分散矩阵上的问题求解

原文:https://www . geeksforgeeks . org/分散矩阵解题/

先决条件: 散点图矩阵

我们计算可用数据点的 S w (类散布矩阵内)和 S B (类散布矩阵间)。

S W :为了最小化类内的可变性,类内分散。 S B :增加阶级之间的可变性,阶级之间的分散性。

点的散点图

X1 = (y1, y2) ={ (2,2), (1,2), (1,2), (1,2), (2,2) }
X2 = (y1,y2) ={ (9, 10), (6,8), (9,5), (8,7), (10,8) }

类内分散矩阵:

S_W = \sum_{i=1}^{c}S_i \ S_i = \sum_{x\in D_i}^{c} (x-m_i)(x-m_i)^{T}

Si is the class specific covariance matrix.
mi is the mean of indivisual class

平均值计算:

我们计算课堂上每个点的平均值。这里的平均值是观测值的总和除以观测值的数量,我们需要这个平均值来计算矩阵的协方差。

m_1 = [\frac{2+1+1+1+2}{5} , \frac{2+2+2+2+2}{5} ] \  =  [1.4,2]

m_2 = [\frac{9+6+9+8+10}{5} , \frac{10+8+5+7+8}{5} ] \  =  [8.4,7.6]

协方差矩阵计算: 我们从每个观测值中减去平均值,然后用矩阵的转置进行矩阵乘法后计算平均值。

第一个类别的类别特定协方差:

(X1-m_1) = \begin{bmatrix} 0.6 & -0.4 & -0.4 & -0.4 & 0.6\ 0 & 0 & 0& 0& 0 \end{bmatrix}

1) \begin{bmatrix} 0.6 \ 0 \end{bmatrix} * \begin{bmatrix} 0.6 &0 \end{bmatrix} = \begin{bmatrix} 0.36 &0 \ 0 &0 \end{bmatrix} \\ 2) \begin{bmatrix} -0.4 \ 0 \end{bmatrix} * \begin{bmatrix} -0.4 &0 \end{bmatrix} = \begin{bmatrix} 0.16 &0 \ 0 &0 \end{bmatrix} \\ 3) \begin{bmatrix} -0.4 \ 0 \end{bmatrix} * \begin{bmatrix} -0.4 &0 \end{bmatrix} = \begin{bmatrix} 0.16 &0 \ 0 &0 \end{bmatrix} \\ 4) \begin{bmatrix} -0.4 \ 0 \end{bmatrix} * \begin{bmatrix} -0.4 &0 \end{bmatrix} = \begin{bmatrix} 0.16 &0 \ 0 &0 \end{bmatrix} \\ 5) \begin{bmatrix} 0.6 \ 0 \end{bmatrix} * \begin{bmatrix} 0.6 &0 \end{bmatrix} = \begin{bmatrix} 0.36 &0 \ 0 &0 \end{bmatrix} \\

取 1、2、3、4 和 5 的平均值。 我们计算 S1 矩阵中每个元素的所有值之和,除以观测值的个数,在当前计算中是 5。

matrix_{00} = \frac{ 0.36+0.16+0.16+0.16+0.36}{5}\ =\frac{1.2}{5}\ = 0.24\\ matrix_{01} = \frac{ 0+0+0+0+0}{5}\ = 0\\ matrix_{10} = \frac{ 0+0+0+0+0}{5}\ = 0\\ matrix_{11} = \frac{ 0+0+0+0+0}{5}\ = 0\\

因此 S 1 为:

S_1 = \begin{bmatrix} 0.24 &0 \ 0 &0 \end{bmatrix}

第二类的类特定协方差:

(X2-m_2) = \begin{bmatrix} 0.6 & -2.4 & 0.6 & -0.4 & 1.6\ 2.4 & 0.4 & -2.6& -0.6& 0.4 \end{bmatrix}

1) \begin{bmatrix} 0.6 \ 2.4 \end{bmatrix} * \begin{bmatrix} 0.6 &2.4 \end{bmatrix} = \begin{bmatrix} 0.36 &1.44 \ 1.44 &05.76 \end{bmatrix} \\ 2) \begin{bmatrix} -2.4 \ 0.4 \end{bmatrix} * \begin{bmatrix} -2.4 &0.4 \end{bmatrix} = \begin{bmatrix} 5.76 &-0.96 \ -0.96 &0.16 \end{bmatrix} \\ 3) \begin{bmatrix} 0.6 \ -2.6 \end{bmatrix} * \begin{bmatrix} 0.6 &-2.6 \end{bmatrix} = \begin{bmatrix} 0.36 &-1.56 \ 1.56 &6.76 \end{bmatrix} \\ 4) \begin{bmatrix} -0.4 \ -0.6 \end{bmatrix} * \begin{bmatrix} -0.4 &-0.6 \end{bmatrix} = \begin{bmatrix} 0.16 &0.24 \ 0.24 &0.36 \end{bmatrix} \\ 5) \begin{bmatrix} 1.6 \ 0.4 \end{bmatrix} * \begin{bmatrix} 1.6 &0.4 \end{bmatrix} = \begin{bmatrix} 2.56 &0.64 \ 0.64 &0.16 \end{bmatrix} \\

平均来自 1、2、3、4 和 5 的值 我们计算 S2 矩阵中每个元素的所有值的和,并除以观测值的数量,在当前计算中是 5。

matrix_{00} = \frac{ 0.36+5.76+0.36+0.16+2.56}{5}\ =\frac{9.2}{5}\ = 1.84\\ matrix_{01} = \frac{ 1.44-0.96-1.56+0.24+0.64}{5}\ =\frac{-0.2}{5}\ = -0.04\\ matrix_{10} = \frac{ 1.44-0.96-1.56+0.24+0.64}{5}\ =\frac{-0.2}{5}\ = -0.04\\ matrix_{11} = \frac{ 5.76+0.16+6.76+0.36+0.16}{5}\ =\frac{13.2}{5}\ = 2.64\\

因此 S2 是:

S_2 = \begin{bmatrix} 1.84 &-0.04 \ -0.04 &2.64 \end{bmatrix}

类内散布矩阵 S w :

SW = S1 + S2

S_W=  \begin{bmatrix} 0.24 &0 \ 0 &0 \end{bmatrix} + \begin{bmatrix} 1.84 &-0.04 \ -0.04 &2.64 \end{bmatrix} \\ =\begin{bmatrix} 2.08 &-0.04 \ -0.04 &2.64 \end{bmatrix}

类间散点矩阵 S B :

S_B = (m_1 - m_2) * (m_1 - m_2)^{T}\\ S_B = \begin{bmatrix} 7 & 5.6 \end{bmatrix} * \begin{bmatrix} 7 \5.6 \end{bmatrix} \\ =\begin{bmatrix} 49 &37.2 \ 37.2 &31.36 \end{bmatrix}

总散射矩阵:

S<sub>T = SB + SW</sub>

S_w  =\begin{bmatrix} 49 &37.2 \ 37.2 &31.36 \end{bmatrix} + \begin{bmatrix} 2.08 &-0.04 \ -0.04 &2.64 \end{bmatrix} \ =\begin{bmatrix} 51.08 & 37.16 \ 37.16 &34 \end{bmatrix}

因此,我们计算了可用数据点的类间散布矩阵和类内散布矩阵。

我们在特征提取中利用这些计算,其中主要目标是在点的投影中增加类之间的距离,并在投影中减少类内点之间的距离。这里,我们旨在生成所需维度的数据投影。