Метод главных компонент (principal component analysis, PCA) порождает новые признаки z∈RK, отвечающие проекциям объекта x на первые K главных компонент. Докажем, что полученные признаки обладают следующими свойствами:
обладают нулевым средним;
нескореллированы друг с другом;
обладают свойством линейной независимости.
Утверждение: центрированность проекций
Если исходные данные {xn}n=1N были центрированы (E[x]=0), то математическое ожидание проекции данных на любую главную компоненту также равно нулю.
Доказательство:
Пусть x — случайный вектор исходных признаков. Рассмотрим значение i-го нового признака (проекции) zi, которое вычисляется как скалярное произведение вектора объекта на i-ю главную компоненту vi:
zi=viTx
Вычислим математическое ожидание полученной величины и воспользуемся линейностью математического ожидания:
E[zi]=E[viTx]=viTE[x]=viT⋅0=0
Утверждение: нескоррелированность проекций
Проекции данных на различные главные компоненты нескоррелированы друг с другом.
Доказательство:
Пусть zi и zj — значения новых признаков (проекций) для центрированных данных. Тогда их ковариация:
Так как собственные векторы симметричной матрицы ортогональны, viTvj=0, ковариация, а, следовательно и корреляция, равна 0.
□
Утверждение: линейная независимость проекций
Векторы новых признаков {zk}k=1D линейно независимы, если все собственные числа λi>0, i=1,2,...D.
Доказательство:
Пусть Z — матрица проекций размера N×D, где элемент Znk — проекция n-го объекта на k-ю главную компоненту. Рассмотрим матрицу G=N1ZTZ. Её элементы вычисляются как:
Как было доказано выше, Gij=λiδij. Таким образом, G — диагональная матрица:
N1ZTZ=λ10⋮00λ2⋮0……⋱…00⋮λD
Если все λk>0, то det(N1ZTZ)=∏λk=0, следовательно, матрица ZTZ имеет полный ранг D. Согласно свойствам ранга произведения матриц, rank(ZTZ)=rank(Z). Значит, rank(Z)=D, что означает линейную независимость столбцов матрицы Z (векторов новых признаков).