转载请附上链接
算法简单介绍
主成分分析(PrincipalComponentAnalysis,简称PCA)是一种经常使用的基于变量协方差矩阵对信息进行处理、压缩和抽提的有效方法。
主要用于对特征进行降维。
算法如果
数据的概率分布满足高斯分布或是指数型的概率分布。
方差高的向量视为主元。
算法输入
包括n条记录的数据集
算法输出
降维或压缩后的数据集
算法思想
• 1. 计算全部样本的均值 m 和 协方差 矩阵 S ;
• 2. 计算 S 的特征值 。 并 由 大到小排序;
• 3. 选择前 n' 个特征值相应的特征矢量作成一个变换矩阵 E=[e1,e2, …, en’] ;
• 4. 最后。对于之前每个 n 维的特征矢量 x 能够转换为 n’ 维的新特征 矢量
y=transpose(E)(x-m)
weka执行结果
以weather.nominal.arff为例执行结果部分截图例如以下:
算法应用
人脸识别
图像压缩
信号去噪
转载请附上链接