博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据挖掘算法学习(四)PCA算法
阅读量:6438 次
发布时间:2019-06-23

本文共 430 字,大约阅读时间需要 1 分钟。

转载请附上链接

算法简单介绍

主成分分析(PrincipalComponentAnalysis,简称PCA)一种经常使用的基于变量协方差矩阵对信息进行处理、压缩和抽提的有效方法

主要用于对特征进行降维。

算法如果

数据的概率分布满足高斯分布或是指数型的概率分布。

方差高的向量视为主元。

算法输入

包括n条记录的数据集

算法输出

降维或压缩后的数据集

算法思想

1.
计算全部样本的均值
m
协方差
矩阵
S
2.
计算
S
的特征值
大到小排序;
3.
选择前
n'
个特征值相应的特征矢量作成一个变换矩阵
E=[e1,e2, …, en’]
4.
最后。对于之前每个
n
维的特征矢量
x
能够转换为
n’
维的新特征
矢量

    y=transpose(E)(x-m)

weka执行结果

以weather.nominal.arff为例执行结果部分截图例如以下:

算法应用

人脸识别

图像压缩

信号去噪

转载请附上链接
你可能感兴趣的文章
mybatis在xml文件中处理大于号小于号的方法
查看>>
Codeforces Codeforces Round #319 (Div. 2) A. Multiplication Table 水题
查看>>
各大浏览器CSS Hack收集
查看>>
再谈 $* 和 $@ 在 Bash 中的表现
查看>>
Apache Commons工具集简介
查看>>
【翻译】Nginx的反向代理
查看>>
htm、html、shtml网页区别
查看>>
SpringCloud学习笔记:服务注册与发现Eureka(2)
查看>>
学习新 api 的思考过程 4.18
查看>>
想要设计自己的微服务?看这篇文章就对了
查看>>
[译] 原生 JavaScript 值得学习吗?答案是肯定的
查看>>
29岁了还一事无成是人生的常态?
查看>>
gRPC-rs:从 C 到 Rust
查看>>
Mysql-高性能索引
查看>>
chrome浏览器最小字号解决方案
查看>>
富文本编译器UEditor+SSM的使用
查看>>
Java EE之旅02 CSS基础
查看>>
kubernetes学习笔记 (二):k8s初体验
查看>>
swift3 0 流控制
查看>>
Data-Mediator专题之属性回调
查看>>