数据分析实战45讲¶
算法¶
决策树¶
朴素贝叶斯¶
SVM¶
KNN¶
K-Means¶
EM¶
关联规则¶
PageRank¶
AdaBoost¶
库¶
NumPy¶
Pandas¶
Matplotlib¶
Seaborn¶
流程¶
数据采集¶
工具
八爪鱼
数据挖掘¶
准备阶段
数据清洗
占据80%的处理时间
规则
完整性
全面性
合法性
唯一性
数据集成
合并多个数据源
数据变换
数据平滑
数据聚焦
数据概化
数据规范化
Min-max 规范化
Z-Score 规范化
小数定标规范化
数据探索
分类阶段
数据可视化¶
4类图
比较
联系
构成
分布