数据分析思维课¶
算法¶
分类¶
回归算法
线性回归
逻辑回归
多项式回归
分类算法
算法
C4.5 决策树
朴素贝叶斯
支持向量机 SVM
随机森林
聚类算法
- 内聚 - 分离
算法
K-Means
KNN
DBSCAN
EM
关联规则
算法
Apriori
FP-growth
setm
Eclat
有限时间内获得最优解
蒙特卡罗算法
拉斯维加斯算法
马尔可夫链
“无记忆” 的性质
协同过滤
推荐系统
PageRank
集成算法
AdaBoost
随机森林
指标¶
准确率: Accuracy
精确率: precision
查准率
召回率
查全率
置信区间: confidence interval
基础¶
平均值(Average)¶
辛普森悖论 Simpson’s paradox
大数定律与小数陷阱¶
赌徒谬误
均值(也叫做期望值)英文是 Mean¶
墨菲定律
随机对照试验¶
幸存者偏差
幂率分布¶
也叫做指数分布
“帕雷托法则”(也被人称之为 “二八法则”)
“马太效应”
正态分布¶
也叫高斯分布
中心极限定理
拉普拉斯分布
散点图¶
气泡图
得克萨斯神枪手谬误
幸存者偏差
标准差¶
标准误差
数据抽样¶
蓄水池算法
过采样
欠采样
伯克松悖论