# 数据分析思维课 ## 算法 ### 分类 - 回归算法 - 1. 线性回归 - 2. 逻辑回归 - 3. 多项式回归 - 分类算法 - 算法 - C4.5 决策树 - 朴素贝叶斯 - 支持向量机 SVM - 随机森林 - 聚类算法 - - 内聚 - 分离 - 算法 - K-Means - KNN - DBSCAN - EM - 关联规则 - 算法 - Apriori - FP-growth - setm - Eclat - 有限时间内获得最优解 - 蒙特卡罗算法 - 拉斯维加斯算法 - 马尔可夫链 - “无记忆” 的性质 - 协同过滤 - 推荐系统 - PageRank - 集成算法 - AdaBoost - 随机森林 ### 指标 - 准确率: Accuracy - 精确率: precision - 查准率 - 召回率 - 查全率 - 置信区间: confidence interval ## 基础 ### 平均值(Average) - 辛普森悖论 Simpson’s paradox ### 大数定律与小数陷阱 - 赌徒谬误 ### 均值(也叫做期望值)英文是 Mean - 墨菲定律 ### 随机对照试验 - 幸存者偏差 ### 幂率分布 - 也叫做指数分布 - “帕雷托法则”(也被人称之为 “二八法则”) - “马太效应” ### 正态分布 - 也叫高斯分布 - 中心极限定理 - 拉普拉斯分布 ### 散点图 - 气泡图 - 得克萨斯神枪手谬误 - 幸存者偏差 ### 标准差 - 标准误差 ### 数据抽样 - 蓄水池算法 - 过采样 - 欠采样 - 伯克松悖论