数据分析思维课

算法

分类

  • 回归算法

      1. 线性回归

      1. 逻辑回归

      1. 多项式回归

  • 分类算法

    • 算法

      • C4.5 决策树

      • 朴素贝叶斯

      • 支持向量机 SVM

      • 随机森林

  • 聚类算法

      - 内聚
    
      - 分离
    
    • 算法

      • K-Means

      • KNN

      • DBSCAN

      • EM

  • 关联规则

    • 算法

      • Apriori

      • FP-growth

      • setm

      • Eclat

  • 有限时间内获得最优解

    • 蒙特卡罗算法

    • 拉斯维加斯算法

  • 马尔可夫链

    • “无记忆” 的性质

  • 协同过滤

    • 推荐系统

  • PageRank

  • 集成算法

    • AdaBoost

    • 随机森林

指标

  • 准确率: Accuracy

  • 精确率: precision

    • 查准率

  • 召回率

    • 查全率

  • 置信区间: confidence interval

基础

平均值(Average)

  • 辛普森悖论 Simpson’s paradox

大数定律与小数陷阱

  • 赌徒谬误

均值(也叫做期望值)英文是 Mean

  • 墨菲定律

随机对照试验

  • 幸存者偏差

幂率分布

  • 也叫做指数分布

  • “帕雷托法则”(也被人称之为 “二八法则”)

  • “马太效应”

正态分布

  • 也叫高斯分布

  • 中心极限定理

  • 拉普拉斯分布

散点图

  • 气泡图

  • 得克萨斯神枪手谬误

  • 幸存者偏差

标准差

  • 标准误差

数据抽样

  • 蓄水池算法

  • 过采样

  • 欠采样

  • 伯克松悖论