常用¶
步骤:
数据收集
处理,清洗,建模,分析
可视化
类型:
1. 响应型分析
* 最基础
* 基本上是按照商业需求出商业报表
2. 诊断型分析
* 当你有了很多数据以后
* 从数据里面挖掘出一些问题
* 或通过数据去解释这些问题,像一些竞品分析、趋势分析
3. 战略分析
* 需要建个模型,然后用数据去得出结论,
* 很多咨询公司就提供这种战略分析
* 像麦肯锡、贝恩等主要做这层次分析
4. 预测型分析
* 最难
* 要建好模
* 还要想到底怎么做
* 采用什么样的行动,给出真正的建议
实时分析:
1. 开源软件
MOLAP:
原生的支持多维的
设计之初就是想把数据结构变成一个多维数据库
这样查询起来既快又方便
Druid,Pinot,Kylin和ElasticSearch
ROLAP:
通过关系型数据库去模拟这种多维查询
企图用传统关系型数据库去构建多维数据库
因为像MySQL、Hive这种传统数据库是非常方便的
2. 商业软件
* 惠普的Vertica
* 一个是Oracle
* Teradata
工具¶
Gephi¶
备注
Gephi 是一款开源免费跨平台基于 JVM 的复杂网络分析软件,其主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具。
NetMiner¶
备注
NetMiner 是一套用于网络数据的探索性分析和可视化的软件工具。NetMiner 允许您可视化和交互式的探索您的网络数据,帮助您发现网络的潜在模式和结构。