浙江大学陈为教授关于大数据与可视化技术及其应用的讲座。
大数据思维
一、数据核心原理
从“流程”核心转变为“数据”核心
二、数据价值原理
由功能即价值转变为数据即价值
三、全样本原理
从抽样转变为需要全部数据样本
四、关注效率原理
由关注精确度转变为关注效率
五、利用相关性取代因果关系
不需要知道为什么
六、从采样到全样本
抽样 != 全样
七、从精确到模糊
大数据简单算法比小数据复杂性算法更有效
八、安迪·比尔定律
软件硬件相互要求
大数据时代生产越来越过剩
大数据分析应用的三个层次
描述性分析-> 预测性分析 -> 指导性分析
- 关注发生了什么,呈现事物
- 关注“可能发生什么”,呈现趋势
- 关注“选择做什么”,呈现不同决策的后果
数据可视化
概念原理
创建并研究数据的视觉表达 (Visual Representation)
- 输入:数据(data)
- 输出:视觉形式(visual form)
- 目标:深入理解(insight)
主要任务
- 表示数据 - Represent
- 分析数据 - Analyze
- 交流数据 - Communicate
思维系统
重要应用
科学研究
物联网与智慧城市
互联网与社交媒体
可视化战役
可视化技术原理
疫情可视化成果
疫情可视化公益活动
拓展阅读
浙江大学陈为“大数据可视化”
彻底颠覆你认知的10条大数据思维