数据分析入门与统计指标
1235 字约 4 分钟
2026-05-20
1-1 互联网数据分析通用教程-导学
- 数据分析师技能
- Excel
- SQL
- Tableau可视化面板
- python大数据处理方式
1-2 从互联网数据分析说起
对互联网数据(即线上)的规律进行提炼总结辅助决策。
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image4.png
2-1 什么是数据
计量层次低就是无法比较(比如都是文字描述,数字还可以比大小)。
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image5.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image6.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image7.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image8.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image9.png
将这些数据合起来就是数据矩阵。
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image10.png
2-2 什么是统计指标
- 什么是统计指标
- 体现总体数量特征的概念和数值
- 格局数据分析的不同,统计指标也会变化
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image12.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image13.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image14.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image15.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image16.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image17.png
2-3 统计指标:集中趋势
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image18.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image19.png
当然了,如果数据里面有异常值那么平均值就会出现一些误导性,因为对异常数不敏感,这可以采用中位数。
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image20.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image21.png
2-4 统计指标:离散趋势
离散可以理解为波动程度。
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image22.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image23.png
极差是求相距最远的两个点之间的距离,是数据内部最大的差异情况,但是这并不能体验具体离散程度,这个需要使用平均差(一组数据与平均值差异的平均差异,越大越分散)。
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image24.png
但是平均差对事件驱动型数据导致的误差不敏感,比如就是有个人买了非常多垃圾股,让该股热门,使用标准差,更加能体现离散程度,也最常用,越大波动越大。
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image25.png
2-5 统计指标:分布形态
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image26.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image27.png
分布形态指图表化后呈现的形态,包括正态分布、左偏分布、
右偏分布。
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image28.png
2-6 识别异常值
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image29.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image30.png
异常值的附加信息还可以帮忙提升数据分析价值,是不是异
常值还是要看具体业务(因为可能淡旺季)。
2-7 处理异常值
错误记录-》修改正确
错误添加-》删除
正确真实-》是否反映特殊事件(看具有业务与目标)-》修改调整/不做处理
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image31.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image32.png
2-8 数据分析流程
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image33.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image34.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image35.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image36.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image37.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image38.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image39.png
:
1%E8%B5%B0%E8%BF%9B%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/image40.png