数据可视化中的几个基本概念

数据可视化中的几个基础概念解释。

维度

数据分析过程中经常使用的一个概念,分析数据的角度。主要是指数值、时间和文本。

图表类型

  • 散点图

展示数据的分布

  • 折线图

展示某一维度数据在时间上的规律或者趋势

  • 柱形图

展示多个维度的比较和变化

  • 饼图

展示一组数据的占比情况

数据查询

分析类型(Analyses Type)

  • 计数(Count):

统计相应字段属性在数据集合中的数量。

  • 唯一性计数(Count Unique)

统一某一唯一字段属性在数据集合中的数量。

  • 最小值(Minimun)

针对符合条件的数据集合中的指定字段属性求最小值,非数字类型忽略。

  • 最大值(Maximum)

针对符合条件的数据集合中的指定字段属性求最大值,非数字类型忽略。

  • 求和(Sum)

针对符合条件的数据集合中的指定字段属性求和,非数字类型忽略。

  • 求平均值(Average)

针对符合条件的数据集合中的指定字段属性求平均值,非数字类型忽略。

  • 求中间值(Median)

针对符合条件的数据集合中的指定字段属性求中间值,存在一定误差,非数字类型忽略。

  • 百分比(Percentile)

针对符合条件的数据集合中的指定字段属性求百分比,存在一定误差,非数字类型忽略。

  • 选择唯一(Select Unique)

针对符合条件的数据集合中的指定字段属性返回一个唯一值得列表数据。

数据集合(Event Collection)

要进行数据分析的数据集。

时间范围(Timeframe)

所要分析的数据的时间范围,可分为相对时间和绝对时间。

相对时间: 相对于当前的一段时间,有年、月、周、日、时、分、秒。
绝对时间: 有明确开始和截止时间的一个固定时间范围。

分组(Group By)

指定分组来将结果进行归类。

类似的场景:

  • 注册用户中,有多少来自iOS,Android 和 Web端?
  • 多少用户来自全世界不同的国家?

过滤(Filters)

对所要分析的数据进行过滤,缩小分析数据的范围。

时间粒度(Interval)

时间粒度通过指定一个具体的时间长度来将数据结果划分到一个子时间范围。

类似的场景:

  • 每天有多少注册用户,在过去的21天里?
  • 发布一个新的产品后,每个星期的收入增长?

参考

【全文完】

作者

潘绳杰

发布于

2016-12-23

更新于

2025-01-19

许可协议

评论