1.1. 指标字典概念
1.1. 指标字典解决的问题
- 业务视角
- 业务分析场景指标、维度不明确;
- 频繁的需求变更和反复迭代,数据报表臃肿,数据参差不齐;
- 用户分析具体业务问题找数据、核对确认数据成本较高。
- 技术视角
- 指标定义,指标命名混乱,指标不唯一,指标维护口径不一致;
- 指标生产,重复建设,数据汇算成本较高;
- 指标消费,数据出口不统一,重复输出,输出口径不一致;
- 产品视角
- 缺乏系统产品化支持从生产到消费数据流没有系统产品层面打通
1.2. 制定指标字典的目标
- 规范维度和量度命名,命名规则明确、通用、易懂。
- 对确认的维度和度量,统一计算口径,避免歧义。
- 涵盖尽可能多的核心维度和度量,以此推动数据建设。
- 基于指标字典接入指标提取工具,实现自助分析与查询。
1.3. 指标字典的价值
- 通过指标字典,可以对指标进行共享和统一修改和维护;
- 如果有指标管理系统,再配合上血缘关系,就更方便追踪数据流转了。
1.4. 指标字典基本概念
- 维度:
- 从哪些角度去衡量事物。
- 汇总方式:
- 用哪种方法衡量,比如:平均、汇总等。
- 量度:
- 指度量单位,只有加了度量单位才有意义。
1.5. 指标命名四要素
- 量化词:
- 对一事物的测量,比如金额、次数。
- 业务过程:
- 用来描述过程性指标的。
- 统计对象:
- 要统计的对象名称,比如订单、用户。
- 限定词:
- 用来对指标进行限定约束,比如当天、累计。
- 建议指标命名:
- 限定词+【业务过程】+统计对象+量化词
- 示例:当月累计+支付成功+订单+总数
1.6. 指标字典设计要求
- 命名要规范
- 规范维度和量度命名,命名规则尽量做到明确、易懂
- 定义清晰
- 对维度和量度统一计算口径,避免歧义,明确指标取数逻辑
- 覆盖范围广
- 涵盖尽可能多的核心维度和量度,确保指标字典里的覆盖的维度可区分,指标可统计。
- 可拓展性强
2. 指标字典需要明确的内容
2.1. 数据域
指面向业务分析,将业务过程或者维度进行抽象的集合。其中,业务过程可以概括为一个个不拆分的行为事件,在业务过程之下,可以定义指标;维度,是度量的环境,如乘客呼单事件,呼单类型是维度。为了保障整个体系的生命力,数据域是需要抽象提炼,并且长期维护更新的,变动需执行变更流程。
2.2. 业务过程
指公司的业务活动事件,如,呼单、支付都是业务过程。其中,业务过程不可拆分。
2.3. 时间周期
用来明确统计的时间范围或者时间点,如最近30天、自然周、截止当日等。
2.4. 修饰类型
是对修饰词的一种抽象划分。修饰类型从属于某个业务域,如日志域的访问终端类型涵盖APP端、PC端等修饰词。
2.5. 修饰词
指的是统计维度以外指标的业务场景限定抽象,修饰词属于一种修饰类型,如在日志域的访问终端类型下,有修饰词APP、PC端等。
2.6. 度量/原子指标
原子指标和度量含义相同,基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,具有明确业务含义的名称,如支付金额。
2.7. 维度
维度是度量的环境,用来反映业务的一类属性,这类属性的集合构成一个维度,也可以称为实体对象。维度属于一个数据域,如地理维度(其中包括国家、地区、省市等)、时间维度(其中包括年、季、月、周、日等级别内容)。
2.8. 维度属性
维度属性隶属于一个维度,如地理维度里面的国家名称、国家ID、省份名称等都属于维度属性。
2.9. 指标分类
-
主要分为原子指标、派生指标、衍生指标
- 原子指标
- 原子指标和度量的含义相同,基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标;
- 原子指标具有明确的业务含义,如支付金额。
- 派生指标
- 派生指标 = 一个原子指标 + 多个修饰词(可选) + 时间周期;
- 派生指标,可以理解为对原子指标统计范围的圈定。
- 如:
- 原子指标:支付金额;
- 派生指标:最近一天海外买家的支付金额;
- 派生指标分为两类:
- 事务型指标:
- 对业务过程进行的衡量,如:新发商品数量,重发商品数量;
- 存量型指标:
- 对实体对象的某些状态的统计,如:商品总数,注册会员总数;
- 事务型指标:
- 衍生指标
- 是在派生指标基础上,计算得出的复合指标;
- 主要有:
- 比率型:
- 如:客退率、点击率;
- 比值型:
- 如:CMP、CPA;
- 统计型:
- 如:日活跃用户数;
- 比率型:
3. 指标内容
3.1. 指标编码
- 为了方便查找和管理,需要对指标定义一套编码。
3.2. 指标口径
-
指标最重要的就是,明确指标的统计口径,就是这个指标是怎么算出来的,口径统一了,才不会产生歧义。
-
口径梳理
- 一开始指标的梳理是很麻烦的,因为要统一一个口径,需要和不同的部门去沟通协调;
- 还有可能会有各种各样的指标出现,需要去判断是否真的需要这个指标,是否可以用其他指标来替代;指标与指标之间的关系也需要理清楚。
3.3. 计算公式
- 对业务口径的翻译,需要业务方告知你从哪里的数据去计算
3.4. 指标版本
- 第一版指标梳理好之后,需要进行推广和维护,不断地迭代,持续推动,让公司所有部门都统一站在一个视角关注问题。
4. 指标定义
- 基础指标 = 主题 + 业务过程 + 量化对象 + 度量 + 汇总方式
- 如:交易额 = 交易 + 支付完成 + 订单 + 金额 + 求和
- 衍生指标 = 基础指标 + 维度修饰词 + 统计周期
- 如:美团小程序交易额 = 交易额 + 流量维度修饰词 + 周期
- 计算指标 = 明确计算公式
5. 命名规则
5.1. 词根
- 简写
- 省略
-
顺序
- 规避问题:
- 同义不同名
- 同名不同义
5.2. 词库
- 中英文对照词库
- 高频词汇固定命名