指标体系:指标字典设计规范

1.1. 指标字典概念

1.1. 指标字典解决的问题

  • 业务视角
    • 业务分析场景指标、维度不明确;
    • 频繁的需求变更和反复迭代,数据报表臃肿,数据参差不齐;
    • 用户分析具体业务问题找数据、核对确认数据成本较高。
  • 技术视角
    • 指标定义,指标命名混乱,指标不唯一,指标维护口径不一致;
    • 指标生产,重复建设,数据汇算成本较高;
    • 指标消费,数据出口不统一,重复输出,输出口径不一致;
  • 产品视角
    • 缺乏系统产品化支持从生产到消费数据流没有系统产品层面打通

1.2. 制定指标字典的目标

  • 规范维度和量度命名,命名规则明确、通用、易懂。
  • 对确认的维度和度量,统一计算口径,避免歧义。
  • 涵盖尽可能多的核心维度和度量,以此推动数据建设。
  • 基于指标字典接入指标提取工具,实现自助分析与查询。

1.3. 指标字典的价值

  • 通过指标字典,可以对指标进行共享和统一修改和维护;
  • 如果有指标管理系统,再配合上血缘关系,就更方便追踪数据流转了。

1.4. 指标字典基本概念

  • 维度:
    • 从哪些角度去衡量事物。
  • 汇总方式:
    • 用哪种方法衡量,比如:平均、汇总等。
  • 量度:
    • 指度量单位,只有加了度量单位才有意义。

1.5. 指标命名四要素

  • 量化词:
    • 对一事物的测量,比如金额、次数。
  • 业务过程:
    • 用来描述过程性指标的。
  • 统计对象:
    • 要统计的对象名称,比如订单、用户。
  • 限定词:
    • 用来对指标进行限定约束,比如当天、累计。
  • 建议指标命名:
    • 限定词+【业务过程】+统计对象+量化词
    • 示例:当月累计+支付成功+订单+总数

1.6. 指标字典设计要求

  • 命名要规范
    • 规范维度和量度命名,命名规则尽量做到明确、易懂
  • 定义清晰
    • 对维度和量度统一计算口径,避免歧义,明确指标取数逻辑
  • 覆盖范围广
    • 涵盖尽可能多的核心维度和量度,确保指标字典里的覆盖的维度可区分,指标可统计。
  • 可拓展性强

2. 指标字典需要明确的内容

2.1. 数据域

指面向业务分析,将业务过程或者维度进行抽象的集合。其中,业务过程可以概括为一个个不拆分的行为事件,在业务过程之下,可以定义指标;维度,是度量的环境,如乘客呼单事件,呼单类型是维度。为了保障整个体系的生命力,数据域是需要抽象提炼,并且长期维护更新的,变动需执行变更流程。

2.2. 业务过程

指公司的业务活动事件,如,呼单、支付都是业务过程。其中,业务过程不可拆分。

2.3. 时间周期

用来明确统计的时间范围或者时间点,如最近30天、自然周、截止当日等。

2.4. 修饰类型

是对修饰词的一种抽象划分。修饰类型从属于某个业务域,如日志域的访问终端类型涵盖APP端、PC端等修饰词。

2.5. 修饰词

指的是统计维度以外指标的业务场景限定抽象,修饰词属于一种修饰类型,如在日志域的访问终端类型下,有修饰词APP、PC端等。

2.6. 度量/原子指标

原子指标和度量含义相同,基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,具有明确业务含义的名称,如支付金额。

2.7. 维度

维度是度量的环境,用来反映业务的一类属性,这类属性的集合构成一个维度,也可以称为实体对象。维度属于一个数据域,如地理维度(其中包括国家、地区、省市等)、时间维度(其中包括年、季、月、周、日等级别内容)。

2.8. 维度属性

维度属性隶属于一个维度,如地理维度里面的国家名称、国家ID、省份名称等都属于维度属性。

2.9. 指标分类

  • 主要分为原子指标、派生指标、衍生指标

  • 原子指标
    • 原子指标和度量的含义相同,基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标;
    • 原子指标具有明确的业务含义,如支付金额。
  • 派生指标
    • 派生指标 = 一个原子指标 + 多个修饰词(可选) + 时间周期;
    • 派生指标,可以理解为对原子指标统计范围的圈定。
    • 如:
      • 原子指标:支付金额;
      • 派生指标:最近一天海外买家的支付金额;
    • 派生指标分为两类:
      • 事务型指标:
        • 对业务过程进行的衡量,如:新发商品数量,重发商品数量;
      • 存量型指标:
        • 对实体对象的某些状态的统计,如:商品总数,注册会员总数;
  • 衍生指标
    • 是在派生指标基础上,计算得出的复合指标;
    • 主要有:
      • 比率型:
        • 如:客退率、点击率;
      • 比值型:
        • 如:CMP、CPA;
      • 统计型:
        • 如:日活跃用户数;

3. 指标内容

3.1. 指标编码

  • 为了方便查找和管理,需要对指标定义一套编码。

3.2. 指标口径

  • 指标最重要的就是,明确指标的统计口径,就是这个指标是怎么算出来的,口径统一了,才不会产生歧义。

  • 口径梳理

    • 一开始指标的梳理是很麻烦的,因为要统一一个口径,需要和不同的部门去沟通协调;
    • 还有可能会有各种各样的指标出现,需要去判断是否真的需要这个指标,是否可以用其他指标来替代;指标与指标之间的关系也需要理清楚。

3.3. 计算公式

  • 对业务口径的翻译,需要业务方告知你从哪里的数据去计算

3.4. 指标版本

  • 第一版指标梳理好之后,需要进行推广和维护,不断地迭代,持续推动,让公司所有部门都统一站在一个视角关注问题。

4. 指标定义

  • 基础指标 = 主题 + 业务过程 + 量化对象 + 度量 + 汇总方式
    • 如:交易额 = 交易 + 支付完成 + 订单 + 金额 + 求和
  • 衍生指标 = 基础指标 + 维度修饰词 + 统计周期
    • 如:美团小程序交易额 = 交易额 + 流量维度修饰词 + 周期
  • 计算指标 = 明确计算公式

5. 命名规则

5.1. 词根

  • 简写
  • 省略
  • 顺序

  • 规避问题:
    • 同义不同名
    • 同名不同义

5.2. 词库

  • 中英文对照词库
  • 高频词汇固定命名