用户画像:常见的用户标签体系

标签梳理 & 标签分类

1. 用户标签的分类

1.1. 按照维度划分

  • 自然属性

  • 商业属性

  • 行为属性

  • 价值属性

1.2. 按照层级划分

  • 主分类标签
    • 一级标签
    • 二级标签
    • 三级标签
  • 业务标签
    • 四级标签
  • 属性标签
    • 五级标签

1.3. 按照生成方式划分

  • 事实标签
    • 属性标签:
      • 可以直接提取
      • 包括一些基本信息,比如:年龄、性别、城市、职业等
    • 事实标签:
      • 可以从用户数据、行为数据、消费数据中统计得出
      • 这些标签来自基于行为数据的统计信息,比如:1日登录次数、7日登录次数、7日下单次数等
    • 事实标签,构成了用户画像的基础
  • 规则类标签
    • 又叫:建模标签
    • 在统计指标基础上通过规则生成,是对统计类指标的有效补充
    • 需要基于用户行为自定义规则
      • 比如:
        • 活跃用户,定义规则为每天登录一次以上的用户
        • 高净值用户,消费总额在某个阈值以上
    • 在开发过程中,运营人员对业务更熟悉,数据维护人员对数据结构、分布、特征更熟悉,所以多数时候由运营人员和数据人员共同搭建维护;
  • 预测类标签
    • 又叫:机器学习标签
    • 是非确定性标签(前两项都属于确定性标签)
    • 需要基于已有的信息“预测”用户特征,需要挖掘才能获得
    • 实际开发过程中,这类项目开发周期长、成本高,属于探索性项目
      • 有些公司使用外包人员、手动打标签,效果可能会更好、而且投入也很低

1.4. 按数据类型划分

  • 数值型
    • 这些标签都是按照一定的规则统计生成的,均是数值型标签,其实本质上和指标没有太大区别。
    • 如:
      • 用户最近7天购买金额
      • 用户近1天浏览次数
    • 统计方式:
      • 计数
      • 求和
      • 最值
      • 均值
      • 中值
    • 组成公式:
      • 时间范围 + 行为方式 + 统计方式
  • 单值枚举型
    • 最大特征是一个用户在这个标签中,只能有一个选项值;
      • 如:性别
        • 未知
      • 和数值型标签的区别在于:
        • 单选型标签的选项值是可穷举的,是离散的。
      • 生成方式
        • 可以是用户自己填写生成的;
        • 也可以是通过数值型标签进行加工、或者算法模型生成的;
      • 例如:
        • 用户的生命周期,通过模型计算分析推导出来;
        • 用户肯定是处于【成长期】、【成熟期】、【衰退期】、【沉睡期】其中的一个,不可能属于两个或者多个。
  • 多值型枚举型
    • 和单选型标签的区别就在于,一个用户可以有多个值。
    • 复选型标签也是离散值,选项是可穷举的。
    • 例如:
      • 用户的收货城市,用户可以有多个城市;
  • 文本型标签
    • 这类标签最大的特征,是不连续、且不可穷举。
    • 例如:
      • 用户常用热搜词,每个用户都可以有自己的常用热搜词,但热搜词的数量是巨大的,不能像单选型标签或者复选型标签那样,几个、甚至最多几十个选项,就能覆盖所有。

2. 用户标签落表建模

2.1. 用户标签命名方式

  • 标签主题:
    • 用于刻画属于那种类型的标签,
    • 如:
      • 用户属性、用户行为、用户消费、风险控制等多种类型,可用A、B、C、D等字母表示各标签主题;
  • 标签类型:
    • 标签类型可划为分类型和统计型这两种类型,其中分类型用于刻画用户属于哪种类型,如是男是女、是否是会员、 是否已流失等标签,统计型标签用于刻画统计用户的某些行为次数,如历史购买金额、优惠券使用次数、近30日登陆次数等 标签,这类标签都需要对应一个用户相应行为的权重次数;
  • 开发方式:
    • 开发方式可分为直接统计型开发和算法预测型开发两大开发方式。其中:
      • 直接统计型开发,可直接从数据仓库中各主题表建模加工而成;
      • 算法预测型开发,需要对数据做机器学习的算法处理得到相应的标签;
  • 是否互斥标签:
    • 对应同一级类目下(如一级标签、二级标签),各标签之间的关系是否为互斥,可将标签划分为互斥关系和 非互斥关系。
    • 例如对于男、女标签就是互斥关系,同一个用户不是被打上男性标签就是女性标签,对于高活跃、中活跃、低 活跃标签也是互斥关系;
  • 用户唯一标识:
    • 用于刻画该标签是打在用户唯一标识(userid)上,还是打在用户使用的设备(cookieid)上。可用U、C等字 母分别标识userid和cookieid维度。

  • 标签命名示例:

2.2. 用户标签需求描述

  • 标签id
  • 标签名称
  • 标签汉语
  • 标签主题
  • 一级标签id
  • 一级标签
  • 二级标签id
  • 二级标签
  • 标签类型
  • 开发方式
  • 是否互斥
  • 更新频率
  • 标签算法规则描述

3. 用户价值标签

3.1. RFM

  • 最近一次消费 (Recency)
    • 理论上,上一次消费时间越近的顾客应该是比较好的顾客,对提供即时的商品或是服务也最有可能会有反应。
    • 示例:
  • 消费频率 (Frequency)
    • 最常购买的消费者,忠诚度也就最高。
    • 示例:
  • 消费金额 (Monetary)
    • 消费金额越高,客户价值越高。
    • 示例:
  • 口径规则
    • 注意:理论上M值和F值是一样的,都带有时间范围。

    • 示例:
  • 维度交叉分析
    • 八类人群
      • 重要价值客户(111)
        • RFM都很高,提供VIP服务。
      • 重要保持客户(011)
        • 最容易转化成第一类客户的群体,一定要想办法提高他们的消费频率。
      • 重要发展客户(101)
        • 主动保持联系,提高复购。
      • 重要挽留客户(001)
        • 客户消费频率低和最近消费时间间隔比较远,但是消费金额高,这种用户即将流失,要主动联系用户,调查问题出在哪里,想办法挽回。
      • 一般价值客户(111)
      • 一般保持客户(011)
      • 一般发展客户(101)
      • 一般挽留客户(001)
      • 示例:

3.2 流失

  • 流失定义
    • 回访率:
      • 30日内,首次访问用户,回访的比率。
    • 流失率:
      • 30日内,首次访问后,无回访的既是流失用户。

3.3. 活跃

  • 活跃度:
    • 高,0.2
    • 中,0.16
    • 低,0.64
    • 遵循:二八原则。

4. 用户属性主题标签

  • 性别
    • 释义:身份证标识的性别
    • 标签:
      • 其他未知
  • 省份
    • 安徽
    • 北京
  • 年龄/分层
    • 释义:对平台用户年龄进行分群分析
    • 标签:
      • 新生婴儿0~28天
      • 婴儿(28天~1年)
      • 幼儿(1~4年)
      • 儿童(5~13)
      • 少年(14~18)
      • 青年(19~44)
      • 中年(45~59)
      • 老年(60以上)
  • 电话号码所在区域/分层
    • 释义:一二三四线城市 or 城乡标识
    • 标签:
      • 一线
      • 二线
      • 三线
      • 四线
      • 乡镇
      • 城郊
      • 农村
  • 是否临时账户
    • 释义:为第三方账号登录,没有进行过账号验证绑定的账号
    • 标签:
  • 注册时间
    • 释义:用户的注册日期,格式yyyy-mm-dd hh:mm:ss
    • 标签:
      • 2022/9/25 11:10
  • 新老用户标识
    • 释义:基于用户注册时间及订单业务情况建模分析
    • 标签:
      • 新用户
      • 老用户
  • 教育程度
    • 释义:用户的学历信息
    • 标签:
      • 博士及以上
      • 研究生
      • 本科
      • 大专
      • 高中
      • 初中及以下
  • 身高
    • 标签:
      • 175cm
  • 体重
    • 释义:
    • 标签:
      • 65kg
  • 职业类型
    • 白领
    • 学生
    • 个体
    • 公务员
    • 工人
    • 农民
  • 收入水平
    • 释义:根据各因子模型预测用户收入等级
  • 星座
    • 释义:根据用户生日进行分群
    • 白羊/金牛/双子/狮子等12星座
  • 婚姻状况
    • 释义:根据各因子模型分析结婚与否
    • 标签:
  • 生育状态
    • 释义:根据各因子模型预测用户生育情况
    • 标签:
      • 未生育
      • 备孕
      • 怀孕
      • 已生育
  • 是否有老人
    • 释义:识别是否有60以上
    • 标签:
  • 是否有小孩
    • 释义:识别是否有小于10岁以下
    • 标签:
  • 是否二胎
    • 释义:是否有2个小于10岁以下
    • 标签:

5. 用户行为主题标签

  • 订单评价
    • 好评
    • 中评
    • 差评
  • 现金券使用次数
  • 现金券使用额度
  • 虚拟现金券使用次数
  • 虚拟现金券使用额度
  • 邀请注册量
  • 邀请新客量
  • 首单营销方式
    • 首单正常购买
    • 首单免费礼物
    • 首单新人价商品
    • 首单优惠券
    • 首单新人专享优惠商品组
    • 首单红包
  • 近30天行为
    • 近30天购买次数(含退拒)
    • 近30天购买金额(含退拒)
    • 近30天购物车次数
    • 近30天购物车放弃数
    • 近30天购物车提交商品数
    • 近30天客单价
    • 近30天活跃天数
  • 近7天行为
    • 近7天购买次数(含退拒)
    • 近7天购买金额(含退拒)
    • 近7天客单价
    • 近7天购物车次数
    • 近7天购物车放弃数
    • 近7天购物车提交商品数
    • 近7天活跃天数
  • 单笔订单最小金额
    • 单笔订单最小金额
    • 单笔订单最大金额
  • 首单距今时间
  • 尾单距今时间
  • 营销方式敏感度
    • 满减
    • 满返
    • 满赠
    • 拼团
    • 多件多折
    • 免费礼物
    • 现金券
  • 访问深度
    • TODO
  • 购买阶段近5日
    • 加购未下单
    • 下单未支付
    • 浏览未购买
    • 未付款成功
  • 高频活跃时间段
    • 上午
    • 中午
    • 下午
    • 晚上
    • 凌晨
  • 购买品类
    • 购买品类单一
    • 多品类购买
  • 邮件渠道活跃
    • 打开活跃度
    • 转化活跃度
    • 转化偏好
  • 邮件渠道活跃时间段
    • 上午
    • 中午
    • 下午
    • 晚上
    • 凌晨
  • 短信渠道活跃
    • 打开活跃度
    • 转化活跃度
    • 转化偏好
    • 时间偏好
      • 上午
      • 中午
      • 下午
      • 晚上
      • 凌晨
  • push活跃
    • 周活跃度
    • 月活跃度
    • 时间偏好
      • 上午
      • 中午
      • 下午
      • 晚上
      • 凌晨
  • 渠道黑名单
    • EDM黑名单
    • EDM灰名单
    • SMD黑名单
  • 最近下单距今天数
  • 最近加购距今天数
  • 站内广告偏好
    • 悬浮
    • 弹窗
    • 首页轮播
    • 站内信
  • 商品

  • 近7天行为
    • 最近7天浏览次数最多的未购买的类目(三级类目)
  • 近3天行为
    • 最近3天浏览次数最多的未购买的类目(三级类目)
    • 最近3天搜索未购买的类目(三级类目
  • 近1天行为
    • 最近1天订单情况(24小时后)
  • 最近行为
    • 最近一次搜索未购买的类目(三级类目)
    • 最近一次收藏商品类目(三级类目)
    • 最近一次访问app日期
    • 上一次支付成功距今天数
  • 历史行为
    • 历史收藏商品中数量最多的类目(三级类目)
  • 收藏属性
    • 收藏商品发生降价
    • 收藏商品库存不足20件
    • 收藏商品参与商品组优惠活动
  • 购物车属性
    • 购物车商品金额
    • 购物车商品发生降价
    • 购物车商品参与商品组优惠活动
    • 购物车商品数目最多的类目(三级类目)
  • 活跃地
    • 最近7日常登陆地

6. 用户偏好

6.1. 价格敏感度

6.2. 优惠偏好

  • 优惠券
  • 折扣
  • 赠品
  • 满减
  • 包邮

6.3. 品类偏好

  • 层级
    • 一级品类
    • 二级品类
    • 三级品类
    • 四季品类
  • 类目
    • 白酒
    • 西餐
    • 游戏手柄
    • 单反相机
    • 等等

6.4. 主题偏好

  • 户外
    • 露营
    • 徒步
    • 野钓
  • 车友
    • 越野
    • 环游
    • 自驾游
  • 美妆
    • 发型
    • 抗衰
    • 去皱纹
    • 去法令纹
    • 祛斑
  • 穿搭
    • 西装
    • 机能风
    • 仙女
    • 纯欲
    • 职场风
  • 发烧友
    • 航模
    • 无线电
    • 手办
  • 美食
    • 西餐
    • 粤菜
    • 轻食
    • 减脂餐
    • 方便菜
  • 宠物
    • 营养餐
    • 猫奴
  • 等等

6.7. 渠道偏好

  • 站内广告
  • 站外
  • 小红书种草
  • 天猫
  • 聚划算
  • 促销活动
  • 6.6. 广告内容偏好

  • 折扣
  • 品类
  • 新品
  • 热销

6.5. 购买行为偏好

  • 闪购
  • Category页面
  • 新品
  • 包邮
  • best deals
  • 促销
  • 搜索

6.6. 购买单价偏好

  • 偏好低价
  • 中等价位
  • 高价位

6.7. 店铺偏好

  • 店铺星级
  • 店铺评分
  • 探新店
  • 店铺风格
  • 经营年限
  • 店铺区域

7. 用户价值标签

7.1. 用户资产

  • 手机品牌
    • 高档
    • 中档
    • 低档
  • 汽车资产
    • 高档
    • 中档
    • 低档
  • 房产
    • 有房
      • 位置
        • 一线城市
        • 二线城市
        • 三线及以下城市
      • 区位
        • 中心区
        • 郊区
    • 无房

7.2. 用户等级

  • 会员
    • 购卡激活会员
    • 积分试用会员
    • 赠送会员
    • 补偿会员
    • 历史会员
    • 非会员
    • 白银会员
    • 黄金会员
    • 白金会员
    • 钻石会员
  • 用户身份
    • 超级用户
    • 金牌用户
    • 银牌用户
    • 铜牌用户
    • 正式会员
    • 试用会员
    • 赠送会员
  • 用户价值
    • 购买客单价
    • 下单次数
    • 首单用户

7.3. 生命周期

  • 安装距今天数
    • 7 天内
    • 7 ~ 30 天
    • 30 ~ 180 天
    • 180 天以上
  • 注册状态
    • 已注册
    • 未注册
  • 历史购买状态
    • 购买过
    • 未购买过
  • 预流失用户
    • 高风险
    • 中风险
    • 低风险
  • 老用户召回
  • 投诉后流失用户
  • 第一次购买后流失用户
  • 最近一次活跃距离今天天数
    • 7 天内
    • 7 ~ 30 天
    • 30 ~ 180 天
    • 180 天以上
  • 最近一次购买距离今天天数
    • 7 天内
    • 7 ~ 30 天
    • 30 ~ 180 天
    • 180 天以上

7.4. 用户购买力

  • 重复咨询
    • 高频
    • 中频
    • 低频
  • 购买风格
    • 搜索购买型
    • 浏览购买型
    • 促销购买型
  • 平均客单价
    • 高价格段
    • 中价格段
    • 低价格段
  • 购买价格段偏好
    • 高价格段
    • 中价格段
    • 低价格段
  • 账户优惠券
    • 账户内是否有可用优惠券
    • 账户内可用优惠券到期日期(有多个优惠券)
    • 账户内积分值
  • 支付偏好
    • 银行卡
      • 信用卡
      • 储蓄卡
    • 支付宝
      • 花呗
      • 余额
    • 微信
    • 白条

7.5. 用户诚信度

  • 用户诚信度
    • 高诚信
    • 无异常
    • 低诚信
  • 用户忠诚度
    • 新用户
    • 熟客
    • 高忠诚
  • 退货频率
    • 高频
    • 中频
    • 低频
  • 投诉频率
    • 高频
    • 中频
    • 低频

7.6. 用户活跃度

  • 活跃状态
    • 高活跃用户
    • 中活跃用户
    • 低活跃用户
    • 流失用户
  • 消费状态
    • 购买次数
    • 平均购买金额
    • 最近一次购买间隔
  • 活跃度
  • 购买活跃度
  • 流失度

7.7. RFM

  • 重要价值用户
  • 重要发展用户
  • 重要保持用户
  • 重要挽留用户
  • 一般价值用户
  • 一般发展用户
  • 一般保持用户
  • 一般挽留用户

8. 用户风控主题标签

  • 异常挂起子单数
  • 终结类型
    • 连签1单
    • 连签2单
    • 连签3单
    • 连拒1单
    • 连拒2单
    • 连拒3单
  • 签收率
  • 联系不上率
  • 历史付款失败订单数
  • 问题类型
    • 退货率
    • 赔付率
    • 退换货 / 货品异常
    • 多账户使用同样的收获地址
  • 问题来源
    • 邮件表单渠道
    • 客服客诉电话
    • 商品评价
    • 商品退换货
  • 是否问题用户
    • 问题用户
    • 非问题用户
    • 未知用户
  • 问题反馈时间
    • 最近一次问题反馈时间