1. 用户标签的分类
1.1. 按照维度划分
-
自然属性
-
商业属性
-
行为属性
-
价值属性
1.2. 按照层级划分
- 主分类标签
- 一级标签
- 二级标签
- 三级标签
- 业务标签
- 四级标签
- 属性标签
- 五级标签
1.3. 按照生成方式划分
- 事实标签
- 属性标签:
- 可以直接提取
- 包括一些基本信息,比如:年龄、性别、城市、职业等
- 事实标签:
- 可以从用户数据、行为数据、消费数据中统计得出
- 这些标签来自基于行为数据的统计信息,比如:1日登录次数、7日登录次数、7日下单次数等
- 事实标签,构成了用户画像的基础
- 属性标签:
- 规则类标签
- 又叫:建模标签
- 在统计指标基础上通过规则生成,是对统计类指标的有效补充
- 需要基于用户行为自定义规则
- 比如:
- 活跃用户,定义规则为每天登录一次以上的用户
- 高净值用户,消费总额在某个阈值以上
- 比如:
- 在开发过程中,运营人员对业务更熟悉,数据维护人员对数据结构、分布、特征更熟悉,所以多数时候由运营人员和数据人员共同搭建维护;
- 预测类标签
- 又叫:机器学习标签
- 是非确定性标签(前两项都属于确定性标签)
- 需要基于已有的信息“预测”用户特征,需要挖掘才能获得
- 实际开发过程中,这类项目开发周期长、成本高,属于探索性项目
- 有些公司使用外包人员、手动打标签,效果可能会更好、而且投入也很低
1.4. 按数据类型划分
- 数值型
- 这些标签都是按照一定的规则统计生成的,均是数值型标签,其实本质上和指标没有太大区别。
- 如:
- 用户最近7天购买金额
- 用户近1天浏览次数
- 统计方式:
- 计数
- 求和
- 最值
- 均值
- 中值
- 组成公式:
- 时间范围 + 行为方式 + 统计方式
- 单值枚举型
- 最大特征是一个用户在这个标签中,只能有一个选项值;
- 如:性别
- 男
- 女
- 未知
- 和数值型标签的区别在于:
- 单选型标签的选项值是可穷举的,是离散的。
- 生成方式
- 可以是用户自己填写生成的;
- 也可以是通过数值型标签进行加工、或者算法模型生成的;
- 例如:
- 用户的生命周期,通过模型计算分析推导出来;
- 用户肯定是处于【成长期】、【成熟期】、【衰退期】、【沉睡期】其中的一个,不可能属于两个或者多个。
- 如:性别
- 最大特征是一个用户在这个标签中,只能有一个选项值;
- 多值型枚举型
- 和单选型标签的区别就在于,一个用户可以有多个值。
- 复选型标签也是离散值,选项是可穷举的。
- 例如:
- 用户的收货城市,用户可以有多个城市;
- 文本型标签
- 这类标签最大的特征,是不连续、且不可穷举。
- 例如:
- 用户常用热搜词,每个用户都可以有自己的常用热搜词,但热搜词的数量是巨大的,不能像单选型标签或者复选型标签那样,几个、甚至最多几十个选项,就能覆盖所有。
2. 用户标签落表建模
2.1. 用户标签命名方式
- 标签主题:
- 用于刻画属于那种类型的标签,
- 如:
- 用户属性、用户行为、用户消费、风险控制等多种类型,可用A、B、C、D等字母表示各标签主题;
- 标签类型:
- 标签类型可划为分类型和统计型这两种类型,其中分类型用于刻画用户属于哪种类型,如是男是女、是否是会员、 是否已流失等标签,统计型标签用于刻画统计用户的某些行为次数,如历史购买金额、优惠券使用次数、近30日登陆次数等 标签,这类标签都需要对应一个用户相应行为的权重次数;
- 开发方式:
- 开发方式可分为直接统计型开发和算法预测型开发两大开发方式。其中:
- 直接统计型开发,可直接从数据仓库中各主题表建模加工而成;
- 算法预测型开发,需要对数据做机器学习的算法处理得到相应的标签;
- 开发方式可分为直接统计型开发和算法预测型开发两大开发方式。其中:
- 是否互斥标签:
- 对应同一级类目下(如一级标签、二级标签),各标签之间的关系是否为互斥,可将标签划分为互斥关系和 非互斥关系。
- 例如对于男、女标签就是互斥关系,同一个用户不是被打上男性标签就是女性标签,对于高活跃、中活跃、低 活跃标签也是互斥关系;
- 用户唯一标识:
-
用于刻画该标签是打在用户唯一标识(userid)上,还是打在用户使用的设备(cookieid)上。可用U、C等字 母分别标识userid和cookieid维度。
-
- 标签命名示例:
2.2. 用户标签需求描述
- 标签id
- 标签名称
- 标签汉语
- 标签主题
- 一级标签id
- 一级标签
- 二级标签id
- 二级标签
- 标签类型
- 开发方式
- 是否互斥
- 更新频率
- 标签算法规则描述
3. 用户价值标签
3.1. RFM
- 最近一次消费 (Recency)
- 理论上,上一次消费时间越近的顾客应该是比较好的顾客,对提供即时的商品或是服务也最有可能会有反应。
- 示例:
- 消费频率 (Frequency)
- 最常购买的消费者,忠诚度也就最高。
- 示例:
- 消费金额 (Monetary)
- 消费金额越高,客户价值越高。
- 示例:
- 口径规则
-
注意:理论上M值和F值是一样的,都带有时间范围。
- 示例:
-
- 维度交叉分析
- 八类人群
- 重要价值客户(111)
- RFM都很高,提供VIP服务。
- 重要保持客户(011)
- 最容易转化成第一类客户的群体,一定要想办法提高他们的消费频率。
- 重要发展客户(101)
- 主动保持联系,提高复购。
- 重要挽留客户(001)
- 客户消费频率低和最近消费时间间隔比较远,但是消费金额高,这种用户即将流失,要主动联系用户,调查问题出在哪里,想办法挽回。
- 一般价值客户(111)
- 一般保持客户(011)
- 一般发展客户(101)
- 一般挽留客户(001)
- 示例:
- 重要价值客户(111)
- 八类人群
3.2 流失
- 流失定义
- 回访率:
- 30日内,首次访问用户,回访的比率。
- 流失率:
- 30日内,首次访问后,无回访的既是流失用户。
- 回访率:
3.3. 活跃
- 活跃度:
- 高,0.2
- 中,0.16
- 低,0.64
-
遵循:二八原则。
4. 用户属性主题标签
- 性别
- 释义:身份证标识的性别
- 标签:
- 男
- 女
- 其他未知
- 省份
- 安徽
- 北京
- …
- 年龄/分层
- 释义:对平台用户年龄进行分群分析
- 标签:
- 新生婴儿0~28天
- 婴儿(28天~1年)
- 幼儿(1~4年)
- 儿童(5~13)
- 少年(14~18)
- 青年(19~44)
- 中年(45~59)
- 老年(60以上)
- 电话号码所在区域/分层
- 释义:一二三四线城市 or 城乡标识
- 标签:
- 一线
- 二线
- 三线
- 四线
- 乡镇
- 城郊
- 农村
- 是否临时账户
- 释义:为第三方账号登录,没有进行过账号验证绑定的账号
- 标签:
- 是
- 否
- 注册时间
- 释义:用户的注册日期,格式yyyy-mm-dd hh:mm:ss
- 标签:
- 2022/9/25 11:10
- 新老用户标识
- 释义:基于用户注册时间及订单业务情况建模分析
- 标签:
- 新用户
- 老用户
- 教育程度
- 释义:用户的学历信息
- 标签:
- 博士及以上
- 研究生
- 本科
- 大专
- 高中
- 初中及以下
- 身高
- 标签:
- 175cm
- 标签:
- 体重
- 释义:
- 标签:
- 65kg
- 职业类型
- 白领
- 学生
- 个体
- 公务员
- 工人
- 农民
- 收入水平
- 释义:根据各因子模型预测用户收入等级
- 高
- 中
- 低
- 星座
- 释义:根据用户生日进行分群
- 白羊/金牛/双子/狮子等12星座
- 婚姻状况
- 释义:根据各因子模型分析结婚与否
- 标签:
- 是
- 否
- 生育状态
- 释义:根据各因子模型预测用户生育情况
- 标签:
- 未生育
- 备孕
- 怀孕
- 已生育
- 是否有老人
- 释义:识别是否有60以上
- 标签:
- 是
- 否
- 是否有小孩
- 释义:识别是否有小于10岁以下
- 标签:
- 是
- 否
- 是否二胎
- 释义:是否有2个小于10岁以下
- 标签:
- 是
- 否
5. 用户行为主题标签
- 订单评价
- 好评
- 中评
- 差评
- 现金券使用次数
- 现金券使用额度
- 虚拟现金券使用次数
- 虚拟现金券使用额度
- 邀请注册量
- 邀请新客量
- 首单营销方式
- 首单正常购买
- 首单免费礼物
- 首单新人价商品
- 首单优惠券
- 首单新人专享优惠商品组
- 首单红包
- 近30天行为
- 近30天购买次数(含退拒)
- 近30天购买金额(含退拒)
- 近30天购物车次数
- 近30天购物车放弃数
- 近30天购物车提交商品数
- 近30天客单价
- 近30天活跃天数
- 近7天行为
- 近7天购买次数(含退拒)
- 近7天购买金额(含退拒)
- 近7天客单价
- 近7天购物车次数
- 近7天购物车放弃数
- 近7天购物车提交商品数
- 近7天活跃天数
- 单笔订单最小金额
- 单笔订单最小金额
- 单笔订单最大金额
- 首单距今时间
- 尾单距今时间
- 营销方式敏感度
- 满减
- 满返
- 满赠
- 拼团
- 多件多折
- 免费礼物
- 现金券
- 访问深度
- TODO
- 购买阶段近5日
- 加购未下单
- 下单未支付
- 浏览未购买
- 未付款成功
- 高频活跃时间段
- 上午
- 中午
- 下午
- 晚上
- 凌晨
- 购买品类
- 购买品类单一
- 多品类购买
- 邮件渠道活跃
- 打开活跃度
- 转化活跃度
- 转化偏好
- 邮件渠道活跃时间段
- 上午
- 中午
- 下午
- 晚上
- 凌晨
- 短信渠道活跃
- 打开活跃度
- 转化活跃度
- 转化偏好
- 时间偏好
- 上午
- 中午
- 下午
- 晚上
- 凌晨
- push活跃
- 周活跃度
- 月活跃度
- 时间偏好
- 上午
- 中午
- 下午
- 晚上
- 凌晨
- 渠道黑名单
- EDM黑名单
- EDM灰名单
- SMD黑名单
- 最近下单距今天数
- 最近加购距今天数
- 站内广告偏好
- 悬浮
- 弹窗
- 首页轮播
- 站内信
- …
-
商品
- 近7天行为
- 最近7天浏览次数最多的未购买的类目(三级类目)
- …
- 近3天行为
- 最近3天浏览次数最多的未购买的类目(三级类目)
- 最近3天搜索未购买的类目(三级类目
- …
- 近1天行为
- 最近1天订单情况(24小时后)
- …
- 最近行为
- 最近一次搜索未购买的类目(三级类目)
- 最近一次收藏商品类目(三级类目)
- 最近一次访问app日期
- 上一次支付成功距今天数
- …
- 历史行为
- 历史收藏商品中数量最多的类目(三级类目)
- …
- 收藏属性
- 收藏商品发生降价
- 收藏商品库存不足20件
- 收藏商品参与商品组优惠活动
- …
- 购物车属性
- 购物车商品金额
- 购物车商品发生降价
- 购物车商品参与商品组优惠活动
- 购物车商品数目最多的类目(三级类目)
- 活跃地
- 最近7日常登陆地
6. 用户偏好
6.1. 价格敏感度
- 低
- 中
- 高
6.2. 优惠偏好
- 优惠券
- 折扣
- 赠品
- 满减
- 包邮
6.3. 品类偏好
- 层级
- 一级品类
- 二级品类
- 三级品类
- 四季品类
- 类目
- 白酒
- 西餐
- 游戏手柄
- 单反相机
- 等等
6.4. 主题偏好
- 户外
- 露营
- 徒步
- 野钓
- 车友
- 越野
- 环游
- 自驾游
- 美妆
- 发型
- 抗衰
- 去皱纹
- 去法令纹
- 祛斑
- 穿搭
- 西装
- 机能风
- 仙女
- 纯欲
- 职场风
- 发烧友
- 航模
- 无线电
- 手办
- 美食
- 西餐
- 粤菜
- 轻食
- 减脂餐
- 方便菜
- 宠物
- 营养餐
- 猫奴
- 等等
6.7. 渠道偏好
- 站内广告
- 站外
- 小红书种草
- 天猫
- 聚划算
- 促销活动
- …
6.6. 广告内容偏好
- 折扣
- 品类
- 新品
- 热销
6.5. 购买行为偏好
- 闪购
- Category页面
- 新品
- 包邮
- best deals
- 促销
- 搜索
6.6. 购买单价偏好
- 偏好低价
- 中等价位
- 高价位
6.7. 店铺偏好
- 店铺星级
- 店铺评分
- 探新店
- 店铺风格
- 经营年限
- 店铺区域
7. 用户价值标签
7.1. 用户资产
- 手机品牌
- 高档
- 中档
- 低档
- 汽车资产
- 高档
- 中档
- 低档
- 房产
- 有房
- 位置
- 一线城市
- 二线城市
- 三线及以下城市
- 区位
- 中心区
- 郊区
- 位置
- 无房
- 有房
7.2. 用户等级
- 会员
- 购卡激活会员
- 积分试用会员
- 赠送会员
- 补偿会员
- 历史会员
- 非会员
- 白银会员
- 黄金会员
- 白金会员
- 钻石会员
- 用户身份
- 超级用户
- 金牌用户
- 银牌用户
- 铜牌用户
- 正式会员
- 试用会员
- 赠送会员
- 用户价值
- 购买客单价
- 下单次数
- 首单用户
7.3. 生命周期
- 安装距今天数
- 7 天内
- 7 ~ 30 天
- 30 ~ 180 天
- 180 天以上
- 注册状态
- 已注册
- 未注册
- 历史购买状态
- 购买过
- 未购买过
- 预流失用户
- 高风险
- 中风险
- 低风险
- 老用户召回
- 是
- 否
- 投诉后流失用户
- 是
- 否
- 第一次购买后流失用户
- 是
- 否
- 最近一次活跃距离今天天数
- 7 天内
- 7 ~ 30 天
- 30 ~ 180 天
- 180 天以上
- 最近一次购买距离今天天数
- 7 天内
- 7 ~ 30 天
- 30 ~ 180 天
- 180 天以上
7.4. 用户购买力
- 重复咨询
- 高频
- 中频
- 低频
- 购买风格
- 搜索购买型
- 浏览购买型
- 促销购买型
- 平均客单价
- 高价格段
- 中价格段
- 低价格段
- 购买价格段偏好
- 高价格段
- 中价格段
- 低价格段
- 账户优惠券
- 账户内是否有可用优惠券
- 账户内可用优惠券到期日期(有多个优惠券)
- 账户内积分值
- 支付偏好
- 银行卡
- 信用卡
- 储蓄卡
- 支付宝
- 花呗
- 余额
- 微信
- 白条
- …
- 银行卡
7.5. 用户诚信度
- 用户诚信度
- 高诚信
- 无异常
- 低诚信
- 用户忠诚度
- 新用户
- 熟客
- 高忠诚
- 退货频率
- 高频
- 中频
- 低频
- 投诉频率
- 高频
- 中频
- 低频
7.6. 用户活跃度
- 活跃状态
- 高活跃用户
- 中活跃用户
- 低活跃用户
- 流失用户
- 消费状态
- 购买次数
- 平均购买金额
- 最近一次购买间隔
- 活跃度
- 高
- 中
- 低
- 购买活跃度
- 高
- 中
- 低
- 流失度
- 高
- 中
- 低
7.7. RFM
- 重要价值用户
- 重要发展用户
- 重要保持用户
- 重要挽留用户
- 一般价值用户
- 一般发展用户
- 一般保持用户
- 一般挽留用户
8. 用户风控主题标签
- 异常挂起子单数
- 终结类型
- 连签1单
- 连签2单
- 连签3单
- 连拒1单
- 连拒2单
- 连拒3单
- 签收率
- 联系不上率
- 历史付款失败订单数
- 问题类型
- 退货率
- 赔付率
- 退换货 / 货品异常
- 多账户使用同样的收获地址
- 问题来源
- 邮件表单渠道
- 客服客诉电话
- 商品评价
- 商品退换货
- 是否问题用户
- 问题用户
- 非问题用户
- 未知用户
- 问题反馈时间
- 最近一次问题反馈时间