玩命加载中 . . .

用户画像系列(二)用户标签指标体系


§1.标签类型

用户画像建模其实就是对用户进行打标签, 从对用户打标签的方式来看, 一般分为三种类型:
1、 基于统计类的标签;
2、 基于规则类的标签;
3、 基于挖掘类的标签。
下面我们介绍这三种类型标签的区别:

  • 统计类标签:
    • 这类标签是最为基础也最为常见的标签类型, 例如对于某个用户来说, 他的性别、 年龄、 城市、 星座、 近7日活跃时长、 近7日活跃天数、 近7日活跃次数等字段可以从用户注册数据、 用户访问、 消费类数据中统计得出。 该类标签构成了用户画像的基础
  • 规则类标签:
    • 该类标签基于用户行为及确定的规则产生。 例如对平台上“消费活跃” 用户这一口径的定义为近30天交易次数>=2。 在实际开发画像的过程中, 由于运营人员对业务更为熟悉、 而数据人员对数据的结构、 分布、 特征更为熟悉, 因此规则类标签的规则确定由运营人员和数据人员共同协商确定;
  • 机器学习挖掘类标签:
    • 该类标签通过数据挖掘产生, 应用在对用户的某些属性或某些行为进行预测判断。 例如根据一个用户的行为习惯判断该用户是男性还是女性, 根据一个用户的消费习惯判断其对某商品的偏好程度。 该类标签需要通过算法挖掘产生。

在项目工程实践中, 一般统计类和规则类的标签即可以满足应用需求, 开发中占有较大比例。 机器学习挖掘类标签多用于预测场景, 如判断用户性别是男是女, 判断用户购买商品偏好、 判断用户流失意向等。 一般地机器学习标签开发周期较长, 耗费开发成本较大,因此其开发所占比例较小。


§2.标签命名方式

image-20210506001448373

  • 标签主题: 用于刻画属于那种类型的标签, 如用户属性、 用户行为、 用户消费、 风险控制等多种类型, 可用A、 B、 C、 D等字母表示各标签主题;

  • 标签类型: 标签类型可划为分类型统计型这两种类型, 其中分类型用于刻画用户属于哪种类型, 如是男是女、 是否是会员、是否已流失等标签, 统计型标签用于刻画统计用户的某些行为次数, 如历史购买金额、 优惠券使用次数、 近30日登陆次数等标签, 这类标签都需要对应一个用户相应行为的权重次数;

  • **开发方式: **开发方式可分为统计型开发算法型开发两大开发方式。 其中统计型开发可直接从数据仓库中各主题表建模加工而成, 算法型开发需要对数据做机器学习的算法处理得到相应的标签;

  • 是否互斥标签: 对应同一级类目下(如一级标签、 二级标签) , 各标签之间的关系是否为互斥, 可将标签划分为互斥关系非互斥关系。 例如对于男、 女标签就是互斥关系, 同一个用户不是被打上男性标签就是女性标签, 对于高活跃、 中活跃、 低活跃标签也是互斥关系;

  • 用户维度:* 用于刻画该标签是打在用户唯一标识(userid) 上, 还是打在用户使用的设备(cookieid)上*。 可用U、 C等字母分别标识userid和cookieid维度。

  • 示例

    • image-20210506001840951

    • 对于用户是男是女这个标签, 标签主题是用户属性标签类型属于分类型开发方式为统计型, 为互斥关系用户维度为userid。 这样给男性用户打上标签“A111U001_001” , 女性用户打上标签“A111U001_002” , 其中“A111U” 为上面介绍的命名方式, “001” 为一级标签的id, 后面对于用户属性维度的其他一级标签可用“002” 、“003” 等方式追加命名, “_” 后面的“001” 和“002” 为该一级标签下的标签明细, 如果是划分高、 中、 低活跃用户的, 对应一级标签下的明细可划分为“001” 、 “002” 、 “003” 。


§3. 消费维度指标应用

运营人员根据要营销的商品品类, 在产品上根据规则圈定如消费过某些品类、 消费次数和消费金额、 近期活跃等条件的用户群 :

image-20210506002621105


文章作者: Angus Lan
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Angus Lan !
评论
  目录