用户画像—单位换算用户偏好标签

在“用户画像—打用户行为标签”中,主要讲了如何能对用户的每一次操作行为、业务行为参与记录打上或则的标签。在这篇博客中,主要讲如何能对这些明细标签并且换算这些偏好的产品、内容的类目。

跪求用户标签权重的计算,在这篇博客里面讲过了:

超人一样:用户画像之标签权重算法

这里再详细详细介绍一下:

用户标签权重=行为类型权重×时间衰减时间×用户行为次数×TF-IDF算出标签权重

公式中各参数的释义万分感谢:

行为类型权重:用户查看网页、搜索、收藏、下单、网上购买等有所不同行为对用户而言有着不同的重要性,相对而言你的操作紧张度越高的行为权重越大。该权重值象由运营人员或数据分析人员主观想法具体;时间衰减作用:用户某些行为受时间影响不停变得越来越弱,行为时间距现在越远,该行为对用户当前来说的意义越小;行为次数:用户标签权重按天统计,用户突然有一天与该标签才能产生的行为次数一定,该标签对用户的影响越大;TF-IDF可以计算标签权重:每个标签的对用户的重要性及该标签在全体标签中重要性的乘积得出每个标签的客观权重值;

为计算用户偏好标签,必须在用户行为标签的基础上算出用户行为标签填写的权重值,随即对猎杀者标签做权重汇总,算不出用户偏好的标签。麻烦问下用户行为标签如何打,在这篇博客里面有推荐过了

奥特曼:用户画像—打用户行为标签

下面可以介绍怎么在用户行为标签表的基础上加工用户偏好标签:

1、用户标签权重表结构设计

字段定义:

用户id(user账号):用户仅有id;标签id(tagid):图书id;标签名称(tag_name):图书名称;用户行为次数(cnt):用户当日再产生该标签的次数,如用户当日网页一本图书4次,则记录信息4;行为日期(date帐号):再产生该条标签按日期;标签类型(tag_type我的id):在本案例中是从与图书类型表相关联,取出每本图书随机的类型,如《钢铁是怎么炼成的》对应“名著”;用户行为类型(act_type账号):即用户的购买、浏览、评论等操作行为,在本例中方式初始设定数值1~7来符号表示用户按的行为类型。1:定购行为,2:打开浏览器行为,3:评论行为,4:收藏行为,5:已取消收藏行为,6:加入购物车行为,7:搜索行为;

2、在用户行为标签基础上加工权重表

加工标签权重表时,要依据什么用户有所不同行为按的权重组建一个权重维表:

向维表中插入到数据:

3、对每个用户偏好的每个标签加总求权重值,对权重值做倒排序,取flyN

大量关於用户画像开发、分析和应用方案的内容详见https://item.jd.com/12824930.html

扫码免费用

源码支持二开

在线咨询