用户画像简介

1-1 简介

基本概念1.基本属性:每个人都有一些基本属性(性别、年龄、婚姻、收藏、教育)。行为记录:购买行为、浏览行为、点击行为、购物车行为,从这些行为中判断用户的一些信息,如经常购买儿童物品,从现在起可以判断儿童的年龄、性别等。.购买能力可以判断用户的购买力,从而打上购买力的等级标志。.行为特征:可以判断用户的行为特征,如用户活动和购物类型。.社交网络:可以判断他的社交网络。.心理特征:比如促销敏感,购物真诚。.兴趣爱好:颜色的偏好,品牌的偏好。用户画像的用途1.精准营销:邮件、短信、2.用户统计:区域、时间3.数据挖掘:特征和行为学习目标:1.了解hive数据仓库特点2.学会使用hive数据开发3.深入了解用户数据的特点4.掌握如何构建用户画像5.密切接触实际项目开发6.积累项目实践经验的主要内容:1.用户肖像项目介绍2.用户画像建模3.使用hive4.进项数据开发.开发用户肖像数据

1-2 用户肖像简介

定义用户肖像(UserProfile)也被称为用户信息标签,客户标签。根据基本信息和行为,用一些标签来描述用户,描述用户的标签是用户肖像。构建用户肖像的技术1.数据收集:网络日志数据、用户行为数据、网站交易数据2.行为建模:文本挖掘、自然语言处理、机器学习、预测算法、聚类算法3.用户肖像:基本属性、购买力、行为特征、兴趣爱好、心理特征、社交网络源数据1.静态信息数据:来自用户填写的个人数据或由此计算的数据。如果有不确定性。可以建立一个模型来判断。例如,如果用户的性别没有被填写,他们可以建立一个性别模型,并通过用户的行为来判断他们的性别口属性:性别、生日、年龄、婚姻、收藏、城市、教育、职业、是否有儿童(数量)、星座、月收入商业属性:消费水平、消费周期2.动态信息数据:用户行为产生的数据:注册、浏览、点击、购买、签收、评价。比较重要的行为:购买商品、浏览商品、放入购物车、关注商品。注册时间、首单时间、潮妈族,纠结商品,最大消费,退货数量,败家指数,品牌偏好。用户联系点(TouchPoint)行为类型:浏览、搜索、发表、点赞数接触点(Tag):女装单品页面,女鞋单品页面……标签分类1.确定的标签2.以算法猜测的标签为例:1.用户活动:未购买、活跃、沉睡、损失2.用户群:计算机专家、数字潮人、家庭用户、房主、网上购物专家、单身贵族、时尚男女、父母、闪购用户、超级用户。(根据用户购买的类别,如一级和二级类别)

1-3 用户肖像用途

用户肖像的作用:1.分类统计:12星座对雾霾天气的预防指数;爸爸主导指数;访客肖像(男女比例;新老用户比例;年龄分布;教育分布)2.营销推荐:邮件营销;短信营销;push信息。例 如,如果孩子,推荐一些母婴产品3.数据挖掘:根据用户的数据挖掘一些有用的信息来支持决策。使用相关规则:喜欢红酒的人通常喜欢什么品牌?使用聚类算法分析:喜欢红酒的人,年龄分布。数据挖掘1.属性筛选:基于信息增益的属性筛选、属性重要性评分、主要成分分析、基于卡方检验的属性筛选;2.分类预测:决策树、神经网络分类、贝叶斯网络、分类回归树、支持向量分类、逻辑回归、简单贝叶斯、分类组合模型;3.回归预测:多线性回归、神经网络回归、广义线性回归、支持向量机回归、回归组合模型;4.聚类分析:K均值聚类,基础K平均水平聚类、分布估计聚类、两阶段聚类;5.关联分析:购物篮分析、属性关联分析、序列模式分析;6.时间序列:ARX时间序列数据挖掘喜欢什么的人往往喜欢什么?做过这件事的人接下来通常会做什么?最经典的例子:啤酒和尿布的关系。

扫码免费用

源码支持二开

在线咨询