用户画像咋能不验正验正改密保准确性?

的原因分类相同,用户画像的验证方法也有了差异。200元以内具体具体阐述不验证的过程与方法:

一、用户画像分类

基于组件白条的日常业务,我们将用户画像两类三大类。

第一类为基本信息画像,主要是用户基本信息,如年龄、性别、学历、职业、收入、资产、婚否、是否有房、如何确定有车等;

第二类为用户行为画像(实现互联网业务,此处的用户行为比较多指用户的消费行为),如品类偏好、下单付款分析和预测、申请分期意愿等;

第三类则是涵盖面的用户分群画像,是非画像基于条件统计方法(聚类)将同类型用户划作一类,据有所不同业务需求,群体特征也差异极大。

二、用户画像验正

按事件的发展过程来看,用户画像准确性验证分为事中和出事,其中事中指用户开发过程中,而当时则是指画像上线运用于业务后。不同阶段的验证方法也极大有所不同。

事后全过程验证:

事中不验证主要注意基于组件画像开发过程中所选模型及统计方法,对此三类画像,有200元以内三种验证指标:

1.模型验证指标

具体用法的模型指标验证比较多用户前两类画像的验证,通用的为AUC、KS、ROC、Confusion Matrix等,这些指标的介绍及判断标准早有比较晚熟的理论基础,此处不发起赘述。

是对第三类实现聚类的用户画像没有较具体方法的验证指标。通常情况下,聚类效果图不能非常好的只能证明问题,还需结合业务及每个群体用户包裹度参与你所选调整,到最后的验证大多数也基于组件事后的业务反馈效果。

2.抽样验正

业务中用户画像大多数不属于千万级甚至连上亿级用户,不可能全部验正,那种情况下这个可以根据不同情况整群抽样验证或分层抽样验证。肯定因此抽样验正的数据量总体较小,并且劝得动度不高。

3.交叉验证

交叉验证分画像指标间的交叉验证及外部数据的补充交叉验证。

通常情况下,一些画像类的指标间会未知一些相关性,此时可并且交叉验证。

例如:收入与资产存在当然的相关性,通常收入越高资产也会越高,此时就后用这两个画像评分进行交叉验证。

至于,如果没有公司去购买的第三方机构数据也有相应的画像指标,也可主要用于可以参考进行交叉验证。

这件事修改密保:

这件事验正要注意基于随业务发展减少的数据源(假的数据)及应用形式于业务后的反馈数据。

1.真实数据不验证

紧接着业务发展,一些用户画像信息会从弱变强渐渐地积累,无容置疑的是,将神秘数据主要是用于验正画像类指标是最清楚的。

2.A/BTest

A/BTest是互联网公司最常用的验证方法,就像实现用户画像如何制定的策略在上游戏时都会并且严不的对比试验,以测试画像的准确性。

举例来说:下图为一组差别试验(假设纵轴为用户发令率,横轴为营销活动正在时间),更说明实验组的效果优于对照组,并且该画像可怀疑低些准。

3.业务反馈数据验证

用户画像中的第二类(用户行为画像)和第三类(用户分群画像)与业务有紧密联系,来源于业务也应用于业务,因此由求实际业务数据反馈来验证画像准确性是相对来说最快速有效的。

验正方法通常看业务反馈排序与画像模型排序模型是否是呈现出单调性。应该举例来说:

备注:Level1-Level10分析和预测概率等级呈降序,即level1概率最低,level10概率最低。

如上图中,实现用户画像指标(下订单预测国家概率模型)将用户划分为十个等级。求实际业务中,会从每个level随机抽一部分用户用于营销,随即依据什么不好算情况(即下单后率)来可以检测画像模型排序能力。

上图中,下订单率与画像模型排序完全呈现严不单调性,而就业务角度而言该画像是最有效的,能作用于业务并对业务发挥作用一定会提升作用。若不-1,则必须确定是否是需求及时优化画像模型。

感谢京东金融-消费者金融部-信用管理部可以提供内容

扫码免费用

源码支持二开

在线咨询