专业的短链接生成工具
链接域名
短网址有效期
用户画像ID体系建设:以阿里、网易、美团、58为例
更新时间:2025-5-2 10:21:55 作者:爱短链
在上一篇文章的基础上,今天,作者以阿里巴巴、网易、美团和58为例,分析和总结了用户肖像ID系统建设,帮你理清每一个系统ID做映射很方便。
前言:在梳理了标签肖像系统的业务需求后,作为数据产品经理,有必要开始肖像系统的整体设计,首先遇到的是用户ID系统开放相关问题。
公司各业务线ID多,数据分割,如何尽可能多地关联更多的数据,准确地描述用户的肖像? 接下来,让我们来看看索隆通过对阿里巴巴、网易、美团和58的研究和分析,逐步建立自己的公司ID-Mapping系统的过程。
一、阿里OneID 阿里巴巴作为一家包含多条业务线的公司,如: 电子商务、金融、广告、文化、教育、娱乐、设备和社交等领域,数据区域包括国内外;数据场景包括在线货场资金、离线货场资金位置等数据,以及物流、餐饮、咨询、影视、旅游、阅读、音乐、健康等相关数据。
ID类型包含phone、PC cookie、IMEI与IDFA、淘宝账号、支付宝账号、邮箱等。
而对于每个BU就他们而言,他们所知道的只是客户的片面属性。
在开展营销活动时,他们只为手机号码或电子邮件进行营销,但他们无法识别背后的自然人和公司。
阿里使用它来打破数据岛,创造更大的数据价值OneData作为核心方法论。
OneData体系包含: OneModel:建设和管理数据资产 OneID:实体开放和画像 OneService:逻辑化服务 OneID基于超强ID识别技术链接数据,高效生产标签;业务驱动技术价值化,消除数据孤岛,提高数据质量和价值。
而ID必须有ID-ID两两映射通过关系,通过ID只有映射关系表,才能形成多种ID两者之间的联系是完全孤立的ID无法打通。
打通整个ID系统,看似简单,实则计算复杂,计算量很大。
如果某个对象有数亿个人,每个人都有数十个不同的对象ID任意两种标志ID所有想要完成这类对象的个体都有可能打通关系。
ID一般机器甚至大数据集群都机器甚至大数据集群都无法完成。
在大数据领域ID-Mapping技术是用机器学习算法代替野蛮计算,解决对象数据打开的问题。
基于输入的ID关系是正确的。
机器学习算法用于稳定性和收敛性计算,输出关系稳定ID关系是正确的,并产生一个UID作为识别对象的唯一标识码。
二、网易ID-Mapping 网易产品线包括网易云音乐、网易邮箱、网易新闻、网易严格选择等。
不同的应用有不同的应用ID,如yanxuanid、oaid、musicid、phone、email、idfa、imei等。
唯一的标志ID,网易采用的思路和方案如下: 结合各种账户、各种设备型号的关系,以及设备使用规则等用户数据,采用规则规则和数据挖掘算法(连接图划分 社区发现)判断账户是否属于同一个人的方法。
ID-Mapping在此过程中,经常遇到的问题及相应方案如下: 1. 问题1:用户有多个设备信息 解决方案:定义相关阈值进行关联。
社区发现,目前在营销场景中的应用尚未用于风险控制或用户操作场景,因为这将连接一些异常账户,并且只有一次设备信息。
2. 问题二:设备过期,一般2年半左右 解决方案:设置衰减系数,增加单用户多设备的衰减。
备注一般一人多设备对应的场景有,借用朋友设备、设备脏数据、刷号等。
三、58 ID-Mapping 58业务场景丰富,产品线包括58个城市、市场、安居客、中国人才网、转转、58家等。
在这种多用户、多业务线、多子公司的情况下,用户数据种类繁多。
构建肖像的数据来自日志、简历库、帖子库、用户信息库、商户库、认证信息库等数据源,其中仅日志就涉及58、市场、安居客等子产品PC/M/APP日志。
如何将众多数据源串联起来,是构建用户肖像所面临的第一个问题,如下是58构建ID-Mapping模型图。
从图中可以看出,不同的业务线所拥有的ID标识不一: 58同城:wuser、wbdid、wimei 58赶集:guser、gbdid、gapud、gimei 安居客:kimei 可通过telep、bidua、appua、imei、idfa建立不同的联系ID相关映射关系是ID-Mapping的过程。
四、美团ID-Mapping 美团与公众评论合并,同一用户在两个APP有不同的身份标志。
美团应该如何做唯一的标志? 让我们来看看美团和公众评论的账户系统。
美团采用手机号码、微信、微博、美团账号登录;手机号码、微信、QQ、微博登录方式;其交集为手机号码、微信、微博。
最后,美团采用手机号作为注册用户账户系统的唯一标志。
五、总结 从以上案例可以看出,ID-Mapping常见的方法有三种: 基于账户系统的企业最常用的是基于账户系统ID打开,用户注册时,给用户一个uid,以uid加强所有注册用户的信息。
基于设备:未注册用户可通过终端设备ID包括精确识别Android/iOS识别两种主流终端。
SDK将各种ID收集报告,后台使用ID关系库和校准算法实时生成/找回唯一的终端ID并下发。
基于账号