首页 理论教育用户行为建模:构建用户标识、产出标签与权重

用户行为建模:构建用户标识、产出标签与权重

【摘要】:本节详细介绍如何根据用户行为构建模型产出标签、权重。关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。表9-2用户标识表②什么时间。时间戳,为了标识用户行为的时间点,如,1395121950,1395121950.083612,通常采用精度到秒的时间戳即可,因为微秒的时间戳精度并不可靠。行为类型:浏览行为记为权重1;地点:品尚红酒单品页的网址子权重记为0.9。用户偏好标签是红酒,权重是0.95×0.9×1=0.855,即用户A:红酒0.855、长城0.855。

本节详细介绍如何根据用户行为构建模型产出标签、权重。一个事件模型包括时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。

①什么用户。关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。

表9-2列举了互联网主要的用户标识方法,获取方式由易到难。视企业的用户黏性,可以获取的标识信息有所差异。

表9-2 用户标识表

②什么时间。时间包括两个重要信息,时间戳+时间长度。时间戳,为了标识用户行为的时间点,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常采用精度到秒的时间戳即可,因为微秒的时间戳精度并不可靠。浏览器时间精度,准确度最多也只能到毫秒。时间长度是为了标识用户在某一页面的停留时间。

③什么地点。对于每个用户接触点(touch point),潜在包含了两层信息:网址+内容。网址就是每一个url链接(页面/屏幕),即定位了一个互联网页面地址,或者某个产品的特定页面。可以是PC上某电商网站的页面url,也可以是手机上的微博,微信等应用某个功能页面,某款产品应用的特定画面,如长城红酒单品页、微信订阅号页面、某游戏的过关页。内容就是每个url网址(页面/屏幕)中的内容,可以是单品的相关信息:类别、品牌、描述、属性、网站信息等,如红酒、长城。对于每个互联网接触点,网址决定了权重,内容决定了标签。

标签权重:矿泉水1//超市;矿泉水3//火车;矿泉水5//景区

类似地,用户在京东商城浏览红酒信息,与在品尚红酒网浏览红酒信息,表现出对红酒的喜好度是有差异的。这里的关注点是不同的网址,存在权重差异,权重模型的构建需要根据各自的业务需求构建。所以,网址本身表征了用户的标签偏好权重。网址对应的内容体现了标签信息。

④什么事。用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏等。

不同的行为类型对于接触点的内容产生的标签信息具有不同的权重。

综合上述分析,用户画像的数据模型可以概括为下面的公式:

用户标识+时间+行为类型+接触点(网址+内容)

某用户因为在什么时间、地点、做了什么事,会被打上相应标签。

用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:

标签权重=衰减因子×行为权重×网址子权重

如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息,标签:红酒,长城;时间:因为是昨天的行为,假设衰减因子r=0.95。

行为类型:浏览行为记为权重1;地点:品尚红酒单品页的网址子权重记为0.9(京东红酒单品页为0.7)。

假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不在综合商城选购。用户偏好标签是红酒,权重是0.95×0.9×1=0.855,即用户A:红酒0.855、长城0.855。

上述模型权重值的选取只是举例参考,具体的权重值需要根据业务需求二次建模,这里强调的是如何从整体思考去构建用户画像模型,进而能够逐步细化模型。