关灯
护眼
字体:

第058章 数据的心跳(第2页)

章节目录保存书签

【记住全网最快小説站101看书网超顺畅,????????????。??????隨时看】

“降维。”

顾清舟在坐標轴上画了几个圆圈。

“我们不需要计算每个人。我们把人变成『向量。”

“给每个用户打標籤。比如:美妆、极客、摄影、美食、宠物……”

“用户a不再是用户a,他是一个向量:美妆:0。1,极客:0。9,摄影:0。5。”

“我们只需要计算向量之间的夹角。夹角越小,这两个人越像。”

“然后,把那个像的人看过的东西,推给他。”

大卫盯著白板上的那个坐標轴,脑海里仿佛有一道闪电划过。

作为数学家,他习惯了追求精確解。

但在商业应用里,有时候“模糊的正確”比“精確的错误”更有价值。

“向量化……”大卫喃喃自语,“这確实能极大地降低计算量。我们可以把用户的行为日誌离线处理,生成用户画像向量,然后在线上实时匹配內容向量。”

“可是,还有一个问题。”

大卫推了推眼镜,指出了关键,“冷启动。对於那些刚註册的新用户,我们没有任何数据,怎么给他们生成向量?”

“那就『骗他们交出数据。”

顾清舟笑了。

“在註册流程里,加一步。让用户选三个感兴趣的標籤。比如:你喜欢猫还是狗?你喜欢旅行还是宅家?”

“这不仅是为了收集数据,更是为了给用户一种『被尊重的错觉。让他们觉得,halo是在为他们量身定製的。”

“而且……”

顾清舟走到大卫身边,压低了声音。

“我们还有一个杀手鐧。”

“什么?”

“位置服务。”

“一个人在哪,决定了他是谁。”

“如果一个用户经常出现在华尔街,那他大概率对財经和豪车感兴趣。如果他经常出现在苏荷区,那他可能是个时尚达人。”

“把地理位置信息也加进向量里。”

大卫深吸了一口气。

他看著顾清舟,眼神里多了一丝敬畏。

这个年轻人不仅懂產品,更懂那些隱藏在数据背后的逻辑。

章节目录