第058章 数据的心跳(第2页)
【记住全网最快小説站101看书网超顺畅,????????????。??????隨时看】
“降维。”
顾清舟在坐標轴上画了几个圆圈。
“我们不需要计算每个人。我们把人变成『向量。”
“给每个用户打標籤。比如:美妆、极客、摄影、美食、宠物……”
“用户a不再是用户a,他是一个向量:美妆:0。1,极客:0。9,摄影:0。5。”
“我们只需要计算向量之间的夹角。夹角越小,这两个人越像。”
“然后,把那个像的人看过的东西,推给他。”
大卫盯著白板上的那个坐標轴,脑海里仿佛有一道闪电划过。
作为数学家,他习惯了追求精確解。
但在商业应用里,有时候“模糊的正確”比“精確的错误”更有价值。
“向量化……”大卫喃喃自语,“这確实能极大地降低计算量。我们可以把用户的行为日誌离线处理,生成用户画像向量,然后在线上实时匹配內容向量。”
“可是,还有一个问题。”
大卫推了推眼镜,指出了关键,“冷启动。对於那些刚註册的新用户,我们没有任何数据,怎么给他们生成向量?”
“那就『骗他们交出数据。”
顾清舟笑了。
“在註册流程里,加一步。让用户选三个感兴趣的標籤。比如:你喜欢猫还是狗?你喜欢旅行还是宅家?”
“这不仅是为了收集数据,更是为了给用户一种『被尊重的错觉。让他们觉得,halo是在为他们量身定製的。”
“而且……”
顾清舟走到大卫身边,压低了声音。
“我们还有一个杀手鐧。”
“什么?”
“位置服务。”
“一个人在哪,决定了他是谁。”
“如果一个用户经常出现在华尔街,那他大概率对財经和豪车感兴趣。如果他经常出现在苏荷区,那他可能是个时尚达人。”
“把地理位置信息也加进向量里。”
大卫深吸了一口气。
他看著顾清舟,眼神里多了一丝敬畏。
这个年轻人不仅懂產品,更懂那些隱藏在数据背后的逻辑。