婚恋和资源共享市场,到底该用传统搜广推还是 AI 推荐算法?
Published:
我和朋友最近在讨论这个问题。朋友说想拿 AI 来做婚恋市场的匹配,我觉得在样本量小的情况下,这完全可行——甚至根本不需要搭任何搜广推系统。你直接问大语言模型,把几个用户的简历丢进去,让它排序就好了,整个过程非常简单。
但如果样本量上来了,比如几十个、上百个用户,大语言模型直接排序就开始力不从心了,这时候才真正需要一个小的搜推系统来打标签、做过滤。所以问题就变成了:什么时候该用传统搜广推,什么时候该上 AI 推荐算法,两者的边界在哪里?如果要做婚恋市场,或者创始人和投资人的资源共享交互平台,这个选择又有什么不一样?我去查了一些业界的实操经验,把自己的思考整理在这里。
传统搜广推是什么
“搜广推”是搜索、广告、推荐三个方向的合称,是互联网产品里最成熟的流量分发体系。传统做法的核心是打标签 + 规则 + 协同过滤。
具体来说,流程大概是这样的:先对用户和内容打标签(年龄、地域、兴趣、行为),然后通过多路召回(基于内容的召回、协同过滤召回、热门召回等)拿到候选集,再经过粗排、精排、重排三个阶段,最终把结果呈现给用户。
这套体系在淘宝、抖音、微博上跑了十几年,工程上非常成熟。它的优点是可解释、可调控、对数据量要求相对低。缺点也很明显:冷启动难,新用户没有行为数据就很难推准;标签体系需要人工维护,容易过时;而且它本质上是在优化”点击率”这类显式反馈,不一定能捕捉到用户真正想要的东西。
AI 推荐算法在做什么
这里说的 AI 推荐,主要指两类:一是基于深度学习的端到端模型(比如双塔模型、Transformer 序列模型),二是近两年兴起的大语言模型(LLM)辅助推荐。
深度学习推荐系统的核心进步是:不再依赖人工打标签,而是让模型自己从行为序列里学习用户偏好的表示(embedding)。YouTube、Netflix、Spotify 都在用这套路子。它的优势是能捕捉更细粒度的偏好,泛化能力强,在数据量足够的情况下效果远超传统方法。
LLM 辅助推荐是更新的方向。业界的实践大概分三种用法:一是用 LLM 做特征工程,给 item 生成更丰富的语义描述;二是用 LLM 做冷启动,对新用户通过对话理解偏好;三是直接用 LLM 做推荐决策,让模型根据用户的自然语言描述直接输出推荐结果。第三种目前在工业界还不是主流,因为延迟高、成本贵,但在小规模、高价值场景里已经有人在试。
婚恋市场的特殊性
婚恋平台是一个非常特殊的场景,它和电商、短视频推荐有本质区别:双边匹配,且结果是互斥的。你推给 A 的人,A 喜欢了,但对方不一定喜欢 A。这不是单向的”用户喜不喜欢这个内容”,而是一个需要双向意愿的配对问题。
Hinge 目前用的是基于 Gale-Shapley 稳定匹配算法改进的推荐系统,同时结合机器学习模型预测双向互动概率。OkCupid 早期靠大量问卷打标签,用加权相似度做匹配,这是典型的传统搜广推思路。但 OkCupid 自己也承认,问卷数据越来越难收集,用户填写意愿在下降。
婚恋场景里,传统打标签的问题在于:人对自己的偏好描述往往不准确。用户说自己想找”成熟稳重”的,但实际行为数据显示他们更多地对”幽默外向”的人产生互动。标签捕捉的是用户的自我认知,不是真实偏好。AI 模型从行为序列里学,反而更接近真相。
但婚恋场景的数据量通常不大,尤其是垂直细分市场(比如高学历、特定职业群体)。数据稀疏的情况下,深度学习模型的优势会大幅缩水,反而是规则 + 标签的传统方法更稳定。
创始人和投资人的资源共享市场
这个场景比婚恋更复杂,因为匹配的维度更多:行业赛道、投资阶段、地域、投资人的 portfolio 偏好、创始人的融资需求……而且这个市场的用户规模通常很小,数据量根本撑不起一个深度学习推荐系统。
目前业界的实践,比如 Metal、Seedblink、EasyVC 这类平台,基本都是混合策略:用结构化数据(投资历史、行业标签、阶段偏好)做基础过滤,再用 LLM 对非结构化信息(投资人的公开文章、创始人的 pitch deck)做语义理解,最后生成匹配推荐。这本质上是”传统规则过滤 + LLM 语义增强”的组合,而不是纯粹的 AI 推荐。
这个思路是对的。在数据稀疏、用户规模小、每次匹配价值极高的场景里,LLM 的语义理解能力是真正的增量价值——它能读懂”我们专注于气候科技的 Pre-A 轮”这种自然语言描述,而传统标签系统需要把这句话拆解成十几个字段才能处理。
我的判断
婚恋和创投资源共享,看起来都是”双边匹配”,但本质上是两种完全不同的场景,不能用同一套逻辑来设计产品。
婚恋是低频的。一个人一生里认真谈几次恋爱,结一次婚,行为数据极其稀疏。更重要的是,婚恋的最终判断没有办法外包给算法——你必须自己去见,自己去感受,自己去试。算法能做的只是缩小候选集,把”可能合适”的人推到你面前,但它替代不了你的判断,也不应该试图替代。在这个场景里,过度依赖 AI 推荐反而是一种产品方向上的误判。
创投资源共享则完全不同。创始人在融资过程中要接触几十上百个投资人,投资人每周要看几十份 BP,双方都在进行高频、重复的筛选判断。这是一个典型的重复博弈场景——每一次互动都在产生数据,每一次拒绝或推进都是信号。在这种场景里,AI 推荐算法不是在”替代”人的判断,而是在充当判断加速器:它帮你把不匹配的过滤掉,把值得花时间的优先排上来。数据越积越多,模型越来越准,这个飞轮是真实存在的。
但有一点两个场景都一样:不管用什么技术,产品都得创始人自己去做。不是说找个技术人员闭着眼睛把算法跑起来就完了。婚恋产品需要创始人真正理解用户在找什么、怕什么、在哪个环节放弃;创投平台需要创始人自己在这个圈子里摸爬滚打过,知道投资人真正的决策逻辑是什么。算法是工具,产品感觉是前提。没有后者,前者搭得再精巧也是空的。
一个值得认真对待的反驳
我朋友的观点更乐观:他认为 AI 能大幅提升婚恋匹配的准确率,传统标签匹配的成功率可能只有 2%,而 AI 做性格层面的配对能把这个数字推到 35%。
我不完全同意,但也不想简单否定。
塔勒布有个观点:一样东西已经存在很久,它就可能继续存在更久。婚恋中介、媒人这件事,人类做了几千年。AI 才存在多少年?从这个角度看,过分强调 AI 的作用是危险的。
但换一个角度,AI 的语义理解恰恰和传统婚恋中介有相似之处。媒人做的事情是什么?是听你说话,理解你真正想要什么,然后在脑子里做匹配。这不是打标签,这是语义理解。从这个意义上说,用 LLM 来做婚恋匹配,反而比协同过滤、比标签系统更接近人类几千年来处理这件事的方式——它更人性化,不是更机械化。
所以我对 AI 在婚恋场景里的前途并不悲观,只是对时间表保持谨慎。现实的约束是算力成本,LLM 做大规模排序目前还太贵。更重要的约束是数据和经验:这件事必须由真正懂这个行业的人来做,先积累足够的数据,先把产品逻辑想清楚,然后才是设计算法。顺序不能反。
