从婚介所到约会软件,爱情算法靠谱吗


来自:线性资本(微信号:LinearVenture),作者:贺若昕,哥伦比亚大学国际关系学院国际金融硕士在读。

如果爱情可以被计算


爱情究竟是什么?心理学家罗伯特斯滕伯格曾提出过一个“三基石”理论,目前是心理学界关于亲密关系的一个主流理论。

他提出,爱情是由三块基石构成的,分别是亲密、激情和承诺,在真实的情感中,可能三种成分各自占比的程度不同,从而形成了各类不同的爱情。



我假设爱情可以由函数计算,那么Y(爱情)=(f激情(p),f亲密(l),f承诺(c))

  • 激情

构成浪漫爱情的决定因素

我们假设浪漫爱情产生的前提是两人之间相互吸引,而吸引或一见倾心的主要因素是外表

因此f激情=(长相,身材,气质,感觉…)

  • 亲密

Grote&Frieze对其概括为: “对一个值得喜爱的伴侣的适意的充满感情的信赖的爱,它以深厚的友谊为基础,涉及到相伴的关系,享受共同的活动,相互的乐趣和分享快乐。”

同时更多的研究表明,亲密关系伴侣之间的相似性越大,对彼此就更有吸引力,他们的婚姻也更幸福

因此f亲密=(三观,兴趣…),两者之间相似程度越大则取值越高

  • 承诺

不完全由感情决定,更多由认知因素影响

因此我将财富、家庭背景等客观条件归于这一类,f承诺=(财富,家境,社会地位….)

 

最后,我定义的婚恋市场的核心功能,即帮助参与者找到尽可能多的同时或部分符合亲密、激情、承诺这三个条件的候选对象,并帮助其在当中挑选出最终计算的函数值最大的人选。


婚恋市场的商业模式



由于买房也是我国传统文化里一件人生大事,且其也是交易频次低、交易金额大的一笔生意,我们用房产市场做类比,先讲讲婚恋市场的商业模式。



服务对象:婚恋市场上的参与者是婚恋对象双方,这类似二手房产市场上的买房者和购房者。

核心需求:双方要配对成功—不论是买房购房还是嫁娶双方。这些在自然状态下都是有难度的。如果没有交易成本,按科斯的理论,大家都能实现最优结果。但现实世界多了一笔交易成本,这导致买房的找不到合适的房源,想结婚或谈恋爱的找不到合适的对象。

传统商业模式:买房有实体二手房中介,婚恋市场更是历史悠久,从月老媒婆到后来的婚介所,可谓是方式众多。

互联网和大数据下的商业模式:

互联网的普及催生了房源门户网站,如58同城、搜房网等,便利了购房者在更广的范围内搜索自己想要的房子。在大数据和人工智能的变革下,一些房产中介如链家又悄然变革,逐渐借助算法来描绘更准确的用户画像,以方便对用户进行精准推荐


(可以参考我们的上一篇文章:房地产行业的「互联网+」该怎么玩? ——以链家为例


婚恋市场也是一样的道理。互联网时代到来之后,出现了各种婚恋门户网站,如百合网、世纪佳缘等,在大数据和人工智能的变革下,各类约会软件如OkCupid、Tinder又在用算法提高用户之间的匹配程度,了解用户的真实需求,以便为用户准确推荐适合他们的对象。




从婚介所到约会算法


首先我们要解决爱情的基石1激情


照像技术变革过一次这个领域,使得这件事从单纯的“媒妁之言”进步到了“凭照相亲”,从门户网站到约会软件,照片很多时候都成为一个人选择是否和另一个人交往的前提。

算法时代,Tinder之类的约会软件甚至使这个流程变得更加方便快捷了。它可以帮你推荐多个也许符合你审美的人选,你只需不喜欢左划、喜欢右划,so easy




但激情过后,实现爱情的基石2亲密则比较困难


传统的婚介所是如何操作的呢?

我们来看看安小姐的经历

她说,缴纳服务费之后,顾问会让你做一套心理测试题,之后由顾问负责人工在电脑资料库里寻找匹配对象,并承诺在经历和性格相似的对象中寻找最适合她的对象。


听起来是不是很熟悉?这不就是OkCupid软件测试题的线下版吗

我不禁心生疑问,既然传统的商业模式中也是这么做的,算法和大数据又在哪些环节做到了颠覆和变革呢?


安小姐继续说,这家婚介所的心理测试内容不过是一套人格分析题,在得出自己是乐观型、坚定型人格之后,并没有像合同上承诺的一样对自己的性格和择偶标准做出深刻的了解,仅仅是根据资料库进行机械的配对。


很显然,传统的婚介所无法做到判断

1)哪些问题对你来说是最值得问的问题,这些问题各自的权重占比是多少

2)无法科学计算,从而无法准确配对 

3)用户回答的答案是否是其真实的态度


而基于算法的约会软件又是如何做的呢?

OkCupid会问你一系列问题,每个问题你都要回答三点 

1)你的态度2)你希望对方的态度3)这个问题的重要程度

现在假设你是A,计算机希望将你和B匹配,它需要回答的问题是:你对B的回答的满意程度是多少?这个答案是用一个分数表达的,分子是B答案的总分数,分母是你认为这个答案的重要程度的总分数,在对每一个单独的问题计算出这个分数之后,再将这些分数相加并转换成百分比,这个百分比就是衡量你和B在一起后会有多开心的数字。之后算法再用同样的步骤计算一遍B对你回答的满意程度。最后算法计算出A的百分比满意度和B的百分比满意度的乘积的n根,这个分数将决定A和B的匹配程度。

这个算法解决了婚介所无法解决问题的前两个。


实际中可能还存在这样的情况:一个人声称他喜欢不喝酒、热爱旅游的美女,现实中却偏偏被另一个夜店范女郎吸引,这被叫做显示性偏好。由于人的自我认知或其他因素的影响,显示性偏好和表述偏好之间经常存在差距。为了解决这个问题,Match.com的算法在同时存储了你的表述和显示性偏好之后,会在网站上寻找那些和你在两者差异上类似的人,用他们的记录来估计你的情况,从而为你推荐合适的对象人选。

这就也解决了第三个问题。(实际的数据搜集结果可能是显示性偏好数据不足,因此这个问题只能算部分解决)


这么看来,算法算出来的对象应该是靠谱的,可是...


爱情真的可以用算法计算吗?


可是如果我们一开始的假设就错了呢?


我用“你觉得爱情中什么最重要”这个问题调查了几个周围的朋友,他们还提到了缘分、互补、相互信任感等软件不会考察的因素。

我最喜欢的一个答案是这样的—“因为喜欢了他,对自我产生了新的认识,甚至世界观、人生规划等都发生了变化”。


如此看来,真正的爱情不止在于合适,它是复杂的,是一个混沌系统。正因为是混沌系统,更多变量无法被纳入模型,所以我们可能不能用像开头那样的线性模型计算,我们只能相信概率,在一次次试错中逼近正确值。


这种情况下,我们可以如何更好地用算法改进这个过程呢?


1)从纯线上到线上线下协同发展


缘分、建立联系等要素可能还是得通过线下的活动来培养。类似房地产,平台的线下运营能力非常关键。未来的趋势可能是线上平台从轻资产到重资产,通过策划线下活动,改善用户的服务体验来提升竞争力。

 

2)多场景获取用户数据,描绘用户真实需求


 简单的一份问卷调查可能无法很好的匹配用户,但如果数据量增加,匹配的能力也许就增强了。

类似链家从租房、买房到房产金融的全场景布局,如果约会软件也可以获取用户在其他场景下的数据,比如其他社交软件、兴趣部落、购物平台等等,得到的整个生态系统的数据,再运用深度学习等技术概括出用户的特征和真实需求,也许会得到更好的匹配结果。


最后,让我们用安小姐故事的结局做结尾吧

安小姐结束了在婚恋所的咨询并不再付费,她觉得要自己投身真实的生活去寻找爱情。

因为爱情的一部分意义可能就在于它的不确定性,在于对另一个生命的永不倦怠的探索。

 

参考资料:

制造“爱情工厂":假如丘比特是个程序员

在婚介公司,花十几万找对象的人比比皆是

美国式婚恋:50年来网络算法如何颠覆男女的婚配及命运

Why did I delete OKCupid

OKCupid:the math behind online dating

推荐↓↓↓
算法与数据结构
上一篇:一文读懂 AVL 树 下一篇:高德纳(Donald Ervin Knuth):这位所有程序员心中的大神今天80岁了