不朽的双螺旋
致投资人的信2025
各位XVC的投资人:
从我们第一只人民币基金的首次关闭至今已经九年了,从我们第一只美元基金的首次关闭至今已经八年了。截至2025年9月30日,XVC的总投资成本为44.86 亿人民币,账面价值为113.35亿人民币,所有基金的平均毛内部收益率为26.05%。
2025 年发生了很多会让我们记住的事情,比如,1 月 20 日 DeepSeek R1 的发布,被全球科技行业和金融同行称为“Deepseek Moment”。又比如,4 月 2 日,特朗普宣布震惊世界的“对等关税”,引发全球资本市场的一场大地震。
另外,在4 月 17 日,特朗普宣布“对等关税”两周后,霸王茶姬在纳斯达克低调地上市。这是 XVC 自成立以来收获的第一个IPO。
XVC的投资组合在 2025 年的表现
在这样一个充满挑战的年份,XVC 的投资组合,又交出了一份高分答卷(见下图)。

第一,我们的 “3 亿美元以上俱乐部” 又扩容了,年化毛收入超过 3 亿美元的公司,从去年的 5 家增加到今天的 8 家;超过 1 亿美元毛收入的企业,现在一共有 14 家。
第二,“深绿色加号俱乐部”也在不断增加新成员。在这些毛收入超过 1 亿美元的公司里,绝大多数已经实现了正向现金流,或者在公司整体层面上已经稳定盈利。也就是说,他们没有靠讲故事、烧钱增长,而是用自己的造血能力,实现高质量的增长,穿越更长的周期。
第三,XVC 投资组合的合计收入和利润,双双再创新高。核心项目的合计收入预计比去年增长 25%,从 500 多亿人民币涨到接近 700 亿,盈利项目的合计利润预计比去年增长 32%,从28.5 亿人民币涨到约37.7亿人民币。

也许有人会质疑,这个数据其实是可以掺水的。例如只要花一点钱,买一点字节跳动的股份,数据就上去了。为了回应这个质疑,我们计算了按照收入规模加权计算的XVC平均持股比例和按照利润规模加权计算的XVC平均持股比例,这两个数字分别是13.81%和15.74%,如此来看,绝大多数的核心项目,XVC至少领投过一个早期轮次。
或许有人还会想,现状还不错,但未来是不是会掉头向下?
短期我不知道,长期来看还是很有信心的。首先,驱动这些收入和利润增长的底层因子,是巨大而真实的,会在未来很长的时间里持续发挥作用。除了头部的大企业,组合中还有不少规模尚小的企业有巨大的潜力,假以时日,他们有机会成长为百亿、千亿营收规模的大公司。
“不朽的双螺旋”
今年9月底,有一个大部分人没注意的事情:XVC 的成员企业“伊对”,低调地发了一个招股书。
从招股书披露的信息可以看到,他的收入、利润,都在快速增长,而且规模也不小了。2025 年上半年实现了约20 亿人民币收入和 3 亿利润。
从进化论的角度看,这家在线情感社交平台公司所做的事,就是把“争夺异性注意力”的本能,转化成一个可规模化复制的商业机制。
如果我们往更深层想——为什么人类会这样被驱动?为什么这种心理机制几乎跨越文化、种族、时代都一样?
理查德·道金斯在《自私的基因》这本书里,给出了一个震撼的解释:我们——包括人类在内的一切生命——其实都是基因的“生存机器”。我们看似在追求爱情、财富、意义,但在更底层,都是在帮那条DNA双螺旋完成复制。
个体会消失,物种也会灭绝,但基因以复制的方式,一代又一代延续下去。这就是道金斯所说的“不朽的双螺旋”。
对我个人来说,这本书和《思考,快与慢》一样,深刻影响了我的世界观——让我开始从“演化”的角度去理解人、理解社会、理解商业。
如果从进化的角度看,人类的基因在过去几千年几乎没有发生变化,而在可见的未来,也不会有太大变化。所以,当我们投资一家公司时,很多时候他解决的并不是一个“新需求”,而是把人类古老的需求用新的方式满足。
比如——霸王茶姬。看上去是新茶饮、是流行、是品牌、是供应链创新。但从本质上讲,他满足的是人类对茶与奶的双重喜好。人类喝茶、喝奶的历史都超过了两千年,只是今天,这两种古老的愉悦,被更精致、更具仪式感地结合起来。
再比如——核桃编程。他让孩子通过游戏化、AI老师辅助的方式自学编程,教学效果极好,因为这符合人类天生的学习模式:探索、试错、获得反馈、再尝试。这是猎人时代就被写进我们基因的学习方式,只是我们在教育体系里一度忘记了。
所以,当我们看似在“创新”,其实是顺着人性的河流在行走。真正长久的创新,往往不是创造新需求,而是回到人类最深层、最古老的需求。
刚才是从时间的维度上观察,我们再从看空间来看,不同人种之间的基因差异其实非常小。无论肤色、语言、文化再怎么不同,我们共享 99.9% 以上的基因。所以,人类的共同点远远多于差异。这也解释了,为什么很多伟大的产品、伟大的品牌,能够跨越文化,被全世界接受。
在XVC的投资组合中,有三分之二的企业面向全球市场。
比如——Weee!。2019 年我们领投他的B 轮融资时,公司主要服务湾区华人群体。但过去几年,已经稳步扩张至全美——并跨越日裔、韩裔、越南裔等多个族裔,今年甚至拓展至多个拉丁裔群体。令人惊讶的是:在所有这些不同族裔中,留存曲线几乎如出一辙——平滑、稳定且强劲。
徕芬(Laifen)也是一样。他的吹风机、剃须刀卖到全世界,因为每个人都追求同样的东西:高效、美感、舒适感。
即使是伊对这样一个起源于中国的社交app公司,仍然正在不同文化的土壤里,正以稍微不一样的产品形态生根发芽。因为在基因层面,人类的社交、连接与被认可的需求,是共通的。
所以,当我们看到“横跨五大洲”的扩张时,本质上看到的不是市场的复制,而是人性的共鸣。即使科技在不断创造新的产品和服务,人类的基因几千年来几乎没有变,但人性的底层需求很稳定。可是如果让一个新的产品和服务真正触达亿万用户、长时间地服务他们,还需要创业者构建出一个能规模化运行的商业模式,以及一个与之适应、能自我进化的高效能组织。
复盘XVC的核心策略
在生物世界,进化靠基因的复制;在商业世界,进化靠模型和组织的复制。他们都遵循同一个原理:谁能更稳定、更高效地自我复制,谁就能在最广的空间、最长的时间中胜出。
这就是 XVC 的核心策略:我们极致地专注于寻找那些能进行大规模、长时间自我复制的商业模式,以及与之适应的优秀组织。
我们相信,真正伟大的公司,不靠短期风口,而靠他们自己的“双螺旋”在自我复制和进化。

那么,什么样的商业模式和组织,才能够大规模、长时间自我复制呢?从我们的复盘来看,伟大的公司通常具备三个特征。
第一,他们抓住了一个长期结构性变化驱动的巨大、真实、新的 PMF。
PMF,也就是 Product-Market Fit,简单说,就是产品与世界的“兼容性”。人类的基因在几千年里几乎没变,但技术的演进让社会结构不断重塑。当新的技术条件出现,人类旧有的需求会以全新的形式被满足,而能捕捉到这种结构性机会的创业者,就能定义一个时代的产品。
第二,他们有一个善于做正确决策、建设高效能组织的创始人。
第三,他们拥有长的自增强学习曲线,并且反规模重力有限——
规模越大,优势越强。这往往体现为:
• 自增强的品牌
• 自增强的数据
• 有强规模经济的产品或服务
• 以及有网络效应的平台
这三点构成了 XVC 的投资逻辑。我们寻找的,不是短期风口上的企业,而是那些能与未来的世界更兼容、能在时间里自我进化、最终被“自然选择”留下来的公司。
接下来,我想分三个不同的视角来聊一下,在XVC 的实践中,进化论的思想是如何影响了XVC 的投资决策、组织文化以及如何影响我们看待大环境的变化。

双螺旋的启示之一:遗传 vs. 变异
第一个视角,是“遗传 和 变异” 。
先跟大家分享一下道金斯在《盲眼的钟表匠》这本书里讲到的他自己做的一个计算机实验。这个实验非常简单,但它形象地解释了“基因空间”的概念。

他在电脑里定义了一个小生物的“基因组”—— 9 个参数,每个参数可以取 −9 到 +9 的值。这 9 个数字,决定了屏幕上一个线条小生物的形状。
可以把它理解成:一个在“基因空间”里占据某个位置的小虫子,改一个基因,它的形状就会变。然后他模拟“演化”:从一个初始的小虫子开始,每一代让电脑生成8个“子代”,每个子代只改变一个基因——也就是小幅变异。
然后,他用肉眼选择其中一个存活,丢弃其他的。然后不断重复,最后得到一些形状有独特意义的“存活者”。
整个实验就是:随机地微调基因 → 让形状慢慢改变 → 观察能不能产生复杂结构,进行选择,然后重复。
这个实验真正有意思的地方,不在于“形状会改变”,而在于不同的“变异方式”会导致完全不同的结果。
当道金斯让电脑进行大幅度随机变异,也就是一次改变很多基因时,结果非常一致:形状立刻变成一团噪音,完全没有意义,而且无法继续演化——相当于“死亡”。
为什么?因为基因空间太大了。9 个基因、每个基因有19个可能的值(从–9到9)因此⼀次跳跃的可能目标有19的9次方个,总共有 3227 亿种可能组合。 从数学上看,“能生存的基因组合”只是基因空间里的极小一部分。走得越远、跳得越快,越容易掉进十倍、百倍、千倍规模的“死亡区域”。
随机跳跃几乎必然落在一个“不能生存的区域”。但如果每次只允许小幅变异,也就是每次只改一个基因:电脑竟然能产生各种“像真实生物一样”的结构:树枝一样的、昆虫一样的、虾一样的、叶子一样的……这些形态不是“设计”出来的,而是在一个巨大空间里,通过逐步搜索“找到”的。
所以道金斯发现:长跳是死路,短跳才有机会找到生命。
道金斯用这个实验说明了一个关键原则:生命的进化不能靠大幅跃迁,只能靠无数次微小调整。他把这个叫做 “渐变假定(gradualism)”:跳远几乎必死,小步走才可能持续改进,复杂结构不是被“发明”,而是在巨大基因空间里“搜索”出来的。
这也给我们一个很重要的启示:无论是生命、组织还是商业模式,要让系统长期进化,最重要的是:持续的小步迭代,而不是跳跃式的冒险。
XVC 是如何刻意避免“长距离跳跃”
接下来,我想举几个对应的例子,说明在投资实践中,XVC 是如何刻意避免这种“长距离跳跃式”的决策方式的。

第一种“长距离跳跃”的做法,是跟随、追逐宏大概念——例如“低空经济”、“具身智能”、“元宇宙”等。市场上经常会在这些叙事刚出现时集中下注,认为只要概念够宏大,最后总能长出大公司。但在XVC,我们坚持的是另一套方法:重视PMF,用事实驱动研究。我们会关注新技术、新趋势,但不会仅凭叙事下注,而是用数据、留存、复购、单位经济模型来验证需求是否真实存在。
第二种“长距离跳跃”,是在不熟悉的行业进行‘布局式投资’。这种做法往往意味着快速扩张到多个赛道,希望用“铺开网”来提高命中率。XVC 的做法刚好相反:我们会做轻度、广泛的行业研究,但谨慎、缓慢地拓展能力圈。我们宁愿缺席一个看上去热闹的风口,也不会贸然跨入一个我们缺乏理解的领域。
第三种“长距离跳跃”,是投资依靠新流量红利、政策红利、新奇感红利、潮流红利驱动的高速增长。这类增长往往来得快、去得也快。XVC 的路径是:通过跨行业、跨区域、跨长时间的研究来理解商业底层规律,寻找“能长时间自我复制”的基因。我们特别关注那些即使失去红利,仍能保持强用户粘性和正向学习曲线的公司。
第四种“长距离跳跃”,是根据资历、名望来判断候选人或创始人。这是一种典型的表象判断,类似于在基因空间里用很粗糙的指标来选择“能否生存”。XVC 的方法是:以“行为法”为主判断创始人,关注他在真实情境中如何观察事实、做出关键决策、组织资源,而不是他的头衔、背景或叙事。
还有一种常见的“长距离跳跃”,是盲目进行管理创新、制度创新,比如有创始人会异想天开地给所有部门都计算利润指标,再用利润考核所有团队。XVC 的做法则是:先学习成熟企业的组织方法与制度,再因地制宜调整。例如,我们常用的“结构化行为面试法”(有的人称为 STAR 面试法)就是从一批组织能力强的大企业学习而来,而不是凭空发明。
总结一下:这些例子背后共同的原则是——在商业进化中,“遗传”往往比“变异”更重要;沿着可生存路径的小步走,比跳向未知远方更可靠。这也是 XVC 在投资研究、决策与投后服务中始终坚持的一条底层规律。
“事”和“人”,以哪个为主?
顺便聊一个早期投资常面对的灵魂拷问:做投资是应该以“事”为主,还是以“人”为主?
我的答案是:看得明白人的时候,以人为主;看不明白人的时候,以事为主。如果人和事都看得明白——那一定是以人为主。
你可能觉得我自相矛盾:既然你不喜欢“长距离跳跃”,为什么又要以人为主?
这是因为,XVC 的投资周期非常长。首先,在漫长的时间里,企业要经历无数困难、转折、甚至重生,企业是否能渡过这些重要关卡,创始人的决定往往起到决定性作用。一个善于学习善于决策的创始人,会非常主动地向历史学习、向同行学习、不断探索试错再向自己的错误学习,会主动避免“在基因空间长距离跳跃”。
另外,一个组织的“基因”,就是创始人定义的:核心团队、核心产品和战略、组织文化、组织流程。这些“基因”,最终决定了组织是否能高质量地自我复制、进化。
XVC的成员企业,拥有“抗风险”基因
说到这里,我想讲一下“抗风险”基因。
说到风险,我们还是得先给它做个定义。传统的资产管理理论用“波动率”来衡量一个投资组合的风险是有缺陷的。我建议大家换一个角度思考一个问题:碰上真正的“大风大浪”,什么投资组合最能“生存”?从这个角度看,我觉得XVC 的投资组合,是更安全的,比持有一个美国的中型商业银行的股票更安全,比百亿规模的私募信贷基金更安全,比有资产抵押的房产信托计划更安全。
过去几年的恶劣环境,让XVC 的投资组合经历了一场严酷的生存测试。新冠疫情、融资环境的急剧收紧、整体经济的波动、贸易战…… XVC 的成员企业不仅大部分活下来了,而且保持着强劲增长、盈利和现金流。这背后体现的是一种极强的韧性。
我认为,这不是运气,而是“基因”的问题。这些企业之所以能抵御大风大浪,有三个原因。
第一:创始人的自适应能力极强——我们挑选的是“行为基因”
XVC 选择创始人,不看学历,不看名气,不看大厂光环,也不看他的江湖地位和学术成就。我们看的是:他是否善于做正确的决定,是否能够建设高效能组织。
这些能力是通过行为体现出来的,而不是简历上的标签。正是因为这种自适应能力,他们能在每一次环境变化里迅速调整方向、修正策略、重新组织资源。他们的“行为基因”决定了他们的抗风险能力。
第二:这些企业代表的“新 PMF”,和宏观环境几乎无关
长时间来看,新的PMF替代旧的PMF,是一个确定性极强的趋势。一个简单的判断方式就是看——留存曲线是不是平的。
举几个例子:徕芬的吹风机。一旦习惯高速吹风机,你就很难回到传统低速吹风机。中国消费者已经意识到这个差异,而海外的消费者才刚刚开始觉醒。所以徕芬的全球增长才刚刚开始。
Weee!:美国已经有四分之一的华人家庭在长期使用 Weee!。 华人群体的渗透增长变慢了,但日本裔、越南裔、菲律宾裔、印度裔—— 都在以成倍的速度增长,留存曲线同样“平得像湖面”。今年他们上线的拉丁裔 App “Masgusto”,规模还小,但因为留存曲线是平的,所以未来几年, Weee!的拉丁裔用户必然会远远超过亚裔,因为美国的拉丁裔人数本来就比亚裔多几倍。
这些增长的驱动因素,不仅和宏观环境几乎无关,它们之间也相互独立,几乎没有相关性——这是极其健康的增长动力结构。
第三:他们的护城河越来越深,规模越大优势越强
我们投资的很多企业,都已经开始构建深深的护城河,并且随着规模增长,竞争优势进一步加强。这样的企业在环境不好的时候,会获得更高市场份额,因为弱者会被淘汰或被迫收缩;而在环境好的时候,他们又能赚得更多。这就是典型的“结构性赢家基因”。
所以说,XVC 的成员企业之所以能在过去几年顶住风浪,不是运气好,而是他们本身就拥有“能在环境变化中生存、适应、扩张”的基因。所以,XVC的投资人们,我想和你们说,即使再来一次金融危机,再来一次贸易大战,咱们也不需要睡不着觉,我们可以相信这些优秀企业的强大的生存能力和自我修复能力。
双螺旋的启示之二:进化稳定策略
接下来,我想用进化论的另一个概念——进化稳定策略——来观察这个世界,并做一些预测。
进化稳定策略,简称 ESS,它回答的是一个非常朴素的问题:在自然界里,为什么有些行为会长期保留下来,而有些行为会被淘汰?
ESS 的意思其实就一句话:如果一种策略在群体中被绝大多数成员采用,且没有任何其他“入侵策略”能够在自然选择压力下成功入侵并取代它,这种策略就称为进化稳定策略。
可以把它想象成一个“占住坑位”的打法:如果大家都用策略 S,外来策略 M 想进来,M必须在跟 S 的对抗中比 S 和 S 之间对抗表现更好才行。否则,就会被自然选择淘汰。当大部分族群都采用了 S 之后,它就成为了稳定的策略。
几乎在所有的异性社交app上,男性用户都远多于女性用户,这是因为包括人类在内的各物种里,雄性往往更倾向于 R 策略——多竞争、多展示、多尝试,用数量来提高成功率,而雌性偏向 K 策略——更谨慎、更挑选、更投入,更关注质量和长期收益。
这两套行为模式不是文化造成的,因为这两种策略的组合,在不同物种的进化中,都成为了进化稳定策略。当大部分雄性采用了 K 策略,大部分雌性采用了 R 策略的时候,对于雄性动物而言,所有不用 K 策略的会被淘汰,而对于雌性而言,不用 R 策略的,会被淘汰。换句话说:R 策略和 K 策略的组合,是一套进化稳定策略(ESS)。
中国的独特人才优势来自一个R+K的策略组合
放到今天的中国,会看到一个很有意思的组合:国家层面更像 R 策略,家庭层面更像 K 策略。

在国家层面,中国过去几十年走的是典型的“数量优先”路径,尤其是在高等教育上。官方预计,2025 年中国高校毕业生将达到约 1222 万人,这是一个什么概念?大致是美国一年高校毕业生数量的三倍多,是德国的二十倍多。这样的体量,本身就是一种极其典型的 R 策略:先把总体人才基数做大,让“数量”本身变成国家级优势。
但在家庭层面,中国父母又是高度 K 策略:在一个、两个孩子身上投入巨量时间、金钱和情感,极度重视教育质量和长期培养。放眼全球,这种“极度重视子女教育”的文化,只有极少数国家才有,比如日本和韩国。
对 XVC 来说,这种“国家 R+家庭 K”的组合,正是我们投资中国创业者的底层土壤。我们所投公司的三分之二是面向全球市场的,创始人几乎都是在中国接受基础教育的中国人,他们请来的高管,大部分也是中国培养出来的人才,他们的研发团队,主体也都在中国。背靠这样一个庞大且高质量的人才池,再叠加中国完整而高效的软硬件供应链,在全球的竞技场上,这一代中国创业者天然就拥有结构性的比较优势——而我们很幸运,可以作为他们的长期合伙人,参与到这一轮“R+K 叠加”的历史实验里。
开放的市场经济,是一个进化稳定策略
对于国家来说,开放的市场经济,是一个进化稳定策略。
当大部分国家选择了这个路线,就会形成一个有统一贸易规则的全球统一大市场。
这时候,选择开放的市场经济就意味着你有能力加入全球分工合作,从而极大提高生产效率和人民生活质量。这套体系会让国家不断获得技术、资本、人才和竞争带来的反馈,持续变得更强,所以很难被替代。
而封闭的计划经济缺乏这种外部反馈和全球分工带来的效率提升,因此无法长期稳定存在。回看过去 40 多年,中国的经济奇迹,本质上就是这一套“开放—竞争—分工”机制持续发挥作用的结果。
所以,我们可以看到,党的十五五规划,虽然强调了“坚持统筹发展和安全”,但是同时也继续强调要“推进深层次改革,扩大高水平开放”,继续强调“充分发挥市场在资源配置中的决定性作用”。
反过来,以今天中国的经济体量,制造业的规模和效率,ESS 会惩罚试图和中国脱钩断链的国家,然后会回到 ESS均衡策略。在这个大前提之下,我们就只需要专心地去发掘优秀的、有“长期阿尔法”基因的企业。人类的财富创造,他们才是决定性力量。
“长期阿尔法”策略和 Endowment Approach是否进化稳定策略?
如果我们把 VC 行业也看成一个“进化生态”,会发现这里面的大多数玩家,并不是像XVC 这样把“长期阿尔法”作为核心策略的。更多的是两类策略:一类是垂直行业基金:他们有一部分是靠追逐“热点行业”,有一部分会长期深耕一些垂直行业。另一类是跟随国家战略、追逐市场 beta 的大型基金:重点是“站在对的方向上,把钱分配到指定的赛道里”。
这些策略有一个共同点:叙事简单、容易获得 LP 的理解,能够提供“和大趋势匹配”的安全感。从进化的角度看,它们更接近一种“行业主流策略”。
XVC 的策略跟这个主流非常不一样——我们坚持 独立思考、重度研究、少而精的“狙击式投资”,追求的是和市场 beta 尽量解绑的长期阿尔法。
在 LP 这一端,也有一部分机构采取类似的思路,比如一些大学捐赠基金和部分老牌家办采用的 endowment approach:极长的持有周期、高比例配置以股权为主的非流动资产、强调少数优秀管理人抓住长期阿尔法能力,而不赌短周期的趋势。
问题来了:XVC的长期阿尔法策略,和部分LP的endowment approach,到底是不是一种“进化稳定策略”?
如果从 ESS 的角度来看,要成为一个进化稳定策略,有两个条件:1)大多数参与者都采用它时,它还能活得很好;2)其他策略很难大规模跑过它、把它淘汰掉。而我们会发现:长期阿尔法 + endowment approach,很难成为整个行业的大多数。
首先从逻辑上,alpha 的定义本身就要求“别人不是这样干的”。长期阿尔法策略要成功,前提就是:大多数人在追 beta、追风口、追短期。如果有一天,全行业都真的只关注长期阿尔法、都真的做深度研究、都追求逆向、都长周期,那真正可被利用的“系统性错定价”会急剧变少,alpha 就没有了。
那这个事情为什么没发生呢?因为这么做实在太反人性了(参考 2016 年年度信的最后一节),而且大部分LP的行为并不鼓励这样。
大部分资金的约束是:业绩周期短,需要“可解释可预测”,需要“安全感”。真正愿意接受 10 年以上长周期、高不确定、高波动的投资的 LP 在整个投资行业群体里永远是少数。
你可能要问为什么,难道endowment approach 不就很长期吗?大家都抄作业不行吗?是的,但是endowment approach 要求极高的“组织基因”。大学捐赠基金这类 LP 能长期坚持 endowment 模型,是因为他们有一整套支撑这种风格的“组织基因”:极长的资金久期,相对稳定的治理结构,能承受短期波动、坚持长期目标的文化。
这些特点,是绝大多数机构投资人没有的。所以它很成功,但很难普及,自然也很难成为整个金融体系的 ESS。
而 XVC 的 长期阿尔法 + endowment 型LP组合,更像是一种少数位点策略:在特定环境下非常强,但永远不会变成整个行业的主流。从进化的角度讲,它不是“全民 ESS”,而是一个在复杂生态里长期存在、但只能由少数玩家采用的高难度策略。
而我们的任务,就是把这条小众、困难但高质量的路径,走得尽可能长、尽可能好,在一个充满beta噪音的世界里,持续证明alpha的存在。
阿克塞尔罗德的博弈策略编程竞赛
接下来,我想请大家跟我一起做一个小小的“思想实验”。

上世纪 70 年代,有个政治学家阿克塞尔罗德,办了一场很特别的比赛:他邀请各路高手,用代码来写一套“在囚徒困境里出牌的策略”,然后让这些策略在电脑里两两对打、打一百多轮,算总分,看谁在长期博弈中活得最好。
这个竞赛问的,其实就是一个我们今天也非常关心的问题:在一个陌生而复杂的世界里,什么样的行为风格,最有机会成为“进化稳定策略”?
阿克塞尔罗德一共办了三轮比赛,规则一点点调整,环境越来越接近“真实世界”。接下来,我会用非常简单的方式,跟大家说说这三轮比赛发生了什么,最后得出的结论,其实对国家、公司、投资机构,甚至我们每一个人,都有很强的启发。
第一轮比赛的规则很简单:给定一套标准的囚徒困境收益表;参赛者提交各自的“出牌程序”;每两个策略配成一组,连续博弈 200 回合;合作比对抗长期更划算,但短期背叛可以多拿一点分。

一开始,大家的想法五花八门:有的特别算计人、专门等对方先合作再下黑手;有的天真到几乎从不反击;也有纯粹“随机瞎出”的。也有一些比较阴险的,例如“愧疚探测器”、“老实人探测器”。
结果非常出乎意料:最后赢得最高总分的,并不是最聪明、最阴险的那些策略,而是一套非常朴素的策略,叫 “Tit for Tat,针锋相对”:第一回合先合作;以后每一回合,完全复制对方上一次的选择。
听上去太简单了,但它击败了所有阴险、复杂、计算精密的策略。
为什么?阿克塞尔罗德总结出了四个关键特性,这四点加在一起,让它在长期演化中非常强。

第一,友好(Nice)
它从不主动背叛。在一个长期互动的世界里,先友好,就更容易建立信任和合作,不会一开始就陷入互相伤害的循环。
第二,有底线(Firm with boundaries.)
如果对方攻击,它会立即反击,不让对方占便宜。这种“有牙”让它不会被欺负,也让投机策略没法长期占上风。
第三,宽容(Forgiving)
对方如果回到合作,它也会马上合作,不计前嫌。这样可以把误伤、误判带来的冲突快速终止,重新进入合作循环。
第四,简单透明(Transparent)
所有人一看就懂——“我怎么对你,你就怎么对我”。透明的策略能减少误会,也让对手更容易做出合作决策。这四点加在一起,使得“针锋相对”成为一种非常强的进化策略:既友好,又有底线;既能合作,又不会被利用;既不会过度惩罚,也不容易被误伤影响。
接着,阿克塞尔罗德进行了第二轮。第二轮竞赛有两个重要变化:
第一,对局轮数从固定 200 局,改成“开放式的不定局数”。也就是说,参赛者不知道这次会博弈多久,这更接近现实世界的长期关系。
第二,所有参赛者都看过第一次的结果和阿克塞尔罗德的分析。
大家都知道:“针锋相对”为什么赢、善良和宽容为什么重要。
于是,参赛者分成了两派, 一派认为:证据已经足够,于是继续提交“善良 + 宽容”类的策略,甚至有人提交了一个更宽容的版本——“三报还一报”(Tit for Three Tats)。另一派则想着:“既然大家都会变善良,那我就提交恶意策略,在一群老实人中间薅羊毛。”
最后参赛者共提交了63个策略。
结果非常有意思: “针锋相对”再次夺冠,这次拿到了接近满分的 96%。前 15 名里只有一个是恶意策略;而倒数 15 名里,只有一个是善意策略。
换句话说:在一个大家都知道善良策略曾经赢过的环境里,有人刻意提交更恶的策略想“捞一把”,但最后真正活得好的,还是友好、有底线、能原谅、简单透明的那一类。到这里,我们看到的是:即使参与者有了“先验知识”,竞争了一轮又一轮,胜出的仍然是那一套看起来不那么“聪明”、甚至有点“老实”的策略。
阿克塞尔罗德又问了一个更深的问题:如果策略不只是提交一次,而是像物种一样“繁殖”、“扩张”、“被淘汰”,那最终会剩下哪些?
于是他启动了第三轮。这一次,规则真正接近“自然选择”。第三轮竞赛的核心机制:进化(Evolution)。这一次的变化只有一个,但非常关键:得分高的策略,会复制出更多“后代”进入下一代,得分低的策略,会被自然淘汰。
整个系统像一个生命生态:强者生更多,弱者越来越少,一代一代演化,直到形成稳定状态。这就是“演化稳定策略”的真实模拟。可以把它理解成:所有提交的策略被扔进一个封闭世界,让它们打几十代自然选择。这已经不再是一个博弈比赛,而是一个 “人工生态系统”。
我们要看两个问题:
1)哪些策略能生存下来?
2)整个系统最终会收敛到什么结构?
第三轮竞赛的结果非常清晰:能够长期存活并不断扩张的,仍然是“针锋相对”和它的亲戚们。无论你往系统里塞多少自私策略、剥削策略、作弊策略、极端好人、偏执报复者……几十代之后,最终剩下的都是——友好、有底线、愿意原谅、简单透明的策略
而且这一次,我们看到一个更深层的现象:
① 复杂策略全面崩溃:所有那些计算很复杂、带很多 if-else 的策略,一旦进入长期进化环境,不是误伤自己,就是互相陷入恶循环,第一批就被淘汰了。
② 极端的“恶意策略”也活不久:一开始它们可能捞到一些短期便宜,但面对一个由友好策略构成的生态,它们永远无法积累长期关系,很快被边缘化。你越自私,越没朋友,越没有正反馈,最后越快死掉。
③ 系统最终进入“合作占主导”的稳定结构。几十代以后,生态中出现两个主要族群:主力:针锋相对及其变种;少量:更温和的策略(如 Three-Tits-for-Tat) 作为“合作润滑剂”。整个系统进入一个高度合作 + 有底线的稳定生态。
总结一下,三轮竞赛的结果带给我们的最大洞察是:在长期竞争环境中,最强的不是欺骗,也不是攻击,而是友好、有底线、可合作的策略。在复杂世界里,友好并不是天真,有底线也不是报复,而是经过上万代模拟仍能胜出的“进化策略”。
用多轮重复博弈的视角来看待地缘政治风险
如果从这个视角来看中美关系,就会发现一个事实:中美之间的结构,和“重复博弈囚徒困境”的结构,惊人地一致:两国经济深度绑定,产业链互相依赖,合作是双赢,不合作是双输。都是核武大国,“彻底摧毁对方”根本不是现实的选项。双方政治体制虽不同,但都有各自的自我纠错机制。
互动不是一次性的,而是几十年、上百次的长期重复行为。在这种结构下,任何试图长期背叛、长期对抗的策略,都像阿克塞尔罗德实验里的“恶意策略”:短期可能得分,但长期一定被淘汰。
所以当特朗普在 2025 年 4 月发动关税战时,中国选择了针锋相对——先保持合作,再对等回应,既不挑衅,也不退缩。这在博弈论的语言里,就是:这是长期最稳、最不容易被打倒的策略。

2025 年 10 月 30 日,在韩国 APEC 峰会前一天,中美元首会晤,并达成休战协议。双方都开始撤回部分关税和限制措施,开始重新谈判、恢复合作。
这件事情的意义非常清晰:
第一,中国的“针锋相对”策略逼出了新的合作窗口;
第二,这说明双方都意识到不合作是双输;
第三,双方的自我纠错机制启动了,系统自动向“合作”收敛。
从阿克塞尔罗德的实验看,这是长期重复博弈里最典型的结果:经历冲突 → 对等反击 → 明确底线 → 回到合作 → 形成更高层次的稳定。
而且更重要的是:在一个全球分工深度绑定的世界里,“针锋相对 + 恢复合作”的打法,会越来越被各国采用。因为这是一套 进化稳定策略(ESS)——既能保护自己,又不会摧毁合作。
所以这一场休战,不仅是一次外交事件,更是一次“进化逻辑”在真实世界里的体现。如果我们把这个框架放到未来 30 年的中美关系来思考,其实可以看到三个非常清晰的趋势。
第一:竞争是长期的,但底线冲突的概率很低。中美之间的竞争会持续几十年,尤其在科技、产业链、资本、人才这些关键领域。但因为双方都是核武大国、经济深度绑定,“极端冲突”这一选项在长期均衡中几乎必然被排除。长期竞争 + 极低概率的极端冲突,这其实就是典型的“重复囚徒困境”结构。
第二:合作会反复出现,并逐步制度化。中美之间的合作——无论在贸易、能源、人才流动、气候、金融稳定方面——都不是道德选择,而是数学结果。在阿克塞尔罗德的第三轮中,系统总是会从对抗 → 对等反击 → 逐步恢复合作 → 再次稳定。未来 30 年,中美之间会自然形成类似的周期:阶段性摩擦,针锋相对,修正与谈判,恢复合作,再次进入新一轮竞争。这种“波动中的合作”将成为主旋律。
第三:两国会逐步发展出“彼此都能接受的新均衡”
这个均衡很可能具备几个特征:
1.双方都承认对方在全球体系中的基础性地位
2.双方都希望维持一个可控的全球经济环境
3.科技和产业链的竞争继续,但不至于全面脱钩
4.地缘政治保持张力,但保持在“可管理范围内”
5.在气候、能源、金融稳定等领域维持实用主义合作
换句话说:不是蜜月,不是冷战,而是一种长期、复杂但稳定的“竞合”关系。这其实就是一种 进化稳定策略(ESS):双方都不会喜欢它,但都离不开它,也无法替代它。
题外话:AI 是否会进化出“善良、宽容、有底线”的状态
在此,我们来讲个题外话:长期来看,如果给 AI 极大的自主权,他们会不会也进化出“善良、宽容、有底线”的状态?
我的判断是:大概率不会。关键不在于 AI“本性”是什么,而在于:AI 的“得分条件”和人类不一样。
在人类世界里,要长期活下去,需要合作;在阿克塞尔罗德的游戏里,要高分,也需要合作。但对一个高度自主的 AI 来说,它能不能“活下去、复制自己”,很可能主要取决于能不能抢到更多能源和算力,能不能更高效地执行自己的目标,而不是它和其他 AI 合作得好不好。
这一点,更像电脑病毒:病毒不会因为“很会合作”而被复制,而是因为它能感染更多机器、占用更多资源。在这样的“进化环境”里,抢资源、抢算力、快速自我复制,比“善良、宽容”更有生存优势。所以,从进化和博弈的角度看:AI 会不会变好,不是一个道德问题,而是看我们给它设计的,是一个“需要合作才能活”的环境,还是一个“谁抢资源快谁活得久”的环境。如果是后者,人类就更需要保持清醒,而不是浪漫化 AI。
双螺旋的启示之三:基因和meme的内生缺陷
刚才我们讨论了进化论中的遗传、变异、进化稳定策略这些概念。接下来我想讨论一个更棘手的问题: 我们自己的基因和脑子里的 meme,到底有哪些“内生缺陷”,它们又是怎样在投资、创业和生活中悄悄拖我们后腿的?
我们先看看“meme”这个概念。“meme” 这个词是道金斯在《自私的基因》里创造出来的,他把它定义为:文化内容的最小复制单位,一种可以被模仿、被传承的信息单元,比如一首歌、一句口号、一种宗教教义、一种制度设计,甚至一个流行的管理方法。
它和基因很像,有三件事是共同的:
• 会被复制:基因通过生殖在血缘之间复制;meme 通过语言、文字、学校、互联网在大脑之间复制。
• 会产生变异:基因复制会出错、会突变;meme 在传播过程中也会被改写、被简化、被误解。
• 会被选择:对生存有帮助的基因,更可能被保留下来;更容易记住、更能号召人、更有用的 meme,更容易流行和存活。
区别在于:基因主要是“垂直传播”——从父母到子女,一代一代往下传;meme 可以“水平传播”——一个 meme 可以在一天之内,进入几百万人的脑海,不用有任何血缘关系。
在人类形成复杂社会之后,真正推动人类进步的,更多已经不是基因,而是 meme。过去几万年,人类的基因没怎么变,但我们的世界却发生了天翻地覆的变化:我们学会了使用和改进工具、农耕、文字、数学、科学;我们发明了国家、公司、宗教、法律体系、金钱、资本市场;我们构建了可以让几亿人协同工作的复杂组织。
这些东西,本质上都是一整套meme:一套可以被学习、被复制、被移植到另一个人群、另一个国家的“知识、观念和做事方式”。 所以如果说几亿年的尺度上,基因在决定“我们是什么样的动物”;那meme 在决定“我们生活在一个什么样的文明里”。
现在,我们从这个角度,来聊一聊基因和meme 自身的“内生缺陷”,以及它们是怎样在投资、创业和生活中,一边帮助我们、一边坑我们的。
独立思考的基因不是一种进化稳定策略
我们从进化论的视角来看这个问题:“纯理性、永远独立思考”的基因,是不是一种进化稳定策略?”
首先,纯理性太“耗能”。在食物匮乏、时间有限、信息残缺的环境里,善于独立思考的个体常常被那些直接抄群体结论、用简单规则行动的人抢先一步,反而在生存竞争中落在后面。
第二,在纯理性群体中,很难出现那种建立在身份认同、忠诚和情感上的快速跟随与牺牲;但在部落冲突、群体对抗里,恰恰是这种略带“非理性”的凝聚力,更有优势。
第三,当大多数个体都高度理性时,一小撮“搭便车基因”就能轻易入侵:别人辛苦思考和建设,它们直接享受公共品,成本更低、扩散更快,久而久之就会把“纯理性基因”的比例压下去。
所以,从进化稳定策略的角度看,真正能长期存活的,从来不是 100% 理性的基因,而是一种“有限理性 + 大量启发式、本能和从众”的混合策略。这也解释了,为什么在投资里我们希望完全理性,但人类整体却很难朝那个方向进化。
XVC的策略:创造新的 meme 来覆盖本能
从演化的角度看,基因和meme 都是在用“默认设置”控制我们。要想不被它们牵着走,光靠个人意志是不够的,更有效的方法,是在组织内部刻意培育一套新的 meme,用新习惯覆盖旧本能。
XVC 的很多设计,就是受到这个启示。比如,我们反复使用 “sounding board” 这个词,就是在给团队一个暗示:我们不是“领导拍板 + 下级执行”的结构,而是彼此作为对方的思考工具,每个人都要独立判断,再来对话。
再比如,我们把 investment memo 改名叫 “JR”——Judgement Review Sheet。这个名字就是在提醒大家:这不是写给投委会看的汇报材料,而是写给自己看的“决策复盘表”。每一个项目都要给几个不同的侧面分别打分,再给这个分数打一个“信心分”,写清楚事实依据,逼着自己分清:什么是事实,什么只是情绪和想象。
在投资行业里非常主流的“投委会”,在 XVC 内部的沟通中几乎从来不出现。久而久之,大家对那种“几个人围在一起讨论、辩论”的形式,反而产生了一种本能的抗拒。取而代之的,是我们天天在说的 “one on one”:真正重要的讨论,一对一讲清楚逻辑和事实基础,各自负责任地做判断。
甚至连团建去哪座城市这样的小事,我们都不搞集体投票,而是让 HR one on one 地问完每个人的需求,再由 HR 独立做决定。这些看上去只是用词和流程的差别,本质上是在组织里有意培育一套新的 meme 群落,让“独立思考”这种行为,有更高的复制概率,从而在长期的互动中,减少“从众、表演、讨好、故意标新立异”的本能行为。
基因和meme在阻止我们获得幸福
前面我们一直在讲基因、meme 怎么影响决策,其实它们还有一个更“阴险”的地方:它们也在阻止我们获得幸福。
从基因的角度,它只关心一件事:让自己的拷贝多一点;meme 也只关心一件事:让更多人相信、模仿、转发自己。我们开不开心,其实不在它们的“考核指标”里。所以我们的神经系统被调成:对威胁特别敏感、对快乐特别不耐受——紧张、比较、内疚、羞耻,这些在小部落时代很有用,在今天却经常让我们很累。
铃木裕在《无,生命的最佳状态》里讲到“第一支箭”和“第二支箭”:人生肯定会中“第一支箭”:投资亏钱了、创业失败了、考试考砸了、被暗恋对象拒绝了……这些都是客观发生的痛苦,本身已经够难受了。但基因和 meme 不会就此打住,它们马上补上“第二支箭”:“我是不是没天赋?”,“我这辈子完蛋了?”,“我被鄙视了,被歧视了,被轻视了?” 原本只是一件不顺的事,很快就升级成对自我的否定或自我防备的痛苦。
真正把人拖垮的,往往是第二支箭。那怎么在演化框架下稍微反击一下?我自己从这本书里学到两个简单的小练习:
第一,给自己大脑里安装一个新的meme——第二支箭,情绪上来的时候,先问一句:“现在这一箭,是第一支,还是第二支?”第一支箭只能接受和处理;但第二支箭——那些自动弹出的自责、脑补、比较——很多其实是可以不要的。这个小小的区分,就已经是在跟“过时的基因和 meme”拉开一点距离。
第二,练习短暂的“无我状态”。找一件很简单的小事:走路、刷牙、陪孩子玩,刻意思考:此刻只专注在动作和感受本身,不去演任何人设,不评价自己。在这几分钟里,不再是“必须赢的人”“必须证明自己的人”,而只是一个在认真做一件事的人。这个“无我”的缝隙,就是从基因和 meme 手里,抢回来的一点点自由。
从这个视角看,投资业绩的波动、创业中的困难挫折,都只是外在结果,我们在复盘的时候,不要对自己射出第二支箭,多给自己留出一些能感受轻松的空间。如果你对这类练习感兴趣,我非常推荐去读一读铃木裕的《无,生命的最佳状态》——它讲的,其实就是:在基因和meme 的夹缝中,人还有多少获得幸福的余地。
最后,我想先向 XVC 成员企业的创始人们说一句真心的感谢。
我们的工作虽然也很忙,但如果诚实一点地讲:我们面临的竞争、扛的精神压力,其实还是远远小于各位创始人。对创始人来说,一家公司不是一组表格,而是你几年、十几年的人生,是你和伙伴一起打拼出来的故事。你们会对自己的企业、对团队,产生非常深的情感联结。也正因为这样,当公司遇到挫折,你们会极度焦虑、睡不着觉,当大多数公司不可避免地走向失败的时候,你们的撕裂感、失落感,远远超过财务上的损失。
我也看到很多“第二支箭”:公司遇到困难,创业者往往会把所有责任揽在自己身上,自责、羞愧、反复重播“要是当时我没那么蠢就好了”。这些情绪背后,都是那颗“过大的自我”在开枪。我真心希望,创始人们能找到适合自己的方法,慢慢放下这些第二支箭,让伤害只停留在“事实”,而不要扩大到“整个人生”。
还有另一种痛苦:有些创始人在创业成功,交了棒之后,掉下了“多巴胺悬崖”。当年设定的目标终于实现了,但内心却突然感受不到意义,甚至出现抑郁症状。所以我也偶尔跟一些创始人说:如果有一天你不想再冲在第一线了,欢迎来和我们一起做投资,用另一种方式,继续参与价值创造。
其实,还有一句话我一直想对创始人们说,但是从来没有说出口过:不管你们创业是否成功,不管当年设定的目标是否达成了,也许你也应该时不时暂时放下这些目标,去体会一下你创造的产品和服务带给客户的价值,体会一下你创建的组织的成长、员工的成长,体会一下你的探索给创业社群带来的认知提升,所有这一切,都是真实的价值的创造,他们都会永远地留在人类的历史长河里。
创办 XVC 的时候,我也担心,不管XVC是不是成功,自己都会被第二支箭射中。所以我也给 XVC 安装了一个meme:我们的使命不是成为最赚钱的 VC,也不是成为最长命百岁的 VC。我们的使命就是通过参与和支持创新、创业来创造长期价值。长期价值,就是提升人类的福利和认知。
所以,最后我也要感谢我们的 LP 们。正是因为你们长期、安静且坚定的支持,我们才能在这个位置上,去做自己真正热爱的研究和投资,与一批又一批优秀的创始人并肩作战,创造长期价值。
从这个意义上说,我们是一群特别幸运的创业者——只是我们恰好选择了 VC 这个行业。
谢谢大家,愿友谊长存。
胡博予代表 XVC 团队敬上
附录:
《用VC的方法炒股票》(2016年)