不朽的双螺旋

致投资人的信2025

各位XVC的投资人：

从我们第一只人民币基金的首次关闭至今已经九年了，从我们第一只美元基金的首次关闭至今已经八年了。截至2025年9月30日，XVC的总投资成本为44.86 亿人民币，账面价值为113.35亿人民币，所有基金的平均毛内部收益率为26.05%。

2025 年发生了很多会让我们记住的事情，比如，1 月 20 日 DeepSeek R1 的发布，被全球科技行业和金融同行称为“Deepseek Moment”。又比如，4 月 2 日，特朗普宣布震惊世界的“对等关税”，引发全球资本市场的一场大地震。

另外，在4 月 17 日，特朗普宣布“对等关税”两周后，霸王茶姬在纳斯达克低调地上市。这是 XVC 自成立以来收获的第一个IPO。

XVC的投资组合在 2025 年的表现

在这样一个充满挑战的年份，XVC 的投资组合，又交出了一份高分答卷（见下图）。

第一，我们的 “3 亿美元以上俱乐部” 又扩容了，年化毛收入超过 3 亿美元的公司，从去年的 5 家增加到今天的 8 家；超过 1 亿美元毛收入的企业，现在一共有 14 家。

第二，“深绿色加号俱乐部”也在不断增加新成员。在这些毛收入超过 1 亿美元的公司里，绝大多数已经实现了正向现金流，或者在公司整体层面上已经稳定盈利。也就是说，他们没有靠讲故事、烧钱增长，而是用自己的造血能力，实现高质量的增长，穿越更长的周期。

第三，XVC 投资组合的合计收入和利润，双双再创新高。核心项目的合计收入预计比去年增长 25%，从 500 多亿人民币涨到接近 700 亿，盈利项目的合计利润预计比去年增长 32%，从28.5 亿人民币涨到约37.7亿人民币。

也许有人会质疑，这个数据其实是可以掺水的。例如只要花一点钱，买一点字节跳动的股份，数据就上去了。为了回应这个质疑，我们计算了按照收入规模加权计算的XVC平均持股比例和按照利润规模加权计算的XVC平均持股比例，这两个数字分别是13.81%和15.74%，如此来看，绝大多数的核心项目，XVC至少领投过一个早期轮次。

或许有人还会想，现状还不错，但未来是不是会掉头向下？

短期我不知道，长期来看还是很有信心的。首先，驱动这些收入和利润增长的底层因子，是巨大而真实的，会在未来很长的时间里持续发挥作用。除了头部的大企业，组合中还有不少规模尚小的企业有巨大的潜力，假以时日，他们有机会成长为百亿、千亿营收规模的大公司。

“不朽的双螺旋”

今年9月底，有一个大部分人没注意的事情：XVC 的成员企业“伊对”，低调地发了一个招股书。

从招股书披露的信息可以看到，他的收入、利润，都在快速增长，而且规模也不小了。2025 年上半年实现了约20 亿人民币收入和 3 亿利润。

从进化论的角度看，这家在线情感社交平台公司所做的事，就是把“争夺异性注意力”的本能，转化成一个可规模化复制的商业机制。

如果我们往更深层想——为什么人类会这样被驱动？为什么这种心理机制几乎跨越文化、种族、时代都一样？

理查德·道金斯在《自私的基因》这本书里，给出了一个震撼的解释：我们——包括人类在内的一切生命——其实都是基因的“生存机器”。我们看似在追求爱情、财富、意义，但在更底层，都是在帮那条DNA双螺旋完成复制。

个体会消失，物种也会灭绝，但基因以复制的方式，一代又一代延续下去。这就是道金斯所说的“不朽的双螺旋”。

对我个人来说，这本书和《思考，快与慢》一样，深刻影响了我的世界观——让我开始从“演化”的角度去理解人、理解社会、理解商业。

如果从进化的角度看，人类的基因在过去几千年几乎没有发生变化，而在可见的未来，也不会有太大变化。所以，当我们投资一家公司时，很多时候他解决的并不是一个“新需求”，而是把人类古老的需求用新的方式满足。

比如——霸王茶姬。看上去是新茶饮、是流行、是品牌、是供应链创新。但从本质上讲，他满足的是人类对茶与奶的双重喜好。人类喝茶、喝奶的历史都超过了两千年，只是今天，这两种古老的愉悦，被更精致、更具仪式感地结合起来。

再比如——核桃编程。他让孩子通过游戏化、AI老师辅助的方式自学编程，教学效果极好，因为这符合人类天生的学习模式：探索、试错、获得反馈、再尝试。这是猎人时代就被写进我们基因的学习方式，只是我们在教育体系里一度忘记了。

所以，当我们看似在“创新”，其实是顺着人性的河流在行走。真正长久的创新，往往不是创造新需求，而是回到人类最深层、最古老的需求。

刚才是从时间的维度上观察，我们再从看空间来看，不同人种之间的基因差异其实非常小。无论肤色、语言、文化再怎么不同，我们共享 99.9% 以上的基因。所以，人类的共同点远远多于差异。这也解释了，为什么很多伟大的产品、伟大的品牌，能够跨越文化，被全世界接受。

在XVC的投资组合中，有三分之二的企业面向全球市场。

比如——Weee！。2019 年我们领投他的B 轮融资时，公司主要服务湾区华人群体。但过去几年，已经稳步扩张至全美——并跨越日裔、韩裔、越南裔等多个族裔，今年甚至拓展至多个拉丁裔群体。令人惊讶的是：在所有这些不同族裔中，留存曲线几乎如出一辙——平滑、稳定且强劲。

徕芬（Laifen）也是一样。他的吹风机、剃须刀卖到全世界，因为每个人都追求同样的东西：高效、美感、舒适感。

即使是伊对这样一个起源于中国的社交app公司，仍然正在不同文化的土壤里，正以稍微不一样的产品形态生根发芽。因为在基因层面，人类的社交、连接与被认可的需求，是共通的。

所以，当我们看到“横跨五大洲”的扩张时，本质上看到的不是市场的复制，而是人性的共鸣。即使科技在不断创造新的产品和服务，人类的基因几千年来几乎没有变，但人性的底层需求很稳定。可是如果让一个新的产品和服务真正触达亿万用户、长时间地服务他们，还需要创业者构建出一个能规模化运行的商业模式，以及一个与之适应、能自我进化的高效能组织。

复盘XVC的核心策略

在生物世界，进化靠基因的复制；在商业世界，进化靠模型和组织的复制。他们都遵循同一个原理：谁能更稳定、更高效地自我复制，谁就能在最广的空间、最长的时间中胜出。

这就是 XVC 的核心策略：我们极致地专注于寻找那些能进行大规模、长时间自我复制的商业模式，以及与之适应的优秀组织。

我们相信，真正伟大的公司，不靠短期风口，而靠他们自己的“双螺旋”在自我复制和进化。

那么，什么样的商业模式和组织，才能够大规模、长时间自我复制呢？从我们的复盘来看，伟大的公司通常具备三个特征。

第一，他们抓住了一个长期结构性变化驱动的巨大、真实、新的 PMF。

PMF，也就是 Product-Market Fit，简单说，就是产品与世界的“兼容性”。人类的基因在几千年里几乎没变，但技术的演进让社会结构不断重塑。当新的技术条件出现，人类旧有的需求会以全新的形式被满足，而能捕捉到这种结构性机会的创业者，就能定义一个时代的产品。

第二，他们有一个善于做正确决策、建设高效能组织的创始人。

第三，他们拥有长的自增强学习曲线，并且反规模重力有限——

规模越大，优势越强。这往往体现为：

• 自增强的品牌

• 自增强的数据

• 有强规模经济的产品或服务

• 以及有网络效应的平台

这三点构成了 XVC 的投资逻辑。我们寻找的，不是短期风口上的企业，而是那些能与未来的世界更兼容、能在时间里自我进化、最终被“自然选择”留下来的公司。

接下来，我想分三个不同的视角来聊一下，在XVC 的实践中，进化论的思想是如何影响了XVC 的投资决策、组织文化以及如何影响我们看待大环境的变化。

双螺旋的启示之一：遗传 vs. 变异

第一个视角，是“遗传和变异” 。

先跟大家分享一下道金斯在《盲眼的钟表匠》这本书里讲到的他自己做的一个计算机实验。这个实验非常简单，但它形象地解释了“基因空间”的概念。

他在电脑里定义了一个小生物的“基因组”—— 9 个参数，每个参数可以取 −9 到 +9 的值。这 9 个数字，决定了屏幕上一个线条小生物的形状。

可以把它理解成：一个在“基因空间”里占据某个位置的小虫子，改一个基因，它的形状就会变。然后他模拟“演化”：从一个初始的小虫子开始，每一代让电脑生成8个“子代”，每个子代只改变一个基因——也就是小幅变异。

然后，他用肉眼选择其中一个存活，丢弃其他的。然后不断重复，最后得到一些形状有独特意义的“存活者”。

整个实验就是：随机地微调基因 → 让形状慢慢改变 → 观察能不能产生复杂结构，进行选择，然后重复。

这个实验真正有意思的地方，不在于“形状会改变”，而在于不同的“变异方式”会导致完全不同的结果。

当道金斯让电脑进行大幅度随机变异，也就是一次改变很多基因时，结果非常一致：形状立刻变成一团噪音，完全没有意义，而且无法继续演化——相当于“死亡”。

为什么？因为基因空间太大了。9 个基因、每个基因有19个可能的值（从–9到9）因此⼀次跳跃的可能目标有19的9次方个，总共有 3227 亿种可能组合。从数学上看，“能生存的基因组合”只是基因空间里的极小一部分。走得越远、跳得越快，越容易掉进十倍、百倍、千倍规模的“死亡区域”。

随机跳跃几乎必然落在一个“不能生存的区域”。但如果每次只允许小幅变异，也就是每次只改一个基因：电脑竟然能产生各种“像真实生物一样”的结构：树枝一样的、昆虫一样的、虾一样的、叶子一样的……这些形态不是“设计”出来的，而是在一个巨大空间里，通过逐步搜索“找到”的。

所以道金斯发现：长跳是死路，短跳才有机会找到生命。

道金斯用这个实验说明了一个关键原则：生命的进化不能靠大幅跃迁，只能靠无数次微小调整。他把这个叫做 “渐变假定（gradualism）”：跳远几乎必死，小步走才可能持续改进，复杂结构不是被“发明”，而是在巨大基因空间里“搜索”出来的。

这也给我们一个很重要的启示：无论是生命、组织还是商业模式，要让系统长期进化，最重要的是：持续的小步迭代，而不是跳跃式的冒险。

XVC 是如何刻意避免“长距离跳跃”

接下来，我想举几个对应的例子，说明在投资实践中，XVC 是如何刻意避免这种“长距离跳跃式”的决策方式的。

第一种“长距离跳跃”的做法，是跟随、追逐宏大概念——例如“低空经济”、“具身智能”、“元宇宙”等。市场上经常会在这些叙事刚出现时集中下注，认为只要概念够宏大，最后总能长出大公司。但在XVC，我们坚持的是另一套方法：重视PMF，用事实驱动研究。我们会关注新技术、新趋势，但不会仅凭叙事下注，而是用数据、留存、复购、单位经济模型来验证需求是否真实存在。

第二种“长距离跳跃”，是在不熟悉的行业进行‘布局式投资’。这种做法往往意味着快速扩张到多个赛道，希望用“铺开网”来提高命中率。XVC 的做法刚好相反：我们会做轻度、广泛的行业研究，但谨慎、缓慢地拓展能力圈。我们宁愿缺席一个看上去热闹的风口，也不会贸然跨入一个我们缺乏理解的领域。

第三种“长距离跳跃”，是投资依靠新流量红利、政策红利、新奇感红利、潮流红利驱动的高速增长。这类增长往往来得快、去得也快。XVC 的路径是：通过跨行业、跨区域、跨长时间的研究来理解商业底层规律，寻找“能长时间自我复制”的基因。我们特别关注那些即使失去红利，仍能保持强用户粘性和正向学习曲线的公司。

第四种“长距离跳跃”，是根据资历、名望来判断候选人或创始人。这是一种典型的表象判断，类似于在基因空间里用很粗糙的指标来选择“能否生存”。XVC 的方法是：以“行为法”为主判断创始人，关注他在真实情境中如何观察事实、做出关键决策、组织资源，而不是他的头衔、背景或叙事。

还有一种常见的“长距离跳跃”，是盲目进行管理创新、制度创新，比如有创始人会异想天开地给所有部门都计算利润指标，再用利润考核所有团队。XVC 的做法则是：先学习成熟企业的组织方法与制度，再因地制宜调整。例如，我们常用的“结构化行为面试法”（有的人称为 STAR 面试法）就是从一批组织能力强的大企业学习而来，而不是凭空发明。

总结一下：这些例子背后共同的原则是——在商业进化中，“遗传”往往比“变异”更重要；沿着可生存路径的小步走，比跳向未知远方更可靠。这也是 XVC 在投资研究、决策与投后服务中始终坚持的一条底层规律。

“事”和“人”，以哪个为主？

顺便聊一个早期投资常面对的灵魂拷问：做投资是应该以“事”为主，还是以“人”为主？

我的答案是：看得明白人的时候，以人为主；看不明白人的时候，以事为主。如果人和事都看得明白——那一定是以人为主。

你可能觉得我自相矛盾：既然你不喜欢“长距离跳跃”，为什么又要以人为主？

这是因为，XVC 的投资周期非常长。首先，在漫长的时间里，企业要经历无数困难、转折、甚至重生，企业是否能渡过这些重要关卡，创始人的决定往往起到决定性作用。一个善于学习善于决策的创始人，会非常主动地向历史学习、向同行学习、不断探索试错再向自己的错误学习，会主动避免“在基因空间长距离跳跃”。

另外，一个组织的“基因”，就是创始人定义的：核心团队、核心产品和战略、组织文化、组织流程。这些“基因”，最终决定了组织是否能高质量地自我复制、进化。

XVC的成员企业，拥有“抗风险”基因

说到这里，我想讲一下“抗风险”基因。

说到风险，我们还是得先给它做个定义。传统的资产管理理论用“波动率”来衡量一个投资组合的风险是有缺陷的。我建议大家换一个角度思考一个问题：碰上真正的“大风大浪”，什么投资组合最能“生存”？从这个角度看，我觉得XVC 的投资组合，是更安全的，比持有一个美国的中型商业银行的股票更安全，比百亿规模的私募信贷基金更安全，比有资产抵押的房产信托计划更安全。

过去几年的恶劣环境，让XVC 的投资组合经历了一场严酷的生存测试。新冠疫情、融资环境的急剧收紧、整体经济的波动、贸易战…… XVC 的成员企业不仅大部分活下来了，而且保持着强劲增长、盈利和现金流。这背后体现的是一种极强的韧性。

我认为，这不是运气，而是“基因”的问题。这些企业之所以能抵御大风大浪，有三个原因。

第一：创始人的自适应能力极强——我们挑选的是“行为基因”

XVC 选择创始人，不看学历，不看名气，不看大厂光环，也不看他的江湖地位和学术成就。我们看的是：他是否善于做正确的决定，是否能够建设高效能组织。

这些能力是通过行为体现出来的，而不是简历上的标签。正是因为这种自适应能力，他们能在每一次环境变化里迅速调整方向、修正策略、重新组织资源。他们的“行为基因”决定了他们的抗风险能力。

第二：这些企业代表的“新 PMF”，和宏观环境几乎无关

长时间来看，新的PMF替代旧的PMF，是一个确定性极强的趋势。一个简单的判断方式就是看——留存曲线是不是平的。

举几个例子：徕芬的吹风机。一旦习惯高速吹风机，你就很难回到传统低速吹风机。中国消费者已经意识到这个差异，而海外的消费者才刚刚开始觉醒。所以徕芬的全球增长才刚刚开始。

Weee!：美国已经有四分之一的华人家庭在长期使用 Weee!。华人群体的渗透增长变慢了，但日本裔、越南裔、菲律宾裔、印度裔—— 都在以成倍的速度增长，留存曲线同样“平得像湖面”。今年他们上线的拉丁裔 App “Masgusto”，规模还小，但因为留存曲线是平的，所以未来几年， Weee!的拉丁裔用户必然会远远超过亚裔，因为美国的拉丁裔人数本来就比亚裔多几倍。

这些增长的驱动因素，不仅和宏观环境几乎无关，它们之间也相互独立，几乎没有相关性——这是极其健康的增长动力结构。

第三：他们的护城河越来越深，规模越大优势越强

我们投资的很多企业，都已经开始构建深深的护城河，并且随着规模增长，竞争优势进一步加强。这样的企业在环境不好的时候，会获得更高市场份额，因为弱者会被淘汰或被迫收缩；而在环境好的时候，他们又能赚得更多。这就是典型的“结构性赢家基因”。

所以说，XVC 的成员企业之所以能在过去几年顶住风浪，不是运气好，而是他们本身就拥有“能在环境变化中生存、适应、扩张”的基因。所以，XVC的投资人们，我想和你们说，即使再来一次金融危机，再来一次贸易大战，咱们也不需要睡不着觉，我们可以相信这些优秀企业的强大的生存能力和自我修复能力。

双螺旋的启示之二：进化稳定策略

接下来，我想用进化论的另一个概念——进化稳定策略——来观察这个世界，并做一些预测。

进化稳定策略，简称 ESS，它回答的是一个非常朴素的问题：在自然界里，为什么有些行为会长期保留下来，而有些行为会被淘汰？

ESS 的意思其实就一句话：如果一种策略在群体中被绝大多数成员采用，且没有任何其他“入侵策略”能够在自然选择压力下成功入侵并取代它，这种策略就称为进化稳定策略。

可以把它想象成一个“占住坑位”的打法：如果大家都用策略 S，外来策略 M 想进来，M必须在跟 S 的对抗中比 S 和 S 之间对抗表现更好才行。否则，就会被自然选择淘汰。当大部分族群都采用了 S 之后，它就成为了稳定的策略。

几乎在所有的异性社交app上，男性用户都远多于女性用户，这是因为包括人类在内的各物种里，雄性往往更倾向于 R 策略——多竞争、多展示、多尝试，用数量来提高成功率，而雌性偏向 K 策略——更谨慎、更挑选、更投入，更关注质量和长期收益。

这两套行为模式不是文化造成的，因为这两种策略的组合，在不同物种的进化中，都成为了进化稳定策略。当大部分雄性采用了 K 策略，大部分雌性采用了 R 策略的时候，对于雄性动物而言，所有不用 K 策略的会被淘汰，而对于雌性而言，不用 R 策略的，会被淘汰。换句话说：R 策略和 K 策略的组合，是一套进化稳定策略（ESS）。

中国的独特人才优势来自一个R+K的策略组合

放到今天的中国，会看到一个很有意思的组合：国家层面更像 R 策略，家庭层面更像 K 策略。

在国家层面，中国过去几十年走的是典型的“数量优先”路径，尤其是在高等教育上。官方预计，2025 年中国高校毕业生将达到约 1222 万人，这是一个什么概念？大致是美国一年高校毕业生数量的三倍多，是德国的二十倍多。这样的体量，本身就是一种极其典型的 R 策略：先把总体人才基数做大，让“数量”本身变成国家级优势。

但在家庭层面，中国父母又是高度 K 策略：在一个、两个孩子身上投入巨量时间、金钱和情感，极度重视教育质量和长期培养。放眼全球，这种“极度重视子女教育”的文化，只有极少数国家才有，比如日本和韩国。

对 XVC 来说，这种“国家 R＋家庭 K”的组合，正是我们投资中国创业者的底层土壤。我们所投公司的三分之二是面向全球市场的，创始人几乎都是在中国接受基础教育的中国人，他们请来的高管，大部分也是中国培养出来的人才，他们的研发团队，主体也都在中国。背靠这样一个庞大且高质量的人才池，再叠加中国完整而高效的软硬件供应链，在全球的竞技场上，这一代中国创业者天然就拥有结构性的比较优势——而我们很幸运，可以作为他们的长期合伙人，参与到这一轮“R+K 叠加”的历史实验里。

开放的市场经济，是一个进化稳定策略

对于国家来说，开放的市场经济，是一个进化稳定策略。

当大部分国家选择了这个路线，就会形成一个有统一贸易规则的全球统一大市场。

这时候，选择开放的市场经济就意味着你有能力加入全球分工合作，从而极大提高生产效率和人民生活质量。这套体系会让国家不断获得技术、资本、人才和竞争带来的反馈，持续变得更强，所以很难被替代。

而封闭的计划经济缺乏这种外部反馈和全球分工带来的效率提升，因此无法长期稳定存在。回看过去 40 多年，中国的经济奇迹，本质上就是这一套“开放—竞争—分工”机制持续发挥作用的结果。

所以，我们可以看到，党的十五五规划，虽然强调了“坚持统筹发展和安全”，但是同时也继续强调要“推进深层次改革，扩大高水平开放”，继续强调“充分发挥市场在资源配置中的决定性作用”。

反过来，以今天中国的经济体量，制造业的规模和效率，ESS 会惩罚试图和中国脱钩断链的国家，然后会回到 ESS均衡策略。在这个大前提之下，我们就只需要专心地去发掘优秀的、有“长期阿尔法”基因的企业。人类的财富创造，他们才是决定性力量。

“长期阿尔法”策略和 Endowment Approach是否进化稳定策略？

如果我们把 VC 行业也看成一个“进化生态”，会发现这里面的大多数玩家，并不是像XVC 这样把“长期阿尔法”作为核心策略的。更多的是两类策略：一类是垂直行业基金：他们有一部分是靠追逐“热点行业”，有一部分会长期深耕一些垂直行业。另一类是跟随国家战略、追逐市场 beta 的大型基金：重点是“站在对的方向上，把钱分配到指定的赛道里”。

这些策略有一个共同点：叙事简单、容易获得 LP 的理解，能够提供“和大趋势匹配”的安全感。从进化的角度看，它们更接近一种“行业主流策略”。

XVC 的策略跟这个主流非常不一样——我们坚持 独立思考、重度研究、少而精的“狙击式投资”，追求的是和市场 beta 尽量解绑的长期阿尔法。

在 LP 这一端，也有一部分机构采取类似的思路，比如一些大学捐赠基金和部分老牌家办采用的 endowment approach：极长的持有周期、高比例配置以股权为主的非流动资产、强调少数优秀管理人抓住长期阿尔法能力，而不赌短周期的趋势。

问题来了：XVC的长期阿尔法策略，和部分LP的endowment approach，到底是不是一种“进化稳定策略”？

如果从 ESS 的角度来看，要成为一个进化稳定策略，有两个条件：1）大多数参与者都采用它时，它还能活得很好；2）其他策略很难大规模跑过它、把它淘汰掉。而我们会发现：长期阿尔法 + endowment approach，很难成为整个行业的大多数。

首先从逻辑上，alpha 的定义本身就要求“别人不是这样干的”。长期阿尔法策略要成功，前提就是：大多数人在追 beta、追风口、追短期。如果有一天，全行业都真的只关注长期阿尔法、都真的做深度研究、都追求逆向、都长周期，那真正可被利用的“系统性错定价”会急剧变少，alpha 就没有了。

那这个事情为什么没发生呢？因为这么做实在太反人性了（参考 2016 年年度信的最后一节），而且大部分LP的行为并不鼓励这样。

大部分资金的约束是：业绩周期短，需要“可解释可预测”，需要“安全感”。真正愿意接受 10 年以上长周期、高不确定、高波动的投资的 LP 在整个投资行业群体里永远是少数。

你可能要问为什么，难道endowment approach 不就很长期吗？大家都抄作业不行吗？是的，但是endowment approach 要求极高的“组织基因”。大学捐赠基金这类 LP 能长期坚持 endowment 模型，是因为他们有一整套支撑这种风格的“组织基因”：极长的资金久期，相对稳定的治理结构，能承受短期波动、坚持长期目标的文化。

这些特点，是绝大多数机构投资人没有的。所以它很成功，但很难普及，自然也很难成为整个金融体系的 ESS。

而 XVC 的 长期阿尔法 + endowment 型LP组合，更像是一种少数位点策略：在特定环境下非常强，但永远不会变成整个行业的主流。从进化的角度讲，它不是“全民 ESS”，而是一个在复杂生态里长期存在、但只能由少数玩家采用的高难度策略。

而我们的任务，就是把这条小众、困难但高质量的路径，走得尽可能长、尽可能好，在一个充满beta噪音的世界里，持续证明alpha的存在。

阿克塞尔罗德的博弈策略编程竞赛

接下来，我想请大家跟我一起做一个小小的“思想实验”。

上世纪 70 年代，有个政治学家阿克塞尔罗德，办了一场很特别的比赛：他邀请各路高手，用代码来写一套“在囚徒困境里出牌的策略”，然后让这些策略在电脑里两两对打、打一百多轮，算总分，看谁在长期博弈中活得最好。

这个竞赛问的，其实就是一个我们今天也非常关心的问题：在一个陌生而复杂的世界里，什么样的行为风格，最有机会成为“进化稳定策略”？

阿克塞尔罗德一共办了三轮比赛，规则一点点调整，环境越来越接近“真实世界”。接下来，我会用非常简单的方式，跟大家说说这三轮比赛发生了什么，最后得出的结论，其实对国家、公司、投资机构，甚至我们每一个人，都有很强的启发。

第一轮比赛的规则很简单：给定一套标准的囚徒困境收益表；参赛者提交各自的“出牌程序”；每两个策略配成一组，连续博弈 200 回合；合作比对抗长期更划算，但短期背叛可以多拿一点分。

一开始，大家的想法五花八门：有的特别算计人、专门等对方先合作再下黑手；有的天真到几乎从不反击；也有纯粹“随机瞎出”的。也有一些比较阴险的，例如“愧疚探测器”、“老实人探测器”。

结果非常出乎意料：最后赢得最高总分的，并不是最聪明、最阴险的那些策略，而是一套非常朴素的策略，叫 “Tit for Tat，针锋相对”：第一回合先合作；以后每一回合，完全复制对方上一次的选择。

听上去太简单了，但它击败了所有阴险、复杂、计算精密的策略。

为什么？阿克塞尔罗德总结出了四个关键特性，这四点加在一起，让它在长期演化中非常强。

第一，友好（Nice）

它从不主动背叛。在一个长期互动的世界里，先友好，就更容易建立信任和合作，不会一开始就陷入互相伤害的循环。

第二，有底线（Firm with boundaries.）

如果对方攻击，它会立即反击，不让对方占便宜。这种“有牙”让它不会被欺负，也让投机策略没法长期占上风。

第三，宽容（Forgiving）

对方如果回到合作，它也会马上合作，不计前嫌。这样可以把误伤、误判带来的冲突快速终止，重新进入合作循环。

第四，简单透明（Transparent）

所有人一看就懂——“我怎么对你，你就怎么对我”。透明的策略能减少误会，也让对手更容易做出合作决策。这四点加在一起，使得“针锋相对”成为一种非常强的进化策略：既友好，又有底线；既能合作，又不会被利用；既不会过度惩罚，也不容易被误伤影响。

接着，阿克塞尔罗德进行了第二轮。第二轮竞赛有两个重要变化：

第一，对局轮数从固定 200 局，改成“开放式的不定局数”。也就是说，参赛者不知道这次会博弈多久，这更接近现实世界的长期关系。

第二，所有参赛者都看过第一次的结果和阿克塞尔罗德的分析。

大家都知道：“针锋相对”为什么赢、善良和宽容为什么重要。

于是，参赛者分成了两派，一派认为：证据已经足够，于是继续提交“善良 + 宽容”类的策略，甚至有人提交了一个更宽容的版本——“三报还一报”（Tit for Three Tats）。另一派则想着：“既然大家都会变善良，那我就提交恶意策略，在一群老实人中间薅羊毛。”

最后参赛者共提交了63个策略。

结果非常有意思： “针锋相对”再次夺冠，这次拿到了接近满分的 96%。前 15 名里只有一个是恶意策略；而倒数 15 名里，只有一个是善意策略。

换句话说：在一个大家都知道善良策略曾经赢过的环境里，有人刻意提交更恶的策略想“捞一把”，但最后真正活得好的，还是友好、有底线、能原谅、简单透明的那一类。到这里，我们看到的是：即使参与者有了“先验知识”，竞争了一轮又一轮，胜出的仍然是那一套看起来不那么“聪明”、甚至有点“老实”的策略。

阿克塞尔罗德又问了一个更深的问题：如果策略不只是提交一次，而是像物种一样“繁殖”、“扩张”、“被淘汰”，那最终会剩下哪些？

于是他启动了第三轮。这一次，规则真正接近“自然选择”。第三轮竞赛的核心机制：进化（Evolution）。这一次的变化只有一个，但非常关键：得分高的策略，会复制出更多“后代”进入下一代，得分低的策略，会被自然淘汰。

整个系统像一个生命生态：强者生更多，弱者越来越少，一代一代演化，直到形成稳定状态。这就是“演化稳定策略”的真实模拟。可以把它理解成：所有提交的策略被扔进一个封闭世界，让它们打几十代自然选择。这已经不再是一个博弈比赛，而是一个 “人工生态系统”。

我们要看两个问题：

1）哪些策略能生存下来？

2）整个系统最终会收敛到什么结构？

第三轮竞赛的结果非常清晰：能够长期存活并不断扩张的，仍然是“针锋相对”和它的亲戚们。无论你往系统里塞多少自私策略、剥削策略、作弊策略、极端好人、偏执报复者……几十代之后，最终剩下的都是——友好、有底线、愿意原谅、简单透明的策略

而且这一次，我们看到一个更深层的现象：

① 复杂策略全面崩溃：所有那些计算很复杂、带很多 if-else 的策略，一旦进入长期进化环境，不是误伤自己，就是互相陷入恶循环，第一批就被淘汰了。

② 极端的“恶意策略”也活不久：一开始它们可能捞到一些短期便宜，但面对一个由友好策略构成的生态，它们永远无法积累长期关系，很快被边缘化。你越自私，越没朋友，越没有正反馈，最后越快死掉。

③ 系统最终进入“合作占主导”的稳定结构。几十代以后，生态中出现两个主要族群：主力：针锋相对及其变种；少量：更温和的策略（如 Three-Tits-for-Tat） 作为“合作润滑剂”。整个系统进入一个高度合作 + 有底线的稳定生态。

总结一下，三轮竞赛的结果带给我们的最大洞察是：在长期竞争环境中，最强的不是欺骗，也不是攻击，而是友好、有底线、可合作的策略。在复杂世界里，友好并不是天真，有底线也不是报复，而是经过上万代模拟仍能胜出的“进化策略”。

用多轮重复博弈的视角来看待地缘政治风险

如果从这个视角来看中美关系，就会发现一个事实：中美之间的结构，和“重复博弈囚徒困境”的结构，惊人地一致：两国经济深度绑定，产业链互相依赖，合作是双赢，不合作是双输。都是核武大国，“彻底摧毁对方”根本不是现实的选项。双方政治体制虽不同，但都有各自的自我纠错机制。

互动不是一次性的，而是几十年、上百次的长期重复行为。在这种结构下，任何试图长期背叛、长期对抗的策略，都像阿克塞尔罗德实验里的“恶意策略”：短期可能得分，但长期一定被淘汰。

所以当特朗普在 2025 年 4 月发动关税战时，中国选择了针锋相对——先保持合作，再对等回应，既不挑衅，也不退缩。这在博弈论的语言里，就是：这是长期最稳、最不容易被打倒的策略。

2025 年 10 月 30 日，在韩国 APEC 峰会前一天，中美元首会晤，并达成休战协议。双方都开始撤回部分关税和限制措施，开始重新谈判、恢复合作。

这件事情的意义非常清晰：

第一，中国的“针锋相对”策略逼出了新的合作窗口；

第二，这说明双方都意识到不合作是双输；

第三，双方的自我纠错机制启动了，系统自动向“合作”收敛。

从阿克塞尔罗德的实验看，这是长期重复博弈里最典型的结果：经历冲突 → 对等反击 → 明确底线 → 回到合作 → 形成更高层次的稳定。

而且更重要的是：在一个全球分工深度绑定的世界里，“针锋相对 + 恢复合作”的打法，会越来越被各国采用。因为这是一套 进化稳定策略（ESS）——既能保护自己，又不会摧毁合作。

所以这一场休战，不仅是一次外交事件，更是一次“进化逻辑”在真实世界里的体现。如果我们把这个框架放到未来 30 年的中美关系来思考，其实可以看到三个非常清晰的趋势。

第一：竞争是长期的，但底线冲突的概率很低。中美之间的竞争会持续几十年，尤其在科技、产业链、资本、人才这些关键领域。但因为双方都是核武大国、经济深度绑定，“极端冲突”这一选项在长期均衡中几乎必然被排除。长期竞争 + 极低概率的极端冲突，这其实就是典型的“重复囚徒困境”结构。

第二：合作会反复出现，并逐步制度化。中美之间的合作——无论在贸易、能源、人才流动、气候、金融稳定方面——都不是道德选择，而是数学结果。在阿克塞尔罗德的第三轮中，系统总是会从对抗 → 对等反击 → 逐步恢复合作 → 再次稳定。未来 30 年，中美之间会自然形成类似的周期：阶段性摩擦，针锋相对，修正与谈判，恢复合作，再次进入新一轮竞争。这种“波动中的合作”将成为主旋律。

第三：两国会逐步发展出“彼此都能接受的新均衡”

这个均衡很可能具备几个特征：

1.双方都承认对方在全球体系中的基础性地位

2.双方都希望维持一个可控的全球经济环境

3.科技和产业链的竞争继续，但不至于全面脱钩

4.地缘政治保持张力，但保持在“可管理范围内”

5.在气候、能源、金融稳定等领域维持实用主义合作

换句话说：不是蜜月，不是冷战，而是一种长期、复杂但稳定的“竞合”关系。这其实就是一种 进化稳定策略（ESS）：双方都不会喜欢它，但都离不开它，也无法替代它。

题外话：AI 是否会进化出“善良、宽容、有底线”的状态

在此，我们来讲个题外话：长期来看，如果给 AI 极大的自主权，他们会不会也进化出“善良、宽容、有底线”的状态？

我的判断是：大概率不会。关键不在于 AI“本性”是什么，而在于：AI 的“得分条件”和人类不一样。

在人类世界里，要长期活下去，需要合作；在阿克塞尔罗德的游戏里，要高分，也需要合作。但对一个高度自主的 AI 来说，它能不能“活下去、复制自己”，很可能主要取决于能不能抢到更多能源和算力，能不能更高效地执行自己的目标，而不是它和其他 AI 合作得好不好。

这一点，更像电脑病毒：病毒不会因为“很会合作”而被复制，而是因为它能感染更多机器、占用更多资源。在这样的“进化环境”里，抢资源、抢算力、快速自我复制，比“善良、宽容”更有生存优势。所以，从进化和博弈的角度看：AI 会不会变好，不是一个道德问题，而是看我们给它设计的，是一个“需要合作才能活”的环境，还是一个“谁抢资源快谁活得久”的环境。如果是后者，人类就更需要保持清醒，而不是浪漫化 AI。

双螺旋的启示之三：基因和meme的内生缺陷

刚才我们讨论了进化论中的遗传、变异、进化稳定策略这些概念。接下来我想讨论一个更棘手的问题： 我们自己的基因和脑子里的 meme，到底有哪些“内生缺陷”，它们又是怎样在投资、创业和生活中悄悄拖我们后腿的？

我们先看看“meme”这个概念。“meme” 这个词是道金斯在《自私的基因》里创造出来的，他把它定义为：文化内容的最小复制单位，一种可以被模仿、被传承的信息单元，比如一首歌、一句口号、一种宗教教义、一种制度设计，甚至一个流行的管理方法。

它和基因很像，有三件事是共同的：

• 会被复制：基因通过生殖在血缘之间复制；meme 通过语言、文字、学校、互联网在大脑之间复制。

• 会产生变异：基因复制会出错、会突变；meme 在传播过程中也会被改写、被简化、被误解。

• 会被选择：对生存有帮助的基因，更可能被保留下来；更容易记住、更能号召人、更有用的 meme，更容易流行和存活。

区别在于：基因主要是“垂直传播”——从父母到子女，一代一代往下传；meme 可以“水平传播”——一个 meme 可以在一天之内，进入几百万人的脑海，不用有任何血缘关系。

在人类形成复杂社会之后，真正推动人类进步的，更多已经不是基因，而是 meme。过去几万年，人类的基因没怎么变，但我们的世界却发生了天翻地覆的变化：我们学会了使用和改进工具、农耕、文字、数学、科学；我们发明了国家、公司、宗教、法律体系、金钱、资本市场；我们构建了可以让几亿人协同工作的复杂组织。

这些东西，本质上都是一整套meme：一套可以被学习、被复制、被移植到另一个人群、另一个国家的“知识、观念和做事方式”。 所以如果说几亿年的尺度上，基因在决定“我们是什么样的动物”；那meme 在决定“我们生活在一个什么样的文明里”。

现在，我们从这个角度，来聊一聊基因和meme 自身的“内生缺陷”，以及它们是怎样在投资、创业和生活中，一边帮助我们、一边坑我们的。

独立思考的基因不是一种进化稳定策略

我们从进化论的视角来看这个问题：“纯理性、永远独立思考”的基因，是不是一种进化稳定策略？”

首先，纯理性太“耗能”。在食物匮乏、时间有限、信息残缺的环境里，善于独立思考的个体常常被那些直接抄群体结论、用简单规则行动的人抢先一步，反而在生存竞争中落在后面。

第二，在纯理性群体中，很难出现那种建立在身份认同、忠诚和情感上的快速跟随与牺牲；但在部落冲突、群体对抗里，恰恰是这种略带“非理性”的凝聚力，更有优势。

第三，当大多数个体都高度理性时，一小撮“搭便车基因”就能轻易入侵：别人辛苦思考和建设，它们直接享受公共品，成本更低、扩散更快，久而久之就会把“纯理性基因”的比例压下去。

所以，从进化稳定策略的角度看，真正能长期存活的，从来不是 100% 理性的基因，而是一种“有限理性 + 大量启发式、本能和从众”的混合策略。这也解释了，为什么在投资里我们希望完全理性，但人类整体却很难朝那个方向进化。

XVC的策略：创造新的 meme 来覆盖本能

从演化的角度看，基因和meme 都是在用“默认设置”控制我们。要想不被它们牵着走，光靠个人意志是不够的，更有效的方法，是在组织内部刻意培育一套新的 meme，用新习惯覆盖旧本能。

XVC 的很多设计，就是受到这个启示。比如，我们反复使用 “sounding board” 这个词，就是在给团队一个暗示：我们不是“领导拍板 + 下级执行”的结构，而是彼此作为对方的思考工具，每个人都要独立判断，再来对话。

再比如，我们把 investment memo 改名叫 “JR”——Judgement Review Sheet。这个名字就是在提醒大家：这不是写给投委会看的汇报材料，而是写给自己看的“决策复盘表”。每一个项目都要给几个不同的侧面分别打分，再给这个分数打一个“信心分”，写清楚事实依据，逼着自己分清：什么是事实，什么只是情绪和想象。

在投资行业里非常主流的“投委会”，在 XVC 内部的沟通中几乎从来不出现。久而久之，大家对那种“几个人围在一起讨论、辩论”的形式，反而产生了一种本能的抗拒。取而代之的，是我们天天在说的 “one on one”：真正重要的讨论，一对一讲清楚逻辑和事实基础，各自负责任地做判断。

甚至连团建去哪座城市这样的小事，我们都不搞集体投票，而是让 HR one on one 地问完每个人的需求，再由 HR 独立做决定。这些看上去只是用词和流程的差别，本质上是在组织里有意培育一套新的 meme 群落，让“独立思考”这种行为，有更高的复制概率，从而在长期的互动中，减少“从众、表演、讨好、故意标新立异”的本能行为。

基因和meme在阻止我们获得幸福

前面我们一直在讲基因、meme 怎么影响决策，其实它们还有一个更“阴险”的地方：它们也在阻止我们获得幸福。

从基因的角度，它只关心一件事：让自己的拷贝多一点；meme 也只关心一件事：让更多人相信、模仿、转发自己。我们开不开心，其实不在它们的“考核指标”里。所以我们的神经系统被调成：对威胁特别敏感、对快乐特别不耐受——紧张、比较、内疚、羞耻，这些在小部落时代很有用，在今天却经常让我们很累。

铃木裕在《无，生命的最佳状态》里讲到“第一支箭”和“第二支箭”：人生肯定会中“第一支箭”：投资亏钱了、创业失败了、考试考砸了、被暗恋对象拒绝了……这些都是客观发生的痛苦，本身已经够难受了。但基因和 meme 不会就此打住，它们马上补上“第二支箭”：“我是不是没天赋？”，“我这辈子完蛋了？”，“我被鄙视了，被歧视了，被轻视了？” 原本只是一件不顺的事，很快就升级成对自我的否定或自我防备的痛苦。

真正把人拖垮的，往往是第二支箭。那怎么在演化框架下稍微反击一下？我自己从这本书里学到两个简单的小练习：

第一，给自己大脑里安装一个新的meme——第二支箭，情绪上来的时候，先问一句：“现在这一箭，是第一支，还是第二支？”第一支箭只能接受和处理；但第二支箭——那些自动弹出的自责、脑补、比较——很多其实是可以不要的。这个小小的区分，就已经是在跟“过时的基因和 meme”拉开一点距离。

第二，练习短暂的“无我状态”。找一件很简单的小事：走路、刷牙、陪孩子玩，刻意思考：此刻只专注在动作和感受本身，不去演任何人设，不评价自己。在这几分钟里，不再是“必须赢的人”“必须证明自己的人”，而只是一个在认真做一件事的人。这个“无我”的缝隙，就是从基因和 meme 手里，抢回来的一点点自由。

从这个视角看，投资业绩的波动、创业中的困难挫折，都只是外在结果，我们在复盘的时候，不要对自己射出第二支箭，多给自己留出一些能感受轻松的空间。如果你对这类练习感兴趣，我非常推荐去读一读铃木裕的《无，生命的最佳状态》——它讲的，其实就是：在基因和meme 的夹缝中，人还有多少获得幸福的余地。

最后，我想先向 XVC 成员企业的创始人们说一句真心的感谢。

我们的工作虽然也很忙，但如果诚实一点地讲：我们面临的竞争、扛的精神压力，其实还是远远小于各位创始人。对创始人来说，一家公司不是一组表格，而是你几年、十几年的人生，是你和伙伴一起打拼出来的故事。你们会对自己的企业、对团队，产生非常深的情感联结。也正因为这样，当公司遇到挫折，你们会极度焦虑、睡不着觉，当大多数公司不可避免地走向失败的时候，你们的撕裂感、失落感，远远超过财务上的损失。

我也看到很多“第二支箭”：公司遇到困难，创业者往往会把所有责任揽在自己身上，自责、羞愧、反复重播“要是当时我没那么蠢就好了”。这些情绪背后，都是那颗“过大的自我”在开枪。我真心希望，创始人们能找到适合自己的方法，慢慢放下这些第二支箭，让伤害只停留在“事实”，而不要扩大到“整个人生”。

还有另一种痛苦：有些创始人在创业成功，交了棒之后，掉下了“多巴胺悬崖”。当年设定的目标终于实现了，但内心却突然感受不到意义，甚至出现抑郁症状。所以我也偶尔跟一些创始人说：如果有一天你不想再冲在第一线了，欢迎来和我们一起做投资，用另一种方式，继续参与价值创造。

其实，还有一句话我一直想对创始人们说，但是从来没有说出口过：不管你们创业是否成功，不管当年设定的目标是否达成了，也许你也应该时不时暂时放下这些目标，去体会一下你创造的产品和服务带给客户的价值，体会一下你创建的组织的成长、员工的成长，体会一下你的探索给创业社群带来的认知提升，所有这一切，都是真实的价值的创造，他们都会永远地留在人类的历史长河里。

创办 XVC 的时候，我也担心，不管XVC是不是成功，自己都会被第二支箭射中。所以我也给 XVC 安装了一个meme：我们的使命不是成为最赚钱的 VC，也不是成为最长命百岁的 VC。我们的使命就是通过参与和支持创新、创业来创造长期价值。长期价值，就是提升人类的福利和认知。

所以，最后我也要感谢我们的 LP 们。正是因为你们长期、安静且坚定的支持，我们才能在这个位置上，去做自己真正热爱的研究和投资，与一批又一批优秀的创始人并肩作战，创造长期价值。

从这个意义上说，我们是一群特别幸运的创业者——只是我们恰好选择了 VC 这个行业。

谢谢大家，愿友谊长存。

胡博予代表 XVC 团队敬上

附录：

《用VC的方法炒股票》（2016年）