25岁天才少女用数学杀死AI幻觉：公司14个月估值破110亿

25岁，2亿美元（约14亿元人民币）融资，110亿估值——这三个数字最近让整个硅谷为之震动。来自中国广州的洪乐潼，创办AI公司Axiom仅一年多，就跻身全球最年轻的独角兽行列。但她做的事情，比融资数字更让人震惊：她要用数学，"杀死"困扰AI行业多年的幻觉问题。

一、"一本正经胡说八道"的AI，正在侵蚀信任

你可能有过这样的经历：问AI一个专业问题，它言之凿凿地给出一段引用，结果你去查，发现这段话根本不存在。这就是AI幻觉——AI会自信地编造听起来完全正确的内容，却与事实毫不相干。

这不只是普通用户的烦恼。在医疗诊断、法律文书、金融分析等高风险场景中，AI的一次"胡说八道"，可能意味着错误的处方、错误的判决，或者错误的投资决策。据研究机构统计，目前主流大模型的幻觉率高达15%至30%——换句话说，每10次重要回答中，可能有1到3次是错的。这让许多行业对AI望而却步，即便它已经足够"聪明"。

二、从MIT到斯坦福，一个数学天才的"偏执"

洪乐潼的履历，放在任何场合都是"炸裂"级别的存在。2001年出生于广州天河区，父母是普通务工者，她从小展现出超凡的数学天赋。高一在全国数学奥林匹克选拔中晋级并屡获佳绩，2018年17岁考入麻省理工学院，仅用三年就拿下数学和物理双学位，本科期间发表9篇高质量学术论文，斩获北美数学最高荣誉摩根奖。

此后，她进入牛津大学攻读神经科学硕士，又到斯坦福大学攻读数学与法学双博士学位。2024年秋天，在一次咖啡馆交谈中，她与Meta AI前研究总监Shubho Sengupta一拍即合，做出了一个改变人生轨迹的决定：从斯坦福退学，全职创业。

"数学怎么赚钱？"这个问题曾让她被嘲笑。但洪乐潼看到的，是数学最独特的价值：自我验证。一道数学证明题，要么对，要么错，没有任何模糊地带。她想把这种确定性，注入到AI的血液里。

三、"形式化验证"：用数学公理给AI套上缰绳

Axiom做的，叫"形式化验证"——这是一个听起来极其冷门、却可能是AI发展史上关键一步的技术方向。

简单来说，形式化验证就像给AI的每一步推理配备一个"数学警察"。当AI得出一个结论时，系统会用Lean编程语言（一种专门用于数学证明的编程语言）从头验证整个推理链条，确保每一步都经得起数学检验。

这意味着什么？传统AI给答案，靠的是"概率"——它说这句话的概率很高，所以它认为这句话是对的。但Axiom的系统不给概率，它只给"已被证明的真理"。

在实际测试中，Axiom的AxiomProver系统展现了惊人的能力：在有"本科生数学奥林匹克"之称的普特南数学竞赛中，它斩获满分；在面对两道埃尔德什数论难题时，它仅用1天5小时，就自主完成了全程无人干预的形式化证明。这意味着，曾经需要数学家耗费数周甚至数月才能攻克的难题，AI可以在不到两天内给出可验证的完整证明。

四、20人的小团队，如何撬动110亿估值

Axiom目前只有20多名员工，却拿到了来自Menlo Ventures、Greycroft、Madrona Venture、B Capital、Toyota Ventures等顶级风投的2亿美元融资。这在VC普遍追逐"大团队、大规模"的硅谷，显得格格不入。

洪乐潼的解释很直接：技术壁垒，不是靠堆人堆出来的。Axiom的核心竞争力，在于对Lean语言和数学证明逻辑的深度积累。她说："我们不是在做一个更聪明的聊天机器人，而是在解决AI最根本的可靠性问题。"

她的目标市场也很清晰：金融、军工、芯片设计、自动驾驶——这些领域，对错误的容忍度是零。一次AI推理的失误，可能意味着几亿美元的损失，甚至生命的代价。这也是为什么，摩根、高盛等顶级金融机构，已经开始与Axiom接触，探索在量化交易和资产定价中引入可验证AI的可能性。

五、AI幻觉真的能被"杀死"吗？

洪乐潼的愿景很美好：用数学公理，给AI套上缰绳，让它不再胡说八道。但质疑声同样存在。

有研究者认为，形式化验证虽然理论上完美，但在实践中面临巨大挑战：现实世界的问题，往往无法像数学定理那样被严格定义。医疗诊断、法律分析、文学创作，这些领域的"正确答案"本身就充满争议，又如何让AI给出"可验证的真理"？

也有人说，可验证AI的本质，是把AI的能力限定在一个足够狭小的范围内——在这个范围内，数学可以帮忙；但AI真正有价值的地方，恰恰在于那些模糊的、跨界的、无法被公理化的领域。

这些质疑，Axiom也在回应。公司正在拓展应用边界，从代码验证延伸到算法分析，甚至尝试用形式化方法处理一些"软性"推理问题。洪乐潼的态度很务实："我们不是在追求AI永远不犯错，我们是在追求，在AI犯错的场景里，人类能知道它错了。"

你觉得，用数学"杀死"AI幻觉，这个方向走得通吗？你有没有被AI"一本正经胡说八道"坑过的经历？欢迎在评论区聊聊你的看法。

本文部分内容由AI辅助创作。