25岁,2亿美元(约14亿元人民币)融资,110亿估值——这三个数字最近让整个硅谷为之震动。来自中国广州的洪乐潼,创办AI公司Axiom仅一年多,就跻身全球最年轻的独角兽行列。但她做的事情,比融资数字更让人震惊:她要用数学,"杀死"困扰AI行业多年的幻觉问题。
一、"一本正经胡说八道"的AI,正在侵蚀信任
你可能有过这样的经历:问AI一个专业问题,它言之凿凿地给出一段引用,结果你去查,发现这段话根本不存在。这就是AI幻觉——AI会自信地编造听起来完全正确的内容,却与事实毫不相干。
这不只是普通用户的烦恼。在医疗诊断、法律文书、金融分析等高风险场景中,AI的一次"胡说八道",可能意味着错误的处方、错误的判决,或者错误的投资决策。据研究机构统计,目前主流大模型的幻觉率高达15%至30%——换句话说,每10次重要回答中,可能有1到3次是错的。这让许多行业对AI望而却步,即便它已经足够"聪明"。
二、从MIT到斯坦福,一个数学天才的"偏执"
洪乐潼的履历,放在任何场合都是"炸裂"级别的存在。2001年出生于广州天河区,父母是普通务工者,她从小展现出超凡的数学天赋。高一在全国数学奥林匹克选拔中晋级并屡获佳绩,2018年17岁考入麻省理工学院,仅用三年就拿下数学和物理双学位,本科期间发表9篇高质量学术论文,斩获北美数学最高荣誉摩根奖。
此后,她进入牛津大学攻读神经科学硕士,又到斯坦福大学攻读数学与法学双博士学位。2024年秋天,在一次咖啡馆交谈中,她与Meta AI前研究总监Shubho Sengupta一拍即合,做出了一个改变人生轨迹的决定:从斯坦福退学,全职创业。
"数学怎么赚钱?"这个问题曾让她被嘲笑。但洪乐潼看到的,是数学最独特的价值:自我验证。一道数学证明题,要么对,要么错,没有任何模糊地带。她想把这种确定性,注入到AI的血液里。
三、"形式化验证":用数学公理给AI套上缰绳
Axiom做的,叫"形式化验证"——这是一个听起来极其冷门、却可能是AI发展史上关键一步的技术方向。
简单来说,形式化验证就像给AI的每一步推理配备一个"数学警察"。当AI得出一个结论时,系统会用Lean编程语言(一种专门用于数学证明的编程语言)从头验证整个推理链条,确保每一步都经得起数学检验。
这意味着什么?传统AI给答案,靠的是"概率"——它说这句话的概率很高,所以它认为这句话是对的。但Axiom的系统不给概率,它只给"已被证明的真理"。
在实际测试中,Axiom的AxiomProver系统展现了惊人的能力:在有"本科生数学奥林匹克"之称的普特南数学竞赛中,它斩获满分;在面对两道埃尔德什数论难题时,它仅用1天5小时,就自主完成了全程无人干预的形式化证明。这意味着,曾经需要数学家耗费数周甚至数月才能攻克的难题,AI可以在不到两天内给出可验证的完整证明。
四、20人的小团队,如何撬动110亿估值
Axiom目前只有20多名员工,却拿到了来自Menlo Ventures、Greycroft、Madrona Venture、B Capital、Toyota Ventures等顶级风投的2亿美元融资。这在VC普遍追逐"大团队、大规模"的硅谷,显得格格不入。
洪乐潼的解释很直接:技术壁垒,不是靠堆人堆出来的。Axiom的核心竞争力,在于对Lean语言和数学证明逻辑的深度积累。她说:"我们不是在做一个更聪明的聊天机器人,而是在解决AI最根本的可靠性问题。"
她的目标市场也很清晰:金融、军工、芯片设计、自动驾驶——这些领域,对错误的容忍度是零。一次AI推理的失误,可能意味着几亿美元的损失,甚至生命的代价。这也是为什么,摩根、高盛等顶级金融机构,已经开始与Axiom接触,探索在量化交易和资产定价中引入可验证AI的可能性。
五、AI幻觉真的能被"杀死"吗?
洪乐潼的愿景很美好:用数学公理,给AI套上缰绳,让它不再胡说八道。但质疑声同样存在。
有研究者认为,形式化验证虽然理论上完美,但在实践中面临巨大挑战:现实世界的问题,往往无法像数学定理那样被严格定义。医疗诊断、法律分析、文学创作,这些领域的"正确答案"本身就充满争议,又如何让AI给出"可验证的真理"?
也有人说,可验证AI的本质,是把AI的能力限定在一个足够狭小的范围内——在这个范围内,数学可以帮忙;但AI真正有价值的地方,恰恰在于那些模糊的、跨界的、无法被公理化的领域。
这些质疑,Axiom也在回应。公司正在拓展应用边界,从代码验证延伸到算法分析,甚至尝试用形式化方法处理一些"软性"推理问题。洪乐潼的态度很务实:"我们不是在追求AI永远不犯错,我们是在追求,在AI犯错的场景里,人类能知道它错了。"
你觉得,用数学"杀死"AI幻觉,这个方向走得通吗?你有没有被AI"一本正经胡说八道"坑过的经历?欢迎在评论区聊聊你的看法。
本文部分内容由AI辅助创作。
