这项由位于旧金山的Aster AI Labs公司开展的研究发表于2026年2月10日,论文编号为arXiv:2602.07040v1,感兴趣的读者可通过此编号查阅完整研究。这是一项关于自主科学发现的突破性研究,它展示了如何让人工智能在科学研究中发挥前所未有的作用。
科学研究一直像是在黑暗中摸索宝藏的过程。传统上,科学家们需要经过无数次尝试和失败才能找到正确答案。就好比你想找到最完美的蛋糕配方,可能需要烤上几百个蛋糕,每次调整一点点配料,直到找到最理想的味道。这个过程既漫长又昂贵,特别是当每次"烤蛋糕"都需要几个小时甚至几天的时候。
现在,Aster AI Labs的研究团队开发出了一个名为Aster的智能系统,它就像一个超级聪明的厨师助手,能够只用五次尝试就找到完美配方,而传统方法需要115次尝试。这意味着科学发现的速度提升了惊人的23倍。更重要的是,这个系统不仅速度快,准确性也极高,在多个科学领域都创造了新的纪录。
一、像超级厨师一样工作的科学助手
要理解Aster是如何工作的,我们可以把它想象成一个拥有超强学习能力的厨师。这个厨师面前有一个基础食谱(初始程序)、一套评判标准(评估脚本),以及一个明确目标(比如做出最香甜的蛋糕)。
传统的科学发现系统就像普通厨师,需要按部就班地尝试每一种可能的配料组合。比如OpenEvolve这样的系统,它可能需要做115个蛋糕才能找到最佳配方。每做一个蛋糕,它会记录结果,然后基于这些信息稍微调整下一次的配料。
但Aster就像一个天才厨师,它不仅能从每次尝试中学到更多东西,还能更聪明地预测下一步应该怎么调整。研究团队在圆形装箱问题上进行了测试,这个问题就像在一个圆形盒子里尽可能多地装入小圆球。传统系统OpenEvolve需要115次尝试才能达到2.634的装箱效率,而Aster仅用5次尝试就达到了2.6353的效率,甚至超越了之前的最好成绩。
这种效率提升意味着什么呢?对于那些需要长时间计算的科学问题,比如训练大型机器学习模型(这个过程可能需要几个小时甚至几天),传统方法因为需要太多次尝试而变得不现实。但有了Aster,这些原本无法处理的问题现在变得可行了。
二、在数学世界中创造新纪录
Aster的第一个重大成就发生在数学领域,具体来说是解决了一个叫做"埃尔德什最小重叠问题"的数学难题。这个问题最初由著名数学家保罗·埃尔德什在1955年提出,就像一个古老的数学谜题,挑战了数学家们70年。
这个问题可以这样理解:假设你有一盒编号从1到2n的小球,你需要把它们分成两组,使得两组之间某种特定的"重叠程度"尽可能小。在连续情况下,这相当于寻找一个特殊的函数,让它的自相关函数的最大值尽可能小。这听起来很抽象,但就像调音师要找到最完美的音频平衡点一样。
人类数学家们经过几十年的努力,找到的最好答案是0.380927。而Aster在40次尝试后,成功将这个数值降低到了0.380874,虽然改进幅度看似微小,但在数学世界里这是一个显著的突破。更有趣的是,Aster找到的解决方案比之前最好的解决方案更加精细,它使用了8192个分段,而之前的最佳解决方案只有600个分段。
这就好比两个画家都在创作同一幅风景画,之前的画家用了600种颜色就画出了很美的作品,而Aster用了8000多种颜色,创作出了更加细腻和精准的杰作。
三、让生物学数据变得更清晰
在生物学研究中,科学家们经常要处理单细胞RNA测序数据,这些数据就像是从每个细胞里偷听到的"对话",能告诉我们细胞在干什么。但问题在于,这些"对话"经常被噪音干扰,就像在嘈杂的餐厅里试图听清楚邻桌的谈话一样困难。
这种现象叫做"dropout"事件,简单说就是本来存在的基因表达信号没有被检测到,造成了数据的稀疏和噪音。科学家们需要算法来"去噪",就像用高级音响系统过滤掉背景杂音,让真正的声音变得清晰。
Aster在这个问题上的表现同样令人印象深刻。它使用了OpenProblems基准测试,这是生物学领域的标准测试平台。最好的人类设计算法MAGIC得分为0.641,而之前最好的AI方法TTT-Discover达到了0.709。Aster通过30次迭代优化,将性能提升到了0.711。
这个提升的关键在于Aster能够更好地平衡两个重要指标。第一个是MSE(均方误差),类似于测量去噪后的数据与真实数据之间的差距,Aster将这个值从0.154降低到了0.150。第二个是Poisson得分,用来确保去噪过程不会引入不真实的信号,Aster保持在0.049的水平,与之前最好结果相当。
四、加速GPU计算的幕后英雄
现代人工智能的发展离不开强大的计算能力,而GPU(图形处理器)就是这个计算能力的核心。Aster在GPU内核优化方面的成就,就像为一台超级跑车调校引擎,让它跑得更快更稳。
研究团队选择了TriMul(三角矩阵乘法)内核作为优化目标,这是AlphaFold蛋白质结构预测系统中的关键计算组件。就像汽车引擎中的某个关键部件,虽然看起来不起眼,但对整体性能影响巨大。
在NVIDIA H100这款顶级GPU上,之前最好的人类优化结果是1371微秒,TTT-Discover系统将其优化到了1161微秒。而Aster通过70次迭代,进一步将运行时间缩短到1114微秒。虽然每次改进的幅度看似微小,但在需要执行数百万次这样计算的AI训练过程中,这些微秒级的改进会累积成显著的性能提升。
这种优化就像一个经验丰富的机械师,能够发现引擎中那些人类工程师可能忽略的微小调整机会。Aster不是简单地调整参数,而是重新设计了整个计算流程,找到了更高效的数据处理方式。
五、打破机器学习训练速度纪录
在机器学习领域,有一个著名的竞赛叫做"NanoGPT极速赛",参赛者的目标是在8块NVIDIA H100 GPU上尽可能快地训练出一个语言模型,使其在FineWeb验证数据集上达到特定的性能标准(交叉熵损失小于3.28)。
这个竞赛就像Formula 1赛车比赛,每个参赛者都在寻找哪怕是0.1秒的速度提升。当竞赛开始时,训练一个模型需要45分钟。经过无数工程师的努力,在Aster参与之前,最快纪录是96.8秒。
Aster仅用8次迭代就将这个纪录缩短到95.2秒,节省了1.6秒。在这种级别的竞赛中,1.6%的提升是相当显著的成就。Aster的解决方案主要集中在优化Triton内核的设计上,改进了内存载入方式,避免了不必要的重复计算。
这个成就让Aster成为第三个在NanoGPT极速赛中做出贡献的AI系统,前两个分别是Hiverge(提升0.9%)和Locus(提升1.3%)。这表明AI系统不仅能够辅助人类进行科学发现,甚至能够在竞争激烈的性能优化领域超越人类专家。
六、挑战长时间训练任务
为了证明Aster能够处理那些需要长时间计算的复杂任务,研究团队选择了ZAP-Bench(斑马鱼活动预测基准)作为测试目标。这个任务需要预测整个幼体斑马鱼大脑中每个神经元的活动模式,是一个极其复杂的高维预测问题。
最好的人类设计模型使用UNet架构,在16块A100 GPU上训练了36小时,最终达到0.0182的平均绝对误差(MAE)。这就像让一个天才预测师观察36小时的复杂数据后,对未来做出预测。
Aster的表现令人惊叹。它分两个阶段进行了总共34次迭代:首先进行20次迭代,每次限时1小时;然后进行14次迭代,每次限时3小时。最终,Aster也达到了0.0182的MAE,与最佳人类性能持平,但使用的计算资源只有人类方法的1/190。
这个成就的意义不仅在于效率提升,更在于证明了Aster能够处理那些传统自动发现系统无法处理的长周期任务。如果使用传统的需要数百次迭代的方法,这样的任务可能需要一个多月才能完成,而Aster仅用两天半就达到了相同效果。
虽然在这个任务上,之前已经有Aygün等人的树搜索系统达到了0.0176的更好结果,但Aster在被中断时仍在持续改进,很可能在更长时间内能够达到或超越这个性能。
七、技术创新的核心秘密
Aster之所以能够在这么多不同领域都表现出色,关键在于它的工作方式与传统系统有根本不同。传统的自动发现系统就像按照固定菜谱做菜的厨师,每次都严格按照既定步骤操作,从每次尝试中学到的信息有限。
相比之下,Aster更像一个有创造力的大厨,能够从每次尝试中提取更多有价值的信息,并更智能地决定下一步的改进方向。虽然论文中没有透露Aster的具体技术细节,但从结果可以看出,它必然在以下几个方面有所创新:首先是更高效的学习机制,能够从较少的样本中获得更多信息;其次是更智能的搜索策略,避免在无效的方向上浪费时间;最后是更好的泛化能力,能够将在一个问题上学到的经验应用到其他类似问题上。
这种能力特别适合处理那些评估成本高昂的问题。在传统系统需要进行数百次甚至数千次尝试的情况下,每次尝试都可能需要几小时甚至几天,总时间成本变得无法承受。而Aster只需要几十次尝试就能达到相同甚至更好的结果,使得原本不可行的研究变得可能。
八、对科学研究的深远影响
Aster的成功意味着科学研究的方式可能发生根本性改变。过去,很多科学问题因为需要太长时间或太多资源而被搁置。现在,研究人员可以在合理的时间内探索这些问题,大大扩展了可研究问题的范围。
这种变化就像从马车时代进入汽车时代。过去需要几个月才能完成的科学探索,现在可能只需要几天。这不仅加速了科学发现的过程,还让更多研究团队能够参与到高水平的科学研究中来。
Aster的出现也展示了人工智能与人类研究者合作的新模式。AI不是要替代科学家,而是成为科学家的得力助手,帮助他们更快地验证假设、优化实验设计、发现新的规律。科学家可以专注于提出创新想法和解释研究结果,而将繁重的优化和搜索工作交给AI系统。
此外,Aster的成功还可能推动其他研究团队开发类似的系统,形成良性竞争,进一步提升自动科学发现的能力。就像智能手机推动了整个移动技术产业的发展一样,Aster可能成为推动科学研究自动化的催化剂。
目前,有兴趣的研究人员可以通过asterlab.ai网站访问Aster系统,既可以通过网页界面使用,也可以通过API接口集成到自己的研究工作流程中。这种开放性使得更多研究人员能够受益于这项技术,同时也为Aster在更多科学领域的应用提供了可能。
说到底,Aster代表了科学研究进入新时代的一个里程碑。它不仅展示了AI在科学发现中的巨大潜力,更重要的是证明了通过更智能的方法,我们可以大幅提高科学研究的效率和质量。对于那些渴望加速科学发现、解决复杂问题的研究人员来说,Aster提供了一个强大而实用的工具。
未来,随着这类AI系统的不断完善,我们可能会看到科学发现的速度呈指数级增长,从而为解决人类面临的重大挑战提供更多可能性。无论是新药开发、气候变化应对,还是新材料发现,都可能因为这种技术的普及而获得突破性进展。
Q&A
Q1:Aster AI是什么,它有什么特别之处?
A:Aster是由Aster AI Labs开发的自主科学发现系统,它的特别之处在于能够将科学发现的速度提升20多倍。传统系统需要115次尝试才能解决的问题,Aster只需要5次尝试就能达到更好的结果,这让原本需要几个月的研究可能在几天内完成。
Q2:Aster在哪些科学领域取得了突破?
A:Aster在多个领域都创造了新纪录,包括数学领域的埃尔德什最小重叠问题、生物学的单细胞数据去噪、GPU内核优化、机器学习训练加速等。它不仅速度快,准确性也很高,在大多数任务上都超越了之前最好的人类和AI方法。
Q3:普通研究人员如何使用Aster系统?
A:研究人员可以通过asterlab.ai网站访问Aster系统,既可以使用网页界面,也可以通过API接口将其集成到自己的研究工作中。这种开放性让更多科研团队能够利用这项技术加速自己的研究发现。