当人与AI意见相左,沪上一批AI原生企业选择“听AI的”,结果出人意料
创始人
2025-09-17 15:01:27
0

让人和AI(人工智能)共做一道题,答案相左,听谁的?一般来说,当然由人把关,但对于智能原生企业来说,他们选择“听AI的”。

不久前国务院发布的《关于深入实施“人工智能+”行动的意见》中,“智能原生”首次出现在官方文件中,被定义为“底层架构和运行逻辑基于人工智能”。

成立于2021年的天鹜科技,就是一家智能原生企业。他们拥有基于全球最大的蛋白质序列数据集进行预训练的AI蛋白质设计大模型,只要半天时间,该模型就能按照需求挖掘或设计出一批蛋白质,它们中的一些可能从未被人发现过,但天鹜科技的员工会非常认真地将AI挑选的结果放到真实场景中去验证。多年的经验给了他们信心,而结果也往往令人惊喜。

智能原生,就是把AI当成企业的核心基因,它们往往能带来颠覆式变化,而非效率的简单提升。当AI与真实世界的融合加速,或许未来“听AI的”会是一种常态。

AI的选择颠覆教科书

蛋白质由20种天然氨基酸组成,蛋白质数据库里序列的平均长度,约为361个氨基酸。仅改变其中1个氨基酸,就有6859种可能;改变2个,可能性飙升到2300多万种;改变3个,更是达到533亿种。想找到或设计出一个功能优异的蛋白质无异于大海捞针。过去,科学家一旦捞到了“针”,就会特别珍惜,他们还会将“针”与“针”相互排列组合,以期让结果更好。

AI则不然,它不仅关注好的,也关注坏的。天鹜科技首席技术官刘灏,就遇到过一个改变他认知的案例。教科书上说,蛋白质内部的相互作用越强,蛋白质的稳定性就越高,所以,面对AI大模型给出的结果,刘灏很意外——AI要他先破坏蛋白质内部作用力再结合。但他还是按照AI的思路做了,因为他刚见证团队中一位没有生物学背景的工程师,只是把客户提供的序列输入AI大模型,就成功改造出符合要求的酶。最终,AI没有令人失望,刘灏得到了更稳定的蛋白质,比之前所有做实验产出的都好。

“这种现象在自然界中也存在,叫做‘上位效应’,比如在爬山时,先走一段下山路再登顶,比直接登顶更快更省力,但如果没有AI助力,人们根本不知道应该在哪里、怎样去组合好与坏。”刘灏说。

这样的案例多了,天鹜科技对AI的信任度越来越高,现在当人和AI产生分歧,天鹜人会选择“听AI的”。

AI处理失败的熟练度优于人类

在另一家智能原生企业晶泰科技,同样的情况也在上演。晶泰科技内部会定期组织“AI科学家”和人类科学家比赛,在最近几次AI反应预测能力比拼中,针对某两种类型的反应预测上,晶泰科技自研的AI垂类模型准确率均超过80%,与人类科学家旗鼓相当;但在对失败反应预测的识别率上,AI准确率则超过50%,是人类的一倍以上。

晶泰AI设备。晶泰供图

人类与AI在成功与失败反应预测能力上的差别,也许与数据有关。浙江大学化学系研究员、博士生导师洪鑫表示,合成化学理论上可合成的中小分子数量高达10的60次方,这是一个远超宇宙中恒星数量的天文数字。自古以来,化学家都渴望成功,他们依赖已有的知识地图和敏锐的直觉,在实践中不断调整路线。这句话的潜台词是,科学家处理成功的结果都忙不过来,几乎不可能去关注失败的结果。

但在晶泰科技的智能实验室里,机器人一丝不苟记录下每一个数据,它并不偏爱得到好结果的数据,而是对好坏一视同仁。于是,失败数据与成功数据一起构建了一个更为完整的数据库。AI可以通过对“失败经验”的挖掘,找到从未被人类注意过的更优解。

晶泰科技联合创始人、首席执行官马健注意到了这个现象,他说:“我们会更加关注那些无法完成实验的‘失败经验’与大模型的关系,它们非常重要。”

大模型幻觉或来自数据不够

今年的OceanBase开发者大会上,蚂蚁集团首席技术官何征宇表示,缺乏足够的数据将导致AI产生“幻觉”,这种现象在当前的技术环境中愈发明显。

天鹜科技选择“听AI的”,最大底气就来自于其坐拥包含近90亿条序列、数亿个功能标签的全球最大蛋白质数据集,这些序列不仅涵盖常规生物,还包括从深海、火山口等极端环境中采集到的耐高温、耐强酸/强碱的蛋白质,几乎囊括自然界所有的蛋白语料。

在与金赛药业的合作中,对方希望找到一个耐强碱蛋白质,天鹜科技借助AI大模型,很快就找到数十个结果。经过在真实场景中测试,最后胜出的蛋白质,耐碱性能提高四倍,使用寿命延长一倍。目前,该蛋白质已完成多个批次的5000升放大生产,成为全球首个实现工业化生产的大模型设计蛋白质。

最近爆火的“纳米香蕉”图像模型在图片的色调、氛围、画面布局和视觉重点等方面表现出惊人的图片一致性,在连续20次编辑操作中,字符一致性准确率保持在95%以上。据谷歌方面介绍,融入丰富的真实世界知识,是其理解能力达到新高度的主要原因——它能够铭记上一幅作品的内容,同时也深刻理解对话的背景和逻辑。

人形机器人也在渴求更多数据。仅一个倒水的动作,机器人就需要吸收上万条数据才能学会,而一位数据采集师每天仅能采集约150条数据。在智元机器人合伙人兼具身业务部总裁姚卯青看来,不研究大模型的具身智能公司没有未来。目前,全球机器人动作数据相较于大语言模型的“核爆点”还差3至4个数量级,智元希望两年内能采集到1亿条。

相关内容

热门资讯

东风汽车集团申请阻燃柔性固态电... 金融界2025年1月31日消息,国家知识产权局信息显示,东风汽车集团股份有限公司申请一项名为“一种阻...
中端性能机大乱斗:加米耀酷真,... 近期,中端手机市场迎来了多款新品,包括一加Ace 5、REDMI K80、荣耀GT、真我Neo 7以...
无机房电梯楼层显示器异常解决指... 电梯 无机房电梯楼层显示器异常怎么办? 别急,本文将为您详细解答。首先,我们要了解无机房电梯楼层显示...
我市特步5G工厂入选国家5G工... 日前,工业和信息化部发布《关于2024年5G工厂名录的公示》,我市特步5G工厂入选国家5G工厂名录,...
卫星化学获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示卫星化学(002648)新获得一项实用新型专利授权,专利名为“...
自动驾驶+跟踪巡逻+现场抓捕 ... 近日,在浙江温州的闹市区,特警巡逻队带着一台球形机器人一起巡街,引来不少路人的关注。 球形“机器警察...
360智脑张向征:构建安全可信... 人工智能的加速发展,有力推动了社会的数智化转型;与此同时,带来的相关安全风险也日益凸显。近日,在北京...
原创 3... 一、iQOO 12 参考价格:2659元(12G+256G)。 性能强劲,游戏无忧 首先不得...
联想宣布旗下AIPC个人智能体... DoNews2月7日消息,近日,联想宣布个人智能体“小天”已接入DeepSeek,除了目前可以在联想...
2025年消脂设备产业数据报告 消脂仪是医学美容领域的医疗器械。 它使用激光和微波等设备根据其波长向真皮/皮下平面发射能量; 通过加...