·Tool Discoverer担任把天然言语的功能需求从动为合适“AI–东西交互和谈”的布局化东西申明和可施行的法式代码。
AI 科学家因可以或许自动推理、从动尝试和协做发觉而被人们寄予厚望。但建立 AI 科学槛极高,科学研究本身具有高度定制化取专业化的特征,难以用规模化、从动化的体例快速建立。
保守的 AI 智能体凡是只能完成如文献检索、摘要生成、数据初步阐发等辅帮性使命,难以胜任跨学科、长周期、动态演化的科研工做。其底子缘由正在于:现有 AI 智能体缺乏同一的体例理解、操做并取实正在科研进行深度交互。也就是说,AI 无人类科学家一样,以“通用尝试言语”取尝试设备、仿实平台或计较资本协做。
现实上,每个科学范畴都有奇特的研究范式、尝试方式和数据东西,AI 系统往往需要针对具体科研问题进行复杂的、个性化设置装备摆设取调优。这一过程高度依赖具有 AI 取范畴学问双沉布景的研究人员,因而大大都科研工做者难以间接建立或利用实正懂科研的 AI 科学家。
而正在集成电设想如许高度集成和流程化的范畴中,行业次要依赖几家公司供给的功能强大的电子设想从动化(EDA,Electronic design automation)东西。ToolUniverse 将优先完成 EDA 东西等专业设想软件的适配,使 AI 可以或许借帮范畴专无数据格局利用相关设想东西,正在不改变原有设想流程的前提下,提拔设想效率。此外,ToolUniverse 凭仗其基于多智能体的东西发觉系统,能按照范畴用户需求从动集成新东西,从而敏捷拓展至新的科研范畴。
据领会,研究团队正正在取合做伙伴配合摸索 ToolUniverse 正在多个科学范畴的使用。除了生物医学,他们还正在取集成电范畴的研究人员合做,开辟用于集成电芯片设想的 AI 科学家。
若是将科研世界看做是一台电脑,那么 ToolUniverse 就是让 AI 学会利用键盘和鼠标的系统。华对 DeepTech 暗示,ToolUniverse 帮力科研人员摸索 AI 正在科学研究范畴的潜力鸿沟。但愿它成为将来 AI 科研的根本设备,就好像 AI 东西界的“HTTP 和谈”和 AI 科学家的“Linux 操做系统”。
两个系统城市通过多轮从动反馈轮回来纠错,它们会利用 ToolUniverse 已有的东西进行收集搜刮、阐发运转成果、按照测试和专家反馈不竭优化。ToolUniverse 不只能从动生成新东西,还能让这些东西被持续改良,从而从动化地提拔东西的靠得住性和可用性。该团队还设想了矫捷多样的东西注册机制,并将其为合适和谈尺度的可挪用单位。
近日,OpenAI 要正在 2028 年实现让 AI 完全自从做研究,一会儿又把核心聚正在了AI 科学家。
“目前,我们已取国表里相关范畴的公司及研究机形成立联系取合做,配合鞭策科研平台的建立取普遍使用。我们也欢送财产界和学界的伴侣插手我们,配合推进这一历程。”华暗示。
抱负的 AI 科学家终极形态是可以或许自从提出全新的科学,并最终取得诺贝尔级此外科学发觉。AI 科学家将不只是人类科学家的合做伙伴,而是进一步成为人类科学家摸索的“导师”。正在科学发觉的过程中,它无望为人类对世界的认知贡献全新学问。
黄晔鹏是哈佛医学院的博士生,本科结业于南京大学,研究标的目的是开辟人工智能方式,用于研究多标准扰动,涵盖从细胞系统中的遗传和化学干涉到全脑神经调控。
华暗示:“该和谈基于通用言语,系统建立了一个能够组合的,把分歧类型、分歧来历的东西像搭建积木一样毗连起来。不只显著提拔了东西之间的互操做性,还可以或许轻松建立出合适科研需求的复杂流程。”。
华正在南开大学获得博士学位,目前正在哈佛医学院处置博士后研究,努力于开辟根本模子和通用表征进修方式,以加强对现实世界的理解和交互。他的研究侧沉于通用手艺,包罗 AI 智能体、生成模子、自监视进修以及根本模子的设想。
图丨 a)通过将大模子(如 Claude)取专业东西连系,培育 AI 科学家;b)通过将 ToolUniverse 帮力取 AI 智能体(如 Gemini CLI)毗连,建立具备多轮东西利用取推理能力的 AI 科学家(来历:arXiv)。
分歧范畴的东西生态建立根基策略,都环绕毗连人类科学家现实利用的东西,并将其为 AI 可拜候的资本展开。各范畴既存正在很多通用东西(如文献检索取科学计较东西),也涉及范畴特有的东西取集成策略。例如,正在生物医学范畴,ToolUniverse 涵盖数百个丰硕的数据库消息,以及针对药物、卵白质、单细胞等范畴的大量计较模子。
孔正伦是哈佛大学的博士后研究员,本科结业于华中科技大学,曾正在微软研究院、ARM和三星研究院担任研究练习生,研究沉点是开辟合用于现实场景的高效深度进修方式。
其相当于 AI 用于科研的“Linux 操做系统”:将 AI 可施行的科研操做笼统为同一的和谈接口,使 AI 可以或许以尺度化体例挪用、组合、优化跨越 600 种科研东西(最新数据已增加到 700+种)。
研究团队目前的沉点研究标的目的是进一步提拔基于 AI 智能体的 AI 科学家正在处理科学问题方面的能力,并持续建立的 ToolUniverse。正在财产化层面,他们专注于开源社区的成立和成长。
而且,可进一步正在 ToolUniverse 生态中集成范畴公用的科研。该系统所供给的科学不只支撑 AI 科学家施行科研使命,还可做为强化进修,用于锻炼特定科研范畴的 AI 科学家。
相较于现有框架,ToolUniverse 的奇特劣势正在于对科学研究范畴的特地优化,包罗为各类 AI 科学家所需的科研勾当设想了同一的“AI-东西交互和谈”,并基于该和谈衍生出专为科研范畴打制的东西生态系统,以及配套的科研东西生成、集成、选择、组合取优化功能,从而提拔具体科研使命中的能力程度。
隋芃玮具有哥伦比亚大学计较机科学硕士学位,专注于图进修和狂言语模子智能体正在生物医学和基因组学中的使用,研究沉点是操纵基于 LLM 的多智能系统统来推进医治科学,并对开辟基于 LLM 的工做流引擎以用于医治学中的各类下逛使命感乐趣。
保守模子多逗留正在筛选层面,而 AI 科学家可以或许融合多模态数据并取多种东西交互,从中揣度潜正在的感化机制,阐明靶点若何影响疾病历程,进而使后续药物筛选更具靶向性。正在保守流程中耗时数小时的使命,AI 科学家可以或许通过设想成本最低、验证效率最高的尝试组合来完成,从而避免盲目标大规模试错。
ToolUniverse 支撑通过模子上下文和谈(MCP,Model Context Protocol)向用户东西,并正在此根本上加强了东西搜刮等一系列功能。此外,ToolUniverse 可以或许将现有的 MCP 东西无缝集成到其生态中,使这些本来的东西可以或许被组合取优化,从而实现更复杂的科研功能。
需要领会的是,ToolUniverse 取现有框架并非合作关系,而是互补关系。它既可用于由 LangChain、AutoGen 等建立的智能体,也能将这些智能体为科研的一部门,以供科研利用。
研究团队认为,实现 AI 科学家的财产化起首要处理普及和承认的问题,即让科研人员可以或许通过 ToolUniverse 接触并利用 AI 科学家,从而提拔工做效率,同时打通各类科研取 AI 科学家之间的毗连。
过去,AI 只是做为“帮理”辅帮研究者们进行科学研究。现正在,美国哈佛大学取美国麻省理工学院结合团队颁布发表,他们开辟了一套能让 AI 实正“做科研”的通用生态系统 ToolUniverse,涵盖建立科研、发觉东西取优化、从动化组合科研流程等功能来支撑摸索科学问题、施行尝试并完成阐发。
图丨 a)打制 AI 科学家的生态系统;b)ToolUniverse 帮力支撑的多样化东西类别概览,涵盖机械进修模子、智能体、范畴学问库、尝试平台、科研软件包、从动化东西、人工反馈、工做流、数据集、API 接口、嵌入存储、可视化东西及检索系统;c-d)正如 HTTP 和谈规范了客户端取办事器的通信,ToolUniverse 帮力通过交互和谈规范了 AI 模子发出东西请求取领受响应的流程(来历:arXiv)?。
Richard Zhu 是哈佛大学的本科生,对人工智能、统计学、神经科学和生物医学的交叉范畴感乐趣,研究经验涵盖生物消息学、神经退行性疾病、生物学、人工智能以及运能临床评估。
正在接下来的研究阶段中,该团队打算继续摸索具备自从进修取迭代进化能力的 AI 科学家模子,使其可以或许正在复杂尝试中实现高度自从化,并可持续地长时间工做。
基于 ToolUniverse 系统,研究人员无需具备 AI 布景,能够极低成本将肆意狂言语模子、推理模子或智能体正在几分钟内快速生成特定范畴的、懂科研的 AI 科学家,出格值得关心是,其无需额外的锻炼或微调。
正在高胆固醇血症的案例研究中,ToolUniverse 成功建立了一个 AI 科学家,并能识别具有预测优良特征的药物的强效雷同物。
为系统性处理上述问题,研究团队提出了“AI-东西交互和谈”,显著简化了 AI 科学家取人类科学家、尝试操做以及科研之间的交互取沟通,让 AI 科学家可以或许理解东西的功能和参数,并用天然言语来描述或挪用它们。