有消息人士透露,ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。
该项目的具体信息此前未曾披露,目前微软支持的初创企业正在积极展示其模型的高级推理能力。
根据路透社5月份获得的OpenAI内部文件,OpenAI的团队正在研发Strawberry。路透社无法确认该文件的具体日期,但文件中详细说明了OpenAI如何计划利用Strawberry进行研究。消息人士表示,该计划正在推进中,但路透社无法确定“草莓”何时会发布。
这位知情人士指出,即使在OpenAI内部,“草莓”的运作机制也是一个高度保密的内容。
据知情人士透露,该文件提到一个使用Strawberry模型的项目,旨在使公司的人工智能不仅能生成查询答案,还能提前进行充分的规划,自主且可靠地在互联网上导航,以执行OpenAI所称的“深度研究”。
根据对十多位人工智能研究人员的采访,这是当前人工智能模型尚未解决的难题。
当被问及“草莓”及相关细节时,OpenAI的一位发言人在声明中表示:“我们希望我们的人工智能模型能像我们一样理解这个世界。持续研究新的人工智能功能是行业的普遍做法,大家都相信,随着时间的推移,这些系统的推理能力将会得到提升。”
发言人没有直接回应关于“草莓”的问题。
草莓项目的前身是Q*,路透社去年报道,该项目在公司内部被视为一项重大突破。
两名消息人士描述了OpenAI员工早些时候展示的Q*演示,能够解决当前商用模型无法应对的复杂科学和数学问题。
另一位知情人士表示,OpenAI已在内部测试人工智能,其在数学数据集上的得分超过90%,该数据集是针对冠军数学问题的基准。路透社无法确认这是否与“草莓”项目相关。
据彭博社报道,在周二的一次内部全体会议上,OpenAI展示了一个研究项目的演示,声称该项目具备新的类人推理能力。OpenAI的一位发言人证实了会议的举行,但拒绝透露具体内容。路透社无法确认该项目是否为“草莓”。
知情人士表示,OpenAI希望这一创新能显著提升其人工智能模型的推理能力,并补充说,“草莓”涉及一种专门处理人工智能模型的方法,该模型是在非常大的数据集上进行预训练的。
路透社采访的研究人员表示,推理是人工智能实现人类或超人类智能水平的关键。
尽管大型语言模型已经能够比人类更快地总结复杂文本和撰写优美散文,但在解决对人类而言似乎直观的常识性问题时,这种技术往往表现不足,例如识别逻辑谬误和玩井字游戏。当模型遇到这类问题时,通常会产生“幻觉”或虚假信息。
接受路透社采访的人工智能研究人员普遍认为,在人工智能的背景下,推理包括构建一个模型,使人工智能能够提前计划,反映物理世界的运作方式,并可靠地解决具有挑战性的多步骤问题。
提升人工智能模型的推理能力被视为解锁模型潜力的关键,这将影响从重大科学发现到规划和构建新软件应用程序的各个方面。
OpenAI首席执行官萨姆·奥特曼早些时候表示,在人工智能领域,“最重要的进展将围绕推理能力展开。”
谷歌、Meta和微软等其他公司也在尝试不同的技术来提升人工智能模型的推理能力,大多数从事人工智能研究的学术实验室也是如此。然而,关于大型语言模型是否能够将想法和长期规划纳入预测方式,研究人员意见不一。例如,现代人工智能的先驱之一、Meta公司的Yann LeCun经常表示,法学硕士不具备类似人类的推理能力。
人工智能的挑战
知情人士称,Strawberry是OpenAI克服这些挑战计划的关键组成部分。路透社看到的文件描述了“草莓”的目标,但未说明如何实现。
据四名听过该公司宣传的人士透露,近几个月来,该公司一直在私下向开发者和其他外部各方暗示,技术即将发布,具备更先进的推理能力。他们拒绝透露身份,因为未获授权讨论私事。
其中一位消息人士称,“草莓”包括一种被称为“后训练”的OpenAI生成式人工智能模型的专门方法,即在对大量广义数据进行“训练”后,对基础模型进行调整,以特定方式提升其性能。
开发模型的后训练阶段涉及“微调”等方法,这是当今几乎所有语言模型都使用的过程,形式多样,例如让人类根据模型的反应提供反馈,并给予模型好的和坏的答案。
据知情人士透露,“草莓”与斯坦福大学2022年开发的“自学推理器”或“STaR”方法有相似之处。STaR的创始人之一、斯坦福大学教授诺亚·古德曼对路透社表示,STaR使人工智能模型能够通过迭代创建自己的训练数据来“引导”自己达到更高的智能水平,理论上可以用来让语言模型超越人类的智能水平。
“我认为这既令人兴奋又令人担忧……如果事情继续朝这个方向发展,我们作为人类将面临一些严肃的考量,”古德曼说。Goodman并不隶属于OpenAI,也不熟悉Strawberry。
第一个消息来源解释说,OpenAI将“草莓”瞄准的功能之一是执行长期任务(LHT),指的是需要模型提前计划并在较长时间内执行一系列动作的复杂任务。
OpenAI的内部文件显示,为此,OpenAI正在创建、训练和评估其所谓的“深度研究”数据集上的模型。路透社无法确认数据集的具体内容,也无法确定延长的时间意味着多长。
根据该文件和其中一位消息人士的说法,OpenAI特别希望其模型能够利用这些功能,在“CUA”(即使用计算机的代理)的帮助下自主浏览网页,从而进行研究。CUA可以根据其发现采取行动。OpenAI还计划测试其在软件和机器学习工程师工作方面的能力。
安娜·唐(Anna Tong)旧金山报道,凯蒂·保罗(Katie Paul)纽约报道;Ken Li和Claudia Parsons编辑。2024年版权。版权所有。本材料不得出版、广播、重写或重新分发。
本文来自作者[丹琴]投稿,不代表往来号立场,如若转载,请注明出处:https://wak.wltrip.cn/life/202505-684.html
评论列表(4条)
我是往来号的签约作者“丹琴”!
希望本篇文章《探索“草莓”:迈向具备思考能力的人工智能的初步尝试》能对你有所帮助!
本站[往来号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览: 有消息人士透露,ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。 该项目的具体信息此前未曾披露,目前微软...