探索“草莓”：迈向具备思考能力的人工智能的初步尝试

丹琴 • 2025年05月24日 18:44 • 生活经验 • 阅读 4

　　有消息人士透露，ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。该项目的具体信息此前未曾披露，目前微软...

有消息人士透露，ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。

该项目的具体信息此前未曾披露，目前微软支持的初创企业正在积极展示其模型的高级推理能力。

根据路透社5月份获得的OpenAI内部文件，OpenAI的团队正在研发Strawberry。路透社无法确认该文件的具体日期，但文件中详细说明了OpenAI如何计划利用Strawberry进行研究。消息人士表示，该计划正在推进中，但路透社无法确定“草莓”何时会发布。

这位知情人士指出，即使在OpenAI内部，“草莓”的运作机制也是一个高度保密的内容。

据知情人士透露，该文件提到一个使用Strawberry模型的项目，旨在使公司的人工智能不仅能生成查询答案，还能提前进行充分的规划，自主且可靠地在互联网上导航，以执行OpenAI所称的“深度研究”。

根据对十多位人工智能研究人员的采访，这是当前人工智能模型尚未解决的难题。

当被问及“草莓”及相关细节时，OpenAI的一位发言人在声明中表示：“我们希望我们的人工智能模型能像我们一样理解这个世界。持续研究新的人工智能功能是行业的普遍做法，大家都相信，随着时间的推移，这些系统的推理能力将会得到提升。”

发言人没有直接回应关于“草莓”的问题。

草莓项目的前身是Q*，路透社去年报道，该项目在公司内部被视为一项重大突破。

两名消息人士描述了OpenAI员工早些时候展示的Q*演示，能够解决当前商用模型无法应对的复杂科学和数学问题。

另一位知情人士表示，OpenAI已在内部测试人工智能，其在数学数据集上的得分超过90%，该数据集是针对冠军数学问题的基准。路透社无法确认这是否与“草莓”项目相关。

据彭博社报道，在周二的一次内部全体会议上，OpenAI展示了一个研究项目的演示，声称该项目具备新的类人推理能力。OpenAI的一位发言人证实了会议的举行，但拒绝透露具体内容。路透社无法确认该项目是否为“草莓”。

知情人士表示，OpenAI希望这一创新能显著提升其人工智能模型的推理能力，并补充说，“草莓”涉及一种专门处理人工智能模型的方法，该模型是在非常大的数据集上进行预训练的。

路透社采访的研究人员表示，推理是人工智能实现人类或超人类智能水平的关键。

尽管大型语言模型已经能够比人类更快地总结复杂文本和撰写优美散文，但在解决对人类而言似乎直观的常识性问题时，这种技术往往表现不足，例如识别逻辑谬误和玩井字游戏。当模型遇到这类问题时，通常会产生“幻觉”或虚假信息。

接受路透社采访的人工智能研究人员普遍认为，在人工智能的背景下，推理包括构建一个模型，使人工智能能够提前计划，反映物理世界的运作方式，并可靠地解决具有挑战性的多步骤问题。

提升人工智能模型的推理能力被视为解锁模型潜力的关键，这将影响从重大科学发现到规划和构建新软件应用程序的各个方面。

OpenAI首席执行官萨姆·奥特曼早些时候表示，在人工智能领域，“最重要的进展将围绕推理能力展开。”

谷歌、Meta和微软等其他公司也在尝试不同的技术来提升人工智能模型的推理能力，大多数从事人工智能研究的学术实验室也是如此。然而，关于大型语言模型是否能够将想法和长期规划纳入预测方式，研究人员意见不一。例如，现代人工智能的先驱之一、Meta公司的Yann LeCun经常表示，法学硕士不具备类似人类的推理能力。

人工智能的挑战

知情人士称，Strawberry是OpenAI克服这些挑战计划的关键组成部分。路透社看到的文件描述了“草莓”的目标，但未说明如何实现。

据四名听过该公司宣传的人士透露，近几个月来，该公司一直在私下向开发者和其他外部各方暗示，技术即将发布，具备更先进的推理能力。他们拒绝透露身份，因为未获授权讨论私事。

其中一位消息人士称，“草莓”包括一种被称为“后训练”的OpenAI生成式人工智能模型的专门方法，即在对大量广义数据进行“训练”后，对基础模型进行调整，以特定方式提升其性能。

开发模型的后训练阶段涉及“微调”等方法，这是当今几乎所有语言模型都使用的过程，形式多样，例如让人类根据模型的反应提供反馈，并给予模型好的和坏的答案。

据知情人士透露，“草莓”与斯坦福大学2022年开发的“自学推理器”或“STaR”方法有相似之处。STaR的创始人之一、斯坦福大学教授诺亚·古德曼对路透社表示，STaR使人工智能模型能够通过迭代创建自己的训练数据来“引导”自己达到更高的智能水平，理论上可以用来让语言模型超越人类的智能水平。

“我认为这既令人兴奋又令人担忧……如果事情继续朝这个方向发展，我们作为人类将面临一些严肃的考量，”古德曼说。Goodman并不隶属于OpenAI，也不熟悉Strawberry。

第一个消息来源解释说，OpenAI将“草莓”瞄准的功能之一是执行长期任务(LHT)，指的是需要模型提前计划并在较长时间内执行一系列动作的复杂任务。

OpenAI的内部文件显示，为此，OpenAI正在创建、训练和评估其所谓的“深度研究”数据集上的模型。路透社无法确认数据集的具体内容，也无法确定延长的时间意味着多长。

根据该文件和其中一位消息人士的说法，OpenAI特别希望其模型能够利用这些功能，在“CUA”（即使用计算机的代理）的帮助下自主浏览网页，从而进行研究。CUA可以根据其发现采取行动。OpenAI还计划测试其在软件和机器学习工程师工作方面的能力。

本文来自作者[丹琴]投稿，不代表往来号立场，如若转载，请注明出处：https://wak.wltrip.cn/life/202505-684.html

4 4

本文作者

丹琴签约作者

1 文章

1 粉丝

我是往来号的签约作者[丹琴],本篇文章《探索“草莓”：迈向具备思考能力的人工智能的初步尝试》主要讲述了:　　有消息人士透露，ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。该项目的具体信息此前未曾披露，目前微软...

生活经验

Yediyurappa定于6月17日出庭接受刑事调查

　　印度人民党(BJP)的高级领导人耶迪尤拉帕(BSYediyurappa)在周六表示，他将于6月17日出席刑事调查部门(CID)，接受与他相关的POCSO案件的调查。抵达该市后，这位前首席部长表示，反对他的人将会受到应有的教训。

山青
2025年05月24日
0
常识科普

副警长表示，1975年的乐队在警方接到报案前已离开马来西亚

吉隆坡，7月25日——警察副总监拿督斯里AyobKhanMydinPitchay表示，警方只收到了关于英国乐队The1975在雪邦GoodVibesFestival2023上的不礼貌行为的报告，该乐队于上周五离开该国前往英国。他否认了警方在处理此事时效

荆雨涵
2025年05月24日
0
科技世界

PNB Housing股价上涨10%，因通用大西洋或将出售5%股份

　　剧情简介据报道，通用大西洋通过上市前大宗交易出售了PNB住房金融公司5.4%的股份，PNB住房金融公司的股价在孟买证券交易所上涨10%，至893.60卢比。据IIFL证券称，通用大西洋计划以每股775卢比的价格出售133万股股票，以筹集103.3亿卢比。

闪杰
2025年05月24日
0
百科栏目

官员报告：以色列空袭致加沙学校避难所近百人遇难

　　路透社开罗8月10日电---加沙的民间紧急服务机构周六表示，以色列对加沙城一所学校的空袭导致约100人遇难，而以色列则声称死亡人数被夸大，死者中包括19名激进分子。现场视频显示，尸体碎片散落在废墟中，更多尸体被抬走并盖上毯子。空罐头躺在血泊中，烧焦的床

山柏
2025年05月24日
0
科技世界

以色列国防部长解析加沙未来的行动计划

以色列国防部长约阿夫·加兰特表示，在下一阶段的冲突中，以色列军队将在加沙北部采取规模较小的“新作战方式”。他说，只要有必要，以色列军队将继续在加沙南部与哈马斯作战。加兰特还概述了一旦哈马斯被击败后加沙将如何运作的建议，即以色列保持安全控制，而一个

梦槐
2025年05月24日
0
知识分享

乌克兰宣称成功打击俄罗斯先进战机

乌克兰表示，其部队击中了驻扎在距离前线近400英里的一个空军基地的一架超现代化的俄罗斯战机。此前，乌克兰的西方盟友允许基辅在俄罗斯境内使用武器进行有限的打击。基辅的主要军事情报机构星期天分享了卫星照片，称这些照片显示了袭击的后果。如果得到证实，这将标志着乌克兰首

中柯慧
2025年05月24日
0
作者专栏

司机在致命的KK交通事故中遇难

哥打京那巴鲁:8月30日，一名男子在班达尔·塞拉·泰利波克附近的一次车祸中失去对货车的控制，导致一名男子死亡。据报道，受害者是50岁的理查德·利纳辛，他的车在下午3点30分左右失去了控制，导致车在路边翻车。一位发言人说，来自林塔斯消防站的六名消防员

冷烟
2025年05月24日
0
常识科普

卡拉奇机场：男子因携带47张伪造签证被捕

卡拉奇，8月29日(ANI):一名乘客在卡拉奇真纳国际机场试图出国旅行时被逮捕，因为他的手机上发现了大量非法签证。这名男子名叫阿里扬·扎曼(AliyanZaman)，正要登上飞往马来西亚的航班时被移民官员拘留。经过进一步调查，发现他的手机里有47多个

佟佳森
2025年05月24日
1
知识分享

联邦调查局调查布鲁克林教堂，关注牧师与亚当斯前幕僚长的潜在商业关系

　　多名消息人士周五称，联邦调查人员正在调查另外两名与市长埃里克·亚当斯(EricAdams)有关系的人之间可能存在的商业和金融交易，他们分别是市长的前幕僚长和布鲁克林的一名牧师。据知情人士透露，联邦调查局最近向布鲁克林的一家天主教堂发出传票，要求提供其主要牧师之一杰米·吉安提洛(Ja

依灵
2025年05月24日
0
生活经验

截至6月，韩国财政赤字同比减小

这张未注明日期的照片显示的是位于行政中心城市世宗的教育部大楼的外观。(环境部经济及金融)周四公布的数据显示，在收入和支出下降的情况下，韩国2023年前六个月的财政赤字同比收窄。韩国经济和财政部(MinistryofEconomyandFinan

栋艳丽
2025年05月24日
0

发表回复

本站作者后才能评论

评论列表（4条）

丹琴 2025年05月24日

我是往来号的签约作者“丹琴”！

回复
丹琴 2025年05月24日

希望本篇文章《探索“草莓”：迈向具备思考能力的人工智能的初步尝试》能对你有所帮助！

回复
丹琴 2025年05月24日

本站[往来号]内容主要涵盖：国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

回复
丹琴 2025年05月24日

本文概览：　　有消息人士透露，ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。该项目的具体信息此前未曾披露，目前微软...

回复

探索“草莓”：迈向具备思考能力的人工智能的初步尝试

人工智能的挑战

本文作者

文章推荐

发表回复

评论列表（4条）

联系我们