OpenAI 将其 GPT-4.1 和 GPT-4.1 迷你模型引入 ChatGPT
OpenAI 宣布其旗舰模型 GPT-4.1 将应用于 ChatGPT。所有付费账户和团队用户均可在模型选择器下拉菜单中使用。OpenAI 透露,免费用户无法使用,但企业版和教育版用户可以访问。
所有用户(包括免费账户)的 GPT-4.0 mini 将替换为 GPT-4.1 mini。付费用户也将在下拉选择器中看到 GPT-4.1 mini 模型。
OpenAI 表示,GPT-4.1 mini 与 GPT-4.1 针对编码任务进行了优化,并增强了指令响应,性能优于 GPT-4.0。
OpenAI 的 GPT-4.1 全面超越 GPT-4.0
OpenAI 表示,GPT-4.1 模型提供了更大的上下文窗口,支持多达一百万个上下文标记,并且可以更好地利用具有长理解能力的上下文。这家 AI 公司补充说,软件工程师将受益于使用该模型开发 Web 应用程序。
OpenAI的发行说明透露,工程师可以使用该模型运行日常查询、后续问题、编码和其他复杂任务。
这家由 Sam Altman 领导的 AI 公司表示,与 GPT-4.0 的 128,000 个 token 限制相比,GPT-4.1 模型可以处理海量文本、图像和视频。据OpenAI其中,GPT-4.1 的 SWE-bench Verified 得分为 54.6%,比 GPT-4.0 提高了 21.4%,比 GPT-4.5 提高了 26.6%,成为编码任务的领先模型。
在 Scale 的 MultiChallenge 基准测试(衡量指令执行能力的指标)中,GPT-4.1 的得分为 38.3%,比 GPT-4.0 提高了 10.5%。此外,在多模态长上下文理解基准测试 Video MME 中,GPT-4.1 在长篇无字幕视频类别中取得了 72.0% 的高分,比 GPT-4.0 提高了 6.7%。
OpenAI 透露,基准测试提供了宝贵的见解,并且他们专注于实际应用来训练模型。该公司对开发者社区针对复杂任务优化模型表示感谢。
GPT-4.1 没有安全报告
人工智能研究界批评OpenAI在没有安全报告的情况下发布GPT-4.1模型,声称OpenAI模型的透明度标准降低了。
该人工智能公司辩称,尽管该模型比 GPT-4.0 提供了更高的性能和速度,但它并不像更先进的模型那样需要安全报告,因为它不是前沿模型。
GPT-4.1 没有引入新的模式或与模型交互的方式,在智能方面也没有超越 03。这意味着,这里的安全考虑虽然很重要,但与前沿模型有所不同。
–约翰内斯·海德克,Open AI 安全主管
这家人工智能科技公司发布了更多关于 GPT-4.1 的信息,以回应安全声明。周三,该公司承诺将及时公布其内部模型安全评估结果,以提高透明度。
该公司透露,它正在努力在这个日益拥挤的领域脱颖而出。这家人工智能公司据报道即将宣布以 30 亿美元收购最知名的 AI 编码工具之一 Windsurf。Windsurf 的竞争对手是另一款流行的 AI 编码工具 Cursor,以及微软和 Anthropic 等公司现有的 AI 编码功能。
Andrej Karpathy,前 OpenAI 创始人, 说Windsurf 是一款近几个月来备受开发者青睐的工具,用于快速编写新软件代码。这家初创公司的投资者包括 Founders Fund、General Catalyst、Greenoaks 和 Kleiner Perkins。
另一方面,谷歌更新了其 Gemini 聊天机器人,使其能够更轻松地连接到 GitHub 项目。此前,OpenAI 推出了一个 GitHub 连接器,用于ChatGPT深入研究。GitHub 连接器工具会搜索网络和其他来源,以编写有关某个主题的详尽研究报告。
周二,OpenAI 欢迎 SharePoint 和 Microsoft OneDrive 连接器加入 ChatGPT 深入研究。
Cryptopolitan 学院:厌倦了市场波动?了解 DeFi 如何助你建立稳定的被动收入。立即注册
(责任编辑:百科资讯)
-
本人有武汉公积金贷款因工作调动到荆州该怎么办?有什么好的办法吗。
项羽为什么没有做好?第一,利益分配不对,功劳是自己的,错误是部下的,这样的分配方式不可能有团队。...[详细]
-
恒逸石化:前瞻布局文莱炼化项目,打通产业链并持续发挥综合竞争优势
和橘子娱乐合作也意味着找到一个懂年轻人的玩家(下图是橘子娱乐的用户画像),这个时代最大的悲哀是,你失败不是因为做错什么,而是你老了! 纵观所有文娱产业中运营IP最为成熟还是(明星)娱...[详细]
-
Friend.Tech 開發團隊放棄合約控制權!FRIEND 代幣暴跌,麻吉大哥臉綠了
而且,现阶段中国乡村旅游市场的迅猛发展,还受到两个因素的带动: 1.中产阶级消费升级 一是迅速崛起的2亿城市中产阶级正在经历显著的消费升级。...[详细]
-
显然看清自己比什么都重要,当然,定位不是一种好高骛远,不切实际的定位,要站在行业的高度去做,或者比肩行业的领军人物作为标榜,毕竟站在金字塔顶端的寥寥无几,而在细分领域,则有无数个小山头让企业去选择,一...[详细]
-
当人类脱离了最基础的生存需求后,这种没有参照的虚脱感会给智慧生物带来无比的痛苦感,会使得思考本身成为自我认同的阻碍,感到焦虑不安没有方向。...[详细]
-
但是也不能跟我一样太纠结了,哈哈。...[详细]
-
Saving WBTC? Can the signature prize pool activities supported by Curve and Synthetix be successful?
从内容天花板来讲,“知识分子”如果定义为媒体,就没有什么空间,在短期内没有收入的可能。...[详细]
-
而我们再看《王者荣耀》,就会发现《王者荣耀》的平均时长只有20分钟左右,虽然20分钟看起来也有点长,但是这20分钟却是可预计的,极少出现一局打一小时的膀胱局,而养成类手游是不可能以20分钟为界限来...[详细]
-
沙龙讨论气氛和新媒体创业一样火热。...[详细]
-
狼人杀的走红的缘由无非是这两个方面。...[详细]