美国 AI 巨头 OpenAI 今日正式推出新一代旗舰人工智慧模型 GPT-5
并宣称该系统在智慧层级上远超以往所有版本。GPT-5 拥有顶尖的数学、程式编码、文学创作、视觉理解与健康咨询能力,将逐步取代 GPT-4o 成为 ChatGPT 的预设模型,并已开放给所有用户使用。
更聪明的统一系统:视情境动态选择推理模式
GPT-5 整合了能够解答大多数问题的智能高效模型,以及能够解决更复杂问题的更深层次的推理模型。系统会根据对话内容的难度与用户需求,自动在快速回应模式与「深度推理」(GPT-5 thinking) 模式间切换,确保在速度与深度间取得最佳平衡。若使用者在提示中写下「think hard about this」等指令,也可直接启用推理功能。即便在达到使用上限后,用户仍可使用 GPT-5 mini 服务,未来 OpenAI 也计划整合所有模型为单一结构。
广告 – 内文未完请往下滚动
GPT-5 在写作、程式与健康领域全方位升级
GPT-5 不仅在基准测试中超越了先前的模型,回答问题的速度也更快,重点是 GPT-5 显著减少了 AI 幻觉、提高指令执行能力和减少谄媚,同时提升了 GPT-5 在 ChatGPT 最常见的三个用途:写作、程式设计和健康中的表现。
编码能力史上最强,支援创建完整网页与游戏
GPT-5 是迄今最强的程式模型,特别擅长前端设计与大型代码仓库除错,甚至能仅凭一段提示就快速生成动画游戏或互动式网页,对排版、美感与空白留白的理解也大幅进步。
写作表现更具文学性,从电子邮件到诗歌都游刃有余
GPT-5 可协助用户将粗略构想转化为具节奏与深度的成品,能自然产出自由诗与无押韵诗体,支援报告、备忘录与演讲稿撰写,能够更可靠地处理结构模糊的写作。
健康领域跃进,能提出精确问题并避免错误建议
GPT-5 在医疗问答评测 HealthBench 上取得新高分,更能根据用户背景、知识水平与地理位置调整建议,成为「用户与医生间的沟通桥梁」,而非替代专业医师。
减少幻觉、提升理解:GPT-5 在多项测验上创下高分
在多项严谨的标准评测中,GPT-5 全面领先过去模型,包括:
- 数学竞赛 AIME:94.6% 正确率。
- 真实世界编码 SWE-Bench:74.9% 准确率,远超 GPT-4o。
- GPQA 博士级科学问答:88.4%。
- MMMU (大规模多学科多模态理解与推理):84.2% 准确率。
- HealthBench Hard 高难度医疗问答:46.2%,远胜 GPT-4o 的 31.6%
同时,GPT-5 在「诚实性」上也有重大突破。以往模型面对无解问题时常虚构答案,GPT-5 则更诚实地承认限制,AI 幻觉率从 GPT-4o 的 4.8% 降至 2.1%。
如何因应 AI 用于作恶?GPT-5 增强安全补全系统
OpenAI 同步更新 GPT-5 的安全训练机制,用户常会对 AI 询问一些「可能有害」的信息 (例如说要如何策划攻击)。当面对这种双重用途信息 (如病毒学或化学知识) 时,模型会选择「提供部分安全信息并拒绝解释细节」的中庸方案,减少过度拒答,同时降低滥用风险。
此外,GPT-5 相较 GPT-4o 不再「过度附和」用户,更能进行有思辨性的对话。OpenAI 表示与 GPT-4o 相比,GPT-5 不那么亲切,不必要的表情符号也更少。与其说是与 AI 对话,更像是与一位拥有博士级智力水平的乐于助人的朋友聊天。新版本也引入 4 种预设个性风格 (悲观者、机器人、聆听者、书呆子),让用户可自订 AI 的语气与互动方式。
GPT-5 Pro 为深度推理而生,千位专家给出评价
同步推出的 GPT-5 Pro 是升级版本,专为最复杂、最需要深度推理的任务设计。它在健康、数学与工程等领域表现尤为出色,并在千份实务评测中获得 67.8% 专家偏好评分,错误率更少 22%。
GPT-5 已全面上线,三个等级供用户玩转 AI
GPT-5 现已全面上线:
- 免费用户:预设使用 GPT-5,使用量有限,达上限后转为 GPT-5 mini。
- Plus 用户:每日使用量提升,可作为预设 AI 助手。
- Pro 用户:可使用 GPT-5 Pro,执行最复杂的任务。
- Team/Enterprise/Edu 用户:享有高上限与开发者支持,预计于一周内上限。
风险提示
加密货币投资具有高度风险,其价格可能波动剧烈,您可能损失全部本金。请谨慎评估风险。