OpenAI o3 AI 模型突破推理极限背后:成本飙升,没“钞能力”用不起
作者:暴走手游网时间:2024-12-26 12:16:17
本站 12 月 24 日消息,科技媒体 TechCrunch 昨日(12 月 23 日)发布博文,认为 OpenAI 的 o3 模型虽然在 ARC-AGI 等测试中取得了亮眼成绩,但背后的高计算成本,让其短期内很难在实际应用中普及。
o3 性能
o3 的新功能之一是可以调整推理时间,分为低、中、高三种计算级别,计算级别越高,o3 的任务执行性能越好。
而 o3 是 OpenAI 是迈向该目标的重要一步,在 ARC-AGI 基准测试中,o3 在高计算设置下获得了 87.5% 的分数,在低计算设置下得分为 75.7%,性能是 o1 的三倍。
在 EpochAI 的 Frontier Math 基准测试中,o3 解决了 25.2% 的问题(其他模型均不超过 2%),创造了新纪录。
o3 模型成本过高
ARC-AGI 基准测试的创建者 François Chollet 在博文中写道,OpenAI 的 o3 模型虽然是 AI 领域的一个重要突破,但成本着实太高。
根据 ARC-AGI 测试的性能图标,o3 的高分版本每项任务都使用了价值超过 1000 美元(本站备注:当前约 7303 元人民币)的计算资源,o1 模型每个任务使用约 5 美元的计算资源,而 o1-mini 仅使用几美分。
这意味着 OpenAI 虽然获得了将近 88% 的高分,但却消耗了 170 多倍的计算资源,而高计算版本 o3 整个测试下来,调用资源成本超过 1 万美元(当前约 73033 元人民币),只有财力雄厚的机构和个人才能负担得起 o3 模型的使用成本。
o3 模型的高计算成本使其更适合处理复杂问题,例如长期战略决策,而非日常小问题;更高效的 AI 推理芯片和更具成本效益的 AI 芯片可能是未来降低 o3 模型使用成本的关键。
相关文章
-
机械革命 CES 2025 新品预热:内吹散热,满血双烤 40+dB
本站 12 月 27 日消息,机械革命即将亮相CES 2025国际消费类电子产品展览会,并在同期举办 2025 年重磅新品品鉴会,本站届时将为大家带来详细报道。机械革命今天放出了一张海报,展示了一款将
-
零跑朱江明:未来三年会有 ABCD 四个系列,用十三四款车布满 6 万 - 30 万元市场
本站 12 月 27 日消息,零跑汽车日前迎来造车 9 周年,据晚点 Auto 今日报道,零跑汽车创始人、董事长、CEO 朱江明在接受采访时透露,零跑未来三年会有 A、B、C、D 四个系列,用十三四款
-
领克汽车首款大型高端插混 SUV 预热,2025 年初正式亮相
本站 12 月 27 日消息,领克汽车刚刚发布了一段新的预热短片,展示了“领克首款大型高端插混 SUV”的前脸设计。可以看到,这款车型车顶配备了激光雷达,预示其将具备高阶智驾能力。官方此前表示,这是领
-
国产首款自研 600 公斤推力级涡扇发动机首次点火启动:预计 2025 年 6 月完成首飞,2026 年完成定型
本站 12 月 27 日消息,据央视新闻报道,中国航空发动机集团开发的国产首款自研 600 公斤推力级涡扇发动机今日完成首次点火启动。本站查询官方资料获悉,该款涡扇发动机具有高空 1 5 万米以上、高
-
重庆江北国际机场第四跑道正式启用,东航 C919 执飞首个航班
本站 12 月 27 日消息,重庆江北国际机场新建第四跑道于 12 月 26 日正式启用,江北国际机场成为中西部地区首个、全国继上海浦东、北京大兴机场之后第 3 个拥有四条跑道且同时运行的机场。东方航
-
腾势 Z9GT 推送 OTA 升级:城市领航全国用户全量推送
感谢本站网友 朱丶工作室 的线索投递! 本站 12 月 27 日消息,腾势汽车今天宣布,腾势 Z9GT 开启 OTA 年末大升级,本站汇总更新内容如下:城