ChatGPT-5没等到，o1-preview 和 o1-mini强势登场有何区别？如何获取 o1 中转API？阅读一篇就够了

这篇文章距离上次修改已过256天，其中的内容可能已经有所变动。

终于ChatGPT-5没有等来，却等来了o1-preview 和 o1-mini。很多人期待GPT-5能进一步突破认知极限，但出乎意料的是，GPT-5并没有按期发布，而市场上却出现了两个替代品：o1-preview 和 o1-mini。

这些产品的到来标志着AI的发展方向发生了某种转变。

如果你正在寻找API，我们也提供了官转方案：

GPTech API 转发地址：oneapi.huinong.co

o1模型能力评估结果

1. 学习推理能力

OpenAI o1：这是一个使用强化学习训练的大语言模型，专注于复杂推理能力的提升。它在回答问题之前会“先思考”，产生一条较长的推理链，然后再给出答案，使得推理能力更加准确和深入。

o1-preview是该模型的早期版本，目前已开放给ChatGPT Pro用户和API开发者使用。在编程和数学推理任务中表现优异，排名靠前，超过了普通的PhD水平。

o1模型在编程和数学推理任务中的表现

模型的训练方式是通过强化学习，教它如何在复杂问题中使用推理链。这使得模型在处理需要分步骤推理的任务时表现出色，能够逐步调整策略、修正错误。

o1的表现会随着训练和使用时间的增加而持续改善，这种强化学习过程的积累使它在复杂任务中表现得越来越好。

o1模型的强化学习方法

o1在多个推理任务上超越了GPT-4.0，特别是在需要复杂逻辑和多步骤推理的任务上，如数学和编程竞赛题。在高级数学、科学和物理问题上的表现超过了PhD水平。

在2024年的AIME考试中，o1的成绩为74%，在一致性较好的情况下达到了83%。在重新排名的1000个样本中，达到了93%的表现。

o1通过强化学习习得了“链式推理”的能力，即在回答问题之前，模型会生成一条详细的思维链，逐步解决问题。这种方法模仿了人类的思维过程，使得模型在处理复杂问题时更加有效。

在包含复杂推理任务的开放式问题上，o1-preview表现得更好，优于GPT-4.0，特别是在数据分析、编程、数学等需要深入推理的领域。

o1-preview在安全性上做了显著的改进，尤其是在内容生成的可控性方面。模型生成的推理链不会直接展示给用户，而是用于内部决策，确保生成的内容更加安全可靠。

在AI推理和复杂任务中，o1显著提升了推理能力。它的链式推理能力尤其表现突出，未来的改进版本将继续完善其推理能力和安全性。

o1及其后续版本有望解锁更多复杂领域的新应用，包括编程、数学和其他跨学科领域。

虽然像o1-preview 和 o1-mini这样的模型在性能和功能上都有显著提升，但高昂的成本可能成为许多用户的门槛。尤其对于个人开发者或小型团队来说，频繁使用这些大语言模型的成本可能超出预算。