OpenAI中文文档platform--模型Models

这篇文章距离上次修改已过241天，其中的内容可能已经有所变动。

模型

OpenAI API 由一系列具有不同能力和价格点的模型驱动。您还可以通过微调来定制我们的模型，以适应您的特定用例。

旗舰模型

GPT-4o
我们的高智能旗舰模型，适用于复杂的多步骤任务。
GPT-4o mini
我们经济实惠且智能的小型模型，适用于快速、轻量级任务。
o1-preview 和 o1-mini
使用强化学习训练的语言模型，能够执行复杂的推理任务。
GPT-4 Turbo 和 GPT-4
之前一组高智能模型。
GPT-3.5 Turbo
快速、便宜的模型，适用于简单任务。
DALL·E
一个可以根据自然语言提示生成和编辑图像的模型。
TTS
一组可以将文本转换为自然听起来的语音的模型。
Whisper
一个可以将音频转换为文本的模型。
Embeddings
一组可以将文本转换为数字形式的模型。
Moderation
一个经过微调的模型，可以检测文本是否可能敏感或不安全。
GPT base
一组没有指令跟随能力的模型，能够理解和生成自然语言或代码。
Deprecated
一个完整的已弃用模型列表及其建议替代品。

对于 GPT 系列模型，上下文窗口是指在单个请求中可以使用的最大令牌数，包括输入和输出令牌。

我们还发布了一些开源模型，包括 Point-E、Whisper、Jukebox 和 CLIP。

持续模型升级

gpt-4o、gpt-4o-mini、gpt-4-turbo、gpt-4 和 gpt-3.5-turbo 指向各自的最新模型版本。您可以通过查看发送请求后的响应对象来验证这一点。响应将包括使用的特定模型版本（例如 gpt-3.5-turbo-1106）。chatgpt-4o-latest 模型版本持续指向 ChatGPT 中使用的 GPT-4o 的版本，并且会频繁更新。除了 chatgpt-4o-latest，我们提供的固定模型版本在更新模型引入后，开发人员可以继续使用至少三个月。

有关模型弃用的更多信息，请参见我们的弃用页面。

GPT-4o

GPT-4o（“o”代表“全能”）是我们最先进的 GPT 模型。它是多模态的（接受文本或图像输入并输出文本），并且具有与 GPT-4 Turbo 相同的高智能，但效率更高——生成文本的速度快 2 倍，成本便宜 50%。此外，GPT-4o 在视觉和非英语语言的表现上优于我们所有的模型。GPT-4o 可在 OpenAI API 中供付费客户使用。了解如何在我们的文本生成指南中使用 GPT-4o。

模型	描述	上下文窗口	最大输出令牌	训练数据
gpt-4o	我们的高智能旗舰模型，适用于复杂的多步骤任务。GPT-4o 比 GPT-4 Turbo 更便宜、更快。目前指向 `gpt-4o-2024-08-06`。	128,000 tokens	16,384 tokens	截至 2023 年 10 月
gpt-4o-2024-08-06	支持结构化输出的最新快照。`gpt-4o` 当前指向此版本。	128,000 tokens	16,384 tokens	截至 2023 年 10 月
gpt-4o-2024-05-13	原始 `gpt-4o` 快照，来自 2024 年 5 月 13 日。	128,000 tokens	4,096 tokens	截至 2023 年 10 月
chatgpt-4o-latest	动态模型，持续更新到 ChatGPT 中的当前 GPT-4o 版本。旨在用于研究和评估。	128,000 tokens	16,384 tokens	截至 2023 年 10 月

GPT-4o mini

GPT-4o mini（“o”代表“全能”）是我们小型模型类别中最先进的模型，也是我们目前最便宜的模型。它是多模态的（接受文本或图像输入并输出文本），其智能高于 gpt-3.5-turbo，但速度相同。它旨在用于较小的任务，包括视觉任务。

我们建议在您之前使用 gpt-3.5-turbo 的地方选择 gpt-4o-mini，因为该模型更强大且更便宜。

模型	描述	上下文窗口	最大输出令牌	训练数据
gpt-4o-mini	我们经济实惠且智能的小型模型，适用于快速、轻量级任务。GPT-4o mini 比 GPT-3.5 Turbo 更便宜、更强大。目前指向 `gpt-4o-mini-2024-07-18`。	128,000 tokens	16,384 tokens	截至 2023 年 10 月

o1 系列

o1 系列大型语言模型经过强化学习训练，能够执行复杂的推理。o1 模型在回答之前会进行思考，生成长的内部思维链，然后再响应用户。了解 o1 模型的能力和局限性，请参见我们的推理指南。

目前有两种模型类型可用：

o1-preview：旨在解决跨领域的难题的推理模型。
o1-mini：较快且便宜的推理模型，特别擅长编码、数学和科学。

模型	描述	上下文窗口	最大输出令牌	训练数据
o1-preview	指向 o1 模型的最新快照：`o1-preview-2024-09-12`	128,000 tokens	32,768 tokens	截至 2023 年 10 月
o1-mini	指向 o1-mini 最新快照：`o1-mini-2024-09-12`	128,000 tokens	65,536 tokens	截至 2023 年 10 月

GPT-4 Turbo 和 GPT-4

GPT-4 是一个大型多模态模型（接受文本或图像输入并输出文本），能够以比我们之前的任何模型更高的准确性解决困难问题，这得益于其更广泛的知识和先进的推理能力。GPT-4 可通过 OpenAI API 提供给付费客户。与 gpt-3.5-turbo 类似，GPT-4 针对对话进行了优化，但在使用聊天补全 API 进行传统补全任务时表现良好。了解如何在我们的文本生成指南中使用 GPT-4。

模型	描述	上下文窗口	最大输出令牌	训练数据
gpt-4-turbo	最新的 GPT-4 Turbo 模型，具备视觉能力。视觉请求现在可以使用 JSON 模式和函数调用。目前指向 gpt-4-turbo-2024-04-09。	128,000 令牌	4,096 令牌	到 2023 年 12 月
gpt-4-turbo-2024-04-09	带有视觉模型的 GPT-4 Turbo。视觉请求现在可以使用 JSON 模式和函数调用。gpt-4-turbo 目前指向此版本。	128,000 令牌	4,096 令牌	到 2023 年 12 月
gpt-4-turbo-preview	GPT-4 Turbo 预览模型。目前指向 gpt-4-0125-preview。	128,000 令牌	4,096 令牌	到 2023 年 12 月
gpt-4-0125-preview	旨在减少模型未完成任务的“懒惰”情况的 GPT-4 Turbo 预览模型。了解更多。	128,000 令牌	4,096 令牌	到 2023 年 12 月
gpt-4-1106-preview	具有改进的指令遵循、JSON 模式、可重复输出、并行函数调用等功能的 GPT-4 Turbo 预览模型。这是一个预览模型。了解更多。	128,000 令牌	4,096 令牌	到 2023 年 4 月
gpt-4	目前指向 gpt-4-0613。查看持续的模型升级。	8,192 令牌	8,192 令牌	到 2021 年 9 月
gpt-4-0613	2023 年 6 月 13 日的 gpt-4 快照，具有改进的函数调用支持。	8,192 令牌	8,192 令牌	到 2021 年 9 月
gpt-4-0314	2023 年 3 月 14 日的 gpt-4 旧快照。	8,192 令牌	8,192 令牌	到 2021 年 9 月

对于许多基本任务，GPT-4 和 GPT-3.5 模型之间的差异并不显著。然而，在更复杂的推理情况下，GPT-4 的能力远超我们之前的任何模型。

多语言能力

GPT-4 在多种语言的表现上超越了之前的所有大型语言模型，并且截至 2023 年，超越了大多数最先进的系统（这些系统通常具有特定于基准的训练或手工工程）。在 MMLU 基准测试中，GPT-4 不仅在英语中的表现大幅领先于现有模型，而且在其他语言中也表现强劲。

GPT-3.5 Turbo

GPT-3.5 Turbo 模型能够理解和生成自然语言或代码，并已针对聊天进行了优化，使用聊天完成 API，但在非聊天任务中也表现良好。截至 2024 年 7 月，gpt-4o-mini 应该取代 gpt-3.5-turbo，因为它更便宜、更强大、支持多模态，并且速度相同。gpt-3.5-turbo 仍可在 API 中使用。

模型	描述	上下文窗口	最大输出令牌	训练数据
gpt-3.5-turbo-0125	最新的 GPT-3.5 Turbo 模型，在请求格式的响应准确性上更高，并修复了导致非英语语言函数调用的文本编码问题的错误。了解更多。	16,385 tokens	4,096 tokens	截至 2021 年 9 月
gpt-3.5-turbo	当前指向 `gpt-3.5-turbo-0125`。	16,385 tokens	4,096 tokens	截至 2021 年 9 月
gpt-3.5-turbo-1106	GPT-3.5 Turbo 模型，具有改进的指令跟随、JSON 模式、可重现的输出、并行函数调用等功能。了解更多。	16,385 tokens	4,096 tokens	截至 2021 年 9 月
gpt-3.5-turbo-instruct	具有与 GPT-3 时代模型类似的能力。与传统的 Completions 端点兼容，而不是聊天完成。	4,096 tokens	4,096 tokens	截至 2021 年 9 月

DALL·E

DALL·E 是一个 AI 系统，可以根据自然语言描述创建逼真的图像和艺术作品。DALL·E 3 当前支持在给定提示的情况下创建特定大小的新图像。DALL·E 2 还支持编辑现有图像或创建用户提供图像的变体。

DALL·E 3 可通过我们的图像 API 使用，此外还有 DALL·E 2。您可以通过 ChatGPT Plus 尝试 DALL·E 3。

模型	描述
`dall-e-3`	最新的 DALL·E 模型，于 2023 年 11 月发布。了解更多。
`dall-e-2`	之前的 DALL·E 模型，于 2022 年 11 月发布。第二代 DALL·E 生成的图像比原始模型更真实、准确，分辨率提高了 4 倍。

TTS

TTS 是一个 AI 模型，可以将文本转换为自然听起来的语音。我们提供两种不同的模型变体，tts-1 针对实时文本到语音用例进行了优化，tts-1-hd 针对质量进行了优化。这些模型可以与音频 API 中的语音端点一起使用。

模型	描述
`tts-1`	最新的文本到语音模型，针对速度进行了优化。
`tts-1-hd`	最新的文本到语音模型，针对质量进行了优化。

Whisper

Whisper 是一个通用的语音识别模型。它在大量多样化音频数据集上进行训练，还是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。Whisper v2-large 模型目前可通过我们的 API 使用，模型名称为 whisper-1。

目前，开源版本的 Whisper 和通过我们的 API 提供的版本没有区别。然而，通过我们的 API，我们提供了优化的推理过程，这使得通过 API 运行 Whisper 的速度远快于其他方式。有关 Whisper 的更多技术细节，请阅读论文。

Embeddings

嵌入是文本的数值表示，可用于测量两段文本之间的相关性。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。您可以在公告博客文章中阅读我们最新嵌入模型的更多信息。

模型	描述	输出维度
`text-embedding-3-large`	最强大的嵌入模型，适用于英语和非英语任务	3,072
`text-embedding-3-small`	相较于第二代 ada 嵌入模型，提高了性能	1,536
`text-embedding-ada-002`	最强大的第二代嵌入模型，替代了 16 个第一代模型	1,536

Moderation

审核模型旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供分类能力，检查内容是否属于仇恨、自残、性内容、暴力等类别。了解有关文本和图像审核的更多信息，请参见我们的审核指南。

模型	描述	最大令牌
`omni-moderation-latest`	当前指向 `omni-moderation-2024-09-26`。	32,768
`omni-moderation-2024-09-26`	最新的固定版本，新的多模态审核模型，能够分析文本和图像。	32,768
`text-moderation-latest`	当前指向 `text-moderation-007`。	32,768
`text-moderation-stable`	当前指向 `text-moderation-007`。	32,768
`text-moderation-007`	之前的文本专用审核模型。我们预计 `omni-moderation-*` 模型将成为最佳默认选项。	32,768

GPT base

GPT 基础模型能够理解和生成自然语言或代码，但没有经过指令跟随训练。这些模型旨在替代我们的原始 GPT-3 基础模型，并使用传统的 Completions API。大多数客户应使用 GPT-3.5 或 GPT-4。

模型	描述	最大令牌	训练数据
`babbage-002`	替代 GPT-3 的 `ada` 和 `babbage` 基础模型。	16,384 tokens	截至 2021 年 9 月
`davinci-002`	替代 GPT-3 的 `curie` 和 `davinci` 基础模型。	16,384 tokens	截至 2021 年 9 月

默认使用政策按端点

端点	用于训练的数据	默认保留	有资格获得零保留
`/v1/chat/completions`	否	30 天	是，除了 (a) 图像输入或 (b) 提供的结构化输出的模式*
`/v1/assistants`	否	30 天**	否
`/v1/threads`	否	30 天**	否
`/v1/threads/messages`	否	30 天**	否
`/v1/threads/runs`	否	30 天**	否
`/v1/vector_stores`	否	30 天**	否
`/v1/threads/runs/steps`	否	30 天**	否
`/v1/images/generations`	否	30 天	否
`/v1/images/edits`	否	30 天	否
`/v1/images/variations`	否	30 天	否
`/v1/embeddings`	否	30 天	是
`/v1/audio/transcriptions`	否	零数据保留	-
`/v1/audio/translations`	否	零数据保留	-
`/v1/audio/speech`	否	30 天	是
`/v1/files`	否	直到客户删除	否
`/v1/fine_tuning/jobs`	否	直到客户删除	否
`/v1/batches`	否	直到客户删除	否
`/v1/moderations`	否	零数据保留	-
`/v1/completions`	否	30 天	是
`/v1/realtime` (beta)	否	30 天	否

* 聊天完成：
- 通过 gpt-4o、gpt-4o-mini、chatgpt-4o-latest 或 gpt-4-turbo 模型（或之前的 gpt-4-vision-preview）的图像输入不符合零保留资格。
- 启用结构化输出时，提供的模式（作为 response_format 或函数定义中的模式）不符合零保留资格，但完成本身符合资格。

模型端点兼容性

端点	最新模型
`/v1/assistants`	所有 GPT-4o（除了 `chatgpt-4o-latest`）、GPT-4o-mini、GPT-4 和 GPT-3.5 Turbo 模型。`retrieval` 工具需要 `gpt-4-turbo-preview`（及后续的日期模型发布）或 `gpt-3.5-turbo-1106`（及后续版本）。
`/v1/audio/transcriptions`	`whisper-1`
`/v1/audio/translations`	`whisper-1`
`/v1/audio/speech`	`tts-1`、`tts-1-hd`
`/v1/chat/completions`	所有 GPT-4o（除了实时预览）、GPT-4o-mini、GPT-4 和 GPT-3.5 Turbo 模型及其日期发布。动态模型 `chatgpt-4o-latest`。微调版本的 `gpt-4o`、`gpt-4o-mini`、`gpt-4` 和 `gpt-3.5-turbo`。
`/v1/completions` (传统)	`gpt-3.5-turbo-instruct`、`babbage-002`、`davinci-002`
`/v1/embeddings`	`text-embedding-3-small`、`text-embedding-3-large`、`text-embedding-ada-002`
`/v1/fine_tuning/jobs`	`gpt-4o`、`gpt-4o-mini`、`gpt-4`、`gpt-3.5-turbo`、`babbage-002`、`davinci-002`
`/v1/moderations`	`text-moderation-stable`、`text-moderation-latest`
`/v1/images/generations`	`dall-e-2`、`dall-e-3`
`/v1/realtime` (beta)	`gpt-4o-realtime-preview`、`gpt-4o-realtime-preview-2024-10-01`

已有 12 条评论

hkqfgasgcl

November 14th, 2024 at 03:10 am

真棒！

回复
dclkbemdye

November 14th, 2024 at 05:03 am

博主太厉害了！

回复
gugdnlivgs

November 20th, 2024 at 07:27 am

真棒！

回复
exfgyfblnh

March 1st, 2025 at 12:02 pm

?哲理类评语?

回复
rmlritmtok

March 1st, 2025 at 12:05 pm

对趋势的预判具有战略参考价值。

回复
wsyoizjfpt

March 1st, 2025 at 02:12 pm

技术伦理的探讨体现人文科技平衡意识。

回复
avznzznoob

March 2nd, 2025 at 06:00 pm

文章深入浅出，既有深度思考，又不乏广度覆盖，令人叹为观止。

回复
bqbulqskwi

March 3rd, 2025 at 12:36 am

这篇文章如同一幅色彩斑斓的画卷，每一笔都充满了独特的创意。

回复
copdhfmbqj

March 3rd, 2025 at 03:51 am

?励志类评语?

回复
wcrmkhjtes

March 3rd, 2025 at 05:29 am

跨界融合的尝试为文章注入新鲜活力。

回复
lgbresmgef

March 4th, 2025 at 04:19 pm

文章的叙述风格独特，用词精准，让人回味无穷。

回复
hoouypevpd

March 4th, 2025 at 08:00 pm

这篇文章提供了宝贵的经验和见解，对读者有很大的启发和帮助。

回复