💥🧲【浙商电子】OpenAI发布重磅原生多模态模型GPT-4o：实时语音对话和视觉识别，用户

jrxj · 发表于 2024-5-14 11:21:29

💥🧲【浙商电子】OpenAI发布重磅原生多模态模型GPT-4o：实时语音对话和视觉识别，用户可免费使用

OpenAI春季发布会发布全新多模态模型GPT-4o，是首个可实现语音、视觉和文本混合输入输出的多模态模型。亮点包括：

1⃣实时语音对话。官方演示中基于新模型的ChatGPT可实现平均320毫秒响应语音输入，较GPT-3.5（延迟2.8秒）和GPT-4（延迟5.4秒）提升显著。可随时打断模型语音输出，模型能够理解情感，并生成不同情感风格语音。

2⃣视觉能力提升。GPT-4o可实时识别手机相机中的内容，并给予准确答复，现场演示包括识别代码，解答数学题以及识别人脸的情绪。

3⃣所有用户可免费使用基于GPT-4o的新版ChatGPT，目前包括文本和图像功能，将在几周内推出基于GPT-4o语音模式的Alpha版本。

4⃣API更便宜、性能更优。开发者可通过API访问GPT-4o，价格是GPT-4 Turbo的一半，速度提升1倍，速率限制提升4倍。

5⃣️即将发布桌面客户端及web端新UI。OpenAI从今天开始逐步向Plus用户推出MacOS客户端，晚些时候推出Windows客户端，并更新web端UI便于客户使用。

【来源及风险提示】内容根据官网发布内容翻译而来，或因语法理解、翻译有误、翻译不完整等原因造成含义与公司表述有偏差的风险，仅供参考。
————————————
🟥🟦浙商电子蒋高振/安子超 18611396466

		自动登录	找回密码
密码			立即注册