充值积分切换到窄版

 找回密码
 立即注册
查看: 37|回复: 0

💥🧲【浙商电子】OpenAI发布重磅原生多模态模型GPT-4o:实时语音对话和视觉识别,用户

[复制链接]

581

主题

6

回帖

1893

积分

管理员

积分
1893
发表于 2024-5-14 11:21:29 | 显示全部楼层 |阅读模式
💥🧲【浙商电子】OpenAI发布重磅原生多模态模型GPT-4o:实时语音对话和视觉识别,用户可免费使用

OpenAI春季发布会发布全新多模态模型GPT-4o,是首个可实现语音、视觉和文本混合输入输出的多模态模型。亮点包括:

1⃣实时语音对话。官方演示中基于新模型的ChatGPT可实现平均320毫秒响应语音输入,较GPT-3.5(延迟2.8秒)和GPT-4(延迟5.4秒)提升显著。可随时打断模型语音输出,模型能够理解情感,并生成不同情感风格语音。

2⃣视觉能力提升。GPT-4o可实时识别手机相机中的内容,并给予准确答复,现场演示包括识别代码,解答数学题以及识别人脸的情绪。

3⃣所有用户可免费使用基于GPT-4o的新版ChatGPT,目前包括文本和图像功能,将在几周内推出基于GPT-4o语音模式的Alpha版本。

4⃣API更便宜、性能更优。开发者可通过API访问GPT-4o,价格是GPT-4 Turbo的一半,速度提升1倍,速率限制提升4倍。

5⃣️即将发布桌面客户端及web端新UI。OpenAI从今天开始逐步向Plus用户推出MacOS客户端,晚些时候推出Windows客户端,并更新web端UI便于客户使用。

【来源及风险提示】内容根据官网发布内容翻译而来,或因语法理解、翻译有误、翻译不完整等原因造成含义与公司表述有偏差的风险,仅供参考。
————————————
🟥🟦浙商电子 蒋高振/安子超 18611396466

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|购买会员|Archiver|手机版|小黑屋|金融学家-专业提供各个行业、公司的研究报告、分析报告

GMT+8, 2025-1-23 04:53 , Processed in 0.078887 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表