充值积分切换到窄版

 找回密码
 立即注册
查看: 292|回复: 0

【广发电子团队】Open AI发布"全能”模型GPT-4o,多模态推理性能大幅提升

[复制链接]

581

主题

6

回帖

1893

积分

管理员

积分
1893
发表于 2024-5-14 11:20:54 | 显示全部楼层 |阅读模式
【广发电子团队】Open AI发布"全能”模型GPT-4o,多模态推理性能大幅提升

Open AI发布“全能”模型GPT-4o
Open AI在春季新品发布会发布了新模型GPT-4o,"o"是"Omni(全能)"的缩写。新模型GPT-4o接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出;它可以在短至232毫秒、平均320毫秒的时间内响应音频输入,与人类在对话中的反应速度基本一致,实现了类似电影《her》的效果;且GPT-4o将对所有用户免费开放。

GPT-4o的优异多模态推理性能受益于单一模型解决方案
GPT-4o是跨文本、视觉和音频端到端训练而来的新模型,所有模态的输入和输出都由同一神经网络处理。相较于此前的多个模型协作的多模态推理形式(如GPT-4的多模态推理需要调用三个模型),GPT-4o的单一模型解决方案具有延迟低、可捕捉情感/笑声/音调等更多层次细节信息的明显优势。GPT-4o的实时多模态推理能力有望推动更多人机交互应用的落地普及。

推出新ChatGPT桌面应用程序
Open AI在发布会也推出了适用于macOS的新ChatGPT桌面应用程序,Mac端用户可通过快捷键即时向ChatGPT提问或进行语音对话;后续Open AI也会推出Windows版本应用程序。

投资建议:多模态AIGC技术的快速升级迭代有望带动AI手机、AIPC、智能耳机音箱及其他AI硬件的终端需求;同时云侧、端侧的算存连解决方案有望持续升级。建议关注终端产品需求的β型机会,如AI手机产业链、智能耳机/智能音箱产业链标的;以及受益于算力侧算存连持续量价齐升趋势的标的,如AI服务器产业链标的。
——————————————
AIGC软硬件协同发展、行业日新月异。详细研究和观点欢迎各位领导联系。

广发电子 王亮/耿正/任思儒

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|购买会员|Archiver|手机版|小黑屋|金融学家-专业提供各个行业、公司的研究报告、分析报告

GMT+8, 2025-1-23 07:53 , Processed in 0.078396 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表