充值积分切换到窄版

 找回密码
 立即注册
查看: 127|回复: 0

❗OpenAI发布会总结: 视觉声音混合多模态+极快响应速度+成本下降50%,Her时刻来临,重

[复制链接]

581

主题

6

回帖

1893

积分

管理员

积分
1893
发表于 2024-5-14 11:22:23 | 显示全部楼层 |阅读模式
❗OpenAI发布会总结: 视觉声音混合多模态+极快响应速度+成本下降50%,Her时刻来临,重申全面看多AI板块【天风计算机】

#OpenAI发布会发布全新SOTA模型GPT-4o
本次更新发布了新端到端多模态大模型GPT-4o模型与API,模型本身在GPT-4tuibo基础上实现了视觉-音频的混合多模态功能,输入端接受文字/视觉(图与视频)/音频,输出端同样也可以文字/视觉/音频,同时响应速度仅320毫秒(之前GPT-4为5.4秒),模型在非英语语言上也有极大的提升,同时GPT-4o的API价格便宜50%,速度限制提高5倍。

#GPT-4o在现场完成实时多模态交互
GPT-4o可以实现快速的人机交互,发布会上,OpenAI展示了复杂的实时对话、语音翻译、视频交互等功能。语音交互十分流畅,无需等待回复加载,GPT通过音频可感知并提供各种情绪;翻译可以实现实时同声传译;视频交互则表现出复杂的多模态融合交互,包括现场写方程与ChatGPT沟通解法,根据视频拍摄内容给出情感反馈;可语音互动沟通代码内容,并解释分析代码生成的图表等。真正的个人助手时代有望到来

#个人助手时代加速来临
GPT-4o展示了桌面端与手机端的终端,用户可以通过音频与OpenAI完成多种模态的复杂交互,《Her》时代加速来临。我们预计GPT-4o将加速AGI与智能交互的时代到来,看好包括AI音频、AI个人助手等方向的应用与算力板块反弹。

推荐关注
1.应用:(1)办公软件:金山办公、福昕软件、彩讯股份
(2)多模态:万兴科技、美图公司、虹软科技、光云科技
(3)TO B:鼎捷软件、用友网络、金蝶国际、致远互联、泛微网络、汉得信息
(4)金融、教育、医疗:科大讯飞、佳发教育、视源股份、润达医疗、恒生电子、新致软件
2.基础设施:华为+海光算力产业链、云天励飞、星环科技、寒武纪、景嘉微

欢迎交流!
缪欣君/刘鉴18501700231

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|购买会员|Archiver|手机版|小黑屋|金融学家-专业提供各个行业、公司的研究报告、分析报告

GMT+8, 2025-1-23 04:53 , Processed in 0.078022 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表