充值积分切换到窄版

 找回密码
 立即注册
查看: 95|回复: 0

中信建投:预计Open AI开发者大会推出含内存存储的API等更新

[复制链接]

581

主题

6

回帖

1893

积分

管理员

积分
1893
发表于 2023-11-6 09:42:27 | 显示全部楼层 |阅读模式

中信建投:预计Open AI开发者大会推出含内存存储的API等更新

简评:

我们预计开发者大会可能发布公司在GPT-4、DALL•E等模型的新进展,主要包括:1)发布内存存储API,减少重复上传历史文本带来的token耗用,从而降低API调用成本;2)持续推进多模态布局,推出GPT-4 V和DALL•E 3的API调用服务等。

1、内存存储API有望有效降低API调用成本

目前大量token用于历史文本传输,内存存储API有望降低API调用成本达95%。据公司官网,目前通过GPT-4、GPT-3.5Turbo上传750词的文档分别需要0.06、0.003美元(以最高速度计算)。2023年6月,公司CEO Sam Altman接受AI开发平台Humanloop采访时曾透露公司的发展路线图,包括推出“有记忆的API”,解决大量token用于历史文本传输的情况。据路透社,内存存储API可能在开发者大会中推出,提高大模型计算速度,降低开发者的API调用成本达95%。

1)降低API调用成本:当前运行AI应用时,都需要将其历史记录通过API上传至大模型,以便大模型依据历史记录进行内容生成,导致大量token用于历史记录传输。内存存储API推出后,使用AI应用时,只需通过API上传最新的对话记录,大模型即可结合该记录和其维护的历史记录,生成新的内容,以此降低token使用量。

2)提高大模型计算速度:内存存储API推出后,大模型只需进行新记录的计算,无需对历史记录进行重复计算,可以提高计算速度,减小算力浪费。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|购买会员|Archiver|手机版|小黑屋|金融学家-专业提供各个行业、公司的研究报告、分析报告

GMT+8, 2025-1-23 10:41 , Processed in 0.107948 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表