号称“全能”的确不假。GPT-4o不仅能够实时处理文本、音频和图像，还采用全新的语音交互模式，大幅提升人机对话的响应速度，几乎与真人对话相差无几，它还会看人脸色、讲笑话……总之，AI更像人，甚至更像一个朋友了。在GPT-4o的“人性”背后，大模型正进入多模态发展的新阶段。模型不再追求长文本的单一的语言对话，视觉、语音乃至情感都成为模型参数中的关键。对如今的“百模大战”而言，这一变化是危机还是商机?

　　不少人有这样一个判断：2024会是推理的元年。据英伟达2023年财报电话会议披露，公司全年数据中心里已经有40%的收入来自推理业务，超出了绝大部分人预期。

　　让人没想到的是，推理端的爆发率先在大模型价格上卷了起来。今年5月，幻方、字节先后发布新模型，价格动辄市面上原有模型的1%。同时，智谱也官宣了新的价格体系，将入门级产品GLM-3 Turbo模型的价格下调了80%。

　　这样的趋势，同样也在国外发生。自去年以来，OpenAI已经进行了4次降价。在刚刚结束的春季功能更新会上，OpenAI宣布了其最新模型GPT-4o，不仅性能有大幅提升，价格也下调了50%。

　　那么，驱动这轮大模型推理成本下降的逻辑是什么?我们又应该如何理解推理成本下降对产业的意义?

降本超预期！GPT4一年降价超80%

　　从5月召开的发布会来看，各家在大模型价格上卷得越来越厉害了。

　　5月6日，幻方量化旗下DeepSeek(深度求索)发布第二代MoE模型DeepSeek-V2，该模型API定价为每百万Tokens输入1元、输出2元(32K上下文)，价格为GPT-4 Turbo的近百分之一。

　　5月11日，智谱大模型官宣新的价格体系，新注册用户可以获得额度从500万 tokens 提升至2500万 tokens，并且入门级产品GLM-3 Turbo模型调用价格从5元/百万Tokens降至1元/百万Tokens，降幅高达80%。

　　5月13日，OpenAI发布GPT-4o，不仅在功能上大幅超越GPT-4 Turbo，价格只有一半。

　　5月15日，豆包主力模型为0.0008元/千Tokens，即0.8厘就能处理1500多个汉字，宣称比行业便宜了99.3%。在32K(千字节)以下主力模型中，每1000 Tokens(大模型文本中的一个最小单位)的企业市场使用价格，GPT-4(美国AI研究公司OpenAI旗下的大模型)为0.42元，百度文心一言和阿里通义千问为0.12元。

　　可以看到，大模型降价既有GLM-3 Turbo这样的入门模型，也有像性能接近GPT-4 Turbo的主力模型。而从OpenAI过去一年的动作看，降价也一直其升级的主线。

　　算上此次GPT-4o的发布，2023年年初以来，OpenAI已经进行了4次降价。去年3月，OpenAI开放了gpt-3.5-turbo，每1000个token的成本为0.002美元，价格比此前的GPT-3.5模型下降了90%。

　　到去年11月，OpenAI发布了GPT-4 Turbo的同时，也对整个平台的价格做出了调整。其中，GPT-4 Turbo输入tokens价格是GPT-4的1/3，为0.01美元/1k tokens(折合人民币约0.07元)，输出tokens价格是其1/2，为，折合人民币约0.22元)。

编辑：菲菲

免责声明：文章转载自网络。文章内容不代表本站观点，本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺，仅供读者参考，风险自己甄别并承担后果；如有侵权请及时联系本站，我们会及时删除处理！

图文推荐

资讯

河南社旗县苗店镇：开展防汛应急演练筑牢汛期

产业

阳春市潭水镇盘新村：龙头企业带动鳜鱼苗种产业

图文推荐

相关阅读

资讯

产业

新闻排行