腾讯在一年一度的全球数字生态大会上 正式“亮相”了自己的混元大模型
发布时间:2023-09-08 21:27:25|来源:搜狐新闻|作者:

  腾讯云的目标是实现盈亏平衡,对于目前的盈利情况,汤道生向澎湃新闻记者透露,今年腾讯云整体毛利率实现非常大的增长,在供应链管理、亏损业务的管理上都取得较好进展,“盈亏平衡是我们追求的结果,但在实际管理中我们是要拆分为不同的产品、不同的赛道。”

  他认为,对于需要培育和发展的产品,要给予更长跑道和更大宽容度,对于一些相对成熟、产生利润的产品,则要提出更高要求。

  今年6月,在2023腾讯股东大会上,当被问及大模型进展时,马化腾曾说,“我们一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示。”

  如今虽迟但到,鹅厂终于也推出了自己的通用大模型。9月7日,腾讯在一年一度的全球数字生态大会上,正式“亮相”了自己的混元大模型。

  腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生介绍:混元大模型通过腾讯云对外开放,并已接入了腾讯广告、游戏、金融科技、腾讯会议、微信搜一搜等产品。

  汤道生表示,该大模型产品是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,将作为腾讯云MaaS服务的底座,支持API直接调用,以及专属大模型产品应用构建。

  如今一个普遍行业共识是:大模型正在改变云生态。它有可能成为互联网云厂商在价格战之外谋求份额增长的新动力,并为云计算行业带来全新的变革契机。

  而在今年以来,腾讯云在公有云业务(IaaS+PaaS)市场份额下降的现实基础上,抓住此次时机,也显得尤为重要。腾讯云总裁邱跃鹏也在会上表示:“云是大模型的最佳载体,大模型将开创下一代云服务的全新形态。”

为何腾讯姗姗来迟

  据赛迪顾问数据显示,截至 2023 年 7 月,中国累计已经有130个大模型问世。

  今年上半年,在百度、阿里等一众大厂争发大模型之时,“不赶风头”的鹅厂,显得较为谨慎。不过相较于各家大厂普遍踏足的通用大模型,腾讯从一开始就把大模型重心引向了B端应用。

  6月19日,腾讯云首次公布了行业大模型进度,发布了TO B客户解决方案:腾讯云MaaS(Model-as-a-Service,模型即服务),覆盖了金融、文旅、政务、传媒、教育等10大行业的多个模型,并提供了超过50个解决方案。

  那时,行业和客户已经有很多关于大模型的需求。在经历几个月的在腾讯文档、会议等应用磨练后,腾讯才终于有信心把大模型开放出来,服务更多企业。

  ▲图注:腾讯集团副总裁蒋杰

  据腾讯副总裁蒋杰介绍,彼时,已经收到了很多客户需求询问,但还没有对模型进行全面深度的评测,处于半研发半应用的阶段。

  “腾讯的混元的大模型的体系,一开始不光是为了业界做一个发布,甚至评测、去打榜,我们一开始就是根据腾讯企业自己的自身的应用,去做了一个这样的研发和匹配,去做一些跟大模型更深度结合的应用,才能够去抵消整个大模型高昂的设备、训练、人员的成本。”蒋杰说。

  早在2022年4月,腾讯首次对外披露了旗下“混元”AI大模型的研发进展,完整覆盖了NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业模型。但类chat大语言模型则是迟迟未推出。

  事实上,过早地推出大模型,也容易“翻车”,出现“幻觉”。

  所谓“幻觉”,简单说就是大模型“胡言乱语”。为了确保大模型更加可靠,降低“幻觉率”是大语言模型的重中之重,即便不能彻底解决,但也尽力从概率上降到最低。

  据介绍,腾讯混元的“幻觉率”相比主流开源大模型可降低30%至50%, 用的是自研的“探真”技术来解决“幻觉”。

  “外界其实一般多会用到知识图谱,甚至搜索外挂来让模型的检索支持能力变得更强,腾讯也会用,但不能用的比例很高。我们一定要在整个的大模型的预训练阶段把这个问题解决掉,控制掉。现在看到很多家开源模型和厂家发布的模型,搜索增强用到10%以上甚至更多,但这个会导致出现不一样的幻觉。”蒋杰说。

编辑:菲菲
免责声明:文章转载自网络。文章内容不代表本站观点,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,风险自己甄别并承担后果;如有侵权请及时联系本站,我们会及时删除处理!

图文推荐

相关阅读

资讯

产业

新闻排行