ChatGPT究竟智能在哪里?其通过交互式对话来逐步理清用户的意图,尤其针对一些比较复杂的意图,ChatGPT能够通过几轮的人机交互让用户讲清楚诉求,ChatGPT也能完全理解用户意图并给出相应回答。
4月8日,在人工智能大模型技术高峰论坛上,京东集团副总裁何晓冬表示,京东将在今年发布新一代大模型“ChatJD”,定位为产业版本ChatGPT。
两个月前,京东云曾公布过ChatJD的落地应用路线图“125”计划:一个平台、两个领域和五个应用。一个平台为ChatJD智能人机对话平台,即自然语言处理中理解和生成任务的对话平台,两个领域为零售和金融。五个应用包括内容生成、人机对话、用户意图理解、信息抽取和情感分类。
结合京东自身实践,京东大模型主要聚焦于文本、语音、对话和数字人生成等4个方面开展工作。例如在文本生成方面,京东于2019年开始自研,基于自研领域模型K-PLUG(参数量10亿),对于给定商品的sku自动生成长度不等的商品文案,包括商品标题(10个字)、商品卖点文案(100字)和商品直播文案(500字)三类,目前商品文案写作能力已覆盖2000多个京东的品类。
作为京东AI技术的带头人,何晓冬认为ChatGPT最大的创新在于文本内容生成。ChatGPT通过交互式对话来逐步理清用户的意图,尤其针对一些比较复杂的意图,ChatGPT能够通过几轮的人机交互让用户讲清楚诉求,ChatGPT也能完全理解用户意图并给出相应回答。再配合ChatGPT文本生成的高完整度,体验就到达了一个阈值,到了一个“令人惊艳”的水平。
从技术角度看,相较于之前大量使用的无监督深度学习算法,ChatGPT模型背后的算法和训练过程更加新颖,使用了半监督学习算法,尤其ChatGPT把生成的文本模型更加“组织化”,是非常大的技术创新。如果没有数据甄选,模型参数即便大十几倍,也很难达到这个效果。某种意义上,这其实是对过去一味追求(参数)“大”和追求无监督学习的一个路线修正。相较于GPT-3.5及ChatGPT主要处理文本数据,GPT-4是一个大型的多模态模型,提高了大模型的多模态处理能力。GPT-4可以支持图像和文本输入,并生成文本回复。在多种专业和学术考试方面达到人类水平,其逻辑分析能力更加全面,回答更有条理,理解更加准确,并拥有了识图能力。
记者了解到,在团队建设方面,当前京东AI研发团队主要成员为何晓冬、吴友政、张政臣和陈蒙。何晓冬于2018年加入京东,打造了言犀人工智能应用平台和系列产业和解决方案。公开资料显示,“言犀”目前服务覆盖5.8亿用户、880家金融机构、1821家大型企业、195万多家中小微企业。
吴友政目前为京东集团高级总监和京东科技语音语言算法部负责人。自2006年中科院博士毕业后,先后在日本国立信息通信研究机构、英国爱丁堡大学等机构从事自然语言处理相关研究工作。工作主要聚焦自然语言处理、人机对话、语音识别、机器翻译等技术研究和产品研发工作,他与团队合作打造了言犀人工智能应用平台。
张政臣现为京东语音合成产品负责人,先后工作于新加坡科技研究发展局和京东。2018年7月加入京东以来,他作为主要参与者参与了京东语音合成产品研发和销售的过程。其产品已经在言犀智能客服,京东金融、京东直播、京东智能音箱等内外部客户大规模应用。
陈蒙现为京东科技人机交互技术部负责人。2018年5月加入京东,现任京东科技人机交互技术部负责人。加入京东后,先后打造京东科技两大旗舰型产品-京小智和言犀的核心算法引擎,所研发的人机对话产品服务于京东的商家和用户。
除了京东外,多家互联网公司也发布了相关大模型产品。百度在3月16日发布了新一代大语言模型、生成式AI产品文心一言。3月30日,腾讯集团高级执行副总裁汤道生表示腾讯正在研发类ChatGPT聊天机器人。4月7日,阿里云宣布,自研大模型“通义千问”开始邀请用户测试体验。