财新传媒
  • 分享到微信朋友圈
  • 新浪转发

巨量模型落地考 浪潮服务大脑如何跨越产业鸿沟

来源于 《财新周刊》 2022年第50期 出版日期 2022年12月26日

  [市场企划]

  AI产业化落地的路径逐渐清晰。半年前,浪潮信息在“源”大模型的基础上,推出了四个技能大模型,使得过去动辄几个月甚至几年的大模型开发训练周期,缩短至不足一个月。

 
  虽然AI深度学习的发展已经到了令人赞叹的地步,但是,在一些专业领域,AI落地仍遇到瓶颈,一直未有大的突破。数据显示,2018年人工智能的行业渗透率仅4%,2021年这个数据也才7%。有知名人士预测,2026年人工智能的行业渗透率将达到20%。

  “让行业用户甚至是中小用户也能利用大模型开展深度创新,从而加速整个社会的智能化升级。”浪潮信息副总裁刘军在技能大模型推出时这样表示。半年后,“深度创新”得以在浪潮智能客服领域实现。智能客服大脑不仅支持自然语言交互服务、智能运维与诊断,还支持对专家工程师、备品备件等资源的智能管理与调度。

  这是浪潮信息走出的一小步,未来能否将这一成功模式在其他行业进行复制?“大模型“的创新路径能走多远?能否借助大模型的智能化生产力,从智能感知、智能交互和智能决策等层面,帮助企业实现“降成、增效、创新”?

  AI落地正在迎来新的大考,拭目以待。

以巨量模型做引擎,AI不再“装烟囱”

  在工业领域如制造业、物流等行业,AI落地为何举步维艰?原因是,专业性以及由此带来的多场景化是一道巨大的门槛。

  “2019年我们就上线了任务式对话、知识图谱等多种类型机器人。”浪潮信息服务总监陈彬在谈到智能客服系统时指出,基本上市场迭代过的机器人浪潮信息都落地使用过。

  当时,浪潮信息用多个小模型、小知识库搭建系统以此来完成不同的任务。不过,设计者很快发现,这样的系统搭建目前已经走到了一个瓶颈期,无法达到理想中的智能化程度。

  “在引入大模型之前,我们还是遇到了比较大的困难。”陈彬解释说,IT行业的技术问题大多呈现专业度高、复杂度高的特点,不仅需要专业技术人员参与训练,更多的问题需要经过多轮对话之后才能理解客户真实的服务意图。“如何让机器人学会引导客户提问,学会结合上下文语义理解就是一大难点。”

  智能客服的另一大难点源自浪潮信息强大的背景。浪潮信息是中国大型的AI、边缘和云服务器提供商,IDC2022年8月发布的2021H2《全球人工智能市场半年度追踪报告》(Worldwide Semiannual Artificial Intelligence Tracker)显示,2021全年,浪潮信息在全球人工智能服务器市场占有率达20.9%,保持全球市场第一。在此境况下,浪潮服务团队不仅面临高强度的服务压力,还需要在专业壁垒高、低容错率的服务要求下,以数字化、智能化技术提升服务全流程的质效水平。除此之外,浪潮信息的数据中心业务涉及多元业务流程、硬件和软件的交叉,也使得智能系统在实际业务中面临着一个比C端更复杂的场景。

  按照传统的AI模式,每个知识库都需要人工或半人工搭建,维护成本非常高。经过多年的持续建设后,还会形成重重烟囱式系统,导致客户体验参差不齐。

  近几年,IT巨头纷纷推出的巨量模型也让AI产业落地找到了新的方向。浪潮信息和谷歌、微软、阿里这些国内外AI 头部企业纷纷加码巨量模型的投入与研发。从OpenAI 的 GPT-3 ,到DeepMind 的 Gopher ,再到浪潮信息2021年推出的全球最大的中文单体巨量模型源1.0,模型的参数越来越高,耗资也越来越大。

  “大模型并不是新一轮的炫技,它更多源于人工智能产业的现实需求。”刘军指出,AI应用场景已经从碎片化过渡到深度融合的一体化,在算法模型方面,巨量模型将会成为AI算法规模化创新的基础。

打破传统多模型驱动,革新训练模式

  自己造的降落伞要自己先跳。浪潮信息一直秉承这样一个理念。他们试图寻找这样一种融合:以“源”大模型为引擎,以专业的服务平台为基座,通过知识积累和团队合作,在其熟悉的智能客服领域打造出“智能客服大脑”。

  如何将大模型与契合场景需求的行业模型进行结合?浪潮信息在这方面开启了先河。“把一个小孩从小学培养到大学,完成通识教育,再让他学习IT运维的专业知识。”陈彬解释说,“按照这样的方式将AI训练分为两个层次后,极大减轻了我们业务侧的训练负担。”

  “源”大模型有着深厚的学术根基。他总共阅读过大约 2000 亿词,是全球大型中文数据集。假如一个成年人一年读100本20 万字书, 2000 亿词需要一万年才能读完。在一项中文语言理解测评上,他有10项子任务获得冠军,在成语阅读理解填空项目中,表现更是超越了人类智能。

  浪潮信息给这位“大学生”准备了充足的专业知识库,包括2万余份产品文档、用户手册,百万余条浪潮信息专家工程师服务对话、数十万份日志、工单数据等。

  凭借“源“强大的学习能力,智能客服大脑能够对上述知识库进行自主化学习,不再需要人工进行一条条的问答填充和标注,由此给“训练”带来了颠覆式的变革。

  在谈到“源”大模型给智能客服带来的收益和成效时,陈彬介绍说,以往智能客服是多模型、多数据库的,技术架构相对复杂,维护难度非常大。升级为大模型驱动则将传统烟囱式的、碎片化的AI应用开发转向了集中式开发,有效缓解了碎片化开发反复建模的困境。

  “以前我们每周都要让技术专家花费将近20多个小时,来做机器人训练,现在这部分时间被完全解放出来。”陈彬进一步指出,“智能客服大脑还支持对企业文档、知识库和内部的产品资料的同步学习能力,让我们的智能客服保证专业知识的实时更新。”

  可以说,浪潮信息打造了一个全流程的智能客服大脑。通过知识蒸馏、压缩等技术,“大脑”实现了知识编码、智能问答、知识抽取、故障推理等多种能力。凭借强大的智能交互水平,实现了对用户问题更高精度的回答。

  在此基础上打造的“源晓服”也已经成长为一位专家级智能客服机器人,不仅可以对一些复杂的技术咨询进行智能提问引导,还能针对问题进行精准定位,给出专业解答。“源晓服”管理浪潮信息八大产品线的技术售后,覆盖终端用户92%的咨询问题。对于一些常见技术问题,如系统安装、Raid配置、部件异常等问题,“源晓服”的解决率高达80%。

  “这意味着我们的智能客服不仅要理解客户所问的问题,定位出客户所问问题的方向和归类,还能给出精练的、正确的和贴切的答案。”陈彬进一步补充说,“‘源晓服’可以在最大程度上减少客户在对话交流中花费的时间。”数据显示,和人工客服需要10分钟才能解决的事在智能客服中可能10秒钟就可以得到解决。

构建行业智能引擎,推进AI落地走向深水区

  在业内人士看来,智能客服大脑无疑是巨量模型与应用场景融合的又一成功案例。从数字化转型到推出巨量模型再到智能客服大脑,浪潮信息不断推进AI应用走向深水区。

  目前,智能客服大脑不仅支持自然语言交互服务、也能够实现对已授权IT设备的智能运维与诊断,还可以支持对专家工程师、备品备件等资源的智能管理与调度,已然成为支撑浪潮信息服务智能化转型的核心“大脑”。据陈彬介绍,智能客服大脑目前以InService平台为载体对外提供服务,该平台免费开放给浪潮信息的客户使用。

  “‘源’大模型十分受到行业关注。在交通、金融、医疗等行业,很多客户在寻求合作。”吴韶华表示,有医疗机构的客户基于“源”大模型做的医生助手对话机器人,也有偏于娱乐方向的客户,做剧本杀机器人等。

  浪潮信息构建了“行业大脑”的解决方案,可以直接面向企业,以标准化的流程助力企业构建满足自身需求的“行业大脑”。这个解决方案指的是浪潮信息基于“源”大模型构建的行业认知智能引擎,包含智能数据中心、智能知识中心、大模型算法基础设施、AI应用平台。这个智能引擎未来将充分适配多行业,打通企业数据闭环和多类业务场景。

  AI落地的成效正在从浪潮信息的智能客服领域,向其他行业延伸。智能客服大脑不仅是浪潮信息业务转型的一个重要尝试,也是行业内关于巨量模型的一个新的探索。意味着“大模型”可以不再停留在实验室,而是真正的开始赋能行业。

  *本文刊发在财新市场企划版块,不代表《财新周刊》编辑部观点

推广

财新网主编精选版电邮 样例
财新网新闻版电邮全新升级!财新网主编精心编写,每个工作日定时投递,篇篇重磅,可信可引。
订阅