面向NLP领域AI的探索 , 文心大模型跳出了以往大模型的窠臼 , 采用了知识增强这一全新技术路径 。 知识增强将百度在知识图谱、跨模态学习等领域的技术能力 , 与模型训练学习方面的产业积累结合 , 实现了更高效率的学习 , 令模型的理解与生成能力显著增强 。
这也很像人类学习的过程 , 具体信息的学习固然重要 , 同时知识与逻辑的学习也必不可少 。 知识既构成了人的通识能力基础 , 也可以显著提升具体能力的学习与应用 。 在大模型领域 , 知识与深度学习的结合起到了事半功倍的效果 。
与此同时 , 文心大模型还强化了跨语言、跨模态的学习能力 。 在技术的不断迭代之下 , 文心大模型的泛化能力更强 , 可以适应更具体真实的任务应用 , 尤其是处理小样本学习任务的能力 。
(鹏城-百度·文心模型结构图)
这条差异化之路 , 让鹏城-百度·文心千亿大模型可以实现更高效率的学习 , 并在同等参数空间下实现效果更优 , 并且符合真实场景的应用需求 。 而能够实现知识增强这条新路的开拓 , 得益于百度在知识、深度学习、以及模型开发训练并行且长期的布局积累 , 也得益于鹏城云脑Ⅱ提供的强大算力 。
中国AI的积累、实力与需求 , 共同构成了差异化之路的起点 。 从这个意义上来看 , 知识增强大模型的价值并不仅仅在大模型本身 。
走向通用:百度文心的应用拓展空间
BERT、GPT-3等大模型确实取得了惊人的效果 , 但大模型也经常因为应用上的滞后性引发质疑 。 其原因主要来自两方面:一是大模型的算力需求过大 , 成本高昂;二是大模型的泛化能力欠佳 , 经常难以解决应用场景中复杂多变的实际问题 。
面对这些问题 , 鹏城-百度·文心实现了更强的应用能力 。 在场景化应用方案中 , 鹏城-百度·文心可以实现多尺寸的模型蒸馏 , 甚至以极小尺寸适配具体需求 , 降低大模型使用门槛与成本 。
在通用能力上 , 通过与知识的结合加上跨语言、跨模态能力的融入 , 文心大模型可以适配更加多样化、通用化的任务 , 在通信、金融、医疗等领域具备广泛的应用前景与想象空间 。
鹏城-百度·文心在60多项国际著名任务上取得了领先优势 , 其中有30多项是小样本、零样本学习的任务 , 表明了鹏城-百度·文心的泛化应用能力更强 , 可以低门槛适配行业需求与行业能力 。
(鹏城-百度·文心小样本学习效果)
(鹏城-百度·文心零样本学习效果)
在金融领域 , 文心大模型赋能可以结合百度全流程AI开发平台BML提供的模型再训练能力 , 基于定制的保险合同条款“智能解析模型” , 完成一份合同内近40个类目条款的智能分类 , 让业务员处理单份合同文本的时长缩短到1分钟 , 速度提升几十倍 。 在智能客服领域 , 文心大模型可以有效提升服务的精准性 。 这一能力目前已经在浦发银行、中国联通等国内众多企业中得到应用 。
整体而言 , 文心大模型在相对复杂、有考验性的应用场景具备更加强大的表现 。 比如媒体创作、医疗文本分析、金融信息研判、合同分析等等 , 这些应用空间非常广阔 , 并且能够适配的AI技术净值很高 , 具有明确的商业化动力 。
AI正在走向工业大生产 , 其中核心就是让实验室中的强大AI能力 , 走入产业 , 拥抱真实需求 。 而这就需要大模型具备更强的通用化能力 , 鹏城-百度·文心正是踏出了这样的关键一步 。
文心之路 , 自立之路:中国AI的飞翔之地
从技术差异和应用场景出发 , 我们其实可以从鹏城-百度·文心和百度文心大模型里看到更远 。 如今 , 科技自立成为了时代潮流与企业责任 , 而到底什么是真正的科技自立呢?从鹏城-百度·文心中 , 我们或许能找到一些新的经验与标准 。
相关经验推荐
- 微信|微信更新内测版,OPPO Find N支持平板模式登陆
- 天玑9000|全球首款天玑9000手机,OPPO Find X5终于来了!
- 苹果|三星小米甘拜下风!苹果正式成为全球第一:iPhone 13迎来大降价
- 小米科技|实力媲美小米、TCL,国产彩电龙头走向全球,从海外赚回731亿
- 芯片|一家日本味精公司,却卡住了全球芯片企业的脖子,真的假的?
- 微软|微软改写全球科技行业格局,游戏成主角
- 家居|透过《2021年舒适家电白皮书》看家电企业如何向上生长?
- 微信|微信8.0.17更新!解锁超多功能!
- iPhone|全球手机市场排名重新洗牌:小米第三、三星第二、第一预料之中
- 小米科技|中国科技公司“新突破”,首发超宽频马达,常年稳居全球第一!
