华为云盘古大模型30:从ChatGPT到行业服务,AI之声
在中国航天日的背景下,我们回顾了华为云盘古大模型30的发布,它并没有成为中国版ChatGPT,而是以面向行业服务为基础设计的大模型体系。这种选择是否正确,值得深入探讨。
自2022年12月ChatGPT问世以来,AI大模型加速了新一代人工智能的发展。当大模型和生成式AI技术不断取得突破,众多行业人士纷纷开始思考大模型技术在商业化运营中,将会产生何种效用。在此背景下,华为云CEO张平安再次明确了华为在大模型领域的定位,不做“ChatGPT”类产品。
不做“ChatGPT”
自2015年12月OpenAI开启引擎至今,大模型技术已经成为全球科技公司竞争焦点之一。在这个过程中,“对话 5G”开启了智能互联时代,而“Transformer 大模型”成为了AlphaGo后续引领的人工智能新分水岭。但令谷歌没有想到的是,这个Transformer随后却成为了OpenAI滋养ChatGPT的土壤。
百度、阿里等国内企业也紧跟着发布自己的文心一言、通义千问,并将其融入各项业务。据统计,只有短短几个月时间,就有超过80个大型应用产品涌现出来,“百模大战”正在蓬勃发展,但这些都未能阻挡住华为对于这场竞赛态度上的谨慎。
从华为在大模型领域布局来看,他们立项于2020年,并于2021年4月发布“盘古大模型”,经过摸索和探索,他们逐步确立了这一领域新的定位。而现在,在7号发布的内容中,盘古工业界的大模式3.0升级后,将会是其“大的模式系列”的统称,从语言到视觉,再到具有特定属性的大型工业界案例,以及场景开发类别的服务,都将被包含其中。这意味着前期已有超过1000个项目落地,这些经验也将支持未来更多项目落实。
而任正非创始人的观点更进一步,他认为未来在AI、大型模式方面会风起云涌,不只是微软这样。他指出,对人类社会直接贡献可能不到2%,98%都是对工业社会、农业社会的促进。他强调,与应用平台不同的是,大型模式本身就是一个强大的底层算力平台,但应用平台不是他的选项。“我们占一点点就行。”
所以问题来了,大型模式如何从概念走向落地?张平安表示目前,大型模式几乎集中在C端市场上,而面向B端时,由于数据获取困难和与行业知多少结合困难,大型模式在B端市场中的落地较慢。因此,他提出了两个突破口:放大的来自人工智能芯片算力的优势,以及深耕多个场景进行训练,以达到真正能够满足实际需求的大规模服务能力。
此外他还提到了盘古的一套五N X架构,其中L0层包括自然语言、视觉、多模态预测科学计算五个基础类型;L1层则提供使用公开数据训练的大量行业通用类型;L2层则针对政务热线、网点助手等具体业务场景提供更加精细化的情境化解决方案,为客户提供"开箱即用的"解决方案。不仅如此,这套架构还覆盖金融制造医药研发煤矿铁路等诸多行业,比如药物研发周期缩短至一个月而成本降低70%的情况,也表明该系统已经具备很高效率和可靠性。
总结来说,即便是在今天这个充满激情与挑战的人工智能时代,也需要我们冷静下来思考到底什么才是真正意义上的创新与应用。大规模服务社会不应该仅仅停留于概念上,更应通过专业企业组织加速实体产业内落地,为我们的生活带来真实有效价值。