经历了上半年的喧嚣,ChatGPT带来的大模型热潮正在迎来第一轮冷静期。今年6月,ChatGPT的访问量首次出现了月度下滑,而年初接入ChatGPT聊天功能的新版必应(Microsoft Bing),市占率也在近期出现下滑,甚至低于改版之前。
一切都在预示着,大模型赛道“看热闹”的时刻过去了,市场正在对大模型的实用性提出更高的要求。与C端市场的集体狂欢相比,现在大家更关心大模型如何在B端行业落地,仅仅只会“Chat”(聊天)的解决方案已经满足不了需求。
新的竞争局势已经出现。就在刚刚过去的人工智能大会上,一批聚焦不同行业和场景的大模型开始涌现。从华为、腾讯、阿里到科大讯飞等等,都在试图让大模型在商用层面落地。而华为作为国内最早投入大模型研发的科技巨头,在2021年就推出了盘古大模型1.0。但是在今年的行业热潮中,却迟迟没有拿出来自自家的当家产品。
直到7月6日世界人工智能大会,华为轮值董事长胡厚崑才正式预告了盘古3.0的大型发布,并提到,将要走向深度应用,为产业升级赋能。在7月7日,在华为云开发者大会(HDC2023)上,华为云正式发布了盘古3.0版本。这一次,不是主打“聊天”,而是以专业能力和高度定制化功能性特征作为核心卖点。
据介绍,这不是一个单一的大模式,而是一系列集群和工程应用平台总称,其共分三个层级:底层通用、大型工业领域、中小企业精细化服务。此外,还有针对性的特调训练,可以通过SFT数据进行精调,以满足不同行业需求。
此外,由于不同的行业客户需求不同,比如铁路可能主要需要视觉处理能力,而气象可能主要需要科学计算能力,因此这款系统采用了一种分层解耦设计,使得用户可以按需取用每项服务,从而适应各行各业多样化需求。
依托全新的三层架构和分层解耦能力,这款系统核心定位是对各行各业进行赋能,其中专注于L0通用及L1通识水平。此外,它还采用超过30000亿个token预训练数据,以及超过1000TB训练所需算力,并且使用达芬奇架构昇腾芯片支持神经网络计算,其算力效率提升到了原有的基础之上。
正如任正非曾提到的,全AI时代将风起云涌,但其直接贡献对于人类社会来说不多,只有对于工业社会及农业社会才有显著影响。因此,该公司致力于深耕这些领域,以改变整个社会结构,是未来的重要趋势之一。