未来科技绘画华为避开ChatGPT老路创新步伐

经历了上半年的喧嚣，ChatGPT带来的大模型热潮正在迎来第一轮冷静期。今年6月，ChatGPT的访问量首次出现了月度下滑，而年初接入ChatGPT聊天功能的新版必应（Microsoft Bing），市占率也在近期出现下滑，甚至低于改版之前。

一切都在预示着，大模型赛道“看热闹”的时刻过去了，市场正在对大模型的实用性提出更高的要求。与C端市场的集体狂欢相比，现在大家更关心大模型如何在B端行业落地，仅仅只会“Chat”（聊天）的解决方案已经满足不了需求。

新的竞争局势已经出现。就在刚刚过去的人工智能大会上，一批聚焦不同行业和场景的大模型开始涌现。从华为、腾讯、阿里到科大讯飞等等，都在试图让大模型在商用层面落地。而华为作为国内最早投入大模型研发的科技巨头，在2021年就推出了盘古大模型1.0。但是在今年的行业热潮中，却迟迟没有拿出来自自家的当家产品。

直到7月6日世界人工智能大会，华为轮值董事长胡厚崑才正式预告了盘古3.0的大型发布，并提到，将要走向深度应用，为产业升级赋能。在7月7日，在华为云开发者大会（HDC2023）上，华为云正式发布了盘古3.0版本。这一次，不是主打“聊天”，而是以专业能力和高度定制化功能性特征作为核心卖点。

据介绍，这不是一个单一的大模式，而是一系列集群和工程应用平台总称，其共分三个层级：底层通用、大型工业领域、中小企业精细化服务。此外，还有针对性的特调训练，可以通过SFT数据进行精调，以满足不同行业需求。

此外，由于不同的行业客户需求不同，比如铁路可能主要需要视觉处理能力，而气象可能主要需要科学计算能力，因此这款系统采用了一种分层解耦设计，使得用户可以按需取用每项服务，从而适应各行各业多样化需求。

依托全新的三层架构和分层解耦能力，这款系统核心定位是对各行各业进行赋能，其中专注于L0通用及L1通识水平。此外，它还采用超过30000亿个token预训练数据，以及超过1000TB训练所需算力，并且使用达芬奇架构昇腾芯片支持神经网络计算，其算力效率提升到了原有的基础之上。

正如任正非曾提到的，全AI时代将风起云涌，但其直接贡献对于人类社会来说不多，只有对于工业社会及农业社会才有显著影响。因此，该公司致力于深耕这些领域，以改变整个社会结构，是未来的重要趋势之一。

标签：天文学学术交流、杨勇辉国际学术交流中心、学术交流