华为不走ChatGPT老路,盘古3.0革新大模型应用
在上半年的热潮之后,ChatGPT带来的大模型热潮正在逐渐冷却。6月份,ChatGPT的访问量首次出现下滑,而微软推出的必应聊天功能也未能如预期般成功。市场正向着更高标准的实用性和落地能力转变。
与此同时,一批聚焦不同行业和场景的大模型开始崭露头角。华为、腾讯、阿里巴巴等科技巨头都在探索如何将大模型应用于商业领域,从而帮助用户解决实际问题。华为作为国内最早投入大模型研发的企业,其盘古系列产品已经迈出了重要一步。
7月6日,华为轮值董事长胡厚崑宣布了盘古3.0版本,并强调未来人工智能发展的关键是要“走深向实”,赋能产业升级。在7月7日举行的华为云开发者大会上,华为正式发布了盘古3.0版本,这一版本并不是主打聊天功能的大模型,而是以集群和工程应用平台形式出现,为不同的行业提供定制化服务。
据了解,盘古3.0采用三层架构,其中包括通用大模型、行业大模型以及细分场景模式,每个层级都有其独特之处。此外,该产品还引入了从通用到专精训练模式,以及针对性数据训练,以满足不同行业需求。此设计使得用户可以按需取用,不需要像之前那样购买一个庞大的系统。
值得一提的是,由于技术限制,华为不能使用通用的GPU架构,因此必须自建框架和平台。尽管如此,该公司仍然能够实现算力提升,并且宣布单集群2000P Flops算力的昇腾AI云服务已经上线。这表明,在未来的竞争中,除了技术创新之外,也需要考虑到成本效益的问题。
总体来说,大型科技公司正在从依赖单一聊天功能转向更加专业化、大规模、高效率的地面应用。大型语言处理器(LLaMA)可能会继续成为趋势,但它们需要被整合到具体业务流程中,以便真正产生价值。而对于那些希望利用这些技术进行基础设施更新或创新的企业来说,这种变化意味着他们可以期待得到更多关于如何有效利用这些工具来改善工作流程或提供新服务的信息。