今年以来,以预训练大模型等为代表的新兴技术正在掀起新一轮人工智能热潮,百“模”共生,百家争鸣下,大模型的真正用处却依旧朦胧。在经历半年多的“狂飙”后,即便是曾经爆火的ChatGPT流量也不再继续。当C端热度逐渐褪去,产业界的噪音开始多了起来:仅凭聊天作画等功能,大模型就可以重构人类社会?人工智能的下一步该如何发展?
“盘古大模型不作诗,只做事。”7月7日下午,华为常务董事、华为云CEO张平安在华为开发者大会2023上再次明确了华为在大模型领域的定位,不做“ChatGPT”类产品。他表示,盘古大模型3.0是一个完全面向行业提供服务,以行业需求为基础设计的大模型体系。
在华为云看来,人工智能已经成为目前众多科技企业的战略竞争焦点,在与实体经济的结合中,行业大模型扮演着重要作用,这将带来更大的产业机会。不做“ChatGPT”
自2022年12月ChatGPT问世以来,AI大模式加速了新一代人工智能发展。当大模式和生成式AI技术不断取得突破,对于商业化运营中,将会产生何种效用的思考越发普遍。上述开发者大会中,华為认为,大モデル正在引領新一輪的人機互動,为用户帶來颠覆式使用體驗。如果說在PC時代,“鼠標圖形界面”開啟了第一次交互;“觸屏手勢”開啟了移動互聯時代,而「對話5G」則開啟了智慧互聯時代,這標誌就是以ChatGPT為代表的大モデル技術。
2015年12月,由硅谷企業家們開啟OpenAI引擎,並開始酝酿這個計畫。而前一年谷歌已經收購DeepMind,并且依靠DeepMind團隊研發AlphaGo在全球掀起了一場AI風暴。随后谷歌发布Transformer 大型语言处理神经网络,这成为了AI领域的一个重要里程碑。但令谷歌没有想到的是,这个里程碑成为了OpenAI滋养ChatGPT的大本营。
OpenAI火爆之后,也激发了科技巨头对大模式军备竞赛。今年3月,比亚迪发布文心,一言并开始将其融入比亚迪所有业务;4月,加利亚发布通义千问,并于6月将这个计划拓展至音视频领域。据不完全统计,当今仅国内已推出超过80个不同类型的大model产品,对应不同的行业、不同的应用场景,“百模之战”如同烈火般燃烧。
但當走得越久,在華為看來,就越應該保持冷靜。在6日舉行的人工智能世界大会上,由於現實情況要求樂觀又要保持冷靜,所以我們需要繼續推進深入到實際應用中的發展工作。“
從華為雲看來,它們已經有超過1000個項目與各行業合作,這也讓盤古系列能夠順利落地。此外任正非創始人的見解指出,他認為未來會有一場风波,但不是微軟獨有的戰爭,他們將專注於底層算力而非应用平台,因為他們相信自己的產品能夠獲得市場需求,即使只占據小部分市場份額也是好的。
張平安表示:“目前,大部分Big Model都集中於2C領域,而面向Industry時,由於資料獲取困難以及技術與行業知識結合困難,大Model 在Industry 的落地進展較慢。”
華為選擇透過兩種方式突破這些障礙。一是利用自身的人工智能芯片昇腾計算能力提供強大的算力支持;二是在多個場景中進行深耕研究。張迪煊稱:“我們現在已幫助孵化20餘個基礎Big Model,比如科學訊飛星火Big Model ‘’中國Big Model 中約有一半由昇腾支持”。
此外他還提到了盤古系列三層架構:
L0层包括自然语言、视觉、多模态、预测、科学计算五个基础big model,他们满足行业场景中的各种技能需求;
L1层是N个行业big model,可以通过公开数据进行训练,以政务金融制造矿山气象等特定工业数据作为输入;
L2层则针对具体业务或特定场景,如政务热线网点助手先导药物筛选传送带异物检测台风路径预测等,有针对性强力的解决方案。
總結而言,不僅僅是面向零基础工業客戶,也包括自己内部做big model應用的企業。
張平安展示了一些案例表明盤古系列已經覆蓋金融醫藥研發煤炭鐵路等眾多行業,其中一個成功案例是在藥物研發領域。大Model協助西安交通大學第一附屬醫院劉冰教授團隊找到全球40年來首個新的抗生素類別並將原先10年的時間降低到1個月,並減少成本70%。
值得注意的是除了華為cloud, 腾讯阿里字节360 等科技公司也看到了 行业端 的机会 并瞄向 行业 big models 进行布局。
"對話寫詩作畫絕不是 Big Models 的全部。我們需要去深入思考 Big Models 的應用方向。”邬贺铨院士認爲,要將 Big Models 切實投入到城市發展金融科技生物醫藥工業製造科學研究等領域,也需要專業企業和組織加速其在實體產業落地,用以服務社會並帶來實際價值。