7月7日,在華為開發者大會 2023 上,華為云盤古大模型3.0亮相。
華為常務董事、華為云CEO張平安介紹道,華為云盤古大模型3.0是一個完全面向行業的大模型系列,包括“5+N+X”三層架構:L0層的基礎大模型、L1層行業大模型以及L2層場景模型。
L0層包括自然語言、視覺、多模態、預測、科學計算五個基礎大模型,提供滿足行業場景中的多種技能需求。盤古3.0為客戶提供100億參數、380億參數、710參數和1000億參數的系列化基礎大模型,匹配客戶不同場景、不同時延、不同響應速度的行業多樣化需求。同時提供全新能力集,包括NLP大模型的知識問答、文案生成、代碼生成,以及多模態大模型的圖像生成、圖像理解等能力,這些技能都可以供客戶和伙伴企業直接調用。無論多大參數規模的大模型,盤古提供一致的能力集。
(資料圖片)
L1層是N個行業大模型,華為云既可以提供使用行業公開數據訓練的行業通用大模型,包括政務,金融,制造,礦山,氣象等大模型;也可以基于行業客戶的自有數據,在盤古大模型的L0和L1層上,為客戶訓練自己的專有大模型。
L2層為客戶提供了更多細化場景的模型,更加專注于政務熱線、網點助手、先導藥物篩選、傳送帶異物檢測、臺風路徑預測等具體行業應用或特定業務場景,為客戶提供“開箱即用”的模型服務。
張平安表示盤古大模型3.0“不做詩只做事”,將圍繞“行業重塑”“技術扎根”“開放同飛”三大創新方向,為行業客戶、伙伴及開發者提供更好的服務。據介紹,盤古大模型已在金融、制造、醫藥研發、煤礦、鐵路、氣象等諸多行業發揮巨大價值。
在政務領域,華為云攜手深圳市福田區政務服務數據管理局,上線了基于盤古政務大模型的福田政務智慧助手小福,能夠精準理解民眾咨詢意圖,改變傳統的一網通辦模式,把老百姓的話語轉化為政府辦事的語言。盤古政務大模型對超過20萬條政務數據進行精調,包括12345熱線、政策文件、政務百科等,掌握了豐富的法律法規、辦事流程等行業知識。基于盤古政務大模型的小福,在一網通辦業務中體現出行業性、專業性、領先性和惠民性。
在煤礦領域,盤古礦山大模型已經在全國8個礦井規模使用,一個大模型可以覆蓋煤礦的采、掘、機、運、通、洗選等業務流程下的1000多個細分場景,讓更多的煤礦工人能夠在地面上作業,不僅能讓煤礦工人的工作環境更加舒適,而且可以極大地減少安全事故。
據公開資料,華為盤古系列基礎大模型于2021發布,包括NLP、CV和科學計算大模三大基礎大模型,后續發布了礦山、藥物分子、氣象、海浪等行業大模型;2022年4月升級到2.0版本,發布層次化開發方案 ( LO, L1,L2) ,打造工業級盤古大模型。
據了解,基于華為的AI根技術,大模型訓練效能可以調優到業界主流GPU的1.1倍。華為在最底層構建了以鯤鵬和昇騰為基礎的AI算力云平臺,以及異構計算架構CANN、全場景AI框架昇思MindSpore,AI開發生產線ModelArts等,為大模型開發和運行提供分布式并行加速,算子和編譯優化、集群級通信優化等關鍵能力。
眾所周知算力是訓練大模型的基礎。在本次大會上,張平安宣布單集群2000PFlops算力的昇騰AI云服務在華為云的烏蘭察布和貴安AI算力中心同時上線。昇騰AI云服務除了支持華為全場景AI框架昇思MindSpore外,還支持Pytorch、Tensorflow等主流AI框架。同時,這些框架中90%的算子,都可以通過華為端到端的遷移工具平滑遷移到昇騰平臺。
關鍵詞:
版權與免責聲明:
1 本網注明“來源:×××”(非商業周刊網)的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,本網不承擔此類稿件侵權行為的連帶責任。
2 在本網的新聞頁面或BBS上進行跟帖或發表言論者,文責自負。
3 相關信息并未經過本網站證實,不對您構成任何投資建議,據此操作,風險自擔。
4 如涉及作品內容、版權等其它問題,請在30日內同本網聯系。