《大模型專題:大模型的異構計算和加速》由英特爾院士戴金權在AiCon全球人工智能開發與應用大會上的演講內容整理而成。報告介紹了大語言模型的異構計算和加速相關技術。首先闡述大語言模型基于Transformer解碼器架構的自回歸模型原理。接著分析大模型推理和訓練面臨的瓶頸,包括內存帶寬、計算、顯存大小和分布式計算等方面。
報告重點介紹了大模型的異構計算和加速方法。包括XPU異構計算,涉及CPU、GPU、NPU等硬件加速;低比特計算,如模型量化/壓縮、數據類型選擇、低比特算子應用以及對顯存使用量和訓練微調的影響,并對比了不同量化方式下多個模型的精度;還介紹了推理算法優化,涵蓋Self - speculative decoding、KV Cache compression等多種方式。
此外,報告還介紹了IPEX - LLM開源大模型XPU加速框架及其應用場景,如在Intel Core Ultra AI PC、Intel Arc A770 GPU等不同硬件上的加速體驗,包括Office助手、工業機器人代碼生成、AI座艙 - 汽車助理等多個應用案例展示了英特爾XPU在大模型應用創新方面的成果,并鼓勵關注和試用IPEX - LLM,在Intel XPU平臺開發大模型及其應用。
附件:大模型的異構計算和加速:加速方法,包括XPU異構計算,多個模型的精度,推理算法優化
增強型工作,智能企業開始利用人工智能創造真正價值的方式;實時自動決策帶來更高的效率和對變化中的客戶習慣與市場狀況更快的反應速度
基于對視頻的AI智能分析,實現皮帶運輸各類異常情況的智能視頻分析和判別;實現設備的一鍵啟停、遠程操作控制等功能,有效降低危險作業區域安全事故發生率
AI 技術的發展揭示了第五種科學研究范式, 即通過機器猜想的方式應用于 科學智能,通過不同的算法思維和應用場景的對撞,得到不同領域專業知識,從而推導位置結論的范式
AI 發展中產生了 五大悖論,揭示了AI 作為技術的局限性和未來可能應用方向的限制;AI 依然是一種意義重大的技術,它將顯著提高生產和工 作效率
AI是一種更強的工具,像超級計算機一樣可被購買;AI無所不能,人類是執行器,AI將取代人類;AI將和人類具備平等的地位
第二章提供全景式的 AI 產業鏈圖譜和 中美 AI 能力對比;第三章闡述了生成式 AI 的核心技術及發展趨勢;展望 AI 商業化路徑和產業競爭格局演變
B端及C端AI應用,目前B端應用落地較快,C端應用靜待殺手級應用出現;C端應用頭部格局穩定,但用戶需求不明確,往往是供給激發需求
國內通用類大模型正在持續拓展應用領域,包括文心一 言、通義千問、星火認知等一批通用大模型正在快速發展,垂直領域專業類大模型也在不斷深化落地
生成式 AI 等創新技術,正在引領未來商業發展的新方向;將 AI 技術和 AI 應用視為增加企業營銷能力的伙伴,共同 生成商業新未來
當Al與勞動高度互補時,互補效應變得強于位移效應,特別是在收入分配的上半部分,導致與低互補情況相比
模型無法做到無限制的創意賦能,隨著海量設計師利用同一模型 進行設計流程的迭代,產品的設計風格可能趨于同化,擴大設計師在 實踐中所創造知識的影響力
訓練與微調成本,該訓練成本僅針對企業應用基礎模型結合行業知識與數據集進行訓練與微調的成本,并非基礎大模型訓練成本,該成本仍然為行業知識壁壘顯著的企業必須承擔的成本