在上一節中我們介紹了深度學習可解釋性的三種方法:1. 隱層分析法,2. 敏感性分析法 3. 代理/替代模型法。在這一節中我們主要介紹第一種方法:隱層分析法。
1. 黑箱真的是黑箱嗎?——深度學習的物質組成視角
通過上一節的介紹我們也了解到,深度學習的黑箱性主要來源于其高度非線性性質,每個神經元都是由上一層的線性組合再加上一個非線性函數的得到,我們無法像理解線性回歸的參數那樣通過非常solid的統計學基礎假設來理解神經網絡中的參數含義及其重要程度、波動范圍。但實際上我們是知道這些參數的具體值以及整個訓練過程的,所以神經網絡模型本身其實并不是一個黑箱,其黑箱性在于我們沒辦法用人類可以理解的方式理解模型的具體含義和行為,而神經網絡的一個非常好的性質在于神經元的分層組合形式,這讓我們可以用物質組成的視角來理解神經網絡的運作方式。比如如下圖所示,人體的組成過程是從分子-細胞-組織-器官-系統-人體:
而通過一些對神經網絡隱層的可視化我們也發現:比如下圖的一個人臉識別的例子,神經網絡在這個過程中先學到了邊角的概念,之后學到了五官,最后學到了整個面部的特征。
如果我們能夠用一些方法來幫助我們理解這個從低級概念到高級概念的生成過程,那么就離理解神經網絡的具體結構就近了很多。而這也可以逐漸幫助我們完成一個“祛魅”的過程,將調參的魔法真正變成一項可控、可解釋的過程。
要理解這個概念的生成過程很重要的一點就是要研究隱層的概念表示,在接下來的部分中我將給大家介紹業界關于隱層分析方法的幾個研究工作。
2. 模型學到了哪些概念?
要理解神經網絡中每層都學到了哪些概念一個非常直觀的方法就是通過對隱層運用一些可視化方法來將其轉化成人類可以理解的有實際含義的圖像,這方面一個非常具有代表性的一個工作就是14年ECCV的一篇經典之作:《Visualizing and Understanding Convolutional Networks》,這篇文章主要利用了反卷積的相關思想實現了特征可視化來幫助我們理解CNN的每一層究竟學到了什么東西。我們都知道典型的CNN模型的一個完整卷積過程是由卷積-激活-池化(pooling)三個步驟組成的。而如果想把一個CNN的中間層轉化成原始輸入空間呢?我們就需要經過反池化-反激活-反卷積這樣的一個逆過程。整個模型的結構如下圖所示:
資料獲取 | |
新聞資訊 | |
== 資訊 == | |
» 人形機器人未來3-5年能夠實現產業化的方 | |
» 導診服務機器人上崗門診大廳 助力醫院智慧 | |
» 山東省青島市政府辦公廳發布《數字青島20 | |
» 關于印發《青海省支持大數據產業發展政策措 | |
» 全屋無主燈智能化規范 | |
» 微波雷達傳感技術室內照明應用規范 | |
» 人工智能研發運營體系(ML0ps)實踐指 | |
» 四驅四轉移動機器人運動模型及應用分析 | |
» 國內細分賽道企業在 AIGC 各應用場景 | |
» 國內科技大廠布局生成式 AI,未來有望借 | |
» AIGC領域相關初創公司及業務場景梳理 | |
» ChatGPT 以 GPT+RLHF 模 | |
» AIGC提升文字 圖片滲透率,視頻 直播 | |
» AI商業化空間前景廣闊應用場景豐富 | |
» AI 內容創作成本大幅降低且耗時更短 優 | |
== 機器人推薦 == | |
服務機器人(迎賓、講解、導診...) |
|
智能消毒機器人 |
|
機器人底盤 |