在生活中,很多人都不知道enet網絡學院_enet硅谷動力學院是什么意思,其實他的意思是非常簡單的,下面就是小編搜索到的enet網絡學院_enet硅谷動力學院相關的一些知識,我們一起來學習下吧!
(資料圖片)
Enet *** 學院(enet硅谷動力學院)雷鋒網2019-02-26 10:14:15
本文是為AI研究所整理的技術博客,原題:
ENet——一種用于實時語義分割的深度神經架構
作者|阿魯納瓦
翻譯| callofduty890
校對|范姜梨評|皮塔整理|鯉魚網
原始鏈接:
https://towardsdatascience . com/enet-a-deep-neural-architecture-for-real-time-semantic-segmentation-2 baa 59 cf 97 e 9
圖一。一個語義分段的家伙和一個卡通之間的對話
這是論文的摘要:
ENet:用于實時語義分割的深度神經 *** 架構
作者亞當·帕茲克
論文:https://arxiv.org/abs/1606.02147
介紹
ENet(高效神經 *** )提供了實時按像素進行語義分割的能力。ENet的速度提高了18倍,FLOP要求降低了75倍,參數降低了79倍,并為現有模型提供了類似或更好的精度。在CamVid、CityScapes和SUN數據集上進行了測試。
方法:
圖3。ENet架構
以上是完整的 *** 架構。
它分為幾個階段,由表中的水平線和每個塊名稱后的之一個數字突出顯示。輸出尺寸為輸入圖像分辨率的512 * 512。
圖4。ENET的每個模塊都有詳細的解釋。
視覺表現:
-初始模塊是(a)中所示的模塊-瓶頸模塊顯示在(b)中
每個瓶頸模塊包括:
-1x1投影,減少尺寸。
-主卷積層(conv)(-常規、擴展或完整)(3x3)
-1x1擴展
并且它們在所有卷積層之間放置批標準化和預露。
如果瓶頸模塊正在縮減采樣,則將更大池層添加到主分支。此外,之一個1x1投影被替換為2x2卷積,跨距= 2。
他們將激活無填充以匹配要素地圖的數量。
Conv有時是非對稱卷積,即5 * 1和1 * 5卷積的序列。
對于正則項,他們使用空間落差:
瓶頸2.0之前,p = 0.01
-完成后p = 0.1
所以,
階段1,2,3-編碼器-由5個瓶頸模塊組成(除了階段3沒有下采樣)。
階段4,5-解碼器-階段4包含三個瓶頸,階段5包含兩個瓶頸模塊。
接下來是一個fullconv,它輸出最終輸出-C * 512 * 512大小,其中C是濾波器的數量。
有一些事實:
-他們在任何預測中都沒有使用偏見術語
-在每個卷積層和激活層之間,它們使用批量歸一化
-在解碼器中,MaxPooling被MaxUnpooling代替。
-在解碼器中,填充被無偏差的空間卷積代替。
-在最后一個(5.0)上采樣模塊中沒有使用池索引。
- *** 的最后一個模塊是裸完全卷積,占用了解碼器的大部分處理時間。
-每個側支丟失一個空,之一級p = 0.01,然后是后級p = 0.1。
結果
通過benchmark測試了ENet的性能。
-CamVid(道路場景)
-城市景觀(道路場景)
-太陽RGB-D(室內場景)
SegNet [2]被用作基線,因為它是最快的分段模型之一。使用cuDNN后端使用Torch7庫。
使用英偉達Titan X GPU和英偉達TX1嵌入式系統模塊記錄推理速度。輸入圖像大小為640x360,速度超過10fps。
圖5。以SegNet為基線的兩種不同GPU推理時間的比較
圖6。Segnet和ENet的硬件要求
基準
亞當。ENet用于快速融合。每個數據集上使用4個Titan X GPU,訓練只需要3-6個小時。
它分兩個階段進行:
-首先,他們訓練編碼器對輸入圖像的下采樣區域進行分類。
然后附加一個解碼器,訓練 *** 進行上采樣和像素分類。
學習率-5e-4
L2的重量衰減為2e-4。
批量為10件。
自定義類別權重方案定義為
圖7顯示了。自定義類別權重方案的公式
其中c = 1.02,類別權重限制在[1.50]的區間內
圖8。Cityscapes數據集的性能
圖9。Camvid數據集的性能
參考:
A.Paszke、A. Chaurasia、S. Kim和E. Culurciello。Enet:用于實時語義分割的深度神經 *** 架構。arXiv預印本arXiv:1606.02147,2016。
動詞 (verb的縮寫)Badrinarayanan,A. Kendall和R. Cipolla,“Segnet:用于圖像分割的深度卷積編碼器-解碼器架構”,arXiv預印本arXiv:1511.00561,2015年。
我最近也轉載了這篇論文,可以在這里找到:
https://github . com/iArunava/ENet-實時-語義-分段
想繼續查看本文相關鏈接和參考文獻?
點擊【enet——實時語義分割的深度神經架構】或長按地址訪問:
https://ai.yanxishe.com/page/TextTranslation/1468
艾所今日推薦:雷鋒網雷鋒網雷鋒網
卡耐基梅隆大學2019年春季的“神經 *** 自然語言處理”是CMU語言技術學院和計算機學院的聯合課程。其主要內容是教學生如何利用神經 *** 做自然語言處理。神經 *** 可以被認為是為語言建模任務提供了一個強有力的新工具。同時,神經 *** 可以在許多任務中改進最新技術,使過去不易解決的問題變得容易和簡單。
加入群免費看視頻:https://ai.yanxishe.com/page/groupDetail/33
收集3條評論。
關鍵詞: 硅谷動力