中國科學家團隊完成視覺識別里程碑式突破_第1頁
已閱讀1頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、中國科學家團隊完成視覺識別里程碑式突破一直以來,計算科學家一直在為建立世界上最精確的計算機視覺系統(tǒng)孜孜不倦地努力著,但取得進展的過程卻一直如馬拉松競賽般漫長而艱辛。近期,微軟亞洲研究院實現(xiàn)的突破讓他們成為了這場競賽的最新領跑者。該團隊所開發(fā)的基于深度卷積神經(jīng)網(wǎng)絡(CNN)的計算機視覺系統(tǒng),在Image1000挑戰(zhàn)中首次超越了人類進行對象識別分類的能力。該研究團隊是微軟亞洲研究院視覺計算組,他們開發(fā)了一個計算機視覺系統(tǒng),該系統(tǒng)基于深度卷積

2、神經(jīng)網(wǎng)絡(觀察者網(wǎng)注:卷積神經(jīng)網(wǎng)絡,ConvolutionalNeuralwks,縮寫為CNN,不是那個教老外在中國找女友的電視臺的CNN哦)。該研究團隊的論文名稱較長:“DelvingDeepintoRectifiers:SurpassingHumanLevelPerfmanceonImageClassification”。論文中指出,他們的系統(tǒng)在Image2012分類數(shù)據(jù)集中的錯誤率已降低至4.94%。此前同樣的實驗中,人眼辨識的錯

3、誤率大概為5.1%。這個數(shù)據(jù)集包含約120萬張訓練圖像、5萬張驗證圖像和10萬張測試圖像,分為1000個不同的類別。微軟研究員表示:“據(jù)我們所知,我們的研究成果是這項視覺識別挑戰(zhàn)中第一個超越人類視覺能力的計算機系統(tǒng)?!?人團隊:孫劍、何愷明、張祥雨、任少卿人團隊:孫劍、何愷明、張祥雨、任少卿值得一提的是,完成這個研究的團隊僅有4人,全部由中國人組成:2人為微軟亞洲研究院研究員孫劍與何愷明孫劍與何愷明,另外2人為實習生,分別是來自西安交通

4、大學的張祥雨和中國科學技術大學的任少卿。孫劍孫劍已在微軟亞洲研究院工作了十二年,現(xiàn)任視覺計算組首席研究員。此前,他在西安交通大學獲得了電氣工程專業(yè)學士、碩士及博士學位。2001年,孫劍曾是沈向洋博士的學生。沈向洋目前擔任微軟全球執(zhí)行副總裁,主管技術與研究,并且是微軟亞洲研究院創(chuàng)始成員之一。這位因在計算機視覺及圖像學領域建樹卓著而當選IEEEFellow(電氣電子工程師學會院士)及ACMFellow(美國計算機協(xié)會院士)的計算機科學家。沈

5、向洋對他昔日弟子所取得的成就感到非常自豪,他介紹說,“孫劍和我在2001年和西安交通大學鄭南寧教授一起做的第一個項目是利用置信傳播(beliefpropagation)進行立體重建。孫劍第一個將貝葉斯置信傳播用來解決立體視覺問題并取得了當時最好的效果。孫劍的很多研究成果都成功應用到了微軟的核心產(chǎn)品中。而他在更深層神經(jīng)網(wǎng)絡方面最新研究成果的潛力讓我尤為興奮和期待?!痹撗芯繄F隊雖然對其算法超越人類視覺識別極限感到興奮不已,但與該領域的其他研

6、究人員一樣,研究團隊成員也強調,計算機視覺目前從根本上仍無法與人類視覺相比。計算機系統(tǒng)在識別物體、理解圖像上下文及場景高級信息等領域仍面臨諸多挑戰(zhàn)?!半m然我們的算法基于該特定的數(shù)據(jù)集得出了極為理想的結果,但這并不表明在對象識別領域機器視覺普遍優(yōu)于人類視覺。某些對于人類來說輕而易舉的基本對象類別的識別,機器識別仍然存在明顯錯誤。盡管如此,我們的研究結果表明機器算法在眾多視覺識別任務上具有巨大的發(fā)展?jié)摿Α!薄叭祟惪梢院敛毁M力地區(qū)分出一只羊和

7、一頭牛。但計算機在執(zhí)行這些簡單人類可以毫不費力地區(qū)分出一只羊和一頭牛。但計算機在執(zhí)行這些簡單任務時卻不盡完美任務時卻不盡完美,”孫劍解釋道。“但是,當涉及到不同品種的羊的區(qū)分時,但是,當涉及到不同品種的羊的區(qū)分時,計算機可超越人類。通過訓練,計算機可觀察圖像的細節(jié)、紋理、形狀及環(huán)境,計算機可超越人類。通過訓練,計算機可觀察圖像的細節(jié)、紋理、形狀及環(huán)境,并發(fā)現(xiàn)人類無法察覺出的區(qū)別并發(fā)現(xiàn)人類無法察覺出的區(qū)別?!蔽④浹芯繄F隊的工作并不僅僅局限

8、于基礎研究,其多項成果已被應用到微軟的產(chǎn)品和服務中,包括必應圖片搜索及微軟云存儲解決方案OneDrive。在近期的一篇博文中,微軟OneDrive項目經(jīng)理DouglasPearce介紹了OneDrive自動識別照片內容的功能?!癘neDrive會自動為用戶上傳的照片創(chuàng)建標簽,比如人、狗、沙灘、落日等等,使用戶借助標簽能夠更輕松地尋找到自己的圖片。有了這項功能,我們向演示項目中添加照片、與家人重溫特殊回憶,或與Facebook好友分享重要

9、時刻就變得輕而易舉?!盤earce如是說。想要了解此項技術背后原理的讀者可閱讀微軟研究院去年發(fā)布的專題文章。該文章介紹了來自同一研究團隊的研究成果,他們在保持準確性不變的條件下將深度學習目標檢測系統(tǒng)加速了多達100倍。該團隊的科研進展記錄于題為“SpatialPyraPoolinginDeepConvolutionalwksfVisualRecognition”研究論文中?!拔④泚喼扪芯吭阂曈X計算研究組一直致力于推動計算機視覺研究的前沿

10、發(fā)展,終極目標是使計算機能夠模擬出人類的感知能力。我對研究組多年來所取得的成就深感自豪,他們不僅以高質量的論文取得了學術界的認可,而且通過將這些技術轉化到了微軟的多個核心產(chǎn)品中?!蔽④泚喬邪l(fā)集團主席兼微軟亞洲研究院院長洪小文博士說道。20102010年,來自斯坦福大學、普林斯頓大學及哥倫比亞大學的科學家們啟動年,來自斯坦福大學、普林斯頓大學及哥倫比亞大學的科學家們啟動大規(guī)模視覺識別挑戰(zhàn)賽(大規(guī)模視覺識別挑戰(zhàn)賽(LargeLargeSc

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論