|  首頁  |  資訊  |  評測  |  人物  |  活動  |  學院  |  新報  |  專欄  |  專題  |  專區  |  
您現在的位置:硅谷網> 學院> 速記>

【2017CCF青年精英大會】湯曉鷗談人工智能明天

2017-05-21 02:26 作者:蔡小飛 來源:硅谷網 HV: 編輯:GuiGu 【搜索試試

【硅谷網報道】北京時間2017年5月20日,以“科研·產業·融合”為主題的2017CCF青年精英大會在北京國家會議中心舉行。本次大會由中國計算機學會(CCF)主辦,Xtecher協辦。大會邀請了30+位學界大咖,首次曝光12項高精科技,并設有人工智能、大數據、云計算、信息安全、綜合領域等5大前沿技術頭腦風暴會。香港中文大學教授、工程學院副院長湯曉鷗做了主題為《人工智能的明天,中國去哪?》的分享。

以下根據演講實錄整理:

謝謝主持人的介紹。非常感謝組委會的邀請,尤其是跟我講請了三位學者講,第一位趙部長主要是講學術領域方面的,后面的老師是怎么樣落地用到實際生產中,我在中間是承上啟下的說法,我不知道我理解的對不對。今天講座,像一個杠鈴一樣重量主要是在前面和后面,我在中間是很細的桿把這個重量連接起來。雖然份量很輕,但是壓力非常大,我想了很久,雖然不太會說話,但是還是來了。

今天我講的題目:人工智能的明天,中國去哪兒?份量比較輕,我選了一個比較大的題目,壓壓場上。原來我給題目比這個還大:人工智能的明天地球去哪兒?我后來想一帶一路剛剛開完,地球去哪兒已經解決了,我還是回到我的小題目,中國去哪兒。

不管講什么都是用我兒子的照片開始,以前我用主要是他長得漂亮,沒有什么其他的原因,還是有一些原因了,因為他最近對演戲開始感興趣了。我說當演員是沒戲了,我也當想,但是你得長得漂亮。我說如果你繼續免費讓我用你的照片,也許我可以幫你成為一個網紅,他也不知道網紅是什么,所以也就同意了,所以我今天還是用一下。我今天講的跟他的照片沒有太大的關系。

不管人工智能怎么樣發展,還是年輕人創業和做研究,其實我們要做的事情也就是三件事情:

第一,把基礎打好,需要花時間,剛才趙部長講的很好,就是要堅持,真正花很長時間把這個基礎打好,做什么東西都不是說一夜之間就所有人開始做人工智能了。

第二,要做創新,要做新的東西,不要老是跟在別人后面走。

第三,把漂在上面的東西要落地,還要產業化。

今天從我們實驗室的研究和公司做的產品,來講講對這三個方面的理解。

什么是人工智能?現在已經非常難定義了,幾乎所有事情都可以說是人工智能,我的理解來講人工智能應該也是深度學習,因為以前的人工智能確實是在很多情況下用不起來,就是人手設計的人工智能還是比較難超越人在做某一件事情。由于有了深度學習我們可以把它變成一個數據驅動,這個數據量大到一定程度,參數量到一定程度,在某一件事情上機器可能超過人類,很多現實中落地的東西,其實都是深度學習做出來的。深度學習做觸處機來的,成功東西比較多,語音是一方面,可能更多還是做視覺方面,所以大家可以看到很多計算機視覺方面新的成果。在我看來,我所講的人工智能其實也就是計算機視覺,用深度學習做計算機視覺,就變得更窄了。

大家可以看到深度學習的詞在谷歌上搜索,從2006年開始有這個詞,這是這些前輩發明了這個算法。2000-2011年是很平穩的,只有在學術界才會去所搜索這個詞語,才知道這樣的事情。2011年突然之間開始起來了,成指數性的上升,現在搜索量已經非常的巨大了。這條曲線代表了深度學習的爆發過程。

深度學習到底在做什么事情?實際上他所做的事情是非常艱難,從X到Y,或者從A到B,你給我一個輸出我怎么樣輸出?只是說這些事情做得非常好。把這個Make做得非常好,其他算法也可以,只不過做得不如別人好,現在它做到極值。比如說給了一張照片,我就可以給你講出這個照片的名字,我給你一個物體的形狀我就可以告訴你這個物體是什么物體,你給我一個車的場景、相機的場景,我就可以給你輸出這個車應該往哪兒拐,你給我一個醫療的圖象,我給你判斷這是什么病,實際上就是這樣的一個過程。不要把人工智能想象成可以超越人類,可以控制人類,這些都是所謂的“好萊塢人工智能”或者想象中的人工智能,真正人工智能在我們這個階段其實就是這句話。做到這件事情其實是很不簡單的。

最近這幾年深度學習確實在學術界、工業界取得重大了突破,第一個突破就是語音識別上,這是微軟的鄧麗老師在2011年語音識別上取得了巨大的成功,昨天可能大家在微信也刷屏了,等麗老師老師從微軟出來到頂級對沖基金。我的理解也是A2B,把鄧老師深度學習經驗,所有東西都輸入到對沖基金,這個對沖基金的錢就到了鄧老師口袋里面了。語音識別取得了巨大成功以后,2012年人臉識別之前我們一個點一點推,他一年就推了十年的進步,所以在學術界引起了很大的轟動。2014年做人臉識別中深度學習做到的人臉識別超過了人的研究。最后2016年還是谷歌的最厲害,每年120億美金的研發投入是沒有白投,下了一盤棋叫Ip GO啊法狗??,這盤棋下完之后人工智能不需要我們解釋了,大家都明白了,人工智能就是下棋。接著自動駕駛也取得了一些重大的突破,現在比較熱門的又開始了在醫療圖象上進行人工智能的診斷。深度學習其實有三個核心的要素,一個是學習算法的設計,你設計的大腦夠不夠聰明,第二個要有高性能的計算,要有一個大的集群訓練比較大的網絡,還必須要有大數據。

我們在深度網絡學習方面做的一些工作,2011年開始做這項工作,一開始沒有開源的系統,所以要自己做很多的工作。做得時間長了,實驗室就做了一套Parrots系統,不是開源的。這項系統我們就說訓練一個非常深的網絡,原來Imagenet是八層,后來谷歌是22層,后來Resnet是52層,以及2018年是120層。這是設計一千多層的網絡,大家可以看到這個深度。很細的線就是網,中間一個格往外走,這個中間叫做Palynet,用這樣的一個net,我們在做這個分類上做了目前為止最好的結果。

目前在Imagenet最好的結果,前面是谷歌的結果,中間是Fcoabook,也是大華團隊做的。前一段時間在我們系里面大華做了一個講座,揭示了整個這個結構,我們系里面老師得出一個結論,這個上面我們信息工程系的兩個學生之間的戰爭。

在檢測上大家可以看到這個進步速度,2013年一開始的時候物體檢測準確率是22%,但是很快谷歌可以做到43.9%,我們做到50.3%,緊接著微軟是62%,現在最好結果是66%了。這個速度是幾年之內翻了三倍,也是深度學習的力量。

我們訓練出來這樣一個大腦,可以把它應用到各個方向,做出了很多各個領域不同的技術。在人臉方面我們做了人臉檢測,人臉關鍵點定位,身份證對比、聚類以及人臉屬性、后期檢測以及等等,第一個深度學習的文章從我們實驗室出來的。智能監控方面,做了非機動車結構化研究,人的屬性,大概有70種的屬性。人群定義了90幾種屬性。在衣服的搜索以及物體的檢測和場景的分類和車型的檢測,車型檢測定義了幾千種車型的分類。在文字的方面,小票的識別,信用卡的識別,車牌的識別,這些都是由深度學習的算法來做的。同時在圖象的處理方面,在去霧、超分辨率抖動SDR各種濾鏡的研究都是用深度學習的算法,我們基本上用一套大腦做很多的任務

另外一個門檻就是高性能計算,以前高性能計算大家都是講的CPU,科學計算,很多都是GPU,做GPU的集群目前是一個比較大的門檻。我們在北京做了三個GPU的集群,在香港做了一個大的集群,用這些集群訓練我們的我們的網絡。

大數據,如果把人工智能比喻一個火箭的話,大數據就是這個火箭的原料。

工業界跟300多家的廠商客戶進行合作,所以積累了大量的數據,屬幾億的圖片,有300多人的團隊專門做這個數據標注。包括幾千個車的據,以及人群的大數據以及衣服的搜索和分類的數據庫,對于學術界以及工業界都是很有益的。谷歌做的體量更大,他們還會做一個非常大的醫療圖象的開放,跟NH,回頭在醫療方面我相信大家會有大量的數據進行處理。這個時候對于我們的高性能計算又提出了一些新的要求。

實驗室比較有幸做的比較早。我們起步很早,在很多的計算機視覺有人臉檢測,人群、等等各個方面,這里列了全球第一個深度學習解決這些問題,是由我們提出來的。也相當于說對創新的一些貢獻。被評為全亞洲唯一的人工智能研究先趨,非常榮幸跟MAT以及斯坦福這樣的名校,以及深度學習的頂級大佬,臉書、谷歌等等的在一起,覺得非常有幸。還要做一些更多現在沒有的技術,比如說,這個大家可能以前見過很多,以前都是用深度攝像頭來做的,它的信息量很大,這個團隊做的實際上用單個攝像頭,很便宜的單個攝像頭,單個攝像頭做這樣的效果還是非常不容易,尤其做到實時,在智能駕駛方面等等都有很大的應用前景。

這個工作是去年做的,根據一個人的照相,兩個人的擺姿勢的感覺,可以判斷兩個人的情感,是朋友還是敵人的。同時可以根據兩個人的表情也可以判斷兩個人的關系,所以以后如果你把你的照片上載到互聯網上,實際上我們完全可以判斷出來跟你一起照相的這個人,跟你具體是什么關系。有甚么用,大家都會把照片放到網上,我們用這些捉片判斷這些人的感覺,如果你跟一個非常名的人,或者跟一個非常有錢的人照了一張照片,那你這個人可信度可能就增加,這是實時判斷兩個人的關系,可以看到兩個曲線,根據他們實時判斷兩個人的關系。我們判斷這種關系,你的可信度就可以提高了,或者你跟一個罪犯長了一張照片,你的可信度就下降,我們用這個就可以做金融的征信,把不同的關系網建立起來,把信用度傳播出去。這個關系可以做得更多,把一張圖片所有物體之間,哪個在上面,哪個在后面,互相是什么關系,可以由一張照片判斷出來。

這也是最新的工作,這是小剛他們實驗室做出來的。我們定義了70種人的特性,根據這個特性進行搜索。現在定義一個新的搜索模式,就是用自然語言來搜索,就是我說一段話來描述這個人,把這個人描述出來以后用這段話去搜索我要找的這樣一個人,這個信息量其實是更大的,找的是更準了,實際上可以提供的,比如說用這些話我們再建立一個大的數據庫,來源做這件事情。在這個數據中,自然語言,人體有70幾種,但是從這些自然語言里面我們可以抽出不同的詞,用詞來描述不同的人,這個信息量巨大,搜索準確率也大幅度提高。這是具體的結果。用自然語言做人的搜索。大家可以想像一下在醫療上可以用,多模態的醫療診斷上。一個是醫療的圖象,一個是醫生的診斷,可以實時的識別出來,進行自然語言的分析,把兩個進行結合再進行診斷。

這是大華他們所做的工作,根據這個Vido的內容,判斷這段時候是Romance的視頻,還是一段災難。你可以看到那兩個曲線,現在是Romance的線就上來的,如果是災難,那個災難的綠線就上來了,實時根據這個內容判斷劇情,這應該也是去年的工作。

今年目前他們又做了一個新的工作,可以根據電影的在實時計算機判斷,根據這個視頻以及各種各樣的內容作用源來理解判斷這個里面的劇情,然后同時也可以把一個演員,在整個電影里面,在什么地方出現,在那段時間劇情用自然語言描述出來,把整個電影的內容分析,用自然的方式可以分析出來了。將來插播廣告,還可以搜索各種不同的片段。

還有一項工作超分辨率,就是把很模糊的圖象放大?這個好萊塢的圖象,這個視頻抓到一個很模糊的嫌疑犯罪的圖象,然后把它實時的變得很清晰。這是這個電影上演的效果,我們還是很震撼的。實際上我們用傳統算法做一下,我們以為可以用比較漂亮的樣子,實際上用傳統算法做出來這樣效果。跟人臉檢測以及人臉識別方面進行積累,實際上做了10、20篇文章,最后又得到了比較好的結果,我們能不能做到這樣的一個結果呢?這是我們希望得到的目標,把應用方向還可以在低清晰度的電視放成高清,這也是一個應用方向。這是我們做的最新的結果。左邊直接放大,右邊是我們直接放大的結果,已經基本上可以達到高清的效果了。在日本,也把這個卡通的放大,也是有很好的效果。

2016年的時候,推特跟谷歌密集做了幾篇文章,就是做超分辨率的。實際上就是用深度學習,實際上這件事情就是怎么樣開始?2014年做的超分辨率,2015年有做了一篇,把這個速度加上去了。2016年又做了兩篇,取得了比較大的突破。2017年我們緊接著又做了三篇,目前再到實時以及效果實用化的階段。目前可以看到最好開創性的工作也是做的。實時的監控,公安監控攝像頭可以把人看的比較清晰了。

這是實際的產品方向的開發,有自動駕駛,有六個方面的技術,有30多個核心的技術。我在這里面就簡單舉幾個例子做演示。這是車的檢測,這是人的實物檢測?這是路的檢測,這是實時的分割,我們也做到前端,用前端的芯片做實時的效果。對人的標清的互動以及手勢的互動。

這是在人臉的布控系統,這已經在很多城市實時布控了。這相當于百米之外抓人,百米之外看到一個目標拉近然后進行人臉識別。這是百米外抓車,可以把這個人進行人臉識別,這是百米外的人群,把人群一個人進行識別。這是視頻結構化,把視頻里面的車以及特性都檢測出來了,標注出來了,這樣把整個視頻變成了文件和文檔,就可以進行文檔性的搜索。這是在中國移動的實名認證系統,去年跟中國移動做了三億人的視頻認證,這是小米的寶寶相冊,這是華為的智能相冊,這是FaceU做的特效,微博這樣特效絕大部分都是我們進行人臉識別、人的跟蹤的技術做出來的。實際上在人工智能落地方面我們做了蠻多的落地產品,去年的雙創活動中幾百家企業里面選了兩家代表中國人工智能,右邊是百度,左邊是商湯科技。

在中國創業是一個什么感受?我覺得中國創業就像跑百米一樣,要跑的非常快,第一個到達終點才可以活下來,但是這個跑道是滿地都是坑的跑道,要不然跑到最快,要不然還沒有起步就掉坑里面就死掉了,這個困難肯定是有的。年輕人要不要創業?盡管這個坑還是比較多,但是創業還是可以試一試的,我給一個忠告用什么錢可以創業,什么錢可以用,什么錢不可以用,那首先你父母的錢你不可以用,你自己第一桶金可以用,燒完了之后你們還可以繼續用。投資人的錢,投資人的錢肯定是可以用的,因為這都是有錢人的錢,都是這些大佬,都是非常過凈值的錢,我覺得劫富濟貧人人有責,大家還是出來創業吧。謝謝大家。

【對“【2017CCF青年精英大會】湯曉鷗談人工智能明天”發布評論】

版權及免責聲明:
① 本網站部分投稿來源于“網友”,涉及投資、理財、消費等內容,請親們反復甄別,切勿輕信。本網站部分由贊助商提供的內容屬于【廣告】性質,僅供閱讀,不構成具體實施建議,請謹慎對待。據此操作,風險自擔。
② 內容來源注明“硅谷網”及其相關稱謂的文字、圖片和音視頻,版權均屬本網站所有,任何媒體、網站或個人需經本網站許可方可復制或轉載,并在使用時必須注明來源【硅谷網】或對應來源,違者本網站將依法追究責任。
③ 注明來源為各大報紙、雜志、網站及其他媒體的文章,文章原作者享有著作權,本網站轉載其他媒體稿件是為傳播更多的信息,并不代表贊同其觀點和對其真實性負責,本網站不承擔此類稿件侵權行為的連帶責任。
④ 本網站不對非自身發布內容的真實性、合法性、準確性作擔保。若硅谷網因為自身和轉載內容,涉及到侵權、違法等問題,請有關單位或個人速與本網站取得聯系(聯系電話:01057255600),我們將第一時間核實處理。
相關
·【硅谷速記】2017CCF青年精英大會部分實錄上
·2017CCF青年精英大會:人工智能的明天在哪里?
·【2017CCF青年精英大會】趙沁平:虛擬現實看科技
廣告
頭條
·【硅谷速記】張小龍:全面闡述小程序來了!
圖文
2018國際文創產業合作伙伴大會9月11日上午實錄
2018國際文創產業合作伙伴大會9月11日上午
RTC 2018實時互聯網大會之聲網媒體溝通會實錄
RTC 2018實時互聯網大會之聲網媒體溝通會實
2018國際文創產業合作伙伴大會9月11日上午實錄
2018國際文創產業合作伙伴大會9月11日上午
【硅谷速記】蘇寧易購418家電3C狂歡節發布會
【硅谷速記】蘇寧易購418家電3C狂歡節發布
最新
·nokelock 2019 全球新品發布會全程文字速記實錄
·【硅谷速記】牛電科技媒體溝通會-2016年4月6日
·GrowingIO 2018增長大會主會場上午現場速記實錄
·三好網2018培訓教師發展大會全程速記現場實錄
·2018 AGM X3喜馬拉雅新品發布會媒體群訪速記
熱點
·【硅谷速記】特朗普就職演講全文(中英對照版)
·三好網2018培訓教師發展大會全程速記現場實錄
·GrowingIO 2018增長大會主會場上午現場速記實
·【硅谷速記】家園網馬永才接受硅谷網等群訪錄
·2018國際文創產業合作伙伴大會9月11日上午實
舊聞
·GBDC|天府新區李昂:成都天府新區產業政策介
·【硅谷速記】CCTV一鎮一品項目啟動儀式實錄
·【硅谷速記】360安全路由2017新品發布會實錄
·【硅谷速記】2018年中國TMT行業“領秀榜”盛
·【硅谷速記】萬象人工智能研究院發布會實錄
廣告
硅谷影像
2018國際文創產業合作伙伴大會9月11日上午實錄
2018國際文創產業合作伙伴大會9月11日上午實錄
RTC 2018實時互聯網大會之聲網媒體溝通會實錄
RTC 2018實時互聯網大會之聲網媒體溝通會實錄
【硅谷速記】GMIC北京2018:知乎李大海演講實錄
【硅谷速記】GMIC北京2018:知乎李大海演講實錄
【硅谷速記】GMIC北京2018上蘇寧喬新亮演講實錄
【硅谷速記】GMIC北京2018上蘇寧喬新亮演講實錄
【硅谷速記】UC光譜計劃開放平臺發布會實錄
【硅谷速記】UC光譜計劃開放平臺發布會實錄
【2017CCF青年精英大會】湯曉鷗談人工智能明天
【2017CCF青年精英大會】湯曉鷗談人工智能明天
關于我們·About | 聯系我們·contact | 加入我們·Join | 贊助我們·Sponsor | Site Map | Tags | RSS Map
電腦版·PC版 移動版·MD版 網站熱線:(+86)010-57255600
Copyright © 2007-2019 硅谷網. 版權所有. All Rights Reserved. <京ICP備12003855號-2>
吉林快3网上投注