2016年可謂人工智能的元年,尤其是AlphaGo和李世石的對決,在全球范圍內掀起了人們對人工智能前所未有的關注。人工智能的第三次浪潮究竟會是怎樣一種形態,會不會像前兩次一樣很快就退潮?人工智能到底是產業大潮,還是概念的泡沫?我們對人工智能的未來的預測是否過于樂觀?
要回答這些問題,我們不能站在預言家的角度,而是應該用事實說話。圍繞這些熱點,11月23日,在科大訊飛2016年度發布會上,科大訊飛董事長劉慶峰先生進行了專業解讀。
▌人工智能第三次大潮已切實到來
1956年,人工智能這一名詞在美國Dartmouth會議上被定義出來,由于當時的理論和模型只能解決一些非常簡單的問題,人工智能很快就進入冬天。第二次浪潮出現在80年代,但后來也破滅了,因為人們發現它離實際生活還很遙遠,這也是由于當時運算能力的局限。
今天的第三次浪潮是以深度神經網絡為基礎,依靠大數據、云計算、移動互聯網,源源不斷的收集各種數據,以目前的時間節點來看,人工智能的第三次大潮已經切實到來了,它已經不再是一個概念,而是可以進入各種行業。
今年3月9號,在AlphaGo和李世石對決之前,幾十家媒體采訪科大訊飛,問我們的預測,當時我們就很堅定的認為機器一定會領先,因為它后臺的算法是基于深度神經網絡的應用,而這方面科大訊飛早已在很多領域取得了非常好的應用效果,這種算法帶動了和它相關產業的持續創新,也推動了人工智能第三次大潮的到來。
深度神經網絡基本理論框架在2006年被提出來,科大訊飛第一個把它用到語音識別領域,并且異軍突起,持續從算法創新到應用創新以及數據迭代,不斷取得一個又一個令人興奮的成果。比如全球語音合成大賽,今年比的是英語合成,包括小說和故事,要求語音聲情并茂,難度極大,加上IBM年初就指出人機交互在十大技術突破中排名第三,各方對語音合成的關注度非常大,但即便如此,科大訊飛再次在一堆國際頂尖研究機構中奪得第一,把英語合成技術做到了超過普通人說話的水平,我們在全世界是唯一一家,而且蟬聯冠軍11年,代表了中國創新企業崛起的水平。
我們的語音轉文字能力也全球領先,即便在不聯網的單機情況下也能達到90%的準確率,全行業迄今為止只有科大訊飛一家。我們可以在3-5米、5-8米之外,用語音和機器人、智能家居自動交流,可以多人對話,上下文可以語意相關,可以隨時隨地打斷,我們由此定義了萬物互聯時代的語音交互標準,并推出了人工智能交互平臺--AIUI。
國際上有一個非常著名的語音識別比賽,叫“chime國際語音識別大賽”,今年這個比賽幾乎全球頂尖機構全部參加了,科大訊飛在所有三項指標中都是全球第一名,準確率已經做到97%以上,在噪音環境下,我們的錯誤率只有2.24%。這些識別技術真正推動了整個產業的革命和創新,到目前為止,根據寶馬、奔馳這些國際大廠的測試,汽車時速超過100公里并打開空調,這樣的噪音環境下,目前只有科大訊飛的技術能夠對語音做到正確識別。(語音識別)我們不光有英語,還有維語、藏語、日語和韓語,未來我們要把世界主要語種全部放進去,這都是在踐行我們創業之初就豎立的“讓人類乃至人機信息溝通無障礙”這一理念。
在機器翻譯領域,2014年科大訊飛在機器翻譯方面取得突破性的歷史進步,參加了國際口語翻譯大賽并取得全球第一。2015年,在美國國家標準技術研究院組織的機器翻譯大賽中,我們依舊是全球第一。
▌這個趨勢不可逆轉,事關所有人
人工智能經歷了計算智能,機器人能算會存到感知智能三個層次,未來,人工智能的核心是認知智能,而以語音和語言為入口的認知計算,是人工智能的必由之路。在認知計算領域,我們過去一年來取得令全球矚目的成績,在國際知名的認知智能測試大賽上獲得全球第一名,這個比賽是英語、漢語、西班牙語三個語種同時上,我們的獲獎對中國人工智能歷史有標志性意義,中國人在人工智能領域不是科普、科幻或者所謂先知角度的感性判斷,而是在踏踏實實的做理論創新。
我們的機器閱卷已開始推廣,在今年上海的4、6級考試,江蘇、湖南等地的高考和研究生考試中,機器在學習500份專家改過的卷子后就可以改其它幾十萬份卷子,超過了人工,而且有效保證了公平公正。我們的技術在醫療行業也同樣適用,機器可以學習頂尖醫療專家的知識和已有病例,他就能超過全科醫生,給我們的醫療帶來巨大福利。在法律體系里,當機器學習了大量的司法大數據后,效率和準確度甚至可以超過人工判案。隨著技術的不斷進展和迭代和進步,人工智能將來能達到一流專家水平,超過90%的普通專業人士,這就是我們面臨的時代的趨勢。
這不僅僅是科大訊飛的判斷,我們可以看看各方面的分析。去年10月麥肯錫的報告認為,將來45%的知識活動可以被自動化,鼎鼎有名的《科學》雜志給出的判斷是,到了2045年,全球50%的工作崗位將由機器替代,而在中國,這個數據將會是77%。也就是說未來30年內,在中國每4個工作中會有3個由人工智能替代。這是《科學》雜志今年年初的預測,以今天的進展來看,這個時間將大幅度提前,所以人工智能已經不僅僅是一個企業或者是一個行業的事,而是事關每一個人,這個趨勢不可逆轉。
▌人工智能時代,巨頭再難血洗行業
在人工智能+的時代,各行業會有什么樣的不同特點?科大訊飛研究院經過分析,把它分成三種狀況:第一種,所謂的信息完全輸入的狀況,在這種狀況下,得到一個輸入就可以充分準確的得到相應的輸出,像語音轉寫,安保時的人臉識別等,這些領域機器將來可以完全替代人工。
第二種,僅有當前的輸入信息還不夠,還要有經驗判斷,還要有常識,還是要有不斷迭代的專家知識,是人和機器耦合的,比如說教育,機器不可能替代老師,而是幫助老師更好的提高課堂效率,幫助孩子減輕課后無效的重復學習,還有醫療,學習頂尖醫療專家的知識,并不斷逼近它,這是需要人和機器耦合的。
第三種,沒有輸入做支撐,主要靠創意和想象力,像今天藝術大師所做的成果一樣。機器可以做圖、畫畫,可以寫詩,但是還達不到藝術的標準,還是要靠人類的靈感和想象來做。
從這三塊來看,第二種狀態集中度非常高。未來的人工智能可以是無所不在的一個后臺,處處為我們服務,也許今天他只能做10%的服務,但是機器可以學習,3個月后可以做到20%,三年就能做到80%甚至90%,這就是迭代學習,背后是幾百萬人的不斷使用,機器不斷的學習、迭代。
未來的世界,是由頂尖專家和頂尖管理者協同管理人和機器聯合體的未來,人類的工作會越來越多的被機器代替,我們被釋放出來,做更有創意的事,這是我們認為的人機協同機制。在這樣的機制下,人類智慧大爆炸時代正在到來,人工智能未來可以精準的滿足個性化需求。未來,在萬物互聯時代,手機也許會變成眼鏡,手表,鈕扣,胸針,因為任何設備都能聯網、交互,與每一個人的審美情趣和穿戴習慣有關。
在人工智能時代,各個細分領域的創業者更容易成功,他有自己獨特的創意,獨特的品位和感覺,就能打動獨特的人群,很難被其他巨頭用資金、數據和入口血洗出局,創業者擁有前所未有的歷史機遇,不再像原來的windows因特爾時代,以及像現在的安卓和ios,一兩個產品品類可以統天下。
各國政府也在高度關注這個趨勢,今年1月,日本正式提出超智能社會的發展規劃,美國11月正式出臺了人工智能產業規劃,而且專門出了一本教育美國民眾如何面對人工智能未來生活的專門規劃,兩本產業規劃包括科技產業、人文和倫理。
在中國,習近平總書記把科技創新提到前所未有的高度,在這個大框架下,今年4月8號,在工信部的指導下,科大訊飛領銜,我們跟華為等眾多企業一道發布了人工智能深圳宣言。這個宣言特別強調,第一,人工智能首先必須強調源頭技術創新,在核心技術上擁有話語權,你才會在未來的產業布局上具備優勢。
第二,必須強調人工智能產業生態。
第三,必須有標準體系。訊飛平臺上有21萬家合作伙伴,幾千種品類在研發,未來如何使這些設備互聯互通,節約投資,避免浪費,標準體系是當務之急。
當然還有法律法規和道德倫理,這是必須考慮的。剛才提到過《科學》雜志的預測,當人工智能時代全面到來,舊的工作崗位被替代,新的崗位還沒有創造之前,社會財富很有可能在相當長一段時間內由少數頂尖人工智能公司集中創造,社會的財富分配體系,救助體系和法律保障是什么樣的,今天就應該考慮。在今年兩會上我給張德江委員長當面匯報的,我提交的人大議案核心就跟這個有關,因為人工智能時代全面到來的時間會比我們想象的還要快,我們要做好準備。
道德倫理比較好理解,將來人工智能是服務人類的,不是顛覆和主宰人類,我們在倫理和人文上有一系列要研究的地方。我想強調的是,人工智能絕對跟每一位社會民眾,每一個企業,從中央到地方政府,都是密不可分的。全球的產業都面臨著轉型升級壓力,但這也是動力和機遇,中國推出中國制造2025這一行動綱領,對中國制造業的未來和產業發展是非常重要的指南,我們認為,中國制造2025一定要跟人工智能匹配在一起,否則未來的產業效率以及產業水平將遠遠跟不上時代的需要。
過去30年,我們創造了經濟上的奇跡,但在全球產業鏈上是處于價值鏈的低端的,未來30年,如果我們抓住人工智能產業機遇,我們將在全球價值鏈中有更大的話語權和影響力,如果我們丟掉人工智能話語權,我們將繼續給全世界打工,這就是我們面臨的現狀,所以一定要把人工智能和中國制造提到雙能驅動、并駕齊驅的戰略高度,要讓人工智能上升為真正的國家戰略,這不是一個企業、一個行業的事情,事關國家和民族全局。在人工智能第三次大潮到來之際,希望我們能夠齊心協力,精誠合作,共同用人工智能改變世界,謝謝大家。
圖片來源:找項目網