計(jì)算機(jī)學(xué)會(huì)ACM是計(jì)算機(jī)/信息領(lǐng)域最權(quán)威的全球組織。近期ACM對(duì)聯(lián)想集團(tuán)首席技術(shù)官、高級(jí)副總裁、ACM Fellow(會(huì)士)芮勇進(jìn)行了專訪,并將專訪的文章放在首頁醒目的位置予以展示。作為計(jì)算領(lǐng)域的杰出專家,芮勇博士在專訪中談到自己的學(xué)術(shù)研究生涯,并對(duì)行業(yè)未來的技術(shù)發(fā)展,比如智能手機(jī)、AR/VR以及多媒體計(jì)算等發(fā)表了自己前瞻性的看法和觀點(diǎn),干貨頗多。
學(xué)術(shù)研究生涯和多媒體計(jì)算的未來
芮勇博士是聯(lián)想集團(tuán)的首席技術(shù)官和高級(jí)副總裁,他也是聯(lián)想技術(shù)研究的領(lǐng)導(dǎo)者,專注于智能設(shè)備、人工智能、云計(jì)算、5G和智能生活等方面的技術(shù)研究。作為國(guó)際計(jì)算機(jī)學(xué)會(huì)ACM Fellow(會(huì)士),芮勇?lián)碛?5項(xiàng)美國(guó)和國(guó)際專利。他是如何一路走來,成為多媒體計(jì)算研究領(lǐng)域的杰出專家的呢?
芮勇談到他在本科和碩士時(shí)選擇了控制理論和大規(guī)模系統(tǒng)優(yōu)化,這對(duì)于后來從事多媒體領(lǐng)域研究的工作,比如相關(guān)性反饋、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等,都發(fā)揮了重要的作用。之后其前往伊利諾伊大學(xué)厄巴納-香檳分校讀博,開始多媒體分析和檢索的研究。在讀博期間,他抓住了一個(gè)機(jī)會(huì),參加了美國(guó)國(guó)家自然科學(xué)基金會(huì)設(shè)立并資助的 “數(shù)字圖書館”項(xiàng)目,將控制理論,信息檢索和計(jì)算機(jī)視覺這三個(gè)領(lǐng)域融合起來,進(jìn)行深入的跨學(xué)科研究,最終成為了第一批基于相關(guān)性反饋實(shí)現(xiàn)圖像搜索的研究者,為圖像搜索創(chuàng)造了一種全新的模式。
取得博士學(xué)位后,芮勇很快進(jìn)入了微軟,繼續(xù)從事多媒體分析、理解和檢索,機(jī)器學(xué)習(xí),計(jì)算機(jī)視覺和模式識(shí)別等領(lǐng)域的研究工作,在那里工作了18年,之后就進(jìn)入了現(xiàn)在的聯(lián)想,帶領(lǐng)團(tuán)隊(duì)推進(jìn)多媒體計(jì)算的發(fā)展,并將最前沿的多媒體研究成果融入到聯(lián)想的產(chǎn)品和服務(wù)中。
如今這個(gè)時(shí)代,每天都會(huì)產(chǎn)生大量的多媒體數(shù)據(jù)。如何看待未來多媒體分析和檢索的價(jià)值?芮勇表示,以深度學(xué)習(xí)為代表的人工智能算法正在并將繼續(xù)促進(jìn)多媒體研究,尤其近期深度學(xué)習(xí)較好構(gòu)建了基于多模態(tài)的算法框架,使得跨領(lǐng)域的多媒體數(shù)據(jù)的有效融合、利用/檢索成為可能。
比如圖像和視頻的描述,幾年前,描述能做的只是給圖像或視頻自動(dòng)打上標(biāo)簽,而深度學(xué)習(xí)建立了計(jì)算機(jī)視覺和自然語言處理之間的連接,可以將零散的標(biāo)簽變成一句基于視覺內(nèi)容并且通順連貫的自然語言描述。未來,圖像/視頻描述甚至將支持一段(多句)關(guān)于內(nèi)容的自然語言描述,也將支持更自然的用戶交互系統(tǒng);而支持的模態(tài)也會(huì)超越計(jì)算機(jī)視覺和自然語言處理的范圍,例如,可以導(dǎo)入語音特征、空間深度信息、文本特征等。
未來智能手機(jī)形態(tài)可能大變
聯(lián)想是智能手機(jī)的主要制造商之一,對(duì)于智能手機(jī)的未來,芮勇博士表示,未來像人工智能、VR/AR、5G、實(shí)時(shí)翻譯,新電池技術(shù)以及全息技術(shù)的發(fā)展,都會(huì)深刻改變智能手機(jī)和用戶的體驗(yàn)。
他表示,具體來說,無邊框屏,神經(jīng)網(wǎng)絡(luò)處理器(NPU),以及更多的傳感器可能會(huì)出現(xiàn)在智能手機(jī)上傳感器方面,手機(jī)將會(huì)融合生物特征傳感器、深度攝像頭,多攝像頭以及更好的計(jì)算機(jī)視覺技術(shù)。此外,5G的發(fā)展會(huì)將為手機(jī)帶來10倍帶寬和零延遲。
此外,他還提到,智能手機(jī)的形態(tài)也可能會(huì)發(fā)生很大的變化,其中一個(gè)可能是可折疊手機(jī)。2016年,聯(lián)想研究院曾研發(fā)出業(yè)界首個(gè)真正的可折疊手機(jī)原型CPlus和Folio。CPlus可以在手機(jī)和腕表之間轉(zhuǎn)換形態(tài),而Folio則可以在平板和手機(jī)之間隨意切換。
AR/VR技術(shù)正走向主流
AR/VR技術(shù)已經(jīng)存在了幾十年,為何現(xiàn)在才真正開始走向主流呢?芮勇博士表示,這是因?yàn)榻陙淼募夹g(shù)突破,比如光學(xué)鏡頭,計(jì)算機(jī)視覺以及即時(shí)定位與地圖構(gòu)建,讓AR/VR技術(shù)開始加速發(fā)展,巨大潛力開始顯現(xiàn)。另外,AR/VR可以幫助解決很多行業(yè)上的痛點(diǎn)問題,也能夠給用戶帶來全新的娛樂體驗(yàn)。
芮勇認(rèn)為,與VR相比,未來AR很可能會(huì)成為一個(gè)更大的、更有前景的平臺(tái)。尤其是當(dāng)AR與垂直行業(yè)結(jié)合時(shí),比如教育,培訓(xùn)以及工業(yè)維護(hù)等。在聯(lián)想2017Tech World上,聯(lián)想展示了研發(fā)的晨星AR(daystAR)眼鏡原型以及AR平臺(tái),一位工程師還在現(xiàn)場(chǎng)展示了如何利用這些AR設(shè)備和平臺(tái)維修出現(xiàn)故障的飛機(jī)發(fā)動(dòng)機(jī),這反映了VR在垂直領(lǐng)域擁有廣闊發(fā)展前景。另外,在IFA2017展會(huì)上,聯(lián)想還聯(lián)合迪士尼推出了一款由智能手機(jī)驅(qū)動(dòng)的AR設(shè)備Lenovo Mirage。
小結(jié):
多年來,我們一直在想象未來的世界會(huì)是什么樣?而在我們暢想、展望之前,許多像芮勇一樣的前沿技術(shù)專家,已經(jīng)默默做了很多前瞻性的研究和探索,他們比我們更先一步看到未來的世界。通過芮勇博士的分析和見解,我們看到深度學(xué)習(xí)為代表的人工智能算法正在改變多媒體研究,并將為我們社會(huì)帶來重要價(jià)值的新興應(yīng)用,同時(shí)也看到聯(lián)想在AR和智能手機(jī)上,也做了很多前沿性的嘗試。期待通過一批批中國(guó)企業(yè)和科研人員的奮斗和努力,這更美好的充滿智能的世界能早日來到。
版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載
關(guān)于CNMO | 聯(lián)系我們 | 站點(diǎn)地圖 | 精英招聘 | CNMO記事 | 家長(zhǎng)監(jiān)護(hù)工程 | 舉報(bào)不良信息
Copyright © 2007 -
北京沃德斯瑪特網(wǎng)絡(luò)科技有限責(zé)任公司.All rights reserved 發(fā)郵件給我們
京ICP證-070681號(hào) 京ICP備09081256號(hào) 京公網(wǎng)安備 11010502036320號(hào)