德州撲克人機(jī)大戰(zhàn)前 我們和它背后的AI專家長(zhǎng)談了一番

來(lái)源:網(wǎng)絡(luò) 時(shí)間:2017-03-30 17:49:19

德州撲克人機(jī)大戰(zhàn)前 我們和它背后的AI專家長(zhǎng)談了一番

2015年創(chuàng)新工場(chǎng)CEO李開復(fù)(微博)獲卡內(nèi)基梅隆大學(xué)頒給榮譽(yù)博士畢業(yè)演講前,與計(jì)算機(jī)學(xué)院院長(zhǎng)Andrew Moore合影(中:李開復(fù)/右:Andrew Moore)

文/騰訊科技 孫實(shí)

近日,一條關(guān)于“人機(jī)大戰(zhàn)”的新聞刷遍了朋友圈。這次不是比賽圍棋,而是德州撲克。

2017年4月6日至10日,由創(chuàng)新工場(chǎng)CEO李開復(fù)發(fā)起,邀請(qǐng)母校美國(guó)卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)知名的Libratus撲克機(jī)器人主創(chuàng)團(tuán)隊(duì)訪問(wèn)中國(guó),于海南進(jìn)行一場(chǎng)“冷撲大師v.s.中國(guó)龍之隊(duì)—人工智能和頂尖牌手巔峰表演賽”,對(duì)陣由中國(guó)撲克高手杜悅帶領(lǐng)的“中國(guó)龍之隊(duì)”,這也是亞洲首度舉辦的人工智能與真人對(duì)打的撲克賽事。

在比賽前夕,騰訊科技也專訪到卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)學(xué)院院長(zhǎng)Andrew Moore,就冷撲大師的算法、應(yīng)對(duì)德州撲克心理戰(zhàn)、未來(lái)商業(yè)化等話題進(jìn)行了交流。

冷撲大師的基礎(chǔ)是大量的數(shù)學(xué)計(jì)算

眾所周知,心理戰(zhàn)是德州撲克相當(dāng)重要的一部分,除去無(wú)法控制的運(yùn)氣,和累積經(jīng)驗(yàn)下來(lái)的技術(shù),剩下就是心理層面的,這也是德州有趣的地方。所以,通過(guò)對(duì)手的動(dòng)作表情判斷對(duì)手牌的強(qiáng)弱,是德州撲克相當(dāng)重要的一種游戲技巧,而冷撲大師作為一個(gè)冷冰冰的人工智能系統(tǒng),是如何應(yīng)對(duì)人類棋手復(fù)雜的心理戰(zhàn)呢?

對(duì)于騰訊科技的這個(gè)疑問(wèn),Andrew Moore表示,冷撲大師并沒(méi)有用到任何心理戰(zhàn)的機(jī)制,完全用的是大量的數(shù)學(xué),實(shí)際算法并不是讓機(jī)器學(xué)習(xí)所謂“詐和”的招數(shù),而且是算出詐和的數(shù)量要在多少才是最為優(yōu)化的,多一點(diǎn)還是少一點(diǎn)才能產(chǎn)生最高的勝率。

和AlphaGo有哪些不同?

作為知名的人工智能系統(tǒng),冷撲大師免不了會(huì)與AlphaGo進(jìn)行一番比較。Andrew Moore認(rèn)為,其實(shí)撲克比圍棋來(lái)說(shuō),游戲規(guī)則相對(duì)簡(jiǎn)單,但具有大量的隱藏信息。圍棋沒(méi)有隱藏信息,但是每一步必須進(jìn)行很深、很廣的搜索。在撲克上面,難處在于有非常多不同的詐和招數(shù),程序必須每招去一一進(jìn)行檢查。撲克AI并沒(méi)有用到神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)這兩種技術(shù),反倒是用了一種比較古典的線性規(guī)劃。

助力談判博弈或是商業(yè)化前景

任何一種技術(shù),最終肯定是要服務(wù)人類、幫助企業(yè)盈利,關(guān)于冷撲大師的商業(yè)計(jì)劃,Andrew Moore表示,他自己最喜歡的一個(gè)商業(yè)應(yīng)用是在所謂的企業(yè)交易或者是企業(yè)談判,未來(lái)貨物的供需或者貨物的交易,可以更快地用這種AI驅(qū)動(dòng)的商業(yè)談判算法來(lái)進(jìn)行,甚至可以通過(guò)AI去摸清談判對(duì)象的底線和談判邏輯。

以下為騰訊科技整理的專訪實(shí)錄:

騰訊科技:打德州撲克很重要的一個(gè)因素是心理戰(zhàn),我想知道在心理戰(zhàn)當(dāng)中人工智能如何發(fā)揮作用的?

Andrew Moore:我們CMU學(xué)校所研發(fā)的人機(jī)撲克對(duì)戰(zhàn),背后并沒(méi)有用到任何心理戰(zhàn)的機(jī)制,完全用的是大量的數(shù)學(xué)。所以舉撲克中的詐和,實(shí)際演算法里面并不是讓機(jī)器學(xué)詐和的招數(shù),而且是算出詐和的數(shù)量要在多少才是最為優(yōu)化的,多一點(diǎn)詐和還是少一點(diǎn)詐和才能產(chǎn)生最高的勝率,背后還是數(shù)學(xué)。

騰訊科技:未來(lái)冷撲大師AI商業(yè)化的運(yùn)作怎么樣?除了通過(guò)打德州撲克驗(yàn)證了它處理不完美信息的能力,未來(lái)商業(yè)化最終的目的是什么?

Andrew Moore:我自己最喜歡的一個(gè)商業(yè)應(yīng)用是在所謂的企業(yè)交易或者是企業(yè)談判,未來(lái)貨物的供需或者貨物的交易,可以更快地用這種AI驅(qū)動(dòng)的商業(yè)談判算法來(lái)進(jìn)行。

騰訊科技:是指在談判過(guò)程當(dāng)中根據(jù)大數(shù)據(jù)得出對(duì)方的底價(jià),或者推敲對(duì)方議價(jià)的邏輯嗎?

Andrew Moore:是的,這個(gè)過(guò)程當(dāng)中的商業(yè)談判就可以被自動(dòng)化,AI會(huì)驅(qū)動(dòng)自動(dòng)化時(shí)代的到來(lái)。

問(wèn):撲克機(jī)器人最大的亮點(diǎn)是可以處理信息,也學(xué)會(huì)隱藏信息,是不是意味著電腦很快有一天也能夠?qū)W會(huì)主動(dòng)隱藏信息,如果這樣的事情發(fā)生,這樣會(huì)不會(huì)讓人們覺(jué)得非常的恐懼跟擔(dān)憂?

Andrew Moore:我分兩部分回答這個(gè)問(wèn)題,第一部分關(guān)于現(xiàn)在我們CMU在研發(fā)的AI談判技術(shù),其中一部分是關(guān)于隱藏事實(shí)。其中一個(gè)領(lǐng)域是關(guān)于拍賣或者競(jìng)標(biāo)的形式,現(xiàn)在競(jìng)拍的形式在很多地方都已經(jīng)被廣泛應(yīng)用了,比如說(shuō)廣告的競(jìng)價(jià)排名,甚至一些物流運(yùn)輸業(yè)行業(yè)也用到競(jìng)拍競(jìng)標(biāo)的機(jī)制,競(jìng)拍中間的過(guò)程其實(shí)相對(duì)是復(fù)雜的,雙方要經(jīng)過(guò)序列式的猜測(cè),我先猜你再猜,所以有一個(gè)順序性的隱藏信息在逐步被揭露。

現(xiàn)在有一個(gè)非常聰明的機(jī)制,這個(gè)聰明的機(jī)制基于不同于傳統(tǒng)競(jìng)標(biāo)方式的一個(gè)演算法,叫做第二價(jià)格競(jìng)拍,但目的是為了去贏得這個(gè)競(jìng)拍,研究出來(lái)最好的策略是永遠(yuǎn)保持誠(chéng)實(shí)。這個(gè)機(jī)制當(dāng)中,科學(xué)家在發(fā)明AI談判算法的時(shí)候所用的策略就是盡可能地促使每一個(gè)參與者都說(shuō)實(shí)話,第二價(jià)格競(jìng)拍其實(shí)在傳統(tǒng)拍賣行業(yè)中不是一個(gè)新制度,但在AI領(lǐng)域反而促進(jìn)了全新發(fā)明。

第二部分說(shuō)明,是有關(guān)對(duì)抗所有的網(wǎng)絡(luò)攻擊或者垃圾郵件的技術(shù)。所有電子郵箱的服務(wù)供應(yīng)商過(guò)往都投注大量資源研發(fā)各種方法來(lái)阻擋垃圾郵件,但是他們絕對(duì)不能公布這些方法,一旦公布很快就會(huì)被破解了,被想攻擊的不法分子所用。對(duì)于所謂的“壞蛋”,我們反而是需要一些被隱藏的演算法來(lái)欺騙他們,不告訴他們實(shí)話。

你問(wèn)到科學(xué)家在做的算法或者所發(fā)明的程序,會(huì)不會(huì)有一天自己有學(xué)習(xí)能力反過(guò)來(lái)欺騙了人類?我的回答是,在現(xiàn)階段還沒(méi)有什么方式會(huì)促使電腦自己產(chǎn)生動(dòng)機(jī)去做這件事情,現(xiàn)階段的技術(shù)領(lǐng)域,電腦沒(méi)有辦法自行產(chǎn)生一個(gè)動(dòng)機(jī)想去欺騙人。

問(wèn):AI圍棋和AI撲克有什么不同?AI撲克是否用到神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)?

Andrew Moore:其實(shí)撲克比圍棋來(lái)說(shuō),游戲規(guī)則相對(duì)簡(jiǎn)單,但具有大量的隱藏信息。圍棋沒(méi)有隱藏信息,但是每一步必須進(jìn)行很深、很廣的搜索。在撲克上面,難處在于有非常多不同的詐和招數(shù),程序必須每招去一一進(jìn)行檢查。撲克AI并沒(méi)有用到神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)這兩種技術(shù),反倒是用了一種比較古典的線性規(guī)劃(linear programming)。

問(wèn):請(qǐng)您談?wù)剬?duì)于中國(guó)AI市場(chǎng)的看法,以及AI技術(shù)在中國(guó)市場(chǎng)的潛力。

Andrew Moore:我對(duì)于現(xiàn)在在中國(guó)市場(chǎng)對(duì)AI領(lǐng)域有這么熱切的投資興趣非常認(rèn)同,更重要的是,我們看到AI能夠很實(shí)質(zhì)在不同產(chǎn)業(yè)被大量導(dǎo)入在自動(dòng)化領(lǐng)域,很多現(xiàn)在的產(chǎn)業(yè)運(yùn)作方式會(huì)被大量的自動(dòng)化。我個(gè)人對(duì)于去發(fā)展一些平臺(tái)式技術(shù)不那么感興趣,我更感興趣的是一些特定垂直領(lǐng)域的解決方案,特別是能在實(shí)際生活或商業(yè)上被用到的場(chǎng)景,所以我也鼓勵(lì)中國(guó)的創(chuàng)業(yè)者,盡量設(shè)定特定垂直領(lǐng)域的一些應(yīng)用發(fā)展。

比如說(shuō)兩個(gè)例子,一個(gè)是某個(gè)創(chuàng)業(yè)者針對(duì)有自閉癥的孩子去研發(fā)一種新的解決方案,這就非常棒。但是如果只是平臺(tái)式思維想要讓機(jī)器學(xué)習(xí)更精進(jìn)那么一點(diǎn)點(diǎn),就不怎么吸引我。

繼續(xù)閱讀與本文標(biāo)簽相同的文章

分享至:

你可能感興趣 換一換

分享到微信朋友圈 ×
打開微信,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。