
李世石(右)與AlphaGo對弈,代替AlphaGo落子的是該人工智能程序研發(fā)團隊成員。供圖/視覺中國
昨天全世界的目光都集中在韓國首爾四季酒店。世界圍棋冠軍李世石與谷歌人工智能程序AlphaGo的首場圍棋比賽,經(jīng)過近4小時的鏖戰(zhàn),李世石投子認負,人工智能獲得首輪勝利。雙方第二局比賽于今日打響。
【意外】
李世石沒想到會輸
經(jīng)過3小時40分鐘的鏖戰(zhàn),這場舉世矚目的“人機大戰(zhàn)”分出了勝負。手握18座世界圍棋冠軍獎杯的李世石冷峻的臉上露出一絲苦澀的笑容,當比賽行至第186手后,看到形勢已無法逆轉的他投子認負。
“我沒想到會輸,但我從一開始就犯了錯,失誤也一直伴隨到最后,最終無力扭轉局面。我真的沒想到AlphaGo會以如此完美的方式贏得比賽?!被貞浧饎倓偨Y束的比賽,李世石遺憾地說。
時間回到3個多小時前,李世石為了本次比賽特意剪了一個清爽的“蓋兒頭”,但新發(fā)型并未給他帶來好運氣,比賽從序盤階段就充滿了緊張的氣氛。經(jīng)過猜先,李世石執(zhí)黑先行。有備而來的他選擇了并不常見的開局,以此給AlphaGo的計算和判斷制造麻煩。布局階段過后,黑棋形勢稍占優(yōu),尤其左下部幾乎都在李世石的掌控之下。
不過,近期不斷通過“深度學習”提升實力的AlphaGo毫不示弱,在處于下風時屢屢祭出狠招,給予李世石強力回擊。行至70多手,李世石的行棋沒有了序盤時的犀利和流暢,頻頻陷入長考。
隨著戰(zhàn)局深入,一開始還靠在沙發(fā)上比賽的李世石,基本上只坐在沙發(fā)的前半部分,身體微微前傾,雙臂交叉,似乎想更靠近棋盤,看清復雜的變化形勢。由于黑棋在棋盤右側實地的爭奪中接連出現(xiàn)失誤,原本的優(yōu)勢瞬間被白棋吞噬殆盡。
盡管AlphaGo的白棋也有細微漏招,但還是確保了中盤之后的優(yōu)勢地位。此后,李世石的表情變得相當尷尬,不斷用撓頭的方式來給自己減壓。AlphaGo在優(yōu)勢局面下沒給李世石留下任何逆轉的機會,后者中盤認輸。
對于AlphaGo展現(xiàn)出的實力,李世石有些吃驚。
他在賽后說:“首先是打開局面的能力,我預想布局對AlphaGo是個難點,但結果出乎我的意料,變成了對雙方來說都很困難的局面。此外,有些需要很強計算力才敢下的棋,AlphaGo都能下出來,令人驚訝。”
展望下盤比賽,李世石并未失去信心,“第一盤輸了并不會動搖我的信心。比賽才剛剛開始,我會繼續(xù)了解對手。雖然輸?shù)羰妆P,但我還是很享受這盤棋,也很期待后面的比賽。我覺得我的勝算還是比較大的,至少有五成把握?!?/p>
【熱議】
圍棋界對AlphaGo刮目相看
和賽前中、韓兩國職業(yè)圍棋界一邊倒地看好李世石不同,AlphaGo昨天取勝后已被職業(yè)棋手當成“怪獸”級別的對手來看待。
在現(xiàn)場解說比賽的韓國棋手金成龍九段直言,這場失利讓包括李世石在內(nèi)的大部分職業(yè)棋手倍感壓力?!捌迨衷诒荣愔杏凶约猴L格和情緒上的變化,但電腦程序沒有。我在盤中曾判斷AlphaGo的形勢不利,但它竟然能成功逆轉。AlphaGo下出了超越人類風格的棋,太令人驚訝了?!?/p>
中國圍棋隊主教練俞斌則認為,李世石的失利讓人腦5比0戰(zhàn)勝電腦的可能性不復存在,而且還存在被電腦橫掃的可能。他直言,“比賽中,電腦沒有明顯薄弱的地方,而李世石的錯誤卻是職業(yè)棋手經(jīng)常會犯的。”
近來多次在世界大賽中擊敗李世石的中國天才棋手、19歲的柯潔九段認為,李世石的強項是后半盤的翻盤能力,布局則是他最差的地方,判斷力也不是太好,這對AlphaGo來說是個重大利好,因為電腦一般強在后半盤。比賽結果也印證了柯潔的判斷。
柯潔還不忘給李世石支招兒,“AlphaGo確實下得很好,處理風格很簡單,目的明顯,跟我的下棋風格很像。每一步都想得很清楚,處于不利局面時會去拼,這點特別像人類的思維模式。而且它計算精準,后半盤對局面和目數(shù)的把控能力很強。”
柯潔認為,如果自己和AlphaGo對弈,必須在前面積攢下足夠的優(yōu)勢,才不會因后半盤的失誤導致失敗?!袄钍朗瘧摫M快忘掉失利,不要受首盤的影響。畢竟電腦在比賽中還是有失誤,完全可以被擊敗。”
中國圍棋隊領隊華學明則從另外一個層面看待“人機大戰(zhàn)”,她說:“大家不要覺得電腦戰(zhàn)勝了頂尖棋手,圍棋的神秘感就會消失。電腦因擁有深度學習、搜索和價值評估三大利器,具備了強大的實力??蛇@并不代表圍棋的全部,也無法體現(xiàn)出圍棋的思維和深邃的內(nèi)在,在這方面,電腦需要‘學習’的還很多。”
【探秘】
神經(jīng)網(wǎng)絡算法造最強“大腦”
全球圍觀的“人腦榮譽保衛(wèi)戰(zhàn)”,讓人工智能AlphaGo一戰(zhàn)封神。但在人們心底積聚下來的好奇與疑惑卻如雪球般越滾越大:AlphaGo作為一款圍棋人工智能程序,如何練就最強“大腦”?
據(jù)介紹,AlphaGo的核心是兩種不同的深度神經(jīng)網(wǎng)絡?!安呗跃W(wǎng)絡”和 “價值網(wǎng)絡”,它們的任務在于合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計算量控制在計算機可以完成的范圍里——本質(zhì)上,這和人類棋手所做的一樣。
其中,“價值網(wǎng)絡”負責減少搜索的深度——AI會一邊推算一邊判斷局面,局面明顯劣勢的時候,就直接拋棄某些路線,不用一條道算到黑;而“策略網(wǎng)絡”負責減少搜索的寬度——面對眼前的一盤棋,有些棋步是明顯不該走的,比如不該隨便送子給別人吃。
AlphaGo利用這兩個工具來分析局面,判斷每種下子策略的優(yōu)劣,就像人類棋手會判斷當前局面以及推斷未來的局面一樣,這樣AlphaGo在分析了比如未來20步的情況下,就能判斷在哪里下子贏的概率會高。
AlphaGo的強大,一方面體現(xiàn)在它能迅速汲取10萬圍棋高手的棋局,充分利用人類棋手的即有經(jīng)驗;另一方面體現(xiàn)在可以每天上萬盤的自我“左右互搏”。
今年1月,負責研發(fā)該項目的Deep Mind團隊就曾透露,AlphaGo在四周的時間里完成了100萬局的自我對局,也就是說,它一天可以自我對局3萬局,在不斷的試錯中自我完善、自我進化。而這樣“左右互搏”的練習體量,對人類來說是不可想象的。
據(jù)介紹,AlphaGo背后是一群杰出的谷歌工程師們夜以繼日的進行程序編程,工程師們利用神經(jīng)網(wǎng)絡算法,將棋類專家的比賽記錄輸入給計算機,并讓計算機自己與自己進行比賽,在這個過程中不斷學習訓練。某種程度上講,AlphaGo的棋藝不是開發(fā)者教給他的,而是自學成才。
【效應】
百萬獎金噱頭的全球營銷
不管最終的勝負幾何,這場百萬獎金噱頭炮制的商業(yè)營銷可謂賺了個盆滿缽滿。
這場比賽讓谷歌和圍棋得到了一次全球的關注。在國內(nèi),騰訊視頻、圍棋TV、樂視體育等15家網(wǎng)站邀請專業(yè)棋手和嘉賓對比賽進行直播。在東亞地區(qū),圍棋熱也再一次掀起。在韓國,進入3月,從農(nóng)心杯到人機大戰(zhàn),圍棋的熱度幾乎覆蓋了各個媒體。
“這稱得上近年來,中國圍棋界乃至世界圍棋界關注度最高的賽事了。”中國圍棋協(xié)會主席王汝南感慨,與眾多圍棋界人士一樣,王汝南認為拋開輸贏這都是圍棋的勝利,“全世界都關注圍棋,這在圍棋運動歷史上,也是里程碑式的?!?/p>
同時,以谷歌為代表的AI研究公司也將隨即迎來新一輪的發(fā)展高潮。
今年3月7日,來自中國團隊異構智能也宣布將研發(fā)圍棋人工智能“異構神機”,挑戰(zhàn)另一位世界圍棋冠軍柯潔。值得玩味的是,就在3月6日農(nóng)心杯上,柯潔剛剛戰(zhàn)勝了李世石。此前Facebook也宣布開發(fā)了圍棋人工智能黑色森林。扎克伯格更是興奮地在Facebook上寫道:“20年來,科學家們一直在努力教電腦如何贏得圍棋比賽,我們已經(jīng)快要成功了!”
而對于此次對壘的雙方——李世石和AlphaGo也將成為人工智能發(fā)展史上無法抹去的一部分。據(jù)了解,李世石與AlphaGo展開的5盤對局,勝者獎金為100萬美元。而李世石每盤對局費為3萬美元,每贏一盤還將獲得2萬美元的獎金,也就是說,如果李世石5盤全勝,將獲得125萬美元獎金,即使沒有贏,李世石也會因參與到這樣一場舉世矚目的人機大戰(zhàn)而留名史冊。
對此場人機大戰(zhàn),柯潔直言不諱地表示,“這是一次完美的營銷。宣傳完美,谷歌花了百萬美元,如今是股價大漲,多少個100萬都掙回了。同時對圍棋而言也是一次極完美的推廣,全世界很多人,不管會不會下圍棋,都會盯著這場舉世矚目的大戰(zhàn)?!?/p>
關于人工智能的討論也在迅速擴大著邊界。著名創(chuàng)業(yè)者、創(chuàng)新工場首席執(zhí)行官李開復就表示,深度學習的技術還有非常大的數(shù)據(jù)量和計算量可以擴張的使用,超過了想象,比如股市中,人工智能可以輸入一些判斷的知識,買股票方面機器人會超過人。
但正如谷歌董事長施密特所言,無論誰在比賽中獲勝,人類都將是最大的贏家。(記者 王洋 范曉)
(責任編輯:梁艷)