close

谷歌開發程序AlphaGo首次戰勝人類圍棋高手

計算機程序擊敗人類圍棋專業高手,原本被認為是人工智能10年後才能達到的成就。AlphaGo將在2016年3月迎戰世界冠軍李世乭




2016年1月28日,《自然》雜志發表論文並以封面故事展示瞭計算機圍棋程序“Al台中產後之家介紹phaGo”,它在一項競賽中以5比0戰勝歐洲圍棋冠軍樊麾。


【財新網】(實習記者 呂光一)近日,人工智能在同人類高手的的圍棋對弈中取得歷史性勝利。

2016年1月28日,《自然》雜志發表論文,並以封面故事展示瞭由谷歌旗下人工智能公司DeepMind研發的計算機圍棋程序“AlphaGo”,這項程序在一項競賽中以5比0的成績戰勝瞭歐洲圍棋冠軍樊麾。這是有史以來第一次,計算機程序在不讓子的情況下,在圍棋遊戲中擊敗人類專業高手,而這原本被認為是人工智能在10年後才能達到的成就。接下來,AlphaGo還將在2016年3月挑台中產後護理中心推薦戰世界冠軍棋手李世乭。

20多年來,人工智能在大眾棋類領域同人類的較量一直存在。從上世紀90年代中期戰勝全世界跳棋頂尖高手的Chinook程序,到戰勝國際象棋大師卡斯帕羅夫的深藍,通過一代代的更新發展,在這類以智力博弈著稱的遊戲中,人工智能刷新記錄,打敗人類,創下紀錄。

然而,一直以來,圍棋卻是個例外。在這次AlphaGo取得突破性勝利之前,計算機圍棋程序雖屢次向人類高手發出挑戰,但其博弈水平遠遠低於台中高級月子中心人類。在同職業高段位頂尖棋手的較量中往往隻能在“讓子”的情況下才能打個平手或是略勝一籌。2013年日本電腦圍棋“Crazy Stone”讓四子打敗瞭圍棋九段高手石田芳夫,2015年11月份韓國專傢林宰范研發的“DolBaram”程序在讓四子的情況下擊敗瞭前超一流棋手趙治勛九段。

之所以出現這種情況,是因為比之於計算國際象棋,計算圍棋要復雜得多。圍棋最大有3^361 種局面,大致的體量是10^170。而國際象棋最大隻有2^155種局面,體量大致是10^47。圍棋一盤大約要下150步,每一步有250種可選的下法,那麼一盤圍棋需要計算250^150種情況,大致是10^360。這是一個過於龐大的數字,傳統蠻力搜索在圍棋這裡並不可行。

因此,AlphaGo戰勝人類圍棋高手尤為難得。開發者大衛·斯爾弗(David Silver), 黃世傑(Aja Huang)和戴密斯·哈薩比斯(Demis Hassabis)運用深層卷積神經網絡來縮小傳統蒙特卡洛樹搜索的廣度和深度,以挑選最佳招數。“Alpha Go”的核心也正是兩種不同的深層神經網絡:策略網絡(policy network)和價值網絡(value network)。利用“價值網絡”去計算局面,根據局勢對路線進行取舍;用“策略網絡”選擇下子,減少不必要的棋步,在配合中選出有希望的好棋步,拋棄明顯差棋,從而將計算量控制在計算機可以完成的范圍內。

此外,開發者們還用兩種方式同步訓練AlphaGo,一是用許多專業棋局進行訓台中產後照護練的監督式學習(supervised learning),然後讓“Alpha Go”和自己對弈,這種方法稱為強化式學習(reinforcement learning)。在這種不斷的學習,反思和練習下,在同其他圍棋程序進行的總計495局的較量中取得隻輸一局的輝煌戰績。它的對手也包括Crazy Stone、Zen和Pachi三個先進的計算機圍棋程序。

在自然發表的論文中,AlphaGo與樊麾對戰五局,均取得瞭勝利。樊麾出生於中國,後入籍法國,曾獲歐洲圍棋冠軍,目前是法國國傢圍棋隊總教練。

“我開始以為會是我贏,”樊麾接受《自然》采訪時表示,在第一局落敗之後,他改變策略並更積極地反擊,但仍然失敗。“因為我們是人類,所以我們會犯錯誤、會疲倦,求勝之心也會帶來壓力。而程序並非如此,它非常的強大穩定,像一堵墻。”樊麾表示,他覺得AlphaGo棋路略有些奇怪,但仍然像是一個強大的真人對手。

“在觀察棋局時,如果不是預先知道,我很難看出來哪一方是電腦下的,”英國圍棋協會主席喬恩·戴蒙得(Jon Diamond)表示,在AlphaGo之前,最好的計算機程序也無法戰勝人類的業餘高手,因此他曾認為,計算機程序打敗人類專業高手在5-10年之後才會發生。

韓國專業旗手Hajin Lee則表示,從棋局記錄上來看,AlphaGo明顯強於樊麾,但它是否能夠戰勝世界頂尖選手仍然存疑 ,“也許,這個程序會遇強則強”。

圍棋界紛紛表示,AlphaGo對戰李世乭,將是令人期待的標志性戰役。韓國九段棋手李世乭是近10年中獲得世界冠軍頭銜最多的棋手,他的旗風屬於力戰型,善於敏銳地抓住對手的弱處主動出擊,以強大的力量擊垮對手。

面對挑戰,李世乭回應稱台中月子中心收費,這將是有史以來第一次計算機程序在不讓子的條件下挑戰人類最頂尖的專業高手,他將很榮幸地應戰。 “我聽說DeepMind的人工智能很強,並且越來越強,但我有信心,至少這次能夠贏得比賽。”。

韓國圍棋協會對這場未來的人機圍棋大戰表示歡迎,關於比賽結果,他們認為,“也許由於李世乭之前沒有跟計算機對弈的經驗,所以AlphaGo有可能贏個一兩局,但是難以獲得最終勝利。”

如果對這場比賽下賭註,英國圍棋協會成員、此前AlphaGo與樊麾戰局的裁判托比·曼寧(Toby Manning)笑稱,自己會押李世乭獲勝,“但我可能不敢賭上很多錢。”■


【音頻】O2O市場雙雄爭霸將走向何方?

聽!財新周刊:O2O變局 · 眾安招股 · 打破剛兌

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow

    d67gikl5z 發表在 痞客邦 留言(0) 人氣()