2017-12-04 00:55:27vbn91rn95f
有片/AlphaGo再進化 3天學完人類圍棋數千年發展棋路
在今年5月下旬擊敗世界棋王柯潔後,Google DeepMind團隊並未停下腳步,更是在日前提出讓AlphaGo可自我審視學習情況下持續精進。而稍早宣布推出的新版本AlphaGo Zero,DeepMind團隊更是以白紙般「返樸歸真」,強調在費時3天的自我對弈之下,幾乎走完人類花費千年累積的圍棋歷史,更在對弈過程中摸索全新棋路,相比去年擊敗南韓棋王李世乭的AlphaGo版本,更是創下100:0的完勝表現。 分享 facebook 根據DeepMind團隊執行長Demis Hassabis,以及AlphaGo項目負責人Dave Sliver說明,新版本AlphaGo Zero完全以棋盤上所下黑子、白子位置做判斷,相比過往仍會參考人為下棋習慣為參考作法不同,同時將過往策略網絡、價值網絡形式預測方式合併,透過單一類神經網絡運算方式判斷所有棋路,並且不再僅以最快方式判斷下子位置,新系統甚至可能在不同棋路會有較長「思考」時間。加上先前DeepMind團隊提出自我審視與休眠時仍持續自我訓練的運作模式,或許也讓AlphaGo Zero能累積更敏銳的下子判斷能力,透過3天持續訓練之下,從零基礎快速學習人類過去在圍棋上累積數千年的發展經驗,藉此創下以100:0成果擊敗先前與南韓棋王李世乭的AlphaGo版本,並且在40天對弈過程中超越曾經擊敗世界棋王柯潔的Master版AlphaGo。而在對弈過程中,AlphaGo Zero不但將人類過往所下棋路全數學習,更推演出打破常規的全新棋路,意味人工智慧將能協助人類在既有資料中重新挖掘過往未曾留意的有價數據,藉此協助推動全新發展。不過,如此一來可能也會讓更多人再次擔憂未來是否將由電腦主宰一切,但從許多看法認為,人工智慧技術發展過程中必然需要設下諸多避免系統產生矛盾情況,並且在必要時候仍可讓人可介入終止運算,避免原本期望帶來便利應用的發展變成危機?