顯示具有 麻將 標籤的文章。 顯示所有文章
顯示具有 麻將 標籤的文章。 顯示所有文章

2019年10月2日 星期三

人工智慧爭輸贏!麻將AI與圍棋AI大PK(下)

人工智慧Suphx勝出不是沒有道理的!


人工智慧Suphx勝出不是沒有道理的!

「全新機制、教練先知、全面預測」對付麻將AI研發瓶頸


全新機制應對「巨大的狀態空間」

首先,為了應對「巨大的狀態空間」,研究團隊引入了全新的機制,對探索過程的多樣性,進行動態調控,讓 Suphx 可以比傳統算法更加充分地試探牌局狀態的多種可能。另一方面,一旦某一輪的底牌給定,其狀態子空間會大幅縮小。所以研究團隊讓Suphx 在推理階段可以根據本輪的牌局,來動態調整策略,對縮小了的狀態子空間進行更有針對性的探索,進而更好地根據本輪牌局的演進做出自適應的決策。

「先知教練技術」應對「非完美資訊」

其次,對於「非完美訊息」博弈的挑戰,Suphx 創新性地嘗試了先知教練技術來提升強化學習的效果。其基本思想是在自我博弈的訓練階段,利用不可見的一些隱藏訊息,以此來引導 AI人工智慧 模型的訓練方向,使其學習路徑更加清晰、更加接近完美資訊意義下的最佳路徑,從而倒逼 AI人工智慧 模型更加深入地理解可見信息,從中找到有效的決策依據。

「全盤預測技術」理解「復雜的獎勵機制」

另外,對於麻將復雜的牌面表達和計分機制,研究團隊還利用全盤預測技術搭建起每輪比賽和8輪過後的終盤結果之間的橋樑。這個預測器通過精巧的設計,可以理解每輪比賽對終盤的不同貢獻,從而將終盤的獎勵信號合理地分配回每一輪比賽之中,以便對自我博弈的過程進行更加直接而有效的指導,並使得Suphx可以學會一些具有大局觀的高級技巧。

得益於以上新技術和其他方面的創新,自今年 3 月進入天鳳平台以來,Suphx 在與人類玩家的對局中,學習進度可說是非常快。目前,在平衡攻擊和防禦方面,Suphx 表現出了比許多頂尖人類玩家更明智的策略,能夠戰略性地完成短期損失與長期收益之間的權衡,並根據已有的模糊信息進行快速決策。

Suphx 一直在不斷學習與進步,研究團隊也一直在對 Suphx 背後核心算法的價值進行評估、反思和重複回饋過程,從而實現進一步的改進和提升。劉鐵岩表示「 雖然 Suphx 根據麻將的獨特挑戰,進行了針對性的設計,也取得了不錯的戰績,但我們的創新從未停止。我們期待在不久的將來發明出更新穎、更強大的AI人工智慧 技術,使得Suphx 的能力有更大幅度的提升。縱觀歷史、遊戲AI人工智慧 的進化始終與AI人工智慧 研究進展相生相伴,很多關於人工智能的研究都起源於研究如何構建能夠完成遊戲的智能體。我們希望藉由對 Suphx 的研究來探索及擴展已有AI人工智慧技術的邊界,可以不斷推動人工智慧領域的進步。」


相關文章

人工智慧爭輸贏!麻將AI與圍棋AI大PK(上)

做Python小遊戲,第一次就上手!

掌握Python第一步-加減乘除四則運算

暑假快到了!與其讓兒子盲目拚學測,我寧可讓他先選擇人生方向~

人工智慧連資源回收都能處理,太便利了!!

人工智慧也能放到音樂錄影帶中引領潮流?

你必須知道的:AI人工智慧與機器學習的發展三階段!

2019年10月1日 星期二

人工智慧爭輸贏!麻將AI與圍棋AI大PK(上)

人工智慧PK!麻將AI與圍棋AI互尬誰會贏?


人工智慧PK!麻將AI與圍棋AI互尬誰會贏?



為何我們會想寫這篇文章?

大家看到了這篇文章:AI人工智慧又贏了!微軟Suphx突破日本麻將最高紀錄,打敗人類頂尖玩家後,可能會聯想到 Google 開發的圍棋人工智慧 Alpha Go 於兩年前,以近乎完美的姿態打敗了人類選手,李世乭和柯潔的新聞。根據微軟所說:研發麻將 AI 人工智慧的技術門檻,可說是比研發圍棋、德州撲克等棋牌、博弈類的遊戲難多了!這是真的嗎?這篇取材自微軟亞洲研究院的新聞稿,將跟有這疑惑的大家解釋解釋,為何同樣是人工智慧,研發 AI 麻將技術門檻就是比 Alpha Go 等棋類 AI 還高得多呢?


微軟:麻將變動度,更勝圍棋德州撲克等

微軟在近期的新聞稿上提到了開發麻將 AI 人工智慧「Sphix」難度與象棋、圍棋、德州撲克等棋牌類遊戲相比,麻將具有更復雜的隱藏信息和更高的難度。總言而之,麻將 AI 人工智慧主要面臨以下挑戰:

巨大的狀態空間:

和只有 52 張牌的德州撲克相比,136 張麻將牌的排列組合擁有更多組合的可能性。同時,麻將中同一個玩家在兩次出牌之間,夾雜了其他 3 個玩家的出牌和自己摸的底牌,可能出現的不同局面數目非常巨大。值得一提的是,在麻將中,4 位玩家的出牌順序是不固定的,任意一位玩家的「吃」、「碰」、「槓」都可能改變出牌順序,導致遊戲順序的不規則和莫大的變化。這些變動使麻將真的很難直接利用 AlphaGo 等棋盤遊戲 人工智慧 常用的蒙特卡洛樹搜索算法。

非完美資訊遊戲:

賽局理論中,資訊集合是指對於特定的參與者,建立於其所觀察到的所有賽局中可能發生的行動的集合。如果賽局是完美資訊的,每個資訊集合只能有一個參與者,並顯示賽局所處的階段。否則,有的參與者可能就不知道賽局的狀態,以及自己周圍的形勢。
象棋和圍棋屬於完美資訊遊戲,玩家可以看到棋局中對方玩家的落子。麻將則存在大量的隱藏資訊。整體來說,麻將中每個玩家可以有 13 張手牌,另外還有 84 張底牌。對於一個玩家而言,他只知道自己手裏的 13 張牌和之前已經打出來的牌,卻無法知道別人的手牌和沒有翻出來的底牌,所以最多可以有超過 120 張未知的牌。這麽多的未知資訊,使得麻將的難度非常高。一方面,由於隨機性太大,玩家即便在出牌決策中估計對方玩家手牌、底牌等不可見的牌,也無法避免不確定性對於遊戲走向的影響。這將對 AI人工智慧 模型的訓練帶來很大挑戰:AI人工智慧 模型很難發現已知牌面信息和最優打法之間的邏輯鏈路。另一方面,豐富的隱藏信息導致遊戲樹的寬度非常大,對樹搜索算法的可行性提出了進一步的挑戰。

復雜的獎勵機制:

日本麻將的規則是「無役不能和牌」,多樣又特殊的牌面,構成了復雜的「役種」和番數計算規則。一輪遊戲共包含 8 局,單局得分與役種和番數相關,最後根據 8 局的得分總和進行排名,來形成最終影響段位的點數獎懲。因此有時麻將高手會策略性輸牌,例如,在第 8 輪時如果 A 玩家已經大比分領先第二名,他可能會故意放炮給排名第四的玩家,來防止總分被排名第二的玩家反超,保證自己在最終結算時獲得最大的點數獎勵。這為構建高超的麻將 AI人工智慧 策略帶來了額外的挑戰,AI人工智慧 需要審時度勢,把握進攻與防守的時機。
「面對麻將遊戲的巨大挑戰,AI人工智慧 僅靠強大的計算能力,沒辦法從根本上解決問題,而需要更強的直覺、預測、推理和模糊決策能力」微軟亞洲研究院副院長、機器學習領域負責人劉鐵巖博士表示。

為了讓 Suphx 能高效地學習麻將的複雜狀態和策略,微軟亞洲研究院特別針對麻將的特點與困難度,嘗試了一系列的「基於強化學習」的新式演算法,希望透過技術面的創新,讓 Suphx 具備強大有效的「狀態表達」和「策略學習」能力,同時具有「大局意識」,能從遊戲的全局角度做出策略性的判斷,確保統計意義上總分的領先地位。



相關文章

人工智慧爭輸贏!麻將AI與圍棋AI大PK(下)

真人冒充人工智慧,幕後藏鏡人是誰!?(上)

真人冒充人工智慧,幕後藏鏡人是誰!?(下)

暑假快到了!與其讓兒子盲目拚學測,我寧可讓他先選擇人生方向~

Python基礎概念知識站:變數

還不知java這名字怎麼來的?快看這些程式語言的名字由來!

超強!這個工程師用Python畫皮卡丘練手感

2019年8月30日 星期五

這讓人怎麼活啊!連麻將都難不倒人工智慧! (4)

人工智慧Suphx連日本雀士界名人都讚嘆不已!




人工智慧Suphx連日本雀士界名人都讚嘆不已!




 

Suphx 的強大,獲日本雀士界名人讚嘆



 

日本家喻戶曉的知名麻將玩家朝倉康心(天鳳 ID 為「ASAPIN」)是天鳳玩家中率先成為「天鳳位」的第一人,是公認天鳳位中最強玩家之一。連他都對 Suphx 甘拜下風,在社交媒體上表示:「我看了 AI人工智慧 Suphx 的比賽,我感覺它好像比我更強大!」他還表示:「有種《獵人》漫畫尼特羅會長看到尼飛彼多的感覺。」

今年 6 月「太くないお」 成為世界上第 15 名取得三人麻將天鳳位的玩家,他也是第一位在四人麻將和三人麻將中均取得天鳳位的頂級玩家。他說:「我已經看了300 多場 Suphx 的比賽,我甚至不再觀看人類玩家的比賽了。我從Suphx 身上學到很多新技術,對於我的三人麻將打法,有著非常大的啟發意義。」

Suphx 的傑出表現也獲得了天鳳平臺官方的認可與青睞:「毫無疑問,Suphx 是至今段位最高的麻將 AI。我們正考慮將 Suphx 的所有比賽錄影歸檔,以分享給全平臺的麻將玩家參考學習。我們也正和麻將社區中眾多的玩家討論,是否可以破例允許 人工智慧 Suphx 進入只有人類玩家才能參與的「鳳凰房」進行比賽。這樣,我們將有機會欣賞到更加激烈和精彩紛呈的比賽。」

天鳳平臺開發公司 C-EGG 的 CEO 角田真吾表示:「這是一項巨大的突破, 人工智慧 Suphx 不僅幫助我們用更智能的方式發展傳統文化,更顯示出擴張 AI 能力極限的可能性,我想這對天鳳平臺、麻將社區乃至社會都是一個令人振奮的事情。」

直至八月底,微軟在記者會過後發出新聞稿,講述 Suphx 的 AI 核心技術、研究成果等等。


至於微軟在研發 AI人工智慧 Suphx 有遇到什麼樣的挑戰呢?請看這篇:人工智慧麻將Suphx研發難度更勝AlphaGo?看看微軟怎麼說!



推薦文章

這讓人怎麼活啊!連麻將都難不倒人工智慧! (1)

這讓人怎麼活啊!連麻將都難不倒人工智慧! (2)

這讓人怎麼活啊!連麻將都難不倒人工智慧! (3)

暑假快到了!與其讓兒子盲目拚學測,我寧可讓他先選擇人生方向~

在對抗Python或Java時,你需要最適當的音樂阿~~

充斥人工智慧的未來你能想像嗎?今天這個金屬樂團給你點方向!

你有人工智慧幫你點餐的經驗嗎?去這家麥當勞就知道啦! 

2019年8月29日 星期四

這讓人怎麼活啊!連麻將都難不倒人工智慧! (3)

AI人工智慧再度打敗人類頂尖玩家! Suphx強勢竄升突破日本麻將最高紀錄!

AI人工智慧再度打敗人類頂尖玩家! Suphx強勢竄升突破日本麻將最高紀錄!




目錄
  1. 為何我們會想寫這篇文章?
  2. 關於職業麻將高手齊聚的平台「天鳳」
  3. 強勢竄升到天鳳十級的人工智慧「 Suphx 」
  4. Suphx 的強大,獲日本雀士界名人讚嘆

 

強勢竄升到天鳳十級的人工智慧「 Suphx 」

今年 6 月,由微軟亞洲研究院開發的麻將 AI人工智慧 系統 Suphx 成為首個在國際知名專業麻將平臺「天鳳」上,榮升十段的 AI人工智慧 ,這是目前 AI人工智慧 在麻將領域取得的最好成績,其實力超越該平臺公開房間頂級人類選手的平均水平。

Suphx,據「天鳳」官方解釋是Super Phoenix 之意。

麻將平台「天鳳」管制嚴格,使用 AI人工智慧 在其平台上打牌一率算為違規。若真的要使用 AI 打牌,必須獲得官方的批准。在 33 萬玩家中,目前被批准的 AI 人工智慧只有三個:前面提過的「爆打」、「NAGA25」以及在這次要介紹的主角——今天三月被批准的「Suphx」。

這些 AI 人工智慧都是基於深度學習 (deep learning) 的模式如下:
透過深度學習該平台上程度較高「天鳳鳳凰桌」的牌局,研究、分析並找出 AI 自己的思考方式。在分析的過程中,邏輯、細節與會依照其開發工程師的不同,而有所差異。到底哪種方法最好,就由牌局的結果來反應。

AI 人工智慧可以日以繼夜24 小時進行 PK,因此這三個人工智慧 AI 都可以累積大量的對局經驗,以下是三個 AI人工智慧 在天鳳平台上第二高等級的「特上桌」(註:天鳳會根據玩家的段位及 Rate 值把玩家們劃分成四個部分,由高至低分別為:鳳凰桌、特上桌、上級桌以及一般桌,以隔開不同水平的玩家。)半莊戰的成績:
人工智慧「暴打」AI 對戰 30516 次、穩定段位 6597、最高段位九段;
人工智慧「NAGA25」AI 對戰 9557 次、穩定段位 6644 、最高段位八段;
人工智慧「Suphx」AI 對戰 5760 次、穩定段位 8748、最高段位十段。
從以上的數值可看出,Suphx 大勝另外兩個 AI 人工智慧。取樣樣本很大,在統計學上亦被採信。

Suphx 三月加入天鳳戰局至六月底,僅短短四個月內,就以壓倒性的勝利,達到天鳳十段,可說是一鳴驚人。不過當時微軟尚未正式發表 Suphx,因此吸引許多「鍵盤柯南」爭相找出其開發者,開發方式仍是個謎。



請看本系列文章下一篇:Suphx 的強大,獲日本雀士界名人讚嘆



推薦文章

這讓人怎麼活啊!連麻將都難不倒人工智慧! (1)

這讓人怎麼活啊!連麻將都難不倒人工智慧! (2)

這讓人怎麼活啊!連麻將都難不倒人工智慧! (4)

暑假快到了!與其讓兒子盲目拚學測,我寧可讓他先選擇人生方向~

Python的正確發音到底是 “派桑”還是 “派森”?

現代的人工智慧之所以順利發展,我們感謝特斯拉一生對科學的奉獻!

Netflix:"人工智慧預測為我們省下10億美元"-真假的?

2019年8月28日 星期三

這讓人怎麼活啊!連麻將都難不倒人工智慧! (2)

AI人工智慧Suphx究竟是怎麼突破日本麻將最高紀錄的!?


AI人工智慧Suphx究竟是怎麼突破日本麻將最高紀錄的!?



 

強勢竄升到天鳳十級的人工智慧「 Suphx 」

今年 6 月,由微軟亞洲研究院開發的麻將 AI人工智慧 系統 Suphx, 成為第一個在國際知名專業麻將平臺「天鳳」上晉升十段的 AI人工智慧,這是目前 AI人工智慧 在麻將領域中取得的最好成績,其實力遠超該平臺公開房間頂級人類選手的平均水平。

Suphx,據「天鳳」官方解釋是Super Phoenix 之意。

麻將平台「天鳳」管制嚴格,使用 AI 在其平台上打牌一率算違規。若真的要使用 AI人工智慧 打牌,必須獲得官方的批准。在 33 萬玩家中,目前被批准的 AI 人工智慧只有三個:前面提過的「爆打」、「NAGA25」以及這次要介紹的主角——今天三月被批准的「Suphx」。

這些 AI 人工智慧都是基於深度學習 (deep learning) 的模式如下:透過深度學習該平台上程度較高「天鳳鳳凰桌」的牌局,研究分析後,找出 AI 自己的思考方式。在分析的過程中,邏輯和細節會依照其開發工程師的不同,而有所差異。到底哪種方法最好,由牌局的結果來反應。

AI 人工智慧可以日以繼夜地 24 小時進行 PK,因此這三個人工智慧 AI 都可以累積大量的對局經驗,以下是三個 AI人工智慧 在天鳳平台上第二高等級的「特上桌」(註:天鳳會根據玩家的段位及 Rate 值把玩家們劃分成四個部分,由高至低分別為:鳳凰桌、特上桌、上級桌以及一般桌,以隔開不同水平的玩家。)半莊戰的成績:


人工智慧「暴打」AI 對戰 30516 次、穩定段位 6597、最高段位九段;
人工智慧「NAGA25」AI 對戰 9557 次、穩定段位 6644 、最高段位八段;
人工智慧「Suphx」AI 對戰 5760 次、穩定段位 8748、最高段位十段。
由以上的數值可知,Suphx 大勝其他另外兩個 AI 人工智慧。取樣樣本很大,在統計學上亦被採信。
Suphx 三月加入天鳳戰局,至六月底短短四個月內,就壓倒性的到達天鳳十段,可說是一名驚人。不過當時微軟尚未正式發表 Suphx,吸引許多「鍵盤柯南」爭相找出其開發者。開發方式仍是個謎。



推薦文章

這讓人怎麼活啊!連麻將都難不倒人工智慧! (1)

這讓人怎麼活啊!連麻將都難不倒人工智慧! (3)

這讓人怎麼活啊!連麻將都難不倒人工智慧! (4)

暑假快到了!與其讓兒子盲目拚學測,我寧可讓他先選擇人生方向~

如何應對AI?Python是解答嗎?-來聽聽張忠謀怎麼說!

人工智慧因特斯拉而出現曙光,但他卻因為遇到愛迪生而前途坎坷?

微軟這貼心的發明-人工智慧簡報教練!想必是聽到大家的心聲啦!

2019年8月27日 星期二

這讓人怎麼活啊!連麻將都難不倒人工智慧! (1)

AI人工智慧再度打敗人類頂尖玩家!打破麻將最高紀錄!



AI人工智慧再度打敗人類頂尖玩家!打破麻將最高紀錄!






為何會想寫這篇文章?

AI人工智慧「Microsoft Suphx」(Super Phoenix) 被微軟發表之前,日本麻將平台「天鳳」可說是人類麻將高手雲集的地方,且沒有一個 AI 能在此平台上晉升10段。
這些 AI 包括東大碩士生水上直紀開發的「爆打」、株式会社ドワンゴ (多玩國公司) 開發的「NAGA25」等。
目前該平台有 33 萬玩家,但是達到 10 段的玩家只有 180 位,比例只有 0.0054%。目前這個平台採用日本麻將規則,有 3 人麻將與 4 人麻將,以擁有段位、級數等制度來替玩家分等級。而微軟的麻將 AI人工智慧 「Suphx」,自今年 3 月起在該平台上出沒,強勢的打敗許多麻將玩家。微軟亞洲研究院在這個月正式發表麻將 AI 「Suphx」,並宣佈「她」取得晉升 10 段的頂尖成果!

 

職業麻將高手齊聚的平台「天鳳」


麻將長期在民間流傳,自古以來,隨著地區、玩家的不同而有不同的玩法,缺少統一的規則標準和評價體系。日本線上麻將競技平臺「天鳳」,以完善的競技規則和專業的段位體系,成為業界首屈一指的專業麻將平臺,受到職業麻將界的認可。「天鳳」吸引了全球近 33 萬名麻將愛好者,其中不乏專業麻將選手。

天鳳平臺為高水平麻將玩家提供了兩種競技房間:「特上房」對四段以上所有玩家免費開放,允許 AI人工智慧 參與遊戲,目前所有玩家在此房間的最高段位是十段;「鳳凰房」則僅對七段以上的人類付費玩家開放,目前不允許 AI人工智慧 參與遊戲,在該房間能夠達到的最高段位是十一段,稱為「天鳳位」。自天鳳平臺在 2006 年推出以來,全平臺達到四人麻將天鳳位的麻將高手僅有13位,曾經達到過十段的選手約有 180 位,而現役十段的人類選手也僅有十幾位。

由於單局麻將的輸贏,不僅僅取決於玩家的實力。從發牌到抽牌,4 位玩家的所拿到的牌均充滿了不確定性,運氣也會大大的影響結果。唯有大量的麻將對局數,才能真實反應玩家的平均水平。天鳳平臺通過計算穩定段位(Stable Rank)來衡量玩家的真實實力水平。玩家的段位越高,在比賽中排位第四受到的點數懲罰也越多,點數扣除到一定程度會導致降段,因此取得一個高而穩定的穩定段位是非常不易的。


請看本系列文章下一篇:關於職業麻將高手齊聚的平台「天鳳」


推薦文章

這讓人怎麼活啊!連麻將都難不倒人工智慧! (2)

這讓人怎麼活啊!連麻將都難不倒人工智慧! (3)

這讓人怎麼活啊!連麻將都難不倒人工智慧! (4)

暑假快到了!與其讓兒子盲目拚學測,我寧可讓他先選擇人生方向~

照片去背好麻煩!?人工智慧幫你省時省力!

曾預言人工智慧的特斯拉,卻遭受愛迪生的步步摧毀!

為了更上一層樓,企業們可不敢忽視AI人工智慧和機器學習三階段!