亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

蟲蟲首頁| 資源下載| 資源專輯| 精品軟件
登錄| 注冊

您現在的位置是:首頁 > 技術閱讀 >  人工智能打撲克

人工智能打撲克

時間:2024-01-26

━━ ━━ 

人生不是游戲,但游戲和人生有相似之處。這就是為什么發明能夠贏得比賽的人工智能算法是有價值的。一種此類人工智能現在終于破解了最簡單的撲克玩法之一。對于在更復雜的撲克游戲中擊敗人類撲克冠軍的漫漫長路而言,這是關鍵的第一步。這可不是吹噓:玩撲克可以訓練計算機算法,以破解現實世界中安全和醫藥領域的復雜挑戰;在這些領域中,算法能夠得到的信息很少有完美或全面的。

撲克中眾多的技巧意味著無數種可能的玩法,即使只有兩個人玩,也是如此。通過在游戲的一開始就找到每一步完美的、無可匹敵的策略,計算機已經破解了較簡單的游戲,例如四子棋和西洋跳棋。不過,分析即使是最簡單的撲克游戲的所有可能性則是一項更大的挑戰,因為每個玩家都有隱藏的牌,即向對手隱瞞的信息。在這個意義上說,撲克是一種“不完全信息博弈”,類似真實世界中具有不同程度不確定性的情況。

阿爾伯塔大學(位于加拿大埃德蒙頓)的計算機科學家尼爾?伯奇(Neil Burch)說:“不完全信息博弈的破解方案需要計算機能夠處理不確定比賽狀態所帶來的額外復雜因素,比如不知道對手的牌。這種技術需要更大的計算機內存和更強的計算能力。”

伯奇和他的同事們曾在美國《科學》雜志上發表了他們對“雙人限注”德州撲克算法的破解方案。用人工智能用語來說,這只是對于一種特定撲克玩法的“弱”破解。這個游戲只有兩名玩家,下注金額固定,加注次數也是固定的。但從統計學意義的角度來看,該軟件仍足以讓人幾乎無法分辨那到底是計算機的解決方案還是完美的撲克技巧。

━━ ━━ 

該算法利用一種經改進的虛擬遺憾最小化(CFR)技術,它被其創造者命名為CFR+。CFR算法對于單步游戲是最容易理解的,比如剪刀石頭布。它們會將游戲結果(比方說,你輸了多少錢)與最佳選擇結果作對比。所不同的是遺憾值。該算法隨后為你下次游戲制定策略(以你將做的動作會產生結果的概率來表示),盡量降低你在所有游戲中的整體遺憾值。CFR將這一過程延伸到了像撲克這樣的游戲中,此類游戲從起點到終點之間有許多步驟。而且CFR+提升了這一過程的效率,通過更大的步伐、更少的步數實現最佳的破解方案。

因為所需要的內存巨大——約262太字節(TB),所以過去的CFR算法從未嘗試過破解雙人限注德州撲克的整場比賽。但依靠一些內存壓縮技術的幫助,CFR+現在足以高效地破解整場比賽。下一項大挑戰是要設法破解雙人無限注德州撲克,這個游戲更為復雜,它允許在游戲中進行無限制的下注。算法必須考慮更多的信息集,每個信息集都代表對手在比賽的每個階段可能做的動作。信息集數量的差異是巨大的——約為147個數量級。出于這個原因,研究人員不能指望算法能夠涵蓋每一種可能的玩法。相反,他們轉而利用“抽象”方法,即對整場比賽進行簡化。

由圖奧馬斯?桑德霍爾姆(Tuomas Sandholm)領導的卡耐基?梅隆大學的一個團隊開發了一個計算機程序,該程序能夠處理無限注德州撲克的抽象版本,它比之前的任何一個德州撲克的抽象版本都要大5倍。事實上,它可能是計算機處理過的最大的不完全信息博弈。

卡耐基?梅隆大學的抽象算法的工作原理是,將抽象的游戲劃分為一個個小塊,并將它們散布到匹茲堡超級計算中心的黑光(Blacklight)超級計算機(一臺37萬億次浮點運算的機器)的各個刀片服務器。抽象的一個“母件”與其他服務器上的更小部件進行信息交換。相對于將游戲全部放在一臺服務器上來說,這就使該團隊能夠創造更大的抽象;比起將抽象分散到多臺必須相互溝通的服務器上,速度也提升了兩倍。

一旦CFR算法分析了抽象的游戲并制定了撲克游戲的策略,就需要一個反向映射算法將該策略應用到完整的無限注德州撲克中。桑德霍爾姆的研究小組就開發出了這樣的算法(稱為“偽諧波映射”),它可以降低對手采取抽象中未覆蓋的行動而獲勝的可能性。

桑德霍爾姆研究小組的人工智能曾經擊敗了最好的撲克游戲程序,顯示了它的價值。它并不是無限注德州撲克的破解方案,但它仍然是有用的。桑德霍爾姆說:“我們開發的算法并不是為了破解撲克,而是為了破解一般的不完全信息博弈。撲克只是一個標桿,我們可以每年用它來測試進展情況。”

作者:Jeremy Hsu

往期推薦

深度學習挑戰賽尋求可進行偵查的人工智能

探索影像學標志,發展基于人工智能的腦疾病精準診療

專題 | 從動物智能到人工智能

主站蜘蛛池模板: 定陶县| 措勤县| 乌鲁木齐市| 阿拉善左旗| 泸溪县| 华坪县| 库车县| 丰都县| 德化县| 济宁市| 江城| 喀喇沁旗| 理塘县| 蓝山县| 呼和浩特市| 南澳县| 北辰区| 镇巴县| 永顺县| 额敏县| 和平区| 若尔盖县| 保山市| 新昌县| 洛南县| 鄂州市| 黔东| 洪洞县| 安丘市| 罗定市| 健康| 清水河县| 宜章县| 香格里拉县| 潞城市| 历史| 微山县| 敦煌市| 左贡县| 朝阳区| 柘城县|