靚麗時尚館

位置:首頁 > 健康生活 > 心理

蒙特卡洛樹搜尋的主要流程有

心理2.15W
蒙特卡洛樹搜尋的主要流程有

蒙特卡羅樹搜尋(Monte Carlo Tree Search)並不是一種"模擬人"的演算法。而是通過隨機的對遊戲進行推演來逐漸建立一棵不對稱的搜尋樹的過程。可以看成是某種意義上的強化學習,當然這一點學界還有一些爭議。

蒙特卡羅樹搜尋大概可以被分成四步。選擇(Selection),拓展(Expansion),模擬(Simulation),反向傳播(Backpropagation)。

在開始階段,搜尋樹只有一個節點,也就是我們需要決策的局面。

搜尋樹中的每一個節點包含了三個基本資訊:代表的局面,被訪問的次數,累計評分。

標籤:蒙特卡洛 流程