Minimax - Ce este, definiție și concept

Cuprins:

Minimax - Ce este, definiție și concept
Minimax - Ce este, definiție și concept
Anonim

Minima, în teoria jocurilor, este o metodă care urmărește să minimizeze pierderea așteptată. Pentru a face acest lucru, jucătorul presupune că decizia luată de adversarul său va fi nefavorabilă. Adică, cel mai rău scenariu este de așteptat înainte de mișcarea adversarului.

Cu alte cuvinte, metoda minimax constă în modul de a lua cea mai bună decizie, presupunând că celălalt jucător va alege cel mai prost scenariu pentru dvs.

Trebuie să ținem cont de faptul că această metodă este aplicabilă într-un joc cu două persoane (doi jucători) și că nu este cooperativă, ci un joc cu sumă zero. Aceasta înseamnă că ceea ce câștigă un jucător este pierdut de celălalt și invers. În consecință, fiecare agent va fi interesat să își maximizeze propria utilitate, chiar dacă asta îl rănește pe celălalt.

În acest moment, trebuie să ne amintim, de asemenea, că teoria jocurilor este o ramură a matematicii și economiei care studiază alegerea care optimizează situația unei persoane atunci când costurile și beneficiile nu sunt fixate în avans, ci depind de deciziile altora.

Algoritm Minimax într-un arbore de decizie

Putem vedea cum se aplică metoda minimax într-un arbore de decizie cu mai multe noduri. Jocul începe de jos și se termină cu un rezultat la nivelul superior.

La baza copacului, adversarul face prima mișcare, așa că se așteaptă cel mai prost rezultat. Apoi, în al doilea nivel, depinde de jucătorul x care va căuta să-și maximizeze profitul, ținând cont de decizia luată anterior de adversar.

La al treilea nivel, este din nou rândul adversarului și așa mai departe. Vom arăta un exemplu mai jos.

Exemplu de algoritm Minimax

În următorul arbore de decizie, arătăm rezultatele obținute de jucătorul x în fiecare moment al jocului. La bază, la primul nivel, adversarul ia decizia. Din acest motiv, sunt prezentate scenariile în care jucătorul poate pierde -10 sau câștiga 5.

La al doilea nivel, depinde de jucătorul x, așa că își va maximiza profitul. Între a pierde 10 sau a câștiga 1, veți câștiga 1. La fel, între a câștiga 5 sau 7, veți câștiga 7.

Apoi, este din nou rândul adversarului, așa că vor fi date scenariile în care jucătorul x are cel mai slab rezultat, -3 și 4, în funcție de caz. În cele din urmă, între a pierde 3 sau a câștiga 4, jucătorul x va lua decizia care îi va permite acestuia din urmă.

Trebuie să luăm în considerare faptul că valorile fiecărui nod vor depinde de o funcție de utilitate.

Pentru a înțelege mai bine arborele, să presupunem că la bază decizia se referă la distribuția produsului. Concurentul (adversarul) poate externaliza distribuția (vezi partea stângă a copacului). În acest caz, el trebuie să aleagă, de exemplu, între dealerul A și B. Astfel, îl alege pe primul, determinând jucătorul x să piardă 10 (Dacă ar alege B, jucătorul x ar câștiga 12).

Cu toate acestea, poate că adversarul preferă să-și distribuie singur marfa, fiind capabil să angajeze vehicule cu motor sau să cumpere un camion. Dintre ambele scenarii, alegeți primul care este mai puțin măgulitor pentru jucătorul x, deoarece câștigă 5 și nu 10.