2020: Rise of the Machines

กฎของศาลอุทธรณ์กฎต่อต้าน DOJ เคลียร์ทางสำหรับโป๊กเกอร์ออนไลน์
January 25, 2021 0 Comments


di James Grosjean Contami tra i droni Netflix che hanno adorato The Queen’s Gambit (2020), ma sono sempre stato un appassionato di scacchi. Durante i miei anni universitari, probabilmente ho mangiato un migliaio di croissant al cioccolato mentre guardavo l’eccentrico e magnifico Murray Turnbull (noto anche come “The Chess Master”) affrontare tutti gli altri nella piazza della città – “$ 2, rimborsati se vinci o pareggi”. È stato un onore per me catturare una foto del grande Karpov incorniciata dalle vetrate del Memorial Hall quando ha fatto una simulazione di 40 tavole nel campus. Facevo parte della stampa studentesca quando Kasparov fece la sua controversa affermazione che un computer sarebbe stato un grande campione prima che lo fosse una donna. Salvando il dibattito sulla possibile misoginia di Kasparov per un altro forum e un altro giorno, ho preso la sua dichiarazione come una semplice proiezione basata sull’osservazione empirica della comunità scacchistica. La partecipazione femminile è sempre stata bassa e non in aumento in modo significativo, mentre i computer erano già forti e si stavano rafforzando rapidamente. Le macchine introdurranno una nuova uguaglianza, in cui tutti i sessi verranno schiacciati come formiche. Il Teorema di Zermelo ci dice che un gioco con tutte le informazioni (entrambi i giocatori possono vedere tutti i pezzi sulla scacchiera), che è finito (il gioco FINISCE dopo un certo numero di mosse), ha una soluzione, e che se entrambe le parti giocano questo soluzione ottimale, quindi ogni partita ha lo stesso risultato. Gli scacchi sono abbastanza complicati da non essere sicuri di quale sarebbe il risultato, ma pensiamo che il Bianco vincerebbe ogni volta, nel qual caso non c’è risposta del Nero che possa cambiare il risultato. Anche il gioco di Connect Four rientra nel Teorema di Zermelo, e l’analisi ha stabilito che in quel gioco, la sorella subdola vince sempre se va per prima e gioca in modo ottimale. Se sei un AP a cui piaceva QGambit e hai fame di più contenuti durante questa pandemia senza fine, il tuo prossimo compito è guardare AlphaGo, un documentario sull’ascesa dei computer nell’antico gioco di Go, che è più complicato di scacchi. Non sto scherzando, questo film è uno strappalacrime per le persone che sono interessate a questo campo e apprezzano l’intenso dramma emotivo per il campione dell’umanità, Lee Sedol, il migliore che abbia mai fatto. Il film cattura l’angoscia, il coraggio, la genialità e poi l’umiltà di Sedol, quando si rende conto che questa partita contro la macchina non è solo un gioco, ma l’emergere di un nuovo ordine mondiale. Non un programmatore, Sedol non apprezzava quello che avrebbe dovuto affrontare, ma come esperto del suo mestiere, sul tabellone poteva sentire il peso implacabile e impenetrabile del suo avversario. Dopo esserti divertito con AlphaGo, ti consiglio (in realtà, Google consiglia) di guardare alcune partite di poker tra Dan Negreanu della vecchia scuola e il moderno clone di computer Doug Polk. Il miglior giocatore sulla terra è la macchina, quindi un essere umano intelligente come Polk emula la strategia della macchina. Adattati o muori. Una volta ho avuto un breve scambio con Howard Lederer. Gli ho chiesto dei bot sui siti di poker. Ha liquidato la questione dicendo: “Il poker non è come gli scacchi. Il poker è un gioco di informazioni incomplete. I computer non sono bravi in ​​questo. ” Non saprei dire se fosse uno sciocco ingenuo o un truffatore per Full Tilt Poker. Ad ogni modo, non volevo continuare quella conversazione 15 anni fa. Ma ora eccoci qui, nel 2021, ed è tempo di continuare quella conversazione, confutando quel primo errore riguardante i computer GTO (teoria dei giochi ottimale) e tutti gli altri errori sovrapposti che sono i dinosauri del poker e gli autoproclamati esperti del poker aggrappandosi disperatamente a: Errore n. 1: i computer non sono bravi a giocare con informazioni incomplete. Questo è solo ignorante. È vero che il teorema di Zermelo non si applica a giochi come il poker. Per il poker, ci sono ALTRI teoremi che fondamentalmente dicono che esiste una soluzione al gioco, e una soluzione per computer generalmente coinvolgerà “strategie miste”, il che significa che c’è qualche componente randomizzante nella strategia (come chiamare Forbici con probabilità 1/3 ). I computer sono abbastanza bravi, migliori degli umani, nel calcolare l’aspettativa sui risultati probabilistici, specialmente quando le distribuzioni di probabilità sono note con precisione, come lo sono nei giochi di carte. Ad esempio, il computer sa esattamente qual è la probabilità di pescare un colore backdoor e quali probabilità del piatto ha bisogno per giustificare la caccia. Sebbene il poker implichi informazioni incomplete, il poker heads-up no limit è un gioco più semplice di Go, anche se Go include informazioni complete (informazioni di conoscenza comune). Errore n. 2: la superiorità del computer deriva dall’essere in grado di ricordare ogni mano che ho giocato e aggiustare di conseguenza. Mentre un “bot sfruttatore” analizza effettivamente le tue giocate passate e si adegua ai punti deboli percepiti, un bot GTO standard (che abbiamo usato per chiamare un “bot Nash”) è l’equivalente poker di BS nel blackjack. La strategia GTO non cambia, indipendentemente da come hai giocato le mani precedenti. Non ha bisogno di quelle informazioni e non gli importa. Errore n. 3: la soluzione GTO è “corretta” solo se si gioca contro un altro bot GTO, perché questo è ciò che si presumeva quando il bot è stato sviluppato: il bot “ha imparato” giocando contro se stesso. Questo è falso. “Il bot ha giocato contro se stesso per imparare a giocare a poker” è un’errata caratterizzazione del processo di sviluppo. Ai media piace esaltare il suo clickbait per fare in modo che ogni risultato nell’elaborazione suoni come una svolta generazionale, invocando HAL e Skynet. Un bot GTO non sa niente del poker. Derivare la strategia GTO è un esercizio di calcolo, reso possibile dall’enorme memoria e dalla velocità della CPU disponibili nei computer odierni e dallo sviluppo di un algoritmo efficiente per eseguire il calcolo (“minimizzazione del rimpianto”). Non abbiamo mai descritto l’algoritmo come “apprendimento automatico” o “AI”: lo chiamavamo semplicemente “salita in collina” o “massimizzazione” o “ottimizzazione”. Ad ogni passo dell’algoritmo iterativo, il computer ha l’attuale strategia in fase di sviluppo per ogni posto al tavolo, e questa strategia attuale potrebbe essere comunemente descritta come “se stessa”, come in: “PokerSnowie gioca contro se stesso”. Ma in realtà è solo un’iterazione nel suo percorso di scalare la collina per convergere al culmine: una strategia ottimale per il poker. Questo ottimo non presuppone alcun avversario particolare. Ci sono altri modi in cui avremmo potuto calcolare la soluzione (anche se forse non così velocemente), e sarebbe altrettanto valida. Questa strategia GTO è “The Book” per il poker, e non sarebbe mai in svantaggio, indipendentemente dal suo avversario. Non esiste una strategia che possa ottenere un vantaggio contro di essa. Errore n. 4: il bot GTO presume che giocherò in un certo modo, ma lo ingannerò giocando il mio 72 fuori seme fuori posizione. Sbagliato. Il bot GTO non dà per scontato nulla su come giochi. Non gli importa. È imbattibile contro QUALSIASI strategia avversaria. Immagina di avere una battaglia imminente contro Floyd Mayweather e dici: “Floyd si aspetta che mi presenti in un condizionamento fisico impeccabile. Presume che mi allenerò duramente per i prossimi sei mesi. Lo ingannerò: guarderò Netflix e mangerò ciambelle per i prossimi sei mesi “. Floyd non ha idea di quanto ti allenerai. Sa che se lui stesso si presenta in perfetta forma, nessun avversario può ottenere un vantaggio contro di lui. Ha senso dire: “Il bot presume che giocherò bene. Ingannerò il bot giocando male a poker! ” Sì, li hai sicuramente mostrati! Errore n. 5: ho trovato un punto debole: quando ho questo e quello, da questa o quella posizione, il bot dovrebbe fare X, ma lo fa Y. Sbagliato. Il bot non ha punti deboli. Stai guardando una particolare mano che tiene e un particolare risultato, ma in base alla probabilità di trovarti in quello scenario e tutte le possibili mani che potresti tenere viste dal punto di vista del bot, il suo gioco è corretto e puoi non trovo un buco lì. È molto pericoloso guardare un’opera in isolamento. Il bot fa delle mosse per bilanciare i suoi range, in modo che tu non possa scalpellare in altre situazioni, o se diverse carte sono arrivate al river. Se non lo vedi, allora il difetto è nel tuo modo di pensare al poker, non nel bot. Errore n. 6: se lo suono per un po ‘, scoprirò come funziona e troverò un punto debole. Sbagliato. Non c’è debolezza. In effetti, potremmo pubblicare la strategia del bot e non farebbe alcuna differenza. Se ti dico che giocherò a Scissors, Rock e Paper con probabilità 1/3 su ciascuno, il fatto che tu sappia la mia strategia non ti dà la possibilità di ottenere un vantaggio. Non c’è tallone d’Achille. Errore n. 7: i bot con limite di testa a testa introdotti nei casinò erano altamente battibili, quindi probabilmente lo sono anche i robot GTO. Questo non è un confronto significativo. Alcuni dei robot del casinò sono stati istruiti a non giocare al loro gioco A, perché era troppo forte contro gli umani medi. Se il casinò imposta il bot per giocare al suo gioco B, per ottenere, diciamo, un vantaggio del 5% contro la maggior parte dei giocatori, allora un essere umano davvero bravo avrebbe potuto fare soldi contro quel bot GTSO (bot subottimale della teoria dei giochi). Ma questo è un problema diverso. Non mi interessa chi sei: se giochi heads-up contro PokerSnowie, perderai. Errore n. 8: i robot GTO possono battere i giocatori deboli, ma i bot avranno problemi contro i migliori avversari come Phil Ivey o Dan Negreanu. Sbagliato. Una cosa bella di un bot GTO è che non importa chi sia l’avversario. Nella migliore delle ipotesi, qualcuno potrebbe giocare anche con il bot. Un anello di robot GTO sarebbe come un lavandino, con il denaro che scorre in senso orario inseguendo il pulsante e drenando il centro del tavolo a causa del rastrello. Un problema pratico che avevano i professionisti del mondo reale era decidere quando la loro abilità era sufficiente per passare alla successiva posta in gioco più alta disponibile, dove i giocatori erano presumibilmente più forti. Ma ora, un giocatore che imita la strategia GTO può sedersi a qualsiasi tavolo nel mondo, a qualsiasi posta in gioco, e non deve preoccuparsi di essere il pesce. Nella migliore delle ipotesi, il gioco sarebbe uniforme (al di fuori del rake) e, in pratica, una strategia GTO conferisce un vantaggio considerevole contro chiunque incontrerai in natura. Errore n. 9: Dan Negreanu è un professionista di poker di lunga data con braccialetti N, quindi schiaccerà i pidocchi del computer come Doug Polk che non capisce le sfumature del vero poker. Se un tipo come Polk si limita a memorizzare “le classifiche” e imita la strategia GTO, non ha bisogno di capire un accidente. Non ha bisogno di sapere cosa significa la parola “sfumatura”. L’esperienza di poker di professionisti come Negreanu è ciò che ha permesso loro di capire il gioco migliore in scenari complicati. Questa esperienza è obsoleta ora che i computer hanno appena calcolato quali sono i giochi giusti. Forse nel 1950, l’esperienza di un giocatore gli ha permesso di determinare che colpire 14 v T era meglio che stare in piedi. Una volta che i Four Horsemen hanno calcolato la classifica BS, l’esperienza del blackjack è diventata irrilevante. Il libro rende l’esperienza non necessaria. Ora Doug Polk non è un bot GTO. È un grande professionista che impiega strategie GTO. Quindi, l’unico colpo di Negreanu per battere Polk è se l’emulazione di GTO di Polk non è accurata e se i buchi sono abbastanza grandi da poter essere trovati e sfruttati da Negreanu. Ne dubito. Un’altra possibilità sarebbe se giocassero dal vivo, e se Polk avesse dei tell fisici che fornissero informazioni sulle sue carte coperte, e se Negreanu potesse leggerlo in quel modo. O se Polk ha problemi di inclinazione e inizia a deviare da GTO se ha una cattiva serie di carte. Non è probabile. O forse il gioco è abbastanza breve che Negreanu è fortunato in un piccolo campione. Dopo aver giocato contro AlphaGo, Lee Sedol ha elevato il suo gioco e ha iniziato a schiacciare tutti (non che non lo facesse già), ma poi si è ritirato dal gioco! Ha ammesso di essere stato battuto (che idea!) E che nessun umano avrebbe mai più sfidato il miglior giocatore al mondo, AlphaGo. Vedremo se Negreanu avrà la stessa epifania. Un recente tweet mi fa riflettere, perché Negreanu sembrava mettere in dubbio un gioco di bot e suggerire che esiste una linea sottile tra genio e stupidità. Penso che speri ancora che ci sia un difetto nella strategia GTO. Non c’è. L’ultima volta che ho sentito, Negreanu stava recuperando terreno nel contest, e c’è qualche indicazione che una ragione è che, a suo merito, Negreanu si sta allenando con PokerSnowie e si sta adattando! Se Negreanu può imparare rapidamente la strategia GTO, potrebbe livellare il campo di gioco, il che sarebbe un risultato straordinario. L’unico modo in cui un dinosauro può sopravvivere è evolversi. Vedremo nel 2021.

[Next time, I’ll discuss some of the limitations and weaknesses of the poker bots, unless we thrash them out in the Comments below.]


คาสิโน888
คาสิโน88
เกม คาสิโน
เกมส์ คาสิโน
ts911 คาสิโน ออนไลน์

Leave a Reply

Your email address will not be published. Required fields are marked *