Διαβάστε για την πρόταση

FB TW YT PN
Ε

ρευνητές από τον Καναδά και την τσεχική Δημοκρατία έχουν τσαντιστεί στο Carnegie Mellon University Libratus παρέλαση, υποστηρίζοντας ότι τα AI, που είναι γνωστή ως Deepstack, έχει ήδη ηττηθεί ανθρώπινη παίκτες πόκερ στο No-Limit hold'em.Η μάχη μεταξύ του Carnegie Mellon University (CMU) Τεχνητή Νοημοσύνη Libratus και τέσσερις heads-up No-Limit hold'em, οι παίκτες του πόκερ έχει αναπτυχθεί μια άσχημη περίπτωση των μπλε μπάλες μετά από μια ομάδα ερευνητών από τον Καναδά και την τσεχική Δημοκρατία ήρθε προς τα εμπρός για να πω ότι δεν ήταν τίποτα, αλλά η χθεσινή είδηση.Το πιο λαμπρό σπίθες από το Πανεπιστήμιο της Αλμπέρτα, Έντμοντον, και μερικά Πανεπιστήμια στην Πράγα της τσεχικής Δημοκρατίας ένωσαν τις δυνάμεις τους για να δημιουργήσουν DeepStack: Επίπεδο Εμπειρογνωμόνων Τεχνητή Νοημοσύνη στο No-Limit Πόκερ και ισχυρίζονται ότι είναι το πρώτο αλγόριθμο για να νικήσει τους ανθρώπους σε NLHE ανταγωνισμού.Μια μη-επιστημονική επανεξέταση εγγράφου (το βρήκα εδώ), υποστηρίζει ότι Deepstack έπαιξε 44,852 χέρια του πόκερ, έναντι 33 παίκτες, και βγήκε στην κορυφή, κερδίζοντας 492 mbb/g (Μέσο ποσοστό νίκης πάνω από μια σειρά από παιχνίδια, που μετράται σε χιλιοστά του big blinds).Οι ερευνητές πιστεύουν ότι η επαγγελματίας παίκτης του πόκερ θεωρεί 50 mbb/g ένα " σημαντικό περιθώριο." Οι ερευνητές ήθελαν οι παίκτες να ανταγωνιστούν σε 3.000 παιχνίδια εναντίον Deepstack, και μόνο 11 από αυτούς πήγε η απόσταση, συμπεριλαμβανομένων των Φιλ Λακ.Θα ήθελα να σας πω αν ο Φιλ κερδίσει ή όχι, αλλά μόνο ο Bill Chen θα είναι σε θέση να μάθετε τα αποτελέσματα.Επικοινώνησα με δύο Deepstack του αντιπάλου για να μετρήσετε γνώμη τέλος.

"Έπαιξα λίγα χέρια, και έδωσε", Δήλωσε ο Luca Moschitta."Το λογισμικό που χρησιμοποιήθηκε ήταν ότι η αργή που με έκανε να γέρνει πολύ και κατάλαβα ότι έπαιζε άσχημα." Ο φίνταν ο Γκάβιν τα πήγαν λίγο καλύτερα ανταγωνίζονται σε 1,555 χέρια μια παρουσίαση στα αγγλικά. "Ένιωσα το προνόμιο να δοθεί η ευκαιρία και διαπίστωσε ότι είναι μια καλή συνολική εμπειρία με εκπληκτικά αξιοπρεπή λογισμικό με σχεδόν μηδέν προβλήματα", δήλωσε ο Γκάβιν τέλος.
"Η μεγαλύτερη πρόκληση για μένα ήταν η ολοκλήρωση των 3.000 χέρια εντός του προβλεπόμενου χρόνου." Πώς αυτό θα επηρεάσει το αποτέλεσμα για Γκάβιν; "Διέλυσα το bot στο πρώτο μισό του αγώνα.Αλλά τότε, σε μια προσπάθεια να επιταχύνει, έπαιξα πολλά και έχασα όλα μου αργότερα συνεδρίες." Πώς το bot παιχνίδι; "Το bot επίπεδο δεξιοτήτων ήταν ανάμικτα.Αν πίστευα, θα μπορούσα να νικήσει με συνέπεια το bot, αν δεν ήταν φρέσκα και παρασκευασμένα και δεν ισχύουν 100% συγκέντρωση το bot με χτυπούσε κάθε φορά." Πώς Deepstack κερδίσει;Πάνω στο χαρτί: συνδυάζει την αναδρομική σκεπτικό να χειρίζονται τις πληροφορίες ασυμμετρία, αποσύνθεση να επικεντρωθεί υπολογισμό της σχετικής απόφασης, και μια μορφή διαίσθηση για αυθαίρετη πόκερ καταστάσεις που είναι αυτόματα μάθει από την αυτο-παίξτε παιχνίδια με βαθιά μάθηση.Ξεχάστε για να πάρει κλίση από το λογισμικό, Λούκα – είμαι γέρνει από τη χρήση της γλώσσας στο χαρτί.Μια γραμμή θα αναγνωρίσει στη δίνη περίπλοκες λέξεις, για τον ερευνητή είναι η περιγραφή του πόκερ ως η " πεμπτουσία παιχνίδι ατελείς πληροφορίες." Και αυτό γιατί το No-Limit είναι το Άγιο Δισκοπότηρο για AI ερευνητές.Οι ερευνητές πιστεύουν ότι Deepstack έχει το πάνω χέρι πάνω από Claudico, το CMU AI που έχασε κατά Doug Polk και Συν πέρυσι, επειδή λειτουργεί με διαφορετικό τρόπο από ό, τι οποιαδήποτε άλλη μορφή AI.Πίσω σε αυτό το ιδιαίτερα εκπαιδευμένο χαρτιού και πάλι ένα κομμάτι της μουσικής puzzelwoord. DeepStack χρειάζεται μια ριζικά διαφορετική προσέγγιση.Συνεχίζει να χρησιμοποιήσετε το επαναλαμβανόμενο συλλογισμό του CFR να χειρίζονται τις πληροφορίες ασυμμετρία.Ωστόσο, δεν υπολογίζουν και αποθηκεύουν μια ολοκληρωμένη στρατηγική πριν από να παίξει και δεν έχει καμία ανάγκη για ρητή αφαίρεσης.Αντί να κρίνει κάθε συγκεκριμένη κατάσταση, όπως προκύπτει κατά τη διάρκεια της αναπαραγωγής, αλλά όχι σε απομόνωση.Αποφεύγει το σκεπτικό για όλο το υπόλοιπο παιχνίδι αντικαθιστώντας τον υπολογισμό πέρα από ένα ορισμένο βάθος, με μια γρήγορη εκτίμηση.Η εκτίμηση αυτή μπορεί να θεωρηθεί ως DeepStack διαίσθηση: το ένστικτο της αξίας των συμμετοχών τυχόν ιδιωτικές κάρτες σε κάθε πιθανή κατάσταση πόκερ.Τέλος, DeepStack διαίσθηση, όπως η ανθρώπινη διαίσθηση, πρέπει να εκπαιδευτεί.Μπορούμε να το εκπαιδεύσετε με το βαθύ της μάθησης με παραδείγματα που δημιουργούνται από τυχαία πόκερ καταστάσεις.Θα δείξουμε ότι DeepStack είναι θεωρητικά ήχου, παράγει σημαντικά λιγότερο εκμεταλλεύσιμα στρατηγικές από αφαίρεση-based τεχνικές, και είναι το πρώτο πρόγραμμα για να νικήσει επαγγελματίες παίκτες πόκερ στο HUNL με μια αξιοσημείωτη νίκη μέσος όρος ποσοστό πάνω από 450 mbb/g.Αυτό είναι, λοιπόν, δεν έχει νόημα να παρακολουθεί Libratus να πάρει κάτω και βρώμικο με τον Τζέισον Λεσ και co επειδή Deepstack έχει ήδη αποδειχθεί ότι το μέλλον του online πόκερ είναι σκατά.Ή είναι; "Θα ήθελα να είναι πρόθυμοι να τοποθετήσετε ένα μεγάλο στοίχημα εναντίον των bot πάνω από οποιοδήποτε ποσό από τα χέρια." Είπε Ο Γκάβιν.Και σε αυτή την πρόταση, ο φίνταν ο Γκάβιν περιγράφεται το μέλλον του online πόκερ.Τον κόσμο όπου AI και οι άνθρωποι συνυπάρχουν σε όλο το φάσμα των παιχνιδιών και χαμηλός και υψηλή διακύβευμα.Λάβετε τα τελευταία νέα τυχερών παιχνιδιών από Calvin Ayre τι κάθεσαι και να πάω να πω στο πόκερ.

τέλος

TOP