Κυριακή 2 Ιανουαρίου 2011

Η θεωρία παιγνίων και ο εξυπνότερος άνθρωπος του κόσμου!



                                     «Βομβαρδίστε την ΕΣΣΔ.» 
                                                                       Γιάνος Φον Νιουμαν 

   Οι άνθρωποι πάντα αρέσκονταν να παίζουν και κάθε εποχή είχε τα αγαπημένα της παιχνίδια.Τα περισσότερα από αυτά είναι μίγμα επιδεξιότητας και τύχης, καλός παίκτης είναι εκείνος που μετά από αλλεπάλληλα παιχνίδια καταφέρνει να βγει αλώβητος ή το ισοζύγιο κέρδους ζημιάς να είναι θετικό.Αυτά που ενδιαφέρουν κυρίως είναι τα παιχνίδια που η τύχη παίζει πολύ μικρό ρόλο,παιχνίδια που  βασίζονται στην καθαρή στρατηγική και στις σωστές κινήσεις τακτικής.Αυτά λοιπόν τα παιχνίδια αποτελούν κατά κύριο λόγο αντικείμενο μελέτης της θεωρίας παιγνίων.
  Η τρίλιζα, το σκάκι, το κινέζικο Gο, το kriegsspiel (https://en.wikipedia.org/wiki/Kriegsspiel)  το οποίο επινόησαν Πρώσοι  στρατιωτικοί τον 19ο αιώνα και προσομοίωνε σε μια σκακιέρα το πεδίο της μάχης.Οι στρατιωτικές επιτυχίες του Πρωσικού στρατού  εν μέρει αποδίδονται  στην υψηλού επιπέδου στρατηγική  η οποία αναπτύχτηκε από τις προσομοιώσεις του kriegsspiel.Τα στρατιωτικά παιχνίδια  αναλύθηκαν μαθηματικά για πρώτη φορά από τον Εμίλ Μπορέλ,Γάλλο μαθηματικό και υπουργό ναυτιλίας  την δεκαετία του 1920.Ο Μπορέλ ανέλυε επίσης καταστάσεις  όπως η μπλόφα στο πόκερ  σαν κίνηση τακτικής.Η αυστηρή θεμελίωση της θεωρίας όμως έγινε το 1944 από τον Γιάνος Φον Νιουμαν.
 
Ταμπλώ του Kriegsspiel
 Αθωα τριλιζαστρατου  εν μερει αποδιδονται  στην υψηλου επιπεδου στρατηγικη  η οποια ναπτυχθηκε απο
  Ο Γιάνος Φον Νιουμαν ίσως να υπήρξε ο πιο έξυπνος άνθρωπος που έζησε ποτέ. Κλασσική math geek φιγούρα.Παιδί θαύμα, εκτός από της εξαίρετες μαθηματικές του ικανότητες  διέθετε φωτογραφική μνήμη,στα έξι του χρόνια αστειευόταν με τον πατέρα του στα Αρχαία Ελληνικά, γνώριζε άπταιστα Αγγλικά, Γαλλικά, Ουγγρικά, ένας μαθηματικός που έγινε θρύλος.Υπολόγιζε και έλυνε  προβλήματα με την ιδία ευκολία που ανέπνεε. Ο θρύλος λέει ότι κατά την  διαδρομή μέσα σε ένα ταξί  εμπνεύστηκε το θεώρημα minimax.Ασχολήθηκε με την Λογική, την κβαντομηχανική, την άλγεβρα αλλά πάνω από όλα ήταν ο «πατέρας»της θεωρίας παιγνίων ,αντικείμενο του διδακτορικού του,το 1946.Έγραψε μαζί με τον Όσκαρ Μόργκενσεν το κλασσικό «Θεωρία παιγνίων και οικονομική συμπεριφορά».



                         Παιχνίδια μηδενικού αθροίσματος (zero sum games)
  Ίσως να ακούγεται πολύπλοκο  αλλά  δεν είναι τίποτα  άλλο από ένα παιχνίδι  δυο παικτών , δυο ομάδων, όπου η κάθε πλευρά κερδίζει  όσα ακριβώς η άλλη χάνει. Αν ο παίκτης Α κερδίσει 200 ευρώ τότε ο Β χάνει  200  ευρώ.Έτσι προκύπτει  ο  όρος μηδενικό άθροισμα ,δηλαδή δεν υπάρχει σημείο όπου ο παίκτης Α συνεργάζεται με τον παίκτη Β, συνεχής ανταγωνισμός όπου υπάρχει μόνο ήττα ή μόνο νίκη.
 Ας δούμε ένα παράδειγμα:
  Έστω δυο τηλεοπτικά κανάλια  το κανάλι Α και το κανάλι Β, και τα δυο θέλουν να επεκτείνουν τις δραστηριότητες τους σε μια νέα χώρα ,και τα δυο έχουν βάλει στο μάτι   την Ελλάδα και την Τουρκία. Η απόφαση που θα πάρουν θα  βασιστεί στο αριθμό  των τηλεθεατών που θα έχουν σε κάθε μια από τις δυο επιλογές .Λαμβάνουμε υπόψη  ότι αν δραστηριοποιηθούν στην ίδια χώρα τους τηλεθεατές που θα έχει το ένα κανάλι θα τους χάνει το άλλο και τουμπαλιν. Γνωστή εταιρεία στατιστικών ερευνών τους έδωσε στοιχεία με τα εκατομμύρια των τηλεθεατών  που θα έχουν σε κάθε περίπτωση.Τα στοιχεία αποτυπώνονται στον παρακάτω πίνακα:



    ΚΑΝΑΛΙ Β



    Ελλάδα
Τουρκία
ΚΑΝΑΛΙ Α
Ελλάδα
          +5
    -3

Τουρκία
         +2
   +4
 Αν και τα δυο κανάλια επενδύσουν στην  Ελλάδα τότε το κανάλι Α Θα κερδίσει 5 εκατομμύρια τηλεθεατές και το Κανάλι Β θα τους χάσει.Σημειώνουμε ότι   το θετικό πρόσημο σημαίνει κέρδος για το κανάλι Α και το αρνητικό πρόσημο κέρδος για το κανάλι Β.
Το ερώτημα είναι ποια πρέπει να είναι η απόφαση που θα πάρουν  τα δυο τηλεοπτικά κανάλια για  έχουν τα καλύτερα δυνατά αποτελέσματα.
Αν το κανάλι Α διαλέξει την Ελλάδα το χειρότερο που μπορεί να συμβεί είναι να χάσει 3 εκατομμύρια,αν επενδύσει στην Τουρκία το χειρότερο που μπορεί να συμβεί είναι κερδίσει  2  εκατομμύρια.Άρα η σωστή επιλογή για το Α σε κάθε περίπτωση είναι  η Τουρκία.
Όσο για το κανάλι Β  προφανώς από τα στοιχεία είναι σε πιο δυσχερή θέση, παρ όλα αυτά μπορεί και αυτό να αναπτύξει μια στρατηγική που θα ελαχιστοποιήσει τις πιθανές απώλειες . Αν διαλέξει την Ελλάδα το χειρότερο που θα μπορούσε να συμβεί είναι να χάσει 5 εκατομμύρια,ενώ αν διαλέξει την Τουρκία η απώλεια ελαχιστοποιείται στα 3 εκατομμύρια. Άρα και το κανάλι Β η βέλτιστη επιλογή είναι η Τουρκία.(Ότι γίνεται και στην πραγματικότητα!)
 Τον επόμενο χρόνο τα πράγματα γίνονται πιο περίπλοκα για τα δυο κανάλια.
Τώρα υπάρχει μια νέα επιλογή , επένδυση  εκτός από την Ελλάδα και την Τουρκία και στην Βουλγαρία.Ο πίνακας με τα στοιχεία τώρα έχει την μορφή:








ΚΑΝΑΛΙ Β



ΕΛΑΧΙΣΤΟ  ΓΡΑΜΜΩΝ

Βουλγαρία
Ελλάδα
Τουρκία

ΚΑΝΑΛΙ Α

Τουρκία
        +3
      +2
     +1
      +1

Ελλάδα
      +4
      +2
      0
      -1

Βουλγαρία
       -3
      +5
     - 2
       -3
ΜΕΓΙΣΤΟ ΣΤΗΛΩΝ


      +4

       +5

      +1


   Σκεφτόμαστε με ανάλογο τρόπο.Ας πούμε το κανάλι  Α πρέπει να λάβει υπόψη  από κάθε γραμμή το ελάχιστο κέρδος και από τις τρεις αυτές επιλογές να πάρει την μεγίστη.Στο συγκεκριμένο παράδειγμα το μέγιστο των    {+1,-1,-3}  είναι το +1  η Βουλγαρία.
Το κανάλι Β  λογω διαφορετικού πρόσημου με την ίδια συλλογιστική θα  λάβει υπόψη  από κάθε στήλη το μέγιστο κέρδος και από τις τρεις επιλογές θα πάρει την μικρότερη δηλ στο συγκεκριμένο παράδειγμα την Τουρκία. Διότι  το ελάχιστο των
{+4,+5,-1}  είναι το +1  η Τουρκία .
Διαλέγοντας την Βουλγαρία το κανάλι Α είναι βέβαιο δεν θα κερδίσει κάτω από 1 εκατομμύριο θεατές όποια  επιλογή και αν κάνει το  κανάλι Β.Όσο για το Β  διαλέγοντας   την Τουρκία είναι εγγυημένο  ότι δεν θα χάσει πάνω από  1 εκατομμύριο θεατές ότι και  αν κάνει το κανάλι Α.
Παρατηρούμε ότι:
                                maximum{+1,-1,-3}=minimum{+4,+5,-1}  = +1
   Δηλαδή  αν τα δυο κανάλια διαλέξουν  Βουλγαρία, Τουρκία αντίστοιχα  έχουμε ένα σημείο ισορροπίας (Nash Equilibrium).

                           
   
  Το παραπάνω παιχνίδι  έχει μόνο ένα γύρο.Τα παιχνίδια με περισσότερους  γύρους από έναν η αντιμετώπιση είναι διαφορετική.Για παράδειγμα το πολύ γνωστό παιχνίδι «πέτρα , ψαλίδι, χαρτί»:
Στο συγκεκριμένο παιχνίδι οι δυο παίκτες «δείχνουν» είτε  παλάμη  (χαρτί),γροθιά(πέτρα), δυο δάκτυλα (ψαλίδι)  ταυτόχρονα μετρώντας μέχρι το 3.
Τα αποτελέσματα έχουν ως εξής: Το χαρτί κερδίζει την πέτρα αλλά χάνει από το ψαλίδι, η πέτρα κερδίζει το ψαλίδι.
Αν αντιστοιχίσουμε την   νίκη=1,   ήττα=-1,  ισοπαλία=0   έχουμε τον πίνακα:

Χαρτί
Ψαλίδι
πέτρα
Χαρτί
0
-1
+1
Ψαλίδι
+1
0

πέτρα
-1
+1
0
   Στο συγκεκριμένο  παιχνίδι παρατηρούμε ότι δεν υπάρχει σημείο  ισορροπίας ,δεν υπάρχει μια προφανής στρατηγική την οποία πρέπει να ακολουθήσουμε.Ο Φον Νιουμαν προτείνει μια μεικτή στρατηγική  η οποία χρησιμοποιεί πιθανότητες.Η βέλτιστη στρατηγική είναι να επιλέγουμε πέτρα,ψαλίδι,χαρτί  σε ποσοστό 30%  των επαναλαμβανόμενων γύρων, χωρίς να ακολουθούμε κάποιο μοτίβο και γίνουμε αντιληπτοί από τον  αντίπαλο.
   Δεν είναι όλα τα παιχνίδια μηδενικού αθροίσματος.Υπάρχουν και παιχνίδια συνεργασίας  όπως το πρόβλημα του φυλακισμένου ή το μοίρασμα του Κέικ.

Το μοίρασμα του Κέικ
 Έστω ότι έχουμε ένα κέικ το οποίο θέλουμε να μοιράσουμε σε δυο παιδιά χωρίς να αφήσουμε κανένα με την αίσθηση ότι αδικήθηκε.Η βέλτιστη στρατηγική είναι να δώσουμε το κέικ  στο ένα από τα δυο παιδιά  να το κόψει σε δυο ισα  κομμάτια και να αφήσουμε το άλλο παιδί  να διαλέξει κομμάτι.Θα εξασφαλίσουμε ότι και τα δυο παιδιά θα είναι ευχαριστημένα!
 Για το πρόβλημα των ίσων μεριδίων δείτε:
http://mathhmagic.blogspot.gr/2011/06/hugo-steinhaus.html






Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου