#ΜαθηΜαγικοΗμερολογιο Ένας άνθρωπος που δεν χωρούσε σε κουτί
Ο George Kingsley Zipf (1902-1950) ήταν μια από εκείνες τις σπάνιες προσωπικότητες που δεν χωρούσαν σε ένα μόνο επιστημονικό κουτί. Σιδεράς στα εφηβικά του χρόνια, φιλόλογος στις σπουδές του, στατιστικολόγος από εμμονή — και τελικά, πρωτοπόρος της επιστήμης των πολύπλοκων συστημάτων χωρίς να το γνωρίζει. Ο νόμος που φέρει το όνομά του αποτελεί ένα από τα πιο εντυπωσιακά και επίμονα φαινόμενα της στατιστικής, αποκαλύπτοντας ότι η ανθρώπινη γλώσσα —αλλά και πολλά φυσικά συστήματα— υπακούουν σε μια βαθύτερη μαθηματική τάξη.
Η ζωή του Zipf — από το σφυρί στις λέξεις
Γεννήθηκε στις 26 Ιανουαρίου 1902 στο Freeport του Ιλινόι, παιδί μεταναστών γερμανικής καταγωγής. Από μικρός είχε δύο πάθη: τα εργαλεία και τις λέξεις. Στα εφηβικά του χρόνια εργαζόταν ως σιδεράς — μια λεπτομέρεια που ίσως εξηγεί την εμμονή του αργότερα με την «ελάχιστη προσπάθεια»: ήξερε καλά πόσο κουράζει το ανθρώπινο χέρι.
Σπούδασε στο Πανεπιστήμιο του Χάρβαρντ, παίρνοντας πτυχίο το 1924, μεταπτυχιακό το 1925 και διδακτορικό το 1930 — όλα στη γερμανική φιλολογία και τη συγκριτική γλωσσολογία. Δεν ήταν μαθηματικός. Δεν ήταν στατιστικολόγος. Αυτό είναι το πρώτο μεγάλο παράδοξό του.
Το ταξίδι που άλλαξε τα πάντα: μετά το Χάρβαρντ, ταξίδεψε στη Γερμανία και στην Ισλανδία. Εκεί, μελετώντας αρχαία ισλανδικά κείμενα και σύγχρονες γερμανικές εφημερίδες, παρατήρησε κάτι περίεργο: οι λέξεις που χρησιμοποιούνταν συχνότερα ήταν πάντα οι ίδιες, και η σχέση μεταξύ τους ήταν ύποπτα τακτική. Άρχισε να μετράει. Τα έκανε όλα με το χέρι — χωρίς υπολογιστές, χωρίς βάσεις δεδομένων. Μόνο μολύβι, χαρτί και ατελείωτες ώρες καταμέτρησης.
Το 1935 εξέδωσε το πρώτο του σημαντικό βιβλίο, «The Psycho-Biology of Language»— ένας τίτλος που ακόμα και σήμερα ακούγεται πρωτοποριακός. Εκεί διατύπωσε τον περίφημο νόμο του, αλλά δεν σταμάτησε. Το 1949, ένα χρόνο πριν πεθάνει, εξέδωσε το αριστούργημά του:«Human Behavior and the Principle of Least Effort», όπου επιχείρησε να δείξει ότι η αρχή του δεν εξηγεί μόνο τις λέξεις, αλλά και την οργάνωση των πόλεων, την κατανομή του πλούτου, ακόμα και τη δομή των μουσικών συστημάτων.
Στις 25 Σεπτεμβρίου 1950, σε ηλικία μόλις 48 ετών, ο Zipf πέθανε ξαφνικά. Έφυγε πριν προλάβει να δει την ιδέα του να κατακτά τον κόσμο. Αλλά σήμερα, ο νόμος του εφαρμόζεται στη γλωσσολογία, την πληροφορική, την οικονομία της προσοχής, την επιστήμη των δικτύων και τη φυσική των πολύπλοκων συστημάτων.
Ο πρώτος νόμος — η μαθηματική ισορροπία της γλώσσας
Ο πυρήνας του νόμου ορίζει ότι σε ένα μεγάλο σώμα κειμένου, η συχνότητα εμφάνισης μιας λέξης είναι αντιστρόφως ανάλογη με τη θέση (rank) που κατέχει στη λίστα συχνότητας.
Το μοτίβο 1/rank:Η πιο συχνή λέξη μιας γλώσσας εμφανίζεται περίπου διπλάσιες φορές από τη δεύτερη πιο συχνή, τριπλάσιες από την τρίτη, και ούτω καθεξής.
- Σταθερό γινόμενο: Αν πολλαπλασιάσουμε τη θέση μιας λέξης με τη συχνότητά της, το αποτέλεσμα είναι σχεδόν σταθερό. Για παράδειγμα, αν η 35η πιο κοινή λέξη εμφανίζεται 836 φορές (35 × 836 = 29.260), η 75η λέξη εμφανίζεται 422 φορές (75 × 422 = 31.650) — τα νούμερα αυτά είναι εντυπωσιακά κοντά μεταξύ τους.
- Η κυριαρχία των λίγων: Στα αγγλικά, η λέξη «the» αποτελεί περίπου το 6%του συνολικού λόγου. Μόλις 100 λέξεις αρκούν για να καλύψουν σχεδόν το 50% οποιουδήποτε βιβλίου ή συνομιλίας.
Ο δεύτερος νόμος — η αρχή της ελάχιστης προσπάθειας
Ο Zipf παρατήρησε μια άμεση σχέση ανάμεσα στο μήκος της λέξης και τη χρήση της: «όσο πιο σύντομη είναι μια λέξη, τόσο πιο συχνά χρησιμοποιείται».
Αυτό το απέδωσε στην «αρχή της ελάχιστης προσπάθειας» — την τάση των ανθρώπων να επικοινωνούν καταβάλλοντας τη μικρότερη δυνατή ενέργεια. Η γλώσσα είναι ένας διαρκής συμβιβασμός ανάμεσα στην τεμπελιά του ομιλητή (που θέλει λίγες, μικρές λέξεις) και την ανάγκη του ακροατή (που θέλει σαφήνεια και ποικιλία). Ο νόμος του Zipf είναι η χρυσή τομή ανάμεσα στις δύο ανάγκες.
Στατιστικά, περίπου το 50% των λέξεων που χρησιμοποιούμε σε ένα εκτενές δείγμα λόγου αποτελούνται από μία μόνο συλλαβή.
Γιατί συμβαίνει; (Οι θεωρίες)
Παρά την ακρίβεια του νόμου, η επιστήμη δεν έχει καταλήξει σε μία οριστική εξήγηση, αλλά υπάρχουν τρεις επικρατούσες προσεγγίσεις:
1. Συμβιβασμός επικοινωνίας (όπως περιγράφηκε παραπάνω).
2. Πιθανοτικό μοντέλο Mandelbrot: Ο Benoit Mandelbrot έδειξε ότι ακόμα και αν πληκτρολογούσαμε τυχαία μια ακολουθία χαρακτήρων με συγκεκριμένους κανόνες (π.χ. κενό ως οριοθέτηση λέξεων), οι «λέξεις» που θα προέκυπταν θα ακολουθούσαν κατά προσέγγιση τον νόμο του Zipf — λόγω των εκθετικών πιθανοτήτων των συνδυασμών γραμμάτων. Δεν πρόκειται για «μαθηματική αναγκαιότητα» αλλά για μια εύρωστη στατιστική ιδιότητα.
3. Προτιμησιακή προσκόλληση (preferential attachment): Η λογική του «ο πλούσιος γίνεται πλουσιότερος». Μια λέξη που χρησιμοποιήθηκε ήδη μία φορά έχει περισσότερες πιθανότητες να χρησιμοποιηθεί ξανά στο μέλλον, ενισχύοντας τη θέση της.
Σήμερα, οι ερευνητές θεωρούν τον νόμο του Zipf ως ελκυστήρα (attractor) πολύπλοκων συστημάτων — ένα μαθηματικό μοτίβο που αναδύεται όταν ένα σύστημα βρίσκεται σε μια «χρυσή τομή» μεταξύ τάξης και χάους, χωρίς ωστόσο να υπάρχει μια καθολική, αναγκαία αιτία.
Ένα συμπαντικό φαινόμενο
Το πιο εντυπωσιακό στοιχείο είναι ότι ο νόμος δεν περιορίζεται στη γλώσσα. Το ίδιο μοτίβο συναντάται —σε διάφορους βαθμούς προσέγγισης— και σε άλλα φαινόμενα:
- Στον πληθυσμό των πόλεων (η μεγαλύτερη πόλη μιας χώρας έχει συνήθως περίπου διπλάσιο πληθυσμό από τη δεύτερη, ιδίως σε παγκόσμια κλίμακα).
- Στην ένταση των ηλιακών εκλάμψεων και το μέγεθος των σεισμών (νόμος Gutenberg–Richter).
- Στον αριθμό των αναφορών σε ακαδημαϊκές εργασίες και στην κίνηση των ιστοσελίδων.
- Ακόμα και στα συστατικά που περιλαμβάνονται σε βιβλία μαγειρικής.
Η τεμπελιά που έγινε νόμος
Λέγεται ότι μια φορά, σε ένα σεμινάριο του Χάρβαρντ, ένας φοιτητής ρώτησε τον Zipf: «Κύριε, όλο αυτό είναι εντυπωσιακό, αλλά τελικά, τι νόημα έχει;»
Ο Zipf έμεινε σιωπηλός για μερικά δευτερόλεπτα, κοίταξε το παράθυρο και είπε: «Η φύση είναι τεμπέλα, νεαρέ μου. Και εμείς, παιδιά της φύσης, είμαστε διπλά τεμπέληδες. Ο νόμος μου είναι απλώς η μαθηματική έκφραση της ανθρώπινης τεμπελιάς. Και αυτό είναι υπέροχο.»
Ο νόμος του Zipf αποκαλύπτει ότι η ανθρώπινη γλώσσα και πολλά φυσικά φαινόμενα, όσο χαοτικά κι αν φαίνονται, συχνά υπακούουν σε μια βαθύτερη μαθηματική τάξη. Δεν πρόκειται για ένα άλυτο «μυστήριο» με την απόλυτη έννοια, αλλά για ένα εύρωστο στατιστικό μοτίβο που η σύγχρονη επιστήμη μπορεί να προσομοιώσει και εν μέρει να ερμηνεύσει. Και στο κέντρο όλων βρίσκεται ένας σιδεράς που έγινε καθηγητής, ένας φιλόλογος που έφτιαξε μαθηματικό νόμο, κι ένας οραματιστής που πέθανε νωρίς — αλλά η ιδέα του ζει μέσα σε κάθε λέξη που γράφουμε, κάθε πόλη που μεγαλώνει, κάθε μοτίβο που επαναλαμβάνεται.
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου