George Kingsley Zipf (1902–1950) |
Mark Twain
Τα λογοτεχνικά βιβλία παρότι είναι δημιουργήματα της φαντασίας του εκάστοτε συγγραφέα περιέχουν αριθμητικά μοτίβο και υπακούουν σε κανονικότητες.
Για παράδειγμα, ο Οδυσσέας του Τζαίημς Τζους.Στην δεκαετία του 1940,ερευνητές στο πανεπιστήμιο του Ουισκόνσιν σε διάστημα 14 μηνών συνέταξαν μια λίστα με όλες τις λέξεις του βιβλίου και την διέταξαν κατά φθίνουσα σειρά (από την μεγαλύτερη συχνότητα προς την μικρότερη) με κριτήριο την συχνότητα εμφάνισης κάθε λέξης.Ο George Kingsley Zipf , καθηγητής στο Χάρβαρντ παρατήρησε κάτι αξιοσημείωτο.Δείτε για παράδειγμα:
Λέξη Αύξοντας αριθμός Συχνότητα εμφάν.
Εγώ 10η 26563
( I)
Είπε 100η 265
(say)
Τσάντα 1000η 26
(bag)
Φλογερός 10000η 2
(orangefiery)
Η δέκατη δημοφιλέστερη λέξη ( εγώ) ήταν περίπου 10 φορές πιο συχνά
εμφανιζόμενη από την εκατοστή λέξη (είπε)
και περίπου χίλιες φορές πιο συχνά εμφανιζόμενη από την χιλιοστή λέξη
(φλογερός).Ο Τζους υπήρξε ένα
λογοτεχνικός κολοσσός όμως δεν θα μπορούσε να το κάνει επίτηδες.
Σε
μαθηματικούς όρους,οι λέξεις στον Οδυσσέα υπακούν στον αριθμητικό τύπο.
(Συχνότητα
εμφάνισης λέξης )x(αύξοντας
αριθμός διάταξης) =26500
ή
(Συχνότητα εμφάνισης λέξης )=
26500/(αύξοντας αριθμός διάταξης)
Ένας
τύπος της μορφής:
(Συχνότητα εμφάνισης λέξης )=
Σ/(αύξοντας αριθμός διάταξης)
Όπου
Σ μια σταθερά.
Ισοδύναμα
μπορεί να διατυπωθεί : ότι η συχνότητα
εμφάνισης μια λέξης είναι αντιστρόφως ανάλογη με τον αύξοντα αριθμό την λίστα
κατάταξης κατά φθίνουσα σειρά .
Ο Zipf μελέτησε περισσότερα
κείμενα και κατέληξε ότι το παραπάνω
συμπέρασμα ισχύει για κάθε βιβλίο σε όποια
γλώσσα και αν έχει γραφεί με μια ελαφρά προσθήκη:
(Συχνότητα
εμφάνισης λέξης )= Σ/(αύξοντας αριθμός διάταξης) ^α
Όπου Σ,α σταθερές.Έκτοτε,η παραπάνω εξίσωση ονομάζεται ο νόμος του Zipf.
Πριν από αρκετά χρόνια,η καταγραφή της συχνότητας
εμφάνισης κάθε λέξης ήταν επίπονη και κοπιαστική δουλειά.Σήμερα, το διαδίκτυο
μας προσφέρει μοναδικές εφαρμογές που κάνουν πολύ πιο λεπτομερή δουλειά σε
ελάχιστο χρόνο.Όχι μόνο.Είναι σε θέση να οπτικοποιήσουν το αποτέλεσμα καθώς
μπορούν να πάρουν ένα κείμενο οσοδήποτε μεγάλο είναι και να δημιουργήσουν
σύννεφα λέξεων όπου το μέγεθος κάθε λέξης είναι ανάλογο της συχνότητας
εμφάνισης της.Ενδεικτικά αναφέρω την δωρεάν εφαρμογή Wordle
(http://www.wordle.net).Επικόλλησα
στην εφαρμογή την παρουσα ανάρτηση.Στο σχήμα βλέπετε το αποτέλεσμα:
Σχετικό βίντεο
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου