«Ο Αρχιμήδης θα μνημονευθεί όταν ο Αισχύλος θα έχει λησμονηθεί, διότι οι γλώσσες πεθαίνουν, μα οι μαθηματικές ιδέες όχι.» G.Hardy


Τετάρτη, 11 Μαΐου 2016

Αριθμητικά μοτίβο σε λογοτεχνικά κείμενα και ο νόμος του Zipf!!

George Kingsley Zipf (1902–1950)
   Σε δυο στιγμές της ζωής του ο άνθρωπος δεν πρέπει να πιθανολογεί:oταν δεν έχει την πολυτέλεια να το κάνει και όταν την έχει.
                                                                         Mark Twain 

   Τα λογοτεχνικά βιβλία παρότι είναι δημιουργήματα της φαντασίας του εκάστοτε συγγραφέα περιέχουν αριθμητικά μοτίβο και υπακούουν σε κανονικότητες.
    Για παράδειγμα, ο Οδυσσέας του Τζαίημς Τζους.Στην δεκαετία του 1940 ,ερευνητές στο πανεπιστήμιο του Ουισκόνσιν σε διάστημα 14 μηνών συνέταξαν μια λίστα  με όλες τις λέξεις του βιβλίου και την διέταξαν κατά φθίνουσα σειρά (από την μεγαλύτερη συχνότητα προς την μικρότερη) με κριτήριο την συχνότητα εμφάνισης κάθε λέξης. Ο George Kingsley Zipf , καθηγητής  στο Χάρβαρντ παρατήρησε  κάτι αξιοσημείωτο.Δείτε για παράδειγμα:

Λέξη      Αύξοντας αριθμός   Συχνότητα εμφάν.

 Εγώ                  10η                         26563

( I)                   

Είπε                   100η                       265  

(say)               

Τσάντα               1000η                     26

(bag)            

Φλογερός            10000η                   2

(orangefiery)   

  Η δέκατη δημοφιλέστερη λέξη ( εγώ) ήταν περίπου 10 φορές πιο συχνά εμφανιζόμενη από την εκατοστή λέξη (είπε) και περίπου χίλιες φορές πιο συχνά εμφανιζόμενη από την  χιλιοστή λέξη  (φλογερός). Ο Τζους υπήρξε ένα λογοτεχνικός κολοσσός όμως δεν θα μπορούσε να το κάνει επίτηδες.

Σε μαθηματικούς όρους,οι λέξεις στον Οδυσσέα υπακούν στον αριθμητικό τύπο.

 (Συχνότητα εμφάνισης λέξης )x(αύξοντας αριθμός διάταξης) =26500

                                  ή

(Συχνότητα εμφάνισης λέξης )= 26500/(αύξοντας αριθμός διάταξης)

Ένας τύπος της μορφής:

(Συχνότητα εμφάνισης λέξης )= Σ/(αύξοντας αριθμός διάταξης)

Όπου Σ  μια σταθερά.

Ισοδύναμα μπορεί να διατυπωθεί :  ότι η συχνότητα εμφάνισης μια λέξης είναι αντιστρόφως ανάλογη με τον αύξοντα αριθμό την λίστα κατάταξης κατά φθίνουσα σειρά .

Ο Zipf μελέτησε περισσότερα κείμενα  και κατέληξε ότι το παραπάνω συμπέρασμα ισχύει  για κάθε βιβλίο σε όποια γλώσσα και αν έχει γραφεί με μια ελαφρά προσθήκη:

         (Συχνότητα εμφάνισης λέξης )= Σ/(αύξοντας αριθμός διάταξης) ^α

Όπου Σ,α μια σταθερές.Έκτοτε,η παραπάνω εξίσωση ονομάζεται ο νόμος του Zipf.

  Πριν από αρκετά χρόνια,η καταγραφή της συχνότητας εμφάνισης κάθε λέξης ήταν επίπονη και κοπιαστική δουλειά.Σήμερα, το διαδίκτυο μας προσφέρει μοναδικές εφαρμογές που κάνουν πολύ πιο λεπτομερή δουλειά σε ελάχιστο χρόνο.Όχι μόνο.Είναι σε θέση να οπτικοποιήσουν το αποτέλεσμα καθώς μπορούν να πάρουν ένα κείμενο οσοδήποτε μεγάλο είναι και να δημιουργήσουν σύννεφα λέξεων όπου το μέγεθος κάθε λέξης είναι ανάλογο της συχνότητας εμφάνισης της. Ενδεικτικά αναφέρω την δωρεάν εφαρμογή Wordle (http://www.wordle.net).Επικόλλησα στην εφαρμογή την παρουσα ανάρτηση.Στο σχήμα βλέπετε το αποτέλεσμα:

                        

        



Σχετικό βίντεο

                    

1 σχόλιο:

Related Posts Plugin for WordPress, Blogger...