3,5 χρόνια σχέσης, σε μηνύματα Whatsapp

Ανάλυση δεδομένων από μια συνομιλία μέσω Whatsapp με τη φίλη μου

Ημέρα του Αγίου Βαλεντίνου 2020 πέρασε πρόσφατα. Η ημέρα του χρόνου όπου τα ζευγάρια γιορτάζουν τη σχέση τους και τα μέσα κοινωνικής δικτύωσης πλημμυρίζουν με δημοσιεύσεις, φωτογραφίες και επαίνους για τα άλλα μισά. Είναι συχνά μια απολαυστική εποχή του χρόνου για όποιον δεν έχει σχέση, που πρέπει να ασχοληθεί με τις απεικονίσεις της τελειότητας που βλέπουμε τόσο συχνά στο χρονοδιάγραμμά μας. Παρά το γεγονός ότι βρίσκομαι σε σχέση, είμαι και εγώ βαρεμένος να βλέπω μη ρεαλιστικές απεικονίσεις ζευγαριών στο διαδίκτυο, οπότε φέτος αποφάσισα να αντισταθώ με κάποια κρύα σκληρά δεδομένα. Για να το κάνω αυτό, θυσίασα το απόρρητό μου και γύρισα στο μέσο που πιστεύω ότι είναι το πιο πραγματικό - η συνομιλία Whatsapp με τη φίλη μου.

Πρόσφατα ανακάλυψα ότι είναι δυνατή η λήψη ολόκληρου του ιστορικού συνομιλιών από το Whatsapp σε ένα αρχείο κειμένου. Μου φάνηκε ότι αυτή θα μπορούσε να είναι μια πολύ ενδιαφέρουσα πηγή δεδομένων που θα μπορούσε να δώσει μια πολύ πιο ρεαλιστική, μοναδική απεικόνιση του πώς είναι μια σχέση. Εδώ λοιπόν σε αυτό το άρθρο θα βάλω το δικό μου εκεί έξω με την ελπίδα ότι μπορεί να βρείτε την ανάλυση ενδιαφέρουσα, ή ότι μπορεί να σας εμπνεύσει α) να σκεφτείτε πώς τα δεδομένα μπορούν να εξουδετερώσουν την ψευδή πραγματικότητα που βλέπουμε στα κοινωνικά μέσα, β) σκάψτε λίγο βαθύτερα στα δεδομένα που παράγετε εσείς ή γ) δώστε στον σύντροφό σας ένα πολύ χαριτωμένο, δώρο για την ημέρα του Αγίου Βαλεντίνου με θέμα την επιστήμη δεδομένων.

(Βαθμοί μπόνους εάν μπορείτε να προσδιορίσετε όλες τις επικεφαλίδες ενοτήτων…)

Ερχεται ο ήλιος

Όπως ανέφερα, το Whatsapp σας επιτρέπει να κατεβάσετε ολόκληρο το ιστορικό οποιωνδήποτε συνομιλιών σας πολύ εύκολα και να κάνετε εξαγωγή ως ένα αρχείο κειμένου, το οποίο στη συνέχεια μετέτρεψα και ανέλυσα χρησιμοποιώντας τη γλώσσα προγραμματισμού R. Η εν λόγω συνομιλία ξεκίνησε τον Οκτώβριο του 2016 ( από τότε που άλλαξα τους αριθμούς τηλεφώνου - η κοπέλα μου και εγώ είμαστε μαζί από τον Μάρτιο του 2016).

Είναι η κύρια μορφή εικονικής επικοινωνίας μας (σπάνια στέλνουμε κείμενο ή χρησιμοποιούμε το Facebook, για παράδειγμα) και το αποτέλεσμα ήταν ένα σύνολο δεδομένων 52.163 μεμονωμένων μηνυμάτων - κατά μέσο όρο 43 μηνύματα την ημέρα. Αυτό με εκπλήσσει ήδη και δεν έχουμε ακόμη γρατσουνίσει την επιφάνεια…

Η Δύναμη των Δεδομένων

Ο στόχος είναι να συνοψίσουμε τη σχέση μας, αμέσως μετά το ρόπαλο που θα συγκεντρώσουμε και θα δούμε τα υψηλά επίπεδα. Ακολουθεί μια σύντομη επισκόπηση:

  • 1.212 ημέρες - μεταξύ 18 Οκτωβρίου 2016 και 12 Φεβρουαρίου 2020.
  • 980 (81%) από αυτές ήταν «ενεργές» ημέρες (δηλαδή απεστάλησαν μηνύματα).
  • 52.163 μηνύματα. Έστειλα 1.495 περισσότερα μηνύματα από τη φίλη μου - και πάλι, όχι αυτό που περίμενα να βρω!
  • Χρησιμοποιήθηκαν 11.670 μοναδικές λέξεις (πολλές από τις οποίες δεν είναι πραγματικές λέξεις). Χρησιμοποίησα 8.844 μοναδικές λέξεις όπου η κοπέλα μου χρησιμοποίησε 7.043.
  • 2 συμμετέχοντες - η κοπέλα μου και εγώ - ζούμε στο Ηνωμένο Βασίλειο και στις αρχές της δεκαετίας του '20.

Δεν θέλω να πληκτρολογήσω κάτι

Ο αριθμός των μηνυμάτων που στέλνουμε κάθε μέρα μειώνεται, κατά μέσο όρο, με την πάροδο του χρόνου που είμαστε μαζί.

Αριθμός μηνυμάτων Whatsapp που αποστέλλονται ανά ημέρα μεταξύ της φίλης μου και εγώ, 16 Οκτωβρίου - 20 Φεβρουαρίου. Η μπλε γραμμή δείχνει τον εξομαλυνμένο μέσο όρο.

Αυτό οφείλεται κυρίως στο γεγονός ότι στην αρχή αυτής της χρονικής περιόδου ήμασταν και οι δύο στο πανεπιστήμιο και ζούσαμε χώρια, επομένως τα μηνύματα συχνότερα. Στη συνέχεια, μπορείτε να δείτε στα μέσα του 2017 όταν τελειώσουμε το πανεπιστήμιο και ζούμε μαζί, αλλά όχι ακόμα σε εργασία πλήρους απασχόλησης. Εξαιτίας αυτού, ξοδεύαμε τον περισσότερο χρόνο μας μαζί κάθε μέρα και, ως εκ τούτου, δεν επικοινωνούσαμε μεταξύ τους. Τον Σεπτέμβριο του 2017 ξεκινήσαμε τις εργασίες και η συχνότητα των μηνυμάτων αυξήθηκε ξανά (ουπ).

Αν κοιτάξετε προσεκτικά, θα δείτε επίσης ένα μοτίβο μιας ακίδας γύρω από την περίοδο των Χριστουγέννων - την οποία περνάμε εκτός από τις αντίστοιχες οικογένειές μας - και μια επακόλουθη βουτιά γύρω από το νέο έτος - το οποίο τείνουμε να περνάμε μαζί.

Παρασκευή, είμαι ερωτευμένος

Το επόμενο γράφημα θα μπορούσε εύκολα να είναι ένα γράφημα των επιπέδων κινήτρων καθ 'όλη τη διάρκεια της εβδομάδας. Στέλνουμε περισσότερα μηνύματα τις καθημερινές από τα σαββατοκύριακα.

Μέσος αριθμός μηνυμάτων που αποστέλλονται ανά ημέρα της εβδομάδας.

Τα μοτίβα ανταλλαγής μηνυμάτων τείνουν να αντανακλούν τα γενικά συναισθήματά μου απέναντι σε κάθε ημέρα της εβδομάδας, φτάνοντας σε ένα crescendo την Παρασκευή, όταν είναι πιο πιθανό να είμαστε απασχολημένοι και κοινωνικοποιημένοι. Αυτό συνεπάγεται συχνά σχεδιασμό και επικοινωνία σχετικών πληροφοριών (τόσο περισσότερα μηνύματα). Η Κυριακή είναι η ημέρα της εβδομάδας που είναι πιθανότερο να περάσουμε μαζί, γι 'αυτό στέλνουμε σημαντικά λιγότερα μηνύματα.

Χρόνος μετά το χρόνο

Ακολουθώντας το θέμα των περισσότερων μηνυμάτων κατά τη διάρκεια της εβδομάδας εργασίας, ας δούμε αν είμαστε πραγματικά τόσο κακοί στην αναβολή ή εάν μπορώ να σώσω λίγο πρόσωπο…

Μέσος αριθμός μηνυμάτων ανά λεπτό κατά τη διάρκεια μιας 24ωρης ημέρας.

Μπορείτε να δείτε ότι τα μηνύματά μας αυξάνονται σταδιακά όλο το πρωί, φτάνοντας στο αποκορύφωμά τους γύρω από το μεσημέρι (δεν προκαλεί έκπληξη). Στη συνέχεια βυθίζονται ελαφρώς μετά το μεσημεριανό γεύμα καθώς επιστρέφουμε στη δουλειά και παίρνουμε ξανά μετά τις 4μμ, περίπου την ώρα που συνήθως τελειώνουμε τη δουλειά. Λιγότερα μηνύματα τα βράδια είναι απλώς μια άλλη αντανάκλαση του γεγονότος ότι δεν στέλνουμε μηνύματα όταν είμαστε μαζί.

Παραπανω απο λεξεις

Τώρα για τα πραγματικά καταδικαστικά στοιχεία ... χρόνος να δούμε ποιες ήταν οι πιο συχνά χρησιμοποιούμενες λέξεις μας. Για αυτό, κατάργησα όλες τις λέξεις-κλειδιά ('a', 'the', 'και' κ.λπ.) και οι 10 κορυφαίες λέξεις που χρησιμοποιούνται πιο συχνά από τον καθένα από εμάς μπορούν να δουν παρακάτω:

Οι 10 πιο δημοφιλείς λέξεις για κάθε έναν από εμάς, εξαιρουμένων των λέξεων κλεισίματος

Προφανώς συμφωνούμε μεταξύ μας… πολύ. Είμαι αρκετά σίγουρος ότι ο πατέρας μου που διδάσκει Αγγλικά θα απογοητευόταν από τη συχνή χρήση του «θα». Είναι επίσης σαφές ότι το "ah" είναι η αγαπημένη μας λέξη πλήρωσης - ή οτιδήποτε άλλο ισοδυναμεί για συνομιλίες με κείμενο.

Θεωρώ ενδιαφέρον ότι ο «χρόνος» είναι μια τόσο κοινή λέξη και για τους δύο, πιθανότατα αντικατοπτρίζει καταστάσεις όταν προσπαθούμε να οργανώσουμε ή να σχεδιάσουμε κάτι («τι ώρα;», «αν έχουμε χρόνο» κ.λπ.). Είναι επίσης αρκετά προφανές που λέει πιο συχνά «καληνύχτα» και «καλημέρα».

Συνολική έκλειψη της καρδιάς (Emoji)

Τα Emoji είναι μια εξαιρετικά δημοφιλής μορφή επικοινωνίας αυτές τις μέρες και συχνά χρησιμοποιούνται για κωμικό εφέ ή για να απεικονίσουν συναισθήματα χωρίς να χρειάζεται να πληκτρολογήσετε τις λέξεις. Για να ολοκληρώσουμε αυτήν τη φευγαλέα ανάλυση της συνομιλίας Whatsapp μεταξύ της φίλης μου και εγώ, ας ρίξουμε μια ματιά στα αγαπημένα μας emoji:

Διάγραμμα που δείχνει καθένα από τα 10 πιο δημοφιλή emoji κατά τη διάρκεια της χρονικής περιόδου

Κανείς από εμάς δεν εκπλήσσεται με το ποια είναι τα πιο συχνά χρησιμοποιούμενα emoji μας. Ωστόσο, με εκπλήσσει πολύ το πόσο χρησιμοποιώ τα emoji eye-roll… ειδικά όταν θεωρείτε ότι είναι περισσότερο από διπλάσιο από οποιοδήποτε emoji χρησιμοποιεί η φίλη μου, εκτός από τα δύο κορυφαία.

Θεωρώ επίσης ενδιαφέρον να δω πώς το γράφημα αντικατοπτρίζει τις διαφορές στον τρόπο που χρησιμοποιούμε τα emoji. Τείνω να χρησιμοποιώ μια ευρύτερη ποικιλία και - αν και σαφώς έχω κάποια αγαπημένα - η διάδοση του αριθμού των φορών που χρησιμοποιώ κάθε emoji είναι αρκετά ομοιόμορφο. Η φίλη μου, από την άλλη πλευρά, έχει δύο emoji που είναι σαφώς «emojis» της - η μαϊμού βλέπουμε και το γέλιο που κλαίει.

ΕΠΕΞΕΡΓΑΣΙΑ: Ο κωδικός που χρησιμοποιείται σε αυτό το άρθρο είναι πλέον διαθέσιμος στο Github εδώ.

Τα δεδομένα σας είναι μια χώρα των θαυμάτων

Λοιπόν, ελπίζω να απολαύσατε αυτήν τη σύντομη εικόνα της σχέσης μου - είμαι βέβαιος ότι το βρήκατε συναρπαστικό. Συνολικά φαίνεται ότι 3,5 χρόνια σχέσης στο Whatsapp μπορούν να συνοψιστούν με ένα εντυπωσιακό emoji.

Με κάθε σοβαρότητα, αν αυτός ο τύπος ανάλυσης και παρουσίασης δεδομένων σας ενδιαφέρει, δώστε μου μια συνέχεια και δώστε μου στη δημοσίευση (Data Slice) μια παρακολούθηση για να μείνω ενημερωμένος με τα άρθρα μου! Σκέφτομαι επίσης να δημιουργήσω μια εφαρμογή που θα επιτρέπει σε οποιονδήποτε να βλέπει γρήγορα μια οπτικοποίηση της συνομιλίας του Whatsapp χρησιμοποιώντας παρόμοια γραφήματα / γραφήματα με αυτά που βλέπετε εδώ - επιτρέψτε μου να ξέρω στα σχόλια ή με άμεσο μήνυμα εάν αυτό είναι κάτι που θα σας ενδιαφέρει.