College of Engineering and Applied Sciences

In ogni anno, la depressione colpisce più del sei per cento della popolazione adulta negli Stati Uniti – circa 16 milioni di persone – ma meno della metà riceve il trattamento di cui ha bisogno. Cosa succederebbe se un algoritmo potesse scansionare i social media e indicare le bandiere rosse linguistiche della malattia prima che sia stata fatta una diagnosi medica formale?

“Ciò che le persone scrivono nei social media e online cattura un aspetto della vita che è molto difficile in medicina e nella ricerca di accedere altrimenti. È una dimensione che è relativamente poco sfruttata rispetto ai marcatori biofisici delle malattie”, dice H. Andrew Schwartz, professore assistente nel Dipartimento di Informatica della Stony Brook University e ricercatore principale del World Well-Being Project. “Condizioni come la depressione, l’ansia e il PTSD, per esempio, si trovano più segnali nel modo in cui le persone si esprimono digitalmente.”

Pubblicata nei Proceedings of the National Academy of Sciences, la ricerca di Schwartz mostra che questo è ora più plausibile che mai. Analizzando i dati dei social media condivisi da utenti consenzienti nei mesi precedenti una diagnosi di depressione, i ricercatori della Stony Brook University e dell’Università della Pennsylvania hanno scoperto che il loro algoritmo potrebbe prevedere accuratamente la depressione futura. Gli indicatori della condizione includevano menzioni di ostilità e solitudine, parole come “lacrime” e “sentimenti”, e l’uso di più pronomi in prima persona come “io” e “me”.”

Per sei anni, i ricercatori del World Well-Being Project (WWBP), con sede nello Human Language Analysis Lab della Stony Brook e nel Positive Psychology Center della UPenn, hanno studiato come le parole usate dalle persone riflettono i loro sentimenti interiori e la loro soddisfazione. Nel 2014, Johannes Eichstaedt, ricercatore fondatore del WWBP e borsista post-dottorato alla Penn, ha iniziato a chiedersi se fosse possibile per i social media prevedere gli esiti della salute mentale, in particolare per la depressione.

“I dati dei social media contengono marcatori simili al genoma. Con metodi sorprendentemente simili a quelli usati nella genomica, possiamo pettinare i dati dei social media per trovare questi marcatori”, spiega Eichstaedt. “La depressione sembra essere qualcosa di abbastanza rilevabile in questo modo; cambia davvero l’uso che le persone fanno dei social media in un modo che qualcosa come una malattia della pelle o il diabete non fa.”

Eichstaedt e Schwartz hanno collaborato con i colleghi Robert J. Smith, Raina Merchant, David Asch e Lyle Ungar del Penn Medicine Center for Digital Health per questo studio. Piuttosto che fare ciò che gli studi precedenti avevano fatto – reclutare partecipanti che auto-riferiscono la loro depressione – i ricercatori hanno identificato i dati dalle persone che hanno acconsentito a condividere gli stati di Facebook e le informazioni della cartella clinica elettronica, poi analizzati utilizzando tecniche di apprendimento automatico per distinguere quelli con una diagnosi formale di depressione.

Quasi 1.200 persone hanno accettato di fornire entrambi gli archivi digitali. Di queste, 114 persone avevano una diagnosi di depressione nelle loro cartelle cliniche. I ricercatori hanno poi abbinato ogni persona con una diagnosi di depressione con cinque che non ha fatto, per agire come controllo, per un campione totale di 683 persone (escluso uno per parole insufficienti all’interno di aggiornamenti di stato). L’idea era di creare uno scenario il più realistico possibile per addestrare e testare l’algoritmo dei ricercatori.

“Questo è un problema davvero difficile”, dice Eichstaedt. “Se 683 persone si presentano in ospedale e il 15% di loro è depresso, il nostro algoritmo sarebbe in grado di prevedere quali sono? Se l’algoritmo dice che nessuno era depresso, sarebbe accurato all’85 per cento.”

Per costruire l’algoritmo, Eichstaedt, Smith e colleghi hanno esaminato 524.292 aggiornamenti di Facebook dagli anni precedenti la diagnosi per ogni individuo con depressione e per lo stesso arco di tempo per il controllo. Hanno determinato le parole e le frasi più frequentemente utilizzate, poi modellato 200 argomenti per scovare ciò che hanno chiamato “marcatori di linguaggio associati alla depressione”. Infine, hanno confrontato in che modo e quanto frequentemente i partecipanti depressi rispetto ai partecipanti di controllo hanno usato tali fraseggi.

Hanno imparato che questi marcatori comprendevano processi emotivi, cognitivi e interpersonali come ostilità e solitudine, tristezza e ruminazione, e potrebbero prevedere la depressione futura già tre mesi prima della prima documentazione della malattia in una cartella clinica.

“C’è la percezione che l’uso dei social media non faccia bene alla propria salute mentale, ma potrebbe rivelarsi uno strumento importante per la diagnosi, il monitoraggio ed eventualmente il trattamento”, dice Schwartz. “Qui, abbiamo dimostrato che può essere utilizzato con le registrazioni cliniche, un passo verso il miglioramento della salute mentale con i social media.”

Eichstaedt vede un potenziale a lungo termine nell’utilizzo di questi dati come una forma di screening non intrusivo. “La speranza è che un giorno, questi sistemi di screening possano essere integrati nei sistemi di cura”, dice. “Questo strumento solleva bandiere gialle; alla fine la speranza è che si potrebbe incanalare direttamente le persone che identifica in modalità di trattamento scalabile.”

Nonostante alcune limitazioni allo studio, tra cui un campione urbano distintivo, e limitazioni nel campo stesso – non ogni diagnosi di depressione in una cartella clinica soddisfa il gold standard che forniscono interviste cliniche strutturate, per esempio – i risultati offrono un potenziale nuovo modo per scoprire e ottenere aiuto per coloro che soffrono di depressione.