College of Engineering and Applied Sciences

Hvert år rammer depression mere end seks procent af den voksne befolkning i USA – omkring 16 millioner mennesker – men mindre end halvdelen får den behandling, de har brug for. Hvad nu, hvis en algoritme kunne scanne sociale medier og pege på sproglige røde flag for sygdommen, før en formel medicinsk diagnose var blevet stillet?

“Det, folk skriver på sociale medier og online, indfanger et aspekt af livet, som det er meget svært for medicin og forskning at få adgang til på anden vis. Det er en dimension, der er relativt uudnyttet sammenlignet med biofysiske sygdomsmarkører”, siger H. Andrew Schwartz, assisterende professor ved Institut for Datalogi på Stony Brook University og hovedundersøger af World Well-Being Project. “Tilstande som depression, angst og PTSD finder man f.eks. flere signaler i den måde, folk udtrykker sig digitalt.”

Publiceret i Proceedings of the National Academy of Sciences viser Schwartz’ forskning, at dette nu er mere plausibelt end nogensinde før. Ved at analysere data fra sociale medier, som blev delt af brugere med samtykke i løbet af de måneder, der gik forud for en depressionsdiagnose, fandt forskere fra Stony Brook University og University of Pennsylvania, at deres algoritme præcist kunne forudsige fremtidig depression. Indikatorer for tilstanden var bl.a. omtaler af fjendtlighed og ensomhed, ord som “tårer” og “følelser” og brug af flere førstepersonspronomener som “jeg” og “mig”.”

I seks år har forskere i World Well-Being Project (WWBP), der er baseret i Stony Brook’s Human Language Analysis Lab og UPenn’s Positive Psychology Center, undersøgt, hvordan de ord, som folk bruger, afspejler deres indre følelser og tilfredshed. I 2014 begyndte Johannes Eichstaedt, WWBP’s stiftende forsker og postdoc på Penn, at spekulere på, om det var muligt for sociale medier at forudsige mentale sundhedsresultater, især for depression.

“Data fra sociale medier indeholder markører, der kan sammenlignes med genomet. Med overraskende lignende metoder som dem, der anvendes inden for genomik, kan vi finkæmme sociale mediedata for at finde disse markører”, forklarer Eichstaedt. “Depression synes at være noget, der kan påvises på denne måde; det ændrer virkelig folks brug af sociale medier på en måde, som noget som hudsygdomme eller diabetes ikke gør.”

Eichstaedt og Schwartz arbejdede sammen med kollegerne Robert J. Smith, Raina Merchant, David Asch og Lyle Ungar fra Penn Medicine Center for Digital Health i forbindelse med denne undersøgelse. I stedet for at gøre, hvad tidligere undersøgelser havde gjort – rekruttere deltagere, der selv rapporterer deres depression – identificerede forskerne data fra personer, der gav samtykke til at dele Facebook-status og oplysninger fra elektroniske patientjournaler, og analyserede dem derefter ved hjælp af maskinlæringsteknikker for at skelne dem med en formel depressionsdiagnose.

Næsten 1.200 personer gav deres samtykke til at levere begge digitale arkiver. Af disse havde 114 personer en diagnose af depression i deres lægejournaler. Forskerne matchede derefter hver person med en diagnose af depression med fem personer, der ikke havde en diagnose af depression, for at fungere som en kontrol, for at få en samlet stikprøve på 683 personer (eksklusive én for utilstrækkelige ord i statusopdateringer). Ideen var at skabe et så realistisk scenarie som muligt for at træne og teste forskernes algoritme.

“Dette er et virkelig svært problem,” siger Eichstaedt. “Hvis 683 mennesker møder op på hospitalet, og 15 procent af dem er deprimerede, ville vores algoritme så kunne forudsige hvilke af dem? Hvis algoritmen siger, at ingen var deprimerede, ville den være 85 procent præcis.”

For at opbygge algoritmen kiggede Eichstaedt, Smith og kolleger tilbage på 524.292 Facebook-opdateringer fra årene op til diagnosen for hver enkelt person med depression og for samme tidsrum for kontrolgruppen. De bestemte de hyppigst anvendte ord og sætninger og modellerede derefter 200 emner for at finde frem til det, de kaldte “depressionsassocierede sproglige markører”. Endelig sammenlignede de, på hvilken måde og hvor ofte deprimerede deltagere i forhold til kontroldeltagere brugte sådanne formuleringer.

De fandt ud af, at disse markører omfattede følelsesmæssige, kognitive og interpersonelle processer som f.eks. fjendtlighed og ensomhed, tristhed og rumination og kunne forudsige fremtidig depression allerede tre måneder før den første dokumentation af sygdommen i en lægejournal.

“Der er en opfattelse af, at det ikke er godt for ens mentale sundhed at bruge sociale medier, men det kan vise sig at være et vigtigt redskab til at diagnosticere, overvåge og i sidste ende behandle den”, siger Schwartz. “Her har vi vist, at det kan bruges sammen med kliniske optegnelser, hvilket er et skridt i retning af at forbedre den mentale sundhed med sociale medier.”

Eichstaedt ser et langsigtet potentiale i at bruge disse data som en form for uoptrækkende screening. “Håbet er, at disse screeningssystemer en dag kan integreres i plejesystemer”, siger han. “Dette værktøj rejser gule flag; i sidste ende er håbet, at man direkte kan føre folk, som det identificerer, ind i skalerbare behandlingsmetoder.”

Trods nogle begrænsninger i undersøgelsen, herunder en særpræget stikprøve fra byerne, og begrænsninger i selve feltet – ikke alle depressionsdiagnoser i en patientjournal opfylder den guldstandard, som strukturerede kliniske interviews giver, for eksempel – tilbyder resultaterne en potentiel ny måde at afdække og få hjælp til dem, der lider af depression.