College of Engineering and Applied Sciences

Under ett givet år drabbar depression mer än sex procent av den vuxna befolkningen i USA – cirka 16 miljoner människor – men färre än hälften får den behandling de behöver. Vad skulle hända om en algoritm kunde skanna sociala medier och peka på språkliga röda flaggor för sjukdomen innan en formell medicinsk diagnos har ställts?

”Det som människor skriver i sociala medier och på nätet fångar en aspekt av livet som det är mycket svårt att få tillgång till inom medicin och forskning på annat sätt. Det är en dimension som är relativt outnyttjad jämfört med biofysiska sjukdomsmarkörer”, säger H. Andrew Schwartz, biträdande professor vid institutionen för datavetenskap vid Stony Brook University och huvudansvarig för World Well-Being Project. ”Tillstånd som depression, ångest och PTSD, till exempel, hittar man fler signaler i hur människor uttrycker sig digitalt.”

Publicerad i Proceedings of the National Academy of Sciences, visar Schwartz forskning att detta nu är mer troligt än någonsin. Genom att analysera data från sociala medier som delats av samtyckande användare under de månader som föregick en depressionsdiagnos fann forskare från Stony Brook University och University of Pennsylvania att deras algoritm exakt kunde förutsäga framtida depressioner. Indikatorer för tillståndet var bland annat omnämnanden av fientlighet och ensamhet, ord som ”tårar” och ”känslor” och användning av fler förstapersonliga pronomen som ”jag” och ”me”.

I sex år har forskarna i World Well-Being Project (WWBP), som är baserade i Stony Brooks Human Language Analysis Lab och UPenns Positive Psychology Center, studerat hur de ord som människor använder speglar deras inre känslor och tillfredsställelse. År 2014 började Johannes Eichstaedt, WWBP:s grundande forskare och postdoktoral stipendiat vid Penn, undra om det var möjligt att sociala medier skulle kunna förutsäga psykiska hälsoutfall, särskilt när det gäller depression.

”Sociala mediedata innehåller markörer som kan liknas vid arvsmassan. Med förvånansvärt liknande metoder som de som används inom genomik kan vi finkamma sociala mediedata för att hitta dessa markörer”, förklarar Eichstaedt. ”Depression verkar vara något som kan upptäckas på detta sätt; det förändrar verkligen människors användning av sociala medier på ett sätt som inte är fallet med exempelvis hudsjukdomar eller diabetes.”

Eichstaedt och Schwartz samarbetade med kollegorna Robert J. Smith, Raina Merchant, David Asch och Lyle Ungar från Penn Medicine Center for Digital Health för den här studien. I stället för att göra det som tidigare studier hade gjort – rekrytera deltagare som själv rapporterar sin depression – identifierade forskarna data från personer som gav sitt samtycke till att dela med sig av Facebook-status och information från elektroniska medicinska journaler, och analyserade dem sedan med hjälp av maskininlärningstekniker för att särskilja dem som hade en formell depressionsdiagnos.

Nästan 1 200 personer gav sitt samtycke till att tillhandahålla båda de digitala arkiven. Av dessa hade 114 personer en depressionsdiagnos i sina medicinska journaler. Forskarna matchade sedan varje person med en depressionsdiagnos med fem personer som inte hade det, för att fungera som en kontroll, för att få ett totalt urval på 683 personer (en person exkluderades på grund av otillräckliga ord i statusuppdateringar). Tanken var att skapa ett så realistiskt scenario som möjligt för att träna och testa forskarnas algoritm.

”Det här är ett riktigt svårt problem”, säger Eichstaedt. ”Om 683 personer kommer till sjukhuset och 15 procent av dem är deprimerade, skulle vår algoritm kunna förutsäga vilka? Om algoritmen säger att ingen var deprimerad skulle den vara 85 procent korrekt.”

För att bygga upp algoritmen tittade Eichstaedt, Smith och kollegor tillbaka på 524 292 Facebook-uppdateringar från åren före diagnosen för varje person med depression och för samma tidsperiod för kontrollgruppen. De fastställde de mest frekvent använda orden och fraserna och modellerade sedan 200 ämnen för att ta reda på vad de kallade ”depressionsassocierade språkmarkörer”. Slutligen jämförde de på vilket sätt och hur ofta deprimerade respektive kontrolldeltagare använde sådana formuleringar.

De fick veta att dessa markörer omfattade känslomässiga, kognitiva och interpersonella processer som fientlighet och ensamhet, sorg och grubbleri, och att de kunde förutsäga en framtida depression så tidigt som tre månader före den första dokumentationen av sjukdomen i en medicinsk journal.

”Det finns en föreställning om att det inte är bra för ens psykiska hälsa att använda sociala medier, men det kan visa sig vara ett viktigt verktyg för att diagnostisera, övervaka och så småningom behandla den”, säger Schwartz. ”Här har vi visat att det kan användas tillsammans med kliniska journaler, ett steg mot att förbättra den psykiska hälsan med hjälp av sociala medier.”

Eichstaedt ser en långsiktig potential i att använda dessa data som en form av diskret screening. ”Förhoppningen är att dessa screeningssystem en dag kan integreras i vårdsystemen”, säger han. ”Det här verktyget lyfter upp gula flaggor; så småningom är förhoppningen att man direkt kan leda personer som identifieras till skalbara behandlingsmetoder.”

Trots vissa begränsningar i studien, inklusive ett distinkt urbant urval, och begränsningar inom själva fältet – inte alla depressionsdiagnoser i en journal uppfyller den guldstandard som strukturerade kliniska intervjuer ger, till exempel – erbjuder resultaten ett potentiellt nytt sätt att avslöja och få hjälp för dem som lider av depression.