College of Engineering and Applied Sciences

In een willekeurig jaar treft depressie meer dan zes procent van de volwassen bevolking in de Verenigde Staten – zo’n 16 miljoen mensen – maar minder dan de helft krijgt de behandeling die ze nodig hebben. Wat als een algoritme sociale media zou kunnen scannen en linguïstische rode vlaggen van de ziekte zou kunnen aanwijzen voordat er een formele medische diagnose is gesteld?

“Wat mensen in sociale media en online schrijven, geeft een aspect van het leven weer dat anders moeilijk toegankelijk is voor geneeskunde en onderzoek. Het is een dimensie die relatief onbenut blijft in vergelijking met biofysische markers van ziekte,” zegt H. Andrew Schwartz, assistent-professor bij de afdeling computerwetenschappen van de Stony Brook University en hoofdonderzoeker van het World Well-Being Project. “Aandoeningen zoals depressie, angst en PTSS, bijvoorbeeld, vind je meer signalen in de manier waarop mensen zich digitaal uitdrukken.”

gepubliceerd in de Proceedings of the National Academy of Sciences, toont het onderzoek van Schwartz aan dat dit nu aannemelijker is dan ooit. Onderzoekers van Stony Brook University en University of Pennsylvania analyseerden sociale-mediagegevens die werden gedeeld door instemmende gebruikers in de maanden voorafgaand aan een depressiediagnose en ontdekten dat hun algoritme toekomstige depressie nauwkeurig kon voorspellen. Indicatoren van de aandoening waren onder meer vermeldingen van vijandigheid en eenzaamheid, woorden als “tranen” en “gevoelens”, en het gebruik van meer voornaamwoorden uit de eerste persoon, zoals “ik” en “mij.”

Sinds zes jaar bestuderen onderzoekers in het World Well-Being Project (WWBP), gevestigd in het Human Language Analysis Lab van Stony Brook en het Positive Psychology Center van UPenn, hoe de woorden die mensen gebruiken hun innerlijke gevoelens en tevredenheid weerspiegelen. In 2014 begon Johannes Eichstaedt, de oprichter van WWBP en een postdoctoraal fellow aan Penn, zich af te vragen of het mogelijk was dat sociale media de resultaten op het gebied van geestelijke gezondheid konden voorspellen, met name voor depressie.

“Sociale mediagegevens bevatten markers die verwant zijn aan het genoom. Met methoden die verrassend veel lijken op de methoden die in de genomica worden gebruikt, kunnen we sociale-mediagegevens uitkammen om deze markers te vinden,” legt Eichstaedt uit. “Depressie blijkt op deze manier iets heel detecteerbaars te zijn; het verandert echt het gebruik van sociale media door mensen op een manier die iets als huidziekte of diabetes niet doet.”

Eichstaedt en Schwartz werkten voor deze studie samen met collega’s Robert J. Smith, Raina Merchant, David Asch, en Lyle Ungar van het Penn Medicine Center for Digital Health. In plaats van te doen wat eerdere studies hadden gedaan – deelnemers werven die zelf hun depressie rapporteren – identificeerden de onderzoekers gegevens van mensen die toestemden om Facebook-statussen en elektronische medische dossierinformatie te delen, en analyseerden ze vervolgens met behulp van machine-learningtechnieken om degenen met een formele depressiediagnose te onderscheiden.

Bijna 1.200 mensen stemden toe om beide digitale archieven te verstrekken. Hiervan hadden 114 mensen een diagnose van depressie in hun medisch dossier. De onderzoekers koppelden vervolgens elke persoon met een diagnose van depressie aan vijf die dat niet hadden, om als controle te fungeren, voor een totale steekproef van 683 mensen (exclusief één wegens onvoldoende woorden in statusupdates). Het idee was om een zo realistisch mogelijk scenario te creëren om het algoritme van de onderzoekers te trainen en te testen.

“Dit is echt een moeilijk probleem,” zegt Eichstaedt. “Als 683 mensen zich in het ziekenhuis melden en 15 procent van hen is depressief, zou ons algoritme dan kunnen voorspellen welke dat zijn? Als het algoritme zegt dat niemand depressief was, zou het 85 procent accuraat zijn.”

Om het algoritme te bouwen, keken Eichstaedt, Smith en collega’s terug naar 524.292 Facebook-updates uit de jaren voorafgaand aan de diagnose voor elk individu met een depressie en voor dezelfde tijdspanne voor de controle. Ze bepaalden de meest gebruikte woorden en zinnen en modelleerden vervolgens 200 onderwerpen om uit te zoeken wat zij “depressie-geassocieerde taalmarkers” noemden. Tenslotte vergeleken zij op welke manier en hoe vaak depressieve versus controledeelnemers dergelijke formuleringen gebruikten.

Zij leerden dat deze markers emotionele, cognitieve en interpersoonlijke processen omvatten, zoals vijandigheid en eenzaamheid, droefheid en herkauwen, en dat zij toekomstige depressie al drie maanden vóór de eerste documentatie van de ziekte in een medisch dossier konden voorspellen.

“Er is een perceptie dat het gebruik van sociale media niet goed is voor iemands geestelijke gezondheid, maar het kan een belangrijk hulpmiddel blijken te zijn voor het diagnosticeren, monitoren en uiteindelijk behandelen ervan,” zegt Schwartz. “Hier hebben we laten zien dat het kan worden gebruikt met klinische dossiers, een stap in de richting van het verbeteren van de geestelijke gezondheid met sociale media.”

Eichstaedt ziet op lange termijn potentieel in het gebruik van deze gegevens als een vorm van onopdringerige screening. “De hoop is dat deze screeningsystemen op een dag kunnen worden geïntegreerd in zorgsystemen”, zegt hij. “Deze tool brengt gele vlaggen aan het licht; uiteindelijk is de hoop dat je mensen die het identificeert direct naar schaalbare behandelingsmodaliteiten kunt leiden.”

Ondanks enkele beperkingen van de studie, waaronder een kenmerkende stedelijke steekproef, en beperkingen in het veld zelf – niet elke depressiediagnose in een medisch dossier voldoet aan de gouden standaard die gestructureerde klinische interviews bieden, bijvoorbeeld – bieden de bevindingen een potentiële nieuwe manier om depressiepatiënten aan het licht te brengen en hulp te krijgen.