College of Engineering and Applied Sciences

Vuosittain masennukseen sairastuu yli kuusi prosenttia Yhdysvaltojen aikuisväestöstä – noin 16 miljoonaa ihmistä – mutta alle puolet saa tarvitsemaansa hoitoa. Entä jos algoritmi voisi skannata sosiaalista mediaa ja osoittaa sairauden kielelliset punaiset liput ennen kuin virallinen lääketieteellinen diagnoosi on tehty?

”Se, mitä ihmiset kirjoittavat sosiaalisessa mediassa ja verkossa, kuvaa sellaista elämän osa-aluetta, jota lääketieteen ja tutkimuksen on muuten hyvin vaikea tavoittaa. Se on ulottuvuus, joka on suhteellisen hyödyntämätön verrattuna sairauden biofysikaalisiin markkereihin”, sanoo H. Andrew Schwartz, Stony Brookin yliopiston tietojenkäsittelytieteen laitoksen apulaisprofessori ja World Well-Being Projectin päätutkija. ”Esimerkiksi masennuksen, ahdistuksen ja PTSD:n kaltaisista tiloista löytyy enemmän signaaleja siitä, miten ihmiset ilmaisevat itseään digitaalisesti.”

Proceedings of the National Academy of Sciences -julkaisussa julkaistu Schwartzin tutkimus osoittaa, että tämä on nyt uskottavampaa kuin koskaan. Analysoimalla suostumuksensa antaneiden käyttäjien jakamia sosiaalisen median tietoja masennusdiagnoosia edeltäviltä kuukausilta Stony Brookin yliopiston ja Pennsylvanian yliopiston tutkijat havaitsivat, että heidän algoritminsa pystyi ennustamaan tarkasti tulevan masennuksen. Tilaindikaattoreihin kuuluivat maininnat vihamielisyydestä ja yksinäisyydestä, sanat kuten ”kyyneleet” ja ”tunteet” sekä useampien ensimmäisen persoonan pronominien, kuten ”minä” ja ”minua”, käyttö.”

Stony Brookin Human Language Analysis Labissa ja UPennin Positive Psychology Centerissä toimivan World Well-Being Project (WWBP) -hankkeen (Maailman hyvinvointihanke) tutkijat ovat kuuden vuoden ajan tutkineet, miten ihmisten käyttämät sanat heijastavat heidän sisäisiä tunteitaan ja tyytyväisyyttään. Vuonna 2014 Johannes Eichstaedt, WWBP:n perustanut tutkija ja Pennin postdoc-tutkija, alkoi pohtia, olisiko sosiaalisen median mahdollista ennustaa mielenterveyden tuloksia, erityisesti masennusta.

”Sosiaalisen median tiedot sisältävät genomin kaltaisia markkereita. Yllättävän samanlaisilla menetelmillä kuin genomitutkimuksessa, voimme haravoida sosiaalisen median dataa löytääksemme nämä markkerit”, Eichstaedt selittää. ”Masennus näyttää olevan jotain, joka on varsin hyvin havaittavissa tällä tavoin; se todella muuttaa ihmisten sosiaalisen median käyttöä tavalla, jota jokin ihosairauden tai diabeteksen kaltainen asia ei muuta.”

Eichstaedt ja Schwartz tekivät tutkimusta yhdessä kollegoidensa Robert J. Smithin, Raina Merchantin, David Aschin ja Lyle Ungarin kanssa Penn Medicine Center for Digital Health -yksiköstä. Sen sijaan, että he olisivat tehneet sen, mitä aiemmat tutkimukset olivat tehneet – rekrytoineet osallistujia, jotka ilmoittivat itse masennuksestaan – tutkijat tunnistivat tietoja ihmisistä, jotka suostuivat jakamaan Facebook-statuksia ja sähköisiä sairauskertomustietoja, ja analysoivat niitä sitten koneoppimisen tekniikoiden avulla erottaakseen toisistaan ne, joilla oli muodollinen masennusdiagnoosi.

Vähän 1200 ihmistä suostui toimittamaan molemmat digitaaliset arkistot. Heistä 114:llä henkilöllä oli sairauskertomuksessa masennusdiagnoosi. Tämän jälkeen tutkijat vertasivat jokaista henkilöä, jolla oli masennusdiagnoosi, viiteen henkilöön, joilla ei ollut masennusdiagnoosia, jotta he voisivat toimia kontrollina, ja näin saatiin yhteensä 683 henkilön otos (pois lukien yksi henkilö, koska hänellä ei ollut riittävästi sanoja tilapäivityksissä). Tarkoituksena oli luoda mahdollisimman realistinen skenaario tutkijoiden algoritmin harjoittelua ja testausta varten.

”Tämä on todella vaikea ongelma”, Eichstaedt sanoo. ”Jos 683 ihmistä saapuu sairaalaan ja 15 prosenttia heistä on masentuneita, pystyisikö algoritmimme ennustamaan, ketkä heistä ovat masentuneita?”. Jos algoritmi sanoo, ettei kukaan ole masentunut, se olisi 85-prosenttisen tarkka.”

Algoritmin rakentamiseksi Eichstaedt, Smith ja kollegat tarkastelivat 524 292 Facebook-päivitystä diagnoosia edeltäviltä vuosilta jokaiselta masennusta sairastavalta yksilöltä ja samalta ajanjaksolta kontrolliryhmältä. He määrittivät yleisimmin käytetyt sanat ja fraasit ja mallinsivat sitten 200 aihetta löytääkseen ”masennukseen liittyvät kielelliset markkerit”. Lopuksi he vertasivat, millä tavoin ja kuinka usein masentuneet ja kontrollihenkilöt käyttivät tällaisia ilmaisuja.

He saivat selville, että nämä markkerit sisälsivät emotionaalisia, kognitiivisia ja ihmissuhteiden välisiä prosesseja, kuten vihamielisyyttä ja yksinäisyyttä, surumielisyyttä ja mököttämistä, ja että ne saattoivat ennustaa tulevaa masennusta jo kolme kuukautta ennen kuin sairaus oli ensimmäisen kerran dokumentoitu sairauskertomukseen.

”On olemassa käsitys, että sosiaalisen median käyttö ei ole hyväksi mielenterveydelle, mutta se voi osoittautua tärkeäksi työkaluksi diagnosoinnissa, seurannassa ja lopulta hoidossa”, Schwartz sanoo. ”Tässä olemme osoittaneet, että sitä voidaan käyttää kliinisten tietojen kanssa, mikä on askel kohti mielenterveyden parantamista sosiaalisen median avulla.”

Eichstaedt näkee pitkän aikavälin mahdollisuuksia näiden tietojen käyttämisessä eräänlaisena huomaamattomana seulontana. ”Toiveena on, että jonain päivänä nämä seulontajärjestelmät voidaan integroida hoitojärjestelmiin”, hän sanoo. ”Tämä työkalu herättää keltaisia lippuja; lopulta toiveena on, että sen tunnistamat ihmiset voitaisiin ohjata suoraan skaalautuviin hoitomuotoihin.”

Tutkimuksen joistakin rajoituksista huolimatta, mukaan lukien omaleimainen kaupunkinäyte, ja itse alan rajoituksista huolimatta – esimerkiksi kaikki sairauskertomuksissa olevat masennusdiagnoosit eivät täytä strukturoitujen kliinisten haastattelujen kultaista standardia – havainnot tarjoavat potentiaalisen uuden tavan paljastaa masennusta sairastavat ja saada apua heille.

Havaintoja voidaan käyttää masennuksesta kärsivien henkilöiden auttamiseksi.