SBU - Computer Science Department - Social Media Posts Can Predict Depression

20 prosince, 2021

V daném roce trpí depresí více než šest procent dospělé populace ve Spojených státech – přibližně 16 milionů lidí – ale méně než polovina z nich se podrobí potřebné léčbě. Co kdyby algoritmus dokázal prohledat sociální média a poukázat na jazykové příznaky nemoci ještě před stanovením formální lékařské diagnózy?“

„To, co lidé píší v sociálních médiích a na internetu, zachycuje aspekt života, který je v medicíně a výzkumu jinak velmi těžko přístupný. Je to rozměr, který je ve srovnání s biofyzikálními markery nemocí relativně nevyužitý,“ říká H. Andrew Schwartz, odborný asistent na katedře informatiky Stony Brook University a hlavní řešitel projektu World Well-Being. „Například u stavů, jako je deprese, úzkost a posttraumatická stresová porucha, najdete více signálů ve způsobu, jakým se lidé digitálně vyjadřují.“

Schwartzův výzkum publikovaný v Proceedings of the National Academy of Sciences ukazuje, že je to nyní pravděpodobnější než kdy dříve. Analýzou dat ze sociálních médií sdílených souhlasnými uživateli v průběhu měsíců předcházejících diagnóze deprese vědci z univerzity Stony Brook a Pensylvánské univerzity zjistili, že jejich algoritmus dokáže přesně předpovědět budoucí depresi. Mezi indikátory tohoto stavu patřily zmínky o nepřátelství a osamělosti, slova jako „slzy“ a „pocity“ a používání většího počtu zájmen v první osobě, jako jsou „já“ a „mně“.

Po šest let výzkumníci v rámci projektu WWBP (World Well-Being Project), který sídlí v laboratoři analýzy lidského jazyka na Stony Brook a v centru pozitivní psychologie na UPenn, zkoumali, jak slova, která lidé používají, odrážejí jejich vnitřní pocity a spokojenost. V roce 2014 se Johannes Eichstaedt, zakládající vědecký pracovník WWBP a postdoktorand na Penn, začal zajímat o to, zda je možné, aby sociální média předpovídala výsledky duševního zdraví, zejména v případě deprese.

„Data sociálních médií obsahují markery podobné genomu. S překvapivě podobnými metodami, jaké se používají v genomice, můžeme data sociálních médií pročesat a tyto markery najít,“ vysvětluje Eichstaedt. „Zdá se, že deprese je něco, co je tímto způsobem docela dobře zjistitelné; skutečně mění používání sociálních médií lidmi způsobem, který něco jako kožní onemocnění nebo cukrovka nezmění.“

Eichstaedt a Schwartz se pro tuto studii spojili s kolegy Robertem J. Smithem, Rainou Merchantovou, Davidem Aschem a Lyle Ungarem z Centra pro digitální zdraví Penn Medicine. Namísto toho, aby dělali to, co dělaly předchozí studie – nabírali účastníky, kteří sami uvádějí své deprese -, výzkumníci identifikovali data od lidí, kteří souhlasili se sdílením statusů na Facebooku a informací z elektronických lékařských záznamů, a poté je analyzovali pomocí technik strojového učení, aby rozlišili ty, kteří mají formální diagnózu deprese.

Téměř 1 200 lidí souhlasilo s poskytnutím obou digitálních archivů. Z nich 114 osob mělo ve svých lékařských záznamech diagnózu deprese. Výzkumníci poté porovnali každou osobu s diagnózou deprese s pěti osobami, které ji neměly, aby sloužily jako kontrola, a získali tak celkový vzorek 683 osob (s vyloučením jedné osoby pro nedostatečný počet slov v rámci aktualizací stavu). Cílem bylo vytvořit co nejrealističtější scénář pro trénink a testování algoritmu výzkumníků.

„Je to opravdu těžký problém,“ říká Eichstaedt. „Pokud se do nemocnice dostaví 683 lidí a 15 procent z nich má depresi, dokázal by náš algoritmus předpovědět, kteří z nich to jsou? Pokud by algoritmus řekl, že nikdo nebyl v depresi, byl by přesný na 85 procent.“

Pro sestavení algoritmu se Eichstaedt, Smith a jejich kolegové podívali zpětně na 524 292 aktualizací na Facebooku z let předcházejících diagnóze u každého jedince s depresí a na stejný časový úsek u kontrolní skupiny. Určili nejčastěji používaná slova a fráze a poté vymodelovali 200 témat, aby zjistili, co nazývají „jazykové markery spojené s depresí“. Nakonec porovnali, jakým způsobem a jak často účastníci s depresí v porovnání s kontrolní skupinou tyto fráze používali.

Zjistili, že tyto markery zahrnují emocionální, kognitivní a interpersonální procesy, jako je nepřátelství a osamělost, smutek a prožívání, a mohou předpovědět budoucí depresi již tři měsíce před prvním zdokumentováním nemoci v lékařské dokumentaci.

„Panuje názor, že používání sociálních médií není dobré pro duševní zdraví, ale může se ukázat, že jde o důležitý nástroj pro diagnostiku, sledování a případně i léčbu,“ říká Schwartz. „Zde jsme ukázali, že je lze používat s klinickými záznamy, což je krok ke zlepšení duševního zdraví pomocí sociálních médií.“

Eichstaedt vidí dlouhodobý potenciál ve využití těchto dat jako formy nenápadného screeningu. „Doufáme, že jednoho dne bude možné tyto screeningové systémy integrovat do systémů péče,“ říká. „Tento nástroj zvedá žluté vlajky; nakonec je naděje, že byste mohli lidi, které identifikuje, přímo nasměrovat do škálovatelných léčebných modalit.“

Přes některá omezení studie, včetně výrazného městského vzorku a omezení v samotné oblasti – ne každá diagnóza deprese ve zdravotnické dokumentaci splňuje zlatý standard, který například poskytují strukturované klinické rozhovory – nabízejí zjištění potenciální nový způsob, jak odhalit a získat pomoc pro ty, kteří trpí depresí.

Savage Rose

College of Engineering and Applied Sciences

Napsat komentář Zrušit odpověď na komentář