W danym roku depresja dotyka ponad sześć procent dorosłej populacji w Stanach Zjednoczonych – około 16 milionów osób – ale mniej niż połowa z nich otrzymuje potrzebne leczenie. Co by było, gdyby algorytm mógł skanować media społecznościowe i wskazywać na językowe czerwone flagi choroby, zanim zostanie postawiona formalna diagnoza medyczna?
„To, co ludzie piszą w mediach społecznościowych i online, oddaje aspekt życia, do którego dostęp w medycynie i badaniach jest bardzo trudny. Jest to wymiar, który jest stosunkowo niewykorzystany w porównaniu z biofizycznymi markerami chorób” – mówi H. Andrew Schwartz, adiunkt na Wydziale Informatyki Uniwersytetu Stony Brook i główny badacz World Well-Being Project. „Warunki takie jak depresja, lęk i PTSD, na przykład, można znaleźć więcej sygnałów w sposób, w jaki ludzie wyrażają się cyfrowo.”
Opublikowane w Proceedings of the National Academy of Sciences, badania Schwartza pokazują, że jest to teraz bardziej prawdopodobne niż kiedykolwiek. Analizując dane z mediów społecznościowych udostępniane przez użytkowników w miesiącach poprzedzających diagnozę depresji, naukowcy ze Stony Brook University i University of Pennsylvania odkryli, że ich algorytm może dokładnie przewidzieć przyszłą depresję. Wskaźniki tego stanu obejmowały wzmianki o wrogości i samotności, słowa takie jak „łzy” i „uczucia” oraz użycie większej liczby zaimków w pierwszej osobie, takich jak „ja” i „mnie.”
Od sześciu lat badacze z World Well-Being Project (WWBP), działającego w Stony Brook’s Human Language Analysis Lab i UPenn’s Positive Psychology Center, badają, w jaki sposób słowa, których używają ludzie, odzwierciedlają ich wewnętrzne uczucia i zadowolenie. W 2014 roku Johannes Eichstaedt, naukowiec założyciel WWBP i stypendysta postdoktorancki w Penn, zaczął się zastanawiać, czy było możliwe, aby media społecznościowe przewidywały wyniki zdrowia psychicznego, szczególnie w przypadku depresji.
„Dane mediów społecznościowych zawierają markery zbliżone do genomu. Z zaskakująco podobnych metod do tych stosowanych w genomice, możemy przeczesać dane mediów społecznościowych, aby znaleźć te markery,” wyjaśnia Eichstaedt. „Depresja wydaje się być czymś całkiem wykrywalnym w ten sposób; to naprawdę zmienia ludzi korzystania z mediów społecznościowych w sposób, że coś takiego jak choroby skóry lub cukrzyca nie.”
Eichstaedt i Schwartz połączyli siły z kolegami Robert J. Smith, Raina Merchant, David Asch, i Lyle Ungar z Penn Medicine Center for Digital Health dla tego badania. Zamiast robić to, co poprzednie badania – rekrutować uczestników, którzy sami zgłaszają swoją depresję – badacze zidentyfikowali dane od osób, które zgodziły się udostępnić statusy z Facebooka i informacje z elektronicznej dokumentacji medycznej, a następnie przeanalizowali je przy użyciu technik uczenia maszynowego, aby wyodrębnić osoby z formalną diagnozą depresji.
Niemal 1200 osób zgodziło się udostępnić oba cyfrowe archiwa. Spośród nich 114 osób posiadało diagnozę depresji w swojej dokumentacji medycznej. Następnie badacze dopasowali każdą osobę z diagnozą depresji do pięciu osób, które jej nie miały, aby działać jako kontrola, dla łącznej próby 683 osób (wyłączając jedną z powodu niewystarczającej ilości słów w aktualizacjach statusu). Chodziło o to, aby stworzyć jak najbardziej realistyczny scenariusz do szkolenia i testowania algorytmu badaczy.
„To jest naprawdę trudny problem” – mówi Eichstaedt. „Jeśli do szpitala trafią 683 osoby, a 15 procent z nich będzie miało depresję, czy nasz algorytm będzie w stanie przewidzieć, które to osoby? Jeśli algorytm powie, że nikt nie był w depresji, będzie to 85 procent dokładności.”
Aby zbudować algorytm, Eichstaedt, Smith i koledzy spojrzeli wstecz na 524,292 aktualizacji na Facebooku z lat poprzedzających diagnozę dla każdej osoby z depresją i dla tego samego przedziału czasowego dla kontroli. Określili najczęściej używane słowa i zwroty, a następnie przeanalizowali 200 tematów, aby dowiedzieć się, co nazwali „markerami językowymi związanymi z depresją”. Na koniec porównali, w jaki sposób i jak często uczestnicy z depresją i grupą kontrolną używali takich sformułowań.
Dowiedzieli się, że te znaczniki obejmowały procesy emocjonalne, poznawcze i interpersonalne, takie jak wrogość i samotność, smutek i ruminacje, i mogły przewidywać przyszłą depresję już na trzy miesiące przed pierwszym udokumentowaniem choroby w dokumentacji medycznej.
„Istnieje przekonanie, że korzystanie z mediów społecznościowych nie jest dobre dla zdrowia psychicznego, ale może się okazać, że jest to ważne narzędzie do diagnozowania, monitorowania, a ostatecznie leczenia” – mówi Schwartz. „Tutaj pokazaliśmy, że może być stosowany z zapisów klinicznych, krok w kierunku poprawy zdrowia psychicznego z mediów społecznościowych.”
Eichstaedt widzi długoterminowy potencjał w wykorzystaniu tych danych jako formy dyskretnego badania przesiewowego. „Nadzieja jest taka, że pewnego dnia te systemy przesiewowe mogą być zintegrowane z systemami opieki”, mówi. „Narzędzie to podnosi żółte flagi; ostatecznie mamy nadzieję, że będzie można bezpośrednio kierować ludzi, których identyfikuje do skalowalnych metod leczenia.”
Pomimo pewnych ograniczeń badania, w tym charakterystycznej próby miejskiej, oraz ograniczeń w samej dziedzinie – nie każda diagnoza depresji w dokumentacji medycznej spełnia złoty standard, który zapewniają na przykład ustrukturyzowane wywiady kliniczne – wyniki oferują potencjalnie nowy sposób wykrywania i uzyskiwania pomocy dla osób cierpiących na depresję.