College of Engineering and Applied Sciences

Dans une année donnée, la dépression affecte plus de six pour cent de la population adulte aux États-Unis – environ 16 millions de personnes – mais moins de la moitié reçoit le traitement dont elle a besoin. Et si un algorithme pouvait scanner les médias sociaux et pointer les drapeaux rouges linguistiques de la maladie avant qu’un diagnostic médical formel n’ait été posé ?

« Ce que les gens écrivent dans les médias sociaux et en ligne capture un aspect de la vie qui est très difficile à accéder autrement en médecine et en recherche. C’est une dimension relativement inexploitée par rapport aux marqueurs biophysiques des maladies », explique H. Andrew Schwartz, professeur adjoint au département d’informatique de l’université Stony Brook et chercheur principal du World Well-Being Project. « Des conditions comme la dépression, l’anxiété et le SSPT, par exemple, vous trouvez plus de signaux dans la façon dont les gens s’expriment numériquement. »

Publiée dans les Actes de l’Académie nationale des sciences, la recherche de Schwartz montre que cela est maintenant plus plausible que jamais. En analysant les données des médias sociaux partagées par des utilisateurs consentants au cours des mois précédant un diagnostic de dépression, les chercheurs de l’université de Stony Brook et de l’université de Pennsylvanie ont constaté que leur algorithme pouvait prédire avec précision une future dépression. Les indicateurs de cet état comprenaient des mentions d’hostilité et de solitude, des mots comme « larmes » et « sentiments », et l’utilisation de plus de pronoms à la première personne comme « je » et « moi ».

Depuis six ans, les chercheurs du World Well-Being Project (WWBP), basé au laboratoire d’analyse du langage humain de Stony Brook et au centre de psychologie positive de l’UPenn, étudient comment les mots que les gens utilisent reflètent leurs sentiments intérieurs et leur contentement. En 2014, Johannes Eichstaedt, chercheur fondateur du WWBP et postdoctorant à Penn, a commencé à se demander s’il était possible pour les médias sociaux de prédire les résultats en matière de santé mentale, en particulier pour la dépression.

« Les données des médias sociaux contiennent des marqueurs apparentés au génome. Avec des méthodes étonnamment similaires à celles utilisées en génomique, nous pouvons passer au peigne fin les données des médias sociaux pour trouver ces marqueurs », explique Eichstaedt. « La dépression semble être quelque chose de tout à fait détectable de cette façon ; elle modifie vraiment l’utilisation des médias sociaux par les gens d’une manière que quelque chose comme une maladie de la peau ou le diabète ne fait pas. »

Eichstaedt et Schwartz ont fait équipe avec leurs collègues Robert J. Smith, Raina Merchant, David Asch et Lyle Ungar du Penn Medicine Center for Digital Health pour cette étude. Plutôt que de faire ce que les études précédentes avaient fait – recruter des participants qui déclarent eux-mêmes leur dépression – les chercheurs ont identifié les données des personnes consentant à partager les statuts Facebook et les informations des dossiers médicaux électroniques, puis les ont analysées à l’aide de techniques d’apprentissage automatique pour distinguer les personnes ayant reçu un diagnostic formel de dépression.

Près de 1 200 personnes ont consenti à fournir les deux archives numériques. Parmi elles, 114 personnes avaient un diagnostic de dépression dans leur dossier médical. Les chercheurs ont ensuite apparié chaque personne ayant reçu un diagnostic de dépression avec cinq personnes n’en ayant pas reçu, pour servir de contrôle, pour un échantillon total de 683 personnes (en excluant une personne pour insuffisance de mots dans les mises à jour de statut). L’idée était de créer un scénario aussi réaliste que possible pour entraîner et tester l’algorithme des chercheurs.

« C’est un problème vraiment difficile », explique Eichstaedt. « Si 683 personnes se présentent à l’hôpital et que 15 % d’entre elles sont déprimées, notre algorithme serait-il capable de prédire lesquelles ? Si l’algorithme dit que personne n’est déprimé, il serait précis à 85 %. »

Pour construire l’algorithme, Eichstaedt, Smith et leurs collègues ont examiné 524 292 mises à jour Facebook des années précédant le diagnostic pour chaque personne souffrant de dépression et pour la même période pour le groupe témoin. Ils ont déterminé les mots et les phrases les plus fréquemment utilisés, puis ont modélisé 200 sujets pour découvrir ce qu’ils ont appelé des « marqueurs linguistiques associés à la dépression ». Enfin, ils ont comparé de quelle manière et à quelle fréquence les participants déprimés par rapport aux participants témoins utilisaient ces formulations.

Ils ont appris que ces marqueurs comprenaient des processus émotionnels, cognitifs et interpersonnels tels que l’hostilité et la solitude, la tristesse et la rumination, et qu’ils pouvaient prédire une future dépression dès trois mois avant la première documentation de la maladie dans un dossier médical.

« Il existe une perception selon laquelle l’utilisation des médias sociaux n’est pas bonne pour la santé mentale d’une personne, mais elle peut s’avérer être un outil important pour le diagnostic, le suivi et éventuellement le traitement de la maladie », dit Schwartz. « Ici, nous avons montré qu’il peut être utilisé avec les dossiers cliniques, une étape vers l’amélioration de la santé mentale avec les médias sociaux. »

Eichstaedt voit un potentiel à long terme dans l’utilisation de ces données comme une forme de dépistage discret. « L’espoir est qu’un jour, ces systèmes de dépistage puissent être intégrés dans les systèmes de soins », dit-il. « Malgré certaines limites de l’étude, y compris un échantillon urbain particulier, et des limites dans le domaine lui-même – tous les diagnostics de dépression dans un dossier médical ne répondent pas à l’étalon-or que constituent les entretiens cliniques structurés, par exemple – les résultats offrent un nouveau moyen potentiel de découvrir et d’obtenir de l’aide pour les personnes souffrant de dépression.