Le filtrage collaboratif est le processus prédictif derrière les moteurs de recommandation. Les moteurs de recommandation analysent les informations sur les utilisateurs ayant des goûts similaires pour évaluer la probabilité qu’un individu cible apprécie quelque chose, comme une vidéo, un livre ou un produit. Le filtrage collaboratif est également connu sous le nom de filtrage social.
Le filtrage collaboratif utilise des algorithmes pour filtrer les données des avis des utilisateurs afin de faire des recommandations personnalisées pour les utilisateurs ayant des préférences similaires. Le filtrage collaboratif est également utilisé pour sélectionner le contenu et la publicité pour les individus sur les médias sociaux.
Trois types de filtrage collaboratif couramment utilisés dans les systèmes de recommandation sont basés sur le voisinage, l’élément à élément et la classification.
Dans le filtrage basé sur le voisinage, les utilisateurs sont sélectionnés pour leur similarité avec l’utilisateur actif. Cette similarité est déterminée en faisant correspondre les utilisateurs qui ont posté des avis similaires. Sur la base de la similarité précédente, on présume que les goûts et les dégoûts futurs seront également similaires. A partir de l’évaluation moyenne du groupe, des recommandations sont faites pour l’utilisateur actif.
Un processus de filtrage item-to-item utilise une matrice pour déterminer la similitude de paires d’articles. Les processus item-to-item comparent ensuite la préférence de l’utilisateur actuel aux éléments de la matrice pour trouver des similarités sur lesquelles baser les recommandations.
Un système de filtrage collaboratif basé sur la classification recommande des choses en fonction de la similarité des utilisateurs qui ont aimé cette classification ou ce genre. On suppose que les utilisateurs qui apprécient ou n’apprécient pas des expériences similaires dans une classification en apprécieront également d’autres dans cette classification.
Certains systèmes de filtrage collaboratif sont basés sur la mémoire, comme les modèles de voisinage et d’élément à élément, qui comparent les similarités des utilisateurs ou des éléments. D’autres sont basés sur des modèles, utilisant l’apprentissage automatique pour comparer des éléments dissemblables. Les systèmes basés sur des modèles peuvent utiliser des algorithmes tels que le processus de décision de Markov pour prédire les évaluations d’éléments qui n’ont pas encore été évalués. Les systèmes hybrides comprennent des caractéristiques du filtrage basé sur la mémoire et du filtrage basé sur un modèle.
Les systèmes de recommandation sont utilisés pour fournir des suggestions pour toutes sortes de sites Web et de services. Pourtant, ils peuvent rencontrer un certain nombre de difficultés. La sparsité des évaluations est l’un des principaux obstacles à l’utilité du filtrage collaboratif dans les systèmes comportant de nombreux éléments. Les nouveaux éléments ont également tendance à être difficiles à recommander. Dans les nouveaux systèmes de recommandation, il est difficile de fournir de bonnes recommandations avant qu’un nombre suffisant d’utilisateurs aient saisi des évaluations. Dans le même temps, cependant, un trop grand nombre d’évaluations d’utilisateurs peut être un défi pour certains systèmes, car ils constituent d’énormes ensembles de données.