El filtrado colaborativo es el proceso de predicción que hay detrás de los motores de recomendación. Los motores de recomendación analizan información sobre usuarios con gustos similares para evaluar la probabilidad de que un individuo objetivo disfrute de algo, como un vídeo, un libro o un producto. El filtrado colaborativo también se conoce como filtrado social.
El filtrado colaborativo utiliza algoritmos para filtrar los datos de las reseñas de los usuarios para hacer recomendaciones personalizadas para usuarios con preferencias similares. El filtrado colaborativo también se utiliza para seleccionar el contenido y la publicidad para los individuos en los medios sociales.
Tres tipos de filtrado colaborativo comúnmente utilizados en los sistemas de recomendación son los basados en los vecinos, los basados en los elementos y los basados en la clasificación.
En el filtrado basado en los vecinos, los usuarios se seleccionan por su similitud con el usuario activo. Esta similitud se determina comparando usuarios que han publicado reseñas similares. Basándose en la similitud anterior, se presume que los gustos futuros también serán similares. A partir de la valoración media del grupo, se hacen recomendaciones para el usuario activo.
Un proceso de filtrado de artículo a artículo utiliza una matriz para determinar la similitud de los pares de artículos. Los procesos de ítem a ítem comparan entonces la preferencia del usuario actual con los ítems de la matriz para buscar similitudes en las que basar las recomendaciones.
Un sistema de filtrado colaborativo basado en la clasificación recomienda cosas basándose en la similitud de los usuarios con esa clasificación o género. Se supone que los usuarios que disfrutan o no de experiencias similares dentro de una clasificación también disfrutarán de otras dentro de esa clasificación.
Algunos sistemas de filtrado colaborativo se basan en la memoria, como los modelos de vecinos y de elemento a elemento, que comparan las similitudes de los usuarios o los elementos. Otros se basan en modelos, y utilizan el aprendizaje automático para comparar elementos disímiles. Los sistemas basados en modelos pueden utilizar algoritmos como el proceso de decisión de Markov para predecir las valoraciones de los artículos que aún no han sido revisados. Los sistemas híbridos incluyen características tanto del filtrado basado en la memoria como del basado en el modelo.
Los sistemas de recomendación se utilizan para proporcionar sugerencias para todo tipo de sitios web y servicios. Sin embargo, pueden encontrar una serie de dificultades. La escasez de valoraciones es uno de los principales obstáculos para la utilidad del filtrado colaborativo en sistemas con muchos elementos. Los nuevos artículos también suelen ser difíciles de recomendar. En los sistemas de recomendación nuevos, es difícil ofrecer buenas recomendaciones antes de que un número suficiente de usuarios haya introducido reseñas. Al mismo tiempo, sin embargo, un número excesivo de valoraciones de los usuarios puede ser un reto para algunos sistemas, ya que se convierten en enormes conjuntos de datos.