Filtragem colaborativa é o processo preditivo por trás dos motores de recomendação. Os mecanismos de recomendação analisam informações sobre usuários com gostos similares para avaliar a probabilidade de um indivíduo alvo gostar de algo, como um vídeo, um livro ou um produto. A filtragem colaborativa também é conhecida como social filtering.
Collaborative filtering usa algoritmos para filtrar dados de revisões de usuários para fazer recomendações personalizadas para usuários com preferências similares. A filtragem colaborativa também é usada para selecionar conteúdo e publicidade para indivíduos em redes sociais.
Três tipos de filtragem colaborativa comumente usados em sistemas de recomendação são baseados em vizinho, item a item e baseados em classificação.
Na filtragem baseada em vizinho, os usuários são selecionados por sua similaridade com o usuário ativo. Essa similaridade é determinada por usuários correspondentes que tenham postado revisões similares. Com base na semelhança anterior, presume-se que os gostos e desgostos futuros também serão semelhantes. A partir da classificação média do grupo, são feitas recomendações para o usuário ativo.
Um processo de filtragem item a item usa uma matriz para determinar a semelhança de pares de itens. Processos item a item então comparam a preferência do usuário atual com os itens da matriz para similaridades nas quais se baseiam as recomendações.
Um sistema de filtragem colaborativa baseado em classificação recomenda coisas baseadas em como usuários similares gostaram dessa classificação ou gênero. Assume-se que usuários que gostam ou não de experiências similares dentro de uma classificação também gostarão de outros dentro dessa classificação.
Alguns sistemas de filtragem colaborativa são baseados em memória, como modelos vizinhos e item a item, que comparam similaridades de usuários ou itens. Outros são baseados em modelos, usando a aprendizagem da máquina para comparar itens diferentes. Sistemas baseados em modelos podem usar algoritmos como o processo de decisão de Markov para prever classificações para itens que ainda não foram revisados. Sistemas híbridos incluem recursos de filtragem baseados em memória e baseados em modelos.
Sistemas de recomendação são usados para fornecer sugestões para todos os tipos de sites e serviços. Ainda assim, eles podem encontrar uma série de dificuldades. A escassez de classificações é um dos principais obstáculos para a utilidade da filtragem colaborativa em sistemas com muitos itens. Os novos itens também tendem a ser difíceis de fornecer recomendações. Sob novos sistemas de recomendação, é difícil fornecer boas recomendações antes que um número suficiente de usuários tenha entrado em revisões. Ao mesmo tempo, entretanto, muitas classificações de usuários podem ser um desafio para alguns sistemas, pois eles geram enormes conjuntos de dados.