Collaborative Filterung ist der prädiktive Prozess hinter Empfehlungsmaschinen. Empfehlungsmaschinen analysieren Informationen über Benutzer mit ähnlichem Geschmack, um die Wahrscheinlichkeit einzuschätzen, dass einer Zielperson etwas gefallen wird, z. B. ein Video, ein Buch oder ein Produkt. Die kollaborative Filterung wird auch als soziale Filterung bezeichnet.
Die kollaborative Filterung verwendet Algorithmen, um Daten aus Nutzerbewertungen zu filtern und personalisierte Empfehlungen für Nutzer mit ähnlichen Vorlieben zu erstellen. Kollaboratives Filtern wird auch verwendet, um Inhalte und Werbung für Einzelpersonen in sozialen Medien auszuwählen.
Drei Arten des kollaborativen Filterns, die häufig in Empfehlungssystemen verwendet werden, sind nachbarschaftsbasiert, item-to-item und klassifizierungsbasiert.
Beim nachbarschaftsbasierten Filtern werden Benutzer aufgrund ihrer Ähnlichkeit mit dem aktiven Benutzer ausgewählt. Diese Ähnlichkeit wird durch den Abgleich von Nutzern ermittelt, die ähnliche Bewertungen abgegeben haben. Auf der Grundlage der bisherigen Ähnlichkeit wird angenommen, dass auch zukünftige Likes und Dislikes ähnlich sein werden. Anhand der durchschnittlichen Bewertung der Gruppe werden Empfehlungen für den aktiven Nutzer ausgesprochen.
Ein Item-to-Item-Filterverfahren verwendet eine Matrix, um die Ähnlichkeit von Artikelpaaren zu bestimmen. Element-zu-Element-Prozesse vergleichen dann die Präferenzen des aktuellen Benutzers mit den Elementen in der Matrix, um Ähnlichkeiten zu ermitteln, auf denen die Empfehlungen basieren.
Ein klassifizierungsbasiertes kollaboratives Filtersystem empfiehlt Dinge auf der Grundlage der Ähnlichkeit der Benutzer mit dieser Klassifizierung oder diesem Genre. Es wird davon ausgegangen, dass Benutzer, die ähnliche Erfahrungen innerhalb einer Klassifizierung mögen oder nicht mögen, auch andere innerhalb dieser Klassifizierung mögen.
Einige kollaborative Filtersysteme sind speicherbasiert, wie Nachbarschafts- und Element-zu-Element-Modelle, die Ähnlichkeiten von Benutzern oder Elementen vergleichen. Andere sind modellbasiert und verwenden maschinelles Lernen, um unähnliche Elemente zu vergleichen. Modellbasierte Systeme können Algorithmen wie den Markov-Entscheidungsprozess verwenden, um Bewertungen für Artikel vorherzusagen, die noch nicht bewertet worden sind. Hybride Systeme enthalten Merkmale sowohl der speicherbasierten als auch der modellbasierten Filterung.
Empfehlungssysteme werden eingesetzt, um Vorschläge für alle Arten von Websites und Diensten zu machen. Sie können jedoch auf eine Reihe von Schwierigkeiten stoßen. Die geringe Anzahl von Bewertungen ist eines der Haupthindernisse für die Nützlichkeit des kollaborativen Filterns in Systemen mit vielen Elementen. Auch neue Artikel sind in der Regel schwer zu empfehlen. Bei neuen Empfehlungssystemen ist es schwierig, gute Empfehlungen zu geben, bevor genügend Benutzer Bewertungen abgegeben haben. Gleichzeitig können jedoch zu viele Benutzerbewertungen für einige Systeme eine Herausforderung darstellen, da sie zu großen Datensätzen führen.