collaborative filtering

Collaborative filtering is het voorspellende proces achter aanbevelingsmachines. Aanbevelingsengines analyseren informatie over gebruikers met een vergelijkbare smaak om de waarschijnlijkheid in te schatten dat een bepaalde persoon iets leuk zal vinden, zoals een video, een boek of een product. Collaborative filtering is ook bekend als social filtering.

Collaborative filtering gebruikt algoritmen om gegevens uit gebruikersrecensies te filteren om gepersonaliseerde aanbevelingen te doen voor gebruikers met vergelijkbare voorkeuren. Collaborative filtering wordt ook gebruikt om inhoud en advertenties te selecteren voor individuen op sociale media.

Drie soorten collaborative filtering die vaak worden gebruikt in aanbevelingssystemen zijn neighbor-based, item-to-item en classification-gebaseerd.

In neighbor-based filtering worden gebruikers geselecteerd op hun gelijkenis met de actieve gebruiker. Deze gelijkenis wordt bepaald door gebruikers te vergelijken die soortgelijke recensies hebben geplaatst. Op basis van de eerdere gelijkenis, wordt verondersteld dat toekomstige likes en dislikes ook gelijk zullen zijn. Op basis van de gemiddelde waardering van de groep worden aanbevelingen gedaan voor de actieve gebruiker.

Een item-to-item filtering proces gebruikt een matrix om de gelijkenis van paren van items te bepalen. Item-to-item processen vergelijken dan de voorkeur van de huidige gebruiker met de items in de matrix voor overeenkomsten waarop aanbevelingen te baseren.

Een classificatie-gebaseerde collaboratieve filtering systeem beveelt dingen op basis van hoe vergelijkbaar gebruikers hield van die classificatie of genre. Er wordt aangenomen dat gebruikers die genieten of afkeer hebben van soortgelijke ervaringen binnen een classificatie ook zullen genieten van anderen binnen die classificatie.

Sommige collaboratieve filtersystemen zijn gebaseerd op het geheugen, zoals neighboring- en item-to-item-modellen, die gelijkenissen van gebruikers of items vergelijken. Anderen zijn model-gebaseerd, met behulp van machine learning om ongelijke items te vergelijken. Modelgebaseerde systemen kunnen algoritmes gebruiken zoals het Markov beslissingsproces om ratings te voorspellen voor items die nog niet beoordeeld zijn. Hybride systemen bevatten kenmerken van zowel geheugengebaseerde als modelgebaseerde filtering.

Aanbevelingssystemen worden gebruikt om suggesties te geven voor allerlei soorten websites en diensten. Toch kunnen zij op een aantal moeilijkheden stuiten. De schaarste van ratings is een van de belangrijkste hindernissen voor collaborative filtering het nut in systemen met veel items. Nieuwe items zijn ook vaak moeilijk om aanbevelingen voor te doen. Bij nieuwe aanbevelingssystemen is het moeilijk om goede aanbevelingen te doen voordat voldoende gebruikers beoordelingen hebben ingevoerd. Tegelijkertijd kunnen te veel gebruikersbeoordelingen echter een uitdaging vormen voor sommige systemen, omdat ze enorme datasets opleveren.