I FUSE Labs hanno presentato l’ultima versione del Progetto Emporia, un recommendation engine specifico per le notizie. L’occasione della presentazione è stata data dalla conferenza svoltasi a Vancouver, Canada, la Neural Information Processing System Conference (NIPS).
I recommendation engine si dividono fra espliciti e impliciti: i primi arrivano al risultato attraverso una serie di domande, questionari o compilazione di liste richieste all’interessato dal sistema; i secondi si limitano a osservarne i comportamenti, verificare quelli più frequenti, mantenerne memoria e soprattutto attingere al maggior numero di interazioni possibili.
Il Progetto Emporia, reso disponibile a scopo dimostrativo in Rete con una chiara interfaccia HTML5, si basa sulla tecnologia Matchbox di Microsoft Research, utilizza un modello probabilistico Bayesiano per definire gli interessi dell’utente. Tale modello non fa quindi altro che proporre al lettore notizie simili a quelle lette in passato, prevedendo i suoi gusti e le sue preferenze.
Come base dati, Emporia utilizza circa un milione di feed RSS al giorno e tutti i collegamenti messi in condivisione su Twitter. Gli articoli a disposizione vengono ripuliti dallo spam, classificati e categorizzati utilizzando sistemi proprietari ed esterni (Amazon Mechanical Turk) e poi inviati all’algoritmo di smistamento, che svolge la scelta finale. Un elemento interessante di Emporia è che utilizza sia l’approccio implicito, come spiegato, che quello esplicito: all’utente è infatti richiesto di votare gli articoli proposti (p.e.: voglio più storie come questa, ne voglio meno, questa storia mi interessa ma tale scelta non deve avere influenze), al fine di migliorare le scelte future.