1 00:00:00,000 --> 00:00:03,416 >> [RIPRODUZIONE DI BRANI MUSICALI] 2 00:00:03,416 --> 00:00:05,860 3 00:00:05,860 --> 00:00:08,180 >> CERVELLO Scassellati: Benvenuti alla serie CS50 AI. 4 00:00:08,180 --> 00:00:12,600 Il mio nome è Scass, e oggi stiamo andando a parlare di sistemi di raccomandazione. 5 00:00:12,600 --> 00:00:15,780 Sistemi di suoni ora di raccomandazione come una specie di strano nome. 6 00:00:15,780 --> 00:00:18,630 Suona come forse dovrebbe essere sistemi di raccomandazione, 7 00:00:18,630 --> 00:00:21,290 e mi sono d'accordo con te. 8 00:00:21,290 --> 00:00:26,110 Ma questi sono i sistemi che aiutano selezionare le cose simili ogni volta 9 00:00:26,110 --> 00:00:28,210 si seleziona qualcosa online. 10 00:00:28,210 --> 00:00:32,119 Netflix, per esempio suggeriranno altri film che si potrebbe desiderare di vedere. 11 00:00:32,119 --> 00:00:36,660 O Pandora suggerirà diverso canzoni che si potrebbe desiderare di ascoltare. 12 00:00:36,660 --> 00:00:40,940 Amazon suggerire che tipo di altri prodotti si potrebbe desiderare di comprare. 13 00:00:40,940 --> 00:00:43,520 Facebook sarà anche suggerire alcuni degli altri amici 14 00:00:43,520 --> 00:00:45,440 che si potrebbe desiderare di aggiungere. 15 00:00:45,440 --> 00:00:49,800 Ciascuno di questi sistemi operano usando lo stesso tipo di algoritmo di base, 16 00:00:49,800 --> 00:00:52,520 e questo è quello che siamo andando a parlare oggi. 17 00:00:52,520 --> 00:00:56,860 >> Ora, questi algoritmi sono sorprendentemente grande business. 18 00:00:56,860 --> 00:01:01,130 Netflix a pochi anni fa in 2009 ha offerto $ 1 milione 19 00:01:01,130 --> 00:01:07,240 premio se si potesse migliorare la loro sistema di raccomandazione di appena il 10%. 20 00:01:07,240 --> 00:01:11,960 Questo 10%, però, rappresenta un notevole quantità di attività. 21 00:01:11,960 --> 00:01:15,330 Le stime sono difficili da trovare, ma molte persone 22 00:01:15,330 --> 00:01:19,050 credere che questi raccomandazione sistemi per l'acquisto on-line 23 00:01:19,050 --> 00:01:25,729 sistema come Amazon portare da qualche parte tra il 10% e il 25% un aumento delle entrate. 24 00:01:25,729 --> 00:01:27,770 Quindi potete immaginare la tipo di volume che si sei 25 00:01:27,770 --> 00:01:32,860 parlando quando pensiamo anche questi piccoli algoritmi. 26 00:01:32,860 --> 00:01:35,200 >> Quindi cerchiamo di ottenere qualche esempio. 27 00:01:35,200 --> 00:01:38,460 Come è possibile che questi sistemi funzionano davvero? 28 00:01:38,460 --> 00:01:40,773 Offriamo due tipi di algoritmi che 29 00:01:40,773 --> 00:01:45,050 sono in gioco quando si parla di raccomandazioni di generazione. 30 00:01:45,050 --> 00:01:48,650 Le prime sono chiamate filtraggio dei contenuti basato. 31 00:01:48,650 --> 00:01:53,410 E filtraggio dei contenuti basato conta sulle somiglianze tra le voci 32 00:01:53,410 --> 00:02:00,370 stessi, cioè tra due film o due canzoni o due articoli acquistati. 33 00:02:00,370 --> 00:02:03,190 Stiamo andando a utilizzare filmati come esempio, ma questa 34 00:02:03,190 --> 00:02:07,850 potrebbe applicarsi, in realtà, di qualsiasi tipo di oggetto che stiamo cercando. 35 00:02:07,850 --> 00:02:13,330 >> Quindi, se ci penso un po ' film dell'ultimo anno, 36 00:02:13,330 --> 00:02:16,799 Ho visto Inside Out con i miei bambini, si sono trovati benissimo. 37 00:02:16,799 --> 00:02:17,840 Ma abbiamo anche avuto una scelta. 38 00:02:17,840 --> 00:02:21,350 Avremmo potuto vedere Serventi, potremmo visto Age of Ultron, 39 00:02:21,350 --> 00:02:24,850 o avremmo potuto visto Ant Man nei teatri. 40 00:02:24,850 --> 00:02:27,580 >> Per uno di questi film, potremmo immaginare 41 00:02:27,580 --> 00:02:33,320 creazione di un elenco di funzionalità o qualità circa i film diversi. 42 00:02:33,320 --> 00:02:37,190 Così, per esempio, potrei prendere in considerazione che di quei film sono animati. 43 00:02:37,190 --> 00:02:39,960 Beh, entrambi Inside Out e Serventi sono animati. 44 00:02:39,960 --> 00:02:44,140 Né Age of Ultron né Ant Man sono film d'animazione. 45 00:02:44,140 --> 00:02:47,040 E potrei immaginare edificio una struttura, una tabella che 46 00:02:47,040 --> 00:02:49,440 elenca ciascuna di queste proprietà. 47 00:02:49,440 --> 00:02:51,790 Sono animati o no? 48 00:02:51,790 --> 00:02:54,780 Potrei quindi aggiungere di più caratteristiche di questo tavolo 49 00:02:54,780 --> 00:02:58,380 con l'aggiunta di più righe in questa struttura. 50 00:02:58,380 --> 00:03:00,970 Potrei chiedere se Non sono film Marvel. 51 00:03:00,970 --> 00:03:04,010 Beh, Inside Out e Serventi Non sono film Marvel, 52 00:03:04,010 --> 00:03:06,715 Age of Ultron e Ant Man sono certamente. 53 00:03:06,715 --> 00:03:09,100 >> E potrei chiedere qualsiasi tipo di diverse qualità 54 00:03:09,100 --> 00:03:12,080 che volevo, qualsiasi tipo di caratteristiche che potrebbe essere importante per me. 55 00:03:12,080 --> 00:03:13,440 Hanno un supercattivo? 56 00:03:13,440 --> 00:03:16,700 Beh, non c'è supercattivo in Inside Fuori, ma ci sono quelli di Serventi 57 00:03:16,700 --> 00:03:19,990 e, ovviamente, la due film di supereroi. 58 00:03:19,990 --> 00:03:23,900 >> Potrei anche chiedere le cose come, beh, non passano il test Bechdel? 59 00:03:23,900 --> 00:03:27,280 Ci sono due nominati personaggi femminili che 60 00:03:27,280 --> 00:03:30,550 passare un po 'notevole quantità di tempo avere una conversazione che 61 00:03:30,550 --> 00:03:34,400 non comporta uomini nel cast? 62 00:03:34,400 --> 00:03:39,870 Ebbene, in questo caso, Inside Out passa il test, Serventi fallisce, Age of Ultron 63 00:03:39,870 --> 00:03:42,990 passa il test, e ANT Man fallisce. 64 00:03:42,990 --> 00:03:45,020 Una qualsiasi di queste caratteristiche Potrei pensare 65 00:03:45,020 --> 00:03:48,660 come importante per alcune persone. 66 00:03:48,660 --> 00:03:52,000 >> Potrei anche chiedere cose come sono Ci sono delle persone in questi film che 67 00:03:52,000 --> 00:03:57,190 sono alunni di diciamo, Parchi e Ricreazione, uno dei miei programmi preferiti. 68 00:03:57,190 --> 00:04:00,540 Beh, Inside Out ha Amy Poehler, che è un ex-alunni. 69 00:04:00,540 --> 00:04:01,530 Che conta. 70 00:04:01,530 --> 00:04:04,110 Jon Hamm era in Serventi. 71 00:04:04,110 --> 00:04:08,600 Paul Rudd era in Ant Man, ma nessuno in Age of Ultron era nei parchi e Req 72 00:04:08,600 --> 00:04:10,150 anche. 73 00:04:10,150 --> 00:04:12,990 Così posso costruire questo elenco di caratteristiche, e che potevano davvero 74 00:04:12,990 --> 00:04:14,710 essere qualsiasi cosa, sui film. 75 00:04:14,710 --> 00:04:17,329 Potrebbero essere su ciò che proporzioni che sono stati girati in, 76 00:04:17,329 --> 00:04:21,630 potrebbe essere il numero di seggi venduti sul loro fine settimana di apertura. 77 00:04:21,630 --> 00:04:25,630 Qualsiasi caratteristica che voglio generare posso mettere in questa tabella. 78 00:04:25,630 --> 00:04:29,600 >> Ora, in questo caso, ho costruito ogni sorta di valori Bullion, 79 00:04:29,600 --> 00:04:33,700 sì o no, passare o fallire, ma potrebbe essere qualsiasi cosa. 80 00:04:33,700 --> 00:04:36,690 Potrebbero essere valori arbitrari. 81 00:04:36,690 --> 00:04:39,070 Per i contenuti filtro basato, quello che stiamo andando a fare 82 00:04:39,070 --> 00:04:42,810 è che stiamo andando a prendere in considerazione due colonne di questa tabella 83 00:04:42,810 --> 00:04:45,660 e vedere quanto sono simili. 84 00:04:45,660 --> 00:04:48,640 Così, per esempio, se è andato a vedere Inside Out, 85 00:04:48,640 --> 00:04:53,640 Potrei chiedere, quali sono gli altri film che potrei essere disposto ad andare a vedere. 86 00:04:53,640 --> 00:04:56,890 Cioè, quello disposto a spendere i miei soldi per andare a vedere. 87 00:04:56,890 --> 00:05:00,310 E posso paragonare questo da solo prendendo le due colonne, una da Inside Out 88 00:05:00,310 --> 00:05:03,300 e uno qualsiasi dei altri film, e solo vedere 89 00:05:03,300 --> 00:05:06,210 quanti di loro match caratteristiche. 90 00:05:06,210 --> 00:05:09,660 Quindi, se confronto Inside Out con Serventi, beh, c'è 91 00:05:09,660 --> 00:05:10,910 tre cose qui quella partita. 92 00:05:10,910 --> 00:05:16,200 Sono entrambi animati, nessuno dei due sono film Marvel, e ciascuno di essi 93 00:05:16,200 --> 00:05:18,420 avere Parchi e Req alunni. 94 00:05:18,420 --> 00:05:20,420 Così ho potuto contare su come tante partite ci sono stati, 95 00:05:20,420 --> 00:05:22,640 e in questo caso ci sarebbe stato di tre. 96 00:05:22,640 --> 00:05:26,450 >> Se poi paragono Inside Out con diciamo Age of Ultron, 97 00:05:26,450 --> 00:05:28,430 Posso guardare la lista e dire, beh, c'è 98 00:05:28,430 --> 00:05:30,140 solo una cosa che corrisponde lì. 99 00:05:30,140 --> 00:05:34,560 Entrambi superano il test Bechtel, così che sta per essere un punteggio di uno. 100 00:05:34,560 --> 00:05:36,770 E tra Inside Out L'uomo e Formica, ancora una volta ho 101 00:05:36,770 --> 00:05:41,420 può confrontare riga per riga quanti cose coincidono tra loro due. 102 00:05:41,420 --> 00:05:43,060 Beh, uno ANIMATA, uno non lo è. 103 00:05:43,060 --> 00:05:44,970 Uno è un film Marvel, non è. 104 00:05:44,970 --> 00:05:47,280 Uno ha un supercattivo, l'altro no. 105 00:05:47,280 --> 00:05:49,480 Si passa la Bechtel prova, si fallisce, 106 00:05:49,480 --> 00:05:54,450 ma entrambi hanno Parchi e Req alunni, Quindi, di nuovo, si ottiene un punteggio di uno. 107 00:05:54,450 --> 00:05:58,300 >> Quindi, se fossi alla ricerca di film che erano simili a Inside Out, 108 00:05:58,300 --> 00:06:02,170 Potrei cercare i film che hanno il punteggio più alto in questo contenuto 109 00:06:02,170 --> 00:06:03,952 schema di filtraggio. 110 00:06:03,952 --> 00:06:05,660 Quindi, in questo caso, considererebbe Minions 111 00:06:05,660 --> 00:06:08,330 per essere più vicini e più probabile che sia qualcosa 112 00:06:08,330 --> 00:06:13,250 che vorrei spendere soldi per vedere di Age of Ultron o Ant Man. 113 00:06:13,250 --> 00:06:16,150 >> Questi contenuti basato sistemi di filtraggio si basano solo 114 00:06:16,150 --> 00:06:18,670 sulle proprietà i film, e così io 115 00:06:18,670 --> 00:06:21,930 può costruire questi solo conoscendo qualcosa sui prodotti 116 00:06:21,930 --> 00:06:23,500 che ho. 117 00:06:23,500 --> 00:06:26,050 Posso usare qualsiasi tipo di caratteristiche che mi piacerebbe, 118 00:06:26,050 --> 00:06:28,400 e posso costruire più caratteristiche complesse che 119 00:06:28,400 --> 00:06:33,060 coinvolgere test più complessi di una qualità come vado avanti. 120 00:06:33,060 --> 00:06:39,080 In realtà, posso anche visualizzare questa tabella non come un oggetto statico, 121 00:06:39,080 --> 00:06:43,110 ma piuttosto come dimensioni all'interno di uno spazio di stato più grande. 122 00:06:43,110 --> 00:06:46,295 E posso iniziare a parlare del distanze tra film diversi. 123 00:06:46,295 --> 00:06:49,300 124 00:06:49,300 --> 00:06:51,050 Queste sono tutte le cose che sappiamo come 125 00:06:51,050 --> 00:06:55,860 fare con il tipo di strutture di dati che abbiamo già visto in CS50. 126 00:06:55,860 --> 00:06:59,180 Così ho potuto immaginare edificio una struttura di dati per un film. 127 00:06:59,180 --> 00:07:02,390 C'è una struttura che ho costruito chiamato film, 128 00:07:02,390 --> 00:07:04,369 ed ha cinque voci booleane in esso. 129 00:07:04,369 --> 00:07:07,160 E 'animato, è una meraviglia film, ce l'ha un supercattivo, 130 00:07:07,160 --> 00:07:11,047 fa passare il test Bechdel, e Ci sono parchi e Rec alunni in esso? 131 00:07:11,047 --> 00:07:12,880 E ciascuna di queste è un struttura di dati che 132 00:07:12,880 --> 00:07:16,330 possono occupare per quel particolare film. 133 00:07:16,330 --> 00:07:20,090 >> Poi calcolare se due film sono simili o meno, 134 00:07:20,090 --> 00:07:23,330 quale sia il loro punteggio, ho potuto scrivere una serie di pseudocodice che 135 00:07:23,330 --> 00:07:25,120 genera quella stessa funzione. 136 00:07:25,120 --> 00:07:30,100 Cioè, dato qualche film M1, posso trovare il film più simile ad esso 137 00:07:30,100 --> 00:07:32,430 seguendo la pseudocodice. 138 00:07:32,430 --> 00:07:37,040 Considero che è il migliore sistema che ho trovato segnando, 139 00:07:37,040 --> 00:07:39,920 il miglior paragone che ho trovato. 140 00:07:39,920 --> 00:07:41,890 Per ogni altro film Ho intenzione di passare attraverso, 141 00:07:41,890 --> 00:07:44,920 Io preparo un punteggio partita uguale a 0. 142 00:07:44,920 --> 00:07:47,920 E io andrò attraverso quella film, una M1, il film 143 00:07:47,920 --> 00:07:51,500 Ho iniziato con, io controllerò ogni caratteristica 144 00:07:51,500 --> 00:07:53,650 che devono vedere se c'è una corrispondenza. 145 00:07:53,650 --> 00:07:56,460 Se c'è una corrispondenza, io sarò incrementare il punteggio partita. 146 00:07:56,460 --> 00:08:00,480 E se alla fine il punteggio match che Ho è migliore di quello attuale migliore 147 00:08:00,480 --> 00:08:03,310 punteggio, allora io ricordare che il miglior punteggio, 148 00:08:03,310 --> 00:08:05,820 e questo è il miglior match che ho. 149 00:08:05,820 --> 00:08:09,450 Alla fine, qualunque film è seduto in corrispondenza migliore, 150 00:08:09,450 --> 00:08:12,580 che è la più vicina Sono stato in grado di venire. 151 00:08:12,580 --> 00:08:14,890 Così basato questi contenuti sistemi di filtraggio, 152 00:08:14,890 --> 00:08:16,900 tutti hanno questa struttura di base. 153 00:08:16,900 --> 00:08:20,910 Essi si basano sulla voce in questione e nulla 154 00:08:20,910 --> 00:08:24,590 su una qualsiasi delle preferenze dell'utente. 155 00:08:24,590 --> 00:08:29,010 >> L'altro meccanismo che usiamo in fine di costruire sistemi di raccomandazione 156 00:08:29,010 --> 00:08:31,790 si chiama filtraggio collaborativo. 157 00:08:31,790 --> 00:08:36,520 Filtraggio collaborativo si basa su Non le qualità dell'oggetto stesso, 158 00:08:36,520 --> 00:08:40,010 ma come la gente, altro gli utenti che è, come essi hanno 159 00:08:40,010 --> 00:08:43,370 risposto a questi stessi oggetti. 160 00:08:43,370 --> 00:08:48,720 Quindi, per continuare con il mio esempio di film, Potrei prendere un gruppo di miei amici 161 00:08:48,720 --> 00:08:53,180 e loro indagine su se o Non gli piaceva film particolari. 162 00:08:53,180 --> 00:08:56,560 Ora luoghi diversi produrranno questi dati in modi diversi. 163 00:08:56,560 --> 00:08:59,630 È possibile esaminare direttamente il vostro utenti, o si poteva solo 164 00:08:59,630 --> 00:09:03,120 vedere ciò che scelgono se sei, ad esempio Netflix. 165 00:09:03,120 --> 00:09:05,640 Quali film hanno fatto guardare? 166 00:09:05,640 --> 00:09:08,670 >> Potrei mettere in discussione alcuni dei miei amici qui e scoprire 167 00:09:08,670 --> 00:09:12,910 che Jason è piaciuto ogni film vide, non sorprende lì. 168 00:09:12,910 --> 00:09:15,590 Andy è solo Serventi e zia Man. 169 00:09:15,590 --> 00:09:19,330 Sarah è Inside Out e Vendicatori, il contrario di Andy. 170 00:09:19,330 --> 00:09:22,200 E Sam, beh, Sam è piaciuto tutti i film di supereroi, 171 00:09:22,200 --> 00:09:24,960 ma nessuno dei film d'animazione. 172 00:09:24,960 --> 00:09:30,630 >> Potrei quindi interrogare per qualche nuovo individuale, un altro utente come me 173 00:09:30,630 --> 00:09:34,520 e chiedere, beh, se mi è piaciuto uno di questi film, 174 00:09:34,520 --> 00:09:38,600 si può fare una previsione su quale altro film che potrebbe piacere. 175 00:09:38,600 --> 00:09:41,890 Cioè, se mi è piaciuto Dentro Out, quali altri film 176 00:09:41,890 --> 00:09:48,460 sono io probabile che vogliono anche vedere sulla base di ciò che la gente ha fatto simili? 177 00:09:48,460 --> 00:09:51,640 Cioè, io vado attraverso un Io filtrare attraverso questa lista 178 00:09:51,640 --> 00:09:54,520 e trovare solo il individui che piaceva anche 179 00:09:54,520 --> 00:09:57,680 Inside Out, che ha trovato le mie preferenze. 180 00:09:57,680 --> 00:10:00,824 Bene, ciò significa che Andy e Sam, che non gli piaceva Inside Out, 181 00:10:00,824 --> 00:10:02,240 così io non ho intenzione di prenderle in considerazione. 182 00:10:02,240 --> 00:10:06,130 Ho intenzione di sbarazzarsi di loro dati per questo confronto. 183 00:10:06,130 --> 00:10:09,750 >> Posso quindi guardare a ciò che Jason e Sarah pensiero e la loro concordanza 184 00:10:09,750 --> 00:10:13,780 up che dei film che videro che non ho, se li è piaciuto 185 00:10:13,780 --> 00:10:15,150 o no. 186 00:10:15,150 --> 00:10:17,820 Potrei contare fino, diciamo voti. 187 00:10:17,820 --> 00:10:23,360 Così Serventi, per esempio, potrebbe avere un votare a favore, perché Jason piaceva. 188 00:10:23,360 --> 00:10:27,170 Sia Jason e Sarah è piaciuto Avengers, quindi sarebbe dispone di due voti. 189 00:10:27,170 --> 00:10:30,700 E solo Jason piaceva Ant Man, quindi sarebbe ottenere un voto. 190 00:10:30,700 --> 00:10:34,870 Quindi, se ho dovuto poi raccomandare per me che di questi film 191 00:10:34,870 --> 00:10:41,470 Potrei essere più probabilità di vedere, lo farei devono scegliere Age of Ultron: Vendicatori. 192 00:10:41,470 --> 00:10:44,490 >> Così per una di queste sistemi, ora sto usando 193 00:10:44,490 --> 00:10:49,260 dati che non era generato sulla film in sé, ma sulle preferenze 194 00:10:49,260 --> 00:10:51,960 da altri utenti. 195 00:10:51,960 --> 00:10:54,150 Questo ha alcune difficoltà, naturalmente. 196 00:10:54,150 --> 00:10:55,920 Che cosa succede se non si dispone di tutti gli altri utenti? 197 00:10:55,920 --> 00:10:58,770 Beh, che si chiama problema di avvio. 198 00:10:58,770 --> 00:11:03,760 Bisogna avere un po ' quantità di dati prima di sei 199 00:11:03,760 --> 00:11:07,560 in grado di iniziare a fare queste raccomandazioni. 200 00:11:07,560 --> 00:11:10,940 Il rovescio della medaglia di esso è una volta si inizia la raccolta dei dati, 201 00:11:10,940 --> 00:11:13,870 se è possibile raccogliere più e sempre più dati, 202 00:11:13,870 --> 00:11:17,850 si otterrà sempre meglio e le raccomandazioni migliori. 203 00:11:17,850 --> 00:11:21,650 >> Ora potremmo tradurre questo in codice pure. 204 00:11:21,650 --> 00:11:23,860 Siamo in grado di definire un diverso tipo di struttura, 205 00:11:23,860 --> 00:11:25,720 in questo caso lo chiameremo un utente. 206 00:11:25,720 --> 00:11:30,970 Ed ha caratteristiche su quali film questo utente piacevano. 207 00:11:30,970 --> 00:11:34,560 Hanno piace Inside Out, Minions, Vendicatori e Ant Man. 208 00:11:34,560 --> 00:11:36,660 Allora potremmo generare alcuni pseudocodice a seguire 209 00:11:36,660 --> 00:11:39,460 la stessa procedura che ho usato prima. 210 00:11:39,460 --> 00:11:43,460 Cioè, dato un particolare utente x, facciamo consiglia un film 211 00:11:43,460 --> 00:11:46,107 che x potrebbe piacere. 212 00:11:46,107 --> 00:11:47,940 Siamo in grado di passare attraverso e per tutti i film, 213 00:11:47,940 --> 00:11:51,410 siamo in grado di inizializzare un punteggio per quel film sia 0. 214 00:11:51,410 --> 00:11:54,080 E allora possiamo trovare tutto degli altri utenti 215 00:11:54,080 --> 00:11:57,630 hanno le stesse preferenze come x. 216 00:11:57,630 --> 00:11:59,990 E allora per ogni film che gli piaceva, 217 00:11:59,990 --> 00:12:02,340 ci incrementiamo il punteggio di quel film. 218 00:12:02,340 --> 00:12:05,010 Qualunque sia filmato nella finale ha il punteggio più alto, 219 00:12:05,010 --> 00:12:07,600 questo è quello che vorrei raccomandare. 220 00:12:07,600 --> 00:12:09,890 >> Niente di tutto questo è davvero oscuro. 221 00:12:09,890 --> 00:12:11,600 Niente di tutto questo è impegnativo. 222 00:12:11,600 --> 00:12:15,810 Questi sono tutti algoritmi di base che si potrebbe implementare oggi. 223 00:12:15,810 --> 00:12:20,050 >> Ora, con veri e propri sistemi di raccomandazione, si esegue in qualche problema. 224 00:12:20,050 --> 00:12:23,300 Che cosa succede se non c'è nessuno che corrisponde esattamente le tue preferenze? 225 00:12:23,300 --> 00:12:27,170 E se ci sono utenti che sono esattamente le vostre preferenze, 226 00:12:27,170 --> 00:12:30,480 ma poi deviare drasticamente da quello che ti piace? 227 00:12:30,480 --> 00:12:36,210 Mi piace classico Godzilla film, ma mia moglie non lo fa. 228 00:12:36,210 --> 00:12:39,430 Mi piace guardare loro, la mia Account Netflix li contiene. 229 00:12:39,430 --> 00:12:41,800 Il suo di no. 230 00:12:41,800 --> 00:12:45,230 Cosa succede quando si comincia miscelazione dati come questo? 231 00:12:45,230 --> 00:12:47,690 Queste sono tutte le sfide che si può superare, 232 00:12:47,690 --> 00:12:51,900 hanno semplicemente prendere un po ' algoritmi più complessi. 233 00:12:51,900 --> 00:12:56,420 >> Ora, nel mondo reale, che sono in realtà operativa, 234 00:12:56,420 --> 00:12:59,980 usiamo il filtro del contenuto basato o usiamo filtraggio collaborativo? 235 00:12:59,980 --> 00:13:01,910 E la risposta è usiamo entrambi. 236 00:13:01,910 --> 00:13:06,350 Quasi tutti i principali utenti questo caso, Amazon, Facebook, Netflix, 237 00:13:06,350 --> 00:13:11,200 Pandora, tutti usano una combinazione di questi diversi sistemi di raccomandazione. 238 00:13:11,200 --> 00:13:16,520 E quando combiniamo le scelte da ciascuno, noi li chiamiamo sistemi ibridi. 239 00:13:16,520 --> 00:13:20,750 Essi in qualche modo dipendono dal caratteristiche dell'oggetto stesso, 240 00:13:20,750 --> 00:13:24,710 e in qualche modo dipendono da le preferenze degli altri utenti. 241 00:13:24,710 --> 00:13:28,120 Questi sistemi ibridi, sono grandi affari, 242 00:13:28,120 --> 00:13:30,830 e sono ciò che è oggi in corso. 243 00:13:30,830 --> 00:13:32,839 >> Quindi grazie molto per me l'adesione. 244 00:13:32,839 --> 00:13:35,380 Spero che tu hai ottenuto un po ' bit di una comprensione di ciò 245 00:13:35,380 --> 00:13:37,430 rende questi sistemi di lavoro. 246 00:13:37,430 --> 00:13:41,980 La prossima volta che sei in linea, ricorda che non solo si influenzano le scelte, 247 00:13:41,980 --> 00:13:44,680 ma potenzialmente tutti gli altri è così. 248 00:13:44,680 --> 00:13:46,480 Grazie ancora. 249 00:13:46,480 --> 00:13:47,186