1
00:00:00,000 --> 00:00:03,416
>> [RIPRODUZIONE DI BRANI MUSICALI]

2
00:00:03,416 --> 00:00:05,860

3
00:00:05,860 --> 00:00:08,180
>> CERVELLO Scassellati: Benvenuti
alla serie CS50 AI.

4
00:00:08,180 --> 00:00:12,600
Il mio nome è Scass, e oggi stiamo andando
a parlare di sistemi di raccomandazione.

5
00:00:12,600 --> 00:00:15,780
Sistemi di suoni ora di raccomandazione
come una specie di strano nome.

6
00:00:15,780 --> 00:00:18,630
Suona come forse dovrebbe
essere sistemi di raccomandazione,

7
00:00:18,630 --> 00:00:21,290
e mi sono d'accordo con te.

8
00:00:21,290 --> 00:00:26,110
Ma questi sono i sistemi che aiutano
selezionare le cose simili ogni volta

9
00:00:26,110 --> 00:00:28,210
si seleziona qualcosa online.

10
00:00:28,210 --> 00:00:32,119
Netflix, per esempio suggeriranno altri
film che si potrebbe desiderare di vedere.

11
00:00:32,119 --> 00:00:36,660
O Pandora suggerirà diverso
canzoni che si potrebbe desiderare di ascoltare.

12
00:00:36,660 --> 00:00:40,940
Amazon suggerire che tipo di
altri prodotti si potrebbe desiderare di comprare.

13
00:00:40,940 --> 00:00:43,520
Facebook sarà anche suggerire
alcuni degli altri amici

14
00:00:43,520 --> 00:00:45,440
che si potrebbe desiderare di aggiungere.

15
00:00:45,440 --> 00:00:49,800
Ciascuno di questi sistemi operano usando
lo stesso tipo di algoritmo di base,

16
00:00:49,800 --> 00:00:52,520
e questo è quello che siamo
andando a parlare oggi.

17
00:00:52,520 --> 00:00:56,860
>> Ora, questi algoritmi sono
sorprendentemente grande business.

18
00:00:56,860 --> 00:01:01,130
Netflix a pochi anni fa in
2009 ha offerto $ 1 milione

19
00:01:01,130 --> 00:01:07,240
premio se si potesse migliorare la loro
sistema di raccomandazione di appena il 10%.

20
00:01:07,240 --> 00:01:11,960
Questo 10%, però, rappresenta un
notevole quantità di attività.

21
00:01:11,960 --> 00:01:15,330
Le stime sono difficili da
trovare, ma molte persone

22
00:01:15,330 --> 00:01:19,050
credere che questi raccomandazione
sistemi per l'acquisto on-line

23
00:01:19,050 --> 00:01:25,729
sistema come Amazon portare da qualche parte
tra il 10% e il 25% un aumento delle entrate.

24
00:01:25,729 --> 00:01:27,770
Quindi potete immaginare la
tipo di volume che si sei

25
00:01:27,770 --> 00:01:32,860
parlando quando pensiamo
anche questi piccoli algoritmi.

26
00:01:32,860 --> 00:01:35,200
>> Quindi cerchiamo di ottenere qualche esempio.

27
00:01:35,200 --> 00:01:38,460
Come è possibile che questi
sistemi funzionano davvero?

28
00:01:38,460 --> 00:01:40,773
Offriamo due
tipi di algoritmi che

29
00:01:40,773 --> 00:01:45,050
sono in gioco quando si parla di
raccomandazioni di generazione.

30
00:01:45,050 --> 00:01:48,650
Le prime sono chiamate
filtraggio dei contenuti basato.

31
00:01:48,650 --> 00:01:53,410
E filtraggio dei contenuti basato conta
sulle somiglianze tra le voci

32
00:01:53,410 --> 00:02:00,370
stessi, cioè tra due film
o due canzoni o due articoli acquistati.

33
00:02:00,370 --> 00:02:03,190
Stiamo andando a utilizzare filmati
come esempio, ma questa

34
00:02:03,190 --> 00:02:07,850
potrebbe applicarsi, in realtà, di qualsiasi tipo
di oggetto che stiamo cercando.

35
00:02:07,850 --> 00:02:13,330
>> Quindi, se ci penso un po '
film dell'ultimo anno,

36
00:02:13,330 --> 00:02:16,799
Ho visto Inside Out con
i miei bambini, si sono trovati benissimo.

37
00:02:16,799 --> 00:02:17,840
Ma abbiamo anche avuto una scelta.

38
00:02:17,840 --> 00:02:21,350
Avremmo potuto vedere Serventi,
potremmo visto Age of Ultron,

39
00:02:21,350 --> 00:02:24,850
o avremmo potuto visto
Ant Man nei teatri.

40
00:02:24,850 --> 00:02:27,580
>> Per uno di questi
film, potremmo immaginare

41
00:02:27,580 --> 00:02:33,320
creazione di un elenco di funzionalità o
qualità circa i film diversi.

42
00:02:33,320 --> 00:02:37,190
Così, per esempio, potrei prendere in considerazione
che di quei film sono animati.

43
00:02:37,190 --> 00:02:39,960
Beh, entrambi Inside Out
e Serventi sono animati.

44
00:02:39,960 --> 00:02:44,140
Né Age of Ultron né
Ant Man sono film d'animazione.

45
00:02:44,140 --> 00:02:47,040
E potrei immaginare edificio
una struttura, una tabella che

46
00:02:47,040 --> 00:02:49,440
elenca ciascuna di queste proprietà.

47
00:02:49,440 --> 00:02:51,790
Sono animati o no?

48
00:02:51,790 --> 00:02:54,780
Potrei quindi aggiungere di più
caratteristiche di questo tavolo

49
00:02:54,780 --> 00:02:58,380
con l'aggiunta di più righe in questa struttura.

50
00:02:58,380 --> 00:03:00,970
Potrei chiedere se
Non sono film Marvel.

51
00:03:00,970 --> 00:03:04,010
Beh, Inside Out e Serventi
Non sono film Marvel,

52
00:03:04,010 --> 00:03:06,715
Age of Ultron e Ant Man sono certamente.

53
00:03:06,715 --> 00:03:09,100
>> E potrei chiedere qualsiasi tipo
di diverse qualità

54
00:03:09,100 --> 00:03:12,080
che volevo, qualsiasi tipo di caratteristiche
che potrebbe essere importante per me.

55
00:03:12,080 --> 00:03:13,440
Hanno un supercattivo?

56
00:03:13,440 --> 00:03:16,700
Beh, non c'è supercattivo in Inside
Fuori, ma ci sono quelli di Serventi

57
00:03:16,700 --> 00:03:19,990
e, ovviamente, la
due film di supereroi.

58
00:03:19,990 --> 00:03:23,900
>> Potrei anche chiedere le cose come, beh,
non passano il test Bechdel?

59
00:03:23,900 --> 00:03:27,280
Ci sono due nominati
personaggi femminili che

60
00:03:27,280 --> 00:03:30,550
passare un po 'notevole quantità di
tempo avere una conversazione che

61
00:03:30,550 --> 00:03:34,400
non comporta uomini nel cast?

62
00:03:34,400 --> 00:03:39,870
Ebbene, in questo caso, Inside Out passa
il test, Serventi fallisce, Age of Ultron

63
00:03:39,870 --> 00:03:42,990
passa il test, e ANT Man fallisce.

64
00:03:42,990 --> 00:03:45,020
Una qualsiasi di queste caratteristiche
Potrei pensare

65
00:03:45,020 --> 00:03:48,660
come importante per alcune persone.

66
00:03:48,660 --> 00:03:52,000
>> Potrei anche chiedere cose come sono
Ci sono delle persone in questi film che

67
00:03:52,000 --> 00:03:57,190
sono alunni di diciamo, Parchi e
Ricreazione, uno dei miei programmi preferiti.

68
00:03:57,190 --> 00:04:00,540
Beh, Inside Out ha Amy
Poehler, che è un ex-alunni.

69
00:04:00,540 --> 00:04:01,530
Che conta.

70
00:04:01,530 --> 00:04:04,110
Jon Hamm era in Serventi.

71
00:04:04,110 --> 00:04:08,600
Paul Rudd era in Ant Man, ma nessuno
in Age of Ultron era nei parchi e Req

72
00:04:08,600 --> 00:04:10,150
anche.

73
00:04:10,150 --> 00:04:12,990
Così posso costruire questo elenco di
caratteristiche, e che potevano davvero

74
00:04:12,990 --> 00:04:14,710
essere qualsiasi cosa, sui film.

75
00:04:14,710 --> 00:04:17,329
Potrebbero essere su ciò che
proporzioni che sono stati girati in,

76
00:04:17,329 --> 00:04:21,630
potrebbe essere il numero di seggi
venduti sul loro fine settimana di apertura.

77
00:04:21,630 --> 00:04:25,630
Qualsiasi caratteristica che voglio
generare posso mettere in questa tabella.

78
00:04:25,630 --> 00:04:29,600
>> Ora, in questo caso, ho costruito
ogni sorta di valori Bullion,

79
00:04:29,600 --> 00:04:33,700
sì o no, passare o fallire,
ma potrebbe essere qualsiasi cosa.

80
00:04:33,700 --> 00:04:36,690
Potrebbero essere valori arbitrari.

81
00:04:36,690 --> 00:04:39,070
Per i contenuti filtro basato,
quello che stiamo andando a fare

82
00:04:39,070 --> 00:04:42,810
è che stiamo andando a prendere in considerazione
due colonne di questa tabella

83
00:04:42,810 --> 00:04:45,660
e vedere quanto sono simili.

84
00:04:45,660 --> 00:04:48,640
Così, per esempio, se
è andato a vedere Inside Out,

85
00:04:48,640 --> 00:04:53,640
Potrei chiedere, quali sono gli altri film
che potrei essere disposto ad andare a vedere.

86
00:04:53,640 --> 00:04:56,890
Cioè, quello disposto a
spendere i miei soldi per andare a vedere.

87
00:04:56,890 --> 00:05:00,310
E posso paragonare questo da solo prendendo
le due colonne, una da Inside Out

88
00:05:00,310 --> 00:05:03,300
e uno qualsiasi dei
altri film, e solo vedere

89
00:05:03,300 --> 00:05:06,210
quanti di loro match caratteristiche.

90
00:05:06,210 --> 00:05:09,660
Quindi, se confronto Inside Out
con Serventi, beh, c'è

91
00:05:09,660 --> 00:05:10,910
tre cose qui quella partita.

92
00:05:10,910 --> 00:05:16,200
Sono entrambi animati, nessuno dei due
sono film Marvel, e ciascuno di essi

93
00:05:16,200 --> 00:05:18,420
avere Parchi e Req alunni.

94
00:05:18,420 --> 00:05:20,420
Così ho potuto contare su come
tante partite ci sono stati,

95
00:05:20,420 --> 00:05:22,640
e in questo caso ci sarebbe stato di tre.

96
00:05:22,640 --> 00:05:26,450
>> Se poi paragono Inside Out
con diciamo Age of Ultron,

97
00:05:26,450 --> 00:05:28,430
Posso guardare la lista
e dire, beh, c'è

98
00:05:28,430 --> 00:05:30,140
solo una cosa che corrisponde lì.

99
00:05:30,140 --> 00:05:34,560
Entrambi superano il test Bechtel, così
che sta per essere un punteggio di uno.

100
00:05:34,560 --> 00:05:36,770
E tra Inside Out
L'uomo e Formica, ancora una volta ho

101
00:05:36,770 --> 00:05:41,420
può confrontare riga per riga quanti
cose coincidono tra loro due.

102
00:05:41,420 --> 00:05:43,060
Beh, uno ANIMATA, uno non lo è.

103
00:05:43,060 --> 00:05:44,970
Uno è un film Marvel, non è.

104
00:05:44,970 --> 00:05:47,280
Uno ha un supercattivo,
l'altro no.

105
00:05:47,280 --> 00:05:49,480
Si passa la Bechtel
prova, si fallisce,

106
00:05:49,480 --> 00:05:54,450
ma entrambi hanno Parchi e Req alunni,
Quindi, di nuovo, si ottiene un punteggio di uno.

107
00:05:54,450 --> 00:05:58,300
>> Quindi, se fossi alla ricerca di film
che erano simili a Inside Out,

108
00:05:58,300 --> 00:06:02,170
Potrei cercare i film che hanno
il punteggio più alto in questo contenuto

109
00:06:02,170 --> 00:06:03,952
schema di filtraggio.

110
00:06:03,952 --> 00:06:05,660
Quindi, in questo caso,
considererebbe Minions

111
00:06:05,660 --> 00:06:08,330
per essere più vicini e più
probabile che sia qualcosa

112
00:06:08,330 --> 00:06:13,250
che vorrei spendere soldi per vedere
di Age of Ultron o Ant Man.

113
00:06:13,250 --> 00:06:16,150
>> Questi contenuti basato
sistemi di filtraggio si basano solo

114
00:06:16,150 --> 00:06:18,670
sulle proprietà
i film, e così io

115
00:06:18,670 --> 00:06:21,930
può costruire questi solo conoscendo
qualcosa sui prodotti

116
00:06:21,930 --> 00:06:23,500
che ho.

117
00:06:23,500 --> 00:06:26,050
Posso usare qualsiasi tipo di
caratteristiche che mi piacerebbe,

118
00:06:26,050 --> 00:06:28,400
e posso costruire più
caratteristiche complesse che

119
00:06:28,400 --> 00:06:33,060
coinvolgere test più complessi
di una qualità come vado avanti.

120
00:06:33,060 --> 00:06:39,080
In realtà, posso anche visualizzare questa tabella
non come un oggetto statico,

121
00:06:39,080 --> 00:06:43,110
ma piuttosto come dimensioni
all'interno di uno spazio di stato più grande.

122
00:06:43,110 --> 00:06:46,295
E posso iniziare a parlare del
distanze tra film diversi.

123
00:06:46,295 --> 00:06:49,300

124
00:06:49,300 --> 00:06:51,050
Queste sono tutte le cose
che sappiamo come

125
00:06:51,050 --> 00:06:55,860
fare con il tipo di strutture di dati
che abbiamo già visto in CS50.

126
00:06:55,860 --> 00:06:59,180
Così ho potuto immaginare edificio
una struttura di dati per un film.

127
00:06:59,180 --> 00:07:02,390
C'è una struttura che ho
costruito chiamato film,

128
00:07:02,390 --> 00:07:04,369
ed ha cinque voci booleane in esso.

129
00:07:04,369 --> 00:07:07,160
E 'animato, è una meraviglia
film, ce l'ha un supercattivo,

130
00:07:07,160 --> 00:07:11,047
fa passare il test Bechdel, e
Ci sono parchi e Rec alunni in esso?

131
00:07:11,047 --> 00:07:12,880
E ciascuna di queste è un
struttura di dati che

132
00:07:12,880 --> 00:07:16,330
possono occupare per quel particolare film.

133
00:07:16,330 --> 00:07:20,090
>> Poi calcolare se due
film sono simili o meno,

134
00:07:20,090 --> 00:07:23,330
quale sia il loro punteggio, ho potuto
scrivere una serie di pseudocodice che

135
00:07:23,330 --> 00:07:25,120
genera quella stessa funzione.

136
00:07:25,120 --> 00:07:30,100
Cioè, dato qualche film M1, posso
trovare il film più simile ad esso

137
00:07:30,100 --> 00:07:32,430
seguendo la pseudocodice.

138
00:07:32,430 --> 00:07:37,040
Considero che è il migliore
sistema che ho trovato segnando,

139
00:07:37,040 --> 00:07:39,920
il miglior paragone che ho trovato.

140
00:07:39,920 --> 00:07:41,890
Per ogni altro film
Ho intenzione di passare attraverso,

141
00:07:41,890 --> 00:07:44,920
Io preparo un punteggio partita uguale a 0.

142
00:07:44,920 --> 00:07:47,920
E io andrò attraverso quella
film, una M1, il film

143
00:07:47,920 --> 00:07:51,500
Ho iniziato con, io controllerò
ogni caratteristica

144
00:07:51,500 --> 00:07:53,650
che devono vedere
se c'è una corrispondenza.

145
00:07:53,650 --> 00:07:56,460
Se c'è una corrispondenza, io sarò
incrementare il punteggio partita.

146
00:07:56,460 --> 00:08:00,480
E se alla fine il punteggio match che
Ho è migliore di quello attuale migliore

147
00:08:00,480 --> 00:08:03,310
punteggio, allora io
ricordare che il miglior punteggio,

148
00:08:03,310 --> 00:08:05,820
e questo è il miglior match che ho.

149
00:08:05,820 --> 00:08:09,450
Alla fine, qualunque film
è seduto in corrispondenza migliore,

150
00:08:09,450 --> 00:08:12,580
che è la più vicina
Sono stato in grado di venire.

151
00:08:12,580 --> 00:08:14,890
Così basato questi contenuti
sistemi di filtraggio,

152
00:08:14,890 --> 00:08:16,900
tutti hanno questa struttura di base.

153
00:08:16,900 --> 00:08:20,910
Essi si basano sulla voce
in questione e nulla

154
00:08:20,910 --> 00:08:24,590
su una qualsiasi delle preferenze dell'utente.

155
00:08:24,590 --> 00:08:29,010
>> L'altro meccanismo che usiamo in
fine di costruire sistemi di raccomandazione

156
00:08:29,010 --> 00:08:31,790
si chiama filtraggio collaborativo.

157
00:08:31,790 --> 00:08:36,520
Filtraggio collaborativo si basa su
Non le qualità dell'oggetto stesso,

158
00:08:36,520 --> 00:08:40,010
ma come la gente, altro
gli utenti che è, come essi hanno

159
00:08:40,010 --> 00:08:43,370
risposto a questi stessi oggetti.

160
00:08:43,370 --> 00:08:48,720
Quindi, per continuare con il mio esempio di film,
Potrei prendere un gruppo di miei amici

161
00:08:48,720 --> 00:08:53,180
e loro indagine su se o
Non gli piaceva film particolari.

162
00:08:53,180 --> 00:08:56,560
Ora luoghi diversi produrranno
questi dati in modi diversi.

163
00:08:56,560 --> 00:08:59,630
È possibile esaminare direttamente il vostro
utenti, o si poteva solo

164
00:08:59,630 --> 00:09:03,120
vedere ciò che scelgono se
sei, ad esempio Netflix.

165
00:09:03,120 --> 00:09:05,640
Quali film hanno fatto guardare?

166
00:09:05,640 --> 00:09:08,670
>> Potrei mettere in discussione alcuni dei miei
amici qui e scoprire

167
00:09:08,670 --> 00:09:12,910
che Jason è piaciuto ogni film
vide, non sorprende lì.

168
00:09:12,910 --> 00:09:15,590
Andy è solo Serventi e zia Man.

169
00:09:15,590 --> 00:09:19,330
Sarah è Inside Out e
Vendicatori, il contrario di Andy.

170
00:09:19,330 --> 00:09:22,200
E Sam, beh, Sam è piaciuto
tutti i film di supereroi,

171
00:09:22,200 --> 00:09:24,960
ma nessuno dei film d'animazione.

172
00:09:24,960 --> 00:09:30,630
>> Potrei quindi interrogare per qualche nuovo
individuale, un altro utente come me

173
00:09:30,630 --> 00:09:34,520
e chiedere, beh, se mi è piaciuto
uno di questi film,

174
00:09:34,520 --> 00:09:38,600
si può fare una previsione su
quale altro film che potrebbe piacere.

175
00:09:38,600 --> 00:09:41,890
Cioè, se mi è piaciuto Dentro
Out, quali altri film

176
00:09:41,890 --> 00:09:48,460
sono io probabile che vogliono anche vedere
sulla base di ciò che la gente ha fatto simili?

177
00:09:48,460 --> 00:09:51,640
Cioè, io vado attraverso un
Io filtrare attraverso questa lista

178
00:09:51,640 --> 00:09:54,520
e trovare solo il
individui che piaceva anche

179
00:09:54,520 --> 00:09:57,680
Inside Out, che ha trovato le mie preferenze.

180
00:09:57,680 --> 00:10:00,824
Bene, ciò significa che Andy e
Sam, che non gli piaceva Inside Out,

181
00:10:00,824 --> 00:10:02,240
così io non ho intenzione di prenderle in considerazione.

182
00:10:02,240 --> 00:10:06,130
Ho intenzione di sbarazzarsi di loro
dati per questo confronto.

183
00:10:06,130 --> 00:10:09,750
>> Posso quindi guardare a ciò che Jason
e Sarah pensiero e la loro concordanza

184
00:10:09,750 --> 00:10:13,780
up che dei film che videro
che non ho, se li è piaciuto

185
00:10:13,780 --> 00:10:15,150
o no.

186
00:10:15,150 --> 00:10:17,820
Potrei contare fino, diciamo voti.

187
00:10:17,820 --> 00:10:23,360
Così Serventi, per esempio, potrebbe avere un
votare a favore, perché Jason piaceva.

188
00:10:23,360 --> 00:10:27,170
Sia Jason e Sarah è piaciuto Avengers,
quindi sarebbe dispone di due voti.

189
00:10:27,170 --> 00:10:30,700
E solo Jason piaceva Ant Man,
quindi sarebbe ottenere un voto.

190
00:10:30,700 --> 00:10:34,870
Quindi, se ho dovuto poi raccomandare
per me che di questi film

191
00:10:34,870 --> 00:10:41,470
Potrei essere più probabilità di vedere, lo farei
devono scegliere Age of Ultron: Vendicatori.

192
00:10:41,470 --> 00:10:44,490
>> Così per una di queste
sistemi, ora sto usando

193
00:10:44,490 --> 00:10:49,260
dati che non era generato sulla
film in sé, ma sulle preferenze

194
00:10:49,260 --> 00:10:51,960
da altri utenti.

195
00:10:51,960 --> 00:10:54,150
Questo ha alcune difficoltà, naturalmente.

196
00:10:54,150 --> 00:10:55,920
Che cosa succede se non si dispone di tutti gli altri utenti?

197
00:10:55,920 --> 00:10:58,770
Beh, che si chiama problema di avvio.

198
00:10:58,770 --> 00:11:03,760
Bisogna avere un po '
quantità di dati prima di sei

199
00:11:03,760 --> 00:11:07,560
in grado di iniziare a fare
queste raccomandazioni.

200
00:11:07,560 --> 00:11:10,940
Il rovescio della medaglia di esso è una volta
si inizia la raccolta dei dati,

201
00:11:10,940 --> 00:11:13,870
se è possibile raccogliere più
e sempre più dati,

202
00:11:13,870 --> 00:11:17,850
si otterrà sempre meglio
e le raccomandazioni migliori.

203
00:11:17,850 --> 00:11:21,650
>> Ora potremmo tradurre
questo in codice pure.

204
00:11:21,650 --> 00:11:23,860
Siamo in grado di definire un diverso
tipo di struttura,

205
00:11:23,860 --> 00:11:25,720
in questo caso lo chiameremo un utente.

206
00:11:25,720 --> 00:11:30,970
Ed ha caratteristiche su
quali film questo utente piacevano.

207
00:11:30,970 --> 00:11:34,560
Hanno piace Inside Out,
Minions, Vendicatori e Ant Man.

208
00:11:34,560 --> 00:11:36,660
Allora potremmo generare
alcuni pseudocodice a seguire

209
00:11:36,660 --> 00:11:39,460
la stessa procedura che ho usato prima.

210
00:11:39,460 --> 00:11:43,460
Cioè, dato un particolare
utente x, facciamo consiglia un film

211
00:11:43,460 --> 00:11:46,107
che x potrebbe piacere.

212
00:11:46,107 --> 00:11:47,940
Siamo in grado di passare attraverso e
per tutti i film,

213
00:11:47,940 --> 00:11:51,410
siamo in grado di inizializzare un punteggio
per quel film sia 0.

214
00:11:51,410 --> 00:11:54,080
E allora possiamo trovare tutto
degli altri utenti

215
00:11:54,080 --> 00:11:57,630
hanno le stesse preferenze come x.

216
00:11:57,630 --> 00:11:59,990
E allora per ogni
film che gli piaceva,

217
00:11:59,990 --> 00:12:02,340
ci incrementiamo il punteggio di quel film.

218
00:12:02,340 --> 00:12:05,010
Qualunque sia filmato nella
finale ha il punteggio più alto,

219
00:12:05,010 --> 00:12:07,600
questo è quello che vorrei raccomandare.

220
00:12:07,600 --> 00:12:09,890
>> Niente di tutto questo è davvero oscuro.

221
00:12:09,890 --> 00:12:11,600
Niente di tutto questo è impegnativo.

222
00:12:11,600 --> 00:12:15,810
Questi sono tutti algoritmi di base
che si potrebbe implementare oggi.

223
00:12:15,810 --> 00:12:20,050
>> Ora, con veri e propri sistemi di raccomandazione,
si esegue in qualche problema.

224
00:12:20,050 --> 00:12:23,300
Che cosa succede se non c'è nessuno che
corrisponde esattamente le tue preferenze?

225
00:12:23,300 --> 00:12:27,170
E se ci sono utenti che
sono esattamente le vostre preferenze,

226
00:12:27,170 --> 00:12:30,480
ma poi deviare drasticamente
da quello che ti piace?

227
00:12:30,480 --> 00:12:36,210
Mi piace classico Godzilla
film, ma mia moglie non lo fa.

228
00:12:36,210 --> 00:12:39,430
Mi piace guardare loro, la mia
Account Netflix li contiene.

229
00:12:39,430 --> 00:12:41,800
Il suo di no.

230
00:12:41,800 --> 00:12:45,230
Cosa succede quando si comincia
miscelazione dati come questo?

231
00:12:45,230 --> 00:12:47,690
Queste sono tutte le sfide
che si può superare,

232
00:12:47,690 --> 00:12:51,900
hanno semplicemente prendere un po '
algoritmi più complessi.

233
00:12:51,900 --> 00:12:56,420
>> Ora, nel mondo reale, che
sono in realtà operativa,

234
00:12:56,420 --> 00:12:59,980
usiamo il filtro del contenuto basato o
usiamo filtraggio collaborativo?

235
00:12:59,980 --> 00:13:01,910
E la risposta è usiamo entrambi.

236
00:13:01,910 --> 00:13:06,350
Quasi tutti i principali utenti
questo caso, Amazon, Facebook, Netflix,

237
00:13:06,350 --> 00:13:11,200
Pandora, tutti usano una combinazione di
questi diversi sistemi di raccomandazione.

238
00:13:11,200 --> 00:13:16,520
E quando combiniamo le scelte da
ciascuno, noi li chiamiamo sistemi ibridi.

239
00:13:16,520 --> 00:13:20,750
Essi in qualche modo dipendono dal
caratteristiche dell'oggetto stesso,

240
00:13:20,750 --> 00:13:24,710
e in qualche modo dipendono da
le preferenze degli altri utenti.

241
00:13:24,710 --> 00:13:28,120
Questi sistemi ibridi,
sono grandi affari,

242
00:13:28,120 --> 00:13:30,830
e sono ciò che è oggi in corso.

243
00:13:30,830 --> 00:13:32,839
>> Quindi grazie molto per me l'adesione.

244
00:13:32,839 --> 00:13:35,380
Spero che tu hai ottenuto un po '
bit di una comprensione di ciò

245
00:13:35,380 --> 00:13:37,430
rende questi sistemi di lavoro.

246
00:13:37,430 --> 00:13:41,980
La prossima volta che sei in linea, ricorda che
non solo si influenzano le scelte,

247
00:13:41,980 --> 00:13:44,680
ma potenzialmente tutti gli altri è così.

248
00:13:44,680 --> 00:13:46,480
Grazie ancora.

249
00:13:46,480 --> 00:13:47,186