1 00:00:00,000 --> 00:00:03,416 >> [MUSIC JOC] 2 00:00:03,416 --> 00:00:05,860 3 00:00:05,860 --> 00:00:08,180 >> BRAIN SCASSELLATI: Bine ati venit la seria CS50 AI. 4 00:00:08,180 --> 00:00:12,600 Numele meu este Scass, iar astăzi vom pentru a vorbi despre sisteme va recomandat. 5 00:00:12,600 --> 00:00:15,780 Acum va recomandat sunete sisteme ca un fel de nume ciudat. 6 00:00:15,780 --> 00:00:18,630 Se pare ca poate ar trebui fi sisteme de recomandare, 7 00:00:18,630 --> 00:00:21,290 și am un fel de acord cu tine. 8 00:00:21,290 --> 00:00:26,110 Dar acestea sunt sistemele care ajută selectați lucruri similare ori de câte ori 9 00:00:26,110 --> 00:00:28,210 selectați ceva on-line. 10 00:00:28,210 --> 00:00:32,119 Netflix, de exemplu, va sugera alte filme care ar putea să doriți să urmăriți. 11 00:00:32,119 --> 00:00:36,660 Sau Pandora va sugera diferite melodii pe care le-ar putea dori pentru a asculta. 12 00:00:36,660 --> 00:00:40,940 Amazon va sugera ce fel de alte produse s-ar putea dori să cumpere. 13 00:00:40,940 --> 00:00:43,520 Facebook va sugera chiar unele dintre celelalte prieteni 14 00:00:43,520 --> 00:00:45,440 că ați putea dori să adăugați. 15 00:00:45,440 --> 00:00:49,800 Fiecare dintre aceste sisteme funcționează utilizând același tip de bază de algoritm, 16 00:00:49,800 --> 00:00:52,520 și asta e ceea ce suntem vorbi despre ziua de azi. 17 00:00:52,520 --> 00:00:56,860 >> Acum acesti algoritmi sunt surprinzător de mare de afaceri. 18 00:00:56,860 --> 00:01:01,130 Netflix câțiva ani în urmă, în 2,009 oferit un 1 milion $ 19 00:01:01,130 --> 00:01:07,240 premiu dacă ai putea îmbunătăți lor Sistemul de recomandare de numai 10%. 20 00:01:07,240 --> 00:01:11,960 Asta 10%, deși, reprezintă o sumă substanțială de afaceri. 21 00:01:11,960 --> 00:01:15,330 Estimările sunt greu de gasit, dar mulți oameni 22 00:01:15,330 --> 00:01:19,050 cred că acestea recomandare Sisteme pentru o achiziție on-line 23 00:01:19,050 --> 00:01:25,729 sistem ca Amazon duce undeva între 10% și 25% la creșterea veniturilor. 24 00:01:25,729 --> 00:01:27,770 Astfel încât să puteți imagina un fel de volum care sunteți 25 00:01:27,770 --> 00:01:32,860 vorbim despre atunci când ne gândim la chiar și aceste algoritmi mici. 26 00:01:32,860 --> 00:01:35,200 >> Așa că hai să cateva exemple. 27 00:01:35,200 --> 00:01:38,460 Cum se face ca aceste Sisteme de adevărat? 28 00:01:38,460 --> 00:01:40,773 Există două bază tipuri de algoritmi care 29 00:01:40,773 --> 00:01:45,050 sunt în joc atunci când vorbim despre recomandări generatoare. 30 00:01:45,050 --> 00:01:48,650 Primii sunt numite filtrare pe bază de conținut. 31 00:01:48,650 --> 00:01:53,410 Și filtrare pe bază de conținut se bazează pe similitudini între elementele 32 00:01:53,410 --> 00:02:00,370 ei înșiși, adică între două filme sau două melodii sau două elemente achiziționate. 33 00:02:00,370 --> 00:02:03,190 Vom utiliza filme ca un exemplu, dar acest 34 00:02:03,190 --> 00:02:07,850 ar putea aplica, într-adevăr, la orice tip de opoziție pe care le căutați. 35 00:02:07,850 --> 00:02:13,330 >> Deci, dacă mă gândesc la unele filme din anul trecut, 36 00:02:13,330 --> 00:02:16,799 Am văzut cu Inside Out copiii mei, l-au iubit. 37 00:02:16,799 --> 00:02:17,840 Dar am avut, de asemenea, o alegere. 38 00:02:17,840 --> 00:02:21,350 Am fi putut merge pentru a vedea Minions, am putea văzut Age of Ultron, 39 00:02:21,350 --> 00:02:24,850 sau am putea fi văzut Omul Ant în teatrele. 40 00:02:24,850 --> 00:02:27,580 >> Pentru oricare dintre aceste filme, am putea imagina 41 00:02:27,580 --> 00:02:33,320 generând o listă de caracteristici sau calități despre acele filme diferite. 42 00:02:33,320 --> 00:02:37,190 Deci, de exemplu, am putea lua în considerare care dintre aceste filme sunt animate. 43 00:02:37,190 --> 00:02:39,960 Ei bine, atât în ​​interiorul cât Out și slujitorii sunt animate. 44 00:02:39,960 --> 00:02:44,140 Nici Age of Ultron nici Ant Man sunt filme animate. 45 00:02:44,140 --> 00:02:47,040 Și am putea imagina de construcție o structură, un tabel care 46 00:02:47,040 --> 00:02:49,440 enumeră fiecare dintre aceste proprietăți. 47 00:02:49,440 --> 00:02:51,790 Sunt animate sau nu? 48 00:02:51,790 --> 00:02:54,780 Apoi m-am putea adăuga mai multe caracteristici pentru acest tabel 49 00:02:54,780 --> 00:02:58,380 prin adăugarea de mai multe rânduri în această structură. 50 00:02:58,380 --> 00:03:00,970 Aș putea întreba dacă sau nu sunt filme Marvel. 51 00:03:00,970 --> 00:03:04,010 Ei bine, Inside Out și slujitorii nu sunt filme Marvel, 52 00:03:04,010 --> 00:03:06,715 Age of Ultron și Ant Man cu siguranță sunt. 53 00:03:06,715 --> 00:03:09,100 >> Și am putea întreba orice fel de diferite calitati 54 00:03:09,100 --> 00:03:12,080 pe care am vrut, orice tipuri de caracteristici care ar putea fi important pentru mine. 55 00:03:12,080 --> 00:03:13,440 Au un personaj negativ super-? 56 00:03:13,440 --> 00:03:16,700 Ei bine, nu exista nici ticălos super-Inside , Dar există sunt cele în Minions 57 00:03:16,700 --> 00:03:19,990 și în, evident, doua filme Superhero. 58 00:03:19,990 --> 00:03:23,900 >> Aș putea cere, de asemenea lucruri cum ar fi, bine, nu trec testul Bechdel? 59 00:03:23,900 --> 00:03:27,280 Există două nume personaje feminine care 60 00:03:27,280 --> 00:03:30,550 petrece ceva cantitate semnificativă de timp o conversație care 61 00:03:30,550 --> 00:03:34,400 nu implică bărbați în exprimate? 62 00:03:34,400 --> 00:03:39,870 Ei bine, în acest caz, Inside Out trece testul, Minions eșuează, Age of Ultron 63 00:03:39,870 --> 00:03:42,990 trece testul, și Ant Man nu reușește. 64 00:03:42,990 --> 00:03:45,020 Oricare dintre aceste caracteristici Mă puteam gândi 65 00:03:45,020 --> 00:03:48,660 ca fiind important pentru unii oameni. 66 00:03:48,660 --> 00:03:52,000 >> Aș putea cere, de asemenea lucruri ca sunt acolo orice popor din aceste filme care 67 00:03:52,000 --> 00:03:57,190 sunt absolventi de la să zicem, Parcuri și Recreere, unul dintre spectacolele mele preferate. 68 00:03:57,190 --> 00:04:00,540 Ei bine, Inside Out are Amy Poehler, asta e un Alumni. 69 00:04:00,540 --> 00:04:01,530 Care contează. 70 00:04:01,530 --> 00:04:04,110 Jon Hamm a fost în Minions. 71 00:04:04,110 --> 00:04:08,600 Paul Rudd a fost în Ant Man, dar nimeni nu în vârstă de Ultron a fost în Parcuri și Req 72 00:04:08,600 --> 00:04:10,150 deasemenea. 73 00:04:10,150 --> 00:04:12,990 Așa că am putea construi această listă de caracteristici, și într-adevăr au putut 74 00:04:12,990 --> 00:04:14,710 fi nimic despre filme. 75 00:04:14,710 --> 00:04:17,329 Acestea ar putea fi ceea ce raport de aspect au fost împușcați în, 76 00:04:17,329 --> 00:04:21,630 ar putea fi de multe locuri în care cât de vândute pe week-end lor de deschidere. 77 00:04:21,630 --> 00:04:25,630 Orice facilitate care doresc să genera pot pune în acest tabel. 78 00:04:25,630 --> 00:04:29,600 >> Acum, în acest caz, am construit tot felul de valori lingouri, 79 00:04:29,600 --> 00:04:33,700 da sau nu, treci sau nu, dar acestea ar putea fi orice. 80 00:04:33,700 --> 00:04:36,690 Acestea ar putea fi valori arbitrare. 81 00:04:36,690 --> 00:04:39,070 Pentru filtrarea pe bază de conținut, ceea ce am de gând să faci 82 00:04:39,070 --> 00:04:42,810 este vom să ia în considerare două coloane din acest tabel 83 00:04:42,810 --> 00:04:45,660 și a vedea cum similare sunt. 84 00:04:45,660 --> 00:04:48,640 Deci, de exemplu, dacă am a mers pentru a vedea pe dos, 85 00:04:48,640 --> 00:04:53,640 S-ar putea întreba, care sunt alte filme ca să fi dispus să te duci sa vezi. 86 00:04:53,640 --> 00:04:56,890 Asta este, ceea ce dorește să cheltui banii pentru a te duci sa vezi mea. 87 00:04:56,890 --> 00:05:00,310 Și pot compara acest lucru prin luarea doar cele două coloane, una de la Inside Out 88 00:05:00,310 --> 00:05:03,300 și unul din oricare dintre alte filme, și doar a vedea 89 00:05:03,300 --> 00:05:06,210 cât de multe dintre meci caracteristici. 90 00:05:06,210 --> 00:05:09,660 Deci, dacă am compara Inside Out cu Minions, ei bine, nu e 91 00:05:09,660 --> 00:05:10,910 trei lucruri aici, care se potrivesc. 92 00:05:10,910 --> 00:05:16,200 Sunt atât animat, nici unul dintre ei sunt filme Marvel, și amândoi 93 00:05:16,200 --> 00:05:18,420 au Parcuri și cer absolventi. 94 00:05:18,420 --> 00:05:20,420 Așa că am putut număra până cum multe meciuri au fost, 95 00:05:20,420 --> 00:05:22,640 și în acest caz, nu ar fi trei. 96 00:05:22,640 --> 00:05:26,450 >> Dacă atunci am compara Inside Out cu să zicem Age of Ultron, 97 00:05:26,450 --> 00:05:28,430 Pot privi în jos lista și spune, ei bine, nu e 98 00:05:28,430 --> 00:05:30,140 doar un singur lucru care se potrivește acolo. 99 00:05:30,140 --> 00:05:34,560 Amândoi trece testul Bechtel, așa care va fi un scor de unul. 100 00:05:34,560 --> 00:05:36,770 Și între Inside Out și Man Ant, din nou, am 101 00:05:36,770 --> 00:05:41,420 pot compara linie cu linie cât de multe se potrivesc lucrurile între cei doi. 102 00:05:41,420 --> 00:05:43,060 Ei bine, o e animat, cuiva nu. 103 00:05:43,060 --> 00:05:44,970 Unul e un film Marvel, nu e. 104 00:05:44,970 --> 00:05:47,280 Unul are un personaj negativ super, celălalt nu. 105 00:05:47,280 --> 00:05:49,480 Unul trece Bechtel încercare, o eșuează, 106 00:05:49,480 --> 00:05:54,450 dar ambele au Parcuri și cer absolventi, astfel, din nou, acesta devine un scor de unul. 107 00:05:54,450 --> 00:05:58,300 >> Deci, dacă aș fi în căutarea pentru filme care au fost similare cu Inside Out, 108 00:05:58,300 --> 00:06:02,170 Aș putea căuta filmele care au cel mai mare scor în acest continut 109 00:06:02,170 --> 00:06:03,952 sistem de filtrare. 110 00:06:03,952 --> 00:06:05,660 Deci, în acest caz, am ar lua în considerare Minions 111 00:06:05,660 --> 00:06:08,330 a fi mai aproape și mai susceptibile de a fi ceva 112 00:06:08,330 --> 00:06:13,250 care mi-ar cheltui bani pentru a vedea decât vârsta de Ultron sau Man Ant. 113 00:06:13,250 --> 00:06:16,150 >> Acestea conținut pe bază de sisteme de filtrare se bazează doar 114 00:06:16,150 --> 00:06:18,670 privind proprietățile filme, și așa am 115 00:06:18,670 --> 00:06:21,930 pot construi aceste doar prin cunoașterea ceva despre produsele 116 00:06:21,930 --> 00:06:23,500 că am. 117 00:06:23,500 --> 00:06:26,050 Eu pot folosi orice fel de caracteristici pe care am dori, 118 00:06:26,050 --> 00:06:28,400 și pot construi mai mult caracteristici complexe, care 119 00:06:28,400 --> 00:06:33,060 implica test mai complex de o calitate așa cum am merge de-a lungul. 120 00:06:33,060 --> 00:06:39,080 De fapt, chiar și eu pot vedea acest tabel nu ca fiind un obiect static, 121 00:06:39,080 --> 00:06:43,110 ci mai degrabă ca fiind dimensiuni într-un spațiu de stat mai mare. 122 00:06:43,110 --> 00:06:46,295 Și eu pot începe vorbim despre distanțe între diferite filme. 123 00:06:46,295 --> 00:06:49,300 124 00:06:49,300 --> 00:06:51,050 Acestea sunt toate lucrurile că știm cum 125 00:06:51,050 --> 00:06:55,860 face utilizând tipurile de structuri de date care le-am văzut deja în CS50. 126 00:06:55,860 --> 00:06:59,180 Așa că am putut imagina de construcție o structură de date pentru un film. 127 00:06:59,180 --> 00:07:02,390 Există un struct care l-am construite numit film, 128 00:07:02,390 --> 00:07:04,369 și are cinci intrări booleene în ea. 129 00:07:04,369 --> 00:07:07,160 Este animat, este o minune film, nu-l are un personaj negativ super, 130 00:07:07,160 --> 00:07:11,047 nu-l trece testul Bechdel, și sunt acolo Parcuri și REC absolventi în ea? 131 00:07:11,047 --> 00:07:12,880 Și fiecare dintre acestea este o structură de date pe care am 132 00:07:12,880 --> 00:07:16,330 pot ocupa de acel film special. 133 00:07:16,330 --> 00:07:20,090 >> Apoi calcula dacă două Filmele sunt similare sau nu, 134 00:07:20,090 --> 00:07:23,330 ceea ce scorul lor este, am putea scrie un set de pseudocod care 135 00:07:23,330 --> 00:07:25,120 generează aceeași funcție. 136 00:07:25,120 --> 00:07:30,100 Asta este, având în vedere un film M1, pot găsi filmul cel mai similar cu aceasta 137 00:07:30,100 --> 00:07:32,430 urmând Pseudocodul. 138 00:07:32,430 --> 00:07:37,040 Consider care este cel mai bun sistem care l-am găsit a marcat, 139 00:07:37,040 --> 00:07:39,920 cele mai bune compararea pe care l-am găsit. 140 00:07:39,920 --> 00:07:41,890 Pentru orice alt film Am de gând să merg prin, 141 00:07:41,890 --> 00:07:44,920 Voi stabili un scor meci egal cu 0. 142 00:07:44,920 --> 00:07:47,920 Și voi trece prin asta film, un M1, filmul 143 00:07:47,920 --> 00:07:51,500 Am început cu, voi verifica fiecare caracteristică 144 00:07:51,500 --> 00:07:53,650 că ei trebuie să vadă dacă există o potrivire. 145 00:07:53,650 --> 00:07:56,460 Dacă există un meci, voi incrementa scorul meciului. 146 00:07:56,460 --> 00:08:00,480 Și dacă la sfârșitul scorul meciului care Am este mai bună decât curentul cel mai bun 147 00:08:00,480 --> 00:08:03,310 scor, atunci voi amintiți-vă că cel mai bun scor, 148 00:08:03,310 --> 00:08:05,820 iar acest lucru este cel mai bun meci pe care am. 149 00:08:05,820 --> 00:08:09,450 La final, indiferent de film stă în cel mai bun meci, 150 00:08:09,450 --> 00:08:12,580 care este cel mai aproape de Am fost în stare să vină. 151 00:08:12,580 --> 00:08:14,890 Astfel încât acestea de conținut pe sisteme de filtrare, 152 00:08:14,890 --> 00:08:16,900 toate au această structură de bază. 153 00:08:16,900 --> 00:08:20,910 Ei se bazeaza pe elementul în cauză și nimic 154 00:08:20,910 --> 00:08:24,590 despre oricare dintre preferințele utilizatorului. 155 00:08:24,590 --> 00:08:29,010 >> Celălalt mecanism pe care le folosim în scopul de a construi sisteme de recomandare 156 00:08:29,010 --> 00:08:31,790 este numit de filtrare de colaborare. 157 00:08:31,790 --> 00:08:36,520 Filtrarea de colaborare se bazează pe Nu calitățile obiectului în sine, 158 00:08:36,520 --> 00:08:40,010 dar modul în care oamenii, altele Utilizatorii care este, cum au 159 00:08:40,010 --> 00:08:43,370 a răspuns la aceleași obiecte. 160 00:08:43,370 --> 00:08:48,720 Deci, pentru a continua cu exemplul meu film, S-ar putea să ia o mulțime de prieteni mei 161 00:08:48,720 --> 00:08:53,180 și le sondaj cu privire la posibilitatea sau nu le-a plăcut anumite filme. 162 00:08:53,180 --> 00:08:56,560 Acum locuri diferite va genera aceste date în moduri diferite. 163 00:08:56,560 --> 00:08:59,630 Puteți sondaj direct dvs. utilizatori, sau ai putea doar 164 00:08:59,630 --> 00:09:03,120 vezi ce ei aleg dacă ești, de exemplu, Netflix. 165 00:09:03,120 --> 00:09:05,640 Care filme au ceas? 166 00:09:05,640 --> 00:09:08,670 >> S-ar putea pune la îndoială unele dintre meu prietenii de aici și de a afla 167 00:09:08,670 --> 00:09:12,910 că Jason a plăcut fiecare film el a văzut, nu este surprinzător acolo. 168 00:09:12,910 --> 00:09:15,590 Andy a plăcut doar Minions și mătușa Man. 169 00:09:15,590 --> 00:09:19,330 Sarah a placut Inside Out și Avengers, opusul lui Andy. 170 00:09:19,330 --> 00:09:22,200 Și Sam, ei bine, Sam a plăcut toate filmele super-erou, 171 00:09:22,200 --> 00:09:24,960 dar nici unul dintre filmele animate. 172 00:09:24,960 --> 00:09:30,630 >> Aș putea interoga apoi pentru un nou individ, un alt utilizator ca mine 173 00:09:30,630 --> 00:09:34,520 și de a pune, de asemenea, în cazul în care mi-a placut unul dintre aceste filme, 174 00:09:34,520 --> 00:09:38,600 poți face o predicție cu privire la care alte filme s-ar putea dori. 175 00:09:38,600 --> 00:09:41,890 Asta este, dacă mi-a plăcut în interiorul Out, care alte filme 176 00:09:41,890 --> 00:09:48,460 sunt eu susceptibile de a dori, de asemenea pentru a vedea bazat pe ceea ce au făcut oamenii similare? 177 00:09:48,460 --> 00:09:51,640 Asta este, voi merge printr-un Voi filtrează prin această listă 178 00:09:51,640 --> 00:09:54,520 și găsi doar persoanele care, de asemenea, plăcut 179 00:09:54,520 --> 00:09:57,680 Inside Out, care corespund preferințelor mele. 180 00:09:57,680 --> 00:10:00,824 Ei bine, asta înseamnă că Andy și Sam, ei nu-i plăcea Inside Out, 181 00:10:00,824 --> 00:10:02,240 așa că nu am de gând să le considere. 182 00:10:02,240 --> 00:10:06,130 Am de gând să scape de lor date pentru această comparație. 183 00:10:06,130 --> 00:10:09,750 >> Apoi m-am sa te uiti la ceea ce Jason și Sarah a crezut și Tally 184 00:10:09,750 --> 00:10:13,780 up care dintre filmele pe care le-au văzut că nu am făcut-o, dacă acestea au plăcut 185 00:10:13,780 --> 00:10:15,150 sau nu. 186 00:10:15,150 --> 00:10:17,820 Am putea conta doar în sus, să spunem de voturi. 187 00:10:17,820 --> 00:10:23,360 Deci Minions, de exemplu, ar putea avea un vota pentru el, pentru că Jason a plăcut. 188 00:10:23,360 --> 00:10:27,170 Atât Jason și Sarah placut Avengers, asa ca ar avea două voturi. 189 00:10:27,170 --> 00:10:30,700 Și doar Jason a placut Ant Man, asa ca ar primi un vot. 190 00:10:30,700 --> 00:10:34,870 Deci, dacă am avut de atunci de a recomanda pentru mine care dintre aceste filme 191 00:10:34,870 --> 00:10:41,470 S-ar putea fi cel mai probabil pentru a viziona, aș trebuie să aleagă Vârsta de Ultron: Avengers. 192 00:10:41,470 --> 00:10:44,490 >> Deci, pentru oricare dintre aceste sisteme, acum eu sunt, folosind 193 00:10:44,490 --> 00:10:49,260 date care nu a fost generat aproximativ film în sine, ci despre preferințele 194 00:10:49,260 --> 00:10:51,960 de la alți utilizatori. 195 00:10:51,960 --> 00:10:54,150 Acest lucru are anumite dificultăți, desigur. 196 00:10:54,150 --> 00:10:55,920 Ce se întâmplă dacă nu aveți nici alți utilizatori? 197 00:10:55,920 --> 00:10:58,770 Ei bine, asta se numește problemă de pornire. 198 00:10:58,770 --> 00:11:03,760 Trebuie să aveți unele Cantitatea de date înainte de a te 199 00:11:03,760 --> 00:11:07,560 capabil să înceapă a face aceste recomandări. 200 00:11:07,560 --> 00:11:10,940 Reversul este dată începe colectarea de date, 201 00:11:10,940 --> 00:11:13,870 Dacă aveți posibilitatea de a colecta mai mult și mai mult și mai multe date, 202 00:11:13,870 --> 00:11:17,850 veți obține bine și mai bine și recomandări mai bune. 203 00:11:17,850 --> 00:11:21,650 >> Acum am putea traduce acest lucru în cod, de asemenea. 204 00:11:21,650 --> 00:11:23,860 Putem defini un alt tip de structură, 205 00:11:23,860 --> 00:11:25,720 în acest caz, ne vom numi un utilizator. 206 00:11:25,720 --> 00:11:30,970 Și are caracteristici despre care filmele acest utilizator a placut. 207 00:11:30,970 --> 00:11:34,560 Ți le place Inside Out, Minions, Avengers, și Ant Man. 208 00:11:34,560 --> 00:11:36,660 Am putea genera apoi unele pseudocod să urmeze 209 00:11:36,660 --> 00:11:39,460 aceeași procedură pe care am folosit înainte. 210 00:11:39,460 --> 00:11:43,460 Că este, având în vedere o anumită utilizator X, să recomande un film 211 00:11:43,460 --> 00:11:46,107 că X ar putea plăcea. 212 00:11:46,107 --> 00:11:47,940 Putem merge prin și pentru toate filmele, 213 00:11:47,940 --> 00:11:51,410 putem inițializa un scor pentru că filmul să fie 0. 214 00:11:51,410 --> 00:11:54,080 Și apoi putem găsi toate de alți utilizatori care 215 00:11:54,080 --> 00:11:57,630 au aceleași preferințe ca X. 216 00:11:57,630 --> 00:11:59,990 Și apoi pentru fiecare film care le-a placut, 217 00:11:59,990 --> 00:12:02,340 vom incrementa scorul de acel film. 218 00:12:02,340 --> 00:12:05,010 Indiferent de film din capăt are cel mai mare scor, 219 00:12:05,010 --> 00:12:07,600 asta e cea pe care am ar trebui să recomande. 220 00:12:07,600 --> 00:12:09,890 >> Nici una dintre acest lucru este foarte obscur. 221 00:12:09,890 --> 00:12:11,600 Nimic din toate astea este o provocare. 222 00:12:11,600 --> 00:12:15,810 Acestea sunt toate algoritmi de bază care le-ar putea implementa astăzi. 223 00:12:15,810 --> 00:12:20,050 >> Acum, cu sisteme va recomandat reale, aveți o unele probleme. 224 00:12:20,050 --> 00:12:23,300 Ce se întâmplă dacă nu e nimeni care se potrivește exact preferințele? 225 00:12:23,300 --> 00:12:27,170 Ce se întâmplă dacă există utilizatori care sunt exact preferințele, 226 00:12:27,170 --> 00:12:30,480 dar apoi se abate drastic de la ceea ce iti place? 227 00:12:30,480 --> 00:12:36,210 Îmi place clasic Godzilla filme, dar soția mea nu. 228 00:12:36,210 --> 00:12:39,430 Imi place sa ma uit la ei, mi Contul Netflix le conține. 229 00:12:39,430 --> 00:12:41,800 Ei nu. 230 00:12:41,800 --> 00:12:45,230 Ce se întâmplă atunci când vom începe amestecarea date, cum ar fi acest lucru? 231 00:12:45,230 --> 00:12:47,690 Acestea sunt toate provocările pe care le puteți depăși, 232 00:12:47,690 --> 00:12:51,900 ei iau doar puțin algoritmi mai complexe. 233 00:12:51,900 --> 00:12:56,420 >> Acum, în lumea reală, care sunt de fapt operaționale, 234 00:12:56,420 --> 00:12:59,980 folosim de filtrare pe bază de conținut sau folosim de filtrare de colaborare? 235 00:12:59,980 --> 00:13:01,910 Iar răspunsul este folosim amândoi. 236 00:13:01,910 --> 00:13:06,350 Aproape toate marile utilizatorilor în acest caz, Amazon, Facebook, Netflix, 237 00:13:06,350 --> 00:13:11,200 Pandora, toate folosesc o combinație de aceste sisteme de recomandare diferite. 238 00:13:11,200 --> 00:13:16,520 Și când am combina alegerile din fiecare, le numim sisteme hibride. 239 00:13:16,520 --> 00:13:20,750 Ei într-un fel depinde de caracteristici ale obiectului în sine, 240 00:13:20,750 --> 00:13:24,710 și, în unele moduri în care depind de preferințele altor utilizatori. 241 00:13:24,710 --> 00:13:28,120 Aceste sisteme hibride, sunt o afacere mare, 242 00:13:28,120 --> 00:13:30,830 și sunt ceea ce este actual și astăzi. 243 00:13:30,830 --> 00:13:32,839 >> Deci, mulțumesc foarte mult pentru aderarea mine. 244 00:13:32,839 --> 00:13:35,380 Sper că am ajuns un pic bit de o înțelegere a ceea ce 245 00:13:35,380 --> 00:13:37,430 face aceste sisteme de lucru. 246 00:13:37,430 --> 00:13:41,980 Data viitoare când sunteți online, amintiți-vă că nu numai tu influențează alegerile, 247 00:13:41,980 --> 00:13:44,680 dar potential toată lumea, precum. 248 00:13:44,680 --> 00:13:46,480 Multumesc din nou. 249 00:13:46,480 --> 00:13:47,186