1 00:00:00,000 --> 00:00:03,416 >> [REPRODUCCIÓ DE MÚSICA] 2 00:00:03,416 --> 00:00:05,860 3 00:00:05,860 --> 00:00:08,180 >> CERVELL Scassellati: Benvingut a la sèrie CS50 AI. 4 00:00:08,180 --> 00:00:12,600 El meu nom és Scass, i avui anem per parlar dels sistemes de recomanació. 5 00:00:12,600 --> 00:00:15,780 Ara de recomanació sons sistemes com una mena d'estrany nom. 6 00:00:15,780 --> 00:00:18,630 Sona com potser el que hauria ser sistemes de recomanació, 7 00:00:18,630 --> 00:00:21,290 i que tipus d'acord amb vostè. 8 00:00:21,290 --> 00:00:26,110 Però aquests són els sistemes que ajuden seleccioneu coses similars sempre que sigui 9 00:00:26,110 --> 00:00:28,210 selecciona alguna cosa en línia. 10 00:00:28,210 --> 00:00:32,119 Netflix, per exemple suggerirà una altra pel·lícules que vostè pot ser que vulgueu veure. 11 00:00:32,119 --> 00:00:36,660 O Pandora suggerirà diferent cançons que és possible que vulgueu escoltar. 12 00:00:36,660 --> 00:00:40,940 Amazon li suggerirà quin tipus de Altres productes que et poden voler comprar. 13 00:00:40,940 --> 00:00:43,520 Facebook fins i tot suggerir alguns dels altres amics 14 00:00:43,520 --> 00:00:45,440 que és possible que vulgueu afegir. 15 00:00:45,440 --> 00:00:49,800 Cada un d'aquests sistemes funcionen amb el mateix tipus bàsic d'algorisme, 16 00:00:49,800 --> 00:00:52,520 i això és el que estem va a parlar avui. 17 00:00:52,520 --> 00:00:56,860 >> Ara bé, aquests algoritmes són sorprenentment grans empreses. 18 00:00:56,860 --> 00:01:01,130 Netflix fa uns anys en 2009 va oferir un $ 1.000.000 19 00:01:01,130 --> 00:01:07,240 premi si vostè podria millorar la seva sistema de recomanació en només un 10%. 20 00:01:07,240 --> 00:01:11,960 Que el 10%, però, representa una quantitat substancial dels negocis. 21 00:01:11,960 --> 00:01:15,330 Les estimacions són difícils de aconseguir, però moltes persones 22 00:01:15,330 --> 00:01:19,050 Creiem que aquestes recomanacions sistemes per a una compra en línia 23 00:01:19,050 --> 00:01:25,729 sistema com Amazon condueixen a algun lloc entre 10% i 25% majors ingressos. 24 00:01:25,729 --> 00:01:27,770 Així que vostè pot imaginar el tipus de volum que ets 25 00:01:27,770 --> 00:01:32,860 parlant de quan pensem en fins i tot aquests petits algoritmes. 26 00:01:32,860 --> 00:01:35,200 >> Així que anem a obtenir alguns exemples. 27 00:01:35,200 --> 00:01:38,460 Com és que aquests sistemes funcionen realment? 28 00:01:38,460 --> 00:01:40,773 No són dos bàsica tipus d'algoritmes que 29 00:01:40,773 --> 00:01:45,050 estan en joc quan parlem de recomanacions de generació. 30 00:01:45,050 --> 00:01:48,650 Les primeres es denominen filtrat basat en contingut. 31 00:01:48,650 --> 00:01:53,410 I el filtrat basat en contingut es basa sobre similituds entre els elements 32 00:01:53,410 --> 00:02:00,370 a si mateixos, és a dir, entre dues pel·lícules o dues cançons o dos articles comprats. 33 00:02:00,370 --> 00:02:03,190 Utilitzarem pel·lícules com un exemple, però això 34 00:02:03,190 --> 00:02:07,850 podria aplicar-se, en realitat, a qualsevol tipus d'objecte que estem buscant. 35 00:02:07,850 --> 00:02:13,330 >> Així que si penso en alguns pel·lícules de l'any passat, 36 00:02:13,330 --> 00:02:16,799 Vaig veure Inside Out amb meus fills, els va encantar. 37 00:02:16,799 --> 00:02:17,840 Però també vam tenir una elecció. 38 00:02:17,840 --> 00:02:21,350 Podríem haver anat a veure els esbirros, podríem vist Edat d'Ultron, 39 00:02:21,350 --> 00:02:24,850 o podríem haver vist Home Formiga en els teatres. 40 00:02:24,850 --> 00:02:27,580 >> Per a qualsevol d'aquests pel·lícules, podríem imaginar 41 00:02:27,580 --> 00:02:33,320 la generació d'una llista de característiques o qualitats dels diferents pel·lícules. 42 00:02:33,320 --> 00:02:37,190 Així, per exemple, podria considerar quines d'aquestes pel·lícules estan animats. 43 00:02:37,190 --> 00:02:39,960 Bé, tant Inside Out i esbirros estan animats. 44 00:02:39,960 --> 00:02:44,140 Ni l'edat ni d'Ultron Home Formiga són pel·lícules animades. 45 00:02:44,140 --> 00:02:47,040 I jo podia imaginar edifici una estructura, una taula que 46 00:02:47,040 --> 00:02:49,440 enumera cadascuna d'aquestes propietats. 47 00:02:49,440 --> 00:02:51,790 Estan animats o no? 48 00:02:51,790 --> 00:02:54,780 Llavors jo podria afegir més característiques a aquesta taula 49 00:02:54,780 --> 00:02:58,380 mitjançant l'addició de més files en aquesta estructura. 50 00:02:58,380 --> 00:03:00,970 Jo podria preguntar si No són pel·lícules de Marvel. 51 00:03:00,970 --> 00:03:04,010 Bé, Inside Out i Minions No són les pel·lícules de Marvel, 52 00:03:04,010 --> 00:03:06,715 Edat d'Ultron i Ant home certament ho són. 53 00:03:06,715 --> 00:03:09,100 >> I jo podria fer qualsevol tipus de diferents qualitats 54 00:03:09,100 --> 00:03:12,080 que jo volia, qualsevol tipus de característiques que podria ser important per a mi. 55 00:03:12,080 --> 00:03:13,440 Tenen un super dolent? 56 00:03:13,440 --> 00:03:16,700 Bé, no hi ha súper vilà a l'interior , Però n'hi ha en Minions 57 00:03:16,700 --> 00:03:19,990 i en, òbviament, la dues pel·lícules de superherois. 58 00:03:19,990 --> 00:03:23,900 >> Jo també podria preguntar-li coses com, bé, no passen la prova Bechdel? 59 00:03:23,900 --> 00:03:27,280 Hi ha dos nomenats personatges femenins que 60 00:03:27,280 --> 00:03:30,550 passar algun quantitat significativa de temps tenir una conversa que 61 00:03:30,550 --> 00:03:34,400 no involucrar els homes en l'elenc? 62 00:03:34,400 --> 00:03:39,870 Bé, en aquest cas, Inside Out passa la prova, Minions falla, Age of Ultron 63 00:03:39,870 --> 00:03:42,990 passa la prova, i no Ant Man. 64 00:03:42,990 --> 00:03:45,020 Qualsevol d'aquestes característiques El que podia pensar 65 00:03:45,020 --> 00:03:48,660 com importants per a algunes persones. 66 00:03:48,660 --> 00:03:52,000 >> Jo també podria preguntar-li coses com són Hi ha alguna gent en aquestes pel·lícules que 67 00:03:52,000 --> 00:03:57,190 són ex alumnes de diguem, Parcs i Recreació, un dels meus programes favorits. 68 00:03:57,190 --> 00:04:00,540 Bé, Inside Out compta amb Amy Poehler, que és una d'Antics Alumnes. 69 00:04:00,540 --> 00:04:01,530 Això compte. 70 00:04:01,530 --> 00:04:04,110 Jon Hamm estava en Minions. 71 00:04:04,110 --> 00:04:08,600 Paul Rudd estava en Ant Man, però ningú a Age of Ultron era a Parcs i Req 72 00:04:08,600 --> 00:04:10,150 tant be. 73 00:04:10,150 --> 00:04:12,990 Així que puc construir aquesta llista de característiques, i que van poder realment 74 00:04:12,990 --> 00:04:14,710 ser qualsevol cosa sobre les pel·lícules. 75 00:04:14,710 --> 00:04:17,329 Podrien ser d'allò relació d'aspecte que es va rodar a, 76 00:04:17,329 --> 00:04:21,630 que podria ser el nombre d'escons que venut en el primer cap de setmana. 77 00:04:21,630 --> 00:04:25,630 Qualsevol característica que vull gènere que puc posar en aquesta taula. 78 00:04:25,630 --> 00:04:29,600 >> Ara, en aquest cas, he construït tot tipus de valors de lingots, 79 00:04:29,600 --> 00:04:33,700 si o no, passar o fallar, però podrien ser qualsevol cosa. 80 00:04:33,700 --> 00:04:36,690 Podrien ser valors arbitraris. 81 00:04:36,690 --> 00:04:39,070 Per al filtrat de continguts basat, el que farem 82 00:04:39,070 --> 00:04:42,810 és que tindrem en compte dues columnes d'aquesta taula 83 00:04:42,810 --> 00:04:45,660 i veure el similars que són. 84 00:04:45,660 --> 00:04:48,640 Així, per exemple, si va anar a veure Inside Out, 85 00:04:48,640 --> 00:04:53,640 Jo podria preguntar, quines són les altres pel·lícules que podria estar disposat a anar a veure. 86 00:04:53,640 --> 00:04:56,890 És a dir, que es disposa a gastar els meus diners per anar a veure. 87 00:04:56,890 --> 00:05:00,310 I puc comparar això amb només prendre les dues columnes, un des de dins cap a fora 88 00:05:00,310 --> 00:05:03,300 i un qualsevol dels altres pel·lícules, i només veure 89 00:05:03,300 --> 00:05:06,210 quants del seu partit de característiques. 90 00:05:06,210 --> 00:05:09,660 Així que si comparo Inside Out amb esbirros, bé, hi ha 91 00:05:09,660 --> 00:05:10,910 tres coses aquí que els partits. 92 00:05:10,910 --> 00:05:16,200 Tots dos estan animats, cap dels dos són les pel·lícules de Marvel, i dos d'ells 93 00:05:16,200 --> 00:05:18,420 tenir Parcs i Req exalumnes. 94 00:05:18,420 --> 00:05:20,420 Així que podria comptar fins a com molts partits hi va haver, 95 00:05:20,420 --> 00:05:22,640 i en aquest cas no hi hauria tres. 96 00:05:22,640 --> 00:05:26,450 >> Doncs si jo comparo Inside Out amb diguem Edat d'Ultron, 97 00:05:26,450 --> 00:05:28,430 Puc mirar avall a la llista i dir, bé, hi ha 98 00:05:28,430 --> 00:05:30,140 només una cosa que coincideix allà. 99 00:05:30,140 --> 00:05:34,560 Tots dos passen la prova de Bechtel, per la qual que hi haurà una puntuació d'un. 100 00:05:34,560 --> 00:05:36,770 I entre Inside Out i l'Home Formiga, una altra vegada 101 00:05:36,770 --> 00:05:41,420 pot comparar línia per línia el nombre de coses coincideixen entre ells dos. 102 00:05:41,420 --> 00:05:43,060 Bé, un ANIMADA, un no és. 103 00:05:43,060 --> 00:05:44,970 Un és una pel·lícula de Marvel, un no és. 104 00:05:44,970 --> 00:05:47,280 Un té un súper vilà, l'altra no. 105 00:05:47,280 --> 00:05:49,480 Es passa la Bechtel prova, una falla, 106 00:05:49,480 --> 00:05:54,450 però tots dos tenen Parcs i Req alumnes, així que de nou, obté una puntuació d'un. 107 00:05:54,450 --> 00:05:58,300 >> Així que si jo estàvem buscant pel·lícules que eren similars a Inside Out, 108 00:05:58,300 --> 00:06:02,170 Jo podria buscar les pel·lícules que tenen la puntuació més alt dins d'aquest contingut 109 00:06:02,170 --> 00:06:03,952 esquema de filtrat. 110 00:06:03,952 --> 00:06:05,660 Així que en aquest cas, consideraria Minions 111 00:06:05,660 --> 00:06:08,330 per estar més a prop i més probable que sigui una cosa 112 00:06:08,330 --> 00:06:13,250 que anava a gastar diners per veure que era d'Ultron o l'Home Formiga. 113 00:06:13,250 --> 00:06:16,150 >> Basada Aquests continguts sistemes de filtrat es basen simplement 114 00:06:16,150 --> 00:06:18,670 en les propietats de les pel·lícules, i pel que 115 00:06:18,670 --> 00:06:21,930 pot construir aquests només coneixent alguna cosa sobre els productes 116 00:06:21,930 --> 00:06:23,500 que tinc. 117 00:06:23,500 --> 00:06:26,050 Puc utilitzar qualsevol tipus de característiques que m'agradaria, 118 00:06:26,050 --> 00:06:28,400 i puc construir més característiques complexes que 119 00:06:28,400 --> 00:06:33,060 involucrar la prova més complexa d'una qualitat a mesura que avanço. 120 00:06:33,060 --> 00:06:39,080 De fet, fins i tot puc veure aquesta taula no com un objecte estàtic, 121 00:06:39,080 --> 00:06:43,110 sinó més aviat com sent dimensions dins d'un espai d'estat major. 122 00:06:43,110 --> 00:06:46,295 I puc començar a parlar de la distàncies entre diferents pel·lícules. 123 00:06:46,295 --> 00:06:49,300 124 00:06:49,300 --> 00:06:51,050 Aquestes són totes les coses que sabem com 125 00:06:51,050 --> 00:06:55,860 fer ús dels tipus d'estructures de dades que ja hem vist al CS50. 126 00:06:55,860 --> 00:06:59,180 Així que em podia imaginar edifici una estructura de dades per a una pel·lícula. 127 00:06:59,180 --> 00:07:02,390 Hi ha una estructura que tinc construïda anomenada pel·lícula, 128 00:07:02,390 --> 00:07:04,369 i té cinc entrades booleanes en el mateix. 129 00:07:04,369 --> 00:07:07,160 Està animat, ¿és una meravella pel·lícula, ¿té un super dolent, 130 00:07:07,160 --> 00:07:11,047 Què passa la prova Bechdel, i hi ha Parcs i Rec alumnes en ella? 131 00:07:11,047 --> 00:07:12,880 I cada un d'ells és un estructura de dades que I 132 00:07:12,880 --> 00:07:16,330 pot ocupar per a aquesta pel·lícula particular. 133 00:07:16,330 --> 00:07:20,090 >> A continuació, calcular si dos pel·lícules són similars o no, 134 00:07:20,090 --> 00:07:23,330 que la seva puntuació és, que podia construir un cos de pseudo-codi que 135 00:07:23,330 --> 00:07:25,120 genera aquesta mateixa funció. 136 00:07:25,120 --> 00:07:30,100 És a dir, donat una mica de pel·lícula M1, que pugui trobar la pel·lícula més semblant a ella 137 00:07:30,100 --> 00:07:32,430 seguint el pseudocodi. 138 00:07:32,430 --> 00:07:37,040 Considero que és el millor sistema que he trobat anotant, 139 00:07:37,040 --> 00:07:39,920 la millor comparació que he trobat. 140 00:07:39,920 --> 00:07:41,890 Per cada altra pel·lícula Vaig a anar a través, 141 00:07:41,890 --> 00:07:44,920 Vaig a posar una puntuació partit igual a 0. 142 00:07:44,920 --> 00:07:47,920 I vaig a anar a través d'aquesta pel·lícula, un M1, la pel·lícula 143 00:07:47,920 --> 00:07:51,500 Vaig començar amb, ho comprovaré tots i cada funció 144 00:07:51,500 --> 00:07:53,650 que tenen a veure si hi ha un partit. 145 00:07:53,650 --> 00:07:56,460 Si hi ha un partit, vaig a incrementar el resultat del partit. 146 00:07:56,460 --> 00:08:00,480 I si al final el resultat del partit que He és millor que l'actual millor 147 00:08:00,480 --> 00:08:03,310 anotar, llavors vaig a recordar que la millor puntuació, 148 00:08:03,310 --> 00:08:05,820 i aquest és el millor partit que tinc. 149 00:08:05,820 --> 00:08:09,450 Al final, sigui quina sigui la pel·lícula seu al millor partit, 150 00:08:09,450 --> 00:08:12,580 això és el més proper He estat capaç d'arribar. 151 00:08:12,580 --> 00:08:14,890 Així basa aquests continguts sistemes de filtrat, 152 00:08:14,890 --> 00:08:16,900 tots ells tenen aquesta estructura bàsica. 153 00:08:16,900 --> 00:08:20,910 Es basen en l'article en qüestió i res 154 00:08:20,910 --> 00:08:24,590 sobre qualsevol de les preferències de l'usuari. 155 00:08:24,590 --> 00:08:29,010 >> L'altre mecanisme que utilitzem en per construir sistemes de recomanació 156 00:08:29,010 --> 00:08:31,790 es diu filtratge col·laboratiu. 157 00:08:31,790 --> 00:08:36,520 Filtratge col·laboratiu es basa en no les qualitats de l'objecte en si mateix, 158 00:08:36,520 --> 00:08:40,010 però com les persones, altres usuaris, és a dir, com han 159 00:08:40,010 --> 00:08:43,370 respost a aquests mateixos objectes. 160 00:08:43,370 --> 00:08:48,720 Així que per continuar amb el meu exemple de la pel·lícula, Jo podria prendre un munt dels meus amics 161 00:08:48,720 --> 00:08:53,180 i estudiar sobre si és o No els agradava pel·lícules particulars. 162 00:08:53,180 --> 00:08:56,560 Ara diferents llocs generaran aquestes dades de diferents maneres. 163 00:08:56,560 --> 00:08:59,630 Vostè pot examinar directament al seu usuaris, o vostè podria 164 00:08:59,630 --> 00:09:03,120 veure el que decideixen si vostè és, per exemple Netflix. 165 00:09:03,120 --> 00:09:05,640 Què pel·lícules tenien que veuen? 166 00:09:05,640 --> 00:09:08,670 >> Jo podria qüestionar una mica de la meva amics aquí i saber 167 00:09:08,670 --> 00:09:12,910 que Jason li agrada cada pel·lícula que va veure, no sorprenent allà. 168 00:09:12,910 --> 00:09:15,590 Andy només li agrada Minions i tia home. 169 00:09:15,590 --> 00:09:19,330 Sarah li agrada Inside Out i Venjadors, el contrari d'Andy. 170 00:09:19,330 --> 00:09:22,200 I Sam, bé, Sam li agrada totes les pel·lícules de superherois, 171 00:09:22,200 --> 00:09:24,960 però cap de les pel·lícules animades. 172 00:09:24,960 --> 00:09:30,630 >> Llavors jo podria preguntar per alguna nova individual, algun altre usuari com jo 173 00:09:30,630 --> 00:09:34,520 i demanar, bé, si m'ha agradat d'aquestes pel·lícules, 174 00:09:34,520 --> 00:09:38,600 es pot fer una predicció sobre que altres pel·lícules que podria agradar. 175 00:09:38,600 --> 00:09:41,890 És a dir, si m'agradava l'interior Out, que altres pel·lícules 176 00:09:41,890 --> 00:09:48,460 estic probable que també vulgui veure en base al que la gent feia semblants? 177 00:09:48,460 --> 00:09:51,640 És a dir, vaig a anar a través d'un Vaig a filtrar a través d'aquesta llista 178 00:09:51,640 --> 00:09:54,520 i trobar només el persones que també els agradava 179 00:09:54,520 --> 00:09:57,680 Inside Out, que coincidia amb les meves preferències. 180 00:09:57,680 --> 00:10:00,824 Bé, això vol dir que Andy i Sam, que no li agradava Inside Out, 181 00:10:00,824 --> 00:10:02,240 així que no vaig a considerar-los. 182 00:10:02,240 --> 00:10:06,130 Vaig a desfer del seu les dades per a aquesta comparació. 183 00:10:06,130 --> 00:10:09,750 >> Llavors puc veure el que Jason i Sarah va pensar i recompte 184 00:10:09,750 --> 00:10:13,780 fins que de les pel·lícules que veien que no ho vaig fer, si els van agradar 185 00:10:13,780 --> 00:10:15,150 o no. 186 00:10:15,150 --> 00:10:17,820 Jo només podia comptar fins, diguem vots. 187 00:10:17,820 --> 00:10:23,360 Així Minions, per exemple podria tenir-ne un votar per ella, ja que Jason li agradava. 188 00:10:23,360 --> 00:10:27,170 Tant Jason i Sarah li agrada Venjadors, per la qual cosa tindria dos vots. 189 00:10:27,170 --> 00:10:30,700 I només Jason li agrada Ant Man, per la qual cosa seria aconseguir un vot. 190 00:10:30,700 --> 00:10:34,870 Així que si hagués de després recomanar per mi mateix quina d'aquestes pel·lícules 191 00:10:34,870 --> 00:10:41,470 Jo podria ser més propensos a veure, ho faria de triar Edat d'Ultron: Venjadors. 192 00:10:41,470 --> 00:10:44,490 >> Així que per a qualsevol d'aquests sistemes, ara estic fent servir 193 00:10:44,490 --> 00:10:49,260 dades que no va ser generada per la pel·lícula en si, sinó de les preferències 194 00:10:49,260 --> 00:10:51,960 d'altres usuaris. 195 00:10:51,960 --> 00:10:54,150 Això té algunes dificultats, és clar. 196 00:10:54,150 --> 00:10:55,920 Què passa si vostè no té cap altre usuari? 197 00:10:55,920 --> 00:10:58,770 Bé, això es diu problema d'inici. 198 00:10:58,770 --> 00:11:03,760 Has de tenir una mica de quantitat de dades abans que estigui 199 00:11:03,760 --> 00:11:07,560 capaç de començar a fer aquestes recomanacions. 200 00:11:07,560 --> 00:11:10,940 L'altra cara d'això és un cop de començar a recollir dades, 201 00:11:10,940 --> 00:11:13,870 si vostè pot obtenir més i més i més dades, 202 00:11:13,870 --> 00:11:17,850 obtindrà millor i millor i millors recomanacions. 203 00:11:17,850 --> 00:11:21,650 >> Ara podríem traduir això en codi. 204 00:11:21,650 --> 00:11:23,860 Podem definir una diferent tipus d'estructura, 205 00:11:23,860 --> 00:11:25,720 en aquest cas ho anem a trucar a un usuari. 206 00:11:25,720 --> 00:11:30,970 I es va posar sobre les característiques quines pel·lícules aquest usuari agradaven. 207 00:11:30,970 --> 00:11:34,560 Els va agradar Inside Out, Minions, venjadors, i l'Home Formiga. 208 00:11:34,560 --> 00:11:36,660 Llavors podríem generar alguns pseudocodi per seguir 209 00:11:36,660 --> 00:11:39,460 el mateix procediment que he fet servir abans. 210 00:11:39,460 --> 00:11:43,460 És a dir, donat un determinat usuari x, anem a recomanar una pel·lícula 211 00:11:43,460 --> 00:11:46,107 que x pot agradar. 212 00:11:46,107 --> 00:11:47,940 Podem anar a través i per a totes les pel·lícules, 213 00:11:47,940 --> 00:11:51,410 podem inicialitzar una puntuació per a aquesta pel·lícula sigui 0. 214 00:11:51,410 --> 00:11:54,080 I llavors podem trobar tot dels altres usuaris que 215 00:11:54,080 --> 00:11:57,630 tenir les mateixes preferències que x. 216 00:11:57,630 --> 00:11:59,990 I a continuació, per a cada pel·lícula que els agradava, 217 00:11:59,990 --> 00:12:02,340 incrementarem la puntuació d'aquesta pel·lícula. 218 00:12:02,340 --> 00:12:05,010 Sigui quina sigui la pel·lícula en el extrem té la puntuació més alta, 219 00:12:05,010 --> 00:12:07,600 aquesta és la que jo hauria de recomanar. 220 00:12:07,600 --> 00:12:09,890 >> Res d'això és realment fosca. 221 00:12:09,890 --> 00:12:11,600 Res d'això és un repte. 222 00:12:11,600 --> 00:12:15,810 Aquests són tots els algoritmes bàsics que es pot aplicar avui. 223 00:12:15,810 --> 00:12:20,050 >> Ara, amb els sistemes de recomanació de béns, es troba amb alguns problemes. 224 00:12:20,050 --> 00:12:23,300 Què passa si no hi ha ningú que coincideix exactament amb les seves preferències? 225 00:12:23,300 --> 00:12:27,170 Què passa si hi ha usuaris que són exactament les seves preferències, 226 00:12:27,170 --> 00:12:30,480 però llavors desviar dràsticament del que t'agrada? 227 00:12:30,480 --> 00:12:36,210 M'agrada clàssic Godzilla pel·lícules, però la meva dona no ho fa. 228 00:12:36,210 --> 00:12:39,430 M'agrada veure'ls, el meu Compte de Netflix els conté. 229 00:12:39,430 --> 00:12:41,800 De La seva no. 230 00:12:41,800 --> 00:12:45,230 Què passa quan comencem barreja de dades d'aquest tipus? 231 00:12:45,230 --> 00:12:47,690 Aquests són tots els desafiaments que pot superar, 232 00:12:47,690 --> 00:12:51,900 que acaba de prendre una mica algoritmes més complexos. 233 00:12:51,900 --> 00:12:56,420 >> Ara, en el món real, el que són en realitat operativa, 234 00:12:56,420 --> 00:12:59,980 Com fem servir el filtrat basat en contingut o Com fem servir filtratge col·laboratiu? 235 00:12:59,980 --> 00:13:01,910 I la resposta és que utilitzem tots dos. 236 00:13:01,910 --> 00:13:06,350 Gairebé tots els principals usuaris en aquest cas, Amazon, Facebook, Netflix, 237 00:13:06,350 --> 00:13:11,200 Pandora, tots ells utilitzen una combinació de aquests diferents sistemes de recomanació. 238 00:13:11,200 --> 00:13:16,520 I quan combinem les opcions de cadascun, els anomenem sistemes híbrids. 239 00:13:16,520 --> 00:13:20,750 Ells d'alguna manera depenen de la característiques de l'objecte en si mateix, 240 00:13:20,750 --> 00:13:24,710 i d'alguna manera depenen de les preferències dels altres usuaris. 241 00:13:24,710 --> 00:13:28,120 Aquests sistemes híbrids, són un gran negoci, 242 00:13:28,120 --> 00:13:30,830 i són el que està vigent en l'actualitat. 243 00:13:30,830 --> 00:13:32,839 >> Així que moltes gràcies per acompanyar-me. 244 00:13:32,839 --> 00:13:35,380 Espero que hagis aconseguit una mica mica d'una comprensió del 245 00:13:35,380 --> 00:13:37,430 fa que aquests sistemes de treball. 246 00:13:37,430 --> 00:13:41,980 La propera vegada que estiguis en línia, recorda que No només li influir en les seves decisions, 247 00:13:41,980 --> 00:13:44,680 però potencialment tot el món és així. 248 00:13:44,680 --> 00:13:46,480 Gràcies de nou. 249 00:13:46,480 --> 00:13:47,186