1 00:00:00,000 --> 00:00:03,416 >> [REPRODUCCIÓN DE MÚSICA] 2 00:00:03,416 --> 00:00:05,860 3 00:00:05,860 --> 00:00:08,180 >> CEREBRO Scassellati: Bienvenido a la serie CS50 AI. 4 00:00:08,180 --> 00:00:12,600 Mi nombre es Scass, y hoy vamos para hablar de los sistemas de recomendación. 5 00:00:12,600 --> 00:00:15,780 Ahora de recomendación sonidos sistemas como una especie de extraño nombre. 6 00:00:15,780 --> 00:00:18,630 Suena como tal vez lo que debería ser sistemas de recomendación, 7 00:00:18,630 --> 00:00:21,290 y que tipo de acuerdo con usted. 8 00:00:21,290 --> 00:00:26,110 Pero estos son los sistemas que ayudan seleccione cosas similares siempre que sea 9 00:00:26,110 --> 00:00:28,210 selecciona algo en línea. 10 00:00:28,210 --> 00:00:32,119 Netflix, por ejemplo sugerirá otra películas que usted puede ser que desee ver. 11 00:00:32,119 --> 00:00:36,660 O Pandora sugerirá diferente canciones que es posible que desee escuchar. 12 00:00:36,660 --> 00:00:40,940 Amazon le sugerirá qué tipo de Otros productos que te pueden querer comprar. 13 00:00:40,940 --> 00:00:43,520 Facebook incluso sugerir algunos de los otros amigos 14 00:00:43,520 --> 00:00:45,440 que es posible que desee agregar. 15 00:00:45,440 --> 00:00:49,800 Cada uno de estos sistemas funcionan con el mismo tipo básico de algoritmo, 16 00:00:49,800 --> 00:00:52,520 y eso es lo que estamos va a hablar hoy. 17 00:00:52,520 --> 00:00:56,860 >> Ahora bien, estos algoritmos son sorprendentemente grandes empresas. 18 00:00:56,860 --> 00:01:01,130 Netflix hace unos años en 2009 ofreció un $ 1.000.000 19 00:01:01,130 --> 00:01:07,240 premio si usted podría mejorar su sistema de recomendación en sólo un 10%. 20 00:01:07,240 --> 00:01:11,960 Que el 10%, sin embargo, representa una cantidad sustancial de los negocios. 21 00:01:11,960 --> 00:01:15,330 Las estimaciones son difíciles de conseguir, pero muchas personas 22 00:01:15,330 --> 00:01:19,050 Creemos que estas recomendaciones sistemas para una compra en línea 23 00:01:19,050 --> 00:01:25,729 sistema como Amazon conducen a alguna parte entre 10% y 25% mayores ingresos. 24 00:01:25,729 --> 00:01:27,770 Así que usted puede imaginar el tipo de volumen que eres 25 00:01:27,770 --> 00:01:32,860 hablando de cuando pensamos en incluso estos pequeños algoritmos. 26 00:01:32,860 --> 00:01:35,200 >> Así que vamos a obtener algunos ejemplos. 27 00:01:35,200 --> 00:01:38,460 ¿Cómo es que estos sistemas funcionan realmente? 28 00:01:38,460 --> 00:01:40,773 No son dos básica tipos de algoritmos que 29 00:01:40,773 --> 00:01:45,050 están en juego cuando hablamos de recomendaciones de generación. 30 00:01:45,050 --> 00:01:48,650 Las primeras se denominan filtrado basado en contenido. 31 00:01:48,650 --> 00:01:53,410 Y el filtrado basado en contenido se basa sobre similitudes entre los elementos 32 00:01:53,410 --> 00:02:00,370 a sí mismos, es decir, entre dos películas o dos canciones o dos artículos comprados. 33 00:02:00,370 --> 00:02:03,190 Vamos a utilizar películas como un ejemplo, pero esto 34 00:02:03,190 --> 00:02:07,850 podría aplicarse, en realidad, a cualquier tipo de objeto que estamos buscando. 35 00:02:07,850 --> 00:02:13,330 >> Así que si pienso en algunos películas del año pasado, 36 00:02:13,330 --> 00:02:16,799 Vi Inside Out con mis hijos, les encantó. 37 00:02:16,799 --> 00:02:17,840 Pero también tuvimos una elección. 38 00:02:17,840 --> 00:02:21,350 Podríamos haber ido a ver a los esbirros, podríamos visto Edad de Ultron, 39 00:02:21,350 --> 00:02:24,850 o podríamos haber visto Hombre Hormiga en los teatros. 40 00:02:24,850 --> 00:02:27,580 >> Para cualquiera de estos películas, podríamos imaginar 41 00:02:27,580 --> 00:02:33,320 la generación de una lista de características o cualidades de los diferentes películas. 42 00:02:33,320 --> 00:02:37,190 Así, por ejemplo, podría considerar cuáles de esas películas están animados. 43 00:02:37,190 --> 00:02:39,960 Bueno, tanto Inside Out y esbirros están animados. 44 00:02:39,960 --> 00:02:44,140 Ni la edad ni de Ultron Hombre Hormiga son películas animadas. 45 00:02:44,140 --> 00:02:47,040 Y yo podía imaginar edificio una estructura, una tabla que 46 00:02:47,040 --> 00:02:49,440 enumera cada una de estas propiedades. 47 00:02:49,440 --> 00:02:51,790 Están animados o no? 48 00:02:51,790 --> 00:02:54,780 Entonces yo podría añadir más características a esta tabla 49 00:02:54,780 --> 00:02:58,380 mediante la adición de más filas en esta estructura. 50 00:02:58,380 --> 00:03:00,970 Yo podría preguntar si No son películas de Marvel. 51 00:03:00,970 --> 00:03:04,010 Bueno, Inside Out y Minions No son las películas de Marvel, 52 00:03:04,010 --> 00:03:06,715 Edad de Ultron y Ant hombre ciertamente lo son. 53 00:03:06,715 --> 00:03:09,100 >> Y yo podría hacer cualquier tipo de diferentes calidades 54 00:03:09,100 --> 00:03:12,080 que yo quería, cualquier tipo de características que podría ser importante para mí. 55 00:03:12,080 --> 00:03:13,440 ¿Tienen un super villano? 56 00:03:13,440 --> 00:03:16,700 Bueno, no hay súper villano en el interior , Pero los hay en Minions 57 00:03:16,700 --> 00:03:19,990 y en, obviamente, la dos películas de superhéroes. 58 00:03:19,990 --> 00:03:23,900 >> Yo también podría preguntarle cosas como, bueno, no pasan la prueba Bechdel? 59 00:03:23,900 --> 00:03:27,280 ¿Hay dos nombrados personajes femeninos que 60 00:03:27,280 --> 00:03:30,550 pasar algún cantidad significativa de tiempo tener una conversación que 61 00:03:30,550 --> 00:03:34,400 no involucrar a los hombres en el elenco? 62 00:03:34,400 --> 00:03:39,870 Bueno, en este caso, Inside Out pasa la prueba, Minions falla, Age of Ultron 63 00:03:39,870 --> 00:03:42,990 pasa la prueba, y no Ant Man. 64 00:03:42,990 --> 00:03:45,020 Cualquiera de estas características Lo que podía pensar 65 00:03:45,020 --> 00:03:48,660 como importantes para algunas personas. 66 00:03:48,660 --> 00:03:52,000 >> Yo también podría preguntarle cosas como son Hay alguna gente en estas películas que 67 00:03:52,000 --> 00:03:57,190 son ex alumnos de digamos, Parques y Recreación, uno de mis programas favoritos. 68 00:03:57,190 --> 00:04:00,540 Bueno, Inside Out cuenta con Amy Poehler, que es una de Antiguos Alumnos. 69 00:04:00,540 --> 00:04:01,530 Eso cuenta. 70 00:04:01,530 --> 00:04:04,110 Jon Hamm estaba en Minions. 71 00:04:04,110 --> 00:04:08,600 Paul Rudd estaba en Ant Man, pero nadie en Age of Ultron estaba en Parques y Req 72 00:04:08,600 --> 00:04:10,150 así como. 73 00:04:10,150 --> 00:04:12,990 Así que puedo construir esta lista de características, y que pudieron realmente 74 00:04:12,990 --> 00:04:14,710 ser cualquier cosa sobre las películas. 75 00:04:14,710 --> 00:04:17,329 Podrían ser de lo relación de aspecto que se rodó en, 76 00:04:17,329 --> 00:04:21,630 que podría ser el número de escaños que vendido en su primer fin de semana. 77 00:04:21,630 --> 00:04:25,630 Cualquier característica que quiero genero que puedo poner en esta tabla. 78 00:04:25,630 --> 00:04:29,600 >> Ahora, en este caso, he construido todo tipo de valores de lingotes, 79 00:04:29,600 --> 00:04:33,700 sí o no, pasar o fallar, pero podrían ser cualquier cosa. 80 00:04:33,700 --> 00:04:36,690 Podrían ser valores arbitrarios. 81 00:04:36,690 --> 00:04:39,070 Para el filtrado de contenidos basado, lo que vamos a hacer 82 00:04:39,070 --> 00:04:42,810 es que vamos a tener en cuenta dos columnas de esta tabla 83 00:04:42,810 --> 00:04:45,660 y ver lo similares que son. 84 00:04:45,660 --> 00:04:48,640 Así, por ejemplo, si fue a ver Inside Out, 85 00:04:48,640 --> 00:04:53,640 Yo podría preguntar, ¿cuáles son las otras películas que podría estar dispuesto a ir a ver. 86 00:04:53,640 --> 00:04:56,890 Es decir, lo dispuesto a gastar mi dinero para ir a ver. 87 00:04:56,890 --> 00:05:00,310 Y puedo comparar esto con sólo tomar las dos columnas, uno desde adentro hacia afuera 88 00:05:00,310 --> 00:05:03,300 y uno de cualquiera de los otras películas, y sólo ver 89 00:05:03,300 --> 00:05:06,210 cuántos de su partido de características. 90 00:05:06,210 --> 00:05:09,660 Así que si comparo Inside Out con esbirros, bueno, hay 91 00:05:09,660 --> 00:05:10,910 tres cosas aquí que los partidos. 92 00:05:10,910 --> 00:05:16,200 Ambos están animados, ninguno de los dos son las películas de Marvel, y dos de ellos 93 00:05:16,200 --> 00:05:18,420 tener Parques y Req ex alumnos. 94 00:05:18,420 --> 00:05:20,420 Así que podría contar hasta cómo muchos partidos hubo, 95 00:05:20,420 --> 00:05:22,640 y en este caso no habría tres. 96 00:05:22,640 --> 00:05:26,450 >> Pues si yo comparo Inside Out con digamos Edad de Ultron, 97 00:05:26,450 --> 00:05:28,430 Puedo mirar abajo en la lista y decir, bueno, hay 98 00:05:28,430 --> 00:05:30,140 sólo una cosa que coincide allí. 99 00:05:30,140 --> 00:05:34,560 Ambos pasan la prueba de Bechtel, por lo que va a haber una puntuación de uno. 100 00:05:34,560 --> 00:05:36,770 Y entre Inside Out y el Hombre Hormiga, otra vez 101 00:05:36,770 --> 00:05:41,420 puede comparar línea por línea el número de cosas coinciden entre ellos dos. 102 00:05:41,420 --> 00:05:43,060 Bueno, una ANIMADA, uno no es. 103 00:05:43,060 --> 00:05:44,970 Uno es una película de Marvel, uno no es. 104 00:05:44,970 --> 00:05:47,280 Uno tiene un súper villano, la otra no. 105 00:05:47,280 --> 00:05:49,480 Se pasa la Bechtel prueba, una falla, 106 00:05:49,480 --> 00:05:54,450 pero ambos tienen Parques y Req alumnos, así que de nuevo, obtiene una puntuación de uno. 107 00:05:54,450 --> 00:05:58,300 >> Así que si yo estábamos buscando películas que eran similares a Inside Out, 108 00:05:58,300 --> 00:06:02,170 Yo podría buscar las películas que tienen el puntaje más alto dentro de este contenido 109 00:06:02,170 --> 00:06:03,952 esquema de filtrado. 110 00:06:03,952 --> 00:06:05,660 Así que en este caso, consideraría Minions 111 00:06:05,660 --> 00:06:08,330 para estar más cerca y más probable que sea algo 112 00:06:08,330 --> 00:06:13,250 que iba a gastar dinero para ver que era de Ultron o el Hombre Hormiga. 113 00:06:13,250 --> 00:06:16,150 >> Basada Estos contenidos sistemas de filtrado se basan simplemente 114 00:06:16,150 --> 00:06:18,670 en las propiedades de las películas, y por lo que 115 00:06:18,670 --> 00:06:21,930 puede construir estos sólo conociendo algo acerca de los productos 116 00:06:21,930 --> 00:06:23,500 eso tengo. 117 00:06:23,500 --> 00:06:26,050 Puedo usar cualquier tipo de características que me gustaría, 118 00:06:26,050 --> 00:06:28,400 y puedo construir más características complejas que 119 00:06:28,400 --> 00:06:33,060 involucrar a la prueba más compleja de una calidad a medida que avanzo. 120 00:06:33,060 --> 00:06:39,080 De hecho, incluso puedo ver esta tabla no como un objeto estático, 121 00:06:39,080 --> 00:06:43,110 sino más bien como siendo dimensiones dentro de un espacio de estado mayor. 122 00:06:43,110 --> 00:06:46,295 Y puedo empezar a hablar de la distancias entre diferentes películas. 123 00:06:46,295 --> 00:06:49,300 124 00:06:49,300 --> 00:06:51,050 Estas son todas las cosas que sabemos cómo 125 00:06:51,050 --> 00:06:55,860 hacer uso de los tipos de estructuras de datos que ya hemos visto en el CS50. 126 00:06:55,860 --> 00:06:59,180 Así que me podía imaginar edificio una estructura de datos para una película. 127 00:06:59,180 --> 00:07:02,390 Hay una estructura que tengo construida llamada película, 128 00:07:02,390 --> 00:07:04,369 y tiene cinco entradas booleanas en el mismo. 129 00:07:04,369 --> 00:07:07,160 ¿Está animado, ¿es una maravilla película, ¿tiene un super villano, 130 00:07:07,160 --> 00:07:11,047 Qué pasa la prueba Bechdel, y hay Parques y Rec alumnos en ella? 131 00:07:11,047 --> 00:07:12,880 Y cada uno de ellos es un estructura de datos que I 132 00:07:12,880 --> 00:07:16,330 puede ocupar para esa película particular. 133 00:07:16,330 --> 00:07:20,090 >> A continuación, calcular si dos películas son similares o no, 134 00:07:20,090 --> 00:07:23,330 lo que su puntuación es, que podía escribir un conjunto de pseudocódigo que 135 00:07:23,330 --> 00:07:25,120 genera esa misma función. 136 00:07:25,120 --> 00:07:30,100 Es decir, dado un poco de película M1, que pueda encontrar la película más parecida a ella 137 00:07:30,100 --> 00:07:32,430 siguiendo el pseudocódigo. 138 00:07:32,430 --> 00:07:37,040 Considero que es el mejor sistema que he encontrado anotando, 139 00:07:37,040 --> 00:07:39,920 la mejor comparación que he encontrado. 140 00:07:39,920 --> 00:07:41,890 Por cada otra película Voy a ir a través, 141 00:07:41,890 --> 00:07:44,920 Voy a poner una puntuación partido igual a 0. 142 00:07:44,920 --> 00:07:47,920 Y voy a ir a través de esa película, un M1, la película 143 00:07:47,920 --> 00:07:51,500 Empecé con, lo comprobaré todos y cada función 144 00:07:51,500 --> 00:07:53,650 que tienen que ver si hay un partido. 145 00:07:53,650 --> 00:07:56,460 Si hay un partido, voy a incrementar el resultado del partido. 146 00:07:56,460 --> 00:08:00,480 Y si al final el resultado del partido que He es mejor que el actual mejor 147 00:08:00,480 --> 00:08:03,310 anotar, entonces voy a recordar que la mejor puntuación, 148 00:08:03,310 --> 00:08:05,820 y este es el mejor partido que tengo. 149 00:08:05,820 --> 00:08:09,450 Al final, sea cual sea la película está sentado en el mejor partido, 150 00:08:09,450 --> 00:08:12,580 eso es el más cercano He sido capaz de llegar. 151 00:08:12,580 --> 00:08:14,890 Así basa estos contenidos sistemas de filtrado, 152 00:08:14,890 --> 00:08:16,900 todos ellos tienen esta estructura básica. 153 00:08:16,900 --> 00:08:20,910 Se basan en el artículo en cuestión y nada 154 00:08:20,910 --> 00:08:24,590 sobre cualquiera de las preferencias del usuario. 155 00:08:24,590 --> 00:08:29,010 >> El otro mecanismo que utilizamos en para construir sistemas de recomendación 156 00:08:29,010 --> 00:08:31,790 se llama filtrado colaborativo. 157 00:08:31,790 --> 00:08:36,520 Filtrado colaborativo se basa en no las cualidades del objeto en sí mismo, 158 00:08:36,520 --> 00:08:40,010 pero ¿cómo las personas, otros usuarios, es decir, cómo han 159 00:08:40,010 --> 00:08:43,370 respondido a estos mismos objetos. 160 00:08:43,370 --> 00:08:48,720 Así que para continuar con mi ejemplo de la película, Yo podría tomar un montón de mis amigos 161 00:08:48,720 --> 00:08:53,180 y estudiar acerca de si es o No les gustaba películas particulares. 162 00:08:53,180 --> 00:08:56,560 Ahora diferentes lugares generarán estos datos de diferentes maneras. 163 00:08:56,560 --> 00:08:59,630 Usted puede examinar directamente a su usuarios, o usted podría 164 00:08:59,630 --> 00:09:03,120 ver lo que deciden si usted es, por ejemplo Netflix. 165 00:09:03,120 --> 00:09:05,640 ¿Qué películas tenían que ven? 166 00:09:05,640 --> 00:09:08,670 >> Yo podría cuestionar un poco de mi amigos aquí y saber 167 00:09:08,670 --> 00:09:12,910 que Jason le gusta cada película que vio, no sorprendiendo allí. 168 00:09:12,910 --> 00:09:15,590 Andy solamente le gusta Minions y tía hombre. 169 00:09:15,590 --> 00:09:19,330 Sarah le gusta Inside Out y Vengadores, lo contrario de Andy. 170 00:09:19,330 --> 00:09:22,200 Y Sam, bueno, Sam le gusta todas las películas de superhéroes, 171 00:09:22,200 --> 00:09:24,960 pero ninguna de las películas animadas. 172 00:09:24,960 --> 00:09:30,630 >> Entonces yo podría preguntar por alguna nueva individual, algún otro usuario como yo 173 00:09:30,630 --> 00:09:34,520 y pedir, bueno, si me ha gustado una de estas películas, 174 00:09:34,520 --> 00:09:38,600 se puede hacer una predicción sobre que otras películas que podría gustar. 175 00:09:38,600 --> 00:09:41,890 Es decir, si me gustaba el interior Out, que otras películas 176 00:09:41,890 --> 00:09:48,460 estoy probable que también desee ver en base a lo que la gente hacía similares? 177 00:09:48,460 --> 00:09:51,640 Es decir, voy a ir a través de un Voy a filtrar a través de esta lista 178 00:09:51,640 --> 00:09:54,520 y encontrar sólo el personas que también les gustaba 179 00:09:54,520 --> 00:09:57,680 Inside Out, que coincidía con mis preferencias. 180 00:09:57,680 --> 00:10:00,824 Bueno, eso significa que Andy y Sam, que no le gustaba Inside Out, 181 00:10:00,824 --> 00:10:02,240 así que no voy a considerarlos. 182 00:10:02,240 --> 00:10:06,130 Voy a deshacerse de su los datos para esta comparación. 183 00:10:06,130 --> 00:10:09,750 >> Entonces puedo ver lo que Jason y Sarah pensó y recuento 184 00:10:09,750 --> 00:10:13,780 hasta que de las películas que veían que no lo hice, si les gustaron 185 00:10:13,780 --> 00:10:15,150 O no. 186 00:10:15,150 --> 00:10:17,820 Yo sólo podía contar hasta, digamos votos. 187 00:10:17,820 --> 00:10:23,360 Así Minions, por ejemplo podría tener uno votar por ella, ya que Jason le gustaba. 188 00:10:23,360 --> 00:10:27,170 Tanto Jason y Sarah le gusta Vengadores, por lo que tendría dos votos. 189 00:10:27,170 --> 00:10:30,700 Y sólo Jason le gusta Ant Man, por lo que sería conseguir un voto. 190 00:10:30,700 --> 00:10:34,870 Así que si tuviera que luego recomendar por mí mismo cuál de estas películas 191 00:10:34,870 --> 00:10:41,470 Yo podría ser más propensos a ver, lo haría que elegir Edad de Ultron: Vengadores. 192 00:10:41,470 --> 00:10:44,490 >> Así que para cualquiera de estos sistemas, ahora estoy usando 193 00:10:44,490 --> 00:10:49,260 datos que no fue generada por la película en sí, sino de las preferencias 194 00:10:49,260 --> 00:10:51,960 de otros usuarios. 195 00:10:51,960 --> 00:10:54,150 Esto tiene algunas dificultades, por supuesto. 196 00:10:54,150 --> 00:10:55,920 ¿Qué pasa si usted no tiene ningún otro usuario? 197 00:10:55,920 --> 00:10:58,770 Bueno, eso se llama problema de inicio. 198 00:10:58,770 --> 00:11:03,760 Tienes que tener un poco de cantidad de datos antes de que esté 199 00:11:03,760 --> 00:11:07,560 capaz de empezar a hacer estas recomendaciones. 200 00:11:07,560 --> 00:11:10,940 La otra cara de esto es una vez de empezar a recoger datos, 201 00:11:10,940 --> 00:11:13,870 si usted puede obtener más y más y más datos, 202 00:11:13,870 --> 00:11:17,850 obtendrá mejor y mejor y mejores recomendaciones. 203 00:11:17,850 --> 00:11:21,650 >> Ahora podríamos traducir esto en código. 204 00:11:21,650 --> 00:11:23,860 Podemos definir una diferente tipo de estructura, 205 00:11:23,860 --> 00:11:25,720 en este caso lo vamos a llamar a un usuario. 206 00:11:25,720 --> 00:11:30,970 Y se puso sobre las características qué películas este usuario gustaban. 207 00:11:30,970 --> 00:11:34,560 ¿Les gustó Inside Out, Minions, vengadores, y el Hombre Hormiga. 208 00:11:34,560 --> 00:11:36,660 Entonces podríamos generar algunos pseudocódigo para seguir 209 00:11:36,660 --> 00:11:39,460 el mismo procedimiento que he usado antes. 210 00:11:39,460 --> 00:11:43,460 Es decir, dado un determinado usuario x, vamos a recomendar una película 211 00:11:43,460 --> 00:11:46,107 que x puede gustar. 212 00:11:46,107 --> 00:11:47,940 Podemos ir a través y para todas las películas, 213 00:11:47,940 --> 00:11:51,410 podemos inicializar una puntuación para esa película sea 0. 214 00:11:51,410 --> 00:11:54,080 Y entonces podemos encontrar todo de los otros usuarios que 215 00:11:54,080 --> 00:11:57,630 tener las mismas preferencias que x. 216 00:11:57,630 --> 00:11:59,990 Y a continuación, para cada película que les gustaba, 217 00:11:59,990 --> 00:12:02,340 vamos a incrementar el puntaje de esa película. 218 00:12:02,340 --> 00:12:05,010 Sea cual sea la película en el extremo tiene la puntuación más alta, 219 00:12:05,010 --> 00:12:07,600 esa es la que yo debería recomendar. 220 00:12:07,600 --> 00:12:09,890 >> Nada de esto es realmente oscura. 221 00:12:09,890 --> 00:12:11,600 Nada de esto es un reto. 222 00:12:11,600 --> 00:12:15,810 Estos son todos los algoritmos básicos que se puede aplicar hoy. 223 00:12:15,810 --> 00:12:20,050 >> Ahora, con los sistemas de recomendación de bienes, se encuentra con algunos problemas. 224 00:12:20,050 --> 00:12:23,300 ¿Qué pasa si no hay nadie que coincide exactamente con sus preferencias? 225 00:12:23,300 --> 00:12:27,170 ¿Qué pasa si hay usuarios que son exactamente sus preferencias, 226 00:12:27,170 --> 00:12:30,480 pero entonces desviarse drásticamente de lo que te gusta? 227 00:12:30,480 --> 00:12:36,210 Me gusta clásico Godzilla películas, pero mi esposa no lo hace. 228 00:12:36,210 --> 00:12:39,430 Me gusta verlos, mi Cuenta de Netflix los contiene. 229 00:12:39,430 --> 00:12:41,800 De Su no. 230 00:12:41,800 --> 00:12:45,230 ¿Qué sucede cuando empezamos mezcla de datos de este tipo? 231 00:12:45,230 --> 00:12:47,690 Estos son todos los desafíos que puede superar, 232 00:12:47,690 --> 00:12:51,900 que acaba de tomar un poco algoritmos más complejos. 233 00:12:51,900 --> 00:12:56,420 >> Ahora, en el mundo real, lo que son en realidad operativa, 234 00:12:56,420 --> 00:12:59,980 Cómo usamos el filtrado basado en contenido o Cómo usamos filtrado colaborativo? 235 00:12:59,980 --> 00:13:01,910 Y la respuesta es que utilizamos los dos. 236 00:13:01,910 --> 00:13:06,350 Casi todos los principales usuarios en este caso, Amazon, Facebook, Netflix, 237 00:13:06,350 --> 00:13:11,200 Pandora, todos ellos utilizan una combinación de estos diferentes sistemas de recomendación. 238 00:13:11,200 --> 00:13:16,520 Y cuando combinamos las opciones de cada uno, los llamamos sistemas híbridos. 239 00:13:16,520 --> 00:13:20,750 Ellos de alguna manera dependen de la características del objeto en sí mismo, 240 00:13:20,750 --> 00:13:24,710 y de alguna manera dependen de las preferencias de los otros usuarios. 241 00:13:24,710 --> 00:13:28,120 Estos sistemas híbridos, son un gran negocio, 242 00:13:28,120 --> 00:13:30,830 y son lo que está vigente en la actualidad. 243 00:13:30,830 --> 00:13:32,839 >> Así que muchas gracias por acompañarme. 244 00:13:32,839 --> 00:13:35,380 Espero que hayas conseguido un poco poco de una comprensión de lo 245 00:13:35,380 --> 00:13:37,430 hace que estos sistemas de trabajo. 246 00:13:37,430 --> 00:13:41,980 La próxima vez que estés en línea, recuerda que No sólo le influir en sus decisiones, 247 00:13:41,980 --> 00:13:44,680 pero potencialmente todo el mundo es así. 248 00:13:44,680 --> 00:13:46,480 Gracias de nuevo. 249 00:13:46,480 --> 00:13:47,186