1 00:00:00,000 --> 00:00:03,416 >> [Prehrávanie hudby] 2 00:00:03,416 --> 00:00:05,860 3 00:00:05,860 --> 00:00:08,180 >> BRAIN SCASSELLATI: Vitajte k sérii CS50 AI. 4 00:00:08,180 --> 00:00:12,600 Volám sa Scass, a dnes budeme hovoriť o odporúčací systémy. 5 00:00:12,600 --> 00:00:15,780 Teraz Odporúčací systémy zvuky ako druh podivné meno. 6 00:00:15,780 --> 00:00:18,630 Znie to, ako by snáď malo byť odporúčanie systémy, 7 00:00:18,630 --> 00:00:21,290 a nejako som s vami súhlasím. 8 00:00:21,290 --> 00:00:26,110 Ale to sú systémy, ktoré pomáhajú vyberte z podobné veci, kedykoľvek je to 9 00:00:26,110 --> 00:00:28,210 vyberiete niečo online. 10 00:00:28,210 --> 00:00:32,119 Netflix, napríklad navrhne ďalšie filmy, ktoré budete chcieť sledovať. 11 00:00:32,119 --> 00:00:36,660 Alebo Pandora navrhne iný Piesne, ktoré budete chcieť počúvať. 12 00:00:36,660 --> 00:00:40,940 Amazon navrhne, aké druhy ostatné výrobky budete chcieť kúpiť. 13 00:00:40,940 --> 00:00:43,520 Facebook bude dokonca naznačujú, niektoré z ďalších priateľov 14 00:00:43,520 --> 00:00:45,440 že budete chcieť pridať. 15 00:00:45,440 --> 00:00:49,800 Každý z týchto systémov pracujú na báze rovnaké základné druh algoritmu, 16 00:00:49,800 --> 00:00:52,520 a to je to, čo sme hovoriť o dnes. 17 00:00:52,520 --> 00:00:56,860 >> Teraz tieto algoritmy sú Prekvapivo veľký biznis. 18 00:00:56,860 --> 00:01:01,130 Netflix pred niekoľkými rokmi v 2.009 ponúkol 1.000.000 $ 19 00:01:01,130 --> 00:01:07,240 Cenu keby mohol zlepšiť ich Odporúčanie systém o iba 10%. 20 00:01:07,240 --> 00:01:11,960 , Že 10%, aj keď, predstavuje podstatná časť obchodu. 21 00:01:11,960 --> 00:01:15,330 Odhady sú ťažké prísť, ale mnoho ľudí 22 00:01:15,330 --> 00:01:19,050 verí, že tieto odporúčania Systémy pre on-line nákupy 23 00:01:19,050 --> 00:01:25,729 systém, ako je Amazon vedú k niekam medzi 10% a 25% zvýšenie výnosu. 24 00:01:25,729 --> 00:01:27,770 Takže si môžete predstaviť druh zväzku, ktorý ste 25 00:01:27,770 --> 00:01:32,860 hovorí o tom, kedy si myslíme, že o aj tieto malé algoritmy. 26 00:01:32,860 --> 00:01:35,200 >> Takže poďme niekoľko príkladov. 27 00:01:35,200 --> 00:01:38,460 Ako je možné, že tieto Systémy naozaj funguje? 28 00:01:38,460 --> 00:01:40,773 Existujú dva základné druhy algoritmov, ktoré 29 00:01:40,773 --> 00:01:45,050 sú v hre, keď hovoríme o odporúčanie generovanie. 30 00:01:45,050 --> 00:01:48,650 Prvý z nich sa nazývajú Obsah založené filtrovanie. 31 00:01:48,650 --> 00:01:53,410 A filtrovanie založený obsah spolieha na podobnosti medzi položkami 32 00:01:53,410 --> 00:02:00,370 samy o sebe, že sa medzi dva filmy alebo dve piesne alebo dve zakúpené položky. 33 00:02:00,370 --> 00:02:03,190 Budeme používať filmy ako príklad, ale toto 34 00:02:03,190 --> 00:02:07,850 by sa mohli týkať, naozaj, na akýkoľvek typ objektov, ktoré hľadáme. 35 00:02:07,850 --> 00:02:13,330 >> Takže ak si myslím o niektorých filmy z minulého roka, 36 00:02:13,330 --> 00:02:16,799 Videl som naruby s moje deti, sa im to páčilo. 37 00:02:16,799 --> 00:02:17,840 Ale tiež sme mali na výber. 38 00:02:17,840 --> 00:02:21,350 Mohli sme šli vidieť prisluhovačov, sme mohli vidieť Age of Ultron, 39 00:02:21,350 --> 00:02:24,850 alebo sme mohli vidieť Ant Muž v kinách. 40 00:02:24,850 --> 00:02:27,580 >> Pre niektoré z týchto filmy, mohli by sme si predstaviť, 41 00:02:27,580 --> 00:02:33,320 generovanie zoznamu funkcií alebo vlastnosti o tých rôznych filmoch. 42 00:02:33,320 --> 00:02:37,190 Tak napríklad, mohol považujem ktoré z týchto filmov sú animované. 43 00:02:37,190 --> 00:02:39,960 No, a to ako Inside Out a obľúbenci sú animované. 44 00:02:39,960 --> 00:02:44,140 Ani vek, ani Ultron Ant Man sú animované filmy. 45 00:02:44,140 --> 00:02:47,040 A ja som si predstaviť, budova up štruktúry, tabuľky, ktorá 46 00:02:47,040 --> 00:02:49,440 uvádza každej z týchto vlastností. 47 00:02:49,440 --> 00:02:51,790 Sú animované, alebo nie? 48 00:02:51,790 --> 00:02:54,780 Mohol by som potom pridať ďalšie Funkcie v tejto tabuľke 49 00:02:54,780 --> 00:02:58,380 pridaním ďalších riadkov do tejto štruktúry. 50 00:02:58,380 --> 00:03:00,970 Mohol by som sa opýtať, či nie, že sú Marvel filmy. 51 00:03:00,970 --> 00:03:04,010 No, Inside Out a obľúbenci nie sú Marvel filmy, 52 00:03:04,010 --> 00:03:06,715 Vek Ultron a mravec človeka iste sú. 53 00:03:06,715 --> 00:03:09,100 >> A mohol by som sa opýtať všetky druhy rôzne kvality 54 00:03:09,100 --> 00:03:12,080 že som chcel, všetky druhy funkcií ktoré by mohli byť dôležité pre mňa. 55 00:03:12,080 --> 00:03:13,440 Majú super darebáka? 56 00:03:13,440 --> 00:03:16,700 No, je tu žiadny Super zloduch v Inside Out, ale tam sú tie v prisluhovači 57 00:03:16,700 --> 00:03:19,990 a, sa teda jedná o dve superhrdinu filmy. 58 00:03:19,990 --> 00:03:23,900 >> Mohol by som tiež požiadať veci, ako, dobre, sa im prejsť testom Bechdel? 59 00:03:23,900 --> 00:03:27,280 Sú tu za dva pomenoval ženskej postavy, ktoré 60 00:03:27,280 --> 00:03:30,550 stráviť nejaký značné množstvo Doba konverzáciu, ktorá 61 00:03:30,550 --> 00:03:34,400 nezahŕňa muža v obsadení? 62 00:03:34,400 --> 00:03:39,870 No, v tomto prípade, Inside Out prejde testy, obľúbenci zlyhá, vek Ultron 63 00:03:39,870 --> 00:03:42,990 prejde testom, a Ant Muž zlyhá. 64 00:03:42,990 --> 00:03:45,020 Každý z týchto funkcií Nemohol som myslieť 65 00:03:45,020 --> 00:03:48,660 za dôležité pre niektorých ľudí. 66 00:03:48,660 --> 00:03:52,000 >> Mohol by som tiež požiadať veci, ako sú tam nejakí ľudia v týchto filmov, ktoré 67 00:03:52,000 --> 00:03:57,190 sú absolventi z povedzme, parky a Rekreácie, jeden z mojich obľúbených relácií. 68 00:03:57,190 --> 00:04:00,540 No, Inside Out má Amy Poehler, to je Alumni. 69 00:04:00,540 --> 00:04:01,530 To sa počíta. 70 00:04:01,530 --> 00:04:04,110 Jon Hamm bol v prisluhovači. 71 00:04:04,110 --> 00:04:08,600 Paul Rudd bol v Ant Man, ale nikto Age of ULTRON bolo v parkoch a Req 72 00:04:08,600 --> 00:04:10,150 tiež. 73 00:04:10,150 --> 00:04:12,990 Tak som si vybudovať tento zoznam rysy, a mohli naozaj 74 00:04:12,990 --> 00:04:14,710 byť niečo o filmoch. 75 00:04:14,710 --> 00:04:17,329 Môžu byť, čo Pomer strán boli výstrel v, 76 00:04:17,329 --> 00:04:21,630 to by mohlo byť, ako veľa miest, ktoré predal na svojom víkendu otvorení. 77 00:04:21,630 --> 00:04:25,630 Všetky funkcie, ktoré chcem generovať môžem dať do tejto tabuľky. 78 00:04:25,630 --> 00:04:29,600 >> Teraz, v tomto prípade, som postavil všetky druh hodnôt Bullion, 79 00:04:29,600 --> 00:04:33,700 áno alebo nie, prejsť alebo zlyhanie, ale mohli by byť čokoľvek. 80 00:04:33,700 --> 00:04:36,690 Môžu byť ľubovoľné hodnoty. 81 00:04:36,690 --> 00:04:39,070 Pre obsahu založené filtrovanie, čo budeme robiť 82 00:04:39,070 --> 00:04:42,810 sa budeme uvažovať dva stĺpce v tejto tabuľke 83 00:04:42,810 --> 00:04:45,660 a vidieť, ako podobné sú. 84 00:04:45,660 --> 00:04:48,640 Tak napríklad, ak I šiel vidieť zvnútra von, 85 00:04:48,640 --> 00:04:53,640 Mohol by som sa opýtať, aké sú ďalšie filmy že by som mohol byť ochotný ísť vidieť. 86 00:04:53,640 --> 00:04:56,890 To znamená, že to, čo ochotný míňať svoje peniaze ísť vidieť. 87 00:04:56,890 --> 00:05:00,310 A môžem porovnávať len s tým, že dva stĺpce, jeden z Inside Out 88 00:05:00,310 --> 00:05:03,300 a jeden z niektorého z ostatné filmy, a len vidieť 89 00:05:03,300 --> 00:05:06,210 koľko z ich funkcií zápasu. 90 00:05:06,210 --> 00:05:09,660 Takže keď to porovnám Inside Out s prisluhovačmi, no, je tu 91 00:05:09,660 --> 00:05:10,910 tri veci, ktoré tu zápas. 92 00:05:10,910 --> 00:05:16,200 Sú obaja animované, ani jeden z nich Marvel sú filmy, a to ako z nich 93 00:05:16,200 --> 00:05:18,420 majú parky a REQ absolventov. 94 00:05:18,420 --> 00:05:20,420 Takže som mohol spočítať, ako Mnoho zápasov tam bolo, 95 00:05:20,420 --> 00:05:22,640 a v tomto prípade, že by tri. 96 00:05:22,640 --> 00:05:26,450 >> Ak by som potom porovnať Inside Out s povedzme Age of Ultron, 97 00:05:26,450 --> 00:05:28,430 Ja sa pozrieť dole v zozname a hovoria, dobre, je tu 98 00:05:28,430 --> 00:05:30,140 len jedna vec, ktorá tam zodpovedá. 99 00:05:30,140 --> 00:05:34,560 Oba prejsť testom Bechtel, tak že to bude skóre jedného. 100 00:05:34,560 --> 00:05:36,770 A medzi Inside Out a Ant Muž, som znovu 101 00:05:36,770 --> 00:05:41,420 Môžete porovnať riadok po riadku, koľko veci zápas medzi dvoma z nich. 102 00:05:41,420 --> 00:05:43,060 No, jeden je animovaný, človek nie je. 103 00:05:43,060 --> 00:05:44,970 Jeden to film Marvel, jeden to nie je. 104 00:05:44,970 --> 00:05:47,280 Jeden má super darebáka, druhý nie. 105 00:05:47,280 --> 00:05:49,480 Jeden prechádza Bechtel test, to zlyhá, 106 00:05:49,480 --> 00:05:54,450 ale obaja majú parkov a req absolventov, takže opäť sa dostane skóre jeden. 107 00:05:54,450 --> 00:05:58,300 >> Takže keď som hľadali filmy ktoré boli podobné naruby, 108 00:05:58,300 --> 00:06:02,170 Mohol by som hľadať filmy, ktoré majú najvyšší počet bodov v rámci tohto obsahu 109 00:06:02,170 --> 00:06:03,952 schéma filtrovanie. 110 00:06:03,952 --> 00:06:05,660 Takže v tomto prípade, myslím, bude uvažovať prisluhovačov 111 00:06:05,660 --> 00:06:08,330 byť bližšie a viac pravdepodobné, že bude niečo 112 00:06:08,330 --> 00:06:13,250 že by som míňať peniaze, aby vidieť ako Age of ULTRON alebo Ant Man. 113 00:06:13,250 --> 00:06:16,150 >> Tieto obsah založený filtračné systémy sa spoliehajú len 114 00:06:16,150 --> 00:06:18,670 Na základe vlastností filmy, a tak som sa 115 00:06:18,670 --> 00:06:21,930 môže stavať to práve tým, že pozná niečo o produktoch 116 00:06:21,930 --> 00:06:23,500 že mám. 117 00:06:23,500 --> 00:06:26,050 Môžem použiť všetky druhy funkcie, ktoré by som chcel, 118 00:06:26,050 --> 00:06:28,400 a môžem postaviť viac komplexné funkcie, ktoré 119 00:06:28,400 --> 00:06:33,060 zahŕňať zložitejšie skúšky o kvalite, ako som ísť ďalej. 120 00:06:33,060 --> 00:06:39,080 V skutočnosti, môžem dokonca zobraziť túto tabuľku nie ako byť jeden statický objekt, 121 00:06:39,080 --> 00:06:43,110 ale skôr ako rozmery v rámci väčšej stavového priestoru. 122 00:06:43,110 --> 00:06:46,295 A môžem začať hovoriť o vzdialenosti medzi rôznymi filmami. 123 00:06:46,295 --> 00:06:49,300 124 00:06:49,300 --> 00:06:51,050 To všetko sú veci že by sme vedieť, ako sa 125 00:06:51,050 --> 00:06:55,860 vykonať pomocou druhy dátových štruktúr že sme už videli v CS50. 126 00:06:55,860 --> 00:06:59,180 Takže som si dokázal predstaviť budovu štruktúra dát pre film. 127 00:06:59,180 --> 00:07:02,390 Je tu struct, ktorý som postavený tzv film, 128 00:07:02,390 --> 00:07:04,369 a to má päť logické položky v ňom. 129 00:07:04,369 --> 00:07:07,160 Je to živý, je to Marvel film, to má super darebáka, 130 00:07:07,160 --> 00:07:11,047 to prejsť testom Bechdel, a sú tam Parky a Rec absolventov v nej? 131 00:07:11,047 --> 00:07:12,880 A každý z nich je štruktúra dát, ktoré som 132 00:07:12,880 --> 00:07:16,330 môžu zaberať pre konkrétny film. 133 00:07:16,330 --> 00:07:20,090 >> Potom vypočítať, či dva filmy sú podobné alebo nie, 134 00:07:20,090 --> 00:07:23,330 čo ich skóre, mohol by som vypísať sadu pseudokódu, ktorý 135 00:07:23,330 --> 00:07:25,120 generuje túto rovnakú funkciu. 136 00:07:25,120 --> 00:07:30,100 To znamená, že vzhľadom na to nejaký film M1, môžem nájsť najviac podobný film k nemu 137 00:07:30,100 --> 00:07:32,430 pomocou nasledujúceho pseudokódu. 138 00:07:32,430 --> 00:07:37,040 Domnievam sa, čo je najlepší bodovací systém, ktorý som našiel, 139 00:07:37,040 --> 00:07:39,920 najlepšie porovnanie, ktoré som našiel. 140 00:07:39,920 --> 00:07:41,890 Pre každý iný film Chystám sa prejsť, 141 00:07:41,890 --> 00:07:44,920 Budem nastaviť zápas skóre rovno 0. 142 00:07:44,920 --> 00:07:47,920 A ja pôjdem cez to film, čo M1, film 143 00:07:47,920 --> 00:07:51,500 Začal som sa, Pozriem každý rys 144 00:07:51,500 --> 00:07:53,650 že musíte vidieť či je zhoda. 145 00:07:53,650 --> 00:07:56,460 Ak existuje zhoda, budem zvýšiť zápas skóre. 146 00:07:56,460 --> 00:08:00,480 A ak sa na konci zápas skóre, ktoré Som je lepší ako súčasný najlepší 147 00:08:00,480 --> 00:08:03,310 skóre, potom budem nezabudnite, že najlepšie skóre, 148 00:08:03,310 --> 00:08:05,820 a to je to najlepší zápas, ktorý mám. 149 00:08:05,820 --> 00:08:09,450 Na konci, bez ohľadu na film sedí v najlepšom zápase, 150 00:08:09,450 --> 00:08:12,580 to je najbližší Bol som schopný prísť. 151 00:08:12,580 --> 00:08:14,890 Tak to obsah na báze filtračné systémy, 152 00:08:14,890 --> 00:08:16,900 všetky majú základnú štruktúru. 153 00:08:16,900 --> 00:08:20,910 Oni sa spoliehajú na položku v pochybnosť a nič 154 00:08:20,910 --> 00:08:24,590 o niektorý z užívateľských preferencií. 155 00:08:24,590 --> 00:08:29,010 >> Druhý mechanizmus, ktorý budeme používať vo s cieľom vybudovať odporúčanie systémy 156 00:08:29,010 --> 00:08:31,790 sa nazýva spolupracovní filtrovanie. 157 00:08:31,790 --> 00:08:36,520 Spolupracovní filtrovanie spolieha na nie vlastnosti samotného objektu, 158 00:08:36,520 --> 00:08:40,010 ale ako sa ľudia, ostatné Užívatelia, že je, ako som 159 00:08:40,010 --> 00:08:43,370 reagoval na tieto rovnaké objekty. 160 00:08:43,370 --> 00:08:48,720 Takže pokračovať vo svojom príklade filmu, Mohol by som mať veľa mojich priateľov 161 00:08:48,720 --> 00:08:53,180 a prieskum je o tom, či Niet sa im páčilo jednotlivé filmy. 162 00:08:53,180 --> 00:08:56,560 Teraz rôzne miesta budú vytvárať tieto dáta rôznymi spôsobmi. 163 00:08:56,560 --> 00:08:59,630 Môžete priamo prieskumu svoj Užívatelia, alebo môžete jednoducho 164 00:08:59,630 --> 00:09:03,120 vidieť, čo si vybrať, či ste, napríklad Netflix. 165 00:09:03,120 --> 00:09:05,640 Aké filmy sa im pozerať? 166 00:09:05,640 --> 00:09:08,670 >> Mohol by som spochybniť niektoré z mojich priateľov a zistiť, 167 00:09:08,670 --> 00:09:12,910 že Jason páčil každý film videl, tam nie je prekvapujúce. 168 00:09:12,910 --> 00:09:15,590 Andy len rád prisluhovačov a tetou Man. 169 00:09:15,590 --> 00:09:19,330 Sarah rada Inside Out a Pomstitelia, opak Andy. 170 00:09:19,330 --> 00:09:22,200 A Sam, dobre, Sam rád všetky superhrdinu filmov, 171 00:09:22,200 --> 00:09:24,960 ale žiadny z animovaných filmov. 172 00:09:24,960 --> 00:09:30,630 >> Mohol by som potom dotaz pre niektoré nové jednotlivec, nejaký iný užívateľ, ako som ja 173 00:09:30,630 --> 00:09:34,520 a opýtať sa, dobre, ak sa mi páčilo jeden z týchto filmov, 174 00:09:34,520 --> 00:09:38,600 môžete robiť predpoveď o ktoré ďalšie filmy by som mohol páčiť. 175 00:09:38,600 --> 00:09:41,890 To znamená, že keď som Inside páčil Out, ktoré ďalšie filmy 176 00:09:41,890 --> 00:09:48,460 mám pravdepodobné, že tiež chcú vidieť na základe toho, čo ľudia robili podobné? 177 00:09:48,460 --> 00:09:51,640 To znamená, že pôjdem cez Budem filtrovať cez tento zoznam 178 00:09:51,640 --> 00:09:54,520 a nájsť len jednotlivci, ktorí sa tiež páčilo 179 00:09:54,520 --> 00:09:57,680 Naruby, ktorý uzavreté predvoľby. 180 00:09:57,680 --> 00:10:00,824 No, to znamená, že Andy a Sam sa im nepáčilo, Inside Out, 181 00:10:00,824 --> 00:10:02,240 takže nebudem skúmať ich. 182 00:10:02,240 --> 00:10:06,130 Chystám sa zbaviť svojich Údaje pre toto porovnanie. 183 00:10:06,130 --> 00:10:09,750 >> Potom som sa pozrieť na to, čo Jason a Sarah si myslel, a zhodujú 184 00:10:09,750 --> 00:10:13,780 up, ktorý z filmov, ktoré oni videli že som to neurobil, či sa im páčilo 185 00:10:13,780 --> 00:10:15,150 alebo nie. 186 00:10:15,150 --> 00:10:17,820 Mohol by som jednoducho počítať, povedzme hlasov. 187 00:10:17,820 --> 00:10:23,360 Takže prisluhovači, napríklad môže mať jeden pre neho hlasovať, pretože Jason to páčilo. 188 00:10:23,360 --> 00:10:27,170 Obaja Jason a Sarah rada Avengers, tak to bude mať dva hlasy. 189 00:10:27,170 --> 00:10:30,700 A iba Jason páčilo Ant Man, tak to by si jeden hlas. 190 00:10:30,700 --> 00:10:34,870 Takže ak by som mal do tej doby odporučiť pre seba, ktoré z týchto filmov 191 00:10:34,870 --> 00:10:41,470 Mohol by som byť s najväčšou pravdepodobnosťou sledovať, by som si vybrať Age of ULTRON: Avengers. 192 00:10:41,470 --> 00:10:44,490 >> Takže pre niektorý z nich Systémy, teraz som pomocou 193 00:10:44,490 --> 00:10:49,260 Dáta, ktoré boli generovaná nie o Film sám o sebe, ale o preferenciách 194 00:10:49,260 --> 00:10:51,960 od ostatných užívateľov. 195 00:10:51,960 --> 00:10:54,150 To má určité ťažkosti samozrejme. 196 00:10:54,150 --> 00:10:55,920 Čo keď nemáte žiadne iné užívateľa? 197 00:10:55,920 --> 00:10:58,770 No, to sa hovorí spustenie problém. 198 00:10:58,770 --> 00:11:03,760 Musíte mať niektoré Množstvo dát, než ste 199 00:11:03,760 --> 00:11:07,560 mohli začať robiť tieto odporúčania. 200 00:11:07,560 --> 00:11:10,940 Odvrátenou stranou je to opäť začnete zberu dát, 201 00:11:10,940 --> 00:11:13,870 ak môžete zbierať viac a ďalšie a ďalšie údaje, 202 00:11:13,870 --> 00:11:17,850 budete mať lepšie a lepšie a lepšie odporúčanie. 203 00:11:17,850 --> 00:11:21,650 >> Teraz by sme mohli preložiť toto do kódu tiež. 204 00:11:21,650 --> 00:11:23,860 Môžeme definovať iný druh štruktúry, 205 00:11:23,860 --> 00:11:25,720 V tomto prípade budeme hovoriť užívateľ. 206 00:11:25,720 --> 00:11:30,970 A je to tu o funkcie aké filmy tento užívateľ páčilo. 207 00:11:30,970 --> 00:11:34,560 Páčilo sa im páči naruby, Prisluhovači, pomstitelia a Ant Man. 208 00:11:34,560 --> 00:11:36,660 Mohli by sme potom generovať niektorí pseudokód nasledovať 209 00:11:36,660 --> 00:11:39,460 rovnaký postup, ktorý som použil predtým. 210 00:11:39,460 --> 00:11:43,460 To znamená, že pri určitom Užívateľ x, poďme odporučiť film 211 00:11:43,460 --> 00:11:46,107 že x mohlo páčiť. 212 00:11:46,107 --> 00:11:47,940 Môžeme prejsť a pre všetky filmy, 213 00:11:47,940 --> 00:11:51,410 môžeme inicializovať skóre Pre ten film bude 0. 214 00:11:51,410 --> 00:11:54,080 A potom môžeme nájsť všetko, z ostatných užívateľov, ktorí 215 00:11:54,080 --> 00:11:57,630 majú rovnaké preferencie ako x. 216 00:11:57,630 --> 00:11:59,990 A potom za každých film, ktorý sa im páči, 217 00:11:59,990 --> 00:12:02,340 budeme zvyšovať skóre tohto filmu. 218 00:12:02,340 --> 00:12:05,010 Bez ohľadu na film v koniec má najvyššie skóre, 219 00:12:05,010 --> 00:12:07,600 to je ten, čo som mala odporučiť. 220 00:12:07,600 --> 00:12:09,890 >> Nič z toho je naozaj obskurní. 221 00:12:09,890 --> 00:12:11,600 Nič z toho, je náročné. 222 00:12:11,600 --> 00:12:15,810 To všetko sú základné algoritmy že by ste mohli realizovať dnes. 223 00:12:15,810 --> 00:12:20,050 >> Teraz s reálnymi odporúčacieho systémami, sa dostanete do nejakej problémy. 224 00:12:20,050 --> 00:12:23,300 Čo keď tam nikto, kto zodpovedá presne vaše preferencie? 225 00:12:23,300 --> 00:12:27,170 Čo keď tam sú užívatelia, ktorí sú presne vaše preferencie, 226 00:12:27,170 --> 00:12:30,480 ale potom sa odchyľujú drasticky z toho, čo sa vám páči? 227 00:12:30,480 --> 00:12:36,210 Mám rád klasickú Godzilla filmy, ale moja žena nie je. 228 00:12:36,210 --> 00:12:39,430 Rád sa na ne pozerať, my Netflix účet obsahuje je. 229 00:12:39,430 --> 00:12:41,800 Jej to nie je. 230 00:12:41,800 --> 00:12:45,230 Čo sa stane, keď začneme miešanie dáta, ako je táto? 231 00:12:45,230 --> 00:12:47,690 To všetko sú výzvy že môžete prekonať, 232 00:12:47,690 --> 00:12:51,900 oni len sa mierne zložitejšie algoritmy. 233 00:12:51,900 --> 00:12:56,420 >> Teraz v reálnom svete, ktorý sú skutočne v prevádzke, 234 00:12:56,420 --> 00:12:59,980 používame filtrovanie obsahu, alebo na základe použijeme spolupracovní filtrovanie? 235 00:12:59,980 --> 00:13:01,910 A odpoveď je používame oba. 236 00:13:01,910 --> 00:13:06,350 Takmer všetky hlavné užívateľovi Tento prípad, Amazon, Facebook, Netflix, 237 00:13:06,350 --> 00:13:11,200 Pandora, že všetci používajú kombináciu Tieto rôzne odporúčania systémy. 238 00:13:11,200 --> 00:13:16,520 A keď sme kombinovať voľby z každý, im hovoríme hybridné systémy. 239 00:13:16,520 --> 00:13:20,750 Sú nejakým spôsobom závisieť na vlastnosti samotného objektu, 240 00:13:20,750 --> 00:13:24,710 av niektorých ohľadoch sú závislé na preferencie iných užívateľov. 241 00:13:24,710 --> 00:13:28,120 Tieto hybridné systémy, oni sú veľký biznis, 242 00:13:28,120 --> 00:13:30,830 a oni sú to, čo je aktuálne aj dnes. 243 00:13:30,830 --> 00:13:32,839 >> Takže vďaka moc za mňa spájanie. 244 00:13:32,839 --> 00:13:35,380 Dúfam, že ste sa dostali trochu trochu pochopenie toho, čo 245 00:13:35,380 --> 00:13:37,430 robí tieto systémy pracujú. 246 00:13:37,430 --> 00:13:41,980 Nabudúce ste online, pamätajte, že a to nielen tie ovplyvňujú vaše voľby, 247 00:13:41,980 --> 00:13:44,680 ale potenciálne všetci ostatní to tiež. 248 00:13:44,680 --> 00:13:46,480 Ešte raz ďakujem. 249 00:13:46,480 --> 00:13:47,186