1 00:00:00,000 --> 00:00:03,416 >> [Muzikos grojimo] 2 00:00:03,416 --> 00:00:05,860 3 00:00:05,860 --> 00:00:08,180 >> BRAIN SCASSELLATI: Sveiki į CS50 AI serijos. 4 00:00:08,180 --> 00:00:12,600 Mano vardas Scass, ir šiandien mes ketiname kalbėti apie Rekomenduokite sistemas. 5 00:00:12,600 --> 00:00:15,780 Dabar Rekomendacinės sistemos garsai kaip rūšies nelyginis vardu. 6 00:00:15,780 --> 00:00:18,630 Tai skamba kaip gal ji turėtų būti rekomendacija sistemos, 7 00:00:18,630 --> 00:00:21,290 ir I rūšies sutinku su jumis. 8 00:00:21,290 --> 00:00:26,110 Bet tai yra sistemos, kurios padeda pasirinkite vykdo panašią dalykus kai tik prireiks 9 00:00:26,110 --> 00:00:28,210 Pasirinkę kažką internete. 10 00:00:28,210 --> 00:00:32,119 "Netflix", pavyzdžiui, bus pasiūlyti kiti Filmai, kad jūs galbūt norėsite žiūrėti. 11 00:00:32,119 --> 00:00:36,660 Arba Pandora siūlys skiriasi dainas, kad jūs galbūt norėsite klausytis. 12 00:00:36,660 --> 00:00:40,940 "Amazon" siūlys Kokie kiti produktai jums gali nori pirkti. 13 00:00:40,940 --> 00:00:43,520 "Facebook" bus netgi rodo kai kurių kitų draugais 14 00:00:43,520 --> 00:00:45,440 kad jūs galbūt norėsite pridėti. 15 00:00:45,440 --> 00:00:49,800 Kiekviena iš šių sistemų veikia naudodami tą pačią pagrindinę rūšies algoritmas, 16 00:00:49,800 --> 00:00:52,520 ir tai, ką mes ketiname kalbėti apie šiandien. 17 00:00:52,520 --> 00:00:56,860 >> Dabar šie algoritmai yra Nenuostabu didelis verslas. 18 00:00:56,860 --> 00:01:01,130 "Netflix" prieš kelerius metus 2009 pasiūlyta 1 mln $ 19 00:01:01,130 --> 00:01:07,240 prizas, jei jūs galėtumėte pagerinti savo Rekomendacija sistema vos 10%. 20 00:01:07,240 --> 00:01:11,960 , Kad 10%, nors, žymi Nemažai verslui. 21 00:01:11,960 --> 00:01:15,330 Prognozės yra sunku ateiti, tačiau daugelis žmonių 22 00:01:15,330 --> 00:01:19,050 mano, kad šie rekomendacijos sistemos internete pirkimo 23 00:01:19,050 --> 00:01:25,729 sistema, kaip Amazonės švino kažkur tarp 10% ir 25% padidėjo pajamų. 24 00:01:25,729 --> 00:01:27,770 Taigi galite įsivaizduoti rūšies kiekio, kad esate 25 00:01:27,770 --> 00:01:32,860 kalbėti apie tai, kada mes galvojame apie net ir šie maži algoritmai. 26 00:01:32,860 --> 00:01:35,200 >> Taigi galime gauti keletą pavyzdžių. 27 00:01:35,200 --> 00:01:38,460 Kaip tai, kad šie sistemos tikrai veikia? 28 00:01:38,460 --> 00:01:40,773 Yra du pagrindiniai rūšių algoritmų, kurie 29 00:01:40,773 --> 00:01:45,050 yra ne žaidimą, kai mes kalbame apie generatoriniai rekomendacijos. 30 00:01:45,050 --> 00:01:48,650 Pirmieji vadinami turinys pagrįstas filtravimas. 31 00:01:48,650 --> 00:01:53,410 Ir turinys grindžiamas filtravimo priklauso nuo panašumų tarp daiktų 32 00:01:53,410 --> 00:02:00,370 patys, tai yra tarp dviejų filmų ar dvi dainos ar du įsigytų daiktų. 33 00:02:00,370 --> 00:02:03,190 Mes ketiname naudoti filmus kaip, pavyzdžiui, bet tai 34 00:02:03,190 --> 00:02:07,850 gali būti taikomos, tikrai, kad bet kokio tipo objektas, kad mes ieškome. 35 00:02:07,850 --> 00:02:13,330 >> Taigi, jei aš galvoju apie kai Filmai iš praėjusių metų, 36 00:02:13,330 --> 00:02:16,799 Mačiau Inside Out su mano vaikai, jie myli jį. 37 00:02:16,799 --> 00:02:17,840 Bet mes taip pat turėjo pasirinkimą. 38 00:02:17,840 --> 00:02:21,350 Mes galėjo būti pamatyti pakalikai, galėtume matyti amžius Ultron, 39 00:02:21,350 --> 00:02:24,850 ar mes galime matyti Ant žmogus teatruose. 40 00:02:24,850 --> 00:02:27,580 >> Už bet kurį iš šių Filmai, mes galime įsivaizduoti 41 00:02:27,580 --> 00:02:33,320 generuoti funkcijų sąrašą arba savybės apie šių skirtingų filmų. 42 00:02:33,320 --> 00:02:37,190 Taigi, pavyzdžiui, aš galėtų apsvarstyti kuris iš šių filmų yra animacinis. 43 00:02:37,190 --> 00:02:39,960 Na, tiek Inside Out ir Minions yra animacinis. 44 00:02:39,960 --> 00:02:44,140 Nei Ultron Amžius nei Ant Žmogus yra animaciniai filmai. 45 00:02:44,140 --> 00:02:47,040 Ir aš galėjau įsivaizduoti pastatą iki struktūros lentelę, kad 46 00:02:47,040 --> 00:02:49,440 išvardytos kiekviena iš šių savybių. 47 00:02:49,440 --> 00:02:51,790 Ar jie animacinis ar ne? 48 00:02:51,790 --> 00:02:54,780 Tada aš galėtų pridėti daugiau Savybės šią lentelę 49 00:02:54,780 --> 00:02:58,380 pridedant daugiau eilučių į šią struktūrą. 50 00:02:58,380 --> 00:03:00,970 Galėčiau paklausti, ar ne jie Marvel filmus. 51 00:03:00,970 --> 00:03:04,010 Na, Inside Out ir Minions nėra Marvel filmai, 52 00:03:04,010 --> 00:03:06,715 Amžius Ultron ir skruzdžių Man tikrai yra. 53 00:03:06,715 --> 00:03:09,100 >> Ir aš galėčiau užduoti rūšių skirtingos kokybės 54 00:03:09,100 --> 00:03:12,080 kad aš norėjau, bet funkcijų rūšių kad gali būti svarbu man. 55 00:03:12,080 --> 00:03:13,440 Ar jie turi super villain? 56 00:03:13,440 --> 00:03:16,700 Na, ten ne super piktadarys Inside Atlikti, tačiau ten yra tie, į pakalikai 57 00:03:16,700 --> 00:03:19,990 ir, akivaizdu, kad du superherojus filmus. 58 00:03:19,990 --> 00:03:23,900 >> Aš taip pat galėtų prašyti dalykų, pavyzdžiui, gerai, jie praeiti Bechdel testą? 59 00:03:23,900 --> 00:03:27,280 Yra du pavadintas moterų simbolių, kuris 60 00:03:27,280 --> 00:03:30,550 praleisti didelę sumą laikas turėti pokalbį, kad 61 00:03:30,550 --> 00:03:34,400 neapima vyrų dauguma? 62 00:03:34,400 --> 00:03:39,870 Na, šiuo atveju, Inside Out eina testus, Minions nepavyksta, amžius Ultron 63 00:03:39,870 --> 00:03:42,990 eina testą ir Skruzdė Žmogus nepavyksta. 64 00:03:42,990 --> 00:03:45,020 Bet kuris iš šių funkcijų vienas Galėčiau galvoti apie 65 00:03:45,020 --> 00:03:48,660 kaip svarbu kai kuriems žmonėms. 66 00:03:48,660 --> 00:03:52,000 >> Aš taip pat galėtų prašyti dalykų, pavyzdžiui, yra yra kokių nors šiuos filmus žmonės, 67 00:03:52,000 --> 00:03:57,190 yra absolventai iš tarkim, parkai ir Poilsis, vienas iš mano mėgstamiausių šou. 68 00:03:57,190 --> 00:04:00,540 Na, Inside Out turi Amy Poehler, tai Alumni. 69 00:04:00,540 --> 00:04:01,530 Tai svarbiausia. 70 00:04:01,530 --> 00:04:04,110 Jon Hamm buvo pakalikai. 71 00:04:04,110 --> 00:04:08,600 Paul Rudd buvo Ant žmogus, bet niekas Age of Ultron buvo parkuose ir Req 72 00:04:08,600 --> 00:04:10,150 taip pat. 73 00:04:10,150 --> 00:04:12,990 Taigi aš galiu sukurti šį sąrašą funkcijos, ir jie tikrai galėjo 74 00:04:12,990 --> 00:04:14,710 būti nieko apie filmus. 75 00:04:14,710 --> 00:04:17,329 Jie gali būti apie tai, ką santykis buvo nušautas, 76 00:04:17,329 --> 00:04:21,630 tai galėtų būti, kiek vietų jos parduodami jų atidarymo savaitgalį. 77 00:04:21,630 --> 00:04:25,630 Bet funkcija, kad aš noriu generuoti aš galiu įdėti į šią lentelę. 78 00:04:25,630 --> 00:04:29,600 >> Dabar, šiuo atveju, aš pastatytas visi lydiniams vertybių rūšiuoti, 79 00:04:29,600 --> 00:04:33,700 Taip arba Ne, teigiamas arba neigiamas, tačiau jie gali būti bet kas. 80 00:04:33,700 --> 00:04:36,690 Jie gali būti savavališkai vertės. 81 00:04:36,690 --> 00:04:39,070 Dėl turinio pagrįstas filtravimas, ką mes ketiname daryti 82 00:04:39,070 --> 00:04:42,810 yra mes ketiname apsvarstyti du stulpeliai šioje lentelėje 83 00:04:42,810 --> 00:04:45,660 ir pamatyti, kokie jie yra panašūs. 84 00:04:45,660 --> 00:04:48,640 Taigi, pavyzdžiui, jei aš teko matyti Inside Out, 85 00:04:48,640 --> 00:04:53,640 Galėčiau paklausti, kokie yra kiti filmai kad būčiau pasiruošęs eiti pamatyti. 86 00:04:53,640 --> 00:04:56,890 Tai yra, kas pasiruošęs išleisti savo pinigus eiti pamatyti. 87 00:04:56,890 --> 00:05:00,310 Ir aš galiu palyginti tai tiesiog atsižvelgiant du stulpeliai, vienas iš Inside Out 88 00:05:00,310 --> 00:05:03,300 Ir vienas iš bet kurios kiti filmai, ir tik matydamas 89 00:05:03,300 --> 00:05:06,210 kiek jų savybės rungtynių. 90 00:05:06,210 --> 00:05:09,660 Taigi, jei aš galiu palyginti Inside Out su pakalikai, gerai, ten 91 00:05:09,660 --> 00:05:10,910 Trys dalykai, kad čia rungtynes. 92 00:05:10,910 --> 00:05:16,200 Jie abu animacinis, nė vienas iš jų yra Marvel filmų ir jie abu 93 00:05:16,200 --> 00:05:18,420 turi Parkai ir Req absolventai. 94 00:05:18,420 --> 00:05:20,420 Taigi galėčiau suskaičiuoti, kaip daug atitikmenų buvo, 95 00:05:20,420 --> 00:05:22,640 ir šiuo atveju būčiau tris. 96 00:05:22,640 --> 00:05:26,450 >> Jei tada aš palyginti Inside Out su tarkim amžius Ultron, 97 00:05:26,450 --> 00:05:28,430 Galiu pažvelgti žemyn sąrašą ir sako, gerai, ten 98 00:05:28,430 --> 00:05:30,140 tik vienas dalykas, kuris atitinka ten. 99 00:05:30,140 --> 00:05:34,560 Jie abu praeiti Bechtel testą, todėl kad tai bus vienos rezultatas. 100 00:05:34,560 --> 00:05:36,770 Ir tarp Inside Out ir Skruzdė Žmogau, aš vėl 101 00:05:36,770 --> 00:05:41,420 galima lyginti pagal kiekvieną eilutę, kiek viskas atitiktų tarp dviejų iš jų. 102 00:05:41,420 --> 00:05:43,060 Na, vienas manimi animacinis, vienas ne. 103 00:05:43,060 --> 00:05:44,970 Vienas yra stebuklas filmas, vienas ne. 104 00:05:44,970 --> 00:05:47,280 Vienas atšoko super villain, kitas ne. 105 00:05:47,280 --> 00:05:49,480 Vienas eina Bechtel testus, nepavyksta tai, 106 00:05:49,480 --> 00:05:54,450 bet jie abu turi Parkai ir Req absolventai, Taigi dar kartą, ji gauna vieną balą. 107 00:05:54,450 --> 00:05:58,300 >> Taigi, jei aš buvo ieškote filmus kad buvo panašus į Inside Out, 108 00:05:58,300 --> 00:06:02,170 Galėčiau ieškoti filmų, kurie aukščiausią rezultatą per šį turinį 109 00:06:02,170 --> 00:06:03,952 filtravimo sistema. 110 00:06:03,952 --> 00:06:05,660 Taigi šiuo atveju, aš turėtų apsvarstyti pakalikai 111 00:06:05,660 --> 00:06:08,330 būti arčiau ir daugiau gali būti kažką 112 00:06:08,330 --> 00:06:13,250 kad man būtų išleisti pinigus pamatyti nei amžius Ultron ar skruzdžių Man. 113 00:06:13,250 --> 00:06:16,150 >> Tai turinys pagrįstas filtravimo sistemų remtis tik 114 00:06:16,150 --> 00:06:18,670 apie savybių filmai, ir todėl aš 115 00:06:18,670 --> 00:06:21,930 gali kurti tai tik žinant kažkas apie produktus 116 00:06:21,930 --> 00:06:23,500 kad turiu. 117 00:06:23,500 --> 00:06:26,050 Galiu naudoti jokių rūšių funkcijos, kurios man norėtųsi, 118 00:06:26,050 --> 00:06:28,400 ir aš galiu sukurti daugiau sudėtingų funkcijų, 119 00:06:28,400 --> 00:06:33,060 dalyvauja daugiau sudėtingą testą tokios kokybės, kaip aš einu kartu. 120 00:06:33,060 --> 00:06:39,080 Tiesą sakant, aš netgi galite peržiūrėti šią lentelę ne kaip viena statinė objektas, 121 00:06:39,080 --> 00:06:43,110 o kaip matmenis per didesnį valstybinės erdvėje. 122 00:06:43,110 --> 00:06:46,295 Ir galiu pradėti kalbėti apie atstumai tarp skirtingų filmų. 123 00:06:46,295 --> 00:06:49,300 124 00:06:49,300 --> 00:06:51,050 Tai yra viskas kad mes žinome, kaip jie 125 00:06:51,050 --> 00:06:55,860 padaryti naudojant duomenų struktūrų rūšių kad mes jau matėme iš CS50. 126 00:06:55,860 --> 00:06:59,180 Taigi galėjau įsivaizduoti pastatą duomenų struktūra filmą. 127 00:06:59,180 --> 00:07:02,390 Yra konstrukto, kad aš pastatytas vadinamas filmas, 128 00:07:02,390 --> 00:07:04,369 ir ji turi penkis Bulio įrašus į jį. 129 00:07:04,369 --> 00:07:07,160 Ar tai animacinis, tai stebuklas Filmas, ji neturi super villain, 130 00:07:07,160 --> 00:07:11,047 ji praeiti Bechdel testą ir yra ten Parkai ir Rec absolventai jame? 131 00:07:11,047 --> 00:07:12,880 Ir kiekvienas iš jų yra duomenų struktūra, kad aš 132 00:07:12,880 --> 00:07:16,330 gali užimti tam konkrečiam filmą. 133 00:07:16,330 --> 00:07:20,090 >> Tada apskaičiuoti, ar dviejų filmai yra panašūs, ar ne, 134 00:07:20,090 --> 00:07:23,330 kas jų rezultatas yra, galėčiau rašyti keletą Pseudocode rinkinį, 135 00:07:23,330 --> 00:07:25,120 generuoja tą pačią funkciją. 136 00:07:25,120 --> 00:07:30,100 Tai yra, nes kai filmas M1, galiu rasti labiausiai panašų filmą į jį 137 00:07:30,100 --> 00:07:32,430 sekdami Pseudocode. 138 00:07:32,430 --> 00:07:37,040 Laikau, kuris yra geriausias balais sistemą, kuri radau, 139 00:07:37,040 --> 00:07:39,920 geriausias palyginimas, kad aš rasiu. 140 00:07:39,920 --> 00:07:41,890 Už kiekvieną Kita filmą Aš ruošiuosi eiti per, 141 00:07:41,890 --> 00:07:44,920 Aš nustatyti minutę išlygino rezultatą, lygų 0. 142 00:07:44,920 --> 00:07:47,920 Ir aš eisiu per tą Filmas, M1, filmas 143 00:07:47,920 --> 00:07:51,500 Aš pradėjau su, aš patikrinti kiekvienas bruožas 144 00:07:51,500 --> 00:07:53,650 , kad jie turi pamatyti jei ten rungtynės. 145 00:07:53,650 --> 00:07:56,460 Jei yra rungtynės, aš prieaugio minutę išlygino rezultatą. 146 00:07:56,460 --> 00:08:00,480 Ir jei ne baigti mačo rezultatas, kuris Aš geriau nei dabartinis geriausias 147 00:08:00,480 --> 00:08:03,310 rezultatas, tada aš prisiminti, kad geriausią rezultatą, 148 00:08:03,310 --> 00:08:05,820 ir tai yra geriausias rungtynės, kad turiu. 149 00:08:05,820 --> 00:08:09,450 Pabaigoje, nepriklausomai filmą sėdi geriausią rungtynių 150 00:08:09,450 --> 00:08:12,580 tai arčiausiai Aš galėjo ateiti. 151 00:08:12,580 --> 00:08:14,890 Taigi šie turinys pagrįstas filtravimo sistemų, 152 00:08:14,890 --> 00:08:16,900 visi jie turi šią pagrindinę struktūrą. 153 00:08:16,900 --> 00:08:20,910 Jie remiasi elemento į klausimą ir nieko 154 00:08:20,910 --> 00:08:24,590 apie bet vartotojų pageidavimus. 155 00:08:24,590 --> 00:08:29,010 >> Kitas mechanizmas, mes naudojame siekiant sukurti rekomendacija sistemas 156 00:08:29,010 --> 00:08:31,790 vadinama bendradarbiavimo filtravimas. 157 00:08:31,790 --> 00:08:36,520 Bendradarbiavimo filtravimas remiasi ne paties objekto savybes, 158 00:08:36,520 --> 00:08:40,010 bet kaip žmonės, kita vartotojai, kurie yra, kaip jie jau 159 00:08:40,010 --> 00:08:43,370 atsakė į tuos pačius objektus. 160 00:08:43,370 --> 00:08:48,720 Taigi toliau mano filmų, pavyzdžiui, Aš gali užtrukti iš mano draugų krūva 161 00:08:48,720 --> 00:08:53,180 ir apklausti juos apie tai, ar jie patiko tikrus filmus. 162 00:08:53,180 --> 00:08:56,560 Dabar skirtingose ​​vietose sukurs šis duomenų skirtingais būdais. 163 00:08:56,560 --> 00:08:59,630 Jūs galite tiesiogiai apklausą jūsų Vartotojų, arba galite tiesiog 164 00:08:59,630 --> 00:09:03,120 pamatyti, ką jie pasirinkti, jei jūs, pavyzdžiui, "Netflix". 165 00:09:03,120 --> 00:09:05,640 Kuris filmus jie žiūri? 166 00:09:05,640 --> 00:09:08,670 >> Galėčiau abejoti kai mano draugai čia ir sužinokite 167 00:09:08,670 --> 00:09:12,910 kad Jasonas patiko kiekvieną filmą jis pamatė, nenuostabu ten. 168 00:09:12,910 --> 00:09:15,590 Andy patiko tik pakalikai ir teta žmogus. 169 00:09:15,590 --> 00:09:19,330 Sara patiko Inside Out ir Keršytojas, Andy priešinga. 170 00:09:19,330 --> 00:09:22,200 Sam, gerai, Sam patiko visi superhero filmus, 171 00:09:22,200 --> 00:09:24,960 tačiau nė vienas iš animacinių filmų. 172 00:09:24,960 --> 00:09:30,630 >> Tada galėčiau užklausti kai nauja individualus, kai kitas vartotojas kaip aš 173 00:09:30,630 --> 00:09:34,520 ir paklausti, gerai, jei man patiko vienas iš šių filmų, 174 00:09:34,520 --> 00:09:38,600 galite padaryti prognozę apie kuris kitas filmai man gali patikti. 175 00:09:38,600 --> 00:09:41,890 Tai yra, jei man patiko Viduje Iš, kuris kitų filmų 176 00:09:41,890 --> 00:09:48,460 aš tikriausiai taip pat noriu pamatyti remiantis tuo, kas panašūs žmonės padarė? 177 00:09:48,460 --> 00:09:51,640 Tai yra, aš eisiu per Aš filtruojama per šį sąrašą 178 00:09:51,640 --> 00:09:54,520 ir sužinoti tik asmenys, kurie taip pat patiko 179 00:09:54,520 --> 00:09:57,680 Inside Out, kuris atitiko mano pageidavimus. 180 00:09:57,680 --> 00:10:00,824 Na, tai reiškia, kad Andy ir Samas, jie nepatiko Inside Out, 181 00:10:00,824 --> 00:10:02,240 todėl aš neketinu svarstyti juos. 182 00:10:02,240 --> 00:10:06,130 Aš ruošiuosi atsikratyti savo duomenų šiam palyginimui. 183 00:10:06,130 --> 00:10:09,750 >> Aš tada gali pažvelgti, kas Jason ir Sara minties ir sutampa 184 00:10:09,750 --> 00:10:13,780 iki kurios iš filmų, kad jie matė, kad aš ne, ar jiems patiko juos 185 00:10:13,780 --> 00:10:15,150 arba ne. 186 00:10:15,150 --> 00:10:17,820 Galėčiau tik suskaičiuoti, tarkim balsus. 187 00:10:17,820 --> 00:10:23,360 Taigi pakalikai, pavyzdžiui, gali turėti vieną balsuoti už jį, nes Jasonas patiko. 188 00:10:23,360 --> 00:10:27,170 Tiek Jasonas ir Sarah patiko Avengers, todėl būtų du balsus. 189 00:10:27,170 --> 00:10:30,700 Ir tik Jasonas patiko Ant Man, todėl norėčiau gauti vieną balsą. 190 00:10:30,700 --> 00:10:34,870 Taigi, jei aš turėjo tada rekomenduojame už save, kuri iš šių filmų 191 00:10:34,870 --> 00:10:41,470 Aš gali būti labiausiai tikėtina, kad žiūrėti, aš norėčiau turite pasirinkti amžius Ultron: Keršytojas. 192 00:10:41,470 --> 00:10:44,490 >> Taigi, bet kuris iš šių sistemos, o dabar aš naudoju 193 00:10:44,490 --> 00:10:49,260 duomenų, kad buvo sukurtas ne apie Pats filmas, bet apie lengvatas 194 00:10:49,260 --> 00:10:51,960 iš kitų naudotojų. 195 00:10:51,960 --> 00:10:54,150 Tai turi keletą žinoma sunkumų. 196 00:10:54,150 --> 00:10:55,920 Ką daryti, jei jūs neturite jokių kitų vartotojų? 197 00:10:55,920 --> 00:10:58,770 Na, tai vadinama paleidimo problema. 198 00:10:58,770 --> 00:11:03,760 Jūs turite keletą duomenų kiekis prieš jums 199 00:11:03,760 --> 00:11:07,560 galėtų pradėti uždirbti šių rekomendacijų. 200 00:11:07,560 --> 00:11:10,940 Pasitaiko tai yra vieną kartą pradėdami rinkti duomenis, 201 00:11:10,940 --> 00:11:13,870 jei galite surinkti daugiau ir vis daugiau duomenų, 202 00:11:13,870 --> 00:11:17,850 jums geriau ir geriau ir geriau rekomendacijos. 203 00:11:17,850 --> 00:11:21,650 >> Dabar mes galime išversti į tai kodas, kaip gerai. 204 00:11:21,650 --> 00:11:23,860 Mes galime nustatyti skirtingas rūšies struktūra, 205 00:11:23,860 --> 00:11:25,720 šiuo atveju mes jį vadiname vartotojas. 206 00:11:25,720 --> 00:11:30,970 Ir jis gavo funkcijas apie kurie filmai Šis vartotojas patiko. 207 00:11:30,970 --> 00:11:34,560 Ar jie patinka Inside Out, Pakalikai, Keršytojas, o skruzdė žmogus. 208 00:11:34,560 --> 00:11:36,660 Mes tada gali generuoti kai Pseudocode sekti 209 00:11:36,660 --> 00:11:39,460 ta pati procedūra, kad aš naudojamas anksčiau. 210 00:11:39,460 --> 00:11:43,460 Tai reiškia, kad suteikta pirma Vartotojas: x, tegul rekomenduoti filmą 211 00:11:43,460 --> 00:11:46,107 kad x gali patikti. 212 00:11:46,107 --> 00:11:47,940 Mes galime pereiti ir visiems filmus, 213 00:11:47,940 --> 00:11:51,410 mes galime inicijuoti rezultatą už tai filmas bus 0. 214 00:11:51,410 --> 00:11:54,080 Ir tada mes galime rasti visus kitų naudotojų, kurie 215 00:11:54,080 --> 00:11:57,630 turi tas pačias lengvatas kaip x. 216 00:11:57,630 --> 00:11:59,990 Ir tada kiekvienas filmas, kad jiems patiko, 217 00:11:59,990 --> 00:12:02,340 mes prieaugio tą filmą rezultatą. 218 00:12:02,340 --> 00:12:05,010 Kurį filmą į pabaigos turi didžiausią rezultatą, 219 00:12:05,010 --> 00:12:07,600 tai vienas aš turėtų rekomenduoti. 220 00:12:07,600 --> 00:12:09,890 >> Visa tai tikrai neaiški. 221 00:12:09,890 --> 00:12:11,600 Visa tai sudėtinga. 222 00:12:11,600 --> 00:12:15,810 Tai yra visi pagrindiniai algoritmai , kad galėtumėte įgyvendinti šiandien. 223 00:12:15,810 --> 00:12:20,050 >> Dabar su nekilnojamojo Rekomenduokite sistemų, paleisti į kai kurias problemas. 224 00:12:20,050 --> 00:12:23,300 Ką daryti, jei ten niekas, kas tiksliai atitinka Jūsų pageidavimus? 225 00:12:23,300 --> 00:12:27,170 Ką daryti, jei yra vartotojai, kurie yra tiksliai į jūsų pageidavimus, 226 00:12:27,170 --> 00:12:30,480 bet tada nukrypti drastiškai nuo to, ką norite? 227 00:12:30,480 --> 00:12:36,210 Man patinka klasikinis Godzilla Filmai, tačiau mano žmona nėra. 228 00:12:36,210 --> 00:12:39,430 Man patinka žiūrėti jiems: "Mano "Netflix" sąskaitos juos yra. 229 00:12:39,430 --> 00:12:41,800 Jos s neturi. 230 00:12:41,800 --> 00:12:45,230 Kas atsitinka, kai mes pradedame maišymo duomenis, kaip šis? 231 00:12:45,230 --> 00:12:47,690 Tai yra visi iššūkiai kad jūs galite įveikti 232 00:12:47,690 --> 00:12:51,900 jie tiesiog truputį daugiau sudėtingų algoritmų. 233 00:12:51,900 --> 00:12:56,420 >> Dabar realiame pasaulyje, kuris yra iš tikrųjų veikti, 234 00:12:56,420 --> 00:12:59,980 mes naudojame turinį, kurių filtravimo arba mes naudojame bendradarbiavimo filtravimas? 235 00:12:59,980 --> 00:13:01,910 Ir atsakymas yra mes naudojame abu. 236 00:13:01,910 --> 00:13:06,350 Beveik visi iš pagrindinių vartotojų šiuo atveju, "Amazon", "Facebook", "Netflix", 237 00:13:06,350 --> 00:13:11,200 Pandora, visi jie naudoja kombinaciją šie skirtingi rekomendacija sistemos. 238 00:13:11,200 --> 00:13:16,520 Ir kai mes deriname pasirinkimus nuo kiekvienas mes vadiname juos hibridiniai sistemos. 239 00:13:16,520 --> 00:13:20,750 Jie tam tikru būdu priklauso nuo bruožai paties objekto, 240 00:13:20,750 --> 00:13:24,710 ir tam tikrais būdais jie priklausys nuo kitų vartotojų pageidavimus. 241 00:13:24,710 --> 00:13:28,120 Šie hibridiniai sistemos, jie didelis verslas, 242 00:13:28,120 --> 00:13:30,830 ir jie kas dabartinis šiandien. 243 00:13:30,830 --> 00:13:32,839 >> Taigi labai ačiū už prisijungimą mane. 244 00:13:32,839 --> 00:13:35,380 Tikiuosi, kad jūs Dotarłeś šiek tiek tiek yra supratimo, kas 245 00:13:35,380 --> 00:13:37,430 daro šias sistemas darbą. 246 00:13:37,430 --> 00:13:41,980 Kitą kartą jūs internete, prisiminti, kad ne tik jums daryti įtaką savo pasirinkimą, 247 00:13:41,980 --> 00:13:44,680 tačiau potencialiai visi kiti taip pat. 248 00:13:44,680 --> 00:13:46,480 Ačiū dar kartą. 249 00:13:46,480 --> 00:13:47,186