1 00:00:00,000 --> 00:00:03,416 >> [MUSIC nagpe-play] 2 00:00:03,416 --> 00:00:05,860 3 00:00:05,860 --> 00:00:08,180 >> BRAIN SCASSELLATI: Welcome sa mga serye CS50 AI. 4 00:00:08,180 --> 00:00:12,600 Ang pangalan ko ay Scass, at ngayon kami ay pagpunta makipag-usap tungkol recommender systems. 5 00:00:12,600 --> 00:00:15,780 Ngayon recommender tunog systems tulad ng uri ng isang kakaibang pangalan. 6 00:00:15,780 --> 00:00:18,630 Ito tunog tulad marahil ito ay dapat na maging rekomendasyon sistema, 7 00:00:18,630 --> 00:00:21,290 at ako uri ng sumasang-ayon sa iyo. 8 00:00:21,290 --> 00:00:26,110 Ngunit ito ay ang sistema na makakatulong sa piliin ang mga katulad na mga bagay-bagay sa tuwing 9 00:00:26,110 --> 00:00:28,210 pumili ka ng isang bagay na online. 10 00:00:28,210 --> 00:00:32,119 Netflix, halimbawa ay magmumungkahi ng iba pang mga pelikula na baka gusto mong panoorin. 11 00:00:32,119 --> 00:00:36,660 O Pandora ay magmumungkahi ng iba't ibang kanta na maaaring gusto mong makinig sa. 12 00:00:36,660 --> 00:00:40,940 Amazon ay magmumungkahi ano ang mga uri ng iba pang mga produkto na maaaring gusto mong bumili. 13 00:00:40,940 --> 00:00:43,520 Facebook ay kahit na iminumungkahi ang ilan sa mga iba pang mga kaibigan 14 00:00:43,520 --> 00:00:45,440 na maaaring gusto mong idagdag. 15 00:00:45,440 --> 00:00:49,800 Bawat isa sa mga sistema ay tumatakbo na gumagamit ang parehong mga pangunahing uri ng mga algorithm, 16 00:00:49,800 --> 00:00:52,520 at iyon ang hindi namin pagpunta sa makipag-usap tungkol sa ngayon. 17 00:00:52,520 --> 00:00:56,860 >> Ngayon ang mga algorithm ay nakakagulat malaking negosyo. 18 00:00:56,860 --> 00:01:01,130 Netflix ng ilang taon na ang nakakaraan sa 2009 inalok ng $ 1 milyon 19 00:01:01,130 --> 00:01:07,240 prize kung maaari mong pagbutihin ang kanilang rekomendasyon ng sistema sa pamamagitan lamang ng 10%. 20 00:01:07,240 --> 00:01:11,960 Iyon 10%, bagaman, ay kumakatawan sa isang malaking halaga ng negosyo. 21 00:01:11,960 --> 00:01:15,330 Ang mga pagtatantiya ay mahirap dumating sa pamamagitan ng, ngunit maraming mga tao 22 00:01:15,330 --> 00:01:19,050 naniniwala na ang mga rekomendasyon sistema para sa isang online na pagbili 23 00:01:19,050 --> 00:01:25,729 system tulad ng Amazon lead sa tabi-tabi sa pagitan ng 10% at 25% mas mataas na kita. 24 00:01:25,729 --> 00:01:27,770 Kaya maaari mong isipin ang uri ng lakas ng tunog na ikaw ay 25 00:01:27,770 --> 00:01:32,860 pakikipag-usap tungkol sa kapag sa tingin namin tungkol kahit na ang mga maliit na mga algorithm. 26 00:01:32,860 --> 00:01:35,200 >> Kaya sabihin makakuha ng ilang mga halimbawa. 27 00:01:35,200 --> 00:01:38,460 Paano ay ito na ang mga sistema na talagang gumagana? 28 00:01:38,460 --> 00:01:40,773 May dalawang pangunahing uri ng mga algorithm na 29 00:01:40,773 --> 00:01:45,050 ay sa play sa usaping pagbuo ng mga rekomendasyon. 30 00:01:45,050 --> 00:01:48,650 Ang unang iyan ay tinatawag na based filter ng nilalaman. 31 00:01:48,650 --> 00:01:53,410 At sa pag-filter ng nilalaman na batay nakasalalay sa pagkakatulad sa pagitan ng mga item 32 00:01:53,410 --> 00:02:00,370 kanilang sarili, na nasa pagitan ng dalawang mga pelikula o dalawang kanta o dalawang mga bagay na binili. 33 00:02:00,370 --> 00:02:03,190 Kami ay pagpunta sa gamitin ang pelikula bilang isang halimbawa, ngunit ito 34 00:02:03,190 --> 00:02:07,850 maaaring mag-aplay, talaga, sa anumang uri ng object na kami ay naghahanap para sa. 35 00:02:07,850 --> 00:02:13,330 >> Kaya kung sa tingin ko ang tungkol sa ilang mga pelikula mula sa nakaraang taon, 36 00:02:13,330 --> 00:02:16,799 Nakita ko ang Inside Out sa ang mga anak ko, mga mahal nila ito. 37 00:02:16,799 --> 00:02:17,840 Ngunit nagkaroon din kami ng isang pagpipilian. 38 00:02:17,840 --> 00:02:21,350 Kami ay maaaring may nawala upang makita Minions, kami ay maaaring tumingin sa Edad ng Ultron, 39 00:02:21,350 --> 00:02:24,850 o maaari naming tumingin sa Ant Man sa mga sinehan. 40 00:02:24,850 --> 00:02:27,580 >> Para sa alinman sa mga ito mga pelikula, maaari naming isipin 41 00:02:27,580 --> 00:02:33,320 pagbuo ng isang listahan ng mga tampok o katangian ang tungkol sa mga iba't ibang mga pelikula. 42 00:02:33,320 --> 00:02:37,190 Kaya halimbawa, kaya kong isaalang-alang kung alin sa mga pelikula ay animated. 43 00:02:37,190 --> 00:02:39,960 Well, parehong Inside Out at Minions ay animated. 44 00:02:39,960 --> 00:02:44,140 Wala alinman sa Edad ng Ultron ni Ant Man mga animated movies. 45 00:02:44,140 --> 00:02:47,040 At ako ay maaaring magpalagay na gusali up ng isang istraktura, ang isang talahanayan na 46 00:02:47,040 --> 00:02:49,440 Inililista bawat isa sa mga katangian. 47 00:02:49,440 --> 00:02:51,790 Sigurado sila animated o hindi? 48 00:02:51,790 --> 00:02:54,780 Maaari ako pagkatapos magdagdag ng higit pa mga tampok sa talahanayan na ito 49 00:02:54,780 --> 00:02:58,380 sa pamamagitan ng pagdaragdag ng mas maraming mga hilera sa structure na ito. 50 00:02:58,380 --> 00:03:00,970 Maaari kong tanungin kung o hindi ang mga ito ay mga pelikula milagro. 51 00:03:00,970 --> 00:03:04,010 Well, Inside Out at Minions hindi movies milagro, 52 00:03:04,010 --> 00:03:06,715 Edad ng Ultron at Ant Man tiyak. 53 00:03:06,715 --> 00:03:09,100 >> At ako ay maaaring humingi ng anumang uri ng iba't ibang mga katangian 54 00:03:09,100 --> 00:03:12,080 na nais ko, ang anumang mga uri ng mga tampok na maaaring mahalaga sa akin. 55 00:03:12,080 --> 00:03:13,440 Sila ay may isang super kontrabida ba? 56 00:03:13,440 --> 00:03:16,700 Well, walang super kontrabida sa Inside Out, ngunit may mga bago sa Minions 57 00:03:16,700 --> 00:03:19,990 at sa, malinaw naman, ang dalawang superhero movies. 58 00:03:19,990 --> 00:03:23,900 >> Maaari ko ring magtanong ng mga bagay tulad ng, well, gawin nila pumasa sa pagsubok Bechdel? 59 00:03:23,900 --> 00:03:27,280 Sigurado pinangalanan mayroong dalawang female character na 60 00:03:27,280 --> 00:03:30,550 gumastos ng ilang makabuluhang halaga ng oras sa pagkakaroon ng isang pag-uusap na 61 00:03:30,550 --> 00:03:34,400 ay hindi kasangkot sa mga lalaki sa cast? 62 00:03:34,400 --> 00:03:39,870 Well, sa kasong ito, magbabalik Inside Out ang mga pagsubok, nabigo Minions, Age of Ultron 63 00:03:39,870 --> 00:03:42,990 pumasa sa pagsubok, at nabigo Ant Man. 64 00:03:42,990 --> 00:03:45,020 Anumang isa sa mga tampok na ito Kaya kong isipin ang tungkol sa 65 00:03:45,020 --> 00:03:48,660 bilang mahalaga para sa ilang mga tao. 66 00:03:48,660 --> 00:03:52,000 >> Maaari ko ring magtanong ng mga bagay tulad ng mga Mayroon bang anumang mga tao sa mga pelikula na 67 00:03:52,000 --> 00:03:57,190 mga alumni mula sabihin natin, Parke at Libangan, ang isa sa aking mga paboritong palabas. 68 00:03:57,190 --> 00:04:00,540 Well, Inside Out may Amy Poehler, na ang isang Alumni. 69 00:04:00,540 --> 00:04:01,530 Iyon ang binibilang. 70 00:04:01,530 --> 00:04:04,110 Jon Hamm ay sa Minions. 71 00:04:04,110 --> 00:04:08,600 Paul Rudd ay sa Ant Man, ngunit walang isa sa Edad ng Ultron ay sa Parke at Req 72 00:04:08,600 --> 00:04:10,150 din. 73 00:04:10,150 --> 00:04:12,990 Kaya ang maaari kong bumuo ng up ang listahan ng mga mga tampok, at maaaring sila ay talagang 74 00:04:12,990 --> 00:04:14,710 maging anumang bagay tungkol sa mga movies. 75 00:04:14,710 --> 00:04:17,329 Sila ay maaaring maging tungkol sa kung ano aspect ratio sila ay pagbaril sa, 76 00:04:17,329 --> 00:04:21,630 maaaring ito ay kung gaano karaming mga upuan nila ibinebenta sa kanilang opening weekend. 77 00:04:21,630 --> 00:04:25,630 Anumang mga tampok na gusto kong bumuo ang maaari kong ilagay sa talahanayan na ito. 78 00:04:25,630 --> 00:04:29,600 >> Ngayon, sa kasong ito, na binuo ko lahat ng uri ng Bullion halaga, 79 00:04:29,600 --> 00:04:33,700 oo o hindi, pumasa o mabibigo, ngunit maaaring sila ay kahit ano. 80 00:04:33,700 --> 00:04:36,690 Sila ay maaaring maging di-makatwirang halaga. 81 00:04:36,690 --> 00:04:39,070 Para sa pag-filter ng nilalaman na batay, kung ano ang namin ang pagpunta sa gawin 82 00:04:39,070 --> 00:04:42,810 ay kami ay pagpunta upang isaalang-alang dalawang mga hanay sa talahanayan na ito 83 00:04:42,810 --> 00:04:45,660 at makita kung gaano magkakatulad ang mga ito. 84 00:04:45,660 --> 00:04:48,640 Kaya halimbawa, kung ako nagpunta upang makita Inside Out, 85 00:04:48,640 --> 00:04:53,640 Baka ako tanungin, ano ang ibang mga pelikula na baka ako ay handa upang pumunta makita. 86 00:04:53,640 --> 00:04:56,890 Iyon ay, kung ano ang handang gastusin ang aking pera upang pumunta makita. 87 00:04:56,890 --> 00:05:00,310 At maaari ko bang ihambing ito sa pamamagitan ng pagkuha lamang ang dalawang mga haligi, isa mula sa Inside Out 88 00:05:00,310 --> 00:05:03,300 at isa mula sa alinman sa mga iba pang mga pelikula, at lamang ang nakakakita 89 00:05:03,300 --> 00:05:06,210 kung ilan sa kanilang mga tugma tampok. 90 00:05:06,210 --> 00:05:09,660 Kaya kung ihahambing ko ang Inside Out may Minions, well, may 91 00:05:09,660 --> 00:05:10,910 tatlong bagay dito na tumutugma. 92 00:05:10,910 --> 00:05:16,200 Sila ay parehong animated, alinman sa mga ito mga pelikula milagro, at pareho ng mga ito 93 00:05:16,200 --> 00:05:18,420 Mayroon Parks at Req alumni. 94 00:05:18,420 --> 00:05:20,420 Kaya maaari kong bilangin up kung paano maraming mga tugma mayroong, 95 00:05:20,420 --> 00:05:22,640 at sa kasong ito may gusto maging tatlo. 96 00:05:22,640 --> 00:05:26,450 >> Kung pagkatapos ay i-kumpara Inside Out may sabihin natin Edad ng Ultron, 97 00:05:26,450 --> 00:05:28,430 Maaari ko bang tingnan ang listahan at sabihin mo, well, may 98 00:05:28,430 --> 00:05:30,140 lamang ng isang bagay na tumutugma doon. 99 00:05:30,140 --> 00:05:34,560 Sila ay parehong pumasa sa pagsubok Bechtel, kaya na ay magiging isang puntos ng isa. 100 00:05:34,560 --> 00:05:36,770 At sa pagitan Inside Out at Ant Man, muli kong 101 00:05:36,770 --> 00:05:41,420 maaaring ihambing bawat linya nito kung gaano karaming mga bagay na tumugma sa pagitan ng dalawa sa kanila. 102 00:05:41,420 --> 00:05:43,060 Well, isa ay animated, ang isa ay hindi. 103 00:05:43,060 --> 00:05:44,970 One ay isang milagro movie, isa ay hindi. 104 00:05:44,970 --> 00:05:47,280 Nakakuha One ng isang sobrang kontrabida, ang iba pang ay hindi. 105 00:05:47,280 --> 00:05:49,480 One magbabalik ang Bechtel test, nabigo ang isa sa mga ito, 106 00:05:49,480 --> 00:05:54,450 ngunit sila ay parehong may mga Parke at Req alumni, kaya muli, ito ay makakakuha ng isang marka ng isa. 107 00:05:54,450 --> 00:05:58,300 >> Kaya kung ako ay naghahanap para sa mga pelikula na katulad ng sa Inside Out, 108 00:05:58,300 --> 00:06:02,170 Kaya kong tumingin para sa mga pelikula na mayroon ang pinakamataas na iskor sa loob ng nilalaman 109 00:06:02,170 --> 00:06:03,952 scheme filtering. 110 00:06:03,952 --> 00:06:05,660 Kaya sa kasong ito, ako isaalang-alang ang Minions 111 00:06:05,660 --> 00:06:08,330 upang maging mas malapit at mas malamang na maging isang bagay 112 00:06:08,330 --> 00:06:13,250 na ako ay gumastos ng pera upang makita sa Edad ng Ultron o Ant Man. 113 00:06:13,250 --> 00:06:16,150 >> Based Ang mga nilalaman filtering systems lamang umaasa 114 00:06:16,150 --> 00:06:18,670 sa mga katangian ng mga pelikula, at sa gayon ako 115 00:06:18,670 --> 00:06:21,930 maaaring bumuo ng mga pamamagitan lamang ng karunungan isang bagay tungkol sa mga produkto 116 00:06:21,930 --> 00:06:23,500 na mayroon akong. 117 00:06:23,500 --> 00:06:26,050 Maaari ko bang gamitin ang anumang uri ng mga tampok na gusto ko, 118 00:06:26,050 --> 00:06:28,400 at maaari ba akong bumuo ng higit pa kumplikadong mga tampok na 119 00:06:28,400 --> 00:06:33,060 magdawit ng mas kumplikadong mga test ng isang kalidad na pumunta ako kasama. 120 00:06:33,060 --> 00:06:39,080 Sa katunayan, maaaring kahit ko bang tingnan ang talahanayan na ito hindi bilang isang static na bagay, 121 00:06:39,080 --> 00:06:43,110 ngunit sa halip na rin ang pagiging sukat sa loob ng isang mas malaking espasyo ng estado. 122 00:06:43,110 --> 00:06:46,295 At maaari ko bang simulan ang pakikipag-usap tungkol sa distansya sa pagitan ng iba't ibang movies. 123 00:06:46,295 --> 00:06:49,300 124 00:06:49,300 --> 00:06:51,050 Ito ang lahat ng mga bagay-bagay na alam namin kung paano sila 125 00:06:51,050 --> 00:06:55,860 gawin gamit ang mga uri ng istruktura ng data na kami ay nakita ko na sa CS50. 126 00:06:55,860 --> 00:06:59,180 Kaya maaari kong isipin na gusali isang istraktura ng data para sa isang pelikula. 127 00:06:59,180 --> 00:07:02,390 May isang struct na ko itinayo tinatawag movie, 128 00:07:02,390 --> 00:07:04,369 at ito ay may limang Boolean entries sa loob nito. 129 00:07:04,369 --> 00:07:07,160 Ay animated ito, ito ay isang milagro pelikula, ang magkaroon ng isang super kontrabida, 130 00:07:07,160 --> 00:07:11,047 ay ito pumasa sa pagsubok Bechdel, at ang naroon Parks at Rec alumni sa loob nito? 131 00:07:11,047 --> 00:07:12,880 At bawat isa sa mga ito ay isang istraktura ng data na ako 132 00:07:12,880 --> 00:07:16,330 maaaring sumakop para sa partikular na pelikula. 133 00:07:16,330 --> 00:07:20,090 >> Pagkatapos compute kung dalawang pelikula ay katulad o hindi, 134 00:07:20,090 --> 00:07:23,330 ano ang kanilang mga iskor ay, maaari ko isulat ang isang hanay ng mga pseudocode na 135 00:07:23,330 --> 00:07:25,120 bumubuo na parehong function. 136 00:07:25,120 --> 00:07:30,100 Iyon ay, na ibinigay ng ilang pelikula M1, maaari ko hanapin ang pinaka-katulad na movie na ito 137 00:07:30,100 --> 00:07:32,430 pamamagitan ng pagsunod sa pseudocode. 138 00:07:32,430 --> 00:07:37,040 Isaalang-alang ko na kung saan ay ang pinakamahusay na pagmamarka ng sistema na na nahanap ko, 139 00:07:37,040 --> 00:07:39,920 ang pinakamahusay na mga paghahambing na nalaman ko. 140 00:07:39,920 --> 00:07:41,890 Para sa lahat ng iba pang movie Pupunta ako sa pumunta sa pamamagitan ng, 141 00:07:41,890 --> 00:07:44,920 Kukunin ko i-set ang isang marka match katumbas ng 0. 142 00:07:44,920 --> 00:07:47,920 At kukunin ko na pumunta sa pamamagitan ng na movie, isang M1, ang pelikula 143 00:07:47,920 --> 00:07:51,500 Ako makapagsimula sa, kukunin ko na suriin ang bawat isa at ang bawat tampok 144 00:07:51,500 --> 00:07:53,650 na mayroon sila upang makita ang kung may isang match. 145 00:07:53,650 --> 00:07:56,460 Kung mayroong isang pares, kukunin ko paglakas ng pagtutugma ng kalidad. 146 00:07:56,460 --> 00:08:00,480 At kung sa tapusin ang tumugma sa iskor na Ako ay mas mahusay kaysa sa mga kasalukuyang pinakamahusay na 147 00:08:00,480 --> 00:08:03,310 puntos, at pagkatapos ay makikita ko ang tandaan na ang pinakamahusay na iskor, 148 00:08:03,310 --> 00:08:05,820 at ito ay ang pinakamahusay na tugma na mayroon ako. 149 00:08:05,820 --> 00:08:09,450 Sa katapusan, kahit anong movie ay nakaupo sa pinakamahusay na tugma, 150 00:08:09,450 --> 00:08:12,580 iyon ang pinakamalapit Napuntahan ko na dumating. 151 00:08:12,580 --> 00:08:14,890 Kaya batay sa mga nilalaman filtering systems, 152 00:08:14,890 --> 00:08:16,900 lahat sila ay may mga ito ng pangunahing istraktura. 153 00:08:16,900 --> 00:08:20,910 Sila ay umaasa sa mga item na pinag-uusapan at wala 154 00:08:20,910 --> 00:08:24,590 tungkol sa alinman sa mga kagustuhan ng gumagamit. 155 00:08:24,590 --> 00:08:29,010 >> Ang iba pang mga mekanismo na ginagamit namin sa order upang bumuo ng rekomendasyon sistema 156 00:08:29,010 --> 00:08:31,790 ay tinatawag collaborative filtering. 157 00:08:31,790 --> 00:08:36,520 Tulungang filtering ay nakasalalay sa hindi ang mga katangian ng bagay mismo, 158 00:08:36,520 --> 00:08:40,010 ngunit kung paano ang mga tao, ang ibang mga gumagamit na ay, kung paano sila Na 159 00:08:40,010 --> 00:08:43,370 tumugon sa mga parehong bagay. 160 00:08:43,370 --> 00:08:48,720 Kaya upang magpatuloy sa aking mga halimbawa ng pelikula, Maaari ako kumuha ng isang bungkos ng mga kaibigan ko 161 00:08:48,720 --> 00:08:53,180 at survey ang mga ito tungkol sa kung o Hindi nagustuhan nila partikular na mga pelikula. 162 00:08:53,180 --> 00:08:56,560 Ngayon iba't-ibang lugar ay bubuo ng ang data na ito sa iba't ibang paraan. 163 00:08:56,560 --> 00:08:59,630 Maaari kang direktang survey na ang iyong gumagamit, o maaari mo lamang 164 00:08:59,630 --> 00:09:03,120 makita kung ano ang pinili nila kung ikaw ay, halimbawa Netflix. 165 00:09:03,120 --> 00:09:05,640 Aling mga pelikula ay nilang panoorin? 166 00:09:05,640 --> 00:09:08,670 >> Maaaring tanong ko ang ilan sa aking mga mga kaibigan dito at alamin kung 167 00:09:08,670 --> 00:09:12,910 na nagustuhan Jason ang bawat pelikula Nakita niya, hindi nakakagulat doon. 168 00:09:12,910 --> 00:09:15,590 Lamang nagustuhan Andy Minions at tiyahin Man. 169 00:09:15,590 --> 00:09:19,330 Nagustuhan Sarah Inside Out at Avengers, ang kabaligtaran ng Andy. 170 00:09:19,330 --> 00:09:22,200 At Sam, well, Sam nagustuhan sa lahat ng mga superhero movies, 171 00:09:22,200 --> 00:09:24,960 ngunit wala sa mga animated movies. 172 00:09:24,960 --> 00:09:30,630 >> Maaari ko pagkatapos ay sa query para sa ilang bagong indibidwal na, ang ilang mga iba pang mga user tulad ng aking sarili 173 00:09:30,630 --> 00:09:34,520 at tanungin, well, kung nagustuhan ko isa sa mga movies, 174 00:09:34,520 --> 00:09:38,600 maaari kang gumawa ng isang hula tungkol sa kung saan ang ibang mga pelikula na maaaring magustuhan ko. 175 00:09:38,600 --> 00:09:41,890 Iyon ay, kung nagustuhan ko Inside Out, kung saan ang ibang mga pelikula 176 00:09:41,890 --> 00:09:48,460 malamang kong ring nais na makita ako batay sa kung ano ang ginawa katulad na mga tao? 177 00:09:48,460 --> 00:09:51,640 Iyon ay, kukunin ko na pumunta sa pamamagitan ng isang Kukunin ko i-filter sa pamamagitan ng listahang ito 178 00:09:51,640 --> 00:09:54,520 at hanapin lamang ang mga indibidwal na din nagustuhan 179 00:09:54,520 --> 00:09:57,680 Baligtad, na tumugma sa aking mga kagustuhan. 180 00:09:57,680 --> 00:10:00,824 Well, na nangangahulugan na ang Andy at Sam, hindi nila gusto Inside Out, 181 00:10:00,824 --> 00:10:02,240 kaya hindi ako pagpunta sa isaalang-alang ang mga ito. 182 00:10:02,240 --> 00:10:06,130 Pupunta ako sa mapupuksa ang kanilang mga data para sa paghahambing na ito. 183 00:10:06,130 --> 00:10:09,750 >> Maaari kong pagkatapos ay tingnan kung ano ang Jason at naisip Sarah at tally 184 00:10:09,750 --> 00:10:13,780 up na ng pelikula na nakita nila na ako ay hindi, kung nagustuhan nila ang mga ito 185 00:10:13,780 --> 00:10:15,150 o hindi. 186 00:10:15,150 --> 00:10:17,820 Kaya kong bilangin lang up, sabihin natin na boto. 187 00:10:17,820 --> 00:10:23,360 Kaya Minions, halimbawa ay maaaring magkaroon ng isa bumoto para sa mga ito, dahil nagustuhan ito Jason. 188 00:10:23,360 --> 00:10:27,170 Nagustuhan Parehong Jason at Sarah Avengers, kaya ito ay may dalawang mga boto. 189 00:10:27,170 --> 00:10:30,700 At lamang nagustuhan Jason Ant Man, kaya ito ay makakuha ng isang boto. 190 00:10:30,700 --> 00:10:34,870 Kaya kung ako ay upang pagkatapos ay pinapayo para sa aking sarili kung alin sa mga pelikula 191 00:10:34,870 --> 00:10:41,470 Ito ay maaaring maging pinaka-malamang na panoorin ko, nais ko kung piliin ang Edad ng Ultron: Avengers. 192 00:10:41,470 --> 00:10:44,490 >> Kaya para sa alinman sa mga ito systems, ngayon gumagamit ako ng 193 00:10:44,490 --> 00:10:49,260 data na nabuo hindi tungkol sa mga movie mismo, ngunit tungkol sa mga kagustuhan 194 00:10:49,260 --> 00:10:51,960 mula sa iba pang mga gumagamit. 195 00:10:51,960 --> 00:10:54,150 Na ito ay may ilang mga problema ng mga kurso. 196 00:10:54,150 --> 00:10:55,920 Paano kung hindi ka magkaroon ng anumang iba pang mga gumagamit? 197 00:10:55,920 --> 00:10:58,770 Well, na tinatawag na startup problema. 198 00:10:58,770 --> 00:11:03,760 Mayroon kang magkaroon ng ilang mga dami ng data nang hindi ka pa 199 00:11:03,760 --> 00:11:07,560 magagawang upang simulan ang paggawa ang mga rekomendasyon. 200 00:11:07,560 --> 00:11:10,940 Ang kasalungat ng ito ay isang beses simulan mo sa pagkolekta ng data, 201 00:11:10,940 --> 00:11:13,870 kung maaari mong mangolekta ng higit pang at higit pa at mas maraming data, 202 00:11:13,870 --> 00:11:17,850 makakakuha ka ng mas mahusay at mas mahusay na at mas mahusay na mga rekomendasyon. 203 00:11:17,850 --> 00:11:21,650 >> Ngayon kami ay maaaring isalin ito sa code pati na rin. 204 00:11:21,650 --> 00:11:23,860 Maaari naming tukuyin ang isang iba't ibang mga uri ng istraktura, 205 00:11:23,860 --> 00:11:25,720 sa kasong ito makikita ang tawag namin ito ng isang user. 206 00:11:25,720 --> 00:11:30,970 At ito ay nakuha ng mga tampok tungkol sa kung aling mga pelikula nagustuhan ang user na ito. 207 00:11:30,970 --> 00:11:34,560 Gusto ba nila Inside Out, Minions, Avengers, at Ant Man. 208 00:11:34,560 --> 00:11:36,660 Maaari naming pagkatapos ay bumuo ng ilang pseudocode upang sundin 209 00:11:36,660 --> 00:11:39,460 ang parehong pamamaraan na ginamit ko dati. 210 00:11:39,460 --> 00:11:43,460 Iyon ay, na ibinigay ng isang partikular na user x, inirerekumenda ng isang movie ipaalam 211 00:11:43,460 --> 00:11:46,107 Maaaring gusto na x. 212 00:11:46,107 --> 00:11:47,940 Maaari naming pumunta sa pamamagitan at para sa lahat ng mga movies, 213 00:11:47,940 --> 00:11:51,410 maaari naming initialize ang isang marka para sa pelikula na 0. 214 00:11:51,410 --> 00:11:54,080 At pagkatapos ay maaari mahanap namin ang lahat ng ng iba pang mga gumagamit na 215 00:11:54,080 --> 00:11:57,630 magkakaroon ng parehong mga kagustuhan bilang x. 216 00:11:57,630 --> 00:11:59,990 At pagkatapos ay para sa bawat pelikula na nagustuhan nila, 217 00:11:59,990 --> 00:12:02,340 ipapakita namin pagdami ang mga marka ng na movie. 218 00:12:02,340 --> 00:12:05,010 Alinmang movie sa end ay ang pinakamataas na iskor, 219 00:12:05,010 --> 00:12:07,600 na ang isa ay dapat ko inirerekumenda. 220 00:12:07,600 --> 00:12:09,890 >> Wala sa mga ito ay talagang nakatago. 221 00:12:09,890 --> 00:12:11,600 Wala sa mga ito ay mahirap na. 222 00:12:11,600 --> 00:12:15,810 Ito ang lahat ng mga pangunahing mga algorithm na maaari mong ipatupad ngayon. 223 00:12:15,810 --> 00:12:20,050 >> Ngayon na may real recommender systems, tumakbo ka sa ilang mga problema. 224 00:12:20,050 --> 00:12:23,300 Paano kung may walang tao na tumutugma nang eksakto sa iyong mga kagustuhan? 225 00:12:23,300 --> 00:12:27,170 Paano kung may mga gumagamit na ay eksakto ang iyong mga kagustuhan, 226 00:12:27,170 --> 00:12:30,480 ngunit pagkatapos ay mag-iba ng husto mula sa kung ano ang gusto mo? 227 00:12:30,480 --> 00:12:36,210 Gusto ko classic Godzilla mga pelikula, ngunit ang aking asawa ay hindi. 228 00:12:36,210 --> 00:12:39,430 Gusto ko na panoorin ang mga ito, ang aking Netflix account ay naglalaman ng mga ito. 229 00:12:39,430 --> 00:12:41,800 Ang kanyang ay hindi. 230 00:12:41,800 --> 00:12:45,230 Ano ang mangyayari kapag binuksan namin paghahalo ng data tulad nito? 231 00:12:45,230 --> 00:12:47,690 Ito ang lahat ng mga hamon na maaari mong pagtagumpayan, 232 00:12:47,690 --> 00:12:51,900 tumagal lamang sila ng bahagyang mas kumplikadong mga algorithm. 233 00:12:51,900 --> 00:12:56,420 >> Ngayon sa tunay na mundo, na kung saan mga tunay na pagpapatakbo, 234 00:12:56,420 --> 00:12:59,980 gumagamit kami ng pag-filter batay sa nilalaman o tayo gumagamit collaborative filtering? 235 00:12:59,980 --> 00:13:01,910 At ang sagot ay na ginagamit namin ang dalawang iyan. 236 00:13:01,910 --> 00:13:06,350 Halos lahat ng mga pangunahing mga gumagamit sa kasong ito, Amazon, Facebook, Netflix, 237 00:13:06,350 --> 00:13:11,200 Pandora, lahat sila ay gumamit ng isang kumbinasyon ng mga mga iba't ibang mga rekomendasyon ng mga sistema. 238 00:13:11,200 --> 00:13:16,520 At kapag pinagsama natin ang mga pagpipilian mula sa ang bawat isa, ang tawag namin sa mga ito systems hybrid. 239 00:13:16,520 --> 00:13:20,750 Sila sa ilang mga paraan depende sa mga mga katangian ng mga bagay sa sarili, 240 00:13:20,750 --> 00:13:24,710 at sa ilang mga paraan depende sila sa ang mga kagustuhan ng iba pang mga gumagamit. 241 00:13:24,710 --> 00:13:28,120 Ang mga hybrid system, ang mga ito ay malaking negosyo, 242 00:13:28,120 --> 00:13:30,830 at ang mga ito kung ano ang kasalukuyang araw na ito. 243 00:13:30,830 --> 00:13:32,839 >> Kaya salamat talaga sa pagsama sa akin. 244 00:13:32,839 --> 00:13:35,380 Umaasa ako na iyong nakuha ng isang maliit na bit ng isang pag-unawa sa kung ano ang 245 00:13:35,380 --> 00:13:37,430 gumagawa ng mga sistema ng trabaho. 246 00:13:37,430 --> 00:13:41,980 Susunod na oras na ikaw ay online, tandaan na hindi lamang sa iyo pag-impluwensya sa iyong mga pagpipilian, 247 00:13:41,980 --> 00:13:44,680 ngunit potensyal na ang iba ay pati na rin. 248 00:13:44,680 --> 00:13:46,480 Salamat ulit. 249 00:13:46,480 --> 00:13:47,186