1 00:00:00,000 --> 00:00:03,416 >> [Muzika] 2 00:00:03,416 --> 00:00:05,860 3 00:00:05,860 --> 00:00:08,180 >> BRAIN SCASSELLATI: Mirë se vini në seri CS50 UA. 4 00:00:08,180 --> 00:00:12,600 Emri im është Scass, dhe sot ne jemi duke shkuar për të folur në lidhje me sistemet rekomanduesi. 5 00:00:12,600 --> 00:00:15,780 Sistemet tani rekomanduesi tinguj lloj si një emër i rastësishëm. 6 00:00:15,780 --> 00:00:18,630 Kjo tingëllon si ndoshta kjo duhet të jetë sistemet rekomandim, 7 00:00:18,630 --> 00:00:21,290 dhe unë lloj të pajtohem me ju. 8 00:00:21,290 --> 00:00:26,110 Por këto janë sisteme që ndihmojnë zgjidhni nga gjëra të ngjashme kurdo 9 00:00:26,110 --> 00:00:28,210 ju zgjidhni diçka në internet. 10 00:00:28,210 --> 00:00:32,119 Netflix, për shembull, do të sugjerojë të tjera filma që ju mund të dëshironi të shihni. 11 00:00:32,119 --> 00:00:36,660 Ose Pandora do të sugjerojë ndryshme këngët që ju mund të dëshironi për të dëgjuar për të. 12 00:00:36,660 --> 00:00:40,940 Amazon do të sugjerojë se çfarë lloj të produkte të tjera që ju mund të dëshironi të blini. 13 00:00:40,940 --> 00:00:43,520 Facebook do të sugjerojë edhe disa miq të tjerë 14 00:00:43,520 --> 00:00:45,440 që ju mund të dëshironi të shtoni. 15 00:00:45,440 --> 00:00:49,800 Secili nga këto sisteme funksionojnë duke përdorur të njëjtin lloj themelor i algorithm, 16 00:00:49,800 --> 00:00:52,520 dhe kjo është ajo që ne jemi do të flasim për sot. 17 00:00:52,520 --> 00:00:56,860 >> Tani këto algoritme janë biznes çuditërisht i madh. 18 00:00:56,860 --> 00:01:01,130 Netflix disa vite më parë në 2009 ofroi një 1.000.000 $ 19 00:01:01,130 --> 00:01:07,240 çmimi nëse ju mund të përmirësojë tyre sistem rekomandim me vetëm 10%. 20 00:01:07,240 --> 00:01:11,960 Se 10%, edhe pse, përfaqëson një sasi të konsiderueshme të biznesit. 21 00:01:11,960 --> 00:01:15,330 Vlerësimet janë të vështirë për të ardhur nga, por shumë njerëz 22 00:01:15,330 --> 00:01:19,050 besojnë se këto rekomandim sistemet për një blerje online 23 00:01:19,050 --> 00:01:25,729 sistemi si Amazon çojë në diku ndërmjet 10% dhe 25% rritjen e të ardhurave. 24 00:01:25,729 --> 00:01:27,770 Kështu që ju mund të imagjinoni lloj i vëllimit që ju jeni 25 00:01:27,770 --> 00:01:32,860 duke folur për kur mendojmë për edhe këto algoritme pak. 26 00:01:32,860 --> 00:01:35,200 >> Pra, le të marrë disa shembuj. 27 00:01:35,200 --> 00:01:38,460 Si është e mundur që këto Sisteme të vërtetë punojnë? 28 00:01:38,460 --> 00:01:40,773 Ka dy themelore llojet e algoritme që 29 00:01:40,773 --> 00:01:45,050 janë në lojë kur flasim për Rekomandimet gjeneruese. 30 00:01:45,050 --> 00:01:48,650 Të parat janë quajtur përmbajtje filtrim bazuar. 31 00:01:48,650 --> 00:01:53,410 Dhe përmbajtjen filtrim bazuar mbështetet mbi ngjashmëritë në mes të artikujve 32 00:01:53,410 --> 00:02:00,370 vetë, që është në mes të dy filma ose dy këngë ose dy artikujt e blerë. 33 00:02:00,370 --> 00:02:03,190 Ne jemi duke shkuar për të përdorur filmat si një shembull, por kjo 34 00:02:03,190 --> 00:02:07,850 mund të aplikojë, me të vërtetë, për çdo lloj i objektit që ne jemi duke kërkuar për të. 35 00:02:07,850 --> 00:02:13,330 >> Pra, nëse unë mendoj për disa filma nga viti i kaluar, 36 00:02:13,330 --> 00:02:16,799 Unë pashë Inside Out me fëmijët e mi, ata e donin atë. 37 00:02:16,799 --> 00:02:17,840 Por ne gjithashtu kishte një zgjedhje. 38 00:02:17,840 --> 00:02:21,350 Ne mund të ketë shkuar për të parë Minions, ne mund të shihet Mosha e ULTRON, 39 00:02:21,350 --> 00:02:24,850 ose ne mund të kemi parë Njeriu Ant në teatro. 40 00:02:24,850 --> 00:02:27,580 >> Për ndonjë nga këto filma, ne mund të imagjinohet 41 00:02:27,580 --> 00:02:33,320 gjeneruar një listë të karakteristika ose Cilësitë për ato filma të ndryshëm. 42 00:02:33,320 --> 00:02:37,190 Kështu për shembull, unë mund të konsiderojnë cila prej këtyre filmave janë të animuar. 43 00:02:37,190 --> 00:02:39,960 E pra, të dyja Inside Out dhe Minions janë të animuar. 44 00:02:39,960 --> 00:02:44,140 As Mosha e ULTRON as Ant Njeriu janë filma të animuar. 45 00:02:44,140 --> 00:02:47,040 Dhe unë mund të imagjinohet ndërtesë up një strukturë, një tavolinë që 46 00:02:47,040 --> 00:02:49,440 listat secili prej këtyre pronave. 47 00:02:49,440 --> 00:02:51,790 A janë ata të animuar apo jo? 48 00:02:51,790 --> 00:02:54,780 Unë pastaj mund të shtoni më shumë Karakteristika në këtë tabelë 49 00:02:54,780 --> 00:02:58,380 duke shtuar më shumë rreshtave në këtë strukturë. 50 00:02:58,380 --> 00:03:00,970 Unë mund të pyes nëse janë apo jo ata janë filma Marvel. 51 00:03:00,970 --> 00:03:04,010 E pra, Inside Out dhe Minions nuk janë filma Marvel, 52 00:03:04,010 --> 00:03:06,715 Mosha e ULTRON dhe Ant njeriut me siguri janë. 53 00:03:06,715 --> 00:03:09,100 >> Dhe unë mund të kërkoj të gjitha llojet Cilësitë e ndryshme 54 00:03:09,100 --> 00:03:12,080 që kam kërkuar, të gjitha llojet e karakteristika të që mund të jetë e rëndësishme për mua. 55 00:03:12,080 --> 00:03:13,440 A kanë një zuzar super? 56 00:03:13,440 --> 00:03:16,700 E pra, nuk ka shejtan super në Inside Jashtë, por ato nuk janë në Minions 57 00:03:16,700 --> 00:03:19,990 dhe në, natyrisht, Dy filma Superhero. 58 00:03:19,990 --> 00:03:23,900 >> Unë mund të kërkoj gjëra të tilla si, mirë, ata kalojnë testin Bechdel? 59 00:03:23,900 --> 00:03:27,280 A ka dy quajtur personazhet femra që 60 00:03:27,280 --> 00:03:30,550 kalojnë disa sasi të konsiderueshme të Ora paturit e një bisedë që 61 00:03:30,550 --> 00:03:34,400 nuk përfshin burra në të hedhura? 62 00:03:34,400 --> 00:03:39,870 E pra, në këtë rast, Inside Out kalon testi, Minions dështon, Age of ULTRON 63 00:03:39,870 --> 00:03:42,990 kalon testin, dhe Ant Njeriu dështon. 64 00:03:42,990 --> 00:03:45,020 Çdo njëri nga këto karakteristika Unë mund të mendoj për 65 00:03:45,020 --> 00:03:48,660 si të rëndësishme për disa njerëz. 66 00:03:48,660 --> 00:03:52,000 >> Unë mund të kërkoj gjëra të tilla si janë ka ndonjë popull në këto filma që 67 00:03:52,000 --> 00:03:57,190 janë alumni nga le të themi, parqet dhe Rekreative, një nga shfaqjet e mia të preferuar. 68 00:03:57,190 --> 00:04:00,540 E pra, Inside Out ka Amy Poehler, kjo është një Alumni. 69 00:04:00,540 --> 00:04:01,530 Që ka rëndësi. 70 00:04:01,530 --> 00:04:04,110 Jon Hamm ishte në Minions. 71 00:04:04,110 --> 00:04:08,600 Paul Rudd ishte në Ant njeriut, por askush nuk në Epokën e ULTRON ishte në parqe dhe req 72 00:04:08,600 --> 00:04:10,150 gjithashtu. 73 00:04:10,150 --> 00:04:12,990 Kështu që unë mund të ndërtojë këtë listë të karakteristika, dhe ata mund të vërtetë 74 00:04:12,990 --> 00:04:14,710 të jetë çdo gjë në lidhje me filmat. 75 00:04:14,710 --> 00:04:17,329 Ato mund të jenë në lidhje me atë raport aspekt ata u pushkatuan në, 76 00:04:17,329 --> 00:04:21,630 ajo mund të jetë sa vende ata shitur në fundjavë e tyre hapjes. 77 00:04:21,630 --> 00:04:25,630 Çdo tipar që unë dua të gjenerojë unë mund të vënë në këtë tryezë. 78 00:04:25,630 --> 00:04:29,600 >> Tani, në këtë rast, unë kam ndërtuar të gjitha llojet e vlerave shufra ari ose argjendi, 79 00:04:29,600 --> 00:04:33,700 po ose jo, kalojë ose të dështojnë, por ato mund të jetë çdo gjë. 80 00:04:33,700 --> 00:04:36,690 Ato mund të jenë vlera arbitrare. 81 00:04:36,690 --> 00:04:39,070 Për përmbajtjen e bazuar filtrim, ajo që ne jemi duke shkuar për të bërë 82 00:04:39,070 --> 00:04:42,810 po ne do të marrin në konsideratë Dy kolonat në këtë tabelë 83 00:04:42,810 --> 00:04:45,660 dhe të shohim se sa të ngjashme janë ata. 84 00:04:45,660 --> 00:04:48,640 Kështu për shembull, në qoftë se unë shkoi për të parë Inside Out, 85 00:04:48,640 --> 00:04:53,640 Unë mund të pyes, çfarë janë filmat e tjerë që të mund të jenë të gatshëm për të shkuar të parë. 86 00:04:53,640 --> 00:04:56,890 Kjo është, ajo që i gatshëm të shpenzojnë paratë e mia për të shkuar të parë. 87 00:04:56,890 --> 00:05:00,310 Dhe unë mund të krahasoni këtë duke thjesht duke marrë dy kolona, ​​njëra nga Inside Out 88 00:05:00,310 --> 00:05:03,300 dhe njërin prej tyre në ndonjë nga filma të tjerë, dhe vetëm duke parë 89 00:05:03,300 --> 00:05:06,210 Sa nga tiparet e tyre ndeshjes. 90 00:05:06,210 --> 00:05:09,660 Pra, nëse unë krahasoj Inside Out me Minions, mirë, nuk ka 91 00:05:09,660 --> 00:05:10,910 tri gjëra këtu që përputhen. 92 00:05:10,910 --> 00:05:16,200 Ata janë të dy animuar, asnjëri prej tyre janë filma Marvel, dhe dy prej tyre 93 00:05:16,200 --> 00:05:18,420 kanë parqet dhe req alumni. 94 00:05:18,420 --> 00:05:20,420 Kështu që unë mund të llogarisë deri sa shumë ndeshje ka qenë, 95 00:05:20,420 --> 00:05:22,640 dhe në këtë rast nuk do të jetë tre. 96 00:05:22,640 --> 00:05:26,450 >> Nëse unë pastaj krahasoni Inside Out me le të themi Mosha e ULTRON, 97 00:05:26,450 --> 00:05:28,430 Unë mund të shikoni poshtë në listë dhe thonë, mirë, nuk ka 98 00:05:28,430 --> 00:05:30,140 vetëm një gjë që përputhet atje. 99 00:05:30,140 --> 00:05:34,560 Ata të dy kalojnë testin Bechtel, kështu që do të jetë një rezultat i një. 100 00:05:34,560 --> 00:05:36,770 Dhe në mes Inside Out dhe Man Ant, përsëri unë 101 00:05:36,770 --> 00:05:41,420 mund të krahasohen rresht pas rreshti sa gjëra të përputhen në mes të dy prej tyre. 102 00:05:41,420 --> 00:05:43,060 E pra, një e animuar, dikujt nuk. 103 00:05:43,060 --> 00:05:44,970 Një është një film Marvel, nuk është. 104 00:05:44,970 --> 00:05:47,280 Një mori një zuzar super, tjetri nuk. 105 00:05:47,280 --> 00:05:49,480 Një kalon Bechtel Testi, një dështon atë, 106 00:05:49,480 --> 00:05:54,450 por ata të dy kanë Parks dhe req alumni, kështu përsëri, ajo merr një rezultat të një. 107 00:05:54,450 --> 00:05:58,300 >> Pra, nëse unë po kërkoni për filma që ishin të ngjashme me Inside Out, 108 00:05:58,300 --> 00:06:02,170 Unë mund të shikoni për filmat që kanë rezultatin më të lartë në këtë përmbajtje 109 00:06:02,170 --> 00:06:03,952 Skema filtrim. 110 00:06:03,952 --> 00:06:05,660 Pra, në këtë rast, unë do ta konsideronte Minions 111 00:06:05,660 --> 00:06:08,330 të jetë më afër dhe më shumë ka të ngjarë të jetë diçka 112 00:06:08,330 --> 00:06:13,250 që unë do të shpenzojnë para për të parë se mosha e ULTRON apo njeriut Ant. 113 00:06:13,250 --> 00:06:16,150 >> Këto përmbajtje të bazuar Sistemet e filtrimit të mbështeten vetëm 114 00:06:16,150 --> 00:06:18,670 mbi pronat e filma, dhe kështu unë 115 00:06:18,670 --> 00:06:21,930 mund të ndërtojnë këto vetëm duke e ditur diçka në lidhje me produktet 116 00:06:21,930 --> 00:06:23,500 që unë kam. 117 00:06:23,500 --> 00:06:26,050 Unë mund të përdorin të gjitha llojet e karakteristika që unë do të doja, 118 00:06:26,050 --> 00:06:28,400 dhe unë mund të ndërtojnë më shumë karakteristika komplekse që 119 00:06:28,400 --> 00:06:33,060 përfshijnë provë më komplekse të një cilësie sa unë të shkojnë së bashku. 120 00:06:33,060 --> 00:06:39,080 Në fakt, unë edhe mund të shikoni këtë tabelë jo si një objekt statik, 121 00:06:39,080 --> 00:06:43,110 por më tepër si dimensione brenda një hapësirë ​​më të madhe shtetëror. 122 00:06:43,110 --> 00:06:46,295 Dhe unë mund të filloni duke folur për distancat mes filma të ndryshëm. 123 00:06:46,295 --> 00:06:49,300 124 00:06:49,300 --> 00:06:51,050 Këto janë të gjitha gjërat që ne e dimë se si ata 125 00:06:51,050 --> 00:06:55,860 të bëjë duke përdorur llojet e strukturat e të dhënave që ne kemi parë tashmë në CS50. 126 00:06:55,860 --> 00:06:59,180 Kështu që unë mund të imagjinohet ndërtesë një strukturë e të dhënave për një film. 127 00:06:59,180 --> 00:07:02,390 Ka një struct që unë kam ndërtuar quajtur film, 128 00:07:02,390 --> 00:07:04,369 dhe ajo ka pesë hyra Boolean në të. 129 00:07:04,369 --> 00:07:07,160 A është e animuar, është një mrekulli film, e bën atë të ketë një zuzar super, 130 00:07:07,160 --> 00:07:11,047 e bën atë të kalojnë testin Bechdel, dhe janë atje Parqet dhe Rec alumni në të? 131 00:07:11,047 --> 00:07:12,880 Dhe secili prej tyre është një Struktura e të dhënave që unë 132 00:07:12,880 --> 00:07:16,330 mund të zënë për këtë film të veçantë. 133 00:07:16,330 --> 00:07:20,090 >> Pastaj llogaritin nëse dy filma janë të ngjashme ose jo, 134 00:07:20,090 --> 00:07:23,330 çfarë rezultati i tyre është, unë mund të shkruani nga një sërë pseudokod që 135 00:07:23,330 --> 00:07:25,120 gjeneron të njëjtin funksion. 136 00:07:25,120 --> 00:07:30,100 Kjo është, duke pasur parasysh disa film M1, unë mund të gjeni filmin më të ngjashëm me atë 137 00:07:30,100 --> 00:07:32,430 duke ndjekur pseudokod. 138 00:07:32,430 --> 00:07:37,040 Unë e konsideroj që është më e mirë sistemi që unë kam gjetur të shënuar, 139 00:07:37,040 --> 00:07:39,920 krahasimi më i mirë që unë kam gjetur. 140 00:07:39,920 --> 00:07:41,890 Për çdo film tjetër Unë jam duke shkuar për të shkuar nëpër, 141 00:07:41,890 --> 00:07:44,920 Unë do të të vendosur një rezultat ndeshje të barabartë me 0. 142 00:07:44,920 --> 00:07:47,920 Dhe unë do të shkoj nëpër atë Filmi, një M1, filmi 143 00:07:47,920 --> 00:07:51,500 Unë fillova me të, unë do të kontrolloni çdo tipar 144 00:07:51,500 --> 00:07:53,650 se ata duhet të shohin në qoftë se ka një ndeshje. 145 00:07:53,650 --> 00:07:56,460 Nëse ka një ndeshje, unë do ardhura rezultatin ndeshje. 146 00:07:56,460 --> 00:08:00,480 Dhe në qoftë se në fund rezultatin ndeshje që Unë kam është më i mirë se i tanishëm më i mirë 147 00:08:00,480 --> 00:08:03,310 të shënuar, atëherë unë do të mos harroni se rezultatin më të mirë, 148 00:08:03,310 --> 00:08:05,820 dhe kjo është ndeshja më e mirë që kam. 149 00:08:05,820 --> 00:08:09,450 Në fund, çfarëdo film është ulur në ndeshjen më të mirë, 150 00:08:09,450 --> 00:08:12,580 kjo është më e afërt Unë kam qenë në gjendje për të ardhur. 151 00:08:12,580 --> 00:08:14,890 Pra, këto përmbajtje të bazuar Sistemet e filtrimit, 152 00:08:14,890 --> 00:08:16,900 ata të gjithë kanë këtë strukturë bazike. 153 00:08:16,900 --> 00:08:20,910 Ata mbështeten mbi sendin në fjalë dhe asgjë nuk 154 00:08:20,910 --> 00:08:24,590 lidhje me ndonjë nga parapëlqimet e përdoruesit. 155 00:08:24,590 --> 00:08:29,010 >> Mekanizmi tjetër që ne i përdorim në urdhërojnë për të ndërtuar sistemet rekomanduese 156 00:08:29,010 --> 00:08:31,790 është quajtur filtrim bashkëpunuese. 157 00:08:31,790 --> 00:08:36,520 Filtrim bashkëpunuese mbështetet mbi jo cilësitë e objektit në vetvete, 158 00:08:36,520 --> 00:08:40,010 por se si njerëzit, të tjera Përdoruesit që është, se si ata kanë 159 00:08:40,010 --> 00:08:43,370 iu përgjigj këtyre objekteve të njëjta. 160 00:08:43,370 --> 00:08:48,720 Pra, për të vazhduar me shembullin tim film, Unë mund të marrë një bandë e miqtë e mi 161 00:08:48,720 --> 00:08:53,180 dhe studim e tyre në lidhje me nëse janë apo jo ata i pëlqente filmat veçanta. 162 00:08:53,180 --> 00:08:56,560 Tani vende të ndryshme do të gjenerojë këto të dhëna në mënyra të ndryshme. 163 00:08:56,560 --> 00:08:59,630 Ju mund të studim direkt tuaj përdoruesit, ose ju mund vetëm 164 00:08:59,630 --> 00:09:03,120 të shohim se çfarë ata zgjedhin nëse ju jeni, për shembull Netflix. 165 00:09:03,120 --> 00:09:05,640 Të cilat filma bëri ata të shikojnë? 166 00:09:05,640 --> 00:09:08,670 >> Unë mund të vënë në dyshim disa nga tim miqtë këtu dhe gjeni 167 00:09:08,670 --> 00:09:12,910 se Jason pëlqente çdo film ai pa, nuk është e habitshme atje. 168 00:09:12,910 --> 00:09:15,590 Andy vetëm i pëlqente Minions dhe hallë Man. 169 00:09:15,590 --> 00:09:19,330 Sarah pëlqyer brenda dhe jashtë dhe Avengers, e kundërta e Andy. 170 00:09:19,330 --> 00:09:22,200 Dhe Sam, mirë, Sam pëlqyer të gjitha filmat Superhero, 171 00:09:22,200 --> 00:09:24,960 por asnjë nga filmat e animuar. 172 00:09:24,960 --> 00:09:30,630 >> Unë pastaj mund të pyetjes për disa të reja individ, disa përdorues tjetër si veten 173 00:09:30,630 --> 00:09:34,520 dhe pyesin, mirë, në qoftë se unë i pëlqente njëra nga këto filmave, 174 00:09:34,520 --> 00:09:38,600 mund të bëni një parashikim për që filma unë mund të dëshironi tjetër. 175 00:09:38,600 --> 00:09:41,890 Kjo është, në qoftë se unë i pëlqente Brenda Jashtë, të cilat filma të tjerë 176 00:09:41,890 --> 00:09:48,460 jam shumë gjasa për të të duan të shohin bazuar në atë që bëri njerëzit të ngjashme? 177 00:09:48,460 --> 00:09:51,640 Kjo është, unë do të shkoj nëpër një Unë do të filtruar nëpër këtë listë 178 00:09:51,640 --> 00:09:54,520 dhe për të gjetur vetëm individët të cilët gjithashtu pëlqente 179 00:09:54,520 --> 00:09:57,680 Inside Out, i cili përputhet preferencat e mia. 180 00:09:57,680 --> 00:10:00,824 E pra, kjo do të thotë se Andy dhe Sam, ata nuk e pëlqen brenda dhe jashtë, 181 00:10:00,824 --> 00:10:02,240 kështu që unë nuk jam do të marrin në konsideratë ato. 182 00:10:02,240 --> 00:10:06,130 Unë jam duke shkuar për të hequr qafe të tyre të dhënat për këtë krahasim. 183 00:10:06,130 --> 00:10:09,750 >> Unë pastaj mund të shikoni në çfarë Jason dhe Sara mendoi dhe grup 184 00:10:09,750 --> 00:10:13,780 up që nga filmat që ata panë që nuk e kam, nëse ata i pëlqente ato 185 00:10:13,780 --> 00:10:15,150 apo jo. 186 00:10:15,150 --> 00:10:17,820 Unë mund vetëm të numëroj deri, le të themi vota. 187 00:10:17,820 --> 00:10:23,360 Pra Minions, për shembull, mund të ketë një të tillë votojnë për të, sepse Jason liked it. 188 00:10:23,360 --> 00:10:27,170 Të dy Jason dhe Sara pëlqente Avengers, kështu që do të ketë dy vota. 189 00:10:27,170 --> 00:10:30,700 Dhe vetëm Jason pëlqente Ant Man, kështu ajo do të marrë një votë. 190 00:10:30,700 --> 00:10:34,870 Pra, nëse unë kam për të pastaj të të rekomandojë për veten se cili prej këtyre filmave 191 00:10:34,870 --> 00:10:41,470 Unë mund të jetë më shumë gjasa për të parë, unë do të duhet të zgjedhin Mosha e ULTRON: Avengers. 192 00:10:41,470 --> 00:10:44,490 >> Pra, për ndonjë nga këto sistemet, tani unë jam duke përdorur 193 00:10:44,490 --> 00:10:49,260 të dhëna që nuk ishte gjeneruar rreth Vetë film, por në lidhje me preferencat 194 00:10:49,260 --> 00:10:51,960 nga përdorues të tjerë. 195 00:10:51,960 --> 00:10:54,150 Kjo ka disa vështirësi natyrisht. 196 00:10:54,150 --> 00:10:55,920 Çfarë ndodh nëse ju nuk keni ndonjë përdorues tjetër? 197 00:10:55,920 --> 00:10:58,770 E pra, kjo quhet problemi fillimin. 198 00:10:58,770 --> 00:11:03,760 Ju duhet të keni disa Sasia e të dhënave para se ju jeni 199 00:11:03,760 --> 00:11:07,560 në gjendje të fillojnë duke e bërë Këto rekomandime. 200 00:11:07,560 --> 00:11:10,940 Anë rrokullisje e saj është herë ju filloni mbledhjen e të dhënave, 201 00:11:10,940 --> 00:11:13,870 në qoftë se ju mund të mbledhë më shumë dhe të dhënat e më shumë, 202 00:11:13,870 --> 00:11:17,850 ju do të merrni më të mirë dhe më të mirë dhe rekomandimet më të mira. 203 00:11:17,850 --> 00:11:21,650 >> Tani ne mund të përkthehet kjo në kod si edhe. 204 00:11:21,650 --> 00:11:23,860 Ne mund të përcaktojë një tjetër lloj strukture, 205 00:11:23,860 --> 00:11:25,720 në këtë rast ne do të thërrasë atë një përdorues. 206 00:11:25,720 --> 00:11:30,970 Dhe atë e mori karakteristika për që Filma ky përdorues pëlqente. 207 00:11:30,970 --> 00:11:34,560 A u pëlqen Inside Out, Minions, Avengers, dhe Ant Man. 208 00:11:34,560 --> 00:11:36,660 Ne pastaj mund të gjenerojnë disa pseudokod për të ndjekur 209 00:11:36,660 --> 00:11:39,460 e njëjta procedurë që kam përdorur më parë. 210 00:11:39,460 --> 00:11:43,460 Kjo është, dhënë një të veçantë përdorues x, le të të rekomandojë një film 211 00:11:43,460 --> 00:11:46,107 se x mund të donte. 212 00:11:46,107 --> 00:11:47,940 Ne mund të shkoni nëpër dhe për të gjithë filmat, 213 00:11:47,940 --> 00:11:51,410 ne mund të iniciojnë një rezultat për këtë film të jetë 0. 214 00:11:51,410 --> 00:11:54,080 Dhe pastaj ne mund të gjeni të gjitha e përdoruesve të tjerë të cilët 215 00:11:54,080 --> 00:11:57,630 kanë të njëjtat preferenca si x. 216 00:11:57,630 --> 00:11:59,990 Dhe pastaj për çdo film që ata i pëlqente, 217 00:11:59,990 --> 00:12:02,340 ne do të rrisim rezultatin e atij filmi. 218 00:12:02,340 --> 00:12:05,010 Cilado film në fund ka rezultatin më të lartë, 219 00:12:05,010 --> 00:12:07,600 kjo është një unë duhet të rekomandojë. 220 00:12:07,600 --> 00:12:09,890 >> Asnjë nga këto nuk është me të vërtetë i panjohur. 221 00:12:09,890 --> 00:12:11,600 Asnjë nga këto nuk është sfiduese. 222 00:12:11,600 --> 00:12:15,810 Këto janë të gjitha algoritmet themelore që ju të mund të zbatojë sot. 223 00:12:15,810 --> 00:12:20,050 >> Tani me sisteme rekomanduesi vërtetë, keni drejtuar në disa probleme. 224 00:12:20,050 --> 00:12:23,300 Çfarë nëse nuk ka askush që përputhet saktësisht preferencat tuaja? 225 00:12:23,300 --> 00:12:27,170 Çfarë nëse ka përdorues të cilët Janë pikërisht preferencat tuaja, 226 00:12:27,170 --> 00:12:30,480 por pastaj devijojnë në mënyrë drastike nga ajo që ju pëlqen? 227 00:12:30,480 --> 00:12:36,210 Më pëlqen klasik Godzilla filma, por gruaja ime nuk e bën. 228 00:12:36,210 --> 00:12:39,430 Më pëlqen të shikojnë ata, im Llogaria Netflix përmban ato. 229 00:12:39,430 --> 00:12:41,800 Saj nuk ka. 230 00:12:41,800 --> 00:12:45,230 Çfarë ndodh kur ne fillojmë përzierjen e të dhënave si kjo? 231 00:12:45,230 --> 00:12:47,690 Këto janë të gjitha sfidat që ju mund të kapërcejë, 232 00:12:47,690 --> 00:12:51,900 ata vetëm të marrë pak algoritme më komplekse. 233 00:12:51,900 --> 00:12:56,420 >> Tani në botën e vërtetë, e cila janë në të vërtetë funksionale, 234 00:12:56,420 --> 00:12:59,980 nuk kemi përdorni përmbajtje filtrim në bazë ose nuk kemi përdorim filtrim bashkëpunuese? 235 00:12:59,980 --> 00:13:01,910 Dhe përgjigja është ne përdorim dy prej tyre. 236 00:13:01,910 --> 00:13:06,350 Pothuajse të gjithë e përdoruesve të mëdha në ky rast, Amazon, Facebook, Netflix, 237 00:13:06,350 --> 00:13:11,200 Pandora, ata të gjithë përdorin një kombinim të këto sisteme të ndryshme rekomandim. 238 00:13:11,200 --> 00:13:16,520 Dhe kur kombinohen zgjedhje nga secili, ne i quajmë ato sisteme hibride. 239 00:13:16,520 --> 00:13:20,750 Ata në një farë mënyre varet nga tiparet e objektit në vetvete, 240 00:13:20,750 --> 00:13:24,710 dhe në disa mënyra ata varen nga preferencat e përdoruesve të tjerë. 241 00:13:24,710 --> 00:13:28,120 Këto sisteme hibride, ata janë një biznes i madh, 242 00:13:28,120 --> 00:13:30,830 dhe ata janë çfarë është aktuale sot. 243 00:13:30,830 --> 00:13:32,839 >> Pra, Faleminderit shumë për t'u bashkuar me mua. 244 00:13:32,839 --> 00:13:35,380 Unë shpresoj se ju keni marrë pak pak e një kuptim të asaj 245 00:13:35,380 --> 00:13:37,430 i bën këto sisteme punë. 246 00:13:37,430 --> 00:13:41,980 Herën tjetër ju jeni online, mos harroni se jo vetëm ju ndikuar zgjedhjet tuaja, 247 00:13:41,980 --> 00:13:44,680 por potencialisht të gjithë të tjerët si. 248 00:13:44,680 --> 00:13:46,480 Faleminderit perseri. 249 00:13:46,480 --> 00:13:47,186