1 00:00:00,000 --> 00:00:03,416 >> [เล่นเพลง] 2 00:00:03,416 --> 00:00:05,860 3 00:00:05,860 --> 00:00:08,180 >> สมอง SCASSELLATI: ยินดีต้อนรับ ชุด CS50 AI 4 00:00:08,180 --> 00:00:12,600 ชื่อของฉันคือ Scass และในวันนี้เรากำลังจะ ที่จะพูดคุยเกี่ยวกับระบบ recommender 5 00:00:12,600 --> 00:00:15,780 ตอนนี้เสียงระบบ recommender ชนิดเหมือนชื่อแปลก 6 00:00:15,780 --> 00:00:18,630 มันเสียงเหมือนบางทีมันอาจจะควร เป็นระบบที่แนะนำ 7 00:00:18,630 --> 00:00:21,290 และชนิดของฉันเห็นด้วยกับคุณ 8 00:00:21,290 --> 00:00:26,110 แต่เหล่านี้เป็นระบบที่จะช่วยให้ เลือกจากสิ่งที่คล้ายกันเมื่อใดก็ตามที่ 9 00:00:26,110 --> 00:00:28,210 คุณเลือกสิ่งที่ออนไลน์ 10 00:00:28,210 --> 00:00:32,119 Netflix, ตัวอย่างเช่นจะแนะนำอื่น ๆ ภาพยนตร์ที่คุณอาจต้องการที่จะดู 11 00:00:32,119 --> 00:00:36,660 หรือแพนดอร่าจะแนะนำที่แตกต่างกัน เพลงที่คุณอาจต้องการที่จะฟัง 12 00:00:36,660 --> 00:00:40,940 อเมซอนจะแนะนำสิ่งที่ชนิดของ ผลิตภัณฑ์อื่น ๆ ที่คุณอาจต้องการที่จะซื้อ 13 00:00:40,940 --> 00:00:43,520 แม้ Facebook จะแนะนำ เพื่อนบางคนของคนอื่น ๆ 14 00:00:43,520 --> 00:00:45,440 ที่คุณอาจต้องการที่จะเพิ่ม 15 00:00:45,440 --> 00:00:49,800 แต่ละระบบเหล่านี้ทำงานโดยใช้ ชนิดพื้นฐานที่เหมือนกันของขั้นตอนวิธี 16 00:00:49,800 --> 00:00:52,520 และนั่นคือสิ่งที่เรากำลัง จะพูดถึงในวันนี้ 17 00:00:52,520 --> 00:00:56,860 >> ตอนนี้ขั้นตอนวิธีการเหล่านี้เป็น ธุรกิจขนาดใหญ่ที่น่าแปลกใจ 18 00:00:56,860 --> 00:01:01,130 Netflix ไม่กี่ปีที่ผ่านมาใน 2009 นำเสนอ $ 1,000,000 19 00:01:01,130 --> 00:01:07,240 รางวัลถ้าคุณสามารถปรับปรุงของพวกเขา ระบบแนะนำโดยเพียงแค่ 10% 20 00:01:07,240 --> 00:01:11,960 ว่า 10% แต่แสดงให้เห็นถึง จำนวนมากของธุรกิจ 21 00:01:11,960 --> 00:01:15,330 ประมาณการได้ยาก มาด้วย แต่หลายคน 22 00:01:15,330 --> 00:01:19,050 เชื่อว่าคำแนะนำเหล่านี้ ระบบการจัดซื้อออนไลน์ 23 00:01:19,050 --> 00:01:25,729 ระบบเช่น Amazon นำไปสู่​​ที่ใดที่หนึ่ง ระหว่าง 10% และ 25% ของรายได้ที่เพิ่มขึ้น 24 00:01:25,729 --> 00:01:27,770 ดังนั้นคุณสามารถจินตนาการ ชนิดของปริมาณที่คุณ 25 00:01:27,770 --> 00:01:32,860 พูดถึงเมื่อเราคิดเกี่ยวกับ แม้เหล่านี้ขั้นตอนวิธีการเล็ก ๆ น้อย ๆ 26 00:01:32,860 --> 00:01:35,200 >> จึงขอได้ตัวอย่างบางส่วน 27 00:01:35,200 --> 00:01:38,460 มันเป็นวิธีการที่เหล่านี้ ระบบจริงๆทำงานอย่างไร 28 00:01:38,460 --> 00:01:40,773 มีสองขั้นพื้นฐาน ชนิดของขั้นตอนวิธีการที่ 29 00:01:40,773 --> 00:01:45,050 มีที่เล่นเมื่อเราพูดคุยเกี่ยวกับ ที่ก่อให้เกิดคำแนะนำ 30 00:01:45,050 --> 00:01:48,650 คนแรกที่จะถูกเรียกว่า เนื้อหาการกรองตาม 31 00:01:48,650 --> 00:01:53,410 และเนื้อหาการกรองอาศัยตาม เมื่อความคล้ายคลึงกันระหว่างรายการ 32 00:01:53,410 --> 00:02:00,370 ตัวเองที่อยู่ในระหว่างสองภาพยนตร์ หรือสองเพลงหรือสองรายการซื้อ 33 00:02:00,370 --> 00:02:03,190 เรากำลังจะใช้ภาพยนตร์ เป็นตัวอย่าง แต่นี้ 34 00:02:03,190 --> 00:02:07,850 สามารถนำไปใช้จริงๆชนิดใด ๆ ของวัตถุที่เรากำลังมองหา 35 00:02:07,850 --> 00:02:13,330 >> ดังนั้นถ้าผมคิดว่าเกี่ยวกับบางส่วน ภาพยนตร์จากปีที่ผ่านมา 36 00:02:13,330 --> 00:02:16,799 ผมเห็น Inside Out กับ เด็ก ๆ ของฉันที่พวกเขารักมัน 37 00:02:16,799 --> 00:02:17,840 แต่เรายังมีทางเลือก 38 00:02:17,840 --> 00:02:21,350 เราจะได้ไปที่จะเห็นลูกน้อง, เราสามารถมองเห็นอายุ Ultron, 39 00:02:21,350 --> 00:02:24,850 หรือเราอาจจะได้เห็น ผู้ชายมดในโรงภาพยนตร์ 40 00:02:24,850 --> 00:02:27,580 >> สำหรับการใด ๆ เหล่านี้ ภาพยนตร์ที่เราสามารถจินตนาการ 41 00:02:27,580 --> 00:02:33,320 สร้างรายชื่อของคุณสมบัติหรือ เกี่ยวกับภาพยนตร์คุณภาพที่แตกต่างกัน 42 00:02:33,320 --> 00:02:37,190 ดังนั้นสำหรับตัวอย่างเช่นผมอาจจะพิจารณา ซึ่งหนังเหล่านั้นเป็นภาพเคลื่อนไหว 43 00:02:37,190 --> 00:02:39,960 ดีทั้งสองด้านในออก และลูกน้องเป็นภาพเคลื่อนไหว 44 00:02:39,960 --> 00:02:44,140 อายุ Ultron มิได้ ผู้ชายมดเป็นภาพยนตร์อนิเมชัน 45 00:02:44,140 --> 00:02:47,040 และผมสามารถจินตนาการอาคาร โครงสร้างโต๊ะที่ 46 00:02:47,040 --> 00:02:49,440 แสดงแต่ละคุณสมบัติเหล่านี้ 47 00:02:49,440 --> 00:02:51,790 พวกเขาเคลื่อนไหวหรือไม่? 48 00:02:51,790 --> 00:02:54,780 จากนั้นผมก็สามารถเพิ่มมากขึ้น คุณสมบัติที่จะตารางนี้ 49 00:02:54,780 --> 00:02:58,380 โดยการเพิ่มแถวในโครงสร้างนี้ 50 00:02:58,380 --> 00:03:00,970 ฉันจะถามว่า ไม่ว่าพวกเขากำลังดูหนังมาร์เวล 51 00:03:00,970 --> 00:03:04,010 ดี Inside Out และลูกน้อง ไม่ได้ดูหนังมหัศจรรย์ 52 00:03:04,010 --> 00:03:06,715 อายุ Ultron และมดผู้ชายอย่างแน่นอน 53 00:03:06,715 --> 00:03:09,100 >> และฉันจะขอให้ทุกชนิด คุณภาพแตกต่างกัน 54 00:03:09,100 --> 00:03:12,080 ที่ฉันต้องการชนิดใด ๆ ของคุณสมบัติ ที่อาจจะมีความสำคัญกับผม 55 00:03:12,080 --> 00:03:13,440 พวกเขามีคนร้าย super? 56 00:03:13,440 --> 00:03:16,700 ดีไม่มีคนร้ายสุดในภายใน ออก แต่มีคนในลูกน้อง 57 00:03:16,700 --> 00:03:19,990 และเห็นได้ชัดที่ สองภาพยนตร์ซูเปอร์ฮีโร่ 58 00:03:19,990 --> 00:03:23,900 >> ฉันยังสามารถขอสิ่งที่ชอบดี พวกเขาผ่านการทดสอบ Bechdel? 59 00:03:23,900 --> 00:03:27,280 จะมีสองชื่อ ตัวละครหญิงที่ 60 00:03:27,280 --> 00:03:30,550 ใช้จ่ายบางส่วนจำนวนมาก เวลาที่มีการสนทนาว่า 61 00:03:30,550 --> 00:03:34,400 ไม่ได้เกี่ยวข้องกับคนที่อยู่ในทีมนักแสดง? 62 00:03:34,400 --> 00:03:39,870 ทั้งในกรณีนี้ Inside Out ผ่าน ผลการทดสอบลูกน้องล้มเหลวอายุ Ultron 63 00:03:39,870 --> 00:03:42,990 ผ่านการทดสอบและผู้ชายมดล้มเหลว 64 00:03:42,990 --> 00:03:45,020 คนใดคนหนึ่งของคุณสมบัติเหล่านี้ ฉันจะคิดเกี่ยวกับ 65 00:03:45,020 --> 00:03:48,660 ในฐานะที่เป็นสิ่งสำคัญสำหรับคนบางคน 66 00:03:48,660 --> 00:03:52,000 >> ฉันยังสามารถขอสิ่งที่ต้องการเป็น มีคนใด ๆ ในภาพยนตร์เหล่านี้ว่า 67 00:03:52,000 --> 00:03:57,190 เป็นศิษย์เก่าจากสมมติว่าสวนสาธารณะและ สันทนาการหนึ่งของการแสดงที่ชื่นชอบ 68 00:03:57,190 --> 00:04:00,540 ดี Inside Out มีเอมี่ Poehler ที่เป็นศิษย์เก่า 69 00:04:00,540 --> 00:04:01,530 ที่นับ 70 00:04:01,530 --> 00:04:04,110 จอนแฮมม์อยู่ในลูกน้อง 71 00:04:04,110 --> 00:04:08,600 พอลรัดด์อยู่ในผู้ชายมด แต่ไม่มีใคร ในยุคของ Ultron อยู่ในสวนสาธารณะและ Req 72 00:04:08,600 --> 00:04:10,150 ได้เป็นอย่างดี 73 00:04:10,150 --> 00:04:12,990 ดังนั้นผมจึงสามารถสร้างรายการนี​​้ คุณสมบัติและการที่พวกเขาได้จริงๆ 74 00:04:12,990 --> 00:04:14,710 เป็นอะไรก็ได้ที่เกี่ยวกับภาพยนตร์ 75 00:04:14,710 --> 00:04:17,329 พวกเขาอาจจะเกี่ยวกับสิ่งที่ อัตราส่วนที่พวกเขาถูกยิงใน 76 00:04:17,329 --> 00:04:21,630 มันอาจจะเป็นวิธีการที่หลายที่นั่งพวกเขา ขายในวันหยุดสุดสัปดาห์ของพวกเขาเปิด 77 00:04:21,630 --> 00:04:25,630 คุณลักษณะใด ๆ ที่ฉันต้องการ สร้างฉันสามารถใส่ลงไปในตารางนี้ 78 00:04:25,630 --> 00:04:29,600 >> ขณะนี้ในกรณีนี้ผมได้สร้าง การเรียงลำดับของค่าแท่งทั้งหมด 79 00:04:29,600 --> 00:04:33,700 ใช่หรือไม่ผ่านหรือล้มเหลว แต่พวกเขาจะเป็นอะไร 80 00:04:33,700 --> 00:04:36,690 พวกเขาอาจจะเป็นค่าโดยพลการ 81 00:04:36,690 --> 00:04:39,070 สำหรับการกรองตามเนื้อหา สิ่งที่เรากำลังจะทำ 82 00:04:39,070 --> 00:04:42,810 คือเรากำลังจะพิจารณา สองคอลัมน์ในตารางนี้ 83 00:04:42,810 --> 00:04:45,660 และดูว่าพวกเขามีความคล้ายกัน 84 00:04:45,660 --> 00:04:48,640 ดังนั้นตัวอย่างเช่นถ้าฉัน ไปดูด้านในออก 85 00:04:48,640 --> 00:04:53,640 ผมอาจจะถามว่าสิ่งที่หนังเรื่องอื่น ๆ ที่ผมอาจจะมีความเต็มใจที่จะไปดู 86 00:04:53,640 --> 00:04:56,890 นั่นคือสิ่งที่ยินดีที่จะ ใช้จ่ายเงินของฉันที่จะไปดู 87 00:04:56,890 --> 00:05:00,310 และผมสามารถเปรียบเทียบการนี​​้โดยเพียงแค่การ สองคอลัมน์หนึ่งจากด้านในออก 88 00:05:00,310 --> 00:05:03,300 และเป็นหนึ่งจากส่วนใดของ ภาพยนตร์อื่น ๆ และเพียงแค่เห็น 89 00:05:03,300 --> 00:05:06,210 จำนวนของการแข่งขันคุณสมบัติของพวกเขา 90 00:05:06,210 --> 00:05:09,660 ดังนั้นถ้าผมเปรียบเทียบ Inside Out มีลูกน้องที่ดีมี 91 00:05:09,660 --> 00:05:10,910 สามสิ่งที่ตรงกับที่นี่ 92 00:05:10,910 --> 00:05:16,200 พวกเขากำลังทั้งภาพเคลื่อนไหวไม่ใช่ของพวกเขา ภาพยนตร์มหัศจรรย์และทั้งสองคน 93 00:05:16,200 --> 00:05:18,420 มีสวนสาธารณะและศิษย์เก่า Req 94 00:05:18,420 --> 00:05:20,420 ดังนั้นผมจึงสามารถนับได้ถึงวิธีการ แมตช์ที่มีหลายคน 95 00:05:20,420 --> 00:05:22,640 และในกรณีนี้มันน่าจะมีสาม 96 00:05:22,640 --> 00:05:26,450 >> ถ้าผมแล้วเปรียบเทียบ Inside Out ด้วยการสมมติว่าอายุ Ultron, 97 00:05:26,450 --> 00:05:28,430 ฉันสามารถมองลงรายการ และพูดดีมี 98 00:05:28,430 --> 00:05:30,140 เพียงสิ่งเดียวที่ตรงกับที่นั่น 99 00:05:30,140 --> 00:05:34,560 พวกเขาทั้งสองผ่านการทดสอบเบคเทลดังนั้น ที่จะเป็นคะแนนหนึ่ง 100 00:05:34,560 --> 00:05:36,770 และระหว่าง Inside Out และผู้ชายมดอีกครั้งฉัน 101 00:05:36,770 --> 00:05:41,420 สามารถเปรียบเทียบทีละบรรทัดวิธีการหลาย สิ่งที่ตรงกับระหว่างสองของพวกเขา 102 00:05:41,420 --> 00:05:43,060 ดีหนึ่งที่เคลื่อนไหวอย่างใดอย่างหนึ่งไม่ได้ 103 00:05:43,060 --> 00:05:44,970 หนึ่งเป็นหนังที่มหัศจรรย์อย่างใดอย่างหนึ่งไม่ได้ 104 00:05:44,970 --> 00:05:47,280 หนึ่งก็มีคนร้ายสุด อื่น ๆ ไม่ได้ 105 00:05:47,280 --> 00:05:49,480 หนึ่งผ่านเบคเทล การทดสอบล้มเหลวนั้น 106 00:05:49,480 --> 00:05:54,450 แต่พวกเขาทั้งสองมีสวนสาธารณะและศิษย์เก่า Req, เช่นนั้นอีกครั้งจะได้รับคะแนนหนึ่ง 107 00:05:54,450 --> 00:05:58,300 >> ดังนั้นถ้าฉันกำลังมองหาสำหรับภาพยนตร์ ที่มีความคล้ายคลึงกับด้านในออก 108 00:05:58,300 --> 00:06:02,170 ฉันจะมองหาหนังที่มี คะแนนสูงสุดในเนื้อหานี้ 109 00:06:02,170 --> 00:06:03,952 โครงการการกรอง 110 00:06:03,952 --> 00:06:05,660 ดังนั้นในกรณีนี้ผม จะพิจารณาลูกน้อง 111 00:06:05,660 --> 00:06:08,330 จะได้ใกล้ชิดและอื่น ๆ มีแนวโน้มที่จะเป็นสิ่งที่ 112 00:06:08,330 --> 00:06:13,250 ว่าผมจะใช้จ่ายเงินเพื่อดู กว่าอายุ Ultron หรือผู้ชายมด 113 00:06:13,250 --> 00:06:16,150 >> เนื้อหาดังกล่าวจาก ระบบการกรองพึ่งพาเพียง 114 00:06:16,150 --> 00:06:18,670 เกี่ยวกับคุณสมบัติของ ภาพยนตร์และเพื่อให้ฉัน 115 00:06:18,670 --> 00:06:21,930 สามารถสร้างเหล่านี้เพียงแค่รู้ บางสิ่งบางอย่างเกี่ยวกับผลิตภัณฑ์ 116 00:06:21,930 --> 00:06:23,500 ที่ฉันมี. 117 00:06:23,500 --> 00:06:26,050 ฉันสามารถใช้ทุกชนิด คุณสมบัติที่ฉันต้องการ 118 00:06:26,050 --> 00:06:28,400 และผมสามารถสร้างเพิ่มเติม คุณสมบัติที่ซับซ้อนที่ 119 00:06:28,400 --> 00:06:33,060 เกี่ยวข้องกับการทดสอบที่ซับซ้อนมากขึ้น มีคุณภาพที่ผมไปตาม 120 00:06:33,060 --> 00:06:39,080 ในความเป็นจริงฉันยังสามารถดูตารางนี้ ไม่ได้เป็นวัตถุคงที่หนึ่ง 121 00:06:39,080 --> 00:06:43,110 แต่ในฐานะที่เป็นมิติ ภายในพื้นที่ของรัฐที่มีขนาดใหญ่ 122 00:06:43,110 --> 00:06:46,295 และผมสามารถเริ่มต้นการพูดคุยเกี่ยวกับ ระยะทางระหว่างภาพยนตร์ที่แตกต่างกัน 123 00:06:46,295 --> 00:06:49,300 124 00:06:49,300 --> 00:06:51,050 เหล่านี้เป็นสิ่งที่ทุก ที่เรารู้ว่าพวกเขา 125 00:06:51,050 --> 00:06:55,860 ทำโดยใช้ชนิดของโครงสร้างข้อมูล ที่เราได้เห็นแล้วใน CS50 126 00:06:55,860 --> 00:06:59,180 ดังนั้นผมจึงสามารถจินตนาการอาคาร โครงสร้างข้อมูลสำหรับภาพยนตร์ 127 00:06:59,180 --> 00:07:02,390 มีโครงสร้างที่ผมเคยเป็น เรียกว่าสร้างภาพยนตร์ 128 00:07:02,390 --> 00:07:04,369 และมันมีห้ารายการบูลีนอยู่ในนั้น 129 00:07:04,369 --> 00:07:07,160 มันเป็นภาพเคลื่อนไหว, มันเป็นเรื่องมหัศจรรย์ หนังไม่ได้มีคนร้ายสุด 130 00:07:07,160 --> 00:07:11,047 มันไม่ผ่านการทดสอบ Bechdel และ มีสวนสาธารณะและเมอร์ดอลล่าในมันได้หรือไม่ 131 00:07:11,047 --> 00:07:12,880 และแต่ละเหล่านี้เป็น โครงสร้างข้อมูลที่ฉัน 132 00:07:12,880 --> 00:07:16,330 สามารถครอบครองสำหรับภาพยนตร์โดยเฉพาะอย่างยิ่งที่ 133 00:07:16,330 --> 00:07:20,090 >> แล้วคำนวณว่าสอง ภาพยนตร์ที่คล้ายกันหรือไม่ 134 00:07:20,090 --> 00:07:23,330 ว่าคะแนนของพวกเขาคือที่ฉันสามารถทำได้ เขียนออกชุดของรหัสจำลองที่ 135 00:07:23,330 --> 00:07:25,120 สร้างฟังก์ชั่นเดียวกันกับที่ 136 00:07:25,120 --> 00:07:30,100 นั่นคือได้รับภาพยนตร์ M1 บางอย่างผมสามารถ หาหนังที่คล้ายกันมากที่สุดไป 137 00:07:30,100 --> 00:07:32,430 โดยทำตาม pseudocode 138 00:07:32,430 --> 00:07:37,040 ผมคิดว่าที่ดีที่สุด ระบบการให้คะแนนที่ผมเคยพบ 139 00:07:37,040 --> 00:07:39,920 การเปรียบเทียบที่ดีที่สุดที่ฉันได้พบ 140 00:07:39,920 --> 00:07:41,890 ทุกภาพยนตร์อื่น ๆ ฉันจะผ่านไป 141 00:07:41,890 --> 00:07:44,920 ฉันจะกำหนดคะแนนการแข่งขันเท่ากับ 0 142 00:07:44,920 --> 00:07:47,920 และฉันจะไปถึงที่ ภาพยนตร์เป็น M1 หนัง 143 00:07:47,920 --> 00:07:51,500 ฉันเริ่มต้นด้วยผมจะตรวจสอบ แต่ละคนและทุกคุณลักษณะ 144 00:07:51,500 --> 00:07:53,650 ที่พวกเขาต้องดู ถ้ามีการแข่งขัน 145 00:07:53,650 --> 00:07:56,460 หากมีการแข่งขันฉันจะ เพิ่มคะแนนการแข่งขัน 146 00:07:56,460 --> 00:08:00,480 และถ้าที่จบคะแนนการแข่งขันว่า ฉันได้ดีกว่าในปัจจุบันที่ดีที่สุด 147 00:08:00,480 --> 00:08:03,310 คะแนนแล้วฉันจะ จำไว้ว่าคะแนนที่ดีที่สุด 148 00:08:03,310 --> 00:08:05,820 และนี่คือการแข่งขันที่ดีที่สุดที่ฉันมี 149 00:08:05,820 --> 00:08:09,450 ในตอนท้ายสิ่งที่ภาพยนตร์ นั่งอยู่ในการแข่งขันที่ดีที่สุด 150 00:08:09,450 --> 00:08:12,580 ที่ใกล้เคียงที่สุด ฉันได้รับสามารถที่จะมา 151 00:08:12,580 --> 00:08:14,890 ดังนั้นเนื้อหาดังกล่าวจาก ระบบการกรอง 152 00:08:14,890 --> 00:08:16,900 พวกเขาทั้งหมดมีโครงสร้างพื้นฐานนี้ 153 00:08:16,900 --> 00:08:20,910 พวกเขาขึ้นอยู่กับรายการ ในคำถามและไม่มีอะไร 154 00:08:20,910 --> 00:08:24,590 เกี่ยวกับการใด ๆ ของค่าของผู้ใช้ 155 00:08:24,590 --> 00:08:29,010 >> กลไกอื่น ๆ ที่เราใช้ในการ เพื่อที่จะสร้างระบบข้อเสนอแนะ 156 00:08:29,010 --> 00:08:31,790 ที่เรียกว่าการกรองการทำงานร่วมกัน 157 00:08:31,790 --> 00:08:36,520 กรองความร่วมมืออาศัย ไม่ได้คุณภาพของวัตถุที่ตัวเอง 158 00:08:36,520 --> 00:08:40,010 แต่วิธีการที่คนอื่น ๆ ผู้ใช้ที่เป็นวิธีการที่พวกเขาได้ 159 00:08:40,010 --> 00:08:43,370 ตอบสนองต่อวัตถุเหล่านี้เหมือนกัน 160 00:08:43,370 --> 00:08:48,720 ดังนั้นเพื่อดำเนินการต่อด้วยตัวอย่างภาพยนตร์ของฉัน ผมอาจจะใช้พวงของเพื่อนของฉัน 161 00:08:48,720 --> 00:08:53,180 และพวกเขาเกี่ยวกับการสำรวจหรือ พวกเขาไม่ชอบดูหนังโดยเฉพาะอย่างยิ่ง 162 00:08:53,180 --> 00:08:56,560 ตอนนี้สถานที่ที่แตกต่างกันจะสร้าง ข้อมูลนี้ในวิธีที่แตกต่าง 163 00:08:56,560 --> 00:08:59,630 คุณโดยตรงสามารถสำรวจของคุณ ผู้ใช้หรือคุณอาจจะเพียงแค่ 164 00:08:59,630 --> 00:09:03,120 ดูสิ่งที่พวกเขาเลือกที่ถ้า คุณเช่น Netflix 165 00:09:03,120 --> 00:09:05,640 ซึ่งภาพยนตร์ที่พวกเขาดู? 166 00:09:05,640 --> 00:09:08,670 >> ฉันอาจจะตั้งคำถามกับบางส่วนของฉัน เพื่อนที่นี่และหา 167 00:09:08,670 --> 00:09:12,910 ที่เจสันชอบหนังทุก เขาเห็นว่าไม่น่าแปลกใจที่มี 168 00:09:12,910 --> 00:09:15,590 แอนดี้เท่านั้นที่ชอบลูกน้องและป้าผู้ชาย 169 00:09:15,590 --> 00:09:19,330 ซาร่าห์ชอบภายในออกและ เวนเจอร์สตรงข้ามของแอนดี้ 170 00:09:19,330 --> 00:09:22,200 และแซม, ดี, แซมชอบ ทั้งหมดของภาพยนตร์ซูเปอร์ฮีโร่ที่ 171 00:09:22,200 --> 00:09:24,960 แต่ไม่มีผู้ใดของภาพยนตร์การ์ตูน 172 00:09:24,960 --> 00:09:30,630 >> จากนั้นผมก็สามารถสอบถามใหม่บางส่วน บุคคลบางอย่างของผู้อื่นเหมือนตัวเอง 173 00:09:30,630 --> 00:09:34,520 และขอให้ดีถ้าฉันชอบ หนึ่งในภาพยนตร์เหล่านี้ 174 00:09:34,520 --> 00:09:38,600 คุณสามารถทำให้การคาดการณ์เกี่ยวกับ ซึ่งหนังเรื่องอื่น ๆ ผมอาจจะชอบ 175 00:09:38,600 --> 00:09:41,890 นั่นคือถ้าผมชอบภายใน ออกซึ่งภาพยนตร์อื่น ๆ 176 00:09:41,890 --> 00:09:48,460 ฉันมีแนวโน้มที่จะยังต้องการที่จะเห็น ขึ้นอยู่กับสิ่งที่คนที่คล้ายกันไม่? 177 00:09:48,460 --> 00:09:51,640 นั่นคือฉันจะไปผ่าน ฉันจะกรองผ่านรายการนี​​้ 178 00:09:51,640 --> 00:09:54,520 และพบเพียง บุคคลที่ยังชอบ 179 00:09:54,520 --> 00:09:57,680 Inside Out ที่ตรงกับการตั้งค่าของฉัน 180 00:09:57,680 --> 00:10:00,824 ดีที่หมายความว่าแอนดี้และ แซมพวกเขาไม่ชอบด้านในออก 181 00:10:00,824 --> 00:10:02,240 ดังนั้นฉันจะไม่พิจารณาให้ 182 00:10:02,240 --> 00:10:06,130 ฉันจะได้รับการกำจัดของ ข้อมูลสำหรับการเปรียบเทียบนี้ 183 00:10:06,130 --> 00:10:09,750 >> จากนั้นผมก็สามารถมองสิ่งที่เจสัน และซาร่าห์และคิดว่านับ 184 00:10:09,750 --> 00:10:13,780 ซึ่งขึ้นของภาพยนตร์ที่พวกเขาเห็น ที่ฉันไม่ได้ไม่ว่าจะชอบพวกเขา 185 00:10:13,780 --> 00:10:15,150 หรือไม่. 186 00:10:15,150 --> 00:10:17,820 ฉันสามารถนับขึ้นสมมติว่าคะแนนโหวต 187 00:10:17,820 --> 00:10:23,360 ดังนั้นลูกน้องเช่นอาจจะมีหนึ่ง ลงคะแนนให้มันเพราะเจสันชอบมัน 188 00:10:23,360 --> 00:10:27,170 ทั้งเจสันและซาร่าห์ชอบเวนเจอร์ส ดังนั้นมันจะมีสองคะแนน 189 00:10:27,170 --> 00:10:30,700 และมีเพียงเจสันชอบมดชาย จึงจะได้รับหนึ่งเสียง 190 00:10:30,700 --> 00:10:34,870 ดังนั้นถ้าผมจะแนะนำแล้ว สำหรับตัวเองซึ่งภาพยนตร์เหล่านี้ 191 00:10:34,870 --> 00:10:41,470 ฉันอาจจะมีโอกาสมากที่สุดที่จะดูผมจะ ต้องเลือกอายุ Ultron: เวนเจอร์ส 192 00:10:41,470 --> 00:10:44,490 >> ดังนั้นสำหรับใด ๆ เหล่านี้ ระบบตอนนี้ผมใช้ 193 00:10:44,490 --> 00:10:49,260 ข้อมูลที่ถูกสร้างขึ้นไม่ได้เกี่ยวกับ หนังตัวเอง แต่เกี่ยวกับการตั้งค่า 194 00:10:49,260 --> 00:10:51,960 จากผู้อื่น 195 00:10:51,960 --> 00:10:54,150 นี้มีปัญหาบางอย่างแน่นอน 196 00:10:54,150 --> 00:10:55,920 เกิดอะไรขึ้นถ้าคุณไม่ได้มีผู้ใช้อื่น ๆ ? 197 00:10:55,920 --> 00:10:58,770 ดีที่เรียกว่าปัญหาการเริ่มต้น 198 00:10:58,770 --> 00:11:03,760 คุณต้องมีความบาง ปริมาณของข้อมูลก่อนที่คุณจะ 199 00:11:03,760 --> 00:11:07,560 สามารถที่จะเริ่มต้นทำ คำแนะนำเหล่านี้ 200 00:11:07,560 --> 00:11:10,940 พลิกด้านของมันเป็นครั้งเดียว ที่คุณจะเริ่มการเก็บรวบรวมข้อมูล 201 00:11:10,940 --> 00:11:13,870 ถ้าคุณสามารถเก็บมากขึ้น และข้อมูลมากขึ้น 202 00:11:13,870 --> 00:11:17,850 คุณจะได้รับดีและดีกว่า และข้อเสนอแนะที่ดีกว่า 203 00:11:17,850 --> 00:11:21,650 >> ตอนนี้เราสามารถแปล นี้เป็นรหัสเช่นกัน 204 00:11:21,650 --> 00:11:23,860 เราสามารถกำหนดที่แตกต่างกัน ชนิดของโครงสร้าง 205 00:11:23,860 --> 00:11:25,720 ในกรณีนี้เราจะเรียกว่าผู้ใช้ 206 00:11:25,720 --> 00:11:30,970 และมันก็มีคุณสมบัติที่เกี่ยวกับ ภาพยนตร์ที่ชอบใช้นี้ 207 00:11:30,970 --> 00:11:34,560 พวกเขาชอบ Inside Out, สมุนเวนเจอร์สและแมนมด 208 00:11:34,560 --> 00:11:36,660 จากนั้นเราจะสามารถสร้าง pseudocode ที่จะปฏิบัติตาม 209 00:11:36,660 --> 00:11:39,460 ขั้นตอนเดียวกับที่ผมใช้มาก่อน 210 00:11:39,460 --> 00:11:43,460 นั่นคือได้รับโดยเฉพาะอย่างยิ่ง ผู้ใช้ x ขอแนะนำภาพยนตร์ 211 00:11:43,460 --> 00:11:46,107 ที่ x อาจชอบ 212 00:11:46,107 --> 00:11:47,940 เราสามารถผ่านไปและ สำหรับทุกภาพยนตร์ 213 00:11:47,940 --> 00:11:51,410 เราสามารถเริ่มต้นได้คะแนน สำหรับภาพยนตร์ที่จะเป็น 0 214 00:11:51,410 --> 00:11:54,080 และจากนั้นเราสามารถค้นหาทั้งหมด ของผู้อื่นที่ 215 00:11:54,080 --> 00:11:57,630 มีการตั้งค่าเช่นเดียวกับ x 216 00:11:57,630 --> 00:11:59,990 และแล้วทุก ภาพยนตร์ที่พวกเขาชอบ 217 00:11:59,990 --> 00:12:02,340 เราจะเพิ่มคะแนนของภาพยนตร์ว่า 218 00:12:02,340 --> 00:12:05,010 ภาพยนตร์ใดก็ตามที่อยู่ใน ปลายมีคะแนนสูงสุด 219 00:12:05,010 --> 00:12:07,600 ที่หนึ่งที่ฉันควรแนะนำ 220 00:12:07,600 --> 00:12:09,890 >> ไม่มีนี้เป็นความจริงที่ปิดบัง 221 00:12:09,890 --> 00:12:11,600 ไม่มีนี้เป็นสิ่งที่ท้าทาย 222 00:12:11,600 --> 00:12:15,810 เหล่านี้เป็นขั้นตอนวิธีการพื้นฐานทั้งหมด ที่คุณสามารถใช้ในวันนี้ 223 00:12:15,810 --> 00:12:20,050 >> ขณะนี้มีระบบ recommender จริง คุณทำงานเป็นปัญหาบางอย่าง 224 00:12:20,050 --> 00:12:23,300 เกิดอะไรขึ้นถ้ามีใครที่ ตรงกับความต้องการของคุณ? 225 00:12:23,300 --> 00:12:27,170 เกิดอะไรขึ้นถ้ามีผู้ใช้ที่ จะตรงตั้งค่าของคุณ 226 00:12:27,170 --> 00:12:30,480 แต่แล้วเบี่ยงเบนอย่างเห็นได้ชัด จากสิ่งที่คุณชอบ? 227 00:12:30,480 --> 00:12:36,210 ผมชอบที่หนักหนาสาหัสคลาสสิก ภาพยนตร์ แต่ภรรยาของฉันไม่ได้ 228 00:12:36,210 --> 00:12:39,430 ผมชอบที่จะดูพวกเขาของฉัน บัญชี Netflix มีพวกเขา 229 00:12:39,430 --> 00:12:41,800 เธอไม่ได้ 230 00:12:41,800 --> 00:12:45,230 เกิดอะไรขึ้นเมื่อเราเริ่มต้น ผสมข้อมูลเช่นนี้หรือไม่? 231 00:12:45,230 --> 00:12:47,690 เหล่านี้เป็นความท้าทายทั้งหมด ที่คุณสามารถเอาชนะ 232 00:12:47,690 --> 00:12:51,900 พวกเขาใช้เวลาเพียงแค่เล็กน้อย ขั้นตอนวิธีการที่ซับซ้อนมากขึ้น 233 00:12:51,900 --> 00:12:56,420 >> ขณะนี้อยู่ในโลกแห่งความจริงซึ่ง มีการปฏิบัติงานจริง 234 00:12:56,420 --> 00:12:59,980 เราจะใช้เนื้อหาการกรองหรือ เราจะใช้การกรองการทำงานร่วมกัน? 235 00:12:59,980 --> 00:13:01,910 และคำตอบคือเราใช้ทั้งของพวกเขา 236 00:13:01,910 --> 00:13:06,350 เกือบทั้งหมดของผู้ใช้ที่สำคัญใน กรณีนี้, Amazon, Facebook, Netflix, 237 00:13:06,350 --> 00:13:11,200 แพนดอร่าพวกเขาทั้งหมดใช้การรวมกันของ ระบบเหล่านี้คำแนะนำที่แตกต่างกัน 238 00:13:11,200 --> 00:13:16,520 และเมื่อเรารวมตัวเลือกจาก แต่ละครั้งเราเรียกพวกเขาระบบไฮบริด 239 00:13:16,520 --> 00:13:20,750 พวกเขาในบางวิธีขึ้นอยู่กับ คุณสมบัติของวัตถุเอง 240 00:13:20,750 --> 00:13:24,710 และในรูปแบบที่พวกเขาขึ้นอยู่กับ การตั้งค่าของผู้อื่น 241 00:13:24,710 --> 00:13:28,120 เหล่านี้ระบบไฮบริด พวกเขากำลังธุรกิจขนาดใหญ่ 242 00:13:28,120 --> 00:13:30,830 และพวกเขากำลังมีอะไรในปัจจุบันในวันนี้ 243 00:13:30,830 --> 00:13:32,839 >> ดังนั้นขอบคุณมากสำหรับการเข้าร่วมฉัน 244 00:13:32,839 --> 00:13:35,380 ฉันหวังว่าคุณเคยเล็ก ๆ น้อย ๆ บิตของความเข้าใจในสิ่งที่ 245 00:13:35,380 --> 00:13:37,430 ทำให้ระบบเหล่านี้ทำงาน 246 00:13:37,430 --> 00:13:41,980 ครั้งต่อไปที่คุณกำลังออนไลน์โปรดจำไว้ว่า ไม่เพียง แต่คุณมีอิทธิพลต่อการเลือกของคุณ 247 00:13:41,980 --> 00:13:44,680 แต่อาจเป็นคนอื่นได้เป็นอย่างดี 248 00:13:44,680 --> 00:13:46,480 ขอบคุณอีกครั้ง. 249 00:13:46,480 --> 00:13:47,186