1 00:00:00,000 --> 00:00:08,364 2 00:00:08,364 --> 00:00:08,870 >> LUCAS FREITAS: Hey 3 00:00:08,870 --> 00:00:09,980 ทุกคนยินดีต้อนรับ 4 00:00:09,980 --> 00:00:11,216 ชื่อของฉันคือลูคัสตาส 5 00:00:11,216 --> 00:00:15,220 ผมจูเนียร์ที่ [ไม่ได้ยิน] การศึกษา วิทยาศาสตร์คอมพิวเตอร์ที่มีความสำคัญใน 6 00:00:15,220 --> 00:00:16,410 ภาษาศาสตร์ 7 00:00:16,410 --> 00:00:19,310 ดังนั้นรองของฉันอยู่ในภาษา และทฤษฎีภาษาศาสตร์ 8 00:00:19,310 --> 00:00:21,870 ผมตื่นเต้นจริงๆที่จะสอนพวกคุณ นิด ๆ หน่อย ๆ เกี่ยวกับข้อมูล 9 00:00:21,870 --> 00:00:24,300 มันเป็นพื้นที่ที่น่าตื่นเต้นมากที่จะศึกษา 10 00:00:24,300 --> 00:00:27,260 นอกจากนี้ยังมีจำนวนมากที่มีศักยภาพ สำหรับอนาคต 11 00:00:27,260 --> 00:00:30,160 ดังนั้นผมตื่นเต้นจริงๆที่พวกคุณ กำลังพิจารณาโครงการใน 12 00:00:30,160 --> 00:00:31,160 ภาษาศาสตร์ 13 00:00:31,160 --> 00:00:35,460 และฉันจะมากกว่ายินดีที่จะให้คำแนะนำ ใด ๆ ของคุณถ้าคุณตัดสินใจที่จะ 14 00:00:35,460 --> 00:00:37,090 ติดตามหนึ่งในบรรดา 15 00:00:37,090 --> 00:00:40,010 >> ดังนั้นครั้งแรกของทุกสิ่งที่มีการคำนวณ ภาษาศาสตร์? 16 00:00:40,010 --> 00:00:44,630 ภาษาศาสตร์ดังนั้นการคำนวณคือ สี่แยกระหว่างภาษาศาสตร์และ 17 00:00:44,630 --> 00:00:46,390 สาขาวิชาวิทยาการคอมพิวเตอร์ 18 00:00:46,390 --> 00:00:47,415 ดังนั้นสิ่งที่เป็นภาษาศาสตร์? 19 00:00:47,415 --> 00:00:48,490 วิทยาการคอมพิวเตอร์คืออะไร 20 00:00:48,490 --> 00:00:51,580 ดีจากภาษาศาสตร์สิ่งที่ เราจะใช้ภาษา 21 00:00:51,580 --> 00:00:54,960 ดังนั้นภาษาศาสตร์เป็นจริงการศึกษา ของภาษาธรรมชาติทั่วไป 22 00:00:54,960 --> 00:00:58,330 ดังนั้นภาษาธรรมชาติ - เราพูดคุยเกี่ยวกับ ภาษาที่เราใช้จริงกับ 23 00:00:58,330 --> 00:00:59,770 สื่อสารกับแต่ละอื่น 24 00:00:59,770 --> 00:01:02,200 ดังนั้นเราจะไม่พูดว่า เกี่ยวกับ C หรือ Java 25 00:01:02,200 --> 00:01:05,900 เรากำลังพูดถึงเกี่ยวกับภาษาอังกฤษและ ภาษาจีนและอื่น ๆ ที่เรา 26 00:01:05,900 --> 00:01:07,780 ใช้ในการสื่อสารกับแต่ละอื่น 27 00:01:07,780 --> 00:01:12,470 >> สิ่งที่ท้าทายเกี่ยวกับการที่ว่า ตอนนี้เรามีเกือบ 7,000 28 00:01:12,470 --> 00:01:14,260 ภาษาในโลก 29 00:01:14,260 --> 00:01:19,520 ดังนั้นจึงมีความหลากหลายค่อนข้างสูง ภาษาที่เราสามารถเรียนได้ 30 00:01:19,520 --> 00:01:22,600 แล้วคุณคิดว่ามันอาจจะเป็น ยากมากที่จะทำเช่น 31 00:01:22,600 --> 00:01:26,960 การแปลจากภาษาหนึ่งไปยัง อื่น ๆ ที่พิจารณาว่าคุณมี 32 00:01:26,960 --> 00:01:28,240 เกือบ 7,000 ของพวกเขา 33 00:01:28,240 --> 00:01:31,450 ดังนั้นถ้าคุณคิดว่าการทำแปล จากภาษาหนึ่งไปยังอีกที่คุณ 34 00:01:31,450 --> 00:01:35,840 มีเกือบมากกว่าหนึ่งล้าน ชุดที่แตกต่างกันที่คุณสามารถ 35 00:01:35,840 --> 00:01:37,330 มีจากภาษาภาษา 36 00:01:37,330 --> 00:01:40,820 ดังนั้นมันจริงๆความท้าทายที่จะทำบางอย่าง ชนิดของระบบการแปลตัวอย่างสำหรับ 37 00:01:40,820 --> 00:01:43,540 ทุกภาษาเดียว 38 00:01:43,540 --> 00:01:47,120 >> ดังนั้นถือว่าภาษาศาสตร์ด้วยไวยากรณ์ ความหมายเน้น 39 00:01:47,120 --> 00:01:49,550 พวกคุณไม่ได้ว่าต้อง ที่จะรู้ว่าสิ่งที่พวกเขามี 40 00:01:49,550 --> 00:01:55,090 แต่สิ่งที่น่าสนใจมากคือ ในฐานะที่เป็นเจ้าของภาษาเมื่อคุณเรียนรู้ 41 00:01:55,090 --> 00:01:59,010 ภาษาเป็นเด็กคุณได้เรียนรู้จริง ทุกสิ่งที่ - ความหมายไวยากรณ์ 42 00:01:59,010 --> 00:02:00,500 และเน้น - 43 00:02:00,500 --> 00:02:01,430 ด้วยตัวเอง 44 00:02:01,430 --> 00:02:04,820 และไม่มีใครมีที่จะสอนไวยากรณ์สำหรับ คุณจะเข้าใจว่าประโยคนี้ 45 00:02:04,820 --> 00:02:05,290 โครงสร้าง 46 00:02:05,290 --> 00:02:07,980 ดังนั้นจึงเป็นที่น่าสนใจมากเพราะ มันเป็นสิ่งที่มามาก 47 00:02:07,980 --> 00:02:10,389 อย่างสังหรณ์ใจ 48 00:02:10,389 --> 00:02:13,190 >> และสิ่งที่คุณจะได้รับจาก วิทยาการคอมพิวเตอร์หรือไม่ 49 00:02:13,190 --> 00:02:16,700 ดีสิ่งที่สำคัญที่สุดที่เรา มีวิทยาการคอมพิวเตอร์เป็นครั้งแรกของ 50 00:02:16,700 --> 00:02:19,340 ทุกปัญญาประดิษฐ์ และการเรียนรู้เครื่อง 51 00:02:19,340 --> 00:02:22,610 ดังนั้นสิ่งที่เรากำลังพยายามที่จะทำ ภาษาศาสตร์คือสอน 52 00:02:22,610 --> 00:02:26,990 คอมพิวเตอร์ของคุณวิธีที่จะทำบางสิ่งบางอย่าง กับภาษา 53 00:02:26,990 --> 00:02:28,630 >> ดังนั้นสำหรับตัวอย่างเช่นในเครื่อง การแปล 54 00:02:28,630 --> 00:02:32,490 ฉันพยายามที่จะสอนวิธีการใช้คอมพิวเตอร์ของฉัน รู้วิธีที่จะเปลี่ยนจากหนึ่ง 55 00:02:32,490 --> 00:02:33,310 ภาษาอื่น ๆ 56 00:02:33,310 --> 00:02:35,790 ดังนั้นโดยทั่วไปชอบการเรียนการสอน คอมพิวเตอร์ทั้งสองภาษา 57 00:02:35,790 --> 00:02:38,870 ถ้าผมทำการประมวลผลภาษาธรรมชาติ ซึ่งเป็นกรณีตัวอย่างของ 58 00:02:38,870 --> 00:02:41,810 Facebook ของกราฟ Search คุณสอน คอมพิวเตอร์ของคุณวิธีการที่จะเข้าใจ 59 00:02:41,810 --> 00:02:42,730 การค้นหาที่ดี 60 00:02:42,730 --> 00:02:48,130 >> ดังนั้นถ้าคุณบอกว่า "ภาพของฉัน เพื่อน. "Facebook ไม่ได้รักษาที่ 61 00:02:48,130 --> 00:02:51,130 เป็นสตริงที่มีทั้ง เพียงพวงของคำ 62 00:02:51,130 --> 00:02:56,020 มันจริงเข้าใจความสัมพันธ์ ระหว่าง "ภาพ" และ "เพื่อนของฉัน" และ 63 00:02:56,020 --> 00:02:59,620 เข้าใจว่า "ภาพถ่าย" เป็น สถานที่ให้บริการของ "เพื่อนของฉัน." 64 00:02:59,620 --> 00:03:02,350 >> ดังนั้นที่เป็นส่วนหนึ่งของตัวอย่างเช่น การประมวลผลภาษาธรรมชาติ 65 00:03:02,350 --> 00:03:04,790 มันพยายามที่จะเข้าใจในสิ่งที่ เป็นความสัมพันธ์ระหว่าง 66 00:03:04,790 --> 00:03:07,520 คำในประโยค 67 00:03:07,520 --> 00:03:11,170 และคำถามใหญ่คือคุณสามารถ สอนคอมพิวเตอร์วิธีการพูด 68 00:03:11,170 --> 00:03:12,650 ภาษาโดยทั่วไป 69 00:03:12,650 --> 00:03:17,810 ซึ่งเป็นคำถามที่น่าสนใจมากที่จะ คิดว่าอาจจะเป็นในอนาคต 70 00:03:17,810 --> 00:03:19,930 คุณจะสามารถ พูดคุยกับโทรศัพท์มือถือของคุณ 71 00:03:19,930 --> 00:03:23,290 ชนิดเช่นสิ่งที่เราทำกับศิริ แต่ บางสิ่งบางอย่างมากขึ้นเช่นคุณสามารถจริง 72 00:03:23,290 --> 00:03:25,690 บอกว่าสิ่งที่คุณต้องการและโทรศัพท์ จะเข้าใจทุกอย่าง 73 00:03:25,690 --> 00:03:28,350 และมันก็จะมีคำถามตามมา และให้พูดคุย 74 00:03:28,350 --> 00:03:30,880 นั่นเป็นสิ่งที่น่าตื่นเต้นจริงๆ ในความคิดของฉัน 75 00:03:30,880 --> 00:03:33,070 >> ดังนั้นสิ่งที่เกี่ยวกับภาษาธรรมชาติ 76 00:03:33,070 --> 00:03:36,220 สิ่งที่น่าสนใจมากเกี่ยวกับ ภาษาธรรมชาติที่และนี่คือ 77 00:03:36,220 --> 00:03:38,470 เครดิตกับภาษาศาสตร์อาจารย์ของฉัน มาเรีย Polinsky 78 00:03:38,470 --> 00:03:40,830 เธอแสดงให้เห็นตัวอย่างและฉันคิดว่า มันเป็นเรื่องที่น่าสนใจจริงๆ 79 00:03:40,830 --> 00:03:47,060 เพราะเราเรียนรู้ภาษาจากเมื่อ เราเกิดมาแล้วพื้นเมืองของเรา 80 00:03:47,060 --> 00:03:49,170 ชนิดของภาษาที่เราเติบโตขึ้น 81 00:03:49,170 --> 00:03:52,570 >> และโดยทั่วไปคุณเรียนรู้ภาษา จากการป้อนข้อมูลน้อยที่สุดใช่ไหม 82 00:03:52,570 --> 00:03:56,700 คุณเพียงแค่ได้รับการป้อนข้อมูลจากคุณ พ่อแม่ของสิ่งที่ภาษาของคุณเสียง 83 00:03:56,700 --> 00:03:58,770 ชอบและคุณเพียงแค่เรียนรู้มัน 84 00:03:58,770 --> 00:04:02,240 ดังนั้นจึงเป็นที่น่าสนใจเพราะถ้าคุณดู ที่ประโยคเหล่านั้นตัวอย่างเช่น 85 00:04:02,240 --> 00:04:06,980 คุณดู "แมรี่สวมเสื้อเกราะทุก เวลาที่เธอออกจากบ้าน. " 86 00:04:06,980 --> 00:04:10,650 >> ในกรณีนี้ก็เป็นไปได้ที่จะมี คำว่า "เธอ" หมายถึงแมรี่ใช่ไหม 87 00:04:10,650 --> 00:04:13,500 คุณสามารถพูดได้ "แมรี่สวมเสื้อเกราะ เวลาแมรี่ออกทุก 88 00:04:13,500 --> 00:04:14,960 บ้าน. "เพื่อให้เป็นดี 89 00:04:14,960 --> 00:04:19,370 แต่แล้วถ้าคุณมองไปที่ประโยค "เธอสวมเสื้อเกราะทุกครั้งที่แมรี่ 90 00:04:19,370 --> 00:04:22,850 ออกจากบ้าน. "คุณรู้ว่ามัน เป็นไปไม่ได้ที่จะบอกว่า "เธอ" เป็น 91 00:04:22,850 --> 00:04:24,260 หมายถึงแมรี่ 92 00:04:24,260 --> 00:04:27,070 >> มีวิธีการบอกว่า "แมรี่ทำให้ไม่ได้ เสื้อแมรี่เวลาออกทุก 93 00:04:27,070 --> 00:04:30,790 บ้าน. "ดังนั้นจึงเป็นที่น่าสนใจเพราะ นี้เป็นชนิดของสัญชาตญาณ 94 00:04:30,790 --> 00:04:32,890 ว่าทุกเจ้าของภาษามี 95 00:04:32,890 --> 00:04:36,370 และไม่มีใครได้รับการสอนว่านี้เป็น วิธีการที่ผลงานของไวยากรณ์ 96 00:04:36,370 --> 00:04:41,930 และการที่คุณสามารถมีเพียงแค่นี้ "เธอ" หมายถึงแมรี่ในกรณีแรกนี้ 97 00:04:41,930 --> 00:04:44,260 และจริงในอื่น ๆ เกินไป แต่ไม่ได้อยู่ในนี้ 98 00:04:44,260 --> 00:04:46,500 แต่ทุกคนจะได้รับชนิดของ ให้คำตอบเดียวกัน 99 00:04:46,500 --> 00:04:48,580 ทุกคนเห็นพ้องว่า 100 00:04:48,580 --> 00:04:53,280 ดังนั้นจึงเป็นที่น่าสนใจจริงๆว่าแม้ว่า คุณไม่ทราบว่ากฎทั้งหมด 101 00:04:53,280 --> 00:04:55,575 ในภาษาของคุณชนิดของคุณเข้าใจ วิธีการทำงานของภาษา 102 00:04:55,575 --> 00:04:59,020 103 00:04:59,020 --> 00:05:01,530 >> ดังนั้นสิ่งที่น่าสนใจเกี่ยวกับธรรมชาติ ภาษาคือการที่คุณจะได้ไม่ต้อง 104 00:05:01,530 --> 00:05:06,970 รู้ไวยากรณ์ใดที่จะทราบว่าประโยค เป็นไวยากรณ์หรือผิดไวยากรณ์เพื่อ 105 00:05:06,970 --> 00:05:08,810 กรณีส่วนใหญ่ 106 00:05:08,810 --> 00:05:13,220 ซึ่งทำให้คุณคิดว่าอาจจะเป็นสิ่งที่ ที่เกิดขึ้นคือผ่านชีวิตของคุณคุณ 107 00:05:13,220 --> 00:05:17,410 เพียงแค่ให้ได้รับมากขึ้นและมากขึ้น ประโยคที่บอกให้คุณ 108 00:05:17,410 --> 00:05:19,800 แล้วคุณจะให้จำ ทุกประโยค 109 00:05:19,800 --> 00:05:24,230 และจากนั้นเมื่อมีคนบอกคุณ บางสิ่งบางอย่างที่คุณได้ยินประโยคที่และ 110 00:05:24,230 --> 00:05:27,040 คุณดูที่คำศัพท์ของคุณ ของประโยคและดูว่า 111 00:05:27,040 --> 00:05:28,270 ประโยคที่มี 112 00:05:28,270 --> 00:05:29,830 และถ้ามันเป็นสิ่งที่มีคุณ บอกว่ามันเป็นไวยากรณ์ 113 00:05:29,830 --> 00:05:31,740 ถ้ามันไม่ได้บอกว่ามันเป็น ผิดไวยากรณ์ 114 00:05:31,740 --> 00:05:35,150 >> ดังนั้นในกรณีที่คุณจะพูดว่าโอ้ เพื่อให้คุณมีรายการใหญ่ของทั้งหมด 115 00:05:35,150 --> 00:05:36,140 ประโยคที่เป็นไปได้ 116 00:05:36,140 --> 00:05:38,240 และจากนั้นเมื่อคุณได้ยินประโยค คุณรู้ว่ามันเป็นไวยากรณ์หรือ 117 00:05:38,240 --> 00:05:39,450 ไม่ขึ้นอยู่กับว่า 118 00:05:39,450 --> 00:05:42,360 เป็นสิ่งที่ถ้าคุณดูที่ ประโยคตัวอย่างเช่น " 119 00:05:42,360 --> 00:05:47,540 ห้าหัว CS50 TFs สุกตาบอด ปลาหมึกใช้แก้ว DAPA. "มันเป็น 120 00:05:47,540 --> 00:05:49,630 แน่นอนไม่ประโยค ที่คุณได้ยินมาก่อน 121 00:05:49,630 --> 00:05:52,380 แต่ในขณะเดียวกันคุณรู้ว่ามัน สวยมากไวยากรณ์ใช่ไหม 122 00:05:52,380 --> 00:05:55,570 ไม่มีความผิดพลาดทางไวยากรณ์เป็น และคุณสามารถพูดได้ว่า 123 00:05:55,570 --> 00:05:57,020 มันเป็นเรื่องที่เป็นไปได้ประโยค 124 00:05:57,020 --> 00:06:01,300 >> จึงทำให้เราคิดว่าจริง วิธีการที่เราได้เรียนรู้ภาษาที่ไม่เพียง 125 00:06:01,300 --> 00:06:07,090 โดยมีฐานข้อมูลขนาดใหญ่ที่เป็นไปได้ คำหรือประโยค แต่มากขึ้นของ 126 00:06:07,090 --> 00:06:11,490 การทำความเข้าใจความสัมพันธ์ระหว่าง คำในประโยคเหล่านั้น 127 00:06:11,490 --> 00:06:14,570 ไม่ที่ทำให้รู้สึก? 128 00:06:14,570 --> 00:06:19,370 ดังนั้นแล้วคำถามคือสามารถ คอมพิวเตอร์เรียนรู้ภาษา? 129 00:06:19,370 --> 00:06:21,490 เราสามารถสอนภาษาให้กับคอมพิวเตอร์? 130 00:06:21,490 --> 00:06:24,230 >> ดังนั้นขอคิดของความแตกต่าง ระหว่างเจ้าของภาษาของภาษา 131 00:06:24,230 --> 00:06:25,460 และเครื่องคอมพิวเตอร์ 132 00:06:25,460 --> 00:06:27,340 ดังนั้นสิ่งที่เกิดขึ้นกับลำโพงหรือไม่ 133 00:06:27,340 --> 00:06:30,430 ดีเจ้าของภาษาเรียนรู้ ภาษาจากการสัมผัสกับมัน 134 00:06:30,430 --> 00:06:34,200 ปกติปีในวัยเด็กของต้น 135 00:06:34,200 --> 00:06:38,570 ดังนั้นโดยทั่วไปคุณก็มีลูก และคุณให้พูดคุยกับมันและมัน 136 00:06:38,570 --> 00:06:40,540 เพียงแค่เรียนรู้วิธีการพูด ภาษาใช่ไหม 137 00:06:40,540 --> 00:06:42,660 ดังนั้นคุณพื้นให้ ใส่ไปยังทารก 138 00:06:42,660 --> 00:06:45,200 ดังนั้นแล้วคุณสามารถยืนยันว่าคอมพิวเตอร์ สามารถทำสิ่งเดียวกันใช่ไหม 139 00:06:45,200 --> 00:06:49,510 คุณก็สามารถให้ภาษา เป็นข้อมูลไปยังคอมพิวเตอร์ 140 00:06:49,510 --> 00:06:53,410 >> เป็นเช่นพวงของไฟล์ ที่มีหนังสือภาษาอังกฤษ 141 00:06:53,410 --> 00:06:56,190 บางทีนั่นอาจเป็นวิธีหนึ่งที่คุณ อาจจะสอน 142 00:06:56,190 --> 00:06:57,850 คอมพิวเตอร์ภาษาอังกฤษใช่ไหม 143 00:06:57,850 --> 00:07:01,000 และในความเป็นจริงถ้าคุณคิดเกี่ยวกับมัน ก็จะใช้เวลาที่คุณอาจจะไม่กี่ 144 00:07:01,000 --> 00:07:02,680 วันในการอ่านหนังสือ 145 00:07:02,680 --> 00:07:05,760 สำหรับเครื่องคอมพิวเตอร์ที่จะใช้เวลาสองถึง ดูคำทั้งหมดที่อยู่ในหนังสือ 146 00:07:05,760 --> 00:07:10,810 เพื่อให้คุณสามารถคิดว่าอาจจะมีเพียงแค่นี้ ข้อโต้แย้งของการป้อนข้อมูลจากรอบ ๆ ตัวคุณ 147 00:07:10,810 --> 00:07:15,440 ที่ไม่เพียงพอที่จะบอกว่าที่ สิ่งที่มนุษย์สามารถทำได้ 148 00:07:15,440 --> 00:07:17,680 คุณสามารถคิดคอมพิวเตอร์ นอกจากนี้ยังสามารถได้รับข้อมูล 149 00:07:17,680 --> 00:07:21,170 >> สิ่งที่สองคือว่าเจ้าของภาษา ยังมีสมองที่มี 150 00:07:21,170 --> 00:07:23,870 ความสามารถในการเรียนรู้ภาษา 151 00:07:23,870 --> 00:07:27,020 แต่ถ้าคุณคิดเกี่ยวกับมัน สมองเป็นสิ่งที่มั่นคง 152 00:07:27,020 --> 00:07:30,450 เมื่อคุณจะเกิดมาก็ตั้งแล้ว - 153 00:07:30,450 --> 00:07:31,320 นี้เป็นสมองของคุณ 154 00:07:31,320 --> 00:07:34,660 และในขณะที่คุณโตขึ้นคุณก็จะได้รับเพิ่มเติม ใส่ของภาษาและสารอาหารที่อาจจะ 155 00:07:34,660 --> 00:07:35,960 และสิ่งอื่น ๆ 156 00:07:35,960 --> 00:07:38,170 สวยมาก แต่สมองของคุณ เป็นสิ่งที่มั่นคง 157 00:07:38,170 --> 00:07:41,290 >> เพื่อให้คุณสามารถพูดได้ว่าดีบางทีคุณอาจจะสามารถ สร้างคอมพิวเตอร์ที่มีพวงของ 158 00:07:41,290 --> 00:07:45,890 ฟังก์ชั่นและวิธีการที่เพียงแค่เลียนแบบ ความสามารถในการเรียนรู้ภาษา 159 00:07:45,890 --> 00:07:49,630 ดังนั้นในแง่ที่ว่าคุณอาจจะบอกว่าดีฉัน สามารถมีเครื่องคอมพิวเตอร์ที่มีทั้งหมด 160 00:07:49,630 --> 00:07:52,270 สิ่งที่ฉันจำเป็นต้องเรียนรู้ภาษา 161 00:07:52,270 --> 00:07:56,200 และสิ่งสุดท้ายคือการที่ชาวพื้นเมือง ลำโพงเรียนรู้จากการทดลองและข้อผิดพลาด 162 00:07:56,200 --> 00:08:01,090 ดังนั้นโดยทั่วไปอีกหนึ่งสิ่งที่สำคัญในการ การเรียนรู้ภาษาที่คุณชนิด 163 00:08:01,090 --> 00:08:05,340 ของเรียนรู้สิ่งโดยการ ภาพรวมของสิ่งที่คุณได้ยิน 164 00:08:05,340 --> 00:08:10,280 >> เพื่อที่คุณจะเติบโตขึ้นมาคุณได้เรียนรู้ว่า คำบางคำมีมากขึ้นเช่นคำนาม 165 00:08:10,280 --> 00:08:11,820 บางคนอื่น ๆ ที่มีคำคุณศัพท์ 166 00:08:11,820 --> 00:08:14,250 และคุณไม่จำเป็นต้องมี ความรู้เกี่ยวกับภาษาศาสตร์ 167 00:08:14,250 --> 00:08:15,040 ต้องเข้าใจว่า 168 00:08:15,040 --> 00:08:18,560 แต่คุณก็รู้ว่ามีคำบางคำ ถูกวางตำแหน่งในส่วนของบางอย่าง 169 00:08:18,560 --> 00:08:22,570 ประโยคและบางคนอื่น ๆ ในที่อื่น ชิ้นส่วนของประโยค 170 00:08:22,570 --> 00:08:26,110 >> และที่ว่าเมื่อคุณทำสิ่งที่เป็น เช่นประโยคที่ไม่ถูกต้อง - 171 00:08:26,110 --> 00:08:28,770 อาจจะเป็นเพราะลักษณะทั่วไปกว่า เช่น 172 00:08:28,770 --> 00:08:32,210 บางทีเมื่อคุณเติบโตขึ้นคุณสังเกตเห็น ที่เป็นพหูพจน์โดยปกติจะเป็น 173 00:08:32,210 --> 00:08:35,809 ที่เกิดขึ้นโดยการใส่ S ที่ ในตอนท้ายของคำว่า 174 00:08:35,809 --> 00:08:40,042 และจากนั้นคุณพยายามที่จะทำพหูพจน์ของ "กวาง" ขณะที่ "กวาง" หรือ "ฟัน" เป็น 175 00:08:40,042 --> 00:08:44,780 "ฟัน." ดังนั้นแล้วพ่อแม่ของคุณหรือ ใครบางคนที่คุณแก้ไขและบอกว่าไม่มี 176 00:08:44,780 --> 00:08:49,020 พหูพจน์ของ "กวาง" เป็น "กวาง" และ พหูพจน์ของ "ฟัน" เป็น "ฟัน." แล้วจึง 177 00:08:49,020 --> 00:08:50,060 คุณเรียนรู้สิ่งเหล่านั้น 178 00:08:50,060 --> 00:08:51,520 เพื่อให้คุณได้เรียนรู้จากการทดลองและความผิดพลาด 179 00:08:51,520 --> 00:08:53,100 >> แต่คุณยังสามารถทำเช่นนั้นได้ กับคอมพิวเตอร์ 180 00:08:53,100 --> 00:08:55,310 คุณสามารถมีสิ่งที่เรียกว่า การเรียนรู้เสริม 181 00:08:55,310 --> 00:08:58,560 ซึ่งเป็นพื้นเช่นให้ คอมพิวเตอร์รางวัลเมื่อใดก็ตามที่มันไม่ 182 00:08:58,560 --> 00:08:59,410 บางสิ่งบางอย่างได้อย่างถูกต้อง 183 00:08:59,410 --> 00:09:04,710 และให้มันตรงข้ามของรางวัล และเมื่อมันไม่สิ่งที่ไม่ถูกต้อง 184 00:09:04,710 --> 00:09:07,410 จริงๆคุณสามารถเห็นได้ว่าถ้าคุณไป ไปที่ Google แปลและคุณพยายามที่จะ 185 00:09:07,410 --> 00:09:10,220 แปลประโยคมัน ขอให้คุณสำหรับข้อมูล 186 00:09:10,220 --> 00:09:13,240 ดังนั้นถ้าคุณจะพูดว่าโอ้มีดีกว่าที่ แปลประโยคนี้ 187 00:09:13,240 --> 00:09:18,140 คุณสามารถพิมพ์มันขึ้นมาและจากนั้นถ้าเป็นจำนวนมาก คนให้บอกว่าจะดีกว่า 188 00:09:18,140 --> 00:09:21,560 แปลก็แค่รู้ว่ามัน ควรใช้การแปลที่แทน 189 00:09:21,560 --> 00:09:22,960 หนึ่งก็คือการให้ 190 00:09:22,960 --> 00:09:28,830 >> ดังนั้นจึงเป็นคำถามปรัชญามาก เพื่อดูว่าคอมพิวเตอร์ที่เป็นไปได้ 191 00:09:28,830 --> 00:09:30,340 สามารถที่จะพูดคุยหรือไม่ในอนาคต 192 00:09:30,340 --> 00:09:34,440 แต่ฉันมีความหวังสูงที่พวกเขาสามารถ เพียงแค่ขึ้นอยู่กับข้อโต้แย้งเหล่านั้น 193 00:09:34,440 --> 00:09:38,570 แต่มันเป็นเพียงมากขึ้นของปรัชญา คำถาม 194 00:09:38,570 --> 00:09:43,460 >> ดังนั้นในขณะที่คอมพิวเตอร์ยังไม่สามารถพูดคุย สิ่งที่เราสามารถทำได้หรือไม่ 195 00:09:43,460 --> 00:09:47,070 บางสิ่งที่เย็นจริงๆ การจัดหมวดหมู่ข้อมูล 196 00:09:47,070 --> 00:09:53,210 ดังนั้นสำหรับตัวอย่างเช่นที่พวกคุณรู้ บริการอีเมลที่ทำสำหรับ 197 00:09:53,210 --> 00:09:55,580 ตัวอย่างเช่นการกรองสแปม 198 00:09:55,580 --> 00:09:59,070 ดังนั้นเมื่อใดก็ตามที่คุณได้รับสแปม พยายามที่จะกรองกล่องอื่น 199 00:09:59,070 --> 00:10:00,270 ดังนั้นวิธีที่จะทำเช่นนั้น 200 00:10:00,270 --> 00:10:06,080 มันไม่เหมือนคอมพิวเตอร์เพียงแค่รู้ สิ่งที่อยู่อีเมลที่มีการส่งสแปม 201 00:10:06,080 --> 00:10:09,130 ดังนั้นจึงขึ้นอยู่กับเนื้อหาของ ข้อความหรืออาจจะชื่อเรื่องหรือ 202 00:10:09,130 --> 00:10:11,310 อาจจะรูปแบบบางอย่างที่คุณมี 203 00:10:11,310 --> 00:10:15,690 >> ดังนั้นโดยทั่วไปสิ่งที่คุณสามารถทำได้คือการได้รับ ข้อมูลจำนวนมากของอีเมลที่เป็นสแปม 204 00:10:15,690 --> 00:10:19,980 อีเมลที่ไม่ได้สแปมและเรียนรู้สิ่งที่ ชนิดของรูปแบบที่คุณมีใน 205 00:10:19,980 --> 00:10:21,000 คนที่มีสแปม 206 00:10:21,000 --> 00:10:23,260 และนี่คือส่วนหนึ่งของการคำนวณ ภาษาศาสตร์ 207 00:10:23,260 --> 00:10:24,720 มันเรียกว่าการจัดหมวดหมู่ข้อมูล 208 00:10:24,720 --> 00:10:28,100 และเรากำลังจริงจะไปดู ตัวอย่างที่อยู่ในสไลด์ถัดไป 209 00:10:28,100 --> 00:10:32,910 >> สิ่งที่สองคือภาษาธรรมชาติ การประมวลผลซึ่งเป็นสิ่งที่ 210 00:10:32,910 --> 00:10:36,580 ค้นหากราฟจะทำของให้ คุณเขียนประโยค 211 00:10:36,580 --> 00:10:38,690 และมันก็ไว้ใจคุณเข้าใจสิ่งที่ คือความหมายและให้ 212 00:10:38,690 --> 00:10:39,940 คุณผลที่ดีกว่า 213 00:10:39,940 --> 00:10:43,880 ที่จริงถ้าคุณไปที่ Google หรือ Bing และคุณสามารถค้นหาสิ่งที่ชอบเลดี้ 214 00:10:43,880 --> 00:10:47,060 ความสูงของกาก้า, คุณกำลังจะเป็นจริง ที่จะได้รับ 5 '1 "แทนข้อมูล 215 00:10:47,060 --> 00:10:50,170 จากเธอจริงเพราะมันเข้าใจ สิ่งที่คุณกำลังพูดถึง 216 00:10:50,170 --> 00:10:52,140 เพื่อให้เป็นส่วนหนึ่งของธรรมชาติ การประมวลผลภาษา 217 00:10:52,140 --> 00:10:57,000 >> หรือเมื่อคุณกำลังใช้สิริแรก คุณมีขั้นตอนวิธีการที่พยายามที่จะ 218 00:10:57,000 --> 00:11:01,130 แปลสิ่งที่คุณพูด เป็นคำในข้อความ 219 00:11:01,130 --> 00:11:03,690 แล้วก็พยายามที่จะแปล ที่เป็นความหมาย 220 00:11:03,690 --> 00:11:06,570 ดังนั้นนั่นคือทั้งหมดที่เป็นส่วนหนึ่งของธรรมชาติ การประมวลผลภาษา 221 00:11:06,570 --> 00:11:08,320 >> แล้วคุณมีเครื่องแปลภาษา - 222 00:11:08,320 --> 00:11:10,300 ซึ่งเป็นจริงอย่างใดอย่างหนึ่ง รายการโปรดของฉัน - 223 00:11:10,300 --> 00:11:14,060 ซึ่งเป็นเพียงการแปลจาก ภาษาอื่น 224 00:11:14,060 --> 00:11:17,950 เพื่อให้คุณสามารถคิดว่าเมื่อคุณกำลังทำ เครื่องแปลภาษาที่คุณต้อง 225 00:11:17,950 --> 00:11:19,750 เป็นไปได้ไม่มีที่สิ้นสุดของประโยค 226 00:11:19,750 --> 00:11:22,960 จึงมีวิธีการจัดเก็บเพียงไม่ ทุกแปลเดียว 227 00:11:22,960 --> 00:11:27,440 ดังนั้นคุณต้องมากับที่น่าสนใจ ขั้นตอนวิธีการที่จะสามารถ 228 00:11:27,440 --> 00:11:30,110 แปลทุกเดียว ประโยคในบางวิธี 229 00:11:30,110 --> 00:11:32,483 >> พวกคุณมีคำถามใด ๆ เพื่อให้ห่างไกล 230 00:11:32,483 --> 00:11:34,450 ไม่ได้หรือไม่ 231 00:11:34,450 --> 00:11:34,830 ตกลง 232 00:11:34,830 --> 00:11:36,900 >> ดังนั้นสิ่งที่เราจะได้เห็นในวันนี้ 233 00:11:36,900 --> 00:11:39,300 แรกของทั้งหมดที่ฉันจะพูดคุยเกี่ยวกับ ปัญหาการจัดหมวดหมู่ 234 00:11:39,300 --> 00:11:41,440 ดังนั้นสิ่งหนึ่งที่ฉันเป็น พูดเกี่ยวกับสแปม 235 00:11:41,440 --> 00:11:46,820 สิ่งที่ฉันจะทำคือเนื้อเพลงที่กำหนด เพลงที่คุณสามารถพยายามที่จะคิดออก 236 00:11:46,820 --> 00:11:49,810 มีโอกาสสูง ที่เป็นนักร้องหรือไม่ 237 00:11:49,810 --> 00:11:53,590 สมมติว่าผมมีเพลงจากเลดี้ กาก้าและ Katy Perry, ถ้าฉันให้คุณ 238 00:11:53,590 --> 00:11:58,130 เพลงใหม่ที่คุณสามารถคิดออกว่า มัน Katy Perry หรือ Lady Gaga? 239 00:11:58,130 --> 00:12:01,490 >> คนที่สองฉันแค่จะไปพูดคุย เกี่ยวกับปัญหาการแบ่งส่วน 240 00:12:01,490 --> 00:12:05,780 ดังนั้นผมจึงไม่ทราบว่าพวกคุณรู้ แต่ จีน, ญี่ปุ่น, อื่น ๆ ในเอเชียตะวันออก 241 00:12:05,780 --> 00:12:08,090 ภาษาและภาษาอื่น ๆ โดยทั่วไปไม่ได้ 242 00:12:08,090 --> 00:12:09,830 ช่องว่างระหว่างคำ 243 00:12:09,830 --> 00:12:13,540 แล้วถ้าคุณคิดเกี่ยวกับวิธีการที่ ชนิดเครื่องคอมพิวเตอร์ของคุณพยายามที่จะ 244 00:12:13,540 --> 00:12:18,600 เข้าใจการประมวลผลภาษาธรรมชาติ มันมีลักษณะที่เป็นคำพูดและ 245 00:12:18,600 --> 00:12:21,500 พยายามที่จะเข้าใจความสัมพันธ์ ระหว่างพวกเขาใช่มั้ย 246 00:12:21,500 --> 00:12:25,440 แต่แล้วถ้าคุณมีจีนและคุณ มีศูนย์การเว้นวรรคเป็นจริงยากที่จะ 247 00:12:25,440 --> 00:12:28,360 หาสิ่งที่เป็นความสัมพันธ์ระหว่าง คำเพราะพวกเขาไม่ได้มี 248 00:12:28,360 --> 00:12:29,530 คำในตอนแรก 249 00:12:29,530 --> 00:12:32,600 ดังนั้นคุณต้องทำสิ่งที่เรียกว่า การแบ่งส่วนซึ่งก็หมายถึงการวาง 250 00:12:32,600 --> 00:12:36,490 ช่องว่างระหว่างสิ่งที่เราต้องการโทร คำในภาษาเหล่านั้น 251 00:12:36,490 --> 00:12:37,740 ทำให้รู้สึก 252 00:12:37,740 --> 00:12:39,680 253 00:12:39,680 --> 00:12:41,540 >> แล้วเรากำลังจะ พูดคุยเกี่ยวกับไวยากรณ์ 254 00:12:41,540 --> 00:12:44,050 ดังนั้นเพียงแค่นิด ๆ หน่อย ๆ เกี่ยวกับธรรมชาติ การประมวลผลภาษา 255 00:12:44,050 --> 00:12:45,420 มันจะเป็นเพียงแค่ภาพรวม 256 00:12:45,420 --> 00:12:50,700 ดังนั้นวันนี้เป็นสิ่งที่ฉันต้องการจะทำ ที่ให้คุณผู้ชายเล็กน้อย 257 00:12:50,700 --> 00:12:53,930 ด้านในของสิ่งที่เป็นไปได้ ที่คุณสามารถทำอะไรกับคอมพิวเตอร์ 258 00:12:53,930 --> 00:12:54,960 ภาษาศาสตร์ 259 00:12:54,960 --> 00:13:00,410 และแล้วคุณจะเห็นสิ่งที่คุณคิด เป็นเย็นในสิ่งเหล่านั้น 260 00:13:00,410 --> 00:13:02,270 และบางทีคุณอาจจะคิดว่าโครงการ และมาพูดคุยกับผม 261 00:13:02,270 --> 00:13:05,260 และผมสามารถให้คำแนะนำ เกี่ยวกับวิธีการที่จะใช้มัน 262 00:13:05,260 --> 00:13:09,060 >> ดังนั้นรูปแบบที่เป็นไปได้นิด ๆ หน่อย ๆ เกี่ยวกับการค้นหากราฟและเครื่อง 263 00:13:09,060 --> 00:13:09,670 การแปล 264 00:13:09,670 --> 00:13:13,650 ฉันแค่จะให้ตัวอย่างของวิธีการ คุณสามารถยกตัวอย่างเช่นการแปล 265 00:13:13,650 --> 00:13:16,020 อะไรบางอย่างจากภาษาโปรตุเกสเป็นภาษาอังกฤษ 266 00:13:16,020 --> 00:13:17,830 เสียงดี? 267 00:13:17,830 --> 00:13:19,293 >> ดังนั้นครั้งแรกที่ปัญหาการจัดหมวดหมู่ 268 00:13:19,293 --> 00:13:23,590 ฉันจะบอกว่าเป็นส่วนหนึ่งของการสัมมนานี้ เป็นไปได้ที่ท้าทายที่สุด 269 00:13:23,590 --> 00:13:27,560 อย่างใดอย่างหนึ่งเพียงเพราะมีจะ จะมีบางรหัส 270 00:13:27,560 --> 00:13:29,470 แต่มันจะเป็นงูหลาม 271 00:13:29,470 --> 00:13:34,380 ฉันรู้ว่าพวกคุณไม่ทราบว่างูหลามดังนั้น ฉันแค่จะอธิบายไว้ในที่สูง 272 00:13:34,380 --> 00:13:35,750 ระดับสิ่งที่ฉันทำ 273 00:13:35,750 --> 00:13:40,900 และคุณไม่ต้องดูแลมากเกินไป มากเกี่ยวกับไวยากรณ์เพราะนั่นคือ 274 00:13:40,900 --> 00:13:42,140 สิ่งที่พวกคุณสามารถเรียนรู้ 275 00:13:42,140 --> 00:13:42,540 OK? 276 00:13:42,540 --> 00:13:43,580 เสียงดี 277 00:13:43,580 --> 00:13:46,020 >> ดังนั้นสิ่งที่เป็นปัญหาการจัดหมวดหมู่หรือไม่ 278 00:13:46,020 --> 00:13:49,140 ดังนั้นคุณจะได้รับเนื้อเพลงบาง เพลงและคุณต้องการที่จะคาดเดา 279 00:13:49,140 --> 00:13:50,620 ที่มีการร้องเพลง 280 00:13:50,620 --> 00:13:54,045 และนี้สามารถเป็นชนิดใด ของปัญหาอื่น ๆ 281 00:13:54,045 --> 00:13:59,980 เพื่อที่จะสามารถยกตัวอย่างเช่นคุณมี ประธานาธิบดีและคุณมี 282 00:13:59,980 --> 00:14:02,610 การพูดและคุณต้องการที่จะหา ออกมาถ้ามันเป็นเช่น 283 00:14:02,610 --> 00:14:04,470 โอบามาหรือนวมรอมนีย์ 284 00:14:04,470 --> 00:14:07,700 หรือคุณสามารถมีพวงของอีเมลและ คุณต้องการที่จะคิดออกว่าพวกเขาเป็น 285 00:14:07,700 --> 00:14:08,890 สแปมหรือไม่ 286 00:14:08,890 --> 00:14:11,440 ดังนั้นมันจึงเป็นเพียงการแบ่งบาง ข้อมูลตามคำ 287 00:14:11,440 --> 00:14:13,790 ที่คุณต้องมี 288 00:14:13,790 --> 00:14:16,295 >> ดังนั้นจะทำอย่างไรที่คุณจะต้อง ทำให้สมมติฐานบางอย่าง 289 00:14:16,295 --> 00:14:20,570 ดังนั้นจำนวนมากเกี่ยวกับภาษาศาสตร์ คือการทำให้สมมติฐาน 290 00:14:20,570 --> 00:14:24,100 สมมติฐานมักจะสมาร์ทเพื่อให้ คุณจะได้รับผลลัพธ์ที่ดี 291 00:14:24,100 --> 00:14:26,670 พยายามที่จะสร้างแบบจำลองสำหรับมัน 292 00:14:26,670 --> 00:14:31,290 แล้วลองมันออกมาและดูว่าการทำงาน ถ้ามันจะช่วยให้คุณมีความแม่นยำที่ดี 293 00:14:31,290 --> 00:14:33,940 และถ้าไม่แล้วคุณ พยายามที่จะปรับปรุงมัน 294 00:14:33,940 --> 00:14:37,640 ถ้าไม่ได้คุณก็เหมือนตกลงบางทีฉัน ควรจะทำให้สมมติฐานที่แตกต่างกัน 295 00:14:37,640 --> 00:14:44,030 >> ดังนั้นสมมติฐานที่เรากำลังจะ ให้เป็นศิลปินที่มักจะร้องเพลง 296 00:14:44,030 --> 00:14:49,220 เกี่ยวกับหัวข้อที่หลายครั้งและอาจจะ ใช้คำพูดหลายครั้งเพียงแค่ 297 00:14:49,220 --> 00:14:50,270 เพราะพวกเขากำลังใช้มัน 298 00:14:50,270 --> 00:14:51,890 คุณก็สามารถคิดของเพื่อนของคุณ 299 00:14:51,890 --> 00:14:57,350 ฉันแน่ใจว่าพวกคุณทุกคนมีเพื่อน วลีที่บอกว่าลายเซ็นของพวกเขา 300 00:14:57,350 --> 00:14:59,260 แท้จริงสำหรับทุกประโยคเดียว - 301 00:14:59,260 --> 00:15:02,660 เช่นบางคำที่เฉพาะเจาะจงหรือเฉพาะบางส่วน วลีที่ว่าพวกเขากล่าวว่าสำหรับ 302 00:15:02,660 --> 00:15:04,020 ทุกประโยคเดียว 303 00:15:04,020 --> 00:15:07,920 >> และสิ่งที่คุณสามารถพูดได้ก็คือว่าถ้าคุณเห็น ประโยคที่มีลายเซ็น 304 00:15:07,920 --> 00:15:11,450 วลีที่คุณสามารถเดาว่าน่าจะเป็น เพื่อนของคุณเป็น 305 00:15:11,450 --> 00:15:13,310 หนึ่งบอกว่ามันใช่มั้ย 306 00:15:13,310 --> 00:15:18,410 ดังนั้นคุณจึงทำให้สันนิษฐานว่าแล้ว ว่าเป็นวิธีที่คุณสร้างแบบจำลอง 307 00:15:18,410 --> 00:15:24,440 >> ตัวอย่างที่ผมจะให้อยู่ใน วิธีของเลดี้กาก้ายกตัวอย่างเช่นคน 308 00:15:24,440 --> 00:15:27,430 บอกว่าเธอใช้ "ทารก" สำหรับการ ของเธอจำนวนหนึ่งเพลงทั้งหมด 309 00:15:27,430 --> 00:15:32,270 และที่จริงนี้เป็นวิดีโอที่แสดงให้เห็นว่า เธอบอกว่าคำว่า "เด็ก" สำหรับการ 310 00:15:32,270 --> 00:15:33,410 เพลงที่แตกต่างกัน 311 00:15:33,410 --> 00:15:33,860 >> [วิดีโอเล่นภาพ] 312 00:15:33,860 --> 00:15:34,310 >> - (ร้องเพลง) เด็ก 313 00:15:34,310 --> 00:15:36,220 ทารก 314 00:15:36,220 --> 00:15:37,086 ทารก 315 00:15:37,086 --> 00:15:37,520 ทารก 316 00:15:37,520 --> 00:15:37,770 ทารก 317 00:15:37,770 --> 00:15:38,822 ทารก 318 00:15:38,822 --> 00:15:39,243 ทารก 319 00:15:39,243 --> 00:15:40,085 ทารก 320 00:15:40,085 --> 00:15:40,510 ทารก 321 00:15:40,510 --> 00:15:40,850 ทารก 322 00:15:40,850 --> 00:15:41,090 >> [จบเล่นวิดีโอ- 323 00:15:41,090 --> 00:15:44,020 >> LUCAS FREITAS: จึงมีผมคิดว่า 40 เพลงที่นี่ในการที่เธอบอกว่า 324 00:15:44,020 --> 00:15:48,690 คำว่า "ลูก". เพื่อให้คุณโดยทั่วไปสามารถคาดเดาได้ ว่าถ้าคุณเห็นเพลงที่มี 325 00:15:48,690 --> 00:15:52,180 คำว่า "ลูก" มีบางสูง ความน่าจะเป็นว่ามันเป็นของเลดี้กาก้า 326 00:15:52,180 --> 00:15:56,450 แต่ให้พยายามที่จะพัฒนานี้ ต่อไปอีกอย่างเป็นทางการ 327 00:15:56,450 --> 00:16:00,470 >> ดังนั้นเหล่านี้เป็นเนื้อเพลงเพลง ของเลดี้กาก้าและ Katy Perry 328 00:16:00,470 --> 00:16:04,120 เพื่อให้คุณดู Lady Gaga คุณจะเห็นพวกเขา มีจำนวนมากเกิดขึ้นของ "เด็ก" 329 00:16:04,120 --> 00:16:07,710 จำนวนมากเกิดขึ้นของ "วิธีการ". แล้วจึง Katy Perry มีจำนวนมากเกิดขึ้นของ 330 00:16:07,710 --> 00:16:10,360 "," จำนวนมากเกิดขึ้นของ "ไฟ." 331 00:16:10,360 --> 00:16:14,560 >> ดังนั้นโดยทั่วไปสิ่งที่เราต้องการ ไม่เป็นที่คุณจะได้รับบทกวี 332 00:16:14,560 --> 00:16:20,480 สมมติว่าคุณจะได้รับบทเป็น เพลงที่เป็น "ลูก" แค่ "ลูก." ถ้า 333 00:16:20,480 --> 00:16:24,750 คุณเพิ่งได้รับคำว่า "ลูก" และนี้ คือข้อมูลทั้งหมดที่คุณได้จาก 334 00:16:24,750 --> 00:16:27,880 ของเลดี้กาก้าและเคทีเพอร์รี่ที่จะ คุณคิดว่าเป็นบุคคลที่ 335 00:16:27,880 --> 00:16:29,370 ที่ร้องเพลงได้หรือไม่ 336 00:16:29,370 --> 00:16:32,360 Lady Gaga หรือ Katy Perry? 337 00:16:32,360 --> 00:16:33,150 Lady Gaga ใช่ไหม 338 00:16:33,150 --> 00:16:37,400 เพราะเธอเป็นคนเดียวที่บอกว่า "ทารก". นี้เสียงโง่ใช่มั้ย? 339 00:16:37,400 --> 00:16:38,760 ตกลงนี้เป็นเรื่องง่ายจริงๆ 340 00:16:38,760 --> 00:16:41,860 ฉันแค่มองหาที่สองเพลงและ แน่นอนเธอเป็นคนเดียวที่มี 341 00:16:41,860 --> 00:16:42,660 "ทารก". 342 00:16:42,660 --> 00:16:44,740 >> แต่สิ่งที่ถ้าคุณมีพวงของคำหรือไม่ 343 00:16:44,740 --> 00:16:50,900 หากคุณมีบางสิ่งบางอย่างที่เกิดขึ้นจริงบทกวี, เช่น "ลูกฉัน 344 00:16:50,900 --> 00:16:51,610 ไปดู [? CFT?] 345 00:16:51,610 --> 00:16:54,020 บรรยาย "หรือสิ่งที่ต้องการและ จริงๆแล้วคุณต้องคิดออก - 346 00:16:54,020 --> 00:16:55,780 ขึ้นอยู่กับคำทุกคน - 347 00:16:55,780 --> 00:16:58,350 ที่เป็นศิลปินที่น่าจะเป็น ร้องเพลงนี้ 348 00:16:58,350 --> 00:17:01,860 ดังนั้นเรามาพยายามที่จะพัฒนา นี้ต่อไปเพียงเล็กน้อย 349 00:17:01,860 --> 00:17:05,630 >> ตกลงตามเพื่อเพียงบนพื้นฐานของข้อมูลที่เรา ได้มันก็ดูเหมือนว่าน่าจะเป็นประสาท 350 00:17:05,630 --> 00:17:06,260 นักร้อง 351 00:17:06,260 --> 00:17:07,904 แต่วิธีการที่เราสามารถเขียน นี้มากขึ้นอย่างเป็นทางการ? 352 00:17:07,904 --> 00:17:10,579 353 00:17:10,579 --> 00:17:13,140 และมีเป็นไปได้น้อย บิตของสถ​​ิติ 354 00:17:13,140 --> 00:17:15,880 ดังนั้นถ้าคุณได้หายไปเพียงแค่ลอง ที่จะเข้าใจแนวคิด 355 00:17:15,880 --> 00:17:18,700 มันไม่สำคัญว่าถ้าคุณเข้าใจ สมสมบูรณ์ดี 356 00:17:18,700 --> 00:17:22,150 นี่คือทั้งหมดที่จะเป็นออนไลน์ 357 00:17:22,150 --> 00:17:25,490 >> ดังนั้นโดยทั่วไปสิ่งที่ฉันคำนวณเป็น ความน่าจะเป็นว่าเพลงนี้คือ 358 00:17:25,490 --> 00:17:28,040 Lady Gaga ที่กำหนดว่า - 359 00:17:28,040 --> 00:17:30,660 ดังนั้นแถบนี้หมายถึงการกำหนดว่า - 360 00:17:30,660 --> 00:17:33,680 ผมเห็นคำว่า "ลูก". ไม่ที่ทำให้รู้สึก? 361 00:17:33,680 --> 00:17:35,540 ดังนั้นฉันพยายามที่จะคำนวณ น่าจะเป็นที่ 362 00:17:35,540 --> 00:17:38,540 >> จึงมีความเชื่อที่เรียกว่านี้ Bayes ทฤษฎีบทที่บอกว่า 363 00:17:38,540 --> 00:17:43,330 น่าจะเป็นของที่ได้รับ B เป็น น่าจะเป็นของ B ที่กำหนดเวลา 364 00:17:43,330 --> 00:17:47,660 น่าจะเป็นของกว่าความน่าจะเป็น ของบีนี่คือสมการยาว 365 00:17:47,660 --> 00:17:51,970 แต่สิ่งที่คุณต้องเข้าใจจาก ที่ว่านี้คือสิ่งที่ฉันต้องการ 366 00:17:51,970 --> 00:17:52,830 คำนวณใช่ไหม 367 00:17:52,830 --> 00:17:56,570 ดังนั้นความน่าจะเป็นว่าเพลงที่เป็นโดย Lady Gaga ให้ที่ฉันได้เห็นคำว่า 368 00:17:56,570 --> 00:17:58,230 "ทารก". 369 00:17:58,230 --> 00:18:02,960 >> และตอนนี้สิ่งที่ฉันได้รับเป็น น่าจะเป็นของคำว่า "ลูก" ที่ได้รับ 370 00:18:02,960 --> 00:18:04,390 ที่ฉันมีของเลดี้กาก้า 371 00:18:04,390 --> 00:18:07,220 และว่าสิ่งที่พื้น? 372 00:18:07,220 --> 00:18:10,500 สิ่งที่หมายถึงว่าเป็นสิ่งที่เป็น ความน่าจะเป็นของการได้เห็นคำว่า "ลูก" 373 00:18:10,500 --> 00:18:12,130 ในเนื้อเพลงทึ่ม? 374 00:18:12,130 --> 00:18:16,240 ถ้าผมต้องการที่จะคำนวณว่าในมาก วิธีง่ายๆก็เพียงจำนวน 375 00:18:16,240 --> 00:18:23,640 ครั้งที่ผมเห็น "ทารก" เหนือจำนวน ของคำในเนื้อเพลงทึ่มใช่ไหม 376 00:18:23,640 --> 00:18:27,600 เป็นความถี่ที่ฉันเห็นสิ่งที่ คำว่าในการทำงานของกาก้า? 377 00:18:27,600 --> 00:18:30,530 ทำให้รู้สึก 378 00:18:30,530 --> 00:18:33,420 >> ระยะที่สองคือ น่าจะเป็นของประสาท 379 00:18:33,420 --> 00:18:34,360 สิ่งที่หมายความว่าอย่างไร 380 00:18:34,360 --> 00:18:38,550 ที่โดยทั่วไปหมายถึงสิ่งที่เป็น น่าจะเป็นของการจัด 381 00:18:38,550 --> 00:18:40,690 เนื้อเพลงบางอย่างที่โง่? 382 00:18:40,690 --> 00:18:45,320 และที่เป็นชนิดของแปลก แต่ ให้คิดเช่น 383 00:18:45,320 --> 00:18:49,230 ดังนั้นขอบอกว่าน่าจะเป็นของ มี "ลูก" ในเพลงเดียวกัน 384 00:18:49,230 --> 00:18:51,760 เพื่อทึ่มและ Britney Spears 385 00:18:51,760 --> 00:18:54,950 แต่ Britney Spears มีสองครั้ง เพลงมากกว่าของเลดี้กาก้า 386 00:18:54,950 --> 00:19:00,570 ดังนั้นถ้ามีคนเพียงแค่การสุ่มจะช่วยให้คุณ เนื้อเพลงของ "ทารก" สิ่งแรกที่คุณ 387 00:19:00,570 --> 00:19:04,710 ดูเป็นสิ่งที่น่าจะเป็นของ มี "ลูก" ในเพลงทึ่ม "ทารก" 388 00:19:04,710 --> 00:19:05,410 ในเพลงบริทนี? 389 00:19:05,410 --> 00:19:06,460 และมันก็เป็นสิ่งเดียวกัน 390 00:19:06,460 --> 00:19:10,040 >> ดังนั้นสิ่งที่สองที่คุณจะเห็นคือ ดีสิ่งที่เป็นความน่าจะเป็นของ 391 00:19:10,040 --> 00:19:13,770 บทกวีนี้ด้วยตัวเองเป็นบทกวีกาก้า, และเป็นสิ่งที่น่าจะเป็นของ 392 00:19:13,770 --> 00:19:15,380 เป็นบทกวี Britney? 393 00:19:15,380 --> 00:19:18,950 ดังนั้นตั้งแต่บริทนีเพื่อให้มีเพลงอื่น ๆ อีกมากมาย กว่ากาก้าที่คุณจะอาจ 394 00:19:18,950 --> 00:19:21,470 พูดดีนี้อาจจะเป็น บทกวีบริทนี 395 00:19:21,470 --> 00:19:23,340 ดังนั้นที่ว่าทำไมเรามีนี้ ระยะที่นี่ 396 00:19:23,340 --> 00:19:24,670 น่าจะเป็นของประสาท 397 00:19:24,670 --> 00:19:26,950 ทำให้รู้สึก? 398 00:19:26,950 --> 00:19:28,660 ไม่ได้หรือไม่ 399 00:19:28,660 --> 00:19:29,370 ตกลง 400 00:19:29,370 --> 00:19:33,500 >> และคนสุดท้ายเป็นเพียงความน่าจะเป็น ของ "เด็ก" ซึ่งไม่ได้ 401 00:19:33,500 --> 00:19:34,810 จริงๆเรื่องที่มาก 402 00:19:34,810 --> 00:19:39,940 แต่มันก็น่าจะเป็นของ เห็น "เด็ก" ในภาษาอังกฤษ 403 00:19:39,940 --> 00:19:42,725 เรามักจะไม่สนใจว่า มากเกี่ยวกับคำว่า 404 00:19:42,725 --> 00:19:44,490 ไม่ที่ทำให้รู้สึก? 405 00:19:44,490 --> 00:19:48,110 ดังนั้นน่าจะเป็นของกาก้าเป็น เรียกว่าน่าจะเป็นก่อน 406 00:19:48,110 --> 00:19:49,530 ของทึ่มชั้น 407 00:19:49,530 --> 00:19:53,840 เพราะมันก็หมายความว่าสิ่งที่เป็น ความน่าจะเป็นของการมีชั้นเรียนที่ - 408 00:19:53,840 --> 00:19:55,520 ซึ่งเป็นทึ่ม - 409 00:19:55,520 --> 00:19:59,350 เพียงในทั่วไปเพียง โดยไม่มีเงื่อนไข 410 00:19:59,350 --> 00:20:02,560 >> และจากนั้นเมื่อฉันมีความน่าจะเป็นของ กาก้าได้รับ "ทารก" เราเรียกมันว่าบวก 411 00:20:02,560 --> 00:20:06,160 teary น่าจะเป็นเพราะมันเป็น ความน่าจะเป็นของการมี 412 00:20:06,160 --> 00:20:08,300 กาก้าได้รับหลักฐานบางอย่าง 413 00:20:08,300 --> 00:20:11,050 ดังนั้นฉันให้คุณหลักฐาน ที่ผมเห็นลูกคำและ 414 00:20:11,050 --> 00:20:12,690 เพลงที่ทำให้รู้สึก 415 00:20:12,690 --> 00:20:15,960 416 00:20:15,960 --> 00:20:16,410 ตกลง 417 00:20:16,410 --> 00:20:22,400 >> ดังนั้นถ้าผมคำนวณว่าสำหรับแต่ละ ของเพลงเลดี้กาก้า, 418 00:20:22,400 --> 00:20:25,916 สิ่งที่จะเป็น - 419 00:20:25,916 --> 00:20:27,730 เห็นได้ชัดว่าฉันไม่สามารถย้ายนี้ 420 00:20:27,730 --> 00:20:31,850 421 00:20:31,850 --> 00:20:36,920 น่าจะเป็นของกาก้าจะเป็น สิ่งที่ต้องการ 2 กว่า 24 ครั้งที่ 1/2, 422 00:20:36,920 --> 00:20:38,260 2 กว่า 53 423 00:20:38,260 --> 00:20:40,640 มันไม่สำคัญว่าถ้าคุณรู้ว่าสิ่งที่ ตัวเลขเหล่านี้จะมาจาก 424 00:20:40,640 --> 00:20:44,750 แต่มันเป็นเพียงตัวเลขที่เป็นไป จะมากกว่า 0 ใช่ไหม 425 00:20:44,750 --> 00:20:48,610 >> และจากนั้นเมื่อฉันทำ Katy Perry, ความน่าจะเป็นของ "ลูก" ให้เคทีเป็น 426 00:20:48,610 --> 00:20:49,830 0 อยู่แล้วใช่มั้ย 427 00:20:49,830 --> 00:20:52,820 เพราะไม่มี "ทารก" ใน Katy Perry 428 00:20:52,820 --> 00:20:56,360 ดังนั้นแล้วนี้จะกลายเป็น 0 และประสาท ชนะซึ่งหมายความว่าทึ่ม 429 00:20:56,360 --> 00:20:57,310 อาจจะเป็นนักร้อง 430 00:20:57,310 --> 00:20:58,560 ไม่ที่ทำให้รู้สึก? 431 00:20:58,560 --> 00:21:00,700 432 00:21:00,700 --> 00:21:01,950 ตกลง 433 00:21:01,950 --> 00:21:04,160 434 00:21:04,160 --> 00:21:11,750 >> ดังนั้นถ้าผมต้องการที่จะทำให้เรื่องนี้อย่างเป็นทางการมากขึ้น ที่จริงผมสามารถทำแบบจำลอง 435 00:21:11,750 --> 00:21:12,700 คำหลาย 436 00:21:12,700 --> 00:21:14,610 ดังนั้นขอบอกว่าฉันมีบางสิ่งบางอย่าง เช่น "ลูกผม 437 00:21:14,610 --> 00:21:16,030 ไฟไหม้ "หรือบางสิ่งบางอย่าง 438 00:21:16,030 --> 00:21:17,760 ดังนั้นจึงมีหลายคำ 439 00:21:17,760 --> 00:21:20,880 และในกรณีนี้คุณจะเห็น ว่า "ลูก" ที่อยู่ในประสาท 440 00:21:20,880 --> 00:21:21,710 แต่มันก็ไม่ได้อยู่ในเคที 441 00:21:21,710 --> 00:21:24,940 และ "ไฟ" ที่อยู่ในเคที แต่ มันไม่ได้อยู่ในประสาทใช่ไหม 442 00:21:24,940 --> 00:21:27,200 ดังนั้นจึงได้รับ trickier ใช่ไหม 443 00:21:27,200 --> 00:21:31,440 เพราะมันดูเหมือนว่าคุณเกือบ มีการผูกระหว่างคนทั้งสอง 444 00:21:31,440 --> 00:21:36,980 >> ดังนั้นสิ่งที่คุณต้องทำคือการคิด ความเป็นอิสระระหว่างคำ 445 00:21:36,980 --> 00:21:41,210 ดังนั้นโดยทั่วไปสิ่งที่หมายถึงคือ ฉันแค่การคำนวณสิ่งที่เป็น 446 00:21:41,210 --> 00:21:44,330 ความน่าจะเป็นของการเห็น "ทารก" สิ่งที่เป็น ความน่าจะเป็นของการเห็น "ฉัน" และ 447 00:21:44,330 --> 00:21:46,670 "am" และ "ใน" และ "ไฟ" ทั้งหมดแยกกัน 448 00:21:46,670 --> 00:21:48,670 แล้วฉันคูณทั้งหมดของพวกเขา 449 00:21:48,670 --> 00:21:52,420 และฉันเห็นสิ่งที่เป็นความน่าจะเป็น เห็นทั้งประโยค 450 00:21:52,420 --> 00:21:55,210 ทำให้รู้สึก 451 00:21:55,210 --> 00:22:00,270 >> ดังนั้นโดยทั่วไปถ้ามีเพียงหนึ่งคำ สิ่งที่ฉันต้องการที่จะพบคือสูงสุดหาเรื่อง, 452 00:22:00,270 --> 00:22:05,385 ซึ่งหมายถึงสิ่งที่เป็นชั้นที่ ให้ฉันความน่าจะเป็นสูงสุด 453 00:22:05,385 --> 00:22:10,010 ดังนั้นสิ่งที่เป็นชั้นที่จะให้ ผมน่าจะเป็นสูงสุด 454 00:22:10,010 --> 00:22:11,940 ความน่าจะเป็นของชั้นเรียนให้คำ 455 00:22:11,940 --> 00:22:17,610 ดังนั้นในกรณีนี้กาก้าได้รับ "ลูก." หรือเคทีได้รับ "ลูก." ทำให้รู้สึก 456 00:22:17,610 --> 00:22:21,040 >> และเพียงแค่จาก Bayes ที่ สมการที่ผมแสดงให้เห็น 457 00:22:21,040 --> 00:22:24,780 เราจะสร้างส่วนนี้ 458 00:22:24,780 --> 00:22:28,750 สิ่งเดียวคือคุณจะเห็นว่า น่าจะเป็นของคำที่กำหนด 459 00:22:28,750 --> 00:22:31,370 การเปลี่ยนแปลงระดับขึ้น ในชั้นเรียนใช่มั้ย 460 00:22:31,370 --> 00:22:34,260 จำนวนของ "ลูก" ของที่ฉันมี ในประสาทจะแตกต่างจากเคที 461 00:22:34,260 --> 00:22:37,640 ความน่าจะเป็นของการเรียนยัง การเปลี่ยนแปลงเพราะมันเป็นเพียงตัวเลข 462 00:22:37,640 --> 00:22:39,740 ของเพลงที่แต่ละคนมี 463 00:22:39,740 --> 00:22:43,980 >> แต่ความน่าจะเป็นของคำที่ตัวเอง เป็นไปได้เหมือนกันสำหรับทุก 464 00:22:43,980 --> 00:22:44,740 ศิลปินใช่มั้ย? 465 00:22:44,740 --> 00:22:47,150 ดังนั้นความน่าจะเป็นของคำว่าเป็น เพียงแค่สิ่งที่เป็นความน่าจะเป็นของ 466 00:22:47,150 --> 00:22:49,820 เห็นคำว่า ภาษาภาษาอังกฤษได้ไหม 467 00:22:49,820 --> 00:22:51,420 ดังนั้นจึงเป็นเหมือนกันสำหรับทั้งหมดของพวกเขา 468 00:22:51,420 --> 00:22:55,790 ดังนั้นตั้งแต่นี้เป็นค่าคงที่ที่เราสามารถทำได้เพียงแค่ ลดลงนี้และไม่สนใจเกี่ยวกับเรื่องนี้ 469 00:22:55,790 --> 00:23:00,230 ดังนั้นนี้จะเป็นจริง สมการที่เรากำลังมองหา 470 00:23:00,230 --> 00:23:03,360 >> และถ้าผมมีคำหลายคำที่ฉัน ยังคงไปได้ก่อน 471 00:23:03,360 --> 00:23:04,610 ความน่าจะเป็นที่นี่ 472 00:23:04,610 --> 00:23:06,980 สิ่งเดียวคือฉันคูณ น่าจะเป็นของ 473 00:23:06,980 --> 00:23:08,490 ทุกคำอื่น ๆ 474 00:23:08,490 --> 00:23:10,110 ดังนั้นฉันคูณทั้งหมดของพวกเขา 475 00:23:10,110 --> 00:23:12,610 ทำให้รู้สึก 476 00:23:12,610 --> 00:23:18,440 มันดูแปลก ๆ แต่โดยทั่วไปหมายถึง คำนวณก่อนของชั้นเรียนและ 477 00:23:18,440 --> 00:23:22,100 แล้วคูณด้วยความน่าจะเป็นของแต่ละ คำที่อยู่ในชั้นเรียนที่ 478 00:23:22,100 --> 00:23:24,620 479 00:23:24,620 --> 00:23:29,150 >> และคุณรู้ว่าน่าจะเป็นของ คำที่กำหนดชั้นเรียนเป็นไปได้ 480 00:23:29,150 --> 00:23:34,520 จำนวนครั้งที่คุณเห็นคำว่า ชั้นเรียนที่หารด้วยจำนวนของ 481 00:23:34,520 --> 00:23:37,020 คำที่คุณมีในที่ ชั้นในทั่วไป 482 00:23:37,020 --> 00:23:37,990 ทำให้รู้สึก 483 00:23:37,990 --> 00:23:41,680 มันเป็นเพียงวิธีการที่ "เด็ก" เป็น 2 กว่า จำนวนคำที่ 484 00:23:41,680 --> 00:23:43,020 ฉันได้ในเนื้อเพลง 485 00:23:43,020 --> 00:23:45,130 ดังนั้นเพียงแค่ความถี่ 486 00:23:45,130 --> 00:23:46,260 >> แต่มีสิ่งหนึ่งที่ 487 00:23:46,260 --> 00:23:51,250 จำได้ว่าผมได้แสดงให้เห็นว่า ความน่าจะเป็นของ "ทารก" เนื้อเพลงเป็น 488 00:23:51,250 --> 00:23:56,350 จาก Katy Perry เป็น 0 เพียงเพราะเคที เพอร์รี่ไม่ได้มี "ลูก" ที่ทั้งหมดหรือไม่ 489 00:23:56,350 --> 00:24:04,900 แต่เสียงเล็ก ๆ น้อย ๆ ที่รุนแรงที่จะเพียงแค่ เพียงแค่พูดว่าเนื้อเพลงไม่อาจได้มาจาก 490 00:24:04,900 --> 00:24:10,040 ศิลปินเพียงเพราะพวกเขาไม่ได้ คำว่าโดยเฉพาะอย่างยิ่งในเวลาใดก็ได้ 491 00:24:10,040 --> 00:24:13,330 >> ดังนั้นคุณก็สามารถพูดได้ดีถ้าคุณ ไม่ได้มีคำนี้ผมกำลังจะไป 492 00:24:13,330 --> 00:24:15,640 ทำให้คุณมีความน่าจะเป็นที่ต่ำกว่า แต่ฉันก็ไม่ไป 493 00:24:15,640 --> 00:24:17,420 0 ให้ทันที 494 00:24:17,420 --> 00:24:21,040 เพราะบางทีมันอาจจะเป็นสิ่งที่ชอบ "ไฟไหม้ไฟไหม้ไฟไหม้ไฟ" ซึ่งเป็น 495 00:24:21,040 --> 00:24:21,990 ทั้งหมด Katy Perry 496 00:24:21,990 --> 00:24:26,060 และ "เด็ก" และมันเพียงแค่ไปที่ 0 ทันทีเพราะมีหนึ่ง 497 00:24:26,060 --> 00:24:27,250 "ทารก". 498 00:24:27,250 --> 00:24:31,440 >> ดังนั้นโดยทั่วไปสิ่งที่เราทำบางสิ่งบางอย่าง ที่เรียกว่าเลซเรียบ 499 00:24:31,440 --> 00:24:36,260 และนี้ก็หมายความว่าฉันให้ ความน่าจะเป็นบางคนถึงกับคำว่า 500 00:24:36,260 --> 00:24:37,850 ที่ไม่อยู่ 501 00:24:37,850 --> 00:24:43,170 ดังนั้นสิ่งที่ฉันทำคือการที่เมื่อฉัน การคำนวณนี้ฉันมักจะเพิ่ม 1 ถึง 502 00:24:43,170 --> 00:24:44,180 เศษ 503 00:24:44,180 --> 00:24:48,060 ดังนั้นแม้ว่าคำว่าไม่อยู่ใน กรณีนี้ถ้าเป็น 0, ฉันยังคง 504 00:24:48,060 --> 00:24:51,250 การคำนวณนี้เป็น 1 ในช่วง จำนวนรวมของคำ 505 00:24:51,250 --> 00:24:55,060 มิฉะนั้นผมได้รับกี่คำ ฉันมีและฉันเพิ่ม 1 506 00:24:55,060 --> 00:24:58,300 ดังนั้นฉันนับการทั้งสองกรณี 507 00:24:58,300 --> 00:25:00,430 ทำให้รู้สึก 508 00:25:00,430 --> 00:25:03,060 >> ดังนั้นตอนนี้ขอทำบางรหัส 509 00:25:03,060 --> 00:25:06,440 ฉันจะต้องทำมันสวยอย่างรวดเร็ว แต่มันเป็นสิ่งสำคัญเพียงว่าคุณ 510 00:25:06,440 --> 00:25:08,600 ผู้ชายเข้าใจแนวคิด 511 00:25:08,600 --> 00:25:13,450 ดังนั้นสิ่งที่เรากำลังพยายามทำ มีการดำเนินการนี​​้ว่า 512 00:25:13,450 --> 00:25:14,330 สิ่งที่ฉันกล่าวว่า - 513 00:25:14,330 --> 00:25:19,110 ฉันต้องการให้คุณใส่เนื้อเพลงจาก ของเลดี้กาก้าและ Katy Perry 514 00:25:19,110 --> 00:25:22,980 และโปรแกรมที่เป็นไปเพื่อให้สามารถ บอกว่าเนื้อเพลงใหม่เหล่านี้จะมาจากประสาท 515 00:25:22,980 --> 00:25:24,170 หรือ Katy Perry 516 00:25:24,170 --> 00:25:25,800 ทำให้รู้สึก 517 00:25:25,800 --> 00:25:27,530 ตกลง 518 00:25:27,530 --> 00:25:30,710 >> ดังนั้นผมจึงมีโปรแกรมที่ฉันจะนี้ ที่จะเรียก classify.py 519 00:25:30,710 --> 00:25:31,970 ดังนั้นนี่คืองูหลาม 520 00:25:31,970 --> 00:25:34,210 มันเป็นภาษาการเขียนโปรแกรมใหม่ 521 00:25:34,210 --> 00:25:38,020 มันเป็นความคล้ายกันในบางส่วน วิธีการที่จะ C และ PHP 522 00:25:38,020 --> 00:25:43,180 มันคล้ายกันเพราะถ้าคุณต้องการที่จะ เรียนรู้หลามหลังจากที่รู้ C ก็ 523 00:25:43,180 --> 00:25:46,270 จริงๆไม่ว่ามากของความท้าทาย เพียงเพราะงูใหญ่เป็นเรื่องง่ายที่ 524 00:25:46,270 --> 00:25:47,520 กว่า C แรกของทุกคน 525 00:25:47,520 --> 00:25:49,370 และจำนวนมากของสิ่งที่มีอยู่แล้ว ดำเนินการสำหรับคุณ 526 00:25:49,370 --> 00:25:56,820 ดังนั้นเพียงแค่วิธีการเช่น PHP มีฟังก์ชั่นที่ เรียงลำดับรายการหรือผนวกบางสิ่งบางอย่าง 527 00:25:56,820 --> 00:25:58,780 อาร์เรย์หรือ blah, blah, blah 528 00:25:58,780 --> 00:26:00,690 งูใหญ่มีทั้งหมดของเหล่านั้นเช่นกัน 529 00:26:00,690 --> 00:26:05,960 >> ดังนั้นฉันแค่จะอธิบายได้อย่างรวดเร็ว วิธีการที่เราสามารถดำเนินการจัดหมวดหมู่ 530 00:26:05,960 --> 00:26:07,860 ปัญหาสำหรับที่นี่ 531 00:26:07,860 --> 00:26:13,230 จึงขอบอกว่าในกรณีนี้ผมมี เนื้อเพลงจากประสาทและ Katy Perry 532 00:26:13,230 --> 00:26:21,880 วิธีการที่ฉันมีเนื้อเพลงเหล่านั้นก็คือว่า คำแรกของเนื้อเพลงคือ 533 00:26:21,880 --> 00:26:25,250 ชื่อของศิลปินและ ส่วนที่เหลือเป็นเนื้อเพลง 534 00:26:25,250 --> 00:26:29,470 ดังนั้นขอบอกว่าฉันมีรายชื่อใน ซึ่งคนแรกคือเนื้อเพลงทึ่ม 535 00:26:29,470 --> 00:26:31,930 ดังนั้นที่นี่ฉันในการติดตามขวา 536 00:26:31,930 --> 00:26:35,270 และคนต่อไปคือเคทีและ มันยังมีเนื้อเพลง 537 00:26:35,270 --> 00:26:38,040 >> ดังนั้นนี่คือวิธีการที่คุณประกาศ ตัวแปรในหลาม 538 00:26:38,040 --> 00:26:40,200 คุณไม่จำเป็นที่จะให้ชนิดข้อมูล 539 00:26:40,200 --> 00:26:43,150 คุณเพียงแค่เขียน "เนื้อเพลง" ชนิดเช่นใน PHP 540 00:26:43,150 --> 00:26:44,890 ทำให้รู้สึก 541 00:26:44,890 --> 00:26:47,770 >> ดังนั้นสิ่งที่เป็นสิ่งที่ฉันต้อง คำนวณเพื่อให้สามารถคำนวณ 542 00:26:47,770 --> 00:26:49,360 ความน่าจะเป็น? 543 00:26:49,360 --> 00:26:55,110 ฉันมีการคำนวณ "ไพรเออร์" ของแต่ละที่แตกต่างกัน 544 00:26:55,110 --> 00:26:56,710 ชั้นเรียนที่ฉันมี 545 00:26:56,710 --> 00:27:06,680 ฉันมีการคำนวณ "posteriors" หรือสวยมากน่าจะเป็นของ 546 00:27:06,680 --> 00:27:12,150 แต่ละคำที่แตกต่างกันที่ ฉันสามารถมีสำหรับศิลปินแต่ละคน 547 00:27:12,150 --> 00:27:17,210 ดังนั้นภายในประสาทเช่นฉันจะ ที่จะมีรายชื่อของวิธีการที่หลายต่อหลายครั้งที่ฉันเห็น 548 00:27:17,210 --> 00:27:19,250 แต่ละคำ 549 00:27:19,250 --> 00:27:20,760 ทำให้รู้สึก 550 00:27:20,760 --> 00:27:25,370 >> และในที่สุดผมก็จะมี รายการที่เรียกว่า "คำ" ที่เพิ่งจะ 551 00:27:25,370 --> 00:27:29,780 จะมีกี่คำที่ฉัน มีสำหรับศิลปินแต่ละคน 552 00:27:29,780 --> 00:27:33,760 ดังนั้นสำหรับทึ่มตัวอย่างเช่นเมื่อฉันมอง เนื้อเพลงผมผมคิดว่า 24 553 00:27:33,760 --> 00:27:34,750 คำทั้งหมด 554 00:27:34,750 --> 00:27:38,970 ดังนั้นรายการนี​​้เป็นเพียงการไปได้ 24 กาก้าและเคทีหมายเลขอื่น 555 00:27:38,970 --> 00:27:40,130 ทำให้รู้สึก 556 00:27:40,130 --> 00:27:40,560 ตกลง 557 00:27:40,560 --> 00:27:42,530 >> ดังนั้นตอนนี้จริงให้ ไปที่การเขียนโปรแกรม 558 00:27:42,530 --> 00:27:45,270 ดังนั้นในหลามคุณสามารถจริง กลับพวงของการที่แตกต่างกัน 559 00:27:45,270 --> 00:27:46,630 สิ่งจากฟังก์ชั่น 560 00:27:46,630 --> 00:27:50,810 ดังนั้นฉันจะสร้างฟังก์ชั่นนี้ เรียกว่า "เงื่อนไข" ที่เป็นไป 561 00:27:50,810 --> 00:27:53,890 ที่จะกลับมาทั้งหมดของสิ่งเหล่านั้น "ไพรเออร์" "น่าจะ" และ 562 00:27:53,890 --> 00:28:05,690 "คำพูด". ดังนั้น "เงื่อนไข" และมันเป็น จะได้รับการโทรเข้ามา "เนื้อเพลง." 563 00:28:05,690 --> 00:28:11,510 >> ดังนั้นตอนนี้ฉันต้องการให้คุณจริง เขียนฟังก์ชั่นนี้ 564 00:28:11,510 --> 00:28:17,750 ดังนั้นวิธีที่ฉันสามารถเขียนนี้ ฟังก์ชั่นที่ผมกำหนดไว้นี้ 565 00:28:17,750 --> 00:28:20,620 ทำงานด้วย "def." ดังนั้นฉันได้ "def เงื่อนไข "และมันสละ 566 00:28:20,620 --> 00:28:28,700 "เนื้อเพลง." และสิ่งนี้จะไปทำ เป็นครั้งแรกของทุกฉันมีไพรเออร์ของฉัน 567 00:28:28,700 --> 00:28:31,030 ที่ฉันต้องการในการคำนวณ 568 00:28:31,030 --> 00:28:34,330 >> ดังนั้นวิธีที่ฉันสามารถทำเช่นนี้คือการสร้าง ในพจนานุกรมหลามที่ 569 00:28:34,330 --> 00:28:37,320 สวยมากสิ่งเดียวกับกัญชา ตารางหรือมันก็เหมือนการย้ำ 570 00:28:37,320 --> 00:28:40,480 อาร์เรย์ใน PHP 571 00:28:40,480 --> 00:28:44,150 นี่คือวิธีที่ผมประกาศพจนานุกรม 572 00:28:44,150 --> 00:28:53,580 และโดยทั่วไปสิ่งที่หมายถึงนี้คือ ไพรเออร์ของประสาทคือ 0.5 ตัวอย่างเช่นถ้า 573 00:28:53,580 --> 00:28:57,200 50% ของเพลงที่มาจาก ทึ่ม 50% จะมาจากเคที 574 00:28:57,200 --> 00:28:58,450 ทำให้รู้สึก 575 00:28:58,450 --> 00:29:00,680 576 00:29:00,680 --> 00:29:03,680 ดังนั้นผมจึงมีการคิดออกว่า ไพรเออร์ในการคำนวณ 577 00:29:03,680 --> 00:29:07,120 >> คนต่อไปที่ฉันต้องทำยัง มีความน่าจะเป็นและคำพูด 578 00:29:07,120 --> 00:29:17,100 ดังนั้นความน่าจะเป็นของประสาทคือรายการ ของความน่าจะเป็นทั้งหมดที่ฉัน 579 00:29:17,100 --> 00:29:19,160 มีสำหรับแต่ละคำสำหรับทึ่ม 580 00:29:19,160 --> 00:29:23,880 ดังนั้นถ้าผมไปที่ความน่าจะเป็นของประสาท "ทารก" ตัวอย่างเช่นมันจะให้ฉัน 581 00:29:23,880 --> 00:29:28,750 สิ่งที่ต้องการ 2 กว่า 24 ในกรณีที่ 582 00:29:28,750 --> 00:29:30,070 ทำให้รู้สึก 583 00:29:30,070 --> 00:29:36,120 ดังนั้นผมจึงไปที่ "น่าจะ" ไปที่ "ทึ่ม" ถังที่มีรายชื่อของ 584 00:29:36,120 --> 00:29:40,550 คำประสาทแล้วฉันไปที่ "เด็ก" และผมเห็นความน่าจะเป็น 585 00:29:40,550 --> 00:29:45,940 >> และในที่สุดฉันมีนี้ "คำพูด" พจนานุกรม 586 00:29:45,940 --> 00:29:53,620 ดังนั้นที่นี่ "น่าจะ". แล้วจึง "คำพูด". ดังนั้นถ้าผมทำ "คำ", "กาก้า" 587 00:29:53,620 --> 00:29:58,330 สิ่งที่จะเกิดขึ้นคือว่ามัน จะให้ฉัน 24 บอกว่าฉัน 588 00:29:58,330 --> 00:30:01,990 มี 2​​4 คำภายในเนื้อเพลงจากทึ่ม 589 00:30:01,990 --> 00:30:04,110 ทำให้รู้สึก? 590 00:30:04,110 --> 00:30:07,070 ดังนั้นที่นี่ "คำพูด" เท่ากับ DAH-DAH-DAH 591 00:30:07,070 --> 00:30:07,620 ตกลง 592 00:30:07,620 --> 00:30:12,210 >> ดังนั้นสิ่งที่ผมจะทำคือผมกำลังจะไป ย้ำกว่าแต่ละเนื้อเพลงดังนั้น 593 00:30:12,210 --> 00:30:14,490 แต่ละสายที่ ฉันมีในรายการ 594 00:30:14,490 --> 00:30:18,040 และฉันจะคำนวณสิ่งเหล่านั้น สำหรับแต่ละของผู้สมัคร 595 00:30:18,040 --> 00:30:19,950 ทำให้รู้สึก? 596 00:30:19,950 --> 00:30:21,700 ดังนั้นผมจึงต้องทำสำหรับวง 597 00:30:21,700 --> 00:30:26,300 >> ดังนั้นในหลามสิ่งที่ฉันสามารถทำได้คือ "สำหรับสาย ในเนื้อเพลง. "สิ่งที่เหมือนกันกับ 598 00:30:26,300 --> 00:30:28,000 "สำหรับแต่ละ" คำสั่งใน PHP 599 00:30:28,000 --> 00:30:33,420 โปรดจำไว้ว่าถ้ามันเป็น PHP ที่จะทำได้ กล่าวว่า "สำหรับการเป็นเพลงที่แต่ละ 600 00:30:33,420 --> 00:30:35,220 สาย. "ทำให้รู้สึก? 601 00:30:35,220 --> 00:30:38,900 ดังนั้นฉันเอาแต่ละเส้นในการนี​​้ กรณีที่สายนี้และต่อไป 602 00:30:38,900 --> 00:30:44,540 สตริงดังนั้นสำหรับแต่ละเส้นสิ่งที่ฉัน จะทำคือครั้งแรกที่ฉันจะไป 603 00:30:44,540 --> 00:30:49,150 แยกสายนี้ลงในรายการของ คำคั่นด้วยช่องว่าง 604 00:30:49,150 --> 00:30:53,730 >> ดังนั้นสิ่งดีๆเกี่ยวกับงูหลามที่ คุณอาจจะเพียงแค่ Google เช่น "วิธีการที่ฉันสามารถ 605 00:30:53,730 --> 00:30:58,220 แบ่งสายเป็นคำ? "และมันเป็น จะบอกให้คุณทราบวิธีที่จะทำมัน 606 00:30:58,220 --> 00:31:04,890 และวิธีการที่จะทำมันก็แค่ "สาย = line.split () "และมันเป็นพื้น 607 00:31:04,890 --> 00:31:08,640 จะให้รายการที่มี แต่ละคำที่นี่ 608 00:31:08,640 --> 00:31:09,620 ทำให้รู้สึก? 609 00:31:09,620 --> 00:31:15,870 ดังนั้นขณะนี้ที่ผมว่าผมต้องการที่จะรู้ว่า ที่เป็นนักร้องของเพลงที่ 610 00:31:15,870 --> 00:31:20,130 และจะทำอย่างไรที่ฉันจะต้องได้รับ องค์ประกอบแรกของอาร์เรย์ใช่ไหม 611 00:31:20,130 --> 00:31:26,390 ดังนั้นผมก็สามารถพูดได้ว่าผม "นักร้อง = บรรทัด (0) "ทำให้รู้สึก? 612 00:31:26,390 --> 00:31:32,010 >> และแล้วสิ่งที่ฉันต้องทำคือการเป็นครั้งแรกของ ทั้งหมดที่ฉันจะปรับปรุงวิธีการที่หลาย 613 00:31:32,010 --> 00:31:36,130 คำที่ฉันมีภายใต้ "โง่." ดังนั้นฉันเพียงแค่ จะคำนวณจำนวนคำที่ฉัน 614 00:31:36,130 --> 00:31:38,690 มีในรายการนี​​้ใช่มั้ย 615 00:31:38,690 --> 00:31:41,910 เพราะนี่เป็นวิธีการที่หลายคำที่ฉันมี ในเนื้อเพลงและฉันแค่จะไป 616 00:31:41,910 --> 00:31:44,120 เพิ่ม "ทึ่ม" อาเรย์ 617 00:31:44,120 --> 00:31:47,090 ไม่ที่ทำให้รู้สึก? 618 00:31:47,090 --> 00:31:49,010 ไม่เน้นมากเกินไปในไวยากรณ์ 619 00:31:49,010 --> 00:31:50,430 คิดเพิ่มเติมเกี่ยวกับแนวคิด 620 00:31:50,430 --> 00:31:52,400 นั่นเป็นส่วนที่สำคัญที่สุด 621 00:31:52,400 --> 00:31:52,720 ตกลง 622 00:31:52,720 --> 00:32:00,260 >> ดังนั้นสิ่งที่ฉันจะทำมันก็คือถ้า "ทึ่ม" เป็น แล้วในรายการที่ว่า "ถ้านักร้องใน 623 00:32:00,260 --> 00:32:03,190 คำว่า "ซึ่งหมายความว่าฉันแล้ว มีคำโดยทึ่ม 624 00:32:03,190 --> 00:32:06,640 ผมแค่อยากจะเพิ่มอีก คำว่า 625 00:32:06,640 --> 00:32:15,810 ดังนั้นสิ่งที่ฉันทำคือ "คำ (นักร้อง) + = len (สาย) - 1 " 626 00:32:15,810 --> 00:32:18,250 และจากนั้นฉันก็สามารถทำ ความยาวของเส้น 627 00:32:18,250 --> 00:32:21,860 ดังนั้นวิธีที่หลายองค์ประกอบฉัน มีในอาร์เรย์ 628 00:32:21,860 --> 00:32:27,060 และผมต้องทำลบ 1 เพียงเพราะ องค์ประกอบแรกของอาร์เรย์เป็นเพียง 629 00:32:27,060 --> 00:32:29,180 นักร้องและผู้ที่มีเนื้อเพลงไม่ได้ 630 00:32:29,180 --> 00:32:31,420 ทำให้รู้สึก? 631 00:32:31,420 --> 00:32:32,780 ตกลง 632 00:32:32,780 --> 00:32:35,820 >> "อื่น ๆ " มันหมายความว่าฉันต้องการจริง ใส่ประสาทในรายการ 633 00:32:35,820 --> 00:32:45,990 ดังนั้นผมก็ทำ "คำ (นักร้อง) = len (สาย) - 1, "ขอโทษ 634 00:32:45,990 --> 00:32:49,200 ดังนั้นความแตกต่างเพียงอย่างเดียวระหว่างสอง สายเป็นที่หนึ่งนี้ก็ไม่ได้ 635 00:32:49,200 --> 00:32:51,080 ที่มีอยู่ยังดังนั้นฉันแค่ การเริ่มต้นมัน 636 00:32:51,080 --> 00:32:53,820 หนึ่งฉันจริงเพิ่มนี้ 637 00:32:53,820 --> 00:32:55,570 ตกลง 638 00:32:55,570 --> 00:32:59,480 ดังนั้นนี่คือการเพิ่มคำ 639 00:32:59,480 --> 00:33:03,040 >> ตอนนี้ผมต้องการที่จะเพิ่มไพรเออร์ 640 00:33:03,040 --> 00:33:05,480 ดังนั้นฉันจะคำนวณไพรเออร์หรือไม่ 641 00:33:05,480 --> 00:33:11,580 ไพรเออร์สามารถคำนวณได้ โดยวิธีการหลายครั้ง 642 00:33:11,580 --> 00:33:15,340 ดังนั้นวิธีที่หลายต่อหลายครั้งที่คุณเห็นนักร้องที่ ในหมู่ของนักร้องที่คุณ 643 00:33:15,340 --> 00:33:16,380 มีใช่มั้ย? 644 00:33:16,380 --> 00:33:18,810 ดังนั้นสำหรับทึ่มและ Katy Perry, ในกรณีนี้ผมเห็นทึ่ม 645 00:33:18,810 --> 00:33:20,570 ครั้ง Katy Perry ครั้ง 646 00:33:20,570 --> 00:33:23,320 >> ดังนั้นโดยทั่วไปไพรเออร์กับกาก้า และ Katy Perry จะ 647 00:33:23,320 --> 00:33:24,390 เพียงแค่เป็นหนึ่งใช่ไหม 648 00:33:24,390 --> 00:33:26,500 คุณเพียงแค่วิธีการที่หลายต่อหลายครั้ง ผมเห็นศิลปิน 649 00:33:26,500 --> 00:33:28,740 ดังนั้นนี้เป็นเรื่องง่ายมากในการคำนวณ 650 00:33:28,740 --> 00:33:34,100 ฉันสามารถเพียงแค่บางสิ่งบางอย่างที่คล้ายกันเช่น "ถ้า นักร้องในไพรเออร์ "ฉันแค่จะ 651 00:33:34,100 --> 00:33:38,970 เพื่อเพิ่ม 1 ถึงไพรเออร์ของพวกเขากล่อง 652 00:33:38,970 --> 00:33:51,000 ดังนั้น "ไพรเออร์ (ร้องเพลง)" + = 1 "แล้ว" อื่น " ฉันจะทำ "ไพรเออร์ (นักร้อง) 653 00:33:51,000 --> 00:33:55,000 = 1. "ทำให้รู้สึก? 654 00:33:55,000 --> 00:34:00,080 >> ดังนั้นถ้ามันไม่ได้อยู่ที่ผมเพียงแค่ใส่ 1 เป็นอย่างอื่นผมเพียงแค่เพิ่ม 1 655 00:34:00,080 --> 00:34:11,280 ตกลงดังนั้นตอนนี้สิ่งที่ผมได้ออกไปทำ นอกจากนี้ยังเพิ่มแต่ละคำเพื่อ 656 00:34:11,280 --> 00:34:12,290 ความน่าจะเป็น 657 00:34:12,290 --> 00:34:14,889 ดังนั้นผมจึงมีการนับจำนวนครั้งที่ ผมเห็นแต่ละคำ 658 00:34:14,889 --> 00:34:18,780 ดังนั้นผมก็ต้องทำอีก สำหรับวงในสาย 659 00:34:18,780 --> 00:34:25,190 >> ดังนั้นสิ่งแรกที่ผมจะทำคือ ตรวจสอบว่านักร้องที่มีอยู่แล้ว 660 00:34:25,190 --> 00:34:26,969 น่าจะเป็นแถว 661 00:34:26,969 --> 00:34:31,739 ดังนั้นฉันตรวจสอบว่านักร้องไม่ได้ มีความน่าจะเป็นอาเรย์, ฉันแค่ 662 00:34:31,739 --> 00:34:34,480 จะเริ่มต้นอย่างใดอย่างหนึ่งสำหรับพวกเขา 663 00:34:34,480 --> 00:34:36,400 ก็ไม่ได้มากมายขอโทษ เป็นพจนานุกรม 664 00:34:36,400 --> 00:34:43,080 ดังนั้นความน่าจะเป็นของนักร้องที่เป็นไป จะเปิดพจนานุกรมเพื่อให้ฉัน 665 00:34:43,080 --> 00:34:45,830 เพียงแค่การเริ่มต้นพจนานุกรมสำหรับมัน 666 00:34:45,830 --> 00:34:46,820 OK? 667 00:34:46,820 --> 00:34:58,330 >> และตอนนี้ฉันสามารถทำได้จริงสำหรับวง ในการคำนวณของแต่ละคำพูดของ 668 00:34:58,330 --> 00:35:00,604 ความน่าจะเป็น 669 00:35:00,604 --> 00:35:01,540 ตกลง 670 00:35:01,540 --> 00:35:04,160 ดังนั้นสิ่งที่ฉันสามารถทำได้คือห่วงสำหรับ 671 00:35:04,160 --> 00:35:06,590 ดังนั้นฉันแค่จะย้ำ กว่าอาร์เรย์ 672 00:35:06,590 --> 00:35:15,320 ดังนั้นวิธีการที่ฉันสามารถทำในหลาม คือ "การที่ผมอยู่ในช่วง." ตั้งแต่วันที่ 1 673 00:35:15,320 --> 00:35:19,200 เพราะฉันต้องการที่จะเริ่มต้นในครั้งที่สอง เพราะองค์ประกอบแรกคือ 674 00:35:19,200 --> 00:35:20,260 ชื่อนักร้อง 675 00:35:20,260 --> 00:35:24,990 ดังนั้นจากหนึ่งถึง ความยาวของเส้น 676 00:35:24,990 --> 00:35:29,760 และเมื่อฉันมีช่วงที่มันเป็นจริงไปจาก เช่นที่นี่จาก 1 ถึง len ของ 677 00:35:29,760 --> 00:35:30,740 ลบ 1 บรรทัด 678 00:35:30,740 --> 00:35:33,810 ดังนั้นจึงไม่อยู่แล้วสิ่งที่ทำว่า n ลบ 1 สำหรับอาร์เรย์ซึ่งเป็นมาก 679 00:35:33,810 --> 00:35:35,500 สะดวกสบาย 680 00:35:35,500 --> 00:35:37,850 ทำให้รู้สึก? 681 00:35:37,850 --> 00:35:42,770 >> ดังนั้นสำหรับแต่ละเหล่านี้สิ่งที่ฉันกำลังจะไป ทำคือการเช่นเดียวกับในอีกหนึ่ง 682 00:35:42,770 --> 00:35:50,320 ฉันจะตรวจสอบว่าคำในนี้ ตำแหน่งในสายที่มีอยู่แล้วใน 683 00:35:50,320 --> 00:35:51,570 ความน่าจะเป็น 684 00:35:51,570 --> 00:35:53,400 685 00:35:53,400 --> 00:35:57,260 แล้วที่ผมกล่าวว่าที่นี่น่าจะเป็น คำในขณะที่ฉันใส่ 686 00:35:57,260 --> 00:35:58,400 "ความน่าจะเป็น (นักร้อง)" 687 00:35:58,400 --> 00:35:59,390 ดังนั้นชื่อของนักร้อง 688 00:35:59,390 --> 00:36:03,450 ดังนั้นถ้ามันมีอยู่แล้วใน "probabilit (นักร้อง)" มันหมายความว่าฉัน 689 00:36:03,450 --> 00:36:11,960 ต้องการเพิ่ม 1 ถึงมันดังนั้นฉันจะ ทำ "ความน่าจะเป็น (นักร้อง)" และ 690 00:36:11,960 --> 00:36:14,100 คำที่เรียกว่า "สาย (i)" 691 00:36:14,100 --> 00:36:22,630 ฉันจะเพิ่ม 1 และ "อื่น ๆ " ฉันเพียงแค่ จะเริ่มต้นมันถึง 1 692 00:36:22,630 --> 00:36:23,880 "เส้น (i)" 693 00:36:23,880 --> 00:36:26,920 694 00:36:26,920 --> 00:36:28,420 ทำให้รู้สึก? 695 00:36:28,420 --> 00:36:30,180 >> ดังนั้นฉันจึงมีการคำนวณทั้งหมดของอาร์เรย์ 696 00:36:30,180 --> 00:36:36,580 ดังนั้นตอนนี้สิ่งที่ฉันต้องทำเพื่อ อันนี้เป็นเพียงการ "กลับไพรเออร์, 697 00:36:36,580 --> 00:36:43,230 ความน่าจะเป็นและคำพูด. "ขอ ดูว่ามีใด ๆ ที่ตกลง 698 00:36:43,230 --> 00:36:45,690 ดูเหมือนว่าทุกอย่างคือการทำงานเพื่อให้ห่างไกล 699 00:36:45,690 --> 00:36:46,900 เพื่อที่จะทำให้ความรู้สึก? 700 00:36:46,900 --> 00:36:47,750 ในบางวิธี? 701 00:36:47,750 --> 00:36:49,280 ตกลง 702 00:36:49,280 --> 00:36:51,980 ดังนั้นตอนนี้ฉันมีความน่าจะเป็นทั้งหมด 703 00:36:51,980 --> 00:36:55,100 ดังนั้นตอนนี้สิ่งเดียวที่ฉันมีซ้าย เป็นเพียงการมีสิ่งที่ว่า 704 00:36:55,100 --> 00:36:58,650 คำนวณผลิตภัณฑ์ทั้งหมด น่าจะเป็นตอนที่ผมได้รับเนื้อเพลง 705 00:36:58,650 --> 00:37:06,270 >> จึงขอบอกว่าผมต้องการที่จะเรียก ฟังก์ชั่นนี้ "จัด ()" และ 706 00:37:06,270 --> 00:37:08,880 สิ่งที่ฟังก์ชั่นที่ใช้เวลา เป็นเพียงการโต้แย้ง 707 00:37:08,880 --> 00:37:13,170 สมมติว่า "เด็กผมลงบนกองไฟ" และมันเป็น จะคิดออกว่า 708 00:37:13,170 --> 00:37:14,490 ความน่าจะเป็นว่านี่คือโง่? 709 00:37:14,490 --> 00:37:16,405 ความน่าจะเป็นสิ่งที่ ว่านี่คือเคธี่? 710 00:37:16,405 --> 00:37:19,690 เสียงดี? 711 00:37:19,690 --> 00:37:25,750 ดังนั้นฉันแค่ไปที่จะมีการสร้าง ฟังก์ชั่นใหม่ที่เรียกว่า "จัด ()" และ 712 00:37:25,750 --> 00:37:29,180 มันจะใช้เวลาบางส่วน เนื้อเพลงเป็นอย่างดี 713 00:37:29,180 --> 00:37:31,790 714 00:37:31,790 --> 00:37:36,160 และนอกจากเพลงที่ฉันยัง ต้องส่งไพรเออร์, 715 00:37:36,160 --> 00:37:37,700 ความน่าจะเป็นและคำพูด 716 00:37:37,700 --> 00:37:44,000 ดังนั้นฉันจะส่งเนื้อเพลงไพรเออร์, น่าจะเป็นคำพูด 717 00:37:44,000 --> 00:37:51,840 >> ดังนั้นนี่คือการเนื้อเพลงไพรเออร์, น่าจะเป็นคำพูด 718 00:37:51,840 --> 00:37:53,530 ดังนั้นสิ่งที่ไม่ได้ทำอย่างไร 719 00:37:53,530 --> 00:37:57,180 มันเป็นพื้นจะไปผ่านทุก ผู้สมัครที่เป็นไปได้ที่คุณ 720 00:37:57,180 --> 00:37:58,510 ได้เป็นนักร้อง 721 00:37:58,510 --> 00:37:59,425 และสถานที่ที่ผู้สมัครเหล่านั้นมีอะไรบ้าง 722 00:37:59,425 --> 00:38:01,020 พวกเขากำลังในไพรเออร์ใช่มั้ย? 723 00:38:01,020 --> 00:38:02,710 ดังนั้นผมจึงมีทุกคนมี 724 00:38:02,710 --> 00:38:07,870 ดังนั้นฉันจะมีพจนานุกรม ของผู้สมัครที่เป็นไปได้ทั้งหมด 725 00:38:07,870 --> 00:38:14,220 และจากนั้นให้ผู้สมัครในแต่ละ ไพรเออร์ดังนั้นก็หมายความว่ามันจะ 726 00:38:14,220 --> 00:38:17,740 เป็นกาก้าเคธี่ถ้าผมมี มากขึ้นก็จะมีมากขึ้น 727 00:38:17,740 --> 00:38:20,410 ฉันจะเริ่มต้นการคำนวณ ความน่าจะเป็นนี้ 728 00:38:20,410 --> 00:38:28,310 น่าจะเป็นอย่างที่เราเห็นใน PowerPoint เป็นครั้งก่อน 729 00:38:28,310 --> 00:38:30,800 ผลิตภัณฑ์ของแต่ละ ความน่าจะเป็นอื่น ๆ 730 00:38:30,800 --> 00:38:32,520 >> ดังนั้นผมจึงสามารถทำเช่นเดียวกันที่นี่ 731 00:38:32,520 --> 00:38:36,330 ฉันสามารถทำน่าจะเป็น ในขั้นต้นก่อน 732 00:38:36,330 --> 00:38:40,340 ดังนั้นไพรเออร์ของผู้สมัคร 733 00:38:40,340 --> 00:38:40,870 ใช่มั้ย? 734 00:38:40,870 --> 00:38:45,360 และตอนนี้ฉันต้องย้ำกว่าทุก คำที่ฉันมีในเนื้อเพลงจะเป็น 735 00:38:45,360 --> 00:38:48,820 สามารถที่จะเพิ่มความน่าจะเป็น สำหรับแต่ละคน OK? 736 00:38:48,820 --> 00:38:57,900 ดังนั้น "สำหรับคำในเนื้อเพลง" สิ่งที่ฉันจะ ที่จะทำคือถ้าคำที่อยู่ใน 737 00:38:57,900 --> 00:39:01,640 "ความน่าจะเป็น (ผู้สมัคร)" ซึ่ง หมายความว่ามันเป็นคำที่ 738 00:39:01,640 --> 00:39:03,640 ผู้สมัครที่มีอยู่ในเนื้อเพลงของพวกเขา - 739 00:39:03,640 --> 00:39:05,940 ตัวอย่างเช่น "ลูกน้อย" สำหรับการประสาท - 740 00:39:05,940 --> 00:39:11,710 สิ่งที่ผมจะทำก็คือ ความน่าจะเป็นไปได้คูณ 741 00:39:11,710 --> 00:39:22,420 โดย 1 บวกความน่าจะเป็นของ ผู้สมัครสำหรับคำว่า 742 00:39:22,420 --> 00:39:25,710 และก็เรียกว่า "คำ" 743 00:39:25,710 --> 00:39:32,440 นี้หารด้วยจำนวนของคำ ที่ฉันมีให้ผู้สมัครที่ 744 00:39:32,440 --> 00:39:37,450 จำนวนรวมของคำที่ฉันมี นักร้องที่ฉันกำลังมองหาที่ 745 00:39:37,450 --> 00:39:40,290 >> "อื่น ๆ ". มันหมายความว่ามันเป็นคำใหม่ ดังนั้นมันจะเป็นอย่างเช่น 746 00:39:40,290 --> 00:39:41,860 "ไฟ" สำหรับการของเลดี้กาก้า 747 00:39:41,860 --> 00:39:45,760 ดังนั้นผมเพียงแค่ต้องการที่จะทำในช่วงที่ 1 "คำ (ผู้สมัคร)" 748 00:39:45,760 --> 00:39:47,710 ดังนั้นผมจึงไม่ต้องการที่จะใส่ในระยะนี้ที่นี่ 749 00:39:47,710 --> 00:39:50,010 >> ดังนั้นจึงเป็นไปได้โดยทั่วไป คัดลอกและวางนี้ 750 00:39:50,010 --> 00:39:54,380 751 00:39:54,380 --> 00:39:56,000 แต่ฉันจะลบส่วนนี้ 752 00:39:56,000 --> 00:39:57,610 ดังนั้นมันก็จะเป็น 1 ในช่วงที่ 753 00:39:57,610 --> 00:40:00,900 754 00:40:00,900 --> 00:40:02,150 เสียงดี? 755 00:40:02,150 --> 00:40:03,980 756 00:40:03,980 --> 00:40:09,700 และตอนนี้ที่สิ้นสุดฉันแค่จะไป พิมพ์ชื่อของผู้สมัครและ 757 00:40:09,700 --> 00:40:15,750 ความน่าจะเป็นว่าคุณมีของ มี S ในเนื้อเพลงของพวกเขา 758 00:40:15,750 --> 00:40:16,200 ทำให้รู้สึก? 759 00:40:16,200 --> 00:40:18,390 และที่จริงผมทำไม่ได้ ต้องพจนานุกรมนี้ 760 00:40:18,390 --> 00:40:19,510 ทำให้รู้สึก? 761 00:40:19,510 --> 00:40:21,810 >> ดังนั้นขอดูว่านี้ใช้งานได้จริง 762 00:40:21,810 --> 00:40:24,880 ดังนั้นถ้าผมทำงานนี้ก็ไม่ได้ทำงาน 763 00:40:24,880 --> 00:40:26,130 รอคนที่สอง 764 00:40:26,130 --> 00:40:28,870 765 00:40:28,870 --> 00:40:31,720 "คำพูด (ผู้สมัคร)", "คำ (ผู้สมัคร)" นั่นคือ 766 00:40:31,720 --> 00:40:33,750 ชื่อของอาร์เรย์ 767 00:40:33,750 --> 00:40:41,435 ตกลงดังนั้นจึงกล่าวว่ามีข้อผิดพลาดบางอย่าง ให้ผู้สมัครในไพรเออร์ 768 00:40:41,435 --> 00:40:46,300 769 00:40:46,300 --> 00:40:48,760 ผมขอเพียงแค่เย็นนิด ๆ หน่อย ๆ 770 00:40:48,760 --> 00:40:50,360 ตกลง 771 00:40:50,360 --> 00:40:51,305 ลอง 772 00:40:51,305 --> 00:40:51,720 ตกลง 773 00:40:51,720 --> 00:40:58,710 >> ดังนั้นจึงให้ Katy Perry มีนี้ น่าจะเป็นครั้งที่ 10 ที่จะ 774 00:40:58,710 --> 00:41:02,200 ลบ 7 และมีประสาทนี้ ครั้งที่ 10 ถึง 6 ลบ 775 00:41:02,200 --> 00:41:05,610 ดังนั้นคุณจะเห็นว่ามันแสดงให้เห็นว่าทึ่ม มีความน่าจะเป็นสูงกว่า 776 00:41:05,610 --> 00:41:09,260 ดังนั้น "เด็กฉันไฟ" เป็นที่ อาจเป็นเพลงที่โง่ 777 00:41:09,260 --> 00:41:10,580 ทำให้รู้สึก? 778 00:41:10,580 --> 00:41:12,030 ดังนั้นนี่คือสิ่งที่เราทำ 779 00:41:12,030 --> 00:41:16,010 >> รหัสนี้จะถูกโพสต์ออนไลน์ ดังนั้นพวกคุณสามารถตรวจสอบออก 780 00:41:16,010 --> 00:41:20,720 อาจจะใช้บางส่วนของมันถ้าคุณต้องการที่จะ ทำโครงการหรือสิ่งที่คล้ายกัน 781 00:41:20,720 --> 00:41:22,150 ตกลง 782 00:41:22,150 --> 00:41:25,930 นี่เป็นเพียงการแสดง สิ่งที่การคำนวณ 783 00:41:25,930 --> 00:41:27,230 รหัสภาษาศาสตร์ดูเหมือนว่า 784 00:41:27,230 --> 00:41:33,040 แต่ตอนนี้ขอไปให้มากขึ้น สิ่งที่อยู่ในระดับสูง 785 00:41:33,040 --> 00:41:33,340 ตกลง 786 00:41:33,340 --> 00:41:35,150 >> ดังนั้นปัญหาอื่น ๆ ที่ฉัน พูดคุยเกี่ยวกับ - 787 00:41:35,150 --> 00:41:37,550 ปัญหาการแบ่งส่วน เป็นครั้งแรกของพวกเขา 788 00:41:37,550 --> 00:41:40,820 เพื่อให้คุณมีที่นี่ญี่ปุ่น 789 00:41:40,820 --> 00:41:43,420 แล้วคุณจะเห็นว่า ไม่มีช่องว่าง 790 00:41:43,420 --> 00:41:49,110 ดังนั้นนี้โดยทั่วไปหมายถึงว่ามันเป็น ด้านบนของเก้าอี้ใช่ไหม 791 00:41:49,110 --> 00:41:50,550 คุณพูดภาษาญี่ปุ่น 792 00:41:50,550 --> 00:41:52,840 มันเป็นด้านบนของเก้าอี้ใช่ไหม 793 00:41:52,840 --> 00:41:54,480 >> นักเรียน: ผมไม่ทราบว่า ตัวอักษรคันจิที่นั่นเป็น 794 00:41:54,480 --> 00:41:57,010 >> LUCAS FREITAS: มัน [พูดญี่ปุ่น] 795 00:41:57,010 --> 00:41:57,950 ตกลง 796 00:41:57,950 --> 00:42:00,960 ดังนั้นโดยทั่วไปหมายถึงเก้าอี้ของด้านบน 797 00:42:00,960 --> 00:42:03,620 ดังนั้นถ้าคุณมีการใส่ช่องว่าง มันจะเป็นที่นี่ 798 00:42:03,620 --> 00:42:05,970 แล้วคุณมี [? อุเอดะซัง ?] 799 00:42:05,970 --> 00:42:09,040 ซึ่งโดยทั่วไปหมายถึงนายอุเอดะ 800 00:42:09,040 --> 00:42:13,180 และคุณจะเห็นว่า "อุเอดะ" และคุณมี พื้นที่และแล้ว "san." ดังนั้นคุณจะเห็นว่า 801 00:42:13,180 --> 00:42:15,470 ที่นี่คุณ "Ue" เป็นเหมือนการด้วยตัวเอง 802 00:42:15,470 --> 00:42:17,750 และที่นี่ก็มีตัวละคร ถัดไป 803 00:42:17,750 --> 00:42:21,720 >> ดังนั้นจึงไม่เหมือนในภาษาเหล่านั้น ตัวอักษรที่มีความหมายคำมันเพื่อให้คุณ 804 00:42:21,720 --> 00:42:23,980 เพียงแค่ใส่จำนวนมากของช่องว่าง 805 00:42:23,980 --> 00:42:25,500 ตัวละครที่เกี่ยวข้องกับแต่ละอื่น 806 00:42:25,500 --> 00:42:28,680 และพวกเขาสามารถจะอยู่ด้วยกัน เช่นสองสามอย่างใดอย่างหนึ่ง 807 00:42:28,680 --> 00:42:34,520 ดังนั้นคุณจะมีการสร้างบางชนิด ของวิธีการใส่ช่องว่างเหล่านั้น 808 00:42:34,520 --> 00:42:38,850 >> และสิ่งนี้ก็คือว่าเมื่อใดก็ตามที่คุณได้รับ ข้อมูลจากภาษาเอเชียเหล่านั้น 809 00:42:38,850 --> 00:42:40,580 ทุกอย่างมา unsegmented 810 00:42:40,580 --> 00:42:45,940 เพราะคนที่เขียนญี่ปุ่นไม่มี หรือภาษาจีนเขียนที่มีช่องว่าง 811 00:42:45,940 --> 00:42:48,200 เมื่อใดก็ตามที่คุณกำลังเขียนจีน ภาษาญี่ปุ่นที่คุณเพียงแค่เขียนทุกอย่าง 812 00:42:48,200 --> 00:42:48,710 ไม่มีช่องว่าง 813 00:42:48,710 --> 00:42:52,060 มันไม่ได้ทำให้ความรู้สึก การใส่ช่องว่าง 814 00:42:52,060 --> 00:42:57,960 ดังนั้นแล้วเมื่อคุณได้รับข้อมูลจากบางคน ภาษาเอเชียตะวันออกถ้าคุณต้องการที่จะ 815 00:42:57,960 --> 00:43:00,760 จริงทำอะไรกับที่ คุณต้องส่วนแรก 816 00:43:00,760 --> 00:43:05,130 >> คิดทำตัวอย่างของ เนื้อเพลงที่ไม่มีช่องว่าง 817 00:43:05,130 --> 00:43:07,950 ดังนั้นเนื้อเพลงที่เดียวที่คุณมี จะเป็นประโยคใช่ไหม 818 00:43:07,950 --> 00:43:09,470 คั่นด้วยระยะเวลา 819 00:43:09,470 --> 00:43:13,930 แต่แล้วมีเพียงประโยคที่จะ ได้จริงๆช่วยในการให้ข้อมูล 820 00:43:13,930 --> 00:43:17,760 ของผู้ที่เนื้อเพลงที่มีโดย 821 00:43:17,760 --> 00:43:18,120 ใช่มั้ย? 822 00:43:18,120 --> 00:43:20,010 ดังนั้นคุณควรทำให้ช่องว่างแรก 823 00:43:20,010 --> 00:43:21,990 ดังนั้นวิธีที่คุณสามารถทำได้ 824 00:43:21,990 --> 00:43:24,920 >> ดังนั้นแล้วก็มาถึงความคิดของภาษา รูปแบบซึ่งเป็นสิ่งที่จริงๆ 825 00:43:24,920 --> 00:43:26,870 สิ่งที่สำคัญสำหรับการคำนวณ ภาษาศาสตร์ 826 00:43:26,870 --> 00:43:32,790 ดังนั้นรูปแบบของภาษาที่เป็นพื้น ตารางของความน่าจะแสดงให้เห็นว่า 827 00:43:32,790 --> 00:43:36,260 แรกของทุกสิ่งที่เป็นความน่าจะเป็น ของการมีคำในภาษาหรือไม่ 828 00:43:36,260 --> 00:43:39,590 เพื่อแสดงให้เห็นว่าบ่อยคำเป็น 829 00:43:39,590 --> 00:43:43,130 แล้วยังแสดงให้เห็นความสัมพันธ์ ระหว่างคำในประโยค 830 00:43:43,130 --> 00:43:51,500 >> ดังนั้นความคิดหลักคือถ้ามีคนแปลกหน้ามา ให้คุณและประโยคที่กล่าวว่า 831 00:43:51,500 --> 00:43:55,600 คุณเป็นสิ่งที่น่าจะเป็นที่สำหรับ เช่น "นี้เป็นน้องสาวของฉัน [? GTF"?] 832 00:43:55,600 --> 00:43:57,480 เป็นประโยคที่ว่าบุคคลดังกล่าวหรือไม่ 833 00:43:57,480 --> 00:44:00,380 ดังนั้นเห็นได้ชัดว่าบางประโยคเป็น พบได้บ่อยกว่าคนอื่น ๆ 834 00:44:00,380 --> 00:44:04,450 ตัวอย่างเช่น "วันดี" หรือ "ดี คืน "หรือ" เฮ้มี "มากขึ้น 835 00:44:04,450 --> 00:44:08,260 ที่พบมากที่สุดกว่าประโยค ว่าเรามีภาษาอังกฤษ 836 00:44:08,260 --> 00:44:11,060 เหตุใดจึงต้องมีประโยคที่ บ่อยมาก 837 00:44:11,060 --> 00:44:14,060 >> แรกของทั้งหมดมันเป็นเพราะคุณมี คำที่มีบ่อยมากขึ้น 838 00:44:14,060 --> 00:44:20,180 ดังนั้นสำหรับตัวอย่างเช่นถ้าคุณบอกว่าสุนัขเป็น ขนาดใหญ่และสุนัขที่มีขนาดใหญ่คุณ 839 00:44:20,180 --> 00:44:23,880 มักจะได้ยินเสียงสุนัขอาจจะมีขนาดใหญ่ มักจะมากขึ้นเพราะ "บิ๊ก" เป็นอีก 840 00:44:23,880 --> 00:44:27,260 บ่อยในภาษาอังกฤษกว่า "มโหฬาร". ดังนั้นหนึ่งของ 841 00:44:27,260 --> 00:44:30,100 สิ่งที่เป็นความถี่ของคำ 842 00:44:30,100 --> 00:44:34,490 >> สิ่งที่สองที่เป็นจริง ที่สำคัญเป็นเพียง 843 00:44:34,490 --> 00:44:35,490 คำสั่งของ 844 00:44:35,490 --> 00:44:39,500 ดังนั้นจึงเป็นเรื่องธรรมดาที่จะพูดว่า "แมว ภายในกล่อง. "แต่คุณจะไม่ปกติ 845 00:44:39,500 --> 00:44:44,250 เห็นในกล่อง "ภายในเป็นแมว." ดังนั้น คุณจะเห็นว่ามีความสำคัญบางอย่าง 846 00:44:44,250 --> 00:44:46,030 ในคำสั่งของคำ 847 00:44:46,030 --> 00:44:50,160 คุณไม่สามารถเพียงแค่บอกว่าทั้งสอง ประโยคที่มีความน่าจะเป็นเหมือนกัน 848 00:44:50,160 --> 00:44:53,010 เพียงเพราะพวกเขามีคำเดียวกัน 849 00:44:53,010 --> 00:44:55,550 คุณจะมีการดูแล เกี่ยวกับคำสั่งเป็นอย่างดี 850 00:44:55,550 --> 00:44:57,650 ทำให้รู้สึก 851 00:44:57,650 --> 00:44:59,490 >> ดังนั้นเราจะทำอย่างไร 852 00:44:59,490 --> 00:45:01,550 ดังนั้นสิ่งที่ฉันอาจพยายามที่จะได้รับคุณ 853 00:45:01,550 --> 00:45:04,400 ฉันพยายามที่จะให้คุณได้รับสิ่งที่เรา เรียกรุ่น n-กรัม 854 00:45:04,400 --> 00:45:09,095 ดังนั้นรูปแบบ n-กรัมโดยทั่วไปถือว่า ว่าสำหรับแต่ละคำว่า 855 00:45:09,095 --> 00:45:10,960 ที่คุณมีในประโยค 856 00:45:10,960 --> 00:45:15,020 มันเป็นความน่าจะเป็นของการมีที่ คำมีขึ้นไม่เพียง แต่ใน 857 00:45:15,020 --> 00:45:18,395 ความถี่ของคำในภาษาที่ แต่ยังอยู่ในคำว่า 858 00:45:18,395 --> 00:45:19,860 จะถูกล้อมรอบมัน 859 00:45:19,860 --> 00:45:25,810 >> ดังนั้นตัวอย่างเช่นโดยปกติเมื่อคุณเห็น สิ่งที่ชอบหรือที่คุณ 860 00:45:25,810 --> 00:45:28,040 อาจจะไปดู นามหลังจากที่มันใช่มั้ย 861 00:45:28,040 --> 00:45:31,750 เพราะเมื่อคุณมีคำบุพบท มักจะใช้เวลาเป็นรูปธรรมหลังจากที่มัน 862 00:45:31,750 --> 00:45:35,540 หรือหากคุณมีคำกริยาที่เป็นสกรรมกริยา คุณมักจะไป 863 00:45:35,540 --> 00:45:36,630 มีนามวลี 864 00:45:36,630 --> 00:45:38,780 ดังนั้นจึงจะมีคำนาม ที่ไหนสักแห่งที่อยู่รอบ ๆ 865 00:45:38,780 --> 00:45:44,950 >> ดังนั้นโดยทั่วไปสิ่งที่มันไม่สามารถที่จะ คิดว่าน่าจะเป็นของการมี 866 00:45:44,950 --> 00:45:47,960 คำติดกันเมื่อ คุณกำลังคำนวณ 867 00:45:47,960 --> 00:45:49,050 ความน่าจะเป็นของประโยค 868 00:45:49,050 --> 00:45:50,960 และนั่นคือสิ่งที่ภาษา รูปแบบที่เป็นพื้น 869 00:45:50,960 --> 00:45:54,620 เพียงแค่พูดในสิ่งที่เป็นความน่าจะเป็น ของการมีที่เฉพาะเจาะจง 870 00:45:54,620 --> 00:45:57,120 ประโยคในภาษาหรือไม่ 871 00:45:57,120 --> 00:45:59,110 ดังนั้นทำไมที่เป็นประโยชน์โดยทั่วไป? 872 00:45:59,110 --> 00:46:02,390 และครั้งแรกของทุกสิ่งที่เป็น รุ่น n-กรัม, แล้ว 873 00:46:02,390 --> 00:46:08,850 >> ดังนั้นรูปแบบ n-กรัมหมายความว่า แต่ละคำจะขึ้นอยู่กับ 874 00:46:08,850 --> 00:46:12,700 ต่อไปไม่มีลบ 1 คำ 875 00:46:12,700 --> 00:46:18,150 ดังนั้นโดยทั่วไปจะหมายถึงว่าถ้าเรามอง ตัวอย่างเช่นที่ TF CS50 เมื่อ 876 00:46:18,150 --> 00:46:21,500 ฉันคำนวณความน่าจะเป็นของ ประโยคที่ว่าคุณจะเป็นเช่น " 877 00:46:21,500 --> 00:46:25,280 ความน่าจะเป็นของการมีคำว่า "" ครั้งความน่าจะเป็นของการมี " 878 00:46:25,280 --> 00:46:31,720 CS50 "ครั้งความน่าจะเป็นของการมี "TF CS50." ดังนั้นโดยทั่วไปฉันนับ 879 00:46:31,720 --> 00:46:35,720 วิธีที่เป็นไปได้ทั้งหมดของการยืดมัน 880 00:46:35,720 --> 00:46:41,870 >> แล้วมักจะเมื่อคุณทำเช่นนี้ ในขณะที่โครงการที่คุณใส่ N เพื่อเป็น 881 00:46:41,870 --> 00:46:42,600 มูลค่าต่ำ 882 00:46:42,600 --> 00:46:45,930 ดังนั้นมักจะมีหรือ bigrams trigrams 883 00:46:45,930 --> 00:46:51,090 เพื่อให้คุณเพียงแค่นับสองคำ กลุ่มของสองคำหรือสามคำ 884 00:46:51,090 --> 00:46:52,620 เพียง แต่สำหรับปัญหาเรื่องประสิทธิภาพ 885 00:46:52,620 --> 00:46:56,395 และยังเพราะบางทีถ้าคุณมี บางอย่างเช่น "TF CS50." เมื่อคุณ 886 00:46:56,395 --> 00:47:00,510 มี "TF" มันเป็นสิ่งสำคัญมากที่ "CS50" เป็นถัดไปใช่ไหม 887 00:47:00,510 --> 00:47:04,050 ทั้งสองสิ่งนี้มักจะ ถัดจากแต่ละอื่น 888 00:47:04,050 --> 00:47:06,410 >> ถ้าคุณคิดว่าของ "ลุย" มันอาจจะเป็น จะมีสิ่งที่ 889 00:47:06,410 --> 00:47:07,890 ชั้นก็ TF'ing เพื่อ 890 00:47:07,890 --> 00:47:11,330 นอกจากนี้ "" เป็นสิ่งที่สำคัญจริงๆ เพื่อ CS50 TF 891 00:47:11,330 --> 00:47:14,570 แต่ถ้าคุณมีบางสิ่งบางอย่างเช่น "CS50 TF ไปเรียนและให้พวกเขา 892 00:47:14,570 --> 00:47:20,060 นักเรียนขนมบาง. "" แคนดี้ "และ" " ไม่มีความสัมพันธ์จริงๆใช่มั้ย 893 00:47:20,060 --> 00:47:23,670 พวกเขากำลังเพื่อให้ห่างไกลจากแต่ละอื่น ๆ ที่ มันไม่ได้เรื่องจริงๆสิ่งที่ 894 00:47:23,670 --> 00:47:25,050 คำที่คุณมี 895 00:47:25,050 --> 00:47:31,210 >> ดังนั้นด้วยการทำ bigram หรือ Trigram มัน ก็หมายความว่าคุณกำลัง จำกัด 896 00:47:31,210 --> 00:47:33,430 ตัวเองกับคำบางคำ ที่อยู่รอบ 897 00:47:33,430 --> 00:47:35,810 ทำให้รู้สึก 898 00:47:35,810 --> 00:47:40,630 ดังนั้นเมื่อคุณต้องการที่จะทำแบ่งส่วน โดยทั่วไปสิ่งที่คุณต้องการจะทำคือการมองเห็น 899 00:47:40,630 --> 00:47:44,850 สิ่งที่เป็นทุกวิธีที่เป็นไปได้ว่า คุณสามารถส่วนประโยคที่ว่า 900 00:47:44,850 --> 00:47:49,090 >> เช่นที่คุณเห็นสิ่งที่เป็น ความน่าจะเป็นของแต่ละประโยคที่ 901 00:47:49,090 --> 00:47:50,880 ที่มีอยู่ในภาษาหรือไม่ 902 00:47:50,880 --> 00:47:53,410 ดังนั้นสิ่งที่คุณทำก็เหมือนกันให้ ฉันพยายามที่จะนำพื้นที่ที่นี่ 903 00:47:53,410 --> 00:47:55,570 เพื่อให้คุณใส่ช่องว่างที่มี และคุณจะเห็นสิ่งที่เป็น 904 00:47:55,570 --> 00:47:57,590 ความน่าจะเป็นของประโยคที่ 905 00:47:57,590 --> 00:48:00,240 แล้วคุณจะเหมือนตกลงอาจจะ นั่นคือไม่ว่าดี 906 00:48:00,240 --> 00:48:03,420 ดังนั้นผมจึงใส่ช่องว่างและมีพื้นที่ มีและคุณคำนวณ 907 00:48:03,420 --> 00:48:06,240 ความน่าจะเป็นในขณะนี้และคุณจะเห็นว่า ก็น่าจะสูงกว่า 908 00:48:06,240 --> 00:48:12,160 >> ดังนั้นนี่คือวิธีการที่เรียกว่า TANGO ขั้นตอนวิธีการแบ่งส่วนซึ่งเป็น 909 00:48:12,160 --> 00:48:14,990 จริงสิ่งที่จะเป็นจริง เย็นสำหรับโครงการที่ 910 00:48:14,990 --> 00:48:20,860 โดยทั่วไปจะใช้เวลาข้อความ unsegmented ที่ สามารถภาษาญี่ปุ่นหรือจีนหรืออาจจะ 911 00:48:20,860 --> 00:48:26,080 อังกฤษไม่มีช่องว่างและพยายามที่จะใส่ ช่องว่างระหว่างคำและมันจะ 912 00:48:26,080 --> 00:48:29,120 ว่าด้วยการใช้รูปแบบของภาษาและ พยายามที่จะมองเห็นสิ่งที่อยู่สูงที่สุด 913 00:48:29,120 --> 00:48:31,270 น่าจะเป็นที่คุณจะได้รับ 914 00:48:31,270 --> 00:48:32,230 ตกลง 915 00:48:32,230 --> 00:48:33,800 ดังนั้นนี่คือการแบ่งส่วน 916 00:48:33,800 --> 00:48:35,450 >> ตอนนี้ไวยากรณ์ 917 00:48:35,450 --> 00:48:40,940 ดังนั้นรูปแบบที่จะถูกใช้สำหรับการ จำนวนมากดังนั้นสิ่งที่ถูกต้องในขณะนี้ 918 00:48:40,940 --> 00:48:44,880 ดังนั้นสำหรับการค้นหากราฟสำหรับสิริ สวยมากชนิดของธรรมชาติใด ๆ 919 00:48:44,880 --> 00:48:46,490 การประมวลผลภาษาที่คุณมี 920 00:48:46,490 --> 00:48:49,140 ดังนั้นสิ่งที่มีความสำคัญ สิ่งที่เกี่ยวกับไวยากรณ์? 921 00:48:49,140 --> 00:48:52,390 ดังนั้นประโยคโดยทั่วไปมี สิ่งที่เราเรียกองค์ประกอบ 922 00:48:52,390 --> 00:48:57,080 ซึ่งเป็นชนิดเช่นกลุ่มของคำ ที่มีฟังก์ชั่นในประโยค 923 00:48:57,080 --> 00:49:02,220 และพวกเขาไม่สามารถจริงๆ ห่างจากกัน 924 00:49:02,220 --> 00:49:07,380 >> ดังนั้นถ้าผมพูดเช่น "ลอเรนรัก ไมโล. "ฉันรู้ว่า" ลอเรน "เป็น 925 00:49:07,380 --> 00:49:10,180 ส่วนประกอบและแล้ว "ความรัก ไมโล "ยังเป็นอีกหนึ่ง 926 00:49:10,180 --> 00:49:16,860 เพราะคุณไม่สามารถพูดได้เช่น "ลอเรนไมโล รัก "จะมีความหมายเหมือนกัน 927 00:49:16,860 --> 00:49:18,020 มันไม่ได้เป็นไปได้ ความหมายเหมือนกัน 928 00:49:18,020 --> 00:49:22,500 หรือฉันไม่สามารถพูดเช่น "ไมโลลอเรน รัก. "ทุกอย่างไม่ได้เหมือนกัน 929 00:49:22,500 --> 00:49:25,890 หมายถึงการทำที่ 930 00:49:25,890 --> 00:49:31,940 >> ดังนั้นสองสิ่งที่สำคัญเพิ่มเติมเกี่ยวกับ ไวยากรณ์เป็นประเภทซึ่งเป็นคำศัพท์ 931 00:49:31,940 --> 00:49:35,390 โดยทั่วไปฟังก์ชั่นที่คุณ มีคำด้วยตัวเอง 932 00:49:35,390 --> 00:49:39,180 ดังนั้นคุณต้องรู้ว่า "ลอเรน" และ "ไมโล" เป็นคำนาม 933 00:49:39,180 --> 00:49:41,040 "ความรัก" เป็นคำกริยา 934 00:49:41,040 --> 00:49:45,660 และสิ่งที่สำคัญที่สองคือ ว่าพวกเขากำลังชนิดวลี 935 00:49:45,660 --> 00:49:48,990 เพื่อให้คุณรู้ว่า "รักไมโล" เป็นจริงเป็นวลีที่พูด 936 00:49:48,990 --> 00:49:52,390 ดังนั้นเมื่อผมพูดว่า "ลอเรน" ฉันรู้ว่า ลอเรนจะทำบางสิ่งบางอย่าง 937 00:49:52,390 --> 00:49:53,620 เธอกำลังทำอะไร 938 00:49:53,620 --> 00:49:54,570 เธอรักไมโล 939 00:49:54,570 --> 00:49:56,440 ดังนั้นจึงเป็นสิ่งที่ทั้ง 940 00:49:56,440 --> 00:50:01,640 แต่ชิ้นส่วนที่มี คำนามและคำกริยา 941 00:50:01,640 --> 00:50:04,210 แต่ร่วมกันพวกเขาให้คำกริยาวลี 942 00:50:04,210 --> 00:50:08,680 >> ดังนั้นสิ่งที่เราสามารถทำได้จริงด้วย ภาษาศาสตร์? 943 00:50:08,680 --> 00:50:13,810 ดังนั้นถ้าฉันมีบางอย่างเช่น "เพื่อนของแอลลิสัน." ผมเห็นถ้าฉันเพียงแค่ 944 00:50:13,810 --> 00:50:17,440 ไม่ต้นไม้วากยสัมพันธ์ฉันอยากจะรู้ว่า "เพื่อน" เป็นวลีคำนามเป็น 945 00:50:17,440 --> 00:50:21,480 คำนามและแล้ว "ของแอลลิสัน" เป็น บุพบทวลีที่ "ของ" เป็น 946 00:50:21,480 --> 00:50:24,810 เรื่องและ "อัลลิสัน" เป็นคำนาม 947 00:50:24,810 --> 00:50:30,910 สิ่งที่ฉันสามารถทำคือการสอนคอมพิวเตอร์ของฉัน ที่เมื่อฉันมีนามวลีหนึ่งและ 948 00:50:30,910 --> 00:50:33,080 แล้วบุพบทวลี 949 00:50:33,080 --> 00:50:39,020 ดังนั้นในกรณีนี้ "เพื่อน" แล้ว "ของ ไมโล "ฉันรู้ว่านี้หมายความว่า 950 00:50:39,020 --> 00:50:43,110 NP2, คนที่สองเป็นเจ้าของ NP1 951 00:50:43,110 --> 00:50:47,680 >> ดังนั้นผมจึงสามารถสร้างชนิดของความสัมพันธ์บางอย่าง บางชนิดของฟังก์ชั่นสำหรับมัน 952 00:50:47,680 --> 00:50:52,370 ดังนั้นเมื่อใดก็ตามที่ฉันเห็นโครงสร้างนี้ซึ่ง ตรงที่ว่าด้วย "เพื่อนของ 953 00:50:52,370 --> 00:50:56,030 แอลลิสัน "ฉันรู้ว่าแอลลิสัน เพื่อนที่เป็นเจ้าของ 954 00:50:56,030 --> 00:50:58,830 เพื่อให้เพื่อนเป็นสิ่งที่ แอลลิสันที่มี 955 00:50:58,830 --> 00:50:59,610 ทำให้รู้สึก? 956 00:50:59,610 --> 00:51:01,770 ดังนั้นนี่คือสิ่งที่โดยทั่วไป ค้นหากราฟไม่ 957 00:51:01,770 --> 00:51:04,360 มันก็จะสร้างกฎ สำหรับจำนวนมากของสิ่งที่ 958 00:51:04,360 --> 00:51:08,190 ดังนั้น "เพื่อนของแอลลิสัน", "เพื่อนของฉัน ที่อาศัยอยู่ในเคมบริดจ์ "," เพื่อนของฉัน 959 00:51:08,190 --> 00:51:12,970 ที่ไปที่ฮาร์วาร์. "มันสร้างกฎระเบียบ สำหรับทุกสิ่งเหล่านั้น 960 00:51:12,970 --> 00:51:14,930 >> ตอนนี้เครื่องแปลภาษา 961 00:51:14,930 --> 00:51:18,850 ดังนั้นเครื่องแปลภาษายังเป็น บางสิ่งบางอย่างทางสถิติ 962 00:51:18,850 --> 00:51:21,340 และที่จริงถ้าคุณได้รับที่เกี่ยวข้องใน ภาษาศาสตร์จำนวนมาก 963 00:51:21,340 --> 00:51:23,580 ข้อมูลของคุณเป็นไปได้สถิติ 964 00:51:23,580 --> 00:51:26,670 ดังนั้นขณะที่ผมกำลังทำตัวอย่างกับ จำนวนมากที่มีความน่าจะเป็นว่าผมเป็น 965 00:51:26,670 --> 00:51:30,540 การคำนวณและจากนั้นคุณจะได้รับนี้ จำนวนน้อยมากที่สุดท้าย 966 00:51:30,540 --> 00:51:33,180 น่าจะเป็นและนั่นคือสิ่งที่ ช่วยให้คุณมีคำตอบ 967 00:51:33,180 --> 00:51:37,540 เครื่องแปลภาษานอกจากนี้ยังใช้ แบบจำลองทางสถิติ 968 00:51:37,540 --> 00:51:44,790 และถ้าคุณต้องการที่จะคิดของเครื่อง แปลในที่ง่ายที่สุด 969 00:51:44,790 --> 00:51:48,970 วิธีที่สิ่งที่คุณสามารถคิดเป็นเพียง แปลคำโดยคำใช่ไหม 970 00:51:48,970 --> 00:51:52,150 >> เมื่อคุณเรียนรู้ภาษาสำหรับ ครั้งแรกที่มักจะสิ่งที่ 971 00:51:52,150 --> 00:51:52,910 ที่คุณทำใช่ไหม 972 00:51:52,910 --> 00:51:57,050 ถ้าคุณต้องการคุณแปลประโยค ในภาษาของคุณในการใช้ภาษา 973 00:51:57,050 --> 00:52:00,060 คุณกำลังเรียนรู้มักจะเป็นครั้งแรกที่คุณ แปลแต่ละคำ 974 00:52:00,060 --> 00:52:03,180 เป็นรายบุคคลและจากนั้นคุณพยายาม จะนำคำให้เข้าที่ 975 00:52:03,180 --> 00:52:07,100 >> ดังนั้นถ้าผมต้องการที่จะแปลนี้ [พูดภาษาโปรตุเกส] 976 00:52:07,100 --> 00:52:10,430 ซึ่งหมายความว่า "แมวสีขาววิ่งหนีไป." ถ้าผมต้องการที่จะแปลจาก 977 00:52:10,430 --> 00:52:13,650 โปรตุเกสเป็นภาษาอังกฤษสิ่งที่ฉัน สามารถทำอะไรได้เป็นครั้งแรกที่ฉันเพียงแค่ 978 00:52:13,650 --> 00:52:14,800 แปลตามพยัญชนะ 979 00:52:14,800 --> 00:52:20,570 ดังนั้น "o" เป็น "", "แมว", "แมว" "กู", "สีขาว" แล้ว "fugio" เป็น 980 00:52:20,570 --> 00:52:21,650 "วิ่งหนีไป". 981 00:52:21,650 --> 00:52:26,130 >> ดังนั้นแล้วฉันมีคำทั้งหมดที่นี่ แต่พวกเขาไม่ได้อยู่ในลำดับที่ 982 00:52:26,130 --> 00:52:29,590 มันก็เหมือน "สีขาวแมววิ่งหนีไป" ซึ่งเป็นผิดไวยากรณ์ 983 00:52:29,590 --> 00:52:34,490 ดังนั้นแล้วฉันจะมีขั้นตอนที่สองซึ่ง เป็นไปได้ในการหาที่เหมาะ 984 00:52:34,490 --> 00:52:36,610 ตำแหน่งของแต่ละคำ 985 00:52:36,610 --> 00:52:40,240 ดังนั้นผมจึงรู้ว่าที่จริงผมต้องการที่จะมี "แมวสีขาว" แทน "แมวสีขาว." ดังนั้น 986 00:52:40,240 --> 00:52:46,050 สิ่งที่ฉันสามารถทำได้คือวิธีไร้เดียงสามากที่สุด จะสร้างทั้งหมด 987 00:52:46,050 --> 00:52:49,720 พีชคณิตเป็นไปได้ของ คำของตำแหน่ง 988 00:52:49,720 --> 00:52:53,300 แล้วดูที่หนึ่งมี น่าจะเป็นสูงสุดตาม 989 00:52:53,300 --> 00:52:54,970 กับรูปแบบภาษาของฉัน 990 00:52:54,970 --> 00:52:58,390 และจากนั้นเมื่อฉันพบหนึ่งที่มี น่าจะเป็นสูงสุดมันซึ่งเป็น 991 00:52:58,390 --> 00:53:01,910 อาจจะ "แมวสีขาววิ่งออกไป" ที่แปลของฉัน 992 00:53:01,910 --> 00:53:06,710 >> และนี่เป็นวิธีที่ง่ายในการอธิบาย วิธีการจำนวนมากของเครื่องแปลภาษา 993 00:53:06,710 --> 00:53:07,910 ขั้นตอนวิธีการทำงาน 994 00:53:07,910 --> 00:53:08,920 ไม่ที่ทำให้รู้สึก? 995 00:53:08,920 --> 00:53:12,735 และนี่ก็เป็นสิ่งที่น่าตื่นเต้นจริงๆ ที่พวกคุณอาจจะสามารถสำรวจ 996 00:53:12,735 --> 00:53:13,901 โครงการสุดท้ายใช่? 997 00:53:13,901 --> 00:53:15,549 >> นักเรียน: ดีคุณบอกว่ามันเป็น วิธีที่ไร้เดียงสาดังนั้นสิ่งที่เป็น 998 00:53:15,549 --> 00:53:17,200 วิธีคิดที่ไม่ไร้เดียงสา? 999 00:53:17,200 --> 00:53:18,400 >> LUCAS FREITAS: วิธีคิดที่ไม่ไร้เดียงสา? 1000 00:53:18,400 --> 00:53:19,050 ตกลง 1001 00:53:19,050 --> 00:53:22,860 ดังนั้นสิ่งแรกที่ไม่ดีเกี่ยวกับ วิธีการนี​​้เป็นที่ฉันเพียงแค่การแปล 1002 00:53:22,860 --> 00:53:24,330 คำคำโดยคำ 1003 00:53:24,330 --> 00:53:30,570 แต่บางครั้งคุณจะมีคำว่า สามารถมีการแปลหลาย 1004 00:53:30,570 --> 00:53:32,210 ฉันจะพยายามที่จะคิด บางสิ่งบางอย่าง 1005 00:53:32,210 --> 00:53:37,270 ตัวอย่างเช่น "มังงะ" ในภาษาโปรตุเกสสามารถ อย่างใดอย่างหนึ่งเป็น "ฉีก" หรือ "แขน". ดังนั้น 1006 00:53:37,270 --> 00:53:40,450 เมื่อคุณกำลังพยายามที่จะแปลคำ ด้วยคำพูดมันอาจจะให้คุณ 1007 00:53:40,450 --> 00:53:42,050 อะไรบางอย่างที่ทำให้รู้สึกไม่ 1008 00:53:42,050 --> 00:53:45,770 >> เพื่อให้คุณจริงต้องการคุณดูที่ทั้งหมด เป็นไปได้ของการแปล 1009 00:53:45,770 --> 00:53:49,840 คำพูดและการเห็นแรกของทั้งหมด สิ่งที่เป็นคำสั่ง 1010 00:53:49,840 --> 00:53:52,000 เราได้พูดคุยเกี่ยวกับ Permutating สิ่งที่? 1011 00:53:52,000 --> 00:53:54,150 เพื่อดูคำสั่งที่เป็นไปได้และ เลือกหนึ่งที่มีมากที่สุด 1012 00:53:54,150 --> 00:53:54,990 ความน่าจะเป็น? 1013 00:53:54,990 --> 00:53:57,860 นอกจากนี้คุณยังสามารถเลือกที่เป็นไปได้ทั้งหมด แปลสำหรับแต่ละ 1014 00:53:57,860 --> 00:54:00,510 คำแล้วดู - 1015 00:54:00,510 --> 00:54:01,950 รวมกับพีชคณิต - 1016 00:54:01,950 --> 00:54:03,710 ที่หนึ่งที่มีความน่าจะเป็นสูงสุด 1017 00:54:03,710 --> 00:54:08,590 >> นอกจากนี้คุณยังสามารถดูได้ คำเพียง แต่วลี 1018 00:54:08,590 --> 00:54:11,700 เพื่อให้คุณสามารถวิเคราะห์ความสัมพันธ์ระหว่าง คำและจากนั้นได้รับ 1019 00:54:11,700 --> 00:54:13,210 การแปลที่ดีกว่า 1020 00:54:13,210 --> 00:54:16,690 นอกจากนี้ยังมีสิ่งอื่นเพื่อให้ภาคการศึกษานี้ ฉันจริงการทำวิจัยใน 1021 00:54:16,690 --> 00:54:19,430 ภาษาจีนภาษาอังกฤษแปลเครื่อง เพื่อแปลจาก 1022 00:54:19,430 --> 00:54:20,940 ภาษาจีนเป็นภาษาอังกฤษ 1023 00:54:20,940 --> 00:54:26,760 >> และสิ่งที่เราทำคือนอกเหนือจากการใช้ แบบจำลองทางสถิติซึ่งเป็นเพียง 1024 00:54:26,760 --> 00:54:30,570 เห็นความเป็นไปได้ของการมองเห็น ตำแหน่งในประโยคบางอย่างฉัน 1025 00:54:30,570 --> 00:54:35,360 จริงยังเพิ่มรูปแบบบางอย่างของฉัน แบบว่าโอ้ถ้าผมเห็นแบบนี้ 1026 00:54:35,360 --> 00:54:39,420 ของการก่อสร้างนี้เป็นสิ่งที่ฉันต้องการ ที่จะเปลี่ยนไปเมื่อฉันแปล 1027 00:54:39,420 --> 00:54:43,880 เพื่อให้คุณยังสามารถเพิ่มชนิดของ องค์ประกอบของไวยากรณ์ที่จะทำให้ 1028 00:54:43,880 --> 00:54:47,970 แปลมีประสิทธิภาพมากขึ้น และแม่นยำมากขึ้น 1029 00:54:47,970 --> 00:54:48,550 ตกลง 1030 00:54:48,550 --> 00:54:51,010 >> ดังนั้นวิธีที่สามารถให้คุณเริ่มต้นถ้าคุณต้องการ ที่จะทำอะไรบางอย่างในการคำนวณ 1031 00:54:51,010 --> 00:54:51,980 ภาษาศาสตร์? 1032 00:54:51,980 --> 00:54:54,560 >> ขั้นแรกให้คุณเลือกโครงการ ที่เกี่ยวข้องกับภาษา 1033 00:54:54,560 --> 00:54:56,310 ดังนั้นมีจำนวนมากออกมี 1034 00:54:56,310 --> 00:54:58,420 มีหลายสิ่งที่คุณสามารถทำได้ 1035 00:54:58,420 --> 00:55:00,510 แล้วสามารถคิดรูปแบบ ที่คุณสามารถใช้ 1036 00:55:00,510 --> 00:55:04,710 มักจะหมายถึงการที่ความคิดของ สมมติฐานที่เป็นเช่นโอ้เมื่อฉันถูก 1037 00:55:04,710 --> 00:55:05,770 เช่นความคิดของเนื้อเพลง 1038 00:55:05,770 --> 00:55:09,510 ฉันก็เหมือนกันถ้าผมต้องการที่จะคิด ออกที่เขียนนี้ผมอาจต้องการ 1039 00:55:09,510 --> 00:55:15,400 การมองไปที่คำว่าคนที่ใช้และ ดูว่าใครใช้คำว่าบ่อยมาก 1040 00:55:15,400 --> 00:55:18,470 จึงพยายามที่จะทำให้สมมติฐานและ พยายามที่จะคิดในรูปแบบ 1041 00:55:18,470 --> 00:55:21,395 แล้วคุณยังสามารถค้นหาออนไลน์สำหรับ ชนิดของปัญหาที่คุณมี 1042 00:55:21,395 --> 00:55:24,260 และก็จะให้คำแนะนำ กับรุ่นที่คุณว่าอาจจะ 1043 00:55:24,260 --> 00:55:26,560 การสร้างแบบจำลองสิ่งที่ดี 1044 00:55:26,560 --> 00:55:29,080 >> และยังให้คุณสามารถส่งอีเมลฉัน 1045 00:55:29,080 --> 00:55:31,140 me@lfreitas.com 1046 00:55:31,140 --> 00:55:34,940 และผมก็สามารถตอบคำถามของคุณ 1047 00:55:34,940 --> 00:55:38,600 เราสามารถตอบสนองความต้องการก็อาจจะขึ้นเพื่อที่ฉันสามารถ ให้คำแนะนำเกี่ยวกับวิธีการของ 1048 00:55:38,600 --> 00:55:41,490 การดำเนินการโครงการของคุณ 1049 00:55:41,490 --> 00:55:45,610 และฉันหมายความว่าถ้าคุณได้รับเกี่ยวข้องกับ ภาษาศาสตร์ก็จะ 1050 00:55:45,610 --> 00:55:46,790 จะดี 1051 00:55:46,790 --> 00:55:48,370 คุณจะเห็นมี มีศักยภาพมาก 1052 00:55:48,370 --> 00:55:52,060 และอุตสาหกรรมต้องการที่จะจ้าง คุณเลวร้ายเพราะการที่ 1053 00:55:52,060 --> 00:55:54,720 ดังนั้นผมหวังว่าพวกคุณจะสนุกกับนี้ 1054 00:55:54,720 --> 00:55:57,030 ถ้าพวกคุณมีคำถามใด ๆ คุณสามารถถามฉันหลังจากนี้ 1055 00:55:57,030 --> 00:55:58,280 แต่ขอขอบคุณ 1056 00:55:58,280 --> 00:56:00,150