1
00:00:00,000 --> 00:00:08,364

2
00:00:08,364 --> 00:00:08,870
>> LUCAS FREITAS: Hey

3
00:00:08,870 --> 00:00:09,980
ทุกคนยินดีต้อนรับ

4
00:00:09,980 --> 00:00:11,216
ชื่อของฉันคือลูคัสตาส

5
00:00:11,216 --> 00:00:15,220
ผมจูเนียร์ที่ [ไม่ได้ยิน] การศึกษา
วิทยาศาสตร์คอมพิวเตอร์ที่มีความสำคัญใน

6
00:00:15,220 --> 00:00:16,410
ภาษาศาสตร์

7
00:00:16,410 --> 00:00:19,310
ดังนั้นรองของฉันอยู่ในภาษา
และทฤษฎีภาษาศาสตร์

8
00:00:19,310 --> 00:00:21,870
ผมตื่นเต้นจริงๆที่จะสอนพวกคุณ
นิด ๆ หน่อย ๆ เกี่ยวกับข้อมูล

9
00:00:21,870 --> 00:00:24,300
มันเป็นพื้นที่ที่น่าตื่นเต้นมากที่จะศึกษา

10
00:00:24,300 --> 00:00:27,260
นอกจากนี้ยังมีจำนวนมากที่มีศักยภาพ
สำหรับอนาคต

11
00:00:27,260 --> 00:00:30,160
ดังนั้นผมตื่นเต้นจริงๆที่พวกคุณ
กำลังพิจารณาโครงการใน

12
00:00:30,160 --> 00:00:31,160
ภาษาศาสตร์

13
00:00:31,160 --> 00:00:35,460
และฉันจะมากกว่ายินดีที่จะให้คำแนะนำ
ใด ๆ ของคุณถ้าคุณตัดสินใจที่จะ

14
00:00:35,460 --> 00:00:37,090
ติดตามหนึ่งในบรรดา

15
00:00:37,090 --> 00:00:40,010
>> ดังนั้นครั้งแรกของทุกสิ่งที่มีการคำนวณ
ภาษาศาสตร์?

16
00:00:40,010 --> 00:00:44,630
ภาษาศาสตร์ดังนั้นการคำนวณคือ
สี่แยกระหว่างภาษาศาสตร์และ

17
00:00:44,630 --> 00:00:46,390
สาขาวิชาวิทยาการคอมพิวเตอร์

18
00:00:46,390 --> 00:00:47,415
ดังนั้นสิ่งที่เป็นภาษาศาสตร์?

19
00:00:47,415 --> 00:00:48,490
วิทยาการคอมพิวเตอร์คืออะไร

20
00:00:48,490 --> 00:00:51,580
ดีจากภาษาศาสตร์สิ่งที่
เราจะใช้ภาษา

21
00:00:51,580 --> 00:00:54,960
ดังนั้นภาษาศาสตร์เป็นจริงการศึกษา
ของภาษาธรรมชาติทั่วไป

22
00:00:54,960 --> 00:00:58,330
ดังนั้นภาษาธรรมชาติ - เราพูดคุยเกี่ยวกับ
ภาษาที่เราใช้จริงกับ

23
00:00:58,330 --> 00:00:59,770
สื่อสารกับแต่ละอื่น

24
00:00:59,770 --> 00:01:02,200
ดังนั้นเราจะไม่พูดว่า
เกี่ยวกับ C หรือ Java

25
00:01:02,200 --> 00:01:05,900
เรากำลังพูดถึงเกี่ยวกับภาษาอังกฤษและ
ภาษาจีนและอื่น ๆ ที่เรา

26
00:01:05,900 --> 00:01:07,780
ใช้ในการสื่อสารกับแต่ละอื่น

27
00:01:07,780 --> 00:01:12,470
>> สิ่งที่ท้าทายเกี่ยวกับการที่ว่า
ตอนนี้เรามีเกือบ 7,000

28
00:01:12,470 --> 00:01:14,260
ภาษาในโลก

29
00:01:14,260 --> 00:01:19,520
ดังนั้นจึงมีความหลากหลายค่อนข้างสูง
ภาษาที่เราสามารถเรียนได้

30
00:01:19,520 --> 00:01:22,600
แล้วคุณคิดว่ามันอาจจะเป็น
ยากมากที่จะทำเช่น

31
00:01:22,600 --> 00:01:26,960
การแปลจากภาษาหนึ่งไปยัง
อื่น ๆ ที่พิจารณาว่าคุณมี

32
00:01:26,960 --> 00:01:28,240
เกือบ 7,000 ของพวกเขา

33
00:01:28,240 --> 00:01:31,450
ดังนั้นถ้าคุณคิดว่าการทำแปล
จากภาษาหนึ่งไปยังอีกที่คุณ

34
00:01:31,450 --> 00:01:35,840
มีเกือบมากกว่าหนึ่งล้าน
ชุดที่แตกต่างกันที่คุณสามารถ

35
00:01:35,840 --> 00:01:37,330
มีจากภาษาภาษา

36
00:01:37,330 --> 00:01:40,820
ดังนั้นมันจริงๆความท้าทายที่จะทำบางอย่าง
ชนิดของระบบการแปลตัวอย่างสำหรับ

37
00:01:40,820 --> 00:01:43,540
ทุกภาษาเดียว

38
00:01:43,540 --> 00:01:47,120
>> ดังนั้นถือว่าภาษาศาสตร์ด้วยไวยากรณ์
ความหมายเน้น

39
00:01:47,120 --> 00:01:49,550
พวกคุณไม่ได้ว่าต้อง
ที่จะรู้ว่าสิ่งที่พวกเขามี

40
00:01:49,550 --> 00:01:55,090
แต่สิ่งที่น่าสนใจมากคือ
ในฐานะที่เป็นเจ้าของภาษาเมื่อคุณเรียนรู้

41
00:01:55,090 --> 00:01:59,010
ภาษาเป็นเด็กคุณได้เรียนรู้จริง
ทุกสิ่งที่ - ความหมายไวยากรณ์

42
00:01:59,010 --> 00:02:00,500
และเน้น -

43
00:02:00,500 --> 00:02:01,430
ด้วยตัวเอง

44
00:02:01,430 --> 00:02:04,820
และไม่มีใครมีที่จะสอนไวยากรณ์สำหรับ
คุณจะเข้าใจว่าประโยคนี้

45
00:02:04,820 --> 00:02:05,290
โครงสร้าง

46
00:02:05,290 --> 00:02:07,980
ดังนั้นจึงเป็นที่น่าสนใจมากเพราะ
มันเป็นสิ่งที่มามาก

47
00:02:07,980 --> 00:02:10,389
อย่างสังหรณ์ใจ

48
00:02:10,389 --> 00:02:13,190
>> และสิ่งที่คุณจะได้รับจาก
วิทยาการคอมพิวเตอร์หรือไม่

49
00:02:13,190 --> 00:02:16,700
ดีสิ่งที่สำคัญที่สุดที่เรา
มีวิทยาการคอมพิวเตอร์เป็นครั้งแรกของ

50
00:02:16,700 --> 00:02:19,340
ทุกปัญญาประดิษฐ์
และการเรียนรู้เครื่อง

51
00:02:19,340 --> 00:02:22,610
ดังนั้นสิ่งที่เรากำลังพยายามที่จะทำ
ภาษาศาสตร์คือสอน

52
00:02:22,610 --> 00:02:26,990
คอมพิวเตอร์ของคุณวิธีที่จะทำบางสิ่งบางอย่าง
กับภาษา

53
00:02:26,990 --> 00:02:28,630
>> ดังนั้นสำหรับตัวอย่างเช่นในเครื่อง
การแปล

54
00:02:28,630 --> 00:02:32,490
ฉันพยายามที่จะสอนวิธีการใช้คอมพิวเตอร์ของฉัน
รู้วิธีที่จะเปลี่ยนจากหนึ่ง

55
00:02:32,490 --> 00:02:33,310
ภาษาอื่น ๆ

56
00:02:33,310 --> 00:02:35,790
ดังนั้นโดยทั่วไปชอบการเรียนการสอน
คอมพิวเตอร์ทั้งสองภาษา

57
00:02:35,790 --> 00:02:38,870
ถ้าผมทำการประมวลผลภาษาธรรมชาติ
ซึ่งเป็นกรณีตัวอย่างของ

58
00:02:38,870 --> 00:02:41,810
Facebook ของกราฟ Search คุณสอน
คอมพิวเตอร์ของคุณวิธีการที่จะเข้าใจ

59
00:02:41,810 --> 00:02:42,730
การค้นหาที่ดี

60
00:02:42,730 --> 00:02:48,130
>> ดังนั้นถ้าคุณบอกว่า "ภาพของฉัน
เพื่อน. "Facebook ไม่ได้รักษาที่

61
00:02:48,130 --> 00:02:51,130
เป็นสตริงที่มีทั้ง
เพียงพวงของคำ

62
00:02:51,130 --> 00:02:56,020
มันจริงเข้าใจความสัมพันธ์
ระหว่าง "ภาพ" และ "เพื่อนของฉัน" และ

63
00:02:56,020 --> 00:02:59,620
เข้าใจว่า "ภาพถ่าย" เป็น
สถานที่ให้บริการของ "เพื่อนของฉัน."

64
00:02:59,620 --> 00:03:02,350
>> ดังนั้นที่เป็นส่วนหนึ่งของตัวอย่างเช่น
การประมวลผลภาษาธรรมชาติ

65
00:03:02,350 --> 00:03:04,790
มันพยายามที่จะเข้าใจในสิ่งที่
เป็นความสัมพันธ์ระหว่าง

66
00:03:04,790 --> 00:03:07,520
คำในประโยค

67
00:03:07,520 --> 00:03:11,170
และคำถามใหญ่คือคุณสามารถ
สอนคอมพิวเตอร์วิธีการพูด

68
00:03:11,170 --> 00:03:12,650
ภาษาโดยทั่วไป

69
00:03:12,650 --> 00:03:17,810
ซึ่งเป็นคำถามที่น่าสนใจมากที่จะ
คิดว่าอาจจะเป็นในอนาคต

70
00:03:17,810 --> 00:03:19,930
คุณจะสามารถ
พูดคุยกับโทรศัพท์มือถือของคุณ

71
00:03:19,930 --> 00:03:23,290
ชนิดเช่นสิ่งที่เราทำกับศิริ แต่
บางสิ่งบางอย่างมากขึ้นเช่นคุณสามารถจริง

72
00:03:23,290 --> 00:03:25,690
บอกว่าสิ่งที่คุณต้องการและโทรศัพท์
จะเข้าใจทุกอย่าง

73
00:03:25,690 --> 00:03:28,350
และมันก็จะมีคำถามตามมา
และให้พูดคุย

74
00:03:28,350 --> 00:03:30,880
นั่นเป็นสิ่งที่น่าตื่นเต้นจริงๆ
ในความคิดของฉัน

75
00:03:30,880 --> 00:03:33,070
>> ดังนั้นสิ่งที่เกี่ยวกับภาษาธรรมชาติ

76
00:03:33,070 --> 00:03:36,220
สิ่งที่น่าสนใจมากเกี่ยวกับ
ภาษาธรรมชาติที่และนี่คือ

77
00:03:36,220 --> 00:03:38,470
เครดิตกับภาษาศาสตร์อาจารย์ของฉัน
มาเรีย Polinsky

78
00:03:38,470 --> 00:03:40,830
เธอแสดงให้เห็นตัวอย่างและฉันคิดว่า
มันเป็นเรื่องที่น่าสนใจจริงๆ

79
00:03:40,830 --> 00:03:47,060
เพราะเราเรียนรู้ภาษาจากเมื่อ
เราเกิดมาแล้วพื้นเมืองของเรา

80
00:03:47,060 --> 00:03:49,170
ชนิดของภาษาที่เราเติบโตขึ้น

81
00:03:49,170 --> 00:03:52,570
>> และโดยทั่วไปคุณเรียนรู้ภาษา
จากการป้อนข้อมูลน้อยที่สุดใช่ไหม

82
00:03:52,570 --> 00:03:56,700
คุณเพียงแค่ได้รับการป้อนข้อมูลจากคุณ
พ่อแม่ของสิ่งที่ภาษาของคุณเสียง

83
00:03:56,700 --> 00:03:58,770
ชอบและคุณเพียงแค่เรียนรู้มัน

84
00:03:58,770 --> 00:04:02,240
ดังนั้นจึงเป็นที่น่าสนใจเพราะถ้าคุณดู
ที่ประโยคเหล่านั้นตัวอย่างเช่น

85
00:04:02,240 --> 00:04:06,980
คุณดู "แมรี่สวมเสื้อเกราะทุก
เวลาที่เธอออกจากบ้าน. "

86
00:04:06,980 --> 00:04:10,650
>> ในกรณีนี้ก็เป็นไปได้ที่จะมี
คำว่า "เธอ" หมายถึงแมรี่ใช่ไหม

87
00:04:10,650 --> 00:04:13,500
คุณสามารถพูดได้ "แมรี่สวมเสื้อเกราะ
เวลาแมรี่ออกทุก

88
00:04:13,500 --> 00:04:14,960
บ้าน. "เพื่อให้เป็นดี

89
00:04:14,960 --> 00:04:19,370
แต่แล้วถ้าคุณมองไปที่ประโยค
"เธอสวมเสื้อเกราะทุกครั้งที่แมรี่

90
00:04:19,370 --> 00:04:22,850
ออกจากบ้าน. "คุณรู้ว่ามัน
เป็นไปไม่ได้ที่จะบอกว่า "เธอ" เป็น

91
00:04:22,850 --> 00:04:24,260
หมายถึงแมรี่

92
00:04:24,260 --> 00:04:27,070
>> มีวิธีการบอกว่า "แมรี่ทำให้ไม่ได้
เสื้อแมรี่เวลาออกทุก

93
00:04:27,070 --> 00:04:30,790
บ้าน. "ดังนั้นจึงเป็นที่น่าสนใจเพราะ
นี้เป็นชนิดของสัญชาตญาณ

94
00:04:30,790 --> 00:04:32,890
ว่าทุกเจ้าของภาษามี

95
00:04:32,890 --> 00:04:36,370
และไม่มีใครได้รับการสอนว่านี้เป็น
วิธีการที่ผลงานของไวยากรณ์

96
00:04:36,370 --> 00:04:41,930
และการที่คุณสามารถมีเพียงแค่นี้ "เธอ"
หมายถึงแมรี่ในกรณีแรกนี้

97
00:04:41,930 --> 00:04:44,260
และจริงในอื่น ๆ
เกินไป แต่ไม่ได้อยู่ในนี้

98
00:04:44,260 --> 00:04:46,500
แต่ทุกคนจะได้รับชนิดของ
ให้คำตอบเดียวกัน

99
00:04:46,500 --> 00:04:48,580
ทุกคนเห็นพ้องว่า

100
00:04:48,580 --> 00:04:53,280
ดังนั้นจึงเป็นที่น่าสนใจจริงๆว่าแม้ว่า
คุณไม่ทราบว่ากฎทั้งหมด

101
00:04:53,280 --> 00:04:55,575
ในภาษาของคุณชนิดของคุณเข้าใจ
วิธีการทำงานของภาษา

102
00:04:55,575 --> 00:04:59,020

103
00:04:59,020 --> 00:05:01,530
>> ดังนั้นสิ่งที่น่าสนใจเกี่ยวกับธรรมชาติ
ภาษาคือการที่คุณจะได้ไม่ต้อง

104
00:05:01,530 --> 00:05:06,970
รู้ไวยากรณ์ใดที่จะทราบว่าประโยค
เป็นไวยากรณ์หรือผิดไวยากรณ์เพื่อ

105
00:05:06,970 --> 00:05:08,810
กรณีส่วนใหญ่

106
00:05:08,810 --> 00:05:13,220
ซึ่งทำให้คุณคิดว่าอาจจะเป็นสิ่งที่
ที่เกิดขึ้นคือผ่านชีวิตของคุณคุณ

107
00:05:13,220 --> 00:05:17,410
เพียงแค่ให้ได้รับมากขึ้นและมากขึ้น
ประโยคที่บอกให้คุณ

108
00:05:17,410 --> 00:05:19,800
แล้วคุณจะให้จำ
ทุกประโยค

109
00:05:19,800 --> 00:05:24,230
และจากนั้นเมื่อมีคนบอกคุณ
บางสิ่งบางอย่างที่คุณได้ยินประโยคที่และ

110
00:05:24,230 --> 00:05:27,040
คุณดูที่คำศัพท์ของคุณ
ของประโยคและดูว่า

111
00:05:27,040 --> 00:05:28,270
ประโยคที่มี

112
00:05:28,270 --> 00:05:29,830
และถ้ามันเป็นสิ่งที่มีคุณ
บอกว่ามันเป็นไวยากรณ์

113
00:05:29,830 --> 00:05:31,740
ถ้ามันไม่ได้บอกว่ามันเป็น
ผิดไวยากรณ์

114
00:05:31,740 --> 00:05:35,150
>> ดังนั้นในกรณีที่คุณจะพูดว่าโอ้
เพื่อให้คุณมีรายการใหญ่ของทั้งหมด

115
00:05:35,150 --> 00:05:36,140
ประโยคที่เป็นไปได้

116
00:05:36,140 --> 00:05:38,240
และจากนั้นเมื่อคุณได้ยินประโยค
คุณรู้ว่ามันเป็นไวยากรณ์หรือ

117
00:05:38,240 --> 00:05:39,450
ไม่ขึ้นอยู่กับว่า

118
00:05:39,450 --> 00:05:42,360
เป็นสิ่งที่ถ้าคุณดูที่
ประโยคตัวอย่างเช่น "

119
00:05:42,360 --> 00:05:47,540
ห้าหัว CS50 TFs สุกตาบอด
ปลาหมึกใช้แก้ว DAPA. "มันเป็น

120
00:05:47,540 --> 00:05:49,630
แน่นอนไม่ประโยค
ที่คุณได้ยินมาก่อน

121
00:05:49,630 --> 00:05:52,380
แต่ในขณะเดียวกันคุณรู้ว่ามัน
สวยมากไวยากรณ์ใช่ไหม

122
00:05:52,380 --> 00:05:55,570
ไม่มีความผิดพลาดทางไวยากรณ์เป็น
และคุณสามารถพูดได้ว่า

123
00:05:55,570 --> 00:05:57,020
มันเป็นเรื่องที่เป็นไปได้ประโยค

124
00:05:57,020 --> 00:06:01,300
>> จึงทำให้เราคิดว่าจริง
วิธีการที่เราได้เรียนรู้ภาษาที่ไม่เพียง

125
00:06:01,300 --> 00:06:07,090
โดยมีฐานข้อมูลขนาดใหญ่ที่เป็นไปได้
คำหรือประโยค แต่มากขึ้นของ

126
00:06:07,090 --> 00:06:11,490
การทำความเข้าใจความสัมพันธ์ระหว่าง
คำในประโยคเหล่านั้น

127
00:06:11,490 --> 00:06:14,570
ไม่ที่ทำให้รู้สึก?

128
00:06:14,570 --> 00:06:19,370
ดังนั้นแล้วคำถามคือสามารถ
คอมพิวเตอร์เรียนรู้ภาษา?

129
00:06:19,370 --> 00:06:21,490
เราสามารถสอนภาษาให้กับคอมพิวเตอร์?

130
00:06:21,490 --> 00:06:24,230
>> ดังนั้นขอคิดของความแตกต่าง
ระหว่างเจ้าของภาษาของภาษา

131
00:06:24,230 --> 00:06:25,460
และเครื่องคอมพิวเตอร์

132
00:06:25,460 --> 00:06:27,340
ดังนั้นสิ่งที่เกิดขึ้นกับลำโพงหรือไม่

133
00:06:27,340 --> 00:06:30,430
ดีเจ้าของภาษาเรียนรู้
ภาษาจากการสัมผัสกับมัน

134
00:06:30,430 --> 00:06:34,200
ปกติปีในวัยเด็กของต้น

135
00:06:34,200 --> 00:06:38,570
ดังนั้นโดยทั่วไปคุณก็มีลูก
และคุณให้พูดคุยกับมันและมัน

136
00:06:38,570 --> 00:06:40,540
เพียงแค่เรียนรู้วิธีการพูด
ภาษาใช่ไหม

137
00:06:40,540 --> 00:06:42,660
ดังนั้นคุณพื้นให้
ใส่ไปยังทารก

138
00:06:42,660 --> 00:06:45,200
ดังนั้นแล้วคุณสามารถยืนยันว่าคอมพิวเตอร์
สามารถทำสิ่งเดียวกันใช่ไหม

139
00:06:45,200 --> 00:06:49,510
คุณก็สามารถให้ภาษา
เป็นข้อมูลไปยังคอมพิวเตอร์

140
00:06:49,510 --> 00:06:53,410
>> เป็นเช่นพวงของไฟล์
ที่มีหนังสือภาษาอังกฤษ

141
00:06:53,410 --> 00:06:56,190
บางทีนั่นอาจเป็นวิธีหนึ่งที่คุณ
อาจจะสอน

142
00:06:56,190 --> 00:06:57,850
คอมพิวเตอร์ภาษาอังกฤษใช่ไหม

143
00:06:57,850 --> 00:07:01,000
และในความเป็นจริงถ้าคุณคิดเกี่ยวกับมัน
ก็จะใช้เวลาที่คุณอาจจะไม่กี่

144
00:07:01,000 --> 00:07:02,680
วันในการอ่านหนังสือ

145
00:07:02,680 --> 00:07:05,760
สำหรับเครื่องคอมพิวเตอร์ที่จะใช้เวลาสองถึง
ดูคำทั้งหมดที่อยู่ในหนังสือ

146
00:07:05,760 --> 00:07:10,810
เพื่อให้คุณสามารถคิดว่าอาจจะมีเพียงแค่นี้
ข้อโต้แย้งของการป้อนข้อมูลจากรอบ ๆ ตัวคุณ

147
00:07:10,810 --> 00:07:15,440
ที่ไม่เพียงพอที่จะบอกว่าที่
สิ่งที่มนุษย์สามารถทำได้

148
00:07:15,440 --> 00:07:17,680
คุณสามารถคิดคอมพิวเตอร์
นอกจากนี้ยังสามารถได้รับข้อมูล

149
00:07:17,680 --> 00:07:21,170
>> สิ่งที่สองคือว่าเจ้าของภาษา
ยังมีสมองที่มี

150
00:07:21,170 --> 00:07:23,870
ความสามารถในการเรียนรู้ภาษา

151
00:07:23,870 --> 00:07:27,020
แต่ถ้าคุณคิดเกี่ยวกับมัน
สมองเป็นสิ่งที่มั่นคง

152
00:07:27,020 --> 00:07:30,450
เมื่อคุณจะเกิดมาก็ตั้งแล้ว -

153
00:07:30,450 --> 00:07:31,320
นี้เป็นสมองของคุณ

154
00:07:31,320 --> 00:07:34,660
และในขณะที่คุณโตขึ้นคุณก็จะได้รับเพิ่มเติม
ใส่ของภาษาและสารอาหารที่อาจจะ

155
00:07:34,660 --> 00:07:35,960
และสิ่งอื่น ๆ

156
00:07:35,960 --> 00:07:38,170
สวยมาก แต่สมองของคุณ
เป็นสิ่งที่มั่นคง

157
00:07:38,170 --> 00:07:41,290
>> เพื่อให้คุณสามารถพูดได้ว่าดีบางทีคุณอาจจะสามารถ
สร้างคอมพิวเตอร์ที่มีพวงของ

158
00:07:41,290 --> 00:07:45,890
ฟังก์ชั่นและวิธีการที่เพียงแค่เลียนแบบ
ความสามารถในการเรียนรู้ภาษา

159
00:07:45,890 --> 00:07:49,630
ดังนั้นในแง่ที่ว่าคุณอาจจะบอกว่าดีฉัน
สามารถมีเครื่องคอมพิวเตอร์ที่มีทั้งหมด

160
00:07:49,630 --> 00:07:52,270
สิ่งที่ฉันจำเป็นต้องเรียนรู้ภาษา

161
00:07:52,270 --> 00:07:56,200
และสิ่งสุดท้ายคือการที่ชาวพื้นเมือง
ลำโพงเรียนรู้จากการทดลองและข้อผิดพลาด

162
00:07:56,200 --> 00:08:01,090
ดังนั้นโดยทั่วไปอีกหนึ่งสิ่งที่สำคัญในการ
การเรียนรู้ภาษาที่คุณชนิด

163
00:08:01,090 --> 00:08:05,340
ของเรียนรู้สิ่งโดยการ
ภาพรวมของสิ่งที่คุณได้ยิน

164
00:08:05,340 --> 00:08:10,280
>> เพื่อที่คุณจะเติบโตขึ้นมาคุณได้เรียนรู้ว่า
คำบางคำมีมากขึ้นเช่นคำนาม

165
00:08:10,280 --> 00:08:11,820
บางคนอื่น ๆ ที่มีคำคุณศัพท์

166
00:08:11,820 --> 00:08:14,250
และคุณไม่จำเป็นต้องมี
ความรู้เกี่ยวกับภาษาศาสตร์

167
00:08:14,250 --> 00:08:15,040
ต้องเข้าใจว่า

168
00:08:15,040 --> 00:08:18,560
แต่คุณก็รู้ว่ามีคำบางคำ
ถูกวางตำแหน่งในส่วนของบางอย่าง

169
00:08:18,560 --> 00:08:22,570
ประโยคและบางคนอื่น ๆ ในที่อื่น
ชิ้นส่วนของประโยค

170
00:08:22,570 --> 00:08:26,110
>> และที่ว่าเมื่อคุณทำสิ่งที่เป็น
เช่นประโยคที่ไม่ถูกต้อง -

171
00:08:26,110 --> 00:08:28,770
อาจจะเป็นเพราะลักษณะทั่วไปกว่า
เช่น

172
00:08:28,770 --> 00:08:32,210
บางทีเมื่อคุณเติบโตขึ้นคุณสังเกตเห็น
ที่เป็นพหูพจน์โดยปกติจะเป็น

173
00:08:32,210 --> 00:08:35,809
ที่เกิดขึ้นโดยการใส่ S ที่
ในตอนท้ายของคำว่า

174
00:08:35,809 --> 00:08:40,042
และจากนั้นคุณพยายามที่จะทำพหูพจน์ของ
"กวาง" ขณะที่ "กวาง" หรือ "ฟัน" เป็น

175
00:08:40,042 --> 00:08:44,780
"ฟัน." ดังนั้นแล้วพ่อแม่ของคุณหรือ
ใครบางคนที่คุณแก้ไขและบอกว่าไม่มี

176
00:08:44,780 --> 00:08:49,020
พหูพจน์ของ "กวาง" เป็น "กวาง" และ
พหูพจน์ของ "ฟัน" เป็น "ฟัน." แล้วจึง

177
00:08:49,020 --> 00:08:50,060
คุณเรียนรู้สิ่งเหล่านั้น

178
00:08:50,060 --> 00:08:51,520
เพื่อให้คุณได้เรียนรู้จากการทดลองและความผิดพลาด

179
00:08:51,520 --> 00:08:53,100
>> แต่คุณยังสามารถทำเช่นนั้นได้
กับคอมพิวเตอร์

180
00:08:53,100 --> 00:08:55,310
คุณสามารถมีสิ่งที่เรียกว่า
การเรียนรู้เสริม

181
00:08:55,310 --> 00:08:58,560
ซึ่งเป็นพื้นเช่นให้
คอมพิวเตอร์รางวัลเมื่อใดก็ตามที่มันไม่

182
00:08:58,560 --> 00:08:59,410
บางสิ่งบางอย่างได้อย่างถูกต้อง

183
00:08:59,410 --> 00:09:04,710
และให้มันตรงข้ามของรางวัล
และเมื่อมันไม่สิ่งที่ไม่ถูกต้อง

184
00:09:04,710 --> 00:09:07,410
จริงๆคุณสามารถเห็นได้ว่าถ้าคุณไป
ไปที่ Google แปลและคุณพยายามที่จะ

185
00:09:07,410 --> 00:09:10,220
แปลประโยคมัน
ขอให้คุณสำหรับข้อมูล

186
00:09:10,220 --> 00:09:13,240
ดังนั้นถ้าคุณจะพูดว่าโอ้มีดีกว่าที่
แปลประโยคนี้

187
00:09:13,240 --> 00:09:18,140
คุณสามารถพิมพ์มันขึ้นมาและจากนั้นถ้าเป็นจำนวนมาก
คนให้บอกว่าจะดีกว่า

188
00:09:18,140 --> 00:09:21,560
แปลก็แค่รู้ว่ามัน
ควรใช้การแปลที่แทน

189
00:09:21,560 --> 00:09:22,960
หนึ่งก็คือการให้

190
00:09:22,960 --> 00:09:28,830
>> ดังนั้นจึงเป็นคำถามปรัชญามาก
เพื่อดูว่าคอมพิวเตอร์ที่เป็นไปได้

191
00:09:28,830 --> 00:09:30,340
สามารถที่จะพูดคุยหรือไม่ในอนาคต

192
00:09:30,340 --> 00:09:34,440
แต่ฉันมีความหวังสูงที่พวกเขาสามารถ
เพียงแค่ขึ้นอยู่กับข้อโต้แย้งเหล่านั้น

193
00:09:34,440 --> 00:09:38,570
แต่มันเป็นเพียงมากขึ้นของปรัชญา
คำถาม

194
00:09:38,570 --> 00:09:43,460
>> ดังนั้นในขณะที่คอมพิวเตอร์ยังไม่สามารถพูดคุย
สิ่งที่เราสามารถทำได้หรือไม่

195
00:09:43,460 --> 00:09:47,070
บางสิ่งที่เย็นจริงๆ
การจัดหมวดหมู่ข้อมูล

196
00:09:47,070 --> 00:09:53,210
ดังนั้นสำหรับตัวอย่างเช่นที่พวกคุณรู้
บริการอีเมลที่ทำสำหรับ

197
00:09:53,210 --> 00:09:55,580
ตัวอย่างเช่นการกรองสแปม

198
00:09:55,580 --> 00:09:59,070
ดังนั้นเมื่อใดก็ตามที่คุณได้รับสแปม
พยายามที่จะกรองกล่องอื่น

199
00:09:59,070 --> 00:10:00,270
ดังนั้นวิธีที่จะทำเช่นนั้น

200
00:10:00,270 --> 00:10:06,080
มันไม่เหมือนคอมพิวเตอร์เพียงแค่รู้
สิ่งที่อยู่อีเมลที่มีการส่งสแปม

201
00:10:06,080 --> 00:10:09,130
ดังนั้นจึงขึ้นอยู่กับเนื้อหาของ
ข้อความหรืออาจจะชื่อเรื่องหรือ

202
00:10:09,130 --> 00:10:11,310
อาจจะรูปแบบบางอย่างที่คุณมี

203
00:10:11,310 --> 00:10:15,690
>> ดังนั้นโดยทั่วไปสิ่งที่คุณสามารถทำได้คือการได้รับ
ข้อมูลจำนวนมากของอีเมลที่เป็นสแปม

204
00:10:15,690 --> 00:10:19,980
อีเมลที่ไม่ได้สแปมและเรียนรู้สิ่งที่
ชนิดของรูปแบบที่คุณมีใน

205
00:10:19,980 --> 00:10:21,000
คนที่มีสแปม

206
00:10:21,000 --> 00:10:23,260
และนี่คือส่วนหนึ่งของการคำนวณ
ภาษาศาสตร์

207
00:10:23,260 --> 00:10:24,720
มันเรียกว่าการจัดหมวดหมู่ข้อมูล

208
00:10:24,720 --> 00:10:28,100
และเรากำลังจริงจะไปดู
ตัวอย่างที่อยู่ในสไลด์ถัดไป

209
00:10:28,100 --> 00:10:32,910
>> สิ่งที่สองคือภาษาธรรมชาติ
การประมวลผลซึ่งเป็นสิ่งที่

210
00:10:32,910 --> 00:10:36,580
ค้นหากราฟจะทำของให้
คุณเขียนประโยค

211
00:10:36,580 --> 00:10:38,690
และมันก็ไว้ใจคุณเข้าใจสิ่งที่
คือความหมายและให้

212
00:10:38,690 --> 00:10:39,940
คุณผลที่ดีกว่า

213
00:10:39,940 --> 00:10:43,880
ที่จริงถ้าคุณไปที่ Google หรือ Bing
และคุณสามารถค้นหาสิ่งที่ชอบเลดี้

214
00:10:43,880 --> 00:10:47,060
ความสูงของกาก้า, คุณกำลังจะเป็นจริง
ที่จะได้รับ 5 '1 "แทนข้อมูล

215
00:10:47,060 --> 00:10:50,170
จากเธอจริงเพราะมันเข้าใจ
สิ่งที่คุณกำลังพูดถึง

216
00:10:50,170 --> 00:10:52,140
เพื่อให้เป็นส่วนหนึ่งของธรรมชาติ
การประมวลผลภาษา

217
00:10:52,140 --> 00:10:57,000
>> หรือเมื่อคุณกำลังใช้สิริแรก
คุณมีขั้นตอนวิธีการที่พยายามที่จะ

218
00:10:57,000 --> 00:11:01,130
แปลสิ่งที่คุณพูด
เป็นคำในข้อความ

219
00:11:01,130 --> 00:11:03,690
แล้วก็พยายามที่จะแปล
ที่เป็นความหมาย

220
00:11:03,690 --> 00:11:06,570
ดังนั้นนั่นคือทั้งหมดที่เป็นส่วนหนึ่งของธรรมชาติ
การประมวลผลภาษา

221
00:11:06,570 --> 00:11:08,320
>> แล้วคุณมีเครื่องแปลภาษา -

222
00:11:08,320 --> 00:11:10,300
ซึ่งเป็นจริงอย่างใดอย่างหนึ่ง
รายการโปรดของฉัน -

223
00:11:10,300 --> 00:11:14,060
ซึ่งเป็นเพียงการแปลจาก
ภาษาอื่น

224
00:11:14,060 --> 00:11:17,950
เพื่อให้คุณสามารถคิดว่าเมื่อคุณกำลังทำ
เครื่องแปลภาษาที่คุณต้อง

225
00:11:17,950 --> 00:11:19,750
เป็นไปได้ไม่มีที่สิ้นสุดของประโยค

226
00:11:19,750 --> 00:11:22,960
จึงมีวิธีการจัดเก็บเพียงไม่
ทุกแปลเดียว

227
00:11:22,960 --> 00:11:27,440
ดังนั้นคุณต้องมากับที่น่าสนใจ
ขั้นตอนวิธีการที่จะสามารถ

228
00:11:27,440 --> 00:11:30,110
แปลทุกเดียว
ประโยคในบางวิธี

229
00:11:30,110 --> 00:11:32,483
>> พวกคุณมีคำถามใด ๆ เพื่อให้ห่างไกล

230
00:11:32,483 --> 00:11:34,450
ไม่ได้หรือไม่

231
00:11:34,450 --> 00:11:34,830
ตกลง

232
00:11:34,830 --> 00:11:36,900
>> ดังนั้นสิ่งที่เราจะได้เห็นในวันนี้

233
00:11:36,900 --> 00:11:39,300
แรกของทั้งหมดที่ฉันจะพูดคุยเกี่ยวกับ
ปัญหาการจัดหมวดหมู่

234
00:11:39,300 --> 00:11:41,440
ดังนั้นสิ่งหนึ่งที่ฉันเป็น
พูดเกี่ยวกับสแปม

235
00:11:41,440 --> 00:11:46,820
สิ่งที่ฉันจะทำคือเนื้อเพลงที่กำหนด
เพลงที่คุณสามารถพยายามที่จะคิดออก

236
00:11:46,820 --> 00:11:49,810
มีโอกาสสูง
ที่เป็นนักร้องหรือไม่

237
00:11:49,810 --> 00:11:53,590
สมมติว่าผมมีเพลงจากเลดี้
กาก้าและ Katy Perry, ถ้าฉันให้คุณ

238
00:11:53,590 --> 00:11:58,130
เพลงใหม่ที่คุณสามารถคิดออกว่า
มัน Katy Perry หรือ Lady Gaga?

239
00:11:58,130 --> 00:12:01,490
>> คนที่สองฉันแค่จะไปพูดคุย
เกี่ยวกับปัญหาการแบ่งส่วน

240
00:12:01,490 --> 00:12:05,780
ดังนั้นผมจึงไม่ทราบว่าพวกคุณรู้ แต่
จีน, ญี่ปุ่น, อื่น ๆ ในเอเชียตะวันออก

241
00:12:05,780 --> 00:12:08,090
ภาษาและภาษาอื่น ๆ
โดยทั่วไปไม่ได้

242
00:12:08,090 --> 00:12:09,830
ช่องว่างระหว่างคำ

243
00:12:09,830 --> 00:12:13,540
แล้วถ้าคุณคิดเกี่ยวกับวิธีการที่
ชนิดเครื่องคอมพิวเตอร์ของคุณพยายามที่จะ

244
00:12:13,540 --> 00:12:18,600
เข้าใจการประมวลผลภาษาธรรมชาติ
มันมีลักษณะที่เป็นคำพูดและ

245
00:12:18,600 --> 00:12:21,500
พยายามที่จะเข้าใจความสัมพันธ์
ระหว่างพวกเขาใช่มั้ย

246
00:12:21,500 --> 00:12:25,440
แต่แล้วถ้าคุณมีจีนและคุณ
มีศูนย์การเว้นวรรคเป็นจริงยากที่จะ

247
00:12:25,440 --> 00:12:28,360
หาสิ่งที่เป็นความสัมพันธ์ระหว่าง
คำเพราะพวกเขาไม่ได้มี

248
00:12:28,360 --> 00:12:29,530
คำในตอนแรก

249
00:12:29,530 --> 00:12:32,600
ดังนั้นคุณต้องทำสิ่งที่เรียกว่า
การแบ่งส่วนซึ่งก็หมายถึงการวาง

250
00:12:32,600 --> 00:12:36,490
ช่องว่างระหว่างสิ่งที่เราต้องการโทร
คำในภาษาเหล่านั้น

251
00:12:36,490 --> 00:12:37,740
ทำให้รู้สึก

252
00:12:37,740 --> 00:12:39,680

253
00:12:39,680 --> 00:12:41,540
>> แล้วเรากำลังจะ
พูดคุยเกี่ยวกับไวยากรณ์

254
00:12:41,540 --> 00:12:44,050
ดังนั้นเพียงแค่นิด ๆ หน่อย ๆ เกี่ยวกับธรรมชาติ
การประมวลผลภาษา

255
00:12:44,050 --> 00:12:45,420
มันจะเป็นเพียงแค่ภาพรวม

256
00:12:45,420 --> 00:12:50,700
ดังนั้นวันนี้เป็นสิ่งที่ฉันต้องการจะทำ
ที่ให้คุณผู้ชายเล็กน้อย

257
00:12:50,700 --> 00:12:53,930
ด้านในของสิ่งที่เป็นไปได้
ที่คุณสามารถทำอะไรกับคอมพิวเตอร์

258
00:12:53,930 --> 00:12:54,960
ภาษาศาสตร์

259
00:12:54,960 --> 00:13:00,410
และแล้วคุณจะเห็นสิ่งที่คุณคิด
เป็นเย็นในสิ่งเหล่านั้น

260
00:13:00,410 --> 00:13:02,270
และบางทีคุณอาจจะคิดว่าโครงการ
และมาพูดคุยกับผม

261
00:13:02,270 --> 00:13:05,260
และผมสามารถให้คำแนะนำ
เกี่ยวกับวิธีการที่จะใช้มัน

262
00:13:05,260 --> 00:13:09,060
>> ดังนั้นรูปแบบที่เป็นไปได้นิด ๆ หน่อย ๆ
เกี่ยวกับการค้นหากราฟและเครื่อง

263
00:13:09,060 --> 00:13:09,670
การแปล

264
00:13:09,670 --> 00:13:13,650
ฉันแค่จะให้ตัวอย่างของวิธีการ
คุณสามารถยกตัวอย่างเช่นการแปล

265
00:13:13,650 --> 00:13:16,020
อะไรบางอย่างจากภาษาโปรตุเกสเป็นภาษาอังกฤษ

266
00:13:16,020 --> 00:13:17,830
เสียงดี?

267
00:13:17,830 --> 00:13:19,293
>> ดังนั้นครั้งแรกที่ปัญหาการจัดหมวดหมู่

268
00:13:19,293 --> 00:13:23,590
ฉันจะบอกว่าเป็นส่วนหนึ่งของการสัมมนานี้
เป็นไปได้ที่ท้าทายที่สุด

269
00:13:23,590 --> 00:13:27,560
อย่างใดอย่างหนึ่งเพียงเพราะมีจะ
จะมีบางรหัส

270
00:13:27,560 --> 00:13:29,470
แต่มันจะเป็นงูหลาม

271
00:13:29,470 --> 00:13:34,380
ฉันรู้ว่าพวกคุณไม่ทราบว่างูหลามดังนั้น
ฉันแค่จะอธิบายไว้ในที่สูง

272
00:13:34,380 --> 00:13:35,750
ระดับสิ่งที่ฉันทำ

273
00:13:35,750 --> 00:13:40,900
และคุณไม่ต้องดูแลมากเกินไป
มากเกี่ยวกับไวยากรณ์เพราะนั่นคือ

274
00:13:40,900 --> 00:13:42,140
สิ่งที่พวกคุณสามารถเรียนรู้

275
00:13:42,140 --> 00:13:42,540
OK?

276
00:13:42,540 --> 00:13:43,580
เสียงดี

277
00:13:43,580 --> 00:13:46,020
>> ดังนั้นสิ่งที่เป็นปัญหาการจัดหมวดหมู่หรือไม่

278
00:13:46,020 --> 00:13:49,140
ดังนั้นคุณจะได้รับเนื้อเพลงบาง
เพลงและคุณต้องการที่จะคาดเดา

279
00:13:49,140 --> 00:13:50,620
ที่มีการร้องเพลง

280
00:13:50,620 --> 00:13:54,045
และนี้สามารถเป็นชนิดใด
ของปัญหาอื่น ๆ

281
00:13:54,045 --> 00:13:59,980
เพื่อที่จะสามารถยกตัวอย่างเช่นคุณมี
ประธานาธิบดีและคุณมี

282
00:13:59,980 --> 00:14:02,610
การพูดและคุณต้องการที่จะหา
ออกมาถ้ามันเป็นเช่น

283
00:14:02,610 --> 00:14:04,470
โอบามาหรือนวมรอมนีย์

284
00:14:04,470 --> 00:14:07,700
หรือคุณสามารถมีพวงของอีเมลและ
คุณต้องการที่จะคิดออกว่าพวกเขาเป็น

285
00:14:07,700 --> 00:14:08,890
สแปมหรือไม่

286
00:14:08,890 --> 00:14:11,440
ดังนั้นมันจึงเป็นเพียงการแบ่งบาง
ข้อมูลตามคำ

287
00:14:11,440 --> 00:14:13,790
ที่คุณต้องมี

288
00:14:13,790 --> 00:14:16,295
>> ดังนั้นจะทำอย่างไรที่คุณจะต้อง
ทำให้สมมติฐานบางอย่าง

289
00:14:16,295 --> 00:14:20,570
ดังนั้นจำนวนมากเกี่ยวกับภาษาศาสตร์
คือการทำให้สมมติฐาน

290
00:14:20,570 --> 00:14:24,100
สมมติฐานมักจะสมาร์ทเพื่อให้
คุณจะได้รับผลลัพธ์ที่ดี

291
00:14:24,100 --> 00:14:26,670
พยายามที่จะสร้างแบบจำลองสำหรับมัน

292
00:14:26,670 --> 00:14:31,290
แล้วลองมันออกมาและดูว่าการทำงาน
ถ้ามันจะช่วยให้คุณมีความแม่นยำที่ดี

293
00:14:31,290 --> 00:14:33,940
และถ้าไม่แล้วคุณ
พยายามที่จะปรับปรุงมัน

294
00:14:33,940 --> 00:14:37,640
ถ้าไม่ได้คุณก็เหมือนตกลงบางทีฉัน
ควรจะทำให้สมมติฐานที่แตกต่างกัน

295
00:14:37,640 --> 00:14:44,030
>> ดังนั้นสมมติฐานที่เรากำลังจะ
ให้เป็นศิลปินที่มักจะร้องเพลง

296
00:14:44,030 --> 00:14:49,220
เกี่ยวกับหัวข้อที่หลายครั้งและอาจจะ
ใช้คำพูดหลายครั้งเพียงแค่

297
00:14:49,220 --> 00:14:50,270
เพราะพวกเขากำลังใช้มัน

298
00:14:50,270 --> 00:14:51,890
คุณก็สามารถคิดของเพื่อนของคุณ

299
00:14:51,890 --> 00:14:57,350
ฉันแน่ใจว่าพวกคุณทุกคนมีเพื่อน
วลีที่บอกว่าลายเซ็นของพวกเขา

300
00:14:57,350 --> 00:14:59,260
แท้จริงสำหรับทุกประโยคเดียว -

301
00:14:59,260 --> 00:15:02,660
เช่นบางคำที่เฉพาะเจาะจงหรือเฉพาะบางส่วน
วลีที่ว่าพวกเขากล่าวว่าสำหรับ

302
00:15:02,660 --> 00:15:04,020
ทุกประโยคเดียว

303
00:15:04,020 --> 00:15:07,920
>> และสิ่งที่คุณสามารถพูดได้ก็คือว่าถ้าคุณเห็น
ประโยคที่มีลายเซ็น

304
00:15:07,920 --> 00:15:11,450
วลีที่คุณสามารถเดาว่าน่าจะเป็น
เพื่อนของคุณเป็น

305
00:15:11,450 --> 00:15:13,310
หนึ่งบอกว่ามันใช่มั้ย

306
00:15:13,310 --> 00:15:18,410
ดังนั้นคุณจึงทำให้สันนิษฐานว่าแล้ว
ว่าเป็นวิธีที่คุณสร้างแบบจำลอง

307
00:15:18,410 --> 00:15:24,440
>> ตัวอย่างที่ผมจะให้อยู่ใน
วิธีของเลดี้กาก้ายกตัวอย่างเช่นคน

308
00:15:24,440 --> 00:15:27,430
บอกว่าเธอใช้ "ทารก" สำหรับการ
ของเธอจำนวนหนึ่งเพลงทั้งหมด

309
00:15:27,430 --> 00:15:32,270
และที่จริงนี้เป็นวิดีโอที่แสดงให้เห็นว่า
เธอบอกว่าคำว่า "เด็ก" สำหรับการ

310
00:15:32,270 --> 00:15:33,410
เพลงที่แตกต่างกัน

311
00:15:33,410 --> 00:15:33,860
>> [วิดีโอเล่นภาพ]

312
00:15:33,860 --> 00:15:34,310
>> - (ร้องเพลง) เด็ก

313
00:15:34,310 --> 00:15:36,220
ทารก

314
00:15:36,220 --> 00:15:37,086
ทารก

315
00:15:37,086 --> 00:15:37,520
ทารก

316
00:15:37,520 --> 00:15:37,770
ทารก

317
00:15:37,770 --> 00:15:38,822
ทารก

318
00:15:38,822 --> 00:15:39,243
ทารก

319
00:15:39,243 --> 00:15:40,085
ทารก

320
00:15:40,085 --> 00:15:40,510
ทารก

321
00:15:40,510 --> 00:15:40,850
ทารก

322
00:15:40,850 --> 00:15:41,090
>> [จบเล่นวิดีโอ-

323
00:15:41,090 --> 00:15:44,020
>> LUCAS FREITAS: จึงมีผมคิดว่า
40 เพลงที่นี่ในการที่เธอบอกว่า

324
00:15:44,020 --> 00:15:48,690
คำว่า "ลูก". เพื่อให้คุณโดยทั่วไปสามารถคาดเดาได้
ว่าถ้าคุณเห็นเพลงที่มี

325
00:15:48,690 --> 00:15:52,180
คำว่า "ลูก" มีบางสูง
ความน่าจะเป็นว่ามันเป็นของเลดี้กาก้า

326
00:15:52,180 --> 00:15:56,450
แต่ให้พยายามที่จะพัฒนานี้
ต่อไปอีกอย่างเป็นทางการ

327
00:15:56,450 --> 00:16:00,470
>> ดังนั้นเหล่านี้เป็นเนื้อเพลงเพลง
ของเลดี้กาก้าและ Katy Perry

328
00:16:00,470 --> 00:16:04,120
เพื่อให้คุณดู Lady Gaga คุณจะเห็นพวกเขา
มีจำนวนมากเกิดขึ้นของ "เด็ก"

329
00:16:04,120 --> 00:16:07,710
จำนวนมากเกิดขึ้นของ "วิธีการ". แล้วจึง
Katy Perry มีจำนวนมากเกิดขึ้นของ

330
00:16:07,710 --> 00:16:10,360
"," จำนวนมากเกิดขึ้นของ "ไฟ."

331
00:16:10,360 --> 00:16:14,560
>> ดังนั้นโดยทั่วไปสิ่งที่เราต้องการ
ไม่เป็นที่คุณจะได้รับบทกวี

332
00:16:14,560 --> 00:16:20,480
สมมติว่าคุณจะได้รับบทเป็น
เพลงที่เป็น "ลูก" แค่ "ลูก." ถ้า

333
00:16:20,480 --> 00:16:24,750
คุณเพิ่งได้รับคำว่า "ลูก" และนี้
คือข้อมูลทั้งหมดที่คุณได้จาก

334
00:16:24,750 --> 00:16:27,880
ของเลดี้กาก้าและเคทีเพอร์รี่ที่จะ
คุณคิดว่าเป็นบุคคลที่

335
00:16:27,880 --> 00:16:29,370
ที่ร้องเพลงได้หรือไม่

336
00:16:29,370 --> 00:16:32,360
Lady Gaga หรือ Katy Perry?

337
00:16:32,360 --> 00:16:33,150
Lady Gaga ใช่ไหม

338
00:16:33,150 --> 00:16:37,400
เพราะเธอเป็นคนเดียวที่บอกว่า
"ทารก". นี้เสียงโง่ใช่มั้ย?

339
00:16:37,400 --> 00:16:38,760
ตกลงนี้เป็นเรื่องง่ายจริงๆ

340
00:16:38,760 --> 00:16:41,860
ฉันแค่มองหาที่สองเพลงและ
แน่นอนเธอเป็นคนเดียวที่มี

341
00:16:41,860 --> 00:16:42,660
"ทารก".

342
00:16:42,660 --> 00:16:44,740
>> แต่สิ่งที่ถ้าคุณมีพวงของคำหรือไม่

343
00:16:44,740 --> 00:16:50,900
หากคุณมีบางสิ่งบางอย่างที่เกิดขึ้นจริงบทกวี,
เช่น "ลูกฉัน

344
00:16:50,900 --> 00:16:51,610
ไปดู [? CFT?]

345
00:16:51,610 --> 00:16:54,020
บรรยาย "หรือสิ่งที่ต้องการและ
จริงๆแล้วคุณต้องคิดออก -

346
00:16:54,020 --> 00:16:55,780
ขึ้นอยู่กับคำทุกคน -

347
00:16:55,780 --> 00:16:58,350
ที่เป็นศิลปินที่น่าจะเป็น
ร้องเพลงนี้

348
00:16:58,350 --> 00:17:01,860
ดังนั้นเรามาพยายามที่จะพัฒนา
นี้ต่อไปเพียงเล็กน้อย

349
00:17:01,860 --> 00:17:05,630
>> ตกลงตามเพื่อเพียงบนพื้นฐานของข้อมูลที่เรา
ได้มันก็ดูเหมือนว่าน่าจะเป็นประสาท

350
00:17:05,630 --> 00:17:06,260
นักร้อง

351
00:17:06,260 --> 00:17:07,904
แต่วิธีการที่เราสามารถเขียน
นี้มากขึ้นอย่างเป็นทางการ?

352
00:17:07,904 --> 00:17:10,579

353
00:17:10,579 --> 00:17:13,140
และมีเป็นไปได้น้อย
บิตของสถ​​ิติ

354
00:17:13,140 --> 00:17:15,880
ดังนั้นถ้าคุณได้หายไปเพียงแค่ลอง
ที่จะเข้าใจแนวคิด

355
00:17:15,880 --> 00:17:18,700
มันไม่สำคัญว่าถ้าคุณเข้าใจ
สมสมบูรณ์ดี

356
00:17:18,700 --> 00:17:22,150
นี่คือทั้งหมดที่จะเป็นออนไลน์

357
00:17:22,150 --> 00:17:25,490
>> ดังนั้นโดยทั่วไปสิ่งที่ฉันคำนวณเป็น
ความน่าจะเป็นว่าเพลงนี้คือ

358
00:17:25,490 --> 00:17:28,040
Lady Gaga ที่กำหนดว่า -

359
00:17:28,040 --> 00:17:30,660
ดังนั้นแถบนี้หมายถึงการกำหนดว่า -

360
00:17:30,660 --> 00:17:33,680
ผมเห็นคำว่า "ลูก".
ไม่ที่ทำให้รู้สึก?

361
00:17:33,680 --> 00:17:35,540
ดังนั้นฉันพยายามที่จะคำนวณ
น่าจะเป็นที่

362
00:17:35,540 --> 00:17:38,540
>> จึงมีความเชื่อที่เรียกว่านี้
Bayes ทฤษฎีบทที่บอกว่า

363
00:17:38,540 --> 00:17:43,330
น่าจะเป็นของที่ได้รับ B เป็น
น่าจะเป็นของ B ที่กำหนดเวลา

364
00:17:43,330 --> 00:17:47,660
น่าจะเป็นของกว่าความน่าจะเป็น
ของบีนี่คือสมการยาว

365
00:17:47,660 --> 00:17:51,970
แต่สิ่งที่คุณต้องเข้าใจจาก
ที่ว่านี้คือสิ่งที่ฉันต้องการ

366
00:17:51,970 --> 00:17:52,830
คำนวณใช่ไหม

367
00:17:52,830 --> 00:17:56,570
ดังนั้นความน่าจะเป็นว่าเพลงที่เป็นโดย
Lady Gaga ให้ที่ฉันได้เห็นคำว่า

368
00:17:56,570 --> 00:17:58,230
"ทารก".

369
00:17:58,230 --> 00:18:02,960
>> และตอนนี้สิ่งที่ฉันได้รับเป็น
น่าจะเป็นของคำว่า "ลูก" ที่ได้รับ

370
00:18:02,960 --> 00:18:04,390
ที่ฉันมีของเลดี้กาก้า

371
00:18:04,390 --> 00:18:07,220
และว่าสิ่งที่พื้น?

372
00:18:07,220 --> 00:18:10,500
สิ่งที่หมายถึงว่าเป็นสิ่งที่เป็น
ความน่าจะเป็นของการได้เห็นคำว่า "ลูก"

373
00:18:10,500 --> 00:18:12,130
ในเนื้อเพลงทึ่ม?

374
00:18:12,130 --> 00:18:16,240
ถ้าผมต้องการที่จะคำนวณว่าในมาก
วิธีง่ายๆก็เพียงจำนวน

375
00:18:16,240 --> 00:18:23,640
ครั้งที่ผมเห็น "ทารก" เหนือจำนวน
ของคำในเนื้อเพลงทึ่มใช่ไหม

376
00:18:23,640 --> 00:18:27,600
เป็นความถี่ที่ฉันเห็นสิ่งที่
คำว่าในการทำงานของกาก้า?

377
00:18:27,600 --> 00:18:30,530
ทำให้รู้สึก

378
00:18:30,530 --> 00:18:33,420
>> ระยะที่สองคือ
น่าจะเป็นของประสาท

379
00:18:33,420 --> 00:18:34,360
สิ่งที่หมายความว่าอย่างไร

380
00:18:34,360 --> 00:18:38,550
ที่โดยทั่วไปหมายถึงสิ่งที่เป็น
น่าจะเป็นของการจัด

381
00:18:38,550 --> 00:18:40,690
เนื้อเพลงบางอย่างที่โง่?

382
00:18:40,690 --> 00:18:45,320
และที่เป็นชนิดของแปลก แต่
ให้คิดเช่น

383
00:18:45,320 --> 00:18:49,230
ดังนั้นขอบอกว่าน่าจะเป็นของ
มี "ลูก" ในเพลงเดียวกัน

384
00:18:49,230 --> 00:18:51,760
เพื่อทึ่มและ Britney Spears

385
00:18:51,760 --> 00:18:54,950
แต่ Britney Spears มีสองครั้ง
เพลงมากกว่าของเลดี้กาก้า

386
00:18:54,950 --> 00:19:00,570
ดังนั้นถ้ามีคนเพียงแค่การสุ่มจะช่วยให้คุณ
เนื้อเพลงของ "ทารก" สิ่งแรกที่คุณ

387
00:19:00,570 --> 00:19:04,710
ดูเป็นสิ่งที่น่าจะเป็นของ
มี "ลูก" ในเพลงทึ่ม "ทารก"

388
00:19:04,710 --> 00:19:05,410
ในเพลงบริทนี?

389
00:19:05,410 --> 00:19:06,460
และมันก็เป็นสิ่งเดียวกัน

390
00:19:06,460 --> 00:19:10,040
>> ดังนั้นสิ่งที่สองที่คุณจะเห็นคือ
ดีสิ่งที่เป็นความน่าจะเป็นของ

391
00:19:10,040 --> 00:19:13,770
บทกวีนี้ด้วยตัวเองเป็นบทกวีกาก้า,
และเป็นสิ่งที่น่าจะเป็นของ

392
00:19:13,770 --> 00:19:15,380
เป็นบทกวี Britney?

393
00:19:15,380 --> 00:19:18,950
ดังนั้นตั้งแต่บริทนีเพื่อให้มีเพลงอื่น ๆ อีกมากมาย
กว่ากาก้าที่คุณจะอาจ

394
00:19:18,950 --> 00:19:21,470
พูดดีนี้อาจจะเป็น
บทกวีบริทนี

395
00:19:21,470 --> 00:19:23,340
ดังนั้นที่ว่าทำไมเรามีนี้
ระยะที่นี่

396
00:19:23,340 --> 00:19:24,670
น่าจะเป็นของประสาท

397
00:19:24,670 --> 00:19:26,950
ทำให้รู้สึก?

398
00:19:26,950 --> 00:19:28,660
ไม่ได้หรือไม่

399
00:19:28,660 --> 00:19:29,370
ตกลง

400
00:19:29,370 --> 00:19:33,500
>> และคนสุดท้ายเป็นเพียงความน่าจะเป็น
ของ "เด็ก" ซึ่งไม่ได้

401
00:19:33,500 --> 00:19:34,810
จริงๆเรื่องที่มาก

402
00:19:34,810 --> 00:19:39,940
แต่มันก็น่าจะเป็นของ
เห็น "เด็ก" ในภาษาอังกฤษ

403
00:19:39,940 --> 00:19:42,725
เรามักจะไม่สนใจว่า
มากเกี่ยวกับคำว่า

404
00:19:42,725 --> 00:19:44,490
ไม่ที่ทำให้รู้สึก?

405
00:19:44,490 --> 00:19:48,110
ดังนั้นน่าจะเป็นของกาก้าเป็น
เรียกว่าน่าจะเป็นก่อน

406
00:19:48,110 --> 00:19:49,530
ของทึ่มชั้น

407
00:19:49,530 --> 00:19:53,840
เพราะมันก็หมายความว่าสิ่งที่เป็น
ความน่าจะเป็นของการมีชั้นเรียนที่ -

408
00:19:53,840 --> 00:19:55,520
ซึ่งเป็นทึ่ม -

409
00:19:55,520 --> 00:19:59,350
เพียงในทั่วไปเพียง
โดยไม่มีเงื่อนไข

410
00:19:59,350 --> 00:20:02,560
>> และจากนั้นเมื่อฉันมีความน่าจะเป็นของ
กาก้าได้รับ "ทารก" เราเรียกมันว่าบวก

411
00:20:02,560 --> 00:20:06,160
teary น่าจะเป็นเพราะมันเป็น
ความน่าจะเป็นของการมี

412
00:20:06,160 --> 00:20:08,300
กาก้าได้รับหลักฐานบางอย่าง

413
00:20:08,300 --> 00:20:11,050
ดังนั้นฉันให้คุณหลักฐาน
ที่ผมเห็นลูกคำและ

414
00:20:11,050 --> 00:20:12,690
เพลงที่ทำให้รู้สึก

415
00:20:12,690 --> 00:20:15,960

416
00:20:15,960 --> 00:20:16,410
ตกลง

417
00:20:16,410 --> 00:20:22,400
>> ดังนั้นถ้าผมคำนวณว่าสำหรับแต่ละ
ของเพลงเลดี้กาก้า,

418
00:20:22,400 --> 00:20:25,916
สิ่งที่จะเป็น -

419
00:20:25,916 --> 00:20:27,730
เห็นได้ชัดว่าฉันไม่สามารถย้ายนี้

420
00:20:27,730 --> 00:20:31,850

421
00:20:31,850 --> 00:20:36,920
น่าจะเป็นของกาก้าจะเป็น
สิ่งที่ต้องการ 2 กว่า 24 ครั้งที่ 1/2,

422
00:20:36,920 --> 00:20:38,260
2 กว่า 53

423
00:20:38,260 --> 00:20:40,640
มันไม่สำคัญว่าถ้าคุณรู้ว่าสิ่งที่
ตัวเลขเหล่านี้จะมาจาก

424
00:20:40,640 --> 00:20:44,750
แต่มันเป็นเพียงตัวเลขที่เป็นไป
จะมากกว่า 0 ใช่ไหม

425
00:20:44,750 --> 00:20:48,610
>> และจากนั้นเมื่อฉันทำ Katy Perry,
ความน่าจะเป็นของ "ลูก" ให้เคทีเป็น

426
00:20:48,610 --> 00:20:49,830
0 อยู่แล้วใช่มั้ย

427
00:20:49,830 --> 00:20:52,820
เพราะไม่มี "ทารก"
ใน Katy Perry

428
00:20:52,820 --> 00:20:56,360
ดังนั้นแล้วนี้จะกลายเป็น 0 และประสาท
ชนะซึ่งหมายความว่าทึ่ม

429
00:20:56,360 --> 00:20:57,310
อาจจะเป็นนักร้อง

430
00:20:57,310 --> 00:20:58,560
ไม่ที่ทำให้รู้สึก?

431
00:20:58,560 --> 00:21:00,700

432
00:21:00,700 --> 00:21:01,950
ตกลง

433
00:21:01,950 --> 00:21:04,160

434
00:21:04,160 --> 00:21:11,750
>> ดังนั้นถ้าผมต้องการที่จะทำให้เรื่องนี้อย่างเป็นทางการมากขึ้น
ที่จริงผมสามารถทำแบบจำลอง

435
00:21:11,750 --> 00:21:12,700
คำหลาย

436
00:21:12,700 --> 00:21:14,610
ดังนั้นขอบอกว่าฉันมีบางสิ่งบางอย่าง
เช่น "ลูกผม

437
00:21:14,610 --> 00:21:16,030
ไฟไหม้ "หรือบางสิ่งบางอย่าง

438
00:21:16,030 --> 00:21:17,760
ดังนั้นจึงมีหลายคำ

439
00:21:17,760 --> 00:21:20,880
และในกรณีนี้คุณจะเห็น
ว่า "ลูก" ที่อยู่ในประสาท

440
00:21:20,880 --> 00:21:21,710
แต่มันก็ไม่ได้อยู่ในเคที

441
00:21:21,710 --> 00:21:24,940
และ "ไฟ" ที่อยู่ในเคที แต่
มันไม่ได้อยู่ในประสาทใช่ไหม

442
00:21:24,940 --> 00:21:27,200
ดังนั้นจึงได้รับ trickier ใช่ไหม

443
00:21:27,200 --> 00:21:31,440
เพราะมันดูเหมือนว่าคุณเกือบ
มีการผูกระหว่างคนทั้งสอง

444
00:21:31,440 --> 00:21:36,980
>> ดังนั้นสิ่งที่คุณต้องทำคือการคิด
ความเป็นอิสระระหว่างคำ

445
00:21:36,980 --> 00:21:41,210
ดังนั้นโดยทั่วไปสิ่งที่หมายถึงคือ
ฉันแค่การคำนวณสิ่งที่เป็น

446
00:21:41,210 --> 00:21:44,330
ความน่าจะเป็นของการเห็น "ทารก" สิ่งที่เป็น
ความน่าจะเป็นของการเห็น "ฉัน" และ

447
00:21:44,330 --> 00:21:46,670
"am" และ "ใน" และ "ไฟ"
ทั้งหมดแยกกัน

448
00:21:46,670 --> 00:21:48,670
แล้วฉันคูณทั้งหมดของพวกเขา

449
00:21:48,670 --> 00:21:52,420
และฉันเห็นสิ่งที่เป็นความน่าจะเป็น
เห็นทั้งประโยค

450
00:21:52,420 --> 00:21:55,210
ทำให้รู้สึก

451
00:21:55,210 --> 00:22:00,270
>> ดังนั้นโดยทั่วไปถ้ามีเพียงหนึ่งคำ
สิ่งที่ฉันต้องการที่จะพบคือสูงสุดหาเรื่อง,

452
00:22:00,270 --> 00:22:05,385
ซึ่งหมายถึงสิ่งที่เป็นชั้นที่
ให้ฉันความน่าจะเป็นสูงสุด

453
00:22:05,385 --> 00:22:10,010
ดังนั้นสิ่งที่เป็นชั้นที่จะให้
ผมน่าจะเป็นสูงสุด

454
00:22:10,010 --> 00:22:11,940
ความน่าจะเป็นของชั้นเรียนให้คำ

455
00:22:11,940 --> 00:22:17,610
ดังนั้นในกรณีนี้กาก้าได้รับ "ลูก."
หรือเคทีได้รับ "ลูก." ทำให้รู้สึก

456
00:22:17,610 --> 00:22:21,040
>> และเพียงแค่จาก Bayes ที่
สมการที่ผมแสดงให้เห็น

457
00:22:21,040 --> 00:22:24,780
เราจะสร้างส่วนนี้

458
00:22:24,780 --> 00:22:28,750
สิ่งเดียวคือคุณจะเห็นว่า
น่าจะเป็นของคำที่กำหนด

459
00:22:28,750 --> 00:22:31,370
การเปลี่ยนแปลงระดับขึ้น
ในชั้นเรียนใช่มั้ย

460
00:22:31,370 --> 00:22:34,260
จำนวนของ "ลูก" ของที่ฉันมี
ในประสาทจะแตกต่างจากเคที

461
00:22:34,260 --> 00:22:37,640
ความน่าจะเป็นของการเรียนยัง
การเปลี่ยนแปลงเพราะมันเป็นเพียงตัวเลข

462
00:22:37,640 --> 00:22:39,740
ของเพลงที่แต่ละคนมี

463
00:22:39,740 --> 00:22:43,980
>> แต่ความน่าจะเป็นของคำที่ตัวเอง
เป็นไปได้เหมือนกันสำหรับทุก

464
00:22:43,980 --> 00:22:44,740
ศิลปินใช่มั้ย?

465
00:22:44,740 --> 00:22:47,150
ดังนั้นความน่าจะเป็นของคำว่าเป็น
เพียงแค่สิ่งที่เป็นความน่าจะเป็นของ

466
00:22:47,150 --> 00:22:49,820
เห็นคำว่า
ภาษาภาษาอังกฤษได้ไหม

467
00:22:49,820 --> 00:22:51,420
ดังนั้นจึงเป็นเหมือนกันสำหรับทั้งหมดของพวกเขา

468
00:22:51,420 --> 00:22:55,790
ดังนั้นตั้งแต่นี้เป็นค่าคงที่ที่เราสามารถทำได้เพียงแค่
ลดลงนี้และไม่สนใจเกี่ยวกับเรื่องนี้

469
00:22:55,790 --> 00:23:00,230
ดังนั้นนี้จะเป็นจริง
สมการที่เรากำลังมองหา

470
00:23:00,230 --> 00:23:03,360
>> และถ้าผมมีคำหลายคำที่ฉัน
ยังคงไปได้ก่อน

471
00:23:03,360 --> 00:23:04,610
ความน่าจะเป็นที่นี่

472
00:23:04,610 --> 00:23:06,980
สิ่งเดียวคือฉันคูณ
น่าจะเป็นของ

473
00:23:06,980 --> 00:23:08,490
ทุกคำอื่น ๆ

474
00:23:08,490 --> 00:23:10,110
ดังนั้นฉันคูณทั้งหมดของพวกเขา

475
00:23:10,110 --> 00:23:12,610
ทำให้รู้สึก

476
00:23:12,610 --> 00:23:18,440
มันดูแปลก ๆ แต่โดยทั่วไปหมายถึง
คำนวณก่อนของชั้นเรียนและ

477
00:23:18,440 --> 00:23:22,100
แล้วคูณด้วยความน่าจะเป็นของแต่ละ
คำที่อยู่ในชั้นเรียนที่

478
00:23:22,100 --> 00:23:24,620

479
00:23:24,620 --> 00:23:29,150
>> และคุณรู้ว่าน่าจะเป็นของ
คำที่กำหนดชั้นเรียนเป็นไปได้

480
00:23:29,150 --> 00:23:34,520
จำนวนครั้งที่คุณเห็นคำว่า
ชั้นเรียนที่หารด้วยจำนวนของ

481
00:23:34,520 --> 00:23:37,020
คำที่คุณมีในที่
ชั้นในทั่วไป

482
00:23:37,020 --> 00:23:37,990
ทำให้รู้สึก

483
00:23:37,990 --> 00:23:41,680
มันเป็นเพียงวิธีการที่ "เด็ก" เป็น 2 กว่า
จำนวนคำที่

484
00:23:41,680 --> 00:23:43,020
ฉันได้ในเนื้อเพลง

485
00:23:43,020 --> 00:23:45,130
ดังนั้นเพียงแค่ความถี่

486
00:23:45,130 --> 00:23:46,260
>> แต่มีสิ่งหนึ่งที่

487
00:23:46,260 --> 00:23:51,250
จำได้ว่าผมได้แสดงให้เห็นว่า
ความน่าจะเป็นของ "ทารก" เนื้อเพลงเป็น

488
00:23:51,250 --> 00:23:56,350
จาก Katy Perry เป็น 0 เพียงเพราะเคที
เพอร์รี่ไม่ได้มี "ลูก" ที่ทั้งหมดหรือไม่

489
00:23:56,350 --> 00:24:04,900
แต่เสียงเล็ก ๆ น้อย ๆ ที่รุนแรงที่จะเพียงแค่
เพียงแค่พูดว่าเนื้อเพลงไม่อาจได้มาจาก

490
00:24:04,900 --> 00:24:10,040
ศิลปินเพียงเพราะพวกเขาไม่ได้
คำว่าโดยเฉพาะอย่างยิ่งในเวลาใดก็ได้

491
00:24:10,040 --> 00:24:13,330
>> ดังนั้นคุณก็สามารถพูดได้ดีถ้าคุณ
ไม่ได้มีคำนี้ผมกำลังจะไป

492
00:24:13,330 --> 00:24:15,640
ทำให้คุณมีความน่าจะเป็นที่ต่ำกว่า
แต่ฉันก็ไม่ไป

493
00:24:15,640 --> 00:24:17,420
0 ให้ทันที

494
00:24:17,420 --> 00:24:21,040
เพราะบางทีมันอาจจะเป็นสิ่งที่ชอบ
"ไฟไหม้ไฟไหม้ไฟไหม้ไฟ" ซึ่งเป็น

495
00:24:21,040 --> 00:24:21,990
ทั้งหมด Katy Perry

496
00:24:21,990 --> 00:24:26,060
และ "เด็ก" และมันเพียงแค่ไปที่
0 ทันทีเพราะมีหนึ่ง

497
00:24:26,060 --> 00:24:27,250
"ทารก".

498
00:24:27,250 --> 00:24:31,440
>> ดังนั้นโดยทั่วไปสิ่งที่เราทำบางสิ่งบางอย่าง
ที่เรียกว่าเลซเรียบ

499
00:24:31,440 --> 00:24:36,260
และนี้ก็หมายความว่าฉันให้
ความน่าจะเป็นบางคนถึงกับคำว่า

500
00:24:36,260 --> 00:24:37,850
ที่ไม่อยู่

501
00:24:37,850 --> 00:24:43,170
ดังนั้นสิ่งที่ฉันทำคือการที่เมื่อฉัน
การคำนวณนี้ฉันมักจะเพิ่ม 1 ถึง

502
00:24:43,170 --> 00:24:44,180
เศษ

503
00:24:44,180 --> 00:24:48,060
ดังนั้นแม้ว่าคำว่าไม่อยู่ใน
กรณีนี้ถ้าเป็น 0, ฉันยังคง

504
00:24:48,060 --> 00:24:51,250
การคำนวณนี้เป็น 1 ในช่วง
จำนวนรวมของคำ

505
00:24:51,250 --> 00:24:55,060
มิฉะนั้นผมได้รับกี่คำ
ฉันมีและฉันเพิ่ม 1

506
00:24:55,060 --> 00:24:58,300
ดังนั้นฉันนับการทั้งสองกรณี

507
00:24:58,300 --> 00:25:00,430
ทำให้รู้สึก

508
00:25:00,430 --> 00:25:03,060
>> ดังนั้นตอนนี้ขอทำบางรหัส

509
00:25:03,060 --> 00:25:06,440
ฉันจะต้องทำมันสวยอย่างรวดเร็ว
แต่มันเป็นสิ่งสำคัญเพียงว่าคุณ

510
00:25:06,440 --> 00:25:08,600
ผู้ชายเข้าใจแนวคิด

511
00:25:08,600 --> 00:25:13,450
ดังนั้นสิ่งที่เรากำลังพยายามทำ
มีการดำเนินการนี​​้ว่า

512
00:25:13,450 --> 00:25:14,330
สิ่งที่ฉันกล่าวว่า -

513
00:25:14,330 --> 00:25:19,110
ฉันต้องการให้คุณใส่เนื้อเพลงจาก
ของเลดี้กาก้าและ Katy Perry

514
00:25:19,110 --> 00:25:22,980
และโปรแกรมที่เป็นไปเพื่อให้สามารถ
บอกว่าเนื้อเพลงใหม่เหล่านี้จะมาจากประสาท

515
00:25:22,980 --> 00:25:24,170
หรือ Katy Perry

516
00:25:24,170 --> 00:25:25,800
ทำให้รู้สึก

517
00:25:25,800 --> 00:25:27,530
ตกลง

518
00:25:27,530 --> 00:25:30,710
>> ดังนั้นผมจึงมีโปรแกรมที่ฉันจะนี้
ที่จะเรียก classify.py

519
00:25:30,710 --> 00:25:31,970
ดังนั้นนี่คืองูหลาม

520
00:25:31,970 --> 00:25:34,210
มันเป็นภาษาการเขียนโปรแกรมใหม่

521
00:25:34,210 --> 00:25:38,020
มันเป็นความคล้ายกันในบางส่วน
วิธีการที่จะ C และ PHP

522
00:25:38,020 --> 00:25:43,180
มันคล้ายกันเพราะถ้าคุณต้องการที่จะ
เรียนรู้หลามหลังจากที่รู้ C ก็

523
00:25:43,180 --> 00:25:46,270
จริงๆไม่ว่ามากของความท้าทาย
เพียงเพราะงูใหญ่เป็นเรื่องง่ายที่

524
00:25:46,270 --> 00:25:47,520
กว่า C แรกของทุกคน

525
00:25:47,520 --> 00:25:49,370
และจำนวนมากของสิ่งที่มีอยู่แล้ว
ดำเนินการสำหรับคุณ

526
00:25:49,370 --> 00:25:56,820
ดังนั้นเพียงแค่วิธีการเช่น PHP มีฟังก์ชั่นที่
เรียงลำดับรายการหรือผนวกบางสิ่งบางอย่าง

527
00:25:56,820 --> 00:25:58,780
อาร์เรย์หรือ blah, blah, blah

528
00:25:58,780 --> 00:26:00,690
งูใหญ่มีทั้งหมดของเหล่านั้นเช่นกัน

529
00:26:00,690 --> 00:26:05,960
>> ดังนั้นฉันแค่จะอธิบายได้อย่างรวดเร็ว
วิธีการที่เราสามารถดำเนินการจัดหมวดหมู่

530
00:26:05,960 --> 00:26:07,860
ปัญหาสำหรับที่นี่

531
00:26:07,860 --> 00:26:13,230
จึงขอบอกว่าในกรณีนี้ผมมี
เนื้อเพลงจากประสาทและ Katy Perry

532
00:26:13,230 --> 00:26:21,880
วิธีการที่ฉันมีเนื้อเพลงเหล่านั้นก็คือว่า
คำแรกของเนื้อเพลงคือ

533
00:26:21,880 --> 00:26:25,250
ชื่อของศิลปินและ
ส่วนที่เหลือเป็นเนื้อเพลง

534
00:26:25,250 --> 00:26:29,470
ดังนั้นขอบอกว่าฉันมีรายชื่อใน
ซึ่งคนแรกคือเนื้อเพลงทึ่ม

535
00:26:29,470 --> 00:26:31,930
ดังนั้นที่นี่ฉันในการติดตามขวา

536
00:26:31,930 --> 00:26:35,270
และคนต่อไปคือเคทีและ
มันยังมีเนื้อเพลง

537
00:26:35,270 --> 00:26:38,040
>> ดังนั้นนี่คือวิธีการที่คุณประกาศ
ตัวแปรในหลาม

538
00:26:38,040 --> 00:26:40,200
คุณไม่จำเป็นที่จะให้ชนิดข้อมูล

539
00:26:40,200 --> 00:26:43,150
คุณเพียงแค่เขียน "เนื้อเพลง"
ชนิดเช่นใน PHP

540
00:26:43,150 --> 00:26:44,890
ทำให้รู้สึก

541
00:26:44,890 --> 00:26:47,770
>> ดังนั้นสิ่งที่เป็นสิ่งที่ฉันต้อง
คำนวณเพื่อให้สามารถคำนวณ

542
00:26:47,770 --> 00:26:49,360
ความน่าจะเป็น?

543
00:26:49,360 --> 00:26:55,110
ฉันมีการคำนวณ "ไพรเออร์"
ของแต่ละที่แตกต่างกัน

544
00:26:55,110 --> 00:26:56,710
ชั้นเรียนที่ฉันมี

545
00:26:56,710 --> 00:27:06,680
ฉันมีการคำนวณ "posteriors"
หรือสวยมากน่าจะเป็นของ

546
00:27:06,680 --> 00:27:12,150
แต่ละคำที่แตกต่างกันที่
ฉันสามารถมีสำหรับศิลปินแต่ละคน

547
00:27:12,150 --> 00:27:17,210
ดังนั้นภายในประสาทเช่นฉันจะ
ที่จะมีรายชื่อของวิธีการที่หลายต่อหลายครั้งที่ฉันเห็น

548
00:27:17,210 --> 00:27:19,250
แต่ละคำ

549
00:27:19,250 --> 00:27:20,760
ทำให้รู้สึก

550
00:27:20,760 --> 00:27:25,370
>> และในที่สุดผมก็จะมี
รายการที่เรียกว่า "คำ" ที่เพิ่งจะ

551
00:27:25,370 --> 00:27:29,780
จะมีกี่คำที่ฉัน
มีสำหรับศิลปินแต่ละคน

552
00:27:29,780 --> 00:27:33,760
ดังนั้นสำหรับทึ่มตัวอย่างเช่นเมื่อฉันมอง
เนื้อเพลงผมผมคิดว่า 24

553
00:27:33,760 --> 00:27:34,750
คำทั้งหมด

554
00:27:34,750 --> 00:27:38,970
ดังนั้นรายการนี​​้เป็นเพียงการไปได้
24 กาก้าและเคทีหมายเลขอื่น

555
00:27:38,970 --> 00:27:40,130
ทำให้รู้สึก

556
00:27:40,130 --> 00:27:40,560
ตกลง

557
00:27:40,560 --> 00:27:42,530
>> ดังนั้นตอนนี้จริงให้
ไปที่การเขียนโปรแกรม

558
00:27:42,530 --> 00:27:45,270
ดังนั้นในหลามคุณสามารถจริง
กลับพวงของการที่แตกต่างกัน

559
00:27:45,270 --> 00:27:46,630
สิ่งจากฟังก์ชั่น

560
00:27:46,630 --> 00:27:50,810
ดังนั้นฉันจะสร้างฟังก์ชั่นนี้
เรียกว่า "เงื่อนไข" ที่เป็นไป

561
00:27:50,810 --> 00:27:53,890
ที่จะกลับมาทั้งหมดของสิ่งเหล่านั้น
"ไพรเออร์" "น่าจะ" และ

562
00:27:53,890 --> 00:28:05,690
"คำพูด". ดังนั้น "เงื่อนไข" และมันเป็น
จะได้รับการโทรเข้ามา "เนื้อเพลง."

563
00:28:05,690 --> 00:28:11,510
>> ดังนั้นตอนนี้ฉันต้องการให้คุณจริง
เขียนฟังก์ชั่นนี้

564
00:28:11,510 --> 00:28:17,750
ดังนั้นวิธีที่ฉันสามารถเขียนนี้
ฟังก์ชั่นที่ผมกำหนดไว้นี้

565
00:28:17,750 --> 00:28:20,620
ทำงานด้วย "def." ดังนั้นฉันได้ "def
เงื่อนไข "และมันสละ

566
00:28:20,620 --> 00:28:28,700
"เนื้อเพลง." และสิ่งนี้จะไปทำ
เป็นครั้งแรกของทุกฉันมีไพรเออร์ของฉัน

567
00:28:28,700 --> 00:28:31,030
ที่ฉันต้องการในการคำนวณ

568
00:28:31,030 --> 00:28:34,330
>> ดังนั้นวิธีที่ฉันสามารถทำเช่นนี้คือการสร้าง
ในพจนานุกรมหลามที่

569
00:28:34,330 --> 00:28:37,320
สวยมากสิ่งเดียวกับกัญชา
ตารางหรือมันก็เหมือนการย้ำ

570
00:28:37,320 --> 00:28:40,480
อาร์เรย์ใน PHP

571
00:28:40,480 --> 00:28:44,150
นี่คือวิธีที่ผมประกาศพจนานุกรม

572
00:28:44,150 --> 00:28:53,580
และโดยทั่วไปสิ่งที่หมายถึงนี้คือ
ไพรเออร์ของประสาทคือ 0.5 ตัวอย่างเช่นถ้า

573
00:28:53,580 --> 00:28:57,200
50% ของเพลงที่มาจาก
ทึ่ม 50% จะมาจากเคที

574
00:28:57,200 --> 00:28:58,450
ทำให้รู้สึก

575
00:28:58,450 --> 00:29:00,680

576
00:29:00,680 --> 00:29:03,680
ดังนั้นผมจึงมีการคิดออกว่า
ไพรเออร์ในการคำนวณ

577
00:29:03,680 --> 00:29:07,120
>> คนต่อไปที่ฉันต้องทำยัง
มีความน่าจะเป็นและคำพูด

578
00:29:07,120 --> 00:29:17,100
ดังนั้นความน่าจะเป็นของประสาทคือรายการ
ของความน่าจะเป็นทั้งหมดที่ฉัน

579
00:29:17,100 --> 00:29:19,160
มีสำหรับแต่ละคำสำหรับทึ่ม

580
00:29:19,160 --> 00:29:23,880
ดังนั้นถ้าผมไปที่ความน่าจะเป็นของประสาท
"ทารก" ตัวอย่างเช่นมันจะให้ฉัน

581
00:29:23,880 --> 00:29:28,750
สิ่งที่ต้องการ 2 กว่า 24 ในกรณีที่

582
00:29:28,750 --> 00:29:30,070
ทำให้รู้สึก

583
00:29:30,070 --> 00:29:36,120
ดังนั้นผมจึงไปที่ "น่าจะ" ไปที่
"ทึ่ม" ถังที่มีรายชื่อของ

584
00:29:36,120 --> 00:29:40,550
คำประสาทแล้วฉันไปที่ "เด็ก"
และผมเห็นความน่าจะเป็น

585
00:29:40,550 --> 00:29:45,940
>> และในที่สุดฉันมีนี้
"คำพูด" พจนานุกรม

586
00:29:45,940 --> 00:29:53,620
ดังนั้นที่นี่ "น่าจะ". แล้วจึง
"คำพูด". ดังนั้นถ้าผมทำ "คำ", "กาก้า"

587
00:29:53,620 --> 00:29:58,330
สิ่งที่จะเกิดขึ้นคือว่ามัน
จะให้ฉัน 24 บอกว่าฉัน

588
00:29:58,330 --> 00:30:01,990
มี 2​​4 คำภายในเนื้อเพลงจากทึ่ม

589
00:30:01,990 --> 00:30:04,110
ทำให้รู้สึก?

590
00:30:04,110 --> 00:30:07,070
ดังนั้นที่นี่ "คำพูด" เท่ากับ DAH-DAH-DAH

591
00:30:07,070 --> 00:30:07,620
ตกลง

592
00:30:07,620 --> 00:30:12,210
>> ดังนั้นสิ่งที่ผมจะทำคือผมกำลังจะไป
ย้ำกว่าแต่ละเนื้อเพลงดังนั้น

593
00:30:12,210 --> 00:30:14,490
แต่ละสายที่
ฉันมีในรายการ

594
00:30:14,490 --> 00:30:18,040
และฉันจะคำนวณสิ่งเหล่านั้น
สำหรับแต่ละของผู้สมัคร

595
00:30:18,040 --> 00:30:19,950
ทำให้รู้สึก?

596
00:30:19,950 --> 00:30:21,700
ดังนั้นผมจึงต้องทำสำหรับวง

597
00:30:21,700 --> 00:30:26,300
>> ดังนั้นในหลามสิ่งที่ฉันสามารถทำได้คือ "สำหรับสาย
ในเนื้อเพลง. "สิ่งที่เหมือนกันกับ

598
00:30:26,300 --> 00:30:28,000
"สำหรับแต่ละ" คำสั่งใน PHP

599
00:30:28,000 --> 00:30:33,420
โปรดจำไว้ว่าถ้ามันเป็น PHP ที่จะทำได้
กล่าวว่า "สำหรับการเป็นเพลงที่แต่ละ

600
00:30:33,420 --> 00:30:35,220
สาย. "ทำให้รู้สึก?

601
00:30:35,220 --> 00:30:38,900
ดังนั้นฉันเอาแต่ละเส้นในการนี​​้
กรณีที่สายนี้และต่อไป

602
00:30:38,900 --> 00:30:44,540
สตริงดังนั้นสำหรับแต่ละเส้นสิ่งที่ฉัน
จะทำคือครั้งแรกที่ฉันจะไป

603
00:30:44,540 --> 00:30:49,150
แยกสายนี้ลงในรายการของ
คำคั่นด้วยช่องว่าง

604
00:30:49,150 --> 00:30:53,730
>> ดังนั้นสิ่งดีๆเกี่ยวกับงูหลามที่
คุณอาจจะเพียงแค่ Google เช่น "วิธีการที่ฉันสามารถ

605
00:30:53,730 --> 00:30:58,220
แบ่งสายเป็นคำ? "และมันเป็น
จะบอกให้คุณทราบวิธีที่จะทำมัน

606
00:30:58,220 --> 00:31:04,890
และวิธีการที่จะทำมันก็แค่ "สาย
= line.split () "และมันเป็นพื้น

607
00:31:04,890 --> 00:31:08,640
จะให้รายการที่มี
แต่ละคำที่นี่

608
00:31:08,640 --> 00:31:09,620
ทำให้รู้สึก?

609
00:31:09,620 --> 00:31:15,870
ดังนั้นขณะนี้ที่ผมว่าผมต้องการที่จะรู้ว่า
ที่เป็นนักร้องของเพลงที่

610
00:31:15,870 --> 00:31:20,130
และจะทำอย่างไรที่ฉันจะต้องได้รับ
องค์ประกอบแรกของอาร์เรย์ใช่ไหม

611
00:31:20,130 --> 00:31:26,390
ดังนั้นผมก็สามารถพูดได้ว่าผม "นักร้อง
= บรรทัด (0) "ทำให้รู้สึก?

612
00:31:26,390 --> 00:31:32,010
>> และแล้วสิ่งที่ฉันต้องทำคือการเป็นครั้งแรกของ
ทั้งหมดที่ฉันจะปรับปรุงวิธีการที่หลาย

613
00:31:32,010 --> 00:31:36,130
คำที่ฉันมีภายใต้ "โง่." ดังนั้นฉันเพียงแค่
จะคำนวณจำนวนคำที่ฉัน

614
00:31:36,130 --> 00:31:38,690
มีในรายการนี​​้ใช่มั้ย

615
00:31:38,690 --> 00:31:41,910
เพราะนี่เป็นวิธีการที่หลายคำที่ฉันมี
ในเนื้อเพลงและฉันแค่จะไป

616
00:31:41,910 --> 00:31:44,120
เพิ่ม "ทึ่ม" อาเรย์

617
00:31:44,120 --> 00:31:47,090
ไม่ที่ทำให้รู้สึก?

618
00:31:47,090 --> 00:31:49,010
ไม่เน้นมากเกินไปในไวยากรณ์

619
00:31:49,010 --> 00:31:50,430
คิดเพิ่มเติมเกี่ยวกับแนวคิด

620
00:31:50,430 --> 00:31:52,400
นั่นเป็นส่วนที่สำคัญที่สุด

621
00:31:52,400 --> 00:31:52,720
ตกลง

622
00:31:52,720 --> 00:32:00,260
>> ดังนั้นสิ่งที่ฉันจะทำมันก็คือถ้า "ทึ่ม" เป็น
แล้วในรายการที่ว่า "ถ้านักร้องใน

623
00:32:00,260 --> 00:32:03,190
คำว่า "ซึ่งหมายความว่าฉันแล้ว
มีคำโดยทึ่ม

624
00:32:03,190 --> 00:32:06,640
ผมแค่อยากจะเพิ่มอีก
คำว่า

625
00:32:06,640 --> 00:32:15,810
ดังนั้นสิ่งที่ฉันทำคือ "คำ (นักร้อง)
+ = len (สาย) - 1 "

626
00:32:15,810 --> 00:32:18,250
และจากนั้นฉันก็สามารถทำ
ความยาวของเส้น

627
00:32:18,250 --> 00:32:21,860
ดังนั้นวิธีที่หลายองค์ประกอบฉัน
มีในอาร์เรย์

628
00:32:21,860 --> 00:32:27,060
และผมต้องทำลบ 1 เพียงเพราะ
องค์ประกอบแรกของอาร์เรย์เป็นเพียง

629
00:32:27,060 --> 00:32:29,180
นักร้องและผู้ที่มีเนื้อเพลงไม่ได้

630
00:32:29,180 --> 00:32:31,420
ทำให้รู้สึก?

631
00:32:31,420 --> 00:32:32,780
ตกลง

632
00:32:32,780 --> 00:32:35,820
>> "อื่น ๆ " มันหมายความว่าฉันต้องการจริง
ใส่ประสาทในรายการ

633
00:32:35,820 --> 00:32:45,990
ดังนั้นผมก็ทำ "คำ (นักร้อง)
= len (สาย) - 1, "ขอโทษ

634
00:32:45,990 --> 00:32:49,200
ดังนั้นความแตกต่างเพียงอย่างเดียวระหว่างสอง
สายเป็นที่หนึ่งนี้ก็ไม่ได้

635
00:32:49,200 --> 00:32:51,080
ที่มีอยู่ยังดังนั้นฉันแค่
การเริ่มต้นมัน

636
00:32:51,080 --> 00:32:53,820
หนึ่งฉันจริงเพิ่มนี้

637
00:32:53,820 --> 00:32:55,570
ตกลง

638
00:32:55,570 --> 00:32:59,480
ดังนั้นนี่คือการเพิ่มคำ

639
00:32:59,480 --> 00:33:03,040
>> ตอนนี้ผมต้องการที่จะเพิ่มไพรเออร์

640
00:33:03,040 --> 00:33:05,480
ดังนั้นฉันจะคำนวณไพรเออร์หรือไม่

641
00:33:05,480 --> 00:33:11,580
ไพรเออร์สามารถคำนวณได้
โดยวิธีการหลายครั้ง

642
00:33:11,580 --> 00:33:15,340
ดังนั้นวิธีที่หลายต่อหลายครั้งที่คุณเห็นนักร้องที่
ในหมู่ของนักร้องที่คุณ

643
00:33:15,340 --> 00:33:16,380
มีใช่มั้ย?

644
00:33:16,380 --> 00:33:18,810
ดังนั้นสำหรับทึ่มและ Katy Perry,
ในกรณีนี้ผมเห็นทึ่ม

645
00:33:18,810 --> 00:33:20,570
ครั้ง Katy Perry ครั้ง

646
00:33:20,570 --> 00:33:23,320
>> ดังนั้นโดยทั่วไปไพรเออร์กับกาก้า
และ Katy Perry จะ

647
00:33:23,320 --> 00:33:24,390
เพียงแค่เป็นหนึ่งใช่ไหม

648
00:33:24,390 --> 00:33:26,500
คุณเพียงแค่วิธีการที่หลายต่อหลายครั้ง
ผมเห็นศิลปิน

649
00:33:26,500 --> 00:33:28,740
ดังนั้นนี้เป็นเรื่องง่ายมากในการคำนวณ

650
00:33:28,740 --> 00:33:34,100
ฉันสามารถเพียงแค่บางสิ่งบางอย่างที่คล้ายกันเช่น "ถ้า
นักร้องในไพรเออร์ "ฉันแค่จะ

651
00:33:34,100 --> 00:33:38,970
เพื่อเพิ่ม 1 ถึงไพรเออร์ของพวกเขากล่อง

652
00:33:38,970 --> 00:33:51,000
ดังนั้น "ไพรเออร์ (ร้องเพลง)" + = 1 "แล้ว" อื่น "
ฉันจะทำ "ไพรเออร์ (นักร้อง)

653
00:33:51,000 --> 00:33:55,000
= 1. "ทำให้รู้สึก?

654
00:33:55,000 --> 00:34:00,080
>> ดังนั้นถ้ามันไม่ได้อยู่ที่ผมเพียงแค่ใส่
1 เป็นอย่างอื่นผมเพียงแค่เพิ่ม 1

655
00:34:00,080 --> 00:34:11,280
ตกลงดังนั้นตอนนี้สิ่งที่ผมได้ออกไปทำ
นอกจากนี้ยังเพิ่มแต่ละคำเพื่อ

656
00:34:11,280 --> 00:34:12,290
ความน่าจะเป็น

657
00:34:12,290 --> 00:34:14,889
ดังนั้นผมจึงมีการนับจำนวนครั้งที่
ผมเห็นแต่ละคำ

658
00:34:14,889 --> 00:34:18,780
ดังนั้นผมก็ต้องทำอีก
สำหรับวงในสาย

659
00:34:18,780 --> 00:34:25,190
>> ดังนั้นสิ่งแรกที่ผมจะทำคือ
ตรวจสอบว่านักร้องที่มีอยู่แล้ว

660
00:34:25,190 --> 00:34:26,969
น่าจะเป็นแถว

661
00:34:26,969 --> 00:34:31,739
ดังนั้นฉันตรวจสอบว่านักร้องไม่ได้
มีความน่าจะเป็นอาเรย์, ฉันแค่

662
00:34:31,739 --> 00:34:34,480
จะเริ่มต้นอย่างใดอย่างหนึ่งสำหรับพวกเขา

663
00:34:34,480 --> 00:34:36,400
ก็ไม่ได้มากมายขอโทษ
เป็นพจนานุกรม

664
00:34:36,400 --> 00:34:43,080
ดังนั้นความน่าจะเป็นของนักร้องที่เป็นไป
จะเปิดพจนานุกรมเพื่อให้ฉัน

665
00:34:43,080 --> 00:34:45,830
เพียงแค่การเริ่มต้นพจนานุกรมสำหรับมัน

666
00:34:45,830 --> 00:34:46,820
OK?

667
00:34:46,820 --> 00:34:58,330
>> และตอนนี้ฉันสามารถทำได้จริงสำหรับวง
ในการคำนวณของแต่ละคำพูดของ

668
00:34:58,330 --> 00:35:00,604
ความน่าจะเป็น

669
00:35:00,604 --> 00:35:01,540
ตกลง

670
00:35:01,540 --> 00:35:04,160
ดังนั้นสิ่งที่ฉันสามารถทำได้คือห่วงสำหรับ

671
00:35:04,160 --> 00:35:06,590
ดังนั้นฉันแค่จะย้ำ
กว่าอาร์เรย์

672
00:35:06,590 --> 00:35:15,320
ดังนั้นวิธีการที่ฉันสามารถทำในหลาม
คือ "การที่ผมอยู่ในช่วง." ตั้งแต่วันที่ 1

673
00:35:15,320 --> 00:35:19,200
เพราะฉันต้องการที่จะเริ่มต้นในครั้งที่สอง
เพราะองค์ประกอบแรกคือ

674
00:35:19,200 --> 00:35:20,260
ชื่อนักร้อง

675
00:35:20,260 --> 00:35:24,990
ดังนั้นจากหนึ่งถึง
ความยาวของเส้น

676
00:35:24,990 --> 00:35:29,760
และเมื่อฉันมีช่วงที่มันเป็นจริงไปจาก
เช่นที่นี่จาก 1 ถึง len ของ

677
00:35:29,760 --> 00:35:30,740
ลบ 1 บรรทัด

678
00:35:30,740 --> 00:35:33,810
ดังนั้นจึงไม่อยู่แล้วสิ่งที่ทำว่า
n ลบ 1 สำหรับอาร์เรย์ซึ่งเป็นมาก

679
00:35:33,810 --> 00:35:35,500
สะดวกสบาย

680
00:35:35,500 --> 00:35:37,850
ทำให้รู้สึก?

681
00:35:37,850 --> 00:35:42,770
>> ดังนั้นสำหรับแต่ละเหล่านี้สิ่งที่ฉันกำลังจะไป
ทำคือการเช่นเดียวกับในอีกหนึ่ง

682
00:35:42,770 --> 00:35:50,320
ฉันจะตรวจสอบว่าคำในนี้
ตำแหน่งในสายที่มีอยู่แล้วใน

683
00:35:50,320 --> 00:35:51,570
ความน่าจะเป็น

684
00:35:51,570 --> 00:35:53,400

685
00:35:53,400 --> 00:35:57,260
แล้วที่ผมกล่าวว่าที่นี่น่าจะเป็น
คำในขณะที่ฉันใส่

686
00:35:57,260 --> 00:35:58,400
"ความน่าจะเป็น (นักร้อง)"

687
00:35:58,400 --> 00:35:59,390
ดังนั้นชื่อของนักร้อง

688
00:35:59,390 --> 00:36:03,450
ดังนั้นถ้ามันมีอยู่แล้วใน
"probabilit (นักร้อง)" มันหมายความว่าฉัน

689
00:36:03,450 --> 00:36:11,960
ต้องการเพิ่ม 1 ถึงมันดังนั้นฉันจะ
ทำ "ความน่าจะเป็น (นักร้อง)" และ

690
00:36:11,960 --> 00:36:14,100
คำที่เรียกว่า "สาย (i)"

691
00:36:14,100 --> 00:36:22,630
ฉันจะเพิ่ม 1 และ "อื่น ๆ " ฉันเพียงแค่
จะเริ่มต้นมันถึง 1

692
00:36:22,630 --> 00:36:23,880
"เส้น (i)"

693
00:36:23,880 --> 00:36:26,920

694
00:36:26,920 --> 00:36:28,420
ทำให้รู้สึก?

695
00:36:28,420 --> 00:36:30,180
>> ดังนั้นฉันจึงมีการคำนวณทั้งหมดของอาร์เรย์

696
00:36:30,180 --> 00:36:36,580
ดังนั้นตอนนี้สิ่งที่ฉันต้องทำเพื่อ
อันนี้เป็นเพียงการ "กลับไพรเออร์,

697
00:36:36,580 --> 00:36:43,230
ความน่าจะเป็นและคำพูด. "ขอ
ดูว่ามีใด ๆ ที่ตกลง

698
00:36:43,230 --> 00:36:45,690
ดูเหมือนว่าทุกอย่างคือการทำงานเพื่อให้ห่างไกล

699
00:36:45,690 --> 00:36:46,900
เพื่อที่จะทำให้ความรู้สึก?

700
00:36:46,900 --> 00:36:47,750
ในบางวิธี?

701
00:36:47,750 --> 00:36:49,280
ตกลง

702
00:36:49,280 --> 00:36:51,980
ดังนั้นตอนนี้ฉันมีความน่าจะเป็นทั้งหมด

703
00:36:51,980 --> 00:36:55,100
ดังนั้นตอนนี้สิ่งเดียวที่ฉันมีซ้าย
เป็นเพียงการมีสิ่งที่ว่า

704
00:36:55,100 --> 00:36:58,650
คำนวณผลิตภัณฑ์ทั้งหมด
น่าจะเป็นตอนที่ผมได้รับเนื้อเพลง

705
00:36:58,650 --> 00:37:06,270
>> จึงขอบอกว่าผมต้องการที่จะเรียก
ฟังก์ชั่นนี้ "จัด ()" และ

706
00:37:06,270 --> 00:37:08,880
สิ่งที่ฟังก์ชั่นที่ใช้เวลา
เป็นเพียงการโต้แย้ง

707
00:37:08,880 --> 00:37:13,170
สมมติว่า "เด็กผมลงบนกองไฟ" และมันเป็น
จะคิดออกว่า

708
00:37:13,170 --> 00:37:14,490
ความน่าจะเป็นว่านี่คือโง่?

709
00:37:14,490 --> 00:37:16,405
ความน่าจะเป็นสิ่งที่
ว่านี่คือเคธี่?

710
00:37:16,405 --> 00:37:19,690
เสียงดี?

711
00:37:19,690 --> 00:37:25,750
ดังนั้นฉันแค่ไปที่จะมีการสร้าง
ฟังก์ชั่นใหม่ที่เรียกว่า "จัด ()" และ

712
00:37:25,750 --> 00:37:29,180
มันจะใช้เวลาบางส่วน
เนื้อเพลงเป็นอย่างดี

713
00:37:29,180 --> 00:37:31,790

714
00:37:31,790 --> 00:37:36,160
และนอกจากเพลงที่ฉันยัง
ต้องส่งไพรเออร์,

715
00:37:36,160 --> 00:37:37,700
ความน่าจะเป็นและคำพูด

716
00:37:37,700 --> 00:37:44,000
ดังนั้นฉันจะส่งเนื้อเพลงไพรเออร์,
น่าจะเป็นคำพูด

717
00:37:44,000 --> 00:37:51,840
>> ดังนั้นนี่คือการเนื้อเพลงไพรเออร์,
น่าจะเป็นคำพูด

718
00:37:51,840 --> 00:37:53,530
ดังนั้นสิ่งที่ไม่ได้ทำอย่างไร

719
00:37:53,530 --> 00:37:57,180
มันเป็นพื้นจะไปผ่านทุก
ผู้สมัครที่เป็นไปได้ที่คุณ

720
00:37:57,180 --> 00:37:58,510
ได้เป็นนักร้อง

721
00:37:58,510 --> 00:37:59,425
และสถานที่ที่ผู้สมัครเหล่านั้นมีอะไรบ้าง

722
00:37:59,425 --> 00:38:01,020
พวกเขากำลังในไพรเออร์ใช่มั้ย?

723
00:38:01,020 --> 00:38:02,710
ดังนั้นผมจึงมีทุกคนมี

724
00:38:02,710 --> 00:38:07,870
ดังนั้นฉันจะมีพจนานุกรม
ของผู้สมัครที่เป็นไปได้ทั้งหมด

725
00:38:07,870 --> 00:38:14,220
และจากนั้นให้ผู้สมัครในแต่ละ
ไพรเออร์ดังนั้นก็หมายความว่ามันจะ

726
00:38:14,220 --> 00:38:17,740
เป็นกาก้าเคธี่ถ้าผมมี
มากขึ้นก็จะมีมากขึ้น

727
00:38:17,740 --> 00:38:20,410
ฉันจะเริ่มต้นการคำนวณ
ความน่าจะเป็นนี้

728
00:38:20,410 --> 00:38:28,310
น่าจะเป็นอย่างที่เราเห็นใน
PowerPoint เป็นครั้งก่อน

729
00:38:28,310 --> 00:38:30,800
ผลิตภัณฑ์ของแต่ละ
ความน่าจะเป็นอื่น ๆ

730
00:38:30,800 --> 00:38:32,520
>> ดังนั้นผมจึงสามารถทำเช่นเดียวกันที่นี่

731
00:38:32,520 --> 00:38:36,330
ฉันสามารถทำน่าจะเป็น
ในขั้นต้นก่อน

732
00:38:36,330 --> 00:38:40,340
ดังนั้นไพรเออร์ของผู้สมัคร

733
00:38:40,340 --> 00:38:40,870
ใช่มั้ย?

734
00:38:40,870 --> 00:38:45,360
และตอนนี้ฉันต้องย้ำกว่าทุก
คำที่ฉันมีในเนื้อเพลงจะเป็น

735
00:38:45,360 --> 00:38:48,820
สามารถที่จะเพิ่มความน่าจะเป็น
สำหรับแต่ละคน OK?

736
00:38:48,820 --> 00:38:57,900
ดังนั้น "สำหรับคำในเนื้อเพลง" สิ่งที่ฉันจะ
ที่จะทำคือถ้าคำที่อยู่ใน

737
00:38:57,900 --> 00:39:01,640
"ความน่าจะเป็น (ผู้สมัคร)" ซึ่ง
หมายความว่ามันเป็นคำที่

738
00:39:01,640 --> 00:39:03,640
ผู้สมัครที่มีอยู่ในเนื้อเพลงของพวกเขา -

739
00:39:03,640 --> 00:39:05,940
ตัวอย่างเช่น "ลูกน้อย" สำหรับการประสาท -

740
00:39:05,940 --> 00:39:11,710
สิ่งที่ผมจะทำก็คือ
ความน่าจะเป็นไปได้คูณ

741
00:39:11,710 --> 00:39:22,420
โดย 1 บวกความน่าจะเป็นของ
ผู้สมัครสำหรับคำว่า

742
00:39:22,420 --> 00:39:25,710
และก็เรียกว่า "คำ"

743
00:39:25,710 --> 00:39:32,440
นี้หารด้วยจำนวนของคำ
ที่ฉันมีให้ผู้สมัครที่

744
00:39:32,440 --> 00:39:37,450
จำนวนรวมของคำที่ฉันมี
นักร้องที่ฉันกำลังมองหาที่

745
00:39:37,450 --> 00:39:40,290
>> "อื่น ๆ ". มันหมายความว่ามันเป็นคำใหม่
ดังนั้นมันจะเป็นอย่างเช่น

746
00:39:40,290 --> 00:39:41,860
"ไฟ" สำหรับการของเลดี้กาก้า

747
00:39:41,860 --> 00:39:45,760
ดังนั้นผมเพียงแค่ต้องการที่จะทำในช่วงที่ 1
"คำ (ผู้สมัคร)"

748
00:39:45,760 --> 00:39:47,710
ดังนั้นผมจึงไม่ต้องการที่จะใส่ในระยะนี้ที่นี่

749
00:39:47,710 --> 00:39:50,010
>> ดังนั้นจึงเป็นไปได้โดยทั่วไป
คัดลอกและวางนี้

750
00:39:50,010 --> 00:39:54,380

751
00:39:54,380 --> 00:39:56,000
แต่ฉันจะลบส่วนนี้

752
00:39:56,000 --> 00:39:57,610
ดังนั้นมันก็จะเป็น 1 ในช่วงที่

753
00:39:57,610 --> 00:40:00,900

754
00:40:00,900 --> 00:40:02,150
เสียงดี?

755
00:40:02,150 --> 00:40:03,980

756
00:40:03,980 --> 00:40:09,700
และตอนนี้ที่สิ้นสุดฉันแค่จะไป
พิมพ์ชื่อของผู้สมัครและ

757
00:40:09,700 --> 00:40:15,750
ความน่าจะเป็นว่าคุณมีของ
มี S ในเนื้อเพลงของพวกเขา

758
00:40:15,750 --> 00:40:16,200
ทำให้รู้สึก?

759
00:40:16,200 --> 00:40:18,390
และที่จริงผมทำไม่ได้
ต้องพจนานุกรมนี้

760
00:40:18,390 --> 00:40:19,510
ทำให้รู้สึก?

761
00:40:19,510 --> 00:40:21,810
>> ดังนั้นขอดูว่านี้ใช้งานได้จริง

762
00:40:21,810 --> 00:40:24,880
ดังนั้นถ้าผมทำงานนี้ก็ไม่ได้ทำงาน

763
00:40:24,880 --> 00:40:26,130
รอคนที่สอง

764
00:40:26,130 --> 00:40:28,870

765
00:40:28,870 --> 00:40:31,720
"คำพูด (ผู้สมัคร)", "คำ (ผู้สมัคร)"
นั่นคือ

766
00:40:31,720 --> 00:40:33,750
ชื่อของอาร์เรย์

767
00:40:33,750 --> 00:40:41,435
ตกลงดังนั้นจึงกล่าวว่ามีข้อผิดพลาดบางอย่าง
ให้ผู้สมัครในไพรเออร์

768
00:40:41,435 --> 00:40:46,300

769
00:40:46,300 --> 00:40:48,760
ผมขอเพียงแค่เย็นนิด ๆ หน่อย ๆ

770
00:40:48,760 --> 00:40:50,360
ตกลง

771
00:40:50,360 --> 00:40:51,305
ลอง

772
00:40:51,305 --> 00:40:51,720
ตกลง

773
00:40:51,720 --> 00:40:58,710
>> ดังนั้นจึงให้ Katy Perry มีนี้
น่าจะเป็นครั้งที่ 10 ที่จะ

774
00:40:58,710 --> 00:41:02,200
ลบ 7 และมีประสาทนี้
ครั้งที่ 10 ถึง 6 ลบ

775
00:41:02,200 --> 00:41:05,610
ดังนั้นคุณจะเห็นว่ามันแสดงให้เห็นว่าทึ่ม
มีความน่าจะเป็นสูงกว่า

776
00:41:05,610 --> 00:41:09,260
ดังนั้น "เด็กฉันไฟ" เป็นที่
อาจเป็นเพลงที่โง่

777
00:41:09,260 --> 00:41:10,580
ทำให้รู้สึก?

778
00:41:10,580 --> 00:41:12,030
ดังนั้นนี่คือสิ่งที่เราทำ

779
00:41:12,030 --> 00:41:16,010
>> รหัสนี้จะถูกโพสต์ออนไลน์
ดังนั้นพวกคุณสามารถตรวจสอบออก

780
00:41:16,010 --> 00:41:20,720
อาจจะใช้บางส่วนของมันถ้าคุณต้องการที่จะ
ทำโครงการหรือสิ่งที่คล้ายกัน

781
00:41:20,720 --> 00:41:22,150
ตกลง

782
00:41:22,150 --> 00:41:25,930
นี่เป็นเพียงการแสดง
สิ่งที่การคำนวณ

783
00:41:25,930 --> 00:41:27,230
รหัสภาษาศาสตร์ดูเหมือนว่า

784
00:41:27,230 --> 00:41:33,040
แต่ตอนนี้ขอไปให้มากขึ้น
สิ่งที่อยู่ในระดับสูง

785
00:41:33,040 --> 00:41:33,340
ตกลง

786
00:41:33,340 --> 00:41:35,150
>> ดังนั้นปัญหาอื่น ๆ ที่ฉัน
พูดคุยเกี่ยวกับ -

787
00:41:35,150 --> 00:41:37,550
ปัญหาการแบ่งส่วน
เป็นครั้งแรกของพวกเขา

788
00:41:37,550 --> 00:41:40,820
เพื่อให้คุณมีที่นี่ญี่ปุ่น

789
00:41:40,820 --> 00:41:43,420
แล้วคุณจะเห็นว่า
ไม่มีช่องว่าง

790
00:41:43,420 --> 00:41:49,110
ดังนั้นนี้โดยทั่วไปหมายถึงว่ามันเป็น
ด้านบนของเก้าอี้ใช่ไหม

791
00:41:49,110 --> 00:41:50,550
คุณพูดภาษาญี่ปุ่น

792
00:41:50,550 --> 00:41:52,840
มันเป็นด้านบนของเก้าอี้ใช่ไหม

793
00:41:52,840 --> 00:41:54,480
>> นักเรียน: ผมไม่ทราบว่า
ตัวอักษรคันจิที่นั่นเป็น

794
00:41:54,480 --> 00:41:57,010
>> LUCAS FREITAS: มัน [พูดญี่ปุ่น]

795
00:41:57,010 --> 00:41:57,950
ตกลง

796
00:41:57,950 --> 00:42:00,960
ดังนั้นโดยทั่วไปหมายถึงเก้าอี้ของด้านบน

797
00:42:00,960 --> 00:42:03,620
ดังนั้นถ้าคุณมีการใส่ช่องว่าง
มันจะเป็นที่นี่

798
00:42:03,620 --> 00:42:05,970
แล้วคุณมี [? อุเอดะซัง ?]

799
00:42:05,970 --> 00:42:09,040
ซึ่งโดยทั่วไปหมายถึงนายอุเอดะ

800
00:42:09,040 --> 00:42:13,180
และคุณจะเห็นว่า "อุเอดะ" และคุณมี
พื้นที่และแล้ว "san." ดังนั้นคุณจะเห็นว่า

801
00:42:13,180 --> 00:42:15,470
ที่นี่คุณ "Ue" เป็นเหมือนการด้วยตัวเอง

802
00:42:15,470 --> 00:42:17,750
และที่นี่ก็มีตัวละคร
ถัดไป

803
00:42:17,750 --> 00:42:21,720
>> ดังนั้นจึงไม่เหมือนในภาษาเหล่านั้น
ตัวอักษรที่มีความหมายคำมันเพื่อให้คุณ

804
00:42:21,720 --> 00:42:23,980
เพียงแค่ใส่จำนวนมากของช่องว่าง

805
00:42:23,980 --> 00:42:25,500
ตัวละครที่เกี่ยวข้องกับแต่ละอื่น

806
00:42:25,500 --> 00:42:28,680
และพวกเขาสามารถจะอยู่ด้วยกัน
เช่นสองสามอย่างใดอย่างหนึ่ง

807
00:42:28,680 --> 00:42:34,520
ดังนั้นคุณจะมีการสร้างบางชนิด
ของวิธีการใส่ช่องว่างเหล่านั้น

808
00:42:34,520 --> 00:42:38,850
>> และสิ่งนี้ก็คือว่าเมื่อใดก็ตามที่คุณได้รับ
ข้อมูลจากภาษาเอเชียเหล่านั้น

809
00:42:38,850 --> 00:42:40,580
ทุกอย่างมา unsegmented

810
00:42:40,580 --> 00:42:45,940
เพราะคนที่เขียนญี่ปุ่นไม่มี
หรือภาษาจีนเขียนที่มีช่องว่าง

811
00:42:45,940 --> 00:42:48,200
เมื่อใดก็ตามที่คุณกำลังเขียนจีน
ภาษาญี่ปุ่นที่คุณเพียงแค่เขียนทุกอย่าง

812
00:42:48,200 --> 00:42:48,710
ไม่มีช่องว่าง

813
00:42:48,710 --> 00:42:52,060
มันไม่ได้ทำให้ความรู้สึก
การใส่ช่องว่าง

814
00:42:52,060 --> 00:42:57,960
ดังนั้นแล้วเมื่อคุณได้รับข้อมูลจากบางคน
ภาษาเอเชียตะวันออกถ้าคุณต้องการที่จะ

815
00:42:57,960 --> 00:43:00,760
จริงทำอะไรกับที่
คุณต้องส่วนแรก

816
00:43:00,760 --> 00:43:05,130
>> คิดทำตัวอย่างของ
เนื้อเพลงที่ไม่มีช่องว่าง

817
00:43:05,130 --> 00:43:07,950
ดังนั้นเนื้อเพลงที่เดียวที่คุณมี
จะเป็นประโยคใช่ไหม

818
00:43:07,950 --> 00:43:09,470
คั่นด้วยระยะเวลา

819
00:43:09,470 --> 00:43:13,930
แต่แล้วมีเพียงประโยคที่จะ
ได้จริงๆช่วยในการให้ข้อมูล

820
00:43:13,930 --> 00:43:17,760
ของผู้ที่เนื้อเพลงที่มีโดย

821
00:43:17,760 --> 00:43:18,120
ใช่มั้ย?

822
00:43:18,120 --> 00:43:20,010
ดังนั้นคุณควรทำให้ช่องว่างแรก

823
00:43:20,010 --> 00:43:21,990
ดังนั้นวิธีที่คุณสามารถทำได้

824
00:43:21,990 --> 00:43:24,920
>> ดังนั้นแล้วก็มาถึงความคิดของภาษา
รูปแบบซึ่งเป็นสิ่งที่จริงๆ

825
00:43:24,920 --> 00:43:26,870
สิ่งที่สำคัญสำหรับการคำนวณ
ภาษาศาสตร์

826
00:43:26,870 --> 00:43:32,790
ดังนั้นรูปแบบของภาษาที่เป็นพื้น
ตารางของความน่าจะแสดงให้เห็นว่า

827
00:43:32,790 --> 00:43:36,260
แรกของทุกสิ่งที่เป็นความน่าจะเป็น
ของการมีคำในภาษาหรือไม่

828
00:43:36,260 --> 00:43:39,590
เพื่อแสดงให้เห็นว่าบ่อยคำเป็น

829
00:43:39,590 --> 00:43:43,130
แล้วยังแสดงให้เห็นความสัมพันธ์
ระหว่างคำในประโยค

830
00:43:43,130 --> 00:43:51,500
>> ดังนั้นความคิดหลักคือถ้ามีคนแปลกหน้ามา
ให้คุณและประโยคที่กล่าวว่า

831
00:43:51,500 --> 00:43:55,600
คุณเป็นสิ่งที่น่าจะเป็นที่สำหรับ
เช่น "นี้เป็นน้องสาวของฉัน [? GTF"?]

832
00:43:55,600 --> 00:43:57,480
เป็นประโยคที่ว่าบุคคลดังกล่าวหรือไม่

833
00:43:57,480 --> 00:44:00,380
ดังนั้นเห็นได้ชัดว่าบางประโยคเป็น
พบได้บ่อยกว่าคนอื่น ๆ

834
00:44:00,380 --> 00:44:04,450
ตัวอย่างเช่น "วันดี" หรือ "ดี
คืน "หรือ" เฮ้มี "มากขึ้น

835
00:44:04,450 --> 00:44:08,260
ที่พบมากที่สุดกว่าประโยค
ว่าเรามีภาษาอังกฤษ

836
00:44:08,260 --> 00:44:11,060
เหตุใดจึงต้องมีประโยคที่
บ่อยมาก

837
00:44:11,060 --> 00:44:14,060
>> แรกของทั้งหมดมันเป็นเพราะคุณมี
คำที่มีบ่อยมากขึ้น

838
00:44:14,060 --> 00:44:20,180
ดังนั้นสำหรับตัวอย่างเช่นถ้าคุณบอกว่าสุนัขเป็น
ขนาดใหญ่และสุนัขที่มีขนาดใหญ่คุณ

839
00:44:20,180 --> 00:44:23,880
มักจะได้ยินเสียงสุนัขอาจจะมีขนาดใหญ่
มักจะมากขึ้นเพราะ "บิ๊ก" เป็นอีก

840
00:44:23,880 --> 00:44:27,260
บ่อยในภาษาอังกฤษกว่า "มโหฬาร".
ดังนั้นหนึ่งของ

841
00:44:27,260 --> 00:44:30,100
สิ่งที่เป็นความถี่ของคำ

842
00:44:30,100 --> 00:44:34,490
>> สิ่งที่สองที่เป็นจริง
ที่สำคัญเป็นเพียง

843
00:44:34,490 --> 00:44:35,490
คำสั่งของ

844
00:44:35,490 --> 00:44:39,500
ดังนั้นจึงเป็นเรื่องธรรมดาที่จะพูดว่า "แมว
ภายในกล่อง. "แต่คุณจะไม่ปกติ

845
00:44:39,500 --> 00:44:44,250
เห็นในกล่อง "ภายในเป็นแมว." ดังนั้น
คุณจะเห็นว่ามีความสำคัญบางอย่าง

846
00:44:44,250 --> 00:44:46,030
ในคำสั่งของคำ

847
00:44:46,030 --> 00:44:50,160
คุณไม่สามารถเพียงแค่บอกว่าทั้งสอง
ประโยคที่มีความน่าจะเป็นเหมือนกัน

848
00:44:50,160 --> 00:44:53,010
เพียงเพราะพวกเขามีคำเดียวกัน

849
00:44:53,010 --> 00:44:55,550
คุณจะมีการดูแล
เกี่ยวกับคำสั่งเป็นอย่างดี

850
00:44:55,550 --> 00:44:57,650
ทำให้รู้สึก

851
00:44:57,650 --> 00:44:59,490
>> ดังนั้นเราจะทำอย่างไร

852
00:44:59,490 --> 00:45:01,550
ดังนั้นสิ่งที่ฉันอาจพยายามที่จะได้รับคุณ

853
00:45:01,550 --> 00:45:04,400
ฉันพยายามที่จะให้คุณได้รับสิ่งที่เรา
เรียกรุ่น n-กรัม

854
00:45:04,400 --> 00:45:09,095
ดังนั้นรูปแบบ n-กรัมโดยทั่วไปถือว่า
ว่าสำหรับแต่ละคำว่า

855
00:45:09,095 --> 00:45:10,960
ที่คุณมีในประโยค

856
00:45:10,960 --> 00:45:15,020
มันเป็นความน่าจะเป็นของการมีที่
คำมีขึ้นไม่เพียง แต่ใน

857
00:45:15,020 --> 00:45:18,395
ความถี่ของคำในภาษาที่
แต่ยังอยู่ในคำว่า

858
00:45:18,395 --> 00:45:19,860
จะถูกล้อมรอบมัน

859
00:45:19,860 --> 00:45:25,810
>> ดังนั้นตัวอย่างเช่นโดยปกติเมื่อคุณเห็น
สิ่งที่ชอบหรือที่คุณ

860
00:45:25,810 --> 00:45:28,040
อาจจะไปดู
นามหลังจากที่มันใช่มั้ย

861
00:45:28,040 --> 00:45:31,750
เพราะเมื่อคุณมีคำบุพบท
มักจะใช้เวลาเป็นรูปธรรมหลังจากที่มัน

862
00:45:31,750 --> 00:45:35,540
หรือหากคุณมีคำกริยาที่เป็นสกรรมกริยา
คุณมักจะไป

863
00:45:35,540 --> 00:45:36,630
มีนามวลี

864
00:45:36,630 --> 00:45:38,780
ดังนั้นจึงจะมีคำนาม
ที่ไหนสักแห่งที่อยู่รอบ ๆ

865
00:45:38,780 --> 00:45:44,950
>> ดังนั้นโดยทั่วไปสิ่งที่มันไม่สามารถที่จะ
คิดว่าน่าจะเป็นของการมี

866
00:45:44,950 --> 00:45:47,960
คำติดกันเมื่อ
คุณกำลังคำนวณ

867
00:45:47,960 --> 00:45:49,050
ความน่าจะเป็นของประโยค

868
00:45:49,050 --> 00:45:50,960
และนั่นคือสิ่งที่ภาษา
รูปแบบที่เป็นพื้น

869
00:45:50,960 --> 00:45:54,620
เพียงแค่พูดในสิ่งที่เป็นความน่าจะเป็น
ของการมีที่เฉพาะเจาะจง

870
00:45:54,620 --> 00:45:57,120
ประโยคในภาษาหรือไม่

871
00:45:57,120 --> 00:45:59,110
ดังนั้นทำไมที่เป็นประโยชน์โดยทั่วไป?

872
00:45:59,110 --> 00:46:02,390
และครั้งแรกของทุกสิ่งที่เป็น
รุ่น n-กรัม, แล้ว

873
00:46:02,390 --> 00:46:08,850
>> ดังนั้นรูปแบบ n-กรัมหมายความว่า
แต่ละคำจะขึ้นอยู่กับ

874
00:46:08,850 --> 00:46:12,700
ต่อไปไม่มีลบ 1 คำ

875
00:46:12,700 --> 00:46:18,150
ดังนั้นโดยทั่วไปจะหมายถึงว่าถ้าเรามอง
ตัวอย่างเช่นที่ TF CS50 เมื่อ

876
00:46:18,150 --> 00:46:21,500
ฉันคำนวณความน่าจะเป็นของ
ประโยคที่ว่าคุณจะเป็นเช่น "

877
00:46:21,500 --> 00:46:25,280
ความน่าจะเป็นของการมีคำว่า ""
ครั้งความน่าจะเป็นของการมี "

878
00:46:25,280 --> 00:46:31,720
CS50 "ครั้งความน่าจะเป็นของการมี
"TF CS50." ดังนั้นโดยทั่วไปฉันนับ

879
00:46:31,720 --> 00:46:35,720
วิธีที่เป็นไปได้ทั้งหมดของการยืดมัน

880
00:46:35,720 --> 00:46:41,870
>> แล้วมักจะเมื่อคุณทำเช่นนี้
ในขณะที่โครงการที่คุณใส่ N เพื่อเป็น

881
00:46:41,870 --> 00:46:42,600
มูลค่าต่ำ

882
00:46:42,600 --> 00:46:45,930
ดังนั้นมักจะมีหรือ bigrams trigrams

883
00:46:45,930 --> 00:46:51,090
เพื่อให้คุณเพียงแค่นับสองคำ
กลุ่มของสองคำหรือสามคำ

884
00:46:51,090 --> 00:46:52,620
เพียง แต่สำหรับปัญหาเรื่องประสิทธิภาพ

885
00:46:52,620 --> 00:46:56,395
และยังเพราะบางทีถ้าคุณมี
บางอย่างเช่น "TF CS50." เมื่อคุณ

886
00:46:56,395 --> 00:47:00,510
มี "TF" มันเป็นสิ่งสำคัญมากที่
"CS50" เป็นถัดไปใช่ไหม

887
00:47:00,510 --> 00:47:04,050
ทั้งสองสิ่งนี้มักจะ
ถัดจากแต่ละอื่น

888
00:47:04,050 --> 00:47:06,410
>> ถ้าคุณคิดว่าของ "ลุย" มันอาจจะเป็น
จะมีสิ่งที่

889
00:47:06,410 --> 00:47:07,890
ชั้นก็ TF'ing เพื่อ

890
00:47:07,890 --> 00:47:11,330
นอกจากนี้ "" เป็นสิ่งที่สำคัญจริงๆ
เพื่อ CS50 TF

891
00:47:11,330 --> 00:47:14,570
แต่ถ้าคุณมีบางสิ่งบางอย่างเช่น "CS50
TF ไปเรียนและให้พวกเขา

892
00:47:14,570 --> 00:47:20,060
นักเรียนขนมบาง. "" แคนดี้ "และ" "
ไม่มีความสัมพันธ์จริงๆใช่มั้ย

893
00:47:20,060 --> 00:47:23,670
พวกเขากำลังเพื่อให้ห่างไกลจากแต่ละอื่น ๆ ที่
มันไม่ได้เรื่องจริงๆสิ่งที่

894
00:47:23,670 --> 00:47:25,050
คำที่คุณมี

895
00:47:25,050 --> 00:47:31,210
>> ดังนั้นด้วยการทำ bigram หรือ Trigram มัน
ก็หมายความว่าคุณกำลัง จำกัด

896
00:47:31,210 --> 00:47:33,430
ตัวเองกับคำบางคำ
ที่อยู่รอบ

897
00:47:33,430 --> 00:47:35,810
ทำให้รู้สึก

898
00:47:35,810 --> 00:47:40,630
ดังนั้นเมื่อคุณต้องการที่จะทำแบ่งส่วน
โดยทั่วไปสิ่งที่คุณต้องการจะทำคือการมองเห็น

899
00:47:40,630 --> 00:47:44,850
สิ่งที่เป็นทุกวิธีที่เป็นไปได้ว่า
คุณสามารถส่วนประโยคที่ว่า

900
00:47:44,850 --> 00:47:49,090
>> เช่นที่คุณเห็นสิ่งที่เป็น
ความน่าจะเป็นของแต่ละประโยคที่

901
00:47:49,090 --> 00:47:50,880
ที่มีอยู่ในภาษาหรือไม่

902
00:47:50,880 --> 00:47:53,410
ดังนั้นสิ่งที่คุณทำก็เหมือนกันให้
ฉันพยายามที่จะนำพื้นที่ที่นี่

903
00:47:53,410 --> 00:47:55,570
เพื่อให้คุณใส่ช่องว่างที่มี
และคุณจะเห็นสิ่งที่เป็น

904
00:47:55,570 --> 00:47:57,590
ความน่าจะเป็นของประโยคที่

905
00:47:57,590 --> 00:48:00,240
แล้วคุณจะเหมือนตกลงอาจจะ
นั่นคือไม่ว่าดี

906
00:48:00,240 --> 00:48:03,420
ดังนั้นผมจึงใส่ช่องว่างและมีพื้นที่
มีและคุณคำนวณ

907
00:48:03,420 --> 00:48:06,240
ความน่าจะเป็นในขณะนี้และคุณจะเห็นว่า
ก็น่าจะสูงกว่า

908
00:48:06,240 --> 00:48:12,160
>> ดังนั้นนี่คือวิธีการที่เรียกว่า TANGO
ขั้นตอนวิธีการแบ่งส่วนซึ่งเป็น

909
00:48:12,160 --> 00:48:14,990
จริงสิ่งที่จะเป็นจริง
เย็นสำหรับโครงการที่

910
00:48:14,990 --> 00:48:20,860
โดยทั่วไปจะใช้เวลาข้อความ unsegmented ที่
สามารถภาษาญี่ปุ่นหรือจีนหรืออาจจะ

911
00:48:20,860 --> 00:48:26,080
อังกฤษไม่มีช่องว่างและพยายามที่จะใส่
ช่องว่างระหว่างคำและมันจะ

912
00:48:26,080 --> 00:48:29,120
ว่าด้วยการใช้รูปแบบของภาษาและ
พยายามที่จะมองเห็นสิ่งที่อยู่สูงที่สุด

913
00:48:29,120 --> 00:48:31,270
น่าจะเป็นที่คุณจะได้รับ

914
00:48:31,270 --> 00:48:32,230
ตกลง

915
00:48:32,230 --> 00:48:33,800
ดังนั้นนี่คือการแบ่งส่วน

916
00:48:33,800 --> 00:48:35,450
>> ตอนนี้ไวยากรณ์

917
00:48:35,450 --> 00:48:40,940
ดังนั้นรูปแบบที่จะถูกใช้สำหรับการ
จำนวนมากดังนั้นสิ่งที่ถูกต้องในขณะนี้

918
00:48:40,940 --> 00:48:44,880
ดังนั้นสำหรับการค้นหากราฟสำหรับสิริ
สวยมากชนิดของธรรมชาติใด ๆ

919
00:48:44,880 --> 00:48:46,490
การประมวลผลภาษาที่คุณมี

920
00:48:46,490 --> 00:48:49,140
ดังนั้นสิ่งที่มีความสำคัญ
สิ่งที่เกี่ยวกับไวยากรณ์?

921
00:48:49,140 --> 00:48:52,390
ดังนั้นประโยคโดยทั่วไปมี
สิ่งที่เราเรียกองค์ประกอบ

922
00:48:52,390 --> 00:48:57,080
ซึ่งเป็นชนิดเช่นกลุ่มของคำ
ที่มีฟังก์ชั่นในประโยค

923
00:48:57,080 --> 00:49:02,220
และพวกเขาไม่สามารถจริงๆ
ห่างจากกัน

924
00:49:02,220 --> 00:49:07,380
>> ดังนั้นถ้าผมพูดเช่น "ลอเรนรัก
ไมโล. "ฉันรู้ว่า" ลอเรน "เป็น

925
00:49:07,380 --> 00:49:10,180
ส่วนประกอบและแล้ว "ความรัก
ไมโล "ยังเป็นอีกหนึ่ง

926
00:49:10,180 --> 00:49:16,860
เพราะคุณไม่สามารถพูดได้เช่น "ลอเรนไมโล
รัก "จะมีความหมายเหมือนกัน

927
00:49:16,860 --> 00:49:18,020
มันไม่ได้เป็นไปได้
ความหมายเหมือนกัน

928
00:49:18,020 --> 00:49:22,500
หรือฉันไม่สามารถพูดเช่น "ไมโลลอเรน
รัก. "ทุกอย่างไม่ได้เหมือนกัน

929
00:49:22,500 --> 00:49:25,890
หมายถึงการทำที่

930
00:49:25,890 --> 00:49:31,940
>> ดังนั้นสองสิ่งที่สำคัญเพิ่มเติมเกี่ยวกับ
ไวยากรณ์เป็นประเภทซึ่งเป็นคำศัพท์

931
00:49:31,940 --> 00:49:35,390
โดยทั่วไปฟังก์ชั่นที่คุณ
มีคำด้วยตัวเอง

932
00:49:35,390 --> 00:49:39,180
ดังนั้นคุณต้องรู้ว่า "ลอเรน"
และ "ไมโล" เป็นคำนาม

933
00:49:39,180 --> 00:49:41,040
"ความรัก" เป็นคำกริยา

934
00:49:41,040 --> 00:49:45,660
และสิ่งที่สำคัญที่สองคือ
ว่าพวกเขากำลังชนิดวลี

935
00:49:45,660 --> 00:49:48,990
เพื่อให้คุณรู้ว่า "รักไมโล"
เป็นจริงเป็นวลีที่พูด

936
00:49:48,990 --> 00:49:52,390
ดังนั้นเมื่อผมพูดว่า "ลอเรน" ฉันรู้ว่า
ลอเรนจะทำบางสิ่งบางอย่าง

937
00:49:52,390 --> 00:49:53,620
เธอกำลังทำอะไร

938
00:49:53,620 --> 00:49:54,570
เธอรักไมโล

939
00:49:54,570 --> 00:49:56,440
ดังนั้นจึงเป็นสิ่งที่ทั้ง

940
00:49:56,440 --> 00:50:01,640
แต่ชิ้นส่วนที่มี
คำนามและคำกริยา

941
00:50:01,640 --> 00:50:04,210
แต่ร่วมกันพวกเขาให้คำกริยาวลี

942
00:50:04,210 --> 00:50:08,680
>> ดังนั้นสิ่งที่เราสามารถทำได้จริงด้วย
ภาษาศาสตร์?

943
00:50:08,680 --> 00:50:13,810
ดังนั้นถ้าฉันมีบางอย่างเช่น
"เพื่อนของแอลลิสัน." ผมเห็นถ้าฉันเพียงแค่

944
00:50:13,810 --> 00:50:17,440
ไม่ต้นไม้วากยสัมพันธ์ฉันอยากจะรู้ว่า
"เพื่อน" เป็นวลีคำนามเป็น

945
00:50:17,440 --> 00:50:21,480
คำนามและแล้ว "ของแอลลิสัน" เป็น
บุพบทวลีที่ "ของ" เป็น

946
00:50:21,480 --> 00:50:24,810
เรื่องและ "อัลลิสัน" เป็นคำนาม

947
00:50:24,810 --> 00:50:30,910
สิ่งที่ฉันสามารถทำคือการสอนคอมพิวเตอร์ของฉัน
ที่เมื่อฉันมีนามวลีหนึ่งและ

948
00:50:30,910 --> 00:50:33,080
แล้วบุพบทวลี

949
00:50:33,080 --> 00:50:39,020
ดังนั้นในกรณีนี้ "เพื่อน" แล้ว "ของ
ไมโล "ฉันรู้ว่านี้หมายความว่า

950
00:50:39,020 --> 00:50:43,110
NP2, คนที่สองเป็นเจ้าของ NP1

951
00:50:43,110 --> 00:50:47,680
>> ดังนั้นผมจึงสามารถสร้างชนิดของความสัมพันธ์บางอย่าง
บางชนิดของฟังก์ชั่นสำหรับมัน

952
00:50:47,680 --> 00:50:52,370
ดังนั้นเมื่อใดก็ตามที่ฉันเห็นโครงสร้างนี้ซึ่ง
ตรงที่ว่าด้วย "เพื่อนของ

953
00:50:52,370 --> 00:50:56,030
แอลลิสัน "ฉันรู้ว่าแอลลิสัน
เพื่อนที่เป็นเจ้าของ

954
00:50:56,030 --> 00:50:58,830
เพื่อให้เพื่อนเป็นสิ่งที่
แอลลิสันที่มี

955
00:50:58,830 --> 00:50:59,610
ทำให้รู้สึก?

956
00:50:59,610 --> 00:51:01,770
ดังนั้นนี่คือสิ่งที่โดยทั่วไป
ค้นหากราฟไม่

957
00:51:01,770 --> 00:51:04,360
มันก็จะสร้างกฎ
สำหรับจำนวนมากของสิ่งที่

958
00:51:04,360 --> 00:51:08,190
ดังนั้น "เพื่อนของแอลลิสัน", "เพื่อนของฉัน
ที่อาศัยอยู่ในเคมบริดจ์ "," เพื่อนของฉัน

959
00:51:08,190 --> 00:51:12,970
ที่ไปที่ฮาร์วาร์. "มันสร้างกฎระเบียบ
สำหรับทุกสิ่งเหล่านั้น

960
00:51:12,970 --> 00:51:14,930
>> ตอนนี้เครื่องแปลภาษา

961
00:51:14,930 --> 00:51:18,850
ดังนั้นเครื่องแปลภาษายังเป็น
บางสิ่งบางอย่างทางสถิติ

962
00:51:18,850 --> 00:51:21,340
และที่จริงถ้าคุณได้รับที่เกี่ยวข้องใน
ภาษาศาสตร์จำนวนมาก

963
00:51:21,340 --> 00:51:23,580
ข้อมูลของคุณเป็นไปได้สถิติ

964
00:51:23,580 --> 00:51:26,670
ดังนั้นขณะที่ผมกำลังทำตัวอย่างกับ
จำนวนมากที่มีความน่าจะเป็นว่าผมเป็น

965
00:51:26,670 --> 00:51:30,540
การคำนวณและจากนั้นคุณจะได้รับนี้
จำนวนน้อยมากที่สุดท้าย

966
00:51:30,540 --> 00:51:33,180
น่าจะเป็นและนั่นคือสิ่งที่
ช่วยให้คุณมีคำตอบ

967
00:51:33,180 --> 00:51:37,540
เครื่องแปลภาษานอกจากนี้ยังใช้
แบบจำลองทางสถิติ

968
00:51:37,540 --> 00:51:44,790
และถ้าคุณต้องการที่จะคิดของเครื่อง
แปลในที่ง่ายที่สุด

969
00:51:44,790 --> 00:51:48,970
วิธีที่สิ่งที่คุณสามารถคิดเป็นเพียง
แปลคำโดยคำใช่ไหม

970
00:51:48,970 --> 00:51:52,150
>> เมื่อคุณเรียนรู้ภาษาสำหรับ
ครั้งแรกที่มักจะสิ่งที่

971
00:51:52,150 --> 00:51:52,910
ที่คุณทำใช่ไหม

972
00:51:52,910 --> 00:51:57,050
ถ้าคุณต้องการคุณแปลประโยค
ในภาษาของคุณในการใช้ภาษา

973
00:51:57,050 --> 00:52:00,060
คุณกำลังเรียนรู้มักจะเป็นครั้งแรกที่คุณ
แปลแต่ละคำ

974
00:52:00,060 --> 00:52:03,180
เป็นรายบุคคลและจากนั้นคุณพยายาม
จะนำคำให้เข้าที่

975
00:52:03,180 --> 00:52:07,100
>> ดังนั้นถ้าผมต้องการที่จะแปลนี้
[พูดภาษาโปรตุเกส]

976
00:52:07,100 --> 00:52:10,430
ซึ่งหมายความว่า "แมวสีขาววิ่งหนีไป."
ถ้าผมต้องการที่จะแปลจาก

977
00:52:10,430 --> 00:52:13,650
โปรตุเกสเป็นภาษาอังกฤษสิ่งที่ฉัน
สามารถทำอะไรได้เป็นครั้งแรกที่ฉันเพียงแค่

978
00:52:13,650 --> 00:52:14,800
แปลตามพยัญชนะ

979
00:52:14,800 --> 00:52:20,570
ดังนั้น "o" เป็น "", "แมว", "แมว"
"กู", "สีขาว" แล้ว "fugio" เป็น

980
00:52:20,570 --> 00:52:21,650
"วิ่งหนีไป".

981
00:52:21,650 --> 00:52:26,130
>> ดังนั้นแล้วฉันมีคำทั้งหมดที่นี่
แต่พวกเขาไม่ได้อยู่ในลำดับที่

982
00:52:26,130 --> 00:52:29,590
มันก็เหมือน "สีขาวแมววิ่งหนีไป"
ซึ่งเป็นผิดไวยากรณ์

983
00:52:29,590 --> 00:52:34,490
ดังนั้นแล้วฉันจะมีขั้นตอนที่สองซึ่ง
เป็นไปได้ในการหาที่เหมาะ

984
00:52:34,490 --> 00:52:36,610
ตำแหน่งของแต่ละคำ

985
00:52:36,610 --> 00:52:40,240
ดังนั้นผมจึงรู้ว่าที่จริงผมต้องการที่จะมี
"แมวสีขาว" แทน "แมวสีขาว." ดังนั้น

986
00:52:40,240 --> 00:52:46,050
สิ่งที่ฉันสามารถทำได้คือวิธีไร้เดียงสามากที่สุด
จะสร้างทั้งหมด

987
00:52:46,050 --> 00:52:49,720
พีชคณิตเป็นไปได้ของ
คำของตำแหน่ง

988
00:52:49,720 --> 00:52:53,300
แล้วดูที่หนึ่งมี
น่าจะเป็นสูงสุดตาม

989
00:52:53,300 --> 00:52:54,970
กับรูปแบบภาษาของฉัน

990
00:52:54,970 --> 00:52:58,390
และจากนั้นเมื่อฉันพบหนึ่งที่มี
น่าจะเป็นสูงสุดมันซึ่งเป็น

991
00:52:58,390 --> 00:53:01,910
อาจจะ "แมวสีขาววิ่งออกไป"
ที่แปลของฉัน

992
00:53:01,910 --> 00:53:06,710
>> และนี่เป็นวิธีที่ง่ายในการอธิบาย
วิธีการจำนวนมากของเครื่องแปลภาษา

993
00:53:06,710 --> 00:53:07,910
ขั้นตอนวิธีการทำงาน

994
00:53:07,910 --> 00:53:08,920
ไม่ที่ทำให้รู้สึก?

995
00:53:08,920 --> 00:53:12,735
และนี่ก็เป็นสิ่งที่น่าตื่นเต้นจริงๆ
ที่พวกคุณอาจจะสามารถสำรวจ

996
00:53:12,735 --> 00:53:13,901
โครงการสุดท้ายใช่?

997
00:53:13,901 --> 00:53:15,549
>> นักเรียน: ดีคุณบอกว่ามันเป็น
วิธีที่ไร้เดียงสาดังนั้นสิ่งที่เป็น

998
00:53:15,549 --> 00:53:17,200
วิธีคิดที่ไม่ไร้เดียงสา?

999
00:53:17,200 --> 00:53:18,400
>> LUCAS FREITAS: วิธีคิดที่ไม่ไร้เดียงสา?

1000
00:53:18,400 --> 00:53:19,050
ตกลง

1001
00:53:19,050 --> 00:53:22,860
ดังนั้นสิ่งแรกที่ไม่ดีเกี่ยวกับ
วิธีการนี​​้เป็นที่ฉันเพียงแค่การแปล

1002
00:53:22,860 --> 00:53:24,330
คำคำโดยคำ

1003
00:53:24,330 --> 00:53:30,570
แต่บางครั้งคุณจะมีคำว่า
สามารถมีการแปลหลาย

1004
00:53:30,570 --> 00:53:32,210
ฉันจะพยายามที่จะคิด
บางสิ่งบางอย่าง

1005
00:53:32,210 --> 00:53:37,270
ตัวอย่างเช่น "มังงะ" ในภาษาโปรตุเกสสามารถ
อย่างใดอย่างหนึ่งเป็น "ฉีก" หรือ "แขน". ดังนั้น

1006
00:53:37,270 --> 00:53:40,450
เมื่อคุณกำลังพยายามที่จะแปลคำ
ด้วยคำพูดมันอาจจะให้คุณ

1007
00:53:40,450 --> 00:53:42,050
อะไรบางอย่างที่ทำให้รู้สึกไม่

1008
00:53:42,050 --> 00:53:45,770
>> เพื่อให้คุณจริงต้องการคุณดูที่ทั้งหมด
เป็นไปได้ของการแปล

1009
00:53:45,770 --> 00:53:49,840
คำพูดและการเห็นแรกของทั้งหมด
สิ่งที่เป็นคำสั่ง

1010
00:53:49,840 --> 00:53:52,000
เราได้พูดคุยเกี่ยวกับ Permutating
สิ่งที่?

1011
00:53:52,000 --> 00:53:54,150
เพื่อดูคำสั่งที่เป็นไปได้และ
เลือกหนึ่งที่มีมากที่สุด

1012
00:53:54,150 --> 00:53:54,990
ความน่าจะเป็น?

1013
00:53:54,990 --> 00:53:57,860
นอกจากนี้คุณยังสามารถเลือกที่เป็นไปได้ทั้งหมด
แปลสำหรับแต่ละ

1014
00:53:57,860 --> 00:54:00,510
คำแล้วดู -

1015
00:54:00,510 --> 00:54:01,950
รวมกับพีชคณิต -

1016
00:54:01,950 --> 00:54:03,710
ที่หนึ่งที่มีความน่าจะเป็นสูงสุด

1017
00:54:03,710 --> 00:54:08,590
>> นอกจากนี้คุณยังสามารถดูได้
คำเพียง แต่วลี

1018
00:54:08,590 --> 00:54:11,700
เพื่อให้คุณสามารถวิเคราะห์ความสัมพันธ์ระหว่าง
คำและจากนั้นได้รับ

1019
00:54:11,700 --> 00:54:13,210
การแปลที่ดีกว่า

1020
00:54:13,210 --> 00:54:16,690
นอกจากนี้ยังมีสิ่งอื่นเพื่อให้ภาคการศึกษานี้
ฉันจริงการทำวิจัยใน

1021
00:54:16,690 --> 00:54:19,430
ภาษาจีนภาษาอังกฤษแปลเครื่อง
เพื่อแปลจาก

1022
00:54:19,430 --> 00:54:20,940
ภาษาจีนเป็นภาษาอังกฤษ

1023
00:54:20,940 --> 00:54:26,760
>> และสิ่งที่เราทำคือนอกเหนือจากการใช้
แบบจำลองทางสถิติซึ่งเป็นเพียง

1024
00:54:26,760 --> 00:54:30,570
เห็นความเป็นไปได้ของการมองเห็น
ตำแหน่งในประโยคบางอย่างฉัน

1025
00:54:30,570 --> 00:54:35,360
จริงยังเพิ่มรูปแบบบางอย่างของฉัน
แบบว่าโอ้ถ้าผมเห็นแบบนี้

1026
00:54:35,360 --> 00:54:39,420
ของการก่อสร้างนี้เป็นสิ่งที่ฉันต้องการ
ที่จะเปลี่ยนไปเมื่อฉันแปล

1027
00:54:39,420 --> 00:54:43,880
เพื่อให้คุณยังสามารถเพิ่มชนิดของ
องค์ประกอบของไวยากรณ์ที่จะทำให้

1028
00:54:43,880 --> 00:54:47,970
แปลมีประสิทธิภาพมากขึ้น
และแม่นยำมากขึ้น

1029
00:54:47,970 --> 00:54:48,550
ตกลง

1030
00:54:48,550 --> 00:54:51,010
>> ดังนั้นวิธีที่สามารถให้คุณเริ่มต้นถ้าคุณต้องการ
ที่จะทำอะไรบางอย่างในการคำนวณ

1031
00:54:51,010 --> 00:54:51,980
ภาษาศาสตร์?

1032
00:54:51,980 --> 00:54:54,560
>> ขั้นแรกให้คุณเลือกโครงการ
ที่เกี่ยวข้องกับภาษา

1033
00:54:54,560 --> 00:54:56,310
ดังนั้นมีจำนวนมากออกมี

1034
00:54:56,310 --> 00:54:58,420
มีหลายสิ่งที่คุณสามารถทำได้

1035
00:54:58,420 --> 00:55:00,510
แล้วสามารถคิดรูปแบบ
ที่คุณสามารถใช้

1036
00:55:00,510 --> 00:55:04,710
มักจะหมายถึงการที่ความคิดของ
สมมติฐานที่เป็นเช่นโอ้เมื่อฉันถูก

1037
00:55:04,710 --> 00:55:05,770
เช่นความคิดของเนื้อเพลง

1038
00:55:05,770 --> 00:55:09,510
ฉันก็เหมือนกันถ้าผมต้องการที่จะคิด
ออกที่เขียนนี้ผมอาจต้องการ

1039
00:55:09,510 --> 00:55:15,400
การมองไปที่คำว่าคนที่ใช้และ
ดูว่าใครใช้คำว่าบ่อยมาก

1040
00:55:15,400 --> 00:55:18,470
จึงพยายามที่จะทำให้สมมติฐานและ
พยายามที่จะคิดในรูปแบบ

1041
00:55:18,470 --> 00:55:21,395
แล้วคุณยังสามารถค้นหาออนไลน์สำหรับ
ชนิดของปัญหาที่คุณมี

1042
00:55:21,395 --> 00:55:24,260
และก็จะให้คำแนะนำ
กับรุ่นที่คุณว่าอาจจะ

1043
00:55:24,260 --> 00:55:26,560
การสร้างแบบจำลองสิ่งที่ดี

1044
00:55:26,560 --> 00:55:29,080
>> และยังให้คุณสามารถส่งอีเมลฉัน

1045
00:55:29,080 --> 00:55:31,140
me@lfreitas.com

1046
00:55:31,140 --> 00:55:34,940
และผมก็สามารถตอบคำถามของคุณ

1047
00:55:34,940 --> 00:55:38,600
เราสามารถตอบสนองความต้องการก็อาจจะขึ้นเพื่อที่ฉันสามารถ
ให้คำแนะนำเกี่ยวกับวิธีการของ

1048
00:55:38,600 --> 00:55:41,490
การดำเนินการโครงการของคุณ

1049
00:55:41,490 --> 00:55:45,610
และฉันหมายความว่าถ้าคุณได้รับเกี่ยวข้องกับ
ภาษาศาสตร์ก็จะ

1050
00:55:45,610 --> 00:55:46,790
จะดี

1051
00:55:46,790 --> 00:55:48,370
คุณจะเห็นมี
มีศักยภาพมาก

1052
00:55:48,370 --> 00:55:52,060
และอุตสาหกรรมต้องการที่จะจ้าง
คุณเลวร้ายเพราะการที่

1053
00:55:52,060 --> 00:55:54,720
ดังนั้นผมหวังว่าพวกคุณจะสนุกกับนี้

1054
00:55:54,720 --> 00:55:57,030
ถ้าพวกคุณมีคำถามใด ๆ
คุณสามารถถามฉันหลังจากนี้

1055
00:55:57,030 --> 00:55:58,280
แต่ขอขอบคุณ

1056
00:55:58,280 --> 00:56:00,150