1 00:00:00,000 --> 00:00:02,928 >> [MUSIC CHƠI] 2 00:00:02,928 --> 00:00:11,230 3 00:00:11,230 --> 00:00:12,790 >> DAVID Malan: Đây là CS50. 4 00:00:12,790 --> 00:00:14,072 Đây là phần cuối của tuần 10. 5 00:00:14,072 --> 00:00:16,030 Và cậu bé, chúng ta có một lớp học tốt cho bạn ngày hôm nay. 6 00:00:16,030 --> 00:00:20,040 Chúng tôi rất vui mừng mời hai bạn bè của chúng tôi từ Yale lên để chúng ta hôm nay 7 00:00:20,040 --> 00:00:23,920 và nhìn vào các giao điểm của trí tuệ nhân tạo, robot, 8 00:00:23,920 --> 00:00:25,710 xử lý ngôn ngữ tự nhiên, và nhiều hơn nữa. 9 00:00:25,710 --> 00:00:27,090 >> Và quả thực, trong Vài tuần qua, chúng tôi đã 10 00:00:27,090 --> 00:00:29,714 chắc chắn đã dành rất nhiều thời gian, đặc biệt là trong các psets trước đó, 11 00:00:29,714 --> 00:00:31,560 tập trung vào khá chi tiết ở mức độ thấp. 12 00:00:31,560 --> 00:00:34,520 Và nó rất dễ dàng để mất thị giác của rừng cây 13 00:00:34,520 --> 00:00:38,170 và được treo lên trên mạch, điều kiện và con trỏ, chắc chắn, và như thế. 14 00:00:38,170 --> 00:00:41,770 Nhưng thực tế là các bạn bây giờ có thành phần mà bạn có thể thực sự 15 00:00:41,770 --> 00:00:45,300 giải quyết một số vấn đề thú vị, trong số họ những người bạn bè của chúng tôi tại Yale 16 00:00:45,300 --> 00:00:48,790 làm việc trên chỉ nhút nhát của Cambridge. 17 00:00:48,790 --> 00:00:52,410 >> Vì vậy, cho phép tôi đầu tiên giới thiệu đầu của chúng tôi giảng dạy trợ từ Yale, Andy. 18 00:00:52,410 --> 00:00:55,182 >> [Vỗ tay] 19 00:00:55,182 --> 00:00:57,030 20 00:00:57,030 --> 00:01:00,710 >> ANDY: Trước hết, chỉ cần cảm ơn bạn cho phép một vài Yalies 21 00:01:00,710 --> 00:01:02,700 để bật trên xuống Cambridge ngày hôm nay. 22 00:01:02,700 --> 00:01:05,299 Chúng tôi thực sự đánh giá cao nó. 23 00:01:05,299 --> 00:01:07,090 Thứ hai, để bạn bè của chúng tôi lại home-- Jason, 24 00:01:07,090 --> 00:01:09,670 cảm ơn cho ở lại và chạy bài giảng. 25 00:01:09,670 --> 00:01:12,970 Hy vọng tất cả đều tốt ở New Haven. 26 00:01:12,970 --> 00:01:15,720 >> Vì vậy, yeah, tôi vui mừng siêu để giới thiệu Scaz ngày hôm nay. 27 00:01:15,720 --> 00:01:17,020 Scaz chạy các phòng thí nghiệm robot. 28 00:01:17,020 --> 00:01:19,690 Anh ấy là một giáo sư, như, năm phòng ban khác nhau tại Yale. 29 00:01:19,690 --> 00:01:23,159 Trong phòng thí nghiệm của mình, ông đã có nhiều, rất nhiều robot mà anh thích chơi với. 30 00:01:23,159 --> 00:01:24,950 Ông có, như thế, việc nhạt nhẽo trong thế giới. 31 00:01:24,950 --> 00:01:27,116 Và anh ta sẽ đến loại lộn xộn xung quanh với tất cả các ngày 32 00:01:27,116 --> 00:01:29,090 dài và làm một số công việc, là tốt. 33 00:01:29,090 --> 00:01:33,070 >> Và vì vậy chúng tôi đã thực sự mang một của chúng xuống với chúng ta ngày nay. 34 00:01:33,070 --> 00:01:36,900 Vì vậy, không có thêm ado, Scaz là sẽ đi trước và giới thiệu chúng tôi 35 00:01:36,900 --> 00:01:38,660 cho bạn bè robot của mình. 36 00:01:38,660 --> 00:01:41,546 >> [Vỗ tay] 37 00:01:41,546 --> 00:01:42,935 38 00:01:42,935 --> 00:01:44,310 BRIAN SCASSELLATI: Thanks, David. 39 00:01:44,310 --> 00:01:45,380 Thanks, Andy. 40 00:01:45,380 --> 00:01:50,050 Nó là tuyệt vời để được ở đây với tất cả mọi người ngày nay. 41 00:01:50,050 --> 00:01:56,490 Tôi muốn đầu tiên là rất rõ ràng rằng các nhân viên ở đây CS50 ở Cambridge 42 00:01:56,490 --> 00:01:59,190 đã được vô cùng hiếu khách cho chúng tôi. 43 00:01:59,190 --> 00:02:02,130 Chúng tôi rất biết ơn tất cả mọi thứ họ đã làm để ủng hộ chúng tôi. 44 00:02:02,130 --> 00:02:05,690 Và vì vậy chúng tôi muốn để có thể để trả lại lòng tốt. 45 00:02:05,690 --> 00:02:09,370 >> Vì vậy, ngày hôm nay, chúng tôi nhận được thông báo rằng chúng ta sẽ có một mới, 46 00:02:09,370 --> 00:02:15,240 một-of-a-loại sự kiện CS50 xảy ra ở New Haven vào tuần tới. 47 00:02:15,240 --> 00:02:18,040 Và đây là những nghiên cứu Expo CS50. 48 00:02:18,040 --> 00:02:21,300 Vì vậy, chúng ta sẽ được mời everyone-- CS50 sinh viên, 49 00:02:21,300 --> 00:02:26,510 nhân viên từ cả Harvard và Yale-- để đi xuống và ghé thăm với chúng tôi vào ngày thứ Sáu. 50 00:02:26,510 --> 00:02:30,400 Chúng tôi sẽ có nhiều hơn 30 người khác nhau trình bày 51 00:02:30,400 --> 00:02:34,830 và upperclassmen exhibiting-- thấy off một số sản phẩm nghiên cứu của họ. 52 00:02:34,830 --> 00:02:38,480 Chúng tôi sẽ có một số phần khởi động, thậm chí, tìm kiếm cho một chút tài năng công nghệ mới, 53 00:02:38,480 --> 00:02:40,460 khởi động từ cả Harvard và Yale. 54 00:02:40,460 --> 00:02:44,550 Và chúng tôi sẽ có một số nhóm học sinh tìm kiếm một số thành viên mới. 55 00:02:44,550 --> 00:02:46,357 >> Nó sẽ là một thời gian rất thú vị. 56 00:02:46,357 --> 00:02:49,190 Hy vọng rằng với những người bạn là ai xuống cho các trò chơi Harvard-Yale 57 00:02:49,190 --> 00:02:51,360 sẽ có thể để ngăn chặn bởi một chút đầu, 58 00:02:51,360 --> 00:02:54,060 ngay tại trung tâm của khuôn viên trường, Thư viện Tưởng niệm Sterling. 59 00:02:54,060 --> 00:02:58,040 Chúng ta sẽ có một bộ tang vật có giá trị từ tự trị 60 00:02:58,040 --> 00:03:04,460 thuyền buồm đến cách sử dụng phần mềm giữ gìn bản thảo thời Trung cổ. 61 00:03:04,460 --> 00:03:07,860 >> Chúng ta sẽ có quảng cáo mạng hoc và người 62 00:03:07,860 --> 00:03:11,230 dạy phần mềm mã hóa ở Cape Town. 63 00:03:11,230 --> 00:03:13,730 Chúng tôi sẽ có máy tính các cuộc biểu tình âm nhạc. 64 00:03:13,730 --> 00:03:16,020 Và chúng tôi sẽ tất nhiên có nhiều robot. 65 00:03:16,020 --> 00:03:18,900 Vì vậy, chúng tôi hy vọng bạn sẽ tham gia với chúng tôi để sự kiện này. 66 00:03:18,900 --> 00:03:21,350 Nó nên được rất nhiều niềm vui, một chút thức ăn, 67 00:03:21,350 --> 00:03:24,430 và rất nhiều thú vị chuyện để nói. 68 00:03:24,430 --> 00:03:28,230 >> Vì vậy, ngày hôm nay, chúng ta sẽ nói chuyện về xử lý ngôn ngữ tự nhiên. 69 00:03:28,230 --> 00:03:32,560 Và đây là những nỗ lực cho chúng tôi để xây dựng một phương pháp mới để interfacing 70 00:03:32,560 --> 00:03:35,150 với các thiết bị của chúng tôi bởi vì trong vài tuần gần đây, 71 00:03:35,150 --> 00:03:40,800 bạn đã được tập trung vào việc làm thế nào mà bạn có thể viết mã, viết phần mềm 72 00:03:40,800 --> 00:03:47,110 đó là một cách để có thể nói đến một máy, đây là những gì tôi muốn bạn làm. 73 00:03:47,110 --> 00:03:50,210 >> Nhưng chúng ta không nên cần phải hy vọng rằng tất cả mọi thứ 74 00:03:50,210 --> 00:03:53,760 đó là ra khỏi đó được sử dụng bởi tất cả mọi người trên thế giới 75 00:03:53,760 --> 00:03:57,480 là có được thành thạo trong các loại hình hướng dẫn. 76 00:03:57,480 --> 00:04:02,540 Vì vậy, chúng ta phân biệt giữa máy tính ngôn ngữ và languages-- tự nhiên 77 00:04:02,540 --> 00:04:06,720 nghĩa là, những thứ mà con người sử dụng để giao tiếp với người khác. 78 00:04:06,720 --> 00:04:12,270 Và chúng tôi cố gắng để xây dựng giao diện sử dụng các cơ chế giao tiếp tự nhiên. 79 00:04:12,270 --> 00:04:16,029 >> Bây giờ, chỉ thích mỗi chủ đề khác mà chúng tôi đã bắt đầu với năm CS50, 80 00:04:16,029 --> 00:04:19,589 chúng ta sẽ bắt đầu với việc đơn giản nhất bit xử lý ngôn ngữ tự nhiên 81 00:04:19,589 --> 00:04:21,269 rằng chúng ta có thể tưởng tượng. 82 00:04:21,269 --> 00:04:24,940 Chúng ta sẽ bắt đầu với một phần lịch sử của ngôn ngữ tự nhiên. 83 00:04:24,940 --> 00:04:28,740 Và sau đó chúng tôi sẽ xây dựng lên đến hơn và nhiều hơn nữa hệ thống gần đây 84 00:04:28,740 --> 00:04:31,450 và có một số trình diễn vui vẻ trên đường đi. 85 00:04:31,450 --> 00:04:35,900 >> Vì vậy, chúng ta sẽ bắt đầu với những gì đã có lẽ là ngôn ngữ tự nhiên đầu tiên 86 00:04:35,900 --> 00:04:38,210 hệ thống xử lý. 87 00:04:38,210 --> 00:04:45,080 Đây là một hệ thống phần mềm được viết trong 1966 bởi Joseph Weizenbaum gọi là ELIZA. 88 00:04:45,080 --> 00:04:49,640 Và ELIZA được thiết kế để nhân rộng các loại tương tác 89 00:04:49,640 --> 00:04:53,850 bạn sẽ có một Trị liệu tâm lý Rogerian. 90 00:04:53,850 --> 00:04:57,210 Bây giờ, các Rogerians, họ đã có một ý tưởng rằng tâm lý 91 00:04:57,210 --> 00:05:02,800 liên quan đến việc có thể để phản ánh lại cho bệnh nhân và nói chuyện với họ, 92 00:05:02,800 --> 00:05:08,100 về cơ bản, chỉ cho họ một chút nhỏ bé của các bác sĩ chuyên khoa. 93 00:05:08,100 --> 00:05:09,920 Đó là, tất cả mọi thứ mà các bác sĩ chuyên khoa cho biết 94 00:05:09,920 --> 00:05:16,500 được cho là chỉ là một sự phản ánh của những bệnh nhân đã được nói với họ. 95 00:05:16,500 --> 00:05:18,990 >> Vì vậy, hãy cố gắng và bản demo này. 96 00:05:18,990 --> 00:05:22,820 Chúng ta có một tình nguyện viên người muốn được sẵn sàng chia sẻ sâu sắc nhất của họ, 97 00:05:22,820 --> 00:05:26,650 đen tối nhất, và / hoặc bí mật giả mạo với ELIZA? 98 00:05:26,650 --> 00:05:29,680 Chắc chắn, tại sao bạn không đến trên lên. 99 00:05:29,680 --> 00:05:30,847 Tuyệt diệu. 100 00:05:30,847 --> 00:05:31,430 Và tên của bạn? 101 00:05:31,430 --> 00:05:32,000 >> MILES: Miles. 102 00:05:32,000 --> 00:05:33,041 >> BRIAN SCASSELLATI: Miles. 103 00:05:33,041 --> 00:05:34,270 Rất vui được gặp bạn, Miles. 104 00:05:34,270 --> 00:05:36,270 Nếu em sẽ ôm chặt mà. 105 00:05:36,270 --> 00:05:40,840 Và chúng ta sẽ sử dụng một phiên bản của ELIZA 106 00:05:40,840 --> 00:05:44,640 mà chúng tôi đã nhân rộng trong IDE CS50. 107 00:05:44,640 --> 00:05:47,140 Và chúng ta sẽ xem xét các nguồn mã này trong một thời gian ngắn. 108 00:05:47,140 --> 00:05:49,910 Nhưng đối với ngay bây giờ, chúng tôi chỉ sẽ gọi nó bằng cách gõ eliza. 109 00:05:49,910 --> 00:05:55,480 >> Và ELIZA là sẽ cung cấp cho bạn câu trả lời rằng đang có được trong tất cả các thủ đô. 110 00:05:55,480 --> 00:05:57,950 Và sẽ hỏi bạn một số câu hỏi. 111 00:05:57,950 --> 00:06:02,130 Và chúng tôi sẽ đáp ứng và gõ trong phản ứng để ELIZA. 112 00:06:02,130 --> 00:06:04,310 Vì vậy, Eliza đã nói, "Xin chào, tôi là ELIZA. 113 00:06:04,310 --> 00:06:05,462 Vấn đề của bạn là gì?" 114 00:06:05,462 --> 00:06:08,092 Những gì bạn muốn nói ELIZA về ngày hôm nay? 115 00:06:08,092 --> 00:06:10,750 >> MILES: Tôi chỉ có thể rơi vào giấc ngủ nếu tôi có dép đi trong nhà chú thỏ trên. 116 00:06:10,750 --> 00:06:12,440 >> BRIAN SCASSELLATI: Tất cả các quyền. 117 00:06:12,440 --> 00:06:13,360 Được rồi. 118 00:06:13,360 --> 00:06:15,300 >> [Cười] 119 00:06:15,300 --> 00:06:22,410 >> "Tôi chỉ có thể rơi vào giấc ngủ với dép đi trong nhà thỏ về. " 120 00:06:22,410 --> 00:06:29,000 Và ELIZA nói, "Này, làm bạn có bất kỳ vấn đề tâm lý? 121 00:06:29,000 --> 00:06:30,450 Có lẽ đây là một dấu hiệu tốt. " 122 00:06:30,450 --> 00:06:30,780 >> ĐƯỢC. 123 00:06:30,780 --> 00:06:32,245 Vì vậy, những gì bạn muốn trả lời? 124 00:06:32,245 --> 00:06:36,110 125 00:06:36,110 --> 00:06:36,970 >> MILES: Yes. 126 00:06:36,970 --> 00:06:38,660 >> BRIAN SCASSELLATI: Yes. 127 00:06:38,660 --> 00:06:39,570 Man của nhiều từ. 128 00:06:39,570 --> 00:06:41,870 Tôi thích điều đó. 129 00:06:41,870 --> 00:06:50,200 Eliza nói, "Bạn có vẻ khá tích cực." 130 00:06:50,200 --> 00:06:53,200 >> MILES: Không, tôi, trên thực tế, một electron. 131 00:06:53,200 --> 00:06:55,150 >> BRIAN SCASSELLATI: "No. 132 00:06:55,150 --> 00:07:02,240 Trong thực tế, tôi là một electron. " "Em có đến với tôi 133 00:07:02,240 --> 00:07:06,954 bởi vì bạn là một electron? " 134 00:07:06,954 --> 00:07:08,870 Bây giờ, chúng ta có thể thấy một số các things-- tôi sẽ 135 00:07:08,870 --> 00:07:10,200 tạm dừng bạn cho chỉ một giây, Miles. 136 00:07:10,200 --> 00:07:11,010 Đừng đi bất cứ nơi nào. 137 00:07:11,010 --> 00:07:12,650 Chúng tôi không thực hiện với bạn chưa. 138 00:07:12,650 --> 00:07:16,490 ELIZA là, trong một số cách, ứng phó với những điều nhất định 139 00:07:16,490 --> 00:07:21,140 rằng ông đang nói nhưng không có bất kỳ sự hiểu biết thực sự. 140 00:07:21,140 --> 00:07:26,090 Và nó cũng parroting lại một số của các bộ phận của câu nói. 141 00:07:26,090 --> 00:07:27,310 >> Vì vậy, chúng tôi đã nói, "No. 142 00:07:27,310 --> 00:07:29,090 Trong thực tế, tôi là một electron. " 143 00:07:29,090 --> 00:07:34,190 Eliza đáp lại, "Em đi vì em là một điện tử? " 144 00:07:34,190 --> 00:07:34,690 Được rồi. 145 00:07:34,690 --> 00:07:36,050 Hãy cung cấp cho nó một trong nhiều phản ứng ở đây. 146 00:07:36,050 --> 00:07:37,140 Cung cấp cho nó một trong những tốt, Miles. 147 00:07:37,140 --> 00:07:37,806 >> MILES: Good one? 148 00:07:37,806 --> 00:07:48,400 149 00:07:48,400 --> 00:07:49,570 >> Vâng, xin vui lòng giúp đỡ tôi. 150 00:07:49,570 --> 00:07:50,570 BRIAN SCASSELLATI: "Có. 151 00:07:50,570 --> 00:07:58,010 Xin hãy giúp tôi. "" Anh chắc chứ? " 152 00:07:58,010 --> 00:07:58,510 MILES: No. 153 00:07:58,510 --> 00:08:00,860 BRIAN SCASSELLATI: No. 154 00:08:00,860 --> 00:08:03,562 "Cái đó gợi ý cho bạn?" 155 00:08:03,562 --> 00:08:06,760 >> MILES: Tôi có thể không một electron. 156 00:08:06,760 --> 00:08:11,170 >> BRIAN SCASSELLATI: "Tôi có thể không phải là một electron. " 157 00:08:11,170 --> 00:08:13,790 "Bạn có nói không chỉ để được tiêu cực?" 158 00:08:13,790 --> 00:08:14,390 >> Được rồi. 159 00:08:14,390 --> 00:08:16,030 Vì vậy, Miles, cảm ơn bạn rất nhiều. 160 00:08:16,030 --> 00:08:16,860 >> MILES: Cảm ơn bạn. 161 00:08:16,860 --> 00:08:18,360 >> BRIAN SCASSELLATI: Cảm ơn rất nhiều. 162 00:08:18,360 --> 00:08:20,230 [Vỗ tay] 163 00:08:20,230 --> 00:08:21,230 164 00:08:21,230 --> 00:08:26,700 >> Vì vậy, chương trình này ELIZA, bằng nhiều cách, được đáp ứng chỉ để các mảnh 165 00:08:26,700 --> 00:08:32,730 mà chúng tôi đang cung cấp mà không có bất kỳ sâu sự hiểu biết về những gì đang xảy ra ở đây. 166 00:08:32,730 --> 00:08:36,640 Đây là một loại hệ thống được gọi là mô hình kết hợp, nơi 167 00:08:36,640 --> 00:08:40,490 chúng tôi đang tìm kiếm nhất định bit của văn bản mà chúng tôi sau đó 168 00:08:40,490 --> 00:08:44,860 sẽ đưa ra những gì được cung cấp như là đầu vào, 169 00:08:44,860 --> 00:08:52,580 chuyển đổi nó, có thể, một cách nào đó, và sau đó đưa lại cho người sử dụng. 170 00:08:52,580 --> 00:08:55,150 >> Làm bất kỳ của bạn nghĩ mà thực sự là ELIZA 171 00:08:55,150 --> 00:08:58,230 thực hiện phân tâm học có giá trị ở đây? 172 00:08:58,230 --> 00:08:59,250 Một người, có lẽ. 173 00:08:59,250 --> 00:09:00,166 >> Đung [không nghe được]. 174 00:09:00,166 --> 00:09:03,315 175 00:09:03,315 --> 00:09:05,440 BRIAN SCASSELLATI: Và làm thế nào Điều đó làm cho bạn cảm thấy? 176 00:09:05,440 --> 00:09:06,530 Có, trong thực tế, nó. 177 00:09:06,530 --> 00:09:10,890 Và chúng ta sẽ thấy, trên thực tế, mã nguồn cho nó chỉ trong một khoảnh khắc. 178 00:09:10,890 --> 00:09:13,580 Và như vậy bạn sẽ được thể hiện chính xác này. 179 00:09:13,580 --> 00:09:17,420 >> Bây giờ, ELIZA là một trong những hình thức gì chúng tôi sẽ gọi ngày hôm nay chat bot. 180 00:09:17,420 --> 00:09:19,950 Nó chỉ đi qua văn bản mà bạn đang cung cấp, 181 00:09:19,950 --> 00:09:24,030 cung cấp số lượng tối thiểu hiểu biết hoặc chế biến, 182 00:09:24,030 --> 00:09:26,790 và sau đó vẹt nó lại cho bạn. 183 00:09:26,790 --> 00:09:31,830 Vì vậy, chúng ta hãy có một cái nhìn, khái niệm, và nói về những gì 184 00:09:31,830 --> 00:09:34,690 nó là ELIZA là thực sự làm. 185 00:09:34,690 --> 00:09:42,000 >> ELIZA được tham gia một let sentence-- của nói, "Tôi muốn gây ấn tượng với ông chủ của tôi." 186 00:09:42,000 --> 00:09:45,130 Và ELIZA đang tìm kiếm qua câu đó 187 00:09:45,130 --> 00:09:48,730 và cố gắng để tìm và phù hợp với các mẫu nhất định. 188 00:09:48,730 --> 00:09:52,850 Vì vậy, ví dụ, một trong những mô hình rằng ELIZA đang tìm kiếm là những lời 189 00:09:52,850 --> 00:09:55,110 "Tôi muốn." 190 00:09:55,110 --> 00:09:59,330 Và bất cứ lúc nào nó thấy một cái gì đó mà có "tôi muốn" trong đó, 191 00:09:59,330 --> 00:10:01,770 nó formulates một phản ứng. 192 00:10:01,770 --> 00:10:05,040 Và phản ứng đó là một chuỗi cố định. 193 00:10:05,040 --> 00:10:07,915 Trong trường hợp này, đó là "tại sao bạn muốn?" 194 00:10:07,915 --> 00:10:11,330 Và tôi đặt một ngôi sao nhỏ ở kết thúc bởi vì đó chỉ 195 00:10:11,330 --> 00:10:13,310 đầu phản ứng của chúng tôi. 196 00:10:13,310 --> 00:10:16,310 Và ngôi sao chỉ ra rằng chúng ta sẽ mất phần còn lại 197 00:10:16,310 --> 00:10:19,850 của utterance-- của người dùng "để gây ấn tượng với ông chủ của tôi" - 198 00:10:19,850 --> 00:10:24,500 và chúng ta sẽ phải nối thêm rằng vào cuối của chuỗi này. 199 00:10:24,500 --> 00:10:28,990 >> Vì vậy, bây giờ, thay vì nói: "tại sao Bạn muốn gây ấn tượng ông chủ của tôi, " 200 00:10:28,990 --> 00:10:31,800 có một chút thêm chế biến mà chúng ta sẽ làm. 201 00:10:31,800 --> 00:10:34,440 Đó là, chúng ta sẽ phải chuyển đổi một số các đại từ 202 00:10:34,440 --> 00:10:38,670 ở đây từ "ông chủ của tôi" thành "ông chủ của bạn." 203 00:10:38,670 --> 00:10:41,300 Và có thể có một vài khác thay đổi mà chúng ta cần phải thực hiện. 204 00:10:41,300 --> 00:10:44,990 Vì vậy, thay vì chỉ gắn bó nó trực tiếp lên cuối cùng, những gì chúng tôi sẽ làm 205 00:10:44,990 --> 00:10:49,160 là chúng ta sẽ mất phần còn lại của utterance-- của người dùng trong here-- trắng 206 00:10:49,160 --> 00:10:54,090 và chúng tôi sẽ mang nó một mảnh tại một thời gian và chuyển đổi từng chuỗi 207 00:10:54,090 --> 00:10:58,180 token, mỗi từ, thành câu. 208 00:10:58,180 --> 00:10:59,580 >> Vì vậy, chúng tôi sẽ lấy chữ "đến". 209 00:10:59,580 --> 00:11:01,650 Không có chuyển đổi rằng chúng ta cần phải làm điều đó. 210 00:11:01,650 --> 00:11:02,340 "Gây ấn tượng." 211 00:11:02,340 --> 00:11:04,140 Không có chuyển đổi chúng ta cần phải làm gì ở đó. 212 00:11:04,140 --> 00:11:06,670 "My" sẽ chuyển sang "của bạn." 213 00:11:06,670 --> 00:11:10,070 Và "ông chủ", chúng tôi sẽ chỉ để lại là "ông chủ". 214 00:11:10,070 --> 00:11:12,740 Và cuối cùng, bất cứ điều gì mà kết thúc với một khoảng thời gian, 215 00:11:12,740 --> 00:11:16,640 chúng tôi sẽ chuyển đổi nó thành một câu hỏi. 216 00:11:16,640 --> 00:11:22,600 >> Mô hình kết hợp rất đơn giản này thực sự là khá thành công. 217 00:11:22,600 --> 00:11:27,260 Và khi điều này đã được giới thiệu trong 1966-- Joseph Weizenbaum 218 00:11:27,260 --> 00:11:28,986 lập trình này trên một máy tính. 219 00:11:28,986 --> 00:11:31,110 Bây giờ, máy tính tại thời điểm đó không mô hình máy tính để bàn. 220 00:11:31,110 --> 00:11:33,950 Họ đã chia sẻ tài nguyên. 221 00:11:33,950 --> 00:11:39,090 Và học sinh của mình sẽ đi và chat với Eliza. 222 00:11:39,090 --> 00:11:41,570 Cuối cùng, ông đã phải hạn chế truy cập vào nó 223 00:11:41,570 --> 00:11:43,890 vì em học sinh đã không nhận được bất kỳ công việc thực hiện. 224 00:11:43,890 --> 00:11:46,190 Họ đã chỉ chat với Eliza. 225 00:11:46,190 --> 00:11:48,850 Và, trên thực tế, ông đã phải bắn trợ lý của ông, người 226 00:11:48,850 --> 00:11:55,840 dành tất cả thời gian của mình nói chuyện với ELIZA về vấn đề sâu sắc và đáng lo ngại của cô. 227 00:11:55,840 --> 00:12:00,350 >> Tất cả những người sử dụng các hệ thống này bắt đầu anthropomorphize họ. 228 00:12:00,350 --> 00:12:04,490 Họ bắt đầu nghĩ về họ như là animate và người thật. 229 00:12:04,490 --> 00:12:07,969 Họ bắt đầu nhận ra một số những điều mà họ nói 230 00:12:07,969 --> 00:12:09,010 đã trở lại với họ. 231 00:12:09,010 --> 00:12:12,120 Và họ đã tìm ra những điều về bản thân mình. 232 00:12:12,120 --> 00:12:17,290 Và, trên thực tế, ngay cả các chuyên gia, ngay cả những nhà tâm lý trị, 233 00:12:17,290 --> 00:12:22,930 bắt đầu lo lắng rằng, trên thực tế, có lẽ ELIZA sẽ thay thế chúng. 234 00:12:22,930 --> 00:12:25,640 Và ngay cả những máy tính các nhà khoa học lo lắng rằng chúng tôi đã 235 00:12:25,640 --> 00:12:30,040 rất gần đến việc giải quyết ngôn ngữ tự nhiên. 236 00:12:30,040 --> 00:12:33,520 >> Bây giờ, đó không phải là bất cứ nơi nào gần với sự thật. 237 00:12:33,520 --> 00:12:37,280 Nhưng đó là cách ấn tượng các hệ thống này có thể có vẻ. 238 00:12:37,280 --> 00:12:40,080 Vì vậy, chúng ta hãy bắt đầu tìm kiếm bên dưới và cố gắng 239 00:12:40,080 --> 00:12:46,190 để có được một chút của một câu hỏi nơi mã này thực sự xảy ra. 240 00:12:46,190 --> 00:12:48,170 Vì vậy, chúng tôi sẽ làm cho mã này có sẵn sau đó. 241 00:12:48,170 --> 00:12:50,880 Và điều này là rất cổng đơn giản và trực tiếp 242 00:12:50,880 --> 00:12:53,240 việc thực hiện ELIZA gốc. 243 00:12:53,240 --> 00:12:56,350 >> Vì vậy, một số trong những phong cách điều mà bạn sẽ thấy ở đây 244 00:12:56,350 --> 00:12:59,360 không phải là phong cách gì chúng ta sẽ muốn bạn làm 245 00:12:59,360 --> 00:13:01,480 hoặc những gì chúng tôi đã được giảng dạy bạn làm. 246 00:13:01,480 --> 00:13:04,770 Nhưng chúng tôi đã cố gắng để giữ cho chúng giống nhau trên nhiều cổng 247 00:13:04,770 --> 00:13:08,087 rằng điều này đã để nó có được hương vị của bản gốc. 248 00:13:08,087 --> 00:13:09,920 Vì vậy, chúng ta sẽ bao gồm một bó của sự vật, 249 00:13:09,920 --> 00:13:12,920 và sau đó chúng ta sẽ có một thiết lập các từ khóa, điều 250 00:13:12,920 --> 00:13:16,460 rằng ELIZA sẽ nhận ra và trả lời trực tiếp. 251 00:13:16,460 --> 00:13:20,780 Vì vậy, nếu bạn có những từ như "có thể giúp bạn" hay "Tôi không" hoặc "không" 252 00:13:20,780 --> 00:13:24,680 hoặc "có" hay "giấc mơ" hay "hello", sau đó ELIZA 253 00:13:24,680 --> 00:13:27,920 sẽ đáp ứng một cách chọn lọc để những người. 254 00:13:27,920 --> 00:13:30,010 Chúng tôi cũng sẽ có một số lượng nhất định của sự vật 255 00:13:30,010 --> 00:13:34,940 rằng chúng ta sẽ trao đổi, như chuyển đổi "tôi" thành "của bạn." 256 00:13:34,940 --> 00:13:39,920 >> Và sau đó chúng ta sẽ có một tập hợp các phản ứng rằng đối với mỗi của các từ khóa, 257 00:13:39,920 --> 00:13:42,580 chúng tôi sẽ xoay qua những phản ứng khác nhau. 258 00:13:42,580 --> 00:13:45,350 Vì vậy, nếu tôi nói "yes" ba lần liên tiếp, tôi 259 00:13:45,350 --> 00:13:50,429 có thể có được ba khác nhau phản hồi từ ELIZA. 260 00:13:50,429 --> 00:13:52,345 Mã của chúng tôi, sau đó, là thực sự đơn giản đáng kể. 261 00:13:52,345 --> 00:13:59,490 Nếu tôi di chuyển xuống qua tất cả các câu trả lời mà chúng ta đã được lập trình trong 262 00:13:59,490 --> 00:14:02,920 và chúng tôi nhận được xuống để chính chúng ta, chúng ta sẽ khởi tạo 263 00:14:02,920 --> 00:14:06,540 một vài biến số khác nhau và làm một chút việc nhà 264 00:14:06,540 --> 00:14:08,480 ở thời điểm bắt đầu. 265 00:14:08,480 --> 00:14:11,760 Nhưng sau đó có hoàn toàn một bộ mã mà bạn có thể hiểu được. 266 00:14:11,760 --> 00:14:15,820 Một vòng lặp trong khi lớn mà nói tôi đi lặp lại điều này hơn và hơn. 267 00:14:15,820 --> 00:14:20,420 Tôi sẽ đọc trong một dòng, và tôi sẽ lưu trữ trong một chuỗi đầu vào. 268 00:14:20,420 --> 00:14:23,880 Tôi sẽ kiểm tra và xem đó là từ khoá đặc biệt "bye", mà 269 00:14:23,880 --> 00:14:26,199 có nghĩa là thoát khỏi chương trình. 270 00:14:26,199 --> 00:14:29,240 Và sau đó tôi sẽ kiểm tra và xem liệu ai đó chỉ là lặp lại chính mình 271 00:14:29,240 --> 00:14:29,800 hêt lân nay tơi lân khac. 272 00:14:29,800 --> 00:14:31,174 Và tôi sẽ hét lên với họ nếu họ làm. 273 00:14:31,174 --> 00:14:34,820 Tôi sẽ nói "không lặp lại chính mình." 274 00:14:34,820 --> 00:14:40,500 >> Miễn là không ai trong số những người xảy ra, chúng tôi sẽ sau đó quét qua và lặp qua, 275 00:14:40,500 --> 00:14:45,330 trên dòng 308-313 ở đây, và kiểm tra và xem 276 00:14:45,330 --> 00:14:49,090 là bất kỳ của những từ khóa cụm từ chứa trong các đầu vào 277 00:14:49,090 --> 00:14:50,620 mà tôi đã được chỉ định? 278 00:14:50,620 --> 00:14:54,845 Nếu có một trận đấu cho họ, cũng Sau đó, tôi sẽ nhớ vị trí đó. 279 00:14:54,845 --> 00:14:57,050 Tôi sẽ nhớ từ khoá đó. 280 00:14:57,050 --> 00:14:58,620 Và tôi sẽ có thể xây dựng một phản ứng. 281 00:14:58,620 --> 00:15:03,150 >> Nếu tôi không tìm thấy một, cũng sau đó, điều cuối cùng trong mảng từ khoá của tôi 282 00:15:03,150 --> 00:15:08,070 sẽ là những phản ứng mặc định của tôi, khi không có gì khác phù hợp. 283 00:15:08,070 --> 00:15:14,160 Tôi sẽ hỏi những câu hỏi như "Tại sao bạn đến đây? "hay" Làm thế nào tôi có thể giúp bạn? " 284 00:15:14,160 --> 00:15:19,710 mà chỉ là một phần thích hợp không có vấn đề gì các đầu vào được. 285 00:15:19,710 --> 00:15:22,580 >> Sau đó chúng tôi sẽ xây dựng lên phản ứng của Eliza. 286 00:15:22,580 --> 00:15:26,040 Chúng tôi sẽ có thể mất rằng phản ứng của cơ sở, 287 00:15:26,040 --> 00:15:28,370 cũng như chúng ta đã làm trong đó "ông chủ của tôi" ví dụ. 288 00:15:28,370 --> 00:15:30,970 289 00:15:30,970 --> 00:15:33,990 Nếu đó là tất cả những gì có is-- nếu nó chỉ là một 290 00:15:33,990 --> 00:15:36,860 chuỗi mà tôi phải respond-- Tôi chỉ có thể gửi nó trở ra. 291 00:15:36,860 --> 00:15:40,610 Nếu nó có một dấu hoa thị ở kết thúc của nó, sau đó tôi sẽ 292 00:15:40,610 --> 00:15:45,710 xử lý mỗi thẻ cá nhân phần còn lại của phản ứng của người dùng 293 00:15:45,710 --> 00:15:51,590 và thêm vào thông tin trong trao đổi ra từng chữ như tôi cần. 294 00:15:51,590 --> 00:15:56,100 >> Tất cả điều này là hoàn toàn cái gì mà bạn có thể xây dựng. 295 00:15:56,100 --> 00:15:59,230 Và trên thực tế, những cách thức mà chúng ta có xử lý đối số dòng lệnh, 296 00:15:59,230 --> 00:16:03,570 cách thức mà bạn có xử lý thông qua các yêu cầu HTTP 297 00:16:03,570 --> 00:16:05,510 theo cùng loại của các quy tắc. 298 00:16:05,510 --> 00:16:08,220 Họ là mô hình kết hợp. 299 00:16:08,220 --> 00:16:15,170 >> Vì vậy, Eliza đã có một tương đối quan trọng tác động trên ngôn ngữ tự nhiên 300 00:16:15,170 --> 00:16:21,620 vì nó làm cho nó có vẻ như đó là một Mục tiêu rất đạt, như bằng cách nào đó, chúng tôi muốn 301 00:16:21,620 --> 00:16:25,550 có thể giải quyết vấn đề này trực tiếp. 302 00:16:25,550 --> 00:16:30,670 Bây giờ, điều đó không có nghĩa là ELIZA làm tất cả mọi thứ mà chúng tôi muốn làm. 303 00:16:30,670 --> 00:16:33,710 Chắc chắn không. 304 00:16:33,710 --> 00:16:35,660 Nhưng chúng ta có thể để làm một cái gì đó nhiều hơn. 305 00:16:35,660 --> 00:16:38,280 306 00:16:38,280 --> 00:16:41,490 >> Bước đầu tiên của chúng tôi để đi ngoài ELIZA sẽ 307 00:16:41,490 --> 00:16:44,840 để có thể nhìn vào không phải văn bản được nhập vào 308 00:16:44,840 --> 00:16:53,750 vào bàn phím nhưng bài phát biểu, thực tế bài phát biểu ghi vào một microphone. 309 00:16:53,750 --> 00:16:56,880 Vì vậy, khi chúng ta nhìn vào những phần khác nhau, chúng tôi 310 00:16:56,880 --> 00:17:00,304 sẽ phải xây dựng một tập các mô hình. 311 00:17:00,304 --> 00:17:02,970 Chúng tôi sẽ có để có thể để đi từ âm thanh ở mức độ thấp 312 00:17:02,970 --> 00:17:07,180 sân information--, biên độ, frequency-- 313 00:17:07,180 --> 00:17:09,530 và chuyển đổi đó vào một số đơn vị mà chúng tôi 314 00:17:09,530 --> 00:17:14,619 có thể dễ dàng thao tác hơn và, cuối cùng, vận dụng chúng 315 00:17:14,619 --> 00:17:18,609 thành các từ và câu. 316 00:17:18,609 --> 00:17:22,880 >> Vì vậy, hầu hết các nhận dạng giọng nói hệ thống được ra có ngày hôm nay 317 00:17:22,880 --> 00:17:26,069 theo một thống kê mô hình mà trong đó chúng ta xây dựng 318 00:17:26,069 --> 00:17:35,090 ba đại diện riêng biệt của những gì rằng tín hiệu âm thanh thực sự chứa. 319 00:17:35,090 --> 00:17:38,640 Chúng tôi bắt đầu với một mô hình ngữ âm mà nói về chỉ các cơ sở 320 00:17:38,640 --> 00:17:41,250 âm thanh mà tôi đang sản xuất. 321 00:17:41,250 --> 00:17:46,900 Tôi sản xuất cái gì đó là một B như trong trai hay D như ở con chó? 322 00:17:46,900 --> 00:17:53,220 Làm thế nào để tôi nhận ra những hai khác nhau điện thoại là riêng biệt? 323 00:17:53,220 --> 00:17:56,600 >> Ngày đầu đó, sau đó chúng ta sẽ xây dựng một mô hình phát âm của từ, 324 00:17:56,600 --> 00:18:01,350 cái gì mà liên kết với nhau những điện thoại cá nhân 325 00:18:01,350 --> 00:18:04,724 và kết hợp chúng thành một từ. 326 00:18:04,724 --> 00:18:07,890 Và sau đó, chúng tôi sẽ đưa các từ và chúng tôi sẽ lắp ráp chúng lại với một ngôn ngữ 327 00:18:07,890 --> 00:18:13,010 mô hình thành một câu hoàn chỉnh. 328 00:18:13,010 --> 00:18:17,230 >> Bây giờ, chúng ta sẽ nói về từng những cách độc lập và riêng rẽ. 329 00:18:17,230 --> 00:18:21,580 Nhưng ba mô hình là tất cả chỉ cần đi đến được thống kê. 330 00:18:21,580 --> 00:18:23,502 Và điều đó có nghĩa là khi chúng ta làm việc với họ, chúng tôi sẽ 331 00:18:23,502 --> 00:18:25,376 có thể làm việc với tất cả chúng cùng một lúc. 332 00:18:25,376 --> 00:18:28,100 333 00:18:28,100 --> 00:18:28,600 Được rồi. 334 00:18:28,600 --> 00:18:30,890 Hãy bắt đầu với mô hình ngữ âm của chúng tôi. 335 00:18:30,890 --> 00:18:34,470 Vì vậy, mô hình ngữ âm dựa trên một kỹ thuật tính toán 336 00:18:34,470 --> 00:18:37,320 gọi là mô hình Markov ẩn. 337 00:18:37,320 --> 00:18:43,050 Đây là những mô hình đồ họa, trong đó tôi có và công nhận một nhà nước của thế giới 338 00:18:43,050 --> 00:18:46,500 như đang được đặc trưng bởi một tập hợp các tính năng. 339 00:18:46,500 --> 00:18:51,960 Và nhà nước mà mô tả một phần của một hành động mà tôi đang tham gia vào. 340 00:18:51,960 --> 00:19:00,190 >> Vì vậy, nếu tôi nghĩ về việc làm những âm thanh "ma" như mẹ, 341 00:19:00,190 --> 00:19:03,970 có khác nhau thành phần âm thanh đó. 342 00:19:03,970 --> 00:19:07,230 Có một phần mà tôi rút ra trong hơi thở. 343 00:19:07,230 --> 00:19:09,560 Và sau đó tôi ví đôi môi của tôi. 344 00:19:09,560 --> 00:19:13,710 Và tôi cuộn đôi môi của tôi trở lại một chút bit để làm cho rằng "ma" âm thanh. 345 00:19:13,710 --> 00:19:15,340 Và sau đó là một bản phát hành. 346 00:19:15,340 --> 00:19:17,020 Đôi môi của tôi bung ra. 347 00:19:17,020 --> 00:19:19,030 Air là trục xuất. 348 00:19:19,030 --> 00:19:22,650 "Ma". 349 00:19:22,650 --> 00:19:29,250 >> Những ba phần khác nhau sẽ được đại diện của các quốc gia trong graph-- này 350 00:19:29,250 --> 00:19:33,420 sự khởi đầu, giữa, và cuối cùng. 351 00:19:33,420 --> 00:19:38,060 Và tôi sẽ có hiệu ứng chuyển tiếp cho phép tôi đi từ một nhà nước 352 00:19:38,060 --> 00:19:42,260 để tiếp theo với một xác suất nhất định. 353 00:19:42,260 --> 00:19:47,250 Vì vậy, ví dụ, rằng M âm thanh có thể có một rất, 354 00:19:47,250 --> 00:19:51,850 lượng rất ngắn ở beginning-- "mm" - và sau đó một dài hơn, 355 00:19:51,850 --> 00:19:55,640 giai đoạn rung nơi tôi đang cầm của tôi đôi môi lại với nhau và hầu như humming-- 356 00:19:55,640 --> 00:20:05,090 "mmmm" - và sau đó là một rất ngắn plosive nơi tôi đuổi breath-- "ma". 357 00:20:05,090 --> 00:20:09,370 >> Các mô hình Markov ẩn là được thiết kế để nắm bắt thực tế 358 00:20:09,370 --> 00:20:13,340 rằng cách mà tôi làm mà âm thanh "ma" đang đi 359 00:20:13,340 --> 00:20:17,350 là hơi khác nhau trong thời gian của nó, là tần số, 360 00:20:17,350 --> 00:20:21,030 và các tính năng của nó hơn cách mà bạn thực hiện nó 361 00:20:21,030 --> 00:20:23,300 hoặc theo cách mà tôi có thể làm cho nó khi tôi đang nói 362 00:20:23,300 --> 00:20:26,030 về mục đích sử dụng khác nhau của bức thư. 363 00:20:26,030 --> 00:20:33,240 "Mẹ" và "tôi có thể" sẽ âm thanh hơi khác nhau. 364 00:20:33,240 --> 00:20:36,800 >> Vì vậy, để nhận ra một âm thanh đặc biệt, chúng tôi sẽ 365 00:20:36,800 --> 00:20:42,020 xây dựng mô hình Markov, những ẩn Markov mô hình, của mỗi điện thoại có thể là tôi 366 00:20:42,020 --> 00:20:45,840 có thể muốn nhận, mọi âm thanh tốt, 367 00:20:45,840 --> 00:20:49,750 và sau đó nhìn vào dữ liệu âm thanh mà tôi có 368 00:20:49,750 --> 00:20:54,430 và xác định thống kê đó là một trong một trong những khả năng nhất 369 00:20:54,430 --> 00:20:58,110 đã sản xuất âm thanh này. 370 00:20:58,110 --> 00:20:58,610 ĐƯỢC. 371 00:20:58,610 --> 00:21:01,540 372 00:21:01,540 --> 00:21:06,750 Với mô hình này, sau đó chúng tôi bắt đầu xây dựng trên đầu trang của nó. 373 00:21:06,750 --> 00:21:09,330 Chúng tôi có một mô hình phát âm. 374 00:21:09,330 --> 00:21:11,790 Bây giờ, đôi khi phát âm mô hình rất đơn giản và dễ dàng 375 00:21:11,790 --> 00:21:14,440 bởi vì chỉ có một cách phát âm một cái gì đó. 376 00:21:14,440 --> 00:21:17,990 Những lần khác, họ là một chút chút phức tạp hơn. 377 00:21:17,990 --> 00:21:21,340 Đây là hướng dẫn phát âm cho rằng điều đó là màu đỏ 378 00:21:21,340 --> 00:21:25,210 một loại trái cây mà bạn làm nước sốt cà chua ra. 379 00:21:25,210 --> 00:21:27,360 Mọi người không nghĩ rằng đó là một loại trái cây. 380 00:21:27,360 --> 00:21:27,860 Bên phải? 381 00:21:27,860 --> 00:21:30,880 382 00:21:30,880 --> 00:21:35,300 >> Bây giờ, có rất nhiều cách khác nhau rằng mọi người sẽ phát âm từ này. 383 00:21:35,300 --> 00:21:37,780 Một số sẽ nói "toe-may-toe." 384 00:21:37,780 --> 00:21:40,880 Một số sẽ nói "toe-mah-toe." 385 00:21:40,880 --> 00:21:44,800 Và chúng ta có thể nắm bắt được rằng với một trong những mô hình đồ họa 386 00:21:44,800 --> 00:21:48,305 nơi, một lần nữa, chúng tôi đại diện cho quá trình chuyển đổi như có một xác suất nhất định 387 00:21:48,305 --> 00:21:51,360 và liên quan đến xác suất với họ. 388 00:21:51,360 --> 00:21:58,290 >> Vì vậy, trong trường hợp này, nếu tôi được làm theo các tuyến đường hàng đầu thông qua toàn bộ đồ này, 389 00:21:58,290 --> 00:22:03,330 Tôi sẽ được bắt đầu tại thư trên bên trái, các "ta" âm thanh. 390 00:22:03,330 --> 00:22:07,570 Tôi sẽ có một nửa trên, các "oh", và sau đó là "ma" 391 00:22:07,570 --> 00:22:14,530 và sau đó là một "một", và sau đó một "ta" và "oh." "Toe-may-toe." 392 00:22:14,530 --> 00:22:19,610 Nếu tôi đi theo con đường phía dưới thông qua này, tôi sẽ nhận được "ta-mah-toe." 393 00:22:19,610 --> 00:22:26,810 Và nếu tôi đã đi xuống và sau đó lên, tôi sẽ nhận được "ta-may-toe." 394 00:22:26,810 --> 00:22:29,950 >> Những mô hình này chụp những sự khác biệt bởi vì bất cứ khi nào 395 00:22:29,950 --> 00:22:32,410 chúng tôi triển khai một trong những hệ thống nhận dạng, 396 00:22:32,410 --> 00:22:35,340 nó sẽ phải làm việc với rất nhiều loại người khác nhau, 397 00:22:35,340 --> 00:22:39,295 rất nhiều giọng khác nhau, và thậm chí sử dụng khác nhau của cùng một từ. 398 00:22:39,295 --> 00:22:42,204 399 00:22:42,204 --> 00:22:44,120 Cuối cùng, trên đó, chúng tôi sẽ xây dựng một cái gì đó 400 00:22:44,120 --> 00:22:48,780 trông thực sự phức tạp, gọi là mô hình ngôn ngữ, 401 00:22:48,780 --> 00:22:52,950 nhưng trong thực tế là đơn giản nhất ba vì những hoạt động 402 00:22:52,950 --> 00:22:56,041 vào những gì được gọi là mô hình n-gram. 403 00:22:56,041 --> 00:23:02,270 Và trong trường hợp này, tôi thấy bạn hai phần mô hình n-gram, một Bigram. 404 00:23:02,270 --> 00:23:08,910 Chúng ta sẽ làm cho cơ thể các ý tưởng mà đôi khi, lời nói nhất định là 405 00:23:08,910 --> 00:23:14,680 nhiều khả năng để thực hiện theo một đưa ra từ hơn những người khác. 406 00:23:14,680 --> 00:23:25,210 Nếu tôi chỉ nói "dự báo thời tiết" từ tiếp theo khả năng có thể "ngày hôm nay" 407 00:23:25,210 --> 00:23:31,510 hoặc có thể là "thời tiết dự báo ngày mai. " 408 00:23:31,510 --> 00:23:38,870 Nhưng nó dường như không được " dự báo thời tiết atisô. " 409 00:23:38,870 --> 00:23:42,980 >> Thật là một mô hình ngôn ngữ nào là nó bắt những thống kê 410 00:23:42,980 --> 00:23:47,450 bằng cách đếm, từ một số rất lớn corpus, tất cả các trường hợp 411 00:23:47,450 --> 00:23:50,890 trong đó một từ sau khác. 412 00:23:50,890 --> 00:23:54,300 Vì vậy, nếu tôi có một corpus-- lớn như mọi Wall Street Journal 413 00:23:54,300 --> 00:24:00,750 đã được sản xuất từ ​​năm 1930, đó là một trong những tiêu chuẩn corpuses-- 414 00:24:00,750 --> 00:24:03,910 và tôi nhìn qua tất cả văn bản đó, và tôi đếm 415 00:24:03,910 --> 00:24:09,770 lên bao nhiêu lần sau "dự báo" tôi thấy "ngày hôm nay" 416 00:24:09,770 --> 00:24:17,454 và bao nhiêu lần tôi nhìn thấy "dự báo" tiếp theo là "atisô," 417 00:24:17,454 --> 00:24:19,370 người đầu tiên được đi có rất nhiều khả năng. 418 00:24:19,370 --> 00:24:21,540 Nó sẽ xuất hiện đến nay thường xuyên hơn. 419 00:24:21,540 --> 00:24:24,610 Và do đó, nó sẽ có một cao hơn xác suất liên kết với nó. 420 00:24:24,610 --> 00:24:27,340 >> Nếu tôi muốn tìm ra các xác suất của toàn bộ một lời nói, 421 00:24:27,340 --> 00:24:29,940 Sau đó, tôi chỉ phá vỡ nó lên. 422 00:24:29,940 --> 00:24:35,990 Vì vậy, xác suất của phiên điều trần câu "con chuột ăn pho mát" 423 00:24:35,990 --> 00:24:39,110 là xác suất của từ "các" bắt đầu từ một câu, 424 00:24:39,110 --> 00:24:42,540 và sau đó xác suất mà từ "chuột" sau từ "các" 425 00:24:42,540 --> 00:24:44,910 và xác suất mà Từ "ăn" sau "chuột" 426 00:24:44,910 --> 00:24:51,120 và xác suất "cheese" sau "ăn". 427 00:24:51,120 --> 00:24:55,160 >> Điều này nghe có vẻ như rất nhiều thống kê, rất nhiều khả năng. 428 00:24:55,160 --> 00:24:57,510 Và đó là tất cả những gì nó được. 429 00:24:57,510 --> 00:25:02,920 Nhưng điều ngạc nhiên là nếu bạn làm điều này với một mẫu đủ lớn dữ liệu, 430 00:25:02,920 --> 00:25:03,670 nó hoạt động. 431 00:25:03,670 --> 00:25:05,250 Và nó hoạt động rất tốt. 432 00:25:05,250 --> 00:25:07,810 433 00:25:07,810 --> 00:25:11,420 Chúng ta đều biết các công nghệ này. 434 00:25:11,420 --> 00:25:16,500 Hầu hết các hệ điều hành đi kèm với nhận dạng giọng nói vào thời điểm này. 435 00:25:16,500 --> 00:25:20,940 Chúng tôi sử dụng Siri và Cortana và Echo. 436 00:25:20,940 --> 00:25:25,070 Và những điều này được dựa trên loại này của ba lớp model-- 437 00:25:25,070 --> 00:25:30,620 một mô hình ngữ âm ở dưới cùng, một mô hình phát âm ở giữa, 438 00:25:30,620 --> 00:25:33,690 và một mô hình ngôn ngữ trên đầu trang của họ. 439 00:25:33,690 --> 00:25:37,630 >> Bây giờ, họ phải làm thêm một tí nữa hơn để trả lời câu hỏi. 440 00:25:37,630 --> 00:25:43,000 Nhưng việc công nhận những gì bạn đang nói chính xác phụ thuộc vào đó. 441 00:25:43,000 --> 00:25:45,700 Vì vậy, chúng ta hãy lấy một ví dụ ở đây. 442 00:25:45,700 --> 00:25:52,020 Vì vậy, tôi có điện thoại của mình, ngồi lên đây bên dưới máy ảnh tài liệu. 443 00:25:52,020 --> 00:25:56,110 Và chúng ta sẽ nhắc đi nhắc Siri là một vài câu hỏi. 444 00:25:56,110 --> 00:25:57,150 Được rồi? 445 00:25:57,150 --> 00:25:59,940 >> Vì vậy, hãy đánh thức điện thoại của tôi ở đây. 446 00:25:59,940 --> 00:26:02,710 447 00:26:02,710 --> 00:26:05,000 Siri, thời tiết là gì như ở New Haven ngày hôm nay? 448 00:26:05,000 --> 00:26:07,670 449 00:26:07,670 --> 00:26:10,780 >> Siri: Đây là thời tiết cho New Haven, Connecticut ngày hôm nay. 450 00:26:10,780 --> 00:26:11,890 >> BRIAN SCASSELLATI: OK. 451 00:26:11,890 --> 00:26:16,720 Vì vậy, đầu tiên bạn đã thấy rằng Siri công nhận mỗi từ cá nhân 452 00:26:16,720 --> 00:26:19,050 và sau đó tạo ra một phản ứng. 453 00:26:19,050 --> 00:26:22,277 Chúng tôi sẽ nói về cách phản ứng đó đi về trong một chút. 454 00:26:22,277 --> 00:26:24,110 Nhưng bây giờ mà chúng ta biết rằng đây chỉ là dựa 455 00:26:24,110 --> 00:26:28,880 về số liệu thô và điều này mô hình kiểu phù hợp của phương pháp tiếp cận, 456 00:26:28,880 --> 00:26:31,120 chúng ta có thể chơi một số trò chơi với Siri. 457 00:26:31,120 --> 00:26:34,560 >> Vì vậy, tôi có thể thử lại. 458 00:26:34,560 --> 00:26:38,864 Siri, thời tiết là gì hà mã New Haven, ngày hôm nay? 459 00:26:38,864 --> 00:26:39,810 >> Siri: OK. 460 00:26:39,810 --> 00:26:44,245 Đây là thời tiết cho New Haven, Connecticut cho ngày hôm nay. 461 00:26:44,245 --> 00:26:46,120 BRIAN SCASSELLATI: Siri không bị đe dọa bởi đó 462 00:26:46,120 --> 00:26:50,980 bởi vì nó được tìm thấy pattern-- "thời tiết", "ngày hôm nay", "New Haven." 463 00:26:50,980 --> 00:26:54,420 Đó là những gì nó đáp ứng để, chỉ thích ELIZA. 464 00:26:54,420 --> 00:26:54,920 Được rồi. 465 00:26:54,920 --> 00:26:59,390 Hãy cung cấp cho nó một nhiều hơn, ngay cả nhiều ví dụ vô lý. 466 00:26:59,390 --> 00:27:03,075 Siri, thời tiết atisô armadillo hà mã New Haven? 467 00:27:03,075 --> 00:27:06,806 468 00:27:06,806 --> 00:27:08,400 >> Siri: Hãy để tôi kiểm tra trên đó. 469 00:27:08,400 --> 00:27:11,280 Đây là những gì tôi tìm thấy trên web cho atisô Armadillo là gì 470 00:27:11,280 --> 00:27:13,780 hà mã New Haven. 471 00:27:13,780 --> 00:27:14,760 >> BRIAN SCASSELLATI: OK. 472 00:27:14,760 --> 00:27:20,400 Vì vậy, nếu tôi đi đủ xa đi từ mô hình này, 473 00:27:20,400 --> 00:27:24,365 Tôi có thể nhầm lẫn nó bởi vì nó không có còn phù hợp với mô hình mà nó có. 474 00:27:24,365 --> 00:27:27,370 475 00:27:27,370 --> 00:27:29,390 Và đó thống kê động cơ đó là nói, 476 00:27:29,390 --> 00:27:32,850 khả năng bạn đã có những gì từ hà mã và atisô 477 00:27:32,850 --> 00:27:34,440 với nhau, và Armadillo? 478 00:27:34,440 --> 00:27:36,050 Đó là đã nhận được một cái gì đó mới. 479 00:27:36,050 --> 00:27:38,840 480 00:27:38,840 --> 00:27:40,610 >> Vì vậy, các công nghệ này chúng ta sử dụng hàng ngày. 481 00:27:40,610 --> 00:27:43,670 482 00:27:43,670 --> 00:27:47,800 Nếu chúng ta muốn đưa họ một bước hơn nữa, tuy nhiên, nếu chúng ta thực sự 483 00:27:47,800 --> 00:27:53,930 muốn có thể nói về những gì nó là các hệ thống này được đáp ứng, 484 00:27:53,930 --> 00:28:00,630 chúng ta phải nói chuyện, một lần nữa, về một thiết lập cơ bản hơn của câu hỏi. 485 00:28:00,630 --> 00:28:05,370 Và đó là một chủ đề trong giao tiếp mà chúng ta gọi là câu hỏi trả lời. 486 00:28:05,370 --> 00:28:07,028 Đó là, chúng tôi muốn có thể đối với: yeah? 487 00:28:07,028 --> 00:28:07,944 Đung [không nghe được]. 488 00:28:07,944 --> 00:28:10,789 489 00:28:10,789 --> 00:28:13,330 BRIAN SCASSELLATI: Liệu chúng ta có được vào chế biến ngữ nghĩa tiềm ẩn? 490 00:28:13,330 --> 00:28:14,070 Vì vậy, có. 491 00:28:14,070 --> 00:28:17,820 Có rất nhiều điều mà xảy ra bên dưới bề mặt với Siri 492 00:28:17,820 --> 00:28:20,210 và trong một số ví dụ Tôi sẽ chỉ cho bạn tiếp theo 493 00:28:20,210 --> 00:28:22,610 nơi có khá một chút về cấu trúc 494 00:28:22,610 --> 00:28:25,260 về những gì bạn đang nói đó là quan trọng. 495 00:28:25,260 --> 00:28:31,890 Và, trên thực tế, đó là một tuyệt vời tiền chất cho các slide tiếp theo đối với tôi. 496 00:28:31,890 --> 00:28:35,110 >> Vì vậy, trong cùng một cách mà chúng tôi nhận dạng giọng nói đã được xây dựng 497 00:28:35,110 --> 00:28:39,620 nhiều lớp, nếu chúng ta muốn hiểu nó là gì đó là thực sự 498 00:28:39,620 --> 00:28:44,620 đang được nói, chúng ta sẽ một lần nữa dựa trên một phân tích đa lớp 499 00:28:44,620 --> 00:28:47,020 của văn bản đó được công nhận. 500 00:28:47,020 --> 00:28:52,560 Vì vậy, khi Siri là thực sự có thể nói, nhìn tôi thấy những lời này. 501 00:28:52,560 --> 00:28:55,230 Bây giờ tôi phải làm gì với họ? 502 00:28:55,230 --> 00:28:59,110 Các thành phần đầu tiên thường là đi qua và cố gắng phân tích 503 00:28:59,110 --> 00:29:03,010 cấu trúc câu. 504 00:29:03,010 --> 00:29:05,410 Và trong những gì chúng ta đã thấy ở trường lớp, thường xuyên, 505 00:29:05,410 --> 00:29:08,920 là loại biểu đồ câu, chúng ta đang đi 506 00:29:08,920 --> 00:29:12,774 để nhận ra rằng nhất định từ có vai trò nhất định. 507 00:29:12,774 --> 00:29:13,440 Đây là danh từ. 508 00:29:13,440 --> 00:29:14,231 Đây là những đại từ. 509 00:29:14,231 --> 00:29:16,200 Đây là những động từ. 510 00:29:16,200 --> 00:29:19,460 Và chúng ta sẽ nhận ra rằng đối với một ngữ pháp cụ thể, 511 00:29:19,460 --> 00:29:24,700 trong trường hợp này ngữ pháp tiếng Anh, có cách hợp lệ, trong đó tôi có thể kết hợp chúng 512 00:29:24,700 --> 00:29:26,280 và những cách khác mà không phải là hợp lệ. 513 00:29:26,280 --> 00:29:29,920 514 00:29:29,920 --> 00:29:33,870 >> Công nhận rằng, cấu trúc đó, có thể là đủ để giúp hướng dẫn cho chúng tôi 515 00:29:33,870 --> 00:29:36,720 một chút. 516 00:29:36,720 --> 00:29:39,820 Nhưng nó không hoàn toàn đủ để chúng tôi có thể cung cấp cho 517 00:29:39,820 --> 00:29:43,290 bất kỳ ý nghĩa cho những gì đang được nói ở đây. 518 00:29:43,290 --> 00:29:46,615 Để làm điều đó, chúng ta sẽ phải dựa trên một số lượng xử lý ngữ nghĩa. 519 00:29:46,615 --> 00:29:49,590 520 00:29:49,590 --> 00:29:55,080 Đó là, chúng ta sẽ phải tìm ở bên dưới những gì mỗi người trong các từ 521 00:29:55,080 --> 00:29:57,400 thực sự mang ý nghĩa như một. 522 00:29:57,400 --> 00:30:01,150 Và trong những cách đơn giản nhất để làm điều này, chúng ta sẽ kết hợp với mỗi từ 523 00:30:01,150 --> 00:30:06,930 mà chúng ta biết một chức năng nhất định, một sự biến đổi nhất định mà nó 524 00:30:06,930 --> 00:30:09,300 cho phép xảy ra. 525 00:30:09,300 --> 00:30:14,470 >> Trong trường hợp này, chúng ta có thể đặt tên Từ "John" như là một tên riêng, 526 00:30:14,470 --> 00:30:18,160 mà nó mang theo nó một sắc. 527 00:30:18,160 --> 00:30:21,530 Và chúng ta có thể đặt tên "Mary" như cùng một cách. 528 00:30:21,530 --> 00:30:27,900 Trong khi đó, một động từ như "yêu", mà tạo thành một mối quan hệ đặc biệt 529 00:30:27,900 --> 00:30:31,582 rằng chúng tôi có thể đại diện. 530 00:30:31,582 --> 00:30:33,290 Bây giờ, đó không có nghĩa chúng ta hiểu 531 00:30:33,290 --> 00:30:37,680 tình yêu là gì mà chỉ nói rằng chúng ta hiểu nó theo cách của một hệ thống biểu tượng. 532 00:30:37,680 --> 00:30:40,480 Đó là, chúng ta có thể gắn nhãn nó và vận dụng nó. 533 00:30:40,480 --> 00:30:44,230 534 00:30:44,230 --> 00:30:49,120 >> Với mỗi loại phương pháp tiếp cận, bất kỳ loại xử lý ngữ nghĩa 535 00:30:49,120 --> 00:30:57,060 ở đây là sẽ đòi hỏi một chút chút kiến ​​thức và rất nhiều công việc 536 00:30:57,060 --> 00:30:59,020 về phía chúng tôi. 537 00:30:59,020 --> 00:31:03,590 Chúng tôi không còn trong lĩnh vực nơi thống kê chỉ là đồng bằng 538 00:31:03,590 --> 00:31:07,320 sẽ là đủ cho chúng ta. 539 00:31:07,320 --> 00:31:11,330 Bây giờ, để đi từ điểm này đến được 540 00:31:11,330 --> 00:31:15,520 có thể nói về bên trong những gì đang thực sự xảy ra ở đây, 541 00:31:15,520 --> 00:31:19,640 để có thể thao tác này cấu trúc và hiểu một câu hỏi 542 00:31:19,640 --> 00:31:23,160 và sau đó có thể đi ra ngoài và tìm kiếm, 543 00:31:23,160 --> 00:31:27,290 mà đòi hỏi một nhiều hơn mô hình nhận thức phức tạp. 544 00:31:27,290 --> 00:31:34,880 >> Cách thức mà các hệ thống này được xây dựng là đối với hầu hết các phần rất, rất lao động 545 00:31:34,880 --> 00:31:36,350 chuyên sâu. 546 00:31:36,350 --> 00:31:39,490 Chúng liên quan đến con người chi tiêu rất 547 00:31:39,490 --> 00:31:44,100 thời gian cơ cấu lại các cách thức mà các loại câu 548 00:31:44,100 --> 00:31:47,270 có thể được biểu diễn trong một số logic. 549 00:31:47,270 --> 00:31:51,639 550 00:31:51,639 --> 00:31:53,430 Nó được thậm chí một chút phức tạp hơn, mặc dù. 551 00:31:53,430 --> 00:31:56,400 552 00:31:56,400 --> 00:31:59,660 >> Ngay cả khi chúng tôi đã xử lý với ngữ nghĩa, chúng tôi sẽ 553 00:31:59,660 --> 00:32:03,860 vẫn phải nhìn vào ngữ dụng của những gì đang được nói. 554 00:32:03,860 --> 00:32:08,620 Đó là, làm thế nào để tôi liên quan từ rằng tôi có một cái gì đó ra khỏi cơ thể 555 00:32:08,620 --> 00:32:12,054 có trên thế giới hay ở ít nhất là một số nguồn thông tin 556 00:32:12,054 --> 00:32:12,970 mà tôi có thể thao tác? 557 00:32:12,970 --> 00:32:15,780 558 00:32:15,780 --> 00:32:20,790 >> Đôi khi, những dẫn đến bit tuyệt vời của sự mơ hồ. 559 00:32:20,790 --> 00:32:24,470 "Red-hot sao để cưới nhà thiên văn học." 560 00:32:24,470 --> 00:32:25,630 ĐƯỢC. 561 00:32:25,630 --> 00:32:28,540 Bây giờ, chúng ta đọc thấy như loại hài hước của tiêu đề 562 00:32:28,540 --> 00:32:34,690 rằng chúng ta sẽ nhìn thấy trên truyền hình đêm khuya bởi vì chúng tôi không giải thích "ngôi sao" 563 00:32:34,690 --> 00:32:38,630 có ý nghĩa thiên thể của nó. 564 00:32:38,630 --> 00:32:43,390 Chúng tôi biết rằng nó có nghĩa là nhiều hơn diễn viên thường hay nữ diễn viên 565 00:32:43,390 --> 00:32:45,240 với số tiền cao của tầm nhìn. 566 00:32:45,240 --> 00:32:47,770 567 00:32:47,770 --> 00:32:51,950 >> "Squad giúp nạn nhân chó cắn." 568 00:32:51,950 --> 00:32:55,550 Là nó mà đội hình thực sự ra có hỗ trợ một con chó 569 00:32:55,550 --> 00:32:59,620 trong ra xung quanh và cắn nạn nhân? 570 00:32:59,620 --> 00:33:02,380 Hoặc là nó mà là có một cá nhân là ai 571 00:33:02,380 --> 00:33:04,625 chó cắn người cần sự giúp đỡ? 572 00:33:04,625 --> 00:33:07,650 573 00:33:07,650 --> 00:33:11,480 Chỉ từ nhìn vào cú pháp và ngữ nghĩa của các câu, 574 00:33:11,480 --> 00:33:14,660 chúng tôi không thể xác định đó. 575 00:33:14,660 --> 00:33:22,000 >> "Máy bay trực thăng chạy bằng ruồi của con người." 576 00:33:22,000 --> 00:33:27,330 Có, trên thực tế, thực tế những điều nhỏ bay xung quanh đó 577 00:33:27,330 --> 00:33:34,510 là những người có đôi cánh tạo năng lượng máy bay trực thăng cho lợi ích của nhân loại? 578 00:33:34,510 --> 00:33:38,960 Hoặc là có một thiết bị cơ khí có nguồn gốc sức mạnh của nó từ một người? 579 00:33:38,960 --> 00:33:41,600 580 00:33:41,600 --> 00:33:46,500 >> Khi chúng ta nhìn vào câu hỏi Hệ thống trả lời, 581 00:33:46,500 --> 00:33:51,110 đây là các lớp mà chúng ta cần phải giải quyết. 582 00:33:51,110 --> 00:33:54,890 Bây giờ, là tốt nhất và các loại nhất phổ biến của các hệ thống này 583 00:33:54,890 --> 00:34:00,640 hiện nay có thể làm mọi thứ ở một mức độ mà là 584 00:34:00,640 --> 00:34:05,050 vượt xa những gì chúng tôi đã có 10 năm trước đây. 585 00:34:05,050 --> 00:34:08,210 Đây là một trong những hệ thống tốt nhất đó là không phải hôm nay. 586 00:34:08,210 --> 00:34:10,519 Và đây là một hệ thống từ IBM gọi là Watson. 587 00:34:10,519 --> 00:34:13,040 588 00:34:13,040 --> 00:34:15,500 Đây là từ bạn bè của chúng tôi tại IBM. 589 00:34:15,500 --> 00:34:19,810 Đây là ngân hàng Katherine, Jia Chen, và Priscilla Moraes cho chúng tôi 590 00:34:19,810 --> 00:34:26,323 một cuộc biểu tình của Watson ngày hôm qua tại IBM ở Yorktown. 591 00:34:26,323 --> 00:34:26,989 [VIDEO PLAYBACK] 592 00:34:26,989 --> 00:34:27,690 -Bạn khỏe không? 593 00:34:27,690 --> 00:34:30,600 594 00:34:30,600 --> 00:34:31,980 >> -Tôi khỏe. 595 00:34:31,980 --> 00:34:35,429 Tôi luôn luôn hạnh phúc khi tôi suy nghĩ, đặc biệt là khi tôi 596 00:34:35,429 --> 00:34:38,920 có thể giữ lạnh trong các phòng máy chủ. 597 00:34:38,920 --> 00:34:40,170 -Ai Nữ diễn viên yêu thích của bạn là? 598 00:34:40,170 --> 00:34:43,870 599 00:34:43,870 --> 00:34:47,555 >> Nữ diễn viên yêu thích -My Angelina Jolie như Lara Croft 600 00:34:47,555 --> 00:34:54,800 trong Tomb Raider vì ban đầu cô hình thức là một nhân vật ảo như tôi. 601 00:34:54,800 --> 00:34:56,760 >> -Làm Thế nào Watson có thể giúp bệnh nhân? 602 00:34:56,760 --> 00:34:59,700 603 00:34:59,700 --> 00:35:03,755 >> -là Những kế hoạch cho bệnh nhân có thể truy cập trực tiếp Watson? 604 00:35:03,755 --> 00:35:08,050 Truy cập vào Watson tư vấn ứng dụng sẽ thay đổi theo từng trường hợp sử dụng. 605 00:35:08,050 --> 00:35:12,630 Nhưng hiện tại, Watson sẽ chỉ cung cấp chẩn đoán và điều trị có thể 606 00:35:12,630 --> 00:35:14,725 tùy chọn để chuyên gia y tế. 607 00:35:14,725 --> 00:35:17,680 Khi thích hợp, bệnh nhân có thể cung cấp thông tin 608 00:35:17,680 --> 00:35:21,210 Watson, có thể thông qua một giao diện web cổng thông tin, máy tính bảng, 609 00:35:21,210 --> 00:35:23,500 hoặc thậm chí là một điện thoại di động. 610 00:35:23,500 --> 00:35:27,180 Ví dụ, một bệnh nhân có thể yêu cầu mô tả các triệu chứng của họ 611 00:35:27,180 --> 00:35:30,460 trong ngôn ngữ tự nhiên trực tiếp thành một giải pháp Watson, 612 00:35:30,460 --> 00:35:34,050 cho phép các bác sĩ tập trung vào chẩn đoán và không thu thập dữ liệu. 613 00:35:34,050 --> 00:35:38,379 614 00:35:38,379 --> 00:35:42,716 >> -Ai Ám sát Abraham Lincoln? 615 00:35:42,716 --> 00:35:46,153 >> -John Wilkes Booth. 616 00:35:46,153 --> 00:35:52,373 >> -Trong Những năm đã làm Arizona Diamondbacks giành chiến thắng trong World Series? 617 00:35:52,373 --> 00:35:55,295 >> -2001. 618 00:35:55,295 --> 00:35:58,710 >> [END PLAYBACK] 619 00:35:58,710 --> 00:36:01,610 >> BRIAN SCASSELLATI: Vì vậy, các loại hệ thống 620 00:36:01,610 --> 00:36:07,430 phải dựa vào đầu tiên của tất cả các công nhận lời nói; lần thứ hai, 621 00:36:07,430 --> 00:36:12,200 chuyển đổi nó thành một nội bộ đầy ý nghĩa đại diện; và sau đó, thứ ba, 622 00:36:12,200 --> 00:36:17,090 là có thể đi ra ngoài và tìm các nguồn thông tin mà 623 00:36:17,090 --> 00:36:21,140 cho phép họ để trả lời câu hỏi đó. 624 00:36:21,140 --> 00:36:27,320 Mức độ phức tạp liên quan đến cùng loại của các chương trình điều 625 00:36:27,320 --> 00:36:31,790 mà bạn đã làm trong bộ vấn đề. 626 00:36:31,790 --> 00:36:38,000 >> Chúng tôi có thể phân tích các yêu cầu HTTP trong cùng loại của các mô hình cấp thấp 627 00:36:38,000 --> 00:36:40,810 phù hợp mà ELIZA có thể làm. 628 00:36:40,810 --> 00:36:45,070 Chúng tôi có thể chuyển đổi các thành một đại diện nội bộ, 629 00:36:45,070 --> 00:36:50,360 và sau đó sử dụng chúng để truy vấn một số cơ sở dữ liệu bên ngoài, có thể sử dụng SQL. 630 00:36:50,360 --> 00:36:53,530 631 00:36:53,530 --> 00:36:56,260 Tất cả các hệ thống đang được xây dựng ngày nay 632 00:36:56,260 --> 00:37:00,520 để làm điều này loại tự nhiên giao tiếp ngôn ngữ 633 00:37:00,520 --> 00:37:04,100 đang được xây dựng dựa trên những nguyên tắc tương tự. 634 00:37:04,100 --> 00:37:09,530 >> Bây giờ, ngay cả một hệ thống như Watson là không đủ phức tạp 635 00:37:09,530 --> 00:37:14,820 để có thể trả lời tùy ý câu hỏi về bất kỳ chủ đề. 636 00:37:14,820 --> 00:37:20,060 Và trên thực tế, họ có được cấu trúc bên trong một tên miền nhất định. 637 00:37:20,060 --> 00:37:24,440 Vì vậy, bạn có thể lên mạng và bạn có thể tìm thấy phiên bản của Watson rằng hoạt động tốt 638 00:37:24,440 --> 00:37:27,700 trong tin học y tế. 639 00:37:27,700 --> 00:37:31,490 Hoặc có một trực tuyến mà chỉ đề với cách 640 00:37:31,490 --> 00:37:34,540 để thực hiện các khuyến nghị tốt về những gì bia sẽ đi mà ăn. 641 00:37:34,540 --> 00:37:37,060 642 00:37:37,060 --> 00:37:41,870 Và trong những lĩnh vực, nó có thể trả lời câu hỏi, 643 00:37:41,870 --> 00:37:46,130 tìm thấy những thông tin mà nó cần. 644 00:37:46,130 --> 00:37:48,270 >> Nhưng bạn không thể trộn và kết hợp chúng. 645 00:37:48,270 --> 00:37:53,150 Các hệ thống đó đã được huấn luyện với cơ sở dữ liệu của thức ăn và bia 646 00:37:53,150 --> 00:37:56,830 không làm việc tốt khi bạn đột nhiên đưa nó vào với những tin y tế 647 00:37:56,830 --> 00:37:59,770 cơ sở dữ liệu. 648 00:37:59,770 --> 00:38:05,680 Vì vậy, ngay cả khi hệ thống tốt nhất của chúng tôi ngày hôm nay dựa vào một mức độ chế biến 649 00:38:05,680 --> 00:38:11,570 trong đó chúng ta được làm bằng tay và mã hóa xây dựng cơ sở hạ tầng để 650 00:38:11,570 --> 00:38:13,275 làm cho hệ thống hoạt động này. 651 00:38:13,275 --> 00:38:16,360 652 00:38:16,360 --> 00:38:20,710 >> Bây giờ, chủ đề cuối cùng tôi muốn để có thể nhận được đến ngày hôm nay 653 00:38:20,710 --> 00:38:23,960 là về giao tiếp phi ngôn ngữ. 654 00:38:23,960 --> 00:38:29,290 Một khối lượng lớn thông tin mà chúng ta giao tiếp với nhau 655 00:38:29,290 --> 00:38:35,490 không xảy ra thông qua việc từ riêng lẻ mà chúng ta đang áp dụng. 656 00:38:35,490 --> 00:38:40,290 Nó đã làm với những thứ như gần, ánh mắt, giọng điệu của giọng nói, 657 00:38:40,290 --> 00:38:42,270 uốn của bạn. 658 00:38:42,270 --> 00:38:46,620 Và đó cũng là thông tin liên lạc cái gì mà nhiều giao diện khác nhau 659 00:38:46,620 --> 00:38:49,960 quan tâm rất nhiều về. 660 00:38:49,960 --> 00:38:51,500 Đó không phải là những gì Siri quan tâm. 661 00:38:51,500 --> 00:38:56,250 Tôi có thể yêu cầu Siri một cái gì đó trong một giọng nói hoặc trong một giai điệu khác nhau của giọng nói, 662 00:38:56,250 --> 00:38:59,840 và Siri sẽ cho tôi câu trả lời tương tự. 663 00:38:59,840 --> 00:39:05,260 Nhưng đó không phải là những gì chúng ta xây dựng cho nhiều loại khác của các giao diện. 664 00:39:05,260 --> 00:39:09,120 >> Tôi muốn giới thiệu với bạn bây giờ để một trong những robot. 665 00:39:09,120 --> 00:39:12,720 Điều này đã được xây dựng bởi lâu năm của tôi bạn và đồng nghiệp Cynthia 666 00:39:12,720 --> 00:39:16,010 Breazeal và công ty của cô Jibo. 667 00:39:16,010 --> 00:39:20,090 Và robot-- này chúng ta sẽ có một vài tình nguyện viên 668 00:39:20,090 --> 00:39:22,520 đưa ra để tương tác với điều này. 669 00:39:22,520 --> 00:39:26,200 Vì vậy, tôi có thể có hai người sẵn sàng để chơi với các robot đối với tôi? 670 00:39:26,200 --> 00:39:29,936 Tại sao bạn không đến trên lên, và tại sao bạn không đi lên trên. 671 00:39:29,936 --> 00:39:31,310 Nếu bạn muốn tham gia cùng tôi lên đây, xin vui lòng. 672 00:39:31,310 --> 00:39:36,520 673 00:39:36,520 --> 00:39:39,670 >> Và nếu tôi có thể có bạn đến ngay trên đây. 674 00:39:39,670 --> 00:39:40,170 Cảm ơn. 675 00:39:40,170 --> 00:39:40,480 Chào. 676 00:39:40,480 --> 00:39:41,400 >> Alfredo: Rất vui được gặp bạn. 677 00:39:41,400 --> 00:39:42,010 Alfredo. 678 00:39:42,010 --> 00:39:42,520 >> BRIAN SCASSELLATI: Alfredo. 679 00:39:42,520 --> 00:39:43,146 >> RACHEL: Rachel. 680 00:39:43,146 --> 00:39:44,228 BRIAN SCASSELLATI: Rachel. 681 00:39:44,228 --> 00:39:45,154 Rất vui được gặp các bạn cả. 682 00:39:45,154 --> 00:39:46,820 Alfredo, tôi sẽ có bạn đi đầu tiên. 683 00:39:46,820 --> 00:39:47,990 Hãy đến ngay lên đây. 684 00:39:47,990 --> 00:39:51,870 Tôi sẽ giới thiệu you-- nếu tôi có thể có được điều này off 685 00:39:51,870 --> 00:39:58,450 mà không gõ cửa các microphone-- để một robot nhỏ có tên Jibo. 686 00:39:58,450 --> 00:40:00,140 ĐƯỢC? 687 00:40:00,140 --> 00:40:04,260 >> Bây giờ, Jibo được thiết kế để tương tác. 688 00:40:04,260 --> 00:40:09,339 Và mặc dù nó có thể cung cấp cho bạn lời nói, nhiều sự tương tác với các robot 689 00:40:09,339 --> 00:40:09,880 là phi ngôn ngữ. 690 00:40:09,880 --> 00:40:12,450 691 00:40:12,450 --> 00:40:17,070 Alfredo, tôi sẽ yêu cầu bạn nói điều gì đó tốt đẹp và miễn phí 692 00:40:17,070 --> 00:40:19,554 để các robot, xin vui lòng. 693 00:40:19,554 --> 00:40:20,845 Alfredo: Tôi nghĩ rằng bạn nhìn dễ thương. 694 00:40:20,845 --> 00:40:24,114 695 00:40:24,114 --> 00:40:25,611 >> [Lăng xăng SOUND] 696 00:40:25,611 --> 00:40:26,192 697 00:40:26,192 --> 00:40:27,108 BRIAN SCASSELLATI: OK. 698 00:40:27,108 --> 00:40:30,110 699 00:40:30,110 --> 00:40:33,180 Phản ứng của nó không phải là lời nói. 700 00:40:33,180 --> 00:40:35,180 Và nó đã cho bạn cả một sự thừa nhận rõ ràng 701 00:40:35,180 --> 00:40:39,680 rằng họ đã nghe những gì bạn nói và bằng cách nào đó cũng hiểu rằng. 702 00:40:39,680 --> 00:40:40,530 ĐƯỢC? 703 00:40:40,530 --> 00:40:42,070 Bước trở lại ngay tại đây trong một giây. 704 00:40:42,070 --> 00:40:43,130 Cam on. 705 00:40:43,130 --> 00:40:44,090 >> Rachel, nếu bạn muốn. 706 00:40:44,090 --> 00:40:46,070 Bây giờ, tôi sẽ cung cấp cho bạn những công việc khó khăn hơn nhiều. 707 00:40:46,070 --> 00:40:48,361 Nếu bạn muốn đứng ngay ở đây, sao lưu chỉ là một chút vì vậy 708 00:40:48,361 --> 00:40:50,280 chúng tôi có thể giúp bạn có được trên máy ảnh và tìm cách này. 709 00:40:50,280 --> 00:40:56,840 Tôi sẽ yêu cầu bạn nói điều gì đó thực sự có ý nghĩa và pha vào bóng robot. 710 00:40:56,840 --> 00:41:02,900 >> RACHEL: Những gì bạn chỉ có vẻ phải làm là hoàn toàn vô lý. 711 00:41:02,900 --> 00:41:03,840 >> [Humming SOUND] 712 00:41:03,840 --> 00:41:07,610 713 00:41:07,610 --> 00:41:09,030 >> Điều đó thậm chí còn vô lý hơn. 714 00:41:09,030 --> 00:41:10,120 Điều gì đang xảy ra với bạn? 715 00:41:10,120 --> 00:41:13,487 716 00:41:13,487 --> 00:41:16,207 Aw, không cảm thấy xấu. 717 00:41:16,207 --> 00:41:17,040 Tôi sẽ cung cấp cho bạn một cái ôm. 718 00:41:17,040 --> 00:41:19,882 719 00:41:19,882 --> 00:41:21,090 BRIAN SCASSELLATI: Tất cả các quyền. 720 00:41:21,090 --> 00:41:22,280 Thanks, Rachel. 721 00:41:22,280 --> 00:41:24,565 Alfredo, Rachel, nhờ chàng trai rất nhiều. 722 00:41:24,565 --> 00:41:26,840 >> [Vỗ tay] 723 00:41:26,840 --> 00:41:28,660 724 00:41:28,660 --> 00:41:34,470 >> Vì vậy, loại này tương tác có trong nhiều cách một số các quy tắc tương tự 725 00:41:34,470 --> 00:41:36,950 và một số của cùng một cấu trúc như những gì chúng tôi 726 00:41:36,950 --> 00:41:39,950 có thể có trong tương tác ngôn ngữ học. 727 00:41:39,950 --> 00:41:44,530 Nó là cả giao tiếp và phục vụ một mục đích quan trọng. 728 00:41:44,530 --> 00:41:48,590 Và sự tương tác đó, trong nhiều cách khác nhau, được thiết kế 729 00:41:48,590 --> 00:41:52,890 để có một hiệu ứng đặc biệt trên người tương tác với hoặc nghe 730 00:41:52,890 --> 00:41:54,410 để các robot. 731 00:41:54,410 --> 00:41:56,450 >> Bây giờ, tôi may mắn có Jibo ở đây ngày hôm nay. 732 00:41:56,450 --> 00:42:00,550 Sam Spaulding là ở đây giúp đỡ chúng tôi ra với các robot. 733 00:42:00,550 --> 00:42:07,470 Và tôi sẽ hỏi Sam để cung cấp cho chúng ta một bản demo đẹp của Jibo nhảy múa 734 00:42:07,470 --> 00:42:09,720 rằng chúng ta có thể xem ở cuối ở đây. 735 00:42:09,720 --> 00:42:10,590 Vì vậy, đi trước, Jibo. 736 00:42:10,590 --> 00:42:11,550 >> SAM: OK, Jibo. 737 00:42:11,550 --> 00:42:14,430 Chỉ cho chúng ta những bước nhảy của bạn. 738 00:42:14,430 --> 00:42:17,310 >> [MUSIC CHƠI] 739 00:42:17,310 --> 00:42:43,114 740 00:42:43,114 --> 00:42:44,780 BRIAN SCASSELLATI: Được rồi, tất cả mọi người. 741 00:42:44,780 --> 00:42:46,865 Nhờ những người bạn của chúng tôi tại Jibo. 742 00:42:46,865 --> 00:42:49,426 >> [Vỗ tay] 743 00:42:49,426 --> 00:42:50,140 744 00:42:50,140 --> 00:42:54,990 >> Và nhờ bạn bè của chúng tôi tại IBM đã giúp đỡ ra ngày hôm nay. 745 00:42:54,990 --> 00:42:57,300 Giao tiếp là một cái gì đó rằng bạn đang đi 746 00:42:57,300 --> 00:43:02,280 để xem sắp tới ngày càng nhiều như chúng ta xây dựng các giao diện phức tạp hơn. 747 00:43:02,280 --> 00:43:05,760 Tuần tới, chúng ta sẽ nói về cách giao tiếp 748 00:43:05,760 --> 00:43:08,890 với đối thủ máy tính trong trò chơi. 749 00:43:08,890 --> 00:43:12,950 Nhưng nếu bạn có thắc mắc về điều này, Sẽ quanh giờ hành chính tối nay. 750 00:43:12,950 --> 00:43:17,610 Tôi rất vui khi nói chuyện với bạn về AI chủ đề hoặc để có được vào chi tiết hơn. 751 00:43:17,610 --> 00:43:18,927 Có một ngày cuối tuần tuyệt vời. 752 00:43:18,927 --> 00:43:21,409 >> [Vỗ tay] 753 00:43:21,409 --> 00:43:21,909 754 00:43:21,909 --> 00:43:26,141 [MUSIC CHƠI] 755 00:43:26,141 --> 00:46:42,879