1 00:00:00,000 --> 00:00:02,928 >> [Bermain muzik] 2 00:00:02,928 --> 00:00:11,230 3 00:00:11,230 --> 00:00:12,790 >> DAVID MALAN: Ini adalah CS50. 4 00:00:12,790 --> 00:00:14,072 Ini adalah akhir minggu 10. 5 00:00:14,072 --> 00:00:16,030 Dan lelaki, kita mempunyai kelas yang baik untuk anda hari ini. 6 00:00:16,030 --> 00:00:20,040 Kami amat teruja untuk menjemput dua daripada rakan-rakan kami dari Yale sehingga kami hari ini 7 00:00:20,040 --> 00:00:23,920 dan untuk melihat di persimpangan kecerdasan buatan, robotik, 8 00:00:23,920 --> 00:00:25,710 pemprosesan bahasa semula jadi, dan banyak lagi. 9 00:00:25,710 --> 00:00:27,090 >> Dan sesungguhnya, sejak Beberapa minggu yang lalu, kami telah 10 00:00:27,090 --> 00:00:29,714 pasti menghabiskan banyak masa, terutamanya dalam psets sebelum ini, 11 00:00:29,714 --> 00:00:31,560 memberi tumpuan kepada cantik butiran peringkat rendah. 12 00:00:31,560 --> 00:00:34,520 Dan ia sangat mudah untuk lupa hutan untuk pokok-pokok 13 00:00:34,520 --> 00:00:38,170 dan digantung di atas gelung dan syarat dan petunjuk, sudah tentu, dan sebagainya. 14 00:00:38,170 --> 00:00:41,770 Tetapi realitinya adalah anda semua kini mempunyai bahan-bahan yang anda boleh benar-benar 15 00:00:41,770 --> 00:00:45,300 menyelesaikan beberapa masalah yang menarik, antara mereka orang-orang yang rakan-rakan kami di Yale 16 00:00:45,300 --> 00:00:48,790 bekerja pada hanya malu Cambridge. 17 00:00:48,790 --> 00:00:52,410 >> Jadi izinkan saya pertama memperkenalkan kepala kita mengajar pembantu dari Yale, Andy. 18 00:00:52,410 --> 00:00:55,182 >> [Tepuk tangan] 19 00:00:55,182 --> 00:00:57,030 20 00:00:57,030 --> 00:01:00,710 >> ANDY: Pertama sekali, hanya mengucapkan terima kasih kasih kerana membenarkan beberapa Yalies 21 00:01:00,710 --> 00:01:02,700 untuk pop di bawah untuk Cambridge hari ini. 22 00:01:02,700 --> 00:01:05,299 Kami benar-benar menghargainya. 23 00:01:05,299 --> 00:01:07,090 Kedua, untuk rakan-rakan kami kembali home-- Jason, 24 00:01:07,090 --> 00:01:09,670 terima kasih untuk tinggal dan menjalankan kuliah. 25 00:01:09,670 --> 00:01:12,970 Harapan itu semua baik di New Haven. 26 00:01:12,970 --> 00:01:15,720 >> Jadi ya, saya super teruja untuk memperkenalkan Scaz hari ini. 27 00:01:15,720 --> 00:01:17,020 Scaz berjalan makmal robotik. 28 00:01:17,020 --> 00:01:19,690 Dia seorang profesor, seperti, lima jabatan yang berlainan di Yale. 29 00:01:19,690 --> 00:01:23,159 Di dalam makmal, beliau mempunyai banyak, banyak robot yang dia suka untuk bermain dengan. 30 00:01:23,159 --> 00:01:24,950 Beliau mempunyai, seperti, pekerjaan yang paling hebat di dunia. 31 00:01:24,950 --> 00:01:27,116 Dan dia mendapat untuk jenis keadaan huru-hara main dengan yang sepanjang hari 32 00:01:27,116 --> 00:01:29,090 panjang dan membuat kerja-kerja, juga. 33 00:01:29,090 --> 00:01:33,070 >> Dan supaya kita benar-benar membawa satu Daripada mereka turun dengan kami hari ini. 34 00:01:33,070 --> 00:01:36,900 Jadi tanpa berlengah-lengah lagi, Scaz adalah akan pergi ke hadapan dan memperkenalkan kami 35 00:01:36,900 --> 00:01:38,660 kepada rakan robot beliau. 36 00:01:38,660 --> 00:01:41,546 >> [Tepuk tangan] 37 00:01:41,546 --> 00:01:42,935 38 00:01:42,935 --> 00:01:44,310 BRIAN SCASSELLATI: Terima kasih, David. 39 00:01:44,310 --> 00:01:45,380 Terima kasih, Andy. 40 00:01:45,380 --> 00:01:50,050 Ia begitu indah untuk menjadi di sini dengan semua orang hari ini. 41 00:01:50,050 --> 00:01:56,490 Saya hendak pertama menjadi sangat jelas bahawa kakitangan CS50 di sini di Cambridge 42 00:01:56,490 --> 00:01:59,190 telah sangat ramah kepada kami. 43 00:01:59,190 --> 00:02:02,130 Kami amat berterima kasih untuk segala-galanya yang mereka lakukan untuk menyokong kami. 44 00:02:02,130 --> 00:02:05,690 Dan dengan itu kita ingin dapat untuk kembali kebaikan. 45 00:02:05,690 --> 00:02:09,370 >> Jadi hari ini, kita akan mendapat untuk mengumumkan bahawa kita akan mempunyai yang baru, 46 00:02:09,370 --> 00:02:15,240 satu-of-a-jenis acara CS50 berlaku di New Haven minggu depan. 47 00:02:15,240 --> 00:02:18,040 Dan ini adalah CS50 Penyelidikan Expo. 48 00:02:18,040 --> 00:02:21,300 Oleh itu, kita akan menjemput everyone-- CS50 pelajar, 49 00:02:21,300 --> 00:02:26,510 kakitangan dari kedua-dua Harvard dan Yale-- untuk datang dan melawat dengan kami pada hari Jumaat. 50 00:02:26,510 --> 00:02:30,400 Kami akan mempunyai pelbagai lebih 30 orang yang berbeza menyampaikan 51 00:02:30,400 --> 00:02:34,830 dan upperclassmen exhibiting-- menunjukkan off beberapa produk penyelidikan mereka. 52 00:02:34,830 --> 00:02:38,480 Kami akan mempunyai beberapa startups, walaupun, mencari untuk sedikit bakat berteknologi baru, 53 00:02:38,480 --> 00:02:40,460 startups dari kedua-dua Harvard dan Yale. 54 00:02:40,460 --> 00:02:44,550 Dan kita akan mempunyai beberapa kumpulan pelajar mencari beberapa keahlian baru. 55 00:02:44,550 --> 00:02:46,357 >> Ia akan menjadi masa yang sangat menarik. 56 00:02:46,357 --> 00:02:49,190 Mudah-mudahan orang-orang di antara kamu yang yang turun untuk permainan Harvard-Yale 57 00:02:49,190 --> 00:02:51,360 akan dapat berhenti dengan sedikit awal, 58 00:02:51,360 --> 00:02:54,060 betul-betul di tengah-tengah kampus, Perpustakaan Memorial Sterling. 59 00:02:54,060 --> 00:02:58,040 Kita akan mempunyai satu set pameran yang pelbagai dari autonomi 60 00:02:58,040 --> 00:03:04,460 perahu layar ke jalan menggunakan perisian untuk memelihara manuskrip zaman pertengahan. 61 00:03:04,460 --> 00:03:07,860 >> Kami akan mempunyai iklan rangkaian hoc dan orang-orang 62 00:03:07,860 --> 00:03:11,230 mengajar perisian pengekodan di Cape Town. 63 00:03:11,230 --> 00:03:13,730 Kami akan mempunyai komputer demonstrasi muzik. 64 00:03:13,730 --> 00:03:16,020 Dan kita sudah tentu akan mempunyai lebih banyak robot. 65 00:03:16,020 --> 00:03:18,900 Oleh itu, kita berharap yang anda akan menyertai kami untuk acara ini. 66 00:03:18,900 --> 00:03:21,350 Ia harus menjadi banyak menyeronokkan, sedikit makanan, 67 00:03:21,350 --> 00:03:24,430 dan banyak yang menarik perkara untuk bercakap tentang. 68 00:03:24,430 --> 00:03:28,230 >> Jadi hari ini, kita akan bercakap mengenai pemprosesan bahasa semula jadi. 69 00:03:28,230 --> 00:03:32,560 Dan ini adalah cubaan untuk kita untuk membina cara baru untuk antara muka 70 00:03:32,560 --> 00:03:35,150 dengan peranti kita kerana untuk beberapa minggu lepas, 71 00:03:35,150 --> 00:03:40,800 anda telah memberi tumpuan kepada bagaimana ia adalah bahawa anda boleh menulis kod, menulis perisian 72 00:03:40,800 --> 00:03:47,110 itu adalah cara untuk dapat berkata kepada mesin, ini adalah apa yang saya mahu anda lakukan. 73 00:03:47,110 --> 00:03:50,210 >> Tetapi kita tidak harus perlu mengharapkan semua yang 74 00:03:50,210 --> 00:03:53,760 yang di luar sana yang digunakan oleh semua orang di dunia 75 00:03:53,760 --> 00:03:57,480 akan menjadi mahir dalam jenis ini pengajaran. 76 00:03:57,480 --> 00:04:02,540 Oleh itu, kita membezakan antara komputer bahasa dan languages-- semula jadi 77 00:04:02,540 --> 00:04:06,720 iaitu perkara-perkara yang manusia penggunaan untuk berkomunikasi dengan manusia lain. 78 00:04:06,720 --> 00:04:12,270 Dan kami cuba untuk membina antara muka yang menggunakan mekanisme komunikasi semula jadi. 79 00:04:12,270 --> 00:04:16,029 >> Sekarang, hanya suka setiap topik lain bahawa kami telah bermula dengan dalam CS50, 80 00:04:16,029 --> 00:04:19,589 kita akan mulakan dengan yang paling mudah sedikit pemprosesan bahasa semula jadi 81 00:04:19,589 --> 00:04:21,269 yang kita boleh bayangkan. 82 00:04:21,269 --> 00:04:24,940 Kita akan mulakan dengan sebahagian sejarah bahasa semula jadi. 83 00:04:24,940 --> 00:04:28,740 Dan kemudian kita akan membina sehingga lebih dan lebih baru-baru ini sistem 84 00:04:28,740 --> 00:04:31,450 dan mempunyai beberapa demo menyeronokkan sepanjang jalan. 85 00:04:31,450 --> 00:04:35,900 >> Oleh itu, kita akan mulakan dengan apa yang mungkin bahasa semula jadi pertama 86 00:04:35,900 --> 00:04:38,210 sistem pemprosesan. 87 00:04:38,210 --> 00:04:45,080 Ini adalah satu sistem perisian yang ditulis dalam 1966 oleh Joseph Weizenbaum dipanggil ELIZA. 88 00:04:45,080 --> 00:04:49,640 Dan ELIZA telah direka untuk meniru jenis interaksi 89 00:04:49,640 --> 00:04:53,850 anda akan mempunyai dengan Psychotherapist Rogerian. 90 00:04:53,850 --> 00:04:57,210 Kini, Rogerians, mereka mempunyai idea bahawa psikoterapi 91 00:04:57,210 --> 00:05:02,800 terlibat dapat cermin belakang kepada pesakit dan bercakap kepada mereka, 92 00:05:02,800 --> 00:05:08,100 pada dasarnya, dengan hanya memberikan mereka sedikit kecil daripada terapi. 93 00:05:08,100 --> 00:05:09,920 Iaitu, segala-galanya bahawa ahli terapi tersebut 94 00:05:09,920 --> 00:05:16,500 sepatutnya menjadi hanya mencerminkan apa yang pesakit telah memberitahu kepada mereka. 95 00:05:16,500 --> 00:05:18,990 >> Jadi mari kita cuba dan demo ini. 96 00:05:18,990 --> 00:05:22,820 Adakah kita mempunyai seorang sukarelawan yang akan menjadi bersedia untuk berkongsi paling dalam mereka, 97 00:05:22,820 --> 00:05:26,650 gelap, dan / atau rahsia palsu dengan ELIZA? 98 00:05:26,650 --> 00:05:29,680 Pasti, mengapa tidak anda datang ke atas. 99 00:05:29,680 --> 00:05:30,847 Fantastic. 100 00:05:30,847 --> 00:05:31,430 Dan nama kamu? 101 00:05:31,430 --> 00:05:32,000 >> MILES: Batu. 102 00:05:32,000 --> 00:05:33,041 >> BRIAN SCASSELLATI: Batu. 103 00:05:33,041 --> 00:05:34,270 Gembira dapat bertemu dengan anda, Miles. 104 00:05:34,270 --> 00:05:36,270 Jika anda akan berpegang pada itu. 105 00:05:36,270 --> 00:05:40,840 Dan kita akan menggunakan versi ELIZA 106 00:05:40,840 --> 00:05:44,640 bahawa kita telah ditiru dalam IDE CS50. 107 00:05:44,640 --> 00:05:47,140 Dan kita akan melihat sumber kod untuk ini dalam sebentar. 108 00:05:47,140 --> 00:05:49,910 Tetapi untuk sekarang, kami hanya akan kematian itu dengan menaip eliza. 109 00:05:49,910 --> 00:05:55,480 >> Dan ELIZA akan memberikan anda jawapan yang akan berada di semua ibu. 110 00:05:55,480 --> 00:05:57,950 Dan akan meminta anda beberapa soalan. 111 00:05:57,950 --> 00:06:02,130 Dan kami akan bertindak balas dan taip dalam jawapan kepada ELIZA. 112 00:06:02,130 --> 00:06:04,310 Jadi ELIZA telah berkata, "Hi, saya ELIZA. 113 00:06:04,310 --> 00:06:05,462 Ada apa? " 114 00:06:05,462 --> 00:06:08,092 Apa yang akan anda suka memberitahu ELIZA tentang hari ini? 115 00:06:08,092 --> 00:06:10,750 >> MILES: Saya hanya boleh tidur jika saya mempunyai selipar bunny pada. 116 00:06:10,750 --> 00:06:12,440 >> BRIAN SCASSELLATI: Baiklah. 117 00:06:12,440 --> 00:06:13,360 Baiklah. 118 00:06:13,360 --> 00:06:15,300 >> [Ketawa] 119 00:06:15,300 --> 00:06:22,410 >> "Saya hanya boleh tidur dengan selipar bunny pada. " 120 00:06:22,410 --> 00:06:29,000 Dan ELIZA berkata, "Katakanlah, adakah anda mempunyai apa-apa masalah psikologi? 121 00:06:29,000 --> 00:06:30,450 Mungkin ini adalah petunjuk yang baik. " 122 00:06:30,450 --> 00:06:30,780 >> OKAY. 123 00:06:30,780 --> 00:06:32,245 Jadi apa yang anda mahu untuk bertindak balas? 124 00:06:32,245 --> 00:06:36,110 125 00:06:36,110 --> 00:06:36,970 >> MILES: Ya. 126 00:06:36,970 --> 00:06:38,660 >> BRIAN SCASSELLATI: Ya. 127 00:06:38,660 --> 00:06:39,570 Manusia banyak perkataan. 128 00:06:39,570 --> 00:06:41,870 Saya suka itu. 129 00:06:41,870 --> 00:06:50,200 Eliza berkata, "Anda kelihatan agak positif." 130 00:06:50,200 --> 00:06:53,200 >> MILES: Tidak, saya, sebenarnya, elektron. 131 00:06:53,200 --> 00:06:55,150 >> BRIAN SCASSELLATI: "Tidak 132 00:06:55,150 --> 00:07:02,240 Malah, saya elektron. " "Adakah kamu datang 133 00:07:02,240 --> 00:07:06,954 kerana anda adalah elektron? " 134 00:07:06,954 --> 00:07:08,870 Sekarang, kita boleh melihat beberapa things-- yang saya akan 135 00:07:08,870 --> 00:07:10,200 untuk berhenti seketika anda hanya sesaat, Miles. 136 00:07:10,200 --> 00:07:11,010 Jangan pergi mana-mana. 137 00:07:11,010 --> 00:07:12,650 Kami tidak selesai dengan anda lagi. 138 00:07:12,650 --> 00:07:16,490 ELIZA adalah, dalam beberapa cara, bertindak balas kepada perkara-perkara tertentu 139 00:07:16,490 --> 00:07:21,140 yang dia katakan tetapi tanpa pengertian sebenar. 140 00:07:21,140 --> 00:07:26,090 Dan ia juga parroting semula beberapa satu bahagian daripada hukumannya. 141 00:07:26,090 --> 00:07:27,310 >> Oleh itu, kita berkata, "Tidak 142 00:07:27,310 --> 00:07:29,090 Malah, saya elektron. " 143 00:07:29,090 --> 00:07:34,190 Eliza balas kembali, "Adakah kamu datang kepada saya kerana anda adalah elektron? " 144 00:07:34,190 --> 00:07:34,690 Baiklah. 145 00:07:34,690 --> 00:07:36,050 Mari kita memberikan satu lagi sambutan di sini. 146 00:07:36,050 --> 00:07:37,140 Memberikan satu yang baik, Miles. 147 00:07:37,140 --> 00:07:37,806 >> MILES: satu yang baik? 148 00:07:37,806 --> 00:07:48,400 149 00:07:48,400 --> 00:07:49,570 >> Ya, sila membantu saya. 150 00:07:49,570 --> 00:07:50,570 BRIAN SCASSELLATI: "Ya. 151 00:07:50,570 --> 00:07:58,010 Sila membantu saya. "" Adakah anda pasti? " 152 00:07:58,010 --> 00:07:58,510 MILES: No. 153 00:07:58,510 --> 00:08:00,860 BRIAN SCASSELLATI: No. 154 00:08:00,860 --> 00:08:03,562 "Apa yang mencadangkan kepada anda?" 155 00:08:03,562 --> 00:08:06,760 >> MILES: Saya mungkin tidak elektron. 156 00:08:06,760 --> 00:08:11,170 >> BRIAN SCASSELLATI: "Saya mungkin tidak elektron. " 157 00:08:11,170 --> 00:08:13,790 "Adakah anda mengatakan tidak hanya untuk menjadi negatif?" 158 00:08:13,790 --> 00:08:14,390 >> Baiklah. 159 00:08:14,390 --> 00:08:16,030 Jadi Batu, terima kasih banyak. 160 00:08:16,030 --> 00:08:16,860 >> MILES: Terima kasih. 161 00:08:16,860 --> 00:08:18,360 >> BRIAN SCASSELLATI: Terima kasih sangat banyak. 162 00:08:18,360 --> 00:08:20,230 [Tepuk tangan] 163 00:08:20,230 --> 00:08:21,230 164 00:08:21,230 --> 00:08:26,700 >> Jadi program ELIZA ini, dalam pelbagai cara, bertindak balas hanya untuk keping 165 00:08:26,700 --> 00:08:32,730 bahawa kita menyediakan tanpa apa-apa dalam memahami apa yang berlaku di sini. 166 00:08:32,730 --> 00:08:36,640 Ini adalah sejenis sistem dipanggil yang hampir sama corak, di mana 167 00:08:36,640 --> 00:08:40,490 yang kami cari tertentu cebisan teks yang kami kemudian 168 00:08:40,490 --> 00:08:44,860 akan mengambil dari apa yang telah disediakan sebagai input, 169 00:08:44,860 --> 00:08:52,580 menukar, berpotensi, dalam beberapa cara, dan kemudian memberikan kembali kepada pengguna. 170 00:08:52,580 --> 00:08:55,150 >> Adakah mana-mana anda berfikir yang ELIZA sebenarnya 171 00:08:55,150 --> 00:08:58,230 melakukan psikoanalisis sah di sini? 172 00:08:58,230 --> 00:08:59,250 Satu orang, mungkin. 173 00:08:59,250 --> 00:09:00,166 >> PENONTON: [didengar]. 174 00:09:00,166 --> 00:09:03,315 175 00:09:03,315 --> 00:09:05,440 BRIAN SCASSELLATI: Dan bagaimana adakah itu membuat anda rasa? 176 00:09:05,440 --> 00:09:06,530 Ya, sebenarnya, ia tidak. 177 00:09:06,530 --> 00:09:10,890 Dan kita akan lihat, sebenarnya, Kod sumber untuk dalam hanya seketika. 178 00:09:10,890 --> 00:09:13,580 Dan supaya anda akan menjadi dapat melakukan perkara ini. 179 00:09:13,580 --> 00:09:17,420 >> Sekarang, ELIZA adalah salah satu bentuk apa kita panggil hari ini bot chat. 180 00:09:17,420 --> 00:09:19,950 Ia hanya akan melalui teks yang anda menyediakan, 181 00:09:19,950 --> 00:09:24,030 menyediakan jumlah minimum yang terdedah kefahaman atau pemprosesan, 182 00:09:24,030 --> 00:09:26,790 dan kemudian burung kakak tua itu kembali kepada anda. 183 00:09:26,790 --> 00:09:31,830 Jadi mari kita lihat, dari segi konsep, dan bercakap tentang apa 184 00:09:31,830 --> 00:09:34,690 ia adalah bahawa ELIZA sebenarnya lakukan. 185 00:09:34,690 --> 00:09:42,000 >> ELIZA adalah mengambil let sentence-- ini berkata, "Saya ingin menarik perhatian bos saya." 186 00:09:42,000 --> 00:09:45,130 Dan ELIZA sedang melalui ayat yang 187 00:09:45,130 --> 00:09:48,730 dan cuba untuk mencari dan sepadan corak tertentu. 188 00:09:48,730 --> 00:09:52,850 Jadi, sebagai contoh, salah satu corak yang ELIZA sedang mencari adalah kata-kata 189 00:09:52,850 --> 00:09:55,110 "Saya mahu." 190 00:09:55,110 --> 00:09:59,330 Dan bila-bila ia melihat sesuatu yang mempunyai "Saya mahu" di dalamnya, 191 00:09:59,330 --> 00:10:01,770 ia merumuskan jawapan. 192 00:10:01,770 --> 00:10:05,040 Dan jawapan yang adalah rentetan tetap. 193 00:10:05,040 --> 00:10:07,915 Dalam kes ini, ia adalah "mengapa kamu mahu?" 194 00:10:07,915 --> 00:10:11,330 Dan saya meletakkan bintang kecil di akhir kerana itu hanya 195 00:10:11,330 --> 00:10:13,310 awal tindak balas kita. 196 00:10:13,310 --> 00:10:16,310 Dan bintang menunjukkan bahawa kita akan mengambil yang lain 197 00:10:16,310 --> 00:10:19,850 daripada utterance-- pengguna "untuk menarik perhatian bos saya" - 198 00:10:19,850 --> 00:10:24,500 dan kita akan menambah bahawa ke akhir rentetan ini. 199 00:10:24,500 --> 00:10:28,990 >> Oleh sebab itu, bukannya mengatakan, "mengapa yang anda ingin menarik perhatian bos saya, " 200 00:10:28,990 --> 00:10:31,800 ada sedikit tambahan pemprosesan yang kita akan lakukan. 201 00:10:31,800 --> 00:10:34,440 Iaitu, kita akan perlu untuk menukar sebahagian daripada kata ganti nama 202 00:10:34,440 --> 00:10:38,670 di sini daripada "bos saya" kepada "bos anda." 203 00:10:38,670 --> 00:10:41,300 Dan mungkin ada beberapa yang lain perubahan yang kita perlukan untuk membuat. 204 00:10:41,300 --> 00:10:44,990 Jadi, daripada hanya melekat terus ke akhirnya, apa yang kita akan lakukan 205 00:10:44,990 --> 00:10:49,160 ini kami akan mengambil yang lain daripada utterance-- pengguna dalam sini-- putih 206 00:10:49,160 --> 00:10:54,090 dan kami akan mengambil satu bahagian pada satu masa dan menukar setiap rentetan 207 00:10:54,090 --> 00:10:58,180 token, setiap perkataan, ke dalam hukuman itu. 208 00:10:58,180 --> 00:10:59,580 >> Oleh itu, kita akan mengambil perkataan "to". 209 00:10:59,580 --> 00:11:01,650 Tidak ada penukaran bahawa kita perlu untuk berbuat demikian. 210 00:11:01,650 --> 00:11:02,340 "Menarik perhatian." 211 00:11:02,340 --> 00:11:04,140 Tidak ada penukaran kita perlu lakukan di sana. 212 00:11:04,140 --> 00:11:06,670 "Saya" akan bertukar kepada "anda." 213 00:11:06,670 --> 00:11:10,070 Dan "bos" kami akan hanya meninggalkan sebagai "bos." 214 00:11:10,070 --> 00:11:12,740 Dan kemudian akhirnya, apa-apa yang berakhir dengan tempoh, 215 00:11:12,740 --> 00:11:16,640 kami akan menukar ke satu soalan. 216 00:11:16,640 --> 00:11:22,600 >> Corak yang hampir sama sangat mudah sebenarnya agak berjaya. 217 00:11:22,600 --> 00:11:27,260 Dan apabila ini telah diperkenalkan dalam 1966-- Joseph Weizenbaum 218 00:11:27,260 --> 00:11:28,986 diprogramkan ini pada komputer. 219 00:11:28,986 --> 00:11:31,110 Sekarang, komputer pada masa itu tidak model desktop. 220 00:11:31,110 --> 00:11:33,950 Mereka berkongsi sumber. 221 00:11:33,950 --> 00:11:39,090 Dan para pelajar beliau akan pergi dan berbual dengan ELIZA. 222 00:11:39,090 --> 00:11:41,570 Akhirnya, dia terpaksa menyekat akses kepada maklumat itu 223 00:11:41,570 --> 00:11:43,890 kerana murid-muridnya tidak mendapat apa-apa kerja yang dilakukan. 224 00:11:43,890 --> 00:11:46,190 Mereka hanya berbual dengan ELIZA. 225 00:11:46,190 --> 00:11:48,850 Dan, sebenarnya, dia terpaksa api pembantunya, yang 226 00:11:48,850 --> 00:11:55,840 menghabiskan semua masa beliau bercakap dengan ELIZA tentang masalah dalam dan membimbangkan beliau. 227 00:11:55,840 --> 00:12:00,350 >> Setiap orang yang menggunakan sistem ini mula anthropomorphize mereka. 228 00:12:00,350 --> 00:12:04,490 Mereka mula memikirkan mereka sebagai yang bernyawa dan orang sebenar. 229 00:12:04,490 --> 00:12:07,969 Mereka mula mengenali beberapa perkara-perkara yang mereka katakan 230 00:12:07,969 --> 00:12:09,010 telah kembali kepada mereka. 231 00:12:09,010 --> 00:12:12,120 Dan mereka mengetahui perkara tentang diri mereka sendiri. 232 00:12:12,120 --> 00:12:17,290 Dan, sebenarnya, walaupun pakar-pakar, walaupun psiko, 233 00:12:17,290 --> 00:12:22,930 mula bimbang bahawa, sebenarnya, mungkin ELIZA akan menggantikan mereka. 234 00:12:22,930 --> 00:12:25,640 Dan walaupun komputer saintis bimbang bahawa kami 235 00:12:25,640 --> 00:12:30,040 begitu dekat dengan menyelesaikan bahasa semula jadi. 236 00:12:30,040 --> 00:12:33,520 >> Sekarang, yang tidak mana-mana sahaja berhampiran dengan benar. 237 00:12:33,520 --> 00:12:37,280 Tetapi itu adalah cara yang mengagumkan sistem ini boleh kelihatan. 238 00:12:37,280 --> 00:12:40,080 Jadi mari kita mula kelihatan di bawah dan cuba 239 00:12:40,080 --> 00:12:46,190 untuk mendapatkan sedikit soalan di mana kod ini benar-benar berlaku. 240 00:12:46,190 --> 00:12:48,170 Oleh itu, kita akan membuat kod ini ada selepas itu. 241 00:12:48,170 --> 00:12:50,880 Dan ini adalah yang sangat port mudah dan langsung 242 00:12:50,880 --> 00:12:53,240 pelaksanaan ELIZA asal. 243 00:12:53,240 --> 00:12:56,350 >> Jadi sebahagian daripada gaya ini perkara yang anda akan lihat di sini 244 00:12:56,350 --> 00:12:59,360 tidak apa segi gaya kami mahu anda untuk melakukan 245 00:12:59,360 --> 00:13:01,480 atau apa yang kita telah mengajar anda lakukan. 246 00:13:01,480 --> 00:13:04,770 Tetapi kita telah cuba untuk memastikan mereka yang sama di pelabuhan banyak 247 00:13:04,770 --> 00:13:08,087 ini telah mempunyai supaya ia mempunyai rasa yang asal. 248 00:13:08,087 --> 00:13:09,920 Jadi, kita akan termasuk sekumpulan perkara, 249 00:13:09,920 --> 00:13:12,920 dan kemudian kita akan mempunyai set kata kunci, perkara 250 00:13:12,920 --> 00:13:16,460 yang ELIZA akan mengenali dan bertindak balas terhadap langsung. 251 00:13:16,460 --> 00:13:20,780 Jadi jika anda mempunyai kata-kata seperti "boleh anda" atau "Saya tidak" atau "tidak" 252 00:13:20,780 --> 00:13:24,680 atau "ya" atau "impian" atau "hello", maka ELIZA 253 00:13:24,680 --> 00:13:27,920 akan bertindak balas secara terpilih kepada mereka. 254 00:13:27,920 --> 00:13:30,010 Kami juga akan mempunyai sebilangan perkara 255 00:13:30,010 --> 00:13:34,940 bahawa kami akan menukar, seperti menukar "saya" untuk "anda." 256 00:13:34,940 --> 00:13:39,920 >> Dan kemudian kita akan mempunyai satu set jawapan bahawa untuk setiap kata kunci ini, 257 00:13:39,920 --> 00:13:42,580 kami akan berputar melalui ini jawapan yang berbeza. 258 00:13:42,580 --> 00:13:45,350 Jadi, jika saya berkata "ya" tiga kali berturut-turut, saya 259 00:13:45,350 --> 00:13:50,429 mungkin akan mendapat tiga berbeza jawapan daripada ELIZA. 260 00:13:50,429 --> 00:13:52,345 Kod kami, maka, adalah sebenarnya amat mudah. 261 00:13:52,345 --> 00:13:59,490 Jika saya tatal ke bawah lalu semua ini jawapan yang telah kita diprogramkan dalam 262 00:13:59,490 --> 00:14:02,920 dan kami pergi ke utama kami, kita akan memulakan 263 00:14:02,920 --> 00:14:06,540 beberapa pembolehubah yang berbeza dan melakukan sedikit pengemasan 264 00:14:06,540 --> 00:14:08,480 pada permulaan. 265 00:14:08,480 --> 00:14:11,760 Tetapi kemudian ada sama sekali satu set kod yang anda boleh faham. 266 00:14:11,760 --> 00:14:15,820 Satu gelung sementara besar yang kata saya akan mengulangi ini berulang kali. 267 00:14:15,820 --> 00:14:20,420 Saya akan membaca dalam satu barisan, dan saya akan menyimpan bahawa dalam rentetan input. 268 00:14:20,420 --> 00:14:23,880 Saya akan menyemak dan melihat jika ia adalah kata kunci khas "bye," yang 269 00:14:23,880 --> 00:14:26,199 bermakna keluar dari program ini. 270 00:14:26,199 --> 00:14:29,240 Dan kemudian saya akan menyemak dan melihat sama ada seseorang hanya mengulangi diri mereka 271 00:14:29,240 --> 00:14:29,800 lagi dan lagi. 272 00:14:29,800 --> 00:14:31,174 Dan saya akan menjerit pada mereka jika mereka lakukan. 273 00:14:31,174 --> 00:14:34,820 Saya akan mengatakan "tidak mengulangi diri sendiri." 274 00:14:34,820 --> 00:14:40,500 >> Selagi tiada mana-mana berlaku, kita akan kemudian mengimbas melalui dan gelung melalui, 275 00:14:40,500 --> 00:14:45,330 pada talian 308-313 di sini, dan menyemak dan melihat 276 00:14:45,330 --> 00:14:49,090 sebarang kata kunci yang Ungkapan-ungkapan yang terkandung dalam input 277 00:14:49,090 --> 00:14:50,620 bahawa saya hanya diberikan? 278 00:14:50,620 --> 00:14:54,845 Jika ada perlawanan untuk mereka, baik itu, saya akan ingat lokasi itu. 279 00:14:54,845 --> 00:14:57,050 Saya akan ingat kata kunci tersebut. 280 00:14:57,050 --> 00:14:58,620 Dan saya akan dapat membina jawapan. 281 00:14:58,620 --> 00:15:03,150 >> Jika saya tidak mencari satu, dan kemudian, perkara terakhir dalam pelbagai kata kunci saya 282 00:15:03,150 --> 00:15:08,070 akan menjadi jawapan lalai saya, apabila apa-apa lagi perlawanan. 283 00:15:08,070 --> 00:15:14,160 Saya akan bertanya soalan seperti "Mengapa anda lakukan datang ke sini? "atau" Bagaimana saya boleh membantu anda? " 284 00:15:14,160 --> 00:15:19,710 yang hanya sebahagiannya sesuai tidak kira apa input itu. 285 00:15:19,710 --> 00:15:22,580 >> Kami kemudian akan membina respons ELIZA ini. 286 00:15:22,580 --> 00:15:26,040 Kami akan dapat mengambil bahawa tindak balas asas, 287 00:15:26,040 --> 00:15:28,370 sama seperti yang kami lakukan pada yang "Bos saya" sebagai contoh. 288 00:15:28,370 --> 00:15:30,970 289 00:15:30,970 --> 00:15:33,990 Jika itu semua yang ada is-- jika ia hanya satu 290 00:15:33,990 --> 00:15:36,860 rentetan yang saya sepatutnya respond-- Saya hanya boleh menghantar kembali keluar. 291 00:15:36,860 --> 00:15:40,610 Jika ia mempunyai tanda bintang di akhir itu, maka saya akan 292 00:15:40,610 --> 00:15:45,710 memproses setiap token individu dalam sepanjang sambutan pengguna 293 00:15:45,710 --> 00:15:51,590 dan menambah mereka yang, bertukar-tukar keluar perkataan perkataan seperti yang saya perlu. 294 00:15:51,590 --> 00:15:56,100 >> Semua ini adalah benar-benar sesuatu yang anda boleh membina. 295 00:15:56,100 --> 00:15:59,230 Dan sebenarnya, cara-cara di mana kita mempunyai diproses hujah baris arahan, 296 00:15:59,230 --> 00:16:03,570 cara di mana anda perlu diproses melalui permintaan HTTP 297 00:16:03,570 --> 00:16:05,510 mengikut jenis yang sama peraturan. 298 00:16:05,510 --> 00:16:08,220 Mereka corak yang sepadan. 299 00:16:08,220 --> 00:16:15,170 >> Jadi ELIZA mempunyai yang agak penting kesan kepada bahasa tabii 300 00:16:15,170 --> 00:16:21,620 kerana ia menjadikan ia kelihatan seperti ia adalah satu mencapai objektif yang boleh dicapai, seperti entah bagaimana kita akan 301 00:16:21,620 --> 00:16:25,550 dapat menyelesaikan masalah ini secara langsung. 302 00:16:25,550 --> 00:16:30,670 Sekarang, itu bukan untuk mengatakan bahawa ELIZA tidak segala-galanya yang kita mahu lakukan. 303 00:16:30,670 --> 00:16:33,710 Sudah tentu tidak. 304 00:16:33,710 --> 00:16:35,660 Tetapi kita akan dapat untuk melakukan sesuatu yang lebih. 305 00:16:35,660 --> 00:16:38,280 306 00:16:38,280 --> 00:16:41,490 >> Langkah pertama kami pergi luar ELIZA akan 307 00:16:41,490 --> 00:16:44,840 dapat melihat tidak teks dicatatkan 308 00:16:44,840 --> 00:16:53,750 ke dalam papan kekunci tetapi ucapan, yang sebenar ucapan yang dirakam ke dalam mikrofon. 309 00:16:53,750 --> 00:16:56,880 Jadi seperti yang kita melihat ini keping yang berbeza, kami 310 00:16:56,880 --> 00:17:00,304 akan perlu membina satu set model. 311 00:17:00,304 --> 00:17:02,970 Kami akan perlu dapat untuk pergi dari akustik peringkat rendah 312 00:17:02,970 --> 00:17:07,180 padang information--, amplitud, frequency-- 313 00:17:07,180 --> 00:17:09,530 dan menukar itu ke dalam beberapa unit yang kami 314 00:17:09,530 --> 00:17:14,619 dapat lebih mudah memanipulasi dan, akhirnya, memanipulasi mereka 315 00:17:14,619 --> 00:17:18,609 kepada perkataan-perkataan dan ayat. 316 00:17:18,609 --> 00:17:22,880 >> Jadi pengiktirafan ucapan yang paling sistem yang di luar sana hari ini 317 00:17:22,880 --> 00:17:26,069 mengikut statistik model di mana kita membina 318 00:17:26,069 --> 00:17:35,090 tiga perwakilan berasingan daripada apa yang bahawa isyarat audio sebenarnya mengandungi. 319 00:17:35,090 --> 00:17:38,640 Kita mulakan dengan model fonetik yang bercakap tentang hanya asas 320 00:17:38,640 --> 00:17:41,250 bunyi yang saya menghasilkan. 321 00:17:41,250 --> 00:17:46,900 Adakah saya menghasilkan sesuatu yang B seperti dalam lelaki atau D seperti dalam anjing? 322 00:17:46,900 --> 00:17:53,220 Bagaimana saya mengenali kedua-dua yang berbeza telefon yang berasingan dan berbeza? 323 00:17:53,220 --> 00:17:56,600 >> Selain itu, kita kemudian akan membina model sebutan perkataan, 324 00:17:56,600 --> 00:18:01,350 sesuatu yang menghubungkan bersama-sama orang-orang telefon individu 325 00:18:01,350 --> 00:18:04,724 dan menggabungkan mereka ke dalam satu perkataan. 326 00:18:04,724 --> 00:18:07,890 Dan selepas itu, kami akan mengambil kata-kata dan kami akan mengumpulkan mereka dengan bahasa yang 327 00:18:07,890 --> 00:18:13,010 model menjadi ayat yang lengkap. 328 00:18:13,010 --> 00:18:17,230 >> Sekarang, kita akan bercakap tentang setiap ini secara bebas dan berasingan. 329 00:18:17,230 --> 00:18:21,580 Tetapi ketiga-tiga model semua hanya akan menjadi statistik. 330 00:18:21,580 --> 00:18:23,502 Dan ini bermakna apabila kita bekerja dengan mereka, kita akan 331 00:18:23,502 --> 00:18:25,376 dapat bekerja dengan mereka semua pada masa yang sama. 332 00:18:25,376 --> 00:18:28,100 333 00:18:28,100 --> 00:18:28,600 Baiklah. 334 00:18:28,600 --> 00:18:30,890 Mari kita mulakan dengan model fonetik kami. 335 00:18:30,890 --> 00:18:34,470 Jadi model fonetik bergantung kepada teknik pengiraan 336 00:18:34,470 --> 00:18:37,320 dipanggil model Markov tersembunyi. 337 00:18:37,320 --> 00:18:43,050 Ini adalah model grafik di mana saya mempunyai dan mengiktiraf sebuah negara di dunia 338 00:18:43,050 --> 00:18:46,500 seperti yang dicirikan oleh satu set ciri-ciri. 339 00:18:46,500 --> 00:18:51,960 Dan negeri yang menerangkan satu bahagian sesuatu tindakan yang saya terlibat dalam. 340 00:18:51,960 --> 00:19:00,190 >> Jadi, jika saya berfikir tentang membuat bunyi "ma" seperti ibu, 341 00:19:00,190 --> 00:19:03,970 ada yang berbeza komponen untuk bunyi itu. 342 00:19:03,970 --> 00:19:07,230 Ada satu bahagian di mana saya menarik nafas. 343 00:19:07,230 --> 00:19:09,560 Dan kemudian saya dompet bibir saya. 344 00:19:09,560 --> 00:19:13,710 Dan saya roll bibir saya ke belakang sedikit sedikit untuk membuat yang "ma" bunyi. 345 00:19:13,710 --> 00:19:15,340 Dan kemudian ada hutang. 346 00:19:15,340 --> 00:19:17,020 Bibir saya datang selain. 347 00:19:17,020 --> 00:19:19,030 Air dibuang. 348 00:19:19,030 --> 00:19:22,650 "Ma." 349 00:19:22,650 --> 00:19:29,250 >> Ketiga-tiga bahagian yang berlainan akan diwakili oleh negeri-negeri di graph-- ini 350 00:19:29,250 --> 00:19:33,420 awal, tengah, dan akhir. 351 00:19:33,420 --> 00:19:38,060 Dan saya akan mempunyai peralihan yang membolehkan saya untuk melancong dari satu negeri 352 00:19:38,060 --> 00:19:42,260 ke depan dengan kebarangkalian tertentu. 353 00:19:42,260 --> 00:19:47,250 Jadi, sebagai contoh, yang M bunyi mungkin mempunyai yang sangat, 354 00:19:47,250 --> 00:19:51,850 pengambilan yang singkat di beginning-- yang "mm" - dan kemudian yang lebih panjang, 355 00:19:51,850 --> 00:19:55,640 fasa bergetar di mana saya memegang saya bibir bersama-sama dan hampir humming-- 356 00:19:55,640 --> 00:20:05,090 "mmmm" - dan kemudian yang singkat plosif mana saya mengusir breath-- "ma." 357 00:20:05,090 --> 00:20:09,370 >> Model Markov tersembunyi adalah direka untuk menangkap hakikat 358 00:20:09,370 --> 00:20:13,340 bahawa cara yang saya buat bunyi "ma" akan 359 00:20:13,340 --> 00:20:17,350 menjadi sedikit berbeza dalam masa, adalah frekuensi, 360 00:20:17,350 --> 00:20:21,030 dan ciri-cirinya daripada cara bahawa anda membuat ia 361 00:20:21,030 --> 00:20:23,300 atau cara, sehingga aku dapat menjadikannya apabila saya bercakap 362 00:20:23,300 --> 00:20:26,030 tentang kegunaan yang berbeza surat. 363 00:20:26,030 --> 00:20:33,240 "Ibu" dan "boleh saya" akan bunyi sedikit berbeza. 364 00:20:33,240 --> 00:20:36,800 >> Jadi untuk mengiktiraf bunyi tertentu, kita akan 365 00:20:36,800 --> 00:20:42,020 membina model Markov, ini Markov tersembunyi model, setiap telefon mungkin bahawa saya 366 00:20:42,020 --> 00:20:45,840 mungkin mahu mengiktiraf, setiap bunyi mungkin, 367 00:20:45,840 --> 00:20:49,750 dan kemudian melihat data akustik yang saya ada 368 00:20:49,750 --> 00:20:54,430 dan menentukan statistik yang mana satu adalah yang paling mungkin 369 00:20:54,430 --> 00:20:58,110 untuk menghasilkan bunyi ini. 370 00:20:58,110 --> 00:20:58,610 OKAY. 371 00:20:58,610 --> 00:21:01,540 372 00:21:01,540 --> 00:21:06,750 Dengan model itu, kami kemudian mula membina di atasnya. 373 00:21:06,750 --> 00:21:09,330 Kami mengambil model sebutan. 374 00:21:09,330 --> 00:21:11,790 Sekarang, kadang-kadang sebutan model adalah mudah dan mudah 375 00:21:11,790 --> 00:21:14,440 kerana terdapat hanya satu cara mengucapkan sesuatu. 376 00:21:14,440 --> 00:21:17,990 Masa yang lain, mereka yang sedikit lebih rumit. 377 00:21:17,990 --> 00:21:21,340 Berikut adalah panduan sebutan untuk perkara yang merah yang 378 00:21:21,340 --> 00:21:25,210 buah-buahan yang anda buat sos tomato daripada. 379 00:21:25,210 --> 00:21:27,360 Orang ramai tidak fikir ia adalah buah. 380 00:21:27,360 --> 00:21:27,860 Betul? 381 00:21:27,860 --> 00:21:30,880 382 00:21:30,880 --> 00:21:35,300 >> Kini, terdapat banyak cara yang berbeza bahawa orang ramai akan menyebut perkataan ini. 383 00:21:35,300 --> 00:21:37,780 Ada yang mengatakan "kaki-Mei-kaki." 384 00:21:37,780 --> 00:21:40,880 Ada yang mengatakan "kaki-mah-kaki." 385 00:21:40,880 --> 00:21:44,800 Dan kita boleh menangkap bahawa dengan salah satu model grafik 386 00:21:44,800 --> 00:21:48,305 di mana, sekali lagi, kita mewakili peralihan sebagai mempunyai kebarangkalian tertentu 387 00:21:48,305 --> 00:21:51,360 dan dikaitkan kebarangkalian dengan mereka. 388 00:21:51,360 --> 00:21:58,290 >> Jadi dalam kes ini, jika saya mengikuti laluan atas melalui keseluruhan graf ini, 389 00:21:58,290 --> 00:22:03,330 Saya akan bermula dari huruf jauh di sebelah kiri, yang "ta" bunyi. 390 00:22:03,330 --> 00:22:07,570 Saya akan mengambil separuh bahagian atas, yang "oh," dan kemudian "ma," 391 00:22:07,570 --> 00:22:14,530 dan kemudian satu "," dan kemudian "ta," dan "oh." "Toe-boleh-kaki." 392 00:22:14,530 --> 00:22:19,610 Jika saya mengambil jalan yang bawah melalui ini, saya akan mendapat "ta-mah-kaki." 393 00:22:19,610 --> 00:22:26,810 Dan jika aku turun dan kemudian up, saya akan mendapat "ta-boleh-kaki." 394 00:22:26,810 --> 00:22:29,950 >> Model-model ini menangkap ini perbezaan kerana setiap kali 395 00:22:29,950 --> 00:22:32,410 kita menggunakan salah satu daripada sistem pengiktirafan, 396 00:22:32,410 --> 00:22:35,340 ia akan perlu bekerja dengan banyak jenis orang yang berbeza, 397 00:22:35,340 --> 00:22:39,295 banyak loghat yang berbeza, dan juga kegunaan yang berbeza perkataan yang sama. 398 00:22:39,295 --> 00:22:42,204 399 00:22:42,204 --> 00:22:44,120 Akhir sekali, di atas itu, kami akan membina sesuatu 400 00:22:44,120 --> 00:22:48,780 yang kelihatan benar-benar rumit, dipanggil model bahasa, 401 00:22:48,780 --> 00:22:52,950 tetapi sebenarnya adalah yang paling mudah tiga sebab ini beroperasi 402 00:22:52,950 --> 00:22:56,041 kepada apa yang dipanggil model n-gram. 403 00:22:56,041 --> 00:23:02,270 Dan dalam kes ini, saya menunjukkan anda dua bahagian model n-gram, bigram a. 404 00:23:02,270 --> 00:23:08,910 Kami akan membuat fizikal idea yang kadang-kadang, kata-kata tertentu 405 00:23:08,910 --> 00:23:14,680 lebih cenderung untuk mengikuti diberikan perkataan daripada yang lain. 406 00:23:14,680 --> 00:23:25,210 Jika saya hanya berkata "ramalan cuaca," perkataan seterusnya mungkin boleh menjadi "hari ini" 407 00:23:25,210 --> 00:23:31,510 atau boleh "cuaca ramalan esok. " 408 00:23:31,510 --> 00:23:38,870 Tetapi ia tidak mungkin menjadi " cuaca ramalan articok. " 409 00:23:38,870 --> 00:23:42,980 >> Apa model bahasa tidak adalah ia menangkap mereka secara statistik 410 00:23:42,980 --> 00:23:47,450 dengan mengira, dari beberapa yang sangat besar corpus, semua keadaan 411 00:23:47,450 --> 00:23:50,890 di mana satu perkataan berikut lain. 412 00:23:50,890 --> 00:23:54,300 Jadi, jika saya mengambil corpus-- besar seperti setiap Wall Street Journal 413 00:23:54,300 --> 00:24:00,750 yang telah dihasilkan sejak tahun 1930, yang merupakan salah satu corpuses-- standard 414 00:24:00,750 --> 00:24:03,910 dan saya melihat melalui semua teks itu, dan saya mengira 415 00:24:03,910 --> 00:24:09,770 sehingga berapa kali selepas "ramalan" saya melihat "hari ini" 416 00:24:09,770 --> 00:24:17,454 dan berapa kali saya melihat "ramalan" diikuti dengan "articok," 417 00:24:17,454 --> 00:24:19,370 yang pertama akan untuk menjadi lebih mungkin. 418 00:24:19,370 --> 00:24:21,540 Ia akan muncul lebih kerap. 419 00:24:21,540 --> 00:24:24,610 Dan maka ia akan mempunyai lebih tinggi kebarangkalian yang berkaitan dengannya. 420 00:24:24,610 --> 00:24:27,340 >> Jika saya mahu memikirkan kebarangkalian keseluruhan ucapan, 421 00:24:27,340 --> 00:24:29,940 itu, saya hanya memecahkan ia sehingga. 422 00:24:29,940 --> 00:24:35,990 Jadi kebarangkalian pendengaran ayat "tikus makan keju" 423 00:24:35,990 --> 00:24:39,110 adalah kebarangkalian perkataan "yang" bermula ayat, 424 00:24:39,110 --> 00:24:42,540 dan kemudian kebarangkalian bahawa perkataan "tikus" berikut perkataan "itu," 425 00:24:42,540 --> 00:24:44,910 dan kebarangkalian bahawa perkataan "makan" berikut "tikus," 426 00:24:44,910 --> 00:24:51,120 dan kebarangkalian bahawa "keju" berikut "makan." 427 00:24:51,120 --> 00:24:55,160 >> Ini bunyi seperti banyak statistik, banyak kebarangkalian. 428 00:24:55,160 --> 00:24:57,510 Dan itu semua bahawa ia adalah. 429 00:24:57,510 --> 00:25:02,920 Tetapi perkara yang menakjubkan ialah jika anda melakukan ini dengan sampel cukup besar data, 430 00:25:02,920 --> 00:25:03,670 ianya berfungsi. 431 00:25:03,670 --> 00:25:05,250 Dan ia berfungsi dengan hebat juga. 432 00:25:05,250 --> 00:25:07,810 433 00:25:07,810 --> 00:25:11,420 Kita semua tahu teknologi ini. 434 00:25:11,420 --> 00:25:16,500 Kebanyakan sistem pengendalian dilengkapi dengan pengecaman suara pada ketika ini. 435 00:25:16,500 --> 00:25:20,940 Kami menggunakan Siri dan Cortana dan Echo. 436 00:25:20,940 --> 00:25:25,070 Dan perkara-perkara ini adalah berdasarkan kepada jenis ini tiga lapisan model-- 437 00:25:25,070 --> 00:25:30,620 model fonetik di bahagian bawah, satu model sebutan di tengah, 438 00:25:30,620 --> 00:25:33,690 dan model bahasa di atas mereka. 439 00:25:33,690 --> 00:25:37,630 >> Sekarang, mereka perlu melakukan lebih sedikit daripada itu untuk menjawab soalan. 440 00:25:37,630 --> 00:25:43,000 Tetapi pengiktirafan apa yang anda pepatah bergantung betul-betul pada itu. 441 00:25:43,000 --> 00:25:45,700 Jadi mari kita mengambil contoh di sini. 442 00:25:45,700 --> 00:25:52,020 Jadi saya mempunyai telefon saya duduk di sini di bawah kamera dokumen itu. 443 00:25:52,020 --> 00:25:56,110 Dan kita akan meminta Siri beberapa soalan. 444 00:25:56,110 --> 00:25:57,150 Semua betul? 445 00:25:57,150 --> 00:25:59,940 >> Jadi mari kita bangun telefon saya di sini. 446 00:25:59,940 --> 00:26:02,710 447 00:26:02,710 --> 00:26:05,000 Siri, apa yang cuaca seperti di New Haven hari ini? 448 00:26:05,000 --> 00:26:07,670 449 00:26:07,670 --> 00:26:10,780 >> SIRI: Berikut adalah cuaca untuk New Haven, Connecticut, hari ini. 450 00:26:10,780 --> 00:26:11,890 >> BRIAN SCASSELLATI: OK. 451 00:26:11,890 --> 00:26:16,720 Jadi pertama anda melihat bahawa Siri diiktiraf setiap satu daripada perkataan individu 452 00:26:16,720 --> 00:26:19,050 dan kemudian menghasilkan jawapan. 453 00:26:19,050 --> 00:26:22,277 Kami akan bercakap tentang bagaimana tindak balas yang datang kira-kira dalam sedikit. 454 00:26:22,277 --> 00:26:24,110 Tetapi sekarang kita tahu bahawa ini adalah hanya berdasarkan 455 00:26:24,110 --> 00:26:28,880 statistik mentah dan ini corak jenis yang hampir sama pendekatan, 456 00:26:28,880 --> 00:26:31,120 kita boleh bermain beberapa permainan dengan Siri. 457 00:26:31,120 --> 00:26:34,560 >> Jadi saya boleh cuba lagi. 458 00:26:34,560 --> 00:26:38,864 Siri, apa yang cuaca badak air New Haven, hari ini? 459 00:26:38,864 --> 00:26:39,810 >> SIRI: OK. 460 00:26:39,810 --> 00:26:44,245 Berikut adalah cuaca untuk New Haven, Connecticut untuk hari ini. 461 00:26:44,245 --> 00:26:46,120 BRIAN SCASSELLATI: Siri ini tidak gentar dengan yang 462 00:26:46,120 --> 00:26:50,980 kerana ia didapati pattern-- yang "cuaca", "hari ini," "New Haven." 463 00:26:50,980 --> 00:26:54,420 Itulah apa yang ia bertindak balas untuk, sama seperti ELIZA. 464 00:26:54,420 --> 00:26:54,920 Baiklah. 465 00:26:54,920 --> 00:26:59,390 Mari kita memberikan satu lagi walaupun contoh lebih tidak masuk akal. 466 00:26:59,390 --> 00:27:03,075 Siri, cuaca articok armadillo badak air New Haven? 467 00:27:03,075 --> 00:27:06,806 468 00:27:06,806 --> 00:27:08,400 >> SIRI: Biar saya memeriksa itu. 469 00:27:08,400 --> 00:27:11,280 Berikut adalah apa yang saya dapati di web untuk apakah artichokes Armadillo 470 00:27:11,280 --> 00:27:13,780 badak air New Haven. 471 00:27:13,780 --> 00:27:14,760 >> BRIAN SCASSELLATI: OK. 472 00:27:14,760 --> 00:27:20,400 Jadi, jika saya pergi cukup jauh dari model ini, 473 00:27:20,400 --> 00:27:24,365 Saya dapat mengelirukan kerana ia tidak lagi sepadan dengan corak yang ia mempunyai. 474 00:27:24,365 --> 00:27:27,370 475 00:27:27,370 --> 00:27:29,390 Dan bahawa statistik enjin yang yang berkata, 476 00:27:29,390 --> 00:27:32,850 apa yang kemungkinan bahawa anda mempunyai badak air kata-kata dan articok 477 00:27:32,850 --> 00:27:34,440 bersama-sama, dan Armadillo? 478 00:27:34,440 --> 00:27:36,050 Yang mendapat menjadi sesuatu yang baru. 479 00:27:36,050 --> 00:27:38,840 480 00:27:38,840 --> 00:27:40,610 >> Jadi teknologi ini kita gunakan setiap hari. 481 00:27:40,610 --> 00:27:43,670 482 00:27:43,670 --> 00:27:47,800 Jika kita mahu mengambil mereka satu langkah lagi, walaupun, jika kita benar-benar 483 00:27:47,800 --> 00:27:53,930 mahu dapat untuk bercakap tentang apa yang ia adalah bahawa sistem ini bertindak balas kepada, 484 00:27:53,930 --> 00:28:00,630 kita perlu bercakap, sekali lagi, kira-kira set lebih asas soalan. 485 00:28:00,630 --> 00:28:05,370 Dan itu adalah satu topik dalam komunikasi yang kita panggil soalan menjawab. 486 00:28:05,370 --> 00:28:07,028 Iaitu, kita mahu dapat supaya- ya? 487 00:28:07,028 --> 00:28:07,944 PENONTON: [didengar]. 488 00:28:07,944 --> 00:28:10,789 489 00:28:10,789 --> 00:28:13,330 BRIAN SCASSELLATI: Adakah kita mendapatkan ke dalam pemprosesan semantik terpendam? 490 00:28:13,330 --> 00:28:14,070 Jadi ya. 491 00:28:14,070 --> 00:28:17,820 Terdapat banyak perkara-perkara yang berlaku di bawah permukaan dengan Siri 492 00:28:17,820 --> 00:28:20,210 dan dalam beberapa contoh Saya akan menunjukkan kepada anda yang akan datang 493 00:28:20,210 --> 00:28:22,610 di mana terdapat agak sedikit dari segi struktur 494 00:28:22,610 --> 00:28:25,260 daripada apa yang anda katakan yang penting. 495 00:28:25,260 --> 00:28:31,890 Dan, sebenarnya, itu adalah satu yang besar pelopor untuk slaid seterusnya untuk saya. 496 00:28:31,890 --> 00:28:35,110 >> Jadi dengan cara yang sama bahawa kami pengecaman pertuturan telah membina 497 00:28:35,110 --> 00:28:39,620 daripada pelbagai lapisan, jika kita mahu memahami apa yang ia adalah bahawa sebenarnya 498 00:28:39,620 --> 00:28:44,620 yang berkata, kita akan sekali lagi bergantung kepada analisis pelbagai lapisan 499 00:28:44,620 --> 00:28:47,020 teks yang yang diiktiraf. 500 00:28:47,020 --> 00:28:52,560 Oleh itu, apabila Siri sebenarnya dapat berkata, melihat saya mendapati kata-kata ini. 501 00:28:52,560 --> 00:28:55,230 Sekarang apa yang saya lakukan dengan mereka? 502 00:28:55,230 --> 00:28:59,110 Komponen pertama yang sering pergi melalui dan cuba untuk menganalisis 503 00:28:59,110 --> 00:29:03,010 struktur ayat. 504 00:29:03,010 --> 00:29:05,410 Dan dalam apa yang kita lihat di sekolah rendah, selalunya, 505 00:29:05,410 --> 00:29:08,920 sebagai jenis diagramming ayat, kita akan 506 00:29:08,920 --> 00:29:12,774 untuk menyedari bahawa tertentu kata-kata mempunyai peranan tertentu. 507 00:29:12,774 --> 00:29:13,440 Ini adalah kata nama. 508 00:29:13,440 --> 00:29:14,231 Ini adalah kata ganti nama. 509 00:29:14,231 --> 00:29:16,200 Ini adalah kata kerja. 510 00:29:16,200 --> 00:29:19,460 Dan kita akan mengenali bahawa untuk tatabahasa tertentu, 511 00:29:19,460 --> 00:29:24,700 dalam kes ini Bahasa Inggeris tatabahasa, terdapat cara-cara yang sah di mana saya boleh menggabungkan mereka 512 00:29:24,700 --> 00:29:26,280 dan cara-cara lain yang tidak sah. 513 00:29:26,280 --> 00:29:29,920 514 00:29:29,920 --> 00:29:33,870 >> Pengiktirafan bahawa, struktur itu, mungkin cukup untuk membantu membimbing kita 515 00:29:33,870 --> 00:29:36,720 sedikit. 516 00:29:36,720 --> 00:29:39,820 Tetapi ia tidak cukup cukup untuk kita dapat memberikan 517 00:29:39,820 --> 00:29:43,290 apa-apa makna kepada apa yang dikatakan di sini. 518 00:29:43,290 --> 00:29:46,615 Untuk berbuat demikian, kami akan terpaksa bergantung kepada beberapa jumlah pemprosesan semantik. 519 00:29:46,615 --> 00:29:49,590 520 00:29:49,590 --> 00:29:55,080 Iaitu, kita akan perlu melihat di bawah apa yang setiap kata-kata ini 521 00:29:55,080 --> 00:29:57,400 sebenarnya membawa sebagai makna. 522 00:29:57,400 --> 00:30:01,150 Dan dengan cara yang paling mudah untuk melakukan ini, kita akan kaitkan dengan setiap perkataan 523 00:30:01,150 --> 00:30:06,930 yang kita tahu fungsi tertentu, transformasi pasti bahawa itu 524 00:30:06,930 --> 00:30:09,300 membolehkan untuk berlaku. 525 00:30:09,300 --> 00:30:14,470 >> Dalam kes ini, kita boleh labelkan perkataan "John" sebagai nama yang betul, 526 00:30:14,470 --> 00:30:18,160 bahawa ia membawa bersamanya identiti. 527 00:30:18,160 --> 00:30:21,530 Dan kita boleh melabelkan "Mary" sebagai cara yang sama. 528 00:30:21,530 --> 00:30:27,900 Manakala kata kerja seperti "suka," yang merupakan hubungan tertentu 529 00:30:27,900 --> 00:30:31,582 yang kami dapat untuk mewakili. 530 00:30:31,582 --> 00:30:33,290 Sekarang, itu tidak bermakna kita memahami 531 00:30:33,290 --> 00:30:37,680 apa cinta itu tetapi hanya untuk kita memahami ia di jalan sistem simbolik. 532 00:30:37,680 --> 00:30:40,480 Iaitu, kita boleh label dan memanipulasi ia. 533 00:30:40,480 --> 00:30:44,230 534 00:30:44,230 --> 00:30:49,120 >> Dengan setiap jenis pendekatan, apa-apa jenis pemprosesan semantik 535 00:30:49,120 --> 00:30:57,060 di sini akan memerlukan sedikit sedikit pengetahuan dan banyak kerja 536 00:30:57,060 --> 00:30:59,020 di pihak kami. 537 00:30:59,020 --> 00:31:03,590 Kita tidak lagi di alam di mana statistik hanya kosong 538 00:31:03,590 --> 00:31:07,320 akan cukup untuk kita. 539 00:31:07,320 --> 00:31:11,330 Sekarang, untuk pergi dari sudut ini untuk menjadi 540 00:31:11,330 --> 00:31:15,520 dapat bercakap tentang bahagian dalam apa yang sebenarnya berlaku di sini, 541 00:31:15,520 --> 00:31:19,640 untuk dapat dimanipulasi struktur dan memahami soalan 542 00:31:19,640 --> 00:31:23,160 dan kemudian dapat untuk keluar dan mencari, 543 00:31:23,160 --> 00:31:27,290 yang memerlukan lebih model kognitif yang kompleks. 544 00:31:27,290 --> 00:31:34,880 >> Cara di mana sistem ini dibina adalah untuk bahagian yang paling sangat, sangat buruh 545 00:31:34,880 --> 00:31:36,350 intensif. 546 00:31:36,350 --> 00:31:39,490 Ia melibatkan manusia menghabiskan tawaran hebat 547 00:31:39,490 --> 00:31:44,100 masa menstrukturkan cara-cara di yang jenis-jenis ayat 548 00:31:44,100 --> 00:31:47,270 boleh diwakili dalam beberapa logik. 549 00:31:47,270 --> 00:31:51,639 550 00:31:51,639 --> 00:31:53,430 Ia mendapat walaupun sedikit lebih kompleks, walaupun. 551 00:31:53,430 --> 00:31:56,400 552 00:31:56,400 --> 00:31:59,660 >> Walaupun sekali kita telah diuruskan dengan semantik, kita akan 553 00:31:59,660 --> 00:32:03,860 masih perlu melihat pragmatik daripada apa yang diperkatakan. 554 00:32:03,860 --> 00:32:08,620 Iaitu, bagaimana saya berkaitan kata-kata yang saya perlu sesuatu secara fizikal daripada 555 00:32:08,620 --> 00:32:12,054 ada di dunia atau di kurangnya beberapa sumber maklumat 556 00:32:12,054 --> 00:32:12,970 bahawa saya boleh memanipulasi? 557 00:32:12,970 --> 00:32:15,780 558 00:32:15,780 --> 00:32:20,790 >> Kadang-kadang, ini membawa kepada bit indah kekaburan. 559 00:32:20,790 --> 00:32:24,470 "Merah-panas bintang untuk berkahwin astronomi." 560 00:32:24,470 --> 00:32:25,630 OKAY. 561 00:32:25,630 --> 00:32:28,540 Sekarang, kita membaca bahawa sebagai Jenis lucu tajuk 562 00:32:28,540 --> 00:32:34,690 bahawa kita akan lihat di TV lewat malam kerana kita tidak mentafsir "bintang" 563 00:32:34,690 --> 00:32:38,630 mempunyai makna objek angkasa itu. 564 00:32:38,630 --> 00:32:43,390 Kita tahu bahawa ia bermakna lebih pelakon biasa atau pelakon 565 00:32:43,390 --> 00:32:45,240 dengan jumlah yang tinggi penglihatan. 566 00:32:45,240 --> 00:32:47,770 567 00:32:47,770 --> 00:32:51,950 >> "Skuad membantu mangsa gigitan anjing." 568 00:32:51,950 --> 00:32:55,550 Adakah ia, skuad itu sebenarnya di luar sana membantu anjing 569 00:32:55,550 --> 00:32:59,620 untuk pergi sekitar dan menggigit mangsa? 570 00:32:59,620 --> 00:33:02,380 Atau adakah terdapat seorang individu yang merupakan 571 00:33:02,380 --> 00:33:04,625 digigit oleh anjing yang memerlukan bantuan? 572 00:33:04,625 --> 00:33:07,650 573 00:33:07,650 --> 00:33:11,480 Hanya dengan melihat sintaks dan semantik daripada ayat, 574 00:33:11,480 --> 00:33:14,660 kita tidak boleh menentukan bahawa. 575 00:33:14,660 --> 00:33:22,000 >> "Helikopter dikuasakan oleh lalat manusia." 576 00:33:22,000 --> 00:33:27,330 Berada di sana, sebenarnya, yang sebenar perkara-perkara kecil yang terbang di sekitar 577 00:33:27,330 --> 00:33:34,510 adalah orang yang mempunyai sayap menjanakan helikopter untuk kebaikan manusia? 578 00:33:34,510 --> 00:33:38,960 Atau ada satu peranti mekanikal yang berasal kuasanya daripada seseorang? 579 00:33:38,960 --> 00:33:41,600 580 00:33:41,600 --> 00:33:46,500 >> Apabila kita melihat soalan menjawab sistem, 581 00:33:46,500 --> 00:33:51,110 ini adalah lapisan yang kita perlu berurusan dengan. 582 00:33:51,110 --> 00:33:54,890 Sekarang, yang terbaik dan yang paling jenis daripada berleluasa sistem ini 583 00:33:54,890 --> 00:34:00,640 hari ini dapat melakukan perkara pada tahap yang 584 00:34:00,640 --> 00:34:05,050 lebih daripada apa yang kita mempunyai 10 tahun yang lalu. 585 00:34:05,050 --> 00:34:08,210 Berikut adalah salah satu sistem yang terbaik yang di luar sana hari ini. 586 00:34:08,210 --> 00:34:10,519 Dan ini adalah satu sistem yang daripada IBM dipanggil Watson. 587 00:34:10,519 --> 00:34:13,040 588 00:34:13,040 --> 00:34:15,500 Ini adalah dari rakan-rakan kami di IBM. 589 00:34:15,500 --> 00:34:19,810 Ini adalah bank Katherine, Jia Chen, dan Priscilla Moraes memberikan kami 590 00:34:19,810 --> 00:34:26,323 demonstrasi Watson semalam di IBM Yorktown. 591 00:34:26,323 --> 00:34:26,989 [VIDEO MAIN SEMULA] 592 00:34:26,989 --> 00:34:27,690 -Apa khabar? 593 00:34:27,690 --> 00:34:30,600 594 00:34:30,600 --> 00:34:31,980 >> -Saya sihat. 595 00:34:31,980 --> 00:34:35,429 Saya sentiasa gembira apabila saya berfikir, terutama apabila saya 596 00:34:35,429 --> 00:34:38,920 boleh kekal sejuk di bilik-bilik server. 597 00:34:38,920 --> 00:34:40,170 -yang Adalah pelakon kegemaran anda? 598 00:34:40,170 --> 00:34:43,870 599 00:34:43,870 --> 00:34:47,555 >> Pelakon kegemaran -My Angelina Jolie sebagai Lara Croft 600 00:34:47,555 --> 00:34:54,800 dalam Tomb Raider kerana asal beliau bentuk adalah sebagai watak maya seperti saya. 601 00:34:54,800 --> 00:34:56,760 >> -Berapa Watson boleh membantu pesakit? 602 00:34:56,760 --> 00:34:59,700 603 00:34:59,700 --> 00:35:03,755 >> -Adakah Pelan bagi pesakit untuk mempunyai akses kepada Watson secara langsung? 604 00:35:03,755 --> 00:35:08,050 Akses kepada Watson nasihat permohonan akan berbeza mengikut penggunaan kes. 605 00:35:08,050 --> 00:35:12,630 Tetapi pada masa ini, Watson hanya akan menyediakan diagnosis mungkin dan rawatan 606 00:35:12,630 --> 00:35:14,725 pilihan untuk profesional perubatan. 607 00:35:14,725 --> 00:35:17,680 Di mana sesuai, pesakit boleh memberikan maklumat 608 00:35:17,680 --> 00:35:21,210 kepada Watson, mungkin melalui antara muka web portal, tablet, 609 00:35:21,210 --> 00:35:23,500 atau telefon bimbit. 610 00:35:23,500 --> 00:35:27,180 Sebagai contoh, seorang pesakit mungkin diminta untuk menggambarkan tanda-tanda mereka 611 00:35:27,180 --> 00:35:30,460 dalam bahasa asli langsung ke dalam penyelesaian Watson, 612 00:35:30,460 --> 00:35:34,050 yang membolehkan doktor untuk memberi tumpuan kepada diagnosis dan tidak pengumpulan data. 613 00:35:34,050 --> 00:35:38,379 614 00:35:38,379 --> 00:35:42,716 >> -yang Abraham Lincoln dibunuh? 615 00:35:42,716 --> 00:35:46,153 >> -John Wilkes Booth. 616 00:35:46,153 --> 00:35:52,373 >> -Dalam Apa tahun lakukan Arizona Diamondbacks memenangi Siri Dunia? 617 00:35:52,373 --> 00:35:55,295 >> -2001. 618 00:35:55,295 --> 00:35:58,710 >> [AKHIR MAIN SEMULA] 619 00:35:58,710 --> 00:36:01,610 >> BRIAN SCASSELLATI: Jadi jenis-jenis sistem 620 00:36:01,610 --> 00:36:07,430 terpaksa bergantung kepada pertama sekali mengiktiraf ucapan; kedua, 621 00:36:07,430 --> 00:36:12,200 menukarkan ia menjadi sebuah dalaman bermakna perwakilan; dan kemudian, ketiga, 622 00:36:12,200 --> 00:36:17,090 dapat keluar dan mencari sumber maklumat yang 623 00:36:17,090 --> 00:36:21,140 membolehkan mereka untuk menjawab soalan itu. 624 00:36:21,140 --> 00:36:27,320 Tahap kerumitan melibatkan jenis yang sama perkara perancangan 625 00:36:27,320 --> 00:36:31,790 bahawa anda telah lakukan dalam set masalah. 626 00:36:31,790 --> 00:36:38,000 >> Kami mampu menghuraikan permintaan HTTP dalam jenis yang sama corak peringkat rendah 627 00:36:38,000 --> 00:36:40,810 yang hampir sama yang ELIZA boleh lakukan. 628 00:36:40,810 --> 00:36:45,070 Kami mampu untuk menukar mereka menjadi perwakilan dalaman, 629 00:36:45,070 --> 00:36:50,360 dan kemudian menggunakan mereka untuk query beberapa pangkalan data luaran, mungkin menggunakan SQL. 630 00:36:50,360 --> 00:36:53,530 631 00:36:53,530 --> 00:36:56,260 Semua sistem yang sedang dibina hari ini 632 00:36:56,260 --> 00:37:00,520 untuk melakukan ini jenis semula jadi komunikasi bahasa 633 00:37:00,520 --> 00:37:04,100 sedang dibina di atas prinsip-prinsip yang sama. 634 00:37:04,100 --> 00:37:09,530 >> Sekarang, walaupun sistem seperti Watson tidak cukup kompleks 635 00:37:09,530 --> 00:37:14,820 dapat menjawab sembarangan soalan tentang sebarang topik. 636 00:37:14,820 --> 00:37:20,060 Dan sebenarnya, mereka perlu berstruktur dalam domain tertentu. 637 00:37:20,060 --> 00:37:24,440 Jadi, anda boleh pergi ke dalam talian, anda boleh versi Watson yang beroperasi dengan baik 638 00:37:24,440 --> 00:37:27,700 dalam informatik perubatan. 639 00:37:27,700 --> 00:37:31,490 Atau ada satu talian yang hanya berkaitan dengan bagaimana 640 00:37:31,490 --> 00:37:34,540 untuk membuat syor yang baik tentang apa bir akan pergi dengan mana makanan. 641 00:37:34,540 --> 00:37:37,060 642 00:37:37,060 --> 00:37:41,870 Dan dalam masa yang domain, ia boleh menjawab soalan, 643 00:37:41,870 --> 00:37:46,130 mencari maklumat yang diperlukan. 644 00:37:46,130 --> 00:37:48,270 >> Tetapi anda tidak boleh mencampur dan sepadan dengan mereka. 645 00:37:48,270 --> 00:37:53,150 Sistem yang sudah dilatih dengan pangkalan data makanan dan bir 646 00:37:53,150 --> 00:37:56,830 tidak berfungsi dengan baik apabila anda tiba-tiba memasukkannya ke dalam dengan informatik perubatan 647 00:37:56,830 --> 00:37:59,770 pangkalan data. 648 00:37:59,770 --> 00:38:05,680 Jadi, walaupun sistem yang terbaik hari ini bergantung kepada tahap pemprosesan 649 00:38:05,680 --> 00:38:11,570 di mana kita berada pengekodan tangan dan membina infrastruktur dalam usaha 650 00:38:11,570 --> 00:38:13,275 untuk membuat sistem ini berjalan. 651 00:38:13,275 --> 00:38:16,360 652 00:38:16,360 --> 00:38:20,710 >> Sekarang, perkara terakhir yang saya mahu dapat untuk sampai ke hari ini 653 00:38:20,710 --> 00:38:23,960 adalah mengenai komunikasi bukan lisan. 654 00:38:23,960 --> 00:38:29,290 Jisim yang besar maklumat yang kita berkomunikasi antara satu sama lain 655 00:38:29,290 --> 00:38:35,490 tidak dapat terbentuk melalui perkataan individu bahawa kita memohon. 656 00:38:35,490 --> 00:38:40,290 Ia mempunyai kaitan dengan perkara-perkara seperti jarak, pandangan, nada suara anda, 657 00:38:40,290 --> 00:38:42,270 nada suara anda. 658 00:38:42,270 --> 00:38:46,620 Dan komunikasi yang juga sesuatu yang antara muka yang berbeza 659 00:38:46,620 --> 00:38:49,960 peduli banyak tentang. 660 00:38:49,960 --> 00:38:51,500 Ia bukan apa Siri mengambil berat tentang. 661 00:38:51,500 --> 00:38:56,250 Saya boleh meminta Siri sesuatu dalam satu suara atau dalam nada yang berbeza suara, 662 00:38:56,250 --> 00:38:59,840 dan Siri akan memberikan saya jawapan yang sama. 663 00:38:59,840 --> 00:39:05,260 Tetapi itu bukan apa yang kita membina untuk lain-lain jenis antara muka. 664 00:39:05,260 --> 00:39:09,120 >> Saya ingin memperkenalkan anda Masuk untuk salah satu robot. 665 00:39:09,120 --> 00:39:12,720 Ini dibina oleh lama saya rakan dan rakan sekerja Cynthia 666 00:39:12,720 --> 00:39:16,010 Breazeal dan syarikatnya Jibo. 667 00:39:16,010 --> 00:39:20,090 Dan robot-- ini kita akan untuk mempunyai beberapa sukarelawan 668 00:39:20,090 --> 00:39:22,520 datang untuk berinteraksi dengan ini. 669 00:39:22,520 --> 00:39:26,200 Jadi boleh saya mempunyai dua orang yang bersedia bermain dengan robot untuk saya? 670 00:39:26,200 --> 00:39:29,936 Apa kata anda datang ke atas, dan mengapa tidak anda datang ke atas. 671 00:39:29,936 --> 00:39:31,310 Jika anda sedang bersama saya di sini, sila. 672 00:39:31,310 --> 00:39:36,520 673 00:39:36,520 --> 00:39:39,670 >> Dan jika saya boleh anda datang tepat di sini. 674 00:39:39,670 --> 00:39:40,170 Terima kasih. 675 00:39:40,170 --> 00:39:40,480 Hi. 676 00:39:40,480 --> 00:39:41,400 >> ALFREDO: Selamat berkenalan. 677 00:39:41,400 --> 00:39:42,010 Alfredo. 678 00:39:42,010 --> 00:39:42,520 >> BRIAN SCASSELLATI: Alfredo. 679 00:39:42,520 --> 00:39:43,146 >> Gosip: Rachel. 680 00:39:43,146 --> 00:39:44,228 BRIAN SCASSELLATI Rachel. 681 00:39:44,228 --> 00:39:45,154 Gembira dapat bertemu dengan anda berdua. 682 00:39:45,154 --> 00:39:46,820 Alfredo, saya akan anda pergi dulu. 683 00:39:46,820 --> 00:39:47,990 Datang tepat di sini. 684 00:39:47,990 --> 00:39:51,870 Saya akan memperkenalkan atasmu, jika saya boleh mendapatkan ini di luar 685 00:39:51,870 --> 00:39:58,450 tanpa mengetuk microphone-- yang kepada robot kecil bernama Jibo. 686 00:39:58,450 --> 00:40:00,140 OKAY? 687 00:40:00,140 --> 00:40:04,260 >> Sekarang, Jibo direka untuk menjadi interaktif. 688 00:40:04,260 --> 00:40:09,339 Dan walaupun ia boleh memberikan ucapan, banyak interaksi dengan robot 689 00:40:09,339 --> 00:40:09,880 adalah bukan lisan. 690 00:40:09,880 --> 00:40:12,450 691 00:40:12,450 --> 00:40:17,070 Alfredo, saya akan meminta anda untuk mengatakan sesuatu yang baik dan percuma 692 00:40:17,070 --> 00:40:19,554 kepada robot, sila. 693 00:40:19,554 --> 00:40:20,845 ALFREDO: Saya rasa anda kelihatan comel. 694 00:40:20,845 --> 00:40:24,114 695 00:40:24,114 --> 00:40:25,611 >> [Whirring BUNYI] 696 00:40:25,611 --> 00:40:26,192 697 00:40:26,192 --> 00:40:27,108 BRIAN SCASSELLATI: OK. 698 00:40:27,108 --> 00:40:30,110 699 00:40:30,110 --> 00:40:33,180 Tindak balas bukan lisan. 700 00:40:33,180 --> 00:40:35,180 Namun ia memberi anda kedua-dua pengesahan jelas 701 00:40:35,180 --> 00:40:39,680 bahawa ia telah mendengar apa yang anda katakan dan juga entah bagaimana memahami bahawa. 702 00:40:39,680 --> 00:40:40,530 OKAY? 703 00:40:40,530 --> 00:40:42,070 Langkah segera kembali di sini untuk satu saat. 704 00:40:42,070 --> 00:40:43,130 Terima kasih. 705 00:40:43,130 --> 00:40:44,090 >> Rachel, jika anda akan. 706 00:40:44,090 --> 00:40:46,070 Sekarang, saya akan memberikan anda kerja lebih sukar. 707 00:40:46,070 --> 00:40:48,361 Jika anda sedang berdiri di sini, menyandarkan hanya sedikit supaya 708 00:40:48,361 --> 00:40:50,280 kita boleh mendapatkan anda pada kamera dan mengalu-cara ini. 709 00:40:50,280 --> 00:40:56,840 Saya akan meminta anda untuk menyatakan sesuatu benar-benar bermakna dan jahat kepada robot. 710 00:40:56,840 --> 00:41:02,900 >> Gosip: Apa yang anda hanya seolah-olah lakukan adalah benar-benar tidak masuk akal. 711 00:41:02,900 --> 00:41:03,840 >> [Bersenandung BUNYI] 712 00:41:03,840 --> 00:41:07,610 713 00:41:07,610 --> 00:41:09,030 >> Itu adalah lebih tidak masuk akal. 714 00:41:09,030 --> 00:41:10,120 Apa yang berlaku dengan anda? 715 00:41:10,120 --> 00:41:13,487 716 00:41:13,487 --> 00:41:16,207 Aw, tidak merasa buruk. 717 00:41:16,207 --> 00:41:17,040 Saya akan memberikan anda pelukan. 718 00:41:17,040 --> 00:41:19,882 719 00:41:19,882 --> 00:41:21,090 BRIAN SCASSELLATI: Baiklah. 720 00:41:21,090 --> 00:41:22,280 Terima kasih, Rachel. 721 00:41:22,280 --> 00:41:24,565 Alfredo, Rachel, guys terima kasih sangat banyak. 722 00:41:24,565 --> 00:41:26,840 >> [Tepuk tangan] 723 00:41:26,840 --> 00:41:28,660 724 00:41:28,660 --> 00:41:34,470 >> Jadi ini jenis interaksi mempunyai dalam banyak cara beberapa peraturan yang sama 725 00:41:34,470 --> 00:41:36,950 dan beberapa yang sama struktur seperti yang kita 726 00:41:36,950 --> 00:41:39,950 mungkin mempunyai dalam interaksi bahasa. 727 00:41:39,950 --> 00:41:44,530 Ia adalah kedua-dua komunikasi dan menyajikan tujuan penting. 728 00:41:44,530 --> 00:41:48,590 Dan interaksi bahawa, pelbagai cara, direka 729 00:41:48,590 --> 00:41:52,890 mempunyai kesan yang khusus kepada orang berinteraksi dengan atau mendengar 730 00:41:52,890 --> 00:41:54,410 kepada robot. 731 00:41:54,410 --> 00:41:56,450 >> Sekarang, saya bernasib baik untuk mempunyai Jibo sini hari ini. 732 00:41:56,450 --> 00:42:00,550 Sam Spaulding di sini membantu kami keluar dengan robot. 733 00:42:00,550 --> 00:42:07,470 Dan saya akan bertanya kepada Sam untuk memberi kita satu demo bagus menari Jibo 734 00:42:07,470 --> 00:42:09,720 yang kita boleh menonton pada akhirnya di sini. 735 00:42:09,720 --> 00:42:10,590 Oleh itu, pergilah ke hadapan, Jibo. 736 00:42:10,590 --> 00:42:11,550 >> SAM: OK, Jibo. 737 00:42:11,550 --> 00:42:14,430 Menunjukkan kepada kita pergerakan tarian anda. 738 00:42:14,430 --> 00:42:17,310 >> [Bermain muzik] 739 00:42:17,310 --> 00:42:43,114 740 00:42:43,114 --> 00:42:44,780 BRIAN SCASSELLATI: Baiklah, semua orang. 741 00:42:44,780 --> 00:42:46,865 Terima kasih kepada rakan-rakan kami di Jibo. 742 00:42:46,865 --> 00:42:49,426 >> [Tepuk tangan] 743 00:42:49,426 --> 00:42:50,140 744 00:42:50,140 --> 00:42:54,990 >> Dan terima kasih kepada rakan-rakan kami di IBM untuk membantu keluar hari ini. 745 00:42:54,990 --> 00:42:57,300 Komunikasi adalah sesuatu bahawa anda akan 746 00:42:57,300 --> 00:43:02,280 untuk melihat datang lebih dan lebih sebagai kita membina antara muka yang lebih kompleks. 747 00:43:02,280 --> 00:43:05,760 Minggu depan, kita akan bercakap tentang bagaimana untuk antara muka 748 00:43:05,760 --> 00:43:08,890 dengan lawan komputer dalam permainan. 749 00:43:08,890 --> 00:43:12,950 Tetapi jika anda mempunyai soalan tentang perkara ini, Saya akan berada di sekitar pada waktu pejabat malam ini. 750 00:43:12,950 --> 00:43:17,610 Saya gembira untuk bercakap dengan anda tentang AI topik atau untuk masuk ke lebih terperinci. 751 00:43:17,610 --> 00:43:18,927 Selamat berhujung minggu. 752 00:43:18,927 --> 00:43:21,409 >> [Tepuk tangan] 753 00:43:21,409 --> 00:43:21,909 754 00:43:21,909 --> 00:43:26,141 [Bermain muzik] 755 00:43:26,141 --> 00:46:42,879