1 00:00:00,000 --> 00:00:02,928 >> [MUSIC PLAYING] 2 00:00:02,928 --> 00:00:11,230 3 00:00:11,230 --> 00:00:12,790 >> DAVID Malan: Ini adalah CS50. 4 00:00:12,790 --> 00:00:14,072 Ini adalah akhir pekan 10. 5 00:00:14,072 --> 00:00:16,030 Dan anak laki-laki, kita memiliki kelas yang baik untuk Anda hari ini. 6 00:00:16,030 --> 00:00:20,040 Kami sangat bersemangat untuk mengundang dua teman-teman kita dari Yale hingga kami hari ini 7 00:00:20,040 --> 00:00:23,920 dan untuk melihat di persimpangan kecerdasan buatan, robotika, 8 00:00:23,920 --> 00:00:25,710 pengolahan bahasa alami, dan banyak lagi. 9 00:00:25,710 --> 00:00:27,090 >> Dan memang, selama beberapa minggu terakhir, kami telah 10 00:00:27,090 --> 00:00:29,714 tentu menghabiskan banyak waktu, terutama di psets sebelumnya, 11 00:00:29,714 --> 00:00:31,560 berfokus pada cukup detail tingkat rendah. 12 00:00:31,560 --> 00:00:34,520 Dan itu sangat mudah untuk melupakan dari hutan untuk pohon 13 00:00:34,520 --> 00:00:38,170 dan terpaku pada loop dan kondisi dan pointer, tentu, dan sejenisnya. 14 00:00:38,170 --> 00:00:41,770 Tetapi kenyataannya adalah kalian sekarang memiliki bahan yang Anda benar-benar dapat 15 00:00:41,770 --> 00:00:45,300 memecahkan beberapa masalah yang menarik, antara mereka orang-orang yang teman-teman kita di Yale 16 00:00:45,300 --> 00:00:48,790 bekerja pada hanya malu dari Cambridge. 17 00:00:48,790 --> 00:00:52,410 >> Jadi izinkan saya pertama memperkenalkan kepala kita mengajar asisten dari Yale, Andy. 18 00:00:52,410 --> 00:00:55,182 >> [TEPUK TANGAN] 19 00:00:55,182 --> 00:00:57,030 20 00:00:57,030 --> 00:01:00,710 >> ANDY: Pertama-tama, hanya terima Anda untuk memungkinkan beberapa Yalies 21 00:01:00,710 --> 00:01:02,700 pop pada ke Cambridge hari ini. 22 00:01:02,700 --> 00:01:05,299 Kami benar-benar menghargai itu. 23 00:01:05,299 --> 00:01:07,090 Kedua, untuk teman-teman kita kembali home-- Jason, 24 00:01:07,090 --> 00:01:09,670 terima kasih untuk tinggal dan menjalankan kuliah. 25 00:01:09,670 --> 00:01:12,970 Berharap itu semua baik di New Haven. 26 00:01:12,970 --> 00:01:15,720 >> Jadi ya, aku super bersemangat memperkenalkan Scaz hari ini. 27 00:01:15,720 --> 00:01:17,020 Scaz menjalankan laboratorium robotika. 28 00:01:17,020 --> 00:01:19,690 Dia seorang profesor, seperti, lima departemen yang berbeda di Yale. 29 00:01:19,690 --> 00:01:23,159 Di laboratorium, ia memiliki banyak, banyak robot yang dia suka bermain dengan. 30 00:01:23,159 --> 00:01:24,950 Dia memiliki, seperti, yang pekerjaan paling keren di dunia. 31 00:01:24,950 --> 00:01:27,116 Dan dia bisa agak berantakan sekitar dengan itu sepanjang hari 32 00:01:27,116 --> 00:01:29,090 panjang dan melakukan beberapa pekerjaan, juga. 33 00:01:29,090 --> 00:01:33,070 >> Dan jadi kita benar-benar membawa satu Dari mereka turun dengan kami hari ini. 34 00:01:33,070 --> 00:01:36,900 Jadi tanpa basa-basi, Scaz adalah akan pergi ke depan dan memperkenalkan kami 35 00:01:36,900 --> 00:01:38,660 ke teman robot nya. 36 00:01:38,660 --> 00:01:41,546 >> [TEPUK TANGAN] 37 00:01:41,546 --> 00:01:42,935 38 00:01:42,935 --> 00:01:44,310 BRIAN SCASSELLATI: Terima kasih, David. 39 00:01:44,310 --> 00:01:45,380 Terima kasih, Andy. 40 00:01:45,380 --> 00:01:50,050 Hal ini begitu indah untuk menjadi di sini dengan semua orang hari ini. 41 00:01:50,050 --> 00:01:56,490 Saya ingin pertama menjadi sangat jelas bahwa staf CS50 di sini di Cambridge 42 00:01:56,490 --> 00:01:59,190 telah sangat ramah kepada kami. 43 00:01:59,190 --> 00:02:02,130 Kami sangat berterima kasih untuk semuanya mereka lakukan untuk mendukung kami. 44 00:02:02,130 --> 00:02:05,690 Dan jadi kami ingin dapat untuk kembali kebaikan. 45 00:02:05,690 --> 00:02:09,370 >> Jadi hari ini, kami bisa mengumumkan bahwa kita akan memiliki baru, 46 00:02:09,370 --> 00:02:15,240 satu-of-a-kind acara CS50 terjadi di New Haven pekan depan. 47 00:02:15,240 --> 00:02:18,040 Dan ini adalah CS50 Penelitian Expo. 48 00:02:18,040 --> 00:02:21,300 Jadi kita akan mengundang everyone-- CS50 siswa, 49 00:02:21,300 --> 00:02:26,510 Staf dari kedua Harvard dan Yale-- untuk turun dan mengunjungi dengan kami pada hari Jumat. 50 00:02:26,510 --> 00:02:30,400 Kami akan memiliki berbagai macam lebih 30 orang yang berbeda menyajikan 51 00:02:30,400 --> 00:02:34,830 dan upperclassmen exhibiting-- menunjukkan off beberapa produk penelitian mereka. 52 00:02:34,830 --> 00:02:38,480 Kami akan memiliki beberapa startups, bahkan, mencari untuk sedikit bakat teknologi baru, 53 00:02:38,480 --> 00:02:40,460 startups dari kedua Harvard dan Yale. 54 00:02:40,460 --> 00:02:44,550 Dan kami akan memiliki beberapa kelompok mahasiswa mencari beberapa anggota baru. 55 00:02:44,550 --> 00:02:46,357 >> Ini akan menjadi waktu yang sangat menarik. 56 00:02:46,357 --> 00:02:49,190 Mudah-mudahan Anda yang berada turun untuk pertandingan Harvard-Yale 57 00:02:49,190 --> 00:02:51,360 akan dapat menghentikan oleh sedikit lebih awal, 58 00:02:51,360 --> 00:02:54,060 tepat di pusat kampus, Sterling Memorial Library. 59 00:02:54,060 --> 00:02:58,040 Kita akan memiliki satu set pameran yang berkisar dari otonom 60 00:02:58,040 --> 00:03:04,460 perahu layar untuk cara menggunakan perangkat lunak untuk melestarikan naskah abad pertengahan. 61 00:03:04,460 --> 00:03:07,860 >> Kita akan memiliki iklan jaringan hoc dan orang-orang 62 00:03:07,860 --> 00:03:11,230 mengajar software coding di Cape Town. 63 00:03:11,230 --> 00:03:13,730 Kami akan memiliki komputer demonstrasi musik. 64 00:03:13,730 --> 00:03:16,020 Dan kami akan tentu saja memiliki lebih robot. 65 00:03:16,020 --> 00:03:18,900 Jadi kami berharap Anda akan bergabung dengan kami untuk acara ini. 66 00:03:18,900 --> 00:03:21,350 Ini harus banyak menyenangkan, sedikit makanan, 67 00:03:21,350 --> 00:03:24,430 dan banyak menarik hal untuk dibicarakan. 68 00:03:24,430 --> 00:03:28,230 >> Jadi hari ini, kita akan berbicara tentang pengolahan bahasa alami. 69 00:03:28,230 --> 00:03:32,560 Dan ini adalah upaya untuk kita untuk membangun cara baru berinteraksi 70 00:03:32,560 --> 00:03:35,150 dengan perangkat kami karena selama beberapa minggu terakhir, 71 00:03:35,150 --> 00:03:40,800 Anda telah difokuskan pada bagaimana itu adalah bahwa Anda dapat menulis kode, menulis perangkat lunak 72 00:03:40,800 --> 00:03:47,110 itu adalah cara untuk bisa mengatakan ke mesin, ini adalah apa yang saya ingin Anda lakukan. 73 00:03:47,110 --> 00:03:50,210 >> Tapi kita tidak perlu berharap bahwa segala sesuatu 74 00:03:50,210 --> 00:03:53,760 yang ada di luar sana yang digunakan oleh semua orang di dunia 75 00:03:53,760 --> 00:03:57,480 akan menjadi mahir dalam jenis instruksi. 76 00:03:57,480 --> 00:04:02,540 Jadi kita membedakan antara komputer bahasa dan languages-- alami 77 00:04:02,540 --> 00:04:06,720 yaitu, hal-hal yang manusia digunakan untuk berkomunikasi dengan manusia lainnya. 78 00:04:06,720 --> 00:04:12,270 Dan kami mencoba untuk membangun interface yang menggunakan mekanisme komunikasi alami ini. 79 00:04:12,270 --> 00:04:16,029 >> Sekarang, sama seperti setiap topik lainnya bahwa kita sudah mulai dengan di CS50, 80 00:04:16,029 --> 00:04:19,589 kita akan mulai dengan sederhana sedikit pengolahan bahasa alami 81 00:04:19,589 --> 00:04:21,269 bahwa kita bisa bayangkan. 82 00:04:21,269 --> 00:04:24,940 Kita akan mulai dengan bagian sejarah bahasa alami. 83 00:04:24,940 --> 00:04:28,740 Dan kemudian kita akan membangun hingga sistem yang lebih dan lebih baru-baru ini 84 00:04:28,740 --> 00:04:31,450 dan memiliki beberapa demo menyenangkan sepanjang jalan. 85 00:04:31,450 --> 00:04:35,900 >> Jadi kita akan mulai dengan apa yang mungkin bahasa alami pertama 86 00:04:35,900 --> 00:04:38,210 sistem pengolahan. 87 00:04:38,210 --> 00:04:45,080 Ini adalah sebuah sistem perangkat lunak yang ditulis dalam 1966 oleh Joseph Weizenbaum disebut ELIZA. 88 00:04:45,080 --> 00:04:49,640 Dan ELIZA dirancang untuk meniru jenis interaksi 89 00:04:49,640 --> 00:04:53,850 Anda akan memiliki dengan Psikoterapis Rogerian. 90 00:04:53,850 --> 00:04:57,210 Sekarang, Rogerians, mereka memiliki sebuah ide yang psikoterapi 91 00:04:57,210 --> 00:05:02,800 terlibat mampu mencerminkan kembali untuk pasien dan berbicara dengan mereka, 92 00:05:02,800 --> 00:05:08,100 pada dasarnya, dengan hanya memberikan mereka sedikit kecil dari terapis. 93 00:05:08,100 --> 00:05:09,920 Artinya, segala sesuatu bahwa terapis mengatakan 94 00:05:09,920 --> 00:05:16,500 seharusnya hanya refleksi dari apa pasien menceritakan kepada mereka. 95 00:05:16,500 --> 00:05:18,990 >> Jadi mari kita coba dan demo ini. 96 00:05:18,990 --> 00:05:22,820 Apakah kita memiliki relawan yang akan bersedia untuk berbagi terdalam mereka, 97 00:05:22,820 --> 00:05:26,650 tergelap, dan / atau rahasia palsu dengan ELIZA? 98 00:05:26,650 --> 00:05:29,680 Tentu, kenapa tidak Anda datang ke atas. 99 00:05:29,680 --> 00:05:30,847 Fantastis. 100 00:05:30,847 --> 00:05:31,430 Dan namamu? 101 00:05:31,430 --> 00:05:32,000 >> MILES: Miles. 102 00:05:32,000 --> 00:05:33,041 >> BRIAN SCASSELLATI: Miles. 103 00:05:33,041 --> 00:05:34,270 Senang bertemu Anda, Miles. 104 00:05:34,270 --> 00:05:36,270 Jika Anda akan memegang itu. 105 00:05:36,270 --> 00:05:40,840 Dan kita akan menggunakan versi ELIZA 106 00:05:40,840 --> 00:05:44,640 bahwa kita telah direplikasi dalam IDE CS50. 107 00:05:44,640 --> 00:05:47,140 Dan kita akan melihat sumber kode untuk ini dalam beberapa saat. 108 00:05:47,140 --> 00:05:49,910 Tapi untuk sekarang, kami hanya akan memanggil dengan mengetik eliza. 109 00:05:49,910 --> 00:05:55,480 >> Dan ELIZA akan memberikan tanggapan yang akan berada di semua ibukota. 110 00:05:55,480 --> 00:05:57,950 Dan akan mengajukan beberapa pertanyaan. 111 00:05:57,950 --> 00:06:02,130 Dan kami akan merespon dan ketik di tanggapan ELIZA. 112 00:06:02,130 --> 00:06:04,310 Jadi ELIZA mengatakan, "Hai, saya ELIZA. 113 00:06:04,310 --> 00:06:05,462 Apa masalah Anda?" 114 00:06:05,462 --> 00:06:08,092 Apa yang ingin Anda memberitahu ELIZA tentang hari ini? 115 00:06:08,092 --> 00:06:10,750 >> MILES: Saya hanya bisa tertidur jika saya memiliki sandal kelinci di. 116 00:06:10,750 --> 00:06:12,440 >> BRIAN SCASSELLATI: Baiklah. 117 00:06:12,440 --> 00:06:13,360 Baiklah. 118 00:06:13,360 --> 00:06:15,300 >> [TAWA] 119 00:06:15,300 --> 00:06:22,410 >> "Saya hanya bisa tertidur dengan sandal kelinci di. " 120 00:06:22,410 --> 00:06:29,000 Dan ELIZA mengatakan, "Katakanlah, apakah Anda memiliki masalah psikologis? 121 00:06:29,000 --> 00:06:30,450 Mungkin ini adalah indikator yang baik. " 122 00:06:30,450 --> 00:06:30,780 >> OKE. 123 00:06:30,780 --> 00:06:32,245 Jadi apa yang Anda ingin menanggapi? 124 00:06:32,245 --> 00:06:36,110 125 00:06:36,110 --> 00:06:36,970 >> MILES: Ya. 126 00:06:36,970 --> 00:06:38,660 >> BRIAN SCASSELLATI: Ya. 127 00:06:38,660 --> 00:06:39,570 Man of banyak kata. 128 00:06:39,570 --> 00:06:41,870 Saya menikmati itu. 129 00:06:41,870 --> 00:06:50,200 Eliza mengatakan, "Anda tampaknya cukup positif." 130 00:06:50,200 --> 00:06:53,200 >> MILES: Tidak, saya, pada kenyataannya, sebuah elektron. 131 00:06:53,200 --> 00:06:55,150 >> BRIAN SCASSELLATI: "Tidak. 132 00:06:55,150 --> 00:07:02,240 Bahkan, saya elektron. " "Apakah kau datang padaku 133 00:07:02,240 --> 00:07:06,954 karena Anda elektron? " 134 00:07:06,954 --> 00:07:08,870 Sekarang, kita bisa melihat beberapa yang things-- aku akan 135 00:07:08,870 --> 00:07:10,200 untuk menghentikan sementara Anda sesaat, Miles. 136 00:07:10,200 --> 00:07:11,010 Jangan pergi ke mana pun. 137 00:07:11,010 --> 00:07:12,650 Kami tidak dilakukan dengan Anda belum. 138 00:07:12,650 --> 00:07:16,490 ELIZA adalah, dalam beberapa hal, menanggapi hal-hal tertentu 139 00:07:16,490 --> 00:07:21,140 bahwa dia mengatakan tetapi tanpa pemahaman yang benar. 140 00:07:21,140 --> 00:07:26,090 Dan itu juga menirukan kembali beberapa bagian dari hukumannya. 141 00:07:26,090 --> 00:07:27,310 >> Jadi kita berkata, "Tidak 142 00:07:27,310 --> 00:07:29,090 Bahkan, saya elektron. " 143 00:07:29,090 --> 00:07:34,190 Eliza menjawab kembali, "Apakah kau datang untuk saya karena Anda adalah elektron? " 144 00:07:34,190 --> 00:07:34,690 Baiklah. 145 00:07:34,690 --> 00:07:36,050 Mari kita memberikan satu lebih respon sini. 146 00:07:36,050 --> 00:07:37,140 Memberikan yang baik, Miles. 147 00:07:37,140 --> 00:07:37,806 >> MILES: Baik satu? 148 00:07:37,806 --> 00:07:48,400 149 00:07:48,400 --> 00:07:49,570 >> Ya, tolong bantu saya. 150 00:07:49,570 --> 00:07:50,570 BRIAN SCASSELLATI: "Ya. 151 00:07:50,570 --> 00:07:58,010 Tolong bantu saya. "" Apakah Anda yakin? " 152 00:07:58,010 --> 00:07:58,510 MILES: No. 153 00:07:58,510 --> 00:08:00,860 BRIAN SCASSELLATI: No. 154 00:08:00,860 --> 00:08:03,562 "Apa yang menyarankan untuk Anda?" 155 00:08:03,562 --> 00:08:06,760 >> MILES: Saya mungkin tidak menjadi elektron. 156 00:08:06,760 --> 00:08:11,170 >> BRIAN SCASSELLATI: "Aku mungkin tidak menjadi elektron. " 157 00:08:11,170 --> 00:08:13,790 "Apakah Anda mengatakan tidak hanya menjadi negatif?" 158 00:08:13,790 --> 00:08:14,390 >> Baiklah. 159 00:08:14,390 --> 00:08:16,030 Jadi Miles, terima kasih banyak. 160 00:08:16,030 --> 00:08:16,860 >> MILES: Terima kasih. 161 00:08:16,860 --> 00:08:18,360 >> BRIAN SCASSELLATI: Terima kasih banyak. 162 00:08:18,360 --> 00:08:20,230 [TEPUK TANGAN] 163 00:08:20,230 --> 00:08:21,230 164 00:08:21,230 --> 00:08:26,700 >> Sehingga program ELIZA ini, dalam banyak hal, merespons hanya untuk potongan 165 00:08:26,700 --> 00:08:32,730 bahwa kita memberikan tanpa mendalam pemahaman tentang apa yang terjadi di sini. 166 00:08:32,730 --> 00:08:36,640 Ini adalah jenis sistem disebut pencocokan pola, di mana 167 00:08:36,640 --> 00:08:40,490 kita cari tertentu bit teks yang kita kemudian 168 00:08:40,490 --> 00:08:44,860 akan mengambil dari apa diberikan sebagai masukan, 169 00:08:44,860 --> 00:08:52,580 mengubahnya, berpotensi, dalam beberapa cara, dan kemudian memberikannya kembali ke pengguna. 170 00:08:52,580 --> 00:08:55,150 >> Apakah ada di antara kalian berpikir yang ELIZA sebenarnya 171 00:08:55,150 --> 00:08:58,230 melakukan psikoanalisis valid di sini? 172 00:08:58,230 --> 00:08:59,250 Satu orang, mungkin. 173 00:08:59,250 --> 00:09:00,166 >> AUDIENCE: [tidak terdengar]. 174 00:09:00,166 --> 00:09:03,315 175 00:09:03,315 --> 00:09:05,440 BRIAN SCASSELLATI: Dan bagaimana apakah itu membuat Anda merasa? 176 00:09:05,440 --> 00:09:06,530 Ya, pada kenyataannya, itu tidak. 177 00:09:06,530 --> 00:09:10,890 Dan kita akan lihat, sebenarnya, kode sumber untuk itu hanya dalam beberapa saat. 178 00:09:10,890 --> 00:09:13,580 Dan sehingga Anda akan menjadi mampu melakukan hal ini. 179 00:09:13,580 --> 00:09:17,420 >> Sekarang, ELIZA merupakan salah satu bentuk apa kita sebut hari ini chat bot. 180 00:09:17,420 --> 00:09:19,950 Itu hanya pergi melalui teks yang Anda menyediakan, 181 00:09:19,950 --> 00:09:24,030 memberikan jumlah minimal pemahaman atau pengolahan, 182 00:09:24,030 --> 00:09:26,790 dan kemudian beo kembali kepada Anda. 183 00:09:26,790 --> 00:09:31,830 Jadi mari kita lihat, konseptual, dan berbicara tentang apa 184 00:09:31,830 --> 00:09:34,690 itu adalah bahwa ELIZA benar-benar melakukan. 185 00:09:34,690 --> 00:09:42,000 >> ELIZA adalah mengambil let sentence-- ini mengatakan, "Saya ingin mengesankan bos saya." 186 00:09:42,000 --> 00:09:45,130 Dan ELIZA mencari melalui kalimat yang 187 00:09:45,130 --> 00:09:48,730 dan mencoba untuk menemukan dan sesuai pola-pola tertentu. 188 00:09:48,730 --> 00:09:52,850 Jadi, misalnya, salah satu pola yang ELIZA mencari kata-kata 189 00:09:52,850 --> 00:09:55,110 "Saya ingin." 190 00:09:55,110 --> 00:09:59,330 Dan setiap saat ia melihat sesuatu yang memiliki "Saya ingin" di dalamnya, 191 00:09:59,330 --> 00:10:01,770 itu merumuskan tanggapan. 192 00:10:01,770 --> 00:10:05,040 Dan respon yang adalah string tetap. 193 00:10:05,040 --> 00:10:07,915 Dalam hal ini, itu "kenapa kau inginkan?" 194 00:10:07,915 --> 00:10:11,330 Dan saya menaruh bintang kecil di akhir karena itu hanya 195 00:10:11,330 --> 00:10:13,310 awal respon kita. 196 00:10:13,310 --> 00:10:16,310 Dan bintang menunjukkan bahwa kita akan mengambil sisanya 197 00:10:16,310 --> 00:10:19,850 dari utterance-- pengguna "untuk mengesankan bos saya" - 198 00:10:19,850 --> 00:10:24,500 dan kita akan menambahkan bahwa ke akhir string ini. 199 00:10:24,500 --> 00:10:28,990 >> Jadi sekarang, daripada mengatakan, "mengapa Anda ingin mengesankan bos saya, " 200 00:10:28,990 --> 00:10:31,800 ada sedikit tambahan pengolahan yang akan kita lakukan. 201 00:10:31,800 --> 00:10:34,440 Artinya, kita harus mengkonversi beberapa kata ganti 202 00:10:34,440 --> 00:10:38,670 sini dari "bos saya" untuk "bos Anda." 203 00:10:38,670 --> 00:10:41,300 Dan mungkin ada beberapa lainnya perubahan yang kita butuhkan untuk membuat. 204 00:10:41,300 --> 00:10:44,990 Jadi bukan hanya menempel langsung ke akhirnya, apa yang akan kita lakukan 205 00:10:44,990 --> 00:10:49,160 adalah kita akan mengambil sisa utterance-- pengguna di sini-putih 206 00:10:49,160 --> 00:10:54,090 dan kami akan mengambilnya satu per satu waktu dan mengkonversi setiap string 207 00:10:54,090 --> 00:10:58,180 Token, setiap kata, dalam kalimat. 208 00:10:58,180 --> 00:10:59,580 >> Jadi kita akan mengambil kata "untuk." 209 00:10:59,580 --> 00:11:01,650 Tidak ada konversi yang perlu kita lakukan itu. 210 00:11:01,650 --> 00:11:02,340 "Mengesankan." 211 00:11:02,340 --> 00:11:04,140 Tidak ada konversi yang perlu kita lakukan di sana. 212 00:11:04,140 --> 00:11:06,670 "Saya" akan dikonversi ke "Anda." 213 00:11:06,670 --> 00:11:10,070 Dan "bos" kita akan hanya meninggalkan sebagai "bos." 214 00:11:10,070 --> 00:11:12,740 Dan akhirnya, apa pun yang berakhir dengan periode, 215 00:11:12,740 --> 00:11:16,640 kita akan mengubahnya menjadi sebuah pertanyaan. 216 00:11:16,640 --> 00:11:22,600 >> Pencocokan ini pola yang sangat sederhana sebenarnya cukup sukses. 217 00:11:22,600 --> 00:11:27,260 Dan ketika ini diperkenalkan di 1966-- Joseph Weizenbaum 218 00:11:27,260 --> 00:11:28,986 diprogram ini pada komputer. 219 00:11:28,986 --> 00:11:31,110 Sekarang, komputer pada waktu itu tidak model desktop. 220 00:11:31,110 --> 00:11:33,950 Mereka sumber daya bersama. 221 00:11:33,950 --> 00:11:39,090 Dan murid-muridnya akan pergi dan chatting dengan ELIZA. 222 00:11:39,090 --> 00:11:41,570 Akhirnya, ia harus membatasi akses ke sana 223 00:11:41,570 --> 00:11:43,890 karena murid-muridnya tidak mendapatkan pekerjaan yang dilakukan. 224 00:11:43,890 --> 00:11:46,190 Mereka hanya mengobrol dengan ELIZA. 225 00:11:46,190 --> 00:11:48,850 Dan, pada kenyataannya, ia harus api asistennya, yang 226 00:11:48,850 --> 00:11:55,840 menghabiskan semua waktunya berbicara dengan ELIZA tentang masalah yang mendalam dan mengkhawatirkan. 227 00:11:55,840 --> 00:12:00,350 >> Setiap orang yang menggunakan sistem ini mulai anthropomorphize mereka. 228 00:12:00,350 --> 00:12:04,490 Mereka mulai menganggap mereka sebagai menjadi bernyawa dan orang-orang yang nyata. 229 00:12:04,490 --> 00:12:07,969 Mereka mulai mengenali beberapa hal-hal yang mereka katakan 230 00:12:07,969 --> 00:12:09,010 datang kembali kepada mereka. 231 00:12:09,010 --> 00:12:12,120 Dan mereka mencari tahu hal tentang diri mereka sendiri. 232 00:12:12,120 --> 00:12:17,290 Dan, pada kenyataannya, bahkan para ahli, bahkan psikoterapis, 233 00:12:17,290 --> 00:12:22,930 mulai khawatir bahwa, pada kenyataannya, mungkin ELIZA akan menggantikan mereka. 234 00:12:22,930 --> 00:12:25,640 Dan bahkan komputer ilmuwan khawatir bahwa kami 235 00:12:25,640 --> 00:12:30,040 begitu dekat dengan pemecahan bahasa alami. 236 00:12:30,040 --> 00:12:33,520 >> Sekarang, itu tidak berada dekat dengan benar. 237 00:12:33,520 --> 00:12:37,280 Tapi itulah cara mengesankan sistem ini bisa. 238 00:12:37,280 --> 00:12:40,080 Jadi mari kita mulai melihat bawah dan mencoba 239 00:12:40,080 --> 00:12:46,190 untuk mendapatkan sedikit pertanyaan dari mana kode ini benar-benar terjadi. 240 00:12:46,190 --> 00:12:48,170 Jadi kita akan membuat kode ini tersedia setelah itu. 241 00:12:48,170 --> 00:12:50,880 Dan ini adalah sangat pelabuhan sederhana dan langsung 242 00:12:50,880 --> 00:12:53,240 pelaksanaan asli ELIZA. 243 00:12:53,240 --> 00:12:56,350 >> Jadi beberapa dari gaya hal-hal yang akan Anda lihat di sini 244 00:12:56,350 --> 00:12:59,360 tidak Gaya apa kami ingin Anda lakukan 245 00:12:59,360 --> 00:13:01,480 atau apa yang kita telah mengajar Anda lakukan. 246 00:13:01,480 --> 00:13:04,770 Tapi kami sudah mencoba untuk menjaga mereka sama di banyak port 247 00:13:04,770 --> 00:13:08,087 bahwa ini telah sehingga memiliki rasa aslinya. 248 00:13:08,087 --> 00:13:09,920 Jadi kita akan mencakup banyak hal, 249 00:13:09,920 --> 00:13:12,920 dan kemudian kita akan memiliki set kata kunci, hal 250 00:13:12,920 --> 00:13:16,460 yang ELIZA akan mengenali dan menanggapi secara langsung. 251 00:13:16,460 --> 00:13:20,780 Jadi jika Anda memiliki kata-kata seperti "Anda bisa" atau "Saya tidak" atau "tidak" 252 00:13:20,780 --> 00:13:24,680 atau "ya" atau "mimpi" atau "halo," kemudian ELIZA 253 00:13:24,680 --> 00:13:27,920 akan merespon selektif untuk mereka. 254 00:13:27,920 --> 00:13:30,010 Kami juga akan memiliki sejumlah hal 255 00:13:30,010 --> 00:13:34,940 bahwa kita akan bertukar, seperti mengkonversi "saya" untuk "Anda." 256 00:13:34,940 --> 00:13:39,920 >> Dan kemudian kita akan memiliki satu set tanggapan bahwa untuk setiap kata kunci tersebut, 257 00:13:39,920 --> 00:13:42,580 kami akan memutar melalui ini respon yang berbeda. 258 00:13:42,580 --> 00:13:45,350 Jadi jika saya mengatakan "ya" tiga kali berturut-turut, saya 259 00:13:45,350 --> 00:13:50,429 mungkin mendapatkan tiga berbeda tanggapan dari ELIZA. 260 00:13:50,429 --> 00:13:52,345 Kode kita, kemudian, adalah sebenarnya sangat sederhana. 261 00:13:52,345 --> 00:13:59,490 Jika saya gulir ke bawah melewati semua ini tanggapan yang telah kita diprogram dalam 262 00:13:59,490 --> 00:14:02,920 dan kami turun ke utama kami, kita akan menginisialisasi 263 00:14:02,920 --> 00:14:06,540 beberapa variabel yang berbeda dan melakukan sedikit rumah tangga 264 00:14:06,540 --> 00:14:08,480 pada awalnya. 265 00:14:08,480 --> 00:14:11,760 Tapi kemudian ada benar-benar set kode yang dapat Anda mengerti. 266 00:14:11,760 --> 00:14:15,820 Satu while besar yang bilang aku akan mengulangi ini berulang-ulang. 267 00:14:15,820 --> 00:14:20,420 Saya akan membaca di garis, dan aku akan menyimpan bahwa dalam string masukan. 268 00:14:20,420 --> 00:14:23,880 Aku akan memeriksa dan melihat apakah itu adalah kata kunci khusus "bye," yang 269 00:14:23,880 --> 00:14:26,199 berarti keluar dari program. 270 00:14:26,199 --> 00:14:29,240 Dan kemudian aku akan memeriksa dan melihat apakah seseorang hanya mengulang sendiri 271 00:14:29,240 --> 00:14:29,800 lagi dan lagi. 272 00:14:29,800 --> 00:14:31,174 Dan aku akan berteriak pada mereka jika mereka lakukan. 273 00:14:31,174 --> 00:14:34,820 Aku akan mengatakan "tidak mengulangi diri sendiri." 274 00:14:34,820 --> 00:14:40,500 >> Selama tidak satupun dari mereka terjadi, kita akan kemudian memindai melalui dan loop melalui, 275 00:14:40,500 --> 00:14:45,330 pada baris 308-313 di sini, dan memeriksa dan melihat 276 00:14:45,330 --> 00:14:49,090 adalah salah satu kata kunci yang frase yang terdapat pada input 277 00:14:49,090 --> 00:14:50,620 bahwa saya hanya diberikan? 278 00:14:50,620 --> 00:14:54,845 Jika ada yang cocok bagi mereka, baik kemudian, saya akan ingat lokasi tersebut. 279 00:14:54,845 --> 00:14:57,050 Aku akan ingat kata kunci tersebut. 280 00:14:57,050 --> 00:14:58,620 Dan aku akan mampu membangun respon. 281 00:14:58,620 --> 00:15:03,150 >> Jika saya tidak menemukan satu, baik itu, hal terakhir dalam array kata kunci saya 282 00:15:03,150 --> 00:15:08,070 akan tanggapan default saya, ketika tidak ada yang lain cocok. 283 00:15:08,070 --> 00:15:14,160 Saya akan mengajukan pertanyaan seperti "Mengapa Anda datang ke sini? "atau" Bagaimana saya bisa membantu Anda? " 284 00:15:14,160 --> 00:15:19,710 yang hanya sebagian yang tepat tidak peduli apa input. 285 00:15:19,710 --> 00:15:22,580 >> Kami kemudian akan membangun respon ELIZA ini. 286 00:15:22,580 --> 00:15:26,040 Kami akan dapat mengambil bahwa respon dasar, 287 00:15:26,040 --> 00:15:28,370 seperti yang kita lakukan dalam "bos saya" misalnya. 288 00:15:28,370 --> 00:15:30,970 289 00:15:30,970 --> 00:15:33,990 Jika itu yang ada is-- jika itu hanya satu 290 00:15:33,990 --> 00:15:36,860 string yang seharusnya saya respond-- Saya hanya dapat mengirim kembali keluar. 291 00:15:36,860 --> 00:15:40,610 Jika memiliki tanda bintang di akhir itu, maka aku akan 292 00:15:40,610 --> 00:15:45,710 memproses setiap token individu dalam sisa respon pengguna 293 00:15:45,710 --> 00:15:51,590 dan menambahkan mereka yang, menukar kata demi kata yang saya butuhkan untuk. 294 00:15:51,590 --> 00:15:56,100 >> Semua ini benar-benar sesuatu yang Anda bisa membangun. 295 00:15:56,100 --> 00:15:59,230 Dan pada kenyataannya, cara di mana kita memiliki diproses argumen baris perintah, 296 00:15:59,230 --> 00:16:03,570 cara di mana Anda memiliki diproses melalui permintaan HTTP 297 00:16:03,570 --> 00:16:05,510 mengikuti jenis yang sama dari aturan. 298 00:16:05,510 --> 00:16:08,220 Mereka pencocokan pola. 299 00:16:08,220 --> 00:16:15,170 >> Jadi ELIZA memiliki relatif penting berdampak pada bahasa alami 300 00:16:15,170 --> 00:16:21,620 karena membuatnya tampak seperti itu adalah tujuan yang sangat dicapai, seperti entah bagaimana kami akan 301 00:16:21,620 --> 00:16:25,550 dapat memecahkan masalah ini secara langsung. 302 00:16:25,550 --> 00:16:30,670 Sekarang, yang bukan untuk mengatakan bahwa ELIZA tidak segala sesuatu yang kita ingin lakukan. 303 00:16:30,670 --> 00:16:33,710 Tentu tidak. 304 00:16:33,710 --> 00:16:35,660 Tapi kita harus bisa untuk melakukan sesuatu yang lebih. 305 00:16:35,660 --> 00:16:38,280 306 00:16:38,280 --> 00:16:41,490 >> Langkah pertama kami untuk pergi luar ELIZA akan 307 00:16:41,490 --> 00:16:44,840 untuk dapat melihat tidak teks yang dimasukkan 308 00:16:44,840 --> 00:16:53,750 ke keyboard tetapi pidato, yang sebenarnya pidato direkam ke dalam mikrofon. 309 00:16:53,750 --> 00:16:56,880 Jadi seperti yang kita lihat ini bagian yang berbeda, kami 310 00:16:56,880 --> 00:17:00,304 akan harus membangun satu set model. 311 00:17:00,304 --> 00:17:02,970 Kita akan harus mampu untuk pergi dari akustik tingkat rendah 312 00:17:02,970 --> 00:17:07,180 lapangan information--, amplitudo, frequency-- 313 00:17:07,180 --> 00:17:09,530 dan mengkonversikan menjadi beberapa unit yang kami 314 00:17:09,530 --> 00:17:14,619 dapat lebih mudah memanipulasi dan, akhirnya, memanipulasi mereka 315 00:17:14,619 --> 00:17:18,609 dalam kata-kata dan kalimat. 316 00:17:18,609 --> 00:17:22,880 >> Jadi paling pengenalan suara sistem yang di luar sana hari ini 317 00:17:22,880 --> 00:17:26,069 mengikuti statistik model di mana kita membangun 318 00:17:26,069 --> 00:17:35,090 tiga representasi terpisah dari apa yang bahwa sinyal audio sebenarnya mengandung. 319 00:17:35,090 --> 00:17:38,640 Kita mulai dengan model fonetik yang berbicara tentang hanya dasar 320 00:17:38,640 --> 00:17:41,250 terdengar bahwa aku memproduksi. 321 00:17:41,250 --> 00:17:46,900 Saya memproduksi sesuatu yang a seperti pada anak laki-laki atau D seperti pada anjing? 322 00:17:46,900 --> 00:17:53,220 Bagaimana cara mengenali dua yang berbeda ponsel sebagai terpisah dan berbeda? 323 00:17:53,220 --> 00:17:56,600 >> Di atas semua itu, kita kemudian akan membangun model pengucapan kata, 324 00:17:56,600 --> 00:18:01,350 sesuatu yang menghubungkan bersama-sama mereka ponsel individu 325 00:18:01,350 --> 00:18:04,724 dan menggabungkan mereka ke dalam sebuah kata. 326 00:18:04,724 --> 00:18:07,890 Dan setelah itu, kami akan mengambil kata-kata dan kami akan mengumpulkan mereka dengan bahasa 327 00:18:07,890 --> 00:18:13,010 memodelkan menjadi kalimat lengkap. 328 00:18:13,010 --> 00:18:17,230 >> Sekarang, kita akan berbicara tentang setiap ini secara independen dan terpisah. 329 00:18:17,230 --> 00:18:21,580 Tapi tiga model ini semua hanya akan menjadi statistik. 330 00:18:21,580 --> 00:18:23,502 Dan itu berarti ketika kita bekerja dengan mereka, kita akan 331 00:18:23,502 --> 00:18:25,376 dapat bekerja dengan mereka semua secara bersamaan. 332 00:18:25,376 --> 00:18:28,100 333 00:18:28,100 --> 00:18:28,600 Baiklah. 334 00:18:28,600 --> 00:18:30,890 Mari kita mulai dengan model yang fonetik kami. 335 00:18:30,890 --> 00:18:34,470 Jadi model fonetik mengandalkan teknik komputasi 336 00:18:34,470 --> 00:18:37,320 disebut model Markov tersembunyi. 337 00:18:37,320 --> 00:18:43,050 Ini adalah model grafis di mana saya memiliki dan mengakui negara dunia 338 00:18:43,050 --> 00:18:46,500 sebagai yang ditandai oleh satu set fitur. 339 00:18:46,500 --> 00:18:51,960 Dan negara yang menggambarkan salah satu bagian dari suatu tindakan yang saya terlibat dalam. 340 00:18:51,960 --> 00:19:00,190 >> Jadi jika saya berpikir tentang membuat suara "ma" seperti ibu, 341 00:19:00,190 --> 00:19:03,970 ada yang berbeda komponen untuk suara. 342 00:19:03,970 --> 00:19:07,230 Ada bagian di mana aku menarik napas. 343 00:19:07,230 --> 00:19:09,560 Dan kemudian saya mengerutkan bibir. 344 00:19:09,560 --> 00:19:13,710 Dan Aku memutar bibirku kembali sedikit bit untuk membuat "ma" suara. 345 00:19:13,710 --> 00:19:15,340 Dan kemudian ada sebuah rilis. 346 00:19:15,340 --> 00:19:17,020 Bibirku datang terpisah. 347 00:19:17,020 --> 00:19:19,030 Air dikeluarkan. 348 00:19:19,030 --> 00:19:22,650 "Ma." 349 00:19:22,650 --> 00:19:29,250 >> Ketiga bagian yang berbeda akan diwakili oleh negara-negara di graph-- ini 350 00:19:29,250 --> 00:19:33,420 timbulnya, tengah, dan akhir. 351 00:19:33,420 --> 00:19:38,060 Dan saya akan memiliki transisi yang memungkinkan saya untuk melakukan perjalanan dari satu negara 352 00:19:38,060 --> 00:19:42,260 ke depan dengan probabilitas tertentu. 353 00:19:42,260 --> 00:19:47,250 Jadi, misalnya, bahwa M terdengar mungkin memiliki sangat, 354 00:19:47,250 --> 00:19:51,850 asupan yang sangat singkat di beginning-- yang "mm" - dan kemudian lagi, 355 00:19:51,850 --> 00:19:55,640 fase getaran di mana aku memegang saya bibir bersama-sama dan hampir humming-- 356 00:19:55,640 --> 00:20:05,090 "mmmm" - dan kemudian sangat singkat plosif mana saya mengusir breath-- "ma." 357 00:20:05,090 --> 00:20:09,370 >> Model Markov tersembunyi adalah dirancang untuk menangkap fakta 358 00:20:09,370 --> 00:20:13,340 bahwa cara yang saya buat suara "ma" akan 359 00:20:13,340 --> 00:20:17,350 menjadi sedikit berbeda di waktu, adalah frekuensi, 360 00:20:17,350 --> 00:20:21,030 dan fitur-fiturnya dari cara yang Anda membuatnya 361 00:20:21,030 --> 00:20:23,300 atau cara yang saya mungkin membuatnya ketika saya sedang berbicara 362 00:20:23,300 --> 00:20:26,030 tentang perbedaan penggunaan surat itu. 363 00:20:26,030 --> 00:20:33,240 "Ibu" dan "mungkin saya" akan terdengar sedikit berbeda. 364 00:20:33,240 --> 00:20:36,800 >> Jadi untuk mengenali suara tertentu, kita akan 365 00:20:36,800 --> 00:20:42,020 membangun model Markov, ini tersembunyi Markov model, setiap telepon mungkin bahwa saya 366 00:20:42,020 --> 00:20:45,840 mungkin ingin mengenali, setiap suara yang mungkin, 367 00:20:45,840 --> 00:20:49,750 dan kemudian melihat Data akustik yang saya miliki 368 00:20:49,750 --> 00:20:54,430 dan menentukan statistik yang satu adalah yang paling mungkin 369 00:20:54,430 --> 00:20:58,110 telah menghasilkan suara ini. 370 00:20:58,110 --> 00:20:58,610 OKE. 371 00:20:58,610 --> 00:21:01,540 372 00:21:01,540 --> 00:21:06,750 Dengan model yang, kita kemudian mulai membangun di atasnya. 373 00:21:06,750 --> 00:21:09,330 Kami mengambil model pengucapan. 374 00:21:09,330 --> 00:21:11,790 Sekarang, kadang-kadang pengucapan model sederhana dan mudah 375 00:21:11,790 --> 00:21:14,440 karena hanya ada satu cara untuk mengucapkan sesuatu. 376 00:21:14,440 --> 00:21:17,990 Kali lain, mereka yang sedikit lebih rumit. 377 00:21:17,990 --> 00:21:21,340 Berikut adalah panduan pengucapan untuk itu hal merah yang 378 00:21:21,340 --> 00:21:25,210 buah yang Anda buat kecap dari. 379 00:21:25,210 --> 00:21:27,360 Orang tidak berpikir itu buah. 380 00:21:27,360 --> 00:21:27,860 Kanan? 381 00:21:27,860 --> 00:21:30,880 382 00:21:30,880 --> 00:21:35,300 >> Sekarang, ada banyak cara yang berbeda bahwa orang akan mengucapkan kata ini. 383 00:21:35,300 --> 00:21:37,780 Beberapa akan mengatakan "toe-Mei-toe." 384 00:21:37,780 --> 00:21:40,880 Beberapa akan mengatakan "toe-mah-toe." 385 00:21:40,880 --> 00:21:44,800 Dan kita bisa menangkap bahwa dengan salah satu model ini grafis 386 00:21:44,800 --> 00:21:48,305 di mana, lagi, kami mewakili transisi sebagai memiliki probabilitas tertentu 387 00:21:48,305 --> 00:21:51,360 dan terkait probabilitas dengan mereka. 388 00:21:51,360 --> 00:21:58,290 >> Jadi dalam hal ini, jika saya mengikuti rute atas melalui seluruh grafik ini, 389 00:21:58,290 --> 00:22:03,330 Saya akan mulai dari huruf di paling kiri, yang "ta" suara. 390 00:22:03,330 --> 00:22:07,570 Saya akan mengambil bagian atas, yang "oh," dan kemudian "ma," 391 00:22:07,570 --> 00:22:14,530 dan kemudian "a," dan kemudian "ta," dan "oh." "Toe-may-toe." 392 00:22:14,530 --> 00:22:19,610 Jika saya mengambil jalan bawah melalui ini, saya akan mendapatkan "ta-mah-toe." 393 00:22:19,610 --> 00:22:26,810 Dan jika saya turun dan kemudian up, saya akan mendapatkan "ta-may-toe." 394 00:22:26,810 --> 00:22:29,950 >> Model ini menangkap ini perbedaan karena setiap kali 395 00:22:29,950 --> 00:22:32,410 kami menyebarkan salah satu dari ini sistem pengenalan, 396 00:22:32,410 --> 00:22:35,340 itu akan harus bekerja dengan banyak berbagai jenis orang, 397 00:22:35,340 --> 00:22:39,295 banyak aksen yang berbeda, dan bahkan perbedaan penggunaan kata-kata yang sama. 398 00:22:39,295 --> 00:22:42,204 399 00:22:42,204 --> 00:22:44,120 Akhirnya, di atas itu, kita akan membangun sesuatu 400 00:22:44,120 --> 00:22:48,780 yang terlihat benar-benar rumit, disebut model bahasa, 401 00:22:48,780 --> 00:22:52,950 tetapi sebenarnya adalah yang paling sederhana tiga karena ini beroperasi 402 00:22:52,950 --> 00:22:56,041 pada apa yang disebut model n-gram. 403 00:22:56,041 --> 00:23:02,270 Dan dalam hal ini, saya menunjukkan Anda model n-gram dua bagian, bigram a. 404 00:23:02,270 --> 00:23:08,910 Kita akan membuat fisik ide bahwa kadang-kadang, kata-kata tertentu yang 405 00:23:08,910 --> 00:23:14,680 lebih mungkin untuk mengikuti diberikan kata daripada yang lain. 406 00:23:14,680 --> 00:23:25,210 Jika saya hanya berkata "cuaca," kata berikutnya mungkin bisa menjadi "hari ini" 407 00:23:25,210 --> 00:23:31,510 atau bisa menjadi "cuaca diperkirakan besok. " 408 00:23:31,510 --> 00:23:38,870 Tapi itu tidak mungkin menjadi " cuaca artichoke. " 409 00:23:38,870 --> 00:23:42,980 >> Apa model bahasa yang dilakukan adalah menangkap mereka secara statistik 410 00:23:42,980 --> 00:23:47,450 dengan menghitung, dari beberapa yang sangat besar corpus, semua contoh 411 00:23:47,450 --> 00:23:50,890 di mana satu kata berikut lain. 412 00:23:50,890 --> 00:23:54,300 Jadi jika saya mengambil corpus-- besar seperti setiap Wall Street Journal 413 00:23:54,300 --> 00:24:00,750 yang telah diproduksi sejak tahun 1930, yang merupakan salah satu corpuses-- standar 414 00:24:00,750 --> 00:24:03,910 dan saya melihat melalui semua teks itu, dan saya menghitung 415 00:24:03,910 --> 00:24:09,770 up berapa kali setelah "perkiraan" saya melihat "hari ini" 416 00:24:09,770 --> 00:24:17,454 dan berapa kali saya melihat "perkiraan" diikuti dengan "artichoke," 417 00:24:17,454 --> 00:24:19,370 yang pertama akan menjadi jauh lebih mungkin. 418 00:24:19,370 --> 00:24:21,540 Ini akan muncul jauh lebih sering. 419 00:24:21,540 --> 00:24:24,610 Dan sehingga akan memiliki lebih tinggi probabilitas yang terkait dengan itu. 420 00:24:24,610 --> 00:24:27,340 >> Jika saya ingin mengetahui probabilitas seluruh ucapan, 421 00:24:27,340 --> 00:24:29,940 kemudian, saya hanya istirahat itu. 422 00:24:29,940 --> 00:24:35,990 Jadi probabilitas pendengaran kalimat "tikus makan keju" 423 00:24:35,990 --> 00:24:39,110 adalah probabilitas kata "yang" mulai kalimat, 424 00:24:39,110 --> 00:24:42,540 dan kemudian probabilitas bahwa Kata "tikus" berikut kata "itu," 425 00:24:42,540 --> 00:24:44,910 dan probabilitas bahwa Kata "makan" berikut "tikus," 426 00:24:44,910 --> 00:24:51,120 dan probabilitas bahwa "keju" berikut "makan." 427 00:24:51,120 --> 00:24:55,160 >> Ini terdengar seperti banyak statistik, banyak probabilitas. 428 00:24:55,160 --> 00:24:57,510 Dan itulah yang itu. 429 00:24:57,510 --> 00:25:02,920 Tapi hal yang menakjubkan adalah jika Anda melakukan hal ini dengan sampel yang cukup besar data, 430 00:25:02,920 --> 00:25:03,670 berhasil. 431 00:25:03,670 --> 00:25:05,250 Dan bekerja sangat baik. 432 00:25:05,250 --> 00:25:07,810 433 00:25:07,810 --> 00:25:11,420 Kita semua tahu teknologi ini. 434 00:25:11,420 --> 00:25:16,500 Sebagian besar sistem operasi datang dengan pengenalan suara pada saat ini. 435 00:25:16,500 --> 00:25:20,940 Kami menggunakan Siri dan Cortana dan Echo. 436 00:25:20,940 --> 00:25:25,070 Dan hal-hal ini didasarkan pada jenis tiga lapis model-- 437 00:25:25,070 --> 00:25:30,620 model fonetik di bagian bawah, sebuah Model pengucapan di tengah, 438 00:25:30,620 --> 00:25:33,690 dan model bahasa di atas mereka. 439 00:25:33,690 --> 00:25:37,630 >> Sekarang, mereka harus melakukan sedikit lebih Selain itu dalam rangka untuk menjawab pertanyaan. 440 00:25:37,630 --> 00:25:43,000 Tapi pengakuan apa yang Anda pepatah tergantung persis pada itu. 441 00:25:43,000 --> 00:25:45,700 Jadi mari kita mengambil contoh di sini. 442 00:25:45,700 --> 00:25:52,020 Jadi saya memiliki telepon saya duduk di sini di bawah kamera dokumen. 443 00:25:52,020 --> 00:25:56,110 Dan kita akan meminta Siri beberapa pertanyaan. 444 00:25:56,110 --> 00:25:57,150 Baiklah? 445 00:25:57,150 --> 00:25:59,940 >> Jadi mari kita bangun telepon saya di sini. 446 00:25:59,940 --> 00:26:02,710 447 00:26:02,710 --> 00:26:05,000 Siri, apa cuaca seperti di New Haven hari ini? 448 00:26:05,000 --> 00:26:07,670 449 00:26:07,670 --> 00:26:10,780 >> SIRI: Berikut cuaca untuk New Haven, Connecticut hari ini. 450 00:26:10,780 --> 00:26:11,890 >> BRIAN SCASSELLATI: OK. 451 00:26:11,890 --> 00:26:16,720 Jadi pertama Anda melihat bahwa Siri diakui setiap kata-kata individu 452 00:26:16,720 --> 00:26:19,050 dan kemudian menghasilkan tanggapan. 453 00:26:19,050 --> 00:26:22,277 Kami akan berbicara tentang bagaimana respon yang datang sekitar dalam sedikit. 454 00:26:22,277 --> 00:26:24,110 Tapi sekarang kita tahu bahwa ini hanya berdasarkan 455 00:26:24,110 --> 00:26:28,880 pada statistik mentah dan ini Jenis pencocokan pola pendekatan, 456 00:26:28,880 --> 00:26:31,120 kita bisa memainkan beberapa game dengan Siri. 457 00:26:31,120 --> 00:26:34,560 >> Sehingga saya bisa mencoba lagi. 458 00:26:34,560 --> 00:26:38,864 Siri, apa cuaca kuda nil New Haven, hari ini? 459 00:26:38,864 --> 00:26:39,810 >> SIRI: OK. 460 00:26:39,810 --> 00:26:44,245 Berikut cuaca untuk New Haven, Connecticut untuk hari ini. 461 00:26:44,245 --> 00:26:46,120 BRIAN SCASSELLATI: Siri tidak gentar dengan yang 462 00:26:46,120 --> 00:26:50,980 karena itu ditemukan pattern-- yang "cuaca," "hari ini," "New Haven." 463 00:26:50,980 --> 00:26:54,420 Itulah yang itu menanggapi untuk, hanya ingin ELIZA. 464 00:26:54,420 --> 00:26:54,920 Baiklah. 465 00:26:54,920 --> 00:26:59,390 Mari kita memberikan satu lebih bahkan lebih contoh konyol. 466 00:26:59,390 --> 00:27:03,075 Siri, artichoke cuaca armadillo kuda nil New Haven? 467 00:27:03,075 --> 00:27:06,806 468 00:27:06,806 --> 00:27:08,400 >> SIRI: Biarkan aku memeriksa itu. 469 00:27:08,400 --> 00:27:11,280 Inilah yang saya temukan di web untuk apa yang artichoke armadillo 470 00:27:11,280 --> 00:27:13,780 kuda nil New Haven. 471 00:27:13,780 --> 00:27:14,760 >> BRIAN SCASSELLATI: OK. 472 00:27:14,760 --> 00:27:20,400 Jadi jika saya pergi cukup jauh jauh dari model ini, 473 00:27:20,400 --> 00:27:24,365 Aku bisa membingungkan karena itu tidak ada lagi sesuai dengan pola yang telah. 474 00:27:24,365 --> 00:27:27,370 475 00:27:27,370 --> 00:27:29,390 Dan bahwa statistik Mesin itu mengatakan, 476 00:27:29,390 --> 00:27:32,850 apa kemungkinan bahwa Anda punya kata-kata kuda nil dan artichoke 477 00:27:32,850 --> 00:27:34,440 bersama-sama, dan armadillo? 478 00:27:34,440 --> 00:27:36,050 Itu harus menjadi sesuatu yang baru. 479 00:27:36,050 --> 00:27:38,840 480 00:27:38,840 --> 00:27:40,610 >> Jadi teknologi ini kita gunakan setiap hari. 481 00:27:40,610 --> 00:27:43,670 482 00:27:43,670 --> 00:27:47,800 Jika kita ingin membawa mereka satu langkah lebih lanjut, meskipun, jika kita benar-benar 483 00:27:47,800 --> 00:27:53,930 ingin dapat berbicara tentang apa adalah bahwa sistem ini menanggapi, 484 00:27:53,930 --> 00:28:00,630 kita harus bicara, lagi, tentang set yang lebih mendasar dari pertanyaan. 485 00:28:00,630 --> 00:28:05,370 Dan itu topik dalam komunikasi yang kita sebut pertanyaan penjawab. 486 00:28:05,370 --> 00:28:07,028 Artinya, kita ingin dapat to-- ya? 487 00:28:07,028 --> 00:28:07,944 AUDIENCE: [tidak terdengar]. 488 00:28:07,944 --> 00:28:10,789 489 00:28:10,789 --> 00:28:13,330 BRIAN SCASSELLATI: Apakah kita mendapatkan dalam pengolahan semantik laten? 490 00:28:13,330 --> 00:28:14,070 Jadi iya. 491 00:28:14,070 --> 00:28:17,820 Ada banyak hal-hal yang terjadi di bawah permukaan dengan Siri 492 00:28:17,820 --> 00:28:20,210 dan di beberapa contoh Aku akan menunjukkan kepada Anda berikutnya 493 00:28:20,210 --> 00:28:22,610 di mana ada cukup sedikit dalam hal struktur 494 00:28:22,610 --> 00:28:25,260 dari apa yang Anda katakan itu penting. 495 00:28:25,260 --> 00:28:31,890 Dan, pada kenyataannya, itu adalah besar prekursor untuk slide berikutnya bagi saya. 496 00:28:31,890 --> 00:28:35,110 >> Jadi dengan cara yang sama yang kami pengenalan suara dibangun 497 00:28:35,110 --> 00:28:39,620 dari beberapa lapisan, jika kita ingin memahami apa yang sebenarnya 498 00:28:39,620 --> 00:28:44,620 dikatakan, kita akan lagi mengandalkan analisis multi-layer 499 00:28:44,620 --> 00:28:47,020 dari teks yang diakui. 500 00:28:47,020 --> 00:28:52,560 Jadi ketika Siri sebenarnya mampu mengatakan, melihat saya menemukan kata-kata ini. 501 00:28:52,560 --> 00:28:55,230 Sekarang apa yang harus saya lakukan dengan mereka? 502 00:28:55,230 --> 00:28:59,110 Komponen pertama adalah sering pergi melalui dan mencoba untuk menganalisis 503 00:28:59,110 --> 00:29:03,010 struktur kalimat. 504 00:29:03,010 --> 00:29:05,410 Dan dalam apa yang telah kita lihat di sekolah dasar, sering, 505 00:29:05,410 --> 00:29:08,920 sebagai semacam diagram kalimat, kita akan 506 00:29:08,920 --> 00:29:12,774 untuk mengakui bahwa tertentu kata memiliki peran tertentu. 507 00:29:12,774 --> 00:29:13,440 Ini adalah kata benda. 508 00:29:13,440 --> 00:29:14,231 Ini adalah kata ganti. 509 00:29:14,231 --> 00:29:16,200 Ini adalah kata kerja. 510 00:29:16,200 --> 00:29:19,460 Dan kita akan mengenali bahwa untuk tata bahasa tertentu, 511 00:29:19,460 --> 00:29:24,700 dalam hal ini bahasa Inggris tata bahasa, ada cara valid di mana saya dapat menggabungkan mereka 512 00:29:24,700 --> 00:29:26,280 dan cara-cara lain yang tidak valid. 513 00:29:26,280 --> 00:29:29,920 514 00:29:29,920 --> 00:29:33,870 >> Pengakuan bahwa, struktur itu, mungkin cukup untuk membantu membimbing kita 515 00:29:33,870 --> 00:29:36,720 sedikit. 516 00:29:36,720 --> 00:29:39,820 Tapi itu tidak cukup bagi kita untuk dapat memberikan 517 00:29:39,820 --> 00:29:43,290 makna untuk apa yang dikatakan di sini. 518 00:29:43,290 --> 00:29:46,615 Untuk melakukan itu, kita harus mengandalkan beberapa jumlah pengolahan semantik. 519 00:29:46,615 --> 00:29:49,590 520 00:29:49,590 --> 00:29:55,080 Artinya, kita akan harus melihat di bawah apa yang masing-masing kata-kata ini 521 00:29:55,080 --> 00:29:57,400 benar-benar membawa sebagai makna. 522 00:29:57,400 --> 00:30:01,150 Dan dengan cara yang paling sederhana untuk melakukan hal ini, kita akan mengasosiasikan dengan setiap kata 523 00:30:01,150 --> 00:30:06,930 yang kita tahu fungsi tertentu, transformasi tertentu yang 524 00:30:06,930 --> 00:30:09,300 memungkinkan terjadi. 525 00:30:09,300 --> 00:30:14,470 >> Dalam hal ini, kita mungkin label kata "John" sebagai nama yang tepat, 526 00:30:14,470 --> 00:30:18,160 bahwa itu disertai dengan identitas. 527 00:30:18,160 --> 00:30:21,530 Dan kita mungkin label "Mary" sebagai cara yang sama. 528 00:30:21,530 --> 00:30:27,900 Sedangkan kata kerja seperti "cinta," yang merupakan hubungan tertentu 529 00:30:27,900 --> 00:30:31,582 bahwa kami dapat mewakili. 530 00:30:31,582 --> 00:30:33,290 Sekarang, itu tidak berarti kita mengerti 531 00:30:33,290 --> 00:30:37,680 apa itu cinta tetapi hanya bahwa kita mengerti itu di jalan sistem simbolik. 532 00:30:37,680 --> 00:30:40,480 Artinya, kita dapat label dan memanipulasinya. 533 00:30:40,480 --> 00:30:44,230 534 00:30:44,230 --> 00:30:49,120 >> Dengan masing-masing jenis pendekatan, jenis pengolahan semantik 535 00:30:49,120 --> 00:30:57,060 di sini akan membutuhkan sedikit sedikit pengetahuan dan banyak pekerjaan 536 00:30:57,060 --> 00:30:59,020 pada bagian kami. 537 00:30:59,020 --> 00:31:03,590 Kita tidak lagi di alam di mana statistik sekadar 538 00:31:03,590 --> 00:31:07,320 akan menjadi cukup bagi kita. 539 00:31:07,320 --> 00:31:11,330 Sekarang, dalam rangka untuk pergi dari titik ini menjadi 540 00:31:11,330 --> 00:31:15,520 mampu berbicara tentang bagian dalam apa yang sebenarnya terjadi di sini, 541 00:31:15,520 --> 00:31:19,640 untuk dapat memanipulasi ini struktur dan memahami pertanyaan 542 00:31:19,640 --> 00:31:23,160 dan kemudian mampu untuk pergi keluar dan mencari, 543 00:31:23,160 --> 00:31:27,290 yang membutuhkan lebih Model kognitif yang kompleks. 544 00:31:27,290 --> 00:31:34,880 >> Cara di mana sistem ini dibangun adalah untuk sebagian besar sangat, sangat padat 545 00:31:34,880 --> 00:31:36,350 intensif. 546 00:31:36,350 --> 00:31:39,490 Mereka melibatkan manusia menghabiskan banyak 547 00:31:39,490 --> 00:31:44,100 waktu penataan cara yang jenis-kalimat 548 00:31:44,100 --> 00:31:47,270 dapat diwakili dalam beberapa logika. 549 00:31:47,270 --> 00:31:51,639 550 00:31:51,639 --> 00:31:53,430 Ia mendapat bahkan sedikit lebih kompleks, meskipun. 551 00:31:53,430 --> 00:31:56,400 552 00:31:56,400 --> 00:31:59,660 >> Bahkan setelah kami sudah berurusan dengan semantik, kita akan 553 00:31:59,660 --> 00:32:03,860 masih harus melihat pragmatik apa yang dikatakan. 554 00:32:03,860 --> 00:32:08,620 Artinya, bagaimana cara berhubungan dengan kata-kata bahwa saya harus sesuatu yang secara fisik keluar 555 00:32:08,620 --> 00:32:12,054 ada di dunia atau di setidaknya beberapa sumber informasi 556 00:32:12,054 --> 00:32:12,970 bahwa saya bisa memanipulasi? 557 00:32:12,970 --> 00:32:15,780 558 00:32:15,780 --> 00:32:20,790 >> Kadang-kadang, ini menyebabkan bit indah ambiguitas. 559 00:32:20,790 --> 00:32:24,470 "Red-hot bintang untuk menikah astronom." 560 00:32:24,470 --> 00:32:25,630 OKE. 561 00:32:25,630 --> 00:32:28,540 Sekarang, kita membaca bahwa sebagai Jenis lucu judul 562 00:32:28,540 --> 00:32:34,690 bahwa kita akan melihat pada larut malam TV karena kita tidak menafsirkan "bintang" 563 00:32:34,690 --> 00:32:38,630 memiliki arti benda angkasa tersebut. 564 00:32:38,630 --> 00:32:43,390 Kita tahu bahwa itu berarti lebih Aktor biasa atau aktris 565 00:32:43,390 --> 00:32:45,240 dengan jumlah tinggi visibilitas. 566 00:32:45,240 --> 00:32:47,770 567 00:32:47,770 --> 00:32:51,950 >> "Skuad membantu korban gigitan anjing." 568 00:32:51,950 --> 00:32:55,550 Apakah itu skuad sebenarnya di luar sana membantu anjing 569 00:32:55,550 --> 00:32:59,620 di terjadi di sekitar dan menggigit korban? 570 00:32:59,620 --> 00:33:02,380 Atau bahwa ada seorang individu yang 571 00:33:02,380 --> 00:33:04,625 digigit anjing yang membutuhkan bantuan? 572 00:33:04,625 --> 00:33:07,650 573 00:33:07,650 --> 00:33:11,480 Hanya dari melihat sintaks dan semantik kalimat, 574 00:33:11,480 --> 00:33:14,660 kita tidak bisa menentukan itu. 575 00:33:14,660 --> 00:33:22,000 >> "Helikopter didukung oleh lalat manusia." 576 00:33:22,000 --> 00:33:27,330 Apakah ada, pada kenyataannya, sebenarnya hal-hal kecil yang terbang di sekitar 577 00:33:27,330 --> 00:33:34,510 adalah orang-orang dengan sayap powering helikopter untuk kebaikan umat manusia? 578 00:33:34,510 --> 00:33:38,960 Atau ada satu perangkat mekanik yang berasal kekuatannya dari seseorang? 579 00:33:38,960 --> 00:33:41,600 580 00:33:41,600 --> 00:33:46,500 >> Ketika kita melihat pertanyaan sistem menjawab, 581 00:33:46,500 --> 00:33:51,110 ini adalah lapisan yang kita perlu berurusan dengan. 582 00:33:51,110 --> 00:33:54,890 Sekarang, yang terbaik dan paling semacam dari umum dari sistem ini 583 00:33:54,890 --> 00:34:00,640 hari ini mampu melakukan hal-hal di tingkat yang 584 00:34:00,640 --> 00:34:05,050 jauh melampaui apa yang kita miliki 10 tahun yang lalu. 585 00:34:05,050 --> 00:34:08,210 Berikut ini salah satu sistem terbaik yang ada di luar sana hari ini. 586 00:34:08,210 --> 00:34:10,519 Dan ini adalah suatu sistem dari IBM yang disebut Watson. 587 00:34:10,519 --> 00:34:13,040 588 00:34:13,040 --> 00:34:15,500 Ini adalah dari teman-teman kita di IBM. 589 00:34:15,500 --> 00:34:19,810 Ini adalah bank Katherine, Jia Chen, dan Priscilla Moraes memberikan kita 590 00:34:19,810 --> 00:34:26,323 demonstrasi Watson kemarin di IBM Yorktown. 591 00:34:26,323 --> 00:34:26,989 [VIDEO PLAYBACK] 592 00:34:26,989 --> 00:34:27,690 -Apa kabar? 593 00:34:27,690 --> 00:34:30,600 594 00:34:30,600 --> 00:34:31,980 >> -Saya baik. 595 00:34:31,980 --> 00:34:35,429 Saya selalu senang ketika saya berpikir, terutama ketika saya 596 00:34:35,429 --> 00:34:38,920 dapat tetap dingin di ruang server ini. 597 00:34:38,920 --> 00:34:40,170 -Siapa Aktris favorit Anda? 598 00:34:40,170 --> 00:34:43,870 599 00:34:43,870 --> 00:34:47,555 >> Aktris favorit -My Angelina Jolie sebagai Lara Croft 600 00:34:47,555 --> 00:34:54,800 di Tomb Raider karena aslinya bentuk adalah sebagai karakter virtual seperti saya. 601 00:34:54,800 --> 00:34:56,760 >> -Bagaimana Watson dapat membantu pasien? 602 00:34:56,760 --> 00:34:59,700 603 00:34:59,700 --> 00:35:03,755 >> -Apakah Rencana bagi pasien untuk memiliki akses ke Watson langsung? 604 00:35:03,755 --> 00:35:08,050 Akses ke Watson penasehat aplikasi akan bervariasi dengan menggunakan kasus. 605 00:35:08,050 --> 00:35:12,630 Tapi saat ini, Watson hanya akan memberikan diagnosis dan pengobatan mungkin 606 00:35:12,630 --> 00:35:14,725 pilihan untuk profesional medis. 607 00:35:14,725 --> 00:35:17,680 Apabila diperlukan, pasien dapat memberikan informasi 608 00:35:17,680 --> 00:35:21,210 Watson, mungkin melalui antarmuka web portal, tablet, 609 00:35:21,210 --> 00:35:23,500 atau bahkan ponsel. 610 00:35:23,500 --> 00:35:27,180 Sebagai contoh, pasien mungkin diminta untuk menggambarkan gejala mereka 611 00:35:27,180 --> 00:35:30,460 dalam bahasa alami langsung menjadi solusi Watson, 612 00:35:30,460 --> 00:35:34,050 memungkinkan dokter untuk fokus pada diagnosis dan tidak pengumpulan data. 613 00:35:34,050 --> 00:35:38,379 614 00:35:38,379 --> 00:35:42,716 >> -Siapa Dibunuh Abraham Lincoln? 615 00:35:42,716 --> 00:35:46,153 >> -John Wilkes Booth. 616 00:35:46,153 --> 00:35:52,373 >> -Dalam Tahun berapa melakukan Arizona Diamondbacks memenangkan World Series? 617 00:35:52,373 --> 00:35:55,295 >> -2001. 618 00:35:55,295 --> 00:35:58,710 >> [END PLAYBACK] 619 00:35:58,710 --> 00:36:01,610 >> BRIAN SCASSELLATI: Jadi jenis-jenis sistem 620 00:36:01,610 --> 00:36:07,430 harus mengandalkan pertama-tama mengenali pidato; kedua, 621 00:36:07,430 --> 00:36:12,200 mengubahnya menjadi internal yang bermakna perwakilan; dan kemudian, ketiga, 622 00:36:12,200 --> 00:36:17,090 bisa pergi keluar dan menemukan sumber informasi yang 623 00:36:17,090 --> 00:36:21,140 memungkinkan mereka untuk menjawab pertanyaan itu. 624 00:36:21,140 --> 00:36:27,320 Tingkat kompleksitas melibatkan jenis yang sama hal program 625 00:36:27,320 --> 00:36:31,790 bahwa Anda telah lakukan di masalah set. 626 00:36:31,790 --> 00:36:38,000 >> Kami dapat mengurai permintaan HTTP di jenis yang sama dari pola tingkat rendah 627 00:36:38,000 --> 00:36:40,810 pencocokan yang ELIZA dapat dilakukan. 628 00:36:40,810 --> 00:36:45,070 Kami dapat mengkonversikan menjadi representasi internal, 629 00:36:45,070 --> 00:36:50,360 dan kemudian menggunakannya untuk query beberapa database eksternal, mungkin menggunakan SQL. 630 00:36:50,360 --> 00:36:53,530 631 00:36:53,530 --> 00:36:56,260 Semua sistem yang yang sedang dibangun saat ini 632 00:36:56,260 --> 00:37:00,520 untuk melakukan hal ini jenis alami komunikasi bahasa 633 00:37:00,520 --> 00:37:04,100 sedang dibangun di atas prinsip-prinsip yang sama. 634 00:37:04,100 --> 00:37:09,530 >> Sekarang, bahkan sistem seperti Watson tidak cukup kompleks 635 00:37:09,530 --> 00:37:14,820 untuk dapat menjawab sewenang-wenang pertanyaan tentang topik apapun. 636 00:37:14,820 --> 00:37:20,060 Dan pada kenyataannya, mereka harus terstruktur dalam domain tertentu. 637 00:37:20,060 --> 00:37:24,440 Sehingga Anda dapat pergi online dan Anda dapat menemukan versi Watson yang beroperasi dengan baik 638 00:37:24,440 --> 00:37:27,700 dalam informatika medis. 639 00:37:27,700 --> 00:37:31,490 Atau ada satu secara online yang hanya berkaitan dengan bagaimana 640 00:37:31,490 --> 00:37:34,540 untuk membuat rekomendasi yang baik tentang apa bir akan pergi dengan yang makanan. 641 00:37:34,540 --> 00:37:37,060 642 00:37:37,060 --> 00:37:41,870 Dan dalam domain-domain, dapat menjawab pertanyaan, 643 00:37:41,870 --> 00:37:46,130 menemukan informasi yang dibutuhkan. 644 00:37:46,130 --> 00:37:48,270 >> Tetapi Anda tidak dapat mencampur dan mencocokkan mereka. 645 00:37:48,270 --> 00:37:53,150 Sistem yang telah dilatih dengan database makanan dan bir 646 00:37:53,150 --> 00:37:56,830 tidak bekerja dengan baik ketika Anda tiba-tiba memasukkannya ke dalam dengan informatika medis 647 00:37:56,830 --> 00:37:59,770 Database. 648 00:37:59,770 --> 00:38:05,680 Jadi bahkan sistem yang terbaik hari ini mengandalkan tingkat pengolahan 649 00:38:05,680 --> 00:38:11,570 di mana kita coding tangan dan membangun infrastruktur dalam rangka 650 00:38:11,570 --> 00:38:13,275 untuk membuat sistem ini berjalan. 651 00:38:13,275 --> 00:38:16,360 652 00:38:16,360 --> 00:38:20,710 >> Sekarang, topik terakhir yang ingin saya untuk bisa sampai ke hari ini 653 00:38:20,710 --> 00:38:23,960 adalah tentang komunikasi nonverbal. 654 00:38:23,960 --> 00:38:29,290 Sebuah massa besar informasi yang kita berkomunikasi satu sama lain 655 00:38:29,290 --> 00:38:35,490 tidak terjadi melalui kata-kata individu bahwa kita menerapkan. 656 00:38:35,490 --> 00:38:40,290 Ini ada hubungannya dengan hal-hal seperti kedekatan, tatapan, nada suara, 657 00:38:40,290 --> 00:38:42,270 infleksi Anda. 658 00:38:42,270 --> 00:38:46,620 Dan komunikasi yang juga sesuatu yang banyak antarmuka yang berbeda 659 00:38:46,620 --> 00:38:49,960 peduli banyak tentang. 660 00:38:49,960 --> 00:38:51,500 Itu bukan apa Siri peduli. 661 00:38:51,500 --> 00:38:56,250 Saya dapat meminta Siri sesuatu dalam satu suara atau dengan nada yang berbeda dari suara, 662 00:38:56,250 --> 00:38:59,840 dan Siri akan memberikan jawaban yang sama. 663 00:38:59,840 --> 00:39:05,260 Tapi itu bukan apa yang kita membangun untuk jenis lain dari interface. 664 00:39:05,260 --> 00:39:09,120 >> Saya ingin memperkenalkan Anda sekarang untuk salah satu robot. 665 00:39:09,120 --> 00:39:12,720 Ini dibangun oleh lama saya teman dan kolega Cynthia 666 00:39:12,720 --> 00:39:16,010 Breazeal dan perusahaannya Jibo. 667 00:39:16,010 --> 00:39:20,090 Dan robot-- ini kita akan untuk memiliki beberapa relawan 668 00:39:20,090 --> 00:39:22,520 datang untuk berinteraksi dengan ini. 669 00:39:22,520 --> 00:39:26,200 Jadi bisa saya memiliki dua orang yang bersedia bermain dengan robot untuk saya? 670 00:39:26,200 --> 00:39:29,936 Mengapa Anda tidak datang ke atas, dan mengapa tidak melakukan Anda datang ke atas. 671 00:39:29,936 --> 00:39:31,310 Jika Anda ingin bergabung dengan saya di sini, silakan. 672 00:39:31,310 --> 00:39:36,520 673 00:39:36,520 --> 00:39:39,670 >> Dan jika aku bisa memiliki Anda datang tepat di sini. 674 00:39:39,670 --> 00:39:40,170 Terima kasih. 675 00:39:40,170 --> 00:39:40,480 Hai. 676 00:39:40,480 --> 00:39:41,400 >> ALFREDO: Senang bertemu Anda. 677 00:39:41,400 --> 00:39:42,010 Alfredo. 678 00:39:42,010 --> 00:39:42,520 >> BRIAN SCASSELLATI: Alfredo. 679 00:39:42,520 --> 00:39:43,146 >> RACHEL: Rachel. 680 00:39:43,146 --> 00:39:44,228 BRIAN SCASSELLATI: Rachel. 681 00:39:44,228 --> 00:39:45,154 Senang bertemu Anda berdua. 682 00:39:45,154 --> 00:39:46,820 Alfredo, aku akan memiliki Anda pergi dulu. 683 00:39:46,820 --> 00:39:47,990 Datang tepat di sini. 684 00:39:47,990 --> 00:39:51,870 Aku akan memperkenalkan you-- jika saya bisa mendapatkan ini dari 685 00:39:51,870 --> 00:39:58,450 tanpa mengetuk microphone-- yang untuk robot kecil bernama Jibo. 686 00:39:58,450 --> 00:40:00,140 OKE? 687 00:40:00,140 --> 00:40:04,260 >> Sekarang, Jibo dirancang untuk menjadi interaktif. 688 00:40:04,260 --> 00:40:09,339 Dan meskipun dapat memberikan pidato Anda, banyak interaksi robot dengan 689 00:40:09,339 --> 00:40:09,880 adalah nonverbal. 690 00:40:09,880 --> 00:40:12,450 691 00:40:12,450 --> 00:40:17,070 Alfredo, aku akan meminta Anda untuk mengatakan sesuatu yang menyenangkan dan gratis 692 00:40:17,070 --> 00:40:19,554 untuk robot, silakan. 693 00:40:19,554 --> 00:40:20,845 ALFREDO: Saya pikir Anda terlihat manis. 694 00:40:20,845 --> 00:40:24,114 695 00:40:24,114 --> 00:40:25,611 >> [Berputar SUARA] 696 00:40:25,611 --> 00:40:26,192 697 00:40:26,192 --> 00:40:27,108 BRIAN SCASSELLATI: OK. 698 00:40:27,108 --> 00:40:30,110 699 00:40:30,110 --> 00:40:33,180 Responnya tidak verbal. 700 00:40:33,180 --> 00:40:35,180 Namun itu memberi Anda berdua pengakuan yang jelas 701 00:40:35,180 --> 00:40:39,680 bahwa mereka telah mendengar apa yang Anda katakan dan juga entah bagaimana memahami bahwa. 702 00:40:39,680 --> 00:40:40,530 OKE? 703 00:40:40,530 --> 00:40:42,070 Langkah tepat kembali ke sini untuk satu detik. 704 00:40:42,070 --> 00:40:43,130 Terima kasih. 705 00:40:43,130 --> 00:40:44,090 >> Rachel, jika Anda akan. 706 00:40:44,090 --> 00:40:46,070 Sekarang, saya akan memberikan Anda pekerjaan jauh lebih sulit. 707 00:40:46,070 --> 00:40:48,361 Jika Anda akan berdiri di sini, cadangan hanya sedikit sehingga 708 00:40:48,361 --> 00:40:50,280 kita bisa mendapatkan Anda pada kamera dan terlihat seperti ini. 709 00:40:50,280 --> 00:40:56,840 Aku akan meminta Anda untuk mengatakan sesuatu benar-benar berarti dan jahat untuk robot. 710 00:40:56,840 --> 00:41:02,900 >> RACHEL: Apa yang baru saja Anda tampak lakukan adalah benar-benar tidak masuk akal. 711 00:41:02,900 --> 00:41:03,840 >> [Bersenandung SUARA] 712 00:41:03,840 --> 00:41:07,610 713 00:41:07,610 --> 00:41:09,030 >> Itu bahkan lebih masuk akal. 714 00:41:09,030 --> 00:41:10,120 Kamu kenapa? 715 00:41:10,120 --> 00:41:13,487 716 00:41:13,487 --> 00:41:16,207 Aw, jangan merasa buruk. 717 00:41:16,207 --> 00:41:17,040 Saya akan memberikan pelukan. 718 00:41:17,040 --> 00:41:19,882 719 00:41:19,882 --> 00:41:21,090 BRIAN SCASSELLATI: Baiklah. 720 00:41:21,090 --> 00:41:22,280 Terima kasih, Rachel. 721 00:41:22,280 --> 00:41:24,565 Alfredo, Rachel, thanks guys sangat banyak. 722 00:41:24,565 --> 00:41:26,840 >> [TEPUK TANGAN] 723 00:41:26,840 --> 00:41:28,660 724 00:41:28,660 --> 00:41:34,470 >> Jadi jenis interaksi memiliki di banyak cara beberapa aturan yang sama 725 00:41:34,470 --> 00:41:36,950 dan beberapa yang sama struktur seperti apa yang kita 726 00:41:36,950 --> 00:41:39,950 mungkin dalam interaksi linguistik. 727 00:41:39,950 --> 00:41:44,530 Hal ini baik dan komunikatif melayani tujuan yang penting. 728 00:41:44,530 --> 00:41:48,590 Dan interaksi itu, di banyak cara, dirancang 729 00:41:48,590 --> 00:41:52,890 memiliki efek tertentu pada orang berinteraksi dengan atau mendengarkan 730 00:41:52,890 --> 00:41:54,410 untuk robot. 731 00:41:54,410 --> 00:41:56,450 >> Sekarang, aku cukup beruntung memiliki Jibo di sini hari ini. 732 00:41:56,450 --> 00:42:00,550 Sam Spaulding sini membantu kami dengan robot. 733 00:42:00,550 --> 00:42:07,470 Dan aku akan meminta Sam untuk memberikan kami salah satu demo yang bagus dari Jibo menari 734 00:42:07,470 --> 00:42:09,720 bahwa kita dapat menonton di akhir di sini. 735 00:42:09,720 --> 00:42:10,590 Jadi silakan, Jibo. 736 00:42:10,590 --> 00:42:11,550 >> SAM: OK, Jibo. 737 00:42:11,550 --> 00:42:14,430 Menunjukkan kepada kita gerakan tarian Anda. 738 00:42:14,430 --> 00:42:17,310 >> [MUSIC PLAYING] 739 00:42:17,310 --> 00:42:43,114 740 00:42:43,114 --> 00:42:44,780 BRIAN SCASSELLATI: Baiklah, semua orang. 741 00:42:44,780 --> 00:42:46,865 Terima kasih kepada teman-teman kita di Jibo. 742 00:42:46,865 --> 00:42:49,426 >> [TEPUK TANGAN] 743 00:42:49,426 --> 00:42:50,140 744 00:42:50,140 --> 00:42:54,990 >> Dan terima kasih kepada teman-teman kita di IBM untuk membantu keluar hari ini. 745 00:42:54,990 --> 00:42:57,300 Komunikasi adalah sesuatu yang bahwa Anda akan 746 00:42:57,300 --> 00:43:02,280 untuk melihat datang lebih banyak dan lebih sebagai kita membangun interface yang lebih kompleks. 747 00:43:02,280 --> 00:43:05,760 Minggu depan, kita akan berbicara tentang bagaimana antarmuka 748 00:43:05,760 --> 00:43:08,890 dengan lawan komputer di game. 749 00:43:08,890 --> 00:43:12,950 Tapi jika Anda memiliki pertanyaan tentang hal ini, Saya akan berada di sekitar di jam kantor malam ini. 750 00:43:12,950 --> 00:43:17,610 Saya senang untuk berbicara dengan Anda tentang AI topik atau untuk mendapatkan ke detail lebih lanjut. 751 00:43:17,610 --> 00:43:18,927 Selamat berakhir pekan. 752 00:43:18,927 --> 00:43:21,409 >> [TEPUK TANGAN] 753 00:43:21,409 --> 00:43:21,909 754 00:43:21,909 --> 00:43:26,141 [MUSIC PLAYING] 755 00:43:26,141 --> 00:46:42,879