1 00:00:00,000 --> 00:00:02,928 >> [MUSIC nagpe-play] 2 00:00:02,928 --> 00:00:11,230 3 00:00:11,230 --> 00:00:12,790 >> David MALAN: Ito ang CS50. 4 00:00:12,790 --> 00:00:14,072 Ito ay ang katapusan ng linggo 10. 5 00:00:14,072 --> 00:00:16,030 And boy, kami ay may isang magandang klase para sa iyo ngayon. 6 00:00:16,030 --> 00:00:20,040 Kami ay kaya nasasabik na imbitahan ang dalawa sa ang aming mga kaibigan mula sa Yale hanggang sa amin sa araw na ito 7 00:00:20,040 --> 00:00:23,920 at upang tumingin sa intersection ng artificial intelligence, robotics, 8 00:00:23,920 --> 00:00:25,710 natural pagpoproseso ng wika, at higit pa. 9 00:00:25,710 --> 00:00:27,090 >> At sa katunayan, sa loob ng nakalipas na ilang linggo, na namin 10 00:00:27,090 --> 00:00:29,714 tiyak na ginugol ng isang pulutong ng mga oras, lalo na sa mga naunang psets, 11 00:00:29,714 --> 00:00:31,560 nagbibigay-diin sa pretty detalye mababang antas. 12 00:00:31,560 --> 00:00:34,520 At ito ay tunay madali na malimutan ng kagubatan para sa mga puno 13 00:00:34,520 --> 00:00:38,170 at Hung up sa mga loop at mga kondisyon at mga payo, tiyak, at ang gusto. 14 00:00:38,170 --> 00:00:41,770 Subalit ang katotohanan ay ka guys ngayon ay mayroon ng mga sangkap na kung saan maaari mong tunay 15 00:00:41,770 --> 00:00:45,300 malutas ang ilang mga kawili-wiling mga problema, bukod sa ang mga ito sa mga na ang ating mga kaibigan sa Yale 16 00:00:45,300 --> 00:00:48,790 magtrabaho sa nahihiya lamang ng Cambridge. 17 00:00:48,790 --> 00:00:52,410 >> Kaya payagan ako unang upang ipakilala ang ating ulo pagtuturo assistant mula sa Yale, Andy. 18 00:00:52,410 --> 00:00:55,182 >> [Palakpakan] 19 00:00:55,182 --> 00:00:57,030 20 00:00:57,030 --> 00:01:00,710 >> ANDY: Una sa lahat, salamat na lang iyo para sa nagpapahintulot sa isang pares Yalies 21 00:01:00,710 --> 00:01:02,700 mag-pop sa pababa sa Cambridge ngayon. 22 00:01:02,700 --> 00:01:05,299 Pinahahalagahan namin talaga ito. 23 00:01:05,299 --> 00:01:07,090 Pangalawa, sa aming mga kaibigan bumalik home-- Jason, 24 00:01:07,090 --> 00:01:09,670 salamat para sa pananatiling at tumatakbo panayam. 25 00:01:09,670 --> 00:01:12,970 Sana ito ay mabuti ang lahat sa New Haven. 26 00:01:12,970 --> 00:01:15,720 >> Kaya oo, ako sobrang tuwang-tuwa upang ipakilala Scaz ngayon. 27 00:01:15,720 --> 00:01:17,020 Scaz nagpapatakbo ng robotics lab. 28 00:01:17,020 --> 00:01:19,690 Siya ay isang propesor ng, tulad ng, limang iba't-ibang departamento sa Yale. 29 00:01:19,690 --> 00:01:23,159 Sa kanyang lab, siya ay may maraming, maraming robots na siya kagustuhan na maglaro sa. 30 00:01:23,159 --> 00:01:24,950 Siya ay may, tulad ng, mga pinaka-cool na trabaho sa mundo. 31 00:01:24,950 --> 00:01:27,116 At siya ay nakakakuha sa uri ng gulo paligid na may na ang lahat ng araw 32 00:01:27,116 --> 00:01:29,090 mahaba at gumawa ng ilang trabaho, pati na rin. 33 00:01:29,090 --> 00:01:33,070 >> At kaya namin ang aktwal na nagdala ng isa ng mga ito down sa amin ngayon. 34 00:01:33,070 --> 00:01:36,900 Kaya nang walang karagdagang linggal, Scaz ay pagpunta sa sige ipakilala sa amin at 35 00:01:36,900 --> 00:01:38,660 sa kanyang kaibigan robot. 36 00:01:38,660 --> 00:01:41,546 >> [Palakpakan] 37 00:01:41,546 --> 00:01:42,935 38 00:01:42,935 --> 00:01:44,310 BRIAN SCASSELLATI: Salamat, David. 39 00:01:44,310 --> 00:01:45,380 Salamat, Andy. 40 00:01:45,380 --> 00:01:50,050 Ito ay kaya kahanga-hanga na dito sa lahat ngayon. 41 00:01:50,050 --> 00:01:56,490 Gusto kong unang maging napakalinaw na CS50 staff dito sa Cambridge 42 00:01:56,490 --> 00:01:59,190 ay hindi kapani-paniwalang mapagbigay sa pakikitungo sa atin. 43 00:01:59,190 --> 00:02:02,130 Kami ay kaya nagpapasalamat para sa lahat ng bagay ang kanilang nagawa sa suporta sa amin. 44 00:02:02,130 --> 00:02:05,690 At kaya nais naming ma upang ibalik ang kabaitan. 45 00:02:05,690 --> 00:02:09,370 >> Kaya ngayon, makuha namin na ipahayag na kami ay pagpunta sa magkaroon ng isang bago, 46 00:02:09,370 --> 00:02:15,240 isa-sa-isang-uri CS50 kaganapan nangyayari sa New Haven susunod na linggo. 47 00:02:15,240 --> 00:02:18,040 At ito ay ang CS50 Research Expo. 48 00:02:18,040 --> 00:02:21,300 Kaya kami ay pagpunta sa ay nag-aanyaya everyone-- CS50 mag-aaral, 49 00:02:21,300 --> 00:02:26,510 staff mula sa parehong Harvard at Yale-- sa bumaba at bisitahin ang sa amin sa Biyernes. 50 00:02:26,510 --> 00:02:30,400 Magkakaroon kami ng isang malawak na iba't ibang mga higit 30 iba't ibang mga tao ang pagtatanghal 51 00:02:30,400 --> 00:02:34,830 at exhibiting-- upperclassmen pagpapakita off ang ilan sa kanilang mga produkto ng pananaliksik. 52 00:02:34,830 --> 00:02:38,480 Magkakaroon kami ng ilang mga startup, kahit na, naghahanap para sa isang maliit na piraso ng bagong tech talent, 53 00:02:38,480 --> 00:02:40,460 mga startup mula sa parehong Harvard at Yale. 54 00:02:40,460 --> 00:02:44,550 At kami ay may ilang mga mag-aaral ng mga grupo naghahanap ng ilang mga bagong kasapi. 55 00:02:44,550 --> 00:02:46,357 >> Ito ay pagpunta sa maging isang napaka-kapana-panabik na oras. 56 00:02:46,357 --> 00:02:49,190 Sana sa inyo na mga darating down para sa laro Harvard-Yale 57 00:02:49,190 --> 00:02:51,360 ay magagawang upang ihinto sa pamamagitan ng isang maliit na piraso ng maaga, 58 00:02:51,360 --> 00:02:54,060 karapatan sa sentro ng campus, Sterling Memorial Library. 59 00:02:54,060 --> 00:02:58,040 Kami ay pagpunta sa magkaroon ng isang hanay ng mga nagpapakita na hanay mula sa autonomous 60 00:02:58,040 --> 00:03:04,460 sailboats sa paraan ng paggamit ng software upang mapanatili medyebal manuskrito. 61 00:03:04,460 --> 00:03:07,860 >> Kami ay pagpunta sa may ad hoc networking at mga tao 62 00:03:07,860 --> 00:03:11,230 pagtuturo software coding sa Cape Town. 63 00:03:11,230 --> 00:03:13,730 Magkakaroon kami ng computer demonstrasyon ng musika. 64 00:03:13,730 --> 00:03:16,020 At kami na siyempre ay may higit pang mga robot. 65 00:03:16,020 --> 00:03:18,900 Kaya umaasa kami sa iyo idedetalye sumali sa amin para sa kaganapang ito. 66 00:03:18,900 --> 00:03:21,350 Dapat ito ay isang pulutong ng mga masaya, isang maliit na piraso ng pagkain, 67 00:03:21,350 --> 00:03:24,430 at ng maraming mga kagiliw-giliw mga bagay na makipag-usap tungkol sa. 68 00:03:24,430 --> 00:03:28,230 >> Kaya ngayon, kami ay pagpunta sa makipag-usap tungkol sa likas na wika sa pagpoproseso. 69 00:03:28,230 --> 00:03:32,560 At ito ay ang pagtatangka para sa amin na bumuo ng isang bagong paraan ng interfacing 70 00:03:32,560 --> 00:03:35,150 sa aming mga device dahil para sa huling ilang linggo, 71 00:03:35,150 --> 00:03:40,800 ang iyong na-nakatutok sa kung paano ito ay na Maaari mong isulat ang code, isulat software 72 00:03:40,800 --> 00:03:47,110 iyon ay isang paraan ng pagiging able sa sabihin sa isang machine, ito ang gusto kong gawin mo. 73 00:03:47,110 --> 00:03:50,210 >> Ngunit hindi pa namin dapat kailangan na umasa na ang lahat ng bagay 74 00:03:50,210 --> 00:03:53,760 tanging magagamit na ginagamit ng lahat ng tao sa mundo 75 00:03:53,760 --> 00:03:57,480 ay magiging marunong sa ganitong uri ng pagtuturo. 76 00:03:57,480 --> 00:04:02,540 Kaya namin makilala sa pagitan ng computer wika at natural languages-- 77 00:04:02,540 --> 00:04:06,720 iyon ay, ang mga bagay na ang mga tao na paggamit upang makipag-usap sa ibang mga tao. 78 00:04:06,720 --> 00:04:12,270 At subukan namin upang bumuo ng mga interface na gumagamit mga natural na mekanismo komunikasyon. 79 00:04:12,270 --> 00:04:16,029 >> Ngayon, tulad lamang ng bawat iba pang paksa na na namin na nagsimula sa sa CS50, 80 00:04:16,029 --> 00:04:19,589 kami ay pagpunta sa magsimula sa ang pinakasimpleng piraso ng natural pagpoproseso ng wika 81 00:04:19,589 --> 00:04:21,269 na maaari naming isipin. 82 00:04:21,269 --> 00:04:24,940 Kami ay pagpunta sa magsimula sa makasaysayang bahagi ng natural na wika. 83 00:04:24,940 --> 00:04:28,740 At pagkatapos ay gagamitin namin bumuo ng hanggang sa mas at mas kamakailan-lamang na mga sistema 84 00:04:28,740 --> 00:04:31,450 at magsaya demo kasama ang paraan. 85 00:04:31,450 --> 00:04:35,900 >> Kaya kami ay pagpunta sa magsimula sa kung ano ang marahil ang unang natural na wika 86 00:04:35,900 --> 00:04:38,210 processing system. 87 00:04:38,210 --> 00:04:45,080 Ito ay isang software system na nakasulat sa 1966 sa pamamagitan ng Joseph Weizenbaum tinatawag ELIZA. 88 00:04:45,080 --> 00:04:49,640 At ELIZA ay dinisenyo upang ginagaya ang mga uri ng mga pakikipag-ugnayan 89 00:04:49,640 --> 00:04:53,850 Gusto mo sa isang Rogerian psychotherapist. 90 00:04:53,850 --> 00:04:57,210 Ngayon, ang Rogerians, sila ay nagkaroon ng isang ideya na psychotherapy 91 00:04:57,210 --> 00:05:02,800 kasangkot pagiging maka-mirror pabalik sa isang pasyente at makipag-usap sa kanila, 92 00:05:02,800 --> 00:05:08,100 talaga, sa pamamagitan lamang ng mga ito ang isang pagbibigay maliit na maliit na maliit na piraso ng mga therapist. 93 00:05:08,100 --> 00:05:09,920 Iyon ay, ang lahat ng bagay na nagsasabing ang mga therapist 94 00:05:09,920 --> 00:05:16,500 ay dapat na maging lamang isang salamin ng kung ano ang mga pasyente ay nagsasabi sa kanila. 95 00:05:16,500 --> 00:05:18,990 >> Kaya sabihin subukan at demo na ito. 96 00:05:18,990 --> 00:05:22,820 Kailangan namin ng isang volunteer na nais maging gustong ibahagi ang kanilang pinakamalalim, 97 00:05:22,820 --> 00:05:26,650 pinakamadilim, at / o pekeng mga lihim sa ELIZA? 98 00:05:26,650 --> 00:05:29,680 Oo naman, bakit hindi mo puntahan up. 99 00:05:29,680 --> 00:05:30,847 Hindi kapani-paniwala. 100 00:05:30,847 --> 00:05:31,430 At ang pangalan mo? 101 00:05:31,430 --> 00:05:32,000 >> MILES: Milya. 102 00:05:32,000 --> 00:05:33,041 >> BRIAN SCASSELLATI: Milya. 103 00:05:33,041 --> 00:05:34,270 Masaya akong makilala kayo, Milya. 104 00:05:34,270 --> 00:05:36,270 Kung nais mong i-hold papunta iyon. 105 00:05:36,270 --> 00:05:40,840 At kami ay pagpunta sa gumamit ng isang bersyon ng ELIZA 106 00:05:40,840 --> 00:05:44,640 na ko na kinokopya namin sa loob ng CS50 IDE. 107 00:05:44,640 --> 00:05:47,140 At kami na tingnan ang source code na ito sa isang maliit na habang. 108 00:05:47,140 --> 00:05:49,910 Ngunit para sa ngayon, hindi namin lamang pagpunta sa mga panawagan ito sa pamamagitan ng pag-type ng eliza. 109 00:05:49,910 --> 00:05:55,480 >> At ELIZA ay pagpunta sa magbibigay sa iyo ng mga sagot na pagpunta sa maging sa lahat ng capitals. 110 00:05:55,480 --> 00:05:57,950 At pagpunta sa hilingin sa iyo ng ilang mga katanungan. 111 00:05:57,950 --> 00:06:02,130 At tutugon kami at i-type sa mga sagot sa ELIZA. 112 00:06:02,130 --> 00:06:04,310 Kaya ELIZA ay sinabi, "Hi, Ako ELIZA. 113 00:06:04,310 --> 00:06:05,462 Ano ang iyong problema? " 114 00:06:05,462 --> 00:06:08,092 Ano ang gusto mong sabihin ELIZA naman ngayon? 115 00:06:08,092 --> 00:06:10,750 >> MILES: maaari ko lamang matulog kung mayroon akong kuneho tsinelas pa. 116 00:06:10,750 --> 00:06:12,440 >> BRIAN SCASSELLATI: Lahat ng karapatan. 117 00:06:12,440 --> 00:06:13,360 Lahat tama. 118 00:06:13,360 --> 00:06:15,300 >> [Tawa] 119 00:06:15,300 --> 00:06:22,410 >> "Maaari ko lamang matulog bunny slippers on. " 120 00:06:22,410 --> 00:06:29,000 At ELIZA nagsasabing, "Say, gawin mo ay may anumang mga sikolohikal na mga problema? 121 00:06:29,000 --> 00:06:30,450 Marahil ito ay isang mahusay na tagapagpahiwatig. " 122 00:06:30,450 --> 00:06:30,780 >> SIGE. 123 00:06:30,780 --> 00:06:32,245 Kaya kung ano ang nais mong tumugon? 124 00:06:32,245 --> 00:06:36,110 125 00:06:36,110 --> 00:06:36,970 >> MILES: Oo. 126 00:06:36,970 --> 00:06:38,660 >> BRIAN SCASSELLATI Oo. 127 00:06:38,660 --> 00:06:39,570 Man ng maraming salita. 128 00:06:39,570 --> 00:06:41,870 Enjoy ko na. 129 00:06:41,870 --> 00:06:50,200 Eliza nagsasabing, "tila medyo positibo mo." 130 00:06:50,200 --> 00:06:53,200 >> MILES: Hindi, ako, sa katunayan, ang isang elektron. 131 00:06:53,200 --> 00:06:55,150 >> BRIAN SCASSELLATI: "No. 132 00:06:55,150 --> 00:07:02,240 Sa katunayan, ako ay isang elektron. " "Dumating ka ba sa akin 133 00:07:02,240 --> 00:07:06,954 dahil sa ikaw ay isang elektron? " 134 00:07:06,954 --> 00:07:08,870 Ngayon, maaari naming makita ang ilan sa mga bagay- pupuntahan ko 135 00:07:08,870 --> 00:07:10,200 upang i-pause mo para sa isang segundo lamang, Milya. 136 00:07:10,200 --> 00:07:11,010 Huwag pumunta sa kahit saan. 137 00:07:11,010 --> 00:07:12,650 Hindi namin ka pa tapos sa iyo. 138 00:07:12,650 --> 00:07:16,490 ELIZA ay, sa ilang mga paraan, pagtugon sa ilang mga bagay 139 00:07:16,490 --> 00:07:21,140 na siya ay sinasabi ngunit walang anumang tunay na pag-unawa. 140 00:07:21,140 --> 00:07:26,090 At ito ay din parroting likod ng ilang sa mga bahagi ng kanyang mga pangungusap. 141 00:07:26,090 --> 00:07:27,310 >> Kaya sinabi namin, "No. 142 00:07:27,310 --> 00:07:29,090 Sa katunayan, ako ay isang elektron. " 143 00:07:29,090 --> 00:07:34,190 Eliza tumugon pabalik, "Pumunta ka ba sa akin dahil ikaw ay isang elektron? " 144 00:07:34,190 --> 00:07:34,690 Lahat tama. 145 00:07:34,690 --> 00:07:36,050 Sabihin bigyan ito ng isa pang tugon dito. 146 00:07:36,050 --> 00:07:37,140 Bigyan ito ng isang magandang isa, Milya. 147 00:07:37,140 --> 00:07:37,806 >> MILES: Good one? 148 00:07:37,806 --> 00:07:48,400 149 00:07:48,400 --> 00:07:49,570 >> Oo, mangyaring makakatulong sa akin. 150 00:07:49,570 --> 00:07:50,570 BRIAN SCASSELLATI: "Oo. 151 00:07:50,570 --> 00:07:58,010 Mangyaring makakatulong sa akin. "" Sigurado ka ba? " 152 00:07:58,010 --> 00:07:58,510 MILES: No. 153 00:07:58,510 --> 00:08:00,860 BRIAN SCASSELLATI: No. 154 00:08:00,860 --> 00:08:03,562 "Ano ang ibig na iminumungkahi sa iyo?" 155 00:08:03,562 --> 00:08:06,760 >> MILES: ako ay maaaring hindi isang elektron. 156 00:08:06,760 --> 00:08:11,170 >> BRIAN SCASSELLATI: "Ako ay maaaring hindi isang elektron. " 157 00:08:11,170 --> 00:08:13,790 "Sinasabi mo bang walang upang maging negatibo lang?" 158 00:08:13,790 --> 00:08:14,390 >> Lahat tama. 159 00:08:14,390 --> 00:08:16,030 Kaya Milya, salamat sa iyo kaya magkano. 160 00:08:16,030 --> 00:08:16,860 >> MILES: Salamat. 161 00:08:16,860 --> 00:08:18,360 >> BRIAN SCASSELLATI: Maraming salamat. 162 00:08:18,360 --> 00:08:20,230 [Palakpakan] 163 00:08:20,230 --> 00:08:21,230 164 00:08:21,230 --> 00:08:26,700 >> Kaya ito ELIZA program, sa maraming paraan, ay tumutugon lamang sa mga piraso 165 00:08:26,700 --> 00:08:32,730 na namin ang pagbibigay nang walang anumang malalim pag-unawa sa kung ano ang nangyayari dito. 166 00:08:32,730 --> 00:08:36,640 Ito ay isang uri ng sistema tinatawag na pagtutugma ng pattern, kung saan 167 00:08:36,640 --> 00:08:40,490 kaming naghahanap ng mga tiyak na mga piraso ng teksto na kami pagkatapos 168 00:08:40,490 --> 00:08:44,860 pagpunta sa kumuha ng kung ano ang ay ibinigay bilang input, 169 00:08:44,860 --> 00:08:52,580 convert ito, potensyal na, sa anumang paraan, at pagkatapos ay bigyan ito pabalik sa gumagamit. 170 00:08:52,580 --> 00:08:55,150 >> Gawin ang anuman sa tingin mo na ELIZA ay talagang 171 00:08:55,150 --> 00:08:58,230 gumaganap valid psychoanalysis dito? 172 00:08:58,230 --> 00:08:59,250 Isang tao, marahil. 173 00:08:59,250 --> 00:09:00,166 >> Madla: [hindi marinig]. 174 00:09:00,166 --> 00:09:03,315 175 00:09:03,315 --> 00:09:05,440 BRIAN SCASSELLATI: At kung paano ang ginagawa na gawin ka makaramdam? 176 00:09:05,440 --> 00:09:06,530 Oo, sa katunayan, ito ay. 177 00:09:06,530 --> 00:09:10,890 At kami ay pagpunta upang makita, talaga, ang source code para sa mga ito sa ilang sandali lamang. 178 00:09:10,890 --> 00:09:13,580 At kaya ka na magiging magawa ang eksaktong ito. 179 00:09:13,580 --> 00:09:17,420 >> Ngayon, ELIZA ay isang form ng kung ano ang gusto naming tumawag ngayon ng isang chat bot. 180 00:09:17,420 --> 00:09:19,950 Ito lamang ang napupunta sa pamamagitan ng teksto na iyong ibinibigay, 181 00:09:19,950 --> 00:09:24,030 nagkakaloob ng pinakamababang halaga ng pag-unawa o processing, 182 00:09:24,030 --> 00:09:26,790 at pagkatapos parrots ito pabalik sa iyo. 183 00:09:26,790 --> 00:09:31,830 Kaya sabihin tumagal ng isang pagtingin, conceptually, at makipag-usap tungkol sa kung ano 184 00:09:31,830 --> 00:09:34,690 ito ay na ELIZA ay aktwal na paggawa. 185 00:09:34,690 --> 00:09:42,000 >> ELIZA ay kumukuha ng isang sentence-- hahayaan sabihin, "Gusto kong mapabilib ang aking boss." 186 00:09:42,000 --> 00:09:45,130 At ELIZA ay naghahanap sa pamamagitan ng pangungusap na 187 00:09:45,130 --> 00:09:48,730 at sinusubukan mong hanapin at tumugma sa ilang mga pattern. 188 00:09:48,730 --> 00:09:52,850 Kaya, halimbawa, isa sa mga pattern na ELIZA ay naghahanap para sa mga salita 189 00:09:52,850 --> 00:09:55,110 "Gusto ko." 190 00:09:55,110 --> 00:09:59,330 At anumang oras nakikita ito ng isang bagay na may "Gusto ko" sa mga ito, 191 00:09:59,330 --> 00:10:01,770 ito formulates ng isang tugon. 192 00:10:01,770 --> 00:10:05,040 At na tugon ay isang fixed string. 193 00:10:05,040 --> 00:10:07,915 Sa kasong ito, ito ay "kung bakit ang gusto mo?" 194 00:10:07,915 --> 00:10:11,330 At nilagyan ko ng maliit na bituin sa sa wakas, dahil ito lamang 195 00:10:11,330 --> 00:10:13,310 ang simula ng aming tugon. 196 00:10:13,310 --> 00:10:16,310 At ang star ay nagpapahiwatig na kami ay pagpunta sa gawin ang mga natitirang 197 00:10:16,310 --> 00:10:19,850 ng utterance-- ng gumagamit "sa mapabilib ang aking boss" - 198 00:10:19,850 --> 00:10:24,500 at kami ay pagpunta upang maidagdag na papunta sa dulo ng ang string na ito. 199 00:10:24,500 --> 00:10:28,990 >> Kaya ngayon, sa halip na sinasabi, "kung bakit ang gusto mong mapabilib ang aking boss, " 200 00:10:28,990 --> 00:10:31,800 mayroong isang maliit na piraso ng mga karagdagang processing na makikita namin. 201 00:10:31,800 --> 00:10:34,440 Iyon ay, kami ay may sa convert ang ilan sa mga panghalip 202 00:10:34,440 --> 00:10:38,670 dito mula sa "aking boss" sa "sa iyong boss." 203 00:10:38,670 --> 00:10:41,300 At doon ay maaaring maging ng ilang mga iba pang mga pagbabago na kailangan namin upang gumawa ng. 204 00:10:41,300 --> 00:10:44,990 Kaya sa halip na malagkit lang ito direkta papunta sa dulo, kung ano ang gagawin namin 205 00:10:44,990 --> 00:10:49,160 ay isasaalang-alang namin ang natitirang bahagi ng utterance-- user sa puting here-- 206 00:10:49,160 --> 00:10:54,090 at kami na ang mga ito sa isang piraso sa isang oras at i-convert ang bawat string 207 00:10:54,090 --> 00:10:58,180 token, bawat salita, sa pangungusap. 208 00:10:58,180 --> 00:10:59,580 >> Kaya isasaalang-alang namin ang mga salitang "sa." 209 00:10:59,580 --> 00:11:01,650 Walang conversion na kailangan namin upang gawin iyon. 210 00:11:01,650 --> 00:11:02,340 "Pahangain." 211 00:11:02,340 --> 00:11:04,140 Walang conversion kailangan naming gawin doon. 212 00:11:04,140 --> 00:11:06,670 "My" ay i-convert sa "iyong". 213 00:11:06,670 --> 00:11:10,070 At "boss" namin makikita lamang mag-iwan ng "boss." 214 00:11:10,070 --> 00:11:12,740 At pagkatapos ay sa wakas, kahit ano na nagtatapos sa isang tagal ng panahon, 215 00:11:12,740 --> 00:11:16,640 makikita convert namin ito sa isang katanungan. 216 00:11:16,640 --> 00:11:22,600 >> Ito napaka-simple pagtutugma ng pattern ay talagang lubos na matagumpay. 217 00:11:22,600 --> 00:11:27,260 At kapag ito ay ipinakilala sa 1966-- Joseph Weizenbaum 218 00:11:27,260 --> 00:11:28,986 program na ito sa isang computer. 219 00:11:28,986 --> 00:11:31,110 Ngayon, mga computer sa oras na iyon ay hindi mga modelo desktop. 220 00:11:31,110 --> 00:11:33,950 Sila ay nagbahagi ng mga mapagkukunan. 221 00:11:33,950 --> 00:11:39,090 At ang kanyang mga mag-aaral ng gagawin pumunta at makipag-chat sa ELIZA. 222 00:11:39,090 --> 00:11:41,570 Sa kalaunan, kinailangan niyang limitahan ang access sa mga ito 223 00:11:41,570 --> 00:11:43,890 sapagkat ang kanyang mga mag-aaral ay hindi nakakakuha ng anumang gawain na ginawa. 224 00:11:43,890 --> 00:11:46,190 Lamang sila ay nakikipag-chat sa ELIZA. 225 00:11:46,190 --> 00:11:48,850 At, sa katunayan, siya ay upang apoy ang kanyang katulong, na 226 00:11:48,850 --> 00:11:55,840 ginugol ang lahat ng kanyang oras ng pakikipag-usap sa ELIZA tungkol sa kanyang malalim at nakakaligalig problema. 227 00:11:55,840 --> 00:12:00,350 >> Ang bawat taong ginagamit ang mga sistema nagsimula na anthropomorphize kanila. 228 00:12:00,350 --> 00:12:04,490 Sila ay nagsimula na sa tingin ng mga ito bilang mga pagiging animate at tunay na tao. 229 00:12:04,490 --> 00:12:07,969 Sila ay nagsimula na kilalanin ang ilan sa mga ang mga bagay na sila ay sinasabi 230 00:12:07,969 --> 00:12:09,010 ay babalik sa kanila. 231 00:12:09,010 --> 00:12:12,120 At sila ay paghahanap out mga bagay-bagay tungkol sa kanilang sarili. 232 00:12:12,120 --> 00:12:17,290 At, sa katunayan, kahit na ang mga eksperto, kahit na ang psychotherapist, 233 00:12:17,290 --> 00:12:22,930 nagsimula na mag-alala na, sa katunayan, siguro ELIZA ay palitan ang mga ito. 234 00:12:22,930 --> 00:12:25,640 At kahit na ang computer nag-aalala siyentipiko na tayo ay 235 00:12:25,640 --> 00:12:30,040 kaya malapit sa paglutas ng natural na wika. 236 00:12:30,040 --> 00:12:33,520 >> Ngayon, na ay hindi kahit saan malapit sa totoo. 237 00:12:33,520 --> 00:12:37,280 Ngunit na kung paano kahanga-hanga mga sistema ay maaaring mukhang. 238 00:12:37,280 --> 00:12:40,080 Kaya natin simulan upang tumingin ipaalam sa ilalim at subukan 239 00:12:40,080 --> 00:12:46,190 upang makakuha ng isang maliit na piraso ng isang katanungan ng kung saan ang tunay na nangyari ito code. 240 00:12:46,190 --> 00:12:48,170 Kaya gagawin namin itong code magagamit pagkatapos. 241 00:12:48,170 --> 00:12:50,880 At ito ay isang napaka simple at direktang port 242 00:12:50,880 --> 00:12:53,240 ng orihinal ELIZA pagpapatupad. 243 00:12:53,240 --> 00:12:56,350 >> Kaya ang ilan sa mga pangkakanyahan bagay-bagay na makikita mo dito 244 00:12:56,350 --> 00:12:59,360 ay hindi stylistically ano Gusto namin ang gusto mong gawin 245 00:12:59,360 --> 00:13:01,480 o kung ano na ang pagtuturo namin sa iyo na gawin. 246 00:13:01,480 --> 00:13:04,770 Ngunit na sinubukan namin upang panatilihin ang mga ito parehong sa kabila ng maraming ports 247 00:13:04,770 --> 00:13:08,087 na ito ay nagkaroon upang ito may lasa ng orihinal. 248 00:13:08,087 --> 00:13:09,920 Kaya kami ay pagpunta upang isama ng grupo ng mga bagay-bagay, 249 00:13:09,920 --> 00:13:12,920 at pagkatapos kami ay may isang hanay ng mga keyword, ang mga bagay 250 00:13:12,920 --> 00:13:16,460 na ELIZA ay makilala at direktang tumugon sa. 251 00:13:16,460 --> 00:13:20,780 Kaya kung mayroon kang mga salita tulad ng "maaari mong" o "Hindi ko" o "hindi" 252 00:13:20,780 --> 00:13:24,680 o "oo" o "panaginip" o "hello," pagkatapos ELIZA 253 00:13:24,680 --> 00:13:27,920 ay tumugon nang pili sa mga iyon. 254 00:13:27,920 --> 00:13:30,010 Ipapakita rin namin magkaroon ng isang tiyak na bilang ng mga bagay-bagay 255 00:13:30,010 --> 00:13:34,940 na kami magpalit, tulad ng pag-convert ng "aking" sa "iyong". 256 00:13:34,940 --> 00:13:39,920 >> At pagkatapos kami ay may isang hanay ng mga kasagutan na sa bawat isa sa mga keyword na ito, 257 00:13:39,920 --> 00:13:42,580 iro-rotate namin sa pamamagitan ng mga iba't ibang mga tugon. 258 00:13:42,580 --> 00:13:45,350 Kaya kung sinasabi ko "yes" tatlong beses sa isang hilera, ako 259 00:13:45,350 --> 00:13:50,429 ay maaaring makakuha ng tatlong iba't ibang mga sagot mula ELIZA. 260 00:13:50,429 --> 00:13:52,345 Ang aming code, at pagkatapos, ay talagang napaka-simple. 261 00:13:52,345 --> 00:13:59,490 Kung mag-scroll ko pababa nakalipas na ang lahat ng mga ito sagot na namin ang program sa 262 00:13:59,490 --> 00:14:02,920 at makakuha ng pababa kami sa aming main, kami ay pagpunta sa initialize 263 00:14:02,920 --> 00:14:06,540 isang pares ng mga iba't ibang mga variable at gawin ang isang maliit na piraso ng housekeeping 264 00:14:06,540 --> 00:14:08,480 sa simula. 265 00:14:08,480 --> 00:14:11,760 Ngunit pagkatapos ay mayroong ganap na isang set ng code na maaari mong maunawaan. 266 00:14:11,760 --> 00:14:15,820 Isang malaking habang loop na nagsasabing ako pagpunta sa ulitin ito nang paulit-ulit. 267 00:14:15,820 --> 00:14:20,420 Kukunin ko basahin sa isang linya, at idedetalye ko imbak na sa isang input string. 268 00:14:20,420 --> 00:14:23,880 Kukunin ko suriin at makita kung ito ay ang espesyal na keyword na "bye," kung saan 269 00:14:23,880 --> 00:14:26,199 nangangahulugan lumabas sa programa. 270 00:14:26,199 --> 00:14:29,240 At pagkatapos ay kukunin ko na suriin at makita kung ang isang tao ay paulit-ulit na lamang ang kanilang mga sarili 271 00:14:29,240 --> 00:14:29,800 paulit-ulit. 272 00:14:29,800 --> 00:14:31,174 At kukunin ko na sumigaw sa kanila kung gagawin nila. 273 00:14:31,174 --> 00:14:34,820 Sasabihin kong "huwag ulitin ang iyong sarili." 274 00:14:34,820 --> 00:14:40,500 >> Hangga't wala sa mga mangyayari, bibigyan namin ng pagkatapos ay i-scan sa pamamagitan ng at loop sa pamamagitan ng, 275 00:14:40,500 --> 00:14:45,330 sa linya 308-313 dito, at suriin at makita 276 00:14:45,330 --> 00:14:49,090 ay alinman sa mga keyword parirala na nakapaloob sa mga input 277 00:14:49,090 --> 00:14:50,620 na ako ay ibinigay lamang? 278 00:14:50,620 --> 00:14:54,845 Kung may isang tugma para sa kanila, well pagkatapos, makikita natatandaan ko na lokasyon. 279 00:14:54,845 --> 00:14:57,050 Makikita natatandaan ko keyword na iyon. 280 00:14:57,050 --> 00:14:58,620 At kukunin ko na magagawang upang bumuo ng isang tugon. 281 00:14:58,620 --> 00:15:03,150 >> Kung hindi ko mahanap ang isa, kung sa gayon, ang huling bagay sa aking keyword array 282 00:15:03,150 --> 00:15:08,070 ay ang aking default na mga sagot, kapag wala pa matches. 283 00:15:08,070 --> 00:15:14,160 Kukunin ko magtanong tulad ng "Bakit mo ginawa dumating dito? "o" Paano ko ng tulong sa iyo? " 284 00:15:14,160 --> 00:15:19,710 na lamang bahagyang naaangkop hindi mahalaga kung ano ang input ay. 285 00:15:19,710 --> 00:15:22,580 >> Makikita pagkatapos ay bumuo kami ng hanggang tugon ELIZA. 286 00:15:22,580 --> 00:15:26,040 Ipapakita namin magagawang gumawa na base tugon, 287 00:15:26,040 --> 00:15:28,370 tulad ng ginawa sa namin na "ang aking boss" halimbawa. 288 00:15:28,370 --> 00:15:30,970 289 00:15:30,970 --> 00:15:33,990 Kung iyon ang lahat na is-- kung ito ay isa lamang 290 00:15:33,990 --> 00:15:36,860 string na ako dapat na respond-- Maaari ko lamang ipadala ito pabalik out. 291 00:15:36,860 --> 00:15:40,610 Kung ito ay isang asterisk sa dulo ng mga ito, at pagkatapos ay makikita ko ang 292 00:15:40,610 --> 00:15:45,710 iproseso ang bawat indibidwal na token sa ang natitirang bahagi ng tugon ng gumagamit 293 00:15:45,710 --> 00:15:51,590 at magdagdag ng mga sa, pagpapalit out salita para sa salita bilang na kailangan upang ko. 294 00:15:51,590 --> 00:15:56,100 >> Ang lahat ng ito ay ganap na walang isang bagay na maaari kang bumuo ng. 295 00:15:56,100 --> 00:15:59,230 At sa katunayan, ang mga paraan kung saan tayo Mayroon naproseso argumento command line, 296 00:15:59,230 --> 00:16:03,570 ang paraan na kung saan ikaw ay may proseso sa pamamagitan ng mga kahilingan ng HTTP 297 00:16:03,570 --> 00:16:05,510 sundin ang parehong mga uri ng mga patakaran. 298 00:16:05,510 --> 00:16:08,220 Sila pagtutugma ng pattern. 299 00:16:08,220 --> 00:16:15,170 >> Kaya ELIZA ay nagkaroon ng isang medyo mahalaga epekto sa natural na wika 300 00:16:15,170 --> 00:16:21,620 dahil ginawa ito mukhang ito tulad ng ito ay isang very maaaring makamit ang layunin, tulad ng sa anumang paraan gusto namin 301 00:16:21,620 --> 00:16:25,550 magagawang lutasin nang direkta ang problemang ito. 302 00:16:25,550 --> 00:16:30,670 Ngayon, na hindi na kailangang sabihin na ELIZA ginagawa lahat ng bagay na nais nating gawin. 303 00:16:30,670 --> 00:16:33,710 Tiyak na hindi. 304 00:16:33,710 --> 00:16:35,660 Ngunit dapat namin magagawang upang gawin ang isang bagay na higit pa. 305 00:16:35,660 --> 00:16:38,280 306 00:16:38,280 --> 00:16:41,490 >> Ang aming mga unang hakbang upang pumunta lampas ELIZA ay pagpunta 307 00:16:41,490 --> 00:16:44,840 para ma-tingnan hindi text na ipinasok 308 00:16:44,840 --> 00:16:53,750 sa keyboard ngunit speech, aktwal speech naitala sa isang microphone. 309 00:16:53,750 --> 00:16:56,880 Kaya bilang tinitingnan namin ang mga iba't ibang mga piraso, hindi namin 310 00:16:56,880 --> 00:17:00,304 pagpunta sa may upang bumuo ng isang set ng mga modelo. 311 00:17:00,304 --> 00:17:02,970 Kami ay pagpunta sa may upang ma upang pumunta mula sa mababang antas ng tunog 312 00:17:02,970 --> 00:17:07,180 information-- pitch, malawak, frequency-- 313 00:17:07,180 --> 00:17:09,530 at convert na sa ilang mga yunit na hindi namin 314 00:17:09,530 --> 00:17:14,619 maaaring mas madaling manipulahin at, sa wakas, manipulahin ang mga ito 315 00:17:14,619 --> 00:17:18,609 sa mga salita at pangungusap. 316 00:17:18,609 --> 00:17:22,880 >> Kaya karamihan speech recognition sistema na ang mayroon ngayon 317 00:17:22,880 --> 00:17:26,069 sundin ang isang statistical modelo na kung saan bumuo namin 318 00:17:26,069 --> 00:17:35,090 tatlong magkakahiwalay na representasyon ng kung ano ang signal na audio ay naglalaman ng aktwal. 319 00:17:35,090 --> 00:17:38,640 Simulan namin na may isang phonetic model na pag-uusap lamang tungkol sa mga base 320 00:17:38,640 --> 00:17:41,250 tunog na ako ng paggawa. 321 00:17:41,250 --> 00:17:46,900 Ako ba ay paggawa ng isang bagay na isang B tulad ng sa batang lalaki o isang D tulad ng sa aso? 322 00:17:46,900 --> 00:17:53,220 Paano ko makikilala ang mga dalawang magkaibang telepono bilang hiwalay at natatangi? 323 00:17:53,220 --> 00:17:56,600 >> Sa itaas ng na, kami pagkatapos ay bumuo ng isang salita model pagbigkas, 324 00:17:56,600 --> 00:18:01,350 isang bagay na ang mga link nang sama-sama mga indibidwal na mga telepono 325 00:18:01,350 --> 00:18:04,724 at pinagsasama ang mga ito sa isang salita. 326 00:18:04,724 --> 00:18:07,890 At pagkatapos nito, kami ay kumuha ng mga salita at kami na magtipon ang mga ito sa isang wika 327 00:18:07,890 --> 00:18:13,010 modelo sa isang kumpletong pangungusap. 328 00:18:13,010 --> 00:18:17,230 >> Ngayon, kami ay pagpunta sa makipag-usap tungkol sa bawat sa mga nakapag-iisa at hiwalay. 329 00:18:17,230 --> 00:18:21,580 Ngunit ang tatlong mga modelo ay ang lahat ng lamang ang pagpunta sa mga istatistika. 330 00:18:21,580 --> 00:18:23,502 At na nangangahulugan na kapag kami gumana sa mga ito, ipapakita namin 331 00:18:23,502 --> 00:18:25,376 maaaring makapag-trabaho sa ito ang lahat nang sabay-sabay. 332 00:18:25,376 --> 00:18:28,100 333 00:18:28,100 --> 00:18:28,600 Lahat tama. 334 00:18:28,600 --> 00:18:30,890 Simulan natin sa ating mga phonetic model Hayaan. 335 00:18:30,890 --> 00:18:34,470 Kaya phonetic modelo umaasa sa isang computational pamamaraan 336 00:18:34,470 --> 00:18:37,320 tinatawag na hidden modelo Markov. 337 00:18:37,320 --> 00:18:43,050 Ang mga ito ay mga graphical na mga modelo na kung saan ako magkaroon at makilala ang isang estado ng mundo 338 00:18:43,050 --> 00:18:46,500 bilang nailalarawan sa pamamagitan ng isang hanay ng mga tampok. 339 00:18:46,500 --> 00:18:51,960 At na ang estado ay naglalarawan ng isang bahagi ng isang aksyon na ako ng pansin sa. 340 00:18:51,960 --> 00:19:00,190 >> Kaya kung sa tingin ko tungkol sa paggawa ang tunog "ma" tulad ng ina, 341 00:19:00,190 --> 00:19:03,970 mayroong iba't ibang sangkap sa na tunog. 342 00:19:03,970 --> 00:19:07,230 May isang bahagi kung saan gumuhit ako sa paghinga. 343 00:19:07,230 --> 00:19:09,560 At pagkatapos ay ako pitaka aking mga labi. 344 00:19:09,560 --> 00:19:13,710 At roll ko ang aking mga labi sa likod ng isang maliit na bit na gumawa na "ma" na tunog. 345 00:19:13,710 --> 00:19:15,340 At pagkatapos ay may isang release. 346 00:19:15,340 --> 00:19:17,020 Ang aking mga labi-iba. 347 00:19:17,020 --> 00:19:19,030 Air ay pinatalsik. 348 00:19:19,030 --> 00:19:22,650 "Ma." 349 00:19:22,650 --> 00:19:29,250 >> Yaong tatlong iba't-ibang bahagi ay kinakatawan ng mga estado sa graph-- 350 00:19:29,250 --> 00:19:33,420 sa simula, ang gitna, at ang wakas. 351 00:19:33,420 --> 00:19:38,060 At gusto ko may mga transition na pinapayagan ako sa paglalakbay mula sa isang estado 352 00:19:38,060 --> 00:19:42,260 sa susunod na may isang tiyak na posibilidad. 353 00:19:42,260 --> 00:19:47,250 Kaya, halimbawa, na ang M tunog ay maaaring magkaroon ng isang napaka, 354 00:19:47,250 --> 00:19:51,850 masyadong maikli ang paggamit sa beginning-- "mm" - at pagkatapos ay isang mas mahaba, 355 00:19:51,850 --> 00:19:55,640 vibratory phase kung saan ako humahawak sa aking labi na magkasama at halos humming-- 356 00:19:55,640 --> 00:20:05,090 "mmmm" - at pagkatapos ay isang napaka-ikling plowsib kung saan paalisin ko breath-- "ma." 357 00:20:05,090 --> 00:20:09,370 >> Ang mga nakatagong Markov modelong ito dinisenyo upang makuha ang katotohanan 358 00:20:09,370 --> 00:20:13,340 na ang paraan na gumawa ako ang tunog na "ma" ay pagpunta 359 00:20:13,340 --> 00:20:17,350 upang maging bahagyang naiiba sa timing nito, ay kadalasan, 360 00:20:17,350 --> 00:20:21,030 at mga tampok nito sa ang paraan na gagawin mo ito 361 00:20:21,030 --> 00:20:23,300 o ang paraan na maaaring ako gumawa ito kapag ako ng pakikipag-usap 362 00:20:23,300 --> 00:20:26,030 tungkol sa iba't ibang mga gumagamit ng sulat. 363 00:20:26,030 --> 00:20:33,240 "Ina" at "upang ako'y" kalooban tunog bahagyang naiiba. 364 00:20:33,240 --> 00:20:36,800 >> Kaya upang makilala ang isang partikular na tunog, gagawin namin 365 00:20:36,800 --> 00:20:42,020 bumuo ng mga modelo Markov, ang mga nakatagong Markov modelo, ng lahat ng posibleng phone na ako 366 00:20:42,020 --> 00:20:45,840 maaaring gusto mong makilala, lahat ng posibleng tunog, 367 00:20:45,840 --> 00:20:49,750 at pagkatapos ay tingnan ang acoustic data na mayroon akong 368 00:20:49,750 --> 00:20:54,430 at matukoy ang istatistika kung saan ang isa ay ang pinaka-malamang na 369 00:20:54,430 --> 00:20:58,110 na magkaroon ng ginawa ang tunog. 370 00:20:58,110 --> 00:20:58,610 SIGE. 371 00:20:58,610 --> 00:21:01,540 372 00:21:01,540 --> 00:21:06,750 Gamit na modelo, kami ay pagkatapos magsimula na magtayo sa ibabaw ng mga ito. 373 00:21:06,750 --> 00:21:09,330 Kumuha kami ng isang modelong pagbigkas. 374 00:21:09,330 --> 00:21:11,790 Ngayon, paminsan-minsan sa pagbigkas modelo ay simple at madaling 375 00:21:11,790 --> 00:21:14,440 dahil may isa lamang paraan sa pagbigkas ng isang bagay. 376 00:21:14,440 --> 00:21:17,990 Iba pang mga beses, na ang mga ito ng isang maliit na kaunti pang kumplikado. 377 00:21:17,990 --> 00:21:21,340 Narito ang isang gabay sa pagbigkas para na red bagay na 378 00:21:21,340 --> 00:21:25,210 isang prutas na gumawa ka ng ketchup sa labas ng. 379 00:21:25,210 --> 00:21:27,360 Mga tao ay hindi sa tingin ito ay isang prutas. 380 00:21:27,360 --> 00:21:27,860 Right? 381 00:21:27,860 --> 00:21:30,880 382 00:21:30,880 --> 00:21:35,300 >> Ngayon, may mga maraming iba't ibang paraan na ang mga tao ay bigkasin ang salitang ito. 383 00:21:35,300 --> 00:21:37,780 Ang ilan ay sabihin "daliri sa paa-may-daliri." 384 00:21:37,780 --> 00:21:40,880 Ang ilan ay sabihin "daliri-mah-daliri sa paa." 385 00:21:40,880 --> 00:21:44,800 At maaari naming makuha na may isa sa mga graphical na mga modelo 386 00:21:44,800 --> 00:21:48,305 kung saan, muli, kami ay kumakatawan sa mga transition tulad ng pagkakaroon ng isang tiyak na posibilidad 387 00:21:48,305 --> 00:21:51,360 at ang kaugnay na bagay na maaaring mangyari sa kanila. 388 00:21:51,360 --> 00:21:58,290 >> Kaya sa kasong ito, kung ako ay upang sundin tuktok na ruta sa pamamagitan ng buong graph, 389 00:21:58,290 --> 00:22:03,330 Gusto ko ay nagsisimula sa titik na sa malayong kaliwa, ang "salamat" na tunog. 390 00:22:03,330 --> 00:22:07,570 Gusto kong kunin ang top half, ang "oh," at pagkatapos ay isang "ma," 391 00:22:07,570 --> 00:22:14,530 at pagkatapos ng isang "ng," at pagkatapos ay isang "salamat," at isang "oh." "Daliri ng paa-maaaring-daliri sa paa." 392 00:22:14,530 --> 00:22:19,610 Kung kinuha ko sa ilalim na landas sa pamamagitan ng ito, ako ay makakuha ng "ta-mah-daliri sa paa." 393 00:22:19,610 --> 00:22:26,810 At kung bumaba ako at pagkatapos ay up, nais kong makakuha ng "ta-maaaring-daliri sa paa." 394 00:22:26,810 --> 00:22:29,950 >> Ang mga modelo na makuha ang mga pagkakaiba dahil sa tuwing 395 00:22:29,950 --> 00:22:32,410 lumawak namin ng isa sa mga sistema ng pagkilala, 396 00:22:32,410 --> 00:22:35,340 ito ay pagpunta sa may sa trabaho sa maraming iba't ibang mga uri ng mga tao, 397 00:22:35,340 --> 00:22:39,295 maraming iba't ibang mga punto, at kahit na iba't-ibang mga gumagamit ng parehong salita. 398 00:22:39,295 --> 00:22:42,204 399 00:22:42,204 --> 00:22:44,120 Sa wakas, sa tuktok ng na, kami bumuo ng isang bagay 400 00:22:44,120 --> 00:22:48,780 na mukhang tunay kumplikado, tinatawag na ang modelo ng wika, 401 00:22:48,780 --> 00:22:52,950 ngunit sa katunayan ay ang pinakasimpleng ng ang tatlong dahil ang mga ito gumana 402 00:22:52,950 --> 00:22:56,041 sa kung ano ang tinatawag n-gram modelo. 403 00:22:56,041 --> 00:23:02,270 At sa kasong ito, ako nagpapakita sa iyo isang dalawang-bahagi n-gram modelo, isang Bigram. 404 00:23:02,270 --> 00:23:08,910 Kami ay pagpunta sa gumawa ng pisikal na mga ideya na kung minsan, ang ilang mga salita ay 405 00:23:08,910 --> 00:23:14,680 mas malamang na sundin ang isang ibinigay na salita kaysa sa iba. 406 00:23:14,680 --> 00:23:25,210 Kung sinabi ko lang "taya ng panahon," ang susunod na salita ay malamang na "ngayon" 407 00:23:25,210 --> 00:23:31,510 o maaaring maging "ang panahon forecast bukas. " 408 00:23:31,510 --> 00:23:38,870 Ngunit ito ay malamang na hindi maging "ang forecast ng panahon artichoke. " 409 00:23:38,870 --> 00:23:42,980 >> Ano ang ginagawa ng isang modelo na wika ay nakukuha nito ang mga istatistika 410 00:23:42,980 --> 00:23:47,450 sa pamamagitan ng pagbibilang, mula sa ilang mga napakalaking corpus, ang lahat ng mga pangyayari 411 00:23:47,450 --> 00:23:50,890 na kung saan ang isang salita ay sumusunod sa isa pa. 412 00:23:50,890 --> 00:23:54,300 Kaya kung kumuha ako ng isang malaking corpus-- tulad ng bawat Wall Street Journal 413 00:23:54,300 --> 00:24:00,750 na ito ay inilathala mula noong 1930, na kung saan ay ang isa sa mga standard corpuses-- 414 00:24:00,750 --> 00:24:03,910 at ako ay tumingin sa pamamagitan ng lahat text na iyon, at bilangin ko 415 00:24:03,910 --> 00:24:09,770 up kung gaano karaming beses pagkatapos "forecast" ako nakakakita ng "ngayon" 416 00:24:09,770 --> 00:24:17,454 at kung gaano karaming beses na ako nakakakita "forecast" na sinusundan ng "artichoke," 417 00:24:17,454 --> 00:24:19,370 ang unang isa ay pagpunta upang maging mas malamang. 418 00:24:19,370 --> 00:24:21,540 Ito ay pagpunta sa lumitaw ang malayo mas madalas. 419 00:24:21,540 --> 00:24:24,610 At kaya ito ay may isang mas mataas na bagay na maaaring mangyari kaugnay nito. 420 00:24:24,610 --> 00:24:27,340 >> Kung gusto kong malaman kung ang posibilidad ng isang buong pananalita, 421 00:24:27,340 --> 00:24:29,940 pagkatapos, masira ko lang ito up. 422 00:24:29,940 --> 00:24:35,990 Kaya ang posibilidad ng pagdinig ang pangungusap "ang daga ate cheese" 423 00:24:35,990 --> 00:24:39,110 ay ang probabilidad ng salita "ang" simula ng isang pangungusap, 424 00:24:39,110 --> 00:24:42,540 at pagkatapos ay ang posibilidad na ang mga salitang "daga" ay sumusunod sa salitang "mga," 425 00:24:42,540 --> 00:24:44,910 at ang posibilidad na ang mga salitang "ate" sumusunod "daga," 426 00:24:44,910 --> 00:24:51,120 at ang posibilidad na ang "cheese" sumusunod "ay kumain." 427 00:24:51,120 --> 00:24:55,160 >> Ito tunog tulad ng isang pulutong ng mga statistics, ang isang pulutong ng mga probabilidad. 428 00:24:55,160 --> 00:24:57,510 At na ang lahat na ito ay. 429 00:24:57,510 --> 00:25:02,920 Ngunit ang kamangha-manghang mga bagay ay kung gagawin mo ito na may isang malaking sapat na sample ng data, 430 00:25:02,920 --> 00:25:03,670 Gumagana siya. 431 00:25:03,670 --> 00:25:05,250 At ito ay gumagana tremendously na rin. 432 00:25:05,250 --> 00:25:07,810 433 00:25:07,810 --> 00:25:11,420 Alam namin ang lahat ng mga teknolohiyang ito. 434 00:25:11,420 --> 00:25:16,500 Karamihan sa mga operating system ang sumama sa pagkilala ng boses sa puntong ito. 435 00:25:16,500 --> 00:25:20,940 Ginagamit namin ang Siri at Cortana at Echo. 436 00:25:20,940 --> 00:25:25,070 At ang mga bagay ay batay sa sa ganitong uri ng tatlong-layer model-- 437 00:25:25,070 --> 00:25:30,620 isang phonetic modelo sa ibaba, ang isang pagbigkas model sa gitna, 438 00:25:30,620 --> 00:25:33,690 at isang modelo ng wika sa itaas ng mga ito. 439 00:25:33,690 --> 00:25:37,630 >> Ngayon, mayroon sila upang makagawa ng higit pa sa isang maliit na piraso sa na upang sagutin ang mga katanungan. 440 00:25:37,630 --> 00:25:43,000 Ngunit ang pagkilala sa kung ano ang iyong kasabihan eksakto depende sa na. 441 00:25:43,000 --> 00:25:45,700 Kaya natin ang isang halimbawa dito. 442 00:25:45,700 --> 00:25:52,020 Kaya ko ang aking phone sitting up dito sa ilalim ng mga dokumento camera. 443 00:25:52,020 --> 00:25:56,110 At kami ay pagpunta sa nagtatanong Siri ng ilang katanungan. 444 00:25:56,110 --> 00:25:57,150 Lahat tama? 445 00:25:57,150 --> 00:25:59,940 >> Kaya ni gisingin ang aking phone dito. 446 00:25:59,940 --> 00:26:02,710 447 00:26:02,710 --> 00:26:05,000 Siri, kung ano ang lagay ng panahon tulad ng sa New Haven ngayon? 448 00:26:05,000 --> 00:26:07,670 449 00:26:07,670 --> 00:26:10,780 >> SIRI: Narito ang lagay ng panahon para New Haven, Connecticut ngayon. 450 00:26:10,780 --> 00:26:11,890 >> BRIAN SCASSELLATI: OK. 451 00:26:11,890 --> 00:26:16,720 Na nakita mo Kaya una na kinikilala Siri bawat isa sa mga indibidwal na mga salita 452 00:26:16,720 --> 00:26:19,050 at pagkatapos ay ginawa ng isang tugon. 453 00:26:19,050 --> 00:26:22,277 Susubukan naming makipag-usap tungkol sa kung paano na tugon dumating ang tungkol sa ilang sandali. 454 00:26:22,277 --> 00:26:24,110 Ngunit ngayon na ang alam namin na ito ay batay lamang 455 00:26:24,110 --> 00:26:28,880 sa raw na mga istatistika at ito pattern na tumutugma sa uri ng mga diskarte, 456 00:26:28,880 --> 00:26:31,120 Maaari naming i-play ang ilang mga laro na may Siri. 457 00:26:31,120 --> 00:26:34,560 >> Kaya ang maaari kong subukan muli. 458 00:26:34,560 --> 00:26:38,864 Siri, kung ano ang lagay ng panahon hippopotamus New Haven, ngayon? 459 00:26:38,864 --> 00:26:39,810 >> SIRI: OK. 460 00:26:39,810 --> 00:26:44,245 Narito ang mga taya ng panahon para sa mga Bagong Haven, Connecticut para sa araw na ito. 461 00:26:44,245 --> 00:26:46,120 BRIAN SCASSELLATI: Siri hindi daunted sa pamamagitan ng na 462 00:26:46,120 --> 00:26:50,980 dahil ito ay matatagpuan sa pattern-- "panahon," "ngayon," "New Haven." 463 00:26:50,980 --> 00:26:54,420 Iyon ay kung ano ito ay pagtugon na, gusto lamang ELIZA. 464 00:26:54,420 --> 00:26:54,920 Lahat tama. 465 00:26:54,920 --> 00:26:59,390 Sabihin bigyan ito ng isa pang kahit Ipaalam mas nakakatawa halimbawa. 466 00:26:59,390 --> 00:27:03,075 Siri, panahon artichoke armadillo hippopotamus New Haven? 467 00:27:03,075 --> 00:27:06,806 468 00:27:06,806 --> 00:27:08,400 >> SIRI: Hayaan akong i-check sa mga iyon. 469 00:27:08,400 --> 00:27:11,280 Narito kung ano ang nakita ko sa web para sa kung ano ang mga artichokes Armadillo 470 00:27:11,280 --> 00:27:13,780 hippopotamus New Haven. 471 00:27:13,780 --> 00:27:14,760 >> BRIAN SCASSELLATI: OK. 472 00:27:14,760 --> 00:27:20,400 Kaya kung malayo sapat pumunta ako ang layo mula sa modelong ito, 473 00:27:20,400 --> 00:27:24,365 Ako makakapag-lituhin ang mga ito dahil ito ay walang na tumutugma sa mga pattern na ito ay may. 474 00:27:24,365 --> 00:27:27,370 475 00:27:27,370 --> 00:27:29,390 At na statistical engine na sinasabi, 476 00:27:29,390 --> 00:27:32,850 kung ano ang mga posibilidad na mayroon ka ang mga salitang hippopotamus at artichoke 477 00:27:32,850 --> 00:27:34,440 sama-sama, at armadilyo? 478 00:27:34,440 --> 00:27:36,050 Iyon ay nakuha na ng isang bagong bagay. 479 00:27:36,050 --> 00:27:38,840 480 00:27:38,840 --> 00:27:40,610 >> Kaya ang mga teknolohiya na ginagamit namin araw-araw. 481 00:27:40,610 --> 00:27:43,670 482 00:27:43,670 --> 00:27:47,800 Kung nais namin na kunin ang mga ito sa isang hakbang karagdagang, bagaman, kung namin talagang 483 00:27:47,800 --> 00:27:53,930 nais na magagawang makipag-usap tungkol sa kung ano ito ay na ang mga sistema ay pagtugon sa, 484 00:27:53,930 --> 00:28:00,630 mayroon kaming makipag-usap, muli, tungkol sa isang mas pangunahing hanay ng mga katanungan. 485 00:28:00,630 --> 00:28:05,370 At iyon ay isang paksa sa komunikasyon na tinatawag naming tanong pagsagot. 486 00:28:05,370 --> 00:28:07,028 Iyon ay, gusto naming ma to-- oo? 487 00:28:07,028 --> 00:28:07,944 Madla: [hindi marinig]. 488 00:28:07,944 --> 00:28:10,789 489 00:28:10,789 --> 00:28:13,330 BRIAN SCASSELLATI: Huwag makuha namin sa latent semantic processing? 490 00:28:13,330 --> 00:28:14,070 Kaya yes. 491 00:28:14,070 --> 00:28:17,820 May isang pulutong ng mga bagay na nangyayari sa ibaba ng ibabaw na may Siri 492 00:28:17,820 --> 00:28:20,210 at sa ilan sa mga halimbawa Pupunta ako upang ipakita sa iyo sa susunod 493 00:28:20,210 --> 00:28:22,610 kung saan may ganap ng isang piraso sa mga tuntunin ng istraktura 494 00:28:22,610 --> 00:28:25,260 ng kung ano ang iyong sinasabi na mahalaga. 495 00:28:25,260 --> 00:28:31,890 At, sa katunayan, iyon ay isang mahusay na pasimula para sa susunod na slide para sa akin. 496 00:28:31,890 --> 00:28:35,110 >> Kaya sa parehong paraan na ang aming speech recognition ay itinayo up 497 00:28:35,110 --> 00:28:39,620 ng maramihang mga layer, kung gusto naming maunawaan kung ano ito ay na ay aktwal na 498 00:28:39,620 --> 00:28:44,620 pagiging sinabi, kami muli ng pagpunta sa umasa sa isang pagtatasa ng multi-layer 499 00:28:44,620 --> 00:28:47,020 ng teksto na na-recognize. 500 00:28:47,020 --> 00:28:52,560 Kaya kapag aktwal Siri ay may kakayahan upang sabihin nating, tumingin natagpuan ko ang mga salitang ito. 501 00:28:52,560 --> 00:28:55,230 Ngayon kung ano ang gagawin ko sa kanila? 502 00:28:55,230 --> 00:28:59,110 Ang unang bahagi ay madalas na pumunta sa pamamagitan ng at subukan upang pag-aralan 503 00:28:59,110 --> 00:29:03,010 ang istraktura ng pangungusap. 504 00:29:03,010 --> 00:29:05,410 At sa kung ano ang nasaksihan namin sa mababang paaralan, madalas, 505 00:29:05,410 --> 00:29:08,920 bilang uri ng balangkas pangungusap, kami ay pagpunta 506 00:29:08,920 --> 00:29:12,774 upang makilala na ang mga tiyak na mga salita ay may tiyak na mga tungkulin. 507 00:29:12,774 --> 00:29:13,440 Ang mga ito ay mga pangngalan. 508 00:29:13,440 --> 00:29:14,231 Ang mga ito ay mga panghalip. 509 00:29:14,231 --> 00:29:16,200 Ang mga ito ay mga pandiwa. 510 00:29:16,200 --> 00:29:19,460 At kami ay pagpunta upang makilala na para sa isang partikular na grammar, 511 00:29:19,460 --> 00:29:24,700 sa kasong ito English grammar, may mga wastong mga paraan kung saan maaari kong pagsamahin ang mga ito 512 00:29:24,700 --> 00:29:26,280 at iba pang mga paraan na hindi wasto. 513 00:29:26,280 --> 00:29:29,920 514 00:29:29,920 --> 00:29:33,870 >> Pagkilala Na, istraktura na, maaaring hindi sapat upang makatulong sa gabay sa amin 515 00:29:33,870 --> 00:29:36,720 kaunti lamang. 516 00:29:36,720 --> 00:29:39,820 Ngunit ito ay hindi pa sapat para sa amin na ma-bigyan 517 00:29:39,820 --> 00:29:43,290 anumang mga kahulugan sa kung ano ang sinabi dito. 518 00:29:43,290 --> 00:29:46,615 Upang magawa iyon, kami ay may sa umasa sa ilang mga halaga ng semantic processing. 519 00:29:46,615 --> 00:29:49,590 520 00:29:49,590 --> 00:29:55,080 Iyon ay, kami ay pagpunta sa may upang tumingin sa ilalim kung ano ang bawat isa sa mga salita 521 00:29:55,080 --> 00:29:57,400 talagang nagdadala bilang kahulugan. 522 00:29:57,400 --> 00:30:01,150 At sa pinakasimpleng paraan ng paggawa nito, kami ay pagpunta sa iugnay sa bawat salita 523 00:30:01,150 --> 00:30:06,930 na alam namin ang isang tiyak na function, isang tiyak na pagbabagong-anyo na ito 524 00:30:06,930 --> 00:30:09,300 ay nagbibigay-daan sa mangyayari. 525 00:30:09,300 --> 00:30:14,470 >> Sa kasong ito, maaari naming lagyan ng label ang salitang "John" bilang isang wastong pangalan, 526 00:30:14,470 --> 00:30:18,160 na ito nagdadala sa mga ito ng isang identity. 527 00:30:18,160 --> 00:30:21,530 At maaari naming label "Mary" bilang ang parehong paraan. 528 00:30:21,530 --> 00:30:27,900 Sapagkat ang isang pandiwa tulad ng "nagmamahal," na bumubuo ng isang partikular na relasyon 529 00:30:27,900 --> 00:30:31,582 na hindi namin magagawang upang kumatawan. 530 00:30:31,582 --> 00:30:33,290 Ngayon, na ay hindi nangangahulugan na na naiintindihan namin 531 00:30:33,290 --> 00:30:37,680 ano ang ibig ay ngunit lamang na naiintindihan namin ito sa paraan ng isang symbolic system. 532 00:30:37,680 --> 00:30:40,480 Iyon ay, maaari naming label ito at manipulahin ito. 533 00:30:40,480 --> 00:30:44,230 534 00:30:44,230 --> 00:30:49,120 >> Sa bawat isa sa mga uri ng mga approach na ito, anumang uri ng semantic processing 535 00:30:49,120 --> 00:30:57,060 dito ay pagpunta sa nangangailangan ng isang maliit na piraso ng kaalaman at ng maraming trabaho 536 00:30:57,060 --> 00:30:59,020 sa aming bahagi. 537 00:30:59,020 --> 00:31:03,590 Humihingi kami ng hindi na sa kaharian kung saan lamang payak na mga istatistika 538 00:31:03,590 --> 00:31:07,320 ay magiging sapat na para sa amin. 539 00:31:07,320 --> 00:31:11,330 Ngayon, upang pumunta mula sa puntong ito sa pagiging 540 00:31:11,330 --> 00:31:15,520 makapag-usap tungkol sa loob ng kung ano ang aktwal na nangyayari dito, 541 00:31:15,520 --> 00:31:19,640 sa pagiging magagawang upang manipulahin ang buuin at maunawaan ng isang katanungan 542 00:31:19,640 --> 00:31:23,160 at pagkatapos ng kakayahang upang pumunta sa labas at sa paghahanap, 543 00:31:23,160 --> 00:31:27,290 na nangangailangan ng isang mas complex na nagbibigay-malay na modelo. 544 00:31:27,290 --> 00:31:34,880 >> Ang paraan kung saan ang mga sistema ay binuo ay para sa pinaka-bahagi tunay, tunay labor 545 00:31:34,880 --> 00:31:36,350 intensive. 546 00:31:36,350 --> 00:31:39,490 Sila ay kasangkot sa mga tao paggastos ng isang mahusay na pakikitungo 547 00:31:39,490 --> 00:31:44,100 ng time-iistraktura ang mga paraan kung kung saan ang mga uri ng mga pangungusap 548 00:31:44,100 --> 00:31:47,270 maaaring katawanin sa ilang logic. 549 00:31:47,270 --> 00:31:51,639 550 00:31:51,639 --> 00:31:53,430 Ito ay makakakuha ng kahit na isang maliit mas kumplikado, bagaman. 551 00:31:53,430 --> 00:31:56,400 552 00:31:56,400 --> 00:31:59,660 >> Kahit na minsan ang aming dealt may semantics, bibigyan namin ng 553 00:31:59,660 --> 00:32:03,860 mayroon pa rin upang tingnan ang pragmatics ng kung ano ang sinabi. 554 00:32:03,860 --> 00:32:08,620 Iyon ay, kung gaano nauugnay ang ko ang mga salita na kung ang isang bagay kong pisikal out 555 00:32:08,620 --> 00:32:12,054 doon sa mundo o sa hindi bababa sa ilang impormasyon sa pinagmulan 556 00:32:12,054 --> 00:32:12,970 na maaari kong manipulahin? 557 00:32:12,970 --> 00:32:15,780 558 00:32:15,780 --> 00:32:20,790 >> Minsan, ang mga humantong sa kahanga-hangang mga piraso ng kalabuan. 559 00:32:20,790 --> 00:32:24,470 "Red-hot star sa ikasal astronomer." 560 00:32:24,470 --> 00:32:25,630 SIGE. 561 00:32:25,630 --> 00:32:28,540 Ngayon, mababasa natin na bilang ng nakakatawa uri ng headline 562 00:32:28,540 --> 00:32:34,690 na gusto namin makita sa late night TV dahil hindi namin bigyang-kahulugan ang "star" 563 00:32:34,690 --> 00:32:38,630 na magkaroon nito celestial body kahulugan. 564 00:32:38,630 --> 00:32:43,390 Alam namin na ito ay nangangahulugan na ang mas maraming pangkaraniwan artista o artista 565 00:32:43,390 --> 00:32:45,240 na may mataas na halaga ng visibility. 566 00:32:45,240 --> 00:32:47,770 567 00:32:47,770 --> 00:32:51,950 >> "Nagpapaputok tumutulong kagat ng aso biktima." 568 00:32:51,950 --> 00:32:55,550 Ay ito na ang pulutong ay talagang out there pagtulong ng aso 569 00:32:55,550 --> 00:32:59,620 sa pagpunta sa paligid at masakit sa mga biktima? 570 00:32:59,620 --> 00:33:02,380 O ito na nagkaroon isang indibidwal na 571 00:33:02,380 --> 00:33:04,625 makagat ng isang aso na kailangan ng tulong? 572 00:33:04,625 --> 00:33:07,650 573 00:33:07,650 --> 00:33:11,480 Lamang mula sa pagtingin sa mga syntax at ang semantics ng mga pangungusap, 574 00:33:11,480 --> 00:33:14,660 hindi namin matukoy na. 575 00:33:14,660 --> 00:33:22,000 >> "Helicopter pinalakas sa pamamagitan ng tao lilipad." 576 00:33:22,000 --> 00:33:27,330 Mayroon bang mga, sa katunayan, ang aktwal na maliit na bagay na lumilipad sa paligid na 577 00:33:27,330 --> 00:33:34,510 ay ang mga taong may pakpak powering helicopter para sa kabutihan ng sangkatauhan? 578 00:33:34,510 --> 00:33:38,960 O kaya ay may isa makina aparato na Nakukuha ng kanyang kapangyarihan mula sa tao? 579 00:33:38,960 --> 00:33:41,600 580 00:33:41,600 --> 00:33:46,500 >> Kapag tumingin kami sa mga tanong pagsagot sistema, 581 00:33:46,500 --> 00:33:51,110 ang mga ito ay ang mga layer na kailangan naming harapin. 582 00:33:51,110 --> 00:33:54,890 Ngayon, ang mga pinakamahusay at ang pinaka-uri-uriin ng kalat ng mga sistema 583 00:33:54,890 --> 00:34:00,640 araw na ito ay maaaring gawin mga bagay-bagay sa isang antas na 584 00:34:00,640 --> 00:34:05,050 malayo sa kung ano kami ay 10 taon na ang nakakaraan. 585 00:34:05,050 --> 00:34:08,210 Narito ang isa sa mga pinakamahusay na mga sistema na ang mayroon ngayon. 586 00:34:08,210 --> 00:34:10,519 At ito ay isang sistema mula sa IBM tinatawag Watson. 587 00:34:10,519 --> 00:34:13,040 588 00:34:13,040 --> 00:34:15,500 Ito ay mula sa aming mga kaibigan sa IBM. 589 00:34:15,500 --> 00:34:19,810 Ito ang Katherine bangko, Jia Chen, at Priscilla Moraes pagbigay sa amin 590 00:34:19,810 --> 00:34:26,323 isang pagtatanghal ng Watson kahapon sa IBM Yorktown. 591 00:34:26,323 --> 00:34:26,989 [Playback ng video] 592 00:34:26,989 --> 00:34:27,690 -Kamusta ka na? 593 00:34:27,690 --> 00:34:30,600 594 00:34:30,600 --> 00:34:31,980 >> -Ako ay mabuti. 595 00:34:31,980 --> 00:34:35,429 Ako ay laging masaya kapag ako pag-iisip, lalo na kapag ako 596 00:34:35,429 --> 00:34:38,920 maaaring manatili cool na sa mga rooms server. 597 00:34:38,920 --> 00:34:40,170 -Sino Iyong mga paboritong artista? 598 00:34:40,170 --> 00:34:43,870 599 00:34:43,870 --> 00:34:47,555 >> -Ang Aking paboritong artista Jolie bilang Lara Croft 600 00:34:47,555 --> 00:34:54,800 sa nitso ang sumasalakay dahil ang kanyang orihinal na anyo ay bilang isang virtual na character tulad ng sa akin. 601 00:34:54,800 --> 00:34:56,760 >> -kung Makakatulong Watson pasyente? 602 00:34:56,760 --> 00:34:59,700 603 00:34:59,700 --> 00:35:03,755 >> -Ang Plano para sa mga pasyente sa may access sa Watson direkta? 604 00:35:03,755 --> 00:35:08,050 Access sa Watson advisory aplikasyon ay mag-iiba sa pamamagitan ng paggamit kaso. 605 00:35:08,050 --> 00:35:12,630 Ngunit sa kasalukuyan, Watson ay magbibigay lamang posibleng diagnosis at paggamot 606 00:35:12,630 --> 00:35:14,725 mga opsyon sa mga medikal na propesyonal. 607 00:35:14,725 --> 00:35:17,680 Kung saan naaangkop, ang mga pasyente Maaaring magbigay ng impormasyon 608 00:35:17,680 --> 00:35:21,210 sa Watson, marahil sa pamamagitan ng isang portal web interface, tablet, 609 00:35:21,210 --> 00:35:23,500 o kahit na isang mobile phone. 610 00:35:23,500 --> 00:35:27,180 Halimbawa, ang isang pasyente ay maaaring tinanong upang ilarawan ang kanilang mga sintomas 611 00:35:27,180 --> 00:35:30,460 sa natural na wika direkta sa isang Watson solusyon, 612 00:35:30,460 --> 00:35:34,050 na nagpapahintulot sa mga manggagamot upang tumutok sa diyagnosis at hindi pangongolekta ng data. 613 00:35:34,050 --> 00:35:38,379 614 00:35:38,379 --> 00:35:42,716 >> -Sino Pinaslang Abraham Lincoln? 615 00:35:42,716 --> 00:35:46,153 >> Juan Wilkes Booth. 616 00:35:46,153 --> 00:35:52,373 >> -Sa Anong taon ginawa ng Arizona Diamondbacks mapanalunan ang World Series? 617 00:35:52,373 --> 00:35:55,295 >> -2001. 618 00:35:55,295 --> 00:35:58,710 >> [END playback] 619 00:35:58,710 --> 00:36:01,610 >> BRIAN SCASSELLATI: So ang mga uri ng mga sistema ng 620 00:36:01,610 --> 00:36:07,430 kung umasa sa una sa lahat Kinikilala ang pagsasalita; second, 621 00:36:07,430 --> 00:36:12,200 convert ito sa isang makabuluhan na panloob representasyon; at pagkatapos, third, 622 00:36:12,200 --> 00:36:17,090 kawalan ng kakayahang lumabas at maghanap ang pinagmulan ng impormasyon na 623 00:36:17,090 --> 00:36:21,140 ay nagbibigay-daan sa kanila upang sagutin ang tanong na iyon. 624 00:36:21,140 --> 00:36:27,320 Ang antas ng pagiging kumplikado ay nagsasangkot ang parehong mga uri ng program na bagay 625 00:36:27,320 --> 00:36:31,790 na ikaw ay ginagawa sa hanay ng problema. 626 00:36:31,790 --> 00:36:38,000 >> Nagawa naming upang i-parse ng mga kahilingan ng HTTP in ang parehong uri ng pattern mababang antas ng 627 00:36:38,000 --> 00:36:40,810 matching na maaaring gawin ELIZA. 628 00:36:40,810 --> 00:36:45,070 Humihingi kami makapag-convert ng mga sa isang panloob na representasyon, 629 00:36:45,070 --> 00:36:50,360 at pagkatapos ay gamitin ang mga ito para sa mga tanong ng ilang panlabas na database, posibleng gamit SQL. 630 00:36:50,360 --> 00:36:53,530 631 00:36:53,530 --> 00:36:56,260 Ang lahat ng mga sistema na ay binuo ngayon 632 00:36:56,260 --> 00:37:00,520 upang gawin ito uri ng likas na komunikasyon wika 633 00:37:00,520 --> 00:37:04,100 ay nakatayo sa ang mga parehong prinsipyo. 634 00:37:04,100 --> 00:37:09,530 >> Ngayon, kahit na ang isang sistema tulad ng Watson ay hindi sapat complex 635 00:37:09,530 --> 00:37:14,820 upang ma-sagot arbitrary mga katanungan tungkol sa anumang paksa. 636 00:37:14,820 --> 00:37:20,060 At sa katunayan, sila ay maging nakabalangkas sa loob ng isang naibigay na domain. 637 00:37:20,060 --> 00:37:24,440 Kaya maaari kang pumunta sa online at maaari mong mahanap ang mga bersyon ng Watson na gumana ng mabuti 638 00:37:24,440 --> 00:37:27,700 sa loob ng informatics medikal. 639 00:37:27,700 --> 00:37:31,490 O may isa online na lamang ang trato sa kung paano 640 00:37:31,490 --> 00:37:34,540 upang gumawa ng magandang mga rekomendasyon tungkol sa kung ano ang beer ay pumunta sa kung saan ang pagkain. 641 00:37:34,540 --> 00:37:37,060 642 00:37:37,060 --> 00:37:41,870 At sa loob ng mga domain, maaari itong sagutin ang mga katanungan, 643 00:37:41,870 --> 00:37:46,130 mahanap ang impormasyon na kailangan nito. 644 00:37:46,130 --> 00:37:48,270 >> Ngunit hindi mo maaaring ihalo at itugma ang mga ito. 645 00:37:48,270 --> 00:37:53,150 Ang sistema na na-sanay sa database ng mga pagkain at beer 646 00:37:53,150 --> 00:37:56,830 ay hindi gumagana ng mabuti kapag ikaw ay biglang ilagay ito sa sa mga medikal na informatics 647 00:37:56,830 --> 00:37:59,770 database. 648 00:37:59,770 --> 00:38:05,680 Kaya kahit na ang aming pinakamahusay na mga sistema ng araw umasa sa isang antas ng processing 649 00:38:05,680 --> 00:38:11,570 kung saan tayo ay hand coding at gusali sa imprastraktura upang 650 00:38:11,570 --> 00:38:13,275 upang gumawa ng run ang system na ito. 651 00:38:13,275 --> 00:38:16,360 652 00:38:16,360 --> 00:38:20,710 >> Ngayon, ang huling topic na gusto ko para ma-makapunta sa araw na ito 653 00:38:20,710 --> 00:38:23,960 ay tungkol sa nonverbal komunikasyon. 654 00:38:23,960 --> 00:38:29,290 Ang isang mahusay na mass ng mga impormasyon na naming makipag-usap sa bawat isa 655 00:38:29,290 --> 00:38:35,490 ay hindi dumating tungkol sa pamamagitan ng indibidwal na mga salita na namin ang pag-aaplay. 656 00:38:35,490 --> 00:38:40,290 Ito ay may kinalaman sa mga bagay tulad ng proximity, tumitig, ang iyong mga tono ng boses, 657 00:38:40,290 --> 00:38:42,270 ang iyong pagbabago ng tono. 658 00:38:42,270 --> 00:38:46,620 At na komunikasyon ay din isang bagay na maraming iba't ibang mga interface 659 00:38:46,620 --> 00:38:49,960 pag-aalaga ng isang mahusay na pakikitungo tungkol sa. 660 00:38:49,960 --> 00:38:51,500 Ito ay hindi kung ano ang nagmamalasakit Siri tungkol sa. 661 00:38:51,500 --> 00:38:56,250 Maaari ko bang hilingin sa Siri isang bagay sa iisang tinig o sa ibang tono ng boses, 662 00:38:56,250 --> 00:38:59,840 at Siri pupuntahan bigyan ako ang parehong sagot. 663 00:38:59,840 --> 00:39:05,260 Ngunit iyon ay hindi kung ano ang bumuo namin para sa marami pang ibang mga uri ng mga interface. 664 00:39:05,260 --> 00:39:09,120 >> Gusto kong ipakilala sa iyo ngayon sa isa sa mga robots. 665 00:39:09,120 --> 00:39:12,720 Ito ay binuo sa pamamagitan ng aking matagal nang kaibigan at kasamahan Cynthia 666 00:39:12,720 --> 00:39:16,010 Breazeal at ang kanyang kumpanya jibo. 667 00:39:16,010 --> 00:39:20,090 At ito robot-- kami ay pagpunta na magkaroon ng isang pares ng mga boluntaryo 668 00:39:20,090 --> 00:39:22,520 lumapit upang makipag-ugnayan sa mga ito. 669 00:39:22,520 --> 00:39:26,200 Kaya maaari mayroon akong dalawang mga taong handang upang i-play sa mga robot para sa akin? 670 00:39:26,200 --> 00:39:29,936 Bakit hindi ka dumating sa up, at bakit hindi ka dumating sa up. 671 00:39:29,936 --> 00:39:31,310 Kung gusto mong sumali up ako dito, please. 672 00:39:31,310 --> 00:39:36,520 673 00:39:36,520 --> 00:39:39,670 >> At kung ako ay maaaring mayroon ka dumating karapatan sa paglipas dito. 674 00:39:39,670 --> 00:39:40,170 Salamat. 675 00:39:40,170 --> 00:39:40,480 Hi. 676 00:39:40,480 --> 00:39:41,400 >> ALFREDO: Masaya akong makilala kayo. 677 00:39:41,400 --> 00:39:42,010 Alfredo. 678 00:39:42,010 --> 00:39:42,520 >> BRIAN SCASSELLATI: Alfredo. 679 00:39:42,520 --> 00:39:43,146 >> RACHEL: Rachel. 680 00:39:43,146 --> 00:39:44,228 BRIAN SCASSELLATI: Rachel. 681 00:39:44,228 --> 00:39:45,154 Masaya akong makilala kayo pareho. 682 00:39:45,154 --> 00:39:46,820 Alfredo, ako pagpunta sa may unang pumunta ka. 683 00:39:46,820 --> 00:39:47,990 Halika karapatan up dito. 684 00:39:47,990 --> 00:39:51,870 Pupunta ako sa kitang ipakilala you-- kung ako makakakuha ng off ito 685 00:39:51,870 --> 00:39:58,450 walang katok ang microphone-- sa isang maliit na robot na may pangalang jibo. 686 00:39:58,450 --> 00:40:00,140 SIGE? 687 00:40:00,140 --> 00:40:04,260 >> Ngayon, jibo ay idinisenyo upang maging interactive. 688 00:40:04,260 --> 00:40:09,339 At bagaman maaari itong magbigay sa iyo ng pagsasalita, marami ng pakikipag-ugnayan sa robot 689 00:40:09,339 --> 00:40:09,880 ay nonverbal. 690 00:40:09,880 --> 00:40:12,450 691 00:40:12,450 --> 00:40:17,070 Alfredo, ako pagpunta sa hilingin sa inyo na magsabi ng maganda at komplimentaryong 692 00:40:17,070 --> 00:40:19,554 sa robot, please. 693 00:40:19,554 --> 00:40:20,845 ALFREDO: Sa tingin ko titingnan mo cute. 694 00:40:20,845 --> 00:40:24,114 695 00:40:24,114 --> 00:40:25,611 >> [Whirring tunog] 696 00:40:25,611 --> 00:40:26,192 697 00:40:26,192 --> 00:40:27,108 BRIAN SCASSELLATI: OK. 698 00:40:27,108 --> 00:40:30,110 699 00:40:30,110 --> 00:40:33,180 Tugon nito ay hindi sa salita. 700 00:40:33,180 --> 00:40:35,180 At gayon pa man ito ibinigay sa iyo sa parehong mga isang malinaw na pag-amin 701 00:40:35,180 --> 00:40:39,680 na ito ay narinig kung ano ang sinabi mo at din sa paanuman nauunawaan na. 702 00:40:39,680 --> 00:40:40,530 SIGE? 703 00:40:40,530 --> 00:40:42,070 Hakbang karapatan bumalik dito para sa isang segundo. 704 00:40:42,070 --> 00:40:43,130 Salamat. 705 00:40:43,130 --> 00:40:44,090 >> Rachel, kung nanaisin mo. 706 00:40:44,090 --> 00:40:46,070 Ngayon, ako pagpunta sa magbibigay ikaw ang mas mahirap na trabaho. 707 00:40:46,070 --> 00:40:48,361 Kung gusto mo tumayo karapatan dito, back up lang nang kaunti kaya 708 00:40:48,361 --> 00:40:50,280 maaari naming kumuha ka sa camera at tumingin sa ganitong paraan. 709 00:40:50,280 --> 00:40:56,840 Pupunta ako sa hilingin sa inyo na sabihin ng isang bagay tunay na ibig sabihin at pangit sa robot. 710 00:40:56,840 --> 00:41:02,900 >> RACHEL: Ano tila ikaw lamang na gawin ay ganap na walang katotohanan. 711 00:41:02,900 --> 00:41:03,840 >> [Hugong] 712 00:41:03,840 --> 00:41:07,610 713 00:41:07,610 --> 00:41:09,030 >> Iyon ay mas walang katotohanan. 714 00:41:09,030 --> 00:41:10,120 Ano kaya ang nangyari sa inyo? 715 00:41:10,120 --> 00:41:13,487 716 00:41:13,487 --> 00:41:16,207 Aw, huwag mabahala. 717 00:41:16,207 --> 00:41:17,040 Bibigyan kita ng isang yakapin. 718 00:41:17,040 --> 00:41:19,882 719 00:41:19,882 --> 00:41:21,090 BRIAN SCASSELLATI: Lahat ng karapatan. 720 00:41:21,090 --> 00:41:22,280 Salamat, Rachel. 721 00:41:22,280 --> 00:41:24,565 Alfredo, Rachel, salamat guys talaga. 722 00:41:24,565 --> 00:41:26,840 >> [Palakpakan] 723 00:41:26,840 --> 00:41:28,660 724 00:41:28,660 --> 00:41:34,470 >> Kaya ito uri ng pakikipag-ugnayan ay sa maraming mga paraan ang ilan sa mga parehong panuntunan 725 00:41:34,470 --> 00:41:36,950 at ang ilan sa mga parehong istraktura bilang kung ano ang aming 726 00:41:36,950 --> 00:41:39,950 baka magkaroon sa linguistic interaction. 727 00:41:39,950 --> 00:41:44,530 Ito ay parehong mahilig makipagkapwa at Naghahain isang mahalagang layunin. 728 00:41:44,530 --> 00:41:48,590 At pakikipag-ugnayan na, sa maraming mga paraan, ay dinisenyo 729 00:41:48,590 --> 00:41:52,890 na magkaroon ng isang partikular na epekto sa taong nakikipag-ugnay sa o pakikinig 730 00:41:52,890 --> 00:41:54,410 sa robot. 731 00:41:54,410 --> 00:41:56,450 >> Ngayon, ako ay mapalad sapat upang magkaroon jibo dito ngayon. 732 00:41:56,450 --> 00:42:00,550 Sam Spaulding ay dito pagtulong amin out sa mga robot. 733 00:42:00,550 --> 00:42:07,470 At ako pagpunta sa hilingin Sam na magbigay sa amin ng isa magandang demo ng jibo dancing 734 00:42:07,470 --> 00:42:09,720 na maaari naming panoorin sa dulo dito. 735 00:42:09,720 --> 00:42:10,590 Kaya sige lang, jibo. 736 00:42:10,590 --> 00:42:11,550 >> Sam: OK, jibo. 737 00:42:11,550 --> 00:42:14,430 Ipakita sa amin ang iyong mga gumagalaw sa sayaw. 738 00:42:14,430 --> 00:42:17,310 >> [MUSIC nagpe-play] 739 00:42:17,310 --> 00:42:43,114 740 00:42:43,114 --> 00:42:44,780 BRIAN SCASSELLATI: Lahat ng mga karapatan, lahat. 741 00:42:44,780 --> 00:42:46,865 Salamat sa aming mga kaibigan sa jibo. 742 00:42:46,865 --> 00:42:49,426 >> [Palakpakan] 743 00:42:49,426 --> 00:42:50,140 744 00:42:50,140 --> 00:42:54,990 >> At salamat sa aming mga kaibigan sa IBM para sa pagtulong out ngayon. 745 00:42:54,990 --> 00:42:57,300 Communication ay isang bagay na na kayo ay pagpunta 746 00:42:57,300 --> 00:43:02,280 upang makita ang pagdating up ng higit pa at higit pa bilang bumuo kami ng mas kumplikadong mga interface. 747 00:43:02,280 --> 00:43:05,760 Sa susunod na linggo, magpapadala kami ay pakikipag-usap tungkol sa kung paano mag-interface 748 00:43:05,760 --> 00:43:08,890 may mga kalaban computer sa games. 749 00:43:08,890 --> 00:43:12,950 Ngunit kung mayroon kang mga katanungan tungkol sa mga ito, Makikita ko ba sa paligid sa mga oras ng opisina ngayong gabi. 750 00:43:12,950 --> 00:43:17,610 Ikinagagalak kong makipag-usap sa iyo ang tungkol sa AI ko paksa o upang makakuha ng sa karagdagang detalye. 751 00:43:17,610 --> 00:43:18,927 Sana'y maging maayos ang iyong bakasyon. 752 00:43:18,927 --> 00:43:21,409 >> [Palakpakan] 753 00:43:21,409 --> 00:43:21,909 754 00:43:21,909 --> 00:43:26,141 [MUSIC nagpe-play] 755 00:43:26,141 --> 00:46:42,879