1 00:00:00,000 --> 00:00:02,928 >> [Мусиц плаиинг] 2 00:00:02,928 --> 00:00:11,230 3 00:00:11,230 --> 00:00:12,790 >> Давид Малан: Ово је ЦС50. 4 00:00:12,790 --> 00:00:14,072 Ово је крај недеље 10. 5 00:00:14,072 --> 00:00:16,030 И дечак, да имамо Добар класа за вас данас. 6 00:00:16,030 --> 00:00:20,040 Ми смо толико узбуђен да позове два наши пријатељи из Иале до нас данас 7 00:00:20,040 --> 00:00:23,920 и да погледамо на раскрсници вештачка интелигенција, роботика, 8 00:00:23,920 --> 00:00:25,710 обрада природног језика, и још много тога. 9 00:00:25,710 --> 00:00:27,090 >> И заиста, над Протеклих неколико недеља, имамо 10 00:00:27,090 --> 00:00:29,714 сигурно провео пуно времена, посебно у ранијим псетс, 11 00:00:29,714 --> 00:00:31,560 са фокусом на лепе детаље ниског нивоа. 12 00:00:31,560 --> 00:00:34,520 И то је врло лако изгубити из вида шуме за дрвеће 13 00:00:34,520 --> 00:00:38,170 и да се спустила се на петљи и условима и показивачи, свакако, и слично. 14 00:00:38,170 --> 00:00:41,770 Али, реалност је ви сада имамо састојци са којима можете стварно 15 00:00:41,770 --> 00:00:45,300 реше неке интересантне проблеме, међу Они који их наши пријатељи на Иале 16 00:00:45,300 --> 00:00:48,790 раде на само мање од Кембриџа. 17 00:00:48,790 --> 00:00:52,410 >> Дакле, дозволите ми прво да представимо наше главе асистент са Јејл, Анди. 18 00:00:52,410 --> 00:00:55,182 >> [АППЛАУСЕ] 19 00:00:55,182 --> 00:00:57,030 20 00:00:57,030 --> 00:01:00,710 >> Анди: Пре свега, само хвала сте дозволили пар Иалиес 21 00:01:00,710 --> 00:01:02,700 поп доле у ​​Кембриџу данас. 22 00:01:02,700 --> 00:01:05,299 Заиста ценимо то. 23 00:01:05,299 --> 00:01:07,090 Друго, нашим пријатељима назад хоме-- Јасон, 24 00:01:07,090 --> 00:01:09,670 хвала за боравак и рад предавање. 25 00:01:09,670 --> 00:01:12,970 Надам се да је све добро у Њу Хејвену. 26 00:01:12,970 --> 00:01:15,720 >> Тако да, ја сам узбуђен да се уведе Сцаз данас. 27 00:01:15,720 --> 00:01:17,020 Сцаз води роботике лабораторију. 28 00:01:17,020 --> 00:01:19,690 Он је професор, као и пет различита одељења на Иале. 29 00:01:19,690 --> 00:01:23,159 У својој лабораторији, он је много, много роботи који воли да се игра са. 30 00:01:23,159 --> 00:01:24,950 Он је, као, најхладнији посао на свету. 31 00:01:24,950 --> 00:01:27,116 И он дође до мало неред око са тим цео дан 32 00:01:27,116 --> 00:01:29,090 дуго и ради нешто, као добро. 33 00:01:29,090 --> 00:01:33,070 >> И тако смо заправо довели једног Од њих са нама данас. 34 00:01:33,070 --> 00:01:36,900 Дакле, без даљег одлагања, Сцаз је отићи напред и увести нас 35 00:01:36,900 --> 00:01:38,660 свом робот пријатеља. 36 00:01:38,660 --> 00:01:41,546 >> [АППЛАУСЕ] 37 00:01:41,546 --> 00:01:42,935 38 00:01:42,935 --> 00:01:44,310 Бриан СЦАССЕЛЛАТИ: Хвала, Давиде. 39 00:01:44,310 --> 00:01:45,380 Хвала, Анди. 40 00:01:45,380 --> 00:01:50,050 Тако је дивно бити овде са свима данас. 41 00:01:50,050 --> 00:01:56,490 Желим да прво буде јасно да ЦС50 особље овде у Кембриџу 42 00:01:56,490 --> 00:01:59,190 је невероватно гостољубиви према нама. 43 00:01:59,190 --> 00:02:02,130 Толико смо захвални за све они урадили да нас подржи. 44 00:02:02,130 --> 00:02:05,690 И тако бисмо волели да будемо у стању да врати доброту. 45 00:02:05,690 --> 00:02:09,370 >> Тако данас, добијамо да објавимо да ћемо имати нову, 46 00:02:09,370 --> 00:02:15,240 један-оф-а-врсте ЦС50 догађаја дешава у Њу Хејвену следеће недеље. 47 00:02:15,240 --> 00:02:18,040 И ово је истраживање ЦС50 Експо. 48 00:02:18,040 --> 00:02:21,300 Тако ћемо се позивају еверионе-- ЦС50 студената, 49 00:02:21,300 --> 00:02:26,510 особље из оба Харварду и Иале-- да сиђе и посетите са нама у петак. 50 00:02:26,510 --> 00:02:30,400 Имаћемо широк спектар од преко 30 различитих људи који представљају 51 00:02:30,400 --> 00:02:34,830 и екхибитинг-- упперцлассмен показује неке од својих истраживачких производа. 52 00:02:34,830 --> 00:02:38,480 Имаћемо неке стартапима, чак, у потрази за мало новим технологијама талената, 53 00:02:38,480 --> 00:02:40,460 стартуп из оба Харвард и Јејл. 54 00:02:40,460 --> 00:02:44,550 А ми ћемо имати неке студентске групе у потрази за неким новим чланство. 55 00:02:44,550 --> 00:02:46,357 >> То ће бити веома узбудљиво време. 56 00:02:46,357 --> 00:02:49,190 Надам се онима који су силази на Харвард-Иале игре 57 00:02:49,190 --> 00:02:51,360 ће моћи да заустави од мало раније, 58 00:02:51,360 --> 00:02:54,060 Право у центру кампуса, Стерлинг Мемориал Либрари. 59 00:02:54,060 --> 00:02:58,040 Ми ћемо имати низ експонате који се крећу од аутономна 60 00:02:58,040 --> 00:03:04,460 једрилице до начина коришћења софтвера за очување средњовековних рукописа. 61 00:03:04,460 --> 00:03:07,860 >> Ми ћемо имати оглас хок умрежавање и људи 62 00:03:07,860 --> 00:03:11,230 учење софтвера кодирање у Кејптауну. 63 00:03:11,230 --> 00:03:13,730 Имаћемо компјутер музика демонстрације. 64 00:03:13,730 --> 00:03:16,020 И ми ћемо, наравно, имати више робота. 65 00:03:16,020 --> 00:03:18,900 Тако смо се надате ћу придружите нам се за овај догађај. 66 00:03:18,900 --> 00:03:21,350 То би требало да буде много забавно, мало хране, 67 00:03:21,350 --> 00:03:24,430 и доста занимљиво ствари да разговарамо. 68 00:03:24,430 --> 00:03:28,230 >> Дакле, данас ћемо да причамо о обради природног језика. 69 00:03:28,230 --> 00:03:32,560 И ово је покушај за нас да се изгради нови начин повезивања 70 00:03:32,560 --> 00:03:35,150 са нашим уређајима, јер За последњих неколико недеља, 71 00:03:35,150 --> 00:03:40,800 сте фокусирани на то како је то можете написати код, пишу софтвер 72 00:03:40,800 --> 00:03:47,110 то је начин бити у стању да кажете на машина, то је оно што желим да урадите. 73 00:03:47,110 --> 00:03:50,210 >> Али не би требало да Очекујем да све 74 00:03:50,210 --> 00:03:53,760 да је тамо да се користи сви у свету 75 00:03:53,760 --> 00:03:57,480 ће бити вешт у ову врсту наставе. 76 00:03:57,480 --> 00:04:02,540 Тако разликујемо рачунара језици и природне лангуагес-- 77 00:04:02,540 --> 00:04:06,720 То је, ствари које људи користе да комуницира са другим људима. 78 00:04:06,720 --> 00:04:12,270 И ми покушавамо да изградимо интерфејсе који користе ови природни механизми комуникације. 79 00:04:12,270 --> 00:04:16,029 >> Сада, као и сваки други топиц да смо почели са у ЦС50, 80 00:04:16,029 --> 00:04:19,589 ћемо почети са најједноставнији мало обради природног језика 81 00:04:19,589 --> 00:04:21,269 да можемо замислити. 82 00:04:21,269 --> 00:04:24,940 Ми ћемо почети са историјски део природног језика. 83 00:04:24,940 --> 00:04:28,740 И онда ћемо изградити до све више и више недавне системи 84 00:04:28,740 --> 00:04:31,450 и да се мало забавимо демо успут. 85 00:04:31,450 --> 00:04:35,900 >> Тако ћемо почети са оним што је било вероватно први природни језик 86 00:04:35,900 --> 00:04:38,210 систем за обраду. 87 00:04:38,210 --> 00:04:45,080 То је софтверски систем написан у 1966 Јосепх Веизенбаум зове Елиза. 88 00:04:45,080 --> 00:04:49,640 И Елиза је дизајниран тако да реплицира врсту интеракције 89 00:04:49,640 --> 00:04:53,850 бисте морали са Рогериан психотерапеут. 90 00:04:53,850 --> 00:04:57,210 Сада, Рогерианс, они су имали идеја да психотерапија 91 00:04:57,210 --> 00:05:02,800 укључени у стању да врати миррор пацијенту и разговарати с њима, 92 00:05:02,800 --> 00:05:08,100 у суштини, за само их је давање мали мало терапеута. 93 00:05:08,100 --> 00:05:09,920 То је све да је терапеут рекао 94 00:05:09,920 --> 00:05:16,500 је требало да буде само одраз шта пацијент је говорио са њима. 95 00:05:16,500 --> 00:05:18,990 >> Дакле, хајде да пробамо и ово демо. 96 00:05:18,990 --> 00:05:22,820 Да ли имамо волонтера који би да буде вољни да поделе своје најдубље, 97 00:05:22,820 --> 00:05:26,650 најмрачније и / или лажни тајне са Елиза? 98 00:05:26,650 --> 00:05:29,680 Наравно, зашто не дођеш горе. 99 00:05:29,680 --> 00:05:30,847 Фантастично. 100 00:05:30,847 --> 00:05:31,430 I tvoje ime? 101 00:05:31,430 --> 00:05:32,000 >> Милес Милес. 102 00:05:32,000 --> 00:05:33,041 >> Бриан СЦАССЕЛЛАТИ: Мајлс. 103 00:05:33,041 --> 00:05:34,270 Драго ми је, Милес. 104 00:05:34,270 --> 00:05:36,270 Ако би држите на то. 105 00:05:36,270 --> 00:05:40,840 И идемо у користите верзију Елиза 106 00:05:40,840 --> 00:05:44,640 да смо реплицирати у ЦС50 ИДЕ. 107 00:05:44,640 --> 00:05:47,140 И ми ћемо погледати на извору Код на ово мало касније. 108 00:05:47,140 --> 00:05:49,910 Али за сада, ми смо само да га позвати куцајући Елиза. 109 00:05:49,910 --> 00:05:55,480 >> И Елиза ће вам дати одговоре који ће бити у свим главним градовима. 110 00:05:55,480 --> 00:05:57,950 И да вам поставим нека питања. 111 00:05:57,950 --> 00:06:02,130 И ми ћемо одговорити и укуцајте У одговорима на Елиза. 112 00:06:02,130 --> 00:06:04,310 Тако ЕЛИЗА је рекао: "Здраво, ја сам Елиза. 113 00:06:04,310 --> 00:06:05,462 Šta je tvoj problem?" 114 00:06:05,462 --> 00:06:08,092 Шта желите да реци Елиза данас? 115 00:06:08,092 --> 00:06:10,750 >> Милес: Могу само да заспим ако имам зека папуче. 116 00:06:10,750 --> 00:06:12,440 >> Бриан СЦАССЕЛЛАТИ: У реду. 117 00:06:12,440 --> 00:06:13,360 У реду. 118 00:06:13,360 --> 00:06:15,300 >> [СМЕХ] 119 00:06:15,300 --> 00:06:22,410 >> "Могу само да заспим са бунни папуче на. " 120 00:06:22,410 --> 00:06:29,000 И Елиза каже: "Реци, зар не имате психолошких проблема? 121 00:06:29,000 --> 00:06:30,450 Можда је ово добар показатељ. " 122 00:06:30,450 --> 00:06:30,780 >> ОК. 123 00:06:30,780 --> 00:06:32,245 Дакле, шта би сте желели да одговорите? 124 00:06:32,245 --> 00:06:36,110 125 00:06:36,110 --> 00:06:36,970 >> Милес: Да. 126 00:06:36,970 --> 00:06:38,660 >> Бриан СЦАССЕЛЛАТИ: Да. 127 00:06:38,660 --> 00:06:39,570 Човек многих речи. 128 00:06:39,570 --> 00:06:41,870 Уживам у томе. 129 00:06:41,870 --> 00:06:50,200 Елиза каже: "Изгледа прилично позитиван." 130 00:06:50,200 --> 00:06:53,200 >> Милес: Не, ја сам, у ствари, електрон. 131 00:06:53,200 --> 00:06:55,150 >> Бриан СЦАССЕЛЛАТИ: "Не 132 00:06:55,150 --> 00:07:02,240 У ствари, ја сам електрон. " "Да ли сте дошли до мене 133 00:07:02,240 --> 00:07:06,954 зато што су електрон? " 134 00:07:06,954 --> 00:07:08,870 Сада можемо да видимо неке од ствари-- Идем 135 00:07:08,870 --> 00:07:10,200 да вам паузу за тренутак, Милес. 136 00:07:10,200 --> 00:07:11,010 Не иди нигде. 137 00:07:11,010 --> 00:07:12,650 Нисмо завршили са тобом. 138 00:07:12,650 --> 00:07:16,490 ЕЛИЗА је, на неки начин, реагује на одређене ствари 139 00:07:16,490 --> 00:07:21,140 да говори, али без било право разумевање. 140 00:07:21,140 --> 00:07:26,090 И то је такође папагај вратити неке од делова његове казне. 141 00:07:26,090 --> 00:07:27,310 >> Тако да смо рекли, "Не 142 00:07:27,310 --> 00:07:29,090 У ствари, ја сам електрон. " 143 00:07:29,090 --> 00:07:34,190 Елиза одговорио натраг, "Да ли си дошао за мене, јер сте електрон? " 144 00:07:34,190 --> 00:07:34,690 У реду. 145 00:07:34,690 --> 00:07:36,050 Хајде да још једном одговор овде. 146 00:07:36,050 --> 00:07:37,140 Дајте му један добар, Милес. 147 00:07:37,140 --> 00:07:37,806 >> Милес: Добра фора? 148 00:07:37,806 --> 00:07:48,400 149 00:07:48,400 --> 00:07:49,570 >> Да, молим те помози ми. 150 00:07:49,570 --> 00:07:50,570 Бриан СЦАССЕЛЛАТИ: "Да. 151 00:07:50,570 --> 00:07:58,010 Молим вас помозите ми. "" Да ли сте сигурни? " 152 00:07:58,010 --> 00:07:58,510 Милес: Не 153 00:07:58,510 --> 00:08:00,860 Бриан СЦАССЕЛЛАТИ: Не 154 00:08:00,860 --> 00:08:03,562 "Шта то тврдим да?" 155 00:08:03,562 --> 00:08:06,760 >> Милес: Не може да буде електрон. 156 00:08:06,760 --> 00:08:11,170 >> Бриан СЦАССЕЛЛАТИ: "Ја не може да буде електрон ". 157 00:08:11,170 --> 00:08:13,790 "Хоћеш да кажеш не само да би негативна?" 158 00:08:13,790 --> 00:08:14,390 >> У реду. 159 00:08:14,390 --> 00:08:16,030 Тако Мајлс, хвала ти пуно. 160 00:08:16,030 --> 00:08:16,860 >> Милес: Хвала. 161 00:08:16,860 --> 00:08:18,360 >> Бриан СЦАССЕЛЛАТИ: Хвала пуно. 162 00:08:18,360 --> 00:08:20,230 [АППЛАУСЕ] 163 00:08:20,230 --> 00:08:21,230 164 00:08:21,230 --> 00:08:26,700 >> Дакле, ово ЕЛИЗА програма, на много начина, је само одговор на комада 165 00:08:26,700 --> 00:08:32,730 да дајемо без икаквих дубоко разумевање шта се овде дешава. 166 00:08:32,730 --> 00:08:36,640 Ово је нека врста система зове образац подударање, где 167 00:08:36,640 --> 00:08:40,490 тражимо сигурно бита текста који смо тада смо 168 00:08:40,490 --> 00:08:44,860 ће да узме шта је обезбеђен као улаз, 169 00:08:44,860 --> 00:08:52,580 претворити га, потенцијално, на неки начин, а затим га вратити корисника. 170 00:08:52,580 --> 00:08:55,150 >> Да ли неко од вас мисли да ЕЛИЗА је заправо 171 00:08:55,150 --> 00:08:58,230 обављање валидну психоанализу овде? 172 00:08:58,230 --> 00:08:59,250 Једна особа, можда. 173 00:08:59,250 --> 00:09:00,166 >> ПУБЛИКА: [неразумљиво]. 174 00:09:00,166 --> 00:09:03,315 175 00:09:03,315 --> 00:09:05,440 Бриан СЦАССЕЛЛАТИ: А како то се осећате? 176 00:09:05,440 --> 00:09:06,530 Да, у ствари, јесте. 177 00:09:06,530 --> 00:09:10,890 И ми ћемо да видимо, заправо, изворни код за то у само тренутак. 178 00:09:10,890 --> 00:09:13,580 И тако ћеш бити у стању да тачно то урадили. 179 00:09:13,580 --> 00:09:17,420 >> Сада, Елиза је један облик онога што бисмо назвали данас чат бота. 180 00:09:17,420 --> 00:09:19,950 То само иде кроз Текст који сте пружању, 181 00:09:19,950 --> 00:09:24,030 обезбеђује минимум износа разумевања или прераде, 182 00:09:24,030 --> 00:09:26,790 а затим га акту вратити. 183 00:09:26,790 --> 00:09:31,830 Дакле, хајде да погледамо, концептуално, и причамо о томе шта 184 00:09:31,830 --> 00:09:34,690 то је да ЕЛИЗА се заправо ради. 185 00:09:34,690 --> 00:09:42,000 >> ЕЛИЗА изводи сентенце-- Хајде да кажу, "Ја желим да импресионирам мог шефа." 186 00:09:42,000 --> 00:09:45,130 И Елиза ис лоокинг кроз тај казне 187 00:09:45,130 --> 00:09:48,730 и покушава да пронађе и подударају одређене обрасце. 188 00:09:48,730 --> 00:09:52,850 Тако, на пример, један од образаца да ЕЛИЗА тражи су речи 189 00:09:52,850 --> 00:09:55,110 "Ja zelim." 190 00:09:55,110 --> 00:09:59,330 И сваки пут се види нешто да има "Желим" у њој, 191 00:09:59,330 --> 00:10:01,770 да формулише одговор. 192 00:10:01,770 --> 00:10:05,040 И тај одговор је фиксна ниска. 193 00:10:05,040 --> 00:10:07,915 У овом случају, то је "зашто хоћеш?" 194 00:10:07,915 --> 00:10:11,330 И стави мало звезду на крај, јер то је само 195 00:10:11,330 --> 00:10:13,310 почетак нашег одговора. 196 00:10:13,310 --> 00:10:16,310 И звезда указује на то да ћемо да се остатак 197 00:10:16,310 --> 00:10:19,850 од уттеранце-- корисника "да импресионира мог шефа" - 198 00:10:19,850 --> 00:10:24,500 а ми ћемо додати да на крају овог низа. 199 00:10:24,500 --> 00:10:28,990 >> Дакле, сада, уместо да каже, "зашто хоћеш да импресионирам мог шефа, " 200 00:10:28,990 --> 00:10:31,800 ту је мало додатног обрада да ћемо учинити. 201 00:10:31,800 --> 00:10:34,440 То је, мораћемо да претворити неке од заменица 202 00:10:34,440 --> 00:10:38,670 овде из "мог шефа" у "својим шефом." 203 00:10:38,670 --> 00:10:41,300 И можда постоји неколико других промене које морамо да. 204 00:10:41,300 --> 00:10:44,990 Дакле, уместо да само лепљење директно на крају, шта ћемо урадити 205 00:10:44,990 --> 00:10:49,160 се узећемо остатка уттеранце-- корисника у белој овде- 206 00:10:49,160 --> 00:10:54,090 и ми ћемо га узети један комад на време и претворити сваки стринг 207 00:10:54,090 --> 00:10:58,180 токена, свака реч, у реченици. 208 00:10:58,180 --> 00:10:59,580 >> Дакле, ми ћемо узети реч "да". 209 00:10:59,580 --> 00:11:01,650 Нема конверзије да морамо да урадимо то. 210 00:11:01,650 --> 00:11:02,340 "Импресс". 211 00:11:02,340 --> 00:11:04,140 Нема конверзије морамо тамо да ради. 212 00:11:04,140 --> 00:11:06,670 "Мој" ће претворити у "свој". 213 00:11:06,670 --> 00:11:10,070 И "газда" само ћемо оставити као "шефа". 214 00:11:10,070 --> 00:11:12,740 И на крају, шта који се завршава са периодом, 215 00:11:12,740 --> 00:11:16,640 ми ћемо га претворити у питање. 216 00:11:16,640 --> 00:11:22,600 >> Овај веома једноставан образац подударање је заправо прилично успешна. 217 00:11:22,600 --> 00:11:27,260 А када је то уведена у 1966-- Јосепх Веизенбаум 218 00:11:27,260 --> 00:11:28,986 ово програмирали на рачунару. 219 00:11:28,986 --> 00:11:31,110 Сада, рачунари у то време нису десктоп модели. 220 00:11:31,110 --> 00:11:33,950 Они су делили ресурсе. 221 00:11:33,950 --> 00:11:39,090 И његови ученици би иди и цхат са Елиза. 222 00:11:39,090 --> 00:11:41,570 На крају, он је морао да ограничи приступ тим 223 00:11:41,570 --> 00:11:43,890 јер његови студенти нису били узимајући било који посао обавља. 224 00:11:43,890 --> 00:11:46,190 Они су само ћаска са Елиза. 225 00:11:46,190 --> 00:11:48,850 А, у ствари, он је морао да фире његов помоћник, који 226 00:11:48,850 --> 00:11:55,840 провео све своје време разговора са Елиза о својим дубоким и забрињавајуће проблеме. 227 00:11:55,840 --> 00:12:00,350 >> Свако ко користи ове системе почели да их антхропоморпхизе. 228 00:12:00,350 --> 00:12:04,490 Они су почели да размишљају о њима као бити жива и прави људи. 229 00:12:04,490 --> 00:12:07,969 Они су почели да препознају неке од ствари које су они говорили 230 00:12:07,969 --> 00:12:09,010 се враћају на њих. 231 00:12:09,010 --> 00:12:12,120 И они су сазна ствари о себи. 232 00:12:12,120 --> 00:12:17,290 А, у ствари, чак и експерти, чак и психотерапеути, 233 00:12:17,290 --> 00:12:22,930 почео да брину да, у ствари, Можда ЕЛИЗА би било да их замене. 234 00:12:22,930 --> 00:12:25,640 Чак и рачунар Научници забринути да смо били 235 00:12:25,640 --> 00:12:30,040 тако близу решавања природног језика. 236 00:12:30,040 --> 00:12:33,520 >> Сада, то није било нигде близу истина. 237 00:12:33,520 --> 00:12:37,280 Али то је импресивно како ови системи могу да изгледају. 238 00:12:37,280 --> 00:12:40,080 Почнимо да погледате испод и покушајте 239 00:12:40,080 --> 00:12:46,190 да се мало питање где овај код заправо дешава. 240 00:12:46,190 --> 00:12:48,170 Дакле, ми ћемо направити овај код доступно касније. 241 00:12:48,170 --> 00:12:50,880 И ово је веома једноставан и директан прикључак 242 00:12:50,880 --> 00:12:53,240 оригиналне имплементације Елиза. 243 00:12:53,240 --> 00:12:56,350 >> Дакле, неки од њих стилски ствари које ћете видети овде 244 00:12:56,350 --> 00:12:59,360 НИСУ стилски шта ми желели да урадите 245 00:12:59,360 --> 00:13:01,480 или оно што смо учи да то урадите. 246 00:13:01,480 --> 00:13:04,770 Али ми смо покушали да их држе исто преко многих лука 247 00:13:04,770 --> 00:13:08,087 да је то је имало тако да има укус оригинала. 248 00:13:08,087 --> 00:13:09,920 Тако ћемо укључити гомила ствари, 249 00:13:09,920 --> 00:13:12,920 и онда ћемо имати сет кључних речи, ствари 250 00:13:12,920 --> 00:13:16,460 који ће препознати ЕЛИЗА и одговори на директно. 251 00:13:16,460 --> 00:13:20,780 Дакле, ако имате речи као што "Можете ли" или "не знам" или "не" 252 00:13:20,780 --> 00:13:24,680 или "да" или "сан" или "здраво", а затим ЕЛИЗА 253 00:13:24,680 --> 00:13:27,920 ће селективно одговори онима. 254 00:13:27,920 --> 00:13:30,010 Такође ћемо имати известан број ствари 255 00:13:30,010 --> 00:13:34,940 да ћемо замијенити, као и претварање "мој" на "свој". 256 00:13:34,940 --> 00:13:39,920 >> И онда ћемо имати низ одговора да за сваки од ових кључних речи, 257 00:13:39,920 --> 00:13:42,580 ми ћемо ротирати кроз ови различити одговори. 258 00:13:42,580 --> 00:13:45,350 Дакле, ако ја кажем "да" три пута за редом, ја 259 00:13:45,350 --> 00:13:50,429 Можда се три различита Одговори из Елиза. 260 00:13:50,429 --> 00:13:52,345 Наша код, онда је заправо изузетно једноставна. 261 00:13:52,345 --> 00:13:59,490 Ако спустите поред свих ових одговори које смо програмирани у 262 00:13:59,490 --> 00:14:02,920 и да пређемо на наш главни, идемо да се покрене 263 00:14:02,920 --> 00:14:06,540 неколико различитих варијабли и да мало домаћинству 264 00:14:06,540 --> 00:14:08,480 U početku. 265 00:14:08,480 --> 00:14:11,760 Али онда апсолутно постоји сет кода који можете да разумете. 266 00:14:11,760 --> 00:14:15,820 Једна велика вхиле петље да каже да сам да поновим ово изнова и изнова. 267 00:14:15,820 --> 00:14:20,420 Ја ћу прочитати у реду, и ја ћу складиштити да у улазног стринга. 268 00:14:20,420 --> 00:14:23,880 Ја ћу да проверим и видим да је то Посебан кључна реч "збогом", који 269 00:14:23,880 --> 00:14:26,199 значи излазак из програма. 270 00:14:26,199 --> 00:14:29,240 И онда ћу провјерити и видети да ли неко је само себе понавља 271 00:14:29,240 --> 00:14:29,800 непрестано. 272 00:14:29,800 --> 00:14:31,174 А ја ћу викати на њих ако они раде. 273 00:14:31,174 --> 00:14:34,820 Ја ћу рећи "не понављам себе." 274 00:14:34,820 --> 00:14:40,500 >> Докле год нико од оних деси, ми ћемо затим скенира кроз и петља кроз, 275 00:14:40,500 --> 00:14:45,330 на линијама 308 до 313 овде, и проверите и видите 276 00:14:45,330 --> 00:14:49,090 су неки од тих кључне речи фразе садржане у улаз 277 00:14:49,090 --> 00:14:50,620 да сам добио? 278 00:14:50,620 --> 00:14:54,845 Ако постоји меч за њих, добро онда ћу запамтити ту локацију. 279 00:14:54,845 --> 00:14:57,050 Ја ћу запамтити ту кључну реч. 280 00:14:57,050 --> 00:14:58,620 А ја ћу бити у стању да изгради одговор. 281 00:14:58,620 --> 00:15:03,150 >> Ако не нађем један, па онда, последња ствар у мом низу кључних речи 282 00:15:03,150 --> 00:15:08,070 ће бити моја дефаулт одговори, када ништа друго одговара. 283 00:15:08,070 --> 00:15:14,160 Ја ћу поставити питања попут: "Зашто си урадио дошао овде? "или" Како могу да вам помогнем? " 284 00:15:14,160 --> 00:15:19,710 да су само делимично одговарајући без обзира на улаз је. 285 00:15:19,710 --> 00:15:22,580 >> Затим ћемо изградити Елиза је одговор. 286 00:15:22,580 --> 00:15:26,040 Ми ћемо бити у стању да преузме та база одговор, 287 00:15:26,040 --> 00:15:28,370 баш као што смо урадили у томе "мој шеф" пример. 288 00:15:28,370 --> 00:15:30,970 289 00:15:30,970 --> 00:15:33,990 Ако је то све што постоји је-- ако је само једна 290 00:15:33,990 --> 00:15:36,860 стринг који ја треба да респонд-- Могу само да га пошаљу натраг. 291 00:15:36,860 --> 00:15:40,610 Ако има звездицу на крај, онда ћу 292 00:15:40,610 --> 00:15:45,710 обрађује сваки појединачни знак у остатак одговора корисника 293 00:15:45,710 --> 00:15:51,590 и додајте оне у, замене се од речи до речи као што сам је потребно. 294 00:15:51,590 --> 00:15:56,100 >> Све ово је апсолутно нешто што сте могли да изградите. 295 00:15:56,100 --> 00:15:59,230 А у ствари, начин на који смо има обрађених аргументе командне линије, 296 00:15:59,230 --> 00:16:03,570 начин на који сте обрађују кроз ХТТП захтева 297 00:16:03,570 --> 00:16:05,510 пратите исте врсте правила. 298 00:16:05,510 --> 00:16:08,220 Они су образац подударање. 299 00:16:08,220 --> 00:16:15,170 >> Тако ЕЛИЗА имао релативно важно утицај на природном језику 300 00:16:15,170 --> 00:16:21,620 јер је изгледало као да је веома достижан циљ, као и некако ми би 301 00:16:21,620 --> 00:16:25,550 моћи директно реши овај проблем. 302 00:16:25,550 --> 00:16:30,670 Сада, то не значи да не ЕЛИЗА Све што смо желели да урадимо. 303 00:16:30,670 --> 00:16:33,710 Сигурно не. 304 00:16:33,710 --> 00:16:35,660 Али морамо бити у стању да уради нешто више. 305 00:16:35,660 --> 00:16:38,280 306 00:16:38,280 --> 00:16:41,490 >> Наш први корак да идем изван ЕЛИЗА иде 307 00:16:41,490 --> 00:16:44,840 да бисте могли да погледате Не тект Уписом 308 00:16:44,840 --> 00:16:53,750 у тастатури, али говору, стварна говор снимљен у микрофон. 309 00:16:53,750 --> 00:16:56,880 Дакле, као што смо погледај ово различитих комада, ми смо 310 00:16:56,880 --> 00:17:00,304 морати да изгради низ модела. 311 00:17:00,304 --> 00:17:02,970 Ми ћемо бити у могућности да иде од ниском нивоу ацоустиц у 312 00:17:02,970 --> 00:17:07,180 информатион-- терен, амплитуда, фрекуенци-- 313 00:17:07,180 --> 00:17:09,530 и претворити то у неке јединице да смо 314 00:17:09,530 --> 00:17:14,619 лакше манипулисати и, коначно, манипулишу њима 315 00:17:14,619 --> 00:17:18,609 у речи и реченица. 316 00:17:18,609 --> 00:17:22,880 >> Тако да је већина препознавање говора системи који су данас тамо 317 00:17:22,880 --> 00:17:26,069 фоллов статистички модел у коме градимо 318 00:17:26,069 --> 00:17:35,090 три одвојена представе шта да аудио сигнала у ствари садржи. 319 00:17:35,090 --> 00:17:38,640 Почињемо са моделом фонетски који говори о само бази 320 00:17:38,640 --> 00:17:41,250 звучи да сам производи. 321 00:17:41,250 --> 00:17:46,900 Да ли сам производи нешто што је а Б као дечак или Д као у пса? 322 00:17:46,900 --> 00:17:53,220 Како препознати оне две различите телефони као одвојени и различити? 323 00:17:53,220 --> 00:17:56,600 >> Поврх тога, онда ћемо изградити реч изговор модел 324 00:17:56,600 --> 00:18:01,350 нешто што повезује заједно те појединачне телефони 325 00:18:01,350 --> 00:18:04,724 и комбинује их у речи. 326 00:18:04,724 --> 00:18:07,890 И после тога, ми ћемо узети речи и ми ћемо их монтирају са језика 327 00:18:07,890 --> 00:18:13,010 модел у потпуном казне. 328 00:18:13,010 --> 00:18:17,230 >> Сада ћемо да разговарамо једни о од њих самостално и одвојено. 329 00:18:17,230 --> 00:18:21,580 Али ови модели су све три само ће бити статистике. 330 00:18:21,580 --> 00:18:23,502 А то значи, када смо рад са њима, ми ћемо 331 00:18:23,502 --> 00:18:25,376 бити у стању да раде са их све истовремено. 332 00:18:25,376 --> 00:18:28,100 333 00:18:28,100 --> 00:18:28,600 У реду. 334 00:18:28,600 --> 00:18:30,890 Почнимо са нашим фонетском модела. 335 00:18:30,890 --> 00:18:34,470 Тако фонетске модели се ослањају на А Цомпутатионал техника 336 00:18:34,470 --> 00:18:37,320 зове скривене Марков модели. 337 00:18:37,320 --> 00:18:43,050 То су графички модели у којима сам има и признају стање у свету 338 00:18:43,050 --> 00:18:46,500 као да је назначен скупом функција. 339 00:18:46,500 --> 00:18:51,960 И то стање описује један део једне акције да сам ангажован у. 340 00:18:51,960 --> 00:19:00,190 >> Дакле, ако мислим о прављењу звук "МА" као мајка, 341 00:19:00,190 --> 00:19:03,970 постоје различити компоненте тај звук. 342 00:19:03,970 --> 00:19:07,230 Постоји део где сам нацртати у даху. 343 00:19:07,230 --> 00:19:09,560 А онда сам портмоне моје усне. 344 00:19:09,560 --> 00:19:13,710 И ролл моје усне се мало Мало да ту "ма" звук. 345 00:19:13,710 --> 00:19:15,340 А онда је издање. 346 00:19:15,340 --> 00:19:17,020 Моје усне долазе одвојено. 347 00:19:17,020 --> 00:19:19,030 Ваздух је избачен. 348 00:19:19,030 --> 00:19:22,650 "Ма". 349 00:19:22,650 --> 00:19:29,250 >> Те три различите делове ће бити заступа држава у овом грапх-- 350 00:19:29,250 --> 00:19:33,420 почетак, средина и крај. 351 00:19:33,420 --> 00:19:38,060 И ја имам прелаз који дозвољено да путују из једне државе 352 00:19:38,060 --> 00:19:42,260 до следећег са одређеном вероватноћом. 353 00:19:42,260 --> 00:19:47,250 Тако, на пример, да М соунд можда има веома, 354 00:19:47,250 --> 00:19:51,850 врло кратко унос у бегиннинг-- "мм" - а затим и дужи, 355 00:19:51,850 --> 00:19:55,640 вибрациони фаза у којој држим мој усне заједно и готово хумминг-- 356 00:19:55,640 --> 00:20:05,090 "мммм", - а затим веома кратак Плосиве где сам протерати бреатх-- "ма". 357 00:20:05,090 --> 00:20:09,370 >> Скривена Марковљев модел је дизајниран за снимање чињеницу 358 00:20:09,370 --> 00:20:13,340 да је начин на који сам се то звучи "МА" иде 359 00:20:13,340 --> 00:20:17,350 да буде нешто другачија у његов тајминг је фреквенција, 360 00:20:17,350 --> 00:20:21,030 и његове карактеристике од начин да га направи 361 00:20:21,030 --> 00:20:23,300 или начин на који сам могао успети кад говорим 362 00:20:23,300 --> 00:20:26,030 о различитим употребе писма. 363 00:20:26,030 --> 00:20:33,240 "Мајка" и "може да" неће соунд мало другачије. 364 00:20:33,240 --> 00:20:36,800 >> Тако да призна Посебно звук, ми би 365 00:20:36,800 --> 00:20:42,020 граде модела Маркова, ова Скривени Марков модели, од свих могућих телефона које сам 366 00:20:42,020 --> 00:20:45,840 можда ћете желети да признају, сваки могући звук, 367 00:20:45,840 --> 00:20:49,750 и онда погледамо акустична подаци да имам 368 00:20:49,750 --> 00:20:54,430 и одредити статистички којих је једна највероватније један 369 00:20:54,430 --> 00:20:58,110 да су произвели овај звук. 370 00:20:58,110 --> 00:20:58,610 ОК. 371 00:20:58,610 --> 00:21:01,540 372 00:21:01,540 --> 00:21:06,750 Са том моделу, онда почети да се гради на њега. 373 00:21:06,750 --> 00:21:09,330 Узимамо изговор модел. 374 00:21:09,330 --> 00:21:11,790 Сада, понекад изговор модели су једноставно и лако 375 00:21:11,790 --> 00:21:14,440 јер постоји само један начин да се изрекне нешто. 376 00:21:14,440 --> 00:21:17,990 Други пут, они су мало компликованије. 377 00:21:17,990 --> 00:21:21,340 Ево изговор за за ту црвену ствар која је 378 00:21:21,340 --> 00:21:25,210 воће које правите кечап из. 379 00:21:25,210 --> 00:21:27,360 Људи не мисле да је то воће. 380 00:21:27,360 --> 00:21:27,860 Jel tako? 381 00:21:27,860 --> 00:21:30,880 382 00:21:30,880 --> 00:21:35,300 >> Сада, постоје различити начини да ће људи изговарају ту реч. 383 00:21:35,300 --> 00:21:37,780 Неки ће рећи "Тое-Маи-прст." 384 00:21:37,780 --> 00:21:40,880 Неки ће рећи "тое-МАХ-прст." 385 00:21:40,880 --> 00:21:44,800 И можемо ухватити да са једна од ових графичких модела 386 00:21:44,800 --> 00:21:48,305 где, опет, ми представљамо прелазе да имају одређеном вероватноћом 387 00:21:48,305 --> 00:21:51,360 и повезан вероватноћу са њима. 388 00:21:51,360 --> 00:21:58,290 >> Дакле, у овом случају, ако бих пратим топ пут кроз целу ову графу, 389 00:21:58,290 --> 00:22:03,330 Ја бих се с почетком у писму на далеко отишао, "ТА" звук. 390 00:22:03,330 --> 00:22:07,570 Ја бих узео горњу половину, је "Ох", а затим "Ма," 391 00:22:07,570 --> 00:22:14,530 па затим и "а", а затим и "Та," и "Ох." "Тое-маи-прст." 392 00:22:14,530 --> 00:22:19,610 Ако сам узео доњи пут кроз ово, ја ћу добити "та-МАХ-прст." 393 00:22:19,610 --> 00:22:26,810 И ако сам доле и онда горе, ја бих се "та-Маи-прст." 394 00:22:26,810 --> 00:22:29,950 >> Ови модели снимање њих разлике јер кад год 395 00:22:29,950 --> 00:22:32,410 смо деплои један од ових системи за препознавање, 396 00:22:32,410 --> 00:22:35,340 то ће морати да раде са много различитих врста људи, 397 00:22:35,340 --> 00:22:39,295 много различитих акцената, па чак и различите употребе истим речима. 398 00:22:39,295 --> 00:22:42,204 399 00:22:42,204 --> 00:22:44,120 На крају, поврх тога, ми ћемо градити нешто 400 00:22:44,120 --> 00:22:48,780 која изгледа заиста компликовано, зове модел језика, 401 00:22:48,780 --> 00:22:52,950 али у ствари је најједноставнији три јер то раде 402 00:22:52,950 --> 00:22:56,041 на оно што се зове Н-грам модели. 403 00:22:56,041 --> 00:23:02,270 И у овом случају, ја вам показујем из два дела Н-грама модел биграмом. 404 00:23:02,270 --> 00:23:08,910 Идемо да физички идеју да понекад, одређене речи су 405 00:23:08,910 --> 00:23:14,680 вероватније да прати с обзиром реч од других. 406 00:23:14,680 --> 00:23:25,210 Ако сам рекао "временска прогноза" следећа реч могла вероватно бити "данас" 407 00:23:25,210 --> 00:23:31,510 или би могао бити "време прогноза сутра. " 408 00:23:31,510 --> 00:23:38,870 Али то је мало вероватно да буде " временска прогноза артицхоке. " 409 00:23:38,870 --> 00:23:42,980 >> Шта је модел језика ради је хвата оне статистички 410 00:23:42,980 --> 00:23:47,450 бројањем, од неких веома велики цорпус, сви инстанци 411 00:23:47,450 --> 00:23:50,890 у којем једна реч следи за другом. 412 00:23:50,890 --> 00:23:54,300 Дакле, ако узмем велики цорпус-- као и сваки Валл Стреет Јоурнал 413 00:23:54,300 --> 00:24:00,750 која је произведена од 1930, који је један од стандардних цорпусес-- 414 00:24:00,750 --> 00:24:03,910 и гледам кроз све тај текст, и ја рачунам 415 00:24:03,910 --> 00:24:09,770 до колико пута после "предвиђања" ја видим "данас" 416 00:24:09,770 --> 00:24:17,454 и колико пута ја видим "предвиђања" следи "артичоке," 417 00:24:17,454 --> 00:24:19,370 први иде да буде много чешће. 418 00:24:19,370 --> 00:24:21,540 То ће да се појави далеко чешће. 419 00:24:21,540 --> 00:24:24,610 И тако да ће имати већи Вероватноћа везане за њега. 420 00:24:24,610 --> 00:24:27,340 >> Ако желим да схватим Вероватноћа целог исказа, 421 00:24:27,340 --> 00:24:29,940 онда, управо сам га раскинемо. 422 00:24:29,940 --> 00:24:35,990 Дакле, вероватноћа расправе реченица је "пацов појео сир" 423 00:24:35,990 --> 00:24:39,110 је вероватноћа речи "" покретање реченицу, 424 00:24:39,110 --> 00:24:42,540 а потом вероватноћа да Реч "пацов" следи реч је "," 425 00:24:42,540 --> 00:24:44,910 и вероватноћа да Реч "појела" прати "рат" 426 00:24:44,910 --> 00:24:51,120 и вероватноћа да "сир" следи "појео". 427 00:24:51,120 --> 00:24:55,160 >> Ово звучи као много статистика, доста вероватноће. 428 00:24:55,160 --> 00:24:57,510 И то је све што је. 429 00:24:57,510 --> 00:25:02,920 Али невероватно ствар је ако ово урадите са великим довољно узорку података, 430 00:25:02,920 --> 00:25:03,670 то ради. 431 00:25:03,670 --> 00:25:05,250 И то ради изузетно добро. 432 00:25:05,250 --> 00:25:07,810 433 00:25:07,810 --> 00:25:11,420 Ми сви знамо ове технологије. 434 00:25:11,420 --> 00:25:16,500 Већина оперативних система долазе са препознавање гласа у овом тренутку. 435 00:25:16,500 --> 00:25:20,940 Ми користимо Сири и Цортана и Ецхо. 436 00:25:20,940 --> 00:25:25,070 А ове ствари су засноване на овај тип три слоја модел-- 437 00:25:25,070 --> 00:25:30,620 фонетски модел на дну, а изговор модел у средини, 438 00:25:30,620 --> 00:25:33,690 и модел језика на њих. 439 00:25:33,690 --> 00:25:37,630 >> Сада, они морају да раде мало више него да би се одговорило на питања. 440 00:25:37,630 --> 00:25:43,000 Али признавање шта си изрека зависи управо о томе. 441 00:25:43,000 --> 00:25:45,700 Дакле, узмимо пример овде. 442 00:25:45,700 --> 00:25:52,020 Дакле, имам мој телефон седи овде испод камере документа. 443 00:25:52,020 --> 00:25:56,110 И ми ћемо пита Сири неколико питања. 444 00:25:56,110 --> 00:25:57,150 У реду? 445 00:25:57,150 --> 00:25:59,940 >> Дакле, хајде да се пробудим мој телефон овде. 446 00:25:59,940 --> 00:26:02,710 447 00:26:02,710 --> 00:26:05,000 Сири што је време као у Нев Хавен данас? 448 00:26:05,000 --> 00:26:07,670 449 00:26:07,670 --> 00:26:10,780 >> Сири: Ево је време за Нев Хавен, Цоннецтицут данас. 450 00:26:10,780 --> 00:26:11,890 >> Бриан СЦАССЕЛЛАТИ: У реду. 451 00:26:11,890 --> 00:26:16,720 Дакле, прво сте видели да Сири призната сваки од појединачних речи 452 00:26:16,720 --> 00:26:19,050 затим произвео одговор. 453 00:26:19,050 --> 00:26:22,277 Причаћемо о томе како тај одговор долази у око мало. 454 00:26:22,277 --> 00:26:24,110 Али сада када знамо да је ово само заснива 455 00:26:24,110 --> 00:26:28,880 о сировим статистике и ово образац подударање врста приступа, 456 00:26:28,880 --> 00:26:31,120 можемо да играмо неке игре са Сири. 457 00:26:31,120 --> 00:26:34,560 >> Дакле, можете покушати поново. 458 00:26:34,560 --> 00:26:38,864 Сири што је време нилски коњ Нев Хавен, данас? 459 00:26:38,864 --> 00:26:39,810 >> Сири: У реду. 460 00:26:39,810 --> 00:26:44,245 Овде је време за ново Хавен, Цоннецтицут за данас. 461 00:26:44,245 --> 00:26:46,120 Бриан СЦАССЕЛЛАТИ: Сири не Преплаłена да 462 00:26:46,120 --> 00:26:50,980 зато што је пронашао паттерн-- "Време", "данас", "Нев Хавен." 463 00:26:50,980 --> 00:26:54,420 То је оно што се одазива да, баш као Елиза. 464 00:26:54,420 --> 00:26:54,920 У реду. 465 00:26:54,920 --> 00:26:59,390 Хајде да дам још једну ни више смешно пример. 466 00:26:59,390 --> 00:27:03,075 Сири, време артичока Армадилло нилски коњ Нев Хавен? 467 00:27:03,075 --> 00:27:06,806 468 00:27:06,806 --> 00:27:08,400 >> Сири: Само да проверим о томе. 469 00:27:08,400 --> 00:27:11,280 Ево шта сам пронашао на Интернету за оно што су артичоке армадилло 470 00:27:11,280 --> 00:27:13,780 нилски коњ Нев Хавен. 471 00:27:13,780 --> 00:27:14,760 >> Бриан СЦАССЕЛЛАТИ: У реду. 472 00:27:14,760 --> 00:27:20,400 Дакле, ако одем довољно далеко далеко од овог модела, 473 00:27:20,400 --> 00:27:24,365 Ја сам у стању да га збуни, јер њега нема више одговара образац да има. 474 00:27:24,365 --> 00:27:27,370 475 00:27:27,370 --> 00:27:29,390 И то статистичка мотор који говори, 476 00:27:29,390 --> 00:27:32,850 шта је вероватноћа да имаш Речи нилски коњ и артичоке 477 00:27:32,850 --> 00:27:34,440 заједно, и армадилло? 478 00:27:34,440 --> 00:27:36,050 То мора да буде нешто ново. 479 00:27:36,050 --> 00:27:38,840 480 00:27:38,840 --> 00:27:40,610 >> Дакле, ове технологије користимо сваки дан. 481 00:27:40,610 --> 00:27:43,670 482 00:27:43,670 --> 00:27:47,800 Ако желимо да их узме један корак Даље, иако, ако стварно 483 00:27:47,800 --> 00:27:53,930 Желим да будем у стању да разговарају о томе како је је да су ови системи реагују на, 484 00:27:53,930 --> 00:28:00,630 морамо да разговарамо, опет, о фундаменталнији сет питања. 485 00:28:00,630 --> 00:28:05,370 И то је тема у комуникацији коју зовемо питање секретарица. 486 00:28:05,370 --> 00:28:07,028 То је, желимо да будемо у стању да да--? 487 00:28:07,028 --> 00:28:07,944 ПУБЛИКА: [неразумљиво]. 488 00:28:07,944 --> 00:28:10,789 489 00:28:10,789 --> 00:28:13,330 Бриан СЦАССЕЛЛАТИ: Да ли добијамо у латентном семантичке обраде? 490 00:28:13,330 --> 00:28:14,070 Тако да. 491 00:28:14,070 --> 00:28:17,820 Постоји много ствари које су догађа испод површине са Сири 492 00:28:17,820 --> 00:28:20,210 и у неким од примера Ја ћу да Вам покажем 493 00:28:20,210 --> 00:28:22,610 где постоји доста у погледу структуре 494 00:28:22,610 --> 00:28:25,260 шта ви кажете да је важно. 495 00:28:25,260 --> 00:28:31,890 А, у ствари, то је сјајна прекурсор за следећи слајд за мене. 496 00:28:31,890 --> 00:28:35,110 >> Дакле, на исти начин да наша препознавање говора је изградио 497 00:28:35,110 --> 00:28:39,620 од неколико слојева, ако желимо да разуме шта је то што је заиста 498 00:28:39,620 --> 00:28:44,620 речено, ми опет да ослањају на анализи вишеслојном 499 00:28:44,620 --> 00:28:47,020 текста који се признат. 500 00:28:47,020 --> 00:28:52,560 Дакле, када Сири је заправо у стању да рецимо, види Нашао сам ове речи. 501 00:28:52,560 --> 00:28:55,230 Шта сада да радим са њима? 502 00:28:55,230 --> 00:28:59,110 Прва компонента је често пролазе кроз и покушајте да анализирају 503 00:28:59,110 --> 00:29:03,010 структура реченице. 504 00:29:03,010 --> 00:29:05,410 И у оно што смо видели у основној школи, често, 505 00:29:05,410 --> 00:29:08,920 као нека врста дијаграма реченице, идемо 506 00:29:08,920 --> 00:29:12,774 да признају да одређени речи имају одређену улогу. 507 00:29:12,774 --> 00:29:13,440 То су именице. 508 00:29:13,440 --> 00:29:14,231 То су заменице. 509 00:29:14,231 --> 00:29:16,200 То су глаголи. 510 00:29:16,200 --> 00:29:19,460 И ми ћемо препознати да за одређену граматику, 511 00:29:19,460 --> 00:29:24,700 у овом случају граматике енглеског језика, постоје важећи начин на који могу да их комбинујете 512 00:29:24,700 --> 00:29:26,280 и други начини да се није важећа. 513 00:29:26,280 --> 00:29:29,920 514 00:29:29,920 --> 00:29:33,870 >> То признање, та структура, може бити довољно да помогне води нас 515 00:29:33,870 --> 00:29:36,720 помало. 516 00:29:36,720 --> 00:29:39,820 Али то није довољно да будемо у стању да пружи 517 00:29:39,820 --> 00:29:43,290 било значење да оно што се овде каже. 518 00:29:43,290 --> 00:29:46,615 Да бисте то урадили, мораћемо да се ослонимо на одређена количина семантичког прераде. 519 00:29:46,615 --> 00:29:49,590 520 00:29:49,590 --> 00:29:55,080 То је, ми ћемо морати да погледам на испод шта свака од ових речи 521 00:29:55,080 --> 00:29:57,400 заправо носи као значење. 522 00:29:57,400 --> 00:30:01,150 И на најједноставнији начин да то урадите, идемо да се друже са сваке речи 523 00:30:01,150 --> 00:30:06,930 да знамо одређену функцију, одређена трансформација томе да 524 00:30:06,930 --> 00:30:09,300 омогућава да се деси. 525 00:30:09,300 --> 00:30:14,470 >> У том случају, можемо означите Реч "Јован" као властито име, 526 00:30:14,470 --> 00:30:18,160 да носи са собом идентитет. 527 00:30:18,160 --> 00:30:21,530 И можемо означити "Марија" као на исти начин. 528 00:30:21,530 --> 00:30:27,900 Док глагола као што је "воли", који представља посебну везу 529 00:30:27,900 --> 00:30:31,582 да смо у стању да представи. 530 00:30:31,582 --> 00:30:33,290 Сада, то не значи да разумемо 531 00:30:33,290 --> 00:30:37,680 шта је љубав, али само да разумемо је на путу симболичког система. 532 00:30:37,680 --> 00:30:40,480 То је, можемо означити то и манипулише га. 533 00:30:40,480 --> 00:30:44,230 534 00:30:44,230 --> 00:30:49,120 >> Са сваким од ових типова приступа, било који тип семантичког обраде 535 00:30:49,120 --> 00:30:57,060 Овде ће мало да захтевају мало знања и пуно посла 536 00:30:57,060 --> 00:30:59,020 са наше стране. 537 00:30:59,020 --> 00:31:03,590 Ми више не у домену где само плаин статистике 538 00:31:03,590 --> 00:31:07,320 ће бити довољно за нас. 539 00:31:07,320 --> 00:31:11,330 Сада, како би ушла од тог тренутка тога што 540 00:31:11,330 --> 00:31:15,520 у стању да разговарају о унутрашњој шта се заправо дешава овде, 541 00:31:15,520 --> 00:31:19,640 да могу да манипулише тхис структуре и разуме питање 542 00:31:19,640 --> 00:31:23,160 и онда способност да изађе и потражите, 543 00:31:23,160 --> 00:31:27,290 да захтијева више комплекс когнитивне модела. 544 00:31:27,290 --> 00:31:34,880 >> Начин на који се уграђује ови системи је у највећем делу врло рада 545 00:31:34,880 --> 00:31:36,350 интензивна. 546 00:31:36,350 --> 00:31:39,490 Они укључују људе троши много 547 00:31:39,490 --> 00:31:44,100 структуирања времена начина на које ове врсте реченица 548 00:31:44,100 --> 00:31:47,270 могу бити представљени у неком логици. 549 00:31:47,270 --> 00:31:51,639 550 00:31:51,639 --> 00:31:53,430 Чак се мало сложенији, мада. 551 00:31:53,430 --> 00:31:56,400 552 00:31:56,400 --> 00:31:59,660 >> Чак и кад смо разматрали са семантици, ми ћемо 553 00:31:59,660 --> 00:32:03,860 тек треба да погледамо прагматика онога што је речено. 554 00:32:03,860 --> 00:32:08,620 То је, како сам се односе речи да морам нешто физички се 555 00:32:08,620 --> 00:32:12,054 негде у свету или на барем неки извор информација 556 00:32:12,054 --> 00:32:12,970 да могу да манипулишу? 557 00:32:12,970 --> 00:32:15,780 558 00:32:15,780 --> 00:32:20,790 >> Понекад, то довести до дивна битова двосмислености. 559 00:32:20,790 --> 00:32:24,470 "Црвена звезда-топло се удаје астроном." 560 00:32:24,470 --> 00:32:25,630 ОК. 561 00:32:25,630 --> 00:32:28,540 Сада, читамо да као смешно тип наслова 562 00:32:28,540 --> 00:32:34,690 да видимо на ноћног ТВ јер ми не тумачимо "стар" 563 00:32:34,690 --> 00:32:38,630 да има свој небеско тело значење. 564 00:32:38,630 --> 00:32:43,390 Знамо да то значи више уобичајена глумац или глумица 565 00:32:43,390 --> 00:32:45,240 са високим износима видљивости. 566 00:32:45,240 --> 00:32:47,770 567 00:32:47,770 --> 00:32:51,950 >> "Екипа помаже жртви Дог Бите". 568 00:32:51,950 --> 00:32:55,550 Да ли је то да је заправо тима тамо помаже пса 569 00:32:55,550 --> 00:32:59,620 у иде около и гризе жртве? 570 00:32:59,620 --> 00:33:02,380 Или је било појединац који је био 571 00:33:02,380 --> 00:33:04,625 ујео пас који потребна помоћ? 572 00:33:04,625 --> 00:33:07,650 573 00:33:07,650 --> 00:33:11,480 Само гледајући у синтакси и семантика реченица, 574 00:33:11,480 --> 00:33:14,660 не можемо утврдити да. 575 00:33:14,660 --> 00:33:22,000 >> "Хеликоптер поверед би људских мува." 576 00:33:22,000 --> 00:33:27,330 Да ли постоје, у ствари, стварна мале ствари лете око тога 577 00:33:27,330 --> 00:33:34,510 су људи са крила напајање хеликоптери за добробит човечанства? 578 00:33:34,510 --> 00:33:38,960 Или постоји један механички уређај која произлази своју моћ од особе? 579 00:33:38,960 --> 00:33:41,600 580 00:33:41,600 --> 00:33:46,500 >> Када погледамо питање одговарања системи, 581 00:33:46,500 --> 00:33:51,110 то су слојеви који морамо да се баве. 582 00:33:51,110 --> 00:33:54,890 Сада, најбоље и највише врста од преовладава од ових система 583 00:33:54,890 --> 00:34:00,640 Данас су у стању да уради ствари на нивоу који су 584 00:34:00,640 --> 00:34:05,050 далеко од онога што смо имали пре 10 година. 585 00:34:05,050 --> 00:34:08,210 Ево један од најбољих система да је тамо данас. 586 00:34:08,210 --> 00:34:10,519 И то је систем ИБМ Ватсон зове. 587 00:34:10,519 --> 00:34:13,040 588 00:34:13,040 --> 00:34:15,500 Ово је од наших пријатеља у ИБМ. 589 00:34:15,500 --> 00:34:19,810 Ово је Катхерине банке, Мишко Чен, и Присцилла Мораес нас давања 590 00:34:19,810 --> 00:34:26,323 демонстрација Ватсон јуче у ИБМ Јорктауну. 591 00:34:26,323 --> 00:34:26,989 [ВИДЕО РЕПРОДУКЦИЈА] 592 00:34:26,989 --> 00:34:27,690 -Како си? 593 00:34:27,690 --> 00:34:30,600 594 00:34:30,600 --> 00:34:31,980 >> -Ја сам добро. 595 00:34:31,980 --> 00:34:35,429 Увек сам срећан када сам размишљам, поготово када сам 596 00:34:35,429 --> 00:34:38,920 могу да остану кул у овим сервер собама. 597 00:34:38,920 --> 00:34:40,170 Ко је твоја омиљена глумица? 598 00:34:40,170 --> 00:34:43,870 599 00:34:43,870 --> 00:34:47,555 >> -Моја Омиљена глумица Анђелина Џоли као Лара Црофт 600 00:34:47,555 --> 00:34:54,800 у Томб Раидер јер јој оригинал облик био као виртуелни лик попут мене. 601 00:34:54,800 --> 00:34:56,760 >> Како могу Вотсон помоћи пацијентима? 602 00:34:56,760 --> 00:34:59,700 603 00:34:59,700 --> 00:35:03,755 >> Је ли план за пацијенте до имају приступ Ватсон директно? 604 00:35:03,755 --> 00:35:08,050 Приступ Ватсон саветовања Пријаве ће се разликовати од случаја употребе. 605 00:35:08,050 --> 00:35:12,630 Али тренутно, Вотсон ће пружити могуће дијагноза и лечење 606 00:35:12,630 --> 00:35:14,725 Опције за медицински стручњак. 607 00:35:14,725 --> 00:35:17,680 Где је потребно, пацијенти могу пружити информације 608 00:35:17,680 --> 00:35:21,210 да Ватсон, можда кроз Портал Веб интерфејс, таблета, 609 00:35:21,210 --> 00:35:23,500 или чак мобилни телефон. 610 00:35:23,500 --> 00:35:27,180 На пример, пацијент може бити затражио да опише своје симптоме 611 00:35:27,180 --> 00:35:30,460 на природном језику директно у Ватсон решење, 612 00:35:30,460 --> 00:35:34,050 омогућавајући да се фокусирају на лекар дијагноза, а не прикупљање података. 613 00:35:34,050 --> 00:35:38,379 614 00:35:38,379 --> 00:35:42,716 >> Ко је убио Абрахам Линколн? 615 00:35:42,716 --> 00:35:46,153 >> -Јохн Вилкс Бут. 616 00:35:46,153 --> 00:35:52,373 >> -У Шта год урадили Аризона Дајмондбекс освојити првенство? 617 00:35:52,373 --> 00:35:55,295 >> -2001. 618 00:35:55,295 --> 00:35:58,710 >> [Крај репродукције] 619 00:35:58,710 --> 00:36:01,610 >> Бриан СЦАССЕЛЛАТИ: Па овакви системи 620 00:36:01,610 --> 00:36:07,430 мора да се ослања на свега препознавање говора; друго, 621 00:36:07,430 --> 00:36:12,200 претварање га у смислена унутрашња заступање; и онда, трећи, 622 00:36:12,200 --> 00:36:17,090 бити у стању да изађу и пронађу извор информације које 623 00:36:17,090 --> 00:36:21,140 им омогућава да одговорим на то питање. 624 00:36:21,140 --> 00:36:27,320 Овај ниво комплексности укључује исте врсте програмских ствари 625 00:36:27,320 --> 00:36:31,790 да сте били раде у проблематичним сетовима. 626 00:36:31,790 --> 00:36:38,000 >> Ми смо у стању да анализирам ХТТП захтева у иста врста ниског нивоа образац 627 00:36:38,000 --> 00:36:40,810 подударање да ЕЛИЗА може да уради. 628 00:36:40,810 --> 00:36:45,070 Ми смо у могућности то претворити онима у унутрашње репрезентације, 629 00:36:45,070 --> 00:36:50,360 а затим их користе да би неки упит спољни базе података, могуће коришћењем СКЛ. 630 00:36:50,360 --> 00:36:53,530 631 00:36:53,530 --> 00:36:56,260 Све система који се данас гради 632 00:36:56,260 --> 00:37:00,520 да уради ову врсту природних језичке комуникације 633 00:37:00,520 --> 00:37:04,100 се гради на Исти принципи. 634 00:37:04,100 --> 00:37:09,530 >> Сада, чак и систем као Вотсон није довољно сложена 635 00:37:09,530 --> 00:37:14,820 бити у стању да одговори на произвољан питања о било којој теми. 636 00:37:14,820 --> 00:37:20,060 У ствари, они морају да буду структурирана унутар дате домена. 637 00:37:20,060 --> 00:37:24,440 Дакле, можете ићи онлине и можете наћи верзије Ватсон који раде добро 638 00:37:24,440 --> 00:37:27,700 у медицинске информатике. 639 00:37:27,700 --> 00:37:31,490 Или постоји једна на мрежи да само бави како 640 00:37:31,490 --> 00:37:34,540 да добре препоруке о оно пиво ће ићи са којима храна. 641 00:37:34,540 --> 00:37:37,060 642 00:37:37,060 --> 00:37:41,870 И у тим доменима, може да одговори на питања, 643 00:37:41,870 --> 00:37:46,130 пронаћи информације које су му потребне. 644 00:37:46,130 --> 00:37:48,270 >> Али не можете мешати и одговарају их. 645 00:37:48,270 --> 00:37:53,150 Систем који је обучен са базом хране и пива 646 00:37:53,150 --> 00:37:56,830 не ради добро када изненада ставите га у медицинском информатике 647 00:37:56,830 --> 00:37:59,770 baza podataka. 648 00:37:59,770 --> 00:38:05,680 Дакле, чак и наши најбољи системи тодаи се ослањају на нивоу прераде 649 00:38:05,680 --> 00:38:11,570 у којој смо ручно кодирање и зграда у инфраструктуру како би 650 00:38:11,570 --> 00:38:13,275 Да би овај систем вожњу. 651 00:38:13,275 --> 00:38:16,360 652 00:38:16,360 --> 00:38:20,710 >> Сада, последња тема желим бити у могућности да дођете до данас 653 00:38:20,710 --> 00:38:23,960 је око невербалне комуникације. 654 00:38:23,960 --> 00:38:29,290 Велики маса информација које комуницирамо једни са другима 655 00:38:29,290 --> 00:38:35,490 не долази преко појединачне речи које смо примјењују. 656 00:38:35,490 --> 00:38:40,290 То има везе са стварима као што су близина, поглед, твој тон гласа, 657 00:38:40,290 --> 00:38:42,270 Ваш модулација. 658 00:38:42,270 --> 00:38:46,620 И то је такође комуникација нешто што многи различити интерфејси 659 00:38:46,620 --> 00:38:49,960 брину много о. 660 00:38:49,960 --> 00:38:51,500 То није оно што Сири стало. 661 00:38:51,500 --> 00:38:56,250 Могу да питам Сири нешто у једном гласу или у неком другом тоном, 662 00:38:56,250 --> 00:38:59,840 и Сири ће дај ми исти одговор. 663 00:38:59,840 --> 00:39:05,260 Али то није оно што градимо за многе друге врсте интерфејса. 664 00:39:05,260 --> 00:39:09,120 >> Желим да вас упознам сада на један од робота. 665 00:39:09,120 --> 00:39:12,720 Ово је саградио мој дугогодишњи пријатељ и колега Синтија 666 00:39:12,720 --> 00:39:16,010 Бреазеал и њена компанија Јибо. 667 00:39:16,010 --> 00:39:20,090 И ово робот-- идемо да има неколико волонтера 668 00:39:20,090 --> 00:39:22,520 доћи до интеракције са овим. 669 00:39:22,520 --> 00:39:26,200 Дакле, могу ли да добијем двоје људи спремни да се игра са роботом за мене? 670 00:39:26,200 --> 00:39:29,936 Зашто не дођеш горе, а зашто не дођеш горе. 671 00:39:29,936 --> 00:39:31,310 Ако би ми се придружите овде, молим те. 672 00:39:31,310 --> 00:39:36,520 673 00:39:36,520 --> 00:39:39,670 >> И ако бих могао да те имам долазе овамо. 674 00:39:39,670 --> 00:39:40,170 Хвала. 675 00:39:40,170 --> 00:39:40,480 Здраво. 676 00:39:40,480 --> 00:39:41,400 >> Алфредо: Драго ми је. 677 00:39:41,400 --> 00:39:42,010 Алфредо. 678 00:39:42,010 --> 00:39:42,520 >> Бриан СЦАССЕЛЛАТИ: Алфредо. 679 00:39:42,520 --> 00:39:43,146 >> Рацхел: Рејчел. 680 00:39:43,146 --> 00:39:44,228 Бриан СЦАССЕЛЛАТИ: Рејчел. 681 00:39:44,228 --> 00:39:45,154 Драго ми је обоје. 682 00:39:45,154 --> 00:39:46,820 Алфредо ћу да ти први. 683 00:39:46,820 --> 00:39:47,990 Уђите овде. 684 00:39:47,990 --> 00:39:51,870 Идем да се уведе ти- ако могу да скинем ово 685 00:39:51,870 --> 00:39:58,450 без куцања на мицропхоне-- да мало робота по имену Јибо. 686 00:39:58,450 --> 00:40:00,140 ОК? 687 00:40:00,140 --> 00:40:04,260 >> Сада, Јибо је дизајниран да буде интерактивна. 688 00:40:04,260 --> 00:40:09,339 И мада може вам дати говор, велики дио интеракције са робота 689 00:40:09,339 --> 00:40:09,880 је невербална. 690 00:40:09,880 --> 00:40:12,450 691 00:40:12,450 --> 00:40:17,070 Алфредо ћу да вас замолим да кажу нешто лепо и поздравни 692 00:40:17,070 --> 00:40:19,554 са роботом, молим те. 693 00:40:19,554 --> 00:40:20,845 Алфредо: Мислим да изгледаш слатко. 694 00:40:20,845 --> 00:40:24,114 695 00:40:24,114 --> 00:40:25,611 >> [Зујање Соунд] 696 00:40:25,611 --> 00:40:26,192 697 00:40:26,192 --> 00:40:27,108 Бриан СЦАССЕЛЛАТИ: У реду. 698 00:40:27,108 --> 00:40:30,110 699 00:40:30,110 --> 00:40:33,180 Његов одговор је не вербално. 700 00:40:33,180 --> 00:40:35,180 А ипак ти је дао и јасна потврда 701 00:40:35,180 --> 00:40:39,680 да је чуо шта си рекао као и некако подразумева да. 702 00:40:39,680 --> 00:40:40,530 ОК? 703 00:40:40,530 --> 00:40:42,070 Корак враћам овде за једну секунду. 704 00:40:42,070 --> 00:40:43,130 Хвала вам. 705 00:40:43,130 --> 00:40:44,090 >> Рејчел, ако хоћете. 706 00:40:44,090 --> 00:40:46,070 Сада ћу дати Јеси ли ти много теже посао. 707 00:40:46,070 --> 00:40:48,361 Ако би стајати овде, бацк уп мало тако 708 00:40:48,361 --> 00:40:50,280 можемо те камером и погледај овај начин. 709 00:40:50,280 --> 00:40:56,840 Ја ћу да вас замолим да кажем нешто заиста значи и гадно са роботом. 710 00:40:56,840 --> 00:41:02,900 >> Рацхел: Оно што је изгледало да урадите је потпуно бесмислено. 711 00:41:02,900 --> 00:41:03,840 >> [Хумминг Соунд] 712 00:41:03,840 --> 00:41:07,610 713 00:41:07,610 --> 00:41:09,030 >> То је још више апсурдна. 714 00:41:09,030 --> 00:41:10,120 Шта се дешава са тобом? 715 00:41:10,120 --> 00:41:13,487 716 00:41:13,487 --> 00:41:16,207 Ма, не осећам лоше. 717 00:41:16,207 --> 00:41:17,040 Даћу вам један загрљај. 718 00:41:17,040 --> 00:41:19,882 719 00:41:19,882 --> 00:41:21,090 Бриан СЦАССЕЛЛАТИ: У реду. 720 00:41:21,090 --> 00:41:22,280 Хвала, Рејчел. 721 00:41:22,280 --> 00:41:24,565 Алфредо, Рејчел, хвала момци пуно. 722 00:41:24,565 --> 00:41:26,840 >> [АППЛАУСЕ] 723 00:41:26,840 --> 00:41:28,660 724 00:41:28,660 --> 00:41:34,470 >> Дакле, ова врста интеракције је у многи начини неке од истих правила 725 00:41:34,470 --> 00:41:36,950 а неке од истог структура као шта смо 726 00:41:36,950 --> 00:41:39,950 можда има у језичкој интеракцији. 727 00:41:39,950 --> 00:41:44,530 То је и комуникативна и има важну функцију. 728 00:41:44,530 --> 00:41:48,590 И то интеракција у много начина, је дизајниран 729 00:41:48,590 --> 00:41:52,890 да имају посебан дејство на Особа интеракцији са или слушања 730 00:41:52,890 --> 00:41:54,410 са роботом. 731 00:41:54,410 --> 00:41:56,450 >> Сада сам довољно срећан да Јибо данас. 732 00:41:56,450 --> 00:42:00,550 Сем Сполдинг је овде помаже нас са роботом. 733 00:42:00,550 --> 00:42:07,470 И ја ћу да питам Сам дати нас једна лепа демо Јибо плеса 734 00:42:07,470 --> 00:42:09,720 да можемо да гледамо овде на крају. 735 00:42:09,720 --> 00:42:10,590 Само напред, Јибо. 736 00:42:10,590 --> 00:42:11,550 >> Сам ОК, Јибо. 737 00:42:11,550 --> 00:42:14,430 Покажите нам своје плесне покрете. 738 00:42:14,430 --> 00:42:17,310 >> [Мусиц плаиинг] 739 00:42:17,310 --> 00:42:43,114 740 00:42:43,114 --> 00:42:44,780 Бриан СЦАССЕЛЛАТИ: У реду, сви. 741 00:42:44,780 --> 00:42:46,865 Захваљујући нашим пријатељима у Јибо. 742 00:42:46,865 --> 00:42:49,426 >> [АППЛАУСЕ] 743 00:42:49,426 --> 00:42:50,140 744 00:42:50,140 --> 00:42:54,990 >> А захваљујући нашим пријатељима у ИБМ за помогао данас. 745 00:42:54,990 --> 00:42:57,300 Комуникација је нешто да идеш 746 00:42:57,300 --> 00:43:02,280 да видим стиже све више и више као градимо сложеније интерфејса. 747 00:43:02,280 --> 00:43:05,760 Следеће недеље ћемо разговарати о томе како да интерфејс 748 00:43:05,760 --> 00:43:08,890 са компјутерским противника у играма. 749 00:43:08,890 --> 00:43:12,950 Али ако имате питања о томе, Ја ћу бити ту у радног времена вечерас. 750 00:43:12,950 --> 00:43:17,610 Драго ми је да разговарам са тобом о АИ тема или да уђу у више детаља. 751 00:43:17,610 --> 00:43:18,927 Желим ти леп викенд. 752 00:43:18,927 --> 00:43:21,409 >> [АППЛАУСЕ] 753 00:43:21,409 --> 00:43:21,909 754 00:43:21,909 --> 00:43:26,141 [Мусиц плаиинг] 755 00:43:26,141 --> 00:46:42,879