[Гуляе музыка] Дэвід малая: Гэта CS50. Гэта канец тыдня 10. І хлопчык, мы маем добры клас для вас сёння. Мы так рады запрасіць двух нашы сябры з Ельскага універсітэта да нас сёння і глядзець на скрыжаванні штучны інтэлект, робататэхніка, апрацоўкі натуральнай мовы, і многае іншае. І на самай справе, над Апошнія некалькі тыдняў, мы вядома, патрацілі шмат часу, асабліва ў ранніх psets, упорам на даволі нізкаўзроўневыя дэталі. І гэта вельмі лёгка страціць з-пад увагі лесу за дрэвамі і зацыклівацца на завесах і ўмоў і паказальнікі, вядома, і да таго падобнае. Але рэальнасць такая, што вы, хлопцы зараз ёсць інгрэдыенты, з якой вы можаце сапраўды вырашыць некаторыя цікавыя праблемы, у тым ліку ім тыя, што нашы сябры ў Ельскім універсітэце працаваць на проста саромеюцца Кембрыджы. Так што дазвольце мне спачатку прадставіць нашу галаву асістэнт ў Ельскім універсітэце, Эндзі. [Апладысменты] Эндзі: Перш за ўсё, дзякую Вы за тое, што пару Yalies поп ўніз ў Кембрыдж сёння. Мы вельмі цэнім гэта. Па-другое, для нашых сяброў таму home-- Джэйсана, дзякуй за знаходжанне і працуе лекцыю. Спадзяюся, што ўсё добра ў Нью-Хейвене. Так што так, я супер ўсхваляваныя ўвесці Scaz сёння. Scaz працуе лабараторыя робататэхнікі. Ён прафесар, як, пяць розныя аддзелы ў Ельскім універсітэце. У сваёй лабараторыі, ён мае шмат, шмат робаты, якія ён любіць гуляць з. Ён, быццам бы, круты ў свеце праца. І ён атрымлівае выгляд бязладзіцы вакол з, што на працягу ўсяго дня доўга і зрабіць некаторую працу, а таксама. І так мы на самай справе прынёс адзін З іх ўніз з намі сёння. Так што без далейшых цырымоній, Scaz з'яўляецца ісці наперад і прадставіць нас каб яго робата аднаму. [Апладысменты] Браян SCASSELLATI: Дзякуй, Дэвід. Дзякуй, Эндзі. Гэта так выдатна быць тут з усімі сёння. Я хачу, каб спачатку быць вельмі ясна, што CS50 Персанал тут у Кембрыджы быў неверагодна гасцінныя да нас. Мы так удзячныя за ўсё, яны зрабілі, каб падтрымаць нас. І таму мы хацелі б, каб быць у стане вярнуць дабрыню. Такім чынам, сёння мы атрымліваем абвясціць што мы будзем мець новы, адзін у сваім родзе CS50 падзей адбываецца ў Нью-Хейвене на наступным тыдні. І гэта CS50 Даследаванні Экспа. Такім чынам, мы збіраемся, каб запрашаць everyone-- CS50 студэнтаў, супрацоўнікі як Гарвард і Yale-- ў спусціцца і наведаць з намі ў пятніцу. Мы будзем мець самыя разнастайныя звыш 30 чалавек, якія прадстаўляюць розныя і exhibiting-- старшакласнікаў паказвае ад некаторых з сваіх даследчых прадуктаў. Мы будзем мець некаторыя стартапы, нават, гледзячы для трохі новага тэхналогій таленту, стартапы з абодвух Гарвард і Йель. І мы будзем мець некаторыя студэнцкія групы Гледзячы на ​​некаторыя новым складзе. Гэта будзе вельмі цікавы час. Спадзяюся, тыя з вас, хто спускаецца на Гарвард-Йель гульні будзе ў стане спыніць па ледзь-ледзь раней, прама ў цэнтры кампуса, Стэрлінг мемарыяльнай бібліятэкі. Мы збіраемся, каб мець набор Экспанаты, якія вар'іруюцца ад аўтаномнага ветразнікі у шляху з дапамогай праграмнага забеспячэння захаваць сярэднявечныя рукапісы. Мы збіраемся, каб мець аб'яву Спецыяльная сетка, і людзі выкладання кадаваньне праграмнага забеспячэння ў Кейптаўне. Мы будзем мець кампутар музычныя дэманстрацыі. І мы, вядома, больш робатаў. Таму мы спадзяемся, што вы далучыцца да нас на гэтым мерапрыемстве. Гэта павінна быць шмат весела, трохі ежы, і шмат цікавага рэчы, каб гаварыць аб. Такім чынам, сёння мы будзем казаць аб апрацоўкі натуральнага мовы. І гэта спроба нас пабудаваць новы спосаб спалучэння з нашымі прыладамі, таму што за апошнія некалькі тыдняў, Вы былі сканцэнтраваны на тым, як гэта тое, што Вы можаце напісаць код, напісаць праграму, што гэта спосаб быць у стане сказаць да машына, гэта тое, што я хачу, каб ты. Але мы не павінны на чакаць, што ўсе гэта там, што выкарыстоўваецца па ўсіх у свеце будзе валодаць у гэтым выглядзе інструкцыі. Так мы адрозніваем паміж кампутарам мовы і натуральна languages-- гэта значыць, тое, што людзі выкарыстоўваюць мець зносіны з іншымі людзьмі. І мы стараемся, каб пабудаваць інтэрфейсы, якія выкарыстоўваюць гэтыя прыродныя механізмы сувязі. Цяпер, як і любы іншы тэме што мы пачалі з у CS50, мы збіраемся пачаць з самага простага трохі апрацоўкі натуральнай мовы што мы можам сабе ўявіць. Мы збіраемся пачаць з Гістарычная частка натуральнага мовы. І тады мы будзем будаваць да ўсё больш і больш новых сістэмах і павесяліцца дэма на гэтым шляху. Такім чынам, мы збіраемся пачаць з таго, што было верагодна, першы натуральны мова сістэма апрацоўкі. Гэта была сістэма праграмнае забеспячэнне, напісанае ў 1966 Джозэф Weizenbaum называецца Эліза. І Эліза была распрацавана, каб прайграць выгляд ўзаемадзеяння вы б з Rogerian псіхатэрапеўт. Цяпер, Rogerians, яны былі ідэя, што псіхатэрапія удзел у стане адлюстраваць таму пацыенту і гаварыць з імі, у асноўным, толькі даючы ім малюсенькія трохі тэрапеўта. Гэта значыць, усё што тэрапеўт сказаў павінен быў быць проста адлюстраваннем што пацыент гаварыў з імі. Так давайце паспрабуем гэта дэма. У нас ёсць валанцёра, які б гатовыя падзяліцца іх глыбокае, цёмныя і / або падробленыя сакрэты з Элізай? Вядома, чаму б вам не прыйсці на да. Фантастычны. І ваша імя? Міль: Майлз. Браян SCASSELLATI: Майлз. Прыемна пазнаёміцца, Майлз. Калі вы трымаеце на гэта. І мы збіраемся выкарыстоўваць версію Элізы што мы прайграныя у CS50 IDE. І мы будзем глядзець на крыніцу код гэта ў той час. Але цяпер, мы проста збіраецца выклікаць яго набраўшы Элізу. І Эліза збіраецца даць вам адказы што будуць ва ўсіх сталіцах. І задам вам некалькі пытанняў. І мы будзем рэагаваць і ўвядзіце ў адказах на ELIZA. Так Эліза сказала, "Прывітанне, я Эліза. У чым праблема?" Што б вы хацелі расказаць Эліза сёння? Міль: Я магу толькі заснуць калі ў мяне ёсць трусік тэпцікі на. Браян SCASSELLATI: Добра. Добра. [Смех] "Я магу толькі заснуць з труса тэпцікі на ". І Эліза кажа, "Скажы, ты ёсць якія-небудзь псіхалагічныя праблемы? Можа быць, гэта добры паказчык ". ДОБРА. Так што б вы хацелі, каб адказаць? Міль: Так. Браян SCASSELLATI: Так. Чалавек шмат слоў. Мне падабаецца, што. Эліза кажа, "Вы, здаецца, вельмі станоўча." Міль: Не, я, на самай справе, электрон. Браян SCASSELLATI: "Няма На самай справе, я электрон ". "Вы прыйшлі да мяне таму што вы электрон? " Цяпер мы можам убачыць некаторыя з things-- я збіраюся каб прыпыніць вас на секунду, Майлз. Нікуды не сыходзь. Мы не зрабілі з вамі яшчэ. Эліза, у некаторых адносінах, рэагуе на пэўныя рэчы што ён кажа, але не рэальнага разумення. І гэта таксама папугай таму некаторыя з частак прысуду. Таму мы сказалі: "Не На самай справе, я электрон ". Эліза адказала таму, "Ты прыйшоў мне, таму што вы электрон? " Добра. Давайце дамо яму яшчэ адзін адказ тут. Дайце яму добры, Майлз. Міль: добры? Так, калі ласка, дапамажыце мне. Браян SCASSELLATI: "Так. Калі ласка, дапамажыце мне "." Вы ўпэўненыя? " Міль: Няма Браян SCASSELLATI: Няма "Што гэта прапанаваць вам?" Міль: Я не можа быць электронаў. Браян SCASSELLATI: "Я можа быць электрон ". "Ня Вы кажаце, не проста, каб быць адмоўным?" Добра. Так Майлз, дзякуй так шмат. Міль: Дзякуй. Браян SCASSELLATI: Дзякуй вельмі шмат. [Апладысменты] Так гэтая праграма Эліза, у многіх адносінах, рэагуе толькі на кавалкі што мы забяспечваем без якіх-небудзь глыбока разуменне таго, што тут адбываецца. Гэта свайго роду сістэма называецца шаблоне, дзе мы шукаем для некаторых біты тэксту, які мы затым збіраецца ўзяць з таго, што была прадастаўлена ў якасці ўваходных дадзеных, пераўтварыць яго, патэнцыйна, у пэўным сэнсе, а затым вярнуць яго назад карыстальніку. У любога з вас думаюць, што Эліза на самай справе выконваючы сапраўдны псіхааналіз тут? Адзін чалавек, магчыма. АЎДЫТОРЫЯ: [неразборліва]. Браян SCASSELLATI: А як гэта прымушае вас адчуваць сябе? Так, на самай справе, што ён робіць. І мы збіраемся, каб убачыць, на самай справе, то Зыходны код для яго ў хвіліну. І так вы будзеце ў стане зрабіць менавіта гэта. Цяпер, Эліза з'яўляецца адной з формаў таго, што мы сёння называем чат бот. Гэта проста ідзе праз Тэкст, які вы дае, забяспечвае мінімальная колькасць голай разумення або апрацоўкі, а затым Папугаі яго назад да вас. Такім чынам, давайце зірнем, канцэптуальна, і казаць пра тое, гэта тое, што Эліза на самай справе робіць. Эліза прымаючы sentence-- давайце кажуць, "я хачу, каб зрабіць уражанне майго боса". І Эліза глядзіць праз гэтай прапановы і спрабуе знайсці і адпавядаць пэўныя заканамернасці. Так, напрыклад, адзін з шаблонаў што Эліза шукае словы "Мне трэба." І ў любы час ён бачыць нешта што мае "Я хачу" у ім, гэта фармулюе адказ. І, што адказ з'яўляецца фіксаванай радком. У гэтым выпадку, гэта "чаму вы хочаце?" І я паклаў трохі зорку канец, таму што гэта проста пачатак нашага адказу. І зорка паказвае, што мы збіраемся ўзяць астатнюю з utterance-- карыстальніка "ўражанне майго боса" - і мы збіраемся дадаць, што на канец гэтага радка. Так што цяпер, замест таго, каб гаварыць, "чаму Вы хочаце зрабіць уражанне на майго боса ", ёсць трохі дадатковага апрацоўка, што мы будзем рабіць. Гэта значыць, мы павінны будзем пераўтварыць некаторыя з займеннікаў тут ад «майго боса" да "свайму босу." І там можа быць некалькі іншых змены, якія мы павінны зрабіць. Такім чынам, замест проста прытрымлівацца яго непасрэдна на канцы, што мы будзем рабіць што мы будзем прымаць астатнюю частку utterance-- карыстальніка ў белым here-- і мы будзем прымаць яго адзін кавалак на час і канвертаваць кожную радок маркер, кожнае слова, у сказе. Такім чынам, мы возьмем слова ", каб." Там няма пераўтварэнні што мы павінны зрабіць гэта. "Impress". Там няма пераўтварэнні мы павінны зрабіць там. "Мае" будзе канвертаваць ў "ваш". І "бос", мы проста пакінуць як "бос." І, нарэшце ,, нічога што заканчваецца перыяд, мы пераўтварыць яго ў пытанне. Гэта вельмі проста па шаблоне на самай справе даволі паспяхова. І калі гэта было ўведзена у 1966-- Язэпа Weizenbaum запраграмаваны гэтага на кампутары. Цяпер, кампутары ў той час ня настольныя мадэлі. Яны былі агульныя рэсурсы. І яго студэнты пайсці і прама з Элізай. У рэшце рэшт, ён павінен быў абмежаваць доступ да яго таму што яго студэнты не былі атрымліваць любую працу. Яны проста ў чаце з Элізай. І на самай справе, ён павінен быў звольніць памочніка, які правёў увесь свой час казаў з ELIZA аб яе глыбокіх і трывожных праблем. Кожны, хто выкарыстаў гэтыя сістэмы пачалі антропоморфизировать іх. Яны пачалі думаць пра іх, як быўшы адушаўлёным і рэальныя людзі. Яны пачалі прызнаваць некаторыя з тое, што яны кажуць вярталіся да іх. І яны даведваліся рэчы пра сябе. І на самай справе, нават спецыялісты, нават псіхатэрапеўты, пачалі турбавацца, што, па сутнасці, можа быць, Эліза будзе замяніць іх. І нават кампутар Навукоўцы занепакоеныя тым, што мы былі так блізка да вырашэння натуральны мову. Цяпер, што нідзе не было блізка да ісціны. Але гэта, як ўражвае гэтыя сістэмы могуць здацца. Такім чынам, давайце пачнем глядзець пад і паспрабуйце каб атрымаць крыху пытанне дзе гэты код на самай справе адбываецца. Такім чынам, мы будзем рабіць гэты код даступныя пазней. І гэта вельмі просты і прамой порт у арыгінальнай рэалізацыі ELIZA. Такім чынам, некаторыя з іх стылістычнай рэчы, якія вы тут бачыце, зьяўляюцца не стылістычна, што мы хацелі б, каб ты або тое, што мы вучылі вас зрабіць. Але мы імкнуліся трымаць іх тое ж самае праз многія парты што гэта была так, што ён мае водар арыгінала. Такім чынам, мы збіраемся ўключыць куча рэчаў, і тады мы будзем мець набор ключавых слоў, рэчаў што Эліза пазнае і рэагаваць непасрэдна. Так што, калі ў вас ёсць такія словы, як "Вы можаце" ці "я не" ці "не" або "так" ці "сон" або "прывітанне", а затым Эліза будзе выбарча рэагаваць на іх. Мы таксама маем пэўную колькасць рэчаў, што мы будзем мяняць, як пераўтварэнні "мой" на "ваш". І тады мы будзем мець набор адказаў што для кожнага з гэтых ключавых слоў, мы будзем чаргаваць праз гэтыя розныя адказы. Так што, калі я кажу "так" тры разы запар, я можа атрымаць тры розныя адказы ад ELIZA. Наш код, тады, на самай справе дзіўна проста. Калі я пракруціць ўніз міма ўсіх гэтых адказы, якія мы запраграмаваныя ў і мы прыступім да нашай асноўнай, мы збіраемся, каб ініцыялізаваць некалькі розных зменных і зрабіць трохі хатняга гаспадаркі у самым пачатку. Але тады ёсць абсалютна мноства кода, які вы можаце зразумець. Адзін вялікі, а цыкл, які кажа, што я збіраюся паўтараць гэта зноў і зноў. Я буду чытаць у лінію, і я буду захоўваць, што ў радку ўводу. Я праверыць і паглядзець, калі гэта Спецыяльнае ключавое слова "Да пабачэння", які азначае выхад з праграмы. І тады я буду праверыць і паглядзець, ці з'яўляецца хтосьці проста паўтараючы сябе зноў і зноў. І я буду крычаць на іх, калі яны робяць. Я кажу "не паўтараць сябе." Пакуль ні адзін з тых, хто не адбудзецца, мы будзем затым сканаваць і завесы праз, на лініях 308 да 313 тут, і праверыць і паглядзець, якія-небудзь з гэтых ключавых слоў фразы, якія змяшчаюцца на ўваходзе што я толькі што даў? Калі ёсць супадзенне для іх, а Затым, я буду памятаць гэтае месца. Я буду памятаць, што ключавое слова. І я буду ў стане пабудаваць адказ. Калі я не знайсці тое, ну а потым, апошняя рэч у маім ключавое слова масіва будзе мае адказы па змаўчанні, калі нічога не супадае. Я задаваць пытанні, як "Чаму вы сюды прыйшлі? "або" Як я магу вам дапамагчы? " якія толькі часткова падыходзіць незалежна ад таго, што ўваход. Затым мы пабудаваць адказ Элізы. Мы зможам ўзяць што база рэагавання, як мы гэта рабілі ў тым, што "мой бос" прыклад. Калі гэта ўсё, што ёсць is-- калі гэта ўсяго толькі адзін Радок, я павінен respond-- Я магу проста адправіць яго назад. Калі ён мае зорачку на канец яго, то я буду апрацоўваць кожны індывідуальны маркер ў астатнія рэакцыі карыстальніка і дадаць тых, хто ў, замена з слова ў слова, як мне трэба, каб. Усё гэта абсалютна тое, што вы маглі б пабудаваць. І на самай справе, спосабаў, у якіх мы апрацаваныя аргументы каманднага радка, спосаб, у якім у вас ёсць апрацоўваюцца з дапамогай HTTP запытаў выканайце тыя ж віды правілаў. Яны па шаблоне. Так Эліза адносна важна ўплыў на натуральнай мове таму што ён зрабіў, здавалася, як гэта было вельмі дасягальная мэта, як-то мы б быць у стане вырашыць гэтую праблему напрамую. Цяпер, гэта не азначае, што Эліза робіць усё, што мы хацелі б зрабіць. Вядома, няма. Але мы павінны быць у стане зрабіць што-то больш. Наш першы крок, каб пайсці за Эліза збіраецца каб быць у стане глядзець на ня тэксту, уводзімага ў клавіятуру, але прамовы, фактычны прамовы запісаныя ў мікрафон. Такім чынам, як мы глядзім на іх розных частак, мы прыйдзецца пабудаваць мноства мадэляў. Мы збіраемся, каб быць у стане каб перайсці ад нізкага ўзроўню акустычных information-- крок, амплітуда, frequency-- і пераўтварыць яго ў некаторыя адзінкі, якія мы магчымасць больш лёгка маніпуляваць і, нарэшце, маніпуляваць імі у словах і прапановах. Таму большасць распазнання прамовы Сістэмы, якія там сёння прытрымлівацца статыстычная мадэль, у якой мы будуем тры асобных ўяўленні аб тым, што што гукавы сігнал на самай справе ўтрымлівае. Пачнем з фанетычнай мадэлі што кажа аб толькі падставы гукі, якія я вытворчасці. Ці магу я вырабляць нешта Па-як у хлопчыка або D, як у сабакі? Як я даведаюся гэтыя два розныя тэлефоны як асобны і выдатны? На вяршыні, што мы затым пабудаваць слова вымаўленне мадэль, тое, што звязвае разам гэтыя асобныя тэлефоны і аб'ядноўвае іх у словы. І пасля гэтага мы будзем прымаць словы і мы сабраць іх з мовы мадэль у поўнай прысуду. Цяпер мы будзем казаць пра кожнага з іх незалежна адзін ад аднаго і паасобку. Але гэтыя тры мадэлі ўсё проста будзе статыстыка. І гэта азначае, што, калі мы працаваць з імі, мы будзем умець працаваць з іх усе адначасова. Добра. Давайце пачнем з нашага фанетычнага мадэлі. Так фанетычныя мадэлі заснаваныя на вылічальная тэхніка называецца схаваныя мадэлі Маркава. Гэтыя графічныя мадэлі, у якой я ёсць і прызнаць дзяржава свету а характарызуецца наборам функцый. І, што стан апісвае адну частку дзеянні, якое я займаўся. Так што, калі я думаю, што пра тое, гук «ма», як маці, Існуюць розныя камплектуючыя да гэтага гуку. Там гэта частка, дзе я малюю ў дыханні. І тады я кашалёк мае вусны. І я згарнуць мае вусны трохі назад трохі, каб зрабіць гэта "Ма" гук. І тады ёсць рэлізе. Мае вусны прыходзяць адзін ад аднаго. Паветра выштурхваецца. "Ма". Гэтыя тры розныя часткі будзе прадстаўленыя дзяржавамі ў гэтай graph-- пачатак, сярэдзіна і канец. І я б пераходы, дазволіў мне ехаць з аднаго стану на наступны з пэўнай верагоднасцю. Так, напрыклад, што М гук можа мець вельмі, вельмі кароткі спажыванне ў beginning-- "мм" - а затым ужо, вібрацыйны этап, калі я трымаю мой вусны і амаль humming-- "мммм", - а затым вельмі кароткі выбухны, дзе я выгнаць breath-- «ма». Прыхаваная мадэль Маркава прызначаныя для захопу той факт, што шлях, які я раблю што гук «ма» збіраецца каб быць трохі адрозніваецца ў яго часу, ад частаты, і яго магчымасцяў, чым так, што вы зрабіць гэта або так, што я мог бы зрабіць гэта, калі я кажу аб розных прымянення лісты. "Маці" і "ці магу я" будзе гук крыху па-іншаму. Такім чынам, каб распазнаць пэўны гук, мы б будаваць мадэлі Маркава, гэтыя схаваныя Маркоўскіх мадэлі, разнастайных тэлефоне, што я можаце прызнаць, разнастайныя гук, а затым паглядзець на акустычныя дадзеныя, што ў мяне ёсць і вызначыць статыстычна які з іх з'яўляецца найбольш верагодны каб падрыхтавалі гэты гук. ДОБРА. З гэтай мадэлі, мы тады пачаць будаваць на ім. Мы бярэм вымаўленне мадэль. Цяпер, часам вымаўленне мадэлі простыя і лёгка таму што ёсць толькі адзін спосаб вымаўляецца нешта. Іншыя часы, яны ты крыху больш складана. Вось даведнік па вымаўленню для гэтага чырвоную рэч, якая садавіна, якія вы робіце кетчуп з. Людзі не думаюць, што гэта плён. Дакладна? Зараз, ёсць шмат розных спосабаў што людзі будуць прамаўляць гэтае слова. Некаторыя скажуць, "шкарпэтку-May-палец». Некаторыя скажуць, "шкарпэтку мАг шкарпэткай." І мы можам захапіць, што з адзін з гэтых графічных мадэляў дзе, зноў жа, мы ўяўляем пераходы як якія маюць пэўную верагоднасць і звязаныя з імі верагоднасць. Такім чынам, у гэтым выпадку, калі б я, каб прытрымлівацца верхняя маршрут праз увесь гэты граф, Я б, пачынаючы з літары на далёкім левым, то "тая" гук. Я б верхнюю палову, "о", а затым "ма", а затым "а", а затым "тая", і "о". "Toe-травень-сыходжанне». Калі б я ўзяў ніжнюю шлях праз гэта, я буду атрымліваць "Та-ма-палец». І калі б я пайшоў уніз, а затым , Я хацеў бы атрымаць "TA-May-палец». Гэтыя мадэлі захапіць гэтыя таму што, калі адрозненні мы размесцім адзін з іх сістэмы распазнання, гэта будзе мець для працы з шмат рознага роду людзей, шмат розных акцэнтаў, і нават розныя віды выкарыстання адных і тых жа слоў. Нарэшце, на вяршыні, што, мы будзем будаваць нешта што выглядае сапраўды складаным, называецца мадэллю мовы, але на самой справе з'яўляецца самым простым з тры, таму што яны працуюць на тое, што называецца мадэлі N-грам. І ў гэтым выпадку, я пакажу вам, з двух частак мадэлі N-грам, А биграмм. Мы збіраемся зрабіць фізічную ідэю што часам некаторыя словы хутчэй за ўсё, прытрымлівацца дадзенае слова, чым іншыя. Калі я толькі што сказаў, "прагноз надвор'я", наступнае слова можа, верагодна, будзе "сёння" ці можа быць "надвор'е Прагноз заўтра ". Але гэта наўрад ці, каб быць " Прагноз надвор'я артышок ". Што моўная мадэль робіць ён захоплівае тыя статыстычна шляхам падліку, ад некаторых вельмі вялікі Корпус, усе асобнікі у якім адно слова варта за іншым. Так што, калі я бяру вялікі corpus-- як і любы Wall Street Journal што было выраблена з 1930 года, які з'яўляецца адным з стандартных corpuses-- і я з нецярпеннем праз усе што тэкст, і я лічу , Колькі разоў пасля "Прагноз" я бачу "сёння" і колькі разоў я бачу "Прагноз", затым "артышок", першая будзе значна больш верагодна. Гэта будзе з'яўляцца значна часцей. І таму ён будзе мець больш Верагоднасць, звязаная з ім. Калі я хачу, каб высветліць Верагоднасць ўсёй выказванні, то, я проста разбіць яго. Так што верагоднасць слыху прысуд "пацук з'ела сыр" верагоднасць словы "" Стартавы прысуд, і тады верагоднасць, што Слова "пацук" варта словы »,« і верагоднасць таго, што Слова "з'еў" варта "пацука", і верагоднасць таго, што "сыр" варта "з'еў". Гэта гучыць, як шмат статыстыка, шмат верагоднасцяў. І гэта ўсё, што яна ёсць. Але дзіўная рэч, калі вы робіце гэта з досыць вялікай выбаркі дадзеных, гэта працуе. І гэта працуе надзвычай добра. Мы ўсе ведаем, гэтыя тэхналогіі. Большасць аперацыйных сістэм пастаўляюцца з распазнаванне галасы ў гэтай кропцы. Мы выкарыстоўваем Siri і Кортаны і Echo. І гэтыя рэчы заснаваныя на гэты тып трохслаёвых model-- Фанетычны мадэль у ніжнім, а вымаўленне мадэль у сярэдзіне, і мадэль мовы на іх. Цяпер яны павінны зрабіць трохі больш чым для таго, каб адказаць на пытанні. Але прызнанне таго, што вы гаворыцца залежыць менавіта ад гэтага. Такім чынам, давайце браць прыклад тут. Так што ў мяне мой тэлефон седзячы тут пад камеры для дакументаў. І мы збіраемся пытаецца Siri на некалькі пытанняў. Усё ў парадку? Так што давайце прачынацца мой тэлефон тут. Сири, што надвор'е як у Нью-Хейвене сёння? Сири: Вось надвор'е Нью-Хейвен, штат Канэктыкут сёння. Браян SCASSELLATI: ОК. Такім чынам, спачатку вы ўбачылі, што Сири прызнаецца кожны з асобных слоў Затым вырабляецца і адказу. Мы пагаворым аб тым, як, што адказ заходзіць пра ў трохі. Але цяпер мы ведаем, што гэта толькі на аснове ад зыходных статыстычных дадзеных і гэты шаблоне тып падыходу, мы можам гуляць у некаторыя гульні з Сири. Так што я магу паспрабаваць яшчэ раз. Сири, што надвор'е бегемот Нью-Хейвен, сёння? Сири: ОК. Вось надвор'е Новы Хейвен, штат Канэктыкут на сённяшні дзень. Браян SCASSELLATI: Сири якога не бянтэжыла тым, што таму што гэта знайшоў pattern-- "Надвор'е", "сёння", "Нью-Хейвен." Вось тое, што ён адказвае каб, як Эліза. Добра. Давайце яго яшчэ адзін, нават смяшней прыклад. Сири, надвор'е артышок браняносца бегемот Нью-Хейвен? Сири: Дазвольце мне праверыць, што. Вось тое, што я знайшоў у Інтэрнэце за тое, што з'яўляюцца артышокі браняносца бегемот Нью-Хейвен. Браян SCASSELLATI: ОК. Так што, калі я іду досыць далёка ад гэтай мадэлі, Я магу блытаць, таму што яна не больш адпавядае шаблоне, што ён мае. І, што статыстычная рухавік, які кажа, што верагоднасць таго, што ў вас ёсць Словы бегемот і артышок разам, і браняносец? Гэта павінен быць нешта новае. Такім чынам, гэтыя тэхналогіі мы выкарыстоўваем кожны дзень. Калі мы хочам, каб ім адзін крок далей, хоць, на самай справе, калі мы хачу, каб мець магчымасць казаць пра што з'яўляецца тое, што гэтыя сістэмы рэагуюць на, мы павінны гаварыць, зноў жа, каля больш фундаментальнае мноства пытанняў. І гэта тэма ў сувязі што мы называем пытанне адказ. Гэта значыць, мы хочам, каб мець магчымасць, мэтай якіх так? АЎДЫТОРЫЯ: [неразборліва]. Браян SCASSELLATI: Мы атрымліваем у схаванай семантычнай апрацоўкі? Так што, так. Ёсць шмат рэчаў, якія з'яўляюцца адбываецца пад паверхняй з Siri і ў некаторых прыкладах Я збіраюся паказаць вам, у наступным там, дзе ёсць трохі у тэрмінах мадэлі што вы кажаце, што гэта важна. І на самай справе, гэта вялікая папярэднік для наступнага слайда для мяне. Так такім жа чынам, што нашы распазнання прамовы была пабудавана з некалькіх слаёў, калі мы хочам, каб зразумець, што гэта на самай справе, што Пры гэтым, мы зноў збіраемся абапірацца на аналіз шматслаёвай тэксту, які быўшы прызнанай. Таму, калі Сири на самай справе ў стане скажам, паглядзіце Я знайшоў гэтыя словы. Цяпер тое, што мне рабіць з імі? Першы кампанент часта прайсці і паспрабаваць прааналізаваць структура прапановы. І ў тое, што мы бачылі у пачатковай школе, часта як свайго роду дыяграм прысуды, мы збіраемся прызнаць, што некаторыя словы маюць пэўныя ролі. Гэтыя назоўнікі. Гэтыя займеннікі. Гэтыя дзеясловы. І мы збіраемся прызнаваць што для канкрэтнай граматыкай, у гэтым выпадку ангельскай граматыкі, існуе Дапушчальныя спосабы, у якіх я магу аб'яднаць іх і іншыя спосабы, якія ня сапраўдныя. Гэта прызнанне, гэтая структура, можа быць дастаткова, каб дапамагчы нам няшмат. Але гэта не зусім дастаткова для нас, каб быць у стане даць любы значэнне да таго, што, як гаворыцца тут. Каб зрабіць гэта, мы павінны спадзявацца на некаторы колькасць семантычнай апрацоўкі. Гэта значыць, мы будзем мець, каб паглядзець на тое, што пад кожнае з гэтых слоў фактычна выконвае як значэння. І ў самы просты спосаб зрабіць гэта, мы збіраемся звязаць з кожным словам што мы ведаем пэўную функцыю, некаторы пераўтварэнне, што яно дазваляе здарыцца. У гэтым выпадку, мы маглі б напішыце на Слова "Іаана" як імя ўласнае, што ён нясе з ім ідэнтычнасць. І мы маглі б пазначыць "Мэры", як такім жа чынам. У той час як дзеяслоў, як «любіць», што з'яўляецца асаблівае стаўленне што мы ў стане ўявіць. Цяпер, гэта не значыць, што мы разумеем што такое каханне, але толькі тое, што мы разумеем, ён у шляху сімвалічнай сістэмы. Гэта значыць, мы можам пазначыць гэта і маніпуляваць. З кожным з гэтых тыпаў падыходаў, любы тып семантычнай апрацоўкі тут будзе патрабаваць трохі трохі ведаў і шмат працы з нашага боку. Мы больш не знаходзімся ў галіне дзе проста статыстыка будуць дастаткова для нас. Зараз, для таго, каб перайсці З гэтага пункту да таго, ў стане гаварыць аб унутранай што на самой справе адбываецца тут, каб быць у стане кіраваць гэтым структураваць і зразумець пытанне а затым у стане каб выйсці і пошук, што патрабуе больш Комплекс кагнітыўная мадэль. Тое, якім чынам пабудаваныя гэтыя сістэмы гэта па большай частцы вельмі, вельмі працы інтэнсіўна. Яны ўключаюць людзей марнаваць шмат часу структуравання шляху ў якіх гэтыя віды прапаноў можа быць прадстаўлена ў некаторай логікі. Гэта становіцца яшчэ трохі больш складаным, аднак. Нават калі мы мелі справу з семантыкай, мы будзем усё роўна прыйдзецца глядзець на прагматыка, што кажуць. Гэта значыць, як я стаўлюся словы што ў мяне ёсць нешта фізічна з ёсць у свеце або на Прынамсі, некаторыя крыніца інфармацыі што я магу маніпуляваць? Часам гэта прыводзіць да выдатныя біты двухсэнсоўнасці. "Чырвона-гарачая зорка ажаніцца астраном." ДОБРА. Зараз, мы чытаем, што, як смешна тып загаловак што мы хацелі б бачыць на канцы тэлевізар ноччу таму што мы не інтэрпрэтаваць "зорка" мець свой нябесны сэнс цела. Мы ведаем, што гэта азначае, што больш звычайным акцёр ці актрыса з высокім утрыманнем бачнасці. "Каманда дапамагае ад укусаў сабак ахвяру." Хіба што атрад на самай справе там дапамогу сабаку пры абыходзе і кусаць ахвяры? Ці гэта, што было чалавек, які быў ўкусіла сабака, хто меў патрэбу ў дапамозе? Проста гледзячы на ​​сінтаксісу і семантыка прапаноў, мы не можам вызначыць, што. "Верталёт сілкуецца ад чалавека мух." Існуюць, па сутнасці, фактычная дробязі лётаюць, што людзі з крыламі харчавання верталёты на карысць чалавецтва? Ці ёсць адно механічнае прылада што атрымлівае сваю ўладу ад чалавека? Калі мы глядзім на пытанне адказваючы сістэмы, гэтыя пласты, мы павінны мець справу з. Цяпер, лепшы і самы роду пераважае з гэтых сістэм сёння ў стане зрабіць рэчы на ​​ўзроўні, якія далёка за межы таго, што мы 10 гадоў таму. Вось адзін з лепшых сістэм гэта там сёння. І гэта сістэма ад IBM называецца Уотсан. Гэта ад нашых сяброў у IBM. Гэта Кэтрын банкі, Цзя Чэнь, і Прысцыла Мораиш даючы нам дэманстрацыя Уотсан Учора ў IBM Йорктаун. [Прайграванне відэа] -Як ты? -Я Добра. Я заўсёды рады, калі я думаць, асабліва калі я можа заставацца прахалодным ў гэтых серверных. -Хто Ваш любімая акторка? -Моя Любімая актрыса Анджэліна Джолі, як Лара Крофт у Tomb Raider, таму што яе арыгінала форма была ў якасці віртуальнага персанажа, як мяне. -Як Уотсан дапамагчы пацыентам? -Гэта План для пацыентаў мець доступ да Уотсан непасрэдна? Доступ да Watson кансультавання прыкладання будзе залежаць ад выкарыстання. Але ў цяперашні час, Уотсан толькі забяспечваюць можна дыягностыка і лячэнне варыянты для медыцынскіх работнікаў. У выпадку неабходнасці, пацыенты можа прадастаўляць інфармацыю Уотсан, магчыма, праз Партал вэб-інтэрфейс, таблеткі, ці нават мабільны тэлефон. Напрыклад, пацыент можа быць папрасілі апісаць свае сімптомы на натуральнай мове непасрэдна у раствор Уотсан, што дазваляе лекару засяродзіцца на дыягностыка і ня збор дадзеных. -Хто Забіты Абрагам Лінкальн? Іаана Уилкс Бут. -У Каком годзе Арызона Diamondbacks выйграць World Series? -2001. [КАНЕЦ ПРАГЛЯДУ] Браян SCASSELLATI: Так гэтыя віды сістэм павінны спадзявацца на першую чаргу прызнаючы прамовы; па-другое, ператвараючы яго ў значны ўнутраны прадстаўленне; і затым, па-трэцяе, будучы ў стане выйсці і знайсці крыніца інфармацыі, які дазваляе ім адказаць на гэтае пытанне. Гэты ўзровень складанасці мяркуе тыя ж тыпы праграмных рэчаў што вы былі рабіць у праблемных мностваў. Мы можам разабраць HTTP запытаў у той жа тып ўзору нізкага ўзроўню адпаведнасць, што Эліза можа зрабіць. Мы можам пераўтварыць тыя, ва ўнутранае прадстаўленне, а затым выкарыстоўваць іх для запыту некаторыя знешняя база дадзеных, магчыма, з выкарыстаннем SQL. Усе сістэмы, якія будуюцца сёння каб зрабіць гэты тып прыродных мова зносін будуюцца на гэтыя ж прынцыпы. Цяпер, нават сістэма, як Уотсан не дастаткова складаным каб быць у стане адказаць на адвольнае пытанні аб любой тэме. І на самай справе, яны павінны быць структураваныя ў дадзенай галіне. Такім чынам, вы можаце выходзіць у інтэрнэт і вы можаце знайсці версіі Уотсан, якія працуюць добра у медыцынскай інфарматыцы. Ці ёсць адзін онлайн што толькі тычыцца таго, як каб зрабіць добрыя рэкамендацыі аб тое, што піва будзе ісці з якой ежа. І ў гэтых галінах, ён можа адказваць на пытанні, знайсці інфармацыю, што ён мае патрэбу. Але вы не можаце зьмешваць і спалучаць іх. Сістэма, якая была падрыхтоўку з базай дадзеных прадуктаў харчавання і піва не працуюць добра, калі вы раптам пакласці яго ў з медыцынскай інфарматыкі базы дадзеных. Так што нават нашы самыя лепшыя сістэмы сёння спадзявацца на ўзроўні апрацоўкі у якім мы рука кадаваньне і будаўніцтва ў інфраструктуру ў парадак Каб гэтая сістэма працаваць. Цяпер, апошняя тэма я хачу каб быць у стане дабрацца да сённяшняга дня аб невербальнае камунікацыі. Выдатны маса інфармацыі, мы маем зносіны адзін з адным не адбылося праз асобныя словы, якія мы ўжываем. Гэта мае дачыненне да рэчы, як Блізкасць, погляд, ваш тон голасу, Ваш перагіну. І, што камунікацыя з'яўляецца таксама тое, што многія розныя інтэрфейсы надаю шмат пра. Гэта не тое, што Сири клапоціцца аб. Я магу папрасіць Siri то ў адзін голас або ў іншым тоне, і Сири збіраецца даць мне той жа адказ. Але гэта не тое, што мы будуем для многія іншыя тыпы інтэрфейсаў. Я хачу пазнаёміць вас Цяпер да аднаго з робатаў. Гэта было пабудавана маім даўнім сябар і калега Сінція Breazeal і яе кампанія Jibo. І гэта robot-- мы збіраемся мець пару добраахвотнікаў прыдумаць, каб ўзаемадзейнічаць з гэтым. Так я магу два чалавекі гатовыя гуляць з робатам для мяне? Чаму вы не прыйшлі на уверх, і чаму вы не прыйшлі на да. Калі вы далучыцца б мяне тут, калі ласка. І калі я мог бы вам прыйсці прама сюды. Дзякуючы. Прывітанне. ALFREDO: Прыемна пазнаёміцца. Альфрэда. Браян SCASSELLATI: Альфрэда. Рейчел: Рейчел. Браян SCASSELLATI: Рэйчел. Прыемна пазнаёміцца, і іншае. Альфрэда, я іду, каб вы ісці першым. Прыходзьце прама тут. Я збіраюся прадставіць you--, калі я магу атрымаць гэта ад без груку ў microphone-- у маленькага робата па імі Jibo. ДОБРА? Цяпер, Jibo прызначаны для інтэрактыўнай. І хоць гэта можа даць вам гаворка, вялікая частка ўзаемадзеяння з робатам гэта невербальны. Альфрэда, я збіраюся папрасіць вас сказаць нешта прыгожа і бясплатны да робату, калі ласка. ALFREDO: Я думаю, што вы выглядаць міла. [Гудучы гук] Браян SCASSELLATI: ОК. Яго адказ не вербальны. І ўсё ж ён даў вам і ясна прызнанне што ён чуў, што вы сказалі, а таксама нейкім чынам зразумеў, што. ДОБРА? Крок назад тут на працягу адной секунды. Дзякуй. Рэйчел, калі вы б. Зараз, я збіраюся даць Вам значна складаней праца. Калі вы хочаце стаяць прама тут, рэзервовае капіраванне толькі трохі, так што мы можам атрымаць вас на камеру і паглядзіце гэты шлях. Я папрашу вас нешта сказаць на самай справе азначае і непрыемны для робата. Рейчел: Што вы толькі што, здавалася, трэба было цалкам абсурдна. [Гудзенне] Гэта было яшчэ больш абсурдна. Што з табой адбываецца? Ой, не адчуваю сябе дрэнна. Я дам вам абняць. Браян SCASSELLATI: Добра. Дзякуй, Рэйчел. Альфрэда, Рэйчел, дзякуй, хлопцы вельмі шмат. [Апладысменты] Так што гэта выгляд ўзаемадзеяння мае ў шмат спосабаў некаторыя з тых жа правілаў і некаторыя з тых жа структура, тое, што мы маглі б мець у моўнай ўзаемадзеяння. Гэта і камунікатыўныя і служыць важнай мэты. І, што ўзаемадзеянне ў шмат спосабаў, прызначана мець асаблівае ўплыў на чалавек, узаемадзейнічаючы з або слухаць да робату. Зараз, я пашчасціла мець Jibo тут сёння. Сэм Сполдинг тут дапамагае нам з робатам. І я збіраюся спытаць Сэма, каб даць нас адным з добра дэма Jibo танцы што мы можам назіраць у канцы тут. Так што наперад, Jibo. СЭМ: ОК, Jibo. Пакажыце нам вашыя танцавальныя руху. [Гуляе музыка] Браян SCASSELLATI: Добра, усё. Дзякуючы нашым сябрам у Jibo. [Апладысменты] А дзякуючы нашым сябрам у IBM за дапамогу сёння. Сувязь-то што вы збіраецеся каб убачыць прыдумляць ўсё больш і больш мы будуем больш складаныя інтэрфейсы. На наступным тыдні, мы будзем казаць пра тое, як узаемадзейнічаць з кампутарнымі супернікамі ў гульнях. Але калі ў вас ёсць пытанні з гэтай нагоды, Я буду вакол у працоўны час сёння. Я шчаслівы пагаварыць з вамі пра AI тэмы або трапіць у больш падрабязна. Майце вялікі выходныя. [Апладысменты] [Гуляе музыка]