[Музички] Дејвид MALAN: Ова е CS50. Ова е крајот на недела 10. И момче, го имаме добра класа за вас денес. Ние сме толку возбудени да го покани двајца нашите пријатели од Јеил до нас денес и да се погледне во пресекот на вештачка интелигенција, роботика, Обработка на природни јазици, и многу повеќе. И навистина, во текот на изминатите неколку недели, ние сме секако, помина многу време, особено во почетокот psets, фокусирајќи се на доста ниско ниво на детали. И тоа е многу лесно да се изгуби од вид на шумата за дрва и се спушти слушалката на јамки и услови и покажувачи, секако, и слично. Но реалноста е дека вие момци сега имаат состојки со кои можете да навистина решавање на некои интересни проблеми, меѓу ги оние дека нашите пријатели во Јеил работат на само срамежливи од Кембриџ. Па дозволете ми најнапред да се воведе нашата глава асистент на Јеил, Енди. [Аплауз] ANDY: Прво на сите, само благодарам што му дозволивте неколку Yalies да се поп на одредување на Кембриџ денес. Ние навистина го ценат. Второ, на нашите пријатели назад home-- Џејсон, Ви благодариме за останување и водење на предавањето. Надевам дека сето тоа е добро во Њу Хејвен. Така да, јас сум супер возбуден да се воведе Scaz денес. Scaz истече од лабораторија роботиката. Тој е професор по, како, пет различни сектори на Јеил. Во неговата лабораторија, тој има многу, многу роботи кои тој сака да си игра со. Тој е, како, на Најкул работа во светот. И тој добива да се вид на хаос околу со кој целиот ден долги и направи некои работи, како и. И така ние всушност донесе еден од нив надолу со нас денес. Значи без понатамошно ado, Scaz е да се оди напред и да се воведе нас на неговиот робот пријател. [Аплауз] Брајан SCASSELLATI: Ви благодариме, Дејвид. Благодарение, Енди. Тоа е толку прекрасно да се биде тука со сите денес. Сакам прво да биде многу јасно дека персоналот на CS50 тука во Кембриџ е неверојатно гостопримливи за нас. Ние сме толку благодарен за сè тие го направиле за да не поддржат. И така ние би сакале да бидете во можност да се врати на добрина. Така, денес, ние се да го објави дека ние ќе треба да имаат нова, една-of-a-вид CS50 настан случува во Њу Хевн следната недела. И ова е CS50 Истражувања Експо. Па ние ќе треба да се покани everyone-- CS50 студенти, персоналот од двете Харвард и Yale-- да дојде и да ја посетите со нас во петокот. Ќе имаме широк спектар на над 30 различни луѓе презентирање и exhibiting-- upperclassmen прикажување исклучи некои од нивните истражувања производи. Ќе имаме некои стартап, дури, се обидува да за малку на нови технолошки талент, стартап од двете Харвард и Јеил. И ќе имаме некои студентски групи во потрага по некои нови членство. Тоа се случува да биде многу возбудливо време. Се надевам дека оние од вас кои се слегува за Харвард, Јеил игра ќе бидат во можност да се запре со малку рано, право во центарот на кампусот, Стерлинг Спомен библиотека. Ние ќе треба да се има во собата на експонати кои се движат од автономните едрилици за начините за користење на софтвер за зачувување на средновековни ракописи. Ние ќе треба да се има реклама хок вмрежување и луѓе настава софтвер за кодирање во Кејп Таун. Ние ќе треба компјутер музика демонстрации. А ние секако ќе имаат повеќе роботи. Па ние не ги надевам дека ќе ни се придружат за овој настан. Тоа треба да биде многу забава, малку на храна, и многу интересни што да зборувате. Така, денес, ние се случува да се зборува за обработка на јазикот. И ова е обид за нас за изградба на нов начин на поврзување со нашите уреди, бидејќи во последните неколку недели, сте биле фокусирани на тоа како е тоа што можете да се напише код, пишуваат софтвер тоа е начин да се биде во можност да се каже на машина, ова е она што сакам да го направам. Но, ние не треба да треба да Очекуваме дека сè тоа е таму што се користи од сите во светот се случува да се знаат во овој вид на настава. Значи ние се прави разлика помеѓу компјутер јазици и природни languages-- односно работи кои луѓето ги користат да комуницираат со други луѓе. И ние се обидуваме да се изгради интерфејси кои користат овие природни механизми за комуникација. Сега, само како и секоја друга тема дека ние сме отворени, со во CS50, ние ќе треба да се започне со наједноставниот малку на природниот јазик обработка дека ние може да се замисли. Ние ќе треба да се започне со историскиот дел на природниот јазик. А потоа ние ќе се изгради до повеќе и повеќе најновите системи и да имаат некоја забава демо снимки на патот. Па ние ќе треба да почнеме со она што беше веројатно првиот природен јазик за обработка на системот. Ова беше систем софтвер напишан во 1966 година од страна на Јосиф Weizenbaum вика Елиза. И Елиза е дизајниран за да реплицираат во вид на интеракција вие ќе треба со Rogerian психотерапевт. Во овој момент, Rogerians, морале една идеја која психотерапија вклучени се биде во можност да се огледало назад на пациентот и да разговараат со нив, во основа, само им даваат мал малку на терапевтот. Тоа е, се ' кој терапевтот рече требаше да биде само одраз на што пациентот ја кажува на нив. Значи, да се обиде и демо ова. Дали имаме волонтер кој ќе биде подготвени да ги споделат нивните најдлабоки, најмрачните, и / или лажни тајни со Елиза? Секако, зошто не дојде на до. Фантастично. И вашето име? MILES: Мајлс. Брајан SCASSELLATI: Мајлс. Убаво да ви се исполнат, Мајлс. Ако сакаш да го задржи тоа. И ние ќе треба да користите верзија на ELIZA дека ние сме пресликани во рамките на CS50 ИРО. И ние ќе се погледне на изворниот кодот на оваа по малку време. Но за сега, ние сме само случува да го повикате со внесување Елиза. И Елиза се случува да ви даде одговори кој се случува да биде во сите главни градови. И ќе ви поставам неколку прашања. И ние ќе одговориме и тип во одговор на Елиза. ELIZA па рече: "Здраво, јас сум Елиза. Што е проблемот? " Што би сакале да кажете ELIZA денес? MILES: Јас можам да падне само спие ако имам зајаче влечки. Брајан SCASSELLATI: Во ред. Во ред. [Смеа] "Можам да падне само спие со зајаче влечки. " И Елиза вели: "Велат, ќе се направи имате било какви психолошки проблеми? Можеби ова е добар показател. " ВО РЕД. Значи она што би сакал да се одговори? MILES: Да. Брајан SCASSELLATI: Да. Човек од многу зборови. Уживам во тоа. Елиза, вели, "Ти се чини доста позитивни." MILES: Не, јас сум, всушност, еден електрон. Брајан SCASSELLATI: "Не Всушност, јас сум еден електрон. " "Дали ќе дојде до мене бидејќи вие сте еден електрон? " Сега, можеме да видиме некои од на things-- Одам да ви пауза за само една секунда, Мајлс. Не оди никаде. Ние не сме направиле со вас уште. Елиза е, на некој начин, одговарање на некои работи што тој го вели, но без било вистинско разбирање. И тоа е, исто така повторува назад некои на делови од својата казна. Така што рековме, "број Всушност, јас сум еден електрон. " Елиза одговори назад, "Дали ќе дојде за мене, бидејќи вие сте еден електрон? " Во ред. Ајде да се даде уште една одговор тука. Го даде добра, Мајлс. MILES: Добар еден? Да, ве молам да ми помогнете. Брајан SCASSELLATI: "Да. Ве молам помогнете ми. "" Дали сте сигурни? " MILES: Не Брајан SCASSELLATI: Не "Што значи дека укажуваат на тоа за вас?" MILES: Јас не може да биде еден електрон. Брајан SCASSELLATI: "Јас не може да биде еден електрон. " "Дали сте велејќи дека нема само да биде негативно?" Во ред. Па Мајлс, ти благодарам многу. MILES: Ви благодарам. Брајан SCASSELLATI: Ви благодарам многу. [Аплауз] Значи оваа програма Елиза, на многу начини, реагира само на парчиња дека ние сме обезбедување без длабока разбирање на она што се случува овде. Ова е еден вид на систем наречен пребарување, каде ние сме во потрага за некои деловите од текстот, дека ние сме тогаш случува да се земе од она што беше предвидено како влез, да го конвертирате, потенцијално, на некој начин, а потоа ја даде назад до корисникот. Дали некој од вас мислат дека Елиза е всушност вршење валидна психоанализата тука? Едно лице, можеби. ПУБЛИКАТА: [Беззвучен]. Брајан SCASSELLATI: И како Дали тоа се направи да се чувствувате? Да, всушност, го прави тоа. И ние ќе треба да се види, всушност, изворниот код за тоа во само еден миг. И така си оди за да биде можност да го стори токму тоа. Сега, Елиза е една форма на она што ние би го нарекол денес разговор бот. Тоа само оди преку текстот што сте обезбедување, обезбедува минимум сума на разбирање или преработка, а потоа го папагали вратам на вас. Па ајде да ги разгледаме, концептуално, и зборува за она тоа е дека Елиза е всушност прави. ELIZA изведува sentence-- ајде каже, "Сакам да ги импресионираат мојот шеф." И Елиза е во потрага преку кои се изрекува и се обидува да се најде и да одговараат на одредени модели. Така, на пример, еден од моделите дека Елиза е во потрага по се зборовите "Јас сакам." И во секое време се гледа нешто кој има "сакам", во него, ќе го дефинира одговорот. И тој одговор е фиксна низа. Во овој случај, тоа е "зошто сакаш?" И јас се стави малку ѕвезда на крајот, бидејќи тоа е само на почетокот на нашиот одговор. И ѕвездата укажува дека ние ќе треба да ги преземе остатокот на utterance-- на корисникот "за да ги импресионираат мојот шеф" - и ние ќе треба да се додаде дека кон крајот на оваа низа. Па сега, наместо велејќи: "зошто Дали сакате да ги импресионираат мојот шеф " таму е малку на дополнителните обработка дека ние ќе направиме. Тоа е, ние ќе мора да конвертирате некои заменки тука од "мојот шеф" да "на вашиот шеф." И може да има неколку други промени кои треба да се направат. Така, наместо само да го држат директно на крајот, она што ние ќе направиме е, дека ќе ги преземе останатите utterance-- корисникот во бело here-- и ќе го земе едно парче во време и конвертирате секој стринг знак, секој збор, во реченицата. Па ние ќе земе збор "да". Нема конверзија дека треба да го направите тоа. "Impress." Нема конверзија ние треба да се направи таму. "Мојот" ќе се претворат во "ти". И "шеф" ние само ќе заминат како "шефот". А потоа, конечно, нешто која завршува со еден период, ние ќе го претворите во прашање. Оваа многу едноставна шема за појавување е всушност доста успешна. И кога тоа беше воведен во 1966-- Јосиф Weizenbaum програмирани тоа на компјутер. Сега, компјутери во тоа време не беа десктоп модели. Тие беа споделени ресурси. И неговите студенти ќе одат и да разговарате со Елиза. На крајот, тој морал да да го ограничи пристапот до неа бидејќи неговите ученици не беа добивање на било која работа. Тие беа само разговор со Елиза. И дека, всушност, тој мораше да оган неговата асистент, кој поминал сите од своето време да разговараат со ELIZA за длабоко загрижувачки и нејзините проблеми. Сите оние кои се користат овие системи почнал да ги anthropomorphize. Почнаа да се размислува за нив како се живи и вистински луѓе. Тие почнаа да го признае некои од работите што тие велеа На враќање на нив. И тие се дознаваат работи во врска со самите себе. И дека, всушност, дури и на експертите, дури и психотерапевти, почна да се загрижени дека, всушност, можеби Елиза ќе биде замена на нив. Па дури и на компјутер Научниците се загрижени дека бевме толку блиску до решавање на природниот јазик. Сега, тоа не е никаде во близина на вистина. Но тоа е како импресивен овие системи може да изгледа. Значи, да почнеме да се погледне под него и да се обиде да се добие малку на прашање од каде што овој код всушност се случува. Па ние ќе се направи овој код достапни потоа. И ова е многу едноставен и директен порта на оригиналниот имплементација на Елиза. Па така некои од овие стилистички работи кои што ќе видите тука не се она што стилистички ние би сакале да се направи или она што ние сме во наставата може да се направи. Но, се обидовме да ги задржиме иста низ многу пристаништа дека ова има, така што тоа има вкус на оригиналот. Па ние ќе треба да се вклучат еден куп работи, и тогаш ќе имаме збир на клучни зборови, работите ELIZA дека нема да ја признае и да одговори директно. Значи, ако имате зборови како "може да ви" или "не" или "не" или "да" или "сон" или "Здраво", тогаш ELIZA ќе одговори на тие селективно. Исто така, ќе имаме одреден број на нештата дека ние ќе се разменуваат, како конвертирање "мојот" на "ти". А потоа ќе има во собата на одговорите дека за секој од овие клучни зборови, ние ќе ротираат преку овие различни одговори. Значи, ако јас се каже "да" три пати по ред, јас може да се добие три различни Одговорите од Елиза. Нашиот код, тогаш, е всушност неверојатно едноставно. Ако јас дојдете долу минатото сите овие одговори дека сме програмирани и ние да се фаќате за нашите главни, ние ќе треба да се иницијализира неколку различни променливи и да се направи малку на домаќинство во почетокот. Но, тогаш постои апсолутно сет на код кој може да се разбере. Една голема додека јамка која вели дека сум нема да се повтори овој одново и одново. Јас ќе го прочитате во една линија, а јас ќе продавница, во којашто во влез стринг. Јас ќе се провери и да видат дали тоа е специјални клучни зборови "пријатно", кој значи излез од програмата. А потоа јас ќе се провери и да се види дали некој е само да се случуваат одново и одново. А јас ќе се развикам нив ако тие го прават. Ќе го кажам ", не се повтори." Се додека ниту еден од тие се случи, ние ќе потоа скенира преку и поминете, на линии 308-313 тука, и да се провери и да се види Дали некој од оние клучни зборови фрази содржани во влез дека сум бил само дава? Ако постои натпревар за нив, добро Тогаш, јас ќе се сеќавам на таа локација. Ќе се сеќавам овој клучен збор. И Јас ќе бидам во можност да се изгради еден одговор. Ако јас не се најде еден, добро тогаш, последното нешто во мојот низа клучни зборови ќе ми одговори дифолт, кога ништо друго не се совпаѓа. Јас ќе поставуваат прашања од типот: "Зошто ти го направи дојде овде? "или" Како можам да ви помогнам? " кои се само делумно е соодветно без разлика што влезот е. Тогаш ние ќе се изгради до одговор на Eliza. Ние ќе бидеме во можност да ги искористат таа база на одговор, како што сторивме и во таа "мојот шеф" на пример. Ако тоа е се што има is-- ако тоа е само еден стринг дека јас сум требало да respond-- Јас само може да го испрати назад надвор. Ако има ѕвездичка во на крајот од неа, тогаш ќе обработува секој поединец во знак остатокот од одговорот на корисникот и да го додадете во оние, Замена надвор од збор до збор, како јас треба да се. Сето ова е апсолутно нешто што може да се изгради. И всушност, начините на кои ние имаат обработени аргументи на командната линија, начинот на кој што го имаме обработуваат преку HTTP барања следат истите видови на правила. Тие се модел за појавување. Па ELIZA имаше релативно значајна влијание врз природниот јазик затоа што тоа го направи да изгледа како да е многу реален цел, како на некој начин ние би биде во можност да се реши овој проблем директно. Сега, тоа не е да се каже дека не ELIZA сето она што ние би сакале да се направи. Секако дека не. Но, ние треба да бидат способни да се направи нешто повеќе. Нашиот прв чекор да се оди надвор ELIZA се случува за да може да се погледне во не текста се внесени во тастатурата но говорот, фактичката говор снимен во микрофон. Така како што изгледаат на овие различни парчиња, ние сме ќе мора да се изгради сет на модели. Ние ќе треба да се има за да може да се оди од акустична на ниско ниво information-- теренот, амплитуда, frequency-- и конвертирате дека во некои единици, дека ние сме можност да полесно се манипулира и, конечно, да манипулира со нив во зборови и реченици. Па повеќето препознавање на говор системи кои се таму и денес следете статистичка модел во кој ќе се изгради три одделни прикази на она што аудио сигнал дека, всушност, содржи. Започнуваме со фонетски модел што зборува за само основата звуци кои јас сум за производство. Сум за производство на нешто што е Б, како и во момче или D како во куче? Како можам да ги признае овие две различни телефони, како одделни и различни? Згора на тоа, тогаш ние ќе се изгради еден изговор модел на текст, нешто што ги поврзува тие поединечни телефони и ги комбинира во еден збор. И после тоа, ние ќе ги преземе зборови а ние ќе ги соберат со јазик модел целосно реченица. Сега, ние ќе треба да се зборува за секоја на овие независно и одделно. Но овие три модели се сите само ќе биде статистички податоци. А тоа значи дека кога ние работи со нив, ние ќе да биде во можност да работат со сите нив истовремено. Во ред. Да почнеме со нашата фонетски модел. Па фонетски модели се потпираат на компјутерската техника наречен скриени Марков модели. Тоа се графички модели во кои јас имаат и препознае состојбата на светот како што се карактеризира со сет на функции. И дека државата ја опишува еден дел на дејствие што јас сум ангажиран во. Значи, ако јас се размислува за правење звукот "МА" како мајка, постојат различни компоненти за тој звук. Има еден дел каде што дојде до воздух. И јас тогаш чантата моите усни. И да го промовираме моите усни назад малку малку да се направи тоа "ма" звук. И потоа, тука е моето ослободување. Усните ми се распаѓа. Воздухот се протерани. "Ма". Тие три различни делови ќе биде застапуван од страна на државите во овој graph-- на почетокот, средината и крајот. И јас би транзиции кои ми е дозволено да патуваат од една држава на следната со одредена веројатност. Така, на пример, дека М звук може да има многу, многу кратко внес на beginning-- "ММ" - а потоа и подолго, вибрационен фаза каде што јас сум држи мојот усните заедно и речиси humming-- "mmmm" - а потоа и за многу кратко експлозивни каде што јас ги избрка breath-- "ма". Скриени Марков модел е со цел да се фати на фактот дека начинот на кој јас се направи тој звук "ма" се случува да биде малку поинаква во неговиот тајминг, е фреквенција, и неговите функции од начинот на кој што го направи тоа или начинот на кој што би можел да го прават тоа кога јас зборувам за различни намени на писмото. "Мајка" и "Може ли" волја звучи малку поинаку. Така да се препознае одреден звук, ние би изгради Марков модели, овие скриени Марков модели, на секој можен Телефонот дека Можеби ќе сакате да се признае, секој можен звук, и потоа да се погледне на акустични податоци дека имам и да се одреди статистички кој е најверојатно еден да го произведоа овој звук. ВО РЕД. Со тој модел, тогаш ние на проектот за изградба на врвот на тоа. Ги модел изговорот. Сега, понекогаш изговор модели се едноставни и лесно бидејќи има само еден начин да го изговара нешто. Други времиња, тие се малку повеќе комплицирано. Еве еден водич изговор за таа црвена нешто што е овошје што ќе се направи надвор од кечап. Луѓе не мислам дека тоа е плод. Нели? Сега, постојат многу различни начини дека луѓето ќе го изговара тој збор. Некои ќе речат "пети-мај-пети". Некои ќе речат "танга mAh-пети". И ние може да се фати дека со еден од овие графички модели каде што, пак, ние ги претставуваме транзиции како што имаат одредена веројатност и веројатност поврзани со нив. Значи во овој случај, да, требаше да го следат врвот рута преку целиот овој графикон, Јас би бил почеток во писмото на многу лево, на "ТА" звук. Јас ќе ја преземе на горната половина, на "О", а потоа и "ма" и потоа "А", а потоа и "Та," и "О". "Пети-мај пети". Ако Зедов дното пат преку ова, јас ќе добие "TA-mAh-пети". И ако отидов долу, а потоа нагоре, јас ќе ја добие "Та-мај пети". Овие модели се фати на овие разлики, бидејќи секогаш кога ние се распореди еден од овие системи за препознавање, тоа се случува да треба да работат со многу различни видови на луѓе, многу различни акценти, па дури и различни начини на користење на истите зборови. Конечно, згора на тоа, ние ќе се изгради нешто дека изгледа навистина комплицирано, нарекува модел на јазикот, но всушност е наједноставниот на три, бидејќи овие работи на она што се нарекува n-грам модели. И во овој случај, јас сум ви покажува две-дел n-грам модел, односно bigram. Ние ќе треба да се направи физичка идејата дека понекогаш, некои зборови се со поголема веројатност да ги следите даден збор од другите. Ако јас само рече "временската прогноза" на следниот збор, најверојатно, би можело да биде "денес" или може да биде "на времето Прогноза за утре. " Но, тоа е малку веројатно да биде " временската прогноза артишок. " Што модел јазикот не е го плени оние статистички со броење, од некои многу големи корпус, сите инстанци во кои еден збор што следува друг. Значи, ако јас се земе голем corpus-- како и секоја Волстрит џурнал што го произведуваме од 1930 година, кој е еден од стандардните corpuses-- и јас се погледне низ сите на тој текст и ги бројам до колку пати по "прогноза" гледам "Денес" и колку пати можам да видам "прогноза", проследено со "артишок" првата се случува да биде многу поголема веројатност. Тоа се случува да се појави далеку почесто. И така што ќе имаат повисока веројатност поврзани со неа. Ако сакам да дознаам веројатноста на целиот исказ, тогаш, јас само го растурат. Па веројатноста за слух реченицата "стаорци јаделе сирење" е веројатноста на зборот "" почетна реченица, и тогаш веројатноста дека Зборот "стаорец" следува зборот "," и веројатноста дека Зборот "јаделе" следи "стаорец" и веројатноста дека "сирење" следи "јадев." Ова звучи како многу статистика, многу веројатности. И тоа е сето она што е. Но неверојатно нешто е ако го направите тоа со доволно голем примерок на податоци, работи. И работи неверојатно добро. Ние сите знаеме овие технологии. Повеќето оперативни системи доаѓаат со препознавање на глас во овој момент. Ние ги користиме Siri и Cortana и ехо. И овие нешта се засновани врз овој тип на три-слој model-- фонетска модел на дното, односно изговор модел во средината, и модел јазикот на врвот на нив. Сега, тие треба да направите малку повеќе од тоа, со цел да одговори на прашања. Но препознавањето на она што си изрека зависи токму на тоа. Значи, да се земе пример тука. Па имам мојот телефон седи тука под камерата документ. И ние ќе треба да побара од Siri неколку прашања. Во ред? Значи, да се разбуди мојот телефон тука. Siri, Што е времето како во Њу Хевн денес? Siri: Овде е времето за Њу Хевн, Конектикат денес. Брајан SCASSELLATI: Во ред. Па прво виде дека Siri признати секоја од поединечните зборови а потоа произведува одговор. Ние ќе зборуваме за тоа како тој одговор збор за во малку. Но, сега кога знаеме дека ова е само врз основа на суровини статистика и ова модел тип појавување на пристап, можеме да играат некои игри со Siri. За да можам да се обидете повторно. Siri, Што е времето Нилскиот коњ Њу Хевн, денес? Siri: Во ред. Тука е времето за Нова Хевн, Конектикат за денес. Брајан SCASSELLATI: Siri е не се обесхрабрени од кои затоа што е пронајден на pattern-- "времето", "Денес", "Њу Хевн." Тоа е она што тоа е како одговор да, исто како и Елиза. Во ред. Ајде да се даде уште една, па дури посмешно пример. Siri, времето артишок Armadillo нилски коњ Њу Хевн? Siri: Дозволете ми да се провери за тоа. Тука е она што го најдов на интернет за она што се артишок Armadillo Нилскиот коњ Њу Хејвен. Брајан SCASSELLATI: Во ред. Значи, ако јас се доволни далеку од овој модел, Јас сум во можност да го мешаме, бидејќи тоа не повеќе одговара на моделот што го има. И дека статистичките моторот што го вели, што е веројатноста дека ќе го добивме Нилскиот коњ зборови и артишок заедно, и Armadillo? Тоа е мора да биде нешто ново. Па овие технологии ние ги користиме секој ден. Ако сакаме да ги земе еден чекор понатаму, иако, ако ние всушност сакаат да бидат во можност да се зборува за она што е дека овие системи се реагира на, мораме да зборуваме, пак, за една повеќе основни сет на прашања. А тоа е тема во комуникацијата што ние го нарекуваме прашање одговарање. Тоа е, ние сакаме да биде во можност to-- је? ПУБЛИКАТА: [Беззвучен]. Брајан SCASSELLATI: Дали ќе го добиеме во латентни семантички обработка? Така да. Постојат многу работи кои се случува под површината со Siri а во некои од примерите Одам да ви покаже следната таму каде што е доста во однос на структурата од она што си ти што зборуваш, тоа е важно. И дека, всушност, тоа е одлично прекурсор за следниот слајд за мене. Така што во истиот начин на кој нашите препознавање на говор беше изградена од повеќе слоеви, ако сакаме да се разбере што е тоа што е всушност се рече, ние ќе треба да повторно се потпираат на анализа на мулти-слој на текстот и тоа е се признаваат. Па кога Siri е во можност да ја да речеме, со нетрпение го најдов овие зборови. Сега што да правам со нив? Првата компонента е често да се одат преку и да се обидат да се анализира структурата на реченицата. И во она што сум го видел во основно училиште, често, како вид на diagramming реченици, ние ќе да се признае дека одредени зборовите имаат одредени улоги. Овие се именки. Овие се заменки. Овие се глаголи. И ние ќе треба да се признае дека за одредена граматика, во овој случај англиски граматика, постојат валидни начините на кои можам да ги комбинирате и други начини на кои не се валидни. Тоа признавање, дека структурата, може да биде доволно за да ни помогне да водич малку. Но тоа не е сосема доволно за нас да биде во можност да даде никакво значење на она што е кажано тука. Да го стори тоа, ќе мора да се потпираат на некои износот на семантички обработка. Тоа е, ние се случува да мора да се погледне во под она што секој од овие зборови всушност ги пренесува како значење. И наједноставен начин да се направи ова, ние ќе треба да се дружат со секој збор дека знаеме одредена функција, одредена трансформација дека тоа дозволува да се случи. Во овој случај, ние би можеле да се означат Зборот "Џон", како да бидат соодветно име, дека со себе носи на идентитетот. И ние би можеле да се означат "Марија", како што на ист начин. Со оглед на тоа како глаголот "сака", кој претставува одредена врска дека ние сме во можност да ги претстават. Сега, тоа не значи дека дека ние се разбираме што е љубов, туку само дека ние се разбираме тоа во начинот на симболичен систем. Тоа е, ние може да се обележат тоа и го манипулираат. Со секој од овие видови на пристапи, било вид на семантички обработка тука се случува да бараат малку малку знаење и многу работа од наша страна. Ние веќе не се во доменот каде само обична статистика се ќе биде доволно за нас. Момент, со цел да се оди од оваа точка да се биде да се зборува за во внатрешноста на она што всушност се случува овде да се биде во можност да манипулира со оваа структура и разбере прашање а потоа да биде во можност да излезат и да го бара, со која се бара повеќе комплексни когнитивни модел. Начинот на кој се изградени овие системи е во најголем дел се многу, многу труд интензивни. Тие подразбираат луѓето потрошите многу период структурирање на начините на што овие видови на реченици може да се претстави во некои логика. Се добива дури и малку посложени, иако. Дури откако ќе се занимаваа со семантика, ние ќе се уште треба да се погледне на прагматика на она што е кажано. Тоа е, како можам да се однесуваат зборовите дека јас треба да дознаете нешто физички таму во светот или во барем некои информации извор за да можам да се манипулира? Понекогаш, овие да доведе до прекрасни парчиња двосмисленост. "Црвено-жешка ѕвезда да се венча астроном." ВО РЕД. Сега, ние читаме дека како смешно тип на насловот дека ние ќе ја видите на крајот од ноќта ТВ бидејќи ние не го протолкува "ѕвезда" да има своја небеско тело значење. Ние знаеме дека тоа значи дека повеќе вообичаена актер или актерка со високи количини на видливост. "Одред помага куче залак жртва." Дали е тоа дека тимот е, всушност, таму им помага на куче да ги заобиколи и гризе жртви? Или е тоа што имаше поединец кој беше каснат од куче кој требаше помош? Само од гледањето на синтакса и семантиката на реченици, ние не може да се утврди тоа. "Хеликоптер напојува со човечки муви." Постојат, всушност, вистински мали нешта кои летаат наоколу се лица со крилја напојување хеликоптери за доброто на човештвото? Или има еден механички уред што произлегува својата енергија од еден човек? Кога ќе погледнеме во прашање Одговарајќи системи, овие се слоеви кои ние треба да се справи со. Сега, најдобрите и најпознатите вид на распространети на овие системи денес се во можност да се направи работите на ниво што се многу подалеку од она што го имавме пред 10 години. Тука е една од најдобрите системи тоа е таму денес. И ова е систем од IBM наречен Вотсон. Ова е од нашите пријатели во IBM. Ова е Кетрин банки, Џија Чен, и Прискила Moraes ни даваат демонстрација на Вотсон вчера во IBM Yorktown. [Видео репродукција] -Како си? -Добро сум. Јас сум секогаш среќен кога сум размислување, особено кога да останете кул во овие серверски простории. -Кој Е вашата омилена актерка? -Мојот Омилена актерка Анџелина Џоли како Лара Крофт во Томб Рајдер бидејќи нејзиниот оригинален форма е како виртуелен лик како мене. -Како Вотсон може да им помогне на пациентите? -Дали Планот за пациентите да имаат пристап до Вотсон директно? Пристап до Вотсон советодавни апликации ќе се разликуваат во зависност од употреба случај. Но, во моментов, Вотсон ќе обезбеди само можната дијагноза и третман опции за медицинско лице. Каде што е соодветно, на пациентите може да обезбеди информации да Вотсон, можеби преку портал веб интерфејс, таблета, или дури и еден мобилен телефон. На пример, на пациентот може да биде побарано да се опише симптомите во природниот јазик директно во раствор Вотсон, му овозможува на лекарот да се фокусира на дијагноза и не собирање на податоци. -Кој Убиен Абрахам Линколн? -Џон Вилкс Бут. -во Која година Аризона Diamondbacks победи на Светската серија? -2001. [END репродукција] Брајан SCASSELLATI: Значи овие видови на системи мора да се потпира пред се препознавање на говор; второ, конвертирање на тоа во значаен внатрешна застапување; а потоа, трета, да се биде во можност да се излезе и да се најде извор на информации кои им овозможува да се одговори на тоа прашање. Ова ниво на сложеност вклучува истите видови на програмски работи дека сте биле прави проблем во сетови. Ние сме во состојба да го анализирам HTTP барања во на истиот тип на шемата на ниско ниво појавување ELIZA дека можете да направите. Ние сме во состојба да се претворат оние во внатрешна застапеност, а потоа ги користат за пребарување некои надворешна база на податоци, а можеби и со користење на SQL. Сите системи кои се градат денес да се направи овој вид на природен комуникација јазик се гради врз основа на Истите принципи. Сега, дури и систем како Вотсон не е доволно комплексни за да може да одговори на произволни прашања во врска со било која тема. И всушност, тие мора да бидат структурирани во рамките на даден домен. За да можете да одат на интернет и може да се најдат верзии на Вотсон кои работат добро во рок од медицинска информатика. Или има една онлајн дека само се занимава со тоа како да се направи добри препораки за она што ќе одат со пиво која храна. И во рамките на овие области, тоа може да одговори на прашања, најдете информациите што им е потребна. Но вие не може да се меша и натпревар нив. Системот и тоа е се обучени со базата на податоци на храна и пиво не работи добро кога одеднаш го стави во со медицинска информатика база на податоци. Па дури и нашите најдобри системи денес потпира на степенот на обработка во која ние сме рака кодирање и градење во инфраструктурата со цел да се направи овој систем работи. Сега, последниве темата сакам да бидат во можност да се дојде до денес е за невербална комуникација. Огромна маса на информации кои ние комуницираме едни со други не дојде за време на поединечни зборови, дека ние сме аплицирањето. Тоа има врска со работи како близина, поглед, вашиот тон на гласот, Вашиот флексија. И дека комуникацијата е, исто така, нешто што многу различни интерфејси се грижат многу за тоа. Тоа не е она што се грижи за Siri. Можам да побара Siri нешто во еден глас или на поинаков тон на гласот, и Siri ќе ми даде истиот одговор. Но тоа не е она што ние се изгради за многу други видови на интерфејси. Сакам да те запознаам сега на еден од роботи. Ова била изградена од страна на мојот долгогодишен пријател и колега Синтија Breazeal и нејзината компанија Jibo. И ова robot-- ние си оди да се имаат неколку волонтери да излезе за да комуницирате со ова. Така што можам да има двајца луѓе подготвени да се игра со робот за мене? Зошто не ви дојде на горе, и зошто не дојдеш нагоре. Ако сакате можете да ми се придружат до тука, ве молам. И дали би можел да имаш дојде право овде. Благодарам. Здраво. Алфредо: Убаво да ви се исполнат. Алфредо. Брајан SCASSELLATI: Алфредо. Рејчел: Рејчел. Брајан SCASSELLATI: Рејчел. Убаво да ви се исполнат и двете. Алфредо, јас ќе одам да мора да одите во прв план. Дојде право овде. Одам да се воведе you-- ако можам да добијам оваа исклучен без тропа на microphone-- до малку робот наречен Jibo. ВО РЕД? Сега, Jibo е дизајниран за да биде интерактивна. И покрај тоа што може да ви даде на говор, голем дел од интеракцијата со робот е невербална. Алфред, а јас ќе одам да ви побара да каже нешто убаво и комплементарни на робот, ве молам. Алфредо: Мислам дека изгледа симпатична. [Шуми SOUND] Брајан SCASSELLATI: Во ред. Одговор на своите не е вербално. А сепак тоа би ти дал двете јасно признание дека претходно веќе слушнале она што го рече а исто така и некако сфатија дека. ВО РЕД? Чекор право враќаат по една секунда. Ти благодарам. Рејчел, ако сакате. Сега, јас ќе одам да се даде можете на многу потешка работа. Ако сакате можете да застане тука, врати само малку така ние може да се добие на камера и се погледне на овој начин. Одам да ви побара да се каже нешто навистина значи и непријатни на робот. Рејчел: Што ви се чинеше да ја направам е целосно апсурдни. [Потпевнува SOUND] Тоа беше дури и повеќе апсурдно. Што се случува со тебе? AW, не се чувствувам лошо. Јас ќе ви даде прегратка. Брајан SCASSELLATI: Во ред. Благодарение, Рејчел. Алфредо, Рејчел, благодарение момци многу. [Аплауз] Така овој вид на интеракција има во многу начини некои од истите правила и некои од истите структура како што е она што ние би можеле да имаат во лингвистичките интеракција. Тоа е и комуникативни и има важна цел. И дека интеракција, во На многу начини, е наменета да имаат посебен ефект на лице интеракција со или слушање на робот. Сега, јас сум доволно среќа да имаат Jibo тука и денес. Сем Spaulding е тука за да им помогне ни излезе со робот. А јас ќе одам да прашам Сем да даде ни еден убав демонстрација на Jibo танцување дека ние може да се види на крајот тука. Па повелете, Jibo. Сем: Добро, Jibo. Покажи ни вашиот танц потези. [Музички] Брајан SCASSELLATI: Во ред, сите. Благодарение на нашите пријатели во Jibo. [Аплауз] И благодарение на нашите пријатели во IBM, за помошта денес. Комуникација е нешто дека си оди да се види кои доаѓаат се повеќе и повеќе како ние се изгради повеќе комплексни интерфејси. Следната недела, ние ќе се зборува за тоа како да интерфејс со компјутерските противници во игри. Но, ако имате прашања во врска со ова, Ќе бидам околу на работното време вечерва. Среќен сум што можам да зборувам со вас за АИ теми или за да се влезе во повеќе детали. Имај Убав викенд. [Аплауз] [Музички]