[Ag seinm ceoil] DAVID MALAN: Tá an CS50. Is é seo an deireadh seachtaine 10. Agus buachaill, an bhfuil ní mór dúinn a rang maith agat inniu. Tá muid oiread sin sceitimíní a cuireadh a thabhairt dhá cheann de ár gcairde ó Yale suas le linn inniu agus chun breathnú ar an áit a dtrasnaíonn hintleachta saorga, róbataic, próiseáil teanga nádúrtha, agus níos mó. Agus go deimhin, thar an seachtainí beaga anuas, tá muid cinnte chaith a lán ama, go háirithe i psets níos luaithe, ag díriú ar go leor sonraí íseal-leibhéil. Agus tá sé an-éasca a chailleadh radharc na foraoise le haghaidh na crainn agus fháil ar crochadh suas ar lúba agus coinníollacha agus leideanna, is cinnte, agus a leithéidí. Ach tá an réaltacht a bhfuil tú guys anois an comhábhair a bhfuil ar féidir leat i ndáiríre réiteach roinnt fadhbanna suimiúla, i measc dóibh siúd go bhfuil ár gcairde ag Yale obair ar díreach cúthail de Cambridge. Mar sin, deis dom chéad a thabhairt isteach ar ár ceann teagasc cúntóir ó Yale, Andy. [Bualadh bos] ANDY: gcéad dul síos, go raibh maith ach agat a thugann deis Yalies lánúin a pop ar síos go dtí Cambridge inniu. Táimid buíoch as i ndáiríre é. Dara dul síos, chun ár gcairde ar ais go home-- Jason, go raibh maith agat as fanacht agus a reáchtáil léacht. Tá súil tá sé ar fad go maith i New Haven. Mar sin, yeah, tá mé ar bís Super a thabhairt isteach Scaz inniu. Ritheann Scaz an saotharlann róbataic. Tá sé ina ollamh de, cosúil le, cúig ranna éagsúla ag Yale. Ina saotharlainne, tá sé go leor, go leor robots go maith sé a imirt leis. Tá sé, ar nós, an post coolest ar fud an domhain. Agus faigheann sé de chineál ar praiseach chun timpeall le sin an lá ar fad fada agus a dhéanamh ar roinnt oibre, chomh maith le. Agus mar sin thug muid i ndáiríre ar cheann Acu síos le linn inniu. Mar sin, gan a thuilleadh moille, tá Scaz ag dul chun dul ar aghaidh agus a thabhairt isteach chugainn a chara robot. [Bualadh bos] BRIAN SCASSELLATI: Go raibh maith agat, David. Go raibh maith agat, Andy. Tá sé chomh iontach a bheith anseo le gach duine inniu. Ba mhaith liom a bheith ar dtús an-soiléir go an fhoireann CS50 anseo i Cambridge Tá thar a hospitable a chur chugainn. Tá muid chomh buíoch do gach rud siad atá déanta chun tacaíocht a thabhairt dúinn. Agus mar sin ba mhaith linn a bheith in ann a thabhairt ar ais ar an cineáltas. Mar sin, lá atá inniu ann, a fháil againn a fhógairt go bhfuil muid ag dul a bheith acu nua, aon-de-a-chineál imeacht CS50 ag tarlú i New Haven tseachtain seo chugainn. Agus is é seo an Taighde CS50 Expo. Mar sin, táimid ag dul a bheith ag tabhairt cuireadh everyone-- CS50 mic léinn, baill foirne ó Harvard agus Yale-- araon teacht síos agus cuairt a thabhairt le linn ar an Aoine. Beidh orainn a bheith ar réimse leathan de os cionn 30 daoine éagsúla i láthair agus upperclassmen exhibiting-- ag taispeáint as roinnt de a gcuid táirgí taighde. Beidh orainn go bhfuil roinnt startups, fiú, ag lorg haghaidh píosa beag de thallann ardteicneolaíochta nua, startups ó Harvard agus Yale araon. Agus beidh orainn go bhfuil roinnt grúpaí mac léinn ag lorg roinnt ballraíocht nua. Tá sé ag dul a bheith am an-spreagúil. Tá súil againn go siúd agaibh a bhfuil ag teacht síos le haghaidh an cluiche Harvard-Yale a bheith in ann chun stop a chur ag beagán go luath, ceart i lár an champais, Leabharlann Cuimhneacháin sterling. Táimid ag dul a bheith acu le sraith de foilseáin go bhfuil raon ó uathrialach sailboats chun bealaí baint úsáide as bogearraí a chaomhnú lámhscríbhinní meánaoiseacha. Táimid ag dul a bheith acu ad líonrú hoc agus daoine teagasc códú bogearraí i Cape Town. Beidh muid ag ríomhaire taispeántais cheoil. Agus beidh orainn robots níos ndóigh. Mar sin ní féidir linn a súil agat beidh bheith linn don imeacht seo. Ba chóir é a bheith ina lán de spraoi, le beagán de bia, agus a lán de suimiúil rudaí chun labhairt faoi. Mar sin, lá atá inniu ann, táimid ag dul chun labhairt faoi ​​phróiseáil teanga nádúrtha. Agus is é seo an iarracht dúinn a thógáil ar bhealach nua de idirphlé lenár feistí mar gheall do na seachtainí anuas, atá tú dírithe ar an gcaoi a bhfuil sé go Is féidir leat scríobh cód, bogearraí a scríobh is é sin ar bhealach a bheith in ann a rá go meaisín, is é seo cad ba mhaith liom tú a dhéanamh. Ach níor chóir mór dúinn a ag súil go bhfuil gach rud sin amach ann go bhfuil a úsáidtear ag gach duine ar fud an domhain ag dul a bheith líofa sa chineál seo teagaisc. Mar sin, idirdhealú a dhéanamh againn idir ríomhaire teangacha agus languages-- nádúrtha is é sin, rudaí a úsáid duine teacht cumarsáid a dhéanamh le daoine eile. Agus déanaimid ár ndícheall chun comhéadain a bhaineann úsáid as a thógáil na meicníochtaí cumarsáide nádúrtha. Anois, díreach cosúil gach topaic eile go atá againn tús le i CS50, táimid ag dul chun tús a chur leis an simplí beagán de próiseála teanga nádúrtha gur féidir linn a shamhlú. Táimid ag dul chun tús a chur leis an chuid stairiúil teanga nádúrtha. Agus ansin beidh orainn a thógáil suas go dtí córais níos mó agus níos mó le déanaí agus tá roinnt demos spraoi feadh na slí. Mar sin, táimid ag dul chun tús a chur leis an méid a bhí dócha go bhfuil an chéad teanga nádúrtha córas próiseála. Bhí sé seo córas bogearraí scríofa i 1966 ag Joseph Weizenbaum dtugtar ELIZA. Agus bhí ELIZA a ceapadh chun mhacasamhlú ar an chineál idirghníomhaíocht bheadh ​​agat le Psychotherapist Rogerian. Anois, na Rogerians, bhí siad smaoineamh go síciteiripe i gceist a bheith in ann a scáthán ar ais d'othar agus labhairt leo, go bunúsach, ag amháin a thabhairt dóibh beagán beag bídeach ar an teiripeoir. Is é sin, gach rud a dúirt an teiripeoir Bhí ceaptha a bheith ach léiriú ar cad a bhí an t-othar ag insint dóibh. Mar sin, a ligean ar iarracht a dhéanamh agus taispeána seo. An bhfuil muid oibrí deonach gur mhaith leo a bheith toilteanach a roinnt a gcuid is doimhne, is dorcha, agus / nó rúin falsa le ELIZA? Cinnte, cén fáth nach bhfuil tú ag teacht ar suas. Iontach. Agus d'ainm? MILES: Miles. BRIAN SCASSELLATI: Miles. Is deas liom bualadh leat, Miles. Más mian leat a shealbhú isteach ar sin. Agus táimid ag dul chun úsáid a bhaint as leagan de ELIZA go atá againn mhacasamhlú laistigh den IDE CS50. Agus beidh muid ag breathnú ar an bhfoinse cód a ghabhann leis an i gceann tamaill beag. Ach do ceart anois, tá muid díreach ag dul a agairt air ag clóscríobh Eliza. Agus is é ELIZA dul a thabhairt duit freagraí go bhfuil dul chun bheith i ngach gceannlitreacha. Agus ag dul a iarraidh ort roinnt ceisteanna. Agus beidh muid ag freagairt agus cineál i freagraí ar ELIZA. Mar sin, tá ELIZA dúirt sé, "Dia duit, tá mé ELIZA. Cad é do fhadhb? " Cad ba mhaith leat a insint ELIZA faoi lá atá inniu ann? MILES: Is féidir liom titim ina chodladh ach má tá mé slipéir Bunny ar. BRIAN SCASSELLATI: Ceart go. Ceart go leor. [Gáire] "Is féidir liom titim ina chodladh ach le slipéir Bunny ar. " Agus deir ELIZA, "Abair, a dhéanann tú tá aon fadhbanna síceolaíochta? B'fhéidir tá sé seo táscaire maith. " OK. Mar sin, cad ba mhaith leat chun freagra? MILES: Is ea. BRIAN SCASSELLATI: Tá. Fear de go leor focail. Taitneamh a bhaint as mé go. Eliza deir, "Is cosúil go tú dearfach go leor." MILES: No, tá mé, i ndáiríre, leictreon. BRIAN SCASSELLATI: "Uimh Go deimhin, tá mé leictreon. " "An bhfaca thagann tú chugam mar go bhfuil tú leictreon? " Anois, is féidir linn a fheiceáil ar roinnt de an things-- Tá mé ag dul chun sos agat ach an dara, Miles. Ná téigh in áit ar bith. Ní táimid ag déanamh a bhfuil tú go fóill. Tá ELIZA, i roinnt bealaí, freagra a thabhairt ar rudaí áirithe go bhfuil sé ag rá ach sin gan aon tuiscint fíor. Agus tá sé parroting ais freisin roinnt de na codanna de a phianbhreith. Mar sin, dúirt muid, "Uimh Go deimhin, tá mé leictreon. " Eliza fhreagair ais, "An bhfaca thagann tú dom mar go bhfuil tú leictreon? " Ceart go leor. A ligean ar thabhairt dó freagra amháin níos mó anseo. Tabhair sé ceann maith, Miles. MILES: Dea-amháin? Yes, le do thoil cabhrú liom. BRIAN SCASSELLATI: "Is ea. Cabhraigh liom. "" An bhfuil tú cinnte? " MILES: Uimh BRIAN SCASSELLATI: Uimh "Cad a dhéanann a thugann le fios a thabhairt duit?" MILES: Ní féidir liom a bheith leictreon. BRIAN SCASSELLATI: "Tá mé Ní féidir a bheith leictreon. " "An bhfuil tú ag rá aon ach a bheith diúltach?" Ceart go leor. Mar sin, Miles, buíochas a ghabháil leat an oiread sin. MILES: Go raibh maith agat. BRIAN SCASSELLATI: Go raibh maith agat go mór. [Bualadh bos] Mar sin, an clár ELIZA, i go leor bealaí, Tá freagairt ach a na píosaí go bhfuil muid ag soláthar gan aon domhain tuiscint ar cad atá ag tarlú anseo. Is é seo ar chineál an chórais ar a dtugtar meaitseáil patrún, i gcás ina táimid ag lorg áirithe píosaí téacs go bhfuil muid ansin ag dul a ghlacadh as an méid Soláthraíodh mar ionchur, thiontú, d'fhéadfadh, ar bhealach éigin, agus ansin a thabhairt ar ais go dtí an t-úsáideoir. An bhfuil aon duine agaibh a cheapann go bhfuil ELIZA iarbhír feidhmiú síocanailís bailí anseo? Duine amháin, b'fhéidir. LUCHT ÉISTEACHTA: [inaudible]. BRIAN SCASSELLATI: Agus conas ndéanann dhéanamh, dar leat? Tá, go deimhin, a dhéanann sé. Agus táimid ag dul a fheiceáil, i ndáiríre, an cód foinse le haghaidh sé i díreach nóiméad. Agus mar sin go bhfuil tú ag dul a bheith in ann a dhéanamh go díreach seo. Anois, tá ELIZA cineál amháin de cad ba mhaith linn glaoch lá atá inniu ann bot comhrá. Téann sé ach tríd an téacs go bhfuil tú ag fáil, Soláthraíonn an méid íosta arbh fhéidir tuisceana nó a phróiseáil, agus ansin parrots sé ar ais chugat. Mar sin a ligean ar ghlacadh le breathnú, choincheapa de, agus labhairt faoi na rudaí go bhfuil sé go bhfuil ELIZA dhéanamh i ndáiríre. ELIZA ag glacadh ligean sentence-- ar a rá, "Ba mhaith liom a luí mo shaoiste." Agus is é ELIZA lorg tríd an abairt agus ag iarraidh a fháil agus patrúin áirithe mheaitseáil. Mar sin, mar shampla, ar cheann de na patrúin go bhfuil ELIZA lorg bhfuil na focail "Ba mhaith liom." Agus aon uair a fheiceann sé rud éigin go bhfuil "Ba mhaith liom" ann, Ceapann sé freagra. Agus is é sin freagra teaghrán seasta. Sa chás seo, tá sé "cén fáth ar mhaith leat?" Agus chuir mé réalta beag ag an deireadh mar gheall ar go díreach tús na ár bhfreagra. Agus léiríonn an réalta go táimid ag dul a chur ar an chuid eile ar an úsáideora utterance-- "a chur ina luí ar mo Boss" - agus táimid ag dul a fhoscríbhinn go isteach ar an deireadh an teaghrán. Mar sin anois, seachas ag rá, "cén fáth ar mhaith leat a luí ar mo Boss, " níl beagán de bhreis próiseáil go mbainfidh linn a dhéanamh. Is é sin, beidh orainn a thiontú roinnt de na forainmneacha anseo ó "mo Boss" go "do Boss." Agus a d'fhéadfadh a bheith ann le cúpla eile athruithe a gur gá dúinn a dhéanamh. Mar sin, seachas díreach sticking sé go díreach ar an deireadh, cad beidh muid ag déanamh Tá beidh orainn a chur ar an chuid eile de na úsáideora utterance-- i here-- bán agus beidh orainn a chur air píosa amháin ag am agus a thiontú gach teaghrán chomhartha, gach focal, isteach an abairt. Mar sin, beidh orainn a chur ar an focal "go." Níl aon comhshó gur gá dúinn a dhéanamh. "Impress." Níl aon comhshó ní mór dúinn a dhéanamh ann. "Mo" Beidh a thiontú go "do." Agus "Boss" beidh orainn fhágáil díreach mar "Boss." Agus ansin ar deireadh, rud ar bith a chríochnaíonn le tréimhse, beidh orainn a thiontú sé isteach ar cheist. Seo meaitseáil patrún an-simplí i ndáiríre go leor rathúil. Agus nuair a tugadh isteach an i 1966-- Joseph Weizenbaum cláraithe seo ar ríomhaire. Anois, ríomhairí ag an am sin Ní raibh samhlacha deisce. Roinneadh siad acmhainní. Agus bheadh ​​a chuid mac léinn dul agus comhrá a dhéanamh le ELIZA. Sa deireadh, bhí sé a srian le rochtain air toisc nach raibh a chuid mac léinn ag fáil aon obair atá déanta. Bhí siad ag caint díreach leis ELIZA. Agus, go deimhin, bhí sé a tine a chúntóir, a Chaith gach ceann cuid ama ag caint le ELIZA faoina fadhbanna domhain agus worrisome. Tá ag gach duine a bhain úsáid as na córais seo thosaigh a anthropomorphize orthu. Thosaigh siad chun smaoineamh ar iad mar á bheochan agus daoine fíor. Thosaigh siad a aithint ar roinnt de na rudaí a bhí siad ag rá bhí ag teacht ar ais orthu. Agus bhí siad ag fáil amach rudaí fúthu féin. Agus, go deimhin, fiú na saineolaithe, fiú na síciteiripeoirí, thosaigh a bheith buartha go bhfuil, i ndáiríre, b'fhéidir go mbeadh ELIZA bheith in áit iad. Agus fiú an ríomhaire eolaithe buartha go raibh muid chomh gar do teanga nádúrtha a réiteach. Anois, ní raibh go in áit ar bith in aice leis fíor. Ach tá go conas hiontach is féidir leis na córais is cosúil. Sin a ligean le tús a chur chun breathnú thíos agus déan iarracht a fháil le beagán de cheist an áit ina dtarlaíonn cód seo i ndáiríre. Mar sin, beidh muid a dhéanamh cód seo ar fáil ina dhiaidh sin. Agus is é seo an- port simplí agus díreach de chur i bhfeidhm ELIZA bunaidh. Mar sin, roinnt de na stíle rudaí a mbainfidh tú a fheiceáil anseo nach bhfuil na stíle de cad ba mhaith linn mhaith leat a dhéanamh nó cad tá muid ag múineadh duit a dhéanamh. Ach tá iarracht déanta againn chun iad a choinneáil mar an gcéanna ar fud na calafoirt go leor go bhfuil an bhí ionas go mbeidh sé Tá an blas de na bunaidh. Mar sin, táimid ag dul a chur san áireamh a bunch de rudaí, agus ansin beidh orainn a bheith sraith de eochairfhocail, rudaí go mbeidh ELIZA aithníonn agus freagra a thabhairt ar go díreach. Mar sin, má tá tú focail cosúil "is féidir leat" nó "Ní féidir liom" nó "níl" nó "tá" nó "aisling" nó "Dia duit," ansin ELIZA Beidh freagairt go roghnach dóibh siúd. Beidh orainn a bheith chomh maith líon áirithe de na rudaí go mbeidh muid babhtála, cosúil le athrú "mo" go "do." Agus ansin beidh orainn sraith de fhreagraí gur le haghaidh gach ceann de na focail, beidh orainn a rothlú trí na freagraí éagsúla. Mar sin, má rá liom "tá" trí huaire i ndiaidh a chéile, mé D'fhéadfadh a fháil trí éagsúla freagraí ó ELIZA. Ár cód, ansin tá, i ndáiríre thar cuimse simplí. Má scrollú mé síos roimhe seo gach ceann de na freagraí go mór dúinn cláraithe i agus a fhaigheann muid síos go dtí ár is mó, táimid ag dul a thúsú cúpla na n-athróg éagsúla agus a dhéanamh le beagán de tís i tús. Ach ansin tá sraith ann go hiomlán de chód gur féidir leat a thuiscint. One lúb cé mór a deir Tá mé ag dul go dtí arís an thar agus os a chionn. Feicfidh mé a léamh i líne, agus beidh mé a stóráil go bhfuil i teaghrán ionchur. Feicfidh mé a sheiceáil agus a fheiceáil má tá sé an eochairfhocal speisialta "beannacht," a ciallaíonn scoir an gclár. Agus ansin beidh mé a sheiceáil agus féach an bhfuil Tá duine éigin athrá díreach iad féin thar agus os cionn. Agus beidh mé yell orthu má dhéanann siad. Feicfidh mé a rá "Níl a athdhéanamh féin." Chomh fada is a aon cheann de na tharlaíonn, beidh muid a ansin scanadh tríd agus lúb tríd, ar línte 308-313 anseo, agus a sheiceáil agus a fheiceáil Tá aon cheann de na eochairfhocal frásaí atá sa ionchur go raibh mé díreach tar éis a tugadh? Má tá ar chluiche dóibh, go maith ansin, beidh mé ag cuimhneamh go suíomh. Beidh mé ag cuimhneamh go eochairfhocal. Agus beidh mé a bheith in ann a thógáil freagra. Más rud é nach féidir liom a fháil amháin, go maith ansin, an rud deireanach i mo sraith eochairfhocal Beidh mo freagraí réamhshocraithe, nuair rud ar bith eile cluichí. Feicfidh mé ceisteanna ar nós a iarraidh "Cén fáth go raibh tú teacht anseo? "nó" Conas is féidir liom cabhrú leat? " go bhfuil ach oiriúnach go páirteach is cuma cad é an t-ionchur. Beidh muid a thógáil ansin suas fhreagairt ELIZA ar. Beidh orainn a bheith in ann a ghlacadh go fhreagairt bonn, díreach mar a rinne muid sa mhéid is go "mo Boss" mar shampla. Más rud é go léir go bhfuil is-- má tá sé ach ceann amháin teaghrán go bhfuil mé ag ceaptha a respond-- Is féidir liom a sheoladh ach é ar ais amach. Má tá sé ar réiltín ag an deireadh sé, ansin beidh mé a phróiseáil gach chomhartha aonair i an chuid eile den fhreagairt an úsáideora agus cuir iad siúd i, swapping amach focal ar fhocal mar is gá dom a. Seo ar fad fíor rud go bhféadfaí tú a thógáil. Agus go deimhin, ar na bealaí ina bhfuil muid tá argóintí orduithe a phróiseáil, an mbealach ina bhfuil tú phróiseáil trí iarratais HTTP lean na cineálacha céanna na rialacha. Tá siad meaitseáil patrún. Mar sin, bhí sách tábhachtach ELIZA tionchar ar theanga nádúrtha mar rinne sé cosúil sé cosúil go raibh sé ina sprioc an-insroichte, mar bhealach ba mhaith linn a bheith in ann chun an fhadhb seo a réiteach go díreach. Anois, ní ar sin le rá go ndéanann ELIZA gach rud go mbeadh muid ag iarraidh a dhéanamh. Is cinnte nach bhfuil. Ach ba chóir dúinn a bheith in ann rud éigin níos mó a dhéanamh. Ár chéad chéim chun dul thar ELIZA ag dul a bheith in ann féachaint ar Ní téacs á iontráil isteach sa méarchlár ach urlabhra, iarbhír urlabhra taifeadta isteach i micreafón. Mar sin, mar táimid ar na píosaí éagsúla, tá muid dul go bhfuil a thógáil le sraith de shamhlacha. Táimid ag dul a bheith acu chun a bheith in ann chun dul as an fuaimiúla íseal-leibhéal páirc information--, aimplitiúid, frequency-- agus a thiontú go isteach roinnt aonad go mbeimid in ann a ionramháil níos éasca agus, ar deireadh, iad a ionramháil i focail agus abairtí. Mar sin, an chuid is mó aithint cainte córais atá amach ann inniu leanúint staidrimh samhail ina bhfuil muid a thógáil trí uiríll ar leith ar cad a Tá go comhartha fuaime i ndáiríre. Tús a chur againn le múnla foghraíochta go cainteanna faoi ach an bonn fuaimeanna go bhfuil mé ag a tháirgeadh. Tá mé ag a tháirgeadh rud éigin go bhfuil B mar atá sa buachaill nó D mar atá i madra? Conas is féidir liom a aithint dá dhifriúla fóin ar leithligh agus ar leith? Ar a bharr sin, beidh orainn a thógáil ansin múnla fuaimniú focal, rud a nascann le chéile na fóin aonair agus le chéile iad i focal. Agus ina dhiaidh sin, beidh orainn a chur ar na focail agus beidh orainn iad a chéile le teanga múnla isteach i abairt iomlán. Anois, tá muid ag dul chun labhairt faoi gach de na neamhspleách agus ar leithligh. Ach tá na trí samhlacha go léir ach ag dul a bheith staitisticí. Agus Ciallaíonn sé sin go nuair a muid obair leo, beidh muid a a bheith in ann a bheith ag obair le iad go léir ag an am céanna. Ceart go leor. Let tús leis ár múnla foghraíochta. Mar sin, ag brath múnlaí foghraíochta ar teicníocht ríomhaireachtúil ar a dtugtar samhlacha Markov i bhfolach. Tá na samhlacha grafacha ina bhfuil mé a bheith acu agus aithníonn staid an domhain mar atá á tréithrithe sraith de ghnéithe. Agus cur síos ar an stáit sin cuid amháin ar ghníomhaíocht atá go bhfuil mé ag gabháil do. Mar sin, má cheapann mé faoi a dhéanamh an fhuaim "ma" cosúil le máthair, tá difriúil comhpháirteanna sin fuaim. Níl cuid ina tharraingt mé i anáil. Agus ansin mé sparán mo bheola. Agus rolladh mé mo bheola ar ais beagán giotán a dhéanamh go "ma" fuaime. Agus ansin níl a scaoileadh. Mo bheola thagann óna chéile. Aeir Tá dhíbirt. "Ma." Bheadh ​​na trí chuid éagsúla a bheith arna ionadú ag stáit sa graph-- an gan, an lár, agus an deireadh. Agus ba mhaith liom a haistrithe go cead dom chun taisteal ó stát amháin an chéad cheann eile le dóchúlacht áirithe. Mar sin, mar shampla, go M fuaim a d'fhéadfadh a bheith an-, iontógáil an-ghearr ag an beginning-- "mm" - agus ansin níos faide, chéim vibratory i gcás ina bhfuil mé ag a bhfuil mo liopaí le chéile agus beagnach humming-- "Mmmm" - agus ansin gearr an- plosive áit dhíbirt mé breath-- "ma." Is é an tsamhail Markov i bhfolach deartha a ghabháil leis an bhfíric gurb é an bealach a dhéanann mé Tá go fuaime "ma" ag dul a bheith beagán difriúil i a uainiú is é, minicíocht, agus a chuid gnéithe ná an mbealach a dhéanann tú é nó ar an mbealach go d'fhéadfadh mé é a dhéanamh nuair atá mé ag caint faoi ​​úsáidí éagsúla den litir. "Máthair" agus "Féadfaidh mé" Beidh fuaime beagán difriúil. Mar sin, a aithint fuaim ar leith, ba mhaith linn a thógáil samhlacha Markov, na Markov i bhfolach samhlacha, de gach fón féidir go mé b'fhéidir gur mhaith a aithint, gach fuaim agus is féidir, agus ansin féachaint ar an sonraí fuaimiúla go bhfuil mé agus a chinneadh go staitistiúil atá ar cheann an ceann is dóichí gur chothaigh an fhuaim. OK. Leis sin samhail, againn ansin tús a thógáil ar a bharr. Glacann muid múnla fuaimniú. Anois, uaireanta fuaimniú Tá múnlaí simplí agus éasca mar níl ach ceann amháin bhealach éigin a fhuaimniú. Amanna eile, tá siad ar beagán níos casta. Seo treoir fuaimniú don rud dearg go bhfuil torthaí a dhéanann tú ketchup as. Ní Daoine a cheapann tá sé ina torthaí. Ceart? Anois, tá go leor bealaí éagsúla go mbeidh daoine fhuaimniú focal seo. Beidh roinnt rá "ladhar-féadfaidh-ladhar." Beidh roinnt rá "ladhar-MAH-ladhar." Agus is féidir linn a ghabháil go bhfuil ar cheann de na múnlaí grafacha más rud é, arís, ionadaíocht againn aistrithe mar a bhfuil dóchúlacht áirithe agus dóchúlacht a bhaineann leo. Mar sin, sa chás seo, má bhí mé a leanúint an bealach is fearr tríd an graf ar fad, Ba mhaith liom a bheith ag tosú ag an litir ar thaobh na láimhe clé dtí seo, an "ta" fuaime. Ba mhaith liom a chur ar an leath barr, an "OH," agus ansin ar "ma," agus ansin "a," agus ansin a "ta," agus "OH." "Toe-may-ladhar." Má thóg mé an cosán bun trí seo, beidh mé a fháil "ta-MAH-ladhar." Agus má chuaigh mé síos agus ansin suas, ba mhaith liom a fháil "ta-may-ladhar." Na múnlaí a ghabháil leis na difríochtaí mar aon uair a imscaradh muid ar cheann de na córais aitheantais, sé ag dul a bheith ag obair leis go leor de chineál éagsúla de na daoine, go leor de na variant éagsúla, agus fiú úsáidí éagsúla de na focail chéanna. Ar deireadh, ar a bharr sin, beidh orainn rud éigin a thógáil go Breathnaíonn i ndáiríre casta, ar a dtugtar an tsamhail teanga, ach i ndáiríre, is é an simplí de na trí mar gheall ar seo ag feidhmiú ar an méid a bhfuil ar a dtugtar samhlacha n-gram. Agus sa chás seo, tá mé ag léiríonn tú samhail n-gram dhá-pháirt, a bigram. Táimid ag dul a dhéanamh fisiciúil an smaoineamh go uaireanta, tá focail áirithe níos mó seans a leanúint tugadh focal ná a chéile. Más rud a dúirt mé díreach tar éis "réamhaisnéis na haimsire," D'fhéadfadh an focal eile a bheith dócha "lá atá inniu ann" nó a d'fhéadfadh a bheith "an aimsir réamhaisnéis amárach. " Ach tá sé nach dócha a bheith "an aimsir réamhaisnéis bhliosán gréine. " Cad a dhéanann samhail teanga rug sé sin go staitistiúil trí chomhaireamh, ó roinnt mór an- corpus, gach ceann de na cásanna i a leanann focal chéile. Mar sin, má ghlacaim le corpus-- mór cosúil le gach Wall Street Journal go bhfuil a tháirgtear ó 1930, atá ar cheann de na corpuses-- caighdeánach agus tá mé ag trí gach téacs, agus iad a chomhaireamh mé suas cé mhéad uair i ndiaidh "réamhaisnéise" a dhéanamh Feicim "lá atá inniu ann" agus cé mhéad uair a dhéanann Feicim "réamhaisnéise" le leanúint ag "bhliosán gréine," Is é an chéad duine ag dul a bheith i bhfad níos mó seans. Sé ag dul a bheith i láthair i bhfad níos minice. Agus mar sin beidh sé a bheith níos airde dóchúlacht a bhaineann leis. Más mian liom a dhéanamh amach an dóchúlacht ar caint ar fad, ansin, mé a bhriseadh ach sé suas. Mar sin, an dóchúlacht héisteachta an abairt "an francach ith cáis" Is é an dóchúlacht an focal "an" ag tosú a dhéanamh ar phianbhreith, agus ansin an dóchúlacht go bhfuil an leanas focal "francach" an focal "an," agus an dóchúlacht go bhfuil an focal "ith" a leanas "francach," agus an dóchúlacht go "cáis" a leanas "ith." Fuaimeanna seo cosúil le a lán de na staitisticí, a lán de na dóchúlachta. Agus sin ar fad go bhfuil sé. Ach tá an rud iontach má dhéanann tú é seo le sampla mór go leor de na sonraí, Oibríonn sé. Agus oibríonn sé tremendously maith. Tá a fhios againn go léir na teicneolaíochtaí seo. An chuid is mó córais oibriúcháin teacht le aithint gutha ag an bpointe seo. Bainimid úsáid as Siri agus Cortana agus Echo. Agus tá na rudaí seo bunaithe ar an cineál seo trí-ciseal model-- samhail foghraíochta ag an mbun, ar samhail fuaimniú i lár, agus samhail teanga ar bharr iad. Anois, tá siad a dhéanamh le beagán níos ná go bhfuil d'fhonn chun ceisteanna a fhreagairt. Ach an t-aitheantas ar an méid a bhfuil tú Braitheann rá go díreach ar sin. Mar sin, a ligean ar ghlacadh, mar shampla anseo. Mar sin, tá mé mo ghuthán suí suas anseo thíos an doiciméad cheamara. Agus táimid ag dul chun Iarrann Siri ar roinnt ceisteanna. Ceart go leor? Mar sin, a ligean ar múscail mo ghuthán anseo. Siri, cad é an aimsir cosúil i New Haven inniu? Siri: Seo an aimsir le haghaidh New Haven, Connecticut inniu. BRIAN SCASSELLATI: OK. Mar sin, an chéad chonaic tú gur aithin Siri gach ceann de na focail aonair agus ansin a tháirgtear freagra. Beidh muid ag labhairt faoi conas go freagra Tagann faoi i le beagán. Ach anois tá a fhios againn go go bhfuil an bunaithe go díreach ar na staitisticí amha agus patrún cineál meaitseáil na chur chuige, Is féidir linn a imirt ar roinnt cluichí le Siri. Mar sin, is féidir liom iarracht eile. Siri, cad é an aimsir dobhareach New Haven, sa lá atá inniu? Siri: OK. Seo an aimsir le haghaidh Nua Haven, Connecticut do lá atá inniu. BRIAN SCASSELLATI: Siri ar Ní daunted ag an mar tá sé le fáil ar an pattern-- "aimsir," "lá atá inniu ann," "New Haven." Sin an méid atá sé ag freagairt go, díreach cosúil ELIZA. Ceart go leor. A ligean ar thabhairt dó amháin níos mó fiú sampla níos ridiculous. Siri, bhliosán gréine aimsir armadillo dobhareach New Haven? Siri: Lig dom a sheiceáil ar sin. Seo an méid a fuair mé ar an ngréasán cad iad bliosáin armadillo dobhareach New Haven. BRIAN SCASSELLATI: OK. Mar sin, má théann mé fada go leor amach as an múnla seo, Tá mé in ann a chur amú sé mar gheall sé aon níos faide oireann an patrún a bhfuil sé. Agus sin staidrimh inneall go rá, cad é an dóchúlacht go atá tú a fuair na focail dobhareach agus bhliosán gréine le chéile, agus armadillo? Sin fuair a bheith rud éigin nua. Mar sin, na teicneolaíochtaí a úsáidimid gach lá. Más mian linn a ghlacadh leo céim amháin tuilleadh, áfach, más rud é againn i ndáiríre ag iarraidh a bheith in ann labhairt faoi na rudaí a sé Is go bhfuil na córais ag freagairt, ní mór dúinn a labhairt, arís, mar gheall ar sraith níos bunúsaí de cheisteanna. Agus sin ábhar i gcumarsáid go tugaimid fhreagairt cheist. Is é sin, ba mhaith linn a bheith in ann to-- yera yeah? LUCHT ÉISTEACHTA: [inaudible]. BRIAN SCASSELLATI: An bhfuil a fháil againn i bpróiseáil shéimeantach folaigh? Mar sin, tá. Tá a lán de na rudaí a bhfuil ag tarlú faoi bhun an dromchla le Siri agus i roinnt de na samplaí Tá mé ag dul a thaispeáint duit chugainn i gcás ina bhfuil go leor le beagán i dtéarmaí na struchtúr de cad tá tú ag rá go tábhachtach. Agus, go deimhin, go bhfuil mór réamhtheachtaí an sleamhnán seo chugainn go dtí mé. Mar sin, ar an mbealach céanna go bhfuil ár Tógadh aithint urlabhra suas de sraitheanna éagsúla, más mian linn a tuiscint a fháil ar cad é go bhfuil i ndáiríre á rá, táimid ag dul chun arís ag brath ar anailís il-ciseal an téacs go a bheith aitheanta. Mar sin, nuair is Siri i ndáiríre in ann a rá, táim fuair mé na focail seo. Anois, cad is féidir liom a dhéanamh leo? Is é an chéad chomhpháirt minic chun dul tríd agus iarracht chun anailís a struchtúr na habairte. Agus i méid atá feicthe againn i scoil grád, go minic, mar saghas diagramming abairtí, táimid ag dul a aithint go áirithe Tá róil áirithe focal. Tá na hainmfhocail. Tá na forainmneacha. Tá na briathra. Agus táimid ag dul chun aitheantas a gur le haghaidh gramadach ar leith, sa chás seo mBéarla gramadach, tá bealaí bailí inar féidir iad a chur le chéile liom agus bealaí eile nach bhfuil bailí. Aitheantas, struchtúr sin, d'fhéadfadh a bheith go leor chun cabhrú le treoir a thabhairt dúinn beagánín. Ach nach bhfuil sé go leor leor dúinn a bheith in ann a thabhairt aon bhrí le cad atá á rá anseo. Chun é sin a dhéanamh, beidh orainn a bheith ag brath ar roinnt méid na próiseála shéimeantach. Is é sin, táimid ag dul a bheith acu chun breathnú ag faoi bhun an méid gach ceann de na focail seo iompraíonn iarbhír mar brí. Agus ar an mbealach is simplí é seo a dhéanamh, táimid ag dul a chomhlachú leis gach focal bhfuil a fhios againn feidhm áirithe, claochlú áirithe go bhfuil sé Ceadaíonn a tharlóidh. Sa chás seo, d'fhéadfadh muid lipéad an focal "John" a bheith ina ainm ceart, go ndéanann sé leis céannacht. Agus d'fhéadfadh muid lipéad "Mary" mar an mbealach céanna. De bharr an méid briathar cosúil le "Is breá," a éard caidreamh ar leith go bhfuil muid in ann chun ionadaíocht a dhéanamh. Anois, ní chiallaíonn go dtuigimid cad is grá ach amháin go dtuigimid sé ar an mbealach a bhaineann le córas siombalach. Is é sin, is féidir linn lipéad é agus a ionramháil air. Le gach ceann de na cineálacha cur chuige, aon chineál próiseála shéimeantach anseo ag dul a cheangal ar beag giotán eolais agus a lán oibre ar ár gcuid. Tá muid a thuilleadh i réimse i gcás ina staidreamh díreach plain ag dul a bheith go leor dúinn. Anois, d'fhonn dul ón bpointe seo le bheith in ann labhairt faoi an taobh istigh de cad atá ag tarlú i ndáiríre anseo, le bheith in ann a ionramháil seo struchtúrú agus ceist a thuiscint agus ansin a bheith in ann chun dul amach agus cuardach a dhéanamh, go n-éilíonn níos mó samhail casta cognaíocha. An bealach ina bhfuil na córais a tógadh Is le haghaidh an chuid is mó an-, an-saothair dian. Baineann siad daoine chaitheamh go leor ama a struchtúrú ar na bealaí a bhfuil na cineálacha abairtí Is féidir a léiriú i roinnt loighic. Faigheann sé fiú beag níos casta, cé. Fiú nuair a tá muid déileáladh le Semantics, beidh muid a fós chun breathnú ar an pragmatics de cad atá á rá. Is é sin, conas is féidir liom mbaineann na focail go bhfuil mé le rud éigin go fisiciúil amach ann ar fud an domhain nó ag a laghad roinnt fhoinse eolais gur féidir liom a ionramháil? Uaireanta, mar thoradh ar na a giotán iontach athbhrí. "Red-te réalta réalteolaí a fear." OK. Anois, léigh muid go mar an cineál greannmhar de ceannlíne go mbeadh muid a fheiceáil ar an teilifís oíche déanach toisc nach bhfuil muid a léirmhíniú "réalta" a bheith acu a bhrí comhlacht neamhaí. Tá a fhios againn go bhfuil ciallaíonn sé an níos mó aisteoir coitianta nó ban-aisteoir le méideanna ard de infheictheachta. "Cuidíonn Scuad íospartach bite madra." An bhfuil sé go bhfuil an scuad i ndáiríre amach ann cúnamh a thabhairt madra i ag dul timpeall agus íospartaigh biting? Nó an bhfuil sé go raibh pearsa aonair a bhí bitten madra atá ag teastáil roinnt cabhrú? Díreach ó féachaint ar an error agus na semantics de na habairtí, ní féidir linn a chinneadh go. "Héileacaptar faoi thiomáint ag an cuileoga an duine." An bhfuil, i ndáiríre, iarbhír rudaí beag ag eitilt timpeall go tá daoine le sciatháin powering héileacaptair ar mhaithe leis an chine daonna? Nó an bhfuil gléas amháin meicniúil a fhaigheann a cumhacht ó dhuine? Nuair a fhéachaimid ar an gceist Córais fhreagairt, is iad seo na sraitheanna a ní mór dúinn chun déileáil leis. Anois, an chuid is fearr agus an chuid is saghas de forleithne de na córais seo Tá lá atá inniu ann in ann a dhéanamh rudaí ag leibhéal atá bhfad níos faide ná an méid a bhí againn 10 bliain ó shin. Seo ceann de na córais is fearr sin amach ann sa lá atá inniu. Agus tá sé seo le córas ó IBM ar a dtugtar Watson. Tá sé seo ó ár gcairde ag IBM. Tá sé seo bainc Katherine, Jia Chen, agus Priscilla Moraes a thabhairt dúinn léiriú ar Watson inné i IBM Yorktown. [VIDEO Archives] -Conas atá tú? -Tá mé go maith. Tá áthas orm i gcónaí nuair atá mé ag smaoineamh, go háirithe nuair mé Is féidir le fanacht fionnuar sna seomraí freastalaí. -Who É do ban-aisteoir is fearr leat? -My Ban-aisteoir is fearr leat Angelina Jolie mar Lara Croft i tuama Raider mar gheall ar a bunaidh foirm a bhí mar charachtar fíorúil cosúil liomsa. -Conas Is féidir Watson cabhrú le hothair? -An An plean d'othair a rochtain a fháil ar Watson go díreach? Rochtain ar Watson comhairleach Beidh iarratais a athrú de réir cás a úsáid. Ach i láthair na huaire, beidh Watson ar fáil ach amháin diagnóis agus cóireáil féideartha roghanna a gairmiúil leighis. I gcás inarb iomchuí, d'othair Is féidir faisnéis a chur ar fáil go Watson, b'fhéidir trí comhéadan gréasáin tairseach, tablet, nó fiú le fón póca. Mar shampla, d'fhéadfadh othar a bheith Iarrtar cur síos a n-airíonna i dteanga nádúrtha go díreach isteach i réiteach Watson, rud a ligeann an dochtúir chun díriú ar diagnóis agus ní bhailiú sonraí. -Who Assassinated Abraham Lincoln? -John Wilkes Booth. -i Cén bhliain a rinne an Arizona Diamondbacks bhuaigh an Sraith an Domhain? -2001. [END Archives] BRIAN SCASSELLATI: Mar sin, na cineálacha córais bheith ag brath ar an gcéad de gach ag aithint an chaint; dara, athrú sé isteach ar inmheánach brí ionadaíocht; agus ansin, an tríú, a bheith in ann dul amach agus a fháil an fhoinse eolais go ligeann dóibh a freagra na ceiste sin. Cuimsíonn sé seo leibhéal castachta na cineálacha céanna rudaí cláir go bhfuil tú ag ag déanamh i Leagann fhadhb. Tá muid in ann a pharsáil iarratais HTTP i an cineál céanna phatrún íseal-leibhéal meaitseáil gur féidir ELIZA dhéanamh. Tá muid in ann a thiontú siúd isteach i léiriú inmheánach, agus ansin iad a úsáid chun ceist ar roinnt bunachar sonraí seachtrach, b'fhéidir, ag baint úsáide as SQL. Gach ceann de na córais a atá á dtógáil sa lá atá inniu sin a dhéanamh den chineál seo nádúrtha cumarsáide teanga á dtógáil ar na prionsabail chéanna. Anois, fiú córas cosúil Ní Watson casta go leor a bheith in ann a fhreagairt treallach ceisteanna faoi aon ábhar. Agus go deimhin, tá siad a bheith struchtúrtha laistigh de réimse ar leith. Mar sin, is féidir leat dul ar líne agus is féidir leat teacht ar leaganacha de Watson go n-oibreoidh go maith laistigh de faisnéisíocht leighis. Nó níl líne amháin a dhéileálann go díreach leis an gcaoi chun moltaí a dhéanamh go maith faoi cén beoir dul lena bia. Agus laistigh de na réimsí, is féidir é a ceisteanna a fhreagairt, an t-eolas gur gá é. Ach ní féidir leat a mheascadh agus iad a mheaitseáil. An córas go bhfuil oiliúint curtha leis an mbunachar sonraí bia agus beoir nach bhfuil ag obair go maith nuair a dhéanann tú go tobann é a chur i leis an faisnéisíochta leighis bunachar sonraí. Mar sin, fiú ár gcórais is fearr inniu ag brath ar leibhéal na próiseála ina bhfuil muid códaithe láimhe agus ag tógáil i mbonneagar in ord a dhéanamh ar an gcóras seo a reáchtáil. Anois, ar an ábhar deireanach mian liom a bheith in ann a fháil chun an lae inniu Is faoi chumarsáid nonverbal. Tá mais mór den fhaisnéis sin táimid ag cumarsáid a dhéanamh lena chéile Ní thagann faoi tríd an focail aonair a bhfuil muid ag déanamh iarratais. Tá sé a dhéanamh le rudaí mar cóngaracht, gaze, do ton gutha, do infhilleadh. Agus is é sin chumarsáid freisin rud a go leor Comhéadain éagsúla cúram go leor faoi. Nach bhfuil sé cad cares Siri faoi. Is féidir liom a iarraidh Siri rud éigin i gceann guth nó i ton éagsúla gutha, agus tá Siri ag dul go dtí a thabhairt dom an freagra céanna. Ach ní go bhfuil an méid a thógáil againn le haghaidh cineálacha eile a lán de na comhéadain. Ba mhaith liom a thabhairt isteach tú anois ar cheann de na robots. D'tógtha ag mo longtime cara agus comhghleacaí Cynthia Breazeal agus a cuideachta Jibo. Agus an robot-- táimid ag dul a bheith acu oibrithe deonacha cúpla teacht suas chun idirghníomhú leis seo. Mar sin is féidir liom a bheith dhá daoine toilteanach a imirt leis an robot dom? Cén fáth nach bhfuil tú ag teacht ar bun, agus cén fáth nach bhfuil tú ag teacht ar suas. Má gur mhaith leat a bheith páirteach mé suas anseo, le do thoil. Agus má raibh mé in ann a bhfuil tú teacht ceart thar anseo. Go raibh maith agat. Dia duit. ALFREDO: Deas bualadh leat. Alfredo. BRIAN SCASSELLATI: Alfredo. RACHEL: Rachel. BRIAN SCASSELLATI: Rachel. Deas bualadh leat araon. Alfredo, tá mé ag dul a bheith acu a théann tú ar dtús. Tar ceart suas anseo. Tá mé ag dul a thabhairt isteach you-- más féidir liom a fháil as seo gan leagan na microphone-- go a chlárú beag darb ainm Jibo. OK? Anois, tá Jibo deartha le bheith idirghníomhach. Agus cé gur féidir é a thabhairt duit cainte, i bhfad ar an idirghníomhú leis an robot Is nonverbal. Alfredo, tá mé ag dul chun tú a iarraidh go a rá rud éigin deas agus moltach leis an robot, le do thoil. ALFREDO: I mo thuairimse, leat breathnú gleoite. [FUAIM whirring] BRIAN SCASSELLATI: OK. Níl a fhreagra ó bhéal. Agus fós thug sé leat an dá admháil shoiléir gur chuala sé cad a dúirt tú agus freisin thuig bhealach go. OK? Céim ceart ar ais anseo le haghaidh an dara ceann. Go raibh maith agat. Rachel, más rud é go mbeadh tú. Anois, tá mé ag dul a thabhairt tú an post i bhfad níos deacra. Má gur mhaith leat a bheith ar dheis anseo, ar ais go dtí ach beagán mar sin is féidir linn a fhaigheann tú ar cheamara agus táim ar an mbealach seo. Tá mé ag dul a iarraidh ort rud éigin a rá Ciallaíonn ndáiríre agus olc leis an robot. RACHEL: Cad chuma tú díreach a dhéanamh a bhí go hiomlán áiféiseach. [Portaireacht SOUND] Go raibh fiú níos mó áiféiseach. Cad atá ar siúl in éineacht leat? Aw, nach mbraitheann dona. Feicfidh mé a thabhairt duit barróg. BRIAN SCASSELLATI: Ceart go. Go raibh maith agat, Rachel. Alfredo, Rachel, guys go raibh maith agat go mór. [Bualadh bos] Mar sin, tá sa chineál seo idirghníomhaíocht go leor bealaí ar chuid de na rialacha céanna agus roinnt de na céanna Struchtúr mar cad againn D'fhéadfadh go mbeadh i idirghníomhaíocht teanga. Tá sé an dá cumarsáideach agus feidhmíonn na críche sin tábhachtach. Agus sin idirghníomhaíocht, i go leor bealaí, tá sé deartha go bhfuil éifeacht ar leith ar an duine idirghníomhú le nó ag éisteacht leis an robot. Anois, tá mé an t-ádh a bheith acu Jibo anseo inniu. Is sam Spaulding anseo ag cabhrú dúinn amach leis an robot. Agus tá mé ag dul a iarraidh Sam a thabhairt taispeána dúinn ar cheann deas de rince Jibo gur féidir linn féachaint ar ag an deireadh anseo. Mar sin, dul ar aghaidh, Jibo. SAM: OK, Jibo. Taispeáin dúinn do bogann rince. [Ag seinm ceoil] BRIAN SCASSELLATI: Ceart go leor, gach duine. Go raibh maith agat chun ár gcairde ag Jibo. [Bualadh bos] Agus go raibh maith agat chun ár gcairde ag IBM as cuidiú amach lá atá inniu ann. Cumarsáid rud éigin go bhfuil tú ag dul a fheiceáil ag teacht suas níos mó agus níos mó mar thógáil againn comhéadain níos casta. Tseachtain seo chugainn, beidh orainn a bheith ag caint faoi ​​conas a comhéadan le opponents ríomhaire i gcluichí. Ach má tá ceisteanna agat faoi seo duit, Beidh mé a bheith thart ar uaireanta oifige anocht. Tá áthas orm a labhairt leat faoi AI topaicí nó chun dul isteach níos mó sonraí. Bíodh deireadh seachtaine iontach. [Bualadh bos] [Ag seinm ceoil]