LUCAS Freitas: Hey. Hər kəs xoş gəlmisiniz. My name Lucas Freitas edir. Mən oxuyan [işitilemez] kiçik deyiləm bir diqqət ilə, kompüter elm hesablama dilçilik. Belə ki, mənim orta dilində və dil nəzəriyyəsi. Mən, həqiqətən, uşaqlar öyrətmək üçün heyecan alıram sahəsində haqqında bir az. Bu öyrənmək üçün çox maraqlı sahədir. Həmçinin potensial bir çox gələcək üçün. Belə ki, mən, həqiqətən, heyecan edirəm ki, siz uşaqlar layihələr nəzərdən hesablama dilçilik. Mən məsləhət üçün çox xoşbəxt olacaq Əgər hər hansı bir Əgər istəsəniz o biri aparırıq. Hesablama nə bütün Belə ki, ilk dilçilik? Belə ki, hesablama dilçilik nədir dilçilik və arasında kəsişmə kompüter elm. Belə ki, dilçilik nədir? Kompüter elm nədir? Yaxşı dilçilik olan, nə biz diller almaq. Belə ki, dilçilik əslində öyrənilməsi ümumiyyətlə təbii dil. Belə ki, təbii dil - biz haqqında danışmaq biz, həqiqətən, istifadə ki, dil bir-biri ilə ünsiyyət. Beləliklə, biz dəqiq söhbət deyilik C və ya Java haqqında. Biz ingilis haqqında daha çox söhbət edirik Çin və digər dillərdə ki, biz bir-biri ilə ünsiyyət üçün istifadə. Ki, haqqında çətin odur ki, indi biz demək olar ki, 7000 dünyada languages. Belə ki, çox yüksək sıra var biz öyrənmək olar ki, dil. Və sonra yəqin ki, hesab edirəm ki, etmək çox çətin, məsələn, Bu bir dildən tərcümə digər, siz nəzərə alaraq demək olar ki, 7000 Onlardan. Belə ki, tərcümə etdiyini düşünürəm əgər bir dildən başqa siz demək olar ki, bir milyon çox müxtəlif birləşmələri bilərsiniz ki, dil dil var. Belə ki, həqiqətən bəzi etmək çətin oldu Məsələn tərcüməsi sisteminin cür üçün hər bir dil. Belə ki, sintaksis ilə dilçilik alır, semantika, praqmatik. Siz uşaqlar tam ehtiyac yoxdur nə var bilmək. Amma çox maraqlı bir şey ki, Siz öyrənmək zaman bir Anadili kimi uşaq kimi dil, siz həqiqətən öyrənmək o hər şeyi - syntax semantika və praqmatik - Özünüz. Və heç kim üçün siz sintaksis öyrətmək var siz cümlələr necə anlamaq strukturlaşdırılmış. Belə ki, həqiqətən maraqlı çünki çox gəlir ki, bir şey var daxilən. Və nə edirlər kompüter elm? Yaxşı, ən əhəmiyyətli odur ki, biz kompüter var ilk deyil bütün süni intellekt və maşın təlim. Belə ki, biz bunu çalışdığınız nə hesablama dilçilik öyrətmək deyil bir şey etmək necə sizin kompüter dili ilə. Belə ki, məsələn, maşın translation. Mən kompüter necə öyrətmək üçün çalışıram bir keçid necə digər dil. Belə ki, əsasən tədris istəyirəm kompüter iki languages. Mən təbii dil emal nə varsa, məsələn halda olan Facebook Graph Search, siz öyrətmək anlamaq üçün necə sizin kompüter queries yaxşı. Belə ki, "photos demək əgər mənim dostlar. "Facebook müalicə deyil ki, olan bir string kimi sözləri bir dəstə. Bu, həqiqətən əlaqəni başa düşür "photos" və "mənim dostları" və arasında "photos" başa düşür ki, əmlak "Dostlarım". Belə ki, məsələn, bir hissəsi təbii dil emal. Bu anlamaq üçün çalışırıq nə arasındakı münasibətlərdir bir cümlə sözləri. Və böyük sual, siz edir danışmaq necə bir kompüter öyrətmək ümumi bir dil? Çox maraqlı bir sual olan , kimi bəlkə gələcəkdə, hesab edirəm siz olacaq mobil telefon danışmaq. Kind biz Siri ilə nə kimi, lakin daha çox bir şey kimi, həqiqətən bilərsiniz istədiyiniz nə demək və telefon hər şeyi anlamaq üçün gedir. Və bu suallar takip edə bilərsiniz və söhbət saxlamaq. Ki, həqiqətən maraqlı bir şey var mənim fikrimcə. Belə ki, təbii dil haqqında bir şey. Haqqında həqiqətən maraqlı bir şey təbii languages ​​ki, və bu Mənim dilçilik professor kredit, Maria Polinsky. O, misal verir və mən hesab edirəm ki, həqiqətən maraqlı deyil. Biz zaman dil öyrənmək Çünki biz doğma sonra anadan edirik dil cür bizə artır. Və əsasən dil öyrənmək minimal daxil olan, sağ? Siz yalnız daxil alırıq Sizin Dil səslənir nə valideynləri kimi və yalnız onu öyrənmək. Siz baxmaq əgər çünki, maraqlıdır o cümlələr, məsələn. Siz baxmaq, "Mary hər bir palto qoyur dəfə o evi tərk edər. " Bu halda, bu, üçün mümkündür sözü "o" sağ, Məryəm baxın? Siz "Mary bir palto qoyur demək olar Mary yarpağı hər zaman ev. "belə ki, gözəl var. Amma sonra cümlə baxsaq "O, Mary bir palto hər vaxt qoyur evi tərk edər. "Əgər bu bilirəm "o" olduğunu söyləmək mümkün Məryəm istinad. "Mary qoyur ki, heç bir yol var bir palto Mary yarpağı hər zaman ev. "Belə ki, maraqlı deyil, çünki bu intuisiya növüdür hər Anadili var. Və heç kim bu ki, tədris edilmişdir sintaksis çalışır ki, yol. Və yalnız bu "o" ola bilər ki, Bu birinci halda Məryəm istinad və həqiqətən bu digər çox, lakin bu bir. Amma hər kəs cür olur eyni cavab. Hər kəs razılaşır. Belə ki, necə olsa da həqiqətən maraqlı bütün qaydaları bilmirəm sizin dildə cür anlamaq dil çalışır. Belə ki, təbii haqqında maraqlı şey dili yoxdur ki, bilmək bir sintaksis bilirsinizsə bir cümlə üçün qrammatik və ya savadsız edir Əksər hallarda. Hesab edir ki, bəlkə nə olur ki, sizin həyat vasitəsilə yalnız daha çox əldə saxlamaq cümlələr sizə izah etdi. Və sonra ezberlemeye saxlamaq bütün cümlə. Və sonra kimsə sizə deyir zaman bir şey, siz cümlə eşitmək və Sizin lüğət baxmaq cümlələr və görmek ki, cümlə var. Və orada siz əgər Bu qrammatik deyirlər. Bu deyil, əgər siz demək savadsız. Belə ki, bu halda, siz, oh, deyərdim belə ki, bütün böyük bir siyahısı var mümkün cümlələr. Və sonra bir cümlə eşitmək zaman, Bu qrammatik və ya əgər siz bilirsiniz əsasında deyil. Bu odur ki, siz baxsaq bir cümlə, məsələn, "The beşbaşlı CS50 TFS kor bişirilmiş bir DAPA kubok istifadə ahtapot. "Bu mütləq bir cümlə Siz əvvəl eşitdim ki,. Amma eyni zamanda bu bilirəm sağ, qrammatik olduqca çox? Qrammatik səhvlər var və demək olar ki, bu, mümkün cümlə var. Belə ki, bizə hesab edir ki, əslində biz dil öyrənmək yol deyil mümkün böyük bir bazası olan söz və ya cümlələr, lakin daha çox arasındakı əlaqəni dərk bu cümlələr sözləri. Ki, hissi edirmi? Belə ki, sonra sual bilər, edir kompüter dil öyrənmək? Biz kompüter dil öyrətmək olar? Belə ki, fərq düşünək bir dil bir Anadili arasında və kompüter. Belə ki, nə natiq olur? Yaxşı, Anadili bir öyrənir ona məruz dil. Adətən onun erkən uşaqlıq illərini. Belə ki, əsasən, yalnız, bir körpə var və siz söhbət saxlamaq və bu, yalnız danışmaq necə öyrənir dil, sağ? Belə ki, əsasən ötürür körpə girdi. Belə ki, sonra, mübahisə edə bilər ki, bir kompüter doğru, eyni şey edə bilərsiniz? Siz yalnız dil verə bilər kompüter giriş kimi. Misal üçün faylları bir dəstə İngilis kitab var. Bəlkə bir yol var ki, siz bəlkə bir dərs bilər kompüter English, sağ? Və əslində, bu barədə düşünüyorsanız, bəlkə bir neçə götürür bir kitab oxumaq üçün gün. Bir kompüter üçün bu bir ikinci edir bir kitab bütün sözləri baxmaq. Belə ki, ola bilər bilər yalnız bu siz ətrafında giriş dəlil, ki, ki, demək kifayət deyil yalnız insanlar edə bilər ki, bir şey. Siz kompüter hesab edə bilər də daxil edə bilərsiniz. İkinci odur ki, anadil də var ki, bir beyin var dil öyrənmə qabiliyyəti. Amma bu barədə düşünüyorsanız, bir beyin möhkəm şeydir. Siz anadan olduqda, artıq müəyyən oldu - Bu sizin beyin. Siz böyümək kimi, yalnız daha çox almaq dil giriş və bəlkə qida və digər stuff. Lakin olduqca çox sizin beyin möhkəm bir şeydir. Belə ki, siz də, bəlkə siz, demək olar bir dəstə var ki, bir kompüter qurmaq funksiyaları və yalnız taklit ki, üsulları dil öyrənmə qabiliyyəti. Belə ki mənada, mən, yaxşı, demək olar bütün var ki, bir kompüter ola bilər Mən dil öyrənmək lazımdır şeylər. Və son şey ki, doğma natiq sınaq və səhv öyrənir. Belə ki, əsasən bir mühüm şey dil öyrənmə ki, siz cür edilməsi şeyi öyrənmək Siz eşitmək nə ümumiləşdirmələr. Siz artan kimi Belə ki, öyrənmək bəzi sözlər daha isim kimi, digər olanları sifətlər var. Və hər hansı bir yoxdur dilçiliyin bilik ki, başa düşmək. Amma yalnız bir söz var bilirəm Bu bir hissəsinə konumlandırılmış cümlə və digər bəzi başqaları cəzanın hissələri. Və siz ki, bir şey nə zaman doğru deyil ki, bir cümlə kimi - bəlkə çünki bir çox ümumiləşdirilməsi məsələn. Siz artan etdiyiniz zaman bəlkə, siz qeyd cəm adətən ki, bir S qoyaraq formalaşır Sözün sonu. Və sonra siz cəm etmək üçün cəhd "Maral" və ya "diş" kimi "maral" "Tooths." Belə ki, sonra valideynləri və ya Kimsə sizə islah və deyir yox, "maral" cəm ", maral" və "diş" cəm "diş" dir. Və sonra siz həmin şeyi öyrənmək. Belə ki, sınaq və səhv öyrənmək. Amma siz də edə bilərsiniz ki, kompüter ilə. Siz deyilən bir şey ola bilər möhkəmlətmə təlim. Bir verilməsi kimi əsasən Hansı Bunu zaman kompüter bir mükafat doğru bir şey. Və bir mükafat əks verilməsi və bu, yanlış bir şey yoxdur zaman. Siz, həqiqətən, görmək olar ki, siz getmək əgər Google Translate və siz cəhd etmək bir cümlə tərcümə, bu Əlaqə üçün xahiş edir. Siz demək Belə ki, oh, bir yaxşı var Bu cümlənin translation. Daha sonra onu yazın və edə bilər, əgər bir çox insanlar daha yaxşı deyərək saxlamaq tərcümə, yalnız öyrənir ki, əvəzinə ki, tərcümə istifadə etməlidir Bu verirdi biridir. Belə ki, bir çox fəlsəfi sual kompüter olacaq görmek üçün gələcəkdə danışmaq və ya edə. Amma yüksək ümidlər var onlar ki yalnız dəlilləri əsaslanır. Amma bir fəlsəfi yalnız daha çox sual. Kompüter hələ də danışmaq bilməz, belə ki, biz nə edə bilər şeylər nələrdir? Bəzi həqiqətən cool şeylər var data təsnifatı. Belə ki, məsələn, uşaqlar bilirik ki, e-poçt xidmətləri üçün, nə Məsələn, spam filtreleme. Siz spam almaq belə zaman, o, Başqa bir qutu filter çalışır. Belə ki, necə ki, bunu edir? Bu kompüter yalnız bilir kimi deyil nə e-poçt ünvanlarını spam göndərir. Belə ki, daha çox content əsasında mesaj, və ya bəlkə adı, və ya bəlkə var ki, bəzi model. Belə ki, əsasən, siz nə edə bilərsiniz almaq bir spam ki, e-poçt məlumatların çox, spam deyil və öyrənmək e-poçt nə Siz var nümunələri cür spam ki olanlardır. Bu Computational hissəsidir dilçilik. Bu data təsnifat deyirlər. Və biz, həqiqətən, görmək olacaq bir növbəti slaydlar ki, nümunə. İkinci şey təbii dil şey olan emal ki, Image Search imkan edir Bir cümlə yazmaq. Və bu başa inanır nə mənası və verir daha yaxşı bir nəticə. Əslində, Google və ya Bing getmək əgər və xanımı kimi bir şey axtarış Gaga hündürlüyü, həqiqətən olacaq əvəzinə məlumat 5 '1 "almaq üçün bu, həqiqətən anlayır, çünki onun Əgər söhbət etdiyiniz nə. Belə ki, təbii hissəsi dil emal. Ya da siz ilk Siri istifadə etdiyiniz zaman Siz üçün çalışır ki, bir alqoritm var nə dediyini tərcümə sözləri, mətn. Və sonra tərcümə çalışır ki, mənası. Belə ki, bütün təbii hissəsi dil emal. Sonra maşın tərcümə var - həqiqətən biri olan Seçdiklərimə - yalnız tərcümə olan başqa bir dil. Belə ki, siz yapýyorsun zaman hesab edə bilər maşın tərcüməsi, siz var cümlələr sonsuz imkanlar. Belə ki, yalnız saxlanılması heç bir yol var hər bir translation. Beləliklə, siz maraqlı gəlmək lazımdır alqoritmlər etmək hər bir tərcümə bir şəkildə cümlə. Siz uşaqlar bu günə qədər hər hansı bir sualınız var? No? OK. Belə ki, nə biz bu gün görmək üçün gedir? İlk növbədə, mən danışacağam təsnifat problem. Belə ki, mən ki, bir Spam haqqında söyləyərək. Mən gedirəm verilən lirika edir bir mahnı, siz anlamaq üçün cəhd edə bilərsiniz yüksək ehtimalı ilə müğənni kimdir? Mən xanımı mahnılar var ki, deyirlər Gaga və Katy Perry, Mən sizə bir vermək əgər yeni mahnı, siz anlamaq bilər Bu Katy Perry və ya Lady Gaga var? İkinci, mən yalnız danışmaq üçün gedirəm seqmentləşdirilməsi problem haqqında. Mən sizə uşaqlar tanıdıqlarını, lakin Çin, Yapon, digər Şərqi Asiya dil və digər dillərdə ümumiyyətlə, yoxdur sözlər arasında boşluq. Və sonra ki, yol barədə düşünüyorsanız çalışır sizin kompüter cür təbii dil emal anlamaq, Bu sözləri baxır və əlaqələrin anlamaq üçün çalışır onların arasında, sağ? Lakin sonra siz Çin var, və əgər sıfır boşluq var, bu, çətindir həqiqətən arasında əlaqə nə tapmaq sözlər, çünki onlar hər hansı bir yoxdur ilk sözlər. Beləliklə, siz deyilən bir şey var yalnız qoyaraq deməkdir seqmentasiya biz zəng istədiyiniz nə arasında boşluq həmin dildə sözlər. Mənada? Və sonra biz olacaq sintaksis haqqında danışmaq. Təbii haqqında Belə ki, yalnız bir az dil emal. Bu yalnız ümumi olacaq. Belə ki, bu gün, əsasən mən bunu istəyirəm nə sizə uşaqlar bir bir az vermək imkanları nə daxili Siz Computational ilə edə bilərsiniz ki, dilçilik. Və sonra siz nə edə bilərsiniz o şeylər arasında sərin. Və bəlkə bir layihə hesab edə bilər və mənə danışmaq gəlir. Mən sizə məsləhət verə bilər onu həyata keçirmək üçün necə. Belə ki, sintaksis bir az olacaq Image Search və maşın haqqında translation. Mən yalnız necə bir nümunə vermək gedirəm Siz, məsələn, tərcümə edə bilər İngilis Portuqaliya şey. Yaxşı səslənir? Belə ki, ilk təsnifat problem. Mən demək lazımdır ki, seminar bu hissəsi ən çətin olacaq bir var olacaq çünki yalnız bəzi coding olmalıdır. Amma bu Python olacaq. Mən sizə uşaqlar Python bilirik ki, yoxdur bilirik Mən yalnız yüksək izah gedirəm Mən yapýyorum nə səviyyəsi. Və siz də həqiqətən qayğı yoxdur ki, çünki sintaksis haqqında çox Sizlərin öyrənə bilər bir şey. OK? Yaxşı səslənir. Belə ki, təsnifat problem nədir? Belə ki, bəzi lyrics sunulur mahnı, və siz tahmin istəyirəm onu ifa olunur. Bu hər hansı ola bilər digər problemləri. Belə ki, misal üçün, bir var bilər prezident kampaniyası və bir var çıxış, və siz tapmaq istəyirəm idi, əgər, məsələn, Obama və ya Mitt Romney. Və ya e-poçt bir dəstə ola bilər və Əgər onlar əgər anlamaq istəyirəm spam və ya deyil. Belə ki, yalnız bir təsnif edir sözləri əsasında data siz var. Belə ki, bunu, siz var bəzi fərziyyələr etmək. Belə ki, hesablama dilçilik haqqında bir çox fərziyyələr edir, adətən smart fərziyyələr, belə ki, Siz yaxşı nəticələr əldə edə bilərsiniz. Bunun üçün bir model yaratmaq üçün çalışırıq. Və sonra, bu cəhd edin və bu işləri görmək bu yaxşı dəqiqlik verir. Və əgər, sonra onu yaxşılaşdırmaq üçün çalışırıq. Bu, siz, OK, kimi danışırsınızsa deyil, bəlkə fərqli bir ehtimal etməlidir. Beləliklə, biz olacaq ki, ehtimal etmək bir rəssam adətən oxuyur ki, bəlkə bir mövzu çox dəfə, və sözləri neçə dəfə istifadə yalnız onlar üçün istifadə etdiyiniz çünki. Siz yalnız dost hesab edə bilər. Mən sizə uşaqlar bütün dostları var əminəm , onların imza söz demək ki, sözün hər bir cümlə üçün - bəzi xüsusi söz və ya bəzi xüsusi kimi onlar üçün demək ki söz hər bir cümlə. Və nə demək olar ki, görürsünüz əgər bir imza var ki, bir cümlə söz, siz tahmin edə bilərsiniz yəqin ki, Sizin dostudur bir hüququ, o dedi? Belə ki, o ehtimal etmək və ki, bir model yaratmaq necə. Mən verəcəyəm ki, nümunə deyil necə Lady Gaga, məsələn, insanlar o "körpə" istifadə edir ki, onun bütün bir nömrəli mahnılar. Və həqiqətən, bu bir video olduğunu göstərir Onun sözü "körpə" deyərək müxtəlif mahnılar. [Video playback] - (SINGING) Baby. Baby. Baby. Baby. Baby. Babe. Baby. Baby. Baby. Baby. [END video playback LUCAS Freitas: Beləliklə, mən hesab edirəm ki, var O deyir ki, burada 40 mahnı sözü "körpə". Belə ki, əsasən tahmin edə bilərsiniz ki, var ki, bir mahnı görürsünüzsə sözü "körpə" bəzi yüksək var Bu Lady Gaga ki, ehtimal. Amma bu inkişaf cəhd edək daha çox formal. Belə ki, bu tərəfindən mahnıları lyrics var Lady Gaga və Katy Perry. Belə ki, Lady Gaga baxmaq, onlar görmək hadisələr bir çox var "körpə" a hadisələr çox "yol". Və sonra Katy Perry hadisələr bir çox var "Bu," hadisələr bir çox "yanğın". Belə ki, əsasən biz istədiyiniz nə nə bir lirik əldə edir. Gəlin bir üçün bir lirik almaq demək edək "körpə" yalnız "körpə." olduğunu mahnı Əgər Siz yalnız söz "körpə" və bu almaq Siz ki, bütün data edir Lady Gaga və Katy Perry, kim Siz tahmin şəxs olan mahnı oxuyur? Lady Gaga və ya Katy Perry? Lady Gaga, sağ? O deyir olan yalnız bir çünki "Körpə". Bu hüquq, axmaq səslənir? OK, bu, həqiqətən asandır. Mən yalnız iki mahnı da və arıyorum Əlbəttə ki, o var olan yalnız biri "Körpə". Amma sözləri bir dəstə nə varsa? Əgər faktiki lyric, bir şey varsa, kimi, "körpə, yalnız bir [görmək getdi? TMM?] mühazirə, "və ya kimi bir şey, və sonra həqiqətən anlamaq üçün var - bütün bu sözlər əsasında - olan rəssam olan yəqin ki, bu mahnını səsləndirdi? Belə ki, inkişaf edək bir az daha bu. OK, belə ki, yalnız məlumatlarına əsaslanır ki, biz var, bu Gaga yəqin ki, görünür müğənni. Amma necə yaza bilərsiniz Bu daha çox formal? Və bir az var olacaq statistika bit. Beləliklə, siz itirilmiş almaq əgər, yalnız cəhd konsepsiyasını başa düşmək üçün. Siz anlamaq, əgər Fərq etməz tənliklər yaxşı. Bu, bütün online olacaq. Belə ki, əsasən nə mən hesablanması alıram edir Bu mahnı ilə olduğunu ehtimal Lady Gaga ki, verilmiş - bu bar ki, verilən deməkdir - Mən söz gördüm "körpə". Ki, hissi edirmi? Mən hesablamaq üçün çalışıram ki, ehtimal. Belə ki adlanan bu teoremi var Ki, deyir ki Bayes teoremi də A verilmiş B ehtimalı, edir A, dəfə verilir B ehtimalı ehtimalı üzərində A ehtimalı, B. Bu uzun tənlik var. Amma nə anlamaq üçün var ki, bu mən istəyirəm nə olduğunu sağ, hesablamaq? Ki, mahnı edir ki ehtimalı Lady Gaga Mən söz gördüm ki, verilmiş "Körpə". İndi nə alıram edir verdiyi sözü "körpə" ehtimalı I Lady Gaga var. Və əsasən nədir? Ki vasitələri nədir, nə deyil sözü "körpə" görən ehtimalı Gaga lirika? Mən çox ki, hesablamaq istəyirsinizsə sadə yolu, bu yalnız sayı var dəfə mən ümumi sayı artıq "körpə" bax Gaga lirika sözlər, sağ? Görürəm ki, tezlik nədir Gaga iş ki, söz? Mənada? Ikinci dövr edir Gaga ehtimalı. Bu nə deməkdir? Bu əsasən deməkdir ki, nə təsnif ehtimalı Gaga kimi bəzi lyrics? Və bu cür qəribə, lakin Nin bir misal üzərində düşünək. Belə deyək ki, ehtimal bir mahnı "körpə" olan eyni Gaga və Britney Spears üçün. Amma Britney Spears iki dəfə var Lady Gaga daha çox mahnılar. Belə ki, kimsə yalnız təsadüfi verir əgər ilk şey ", körpə" nin lirika baxacağıq, ehtimalı nədir bir Gaga mahnı "körpə" olan, "körpə" bir Britney mahnı? Və eyni şey. Beləliklə, siz görəcəksiniz ki, ikinci şey, yaxşı, ehtimalı nədir özü bu lyric, bir Gaga lirik olan və ehtimalı nədir bir Britney lyric olan? Belə ki, Britney daha çox lirika var Gaga çox, siz yəqin ki, olacaq demək, yaxşı, bu yəqin ki, bir Britney lirik. Biz bu var nə ki, var burada adlandırırıq. Gaga ehtimalı. Əhəmiyyət kəsb edir? Yoxdur? OK. Və son bir yalnız ehtimal edir "körpə" olan deyil həqiqətən çox. Amma bu ehtimalı var İngilis dili "körpə" görən. Biz adətən qayğı yoxdur ki, ki, müddət haqqında çox. Ki, hissi edirmi? Belə ki, Gaga ehtimalı əvvəlcədən ehtimal adlı sinif Gaga. Yalnız o deməkdir ki, çünki nə ki, sinif olan ehtimalı - Gaga olan - yalnız ümumi, yalnız heç bir şəraiti ilə. Və sonra mən ehtimalı zaman "Körpə," biz zəng plus verilən Gaga çünki bir ehtimal nəzəriyyəsi olan ehtimalı Gaga bəzi sübut. Mən sizə sübut verirəm Mən söz körpə gördüm ki, mahnı mənada etmək? OK. Mən hesablanmışdır Əgər hər üçün Lady Gaga üçün mahnıları, ki, olacaq nə - Görünür, mən bu hərəkət edə bilməz. Gaga ehtimalı olacaq bir şey kimi, 2 24, dəfə 1/2, 53-dən çox 2 üzərində. Bilirsiniz, əgər bu məsələ deyil nə bu nömrələri gəlir. Amma bu gedir ki, yalnız bir sıra sağ, 0 daha çox olmaq? Və sonra mən Katy Perry, nə zaman Katy verilən "körpə" ehtimalıdır artıq 0, sağ? Heç bir "körpə" var, çünki Katy Perry. Belə ki, bu 0 olur və Gaga qalibiyyət, hansı Gaga o deməkdir ki, yəqin ki, müğənni. Ki, hissi edirmi? OK. Mən bu daha rəsmi etmək istəyirsinizsə, Mən, həqiqətən, bir model edə bilərsiniz neçə söz. Belə ki, bir şey var ki, deyək kimi, "körpə, mən yanğın, "və ya bir şey. Belə ki, çox sözləri var. Və bu halda, siz görə bilərsiniz ki, "körpə", Gaga edir lakin Katy deyil. Və "yanğın" Katy, lakin sağ, Gaga deyil? Belə ki, hüququ, trickier əldə edir? Görünür ki, çünki demək olar ki, arasında birlik var. Beləliklə, nə siz nə etmək lazımdır güman edir sözləri arasında müstəqillik. Belə ki, əsasən o deməkdir ki, nə ki, Mən yalnız nə hesablanması alıram görən ehtimalı "körpə" nə görən ehtimalı "Mən" və "Yanğın" "am", və "," və bütün ayrı-ayrı. Sonra onların hamısı çarparaq alıram. Mən ehtimal nə görən deyiləm bütün cümlə görüb. Mənada? Belə ki, əsasən, mən yalnız bir söz varsa, nə tapmaq istəyirəm ARG max, deməkdir, ki, sinif nə Mənə ən yüksək ehtimalı verilməsi? Belə verdiyi sinif nədir mənim üçün ən yüksək ehtimalı sinif ehtimalı söz verilir. Belə ki, bu halda, Gaga "körpə." Verilir Və ya Katy "körpə." Verilir Mənada? Və yalnız Bayes gələn, Mən göstərdi ki, tənlik, biz bu fraksiya yaratmaq. Yalnız siz ki, bax ki verilmiş sözün ehtimalı asılı olaraq sinif dəyişikliklər sinfində, sağ? Mən ki, "körpə" nin sayı Gaga Katy fərqlidir. Sinif ehtimalı yalnız sıra dəyişikliklər, Onların mahnıları hər malikdir. Amma sözü özü ehtimalı bütün üçün eyni olacaq rəssamlar, sağ? Belə ki, söz ehtimalı yalnız ehtimalı nədir Bu o sözü görən İngilis dili? Belə ki, onların hamısı üçün eyni. Bu daimi ildən Beləliklə, biz yalnız bu düşmək və bu barədə qayğı. Belə ki, bu, həqiqətən olacaq biz aradığınız tənlik. Bir neçə söz varsa, mən hələ əvvəl var gedir burada ehtimal. Mən sadəcə vurulması edirəm ki, ehtimalı bütün digər sözlər. Mən onlara bütün çarparaq alıram. Mənada? Bu, qəribə görünür, ancaq əsasən deməkdir Bu sinif qalmış və hesablamaq sonra hər ehtimalı çoxaltmaq ki, sinif olan sözlər. Və bilirik ki, bir ehtimalı bir sinif verilmiş söz gedir Siz ki, söz görmək dəfə sayı sayı bölünür ki, sinif, sözləri ki, var ümumi sinif. Mənada? Bu artıq 2 yalnız necə "körpə" idi var sözlərin sayının Mən lyrics idi. Belə ki, yalnız tezliyi. Amma bir şey var. Mən göstərən necə xatırlayıram ki, "körpə" olan lyrics ehtimalı Katy Perry 0 idi çünki Katy Perry bütün "körpə" yoxdur? Lakin bu, yalnız bir az sərt səslənir sadəcə lirika ola bilməz ki, onlar yoxdur yalnız bir rəssam hər hansı bir zamanda xüsusilə ki, söz. Əgər belə ki, yalnız, yaxşı, demək olar bu sözü yoxdur, mən gedirəm bir aşağı ehtimal vermək, amma yalnız fikrində deyiləm hemen 0 vermək. Bəlkə bir şey kimi idi Olan "yanğın, yanğın, yanğın, yanğın," tamamilə Katy Perry. Və sonra "körpə" və yalnız gedir 0 hemen bir var idi, çünki "Körpə". Belə ki, əsasən biz nə bir şey deyil Laplas hamarlaşdırıcı çağırıb. Və bu yalnız mən verirəm o deməkdir ki, hətta sözləri bəzi ehtimalı ki, yoxdur. Mən nə ki, mən olduğumu Bu hesablanması, mən həmişə 1 əlavə surət. Sözü yoxdur, belə ki, hətta Bu 0 olduqda bu halda, mən hələ də deyiləm artıq 1 kimi bu hesablanması sözləri ümumi sayı. Əks halda, mən almaq necə çox söz Mən və mən 1 əlavə edin. Mən həm hallar üçün hesablanması alıram. Mənada? Belə ki, indi bəzi coding nə edək. Mən olduqca sürətli bunu gedirəm lakin bu, yalnız vacibdir ki, siz uşaqlar anlayışları anlamaq. Beləliklə biz nə çalışdığınız məhz bu tətbiq edilir Mən yalnız bildirib ki, bir şey - Mən sizə lyrics qoymaq istəyirəm Lady Gaga və Katy Perry. Və proqram etmək niyyətindədir Bu yeni lyrics Gaga əgər demək və ya Katy Perry. Mənada? OK. Mən gedirəm bu proqram var classify.py zəng etmək üçün. Belə ki, bu Python edir. Bu yeni proqramlaşdırma dili var. Bəzi çox oxşardır C və PHP yolları. Siz istəyirəm, çünki, əgər oxşar C bilmədən sonra Python öyrənmək, bu bir problem ki, həqiqətən, çox deyil Python çox asandır, çünki yalnız daha C, ilk növbədə. Və bir çox şey artıq sizin üçün həyata keçirilir. Belə ki, yalnız necə PHP kimi funksiyaları vardır ki, bir siyahısı düzmək, və ya bir şey əlavə bir sıra, və ya blah, blah, blah üçün. Python eləcə də həmin bütün var. Mən tez izah gedirəm biz təsnifatı edə bilər necə burada problem. Belə ki, bu halda, mən ki, deyək Gaga və Katy Perry-dən lyrics. Mən həmin lyrics var ki, yol ki, lyrics ilk söz rəssam adı, və Qalan lirika. Belə ki, Mən bu siyahı var ki, deyək ilk bir Gaga lirika. Belə ki, burada doğru yolda edirəm. Və növbəti bir Katy və bu da lyrics var. Belə ki, bu elan necə Python dəyişən. Siz data type vermək yoxdur. Siz yalnız "lyrics" yazmaq cür PHP istəyirəm. Mənada? Mən ki, hər şeyi nə var hesablamaq etmək hesablamaq ehtimalları? Mən "Priors" hesablamaq lazımdır müxtəlif hər Mən ki, dərsləri. Mən "posteriors," hesablamaq lazımdır və ya olduqca çox ehtimallar of müxtəlif sözlərin hər ki, Mən hər bir rəssam üçün ola bilər. Belə Gaga ərzində, məsələn, gedirəm Mən necə bir çox dəfə bir siyahısı var sözləri hər. Mənada? Və nəhayət, mən yalnız gedirəm bir yalnız gedir ki, "sözləri" adlı siyahı üçün necə çox söz I hər bir rəssam üçün var. Belə ki, Gaga, misal üçün, mən baxmaq lyrics, mən hesab edirəm ki, 24 cəmi words. Belə ki, bu siyahı yalnız gedir Gaga 24 və Katy başqa nömrəsi. Mənada? OK. Belə ki, indi, həqiqətən, edək coding gedin. Belə ki, Python, siz həqiqətən bilərsiniz müxtəlif bir dəstə qayıtmaq bir funksiyası şeylər. Mən bu funksiyanı yaratmaq gedirəm davam edən "şərti" adlı , o hər şeyi qayıtmaq "Məhkumluğu," və "ehtimallar" və "Sözləri." Belə ki, "şərti" və bu daxil zəng etmək olacaq "lyrics". Belə ki, indi siz həqiqətən istəyirəm bu funksiyanı yazın. Mən bu yaza bilərsiniz ki, yol funksiyası Mən yalnız bu müəyyən edilir ilə fəaliyyət "def." Mən def "etdi şərti "və alaraq "Lyrics". Və nə bu nə gedir , ilk növbədə, mən Priors var Mən hesablamaq istəyirəm ki,. Mən bunu edə bilərsiniz ki, yol yaratmaq Python, bir lüğət olan bir hash kimi olduqca çox eyni şey masa, və ya bir iterative kimi PHP array. Bu bir lüğət bəyan necə. Və əsasən nə deməkdir ki, Gaga məhkumluğu əgər, məsələn, 0,5 Lyrics 50% var Gaga, 50% Katy edir. Mənada? Mən anlamaq üçün necə Priors hesablamaq üçün. Mən nə var ki, növbəti olanlar, həmçinin, ehtimallar və sözləri var. Belə ki, Gaga ehtimalları siyahısı bütün ehtimallar ki Gaga sözləri hər biri üçün var. Mən Gaga ehtimallar getmək əgər "Körpə," Məsələn, mənə vermək lazımdır 2 halda 24 kimi bir şey. Mənada? Mən "ehtimalları," Bu gedin Bütün siyahısı var ki, "Gaga" bucket Bu Gaga sözlər, sonra ", körpə" gedin və mən ehtimalı görmək. Və nəhayət mən bu var "Sözləri" lüğət. Belə ki, burada "ehtimallar." Və sonra "Sözləri." Mən "sözləri", "Gaga," əgər nə gedir bu var ki , mənə 24 vermək niyyətində olduğunu söyləyən I Gaga lirika ərzində 24 söz var. Əhəmiyyət kəsb edir? Belə ki, burada "sözləri" dah-dah-dah bərabərdir. OK Mən nə gedirəm Mən gedirəm belə ki, lyrics hər üzərində təkrarlamaq strings hər ki, Mən siyahıda var. Mən o şeyi hesablamaq üçün gedirəm namizədlərin hər biri üçün. Əhəmiyyət kəsb edir? Mən loop üçün var. Belə ki, Python nə edə bilərsiniz xətt üçün " lyrics. "kimi eyni şey PHP şərhdə "hər". Bu PHP, əgər necə ola bilər saxla hər bir mahnı üçün "demək line. "anlamlı? Mən bu, xətlərin hər alıram halda, bu simli və növbəti string mən deyiləm nə xətlərinin hər biri üçün edəcəyimiz gedirəm, ilk siyahısına bu xətti split fəzalarında ayrılmış sözlər. Belə ki, Python haqqında sərin şey ki, yalnız Google kimi "necə bilər mən sözləri bir simli split? "Və bu bunu necə sizə gedir. Və bunu yol, yalnız "xətt var = Line.split () "və bu, əsasən var sizə bir siyahısını vermək niyyətindədir burada sözlərin hər. Əhəmiyyət kəsb edir? Belə ki, indi mən bilmək istəyirəm ki, ki ki, mahnı müğənni kimdir. Mən yalnız almaq lazımdır ki, nə üçün Serialın ilk element, sağ? Mən yalnız deyə bilərəm ki, "müğənni = Line (0) "anlamlı? Və sonra nə etmək lazımdır ilk deyil, bütün, mən yeniləmək üçün gedirəm neçə sözləri mən altında var "Gaga". belə Mən yalnız hesablamaq gedir necə çox söz I sağ, bu siyahıda var? Bu mən nə çox söz çünki lyrics və mən yalnız gedirəm Bu "Gaga" serialın əlavə edin. Ki, hissi edirmi? Sintaksis çox çox diqqət etməyin. Anlayışları haqqında daha düşünün. Bu ən mühüm hissəsi. OK. "Gaga" Əgər Belə ki, nə mən bunu edə bilər artıq siyahıda, belə ki, "müğənni əgər sözləri "o deməkdir ki, mən artıq Gaga sözləri var. Mən yalnız əlavə əlavə etmək istəyirəm ki words. Mən nə "sözləri (müğənni) edir + = Len (line) - 1 ". Və sonra mən yalnız edə bilərsiniz xəttin uzunluğu. Belə ki, necə bir çox elementləri I array var. Və nə üçün 1 minus yalnız, çünki serialın ilk element yalnız bir müğənni və bu lyrics deyil. Əhəmiyyət kəsb edir? OK. "Else," Mən istəyirəm ki, deməkdir əslində siyahısına daxil Gaga daxil edin. Mən yalnız sözlər (müğənni) "nə = Len (line) - 1, "sorry. Belə ki, iki arasında yeganə fərq xətləri bu bir, bu deyil ki, hələ mövcud, belə ki, mən yalnız başlatılıyor. Bu, bir mən, həqiqətən, əlavə alıram. OK. Belə ki, bu sözləri əlavə edilmişdir. İndi məhkumluğu əlavə etmək istəyirəm. Belə ki, necə Priors hesablamaq edirsiniz? The məhkumluğu hesablanır bilər neçə dəfə. Ki, müğənni bax belə neçə dəfə ki, siz müğənnilər bütün arasında sağ, var? , Gaga və Katy Perry üçün belə Bu halda, mən Gaga bax bir dəfə, Katy Perry dəfə. Gaga Belə ki, əsasən məhkumluğu və Katy Perry ki sağ, biri? Siz yalnız neçə dəfə Mən rəssam oldu. Belə ki, bu hesablamaq çox asandır. Mən oxşar bir şey kimi "kimi məhkumluğu müğənni, "Mən yalnız gedirəm onların məhkumluğu qutusuna 1 əlavə edin. "Belə ki," sonra "" məhkumluğu (oxumaq) "+ = 1 başqa Mən "Priors (müğənni) gedirəm = 1. "Anlamlı? Belə ki, mövcud deyil, mən yalnız qoymaq 1 kimi, əks halda mən yalnız 1 əlavə edin. OK, belə ki, indi mən nə üçün sol ki, də sözləri hər əlavə olunur ehtimallar. Mən saymaq neçə dəfə Mən sözləri hər görürük. Mən yalnız başqa nə var xətti loop üçün. Mən gedirəm ki, ilk şey müğənni artıq var yoxlamaq ehtimalları array. Müğənni deyil, əgər Mən yoxlanılması alıram bir ehtimalları array var, mən yalnız deyiləm onlar üçün bir başlamaq üçün gedən. Bu da bir sıra deyil, sorry, Bir lüğət var. Belə ki, müğənni ehtimalları gedir açıq lüğət olmaq, belə ki, mən yalnız bunun üçün bir lüğət başlatılıyor. OK? Və indi mən həqiqətən loop üçün nə edə bilər sözləri hər 'hesablamaq üçün ehtimallar. OK. Mən nə edə loop üçün edir. Mən yalnız təkrarlamaq gedirəm serialın üzərində. Mən Python bunu edə bilərsiniz ki, yol "intervalında i üçün" dir. 1 Mən ikinci başlamaq istəyirəm, çünki ilk biridir element çünki müğənni adı. Belə ki, biri qədər xəttin uzunluğu. Mən üçündür zaman bu, həqiqətən getmək Burada kimi 1-dən LEN üçün line minus 1. Belə ki, artıq bunu şey yoxdur çox olan Diziler üçün n minus 1 rahat. Əhəmiyyət kəsb edir? Belə ki, bu hər biri üçün, nə mən gedirəm nə, yalnız digər bir kimi, Mən yoxlamaq üçün gedirəm əgər bu sözü xətti mövqeyi artıq ehtimallar. Və sonra mən ehtimallar, burada dediyi kimi sözlər, kimi mən qoymaq "Ehtimalları (müğənni)". Belə ki, müğənni adı. Belə ki, artıq əgər "Probabilit (müğənni)", o deməkdir ki, mən bu 1 əlavə etmək istəyirəm ki, mən gedirəm "ehtimallarının (müğənni)", və bunu sözü "line (i)" adlanır. Mən 1 əlavə etmək üçün gedirəm və "başqa" Mən yalnız 1 onu başlamaq niyyətindədir. "Line (i)". Əhəmiyyət kəsb edir? Belə ki, mən Diziler bütün hesablanmışdır. Belə ki, indi mən üçün nə etmək lazımdır ki, bu yalnız ", Priors qayıtmaq ehtimallar və sözləri. "edək OK, hər hansı bir var görmek. Bu günə qədər hər şey işləyir görünür. Belə ki, mənada edir? Bir şəkildə? OK. Belə ki, indi bütün ehtimallar var. Belə ki, indi mən yazmayıblar tək şey yalnız şey var ki, bütün məhsul hesablayır Mən lirika almaq zaman ehtimallar. Belə ki, indi zəng etmək istəyirəm ki, deyək bu funksiya ") (təsnif" və şey funksiyası edir yalnız bir dəlildir. "Baby, I yanğın am" demək edək və bu Bu nə anlamaq üçün gedir Bu Gaga olduğunu ehtimal? Ehtimalı nədir Bu Katie ki? Yaxşı səslənir? Mən yalnız yaratmaq üçün gedirəm adlı yeni funksiya ") (təsnif" və bəzi almaq olacaq lyrics həmçinin. Və lirika başqa mən də Priors göndərmək üçün var, ehtimalları və sözləri. Mən lyrics, Priors göndərmək üçün gedirəm, ehtimallar, söz. Belə ki, bu lyrics, Priors edir, ehtimallar, söz. Belə ki, nə edir? Bu əsasən bütün vasitəsilə getmək üçün gedir mümkün namizədlər ki bir müğənni kimi var. Və həmin namizədlər var? Onlar məhkumluğu istəyirik, sağ? Mən oradakı bütün var. Mən bir lüğət var gedirəm bütün mümkün namizədlərin. Və sonra hər bir namizədin məhkumluğu, bu olacaq o deməkdir ki, Mən əgər Gaga, Katie ola daha çox olardı. Mən hesablanması başlamaq üçün gedirəm Bu ehtimal. Biz gördüyümüz kimi ehtimalı PowerPoint əvvəl dəfə edir Bu hər məhsul digər ehtimallar. Mən burada eyni edə bilərsiniz. Mən yalnız ehtimal edir edə bilərsiniz əvvəlcə yalnız əvvəlcədən. Namizədin belə məhkumluğu. Sağ? Və indi bütün üzərində təkrarlamaq lazımdır Mən lyrics var ki, sözləri ehtimalını əlavə edə OK, onların hər biri üçün? Belə ki, "lyrics sözü" Mən gedirəm söz olduğu halda nə etmək, "Ehtimalları (namizəd)" olan bir söz var o deməkdir ki, Namizəd lirika var - Gaga, misal üçün, "körpə" - nə mən gedirəm ki, ehtimal vurulur olacaq plus ehtimalları 1-by ki, söz üçün namizəd. Və "sözü" deyirlər. Bu sözlərin sayına bölünür Hesab edirəm ki, namizəd var ki. Mən ki, sözlərin ümumi sayı Mən baxıram ki, müğənni üçün. "Else". bu bir yeni söz deməkdir belə ki, məsələn kimi olarıq Lady Gaga üçün "yanğın". Mən yalnız 1 etmək istəyirəm "Sözü (namizəd)". Mən burada bu müddət qoymaq istəmirəm. Belə ki, əsasən olacaq çıxarmaq və bu yapışdıraraq. Amma bu hissəsi silmək üçün gedirəm. Belə ki, yalnız ki, artıq 1 olacaq. Yaxşı səslənir? İndi sonunda, mən yalnız gedirəm Bu namizədin adı və çap Siz var ki, onların lirika S olan. Əhəmiyyət kəsb edir? Mən, həqiqətən, hətta bunu bu lüğət lazımdır. Əhəmiyyət kəsb edir? Belə ki, bu, həqiqətən işləri nin görək. Mən bu run əgər Belə ki, bu iş deyil. Bir ikinci gözləyin. "Words (namizəd)", "sözləri (namizəd)", ki, serialın adı. OK Belə ki, bəzi səhv var deyir məhkumluğu namizəd üçün. Mənə yalnız bir az soyuq edək. OK. Nin cəhd edək. OK. Belə ki, Katy Perry bu var verir Bu bu dəfə 10 ehtimalı mənfi 7, və Gaga bu var dəfə mənfi 6 10. Belə ki, göstərir görürük ki, Gaga yüksək ehtimalı var. Belə ki, "Baby, I Fire edirəm" yəqin ki, bir Gaga mahnı. Əhəmiyyət kəsb edir? Belə ki, bu biz nə edir. Bu kodu online yerləşdiriləcək gedir, belə ki, uşaqlar onu kontrol edə bilərsiniz. Əgər istəyirsinizsə bəlkə üçün bəzi istifadə bir layihə və ya oxşar bir şey. OK. Bu yalnız göstərmək idi nə hesablama dilçilik kodu kimi görünür. Amma indi daha getmək bildirin yüksək səviyyədə stuff. OK. Belə ki, digər problemlər I söhbət - seqmentləşdirilməsi problem onların ilk. Belə ki, burada Yapon var. Və sonra görürük heç bir boşluq var. Belə ki, bu əsasən bu o deməkdir ki, edir kafedrasının üst, sağ? Siz Yapon danışmaq? Bu hüququ kafedrasının top var? TƏLƏBƏ: Bilmirəm nə Kanci üzərində var. LUCAS Freitas: Bu [Yapon danışan] var OK. Belə ki, əsasən üst sədri deməkdir. Siz boşluq qoymaq idi əgər burada olardı. Və sonra [var? Ueda-san. ?] Hansı əsasən cənab Ueda deməkdir. Və siz ki, "Ueda" görmək və siz bir kosmik və sonra "san." Belə ki, bax burada "Ue" özü kimi. Və burada bir xarakter var yanında. Belə ki, həmin dildə kimi deyil bir söz belə Siz məna simvol yalnız fəzalarda bir çox qoymaq. Simvol bir-birinə aid. Və onlar birlikdə ola bilər kimi iki, üç, bir. Beləliklə, siz həqiqətən bir növ yaratmaq üçün yol o boşluq qoyaraq. Bu odur ki, siz almaq zaman həmin Asiya dillərdə məlumatlar, hər şey unsegmented gəlir. Çünki Yapon yazır heç kim və ya Çin fəzalarında ilə yazır. Əgər Çin yazılı etdiyiniz zaman, Japanese yalnız hər şey yazmaq Boşluq. Bu hətta mənada etmir boşluq qoymaq üçün. Beləliklə siz bəzi məlumat almaq zaman Şərqi Asiya dil, siz istəyirsinizsə həqiqətən ki, bir şey ilk seqment var. Nümunə etdiyinə düşünün boşluq olmadan lyrics. Beləliklə, siz var ki, yalnız lyrics sağ, cümlələr olacaq? Dövrlər ayrılmış. Lakin sonra yalnız cümlə olan olacaq həqiqətən məlumat verilməsi kömək bu lyrics ilə olan. Sağ? Belə ki, ilk növbədə boşluq qoyur. Siz bunu necə edə bilərik? Beləliklə bir dil ideyası gəlir həqiqətən, bir şey olan model Computational üçün əhəmiyyətli dilçilik. Belə ki, bir dil model əsasən bir ehtimalları masa göstərir ehtimalı nə ilk növbədə dili söz olan? Belə bir söz necə tez-tez göstərilir. Və sonra da göstərən bir cümlə sözlər arasında. Bir qərib gəldi əgər Belə ki, əsas fikirdir, siz və bir cümlə açıqladı siz ehtimal ki, nədir Məsələn, "bu mənim bacımdır [? GTF"?] şəxs bildirib ki, cümlə idi? Belə ki, açıq-aydın bəzi cümlələr var daha çox ümumi. Məsələn, "səhər yaxşı" və ya "yaxşı gecə, "və ya" orada hey, "çox daha çoxdur ən cümlələr daha ümumi biz bir İngilis var. Belə ki, niyə o cümlələr var daha tez-tez? Siz, çünki ilk növbədə, bu daha tez-tez ki, söz. Siz demək Belə ki, məsələn, it böyük və it siz nəhəng adətən yəqin ki, it böyük eşitmək "böyük" daha daha tez-tez çünki "nəhəng". daha ingilis tez-tez Nın Belə ki, bir şeylər söz tezlik edir. Həqiqətən olan ikinci şey vacibdir yalnız sözləri sifariş. Belə ki, "pişik demək üçün ümumi . qutu içərisində "lakin siz bunu adətən görmək "The qutu içərisində pişik deyil." belə Bəzi əhəmiyyəti olduğunu görürük sözləri üçün. Siz yalnız deyə bilməz ki, bu iki cümlələr eyni ehtimalı var Onlar eyni sözləri yalnız çünki. Siz, həqiqətən, qayğı var üçün haqqında kimi yaxşı. Mənada? Beləliklə, biz nə etməliyəm? Belə ki, nə mən sizə almaq üçün cəhd edə bilər? Mən nə biz almaq üçün çalışıram n-qram modelləri zəng. Belə ki, n-qram modellər əsasən güman ki, hər bir söz üçün Bir cümlə var. Bu olan ehtimalı var ki, söz deyil, yalnız orada asılıdır dildə ki, söz tezliyi, həm də sözləri ki, onun ətraf edilir. Belə ki, məsələn, adətən gördükdə və ya siz etdiyiniz kimi bir şey yəqin ki, bir görmək olacaq sonra isim, sağ? Çünki bir sözönü zaman adətən sonra bir isim edir. Yoxsa transitive ki, bir verb varsa Siz adətən gedir bir isim söz var. Belə ki, bir isim var olacaq ətrafında haradasa. Belə ki, əsasən, bu nə edir ki, olan ehtimalı hesab sözləri bir-birinə yanında, zaman Siz hesablanması etdiyiniz bir cümlə ehtimalı. Və nə bir dil var model əsasən. Yalnız ehtimal var nə dedi xüsusi olan bir dildə cümlə? Belə ki, niyə ki, əsasən, faydalıdır? Və ilk növbədə nə bir n-qram model, sonra? Belə ki, n-qram model deməkdir ki, hər bir söz asılıdır növbəti N minus 1 words. Belə ki, əsasən, mən baxmaq əgər o deməkdir ki, məsələn, CS50 TF da zaman Mən ehtimalı hesablanması alıram cümlə, siz kimi olacaq "Bu sözü "və" olan ehtimalı olan dəfə ehtimalı "Bu Olan CS50 "dəfə ehtimalı "The CS50 TF." Belə ki, əsasən, mən saymaq bu uzanan bütün mümkün yolları. Və sonra adətən, bunu etdiyiniz zaman bir layihə kimi, ola N qoymaq aşağı dəyəri. Belə ki, adətən bigrams və ya trigrams var. Siz yalnız iki söz, bir count Belə ki iki sözlər, və ya üç söz qrupu, yalnız performans məsələləri. Və həmçinin, çünki bəlkə əgər kimi bir şey "The CS50 TF." Zaman var "TF," bu çox vacibdir ki, "CS50" sağ, bu yanında? Bu iki şeyi adətən bir-birinə yanında. Siz düşünüyorsanız "TF," yəqin ki, var üçün gedir nə bunun üçün TF'ing sinif. Də "" həqiqətən vacibdir CS50 TF üçün. Amma "The CS50 kimi bir şey varsa TF sinif getdi verdi onların tələbələr bir konfet. "" Candy "və" " sağ, həqiqətən heç bir əlaqəsi var? Onlar bir-birindən belə uzaq olduğunu bu, həqiqətən nə etməz sözləri var. Belə ki, bir Bigram və ya bir Trigram etməklə, bu yalnız məhdudlaşdıran edirik o deməkdir ki, özünüzü bəzi sözləri ətrafında olan. Mənada? Beləliklə, siz seqmentasiyasının etmək istədiyiniz zaman, əsasən, nə istəyirəm bax bütün mümkün yolları nə var ki, Siz seqment cümlə bilər. Siz nə ki, bu cür o cümlə hər ehtimalı dilində mövcud? Beləliklə, nə siz nə kimi, yaxşı, qoy edir Mənə burada bir boşluq qoymaq üçün çalışırıq. Belə ki, orada bir boşluq qoymaq və nə görmək ki, cümlə ehtimalı? Sonra OK, kimi, bəlkə var ki, yaxşı deyil. Mən bir boşluq var boşluq qoymaq və var, və siz hesablamaq ehtimal indi, və siz görmək daha yüksək ehtimal var. Belə ki, bu TANGO adlı alqoritm edir seqmentasiya alqoritm, olan həqiqətən, həqiqətən ki, bir şey bir layihə üçün sərin olan əsasən unsegmented mətn götürür Yapon və ya Çin və ya bəlkə ola bilər English boşluq olmayan və çalışır söz və bunu arasında boşluq ki, bir dil model istifadə edərək, yüksək nə görmək üçün çalışırıq Siz əldə edə bilərsiniz ehtimalı. OK. Belə ki, bu seqmentasiya edir. İndi syntax. Belə ki, sintaksis üçün istifadə olunur İndi çox şey. Image Search üçün, Siri üçün belə təbii olduqca çox hər hansı bir dil emal siz var. Yəni əhəmiyyətli nə var sintaksis haqqında hər şeyi? Belə ki, ümumiyyətlə cümlələr var biz seçicilərim dediyimiz. Hansı növ sözləri qrupları kimi cümlədə bir funksiyası var. Onlar, həqiqətən, ola bilməz ayrı-birindən. Deyirəm əgər Belə ki, məsələn, "Lauren sevir Milo. Lauren "" Mən bilirəm ki, "a təsis və sonra "sevir Milo "da başqa biridir. Siz "Lauren Milo kimi deyə bilmərəm, çünki eyni məna var "sevir. Var niyyətində deyil eyni məna. Və ya "Milo Lauren kimi deyə bilmərəm sevir. "Hər şey eyni malikdir bunu deməkdir. Haqqında daha iki mühüm şeyi syntax olan leksik növləri əsasən funksiyası ki, özləri tərəfindən sözləri var. Belə ki, bilmək lazımdır ki, "Lauren" və "Milo" isim var. "Sevgi" a verb edir. Və ikinci mühüm şey onlar phrasal növləri olduğunu. Belə ki, "Milo sevir" bilirik ki, əslində bir şifahi söz deyil. Mən deyəndə "Lauren," Mən bilirəm ki, Lauren bir şey edir. O nə edir? O Milo sevgi var. Belə ki, bütün şey. Amma onun komponentləri bir isim və fel. Lakin birlikdə, onlar bir verb söz etmək. Belə ki, biz, həqiqətən, nə edə bilər hesablama dilçilik? Belə ki, mən məsələn bir şey varsa "Allison dostlar." Görürəm, mən yalnız bir sintaktik ağac bilirəm ki ki, "Dostlar" bu bir isim söz bir "Allison" sonra isim və a "üzvü" olan prepositional söz bir proposition və "Allison" a noun edir. Mən nə edə bilər, mənim kompüter öyrətmək Mən bir isim söz var və zaman sonra prepositional söz. Və "bu halda," dost "Belə ki, Milo "Mən bu deməkdir ki, bilirik ki, NP2, ikinci, NP1 malikdir. Mən əlaqədar bir növ yarada, bunun üçün funksiyası bir növ. Mən bu quruluşu görmək zaman, hansı dostları "ilə dəqiq oyunları Allison, "Mən bilirəm ki, Allison dostlar var. Belə ki, dostlar bir şey var Allison var. Əhəmiyyət kəsb edir? Belə ki, bu əsasən nə Image Search yoxdur. Bu, sadəcə qaydaları yaradır çox şey üçün. Belə ki, "Allison dostlar", "dostlarım "" Cambridge yoldaşlarıma yaşayan Harvard getmək. "Bu qaydalar yaradır o şeyi bütün. İndi maşın tərcüməsi. Belə ki, maşın tərcüməsi də statistik bir şey. Və həqiqətən, siz cəlb almaq əgər hesablama dilçilik, bir çox Sizin stuff statistika olacaq. Mən nümunə edirdi Belə ki, Mən ki, ehtimallar bir çox hesablanması, və sonra bu almaq son ki, çox az sayda ehtimal ki, nə sizə cavab verir. Maşın tərcüməsi də istifadə edir bir statistik model. Və maşın düşünmək istəyirsinizsə Sadə mümkün translation yol, nə siz hesab edə bilər yalnız sağ, söz söz tərcümə? Sizin üçün bir dil öyrənmək etdiyiniz zaman ilk dəfə, ki, adətən nə var Siz, sağ? Əgər istəyirsinizsə bir cümlə tərcümə dil sizin dilində Siz, adətən ilk təlim etdiyiniz sözləri hər tərcümə fərdi, və sonra siz cəhd yer sözlər qoymaq üçün. , Mən bu tərcümə etmək istəyirdi əgər [Portuqaliya danışan] "ağ pişik qaçdı." deməkdir Mən onu tərcümə etmək istəyirdi İngilis Portuguese, nə edə bilər Mən yalnız, birinci növbədə, söz söz tərcümə. Belə ki, "o" "Bu," "gato", "pişik" dir "Branco", "ağ" və sonra "fugio" dir "Qaçdı." Beləliklə mən, burada bütün söz var lakin onlar üçün deyilik. "Pişik ağ qaçdı" kimi bu olan savadsız edir. Belə ki, sonra ikinci addım, ola bilər ideal tapmaq olacaq sözləri hər biri üçün mövqe. Mən həqiqətən istəyirəm ki, bilirik Əvəzinə "ağ pişik" "pişik ağ." Belə nə edə bilərsiniz ən sadəlövh üsul deyil yaratmaq olardı bütün mümkün permutations vəzifələrin sözlər,. Və sonra bir olan bax yüksək ehtimalı görə mənim dil model. Və sonra mən var ki, bir tapmaq zaman olan yüksək ehtimalı ki, yəqin ki, "ağ pişik, qaçdı" ki, mənim tərcümə var. Bu izah bir sadə yoludur necə maşın tərcüməsi çox alqoritmlər çalışır. Ki, hissi edirmi? Bu da həqiqətən maraqlı bir şey deyil uşaqlar bəlkə bir üçün tədqiq edə bilərsiniz ki, yekun layihə, yeah? TƏLƏBƏ: Yaxşı, siz bu olduğunu söylədi sadəlövh şəkildə, belə nə var qeyri-sadəlövh yol? LUCAS Freitas: The qeyri-sadəlövh yol? OK. Haqqında pis deyil ki, ilk şey Bu üsul mən yalnız tərcümə ki sözləri, söz söz. Amma bəzən sözləri var ki, birdən çox tərcümələr ola bilər. Mən hesab edirəm ki, cəhd gedirəm bir şey. Portuguese can Məsələn, "manga" ola "korlamaq" və ya "kol." ya Belə Siz söz tərcümə çalışdığınız zaman sözü ilə, bu verilməsi ola bilər heç bir əhəmiyyət kəsb edir ki, bir şey. Siz bütün baxmaq Beləliklə, siz həqiqətən istədiyiniz Bu mümkün tərcümə söz və bax, ilk növbədə, sifariş edir. Biz permutating söhbət şeylər? Bütün mümkün sifariş görmək və yüksək ilə birini seçin ehtimal? Siz həmçinin bütün mümkün seçə bilərsiniz hər tərcümə sonra söz və görmək - permutations ilə birlikdə - bir ən yüksək ehtimalı var. Plus, siz də baxmaq olar yalnız söz lakin ifadələr. belə ki, arasında əlaqələri analiz edə bilərsiniz sözləri və sonra almaq daha yaxşı translation. Həmçinin başqa bir şey, belə ki, bu dövr Mən, həqiqətən, tədqiqat edirəm Çin-ingilis maşın tərcüməsi, belə tərcümə Ingilis dilinə Çin. Və biz bir şey istifadə ilə yanaşı edir yalnız olan bir statistik model, görən ehtimallar görən bir cümlə bəzi mövqeyi, mən həqiqətən də bəzi sintaksis əlavə mənim Mən bu cür görmək əgər model, oh, deyərək Tikinti, bu mən istəyirəm nə I translate zaman dəyişdirmək üçün. Beləliklə, siz də bir növ əlavə edə bilərsiniz etmək üçün sintaksis element translation daha səmərəli və daha dəqiq. OK. Əgər istəyirsinizsə, belə ki, necə başlamaq olar Computational bir şey etmək dilçilik? Birincisi, bir layihə seçmək ki, dil daxildir. Belə ki, orada bir çox var. Siz edə bilərsiniz çox şey var. Və sonra bir model hesab edə bilər istifadə edə bilərsiniz ki,. Adətən düşüncə deməkdir fərziyyələr, mən idi, oh, kimi lyrics düşüncə kimi. Mən anlamaq istəyirəm əgər mən yaxşı kimi idi Bu yazmış həyata, mən yəqin ki, istəyirəm sözləri baxmaq şəxs istifadə və çox tez-tez söz istifadə edən görürük. Belə fərziyyələr etmək üçün cəhd edin və modelləri hesab üçün cəhd edin. Və sonra siz də online axtarış edə bilərsiniz siz ki, problemin cür, və təklif olacaq Siz modelləri ki, bəlkə yaxşı şey modelləşdirilmişdir. Və də həmişə mənə eməktub göndərin. me@lfreitas.com. Mən yalnız sizin suallara cavab verə bilərsiniz. Biz hətta mən cavab ola bilər bilər yolları haqqında təkliflər vermək Sizin layihə həyata. Siz ilə məşğul almaq əgər və mən demək hesablama dilçilik, gedir böyük olmalıdır. Siz orada görmək olacaq qədər potensial var. Və sənaye işə istəyir çünki siz belə pis. Mən sizə uşaqlar bu həzz ümid edirik. Uşaqlar hər hansı bir sualınız varsa, Bu sonra mənə xahiş edə bilər. Amma təşəkkür edirəm.