LUCAS Freitas: Hey. Croeso i bawb. Fy enw i yw Lucas Freitas. Rwy'n iau yn [Anghlywadwy] astudio gwyddoniaeth gyfrifiadurol gyda ffocws yn ieithyddiaeth gyfrifiadurol. Felly, fy uwchradd mewn iaith a theori ieithyddol. Rydw i'n gyffrous iawn i ddysgu chi guys ychydig am y maes. Mae'n ardal gyffrous iawn i astudio. Hefyd gyda llawer o botensial ar gyfer y dyfodol. Felly, rwy'n gyffrous iawn bod chi guys yn ystyried prosiectau yn ieithyddiaeth gyfrifiadurol. A byddaf yn fwy na pharod i roi cyngor unrhyw un ohonoch os ydych yn penderfynu ddilyn un o'r rheiny. Felly, yn gyntaf oll beth yw cyfrifiadurol ieithyddiaeth? Ieithyddiaeth Felly gyfrifiadurol yw'r groesffordd rhwng ieithyddiaeth a gwyddoniaeth gyfrifiadurol. Felly, beth yw ieithyddiaeth? Beth yw gwyddoniaeth gyfrifiadurol? Wel o ieithyddiaeth, yr hyn rydym yn cymryd yw ieithoedd. Felly, ieithyddiaeth mewn gwirionedd yr astudiaeth o iaith naturiol yn gyffredinol. Iaith mor naturiol - rydym yn siarad am iaith a ddefnyddir gennym mewn gwirionedd i cyfathrebu â'i gilydd. Felly, nid ydym yn siarad yn union am C neu Java. Rydym yn sôn mwy am Saesneg a Ieithoedd Tsieineaidd ac eraill yr ydym defnyddio i gyfathrebu â'i gilydd. Y peth heriol am hynny yw bod ar hyn o bryd rydym wedi bron i 7,000 ieithoedd yn y byd. Felly, mae cryn amrywiaeth uchel ieithoedd y gallwn astudio. Ac yna ydych yn meddwl ei fod yn ôl pob tebyg anodd iawn i'w wneud, er enghraifft, cyfieithu o un iaith i'r eraill, gan ystyried eich bod wedi bron i 7,000 ohonynt. Felly, os ydych yn meddwl am wneud cyfieithu o un iaith i'r llall i chi wedi bron i fwy na miliwn o gwahanol gyfuniadau y gallwch gael gan iaith i iaith. Felly, mae'n wir yn her i wneud ychydig o fath o system er enghraifft cyfieithu ar gyfer pob un iaith. Felly, ieithyddiaeth trin â chystrawen, semanteg, phragmatig. Nid oes angen i chi yn union guys i wybod beth y maent. Ond y peth diddorol iawn yw bod fel siaradwr brodorol, pan rydych yn dysgu iaith fel plentyn, chi mewn gwirionedd yn dysgu pob un o'r pethau hynny - semanteg gystrawen a phragmatig - eich pen eich hun. A does neb wedi i ddysgu i chi cystrawen ar gyfer i ddeall sut dedfrydau strwythuredig. Felly, mae'n hynod ddiddorol oherwydd mae'n rhywbeth sy'n dod iawn reddfol. A beth ydych chi'n eu cymryd o y wyddoniaeth gyfrifiadurol? Wel, y peth mwyaf pwysig ein bod yn gael mewn gwyddoniaeth cyfrifiadur yn gyntaf bawb, deallusrwydd artiffisial a dysgu peiriant. Felly, yr hyn yr ydym yn ceisio ei wneud ieithyddiaeth gyfrifiadurol yn addysgu eich cyfrifiadur sut i wneud rhywbeth gydag iaith. Felly, er enghraifft, mewn peiriant cyfieithu. Im 'yn ceisio dysgu fy modd y cyfrifiadur i wybod sut i bontio o un iaith i'r llall. Felly, yn y bôn yn hoffi dysgu cyfrifiadur dwy iaith. Os wyf yn gwneud prosesu iaith naturiol, sydd yn wir, er enghraifft o Facebook Graff Chwilio, byddwch yn dysgu eich cyfrifiadur sut i ddeall ymholiadau yn dda. Felly, os byddwch yn dweud "y lluniau o fy ffrindiau. "Nid yw Facebook yn trin y fel llinyn cyfan sydd dim ond bagad o eiriau. Mae'n mewn gwirionedd yn deall y berthynas rhwng "lluniau" ac "fy ffrindiau" ac yn deall bod "lluniau" yn cael eu eiddo o "fy ffrindiau." Felly, mae hynny'n rhan o, er enghraifft, prosesu iaith naturiol. Mae'n ceisio deall yr hyn y yw'r berthynas rhwng y geiriau mewn brawddeg. A'r cwestiwn mawr yw, a allwch addysgu cyfrifiadur sut i siarad iaith yn gyffredinol? Pa yn gwestiwn diddorol iawn i yn meddwl, fel pe efallai yn y dyfodol, ydych yn mynd i fod yn gallu siaradwch â'ch ffôn cell. Math o fel hyn yr ydym yn ei wneud gyda Siri ond rhywbeth mwy fel, gallwch mewn gwirionedd yn dweud beth bynnag yr ydych ei eisiau a dros y ffôn yn mynd i ddeall popeth. A gall gael cwestiynau dilynol ac yn parhau i siarad. Mae hynny'n rhywbeth gwirioneddol gyffrous, yn fy marn i. Felly, rhywbeth am ieithoedd naturiol. Rhywbeth gwirioneddol ddiddorol am iaith naturiol yw, ac mae hyn yn credyd i fy ieithyddiaeth athro, Maria Polinsky. Mae hi'n rhoi esiampl ac yr wyf yn meddwl mae'n wirioneddol ddiddorol. Oherwydd ein bod yn dysgu iaith o'r adeg pan rydym yn geni ac yna mae ein brodorol iaith math o tyfu ar ni. Ac yn y bôn byddwch yn dysgu iaith o fewnbwn fach iawn, dde? Rydych yn unig yn cael mewnbwn oddi wrth eich rhieni beth synau eich iaith hoffi a 'ch jyst dysgu. Felly, mae'n ddiddorol oherwydd os ydych yn edrych ar dedfrydau hynny, er enghraifft. Byddwch yn edrych, "Mary yn rhoi ar côt bob tro y mae hi'n gadael y tŷ. " Yn yr achos hwn, mae'n bosibl cael yr gair "hi" yn cyfeirio at Mary, dde? Gallwch ddweud "Mary yn rhoi ar côt bob tro Mary yn gadael y tŷ. "felly mae hynny'n iawn. Ond yna os ydych yn edrych ar y ddedfryd "Mae hi'n rhoi ar got bob tro Mary gadael y tŷ. "eich bod yn gwybod ei fod yn amhosibl dweud bod "hi" yn cyfeirio at Mary. Does dim ffordd o ddweud bod "Mary yn rhoi ar got bob tro Mary yn gadael y tŷ. "Felly mae'n ddiddorol oherwydd dyma'r math o greddf bod pob siaradwr brodorol wedi. A doedd neb yn dysgu bod hyn yn y ffordd y mae'r gystrawen yn gweithio. Ac y gallwch gael y "hi" cyfeirio at Mary yn yr achos cyntaf, ac mewn gwirionedd yn y eraill hefyd, ond nid yn yr un yma. Ond mae pawb fath o yn cael i'r un ateb. Mae pawb yn cytuno ar hynny. Felly mae'n wirioneddol ddiddorol sut er nad ydych yn gwybod holl reolau yn eich iaith chi fath o ddeall sut mae'r iaith yn gweithio. Felly, y peth diddorol am naturiol iaith yw nad oes rhaid i chi adnabod unrhyw gystrawen i wybod os dedfryd yn gramadegol neu anramadegol ar gyfer rhan fwyaf o achosion. Sy'n gwneud i chi yn meddwl bod efallai yr hyn digwydd yw bod trwy eich bywyd, byddwch yn jyst cadw mynd yn fwy a mwy brawddegau gwybod i chi. Ac yna eich bod yn cadw cofio pob un o'r brawddegau. Ac yna pan fydd rhywun yn dweud wrthych rhywbeth, byddwch yn clywed y ddedfryd ac ydych yn edrych ar eich geirfa o frawddegau a gweld os y ddedfryd yn yno. Ac os ei fod yno i chi dweud ei fod yn gramadegol. Os nad yw'n rydych yn ei ddweud ei fod yn anramadegol. Felly, yn yr achos hwnnw, byddech yn dweud, oh, felly mae gennych restr enfawr o bob brawddegau posibl. Ac yna pan fyddwch yn clywed brawddeg, eich bod yn gwybod os yw'n gramadegol neu nad yw'n seiliedig ar hynny. Y peth yw, os ydych yn edrych ar dedfryd, er enghraifft, "Mae'r coginio pum pennawd CS50 TFS y deillion octopws gan ddefnyddio mwg DAPA. "Mae'n yn bendant nid yw dedfryd eich bod wedi clywed o'r blaen. Ond ar yr un pryd, byddwch yn gwybod ei fod yn 'n bert lawer gramadegol, dde? Nid oes unrhyw gamgymeriadau gramadegol a gallwch ddweud bod mae'n ddedfryd posibl. Felly mae'n gwneud i ni feddwl sydd mewn gwirionedd yn y ffordd yr ydym yn dysgu iaith yn nid yn unig yn drwy gael cronfa ddata enfawr o bosibl geiriau neu frawddegau, ond yn fwy o deall y berthynas rhwng geiriau yn y brawddegau hynny. A yw hynny'n gwneud synnwyr? Felly, yna y cwestiwn yw, gall cyfrifiaduron yn dysgu ieithoedd? A allwn ni ddysgu iaith i gyfrifiaduron? Felly, gadewch i ni feddwl am y gwahaniaeth rhwng siaradwr brodorol o iaith a chyfrifiadur. Felly, beth sy'n digwydd i'r siaradwr? Wel, y siaradwr brodorol yn dysgu yn iaith rhag bod yn agored iddo. Fel arfer ei flynyddoedd plentyndod cynnar. Felly, yn y bôn, os oes gen ti babi, ac eich bod yn cadw siarad â, ac mae'n dim ond yn dysgu sut i siarad yr iaith, dde? Felly, byddwch yn rhoi yn y bôn mewnbwn i'r baban. Felly, yna gallwch ddadlau bod cyfrifiadur yn gallu gwneud yr un peth, dde? Alli jyst roi iaith fel mewnbwn i'r cyfrifiadur. Fel er enghraifft, criw o ffeiliau sydd â llyfrau yn Saesneg. Efallai dyna un ffordd y byddwch yn o bosib yn addysgu chyfrifiadur Saesneg, dde? Ac yn wir, os ydych yn meddwl am y peth, mae'n mynd â chi efallai ychydig diwrnod i ddarllen llyfr. Ar gyfer cyfrifiadur mae'n cymryd ail edrych ar yr holl eiriau mewn llyfr. Felly, gallwch chi feddwl a allai fod yn dim ond hyn ddadl o fewnbwn gan o'ch cwmpas, nad yw hynny'n ddigon i ddweud bod hynny'n rhywbeth y gall dim ond pobl yn ei wneud. Gallwch chi feddwl cyfrifiaduron Gall hefyd gael mewnbwn. Yr ail beth yw bod siaradwyr brodorol hefyd yn cael ymennydd sydd wedi gallu dysgu iaith. Ond os ydych yn meddwl am y peth, ymennydd yn beth solet. Pan fyddwch yn cael eu geni, mae eisoes wedi pennu - hyn yn eich ymennydd. Ac wrth i chi dyfu i fyny, 'ch jyst yn cael mwy mewnbwn o iaith ac efallai maetholion a phethau eraill. Ond 'n bert lawer eich ymennydd yn beth solet. Felly, gallwch ddweud, wel, efallai y gallwch adeiladu cyfrifiadur sydd â criw o swyddogaethau a dulliau mai dim ond dynwared gallu dysgu iaith. Felly, yn yr ystyr hwnnw, gallech ddweud, wel, yr wyf yn yn gallu cael cyfrifiadur sy'n cynnwys yr holl bethau y mae angen i mi ddysgu iaith. A'r peth olaf yw bod yn frodor siaradwr yn dysgu o brofi a methu. Felly, yn y bôn peth pwysig arall yn ddysgu iaith yw eich bod fath o ddysgu pethau trwy wneud cyffredinoli o'r hyn yr ydych yn ei glywed. Felly, gan eich bod yn tyfu i fyny byddwch yn dysgu bod rhai geiriau yn fwy fel enwau, rhai rhai eraill yn ansoddeiriau. A does dim rhaid i chi gael unrhyw gwybodaeth o ieithyddiaeth i ddeall hynny. Ond 'ch jyst yn gwybod bod rhai geiriau yn cael eu lleoli mewn rhyw ran o'r ddedfryd a rhai eraill mewn meysydd eraill rhannau o'r ddedfryd. A dyna pan fyddwch yn gwneud rhywbeth sy'n fel dedfryd nad yw'n gywir - efallai oherwydd dros cyffredinoli er enghraifft. Efallai pan fyddwch yn tyfu i fyny, byddwch yn sylwi bod y lluosog fel arfer a ffurfiwyd trwy roi S yn ddiwedd y gair. Ac yna yr ydych yn ceisio gwneud y lluosog "Ceirw" fel "deers" neu "dant" fel "Tooths." Felly, yna bydd eich rhieni neu rhywun yn cywiro chi ac yn dweud, na, mae'r lluosog o "ceirw" yw "ceirw," ac yn y lluosog o "dant" yw "dannedd." Ac yna byddwch yn dysgu pethau hynny. Felly, byddwch yn dysgu oddi wrth brofi a methu. Ond gallwch hefyd wneud hynny gyda chyfrifiadur. Gallwch gael rhywbeth a elwir yn dysgu atgyfnerthu. Pa yn y bôn fel rhoi cyfrifiadur gwobr pryd bynnag y mae'n ei wneud rhywbeth yn gywir. A'i roi i'r gwrthwyneb am wobr a phan fydd yn gwneud rhywbeth o'i le. Gallwch weld mewn gwirionedd, os byddwch yn mynd i Google Translate a ydych yn ceisio cyfieithu brawddeg, mae'n yn gofyn i chi am adborth. Felly, os ydych yn dweud, oh, mae gwell cyfieithu ar gyfer y frawddeg hon. Gallwch deipio i fyny ac yna os bydd llawer o pobl yn cadw dweud bod yn well cyfieithu, 'i jyst yn dysgu ei fod yn Dylai ddefnyddio'r cyfieithiad yn hytrach na yr un a oedd yn rhoi. Felly, mae'n gwestiwn athronyddol iawn i weld os oes cyfrifiaduron yn mynd i fod gallu siarad neu nad ydynt yn y dyfodol. Ond yr wyf yn gobeithio'n fawr y gallant yn seiliedig yn unig ar y dadleuon hynny. Ond dim ond yn fwy o athronyddol cwestiwn. Felly, er gyfrifiaduron yn dal i fethu siarad, beth yw'r pethau y gallwn ei wneud? Mae rhai pethau 'n sylweddol oera yn dosbarthiad data. Felly, er enghraifft, rydych guys yn gwybod bod gwasanaethau e-bost ei wneud, er enghraifft, hidlo sbam. Felly, pryd bynnag y byddwch yn derbyn sbam, mae'n ceisio hidlo i flwch arall. Felly, sut mae'n gwneud hynny? Nid yw'n debyg y cyfrifiadur yn unig yn gwybod cyfeiriadau e-bost hyn y yn anfon spam. Felly, mae'n fwy seiliedig ar gynnwys y neges, neu efallai y teitl, neu efallai rhywfaint o batrwm sydd gennych. Felly, yn y bôn, yr hyn y gallwch ei wneud yw cael llawer o ddata o negeseuon e-bost sy'n cael eu sbam, negeseuon e-bost nad ydynt yn sbam, a dysgu beth math o batrymau sydd gennych yn y rhai sy'n sbam. Ac mae hyn yn rhan o cyfrifiannu ieithyddiaeth. Mae'n cael ei alw dosbarthiad data. Ac rydym yn mewn gwirionedd yn mynd i weld enghraifft o hynny yn y sleidiau nesaf. Yr ail beth yw iaith naturiol prosesu sef y peth bod y Graff Chwilio yn ei wneud o roi chi ysgrifennu brawddeg. Ac mae'n ymddiried eich bod yn deall yr hyn y yw ystyr ac yn rhoi chi o ganlyniad i well. Mewn gwirionedd, os byddwch yn mynd i Google neu Bing a ydych yn chwilio rhywbeth fel Lady Uchder Gaga, a ydych yn mynd mewn gwirionedd i gael 5 '1 "yn hytrach na gwybodaeth oddi wrth ei oherwydd ei fod mewn gwirionedd yn deall yr hyn yr ydych yn sôn amdano. Felly, mae hynny'n rhan o'r naturiol prosesu iaith. Neu hefyd pan fyddwch yn defnyddio Siri, yn gyntaf gennych algorithm sy'n ceisio cyfieithu yr hyn yr ydych yn ei ddweud mewn geiriau, mewn testun. Ac yna mae'n ceisio gyfieithu hynny i ystyr. Felly dyna i gyd yn rhan o naturiol prosesu iaith. Yna byddwch yn cael cyfieithu peirianyddol - sydd mewn gwirionedd yn un o fy ffefrynnau - sydd ychydig yn cyfieithu o iaith i'r llall. Felly, gallwch chi feddwl pan fyddwch chi'n ei wneud cyfieithu peirianyddol, mae gennych posibiliadau diddiwedd o frawddegau. Felly, does dim ffordd o ychydig storio pob un cyfieithu. Felly, rhaid i chi ddod o hyd i diddorol algorithmau i allu cyfieithu pob un dedfryd mewn rhyw ffordd. Rydych yn guys gennych unrhyw gwestiynau hyd yn hyn? Nac oes? OK. Felly, beth ydym yn mynd i weld heddiw? Yn gyntaf oll, yr wyf i'n mynd i siarad am y broblem dosbarthiad. Felly, yr un yr wyf yn ddweud am sbam. Yr hyn yr wyf i'n mynd i wneud yw, geiriau a roddir i gân, gallwch geisio chyfrif i maes gyda tebygolrwydd uchel pwy yw'r gantores? Lets 'ddeud bod gennyf caneuon o Lady Gaga a Katy Perry, os byddaf yn rhoi i chi cân newydd, gallwch chyfrif i maes os mae'n Katy Perry neu Lady Gaga? Yr ail un, Im 'jyst yn mynd i siarad am y broblem segmentu. Felly, nid wyf yn gwybod os ydych yn guys gwybod, ond Tseiniaidd, Siapan, eraill Dwyrain Asia ieithoedd, ac ieithoedd eraill yn gyffredinol, nid oes rhaid bylchau rhwng geiriau. Ac yna os ydych yn meddwl am y ffordd y eich math cyfrifiadurol o gais i deall prosesu iaith naturiol, mae'n edrych ar y geiriau a ceisio deall y cysylltiadau rhyngddynt, dde? Ond yna os oes gennych Tseiniaidd, ac rydych sero leoedd, mae'n anodd iawn i cael gwybod beth yw'r berthynas rhwng eiriau, oherwydd nad oes ganddynt unrhyw geiriau ar y dechrau. Felly, rhaid i chi wneud rhywbeth o'r enw segmentu a dim ond yn golygu rhoi bylchau rhwng yr hyn y byddem yn galw y geiriau yn yr ieithoedd hynny. Yn gwneud synnwyr? Ac yna rydym yn mynd i siarad am gystrawen. Felly dim ond ychydig am naturiol prosesu iaith. Mae'n mynd i fod yr un trosolwg. Felly heddiw, yn y bôn yr hyn yr wyf am ei wneud yn rhoi guys i chi ychydig o tu mewn beth yw'r posibiliadau y gallwch ei wneud gyda cyfrifiadol ieithyddiaeth. Ac yna gallwch weld beth yw eich barn yn oer ymhlith pethau hynny. Ac efallai y gallwch chi feddwl am brosiect ac yn dod siarad â mi. Ac yr wyf yn gallu rhoi cyngor i chi ar sut i'w weithredu. Felly gystrawen yn mynd i fod ychydig yn am Chwilio Graff a pheiriant cyfieithu. Im 'jyst yn mynd i roi enghraifft o sut y gallech, er enghraifft, cyfieithu rhywbeth o Portiwgaleg i Saesneg. Swnio'n dda? Felly yn gyntaf, y broblem dosbarthiad. Byddaf yn dweud bod y rhan hon o'r seminar yn mynd i fod y mwyaf heriol un dim ond oherwydd mae mynd bod rhywfaint o godio. Ond mae'n mynd i fod yn Python. Yr wyf yn gwybod nad ydych guys yn gwybod Python, felly Im 'jyst yn mynd i egluro ar uchel lefel yr hyn yr wyf i'n ei wneud. Ac nid oes rhaid i chi wir gofal yn rhy llawer am y gystrawen oherwydd dyna rhywbeth y gallwch guys ddysgu. OK? Swnio'n dda. Felly beth yw'r broblem dosbarthu? Felly, rydych yn rhoi rhywfaint geiriau i cân, a ydych am i ddyfalu sy'n canu ei. A gall hyn fod ar gyfer unrhyw fath o broblemau eraill. Felly y gellir ei, er enghraifft, mae gennych ymgyrch arlywyddol a bod gennych lleferydd, ac yr ydych yn awyddus i ddod o hyd i allan os oedd, er enghraifft, Obama neu Romney Mitt. Neu gallwch gael criw o negeseuon e-bost a ydych am i chyfrif i maes os ydynt yn spam neu beidio. Felly, 'i' jyst dosbarthu rhai data sy'n seiliedig ar y geiriau bod gennych yno. Felly, er mwyn gwneud hynny, rhaid i chi wneud rhai rhagdybiaethau. Felly llawer am ieithyddiaeth gyfrifiadurol yn gwneud rhagdybiaethau, rhagdybiaethau fel arfer yn smart, fel bod gallwch gael canlyniadau da. Ceisio creu model ar ei gyfer. Ac yna roi cynnig arni a gweld os bydd yn gweithio, os yw'n rhoi manylder da chi. Ac os ydyw, yna rydych geisio ei gwella. Os nad yw, ydych chi fel, OK, efallai y gallaf Dylai wneud rhagdybiaeth gwahanol. Felly, y dybiaeth ein bod yn mynd i wneud yw bod artist fel arfer yn canu am sawl gwaith bwnc, ac efallai defnyddio geiriau sawl gwaith yn unig oherwydd eu bod yn arfer ag ef. Alli jyst meddwl am eich ffrind. Rwy'n siŵr eich bod guys i gyd ffrindiau sy'n dweud eu ymadrodd llofnod, yn llythrennol ar gyfer pob un frawddeg - fel rhyw air penodol neu ryw penodol ymadrodd y maent yn ei ddweud am pob un brawddeg. A'r hyn y gallwch ei ddweud yw os ydych yn gweld dedfryd sydd â llofnod ymadrodd, gallwch chi ddyfalu ei bod yn debygol eich ffrind yn y un ddweud ei fod, dde? Felly, byddwch yn gwneud y rhagdybiaeth honno ac yna dyna sut yr ydych yn creu model. Yr enghraifft yr wyf i'n mynd i roi ar sut Lady Gaga, er enghraifft, pobl dweud ei bod yn defnyddio "babi" ar gyfer ei holl ganeuon rhif un. Ac mewn gwirionedd mae hyn yn fideo sy'n dangos hi yn dweud y gair "baban" ar gyfer gwahanol ganeuon. [VIDEO Playback] - (CANU) Baby. Baby. Baby. Baby. Baby. Babe. Baby. Baby. Baby. Baby. [VIDEO END chwarae- LUCAS Freitas: Felly mae, yr wyf yn meddwl, 40 o ganeuon yma lle mae hi'n dweud bod y gair "babi." Felly, gallwch chi yn y bôn ddyfalu os ydych yn gweld cân sydd wedi y gair "babi," mae rhywfaint uchel tebygolrwydd ei fod yn Lady Gaga. Ond gadewch i ni geisio datblygu hyn bellach yn fwy ffurfiol. Felly mae'r rhain yn geiriau i ganeuon gan Lady Gaga a Katy Perry. Felly, rydych yn edrych ar Lady Gaga, byddwch yn gweld eu bod yn yn cael llawer o ddigwyddiadau o "baban," a llawer o achosion o "ffordd." Ac yna Katy Perry Mae gan lawer o achosion o "Y," llawer o achosion o "tân." Felly, yn y bôn yr hyn yr ydym am ei wneud yw, byddwch yn cael telynegol. Dewch i ddweud eich bod yn cael lyric ar gyfer gân sy'n "babi," dim ond "babi." Os 'ch jyst yn cael y gair "babi," ac mae hyn yn yw'r holl ddata sydd gennych o Lady Gaga a Katy Perry, a fyddai'n chi ddyfalu yw'r person sy'n canu y gân? Lady Gaga neu Katy Perry? Lady Gaga, dde? Am ei bod yn yr unig un sy'n dweud "Babi." Mae hyn yn swnio'n dwp, dde? OK, mae hyn yn hawdd iawn. Im 'jyst yn edrych ar y ddau caneuon a Wrth gwrs, mae hi yw'r unig un sydd wedi "Babi." Ond beth os oes gennych criw o eiriau? Os oes gennych telynegol gwirioneddol, rhywbeth fel, "babi, Fi jyst Aeth i weld [? CFT?] ddarlith, "neu rywbeth fel 'na, a yna rhaid i chi mewn gwirionedd i chyfrif i maes - yn seiliedig ar yr holl eiriau hynny - pwy yw'r artist sydd yn ôl pob tebyg canodd y gân? Felly, gadewch i ni geisio datblygu hwn ychydig ymhellach. OK, yn seiliedig felly dim ond ar y data yr ydym yn gael, mae'n ymddangos bod Gaga yn ôl pob tebyg y canwr. Ond sut y gallwn ysgrifennu hyn yn fwy ffurfiol? Ac mae mynd i fod ychydig yn ychydig o ystadegau. Felly, os ydych yn mynd ar goll, dim ond ceisiwch i ddeall y cysyniad. Nid oes ots os ydych yn deall yr hafaliadau yn iawn. Mae hyn i gyd yn mynd i fod ar-lein. Felly, yn y bôn yr hyn yr wyf i'n cyfrifo yw'r tebygolrwydd y gân hon yw drwy Lady Gaga o gofio bod - felly mae hyn yn golygu bar o gofio bod - Gwelais y gair "babi." A yw hynny'n gwneud synnwyr? Felly, Im 'yn ceisio i gyfrifo y tebygolrwydd. Felly mae theorem hwn a elwir yn Bayes theorem sy'n dweud bod y tebygolrwydd y bydd A B a roddir, yw'r tebygolrwydd o B rhoddir A, gwaith y tebygolrwydd o A, dros y tebygolrwydd B. Mae hwn yn hafaliad hir. Ond beth mae'n rhaid i chi ddeall o hynny yw bod hyn yn beth yr wyf am ei cyfrifo, dde? Felly, y tebygolrwydd bod y gân yw drwy Lady Gaga gan fy mod yn gweld y gair "Babi." Ac yn awr yr hyn yr wyf i'n mynd yn tebygolrwydd y gair "baban" a roddwyd bod gennyf Lady Gaga. A beth yw hynny yn y bôn? Beth mae hynny'n ei olygu yw, beth yw'r tebygolrwydd o weld y gair "babi" mewn geiriau Gaga? Os ydw i eisiau cyfrifo bod mewn iawn ffordd syml, dim ond y nifer o gwaith yr wyf yn gweld "babi" dros gyfanswm y nifer o eiriau yn geiriau Gaga, dde? Beth yw amledd fy mod yn gweld y gair hwnnw yng ngwaith Gaga yn? Yn gwneud synnwyr? Yr ail dymor yw tebygolrwydd o Gaga. Beth yw ystyr hynny? Yn y bôn yn golygu, beth yw'r tebygolrwydd o ddosbarthu rhai geiriau fel Gaga? A dyna yn fath o 'n annaearol, ond gadewch i ni feddwl am enghraifft. Felly, gadewch i ni ddweud bod y tebygolrwydd o cael "babi" mewn cân yr un fath ar gyfer Gaga a Britney Spears. Ond Britney Spears wedi ddwywaith mwy o ganeuon nag Lady Gaga. Felly, os bydd rhywun yn unig yn rhoi i chi ar hap geiriau o "baban," y peth cyntaf y byddwch edrych ar yw, beth yw'r tebygolrwydd o cael "babi" mewn cân Gaga, "babi" mewn cân Britney? Ac mae'n yr un peth. Felly, yr ail beth y byddwch yn ei weld yw, yn dda, beth yw'r tebygolrwydd o lyric hwn ei ben ei hun fod yn lyric Gaga, a beth yw'r tebygolrwydd o bod yn lyric Britney? Felly, gan fod Britney wedi cymaint mwy o lyrics na Gaga, a fyddech yn ôl pob tebyg dyweder, yn dda, mae hyn yn ôl pob tebyg yn delynegol Britney. Felly dyna pam yr ydym yn cael y alw'n yma. Tebygolrwydd o Gaga. Yn gwneud synnwyr? A yw'n? OK. Ac mae'r un olaf yn unig y tebygolrwydd o "baban" sy'n nad yw'n wirioneddol bwysig bod llawer. Ond y tebygolrwydd o gweld "babi" yn Saesneg. Rydym fel arfer yn poeni bod llawer am y cyfnod hwnnw. A yw hynny'n gwneud synnwyr? Felly, y tebygolrwydd o Gaga yn Gelwir y tebygolrwydd blaenorol o'r Gaga dosbarth. Oherwydd ei fod yn unig yn golygu, beth yw'r tebygolrwydd o gael dosbarth hwnnw - sy'n Gaga - dim ond yn gyffredinol, dim ond heb unrhyw amodau. Ac yna pan fyddaf yn cael tebygolrwydd o Gaga a roddir "babi," rydym yn galw ei yn ogystal â teary tebygolrwydd oherwydd ei fod yn y tebygolrwydd o gael Gaga rhoi rhywfaint o dystiolaeth. Felly, yr wyf i'n rhoi'r dystiolaeth y byddwch yn fy mod yn gweld y gair babi ac y gân yn gwneud synnwyr? OK. Felly, Os byddaf yn cyfrifo bod ar gyfer pob o ganeuon ar gyfer Lady Gaga, beth fyddai hynny fod - yn ôl pob golwg, ni allaf symud hyn. Bydd y tebygolrwydd o Gaga fod yn rhywbeth fel, 2 dros 24, amserau 1/2, dros 2 dros 53. Nid oes ots os ydych yn gwybod beth rhifau hyn yn dod o. Ond mae'r un nifer sydd yn mynd i fod yn fwy na 0, dde? Ac yna pan fyddaf yn gwneud Katy Perry, y tebygolrwydd o "baban" a roddwyd Katy yn eisoes yn 0, dde? Oherwydd nad oes "babi" yn Katy Perry. Felly, yna mae hyn yn dod yn 0, ac Gaga ennill, sy'n golygu bod Gaga yn yn ôl pob tebyg y canwr. A yw hynny'n gwneud synnwyr? OK. Felly, os ydw i eisiau gwneud mwy o swyddogol hwn, Gallaf ei wneud mewn gwirionedd model am eiriau lluosog. Felly, gadewch i ni ddweud bod gen i rywbeth fel, "babi, yr wyf yn ar dân, "neu rywbeth. Felly mae wedi geiriau lluosog. Ac yn yr achos hwn, gallwch weld bod "babi" mewn Gaga, ond nid yw'n yn Katy. Ac "tân" mewn Katy, ond nid yw'n yn Gaga, dde? Felly, mae'n mynd yn fwy anodd, dde? Oherwydd ei fod yn ymddangos bod chi bron cael tei rhwng y ddau. Felly, beth mae'n rhaid i chi ei wneud yw cymryd yn ganiataol annibyniaeth ymhlith y geiriau. Felly y bôn beth mae hynny'n ei olygu yw y Im 'jyst yn cyfrifo beth yw'r tebygolrwydd o weld "babi," beth yw y tebygolrwydd o weld "Yr wyf i," ac "Am", ac "ar," a "tân," i gyd ar wahân. Yna mi i'n lluosi pob un ohonynt. A dwi'n gweld beth yw'r tebygolrwydd o weld y ddedfryd gyfan. Yn gwneud synnwyr? Felly y bôn, os oes gennyf un gair, yr hyn yr wyf am ddod o hyd yw'r max Grŵp Diwygio Asesu, sy'n golygu, beth yw'r radd flaenaf sydd ar rhoi'r tebygolrwydd uchaf i mi? Felly beth yw'r dosbarth sy'n cael ei rhoi 'm' r tebygolrwydd uchaf ar gyfer tebygolrwydd o ddosbarth a roddir gair. Felly, yn yr achos hwn, Gaga a roddir "babi." Neu Katy rhoi "babi." Yn gwneud synnwyr? Ac yn union o Bayes, bod hafaliad yr wyf yn dangos, rydym yn creu ffracsiwn hwn. Yr unig beth yw eich bod yn gweld bod y tebygolrwydd y gair o ystyried y newidiadau dosbarth yn dibynnu ar y dosbarth, dde? Mae nifer y s "baban" fy mod wedi mewn Gaga yn wahanol i Katy. Y tebygolrwydd y dosbarth hefyd newidiadau oherwydd dim ond y rhif o ganeuon bob un ohonynt. Ond mae'r tebygolrwydd y gair ei hun yn mynd i fod yr un fath ar gyfer yr holl artistiaid, dde? Felly, y tebygolrwydd y gair yn yn unig, beth yw'r tebygolrwydd o gweld y gair yn y Saesneg? Felly, mae'n yr un fath ar gyfer pob un ohonynt. Felly, gan fod hyn yn gyson, gallwn yn unig gollwng hwn ac nid yn gofalu am y peth. Felly, bydd hyn yn mewn gwirionedd hafaliad rydym yn chwilio am. Ac os oes gennyf fwy nag un gair, rwy'n dal i fynd i gael y llaw tebygolrwydd yma. Yr unig beth yw fy mod i'n lluosi y tebygolrwydd o holl eiriau eraill. Felly, rwy'n lluosi pob un ohonynt. Yn gwneud synnwyr? Mae'n edrych yn rhyfedd ond yn y bôn yn golygu, cyfrifo cyn y dosbarth, a yna lluoswch gan y tebygolrwydd y bydd pob o'r geiriau fod yn y dosbarth. A ydych yn gwybod bod y tebygolrwydd o gair a roddir dosbarth yn mynd i fod y nifer o weithiau yr ydych yn gweld y gair yn y dosbarth hwnnw, wedi'i rannu gan y nifer o geiriau sydd gennych yn y dosbarth yn gyffredinol. Yn gwneud synnwyr? Mae'n pa mor "baban" Roedd 2 dros nifer y geiriau sy'n Cefais yn y geiriau. Felly, dim ond pa mor aml. Ond mae un peth. Cofiwch sut yr wyf yn dangos bod y tebygolrwydd o "baban" lyrics cael eu o Katy Perry yn 0 unig oherwydd Katy Nid oedd gan Perry "babi" o gwbl? Ond mae'n swnio braidd yn llym i ddim ond dweud yn syml na all geiriau fod o artist dim ond oherwydd nad oes ganddynt y gair hwnnw yn benodol ar unrhyw adeg. Felly gallech ddweud, yn dda, os ydych yn Nid oes rhaid gair hwn, yr wyf i'n mynd i rhoi tebygolrwydd is i chi, ond Im 'jyst ddim yn mynd i rhoi 0 ar unwaith. Oherwydd efallai ei fod yn rhywbeth fel, "Tân, tân, tân, tân," sydd yn gwbl Katy Perry. Ac yna "babi," a 'i jyst yn mynd i 0 yn syth gan nad oedd un "Babi." Felly, yn y bôn yr hyn yr ydym yn ei wneud yn rhywbeth enw Laplace lyfnu. Ac mae hyn yn unig yn golygu fy mod yn rhoi rhywfaint o debygolrwydd hyd yn oed i'r geiriau nad ydynt yn bodoli. Felly, yr hyn yr wyf yn ei wneud yw bod pan rwy'n gyfrifo hyn, rwyf bob amser yn ychwanegu 1 i y rhifiadur. Felly hyd yn oed os nad yw'r gair yn bodoli, yn yr achos hwn, os yw hyn yn 0, rwy'n dal i cyfrifo hyn fel 1 dros y cyfanswm nifer y geiriau. Fel arall, yr wyf yn cael faint o eiriau Gennyf ac yr wyf yn ychwanegu 1. Felly, yr wyf i'n cyfrif ar gyfer y ddau achos. Yn gwneud synnwyr? Felly nawr gadewch i ni wneud rhywfaint o godio. Rydw i'n mynd i gael i wneud yn eithaf cyflym, ond dim ond bwysig eich bod yn guys yn deall y cysyniadau. Felly, yr hyn yr ydym yn ceisio ei wneud yn union yn cael ei weithredu hyn beth yr wyf newydd ei ddweud - Rwyf am i chi i roi geiriau o Lady Gaga a Katy Perry. Ac mae'r rhaglen yn mynd i fod yn gallu dweud os yw'r rhain geiriau newydd yn dod o Gaga neu Katy Perry. Yn gwneud synnwyr? OK. Felly, yr wyf wedi y rhaglen hon Dw i'n mynd i alw classify.py. Felly mae hyn yn Python. Mae'n iaith raglennu newydd. Mae'n debyg iawn mewn rhai ffyrdd o C a PHP. Mae'n debyg oherwydd os ydych am dysgu Python ar ôl wybod C, mae'n ddim wir bod llawer o her dim ond oherwydd Python yn llawer haws na C, yn gyntaf oll. Ac mae llawer o bethau eisoes gweithredu ar eich rhan. Felly, pa mor fel PHP ganddo swyddogaethau sy'n didoli rhestr, neu atodi rhywbeth i amrywiaeth, neu blah, blah, blah. Python Mae pob un o'r rheiny hefyd. Felly, Im 'jyst yn mynd i egluro yn gyflym sut y gallem wneud y dosbarthiad broblem i yma. Felly, gadewch i ni yn dweud bod yn yr achos hwn, yr wyf wedi geiriau o Gaga a Katy Perry. Y ffordd yr wyf wedi lyrics hynny yw bod y gair cyntaf o'r geiriau yn enw'r artist, a mae'r gweddill yn y geiriau. Felly, gadewch i ni ddweud bod gennyf y rhestr hon yn y mae'r un cyntaf yn geiriau gan Gaga. Felly, dyma fi ar y trywydd iawn. Ac mae'r un nesaf yw Katy, ac mae ganddi hefyd y geiriau. Felly, mae hyn yw sut yr ydych yn datgan newidyn yn Python. Nid oes rhaid i chi roi y math data. Rydych yn unig ysgrifennwch "geiriau," fath o hoffi yn PHP. Yn gwneud synnwyr? Felly, beth yw'r pethau sy'n rhaid i mi cyfrifo i fod yn gallu cyfrifo tebygolrwydd? Rhaid i mi gyfrifo "Priors" o bob un o'r gwahanol dosbarthiadau sydd gennyf. Rhaid i mi gyfrifo "posteriors," neu 'n bert lawer yr tebygolrwydd o bob un o'r geiriau gwahanol sy'n Gallaf ei gael ar gyfer pob artist. Hynny o fewn Gaga, er enghraifft, yr wyf i'n mynd i gael rhestr o sawl gwaith yr wyf yn gweld pob un o'r geiriau. Yn gwneud synnwyr? Ac yn olaf, Im 'jyst yn mynd i gael rhestr o'r enw "yn lle'r geiriau" sy'n cael ei dim ond yn mynd i gael faint o eiriau yr wyf yn gael ar gyfer pob artist. Felly, ar gyfer Gaga, er enghraifft, pan fyddaf yn edrych at y geiriau, yr oeddwn wedi, yr wyf yn meddwl, 24 geiriau i gyd. Felly, y rhestr hon yn unig yn mynd i gael Gaga 24, a Katy rhif arall. Yn gwneud synnwyr? OK. Felly nawr, mewn gwirionedd, gadewch i ni mynd i'r codio. Felly, yn Python, gallwch mewn gwirionedd yn dychwelyd criw o wahanol pethau o swyddogaeth. Felly, yr wyf i'n mynd i greu swyddogaeth hon a elwir yn "amodol" sy'n mynd i ddychwelyd yr holl bethau hynny, y "Priors," y "tebygolrwydd," ac yn y "Eiriau." Felly "amodol," ac mae'n mynd i gael eu galw i mewn i "geiriau." Felly, yn awr yr wyf am i chi mewn gwirionedd ysgrifennu swyddogaeth hon. Felly, y ffordd y gallaf ysgrifennu hyn swyddogaeth Fi jyst diffinio hyn gweithredu gyda "def." Felly mi wnes "def amodol, "ac mae'n cymryd "Geiriau." A beth mae hyn yn mynd i wneud yw, yn gyntaf oll, yr wyf wedi fy Priors yr wyf am i gyfrifo. Felly, y ffordd y gallaf wneud hyn yw creu geiriadur yn Python, a oedd yn 'n bert lawer yr un peth â hash bwrdd, neu ei fod yn debyg i ailadroddol amrywiaeth yn PHP. Mae hyn yn sut yr wyf yn datgan geiriadur. Ac yn y bôn beth mae hyn yn ei olygu yw y Priors o Gaga yw 0.5, er enghraifft, os 50% o'r geiriau yn dod o Gaga, 50% yn dod o Katy. Yn gwneud synnwyr? Felly, rhaid i mi chyfrif i maes sut i gyfrifo'r Priors. Y rhai nesaf y mae'n rhaid i mi ei wneud, hefyd, yw'r tebygolrwydd a'r geiriau. Felly, y tebygolrwydd o Gaga yw'r rhestr o'r holl tebygolrwydd yr wyf gael ar gyfer pob un o'r geiriau ar gyfer Gaga. Felly, os byddaf yn mynd i tebygolrwydd o Gaga "Babi," er enghraifft, bydd yn rhoi i mi rhywbeth fel 2 dros 24 yn yr achos hwnnw. Yn gwneud synnwyr? Felly, yr wyf yn mynd i "tebygolrwydd," mynd i'r Bwced "Gaga" sydd â rhestr o'r holl y geiriau Gaga, yna yr wyf yn mynd i "babi," ac yr wyf yn gweld y tebygolrwydd. Ac yn olaf yr wyf wedi hyn "Geiriau" geiriadur. Felly yma, "tebygolrwydd." Ac yna "Eiriau." Felly, os wyf yn gwneud "geiriau," "Gaga," beth sy'n mynd i ddigwydd yw ei fod yn mynd i roi i mi 24, gan ddweud fy mod 24 Mae gair o fewn geiriau o Gaga. Yn gwneud synnwyr? Felly yma, "geiriau" yn hafal dah-dah-dah. OK Felly, yr hyn yr wyf i'n mynd i wneud yw fy mod i'n mynd i ailadrodd dros bob un o'r geiriau, felly pob un o'r llinynnau sy'n Yr wyf yn ei gael yn y rhestr. Ac yr wyf i'n mynd i gyfrifo pethau hynny gyfer pob un o'r ymgeiswyr. Yn gwneud synnwyr? Felly, rhaid i mi wneud i ddolen. Felly, yn Python hyn y gallaf ei wneud yw "ar gyfer llinell mewn geiriau. "Mae'r un peth â "Ar gyfer pob" datganiad yn PHP. Cofiwch sut os oedd PHP gallwn dweud "ar gyfer pob geiriau fel lein. "Yn gwneud synnwyr? Felly rwy'n cymryd pob un o'r llinellau, yn yr achos, llinyn hwn a'r nesaf llinyn felly ar gyfer pob un o'r llinellau hyn yr wyf i'n mynd i'w wneud yn gyntaf, dw i'n mynd i rhannu y llinell hon yn rhestr o geiriau wedi eu gwahanu gan fylchau. Felly, y peth cŵl am Python yw bod fe allech chi jyst Google fel "sut y gallaf rhannu llinyn mewn geiriau? "Ac mae'n mynd i ddweud wrthych sut i wneud hynny. A'r ffordd i wneud hynny, dim ond "llinell = Line.split () "ac yn y bôn mynd i roi rhestr gyda chi pob un o'r geiriau yma. Yn gwneud synnwyr? Felly nawr fy mod yn gwneud yr wyf am ei wybod pwy yw'r canwr y gân. Ac i wneud hynny dim ond rhaid i mi gael y elfen gyntaf y rhesi, dde? Felly, gallaf ddweud fy mod "canwr = Linell (0) "Yn gwneud synnwyr? Ac yna yr hyn sydd angen i mi ei wneud yw, yn gyntaf cyfan, dw i'n mynd i ddiweddaru faint o geiriau gennyf dan "Gaga." felly Im 'jyst mynd i gyfrifo faint o eiriau yr wyf yn gael yn y rhestr hon, dde? Oherwydd bod hyn yn faint o eiriau gen i yn y geiriau a Im 'jyst yn mynd i ychwanegu at y "Gaga" arae. A yw hynny'n gwneud synnwyr? Nid ydynt yn canolbwyntio gormod ar y gystrawen. Feddwl mwy am y cysyniadau. Bod yn y rhan fwyaf pwysig. OK. Felly, yr hyn y gallaf ei wneud yw os "Gaga" yn eisoes yn y rhestr, felly "os canwr mewn geiriau "sy'n golygu fy mod i eisoes gael geiriau gan Gaga. Fi jyst eisiau ychwanegu i'r ychwanegol geiriau i hynny. Felly, yr hyn yr wyf yn ei wneud yw "eiriau (canwr) + = Len (llinell) - 1 ". Ac yna y gallaf wneud y hyd y llinell. Felly sut llawer o elfennau yr wyf yn gael yn y rhesi. Ac mae'n rhaid i mi ei wneud minws 1 dim ond oherwydd elfen gyntaf y rhesi yn unig Nid yw yn gantores ac mae'r rheini'n geiriau. Yn gwneud synnwyr? OK. "Else," mae'n golygu fy mod am i mewn gwirionedd mewnosoder Gaga ar y rhestr. Felly, Fi jyst yn ei wneud "eiriau (canwr) = Len (llinell) - 1, "mae'n ddrwg gennyf. Felly, yr unig wahaniaeth rhwng y ddau llinellau yw bod hyn yn un, nid yw'n bodoli eto, felly Im 'jyst ymgychwyn ei. Mae hyn yn un mewn gwirionedd rwy'n adio. OK. Felly, roedd hyn yn ychwanegu at eiriau. Nawr rwyf am i ychwanegu at y Priors. Felly, sut ydw i'n gyfrifo Priors? Gall y Priors yn cael ei gyfrifo gan faint o weithiau. Felly, faint o weithiau yr ydych yn gweld y canwr ymhlith pob un o'r cantorion yr ydych gael, dde? Felly, ar gyfer Gaga a Katy Perry, yn yr achos hwn, yr wyf yn gweld Gaga unwaith, Katy Perry unwaith. Felly, yn y bôn y Priors ar gyfer Gaga ac ar gyfer Katy Perry byddai yn unig fod yn un, dde? Rydych yn unig faint o weithiau Rwy'n gweld yr artist. Felly, mae hyn yn hawdd iawn i'w gyfrifo. Gallaf dim ond rhywbeth tebyg fel fel "os canwr mewn Priors, "Im 'jyst yn mynd i ychwanegu 1 at eu blwch Priors. Felly, "Priors (canu)" + = 1 "ac yna" arall " Rydw i'n mynd i wneud "Priors (canwr) = 1. "Yn gwneud synnwyr? Felly, os nad yw'n bodoli Fi jyst rhoi fel 1, fel arall, Fi jyst ychwanegu 1. Iawn, felly erbyn hyn i gyd sydd gennyf ar ôl i wneud hefyd yn cael ei ychwanegu pob un o'r geiriau i'r tebygolrwydd. Felly, rhaid i mi gyfrif faint o weithiau Rwy'n gweld pob un o'r geiriau. Felly, yr wyf yn rhaid gwneud rhywbeth arall ar gyfer dolen yn y llinell. Felly peth cyntaf i mi i'n mynd i wneud yw gwirio os oes gan y canwr yn tebygolrwydd amrywiaeth. Felly, yr wyf i'n gwirio os nad yw'r canwr yn cael amrywiaeth tebygolrwydd, Im 'jyst mynd i ymgychwyn un ar eu cyfer. Nid yw'n hyd yn oed amrywiaeth, mae'n ddrwg gennyf, mae'n geiriadur. Felly, y tebygolrwydd o canwr yn mynd i fod yn geiriadur agored, felly rwy'n dim ond ymgychwyn geiriadur ar ei gyfer. OK? Ac yn awr y gallaf ei wneud mewn gwirionedd yn ar gyfer dolen i gyfrifo pob un o'r geiriau ' tebygolrwydd. OK. Felly, beth y gallaf ei wneud yw i ddolen. Felly, Im 'jyst yn mynd i ailadrodd dros y rhesi. Felly, y ffordd y gallaf ei wneud hynny yn Python yw "ar gyfer i mewn amrediad." O 1 oherwydd yr wyf am ddechrau yn yr ail elfen oherwydd yr un cyntaf yw'r enw'r canwr. Felly, o un hyd at y hyd y llinell. A phan wyf yn amrywio mewn gwirionedd yn mynd o fel yma o 1 i Len o'r minws llinell 1. Felly, mae eisoes yn gwneud y peth o wneud n minws 1 ar gyfer araeau sydd yn iawn cyfleus. Yn gwneud synnwyr? Felly, ar gyfer pob un o'r rhain, yr hyn yr wyf i'n mynd i wneud yw, yn union fel yn y llall, Rydw i'n mynd i wirio a yw'r gair yn y safle yn y llinell eisoes yn tebygolrwydd. Ac yna fel y dywedais yma, tebygolrwydd eiriau, fel yn yr wyf yn rhoi "Tebygolrwyddau (cantores)". Felly, enw'r canwr. Felly, os mae eisoes yn "Probabilit (cantores)", mae'n golygu fy mod yn am ychwanegu 1 ato, felly dw i'n mynd i wneud "tebygolrwyddau (cantores)", a Gelwir gair yn "llinell (i)". Rydw i'n mynd i ychwanegu 1 a "arall" Im 'jyst yn mynd i ymgychwyn i 1. "Llinell (i)". Yn gwneud synnwyr? Felly, yr wyf yn cyfrifo pob un o'r arrays. Felly, erbyn hyn i gyd sydd rhaid i mi ei wneud ar gyfer yr un yma yn unig "yn dychwelyd Priors, tebygolrwydd a geiriau. "Gadewch i ni weld os oes unrhyw, OK. Mae'n ymddangos popeth yn gweithio hyd yn hyn. Felly, mae hynny'n gwneud synnwyr? Mewn rhyw ffordd? OK. Felly, yn awr yr wyf wedi holl tebygolrwydd. Felly, yn awr yr unig beth yr wyf wedi gadael yn unig i gael y peth y cyfrifo y cynnyrch yr holl tebygolrwydd pan fyddaf yn cael y geiriau. Felly, gadewch i ni ddweud yr wyf am ei alw nawr swyddogaeth hon "dosbarthu ()" a'r peth swyddogaeth honno yn cymryd yn unig yw dadl. Lets 'ddeud "Baby, yr wyf ar dân" ac mae'n mynd i chyfrif i maes beth yw'r tebygolrwydd bod hyn yn Gaga? Beth yw'r tebygolrwydd bod hyn yn Katie? Swnio'n dda? Felly, Im 'jyst yn mynd i gael i greu swyddogaeth newydd o'r enw "dosbarthu ()" a mae'n mynd i gymryd peth geiriau hefyd. Ac ar wahân i'r geiriau yr wyf hefyd yn rhaid anfon y Priors, y tebygolrwydd a'r geiriau. Felly, yr wyf i'n mynd i anfon geiriau, Priors, tebygolrwydd, geiriau. Felly, mae hyn yn cymryd geiriau, Priors, tebygolrwydd, geiriau. Felly, beth mae'n ei wneud? Yn y bôn yn mynd i fynd drwy'r holl yr ymgeiswyr posibl y byddwch yn gael fel cantores. A lle yn ymgeiswyr hynny? Maen nhw'n Yn y Priors, dde? Felly, yr wyf yn cael yr holl o'r rhai yno. Felly, yr wyf i'n mynd i gael geiriadur o'r holl ymgeiswyr posibl. Ac yna ar gyfer pob ymgeisydd yn y Priors, felly mae'n golygu ei bod yn mynd i fod Gaga, Katie os ydw i wedi mwy byddai'n fwy. Rydw i'n mynd i ddechrau cyfrifo tebygolrwydd hwn. Mae'r tebygolrwydd fel y gwelsom yn y PowerPoint yw'r weithiau cyn y gynnyrch o bob un o'r tebygolrwydd eraill. Felly, yr wyf yn gallu gwneud yr un peth yma. Gallaf ei wneud tebygolrwydd yn ddechrau dim ond y ymlaen llaw. Felly Priors yr ymgeisydd. Iawn? Ac yn awr mae'n rhaid i mi ailadrodd dros yr holl geiriau sydd gennyf yn y geiriau i fod yn gallu ychwanegu y tebygolrwydd gyfer pob un ohonynt, OK? Felly, "am air mewn geiriau" yr hyn yr wyf i'n mynd ei wneud yw, os yw'r gair yn "Tebygolrwyddau (ymgeisydd)", a yn golygu ei fod yn air fod y ymgeisydd yn eu geiriau - er enghraifft, "baban" ar gyfer Gaga - yr hyn yr wyf i'n mynd i wneud yw bod y tebygolrwydd yn mynd i gael ei lluosi erbyn 1 yn ogystal â'r tebygolrwydd o yr ymgeisydd ar gyfer y gair hwnnw. Ac fe'i gelwir yn "gair". Mae hyn wedi'i rannu gan nifer y geiriau sydd gennyf ar gyfer yr ymgeisydd hwnnw. Cyfanswm y nifer o eiriau sydd gennyf ar gyfer y canwr a Im 'yn edrych ar. "Else." mae'n golygu ei fod yn gair newydd felly byddai'n fod yn debyg, er enghraifft "Tân" ar gyfer Lady Gaga. Felly, Fi jyst eisiau ei wneud 1 dros "Gair (ymgeisydd)". Felly, nid wyf am roi hyn y tymor yma. Felly, mae'n mynd i fod yn y bôn copïo a gludo hyn. Ond dw i'n mynd i ddileu'r rhan hon. Felly, 'i' jyst yn mynd i fod yn 1 dros hynny. Swnio'n dda? Ac yn awr ar y diwedd, Im 'jyst yn mynd i argraffu enw'r ymgeisydd a'r y tebygolrwydd sydd gennych o cael y S ar eu geiriau. Yn gwneud synnwyr? Ac yr wyf yn ei wneud mewn gwirionedd hyd yn oed yn angen geiriadur hwn. Yn gwneud synnwyr? Felly, gadewch i ni weld os yw hyn yn gweithio mewn gwirionedd. Felly os wyf yn rhedeg y, nid oedd yn gweithio. Arhoswch un eiliad. "Geiriau (ymgeisydd)", "eiriau (ymgeisydd)", dyna enw'r y rhesi. OK Felly, mae'n dweud mae rhywfaint o bug ar gyfer yr ymgeisydd mewn Priors. Gadewch i mi ymlacio ychydig. OK. Gadewch i ni geisio. OK. Felly, mae'n rhoi Katy Perry wedi hyn tebygolrwydd o hyn weithiau 10 i'r llai blwch 7, ac Gaga wedi hyn gwaith 10 i'r minws 6. Felly byddwch yn gweld ei fod yn dangos bod Gaga Mae tebygolrwydd uwch. Felly "Baby, dwi ar Tân" yn cael ei yn ôl pob tebyg cân Gaga. Yn gwneud synnwyr? Felly mae hyn yn hyn a wnaethom. Mae'r côd hwn yn mynd i gael ei bostio ar-lein, er mwyn i chi guys edrych arni. Efallai defnyddio rhai ohono ar gyfer os ydych am wneud prosiect neu rywbeth tebyg. OK. Roedd hyn yn unig i ddangos pa cyfrifiadol cod ieithyddiaeth yn edrych fel. Ond yn awr gadewch i ni fynd i fwy stwff lefel uchel. OK. Felly, y problemau eraill yr wyf yn yn siarad am - y broblem segmentu yw'r cyntaf ohonynt. Felly, rydych wedi yma Siapan. Ac yna byddwch yn gweld bod nad oes yna fylchau. Felly, mae hyn yn y bôn yn golygu ei bod yn ben y cadeirydd, dde? Ydych yn siarad Siapan? Mae'n ben y cadeirydd, dde? MYFYRIWR: Nid wyf yn gwybod beth y kanji dros oes. LUCAS Freitas: Mae'n [SIARAD SIAPANEAIDD] OK. Felly, yn y bôn yn golygu cadeirydd top. Felly, os oedd gennych i roi lle byddai yma. Ac yna mae gennych [? Ueda-san. ?] Pa yn y bôn yn golygu Mr Ueda. A ydych yn gweld bod "Ueda" a bod gennych gofod ac yna "san." Felly, byddwch yn gweld bod yma i chi "Ue" yn debyg ei ben ei hun. Ac yma mae ganddo gymeriad drws nesaf iddo. Felly, nid yw'n debyg yn yr ieithoedd hynny cymeriadau sy'n golygu gair ei er mwyn i chi dim ond yn rhoi llawer o leoedd. Cymeriadau yn perthyn i'w gilydd. A gallant fod gyda'i gilydd fel dau, tri, un. Felly, rhaid i chi mewn gwirionedd yn i greu rhyw fath o ffordd o roi lleoedd hynny. Ac mae y peth hyn yw bod pryd bynnag y byddwch yn cael data o ieithoedd Asiaidd hynny, popeth yn dod unsegmented. Oherwydd nad oes neb sy'n ysgrifennu Siapan neu Tseiniaidd yn ysgrifennu gyda bylchau. Pryd bynnag y byddwch yn ysgrifennu Tseiniaidd, Siapan 'ch jyst ysgrifennu popeth heb unrhyw fylchau. Nid yw hyd yn oed yn gwneud synnwyr i roi lleoedd. Felly, yna pan fyddwch yn cael data o, mae rhai Iaith ddwyrain Asia, os ydych am i mewn gwirionedd yn gwneud rhywbeth gyda'r rhaid i chi segment gyntaf. Meddyliwch am wneud yr enghraifft o y geiriau heb fylchau. Felly, yr unig lyrics sydd gennych Bydd brawddegau, dde? Gwahannu gan atalnodau. Ond yna gorfod dim ond y ddedfryd yn ddim wir yn helpu ar roi gwybodaeth pwy geiriau hynny gan. Iawn? Felly, dylech rhoi lleoedd yn gyntaf. Felly sut allwch chi wneud hynny? Felly, yna daw y syniad o iaith model sy'n rhywbeth mewn gwirionedd bwysig ar gyfer cyfrifiannu ieithyddiaeth. Felly, model iaith yn y bôn yn tabl o tebygolrwydd sy'n dangos yn gyntaf oll beth yw'r tebygolrwydd o gael y gair mewn iaith? Felly, yn dangos pa mor aml y gair yn. Ac yna hefyd yn dangos y berthynas rhwng y geiriau mewn brawddeg. Felly, y prif syniad yw, os bydd dieithryn yn dod i chi a dweud brawddeg i chi, beth yw'r tebygolrwydd y, ar gyfer enghraifft, "mae hyn yn fy chwaer [? GTF"?] oedd y ddedfryd fod y person wedi'i ddweud? Felly, yn amlwg mae rhai brawddegau yn yn fwy cyffredin nag eraill. Er enghraifft, "Bore da," neu "da nos, "neu" hey yno, "yn llawer mwy cyffredin na'r rhan fwyaf brawddegau bod gennym Saesneg. Felly pam mae dedfrydau hynny amlach? Yn gyntaf oll, mae'n oherwydd eich bod wedi geiriau sy'n fwy aml. Felly, er enghraifft, os ydych yn ei ddweud, mae'r ci mawr, ac mae'r ci yn enfawr, byddwch yn Fel arfer, yn ôl pob tebyg yn clywed y ci yn fawr yn fwy aml oherwydd "mawr" yn fwy aml yn Saesneg na "enfawr." Felly, un o'r pethau yw'r amlder geiriau. Yr ail beth sydd mewn gwirionedd bwysig yw dim ond y trefn y geiriau. Felly, mae'n gyffredin i ddweud "mae'r gath yn y tu mewn i'r bocs. "ond nad ydych yn gwneud fel arfer gweld yn "Y blwch tu mewn yn y gath." felly byddwch yn gweld bod rhywfaint o bwysigrwydd yn y drefn y geiriau. Nid ydych yn gallu dweud bod dau y rhai brawddegau yn cael yr un tebygolrwydd dim ond oherwydd eu bod yn cael yr un geiriau. Mewn gwirionedd yn rhaid i chi ofalu am orchymyn yn ogystal. Yn gwneud synnwyr? Felly, beth ydym yn ei wneud? Felly, beth y gallwn geisio cael chi? Im 'yn ceisio i fynd â chi yr hyn yr ydym ffoniwch y modelau n-gram. Felly modelau n-gram bôn cymryd yn ganiataol , ar gyfer pob gair gennych mewn brawddeg. Mae'n y tebygolrwydd o gael y gair mae yn dibynnu nid yn unig ar y amlder y gair yn yr iaith, ond hefyd ar y geiriau sy'n yn ei amgylchynu. Felly, er enghraifft, fel arfer pan fyddwch yn gweld rhywbeth fel ar neu ar chi yn na thebyg yn mynd i weld enw ar ei ôl, dde? Oherwydd pan fyddwch yn cael arddodiad Fel arfer, mae'n cymryd enw ar ei ôl. Neu os oes gennych berf sy'n transitive Fel arfer, rydych yn mynd i cael ymadrodd enwol. Felly, mae'n mynd i gael enw rhywle o'i amgylch. Felly, yn y bôn, yr hyn y mae'n ei wneud yw ei fod yn yn ystyried y tebygolrwydd o gael geiriau nesaf at ei gilydd, pan eich bod yn cyfrifo'r tebygolrwydd o ddedfryd. A dyna beth iaith model yn y bôn. Dim ond dweud beth yw'r tebygolrwydd o gael benodol dedfryd mewn iaith? Felly pam yw bod yn ddefnyddiol, yn y bôn? Ac yn gyntaf oll yr hyn sy'n model n-gram, yna? Felly model n-gram yn golygu bod pob gair yn dibynnu ar y minws N nesaf 1 o eiriau. Felly, yn y bôn, mae'n golygu bod os wyf yn edrych, er enghraifft, yn y TF CS50 pan Dw i'n cyfrifo tebygolrwydd o y ddedfryd, byddwch yn fel "y tebygolrwydd o gael y gair "the" gwaith y tebygolrwydd o gael "y CS50 "gwaith y tebygolrwydd o gael "Mae'r TF CS50." Felly, yn y bôn, yr wyf yn cyfrif pob ffyrdd posibl o ymestyn ei. Ac yna fel arfer pan fyddwch yn gwneud hyn, fel mewn prosiect, eich rhoi E yn gwerth isel. Felly, fel arfer yn cael bigrams neu drigramau. Felly, yr ydych newydd gyfrif dau air, a grŵp o ddau air, neu dri gair, yn unig ar gyfer materion perfformiad. A hefyd oherwydd efallai os oes gennych rhywbeth fel "Mae'r TF CS50." Pan fyddwch yn wedi "TF," mae'n bwysig iawn bod "CS50" yn nesaf iddo, dde? Fel arfer y rhai ddau beth yn nesaf at ei gilydd. Os ydych yn meddwl o "TF," mae'n debyg mynd i gael yr hyn dosbarth mae'n TF'ing amdano. Hefyd "y" yn bwysig iawn ar gyfer TF CS50. Ond os oes gennych rhywbeth fel "The CS50 Aeth TF i ddosbarth a rhoi eu fyfyrwyr rhywfaint o Candy. "" Candy "ac" y " Nid oes perthynas gwirionedd, dde? Eu bod nhw mor bell oddi wrth ei gilydd y nid yw'n wir yn ots beth geiriau sydd gennych. Felly, drwy wneud bigram neu trigramau, mae'n yn unig yn golygu eich bod yn cyfyngu ar eich hun i rai geiriau sydd o gwmpas. Yn gwneud synnwyr? Felly, pan fyddwch am wneud segmentiad, yn y bôn, yr hyn rydych am ei wneud yw gweld beth yw'r holl ffyrdd posibl y gallwch segment y ddedfryd. O'r fath yn eich bod yn gweld beth yw'r tebygolrwydd o bob un o'r brawddegau hynny sydd eisoes yn bodoli yn yr iaith? Felly, yr hyn yr ydych yn ei wneud yn debyg, yn dda, gadewch mi geisio rhoi lle yma. Felly, byddwch yn rhoi lle yno a byddwch yn gweld beth yw tebygolrwydd y ddedfryd? Yna ydych yn hoffi, OK, efallai nad oedd yn bod yn dda. Felly, yr wyf yn rhoi lle yno a gofod yno, ac yr ydych yn cyfrifo'r tebygolrwydd yn awr, a byddwch yn gweld bod mae'n tebygolrwydd uwch. Felly mae hwn yn algorithm a elwir yn TANGO algorithm segmentu, sy'n mewn gwirionedd yn rhywbeth a fyddai'n fod yn wirioneddol oeri ar gyfer prosiect, a oedd yn yn y bôn yn destun unsegmented sy'n gall fod yn Siapan neu Tsieineaidd neu efallai Saesneg heb fylchau ac yn ceisio rhoi bylchau rhwng geiriau ac mae'n ei wneud hynny drwy ddefnyddio model iaith a yn ceisio gweld beth yw'r uchaf tebygolrwydd y gallwch ei gael. OK. Felly, mae hyn yn segmentu. Nawr cystrawen. Felly, cystrawen yn cael ei ddefnyddio ar gyfer cymaint o bethau ar hyn o bryd. Felly, ar gyfer Graff Chwilio, am Siri ar gyfer 'n bert lawer unrhyw fath o naturiol prosesu iaith sydd gennych. Felly beth yw'r bwysig pethau am gystrawen? Felly, brawddegau yn gyffredinol wedi yr hyn yr ydym yn galw etholwyr. Pa rai math o fel grwpiau o eiriau sydd â swyddogaeth yn y frawddeg. Ac ni allant mewn gwirionedd fod yn ar wahân i'w gilydd. Felly, os wyf yn dweud, er enghraifft, "Lauren wrth ei bodd Milo. "Rwy'n gwybod bod" Lauren "yn cyfansoddol ac yna "gariadon Milo "yn un arall hefyd. Oherwydd ni allwch ddweud fel "Lauren Milo wrth ei bodd "i gael yr un ystyr. Dyw hi ddim yn mynd i gael yr un ystyr. Neu ni allaf ddweud fel "Milo Lauren caru. "Nid yw popeth yr un sy'n golygu gwneud hynny. Felly mae'r ddau beth yn fwy bwysig am cystrawen yw'r mathau geirfa sy'n yn y bôn y swyddogaeth yr ydych yn gael am eiriau eu hunain. Felly, rhaid i chi wybod bod "Lauren" a "Milo" yn enwau. "Love" yn ferf. A'r ail beth pwysig yw eu bod yn fathau phrasal. Felly, rydych yn gwybod bod "wrth ei bodd yn Milo" mewn gwirionedd yn ymadrodd llafar. Felly, pan fyddaf yn dweud "Lauren," Rwy'n gwybod bod Lauren yn gwneud rhywbeth. Beth mae hi'n ei wneud? Mae hi wedi cariadus Milo. Felly mae'n holl beth. Ond mae ei gydrannau yn yn enw a berf. Ond gyda'i gilydd, maent yn gwneud ymadrodd ferf. Felly, gall yr hyn yr ydym yn ei wneud mewn gwirionedd gyda ieithyddiaeth gyfrifiadurol? Felly, os oes gen i rywbeth, er enghraifft "Cyfeillion o Allison." Rwy'n gweld os Fi jyst oedd coeden cystrawennol byddwn yn gwybod bod "Cyfeillion" yn ymadrodd enw ei fod yn enw ac yna "o Allison" yn ymadrodd arddodiadol lle "o" yn cynnig a "Allison" yn enw. Beth allwn i ei wneud yw dysgu fy nghyfrifiadur pan gennyf ymadrodd enwol un a yna ymadrodd arddodiadol. Felly, yn yr achos hwn, "cyfeillion" ac yna "o Milo "Rwy'n gwybod fod hyn yn golygu NP2, yr ail un, yn berchen ar NP1. Felly, yr wyf yn gallu creu rhyw fath o berthynas, rhyw fath o swyddogaeth ar ei gyfer. Felly, pryd bynnag y byddaf yn gweld y strwythur hwn, a oedd yn yn cyd-fynd yn union â "ffrindiau o Allison, "Rwy'n gwybod bod Allison berchen ar y ffrindiau. Felly, y cyfeillion yn rhywbeth y bod Allison wedi. Yn gwneud synnwyr? Felly, mae hyn yn y bôn yr hyn Graff Chwilio wneud. 'I jyst yn creu rheolau am lawer o bethau. Felly "ffrindiau o Allison," "fy ffrindiau sy'n byw yng Nghaergrawnt, "" fy ffrindiau sy'n mynd i Harvard. "Mae'n creu rheolau ar gyfer pob un o'r pethau hynny. Nawr cyfieithu peirianyddol. Felly, cyfieithu peirianyddol hefyd yn rhywbeth ystadegol. Ac mewn gwirionedd os ydych yn cymryd rhan mewn ieithyddiaeth cyfrifiannu, mae llawer o dy stwff yn mynd i fod ystadegau. Felly, gan fy mod yn gwneud y enghraifft gyda llawer o tebygolrwydd fy mod yn cyfrifo, ac yna byddwch yn cael i hyn nifer fach iawn dyna y rownd derfynol tebygolrwydd, a dyna beth yn rhoi'r ateb i chi. Cyfieithu peirianyddol hefyd yn defnyddio model ystadegol. Ac os ydych chi am feddwl o beiriant cyfieithu yn y symlaf posibl ffordd, beth y gallwch feddwl yn unig cyfieithu gair am air, dde? Pan fyddwch chi'n dysgu iaith am y tro cyntaf, dyna beth fel arfer yn ydych yn ei wneud, dde? Os ydych am i chi cyfieithu brawddeg yn eich iaith i'r iaith eich bod yn dysgu, fel arfer yn gyntaf, yr ydych yn cyfieithu pob un o'r geiriau yn unigol, ac yna i chi roi cynnig i roi'r geiriau ar waith. Felly, os oeddwn i eisiau i drosi hyn, [SIARAD Portiwgaleg] sy'n golygu "yn rhedeg y gath gwyn i ffwrdd." Os oeddwn i eisiau ei gyfieithu o Portiwgaleg i Saesneg, yr hyn yr wyf Gallai wneud yw, yn gyntaf, Fi jyst cyfieithu gair am air. Felly, "o" yw "y," "Gato," "cath" "Branco," "gwyn," ac yna "fugio" yn "Rhedeg i ffwrdd." Felly, yna yr wyf yn cael yr holl eiriau yma, ond nid ydynt yn mewn trefn. Mae fel "y gwyn gath yn rhedeg i ffwrdd" sydd yn anramadegol. Felly, yna gallaf gael ail gam, a oedd yn yn mynd i gael ei dod o hyd i'r delfrydol sefyllfa ar gyfer pob un o'r geiriau. Felly, yr wyf yn gwybod fy mod mewn gwirionedd am gael "Cath wen" yn hytrach na "gwyn cath." Felly, hyn y gallaf ei wneud yw, y dull mwyaf naïf fyddai creu holl gyfnewidiadau posibl eiriau, o swyddi. Ac yna gweld pa un sydd â'r tebygolrwydd uchaf yn ôl i fy model iaith. Ac yna pan fyddaf yn dod o hyd i'r un sydd wedi y tebygolrwydd uchaf, ac mae hynny'n yn ôl pob tebyg "y gath gwyn rhedeg i ffwrdd," dyna fy cyfieithu. Ac mae hyn yn ffordd syml o egluro sut y mae llawer o gyfieithu peirianyddol algorithmau gweithio. A yw hynny'n gwneud synnwyr? Mae hyn hefyd yn rhywbeth cyffrous y gallwch guys efallai archwilio ar gyfer prosiect terfynol, ie? MYFYRIWR: Wel, yr ydych yn dweud ei fod yn y ffordd naïf, felly beth y ffordd heb fod yn naïf? LUCAS Freitas: Y ffordd heb fod yn naïf? OK. Felly, y peth cyntaf sydd yn wael am dull hwn yw yr wyf newydd ei gyfieithu geiriau, air am air. Ond weithiau mae gennych geiriau sy'n yn gallu cael cyfieithiadau lluosog. Rydw i'n mynd i geisio meddwl o rywbeth. Er enghraifft, "Manga" mewn tun Portiwgaleg naill ai yn "mangl" neu "lawes." Felly, pan fyddwch yn ceisio i gyfieithu gair drwy air, gallai fod yn rhoi i chi rhywbeth sy'n gwneud unrhyw synnwyr. Felly rydych chi ei eisiau mewn gwirionedd i chi edrych ar yr holl y cyfieithiadau posibl y geiriau a gweld, yn gyntaf oll, beth yw'r drefn. Rydym yn siarad am permutating y pethau? I weld yr holl archebion posibl a dewis yr un gyda'r uchaf tebygolrwydd? Gallwch hefyd ddewis yr holl posibl cyfieithiadau ar gyfer pob gair ac yna gweld - ynghyd â'r gyfnewidiadau - pa un sydd â'r tebygolrwydd uchaf. Byd Gwaith, gallwch hefyd edrych nid yn dim ond geiriau ond ymadroddion. fel y gallwch ddadansoddi y berthynas rhwng y geiriau ac wedyn yn cael cyfieithu yn well. Hefyd yn rhywbeth arall, felly semester hwn Im 'mewn gwirionedd yn gwneud ymchwil mewn Tsieineaidd-Saesneg cyfieithu peirianyddol, felly cyfieithu o Tseiniaidd i'r Saesneg. A rhywbeth yr ydym yn ei wneud yw, ar wahân i ddefnyddio model ystadegol, sydd ychydig yn gweld y tebygolrwydd o weld rhywfaint o sefyllfa mewn brawddeg, rwy'n mewn gwirionedd hefyd yn ychwanegu rhywfaint o gystrawen i fy model, gan ddywedyd, oh, os byddaf yn gweld y math hwn adeiladu, mae hyn yn yr hyn rwyf am i'w newid i pan fyddaf yn cyfieithu. Felly, gallwch hefyd yn ychwanegu rhyw fath o elfen o gystrawen i wneud y cyfieithu yn fwy effeithlon ac yn fwy manwl gywir. OK. Felly, sut y gallwch ddechrau arni, os ydych am i wneud rhywbeth yn cyfrifiannu ieithyddiaeth? Yn gyntaf, byddwch yn dewis prosiect sy'n cynnwys ieithoedd. Felly, mae cymaint o allan yna. Mae cymaint o bethau y gallwch eu gwneud. Ac yna yn gallu meddwl o fodel y gallwch eu defnyddio. Fel arfer mae hynny'n golygu meddwl am rhagdybiaethau, fel fel, oh, pan oeddwn yn fel meddwl am y geiriau. Roeddwn yn hoffi, wel, os ydw i eisiau i ffigwr cynnal a ysgrifennodd hwn, yr wyf yn ôl pob tebyg am i edrych ar y geiriau y person a ddefnyddiwyd a gweld sy'n defnyddio y gair hwnnw yn aml iawn. Felly ceisiwch wneud rhagdybiaethau a ceisiwch feddwl o fodelau. Ac yna gallwch hefyd chwilio ar-lein ar gyfer y math o broblem sydd gennych, ac mae'n mynd i awgrymu i chi modelau sy'n efallai fodelu y peth yn dda. A hefyd gallwch chi bob amser e-bost ataf. me@lfreitas.com. A gall Fi jyst ateb eich cwestiynau. Gallwn hyd yn oed y gallai cyfarfod felly gallaf rhoi awgrymiadau ar ffyrdd o weithredu eich prosiect. Ac yr wyf yn golygu os ydych yn cymryd rhan gyda ieithyddiaeth gyfrifiadurol, mae'n mynd i fod yn wych. Rydych yn mynd i weld yno yn gymaint o botensial. Ac mae'r diwydiant yn awyddus i logi chi mor wael oherwydd hynny. Felly, yr wyf yn gobeithio y byddwch yn guys mwynhau hyn. Os ydych yn guys gennych unrhyw gwestiynau, gallwch ofyn i mi ar ôl hyn. Ond diolch i chi.