1 00:00:00,000 --> 00:00:08,364 2 00:00:08,364 --> 00:00:08,870 >> LUCAS Freitas: Hey. 3 00:00:08,870 --> 00:00:09,980 Croeso i bawb. 4 00:00:09,980 --> 00:00:11,216 Fy enw i yw Lucas Freitas. 5 00:00:11,216 --> 00:00:15,220 Rwy'n iau yn [Anghlywadwy] astudio gwyddoniaeth gyfrifiadurol gyda ffocws yn 6 00:00:15,220 --> 00:00:16,410 ieithyddiaeth gyfrifiadurol. 7 00:00:16,410 --> 00:00:19,310 Felly, fy uwchradd mewn iaith a theori ieithyddol. 8 00:00:19,310 --> 00:00:21,870 Rydw i'n gyffrous iawn i ddysgu chi guys ychydig am y maes. 9 00:00:21,870 --> 00:00:24,300 Mae'n ardal gyffrous iawn i astudio. 10 00:00:24,300 --> 00:00:27,260 Hefyd gyda llawer o botensial ar gyfer y dyfodol. 11 00:00:27,260 --> 00:00:30,160 Felly, rwy'n gyffrous iawn bod chi guys yn ystyried prosiectau yn 12 00:00:30,160 --> 00:00:31,160 ieithyddiaeth gyfrifiadurol. 13 00:00:31,160 --> 00:00:35,460 A byddaf yn fwy na pharod i roi cyngor unrhyw un ohonoch os ydych yn penderfynu 14 00:00:35,460 --> 00:00:37,090 ddilyn un o'r rheiny. 15 00:00:37,090 --> 00:00:40,010 >> Felly, yn gyntaf oll beth yw cyfrifiadurol ieithyddiaeth? 16 00:00:40,010 --> 00:00:44,630 Ieithyddiaeth Felly gyfrifiadurol yw'r groesffordd rhwng ieithyddiaeth a 17 00:00:44,630 --> 00:00:46,390 gwyddoniaeth gyfrifiadurol. 18 00:00:46,390 --> 00:00:47,415 Felly, beth yw ieithyddiaeth? 19 00:00:47,415 --> 00:00:48,490 Beth yw gwyddoniaeth gyfrifiadurol? 20 00:00:48,490 --> 00:00:51,580 Wel o ieithyddiaeth, yr hyn rydym yn cymryd yw ieithoedd. 21 00:00:51,580 --> 00:00:54,960 Felly, ieithyddiaeth mewn gwirionedd yr astudiaeth o iaith naturiol yn gyffredinol. 22 00:00:54,960 --> 00:00:58,330 Iaith mor naturiol - rydym yn siarad am iaith a ddefnyddir gennym mewn gwirionedd i 23 00:00:58,330 --> 00:00:59,770 cyfathrebu â'i gilydd. 24 00:00:59,770 --> 00:01:02,200 Felly, nid ydym yn siarad yn union am C neu Java. 25 00:01:02,200 --> 00:01:05,900 Rydym yn sôn mwy am Saesneg a Ieithoedd Tsieineaidd ac eraill yr ydym 26 00:01:05,900 --> 00:01:07,780 defnyddio i gyfathrebu â'i gilydd. 27 00:01:07,780 --> 00:01:12,470 >> Y peth heriol am hynny yw bod ar hyn o bryd rydym wedi bron i 7,000 28 00:01:12,470 --> 00:01:14,260 ieithoedd yn y byd. 29 00:01:14,260 --> 00:01:19,520 Felly, mae cryn amrywiaeth uchel ieithoedd y gallwn astudio. 30 00:01:19,520 --> 00:01:22,600 Ac yna ydych yn meddwl ei fod yn ôl pob tebyg anodd iawn i'w wneud, er enghraifft, 31 00:01:22,600 --> 00:01:26,960 cyfieithu o un iaith i'r eraill, gan ystyried eich bod wedi 32 00:01:26,960 --> 00:01:28,240 bron i 7,000 ohonynt. 33 00:01:28,240 --> 00:01:31,450 Felly, os ydych yn meddwl am wneud cyfieithu o un iaith i'r llall i chi 34 00:01:31,450 --> 00:01:35,840 wedi bron i fwy na miliwn o gwahanol gyfuniadau y gallwch 35 00:01:35,840 --> 00:01:37,330 gael gan iaith i iaith. 36 00:01:37,330 --> 00:01:40,820 Felly, mae'n wir yn her i wneud ychydig o fath o system er enghraifft cyfieithu ar gyfer 37 00:01:40,820 --> 00:01:43,540 pob un iaith. 38 00:01:43,540 --> 00:01:47,120 >> Felly, ieithyddiaeth trin â chystrawen, semanteg, phragmatig. 39 00:01:47,120 --> 00:01:49,550 Nid oes angen i chi yn union guys i wybod beth y maent. 40 00:01:49,550 --> 00:01:55,090 Ond y peth diddorol iawn yw bod fel siaradwr brodorol, pan rydych yn dysgu 41 00:01:55,090 --> 00:01:59,010 iaith fel plentyn, chi mewn gwirionedd yn dysgu pob un o'r pethau hynny - semanteg gystrawen 42 00:01:59,010 --> 00:02:00,500 a phragmatig - 43 00:02:00,500 --> 00:02:01,430 eich pen eich hun. 44 00:02:01,430 --> 00:02:04,820 A does neb wedi i ddysgu i chi cystrawen ar gyfer i ddeall sut dedfrydau 45 00:02:04,820 --> 00:02:05,290 strwythuredig. 46 00:02:05,290 --> 00:02:07,980 Felly, mae'n hynod ddiddorol oherwydd mae'n rhywbeth sy'n dod iawn 47 00:02:07,980 --> 00:02:10,389 reddfol. 48 00:02:10,389 --> 00:02:13,190 >> A beth ydych chi'n eu cymryd o y wyddoniaeth gyfrifiadurol? 49 00:02:13,190 --> 00:02:16,700 Wel, y peth mwyaf pwysig ein bod yn gael mewn gwyddoniaeth cyfrifiadur yn gyntaf 50 00:02:16,700 --> 00:02:19,340 bawb, deallusrwydd artiffisial a dysgu peiriant. 51 00:02:19,340 --> 00:02:22,610 Felly, yr hyn yr ydym yn ceisio ei wneud ieithyddiaeth gyfrifiadurol yn addysgu 52 00:02:22,610 --> 00:02:26,990 eich cyfrifiadur sut i wneud rhywbeth gydag iaith. 53 00:02:26,990 --> 00:02:28,630 >> Felly, er enghraifft, mewn peiriant cyfieithu. 54 00:02:28,630 --> 00:02:32,490 Im 'yn ceisio dysgu fy modd y cyfrifiadur i wybod sut i bontio o un 55 00:02:32,490 --> 00:02:33,310 iaith i'r llall. 56 00:02:33,310 --> 00:02:35,790 Felly, yn y bôn yn hoffi dysgu cyfrifiadur dwy iaith. 57 00:02:35,790 --> 00:02:38,870 Os wyf yn gwneud prosesu iaith naturiol, sydd yn wir, er enghraifft o 58 00:02:38,870 --> 00:02:41,810 Facebook Graff Chwilio, byddwch yn dysgu eich cyfrifiadur sut i ddeall 59 00:02:41,810 --> 00:02:42,730 ymholiadau yn dda. 60 00:02:42,730 --> 00:02:48,130 >> Felly, os byddwch yn dweud "y lluniau o fy ffrindiau. "Nid yw Facebook yn trin y 61 00:02:48,130 --> 00:02:51,130 fel llinyn cyfan sydd dim ond bagad o eiriau. 62 00:02:51,130 --> 00:02:56,020 Mae'n mewn gwirionedd yn deall y berthynas rhwng "lluniau" ac "fy ffrindiau" ac 63 00:02:56,020 --> 00:02:59,620 yn deall bod "lluniau" yn cael eu eiddo o "fy ffrindiau." 64 00:02:59,620 --> 00:03:02,350 >> Felly, mae hynny'n rhan o, er enghraifft, prosesu iaith naturiol. 65 00:03:02,350 --> 00:03:04,790 Mae'n ceisio deall yr hyn y yw'r berthynas rhwng 66 00:03:04,790 --> 00:03:07,520 y geiriau mewn brawddeg. 67 00:03:07,520 --> 00:03:11,170 A'r cwestiwn mawr yw, a allwch addysgu cyfrifiadur sut i siarad 68 00:03:11,170 --> 00:03:12,650 iaith yn gyffredinol? 69 00:03:12,650 --> 00:03:17,810 Pa yn gwestiwn diddorol iawn i yn meddwl, fel pe efallai yn y dyfodol, 70 00:03:17,810 --> 00:03:19,930 ydych yn mynd i fod yn gallu siaradwch â'ch ffôn cell. 71 00:03:19,930 --> 00:03:23,290 Math o fel hyn yr ydym yn ei wneud gyda Siri ond rhywbeth mwy fel, gallwch mewn gwirionedd yn 72 00:03:23,290 --> 00:03:25,690 dweud beth bynnag yr ydych ei eisiau a dros y ffôn yn mynd i ddeall popeth. 73 00:03:25,690 --> 00:03:28,350 A gall gael cwestiynau dilynol ac yn parhau i siarad. 74 00:03:28,350 --> 00:03:30,880 Mae hynny'n rhywbeth gwirioneddol gyffrous, yn fy marn i. 75 00:03:30,880 --> 00:03:33,070 >> Felly, rhywbeth am ieithoedd naturiol. 76 00:03:33,070 --> 00:03:36,220 Rhywbeth gwirioneddol ddiddorol am iaith naturiol yw, ac mae hyn yn 77 00:03:36,220 --> 00:03:38,470 credyd i fy ieithyddiaeth athro, Maria Polinsky. 78 00:03:38,470 --> 00:03:40,830 Mae hi'n rhoi esiampl ac yr wyf yn meddwl mae'n wirioneddol ddiddorol. 79 00:03:40,830 --> 00:03:47,060 Oherwydd ein bod yn dysgu iaith o'r adeg pan rydym yn geni ac yna mae ein brodorol 80 00:03:47,060 --> 00:03:49,170 iaith math o tyfu ar ni. 81 00:03:49,170 --> 00:03:52,570 >> Ac yn y bôn byddwch yn dysgu iaith o fewnbwn fach iawn, dde? 82 00:03:52,570 --> 00:03:56,700 Rydych yn unig yn cael mewnbwn oddi wrth eich rhieni beth synau eich iaith 83 00:03:56,700 --> 00:03:58,770 hoffi a 'ch jyst dysgu. 84 00:03:58,770 --> 00:04:02,240 Felly, mae'n ddiddorol oherwydd os ydych yn edrych ar dedfrydau hynny, er enghraifft. 85 00:04:02,240 --> 00:04:06,980 Byddwch yn edrych, "Mary yn rhoi ar côt bob tro y mae hi'n gadael y tŷ. " 86 00:04:06,980 --> 00:04:10,650 >> Yn yr achos hwn, mae'n bosibl cael yr gair "hi" yn cyfeirio at Mary, dde? 87 00:04:10,650 --> 00:04:13,500 Gallwch ddweud "Mary yn rhoi ar côt bob tro Mary yn gadael y 88 00:04:13,500 --> 00:04:14,960 tŷ. "felly mae hynny'n iawn. 89 00:04:14,960 --> 00:04:19,370 Ond yna os ydych yn edrych ar y ddedfryd "Mae hi'n rhoi ar got bob tro Mary 90 00:04:19,370 --> 00:04:22,850 gadael y tŷ. "eich bod yn gwybod ei fod yn amhosibl dweud bod "hi" yn 91 00:04:22,850 --> 00:04:24,260 cyfeirio at Mary. 92 00:04:24,260 --> 00:04:27,070 >> Does dim ffordd o ddweud bod "Mary yn rhoi ar got bob tro Mary yn gadael 93 00:04:27,070 --> 00:04:30,790 y tŷ. "Felly mae'n ddiddorol oherwydd dyma'r math o greddf 94 00:04:30,790 --> 00:04:32,890 bod pob siaradwr brodorol wedi. 95 00:04:32,890 --> 00:04:36,370 A doedd neb yn dysgu bod hyn yn y ffordd y mae'r gystrawen yn gweithio. 96 00:04:36,370 --> 00:04:41,930 Ac y gallwch gael y "hi" cyfeirio at Mary yn yr achos cyntaf, 97 00:04:41,930 --> 00:04:44,260 ac mewn gwirionedd yn y eraill hefyd, ond nid yn yr un yma. 98 00:04:44,260 --> 00:04:46,500 Ond mae pawb fath o yn cael i'r un ateb. 99 00:04:46,500 --> 00:04:48,580 Mae pawb yn cytuno ar hynny. 100 00:04:48,580 --> 00:04:53,280 Felly mae'n wirioneddol ddiddorol sut er nad ydych yn gwybod holl reolau 101 00:04:53,280 --> 00:04:55,575 yn eich iaith chi fath o ddeall sut mae'r iaith yn gweithio. 102 00:04:55,575 --> 00:04:59,020 103 00:04:59,020 --> 00:05:01,530 >> Felly, y peth diddorol am naturiol iaith yw nad oes rhaid i chi 104 00:05:01,530 --> 00:05:06,970 adnabod unrhyw gystrawen i wybod os dedfryd yn gramadegol neu anramadegol ar gyfer 105 00:05:06,970 --> 00:05:08,810 rhan fwyaf o achosion. 106 00:05:08,810 --> 00:05:13,220 Sy'n gwneud i chi yn meddwl bod efallai yr hyn digwydd yw bod trwy eich bywyd, byddwch yn 107 00:05:13,220 --> 00:05:17,410 jyst cadw mynd yn fwy a mwy brawddegau gwybod i chi. 108 00:05:17,410 --> 00:05:19,800 Ac yna eich bod yn cadw cofio pob un o'r brawddegau. 109 00:05:19,800 --> 00:05:24,230 Ac yna pan fydd rhywun yn dweud wrthych rhywbeth, byddwch yn clywed y ddedfryd ac 110 00:05:24,230 --> 00:05:27,040 ydych yn edrych ar eich geirfa o frawddegau a gweld os 111 00:05:27,040 --> 00:05:28,270 y ddedfryd yn yno. 112 00:05:28,270 --> 00:05:29,830 Ac os ei fod yno i chi dweud ei fod yn gramadegol. 113 00:05:29,830 --> 00:05:31,740 Os nad yw'n rydych yn ei ddweud ei fod yn anramadegol. 114 00:05:31,740 --> 00:05:35,150 >> Felly, yn yr achos hwnnw, byddech yn dweud, oh, felly mae gennych restr enfawr o bob 115 00:05:35,150 --> 00:05:36,140 brawddegau posibl. 116 00:05:36,140 --> 00:05:38,240 Ac yna pan fyddwch yn clywed brawddeg, eich bod yn gwybod os yw'n gramadegol neu 117 00:05:38,240 --> 00:05:39,450 nad yw'n seiliedig ar hynny. 118 00:05:39,450 --> 00:05:42,360 Y peth yw, os ydych yn edrych ar dedfryd, er enghraifft, "Mae'r 119 00:05:42,360 --> 00:05:47,540 coginio pum pennawd CS50 TFS y deillion octopws gan ddefnyddio mwg DAPA. "Mae'n 120 00:05:47,540 --> 00:05:49,630 yn bendant nid yw dedfryd eich bod wedi clywed o'r blaen. 121 00:05:49,630 --> 00:05:52,380 Ond ar yr un pryd, byddwch yn gwybod ei fod yn 'n bert lawer gramadegol, dde? 122 00:05:52,380 --> 00:05:55,570 Nid oes unrhyw gamgymeriadau gramadegol a gallwch ddweud bod 123 00:05:55,570 --> 00:05:57,020 mae'n ddedfryd posibl. 124 00:05:57,020 --> 00:06:01,300 >> Felly mae'n gwneud i ni feddwl sydd mewn gwirionedd yn y ffordd yr ydym yn dysgu iaith yn nid yn unig yn 125 00:06:01,300 --> 00:06:07,090 drwy gael cronfa ddata enfawr o bosibl geiriau neu frawddegau, ond yn fwy o 126 00:06:07,090 --> 00:06:11,490 deall y berthynas rhwng geiriau yn y brawddegau hynny. 127 00:06:11,490 --> 00:06:14,570 A yw hynny'n gwneud synnwyr? 128 00:06:14,570 --> 00:06:19,370 Felly, yna y cwestiwn yw, gall cyfrifiaduron yn dysgu ieithoedd? 129 00:06:19,370 --> 00:06:21,490 A allwn ni ddysgu iaith i gyfrifiaduron? 130 00:06:21,490 --> 00:06:24,230 >> Felly, gadewch i ni feddwl am y gwahaniaeth rhwng siaradwr brodorol o iaith 131 00:06:24,230 --> 00:06:25,460 a chyfrifiadur. 132 00:06:25,460 --> 00:06:27,340 Felly, beth sy'n digwydd i'r siaradwr? 133 00:06:27,340 --> 00:06:30,430 Wel, y siaradwr brodorol yn dysgu yn iaith rhag bod yn agored iddo. 134 00:06:30,430 --> 00:06:34,200 Fel arfer ei flynyddoedd plentyndod cynnar. 135 00:06:34,200 --> 00:06:38,570 Felly, yn y bôn, os oes gen ti babi, ac eich bod yn cadw siarad â, ac mae'n 136 00:06:38,570 --> 00:06:40,540 dim ond yn dysgu sut i siarad yr iaith, dde? 137 00:06:40,540 --> 00:06:42,660 Felly, byddwch yn rhoi yn y bôn mewnbwn i'r baban. 138 00:06:42,660 --> 00:06:45,200 Felly, yna gallwch ddadlau bod cyfrifiadur yn gallu gwneud yr un peth, dde? 139 00:06:45,200 --> 00:06:49,510 Alli jyst roi iaith fel mewnbwn i'r cyfrifiadur. 140 00:06:49,510 --> 00:06:53,410 >> Fel er enghraifft, criw o ffeiliau sydd â llyfrau yn Saesneg. 141 00:06:53,410 --> 00:06:56,190 Efallai dyna un ffordd y byddwch yn o bosib yn addysgu 142 00:06:56,190 --> 00:06:57,850 chyfrifiadur Saesneg, dde? 143 00:06:57,850 --> 00:07:01,000 Ac yn wir, os ydych yn meddwl am y peth, mae'n mynd â chi efallai ychydig 144 00:07:01,000 --> 00:07:02,680 diwrnod i ddarllen llyfr. 145 00:07:02,680 --> 00:07:05,760 Ar gyfer cyfrifiadur mae'n cymryd ail edrych ar yr holl eiriau mewn llyfr. 146 00:07:05,760 --> 00:07:10,810 Felly, gallwch chi feddwl a allai fod yn dim ond hyn ddadl o fewnbwn gan o'ch cwmpas, 147 00:07:10,810 --> 00:07:15,440 nad yw hynny'n ddigon i ddweud bod hynny'n rhywbeth y gall dim ond pobl yn ei wneud. 148 00:07:15,440 --> 00:07:17,680 Gallwch chi feddwl cyfrifiaduron Gall hefyd gael mewnbwn. 149 00:07:17,680 --> 00:07:21,170 >> Yr ail beth yw bod siaradwyr brodorol hefyd yn cael ymennydd sydd wedi 150 00:07:21,170 --> 00:07:23,870 gallu dysgu iaith. 151 00:07:23,870 --> 00:07:27,020 Ond os ydych yn meddwl am y peth, ymennydd yn beth solet. 152 00:07:27,020 --> 00:07:30,450 Pan fyddwch yn cael eu geni, mae eisoes wedi pennu - 153 00:07:30,450 --> 00:07:31,320 hyn yn eich ymennydd. 154 00:07:31,320 --> 00:07:34,660 Ac wrth i chi dyfu i fyny, 'ch jyst yn cael mwy mewnbwn o iaith ac efallai maetholion 155 00:07:34,660 --> 00:07:35,960 a phethau eraill. 156 00:07:35,960 --> 00:07:38,170 Ond 'n bert lawer eich ymennydd yn beth solet. 157 00:07:38,170 --> 00:07:41,290 >> Felly, gallwch ddweud, wel, efallai y gallwch adeiladu cyfrifiadur sydd â criw o 158 00:07:41,290 --> 00:07:45,890 swyddogaethau a dulliau mai dim ond dynwared gallu dysgu iaith. 159 00:07:45,890 --> 00:07:49,630 Felly, yn yr ystyr hwnnw, gallech ddweud, wel, yr wyf yn yn gallu cael cyfrifiadur sy'n cynnwys yr holl 160 00:07:49,630 --> 00:07:52,270 bethau y mae angen i mi ddysgu iaith. 161 00:07:52,270 --> 00:07:56,200 A'r peth olaf yw bod yn frodor siaradwr yn dysgu o brofi a methu. 162 00:07:56,200 --> 00:08:01,090 Felly, yn y bôn peth pwysig arall yn ddysgu iaith yw eich bod fath 163 00:08:01,090 --> 00:08:05,340 o ddysgu pethau trwy wneud cyffredinoli o'r hyn yr ydych yn ei glywed. 164 00:08:05,340 --> 00:08:10,280 >> Felly, gan eich bod yn tyfu i fyny byddwch yn dysgu bod rhai geiriau yn fwy fel enwau, 165 00:08:10,280 --> 00:08:11,820 rhai rhai eraill yn ansoddeiriau. 166 00:08:11,820 --> 00:08:14,250 A does dim rhaid i chi gael unrhyw gwybodaeth o ieithyddiaeth 167 00:08:14,250 --> 00:08:15,040 i ddeall hynny. 168 00:08:15,040 --> 00:08:18,560 Ond 'ch jyst yn gwybod bod rhai geiriau yn cael eu lleoli mewn rhyw ran o'r 169 00:08:18,560 --> 00:08:22,570 ddedfryd a rhai eraill mewn meysydd eraill rhannau o'r ddedfryd. 170 00:08:22,570 --> 00:08:26,110 >> A dyna pan fyddwch yn gwneud rhywbeth sy'n fel dedfryd nad yw'n gywir - 171 00:08:26,110 --> 00:08:28,770 efallai oherwydd dros cyffredinoli er enghraifft. 172 00:08:28,770 --> 00:08:32,210 Efallai pan fyddwch yn tyfu i fyny, byddwch yn sylwi bod y lluosog fel arfer 173 00:08:32,210 --> 00:08:35,809 a ffurfiwyd trwy roi S yn ddiwedd y gair. 174 00:08:35,809 --> 00:08:40,042 Ac yna yr ydych yn ceisio gwneud y lluosog "Ceirw" fel "deers" neu "dant" fel 175 00:08:40,042 --> 00:08:44,780 "Tooths." Felly, yna bydd eich rhieni neu rhywun yn cywiro chi ac yn dweud, na, mae'r 176 00:08:44,780 --> 00:08:49,020 lluosog o "ceirw" yw "ceirw," ac yn y lluosog o "dant" yw "dannedd." Ac yna 177 00:08:49,020 --> 00:08:50,060 byddwch yn dysgu pethau hynny. 178 00:08:50,060 --> 00:08:51,520 Felly, byddwch yn dysgu oddi wrth brofi a methu. 179 00:08:51,520 --> 00:08:53,100 >> Ond gallwch hefyd wneud hynny gyda chyfrifiadur. 180 00:08:53,100 --> 00:08:55,310 Gallwch gael rhywbeth a elwir yn dysgu atgyfnerthu. 181 00:08:55,310 --> 00:08:58,560 Pa yn y bôn fel rhoi cyfrifiadur gwobr pryd bynnag y mae'n ei wneud 182 00:08:58,560 --> 00:08:59,410 rhywbeth yn gywir. 183 00:08:59,410 --> 00:09:04,710 A'i roi i'r gwrthwyneb am wobr a phan fydd yn gwneud rhywbeth o'i le. 184 00:09:04,710 --> 00:09:07,410 Gallwch weld mewn gwirionedd, os byddwch yn mynd i Google Translate a ydych yn ceisio 185 00:09:07,410 --> 00:09:10,220 cyfieithu brawddeg, mae'n yn gofyn i chi am adborth. 186 00:09:10,220 --> 00:09:13,240 Felly, os ydych yn dweud, oh, mae gwell cyfieithu ar gyfer y frawddeg hon. 187 00:09:13,240 --> 00:09:18,140 Gallwch deipio i fyny ac yna os bydd llawer o pobl yn cadw dweud bod yn well 188 00:09:18,140 --> 00:09:21,560 cyfieithu, 'i jyst yn dysgu ei fod yn Dylai ddefnyddio'r cyfieithiad yn hytrach na 189 00:09:21,560 --> 00:09:22,960 yr un a oedd yn rhoi. 190 00:09:22,960 --> 00:09:28,830 >> Felly, mae'n gwestiwn athronyddol iawn i weld os oes cyfrifiaduron yn mynd i fod 191 00:09:28,830 --> 00:09:30,340 gallu siarad neu nad ydynt yn y dyfodol. 192 00:09:30,340 --> 00:09:34,440 Ond yr wyf yn gobeithio'n fawr y gallant yn seiliedig yn unig ar y dadleuon hynny. 193 00:09:34,440 --> 00:09:38,570 Ond dim ond yn fwy o athronyddol cwestiwn. 194 00:09:38,570 --> 00:09:43,460 >> Felly, er gyfrifiaduron yn dal i fethu siarad, beth yw'r pethau y gallwn ei wneud? 195 00:09:43,460 --> 00:09:47,070 Mae rhai pethau 'n sylweddol oera yn dosbarthiad data. 196 00:09:47,070 --> 00:09:53,210 Felly, er enghraifft, rydych guys yn gwybod bod gwasanaethau e-bost ei wneud, er 197 00:09:53,210 --> 00:09:55,580 enghraifft, hidlo sbam. 198 00:09:55,580 --> 00:09:59,070 Felly, pryd bynnag y byddwch yn derbyn sbam, mae'n ceisio hidlo i flwch arall. 199 00:09:59,070 --> 00:10:00,270 Felly, sut mae'n gwneud hynny? 200 00:10:00,270 --> 00:10:06,080 Nid yw'n debyg y cyfrifiadur yn unig yn gwybod cyfeiriadau e-bost hyn y yn anfon spam. 201 00:10:06,080 --> 00:10:09,130 Felly, mae'n fwy seiliedig ar gynnwys y neges, neu efallai y teitl, neu 202 00:10:09,130 --> 00:10:11,310 efallai rhywfaint o batrwm sydd gennych. 203 00:10:11,310 --> 00:10:15,690 >> Felly, yn y bôn, yr hyn y gallwch ei wneud yw cael llawer o ddata o negeseuon e-bost sy'n cael eu sbam, 204 00:10:15,690 --> 00:10:19,980 negeseuon e-bost nad ydynt yn sbam, a dysgu beth math o batrymau sydd gennych yn y 205 00:10:19,980 --> 00:10:21,000 rhai sy'n sbam. 206 00:10:21,000 --> 00:10:23,260 Ac mae hyn yn rhan o cyfrifiannu ieithyddiaeth. 207 00:10:23,260 --> 00:10:24,720 Mae'n cael ei alw dosbarthiad data. 208 00:10:24,720 --> 00:10:28,100 Ac rydym yn mewn gwirionedd yn mynd i weld enghraifft o hynny yn y sleidiau nesaf. 209 00:10:28,100 --> 00:10:32,910 >> Yr ail beth yw iaith naturiol prosesu sef y peth bod y 210 00:10:32,910 --> 00:10:36,580 Graff Chwilio yn ei wneud o roi chi ysgrifennu brawddeg. 211 00:10:36,580 --> 00:10:38,690 Ac mae'n ymddiried eich bod yn deall yr hyn y yw ystyr ac yn rhoi 212 00:10:38,690 --> 00:10:39,940 chi o ganlyniad i well. 213 00:10:39,940 --> 00:10:43,880 Mewn gwirionedd, os byddwch yn mynd i Google neu Bing a ydych yn chwilio rhywbeth fel Lady 214 00:10:43,880 --> 00:10:47,060 Uchder Gaga, a ydych yn mynd mewn gwirionedd i gael 5 '1 "yn hytrach na gwybodaeth 215 00:10:47,060 --> 00:10:50,170 oddi wrth ei oherwydd ei fod mewn gwirionedd yn deall yr hyn yr ydych yn sôn amdano. 216 00:10:50,170 --> 00:10:52,140 Felly, mae hynny'n rhan o'r naturiol prosesu iaith. 217 00:10:52,140 --> 00:10:57,000 >> Neu hefyd pan fyddwch yn defnyddio Siri, yn gyntaf gennych algorithm sy'n ceisio 218 00:10:57,000 --> 00:11:01,130 cyfieithu yr hyn yr ydych yn ei ddweud mewn geiriau, mewn testun. 219 00:11:01,130 --> 00:11:03,690 Ac yna mae'n ceisio gyfieithu hynny i ystyr. 220 00:11:03,690 --> 00:11:06,570 Felly dyna i gyd yn rhan o naturiol prosesu iaith. 221 00:11:06,570 --> 00:11:08,320 >> Yna byddwch yn cael cyfieithu peirianyddol - 222 00:11:08,320 --> 00:11:10,300 sydd mewn gwirionedd yn un o fy ffefrynnau - 223 00:11:10,300 --> 00:11:14,060 sydd ychydig yn cyfieithu o iaith i'r llall. 224 00:11:14,060 --> 00:11:17,950 Felly, gallwch chi feddwl pan fyddwch chi'n ei wneud cyfieithu peirianyddol, mae gennych 225 00:11:17,950 --> 00:11:19,750 posibiliadau diddiwedd o frawddegau. 226 00:11:19,750 --> 00:11:22,960 Felly, does dim ffordd o ychydig storio pob un cyfieithu. 227 00:11:22,960 --> 00:11:27,440 Felly, rhaid i chi ddod o hyd i diddorol algorithmau i allu 228 00:11:27,440 --> 00:11:30,110 cyfieithu pob un dedfryd mewn rhyw ffordd. 229 00:11:30,110 --> 00:11:32,483 >> Rydych yn guys gennych unrhyw gwestiynau hyd yn hyn? 230 00:11:32,483 --> 00:11:34,450 Nac oes? 231 00:11:34,450 --> 00:11:34,830 OK. 232 00:11:34,830 --> 00:11:36,900 >> Felly, beth ydym yn mynd i weld heddiw? 233 00:11:36,900 --> 00:11:39,300 Yn gyntaf oll, yr wyf i'n mynd i siarad am y broblem dosbarthiad. 234 00:11:39,300 --> 00:11:41,440 Felly, yr un yr wyf yn ddweud am sbam. 235 00:11:41,440 --> 00:11:46,820 Yr hyn yr wyf i'n mynd i wneud yw, geiriau a roddir i gân, gallwch geisio chyfrif i maes 236 00:11:46,820 --> 00:11:49,810 gyda tebygolrwydd uchel pwy yw'r gantores? 237 00:11:49,810 --> 00:11:53,590 Lets 'ddeud bod gennyf caneuon o Lady Gaga a Katy Perry, os byddaf yn rhoi i chi 238 00:11:53,590 --> 00:11:58,130 cân newydd, gallwch chyfrif i maes os mae'n Katy Perry neu Lady Gaga? 239 00:11:58,130 --> 00:12:01,490 >> Yr ail un, Im 'jyst yn mynd i siarad am y broblem segmentu. 240 00:12:01,490 --> 00:12:05,780 Felly, nid wyf yn gwybod os ydych yn guys gwybod, ond Tseiniaidd, Siapan, eraill Dwyrain Asia 241 00:12:05,780 --> 00:12:08,090 ieithoedd, ac ieithoedd eraill yn gyffredinol, nid oes rhaid 242 00:12:08,090 --> 00:12:09,830 bylchau rhwng geiriau. 243 00:12:09,830 --> 00:12:13,540 Ac yna os ydych yn meddwl am y ffordd y eich math cyfrifiadurol o gais i 244 00:12:13,540 --> 00:12:18,600 deall prosesu iaith naturiol, mae'n edrych ar y geiriau a 245 00:12:18,600 --> 00:12:21,500 ceisio deall y cysylltiadau rhyngddynt, dde? 246 00:12:21,500 --> 00:12:25,440 Ond yna os oes gennych Tseiniaidd, ac rydych sero leoedd, mae'n anodd iawn i 247 00:12:25,440 --> 00:12:28,360 cael gwybod beth yw'r berthynas rhwng eiriau, oherwydd nad oes ganddynt unrhyw 248 00:12:28,360 --> 00:12:29,530 geiriau ar y dechrau. 249 00:12:29,530 --> 00:12:32,600 Felly, rhaid i chi wneud rhywbeth o'r enw segmentu a dim ond yn golygu rhoi 250 00:12:32,600 --> 00:12:36,490 bylchau rhwng yr hyn y byddem yn galw y geiriau yn yr ieithoedd hynny. 251 00:12:36,490 --> 00:12:37,740 Yn gwneud synnwyr? 252 00:12:37,740 --> 00:12:39,680 253 00:12:39,680 --> 00:12:41,540 >> Ac yna rydym yn mynd i siarad am gystrawen. 254 00:12:41,540 --> 00:12:44,050 Felly dim ond ychydig am naturiol prosesu iaith. 255 00:12:44,050 --> 00:12:45,420 Mae'n mynd i fod yr un trosolwg. 256 00:12:45,420 --> 00:12:50,700 Felly heddiw, yn y bôn yr hyn yr wyf am ei wneud yn rhoi guys i chi ychydig o 257 00:12:50,700 --> 00:12:53,930 tu mewn beth yw'r posibiliadau y gallwch ei wneud gyda cyfrifiadol 258 00:12:53,930 --> 00:12:54,960 ieithyddiaeth. 259 00:12:54,960 --> 00:13:00,410 Ac yna gallwch weld beth yw eich barn yn oer ymhlith pethau hynny. 260 00:13:00,410 --> 00:13:02,270 Ac efallai y gallwch chi feddwl am brosiect ac yn dod siarad â mi. 261 00:13:02,270 --> 00:13:05,260 Ac yr wyf yn gallu rhoi cyngor i chi ar sut i'w weithredu. 262 00:13:05,260 --> 00:13:09,060 >> Felly gystrawen yn mynd i fod ychydig yn am Chwilio Graff a pheiriant 263 00:13:09,060 --> 00:13:09,670 cyfieithu. 264 00:13:09,670 --> 00:13:13,650 Im 'jyst yn mynd i roi enghraifft o sut y gallech, er enghraifft, cyfieithu 265 00:13:13,650 --> 00:13:16,020 rhywbeth o Portiwgaleg i Saesneg. 266 00:13:16,020 --> 00:13:17,830 Swnio'n dda? 267 00:13:17,830 --> 00:13:19,293 >> Felly yn gyntaf, y broblem dosbarthiad. 268 00:13:19,293 --> 00:13:23,590 Byddaf yn dweud bod y rhan hon o'r seminar yn mynd i fod y mwyaf heriol 269 00:13:23,590 --> 00:13:27,560 un dim ond oherwydd mae mynd bod rhywfaint o godio. 270 00:13:27,560 --> 00:13:29,470 Ond mae'n mynd i fod yn Python. 271 00:13:29,470 --> 00:13:34,380 Yr wyf yn gwybod nad ydych guys yn gwybod Python, felly Im 'jyst yn mynd i egluro ar uchel 272 00:13:34,380 --> 00:13:35,750 lefel yr hyn yr wyf i'n ei wneud. 273 00:13:35,750 --> 00:13:40,900 Ac nid oes rhaid i chi wir gofal yn rhy llawer am y gystrawen oherwydd dyna 274 00:13:40,900 --> 00:13:42,140 rhywbeth y gallwch guys ddysgu. 275 00:13:42,140 --> 00:13:42,540 OK? 276 00:13:42,540 --> 00:13:43,580 Swnio'n dda. 277 00:13:43,580 --> 00:13:46,020 >> Felly beth yw'r broblem dosbarthu? 278 00:13:46,020 --> 00:13:49,140 Felly, rydych yn rhoi rhywfaint geiriau i cân, a ydych am i ddyfalu 279 00:13:49,140 --> 00:13:50,620 sy'n canu ei. 280 00:13:50,620 --> 00:13:54,045 A gall hyn fod ar gyfer unrhyw fath o broblemau eraill. 281 00:13:54,045 --> 00:13:59,980 Felly y gellir ei, er enghraifft, mae gennych ymgyrch arlywyddol a bod gennych 282 00:13:59,980 --> 00:14:02,610 lleferydd, ac yr ydych yn awyddus i ddod o hyd i allan os oedd, er enghraifft, 283 00:14:02,610 --> 00:14:04,470 Obama neu Romney Mitt. 284 00:14:04,470 --> 00:14:07,700 Neu gallwch gael criw o negeseuon e-bost a ydych am i chyfrif i maes os ydynt yn 285 00:14:07,700 --> 00:14:08,890 spam neu beidio. 286 00:14:08,890 --> 00:14:11,440 Felly, 'i' jyst dosbarthu rhai data sy'n seiliedig ar y geiriau 287 00:14:11,440 --> 00:14:13,790 bod gennych yno. 288 00:14:13,790 --> 00:14:16,295 >> Felly, er mwyn gwneud hynny, rhaid i chi wneud rhai rhagdybiaethau. 289 00:14:16,295 --> 00:14:20,570 Felly llawer am ieithyddiaeth gyfrifiadurol yn gwneud rhagdybiaethau, 290 00:14:20,570 --> 00:14:24,100 rhagdybiaethau fel arfer yn smart, fel bod gallwch gael canlyniadau da. 291 00:14:24,100 --> 00:14:26,670 Ceisio creu model ar ei gyfer. 292 00:14:26,670 --> 00:14:31,290 Ac yna roi cynnig arni a gweld os bydd yn gweithio, os yw'n rhoi manylder da chi. 293 00:14:31,290 --> 00:14:33,940 Ac os ydyw, yna rydych geisio ei gwella. 294 00:14:33,940 --> 00:14:37,640 Os nad yw, ydych chi fel, OK, efallai y gallaf Dylai wneud rhagdybiaeth gwahanol. 295 00:14:37,640 --> 00:14:44,030 >> Felly, y dybiaeth ein bod yn mynd i wneud yw bod artist fel arfer yn canu 296 00:14:44,030 --> 00:14:49,220 am sawl gwaith bwnc, ac efallai defnyddio geiriau sawl gwaith yn unig 297 00:14:49,220 --> 00:14:50,270 oherwydd eu bod yn arfer ag ef. 298 00:14:50,270 --> 00:14:51,890 Alli jyst meddwl am eich ffrind. 299 00:14:51,890 --> 00:14:57,350 Rwy'n siŵr eich bod guys i gyd ffrindiau sy'n dweud eu ymadrodd llofnod, 300 00:14:57,350 --> 00:14:59,260 yn llythrennol ar gyfer pob un frawddeg - 301 00:14:59,260 --> 00:15:02,660 fel rhyw air penodol neu ryw penodol ymadrodd y maent yn ei ddweud am 302 00:15:02,660 --> 00:15:04,020 pob un brawddeg. 303 00:15:04,020 --> 00:15:07,920 >> A'r hyn y gallwch ei ddweud yw os ydych yn gweld dedfryd sydd â llofnod 304 00:15:07,920 --> 00:15:11,450 ymadrodd, gallwch chi ddyfalu ei bod yn debygol eich ffrind yn y 305 00:15:11,450 --> 00:15:13,310 un ddweud ei fod, dde? 306 00:15:13,310 --> 00:15:18,410 Felly, byddwch yn gwneud y rhagdybiaeth honno ac yna dyna sut yr ydych yn creu model. 307 00:15:18,410 --> 00:15:24,440 >> Yr enghraifft yr wyf i'n mynd i roi ar sut Lady Gaga, er enghraifft, pobl 308 00:15:24,440 --> 00:15:27,430 dweud ei bod yn defnyddio "babi" ar gyfer ei holl ganeuon rhif un. 309 00:15:27,430 --> 00:15:32,270 Ac mewn gwirionedd mae hyn yn fideo sy'n dangos hi yn dweud y gair "baban" ar gyfer 310 00:15:32,270 --> 00:15:33,410 gwahanol ganeuon. 311 00:15:33,410 --> 00:15:33,860 >> [VIDEO Playback] 312 00:15:33,860 --> 00:15:34,310 >> - (CANU) Baby. 313 00:15:34,310 --> 00:15:36,220 Baby. 314 00:15:36,220 --> 00:15:37,086 Baby. 315 00:15:37,086 --> 00:15:37,520 Baby. 316 00:15:37,520 --> 00:15:37,770 Baby. 317 00:15:37,770 --> 00:15:38,822 Babe. 318 00:15:38,822 --> 00:15:39,243 Baby. 319 00:15:39,243 --> 00:15:40,085 Baby. 320 00:15:40,085 --> 00:15:40,510 Baby. 321 00:15:40,510 --> 00:15:40,850 Baby. 322 00:15:40,850 --> 00:15:41,090 >> [VIDEO END chwarae- 323 00:15:41,090 --> 00:15:44,020 >> LUCAS Freitas: Felly mae, yr wyf yn meddwl, 40 o ganeuon yma lle mae hi'n dweud bod y 324 00:15:44,020 --> 00:15:48,690 gair "babi." Felly, gallwch chi yn y bôn ddyfalu os ydych yn gweld cân sydd wedi 325 00:15:48,690 --> 00:15:52,180 y gair "babi," mae rhywfaint uchel tebygolrwydd ei fod yn Lady Gaga. 326 00:15:52,180 --> 00:15:56,450 Ond gadewch i ni geisio datblygu hyn bellach yn fwy ffurfiol. 327 00:15:56,450 --> 00:16:00,470 >> Felly mae'r rhain yn geiriau i ganeuon gan Lady Gaga a Katy Perry. 328 00:16:00,470 --> 00:16:04,120 Felly, rydych yn edrych ar Lady Gaga, byddwch yn gweld eu bod yn yn cael llawer o ddigwyddiadau o "baban," a 329 00:16:04,120 --> 00:16:07,710 llawer o achosion o "ffordd." Ac yna Katy Perry Mae gan lawer o achosion o 330 00:16:07,710 --> 00:16:10,360 "Y," llawer o achosion o "tân." 331 00:16:10,360 --> 00:16:14,560 >> Felly, yn y bôn yr hyn yr ydym am ei wneud yw, byddwch yn cael telynegol. 332 00:16:14,560 --> 00:16:20,480 Dewch i ddweud eich bod yn cael lyric ar gyfer gân sy'n "babi," dim ond "babi." Os 333 00:16:20,480 --> 00:16:24,750 'ch jyst yn cael y gair "babi," ac mae hyn yn yw'r holl ddata sydd gennych o 334 00:16:24,750 --> 00:16:27,880 Lady Gaga a Katy Perry, a fyddai'n chi ddyfalu yw'r person 335 00:16:27,880 --> 00:16:29,370 sy'n canu y gân? 336 00:16:29,370 --> 00:16:32,360 Lady Gaga neu Katy Perry? 337 00:16:32,360 --> 00:16:33,150 Lady Gaga, dde? 338 00:16:33,150 --> 00:16:37,400 Am ei bod yn yr unig un sy'n dweud "Babi." Mae hyn yn swnio'n dwp, dde? 339 00:16:37,400 --> 00:16:38,760 OK, mae hyn yn hawdd iawn. 340 00:16:38,760 --> 00:16:41,860 Im 'jyst yn edrych ar y ddau caneuon a Wrth gwrs, mae hi yw'r unig un sydd wedi 341 00:16:41,860 --> 00:16:42,660 "Babi." 342 00:16:42,660 --> 00:16:44,740 >> Ond beth os oes gennych criw o eiriau? 343 00:16:44,740 --> 00:16:50,900 Os oes gennych telynegol gwirioneddol, rhywbeth fel, "babi, Fi jyst 344 00:16:50,900 --> 00:16:51,610 Aeth i weld [? CFT?] 345 00:16:51,610 --> 00:16:54,020 ddarlith, "neu rywbeth fel 'na, a yna rhaid i chi mewn gwirionedd i chyfrif i maes - 346 00:16:54,020 --> 00:16:55,780 yn seiliedig ar yr holl eiriau hynny - 347 00:16:55,780 --> 00:16:58,350 pwy yw'r artist sydd yn ôl pob tebyg canodd y gân? 348 00:16:58,350 --> 00:17:01,860 Felly, gadewch i ni geisio datblygu hwn ychydig ymhellach. 349 00:17:01,860 --> 00:17:05,630 >> OK, yn seiliedig felly dim ond ar y data yr ydym yn gael, mae'n ymddangos bod Gaga yn ôl pob tebyg 350 00:17:05,630 --> 00:17:06,260 y canwr. 351 00:17:06,260 --> 00:17:07,904 Ond sut y gallwn ysgrifennu hyn yn fwy ffurfiol? 352 00:17:07,904 --> 00:17:10,579 353 00:17:10,579 --> 00:17:13,140 Ac mae mynd i fod ychydig yn ychydig o ystadegau. 354 00:17:13,140 --> 00:17:15,880 Felly, os ydych yn mynd ar goll, dim ond ceisiwch i ddeall y cysyniad. 355 00:17:15,880 --> 00:17:18,700 Nid oes ots os ydych yn deall yr hafaliadau yn iawn. 356 00:17:18,700 --> 00:17:22,150 Mae hyn i gyd yn mynd i fod ar-lein. 357 00:17:22,150 --> 00:17:25,490 >> Felly, yn y bôn yr hyn yr wyf i'n cyfrifo yw'r tebygolrwydd y gân hon yw drwy 358 00:17:25,490 --> 00:17:28,040 Lady Gaga o gofio bod - 359 00:17:28,040 --> 00:17:30,660 felly mae hyn yn golygu bar o gofio bod - 360 00:17:30,660 --> 00:17:33,680 Gwelais y gair "babi." A yw hynny'n gwneud synnwyr? 361 00:17:33,680 --> 00:17:35,540 Felly, Im 'yn ceisio i gyfrifo y tebygolrwydd. 362 00:17:35,540 --> 00:17:38,540 >> Felly mae theorem hwn a elwir yn Bayes theorem sy'n dweud bod y 363 00:17:38,540 --> 00:17:43,330 tebygolrwydd y bydd A B a roddir, yw'r tebygolrwydd o B rhoddir A, gwaith y 364 00:17:43,330 --> 00:17:47,660 tebygolrwydd o A, dros y tebygolrwydd B. Mae hwn yn hafaliad hir. 365 00:17:47,660 --> 00:17:51,970 Ond beth mae'n rhaid i chi ddeall o hynny yw bod hyn yn beth yr wyf am ei 366 00:17:51,970 --> 00:17:52,830 cyfrifo, dde? 367 00:17:52,830 --> 00:17:56,570 Felly, y tebygolrwydd bod y gân yw drwy Lady Gaga gan fy mod yn gweld y gair 368 00:17:56,570 --> 00:17:58,230 "Babi." 369 00:17:58,230 --> 00:18:02,960 >> Ac yn awr yr hyn yr wyf i'n mynd yn tebygolrwydd y gair "baban" a roddwyd 370 00:18:02,960 --> 00:18:04,390 bod gennyf Lady Gaga. 371 00:18:04,390 --> 00:18:07,220 A beth yw hynny yn y bôn? 372 00:18:07,220 --> 00:18:10,500 Beth mae hynny'n ei olygu yw, beth yw'r tebygolrwydd o weld y gair "babi" 373 00:18:10,500 --> 00:18:12,130 mewn geiriau Gaga? 374 00:18:12,130 --> 00:18:16,240 Os ydw i eisiau cyfrifo bod mewn iawn ffordd syml, dim ond y nifer o 375 00:18:16,240 --> 00:18:23,640 gwaith yr wyf yn gweld "babi" dros gyfanswm y nifer o eiriau yn geiriau Gaga, dde? 376 00:18:23,640 --> 00:18:27,600 Beth yw amledd fy mod yn gweld y gair hwnnw yng ngwaith Gaga yn? 377 00:18:27,600 --> 00:18:30,530 Yn gwneud synnwyr? 378 00:18:30,530 --> 00:18:33,420 >> Yr ail dymor yw tebygolrwydd o Gaga. 379 00:18:33,420 --> 00:18:34,360 Beth yw ystyr hynny? 380 00:18:34,360 --> 00:18:38,550 Yn y bôn yn golygu, beth yw'r tebygolrwydd o ddosbarthu 381 00:18:38,550 --> 00:18:40,690 rhai geiriau fel Gaga? 382 00:18:40,690 --> 00:18:45,320 A dyna yn fath o 'n annaearol, ond gadewch i ni feddwl am enghraifft. 383 00:18:45,320 --> 00:18:49,230 Felly, gadewch i ni ddweud bod y tebygolrwydd o cael "babi" mewn cân yr un fath 384 00:18:49,230 --> 00:18:51,760 ar gyfer Gaga a Britney Spears. 385 00:18:51,760 --> 00:18:54,950 Ond Britney Spears wedi ddwywaith mwy o ganeuon nag Lady Gaga. 386 00:18:54,950 --> 00:19:00,570 Felly, os bydd rhywun yn unig yn rhoi i chi ar hap geiriau o "baban," y peth cyntaf y byddwch 387 00:19:00,570 --> 00:19:04,710 edrych ar yw, beth yw'r tebygolrwydd o cael "babi" mewn cân Gaga, "babi" 388 00:19:04,710 --> 00:19:05,410 mewn cân Britney? 389 00:19:05,410 --> 00:19:06,460 Ac mae'n yr un peth. 390 00:19:06,460 --> 00:19:10,040 >> Felly, yr ail beth y byddwch yn ei weld yw, yn dda, beth yw'r tebygolrwydd o 391 00:19:10,040 --> 00:19:13,770 lyric hwn ei ben ei hun fod yn lyric Gaga, a beth yw'r tebygolrwydd o 392 00:19:13,770 --> 00:19:15,380 bod yn lyric Britney? 393 00:19:15,380 --> 00:19:18,950 Felly, gan fod Britney wedi cymaint mwy o lyrics na Gaga, a fyddech yn ôl pob tebyg 394 00:19:18,950 --> 00:19:21,470 dyweder, yn dda, mae hyn yn ôl pob tebyg yn delynegol Britney. 395 00:19:21,470 --> 00:19:23,340 Felly dyna pam yr ydym yn cael y alw'n yma. 396 00:19:23,340 --> 00:19:24,670 Tebygolrwydd o Gaga. 397 00:19:24,670 --> 00:19:26,950 Yn gwneud synnwyr? 398 00:19:26,950 --> 00:19:28,660 A yw'n? 399 00:19:28,660 --> 00:19:29,370 OK. 400 00:19:29,370 --> 00:19:33,500 >> Ac mae'r un olaf yn unig y tebygolrwydd o "baban" sy'n nad yw'n 401 00:19:33,500 --> 00:19:34,810 wirioneddol bwysig bod llawer. 402 00:19:34,810 --> 00:19:39,940 Ond y tebygolrwydd o gweld "babi" yn Saesneg. 403 00:19:39,940 --> 00:19:42,725 Rydym fel arfer yn poeni bod llawer am y cyfnod hwnnw. 404 00:19:42,725 --> 00:19:44,490 A yw hynny'n gwneud synnwyr? 405 00:19:44,490 --> 00:19:48,110 Felly, y tebygolrwydd o Gaga yn Gelwir y tebygolrwydd blaenorol 406 00:19:48,110 --> 00:19:49,530 o'r Gaga dosbarth. 407 00:19:49,530 --> 00:19:53,840 Oherwydd ei fod yn unig yn golygu, beth yw'r tebygolrwydd o gael dosbarth hwnnw - 408 00:19:53,840 --> 00:19:55,520 sy'n Gaga - 409 00:19:55,520 --> 00:19:59,350 dim ond yn gyffredinol, dim ond heb unrhyw amodau. 410 00:19:59,350 --> 00:20:02,560 >> Ac yna pan fyddaf yn cael tebygolrwydd o Gaga a roddir "babi," rydym yn galw ei yn ogystal â 411 00:20:02,560 --> 00:20:06,160 teary tebygolrwydd oherwydd ei fod yn y tebygolrwydd o gael 412 00:20:06,160 --> 00:20:08,300 Gaga rhoi rhywfaint o dystiolaeth. 413 00:20:08,300 --> 00:20:11,050 Felly, yr wyf i'n rhoi'r dystiolaeth y byddwch yn fy mod yn gweld y gair babi ac 414 00:20:11,050 --> 00:20:12,690 y gân yn gwneud synnwyr? 415 00:20:12,690 --> 00:20:15,960 416 00:20:15,960 --> 00:20:16,410 OK. 417 00:20:16,410 --> 00:20:22,400 >> Felly, Os byddaf yn cyfrifo bod ar gyfer pob o ganeuon ar gyfer Lady Gaga, 418 00:20:22,400 --> 00:20:25,916 beth fyddai hynny fod - 419 00:20:25,916 --> 00:20:27,730 yn ôl pob golwg, ni allaf symud hyn. 420 00:20:27,730 --> 00:20:31,850 421 00:20:31,850 --> 00:20:36,920 Bydd y tebygolrwydd o Gaga fod yn rhywbeth fel, 2 dros 24, amserau 1/2, 422 00:20:36,920 --> 00:20:38,260 dros 2 dros 53. 423 00:20:38,260 --> 00:20:40,640 Nid oes ots os ydych yn gwybod beth rhifau hyn yn dod o. 424 00:20:40,640 --> 00:20:44,750 Ond mae'r un nifer sydd yn mynd i fod yn fwy na 0, dde? 425 00:20:44,750 --> 00:20:48,610 >> Ac yna pan fyddaf yn gwneud Katy Perry, y tebygolrwydd o "baban" a roddwyd Katy yn 426 00:20:48,610 --> 00:20:49,830 eisoes yn 0, dde? 427 00:20:49,830 --> 00:20:52,820 Oherwydd nad oes "babi" yn Katy Perry. 428 00:20:52,820 --> 00:20:56,360 Felly, yna mae hyn yn dod yn 0, ac Gaga ennill, sy'n golygu bod Gaga yn 429 00:20:56,360 --> 00:20:57,310 yn ôl pob tebyg y canwr. 430 00:20:57,310 --> 00:20:58,560 A yw hynny'n gwneud synnwyr? 431 00:20:58,560 --> 00:21:00,700 432 00:21:00,700 --> 00:21:01,950 OK. 433 00:21:01,950 --> 00:21:04,160 434 00:21:04,160 --> 00:21:11,750 >> Felly, os ydw i eisiau gwneud mwy o swyddogol hwn, Gallaf ei wneud mewn gwirionedd model 435 00:21:11,750 --> 00:21:12,700 am eiriau lluosog. 436 00:21:12,700 --> 00:21:14,610 Felly, gadewch i ni ddweud bod gen i rywbeth fel, "babi, yr wyf yn 437 00:21:14,610 --> 00:21:16,030 ar dân, "neu rywbeth. 438 00:21:16,030 --> 00:21:17,760 Felly mae wedi geiriau lluosog. 439 00:21:17,760 --> 00:21:20,880 Ac yn yr achos hwn, gallwch weld bod "babi" mewn Gaga, 440 00:21:20,880 --> 00:21:21,710 ond nid yw'n yn Katy. 441 00:21:21,710 --> 00:21:24,940 Ac "tân" mewn Katy, ond nid yw'n yn Gaga, dde? 442 00:21:24,940 --> 00:21:27,200 Felly, mae'n mynd yn fwy anodd, dde? 443 00:21:27,200 --> 00:21:31,440 Oherwydd ei fod yn ymddangos bod chi bron cael tei rhwng y ddau. 444 00:21:31,440 --> 00:21:36,980 >> Felly, beth mae'n rhaid i chi ei wneud yw cymryd yn ganiataol annibyniaeth ymhlith y geiriau. 445 00:21:36,980 --> 00:21:41,210 Felly y bôn beth mae hynny'n ei olygu yw y Im 'jyst yn cyfrifo beth yw'r 446 00:21:41,210 --> 00:21:44,330 tebygolrwydd o weld "babi," beth yw y tebygolrwydd o weld "Yr wyf i," ac 447 00:21:44,330 --> 00:21:46,670 "Am", ac "ar," a "tân," i gyd ar wahân. 448 00:21:46,670 --> 00:21:48,670 Yna mi i'n lluosi pob un ohonynt. 449 00:21:48,670 --> 00:21:52,420 A dwi'n gweld beth yw'r tebygolrwydd o weld y ddedfryd gyfan. 450 00:21:52,420 --> 00:21:55,210 Yn gwneud synnwyr? 451 00:21:55,210 --> 00:22:00,270 >> Felly y bôn, os oes gennyf un gair, yr hyn yr wyf am ddod o hyd yw'r max Grŵp Diwygio Asesu, 452 00:22:00,270 --> 00:22:05,385 sy'n golygu, beth yw'r radd flaenaf sydd ar rhoi'r tebygolrwydd uchaf i mi? 453 00:22:05,385 --> 00:22:10,010 Felly beth yw'r dosbarth sy'n cael ei rhoi 'm' r tebygolrwydd uchaf ar gyfer 454 00:22:10,010 --> 00:22:11,940 tebygolrwydd o ddosbarth a roddir gair. 455 00:22:11,940 --> 00:22:17,610 Felly, yn yr achos hwn, Gaga a roddir "babi." Neu Katy rhoi "babi." Yn gwneud synnwyr? 456 00:22:17,610 --> 00:22:21,040 >> Ac yn union o Bayes, bod hafaliad yr wyf yn dangos, 457 00:22:21,040 --> 00:22:24,780 rydym yn creu ffracsiwn hwn. 458 00:22:24,780 --> 00:22:28,750 Yr unig beth yw eich bod yn gweld bod y tebygolrwydd y gair o ystyried y 459 00:22:28,750 --> 00:22:31,370 newidiadau dosbarth yn dibynnu ar y dosbarth, dde? 460 00:22:31,370 --> 00:22:34,260 Mae nifer y s "baban" fy mod wedi mewn Gaga yn wahanol i Katy. 461 00:22:34,260 --> 00:22:37,640 Y tebygolrwydd y dosbarth hefyd newidiadau oherwydd dim ond y rhif 462 00:22:37,640 --> 00:22:39,740 o ganeuon bob un ohonynt. 463 00:22:39,740 --> 00:22:43,980 >> Ond mae'r tebygolrwydd y gair ei hun yn mynd i fod yr un fath ar gyfer yr holl 464 00:22:43,980 --> 00:22:44,740 artistiaid, dde? 465 00:22:44,740 --> 00:22:47,150 Felly, y tebygolrwydd y gair yn yn unig, beth yw'r tebygolrwydd o 466 00:22:47,150 --> 00:22:49,820 gweld y gair yn y Saesneg? 467 00:22:49,820 --> 00:22:51,420 Felly, mae'n yr un fath ar gyfer pob un ohonynt. 468 00:22:51,420 --> 00:22:55,790 Felly, gan fod hyn yn gyson, gallwn yn unig gollwng hwn ac nid yn gofalu am y peth. 469 00:22:55,790 --> 00:23:00,230 Felly, bydd hyn yn mewn gwirionedd hafaliad rydym yn chwilio am. 470 00:23:00,230 --> 00:23:03,360 >> Ac os oes gennyf fwy nag un gair, rwy'n dal i fynd i gael y llaw 471 00:23:03,360 --> 00:23:04,610 tebygolrwydd yma. 472 00:23:04,610 --> 00:23:06,980 Yr unig beth yw fy mod i'n lluosi y tebygolrwydd o 473 00:23:06,980 --> 00:23:08,490 holl eiriau eraill. 474 00:23:08,490 --> 00:23:10,110 Felly, rwy'n lluosi pob un ohonynt. 475 00:23:10,110 --> 00:23:12,610 Yn gwneud synnwyr? 476 00:23:12,610 --> 00:23:18,440 Mae'n edrych yn rhyfedd ond yn y bôn yn golygu, cyfrifo cyn y dosbarth, a 477 00:23:18,440 --> 00:23:22,100 yna lluoswch gan y tebygolrwydd y bydd pob o'r geiriau fod yn y dosbarth. 478 00:23:22,100 --> 00:23:24,620 479 00:23:24,620 --> 00:23:29,150 >> A ydych yn gwybod bod y tebygolrwydd o gair a roddir dosbarth yn mynd i fod y 480 00:23:29,150 --> 00:23:34,520 nifer o weithiau yr ydych yn gweld y gair yn y dosbarth hwnnw, wedi'i rannu gan y nifer o 481 00:23:34,520 --> 00:23:37,020 geiriau sydd gennych yn y dosbarth yn gyffredinol. 482 00:23:37,020 --> 00:23:37,990 Yn gwneud synnwyr? 483 00:23:37,990 --> 00:23:41,680 Mae'n pa mor "baban" Roedd 2 dros nifer y geiriau sy'n 484 00:23:41,680 --> 00:23:43,020 Cefais yn y geiriau. 485 00:23:43,020 --> 00:23:45,130 Felly, dim ond pa mor aml. 486 00:23:45,130 --> 00:23:46,260 >> Ond mae un peth. 487 00:23:46,260 --> 00:23:51,250 Cofiwch sut yr wyf yn dangos bod y tebygolrwydd o "baban" lyrics cael eu 488 00:23:51,250 --> 00:23:56,350 o Katy Perry yn 0 unig oherwydd Katy Nid oedd gan Perry "babi" o gwbl? 489 00:23:56,350 --> 00:24:04,900 Ond mae'n swnio braidd yn llym i ddim ond dweud yn syml na all geiriau fod o 490 00:24:04,900 --> 00:24:10,040 artist dim ond oherwydd nad oes ganddynt y gair hwnnw yn benodol ar unrhyw adeg. 491 00:24:10,040 --> 00:24:13,330 >> Felly gallech ddweud, yn dda, os ydych yn Nid oes rhaid gair hwn, yr wyf i'n mynd i 492 00:24:13,330 --> 00:24:15,640 rhoi tebygolrwydd is i chi, ond Im 'jyst ddim yn mynd i 493 00:24:15,640 --> 00:24:17,420 rhoi 0 ar unwaith. 494 00:24:17,420 --> 00:24:21,040 Oherwydd efallai ei fod yn rhywbeth fel, "Tân, tân, tân, tân," sydd yn 495 00:24:21,040 --> 00:24:21,990 gwbl Katy Perry. 496 00:24:21,990 --> 00:24:26,060 Ac yna "babi," a 'i jyst yn mynd i 0 yn syth gan nad oedd un 497 00:24:26,060 --> 00:24:27,250 "Babi." 498 00:24:27,250 --> 00:24:31,440 >> Felly, yn y bôn yr hyn yr ydym yn ei wneud yn rhywbeth enw Laplace lyfnu. 499 00:24:31,440 --> 00:24:36,260 Ac mae hyn yn unig yn golygu fy mod yn rhoi rhywfaint o debygolrwydd hyd yn oed i'r geiriau 500 00:24:36,260 --> 00:24:37,850 nad ydynt yn bodoli. 501 00:24:37,850 --> 00:24:43,170 Felly, yr hyn yr wyf yn ei wneud yw bod pan rwy'n gyfrifo hyn, rwyf bob amser yn ychwanegu 1 i 502 00:24:43,170 --> 00:24:44,180 y rhifiadur. 503 00:24:44,180 --> 00:24:48,060 Felly hyd yn oed os nad yw'r gair yn bodoli, yn yr achos hwn, os yw hyn yn 0, rwy'n dal i 504 00:24:48,060 --> 00:24:51,250 cyfrifo hyn fel 1 dros y cyfanswm nifer y geiriau. 505 00:24:51,250 --> 00:24:55,060 Fel arall, yr wyf yn cael faint o eiriau Gennyf ac yr wyf yn ychwanegu 1. 506 00:24:55,060 --> 00:24:58,300 Felly, yr wyf i'n cyfrif ar gyfer y ddau achos. 507 00:24:58,300 --> 00:25:00,430 Yn gwneud synnwyr? 508 00:25:00,430 --> 00:25:03,060 >> Felly nawr gadewch i ni wneud rhywfaint o godio. 509 00:25:03,060 --> 00:25:06,440 Rydw i'n mynd i gael i wneud yn eithaf cyflym, ond dim ond bwysig eich bod yn 510 00:25:06,440 --> 00:25:08,600 guys yn deall y cysyniadau. 511 00:25:08,600 --> 00:25:13,450 Felly, yr hyn yr ydym yn ceisio ei wneud yn union yn cael ei weithredu hyn 512 00:25:13,450 --> 00:25:14,330 beth yr wyf newydd ei ddweud - 513 00:25:14,330 --> 00:25:19,110 Rwyf am i chi i roi geiriau o Lady Gaga a Katy Perry. 514 00:25:19,110 --> 00:25:22,980 Ac mae'r rhaglen yn mynd i fod yn gallu dweud os yw'r rhain geiriau newydd yn dod o Gaga 515 00:25:22,980 --> 00:25:24,170 neu Katy Perry. 516 00:25:24,170 --> 00:25:25,800 Yn gwneud synnwyr? 517 00:25:25,800 --> 00:25:27,530 OK. 518 00:25:27,530 --> 00:25:30,710 >> Felly, yr wyf wedi y rhaglen hon Dw i'n mynd i alw classify.py. 519 00:25:30,710 --> 00:25:31,970 Felly mae hyn yn Python. 520 00:25:31,970 --> 00:25:34,210 Mae'n iaith raglennu newydd. 521 00:25:34,210 --> 00:25:38,020 Mae'n debyg iawn mewn rhai ffyrdd o C a PHP. 522 00:25:38,020 --> 00:25:43,180 Mae'n debyg oherwydd os ydych am dysgu Python ar ôl wybod C, mae'n 523 00:25:43,180 --> 00:25:46,270 ddim wir bod llawer o her dim ond oherwydd Python yn llawer haws 524 00:25:46,270 --> 00:25:47,520 na C, yn gyntaf oll. 525 00:25:47,520 --> 00:25:49,370 Ac mae llawer o bethau eisoes gweithredu ar eich rhan. 526 00:25:49,370 --> 00:25:56,820 Felly, pa mor fel PHP ganddo swyddogaethau sy'n didoli rhestr, neu atodi rhywbeth 527 00:25:56,820 --> 00:25:58,780 i amrywiaeth, neu blah, blah, blah. 528 00:25:58,780 --> 00:26:00,690 Python Mae pob un o'r rheiny hefyd. 529 00:26:00,690 --> 00:26:05,960 >> Felly, Im 'jyst yn mynd i egluro yn gyflym sut y gallem wneud y dosbarthiad 530 00:26:05,960 --> 00:26:07,860 broblem i yma. 531 00:26:07,860 --> 00:26:13,230 Felly, gadewch i ni yn dweud bod yn yr achos hwn, yr wyf wedi geiriau o Gaga a Katy Perry. 532 00:26:13,230 --> 00:26:21,880 Y ffordd yr wyf wedi lyrics hynny yw bod y gair cyntaf o'r geiriau yn 533 00:26:21,880 --> 00:26:25,250 enw'r artist, a mae'r gweddill yn y geiriau. 534 00:26:25,250 --> 00:26:29,470 Felly, gadewch i ni ddweud bod gennyf y rhestr hon yn y mae'r un cyntaf yn geiriau gan Gaga. 535 00:26:29,470 --> 00:26:31,930 Felly, dyma fi ar y trywydd iawn. 536 00:26:31,930 --> 00:26:35,270 Ac mae'r un nesaf yw Katy, ac mae ganddi hefyd y geiriau. 537 00:26:35,270 --> 00:26:38,040 >> Felly, mae hyn yw sut yr ydych yn datgan newidyn yn Python. 538 00:26:38,040 --> 00:26:40,200 Nid oes rhaid i chi roi y math data. 539 00:26:40,200 --> 00:26:43,150 Rydych yn unig ysgrifennwch "geiriau," fath o hoffi yn PHP. 540 00:26:43,150 --> 00:26:44,890 Yn gwneud synnwyr? 541 00:26:44,890 --> 00:26:47,770 >> Felly, beth yw'r pethau sy'n rhaid i mi cyfrifo i fod yn gallu cyfrifo 542 00:26:47,770 --> 00:26:49,360 tebygolrwydd? 543 00:26:49,360 --> 00:26:55,110 Rhaid i mi gyfrifo "Priors" o bob un o'r gwahanol 544 00:26:55,110 --> 00:26:56,710 dosbarthiadau sydd gennyf. 545 00:26:56,710 --> 00:27:06,680 Rhaid i mi gyfrifo "posteriors," neu 'n bert lawer yr tebygolrwydd o 546 00:27:06,680 --> 00:27:12,150 bob un o'r geiriau gwahanol sy'n Gallaf ei gael ar gyfer pob artist. 547 00:27:12,150 --> 00:27:17,210 Hynny o fewn Gaga, er enghraifft, yr wyf i'n mynd i gael rhestr o sawl gwaith yr wyf yn gweld 548 00:27:17,210 --> 00:27:19,250 pob un o'r geiriau. 549 00:27:19,250 --> 00:27:20,760 Yn gwneud synnwyr? 550 00:27:20,760 --> 00:27:25,370 >> Ac yn olaf, Im 'jyst yn mynd i gael rhestr o'r enw "yn lle'r geiriau" sy'n cael ei dim ond yn mynd 551 00:27:25,370 --> 00:27:29,780 i gael faint o eiriau yr wyf yn gael ar gyfer pob artist. 552 00:27:29,780 --> 00:27:33,760 Felly, ar gyfer Gaga, er enghraifft, pan fyddaf yn edrych at y geiriau, yr oeddwn wedi, yr wyf yn meddwl, 24 553 00:27:33,760 --> 00:27:34,750 geiriau i gyd. 554 00:27:34,750 --> 00:27:38,970 Felly, y rhestr hon yn unig yn mynd i gael Gaga 24, a Katy rhif arall. 555 00:27:38,970 --> 00:27:40,130 Yn gwneud synnwyr? 556 00:27:40,130 --> 00:27:40,560 OK. 557 00:27:40,560 --> 00:27:42,530 >> Felly nawr, mewn gwirionedd, gadewch i ni mynd i'r codio. 558 00:27:42,530 --> 00:27:45,270 Felly, yn Python, gallwch mewn gwirionedd yn dychwelyd criw o wahanol 559 00:27:45,270 --> 00:27:46,630 pethau o swyddogaeth. 560 00:27:46,630 --> 00:27:50,810 Felly, yr wyf i'n mynd i greu swyddogaeth hon a elwir yn "amodol" sy'n mynd 561 00:27:50,810 --> 00:27:53,890 i ddychwelyd yr holl bethau hynny, y "Priors," y "tebygolrwydd," ac yn y 562 00:27:53,890 --> 00:28:05,690 "Eiriau." Felly "amodol," ac mae'n mynd i gael eu galw i mewn i "geiriau." 563 00:28:05,690 --> 00:28:11,510 >> Felly, yn awr yr wyf am i chi mewn gwirionedd ysgrifennu swyddogaeth hon. 564 00:28:11,510 --> 00:28:17,750 Felly, y ffordd y gallaf ysgrifennu hyn swyddogaeth Fi jyst diffinio hyn 565 00:28:17,750 --> 00:28:20,620 gweithredu gyda "def." Felly mi wnes "def amodol, "ac mae'n cymryd 566 00:28:20,620 --> 00:28:28,700 "Geiriau." A beth mae hyn yn mynd i wneud yw, yn gyntaf oll, yr wyf wedi fy Priors 567 00:28:28,700 --> 00:28:31,030 yr wyf am i gyfrifo. 568 00:28:31,030 --> 00:28:34,330 >> Felly, y ffordd y gallaf wneud hyn yw creu geiriadur yn Python, a oedd yn 569 00:28:34,330 --> 00:28:37,320 'n bert lawer yr un peth â hash bwrdd, neu ei fod yn debyg i ailadroddol 570 00:28:37,320 --> 00:28:40,480 amrywiaeth yn PHP. 571 00:28:40,480 --> 00:28:44,150 Mae hyn yn sut yr wyf yn datgan geiriadur. 572 00:28:44,150 --> 00:28:53,580 Ac yn y bôn beth mae hyn yn ei olygu yw y Priors o Gaga yw 0.5, er enghraifft, os 573 00:28:53,580 --> 00:28:57,200 50% o'r geiriau yn dod o Gaga, 50% yn dod o Katy. 574 00:28:57,200 --> 00:28:58,450 Yn gwneud synnwyr? 575 00:28:58,450 --> 00:29:00,680 576 00:29:00,680 --> 00:29:03,680 Felly, rhaid i mi chyfrif i maes sut i gyfrifo'r Priors. 577 00:29:03,680 --> 00:29:07,120 >> Y rhai nesaf y mae'n rhaid i mi ei wneud, hefyd, yw'r tebygolrwydd a'r geiriau. 578 00:29:07,120 --> 00:29:17,100 Felly, y tebygolrwydd o Gaga yw'r rhestr o'r holl tebygolrwydd yr wyf 579 00:29:17,100 --> 00:29:19,160 gael ar gyfer pob un o'r geiriau ar gyfer Gaga. 580 00:29:19,160 --> 00:29:23,880 Felly, os byddaf yn mynd i tebygolrwydd o Gaga "Babi," er enghraifft, bydd yn rhoi i mi 581 00:29:23,880 --> 00:29:28,750 rhywbeth fel 2 dros 24 yn yr achos hwnnw. 582 00:29:28,750 --> 00:29:30,070 Yn gwneud synnwyr? 583 00:29:30,070 --> 00:29:36,120 Felly, yr wyf yn mynd i "tebygolrwydd," mynd i'r Bwced "Gaga" sydd â rhestr o'r holl 584 00:29:36,120 --> 00:29:40,550 y geiriau Gaga, yna yr wyf yn mynd i "babi," ac yr wyf yn gweld y tebygolrwydd. 585 00:29:40,550 --> 00:29:45,940 >> Ac yn olaf yr wyf wedi hyn "Geiriau" geiriadur. 586 00:29:45,940 --> 00:29:53,620 Felly yma, "tebygolrwydd." Ac yna "Eiriau." Felly, os wyf yn gwneud "geiriau," "Gaga," 587 00:29:53,620 --> 00:29:58,330 beth sy'n mynd i ddigwydd yw ei fod yn mynd i roi i mi 24, gan ddweud fy mod 588 00:29:58,330 --> 00:30:01,990 24 Mae gair o fewn geiriau o Gaga. 589 00:30:01,990 --> 00:30:04,110 Yn gwneud synnwyr? 590 00:30:04,110 --> 00:30:07,070 Felly yma, "geiriau" yn hafal dah-dah-dah. 591 00:30:07,070 --> 00:30:07,620 OK 592 00:30:07,620 --> 00:30:12,210 >> Felly, yr hyn yr wyf i'n mynd i wneud yw fy mod i'n mynd i ailadrodd dros bob un o'r geiriau, felly 593 00:30:12,210 --> 00:30:14,490 pob un o'r llinynnau sy'n Yr wyf yn ei gael yn y rhestr. 594 00:30:14,490 --> 00:30:18,040 Ac yr wyf i'n mynd i gyfrifo pethau hynny gyfer pob un o'r ymgeiswyr. 595 00:30:18,040 --> 00:30:19,950 Yn gwneud synnwyr? 596 00:30:19,950 --> 00:30:21,700 Felly, rhaid i mi wneud i ddolen. 597 00:30:21,700 --> 00:30:26,300 >> Felly, yn Python hyn y gallaf ei wneud yw "ar gyfer llinell mewn geiriau. "Mae'r un peth â 598 00:30:26,300 --> 00:30:28,000 "Ar gyfer pob" datganiad yn PHP. 599 00:30:28,000 --> 00:30:33,420 Cofiwch sut os oedd PHP gallwn dweud "ar gyfer pob geiriau fel 600 00:30:33,420 --> 00:30:35,220 lein. "Yn gwneud synnwyr? 601 00:30:35,220 --> 00:30:38,900 Felly rwy'n cymryd pob un o'r llinellau, yn yr achos, llinyn hwn a'r nesaf 602 00:30:38,900 --> 00:30:44,540 llinyn felly ar gyfer pob un o'r llinellau hyn yr wyf i'n mynd i'w wneud yn gyntaf, dw i'n mynd i 603 00:30:44,540 --> 00:30:49,150 rhannu y llinell hon yn rhestr o geiriau wedi eu gwahanu gan fylchau. 604 00:30:49,150 --> 00:30:53,730 >> Felly, y peth cŵl am Python yw bod fe allech chi jyst Google fel "sut y gallaf 605 00:30:53,730 --> 00:30:58,220 rhannu llinyn mewn geiriau? "Ac mae'n mynd i ddweud wrthych sut i wneud hynny. 606 00:30:58,220 --> 00:31:04,890 A'r ffordd i wneud hynny, dim ond "llinell = Line.split () "ac yn y bôn 607 00:31:04,890 --> 00:31:08,640 mynd i roi rhestr gyda chi pob un o'r geiriau yma. 608 00:31:08,640 --> 00:31:09,620 Yn gwneud synnwyr? 609 00:31:09,620 --> 00:31:15,870 Felly nawr fy mod yn gwneud yr wyf am ei wybod pwy yw'r canwr y gân. 610 00:31:15,870 --> 00:31:20,130 Ac i wneud hynny dim ond rhaid i mi gael y elfen gyntaf y rhesi, dde? 611 00:31:20,130 --> 00:31:26,390 Felly, gallaf ddweud fy mod "canwr = Linell (0) "Yn gwneud synnwyr? 612 00:31:26,390 --> 00:31:32,010 >> Ac yna yr hyn sydd angen i mi ei wneud yw, yn gyntaf cyfan, dw i'n mynd i ddiweddaru faint o 613 00:31:32,010 --> 00:31:36,130 geiriau gennyf dan "Gaga." felly Im 'jyst mynd i gyfrifo faint o eiriau yr wyf yn 614 00:31:36,130 --> 00:31:38,690 gael yn y rhestr hon, dde? 615 00:31:38,690 --> 00:31:41,910 Oherwydd bod hyn yn faint o eiriau gen i yn y geiriau a Im 'jyst yn mynd i 616 00:31:41,910 --> 00:31:44,120 ychwanegu at y "Gaga" arae. 617 00:31:44,120 --> 00:31:47,090 A yw hynny'n gwneud synnwyr? 618 00:31:47,090 --> 00:31:49,010 Nid ydynt yn canolbwyntio gormod ar y gystrawen. 619 00:31:49,010 --> 00:31:50,430 Feddwl mwy am y cysyniadau. 620 00:31:50,430 --> 00:31:52,400 Bod yn y rhan fwyaf pwysig. 621 00:31:52,400 --> 00:31:52,720 OK. 622 00:31:52,720 --> 00:32:00,260 >> Felly, yr hyn y gallaf ei wneud yw os "Gaga" yn eisoes yn y rhestr, felly "os canwr mewn 623 00:32:00,260 --> 00:32:03,190 geiriau "sy'n golygu fy mod i eisoes gael geiriau gan Gaga. 624 00:32:03,190 --> 00:32:06,640 Fi jyst eisiau ychwanegu i'r ychwanegol geiriau i hynny. 625 00:32:06,640 --> 00:32:15,810 Felly, yr hyn yr wyf yn ei wneud yw "eiriau (canwr) + = Len (llinell) - 1 ". 626 00:32:15,810 --> 00:32:18,250 Ac yna y gallaf wneud y hyd y llinell. 627 00:32:18,250 --> 00:32:21,860 Felly sut llawer o elfennau yr wyf yn gael yn y rhesi. 628 00:32:21,860 --> 00:32:27,060 Ac mae'n rhaid i mi ei wneud minws 1 dim ond oherwydd elfen gyntaf y rhesi yn unig 629 00:32:27,060 --> 00:32:29,180 Nid yw yn gantores ac mae'r rheini'n geiriau. 630 00:32:29,180 --> 00:32:31,420 Yn gwneud synnwyr? 631 00:32:31,420 --> 00:32:32,780 OK. 632 00:32:32,780 --> 00:32:35,820 >> "Else," mae'n golygu fy mod am i mewn gwirionedd mewnosoder Gaga ar y rhestr. 633 00:32:35,820 --> 00:32:45,990 Felly, Fi jyst yn ei wneud "eiriau (canwr) = Len (llinell) - 1, "mae'n ddrwg gennyf. 634 00:32:45,990 --> 00:32:49,200 Felly, yr unig wahaniaeth rhwng y ddau llinellau yw bod hyn yn un, nid yw'n 635 00:32:49,200 --> 00:32:51,080 bodoli eto, felly Im 'jyst ymgychwyn ei. 636 00:32:51,080 --> 00:32:53,820 Mae hyn yn un mewn gwirionedd rwy'n adio. 637 00:32:53,820 --> 00:32:55,570 OK. 638 00:32:55,570 --> 00:32:59,480 Felly, roedd hyn yn ychwanegu at eiriau. 639 00:32:59,480 --> 00:33:03,040 >> Nawr rwyf am i ychwanegu at y Priors. 640 00:33:03,040 --> 00:33:05,480 Felly, sut ydw i'n gyfrifo Priors? 641 00:33:05,480 --> 00:33:11,580 Gall y Priors yn cael ei gyfrifo gan faint o weithiau. 642 00:33:11,580 --> 00:33:15,340 Felly, faint o weithiau yr ydych yn gweld y canwr ymhlith pob un o'r cantorion yr ydych 643 00:33:15,340 --> 00:33:16,380 gael, dde? 644 00:33:16,380 --> 00:33:18,810 Felly, ar gyfer Gaga a Katy Perry, yn yr achos hwn, yr wyf yn gweld Gaga 645 00:33:18,810 --> 00:33:20,570 unwaith, Katy Perry unwaith. 646 00:33:20,570 --> 00:33:23,320 >> Felly, yn y bôn y Priors ar gyfer Gaga ac ar gyfer Katy Perry byddai 647 00:33:23,320 --> 00:33:24,390 yn unig fod yn un, dde? 648 00:33:24,390 --> 00:33:26,500 Rydych yn unig faint o weithiau Rwy'n gweld yr artist. 649 00:33:26,500 --> 00:33:28,740 Felly, mae hyn yn hawdd iawn i'w gyfrifo. 650 00:33:28,740 --> 00:33:34,100 Gallaf dim ond rhywbeth tebyg fel fel "os canwr mewn Priors, "Im 'jyst yn mynd 651 00:33:34,100 --> 00:33:38,970 i ychwanegu 1 at eu blwch Priors. 652 00:33:38,970 --> 00:33:51,000 Felly, "Priors (canu)" + = 1 "ac yna" arall " Rydw i'n mynd i wneud "Priors (canwr) 653 00:33:51,000 --> 00:33:55,000 = 1. "Yn gwneud synnwyr? 654 00:33:55,000 --> 00:34:00,080 >> Felly, os nad yw'n bodoli Fi jyst rhoi fel 1, fel arall, Fi jyst ychwanegu 1. 655 00:34:00,080 --> 00:34:11,280 Iawn, felly erbyn hyn i gyd sydd gennyf ar ôl i wneud hefyd yn cael ei ychwanegu pob un o'r geiriau i'r 656 00:34:11,280 --> 00:34:12,290 tebygolrwydd. 657 00:34:12,290 --> 00:34:14,889 Felly, rhaid i mi gyfrif faint o weithiau Rwy'n gweld pob un o'r geiriau. 658 00:34:14,889 --> 00:34:18,780 Felly, yr wyf yn rhaid gwneud rhywbeth arall ar gyfer dolen yn y llinell. 659 00:34:18,780 --> 00:34:25,190 >> Felly peth cyntaf i mi i'n mynd i wneud yw gwirio os oes gan y canwr yn 660 00:34:25,190 --> 00:34:26,969 tebygolrwydd amrywiaeth. 661 00:34:26,969 --> 00:34:31,739 Felly, yr wyf i'n gwirio os nad yw'r canwr yn cael amrywiaeth tebygolrwydd, Im 'jyst 662 00:34:31,739 --> 00:34:34,480 mynd i ymgychwyn un ar eu cyfer. 663 00:34:34,480 --> 00:34:36,400 Nid yw'n hyd yn oed amrywiaeth, mae'n ddrwg gennyf, mae'n geiriadur. 664 00:34:36,400 --> 00:34:43,080 Felly, y tebygolrwydd o canwr yn mynd i fod yn geiriadur agored, felly rwy'n 665 00:34:43,080 --> 00:34:45,830 dim ond ymgychwyn geiriadur ar ei gyfer. 666 00:34:45,830 --> 00:34:46,820 OK? 667 00:34:46,820 --> 00:34:58,330 >> Ac yn awr y gallaf ei wneud mewn gwirionedd yn ar gyfer dolen i gyfrifo pob un o'r geiriau ' 668 00:34:58,330 --> 00:35:00,604 tebygolrwydd. 669 00:35:00,604 --> 00:35:01,540 OK. 670 00:35:01,540 --> 00:35:04,160 Felly, beth y gallaf ei wneud yw i ddolen. 671 00:35:04,160 --> 00:35:06,590 Felly, Im 'jyst yn mynd i ailadrodd dros y rhesi. 672 00:35:06,590 --> 00:35:15,320 Felly, y ffordd y gallaf ei wneud hynny yn Python yw "ar gyfer i mewn amrediad." O 1 673 00:35:15,320 --> 00:35:19,200 oherwydd yr wyf am ddechrau yn yr ail elfen oherwydd yr un cyntaf yw'r 674 00:35:19,200 --> 00:35:20,260 enw'r canwr. 675 00:35:20,260 --> 00:35:24,990 Felly, o un hyd at y hyd y llinell. 676 00:35:24,990 --> 00:35:29,760 A phan wyf yn amrywio mewn gwirionedd yn mynd o fel yma o 1 i Len o'r 677 00:35:29,760 --> 00:35:30,740 minws llinell 1. 678 00:35:30,740 --> 00:35:33,810 Felly, mae eisoes yn gwneud y peth o wneud n minws 1 ar gyfer araeau sydd yn iawn 679 00:35:33,810 --> 00:35:35,500 cyfleus. 680 00:35:35,500 --> 00:35:37,850 Yn gwneud synnwyr? 681 00:35:37,850 --> 00:35:42,770 >> Felly, ar gyfer pob un o'r rhain, yr hyn yr wyf i'n mynd i wneud yw, yn union fel yn y llall, 682 00:35:42,770 --> 00:35:50,320 Rydw i'n mynd i wirio a yw'r gair yn y safle yn y llinell eisoes yn 683 00:35:50,320 --> 00:35:51,570 tebygolrwydd. 684 00:35:51,570 --> 00:35:53,400 685 00:35:53,400 --> 00:35:57,260 Ac yna fel y dywedais yma, tebygolrwydd eiriau, fel yn yr wyf yn rhoi 686 00:35:57,260 --> 00:35:58,400 "Tebygolrwyddau (cantores)". 687 00:35:58,400 --> 00:35:59,390 Felly, enw'r canwr. 688 00:35:59,390 --> 00:36:03,450 Felly, os mae eisoes yn "Probabilit (cantores)", mae'n golygu fy mod yn 689 00:36:03,450 --> 00:36:11,960 am ychwanegu 1 ato, felly dw i'n mynd i wneud "tebygolrwyddau (cantores)", a 690 00:36:11,960 --> 00:36:14,100 Gelwir gair yn "llinell (i)". 691 00:36:14,100 --> 00:36:22,630 Rydw i'n mynd i ychwanegu 1 a "arall" Im 'jyst yn mynd i ymgychwyn i 1. 692 00:36:22,630 --> 00:36:23,880 "Llinell (i)". 693 00:36:23,880 --> 00:36:26,920 694 00:36:26,920 --> 00:36:28,420 Yn gwneud synnwyr? 695 00:36:28,420 --> 00:36:30,180 >> Felly, yr wyf yn cyfrifo pob un o'r arrays. 696 00:36:30,180 --> 00:36:36,580 Felly, erbyn hyn i gyd sydd rhaid i mi ei wneud ar gyfer yr un yma yn unig "yn dychwelyd Priors, 697 00:36:36,580 --> 00:36:43,230 tebygolrwydd a geiriau. "Gadewch i ni weld os oes unrhyw, OK. 698 00:36:43,230 --> 00:36:45,690 Mae'n ymddangos popeth yn gweithio hyd yn hyn. 699 00:36:45,690 --> 00:36:46,900 Felly, mae hynny'n gwneud synnwyr? 700 00:36:46,900 --> 00:36:47,750 Mewn rhyw ffordd? 701 00:36:47,750 --> 00:36:49,280 OK. 702 00:36:49,280 --> 00:36:51,980 Felly, yn awr yr wyf wedi holl tebygolrwydd. 703 00:36:51,980 --> 00:36:55,100 Felly, yn awr yr unig beth yr wyf wedi gadael yn unig i gael y peth y 704 00:36:55,100 --> 00:36:58,650 cyfrifo y cynnyrch yr holl tebygolrwydd pan fyddaf yn cael y geiriau. 705 00:36:58,650 --> 00:37:06,270 >> Felly, gadewch i ni ddweud yr wyf am ei alw nawr swyddogaeth hon "dosbarthu ()" a'r 706 00:37:06,270 --> 00:37:08,880 peth swyddogaeth honno yn cymryd yn unig yw dadl. 707 00:37:08,880 --> 00:37:13,170 Lets 'ddeud "Baby, yr wyf ar dân" ac mae'n mynd i chyfrif i maes beth yw'r 708 00:37:13,170 --> 00:37:14,490 tebygolrwydd bod hyn yn Gaga? 709 00:37:14,490 --> 00:37:16,405 Beth yw'r tebygolrwydd bod hyn yn Katie? 710 00:37:16,405 --> 00:37:19,690 Swnio'n dda? 711 00:37:19,690 --> 00:37:25,750 Felly, Im 'jyst yn mynd i gael i greu swyddogaeth newydd o'r enw "dosbarthu ()" a 712 00:37:25,750 --> 00:37:29,180 mae'n mynd i gymryd peth geiriau hefyd. 713 00:37:29,180 --> 00:37:31,790 714 00:37:31,790 --> 00:37:36,160 Ac ar wahân i'r geiriau yr wyf hefyd yn rhaid anfon y Priors, y 715 00:37:36,160 --> 00:37:37,700 tebygolrwydd a'r geiriau. 716 00:37:37,700 --> 00:37:44,000 Felly, yr wyf i'n mynd i anfon geiriau, Priors, tebygolrwydd, geiriau. 717 00:37:44,000 --> 00:37:51,840 >> Felly, mae hyn yn cymryd geiriau, Priors, tebygolrwydd, geiriau. 718 00:37:51,840 --> 00:37:53,530 Felly, beth mae'n ei wneud? 719 00:37:53,530 --> 00:37:57,180 Yn y bôn yn mynd i fynd drwy'r holl yr ymgeiswyr posibl y byddwch yn 720 00:37:57,180 --> 00:37:58,510 gael fel cantores. 721 00:37:58,510 --> 00:37:59,425 A lle yn ymgeiswyr hynny? 722 00:37:59,425 --> 00:38:01,020 Maen nhw'n Yn y Priors, dde? 723 00:38:01,020 --> 00:38:02,710 Felly, yr wyf yn cael yr holl o'r rhai yno. 724 00:38:02,710 --> 00:38:07,870 Felly, yr wyf i'n mynd i gael geiriadur o'r holl ymgeiswyr posibl. 725 00:38:07,870 --> 00:38:14,220 Ac yna ar gyfer pob ymgeisydd yn y Priors, felly mae'n golygu ei bod yn mynd i 726 00:38:14,220 --> 00:38:17,740 fod Gaga, Katie os ydw i wedi mwy byddai'n fwy. 727 00:38:17,740 --> 00:38:20,410 Rydw i'n mynd i ddechrau cyfrifo tebygolrwydd hwn. 728 00:38:20,410 --> 00:38:28,310 Mae'r tebygolrwydd fel y gwelsom yn y PowerPoint yw'r weithiau cyn y 729 00:38:28,310 --> 00:38:30,800 gynnyrch o bob un o'r tebygolrwydd eraill. 730 00:38:30,800 --> 00:38:32,520 >> Felly, yr wyf yn gallu gwneud yr un peth yma. 731 00:38:32,520 --> 00:38:36,330 Gallaf ei wneud tebygolrwydd yn ddechrau dim ond y ymlaen llaw. 732 00:38:36,330 --> 00:38:40,340 Felly Priors yr ymgeisydd. 733 00:38:40,340 --> 00:38:40,870 Iawn? 734 00:38:40,870 --> 00:38:45,360 Ac yn awr mae'n rhaid i mi ailadrodd dros yr holl geiriau sydd gennyf yn y geiriau i fod yn 735 00:38:45,360 --> 00:38:48,820 gallu ychwanegu y tebygolrwydd gyfer pob un ohonynt, OK? 736 00:38:48,820 --> 00:38:57,900 Felly, "am air mewn geiriau" yr hyn yr wyf i'n mynd ei wneud yw, os yw'r gair yn 737 00:38:57,900 --> 00:39:01,640 "Tebygolrwyddau (ymgeisydd)", a yn golygu ei fod yn air fod y 738 00:39:01,640 --> 00:39:03,640 ymgeisydd yn eu geiriau - 739 00:39:03,640 --> 00:39:05,940 er enghraifft, "baban" ar gyfer Gaga - 740 00:39:05,940 --> 00:39:11,710 yr hyn yr wyf i'n mynd i wneud yw bod y tebygolrwydd yn mynd i gael ei lluosi 741 00:39:11,710 --> 00:39:22,420 erbyn 1 yn ogystal â'r tebygolrwydd o yr ymgeisydd ar gyfer y gair hwnnw. 742 00:39:22,420 --> 00:39:25,710 Ac fe'i gelwir yn "gair". 743 00:39:25,710 --> 00:39:32,440 Mae hyn wedi'i rannu gan nifer y geiriau sydd gennyf ar gyfer yr ymgeisydd hwnnw. 744 00:39:32,440 --> 00:39:37,450 Cyfanswm y nifer o eiriau sydd gennyf ar gyfer y canwr a Im 'yn edrych ar. 745 00:39:37,450 --> 00:39:40,290 >> "Else." mae'n golygu ei fod yn gair newydd felly byddai'n fod yn debyg, er enghraifft 746 00:39:40,290 --> 00:39:41,860 "Tân" ar gyfer Lady Gaga. 747 00:39:41,860 --> 00:39:45,760 Felly, Fi jyst eisiau ei wneud 1 dros "Gair (ymgeisydd)". 748 00:39:45,760 --> 00:39:47,710 Felly, nid wyf am roi hyn y tymor yma. 749 00:39:47,710 --> 00:39:50,010 >> Felly, mae'n mynd i fod yn y bôn copïo a gludo hyn. 750 00:39:50,010 --> 00:39:54,380 751 00:39:54,380 --> 00:39:56,000 Ond dw i'n mynd i ddileu'r rhan hon. 752 00:39:56,000 --> 00:39:57,610 Felly, 'i' jyst yn mynd i fod yn 1 dros hynny. 753 00:39:57,610 --> 00:40:00,900 754 00:40:00,900 --> 00:40:02,150 Swnio'n dda? 755 00:40:02,150 --> 00:40:03,980 756 00:40:03,980 --> 00:40:09,700 Ac yn awr ar y diwedd, Im 'jyst yn mynd i argraffu enw'r ymgeisydd a'r 757 00:40:09,700 --> 00:40:15,750 y tebygolrwydd sydd gennych o cael y S ar eu geiriau. 758 00:40:15,750 --> 00:40:16,200 Yn gwneud synnwyr? 759 00:40:16,200 --> 00:40:18,390 Ac yr wyf yn ei wneud mewn gwirionedd hyd yn oed yn angen geiriadur hwn. 760 00:40:18,390 --> 00:40:19,510 Yn gwneud synnwyr? 761 00:40:19,510 --> 00:40:21,810 >> Felly, gadewch i ni weld os yw hyn yn gweithio mewn gwirionedd. 762 00:40:21,810 --> 00:40:24,880 Felly os wyf yn rhedeg y, nid oedd yn gweithio. 763 00:40:24,880 --> 00:40:26,130 Arhoswch un eiliad. 764 00:40:26,130 --> 00:40:28,870 765 00:40:28,870 --> 00:40:31,720 "Geiriau (ymgeisydd)", "eiriau (ymgeisydd)", dyna 766 00:40:31,720 --> 00:40:33,750 enw'r y rhesi. 767 00:40:33,750 --> 00:40:41,435 OK Felly, mae'n dweud mae rhywfaint o bug ar gyfer yr ymgeisydd mewn Priors. 768 00:40:41,435 --> 00:40:46,300 769 00:40:46,300 --> 00:40:48,760 Gadewch i mi ymlacio ychydig. 770 00:40:48,760 --> 00:40:50,360 OK. 771 00:40:50,360 --> 00:40:51,305 Gadewch i ni geisio. 772 00:40:51,305 --> 00:40:51,720 OK. 773 00:40:51,720 --> 00:40:58,710 >> Felly, mae'n rhoi Katy Perry wedi hyn tebygolrwydd o hyn weithiau 10 i'r 774 00:40:58,710 --> 00:41:02,200 llai blwch 7, ac Gaga wedi hyn gwaith 10 i'r minws 6. 775 00:41:02,200 --> 00:41:05,610 Felly byddwch yn gweld ei fod yn dangos bod Gaga Mae tebygolrwydd uwch. 776 00:41:05,610 --> 00:41:09,260 Felly "Baby, dwi ar Tân" yn cael ei yn ôl pob tebyg cân Gaga. 777 00:41:09,260 --> 00:41:10,580 Yn gwneud synnwyr? 778 00:41:10,580 --> 00:41:12,030 Felly mae hyn yn hyn a wnaethom. 779 00:41:12,030 --> 00:41:16,010 >> Mae'r côd hwn yn mynd i gael ei bostio ar-lein, er mwyn i chi guys edrych arni. 780 00:41:16,010 --> 00:41:20,720 Efallai defnyddio rhai ohono ar gyfer os ydych am wneud prosiect neu rywbeth tebyg. 781 00:41:20,720 --> 00:41:22,150 OK. 782 00:41:22,150 --> 00:41:25,930 Roedd hyn yn unig i ddangos pa cyfrifiadol 783 00:41:25,930 --> 00:41:27,230 cod ieithyddiaeth yn edrych fel. 784 00:41:27,230 --> 00:41:33,040 Ond yn awr gadewch i ni fynd i fwy stwff lefel uchel. 785 00:41:33,040 --> 00:41:33,340 OK. 786 00:41:33,340 --> 00:41:35,150 >> Felly, y problemau eraill yr wyf yn yn siarad am - 787 00:41:35,150 --> 00:41:37,550 y broblem segmentu yw'r cyntaf ohonynt. 788 00:41:37,550 --> 00:41:40,820 Felly, rydych wedi yma Siapan. 789 00:41:40,820 --> 00:41:43,420 Ac yna byddwch yn gweld bod nad oes yna fylchau. 790 00:41:43,420 --> 00:41:49,110 Felly, mae hyn yn y bôn yn golygu ei bod yn ben y cadeirydd, dde? 791 00:41:49,110 --> 00:41:50,550 Ydych yn siarad Siapan? 792 00:41:50,550 --> 00:41:52,840 Mae'n ben y cadeirydd, dde? 793 00:41:52,840 --> 00:41:54,480 >> MYFYRIWR: Nid wyf yn gwybod beth y kanji dros oes. 794 00:41:54,480 --> 00:41:57,010 >> LUCAS Freitas: Mae'n [SIARAD SIAPANEAIDD] 795 00:41:57,010 --> 00:41:57,950 OK. 796 00:41:57,950 --> 00:42:00,960 Felly, yn y bôn yn golygu cadeirydd top. 797 00:42:00,960 --> 00:42:03,620 Felly, os oedd gennych i roi lle byddai yma. 798 00:42:03,620 --> 00:42:05,970 Ac yna mae gennych [? Ueda-san. ?] 799 00:42:05,970 --> 00:42:09,040 Pa yn y bôn yn golygu Mr Ueda. 800 00:42:09,040 --> 00:42:13,180 A ydych yn gweld bod "Ueda" a bod gennych gofod ac yna "san." Felly, byddwch yn gweld bod 801 00:42:13,180 --> 00:42:15,470 yma i chi "Ue" yn debyg ei ben ei hun. 802 00:42:15,470 --> 00:42:17,750 Ac yma mae ganddo gymeriad drws nesaf iddo. 803 00:42:17,750 --> 00:42:21,720 >> Felly, nid yw'n debyg yn yr ieithoedd hynny cymeriadau sy'n golygu gair ei er mwyn i chi 804 00:42:21,720 --> 00:42:23,980 dim ond yn rhoi llawer o leoedd. 805 00:42:23,980 --> 00:42:25,500 Cymeriadau yn perthyn i'w gilydd. 806 00:42:25,500 --> 00:42:28,680 A gallant fod gyda'i gilydd fel dau, tri, un. 807 00:42:28,680 --> 00:42:34,520 Felly, rhaid i chi mewn gwirionedd yn i greu rhyw fath o ffordd o roi lleoedd hynny. 808 00:42:34,520 --> 00:42:38,850 >> Ac mae y peth hyn yw bod pryd bynnag y byddwch yn cael data o ieithoedd Asiaidd hynny, 809 00:42:38,850 --> 00:42:40,580 popeth yn dod unsegmented. 810 00:42:40,580 --> 00:42:45,940 Oherwydd nad oes neb sy'n ysgrifennu Siapan neu Tseiniaidd yn ysgrifennu gyda bylchau. 811 00:42:45,940 --> 00:42:48,200 Pryd bynnag y byddwch yn ysgrifennu Tseiniaidd, Siapan 'ch jyst ysgrifennu popeth 812 00:42:48,200 --> 00:42:48,710 heb unrhyw fylchau. 813 00:42:48,710 --> 00:42:52,060 Nid yw hyd yn oed yn gwneud synnwyr i roi lleoedd. 814 00:42:52,060 --> 00:42:57,960 Felly, yna pan fyddwch yn cael data o, mae rhai Iaith ddwyrain Asia, os ydych am i 815 00:42:57,960 --> 00:43:00,760 mewn gwirionedd yn gwneud rhywbeth gyda'r rhaid i chi segment gyntaf. 816 00:43:00,760 --> 00:43:05,130 >> Meddyliwch am wneud yr enghraifft o y geiriau heb fylchau. 817 00:43:05,130 --> 00:43:07,950 Felly, yr unig lyrics sydd gennych Bydd brawddegau, dde? 818 00:43:07,950 --> 00:43:09,470 Gwahannu gan atalnodau. 819 00:43:09,470 --> 00:43:13,930 Ond yna gorfod dim ond y ddedfryd yn ddim wir yn helpu ar roi gwybodaeth 820 00:43:13,930 --> 00:43:17,760 pwy geiriau hynny gan. 821 00:43:17,760 --> 00:43:18,120 Iawn? 822 00:43:18,120 --> 00:43:20,010 Felly, dylech rhoi lleoedd yn gyntaf. 823 00:43:20,010 --> 00:43:21,990 Felly sut allwch chi wneud hynny? 824 00:43:21,990 --> 00:43:24,920 >> Felly, yna daw y syniad o iaith model sy'n rhywbeth mewn gwirionedd 825 00:43:24,920 --> 00:43:26,870 bwysig ar gyfer cyfrifiannu ieithyddiaeth. 826 00:43:26,870 --> 00:43:32,790 Felly, model iaith yn y bôn yn tabl o tebygolrwydd sy'n dangos 827 00:43:32,790 --> 00:43:36,260 yn gyntaf oll beth yw'r tebygolrwydd o gael y gair mewn iaith? 828 00:43:36,260 --> 00:43:39,590 Felly, yn dangos pa mor aml y gair yn. 829 00:43:39,590 --> 00:43:43,130 Ac yna hefyd yn dangos y berthynas rhwng y geiriau mewn brawddeg. 830 00:43:43,130 --> 00:43:51,500 >> Felly, y prif syniad yw, os bydd dieithryn yn dod i chi a dweud brawddeg i 831 00:43:51,500 --> 00:43:55,600 chi, beth yw'r tebygolrwydd y, ar gyfer enghraifft, "mae hyn yn fy chwaer [? GTF"?] 832 00:43:55,600 --> 00:43:57,480 oedd y ddedfryd fod y person wedi'i ddweud? 833 00:43:57,480 --> 00:44:00,380 Felly, yn amlwg mae rhai brawddegau yn yn fwy cyffredin nag eraill. 834 00:44:00,380 --> 00:44:04,450 Er enghraifft, "Bore da," neu "da nos, "neu" hey yno, "yn llawer mwy 835 00:44:04,450 --> 00:44:08,260 cyffredin na'r rhan fwyaf brawddegau bod gennym Saesneg. 836 00:44:08,260 --> 00:44:11,060 Felly pam mae dedfrydau hynny amlach? 837 00:44:11,060 --> 00:44:14,060 >> Yn gyntaf oll, mae'n oherwydd eich bod wedi geiriau sy'n fwy aml. 838 00:44:14,060 --> 00:44:20,180 Felly, er enghraifft, os ydych yn ei ddweud, mae'r ci mawr, ac mae'r ci yn enfawr, byddwch yn 839 00:44:20,180 --> 00:44:23,880 Fel arfer, yn ôl pob tebyg yn clywed y ci yn fawr yn fwy aml oherwydd "mawr" yn fwy 840 00:44:23,880 --> 00:44:27,260 aml yn Saesneg na "enfawr." Felly, un o'r 841 00:44:27,260 --> 00:44:30,100 pethau yw'r amlder geiriau. 842 00:44:30,100 --> 00:44:34,490 >> Yr ail beth sydd mewn gwirionedd bwysig yw dim ond y 843 00:44:34,490 --> 00:44:35,490 trefn y geiriau. 844 00:44:35,490 --> 00:44:39,500 Felly, mae'n gyffredin i ddweud "mae'r gath yn y tu mewn i'r bocs. "ond nad ydych yn gwneud fel arfer 845 00:44:39,500 --> 00:44:44,250 gweld yn "Y blwch tu mewn yn y gath." felly byddwch yn gweld bod rhywfaint o bwysigrwydd 846 00:44:44,250 --> 00:44:46,030 yn y drefn y geiriau. 847 00:44:46,030 --> 00:44:50,160 Nid ydych yn gallu dweud bod dau y rhai brawddegau yn cael yr un tebygolrwydd 848 00:44:50,160 --> 00:44:53,010 dim ond oherwydd eu bod yn cael yr un geiriau. 849 00:44:53,010 --> 00:44:55,550 Mewn gwirionedd yn rhaid i chi ofalu am orchymyn yn ogystal. 850 00:44:55,550 --> 00:44:57,650 Yn gwneud synnwyr? 851 00:44:57,650 --> 00:44:59,490 >> Felly, beth ydym yn ei wneud? 852 00:44:59,490 --> 00:45:01,550 Felly, beth y gallwn geisio cael chi? 853 00:45:01,550 --> 00:45:04,400 Im 'yn ceisio i fynd â chi yr hyn yr ydym ffoniwch y modelau n-gram. 854 00:45:04,400 --> 00:45:09,095 Felly modelau n-gram bôn cymryd yn ganiataol , ar gyfer pob gair 855 00:45:09,095 --> 00:45:10,960 gennych mewn brawddeg. 856 00:45:10,960 --> 00:45:15,020 Mae'n y tebygolrwydd o gael y gair mae yn dibynnu nid yn unig ar y 857 00:45:15,020 --> 00:45:18,395 amlder y gair yn yr iaith, ond hefyd ar y geiriau sy'n 858 00:45:18,395 --> 00:45:19,860 yn ei amgylchynu. 859 00:45:19,860 --> 00:45:25,810 >> Felly, er enghraifft, fel arfer pan fyddwch yn gweld rhywbeth fel ar neu ar chi yn 860 00:45:25,810 --> 00:45:28,040 na thebyg yn mynd i weld enw ar ei ôl, dde? 861 00:45:28,040 --> 00:45:31,750 Oherwydd pan fyddwch yn cael arddodiad Fel arfer, mae'n cymryd enw ar ei ôl. 862 00:45:31,750 --> 00:45:35,540 Neu os oes gennych berf sy'n transitive Fel arfer, rydych yn mynd i 863 00:45:35,540 --> 00:45:36,630 cael ymadrodd enwol. 864 00:45:36,630 --> 00:45:38,780 Felly, mae'n mynd i gael enw rhywle o'i amgylch. 865 00:45:38,780 --> 00:45:44,950 >> Felly, yn y bôn, yr hyn y mae'n ei wneud yw ei fod yn yn ystyried y tebygolrwydd o gael 866 00:45:44,950 --> 00:45:47,960 geiriau nesaf at ei gilydd, pan eich bod yn cyfrifo'r 867 00:45:47,960 --> 00:45:49,050 tebygolrwydd o ddedfryd. 868 00:45:49,050 --> 00:45:50,960 A dyna beth iaith model yn y bôn. 869 00:45:50,960 --> 00:45:54,620 Dim ond dweud beth yw'r tebygolrwydd o gael benodol 870 00:45:54,620 --> 00:45:57,120 dedfryd mewn iaith? 871 00:45:57,120 --> 00:45:59,110 Felly pam yw bod yn ddefnyddiol, yn y bôn? 872 00:45:59,110 --> 00:46:02,390 Ac yn gyntaf oll yr hyn sy'n model n-gram, yna? 873 00:46:02,390 --> 00:46:08,850 >> Felly model n-gram yn golygu bod pob gair yn dibynnu ar y 874 00:46:08,850 --> 00:46:12,700 minws N nesaf 1 o eiriau. 875 00:46:12,700 --> 00:46:18,150 Felly, yn y bôn, mae'n golygu bod os wyf yn edrych, er enghraifft, yn y TF CS50 pan 876 00:46:18,150 --> 00:46:21,500 Dw i'n cyfrifo tebygolrwydd o y ddedfryd, byddwch yn fel "y 877 00:46:21,500 --> 00:46:25,280 tebygolrwydd o gael y gair "the" gwaith y tebygolrwydd o gael "y 878 00:46:25,280 --> 00:46:31,720 CS50 "gwaith y tebygolrwydd o gael "Mae'r TF CS50." Felly, yn y bôn, yr wyf yn cyfrif 879 00:46:31,720 --> 00:46:35,720 pob ffyrdd posibl o ymestyn ei. 880 00:46:35,720 --> 00:46:41,870 >> Ac yna fel arfer pan fyddwch yn gwneud hyn, fel mewn prosiect, eich rhoi E yn 881 00:46:41,870 --> 00:46:42,600 gwerth isel. 882 00:46:42,600 --> 00:46:45,930 Felly, fel arfer yn cael bigrams neu drigramau. 883 00:46:45,930 --> 00:46:51,090 Felly, yr ydych newydd gyfrif dau air, a grŵp o ddau air, neu dri gair, 884 00:46:51,090 --> 00:46:52,620 yn unig ar gyfer materion perfformiad. 885 00:46:52,620 --> 00:46:56,395 A hefyd oherwydd efallai os oes gennych rhywbeth fel "Mae'r TF CS50." Pan fyddwch yn 886 00:46:56,395 --> 00:47:00,510 wedi "TF," mae'n bwysig iawn bod "CS50" yn nesaf iddo, dde? 887 00:47:00,510 --> 00:47:04,050 Fel arfer y rhai ddau beth yn nesaf at ei gilydd. 888 00:47:04,050 --> 00:47:06,410 >> Os ydych yn meddwl o "TF," mae'n debyg mynd i gael yr hyn 889 00:47:06,410 --> 00:47:07,890 dosbarth mae'n TF'ing amdano. 890 00:47:07,890 --> 00:47:11,330 Hefyd "y" yn bwysig iawn ar gyfer TF CS50. 891 00:47:11,330 --> 00:47:14,570 Ond os oes gennych rhywbeth fel "The CS50 Aeth TF i ddosbarth a rhoi eu 892 00:47:14,570 --> 00:47:20,060 fyfyrwyr rhywfaint o Candy. "" Candy "ac" y " Nid oes perthynas gwirionedd, dde? 893 00:47:20,060 --> 00:47:23,670 Eu bod nhw mor bell oddi wrth ei gilydd y nid yw'n wir yn ots beth 894 00:47:23,670 --> 00:47:25,050 geiriau sydd gennych. 895 00:47:25,050 --> 00:47:31,210 >> Felly, drwy wneud bigram neu trigramau, mae'n yn unig yn golygu eich bod yn cyfyngu ar 896 00:47:31,210 --> 00:47:33,430 eich hun i rai geiriau sydd o gwmpas. 897 00:47:33,430 --> 00:47:35,810 Yn gwneud synnwyr? 898 00:47:35,810 --> 00:47:40,630 Felly, pan fyddwch am wneud segmentiad, yn y bôn, yr hyn rydych am ei wneud yw gweld 899 00:47:40,630 --> 00:47:44,850 beth yw'r holl ffyrdd posibl y gallwch segment y ddedfryd. 900 00:47:44,850 --> 00:47:49,090 >> O'r fath yn eich bod yn gweld beth yw'r tebygolrwydd o bob un o'r brawddegau hynny 901 00:47:49,090 --> 00:47:50,880 sydd eisoes yn bodoli yn yr iaith? 902 00:47:50,880 --> 00:47:53,410 Felly, yr hyn yr ydych yn ei wneud yn debyg, yn dda, gadewch mi geisio rhoi lle yma. 903 00:47:53,410 --> 00:47:55,570 Felly, byddwch yn rhoi lle yno a byddwch yn gweld beth yw 904 00:47:55,570 --> 00:47:57,590 tebygolrwydd y ddedfryd? 905 00:47:57,590 --> 00:48:00,240 Yna ydych yn hoffi, OK, efallai nad oedd yn bod yn dda. 906 00:48:00,240 --> 00:48:03,420 Felly, yr wyf yn rhoi lle yno a gofod yno, ac yr ydych yn cyfrifo'r 907 00:48:03,420 --> 00:48:06,240 tebygolrwydd yn awr, a byddwch yn gweld bod mae'n tebygolrwydd uwch. 908 00:48:06,240 --> 00:48:12,160 >> Felly mae hwn yn algorithm a elwir yn TANGO algorithm segmentu, sy'n 909 00:48:12,160 --> 00:48:14,990 mewn gwirionedd yn rhywbeth a fyddai'n fod yn wirioneddol oeri ar gyfer prosiect, a oedd yn 910 00:48:14,990 --> 00:48:20,860 yn y bôn yn destun unsegmented sy'n gall fod yn Siapan neu Tsieineaidd neu efallai 911 00:48:20,860 --> 00:48:26,080 Saesneg heb fylchau ac yn ceisio rhoi bylchau rhwng geiriau ac mae'n ei wneud 912 00:48:26,080 --> 00:48:29,120 hynny drwy ddefnyddio model iaith a yn ceisio gweld beth yw'r uchaf 913 00:48:29,120 --> 00:48:31,270 tebygolrwydd y gallwch ei gael. 914 00:48:31,270 --> 00:48:32,230 OK. 915 00:48:32,230 --> 00:48:33,800 Felly, mae hyn yn segmentu. 916 00:48:33,800 --> 00:48:35,450 >> Nawr cystrawen. 917 00:48:35,450 --> 00:48:40,940 Felly, cystrawen yn cael ei ddefnyddio ar gyfer cymaint o bethau ar hyn o bryd. 918 00:48:40,940 --> 00:48:44,880 Felly, ar gyfer Graff Chwilio, am Siri ar gyfer 'n bert lawer unrhyw fath o naturiol 919 00:48:44,880 --> 00:48:46,490 prosesu iaith sydd gennych. 920 00:48:46,490 --> 00:48:49,140 Felly beth yw'r bwysig pethau am gystrawen? 921 00:48:49,140 --> 00:48:52,390 Felly, brawddegau yn gyffredinol wedi yr hyn yr ydym yn galw etholwyr. 922 00:48:52,390 --> 00:48:57,080 Pa rai math o fel grwpiau o eiriau sydd â swyddogaeth yn y frawddeg. 923 00:48:57,080 --> 00:49:02,220 Ac ni allant mewn gwirionedd fod yn ar wahân i'w gilydd. 924 00:49:02,220 --> 00:49:07,380 >> Felly, os wyf yn dweud, er enghraifft, "Lauren wrth ei bodd Milo. "Rwy'n gwybod bod" Lauren "yn 925 00:49:07,380 --> 00:49:10,180 cyfansoddol ac yna "gariadon Milo "yn un arall hefyd. 926 00:49:10,180 --> 00:49:16,860 Oherwydd ni allwch ddweud fel "Lauren Milo wrth ei bodd "i gael yr un ystyr. 927 00:49:16,860 --> 00:49:18,020 Dyw hi ddim yn mynd i gael yr un ystyr. 928 00:49:18,020 --> 00:49:22,500 Neu ni allaf ddweud fel "Milo Lauren caru. "Nid yw popeth yr un 929 00:49:22,500 --> 00:49:25,890 sy'n golygu gwneud hynny. 930 00:49:25,890 --> 00:49:31,940 >> Felly mae'r ddau beth yn fwy bwysig am cystrawen yw'r mathau geirfa sy'n 931 00:49:31,940 --> 00:49:35,390 yn y bôn y swyddogaeth yr ydych yn gael am eiriau eu hunain. 932 00:49:35,390 --> 00:49:39,180 Felly, rhaid i chi wybod bod "Lauren" a "Milo" yn enwau. 933 00:49:39,180 --> 00:49:41,040 "Love" yn ferf. 934 00:49:41,040 --> 00:49:45,660 A'r ail beth pwysig yw eu bod yn fathau phrasal. 935 00:49:45,660 --> 00:49:48,990 Felly, rydych yn gwybod bod "wrth ei bodd yn Milo" mewn gwirionedd yn ymadrodd llafar. 936 00:49:48,990 --> 00:49:52,390 Felly, pan fyddaf yn dweud "Lauren," Rwy'n gwybod bod Lauren yn gwneud rhywbeth. 937 00:49:52,390 --> 00:49:53,620 Beth mae hi'n ei wneud? 938 00:49:53,620 --> 00:49:54,570 Mae hi wedi cariadus Milo. 939 00:49:54,570 --> 00:49:56,440 Felly mae'n holl beth. 940 00:49:56,440 --> 00:50:01,640 Ond mae ei gydrannau yn yn enw a berf. 941 00:50:01,640 --> 00:50:04,210 Ond gyda'i gilydd, maent yn gwneud ymadrodd ferf. 942 00:50:04,210 --> 00:50:08,680 >> Felly, gall yr hyn yr ydym yn ei wneud mewn gwirionedd gyda ieithyddiaeth gyfrifiadurol? 943 00:50:08,680 --> 00:50:13,810 Felly, os oes gen i rywbeth, er enghraifft "Cyfeillion o Allison." Rwy'n gweld os Fi jyst 944 00:50:13,810 --> 00:50:17,440 oedd coeden cystrawennol byddwn yn gwybod bod "Cyfeillion" yn ymadrodd enw ei fod yn 945 00:50:17,440 --> 00:50:21,480 enw ac yna "o Allison" yn ymadrodd arddodiadol lle "o" yn 946 00:50:21,480 --> 00:50:24,810 cynnig a "Allison" yn enw. 947 00:50:24,810 --> 00:50:30,910 Beth allwn i ei wneud yw dysgu fy nghyfrifiadur pan gennyf ymadrodd enwol un a 948 00:50:30,910 --> 00:50:33,080 yna ymadrodd arddodiadol. 949 00:50:33,080 --> 00:50:39,020 Felly, yn yr achos hwn, "cyfeillion" ac yna "o Milo "Rwy'n gwybod fod hyn yn golygu 950 00:50:39,020 --> 00:50:43,110 NP2, yr ail un, yn berchen ar NP1. 951 00:50:43,110 --> 00:50:47,680 >> Felly, yr wyf yn gallu creu rhyw fath o berthynas, rhyw fath o swyddogaeth ar ei gyfer. 952 00:50:47,680 --> 00:50:52,370 Felly, pryd bynnag y byddaf yn gweld y strwythur hwn, a oedd yn yn cyd-fynd yn union â "ffrindiau o 953 00:50:52,370 --> 00:50:56,030 Allison, "Rwy'n gwybod bod Allison berchen ar y ffrindiau. 954 00:50:56,030 --> 00:50:58,830 Felly, y cyfeillion yn rhywbeth y bod Allison wedi. 955 00:50:58,830 --> 00:50:59,610 Yn gwneud synnwyr? 956 00:50:59,610 --> 00:51:01,770 Felly, mae hyn yn y bôn yr hyn Graff Chwilio wneud. 957 00:51:01,770 --> 00:51:04,360 'I jyst yn creu rheolau am lawer o bethau. 958 00:51:04,360 --> 00:51:08,190 Felly "ffrindiau o Allison," "fy ffrindiau sy'n byw yng Nghaergrawnt, "" fy ffrindiau 959 00:51:08,190 --> 00:51:12,970 sy'n mynd i Harvard. "Mae'n creu rheolau ar gyfer pob un o'r pethau hynny. 960 00:51:12,970 --> 00:51:14,930 >> Nawr cyfieithu peirianyddol. 961 00:51:14,930 --> 00:51:18,850 Felly, cyfieithu peirianyddol hefyd yn rhywbeth ystadegol. 962 00:51:18,850 --> 00:51:21,340 Ac mewn gwirionedd os ydych yn cymryd rhan mewn ieithyddiaeth cyfrifiannu, mae llawer o 963 00:51:21,340 --> 00:51:23,580 dy stwff yn mynd i fod ystadegau. 964 00:51:23,580 --> 00:51:26,670 Felly, gan fy mod yn gwneud y enghraifft gyda llawer o tebygolrwydd fy mod yn 965 00:51:26,670 --> 00:51:30,540 cyfrifo, ac yna byddwch yn cael i hyn nifer fach iawn dyna y rownd derfynol 966 00:51:30,540 --> 00:51:33,180 tebygolrwydd, a dyna beth yn rhoi'r ateb i chi. 967 00:51:33,180 --> 00:51:37,540 Cyfieithu peirianyddol hefyd yn defnyddio model ystadegol. 968 00:51:37,540 --> 00:51:44,790 Ac os ydych chi am feddwl o beiriant cyfieithu yn y symlaf posibl 969 00:51:44,790 --> 00:51:48,970 ffordd, beth y gallwch feddwl yn unig cyfieithu gair am air, dde? 970 00:51:48,970 --> 00:51:52,150 >> Pan fyddwch chi'n dysgu iaith am y tro cyntaf, dyna beth fel arfer yn 971 00:51:52,150 --> 00:51:52,910 ydych yn ei wneud, dde? 972 00:51:52,910 --> 00:51:57,050 Os ydych am i chi cyfieithu brawddeg yn eich iaith i'r iaith 973 00:51:57,050 --> 00:52:00,060 eich bod yn dysgu, fel arfer yn gyntaf, yr ydych yn cyfieithu pob un o'r geiriau 974 00:52:00,060 --> 00:52:03,180 yn unigol, ac yna i chi roi cynnig i roi'r geiriau ar waith. 975 00:52:03,180 --> 00:52:07,100 >> Felly, os oeddwn i eisiau i drosi hyn, [SIARAD Portiwgaleg] 976 00:52:07,100 --> 00:52:10,430 sy'n golygu "yn rhedeg y gath gwyn i ffwrdd." Os oeddwn i eisiau ei gyfieithu o 977 00:52:10,430 --> 00:52:13,650 Portiwgaleg i Saesneg, yr hyn yr wyf Gallai wneud yw, yn gyntaf, Fi jyst 978 00:52:13,650 --> 00:52:14,800 cyfieithu gair am air. 979 00:52:14,800 --> 00:52:20,570 Felly, "o" yw "y," "Gato," "cath" "Branco," "gwyn," ac yna "fugio" yn 980 00:52:20,570 --> 00:52:21,650 "Rhedeg i ffwrdd." 981 00:52:21,650 --> 00:52:26,130 >> Felly, yna yr wyf yn cael yr holl eiriau yma, ond nid ydynt yn mewn trefn. 982 00:52:26,130 --> 00:52:29,590 Mae fel "y gwyn gath yn rhedeg i ffwrdd" sydd yn anramadegol. 983 00:52:29,590 --> 00:52:34,490 Felly, yna gallaf gael ail gam, a oedd yn yn mynd i gael ei dod o hyd i'r delfrydol 984 00:52:34,490 --> 00:52:36,610 sefyllfa ar gyfer pob un o'r geiriau. 985 00:52:36,610 --> 00:52:40,240 Felly, yr wyf yn gwybod fy mod mewn gwirionedd am gael "Cath wen" yn hytrach na "gwyn cath." Felly, 986 00:52:40,240 --> 00:52:46,050 hyn y gallaf ei wneud yw, y dull mwyaf naïf fyddai creu holl 987 00:52:46,050 --> 00:52:49,720 gyfnewidiadau posibl eiriau, o swyddi. 988 00:52:49,720 --> 00:52:53,300 Ac yna gweld pa un sydd â'r tebygolrwydd uchaf yn ôl 989 00:52:53,300 --> 00:52:54,970 i fy model iaith. 990 00:52:54,970 --> 00:52:58,390 Ac yna pan fyddaf yn dod o hyd i'r un sydd wedi y tebygolrwydd uchaf, ac mae hynny'n 991 00:52:58,390 --> 00:53:01,910 yn ôl pob tebyg "y gath gwyn rhedeg i ffwrdd," dyna fy cyfieithu. 992 00:53:01,910 --> 00:53:06,710 >> Ac mae hyn yn ffordd syml o egluro sut y mae llawer o gyfieithu peirianyddol 993 00:53:06,710 --> 00:53:07,910 algorithmau gweithio. 994 00:53:07,910 --> 00:53:08,920 A yw hynny'n gwneud synnwyr? 995 00:53:08,920 --> 00:53:12,735 Mae hyn hefyd yn rhywbeth cyffrous y gallwch guys efallai archwilio ar gyfer 996 00:53:12,735 --> 00:53:13,901 prosiect terfynol, ie? 997 00:53:13,901 --> 00:53:15,549 >> MYFYRIWR: Wel, yr ydych yn dweud ei fod yn y ffordd naïf, felly beth 998 00:53:15,549 --> 00:53:17,200 y ffordd heb fod yn naïf? 999 00:53:17,200 --> 00:53:18,400 >> LUCAS Freitas: Y ffordd heb fod yn naïf? 1000 00:53:18,400 --> 00:53:19,050 OK. 1001 00:53:19,050 --> 00:53:22,860 Felly, y peth cyntaf sydd yn wael am dull hwn yw yr wyf newydd ei gyfieithu 1002 00:53:22,860 --> 00:53:24,330 geiriau, air am air. 1003 00:53:24,330 --> 00:53:30,570 Ond weithiau mae gennych geiriau sy'n yn gallu cael cyfieithiadau lluosog. 1004 00:53:30,570 --> 00:53:32,210 Rydw i'n mynd i geisio meddwl o rywbeth. 1005 00:53:32,210 --> 00:53:37,270 Er enghraifft, "Manga" mewn tun Portiwgaleg naill ai yn "mangl" neu "lawes." Felly, 1006 00:53:37,270 --> 00:53:40,450 pan fyddwch yn ceisio i gyfieithu gair drwy air, gallai fod yn rhoi i chi 1007 00:53:40,450 --> 00:53:42,050 rhywbeth sy'n gwneud unrhyw synnwyr. 1008 00:53:42,050 --> 00:53:45,770 >> Felly rydych chi ei eisiau mewn gwirionedd i chi edrych ar yr holl y cyfieithiadau posibl y 1009 00:53:45,770 --> 00:53:49,840 geiriau a gweld, yn gyntaf oll, beth yw'r drefn. 1010 00:53:49,840 --> 00:53:52,000 Rydym yn siarad am permutating y pethau? 1011 00:53:52,000 --> 00:53:54,150 I weld yr holl archebion posibl a dewis yr un gyda'r uchaf 1012 00:53:54,150 --> 00:53:54,990 tebygolrwydd? 1013 00:53:54,990 --> 00:53:57,860 Gallwch hefyd ddewis yr holl posibl cyfieithiadau ar gyfer pob 1014 00:53:57,860 --> 00:54:00,510 gair ac yna gweld - 1015 00:54:00,510 --> 00:54:01,950 ynghyd â'r gyfnewidiadau - 1016 00:54:01,950 --> 00:54:03,710 pa un sydd â'r tebygolrwydd uchaf. 1017 00:54:03,710 --> 00:54:08,590 >> Byd Gwaith, gallwch hefyd edrych nid yn dim ond geiriau ond ymadroddion. 1018 00:54:08,590 --> 00:54:11,700 fel y gallwch ddadansoddi y berthynas rhwng y geiriau ac wedyn yn cael 1019 00:54:11,700 --> 00:54:13,210 cyfieithu yn well. 1020 00:54:13,210 --> 00:54:16,690 Hefyd yn rhywbeth arall, felly semester hwn Im 'mewn gwirionedd yn gwneud ymchwil mewn 1021 00:54:16,690 --> 00:54:19,430 Tsieineaidd-Saesneg cyfieithu peirianyddol, felly cyfieithu o 1022 00:54:19,430 --> 00:54:20,940 Tseiniaidd i'r Saesneg. 1023 00:54:20,940 --> 00:54:26,760 >> A rhywbeth yr ydym yn ei wneud yw, ar wahân i ddefnyddio model ystadegol, sydd ychydig yn 1024 00:54:26,760 --> 00:54:30,570 gweld y tebygolrwydd o weld rhywfaint o sefyllfa mewn brawddeg, rwy'n 1025 00:54:30,570 --> 00:54:35,360 mewn gwirionedd hefyd yn ychwanegu rhywfaint o gystrawen i fy model, gan ddywedyd, oh, os byddaf yn gweld y math hwn 1026 00:54:35,360 --> 00:54:39,420 adeiladu, mae hyn yn yr hyn rwyf am i'w newid i pan fyddaf yn cyfieithu. 1027 00:54:39,420 --> 00:54:43,880 Felly, gallwch hefyd yn ychwanegu rhyw fath o elfen o gystrawen i wneud y 1028 00:54:43,880 --> 00:54:47,970 cyfieithu yn fwy effeithlon ac yn fwy manwl gywir. 1029 00:54:47,970 --> 00:54:48,550 OK. 1030 00:54:48,550 --> 00:54:51,010 >> Felly, sut y gallwch ddechrau arni, os ydych am i wneud rhywbeth yn cyfrifiannu 1031 00:54:51,010 --> 00:54:51,980 ieithyddiaeth? 1032 00:54:51,980 --> 00:54:54,560 >> Yn gyntaf, byddwch yn dewis prosiect sy'n cynnwys ieithoedd. 1033 00:54:54,560 --> 00:54:56,310 Felly, mae cymaint o allan yna. 1034 00:54:56,310 --> 00:54:58,420 Mae cymaint o bethau y gallwch eu gwneud. 1035 00:54:58,420 --> 00:55:00,510 Ac yna yn gallu meddwl o fodel y gallwch eu defnyddio. 1036 00:55:00,510 --> 00:55:04,710 Fel arfer mae hynny'n golygu meddwl am rhagdybiaethau, fel fel, oh, pan oeddwn yn 1037 00:55:04,710 --> 00:55:05,770 fel meddwl am y geiriau. 1038 00:55:05,770 --> 00:55:09,510 Roeddwn yn hoffi, wel, os ydw i eisiau i ffigwr cynnal a ysgrifennodd hwn, yr wyf yn ôl pob tebyg am 1039 00:55:09,510 --> 00:55:15,400 i edrych ar y geiriau y person a ddefnyddiwyd a gweld sy'n defnyddio y gair hwnnw yn aml iawn. 1040 00:55:15,400 --> 00:55:18,470 Felly ceisiwch wneud rhagdybiaethau a ceisiwch feddwl o fodelau. 1041 00:55:18,470 --> 00:55:21,395 Ac yna gallwch hefyd chwilio ar-lein ar gyfer y math o broblem sydd gennych, 1042 00:55:21,395 --> 00:55:24,260 ac mae'n mynd i awgrymu i chi modelau sy'n efallai 1043 00:55:24,260 --> 00:55:26,560 fodelu y peth yn dda. 1044 00:55:26,560 --> 00:55:29,080 >> A hefyd gallwch chi bob amser e-bost ataf. 1045 00:55:29,080 --> 00:55:31,140 me@lfreitas.com. 1046 00:55:31,140 --> 00:55:34,940 A gall Fi jyst ateb eich cwestiynau. 1047 00:55:34,940 --> 00:55:38,600 Gallwn hyd yn oed y gallai cyfarfod felly gallaf rhoi awgrymiadau ar ffyrdd o 1048 00:55:38,600 --> 00:55:41,490 weithredu eich prosiect. 1049 00:55:41,490 --> 00:55:45,610 Ac yr wyf yn golygu os ydych yn cymryd rhan gyda ieithyddiaeth gyfrifiadurol, mae'n mynd 1050 00:55:45,610 --> 00:55:46,790 i fod yn wych. 1051 00:55:46,790 --> 00:55:48,370 Rydych yn mynd i weld yno yn gymaint o botensial. 1052 00:55:48,370 --> 00:55:52,060 Ac mae'r diwydiant yn awyddus i logi chi mor wael oherwydd hynny. 1053 00:55:52,060 --> 00:55:54,720 Felly, yr wyf yn gobeithio y byddwch yn guys mwynhau hyn. 1054 00:55:54,720 --> 00:55:57,030 Os ydych yn guys gennych unrhyw gwestiynau, gallwch ofyn i mi ar ôl hyn. 1055 00:55:57,030 --> 00:55:58,280 Ond diolch i chi. 1056 00:55:58,280 --> 00:56:00,150