1 00:00:00,000 --> 00:00:05,691 2 00:00:05,691 --> 00:00:07,690 CONNOR HARRIS: Still I held sumir spennandi vídeó 3 00:00:07,690 --> 00:00:12,570 framleitt með faglega ráðgjöf sem notar R mikið í starfi sínu. 4 00:00:12,570 --> 00:00:16,329 >> Sögumaður: Hvað er á bak við tölfræði, Analytics, og visualizations 5 00:00:16,329 --> 00:00:19,770 bjartasta gögn vísindamenn sem í dag er og viðskipti leiðtogar treysta á 6 00:00:19,770 --> 00:00:22,012 að gera öflugur ákvarðanir? 7 00:00:22,012 --> 00:00:23,540 Þú getur ekki alltaf séð það. 8 00:00:23,540 --> 00:00:24,790 En það er þarna. 9 00:00:24,790 --> 00:00:29,460 Það heitir R, opinn uppspretta R-- á tölfræðileg forritunarmál 10 00:00:29,460 --> 00:00:32,630 Þessi gögn sérfræðinga heims yfir notkun fyrir allt 11 00:00:32,630 --> 00:00:35,350 frá kortlagning breiðum félagslegum og markaðssetning þróun online 12 00:00:35,350 --> 00:00:39,210 að þróa fjárhagslega og loftslag módel sem hjálpa aka hagkerfi okkar 13 00:00:39,210 --> 00:00:40,780 og samfélög. 14 00:00:40,780 --> 00:00:44,910 >> En hvað nákvæmlega er R og þar var R byrja? 15 00:00:44,910 --> 00:00:48,620 Jæja upphaflega, R byrjaði hér með tveimur kennurum 16 00:00:48,620 --> 00:00:51,950 sem vildu betri tölfræðileg vettvangur fyrir nemendur sína. 17 00:00:51,950 --> 00:00:56,030 Svo þeir skapa eitt fyrirmynd eftir tölfræðilegum tungumáli S. 18 00:00:56,030 --> 00:01:00,480 Þeir, ásamt mörgum öðrum, haldið að vinna á og nota R, 19 00:01:00,480 --> 00:01:05,489 skapa verkfæri fyrir R og finna ný forrit fyrir R hverjum degi. 20 00:01:05,489 --> 00:01:07,750 >> Þökk sé þessu er Alþjóðlegt samfélag átak, 21 00:01:07,750 --> 00:01:11,850 R haldið vaxandi með þúsundir af notandi-skapa bókasöfnum byggð 22 00:01:11,850 --> 00:01:15,500 til að auka R virkni og mannfjöldi-uppspretta gæði löggilding 23 00:01:15,500 --> 00:01:19,740 og stuðning frá þekktasta iðnaður leiðtoga á öllum sviðum sem 24 00:01:19,740 --> 00:01:25,040 notar R. Sem er frábært, því R er best hvað það gerir. 25 00:01:25,040 --> 00:01:28,540 Verðandi sérfræðinga fljótt og auðveldlega túlka, samskipti við, 26 00:01:28,540 --> 00:01:33,790 og sjón gögn sem sýna hratt, vaxandi samfélag R notenda um heim allan 27 00:01:33,790 --> 00:01:36,380 og sjá hvernig opinn uppspretta R halda áfram að móta 28 00:01:36,380 --> 00:01:39,340 framtíð tölfræðileg greiningu og gögn vísindi. 29 00:01:39,340 --> 00:01:44,660 30 00:01:44,660 --> 00:01:47,710 >> CONNOR HARRIS: OK, frábært. 31 00:01:47,710 --> 00:01:50,360 Svo eigin kynningu mína verður aðeins meira edrú. 32 00:01:50,360 --> 00:01:54,380 Það mun ekki fela í sér það mikið spennandi bakgrunnur tónlist. 33 00:01:54,380 --> 00:01:59,160 En eins og þú sást í the vídeó, R er tegund almenns tilgangi program tungumál. 34 00:01:59,160 --> 00:02:03,720 En það var búið að mestu fyrir hagskýrslugerðar. 35 00:02:03,720 --> 00:02:07,980 >> Svo það er hannað fyrir tölfræði, fyrir greiningu gagna, fyrir gögn námuvinnslu. 36 00:02:07,980 --> 00:02:12,420 Og svo þú getur séð þetta í fullt af hönnun val að framleiðandi af R 37 00:02:12,420 --> 00:02:13,320 gert. 38 00:02:13,320 --> 00:02:15,472 Það er hannað fyrir mestu, fólk sem er ekki 39 00:02:15,472 --> 00:02:17,930 sérfræðingar í forritun, sem eru bara að tína upp forritun 40 00:02:17,930 --> 00:02:23,460 á hlið svo þeir geti gert vinnu sína í félagsvísindum eða í tölfræði 41 00:02:23,460 --> 00:02:25,440 eða hvað sem er. 42 00:02:25,440 --> 00:02:27,850 >> Það hefur a einhver fjöldi af mjög mikilvægur munur frá C 43 00:02:27,850 --> 00:02:33,200 En setningafræði og málin að það notar eru svipaðar. 44 00:02:33,200 --> 00:02:36,830 Og þú ættir að finna nokkuð mikið heima strax the kylfa. 45 00:02:36,830 --> 00:02:38,520 Það er mikilvægt tungumál. 46 00:02:38,520 --> 00:02:40,260 >> Ekki hafa áhyggjur of mikið um það ef þú veist ekki hugtakið. 47 00:02:40,260 --> 00:02:42,676 En það er greinarmunur milli áríðandi, declarative, 48 00:02:42,676 --> 00:02:43,810 og hagnýtur. 49 00:02:43,810 --> 00:02:47,600 Mikilvægt bara þýðir að þú gerir yfirlýsingar sem eru í grundvallaratriðum skipanir. 50 00:02:47,600 --> 00:02:52,340 Og þá túlkur eða tölva segir þá einn í einu. 51 00:02:52,340 --> 00:02:56,630 Það er veikt slegið, það eru engar gerð yfirlýsingar í R. 52 00:02:56,630 --> 00:02:59,130 >> Og þá línur milli mismunandi gerðir 53 00:02:59,130 --> 00:03:03,920 eru aðeins meira laus en þeir eru í C, til dæmis. 54 00:03:03,920 --> 00:03:06,450 Og eins og ég sagði það eru mjög umfangsmiklar aðstaða 55 00:03:06,450 --> 00:03:15,610 fyrir graphing, fyrir tölfræðilegar greiningu, fyrir gögn námuvinnslu. 56 00:03:15,610 --> 00:03:19,540 Þetta eru bæði byggð inn í tungumál og eins og the vídeó sagði, 57 00:03:19,540 --> 00:03:23,680 þúsundir þriðja bókasöfn aðila sem þú getur sótt og notað ókeypis 58 00:03:23,680 --> 00:03:25,340 með mjög laus skilyrða leyfi. 59 00:03:25,340 --> 00:03:28,800 60 00:03:28,800 --> 00:03:31,500 >> Svo almennt, myndi ég mæla með að þú horfir á þessar tvær bækur 61 00:03:31,500 --> 00:03:34,610 ef þú ert að fara að vinna á R. Einn þeirra er opinber R byrjandi er 62 00:03:34,610 --> 00:03:35,110 leiða. 63 00:03:35,110 --> 00:03:38,660 Það er viðhaldið af algerlega verktaki af R. 64 00:03:38,660 --> 00:03:42,400 Þú getur sótt það aftur, án kostnaðarlausu og löglega á tengilinn þar. 65 00:03:42,400 --> 00:03:45,430 66 00:03:45,430 --> 00:03:49,869 Öll þessi skyggnur eru að fara að fara upp á internetinu, á CS50 vefsvæði 67 00:03:49,869 --> 00:03:50,660 eftir það er gert. 68 00:03:50,660 --> 00:03:53,690 Þannig að ekki þarf að afrita það niður frantically. 69 00:03:53,690 --> 00:03:56,800 >> Hitt er a Kennslubók með Cosma Shalizi, 70 00:03:56,800 --> 00:04:00,100 sem er tölfræði prófessor við Carnegie Mellon, sem heitir Advanced Data 71 00:04:00,100 --> 00:04:02,160 Greining úr rannsókn Elementary Point of View. 72 00:04:02,160 --> 00:04:04,010 Þetta er ekki fyrst og fremst að R bók. 73 00:04:04,010 --> 00:04:07,130 Það er tölfræði bók og það er greining gagna bók. 74 00:04:07,130 --> 00:04:11,990 En það er mjög aðgengileg fyrir fólk sem hafa modicum tölfræði þekkingu. 75 00:04:11,990 --> 00:04:13,750 >> Ég hef aldrei tekið formlega námskeið. 76 00:04:13,750 --> 00:04:17,269 Ég veit bara bita og bita frá ýmsum bandamanna greinum 77 00:04:17,269 --> 00:04:18,579 sem ég hef tekið námskeið í. 78 00:04:18,579 --> 00:04:21,839 Og ég var fær til að skilja það fullkomlega vel. 79 00:04:21,839 --> 00:04:25,630 >> Allar tölur eru gefnar í R. Þeir eru í R 80 00:04:25,630 --> 00:04:30,280 og þeir hafa einnig kóða skráningar neðan hverja mynd sem segja þér 81 00:04:30,280 --> 00:04:33,270 hvernig þú gera hverja mynd með R kóða. 82 00:04:33,270 --> 00:04:37,400 Og það er mjög gagnlegt ef þú ert að reyna að líkja eftir 83 00:04:37,400 --> 00:04:38,650 sumir tala þú sérð í bók. 84 00:04:38,650 --> 00:04:47,840 >> Og aftur frjáls sækja stat.cmu.edu/cshalizi/ miður, 85 00:04:47,840 --> 00:04:50,230 sem ætti að vera rista Tilde cshalizi. 86 00:04:50,230 --> 00:04:53,150 Ég ætla að gera viss um að leiðrétta það þegar opinber renna upp. 87 00:04:53,150 --> 00:04:57,000 / ADAfaEPoV sem er bara skammstöfun á bókartitil. 88 00:04:57,000 --> 00:04:59,850 89 00:04:59,850 --> 00:05:02,500 >> Svo almennt caveats-- R hefur mikið af getu. 90 00:05:02,500 --> 00:05:05,331 Ég er bara að fara að vera fær um að ná yfirborð fullt af hlutum. 91 00:05:05,331 --> 00:05:08,580 Einnig fyrsta hluta námskeiðsins er að fara að vera eitthvað af gögn sorphaugur. 92 00:05:08,580 --> 00:05:11,437 Ég er alveg miður um það. 93 00:05:11,437 --> 00:05:13,770 Í grundvallaratriðum, ég ætla að kynna þig fullt af hlutum 94 00:05:13,770 --> 00:05:15,350 strax the kylfa, fara eins fljótt og auðið er. 95 00:05:15,350 --> 00:05:17,058 Og þá fáum við að gaman hluti, sem er 96 00:05:17,058 --> 00:05:20,570 kynningu þar sem ég get sýnt þér allt sem við höfum talað um á skjánum. 97 00:05:20,570 --> 00:05:23,321 Og þú getur spilað í kring á eigin spýtur. 98 00:05:23,321 --> 00:05:26,070 Þannig að það er að fara til vera a einhver fjöldi af tæknilega efni kastað upp á hér. 99 00:05:26,070 --> 00:05:28,060 Ekki hafa áhyggjur óður í að afrita allt sem niður. 100 00:05:28,060 --> 00:05:31,740 Vegna A er hægt að fá allar efni á CS50 heimasíðu seinna. 101 00:05:31,740 --> 00:05:37,780 Og B, það er ekki í raun að mikilvægt að leggja á minnið þetta frá glærum. 102 00:05:37,780 --> 00:05:40,462 Það er mikilvægara að þú fáir sumir leiðandi leikni með það 103 00:05:40,462 --> 00:05:44,220 og sem kemur frá bara að spila í kring. 104 00:05:44,220 --> 00:05:45,720 >> Svo hvers vegna að nota R? 105 00:05:45,720 --> 00:05:49,440 Í grundvallaratriðum, ef þú ert með verkefni sem felur námuvinnslu stóra gagnagrunna, gögn 106 00:05:49,440 --> 00:05:52,664 visualization, þú ætti að nota R. Ef þú ert 107 00:05:52,664 --> 00:05:55,830 gera flókinn tölfræðigreiningar, sem myndi vera erfitt í Excel, 108 00:05:55,830 --> 00:05:58,010 til dæmis, myndi það Einnig er hægt að good-- einnig 109 00:05:58,010 --> 00:06:00,506 ef þú ert að gera tölfræðileg greining sem er sjálfvirk. 110 00:06:00,506 --> 00:06:02,130 Segjum að þú ert að viðhalda vefsíðu. 111 00:06:02,130 --> 00:06:06,320 Og þú vilt lesa miðlara þig inn á hverjum degi og taka saman smá lista, 112 00:06:06,320 --> 00:06:10,320 eins efstu löndum sem notendur eru að koma frá, 113 00:06:10,320 --> 00:06:15,100 sumir yfirlitstölfræði á hversu lengi þeir eyða á vefsvæði þínu eða hvað sem er. 114 00:06:15,100 --> 00:06:16,910 Og þú vilt keyra þetta á hverjum degi. 115 00:06:16,910 --> 00:06:20,280 >> Nú ef þú ert að gera þetta í Excel, þú þyrftir að fara til miðlara þig inn, 116 00:06:20,280 --> 00:06:23,490 flytja að inn í Excel gögn töflureikni, 117 00:06:23,490 --> 00:06:24,910 hlaupa alla greiningu handvirkt. 118 00:06:24,910 --> 00:06:27,100 Með R, getur þú bara að skrifa eitt handrit. 119 00:06:27,100 --> 00:06:29,520 Áætlun það að keyra á hverjum degi frá stýrikerfið. 120 00:06:29,520 --> 00:06:33,657 Og þá á hverju kvöldi á 2:00 AM, eða þegar þú tímaáætlun það til að keyra, 121 00:06:33,657 --> 00:06:35,990 það mun líta í gegnum þinn internet umferð fyrir þann dag. 122 00:06:35,990 --> 00:06:39,010 Og þá með næsta degi, þú munt hafa þetta ljómandi, nýja skýrslu 123 00:06:39,010 --> 00:06:41,710 eða hvað með allt í Upplýsingarnar sem þú baðst um. 124 00:06:41,710 --> 00:06:44,960 125 00:06:44,960 --> 00:06:50,217 >> Svo í rauninni R er fyrir Cisco forritun á móti Cisco greiningu. 126 00:06:50,217 --> 00:06:51,050 Forkeppni er lokið. 127 00:06:51,050 --> 00:06:53,104 Við skulum fara í alvöru hlutum. 128 00:06:53,104 --> 00:06:55,020 Þannig að það eru þrír alvöru gerðir í tungumáli. 129 00:06:55,020 --> 00:06:56,120 Það er tölustafir tegund. 130 00:06:56,120 --> 00:07:01,250 Það er tegund af mismunur milli heiltölur og fljótandi stig, 131 00:07:01,250 --> 00:07:02,769 en ekki í raun. 132 00:07:02,769 --> 00:07:04,560 Það er eðli tegund, sem er strengi. 133 00:07:04,560 --> 00:07:07,100 Og það er rökrétt tegund, sem er Booleans. 134 00:07:07,100 --> 00:07:11,080 >> Og þú geta umbreyta á milli tegunda nota þessar aðgerðir eins og tölustafir, 135 00:07:11,080 --> 00:07:15,220 sem persónu sem rökrétt. 136 00:07:15,220 --> 00:07:17,510 Ef þú kallar, til dæmis, sem tölugildi á streng, 137 00:07:17,510 --> 00:07:20,030 það verður að reyna að lesa þessi band sem tala, á sama hátt 138 00:07:20,030 --> 00:07:25,897 sem a2i og scanf gera, og C. Ef þú kalla eins tölugildi á satt eða ósatt 139 00:07:25,897 --> 00:07:26,980 það mun umbreyta til 1 eða 0. 140 00:07:26,980 --> 00:07:29,110 Ef þú kallar og eðli á neitt það verður 141 00:07:29,110 --> 00:07:32,550 umbreyta það inn í a streng. 142 00:07:32,550 --> 00:07:34,990 >> Og þá eru vektorar og fylki. 143 00:07:34,990 --> 00:07:37,580 Svo vektor eru í grundvallaratriðum 1 víddar fylki. 144 00:07:37,580 --> 00:07:40,600 Þeir eru það sem við köllum fylki í C. Fylki, 2 víddar fylki. 145 00:07:40,600 --> 00:07:42,350 Og þá hærri víddar fylki þú getur 146 00:07:42,350 --> 00:07:48,560 hafa 3, 4, 5 stærðir eða hvað af tölum, af strengjum, 147 00:07:48,560 --> 00:07:52,860 rökrétt gildi. 148 00:07:52,860 --> 00:07:55,380 >> Þú hefur einnig listar sem eru eins konar tengin array. 149 00:07:55,380 --> 00:07:57,390 Ég næ í þá hluti. 150 00:07:57,390 --> 00:07:59,390 Svo einn mikilvægur hlutur að ferðir fólk upp í R 151 00:07:59,390 --> 00:08:01,470 er að það eru engin alvöru, hreint lotukerfinu tegundir. 152 00:08:01,470 --> 00:08:05,870 Það er engin raunveruleg skil milli a tala, eins tölugildi, 153 00:08:05,870 --> 00:08:07,920 og lista yfir tölum. 154 00:08:07,920 --> 00:08:12,370 Töluleg gildi eru í raun sama og vektor af lengd 1. 155 00:08:12,370 --> 00:08:14,959 Og þetta hefur a tala af mikilvæg áhrif. 156 00:08:14,959 --> 00:08:17,500 Einn, þýðir það að þú getur gert það mjög auðveldlega að fela 157 00:08:17,500 --> 00:08:21,037 eins og að bæta símanúmeri vektor. 158 00:08:21,037 --> 00:08:23,120 R mun í grundvallaratriðum mynd út hvað þú átt við með því. 159 00:08:23,120 --> 00:08:24,610 Og ég næ að því í annað. 160 00:08:24,610 --> 00:08:27,930 Það þýðir líka að það er engin leið fyrir þá tegund checker-- að því marki 161 00:08:27,930 --> 00:08:30,530 að eitthvað svona er í R-- að segja 162 00:08:30,530 --> 00:08:33,780 þegar þú hefur staðist í einu gildi hvenær hann telur array eða öfugt. 163 00:08:33,780 --> 00:08:39,159 Og það getur valdið sumum skrýtið vandræði sem ég hljóp inn þegar 164 00:08:39,159 --> 00:08:42,252 Ég var að nota R á starfi í sumar mínu. 165 00:08:42,252 --> 00:08:43,710 Og það eru engin blönduð gerð fylki. 166 00:08:43,710 --> 00:08:46,543 Svo þú getur ekki hafa fylki voru Fyrstu þættir er, ég veit ekki, 167 00:08:46,543 --> 00:08:49,332 strengurinn "John" og Annað þáttur er númer 42. 168 00:08:49,332 --> 00:08:52,540 Ef þú reynir að gera það, þá munt þú fá allt bara breytt í streng. 169 00:08:52,540 --> 00:08:54,760 Þannig að við höfum string John, string 42. 170 00:08:54,760 --> 00:08:58,250 171 00:08:58,250 --> 00:09:02,025 >> Svo óvenjulegt nokkur dæmi um setningarleg features-- mest R setningafræði er mjög svipuð C 172 00:09:02,025 --> 00:09:04,690 Það eru nokkur mikilvæg munur. 173 00:09:04,690 --> 00:09:05,620 Vélritun er mjög veik. 174 00:09:05,620 --> 00:09:07,360 Þannig að það eru engar breytilegum yfirlýsingar. 175 00:09:07,360 --> 00:09:12,670 Framsal notar undarlegt villa rekstraraðila minna en bandstrik. 176 00:09:12,670 --> 00:09:15,340 Athugasemdir eru með kjötkássa merki. 177 00:09:15,340 --> 00:09:19,230 Ég held nú daga og við köllum það hashtag þó það er í raun ekki accurate-- ekki 178 00:09:19,230 --> 00:09:21,810 tvöfaldur rista. 179 00:09:21,810 --> 00:09:24,710 >> Mát leifar eru með merki %%. 180 00:09:24,710 --> 00:09:30,172 Integer deild er með% /%, sem er mjög erfitt að lesa þegar það er spáð 181 00:09:30,172 --> 00:09:30,880 upp á skjánum. 182 00:09:30,880 --> 00:09:34,150 183 00:09:34,150 --> 00:09:37,200 Þú getur fengið svið heiltölur í ristli. 184 00:09:37,200 --> 00:09:41,840 Svo 2,5 mun gefa þér vektor af allar tölur 2 til 5. 185 00:09:41,840 --> 00:09:44,530 >> Fylki eru einn-verðtryggð, sem skrúfur a einhver fjöldi af fólk 186 00:09:44,530 --> 00:09:47,540 upp ef þeir eru frá fleiri dæmigerð forritunarmál, 187 00:09:47,540 --> 00:09:50,450 eins og C, þar sem mest það eru núll-verðtryggð. 188 00:09:50,450 --> 00:09:54,420 Aftur, þetta er þar sem arfleifð R er sem tungumál fyrir ekki eins 189 00:09:54,420 --> 00:09:56,560 faglega forritari kemur í. 190 00:09:56,560 --> 00:09:59,680 Ef þú ert félagsfræðingur eða hagfræðingur eða eitthvað 191 00:09:59,680 --> 00:10:01,980 og þú ert að reyna að nota R grundvallaratriðum sem viðbót 192 00:10:01,980 --> 00:10:03,832 að meira máli þitt faglega vinnu, 193 00:10:03,832 --> 00:10:06,040 þú ert að fara að finna einn-flokkun aðeins meira náttúrulegur. 194 00:10:06,040 --> 00:10:09,890 Vegna þess að þú byrja að telja á 1 í daglegu lífi, ekki 0. 195 00:10:09,890 --> 00:10:13,260 >> Fyrir-lykkjur, þetta er svipað og sem framhandleggur reisa í PHP, 196 00:10:13,260 --> 00:10:17,090 sem þú munt fá að læra in-- fljótlega. 197 00:10:17,090 --> 00:10:22,540 Sem er fyrir gildi í vektor og þá getur þú gert það með gildi. 198 00:10:22,540 --> 00:10:24,040 Áhorfendur: Það er að koma upp í fyrirlestri. 199 00:10:24,040 --> 00:10:26,248 CONNOR HARRIS: Ó, það er koma upp fyrirlestur, framúrskarandi. 200 00:10:26,248 --> 00:10:29,815 Áhorfendur: Framsal, er það ætlast til að benda frá hægri til vinstri? 201 00:10:29,815 --> 00:10:31,440 CONNOR HARRIS: Frá hægri til vinstri, já. 202 00:10:31,440 --> 00:10:34,720 Þú getur hugsað um það sem verðmæti á rétt shoved í breytunni 203 00:10:34,720 --> 00:10:36,240 til vinstri. 204 00:10:36,240 --> 00:10:36,781 Áhorfendur: OK. 205 00:10:36,781 --> 00:10:39,770 206 00:10:39,770 --> 00:10:42,330 >> CONNOR HARRIS: Og að lokum virka setningafræði er svolítið skrítið. 207 00:10:42,330 --> 00:10:48,460 Þú hefur nafn virka foo, úthlutað að þetta efni virka, fylgt 208 00:10:48,460 --> 00:10:51,530 með öll rök og síðan var Lík virka eftir það. 209 00:10:51,530 --> 00:10:53,280 Aftur þetta getur virðast svolítið skrítið. 210 00:10:53,280 --> 00:10:57,181 Þær verða annað eðli eftir þú vinnur með tungumálið fyrir smá. 211 00:10:57,181 --> 00:10:58,930 Svo vigra, hvernig þú Teikna vigur 212 00:10:58,930 --> 00:11:04,550 er þú slærð C, sem er leitarorðið, þá allar tölur sem þú vilt eða strengir 213 00:11:04,550 --> 00:11:06,490 eða hvað sem er. 214 00:11:06,490 --> 00:11:07,995 Rök einnig vektor. 215 00:11:07,995 --> 00:11:09,620 En vegna array fær fletja. 216 00:11:09,620 --> 00:11:14,385 Svo þú getur ekki hafa fylki hvar sumir þættir eru einn tölur 217 00:11:14,385 --> 00:11:17,010 og sumir þættir eru fylki sjálfir. 218 00:11:17,010 --> 00:11:20,010 >> Þannig að ef þú reynir að reisa array voru fyrsti þátturinn er 4 219 00:11:20,010 --> 00:11:22,370 og Annað þáttur er fylki 3,5 þú munt 220 00:11:22,370 --> 00:11:25,890 bara fá þrjá þætti array, 4,3,5. 221 00:11:25,890 --> 00:11:27,760 Þeir geta ekki verið af blönduðum gerð. 222 00:11:27,760 --> 00:11:32,290 Ef þú reynir að lesa eða skrifa utan marka vigurs 223 00:11:32,290 --> 00:11:36,640 þú munt fá þetta gildi kallast NA a sem stendur fyrir vantar gildi. 224 00:11:36,640 --> 00:11:39,900 Og þetta er ætlað fyrir eins tölfræðinga sem 225 00:11:39,900 --> 00:11:43,080 eru að vinna með ófullnægjandi gagnagrunna. 226 00:11:43,080 --> 00:11:46,460 >> Ef þú sækir um aðgerðina sem er ætlað að taka bara eitt númer til fjölda 227 00:11:46,460 --> 00:11:49,220 þá er það sem þú munt fá er aðgerð mun kortleggja yfir fylkisins. 228 00:11:49,220 --> 00:11:52,130 Þannig að ef virka segjum tekur númer og skilar það ferningur. 229 00:11:52,130 --> 00:11:58,170 Þú sækir að til fylkisins 2,3,5 Það sem þú munt fá er array 4,9,25. 230 00:11:58,170 --> 00:12:00,010 >> Og það er mjög gagnlegt því það þýðir að þú 231 00:12:00,010 --> 00:12:03,374 þurfa ekki að skrifa fyrir lykkjur fyrir gera mjög einfalda hluti eins beita 232 00:12:03,374 --> 00:12:05,040 aðgerð til allra félagsmanna í gögnum. 233 00:12:05,040 --> 00:12:08,557 Sem ef þú ert að vinna með stór gagnagrunnar, þú þarft að gera a einhver fjöldi. 234 00:12:08,557 --> 00:12:10,390 Tvöfaldur aðgerðir eru beitt færslu eftir færslu. 235 00:12:10,390 --> 00:12:12,430 Ég næ í það. 236 00:12:12,430 --> 00:12:16,750 Þú getur fengið aðgang að þeim með fylki eða vektor með hornklofum. 237 00:12:16,750 --> 00:12:22,300 Þannig að nafn vektor hornklofum 1 mun gefa þér fyrstu frumefni. 238 00:12:22,300 --> 00:12:25,510 Nafnið Vector hornklofum 2 mun gefa þér annað frumefni. 239 00:12:25,510 --> 00:12:27,530 >> Þú geta fara framhjá á vektor vísitalna og þú munt 240 00:12:27,530 --> 00:12:29,640 komast aftur út í grundvallaratriðum undir þáttur. 241 00:12:29,640 --> 00:12:34,990 Svo þú getur gert vektor nafn sviga C, 2,4 og þú munt fá út vektor sem inniheldur 242 00:12:34,990 --> 00:12:38,804 öðrum og fjórða þættir array. 243 00:12:38,804 --> 00:12:40,720 Og ef þú vilt bara Samantekt tölfræði 244 00:12:40,720 --> 00:12:47,529 af vektor eins kvartelabilið svið, miðgildi, hámark, hvað, 245 00:12:47,529 --> 00:12:49,820 þú getur bara slegið yfirlit vektor nafn og fá það út. 246 00:12:49,820 --> 00:12:52,680 Það er í raun ekki gagnlegt í forritun en ef þú ert að spila 247 00:12:52,680 --> 00:12:55,990 um gagnagrunna, það er vel. 248 00:12:55,990 --> 00:12:58,650 >> Matrices-- grundvallaratriðum hærri víddar fylki. 249 00:12:58,650 --> 00:13:01,190 Þeir hafa sérstakan veldistáknun setningafræði. 250 00:13:01,190 --> 00:13:07,620 Matrix með fjölda sem fær fyllt in-- miður, fylkinu sem gögn, 251 00:13:07,620 --> 00:13:09,780 Fjöldi lína, fjölda dálka. 252 00:13:09,780 --> 00:13:13,180 Þegar þú hefur nokkrar upplýsingar, fyllir það í array í rauninni að fara efst til botn 253 00:13:13,180 --> 00:13:13,380 fyrst. 254 00:13:13,380 --> 00:13:14,190 Þá vinstri til hægri. 255 00:13:14,190 --> 00:13:15,030 Svo, eins og þessi. 256 00:13:15,030 --> 00:13:17,809 257 00:13:17,809 --> 00:13:19,600 Og R hefur byggt í Matrix margfeldi, 258 00:13:19,600 --> 00:13:24,310 spectral niðurbrot, diagonalization, a einhver fjöldi af hlutur. 259 00:13:24,310 --> 00:13:27,785 Ef þú vilt meiri víddar fylki, svo 3, 4, 5, 260 00:13:27,785 --> 00:13:29,410 eða hvað mál sem þú getur gert það. 261 00:13:29,410 --> 00:13:34,400 The setningafræði er array lítil jafngildir c, þá listi yfir mál. 262 00:13:34,400 --> 00:13:38,620 Svo ef þú vilt a 4 víddar array með mál 4., 7., 8., 9., fylking, 263 00:13:38,620 --> 00:13:45,470 lítil jafngildir C (4,7,8,9). 264 00:13:45,470 --> 00:13:51,180 >> Þér aðgang einstaklings- gildi með sviga Fyrsta færsla kommu annarri færslu. 265 00:13:51,180 --> 00:13:54,870 Þú getur fengið allt sneiðar lína eða dálka. 266 00:13:54,870 --> 00:13:59,900 Með þessu ófullnægjandi setningafræði það er bara róa tala komma eða kommum dálk 267 00:13:59,900 --> 00:14:00,400 númer. 268 00:14:00,400 --> 00:14:02,874 269 00:14:02,874 --> 00:14:04,540 Svo listar eru eins konar tengslum fylkisins. 270 00:14:04,540 --> 00:14:06,360 Þeir hafa eigin setningafræði þeirra hér. 271 00:14:06,360 --> 00:14:08,320 Aftur ekki frantically afrita alla þessa niður. 272 00:14:08,320 --> 00:14:11,370 Þetta er bara þannig að fólk fara í gegnum renna síðar 273 00:14:11,370 --> 00:14:13,089 hafa þetta allt í fallegu tilvísun. 274 00:14:13,089 --> 00:14:16,130 Og þetta mun verða mjög eðlilegt þegar Ég geng reyndar í gegnum kynningum. 275 00:14:16,130 --> 00:14:19,295 276 00:14:19,295 --> 00:14:20,920 Svo útlistar rauninni tengist fylki. 277 00:14:20,920 --> 00:14:27,040 Þú getur fengið aðgang að gildi með Nafnið listi, dollaramerki, lykill. 278 00:14:27,040 --> 00:14:31,370 Svo ef þinn heitir foo, þá er hægt að nálgast það svona. 279 00:14:31,370 --> 00:14:37,032 Þú getur fengið heilt lykill-gildi par við brottför í veldi krappi vísitölunni. 280 00:14:37,032 --> 00:14:39,240 Ef þú lest úr non- lykill, munt þú fá null. 281 00:14:39,240 --> 00:14:41,150 Það mun ekki villa. 282 00:14:41,150 --> 00:14:43,590 Málið er, R vilja gera eins og mikið með null eins og það getur. 283 00:14:43,590 --> 00:14:46,580 Og þetta getur þýtt að ef þú ert ekki búast við að fá null út 284 00:14:46,580 --> 00:14:51,840 sumir lista lesa, munt þú fá sumir óútreiknanlegur villur neðar 285 00:14:51,840 --> 00:14:52,620 línan. 286 00:14:52,620 --> 00:14:54,890 >> Þetta gerðist við mig minn starf sumar þegar ég var að nota R 287 00:14:54,890 --> 00:14:58,410 þar sem ég breytti hvernig ákveðin lista var skilgreind í einum stað 288 00:14:58,410 --> 00:15:05,410 en ekki breyta síðar á kóða sem lesið gildi frá henni. 289 00:15:05,410 --> 00:15:10,190 Og svo það sem gerðist var að ég var lesa núll gildi út af þessum lista, 290 00:15:10,190 --> 00:15:13,090 liggur þá í aðgerðum, og vera mjög ruglaður 291 00:15:13,090 --> 00:15:16,000 þegar ég fékk alls konar handahófi infinities cropping upp 292 00:15:16,000 --> 00:15:16,790 í þessa aðgerð. 293 00:15:16,790 --> 00:15:20,730 Vegna þess að ef þú sækir viss hámark eða lágmarkskröfur aðgerðir á núll, 294 00:15:20,730 --> 00:15:22,570 þú munt fá óendanlega gildi út. 295 00:15:22,570 --> 00:15:26,400 296 00:15:26,400 --> 00:15:29,180 >> Gögn rammar, þá eru þeir undirflokkur listanum. 297 00:15:29,180 --> 00:15:31,170 Sérhver gildi er vektor af sömu lengd. 298 00:15:31,170 --> 00:15:34,220 Og þeir eru að nota til að kynna, grundvallaratriðum, töflum. 299 00:15:34,220 --> 00:15:36,175 Það er þetta frumstilling setningafræði. 300 00:15:36,175 --> 00:15:38,800 Þetta mun allt, aftur, miklu skýrari þegar þú fá til the kynningu. 301 00:15:38,800 --> 00:15:42,240 302 00:15:42,240 --> 00:15:44,240 Og ágætur hlutur óður gögn ramma er að þér 303 00:15:44,240 --> 00:15:49,380 getur gefið nafn öllum dálkum og nöfn til allra raðir. 304 00:15:49,380 --> 00:15:53,890 Og svo gerir að aðgangur þeim aðeins vinalegri. 305 00:15:53,890 --> 00:15:59,130 Einnig er þetta hvernig flest störf sem lesa í gögn frá Excel tafla 306 00:15:59,130 --> 00:16:03,820 eða úr skrá texta, til dæmis, mun lesa í gögnum sínum. 307 00:16:03,820 --> 00:16:07,555 Þeir setja það inn einhvers konar gögn ramma. 308 00:16:07,555 --> 00:16:09,680 Svo functions-- aðgerðir setningafræði er svolítið skrítið. 309 00:16:09,680 --> 00:16:16,160 Aftur er það nafn af the virka, úthluta, þetta leitarorð virka og þá 310 00:16:16,160 --> 00:16:17,900 listi yfir rök. 311 00:16:17,900 --> 00:16:24,080 Þannig að það eru sumir ágætur atriði um hvernig aðgerðir vinna hér. 312 00:16:24,080 --> 00:16:28,170 Fyrir einn, getur þú í raun að tengja sjálfgefnar ákveðnum rökum. 313 00:16:28,170 --> 00:16:32,910 Svo þú getur sagt R1 equals-- þú getur sagt foo 314 00:16:32,910 --> 00:16:38,290 er fall þar sem R1 jafnt eitthvað sjálfgefið ef notandinn skilgreinir 315 00:16:38,290 --> 00:16:39,090 engin rök. 316 00:16:39,090 --> 00:16:41,932 Annars er það hvað hann setti í. 317 00:16:41,932 --> 00:16:44,140 Og þetta er mjög vel vegna þess að mikið af störfum okkar 318 00:16:44,140 --> 00:16:47,910 oft heilmikið eða hundruð rök. 319 00:16:47,910 --> 00:16:51,210 Til dæmis þær sem fyrir samsærismaður myndrit eða samsærismaður dreifið Lóðir 320 00:16:51,210 --> 00:16:54,430 hafa rök sem stjórna allt frá titli og ás 321 00:16:54,430 --> 00:16:59,512 merki til lit aðhvarfsgreiningu línum. 322 00:16:59,512 --> 00:17:01,470 Og svo ef þú vilt ekki til að gera fólk að tilgreina 323 00:17:01,470 --> 00:17:04,050 hvert einasta einn af þessum hundruð rök 324 00:17:04,050 --> 00:17:07,674 stjórna hvert einasta þætti lóð eða afturför eða hvað, 325 00:17:07,674 --> 00:17:09,299 það er gott að hafa þessar sjálfgefin gildi. 326 00:17:09,299 --> 00:17:12,700 327 00:17:12,700 --> 00:17:19,146 >> Og þá getur þú í raun að skrifa eins og þú sást aftur hingað. 328 00:17:19,146 --> 00:17:22,869 Eða finna betri dæmi. 329 00:17:22,869 --> 00:17:28,690 Þegar hringt aðgerðir sem þú getur í raun kalla þá nota rök nöfn. 330 00:17:28,690 --> 00:17:33,919 Svo er hér dæmi um fylkið framkvæmdaaðila. 331 00:17:33,919 --> 00:17:34,960 Það tekur þrjár rök. 332 00:17:34,960 --> 00:17:36,760 Venjulega þú hefur gögn, sem er vektor. 333 00:17:36,760 --> 00:17:38,920 Þú ert N röð, sem er fjöldi lína. 334 00:17:38,920 --> 00:17:41,160 Þú ert N cols-- fjölda dálka. 335 00:17:41,160 --> 00:17:43,920 Málið er ef þú skrifar N röð yfir hvað 336 00:17:43,920 --> 00:17:46,520 og N Col jafngildir hvað sem þegar þú ert að kalla þessa aðgerð, 337 00:17:46,520 --> 00:17:47,770 þú getur raunverulega snúa þeim. 338 00:17:47,770 --> 00:17:51,590 Svo er hægt að setja N Col fyrst og N röð annað og það breytir engu. 339 00:17:51,590 --> 00:17:54,660 Svo er það ágætur lítill lögun. 340 00:17:54,660 --> 00:17:56,260 >> Gerði innflutning og útflutning. 341 00:17:56,260 --> 00:18:00,010 Þetta er hægt að gera, í grundvallaratriðum. 342 00:18:00,010 --> 00:18:03,816 Það eru einnig aðstaða til að skrifa út handahófskennt R mótmælir tvöfaldur skrá 343 00:18:03,816 --> 00:18:05,190 og þá lesa þau aftur síðar. 344 00:18:05,190 --> 00:18:08,030 Sem er vel ef þú ert að gera stór gagnvirkt fundur R 345 00:18:08,030 --> 00:18:12,850 og þú þarft að vista það mjög fljótt. 346 00:18:12,850 --> 00:18:16,460 Sjálfgefið R hefur vinna möppu sem skrár fá skrifað út í 347 00:18:16,460 --> 00:18:19,410 og lesa aftur frá. 348 00:18:19,410 --> 00:18:22,350 Þú getur séð það með getwg, breyta því með setdw. 349 00:18:22,350 --> 00:18:25,630 Ekkert sérstaklega áhugavert hér 350 00:18:25,630 --> 00:18:28,270 >> Svo nú í raun tölfræði stuff-- multilinear aðhvarfsgreiningu. 351 00:18:28,270 --> 00:18:30,960 352 00:18:30,960 --> 00:18:34,910 Svo venjulegum setningafræði er dálítið flókið. 353 00:18:34,910 --> 00:18:37,260 Líkanið er stór hlutur í grundvallaratriðum. 354 00:18:37,260 --> 00:18:39,910 Það fær úthlutað til LM, sem er fall hringja. 355 00:18:39,910 --> 00:18:43,840 Fyrsti þáttur, y tilda x1 plús hvað sem er. 356 00:18:43,840 --> 00:18:46,574 357 00:18:46,574 --> 00:18:47,990 Setningafræði mín hér er dálítið ruglingslegt. 358 00:18:47,990 --> 00:18:49,490 Ég er alveg miður, þetta er staðall leið 359 00:18:49,490 --> 00:18:50,990 að tölvunarfræði bók gera þetta. 360 00:18:50,990 --> 00:18:54,890 En það er dálítið undarlegt. 361 00:18:54,890 --> 00:18:58,200 >> Svo í rauninni, það er LM sviga, fyrsta lið 362 00:18:58,200 --> 00:19:06,730 er variable-- miður, háð breyta tilda x1 plús x2 plús 363 00:19:06,730 --> 00:19:10,910 þó margir sjálfstætt breytur sem þú hefur. 364 00:19:10,910 --> 00:19:14,240 Og þá eru þessir geta annað hvort að vera vektor, öllum sama lengd. 365 00:19:14,240 --> 00:19:16,220 Eða þeir geta verið dálkur haus í gögnum ramma 366 00:19:16,220 --> 00:19:18,553 sem þú tilgreinir bara í Önnur rökin gögn ramma. 367 00:19:18,553 --> 00:19:23,270 368 00:19:23,270 --> 00:19:26,380 >> Þú getur einnig tilgreint flóknari formúla 369 00:19:26,380 --> 00:19:31,990 svo þú þarft ekki að línulega læknað a einn háða breytan, 370 00:19:31,990 --> 00:19:34,440 eða einni ferju á fyrirliggjandi vektor. 371 00:19:34,440 --> 00:19:38,070 Þú getur til dæmis vektor hluti Y veldi plús 1 372 00:19:38,070 --> 00:19:42,100 og læknað að móti log af einhverjum öðrum vektor. 373 00:19:42,100 --> 00:19:45,200 Hægt er að prenta samantektir líkan með þessa skipun sem heitir 374 00:19:45,200 --> 00:19:48,607 summary-- bara samantekt parens líkan. 375 00:19:48,607 --> 00:19:50,190 Aftur eitthvað annað sem ég ætti að skýra. 376 00:19:50,190 --> 00:19:55,407 377 00:19:55,407 --> 00:19:58,615 Eitthvað annað sem mun fá leiðrétt þegar renna upp á internetinu. 378 00:19:58,615 --> 00:20:01,127 379 00:20:01,127 --> 00:20:03,210 Ef þú vilt bara að reikna einfalt fylgni 380 00:20:03,210 --> 00:20:09,170 þú getur notað fylgni vigur 1 vektor 2 virka algerlega. 381 00:20:09,170 --> 00:20:11,856 Aðferð er sjálfgefið Pearson fylgni. 382 00:20:11,856 --> 00:20:13,480 Þeir eru staðlaðar sjálfur þú getur gert. 383 00:20:13,480 --> 00:20:15,990 Einnig Spearman og Kendell fylgni 384 00:20:15,990 --> 00:20:19,530 sem eru nokkrar margs Lesblinda röð fylgni. 385 00:20:19,530 --> 00:20:23,600 Jæja þeir ekki reikna vöru augnablik milli vigra sjálfum, 386 00:20:23,600 --> 00:20:28,511 en af ​​staða pantanir Vigurinn er. 387 00:20:28,511 --> 00:20:29,510 Ég skal útskýra það síðar. 388 00:20:29,510 --> 00:20:30,120 >> Áhorfendur: Quick spurning 389 00:20:30,120 --> 00:20:30,360 >> CONNER HARRIS: Jú. 390 00:20:30,360 --> 00:20:33,151 >> Áhorfendur: Svo þegar þú ert að reikna Fyrir þeirri einföldu fylgni gera 391 00:20:33,151 --> 00:20:37,655 þú ráð fyrir að það er tölfræðileg þýðingu á fylgni? 392 00:20:37,655 --> 00:20:39,030 CONNER HARRIS: Þú þarft ekki að. 393 00:20:39,030 --> 00:20:41,840 394 00:20:41,840 --> 00:20:43,960 An LM er í grundvallaratriðum bara vél. 395 00:20:43,960 --> 00:20:47,690 Það mun taka í tveimur hlutum og það mun spýta út 396 00:20:47,690 --> 00:20:49,770 stuðlarnir fyrir bestu línu. 397 00:20:49,770 --> 00:20:52,310 Hún lýsir einnig staðall villur á þeim stuðlum. 398 00:20:52,310 --> 00:20:55,865 Og það mun segja þér, eins og er stöðva tölfræðilega marktækur 399 00:20:55,865 --> 00:20:56,740 eða munur frá 0. 400 00:20:56,740 --> 00:20:59,400 Er halla bestu passa lína tölfræðilega 401 00:20:59,400 --> 00:21:01,510 frábrugðin núlli, et cetera. 402 00:21:01,510 --> 00:21:06,260 Svo það er gert ráð fyrir ekkert, ég held er besta svarið við spurningunni þinni. 403 00:21:06,260 --> 00:21:07,410 OK. 404 00:21:07,410 --> 00:21:14,650 >> Plotting-- svo helsta ástæða að þú ættir nota R, eins og multilinear aðhvarfsgreiningu. 405 00:21:14,650 --> 00:21:17,320 Grundvallaratriðum að sérhvert tungumál hefur einhverja aðstöðu fyrir það. 406 00:21:17,320 --> 00:21:21,365 Og setningafræði heiðarlega R fyrir aðhvarfsgreiningu er dálítið yfirnáttúrulegt. 407 00:21:21,365 --> 00:21:22,990 En samsærismaður er þar sem það skín í raun. 408 00:21:22,990 --> 00:21:28,090 >> The dráttarklár virka er samsæri og það tekur tvo vigra, x og y. 409 00:21:28,090 --> 00:21:33,010 Og þá ellipses stendur fyrir mjög Fjölmargar valfrjálst rök að 410 00:21:33,010 --> 00:21:39,190 stjórna öllu frá titlum litum ýmissa línur eða ýmsum stöðum, 411 00:21:39,190 --> 00:21:40,200 að gerð söguþræði. 412 00:21:40,200 --> 00:21:42,250 Hægt er að hafa dreifið Lóðir eða lína Lóðir. 413 00:21:42,250 --> 00:21:47,900 414 00:21:47,900 --> 00:21:49,710 >> [Inaudible] 2 vektor af sömu lengd. 415 00:21:49,710 --> 00:21:53,780 Þú getur undan þessu með festu gögn ramma í handritið. 416 00:21:53,780 --> 00:22:01,220 Og þetta mun leyfa þér að nota bara dálk haus í stað aðskildum vigra. 417 00:22:01,220 --> 00:22:05,410 Þú getur bætt við bestu línu og sveitarfélaga afturför línur til línurit þitt. 418 00:22:05,410 --> 00:22:09,390 >> Þessar skipanir skráð hér, AB línu og línur, 419 00:22:09,390 --> 00:22:11,640 sjálfgefið þetta fá skrifaður í pop up glugga 420 00:22:11,640 --> 00:22:15,560 vegna þess að það gerir ráð fyrir að þú ert að nota R gagnvirkt. 421 00:22:15,560 --> 00:22:17,310 Ef þú ert ekki þú getur skrifa tvær skrár sem 422 00:22:17,310 --> 00:22:21,600 eru í raun allir snið þú vilt. 423 00:22:21,600 --> 00:22:25,410 Sorry, ég er með innsláttarvillu Ég áttaði mig bara. 424 00:22:25,410 --> 00:22:30,887 425 00:22:30,887 --> 00:22:32,720 Ef þú vilt opna annar myndræna tæki 426 00:22:32,720 --> 00:22:39,200 þú getur notað þessa virkni sem kallast PNG eða JPEG eða fullt af öðrum sniðum mynd. 427 00:22:39,200 --> 00:22:42,319 Og þú getur skrifað myndrit til hvað skrá nafn sem þú tilgreinir. 428 00:22:42,319 --> 00:22:45,110 Til að hætta við að þú þarft að use-- Ég vissi ekki að skrifa þetta í slide-- 429 00:22:45,110 --> 00:22:49,650 en það er aðgerð sem kallast dev punktur burt sem tekur ekki rök. 430 00:22:49,650 --> 00:22:51,517 >> Þá er aðstaða fyrir 3D samsærismaður 431 00:22:51,517 --> 00:22:53,350 og fyrir útlínu samsærismaður ef þú vilt gera 432 00:22:53,350 --> 00:22:55,700 gröf tveimur sjálfstæðum breytum. 433 00:22:55,700 --> 00:22:57,150 Ég mun ekki fá í þessum núna. 434 00:22:57,150 --> 00:22:59,130 >> Það eru einnig nokkur Aðstaða fyrir fjör 435 00:22:59,130 --> 00:23:01,300 þeir eru yfirleitt viðhaldið af þriðja aðila. 436 00:23:01,300 --> 00:23:06,330 Ég hef gert fjör með R gröf, en ég hef ekki notað þessar þriðja aðila 437 00:23:06,330 --> 00:23:06,940 bókasöfn. 438 00:23:06,940 --> 00:23:09,929 Svo ég get í raun ekki staðfesta að hversu góð þau eru. 439 00:23:09,929 --> 00:23:12,220 Það sem ég mæli með ef þú vilt að gera hreyfimyndir með R 440 00:23:12,220 --> 00:23:16,480 er hægt að skrifa út allar rammar fyrir fjör 441 00:23:16,480 --> 00:23:18,470 og þá er hægt að nota þriðja aðila program-- 442 00:23:18,470 --> 00:23:23,630 dæmigerð Þeir eru kallaðir FFmpeg eða ImageMagick-- að sauma 443 00:23:23,630 --> 00:23:26,540 allar rammar inn í einn fjör. 444 00:23:26,540 --> 00:23:28,380 >> Svo tíma fyrir kynningu. 445 00:23:28,380 --> 00:23:31,030 446 00:23:31,030 --> 00:23:37,189 Svo ef þú ert að nota hvaða Unix eins kerfi sem er Linux BSD en hver notar BSD. 447 00:23:37,189 --> 00:23:39,730 OS X opna Terminal glugga og Type R í stjórn hvetja. 448 00:23:39,730 --> 00:23:42,820 Ef þú ert R stúdíó eða þess háttar, sem einnig virkar. 449 00:23:42,820 --> 00:23:46,270 Fyrir Windows notendur sem þú ættir að vera fær um að finna R í Start valmyndinni. 450 00:23:46,270 --> 00:23:50,390 Það ætti að vera kölluð eitthvað eins R x64 3. liður hvað. 451 00:23:50,390 --> 00:23:53,110 Opinn það upp þar. 452 00:23:53,110 --> 00:23:58,850 >> Svo nú láta mig bara opna Terminal glugga. 453 00:23:58,850 --> 00:24:02,562 Allt í lagi, leita. 454 00:24:02,562 --> 00:24:03,520 Áhorfendur: Command-Space 455 00:24:03,520 --> 00:24:06,675 CONNER HARRIS: Command-Space, þakka þér. 456 00:24:06,675 --> 00:24:10,030 Ég er ekki venjulega nota Macs. 457 00:24:10,030 --> 00:24:13,310 Terminal, sýna að nýja glugga. 458 00:24:13,310 --> 00:24:18,120 Nýjum glugga er stillingar undirstöðu, R. Svo þú ættir að fá 459 00:24:18,120 --> 00:24:22,230 velkomin skilaboð, eitthvað eins og þetta. 460 00:24:22,230 --> 00:24:31,060 >> Þannig að ég ætla að nota R gagnvirkt. 461 00:24:31,060 --> 00:24:32,719 Þú getur líka skrifað R skriftum að sjálfsögðu. 462 00:24:32,719 --> 00:24:34,510 Í grundvallaratriðum forskriftir hlaupa nákvæmlega sama hátt og 463 00:24:34,510 --> 00:24:40,250 ef þú varst að sitja við tölvuna slá inn í hverja línu einu í einu. 464 00:24:40,250 --> 00:24:42,660 Svo skulum byrja á því að gera vigur. 465 00:24:42,660 --> 00:24:46,230 A ör C 1, 2. 466 00:24:46,230 --> 00:24:49,400 1, 2, 4. 467 00:24:49,400 --> 00:24:50,050 OK, viss. 468 00:24:50,050 --> 00:24:51,630 Ég get gert leturstærð stærri. 469 00:24:51,630 --> 00:24:53,030 >> Áhorfendur: Command-Plus 470 00:24:53,030 --> 00:24:53,650 >> CONNER HARRIS: Command-Plus. 471 00:24:53,650 --> 00:24:54,191 Command-Plus. 472 00:24:54,191 --> 00:24:57,610 473 00:24:57,610 --> 00:25:00,370 Allt í lagi, hvernig er það? 474 00:25:00,370 --> 00:25:00,870 Gott? 475 00:25:00,870 --> 00:25:01,551 OK. 476 00:25:01,551 --> 00:25:03,300 Svo skulum byrja á því að lýsa vektor skrá. 477 00:25:03,300 --> 00:25:08,710 Gera, ör, C 1.2.4. 478 00:25:08,710 --> 00:25:11,181 Við getum séð. 479 00:25:11,181 --> 00:25:12,680 Ekki hafa áhyggjur óður í the krappi þar. 480 00:25:12,680 --> 00:25:18,590 Sviga eru svo ef þú prentað út mjög lengi fylki, við getum þar sem þú ert. 481 00:25:18,590 --> 00:25:26,987 Eitt dæmi myndi vera ef ég bara bilinu 2 til 200. 482 00:25:26,987 --> 00:25:28,820 Ef ég prenta mjög lengi array, sviga 483 00:25:28,820 --> 00:25:31,060 eru bara svo ég geti haldið fylgjast með því hvaða vísitölu 484 00:25:31,060 --> 00:25:33,250 við erum á ef ég er að leita í gegnum þetta sjónrænt. 485 00:25:33,250 --> 00:25:36,570 486 00:25:36,570 --> 00:25:38,280 Svo einhvern veginn höfum við a. 487 00:25:38,280 --> 00:25:43,326 >> Svo ég sagði áður að fylki samskipti mjög vel með, til dæmis, 488 00:25:43,326 --> 00:25:44,450 unary starfsemi eins og þetta. 489 00:25:44,450 --> 00:25:46,500 Svo hvað þér ég fá ef ég tegund plús 1? 490 00:25:46,500 --> 00:25:49,630 491 00:25:49,630 --> 00:25:51,140 Jebb. 492 00:25:51,140 --> 00:25:54,250 Einmitt, nú ég ætla að gera þetta öðruvísi array. 493 00:25:54,250 --> 00:26:01,650 Skulum segja b c 20,40, 80. 494 00:26:01,650 --> 00:26:03,400 Svo hvað finnst þér Þessi stjórn mun gera? 495 00:26:03,400 --> 00:26:09,962 496 00:26:09,962 --> 00:26:10,670 Bæta þætti. 497 00:26:10,670 --> 00:26:14,950 Og svo í rauninni er það sem það gerir. 498 00:26:14,950 --> 00:26:16,740 Svo er þetta nokkuð þægilegt. 499 00:26:16,740 --> 00:26:23,800 Svo ég hvernig um ég gera þetta. c er, við skulum segja, 6 sinnum 1 til 10. 500 00:26:23,800 --> 00:26:26,789 501 00:26:26,789 --> 00:26:28,830 Svo hvað ég vil sjá gámur, finnst þér? 502 00:26:28,830 --> 00:26:37,110 503 00:26:37,110 --> 00:26:38,110 Svo allir margfeldi af sex. 504 00:26:38,110 --> 00:26:42,170 Nú, hvað finnst þér gerist ef ég geri þetta? 505 00:26:42,170 --> 00:26:48,090 Ég ætla að gera þetta svolítið skýrari, C, C. 506 00:26:48,090 --> 00:26:50,365 Svo gerist það, er það nokkuð hugsa, ef ég geri þetta? 507 00:26:50,365 --> 00:26:51,488 plús c. 508 00:26:51,488 --> 00:26:55,550 509 00:26:55,550 --> 00:26:56,050 [Inaudible] 510 00:26:56,050 --> 00:26:58,552 511 00:26:58,552 --> 00:27:02,350 >> Áhorfendur: Annaðhvort villu eða það bara bætir fyrstu þrjá þætti. 512 00:27:02,350 --> 00:27:04,510 >> CONNER HARRIS: Ekki alveg. 513 00:27:04,510 --> 00:27:05,522 Þetta er það sem við fengum. 514 00:27:05,522 --> 00:27:08,910 Hvað gerist er styttri array, a, fékk hjólaði. 515 00:27:08,910 --> 00:27:13,990 Þannig að við fengum 124, 124, 124. 516 00:27:13,990 --> 00:27:15,710 Já. 517 00:27:15,710 --> 00:27:18,940 Og í rauninni er hægt að skoða þessi hegðun áður, plús 1, 518 00:27:18,940 --> 00:27:22,190 sem undirflokki þessa hegðun, þar sem stysta array er bara númer 519 00:27:22,190 --> 00:27:25,410 1, sem er einn þáttur array. 520 00:27:25,410 --> 00:27:27,740 Ég bara að segja vektor allt tími stað array, 521 00:27:27,740 --> 00:27:30,290 því það er það sem r skjöl er venjulega. 522 00:27:30,290 --> 00:27:33,070 Það er samgróin c venja. 523 00:27:33,070 --> 00:27:37,590 >> OK, og svo nú höfum við þetta fylki. 524 00:27:37,590 --> 00:27:38,830 Þannig að við höfum þetta array, c. 525 00:27:38,830 --> 00:27:41,380 Við getum fengið yfirlit hagskýrslur um c, samantekt c. 526 00:27:41,380 --> 00:27:46,920 527 00:27:46,920 --> 00:27:48,280 Og það er gott. 528 00:27:48,280 --> 00:27:51,070 529 00:27:51,070 --> 00:27:52,670 Svo nú skulum gera sumir Matrix hluti. 530 00:27:52,670 --> 00:27:56,160 Skulum segja m er fylki. 531 00:27:56,160 --> 00:27:57,780 Við skulum gera það þrjú af þremur einu. 532 00:27:57,780 --> 00:28:01,630 Svo nrows jafngildir 3 og ncols jafngildir 3. 533 00:28:01,630 --> 00:28:04,190 534 00:28:04,190 --> 00:28:10,710 Og fyrir gögn skulum do-- svo hvað finnst þér þetta er að fara að gera? 535 00:28:10,710 --> 00:28:15,310 536 00:28:15,310 --> 00:28:16,580 >> Rétt, það er næsta einn. 537 00:28:16,580 --> 00:28:17,970 Það er nrow og ncolumn. 538 00:28:17,970 --> 00:28:22,164 539 00:28:22,164 --> 00:28:24,580 Svo er það sem ég hef gert að ég hef lýst þriggja af þremur fylki 540 00:28:24,580 --> 00:28:26,950 og ég hef samþykkt í níu staka fylki. 541 00:28:26,950 --> 00:28:30,530 Svo lógaritma allt þættir einn til níu. 542 00:28:30,530 --> 00:28:33,400 543 00:28:33,400 --> 00:28:37,285 Og öllum þeim gildum fylla upp array-- hryggur? 544 00:28:37,285 --> 00:28:38,660 Áhorfendur: Þeir eru grunnfjárhæðir 10 logs? 545 00:28:38,660 --> 00:28:41,284 CONNER HARRIS: Nei, log er náttúrlega lógaritma, þannig grunn e. 546 00:28:41,284 --> 00:28:44,886 547 00:28:44,886 --> 00:28:47,010 Já, ef þú vildir stöð 10 Log, held ég að þú vilt hafa 548 00:28:47,010 --> 00:28:51,620 til að skrá þig hvað, deilt með log 10. 549 00:28:51,620 --> 00:28:56,750 Og svo gögnin sem [inaudible] bara fyllir upp array, svo toppur til botn, 550 00:28:56,750 --> 00:28:59,490 þá vinstri til hægri. 551 00:28:59,490 --> 00:29:06,890 Og ef þú vildir gera einhver önnur array, við skulum segja n er fylki. 552 00:29:06,890 --> 00:29:10,317 Við skulum gera, ég veit ekki, 2 til 13. 553 00:29:10,317 --> 00:29:11,900 Eða ég ætla að gera eitthvað meira áhugavert. 554 00:29:11,900 --> 00:29:13,770 Ég mun gera 2 til 4. 555 00:29:13,770 --> 00:29:15,780 nrow jafngildir, við skulum segja, 3. 556 00:29:15,780 --> 00:29:18,992 Ncol jafngildir 4. 557 00:29:18,992 --> 00:29:20,360 n. 558 00:29:20,360 --> 00:29:22,090 Þannig að við höfum fengið þetta. 559 00:29:22,090 --> 00:29:26,130 >> Og nú ef við viljum að margfalda þetta, við myndum gera n prósent sinnum prósent, 560 00:29:26,130 --> 00:29:27,680 því það er n. 561 00:29:27,680 --> 00:29:30,234 562 00:29:30,234 --> 00:29:31,400 Og við höfum Matrix vörur. 563 00:29:31,400 --> 00:29:33,970 564 00:29:33,970 --> 00:29:37,810 Með því að þeir hætti, sástu hvernig þegar ég lýsti n er 2 til 4 565 00:29:37,810 --> 00:29:43,570 vektor fékk hjólaði þar fyllti upp alla n? 566 00:29:43,570 --> 00:29:45,710 Ef þú vildir taka eigingildið niðurbrot, 567 00:29:45,710 --> 00:29:46,960 þetta er eitthvað sem við getum gert mjög auðveldlega. 568 00:29:46,960 --> 00:29:47,709 Við getum gert Eigen n. 569 00:29:47,709 --> 00:29:52,290 570 00:29:52,290 --> 00:29:54,600 Og svo er þetta fyrsta vor fundur með lista. 571 00:29:54,600 --> 00:29:57,000 >> Svo Eigen n er listi með tveimur lyklum. 572 00:29:57,000 --> 00:29:58,430 Gildi, sem er þetta array hér. 573 00:29:58,430 --> 00:30:01,030 Og vektor, sem er þetta array hér. 574 00:30:01,030 --> 00:30:08,240 Svo ef þú vildir að draga, segjum þetta þriðja dálki 575 00:30:08,240 --> 00:30:13,080 frá eiginvektorar fylki, vegna að eiginvigrar eru dálki vigrar. 576 00:30:13,080 --> 00:30:24,400 Þannig að við getum gert vec Eigen n dollaramerki vektor, komma 3, af [inaudible]. 577 00:30:24,400 --> 00:30:29,800 578 00:30:29,800 --> 00:30:30,900 Vec. 579 00:30:30,900 --> 00:30:34,100 Er það, eins og þú gætir átt von á. 580 00:30:34,100 --> 00:30:39,210 >> Þá segja n sinnum prósent sinnum vec. 581 00:30:39,210 --> 00:30:42,610 582 00:30:42,610 --> 00:30:48,320 Svo niðurstaðan hér vissulega lítur út eins og ef við tók þriðja eigingildisverkefnið hér, 583 00:30:48,320 --> 00:30:50,390 sem samsvarar þriðja eigenvector. 584 00:30:50,390 --> 00:30:53,190 Það margfaldast bara allt í þetta eigenvector, hluti-vitur, 585 00:30:53,190 --> 00:30:53,990 af eigingildisverkefnið. 586 00:30:53,990 --> 00:30:57,760 Og það er það sem við myndum búast við, því það er það eigingildi eru. 587 00:30:57,760 --> 00:31:00,890 Hefur einhver hér ekki tekið línuleg algebra? 588 00:31:00,890 --> 00:31:02,530 Tveimur fólk, OK. 589 00:31:02,530 --> 00:31:04,030 Bara snúa gáfur þínar burt fyrir a hluti. 590 00:31:04,030 --> 00:31:07,490 591 00:31:07,490 --> 00:31:20,720 Og reyndar ef við tökum Eigen n dollaramerki gildi 3 sinnum vec, 592 00:31:20,720 --> 00:31:21,810 vel að fá það sama. 593 00:31:21,810 --> 00:31:24,726 Það er á mismunandi sniði sem röð vektor í stað þess að dálk genaferju, 594 00:31:24,726 --> 00:31:25,640 en stór samningur. 595 00:31:25,640 --> 00:31:29,430 596 00:31:29,430 --> 00:31:35,170 Og svo þeir eru í grundvallaratriðum ágætur hlutir sem við getum gert við fylkjum, 597 00:31:35,170 --> 00:31:36,489 sýnt listum. 598 00:31:36,489 --> 00:31:39,030 Ég ætti að sýna fram á gott atriði um virka eins og heilbrigður. 599 00:31:39,030 --> 00:31:41,750 >> Svo skulum say-- [inaudible] virka, hringja skulum 600 00:31:41,750 --> 00:31:51,960 það Func gegn virka n n squared-- reyndar, það er í raun ekki sú besta. 601 00:31:51,960 --> 00:31:55,632 a, b, a ferningur plús b. 602 00:31:55,632 --> 00:31:58,547 603 00:31:58,547 --> 00:32:00,380 Svo bara eitt um aðgerðir, aftur, er þeir 604 00:32:00,380 --> 00:32:01,963 þarft ekki skýr yfirlýsingar aftur. 605 00:32:01,963 --> 00:32:04,250 Svo er hægt að just-- á síðustu yfirlýsingu metin 606 00:32:04,250 --> 00:32:07,502 verður yfirlýsingu aftur, eða gildi aftur. 607 00:32:07,502 --> 00:32:10,460 Þannig að í þessu tilfelli erum við aðeins að meta einn yfirlýsingu, a ferningur plús b. 608 00:32:10,460 --> 00:32:12,043 Það verður sjálfgefið skilagildi. 609 00:32:12,043 --> 00:32:14,530 Það er aldrei sárt að setja í aftur gildi skýrt, 610 00:32:14,530 --> 00:32:16,880 sérstaklega ef þú ert að takast á við virka mjög flókið rökfræði 611 00:32:16,880 --> 00:32:17,380 renna. 612 00:32:17,380 --> 00:32:18,450 En þú þarft ekki á þeim. 613 00:32:18,450 --> 00:32:24,890 Svo nú getum við gert Störf 5, 1, og þetta er í grundvallaratriðum það sem þú vilt búast. 614 00:32:24,890 --> 00:32:29,146 615 00:32:29,146 --> 00:32:31,270 Eitthvað annað sem við getum gert, við getum í raun gert Störf b 616 00:32:31,270 --> 00:32:33,260 jafnt og 1, sem er jafngildir 5. 617 00:32:33,260 --> 00:32:36,870 618 00:32:36,870 --> 00:32:40,770 Þannig að ef við tilgreina hvaða fjölda hér, sem rök fer sem rök 619 00:32:40,770 --> 00:32:44,680 í aðgerðina, getum við Flip kringum þessi gildi hvar sem við viljum. 620 00:32:44,680 --> 00:32:48,405 >> Áhorfendur: Er einhver ástæða að skrifa það út með b 621 00:32:48,405 --> 00:32:52,404 jafngildir öfugt við bara að nota tölur og komma? 622 00:32:52,404 --> 00:32:54,820 CONNER HARRIS: Já, yfirleitt gera þetta ef þú ert með virka 623 00:32:54,820 --> 00:32:58,540 með fullt af rökum. 624 00:32:58,540 --> 00:33:00,690 Það gæti oft verið eins og fánar sem þú vilt bara 625 00:33:00,690 --> 00:33:03,130 vilt nota í mjög sjaldgæfum tilvikum. 626 00:33:03,130 --> 00:33:06,740 Og þannig að þú getur only-- þig getur átt við ákveðin rök 627 00:33:06,740 --> 00:33:09,110 sem þú vilt nota ekki sjálfgefin gildi fyrir, 628 00:33:09,110 --> 00:33:14,470 og þú þarft ekki að skrifa út fullt af fánar jafngildir rangar eftir þeim. 629 00:33:14,470 --> 00:33:19,710 Eða ég get skrifað þetta aftur með sjálfgefið gildi eins b jafngildir 2. 630 00:33:19,710 --> 00:33:26,289 Og þá gat ég gert f Störf, Ég geri 4, 1 að þessu sinni. 631 00:33:26,289 --> 00:33:28,580 Og 17, sem er 4 í öðru veldi plús 1, eins og þú might búast. 632 00:33:28,580 --> 00:33:34,290 >> En ég gat líka bara kalla þetta með Störf 4, 633 00:33:34,290 --> 00:33:36,970 og ég ætla að fá 18, vegna þess að Ég tilgreinir ekki b. 634 00:33:36,970 --> 00:33:38,550 Svo fær b sjálfgefið gildi 2. 635 00:33:38,550 --> 00:33:41,700 636 00:33:41,700 --> 00:33:47,200 >> OK, svo nú ef þú ert Eftirfarandi ásamt kynningu, 637 00:33:47,200 --> 00:33:51,010 gerð þessa línu á stjórn þinni hvetja og sjá hvað kemur upp. 638 00:33:51,010 --> 00:33:52,090 Reyndar veit það ekki. 639 00:33:52,090 --> 00:33:52,590 Tegund þetta. 640 00:33:52,590 --> 00:33:57,780 641 00:33:57,780 --> 00:34:01,000 Þú ættir að fá eitthvað eins og this. 642 00:34:01,000 --> 00:34:04,780 Svo mtcars er byggð á gögnum sett fyrir þessum mótmælum 643 00:34:04,780 --> 00:34:13,550 tilgangi sem kemur with-- sem kemur í sjálfgefið með r dreifinguna þína. 644 00:34:13,550 --> 00:34:19,211 Þetta er samantekt á tölum frá a 1974 útgáfu tímaritsins Motor Trend er 645 00:34:19,211 --> 00:34:20,710 á ýmsum gerðum bíla. 646 00:34:20,710 --> 00:34:28,270 >> Svo er það kílómetra á lítra, cylinders-- Ég gleymi því Disp is-- hestöfl. 647 00:34:28,270 --> 00:34:31,610 648 00:34:31,610 --> 00:34:32,420 Sennilega. 649 00:34:32,420 --> 00:34:36,920 Ef þú bara Google MT bíla, þá einn af þeim fyrstu niðurstöður 650 00:34:36,920 --> 00:34:38,730 verða úr opinber r skjöl 651 00:34:38,730 --> 00:34:41,080 og það mun útskýra Öll þessi gögn sviðum. 652 00:34:41,080 --> 00:34:47,020 Svo þyngd is-- wt er þyngd á bílnum í tonn. 653 00:34:47,020 --> 00:34:48,880 Q sec er QUARTER MILE tíma. 654 00:34:48,880 --> 00:34:52,409 655 00:34:52,409 --> 00:34:55,850 Svo nú getum við gert nokkrar skemmtilega hluti um MT bíla er gagnasvæði. 656 00:34:55,850 --> 00:35:01,640 >> Þannig að við getum gert hlutina eins róður nöfn, MT bílum. 657 00:35:01,640 --> 00:35:05,490 Og þetta er listi yfir allar raðir í gagnasafninu sem eru nöfn á bílum. 658 00:35:05,490 --> 00:35:10,780 Við getum gert colnames, MT bíla þetta. 659 00:35:10,780 --> 00:35:15,500 Ef þú gerir mt bíla, undir-tölulegar vísitölu, eins og 2. 660 00:35:15,500 --> 00:35:18,177 við fáum annað dálkinn út af þetta, sem væri strokka. 661 00:35:18,177 --> 00:35:19,370 >> Áhorfendur: Hvað gerðir þú? 662 00:35:19,370 --> 00:35:21,570 >> CONNER HARRIS: Ég slóst lestir bíla, sviga E, 663 00:35:21,570 --> 00:35:24,180 sem gaf mér annað dálki út mt bíla. 664 00:35:24,180 --> 00:35:34,501 665 00:35:34,501 --> 00:35:38,110 Eða ef við viljum röð, get ég slegið mtcars Comma 2, til dæmis. 666 00:35:38,110 --> 00:35:41,850 667 00:35:41,850 --> 00:35:46,390 Aðrar umferð 2 komma, svona. 668 00:35:46,390 --> 00:35:48,880 Og það fer í röð þinn. 669 00:35:48,880 --> 00:35:54,680 Þetta hér bara gefur þér dálki, en dálkur sem vektora. 670 00:35:54,680 --> 00:36:04,634 671 00:36:04,634 --> 00:36:06,425 Ég áttaði mig bara nú ég gleymdi að sýna 672 00:36:06,425 --> 00:36:09,150 sumir kaldur hlutur um vigra sem þú getur gert með vísitölum. 673 00:36:09,150 --> 00:36:10,480 Svo láta mig gera það núna. 674 00:36:10,480 --> 00:36:17,130 Svo skulum gera c gets-- setja þetta á pause-- 2 sinnum 1 til 10. 675 00:36:17,130 --> 00:36:21,360 Svo c er bara að fara að vera vigurinn 2 til 20. 676 00:36:21,360 --> 00:36:24,640 Ég get tekið þætti svona, c2. 677 00:36:24,640 --> 00:36:30,942 Ég kemst í vektor eins og þetta, c-- láta mig 678 00:36:30,942 --> 00:36:34,470 nota annað nafn en c, eins vec c. 679 00:36:34,470 --> 00:36:37,591 680 00:36:37,591 --> 00:36:39,340 Í grundvallaratriðum, ég er að gera þetta þannig að þú færð ekki 681 00:36:39,340 --> 00:36:45,010 rugla á milli C sem vektor smíði virka, 682 00:36:45,010 --> 00:36:48,800 og þá c sem breytu nafninu. 683 00:36:48,800 --> 00:36:53,120 Več sviga C 4, 5, 7. 684 00:36:53,120 --> 00:36:56,540 Þetta mun fá mig út fjórða, fimmta, og sjö þætti array. 685 00:36:56,540 --> 00:37:01,740 Ég get gert vec, setja í neikvætt Vísitala, eins neikvæð 4. 686 00:37:01,740 --> 00:37:06,500 Sem vilja fá mig burt með fjórða þáttur fjarlægt. 687 00:37:06,500 --> 00:37:10,140 Þá ef ég vildi gera sneiðar, Ég get gert vec 2 til 6. 688 00:37:10,140 --> 00:37:15,480 2 ristill 6 er bara annað vektor, sem er 2, 3, 4, 5, 6. 689 00:37:15,480 --> 00:37:18,230 Spits út að. 690 00:37:18,230 --> 00:37:20,770 >> Svo einhvern veginn aftur að mt bíla. 691 00:37:20,770 --> 00:37:26,650 692 00:37:26,650 --> 00:37:28,450 Svo skulum gera sumir regressions. 693 00:37:28,450 --> 00:37:34,240 Skulum segja líkan gets-- skulum línulega regress-- Ég veit það ekki. 694 00:37:34,240 --> 00:37:41,780 Fyrst skulum ekki hengja mtcars, auðvitað. 695 00:37:41,780 --> 00:37:44,870 696 00:37:44,870 --> 00:38:00,010 Svo [inaudible] líkan LM, við skulum læknað kílómetra á lítra á Tilde þyngd. 697 00:38:00,010 --> 00:38:03,300 Og þá er gögn ramma mtcars. 698 00:38:03,300 --> 00:38:06,830 Svo samantekt líkan. 699 00:38:06,830 --> 00:38:12,900 700 00:38:12,900 --> 00:38:15,595 >> OK, svo lítur þetta svolítið flókið. 701 00:38:15,595 --> 00:38:19,380 En í grundvallaratriðum, sjá eins og ef við reyna að tjá kílómetra á lítra 702 00:38:19,380 --> 00:38:23,970 sem línulegt fall af þyngd, þá fengum þessa línu hér, 703 00:38:23,970 --> 00:38:28,730 sem rekur á 37.28. 704 00:38:28,730 --> 00:38:33,830 37,28 væri fræðileg kílómetra á lítra af bíl sem vega núll. 705 00:38:33,830 --> 00:38:41,210 Og þá fyrir hvert viðbótar tonn, þú högg um fimm kílómetra á lítra 706 00:38:41,210 --> 00:38:42,440 burt af því. 707 00:38:42,440 --> 00:38:45,120 Báðar þessar stuðlum þú er hægt að sjá, staðlaðar villur þar. 708 00:38:45,120 --> 00:38:47,870 Og þeir eru mjög tölfræðilega marktækur. 709 00:38:47,870 --> 00:38:55,740 >> Þannig að við getum verið mjög viss um að 1 E 10 til neikvæð 10. 710 00:38:55,740 --> 00:38:59,510 Svo 1 sinni eitthvað að neikvæð 10, að ef þú gerir þyngri bíl, 711 00:38:59,510 --> 00:39:01,440 það mun hafa verri mílur á lítra. 712 00:39:01,440 --> 00:39:04,940 713 00:39:04,940 --> 00:39:07,250 Eða getum við prófað nokkrar aðrar líkan. 714 00:39:07,250 --> 00:39:09,230 Eins og í stað þess að regressing þetta á þyngd, 715 00:39:09,230 --> 00:39:12,600 skulum læknað það á log þyngd, vegna kannski skilvirka þyngd 716 00:39:12,600 --> 00:39:15,690 á mílufjöldi er einhvern veginn ekki línuleg. 717 00:39:15,690 --> 00:39:18,540 >> Þetta gaf okkur r veldi af 0.7528. 718 00:39:18,540 --> 00:39:19,610 Svo skulum reyna þetta. 719 00:39:19,610 --> 00:39:21,485 Í þetta sinn skulum gera a öðruvísi breyta líka. 720 00:39:21,485 --> 00:39:22,500 Model2. 721 00:39:22,500 --> 00:39:24,800 Svo samantekt, model2. 722 00:39:24,800 --> 00:39:28,200 723 00:39:28,200 --> 00:39:31,390 Allt í lagi, svo aftur, að við fékk okkar bestu línu hér. 724 00:39:31,390 --> 00:39:36,160 Og þetta time-- þetta er að segja, grundvallaratriðum að í hvert skipti sem þú 725 00:39:36,160 --> 00:39:38,090 auka vægi bíl með stuðlinum e 726 00:39:38,090 --> 00:39:40,580 þú missir þetta margar mílur á lítra. 727 00:39:40,580 --> 00:39:43,210 728 00:39:43,210 --> 00:39:50,326 >> Og svo þetta sinn leifar staðall okkar villa it-- það skiptir ekki máli, í raun. 729 00:39:50,326 --> 00:39:53,540 Leifar staðall villa er í rauninni bara venjulegt villa 730 00:39:53,540 --> 00:39:57,760 sem þú átt eftir eftir þér taka burt stefna línu. 731 00:39:57,760 --> 00:40:02,805 Og r okkar veldi hér er 0.81, sem er aðeins betri en það sem 732 00:40:02,805 --> 00:40:07,640 við höfðum áður, 0.52. 733 00:40:07,640 --> 00:40:09,750 >> Og svo nú skulum bæta Hugtakið þessari afturför. 734 00:40:09,750 --> 00:40:13,020 Svo skulum læknað kílómetra á lítra bæði á þig þungi 735 00:40:13,020 --> 00:40:21,130 og, við skulum gera, q kílómetra, QUARTER MILE tíma. 736 00:40:21,130 --> 00:40:26,190 OK, verður það að hafa the-- allt í lagi, qsec. 737 00:40:26,190 --> 00:40:26,690 Qsec. 738 00:40:26,690 --> 00:40:30,630 739 00:40:30,630 --> 00:40:35,000 Actually-- miður, hvað? 740 00:40:35,000 --> 00:40:37,000 Leyfðu mér að kalla þetta eitthvað annað að auki model2. 741 00:40:37,000 --> 00:40:38,000 Leyfðu mér að kalla þetta model3. 742 00:40:38,000 --> 00:40:40,860 743 00:40:40,860 --> 00:40:42,900 Og svo nú getum við gert samantekt model3. 744 00:40:42,900 --> 00:40:46,850 745 00:40:46,850 --> 00:40:49,100 Og svo aftur, þetta er í grundvallaratriðum það sem þú gætir átt von á. 746 00:40:49,100 --> 00:40:51,750 Þú hefur jákvæð skurðpunkt. 747 00:40:51,750 --> 00:40:54,550 The árangursríkur auka þyngd er neikvæð. 748 00:40:54,550 --> 00:40:58,490 Og virkt auka QUARTER MILE tími 749 00:40:58,490 --> 00:41:02,420 er jákvæð, en þó minna svo en þyngd. 750 00:41:02,420 --> 00:41:06,010 Nú innsæi, þú geta gera skilningarvit af þetta með því að segja að hugsa um íþróttir bíla. 751 00:41:06,010 --> 00:41:08,950 Það er mjög fljótur hröðun, mjög stutt QUARTER MILE sinnum. 752 00:41:08,950 --> 00:41:13,729 Þeir eru líka að fara að nota meira gas, en fleiri skynsamlegar bílar eru að fara 753 00:41:13,729 --> 00:41:16,020 að hafa hægari hröðun, hærri QUARTER MILE sinnum, 754 00:41:16,020 --> 00:41:20,890 og nota minna gas ,, svo hærri kílómetra á lítra. 755 00:41:20,890 --> 00:41:21,390 Great. 756 00:41:21,390 --> 00:41:23,431 Og svo nú er kominn tími til að samsæri eitthvað eins og þetta. 757 00:41:23,431 --> 00:41:27,810 Svo skulum do-- svo ber bein sem við getum gert plots-- 758 00:41:27,810 --> 00:41:35,280 vegna þess að ég hef fest þessi gögn ramma before-- við getum bara gert plots, wt mpg. 759 00:41:35,280 --> 00:41:38,762 760 00:41:38,762 --> 00:41:39,720 Gera þetta svolítið stærri. 761 00:41:39,720 --> 00:41:55,050 762 00:41:55,050 --> 00:41:57,350 Þar höfum við í rauninni dreifa samsæri, en stig 763 00:41:57,350 --> 00:41:58,690 eru eins konar erfitt að sjá um þetta. 764 00:41:58,690 --> 00:42:04,860 765 00:42:04,860 --> 00:42:10,900 >> Ég man ekki offhand hvað setningafræði er til að breyta lóð. 766 00:42:10,900 --> 00:42:14,100 Þannig að ég held að þetta verði góður tími til að koma upp, 767 00:42:14,100 --> 00:42:18,000 það er mjög gott builtin hjálp lögun, virka hjálpa vitna nafn. 768 00:42:18,000 --> 00:42:21,690 Við munum koma upp í grundvallaratriðum allt sem þú vilt. 769 00:42:21,690 --> 00:42:28,010 770 00:42:28,010 --> 00:42:32,730 Ég held að ég í raun að gera þetta gerð jafngildir bls fyrir stig Lóðir. 771 00:42:32,730 --> 00:42:34,369 Gerði það að breyta neinu? 772 00:42:34,369 --> 00:42:35,160 Og nei, eiginlega ekki. 773 00:42:35,160 --> 00:42:39,160 774 00:42:39,160 --> 00:42:39,660 Allt í lagi. 775 00:42:39,660 --> 00:42:46,760 776 00:42:46,760 --> 00:42:49,580 >> Fyrir sumir ástæða, þegar ég gerði þetta á minn eigin tölvu á meðan síðan, 777 00:42:49,580 --> 00:42:52,080 allir dreifið stig voru miklu skýrari. 778 00:42:52,080 --> 00:43:06,390 779 00:43:06,390 --> 00:43:13,970 Einhvern veginn, eru dreifa konar sýnileg? 780 00:43:13,970 --> 00:43:15,124 Það er eitt það. 781 00:43:15,124 --> 00:43:16,165 A fáir, nokkrar þar. 782 00:43:16,165 --> 00:43:18,860 783 00:43:18,860 --> 00:43:21,185 Þú getur konar séð þær, ekki satt? 784 00:43:21,185 --> 00:43:24,310 Svo ef við viljum bæta bestu línu þessari lóð hér, sem er svolítið ber 785 00:43:24,310 --> 00:43:29,290 bones-- láta mig gera það svolítið betur. 786 00:43:29,290 --> 00:43:38,075 Main jafngildir móti þyngd. 787 00:43:38,075 --> 00:43:46,322 788 00:43:46,322 --> 00:43:49,740 Miles á lítra. 789 00:43:49,740 --> 00:43:53,570 Aftur, getur þú séð hvernig gagnlegt valfrjálst rök eru hér með einnig 790 00:43:53,570 --> 00:43:58,090 ekki að þurfa að setja hlutina í ákveðinni röð með lyklaborðinu rök 791 00:43:58,090 --> 00:44:01,600 þegar þú ert plots, vegna þetta taka mikið af rökum. 792 00:44:01,600 --> 00:44:07,490 >> Xlab jafngildir þyngd, þyngd, tonn. 793 00:44:07,490 --> 00:44:10,091 794 00:44:10,091 --> 00:44:10,590 Allt í lagi. 795 00:44:10,590 --> 00:44:17,340 796 00:44:17,340 --> 00:44:21,480 OK, já, þetta tæki er að vera svolítið pirrandi. 797 00:44:21,480 --> 00:44:30,160 En þú getur séð svoleiðis þarna, það er línurit titill á hlið. 798 00:44:30,160 --> 00:44:35,260 Hérna there's-- á botni hér eru ás merki. 799 00:44:35,260 --> 00:44:37,700 Ég man ekki offhand hvað skipanir ars-- 800 00:44:37,700 --> 00:44:41,000 hvað aðgerðir eru að aukast stærð þessara merkimiða og titla, 801 00:44:41,000 --> 00:44:43,110 en þeir eru þar. 802 00:44:43,110 --> 00:44:46,625 >> Og svo ef við viljum bæta bestu línu, 803 00:44:46,625 --> 00:44:49,250 við gætum gert eitthvað like-- I hafa setningafræði skrifað upp hér. 804 00:44:49,250 --> 00:44:52,280 805 00:44:52,280 --> 00:45:11,130 Svo man við bætum bara líkan var MPG, þyngd, mtcars. 806 00:45:11,130 --> 00:45:16,470 Og svo ef ég vildi bæta við besta falli lína, gæti ég gert, b línu líkan. 807 00:45:16,470 --> 00:45:18,556 Og búmm, höfum við bestu línu. 808 00:45:18,556 --> 00:45:19,970 Það er eins konar erfitt að sjá aftur. 809 00:45:19,970 --> 00:45:22,178 Ég er alveg miður um tæknilegra örðugleika. 810 00:45:22,178 --> 00:45:25,230 En það liggur í grundvallaratriðum efst til vinstri til neðst til hægri. 811 00:45:25,230 --> 00:45:27,550 >> Og ef umfang voru stærri, getur þú séð 812 00:45:27,550 --> 00:45:31,260 að stöðva er það sem þú getur finna frá samantekt tölfræði 813 00:45:31,260 --> 00:45:34,790 ef þú skrifar samantekt líkan. 814 00:45:34,790 --> 00:45:40,130 OK, þannig að ég vona að allir gerist eitthvað af tilfinningu um hvað 815 00:45:40,130 --> 00:45:42,030 R er, hvað það er gott fyrir. 816 00:45:42,030 --> 00:45:45,520 Þú gætir gert miklu betur Lóðir en þetta á eigin tíma, ef þú vilt. 817 00:45:45,520 --> 00:45:50,100 818 00:45:50,100 --> 00:45:53,950 >> Þannig að erlend virka tengi. 819 00:45:53,950 --> 00:46:00,330 Þetta er eitthvað sem er ekki venjulega fjallað í inngangs fyrirlestrum 820 00:46:00,330 --> 00:46:03,560 eða inngangs nokkuð fyrir r. 821 00:46:03,560 --> 00:46:05,584 Það er ekki líklegt að þú ert að fara að þurfa það. 822 00:46:05,584 --> 00:46:08,000 Hins vegar fann ég það gagnlegt í mín eigin verkefni í fortíðinni. 823 00:46:08,000 --> 00:46:10,984 Og það er ekki gott kennsluforrit fyrir það á netinu. 824 00:46:10,984 --> 00:46:12,900 Þannig að ég ætla bara að fara að þjóta þér allt í gegnum þetta 825 00:46:12,900 --> 00:46:16,606 og þá þú ert frjáls til að fara. 826 00:46:16,606 --> 00:46:18,480 Og svo erlenda virka tengi er hvað 827 00:46:18,480 --> 00:46:23,130 þú getur notað til að hringja út til að sjá virka með R. innbyrðis, 828 00:46:23,130 --> 00:46:29,850 R er byggt á stærðfræði C. R er bara C 64-bita fleytitölu tölur, 829 00:46:29,850 --> 00:46:32,852 sem er tegund manna [inaudible]. 830 00:46:32,852 --> 00:46:35,060 Og þú might vilja til að gera þetta fyrir fullt af ástæðum. 831 00:46:35,060 --> 00:46:39,250 Fyrir einn, R er túlkað, það er ekki saman niður í vél númer. 832 00:46:39,250 --> 00:46:42,170 Svo er hægt að umrita þinn innri lykkjur í C ​​og þá fá 833 00:46:42,170 --> 00:46:45,920 the kostur af using R. Eins það er dálítið þægilegra en C. 834 00:46:45,920 --> 00:46:48,899 Það hefur betri birta gröf aðstöðu og whatnot. 835 00:46:48,899 --> 00:46:51,690 Og á meðan enn sé hægt að fá toppur hraði af innri lykkjur, 836 00:46:51,690 --> 00:46:53,650 sem er þar sem þú þarft virkilega. 837 00:46:53,650 --> 00:46:56,330 >> Endurnýta C bókasöfnum, það er einnig mikilvægt. 838 00:46:56,330 --> 00:47:00,320 Ef þið hafið einhverjar C bókasafn fyrir eins, Ég veit ekki, Fourier umbreytir 839 00:47:00,320 --> 00:47:05,190 eða einhver mjög Archean tölfræði er notuð 840 00:47:05,190 --> 00:47:09,470 í hár orka stjarneðlisfræði eða eitthvað, ég veit ekki. 841 00:47:09,470 --> 00:47:13,058 Hár orka stjarneðlisfræði er ekki einu sinni hugsa, held ég. 842 00:47:13,058 --> 00:47:16,480 En þú getur gert það í stað þess að hafa að skrifa innfæddur R tengi þeirra. 843 00:47:16,480 --> 00:47:22,725 Og á the-- og aftur, eins og ef þú líta í flestum vanræksla bókasöfnum r er, 844 00:47:22,725 --> 00:47:25,600 á innri, eru innri fara að nota erlenda virka 845 00:47:25,600 --> 00:47:26,724 tengi mjög mikið. 846 00:47:26,724 --> 00:47:31,630 Þær hafa allt eins Fourier umbreytir eða computing fylgni 847 00:47:31,630 --> 00:47:34,890 stuðlar skrifaður í C, og þeir bara R umbúðum kringum þá. 848 00:47:34,890 --> 00:47:38,230 The tengi er dálítið erfitt. Ég held 849 00:47:38,230 --> 00:47:43,750 erfiðleikar hennar er ýkt í fullt af leiðbeiningum sem þú munt finna. 850 00:47:43,750 --> 00:47:46,200 En engu að síður, það er dálítið ruglingslegt. 851 00:47:46,200 --> 00:47:48,650 Og ég hef ekki verið fær um að finna góða einkatími fyrir það, 852 00:47:48,650 --> 00:47:51,980 þannig að þetta er það núna. 853 00:47:51,980 --> 00:47:55,360 Aftur, þetta allt hluti er meira fyrir haga. 854 00:47:55,360 --> 00:47:57,687 Ekki hafa áhyggjur af afritun allt niður núna. 855 00:47:57,687 --> 00:48:00,020 Svo eftirfarandi leiðbeiningum eru fyrir Unix-eins kerfi, 856 00:48:00,020 --> 00:48:05,150 Linux, BSD, OS X. Ég veit ekki hvernig þetta virkar á Windows, 857 00:48:05,150 --> 00:48:08,280 en vinsamlegast bara ekki þinn Lokaverkefni á Windows. 858 00:48:08,280 --> 00:48:10,790 859 00:48:10,790 --> 00:48:12,460 Þú virkilega vilt ekki að. 860 00:48:12,460 --> 00:48:14,770 Unix er miklu betra sett upp fyrir frjálslegur forritun. 861 00:48:14,770 --> 00:48:19,320 862 00:48:19,320 --> 00:48:21,390 Svo, í grundvallaratriðum erlendum virka tengi. 863 00:48:21,390 --> 00:48:24,420 Ef þú vilt að skrifa C virka til notkunar með R, 864 00:48:24,420 --> 00:48:27,250 það þarf að taka alla rök sem ábendingum. 865 00:48:27,250 --> 00:48:30,666 >> Svo fyrir einn gildi, þetta þýðir það bent að verðmæti. 866 00:48:30,666 --> 00:48:33,040 Fyrir fylki, þetta er bendi að fyrsta þáttur, sem 867 00:48:33,040 --> 00:48:36,750 er það array nöfn raun þýtt. 868 00:48:36,750 --> 00:48:40,140 Aftur, þetta er eitthvað sem þú ættir að hafa nokkuð algerlega niður eftir bls sett fimm. 869 00:48:40,140 --> 00:48:43,334 Array nöfn eru bara ábendingar að fyrsta frumefni, 870 00:48:43,334 --> 00:48:44,750 The fljótandi-lið gerð er tvöfaldur. 871 00:48:44,750 --> 00:48:47,310 Og virka þarf að skila ógilt. 872 00:48:47,310 --> 00:48:50,810 Eina leiðin sem það getur í raun segja R hvað gerðist 873 00:48:50,810 --> 00:48:54,410 er með því að breyta minni sem R gaf á það í erlendum virka 874 00:48:54,410 --> 00:48:54,910 tengi. 875 00:48:54,910 --> 00:48:58,180 876 00:48:58,180 --> 00:49:00,127 >> Þannig að ég hef skrifað þetta dæmi hér, þetta er 877 00:49:00,127 --> 00:49:02,460 fall sem reiknar notkun punktur tveggja vigra. 878 00:49:02,460 --> 00:49:05,060 Það tekur tvær breytur, vec1, vec2, sem eru vektor sjálfir, 879 00:49:05,060 --> 00:49:06,934 og þá, sem er n a lengd, því aftur, 880 00:49:06,934 --> 00:49:12,630 R hefur byggt í [inaudible] til að finna út lengd genaferja, en C er ekki. 881 00:49:12,630 --> 00:49:16,182 Í C, vektorar er handahófskennt afmarkast klumpur af minni. 882 00:49:16,182 --> 00:49:17,890 Svo eins og þú getur reikna punktur vörur 883 00:49:17,890 --> 00:49:23,470 er bara að setja þetta fram breytu núlli og þá kunnugt um 884 00:49:23,470 --> 00:49:28,760 frá 1 til stjörnu n, vegna þess að n er bendi á lengd, 885 00:49:28,760 --> 00:49:32,929 bara bæta eitthvað við þetta út breytu. 886 00:49:32,929 --> 00:49:34,970 Og það getur verið gott starf ef þú ert að fara að gera 887 00:49:34,970 --> 00:49:37,270 þetta til að skrifa tvö aðskilin aðgerðir C. 888 00:49:37,270 --> 00:49:41,970 Einn af þeim has-- einn af þeim bara tekur rök og gerðir 889 00:49:41,970 --> 00:49:43,970 að þeir myndu venjulega vera í C. 890 00:49:43,970 --> 00:49:47,780 >> Þannig að það tekur fjölbreytta rök sem ábendingum. 891 00:49:47,780 --> 00:49:57,090 En einn-gildi rök eins n, það tekur bara eins gildum með eintak, 892 00:49:57,090 --> 00:49:57,917 án ábendingum. 893 00:49:57,917 --> 00:49:59,750 Og þá er það ekki [Inaudible] út bendi. 894 00:49:59,750 --> 00:50:01,290 Og þá er hægt að hafa annað, í grundvallaratriðum, 895 00:50:01,290 --> 00:50:03,623 umbúðir virka sem í grundvallaratriðum annast kröfur 896 00:50:03,623 --> 00:50:07,740 af erlendum virka tengi fyrir þig. 897 00:50:07,740 --> 00:50:11,840 >> The vegur þú kalla þetta í R er, þegar þú þarft virka skrifað í C, 898 00:50:11,840 --> 00:50:17,770 þú skrifar R cmd shlib, R stjórn hluti bókasafn, 899 00:50:17,770 --> 00:50:20,110 foo punktur c, eða hvað skrá nafn þitt er, 900 00:50:20,110 --> 00:50:23,020 og OS skel ekki í R flugstöðinni. 901 00:50:23,020 --> 00:50:25,200 Og þetta mun skapa a Bókasafn heitir foo punktur svo. 902 00:50:25,200 --> 00:50:28,180 Og þá er hægt að hlaða hana í handrit okkar eða gagnvirkt 903 00:50:28,180 --> 00:50:32,310 með stjórn Dyn punktur álag. 904 00:50:32,310 --> 00:50:35,720 Þá er það hlutverk í R heitir punktur c. 905 00:50:35,720 --> 00:50:39,310 >> Þetta tekur rök sem eru Fyrsta nafn virka í C 906 00:50:39,310 --> 00:50:40,970 sem þú vilt hringja í. 907 00:50:40,970 --> 00:50:43,920 Og þá allar breytur að að virka, 908 00:50:43,920 --> 00:50:45,420 þeir verða að vera í réttri röð. 909 00:50:45,420 --> 00:50:48,580 Þú þarft að nota þessa tegund þvingunum virka eins heiltölu, sem 910 00:50:48,580 --> 00:50:52,050 tvöfaldur, eins og eðli, og eins og rökrétt. 911 00:50:52,050 --> 00:50:54,710 Og svo þegar það skilar lista, sem aftur er bara 912 00:50:54,710 --> 00:50:57,550 hlutdeildarfélag array af breytu nöfn og gildi 913 00:50:57,550 --> 00:51:00,950 eftir að virka hefur keyrt. 914 00:51:00,950 --> 00:51:08,520 >> Þannig að í þessu tilfelli, vegna þess punktur Prod hefur rök vec1, vec2, og int N, N út. 915 00:51:08,520 --> 00:51:11,980 Að punktur c við höfum punktur Prod, nafn virka 916 00:51:11,980 --> 00:51:16,250 við köllum, vec1, vec2, tegund kúga. 917 00:51:16,250 --> 00:51:20,060 Lengd annaðhvort genaferju, Ég valdi bara vec1 geðþótta. 918 00:51:20,060 --> 00:51:25,479 Það myndi vera traustara að segja s heiltala mín lengd vec1, lengd vec2. 919 00:51:25,479 --> 00:51:27,520 Þá bara eins og tvöfaldur núll, vegna þess að við í raun ekki 920 00:51:27,520 --> 00:51:29,644 sama hvað fer í út breytu vegna þess að við erum 921 00:51:29,644 --> 00:51:32,270 setja það á núll samt. 922 00:51:32,270 --> 00:51:37,560 >> Og þá niðurstöður eru að fara að vera stór tengd array af grundvallaratriðum 923 00:51:37,560 --> 00:51:42,090 vec1 er hvað, vec2 er hvað sem er. 924 00:51:42,090 --> 00:51:44,330 En við erum áhuga á út, svo við getum fengið það út. 925 00:51:44,330 --> 00:51:47,780 Þetta er aftur, mjög leikfang dæmi af erlendum virka tengi. 926 00:51:47,780 --> 00:51:54,160 En ef þú ert að reikna punktur vörur gríðarlegu vigra í lykkjur, 927 00:51:54,160 --> 00:51:56,960 eða ef þú ert að gera eitthvað annað í lykkju, 928 00:51:56,960 --> 00:51:59,850 og þú vilt ekki að treysta á R, sem hjartarskinn hafa a hluti af kostnaður 929 00:51:59,850 --> 00:52:02,830 byggt inn í það, þetta getur verið gagnlegt. 930 00:52:02,830 --> 00:52:05,870 >> Aftur, þetta er yfirleitt ekki inngangsnámskeið efni til R. 931 00:52:05,870 --> 00:52:08,571 Það er ekki mjög vel skjalfest. 932 00:52:08,571 --> 00:52:11,070 Ég ætla bara að meðtöldum það vegna Mér fannst það gagnlegt í fortíðinni. 933 00:52:11,070 --> 00:52:13,654 Svo, slæmur venjur. 934 00:52:13,654 --> 00:52:15,820 Ég nefndi að það er fyrir lykkju í aðgerðina. 935 00:52:15,820 --> 00:52:21,150 Almennt þú ættir ekki, í tungumálið, ekki nota það. 936 00:52:21,150 --> 00:52:26,100 Byggt á því hvernig R útfærir endurtekning innbyrðis, það getur verið hægur. 937 00:52:26,100 --> 00:52:28,540 Þeir bara líka líta ljót. 938 00:52:28,540 --> 00:52:32,410 >> R annast vektor mjög vel, svo oftsinnis þú þarft ekki að nota það. 939 00:52:32,410 --> 00:52:35,050 940 00:52:35,050 --> 00:52:38,900 Þá getur þú venjulega skipta vigur oft 941 00:52:38,900 --> 00:52:42,490 Með þessum aðgerðum kallast hár pöntun aðgerðir, Kort, Minnka, 942 00:52:42,490 --> 00:52:44,404 Finna, eða Sía. 943 00:52:44,404 --> 00:52:46,320 Ég ætla bara að gefa sumir dæmi um hvað þetta gerir. 944 00:52:46,320 --> 00:52:49,957 Kortið er hærri röð virka því það tekur aðgerð sem rök. 945 00:52:49,957 --> 00:52:52,290 Svo er hægt að gefa það í aðgerð, þú getur gefið það fylki, 946 00:52:52,290 --> 00:52:54,640 og það mun gilda aðgerðina að hvert frumefni í fylkinu 947 00:52:54,640 --> 00:52:55,681 og aftur nýja fylkisins. 948 00:52:55,681 --> 00:52:58,035 949 00:52:58,035 --> 00:53:00,160 Minnka, í grundvallaratriðum þú gefur það fylki, gefa þér það 950 00:53:00,160 --> 00:53:02,930 fall sem tekur tvær breytur. 951 00:53:02,930 --> 00:53:07,100 Það mun beita virka fyrst, fyrsta rifrildi með nokkrum startara gildi. 952 00:53:07,100 --> 00:53:09,440 Þá að því niðurstöðu í sekúndu. 953 00:53:09,440 --> 00:53:12,590 Þá að því vegna í þriðja, þá sem leiða til fjórða. 954 00:53:12,590 --> 00:53:14,870 Og síðan aftur þegar það fær til enda. 955 00:53:14,870 --> 00:53:17,620 Svo til dæmis, ef þú vilt reikna summu allra þátta 956 00:53:17,620 --> 00:53:23,240 í fylki, en þú gætir hringt draga með [inaudible] draga viðbót 957 00:53:23,240 --> 00:53:26,620 virka, eins og Störf a, b, skila auk b. 958 00:53:26,620 --> 00:53:28,960 Og þá byrja gildið 0. 959 00:53:28,960 --> 00:53:32,950 >> Og allt þetta, getur þú fundið þá lýst er í R gögnum, 960 00:53:32,950 --> 00:53:35,720 í hvaða kennslubók um hagnýtur forritun. 961 00:53:35,720 --> 00:53:38,330 Það er líka þetta flokkur aðgerðir kallast gilda aðgerðir, 962 00:53:38,330 --> 00:53:42,807 sem ég don't-- þeir eru svolítið erfitt að útskýra, 963 00:53:42,807 --> 00:53:45,640 en ef þú lítur í [inaudible] bókar sem ég vitna í upphafi, 964 00:53:45,640 --> 00:53:48,615 Hann útskýrir þá nokkuð vel í Viðauki hans á R forritun. 965 00:53:48,615 --> 00:53:51,599 966 00:53:51,599 --> 00:53:53,390 Meira um starfshætti, auka við til vektor. 967 00:53:53,390 --> 00:53:57,570 968 00:53:57,570 --> 00:53:58,070 Já? 969 00:53:58,070 --> 00:54:01,651 970 00:54:01,651 --> 00:54:02,900 Ég held að ég ætti að leiðrétta það. 971 00:54:02,900 --> 00:54:07,450 Í þeirri fyrstu línu, vec ör, sem örin ætti ekki að vera þar. 972 00:54:07,450 --> 00:54:10,920 Þú getur tengt vektor, aftur, eftir að lengd auk 1 973 00:54:10,920 --> 00:54:13,220 og framselja nokkur gildi við því. 974 00:54:13,220 --> 00:54:18,970 Það mun lengja vigurinn, eða þú getur gert vec Jafnt c, vec newvalue. 975 00:54:18,970 --> 00:54:21,540 Aftur, ef þú notar C með eitt rifrildi sem vektor, 976 00:54:21,540 --> 00:54:23,300 leiðir stigveldi fær fletja. 977 00:54:23,300 --> 00:54:27,160 Svo þú munt bara fá vigur sem er framlengdur um 1. 978 00:54:27,160 --> 00:54:30,410 Aldrei gera þetta. 979 00:54:30,410 --> 00:54:33,330 >> Ástæðan fyrir því að þér ætti ekki að gera þetta er þetta. 980 00:54:33,330 --> 00:54:37,430 Þegar þú úthluta vektor, það gefur það ákveðna klumpur af minni. 981 00:54:37,430 --> 00:54:40,680 Ef þú eykur þessi vektor stærð, það þarf að endurúthluta vektor 982 00:54:40,680 --> 00:54:43,820 einhvers staðar annars staðar. 983 00:54:43,820 --> 00:54:46,980 Og svo er endurúthlutun alveg dýr. 984 00:54:46,980 --> 00:54:50,530 Ég mun ekki fara inn í smáatriði um hvernig minni allocators eru framkvæmdar 985 00:54:50,530 --> 00:54:57,280 á stýrikerfi stigi, en það tekur a einhver fjöldi af tími 986 00:54:57,280 --> 00:54:58,962 að finna nýja klumpur af minni. 987 00:54:58,962 --> 00:55:00,920 Og einnig, ef þú ert -Endurúthluta fullt og fullt 988 00:55:00,920 --> 00:55:03,500 af smám stærri klumpur, enda þú upp 989 00:55:03,500 --> 00:55:06,420 með eitthvað sem kallast minni sundrungu, 990 00:55:06,420 --> 00:55:09,390 þar sem tiltækt minni er skipt í fullt af litlum blokkir 991 00:55:09,390 --> 00:55:11,500 í minni allocators sjónarmiði. 992 00:55:11,500 --> 00:55:15,340 Og það verður erfiðara og erfiðara að finna minni fyrir aðra hluti. 993 00:55:15,340 --> 00:55:19,455 Þannig að í stað, ef þú þarft að gera þetta, ef þú þarft að vaxa vigur frá einum enda 994 00:55:19,455 --> 00:55:24,240 til annars, í stað þess að auka við til þess stöðugt, ættir þú fyrirfram úthluta því. 995 00:55:24,240 --> 00:55:29,310 Vec ör, vektor lengd jafngildir 1.000, eða hvað. 996 00:55:29,310 --> 00:55:33,200 >> Og þá getur þú bara að tengja að smitferjunni er gildum einn 997 00:55:33,200 --> 00:55:36,000 tími eftir að þú hefur úthlutað það einu sinni. 998 00:55:36,000 --> 00:55:40,140 Ég hljóp inn í þetta, aftur, vinnu sumar mitt þegar ég var að skrifa NRA vaxtamun 999 00:55:40,140 --> 00:55:42,120 Jafna leysa. 1000 00:55:42,120 --> 00:55:43,180 Ekki táknræn tölulegar. 1001 00:55:43,180 --> 00:55:49,290 Hugmyndin er að þegar þú hefur eitt gildi fyrir lausn þína, 1002 00:55:49,290 --> 00:55:51,240 þú notar það til að reikna þann næsta. 1003 00:55:51,240 --> 00:55:53,700 Svo eðlilegt mín barnaleg Halla var að segja OK, 1004 00:55:53,700 --> 00:55:56,930 þannig að ég ætla að byrja með ferju það er mikils virði. 1005 00:55:56,930 --> 00:56:01,260 Reiknið frá því næsta verðmæti sem fer á lausn vektor minn, 1006 00:56:01,260 --> 00:56:02,630 og bæta það. 1007 00:56:02,630 --> 00:56:05,290 >> Búa til eitthvað annað, bæta það. 1008 00:56:05,290 --> 00:56:08,120 Það fór mjög, mjög hægt. 1009 00:56:08,120 --> 00:56:11,540 Og þegar ég áttaði mig á þessu og ég breytti tölvunni minni 1010 00:56:11,540 --> 00:56:16,020 frá appending til þessa ferju á eins 10,000 til 100,000 sinnum, 1011 00:56:16,020 --> 00:56:18,910 bara pre-úthlutun vigur og bara gangi með það. 1012 00:56:18,910 --> 00:56:22,100 Ég fékk meira en 1.000 falt flýta. 1013 00:56:22,100 --> 00:56:26,280 Þannig að þetta er mjög algengt gildru fyrir R forritun. 1014 00:56:26,280 --> 00:56:31,560 Ef þú þarft að byggja upp vigur stykki eftir stykki, pre-úthluta því. 1015 00:56:31,560 --> 00:56:35,360 1016 00:56:35,360 --> 00:56:40,240 >> Önnur algeng ferð up-- þetta er síðasta minn renna, ekki worry-- er villa meðhöndlun. 1017 00:56:40,240 --> 00:56:42,890 R, til að vera hreinskilinn, ekki í raun að gera þetta mjög vel. 1018 00:56:42,890 --> 00:56:45,010 There ert a einhver fjöldi af vandamál sem geta uppskera upp. 1019 00:56:45,010 --> 00:56:48,360 Til dæmis, ef þú færð fylki eða ferju út af virka 1020 00:56:48,360 --> 00:56:52,377 sem þú varst að búast einn gildi að koma frá, eða öfugt, 1021 00:56:52,377 --> 00:56:55,460 og þú fara að í aðgerð sem þú skrifaði von eitt gildi, 1022 00:56:55,460 --> 00:56:57,270 sem getur verið vandamál. 1023 00:56:57,270 --> 00:57:01,440 >> Tilteknar aðgerðir aftur null sem gera, segja, 1024 00:57:01,440 --> 00:57:05,560 lesa úr engin lykill í lista. 1025 00:57:05,560 --> 00:57:08,527 En null er ekki eins og C þar sem ef þú reynir að lesa 1026 00:57:08,527 --> 00:57:11,360 frá gömlum músina, [inaudible] á núll músina, það seg bara galla 1027 00:57:11,360 --> 00:57:14,109 og ef þú ert í aflúsara þinn það segir þér nákvæmlega hvar þú ert. 1028 00:57:14,109 --> 00:57:17,080 1029 00:57:17,080 --> 00:57:20,772 Þess í stað, null mun do-- aðgerðir mun gera ófyrirsjáanlegum hlutum 1030 00:57:20,772 --> 00:57:21,730 ef þeir eru afhent null. 1031 00:57:21,730 --> 00:57:24,575 Eins og ef þú ert afhent max null, það mun gefa þér neikvæð óendanlegt. 1032 00:57:24,575 --> 00:57:27,230 1033 00:57:27,230 --> 00:57:28,190 Og svo, já. 1034 00:57:28,190 --> 00:57:30,880 1035 00:57:30,880 --> 00:57:32,630 Og svo þetta gerðist við mig einu sinni þegar ég var 1036 00:57:32,630 --> 00:57:34,771 breytt fullt af sviðum í lista uppbyggingu mínu 1037 00:57:34,771 --> 00:57:37,520 einu sinni án þess að breyta þeim annars staðar þegar ég var að lesa úr þeim. 1038 00:57:37,520 --> 00:57:40,670 Og þá fékk ég alls konar handahófi Infinity Niðurstöður cropping upp 1039 00:57:40,670 --> 00:57:43,080 og ég ekki hugmynd hvar þeir komu frá. 1040 00:57:43,080 --> 00:57:45,310 Og því miður, það er enginn alvöru R strangur háttur 1041 00:57:45,310 --> 00:57:48,940 þar sem þú getur sagt ef eitthvað lítur út eins og það gæti verið villa, 1042 00:57:48,940 --> 00:57:51,960 bara að hætta þarna svo ég get verið öguð og laga það. 1043 00:57:51,960 --> 00:57:55,282 1044 00:57:55,282 --> 00:57:57,240 Hins vegar er eitthvað kallað stöðva ef ekki. 1045 00:57:57,240 --> 00:58:00,480 Þetta jafngildir að fullyrða C er, ef þú hefur talað um það. 1046 00:58:00,480 --> 00:58:02,690 Ég held ekki C fullyrða er fyrirlestur umræðuefni, 1047 00:58:02,690 --> 00:58:06,370 en hluti leiðtogi þinn gæti hafa farið yfir það. 1048 00:58:06,370 --> 00:58:10,393 Og hætta ef ekki í grundvallaratriðum tekur eitthvað eiginleikann, svo allir yfirlýsingu að 1049 00:58:10,393 --> 00:58:11,824 getur verið satt eða ósatt. 1050 00:58:11,824 --> 00:58:13,490 Og ef það er ósatt, hættir það áætlun sína. 1051 00:58:13,490 --> 00:58:18,260 Það segir þér nákvæmlega hvað línu þú voru á og það ástand mistókst. 1052 00:58:18,260 --> 00:58:21,910 >> Og þetta mjög nytsamleg, til dæmis, geðheilsan stöðva, virka inntak. 1053 00:58:21,910 --> 00:58:25,110 Þannig að ef þú ert með virka og þú átt von á, segjum, 1054 00:58:25,110 --> 00:58:29,640 ef þú ættir að gefa mér dagsetninguna, ég vil dagsetningar vera bara vektor lengd 1 1055 00:58:29,640 --> 00:58:31,735 og einhvers staðar á milli 1 og 31. 1056 00:58:31,735 --> 00:58:34,420 1057 00:58:34,420 --> 00:58:36,170 Og ef ekki, ég veit eitthvað er farið rangt. 1058 00:58:36,170 --> 00:58:40,280 Og ég vel að stoppa það áður en þetta hefur handahófi högg á áhrif með kóða 1059 00:58:40,280 --> 00:58:44,190 að það er erfiðara að rekja í gegnum. 1060 00:58:44,190 --> 00:58:47,170 Svo er það eitt hægt nota fyrir stöðva ef ekki. 1061 00:58:47,170 --> 00:58:48,660 >> Einhvern veginn, OK. 1062 00:58:48,660 --> 00:58:49,690 Svo er það endirinn. 1063 00:58:49,690 --> 00:58:51,290 Þakka þér svo mikið fyrir að koma. 1064 00:58:51,290 --> 00:58:53,710 Ég er röðun áhugamaður á þessu. 1065 00:58:53,710 --> 00:58:57,270 Svo leitt ef þú ert leiðindi eða rugla eða hvað hefur þú. 1066 00:58:57,270 --> 00:59:01,670 Ég er fús til að taka spurningum með tölvupósti á connorharris@college.harvard.edu~~pobj. 1067 00:59:01,670 --> 00:59:07,230 Þetta fer líka fyrir alla horfa þetta í beinni eða síðar. 1068 00:59:07,230 --> 00:59:10,190 Einnig, þó að ég er ekki a TF, ég er líka mjög 1069 00:59:10,190 --> 00:59:13,900 fús til að þjóna sem óopinber ráðgjafi fyrir einhver sem er 1070 00:59:13,900 --> 00:59:15,460 nota R í lokaverkefni. 1071 00:59:15,460 --> 00:59:19,900 >> Ef þú vilt það, þá bara tala við TF þinn 1072 00:59:19,900 --> 00:59:23,750 og þá skrifa mér tölvupóst svo Ég veit hvað þú ert að vinna á 1073 00:59:23,750 --> 00:59:26,680 og svo ég geti sett upp fundi sinnum með þér ef þú vilt. 1074 00:59:26,680 --> 00:59:27,990 Svo aftur, þakka þér kærlega. 1075 00:59:27,990 --> 00:59:28,960 Ég vona að þú njóta það. 1076 00:59:28,960 --> 00:59:29,450 >> Áhorfendur: [inaudible]. 1077 00:59:29,450 --> 00:59:30,617 >> CONNER HARRIS: Auðvitað. 1078 00:59:30,617 --> 00:59:34,910 >> Áhorfendur: Hvers konar verkefni myndi CS nemandi nota R fyrir? 1079 00:59:34,910 --> 00:59:37,427 1080 00:59:37,427 --> 00:59:40,510 CONNER HARRIS: Svo ef þú ert ekki að gera eitthvað sem er eingöngu í gögn námuvinnslu, 1081 00:59:40,510 --> 00:59:43,790 til dæmis, og þar eru fullt af hlutum 1082 00:59:43,790 --> 00:59:46,692 þú gætir gert með því að með gögn Nám og vél nám. 1083 00:59:46,692 --> 00:59:48,900 Þú might vilja til að nota R fyrir hluti af einhverju. 1084 00:59:48,900 --> 00:59:52,022 Ég ólst upp, upphaflega, dæmi um ef þú ert að skrifa á vefsíðu 1085 00:59:52,022 --> 00:59:54,730 og þú vilt keyra sjálfvirkum tölfræðileg greining á vefþjóninum þínum 1086 00:59:54,730 --> 00:59:57,990 logs á ákveðnum tíma á hverjum degi, sem gæti verið eitthvað sem er 1087 00:59:57,990 --> 01:00:01,260 mjög auðvelt að gera í bara stutta R handritinu sem þú getur tímasett 1088 01:00:01,260 --> 01:00:04,200 að hlaupa á hverju kvöldi, til dæmis. 1089 01:00:04,200 --> 01:00:06,550 >> Og ég er viss um, ef það er einhver ástæða að þú vilt 1090 01:00:06,550 --> 01:00:11,520 vilt tölfræði eða graphing getu og hafa þetta að keyra sjálfkrafa í staðinn 1091 01:00:11,520 --> 01:00:13,790 þess að þurfa að hafa samskipti með það í Excel, 1092 01:00:13,790 --> 01:00:16,750 til dæmis, það er eitthvað þú might vilja til að nota R fyrir. 1093 01:00:16,750 --> 01:00:21,190 Svo einhverjar fleiri spurningar áður en ég fer? 1094 01:00:21,190 --> 01:00:21,690 Nei? 1095 01:00:21,690 --> 01:00:24,960 Allt í lagi, vel, og aftur, þakka þér kærlega fyrir komuna. 1096 01:00:24,960 --> 01:00:29,417