1 00:00:00,000 --> 00:00:00,750 2 00:00:00,750 --> 00:00:09,800 >> [Tónlist spila] 3 00:00:09,800 --> 00:00:13,014 4 00:00:13,014 --> 00:00:13,680 Dustin Tran: Hi. 5 00:00:13,680 --> 00:00:14,980 Dustin Ég heiti. 6 00:00:14,980 --> 00:00:18,419 Svo ég ætla að kynna Data Analysis í R. 7 00:00:18,419 --> 00:00:19,710 Bara svolítið um sjálfan mig. 8 00:00:19,710 --> 00:00:24,320 Ég er nú í framhaldsnámi í verkfræði- og Applied vísindi. 9 00:00:24,320 --> 00:00:28,330 Ég stunda nám í gatnamótum vél nám og tölfræði 10 00:00:28,330 --> 00:00:31,375 svo er Data Analysis í R virkilega grundvallaratriði að það 11 00:00:31,375 --> 00:00:33,790 Ég á hverjum einasta degi. 12 00:00:33,790 --> 00:00:35,710 >> Og R er sérstaklega gott fyrir greiningu gagna 13 00:00:35,710 --> 00:00:39,310 vegna þess að það er mjög gott fyrir prototyping. 14 00:00:39,310 --> 00:00:43,590 Og yfirleitt þegar þú ert að gera einhvers konar af greiningu gagna, a einhver fjöldi af vandamál 15 00:00:43,590 --> 00:00:44,920 eru að fara að hugrænni. 16 00:00:44,920 --> 00:00:48,700 Og svo þú vilt bara að hafa sumir mjög gott tungumál sem 17 00:00:48,700 --> 00:00:53,770 er bara gott fyrir að gera innbyggður-í aðgerðir, andstætt 18 00:00:53,770 --> 00:00:57,430 að þurfa að takast á við lágt hlutum. 19 00:00:57,430 --> 00:01:01,040 Svo í byrjun, ég ætla bara að fara að kynna hvað er R, hvers vegna vildi 20 00:01:01,040 --> 00:01:04,540 þú vilt nota það, og þá fara yfir í einhvern demo, 21 00:01:04,540 --> 00:01:07,060 og bara fara þaðan. 22 00:01:07,060 --> 00:01:08,150 >> Svo er það R? 23 00:01:08,150 --> 00:01:11,180 R er bara þróað tungumál tölfræðilega computing 24 00:01:11,180 --> 00:01:12,450 og visualization. 25 00:01:12,450 --> 00:01:16,000 Svo hvað þýðir þetta er að það er mjög gott mál 26 00:01:16,000 --> 00:01:22,400 fyrir hvers konar hlutur sem fæst við óvissa eða gögn visualization. 27 00:01:22,400 --> 00:01:24,850 Svo þú hefur allt þetta líkindadreifingar. 28 00:01:24,850 --> 00:01:27,140 Það eru að fara að vera innbyggður-í aðgerðir. 29 00:01:27,140 --> 00:01:31,650 Þú munt einnig hafa framúrskarandi samsærismaður pakka. 30 00:01:31,650 --> 00:01:34,110 >> Python er annar keppa tungumál fyrir gögn. 31 00:01:34,110 --> 00:01:40,020 Og eitt sem ég kemst að því að R er miklu betri í er visualization. 32 00:01:40,020 --> 00:01:45,200 Svo það sem þú munt sjá í kynningu sem vel er bara mjög leiðandi tungumál 33 00:01:45,200 --> 00:01:48,050 sem bara virkar mjög vel. 34 00:01:48,050 --> 00:01:53,140 Það er einnig frjáls og opinn uppspretta, sem er einhver annar góður tungumál ég giska á. 35 00:01:53,140 --> 00:01:55,440 >> Og hér, fullt af bara leitarorð kastað á þig. 36 00:01:55,440 --> 00:02:00,450 Það er dynamic, sem þýðir ef þú ert a ákveðin tegund úthlutað á hlut 37 00:02:00,450 --> 00:02:02,025 en það verður bara að breyta því á flugu. 38 00:02:02,025 --> 00:02:05,670 Það er latur þannig að það er klár um hvernig það virkar útreikninga. 39 00:02:05,670 --> 00:02:12,250 Functional þýðir að það geta raunverulega starfa byggt burt af störfum svo anything-- 40 00:02:12,250 --> 00:02:16,910 hvers konar meðferð þú ert gera, verður það að byggjast á aðgerðir. 41 00:02:16,910 --> 00:02:20,162 >> Svo tvöfaldur rekstraraðila, til dæmis, eru bara í eðli sínu virka. 42 00:02:20,162 --> 00:02:21,870 Og allt sem þú ert að fara að gera er 43 00:02:21,870 --> 00:02:24,690 að fara að hlaupa burt aðgerðir sjálft. 44 00:02:24,690 --> 00:02:27,140 Og þá mótmæla stilla eins og heilbrigður. 45 00:02:27,140 --> 00:02:30,930 >> Svo er hér að XKCD lóð. 46 00:02:30,930 --> 00:02:34,350 Ekki aðeins vegna þess að mér finnst eins og XKCD er grundvallaratriði í hvers konar 47 00:02:34,350 --> 00:02:37,770 framsetningu, heldur vegna þess að Mér finnst eins og þetta virkilega 48 00:02:37,770 --> 00:02:42,160 hamar lið sem mikið af þegar þú ert að gera einhvers konar gögn 49 00:02:42,160 --> 00:02:46,570 greiningu, vandamálið er ekki svo mikið hversu hratt það rennur, 50 00:02:46,570 --> 00:02:49,850 en hversu lengi það er að fara að taka þig að forrita verkefni. 51 00:02:49,850 --> 00:02:54,112 Svo hér er bara að greina hvort stefnu a eða b er skilvirkari. 52 00:02:54,112 --> 00:02:55,820 Þetta er að fara að vera eitthvað sem þú ert 53 00:02:55,820 --> 00:02:58,290 að fara að takast mikið með í Raða af lágmark-láréttur flötur tungumál 54 00:02:58,290 --> 00:03:03,440 þar sem þú ert að takast á við seg galla, minni úthlutun, initializations, 55 00:03:03,440 --> 00:03:05,270 jafnvel gera the innbyggður-í aðgerðir. 56 00:03:05,270 --> 00:03:09,920 Og þetta efni er öll meðhöndluð mjög glæsilegur í R. 57 00:03:09,920 --> 00:03:12,839 >> Svo bara að negla þetta lið, stærsta flöskuháls 58 00:03:12,839 --> 00:03:13,880 er að fara að vera vitsmunaleg. 59 00:03:13,880 --> 00:03:17,341 Svo er greiningu gagna mjög erfitt vandamál. 60 00:03:17,341 --> 00:03:19,340 Hvort sem þú ert að gera vél nám eða þú ert 61 00:03:19,340 --> 00:03:22,550 gera bara einhverskonar Grunngögn könnun, 62 00:03:22,550 --> 00:03:25,290 þú vilt ekki að hafa að taka skjal 63 00:03:25,290 --> 00:03:27,440 og þá þýða eitthvað í hvert skipti sem þú 64 00:03:27,440 --> 00:03:31,010 langar að sjá hvað dálk lítur út, hvað einkum færslur í stoðefni 65 00:03:31,010 --> 00:03:32,195 lítur út. 66 00:03:32,195 --> 00:03:34,320 Svo þú vilt bara að hafa sumir mjög gott viðmót 67 00:03:34,320 --> 00:03:37,740 þú getur keyrt einfaldri aðgerð að Vísitölur til hvað 68 00:03:37,740 --> 00:03:41,870 þú vilt og bara hlaupa það þaðan. 69 00:03:41,870 --> 00:03:44,190 Og þú þarft lén sérstakar tungumál fyrir þessu. 70 00:03:44,190 --> 00:03:51,750 Og R mun virkilega hjálpa þér að skilgreina vandamál og leysa það á þennan hátt. 71 00:03:51,750 --> 00:03:58,690 >> Svo er hér mynd sem sýnir forritun Vinsældir R þar sem það er farið með tímanum. 72 00:03:58,690 --> 00:04:04,060 Svo eins og þú geta sjá, eins og 2013 eða svo það blásið bara upp ógurlega. 73 00:04:04,060 --> 00:04:09,570 Og þetta hefur verið bara af því gríðarstór stefna í tækni iðnaði 74 00:04:09,570 --> 00:04:10,590 um stór gögn. 75 00:04:10,590 --> 00:04:13,010 Einnig, ekki bara tækni iðnaður, en í raun 76 00:04:13,010 --> 00:04:16,490 allir iðnaður that-- því a einhver fjöldi af iðnaði 77 00:04:16,490 --> 00:04:20,589 eru eins konar grundvöllur að reyna að leysa þessi vandamál. 78 00:04:20,589 --> 00:04:24,590 Og yfirleitt er hægt að hafa sumir góður leið til að mæla þessi vandamál 79 00:04:24,590 --> 00:04:29,720 eða jafnvel skilgreina þær eða leysa þau með gögnum. 80 00:04:29,720 --> 00:04:35,430 Þannig að ég held að núna er R 11. Vinsælasta tungumál á TIOBE 81 00:04:35,430 --> 00:04:38,200 og það hefur verið vaxandi síðan. 82 00:04:38,200 --> 00:04:40,740 83 00:04:40,740 --> 00:04:43,080 >> Svo er hér meira aðgerðir R. Það hefur 84 00:04:43,080 --> 00:04:46,900 gífurleg fjöldi pakka og fyrir allar þessar mismunandi hluti. 85 00:04:46,900 --> 00:04:52,470 Svo hvenær þú hafa a viss vandamál, flest 86 00:04:52,470 --> 00:04:55,060 tíminn R verður sem virka fyrir þig. 87 00:04:55,060 --> 00:04:58,520 Svo hvort sem þú vilt byggja einhverskonar vél 88 00:04:58,520 --> 00:05:02,770 læra reiknirit sem kallast Random Forest eða ákvörðun Trees, 89 00:05:02,770 --> 00:05:07,530 eða jafnvel að reyna að taka meðaltal af fall eða eitthvað af þessu efni, 90 00:05:07,530 --> 00:05:10,000 R mun hafa það. 91 00:05:10,000 --> 00:05:14,190 >> Og ef þú gerir þér þykir vænt um hagræðingu, eitt sem er sameiginlegt 92 00:05:14,190 --> 00:05:17,430 er að eftir að þú ert búinn prototyping einhvers konar hár-láréttur flötur tungumál, 93 00:05:17,430 --> 00:05:19,810 þú munt henda að in-- þú verður bara tengi sem yfir 94 00:05:19,810 --> 00:05:21,550 að einhverju lágmark-láréttur flötur tungumál. 95 00:05:21,550 --> 00:05:26,090 Hvað er gott um R er að þegar þú ert gert prototyping það er hægt að keyra C ++, 96 00:05:26,090 --> 00:05:29,510 eða Fortran eða eitthvað af þessu lægri stigi sjálfur beint inn R. 97 00:05:29,510 --> 00:05:32,320 Svo er það eitt í raun kaldur lögun um R, 98 00:05:32,320 --> 00:05:35,930 ef þér þykir vænt raunverulega um hagræðingu lið. 99 00:05:35,930 --> 00:05:39,490 >> Og það er líka mjög gott fyrir vefur visualizations. 100 00:05:39,490 --> 00:05:43,530 Svo D3.js, til dæmis, er Ég giska annað námskeið 101 00:05:43,530 --> 00:05:45,130 sem við kynnt í dag. 102 00:05:45,130 --> 00:05:48,510 Og þetta er í raun ógnvekjandi fyrir gera gagnvirka sjónræn. 103 00:05:48,510 --> 00:05:54,460 Og D3.js ráð fyrir að þú ert einhvers konar gögn til að samsæri 104 00:05:54,460 --> 00:05:58,080 og R er frábær leið til að vera fær um að gera greining gagna áður en þú flytja hana 105 00:05:58,080 --> 00:06:04,220 yfir til D3.js eða jafnvel bara að keyra D3.js skipanir í R sig, 106 00:06:04,220 --> 00:06:08,240 sem og allar þessar bókasafna og. 107 00:06:08,240 --> 00:06:13,041 >> Svo það var bara kynning á hvað er R og hvers vegna þú gætir notað það. 108 00:06:13,041 --> 00:06:14,790 Svo vonandi, hef ég sannfærður þér eitthvað 109 00:06:14,790 --> 00:06:18,460 um bara að reyna að sjá hvað það er. 110 00:06:18,460 --> 00:06:23,930 Þannig að ég ætla að fara á undan og fara í gegnum sumir grundvallaratriði um R hlutum 111 00:06:23,930 --> 00:06:26,150 og hvað þú getur gert. 112 00:06:26,150 --> 00:06:29,690 >> Svo hér er bara fullt af stærðfræði skipunum. 113 00:06:29,690 --> 00:06:35,000 Svo segja you're-- þú vilt að byggja Tungumál sjálfur og þú vilt bara 114 00:06:35,000 --> 00:06:38,080 að hafa fullt af mismunandi verkfæri. 115 00:06:38,080 --> 00:06:42,520 Hvers konar starfsemi sem þú heldur að þú vilt vilja er ansi mikið að fara að vera í R. 116 00:06:42,520 --> 00:06:44,150 >> Svo hér er 2 plús 2. 117 00:06:44,150 --> 00:06:46,090 Hér er 2 sinnum pí. 118 00:06:46,090 --> 00:06:51,870 R hefur fullt af innbyggður-í fastar að þú munt oft notað eins pí, e. 119 00:06:51,870 --> 00:06:56,230 >> Og þá, hér er 7 plus runif, svo runif af 1. 120 00:06:56,230 --> 00:07:02,450 Þetta er fall sem er býr einn af handahófi samræmda frá 0 til 1. 121 00:07:02,450 --> 00:07:04,400 Og þá er það 3 á vald af 4. 122 00:07:04,400 --> 00:07:06,430 Það er kvaðratrót. 123 00:07:06,430 --> 00:07:07,270 >> Það er skráning. 124 00:07:07,270 --> 00:07:14,500 Svo skráðu þig mun gera stöð veldisvísis af sjálfu sér. 125 00:07:14,500 --> 00:07:18,337 Og þá, ef þú tilgreinir grunn, þá þú getur gert hvað sem stöð sem þú vilt. 126 00:07:18,337 --> 00:07:19,920 Og þá eru hér nokkrar aðrar skipanir. 127 00:07:19,920 --> 00:07:22,180 Svo þú ert 23 unga fólkið 2. 128 00:07:22,180 --> 00:07:24,910 Þá hefur þú afganginn. 129 00:07:24,910 --> 00:07:27,110 Síðan sem þú ert vísinda merki ef þig líka 130 00:07:27,110 --> 00:07:34,060 langar að gera bara meira og flóknari hlutir. 131 00:07:34,060 --> 00:07:37,320 >> Svo hér er verkefni. 132 00:07:37,320 --> 00:07:40,830 Svo dæmigerð verkefni í R er gert með ör 133 00:07:40,830 --> 00:07:43,440 svo það er minna en og þá bandstrik. 134 00:07:43,440 --> 00:07:47,250 Svo hér er ég bara að framselja 3 til breytu val. 135 00:07:47,250 --> 00:07:50,160 >> Og þá er ég að prenta út Val og þá prentar það út þrjú. 136 00:07:50,160 --> 00:07:53,920 Mælast í R túlkur, það prentar það út fyrir þig 137 00:07:53,920 --> 00:07:57,280 svo þú þarft ekki að tilgreina prenta Val hvenær sem þú vilt prenta eitthvað. 138 00:07:57,280 --> 00:08:00,200 Þú getur bara gert val og þá skal gera það fyrir þig. 139 00:08:00,200 --> 00:08:04,380 >> Einnig er hægt að nota jafngildir tæknilega sem framsal rekstraraðila. 140 00:08:04,380 --> 00:08:07,190 Það er dálítill næmi milli með örina 141 00:08:07,190 --> 00:08:10,730 rekstraraðila og jafngildir rekstraraðila fyrir verkefni. 142 00:08:10,730 --> 00:08:15,470 Aðallega af samningur, allir mun bara nota örina rekstraraðila. 143 00:08:15,470 --> 00:08:21,850 >> Og hér, ég framselja þetta hornrétt merki heitir 1 ristill 6. 144 00:08:21,850 --> 00:08:26,010 Þetta býr vigur frá 1 til 6. 145 00:08:26,010 --> 00:08:29,350 Og þetta virkilega gott því þá þú úthluta bara vigur Val 146 00:08:29,350 --> 00:08:34,270 og það virkar af sjálfu sér. 147 00:08:34,270 --> 00:08:37,799 >> Þannig að þetta er nú þegar að fara frá a single-- mjög leiðandi gögn 148 00:08:37,799 --> 00:08:41,070 Uppbygging bara tvöfalt af sumir tegund af tegund í ferju 149 00:08:41,070 --> 00:08:45,670 og sem mun safna öllum að scalar gildi fyrir þig. 150 00:08:45,670 --> 00:08:50,770 Svo eftir að fara frá scalar, þú hafa R hluti og þetta er vektor. 151 00:08:50,770 --> 00:08:55,610 Vektor er hvers konar safn af sömu gerð. 152 00:08:55,610 --> 00:08:58,150 Svo hér eru fullt af vektor. 153 00:08:58,150 --> 00:08:59,800 >> Svo er þetta tölustafir. 154 00:08:59,800 --> 00:09:02,440 Tölustafir er vegur R er að segja tvöfaldur. 155 00:09:02,440 --> 00:09:07,390 Og svo sjálfgefið, allir tala vilja vera tvöfaldur. 156 00:09:07,390 --> 00:09:13,150 >> Svo ef þú ert c 1,1 og 3, neikvæð 5.7, sem c er fall. 157 00:09:13,150 --> 00:09:16,760 Þetta concatenates öll þrjú tölur í ferju. 158 00:09:16,760 --> 00:09:19,619 Og þetta mun be-- svo ef vart 3 af sjálfu sér, 159 00:09:19,619 --> 00:09:21,910 venjulega þú myndi gera ráð fyrir að þetta er eins heiltala, 160 00:09:21,910 --> 00:09:25,050 en vegna þess að allar vigra eru þau sömu tegund, 161 00:09:25,050 --> 00:09:28,660 þetta er vektor af tvennur eða tölustafir í þessu tilfelli. 162 00:09:28,660 --> 00:09:34,920 >> rnorm er fall sem býr stöðluð normaldreifð variables-- 163 00:09:34,920 --> 00:09:36,700 eða stöðluð normaldreifð gildi. 164 00:09:36,700 --> 00:09:38,360 Og ég er að tilgreina tvö af þeim. 165 00:09:38,360 --> 00:09:43,840 Þannig að ég ætla að gera rnorm 2, framselja það til Devs, og þá er ég að prenta út höfunda kerfisins vita. 166 00:09:43,840 --> 00:09:47,350 Svo þetta eru bara tveir handahófi eðlileg gildi. 167 00:09:47,350 --> 00:09:50,060 >> Og þá ints ef þú gerir þér þykir vænt um heiltölur. 168 00:09:50,060 --> 00:09:54,650 Svo er þetta bara um minni úthlutun og sparnaður minni stærð. 169 00:09:54,650 --> 00:10:01,460 Svo þú þyrftir að bæta tölur þínar eftir höfuðborginni L. 170 00:10:01,460 --> 00:10:04,170 >> Almennt, þetta er Sögulega merki R er 171 00:10:04,170 --> 00:10:06,940 fyrir eitthvað sem kallast löng heiltala. 172 00:10:06,940 --> 00:10:09,880 Svo mest af þeim tíma, þú munt fengist við tvíliðaleik. 173 00:10:09,880 --> 00:10:15,180 Og ef þú verður alltaf seinna á bjartsýni númerið þitt, 174 00:10:15,180 --> 00:10:18,110 þú getur bara sett svona L's eftir eða á meðan það 175 00:10:18,110 --> 00:10:22,280 ef þú ert eins og precognitive um hvað þú ert að fara að gera þessar breytur. 176 00:10:22,280 --> 00:10:25,340 177 00:10:25,340 --> 00:10:26,890 >> Svo er hér eðli vektor. 178 00:10:26,890 --> 00:10:31,440 Svo aftur, ég er concatenating þrjú strengir þessu sinni. 179 00:10:31,440 --> 00:10:36,230 Takið eftir að tvöfalda strengi og stakir strengir eru þau sömu í R. 180 00:10:36,230 --> 00:10:41,000 Þannig að ég hef Arthur og Marvin og svo þegar ég er að prenta það út, þá alla 181 00:10:41,000 --> 00:10:43,210 eru að fara að sýna tvöfalda strengi. 182 00:10:43,210 --> 00:10:45,880 Og ef þú vilt einnig að fela í sér tvöfaldur eða einn strengur 183 00:10:45,880 --> 00:10:50,070 í stafi, þá getur þú annaðhvort varamaður strengi þína. 184 00:10:50,070 --> 00:10:53,540 >> Svo Marvin er fyrir Annað þáttur, þetta er 185 00:10:53,540 --> 00:10:56,380 fara að show-- þig bara double strengi 186 00:10:56,380 --> 00:10:59,050 og þá einn strengur þannig að þetta er til skiptis. 187 00:10:59,050 --> 00:11:04,040 Annars, ef þú vilt nota tvöfalt string rekstraraðila í tvöföldum streng 188 00:11:04,040 --> 00:11:07,090 þegar þú ert að lýsa það, þá þú notar bara flýja rekstraraðila. 189 00:11:07,090 --> 00:11:10,600 Svo þú gera Sviga tvöfalda band. 190 00:11:10,600 --> 00:11:13,330 >> Og að lokum, við einnig hafa rökrétt vektor. 191 00:11:13,330 --> 00:11:15,890 Svo logical-- svo TRUE og FALSE, og þeir eru 192 00:11:15,890 --> 00:11:18,880 að fara að vera allt hástafi. 193 00:11:18,880 --> 00:11:22,370 Og þá, aftur, ég er concatenating þá og þá framselja þá til bools. 194 00:11:22,370 --> 00:11:24,590 Svo bools er að fara að sýna þú TRUE, FALSE, og satt. 195 00:11:24,590 --> 00:11:28,280 196 00:11:28,280 --> 00:11:31,620 >> Svo hér er vectorized flokkun. 197 00:11:31,620 --> 00:11:34,870 Svo í byrjun, ég er að taka function-- 198 00:11:34,870 --> 00:11:39,230 þetta er kallað sequence-- röð frá 2 til 12. 199 00:11:39,230 --> 00:11:42,490 Og ég ætla að taka röð af 2. 200 00:11:42,490 --> 00:11:46,660 Svo það er að fara að gera 2, 4, 6, 8, 10 og 12. 201 00:11:46,660 --> 00:11:50,080 Og þá er ég flokkun til að fá þriðja frumefni. 202 00:11:50,080 --> 00:11:55,770 >> Svo er eitt sem þarf að hafa í huga að R Vísitölur með því að byrja frá 1. 203 00:11:55,770 --> 00:12:00,550 Svo Vals 3 er að fara að gefa þú þriðja þáttur. 204 00:12:00,550 --> 00:12:04,580 Þetta er tegund af frábrugðin öðrum tungumál þar sem það byrjar frá núlli. 205 00:12:04,580 --> 00:12:09,780 Svo í C eða C ++, til dæmis, þú ert fara að fá fjórða frumefni. 206 00:12:09,780 --> 00:12:13,280 >> Og hér er Vals frá 3 til 5. 207 00:12:13,280 --> 00:12:16,030 Svo það er eitt í raun er ótrúlegt að þér 208 00:12:16,030 --> 00:12:20,410 er hægt að búa tímabundnar breytur inni og þá bara nota þá á flugu. 209 00:12:20,410 --> 00:12:21,960 Svo hér er 3 til 5. 210 00:12:21,960 --> 00:12:25,070 Þannig að ég ætla að búa til vektor 3, 4, og 5 og síðan 211 00:12:25,070 --> 00:12:29,700 Ég er flokkun til að fá þriðjung, fjórða, og fimmta þætti. 212 00:12:29,700 --> 00:12:32,280 >> Svo álíka, þú getur Útdráttur bara að gera 213 00:12:32,280 --> 00:12:35,280 hvers konar vegvísir sem gefur þér flokkun. 214 00:12:35,280 --> 00:12:40,050 Svo er hér Vals og þá Fyrsta, þriðja og sjötta þætti. 215 00:12:40,050 --> 00:12:42,800 Og þá, ef þú vilt að gera viðbót, 216 00:12:42,800 --> 00:12:45,210 svo þú bara mínus eftirá og munt að 217 00:12:45,210 --> 00:12:48,600 gefa þér allt sem er ekki Fyrsta, þriðja eða sjötta þáttur. 218 00:12:48,600 --> 00:12:51,590 Þannig að þetta verður að vera 4, 8 og 10. 219 00:12:51,590 --> 00:12:54,380 >> Og ef þú vilt fá jafnvel lengra, 220 00:12:54,380 --> 00:12:57,610 þú getur concatenate Boolean vektor. 221 00:12:57,610 --> 00:13:05,210 Þannig að þetta Vísitalan er að fara að gefa þér þetta Boolean vektor lengd 6. 222 00:13:05,210 --> 00:13:07,280 Svo fulltrúi TRUE komma 3. 223 00:13:07,280 --> 00:13:09,680 Þetta mun endurtaka satt þrisvar sinnum. 224 00:13:09,680 --> 00:13:12,900 Þannig að þetta mun gefa þér vektor TRUE, SATT, TRUE. 225 00:13:12,900 --> 00:13:17,470 >> fulltrúi FALSE 4-- þetta er að fara að gefa þér vektor af FALSE, FALSE, FALSE, FALSE. 226 00:13:17,470 --> 00:13:21,280 Og þá c er að fara til concatenate þessir tveir Booleans saman. 227 00:13:21,280 --> 00:13:24,090 Svo þú ert að fara að fá þrjá TRUEs og þá fjórir FALSEs. 228 00:13:24,090 --> 00:13:28,460 >> Þannig að þegar þú vísitölu Vals, þú ert fara að fá sem TRUE, SATT, TRUE. 229 00:13:28,460 --> 00:13:31,420 Svo það er að fara að segja já, Ég vil þá þrjá þætti. 230 00:13:31,420 --> 00:13:33,520 Og þá FALSE, FALSE, FALSE, FALSE er að fara 231 00:13:33,520 --> 00:13:37,140 að segja nei, ég vil ekki þá þætti svo það er ekki að fara að skila þeim. 232 00:13:37,140 --> 00:13:41,490 >> Og ég held að það er í raun prentvilla hér vegna þess að þetta er að segja endurtaka TRUE 3 233 00:13:41,490 --> 00:13:47,990 og endurtaka ósönn 4, og tæknilega, þú aðeins hafa sex þættir svo endurtaka FALSE, 234 00:13:47,990 --> 00:13:50,470 það ætti að vera endurtaka FALSE 3. 235 00:13:50,470 --> 00:13:55,260 Ég held R er líka klár nóg svo að ef þú tilgreinir bara 4 hér, þá 236 00:13:55,260 --> 00:13:56,630 það verður ekki einu sinni villa út. 237 00:13:56,630 --> 00:13:58,480 Það verður bara að gefa þér þetta gildi. 238 00:13:58,480 --> 00:14:00,970 Svo það verður bara að hunsa þessi fjórða FALSE. 239 00:14:00,970 --> 00:14:05,310 240 00:14:05,310 --> 00:14:09,270 >> Svo hér er vectorized verkefni. 241 00:14:09,270 --> 00:14:15,480 Svo set.seed-- þetta bara setur sáðkorn handa pseudorandom númer. 242 00:14:15,480 --> 00:14:20,110 Þannig að ég ætla að setja fræ til 42, sem þýðir að ef ég mynda 243 00:14:20,110 --> 00:14:22,950 þrír af handahófi eðlilegt gildi, og þá ef þú 244 00:14:22,950 --> 00:14:27,400 hlaupa set.seed á eigin spýtur tölva með því að nota sama gildi 42, 245 00:14:27,400 --> 00:14:30,990 þá færðu líka Sömu þrjú random normals. 246 00:14:30,990 --> 00:14:33,411 >> Svo er þetta mjög gott fyrir samanburðarnákvæmni. 247 00:14:33,411 --> 00:14:35,910 Venjulega, þegar þú ert að gera sumir konar vísinda greiningu, 248 00:14:35,910 --> 00:14:37,230 þú vilt að setja fræ. 249 00:14:37,230 --> 00:14:41,270 Þannig öðrum vísindamönnum getur bara endurskapa nákvæmlega sama kóðann sem þú hefur 250 00:14:41,270 --> 00:14:44,790 gert vegna þess að þeir hafa nákvæmlega sömu hendingar that-- eða handahófi 251 00:14:44,790 --> 00:14:47,270 gildi sem þú hefur tekið út eins og heilbrigður. 252 00:14:47,270 --> 00:14:49,870 253 00:14:49,870 --> 00:14:53,910 >> Og svo vectorized verkefni hér er að sýna Vals á 1 til 2. 254 00:14:53,910 --> 00:14:59,290 Þannig að það tekur tvo fyrstu þætti af Vals og þá gefur þá til 0. 255 00:14:59,290 --> 00:15:03,940 Og þá, þú getur líka bara gera líkur hlutur með Booleans. 256 00:15:03,940 --> 00:15:09,340 >> Svo Vals er ekki jafn 0-- þetta mun gefa þér vektor FALSE, FALSE, TRUE 257 00:15:09,340 --> 00:15:10,350 í þessu tilfelli. 258 00:15:10,350 --> 00:15:13,770 Og þá, það er að fara að segja eitthvað af þeim vísitölum sem væri satt, 259 00:15:13,770 --> 00:15:15,270 þá er það að fara að úthluta sem 5. 260 00:15:15,270 --> 00:15:18,790 Svo það tekur þriðja þáttur hér og þá gefur það til 5. 261 00:15:18,790 --> 00:15:22,300 >> Og þetta er mjög gott samanborið við lágmark-láréttur flötur tungumál 262 00:15:22,300 --> 00:15:25,560 þar sem þú þarft að nota fyrir lykkjur að gera alla þessa vectorized efni 263 00:15:25,560 --> 00:15:30,281 vegna þess að það er bara mjög leiðandi og það er a einn einn-Ferja. 264 00:15:30,281 --> 00:15:32,030 Og hvað er mikill um vectorized merki 265 00:15:32,030 --> 00:15:37,020 er að í R, eru þessir tegund af innbyggður-í svo að þeir eru næstum eins hratt 266 00:15:37,020 --> 00:15:42,490 sem gera í lágmark-láréttur flötur tungumál sem öfugt við gerð a for lykkju í R 267 00:15:42,490 --> 00:15:46,317 og þá hafa það að gera the dynamic flokkun sig. 268 00:15:46,317 --> 00:15:48,900 Og það verður að vera hægari en að gera þessi tegund af vectorized hlutur 269 00:15:48,900 --> 00:15:55,950 þar sem það getur gert það samhliða, þar það er að gera það í að þræða í grundvallaratriðum. 270 00:15:55,950 --> 00:15:58,650 >> Svo hér er vectorized starfsemi. 271 00:15:58,650 --> 00:16:04,920 Þannig að ég er að búa til gildið 1 til 3, úthlutun að til þess að vec1, 3 til 5, vec2, 272 00:16:04,920 --> 00:16:05,950 bæta þeim saman. 273 00:16:05,950 --> 00:16:11,490 Það bætir þeim hluti-vitur svo það er 1 plús 3, 2 plús 4, og svo framvegis. 274 00:16:11,490 --> 00:16:13,330 >> vec1 sinnum vec2. 275 00:16:13,330 --> 00:16:16,110 Þetta margfaldar tveir gildi hluti vitur. 276 00:16:16,110 --> 00:16:21,830 Svo er það 1 sinni 3, 2 sinnum 4 og síðan 3 sinnum 5. 277 00:16:21,830 --> 00:16:28,250 >> Og þá, á sama hátt og þú getur líka gert comparisons-- rökrétt samanburð. 278 00:16:28,250 --> 00:16:33,640 Svo er það ósatt ósatt satt í þessu tilfelli vegna þess að 1 er ekki meiri en 3, 279 00:16:33,640 --> 00:16:35,920 2 er ekki meiri en 4. 280 00:16:35,920 --> 00:16:41,160 Þetta er, held ég, annað prentvilla, 3 er örugglega ekki meiri en 5. 281 00:16:41,160 --> 00:16:41,660 Já. 282 00:16:41,660 --> 00:16:45,770 Og svo þú getur bara gert allt þessar einföldu aðgerðir 283 00:16:45,770 --> 00:16:48,350 vegna erft þeirra úr flokkum sjálfum. 284 00:16:48,350 --> 00:16:51,110 285 00:16:51,110 --> 00:16:52,580 >> Svo það var bara ferja. 286 00:16:52,580 --> 00:16:56,530 Og það er tegund af the grundvallaratriði R hlut þar sem gefið vigur, 287 00:16:56,530 --> 00:16:59,170 þú getur reisa fleiri háþróaður hlutum. 288 00:16:59,170 --> 00:17:00,560 >> Svo hér er fylki. 289 00:17:00,560 --> 00:17:05,030 Þetta er í raun abstrakt um hvað fylki sjálft. 290 00:17:05,030 --> 00:17:10,099 Svo í þessu tilfelli, er það þremur mismunandi ferjur, þar sem hver maður er dálkur, 291 00:17:10,099 --> 00:17:12,710 eða þú getur íhuga það sem hvert og eitt er röð. 292 00:17:12,710 --> 00:17:18,250 >> Þannig að ég ætla að geyma fylki frá 1 til 9 og þá er ég að tilgreina 3 raðir. 293 00:17:18,250 --> 00:17:23,364 Svo 1 til 9 mun gefa þér vektor 1, 2, 3, 4, 5, 6, og alla leið til 9. 294 00:17:23,364 --> 00:17:29,250 >> Eitt sem þarf að hafa í huga er að R verslanir gildi í dálki-meiriháttar sniði. 295 00:17:29,250 --> 00:17:34,160 Svo í öðrum orðum, þegar þú sérð 1 9, það er að fara að geyma them-- 296 00:17:34,160 --> 00:17:36,370 það er að fara að vera 1, 2, 3 í fyrsta dálki, 297 00:17:36,370 --> 00:17:38,510 og þá verður það að gera 4, 5, 6 í öðrum dálki, 298 00:17:38,510 --> 00:17:41,440 og síðan 7, 8, 9 í þriðja dálki. 299 00:17:41,440 --> 00:17:45,570 >> Og hér eru nokkrar aðrar algengar aðgerðir sem þú getur notað. 300 00:17:45,570 --> 00:17:49,650 Svo lítil motta, þetta mun gefa þér Stærðir grindarefnisins. 301 00:17:49,650 --> 00:17:52,620 Það er að fara að skila þér vektor af vídd. 302 00:17:52,620 --> 00:17:55,580 Þannig að í þessu tilfelli, vegna þess að fylki okkar er 3 af 3, 303 00:17:55,580 --> 00:18:01,900 það er að fara að gefa þér a tölustafir vektor sem er 3 3. 304 00:18:01,900 --> 00:18:05,270 >> Og hér er bara að sýna Matrix margföldun. 305 00:18:05,270 --> 00:18:11,970 Svo yfirleitt, ef þú gerir bara asterisk-- svo motta stjarna mat-- 306 00:18:11,970 --> 00:18:15,380 þetta er að fara að vera hluti-vitur aðgerð 307 00:18:15,380 --> 00:18:17,300 eða hvað er kallað Hadamard vöru. 308 00:18:17,300 --> 00:18:21,310 Svo það er að fara að gera á hverjum þáttur hluti-vitur. 309 00:18:21,310 --> 00:18:23,610 Hins vegar, ef þú vilt Matrix multiplication-- 310 00:18:23,610 --> 00:18:29,380 svo margfalda fyrstu röðinni sinnum Fyrsti dálkurinn sem annar Matrix er 311 00:18:29,380 --> 00:18:34,510 og svo on-- þú myndir nota þessi prósent aðgerð. 312 00:18:34,510 --> 00:18:38,110 >> Og t af motta er bara aðgerð fyrir lögleiða. 313 00:18:38,110 --> 00:18:42,590 Þannig að ég er að segja taka lögleiða í fylkið, margfalda það með fylkinu 314 00:18:42,590 --> 00:18:43,090 sjálft. 315 00:18:43,090 --> 00:18:45,006 Og þá er það að fara að aftur til þín annar 3 316 00:18:45,006 --> 00:18:50,700 um 3 fylkið sýning varan sem þú vilt vilt. 317 00:18:50,700 --> 00:18:53,750 >> Og svo það var fylki. 318 00:18:53,750 --> 00:18:56,020 Hér er það sem er kallað gögn ramma. 319 00:18:56,020 --> 00:19:00,780 A gögn ramma þú getur hugsað sem a fylki, en hver dálkur sig 320 00:19:00,780 --> 00:19:02,990 er að fara að vera af annarri gerð. 321 00:19:02,990 --> 00:19:07,320 >> Svo er það mjög flott um gögn rammar er að í greiningu gagna sjálft, 322 00:19:07,320 --> 00:19:11,260 þú ert að fara að hafa allt þetta ólíkum gögn og allt þetta í raun 323 00:19:11,260 --> 00:19:15,640 sóðalegur hlutur þar sem hver dálka sjálfir geta verið af ýmsum gerðum. 324 00:19:15,640 --> 00:19:21,460 Svo hér er ég að segja að búa til gögn ramma, gera ints frá 1 til 3, 325 00:19:21,460 --> 00:19:24,750 og þá einnig staf vektor. 326 00:19:24,750 --> 00:19:28,470 Þannig að ég get vísitölu gegnum hver af þessum dálkum 327 00:19:28,470 --> 00:19:30,930 og þá fæ ég þau gildi sjálfir. 328 00:19:30,930 --> 00:19:34,370 Og þú getur líka gert einhverskonar starfsemi á gögn ramma. 329 00:19:34,370 --> 00:19:38,040 Og mest af þeim tíma þegar þú ert gera greiningu gagna eða einhvers konar 330 00:19:38,040 --> 00:19:42,042 af forvinnu, munt þú vera vinna með þessi gögn mannvirki 331 00:19:42,042 --> 00:19:44,250 þar sem hver dálkur er að fara til að vera af annarri tegund. 332 00:19:44,250 --> 00:19:47,880 333 00:19:47,880 --> 00:19:52,970 >> Að lokum, svo þetta eru í raun bara fjórum nauðsynleg hlutir í R. List 334 00:19:52,970 --> 00:19:55,820 mun bara safna allir aðrir hlutir sem þú vilt. 335 00:19:55,820 --> 00:20:00,130 Svo það mun geyma þetta í eitt breytu sem þú getur auðveldlega nálgast. 336 00:20:00,130 --> 00:20:02,370 >> Svo hér, ég ætla að taka lista. 337 00:20:02,370 --> 00:20:04,460 Ég er að segja efni er 3. 338 00:20:04,460 --> 00:20:08,060 Þannig að ég ætla að hafa einn þáttur í lista, og þetta er kallað efni, 339 00:20:08,060 --> 00:20:10,570 og það er að fara að hafa gildið 3. 340 00:20:10,570 --> 00:20:13,140 >> Ég get líka búið til fylki. 341 00:20:13,140 --> 00:20:17,970 Svo er þetta 1 til 4 og endir röð er jafnt og 2, þannig að a 2 um 2 fylki. 342 00:20:17,970 --> 00:20:20,270 Einnig á listanum og það er kallað motta. 343 00:20:20,270 --> 00:20:24,690 moreStuff, eðli band, og jafnvel annan lista í sjálfu sér. 344 00:20:24,690 --> 00:20:27,710 >> Þannig að þetta er listi sem er 5 og björn. 345 00:20:27,710 --> 00:20:30,990 Svo það hefur gildið 5 og það hefur eðli band björn 346 00:20:30,990 --> 00:20:32,710 og það er a listi inni í listanum. 347 00:20:32,710 --> 00:20:35,965 Svo er hægt að hafa þetta endurkvæma hlutum sem 348 00:20:35,965 --> 00:20:38,230 þú þarft another-- a tegund innan tegund. 349 00:20:38,230 --> 00:20:41,420 Svo álíka, getur þú hafa a fylki inni annar grunnefninu og svo framvegis. 350 00:20:41,420 --> 00:20:44,264 Og listi er bara góð leið að safna og samtals 351 00:20:44,264 --> 00:20:45,430 Öll þessi mismunandi hlutir. 352 00:20:45,430 --> 00:20:50,210 353 00:20:50,210 --> 00:20:57,150 >> Og að lokum, hér er bara að hjálpa ef þetta var bara farið yfir mjög fljótt. 354 00:20:57,150 --> 00:21:01,350 Svo hvenær þú ert að rugla um einhvers konar virka, 355 00:21:01,350 --> 00:21:03,510 þú getur gert hjálp að virka. 356 00:21:03,510 --> 00:21:07,120 Svo þú getur gert hjálp fylki eða spurningarmerki fylki. 357 00:21:07,120 --> 00:21:11,430 Og hjálp og spurningarmerki eru bara styttingin fyrir sama 358 00:21:11,430 --> 00:21:13,040 svo þeir eru samheiti. 359 00:21:13,040 --> 00:21:16,820 >> lm er fall sem bara er línulega líkan. 360 00:21:16,820 --> 00:21:20,340 En ef þú ert bara ekki hugmynd um hvernig það verk, þú getur bara gert hjálp LM 361 00:21:20,340 --> 00:21:24,610 og það mun gefa þér nokkra konar gögn sem 362 00:21:24,610 --> 00:21:27,960 lítur svolítið eins og maður síðu í Unix, þar 363 00:21:27,960 --> 00:21:34,210 þú ert með stutta lýsingu á því hvað það gerir, einnig hvaða rök þess eru, 364 00:21:34,210 --> 00:21:38,850 hvað það skilar, og bara ábendingar um hvernig að nota það, og nokkur dæmi eins og heilbrigður. 365 00:21:38,850 --> 00:21:41,680 366 00:21:41,680 --> 00:21:52,890 >> Svo láta mig fara á undan og sýna sumir demo af notkun R. lagi. 367 00:21:52,890 --> 00:21:55,470 Svo ég fór yfir mjög fljótt bara gögnin 368 00:21:55,470 --> 00:21:59,440 mannvirki og einhvers konar af op-- sum starfsemi. 369 00:21:59,440 --> 00:22:02,960 Hér er sumar aðgerðir. 370 00:22:02,960 --> 00:22:06,750 >> Svo hér er ég bara að fara að skilgreina fall. 371 00:22:06,750 --> 00:22:09,970 Þannig að ég ætla líka að nota verkefni rekstraraðila hér, 372 00:22:09,970 --> 00:22:12,610 og þá er ég að segja lýsa því sem fall. 373 00:22:12,610 --> 00:22:14,140 Og það tekur gildið x. 374 00:22:14,140 --> 00:22:18,210 Svo er þetta einhver gildi sem þú vilt og ég ætla að fara aftur x sjálfu sér. 375 00:22:18,210 --> 00:22:20,840 Þannig að þetta er sjálfsmynd virka. 376 00:22:20,840 --> 00:22:23,670 >> Og hvað er kaldur um þetta samanborið við önnur tungumál 377 00:22:23,670 --> 00:22:26,330 og annar lágmark-láréttur flötur tungumálum er að x 378 00:22:26,330 --> 00:22:29,350 getur verið af hvaða gerð sjálfs og það mun skila þessi tegund. 379 00:22:29,350 --> 00:22:35,251 Svo er hægt að imagine-- þannig að við skulum mér að keyra bara þetta fljótt. 380 00:22:35,251 --> 00:22:35,750 Því miður. 381 00:22:35,750 --> 00:22:40,300 >> Svo eitt sem ég ætti líka að nefna er að þessi ritstjóri ég nota 382 00:22:40,300 --> 00:22:41,380 er kallað rstudio. 383 00:22:41,380 --> 00:22:44,389 Þetta er það sem er kallað IDE. 384 00:22:44,389 --> 00:22:46,180 Og eitt sem er mjög gott um þetta 385 00:22:46,180 --> 00:22:51,500 er að það felur í sér mikið af hlutir sem þú vilt gera í R af sjálfu 386 00:22:51,500 --> 00:22:53,180 bara mjög innsæi. 387 00:22:53,180 --> 00:22:55,550 >> Svo er hér túlk vélinni. 388 00:22:55,550 --> 00:23:02,160 Svo álíka, getur þú einnig fá þetta hugga hrár bara með því að gera höfuðborg R. 389 00:23:02,160 --> 00:23:05,630 Og þetta er nákvæmlega sama og vélinni. 390 00:23:05,630 --> 00:23:12,210 Svo ég get bara gert id virka x, x, x. 391 00:23:12,210 --> 00:23:16,130 Og then-- og þá að verður allt í lagi sig. 392 00:23:16,130 --> 00:23:19,200 393 00:23:19,200 --> 00:23:21,740 >> Svo er mikill rstudio vegna þess að það hefur á vélinni. 394 00:23:21,740 --> 00:23:25,360 Það hefur einnig skjöl þú vilt keyra á. 395 00:23:25,360 --> 00:23:28,629 Og þá hefur það nokkrar breytur að þú getur séð í umhverfi. 396 00:23:28,629 --> 00:23:30,420 Og þá, ef þú ert að gera plots, þá þér 397 00:23:30,420 --> 00:23:33,730 getur bara séð það hér, öfugt við stjórna öllum þessum mismunandi gluggum 398 00:23:33,730 --> 00:23:35,940 við sig. 399 00:23:35,940 --> 00:23:40,530 >> Ég reyndar persónulega nota Vim, en ég finnst eins rstudio er frábært bara 400 00:23:40,530 --> 00:23:44,640 fyrir að fá góða hugmynd um hvernig á að nota R. Venjulega, 401 00:23:44,640 --> 00:23:47,040 þegar þú ert að reyna að læra nokkur ný verkefni, 402 00:23:47,040 --> 00:23:49,590 þú vilt ekki að höndla of margt í einu. 403 00:23:49,590 --> 00:23:53,120 Svo er R bara very-- rstudio er mjög góð leið til að læra R 404 00:23:53,120 --> 00:23:56,760 án þess að þurfa að takast á við allt þetta annað. 405 00:23:56,760 --> 00:23:58,600 >> Svo hér er ég að keyra id halló. 406 00:23:58,600 --> 00:24:00,090 Þetta skilar halló. 407 00:24:00,090 --> 00:24:01,740 Auðkenni 123. 408 00:24:01,740 --> 00:24:04,610 Hér er vektor af heiltölur. 409 00:24:04,610 --> 00:24:08,620 Svo álíka, vegna þess að þú getur taka allir einhverskonar gildi, 410 00:24:08,620 --> 00:24:16,060 þú getur gert aftur id x þannig skilar það 1234 og 5. 411 00:24:16,060 --> 00:24:22,210 >> Og láta mig bara að sýna þér að þetta er örugglega heiltala. 412 00:24:22,210 --> 00:24:28,800 Og sömuleiðis, ef þú gerir bekknum kt x, það er að fara að vera heiltala. 413 00:24:28,800 --> 00:24:34,170 Og þá getur þú líka bera saman tvö og það er satt. 414 00:24:34,170 --> 00:24:38,350 Þannig að ég ætla að athuga hvort id x jafngildir jafngildir x og tilkynningu 415 00:24:38,350 --> 00:24:39,760 að það gefur þér tvo TRUEs. 416 00:24:39,760 --> 00:24:44,280 Þannig að þetta er ekki að segja eru tveir hlutir eins, 417 00:24:44,280 --> 00:24:46,845 en eru Hvert færslur innan vigranna eins. 418 00:24:46,845 --> 00:24:50,000 419 00:24:50,000 --> 00:24:52,090 >> Hér er bounded.compare. 420 00:24:52,090 --> 00:24:58,470 Þannig að þetta er örlítið flóknara í að það hefur Ef ástand og annað 421 00:24:58,470 --> 00:25:00,960 og þá tekur það tvo rök í einu. 422 00:25:00,960 --> 00:25:02,640 Svo er x af hvaða gerð. 423 00:25:02,640 --> 00:25:06,280 Og ég er að segja þetta Önnur rökin er. 424 00:25:06,280 --> 00:25:08,380 Þetta getur verið hvað sem er eins vel. 425 00:25:08,380 --> 00:25:12,490 En sjálfgefið, það er að fara að taka 5 ef þú tilgreinir ekki neitt. 426 00:25:12,490 --> 00:25:16,730 >> Svo hér er ég að fara að segja ef X er meiri en a. 427 00:25:16,730 --> 00:25:19,220 Svo ef ég tilgreina ekki, það segir ef x er stærra en 5, 428 00:25:19,220 --> 00:25:20,470 þá ætla ég að fara aftur TRUE. 429 00:25:20,470 --> 00:25:23,230 annars, ég ætla að fara aftur FALSE. 430 00:25:23,230 --> 00:25:24,870 Svo láta mig fara á undan og skilgreina þetta. 431 00:25:24,870 --> 00:25:30,600 432 00:25:30,600 --> 00:25:34,550 >> Og nú ætla ég að hlaupa bounded.compare 3. 433 00:25:34,550 --> 00:25:39,150 Svo það segir er 3 minna than-- er 3 meira en 5. 434 00:25:39,150 --> 00:25:41,830 Nei, það er ekki svo FALSE. 435 00:25:41,830 --> 00:25:46,550 >> Og bounded.compare 3 og ég er að fara að bera saman það með a jafngildir 2. 436 00:25:46,550 --> 00:25:50,700 Svo nú er ég að segja já, nú er ég vilt vera eitthvað annað. 437 00:25:50,700 --> 00:25:52,750 Þannig að ég ætla að segja, ættir þú að vera 2. 438 00:25:52,750 --> 00:25:56,640 >> Ég get annaðhvort gera þessa tegund af merki eða ég segi a jafngildir 2. 439 00:25:56,640 --> 00:25:58,720 Þetta er læsilegri því að þegar þú ert 440 00:25:58,720 --> 00:26:01,450 horfa á þetta í raun flóknar aðgerðir sem 441 00:26:01,450 --> 00:26:08,110 taka margar arguments-- og þetta getur verið heilmikið oftentimes-- bara að segja 442 00:26:08,110 --> 00:26:11,140 a jafngildir 2 er læsilegri fyrir þú svo sem síðar á í framtíðinni 443 00:26:11,140 --> 00:26:13,020 þú verður að vita hvað þú ert að gera. 444 00:26:13,020 --> 00:26:17,120 >> Svo í þessu tilfelli, ég er orð er 3 meiri en 2. 445 00:26:17,120 --> 00:26:18,270 Já það er. 446 00:26:18,270 --> 00:26:22,350 Og sömuleiðis, ég get bara fjarlægja þetta og segja, er 3 meira en 2 447 00:26:22,350 --> 00:26:23,440 þar sem jafngildir 2. 448 00:26:23,440 --> 00:26:26,230 Og það er líka satt. 449 00:26:26,230 --> 00:26:26,730 Já? 450 00:26:26,730 --> 00:26:29,670 >> Áhorfendur: Ertu framkvæmd línu fyrir línu? 451 00:26:29,670 --> 00:26:30,670 >> Dustin Tran: Já ég er. 452 00:26:30,670 --> 00:26:33,900 Svo það sem ég er að gera hér er taka þennan texta document-- 453 00:26:33,900 --> 00:26:39,825 og hvað er mikill um rstudio er að Ég get bara keyrt short-- lykill smákaka. 454 00:26:39,825 --> 00:26:41,820 Þannig að ég ætla að gera Control-inn. 455 00:26:41,820 --> 00:26:44,850 >> Og þá ætla ég að taka á lína í texta skjal 456 00:26:44,850 --> 00:26:46,710 og þá setja í vélinni. 457 00:26:46,710 --> 00:26:50,800 Svo hér er ég að segja, bounded.compare og ég er að gera Control-X. 458 00:26:50,800 --> 00:26:52,540 Svo ég get bara keyrt hér eins og heilbrigður. 459 00:26:52,540 --> 00:26:54,920 Og þá verður að taka á lína og þá setja það hér. 460 00:26:54,920 --> 00:26:57,900 Og þá á sama hátt, get ég keyri hér. 461 00:26:57,900 --> 00:27:04,630 Og þá mun það bara halda að skilgreina línurnar í vélinni svona. 462 00:27:04,630 --> 00:27:10,690 >> Og ef þú tekur einnig hrokkið axlabönd eru bara eins og í C setningafræði. 463 00:27:10,690 --> 00:27:13,910 x-- ef ef ástand er einnig fara að nota sviga og síðan 464 00:27:13,910 --> 00:27:15,350 þú getur notað annað. 465 00:27:15,350 --> 00:27:17,496 Annað er annað hvort. 466 00:27:17,496 --> 00:27:21,440 Þannig að þetta er að fara að vera x er jafnt jafngildir a, til dæmis. 467 00:27:21,440 --> 00:27:24,190 468 00:27:24,190 --> 00:27:26,350 Og þá er ég að fara að aftur eitthvað hérna. 469 00:27:26,350 --> 00:27:29,490 >> Takið eftir að það eru tveir mismunandi hlutir hér sem er að gerast. 470 00:27:29,490 --> 00:27:34,360 Eitt er að hér er ég að tilgreina skila gildi TRUE. 471 00:27:34,360 --> 00:27:35,950 Hér er ég bara að segja x. 472 00:27:35,950 --> 00:27:39,970 Svo R verður yfirleitt sjálfgefið taka síðustu arguments-- 473 00:27:39,970 --> 00:27:43,510 eða taka síðustu línu af kóða, og það mun vera það sem það er aftur. 474 00:27:43,510 --> 00:27:46,920 Svo hér er þetta sama hlutur sem gera aftur x. 475 00:27:46,920 --> 00:27:49,450 476 00:27:49,450 --> 00:27:50,540 >> Og bara til að sýna þér. 477 00:27:50,540 --> 00:27:54,000 478 00:27:54,000 --> 00:27:57,052 Og þá mun það vinna bara svona. 479 00:27:57,052 --> 00:27:58,260 Svo láta mig halda áfram með þetta. 480 00:27:58,260 --> 00:28:00,630 >> Svo annað ef. 481 00:28:00,630 --> 00:28:04,060 Og í raun, ég get aftur eitthvað sem ég vil. 482 00:28:04,060 --> 00:28:06,680 Svo ég er ekki einu sinni að baka Booleans allan tímann, 483 00:28:06,680 --> 00:28:08,410 Ég get bara aftur eitthvað annað. 484 00:28:08,410 --> 00:28:10,670 Svo ég get gert aftur björn. 485 00:28:10,670 --> 00:28:12,989 >> Þannig að ef x er jafnt jafngildir a, það er að fara að fara aftur í, bera. 486 00:28:12,989 --> 00:28:14,530 Annars, það er að fara að fara aftur TRUE. 487 00:28:14,530 --> 00:28:19,310 Ég get líka gert vigur eða í raun hvað sem er. 488 00:28:19,310 --> 00:28:22,210 >> Og eins og venjulega í statically slegið tungumál, 489 00:28:22,210 --> 00:28:23,840 þú vilt að tilgreina tegund hér. 490 00:28:23,840 --> 00:28:25,750 Athugið að það getur bara verið neitt. 491 00:28:25,750 --> 00:28:32,400 Og R er greindur nógu að það verður bara að gera þetta og það mun virka vel. 492 00:28:32,400 --> 00:28:33,620 >> Svo láta mig skilgreina þetta. 493 00:28:33,620 --> 00:28:39,460 494 00:28:39,460 --> 00:28:41,230 Unexpected-- ó miður. 495 00:28:41,230 --> 00:28:44,336 Það ætti að vera hrokkið Brace hér. 496 00:28:44,336 --> 00:28:44,836 OK. 497 00:28:44,836 --> 00:28:45,336 Cool. 498 00:28:45,336 --> 00:28:52,580 499 00:28:52,580 --> 00:28:54,530 Allt í lagi. 500 00:28:54,530 --> 00:28:58,250 Svo nú skulum bera 3 og er 3. 501 00:28:58,250 --> 00:29:01,860 Svo það ætti að return-- yeah-- á gildi björn. 502 00:29:01,860 --> 00:29:06,740 >> Svo nú er meira almennt hlutur eins hvað um önnur gögn mannvirki. 503 00:29:06,740 --> 00:29:09,110 Svo þú hefur þessa aðgerð. 504 00:29:09,110 --> 00:29:15,360 Þetta er að fara að vinna á einhverju tagi af value eins 3 eða hvaða tölustafir, 505 00:29:15,360 --> 00:29:17,500 í öðrum orðum, tvöfaldur. 506 00:29:17,500 --> 00:29:19,330 >> En hvað um eitthvað eins og vektor. 507 00:29:19,330 --> 00:29:27,750 Svo gerist það ef þú do-- svo ég er fara að úthluta Val að segja, 4 til 6. 508 00:29:27,750 --> 00:29:31,640 Þannig að ef ég sný aftur þetta, þetta er vektor frá 4, 5, 6. 509 00:29:31,640 --> 00:29:34,935 >> Nú skulum sjá hvað gerist ef ég bounded.compare Val. 510 00:29:34,935 --> 00:29:37,680 511 00:29:37,680 --> 00:29:42,450 Þannig að þetta er að fara að gefa þér 15 1251. 512 00:29:42,450 --> 00:29:46,440 Svo í öðrum orðum, það er að segja ef þú horfir á þetta ástand 513 00:29:46,440 --> 00:29:50,040 svo það segir x er minna en eða eitthvað. 514 00:29:50,040 --> 00:29:51,880 Svo er þetta örlítið ruglingslegt vegna þess að nú 515 00:29:51,880 --> 00:29:53,379 þú bara veist ekki hvað er að gerast. 516 00:29:53,379 --> 00:29:58,690 Svo ég giska eitt sem er virkilega gott um bara að reyna að kemba 517 00:29:58,690 --> 00:30:04,600 er að þú getur bara gert Val er meiri en a og sjá hvað gerist þar. 518 00:30:04,600 --> 00:30:09,720 >> Svo val-- a er sjálfgefið 5. svo skulum bara Val meiri en 5. 519 00:30:09,720 --> 00:30:14,280 Þannig að þetta er vektor FALSE FALSE TRUE. 520 00:30:14,280 --> 00:30:17,206 Svo nú þegar þú ert að horfa á þetta, það er að fara að segja ef, 521 00:30:17,206 --> 00:30:20,080 og þá er það að fara að gefa þér þetta er vektor af False False True. 522 00:30:20,080 --> 00:30:23,450 >> Svo þegar þú framhjá þessu í R, R hefur ekki hugmynd um hvað þú ert að gera. 523 00:30:23,450 --> 00:30:26,650 Vegna þess að það gerir ráð fyrir eitt stakt gildi, sem er Boole, og nú 524 00:30:26,650 --> 00:30:29,420 þú ert að gefa það a vektor af Booleans. 525 00:30:29,420 --> 00:30:31,970 Svo sjálfgefið, R er bara að fara að segja hvað Heck, 526 00:30:31,970 --> 00:30:35,440 Ég ætla að gera ráð fyrir að þú ert að fara að taka fyrsta frumefni hér. 527 00:30:35,440 --> 00:30:38,320 Þannig að ég ætla að say-- ég ætla að gera ráð fyrir að þetta er FALSE. 528 00:30:38,320 --> 00:30:40,890 Svo það er að fara að segja nei, þetta er ekki rétt. 529 00:30:40,890 --> 00:30:45,246 >> Á sama hátt, það er að fara að vera Val jafngildir jafngildir a. 530 00:30:45,246 --> 00:30:47,244 Nei, því miður 5. 531 00:30:47,244 --> 00:30:48,910 Og það er líka að fara að vera falskur eins og heilbrigður. 532 00:30:48,910 --> 00:30:52,410 Svo það er að fara að segja nei, það er ekki satt eins og heilbrigður svo það er 533 00:30:52,410 --> 00:30:53,680 fara að skila þessum síðasta einn. 534 00:30:53,680 --> 00:30:56,420 535 00:30:56,420 --> 00:31:01,360 >> Svo er annað hvort gott eða slæmt hlutur, eftir því hvernig á það er litið. 536 00:31:01,360 --> 00:31:05,104 Vegna þess að þegar þú ert að búa til þessar aðgerðir, 537 00:31:05,104 --> 00:31:06,770 þú í raun ekki vita hvað er að gerast. 538 00:31:06,770 --> 00:31:10,210 Svo stundum þú vilt vilt villu, eða kannski þú vilt bara viðvörun. 539 00:31:10,210 --> 00:31:12,160 Í þessu tilfelli, R er ekki að gera það. 540 00:31:12,160 --> 00:31:14,300 Svo það er í raun allt að þú byggt burt af því 541 00:31:14,300 --> 00:31:17,310 þú heldur að tungumál ætti að gera í þessu tilfelli 542 00:31:17,310 --> 00:31:22,920 ef það líður í vigur Booleans þegar þú ert að gera er ef ástand. 543 00:31:22,920 --> 00:31:31,733 >> Svo skulum segja að þú hefðir upprunalega einn með ef annar aftur SATT og þú ert 544 00:31:31,733 --> 00:31:34,190 fara til baka FALSE. 545 00:31:34,190 --> 00:31:39,300 Svo ein leið öflun þetta er að segja að ég 546 00:31:39,300 --> 00:31:41,530 þarft ekki einu sinni þetta skilyrt hlutur. 547 00:31:41,530 --> 00:31:47,220 Annað sem ég get gert er bara aftur gildi sjálfir. 548 00:31:47,220 --> 00:31:53,240 Svo ef þú finnur, ef þú do Val er meiri en 5, 549 00:31:53,240 --> 00:31:56,350 þetta er að fara að skila a vektor FALSE FALSE TRUE. 550 00:31:56,350 --> 00:31:58,850 >> Kannski er þetta það sem þú vilja fyrir bounded.compare. 551 00:31:58,850 --> 00:32:02,940 Þú vilt að skila vektor af Booleans þar sem það ber saman hvert af þeim gildum 552 00:32:02,940 --> 00:32:04,190 til sín. 553 00:32:04,190 --> 00:32:11,165 Svo þú getur bara bounded.compare function x, a jafngildir 5. 554 00:32:11,165 --> 00:32:13,322 555 00:32:13,322 --> 00:32:15,363 Og þá í stað þess að gera þetta ef annað ástand, 556 00:32:15,363 --> 00:32:21,430 Ég ætla bara að fara að fara aftur x er hærra en 5. 557 00:32:21,430 --> 00:32:23,620 Þannig að ef það er satt, þá það er að fara að fara aftur TRUE. 558 00:32:23,620 --> 00:32:26,830 Og þá ef það er ekki, það er fara til baka FALSE. 559 00:32:26,830 --> 00:32:30,880 >> Og þetta mun virka fyrir eitthvað af þessum stofnunum. 560 00:32:30,880 --> 00:32:41,450 Svo ég get bounded.compare c 1 6 eða 9 og þá ætla ég að segja jafngildir 6, 561 00:32:41,450 --> 00:32:42,799 til dæmis. 562 00:32:42,799 --> 00:32:44,840 Og þá er það að fara að gefa þér rétt Boolean 563 00:32:44,840 --> 00:32:48,240 vektorar sem þú ert að hanna. 564 00:32:48,240 --> 00:32:50,660 >> Svo þeir eru bara virka og nú láta mig bara 565 00:32:50,660 --> 00:32:54,980 sýna þér gagnvirka myndefni. 566 00:32:54,980 --> 00:32:59,700 Ég held ekki að ég hef í raun Wi-Fi hér svo látið mig fara bara á undan 567 00:32:59,700 --> 00:33:01,970 og sleppa þessu sem ég giska á. 568 00:33:01,970 --> 00:33:05,260 >> En eitt sem er kaldur þó að ef þú bara 569 00:33:05,260 --> 00:33:09,600 langar að prófa fullt af mismunandi gögn skipanir, 570 00:33:09,600 --> 00:33:13,320 það er fullt af mismunandi gagnasafna sem eru nú þegar preloaded inn R. 571 00:33:13,320 --> 00:33:15,770 Svo er einn af þeim kallað gagnasafni Iris. 572 00:33:15,770 --> 00:33:18,910 Þetta er einn af the heilbrigður-þekktur sjálfur í vél námi. 573 00:33:18,910 --> 00:33:23,350 Þú munt yfirleitt bara gera einhverskonar próf tilvikum að sjá hvort númerið þitt rennur. 574 00:33:23,350 --> 00:33:27,520 Svo skulum við athuga bara hvað Iris er. 575 00:33:27,520 --> 00:33:33,130 >> Svo þetta er að fara að vera gögn ramma. 576 00:33:33,130 --> 00:33:36,000 Og það er góður af lengi vegna Ég prenta bara út Iris. 577 00:33:36,000 --> 00:33:38,810 Það er að prenta út allt hlutur. 578 00:33:38,810 --> 00:33:42,830 Svo það hefur alla þessa mismunandi nöfn. 579 00:33:42,830 --> 00:33:45,505 Svo er Iris safn af mismunandi blóm. 580 00:33:45,505 --> 00:33:48,830 Í þessu tilfelli, það er að segja þú tegundir af henni, 581 00:33:48,830 --> 00:33:54,760 allar þessar mismunandi breiddum og Lengdir sepal og petal. 582 00:33:54,760 --> 00:33:58,880 >> Og svo venjulega, ef þú vilt prenta Iris, 583 00:33:58,880 --> 00:34:03,680 til dæmis, þú vilt ekki að hafa það gera allt þetta vegna þess að það getur tekið yfir 584 00:34:03,680 --> 00:34:05,190 allt stjórnborðið. 585 00:34:05,190 --> 00:34:09,280 Svo eitt sem er mjög gott er höfuð virka. 586 00:34:09,280 --> 00:34:12,929 Svo ef þú gerir bara höfðinu Iris, þetta mun gefa þér 587 00:34:12,929 --> 00:34:17,389 fyrstu fimm línur, eða sex ég giska á. 588 00:34:17,389 --> 00:34:19,909 Og þá vel, þér getur bara tilgreina hér. 589 00:34:19,909 --> 00:34:22,914 Svo 20-- þetta mun gefa þú fyrstu 20 raðir. 590 00:34:22,914 --> 00:34:24,830 Og ég var reyndar góður af hissa að þetta 591 00:34:24,830 --> 00:34:28,770 gaf mér sex svo látið mig fara á undan og athuga iris-- eða höfuð, því miður. 592 00:34:28,770 --> 00:34:31,699 593 00:34:31,699 --> 00:34:34,960 Og hér er það mun gefa þú skjölin 594 00:34:34,960 --> 00:34:37,960 af hvaða gildi höfuð gerir. 595 00:34:37,960 --> 00:34:40,839 Svo það skilar fyrst eða síðast á hlut. 596 00:34:40,839 --> 00:34:42,630 Og þá er ég að fara að líta á vanskil. 597 00:34:42,630 --> 00:34:47,340 Og þá segir það sjálfgefið aðferð höfuð X og n er jafnt og 6l. 598 00:34:47,340 --> 00:34:50,620 Þannig að þetta skilar fyrstu sex þætti. 599 00:34:50,620 --> 00:34:55,050 Og álíka ef vart hér, ég þurfti ekki að tilgreina n jafngildir 6. 600 00:34:55,050 --> 00:34:56,840 Sjálfgefið notar sex, held ég. 601 00:34:56,840 --> 00:35:00,130 Og þá, ef ég vil tilgreina ákveðin gildi, þá get ég skoðað það eins og heilbrigður. 602 00:35:00,130 --> 00:35:02,970 603 00:35:02,970 --> 00:35:10,592 >> Svo það er nokkur einföld skipanir og hér er annað sem er just-- vel, 604 00:35:10,592 --> 00:35:12,550 Ég can-- þetta er í raun flóknari, 605 00:35:12,550 --> 00:35:17,130 en þetta verður bara að taka í bekknum af hverjum dálki gagnasafni lithimnu. 606 00:35:17,130 --> 00:35:20,910 Þannig að þetta mun sýna þér hvað hvert þessara dálkar eru hvað varðar gerðir þeirra. 607 00:35:20,910 --> 00:35:23,665 Svo er sepal lengd tölustafir, sepal breidd er tölustafir. 608 00:35:23,665 --> 00:35:26,540 Öll þessi gildi eru bara tölustafir vegna þess að þú getur sagt frá þessum gögnum 609 00:35:26,540 --> 00:35:29,440 uppbygging þetta eru allir að fara að tölugildi. 610 00:35:29,440 --> 00:35:34,310 >> Og Tegund dálk er að fara að vera þáttur. 611 00:35:34,310 --> 00:35:37,270 Svo venjulega, myndir þú hugsa um að þetta er eins og eðli band. 612 00:35:37,270 --> 00:35:48,830 En ef þú gerir bara irisSpecies, og þá er ég að fara að gera höfuð 5, 613 00:35:48,830 --> 00:35:51,820 og þetta er að fara að prenta út fyrstu fimm gildum. 614 00:35:51,820 --> 00:35:54,150 >> Og þá taka þetta stigum. 615 00:35:54,150 --> 00:35:58,870 Þannig að þetta er saying-- þetta er leið R er af því að hafa flokkunartölur breytur. 616 00:35:58,870 --> 00:36:03,765 Þannig að í stað þess að bara hafa táknstrengja, 617 00:36:03,765 --> 00:36:06,740 það hefur stigum tilgreindar sem þessir hlutir eru. 618 00:36:06,740 --> 00:36:12,450 >> Svo skulum segja irisSpecies 1. 619 00:36:12,450 --> 00:36:17,690 Svo það sem þú vilt gera hér er ég subsetting við þessa Tegundir dálki. 620 00:36:17,690 --> 00:36:21,480 Svo tekur þetta Tegundir dálki og þá 621 00:36:21,480 --> 00:36:23,820 það Vísitölur á að fá fyrsta frumefni. 622 00:36:23,820 --> 00:36:27,140 Þannig að þetta ætti að gefa þér setosa. 623 00:36:27,140 --> 00:36:28,710 Og það gefur þér einnig stigum hér. 624 00:36:28,710 --> 00:36:32,812 >> Svo þú getur einnig bera saman þetta eðli setosa 625 00:36:32,812 --> 00:36:34,645 og þetta er ekki að fara til að vera satt vegna þess að eitt 626 00:36:34,645 --> 00:36:37,940 er af annarri tegund en hin. 627 00:36:37,940 --> 00:36:40,590 Eða ég giska á það er satt því R sé greindur en það. 628 00:36:40,590 --> 00:36:45,420 Og það lítur á þetta og þá segir, kannski er þetta það sem þú vilt. 629 00:36:45,420 --> 00:36:51,860 Svo það er að fara að segja staf string setosa er það sama og þessa. 630 00:36:51,860 --> 00:37:01,290 Og þá á sama hátt, þú getur líka bara grípa þetta eins og svo framvegis. 631 00:37:01,290 --> 00:37:05,580 >> Svo er það bara einhverskonar fljótur skipanir í gagnasafni. 632 00:37:05,580 --> 00:37:08,030 Svo er hér nokkur gögn könnun. 633 00:37:08,030 --> 00:37:11,360 Þannig að þetta er svolítið meira í tengslum við greiningu gagna. 634 00:37:11,360 --> 00:37:18,340 Og þetta er tekið úr sumum bootcamp í R um í Berkeley. 635 00:37:18,340 --> 00:37:20,790 >> Svo bókasafn erlend. 636 00:37:20,790 --> 00:37:24,880 Þannig að ég ætla að hlaða í bókasafn sem heitir erlendum. 637 00:37:24,880 --> 00:37:32,460 Þannig að þetta er að fara að gefa mér read.dta svo ráð fyrir að ég hef þetta dataset. 638 00:37:32,460 --> 00:37:39,000 Þetta er geymt í núverandi vinna möppu mínum vélinni. 639 00:37:39,000 --> 00:37:42,190 Svo skulum sjá bara hvað vinnumöppu er. 640 00:37:42,190 --> 00:37:44,620 >> Svo er hér vinnumöppu mín. 641 00:37:44,620 --> 00:37:50,040 Og lesa punktur gögn, þetta hlutur, er að segja þessa skrá 642 00:37:50,040 --> 00:37:54,650 er staðsett í gögnum möppunni þetta núverandi vinna möppu. 643 00:37:54,650 --> 00:38:00,520 Og read.dta þetta er ekki sjálfgefið stjórn. 644 00:38:00,520 --> 00:38:02,760 Ég held ég hlaðinn það þegar verið gert. 645 00:38:02,760 --> 00:38:04,750 IEI tók ég hlaðinn þetta í nú þegar. 646 00:38:04,750 --> 00:38:08,115 >> En svo read.dta er ekki að fara að vera sjálfgefið stjórn. 647 00:38:08,115 --> 00:38:11,550 Og það er hvers vegna þú ert að fara að hafa að hlaða í þessu bókasafni package-- 648 00:38:11,550 --> 00:38:14,500 þessi pakki sem kallast erlendum. 649 00:38:14,500 --> 00:38:16,690 Og ef þú ert ekki pakki, held ég 650 00:38:16,690 --> 00:38:19,180 erlendum er einn af the innbyggður-í sjálfur. 651 00:38:19,180 --> 00:38:31,150 Annars getur þú líka gera install.packages 652 00:38:31,150 --> 00:38:33,180 og þetta mun setja pakka. 653 00:38:33,180 --> 00:38:36,878 Og þetta mun gefa þér R. Uh, nei. 654 00:38:36,878 --> 00:38:39,830 655 00:38:39,830 --> 00:38:43,140 Og þá er ég bara að fara að hætta þetta vegna þess að ég hef nú þegar það. 656 00:38:43,140 --> 00:38:46,920 >> En hvað er í raun gott um R er að pakka stjórnun 657 00:38:46,920 --> 00:38:48,510 Kerfið er mjög glæsilegur. 658 00:38:48,510 --> 00:38:52,470 Vegna þess að það mun geyma allt virkilega fallega fyrir þig. 659 00:38:52,470 --> 00:38:59,780 Svo í þessu tilfelli, það er að fara að geyma það inn, ég tel þetta bókasafn hérna. 660 00:38:59,780 --> 00:39:02,390 >> Svo hvenær þú vilt setja upp ný pakka, 661 00:39:02,390 --> 00:39:04,980 það er bara eins einfalt og gera install.packages 662 00:39:04,980 --> 00:39:07,500 og R mun stjórna öllu pakkarnir fyrir þig. 663 00:39:07,500 --> 00:39:12,900 Svo þú þarft ekki að gera eitthvað í Python, þar sem þú hefur ytri pakka 664 00:39:12,900 --> 00:39:15,330 stjórnendur eins pappír Anaconda þar sem þú ert 665 00:39:15,330 --> 00:39:18,310 doing-- þú setja í embætti the pakka utan Python 666 00:39:18,310 --> 00:39:20,940 og þá reyna að keyra þá sjálfur. 667 00:39:20,940 --> 00:39:22,210 Þannig að þetta er mjög ágætur vegur. 668 00:39:22,210 --> 00:39:25,590 >> Og install.packages krefst internetið. 669 00:39:25,590 --> 00:39:31,950 Það tekur það frá miðlara og geymsla sem 670 00:39:31,950 --> 00:39:33,960 safnar öllum pakka er kallað Cran. 671 00:39:33,960 --> 00:39:40,690 Og þú getur tilgreint hvaða tegund af spegil þú vilt sækja pakka frá. 672 00:39:40,690 --> 00:39:43,420 >> Svo hér er ég að taka þetta dataset. 673 00:39:43,420 --> 00:39:46,240 Ég er að lesa hana í því að nota þessa aðgerð. 674 00:39:46,240 --> 00:39:49,360 Svo láta mig fara á undan og gera það. 675 00:39:49,360 --> 00:39:52,900 >> Svo skulum gera ráð fyrir að þú hefur þetta dataset 676 00:39:52,900 --> 00:39:55,550 og þú ert algerlega ekki hugmynd hvað það er. 677 00:39:55,550 --> 00:39:58,560 Og þetta í raun kemur upp nokkuð oft í greininni 678 00:39:58,560 --> 00:40:00,910 þar sem þú ert bara þetta tonn og tonn af sóðalegur hlutur 679 00:40:00,910 --> 00:40:02,890 og þeir eru ótrúlega ómerkt. 680 00:40:02,890 --> 00:40:06,380 Svo hér er ég hef þetta Gagnasett og ég veit ekki 681 00:40:06,380 --> 00:40:08,400 hvað það er svo ég er bara sýna að stöðva það út. 682 00:40:08,400 --> 00:40:10,620 >> Þannig að ég ætla að gera höfuðið fyrst. 683 00:40:10,620 --> 00:40:14,190 Svo ég athuga fyrstu sex dálkum hvað þetta gagnasafni er. 684 00:40:14,190 --> 00:40:21,730 Svo er þetta ástand, pres04, og þá öllum þessum mismunandi tegund af dálkum. 685 00:40:21,730 --> 00:40:25,612 Og hvað er áhugavert hérna, ég held, er að þér 686 00:40:25,612 --> 00:40:27,945 myndi gera ráð fyrir að þetta lítur eins og einhvers konar kosningum. 687 00:40:27,945 --> 00:40:30,482 688 00:40:30,482 --> 00:40:32,190 Og ég held bara frá horfa á skrá 689 00:40:32,190 --> 00:40:41,070 nefna þetta er einhvers konar safn gagna um frambjóðendur eða kjósendur 690 00:40:41,070 --> 00:40:44,920 sem kusu sérstökum forseta eða forseti frambjóðendur 691 00:40:44,920 --> 00:40:46,550 fyrir 2004 kosningum. 692 00:40:46,550 --> 00:40:52,920 >> Svo hér er gildi 1, 2 svo einn leið til að geyma 693 00:40:52,920 --> 00:40:56,540 forseti frambjóðendur eru nöfn þeirra. 694 00:40:56,540 --> 00:40:59,780 Í þessu tilfelli, það lítur út eins og þeir eru bara heiltölugildi. 695 00:40:59,780 --> 00:41:04,030 Svo 2004, var það Bush móti Kerry ég trúi. 696 00:41:04,030 --> 00:41:09,010 Og nú, við skulum segja að þú bara veist ekki hvort 1 samsvarar Bush eða 2 697 00:41:09,010 --> 00:41:11,703 samsvarar Kerry eða og svo framvegis og svo framvegis, ekki satt? 698 00:41:11,703 --> 00:41:15,860 >> Og þetta er, bara að mér, nokkuð algengt vandamál. 699 00:41:15,860 --> 00:41:18,230 Svo hvað er hægt að gera í þessu tilfelli? 700 00:41:18,230 --> 00:41:20,000 Svo skulum við athuga alla þessa aðra hluti. 701 00:41:20,000 --> 00:41:22,790 >> ástand, ég er hrokafullur þetta kemur frá mismunandi ríkjum. 702 00:41:22,790 --> 00:41:25,100 partyid, tekjur. 703 00:41:25,100 --> 00:41:27,710 Við skulum líta á partyid. 704 00:41:27,710 --> 00:41:32,800 Svo kannski er einn hlutur sem þú getur gert líta á hvert af mælinga 705 00:41:32,800 --> 00:41:36,250 sem hafa partyid af Republican eða Democrat eða eitthvað. 706 00:41:36,250 --> 00:41:38,170 Svo skulum líta bara á það sem partyid er. 707 00:41:38,170 --> 00:41:41,946 >> Þannig að ég ætla að taka DAT og þá er ég að fara 708 00:41:41,946 --> 00:41:47,960 til að gera þetta dollaramerki rekstraraðili sem ég gerði áður 709 00:41:47,960 --> 00:41:50,770 og þetta er að fara að hlutmengi í þeim dálki. 710 00:41:50,770 --> 00:41:57,760 Og þá er ég að fara að fara þetta í 20, bara til að sjá hvað þetta lítur út. 711 00:41:57,760 --> 00:42:00,170 >> Svo er þetta bara fullt af NAS. 712 00:42:00,170 --> 00:42:02,800 Svo í öðrum orðum, þú þarft vantar upplýsingar um þessar krakkar. 713 00:42:02,800 --> 00:42:08,100 En þú tekur þetta líka DAT partyid er þáttur 714 00:42:08,100 --> 00:42:10,030 svo gefur þetta þér mismunandi flokka. 715 00:42:10,030 --> 00:42:14,170 Svo í öðrum orðum, partyid getur tekið Demókrati, Republican, Independent, 716 00:42:14,170 --> 00:42:16,640 eða eitthvað annað. 717 00:42:16,640 --> 00:42:23,940 >> Svo skulum fara á undan og við skulum sjá hver af þessum is-- ó, OK. 718 00:42:23,940 --> 00:42:28,480 Þannig að ég ætla að hlutmengi að partyid og þá 719 00:42:28,480 --> 00:42:32,780 líta á hver sjálfur ert Demókrati, til dæmis. 720 00:42:32,780 --> 00:42:37,150 Þetta er að fara að gefa þér Boolean, a gríðarstór Boolean af TRUEs og FALSEs. 721 00:42:37,150 --> 00:42:41,630 >> Og nú, við skulum segja að ég vil að hlutmengi í þessum krakkar. 722 00:42:41,630 --> 00:42:47,260 Þannig að þetta er að fara að taka dat minn og hlutmengi til hvort athuganir 723 00:42:47,260 --> 00:42:48,910 hafa partyid jafn jafngildir Democrat. 724 00:42:48,910 --> 00:42:52,830 725 00:42:52,830 --> 00:42:55,180 Og þetta er alveg langur vegna þess að það er svo margir af þeim. 726 00:42:55,180 --> 00:42:59,060 Svo nú er ég að fara að fara þetta í 20. 727 00:42:59,060 --> 00:43:05,690 728 00:43:05,690 --> 00:43:11,270 >> Og eins og þú tekur eftir, jafngildir jafn er áhugavert að þú ert 729 00:43:11,270 --> 00:43:13,250 already-- þú ert einnig meðal Nas. 730 00:43:13,250 --> 00:43:19,010 Svo í þessu tilfelli, þú getur enn ekki fengið allar upplýsingar því nú þú ert Nas 731 00:43:19,010 --> 00:43:22,650 og þú vilt bara til að sjá hver er athugun í samræmi við demókrati 732 00:43:22,650 --> 00:43:24,670 og ekki þessir vantar gildi sig. 733 00:43:24,670 --> 00:43:27,680 Svo hvernig væri að þú fá losa af þessir NAS? 734 00:43:27,680 --> 00:43:36,410 >> Svo hér er ég bara að því að nota upp takkann á minn bendilinn og þá segja að fara um. 735 00:43:36,410 --> 00:43:39,778 Og svo hér er ég bara að fara að segja is.na datpartyid. 736 00:43:39,778 --> 00:43:48,970 737 00:43:48,970 --> 00:43:52,720 Þannig að þetta og mun taka tvö mismunandi Boolean vektorar 738 00:43:52,720 --> 00:43:57,160 og segja að það er að fara að vera Satt og ósatt til dæmis. 739 00:43:57,160 --> 00:43:59,190 Svo það er að fara að gera þessa hluti-vitur. 740 00:43:59,190 --> 00:44:02,910 Svo hér er ég að segja að taka gögnin ramma, hlutmengi 741 00:44:02,910 --> 00:44:10,170 við þær sem samsvara demókrati, og fjarlægja eitthvað af þeim sem eru ekki NA. 742 00:44:10,170 --> 00:44:13,540 >> Þannig að þetta will-- ætti gefa þér eitthvað. 743 00:44:13,540 --> 00:44:16,540 744 00:44:16,540 --> 00:44:17,600 Við skulum sjá is.na. 745 00:44:17,600 --> 00:44:24,670 746 00:44:24,670 --> 00:44:27,690 Við skulum reyna is.na datpartyid. 747 00:44:27,690 --> 00:44:36,290 748 00:44:36,290 --> 00:44:45,290 Og þetta ætti að gefa you-- sorry-- bara Boolean vektor. 749 00:44:45,290 --> 00:44:49,260 Og þá, því það er svo lengi, Ég ætla að hlutmengi í 20. 750 00:44:49,260 --> 00:44:49,760 OK. 751 00:44:49,760 --> 00:44:51,570 Þannig að þetta ætti að virka. 752 00:44:51,570 --> 00:44:54,700 >> Og þetta mun einnig vera TRUEs. 753 00:44:54,700 --> 00:45:01,830 Ah, svo er villa mín hér að I'm-- I nota C ++ og R jöfnum höndum þannig að ég gera 754 00:45:01,830 --> 00:45:03,590 þessi mistök allra tíma. 755 00:45:03,590 --> 00:45:05,807 The og rekstraraðili er reyndar það sem þú vilt. 756 00:45:05,807 --> 00:45:08,140 Þú vilt ekki að nota tvo -merkið, bara einn einn. 757 00:45:08,140 --> 00:45:14,970 758 00:45:14,970 --> 00:45:17,010 OK. 759 00:45:17,010 --> 00:45:18,140 >> Svo skulum sjá. 760 00:45:18,140 --> 00:45:20,930 761 00:45:20,930 --> 00:45:23,920 Þannig að við subsetted til partyid þar sem þeir eru demókrati 762 00:45:23,920 --> 00:45:25,300 og þeir eru ekki vantar gildi. 763 00:45:25,300 --> 00:45:27,690 Og nú skulum líta á hver sjálfur þeir kusu. 764 00:45:27,690 --> 00:45:31,530 Svo virðist eins og flest þeirra kusu 1. 765 00:45:31,530 --> 00:45:36,090 Þannig að ég ætla að fara á undan og segja að það er Kerry. 766 00:45:36,090 --> 00:45:39,507 >> Og sömuleiðis, þú getur líka farið til Republican 767 00:45:39,507 --> 00:45:41,090 og vonandi ætti þetta að gefa þér 2. 768 00:45:41,090 --> 00:45:49,730 769 00:45:49,730 --> 00:45:51,770 Það er bara fullt af mismunandi dálkum. 770 00:45:51,770 --> 00:45:53,070 Og reyndar, það er 2. 771 00:45:53,070 --> 00:45:55,750 Svo partyid allt repúblikana, flestir eru að greiða atkvæði um 2. 772 00:45:55,750 --> 00:45:58,390 >> Svo það virðist eins, bara með því að horfa á þetta, 773 00:45:58,390 --> 00:46:00,600 Republican er að fara að vera a very-- eða partyid 774 00:46:00,600 --> 00:46:02,790 er að fara til vera a mjög stór þáttur í að ákvarða 775 00:46:02,790 --> 00:46:05,420 sem frambjóðandi þeir eru að fara að kjósa. 776 00:46:05,420 --> 00:46:07,120 Og þetta er augljóslega satt almennt. 777 00:46:07,120 --> 00:46:10,139 Og þetta passar þinni innsæi, auðvitað. 778 00:46:10,139 --> 00:46:11,930 Svo það virðist eins og ég er keyra út af tíma svo 779 00:46:11,930 --> 00:46:17,040 láta mig bara að fara á undan og sýna sumir fljótur myndir. 780 00:46:17,040 --> 00:46:21,120 Svo er hér eitthvað sem er örlítið flóknari með visualization. 781 00:46:21,120 --> 00:46:26,450 Þannig að í þessu tilfelli, þetta er mjög einföld greining á bara að skoða hvað 782 00:46:26,450 --> 00:46:28,500 forseti '04 er. 783 00:46:28,500 --> 00:46:33,920 >> Þannig að í þessu tilfelli, við skulum segja þér langaði að svara þessari spurningu. 784 00:46:33,920 --> 00:46:38,540 Svo býst við vildum vita atkvæðagreiðslu hegðun í 2.004 forseti kosningar 785 00:46:38,540 --> 00:46:41,170 og hvernig sem er mismunandi eftir kynþætti. 786 00:46:41,170 --> 00:46:44,380 Svo ekki bara þú vilt sjá atkvæðagreiðslu hegðun, 787 00:46:44,380 --> 00:46:47,860 en þú vilt hlutmengi af hverju kapp og svoleiðis saman að. 788 00:46:47,860 --> 00:46:50,770 Og þú getur bara sagt með þessari flóknu tákn 789 00:46:50,770 --> 00:46:52,580 að þetta er eins konar fá hazy. 790 00:46:52,580 --> 00:46:56,390 >> Svo einn af the fleiri háþróaður R pakka sem er líka eins konar nýleg 791 00:46:56,390 --> 00:47:00,070 er kallað dplyr. 792 00:47:00,070 --> 00:47:03,060 Svo er það þetta hérna. 793 00:47:03,060 --> 00:47:08,080 Og ggg-- ggplot2 er bara gott leið til að gera betri sjónræn 794 00:47:08,080 --> 00:47:09,400 en the innbyggður-í einu. 795 00:47:09,400 --> 00:47:11,108 >> Þannig að ég ætla að hlaða þessir tveir bókasöfn. 796 00:47:11,108 --> 00:47:13,200 797 00:47:13,200 --> 00:47:16,950 Og þá er ég að fara að fara undan og keyra þessa skipun. 798 00:47:16,950 --> 00:47:19,050 Þú getur bara meðhöndla þetta sem svartur kassi. 799 00:47:19,050 --> 00:47:23,460 >> Hvað er að gerast er að þetta pípa rekstraraðili er farið í þessa röksemdafærslu 800 00:47:23,460 --> 00:47:24,110 inn hér. 801 00:47:24,110 --> 00:47:28,070 Þannig að ég ætla að segja hóp með DAT kapp og þá forseti 04. 802 00:47:28,070 --> 00:47:31,530 Og þá, allar þessar aðrar skipanir eru sía og þá draga saman 803 00:47:31,530 --> 00:47:34,081 þar sem ég er að gera telja og þá er ég samsærismaður það hér. 804 00:47:34,081 --> 00:47:39,980 805 00:47:39,980 --> 00:47:42,500 OK flott. 806 00:47:42,500 --> 00:47:44,620 Svo skulum fara á undan og sjá hvað þetta lítur út. 807 00:47:44,620 --> 00:47:52,280 808 00:47:52,280 --> 00:47:57,290 >> Svo hvað er að gerast hér er að ég bara teiknuð hver af kynþáttum og þá 809 00:47:57,290 --> 00:47:59,670 hver sjálfur þeir kusu. 810 00:47:59,670 --> 00:48:03,492 Og þessir tveir mismunandi gildi samsvara 2 og 1. 811 00:48:03,492 --> 00:48:05,325 Ef þú vilt vera meira glæsilegur, getur þú einnig 812 00:48:05,325 --> 00:48:11,770 bara tilgreina að 2 er Kerry-- eða 2 er Bush, og þá er Kerry 1. 813 00:48:11,770 --> 00:48:13,700 Og þú getur líka haft að í goðsögninni þínum. 814 00:48:13,700 --> 00:48:17,410 >> Og þú getur líka skipt þessum bar myndrit. 815 00:48:17,410 --> 00:48:19,480 Vegna þess að einn hlutur er að ef þú tekur eftir, 816 00:48:19,480 --> 00:48:24,560 þetta er ekki mjög auðvelt að bera kennsl hver af þessum tveimur gildum eru stærri. 817 00:48:24,560 --> 00:48:27,920 Svo eitt sem þú vilt vilt gera er að taka þetta bláa svæði 818 00:48:27,920 --> 00:48:31,855 og bara færa það yfir hér svo þú getur bera þær saman hlið við hlið. 819 00:48:31,855 --> 00:48:34,480 Og ég held að er eitthvað sem ég hef ekki tíma til að gera núna, 820 00:48:34,480 --> 00:48:36,660 en það er líka mjög auðvelt að gera. 821 00:48:36,660 --> 00:48:40,310 Þú getur bara líta inn Maðurinn síðum ggplot. 822 00:48:40,310 --> 00:48:47,170 Svo þú getur bara ggplot eins sem og lesa inn í þetta maður síðu. 823 00:48:47,170 --> 00:48:51,920 >> Svo láta mig bara fljótt sýna þér sumir kaldur hlutur. 824 00:48:51,920 --> 00:48:57,610 Við skulum fara á undan og fara to-- bara beitingu vél nám. 825 00:48:57,610 --> 00:49:02,450 Svo skulum segja að við höfum þessar þrjár pakka þannig að ég ætla að hlaða þeim á. 826 00:49:02,450 --> 00:49:05,500 827 00:49:05,500 --> 00:49:09,170 Þannig að þetta bara prentar út sumir Upplýsingar eftir að ég hlaðinn í málið. 828 00:49:09,170 --> 00:49:15,220 Svo ég er að segja þetta read.csv, þessu gagnasafni og nú 829 00:49:15,220 --> 00:49:18,940 Ég ætla að fara á undan og horfa og sjá hvað er inni þessu gagnasafni. 830 00:49:18,940 --> 00:49:22,080 >> Svo fyrstu 20 athuganir. 831 00:49:22,080 --> 00:49:27,190 Þannig að ég hef bara X1, X2, og Y. Þannig að það virðist eins og a búnt af þessum gildum 832 00:49:27,190 --> 00:49:31,640 eru allt frá kannski 20 til 80 eða svo. 833 00:49:31,640 --> 00:49:37,700 Og þá á sama hátt fyrir X2 og þá þetta Y virðist vera merki 0 og 1. 834 00:49:37,700 --> 00:49:49,500 >> Til að staðfesta þetta, ég get bara gera samantekt gögn X1. 835 00:49:49,500 --> 00:49:51,660 Og þá á sama hátt fyrir allar þessar aðrar dálkum. 836 00:49:51,660 --> 00:49:55,300 Svo er yfirlit fljótleg leið bara að sýna þér fljótur gildi. 837 00:49:55,300 --> 00:49:56,330 Oh, því miður. 838 00:49:56,330 --> 00:49:58,440 Þetta ætti að vera Y. 839 00:49:58,440 --> 00:50:03,420 >> Þannig að í þessu tilfelli, gefur það quantiles, miðgildi, maxes eins og heilbrigður. 840 00:50:03,420 --> 00:50:07,130 Í þessu tilfelli, dataY, getur þú séð að það er bara að fara að vera 0 og 1. 841 00:50:07,130 --> 00:50:10,100 Einnig meðal er að segja 0.6, þýðir bara að það 842 00:50:10,100 --> 00:50:13,380 virðist eins og ég hef fleiri 1s en 0s. 843 00:50:13,380 --> 00:50:16,160 >> Svo láta mig fara á undan og sýna þú hvað þetta lítur út. 844 00:50:16,160 --> 00:50:17,470 Þannig að ég ætla bara að fara að samsæri þetta. 845 00:50:17,470 --> 00:50:22,852 846 00:50:22,852 --> 00:50:24,636 Við skulum sjá hvernig á að hreinsa þetta. 847 00:50:24,636 --> 00:50:30,492 848 00:50:30,492 --> 00:50:31,468 Oh OK. 849 00:50:31,468 --> 00:50:35,840 850 00:50:35,840 --> 00:50:36,340 OK. 851 00:50:36,340 --> 00:50:37,590 >> Svo er þetta það sem það lítur út. 852 00:50:37,590 --> 00:50:46,310 Svo virðist eins og yellows I sem tilgreind sem 0, og þá rautt ég greinist 1s. 853 00:50:46,310 --> 00:50:52,190 Svo hér það lítur út eins og merki stig og það 854 00:50:52,190 --> 00:50:56,410 virðist eins og þú vildir bara sumir konar Þyrping á þetta. 855 00:50:56,410 --> 00:51:01,020 >> Og láta mig fara bara á undan og sýna þú sumir af þessum innbyggður-í aðgerðir. 856 00:51:01,020 --> 00:51:03,580 Svo hér er lm. 857 00:51:03,580 --> 00:51:06,060 Þannig að þetta er bara að reyna að passa línu á þessu. 858 00:51:06,060 --> 00:51:08,640 Svo er það besta leiðin að ég get passa línu svo 859 00:51:08,640 --> 00:51:14,020 að það best að aðskilja þessi tegund af Þyrping. 860 00:51:14,020 --> 00:51:21,790 Og helst, þú getur bara séð að ég að keyra bara allar þessar skipanir 861 00:51:21,790 --> 00:51:25,450 og þá ætla ég að fara á undan og bæta línuna. 862 00:51:25,450 --> 00:51:28,970 >> Svo virðist þetta eins og best giska. 863 00:51:28,970 --> 00:51:34,150 Það tekur besta sem lágmarkar villa í að reyna að passa þessa línu. 864 00:51:34,150 --> 00:51:40,000 Vitanlega, þetta lítur svona gott, en það er ekki sú besta. 865 00:51:40,000 --> 00:51:43,130 Og línuleg líkön, í Almennt eru að fara að vera 866 00:51:43,130 --> 00:51:46,811 mjög mikill fyrir kenningar og bara raða að byggja grundvallaratriði vél 867 00:51:46,811 --> 00:51:47,310 læra. 868 00:51:47,310 --> 00:51:50,330 En í raun, þú ert að fara að langar að gera eitthvað meira almenna. 869 00:51:50,330 --> 00:51:54,280 >> Svo þú getur bara að reyna að keyra eitthvað sem kallast Tauganet. 870 00:51:54,280 --> 00:51:57,110 Þessir hlutir eru æ algengari. 871 00:51:57,110 --> 00:52:00,530 Og þeir vinna bara frábærlega fyrir stór gagnasafna. 872 00:52:00,530 --> 00:52:07,080 Þannig að í þessu tilfelli, have-- við aðeins skulum see-- við höfum nrow. 873 00:52:07,080 --> 00:52:09,010 Svo nrow er bara að segja fjölda lína. 874 00:52:09,010 --> 00:52:11,790 Svo í þessu tilfelli, ég hafa 100 athugasemdir. 875 00:52:11,790 --> 00:52:15,010 >> Svo láta mig fara á undan og gera Tauganet. 876 00:52:15,010 --> 00:52:18,620 Svo er þetta mjög gott því ég get bara sagt nnet 877 00:52:18,620 --> 00:52:21,767 og þá er ég regressing Y. Svo er Y sem dálki. 878 00:52:21,767 --> 00:52:23,850 Og þá regressing það á hinir tveir breytur. 879 00:52:23,850 --> 00:52:27,360 Svo er þetta styttri merki fyrir X1 og X2. 880 00:52:27,360 --> 00:52:29,741 >> Svo skulum fara á undan og keyra þetta. 881 00:52:29,741 --> 00:52:30,240 Oh, því miður. 882 00:52:30,240 --> 00:52:32,260 Ég þarf að keyra þetta allt hlutur. 883 00:52:32,260 --> 00:52:37,500 Og þetta er bara prentun tákn hversu fljótt eða ekki fljótt það 884 00:52:37,500 --> 00:52:38,460 stefna. 885 00:52:38,460 --> 00:52:41,420 Svo það lítur út eins og það gerði saman. 886 00:52:41,420 --> 00:52:44,970 Svo láta mig fara á undan og prenta hvað þetta lítur út. 887 00:52:44,970 --> 00:52:51,260 >> Sjá hér er mynd og hér er a dýpislínu sýnir hversu vel það passar. 888 00:52:51,260 --> 00:52:56,380 Og þetta er just-- þú getur séð þetta að þetta er mjög, mjög gott. 889 00:52:56,380 --> 00:52:59,400 Það gæti jafnvel verið overfitting, en þú getur líka 890 00:52:59,400 --> 00:53:03,390 reikningur fyrir þetta með öðrum tækni eins kross-löggilding. 891 00:53:03,390 --> 00:53:06,180 Og þetta eru einnig byggt inn R. 892 00:53:06,180 --> 00:53:09,170 >> Og láta mig bara að sýna þér styðja vektor vél. 893 00:53:09,170 --> 00:53:12,470 Þetta er annar mjög algeng tækni í vél nám. 894 00:53:12,470 --> 00:53:18,550 Það er mjög svipað línulegum líkönum, en það notar það sem er kallað kjarna aðferð. 895 00:53:18,550 --> 00:53:22,790 Og við skulum sjá hversu vel það virkar. 896 00:53:22,790 --> 00:53:26,430 Svo er þetta mjög svipað og hvernig vel a tauga net framkvæmir, 897 00:53:26,430 --> 00:53:27,900 en það er miklu meira mýkri. 898 00:53:27,900 --> 00:53:35,740 Og þetta er byggt á af what-- hvernig SVMs vinna. 899 00:53:35,740 --> 00:53:40,250 >> Svo er þetta bara mjög fljótur yfirlit yfir sumir 900 00:53:40,250 --> 00:53:43,822 af the innbyggður-í aðgerðir sem þú getur gert og einnig sumir af the gögn könnun. 901 00:53:43,822 --> 00:53:45,905 Svo láta mig fara bara á undan og fara aftur til skyggnur. 902 00:53:45,905 --> 00:53:50,290 903 00:53:50,290 --> 00:53:53,670 >> Svo augljóslega, þetta er ekki mjög alhliða. 904 00:53:53,670 --> 00:53:57,140 Og þetta er í raun bara stríðnispúki sýna þér hvað þú getur raunverulega gert í R. 905 00:53:57,140 --> 00:53:59,100 Svo ef þú vilt bara eins að læra meira, hér 906 00:53:59,100 --> 00:54:01,210 eru fullt af mismunandi úrræði. 907 00:54:01,210 --> 00:54:06,890 >> Svo ef þú ert hrifinn af kennslubækur eða þú ert bara hrifinn af að lesa það á netinu, 908 00:54:06,890 --> 00:54:09,670 þá er þetta frábær einn af Hadley Wickham, 909 00:54:09,670 --> 00:54:13,010 sem einnig vann allt þetta virkilega flott pakka. 910 00:54:13,010 --> 00:54:17,420 Ef þú ert hrifinn af myndböndum, þá Berkeley hefur ógnvekjandi bootcamp 911 00:54:17,420 --> 00:54:21,060 það er several-- það er góður af lengi. 912 00:54:21,060 --> 00:54:24,210 Og það mun kenna þér nánast allt sem þú vilt vita um R. 913 00:54:24,210 --> 00:54:27,770 >> Og álíka, það er Codeacademy og öll þessi önnur tegund 914 00:54:27,770 --> 00:54:29,414 af gagnvirka vefsíður. 915 00:54:29,414 --> 00:54:31,580 Þeir eru líka að fá common-- fleiri og fleiri algeng. 916 00:54:31,580 --> 00:54:33,749 Svo er þetta mjög svipuð Codeacademy. 917 00:54:33,749 --> 00:54:35,790 Og að lokum, ef þú bara vilja bandalagsins og hjálpa, 918 00:54:35,790 --> 00:54:38,800 þetta eru fullt af hlutir sem þú getur farið til. 919 00:54:38,800 --> 00:54:40,880 Vitanlega, við enn nota póstlista, bara 920 00:54:40,880 --> 00:54:44,860 eins og næstum hvert annað forritunarmál samfélag. 921 00:54:44,860 --> 00:54:47,880 Og #rstats, þetta er samfélag okkar Twitter. 922 00:54:47,880 --> 00:54:49,580 Það er í raun mjög algengt. 923 00:54:49,580 --> 00:54:50,850 Og þá er user! 924 00:54:50,850 --> 00:54:52,340 Er bara ráðstefnu okkar. 925 00:54:52,340 --> 00:54:55,390 >> Og þá að sjálfsögðu, þú getur nota alla þessa aðra Q & A hluti, 926 00:54:55,390 --> 00:54:57,680 eins Stack Yfirfall, Google, og þá GitHub. 927 00:54:57,680 --> 00:55:00,490 Vegna þess að flest af þessum pakka og a einhver fjöldi af samfélaginu 928 00:55:00,490 --> 00:55:03,420 verður í kringum þróun númer því það er opinn uppspretta. 929 00:55:03,420 --> 00:55:05,856 Og það er bara mjög gott á GitHub. 930 00:55:05,856 --> 00:55:08,730 Og að lokum, getur þú haft samband við mig ef þú hefur bara einhverjar fljótur spurningum. 931 00:55:08,730 --> 00:55:13,530 Svo er hægt að finna mig á Twitter hér, website minn, og bara netfangið mitt. 932 00:55:13,530 --> 00:55:17,840 Svo vonandi, það var something-- bara stutt beitu 933 00:55:17,840 --> 00:55:20,900 hvat R er í raun fær um að gera. 934 00:55:20,900 --> 00:55:23,990 Og vonandi, þú bara skrá sig út þessir þrír tenglar 935 00:55:23,990 --> 00:55:25,760 og sjá hvað þú getur gert meira. 936 00:55:25,760 --> 00:55:28,130 Og ég held að það bara um það. 937 00:55:28,130 --> 00:55:28,630 Takk. 938 00:55:28,630 --> 00:55:30,780 >> [Applause] 939 00:55:30,780 --> 00:55:31,968