1 00:00:00,000 --> 00:00:00,750 2 00:00:00,750 --> 00:00:09,800 >> [Muusika mängib] 3 00:00:09,800 --> 00:00:13,014 4 00:00:13,014 --> 00:00:13,680 DUSTIN TRAN: Tere. 5 00:00:13,680 --> 00:00:14,980 Minu nimi on Dustin. 6 00:00:14,980 --> 00:00:18,419 Nii et ma esitan Andmete analüüs R. 7 00:00:18,419 --> 00:00:19,710 Natuke minust. 8 00:00:19,710 --> 00:00:24,320 Ma olen praegu aspirandina Engineering and Applied Sciences. 9 00:00:24,320 --> 00:00:28,330 Õpin ristumiskohas masin õppe ja statistika 10 00:00:28,330 --> 00:00:31,375 nii andmete analüüsiks R on tõesti oluline, millises 11 00:00:31,375 --> 00:00:33,790 Ma teen iga päev. 12 00:00:33,790 --> 00:00:35,710 >> Ja R on eriti hea andmeanalüüsi 13 00:00:35,710 --> 00:00:39,310 sest see on väga hea prototüüpide. 14 00:00:39,310 --> 00:00:43,590 Ja tavaliselt, kui sa teed mingi Andmete analüüs, palju probleeme 15 00:00:43,590 --> 00:00:44,920 lähed kognitiivne. 16 00:00:44,920 --> 00:00:48,700 Ja nii sa lihtsalt tahad olla mõned tõesti hea keel, 17 00:00:48,700 --> 00:00:53,770 on lihtsalt hea teed sisseehitatud funktsioone, vastandina 18 00:00:53,770 --> 00:00:57,430 kuni tegelema madal asju. 19 00:00:57,430 --> 00:01:01,040 Nii alguses, ma lihtsalt tutvustada, mis on R, miks 20 00:01:01,040 --> 00:01:04,540 mida soovite kasutada, ja Seejärel minna üle mõnda demo, 21 00:01:04,540 --> 00:01:07,060 ja lihtsalt minna sealt. 22 00:01:07,060 --> 00:01:08,150 >> Mis on R? 23 00:01:08,150 --> 00:01:11,180 R on lihtsalt keele arenenud statistilise andmetöötluse 24 00:01:11,180 --> 00:01:12,450 ja visualiseerimine. 25 00:01:12,450 --> 00:01:16,000 Nii et mida see tähendab, et see on väga hea keel 26 00:01:16,000 --> 00:01:22,400 iga asi, mis tegeleb ebakindlust või andmete visualiseerimine. 27 00:01:22,400 --> 00:01:24,850 Nii et teil on kõik need tõenäosusjaotused. 28 00:01:24,850 --> 00:01:27,140 Seal saab olla sisseehitatud funktsioone. 29 00:01:27,140 --> 00:01:31,650 Sul on ka suurepärased joonestamist pakette. 30 00:01:31,650 --> 00:01:34,110 >> Python on teise konkureeriva keelt andmeid. 31 00:01:34,110 --> 00:01:40,020 Ja üks asi, mis ma leian, et R on palju parem on visualiseerimine. 32 00:01:40,020 --> 00:01:45,200 Nii et mida sa näed demo kui hästi on lihtsalt väga intuitiivne keel 33 00:01:45,200 --> 00:01:48,050 mis lihtsalt töötab väga hästi. 34 00:01:48,050 --> 00:01:53,140 Samuti on tasuta ja avatud lähtekoodiga, kui muu mõjuva keeles ma arvan. 35 00:01:53,140 --> 00:01:55,440 >> Ja siin, hunnik lihtsalt märksõnad visatakse sind. 36 00:01:55,440 --> 00:02:00,450 See on dünaamiline, mis tähendab, kui teil on konkreetset tüüpi määratud objekti 37 00:02:00,450 --> 00:02:02,025 kui see lihtsalt seda muuta lennult. 38 00:02:02,025 --> 00:02:05,670 See on laisk nii et see on arukas kuidas ta seda teeb arvutusi. 39 00:02:05,670 --> 00:02:12,250 Funktsionaalne tähendab, et see võib tõesti töötavad põhineb off funktsioone nii anything-- 40 00:02:12,250 --> 00:02:16,910 mingit manipuleerimist sa oled tehes põhineb off funktsioone. 41 00:02:16,910 --> 00:02:20,162 >> Nii binaarse operaatorid, näiteks on vaid olemuselt funktsioone. 42 00:02:20,162 --> 00:02:21,870 Ja kõik, mis sa lähed tegema, on 43 00:02:21,870 --> 00:02:24,690 läheb seisata funktsioone ise. 44 00:02:24,690 --> 00:02:27,140 Ja siis objektorienteeritud samuti. 45 00:02:27,140 --> 00:02:30,930 >> Nii et siin on XKCD plot. 46 00:02:30,930 --> 00:02:34,350 Mitte ainult sellepärast, et ma tunnen, XKCD on põhiline mingit 47 00:02:34,350 --> 00:02:37,770 esitusviisi, kuid kuna Ma tunnen, et see on tõesti 48 00:02:37,770 --> 00:02:42,160 haamrid punkt, et palju ajal, kui sa teed mingi andmeid 49 00:02:42,160 --> 00:02:46,570 analüüs, et probleem ei ole nii palju, kui kiiresti ta jookseb, 50 00:02:46,570 --> 00:02:49,850 kuid kui kaua see aega teid programmi ülesanne. 51 00:02:49,850 --> 00:02:54,112 Nii et siin on lihtsalt analüüsida, kas strateegia või b on tõhusam. 52 00:02:54,112 --> 00:02:55,820 See saab olema midagi, mis sa oled 53 00:02:55,820 --> 00:02:58,290 hakkab tegelema partii sisse omamoodi madala taseme keelte 54 00:02:58,290 --> 00:03:03,440 kui olete tegelevad seg vead, mälu eraldamise, initsialisatsioonistringi, 55 00:03:03,440 --> 00:03:05,270 isegi teha sisseehitatud funktsioone. 56 00:03:05,270 --> 00:03:09,920 Ja see kraam on kõik käideldakse väga, väga elegantselt R. 57 00:03:09,920 --> 00:03:12,839 >> Nii lihtsalt haamriga seda punkt, suurim kitsaskoht 58 00:03:12,839 --> 00:03:13,880 läheb kognitiivne. 59 00:03:13,880 --> 00:03:17,341 Nii andmete analüüs on väga raske probleem. 60 00:03:17,341 --> 00:03:19,340 Kas te teete masin õppe või olete 61 00:03:19,340 --> 00:03:22,550 teeme lihtsalt mingi lähteandmete uurimine, 62 00:03:22,550 --> 00:03:25,290 sa ei taha olla võtta dokumendi 63 00:03:25,290 --> 00:03:27,440 ja siis koostada midagi iga kord kui 64 00:03:27,440 --> 00:03:31,010 tahate näha, mida veerg välja näeb, mida eriti kanded maatriks 65 00:03:31,010 --> 00:03:32,195 välja näeb. 66 00:03:32,195 --> 00:03:34,320 Nii et sa lihtsalt tahad olla mõned väga kena liides 67 00:03:34,320 --> 00:03:37,740 saate käivitada lihtne funktsioon et indeksid iganes 68 00:03:37,740 --> 00:03:41,870 soovid ja lihtsalt kasutada seda sealt. 69 00:03:41,870 --> 00:03:44,190 Ja sa pead domeeni Konkreetsete keelte selle eest. 70 00:03:44,190 --> 00:03:51,750 Ja R tõesti aitab teil määratleda probleem ja seda lahendada sel viisil. 71 00:03:51,750 --> 00:03:58,690 >> Nii et siin on maatükk, mis näitab programmeerimine populaarsus R, sest see on läinud aja jooksul. 72 00:03:58,690 --> 00:04:04,060 Nii et nagu näete, nagu 2013 või nii see lihtsalt õhku tohutult. 73 00:04:04,060 --> 00:04:09,570 Ja see on lihtsalt sellepärast, et suur trend tehnoloogia tööstusele 74 00:04:09,570 --> 00:04:10,590 umbes big andmeid. 75 00:04:10,590 --> 00:04:13,010 Samuti ei ole ainult tehnoloogia tööstuses, kuid tegelikult 76 00:04:13,010 --> 00:04:16,490 mistahes tööstusharus selle-- sest palju tööstusharudes 77 00:04:16,490 --> 00:04:20,589 on omamoodi põhiline püüab neid probleeme lahendada. 78 00:04:20,589 --> 00:04:24,590 Ja tavaliselt, saab mõned head mõõtmise viis nende probleemide 79 00:04:24,590 --> 00:04:29,720 või isegi määratlemisest või nende lahendamiseks andmeid kasutades. 80 00:04:29,720 --> 00:04:35,430 Nii et ma arvan, et just nüüd on R 11. Populaarseim keeles TIOBE 81 00:04:35,430 --> 00:04:38,200 ja see on kasvanud sellest ajast. 82 00:04:38,200 --> 00:04:40,740 83 00:04:40,740 --> 00:04:43,080 >> Nii et siin on mõned rohkem funktsioonid R. See on 84 00:04:43,080 --> 00:04:46,900 tohutu hulga pakendite ja kõik need eri asja. 85 00:04:46,900 --> 00:04:52,470 Nii iga kord, kui on teatud probleem, kõige 86 00:04:52,470 --> 00:04:55,060 aeg R on selle funktsiooni jaoks. 87 00:04:55,060 --> 00:04:58,520 Nii, kas sa tahad ehitada mingi masin 88 00:04:58,520 --> 00:05:02,770 õppe algoritmi nimetatakse Random Forest või otsus puud, 89 00:05:02,770 --> 00:05:07,530 või isegi püüdnud võtta keskmine funktsiooni või see kraam, 90 00:05:07,530 --> 00:05:10,000 R on seda. 91 00:05:10,000 --> 00:05:14,190 >> Ja kui sa hoolid optimeerimine, üks asi, mis on ühised 92 00:05:14,190 --> 00:05:17,430 on see, et pärast seda, kui oled teinud prototüüpide mingi kõrgkeeles, 93 00:05:17,430 --> 00:05:19,810 siis viska, et in-- Sa lihtsalt port, et üle 94 00:05:19,810 --> 00:05:21,550 mõned madala keeles. 95 00:05:21,550 --> 00:05:26,090 Mis on hea umbes R on, et kui sa oled teha prototüüpide see, mida saab käivitada C ++, 96 00:05:26,090 --> 00:05:29,510 või FORTRAN või mõni neist madalamal tasemel need otse R. 97 00:05:29,510 --> 00:05:32,320 Nii et üks tõesti lahe funktsioon umbes R, 98 00:05:32,320 --> 00:05:35,930 kui sa tõesti hoolid optimeerimine punkti. 99 00:05:35,930 --> 00:05:39,490 >> Ja see on ka väga hea web visualiseerimine. 100 00:05:39,490 --> 00:05:43,530 Nii D3.js, näiteks on Ma arvan, et teine ​​seminar 101 00:05:43,530 --> 00:05:45,130 et me täna esitletud. 102 00:05:45,130 --> 00:05:48,510 Ja see on tõesti fantastiline teeme interaktiivne visualiseerimine. 103 00:05:48,510 --> 00:05:54,460 Ja D3.js eeldab, et teil on mingisugune andmete joonistatakse 104 00:05:54,460 --> 00:05:58,080 ja R on suurepärane võimalus, et suudetakse teha andmeanalüüsi Enne eksportimist 105 00:05:58,080 --> 00:06:04,220 üle D3.js või isegi lihtsalt joosta D3.js käsud R ise, 106 00:06:04,220 --> 00:06:08,240 samuti kõik need teiste raamatukogude samuti. 107 00:06:08,240 --> 00:06:13,041 >> Nii et oli lihtsalt kasutuselevõtt Mis on R ja miks sa seda kasutada. 108 00:06:13,041 --> 00:06:14,790 Loodetavasti olen veendunud sulle midagi 109 00:06:14,790 --> 00:06:18,460 umbes lihtsalt püüdes näha, mis tunne on. 110 00:06:18,460 --> 00:06:23,930 Nii et ma lähen edasi minna ja minna läbi Mõned põhitõed umbes R objektid 111 00:06:23,930 --> 00:06:26,150 ja mida sa tõesti teha. 112 00:06:26,150 --> 00:06:29,690 >> Nii et siin on lihtsalt hunnik matemaatikakäskudega. 113 00:06:29,690 --> 00:06:35,000 Nii öelda you're-- soovite ehitada keelt ennast ja tahad lihtsalt 114 00:06:35,000 --> 00:06:38,080 on hunnik erinevaid tööriistu. 115 00:06:38,080 --> 00:06:42,520 Mingit operatsiooni te arvate, mida soovite tahad on päris palju saab olema R. 116 00:06:42,520 --> 00:06:44,150 >> Nii et siin on 2 + 2. 117 00:06:44,150 --> 00:06:46,090 Siin on 2 korda pi. 118 00:06:46,090 --> 00:06:51,870 R on hunnik sisseehitatud konstandid et sa kasutad sageli nagu pi, e. 119 00:06:51,870 --> 00:06:56,230 >> Ja siis, siin on 7 pluss runif, nii runif 1. 120 00:06:56,230 --> 00:07:02,450 See on funktsioon, mis on genereerib üks juhuslik ühtne 0-1. 121 00:07:02,450 --> 00:07:04,400 Ja siis on 3 võimu 4. 122 00:07:04,400 --> 00:07:06,430 Seal ruutjuurt. 123 00:07:06,430 --> 00:07:07,270 >> Seal on samamoodi. 124 00:07:07,270 --> 00:07:14,500 Nii logi teeme alus eksponentsiaalse iseenesest. 125 00:07:14,500 --> 00:07:18,337 Ja siis, kui te täpsustada baasi, siis võite teha mida iganes baasi soovite. 126 00:07:18,337 --> 00:07:19,920 Ja siis siin on mõned teised käsud. 127 00:07:19,920 --> 00:07:22,180 Nii et teil on 23 mod 2. 128 00:07:22,180 --> 00:07:24,910 Siis on ülejäänud. 129 00:07:24,910 --> 00:07:27,110 Siis on teadusliku märge, kui te ka 130 00:07:27,110 --> 00:07:34,060 tahan teha lihtsalt rohkem ja keerulisem asju. 131 00:07:34,060 --> 00:07:37,320 >> Nii et siin on ülesanne. 132 00:07:37,320 --> 00:07:40,830 Nii tüüpiline ülesandeid R on tehtud nool 133 00:07:40,830 --> 00:07:43,440 nii et see on vähem kui ja siis sidekriipsu. 134 00:07:43,440 --> 00:07:47,250 Nii et siin ma lihtsalt määrates 3 muutuva val. 135 00:07:47,250 --> 00:07:50,160 >> Ja siis ma väljatrükk val ja siis prindib kolm. 136 00:07:50,160 --> 00:07:53,920 Vaikimisi teadus- tõlk, see prindib asju teha teile 137 00:07:53,920 --> 00:07:57,280 nii et sa ei pea täpsustama printida val iga kord, kui soovite printida midagi. 138 00:07:57,280 --> 00:08:00,200 Sa võid teha val ja siis teen, et teile. 139 00:08:00,200 --> 00:08:04,380 >> Samuti saate võrdub tehniliselt kui omistamisoperaatorile. 140 00:08:04,380 --> 00:08:07,190 On kerge nüansid vahel, kasutades nool 141 00:08:07,190 --> 00:08:10,730 ettevõtja ja võrdsete operaator ülesandeid. 142 00:08:10,730 --> 00:08:15,470 Enamasti tavapäraselt igaühele lihtsalt kasutage nooltega operaator. 143 00:08:15,470 --> 00:08:21,850 >> Ja siin, ma olen selle üleandmiseks kaldus märke nimetatakse 1 jämesooles 6. 144 00:08:21,850 --> 00:08:26,010 See tekitab vektori 1-6. 145 00:08:26,010 --> 00:08:29,350 Ja see on tõesti tore, sest siis sa lihtsalt määrata vektor val 146 00:08:29,350 --> 00:08:34,270 ja mis toimib iseenesest. 147 00:08:34,270 --> 00:08:37,799 >> Nii et see on juba läheb single-- väga intuitiivne andmeid 148 00:08:37,799 --> 00:08:41,070 struktuuri lihtsalt topelt teatud tüüpi liiki vektori 149 00:08:41,070 --> 00:08:45,670 ja kuhu koondatakse kõik skalaar väärtuste eest. 150 00:08:45,670 --> 00:08:50,770 Nii et pärast läheb skalaar, siis on R objektid ja see on vektor. 151 00:08:50,770 --> 00:08:55,610 Vektor on mingisugune kogumist sama tüüpi. 152 00:08:55,610 --> 00:08:58,150 Nii et siin on hunnik vektorid. 153 00:08:58,150 --> 00:08:59,800 >> Nii et see on numbriline. 154 00:08:59,800 --> 00:09:02,440 Numbriline on R viis öelda topelt. 155 00:09:02,440 --> 00:09:07,390 Ja nii vaikimisi kõik number on topelt. 156 00:09:07,390 --> 00:09:13,150 >> Nii et kui teil on c 1,1, 3, negatiivne 5.7, c on funktsioon. 157 00:09:13,150 --> 00:09:16,760 See konkateneerib kõik kolm numbrid vektorisse. 158 00:09:16,760 --> 00:09:19,619 Ja see olema-- nii et kui te märkate 3 iseenesest 159 00:09:19,619 --> 00:09:21,910 Tavaliselt oletan et see on nagu täisarv, 160 00:09:21,910 --> 00:09:25,050 kuid kuna kõik vektorid on sama tüüpi, 161 00:09:25,050 --> 00:09:28,660 see on vektor paarismängus või numbriline käesolevas asjas. 162 00:09:28,660 --> 00:09:34,920 >> rnorm on funktsioon, mis genereerib standard normaalne variables-- 163 00:09:34,920 --> 00:09:36,700 või standardse normaaljaotuse väärtused. 164 00:09:36,700 --> 00:09:38,360 Ja ma määratleda kaks neist. 165 00:09:38,360 --> 00:09:43,840 Nii ma teen rnorm 2, määrates, et devs ja siis ma väljatrükk devs. 166 00:09:43,840 --> 00:09:47,350 Nii et need on vaid kaks juhuslik normaalne väärtusi. 167 00:09:47,350 --> 00:09:50,060 >> Ja siis ints kui sa sa hoolid täisarvud. 168 00:09:50,060 --> 00:09:54,650 Nii et see on lihtsalt mälu jaotamise ja säästa mälu suurus. 169 00:09:54,650 --> 00:10:01,460 Nii et sa ei pea lisama Sinu numbrid kapitali L. 170 00:10:01,460 --> 00:10:04,170 >> Üldiselt on see R ajalooline märge 171 00:10:04,170 --> 00:10:06,940 midagi nn pikk täisarv. 172 00:10:06,940 --> 00:10:09,880 Nii enamiku ajast, saate olla tegemist kahekordistub. 173 00:10:09,880 --> 00:10:15,180 Ja kui sa kunagi tulevikus hiljem on optimeerida oma koodi 174 00:10:15,180 --> 00:10:18,110 saate lihtsalt lisada need L's hiljem või selle kestel 175 00:10:18,110 --> 00:10:22,280 kui sa oled nagu precognitive kohta, mida sa lähed tegema need muutujad. 176 00:10:22,280 --> 00:10:25,340 177 00:10:25,340 --> 00:10:26,890 >> Nii et siin on märk vektor. 178 00:10:26,890 --> 00:10:31,440 Niisiis, jälle, ma concatenating kolm stringid seekord. 179 00:10:31,440 --> 00:10:36,230 Pange tähele, et double stringid ja Üksikud keeled on samad R. 180 00:10:36,230 --> 00:10:41,000 Nii et mul on Arthur ja Marvini ja nii kui ma lasta välja trükkida, neid kõiki 181 00:10:41,000 --> 00:10:43,210 ei kavatse näidata double stringe. 182 00:10:43,210 --> 00:10:45,880 Ja kui sa ka tahad lisada topelt või ühekordse string 183 00:10:45,880 --> 00:10:50,070 Teie tegelased, siis saate kas vaheldumisi oma stringe. 184 00:10:50,070 --> 00:10:53,540 >> Nii Marvini eest Teine element, see on 185 00:10:53,540 --> 00:10:56,380 läheb show-- teile lihtsalt topelt stringid 186 00:10:56,380 --> 00:10:59,050 ja siis ühe string nii et see on vahelduv. 187 00:10:59,050 --> 00:11:04,040 Vastasel juhul, kui soovid kasutada topelt string operaator double string 188 00:11:04,040 --> 00:11:07,090 kui oled tuvastanud, siis sa lihtsalt kasutada põgeneda operaator. 189 00:11:07,090 --> 00:11:10,600 Nii et sa ei längkriipsu double string. 190 00:11:10,600 --> 00:11:13,330 >> Ja lõpuks on meil ka on loogiline vektorid. 191 00:11:13,330 --> 00:11:15,890 Nii logical-- nii tõsi ja vale, ja nad 192 00:11:15,890 --> 00:11:18,880 saab olema suurte tähtedega. 193 00:11:18,880 --> 00:11:22,370 Ja siis jälle, ma concatenating neid ja siis määrates neile bools. 194 00:11:22,370 --> 00:11:24,590 Nii bools läheb näidata sa TRUE, FALSE ja TRUE. 195 00:11:24,590 --> 00:11:28,280 196 00:11:28,280 --> 00:11:31,620 >> Nii et siin on vectorized indekseerimist. 197 00:11:31,620 --> 00:11:34,870 Nii alguses, ma võtan funktsioon-- 198 00:11:34,870 --> 00:11:39,230 seda nimetatakse sequence-- järjestust 2-12. 199 00:11:39,230 --> 00:11:42,490 Ja ma võtan järjestuse 2. 200 00:11:42,490 --> 00:11:46,660 Nii see läheb teha 2, 4, 6, 8, 10 ja 12. 201 00:11:46,660 --> 00:11:50,080 Ja siis ma olen indekseerimine saada kolmas element. 202 00:11:50,080 --> 00:11:55,770 >> Nii et üks asi, mida meeles pidada on see et R indeksid alustades 1. 203 00:11:55,770 --> 00:12:00,550 Nii Vals 3 annan Teile kolmas element. 204 00:12:00,550 --> 00:12:04,580 See on omamoodi erinev teistest keeles, kus ta hakkab nullist. 205 00:12:04,580 --> 00:12:09,780 Nii C või C ++, näiteks sa oled hakka neljas element. 206 00:12:09,780 --> 00:12:13,280 >> Ja siin on Vals 3-5. 207 00:12:13,280 --> 00:12:16,030 Nii et üks asi, mis on väga lahe on see, et sa 208 00:12:16,030 --> 00:12:20,410 võib tekitada ajutist muutujad sees ja siis lihtsalt kasutada neid lennult. 209 00:12:20,410 --> 00:12:21,960 Nii et siin on 3-5. 210 00:12:21,960 --> 00:12:25,070 Nii et ma olen teeniva vektori 3, 4 ja 5 ning seejärel 211 00:12:25,070 --> 00:12:29,700 Ma indekseerimise saada kolmandaks Neljas ja viies elemente. 212 00:12:29,700 --> 00:12:32,280 >> Nii Samamoodi saab abstraktne seda lihtsalt teha 213 00:12:32,280 --> 00:12:35,280 mingit vektori mis annab sulle indekseerimist. 214 00:12:35,280 --> 00:12:40,050 Nii et siin on Vals ja seejärel Esimene, kolmas ja kuues elemente. 215 00:12:40,050 --> 00:12:42,800 Ja siis, kui soovite teha täiendus, 216 00:12:42,800 --> 00:12:45,210 nii et sa lihtsalt ei minus hiljem ja et tulen 217 00:12:45,210 --> 00:12:48,600 annab sulle kõik, mis ei ole Esimene, kolmas või kuues element. 218 00:12:48,600 --> 00:12:51,590 Nii see on 4, 8 ja 10. 219 00:12:51,590 --> 00:12:54,380 >> Ja kui sa tahad saada isegi rohkem arenenud, 220 00:12:54,380 --> 00:12:57,610 saate concatenate Boolean vektorid. 221 00:12:57,610 --> 00:13:05,210 Nii et see indeks on annan teile Selle Boole'i ​​vektori pikkus 6. 222 00:13:05,210 --> 00:13:07,280 Nii rep TRUE komaga 3. 223 00:13:07,280 --> 00:13:09,680 See kordub TRUE kolm korda. 224 00:13:09,680 --> 00:13:12,900 Nii et see annab teile vektor true, true, true. 225 00:13:12,900 --> 00:13:17,470 >> rep FALSE 4-- see läheb teile vektor FALSE, vale, vale, vale. 226 00:13:17,470 --> 00:13:21,280 Ja siis c läheb concatenate Nende kahe tõeväärtused kokku. 227 00:13:21,280 --> 00:13:24,090 Nii et sa lähed, et saada kolm TRUEs ja seejärel neli falses. 228 00:13:24,090 --> 00:13:28,460 >> Nii et kui sa indeks Vals, sa oled hakka true, true, true. 229 00:13:28,460 --> 00:13:31,420 Nii et läheb öelda jah, Ma tahan, et need kolm elementi. 230 00:13:31,420 --> 00:13:33,520 Ja siis FALSE, FALSE, VALE, VALE läheb 231 00:13:33,520 --> 00:13:37,140 öelda ei, ma ei taha neid elemente nii et see ei kavatse neid tagasi. 232 00:13:37,140 --> 00:13:41,490 >> Ja ma arvan, et seal on tegelikult kirjaviga siin sest see ütleb korduvate TRUE 3 233 00:13:41,490 --> 00:13:47,990 ja korrake FALSE 4 ja tehniliselt, siis ainult kuus elemendist, korrata FALSE, 234 00:13:47,990 --> 00:13:50,470 see peaks olema kordus FALSE 3. 235 00:13:50,470 --> 00:13:55,260 Ma arvan, et R on ka piisavalt targad, nagu et kui sa lihtsalt täpsustada 4 siin, siis 236 00:13:55,260 --> 00:13:56,630 see ei ole isegi viga välja. 237 00:13:56,630 --> 00:13:58,480 See lihtsalt anda teile selle väärtust. 238 00:13:58,480 --> 00:14:00,970 Nii et ma lihtsalt ignoreerida, et neljas FALSE. 239 00:14:00,970 --> 00:14:05,310 240 00:14:05,310 --> 00:14:09,270 >> Nii et siin on vectorized ülesanne. 241 00:14:09,270 --> 00:14:15,480 Nii set.seed-- see lihtsalt seab seemne pseudorandom numbrid. 242 00:14:15,480 --> 00:14:20,110 Nii et ma panen seemne 42, mis tähendab, et kui I genereerida 243 00:14:20,110 --> 00:14:22,950 kolm juhuslikult normaalne väärtustega ja siis, kui te 244 00:14:22,950 --> 00:14:27,400 joosta set.seed ise arvutiga sama väärtusega 42, 245 00:14:27,400 --> 00:14:30,990 siis saab ka Samal kolm juhuslikult tervetega. 246 00:14:30,990 --> 00:14:33,411 >> Nii et see on tõesti hea reprodutseeritavuse. 247 00:14:33,411 --> 00:14:35,910 Tavaliselt, kui sa teed mõned omamoodi teaduslik analüüs, 248 00:14:35,910 --> 00:14:37,230 sa paneks seemne. 249 00:14:37,230 --> 00:14:41,270 Nii suudavad teised teadlased lihtsalt reprodutseerida täpselt sama kood olete 250 00:14:41,270 --> 00:14:44,790 teha, sest nad on täpselt Sama juhuslikud muutujad selle-- või juhuslikult 251 00:14:44,790 --> 00:14:47,270 väärtused, et olete välja võtta samuti. 252 00:14:47,270 --> 00:14:49,870 253 00:14:49,870 --> 00:14:53,910 >> Ja nii vectorized loovutamise siin näitab Vals 1-2. 254 00:14:53,910 --> 00:14:59,290 Nii et see võtab kaks esimest osa Vals ja siis annaks neile 0. 255 00:14:59,290 --> 00:15:03,940 Ja siis saab ka lihtsalt teha sarnane asi tõeväärtused. 256 00:15:03,940 --> 00:15:09,340 >> Nii Vals ei võrdu 0-- see tahe teile vektori FALSE, FALSE, TRUE 257 00:15:09,340 --> 00:15:10,350 sel juhul. 258 00:15:10,350 --> 00:15:13,770 Ja siis see läheb midagi rääkida nende indeksid, mis on tõsi, 259 00:15:13,770 --> 00:15:15,270 siis see saab määrata, et kuni 5. 260 00:15:15,270 --> 00:15:18,790 Nii et see võtab kolmas element siin ja siis annab see 5. 261 00:15:18,790 --> 00:15:22,300 >> Ja see on tõesti kena võrreldes madala taseme keelte 262 00:15:22,300 --> 00:15:25,560 kui teil on kasutada silmad teha kõike seda vectorized stuff 263 00:15:25,560 --> 00:15:30,281 sest see on lihtsalt väga intuitiivne ja see on ühekordne-liner. 264 00:15:30,281 --> 00:15:32,030 Ja mis on suur umbes vectorized märke 265 00:15:32,030 --> 00:15:37,020 on see, et R, need on omamoodi Sisseehitatud nii, et nad peaaegu sama kiiresti 266 00:15:37,020 --> 00:15:42,490 kui teed madala keeles mitte teha silmus teadus 267 00:15:42,490 --> 00:15:46,317 ja siis lasta teha dünaamiline indekseerimise ise. 268 00:15:46,317 --> 00:15:48,900 Ja see saab olema aeglasem kui teed selline vectorized asi 269 00:15:48,900 --> 00:15:55,950 kus ta saab seda teha paralleelselt, kus ta teeb seda väliskeermestamiseks põhimõtteliselt. 270 00:15:55,950 --> 00:15:58,650 >> Nii et siin on vectorized operatsioone. 271 00:15:58,650 --> 00:16:04,920 Nii et ma olen teeniva väärtus 1-3, määrates et vec1, 3-5, vec2, 272 00:16:04,920 --> 00:16:05,950 lisades neid koos. 273 00:16:05,950 --> 00:16:11,490 Ta lisab neile komponent tark nii see 1 pluss 3, 2 pluss 4, ja nii edasi. 274 00:16:11,490 --> 00:16:13,330 >> vec1 korda vec2. 275 00:16:13,330 --> 00:16:16,110 See korrutab kaks väärtustab osa tark. 276 00:16:16,110 --> 00:16:21,830 Nii et see on 1 korda 3, 2 korda 4 ja seejärel 3 korda 5. 277 00:16:21,830 --> 00:16:28,250 >> Ja siis samamoodi võite teha comparisons-- loogiline võrdlusi. 278 00:16:28,250 --> 00:16:33,640 Nii et see on vale vale TRUE selles Juhul, sest 1 ei ole suurem kui 3, 279 00:16:33,640 --> 00:16:35,920 2 ei ole suurem kui 4. 280 00:16:35,920 --> 00:16:41,160 See on, ma arvan, teise kirjaviga, 3 Kindlasti ei ole suurem kui 5. 281 00:16:41,160 --> 00:16:41,660 Jah. 282 00:16:41,660 --> 00:16:45,770 Ja nii saab lihtsalt teha kõik Nende lihtsad toimingud 283 00:16:45,770 --> 00:16:48,350 sest nende päritud alates tundidesse. 284 00:16:48,350 --> 00:16:51,110 285 00:16:51,110 --> 00:16:52,580 >> Nii et oli lihtsalt vektor. 286 00:16:52,580 --> 00:16:56,530 Ja see on omamoodi kõige põhilisem R objekti sest antud vektori 287 00:16:56,530 --> 00:16:59,170 saab ehitada rohkem arenenud objektid. 288 00:16:59,170 --> 00:17:00,560 >> Nii et siin on maatriks. 289 00:17:00,560 --> 00:17:05,030 See on sisuliselt võtmiseks mida maatriks on iseenesest. 290 00:17:05,030 --> 00:17:10,099 Nii et kui see on kolme erineva vektorid, kus igaüks on veerus 291 00:17:10,099 --> 00:17:12,710 või saab seda nagu igaüks on reas. 292 00:17:12,710 --> 00:17:18,250 >> Nii et ma olen ladustamiseks maatriks 1 kuni 9 ja siis ma täpsustades 3 rida. 293 00:17:18,250 --> 00:17:23,364 Nii 1-9 teile vektori 1 2, 3, 4, 5, 6, ja kõik viis 9. 294 00:17:23,364 --> 00:17:29,250 >> Üks asi, mida ka meeles pidada, et R kauplustes tulbas-suur formaat. 295 00:17:29,250 --> 00:17:34,160 Nii teisisõnu, kui sa näed 1 9, see läheb salvestada them-- 296 00:17:34,160 --> 00:17:36,370 see saab olema 1, 2, 3 esimeses veerus, 297 00:17:36,370 --> 00:17:38,510 ja siis teen 4, 5, 6 teises veerus, 298 00:17:38,510 --> 00:17:41,440 ja seejärel 7, 8, 9 kolmandas tulbas. 299 00:17:41,440 --> 00:17:45,570 >> Ja siin on mõned muud Ühiste ülesannete mida saab kasutada. 300 00:17:45,570 --> 00:17:49,650 Nii päevasõidutulede matt, see annab teile mõõtmed maatriksi. 301 00:17:49,650 --> 00:17:52,620 See saab teid tagasi vektor mõõtme. 302 00:17:52,620 --> 00:17:55,580 Nii sel juhul, sest meie maatriks on 3 3, 303 00:17:55,580 --> 00:18:01,900 see läheb teile numbriline vektor, mis on 3 3. 304 00:18:01,900 --> 00:18:05,270 >> Ja siin on lihtsalt näitab maatriksi korrutamine. 305 00:18:05,270 --> 00:18:11,970 Nii tavaliselt, kui sa lihtsalt teha asterisk-- nii matt tärniga mat-- 306 00:18:11,970 --> 00:18:15,380 see saab olema Osa tark operatsiooni 307 00:18:15,380 --> 00:18:17,300 või mida nimetatakse Hadamardi toodet. 308 00:18:17,300 --> 00:18:21,310 Nii see läheb teha iga element osa tark. 309 00:18:21,310 --> 00:18:23,610 Siiski, kui soovite maatriks multiplication-- 310 00:18:23,610 --> 00:18:29,380 nii korrutades esimeses reas korda Teine maatriksi esimese veeru 311 00:18:29,380 --> 00:18:34,510 ja nii nüüd-- soovid kasutada Selle protsenti tööd. 312 00:18:34,510 --> 00:18:38,110 >> Ja t matt on lihtsalt operatsiooni ülevõtmist. 313 00:18:38,110 --> 00:18:42,590 Nii et ma räägin võtta transponeeritud sisse maatriks, korrutada see maatriks 314 00:18:42,590 --> 00:18:43,090 ise. 315 00:18:43,090 --> 00:18:45,006 Ja siis see läheb tagasi sa veel 3 316 00:18:45,006 --> 00:18:50,700 3 Tabel, milles on toode, mida tahaks. 317 00:18:50,700 --> 00:18:53,750 >> Ja nii see oli maatriks. 318 00:18:53,750 --> 00:18:56,020 Siin on, mida nimetatakse andmete raami. 319 00:18:56,020 --> 00:19:00,780 Andmestikus sa ei mõtle nii maatriksi, kuid iga kolonni ise 320 00:19:00,780 --> 00:19:02,990 saab olema erinevat liiki. 321 00:19:02,990 --> 00:19:07,320 >> Mis siis lahedaid andmete kohta raamid on, et andmete analüüs iseenesest 322 00:19:07,320 --> 00:19:11,260 sa lähed on see kõik heterogeensete andmete ja kõik need tegelikult 323 00:19:11,260 --> 00:19:15,640 segased lood, kus igasse veergu ise võib olla erinevat tüüpi. 324 00:19:15,640 --> 00:19:21,460 Nii et siin ma räägin luua andmestikus, kas ints 1-3, 325 00:19:21,460 --> 00:19:24,750 ja siis on ka märk vektor. 326 00:19:24,750 --> 00:19:28,470 Ma võin indeks kaudu kõik need sambad 327 00:19:28,470 --> 00:19:30,930 ja siis ma saan väärtused ise. 328 00:19:30,930 --> 00:19:34,370 Ja sa võid teha ka mingisugune tegevuse kohta andmete raamid. 329 00:19:34,370 --> 00:19:38,040 Ja enamiku ajast, kui sa oled teeb andmete analüüsi või mingisugune 330 00:19:38,040 --> 00:19:42,042 kohta preprocessing, siis saad töötavad need andmestruktuurid 331 00:19:42,042 --> 00:19:44,250 kus iga veeru läheb olla erinevat tüüpi. 332 00:19:44,250 --> 00:19:47,880 333 00:19:47,880 --> 00:19:52,970 >> Lõpuks, mis on põhiliselt vaid neli olulist objektid R. Eesti 334 00:19:52,970 --> 00:19:55,820 lihtsalt koguda muud objektid, mida soovid. 335 00:19:55,820 --> 00:20:00,130 Nii et see salvestab selle ühte muutuja, mis saab hõlpsasti. 336 00:20:00,130 --> 00:20:02,370 >> Nii et siin ma võtan nimekirja. 337 00:20:02,370 --> 00:20:04,460 Ma räägin kraami võrdub 3. 338 00:20:04,460 --> 00:20:08,060 Nii et ma lähen on üks osa nimekirja ja seda nimetatakse asju, 339 00:20:08,060 --> 00:20:10,570 ja see läheb väärtus on 3. 340 00:20:10,570 --> 00:20:13,140 >> Võin ka luua maatriks. 341 00:20:13,140 --> 00:20:17,970 Seega on see 1-4 ja lõpuks reas võrdub 2, nii 2 2 maatriksi. 342 00:20:17,970 --> 00:20:20,270 Ka nimekirja ja seda nimetatakse mat. 343 00:20:20,270 --> 00:20:24,690 moreStuff, märgijada, ja isegi teise nimekirja iseenesest. 344 00:20:24,690 --> 00:20:27,710 >> Nii et see on loend, mis on 5 ja karu. 345 00:20:27,710 --> 00:20:30,990 Nii et see on väärtus 5 ja on märgijada karu 346 00:20:30,990 --> 00:20:32,710 ja see on nimekiri sees nimekirja. 347 00:20:32,710 --> 00:20:35,965 Nii saab olema neid rekursiivne asju, kus 348 00:20:35,965 --> 00:20:38,230 teil on another-- kirjuta antud tüübi piires. 349 00:20:38,230 --> 00:20:41,420 Nii Samuti võite olla maatriks sees teise maatriksi ja nii edasi. 350 00:20:41,420 --> 00:20:44,264 Ja nimekiri on lihtsalt hea võimalus kogumise ja koondamisel 351 00:20:44,264 --> 00:20:45,430 kõik need erinevad objektid. 352 00:20:45,430 --> 00:20:50,210 353 00:20:50,210 --> 00:20:57,150 >> Ja lõpuks, siin on lihtsalt aidata korral see oli lihtsalt läinud üle väga kiiresti. 354 00:20:57,150 --> 00:21:01,350 Nii igal oled segaduses umbes mingi funktsioon, 355 00:21:01,350 --> 00:21:03,510 saate teha abiga selle funktsiooni. 356 00:21:03,510 --> 00:21:07,120 Nii saab teha abiga maatriks või küsimärk maatriks. 357 00:21:07,120 --> 00:21:11,430 Ja abi ja küsimärk on lihtsalt lühendvormina sama asi 358 00:21:11,430 --> 00:21:13,040 nii et nad varjunimed. 359 00:21:13,040 --> 00:21:16,820 >> lm on funktsioon, mis lihtsalt ei lineaarse mudeli. 360 00:21:16,820 --> 00:21:20,340 Aga kui sa lihtsalt ei tea, kuidas see tööd, mida saab lihtsalt teha abiga lm 361 00:21:20,340 --> 00:21:24,610 ja et annan teile mõned omamoodi dokumentatsiooni 362 00:21:24,610 --> 00:21:27,960 näeb selline nagu man-lehekülge Unix, kus 363 00:21:27,960 --> 00:21:34,210 Teil on lühike kirjeldus, mida see juhtub, ka seda, mis on tema argumendid, 364 00:21:34,210 --> 00:21:38,850 mida ta naaseb, ja lihtsalt näpunäiteid, kuidas seda kasutada, ja mõned näited samuti. 365 00:21:38,850 --> 00:21:41,680 366 00:21:41,680 --> 00:21:52,890 >> Nii et lubage mul minna ja näidata mõned demo kasutades R. OK. 367 00:21:52,890 --> 00:21:55,470 Nii et ma läksin üle väga kiiresti lihtsalt andmeid 368 00:21:55,470 --> 00:21:59,440 struktuuride ja mingisugune op-- mõned toimingud. 369 00:21:59,440 --> 00:22:02,960 Siin on mõned funktsioonid. 370 00:22:02,960 --> 00:22:06,750 >> Nii et siin ma lihtsalt määratleda funktsiooni. 371 00:22:06,750 --> 00:22:09,970 Nii et ma olen ka kasutades omistamisoperaatorile siin 372 00:22:09,970 --> 00:22:12,610 ja siis ma räägin Kinnitan seda funktsiooni. 373 00:22:12,610 --> 00:22:14,140 Ja see võtab raha x. 374 00:22:14,140 --> 00:22:18,210 Nii et see on mingit väärtust, mida soovite ja ma lähen tagasi x ise. 375 00:22:18,210 --> 00:22:20,840 Nii et see on identiteedi funktsiooni. 376 00:22:20,840 --> 00:22:23,670 >> Ja mis on cool sellest Võrreldes teiste keelte 377 00:22:23,670 --> 00:22:26,330 ja teise madala keeles on see, et x 378 00:22:26,330 --> 00:22:29,350 võib olla mistahes tüüpi ise ja see naasen seda tüüpi. 379 00:22:29,350 --> 00:22:35,251 Nii saab imagine-- las mul käivitada kiiresti. 380 00:22:35,251 --> 00:22:35,750 Vabandust. 381 00:22:35,750 --> 00:22:40,300 >> Nii et üks asi, mida ma peaks mainima on see, et toimetaja ma kasutan 382 00:22:40,300 --> 00:22:41,380 nimetatakse rstudio. 383 00:22:41,380 --> 00:22:44,389 See on see, mida nimetatakse IDE. 384 00:22:44,389 --> 00:22:46,180 Ja üks asi, mis on tõesti kena selle 385 00:22:46,180 --> 00:22:51,500 on, et see sisaldab palju asjad, mida sa tahad teha R ise 386 00:22:51,500 --> 00:22:53,180 lihtsalt väga intuitiivselt. 387 00:22:53,180 --> 00:22:55,550 >> Nii et siin on tõlk konsooli. 388 00:22:55,550 --> 00:23:02,160 Nii Samamoodi saab ka seda konsooli toores lihtsalt tehes kapitali R. 389 00:23:02,160 --> 00:23:05,630 Ja see on täpselt sama asi nagu konsooli. 390 00:23:05,630 --> 00:23:12,210 Nii et ma ei saa lihtsalt teha id funktsioon x, x, x. 391 00:23:12,210 --> 00:23:16,130 Ja then-- ja siis, et saab trahvi ise. 392 00:23:16,130 --> 00:23:19,200 393 00:23:19,200 --> 00:23:21,740 >> Nii rstudio on suur sest see on konsooli. 394 00:23:21,740 --> 00:23:25,360 Samuti on dokumentide soovite sõita. 395 00:23:25,360 --> 00:23:28,629 Ja siis on mõned muutujad et näed keskkondades. 396 00:23:28,629 --> 00:23:30,420 Ja siis, kui teil on teha krundid, siis 397 00:23:30,420 --> 00:23:33,730 võid näha siin, erinevalt juhtimisel kõik need erinevad aknad 398 00:23:33,730 --> 00:23:35,940 ise. 399 00:23:35,940 --> 00:23:40,530 >> Ma tegelikult ise kasutada Vim, aga ma tunne rstudio on suurepärane lihtsalt 400 00:23:40,530 --> 00:23:44,640 saada hea idee kuidas kasutada R. Tavaliselt 401 00:23:44,640 --> 00:23:47,040 kui sa üritad õppida uusi ülesandeid, 402 00:23:47,040 --> 00:23:49,590 sa ei taha hakkama liiga palju asju korraga. 403 00:23:49,590 --> 00:23:53,120 Nii R on lihtsalt very-- rstudio on väga hea viis õppimiseks R 404 00:23:53,120 --> 00:23:56,760 ilma et nad peaksid tegelema kõik need muud asjad. 405 00:23:56,760 --> 00:23:58,600 >> Nii et siin ma olen töötab id tere. 406 00:23:58,600 --> 00:24:00,090 See naaseb tere. 407 00:24:00,090 --> 00:24:01,740 id 123. 408 00:24:01,740 --> 00:24:04,610 Siin on vektor täisarvud. 409 00:24:04,610 --> 00:24:08,620 Nii sarnaselt, sest saad võta mingi väärtus, 410 00:24:08,620 --> 00:24:16,060 saate teha naasmist id x nii et see tagasi 1234 ja 5. 411 00:24:16,060 --> 00:24:22,210 >> Ja las ma näitan sulle, et see on tõepoolest täisarv. 412 00:24:22,210 --> 00:24:28,800 Ja samamoodi, kui sa klassi id x, see saab olema täisarv. 413 00:24:28,800 --> 00:24:34,170 Ja siis saate ka võrrelda kahe ja see on tõsi. 414 00:24:34,170 --> 00:24:38,350 Nii et ma kontrollida, kas ID-x võrdub võrdsete x ja teate 415 00:24:38,350 --> 00:24:39,760 et see annab teile kaks TRUEs. 416 00:24:39,760 --> 00:24:44,280 Nii et see ei ütle ei kaks objekti identne, 417 00:24:44,280 --> 00:24:46,845 kuid iga kirjet jooksul vektorid identsed. 418 00:24:46,845 --> 00:24:50,000 419 00:24:50,000 --> 00:24:52,090 >> Siin on bounded.compare. 420 00:24:52,090 --> 00:24:58,470 Nii see on veidi keerulisem et sellel on, kui seisund ja muud 421 00:24:58,470 --> 00:25:00,960 ja siis ta võtab kaks argumendid korraga. 422 00:25:00,960 --> 00:25:02,640 Nii x on mistahes tüüpi. 423 00:25:02,640 --> 00:25:06,280 Ja ma ütlen seda Teine argument on. 424 00:25:06,280 --> 00:25:08,380 See võib olla ükskõik mida samuti. 425 00:25:08,380 --> 00:25:12,490 Aga vaikimisi see aega võtab 5 kui sa ei määra midagi. 426 00:25:12,490 --> 00:25:16,730 >> Nii et siin ma ütlen kui x on suurem kui. 427 00:25:16,730 --> 00:25:19,220 Nii et kui ma ei täpsusta, siis ütleb, kui x on suurem kui 5, 428 00:25:19,220 --> 00:25:20,470 siis ma lähen tagasi tõsi. 429 00:25:20,470 --> 00:25:23,230 muud, ma lähen tagasi FALSE. 430 00:25:23,230 --> 00:25:24,870 Nii et lubage mul minna ja määratleda seda. 431 00:25:24,870 --> 00:25:30,600 432 00:25:30,600 --> 00:25:34,550 >> Ja nüüd ma lähen joosta bounded.compare 3. 433 00:25:34,550 --> 00:25:39,150 Nii ta ütleb on 3 vähem than-- on 3 suuremat kui 5. 434 00:25:39,150 --> 00:25:41,830 Ei, see ei ole nii FALSE. 435 00:25:41,830 --> 00:25:46,550 >> Ja bounded.compare 3 ja ma lähen võrrelda seda kasutades võrdub 2. 436 00:25:46,550 --> 00:25:50,700 Nüüd ma räägin jah, nüüd ma tahan olla midagi muud. 437 00:25:50,700 --> 00:25:52,750 Nii et ma ütlen, siis peaks olema 2. 438 00:25:52,750 --> 00:25:56,640 >> Võin kas seda omamoodi märke või ütlen võrdub 2. 439 00:25:56,640 --> 00:25:58,720 See on selgem ja arusaadavam et kui sa oled 440 00:25:58,720 --> 00:26:01,450 vaadates neid tõesti keeruline funktsioone, mis 441 00:26:01,450 --> 00:26:08,110 võtta mitu arguments-- ja selle võib olla kümneid oftentimes-- lihtsalt ütlen 442 00:26:08,110 --> 00:26:11,140 võrdub 2 on loetav sind nii, et hiljem tulevikus 443 00:26:11,140 --> 00:26:13,020 sa tead, mida sa teed. 444 00:26:13,020 --> 00:26:17,120 >> Nii et kui ma olen ütlus on 3 ületa 2. 445 00:26:17,120 --> 00:26:18,270 Jah, see on. 446 00:26:18,270 --> 00:26:22,350 Ja täpselt samamoodi, ma ei saa lihtsalt eemaldada seda ja öelda, on 3 suurem kui 2 447 00:26:22,350 --> 00:26:23,440 kus võrdub 2. 448 00:26:23,440 --> 00:26:26,230 Ja see on ka tõsi. 449 00:26:26,230 --> 00:26:26,730 Jah? 450 00:26:26,730 --> 00:26:29,670 >> Sihtrühm: Kas sa oled täidesaatva rida-realt? 451 00:26:29,670 --> 00:26:30,670 >> DUSTIN TRAN: Jah ma olen. 452 00:26:30,670 --> 00:26:33,900 Mida ma teen siin võttes seda teksti document-- 453 00:26:33,900 --> 00:26:39,825 ja mis on suur umbes rstudio on see, et Ma lihtsalt joosta short-- kiirklahvi. 454 00:26:39,825 --> 00:26:41,820 Nii ma teen kontroll-Enter. 455 00:26:41,820 --> 00:26:44,850 >> Ja siis ma teen line teksti dokumendi 456 00:26:44,850 --> 00:26:46,710 ja siis paneb konsooli. 457 00:26:46,710 --> 00:26:50,800 Nii et siin ma ütlen, bounded.compare ja ma teen kontroll-X. 458 00:26:50,800 --> 00:26:52,540 Nii et ma lihtsalt ei joosta ka siin. 459 00:26:52,540 --> 00:26:54,920 Ja siis, et võtan line ja siis pane see siia. 460 00:26:54,920 --> 00:26:57,900 Ja siis samamoodi võin ma joosta siin. 461 00:26:57,900 --> 00:27:04,630 Ja siis muudkui määratlemisel read konsooli niimoodi. 462 00:27:04,630 --> 00:27:10,690 >> Ja kui te ka teate, lokkis traksid on seal nii nagu C süntaksit. 463 00:27:10,690 --> 00:27:13,910 x-ist, kui siis, kui tingimus on ka kavatsete kasutada sulgudes ning seejärel 464 00:27:13,910 --> 00:27:15,350 saate teine. 465 00:27:15,350 --> 00:27:17,496 Veel on teine, kui. 466 00:27:17,496 --> 00:27:21,440 Nii et see saab olema x võrdub võrdub näiteks. 467 00:27:21,440 --> 00:27:24,190 468 00:27:24,190 --> 00:27:26,350 Ja siis ma lähen tagasi siin midagi. 469 00:27:26,350 --> 00:27:29,490 >> Pange tähele, et on olemas kaks erinevat asju siin, et toimub. 470 00:27:29,490 --> 00:27:34,360 Üks on see, et siin ma olen, täpsustades tagasi väärtuse TRUE. 471 00:27:34,360 --> 00:27:35,950 Siin Ma lihtsalt ütlen x. 472 00:27:35,950 --> 00:27:39,970 Nii R tavaliselt vaikimisi võtma viimase arguments-- 473 00:27:39,970 --> 00:27:43,510 või võtta viimane rida koodi, ja see on, mida see tagastatakse. 474 00:27:43,510 --> 00:27:46,920 Nii et siin see on sama asja nagu teevad vastutasuks x. 475 00:27:46,920 --> 00:27:49,450 476 00:27:49,450 --> 00:27:50,540 >> Ja just teile näidata. 477 00:27:50,540 --> 00:27:54,000 478 00:27:54,000 --> 00:27:57,052 Ja siis, et see töötab just niimoodi. 479 00:27:57,052 --> 00:27:58,260 Nii et lubage mul seda jätkata. 480 00:27:58,260 --> 00:28:00,630 >> Nii else if. 481 00:28:00,630 --> 00:28:04,060 Ja tõesti, ma ei saa tagasi midagi, mida ma tahaks. 482 00:28:04,060 --> 00:28:06,680 Nii et ma ei pea isegi tagastamise tõeväärtused kogu aeg, 483 00:28:06,680 --> 00:28:08,410 Võin lihtsalt tagasi millegi muuga. 484 00:28:08,410 --> 00:28:10,670 Ma võin teha edasi-tagasi kandma. 485 00:28:10,670 --> 00:28:12,989 >> Nii et kui x võrdub võrdub, see läheb tagasi kandma. 486 00:28:12,989 --> 00:28:14,530 Vastasel juhul läheb tagasi tõsi. 487 00:28:14,530 --> 00:28:19,310 Võin ka teha vektor või tõesti midagi. 488 00:28:19,310 --> 00:28:22,210 >> Ja tavaliselt staatiliselt trükitud tekst, 489 00:28:22,210 --> 00:28:23,840 sa pead määrama tüüp siin. 490 00:28:23,840 --> 00:28:25,750 Ja teate, et see võib olla ainult midagi. 491 00:28:25,750 --> 00:28:32,400 Ja R on piisavalt intelligentne, et seda lihtsalt seda teha ja see töötab hästi. 492 00:28:32,400 --> 00:28:33,620 >> Nii et lubage mul määratleda seda. 493 00:28:33,620 --> 00:28:39,460 494 00:28:39,460 --> 00:28:41,230 Unexpected-- oh vabandust. 495 00:28:41,230 --> 00:28:44,336 See peaks olema lokkis traksidega siin. 496 00:28:44,336 --> 00:28:44,836 OK. 497 00:28:44,836 --> 00:28:45,336 Külm. 498 00:28:45,336 --> 00:28:52,580 499 00:28:52,580 --> 00:28:54,530 Hea küll. 500 00:28:54,530 --> 00:28:58,250 Vaatame nüüd võrrelda 3 ja võrdub 3. 501 00:28:58,250 --> 00:29:01,860 Seega peaks return-- yeah-- väärtus karu. 502 00:29:01,860 --> 00:29:06,740 >> Nüüd üldisem asi on nagu kuidas teised andmestruktuurid. 503 00:29:06,740 --> 00:29:09,110 Nii et teil on see funktsioon. 504 00:29:09,110 --> 00:29:15,360 See läheb tööle mingit väärtuse nagu 3 või numbri, 505 00:29:15,360 --> 00:29:17,500 teisisõnu, double. 506 00:29:17,500 --> 00:29:19,330 >> Aga midagi sellist vektorit. 507 00:29:19,330 --> 00:29:27,750 Mis juhtub, kui sa do-- nii et ma olen läheb loovutada val, ütleme, 4-6. 508 00:29:27,750 --> 00:29:31,640 Nii et kui ma tagasi selle, see on vektor 4, 5, 6. 509 00:29:31,640 --> 00:29:34,935 >> Nüüd vaatame, mis juhtub kui ma bounded.compare val. 510 00:29:34,935 --> 00:29:37,680 511 00:29:37,680 --> 00:29:42,450 Nii et see on annan teile 15 1251. 512 00:29:42,450 --> 00:29:46,440 Nii teisisõnu see öeldes kui te vaatate seda tingimust 513 00:29:46,440 --> 00:29:50,040 nii ta ütleb x on väiksem kui või midagi. 514 00:29:50,040 --> 00:29:51,880 Nii et see on veidi segane, sest nüüd 515 00:29:51,880 --> 00:29:53,379 sa lihtsalt ei tea, mis toimub. 516 00:29:53,379 --> 00:29:58,690 Nii et ma arvan, et üks asi, mis on tõesti head kohta lihtsalt üritan siluda 517 00:29:58,690 --> 00:30:04,600 on, et saate lihtsalt teha val on suurem kui ja vaata, mis juhtub seal. 518 00:30:04,600 --> 00:30:09,720 >> Nii val-- on vaikimisi 5 nii olgem lihtsalt ei Val üle 5. 519 00:30:09,720 --> 00:30:14,280 Nii et see on vektor vale vale tõsi. 520 00:30:14,280 --> 00:30:17,206 Nüüd, kui te vaatate see, et see saab öelda, kui 521 00:30:17,206 --> 00:30:20,080 ja siis see läheb teile seda on vektor vale vale tõsi. 522 00:30:20,080 --> 00:30:23,450 >> Nii et kui te kaotate seda arvesse R, R ei tea, mida sa teed. 523 00:30:23,450 --> 00:30:26,650 Sest see eeldab ühe väärtust, mis on Boole'i ​​ja nüüd 524 00:30:26,650 --> 00:30:29,420 sa oled andes vektori tõeväärtused. 525 00:30:29,420 --> 00:30:31,970 Nii vaikimisi R on lihtsalt ütlen mida kuradit, 526 00:30:31,970 --> 00:30:35,440 Ma lähen eeldada, et sa oled kavatseme esimene element siin. 527 00:30:35,440 --> 00:30:38,320 Nii et ma lähen say-- ma lähen eeldada, et see on vale. 528 00:30:38,320 --> 00:30:40,890 Nii see läheb öelda Ei, see ei ole õige. 529 00:30:40,890 --> 00:30:45,246 >> Samuti läheb olema val võrdub võrdub. 530 00:30:45,246 --> 00:30:47,244 Ei, sorry 5. 531 00:30:47,244 --> 00:30:48,910 Ja see on ka kavatse olla vale samuti. 532 00:30:48,910 --> 00:30:52,410 Nii see läheb öelda ei, see ei ole tõsi ja nii see 533 00:30:52,410 --> 00:30:53,680 läheb tagasi see viimane. 534 00:30:53,680 --> 00:30:56,420 535 00:30:56,420 --> 00:31:01,360 >> Nii et see on kas hea või halb asi, sõltuvalt sellest, kuidas seda vaadata. 536 00:31:01,360 --> 00:31:05,104 Sest kui sa oled luues neid funktsioone, 537 00:31:05,104 --> 00:31:06,770 sa tegelikult ei tea, mis toimub. 538 00:31:06,770 --> 00:31:10,210 Nii et mõnikord sa tahaks viga või äkki tahad lihtsalt hoiatus. 539 00:31:10,210 --> 00:31:12,160 Sel juhul R ei tee seda. 540 00:31:12,160 --> 00:31:14,300 Nii et see on tõesti kuni sa põhineb off mida 541 00:31:14,300 --> 00:31:17,310 te arvate keel peaks tegema sel juhul 542 00:31:17,310 --> 00:31:22,920 kui te kaotate oma vektor tõeväärtused kui sa teed, kui seisukorras. 543 00:31:22,920 --> 00:31:31,733 >> Ütleme, et sul oli originaal üks kui teine ​​tagastab tõese ja sa oled 544 00:31:31,733 --> 00:31:34,190 läheb tagasi FALSE. 545 00:31:34,190 --> 00:31:39,300 Nii et üks abstraheerides See tähendab, I 546 00:31:39,300 --> 00:31:41,530 ei pea isegi selle tingimuseks asi. 547 00:31:41,530 --> 00:31:47,220 Teine asi, mida ma teha saan, on lihtsalt tagastamise väärtused ise. 548 00:31:47,220 --> 00:31:53,240 Nii et kui te märkate, kui te teha val on suurem kui 5, 549 00:31:53,240 --> 00:31:56,350 see läheb tagasi vektor vale vale tõsi. 550 00:31:56,350 --> 00:31:58,850 >> Võib-olla see, mida sa tahad bounded.compare. 551 00:31:58,850 --> 00:32:02,940 Sa tahad tagasi vektor tõeväärtused kus võrreldakse iga väärtused 552 00:32:02,940 --> 00:32:04,190 ise. 553 00:32:04,190 --> 00:32:11,165 Nii saate lihtsalt ei bounded.compare funktsiooni x, võrdub 5. 554 00:32:11,165 --> 00:32:13,322 555 00:32:13,322 --> 00:32:15,363 Ja siis selle asemel teeme see kui teine ​​tingimus, 556 00:32:15,363 --> 00:32:21,430 Ma lihtsalt tagasi x on suurem kui 5. 557 00:32:21,430 --> 00:32:23,620 Nii et kui see on tõsi, siis see läheb tagasi tõsi. 558 00:32:23,620 --> 00:32:26,830 Ja siis, kui see ei ole, see on läheb tagasi FALSE. 559 00:32:26,830 --> 00:32:30,880 >> Ja see töötab mõni neist struktuure. 560 00:32:30,880 --> 00:32:41,450 Ma võin bounded.compare c 1 6 või 9 ja siis ma lähen ütlen võrdub 6 561 00:32:41,450 --> 00:32:42,799 näiteks. 562 00:32:42,799 --> 00:32:44,840 Ja siis see läheb anna Teile õigust Boolean 563 00:32:44,840 --> 00:32:48,240 vektor et olete projekteerimisel. 564 00:32:48,240 --> 00:32:50,660 >> Nii et need on lihtsalt funktsioonid ja nüüd lubage mul 565 00:32:50,660 --> 00:32:54,980 näitan sulle mõned interaktiivsed visuaale. 566 00:32:54,980 --> 00:32:59,700 Ma ei usu, et ma tegelikult on Wi-Fi siin nii lubage mul minna 567 00:32:59,700 --> 00:33:01,970 ja jätke see, mida ma arvan. 568 00:33:01,970 --> 00:33:05,260 >> Aga üks asi, mis on lahe küll on, et kui sa lihtsalt 569 00:33:05,260 --> 00:33:09,600 soovite testida kamp erinevaid andmeid käsud, 570 00:33:09,600 --> 00:33:13,320 on hunnik erinevaid andmekogusid mis on juba eelnevalt laadida R. 571 00:33:13,320 --> 00:33:15,770 Nii et üks neist on nimetatakse iirise andmebaasil. 572 00:33:15,770 --> 00:33:18,910 See on üks kõige tuntum omadega masin õppe. 573 00:33:18,910 --> 00:33:23,350 Sul tavaliselt lihtsalt teha mingisugune test juhtudel, et näha, kui teie kood jookseb. 574 00:33:23,350 --> 00:33:27,520 Võtame vaadata, mida iiris on. 575 00:33:27,520 --> 00:33:33,130 >> Nii see asi läheb oleks andmestikus. 576 00:33:33,130 --> 00:33:36,000 Ja see on selline pikk, kuna Ma lihtsalt välja printida iiris. 577 00:33:36,000 --> 00:33:38,810 See prindib kogu asi. 578 00:33:38,810 --> 00:33:42,830 Seega on kõik need erinevad nimed. 579 00:33:42,830 --> 00:33:45,505 Nii iiris on kogumik Erinevate lilled. 580 00:33:45,505 --> 00:33:48,830 Sel juhul on öelnud te liikide see, 581 00:33:48,830 --> 00:33:54,760 kõik need erinevad laiused ja pikkused sepal ja kroonlehtedega. 582 00:33:54,760 --> 00:33:58,880 >> Ja nii tavaliselt, kui mida soovite printida iiris, 583 00:33:58,880 --> 00:34:03,680 Näiteks, sa ei tahtnud seda kõike seda teha, sest see võib üle võtta 584 00:34:03,680 --> 00:34:05,190 kogu oma konsooli. 585 00:34:05,190 --> 00:34:09,280 Nii et üks asi, mis on tõesti kena on pea funktsioon. 586 00:34:09,280 --> 00:34:12,929 Nii et kui sa lihtsalt ei pea iirise, see annab teile 587 00:34:12,929 --> 00:34:17,389 Esimene viis rida, või kuus ma arvan. 588 00:34:17,389 --> 00:34:19,909 Ja siis hästi, siis lihtsalt määrata siin. 589 00:34:19,909 --> 00:34:22,914 Nii 20-- see annab sa esimene 20 rida. 590 00:34:22,914 --> 00:34:24,830 Ja ma tegelikult oli selline üllatunud, et see 591 00:34:24,830 --> 00:34:28,770 andis mulle kuus seega lubage mul minna ning vaadake iris-- või pea, vabandust. 592 00:34:28,770 --> 00:34:31,699 593 00:34:31,699 --> 00:34:34,960 Ja siin see annab sa dokumentatsioon 594 00:34:34,960 --> 00:34:37,960 mis väärtus pea teeb. 595 00:34:37,960 --> 00:34:40,839 Nii ta naaseb esimest või viimane objekt. 596 00:34:40,839 --> 00:34:42,630 Ja siis ma lähen vaadata ei täida. 597 00:34:42,630 --> 00:34:47,340 Ja siis ta ütleb default meetod juht x ja n võrdub 6L. 598 00:34:47,340 --> 00:34:50,620 Nii et see tagasi esimese kuue elemente. 599 00:34:50,620 --> 00:34:55,050 Ja täpselt samamoodi kui te märkate siin, ma ei pidanud täpsustama n võrdub 6. 600 00:34:55,050 --> 00:34:56,840 Vaikimisi kasutab ta kuus, ma arvan. 601 00:34:56,840 --> 00:35:00,130 Ja siis, kui ma tahan täpsustada teatavaid väärtus, siis ma saan vaadata, et hästi. 602 00:35:00,130 --> 00:35:02,970 603 00:35:02,970 --> 00:35:10,592 >> Nii et on mõned lihtsad käsud ja siin on veel üks, mis on Lihtsalt-- hästi, 604 00:35:10,592 --> 00:35:12,550 Ma can-- see on tegelikult veidi keerulisem, 605 00:35:12,550 --> 00:35:17,130 aga see lihtsalt võtab klassi Iga veeru vikerkesta andmebaasil. 606 00:35:17,130 --> 00:35:20,910 Nii et see näitab teile, mida kõik need veerud on seoses nende tüübid. 607 00:35:20,910 --> 00:35:23,665 Nii sepal pikkus on numbriline, sepal laius on numbriline. 608 00:35:23,665 --> 00:35:26,540 Kõik need väärtused on lihtsalt numbrilist sest sa ei saa öelda selle andmed 609 00:35:26,540 --> 00:35:29,440 struktureerida need on kõik läheb numbriline. 610 00:35:29,440 --> 00:35:34,310 >> Ja Liigid veerus saab olema tegur. 611 00:35:34,310 --> 00:35:37,270 Nii normaalselt, siis võiks arvata, et see on nagu märgijada. 612 00:35:37,270 --> 00:35:48,830 Aga kui sa lihtsalt ei irisSpecies, ja siis ma teen head 5 613 00:35:48,830 --> 00:35:51,820 ja see saab printida välja esimese viie väärtusi. 614 00:35:51,820 --> 00:35:54,150 >> Ja siis märkate seda taset. 615 00:35:54,150 --> 00:35:58,870 Nii et see on saying-- see on R tee võttes kategooriline muutujaid. 616 00:35:58,870 --> 00:36:03,765 Nii et selle asemel, et lihtsalt võttes tähemärke, 617 00:36:03,765 --> 00:36:06,740 see on tase, täpsustades mis need asjad on. 618 00:36:06,740 --> 00:36:12,450 >> Ütleme irisSpecies 1. 619 00:36:12,450 --> 00:36:17,690 Nii et mida sa teha tahad on siin ma olen Alamkogumi Selle liigi veerus. 620 00:36:17,690 --> 00:36:21,480 Nii et see võtab Liigid veerus ning seejärel 621 00:36:21,480 --> 00:36:23,820 see indeksid saada esimene element. 622 00:36:23,820 --> 00:36:27,140 Nii et see peaks andma sulle setosa. 623 00:36:27,140 --> 00:36:28,710 Ja see annab teile tase siin. 624 00:36:28,710 --> 00:36:32,812 >> Nii saab ka võrrelda see märk setosa 625 00:36:32,812 --> 00:36:34,645 ja see ei kavatse et olla tõsi, sest üks 626 00:36:34,645 --> 00:36:37,940 on teist liiki kui teine. 627 00:36:37,940 --> 00:36:40,590 Või ma arvan, et see on tõsi, sest R on nutikam kui see. 628 00:36:40,590 --> 00:36:45,420 Ja tundub selles ja seejärel ütleb, äkki on see, mida sa tahad. 629 00:36:45,420 --> 00:36:51,860 Nii see läheb öelda iseloomu string setosa on sama kui see üks. 630 00:36:51,860 --> 00:37:01,290 Ja siis Samamoodi saab Samuti lihtsalt haarata neid nagu nii edasi. 631 00:37:01,290 --> 00:37:05,580 >> Nii et on lihtsalt mingisugune kiire käske andmebaasil. 632 00:37:05,580 --> 00:37:08,030 Nii et siin on mõned andmed uurimist. 633 00:37:08,030 --> 00:37:11,360 Seega on see veidi kaasatud andmete analüüsi. 634 00:37:11,360 --> 00:37:18,340 Ja see on võetud mõned BootCamp teadus- nähtud Berkeley. 635 00:37:18,340 --> 00:37:20,790 >> Nii raamatukogu võõras. 636 00:37:20,790 --> 00:37:24,880 Nii et ma lähen koormus raamatukogu, mis nimetatakse võõras. 637 00:37:24,880 --> 00:37:32,460 Nii et see läheb mulle read.dta nii arvata, et mul on see andmebaasil. 638 00:37:32,460 --> 00:37:39,000 See on salvestatud praeguse Töökataloogi minu konsooli. 639 00:37:39,000 --> 00:37:42,190 Võtame vaata, mida Töökataloogi on. 640 00:37:42,190 --> 00:37:44,620 >> Nii et siin on minu töö kataloogis. 641 00:37:44,620 --> 00:37:50,040 Ja lugeda dot andmed, see asi, ütleb seda faili 642 00:37:50,040 --> 00:37:54,650 asub andmed kausta Selle jooksvat kataloogi. 643 00:37:54,650 --> 00:38:00,520 Ja read.dta see ei ole Vaikekäsk. 644 00:38:00,520 --> 00:38:02,760 Ma arvan, et laadida seda juba. 645 00:38:02,760 --> 00:38:04,750 Iei eeldada I koormatud seda juba. 646 00:38:04,750 --> 00:38:08,115 >> Aga nii read.dta ei kavatse olema Vaikekäsk. 647 00:38:08,115 --> 00:38:11,550 Ja sellepärast sa lähed on laadida selles raamatukogu package-- 648 00:38:11,550 --> 00:38:14,500 Selle paketi nimega võõras. 649 00:38:14,500 --> 00:38:16,690 Ja kui sul ei ole pakett, ma arvan 650 00:38:16,690 --> 00:38:19,180 välisriikide on üks sisseehitatud ones. 651 00:38:19,180 --> 00:38:31,150 Vastasel korral võite ka teha install.packages 652 00:38:31,150 --> 00:38:33,180 ja see paigaldab paketi. 653 00:38:33,180 --> 00:38:36,878 Ja see annab teile R. Uh, ei. 654 00:38:36,878 --> 00:38:39,830 655 00:38:39,830 --> 00:38:43,140 Ja siis ma lihtsalt lõpetada seda, sest ma juba seda. 656 00:38:43,140 --> 00:38:46,920 >> Aga mis on tõesti tore R on see, et pakettide 657 00:38:46,920 --> 00:38:48,510 Süsteem on väga elegantne. 658 00:38:48,510 --> 00:38:52,470 Kuna see talletada kõik tõesti kenasti teile. 659 00:38:52,470 --> 00:38:59,780 Nii et kui ta läheb salvestada seda ma usun, et see raamatukogu siin. 660 00:38:59,780 --> 00:39:02,390 >> Nii millal soovite paigaldada uus paketid 661 00:39:02,390 --> 00:39:04,980 see on lihtsalt nii lihtne teeme install.packages 662 00:39:04,980 --> 00:39:07,500 ja R õnnestub kõik pakette teile. 663 00:39:07,500 --> 00:39:12,900 Nii et sa ei pea tegema midagi Python, kus teil on väline paketi 664 00:39:12,900 --> 00:39:15,330 juhid nagu paber Anaconda, kus sa oled 665 00:39:15,330 --> 00:39:18,310 doing-- installimist pakettreise väljaspool Python 666 00:39:18,310 --> 00:39:20,940 ja siis proovida neid ise käivitada. 667 00:39:20,940 --> 00:39:22,210 Nii et see on tõesti kena viis. 668 00:39:22,210 --> 00:39:25,590 >> Ja install.packages nõuab internet. 669 00:39:25,590 --> 00:39:31,950 See võtab see server ja hoidlasse 670 00:39:31,950 --> 00:39:33,960 kogub Pakendite nimetatakse CRAN. 671 00:39:33,960 --> 00:39:40,690 Ja saab määrata, millist tüüpi peegel soovite alla laadida pakette. 672 00:39:40,690 --> 00:39:43,420 >> Nii et siin ma võtan seda andmebaasil. 673 00:39:43,420 --> 00:39:46,240 Ma loen seda, kasutades seda funktsiooni. 674 00:39:46,240 --> 00:39:49,360 Nii et lubage mul minna ja teha. 675 00:39:49,360 --> 00:39:52,900 >> Nii Oletame, et sa pead seda andmekogumi 676 00:39:52,900 --> 00:39:55,550 ja sul on absoluutselt ei tea, mis see on. 677 00:39:55,550 --> 00:39:58,560 Ja see tegelikult kerkib üsna sageli tööstuses 678 00:39:58,560 --> 00:40:00,910 kus sa lihtsalt pead neid tonni ja tonni segased lood 679 00:40:00,910 --> 00:40:02,890 ja nad on uskumatult märgistamata. 680 00:40:02,890 --> 00:40:06,380 Nii et siin ma pean seda andmestik ja ma ei tea, 681 00:40:06,380 --> 00:40:08,400 mis see on, et ma olen lihtsalt näitab, et seda kontrollida. 682 00:40:08,400 --> 00:40:10,620 >> Nii et ma lähen tegema, pea ees. 683 00:40:10,620 --> 00:40:14,190 Nii ma kontrollin esimese kuue veerud, mida see andmekogumi on. 684 00:40:14,190 --> 00:40:21,730 Nii et see on riik, pres04 ja seejärel kõik need erinevad omamoodi veergu. 685 00:40:21,730 --> 00:40:25,612 Ja mis on huvitav Siin, ma arvan, et sa 686 00:40:25,612 --> 00:40:27,945 oletan, et see näeb välja nagu mingi valimisi. 687 00:40:27,945 --> 00:40:30,482 688 00:40:30,482 --> 00:40:32,190 Ja ma arvan, et just alates Vaadates faili 689 00:40:32,190 --> 00:40:41,070 nimi see on mingisugune kogumine andmete kohta taotlejatele või valijad 690 00:40:41,070 --> 00:40:44,920 kes hääletasid konkreetse presidendid või president kandidaadid 691 00:40:44,920 --> 00:40:46,550 2004. aasta valimistel. 692 00:40:46,550 --> 00:40:52,920 >> Niisiis on siin väärtusi 1, 2 nii et üks viis hoida 693 00:40:52,920 --> 00:40:56,540 president kandidaadid nende nimed. 694 00:40:56,540 --> 00:40:59,780 Sel juhul tundub nad lihtsalt täisarvu. 695 00:40:59,780 --> 00:41:04,030 Nii 2004 oli Bush versus Kerry ma usun. 696 00:41:04,030 --> 00:41:09,010 Ja nüüd oletame, et sa lihtsalt ei tea kas 1 vastab Bush või 2 697 00:41:09,010 --> 00:41:11,703 vastab Kerry või ja nii edasi ja nii edasi, eks? 698 00:41:11,703 --> 00:41:15,860 >> Ja see on just mulle, üsna levinud probleem. 699 00:41:15,860 --> 00:41:18,230 Mida saate teha sel juhul? 700 00:41:18,230 --> 00:41:20,000 Nii saab vaadata kõiki neid muid asju. 701 00:41:20,000 --> 00:41:22,790 >> riik, Oletan, et see pärineb eri riikides. 702 00:41:22,790 --> 00:41:25,100 partyid, sissetulek. 703 00:41:25,100 --> 00:41:27,710 Vaatame partyid. 704 00:41:27,710 --> 00:41:32,800 Nii et äkki üks asi, mida teha saame, on vaadata iga märkused 705 00:41:32,800 --> 00:41:36,250 mis on partyid Vabariikliku või demokraat või midagi. 706 00:41:36,250 --> 00:41:38,170 Võtame pilk partyid on. 707 00:41:38,170 --> 00:41:41,946 >> Nii et ma lähen dat ja siis ma lähen 708 00:41:41,946 --> 00:41:47,960 seda teha dollari märk operaator, et ma tegin varem 709 00:41:47,960 --> 00:41:50,770 ja see läheb alagrupis et kolonni. 710 00:41:50,770 --> 00:41:57,760 Ja siis ma lähen pea seda 20, lihtsalt et näha, mis see välja näeb. 711 00:41:57,760 --> 00:42:00,170 >> Nii et see on lihtsalt kamp bürood. 712 00:42:00,170 --> 00:42:02,800 Nii teisisõnu, sa pead puuduvad andmed umbes need kutid. 713 00:42:02,800 --> 00:42:08,100 Aga sa ka seda märgata dat partyid on tegur 714 00:42:08,100 --> 00:42:10,030 nii et see annab teile erinevatesse kategooriatesse. 715 00:42:10,030 --> 00:42:14,170 Nii teisisõnu partyid võib võtta Demokraat vabariiklaste, Independent, 716 00:42:14,170 --> 00:42:16,640 või midagi muud. 717 00:42:16,640 --> 00:42:23,940 >> Nii lähme edasi ja olgem vaata milline neist on-- oh, OK. 718 00:42:23,940 --> 00:42:28,480 Nii et ma lähen alamhulk et partyid ja seejärel 719 00:42:28,480 --> 00:42:32,780 vaadata, millised on Demokraat, näiteks. 720 00:42:32,780 --> 00:42:37,150 See läheb teile Loogiline, suur Loogiline on TRUEs ja falses. 721 00:42:37,150 --> 00:42:41,630 >> Ja nüüd oletame, et ma tahan et alagrupis need kutid. 722 00:42:41,630 --> 00:42:47,260 Nii et see läheb võtan dat ja alagrupis kumb märkused 723 00:42:47,260 --> 00:42:48,910 on partyid võrdsete võrdne demokraat. 724 00:42:48,910 --> 00:42:52,830 725 00:42:52,830 --> 00:42:55,180 Ja see on üsna pikk, sest seal on nii palju neid. 726 00:42:55,180 --> 00:42:59,060 Nüüd ma lähen pea seda 20. 727 00:42:59,060 --> 00:43:05,690 728 00:43:05,690 --> 00:43:11,270 >> Ja kui te märkate, võrdub võrdsete Huvitav on see, et sa oled 729 00:43:11,270 --> 00:43:13,250 already-- sa oled ka kaasa bürood. 730 00:43:13,250 --> 00:43:19,010 Nii et kui sa ikka ei saa mis tahes teavet, sest nüüd on bürood 731 00:43:19,010 --> 00:43:22,650 ja tahad lihtsalt näha, mis tähelepanek vastavad demokraat 732 00:43:22,650 --> 00:43:24,670 ja mitte nende kadunud väärtusi ise. 733 00:43:24,670 --> 00:43:27,680 Niisiis, kuidas sa vabaneda need bürood? 734 00:43:27,680 --> 00:43:36,410 >> Nii et siin ma lihtsalt kasutades klahvi minu kursor ja seejärel öeldes ringi liikudes. 735 00:43:36,410 --> 00:43:39,778 Ja siis siin ma lihtsalt öelda is.na datpartyid. 736 00:43:39,778 --> 00:43:48,970 737 00:43:48,970 --> 00:43:52,720 Nii et see ja ja võtab kaks erinevat Boolean vektorid 738 00:43:52,720 --> 00:43:57,160 ja öelda, et see saab olema Õige ja vale näiteks. 739 00:43:57,160 --> 00:43:59,190 Nii see läheb seda osa tark. 740 00:43:59,190 --> 00:44:02,910 Nii et siin ma räägin take andmestikus, alamhulk 741 00:44:02,910 --> 00:44:10,170 need, mis vastavad demokraat, ja eemaldage neist, kes ei ole NA. 742 00:44:10,170 --> 00:44:13,540 >> Nii et see will-- peaks anna sulle midagi. 743 00:44:13,540 --> 00:44:16,540 744 00:44:16,540 --> 00:44:17,600 Vaatame is.na. 745 00:44:17,600 --> 00:44:24,670 746 00:44:24,670 --> 00:44:27,690 Proovime is.na datpartyid. 747 00:44:27,690 --> 00:44:36,290 748 00:44:36,290 --> 00:44:45,290 Ja see peaks andma sina-- sorry-- lihtsalt Boole'i ​​vektori. 749 00:44:45,290 --> 00:44:49,260 Ja siis, sest see on nii pikk, Ma lähen alagrupis 20. 750 00:44:49,260 --> 00:44:49,760 OK. 751 00:44:49,760 --> 00:44:51,570 Nii et see peaks toimima. 752 00:44:51,570 --> 00:44:54,700 >> Ja see üks ka TRUEs. 753 00:44:54,700 --> 00:45:01,830 Ah, nii et minu viga on see, et I'm-- I kasutada C ++ ja R vaheldumisi nii teen 754 00:45:01,830 --> 00:45:03,590 see viga kogu aeg. 755 00:45:03,590 --> 00:45:05,807 Ja operaator tegelikult soovid. 756 00:45:05,807 --> 00:45:08,140 Sa ei taha kasutada kahte ampersandid, vaid ühekordne. 757 00:45:08,140 --> 00:45:14,970 758 00:45:14,970 --> 00:45:17,010 OK. 759 00:45:17,010 --> 00:45:18,140 >> Vaatame. 760 00:45:18,140 --> 00:45:20,930 761 00:45:20,930 --> 00:45:23,920 Nii et me subsetted kuni partyid kus nad demokraat 762 00:45:23,920 --> 00:45:25,300 ja nad ei kadunud väärtusi. 763 00:45:25,300 --> 00:45:27,690 Ja nüüd vaatame millised nad hääletasid. 764 00:45:27,690 --> 00:45:31,530 Seega tundub, nagu enamik neist hääletasid 1. 765 00:45:31,530 --> 00:45:36,090 Nii et ma lähen edasi minna ja öelda, et on Kerry. 766 00:45:36,090 --> 00:45:39,507 >> Ja Samamoodi saab minna ka vabariiklaste 767 00:45:39,507 --> 00:45:41,090 ja loodetavasti see peaks andma sulle 2. 768 00:45:41,090 --> 00:45:49,730 769 00:45:49,730 --> 00:45:51,770 See on lihtsalt hunnik erinevaid veerge. 770 00:45:51,770 --> 00:45:53,070 Ja tõepoolest, see on 2. 771 00:45:53,070 --> 00:45:55,750 Nii partyid kõik vabariiklaste, enamik neist hääletavad 2. 772 00:45:55,750 --> 00:45:58,390 >> Nii tundub, just vaadates seda, 773 00:45:58,390 --> 00:46:00,600 Vabariikliku saab olema very-- või partyid 774 00:46:00,600 --> 00:46:02,790 saab olema väga suur faktor, 775 00:46:02,790 --> 00:46:05,420 mis kandidaat nad läheb hääletama. 776 00:46:05,420 --> 00:46:07,120 Ja see on ilmselt tõsi üldiselt. 777 00:46:07,120 --> 00:46:10,139 Ja see vastab teie intuitsiooni, muidugi. 778 00:46:10,139 --> 00:46:11,930 Nii tundub, nagu ma olen aeg otsa nii 779 00:46:11,930 --> 00:46:17,040 Lubage mul peaks edasi minna ja näidata mõned kiired pildid. 780 00:46:17,040 --> 00:46:21,120 Nii et siin on midagi, mis on veidi keerulisem visualiseerimine. 781 00:46:21,120 --> 00:46:26,450 Nii sel juhul on see väga lihtne analüüs just checking mida 782 00:46:26,450 --> 00:46:28,500 President '04 on. 783 00:46:28,500 --> 00:46:33,920 >> Nii et kui oletame, et teil tahtsin sellele küsimusele vastata. 784 00:46:33,920 --> 00:46:38,540 Olgu, oletame, tahtsime teada hääletamise käitumise 2004 president valimised 785 00:46:38,540 --> 00:46:41,170 ja kuidas see erineb võistlus. 786 00:46:41,170 --> 00:46:44,380 Nii et mitte ainult sa tahad vaata hääletanud, 787 00:46:44,380 --> 00:46:47,860 kuid soovid alagrupis iga rassi ja omamoodi kokkuvõtte sellest. 788 00:46:47,860 --> 00:46:50,770 Ja saab ainult öelda see keeruline märke 789 00:46:50,770 --> 00:46:52,580 et see on omamoodi saada udune. 790 00:46:52,580 --> 00:46:56,390 >> Nii et üks rohkem arenenud R pakette, mis on ka omamoodi viimastel 791 00:46:56,390 --> 00:47:00,070 nimetatakse dplyr. 792 00:47:00,070 --> 00:47:03,060 Seega on see üks siin. 793 00:47:03,060 --> 00:47:08,080 Ja ggg-- ggplot2 on lihtsalt kena viisiks parem visualiseerimine 794 00:47:08,080 --> 00:47:09,400 kui sisseehitatud üks. 795 00:47:09,400 --> 00:47:11,108 >> Nii et ma lähen laadida Nende kahe raamatukogud. 796 00:47:11,108 --> 00:47:13,200 797 00:47:13,200 --> 00:47:16,950 Ja siis ma lähen käia ja käivitada käsk. 798 00:47:16,950 --> 00:47:19,050 Sa võid käsitleda seda musta kasti. 799 00:47:19,050 --> 00:47:23,460 >> Mis juhtub on see, et toru operaator möödub käesoleva argument 800 00:47:23,460 --> 00:47:24,110 arvesse siit. 801 00:47:24,110 --> 00:47:28,070 Nii et ma räägin rühma dat rassi ja seejärel president 04. 802 00:47:28,070 --> 00:47:31,530 Ja seejärel, kõik need teised käsud on filtreerimine ning seejärel tehakse kokkuvõte 803 00:47:31,530 --> 00:47:34,081 kui ma teen arvu ja siis ma joonestamist siit. 804 00:47:34,081 --> 00:47:39,980 805 00:47:39,980 --> 00:47:42,500 OK cool. 806 00:47:42,500 --> 00:47:44,620 Nii lähme edasi ja näha, mida see välja näeb. 807 00:47:44,620 --> 00:47:52,280 808 00:47:52,280 --> 00:47:57,290 >> Mis juhtub on see, et ma lihtsalt joonistatakse iga võistlused ja seejärel 809 00:47:57,290 --> 00:47:59,670 millised nad hääletasid. 810 00:47:59,670 --> 00:48:03,492 Ja nende kahe erineva väärtused vastavad 2 ja 1. 811 00:48:03,492 --> 00:48:05,325 Kui sa tahad olla rohkem elegantne, saate ka 812 00:48:05,325 --> 00:48:11,770 lihtsalt täpsustada, et 2 on Kerry-- või 2 on Bush, ja siis 1 on Kerry. 813 00:48:11,770 --> 00:48:13,700 Ja sa võid ka et oma legend. 814 00:48:13,700 --> 00:48:17,410 >> Ja saab ka jagada neid baar graafikud. 815 00:48:17,410 --> 00:48:19,480 Sest üks asi on et kui te märkate, 816 00:48:19,480 --> 00:48:24,560 see ei ole väga lihtne kindlaks millist neist kahest väärtusest suurem. 817 00:48:24,560 --> 00:48:27,920 Nii et üks asi, mida tahaks teha on seda sinise ala 818 00:48:27,920 --> 00:48:31,855 ja lihtsalt liiguta seda siin siis saab võrrelda neid kahte kõrvuti. 819 00:48:31,855 --> 00:48:34,480 Ja ma arvan, et midagi, mida ma ei ole aega seda teha just nüüd, 820 00:48:34,480 --> 00:48:36,660 kuid see on ka väga lihtne teha. 821 00:48:36,660 --> 00:48:40,310 Sa võid uurida mees lehekülge ggplot. 822 00:48:40,310 --> 00:48:47,170 Nii saate lihtsalt ei ggplot nagu seda ja lugeda sellesse mees lehel. 823 00:48:47,170 --> 00:48:51,920 >> Lubage mul kiiresti näitan sulle mõned lahedaid asju. 824 00:48:51,920 --> 00:48:57,610 Lähme edasi ja minna mina-- lihtsalt kohaldamise masin õppe. 825 00:48:57,610 --> 00:49:02,450 Ütleme, et meil on need kolm pakette nii et ma lähen laadida neid. 826 00:49:02,450 --> 00:49:05,500 827 00:49:05,500 --> 00:49:09,170 Nii see lihtsalt trükib välja mõned teavet pärast I laaditud asi. 828 00:49:09,170 --> 00:49:15,220 Nii et ma ütlen seda read.csv, Selle andmekogumi ja nüüd 829 00:49:15,220 --> 00:49:18,940 Ma lähen edasi minna ja otsida ja näha, mis on sees see andmebaasil. 830 00:49:18,940 --> 00:49:22,080 >> Nii et esimese 20 tähelepanekuid. 831 00:49:22,080 --> 00:49:27,190 Nii et ma lihtsalt X1, X2, ja Y. Seega Tundub nagu hunnik neid väärtusi 832 00:49:27,190 --> 00:49:31,640 on vahemikus võibolla 20-80 või nii. 833 00:49:31,640 --> 00:49:37,700 Ja siis samamoodi X2 ja seejärel Käesoleva Y tundub olevat etiketid 0 ja 1. 834 00:49:37,700 --> 00:49:49,500 >> Et selles veenduda, suudan lihtsalt ei koondandmed X1. 835 00:49:49,500 --> 00:49:51,660 Ja siis samamoodi kõik need teised veerud. 836 00:49:51,660 --> 00:49:55,300 Nii kokkuvõte on kiire viis lihtsalt näitab teile kiire väärtusi. 837 00:49:55,300 --> 00:49:56,330 Oh, vabandust. 838 00:49:56,330 --> 00:49:58,440 See üks peaks olema Y. 839 00:49:58,440 --> 00:50:03,420 >> Nii et antud juhul annab kvantiilid, mediaani, maxes samuti. 840 00:50:03,420 --> 00:50:07,130 Sel juhul dataY, näete et see on lihtsalt saab olema 0 ja 1. 841 00:50:07,130 --> 00:50:10,100 Ka keskmine ütleb 0,6, tähendab lihtsalt, et see 842 00:50:10,100 --> 00:50:13,380 Tundub, nagu mul on rohkem 1s kui 0.. 843 00:50:13,380 --> 00:50:16,160 >> Nii et lubage mul minna ja näidata teile, mida see välja näeb. 844 00:50:16,160 --> 00:50:17,470 Nii et ma lähen lihtsalt joonistada seda. 845 00:50:17,470 --> 00:50:22,852 846 00:50:22,852 --> 00:50:24,636 Vaatame, kuidas selge see. 847 00:50:24,636 --> 00:50:30,492 848 00:50:30,492 --> 00:50:31,468 Oh OK. 849 00:50:31,468 --> 00:50:35,840 850 00:50:35,840 --> 00:50:36,340 OK. 851 00:50:36,340 --> 00:50:37,590 >> Nii et see on see, mida ta välja näeb. 852 00:50:37,590 --> 00:50:46,310 Nii tundub, nagu kollased määratletud I kui 0 ja seejärel punane I täpsustada 1s. 853 00:50:46,310 --> 00:50:52,190 Nii et siin tundub label punkte ja see 854 00:50:52,190 --> 00:50:56,410 Tundub nagu sa tahtsid mõned omamoodi klastrite selle kohta. 855 00:50:56,410 --> 00:51:01,020 >> Ja lubage mul minna ja näidata mõned neist sisseehitatud funktsioone. 856 00:51:01,020 --> 00:51:03,580 Nii et siin on lm. 857 00:51:03,580 --> 00:51:06,060 Nii et see on lihtsalt üritan sobitada liin sellele. 858 00:51:06,060 --> 00:51:08,640 Mis on parim viis et ma ei sobi line sellised 859 00:51:08,640 --> 00:51:14,020 et see parim eraldamiseks selline rühmitamine. 860 00:51:14,020 --> 00:51:21,790 Ja ideaalis, saate näha et ma lihtsalt käivitada kõik need käsud 861 00:51:21,790 --> 00:51:25,450 ja siis, ma lähen käia ja lisada rida. 862 00:51:25,450 --> 00:51:28,970 >> Nii et see tundub parim oletus. 863 00:51:28,970 --> 00:51:34,150 See võtab parim, mis minimeerib viga püüdnud sobitada seda joont. 864 00:51:34,150 --> 00:51:40,000 Ilmselt see näeb välja selline hea, kuid see ei ole parim. 865 00:51:40,000 --> 00:51:43,130 Ja lineaarne mudelites, Üldiselt ei kavatse olla 866 00:51:43,130 --> 00:51:46,811 tõesti suurepärane teooria ja justkui Hoone põhialuste masin 867 00:51:46,811 --> 00:51:47,310 õppimine. 868 00:51:47,310 --> 00:51:50,330 Kuid praktikas, sa lähed tahad midagi üldisemat. 869 00:51:50,330 --> 00:51:54,280 >> Nii saab lihtsalt proovida töötab midagi nimetatakse närvivõrk. 870 00:51:54,280 --> 00:51:57,110 Need asjad on üha rohkem levinud. 871 00:51:57,110 --> 00:52:00,530 Ja nad lihtsalt tööd fantastiliselt Suurte andmekogumite. 872 00:52:00,530 --> 00:52:07,080 Nii et kui me ainult have-- olgem see-- meil nrow. 873 00:52:07,080 --> 00:52:09,010 Nii nrow on lihtsalt öeldes ridade arv. 874 00:52:09,010 --> 00:52:11,790 Nii et kui ma on 100 märkused. 875 00:52:11,790 --> 00:52:15,010 >> Nii et lubage mul minna ja teha Närvivõrgus. 876 00:52:15,010 --> 00:52:18,620 Nii et see on tõesti kena sest ma lihtsalt öelda nnet 877 00:52:18,620 --> 00:52:21,767 ja siis ma halvenema Y. Nii Y on selles veerus. 878 00:52:21,767 --> 00:52:23,850 Ja siis halvenema seda teised kaks muutujad. 879 00:52:23,850 --> 00:52:27,360 Nii et see on lühem märke X1 ja X2. 880 00:52:27,360 --> 00:52:29,741 >> Nii lähme edasi ja käivitada. 881 00:52:29,741 --> 00:52:30,240 Oh, vabandust. 882 00:52:30,240 --> 00:52:32,260 Mul on vaja sõita kogu see asi. 883 00:52:32,260 --> 00:52:37,500 Ja see on lihtsalt printimisel märke kuidas kiiresti või mitte kiiresti ta 884 00:52:37,500 --> 00:52:38,460 ühtlustunud. 885 00:52:38,460 --> 00:52:41,420 Nii tundub, et see ei lähenenud. 886 00:52:41,420 --> 00:52:44,970 Nii et lubage mul minna ja print saada, mis see välja näeb. 887 00:52:44,970 --> 00:52:51,260 >> Vaata siin on pilt ja siin on kontuuri, mis näitab, kui hästi see sobib. 888 00:52:51,260 --> 00:52:56,380 Ja see on Lihtsalt-- näed see, et see on väga, väga tore. 889 00:52:56,380 --> 00:52:59,400 Võib ka overfitting, kuid võite ka 890 00:52:59,400 --> 00:53:03,390 moodustavad käesoleva teiste tehnikaid nagu ristkontrolli. 891 00:53:03,390 --> 00:53:06,180 Ja need on ka ehitatud R. 892 00:53:06,180 --> 00:53:09,170 >> Ja las ma näitan sulle toetada vektor masin. 893 00:53:09,170 --> 00:53:12,470 See on üks väga sage tehnikat masin õppe. 894 00:53:12,470 --> 00:53:18,550 See on väga sarnane lineaarne mudelid, kuid ta kasutab, mida nimetatakse tuuma meetod. 895 00:53:18,550 --> 00:53:22,790 Ja vaatame, kui hästi, et ei. 896 00:53:22,790 --> 00:53:26,430 Nii see on väga sarnane sellele, kuidas hästi Närvivõrgus täidab, 897 00:53:26,430 --> 00:53:27,900 kuid see on palju sujuvam. 898 00:53:27,900 --> 00:53:35,740 Ja see põhineb off kohta what-- kuidas SVMs tööd. 899 00:53:35,740 --> 00:53:40,250 >> Nii et see on lihtsalt väga põgus ülevaade 900 00:53:40,250 --> 00:53:43,822 on sisseehitatud funktsioone, mida saate teha ja ka mõned andmete uurimine. 901 00:53:43,822 --> 00:53:45,905 Lubage mul minna ja minna tagasi slaidid. 902 00:53:45,905 --> 00:53:50,290 903 00:53:50,290 --> 00:53:53,670 >> Nii on see ilmselt ei ole väga põhjalik. 904 00:53:53,670 --> 00:53:57,140 Ja see on tõesti lihtsalt teaser näitab sulle, mida sa tõesti teha R. 905 00:53:57,140 --> 00:53:59,100 Nii et kui sa tahaks lihtsalt nagu rohkem teada saada, siin 906 00:53:59,100 --> 00:54:01,210 on hunnik erinevaid ressursse. 907 00:54:01,210 --> 00:54:06,890 >> Seega, kui olete kiindunud õpikuid või olete lihtsalt armastavad lugemist asju online, 908 00:54:06,890 --> 00:54:09,670 siis see on fantastiline ükshaaval Hadley Wickham, 909 00:54:09,670 --> 00:54:13,010 kes lõi ka kõik need väga lahe pakette. 910 00:54:13,010 --> 00:54:17,420 Kui oled kiindunud videote, siis Berkeley on awesome BootCamp 911 00:54:17,420 --> 00:54:21,060 see on several--, et on selline pikk. 912 00:54:21,060 --> 00:54:24,210 Ja see õpetab teile peaaegu kõike, mida tahaks teada R. 913 00:54:24,210 --> 00:54:27,770 >> Ja täpselt samamoodi, seal on Codeacademy ja kõik need muud tüüpi 914 00:54:27,770 --> 00:54:29,414 interaktiivse veebilehed. 915 00:54:29,414 --> 00:54:31,580 Nad on ka saada common-- üha tavalisemaks. 916 00:54:31,580 --> 00:54:33,749 Seega on see väga sarnane Codeacademy. 917 00:54:33,749 --> 00:54:35,790 Ja lõpuks, kui sa just soovite ühenduse ja aidata, 918 00:54:35,790 --> 00:54:38,800 need on kamp asju saab minna. 919 00:54:38,800 --> 00:54:40,880 Ilmselt on meil veel kasuta meililistides, vaid 920 00:54:40,880 --> 00:54:44,860 nagu peaaegu iga teine programmeerimiskeelt kogukonnas. 921 00:54:44,860 --> 00:54:47,880 Ja #rstats, see on meie kogukonnas Twitter. 922 00:54:47,880 --> 00:54:49,580 See on tegelikult üsna tavaline. 923 00:54:49,580 --> 00:54:50,850 Ja siis kasutaja! 924 00:54:50,850 --> 00:54:52,340 Kas just meie konverentsi. 925 00:54:52,340 --> 00:54:55,390 >> Ja siis muidugi, saate kasutada kõik need muud küsimused ja asju, 926 00:54:55,390 --> 00:54:57,680 nagu Stack ülevoolu Google ja seejärel github. 927 00:54:57,680 --> 00:55:00,490 Kuna enamik neist paketid ja palju kogukonna 928 00:55:00,490 --> 00:55:03,420 koonduks arendamisel kood, sest see on avatud lähtekoodiga. 929 00:55:03,420 --> 00:55:05,856 Ja see on lihtsalt tore on github. 930 00:55:05,856 --> 00:55:08,730 Ja lõpuks, saate minuga, kui sa lihtsalt mingit kiiret küsimust. 931 00:55:08,730 --> 00:55:13,530 Nii võid leida mind vidistama siin minu kodulehel ja lihtsalt minu e-posti. 932 00:55:13,530 --> 00:55:17,840 Loodetavasti, mis oli midagi-- vaid lühikese teaser 933 00:55:17,840 --> 00:55:20,900 mida R ei ole tegelikult võimeline seda. 934 00:55:20,900 --> 00:55:23,990 Ja loodetavasti sa lihtsalt vaadake neid kolme lingid 935 00:55:23,990 --> 00:55:25,760 ja vaata, mida saate teha rohkem. 936 00:55:25,760 --> 00:55:28,130 Ja ma arvan, et see on just see. 937 00:55:28,130 --> 00:55:28,630 Aitäh. 938 00:55:28,630 --> 00:55:30,780 >> [APPLAUSE] 939 00:55:30,780 --> 00:55:31,968