1 00:00:00,000 --> 00:00:00,750 2 00:00:00,750 --> 00:00:09,800 >> [Musiikki soi] 3 00:00:09,800 --> 00:00:13,014 4 00:00:13,014 --> 00:00:13,680 DUSTIN TRAN: Hei. 5 00:00:13,680 --> 00:00:14,980 Nimeni on Dustin. 6 00:00:14,980 --> 00:00:18,419 Joten minä esittelen Data Analysis in R. 7 00:00:18,419 --> 00:00:19,710 Vain vähän itsestäni. 8 00:00:19,710 --> 00:00:24,320 Olen tällä hetkellä jatko-opiskelija Engineering ja ammattikorkeakoulussa. 9 00:00:24,320 --> 00:00:28,330 Opiskelen risteyksessä koneoppimisen ja tilastot 10 00:00:28,330 --> 00:00:31,375 joten Data Analysis R on todella perustavanlaatuinen mitä 11 00:00:31,375 --> 00:00:33,790 Teen päivittäin. 12 00:00:33,790 --> 00:00:35,710 >> Ja R on erityisen hyvä tietojen analysointi 13 00:00:35,710 --> 00:00:39,310 koska se on erittäin hyvä prototyyppien. 14 00:00:39,310 --> 00:00:43,590 Ja yleensä, kun olet tekemässä jonkinlaista data-analyysi, paljon ongelmia 15 00:00:43,590 --> 00:00:44,920 ovat menossa kognitiivinen. 16 00:00:44,920 --> 00:00:48,700 Ja niin haluat vain olla joitakin todella hyviä kieltä, 17 00:00:48,700 --> 00:00:53,770 on vain hyvä tehdä sisäänrakennettuja toimintoja, toisin 18 00:00:53,770 --> 00:00:57,430 ja ottaa käsitellä alhainen asioita. 19 00:00:57,430 --> 00:01:01,040 Joten alussa, olen juuri menossa esitellä mitä on R, miksi 20 00:01:01,040 --> 00:01:04,540 haluat käyttää sitä, ja sitten mennä yli johonkin demo, 21 00:01:04,540 --> 00:01:07,060 ja vain mennä sieltä. 22 00:01:07,060 --> 00:01:08,150 >> Joten mikä on R? 23 00:01:08,150 --> 00:01:11,180 R on vain kieli kehittyi tilastollisiin computing 24 00:01:11,180 --> 00:01:12,450 ja visualisointi. 25 00:01:12,450 --> 00:01:16,000 Joten mitä tämä tarkoittaa, että se on erittäin hyvä kieli 26 00:01:16,000 --> 00:01:22,400 tahansa sellainen asia, joka käsittelee epävarmuuden tai tietojen visualisointia. 27 00:01:22,400 --> 00:01:24,850 Joten sinulla on kaikki nämä jakaumat. 28 00:01:24,850 --> 00:01:27,140 Siellä aiotaan sisäänrakennettuja toimintoja. 29 00:01:27,140 --> 00:01:31,650 Sinulla on myös erinomainen piirtämistä paketteja. 30 00:01:31,650 --> 00:01:34,110 >> Python on kilpaileva Kieli tietojen. 31 00:01:34,110 --> 00:01:40,020 Ja yksi asia, että pidän, että R on paljon parempi on visualisointi. 32 00:01:40,020 --> 00:01:45,200 Joten mitä näet demo kuin hyvin on vain hyvin intuitiivinen kieli 33 00:01:45,200 --> 00:01:48,050 että vain toimii erittäin hyvin. 34 00:01:48,050 --> 00:01:53,140 Se on myös ilmainen ja avoimen lähdekoodin, kuten on muita hyviä kielen luulisin. 35 00:01:53,140 --> 00:01:55,440 >> Ja tässä, nippu vain avainsanoja heitetään sinua. 36 00:01:55,440 --> 00:02:00,450 Se on dynaaminen, eli jos sinulla on tietyntyyppiset määritetty objekti 37 00:02:00,450 --> 00:02:02,025 kuin se täytyy vain muuttaa sitä lennossa. 38 00:02:02,025 --> 00:02:05,670 Se on laiska, joten se on fiksu miten se laskelmat. 39 00:02:05,670 --> 00:02:12,250 Toiminnallinen jolloin sitä voi todella toimia perustuu pois toimintoja niin anything-- 40 00:02:12,250 --> 00:02:16,910 minkäänlaista manipulaatiota olet teet, se perustuu pois toiminnot. 41 00:02:16,910 --> 00:02:20,162 >> Joten binary operaattoreille, esimerkiksi, ovat vain luonnostaan ​​toimintoja. 42 00:02:20,162 --> 00:02:21,870 Ja kaiken, aiot tehdä, on 43 00:02:21,870 --> 00:02:24,690 aiotaan ajaa pois toiminnot itse. 44 00:02:24,690 --> 00:02:27,140 Ja sitten olio samoin. 45 00:02:27,140 --> 00:02:30,930 >> Joten tässä on XKCD juoni. 46 00:02:30,930 --> 00:02:34,350 Ei vain koska minusta tuntuu XKCD on olennainen minkäänlaista 47 00:02:34,350 --> 00:02:37,770 Esityksen, mutta koska Minusta tuntuu tämä todella 48 00:02:37,770 --> 00:02:42,160 vasarat pisteeseen, että paljon kun teet jonkinlainen tietojen 49 00:02:42,160 --> 00:02:46,570 analyysi, ongelma ei ole niin paljon, kuinka nopeasti se kulkee, 50 00:02:46,570 --> 00:02:49,850 mutta kuinka kauan se tulee vie ohjelmoida tehtävään. 51 00:02:49,850 --> 00:02:54,112 Joten tässä on vain analysoida, onko strategia tai b on tehokkaampaa. 52 00:02:54,112 --> 00:02:55,820 Tämä tulee olemaan jotain, että olet 53 00:02:55,820 --> 00:02:58,290 aikovat käsitellä paljon in eräänlainen matalan tason kielillä 54 00:02:58,290 --> 00:03:03,440 missä olet tekemisissä seg viat, muistin jakamista, alustukset, 55 00:03:03,440 --> 00:03:05,270 jopa tehdä sisäänrakennettuja toimintoja. 56 00:03:05,270 --> 00:03:09,920 Ja tätä tavaraa on kaikki hoidetaan hyvin, hyvin tyylikkäästi R. 57 00:03:09,920 --> 00:03:12,839 >> Joten vain vasaraan tähän piste, suurin pullonkaula 58 00:03:12,839 --> 00:03:13,880 tulee olemaan kognitiivisia. 59 00:03:13,880 --> 00:03:17,341 Joten tietojen analysointi on erittäin kova ongelma. 60 00:03:17,341 --> 00:03:19,340 Olitpa tekemässä koneoppimisen tai olet 61 00:03:19,340 --> 00:03:22,550 tekee vain jonkinlainen perustiedot etsintä, 62 00:03:22,550 --> 00:03:25,290 et halua olla ottaa asiakirja 63 00:03:25,290 --> 00:03:27,440 ja sitten koota jotain aina 64 00:03:27,440 --> 00:03:31,010 halua nähdä, mitä sarake näyttää, mitä erityisesti merkinnät matriisi 65 00:03:31,010 --> 00:03:32,195 näyttää. 66 00:03:32,195 --> 00:03:34,320 Joten haluat vain olla joitakin todella mukava käyttöliittymä 67 00:03:34,320 --> 00:03:37,740 voit suorittaa yksinkertainen funktio että indeksit tahansa 68 00:03:37,740 --> 00:03:41,870 haluat ja vain ajaa sen sieltä. 69 00:03:41,870 --> 00:03:44,190 Ja tarvitset verkkotunnuksen tiettyjä kieliä tähän. 70 00:03:44,190 --> 00:03:51,750 Ja R todella auttaa sinua määrittelemään ongelma ja ratkaista se tällä tavalla. 71 00:03:51,750 --> 00:03:58,690 >> Joten tässä on käyrä, ohjelmointi suosio R se on mennyt ajan. 72 00:03:58,690 --> 00:04:04,060 Joten kuten näette, kuten 2013 tai niin se vain räjäytettiin valtavasti. 73 00:04:04,060 --> 00:04:09,570 Ja tämä on ollut juuri siksi, että valtava kehitys teknologiateollisuudessa 74 00:04:09,570 --> 00:04:10,590 noin iso data. 75 00:04:10,590 --> 00:04:13,010 Lisäksi ei vain teknologia teollisuus, mutta oikeastaan 76 00:04:13,010 --> 00:04:16,490 kaikki teollisuus that-- koska paljon teollisuuden 77 00:04:16,490 --> 00:04:20,589 ovat tavallaan olennainen yrittää ratkaista näitä ongelmia. 78 00:04:20,589 --> 00:04:24,590 Ja yleensä, sinulla voi olla joitakin hyviä tapa mitata näitä ongelmia 79 00:04:24,590 --> 00:04:29,720 tai jopa määritellään ne tai niiden ratkaiseminen tietojen avulla. 80 00:04:29,720 --> 00:04:35,430 Joten mielestäni nyt R on 11 Suosituin kieli TIOBE 81 00:04:35,430 --> 00:04:38,200 ja se on ollut kasvussa siitä lähtien. 82 00:04:38,200 --> 00:04:40,740 83 00:04:40,740 --> 00:04:43,080 >> Joten tässä on joitakin enemmän piirteitä R. Se on 84 00:04:43,080 --> 00:04:46,900 valtava määrä paketteja ja kaikki nämä eri asioita. 85 00:04:46,900 --> 00:04:52,470 Joten aina, kun on tietty ongelma, useimmat 86 00:04:52,470 --> 00:04:55,060 aika R on että toiminto sinulle. 87 00:04:55,060 --> 00:04:58,520 Joten, haluatko rakentaa jonkinlainen kone 88 00:04:58,520 --> 00:05:02,770 oppiminen algoritmi nimeltään Random Forest tai päätös Puut, 89 00:05:02,770 --> 00:05:07,530 tai edes yrittää ottaa keskiarvo toiminto tai tätä kamaa, 90 00:05:07,530 --> 00:05:10,000 R on, että. 91 00:05:10,000 --> 00:05:14,190 >> Ja jos et välität optimointi, yksi asia, joka on yhteinen 92 00:05:14,190 --> 00:05:17,430 on, että kun olet valmis prototyyppien jonkinlainen korkean tason kieli, 93 00:05:17,430 --> 00:05:19,810 voit heittää että in-- Sinun täytyy vain portti, joka yli 94 00:05:19,810 --> 00:05:21,550 Joidenkin matalan tason kieli. 95 00:05:21,550 --> 00:05:26,090 Mitä hyvää R on, että kun olet tehty prototyyppien se, voit käyttää C ++, 96 00:05:26,090 --> 00:05:29,510 tai Fortran, tai mitä tahansa näiden alemman tason suoraan R. 97 00:05:29,510 --> 00:05:32,320 Niin, että yksi todella mainio ominaisuus noin R, 98 00:05:32,320 --> 00:05:35,930 jos todella välität optimointi piste. 99 00:05:35,930 --> 00:05:39,490 >> Ja se on myös todella hyvä web visualisointeja. 100 00:05:39,490 --> 00:05:43,530 Niin D3.js, esimerkiksi, on Luulen toisessa seminaarissa 101 00:05:43,530 --> 00:05:45,130 että esitimme tänään. 102 00:05:45,130 --> 00:05:48,510 Ja tämä on todella mahtava tekee interaktiivisia visualisointeja. 103 00:05:48,510 --> 00:05:54,460 Ja D3.js oletetaan, että sinulla on jonkinlainen piirrettävä data 104 00:05:54,460 --> 00:05:58,080 ja R on hyvä tapa, että voin tehdä data-analyysi, ennen kuin viet sen 105 00:05:58,080 --> 00:06:04,220 yli D3.js tai jopa vain ajaa D3.js komentoja R itse, 106 00:06:04,220 --> 00:06:08,240 sekä kaikki nämä muiden kirjastojen samoin. 107 00:06:08,240 --> 00:06:13,041 >> Niin että oli vain käyttöönotto mikä on R ja miksi saatat käyttää sitä. 108 00:06:13,041 --> 00:06:14,790 Joten toivottavasti, olen vakuuttunut jotain 109 00:06:14,790 --> 00:06:18,460 noin vain yrittää nähdä, mitä se on. 110 00:06:18,460 --> 00:06:23,930 Joten aion mennä eteenpäin ja käydä läpi Joissakin perustekijöiden noin R esineitä 111 00:06:23,930 --> 00:06:26,150 ja mitä voit todella tehdä. 112 00:06:26,150 --> 00:06:29,690 >> Joten tässä on vain nippu matematiikka komentoja. 113 00:06:29,690 --> 00:06:35,000 Joten sanon you're-- haluat rakentaa kieli itsesi ja haluat vain 114 00:06:35,000 --> 00:06:38,080 on joukko erilaisia ​​työkaluja. 115 00:06:38,080 --> 00:06:42,520 Minkäänlaista toimintaa luulet haluat haluavat aika paljon olemaan R. 116 00:06:42,520 --> 00:06:44,150 >> Joten tässä on 2 plus 2. 117 00:06:44,150 --> 00:06:46,090 Tässä on 2 kertaa pi. 118 00:06:46,090 --> 00:06:51,870 R on joukko sisäänrakennettu vakioita että voit usein käyttää kuten pi, e. 119 00:06:51,870 --> 00:06:56,230 >> Ja sitten, tässä on 7 plus runif, joten runif 1. 120 00:06:56,230 --> 00:07:02,450 Tämä on toiminto, joka on luo yksi satunnainen yhtenäinen 0-1. 121 00:07:02,450 --> 00:07:04,400 Ja sitten on 3 potenssiin 4. 122 00:07:04,400 --> 00:07:06,430 On neliöjuuret. 123 00:07:06,430 --> 00:07:07,270 >> On loki. 124 00:07:07,270 --> 00:07:14,500 Joten kirjautua tekee pohja eksponentiaalinen itsestään. 125 00:07:14,500 --> 00:07:18,337 Ja sitten, jos määrität pohja, sitten voit tehdä mitä pohja haluat. 126 00:07:18,337 --> 00:07:19,920 Ja sitten tässä on joitakin muita komentoja. 127 00:07:19,920 --> 00:07:22,180 Joten sinulla on 23 mod 2. 128 00:07:22,180 --> 00:07:24,910 Sitten on jäljellä. 129 00:07:24,910 --> 00:07:27,110 Sitten on tieteellinen muodossa, jos sinulla on myös 130 00:07:27,110 --> 00:07:34,060 haluavat tehdä vain enemmän ja enemmän monimutkaisia ​​asioita. 131 00:07:34,060 --> 00:07:37,320 >> Joten tässä on tehtävä. 132 00:07:37,320 --> 00:07:40,830 Joten tyypillinen toimeksiannot R tehdään nuoli 133 00:07:40,830 --> 00:07:43,440 niin se on alle ja sitten väliviivaa. 134 00:07:43,440 --> 00:07:47,250 Joten tässä olen vain määrittämällä 3 muuttujan val. 135 00:07:47,250 --> 00:07:50,160 >> Ja sitten olen tulostamalla val ja sitten se tulostaa kolme. 136 00:07:50,160 --> 00:07:53,920 Oletuksena R tulkki, se tulostaa asioita sinulle 137 00:07:53,920 --> 00:07:57,280 joten sinun ei tarvitse määrittää tulostamaan val tahansa haluat tulostaa jotain. 138 00:07:57,280 --> 00:08:00,200 Voit vain tehdä val ja niin se tulee tehdä sinulle. 139 00:08:00,200 --> 00:08:04,380 >> Voit myös käyttää tasavertaisina teknisesti toimeksiantona operaattori. 140 00:08:04,380 --> 00:08:07,190 Vähäisiä vivahteet välillä käyttämällä nuoli 141 00:08:07,190 --> 00:08:10,730 operaattori ja equals operaattorin tehtäviin. 142 00:08:10,730 --> 00:08:15,470 Enimmäkseen Sopimuksen mukaan jokainen vain nuolinäppäimillä operaattori. 143 00:08:15,470 --> 00:08:21,850 >> Ja tässä, olen osoitetaan tämän vino merkintätapa kutsutaan 1 paksusuolen 6. 144 00:08:21,850 --> 00:08:26,010 Tämä luo vektori 1-6. 145 00:08:26,010 --> 00:08:29,350 Ja tämä todella mukavaa, koska silloin juuri määrittää vektorin val 146 00:08:29,350 --> 00:08:34,270 ja joka toimii itsestään. 147 00:08:34,270 --> 00:08:37,799 >> Joten tämä on jo menee single-- hyvin intuitiivinen tiedot 148 00:08:37,799 --> 00:08:41,070 rakenne vain kaksinkertainen tietyntyyppinen tyypin vektoriin 149 00:08:41,070 --> 00:08:45,670 ja joka kerää kaikkia skalaariarvot sinulle. 150 00:08:45,670 --> 00:08:50,770 Joten kun menee skalaari, sinun on R-esineitä ja tämä on vektori. 151 00:08:50,770 --> 00:08:55,610 Vektori on minkäänlaista kokoelma samantyyppisiä. 152 00:08:55,610 --> 00:08:58,150 Joten tässä ovat joukko vektoreita. 153 00:08:58,150 --> 00:08:59,800 >> Joten tämä on numeerinen. 154 00:08:59,800 --> 00:09:02,440 Numerolla on R: n tapa sanoa kaksinkertainen. 155 00:09:02,440 --> 00:09:07,390 Ja niin oletusarvoisesti kaikki numero on kaksinkertainen. 156 00:09:07,390 --> 00:09:13,150 >> Joten jos sinulla on C 1.1, 3, negatiivinen 5.7, c on funktio. 157 00:09:13,150 --> 00:09:16,760 Tämä ketjuttaa kaikki kolme numerot vektoriin. 158 00:09:16,760 --> 00:09:19,619 Ja tämä be-- joten jos huomaat 3 itse, 159 00:09:19,619 --> 00:09:21,910 yleensä otatte että tämä on kuin kokonaisluku, 160 00:09:21,910 --> 00:09:25,050 mutta koska kaikki vektorit ovat samantyyppisiä, 161 00:09:25,050 --> 00:09:28,660 tämä on vektori tuplaa tai numeerinen tässä tapauksessa. 162 00:09:28,660 --> 00:09:34,920 >> rnorm on toiminto, joka tuottaa standardi normaali variables-- 163 00:09:34,920 --> 00:09:36,700 tai standardin normaaliarvot. 164 00:09:36,700 --> 00:09:38,360 Ja olen täsmennetään niistä kaksi. 165 00:09:38,360 --> 00:09:43,840 Joten mulla rnorm 2, osoitetaan, että devs, ja sitten olen tulostamalla devs. 166 00:09:43,840 --> 00:09:47,350 Joten nämä ovat vain kaksi satunnainen normaaliarvot. 167 00:09:47,350 --> 00:09:50,060 >> Ja sitten INTs jos teet välität kokonaislukuja. 168 00:09:50,060 --> 00:09:54,650 Joten tämä on vain noin muisti jakaminen ja tallentaminen muistin koko. 169 00:09:54,650 --> 00:10:01,460 Joten sinun olisi liitettävä numeroita isolla L. 170 00:10:01,460 --> 00:10:04,170 >> Yleensä tämä on R: n historiallinen merkintätapa 171 00:10:04,170 --> 00:10:06,940 jotain kutsutaan pitkän kokonaisluku. 172 00:10:06,940 --> 00:10:09,880 Joten suurimman osan ajasta, luultavasti olla tekemisissä nelinpelin. 173 00:10:09,880 --> 00:10:15,180 Ja jos joskus myöhemmin on optimoida koodia, 174 00:10:15,180 --> 00:10:18,110 voit vain lisätä nämä L's jälkeenpäin tai sen aikana 175 00:10:18,110 --> 00:10:22,280 jos olet kuten ennakoivaa mitä aiot tehdä näitä muuttujia. 176 00:10:22,280 --> 00:10:25,340 177 00:10:25,340 --> 00:10:26,890 >> Joten tässä on merkki vektori. 178 00:10:26,890 --> 00:10:31,440 Joten, jälleen, olen ketjuttamalla kolme jouset tällä kertaa. 179 00:10:31,440 --> 00:10:36,230 Huomaa, että kaksinkertainen jouset ja yksi jouset ovat samat R. 180 00:10:36,230 --> 00:10:41,000 Joten minulla on Arthur ja Marvin ja niin kun olen tulostamalla, ne kaikki 181 00:10:41,000 --> 00:10:43,210 aiomme näyttää kaksinkertainen jouset. 182 00:10:43,210 --> 00:10:45,880 Ja jos haluat myös sisällyttää yhden tai kahden hengen jono 183 00:10:45,880 --> 00:10:50,070 teidän merkkejä, niin voit joko vuorottelevat jousille. 184 00:10:50,070 --> 00:10:53,540 >> Joten Marvinin varten Toinen tekijä, tämä on 185 00:10:53,540 --> 00:10:56,380 menossa show-- sinulle vain kaksinkertainen jouset 186 00:10:56,380 --> 00:10:59,050 ja sitten yksi merkkijono joten tämä on vuorotellen. 187 00:10:59,050 --> 00:11:04,040 Muuten, jos haluat käyttää kaksinkertaista merkkijono operaattori kaksinkertainen string 188 00:11:04,040 --> 00:11:07,090 kun olet julistaa sitten käytät vain paeta operaattori. 189 00:11:07,090 --> 00:11:10,600 Joten et kenoviiva kaksinkertainen string. 190 00:11:10,600 --> 00:11:13,330 >> Ja lopuksi, me myös on looginen vektoreita. 191 00:11:13,330 --> 00:11:15,890 Joten logical-- niin totta ja EPÄTOSI, ja he 192 00:11:15,890 --> 00:11:18,880 olemaan kokonaan isoilla kirjaimilla. 193 00:11:18,880 --> 00:11:22,370 Ja sitten taas, olen ketjuttamalla ne ja sitten määrittämällä ne bools. 194 00:11:22,370 --> 00:11:24,590 Joten bools aikoo näyttää te tosi, epätosi ja tosi. 195 00:11:24,590 --> 00:11:28,280 196 00:11:28,280 --> 00:11:31,620 >> Joten tässä on vektoroitua indeksointi. 197 00:11:31,620 --> 00:11:34,870 Joten alussa, minä Käytän function-- 198 00:11:34,870 --> 00:11:39,230 tätä kutsutaan sequence-- sekvenssi 2-12. 199 00:11:39,230 --> 00:11:42,490 Ja otan sekvenssi 2. 200 00:11:42,490 --> 00:11:46,660 Joten se aikoo tehdä 2, 4, 6, 8, 10 ja 12. 201 00:11:46,660 --> 00:11:50,080 Ja sitten, olen indeksointi saada kolmas elementti. 202 00:11:50,080 --> 00:11:55,770 >> Joten yksi asia pitää mielessä on että R indeksit lähtemällä 1. 203 00:11:55,770 --> 00:12:00,550 Joten Vals 3 aikoo antaa te kolmas elementti. 204 00:12:00,550 --> 00:12:04,580 Tämä on eräänlainen eroaa muista kielillä, jossa se alkaa nollasta. 205 00:12:04,580 --> 00:12:09,780 Joten C tai C ++, esimerkiksi olet menossa neljäs elementti. 206 00:12:09,780 --> 00:12:13,280 >> Ja tässä on Vals 3-5. 207 00:12:13,280 --> 00:12:16,030 Niin yksi asia, joka on todella siistiä on, että 208 00:12:16,030 --> 00:12:20,410 voi tuottaa väliaikaisia ​​muuttujia sisällä ja sitten vain käyttää niitä lennossa. 209 00:12:20,410 --> 00:12:21,960 Joten tässä on 3-5. 210 00:12:21,960 --> 00:12:25,070 Joten olen tuottavan vektorin 3, 4, ja 5 ja sen jälkeen 211 00:12:25,070 --> 00:12:29,700 Olen indeksointi päästä kolmas, Neljäs ja viides elementtejä. 212 00:12:29,700 --> 00:12:32,280 >> Joten Vastaavasti voit abstrakti tämä vain tehdä 213 00:12:32,280 --> 00:12:35,280 minkäänlaista vektorin joka antaa sinulle indeksointi. 214 00:12:35,280 --> 00:12:40,050 Joten tässä on Vals ja sitten ensimmäinen, kolmas ja kuudes elementtejä. 215 00:12:40,050 --> 00:12:42,800 Ja sitten, jos haluat tehdä täydennys, 216 00:12:42,800 --> 00:12:45,210 joten et vain miinus jälkeenpäin ja että saat 217 00:12:45,210 --> 00:12:48,600 antaa sinulle kaiken, joka ei ole Ensimmäinen, kolmas tai kuudes elementti. 218 00:12:48,600 --> 00:12:51,590 Joten tämä on 4, 8, ja 10. 219 00:12:51,590 --> 00:12:54,380 >> Ja jos haluat saada jopa kehittyneempää, 220 00:12:54,380 --> 00:12:57,610 voit kytkeä peräkkäin Boolen vektoreita. 221 00:12:57,610 --> 00:13:05,210 Joten tämä indeksi on menossa antaa teille Tämän Boolen vektori, jonka pituus on 6. 222 00:13:05,210 --> 00:13:07,280 Joten rep TOSI pilkku 3. 223 00:13:07,280 --> 00:13:09,680 Tämä toistaa TOSI kolme kertaa. 224 00:13:09,680 --> 00:13:12,900 Joten tämä antaa sinulle vektori TOSI, TOSI, TOSI. 225 00:13:12,900 --> 00:13:17,470 >> rep FALSE 4-- tämä on menossa antaa teille vektori väärä, väärä, väärä, väärä. 226 00:13:17,470 --> 00:13:21,280 Ja sitten C on menossa liität nämä kaksi Booleans yhdessä. 227 00:13:21,280 --> 00:13:24,090 Joten aiot saada kolme Trues ja sitten neljä FALSEs. 228 00:13:24,090 --> 00:13:28,460 >> Niin, että kun indeksi Vals, olet menossa TOSI, TOSI, TOSI. 229 00:13:28,460 --> 00:13:31,420 Niin että menee kyllä, Haluan näihin kolmeen. 230 00:13:31,420 --> 00:13:33,520 Ja sitten väärä, väärä, Väärä, väärä on menossa 231 00:13:33,520 --> 00:13:37,140 sanoa mitään, en halua näitä tekijöitä joten se ei aio palauttaa ne. 232 00:13:37,140 --> 00:13:41,490 >> Ja kai siellä oikeastaan ​​typo täällä koska tämä sanoo toista TOSI 3 233 00:13:41,490 --> 00:13:47,990 ja toista EPÄTOSI 4, ja teknisesti, voit vain kuusi elementtejä niin jatkuvasti virheellisesti, 234 00:13:47,990 --> 00:13:50,470 sen pitäisi olla jatkuvasti virheellisesti 3. 235 00:13:50,470 --> 00:13:55,260 Mielestäni R on myös fiksu kuten että jos vain määrittää 4 täällä, sitten 236 00:13:55,260 --> 00:13:56,630 se ei edes virhe ulos. 237 00:13:56,630 --> 00:13:58,480 Se vain antaa sinulle tämän arvon. 238 00:13:58,480 --> 00:14:00,970 Joten se tulee vain sivuuttaa, että neljäs EPÄTOSI. 239 00:14:00,970 --> 00:14:05,310 240 00:14:05,310 --> 00:14:09,270 >> Joten tässä on vektoroitua toimeksianto. 241 00:14:09,270 --> 00:14:15,480 Joten set.seed-- tämä vain asettaa siemeniä pseudorandom numeroita. 242 00:14:15,480 --> 00:14:20,110 Joten olen asettamalla siemenen 42, mikä tarkoittaa, että jos minä tuottaa 243 00:14:20,110 --> 00:14:22,950 kolme satunnainen normaali arvot, ja sitten jos 244 00:14:22,950 --> 00:14:27,400 ajaa set.seed oman tietokoneeseen sama arvo 42, 245 00:14:27,400 --> 00:14:30,990 niin saat myös Sama kolme satunnainen normaalit. 246 00:14:30,990 --> 00:14:33,411 >> Joten tämä on todella hyvä Toistettavuustes-. 247 00:14:33,411 --> 00:14:35,910 Yleensä, kun teet joitakin tavallaan tieteellisen analyysin, 248 00:14:35,910 --> 00:14:37,230 haluaisi asettaa siemen. 249 00:14:37,230 --> 00:14:41,270 Näin muut tutkijat voivat vain jäljentää täsmälleen sama koodi olet 250 00:14:41,270 --> 00:14:44,790 tehdään, koska he ovat juuri Sama satunnaismuuttujia that-- tai satunnainen 251 00:14:44,790 --> 00:14:47,270 arvoja, jotka olet ottanut samoin. 252 00:14:47,270 --> 00:14:49,870 253 00:14:49,870 --> 00:14:53,910 >> Ja niin vektoroitua toimeksianto tässä näkyy Vals 1-2. 254 00:14:53,910 --> 00:14:59,290 Joten se vie kaksi ensimmäistä elementit Vals ja sitten määrittää ne 0. 255 00:14:59,290 --> 00:15:03,940 Ja sitten, voit myös vain tehdä samanlainen juttu Booleans. 256 00:15:03,940 --> 00:15:09,340 >> Joten Vals ei ole sama kuin 0-- tämän tahtoa antaa sinulle vektori väärä, väärä, TOSI 257 00:15:09,340 --> 00:15:10,350 tässä tapauksessa. 258 00:15:10,350 --> 00:15:13,770 Ja sitten, se tulee sanoa mitään Näiden indeksien jotka olivat TOSI, 259 00:15:13,770 --> 00:15:15,270 sitten se tulee määrittää, että 5. 260 00:15:15,270 --> 00:15:18,790 Joten se vie kolmas elementti täällä ja sitten määrittää sen 5. 261 00:15:18,790 --> 00:15:22,300 >> Ja tämä on todella mukava verrattuna matalan tason kielillä 262 00:15:22,300 --> 00:15:25,560 jossa sinun täytyy käyttää silmukoita tehdä kaikki tämä vektoroitua kamaa 263 00:15:25,560 --> 00:15:30,281 koska se on vain hyvin intuitiivinen ja se on yksi sutkaus. 264 00:15:30,281 --> 00:15:32,030 Ja mitä hienoa vektoroitua merkintätapa 265 00:15:32,030 --> 00:15:37,020 on, että R, nämä ovat tavallaan sisäänrakennettu jotta he melkein yhtä nopeasti 266 00:15:37,020 --> 00:15:42,490 kuten tekee matalan tason kieli vastustavat tehdä silmukka R 267 00:15:42,490 --> 00:15:46,317 ja sitten ottaa sen tehdä dynaaminen indeksointi itse. 268 00:15:46,317 --> 00:15:48,900 Ja se tulee olemaan hitaampaa kuin teet tällaista vektoroitua asia 269 00:15:48,900 --> 00:15:55,950 jossa se voi tehdä sen rinnalla, jos se tekee sitä ketjuttaminen pohjimmiltaan. 270 00:15:55,950 --> 00:15:58,650 >> Joten tässä on vectorized toimintaa. 271 00:15:58,650 --> 00:16:04,920 Joten olen tuottavan arvo 1-3, osoitetaan, että vec1, 3-5, vec2, 272 00:16:04,920 --> 00:16:05,950 lisäämällä ne yhteen. 273 00:16:05,950 --> 00:16:11,490 Se lisää niitä komponentti-viisas niin se 1 plus 3, 2 plus 4, ja niin edelleen. 274 00:16:11,490 --> 00:16:13,330 >> vec1 kertaa vec2. 275 00:16:13,330 --> 00:16:16,110 Tämä moninkertaistaa kaksi arvot komponentti viisas. 276 00:16:16,110 --> 00:16:21,830 Joten se on 1 kertaa 3, 2 kertaa 4, ja sitten 3 kertaa 5. 277 00:16:21,830 --> 00:16:28,250 >> Ja sitten, samalla voit myös tehdä comparisons-- looginen vertailuja. 278 00:16:28,250 --> 00:16:33,640 Joten se on VÄÄRIN VÄÄRIN TOSI tässä tapauksessa, koska 1 ei ole suurempi kuin 3, 279 00:16:33,640 --> 00:16:35,920 2 ei ole suurempi kuin 4. 280 00:16:35,920 --> 00:16:41,160 Tämä on kai, toinen typo, 3 ei todellakaan ole suurempi kuin 5. 281 00:16:41,160 --> 00:16:41,660 Joo. 282 00:16:41,660 --> 00:16:45,770 Ja niin voit vain tehdä kaikki nämä yksinkertaiset toimet 283 00:16:45,770 --> 00:16:48,350 koska heidän peritty luokista itse. 284 00:16:48,350 --> 00:16:51,110 285 00:16:51,110 --> 00:16:52,580 >> Niin että oli vain vektori. 286 00:16:52,580 --> 00:16:56,530 Ja se on tavallaan keskeisimpiä R esine koska annettu vektori, 287 00:16:56,530 --> 00:16:59,170 voit rakentaa kehittyneempiä esineitä. 288 00:16:59,170 --> 00:17:00,560 >> Joten tässä matriisissa. 289 00:17:00,560 --> 00:17:05,030 Tämä on lähinnä abstraktio mitä matriisi on itse. 290 00:17:05,030 --> 00:17:10,099 Joten tässä tapauksessa, se on kolme erilaista vektoreita, missä jokainen on sarake, 291 00:17:10,099 --> 00:17:12,710 tai voit harkita sitä koska jokainen on rivi. 292 00:17:12,710 --> 00:17:18,250 >> Joten olen tallentamiseksi matriisi 1 9 ja sitten olen täsmennetään 3 krs. 293 00:17:18,250 --> 00:17:23,364 Joten 1-9 antaa sinulle vektori 1, 2, 3, 4, 5, 6, ja aina 9. 294 00:17:23,364 --> 00:17:29,250 >> Yksi asia myös pitää mielessä, että R myymälää arvot sarakkeessa-suuria-muodossa. 295 00:17:29,250 --> 00:17:34,160 Eli toisin sanoen, kun näet 1 9, se tulee tallentaa them-- 296 00:17:34,160 --> 00:17:36,370 se tulee olemaan 1, 2, 3 ensimmäisessä sarakkeessa, 297 00:17:36,370 --> 00:17:38,510 ja sitten se tulee tehdä 4, 5, 6 toisessa sarakkeessa, 298 00:17:38,510 --> 00:17:41,440 ja sitten 7, 8, 9 kolmannessa sarakkeessa. 299 00:17:41,440 --> 00:17:45,570 >> Ja tässä on joitakin muita yhteisiä toimintoja voit käyttää. 300 00:17:45,570 --> 00:17:49,650 Niin hämärä matto, tämä antaa sinulle mitat matriisin. 301 00:17:49,650 --> 00:17:52,620 Se tulee palauttaa sinut vektori ulottuvuus. 302 00:17:52,620 --> 00:17:55,580 Joten tässä tapauksessa, koska Meidän matriisi on 3 3, 303 00:17:55,580 --> 00:18:01,900 se tulee antaa sinulle numeerinen vektori se 3 3. 304 00:18:01,900 --> 00:18:05,270 >> Ja tässä on vain näyttää matriisitulo. 305 00:18:05,270 --> 00:18:11,970 Joten yleensä, jos vain tehdä asterisk-- joten matto tähdellä mat-- 306 00:18:11,970 --> 00:18:15,380 tämä tulee olemaan komponentti-viisas toiminta 307 00:18:15,380 --> 00:18:17,300 tai mitä kutsutaan Hadamard- tuote. 308 00:18:17,300 --> 00:18:21,310 Joten se tulee tehdä jokaiselle elementtikomponentti-viisas. 309 00:18:21,310 --> 00:18:23,610 Kuitenkin, jos haluat matriisi multiplication-- 310 00:18:23,610 --> 00:18:29,380 joten kertomalla ensimmäisen rivin kertaa toisen matriisin ensimmäinen sarake 311 00:18:29,380 --> 00:18:34,510 ja niin on-- käyttäisit Tämän prosenttia toiminta. 312 00:18:34,510 --> 00:18:38,110 >> Ja t matto on vain operaation transpoosia. 313 00:18:38,110 --> 00:18:42,590 Joten sanon ottaa ne osaksi matriisi, kerro se matriisi 314 00:18:42,590 --> 00:18:43,090 itse. 315 00:18:43,090 --> 00:18:45,006 Ja sitten se tulee palata teille toisen 3 316 00:18:45,006 --> 00:18:50,700 3 matriisi, josta ilmenee tuotteen sinua halua. 317 00:18:50,700 --> 00:18:53,750 >> Ja niin se oli matriisi. 318 00:18:53,750 --> 00:18:56,020 Tässä on mitä kutsutaan datakehystä. 319 00:18:56,020 --> 00:19:00,780 Datakehystä voit ajatella niin matriisi, mutta kukin sarake itse 320 00:19:00,780 --> 00:19:02,990 tulee olemaan erityyppisiä. 321 00:19:02,990 --> 00:19:07,320 >> Joten mitä todella siistiä noin tiedot kehykset on, että tietojen analysointi sinänsä, 322 00:19:07,320 --> 00:19:11,260 olet menossa on kaikki tämä heterogeeniset tiedot ja kaikki nämä todella 323 00:19:11,260 --> 00:19:15,640 sotkuinen asioita jossa kukin sarakkeet itse voivat olla erityyppisiä. 324 00:19:15,640 --> 00:19:21,460 Joten tässä minä sanon luoda datakehyksessä tehdä ints 1-3, 325 00:19:21,460 --> 00:19:24,750 ja sitten on myös merkki vektori. 326 00:19:24,750 --> 00:19:28,470 Joten voin indeksi kautta kukin näistä sarakkeet 327 00:19:28,470 --> 00:19:30,930 ja sitten saan arvot itse. 328 00:19:30,930 --> 00:19:34,370 Ja voit myös tehdä jonkinlainen Toiminnan tietojen kehyksiä. 329 00:19:34,370 --> 00:19:38,040 Ja suurimman osan ajasta, kun olet tekee tietojen analysointi tai jonkinlainen 330 00:19:38,040 --> 00:19:42,042 jalostusaste, voit olla työskentelemme näiden tietorakenteiden 331 00:19:42,042 --> 00:19:44,250 jossa kukin sarake on menossa olla erityyppisiä. 332 00:19:44,250 --> 00:19:47,880 333 00:19:47,880 --> 00:19:52,970 >> Lopuksi, joten nämä ovat lähinnä vain neljä olennaista esineitä R. List 334 00:19:52,970 --> 00:19:55,820 vain kerää muut esineet haluat. 335 00:19:55,820 --> 00:20:00,130 Joten se tallentaa tämän yhdeksi muuttuja, että voit helposti. 336 00:20:00,130 --> 00:20:02,370 >> Joten tässä, otan lista. 337 00:20:02,370 --> 00:20:04,460 Sanon tavaraa yhtä kuin 3. 338 00:20:04,460 --> 00:20:08,060 Joten aion olla yksi osatekijä lista, ja tätä kutsutaan kamaa, 339 00:20:08,060 --> 00:20:10,570 ja se tulee olla arvo 3. 340 00:20:10,570 --> 00:20:13,140 >> Voin myös luoda matriisi. 341 00:20:13,140 --> 00:20:17,970 Joten tämä on 1-4 ja loppuun rivi on yhtä suuri kuin 2, niin 2 2 matriisi. 342 00:20:17,970 --> 00:20:20,270 Myös listan ja sitä kutsutaan matto. 343 00:20:20,270 --> 00:20:24,690 moreStuff, merkkijono, ja jopa toinen lista sinänsä. 344 00:20:24,690 --> 00:20:27,710 >> Joten tämä on luettelo, joka on 5 ja karhu. 345 00:20:27,710 --> 00:20:30,990 Joten se on arvo 5 ja se on merkkijono karhu 346 00:20:30,990 --> 00:20:32,710 ja se lista sisällä lista. 347 00:20:32,710 --> 00:20:35,965 Joten voit olla näitä rekursiivinen asioita, jos 348 00:20:35,965 --> 00:20:38,230 sinulla another-- kirjoita sisällä tyyppi. 349 00:20:38,230 --> 00:20:41,420 Joten samalla, voit olla matriisi sisällä toinen matriisi ja niin edelleen. 350 00:20:41,420 --> 00:20:44,264 Ja lista on vain hyvä tapa kerätä ja kokoamiseen 351 00:20:44,264 --> 00:20:45,430 kaikki nämä eri esineet. 352 00:20:45,430 --> 00:20:50,210 353 00:20:50,210 --> 00:20:57,150 >> Ja lopuksi, tässä on vain auttaa asiassa tämä oli vain mennyt yli hyvin nopeasti. 354 00:20:57,150 --> 00:21:01,350 Joten milloin olet hämmentynyt noin jonkinlainen funktio, 355 00:21:01,350 --> 00:21:03,510 voit tehdä apua kyseisen toiminnon. 356 00:21:03,510 --> 00:21:07,120 Joten voit tehdä apua matriisi tai kysymysmerkki matriisi. 357 00:21:07,120 --> 00:21:11,430 Ja apua ja kysymysmerkki ovat vain vain lyhenne sama asia 358 00:21:11,430 --> 00:21:13,040 joten he aliaksia. 359 00:21:13,040 --> 00:21:16,820 >> lm on toiminto, joka vain ei lineaarinen malli. 360 00:21:16,820 --> 00:21:20,340 Mutta jos vain ei ole aavistustakaan, miten tämä teoksia, voit vain tehdä apua lm 361 00:21:20,340 --> 00:21:24,610 ja että annan sinulle joitakin tavallaan dokumentaatiosta 362 00:21:24,610 --> 00:21:27,960 näyttää ikään kuin manuaalisivua Unix, jossa 363 00:21:27,960 --> 00:21:34,210 sinulla on lyhyt kuvaus siitä, mitä se myös mitä sen väitteet ovat, 364 00:21:34,210 --> 00:21:38,850 mitä se palaa, ja vain vihjeitä käyttää sitä, ja esimerkkejä samoin. 365 00:21:38,850 --> 00:21:41,680 366 00:21:41,680 --> 00:21:52,890 >> Joten anna minun mennä eteenpäin ja näytä demo käyttää R. OK. 367 00:21:52,890 --> 00:21:55,470 Joten menin hyvin nopeasti vain tiedot 368 00:21:55,470 --> 00:21:59,440 rakenteet ja jonkinlainen op-- jotkut toiminnot. 369 00:21:59,440 --> 00:22:02,960 Tässä on joitakin toimintoja. 370 00:22:02,960 --> 00:22:06,750 >> Joten tässä olen juuri menossa määritellä funktio. 371 00:22:06,750 --> 00:22:09,970 Joten olen myös käyttämällä sijoitusoperaattorin täällä, 372 00:22:09,970 --> 00:22:12,610 ja sitten en sano julistaa sen funktiona. 373 00:22:12,610 --> 00:22:14,140 Ja se saa arvon x. 374 00:22:14,140 --> 00:22:18,210 Joten tämä on mitään arvoa haluat ja aion palata x itse. 375 00:22:18,210 --> 00:22:20,840 Joten tämä on Identiteettifunktio. 376 00:22:20,840 --> 00:22:23,670 >> Ja mitä on siistiä tästä verrattuna muihin kieliin 377 00:22:23,670 --> 00:22:26,330 ja toinen matalan tason kieliä on, että x 378 00:22:26,330 --> 00:22:29,350 voi olla mitä tahansa tyyppiä itse ja se tulee palauttaa, että tyyppi. 379 00:22:29,350 --> 00:22:35,251 Joten voit imagine-- joten anna minulle vain ajaa tätä nopeasti. 380 00:22:35,251 --> 00:22:35,750 Anteeksi. 381 00:22:35,750 --> 00:22:40,300 >> Joten yksi asia Haluan mainita myös on, että tämä toimittaja käytän 382 00:22:40,300 --> 00:22:41,380 kutsutaan rstudio. 383 00:22:41,380 --> 00:22:44,389 Tämä on mitä kutsutaan IDE. 384 00:22:44,389 --> 00:22:46,180 Ja yksi asia, joka on todella mukava tästä 385 00:22:46,180 --> 00:22:51,500 on se, että se sisältää paljon asioita haluat tehdä tutkimus- itse 386 00:22:51,500 --> 00:22:53,180 vain hyvin intuitiivisesti. 387 00:22:53,180 --> 00:22:55,550 >> Joten tässä on tulkki konsoli. 388 00:22:55,550 --> 00:23:02,160 Joten samalla, voit myös saada tämän konsoli raaka vain tekemällä pääoman R. 389 00:23:02,160 --> 00:23:05,630 Ja tämä on täsmälleen sama asia kuin konsoli. 390 00:23:05,630 --> 00:23:12,210 Joten voin vain tehdä id funktio x, x, x. 391 00:23:12,210 --> 00:23:16,130 Ja then-- ja sitten, että on hieno itse. 392 00:23:16,130 --> 00:23:19,200 393 00:23:19,200 --> 00:23:21,740 >> Joten rstudio on suuri koska se on konsoli. 394 00:23:21,740 --> 00:23:25,360 Se on myös asiakirjojen haluat ajaa. 395 00:23:25,360 --> 00:23:28,629 Ja sitten se on joitakin muuttujia että näet ympäristöissä. 396 00:23:28,629 --> 00:23:30,420 Ja sitten, jos sinulla on tehdä tontteja, niin voit 397 00:23:30,420 --> 00:23:33,730 voi vain nähdä sen täällä, toisin kuin hoitaa kaikki nämä erilaiset ikkunat 398 00:23:33,730 --> 00:23:35,940 itse. 399 00:23:35,940 --> 00:23:40,530 >> Olen itse henkilökohtaisesti käyttää Vim, mutta minä tuntuu rstudio on erinomainen vain 400 00:23:40,530 --> 00:23:44,640 saada hyvä idea miten käyttää R. Yleensä 401 00:23:44,640 --> 00:23:47,040 kun yrität oppia uusi tehtävä, 402 00:23:47,040 --> 00:23:49,590 et halua käsitellä liian monta asiaa kerralla. 403 00:23:49,590 --> 00:23:53,120 Joten R on vain very-- rstudio on erittäin hyvä tapa oppia R 404 00:23:53,120 --> 00:23:56,760 ilman käsitellä kaikki nämä muut asiat. 405 00:23:56,760 --> 00:23:58,600 >> Joten tässä olen käynnissä id hei. 406 00:23:58,600 --> 00:24:00,090 Tämä palauttaa hei. 407 00:24:00,090 --> 00:24:01,740 id 123. 408 00:24:01,740 --> 00:24:04,610 Tässä on vektori kokonaislukuja. 409 00:24:04,610 --> 00:24:08,620 Joten samalla, koska voit ota jonkinlainen arvo, 410 00:24:08,620 --> 00:24:16,060 voit tehdä paluuta id X niin se palaa 1234 ja 5. 411 00:24:16,060 --> 00:24:22,210 >> Ja haluan vain osoittaa teille, että tämä on todellakin kokonaisluku. 412 00:24:22,210 --> 00:24:28,800 Ja samoin, jos et luokka id x, se tulee olemaan kokonaisluku. 413 00:24:28,800 --> 00:24:34,170 Ja sitten, voit myös vertailla kahta ja se on totta. 414 00:24:34,170 --> 00:24:38,350 Joten olen tarkkailun jos id x on yhtä suuri kuin tasavertaisten X ja huomautus 415 00:24:38,350 --> 00:24:39,760 että se antaa sinulle kaksi trues. 416 00:24:39,760 --> 00:24:44,280 Joten tämä ei sano ovat kaksi objektia identtiset, 417 00:24:44,280 --> 00:24:46,845 mutta ovat kukin merkinnät sisällä vektorit identtiset. 418 00:24:46,845 --> 00:24:50,000 419 00:24:50,000 --> 00:24:52,090 >> Tässä on bounded.compare. 420 00:24:52,090 --> 00:24:58,470 Joten tämä on hieman monimutkaisempi että sillä on, jos kunto ja muuta 421 00:24:58,470 --> 00:25:00,960 ja sitten se kestää kaksi argumentteja kerrallaan. 422 00:25:00,960 --> 00:25:02,640 Joten x on kaikenlaisia. 423 00:25:02,640 --> 00:25:06,280 Ja en sano tätä Toinen argumentti on. 424 00:25:06,280 --> 00:25:08,380 Tämä voi olla mitä samoin. 425 00:25:08,380 --> 00:25:12,490 Mutta oletuksena, se tulee ottaa 5 jos et määritä mitään. 426 00:25:12,490 --> 00:25:16,730 >> Joten tässä aion sanoa Jos x on suurempi kuin. 427 00:25:16,730 --> 00:25:19,220 Joten jos en määritä, se sanoo, että jos x on suurempi kuin 5, 428 00:25:19,220 --> 00:25:20,470 sitten aion palata TOSI. 429 00:25:20,470 --> 00:25:23,230 muuta, aion palata FALSE. 430 00:25:23,230 --> 00:25:24,870 Joten anna minun mennä eteenpäin ja määritellä tätä. 431 00:25:24,870 --> 00:25:30,600 432 00:25:30,600 --> 00:25:34,550 >> Ja nyt aion ajaa bounded.compare 3. 433 00:25:34,550 --> 00:25:39,150 Niin se sanoo on 3 vähemmän than-- on 3 yli 5. 434 00:25:39,150 --> 00:25:41,830 Ei, se ei ole niin EPÄTOSI. 435 00:25:41,830 --> 00:25:46,550 >> Ja bounded.compare 3 ja aion verrata sitä käyttäen yhtä kuin 2. 436 00:25:46,550 --> 00:25:50,700 Joten nyt sanon kyllä, nyt minä haluavat olla jotain muuta. 437 00:25:50,700 --> 00:25:52,750 Joten aion sanoa, sinun pitäisi olla 2. 438 00:25:52,750 --> 00:25:56,640 >> Voin joko tehdä tällaisia notaatio tai sanon = 2. 439 00:25:56,640 --> 00:25:58,720 Tämä on enemmän luettavissa että kun olet 440 00:25:58,720 --> 00:26:01,450 tarkastelee näitä todella monimutkaisia ​​toimintoja, että 441 00:26:01,450 --> 00:26:08,110 ottaa useita arguments-- ja tämän voi olla kymmeniä oftentimes-- vain sanomalla 442 00:26:08,110 --> 00:26:11,140 = 2 on enemmän luettavissa niin, että myöhemmin tulevaisuudessa 443 00:26:11,140 --> 00:26:13,020 tiedät mitä olet tekemässä. 444 00:26:13,020 --> 00:26:17,120 >> Joten tässä tapauksessa, olen sanonta on 3 yli 2. 445 00:26:17,120 --> 00:26:18,270 Kyllä se on. 446 00:26:18,270 --> 00:26:22,350 Ja samalla, voin vain poistaa ja sanoa, on 3 enemmän kuin 2 447 00:26:22,350 --> 00:26:23,440 missä = 2. 448 00:26:23,440 --> 00:26:26,230 Ja se on myös totta. 449 00:26:26,230 --> 00:26:26,730 Kyllä? 450 00:26:26,730 --> 00:26:29,670 >> Yleisö: Oletko täytäntöönpanosta rivi riviltä? 451 00:26:29,670 --> 00:26:30,670 >> DUSTIN TRAN: Kyllä olen. 452 00:26:30,670 --> 00:26:33,900 Joten mitä teen tässä ottaen tämä teksti document-- 453 00:26:33,900 --> 00:26:39,825 ja mitä hienoa rstudio on, että Voin vain ajaa short-- pikanäppäimen. 454 00:26:39,825 --> 00:26:41,820 Joten mulla Ohjaus-Enter. 455 00:26:41,820 --> 00:26:44,850 >> Ja sitten, otan rivin tekstitiedostona 456 00:26:44,850 --> 00:26:46,710 ja sitten laittoi konsolissa. 457 00:26:46,710 --> 00:26:50,800 Joten tässä minä sanon, bounded.compare ja mulla Ohjaus-X. 458 00:26:50,800 --> 00:26:52,540 Joten voin vain loppuvat täällä. 459 00:26:52,540 --> 00:26:54,920 Ja sitten, että otan rivi ja sitten laittaa sen tänne. 460 00:26:54,920 --> 00:26:57,900 Ja sitten samalla, voin ajaa täällä. 461 00:26:57,900 --> 00:27:04,630 Ja sitten se vain pitää määritellään rivit konsoli niin. 462 00:27:04,630 --> 00:27:10,690 >> Ja jos myös huomata kihara olkaimet ovat siellä aivan kuten C syntaksi. 463 00:27:10,690 --> 00:27:13,910 x-- jos jos ehto on myös aio käyttää sulkeita ja sitten 464 00:27:13,910 --> 00:27:15,350 voit käyttää muualla. 465 00:27:15,350 --> 00:27:17,496 Toinen on muuta, jos. 466 00:27:17,496 --> 00:27:21,440 Joten tämä tulee olemaan x on yhtä yhtä suuri, esimerkiksi. 467 00:27:21,440 --> 00:27:24,190 468 00:27:24,190 --> 00:27:26,350 Ja sitten aion palata jotain täällä. 469 00:27:26,350 --> 00:27:29,490 >> Huomaa, että on olemassa kaksi eri asioita täällä joka on meneillään. 470 00:27:29,490 --> 00:27:34,360 Yksi on se, että täällä olen täsmennetään palauttaa arvon TOSI. 471 00:27:34,360 --> 00:27:35,950 Täällä Sanon vain x. 472 00:27:35,950 --> 00:27:39,970 Joten R tulee yleensä oletuksena ottaa viimeinen arguments-- 473 00:27:39,970 --> 00:27:43,510 tai ottaa viimeisen rivin koodia, ja se tulee olemaan, mitä se palasi. 474 00:27:43,510 --> 00:27:46,920 Joten tässä tämä on sama asia kuin tekee paluun x. 475 00:27:46,920 --> 00:27:49,450 476 00:27:49,450 --> 00:27:50,540 >> Ja vain näyttää. 477 00:27:50,540 --> 00:27:54,000 478 00:27:54,000 --> 00:27:57,052 Ja sitten, se toimii juuri niin. 479 00:27:57,052 --> 00:27:58,260 Joten anna minun jatkaa tätä. 480 00:27:58,260 --> 00:28:00,630 >> Joten if. 481 00:28:00,630 --> 00:28:04,060 Ja oikeastaan, voin palata mitä haluaisin. 482 00:28:04,060 --> 00:28:06,680 Joten en edes tarvitse paluu Booleans koko ajan, 483 00:28:06,680 --> 00:28:08,410 Voin vain palata jotain muuta. 484 00:28:08,410 --> 00:28:10,670 Voin siis tehdä paluun karhu. 485 00:28:10,670 --> 00:28:12,989 >> Joten jos x on yhtä kuin yhtä suuri, se tulee palauttaa karhu. 486 00:28:12,989 --> 00:28:14,530 Muuten, se tulee palauttaa TOSI. 487 00:28:14,530 --> 00:28:19,310 Voin myös tehdä vektori tai oikeastaan ​​mitään. 488 00:28:19,310 --> 00:28:22,210 >> Ja yleensä staattisesti kirjoitetut tekstit, 489 00:28:22,210 --> 00:28:23,840 sinun täytyy määrittää tyypin täällä. 490 00:28:23,840 --> 00:28:25,750 Ja huomaa, että se voi vain olla mitä tahansa. 491 00:28:25,750 --> 00:28:32,400 Ja R on älykäs riitä, että se vain tehdä tämän, ja se toimii hyvin. 492 00:28:32,400 --> 00:28:33,620 >> Joten anna minun määritellä tämän. 493 00:28:33,620 --> 00:28:39,460 494 00:28:39,460 --> 00:28:41,230 Unexpected-- OH pahoillani. 495 00:28:41,230 --> 00:28:44,336 Sen pitäisi olla kihara ahdin täällä. 496 00:28:44,336 --> 00:28:44,836 OK. 497 00:28:44,836 --> 00:28:45,336 Cool. 498 00:28:45,336 --> 00:28:52,580 499 00:28:52,580 --> 00:28:54,530 Selvä. 500 00:28:54,530 --> 00:28:58,250 Joten nyt katsotaanpa vertailla 3 ja on yhtä suuri kuin 3. 501 00:28:58,250 --> 00:29:01,860 Joten se olisi return-- yeah-- arvo karhu. 502 00:29:01,860 --> 00:29:06,740 >> Joten nyt yleisempi asia on kuin Entä muut tietorakenteita. 503 00:29:06,740 --> 00:29:09,110 Joten sinulla on tämä toiminto. 504 00:29:09,110 --> 00:29:15,360 Tämä on menossa töihin minkäänlaisen arvon kuin 3 tai numeerinen, 505 00:29:15,360 --> 00:29:17,500 toisin sanoen, kaksinkertainen. 506 00:29:17,500 --> 00:29:19,330 >> Mutta entä jotain vektorin. 507 00:29:19,330 --> 00:29:27,750 Mitä tapahtuu, jos do-- joten olen menossa antaa val vaikkapa 4-6. 508 00:29:27,750 --> 00:29:31,640 Joten jos palaan tähän, tämä on vektori 4, 5, 6. 509 00:29:31,640 --> 00:29:34,935 >> Katsotaanpa nyt, mitä tapahtuu jos en tee bounded.compare val. 510 00:29:34,935 --> 00:29:37,680 511 00:29:37,680 --> 00:29:42,450 Joten tämä on aio antaa teille 15 1251. 512 00:29:42,450 --> 00:29:46,440 Eli toisin sanoen, se sanoo jos tarkastellaan tämän edellytyksen 513 00:29:46,440 --> 00:29:50,040 niin se sanoo x on pienempi kuin tai jotain. 514 00:29:50,040 --> 00:29:51,880 Joten tämä on hieman sekavaa, koska nyt 515 00:29:51,880 --> 00:29:53,379 et vain tiedä mitä tapahtuu. 516 00:29:53,379 --> 00:29:58,690 Joten kai yksi asia, joka todella hyvää vain yrittää debug 517 00:29:58,690 --> 00:30:04,600 on, että voit vain tehdä val on suurempi kuin ja nähdä, mitä siellä tapahtuu. 518 00:30:04,600 --> 00:30:09,720 >> Joten val-- on oletuksena 5 niin Haluan vain tehdä Val yli 5. 519 00:30:09,720 --> 00:30:14,280 Joten tämä on vektori VÄÄRIN VÄÄRIN TOSI. 520 00:30:14,280 --> 00:30:17,206 Joten nyt kun etsit Tässä se tulee sanoa, jos 521 00:30:17,206 --> 00:30:20,080 ja sitten se aio antaa teille tämän on vektori VÄÄRIN VÄÄRIN TOSI. 522 00:30:20,080 --> 00:30:23,450 >> Joten kun ohitat tämän osaksi R, R ei ole aavistustakaan, mitä olet tekemässä. 523 00:30:23,450 --> 00:30:26,650 Koska se odottaa yhden arvo, joka on Boolen, ja nyt 524 00:30:26,650 --> 00:30:29,420 annat sen vektori Booleans. 525 00:30:29,420 --> 00:30:31,970 Joten oletuksena, R on vain aikoo sanoa mitä hittoa, 526 00:30:31,970 --> 00:30:35,440 Aion olettaa, että olet menossa ottamaan ensimmäisen elementin täällä. 527 00:30:35,440 --> 00:30:38,320 Joten aion say-- aion olettaa, että tämä on EPÄTOSI. 528 00:30:38,320 --> 00:30:40,890 Joten se tulee sanoa no, tämä ei ole oikea. 529 00:30:40,890 --> 00:30:45,246 >> Samoin se tulee olla val yhtä kuin yhtä suuri. 530 00:30:45,246 --> 00:30:47,244 Ei, anteeksi 5. 531 00:30:47,244 --> 00:30:48,910 Ja se on myös olemaan väärä samoin. 532 00:30:48,910 --> 00:30:52,410 Joten se tulee sanoa ei, se ei ole totta yhtä hyvin niin se 533 00:30:52,410 --> 00:30:53,680 aio palata tähän viimeinen. 534 00:30:53,680 --> 00:30:56,420 535 00:30:56,420 --> 00:31:01,360 >> Joten tämä on joko hyvä tai huono asia, riippuen siitä, miten katsella sitä. 536 00:31:01,360 --> 00:31:05,104 Koska kun olet luoda näitä toimintoja, 537 00:31:05,104 --> 00:31:06,770 et oikeastaan ​​tiedä, mitä on tekeillä. 538 00:31:06,770 --> 00:31:10,210 Joten joskus et haluaisi virhe, tai ehkä vain haluavat varoituksen. 539 00:31:10,210 --> 00:31:12,160 Tällöin R ei tee niin. 540 00:31:12,160 --> 00:31:14,300 Joten se on todella jopa te perustuu pois mitä 541 00:31:14,300 --> 00:31:17,310 luulet kieli pitäisi tehdä tässä tapauksessa 542 00:31:17,310 --> 00:31:22,920 jos ohitat vektori Booleans kun teet, jos ehto. 543 00:31:22,920 --> 00:31:31,733 >> Joten sanotaan, että sinulla oli alkuperäinen yksi jos muu return true ja olet 544 00:31:31,733 --> 00:31:34,190 aio palata FALSE. 545 00:31:34,190 --> 00:31:39,300 Joten yksi tapa abstracting tämä on sanoa 546 00:31:39,300 --> 00:31:41,530 ei tarvitse edes tämä ehdollinen asia. 547 00:31:41,530 --> 00:31:47,220 Toinen asia mitä voin tehdä, on vain palaavat arvot itse. 548 00:31:47,220 --> 00:31:53,240 Joten jos huomaat, jos do Val on suurempi kuin 5, 549 00:31:53,240 --> 00:31:56,350 tämä tulee palauttaa vektori VÄÄRIN VÄÄRIN TOSI. 550 00:31:56,350 --> 00:31:58,850 >> Ehkä tämä on mitä haluavat bounded.compare. 551 00:31:58,850 --> 00:32:02,940 Haluat palata vektori Booleans jossa se vertaa jokaista arvojen 552 00:32:02,940 --> 00:32:04,190 itselleen. 553 00:32:04,190 --> 00:32:11,165 Joten voit vain eivät bounded.compare funktio x, on yhtä suuri kuin 5. 554 00:32:11,165 --> 00:32:13,322 555 00:32:13,322 --> 00:32:15,363 Ja sitten sen sijaan tehdä Tämä jos muu ehto, 556 00:32:15,363 --> 00:32:21,430 Olen juuri menossa palata x on suurempi kuin 5. 557 00:32:21,430 --> 00:32:23,620 Joten jos se on totta, niin se tulee palauttaa TOSI. 558 00:32:23,620 --> 00:32:26,830 Ja sitten jos se ei ole, se on aio palata FALSE. 559 00:32:26,830 --> 00:32:30,880 >> Ja tämä toimii tahansa näistä rakenteista. 560 00:32:30,880 --> 00:32:41,450 Voin siis bounded.compare c 1 6 tai 9 ja sitten aion sanoa yhtä kuin 6, 561 00:32:41,450 --> 00:32:42,799 esimerkiksi. 562 00:32:42,799 --> 00:32:44,840 Ja sitten se tulee anna sinulle oikeutta Boolen 563 00:32:44,840 --> 00:32:48,240 vektori, että olet suunnittelussa. 564 00:32:48,240 --> 00:32:50,660 >> Joten ne ovat vain toiminnot ja nyt haluan vain 565 00:32:50,660 --> 00:32:54,980 näyttää sinulle joitakin interaktiivisia grafiikka. 566 00:32:54,980 --> 00:32:59,700 En usko, olen oikeastaan Wi-Fi täällä niin haluaisin vain mennä eteenpäin 567 00:32:59,700 --> 00:33:01,970 ja ohita tämä luulisin. 568 00:33:01,970 --> 00:33:05,260 >> Mutta yksi asia, että on siistiä kuitenkin on, että jos vain 569 00:33:05,260 --> 00:33:09,600 haluavat testata nippu erilaisia ​​tietoja komentoja, 570 00:33:09,600 --> 00:33:13,320 on joukko erilaisia ​​aineistoja jotka on jo esiladattuja R. 571 00:33:13,320 --> 00:33:15,770 Joten yksi niistä on nimeltään iiris aineisto. 572 00:33:15,770 --> 00:33:18,910 Tämä on yksi tunnetuimmista pienimmille koneoppimista. 573 00:33:18,910 --> 00:33:23,350 Sinun yleensä vain tehdä jonkinlainen testitapaukset nähdä, jos koodi toimii. 574 00:33:23,350 --> 00:33:27,520 Joten vain tarkistaa, mitä iiris on. 575 00:33:27,520 --> 00:33:33,130 >> Joten tämä asia on menossa olla datakehyksen. 576 00:33:33,130 --> 00:33:36,000 Ja se on aika pitkä, koska Minä vain tulostaa iiris. 577 00:33:36,000 --> 00:33:38,810 Se tulostamalla koko juttu. 578 00:33:38,810 --> 00:33:42,830 Joten se on kaikki nämä eri nimiä. 579 00:33:42,830 --> 00:33:45,505 Joten Iiriksen kokoelma erilaisia ​​kukkia. 580 00:33:45,505 --> 00:33:48,830 Tässä tapauksessa se on kertoa te lajien sitä, 581 00:33:48,830 --> 00:33:54,760 kaikki nämä eri leveyttä ja pituudet verholehti ja terälehti. 582 00:33:54,760 --> 00:33:58,880 >> Ja niin normaalisti, jos haluat tulostaa iiris, 583 00:33:58,880 --> 00:34:03,680 Esimerkiksi et halua olla se tehdä kaiken tämän, koska se voi kestää yli 584 00:34:03,680 --> 00:34:05,190 koko konsolin. 585 00:34:05,190 --> 00:34:09,280 Niin yksi asia, joka todella kiva on pää toiminto. 586 00:34:09,280 --> 00:34:12,929 Joten jos vain tehdä pää iiris, tämä antaa sinulle 587 00:34:12,929 --> 00:34:17,389 ensimmäiset viisi riviä, tai kuusi luulisin. 588 00:34:17,389 --> 00:34:19,909 Ja sitten hyvin, sinun voi vain määrittää täällä. 589 00:34:19,909 --> 00:34:22,914 Joten 20-- tämä antaa olet ensimmäinen 20 riviä. 590 00:34:22,914 --> 00:34:24,830 Ja olen itse ollut sellainen on yllättynyt, että tämä 591 00:34:24,830 --> 00:34:28,770 antoi minulle kuusi joten anna minun mennä eteenpäin ja tarkista iris-- tai pään, sorry. 592 00:34:28,770 --> 00:34:31,699 593 00:34:31,699 --> 00:34:34,960 Ja tässä se antaa te asiakirjat 594 00:34:34,960 --> 00:34:37,960 mitä arvoa pää tekee. 595 00:34:37,960 --> 00:34:40,839 Joten se palaa ensin tai viimeinen kohde. 596 00:34:40,839 --> 00:34:42,630 Ja sitten aion katso oletusarvot. 597 00:34:42,630 --> 00:34:47,340 Ja sitten se sanoo oletuksena menetelmä pää x ja n on 6L. 598 00:34:47,340 --> 00:34:50,620 Joten tämä palaa kuuden ensimmäisen elementtejä. 599 00:34:50,620 --> 00:34:55,050 Ja samoin jos huomaat täällä, minä ei tarvitse määritellä n on 6. 600 00:34:55,050 --> 00:34:56,840 Oletuksena se käyttää kuusi, luulisin. 601 00:34:56,840 --> 00:35:00,130 Ja sitten, jos haluan määrittää tietyn arvoa, niin voin katsella että samoin. 602 00:35:00,130 --> 00:35:02,970 603 00:35:02,970 --> 00:35:10,592 >> Niin, että on joitakin yksinkertaisia ​​komentoja ja tässä on toinen, joka on just-- hyvin, 604 00:35:10,592 --> 00:35:12,550 Olen can-- tämä on oikeastaan hieman monimutkaisempi, 605 00:35:12,550 --> 00:35:17,130 mutta tämä kestää vain luokan Kunkin sarakkeen iiris aineisto. 606 00:35:17,130 --> 00:35:20,910 Joten tämä näyttää, mitä kukin näistä sarakkeet ovat mitattuna niiden tyyppejä. 607 00:35:20,910 --> 00:35:23,665 Joten verholehti pituus on numeerinen, verholehti leveys on numeerinen. 608 00:35:23,665 --> 00:35:26,540 Kaikki nämä arvot ovat vain numeerinen koska voit kertoa näistä tiedoista 609 00:35:26,540 --> 00:35:29,440 jäsentää nämä ovat kaikki menee numeerinen. 610 00:35:29,440 --> 00:35:34,310 >> Ja Laji sarake tulee olemaan tekijä. 611 00:35:34,310 --> 00:35:37,270 Joten normaalisti, luulisi, että tämä on kuin merkkijono. 612 00:35:37,270 --> 00:35:48,830 Mutta jos et vain irisSpecies, ja sitten aion tehdä pää 5, 613 00:35:48,830 --> 00:35:51,820 ja tämä tulee tulostaa ulos viiden ensimmäisen arvoja. 614 00:35:51,820 --> 00:35:54,150 >> Ja sitten huomaa tätä tasoa. 615 00:35:54,150 --> 00:35:58,870 Joten tämä on saying-- tämä on R: n tavoin ottaa kategorisen muuttujan. 616 00:35:58,870 --> 00:36:03,765 Joten sen sijaan vain ottaa merkkijonoja, 617 00:36:03,765 --> 00:36:06,740 se on tasoa täsmennetään joka nämä asiat ovat. 618 00:36:06,740 --> 00:36:12,450 >> Joten sanokaamme irisSpecies 1. 619 00:36:12,450 --> 00:36:17,690 Joten mitä haluat tehdä tässä olen subsetting tämän lajin sarakkeeseen. 620 00:36:17,690 --> 00:36:21,480 Joten tämä vie Laji sarake ja sitten 621 00:36:21,480 --> 00:36:23,820 Se indeksoi saada ensimmäinen elementti. 622 00:36:23,820 --> 00:36:27,140 Joten tämä pitäisi antaa sinulle setosa. 623 00:36:27,140 --> 00:36:28,710 Ja se myös antaa sinulle tasoa täällä. 624 00:36:28,710 --> 00:36:32,812 >> Joten voit myös vertailla Tämän merkin setosa 625 00:36:32,812 --> 00:36:34,645 ja tämä ei tule olla totta, koska yksi 626 00:36:34,645 --> 00:36:37,940 on eri tyyppiä kuin muut. 627 00:36:37,940 --> 00:36:40,590 Tai kai se on totta, koska R on älykkäämpi kuin. 628 00:36:40,590 --> 00:36:45,420 Ja näyttää tällä ja sitten sanoo, ehkä tämä on mitä haluat. 629 00:36:45,420 --> 00:36:51,860 Joten se tulee sanoa merkki merkkijono setosa on sama kuin tämä. 630 00:36:51,860 --> 00:37:01,290 Ja sitten Vastaavasti voit myös vain napata nämä kuten niin edelleen. 631 00:37:01,290 --> 00:37:05,580 >> Tämä on siis vain jonkinlainen nopeasti käskyjä aineisto. 632 00:37:05,580 --> 00:37:08,030 Joten tässä on joitakin tietoja etsintä. 633 00:37:08,030 --> 00:37:11,360 Joten tämä on hieman enemmän mukana tietojen analysointi. 634 00:37:11,360 --> 00:37:18,340 Ja tämä on otettu joitakin Bootcamp vuonna R Berkeley. 635 00:37:18,340 --> 00:37:20,790 >> Joten kirjasto ulkomaisia. 636 00:37:20,790 --> 00:37:24,880 Joten aion latautuu kirjasto, joka kutsutaan ulkomaisia. 637 00:37:24,880 --> 00:37:32,460 Joten tämä on aio antaa minulle read.dta niin oletetaan, että minulla on tämä aineisto. 638 00:37:32,460 --> 00:37:39,000 Tämä on tallennettu nykyisen Työhakemiston minun konsolin. 639 00:37:39,000 --> 00:37:42,190 Joten vain nähdä mitä työhakemistossa on. 640 00:37:42,190 --> 00:37:44,620 >> Joten tässä on minun työhakemistossa. 641 00:37:44,620 --> 00:37:50,040 Ja lukea pistedata, tämä asia, sanoo tämä tiedosto 642 00:37:50,040 --> 00:37:54,650 sijaitsee data kansioon Tämän työhakemistosta. 643 00:37:54,650 --> 00:38:00,520 Ja read.dta tämä ei ole Oletuksena komento. 644 00:38:00,520 --> 00:38:02,760 Luulen ladattu sen jo. 645 00:38:02,760 --> 00:38:04,750 IEI olettaa Olen ladattu tämän jo. 646 00:38:04,750 --> 00:38:08,115 >> Mutta niin read.dta ei tule olla oletuksena komento. 647 00:38:08,115 --> 00:38:11,550 Ja siksi olet menossa on ladata tässä kirjastossa package-- 648 00:38:11,550 --> 00:38:14,500 tämä paketti nimeltään ulkomaisia. 649 00:38:14,500 --> 00:38:16,690 Ja jos sinulla ei ole paketin, luulen 650 00:38:16,690 --> 00:38:19,180 Ulkomaisten on yksi sisäänrakennettu niistä. 651 00:38:19,180 --> 00:38:31,150 Muuten, voit myös do install.packages 652 00:38:31,150 --> 00:38:33,180 ja tämä asentaa paketin. 653 00:38:33,180 --> 00:38:36,878 Ja tämä antaa sinulle R. Tuota, ei. 654 00:38:36,878 --> 00:38:39,830 655 00:38:39,830 --> 00:38:43,140 Ja sitten olen juuri menossa lopettaa tätä, koska minulla on jo se. 656 00:38:43,140 --> 00:38:46,920 >> Mutta mitä todella mukavaa noin R on, että paketti hallinta 657 00:38:46,920 --> 00:38:48,510 järjestelmä on erittäin tyylikäs. 658 00:38:48,510 --> 00:38:52,470 Koska se tallentaa kaiken todella hienosti sinulle. 659 00:38:52,470 --> 00:38:59,780 Joten tässä tapauksessa, se tulee säilyttää sen, uskon, tätä kirjastoa täällä. 660 00:38:59,780 --> 00:39:02,390 >> Joten milloin haluat asentaa uusia paketteja, 661 00:39:02,390 --> 00:39:04,980 se on aivan yhtä helppoa kuin tekee install.packages 662 00:39:04,980 --> 00:39:07,500 ja R hoitaa kaikki paketteja sinulle. 663 00:39:07,500 --> 00:39:12,900 Joten sinun ei tarvitse tehdä jotain Python, jossa on ulkoinen paketti 664 00:39:12,900 --> 00:39:15,330 johtajat kuten paperi Anaconda missä olet 665 00:39:15,330 --> 00:39:18,310 doing-- asennat paketit ulkopuolella Python 666 00:39:18,310 --> 00:39:20,940 ja sitten yrität käyttää niitä itse. 667 00:39:20,940 --> 00:39:22,210 Joten tämä on todella mukava tapa. 668 00:39:22,210 --> 00:39:25,590 >> Ja install.packages vaatii internet. 669 00:39:25,590 --> 00:39:31,950 Se kestää sen palvelimelta ja arkisto 670 00:39:31,950 --> 00:39:33,960 kerää kaikki paketteja kutsutaan CRAN. 671 00:39:33,960 --> 00:39:40,690 Ja voit määrittää, mitkä tavallaan peili Haluatko ladata paketteja. 672 00:39:40,690 --> 00:39:43,420 >> Joten tässä olen ottamisen aineisto. 673 00:39:43,420 --> 00:39:46,240 Luen sen tämän toiminnon. 674 00:39:46,240 --> 00:39:49,360 Joten anna minun mennä eteenpäin ja tehdä se. 675 00:39:49,360 --> 00:39:52,900 >> Joten Oletetaan, että sinulla on tämä aineisto 676 00:39:52,900 --> 00:39:55,550 ja olet ehdottoman ei ole aavistustakaan, mitä se on. 677 00:39:55,550 --> 00:39:58,560 Ja tämä todella tulee esiin melko usein teollisuudessa 678 00:39:58,560 --> 00:40:00,910 jossa sinun täytyy vain nämä tonneittain sotkuinen asioita 679 00:40:00,910 --> 00:40:02,890 ja he uskomattoman merkitsemätön. 680 00:40:02,890 --> 00:40:06,380 Joten tässä olen tätä aineisto ja en tiedä 681 00:40:06,380 --> 00:40:08,400 mitä se on niin olen vain osoittaa tarkistaa sitä. 682 00:40:08,400 --> 00:40:10,620 >> Joten aion tehdä pää edellä. 683 00:40:10,620 --> 00:40:14,190 Joten voin tarkistaa ensimmäisten kuuden sarakkeet mitä tämä aineisto on. 684 00:40:14,190 --> 00:40:21,730 Joten tämä on valtio, pres04, ja sitten kaikki nämä eri lajitella sarakkeita. 685 00:40:21,730 --> 00:40:25,612 Ja mikä mielenkiintoista täällä, luulisin, että te 686 00:40:25,612 --> 00:40:27,945 voisi olettaa, että tämä näyttää kuten jonkinlainen vaaleissa. 687 00:40:27,945 --> 00:40:30,482 688 00:40:30,482 --> 00:40:32,190 Ja kai pelkästään katsot tiedosto 689 00:40:32,190 --> 00:40:41,070 nimi tämä on jonkinlainen kokoelma Tietojen noin ehdokkaiden tai äänestäjien 690 00:40:41,070 --> 00:40:44,920 jotka äänestivät erityisiä presidentit tai presidentti ehdokkaat 691 00:40:44,920 --> 00:40:46,550 vuoden 2004 vaaleissa. 692 00:40:46,550 --> 00:40:52,920 >> Joten tässä on arvot 1, 2 joten yksi tapa tallentaa 693 00:40:52,920 --> 00:40:56,540 presidentti ehdokkaat heidän nimensä. 694 00:40:56,540 --> 00:40:59,780 Tässä tapauksessa näyttää siltä, he vain kokonaisluku arvoja. 695 00:40:59,780 --> 00:41:04,030 Joten 2004, se oli Bush vs. Kerry uskon. 696 00:41:04,030 --> 00:41:09,010 Ja nyt, sanokaamme vain tiedä onko 1 vastaa Bush tai 2 697 00:41:09,010 --> 00:41:11,703 vastaa Kerry tai ja niin edelleen ja niin edelleen, eikö? 698 00:41:11,703 --> 00:41:15,860 >> Ja tämä on vain minulle, melko yleinen ongelma. 699 00:41:15,860 --> 00:41:18,230 Niin mitä voit tehdä tässä tapauksessa? 700 00:41:18,230 --> 00:41:20,000 Joten katso kaikki nämä muut asiat. 701 00:41:20,000 --> 00:41:22,790 >> valtion, olen olettaen tämä tulee eri valtioissa. 702 00:41:22,790 --> 00:41:25,100 partyid, tulot. 703 00:41:25,100 --> 00:41:27,710 Katsotaanpa partyid. 704 00:41:27,710 --> 00:41:32,800 Joten ehkä yksi asia mitä voi tehdä on tarkastella kunkin havaintojen 705 00:41:32,800 --> 00:41:36,250 että on partyid republikaanien tai demokraatti tai jotain. 706 00:41:36,250 --> 00:41:38,170 Joten katsokaa mitä partyid on. 707 00:41:38,170 --> 00:41:41,946 >> Joten aion ottaa dat ja sitten aion 708 00:41:41,946 --> 00:41:47,960 tehdä tämän dollarin merkki operaattori että tein aiemmin 709 00:41:47,960 --> 00:41:50,770 ja tämä tulee alijoukkoa tähän sarakkeeseen. 710 00:41:50,770 --> 00:41:57,760 Ja sitten aion suunnata tätä 20, vain nähdä, mitä tämä näyttää. 711 00:41:57,760 --> 00:42:00,170 >> Joten tämä on vain nippu toimistojen. 712 00:42:00,170 --> 00:42:02,800 Eli toisin sanoen, sinulla on puuttuvia tietoja nämä kaverit. 713 00:42:02,800 --> 00:42:08,100 Mutta te myös huomata tämän dat partyid on tekijä 714 00:42:08,100 --> 00:42:10,030 joten tämä antaa sinulle eri luokkiin. 715 00:42:10,030 --> 00:42:14,170 Eli toisin sanoen, partyid voi kestää Demokraatti, republikaanien, Independent, 716 00:42:14,170 --> 00:42:16,640 tai jotain muuta. 717 00:42:16,640 --> 00:42:23,940 >> Joten mene eteenpäin ja katsotaanpa mitkä näistä is-- oh, OK. 718 00:42:23,940 --> 00:42:28,480 Joten aion alijoukkoa jotta partyid ja sitten 719 00:42:28,480 --> 00:42:32,780 tarkastella, mitkä ovat Demokraatti, esimerkiksi. 720 00:42:32,780 --> 00:42:37,150 Tämä on menossa antaa teille totuusarvoarvoja valtava Boolen on trues ja FALSEs. 721 00:42:37,150 --> 00:42:41,630 >> Ja nyt, sanotaanko haluan alijoukkoihin että nämä kaverit. 722 00:42:41,630 --> 00:42:47,260 Joten tämä vie minun dat ja osajoukko kumpi havaintoja 723 00:42:47,260 --> 00:42:48,910 on partyid tasavertaisten yhtä suuri demokraatti. 724 00:42:48,910 --> 00:42:52,830 725 00:42:52,830 --> 00:42:55,180 Ja tämä on melko pitkä, koska siellä on niin paljon. 726 00:42:55,180 --> 00:42:59,060 Joten nyt, aion suunnata tätä 20. 727 00:42:59,060 --> 00:43:05,690 728 00:43:05,690 --> 00:43:11,270 >> Ja kuten huomaat, on yhtä suuri kuin tasavertaisten on mielenkiintoinen, olet 729 00:43:11,270 --> 00:43:13,250 already-- olet myös myös toimistojen kesken. 730 00:43:13,250 --> 00:43:19,010 Joten tässä tapauksessa, et silti saa tietoja, koska nyt sinulla on toimistojen 731 00:43:19,010 --> 00:43:22,650 ja haluat vain nähdä, mitkä havainto vastaavat demokraatti 732 00:43:22,650 --> 00:43:24,670 eikä näitä puuttuvia arvoja itse. 733 00:43:24,670 --> 00:43:27,680 Joten miten sinä päästä eroon näistä toimistojen? 734 00:43:27,680 --> 00:43:36,410 >> Joten tässä olen vain käyttämällä ylös-näppäintä minun kohdistin ja sitten sanomalla liikkuvat. 735 00:43:36,410 --> 00:43:39,778 Ja sitten täällä olen juuri menossa sanoa is.na datpartyid. 736 00:43:39,778 --> 00:43:48,970 737 00:43:48,970 --> 00:43:52,720 Joten tämä ja ja ryhtyy kaksi eri Boolen vektorit 738 00:43:52,720 --> 00:43:57,160 ja sano se tulee olemaan Oikean ja väärän esimerkiksi. 739 00:43:57,160 --> 00:43:59,190 Joten se aikoo tehdä tämän komponentin viisas. 740 00:43:59,190 --> 00:44:02,910 Joten tässä minä sanon take datakehyksen, alijoukkoa 741 00:44:02,910 --> 00:44:10,170 hankkeille, jotka vastaavat demokraatti, ja poista niistä, jotka eivät ole NA. 742 00:44:10,170 --> 00:44:13,540 >> Joten tämä will-- olisi antaa sinulle jotain. 743 00:44:13,540 --> 00:44:16,540 744 00:44:16,540 --> 00:44:17,600 Katsotaanpa is.na. 745 00:44:17,600 --> 00:44:24,670 746 00:44:24,670 --> 00:44:27,690 Kokeillaan is.na datpartyid. 747 00:44:27,690 --> 00:44:36,290 748 00:44:36,290 --> 00:44:45,290 Ja tämän pitäisi antaa sinä-- sorry-- vain Boolen vektori. 749 00:44:45,290 --> 00:44:49,260 Ja sitten, koska se on niin pitkä, Aion alijoukkoa 20. 750 00:44:49,260 --> 00:44:49,760 OK. 751 00:44:49,760 --> 00:44:51,570 Joten tämä pitäisi toimia. 752 00:44:51,570 --> 00:44:54,700 >> Ja tämä on myös trues. 753 00:44:54,700 --> 00:45:01,830 Ah, niin minun virhe on, että I'm-- I käyttää C ++ ja R synonyymeinä niin teen 754 00:45:01,830 --> 00:45:03,590 tämä virhe koko ajan. 755 00:45:03,590 --> 00:45:05,807 Ja operaattori on todella haluamasi. 756 00:45:05,807 --> 00:45:08,140 Et halua käyttää kahta -merkit, vain yksi. 757 00:45:08,140 --> 00:45:14,970 758 00:45:14,970 --> 00:45:17,010 OK. 759 00:45:17,010 --> 00:45:18,140 >> Katsotaanpa. 760 00:45:18,140 --> 00:45:20,930 761 00:45:20,930 --> 00:45:23,920 Joten me subsetted kohteeseen partyid missä he demokraatti 762 00:45:23,920 --> 00:45:25,300 ja he eivät puuttuvia arvoja. 763 00:45:25,300 --> 00:45:27,690 Ja nyt katsokaamme mitkä he ovat äänestäneet. 764 00:45:27,690 --> 00:45:31,530 Joten se tuntuu eniten heistä äänesti 1. 765 00:45:31,530 --> 00:45:36,090 Joten aion mennä eteenpäin ja sanoa, että on Kerry. 766 00:45:36,090 --> 00:45:39,507 >> Ja Vastaavasti voit myös mennä republikaanien 767 00:45:39,507 --> 00:45:41,090 ja toivottavasti tämä pitäisi antaa sinulle 2. 768 00:45:41,090 --> 00:45:49,730 769 00:45:49,730 --> 00:45:51,770 Se on vain joukko erilaisia ​​sarakkeita. 770 00:45:51,770 --> 00:45:53,070 Ja todellakin, se on 2. 771 00:45:53,070 --> 00:45:55,750 Joten partyid kaikki republikaanien, useimmat äänestävät 2. 772 00:45:55,750 --> 00:45:58,390 >> Joten se tuntuu, vain katsomalla tämän, 773 00:45:58,390 --> 00:46:00,600 Republikaanien tulee olemaan very-- tai partyid 774 00:46:00,600 --> 00:46:02,790 tulee olemaan hyvin iso tekijä 775 00:46:02,790 --> 00:46:05,420 mikä ehdokas he aio äänestää. 776 00:46:05,420 --> 00:46:07,120 Ja tämä on tietysti totta yleensä. 777 00:46:07,120 --> 00:46:10,139 Ja tämä sopii intuitio, tietenkin. 778 00:46:10,139 --> 00:46:11,930 Joten se tuntuu olen loppumassa aika niin 779 00:46:11,930 --> 00:46:17,040 haluaisin vain pitäisi mennä eteenpäin ja näyttää nopeita kuvia. 780 00:46:17,040 --> 00:46:21,120 Joten tässä on jotain, joka on hieman monimutkaistaa visualisointi. 781 00:46:21,120 --> 00:46:26,450 Joten tässä tapauksessa, tämä on hyvin yksinkertainen analyysi vain tarkistaa, mitä 782 00:46:26,450 --> 00:46:28,500 presidentti '04 on. 783 00:46:28,500 --> 00:46:33,920 >> Joten tässä tapauksessa, sanokaamme halusi vastata tähän kysymykseen. 784 00:46:33,920 --> 00:46:38,540 Joten kai halusimme tietää äänestäminen käyttäytyminen 2004 presidentti vaaleissa 785 00:46:38,540 --> 00:46:41,170 ja miten se vaihtelee rodun. 786 00:46:41,170 --> 00:46:44,380 Niin ei vain haluat katso äänestyskäyttäytyminen, 787 00:46:44,380 --> 00:46:47,860 mutta haluat osajoukko kunkin rotu ja tavallaan yhteenvedon. 788 00:46:47,860 --> 00:46:50,770 Ja voit vain kertoa Tämän monimutkaisen merkintätapa 789 00:46:50,770 --> 00:46:52,580 että tämä on tavallaan tulossa utuinen. 790 00:46:52,580 --> 00:46:56,390 >> Joten yksi kehittyneempiä R paketteja, jotka on myös sellainen viime 791 00:46:56,390 --> 00:47:00,070 kutsutaan dplyr. 792 00:47:00,070 --> 00:47:03,060 Joten se on tämä yksi täällä. 793 00:47:03,060 --> 00:47:08,080 Ja ggg-- ggplot2 on mukavan tapa tehdä paremmin visualisointeja 794 00:47:08,080 --> 00:47:09,400 kuin sisäänrakennettu yhteen. 795 00:47:09,400 --> 00:47:11,108 >> Joten aion ladata Näiden kahden kirjastot. 796 00:47:11,108 --> 00:47:13,200 797 00:47:13,200 --> 00:47:16,950 Ja sitten, aion mennä eteenpäin ja suorita tämä komento. 798 00:47:16,950 --> 00:47:19,050 Voit vain pitää tätä musta laatikko. 799 00:47:19,050 --> 00:47:23,460 >> Mitä tapahtuu, on, että tämä putki operaattori kulkee tässä argumentti 800 00:47:23,460 --> 00:47:24,110 osaksi täällä. 801 00:47:24,110 --> 00:47:28,070 Joten en sano ryhmän dat rotu ja sitten presidentti 04. 802 00:47:28,070 --> 00:47:31,530 Ja sitten, kaikki nämä muut komennot ovat suodatus ja sitten yhteenveto 803 00:47:31,530 --> 00:47:34,081 jos mulla count ja Sitten olen piirtämistä täällä. 804 00:47:34,081 --> 00:47:39,980 805 00:47:39,980 --> 00:47:42,500 OK viileä. 806 00:47:42,500 --> 00:47:44,620 Joten mene eteenpäin ja nähdä, mitä tämä näyttää. 807 00:47:44,620 --> 00:47:52,280 808 00:47:52,280 --> 00:47:57,290 >> Joten mitä täällä tapahtuu on se, että minä vain piirretty kunkin kilpailuista ja sitten 809 00:47:57,290 --> 00:47:59,670 mitkä he ovat äänestäneet. 810 00:47:59,670 --> 00:48:03,492 Ja nämä kaksi erilaista arvot vastaavat 2 ja 1. 811 00:48:03,492 --> 00:48:05,325 Jos haluat olla enemmän tyylikäs, voit myös 812 00:48:05,325 --> 00:48:11,770 vain täsmennetään, että 2 on Kerry-- tai 2 on Bush, ja sitten 1 on Kerry. 813 00:48:11,770 --> 00:48:13,700 Ja voit myös että teidän legenda. 814 00:48:13,700 --> 00:48:17,410 >> Ja voit myös jakaa näitä pylväsdiagrammeja. 815 00:48:17,410 --> 00:48:19,480 Koska yksi asia on että, jos huomaat, 816 00:48:19,480 --> 00:48:24,560 tämä ei ole kovin helppo tunnistaa kumpi näistä kahdesta arvot ovat suurempia. 817 00:48:24,560 --> 00:48:27,920 Joten yksi asia sinua halua tehdä, on ottaa tämä sininen alue 818 00:48:27,920 --> 00:48:31,855 ja siirrä se tänne niin sinua voi verrata näitä kahta vierekkäin. 819 00:48:31,855 --> 00:48:34,480 Ja kai se jotain ei ole aikaa tehdä juuri nyt, 820 00:48:34,480 --> 00:48:36,660 mutta se on myös erittäin helppo tehdä. 821 00:48:36,660 --> 00:48:40,310 Voit etsitä vain mies sivua ggplot. 822 00:48:40,310 --> 00:48:47,170 Joten voit vain eivät ggplot kuten että ja lukea tähän man-sivulta. 823 00:48:47,170 --> 00:48:51,920 >> Joten haluan vain nopeasti näyttää sinulle joitakin hienoja asioita. 824 00:48:51,920 --> 00:48:57,610 Mennään eteenpäin ja mennä to-- vain soveltaminen koneoppimisen. 825 00:48:57,610 --> 00:49:02,450 Joten sanokaamme meillä on nämä kolme paketit joten aion ladata nämä. 826 00:49:02,450 --> 00:49:05,500 827 00:49:05,500 --> 00:49:09,170 Joten tämä vain tulostaa joitakin tiedot, kun olen ladattu asia. 828 00:49:09,170 --> 00:49:15,220 Joten sanon tämän read.csv, tämä aineisto, ja nyt 829 00:49:15,220 --> 00:49:18,940 Aion mennä eteenpäin ja katsoa ja nähdä, mitä sisällä tämä aineisto. 830 00:49:18,940 --> 00:49:22,080 >> Joten ensimmäinen 20 havainnot. 831 00:49:22,080 --> 00:49:27,190 Joten minulla on vain X1, X2, ja Y. Niin tuntuu kasan näitä arvoja 832 00:49:27,190 --> 00:49:31,640 ovat aina ehkä 20-80 tai niin. 833 00:49:31,640 --> 00:49:37,700 Ja sitten samalla X2 ja sitten tämä Y näyttää olevan tarrojen 0 ja 1. 834 00:49:37,700 --> 00:49:49,500 >> Voit tarkistaa tämän, voin vain tehdä yhteenvetotiedot X1. 835 00:49:49,500 --> 00:49:51,660 Ja sitten samalla varten kaikki nämä muut sarakkeet. 836 00:49:51,660 --> 00:49:55,300 Joten yhteenveto on nopea tapa vain näyttää sinulle nopean arvoja. 837 00:49:55,300 --> 00:49:56,330 Anteeksi. 838 00:49:56,330 --> 00:49:58,440 Tämän pitäisi olla Y. 839 00:49:58,440 --> 00:50:03,420 >> Joten tässä tapauksessa antaa quantiles, mediaanit, maxes samoin. 840 00:50:03,420 --> 00:50:07,130 Tällöin dataY, näet että se vain tulee olemaan 0 ja 1. 841 00:50:07,130 --> 00:50:10,100 Myös keskimääräinen sanoo 0,6, tarkoittaa vain sitä, että se 842 00:50:10,100 --> 00:50:13,380 tuntuu kuin olisin enemmän 1s kuin 0s. 843 00:50:13,380 --> 00:50:16,160 >> Joten anna minun mennä eteenpäin ja näytä mitä tämä näyttää. 844 00:50:16,160 --> 00:50:17,470 Joten olen juuri menossa juoni tähän. 845 00:50:17,470 --> 00:50:22,852 846 00:50:22,852 --> 00:50:24,636 Katsotaanpa, miten tyhjentää. 847 00:50:24,636 --> 00:50:30,492 848 00:50:30,492 --> 00:50:31,468 Voi OK. 849 00:50:31,468 --> 00:50:35,840 850 00:50:35,840 --> 00:50:36,340 OK. 851 00:50:36,340 --> 00:50:37,590 >> Joten tämä on mitä se näyttää. 852 00:50:37,590 --> 00:50:46,310 Joten se tuntuu keltaiset I määriteltyjen kuten 0, ja sitten punainen Olen määritetty 1s. 853 00:50:46,310 --> 00:50:52,190 Joten tässä se näyttää etiketti pistettä ja se 854 00:50:52,190 --> 00:50:56,410 tuntuu et vain halusi joitakin tavallaan klusterointi tästä. 855 00:50:56,410 --> 00:51:01,020 >> Ja anna minun vain mennä eteenpäin ja näytä joitakin näistä sisäänrakennettuja toimintoja. 856 00:51:01,020 --> 00:51:03,580 Joten tässä on lm. 857 00:51:03,580 --> 00:51:06,060 Joten tämä on vain yrittää sopimaan linja tähän. 858 00:51:06,060 --> 00:51:08,640 Joten mikä on paras tapa että minä mahtuu linja tällaisten 859 00:51:08,640 --> 00:51:14,020 että se parhaiten erottaa tällainen klusterointi. 860 00:51:14,020 --> 00:51:21,790 Ja mieluiten, voit vain nähdä että olen vain ajaa kaikki nämä komennot 861 00:51:21,790 --> 00:51:25,450 ja sitten, aion eteenpäin ja lisää rivi. 862 00:51:25,450 --> 00:51:28,970 >> Joten tämä tuntuu paras arvaus. 863 00:51:28,970 --> 00:51:34,150 Se otetaan paras, joka minimoi virhe yrittää tunkea tätä linjaa. 864 00:51:34,150 --> 00:51:40,000 Ilmeisesti tämä näyttää ikään hyvä, mutta se ei ole paras. 865 00:51:40,000 --> 00:51:43,130 Ja lineaariset mallit, vuonna Yleensä tulevat olemaan 866 00:51:43,130 --> 00:51:46,811 todella suuri teoria ja vain eräänlainen rakennuksen perustekijät kone 867 00:51:46,811 --> 00:51:47,310 oppiminen. 868 00:51:47,310 --> 00:51:50,330 Mutta käytännössä, olet menossa haluavat tehdä jotain yleisempiä. 869 00:51:50,330 --> 00:51:54,280 >> Joten voit vain yrittää käynnissä jotain kutsutaan neuroverkon. 870 00:51:54,280 --> 00:51:57,110 Nämä asiat ovat yhä yleisempää. 871 00:51:57,110 --> 00:52:00,530 Ja ne vain toimivat uskomattoman suurten aineistojen. 872 00:52:00,530 --> 00:52:07,080 Joten tässä tapauksessa, me vain have-- Katsotaanpa see-- meillä nrow. 873 00:52:07,080 --> 00:52:09,010 Joten nrow on vain sanomalla rivien. 874 00:52:09,010 --> 00:52:11,790 Joten tässä tapauksessa minä on 100 huomautuksia. 875 00:52:11,790 --> 00:52:15,010 >> Joten anna minun mennä eteenpäin ja tehdä neuroverkko. 876 00:52:15,010 --> 00:52:18,620 Joten tämä on todella mukava koska voin vain sanoa nnet 877 00:52:18,620 --> 00:52:21,767 ja sitten olen taantumassa Y. Niin Y on sarakkeen. 878 00:52:21,767 --> 00:52:23,850 Ja sitten taantuu sen kaksi muuta muuttujaa. 879 00:52:23,850 --> 00:52:27,360 Joten tämä on lyhyempi merkintätapa X1 ja X2. 880 00:52:27,360 --> 00:52:29,741 >> Joten mene eteenpäin ja suorittaa tämän. 881 00:52:29,741 --> 00:52:30,240 Anteeksi. 882 00:52:30,240 --> 00:52:32,260 Minun täytyy ajaa koko juttu. 883 00:52:32,260 --> 00:52:37,500 Ja tämä on vain tulostus merkintätapa kuinka nopeasti tai ei nopeasti se 884 00:52:37,500 --> 00:52:38,460 lähentyneet. 885 00:52:38,460 --> 00:52:41,420 Joten se näyttää ei lähentyvät. 886 00:52:41,420 --> 00:52:44,970 Joten anna minun mennä eteenpäin ja tulostaa mitä tämä näyttää. 887 00:52:44,970 --> 00:52:51,260 >> Katso tässä kuva ja tässä ääriviivat siitä, miten hyvin se sopii. 888 00:52:51,260 --> 00:52:56,380 Ja tämä on just-- näet tämä, että tämä on erittäin, erittäin mukava. 889 00:52:56,380 --> 00:52:59,400 Se voisi olla jopa overfitting, mutta voit myös 890 00:52:59,400 --> 00:53:03,390 osuus tästä muiden tekniikoita, kuten rajat validointi. 891 00:53:03,390 --> 00:53:06,180 Ja nämä ovat myös rakennettu R. 892 00:53:06,180 --> 00:53:09,170 >> Ja haluan vain näyttää tukivektorikone. 893 00:53:09,170 --> 00:53:12,470 Tämä on toinen todella yhteinen tekniikka koneoppimista. 894 00:53:12,470 --> 00:53:18,550 Se on hyvin samanlainen kuin lineaariset mallit, mutta se käyttää mitä kutsutaan ydin menetelmä. 895 00:53:18,550 --> 00:53:22,790 Ja katsotaanpa kuinka hyvin, että ei. 896 00:53:22,790 --> 00:53:26,430 Joten tämä on hyvin samanlainen kuin miten hyvin neuroverkko suorittaa, 897 00:53:26,430 --> 00:53:27,900 mutta se on paljon tasaisempi. 898 00:53:27,900 --> 00:53:35,740 Ja tämä perustuu pois of what-- miten SVMs työtä. 899 00:53:35,740 --> 00:53:40,250 >> Joten tämä on vain hyvin Nopea katsaus joidenkin 900 00:53:40,250 --> 00:53:43,822 on sisäänrakennettuja toimintoja voit tehdä ja myös joitakin tietoja etsintä. 901 00:53:43,822 --> 00:53:45,905 Joten anna minun vain mennä eteenpäin ja palata dioja. 902 00:53:45,905 --> 00:53:50,290 903 00:53:50,290 --> 00:53:53,670 >> Joten ilmeisesti, tämä on ei kovin kattava. 904 00:53:53,670 --> 00:53:57,140 Ja tämä on oikeastaan ​​vain teaser osoittaa, mitä voit todella tehdä R. 905 00:53:57,140 --> 00:53:59,100 Joten jos haluaisin vain oppia lisää, tässä 906 00:53:59,100 --> 00:54:01,210 olemassa joukko erilaisia ​​resursseja. 907 00:54:01,210 --> 00:54:06,890 >> Joten jos olet ihastunut oppikirjoja tai olet vain ihastunut lukeminen asioita verkossa, 908 00:54:06,890 --> 00:54:09,670 niin tämä on fantastinen yksi Hadley Wickham, 909 00:54:09,670 --> 00:54:13,010 joka loi myös kaikki nämä todella siistiä paketteja. 910 00:54:13,010 --> 00:54:17,420 Jos olet ihastunut videoita, sitten Berkeley on mahtava bootcamp 911 00:54:17,420 --> 00:54:21,060 se several-- Sellainen pitkä. 912 00:54:21,060 --> 00:54:24,210 Ja se opettaa sinulle melkein kaikki mitä haluat tietää R. 913 00:54:24,210 --> 00:54:27,770 >> Ja samoin, siellä Codeacademy ja kaikki nämä muut lajitella 914 00:54:27,770 --> 00:54:29,414 interaktiivisia sivustoja. 915 00:54:29,414 --> 00:54:31,580 Ne ovat myös saada common-- yhä yleisempää. 916 00:54:31,580 --> 00:54:33,749 Joten tämä on hyvin samanlainen kuin Codeacademy. 917 00:54:33,749 --> 00:54:35,790 Ja lopuksi, jos vain haluavat yhteisön ja apua, 918 00:54:35,790 --> 00:54:38,800 nämä ovat joukko asiat voit mennä. 919 00:54:38,800 --> 00:54:40,880 Emme tietenkään vielä käyttää postituslistoille, vain 920 00:54:40,880 --> 00:54:44,860 kuten lähes kaikki muut ohjelmointikieli yhteisö. 921 00:54:44,860 --> 00:54:47,880 Ja #rstats, tämä on yhteisömme Twitter. 922 00:54:47,880 --> 00:54:49,580 Se on oikeastaan ​​melko yleinen. 923 00:54:49,580 --> 00:54:50,850 Ja sitten käyttäjä! 924 00:54:50,850 --> 00:54:52,340 On vain meidän konferenssissa. 925 00:54:52,340 --> 00:54:55,390 >> Ja sitten tietenkin, voit käyttää kaikkia näitä muita Q & asioita, 926 00:54:55,390 --> 00:54:57,680 kuten pinon ylivuodon, Google, ja sitten GitHub. 927 00:54:57,680 --> 00:55:00,490 Koska useimmat näistä paketeista ja paljon yhteisö 928 00:55:00,490 --> 00:55:03,420 keskitetään noin kehittäminen koodia, koska se on avoimen lähdekoodin. 929 00:55:03,420 --> 00:55:05,856 Ja se on vain todella mukava GitHub. 930 00:55:05,856 --> 00:55:08,730 Ja lopuksi, voit ottaa yhteyttä minuun, jos juuri mitään lyhyttä kysymystä. 931 00:55:08,730 --> 00:55:13,530 Joten löydät minut Twitterissä täällä, minun verkkosivuilla, ja vain minun email. 932 00:55:13,530 --> 00:55:17,840 Joten toivottavasti, että oli something-- vain lyhyt teaser 933 00:55:17,840 --> 00:55:20,900 mitä R on todella kykenee. 934 00:55:20,900 --> 00:55:23,990 Ja toivottavasti, juuri tarkistaa nämä kolme yhteyksiä 935 00:55:23,990 --> 00:55:25,760 ja katso mitä voit tehdä enemmän. 936 00:55:25,760 --> 00:55:28,130 Ja kai se on vain siitä. 937 00:55:28,130 --> 00:55:28,630 Kiitos. 938 00:55:28,630 --> 00:55:30,780 >> [APPLAUSE] 939 00:55:30,780 --> 00:55:31,968