[Musiikki soi] DUSTIN TRAN: Hei. Nimeni on Dustin. Joten minä esittelen Data Analysis in R. Vain vähän itsestäni. Olen tällä hetkellä jatko-opiskelija Engineering ja ammattikorkeakoulussa. Opiskelen risteyksessä koneoppimisen ja tilastot joten Data Analysis R on todella perustavanlaatuinen mitä Teen päivittäin. Ja R on erityisen hyvä tietojen analysointi koska se on erittäin hyvä prototyyppien. Ja yleensä, kun olet tekemässä jonkinlaista data-analyysi, paljon ongelmia ovat menossa kognitiivinen. Ja niin haluat vain olla joitakin todella hyviä kieltä, on vain hyvä tehdä sisäänrakennettuja toimintoja, toisin ja ottaa käsitellä alhainen asioita. Joten alussa, olen juuri menossa esitellä mitä on R, miksi haluat käyttää sitä, ja sitten mennä yli johonkin demo, ja vain mennä sieltä. Joten mikä on R? R on vain kieli kehittyi tilastollisiin computing ja visualisointi. Joten mitä tämä tarkoittaa, että se on erittäin hyvä kieli tahansa sellainen asia, joka käsittelee epävarmuuden tai tietojen visualisointia. Joten sinulla on kaikki nämä jakaumat. Siellä aiotaan sisäänrakennettuja toimintoja. Sinulla on myös erinomainen piirtämistä paketteja. Python on kilpaileva Kieli tietojen. Ja yksi asia, että pidän, että R on paljon parempi on visualisointi. Joten mitä näet demo kuin hyvin on vain hyvin intuitiivinen kieli että vain toimii erittäin hyvin. Se on myös ilmainen ja avoimen lähdekoodin, kuten on muita hyviä kielen luulisin. Ja tässä, nippu vain avainsanoja heitetään sinua. Se on dynaaminen, eli jos sinulla on tietyntyyppiset määritetty objekti kuin se täytyy vain muuttaa sitä lennossa. Se on laiska, joten se on fiksu miten se laskelmat. Toiminnallinen jolloin sitä voi todella toimia perustuu pois toimintoja niin anything-- minkäänlaista manipulaatiota olet teet, se perustuu pois toiminnot. Joten binary operaattoreille, esimerkiksi, ovat vain luonnostaan ​​toimintoja. Ja kaiken, aiot tehdä, on aiotaan ajaa pois toiminnot itse. Ja sitten olio samoin. Joten tässä on XKCD juoni. Ei vain koska minusta tuntuu XKCD on olennainen minkäänlaista Esityksen, mutta koska Minusta tuntuu tämä todella vasarat pisteeseen, että paljon kun teet jonkinlainen tietojen analyysi, ongelma ei ole niin paljon, kuinka nopeasti se kulkee, mutta kuinka kauan se tulee vie ohjelmoida tehtävään. Joten tässä on vain analysoida, onko strategia tai b on tehokkaampaa. Tämä tulee olemaan jotain, että olet aikovat käsitellä paljon in eräänlainen matalan tason kielillä missä olet tekemisissä seg viat, muistin jakamista, alustukset, jopa tehdä sisäänrakennettuja toimintoja. Ja tätä tavaraa on kaikki hoidetaan hyvin, hyvin tyylikkäästi R. Joten vain vasaraan tähän piste, suurin pullonkaula tulee olemaan kognitiivisia. Joten tietojen analysointi on erittäin kova ongelma. Olitpa tekemässä koneoppimisen tai olet tekee vain jonkinlainen perustiedot etsintä, et halua olla ottaa asiakirja ja sitten koota jotain aina halua nähdä, mitä sarake näyttää, mitä erityisesti merkinnät matriisi näyttää. Joten haluat vain olla joitakin todella mukava käyttöliittymä voit suorittaa yksinkertainen funktio että indeksit tahansa haluat ja vain ajaa sen sieltä. Ja tarvitset verkkotunnuksen tiettyjä kieliä tähän. Ja R todella auttaa sinua määrittelemään ongelma ja ratkaista se tällä tavalla. Joten tässä on käyrä, ohjelmointi suosio R se on mennyt ajan. Joten kuten näette, kuten 2013 tai niin se vain räjäytettiin valtavasti. Ja tämä on ollut juuri siksi, että valtava kehitys teknologiateollisuudessa noin iso data. Lisäksi ei vain teknologia teollisuus, mutta oikeastaan kaikki teollisuus that-- koska paljon teollisuuden ovat tavallaan olennainen yrittää ratkaista näitä ongelmia. Ja yleensä, sinulla voi olla joitakin hyviä tapa mitata näitä ongelmia tai jopa määritellään ne tai niiden ratkaiseminen tietojen avulla. Joten mielestäni nyt R on 11 Suosituin kieli TIOBE ja se on ollut kasvussa siitä lähtien. Joten tässä on joitakin enemmän piirteitä R. Se on valtava määrä paketteja ja kaikki nämä eri asioita. Joten aina, kun on tietty ongelma, useimmat aika R on että toiminto sinulle. Joten, haluatko rakentaa jonkinlainen kone oppiminen algoritmi nimeltään Random Forest tai päätös Puut, tai edes yrittää ottaa keskiarvo toiminto tai tätä kamaa, R on, että. Ja jos et välität optimointi, yksi asia, joka on yhteinen on, että kun olet valmis prototyyppien jonkinlainen korkean tason kieli, voit heittää että in-- Sinun täytyy vain portti, joka yli Joidenkin matalan tason kieli. Mitä hyvää R on, että kun olet tehty prototyyppien se, voit käyttää C ++, tai Fortran, tai mitä tahansa näiden alemman tason suoraan R. Niin, että yksi todella mainio ominaisuus noin R, jos todella välität optimointi piste. Ja se on myös todella hyvä web visualisointeja. Niin D3.js, esimerkiksi, on Luulen toisessa seminaarissa että esitimme tänään. Ja tämä on todella mahtava tekee interaktiivisia visualisointeja. Ja D3.js oletetaan, että sinulla on jonkinlainen piirrettävä data ja R on hyvä tapa, että voin tehdä data-analyysi, ennen kuin viet sen yli D3.js tai jopa vain ajaa D3.js komentoja R itse, sekä kaikki nämä muiden kirjastojen samoin. Niin että oli vain käyttöönotto mikä on R ja miksi saatat käyttää sitä. Joten toivottavasti, olen vakuuttunut jotain noin vain yrittää nähdä, mitä se on. Joten aion mennä eteenpäin ja käydä läpi Joissakin perustekijöiden noin R esineitä ja mitä voit todella tehdä. Joten tässä on vain nippu matematiikka komentoja. Joten sanon you're-- haluat rakentaa kieli itsesi ja haluat vain on joukko erilaisia ​​työkaluja. Minkäänlaista toimintaa luulet haluat haluavat aika paljon olemaan R. Joten tässä on 2 plus 2. Tässä on 2 kertaa pi. R on joukko sisäänrakennettu vakioita että voit usein käyttää kuten pi, e. Ja sitten, tässä on 7 plus runif, joten runif 1. Tämä on toiminto, joka on luo yksi satunnainen yhtenäinen 0-1. Ja sitten on 3 potenssiin 4. On neliöjuuret. On loki. Joten kirjautua tekee pohja eksponentiaalinen itsestään. Ja sitten, jos määrität pohja, sitten voit tehdä mitä pohja haluat. Ja sitten tässä on joitakin muita komentoja. Joten sinulla on 23 mod 2. Sitten on jäljellä. Sitten on tieteellinen muodossa, jos sinulla on myös haluavat tehdä vain enemmän ja enemmän monimutkaisia ​​asioita. Joten tässä on tehtävä. Joten tyypillinen toimeksiannot R tehdään nuoli niin se on alle ja sitten väliviivaa. Joten tässä olen vain määrittämällä 3 muuttujan val. Ja sitten olen tulostamalla val ja sitten se tulostaa kolme. Oletuksena R tulkki, se tulostaa asioita sinulle joten sinun ei tarvitse määrittää tulostamaan val tahansa haluat tulostaa jotain. Voit vain tehdä val ja niin se tulee tehdä sinulle. Voit myös käyttää tasavertaisina teknisesti toimeksiantona operaattori. Vähäisiä vivahteet välillä käyttämällä nuoli operaattori ja equals operaattorin tehtäviin. Enimmäkseen Sopimuksen mukaan jokainen vain nuolinäppäimillä operaattori. Ja tässä, olen osoitetaan tämän vino merkintätapa kutsutaan 1 paksusuolen 6. Tämä luo vektori 1-6. Ja tämä todella mukavaa, koska silloin juuri määrittää vektorin val ja joka toimii itsestään. Joten tämä on jo menee single-- hyvin intuitiivinen tiedot rakenne vain kaksinkertainen tietyntyyppinen tyypin vektoriin ja joka kerää kaikkia skalaariarvot sinulle. Joten kun menee skalaari, sinun on R-esineitä ja tämä on vektori. Vektori on minkäänlaista kokoelma samantyyppisiä. Joten tässä ovat joukko vektoreita. Joten tämä on numeerinen. Numerolla on R: n tapa sanoa kaksinkertainen. Ja niin oletusarvoisesti kaikki numero on kaksinkertainen. Joten jos sinulla on C 1.1, 3, negatiivinen 5.7, c on funktio. Tämä ketjuttaa kaikki kolme numerot vektoriin. Ja tämä be-- joten jos huomaat 3 itse, yleensä otatte että tämä on kuin kokonaisluku, mutta koska kaikki vektorit ovat samantyyppisiä, tämä on vektori tuplaa tai numeerinen tässä tapauksessa. rnorm on toiminto, joka tuottaa standardi normaali variables-- tai standardin normaaliarvot. Ja olen täsmennetään niistä kaksi. Joten mulla rnorm 2, osoitetaan, että devs, ja sitten olen tulostamalla devs. Joten nämä ovat vain kaksi satunnainen normaaliarvot. Ja sitten INTs jos teet välität kokonaislukuja. Joten tämä on vain noin muisti jakaminen ja tallentaminen muistin koko. Joten sinun olisi liitettävä numeroita isolla L. Yleensä tämä on R: n historiallinen merkintätapa jotain kutsutaan pitkän kokonaisluku. Joten suurimman osan ajasta, luultavasti olla tekemisissä nelinpelin. Ja jos joskus myöhemmin on optimoida koodia, voit vain lisätä nämä L's jälkeenpäin tai sen aikana jos olet kuten ennakoivaa mitä aiot tehdä näitä muuttujia. Joten tässä on merkki vektori. Joten, jälleen, olen ketjuttamalla kolme jouset tällä kertaa. Huomaa, että kaksinkertainen jouset ja yksi jouset ovat samat R. Joten minulla on Arthur ja Marvin ja niin kun olen tulostamalla, ne kaikki aiomme näyttää kaksinkertainen jouset. Ja jos haluat myös sisällyttää yhden tai kahden hengen jono teidän merkkejä, niin voit joko vuorottelevat jousille. Joten Marvinin varten Toinen tekijä, tämä on menossa show-- sinulle vain kaksinkertainen jouset ja sitten yksi merkkijono joten tämä on vuorotellen. Muuten, jos haluat käyttää kaksinkertaista merkkijono operaattori kaksinkertainen string kun olet julistaa sitten käytät vain paeta operaattori. Joten et kenoviiva kaksinkertainen string. Ja lopuksi, me myös on looginen vektoreita. Joten logical-- niin totta ja EPÄTOSI, ja he olemaan kokonaan isoilla kirjaimilla. Ja sitten taas, olen ketjuttamalla ne ja sitten määrittämällä ne bools. Joten bools aikoo näyttää te tosi, epätosi ja tosi. Joten tässä on vektoroitua indeksointi. Joten alussa, minä Käytän function-- tätä kutsutaan sequence-- sekvenssi 2-12. Ja otan sekvenssi 2. Joten se aikoo tehdä 2, 4, 6, 8, 10 ja 12. Ja sitten, olen indeksointi saada kolmas elementti. Joten yksi asia pitää mielessä on että R indeksit lähtemällä 1. Joten Vals 3 aikoo antaa te kolmas elementti. Tämä on eräänlainen eroaa muista kielillä, jossa se alkaa nollasta. Joten C tai C ++, esimerkiksi olet menossa neljäs elementti. Ja tässä on Vals 3-5. Niin yksi asia, joka on todella siistiä on, että voi tuottaa väliaikaisia ​​muuttujia sisällä ja sitten vain käyttää niitä lennossa. Joten tässä on 3-5. Joten olen tuottavan vektorin 3, 4, ja 5 ja sen jälkeen Olen indeksointi päästä kolmas, Neljäs ja viides elementtejä. Joten Vastaavasti voit abstrakti tämä vain tehdä minkäänlaista vektorin joka antaa sinulle indeksointi. Joten tässä on Vals ja sitten ensimmäinen, kolmas ja kuudes elementtejä. Ja sitten, jos haluat tehdä täydennys, joten et vain miinus jälkeenpäin ja että saat antaa sinulle kaiken, joka ei ole Ensimmäinen, kolmas tai kuudes elementti. Joten tämä on 4, 8, ja 10. Ja jos haluat saada jopa kehittyneempää, voit kytkeä peräkkäin Boolen vektoreita. Joten tämä indeksi on menossa antaa teille Tämän Boolen vektori, jonka pituus on 6. Joten rep TOSI pilkku 3. Tämä toistaa TOSI kolme kertaa. Joten tämä antaa sinulle vektori TOSI, TOSI, TOSI. rep FALSE 4-- tämä on menossa antaa teille vektori väärä, väärä, väärä, väärä. Ja sitten C on menossa liität nämä kaksi Booleans yhdessä. Joten aiot saada kolme Trues ja sitten neljä FALSEs. Niin, että kun indeksi Vals, olet menossa TOSI, TOSI, TOSI. Niin että menee kyllä, Haluan näihin kolmeen. Ja sitten väärä, väärä, Väärä, väärä on menossa sanoa mitään, en halua näitä tekijöitä joten se ei aio palauttaa ne. Ja kai siellä oikeastaan ​​typo täällä koska tämä sanoo toista TOSI 3 ja toista EPÄTOSI 4, ja teknisesti, voit vain kuusi elementtejä niin jatkuvasti virheellisesti, sen pitäisi olla jatkuvasti virheellisesti 3. Mielestäni R on myös fiksu kuten että jos vain määrittää 4 täällä, sitten se ei edes virhe ulos. Se vain antaa sinulle tämän arvon. Joten se tulee vain sivuuttaa, että neljäs EPÄTOSI. Joten tässä on vektoroitua toimeksianto. Joten set.seed-- tämä vain asettaa siemeniä pseudorandom numeroita. Joten olen asettamalla siemenen 42, mikä tarkoittaa, että jos minä tuottaa kolme satunnainen normaali arvot, ja sitten jos ajaa set.seed oman tietokoneeseen sama arvo 42, niin saat myös Sama kolme satunnainen normaalit. Joten tämä on todella hyvä Toistettavuustes-. Yleensä, kun teet joitakin tavallaan tieteellisen analyysin, haluaisi asettaa siemen. Näin muut tutkijat voivat vain jäljentää täsmälleen sama koodi olet tehdään, koska he ovat juuri Sama satunnaismuuttujia that-- tai satunnainen arvoja, jotka olet ottanut samoin. Ja niin vektoroitua toimeksianto tässä näkyy Vals 1-2. Joten se vie kaksi ensimmäistä elementit Vals ja sitten määrittää ne 0. Ja sitten, voit myös vain tehdä samanlainen juttu Booleans. Joten Vals ei ole sama kuin 0-- tämän tahtoa antaa sinulle vektori väärä, väärä, TOSI tässä tapauksessa. Ja sitten, se tulee sanoa mitään Näiden indeksien jotka olivat TOSI, sitten se tulee määrittää, että 5. Joten se vie kolmas elementti täällä ja sitten määrittää sen 5. Ja tämä on todella mukava verrattuna matalan tason kielillä jossa sinun täytyy käyttää silmukoita tehdä kaikki tämä vektoroitua kamaa koska se on vain hyvin intuitiivinen ja se on yksi sutkaus. Ja mitä hienoa vektoroitua merkintätapa on, että R, nämä ovat tavallaan sisäänrakennettu jotta he melkein yhtä nopeasti kuten tekee matalan tason kieli vastustavat tehdä silmukka R ja sitten ottaa sen tehdä dynaaminen indeksointi itse. Ja se tulee olemaan hitaampaa kuin teet tällaista vektoroitua asia jossa se voi tehdä sen rinnalla, jos se tekee sitä ketjuttaminen pohjimmiltaan. Joten tässä on vectorized toimintaa. Joten olen tuottavan arvo 1-3, osoitetaan, että vec1, 3-5, vec2, lisäämällä ne yhteen. Se lisää niitä komponentti-viisas niin se 1 plus 3, 2 plus 4, ja niin edelleen. vec1 kertaa vec2. Tämä moninkertaistaa kaksi arvot komponentti viisas. Joten se on 1 kertaa 3, 2 kertaa 4, ja sitten 3 kertaa 5. Ja sitten, samalla voit myös tehdä comparisons-- looginen vertailuja. Joten se on VÄÄRIN VÄÄRIN TOSI tässä tapauksessa, koska 1 ei ole suurempi kuin 3, 2 ei ole suurempi kuin 4. Tämä on kai, toinen typo, 3 ei todellakaan ole suurempi kuin 5. Joo. Ja niin voit vain tehdä kaikki nämä yksinkertaiset toimet koska heidän peritty luokista itse. Niin että oli vain vektori. Ja se on tavallaan keskeisimpiä R esine koska annettu vektori, voit rakentaa kehittyneempiä esineitä. Joten tässä matriisissa. Tämä on lähinnä abstraktio mitä matriisi on itse. Joten tässä tapauksessa, se on kolme erilaista vektoreita, missä jokainen on sarake, tai voit harkita sitä koska jokainen on rivi. Joten olen tallentamiseksi matriisi 1 9 ja sitten olen täsmennetään 3 krs. Joten 1-9 antaa sinulle vektori 1, 2, 3, 4, 5, 6, ja aina 9. Yksi asia myös pitää mielessä, että R myymälää arvot sarakkeessa-suuria-muodossa. Eli toisin sanoen, kun näet 1 9, se tulee tallentaa them-- se tulee olemaan 1, 2, 3 ensimmäisessä sarakkeessa, ja sitten se tulee tehdä 4, 5, 6 toisessa sarakkeessa, ja sitten 7, 8, 9 kolmannessa sarakkeessa. Ja tässä on joitakin muita yhteisiä toimintoja voit käyttää. Niin hämärä matto, tämä antaa sinulle mitat matriisin. Se tulee palauttaa sinut vektori ulottuvuus. Joten tässä tapauksessa, koska Meidän matriisi on 3 3, se tulee antaa sinulle numeerinen vektori se 3 3. Ja tässä on vain näyttää matriisitulo. Joten yleensä, jos vain tehdä asterisk-- joten matto tähdellä mat-- tämä tulee olemaan komponentti-viisas toiminta tai mitä kutsutaan Hadamard- tuote. Joten se tulee tehdä jokaiselle elementtikomponentti-viisas. Kuitenkin, jos haluat matriisi multiplication-- joten kertomalla ensimmäisen rivin kertaa toisen matriisin ensimmäinen sarake ja niin on-- käyttäisit Tämän prosenttia toiminta. Ja t matto on vain operaation transpoosia. Joten sanon ottaa ne osaksi matriisi, kerro se matriisi itse. Ja sitten se tulee palata teille toisen 3 3 matriisi, josta ilmenee tuotteen sinua halua. Ja niin se oli matriisi. Tässä on mitä kutsutaan datakehystä. Datakehystä voit ajatella niin matriisi, mutta kukin sarake itse tulee olemaan erityyppisiä. Joten mitä todella siistiä noin tiedot kehykset on, että tietojen analysointi sinänsä, olet menossa on kaikki tämä heterogeeniset tiedot ja kaikki nämä todella sotkuinen asioita jossa kukin sarakkeet itse voivat olla erityyppisiä. Joten tässä minä sanon luoda datakehyksessä tehdä ints 1-3, ja sitten on myös merkki vektori. Joten voin indeksi kautta kukin näistä sarakkeet ja sitten saan arvot itse. Ja voit myös tehdä jonkinlainen Toiminnan tietojen kehyksiä. Ja suurimman osan ajasta, kun olet tekee tietojen analysointi tai jonkinlainen jalostusaste, voit olla työskentelemme näiden tietorakenteiden jossa kukin sarake on menossa olla erityyppisiä. Lopuksi, joten nämä ovat lähinnä vain neljä olennaista esineitä R. List vain kerää muut esineet haluat. Joten se tallentaa tämän yhdeksi muuttuja, että voit helposti. Joten tässä, otan lista. Sanon tavaraa yhtä kuin 3. Joten aion olla yksi osatekijä lista, ja tätä kutsutaan kamaa, ja se tulee olla arvo 3. Voin myös luoda matriisi. Joten tämä on 1-4 ja loppuun rivi on yhtä suuri kuin 2, niin 2 2 matriisi. Myös listan ja sitä kutsutaan matto. moreStuff, merkkijono, ja jopa toinen lista sinänsä. Joten tämä on luettelo, joka on 5 ja karhu. Joten se on arvo 5 ja se on merkkijono karhu ja se lista sisällä lista. Joten voit olla näitä rekursiivinen asioita, jos sinulla another-- kirjoita sisällä tyyppi. Joten samalla, voit olla matriisi sisällä toinen matriisi ja niin edelleen. Ja lista on vain hyvä tapa kerätä ja kokoamiseen kaikki nämä eri esineet. Ja lopuksi, tässä on vain auttaa asiassa tämä oli vain mennyt yli hyvin nopeasti. Joten milloin olet hämmentynyt noin jonkinlainen funktio, voit tehdä apua kyseisen toiminnon. Joten voit tehdä apua matriisi tai kysymysmerkki matriisi. Ja apua ja kysymysmerkki ovat vain vain lyhenne sama asia joten he aliaksia. lm on toiminto, joka vain ei lineaarinen malli. Mutta jos vain ei ole aavistustakaan, miten tämä teoksia, voit vain tehdä apua lm ja että annan sinulle joitakin tavallaan dokumentaatiosta näyttää ikään kuin manuaalisivua Unix, jossa sinulla on lyhyt kuvaus siitä, mitä se myös mitä sen väitteet ovat, mitä se palaa, ja vain vihjeitä käyttää sitä, ja esimerkkejä samoin. Joten anna minun mennä eteenpäin ja näytä demo käyttää R. OK. Joten menin hyvin nopeasti vain tiedot rakenteet ja jonkinlainen op-- jotkut toiminnot. Tässä on joitakin toimintoja. Joten tässä olen juuri menossa määritellä funktio. Joten olen myös käyttämällä sijoitusoperaattorin täällä, ja sitten en sano julistaa sen funktiona. Ja se saa arvon x. Joten tämä on mitään arvoa haluat ja aion palata x itse. Joten tämä on Identiteettifunktio. Ja mitä on siistiä tästä verrattuna muihin kieliin ja toinen matalan tason kieliä on, että x voi olla mitä tahansa tyyppiä itse ja se tulee palauttaa, että tyyppi. Joten voit imagine-- joten anna minulle vain ajaa tätä nopeasti. Anteeksi. Joten yksi asia Haluan mainita myös on, että tämä toimittaja käytän kutsutaan rstudio. Tämä on mitä kutsutaan IDE. Ja yksi asia, joka on todella mukava tästä on se, että se sisältää paljon asioita haluat tehdä tutkimus- itse vain hyvin intuitiivisesti. Joten tässä on tulkki konsoli. Joten samalla, voit myös saada tämän konsoli raaka vain tekemällä pääoman R. Ja tämä on täsmälleen sama asia kuin konsoli. Joten voin vain tehdä id funktio x, x, x. Ja then-- ja sitten, että on hieno itse. Joten rstudio on suuri koska se on konsoli. Se on myös asiakirjojen haluat ajaa. Ja sitten se on joitakin muuttujia että näet ympäristöissä. Ja sitten, jos sinulla on tehdä tontteja, niin voit voi vain nähdä sen täällä, toisin kuin hoitaa kaikki nämä erilaiset ikkunat itse. Olen itse henkilökohtaisesti käyttää Vim, mutta minä tuntuu rstudio on erinomainen vain saada hyvä idea miten käyttää R. Yleensä kun yrität oppia uusi tehtävä, et halua käsitellä liian monta asiaa kerralla. Joten R on vain very-- rstudio on erittäin hyvä tapa oppia R ilman käsitellä kaikki nämä muut asiat. Joten tässä olen käynnissä id hei. Tämä palauttaa hei. id 123. Tässä on vektori kokonaislukuja. Joten samalla, koska voit ota jonkinlainen arvo, voit tehdä paluuta id X niin se palaa 1234 ja 5. Ja haluan vain osoittaa teille, että tämä on todellakin kokonaisluku. Ja samoin, jos et luokka id x, se tulee olemaan kokonaisluku. Ja sitten, voit myös vertailla kahta ja se on totta. Joten olen tarkkailun jos id x on yhtä suuri kuin tasavertaisten X ja huomautus että se antaa sinulle kaksi trues. Joten tämä ei sano ovat kaksi objektia identtiset, mutta ovat kukin merkinnät sisällä vektorit identtiset. Tässä on bounded.compare. Joten tämä on hieman monimutkaisempi että sillä on, jos kunto ja muuta ja sitten se kestää kaksi argumentteja kerrallaan. Joten x on kaikenlaisia. Ja en sano tätä Toinen argumentti on. Tämä voi olla mitä samoin. Mutta oletuksena, se tulee ottaa 5 jos et määritä mitään. Joten tässä aion sanoa Jos x on suurempi kuin. Joten jos en määritä, se sanoo, että jos x on suurempi kuin 5, sitten aion palata TOSI. muuta, aion palata FALSE. Joten anna minun mennä eteenpäin ja määritellä tätä. Ja nyt aion ajaa bounded.compare 3. Niin se sanoo on 3 vähemmän than-- on 3 yli 5. Ei, se ei ole niin EPÄTOSI. Ja bounded.compare 3 ja aion verrata sitä käyttäen yhtä kuin 2. Joten nyt sanon kyllä, nyt minä haluavat olla jotain muuta. Joten aion sanoa, sinun pitäisi olla 2. Voin joko tehdä tällaisia notaatio tai sanon = 2. Tämä on enemmän luettavissa että kun olet tarkastelee näitä todella monimutkaisia ​​toimintoja, että ottaa useita arguments-- ja tämän voi olla kymmeniä oftentimes-- vain sanomalla = 2 on enemmän luettavissa niin, että myöhemmin tulevaisuudessa tiedät mitä olet tekemässä. Joten tässä tapauksessa, olen sanonta on 3 yli 2. Kyllä se on. Ja samalla, voin vain poistaa ja sanoa, on 3 enemmän kuin 2 missä = 2. Ja se on myös totta. Kyllä? Yleisö: Oletko täytäntöönpanosta rivi riviltä? DUSTIN TRAN: Kyllä olen. Joten mitä teen tässä ottaen tämä teksti document-- ja mitä hienoa rstudio on, että Voin vain ajaa short-- pikanäppäimen. Joten mulla Ohjaus-Enter. Ja sitten, otan rivin tekstitiedostona ja sitten laittoi konsolissa. Joten tässä minä sanon, bounded.compare ja mulla Ohjaus-X. Joten voin vain loppuvat täällä. Ja sitten, että otan rivi ja sitten laittaa sen tänne. Ja sitten samalla, voin ajaa täällä. Ja sitten se vain pitää määritellään rivit konsoli niin. Ja jos myös huomata kihara olkaimet ovat siellä aivan kuten C syntaksi. x-- jos jos ehto on myös aio käyttää sulkeita ja sitten voit käyttää muualla. Toinen on muuta, jos. Joten tämä tulee olemaan x on yhtä yhtä suuri, esimerkiksi. Ja sitten aion palata jotain täällä. Huomaa, että on olemassa kaksi eri asioita täällä joka on meneillään. Yksi on se, että täällä olen täsmennetään palauttaa arvon TOSI. Täällä Sanon vain x. Joten R tulee yleensä oletuksena ottaa viimeinen arguments-- tai ottaa viimeisen rivin koodia, ja se tulee olemaan, mitä se palasi. Joten tässä tämä on sama asia kuin tekee paluun x. Ja vain näyttää. Ja sitten, se toimii juuri niin. Joten anna minun jatkaa tätä. Joten if. Ja oikeastaan, voin palata mitä haluaisin. Joten en edes tarvitse paluu Booleans koko ajan, Voin vain palata jotain muuta. Voin siis tehdä paluun karhu. Joten jos x on yhtä kuin yhtä suuri, se tulee palauttaa karhu. Muuten, se tulee palauttaa TOSI. Voin myös tehdä vektori tai oikeastaan ​​mitään. Ja yleensä staattisesti kirjoitetut tekstit, sinun täytyy määrittää tyypin täällä. Ja huomaa, että se voi vain olla mitä tahansa. Ja R on älykäs riitä, että se vain tehdä tämän, ja se toimii hyvin. Joten anna minun määritellä tämän. Unexpected-- OH pahoillani. Sen pitäisi olla kihara ahdin täällä. OK. Cool. Selvä. Joten nyt katsotaanpa vertailla 3 ja on yhtä suuri kuin 3. Joten se olisi return-- yeah-- arvo karhu. Joten nyt yleisempi asia on kuin Entä muut tietorakenteita. Joten sinulla on tämä toiminto. Tämä on menossa töihin minkäänlaisen arvon kuin 3 tai numeerinen, toisin sanoen, kaksinkertainen. Mutta entä jotain vektorin. Mitä tapahtuu, jos do-- joten olen menossa antaa val vaikkapa 4-6. Joten jos palaan tähän, tämä on vektori 4, 5, 6. Katsotaanpa nyt, mitä tapahtuu jos en tee bounded.compare val. Joten tämä on aio antaa teille 15 1251. Eli toisin sanoen, se sanoo jos tarkastellaan tämän edellytyksen niin se sanoo x on pienempi kuin tai jotain. Joten tämä on hieman sekavaa, koska nyt et vain tiedä mitä tapahtuu. Joten kai yksi asia, joka todella hyvää vain yrittää debug on, että voit vain tehdä val on suurempi kuin ja nähdä, mitä siellä tapahtuu. Joten val-- on oletuksena 5 niin Haluan vain tehdä Val yli 5. Joten tämä on vektori VÄÄRIN VÄÄRIN TOSI. Joten nyt kun etsit Tässä se tulee sanoa, jos ja sitten se aio antaa teille tämän on vektori VÄÄRIN VÄÄRIN TOSI. Joten kun ohitat tämän osaksi R, R ei ole aavistustakaan, mitä olet tekemässä. Koska se odottaa yhden arvo, joka on Boolen, ja nyt annat sen vektori Booleans. Joten oletuksena, R on vain aikoo sanoa mitä hittoa, Aion olettaa, että olet menossa ottamaan ensimmäisen elementin täällä. Joten aion say-- aion olettaa, että tämä on EPÄTOSI. Joten se tulee sanoa no, tämä ei ole oikea. Samoin se tulee olla val yhtä kuin yhtä suuri. Ei, anteeksi 5. Ja se on myös olemaan väärä samoin. Joten se tulee sanoa ei, se ei ole totta yhtä hyvin niin se aio palata tähän viimeinen. Joten tämä on joko hyvä tai huono asia, riippuen siitä, miten katsella sitä. Koska kun olet luoda näitä toimintoja, et oikeastaan ​​tiedä, mitä on tekeillä. Joten joskus et haluaisi virhe, tai ehkä vain haluavat varoituksen. Tällöin R ei tee niin. Joten se on todella jopa te perustuu pois mitä luulet kieli pitäisi tehdä tässä tapauksessa jos ohitat vektori Booleans kun teet, jos ehto. Joten sanotaan, että sinulla oli alkuperäinen yksi jos muu return true ja olet aio palata FALSE. Joten yksi tapa abstracting tämä on sanoa ei tarvitse edes tämä ehdollinen asia. Toinen asia mitä voin tehdä, on vain palaavat arvot itse. Joten jos huomaat, jos do Val on suurempi kuin 5, tämä tulee palauttaa vektori VÄÄRIN VÄÄRIN TOSI. Ehkä tämä on mitä haluavat bounded.compare. Haluat palata vektori Booleans jossa se vertaa jokaista arvojen itselleen. Joten voit vain eivät bounded.compare funktio x, on yhtä suuri kuin 5. Ja sitten sen sijaan tehdä Tämä jos muu ehto, Olen juuri menossa palata x on suurempi kuin 5. Joten jos se on totta, niin se tulee palauttaa TOSI. Ja sitten jos se ei ole, se on aio palata FALSE. Ja tämä toimii tahansa näistä rakenteista. Voin siis bounded.compare c 1 6 tai 9 ja sitten aion sanoa yhtä kuin 6, esimerkiksi. Ja sitten se tulee anna sinulle oikeutta Boolen vektori, että olet suunnittelussa. Joten ne ovat vain toiminnot ja nyt haluan vain näyttää sinulle joitakin interaktiivisia grafiikka. En usko, olen oikeastaan Wi-Fi täällä niin haluaisin vain mennä eteenpäin ja ohita tämä luulisin. Mutta yksi asia, että on siistiä kuitenkin on, että jos vain haluavat testata nippu erilaisia ​​tietoja komentoja, on joukko erilaisia ​​aineistoja jotka on jo esiladattuja R. Joten yksi niistä on nimeltään iiris aineisto. Tämä on yksi tunnetuimmista pienimmille koneoppimista. Sinun yleensä vain tehdä jonkinlainen testitapaukset nähdä, jos koodi toimii. Joten vain tarkistaa, mitä iiris on. Joten tämä asia on menossa olla datakehyksen. Ja se on aika pitkä, koska Minä vain tulostaa iiris. Se tulostamalla koko juttu. Joten se on kaikki nämä eri nimiä. Joten Iiriksen kokoelma erilaisia ​​kukkia. Tässä tapauksessa se on kertoa te lajien sitä, kaikki nämä eri leveyttä ja pituudet verholehti ja terälehti. Ja niin normaalisti, jos haluat tulostaa iiris, Esimerkiksi et halua olla se tehdä kaiken tämän, koska se voi kestää yli koko konsolin. Niin yksi asia, joka todella kiva on pää toiminto. Joten jos vain tehdä pää iiris, tämä antaa sinulle ensimmäiset viisi riviä, tai kuusi luulisin. Ja sitten hyvin, sinun voi vain määrittää täällä. Joten 20-- tämä antaa olet ensimmäinen 20 riviä. Ja olen itse ollut sellainen on yllättynyt, että tämä antoi minulle kuusi joten anna minun mennä eteenpäin ja tarkista iris-- tai pään, sorry. Ja tässä se antaa te asiakirjat mitä arvoa pää tekee. Joten se palaa ensin tai viimeinen kohde. Ja sitten aion katso oletusarvot. Ja sitten se sanoo oletuksena menetelmä pää x ja n on 6L. Joten tämä palaa kuuden ensimmäisen elementtejä. Ja samoin jos huomaat täällä, minä ei tarvitse määritellä n on 6. Oletuksena se käyttää kuusi, luulisin. Ja sitten, jos haluan määrittää tietyn arvoa, niin voin katsella että samoin. Niin, että on joitakin yksinkertaisia ​​komentoja ja tässä on toinen, joka on just-- hyvin, Olen can-- tämä on oikeastaan hieman monimutkaisempi, mutta tämä kestää vain luokan Kunkin sarakkeen iiris aineisto. Joten tämä näyttää, mitä kukin näistä sarakkeet ovat mitattuna niiden tyyppejä. Joten verholehti pituus on numeerinen, verholehti leveys on numeerinen. Kaikki nämä arvot ovat vain numeerinen koska voit kertoa näistä tiedoista jäsentää nämä ovat kaikki menee numeerinen. Ja Laji sarake tulee olemaan tekijä. Joten normaalisti, luulisi, että tämä on kuin merkkijono. Mutta jos et vain irisSpecies, ja sitten aion tehdä pää 5, ja tämä tulee tulostaa ulos viiden ensimmäisen arvoja. Ja sitten huomaa tätä tasoa. Joten tämä on saying-- tämä on R: n tavoin ottaa kategorisen muuttujan. Joten sen sijaan vain ottaa merkkijonoja, se on tasoa täsmennetään joka nämä asiat ovat. Joten sanokaamme irisSpecies 1. Joten mitä haluat tehdä tässä olen subsetting tämän lajin sarakkeeseen. Joten tämä vie Laji sarake ja sitten Se indeksoi saada ensimmäinen elementti. Joten tämä pitäisi antaa sinulle setosa. Ja se myös antaa sinulle tasoa täällä. Joten voit myös vertailla Tämän merkin setosa ja tämä ei tule olla totta, koska yksi on eri tyyppiä kuin muut. Tai kai se on totta, koska R on älykkäämpi kuin. Ja näyttää tällä ja sitten sanoo, ehkä tämä on mitä haluat. Joten se tulee sanoa merkki merkkijono setosa on sama kuin tämä. Ja sitten Vastaavasti voit myös vain napata nämä kuten niin edelleen. Tämä on siis vain jonkinlainen nopeasti käskyjä aineisto. Joten tässä on joitakin tietoja etsintä. Joten tämä on hieman enemmän mukana tietojen analysointi. Ja tämä on otettu joitakin Bootcamp vuonna R Berkeley. Joten kirjasto ulkomaisia. Joten aion latautuu kirjasto, joka kutsutaan ulkomaisia. Joten tämä on aio antaa minulle read.dta niin oletetaan, että minulla on tämä aineisto. Tämä on tallennettu nykyisen Työhakemiston minun konsolin. Joten vain nähdä mitä työhakemistossa on. Joten tässä on minun työhakemistossa. Ja lukea pistedata, tämä asia, sanoo tämä tiedosto sijaitsee data kansioon Tämän työhakemistosta. Ja read.dta tämä ei ole Oletuksena komento. Luulen ladattu sen jo. IEI olettaa Olen ladattu tämän jo. Mutta niin read.dta ei tule olla oletuksena komento. Ja siksi olet menossa on ladata tässä kirjastossa package-- tämä paketti nimeltään ulkomaisia. Ja jos sinulla ei ole paketin, luulen Ulkomaisten on yksi sisäänrakennettu niistä. Muuten, voit myös do install.packages ja tämä asentaa paketin. Ja tämä antaa sinulle R. Tuota, ei. Ja sitten olen juuri menossa lopettaa tätä, koska minulla on jo se. Mutta mitä todella mukavaa noin R on, että paketti hallinta järjestelmä on erittäin tyylikäs. Koska se tallentaa kaiken todella hienosti sinulle. Joten tässä tapauksessa, se tulee säilyttää sen, uskon, tätä kirjastoa täällä. Joten milloin haluat asentaa uusia paketteja, se on aivan yhtä helppoa kuin tekee install.packages ja R hoitaa kaikki paketteja sinulle. Joten sinun ei tarvitse tehdä jotain Python, jossa on ulkoinen paketti johtajat kuten paperi Anaconda missä olet doing-- asennat paketit ulkopuolella Python ja sitten yrität käyttää niitä itse. Joten tämä on todella mukava tapa. Ja install.packages vaatii internet. Se kestää sen palvelimelta ja arkisto kerää kaikki paketteja kutsutaan CRAN. Ja voit määrittää, mitkä tavallaan peili Haluatko ladata paketteja. Joten tässä olen ottamisen aineisto. Luen sen tämän toiminnon. Joten anna minun mennä eteenpäin ja tehdä se. Joten Oletetaan, että sinulla on tämä aineisto ja olet ehdottoman ei ole aavistustakaan, mitä se on. Ja tämä todella tulee esiin melko usein teollisuudessa jossa sinun täytyy vain nämä tonneittain sotkuinen asioita ja he uskomattoman merkitsemätön. Joten tässä olen tätä aineisto ja en tiedä mitä se on niin olen vain osoittaa tarkistaa sitä. Joten aion tehdä pää edellä. Joten voin tarkistaa ensimmäisten kuuden sarakkeet mitä tämä aineisto on. Joten tämä on valtio, pres04, ja sitten kaikki nämä eri lajitella sarakkeita. Ja mikä mielenkiintoista täällä, luulisin, että te voisi olettaa, että tämä näyttää kuten jonkinlainen vaaleissa. Ja kai pelkästään katsot tiedosto nimi tämä on jonkinlainen kokoelma Tietojen noin ehdokkaiden tai äänestäjien jotka äänestivät erityisiä presidentit tai presidentti ehdokkaat vuoden 2004 vaaleissa. Joten tässä on arvot 1, 2 joten yksi tapa tallentaa presidentti ehdokkaat heidän nimensä. Tässä tapauksessa näyttää siltä, he vain kokonaisluku arvoja. Joten 2004, se oli Bush vs. Kerry uskon. Ja nyt, sanokaamme vain tiedä onko 1 vastaa Bush tai 2 vastaa Kerry tai ja niin edelleen ja niin edelleen, eikö? Ja tämä on vain minulle, melko yleinen ongelma. Niin mitä voit tehdä tässä tapauksessa? Joten katso kaikki nämä muut asiat. valtion, olen olettaen tämä tulee eri valtioissa. partyid, tulot. Katsotaanpa partyid. Joten ehkä yksi asia mitä voi tehdä on tarkastella kunkin havaintojen että on partyid republikaanien tai demokraatti tai jotain. Joten katsokaa mitä partyid on. Joten aion ottaa dat ja sitten aion tehdä tämän dollarin merkki operaattori että tein aiemmin ja tämä tulee alijoukkoa tähän sarakkeeseen. Ja sitten aion suunnata tätä 20, vain nähdä, mitä tämä näyttää. Joten tämä on vain nippu toimistojen. Eli toisin sanoen, sinulla on puuttuvia tietoja nämä kaverit. Mutta te myös huomata tämän dat partyid on tekijä joten tämä antaa sinulle eri luokkiin. Eli toisin sanoen, partyid voi kestää Demokraatti, republikaanien, Independent, tai jotain muuta. Joten mene eteenpäin ja katsotaanpa mitkä näistä is-- oh, OK. Joten aion alijoukkoa jotta partyid ja sitten tarkastella, mitkä ovat Demokraatti, esimerkiksi. Tämä on menossa antaa teille totuusarvoarvoja valtava Boolen on trues ja FALSEs. Ja nyt, sanotaanko haluan alijoukkoihin että nämä kaverit. Joten tämä vie minun dat ja osajoukko kumpi havaintoja on partyid tasavertaisten yhtä suuri demokraatti. Ja tämä on melko pitkä, koska siellä on niin paljon. Joten nyt, aion suunnata tätä 20. Ja kuten huomaat, on yhtä suuri kuin tasavertaisten on mielenkiintoinen, olet already-- olet myös myös toimistojen kesken. Joten tässä tapauksessa, et silti saa tietoja, koska nyt sinulla on toimistojen ja haluat vain nähdä, mitkä havainto vastaavat demokraatti eikä näitä puuttuvia arvoja itse. Joten miten sinä päästä eroon näistä toimistojen? Joten tässä olen vain käyttämällä ylös-näppäintä minun kohdistin ja sitten sanomalla liikkuvat. Ja sitten täällä olen juuri menossa sanoa is.na datpartyid. Joten tämä ja ja ryhtyy kaksi eri Boolen vektorit ja sano se tulee olemaan Oikean ja väärän esimerkiksi. Joten se aikoo tehdä tämän komponentin viisas. Joten tässä minä sanon take datakehyksen, alijoukkoa hankkeille, jotka vastaavat demokraatti, ja poista niistä, jotka eivät ole NA. Joten tämä will-- olisi antaa sinulle jotain. Katsotaanpa is.na. Kokeillaan is.na datpartyid. Ja tämän pitäisi antaa sinä-- sorry-- vain Boolen vektori. Ja sitten, koska se on niin pitkä, Aion alijoukkoa 20. OK. Joten tämä pitäisi toimia. Ja tämä on myös trues. Ah, niin minun virhe on, että I'm-- I käyttää C ++ ja R synonyymeinä niin teen tämä virhe koko ajan. Ja operaattori on todella haluamasi. Et halua käyttää kahta -merkit, vain yksi. OK. Katsotaanpa. Joten me subsetted kohteeseen partyid missä he demokraatti ja he eivät puuttuvia arvoja. Ja nyt katsokaamme mitkä he ovat äänestäneet. Joten se tuntuu eniten heistä äänesti 1. Joten aion mennä eteenpäin ja sanoa, että on Kerry. Ja Vastaavasti voit myös mennä republikaanien ja toivottavasti tämä pitäisi antaa sinulle 2. Se on vain joukko erilaisia ​​sarakkeita. Ja todellakin, se on 2. Joten partyid kaikki republikaanien, useimmat äänestävät 2. Joten se tuntuu, vain katsomalla tämän, Republikaanien tulee olemaan very-- tai partyid tulee olemaan hyvin iso tekijä mikä ehdokas he aio äänestää. Ja tämä on tietysti totta yleensä. Ja tämä sopii intuitio, tietenkin. Joten se tuntuu olen loppumassa aika niin haluaisin vain pitäisi mennä eteenpäin ja näyttää nopeita kuvia. Joten tässä on jotain, joka on hieman monimutkaistaa visualisointi. Joten tässä tapauksessa, tämä on hyvin yksinkertainen analyysi vain tarkistaa, mitä presidentti '04 on. Joten tässä tapauksessa, sanokaamme halusi vastata tähän kysymykseen. Joten kai halusimme tietää äänestäminen käyttäytyminen 2004 presidentti vaaleissa ja miten se vaihtelee rodun. Niin ei vain haluat katso äänestyskäyttäytyminen, mutta haluat osajoukko kunkin rotu ja tavallaan yhteenvedon. Ja voit vain kertoa Tämän monimutkaisen merkintätapa että tämä on tavallaan tulossa utuinen. Joten yksi kehittyneempiä R paketteja, jotka on myös sellainen viime kutsutaan dplyr. Joten se on tämä yksi täällä. Ja ggg-- ggplot2 on mukavan tapa tehdä paremmin visualisointeja kuin sisäänrakennettu yhteen. Joten aion ladata Näiden kahden kirjastot. Ja sitten, aion mennä eteenpäin ja suorita tämä komento. Voit vain pitää tätä musta laatikko. Mitä tapahtuu, on, että tämä putki operaattori kulkee tässä argumentti osaksi täällä. Joten en sano ryhmän dat rotu ja sitten presidentti 04. Ja sitten, kaikki nämä muut komennot ovat suodatus ja sitten yhteenveto jos mulla count ja Sitten olen piirtämistä täällä. OK viileä. Joten mene eteenpäin ja nähdä, mitä tämä näyttää. Joten mitä täällä tapahtuu on se, että minä vain piirretty kunkin kilpailuista ja sitten mitkä he ovat äänestäneet. Ja nämä kaksi erilaista arvot vastaavat 2 ja 1. Jos haluat olla enemmän tyylikäs, voit myös vain täsmennetään, että 2 on Kerry-- tai 2 on Bush, ja sitten 1 on Kerry. Ja voit myös että teidän legenda. Ja voit myös jakaa näitä pylväsdiagrammeja. Koska yksi asia on että, jos huomaat, tämä ei ole kovin helppo tunnistaa kumpi näistä kahdesta arvot ovat suurempia. Joten yksi asia sinua halua tehdä, on ottaa tämä sininen alue ja siirrä se tänne niin sinua voi verrata näitä kahta vierekkäin. Ja kai se jotain ei ole aikaa tehdä juuri nyt, mutta se on myös erittäin helppo tehdä. Voit etsitä vain mies sivua ggplot. Joten voit vain eivät ggplot kuten että ja lukea tähän man-sivulta. Joten haluan vain nopeasti näyttää sinulle joitakin hienoja asioita. Mennään eteenpäin ja mennä to-- vain soveltaminen koneoppimisen. Joten sanokaamme meillä on nämä kolme paketit joten aion ladata nämä. Joten tämä vain tulostaa joitakin tiedot, kun olen ladattu asia. Joten sanon tämän read.csv, tämä aineisto, ja nyt Aion mennä eteenpäin ja katsoa ja nähdä, mitä sisällä tämä aineisto. Joten ensimmäinen 20 havainnot. Joten minulla on vain X1, X2, ja Y. Niin tuntuu kasan näitä arvoja ovat aina ehkä 20-80 tai niin. Ja sitten samalla X2 ja sitten tämä Y näyttää olevan tarrojen 0 ja 1. Voit tarkistaa tämän, voin vain tehdä yhteenvetotiedot X1. Ja sitten samalla varten kaikki nämä muut sarakkeet. Joten yhteenveto on nopea tapa vain näyttää sinulle nopean arvoja. Anteeksi. Tämän pitäisi olla Y. Joten tässä tapauksessa antaa quantiles, mediaanit, maxes samoin. Tällöin dataY, näet että se vain tulee olemaan 0 ja 1. Myös keskimääräinen sanoo 0,6, tarkoittaa vain sitä, että se tuntuu kuin olisin enemmän 1s kuin 0s. Joten anna minun mennä eteenpäin ja näytä mitä tämä näyttää. Joten olen juuri menossa juoni tähän. Katsotaanpa, miten tyhjentää. Voi OK. OK. Joten tämä on mitä se näyttää. Joten se tuntuu keltaiset I määriteltyjen kuten 0, ja sitten punainen Olen määritetty 1s. Joten tässä se näyttää etiketti pistettä ja se tuntuu et vain halusi joitakin tavallaan klusterointi tästä. Ja anna minun vain mennä eteenpäin ja näytä joitakin näistä sisäänrakennettuja toimintoja. Joten tässä on lm. Joten tämä on vain yrittää sopimaan linja tähän. Joten mikä on paras tapa että minä mahtuu linja tällaisten että se parhaiten erottaa tällainen klusterointi. Ja mieluiten, voit vain nähdä että olen vain ajaa kaikki nämä komennot ja sitten, aion eteenpäin ja lisää rivi. Joten tämä tuntuu paras arvaus. Se otetaan paras, joka minimoi virhe yrittää tunkea tätä linjaa. Ilmeisesti tämä näyttää ikään hyvä, mutta se ei ole paras. Ja lineaariset mallit, vuonna Yleensä tulevat olemaan todella suuri teoria ja vain eräänlainen rakennuksen perustekijät kone oppiminen. Mutta käytännössä, olet menossa haluavat tehdä jotain yleisempiä. Joten voit vain yrittää käynnissä jotain kutsutaan neuroverkon. Nämä asiat ovat yhä yleisempää. Ja ne vain toimivat uskomattoman suurten aineistojen. Joten tässä tapauksessa, me vain have-- Katsotaanpa see-- meillä nrow. Joten nrow on vain sanomalla rivien. Joten tässä tapauksessa minä on 100 huomautuksia. Joten anna minun mennä eteenpäin ja tehdä neuroverkko. Joten tämä on todella mukava koska voin vain sanoa nnet ja sitten olen taantumassa Y. Niin Y on sarakkeen. Ja sitten taantuu sen kaksi muuta muuttujaa. Joten tämä on lyhyempi merkintätapa X1 ja X2. Joten mene eteenpäin ja suorittaa tämän. Anteeksi. Minun täytyy ajaa koko juttu. Ja tämä on vain tulostus merkintätapa kuinka nopeasti tai ei nopeasti se lähentyneet. Joten se näyttää ei lähentyvät. Joten anna minun mennä eteenpäin ja tulostaa mitä tämä näyttää. Katso tässä kuva ja tässä ääriviivat siitä, miten hyvin se sopii. Ja tämä on just-- näet tämä, että tämä on erittäin, erittäin mukava. Se voisi olla jopa overfitting, mutta voit myös osuus tästä muiden tekniikoita, kuten rajat validointi. Ja nämä ovat myös rakennettu R. Ja haluan vain näyttää tukivektorikone. Tämä on toinen todella yhteinen tekniikka koneoppimista. Se on hyvin samanlainen kuin lineaariset mallit, mutta se käyttää mitä kutsutaan ydin menetelmä. Ja katsotaanpa kuinka hyvin, että ei. Joten tämä on hyvin samanlainen kuin miten hyvin neuroverkko suorittaa, mutta se on paljon tasaisempi. Ja tämä perustuu pois of what-- miten SVMs työtä. Joten tämä on vain hyvin Nopea katsaus joidenkin on sisäänrakennettuja toimintoja voit tehdä ja myös joitakin tietoja etsintä. Joten anna minun vain mennä eteenpäin ja palata dioja. Joten ilmeisesti, tämä on ei kovin kattava. Ja tämä on oikeastaan ​​vain teaser osoittaa, mitä voit todella tehdä R. Joten jos haluaisin vain oppia lisää, tässä olemassa joukko erilaisia ​​resursseja. Joten jos olet ihastunut oppikirjoja tai olet vain ihastunut lukeminen asioita verkossa, niin tämä on fantastinen yksi Hadley Wickham, joka loi myös kaikki nämä todella siistiä paketteja. Jos olet ihastunut videoita, sitten Berkeley on mahtava bootcamp se several-- Sellainen pitkä. Ja se opettaa sinulle melkein kaikki mitä haluat tietää R. Ja samoin, siellä Codeacademy ja kaikki nämä muut lajitella interaktiivisia sivustoja. Ne ovat myös saada common-- yhä yleisempää. Joten tämä on hyvin samanlainen kuin Codeacademy. Ja lopuksi, jos vain haluavat yhteisön ja apua, nämä ovat joukko asiat voit mennä. Emme tietenkään vielä käyttää postituslistoille, vain kuten lähes kaikki muut ohjelmointikieli yhteisö. Ja #rstats, tämä on yhteisömme Twitter. Se on oikeastaan ​​melko yleinen. Ja sitten käyttäjä! On vain meidän konferenssissa. Ja sitten tietenkin, voit käyttää kaikkia näitä muita Q & asioita, kuten pinon ylivuodon, Google, ja sitten GitHub. Koska useimmat näistä paketeista ja paljon yhteisö keskitetään noin kehittäminen koodia, koska se on avoimen lähdekoodin. Ja se on vain todella mukava GitHub. Ja lopuksi, voit ottaa yhteyttä minuun, jos juuri mitään lyhyttä kysymystä. Joten löydät minut Twitterissä täällä, minun verkkosivuilla, ja vain minun email. Joten toivottavasti, että oli something-- vain lyhyt teaser mitä R on todella kykenee. Ja toivottavasti, juuri tarkistaa nämä kolme yhteyksiä ja katso mitä voit tehdä enemmän. Ja kai se on vain siitä. Kiitos. [APPLAUSE]