[Musiikki soi] DUSTIN TRAN: Hei. Nimeni on Dustin. Joten minÃ¤ esittelen Data Analysis in R. Vain vÃ¤hÃ¤n itsestÃ¤ni. Olen tÃ¤llÃ¤ hetkellÃ¤ jatko-opiskelija Engineering ja ammattikorkeakoulussa. Opiskelen risteyksessÃ¤ koneoppimisen ja tilastot joten Data Analysis R on todella perustavanlaatuinen mitÃ¤ Teen pÃ¤ivittÃ¤in. 

Ja R on erityisen hyvÃ¤ tietojen analysointi koska se on erittÃ¤in hyvÃ¤ prototyyppien. Ja yleensÃ¤, kun olet tekemÃ¤ssÃ¤ jonkinlaista data-analyysi, paljon ongelmia ovat menossa kognitiivinen. Ja niin haluat vain olla joitakin todella hyviÃ¤ kieltÃ¤, on vain hyvÃ¤ tehdÃ¤ sisÃ¤Ã¤nrakennettuja toimintoja, toisin ja ottaa kÃ¤sitellÃ¤ alhainen asioita. Joten alussa, olen juuri menossa esitellÃ¤ mitÃ¤ on R, miksi haluat kÃ¤yttÃ¤Ã¤ sitÃ¤, ja sitten mennÃ¤ yli johonkin demo, ja vain mennÃ¤ sieltÃ¤. 

Joten mikÃ¤ on R? R on vain kieli kehittyi tilastollisiin computing ja visualisointi. Joten mitÃ¤ tÃ¤mÃ¤ tarkoittaa, ettÃ¤ se on erittÃ¤in hyvÃ¤ kieli tahansa sellainen asia, joka kÃ¤sittelee epÃ¤varmuuden tai tietojen visualisointia. Joten sinulla on kaikki nÃ¤mÃ¤ jakaumat. SiellÃ¤ aiotaan sisÃ¤Ã¤nrakennettuja toimintoja. Sinulla on myÃ¶s erinomainen piirtÃ¤mistÃ¤ paketteja. 

Python on kilpaileva Kieli tietojen. Ja yksi asia, ettÃ¤ pidÃ¤n, ettÃ¤ R on paljon parempi on visualisointi. Joten mitÃ¤ nÃ¤et demo kuin hyvin on vain hyvin intuitiivinen kieli ettÃ¤ vain toimii erittÃ¤in hyvin. Se on myÃ¶s ilmainen ja avoimen lÃ¤hdekoodin, kuten on muita hyviÃ¤ kielen luulisin. 

Ja tÃ¤ssÃ¤, nippu vain avainsanoja heitetÃ¤Ã¤n sinua. Se on dynaaminen, eli jos sinulla on tietyntyyppiset mÃ¤Ã¤ritetty objekti kuin se tÃ¤ytyy vain muuttaa sitÃ¤ lennossa. Se on laiska, joten se on fiksu miten se laskelmat. Toiminnallinen jolloin sitÃ¤ voi todella toimia perustuu pois toimintoja niin anything-- minkÃ¤Ã¤nlaista manipulaatiota olet teet, se perustuu pois toiminnot. 

Joten binary operaattoreille, esimerkiksi, ovat vain luonnostaan ââtoimintoja. Ja kaiken, aiot tehdÃ¤, on aiotaan ajaa pois toiminnot itse. Ja sitten olio samoin. 

Joten tÃ¤ssÃ¤ on XKCD juoni. Ei vain koska minusta tuntuu XKCD on olennainen minkÃ¤Ã¤nlaista Esityksen, mutta koska Minusta tuntuu tÃ¤mÃ¤ todella vasarat pisteeseen, ettÃ¤ paljon kun teet jonkinlainen tietojen analyysi, ongelma ei ole niin paljon, kuinka nopeasti se kulkee, mutta kuinka kauan se tulee vie ohjelmoida tehtÃ¤vÃ¤Ã¤n. Joten tÃ¤ssÃ¤ on vain analysoida, onko strategia tai b on tehokkaampaa. TÃ¤mÃ¤ tulee olemaan jotain, ettÃ¤ olet aikovat kÃ¤sitellÃ¤ paljon in erÃ¤Ã¤nlainen matalan tason kielillÃ¤ missÃ¤ olet tekemisissÃ¤ seg viat, muistin jakamista, alustukset, jopa tehdÃ¤ sisÃ¤Ã¤nrakennettuja toimintoja. Ja tÃ¤tÃ¤ tavaraa on kaikki hoidetaan hyvin, hyvin tyylikkÃ¤Ã¤sti R. 

Joten vain vasaraan tÃ¤hÃ¤n piste, suurin pullonkaula tulee olemaan kognitiivisia. Joten tietojen analysointi on erittÃ¤in kova ongelma. Olitpa tekemÃ¤ssÃ¤ koneoppimisen tai olet tekee vain jonkinlainen perustiedot etsintÃ¤, et halua olla ottaa asiakirja ja sitten koota jotain aina halua nÃ¤hdÃ¤, mitÃ¤ sarake nÃ¤yttÃ¤Ã¤, mitÃ¤ erityisesti merkinnÃ¤t matriisi nÃ¤yttÃ¤Ã¤. Joten haluat vain olla joitakin todella mukava kÃ¤yttÃ¶liittymÃ¤ voit suorittaa yksinkertainen funktio ettÃ¤ indeksit tahansa haluat ja vain ajaa sen sieltÃ¤. Ja tarvitset verkkotunnuksen tiettyjÃ¤ kieliÃ¤ tÃ¤hÃ¤n. Ja R todella auttaa sinua mÃ¤Ã¤rittelemÃ¤Ã¤n ongelma ja ratkaista se tÃ¤llÃ¤ tavalla. 

Joten tÃ¤ssÃ¤ on kÃ¤yrÃ¤, ohjelmointi suosio R se on mennyt ajan. Joten kuten nÃ¤ette, kuten 2013 tai niin se vain rÃ¤jÃ¤ytettiin valtavasti. Ja tÃ¤mÃ¤ on ollut juuri siksi, ettÃ¤ valtava kehitys teknologiateollisuudessa noin iso data. LisÃ¤ksi ei vain teknologia teollisuus, mutta oikeastaan kaikki teollisuus that-- koska paljon teollisuuden ovat tavallaan olennainen yrittÃ¤Ã¤ ratkaista nÃ¤itÃ¤ ongelmia. Ja yleensÃ¤, sinulla voi olla joitakin hyviÃ¤ tapa mitata nÃ¤itÃ¤ ongelmia tai jopa mÃ¤Ã¤ritellÃ¤Ã¤n ne tai niiden ratkaiseminen tietojen avulla. Joten mielestÃ¤ni nyt R on 11 Suosituin kieli TIOBE ja se on ollut kasvussa siitÃ¤ lÃ¤htien. 

Joten tÃ¤ssÃ¤ on joitakin enemmÃ¤n piirteitÃ¤ R. Se on valtava mÃ¤Ã¤rÃ¤ paketteja ja kaikki nÃ¤mÃ¤ eri asioita. Joten aina, kun on tietty ongelma, useimmat aika R on ettÃ¤ toiminto sinulle. Joten, haluatko rakentaa jonkinlainen kone oppiminen algoritmi nimeltÃ¤Ã¤n Random Forest tai pÃ¤Ã¤tÃ¶s Puut, tai edes yrittÃ¤Ã¤ ottaa keskiarvo toiminto tai tÃ¤tÃ¤ kamaa, R on, ettÃ¤. 

Ja jos et vÃ¤litÃ¤t optimointi, yksi asia, joka on yhteinen on, ettÃ¤ kun olet valmis prototyyppien jonkinlainen korkean tason kieli, voit heittÃ¤Ã¤ ettÃ¤ in-- Sinun tÃ¤ytyy vain portti, joka yli Joidenkin matalan tason kieli. MitÃ¤ hyvÃ¤Ã¤ R on, ettÃ¤ kun olet tehty prototyyppien se, voit kÃ¤yttÃ¤Ã¤ C ++, tai Fortran, tai mitÃ¤ tahansa nÃ¤iden alemman tason suoraan R. Niin, ettÃ¤ yksi todella mainio ominaisuus noin R, jos todella vÃ¤litÃ¤t optimointi piste. 

Ja se on myÃ¶s todella hyvÃ¤ web visualisointeja. Niin D3.js, esimerkiksi, on Luulen toisessa seminaarissa ettÃ¤ esitimme tÃ¤nÃ¤Ã¤n. Ja tÃ¤mÃ¤ on todella mahtava tekee interaktiivisia visualisointeja. Ja D3.js oletetaan, ettÃ¤ sinulla on jonkinlainen piirrettÃ¤vÃ¤ data ja R on hyvÃ¤ tapa, ettÃ¤ voin tehdÃ¤ data-analyysi, ennen kuin viet sen yli D3.js tai jopa vain ajaa D3.js komentoja R itse, sekÃ¤ kaikki nÃ¤mÃ¤ muiden kirjastojen samoin. 

Niin ettÃ¤ oli vain kÃ¤yttÃ¶Ã¶notto mikÃ¤ on R ja miksi saatat kÃ¤yttÃ¤Ã¤ sitÃ¤. Joten toivottavasti, olen vakuuttunut jotain noin vain yrittÃ¤Ã¤ nÃ¤hdÃ¤, mitÃ¤ se on. Joten aion mennÃ¤ eteenpÃ¤in ja kÃ¤ydÃ¤ lÃ¤pi Joissakin perustekijÃ¶iden noin R esineitÃ¤ ja mitÃ¤ voit todella tehdÃ¤. 

Joten tÃ¤ssÃ¤ on vain nippu matematiikka komentoja. Joten sanon you're-- haluat rakentaa kieli itsesi ja haluat vain on joukko erilaisia ââtyÃ¶kaluja. MinkÃ¤Ã¤nlaista toimintaa luulet haluat haluavat aika paljon olemaan R. 

Joten tÃ¤ssÃ¤ on 2 plus 2. TÃ¤ssÃ¤ on 2 kertaa pi. R on joukko sisÃ¤Ã¤nrakennettu vakioita ettÃ¤ voit usein kÃ¤yttÃ¤Ã¤ kuten pi, e. 

Ja sitten, tÃ¤ssÃ¤ on 7 plus runif, joten runif 1. TÃ¤mÃ¤ on toiminto, joka on luo yksi satunnainen yhtenÃ¤inen 0-1. Ja sitten on 3 potenssiin 4. On neliÃ¶juuret. 

On loki. Joten kirjautua tekee pohja eksponentiaalinen itsestÃ¤Ã¤n. Ja sitten, jos mÃ¤Ã¤ritÃ¤t pohja, sitten voit tehdÃ¤ mitÃ¤ pohja haluat. Ja sitten tÃ¤ssÃ¤ on joitakin muita komentoja. Joten sinulla on 23 mod 2. Sitten on jÃ¤ljellÃ¤. Sitten on tieteellinen muodossa, jos sinulla on myÃ¶s haluavat tehdÃ¤ vain enemmÃ¤n ja enemmÃ¤n monimutkaisia ââasioita. 

Joten tÃ¤ssÃ¤ on tehtÃ¤vÃ¤. Joten tyypillinen toimeksiannot R tehdÃ¤Ã¤n nuoli niin se on alle ja sitten vÃ¤liviivaa. Joten tÃ¤ssÃ¤ olen vain mÃ¤Ã¤rittÃ¤mÃ¤llÃ¤ 3 muuttujan val. 

Ja sitten olen tulostamalla val ja sitten se tulostaa kolme. Oletuksena R tulkki, se tulostaa asioita sinulle joten sinun ei tarvitse mÃ¤Ã¤rittÃ¤Ã¤ tulostamaan val tahansa haluat tulostaa jotain. Voit vain tehdÃ¤ val ja niin se tulee tehdÃ¤ sinulle. 

Voit myÃ¶s kÃ¤yttÃ¤Ã¤ tasavertaisina teknisesti toimeksiantona operaattori. VÃ¤hÃ¤isiÃ¤ vivahteet vÃ¤lillÃ¤ kÃ¤yttÃ¤mÃ¤llÃ¤ nuoli operaattori ja equals operaattorin tehtÃ¤viin. EnimmÃ¤kseen Sopimuksen mukaan jokainen vain nuolinÃ¤ppÃ¤imillÃ¤ operaattori. 

Ja tÃ¤ssÃ¤, olen osoitetaan tÃ¤mÃ¤n vino merkintÃ¤tapa kutsutaan 1 paksusuolen 6. TÃ¤mÃ¤ luo vektori 1-6. Ja tÃ¤mÃ¤ todella mukavaa, koska silloin juuri mÃ¤Ã¤rittÃ¤Ã¤ vektorin val ja joka toimii itsestÃ¤Ã¤n. 

Joten tÃ¤mÃ¤ on jo menee single-- hyvin intuitiivinen tiedot rakenne vain kaksinkertainen tietyntyyppinen tyypin vektoriin ja joka kerÃ¤Ã¤ kaikkia skalaariarvot sinulle. Joten kun menee skalaari, sinun on R-esineitÃ¤ ja tÃ¤mÃ¤ on vektori. Vektori on minkÃ¤Ã¤nlaista kokoelma samantyyppisiÃ¤. Joten tÃ¤ssÃ¤ ovat joukko vektoreita. 

Joten tÃ¤mÃ¤ on numeerinen. Numerolla on R: n tapa sanoa kaksinkertainen. Ja niin oletusarvoisesti kaikki numero on kaksinkertainen. 

Joten jos sinulla on C 1.1, 3, negatiivinen 5.7, c on funktio. TÃ¤mÃ¤ ketjuttaa kaikki kolme numerot vektoriin. Ja tÃ¤mÃ¤ be-- joten jos huomaat 3 itse, yleensÃ¤ otatte ettÃ¤ tÃ¤mÃ¤ on kuin kokonaisluku, mutta koska kaikki vektorit ovat samantyyppisiÃ¤, tÃ¤mÃ¤ on vektori tuplaa tai numeerinen tÃ¤ssÃ¤ tapauksessa. 

rnorm on toiminto, joka tuottaa standardi normaali variables-- tai standardin normaaliarvot. Ja olen tÃ¤smennetÃ¤Ã¤n niistÃ¤ kaksi. Joten mulla rnorm 2, osoitetaan, ettÃ¤ devs, ja sitten olen tulostamalla devs. Joten nÃ¤mÃ¤ ovat vain kaksi satunnainen normaaliarvot. 

Ja sitten INTs jos teet vÃ¤litÃ¤t kokonaislukuja. Joten tÃ¤mÃ¤ on vain noin muisti jakaminen ja tallentaminen muistin koko. Joten sinun olisi liitettÃ¤vÃ¤ numeroita isolla L. 

YleensÃ¤ tÃ¤mÃ¤ on R: n historiallinen merkintÃ¤tapa jotain kutsutaan pitkÃ¤n kokonaisluku. Joten suurimman osan ajasta, luultavasti olla tekemisissÃ¤ nelinpelin. Ja jos joskus myÃ¶hemmin on optimoida koodia, voit vain lisÃ¤tÃ¤ nÃ¤mÃ¤ L's jÃ¤lkeenpÃ¤in tai sen aikana jos olet kuten ennakoivaa mitÃ¤ aiot tehdÃ¤ nÃ¤itÃ¤ muuttujia. 

Joten tÃ¤ssÃ¤ on merkki vektori. Joten, jÃ¤lleen, olen ketjuttamalla kolme jouset tÃ¤llÃ¤ kertaa. Huomaa, ettÃ¤ kaksinkertainen jouset ja yksi jouset ovat samat R. Joten minulla on Arthur ja Marvin ja niin kun olen tulostamalla, ne kaikki aiomme nÃ¤yttÃ¤Ã¤ kaksinkertainen jouset. Ja jos haluat myÃ¶s sisÃ¤llyttÃ¤Ã¤ yhden tai kahden hengen jono teidÃ¤n merkkejÃ¤, niin voit joko vuorottelevat jousille. 

Joten Marvinin varten Toinen tekijÃ¤, tÃ¤mÃ¤ on menossa show-- sinulle vain kaksinkertainen jouset ja sitten yksi merkkijono joten tÃ¤mÃ¤ on vuorotellen. Muuten, jos haluat kÃ¤yttÃ¤Ã¤ kaksinkertaista merkkijono operaattori kaksinkertainen string kun olet julistaa sitten kÃ¤ytÃ¤t vain paeta operaattori. Joten et kenoviiva kaksinkertainen string. 

Ja lopuksi, me myÃ¶s on looginen vektoreita. Joten logical-- niin totta ja EPÃTOSI, ja he olemaan kokonaan isoilla kirjaimilla. Ja sitten taas, olen ketjuttamalla ne ja sitten mÃ¤Ã¤rittÃ¤mÃ¤llÃ¤ ne bools. Joten bools aikoo nÃ¤yttÃ¤Ã¤ te tosi, epÃ¤tosi ja tosi. 

Joten tÃ¤ssÃ¤ on vektoroitua indeksointi. Joten alussa, minÃ¤ KÃ¤ytÃ¤n function-- tÃ¤tÃ¤ kutsutaan sequence-- sekvenssi 2-12. Ja otan sekvenssi 2. Joten se aikoo tehdÃ¤ 2, 4, 6, 8, 10 ja 12. Ja sitten, olen indeksointi saada kolmas elementti. 

Joten yksi asia pitÃ¤Ã¤ mielessÃ¤ on ettÃ¤ R indeksit lÃ¤htemÃ¤llÃ¤ 1. Joten Vals 3 aikoo antaa te kolmas elementti. TÃ¤mÃ¤ on erÃ¤Ã¤nlainen eroaa muista kielillÃ¤, jossa se alkaa nollasta. Joten C tai C ++, esimerkiksi olet menossa neljÃ¤s elementti. 

Ja tÃ¤ssÃ¤ on Vals 3-5. Niin yksi asia, joka on todella siistiÃ¤ on, ettÃ¤ voi tuottaa vÃ¤liaikaisia ââmuuttujia sisÃ¤llÃ¤ ja sitten vain kÃ¤yttÃ¤Ã¤ niitÃ¤ lennossa. Joten tÃ¤ssÃ¤ on 3-5. Joten olen tuottavan vektorin 3, 4, ja 5 ja sen jÃ¤lkeen Olen indeksointi pÃ¤Ã¤stÃ¤ kolmas, NeljÃ¤s ja viides elementtejÃ¤. 

Joten Vastaavasti voit abstrakti tÃ¤mÃ¤ vain tehdÃ¤ minkÃ¤Ã¤nlaista vektorin joka antaa sinulle indeksointi. Joten tÃ¤ssÃ¤ on Vals ja sitten ensimmÃ¤inen, kolmas ja kuudes elementtejÃ¤. Ja sitten, jos haluat tehdÃ¤ tÃ¤ydennys, joten et vain miinus jÃ¤lkeenpÃ¤in ja ettÃ¤ saat antaa sinulle kaiken, joka ei ole EnsimmÃ¤inen, kolmas tai kuudes elementti. Joten tÃ¤mÃ¤ on 4, 8, ja 10. 

Ja jos haluat saada jopa kehittyneempÃ¤Ã¤, voit kytkeÃ¤ perÃ¤kkÃ¤in Boolen vektoreita. Joten tÃ¤mÃ¤ indeksi on menossa antaa teille TÃ¤mÃ¤n Boolen vektori, jonka pituus on 6. Joten rep TOSI pilkku 3. TÃ¤mÃ¤ toistaa TOSI kolme kertaa. Joten tÃ¤mÃ¤ antaa sinulle vektori TOSI, TOSI, TOSI. 

rep FALSE 4-- tÃ¤mÃ¤ on menossa antaa teille vektori vÃ¤Ã¤rÃ¤, vÃ¤Ã¤rÃ¤, vÃ¤Ã¤rÃ¤, vÃ¤Ã¤rÃ¤. Ja sitten C on menossa liitÃ¤t nÃ¤mÃ¤ kaksi Booleans yhdessÃ¤. Joten aiot saada kolme Trues ja sitten neljÃ¤ FALSEs. 

Niin, ettÃ¤ kun indeksi Vals, olet menossa TOSI, TOSI, TOSI. Niin ettÃ¤ menee kyllÃ¤, Haluan nÃ¤ihin kolmeen. Ja sitten vÃ¤Ã¤rÃ¤, vÃ¤Ã¤rÃ¤, VÃ¤Ã¤rÃ¤, vÃ¤Ã¤rÃ¤ on menossa sanoa mitÃ¤Ã¤n, en halua nÃ¤itÃ¤ tekijÃ¶itÃ¤ joten se ei aio palauttaa ne. 

Ja kai siellÃ¤ oikeastaan ââtypo tÃ¤Ã¤llÃ¤ koska tÃ¤mÃ¤ sanoo toista TOSI 3 ja toista EPÃTOSI 4, ja teknisesti, voit vain kuusi elementtejÃ¤ niin jatkuvasti virheellisesti, sen pitÃ¤isi olla jatkuvasti virheellisesti 3. MielestÃ¤ni R on myÃ¶s fiksu kuten ettÃ¤ jos vain mÃ¤Ã¤rittÃ¤Ã¤ 4 tÃ¤Ã¤llÃ¤, sitten se ei edes virhe ulos. Se vain antaa sinulle tÃ¤mÃ¤n arvon. Joten se tulee vain sivuuttaa, ettÃ¤ neljÃ¤s EPÃTOSI. 

Joten tÃ¤ssÃ¤ on vektoroitua toimeksianto. Joten set.seed-- tÃ¤mÃ¤ vain asettaa siemeniÃ¤ pseudorandom numeroita. Joten olen asettamalla siemenen 42, mikÃ¤ tarkoittaa, ettÃ¤ jos minÃ¤ tuottaa kolme satunnainen normaali arvot, ja sitten jos ajaa set.seed oman tietokoneeseen sama arvo 42, niin saat myÃ¶s Sama kolme satunnainen normaalit. 

Joten tÃ¤mÃ¤ on todella hyvÃ¤ Toistettavuustes-. YleensÃ¤, kun teet joitakin tavallaan tieteellisen analyysin, haluaisi asettaa siemen. NÃ¤in muut tutkijat voivat vain jÃ¤ljentÃ¤Ã¤ tÃ¤smÃ¤lleen sama koodi olet tehdÃ¤Ã¤n, koska he ovat juuri Sama satunnaismuuttujia that-- tai satunnainen arvoja, jotka olet ottanut samoin. 

Ja niin vektoroitua toimeksianto tÃ¤ssÃ¤ nÃ¤kyy Vals 1-2. Joten se vie kaksi ensimmÃ¤istÃ¤ elementit Vals ja sitten mÃ¤Ã¤rittÃ¤Ã¤ ne 0. Ja sitten, voit myÃ¶s vain tehdÃ¤ samanlainen juttu Booleans. 

Joten Vals ei ole sama kuin 0-- tÃ¤mÃ¤n tahtoa antaa sinulle vektori vÃ¤Ã¤rÃ¤, vÃ¤Ã¤rÃ¤, TOSI tÃ¤ssÃ¤ tapauksessa. Ja sitten, se tulee sanoa mitÃ¤Ã¤n NÃ¤iden indeksien jotka olivat TOSI, sitten se tulee mÃ¤Ã¤rittÃ¤Ã¤, ettÃ¤ 5. Joten se vie kolmas elementti tÃ¤Ã¤llÃ¤ ja sitten mÃ¤Ã¤rittÃ¤Ã¤ sen 5. 

Ja tÃ¤mÃ¤ on todella mukava verrattuna matalan tason kielillÃ¤ jossa sinun tÃ¤ytyy kÃ¤yttÃ¤Ã¤ silmukoita tehdÃ¤ kaikki tÃ¤mÃ¤ vektoroitua kamaa koska se on vain hyvin intuitiivinen ja se on yksi sutkaus. Ja mitÃ¤ hienoa vektoroitua merkintÃ¤tapa on, ettÃ¤ R, nÃ¤mÃ¤ ovat tavallaan sisÃ¤Ã¤nrakennettu jotta he melkein yhtÃ¤ nopeasti kuten tekee matalan tason kieli vastustavat tehdÃ¤ silmukka R ja sitten ottaa sen tehdÃ¤ dynaaminen indeksointi itse. Ja se tulee olemaan hitaampaa kuin teet tÃ¤llaista vektoroitua asia jossa se voi tehdÃ¤ sen rinnalla, jos se tekee sitÃ¤ ketjuttaminen pohjimmiltaan. 

Joten tÃ¤ssÃ¤ on vectorized toimintaa. Joten olen tuottavan arvo 1-3, osoitetaan, ettÃ¤ vec1, 3-5, vec2, lisÃ¤Ã¤mÃ¤llÃ¤ ne yhteen. Se lisÃ¤Ã¤ niitÃ¤ komponentti-viisas niin se 1 plus 3, 2 plus 4, ja niin edelleen. 

vec1 kertaa vec2. TÃ¤mÃ¤ moninkertaistaa kaksi arvot komponentti viisas. Joten se on 1 kertaa 3, 2 kertaa 4, ja sitten 3 kertaa 5. 

Ja sitten, samalla voit myÃ¶s tehdÃ¤ comparisons-- looginen vertailuja. Joten se on VÃÃRIN VÃÃRIN TOSI tÃ¤ssÃ¤ tapauksessa, koska 1 ei ole suurempi kuin 3, 2 ei ole suurempi kuin 4. TÃ¤mÃ¤ on kai, toinen typo, 3 ei todellakaan ole suurempi kuin 5. Joo. Ja niin voit vain tehdÃ¤ kaikki nÃ¤mÃ¤ yksinkertaiset toimet koska heidÃ¤n peritty luokista itse. 

Niin ettÃ¤ oli vain vektori. Ja se on tavallaan keskeisimpiÃ¤ R esine koska annettu vektori, voit rakentaa kehittyneempiÃ¤ esineitÃ¤. 

Joten tÃ¤ssÃ¤ matriisissa. TÃ¤mÃ¤ on lÃ¤hinnÃ¤ abstraktio mitÃ¤ matriisi on itse. Joten tÃ¤ssÃ¤ tapauksessa, se on kolme erilaista vektoreita, missÃ¤ jokainen on sarake, tai voit harkita sitÃ¤ koska jokainen on rivi. 

Joten olen tallentamiseksi matriisi 1 9 ja sitten olen tÃ¤smennetÃ¤Ã¤n 3 krs. Joten 1-9 antaa sinulle vektori 1, 2, 3, 4, 5, 6, ja aina 9. 

Yksi asia myÃ¶s pitÃ¤Ã¤ mielessÃ¤, ettÃ¤ R myymÃ¤lÃ¤Ã¤ arvot sarakkeessa-suuria-muodossa. Eli toisin sanoen, kun nÃ¤et 1 9, se tulee tallentaa them-- se tulee olemaan 1, 2, 3 ensimmÃ¤isessÃ¤ sarakkeessa, ja sitten se tulee tehdÃ¤ 4, 5, 6 toisessa sarakkeessa, ja sitten 7, 8, 9 kolmannessa sarakkeessa. 

Ja tÃ¤ssÃ¤ on joitakin muita yhteisiÃ¤ toimintoja voit kÃ¤yttÃ¤Ã¤. Niin hÃ¤mÃ¤rÃ¤ matto, tÃ¤mÃ¤ antaa sinulle mitat matriisin. Se tulee palauttaa sinut vektori ulottuvuus. Joten tÃ¤ssÃ¤ tapauksessa, koska MeidÃ¤n matriisi on 3 3, se tulee antaa sinulle numeerinen vektori se 3 3. 

Ja tÃ¤ssÃ¤ on vain nÃ¤yttÃ¤Ã¤ matriisitulo. Joten yleensÃ¤, jos vain tehdÃ¤ asterisk-- joten matto tÃ¤hdellÃ¤ mat-- tÃ¤mÃ¤ tulee olemaan komponentti-viisas toiminta tai mitÃ¤ kutsutaan Hadamard- tuote. Joten se tulee tehdÃ¤ jokaiselle elementtikomponentti-viisas. Kuitenkin, jos haluat matriisi multiplication-- joten kertomalla ensimmÃ¤isen rivin kertaa toisen matriisin ensimmÃ¤inen sarake ja niin on-- kÃ¤yttÃ¤isit TÃ¤mÃ¤n prosenttia toiminta. 

Ja t matto on vain operaation transpoosia. Joten sanon ottaa ne osaksi matriisi, kerro se matriisi itse. Ja sitten se tulee palata teille toisen 3 3 matriisi, josta ilmenee tuotteen sinua halua. 

Ja niin se oli matriisi. TÃ¤ssÃ¤ on mitÃ¤ kutsutaan datakehystÃ¤. DatakehystÃ¤ voit ajatella niin matriisi, mutta kukin sarake itse tulee olemaan erityyppisiÃ¤. 

Joten mitÃ¤ todella siistiÃ¤ noin tiedot kehykset on, ettÃ¤ tietojen analysointi sinÃ¤nsÃ¤, olet menossa on kaikki tÃ¤mÃ¤ heterogeeniset tiedot ja kaikki nÃ¤mÃ¤ todella sotkuinen asioita jossa kukin sarakkeet itse voivat olla erityyppisiÃ¤. Joten tÃ¤ssÃ¤ minÃ¤ sanon luoda datakehyksessÃ¤ tehdÃ¤ ints 1-3, ja sitten on myÃ¶s merkki vektori. Joten voin indeksi kautta kukin nÃ¤istÃ¤ sarakkeet ja sitten saan arvot itse. Ja voit myÃ¶s tehdÃ¤ jonkinlainen Toiminnan tietojen kehyksiÃ¤. Ja suurimman osan ajasta, kun olet tekee tietojen analysointi tai jonkinlainen jalostusaste, voit olla tyÃ¶skentelemme nÃ¤iden tietorakenteiden jossa kukin sarake on menossa olla erityyppisiÃ¤. 

Lopuksi, joten nÃ¤mÃ¤ ovat lÃ¤hinnÃ¤ vain neljÃ¤ olennaista esineitÃ¤ R. List vain kerÃ¤Ã¤ muut esineet haluat. Joten se tallentaa tÃ¤mÃ¤n yhdeksi muuttuja, ettÃ¤ voit helposti. 

Joten tÃ¤ssÃ¤, otan lista. Sanon tavaraa yhtÃ¤ kuin 3. Joten aion olla yksi osatekijÃ¤ lista, ja tÃ¤tÃ¤ kutsutaan kamaa, ja se tulee olla arvo 3. 

Voin myÃ¶s luoda matriisi. Joten tÃ¤mÃ¤ on 1-4 ja loppuun rivi on yhtÃ¤ suuri kuin 2, niin 2 2 matriisi. MyÃ¶s listan ja sitÃ¤ kutsutaan matto. moreStuff, merkkijono, ja jopa toinen lista sinÃ¤nsÃ¤. 

Joten tÃ¤mÃ¤ on luettelo, joka on 5 ja karhu. Joten se on arvo 5 ja se on merkkijono karhu ja se lista sisÃ¤llÃ¤ lista. Joten voit olla nÃ¤itÃ¤ rekursiivinen asioita, jos sinulla another-- kirjoita sisÃ¤llÃ¤ tyyppi. Joten samalla, voit olla matriisi sisÃ¤llÃ¤ toinen matriisi ja niin edelleen. Ja lista on vain hyvÃ¤ tapa kerÃ¤tÃ¤ ja kokoamiseen kaikki nÃ¤mÃ¤ eri esineet. 

Ja lopuksi, tÃ¤ssÃ¤ on vain auttaa asiassa tÃ¤mÃ¤ oli vain mennyt yli hyvin nopeasti. Joten milloin olet hÃ¤mmentynyt noin jonkinlainen funktio, voit tehdÃ¤ apua kyseisen toiminnon. Joten voit tehdÃ¤ apua matriisi tai kysymysmerkki matriisi. Ja apua ja kysymysmerkki ovat vain vain lyhenne sama asia joten he aliaksia. 

lm on toiminto, joka vain ei lineaarinen malli. Mutta jos vain ei ole aavistustakaan, miten tÃ¤mÃ¤ teoksia, voit vain tehdÃ¤ apua lm ja ettÃ¤ annan sinulle joitakin tavallaan dokumentaatiosta nÃ¤yttÃ¤Ã¤ ikÃ¤Ã¤n kuin manuaalisivua Unix, jossa sinulla on lyhyt kuvaus siitÃ¤, mitÃ¤ se myÃ¶s mitÃ¤ sen vÃ¤itteet ovat, mitÃ¤ se palaa, ja vain vihjeitÃ¤ kÃ¤yttÃ¤Ã¤ sitÃ¤, ja esimerkkejÃ¤ samoin. 

Joten anna minun mennÃ¤ eteenpÃ¤in ja nÃ¤ytÃ¤ demo kÃ¤yttÃ¤Ã¤ R. OK. Joten menin hyvin nopeasti vain tiedot rakenteet ja jonkinlainen op-- jotkut toiminnot. TÃ¤ssÃ¤ on joitakin toimintoja. 

Joten tÃ¤ssÃ¤ olen juuri menossa mÃ¤Ã¤ritellÃ¤ funktio. Joten olen myÃ¶s kÃ¤yttÃ¤mÃ¤llÃ¤ sijoitusoperaattorin tÃ¤Ã¤llÃ¤, ja sitten en sano julistaa sen funktiona. Ja se saa arvon x. Joten tÃ¤mÃ¤ on mitÃ¤Ã¤n arvoa haluat ja aion palata x itse. Joten tÃ¤mÃ¤ on Identiteettifunktio. 

Ja mitÃ¤ on siistiÃ¤ tÃ¤stÃ¤ verrattuna muihin kieliin ja toinen matalan tason kieliÃ¤ on, ettÃ¤ x voi olla mitÃ¤ tahansa tyyppiÃ¤ itse ja se tulee palauttaa, ettÃ¤ tyyppi. Joten voit imagine-- joten anna minulle vain ajaa tÃ¤tÃ¤ nopeasti. Anteeksi. 

Joten yksi asia Haluan mainita myÃ¶s on, ettÃ¤ tÃ¤mÃ¤ toimittaja kÃ¤ytÃ¤n kutsutaan rstudio. TÃ¤mÃ¤ on mitÃ¤ kutsutaan IDE. Ja yksi asia, joka on todella mukava tÃ¤stÃ¤ on se, ettÃ¤ se sisÃ¤ltÃ¤Ã¤ paljon asioita haluat tehdÃ¤ tutkimus- itse vain hyvin intuitiivisesti. 

Joten tÃ¤ssÃ¤ on tulkki konsoli. Joten samalla, voit myÃ¶s saada tÃ¤mÃ¤n konsoli raaka vain tekemÃ¤llÃ¤ pÃ¤Ã¤oman R. Ja tÃ¤mÃ¤ on tÃ¤smÃ¤lleen sama asia kuin konsoli. Joten voin vain tehdÃ¤ id funktio x, x, x. Ja then-- ja sitten, ettÃ¤ on hieno itse. 

Joten rstudio on suuri koska se on konsoli. Se on myÃ¶s asiakirjojen haluat ajaa. Ja sitten se on joitakin muuttujia ettÃ¤ nÃ¤et ympÃ¤ristÃ¶issÃ¤. Ja sitten, jos sinulla on tehdÃ¤ tontteja, niin voit voi vain nÃ¤hdÃ¤ sen tÃ¤Ã¤llÃ¤, toisin kuin hoitaa kaikki nÃ¤mÃ¤ erilaiset ikkunat itse. 

Olen itse henkilÃ¶kohtaisesti kÃ¤yttÃ¤Ã¤ Vim, mutta minÃ¤ tuntuu rstudio on erinomainen vain saada hyvÃ¤ idea miten kÃ¤yttÃ¤Ã¤ R. YleensÃ¤ kun yritÃ¤t oppia uusi tehtÃ¤vÃ¤, et halua kÃ¤sitellÃ¤ liian monta asiaa kerralla. Joten R on vain very-- rstudio on erittÃ¤in hyvÃ¤ tapa oppia R ilman kÃ¤sitellÃ¤ kaikki nÃ¤mÃ¤ muut asiat. 

Joten tÃ¤ssÃ¤ olen kÃ¤ynnissÃ¤ id hei. TÃ¤mÃ¤ palauttaa hei. id 123. TÃ¤ssÃ¤ on vektori kokonaislukuja. Joten samalla, koska voit ota jonkinlainen arvo, voit tehdÃ¤ paluuta id X niin se palaa 1234 ja 5. 

Ja haluan vain osoittaa teille, ettÃ¤ tÃ¤mÃ¤ on todellakin kokonaisluku. Ja samoin, jos et luokka id x, se tulee olemaan kokonaisluku. Ja sitten, voit myÃ¶s vertailla kahta ja se on totta. Joten olen tarkkailun jos id x on yhtÃ¤ suuri kuin tasavertaisten X ja huomautus ettÃ¤ se antaa sinulle kaksi trues. Joten tÃ¤mÃ¤ ei sano ovat kaksi objektia identtiset, mutta ovat kukin merkinnÃ¤t sisÃ¤llÃ¤ vektorit identtiset. 

TÃ¤ssÃ¤ on bounded.compare. Joten tÃ¤mÃ¤ on hieman monimutkaisempi ettÃ¤ sillÃ¤ on, jos kunto ja muuta ja sitten se kestÃ¤Ã¤ kaksi argumentteja kerrallaan. Joten x on kaikenlaisia. Ja en sano tÃ¤tÃ¤ Toinen argumentti on. TÃ¤mÃ¤ voi olla mitÃ¤ samoin. Mutta oletuksena, se tulee ottaa 5 jos et mÃ¤Ã¤ritÃ¤ mitÃ¤Ã¤n. 

Joten tÃ¤ssÃ¤ aion sanoa Jos x on suurempi kuin. Joten jos en mÃ¤Ã¤ritÃ¤, se sanoo, ettÃ¤ jos x on suurempi kuin 5, sitten aion palata TOSI. muuta, aion palata FALSE. Joten anna minun mennÃ¤ eteenpÃ¤in ja mÃ¤Ã¤ritellÃ¤ tÃ¤tÃ¤. 

Ja nyt aion ajaa bounded.compare 3. Niin se sanoo on 3 vÃ¤hemmÃ¤n than-- on 3 yli 5. Ei, se ei ole niin EPÃTOSI. 

Ja bounded.compare 3 ja aion verrata sitÃ¤ kÃ¤yttÃ¤en yhtÃ¤ kuin 2. Joten nyt sanon kyllÃ¤, nyt minÃ¤ haluavat olla jotain muuta. Joten aion sanoa, sinun pitÃ¤isi olla 2. 

Voin joko tehdÃ¤ tÃ¤llaisia notaatio tai sanon = 2. TÃ¤mÃ¤ on enemmÃ¤n luettavissa ettÃ¤ kun olet tarkastelee nÃ¤itÃ¤ todella monimutkaisia ââtoimintoja, ettÃ¤ ottaa useita arguments-- ja tÃ¤mÃ¤n voi olla kymmeniÃ¤ oftentimes-- vain sanomalla = 2 on enemmÃ¤n luettavissa niin, ettÃ¤ myÃ¶hemmin tulevaisuudessa tiedÃ¤t mitÃ¤ olet tekemÃ¤ssÃ¤. 

Joten tÃ¤ssÃ¤ tapauksessa, olen sanonta on 3 yli 2. KyllÃ¤ se on. Ja samalla, voin vain poistaa ja sanoa, on 3 enemmÃ¤n kuin 2 missÃ¤ = 2. Ja se on myÃ¶s totta. KyllÃ¤? 

YleisÃ¶: Oletko tÃ¤ytÃ¤ntÃ¶Ã¶npanosta rivi riviltÃ¤? 

DUSTIN TRAN: KyllÃ¤ olen. Joten mitÃ¤ teen tÃ¤ssÃ¤ ottaen tÃ¤mÃ¤ teksti document-- ja mitÃ¤ hienoa rstudio on, ettÃ¤ Voin vain ajaa short-- pikanÃ¤ppÃ¤imen. Joten mulla Ohjaus-Enter. 

Ja sitten, otan rivin tekstitiedostona ja sitten laittoi konsolissa. Joten tÃ¤ssÃ¤ minÃ¤ sanon, bounded.compare ja mulla Ohjaus-X. Joten voin vain loppuvat tÃ¤Ã¤llÃ¤. Ja sitten, ettÃ¤ otan rivi ja sitten laittaa sen tÃ¤nne. Ja sitten samalla, voin ajaa tÃ¤Ã¤llÃ¤. Ja sitten se vain pitÃ¤Ã¤ mÃ¤Ã¤ritellÃ¤Ã¤n rivit konsoli niin. 

Ja jos myÃ¶s huomata kihara olkaimet ovat siellÃ¤ aivan kuten C syntaksi. x-- jos jos ehto on myÃ¶s aio kÃ¤yttÃ¤Ã¤ sulkeita ja sitten voit kÃ¤yttÃ¤Ã¤ muualla. Toinen on muuta, jos. Joten tÃ¤mÃ¤ tulee olemaan x on yhtÃ¤ yhtÃ¤ suuri, esimerkiksi. Ja sitten aion palata jotain tÃ¤Ã¤llÃ¤. 

Huomaa, ettÃ¤ on olemassa kaksi eri asioita tÃ¤Ã¤llÃ¤ joka on meneillÃ¤Ã¤n. Yksi on se, ettÃ¤ tÃ¤Ã¤llÃ¤ olen tÃ¤smennetÃ¤Ã¤n palauttaa arvon TOSI. TÃ¤Ã¤llÃ¤ Sanon vain x. Joten R tulee yleensÃ¤ oletuksena ottaa viimeinen arguments-- tai ottaa viimeisen rivin koodia, ja se tulee olemaan, mitÃ¤ se palasi. Joten tÃ¤ssÃ¤ tÃ¤mÃ¤ on sama asia kuin tekee paluun x. 

Ja vain nÃ¤yttÃ¤Ã¤. Ja sitten, se toimii juuri niin. Joten anna minun jatkaa tÃ¤tÃ¤. 

Joten if. Ja oikeastaan, voin palata mitÃ¤ haluaisin. Joten en edes tarvitse paluu Booleans koko ajan, Voin vain palata jotain muuta. Voin siis tehdÃ¤ paluun karhu. 

Joten jos x on yhtÃ¤ kuin yhtÃ¤ suuri, se tulee palauttaa karhu. Muuten, se tulee palauttaa TOSI. Voin myÃ¶s tehdÃ¤ vektori tai oikeastaan ââmitÃ¤Ã¤n. 

Ja yleensÃ¤ staattisesti kirjoitetut tekstit, sinun tÃ¤ytyy mÃ¤Ã¤rittÃ¤Ã¤ tyypin tÃ¤Ã¤llÃ¤. Ja huomaa, ettÃ¤ se voi vain olla mitÃ¤ tahansa. Ja R on Ã¤lykÃ¤s riitÃ¤, ettÃ¤ se vain tehdÃ¤ tÃ¤mÃ¤n, ja se toimii hyvin. 

Joten anna minun mÃ¤Ã¤ritellÃ¤ tÃ¤mÃ¤n. Unexpected-- OH pahoillani. Sen pitÃ¤isi olla kihara ahdin tÃ¤Ã¤llÃ¤. OK. Cool. SelvÃ¤. Joten nyt katsotaanpa vertailla 3 ja on yhtÃ¤ suuri kuin 3. Joten se olisi return-- yeah-- arvo karhu. 

Joten nyt yleisempi asia on kuin EntÃ¤ muut tietorakenteita. Joten sinulla on tÃ¤mÃ¤ toiminto. TÃ¤mÃ¤ on menossa tÃ¶ihin minkÃ¤Ã¤nlaisen arvon kuin 3 tai numeerinen, toisin sanoen, kaksinkertainen. 

Mutta entÃ¤ jotain vektorin. MitÃ¤ tapahtuu, jos do-- joten olen menossa antaa val vaikkapa 4-6. Joten jos palaan tÃ¤hÃ¤n, tÃ¤mÃ¤ on vektori 4, 5, 6. 

Katsotaanpa nyt, mitÃ¤ tapahtuu jos en tee bounded.compare val. Joten tÃ¤mÃ¤ on aio antaa teille 15 1251. Eli toisin sanoen, se sanoo jos tarkastellaan tÃ¤mÃ¤n edellytyksen niin se sanoo x on pienempi kuin tai jotain. Joten tÃ¤mÃ¤ on hieman sekavaa, koska nyt et vain tiedÃ¤ mitÃ¤ tapahtuu. Joten kai yksi asia, joka todella hyvÃ¤Ã¤ vain yrittÃ¤Ã¤ debug on, ettÃ¤ voit vain tehdÃ¤ val on suurempi kuin ja nÃ¤hdÃ¤, mitÃ¤ siellÃ¤ tapahtuu. 

Joten val-- on oletuksena 5 niin Haluan vain tehdÃ¤ Val yli 5. Joten tÃ¤mÃ¤ on vektori VÃÃRIN VÃÃRIN TOSI. Joten nyt kun etsit TÃ¤ssÃ¤ se tulee sanoa, jos ja sitten se aio antaa teille tÃ¤mÃ¤n on vektori VÃÃRIN VÃÃRIN TOSI. 

Joten kun ohitat tÃ¤mÃ¤n osaksi R, R ei ole aavistustakaan, mitÃ¤ olet tekemÃ¤ssÃ¤. Koska se odottaa yhden arvo, joka on Boolen, ja nyt annat sen vektori Booleans. Joten oletuksena, R on vain aikoo sanoa mitÃ¤ hittoa, Aion olettaa, ettÃ¤ olet menossa ottamaan ensimmÃ¤isen elementin tÃ¤Ã¤llÃ¤. Joten aion say-- aion olettaa, ettÃ¤ tÃ¤mÃ¤ on EPÃTOSI. Joten se tulee sanoa no, tÃ¤mÃ¤ ei ole oikea. 

Samoin se tulee olla val yhtÃ¤ kuin yhtÃ¤ suuri. Ei, anteeksi 5. Ja se on myÃ¶s olemaan vÃ¤Ã¤rÃ¤ samoin. Joten se tulee sanoa ei, se ei ole totta yhtÃ¤ hyvin niin se aio palata tÃ¤hÃ¤n viimeinen. 

Joten tÃ¤mÃ¤ on joko hyvÃ¤ tai huono asia, riippuen siitÃ¤, miten katsella sitÃ¤. Koska kun olet luoda nÃ¤itÃ¤ toimintoja, et oikeastaan ââtiedÃ¤, mitÃ¤ on tekeillÃ¤. Joten joskus et haluaisi virhe, tai ehkÃ¤ vain haluavat varoituksen. TÃ¤llÃ¶in R ei tee niin. Joten se on todella jopa te perustuu pois mitÃ¤ luulet kieli pitÃ¤isi tehdÃ¤ tÃ¤ssÃ¤ tapauksessa jos ohitat vektori Booleans kun teet, jos ehto. 

Joten sanotaan, ettÃ¤ sinulla oli alkuperÃ¤inen yksi jos muu return true ja olet aio palata FALSE. Joten yksi tapa abstracting tÃ¤mÃ¤ on sanoa ei tarvitse edes tÃ¤mÃ¤ ehdollinen asia. Toinen asia mitÃ¤ voin tehdÃ¤, on vain palaavat arvot itse. Joten jos huomaat, jos do Val on suurempi kuin 5, tÃ¤mÃ¤ tulee palauttaa vektori VÃÃRIN VÃÃRIN TOSI. 

EhkÃ¤ tÃ¤mÃ¤ on mitÃ¤ haluavat bounded.compare. Haluat palata vektori Booleans jossa se vertaa jokaista arvojen itselleen. Joten voit vain eivÃ¤t bounded.compare funktio x, on yhtÃ¤ suuri kuin 5. Ja sitten sen sijaan tehdÃ¤ TÃ¤mÃ¤ jos muu ehto, Olen juuri menossa palata x on suurempi kuin 5. Joten jos se on totta, niin se tulee palauttaa TOSI. Ja sitten jos se ei ole, se on aio palata FALSE. 

Ja tÃ¤mÃ¤ toimii tahansa nÃ¤istÃ¤ rakenteista. Voin siis bounded.compare c 1 6 tai 9 ja sitten aion sanoa yhtÃ¤ kuin 6, esimerkiksi. Ja sitten se tulee anna sinulle oikeutta Boolen vektori, ettÃ¤ olet suunnittelussa. 

Joten ne ovat vain toiminnot ja nyt haluan vain nÃ¤yttÃ¤Ã¤ sinulle joitakin interaktiivisia grafiikka. En usko, olen oikeastaan Wi-Fi tÃ¤Ã¤llÃ¤ niin haluaisin vain mennÃ¤ eteenpÃ¤in ja ohita tÃ¤mÃ¤ luulisin. 

Mutta yksi asia, ettÃ¤ on siistiÃ¤ kuitenkin on, ettÃ¤ jos vain haluavat testata nippu erilaisia ââtietoja komentoja, on joukko erilaisia ââaineistoja jotka on jo esiladattuja R. Joten yksi niistÃ¤ on nimeltÃ¤Ã¤n iiris aineisto. TÃ¤mÃ¤ on yksi tunnetuimmista pienimmille koneoppimista. Sinun yleensÃ¤ vain tehdÃ¤ jonkinlainen testitapaukset nÃ¤hdÃ¤, jos koodi toimii. Joten vain tarkistaa, mitÃ¤ iiris on. 

Joten tÃ¤mÃ¤ asia on menossa olla datakehyksen. Ja se on aika pitkÃ¤, koska MinÃ¤ vain tulostaa iiris. Se tulostamalla koko juttu. Joten se on kaikki nÃ¤mÃ¤ eri nimiÃ¤. Joten Iiriksen kokoelma erilaisia ââkukkia. TÃ¤ssÃ¤ tapauksessa se on kertoa te lajien sitÃ¤, kaikki nÃ¤mÃ¤ eri leveyttÃ¤ ja pituudet verholehti ja terÃ¤lehti. 

Ja niin normaalisti, jos haluat tulostaa iiris, Esimerkiksi et halua olla se tehdÃ¤ kaiken tÃ¤mÃ¤n, koska se voi kestÃ¤Ã¤ yli koko konsolin. Niin yksi asia, joka todella kiva on pÃ¤Ã¤ toiminto. Joten jos vain tehdÃ¤ pÃ¤Ã¤ iiris, tÃ¤mÃ¤ antaa sinulle ensimmÃ¤iset viisi riviÃ¤, tai kuusi luulisin. Ja sitten hyvin, sinun voi vain mÃ¤Ã¤rittÃ¤Ã¤ tÃ¤Ã¤llÃ¤. Joten 20-- tÃ¤mÃ¤ antaa olet ensimmÃ¤inen 20 riviÃ¤. Ja olen itse ollut sellainen on yllÃ¤ttynyt, ettÃ¤ tÃ¤mÃ¤ antoi minulle kuusi joten anna minun mennÃ¤ eteenpÃ¤in ja tarkista iris-- tai pÃ¤Ã¤n, sorry. Ja tÃ¤ssÃ¤ se antaa te asiakirjat mitÃ¤ arvoa pÃ¤Ã¤ tekee. Joten se palaa ensin tai viimeinen kohde. Ja sitten aion katso oletusarvot. Ja sitten se sanoo oletuksena menetelmÃ¤ pÃ¤Ã¤ x ja n on 6L. Joten tÃ¤mÃ¤ palaa kuuden ensimmÃ¤isen elementtejÃ¤. Ja samoin jos huomaat tÃ¤Ã¤llÃ¤, minÃ¤ ei tarvitse mÃ¤Ã¤ritellÃ¤ n on 6. Oletuksena se kÃ¤yttÃ¤Ã¤ kuusi, luulisin. Ja sitten, jos haluan mÃ¤Ã¤rittÃ¤Ã¤ tietyn arvoa, niin voin katsella ettÃ¤ samoin. 

Niin, ettÃ¤ on joitakin yksinkertaisia ââkomentoja ja tÃ¤ssÃ¤ on toinen, joka on just-- hyvin, Olen can-- tÃ¤mÃ¤ on oikeastaan hieman monimutkaisempi, mutta tÃ¤mÃ¤ kestÃ¤Ã¤ vain luokan Kunkin sarakkeen iiris aineisto. Joten tÃ¤mÃ¤ nÃ¤yttÃ¤Ã¤, mitÃ¤ kukin nÃ¤istÃ¤ sarakkeet ovat mitattuna niiden tyyppejÃ¤. Joten verholehti pituus on numeerinen, verholehti leveys on numeerinen. Kaikki nÃ¤mÃ¤ arvot ovat vain numeerinen koska voit kertoa nÃ¤istÃ¤ tiedoista jÃ¤sentÃ¤Ã¤ nÃ¤mÃ¤ ovat kaikki menee numeerinen. 

Ja Laji sarake tulee olemaan tekijÃ¤. Joten normaalisti, luulisi, ettÃ¤ tÃ¤mÃ¤ on kuin merkkijono. Mutta jos et vain irisSpecies, ja sitten aion tehdÃ¤ pÃ¤Ã¤ 5, ja tÃ¤mÃ¤ tulee tulostaa ulos viiden ensimmÃ¤isen arvoja. 

Ja sitten huomaa tÃ¤tÃ¤ tasoa. Joten tÃ¤mÃ¤ on saying-- tÃ¤mÃ¤ on R: n tavoin ottaa kategorisen muuttujan. Joten sen sijaan vain ottaa merkkijonoja, se on tasoa tÃ¤smennetÃ¤Ã¤n joka nÃ¤mÃ¤ asiat ovat. 

Joten sanokaamme irisSpecies 1. Joten mitÃ¤ haluat tehdÃ¤ tÃ¤ssÃ¤ olen subsetting tÃ¤mÃ¤n lajin sarakkeeseen. Joten tÃ¤mÃ¤ vie Laji sarake ja sitten Se indeksoi saada ensimmÃ¤inen elementti. Joten tÃ¤mÃ¤ pitÃ¤isi antaa sinulle setosa. Ja se myÃ¶s antaa sinulle tasoa tÃ¤Ã¤llÃ¤. 

Joten voit myÃ¶s vertailla TÃ¤mÃ¤n merkin setosa ja tÃ¤mÃ¤ ei tule olla totta, koska yksi on eri tyyppiÃ¤ kuin muut. Tai kai se on totta, koska R on Ã¤lykkÃ¤Ã¤mpi kuin. Ja nÃ¤yttÃ¤Ã¤ tÃ¤llÃ¤ ja sitten sanoo, ehkÃ¤ tÃ¤mÃ¤ on mitÃ¤ haluat. Joten se tulee sanoa merkki merkkijono setosa on sama kuin tÃ¤mÃ¤. Ja sitten Vastaavasti voit myÃ¶s vain napata nÃ¤mÃ¤ kuten niin edelleen. 

TÃ¤mÃ¤ on siis vain jonkinlainen nopeasti kÃ¤skyjÃ¤ aineisto. Joten tÃ¤ssÃ¤ on joitakin tietoja etsintÃ¤. Joten tÃ¤mÃ¤ on hieman enemmÃ¤n mukana tietojen analysointi. Ja tÃ¤mÃ¤ on otettu joitakin Bootcamp vuonna R Berkeley. 

Joten kirjasto ulkomaisia. Joten aion latautuu kirjasto, joka kutsutaan ulkomaisia. Joten tÃ¤mÃ¤ on aio antaa minulle read.dta niin oletetaan, ettÃ¤ minulla on tÃ¤mÃ¤ aineisto. TÃ¤mÃ¤ on tallennettu nykyisen TyÃ¶hakemiston minun konsolin. Joten vain nÃ¤hdÃ¤ mitÃ¤ tyÃ¶hakemistossa on. 

Joten tÃ¤ssÃ¤ on minun tyÃ¶hakemistossa. Ja lukea pistedata, tÃ¤mÃ¤ asia, sanoo tÃ¤mÃ¤ tiedosto sijaitsee data kansioon TÃ¤mÃ¤n tyÃ¶hakemistosta. Ja read.dta tÃ¤mÃ¤ ei ole Oletuksena komento. Luulen ladattu sen jo. IEI olettaa Olen ladattu tÃ¤mÃ¤n jo. 

Mutta niin read.dta ei tule olla oletuksena komento. Ja siksi olet menossa on ladata tÃ¤ssÃ¤ kirjastossa package-- tÃ¤mÃ¤ paketti nimeltÃ¤Ã¤n ulkomaisia. Ja jos sinulla ei ole paketin, luulen Ulkomaisten on yksi sisÃ¤Ã¤nrakennettu niistÃ¤. Muuten, voit myÃ¶s do install.packages ja tÃ¤mÃ¤ asentaa paketin. Ja tÃ¤mÃ¤ antaa sinulle R. Tuota, ei. Ja sitten olen juuri menossa lopettaa tÃ¤tÃ¤, koska minulla on jo se. 

Mutta mitÃ¤ todella mukavaa noin R on, ettÃ¤ paketti hallinta jÃ¤rjestelmÃ¤ on erittÃ¤in tyylikÃ¤s. Koska se tallentaa kaiken todella hienosti sinulle. Joten tÃ¤ssÃ¤ tapauksessa, se tulee sÃ¤ilyttÃ¤Ã¤ sen, uskon, tÃ¤tÃ¤ kirjastoa tÃ¤Ã¤llÃ¤. 

Joten milloin haluat asentaa uusia paketteja, se on aivan yhtÃ¤ helppoa kuin tekee install.packages ja R hoitaa kaikki paketteja sinulle. Joten sinun ei tarvitse tehdÃ¤ jotain Python, jossa on ulkoinen paketti johtajat kuten paperi Anaconda missÃ¤ olet doing-- asennat paketit ulkopuolella Python ja sitten yritÃ¤t kÃ¤yttÃ¤Ã¤ niitÃ¤ itse. Joten tÃ¤mÃ¤ on todella mukava tapa. 

Ja install.packages vaatii internet. Se kestÃ¤Ã¤ sen palvelimelta ja arkisto kerÃ¤Ã¤ kaikki paketteja kutsutaan CRAN. Ja voit mÃ¤Ã¤rittÃ¤Ã¤, mitkÃ¤ tavallaan peili Haluatko ladata paketteja. 

Joten tÃ¤ssÃ¤ olen ottamisen aineisto. Luen sen tÃ¤mÃ¤n toiminnon. Joten anna minun mennÃ¤ eteenpÃ¤in ja tehdÃ¤ se. 

Joten Oletetaan, ettÃ¤ sinulla on tÃ¤mÃ¤ aineisto ja olet ehdottoman ei ole aavistustakaan, mitÃ¤ se on. Ja tÃ¤mÃ¤ todella tulee esiin melko usein teollisuudessa jossa sinun tÃ¤ytyy vain nÃ¤mÃ¤ tonneittain sotkuinen asioita ja he uskomattoman merkitsemÃ¤tÃ¶n. Joten tÃ¤ssÃ¤ olen tÃ¤tÃ¤ aineisto ja en tiedÃ¤ mitÃ¤ se on niin olen vain osoittaa tarkistaa sitÃ¤. 

Joten aion tehdÃ¤ pÃ¤Ã¤ edellÃ¤. Joten voin tarkistaa ensimmÃ¤isten kuuden sarakkeet mitÃ¤ tÃ¤mÃ¤ aineisto on. Joten tÃ¤mÃ¤ on valtio, pres04, ja sitten kaikki nÃ¤mÃ¤ eri lajitella sarakkeita. Ja mikÃ¤ mielenkiintoista tÃ¤Ã¤llÃ¤, luulisin, ettÃ¤ te voisi olettaa, ettÃ¤ tÃ¤mÃ¤ nÃ¤yttÃ¤Ã¤ kuten jonkinlainen vaaleissa. Ja kai pelkÃ¤stÃ¤Ã¤n katsot tiedosto nimi tÃ¤mÃ¤ on jonkinlainen kokoelma Tietojen noin ehdokkaiden tai Ã¤Ã¤nestÃ¤jien jotka Ã¤Ã¤nestivÃ¤t erityisiÃ¤ presidentit tai presidentti ehdokkaat vuoden 2004 vaaleissa. 

Joten tÃ¤ssÃ¤ on arvot 1, 2 joten yksi tapa tallentaa presidentti ehdokkaat heidÃ¤n nimensÃ¤. TÃ¤ssÃ¤ tapauksessa nÃ¤yttÃ¤Ã¤ siltÃ¤, he vain kokonaisluku arvoja. Joten 2004, se oli Bush vs. Kerry uskon. Ja nyt, sanokaamme vain tiedÃ¤ onko 1 vastaa Bush tai 2 vastaa Kerry tai ja niin edelleen ja niin edelleen, eikÃ¶? 

Ja tÃ¤mÃ¤ on vain minulle, melko yleinen ongelma. Niin mitÃ¤ voit tehdÃ¤ tÃ¤ssÃ¤ tapauksessa? Joten katso kaikki nÃ¤mÃ¤ muut asiat. 

valtion, olen olettaen tÃ¤mÃ¤ tulee eri valtioissa. partyid, tulot. Katsotaanpa partyid. Joten ehkÃ¤ yksi asia mitÃ¤ voi tehdÃ¤ on tarkastella kunkin havaintojen ettÃ¤ on partyid republikaanien tai demokraatti tai jotain. Joten katsokaa mitÃ¤ partyid on. 

Joten aion ottaa dat ja sitten aion tehdÃ¤ tÃ¤mÃ¤n dollarin merkki operaattori ettÃ¤ tein aiemmin ja tÃ¤mÃ¤ tulee alijoukkoa tÃ¤hÃ¤n sarakkeeseen. Ja sitten aion suunnata tÃ¤tÃ¤ 20, vain nÃ¤hdÃ¤, mitÃ¤ tÃ¤mÃ¤ nÃ¤yttÃ¤Ã¤. 

Joten tÃ¤mÃ¤ on vain nippu toimistojen. Eli toisin sanoen, sinulla on puuttuvia tietoja nÃ¤mÃ¤ kaverit. Mutta te myÃ¶s huomata tÃ¤mÃ¤n dat partyid on tekijÃ¤ joten tÃ¤mÃ¤ antaa sinulle eri luokkiin. Eli toisin sanoen, partyid voi kestÃ¤Ã¤ Demokraatti, republikaanien, Independent, tai jotain muuta. 

Joten mene eteenpÃ¤in ja katsotaanpa mitkÃ¤ nÃ¤istÃ¤ is-- oh, OK. Joten aion alijoukkoa jotta partyid ja sitten tarkastella, mitkÃ¤ ovat Demokraatti, esimerkiksi. TÃ¤mÃ¤ on menossa antaa teille totuusarvoarvoja valtava Boolen on trues ja FALSEs. 

Ja nyt, sanotaanko haluan alijoukkoihin ettÃ¤ nÃ¤mÃ¤ kaverit. Joten tÃ¤mÃ¤ vie minun dat ja osajoukko kumpi havaintoja on partyid tasavertaisten yhtÃ¤ suuri demokraatti. Ja tÃ¤mÃ¤ on melko pitkÃ¤, koska siellÃ¤ on niin paljon. Joten nyt, aion suunnata tÃ¤tÃ¤ 20. 

Ja kuten huomaat, on yhtÃ¤ suuri kuin tasavertaisten on mielenkiintoinen, olet already-- olet myÃ¶s myÃ¶s toimistojen kesken. Joten tÃ¤ssÃ¤ tapauksessa, et silti saa tietoja, koska nyt sinulla on toimistojen ja haluat vain nÃ¤hdÃ¤, mitkÃ¤ havainto vastaavat demokraatti eikÃ¤ nÃ¤itÃ¤ puuttuvia arvoja itse. Joten miten sinÃ¤ pÃ¤Ã¤stÃ¤ eroon nÃ¤istÃ¤ toimistojen? 

Joten tÃ¤ssÃ¤ olen vain kÃ¤yttÃ¤mÃ¤llÃ¤ ylÃ¶s-nÃ¤ppÃ¤intÃ¤ minun kohdistin ja sitten sanomalla liikkuvat. Ja sitten tÃ¤Ã¤llÃ¤ olen juuri menossa sanoa is.na datpartyid. Joten tÃ¤mÃ¤ ja ja ryhtyy kaksi eri Boolen vektorit ja sano se tulee olemaan Oikean ja vÃ¤Ã¤rÃ¤n esimerkiksi. Joten se aikoo tehdÃ¤ tÃ¤mÃ¤n komponentin viisas. Joten tÃ¤ssÃ¤ minÃ¤ sanon take datakehyksen, alijoukkoa hankkeille, jotka vastaavat demokraatti, ja poista niistÃ¤, jotka eivÃ¤t ole NA. 

Joten tÃ¤mÃ¤ will-- olisi antaa sinulle jotain. Katsotaanpa is.na. Kokeillaan is.na datpartyid. Ja tÃ¤mÃ¤n pitÃ¤isi antaa sinÃ¤-- sorry-- vain Boolen vektori. Ja sitten, koska se on niin pitkÃ¤, Aion alijoukkoa 20. OK. Joten tÃ¤mÃ¤ pitÃ¤isi toimia. 

Ja tÃ¤mÃ¤ on myÃ¶s trues. Ah, niin minun virhe on, ettÃ¤ I'm-- I kÃ¤yttÃ¤Ã¤ C ++ ja R synonyymeinÃ¤ niin teen tÃ¤mÃ¤ virhe koko ajan. Ja operaattori on todella haluamasi. Et halua kÃ¤yttÃ¤Ã¤ kahta -merkit, vain yksi. OK. 

Katsotaanpa. Joten me subsetted kohteeseen partyid missÃ¤ he demokraatti ja he eivÃ¤t puuttuvia arvoja. Ja nyt katsokaamme mitkÃ¤ he ovat Ã¤Ã¤nestÃ¤neet. Joten se tuntuu eniten heistÃ¤ Ã¤Ã¤nesti 1. Joten aion mennÃ¤ eteenpÃ¤in ja sanoa, ettÃ¤ on Kerry. 

Ja Vastaavasti voit myÃ¶s mennÃ¤ republikaanien ja toivottavasti tÃ¤mÃ¤ pitÃ¤isi antaa sinulle 2. Se on vain joukko erilaisia ââsarakkeita. Ja todellakin, se on 2. Joten partyid kaikki republikaanien, useimmat Ã¤Ã¤nestÃ¤vÃ¤t 2. 

Joten se tuntuu, vain katsomalla tÃ¤mÃ¤n, Republikaanien tulee olemaan very-- tai partyid tulee olemaan hyvin iso tekijÃ¤ mikÃ¤ ehdokas he aio Ã¤Ã¤nestÃ¤Ã¤. Ja tÃ¤mÃ¤ on tietysti totta yleensÃ¤. Ja tÃ¤mÃ¤ sopii intuitio, tietenkin. Joten se tuntuu olen loppumassa aika niin haluaisin vain pitÃ¤isi mennÃ¤ eteenpÃ¤in ja nÃ¤yttÃ¤Ã¤ nopeita kuvia. Joten tÃ¤ssÃ¤ on jotain, joka on hieman monimutkaistaa visualisointi. Joten tÃ¤ssÃ¤ tapauksessa, tÃ¤mÃ¤ on hyvin yksinkertainen analyysi vain tarkistaa, mitÃ¤ presidentti '04 on. 

Joten tÃ¤ssÃ¤ tapauksessa, sanokaamme halusi vastata tÃ¤hÃ¤n kysymykseen. Joten kai halusimme tietÃ¤Ã¤ Ã¤Ã¤nestÃ¤minen kÃ¤yttÃ¤ytyminen 2004 presidentti vaaleissa ja miten se vaihtelee rodun. Niin ei vain haluat katso Ã¤Ã¤nestyskÃ¤yttÃ¤ytyminen, mutta haluat osajoukko kunkin rotu ja tavallaan yhteenvedon. Ja voit vain kertoa TÃ¤mÃ¤n monimutkaisen merkintÃ¤tapa ettÃ¤ tÃ¤mÃ¤ on tavallaan tulossa utuinen. 

Joten yksi kehittyneempiÃ¤ R paketteja, jotka on myÃ¶s sellainen viime kutsutaan dplyr. Joten se on tÃ¤mÃ¤ yksi tÃ¤Ã¤llÃ¤. Ja ggg-- ggplot2 on mukavan tapa tehdÃ¤ paremmin visualisointeja kuin sisÃ¤Ã¤nrakennettu yhteen. 

Joten aion ladata NÃ¤iden kahden kirjastot. Ja sitten, aion mennÃ¤ eteenpÃ¤in ja suorita tÃ¤mÃ¤ komento. Voit vain pitÃ¤Ã¤ tÃ¤tÃ¤ musta laatikko. 

MitÃ¤ tapahtuu, on, ettÃ¤ tÃ¤mÃ¤ putki operaattori kulkee tÃ¤ssÃ¤ argumentti osaksi tÃ¤Ã¤llÃ¤. Joten en sano ryhmÃ¤n dat rotu ja sitten presidentti 04. Ja sitten, kaikki nÃ¤mÃ¤ muut komennot ovat suodatus ja sitten yhteenveto jos mulla count ja Sitten olen piirtÃ¤mistÃ¤ tÃ¤Ã¤llÃ¤. OK viileÃ¤. Joten mene eteenpÃ¤in ja nÃ¤hdÃ¤, mitÃ¤ tÃ¤mÃ¤ nÃ¤yttÃ¤Ã¤. 

Joten mitÃ¤ tÃ¤Ã¤llÃ¤ tapahtuu on se, ettÃ¤ minÃ¤ vain piirretty kunkin kilpailuista ja sitten mitkÃ¤ he ovat Ã¤Ã¤nestÃ¤neet. Ja nÃ¤mÃ¤ kaksi erilaista arvot vastaavat 2 ja 1. Jos haluat olla enemmÃ¤n tyylikÃ¤s, voit myÃ¶s vain tÃ¤smennetÃ¤Ã¤n, ettÃ¤ 2 on Kerry-- tai 2 on Bush, ja sitten 1 on Kerry. Ja voit myÃ¶s ettÃ¤ teidÃ¤n legenda. 

Ja voit myÃ¶s jakaa nÃ¤itÃ¤ pylvÃ¤sdiagrammeja. Koska yksi asia on ettÃ¤, jos huomaat, tÃ¤mÃ¤ ei ole kovin helppo tunnistaa kumpi nÃ¤istÃ¤ kahdesta arvot ovat suurempia. Joten yksi asia sinua halua tehdÃ¤, on ottaa tÃ¤mÃ¤ sininen alue ja siirrÃ¤ se tÃ¤nne niin sinua voi verrata nÃ¤itÃ¤ kahta vierekkÃ¤in. Ja kai se jotain ei ole aikaa tehdÃ¤ juuri nyt, mutta se on myÃ¶s erittÃ¤in helppo tehdÃ¤. Voit etsitÃ¤ vain mies sivua ggplot. Joten voit vain eivÃ¤t ggplot kuten ettÃ¤ ja lukea tÃ¤hÃ¤n man-sivulta. 

Joten haluan vain nopeasti nÃ¤yttÃ¤Ã¤ sinulle joitakin hienoja asioita. MennÃ¤Ã¤n eteenpÃ¤in ja mennÃ¤ to-- vain soveltaminen koneoppimisen. Joten sanokaamme meillÃ¤ on nÃ¤mÃ¤ kolme paketit joten aion ladata nÃ¤mÃ¤. Joten tÃ¤mÃ¤ vain tulostaa joitakin tiedot, kun olen ladattu asia. Joten sanon tÃ¤mÃ¤n read.csv, tÃ¤mÃ¤ aineisto, ja nyt Aion mennÃ¤ eteenpÃ¤in ja katsoa ja nÃ¤hdÃ¤, mitÃ¤ sisÃ¤llÃ¤ tÃ¤mÃ¤ aineisto. 

Joten ensimmÃ¤inen 20 havainnot. Joten minulla on vain X1, X2, ja Y. Niin tuntuu kasan nÃ¤itÃ¤ arvoja ovat aina ehkÃ¤ 20-80 tai niin. Ja sitten samalla X2 ja sitten tÃ¤mÃ¤ Y nÃ¤yttÃ¤Ã¤ olevan tarrojen 0 ja 1. 

Voit tarkistaa tÃ¤mÃ¤n, voin vain tehdÃ¤ yhteenvetotiedot X1. Ja sitten samalla varten kaikki nÃ¤mÃ¤ muut sarakkeet. Joten yhteenveto on nopea tapa vain nÃ¤yttÃ¤Ã¤ sinulle nopean arvoja. Anteeksi. TÃ¤mÃ¤n pitÃ¤isi olla Y. 

Joten tÃ¤ssÃ¤ tapauksessa antaa quantiles, mediaanit, maxes samoin. TÃ¤llÃ¶in dataY, nÃ¤et ettÃ¤ se vain tulee olemaan 0 ja 1. MyÃ¶s keskimÃ¤Ã¤rÃ¤inen sanoo 0,6, tarkoittaa vain sitÃ¤, ettÃ¤ se tuntuu kuin olisin enemmÃ¤n 1s kuin 0s. 

Joten anna minun mennÃ¤ eteenpÃ¤in ja nÃ¤ytÃ¤ mitÃ¤ tÃ¤mÃ¤ nÃ¤yttÃ¤Ã¤. Joten olen juuri menossa juoni tÃ¤hÃ¤n. Katsotaanpa, miten tyhjentÃ¤Ã¤. Voi OK. OK. 

Joten tÃ¤mÃ¤ on mitÃ¤ se nÃ¤yttÃ¤Ã¤. Joten se tuntuu keltaiset I mÃ¤Ã¤riteltyjen kuten 0, ja sitten punainen Olen mÃ¤Ã¤ritetty 1s. Joten tÃ¤ssÃ¤ se nÃ¤yttÃ¤Ã¤ etiketti pistettÃ¤ ja se tuntuu et vain halusi joitakin tavallaan klusterointi tÃ¤stÃ¤. 

Ja anna minun vain mennÃ¤ eteenpÃ¤in ja nÃ¤ytÃ¤ joitakin nÃ¤istÃ¤ sisÃ¤Ã¤nrakennettuja toimintoja. Joten tÃ¤ssÃ¤ on lm. Joten tÃ¤mÃ¤ on vain yrittÃ¤Ã¤ sopimaan linja tÃ¤hÃ¤n. Joten mikÃ¤ on paras tapa ettÃ¤ minÃ¤ mahtuu linja tÃ¤llaisten ettÃ¤ se parhaiten erottaa tÃ¤llainen klusterointi. Ja mieluiten, voit vain nÃ¤hdÃ¤ ettÃ¤ olen vain ajaa kaikki nÃ¤mÃ¤ komennot ja sitten, aion eteenpÃ¤in ja lisÃ¤Ã¤ rivi. 

Joten tÃ¤mÃ¤ tuntuu paras arvaus. Se otetaan paras, joka minimoi virhe yrittÃ¤Ã¤ tunkea tÃ¤tÃ¤ linjaa. Ilmeisesti tÃ¤mÃ¤ nÃ¤yttÃ¤Ã¤ ikÃ¤Ã¤n hyvÃ¤, mutta se ei ole paras. Ja lineaariset mallit, vuonna YleensÃ¤ tulevat olemaan todella suuri teoria ja vain erÃ¤Ã¤nlainen rakennuksen perustekijÃ¤t kone oppiminen. Mutta kÃ¤ytÃ¤nnÃ¶ssÃ¤, olet menossa haluavat tehdÃ¤ jotain yleisempiÃ¤. 

Joten voit vain yrittÃ¤Ã¤ kÃ¤ynnissÃ¤ jotain kutsutaan neuroverkon. NÃ¤mÃ¤ asiat ovat yhÃ¤ yleisempÃ¤Ã¤. Ja ne vain toimivat uskomattoman suurten aineistojen. Joten tÃ¤ssÃ¤ tapauksessa, me vain have-- Katsotaanpa see-- meillÃ¤ nrow. Joten nrow on vain sanomalla rivien. Joten tÃ¤ssÃ¤ tapauksessa minÃ¤ on 100 huomautuksia. 

Joten anna minun mennÃ¤ eteenpÃ¤in ja tehdÃ¤ neuroverkko. Joten tÃ¤mÃ¤ on todella mukava koska voin vain sanoa nnet ja sitten olen taantumassa Y. Niin Y on sarakkeen. Ja sitten taantuu sen kaksi muuta muuttujaa. Joten tÃ¤mÃ¤ on lyhyempi merkintÃ¤tapa X1 ja X2. 

Joten mene eteenpÃ¤in ja suorittaa tÃ¤mÃ¤n. Anteeksi. Minun tÃ¤ytyy ajaa koko juttu. Ja tÃ¤mÃ¤ on vain tulostus merkintÃ¤tapa kuinka nopeasti tai ei nopeasti se lÃ¤hentyneet. Joten se nÃ¤yttÃ¤Ã¤ ei lÃ¤hentyvÃ¤t. Joten anna minun mennÃ¤ eteenpÃ¤in ja tulostaa mitÃ¤ tÃ¤mÃ¤ nÃ¤yttÃ¤Ã¤. 

Katso tÃ¤ssÃ¤ kuva ja tÃ¤ssÃ¤ Ã¤Ã¤riviivat siitÃ¤, miten hyvin se sopii. Ja tÃ¤mÃ¤ on just-- nÃ¤et tÃ¤mÃ¤, ettÃ¤ tÃ¤mÃ¤ on erittÃ¤in, erittÃ¤in mukava. Se voisi olla jopa overfitting, mutta voit myÃ¶s osuus tÃ¤stÃ¤ muiden tekniikoita, kuten rajat validointi. Ja nÃ¤mÃ¤ ovat myÃ¶s rakennettu R. 

Ja haluan vain nÃ¤yttÃ¤Ã¤ tukivektorikone. TÃ¤mÃ¤ on toinen todella yhteinen tekniikka koneoppimista. Se on hyvin samanlainen kuin lineaariset mallit, mutta se kÃ¤yttÃ¤Ã¤ mitÃ¤ kutsutaan ydin menetelmÃ¤. Ja katsotaanpa kuinka hyvin, ettÃ¤ ei. Joten tÃ¤mÃ¤ on hyvin samanlainen kuin miten hyvin neuroverkko suorittaa, mutta se on paljon tasaisempi. Ja tÃ¤mÃ¤ perustuu pois of what-- miten SVMs tyÃ¶tÃ¤. 

Joten tÃ¤mÃ¤ on vain hyvin Nopea katsaus joidenkin on sisÃ¤Ã¤nrakennettuja toimintoja voit tehdÃ¤ ja myÃ¶s joitakin tietoja etsintÃ¤. Joten anna minun vain mennÃ¤ eteenpÃ¤in ja palata dioja. 

Joten ilmeisesti, tÃ¤mÃ¤ on ei kovin kattava. Ja tÃ¤mÃ¤ on oikeastaan ââvain teaser osoittaa, mitÃ¤ voit todella tehdÃ¤ R. Joten jos haluaisin vain oppia lisÃ¤Ã¤, tÃ¤ssÃ¤ olemassa joukko erilaisia ââresursseja. 

Joten jos olet ihastunut oppikirjoja tai olet vain ihastunut lukeminen asioita verkossa, niin tÃ¤mÃ¤ on fantastinen yksi Hadley Wickham, joka loi myÃ¶s kaikki nÃ¤mÃ¤ todella siistiÃ¤ paketteja. Jos olet ihastunut videoita, sitten Berkeley on mahtava bootcamp se several-- Sellainen pitkÃ¤. Ja se opettaa sinulle melkein kaikki mitÃ¤ haluat tietÃ¤Ã¤ R. 

Ja samoin, siellÃ¤ Codeacademy ja kaikki nÃ¤mÃ¤ muut lajitella interaktiivisia sivustoja. Ne ovat myÃ¶s saada common-- yhÃ¤ yleisempÃ¤Ã¤. Joten tÃ¤mÃ¤ on hyvin samanlainen kuin Codeacademy. Ja lopuksi, jos vain haluavat yhteisÃ¶n ja apua, nÃ¤mÃ¤ ovat joukko asiat voit mennÃ¤. Emme tietenkÃ¤Ã¤n vielÃ¤ kÃ¤yttÃ¤Ã¤ postituslistoille, vain kuten lÃ¤hes kaikki muut ohjelmointikieli yhteisÃ¶. Ja #rstats, tÃ¤mÃ¤ on yhteisÃ¶mme Twitter. Se on oikeastaan ââmelko yleinen. Ja sitten kÃ¤yttÃ¤jÃ¤! On vain meidÃ¤n konferenssissa. 

Ja sitten tietenkin, voit kÃ¤yttÃ¤Ã¤ kaikkia nÃ¤itÃ¤ muita Q & asioita, kuten pinon ylivuodon, Google, ja sitten GitHub. Koska useimmat nÃ¤istÃ¤ paketeista ja paljon yhteisÃ¶ keskitetÃ¤Ã¤n noin kehittÃ¤minen koodia, koska se on avoimen lÃ¤hdekoodin. Ja se on vain todella mukava GitHub. Ja lopuksi, voit ottaa yhteyttÃ¤ minuun, jos juuri mitÃ¤Ã¤n lyhyttÃ¤ kysymystÃ¤. Joten lÃ¶ydÃ¤t minut TwitterissÃ¤ tÃ¤Ã¤llÃ¤, minun verkkosivuilla, ja vain minun email. Joten toivottavasti, ettÃ¤ oli something-- vain lyhyt teaser mitÃ¤ R on todella kykenee. Ja toivottavasti, juuri tarkistaa nÃ¤mÃ¤ kolme yhteyksiÃ¤ ja katso mitÃ¤ voit tehdÃ¤ enemmÃ¤n. Ja kai se on vain siitÃ¤. Kiitos. 

[APPLAUSE]