[MUZYKA GRY] DUSTIN TRAN: CzeÅÄ. Nazywam siÄ Dustin. WiÄc bÄdÄ prezentacji Analiza danych w R. Tylko trochÄ o sobie. Obecnie jestem studentem w z nauk technicznych i Stosowanej. StudiujÄ przeciÄcie uczenie maszynowe i statystyki Analiza danych w tak R jest do tego, co tak naprawdÄ podstawowym RobiÄ na co dzieÅ. 

I R jest szczegÃ³lnie dobre dla analizy danych bo to bardzo dobre dla prototypÃ³w. I zazwyczaj, kiedy robisz coÅ w rodzaju analizy danych, wiele problemÃ³w bÄdÄ poznawczych. I tak po prostu chcesz mieÄ niektÃ³re naprawdÄ dobry jÄzyk, jest po prostu dobry sposÃ³b wbudowanej funkcji, w przeciwieÅstwie aby majÄc do czynienia z rzeczy niskim poziomie. Tak wiÄc na poczÄtku, jestem po prostu przedstawiÄ to, co jest R, dlaczego chcesz go uÅ¼ywaÄ, a nastÄpnie przejÅÄ do jakiegoÅ demo, i po prostu go stamtÄd. 

WiÄc co to jest R? R jest po prostu jÄzyk opracowany do obliczeÅ statystycznych i wizualizacji. WiÄc co to oznacza to, Å¼e to bardzo doskonaÅy jÄzyk dla kaÅ¼dego rodzaju rzeczy, ktÃ³ra zajmuje siÄ NiepewnoÅÄ i wizualizacji danych. WiÄc masz wszystko rozkÅady prawdopodobieÅstwa. Nie bÄdÄ wbudowanej funkcji. BÄdziesz mieÄ rÃ³wnieÅ¼ doskonaÅe kreÅlenia pakiety. 

Python jest kolejnym konkurencyjnych JÄzyk danych. I jedno, Å¼e uwaÅ¼am, Å¼e R jest o wiele lepiej jest wizualizacja. WiÄc co moÅ¼na zobaczyÄ w demo jako dobrze jest po prostu bardzo intuicyjny jÄzyk Å¼e po prostu dziaÅa bardzo dobrze. Jest rÃ³wnieÅ¼ wolne i otwarte, jak to kaÅ¼dy inny dobry jÄzyk chyba. 

I tu, kilka tylko sÅowa kluczowe rzucony na ciebie. Jest to dynamiczna, co oznacza, jeÅli masz okreÅlony typ przypisane do obiektu nie bÄdzie to po prostu zmieniÄ go w locie. Jest leniwy, wiÄc mÄdrze jak to robi obliczenia. Funkcjonalne, dziÄki czemu moÅ¼na naprawdÄ dziaÅajÄ opiera siÄ funkcji tak anything-- kaÅ¼dy rodzaj manipulacji jesteÅ CzyniÄc to, bÄdzie opieraÄ siÄ funkcje. 

Operatorzy tak binarne np po prostu z natury sÄ funkcje. I wszystko, co masz zamiar zrobiÄ, to bÄdzie spÅywaÄ sama funkcje. A potem obiektowego, jak rÃ³wnieÅ¼. 

WiÄc tutaj jest dziaÅka XKCD. Nie tylko dlatego, Å¼e czujÄ siÄ jak XKCD ma fundamentalne znaczenie dla kaÅ¼dego rodzaju prezentacji, ale dlatego, CzujÄ siÄ jak to naprawdÄ mÅoty do tego stopnia, Å¼e ââwiele czas, kiedy robisz coÅ w rodzaju danych Analiza, problemem nie jest tak bardzo, jak szybko biegnie, ale jak dÅugo to bÄdzie przejÅcie do programowania zadania. WiÄc tutaj jest po prostu analizuje, czy Strategia lub b jest bardziej efektywne. To bÄdzie coÅ, Å¼e jesteÅ bÄdzie zajmowaÄ duÅ¼o siÄ w sortowania jÄzykÃ³w niskopoziomowych gdzie masz do czynienia z wadami SEG, alokacja pamiÄci, pliki uruchamiania, nawet co wbudowanych funkcji. I to wszystko jest obsÅugiwane rzeczy bardzo, bardzo elegancko w R. 

WiÄc po prostu wbiÄ ten Punkt, najwiÄkszym gardÅem bÄdzie poznawcze. Tak wiÄc analiza danych jest bardzo trudne zagadnienie. Czy robisz uczenie maszynowe lub jesteÅ robi tylko jakieÅ Eksploracja danych podstawowa, nie chce mieÄ wziÄÄ dokument a nastÄpnie skompilowaÄ coÅ za kaÅ¼dym razem chcesz zobaczyÄ, co kolumna wyglÄda, co szczegÃ³lnie wpisy w matrycy wyglÄda. WiÄc po prostu chcesz mieÄ niektÃ³re bardzo Åadny interfejs moÅ¼na uruchomiÄ prostÄ funkcjÄ Å¼e indeksy na cokolwiek chcesz i po prostu uruchom go stamtÄd. I trzeba domenÄ konkretne jÄzyki za to. I R bÄdzie naprawdÄ pomÃ³c zdefiniowaÄ problemu i rozwiÄzaÄ go w ten sposÃ³b. 

WiÄc tutaj jest programowanie pokazujÄc dziaÅki PopularnoÅÄ R, jak go nie ma w czasie. WiÄc jak widaÄ, podobnie jak 2013 lub wiÄc po prostu wysadzony ogromnie. I to byÅo tylko dlatego, Å¼e ogromny trend w branÅ¼y technologicznej o duÅ¼ych danych. Ponadto, nie tylko technologia przemysÅ, ale naprawdÄ PrzemysÅ, poniewaÅ¼ kaÅ¼da that-- Wiele branÅ¼ sÄ swego rodzaju podstawÄ prÃ³by rozwiÄzania tych problemÃ³w. I zazwyczaj, moÅ¼e masz jakiÅ dobry SposÃ³b mierzenia tych problemÃ³w lub nawet ich definiowania lub rozwiÄzywania ich pomocÄ danych. WiÄc myÅlÄ, Å¼e teraz jest 11 R najpopularniejszym jÄzykiem na TIOBE i to roÅnie od tego czasu. 

WiÄc oto kilka cechy R. Ma Ogromna iloÅÄ sztuk, dla wszystkich tych rzeczy. WiÄc za kaÅ¼dym razem masz pewne, wiÄkszoÅÄ problemÃ³w R bÄdzie miaÅ czas Å¼e funkcja dla Ciebie. WiÄc, czy chcesz zbudowaÄ jakÄÅ maszynÄ nauki algorytm zwany Losowe Las lub drzewa decyzyjne, lub nawet starajÄc siÄ ÅredniÄ Funkcja lub ktÃ³regokolwiek z tych rzeczy, R bÄdzie mieÄ. 

A jeÅli nie dbasz o optymalizacja, jedna rzecz, ktÃ³ra jest wspÃ³lna jest to, Å¼e po zakoÅczeniu prototypowanie jakiÅ jÄzyku wysokiego poziomu, moÅ¼na rzuciÄ, Å¼e in-- bÄdziesz tylko port, ktÃ³ry w ciÄgu w pewnym jÄzyku niskiego poziomu. Co jest dobre na temat badaÅ jest to, Å¼e raz jesteÅ wykonane prototypy go moÅ¼na uruchomiÄ C ++, lub Fortran, lub kaÅ¼dy z nich dolne szczebla bezpoÅrednio do R. WiÄc to jest naprawdÄ NowoÅciÄ o R, jeÅli naprawdÄ obchodzi Punkt optymalizacja. 

I to jest rÃ³wnieÅ¼ bardzo dobra dla wizualizacji internetowych. Tak D3.js, na przykÅad, MyÅlÄ, Å¼e kolejne seminarium Å¼e przedstawiony dzisiaj. I to jest naprawdÄ niesamowite dla robi interaktywnych wizualizacji. I D3.js zakÅada, Å¼e ââmasz pewnego rodzaju danych, ktÃ³re bÄdÄ wykreÅlane i R to Åwietny sposÃ³b jest w stanie zrobiÄ Analiza danych przed wyeksportowaÄ nad do D3.js lub nawet uruchomiÄ Polecenia do samego R D3.js, jak rÃ³wnieÅ¼ tych wszystkich inne biblioteki, jak rÃ³wnieÅ¼. 

WiÄc to byÅo tylko wprowadzenie co to jest i dlaczego moÅ¼e R moÅ¼na go uÅ¼ywaÄ. WiÄc mam nadziejÄ, mam przekonany coÅ o po prostu staramy siÄ zobaczyÄ, jak to jest. WiÄc mam zamiar iÅÄ do przodu i przejÅÄ Podstawy o niektÃ³rych obiektÃ³w R i to, co naprawdÄ moÅ¼na zrobiÄ. 

WiÄc tutaj jest po prostu kilka poleceÅ matematycznych. Tak mÃ³wiÄ you're-- chcesz zbudowaÄ sam jÄzyk i chcesz po prostu mieÄ kilka rÃ³Å¼nych narzÄdzi. KaÅ¼dy rodzaj pracy uwaÅ¼asz, Å¼e chcÄ to doÅÄ duÅ¼o bÄdzie w R. 

WiÄc tutaj jest 2 plus 2. Oto 2 razy pi. R ma kilka wbudowanych staÅych Å¼e bÄdziesz czÄsto korzystaÄ jak pi, e. 

A potem, oto 7 oraz runif, wiÄc runif z 1. Jest to funkcja, ktÃ³ra to generuje jednÄ losowÄ uniform od 0 do 1. A jeszcze 3 do potÄgi 4. Jest pierwiastki kwadratowe. 

Jest dziennika. WiÄc zalogowaÄ zrobi bazy wykÅadnicza sama. A potem, jeÅli podasz bazÄ, a nastÄpnie moÅ¼esz robiÄ, co chcesz bazy. A to oto kilka innych poleceÅ. WiÄc masz 23 mod 2. Wtedy masz resztÄ. Wtedy masz naukowa JeÅli takÅ¼e notacji chcÄ zrobiÄ po prostu wiÄcej i bardziej skomplikowane rzeczy. 

WiÄc tutaj jest przypisanie. Tak wiÄc typowe zadania w R jest zrobione ze strzaÅkÄ wiÄc jest to mniej niÅ¼, a nastÄpnie myÅlnik. WiÄc ja tylko przypisanie 3 zmiennej Val. 

A potem ja drukowania val a nastÄpnie wypisze trzy. DomyÅlnie w R tÅumacza, to bÄdzie drukowaÄ rzeczy dla Ciebie wiÄc nie trzeba okreÅlaÄ wydrukowaÄ val kaÅ¼dym razem, gdy chcesz coÅ wydrukowaÄ. MoÅ¼esz po prostu zrobiÄ val i to zrobi to za Ciebie. 

Ponadto, moÅ¼na uÅ¼yÄ rÃ³wna technicznie jako operator przypisania. IstniejÄ niewielkie subtelnoÅci pomiÄdzy pomocÄ strzaÅki Operator i rÃ³wne operator przypisania. GÅÃ³wnie przez kongresowego, kaÅ¼dego po prostu uÅ¼yÄ operatora strzaÅki. 

I tu, jestem przypisanie tego Zapis ukoÅne nazywa 1 dwukropek 6. To generuje wektor od 1 do 6. I to naprawdÄ miÅe, bo wtedy po prostu przypisaÄ wektor do val i Å¼e dziaÅa samodzielnie. 

Tak to juÅ¼ jest przejÅcie z single-- bardzo intuicyjny danych Struktura tylko dwukrotnÄ pewien rodzaj typu do wektora i ktÃ³re bÄdzie zbieraÄ wszystkie skalarne wartoÅci dla Ciebie. WiÄc po przejÅciu z skalarne, to ma przedmiotÃ³w R i to jest wektor. Wektor jest kaÅ¼dy rodzaj zbiÃ³r tego samego typu. WiÄc oto kilka wektorÃ³w. 

WiÄc to jest numeryczny. R numeryczna jest sposobem na powiedzenie dwukrotnie. I tak przez DomyÅlnie kaÅ¼dy Numer bÄdzie podwÃ³jna. 

WiÄc jeÅli masz c 1,1, 3, ujemny 5,7 c jest funkcjÄ. Ten skleja wszystkie trzy numery w wektor. I to tak, jeÅli bÄdzie byÄ: moÅ¼na zauwaÅ¼yÄ 3 przez siebie, normalnie moÅ¼na zakÅadaÄ, Å¼e to jest jak liczba caÅkowita, ale z powodu wszystkich wektorÃ³w sÄ tego samego typu, jest to wektor deblu lub numeryczny w tym przypadku. 

rnorm jest funkcja, ktÃ³ra generuje Årednia normalne variables-- lub standardowe wartoÅci normalnych. A ja okreÅlajÄc dwa z nich. WiÄc robiÄ rnorm 2, przypisujÄc, Å¼e do deweloperÃ³w, a potem mam drukowania Devs. To sÄ tylko dwa losowe wartoÅci normalnych. 

A potem wskazÃ³wki, jeÅli nie dbasz o liczbach. WiÄc to jest tylko o pamiÄÄ PrzydziaÅ i zapisywanie rozmiar pamiÄci. WiÄc trzeba by doÅÄczyÄ Twoje numery od stolicy L. 

Na ogÃ³Å jest to Zapis R w historycznym coÅ zwane dÅuga liczba caÅkowita. Tak wiÄc wiÄkszoÅÄ czasu, bÄdziesz mieÄ do czynienia z podwÃ³jnej. I jeÅli kiedykolwiek bÄdzie pÃ³Åºniej na optymalizacji kodu, moÅ¼na po prostu dodaÄ te L's pÃ³Åºniej lub w trakcie jej jeÅli jesteÅ jak prekognicyjnym o tym, co masz zamiar robiÄ te zmienne. 

WiÄc tutaj jest wektor znakÃ³w. Tak wiÄc raz jeszcze, mam zÅÄczenie trzy ciÄgi tym czasie. ZauwaÅ¼, Å¼e podwÃ³jne struny i pojedyncze struny sÄ takie same w R. WiÄc mam Artur i Marvina i tak kiedy jestem drukowania go, wszystkie z nich zamiar pokazaÄ podwÃ³jne struny. A jeÅli chcesz takÅ¼e m.in. CiÄg peÅne lub pojedyncze w swoich bohaterÃ³w, to moÅ¼esz albo na przemian struny. 

WiÄc Marvina dla Drugi element, to jest bÄdzie show-- ciÄ Wystarczy podwÃ³jne struny a nastÄpnie jeden ciÄg wiÄc to jest zmienny. W przeciwnym razie, jeÅli chcesz korzystaÄ z dwukrotnie Operator ciÄg w podwÃ³jnym sznurkiem kiedy deklarujÄc jÄ, a nastÄpnie po prostu uÅ¼yÄ operatora ucieczki. WiÄc robisz podwÃ³jnÄ ciÄg backslash. 

I w koÅcu, rÃ³wnieÅ¼ majÄ wektory logiczne. WiÄc logical-- tak PRAWDA FAÅSZ, a oni bÄdzie wszystkie litery. A potem znowu, jestem zÅÄczenie je, a nastÄpnie przypisanie ich do bools. WiÄc bools pokaÅ¼e Ci PRAWDA, FAÅSZ, PRAWDA. 

WiÄc tutaj jest wektorowy indeksowania. Tak wiÄc na poczÄtku, I biorÄ function-- nazywany jest sequence-- Sekwencja od 2 do 12. I biorÄ sekwencjÄ przez 2. WiÄc to bÄdzie zrobiÄ 2, 4, 6, 8, 10 i 12. A potem, jestem indeksowania dostaÄ siÄ do trzeciego elementu. 

WiÄc jedna rzecz, aby pamiÄtaÄ, jest Å¼e indeksy R by od 1. WiÄc odstÄpach 3 ma daÄ Ci trzeci element. Jest to rodzaj rÃ³Å¼ni siÄ od innych JÄzyki, gdzie zaczyna siÄ od zera. WiÄc w C lub C ++, na przykÅad, jesteÅ dostanie czwarty element. 

I tu jest vals od 3 do 5. WiÄc jedna rzecz, ktÃ³ra jest naprawdÄ fajne jest to, Å¼e Ciebie moÅ¼e generowaÄ zmienne tymczasowe wewnÄtrz a potem po prostu korzystaÄ z nich na bieÅ¼Äco. WiÄc tutaj jest 3 do 5. WiÄc jestem generowania wektora 3, 4 i 5, a nastÄpnie Jestem indeksowania uzyskaÄ trzeciÄ, czwarty i piÄty elementy. 

Podobnie wiÄc, moÅ¼na streszczenie tego po prostu zrobiÄ kaÅ¼dy rodzaj wektora To daje indeksowanie. WiÄc tutaj jest vals a nastÄpnie elementy pierwszy, trzeci i szÃ³sty. A potem, jeÅli chcesz zrobiÄ uzupeÅnienie, wiÄc po prostu zrobiÄ minus potem, Å¼e bÄdzie dam ci wszystko, co nie jest Po pierwsze, trzeci i szÃ³sty elementem. Tak wiÄc bÄdzie to 4, 8 i 10. 

A jeÅli chcesz dostaÄ nawet bardziej zaawansowany, moÅ¼na ÅÄczyÄ logiczne wektory. Tak wiÄc wskaÅºnik ten bÄdzie Ci Wektor ten Boolean dÅugoÅci 6. WiÄc rep PRAWDA przecinek trzy. BÄdzie to powtÃ³rzyÄ TRUE trzy razy. WiÄc to daje wektor PRAWDA, PRAWDA, PRAWDA. 

rep FAÅSZ 4-- to bÄdzie ci wektor FAÅSZ FAÅSZ FAÅSZ FAÅSZ. A nastÄpnie c zamierza zÅÄczyÄ te dwa Boolean razem. WiÄc masz zamiar uzyskaÄ trzy Trues a nastÄpnie cztery FALSEs. 

Tak, Å¼e kiedy vals indeksy, jesteÅ dostanie PRAWDA, PRAWDA, PRAWDA. Tak, Å¼e powie tak, ChcÄ te trzy elementy. A potem FAÅSZ, FAÅSZ, FAÅSZ FAÅSZ bÄdzie powiedzieÄ nie, nie chcÄ tych elementÃ³w tak, to nie bÄdzie ich zwrotu. 

I myÅlÄ, Å¼e nie ma tu wÅaÅciwie literÃ³wka bo to jest mÃ³wiÄc powtÃ³rz PRAWDA 3 i powtÃ³rzyÄ FAÅSZ 4, i technicznie, ty tylko szeÅÄ elementÃ³w, wiÄc powtÃ³rzyÄ FAÅSZ, naleÅ¼y powtÃ³rzyÄ FAÅSZ 3. MyÅlÄ, Å¼e R jest wystarczajÄco takie inteligentne Å¼e jeÅli tylko okreÅliÄ cztery tutaj, a nastÄpnie nie bÄdzie nawet bÅÄdu siÄ. To po prostu daÄ ci tÄ wartoÅÄ. WiÄc po prostu zignorowaÄ czwarty FAÅSZ. 

WiÄc tutaj jest wektorowy przypisanie. WiÄc to po prostu ustawia set.seed-- nasion dla liczb pseudolosowych. WiÄc jestem nasienie do ustawiania 42, co oznacza, Å¼e ââjeÅli generowaÄ trzy losowo normalne wartoÅci, a nastÄpnie, jeÅli Ciebie uruchomiÄ set.seed na wÅasnÄ rÄkÄ Komputer stosujÄc tÄ ââsamÄ wartoÅÄ 42, NastÄpnie moÅ¼na rÃ³wnieÅ¼ uzyskaÄ Te same trzy losowe normalne. 

WiÄc to jest naprawdÄ dobry dla powtarzalnoÅci. Zazwyczaj, kiedy robisz niektÃ³re rodzaj analizy naukowej, co chcesz ustawiÄ nasienie. W ten sposÃ³b moÅ¼na po prostu inni naukowcy odtworzyÄ dokÅadnie ten sam kod, ktÃ³ry zrobiÄ, bo oni majÄ dokÅadnÄ same zmienne losowe that-- lub losowo WartoÅci, ktÃ³re zostaÅy podjÄte, jak rÃ³wnieÅ¼. 

I tak wektorowy cesja tutaj pokazuje odstÄpach 1 do 2. WiÄc zajmuje pierwsze dwa elementy w odstÄpach, a nastÄpnie przypisuje je do 0. A potem, moÅ¼na teÅ¼ po prostu zrobiÄ Podobnie dzieje siÄ z logicznych. 

WiÄc vals nie jest rÃ³wna 0-- tej woli daje faÅszywe wektorowych, FAÅSZ, PRAWDA w tym przypadku. A potem, to bÄdzie mÃ³wiÄ nic tych wskaÅºnikÃ³w, ktÃ³re sÄ prawdziwe, to siÄ dzieje, Å¼e przypisanie do 5. WiÄc to ma trzeci element tutaj, a nastÄpnie przypisuje go do 5. 

I to jest naprawdÄ Åadne w porÃ³wnaniu do jÄzykÃ³w niskopoziomowych gdzie trzeba uÅ¼yÄ pÄtli robiÄ wszystko to vectorized rzeczy bo to po prostu bardzo intuicyjne i to jest jeden nie-liniowej. A co to wielki temat Zapis wektorowy jest to, Å¼e w R, to coÅ w rodzaju wbudowana tak, Å¼e sÄ one niemal tak szybko, jak robi siÄ w jÄzyku niskiego poziomu, jak przeciwieÅstwie do tworzenia pÄtli w R , a nastÄpnie o to, aby zrobiÄ Samo indeksowanie dynamiczny. I Å¼e bÄdzie wolniejszy niÅ¼ robi ten rodzaj vectorized rzeczy gdzie moÅ¼e to zrobiÄ rÃ³wnolegle, gdzie to robi to w gwintowania zasadzie. 

WiÄc tutaj jest wektorowy operacji. WiÄc jestem generowania wartoÅci od 1 do 3, przypisywania, Å¼e ââaby vec1, 3 do 5, vec2, dodajÄc je razem. To dodaje im skÅadnikiem mÄdry tak to jest jeden plus 3, 2 plus 4, i tak dalej. 

vec1 razy vec2. To mnoÅ¼y dwie wartoÅci skÅadnika mÄdry. WiÄc jest to jeden razy 3, 2 razy 4, a nastÄpnie 3 razy 5. 

A potem, podobnie moÅ¼na rÃ³wnieÅ¼ zrobiÄ comparisons-- porÃ³wnaÅ logicznych. WiÄc to FAÅSZ FAÅSZ PRAWDA, w tym 1 tak, poniewaÅ¼ nie jest wiÄksza niÅ¼ 3, 2 nie jest wyÅ¼sza niÅ¼ 4. Jest to, jak sÄdzÄ, inny literÃ³wkÄ, 3 na pewno nie jest wiÄksza niÅ¼ 5. Tak. A wiÄc moÅ¼na po prostu zrobiÄ wszystko te proste czynnoÅci poniewaÅ¼ ich dziedziczone od samych klas. 

WiÄc to byÅ tylko wektorowych. I to jest jakby najbardziej podstawowym Obiekt R, poniewaÅ¼ biorÄc pod uwagÄ wektor, moÅ¼na tworzyÄ bardziej zaawansowane obiekty. 

Tak tu jest matryca. Jest to w zasadzie abstrakcji co matryca jest sama. WiÄc w tym przypadku, to trzy rÃ³Å¼ne wektory, gdzie kaÅ¼dy z nich jest kolumna, lub moÅ¼na jÄ rozwaÅ¼yÄ w kaÅ¼dej z nich jest wiersz. 

WiÄc jestem przechowywania od 1 do macierzy 9, a potem mam okreÅlajÄc 3 rzÄdy. Tak wiÄc od 1 do 9 daje wektor 1, 2, 3, 4, 5, 6 i aÅ¼ do 9. 

JednÄ z rzeczy, rÃ³wnieÅ¼ pamiÄtaÄ, jest to, Å¼e Sklepy wartoÅci R w formacie kolumny-dur. WiÄc innymi sÅowy, kiedy widzisz 1 do 9, to bÄdzie przechowywaÄ them-- to bÄdzie 1, 2, 3 w pierwszej kolumnie i wtedy bÄdzie to zrobiÄ 4, 5, 6, w drugiej kolumnie i 7, 8, 9 w trzeciej kolumnie. 

A oto niektÃ³re inne wspÃ³lne funkcje moÅ¼na wykorzystaÄ. Tak sÅabe mat, to daje Wymiary macierzy. To bÄdzie powrÃ³t wektor wymiaru. A wiÄc w tym przypadku, poniewaÅ¼ nasza matryca jest 3 przez 3, to siÄ daje wektor numeryczny to 3 3. 

I tu wÅaÅnie pokazuje mnoÅ¼enie macierzy. WiÄc zwykle, jeÅli tylko zrobiÄ asterisk-- wiÄc mata gwiazdka mat-- to bÄdzie Operacja skÅadnikiem mÄdry i co siÄ nazywa produkt Hadamard. WiÄc to zrobiÄ kaÅ¼dy element skÅadowy mÄdry. JednakÅ¼e, jeÅli chcesz multiplication-- matrycy wiÄc mnoÅ¼Äc pierwsze razy wierszy Pierwsza kolumna drugiej macierzy jest i tak on-- naleÅ¼y uÅ¼yÄ operacja ta proc. 

A t maty jest tylko Operacja na transponowanie. WiÄc mÃ³wiÄ wziÄÄ transpozycji macierz, pomnoÅ¼yÄ przez macierz Sam. I wtedy to bÄdzie powrÃ³ci do was kolejne 3 o 3 macierzy projekcji Produkt, czego chcesz. 

I tak to byÅo matrycy. Oto, co siÄ nazywa ramka danych. Ramka danych moÅ¼na myÅleÄ jako matrycy, ale w kaÅ¼dej kolumnie sam bÄdzie innego typu. 

WiÄc co jest naprawdÄ fajne temat danych klatek, Å¼e w samej analizy danych, bÄdziesz mieÄ to wszystko danych heterogenicznych i to wszystko naprawdÄ brudnych rzeczy, gdzie kaÅ¼da z kolumn same mogÄ byÄ rÃ³Å¼nych typÃ³w. WiÄc mÃ³wiÄ stworzyÄ ramka danych, czy ints od 1 do 3, a nastÄpnie rÃ³wnieÅ¼ wektor znakÃ³w. WiÄc mogÄ indeksu przez KaÅ¼dy z tych kolumn i wtedy bÄdÄ miaÅ same wartoÅci. I moÅ¼na teÅ¼ zrobiÄ jakiÅ operacji na ramkach danych. I przez wiÄkszoÅÄ czasu, gdy jesteÅ robi analizÄ danych lub jakÄÅ z wyprzedzajÄcym, bÄdziesz pracy z tych strukturach gdzie kaÅ¼da kolumna bÄdzie byÄ innego typu. 

Wreszcie, wiÄc sÄ to w zasadzie tylko cztery podstawowe obiekty w liÅcie R. po prostu zebraÄ wszelkie inne obiekty chcesz. Tak bÄdzie zapisaÄ to na jednego zmienne, ktÃ³re moÅ¼na Åatwo uzyskaÄ dostÄp. 

WiÄc tutaj, biorÄ listÄ. MÃ³wiÄ rzeczy rÃ³wna 3. WiÄc mam zamiar mieÄ jeden element lista i to siÄ nazywa rzeczy, a to bÄdzie mieÄ wartoÅÄ 3. 

MogÄ rÃ³wnieÅ¼ utworzyÄ macierz. Tak wiÄc wynosi od 1 do 4 i koÅcowego rzÄdu jest rÃ³wna 2, w 2 od 2 matrycy. RÃ³wnieÅ¼ na liÅcie i to siÄ nazywa mat. moreStuff, ciÄg znakÃ³w, a jeszcze inna lista sama w sobie. 

WiÄc to jest lista, ktÃ³ra 5 i niedÅºwiedzia. Tak wiÄc wartoÅÄ 5 i go ma ciÄg znakÃ³w niedÅºwiedzia i to jest lista wewnÄtrz listy. WiÄc moÅ¼na mieÄ te rekurencyjne rzeczy gdzie masz another-- A wpisz w ramach typu. Podobnie wiÄc, moÅ¼na mieÄ matrycÄ w innej matrycy i tak dalej. A lista jest po prostu dobry sposÃ³b zbierania i agregowania wszystkie te rÃ³Å¼ne obiekty. 

I w koÅcu, tutaj jest po prostu pomÃ³c w przypadku to wÅaÅnie przeszedÅ bardzo szybko. Tak wiÄc w kaÅ¼dej chwili jesteÅ zdezorientowany o jakiejÅ funkcji, moÅ¼na zrobiÄ pomocy tej funkcji. WiÄc moÅ¼na zrobiÄ pomocy macierzy lub macierz znak zapytania. Oraz pomoc i znak zapytania sÄ po prostu skrÃ³t do tej samej rzeczy wiÄc sÄ aliasy. 

lm jest funkcja po prostu robi model liniowy. Ale jeÅli po prostu nie majÄ pojÄcia, w jaki sposÃ³b Prace moÅ¼na po prostu zrobiÄ pomocy lm i Å¼e dam ci trochÄ Rodzaj dokumentacji, wyglÄda trochÄ jak Strona czÅowiek w Uniksie, gdzie masz krÃ³tki opis tego, co tak, to jakie sÄ jego argumenty sÄ, co to zwraca, i tylko wskazÃ³wki, jak z niego korzystaÄ, a niektÃ³re przykÅady, jak rÃ³wnieÅ¼. 

WiÄc pozwÃ³l mi iÅÄ do przodu i pokaÅ¼ niektÃ³re demo za pomocÄ R. OK. PoszedÅem wiÄc na bardzo szybko tylko dane struktury i jakiÅ op-- niektÃ³rych operacji. Oto niektÃ³re funkcje. 

WiÄc jestem po prostu w celu zdefiniowania funkcji. WiÄc jestem rÃ³wnieÅ¼ za pomocÄ Operator o przydziaÅ, a nastÄpnie mÃ³wiÄ zadeklarowaÄ jÄ jako funkcjÄ. I to ma wartoÅÄ x. WiÄc to jest jakaÅ wartoÅÄ ma i mam zamiar wrÃ³ciÄ x siebie. WiÄc to jest funkcja toÅ¼samoÅci. 

A co jest fajnego w tym w porÃ³wnaniu z innymi jÄzykami a drugi na niskim poziomie JÄzyki to, Å¼e x moÅ¼e byÄ dowolnego typu samego i bÄdzie to powrÃ³t tego typu. WiÄc moÅ¼e imagine-- wiÄc niech ja po prostu uruchomiÄ to szybko. Przepraszam. 

WiÄc jedna rzecz, naleÅ¼y rÃ³wnieÅ¼ wspomnieÄ, jest to, Å¼e ten edytor uÅ¼ywam nazywa rstudio. To jest to, co siÄ nazywa IDE. I jedna rzecz, ktÃ³ra jest naprawdÄ miÅo o tym jest to, Å¼e zawiera wiele rzeczy, ktÃ³re chcÄ zrobiÄ sama w R po prostu bardzo intuicyjnie. 

WiÄc tutaj jest konsola tÅumacza. Podobnie wiÄc, moÅ¼na rÃ³wnieÅ¼ uzyskaÄ w tym Konsola surowe prostu wykonujÄc R. kapitaÅu I to jest dokÅadnie to, samo, jak w konsoli. WiÄc moÅ¼e po prostu zrobiÄ id funkcji x, x, x. I then-- a nastÄpnie, Å¼e bÄdzie dobrze sam. 

WiÄc rstudio jest wielki poniewaÅ¼ posiada konsolÄ. Posiada rÃ³wnieÅ¼ dokumenty chcesz pracowaÄ na. I to ma zmienne Å¼e moÅ¼na zobaczyÄ w Årodowisku. A potem, jeÅli masz zrobiÄ dziaÅek, a nastÄpnie ci moÅ¼e po prostu zobaczyÄ go tutaj, w przeciwieÅstwie do zarzÄdzania, wszystkie te rÃ³Å¼ne okna przez nich samych. 

I rzeczywiÅcie osobiÅcie uÅ¼ywaÄ Vima, ale poczuÄ siÄ jak rstudio jest doskonaÅa tylko uzyskania dobry pomysÅ jak moÅ¼na wykorzystaÄ R. Zazwyczaj kiedy starasz siÄ nauczyÄ siÄ nowego zadania, nie chcesz, aby obsÅuÅ¼yÄ zbyt wiele rzeczy na raz. WiÄc R jest tylko very-- rstudio Jest to bardzo dobry sposÃ³b uczenia R bez koniecznoÅci zajmowania wszystkie te inne rzeczy. 

WiÄc biegnÄ id komentarzy. Zwraca To czeÅÄ. id 123. Oto wektor liczb caÅkowitych. WiÄc podobnie, poniewaÅ¼ moÅ¼na podejmowaÄ jakieÅ wartoÅci, moÅ¼esz zrobiÄ powrocie id x tak zwraca 1234 i 5. 

I niech mi tylko pokazaÄ, Å¼e jest to faktycznie caÅkowitÄ. I podobnie, jeÅli nie klasÄ id x, to bÄdzie liczbÄ caÅkowitÄ. A potem, moÅ¼na rÃ³wnieÅ¼ porÃ³wnaÄ dwa i to prawda. Jestem wiÄc sprawdzenie, czy identyfikator x rÃ³wna jest rÃ³wna x i zawiadomienia to, Å¼e daje dwa Trues. WiÄc to nie mÃ³wi, sÄ dwa obiekty identyczne, a kaÅ¼dy z zapisÃ³w w ciÄgu wektory identyczne. 

Oto bounded.compare. WiÄc to jest nieco bardziej skomplikowana w tym, Å¼e ma jeÅli warunek i inni a nastÄpnie trzeba dwojga argumenty na raz. Tak wiÄc x jest innego typu. I mÃ³wiÄ to, Drugi argument jest. To moÅ¼e byÄ cokolwiek, jak rÃ³wnieÅ¼. Ale domyÅlnie, to zajmie 5, jeÅli nie podasz nic. 

WiÄc mam zamiar powiedzieÄ, jeÅli x jest wiÄksze niÅ¼. WiÄc jeÅli nie podasz, to mÃ³wi, Å¼e jeÅli x jest wiÄkszy niÅ¼ 5, potem mam zamiar wrÃ³ciÄ PRAWDA. innego, mam zamiar wrÃ³ciÄ FAÅSZ. WiÄc pozwÃ³l mi iÅÄ do przodu i okreÅlenie tego. 

A teraz mam zamiar uruchomiÄ bounded.compare 3. Tak mÃ³wi siÄ 3 mniej than-- jest wiÄksza niÅ¼ 3 5. Nie, to nie jest tak FAÅSZ. 

I bounded.compare 3 i zamierzam porÃ³wnaÄ go za pomocÄ rÃ³wna 2. WiÄc teraz mÃ³wiÄ tak, teraz ja chcÄ byÄ coÅ innego. WiÄc mam zamiar powiedzieÄ, powinny byÄ dwa. 

MogÄ albo zrobiÄ tego rodzaju Zapis lub mÃ³wiÄ rÃ³wna 2. To jest bardziej czytelny na tym, Å¼e kiedy jesteÅ patrzÄc na naprawdÄ te skomplikowane funkcje, ktÃ³re podjÄÄ i to wielokrotnego arguments-- moÅ¼e byÄ tylko, Å¼e dziesiÄtki oftentimes-- rÃ³wna 2 jest bardziej czytelny dla Ci wiÄc, Å¼e pÃ³Åºniej w przyszÅoÅci bÄdziesz wiedzieÄ, co robisz. 

WiÄc w tym przypadku, jestem powiedzenie 3 wiÄkszy niÅ¼ 2. Tak to jest. I podobnie, moÅ¼e po prostu usunÄÄ to i powiedzieÄ, jest wiÄksza niÅ¼ 2 3 gdzie wynosi 2. I to jest rÃ³wnieÅ¼ prawdÄ. Tak? 

PUBLICZNOÅCI: Czy ty wykonywanie linia po linii? 

DUSTIN TRAN: Tak, jestem. WiÄc to, co robiÄ tutaj jest biorÄc ten tekst document-- i co to wielki temat rstudio jest to, Å¼e MogÄ tylko uruchomiÄ short-- klawisz skrÃ³tu. WiÄc robiÄ sterowania-Enter. 

A potem zabieram linia w dokumencie tekstowym a nastÄpnie umieszczenie w konsoli. WiÄc mÃ³wiÄ, bounded.compare i robiÄ Control-X. WiÄc moÅ¼e po prostu nie dziaÅajÄ rÃ³wnieÅ¼ tutaj. A potem, Å¼e wezmÄ linii, a nastÄpnie umieÅciÄ go tutaj. I wtedy podobnie, mogÄ dziaÅajÄ tutaj. I to bÄdzie po prostu zachowaÄ definiowania linie do konsoli tak. 

A jeÅli rÃ³wnieÅ¼ zauwaÅ¼yÄ krÄcone szelki sÄ tam podobnie jak w skÅadni C. X-- jeÅli jeÅli warunek jest rÃ³wnieÅ¼ zamiar uÅ¼yÄ nawiasÃ³w, a nastÄpnie moÅ¼esz uÅ¼yÄ innego. Kolejnym z nich jest inny, jeÅli. WiÄc to bÄdzie x wynosi rÃ³wna, na przykÅad. A potem bÄdÄ coÅ tu wrÃ³ciÄ. 

ZauwaÅ¼, Å¼e istniejÄ dwa rÃ³Å¼ne rzeczy tutaj, Å¼e siÄ dzieje. Jednym z nich jest, Å¼e tu jestem, okreÅlajÄc Zwraca wartoÅÄ PRAWDA. Tutaj MÃ³wiÄ tylko x. WiÄc R bÄdzie zazwyczaj domyÅlnie przyjÄÄ ostatniÄ arguments-- lub podjÄÄ ostatniÄ liniÄ kodu, i to bÄdzie, co to wrÃ³ciÅ. WiÄc to same coÅ jak robi powrotu x. 

I po prostu pokazaÄ. A potem, to bÄdzie dziaÅaÄ tak po prostu. WiÄc pozwÃ³l mi kontynuowaÄ ten. 

WiÄc else if. I naprawdÄ, mogÄ wrÃ³ciÄ coÅ, chciaÅbym. Tak wiÄc nie trzeba nawet powrotne Boolean caÅy czas, MoÅ¼e po prostu coÅ innego powrÃ³ciÄ. WiÄc mogÄ zrobiÄ niedÅºwiedzia powrotu. 

WiÄc jeÅli x rÃ³wna jest rÃ³wna, to bÄdzie powrÃ³t misia. W przeciwnym razie, to siÄ zwrÃ³ci TRUE. MogÄ teÅ¼ zrobiÄ wektor czy naprawdÄ coÅ. 

I zwykle w statycznie JÄzyki na maszynie, trzeba by okreÅliÄ typ tutaj. I zauwaÅ¼, Å¼e to moÅ¼e byÄ po prostu nic. I R jest na tyle inteligentny, Å¼e to po prostu to zrobiÄ i bÄdzie dobrze. 

WiÄc pozwÃ³l, Å¼e okreÅlenie tego. Unexpected-- och przepraszam. Powinno tu byÄ nawias klamrowy. OK. Cool. Dobrze. Teraz porÃ³wnajmy 3 i wynosi 3. Tak powinno return-- yeah-- niedÅºwiedzia wartoÅci. 

WiÄc teraz bardziej ogÃ³lnego, jest to, jak co z innymi strukturami danych. WiÄc trzeba tÄ funkcjÄ. To bÄdzie dziaÅaÄ na kaÅ¼dym rodzaju wartoÅci jak 3 lub numeryczne, innymi sÅowy, podwÃ³jne. 

Ale to, co o czymÅ takim wektorze. WiÄc co siÄ dzieje, jeÅli do-- wiÄc jestem zamierza przypisaÄ val do, powiedzmy, 4 do 6. WiÄc jeÅli wrÃ³cÄ to, to jest wektor z 4, 5, 6. 

Teraz zobaczmy, co siÄ stanie, jeÅli to zrobiÄ bounded.compare val. WiÄc to jest zamiar daÄ 15 1251. WiÄc innymi sÅowy, to mÃ³wi jeÅli spojrzeÄ na tego warunku tak mÃ³wi x jest mniejsza niÅ¼ lub czegoÅ. WiÄc to jest trochÄ mylÄce, bo teraz po prostu nie wiem, co siÄ dzieje. SÄdzÄ wiÄc, Å¼e jednÄ rzecz, ktÃ³ra jest naprawdÄ dobrze tylko prÃ³buje debug jest to, Å¼e moÅ¼na po prostu zrobiÄ val jest wiÄksza ni i zobaczyÄ, co siÄ tam dzieje. 

WiÄc val-- jest domyÅlnie 5 tak ZrÃ³bmy Val wiÄkszy niÅ¼ 5. WiÄc to jest wektor false false PRAWDA. WiÄc teraz, kiedy patrzysz na tego, to bÄdzie powiedzieÄ, czy, i wtedy to bÄdzie ci to daÄ jest wektorem false false PRAWDA. 

WiÄc kiedy przechodzÄ to na R, R nie ma pojÄcia, co robisz. Dlatego, Å¼e spodziewa siÄ, jeden singiel WartoÅÄ, ktÃ³ra jest logiczna, a teraz dajesz mu wektor logicznych. WiÄc domyÅlnie R jest po prostu powiedzieÄ, co do cholery, Mam zamiar zaÅoÅ¼yÄ, Å¼e jesteÅ zamiar wziÄÄ pierwszy element tutaj. WiÄc mam zamiar say-- idÄ przyjÄÄ, Å¼e jest to FAÅSZ. Tak to siÄ mÃ³wi Nie, to nie jest w porzÄdku. 

Podobnie, to bÄdzie byÄ rÃ³wna rÃ³wna val. Nie, przykro 5. I to teÅ¼ bÄdzie faÅszywe, jak rÃ³wnieÅ¼. WiÄc to bÄdzie, Å¼e nie, To nieprawda, jak rÃ³wnieÅ¼ tak, Å¼e to powrÃ³ci ten ostatni. 

WiÄc to jest albo dobre albo zÅe rzeczy, w zaleÅ¼noÅci od sposobu go zobaczyÄ. Bo gdy jesteÅ tworzenia tych funkcji, w rzeczywistoÅci nie wiedzÄ, co siÄ dzieje. WiÄc czasami, Å¼e chcesz bÅÄd, a moÅ¼e chcesz po prostu ostrzeÅ¼enie. W tym przypadku, R nie zrobiÄ. WiÄc to jest naprawdÄ do Ci, co opiera siÄ myÅlisz, Å¼e jÄzyk powinien zrobiÄ w tym przypadku jeÅli przekaÅ¼emy wektora logicznych kiedy robisz, jeÅli stanie. 

WiÄc powiedzmy, Å¼e masz oryginalny jednym z, jeÅli inny TRUE i jesteÅ powrÃ³ci FAÅSZ. Tak wiÄc jednym ze sposobÃ³w abstrahowania to znaczy ja nie trzeba nawet tego warunku rzeczy. InnÄ rzeczÄ, jakÄ mogÄ zrobiÄ, to po prostu powrÃ³t samych wartoÅci. Tak wiÄc, jeÅli zauwaÅ¼y, jeÅli Ciebie Czy Val jest wiÄksza niÅ¼ 5, to bÄdzie powrÃ³t wektor false false PRAWDA. 

ByÄ moÅ¼e to jest to, czego chcÄ za bounded.compare. Chcesz zwrÃ³ciÄ wektor logicznych gdzie porÃ³wnuje kaÅ¼dej wartoÅci do siebie. WiÄc moÅ¼e po prostu nie bounded.compare Funkcja x, wynosi 5. I wtedy zamiast robiÄ tego, czy stan inny, IdÄ do powrotu x jest wiÄksze niÅ¼ 5. WiÄc jeÅli to prawda, to to siÄ zwrÃ³ci TRUE. A jeÅli nie, to powrÃ³ci FAÅSZ. 

I to bÄdzie pracowaÄ dla kaÅ¼da z tych struktur. WiÄc mogÄ bounded.compare c 1 6 lub 9 i mam zamiar powiedzieÄ, rÃ³wna 6, na przykÅad. I wtedy to bÄdzie daje prawo Boolean Wektor, Å¼e jesteÅ projektowania. 

To sÄ tylko funkcje a teraz niech mi tylko pokazaÄ kilka interaktywne wizualizacje. Nie sÄdzÄ, Å¼e rzeczywiÅcie majÄ Wi-Fi tutaj tak powiem po prostu iÅÄ do przodu i pominÄÄ ten jeden chyba. 

Ale jedna rzecz, ktÃ³ra jest cool jest jednak, Å¼e jeÅli tylko chcemy przetestowaÄ kilka rÃ³Å¼ne komendy danych, istnieje kilka rÃ³Å¼nych zestawÃ³w danych ktÃ³re sÄ juÅ¼ fabrycznie w R. Tak wiÄc jednym z nich jest zwany zestaw danych tÄczÃ³wki. Jest to jeden z najbardziej znanych te w uczeniu maszynowym. BÄdziesz zazwyczaj po prostu zrobiÄ jakÄÅ przypadki testowe, aby sprawdziÄ, czy kod dziaÅa. WiÄc po prostu sprawdziÄ, co tÄczÃ³wka. 

WiÄc to, co siÄ dzieje jako ramka danych. A to niby dÅugo, poniewaÅ¼ Ja po prostu wydrukowaÄ tÄczÃ³wkÄ. To drukowanie caÅÄ rzecz. WiÄc to ma te wszystkie rÃ³Å¼ne nazwy. WiÄc tÄczÃ³wka kolekcji rÃ³Å¼nych kwiatÃ³w. W tym przypadku, to mÃ³wi Ci gatunki nim, wszystkich tych rÃ³Å¼nych szerokoÅciach DÅugoÅci Sepal i pÅatka. 

I tak zazwyczaj, gdy chcesz wydrukowaÄ tÄczÃ³wki, na przykÅad, Å¼e nie chcesz go mieÄ to wszystko dlatego, Å¼e moÅ¼e przejÄÄ caÅa konsola. WiÄc jedna rzecz, ktÃ³ra jest naprawdÄ miÅo jest funkcja gÅowy. WiÄc jeÅli po prostu zrobiÄ gÅowÄ tÄczÃ³wki, to daje pierwsze piÄÄ rzÄdÃ³w lub szeÅciu myÅlÄ. A potem jak ci, moÅ¼na po prostu okreÅliÄ tutaj. WiÄc 20-- to daje Ci pierwsi 20 wierszy. I rzeczywiÅcie byÅo trochÄ zaskoczony, Å¼e ten daÅ mi szeÅÄ, wiÄc pozwÃ³l mi iÅÄ do przodu i sprawdziÄ iris-- lub gÅowy, przepraszam. A tutaj to daje Ci dokumentacjÄ z tego, co robi szef wartoÅÄ. Tak zwraca pierwszy lub ostatni obiektu. A potem bÄdÄ spojrzeÄ na domyÅlne. A potem mÃ³wi domyÅlnÄ Metoda gÅowy x i n wynosi 6L. WiÄc ta zwraca pierwsze szeÅÄ elementÃ³w. I podobnie, jeÅli zauwaÅ¼y siÄ tutaj, nie trzeba okreÅlaÄ n wynosi 6. DomyÅlnie uÅ¼ywa szeÅÄ, tak myÅlÄ. A potem, jeÅli chcÄ, aby okreÅliÄ pewne wartoÅci, to mogÄ zobaczyÄ, Å¼e dobrze. 

Tak, Å¼e jest kilka prostych poleceÅ i tu jest inny, Å¼e to just-- dobrze, I can-- to jest rzeczywiÅcie nieco bardziej skomplikowane, ale bÄdzie to po prostu wziÄÄ klasÄ kaÅ¼dej kolumny zestawu danych tÄczÃ³wki. WiÄc bÄdzie to pokazuje, co kaÅ¼dy z nich Kolumny sÄ pod wzglÄdem ich typÃ³w. Tak DÅugoÅÄ sepal jest numeryczne, SzerokoÅÄ sepal jest numeryczne. Wszystkie te wartoÅci sÄ tylko numeryczny bo moÅ¼na powiedzieÄ z tych danych SÄ to struktury wszystko bÄdzie numeryczne. 

Gatunek i kolumny bÄdzie czynnikiem. Tak normalnie, moÅ¼na by pomyÅleÄ, Å¼e to jest jak ÅaÅcuch znakÃ³w. Ale jeÅli po prostu zrobiÄ irisSpecies, i mam zamiar zrobiÄ gÅowÄ 5, i to bÄdzie drukowaÄ z pierwszych piÄciu wartoÅci. 

I wtedy zauwaÅ¼yÅ to poziomy. WiÄc to jest saying-- R jest sposobem na posiadania zmiennych kategorycznych. Zamiast wiÄc majÄc ciÄgi znakÃ³w, ma poziomy okreÅlajÄce ktÃ³re z tych rzeczy. 

WiÄc powiedzmy irisSpecies 1. WiÄc to, co chcesz zrobiÄ, o to, Å¼e jestem podzbiorÃ³w tej kolumnie gatunkÃ³w. WiÄc to ma Gatunek i kolumny indeksy, aby zdobyÄ pierwszy element. Tak to powinno daÄ setosa. I to daje rÃ³wnieÅ¼ poziomy tutaj. 

WiÄc moÅ¼esz takÅ¼e porÃ³wnaÄ to do Setosa znakÃ³w i to nie bÄdzie PRAWDA, poniewaÅ¼ jednym jest innego typu niÅ¼ inne. Albo MyÅlÄ, Å¼e to prawda, poniewaÅ¼ R jest bardziej inteligentny niÅ¼ ten. I wyglÄda na to, a nastÄpnie mÃ³wi, moÅ¼e to jest to, co chcesz. WiÄc to bÄdzie powiedzieÄ, charakter CiÄg setosa jest taki sam, jak ten. I wtedy podobnie, moÅ¼na rÃ³wnieÅ¼ po prostu chwyÄ je jak tak dalej. 

Tak, Å¼e to tylko jakiÅ szybkie komendy do zbioru danych. WiÄc oto kilka eksploracji danych. WiÄc to jest trochÄ wiÄcej zaangaÅ¼owany w analizie danych. I jest pobierana z kilku Bootcamp w badania w Berkeley. 

WiÄc biblioteki zagranicznej. WiÄc idÄ, aby zaÅadowaÄ biblioteka, ktÃ³ra siÄ nazywa zagranicznych. WiÄc to ma daÄ mi read.dta wiÄc zakÅadaÄ, Å¼e mam ten zestaw danych. Ta jest przechowywana w prÄd katalog mojej konsoli pracy. WiÄc po prostu zobaczyÄ, co katalog roboczy jest. 

Tak tu jest mÃ³j katalog roboczy. I odczytu danych dot, to rzeczÄ, mÃ³wi ten plik znajduje siÄ w folderze danych to bieÅ¼Äcy katalog roboczy. I read.dta to nie jest Polecenie domyÅlne. MyÅlÄ, Å¼e to siÄ juÅ¼ zaÅadowany. Romantyk zakÅada zaÅadowaÅem to na juÅ¼. 

Ale tak read.dta nie bÄdzie za polecenie domyÅlne. I dlatego bÄdziesz mieÄ zaÅadowaÄ w tej bibliotece package-- ten pakiet nazywa zagranicznych. A jeÅli nie masz Pakiet, myÅlÄ, Å¼e obcych jest jednym z wbudowanych nich. W przeciwnym razie, moÅ¼na rÃ³wnieÅ¼ zrobiÄ install.packages i to bÄdzie zainstalowaÄ pakiet. A to daje R. Uh, nie. I wtedy ja po prostu siÄ zatrzymaÄ to dlatego, Å¼e mam juÅ¼ to. 

Ale to, co naprawdÄ miÅo o R jest to, Å¼e do zarzÄdzania pakietami System jest bardzo elegancki. Bo to wszystko przechowujesz bardzo Åadnie dla Ciebie. WiÄc w tym przypadku, to bÄdzie do przechowywania to siÄ, jak sÄdzÄ, biblioteka ta tutaj. 

WiÄc kiedy tylko chcesz instalacji nowych pakietÃ³w, to tak samo proste, jak robi install.packages i R bÄdÄ zarzÄdzaÄ pakiety dla Ciebie. WiÄc nie musisz coÅ zrobiÄ Python, gdzie masz pakiet zewnÄtrzny menedÅ¼erowie jak papier Anakonda, gdzie jesteÅ doing-- zainstalowaniu pakiety poza Pythonie a nastÄpnie sprÃ³buj uruchomiÄ je samodzielnie. WiÄc to jest naprawdÄ dobry sposÃ³b. 

I install.packages wymaga Internetu. Zajmuje go z serwera oraz repozytorium, ktÃ³re zbiera wszystkie Pakiety nazywa CRAN. I moÅ¼na okreÅliÄ, ktÃ³ry rodzaj lustra chcesz pobraÄ pakiety. 

WiÄc biorÄ ten zestaw danych. Czytam go przy uÅ¼yciu tej funkcji. WiÄc pozwÃ³l mi iÅÄ do przodu i zrobiÄ. 

WiÄc zaÅÃ³Å¼my, Å¼e masz ten zestaw danych i masz absolutnie nie wiem co to jest. I to rzeczywiÅcie wyjdzie doÅÄ czÄsto w przemyÅle gdzie po prostu trzeba je tony i tony brudnych rzeczy i sÄ one niezwykle bez etykiety. WiÄc mam to ZbiÃ³r danych i nie wiem co to jest, wiÄc jestem pokazujÄc, aby to sprawdziÄ. 

WiÄc mam zamiar zrobiÄ najpierw gÅowÄ. WiÄc sprawdziÄ pierwsze szeÅÄ kolumny, co ten zestaw danych jest. WiÄc to jest stan, pres04, a nastÄpnie te wszystkie rÃ³Å¼ne rodzaj kolumn. I co ciekawe tu, jak sÄdzÄ, jest to, Å¼e Ciebie by przypuszczaÄ, Å¼e to wyglÄda jak jakiÅ wyborÃ³w. I chyba tylko z patrzÄc na pliku nazwa ta jest pewnego rodzaju kolekcji danych dotyczÄcych kandydatÃ³w lub wyborcÃ³w ktÃ³rzy gÅosowali na poszczegÃ³lnych prezydentÃ³w lub kandydatÃ³w prezydenta w wyborach w 2004 roku. 

WiÄc o wartoÅci 1, 2 wiÄc jeden sposÃ³b przechowywania kandydaci prezydent sÄ ich nazwy. W tym przypadku wyglÄda na to, sÄ wartoÅci tylko caÅkowite. WiÄc roku 2004, to byÅ Bush kontra Kerry wierzÄ. A teraz, powiedzmy, Å¼e po prostu nie wiem czy 1 odpowiada Bush lub 2 odpowiada Kerry lub i tak dalej, i tak dalej, prawda? 

I to jest, po prostu do mnie, doÅÄ powszechny problem. WiÄc co moÅ¼na zrobiÄ w tym przypadku? Warto wiÄc sprawdziÄ wszystkie te inne rzeczy. 

PaÅstwo, jestem przy zaÅoÅ¼eniu tego pochodzÄ z rÃ³Å¼nych paÅstw. partyid dochody. SpÃ³jrzmy na partyid. WiÄc moÅ¼e jedno moÅ¼na zrobiÄ, to patrzymy na siebie uwag ktÃ³re majÄ partyid z RepublikaÅskiej czy demokrata czy coÅ. WiÄc po prostu patrzeÄ na to, co partyid jest. 

WiÄc mam zamiar podjÄÄ dat i idÄ zrobiÄ, to znak dolara Operator Å¼e zrobiÅem wczeÅniej i to bÄdzie podzbiÃ³r tej kolumny. A potem mam zamiar udaÄ siÄ to w 20, Å¼eby zobaczyÄ, jak to wyglÄda. 

WiÄc to jest tylko kilka agencji krajowych. Tak wiÄc, innymi sÅowy, trzeba brakuje danych na temat tych facetÃ³w. Ale moÅ¼na zauwaÅ¼yÄ rÃ³wnieÅ¼ w tym dat partyid jest czynnikiem wiÄc to daje rÃ³Å¼ne kategorie. Tak wiÄc, innymi sÅowy, moÅ¼e partyid Demokrata, republikanin, NiezaleÅ¼ny, lub coÅ innego. 

WiÄc idÅº i niech sprawdziÄ, ktÃ³re z nich is-- och, OK. WiÄc mam zamiar podzbiÃ³r do partyid a nastÄpnie spÃ³jrz na te, ktÃ³re sÄ Demokrata, na przykÅad. To siÄ daje wartoÅÄ logicznÄ, Ogromny Boolean z Trues i FALSEs. 

A teraz zaÅÃ³Å¼my, Å¼e chcÄ do podzbioru tych facetÃ³w. WiÄc to zajmie moje DAT i podzbiÃ³r rzecz tego obserwacje majÄ partyid rÃ³wnych rÃ³wna demokrata. I to jest doÅÄ dÅugi, bo jest tak wiele z nich. WiÄc teraz, mam zamiar udaÄ siÄ to w 20. 

I, jak moÅ¼na zauwaÅ¼yÄ, rÃ³wna rÃ³wnych jest interesujÄca, Å¼e ââjesteÅ already-- jesteÅ rÃ³wnieÅ¼ w tym NAS. WiÄc w tym przypadku, nadal nie moÅ¼na uzyskaÄ wszelkie informacje, bo teraz masz NAS i po prostu chcesz zobaczyÄ, ktÃ³re z Obserwacja odpowiadajÄ DemokratÃ³w i nie brakuje tych samych wartoÅci. WiÄc w jaki sposÃ³b pozbyÄ siÄ tych agencji krajowych? 

WiÄc tutaj jestem tylko za pomocÄ przycisku na moim kursor, a nastÄpnie mÃ³wiÄc poruszania siÄ. I to tutaj jestem po prostu powiedzieÄ is.na datpartyid. WiÄc to i i podejmie dwa rÃ³Å¼ne wektory logiczne i powiedzieÄ, Å¼e bÄdzie PRAWDA i FAÅSZ na przykÅad. WiÄc to bÄdzie zrobiÄ ten skÅadnik mÄdry. WiÄc mÃ³wiÄ zabiorÄ ramka danych, podzbiÃ³r do tych, ktÃ³re odpowiadajÄ demokrata, i usuÅ ktÃ³ryÅ z nich, ktÃ³re nie sÄ na. 

WiÄc to will-- powinny daÄ ci coÅ. Zobaczmy is.na. SprÃ³bujmy is.na datpartyid. I to powinno daÄ you-- sorry-- tylko logicznÄ wektor. A potem, bo to tak dÅugo, IdÄ do podzbioru do 20. OK. Tak to powinno dziaÅaÄ. 

A ten bÄdzie rÃ³wnieÅ¼ Trues. Ach, tak, mÃ³j bÅÄd jest to, Å¼e I'm-- I C ++ i uÅ¼ywaÄ zamiennie, wiÄc R siÄ ten bÅÄd caÅy czas. I operator jest faktycznie, ktÃ³ry chcesz. Nie chcesz uÅ¼ywaÄ dwÃ³ch znakÃ³w handlowego, tylko jednym. OK. 

Zobaczmy wiÄc. WiÄc subsetted siÄ partyid gdzie jesteÅ demokratÄ i nie brakuje wartoÅci. A teraz spÃ³jrzmy na ktÃ³re z nich sÄ gÅosowali. Tak wiÄc wydaje siÄ, Å¼e najbardziej z nich gÅosowaÅo na 1. WiÄc mam zamiar iÅÄ do przodu i powiedzieÄ, Å¼e jest Kerry. 

I podobnie, moÅ¼na rÃ³wnieÅ¼ udaÄ siÄ do RepublikanÃ³w i miejmy nadziejÄ, powinno to daÄ 2. To tylko kilka rÃ³Å¼nych kolumn. I rzeczywiÅcie, to dwa. WiÄc partyid wszystkich republikanÃ³w, wiÄkszoÅÄ z nich gÅosujÄ na 2. 

Tak wiÄc wydaje siÄ, po prostu patrzÄc na to, RepublikaÅska bÄdzie very-- lub partyid bÄdzie bardzo waÅ¼nym czynnikiem w okreÅlaniu ktÃ³re kandydat oni zamierza gÅosowaÄ. I jest to oczywiÅcie prawda, w ogÃ³le. I to pasuje do Intuicja, oczywiÅcie. Tak wiÄc wydaje siÄ, Å¼e jestem koÅczy siÄ czas, wiÄc pozwÃ³l mi tylko powinny iÅÄ do przodu i pokazaÄ kilka szybkich zdjÄÄ. WiÄc tutaj jest coÅ, co jest lekko bardziej skomplikowane z wizualizacjÄ. A wiÄc w tym przypadku jest bardzo Prosta analiza tylko sprawdzam, co prezes '04 jest. 

WiÄc w tym przypadku, powiedzmy, chciaÅ odpowiedzieÄ na to pytanie. WiÄc zaÅÃ³Å¼my, Å¼e chciaÅ wiedzieÄ gÅosowania Zachowanie w wyborach prezydenta 2004 i jak to zaleÅ¼y od rasy. WiÄc nie tylko chcesz zobacz zachowanie gÅosowania, ale chcesz podzbiorem kaÅ¼dego rasa i rodzaj podsumowania tego. I moÅ¼na tylko powiedzieÄ tego zÅoÅ¼onego zapisu Å¼e jest to rodzaj coraz mgliste. 

Tak wiÄc jednym z bardziej zaawansowanych badaÅ pakiety to teÅ¼ rodzaj ostatnie nazywa dplyr. WiÄc to jest ta wÅaÅnie tutaj. I ggg-- ggplot2 jest po prostu Åadny sposÃ³b robi lepsze wizualizacje niÅ¼ wbudowany w jednym. 

WiÄc idÄ do zaÅadowania te dwie biblioteki. A potem, mam zamiar iÅÄ dalej i uruchomiÄ to polecenie. MoÅ¼esz po prostu traktujÄ to jako czarna skrzynka. 

Co siÄ dzieje, jest to, Å¼e tej rury Operator przechodzi w tym argumencie siÄ tutaj. WiÄc mÃ³wiÄ grupÄ, dat rasy, a nastÄpnie prezesem 04. A potem, przez te wszystkie inne polecenia blokujemy i podsumowujÄcy gdzie robiÄ liczyÄ i to ja jestem wykreÅlenie go tutaj. OK, fajnie. WiÄc ÅmiaÅo i zobaczyÄ, jak to wyglÄda. 

WiÄc co tu siÄ dzieje jest to, Å¼e po prostu wykreÅliÄ kaÅ¼dej z ras, a nastÄpnie ktÃ³re z nich sÄ gÅosowali. A te dwa rÃ³Å¼ne WartoÅci odpowiadajÄ 2 i 1. JeÅli chcesz byÄ bardziej Elegancki, moÅ¼na rÃ³wnieÅ¼ wystarczy wskazaÄ, Å¼e 2 jest Kerry-- lub 2 Bush, a nastÄpnie 1 Kerry. I moÅ¼na rÃ³wnieÅ¼ Å¼e w swojej legendy. 

I moÅ¼na rÃ³wnieÅ¼ podzieliÄ te wykresy sÅupkowe. Bo jedno jest Å¼e, jeÅli zauwaÅ¼ysz, nie jest to bardzo proste do okreÅlenia ktÃ³ra z tych dwÃ³ch wartoÅci jest wiÄksza. WiÄc jedna rzecz, ktÃ³rÄ chcesz zrobiÄ, to ten niebieski obszar i po prostu przenieÅÄ go tutaj tak Ciebie MoÅ¼na porÃ³wnaÄ te dwa obok siebie. I myÅlÄ, Å¼e to coÅ, czego nie majÄ czasu, aby zrobiÄ juÅ¼ teraz, ale to jest bardzo Åatwe do zrobienia. MoÅ¼esz po prostu zajrzeÄ do strony man z ggplot. WiÄc moÅ¼e po prostu nie ggplot jak Å¼e i czytaÄ na tej stronie podrÄcznika. 

WiÄc niech mi tylko szybko pokazaÄ kilka fajnych rzeczy. Idziemy dalej i przejÅÄ to-- tylko Zastosowanie uczenia maszynowego. WiÄc powiedzmy, Å¼e mamy te trzy opakowaniach, tak mam zamiar zaÅadowaÄ je w. WiÄc to po prostu wypisuje niektÃ³re Informacje po I zaÅadowany do rzeczy. WiÄc mÃ³wiÄ to read.csv, Ten zestaw danych, a teraz Mam zamiar iÅÄ do przodu i patrzeÄ i zobaczyÄ, co jest w Årodku zbioru danych. 

WiÄc pierwsze 20 obserwacji. WiÄc mam tylko x1, x2, i Y. Tak wiÄc Wydaje siÄ, jak kilka tych wartoÅci MoÅ¼e sÄ w zakresie od 20 do 80 lub tak. A potem podobnie dla X2, a nastÄpnie Y to wydaje siÄ, Å¼e etykiety 0 i 1. 

Aby to sprawdziÄ, mogÄ po prostu zrobiÄ X1 podsumowanie danych. A potem podobnie dla te wszystkie inne kolumny. WiÄc podsumowanie jest szybki sposÃ³b po prostu pokazujÄc szybkich wartoÅci. Och, przepraszam. Ten powinien byÄ Y. 

A wiÄc w tym przypadku, wydaje quantiles, mediany, maxes rÃ³wnieÅ¼. W tym przypadku, dataY moÅ¼na zobaczyÄ Å¼e to tylko bÄdzie 0 i 1. RÃ³wnieÅ¼ Årednia mÃ³wi 0.6, po prostu oznacza, Å¼e ââto Wydaje siÄ, Å¼e mam wiÄcej niÅ¼ 1s 0s. 

WiÄc pozwÃ³l mi iÅÄ do przodu i pokaÅ¼ Ci, jak to wyglÄda. WiÄc jestem po prostu wykreÅliÄ ten. Zobaczmy, jak to wyjaÅniÄ. Och OK. OK. 

Tak to jest, jak to wyglÄda. Tak wiÄc wydaje siÄ, Å¼e Å¼Ã³Åcie I okreÅlonych jako 0, a nastÄpnie czerwony I okreÅlono jako 1s. WiÄc wyglÄda na to, etykieta i jej punkty WyglÄda na to, Å¼e chciaÅeÅ tylko niektÃ³re rodzaj grupowania na ten temat. 

I niech mi tylko iÅÄ do przodu i pokaÅ¼ Ci niektÃ³re z tych funkcji wbudowanych. WiÄc tutaj jest lm. WiÄc to jest po prostu staramy aby dopasowaÄ liniÄ do tego. WiÄc co jest najlepszym sposobem Å¼e mogÄ zmieÅciÄ linii takich Å¼e bÄdzie to najlepiej rozdzieliÄ tego rodzaju klastrÃ³w. A najlepiej, moÅ¼na po prostu zobaczyÄ Å¼e po prostu uruchomiÄ wszystkie te polecenia a nastÄpnie, zamierzam dalej i dodaÄ liniÄ. 

Tak wiÄc wydaje siÄ, Å¼e najlepszym odgadniÄcia. To biorÄc najlepszy, ktÃ³ry minimalizuje BÅÄd prÃ³buje dopasowaÄ tÄ liniÄ. OczywiÅcie, to wyglÄda na rodzaj dobre, ale to nie jest najlepszy. I modele liniowe, w OgÃ³lnie rzecz biorÄc, bÄdÄ naprawdÄ wielki dla teorii i wÅaÅnie rodzaj fundamentÃ³w budowlanych maszyny uczenia siÄ. Jednak w praktyce, bÄdziesz chcesz zrobiÄ coÅ bardziej ogÃ³lnego. 

WiÄc moÅ¼e po prostu sprÃ³buj uruchomiÄ coÅ, co nazywa siÄ sieci neuronowej. Te rzeczy sÄ coraz bardziej powszechne. I po prostu dziaÅa fantastycznie dla duÅ¼ych zbiorÃ³w danych. WiÄc w tym przypadku, tylko have-- niech see-- mamy nrow. WiÄc nrow jest tylko, Å¼e liczbÄ wierszy. WiÄc w tym przypadku, Å¼e masz 100 uwag. 

WiÄc pozwÃ³l mi iÅÄ do przodu i dokonaÄ sieci neuronowej. WiÄc to jest naprawdÄ Åadne bo mogÄ tylko powiedzieÄ nnet i jestem cofa Y. Y tak, Å¼e kolumny. A potem cofa go na dwa pozostaÅe zmienne. WiÄc to jest krÃ³tsza Zapis dla X1 i X2. 

WiÄc idÅº naprzÃ³d i uruchomiÄ to. Och, przepraszam. Trzeba uruchomiÄ te wszystkie rzeczy. I to jest wÅaÅnie drukowania notacji do tego, jak szybko to szybko czy nie konwergentnych. WyglÄda wiÄc na to, Å¼e nie sÄ zbieÅ¼ne. WiÄc pozwÃ³l mi iÅÄ do przodu i do druku siÄ, jak to wyglÄda. 

Zobacz tutaj jest obraz i tu jest Kontur pokazujÄc, jak dobrze pasuje. I to jest just-- widaÄ to, Å¼e jest to bardzo, bardzo Åadne. To moÅ¼e byÄ nawet przeuczenia, ale moÅ¼na teÅ¼ WyjaÅniajÄc to z innymi Techniki takie jak krzyÅ¼owego. A te sÄ wbudowane w R. 

I niech mi tylko pokazaÄ, Maszyna wektorÃ³w noÅnych. Jest to kolejny bardzo powszechne technika uczenia maszynowego. Jest to bardzo podobne do modelu liniowej, lecz uÅ¼ywa tego, co siÄ nazywa metoda jÄdra. I zobaczymy, jak dobrze, Å¼e jest. WiÄc ten jest bardzo podobny do tego, jak oraz sieÄ neuronowa wykonuje, ale jest znacznie bardziej pÅynny. I to jest na off z what-- jak dziaÅajÄ SVMs. 

WiÄc jest to tylko bardzo krÃ³tki przeglÄd niektÃ³rych z wbudowanych funkcji moÅ¼esz zrobiÄ a takÅ¼e niektÃ³re z eksploracji danych. PozwÃ³lcie mi iÅÄ do przodu i wrÃ³ciÄ do zjeÅ¼dÅ¼alni. 

Tak oczywiÅcie, jest nie bardzo obszerny. I to jest naprawdÄ tylko teaser pokazujÄc, co naprawdÄ moÅ¼na zrobiÄ w R. WiÄc gdybyÅ tak jak Aby dowiedzieÄ siÄ wiÄcej, tutaj jest kilka rÃ³Å¼nych zasobÃ³w. 

WiÄc jeÅli jesteÅ lubiÄcy podrÄcznikÃ³w lub jesteÅ po prostu lubiÄ czytaÄ rzeczy w sieci, to jest fantastyczne jeden po Hadley Wickham, ktÃ³ry rÃ³wnieÅ¼ stworzyÅ wszystko naprawdÄ fajne pakiety. JeÅli lubi filmy, a nastÄpnie Berkeley ma niesamowite bootcamp to several--, Å¼e trochÄ dÅugo. I bÄdzie to nauczy ciÄ prawie wszystko co chcesz wiedzieÄ o R. 

I podobnie, nie Codeacademy i wszystko to inny rodzaj interaktywnych stron internetowych. SÄ one rÃ³wnieÅ¼ coraz common-- bardziej powszechne. WiÄc to jest bardzo podobne do Codeacademy. I wreszcie, jeÅli tylko chcÄ WspÃ³lnotÄ i pomoc, to banda rzeczy moÅ¼na przejÅÄ. OczywiÅcie, nadal uÅ¼ywaÄ list, po prostu jak prawie kaÅ¼dy inny SpoÅecznoÅÄ jÄzyk programowania. I #rstats, jest naszej spoÅecznoÅci Twitter. To rzeczywiÅcie doÅÄ powszechne. A potem uÅ¼ytkownika! Jest po prostu nasza konferencja. 

A potem, oczywiÅcie, moÅ¼na wykorzystaÄ wszystkie te inne rzeczy, Q & A, jak przepeÅnienie stosu, Google, a nastÄpnie GitHub. PoniewaÅ¼ wiÄkszoÅÄ z tych pakietÃ³w, i wiele spoÅecznoÅci bÄdzie wokÃ³Å rozwoju Kod poniewaÅ¼ jest open source. I to tylko naprawdÄ Åadne na GitHub. I wreszcie, moÅ¼esz skontaktowaÄ siÄ ze mnÄ, jeÅli po prostu masz jakieÅ krÃ³tkie pytania. WiÄc moÅ¼esz mnie znaleÅºÄ na Twitterze tutaj moja strona internetowa, i po prostu mÃ³j e-mail. WiÄc mam nadziejÄ, Å¼e byÅ something-- tylko krÃ³tki zwiastun czego R jest naprawdÄ zdolny. I miejmy nadziejÄ, Å¼e po prostu sprawdziÄ te trzy linki i zobaczyÄ, co moÅ¼na zrobiÄ wiÄcej. I myÅlÄ, Å¼e to wÅaÅnie o nim. DziÄki. 

[APPLAUSE]