[CHWARAE CERDDORIAETH] DUSTIN TRAN: Hi. Dustin Fy enw i. Felly, byddaf yn cyflwyno Dadansoddi Data ym R. Dim ond ychydig am fy hun. Rwy'n hyn o bryd yn fyfyriwr graddedig mewn y Gwyddorau Peirianneg a Chymhwysol. Rwy'n astudio groesffordd dysgu peiriant ac ystadegau felly Dadansoddi Data mewn ymchwil yw 'n sylweddol sylfaenol i'r hyn I ei wneud o ddydd i ddydd. A R yn arbennig da ar gyfer dadansoddi data am ei fod yn dda iawn ar gyfer prototeipio. Ac fel arfer, pan fyddwch yn gwneud rhyw fath o ddadansoddi data, mae llawer o'r problemau yn mynd i gwybyddol. Ac felly 'ch jyst eisiau cael peth iaith da iawn sy'n yn unig da dros wneud adeiledig yn swyddogaethau, yn hytrach na at gael i ddelio â phethau lefel isel. Felly, yn y dechrau, Im 'jyst yn mynd i gyflwyno beth yw R, pam y byddai rydych am ei ddefnyddio, ac yna ewch drosodd i ryw demo, a dim ond yn mynd ymlaen o'r fan honno. Felly beth yw R? R yn unig datblygu iaith ar gyfer cyfrifiadura ystadegol a delweddu. Felly beth mae hyn yn ei olygu yw bod mae'n iaith ardderchog iawn ar gyfer unrhyw fath o beth sy'n delio â ansicrwydd neu delweddu data. Felly, mae gennych y rhain i gyd dosbarthiadau tebygolrwydd. Mae yn mynd i fod adeiledig yn swyddogaethau. Bydd gennych hefyd rhagorol blotio pecynnau. Python yn un arall sy'n cystadlu iaith ar gyfer data. Ac un peth yr wyf yn gweld bod R yn llawer gwell arno yw delweddu. Felly, yr hyn y byddwch yn ei weld yn y demo fel yn dda yn unig yw iaith sythweledol iawn mai dim ond yn gweithio'n arbennig o dda. Mae hefyd yn rhad ac am ddim ac yn ffynhonnell agored, fel y yn unrhyw iaith da eraill yr wyf yn dyfalu. Ac yma, bagad o ddim ond keywords taflu ar chi. Mae'n ddeinamig, sy'n golygu os oes gennych fath penodol neilltuo i gwrthrych nag y bydd yn jyst newid ar y hedfan. Mae'n ddiog felly mae'n smart am sut mae'n gwneud cyfrifiadau. Swyddogaethol sy'n golygu y gall y mae mewn gwirionedd yn gweithredu seiliedig oddi swyddogaethau hynny anything-- unrhyw fath o drin eich bod yn ei wneud, bydd yn cael ei seilio oddi ar swyddogaethau. Gweithredwyr Felly deuaidd, er enghraifft, yn swyddogaethau unig gynhenid. Ac mae popeth a ydych yn mynd i wneud yw mynd i gael ei rhedeg oddi ar swyddogaethau ei hun. Ac yna gwrthrych-gyfeiriol hefyd. Felly dyma yw plot XKCD. Nid yn unig oherwydd fy mod yn teimlo fel XKCD yn sylfaenol i unrhyw fath cyflwyniad, ond oherwydd Rwy'n teimlo fel hyn yn wir morthwylion y pwynt bod llawer o'r adeg pan ydych yn gwneud rhyw fath o ddata dadansoddi, nid yw'r broblem yn cymaint pa mor gyflym y mae'n rhedeg, ond am ba hyd y mae'n mynd i mynd â chi i raglen y dasg. Felly dyma yn unig yw dadansoddi p'un strategaeth a neu b yn fwy effeithlon. Mae hyn yn mynd i fod rhywbeth eich bod yn mynd i ddelio llawer â hwy yn math o ieithoedd lefel isel lle rydych yn delio â diffygion SEG, dyrannu cof, initializations, hyd yn oed yn gwneud y swyddogaethau adeiledig yn. Ac mae pethau hyn yn cael ei drin gyd iawn, yn gain iawn yn R. Felly, dim ond i morthwyl hon pwynt, mae'r dagfa fwyaf yn mynd i fod gwybyddol. Felly dadansoddi data yn broblem anodd iawn. P'un a ydych yn ei wneud dysgu peiriant neu eich bod yn yn gwneud dim ond rhyw fath o archwilio data sylfaenol, nad ydych am gael i gymryd dogfen ac yna llunio rhywbeth bob tro y byddwch yn am weld beth colofn yn edrych fel, pa gofnodion penodol mewn matrics yn edrych fel. Felly, 'ch jyst eisiau cael rhyw rhyngwyneb 'n sylweddol' n glws gallwch chi redeg swyddogaeth syml bod mynegeion i beth bynnag hoffech chi, a dim ond rhedeg oddi yno. A bod angen parth ieithoedd penodol ar gyfer hyn. A bydd R 'n sylweddol yn eich helpu i ddiffinio'r problem a datrys yn y modd hwn. Felly dyma yn llain yn dangos rhaglennu poblogrwydd R gan ei fod wedi mynd dros amser. Felly, fel y gwelwch, fel 2013 neu felly dim ond chwythu i fyny aruthrol. Ac mae hyn wedi bod yn union oherwydd hynny tuedd mawr yn y diwydiant technoleg data am mawr. Hefyd, nid dim ond y dechnoleg diwydiant, ond mewn gwirionedd unrhyw that-- diwydiant oherwydd mae llawer o'r diwydiannau yn fath o sylfaenol i geisio datrys y problemau hyn. Ac fel arfer, gallwch gael rhywfaint o dda ffordd o fesur problemau hyn neu hyd yn oed eu diffinio neu eu datrys gan ddefnyddio data. Felly, yr wyf yn meddwl ar hyn o bryd R yw'r 11eg y rhan fwyaf o iaith poblogaidd ar TIOBE ac mae wedi bod yn tyfu ers hynny. Felly dyma rhai yn fwy nodweddion R. Mae ganddo nifer enfawr o becynnau a ar gyfer yr holl bethau gwahanol hyn. Felly, unrhyw tro y byddwch yn cael broblem benodol, mae'r rhan fwyaf Bydd yr amser R gael swyddogaeth honno i chi. Felly, a ydych am adeiladu rhyw fath o beiriant algorithm dysgu Gelwir Coedwig ar hap neu Coed Penderfyniad, neu hyd yn oed ceisio cymryd cymedr swyddogaeth neu unrhyw un pethau hyn, Bydd R gael hynny. Ac os ydych yn gwneud ydych yn gofalu am Optimization, un peth sy'n gyffredin yw bod ar ôl eich bod yn gwneud prototeipio rhyw fath o iaith lefel uchel, byddwch yn taflu hynny in-- Bydd 'ch jyst porthladd bod dros i ryw iaith lefel isel. Beth sy'n dda am R yw bod unwaith y byddwch chi'n wneud prototeipio, gallwch redeg C ++, neu Fortran, neu unrhyw un o'r rhain rhai lefel is yn uniongyrchol i mewn i R. Felly dyna un 'n sylweddol Nodwedd cŵl am R, os ydych yn wir yn poeni am y pwynt Optimization. Ac mae hefyd yn dda iawn i visualizations we. Felly D3.js, er enghraifft, yw Amcana seminar arall ein bod yn ei gyflwyno heddiw. Ac mae hyn yn wir yn anhygoel i gwneud visualizations rhyngweithiol. Ac D3.js yn cymryd yn ganiataol eich bod wedi rhyw fath o ddata i gael ei blotio a R yn ffordd wych o fod yn gallu gwneud y dadansoddiad data cyn i chi ei allforio drosodd i D3.js neu hyd yn oed rhedeg D3.js gorchmynion i mewn i R ei hun, yn ogystal gan fod y rhain i gyd llyfrgelloedd eraill yn ogystal. Felly dyna yn unig oedd cyflwyno beth yw R a pham y gallech ei ddefnyddio. Felly gobeithio, dwi wedi argyhoeddedig rhywbeth i chi am dim ond ceisio i weld sut brofiad. Felly, yr wyf i'n mynd i fynd yn ei flaen ac yn mynd drwy rhai hanfodion am wrthrychau R a'r hyn y gallwch chi wir yn ei wneud. Felly dyma yn unig yw criw o orchmynion mathemateg. Felly dywedwch you're-- ydych am adeiladu eich hun iaith a 'ch jyst eisiau i gael bagad o offer gwahanol. Unrhyw fath o weithredu yr ydych yn meddwl byddech yn eisiau cael ei 'n bert lawer yn mynd i fod yn R. Felly dyma yw 2 a 2. Dyma 2 waith pi. R Mae criw o cysonion adeiledig mewn y byddwch yn aml yn defnyddio fel pi, e. Ac yna, dyma 7 plws runif, felly runif o 1. Mae hon yn swyddogaeth sy'n cynhyrchu un gwisg hap 0-1. Ac yna mae 3 i'r pŵer o 4. Mae gwreiddiau sgwâr. Mae log. Felly log yn gwneud sylfaen esbonyddol ei ben ei hun. Ac yna, os eich bod yn nodi sylfaen, yna gallwch wneud beth bynnag sylfaen ydych ei eisiau. Ac yna dyma rai gorchmynion eraill. Felly, mae gennych 23 mod 2.. Yna byddwch yn cael y gweddill. Yna mae gennych gwyddonol nodiant os ydych hefyd yn awyddus i wneud yr union mwy a pethau'n fwy cymhleth. Felly dyma yw aseiniad. Aseiniadau mor nodweddiadol mewn R yn cael ei wneud gyda saeth felly mae'n llai na ac yna y cysylltnod. Felly dyma Im 'jyst yn aseinio 3 i'r Val amrywiol. Ac yna dw i'n argraffu Val ac yna mae'n argraffu tri. Yn ddiofyn mewn ymchwil cyfieithydd, mae'n Bydd argraffu pethau allan ar eich rhan felly nid oes rhaid i chi nodi argraffu Val unrhyw tro y byddwch eisiau argraffu rhywbeth. Alli jyst wneud Val a Yna, bydd yn gwneud hynny ar eich rhan. Hefyd, gallwch ddefnyddio hafal dechnegol fel gweithredwr aseiniad. Mae ychydig cynnil rhwng defnyddio y saeth gweithredydd a'r gyfartal gweithredwr ar gyfer aseiniadau. Yn bennaf gan gonfensiwn, mae pawb Bydd defnyddiwch y gweithredwr saeth. Ac yma, rydw i'n neilltuo hon nodiant arosgo o'r enw 1 colon 6. Mae hyn yn creu fector 1-6. Ac mae hyn yn neis iawn oherwydd wedyn 'ch jyst aseinio'r fector i Val ac sy'n gweithio ei ben ei hun. Felly, mae hyn eisoes yn mynd o single-- data sythweledol iawn strwythur dim ond ddwbl o rhyw fath o fath i mewn i fector ac a fydd yn casglu'r holl gwerthoedd sgalar i chi. Felly, ar ôl mynd o sgalar, byddwch yn gael amcanion R ac mae hyn yn fector. Mae fector yn unrhyw fath o casgliad o'r un math. Felly dyma griw o fectorau. Felly mae hwn yn rhifol. Rhifol yn fodd R o ddweud dwbl. Ac felly yn ddiofyn, unrhyw Bydd rhif yn ddwbl. Felly os oes gennych c o 1.1, 3, negyddol 5.7, mae'r c yn swyddogaeth. Mae hyn yn concatenates pob un o'r tri rhifau i mewn i fector. A bydd hyn yn be-- felly os byddwch yn sylwi ar 3 ei ben ei hun, Fel arfer, byddech yn cymryd yn ganiataol bod hyn yn debyg cyfanrif, ond gan fod yr holl fectorau yr un fath, mae hyn yn fector o dyblau neu rhifol yn yr achos hwn. rnorm yn swyddogaeth sy'n cynhyrchu variables-- normal safonol neu werthoedd normal safonol. A dwi'n gan nodi dau ohonynt. Felly, rwy'n ei wneud rnorm 2, aseinio hynny i devs, ac yna i ddim yn argraffu devs. Felly mae'r rhain yn dim ond dau Gwerthoedd normal ar hap. Ac yna ints os ydych yn gwneud ydych yn gofalu am gyfanrifau. Felly, mae hyn yn golygu mwy na cof dyrannu ac arbed maint y cof. Felly, byddai'n rhaid i chi atodi eich rhifau gan y cyfalaf L. Yn gyffredinol, mae hyn yn Nodiant hanesyddol R ar gyfer rhywbeth o'r enw cyfanrif hir. Felly mae'r rhan fwyaf o'r amser, wnewch chi helpu yn delio â dyblau. Ac os ydych chi erioed bydd yn nes ymlaen ar wneud y mwyaf eich cod, gallwch ychwanegu'r rhain L wedyn neu yn ystod ei os ydych chi fel precognitive am yr hyn ydych chi'n mynd i wneud newidynnau hyn. Felly dyma yw fector gymeriad. Felly, unwaith eto, rwy'n cydgadwyno MT tri llinynnau hyn o bryd. Sylwch fod llinynnau dwbl a llinynnau unigol yr un fath ym R. Felly mae gen i arthur a MARVIN ac felly pan dwi'n argraffu allan, pob un ohonynt yn mynd i ddangos llinynnau dwbl. Ac os ydych chi hefyd am gynnwys y llinyn dwbl neu sengl yn eich cymeriadau, yna gallwch naill ai yn ail eich llinynnau. Felly MARVIN ar gyfer y ail elfen, mae hyn yn mynd i show-- chi os oes gen llinynnau dwbl ac yna llinyn unigol felly mae hyn yn eiledol. Fel arall, os ydych am ddefnyddio dwbl gweithredwr llinyn yn llinyn dwbl pan fyddwch yn datgan, yna 'ch jyst defnyddiwch y gweithredwr dianc. Felly, byddwch yn gwneud y slaes llinyn dwbl. Ac yn olaf, rydym hefyd cael fectorau rhesymegol. Felly logical-- mor GWIR ac GAU, ac maen nhw'n mynd i fod pob llythyr cyfalaf. Ac yna, unwaith eto, rwy'n cydgadwyno MT nhw ac yna eu neilltuo i bools. Felly bools yn mynd i ddangos ydych yn TRUE, ANGHYWIR, ac GWIR. Felly dyma yw mynegeio vectorized. Felly, yn y dechrau, yr wyf yn wyf yn cymryd function-- gelwir hyn yn sequence-- dilyniant 2-12. A dwi'n cymryd dilyniant â 2. Felly, mae'n mynd i wneud 2, 4, 6, 8, 10 a 12. Ac yna, rwy'n mynegeio i gael y drydedd elfen. Felly, un peth i gadw mewn cof yw bod mynegeion R drwy ddechrau o 1. Felly vals 3 yn mynd i roi chi y drydedd elfen. Mae hyn yn fath o wahanol eraill ieithoedd lle mae'n dechrau o sero. Felly, yn C neu C ++, er enghraifft, rydych yn mynd i gael y bedwaredd elfen. A dyma yw vals 3 i 5 oed. Felly, un peth sydd yn 'n sylweddol oera yw bod chi Gall cynhyrchu newidynnau dros dro y tu mewn ac yna dim ond yn eu defnyddio ar y hedfan. Felly dyma yw 3 i 5. Felly dw i'n creu fector 3, 4, a 5 ac yna Im 'yn mynegeio i gael y trydydd, pedwerydd, a'r pumed elfen. Felly yr un modd, gallwch haniaethol hyn i ddim ond gwneud unrhyw fath o fector sy'n rhoi i chi mynegeio. Felly dyma yw vals ac yna'r elfennau yn gyntaf, y trydydd, a dosbarth. Ac yna, os ydych chi am i wneud cyflenwad, felly 'ch jyst gwneud y minws chi helpu hynny wedyn ac rhoi popeth nad dyna'r chi yn gyntaf, y trydydd, neu elfen dosbarth. Felly, bydd hyn yn 4, 8, a 10. Ac os ydych chi am gael hyd yn oed yn fwy datblygedig, gallwch concatenate fectorau Boole. Felly mynegai hwn yn mynd i roi i chi y fector Boole o hyd 6. Felly cynrychiolydd coma GWIR 3.. Bydd hyn yn ailadrodd GWIR dair gwaith. Felly, bydd hyn yn rhoi i chi yn fector TRUE, GWIR, GWIR. cynrychiolydd GAU 4-- hyn yn mynd i roi i chi fector o FFUG, ANGHYWIR, ANGHYWIR, ANWIR. Ac yna c yn mynd i concatenate y ddau Booleans gyda'i gilydd. Felly, rydych yn mynd i gael tri TRUEs ac yna bedwar FALSEs. Felly, pan fyddwch yn vals mynegai, rydych yn mynd i gael y GWIR GWIR, GWIR,. Felly mae hynny'n mynd i ddweud ie, Rwyf am tair elfen hynny. Ac yna ANGHYWIR, ANGHYWIR, ANGHYWIR, FFUG yn mynd i ddweud na, dydw i ddim eisiau elfennau hynny felly nid yw'n mynd i ddychwelyd iddynt. Ac yr wyf yn dyfalu mae mewn gwirionedd yn typo yma oherwydd mae hyn yn ei ddweud dro ar ôl tro GWIR 3 ac ailadrodd ANWIR 4, ac yn dechnegol, yr ydych Dim ond chwe elfen, felly ailadrodd FFUG, dylai fod yn ailadrodd ANWIR 3. Rwy'n credu R hefyd yn ddigon mor smart os ydych yn unig yn nodi 4 yma, yna Ni fydd hyd yn oed gwall allan. Bydd 'I jyst yn rhoi gwerth hwn i chi. Felly bydd yn jyst anwybyddu hynny pedwerydd ANWIR. Felly dyma yw aseiniad vectorized. Felly set.seed-- hyn yn unig yn gosod y hadau ar gyfer rhifau pseudorandom. Felly rwy'n gosod y hadau i 42, sy'n golygu bod os byddaf yn cynhyrchu tri ar hap arferol gwerthoedd, ac yna os ydych yn rhedeg set.seed ar eich pen eich hun cyfrifiadur gan ddefnyddio'r un gwerth 42, Yna, byddwch hefyd yn cael y un tri normalau hap. Felly, mae hyn yn wirioneddol dda am atgynyrchioldeb. Fel arfer, pan fyddwch yn gwneud rhywfaint o math o ddadansoddiad gwyddonol, byddech am i osod y hadau. Fel hyn gall dim ond gwyddonwyr eraill atgynhyrchu'r un cod union eich bod wedi ei wneud oherwydd fe wna nhw gael yr union un newidynnau hap that-- neu ar hap gwerthoedd sy'n eich bod wedi cymryd allan yn ogystal. Ac felly yr aseiniad vectorized yma yn dangos y vals 1 i 2. Felly, mae'n cymryd y ddwy elfen gyntaf o vals ac yna yn eu neilltuo i 0. Ac yna, gallwch hefyd jyst gwneud y beth tebyg gyda'r Booleans. Felly nid vals yn hafal i 0-- ewyllys hon rhoi GAU fector chi, ANGHYWIR, GWIR yn yr achos hwn. Ac yna, mae'n mynd i ddweud unrhyw o'r mynegeion hynny a oedd TRUE, Yna, mae'n mynd i aseinio hwnnw i 5. Felly, mae'n cymryd y drydedd elfen yma ac wedyn yn aseinio i 5. Ac mae hyn yn neis iawn o gymharu â ieithoedd lefel isel lle mae'n rhaid i chi eu defnyddio ar gyfer dolenni i wneud hyn i gyd stwff vectorized oherwydd ei fod yn unig iawn 'n athrylithgar ac mae'n un un-leinin. A beth sy'n ymwneud gwych nodiant vectorized yn R, bod y rhain yn fath o adeiledig yn fel eu bod eu bod yn bron mor gyflym fel wneud mewn iaith lefel isel fel hytrach na gwneud ar gyfer dolen mewn Ymchwil ac yna gorfod iddo wneud y mynegeio deinamig ei hun. Ac fe fod yn arafach na gwneud math hwn o beth vectorized lle y gall wneud hynny ar y cyd, lle mae'n gwneud hynny wrth edafu yn y bôn. Felly dyma ei vectorized gweithrediadau. Felly rwy'n creu gwerth 1 i 3, aseinio hynny i vec1, 3 a 5, vec2, gan ychwanegu at ei gilydd. Mae'n ychwanegu cydran-ddoeth iddynt fel 'i' 1 a 3, 2 a 4, ac yn y blaen. vec1 amseroedd vec2. Mae hyn yn lluosi y ddau gwerthfawrogi cydran doeth. Felly mae'n 1 o weithiau 3, 2 waith 4, ac yna 3 gwaith 5. Ac yna, yn yr un modd allwch hefyd wneud comparisons-- cymariaethau rhesymegol. Felly mae'n GAU GWIR GAU yn hyn achos oherwydd mae 1 yn Nid fwy na 3, 2 yn fwy na 4. Mae hyn yn, yr wyf yn dyfalu, typo arall, 3 yn bendant nid fwy na 5. Yeah. Ac er mwyn i chi jyst yn gwneud popeth y gweithrediadau syml oherwydd bod eu etifeddu o'r dosbarthiadau eu hunain. Felly dyna oedd dim ond y fector. A dyna fath o y mwyaf sylfaenol R gwrthrych oherwydd rhoddir fector, gallwch adeiladu gwrthrychau mwy datblygedig. Felly dyma matrics. Mae hyn yn y bôn y tyniad o'r hyn y matrics ei hun. Felly, yn yr achos hwn, mae'n tri gwahanol fectorau, lle mae pob un yn golofn, neu gallwch ystyried ei gan fod pob un yn olynol. Felly rwy'n storio matrics o 1 i 9 ac yna i ddim yn pennu'r 3 rhes. Felly, 1 i 9 yn rhoi fector 1 i chi, 2, 3, 4, 5, 6, a holl ffordd i 9. Un peth hefyd i gadw mewn cof yw bod Siopau R gwerthoedd mewn fformat colofn-mawr. Felly, mewn geiriau eraill, pan fyddwch yn gweld 1 i 9, mae'n mynd i storio them-- mae'n mynd i fod yn 1, 2, 3 yn y golofn gyntaf, ac yna bydd yn gwneud 4, 5, 6 yn yr ail golofn, ac yna 7, 8, 9 yn y drydedd golofn. A dyma rai eraill swyddogaethau cyffredin y gallwch eu defnyddio. Felly mat dim, bydd hyn yn rhoi i chi y dimensiynau y matrics. Mae'n mynd i ddychwelyd i chi fector y dimensiwn. Felly, yn yr achos hwn, gan fod ein matrics yw 3 o 3, mae'n mynd i roi i chi fector rhifol dyna 3 3. A dyma yn unig yw dangos lluosi matrics. Felly fel arfer, os ydych yn unig yn ei wneud asterisk-- felly mat seren mat-- mae hyn yn mynd i fod gweithrediad gydran-ddoeth neu yr hyn a elwir y cynnyrch Hadamard. Felly, mae'n mynd i wneud pob Elfen cydran-ddoeth. Fodd bynnag, os ydych am multiplication-- matrics felly luosi'r amser rhes gyntaf ngholofn gyntaf yr ail matrics yn ac felly on-- byddech yn eu defnyddio y gweithrediad y cant. A t o mat yn unig yw gweithredu am trosi. Felly, yr wyf ddim yn dweud fod ar drosi yn y matrics, lluoswch iddo gan yr matrics ei hun. Ac yna mae'n mynd i dychwelyd atoch 3 arall 3 matrics yn dangos y cynnyrch byddech eisiau. Ac felly yr oedd matrics. Dyma yr hyn a elwir ffrâm data. Mae ffrâm data y gallwch feddwl amdano fel matrics, ond mae pob colofn hun yn mynd i fod o fath gwahanol. Felly beth cŵl am ddata fframiau yw bod mewn dadansoddi data ei hun, rydych yn mynd i gael hyn i gyd data heterogenaidd a phob 'n sylweddol rhain pethau anniben lle mae pob un o'r colofnau Gellir eu hunain fod o wahanol fathau. Felly dyma i ddim yn dweud greu ffrâm data, mae ints 1-3, ac yna hefyd yn cael fector cymeriad. Felly, gallaf mynegai drwy pob un o'r colofnau hyn ac yna byddaf yn cael y gwerthoedd eu hunain. A gallwch hefyd wneud rhyw fath o weithrediadau ar fframiau data. Ac yn y rhan fwyaf o'r amser pan fyddwch chi gwneud dadansoddiad data neu ryw fath o preprocessing, byddwch yn gweithio gyda'r rhain strwythurau data lle mae pob colofn yn mynd i fod o fath gwahanol. Yn olaf, felly mae'r rhain yn eu hanfod yn unig y pedwar gwrthrychau hanfodol Rhestr R. Bydd dim ond casglu unrhyw gwrthrychau eraill yr ydych ei eisiau. Felly, bydd yn storio'r hyn yn un amrywiol y gallwch gael mynediad yn hawdd. Felly dyma, Rwy'n cymryd rhestr. I ddim yn dweud pethau yn dychwelyd 3. Felly dw i'n mynd i gael un elfen mewn y rhestr, ac gelwir hyn yn stwff, ac mae'n mynd i gael y gwerth 3. Gallaf hefyd greu matrics. Felly mae hyn yn 1 i 4 a diwedd rhes yn hafal i 2, felly mae 2 o 2 matrics. Hefyd yn y rhestr ac fe'i gelwir mat. moreStuff, llinyn cymeriad, a hyd yn oed rhestr arall ynddo'i hun. Felly, mae hyn yn rhestr sy'n 5 a arth. Felly, mae wedi y gwerth 5 ac mae'n mae gan y arth llinyn cymeriad ac mae'n rhestr y tu mewn i rhestr. Er mwyn i chi gael y rhain pethau recursive lle mae gennych another-- yn teipiwch o fewn y math. Felly yr un modd, gallwch gael matrics y tu mewn matrics arall ac yn y blaen. A rhestr yn unig yn ffordd dda o gasglu a agregu yr holl wrthrychau gwahanol hyn. Ac yn olaf, dyma jyst yn help rhag ofn mae hyn yn unig oedd mynd dros yn gyflym iawn. Felly, ar unrhyw adeg rydych yn ddryslyd am ryw fath o swyddogaeth, gallwch chi ei wneud help y swyddogaeth honno. Felly, gallwch chi ei wneud help matrics neu matrics marc cwestiwn. A chymorth ac mae'r marc cwestiwn yn dim ond llaw-fer am yr un peth felly maen nhw'n enwau eraill. lm yn swyddogaeth sy'n jyst yn gwneud model llinol. Ond os ydych yn unig yn cael unrhyw syniad sut mae hynny'n gwaith, gallwch wneud chymorth lm a byddwch yn rhoi i chi rai math o ddogfennau sy'n edrych yn fath o fel tudalen dyn yn Unix, lle mae gennych ddisgrifiad byr o'r hyn mae'n ei wneud, hefyd beth yw ei ddadleuon yn, yr hyn y mae'n dychwelyd, a dim ond awgrymiadau ar sut i'w ddefnyddio, ac mae rhai enghreifftiau hefyd. Felly, gadewch i mi fynd yn ei flaen ac yn dangos rhyw demo o ddefnyddio R. OK. Felly es i drosodd iawn yn gyflym dim ond y data strwythurau a rhyw fath o op-- rhai o'r gweithrediadau. Dyma rai swyddogaethau. Felly dyma Im 'jyst yn mynd i ddiffinio swyddogaeth. Felly Rwyf hefyd yn defnyddio gweithredwr aseiniad yma, ac yna i ddim yn dweud ddatgan ei fod fel swyddogaeth. Ac mae'n cymryd y gwerth x. Felly, mae hyn yn unrhyw werth rydych am ac yr wyf i'n mynd i ddychwelyd x ei hun. Felly, mae hyn yn swyddogaeth hunaniaeth. A beth cŵl am hyn o gymharu â ieithoedd eraill a lefel isel-un arall ieithoedd yw bod x Gall fod o unrhyw fath ei hun a bydd yn dychwelyd y math hwnnw. Felly, gallwch imagine-- felly gadewch fi jyst yn rhedeg hyn yn gyflym. Mae'n ddrwg gennym. Felly, un peth y dylwn hefyd grybwyll yw y golygydd hwn Im 'yn arfer yn cael ei alw'n rstudio. Mae hyn yn hyn a elwir yn DRhA. Ac un peth sydd yn neis iawn am hyn yw ei fod yn cynnwys llawer o'r pethau yr ydych am ei wneud mewn ymchwil ei ben ei hun dim ond reddfol iawn. Felly dyma yw consol gyfieithydd. Felly yr un modd, gallwch hefyd gael hwn consol crai yn unig drwy wneud R. cyfalaf Ac mae hyn yn union yr un peth ag y consol. Felly, gallaf wneud id ffwythiant x, x, x. Ac then-- ac yna bod Bydd yn iawn ei hun. Felly rstudio yn wych oherwydd ei fod wedi y consol. Mae ganddo hefyd y dogfennau hoffech i redeg ar. Ac yna mae ganddo rai newidynnau y gallwch weld mewn amgylcheddau. Ac yna, os oes gennych i wneud lleiniau, yna rydych Gall dim ond ei weld yma, yn hytrach na rheoli pob ffenestr gwahanol hyn ganddynt hwy eu hunain. Fi 'n weithredol yn defnyddio Vim yn bersonol, ond yr wyf yn teimlo fel rstudio yn ardderchog yn unig ar gyfer cael syniad da o sut i ddefnyddio R. Fel arfer, pan fyddwch yn ceisio ddysgu rhai tasg newydd, nad ydych am i drin gormod o bethau ar yr un pryd. Felly R yn unig yw rstudio very-- yn ffordd dda iawn o R dysgu heb orfod delio â yr holl bethau eraill hyn. Felly dyma dw i'n id rhedeg helo. Mae hyn yn dychwelyd helo. id 123. Dyma fector o gyfanrifau. Felly yr un modd, oherwydd eich bod yn gallu cymryd unrhyw rhyw fath o werth, gallwch chi ei wneud dychwelyd id o x felly mae'n dychwelyd 1234 a 5. A gadewch i mi jyst dangos eich bod mae hyn yn wir yn gyfanrif. Ac yn yr un modd, os ydych yn gwneud y dosbarth id x, mae'n mynd i fod yn gyfanrif. Ac yna, gallwch hefyd cymharu'r ddau ac mae'n GWIR. Felly dw i'n gwirio os id ox yn cyfateb hafal x ac rhybudd ei fod yn rhoi dau TRUEs chi. Felly, nid yw hyn yn ei ddweud yw y ddau gwrthrychau union yr un fath, ond maent bob un o'r cofnodion o fewn y fectorau union yr un fath. Dyma bounded.compare. Felly, mae hyn yn ychydig yn fwy cymhleth gan ei fod ganddo os yw cyflwr ac arall ac yna mae'n cymryd dau dadleuon ar y tro. Felly x o unrhyw fath. Ac yr wyf ddim yn dweud hyn ail ddadl yw a. Gall hyn fod yn unrhyw beth hefyd. Ond yn ddiofyn, mae'n mynd i gymryd 5 os nad ydych yn nodi unrhyw beth. Felly dyma dw i'n mynd i ddweud os x yn fwy na. Felly os nad wyf yn pennu, mae'n yn dweud os x yn fwy na 5, Yna, dw i'n mynd i ddychwelyd WIR. arall, dw i'n mynd i ddychwelyd ANWIR. Felly, gadewch i mi fynd yn ei flaen ac yn diffinio'r hyn. Ac yn awr yr wyf i'n mynd i rhedeg bounded.compare 3. Felly, mae'n dweud yw 3 yn llai than-- yn 3 fwy na 5. Na, nid yw mor ANWIR. Ac yn bounded.compare 3 a dw i'n mynd i gymharu ei ddefnyddio yn dychwelyd 2.. Felly nawr i ddim yn dweud ie, yn awr yr wyf eisiau i fod yn rhywbeth arall. Felly, yr wyf i'n mynd i ddweud, dylech fod yn 2. Gallaf naill ai wneud y math hwn o nodiant neu yr wyf yn dweud yn hafal 2.. Mae hwn yn fwy darllenadwy yn hynny pan fyddwch chi edrych ar y rhain mewn gwirionedd swyddogaethau cymhleth sy'n cymryd arguments-- lluosog ac mae hyn yn gall fod dwsinau oftentimes-- dim ond dweud mae Equals 2 yn yn fwy darllenadwy i chi fel y yn nes ymlaen yn y dyfodol byddwch yn gwybod beth rydych chi'n ei wneud. Felly, yn yr achos hwn, rwy'n ddywediad yw 3 yn fwy na 2. Ydy, mae'n. Ac yn yr un modd, gall Fi jyst dynnu hyn ac yn dweud, yn 3 fwy na 2 lle mae yn dychwelyd 2.. Ac mae hynny'n GWIR hefyd. Ie? GYNULLEIDFA: A ydych yn gweithredu fesul llinell? DUSTIN TRAN: Ydw ydw i. Felly yr hyn yr wyf i'n ei wneud yma yw gan gymryd testun hwn document-- a'r hyn sy'n wych am rstudio yw bod Gall Fi jyst yn rhedeg short-- a shortcut allweddol. Felly, yr wyf i'n gwneud Rheolaeth-Enter. Ac yna, rwy'n cymryd y llinell yn y ddogfen testun ac yna roi yn y consol. Felly dyma i ddim yn dweud, bounded.compare ac fy mod yn gwneud Control-X. Felly, gallaf yn unig yn rhedeg yma hefyd. Ac yna bydd bod yn cymryd y lein ac yna ei roi yma. Ac yna yr un modd, gallaf yn rhedeg yma. Ac yna bydd yn jyst cadw diffinio y llinellau i mewn i'r consol fel 'na. Ac os byddwch hefyd yn sylwi ar y cyrliog braces yno yn union fel yn C cystrawen. x-- os yw'r os yw cyflwr hefyd mynd i ddefnyddio cromfachau ac yna gallwch ddefnyddio arall. Un arall yw arall os. Felly, mae hyn yn mynd i fod x hafal hafal i, er enghraifft. Ac yna dwi'n mynd i dychwelyd rhywbeth yma. Sylwch fod yna ddau wahanol pethau yma sy'n mynd ymlaen. Un yw bod yma fy mod yn pennu'r dychwelyd y gwerth GWIR. Dyma Im 'jyst yn dweud x. Felly, fel arfer, bydd R ddiofyn cymryd y arguments-- diwethaf neu fynd ar y linell olaf y cod, a fydd yn gwneud beth mae'n ei dychwelyd. Felly dyma mae hyn yr un fath beth â gwneud elw x. A dim ond i ddangos i chi. Ac yna, bydd yn gweithio yn union fel hynny. Felly, gadewch i mi barhau gyda hyn. Felly arall os. Ac yn wir, gallaf ddychwelyd unrhyw beth hoffwn. Felly, nid wyf yn hyd yn oed yn rhaid i ddychwelyd Booleans drwy'r amser, Gall Fi jyst yn dychwelyd rhywbeth arall. Felly gallaf ei wneud arth dychwelyd. Felly os x hafal hafal i, mae'n mynd i ddychwelyd arth. Fel arall, mae'n mynd i ddychwelyd WIR. Gallaf hefyd wneud fector neu yn wir unrhyw beth. Ac fel arfer yn llonydd Ieithoedd teipio, byddai'n rhaid i chi nodi math yma. Ac yn sylwi y gall fod dim ond fod yn unrhyw beth. Ac R yn ddigon deallus ei fod yn Bydd jyst yn gwneud hyn a bydd yn gweithio iawn. Felly, gadewch i mi ddiffinio hyn. Unexpected-- oh ddrwg gennym. Dylai fod yn brês cyrliog yma. OK. Cool. Mae pob hawl. Felly nawr gadewch i ni gymharu 3 a 3 yn hafal. Felly, dylai return-- yeah-- gwerth arth. Felly nawr yn beth mwy cyffredinol yn debyg beth am strwythurau data arall. Felly mae gennych swyddogaeth hon. Mae hyn yn mynd i weithio ar unrhyw fath o werth fel 3 neu unrhyw rhifol, mewn geiriau eraill, dwbl. Ond beth am rhywbeth fel fector. Felly beth sy'n digwydd os ydych yn do-- felly rwy'n mynd i aseinio Val i, dyweder, 4 i 6. Felly os wyf yn dychwelyd hyn, mae hyn yn yn fector o 4, 5, 6. Nawr, gadewch i ni weld beth sy'n digwydd os wyf yn gwneud bounded.compare Val. Felly, mae hyn yn mynd i roi i chi 15 1251. Felly, mewn geiriau eraill, mae'n dweud os edrychwch ar yr amod hwn felly mae'n dweud x yn llai na neu rywbeth. Felly, mae hyn ychydig yn ddryslyd oherwydd erbyn hyn ydych ddim yn gwybod beth sy'n mynd ymlaen. Felly, yr wyf yn dyfalu un peth sy'n wir dda am dim ond ceisio debug yw y gallwch ei wneud Val yn fwy na a gweld beth sy'n digwydd yno. Felly val-- a yw yn ddiofyn 5 felly gadewch i ni yn unig yn Val fwy na 5. Felly mae hwn yn fector GAU GWIR GAU. Felly nawr pan fyddwch yn edrych ar hyn, mae'n mynd i ddweud os, ac yna mae'n mynd i rhoi i chi hyn yn fector o ANGHYWIR ANGHYWIR GWIR. Felly, pan fyddwch yn trosglwyddo hyn i mewn i R, R Nid oes syniad beth ydych yn ei wneud. Oherwydd ei fod yn disgwyl i un sengl gwerth, sy'n Boole, ac yn awr eich bod yn rhoi ei fod yn fector o Booleans. Felly yn ddiofyn, R yn unig mynd i ddweud yr hyn y mae'r Heck, Rydw i'n mynd i gymryd yn ganiataol eich bod yn mynd i gymryd yr elfen gyntaf yma. Felly dw i'n mynd i say-- Rydw i'n mynd i gymryd yn ganiataol bod hyn yn ANWIR. Felly, mae'n mynd i ddweud na, nid yw hyn yn iawn. Yn yr un modd, mae'n mynd i fod Val hafal hafal a. Na, mae'n ddrwg gennyf 5. Ac mae hefyd yn mynd i fod yn ffug hefyd. Felly, mae'n mynd i ddweud na, nid yw'n GWIR yn ogystal felly mae'n mynd i ddychwelyd yr un olaf hwn. Felly mae hyn yn naill ai yn beth da neu ddrwg beth, yn dibynnu ar sut yr ydych yn edrych arno. Oherwydd pan fyddwch chi creu swyddogaethau hyn, nad ydych yn mewn gwirionedd yn gwybod beth sy'n mynd ymlaen. Felly weithiau byddech chi eisiau camgymeriad, neu efallai eich bod dim ond eisiau rhybudd. Yn yr achos hwn, nid yw R yn gwneud hynny. Felly mae'n wirioneddol hyd at chi yn seiliedig i ffwrdd o'r hyn yn eich barn chi yr iaith Dylai wneud yn yr achos hwn os byddwch yn mynd heibio mewn fector o Booleans pan fyddwch chi'n ei wneud yn os yw cyflwr. Felly, gadewch i ni ddweud eich bod yn cael y gwreiddiol un gyda pe arall yn dychwelyd GWIR ac rydych yn mynd i ddychwelyd ANWIR. Felly, un ffordd o tynnu mae hyn yn dweud fy mod Nid oes hyd yn oed angen y peth amodol. Peth arall y gallaf ei wneud yn unig dychwelyd gwerthoedd eu hunain. Felly, os ydych yn sylwi, os ydych wneud Val yn fwy na 5, mae hyn yn mynd i ddychwelyd fector GAU GWIR GAU. Efallai mae hyn yn yr hyn yr ydych eisiau ar gyfer bounded.compare. Rydych am i ddychwelyd fector o Booleans lle y mae'n cymharu pob un o'r gwerthoedd iddynt hwy eu hunain. Er mwyn i chi yn unig yn bounded.compare swyddogaeth x, mae hafal 5. Ac yna yn hytrach na gwneud hwn os arall cyflwr, Im 'jyst yn mynd i ddychwelyd x yn fwy na 5. Felly, os yw'n wir, yna mae'n mynd i ddychwelyd WIR. Ac yna os nad yw'n, mae'n mynd i ddychwelyd ANWIR. A bydd hyn yn gweithio i unrhyw un o'r strwythurau hyn. Felly gallaf bounded.compare c 1 6 neu 9 ac yna dw i'n mynd i ddweud hafal 6, er enghraifft. Ac yna mae'n mynd i rhoi'r Boole cywir i chi fector eich bod yn dylunio. Felly, y rhai yn unig yw'r swyddogaethau ac yn awr gadewch i mi yn unig dangos i chi rhai gweledol rhyngweithiol. Nid wyf yn credu fy mod mewn gwirionedd yn cael Wi-Fi fan hyn felly gadewch i mi jyst mynd yn ei flaen a sgipio hwn yr wyf yn dyfalu. Ond un peth sy'n cŵl fodd bynnag yw os ydych yn unig am brofi bagad o gwahanol gorchmynion data, mae criw o wahanol setiau data sydd eisoes yn cael eu rhaglwythedig mewn i R. Felly, un ohonynt yn Gelwir y set ddata iris. Mae hwn yn un o'r rhai mwyaf adnabyddus rhai mewn dysgu peiriant. Byddwch fel arfer dim ond gwneud rhyw fath o achosion prawf i weld a yw eich cod yn rhedeg. Felly gadewch i ni jyst gwirio pa iris yn. Felly beth mae hyn yn mynd i fod yn ffrâm data. Ac mae'n fath o hir oherwydd Fi jyst hargraffu iris. Mae wedi argraffu y peth cyfan. Felly mae wedi holl enwau gwahanol hyn. Felly iris yn gasgliad o wahanol flodau. Yn yr achos hwn, Mae'n dweud chi yw'r rhywogaeth ohono, i gyd yn wahanol led hyn ac darnau o'r sepal a'r petal. Ac felly fel arfer, os yr ydych eisiau argraffu iris, er enghraifft, nad ydych am ei gael yn gwneud hyn i gyd oherwydd gall hynny gymryd drosodd eich consol cyfan. Felly, un peth sy'n wir braf yw swyddogaeth pen. Felly, os ydych yn unig yn gwneud pen iris, bydd hyn yn rhoi i chi y pum rhes gyntaf, neu chwech yr wyf yn dyfalu. Ac yna yn dda, i chi Gall dim ond nodi yma. Felly 20-- bydd hyn yn rhoi chi yr 20 rhes gyntaf. Ac yr wyf mewn gwirionedd yn garedig o'r synnu bod hwn rhoddodd i mi chwech, felly gadewch i mi fynd yn ei flaen a gwirio iris-- neu bennaeth, mae'n ddrwg gennyf. Ac yma y bydd yn rhoi chi y ddogfennaeth o'r hyn y mae'r pen gwerth ei wneud. Felly, mae'n dychwelyd y cyntaf neu ddiwethaf gwrthrych. Ac yna dwi'n mynd i edrych ar y rhagosodiadau. Ac yna mae'n dweud 'r ball Dull pen x ac n hafal 6L. Felly, mae hyn yn dychwelyd y chwe elfen cyntaf. Ac yn yr un modd os ydych yn sylwi yma, yr wyf yn Nid oedd gan nodi n hafal 6. Yn ddiofyn mae'n defnyddio chwech, yr wyf yn dyfalu. Ac yna, os wyf am i bennu benodol gwerth, yna gallaf weld hynny hefyd. Felly mae hynny'n rhywfaint o orchmynion syml a dyma un arall sy'n just-- yn dda, Rwy'n can-- mae hyn mewn gwirionedd ychydig yn fwy cymhleth, ond bydd hyn yn unig yn cymryd y dosbarth pob colofn y set ddata iris. Felly, bydd hyn yn dangos i chi beth mae pob un o'r rhain colofnau yn o ran eu math. Felly hyd sepal yn rhifol, lled sepal yn rhifol. Mae'r holl gwerthoedd hyn yn unig rhifol oherwydd gallwch ddweud o'r data hwn strwythuro rhain yn i gyd yn mynd i rhifol. A'r golofn Rhywogaethau yn mynd i fod yn ffactor. Felly fel arfer, byddech yn meddwl bod mae hyn yn debyg i llinyn cymeriad. Ond os ydych yn unig yn gwneud irisSpecies, ac yna dwi'n mynd i wneud pen 5, ac mae hyn yn mynd i argraffu allan y pum gwerth cyntaf. Ac yna yn sylwi ar hyn lefel. Felly, mae hyn yn saying-- hyn yn ffordd R o gael newidynnau pendant. Felly, yn hytrach na dim ond cael llinynnau cymeriad, mae ganddo lefelau pennu pa rai o'r pethau hyn yn cael eu. Felly, gadewch i ni ddweud irisSpecies 1. Felly beth rydych am ei wneud yma yw fy mod subsetting at y golofn Rhywogaethau. Felly, mae hyn yn cymryd y Colofn Rhywogaethau ac yna mae'n mynegeion i gael yr elfen gyntaf. Felly, dylai hyn roi setosa i chi. Ac mae hefyd yn rhoi lefelau chi yma. Felly, gallwch hefyd gymharu hwn i'r setosa gymeriad ac nid yw hyn yn mynd i fod yn WIR oherwydd bod un o fath gwahanol na'r llall. Neu yr wyf yn dyfalu ei fod yn wir oherwydd bod R yn fwy deallus na hynny. Ac mae'n edrych ar hyn ac yna'n Dywed, efallai mae hyn yn beth rydych ei eisiau. Felly, mae'n mynd i ddweud cymeriad setosa llinyn yr un fath gan fod hyn yn un. Ac yna yr un modd, gallwch Hefyd, dim ond chrafangia rhain fel yn y blaen. Felly dyna yn unig yw rhyw fath o gorchmynion cyflym o'r set ddata. Felly dyma ychydig o archwilio data. Felly, mae hyn yn ychydig yn fwy ymwneud â'r dadansoddi data. Ac mae hyn yn cael ei gymryd oddi wrth rai bootcamp mewn ymchwil ar eu cyfer yn Berkeley. Felly llyfrgell tramor. Felly dw i'n mynd i lwytho mewn llyfrgell sy'n cael ei alw dramor. Felly, mae hyn yn mynd i roi i mi read.dta felly yn cymryd yn ganiataol bod gennyf set ddata hon. Mae hyn yn cael ei storio yn y presennol cyfeiriadur o fy consol yn gweithio. Felly, gadewch i ni weld beth yn union y cyfeiriadur gwaith y mae. Felly dyma fy cyfeiriadur gwaith. A darllen dot data, mae hyn yn beth, yn ei ddweud y ffeil wedi ei leoli yn y ffolder data y cyfeiriadur gwaith cyfredol. Ac read.dta nad yw hyn yn gorchymyn rhagosodedig. Amcana fy mod llwytho i mewn yn barod. Cymryd yn ganiataol IEI Rwy'n llwytho hyn yn barod. Ond felly nid read.dta yn mynd i fod yn gorchymyn rhagosodedig. A dyna pam yr ydych yn mynd i gael i lwytho yn y llyfrgell hon package-- pecyn hwn a elwir tramor. Ac os nad oes gennych y pecyn, yr wyf yn meddwl tramor yn un o'r rhai adeiledig yn. Fel arall, gallwch hefyd gwneud install.packages a bydd hyn yn gosod y pecyn. A bydd hyn yn rhoi R. Uh i chi, dim. Ac yna Im 'jyst yn mynd i roi'r gorau mae hyn oherwydd fy mod eisoes wedi hynny. Ond yr hyn sy'n wir yn neis am R yw bod y rheolaeth pecyn system yn cain iawn. Gan y bydd yn storio popeth 'n sylweddol' n glws i chi. Felly, yn yr achos hwn, mae'n mynd i storio i mewn, yr wyf yn credu, y llyfrgell hon fan hyn. Felly, ar unrhyw adeg rydych am ei gosod pecynnau newydd, 'i' yr un mor syml â gwneud install.packages a bydd R rheoli'r holl y pecynnau i chi. Felly nid oes rhaid i chi wneud rhywbeth yn Python, lle mae gennych becyn allanol rheolwyr fel papur Anaconda lle rydych chi'n doing-- fyddwch yn gosod y pecynnau y tu allan i Python ac yna rydych yn ceisio rhedeg nhw eich hun. Felly, mae hyn yn wir yn ffordd braf. A install.packages ei gwneud yn ofynnol y rhyngrwyd. Mae'n cymryd ei fod o weinydd a'r storfa sy'n casglu'r holl Gelwir pecynnau yn Cran. A gallwch nodi pa fath o drych ydych am i lawrlwytho'r pecynnau o. Felly dyma yr wyf yn cymryd set ddata hon. Rydw i'n ei ddarllen wrth ddefnyddio'r swyddogaeth hon. Felly, gadewch i mi fynd yn ei flaen ac yn gwneud hynny. Felly, gadewch i ni gymryd yn ganiataol y mae gennych set ddata hon ac yr ydych wedi gwbl ddim syniad beth ydyw. Ac mae hyn mewn gwirionedd yn dod i fyny yn weddol aml yn y diwydiant lle mae 'ch jyst yn cael y rhain tunnell a tunnell o bethau anniben ac maen nhw'n hynod unlabeled. Felly dyma gen hon set ddata ac nid wyf yn gwybod yr hyn y mae mor Im 'jyst gan ddangos i edrych arni. Felly, yr wyf i'n mynd i wneud pen yn gyntaf. Felly, yr wyf yn edrych ar y chwe cyntaf colofnau o'r hyn y set ddata hon yw. Felly mae hwn yn wladwriaeth, pres04, ac yna i gyd yn wahanol math yma o golofnau. A beth sy'n ddiddorol yma, yr wyf yn dyfalu, yw eich bod yn Byddai cymryd yn ganiataol bod hwn yn edrych fel rhyw fath o etholiad. Ac yr wyf yn dyfalu yn unig o gan edrych ar y ffeil enwi mae hyn yn rhyw fath o gasgliad data am ymgeiswyr neu bleidleiswyr a bleidleisiodd i lywyddion penodol neu ymgeiswyr llywydd ar gyfer yr etholiad 2004. Felly dyma gwerthoedd 1, 2 felly un ffordd o storio y llywydd ymgeiswyr yw eu henwau. Yn yr achos hwn, mae'n edrych fel eu bod yn werthoedd yn unig gyfanrif. Felly 2004, roedd Bush yn erbyn Kerry Yr wyf yn credu. Ac yn awr, gadewch i ni ddweud eich bod nid yn unig yn gwybod p'un 1 cyfateb i Bush neu 2 yn cyfateb i Kerry neu a yn y blaen ac yn y blaen, dde? Ac mae hyn yn, dim ond i mi, yn broblem weddol gyffredin. Felly, beth allwch ei wneud yn yr achos hwn? Felly, gadewch i ni edrych ar yr holl bethau eraill hyn. wladwriaeth, dw i'n tybio hon dod o wahanol wladwriaethau. partyid, incwm. Gadewch i ni edrych ar partyid. Felly, efallai un peth y gallwch ei wneud yw yn edrych ar bob un o'r sylwadau sydd â partyid o Weriniaethol neu Democratiaid neu rywbeth. Felly gadewch i ni dim ond yn edrych ar yr hyn partyid yw. Felly dw i'n mynd i gymryd dat ac yna i ddim yn mynd i wneud hyn arwydd doler gweithredwr a wneuthum o'r blaen ac mae hyn yn mynd i is-set i'r golofn. Ac yna dwi'n mynd i fod yn bennaeth hyn yn 20, dim ond i weld beth mae hyn yn edrych fel. Felly mae hyn yn unig yw criw o NAS. Felly, mewn geiriau eraill, mae gennych coll data am guys hyn. Ond byddwch hefyd yn sylwi ar hyn dat partyid yn ffactor felly mae hyn yn rhoi gwahanol gategorïau chi. Felly, mewn geiriau eraill, gall gymryd partyid Democratiaid, Gweriniaethwyr, Independent, neu rywbeth arall. Felly, gadewch i ni fynd yn ei flaen a gadewch i ni weld pa rai o'r rhain yw-- oh, OK. Felly dw i'n mynd i is-set i partyid ac yna yn edrych ar pa rai sy'n Democratiaid, er enghraifft. Mae hyn yn mynd i roi i chi yn Boole, mae Boole enfawr o TRUEs a FALSEs. Ac yn awr, gadewch i ni ddweud Rwyf am i is-set i'r guys hyn. Felly, mae hyn yn mynd i gymryd fy dat a is-set i ba bynnag sylwadau rhaid hafal partyid hafal Democratiaid. Ac mae hyn yn eithaf hir oherwydd bod mae cynifer ohonynt. Felly nawr, dw i'n mynd i fod yn bennaeth hyn mewn 20. Ac fel y byddwch yn sylwi, yn hafal gyfartal yn ddiddorol gan fod eich bod yn already-- byddwch hefyd yn cynnwys y NAS. Felly, yn yr achos hwn, rydych yn dal i fethu gael unrhyw wybodaeth oherwydd erbyn hyn mae gennych NAS ac ch jyst eisiau gweld pa un o'r arsylwi yn cyfateb i Democratiaid ac nid yw'r rhain coll gwerthoedd eu hunain. Felly, sut y byddech yn cael gwared ar NAS hyn? Felly dyma Im 'jyst yn ddefnyddio'r allwedd i fyny ar fy cyrchwr a wedyn yn dweud symud o gwmpas. Ac yna dyma Im 'jyst yn mynd i ddweud is.na datpartyid. Felly a'r hwn a bydd yn cymryd dau fector Boole wahanol ac yn dweud ei fod yn mynd i fod yn Gwir a gau, er enghraifft. Felly, mae'n mynd i wneud gydran-ddoeth hwn. Felly dyma i ddim yn dweud cymryd y ffrâm data, is-set at y rhai sy'n cyfateb i Democratiaid, a symud unrhyw un ohonynt nad ydynt NA. Felly, dylai will-- hwn rhoi rhywbeth i chi. Gadewch i ni weld is.na. Gadewch i ni geisio datpartyid is.na. A dylai hyn roi you-- sorry-- dim ond fector Boole. Ac yna, am ei fod mor hir, Rydw i'n mynd i is-set at 20. OK. Felly, dylai hyn weithio. A bydd hyn yn un hefyd yn TRUEs. Ah, felly mae fy gwall yma yw bod I'm-- fy mod defnyddiwch C ++ a R gyfnewidiol felly rwy'n gwneud camgymeriad hwn drwy'r amser. Mae'r a'r gweithredwr yn mewn gwirionedd yr un rydych am. Nid ydych am i ddefnyddio dau ampersands, dim ond un sengl. OK. Felly, gadewch i ni weld. Felly, rydym yn subsetted at y partyid ble maen nhw'n Democratiaid ac nid ydynt yn colli gwerthoedd. Ac yn awr gadewch i ni edrych ar pa rai y maent yn pleidleisio o blaid. Felly, mae'n ymddangos fel y rhan fwyaf ohonynt yn pleidleisio o blaid 1. Felly dw i'n mynd i fynd yn ei flaen ac yn dweud bod yn Kerry. Ac yn yr un modd, gallwch hefyd yn mynd i Weriniaethol a gobeithio, dylai hyn roi i chi 2.. Dim ond bagad o wahanol colofnau. Ac yn wir, mae'n 2.. Felly partyid pob Gweriniaethwyr, mae'r rhan fwyaf ohonynt yn pleidleisio am 2. Felly, mae'n ymddangos fel, dim ond drwy edrych ar hyn, Weriniaethol yn mynd i fod a very-- neu'r partyid yn mynd i fod yn iawn ffactor mawr wrth benderfynu pa ymgeisydd eu bod yn mynd i bleidleisio. Ac mae hyn yn amlwg yn wir yn gyffredinol. Ac mae hyn yn cyd-fynd â'ch greddf, wrth gwrs. Felly, mae'n ymddangos fel fy mod rhedeg allan o amser, felly gadewch i jyst ddylai mi fynd yn ei flaen ac yn dangos rhai lluniau cyflym. Felly dyma rhywbeth sy'n ychydig yn mwy cymhleth gyda delweddu. Felly, yn yr achos hwn, mae hyn yn iawn dadansoddiad syml o ddim ond gwirio hyn y y llywydd '04 yw. Felly, yn yr achos hwn, gadewch i ni ddweud eich yn awyddus i ateb y cwestiwn hwn. Felly mae'n debyg ein bod eisiau gwybod y pleidleisio ymddygiad yn yr etholiad 2004 yn llywydd a sut mae hynny'n amrywio yn ôl hil. Felly, nid yn unig ydych chi eisiau gweld y patrwm pleidleisio, ond eich bod yn awyddus i is-set o bob un hil a math o crynhoi hynny. A allwch chi ddweud yn unig trwy nodiant cymhleth hwn fod hyn yn fath o gael niwlog. Felly, un o'r R uwch pecynnau dyna hefyd fath o diweddar yn cael ei alw'n dplyr. Felly mae'n yr un yma yn iawn yma. A ggplot2 ggg-- yn unig yw n glws ffordd o wneud yn well visualizations na'r un adeiledig yn. Felly dw i'n mynd i lwytho y ddau lyfrgelloedd. Ac yna, dw i'n mynd i fynd ymlaen a hidla hon archa. Alli jyst trin hyn fel blwch du. Beth sy'n digwydd yw bod bibell hon gweithredwr yn pasio yn y ddadl hon i mewn yma. Felly rwy'n grŵp yn dweud gan dat hil ac yna llywydd 04. Ac yna, yr holl gorchmynion eraill hyn yn hidlo ac yna yn crynhoi lle rwy'n gwneud cyfrif a Yna, Im 'yn plotio yma. OK oer. Felly, gadewch i ni fynd yn ei flaen ac gweld beth mae hyn yn edrych fel. Felly beth sy'n digwydd yma yw fy mod dim ond plotio bob un o'r rasys ac yna pa rai y maent yn pleidleisio o blaid. A dau rhain yn wahanol gwerthoedd cyfateb i 2 a 1. Os ydych am fod yn fwy cain, gallwch hefyd dim ond nodi y 2 Kerry-- neu 2 yw'r Bush, ac yna mae 1 yn Kerry. A gallwch hefyd gael bod yn eich chwedl. A gallwch hefyd rannu graffiau bar hyn. Oherwydd bod un peth yn hynny, os byddwch yn sylwi, nid yw hyn yn hawdd iawn i'w adnabod pa un o'r rhain ddau werth yn fwy. Felly, un peth y byddech eisiau wneud yw cymryd yr ardal las a dim ond symud dros yma er mwyn i chi gallu cymharu y ddau ochr yn ochr. Ac yr wyf yn dyfalu dyna rhywbeth yr wyf Nid oes rhaid i amser i wneud ar hyn o bryd, ond mae hynny'n hawdd iawn i'w wneud hefyd. Alli jyst edrych i mewn y tudalennau dyn o ggplot. Er mwyn i chi yn unig yn ggplot fel hynny ac yn darllen i mewn i'r dudalen dyn. Felly, gadewch i mi jyst yn gyflym dangos i chi rai pethau cŵl. Gadewch i ni fynd yn ei flaen ac yn mynd i'r canlynol-- unig cais o ddysgu peiriant. Felly, gadewch i ni ddweud ein bod wedi tri y rhain pecynnau felly dwi'n mynd i lwytho y rhain yn. Felly, mae hyn dim ond yn argraffu yn nodi rhai wybodaeth ar ôl i mi llwytho yn y peth. Felly, yr wyf yn dweud read.csv hwn, set ddata hon, ac yn awr Rydw i'n mynd i fynd yn ei flaen ac yn edrych a weld beth sydd y tu mewn set ddata hon. Felly, y 20 o arsylwadau cyntaf. Felly, Fi jyst cael X1, X2, a Y. Felly mae'n ymddangos fel criw o gwerthoedd hyn yn amrywio o efallai 20-80 neu hynny. Ac yna yn yr un modd ar gyfer X2 ac yna Y mae hyn yn ymddangos i fod labeli 0 ac 1. I wirio hyn, gallaf dim ond gwneud X1 data cryno. Ac yna yn yr un modd ar gyfer yr holl golofnau eraill hyn. Felly crynodeb yn ffordd gyflym o dim ond dangos i chi gwerthoedd cyflym. O, sori. Dylai hyn un fod Y. Felly, yn yr achos hwn, yn rhoi'r quantiles, canolrifau, maxes hefyd. Yn yr achos hwn, dataY, gallwch weld ei fod yn jyst yn mynd i fod yn 0 ac 1. Hefyd, y cymedr yn ei ddweud 0.6, dim ond yn golygu ei fod ymddangos fel gen i fwy nag 1s 0s. Felly, gadewch i mi fynd yn ei flaen ac yn dangos chi beth mae hyn yn edrych fel. Felly, Im 'jyst yn mynd i blotio hyn. Gadewch i ni weld sut i glirio'r hyn. Oh OK. OK. Felly dyma sut mae'n edrych. Felly, mae'n ymddangos fel melyn yr wyf penodedig fel 0, ac yna goch i mi nodir fel 1s. Felly dyma mae'n edrych fel pwyntiau label ac mae'n ymddangos fel 'ch jyst eisiau rhywfaint o math o glystyru ar hyn. A gadewch i mi jyst mynd yn ei flaen ac yn dangos chi rai o swyddogaethau adeiledig yn hyn. Felly dyma yw lm. Felly, mae hyn yn unig yw ceisio i gyd-fynd linell i hyn. Felly beth yw'r ffordd orau y gallaf ffitio llinell o'r fath y bydd yn orau yn gwahanu y math hwn o glystyru. Ac yn ddelfrydol, gallwch weld yr wyf newydd yn rhedeg yr holl gorchmynion hyn ac yna, dw i'n mynd ymlaen ac ychwanegwch y llinell. Felly, mae hyn yn ymddangos fel y dyfalu gorau. Mae wedi cymryd yr un gorau sy'n lleihau'r y gwall wrth geisio ffitio y llinell hon. Yn amlwg, mae hyn yn edrych yn fath o da, ond nid yw'n gorau. A modelau llinol, yn gyffredinol, yn mynd i fod wirioneddol wych ar gyfer theori ac yn unig fath o adeiladu hanfodion peiriant dysgu. Ond yn ymarferol, rydych chi'n mynd i eisiau gwneud rhywbeth mwy cyffredinol. Felly, gallwch roi cynnig ar redeg rhywbeth o'r enw rhwydwaith nerfol. Mae'r pethau hyn yn yn gynyddol yn fwy cyffredin. Ac maent ond yn gweithio'n wych ar gyfer setiau data mawr. Felly, yn yr achos hwn, rydym yn unig have-- gadewch i ni see-- gennym nrow. Felly nrow yn unig yw dweud nifer o resi. Felly, yn yr achos hwn, yr wyf yn rhaid i 100 o arsylwadau. Felly, gadewch i mi fynd yn ei flaen ac gwneud rhwydwaith nerfol. Felly, mae hyn yn neis iawn oherwydd gallaf ddweud nnet ac yna i ddim yn llithro'n Y. Felly mae'r Y yn y golofn honno. Ac yna llithro'n ar y ddau newidyn arall. Felly, mae hyn yn fyrrach nodiant ar gyfer X1 a X2. Felly, gadewch i ni fynd yn ei flaen ac yn rhedeg hyn. O, sori. Mae angen i mi redeg hyn holl beth. Ac mae hyn yn unig yw argraffu nodiant am pa mor gyflym neu beidio gyflym y mae'n cydgyfeirio. Felly, mae'n edrych fel oedd yn cydgyfeirio. Felly, gadewch i mi fynd yn ei flaen ac argraffu yr hyn y mae hyn yn edrych fel. Gweler dyma y llun a dyma yn cyfuchlin yn dangos pa mor dda y mae'n ffitio. Ac mae hyn yn just-- gallwch weld hyn bod hyn yn iawn, yn neis iawn. Gallai hyd yn oed fod yn overfitting, ond gallwch hefyd yn cyfrif am hyn gyda eraill technegau fel traws-ddilysu. Ac mae'r rhain hefyd yn cael eu hadeiladu i mewn R. A gadewch i mi jyst yn dangos i chi cefnogi beiriant fector. Mae hyn yn un arall 'n sylweddol gyffredin techneg mewn dysgu peiriant. Mae'n debyg iawn i fodelau llinol, ond mae'n defnyddio hyn a elwir yn ddull cnewyllyn. A gadewch i ni weld pa mor dda y mae hynny'n ei wneud. Felly, yr un yma yn debyg iawn i'r ffordd yn dda rhwydwaith nerfol yn perfformio, ond mae'n llawer mwy llyfn. Ac mae hyn yn seiliedig i ffwrdd o what-- sut SVMs gwaith. Felly mae hyn yn unig yw iawn trosolwg cyflym o rai o'r swyddogaethau adeiledig yn y gallwch ei wneud a hefyd rhai o'r archwilio data. Felly, gadewch i mi jyst mynd yn ei flaen ac yn mynd yn ôl at y sleidiau. Felly yn amlwg, mae hyn yn Nid yw gynhwysfawr iawn. Ac mae hyn yn wir yn unig yw ymlid dangos i chi beth y gallwch chi wir yn ei wneud yn R. Felly, os byddech yn union fel i ddysgu mwy, yma yn griw o wahanol adnoddau. Felly, os ydych yn hoff o werslyfrau neu eich bod yn dim ond hoff o ddarllen pethau ar-lein, yna mae hyn yn wych un gan Hadley Wickham, sydd hefyd yn creu hyn i gyd pecynnau 'n sylweddol oera. Os ydych yn hoff o fideos, yna Berkeley Mae gan bootcamp anhygoel dyna several-- dyna'r fath o hir. A bydd yn eich dysgu bron popeth yr hoffech ei wybod am R. Ac yn yr un modd, mae Codeacademy a phob math arall yma gwefannau rhyngweithiol. Maent hefyd yn cael common-- mwy a mwy cyffredin. Felly, mae hyn yn debyg iawn i Codeacademy. Ac yn olaf, os ydych yn unig eisiau Cymunedol a helpu, mae'r rhain yn griw o bethau y gallwch fynd iddo. Yn amlwg, rydym yn dal i defnyddio rhestrau postio, dim ond fel bron bob eraill cymuned iaith raglennu. Ac mae #rstats, mae hyn yn ein cymuned Twitter. Dyna mewn gwirionedd yn eithaf cyffredin. Ac yna y defnyddiwr! Yn unig yw ein cynhadledd. Ac yna, wrth gwrs, gallwch ddefnyddio'r holl rhain yn holi ac ateb pethau eraill, fel Stack Gorlif, Google, ac yna GitHub. Gan fod y rhan fwyaf o'r pecynnau hyn ac mae llawer o'r gymuned Bydd yn cael ei canolbwyntio ar ddatblygu Cod am ei fod yn ffynhonnell agored. Ac 'i' jyst 'n sylweddol' n glws ar GitHub. Ac yn olaf, gallwch gysylltu â mi os 'ch jyst gennych unrhyw gwestiynau cyflym. Felly, gallwch ddod o hyd i mi ar Twitter yma, fy ngwefan, a dim ond fy e-bost. Felly, gobeithio, a oedd something-- dim ond ymlid byr o'r hyn sydd mewn gwirionedd R gallu gwneud. A gobeithio, 'ch jyst atalfa i maes y tair dolen ganlynol a gweld beth y gallwch ei wneud yn fwy. Ac yr wyf yn dyfalu mai dim ond am y peth. Diolch. [Cymeradwyaeth]