1 00:00:00,000 --> 00:00:00,750 2 00:00:00,750 --> 00:00:09,800 >> [მუსიკალური სათამაშო] 3 00:00:09,800 --> 00:00:13,014 4 00:00:13,014 --> 00:00:13,680 DUSTIN TRAN: Hi. 5 00:00:13,680 --> 00:00:14,980 ჩემი სახელის Dustin. 6 00:00:14,980 --> 00:00:18,419 ასე რომ მე იქნება წარდგენის მონაცემთა ანალიზი რ 7 00:00:18,419 --> 00:00:19,710 უბრალოდ ცოტა თავს. 8 00:00:19,710 --> 00:00:24,320 მე გაკეთებული კურსდამთავრებული საინჟინრო და გამოყენებითი მეცნიერებები. 9 00:00:24,320 --> 00:00:28,330 ვსწავლობ კვეთა მანქანა სწავლისა და სტატისტიკა 10 00:00:28,330 --> 00:00:31,375 ასე მონაცემთა ანალიზი R არის მართლაც ფუნდამენტური რა 11 00:00:31,375 --> 00:00:33,790 გავაკეთო ყოველდღიურად. 12 00:00:33,790 --> 00:00:35,710 >> და R განსაკუთრებით კარგი მონაცემების ანალიზი 13 00:00:35,710 --> 00:00:39,310 იმიტომ, რომ ეს ძალიან კარგი prototyping. 14 00:00:39,310 --> 00:00:43,590 და, როგორც წესი, როდესაც თქვენ აკეთებთ გარკვეული მონაცემთა ანალიზი, ბევრი პრობლემა 15 00:00:43,590 --> 00:00:44,920 ვაპირებთ შემეცნებითი. 16 00:00:44,920 --> 00:00:48,700 და ასე რომ თქვენ უბრალოდ გვინდა ზოგიერთი მართლაც კარგი ენა, რომელიც 17 00:00:48,700 --> 00:00:53,770 მხოლოდ კარგი აკეთებს ჩაშენებული ფუნქციები, როგორც ეწინააღმდეგებოდა 18 00:00:53,770 --> 00:00:57,430 მქონე გამკლავება დაბალი დონე რამ. 19 00:00:57,430 --> 00:01:01,040 ასე დასაწყისში, მე უბრალოდ აპირებს დანერგვა რა არის R, რატომ 20 00:01:01,040 --> 00:01:04,540 თქვენ გინდათ გამოიყენოთ იგი, და მერე მეტი შევიდა რამდენიმე დემო, 21 00:01:04,540 --> 00:01:07,060 და მერე იქიდან. 22 00:01:07,060 --> 00:01:08,150 >> რა არის R? 23 00:01:08,150 --> 00:01:11,180 R უბრალოდ ენა მიერ შემუშავებული სტატისტიკური computing 24 00:01:11,180 --> 00:01:12,450 და ვიზუალიზაცია. 25 00:01:12,450 --> 00:01:16,000 რა ეს იმას ნიშნავს, რომ ეს არის ძალიან კარგი ენის 26 00:01:16,000 --> 00:01:22,400 ნებისმიერი სახის რამ, რომელიც ეხება გაურკვევლობის ან მონაცემების ვიზუალიზაცია. 27 00:01:22,400 --> 00:01:24,850 ასე რომ თქვენ გაქვთ ყველა ამ ალბათობა დისტრიბუციის. 28 00:01:24,850 --> 00:01:27,140 იქ იქნება ჩაშენებული ფუნქციები. 29 00:01:27,140 --> 00:01:31,650 თქვენ ასევე აქვს შესანიშნავი შეთქმულება პაკეტები. 30 00:01:31,650 --> 00:01:34,110 >> პითონი არის კიდევ ერთი კონკურენტი ენის მონაცემები. 31 00:01:34,110 --> 00:01:40,020 და ერთი რამ, რომ მე რომ R არის ბევრად უკეთესი ვიზუალიზაცია. 32 00:01:40,020 --> 00:01:45,200 ასე რომ, რას დავინახავთ დემო კარგად არის უბრალოდ ძალიან ინტუიტიური ენის 33 00:01:45,200 --> 00:01:48,050 რომ მხოლოდ მუშაობს ძალიან კარგად. 34 00:01:48,050 --> 00:01:53,140 ეს არის ასევე უფასო და ღია კოდის, როგორც ნებისმიერი სხვა კარგი ენის ვფიქრობ. 35 00:01:53,140 --> 00:01:55,440 >> და აქ, რამოდენიმე უბრალოდ საკვანძო სიტყვები ესროლეს თქვენ. 36 00:01:55,440 --> 00:02:00,450 ეს დინამიური, რაც იმას ნიშნავს, თუ თქვენ გაქვთ კონკრეტული ტიპის ენიჭება ობიექტი 37 00:02:00,450 --> 00:02:02,025 ვიდრე ეს უბრალოდ შეცვლის შესახებ fly. 38 00:02:02,025 --> 00:02:05,670 ეს ზარმაცი ისე, რომ ჭკვიანი შესახებ როგორ აკეთებს გათვლები. 39 00:02:05,670 --> 00:02:12,250 ფუნქციური მნიშვნელობით იგი ნამდვილად მოქმედებს ეფუძნება off ფუნქცია, ასე რომ არაფერი 40 00:02:12,250 --> 00:02:16,910 ნებისმიერი სახის მანიპულირება თქვენ აკეთებს, ეს იქნება დაფუძნებული off ფუნქციები. 41 00:02:16,910 --> 00:02:20,162 >> ასე ბინარული ოპერატორები, მაგალითად, არის მხოლოდ არსებითად ფუნქციები. 42 00:02:20,162 --> 00:02:21,870 და ყველაფერი, რაც თქვენ გაკეთებას აპირებს 43 00:02:21,870 --> 00:02:24,690 იქნება გაიქცევა ფუნქციები თავად. 44 00:02:24,690 --> 00:02:27,140 და შემდეგ ობიექტზე ორიენტირებული ასევე. 45 00:02:27,140 --> 00:02:30,930 >> ასე რომ, აქ არის xkcd ნაკვეთი. 46 00:02:30,930 --> 00:02:34,350 არა მხოლოდ იმიტომ, რომ ვგრძნობ, როგორიცაა Xkcd არის ფუნდამენტური ნებისმიერი სახის 47 00:02:34,350 --> 00:02:37,770 პრეზენტაცია, არამედ იმიტომ, მე ვგრძნობ, რომ ეს მართლაც 48 00:02:37,770 --> 00:02:42,160 hammers იმ თვალსაზრისით, რომ ბევრი დრო, როდესაც თქვენ აკეთებთ გარკვეული მონაცემები 49 00:02:42,160 --> 00:02:46,570 ანალიზი, პრობლემა არ არის იმდენად, რამდენად სწრაფად გადის, 50 00:02:46,570 --> 00:02:49,850 მაგრამ რამდენი ხანი აპირებს გადაგიყვანთ პროგრამის ამოცანა. 51 00:02:49,850 --> 00:02:54,112 ასე რომ, აქ მხოლოდ ანალიზის თუ სტრატეგია ან ბ უფრო ეფექტური. 52 00:02:54,112 --> 00:02:55,820 ეს იქნება რაღაც, რომ თქვენ 53 00:02:55,820 --> 00:02:58,290 აპირებთ გაუმკლავდეთ ბევრი in სახის დაბალი დონის ენაზე 54 00:02:58,290 --> 00:03:03,440 სადაც თქვენ საქმე seg ხარვეზებით, მეხსიერების გამოყოფის, initializations, 55 00:03:03,440 --> 00:03:05,270 მაშინაც კი, რაც ჩაშენებული ფუნქციები. 56 00:03:05,270 --> 00:03:09,920 და ამ პერსონალის არის ყველა სიფრთხილით ძალიან, ძალიან ელეგანტურად R. 57 00:03:09,920 --> 00:03:12,839 >> ასე რომ მხოლოდ ჩაქუჩი ამ წერტილი, დიდი bottleneck 58 00:03:12,839 --> 00:03:13,880 იქნება შემეცნებითი. 59 00:03:13,880 --> 00:03:17,341 ასე მონაცემთა ანალიზი არის ძალიან რთული პრობლემაა. 60 00:03:17,341 --> 00:03:19,340 თუ თქვენ აკეთებთ მანქანა სწავლის ან თქვენ 61 00:03:19,340 --> 00:03:22,550 აკეთებს მხოლოდ გარკვეული ძირითადი მონაცემების მოძიება, 62 00:03:22,550 --> 00:03:25,290 თქვენ არ გსურთ აქვს მიიღოს დოკუმენტი 63 00:03:25,290 --> 00:03:27,440 და შემდეგ ადგენენ რაღაც ყველა დროის 64 00:03:27,440 --> 00:03:31,010 გვინდა, რა სვეტი ჰგავს, რა მასალაა matrix 65 00:03:31,010 --> 00:03:32,195 ჰგავს. 66 00:03:32,195 --> 00:03:34,320 ასე, რომ თქვენ უბრალოდ გვინდა ზოგიერთი მართლაც ლამაზი ინტერფეისი 67 00:03:34,320 --> 00:03:37,740 თქვენ შეგიძლიათ აწარმოებს მარტივი ფუნქცია რომ ინდექსები, რაც არ უნდა 68 00:03:37,740 --> 00:03:41,870 გსურთ და უბრალოდ გაუშვით იქიდან. 69 00:03:41,870 --> 00:03:44,190 და თქვენ უნდა domain კონკრეტულ ენებზე ამ. 70 00:03:44,190 --> 00:03:51,750 და R ნამდვილად დაგეხმარებათ განსაზღვრავს პრობლემა და გადაწყვიტოს იგი ამ გზით. 71 00:03:51,750 --> 00:03:58,690 >> ასე რომ, აქ არის მიწის ნაჩვენებია პროგრამირების პოპულარობა R, როგორც ის წავიდა დროთა განმავლობაში. 72 00:03:58,690 --> 00:04:04,060 ასე რომ, როგორც ხედავთ, როგორიცაა 2013 ან ასე რომ მხოლოდ ააფეთქეს საოცრად. 73 00:04:04,060 --> 00:04:09,570 და ეს უკვე მხოლოდ იმიტომ, რომ დიდი ტენდენცია ტექნოლოგია ინდუსტრიაში 74 00:04:09,570 --> 00:04:10,590 შესახებ დიდი მონაცემები. 75 00:04:10,590 --> 00:04:13,010 ასევე, არა მხოლოდ ტექნიკა მრეწველობის, მაგრამ ნამდვილად 76 00:04:13,010 --> 00:04:16,490 ნებისმიერ ინდუსტრიაში that-- რადგან ბევრი მრეწველობის 77 00:04:16,490 --> 00:04:20,589 არსებობს ერთგვარი ფუნდამენტური ცდილობს ამ პრობლემების მოგვარებას. 78 00:04:20,589 --> 00:04:24,590 და, როგორც წესი, შეგიძლიათ რამდენიმე კარგი გზა საზომი ამ პრობლემების 79 00:04:24,590 --> 00:04:29,720 ან თუნდაც განსაზღვრავს მათ ან მათი გადაჭრის გამოყენებით მონაცემები. 80 00:04:29,720 --> 00:04:35,430 ამიტომ მე ვფიქრობ, ახლა R -11 ყველაზე პოპულარული ენა TIOBE 81 00:04:35,430 --> 00:04:38,200 და ეს უკვე იზრდება მას შემდეგ. 82 00:04:38,200 --> 00:04:40,740 83 00:04:40,740 --> 00:04:43,080 >> ასე რომ, აქ არის კიდევ რამდენიმე მახასიათებლები R. მას აქვს 84 00:04:43,080 --> 00:04:46,900 უზარმაზარი რაოდენობის პაკეტები და ყველა ამ სხვადასხვა რამ. 85 00:04:46,900 --> 00:04:52,470 ისე ნებისმიერ დროს თქვენ გაქვთ გარკვეული პრობლემა, ყველაზე 86 00:04:52,470 --> 00:04:55,060 დრო R ექნება რომ ფუნქცია თქვენთვის. 87 00:04:55,060 --> 00:04:58,520 ასე რომ, თუ გსურთ ავაშენოთ გარკვეული მანქანა 88 00:04:58,520 --> 00:05:02,770 სწავლის ალგორითმი მოუწოდა შემთხვევითი ტყის ან გადაწყვეტილება ხეები, 89 00:05:02,770 --> 00:05:07,530 ან თუნდაც მიიღოს საშუალო ფუნქცია ან ამ პერსონალის, 90 00:05:07,530 --> 00:05:10,000 R ექნება, რომ. 91 00:05:10,000 --> 00:05:14,190 >> და თუ თქვენ აინტერესებს ოპტიმიზაცია, ერთი რამ, რომ საერთო 92 00:05:14,190 --> 00:05:17,430 ის არის, რომ მას შემდეგ, რაც თქვენ გაკეთდეს prototyping გარკვეული მაღალი დონის ენა, 93 00:05:17,430 --> 00:05:19,810 თქვენ იმისათვის, რომ in-- თქვენ მხოლოდ პორტი, რომ მეტი 94 00:05:19,810 --> 00:05:21,550 ზოგიერთი დაბალი დონის ენა. 95 00:05:21,550 --> 00:05:26,090 რა არის კარგი R არის, რომ ერთხელ თქვენ კეთდება prototyping it, თქვენ შეგიძლიათ აწარმოებს C ++, 96 00:05:26,090 --> 00:05:29,510 ან Fortran, ან ეს ქვედა დონეზე, ვინც პირდაპირ R. 97 00:05:29,510 --> 00:05:32,320 ასე რომ, ერთი ნამდვილად მაგარი თვისება შესახებ R, 98 00:05:32,320 --> 00:05:35,930 თუ თქვენ ნამდვილად აინტერესებს ოპტიმიზაციის წერტილი. 99 00:05:35,930 --> 00:05:39,490 >> და ეს ასევე ძალიან კარგი ვებ თვალსაჩინოება. 100 00:05:39,490 --> 00:05:43,530 ასე D3.js, მაგალითად, ვფიქრობ სხვა სემინარზე 101 00:05:43,530 --> 00:05:45,130 რომ ჩვენ პრეზენტაცია დღეს გაიმართა. 102 00:05:45,130 --> 00:05:48,510 და ეს მართლაც გასაოცარია აკეთებს ინტერაქტიული თვალსაჩინოება. 103 00:05:48,510 --> 00:05:54,460 და D3.js ვარაუდობს, რომ თქვენ უნდა გარკვეული მონაცემები უნდა პროპაგანდისტულ 104 00:05:54,460 --> 00:05:58,080 და R არის დიდი გზა, რომ ვერ გააკეთებს მონაცემების ანალიზი, სანამ ექსპორტის მას 105 00:05:58,080 --> 00:06:04,220 მეტი D3.js ან თუნდაც უბრალოდ აწარმოებს D3.js ბრძანებები R თავად, 106 00:06:04,220 --> 00:06:08,240 ისევე, როგორც ყველა ამ სხვა ბიბლიოთეკების ასევე. 107 00:06:08,240 --> 00:06:13,041 >> ისე, რომ მხოლოდ დანერგვა რა არის R და რატომ შეიძლება გამოიყენოს იგი. 108 00:06:13,041 --> 00:06:14,790 ასე რომ, იმედია, მე დარწმუნებულნი ვართ, რაღაც 109 00:06:14,790 --> 00:06:18,460 უბრალოდ ცდილობს დაინახოს, რასაც ის, როგორც. 110 00:06:18,460 --> 00:06:23,930 ამიტომ, მე ვაპირებ წავიდეთ წინ და გაიაროს გარკვეული საფუძვლები შესახებ R ობიექტები 111 00:06:23,930 --> 00:06:26,150 და რა შეგიძლიათ ნამდვილად. 112 00:06:26,150 --> 00:06:29,690 >> ასე რომ, აქ არის მხოლოდ bunch of მათემატიკის ბრძანებები. 113 00:06:29,690 --> 00:06:35,000 ასე ვთქვათ you're-- გსურთ აშენება ენის თავს და თქვენ უბრალოდ 114 00:06:35,000 --> 00:06:38,080 აქვს bunch სხვადასხვა ინსტრუმენტები. 115 00:06:38,080 --> 00:06:42,520 ნებისმიერი სახის ოპერაცია ფიქრობთ ნეტავ მინდა საკმაოდ ბევრი იქნება R. 116 00:06:42,520 --> 00:06:44,150 >> ასე რომ აქ არის 2 plus 2. 117 00:06:44,150 --> 00:06:46,090 აქ არის 2 ჯერ pi. 118 00:06:46,090 --> 00:06:51,870 R აქვს რამოდენიმე ჩაშენებული მუდმივები ის, რომ თქვენ ხშირად იყენებენ, როგორიცაა pi, e. 119 00:06:51,870 --> 00:06:56,230 >> და მაშინ, აქ არის 7 plus runif, ასე runif 1. 120 00:06:56,230 --> 00:07:02,450 ეს არის ფუნქცია, რომელიც არის საერთოდ ერთი შემთხვევითი ერთიანი 0-დან 1. 121 00:07:02,450 --> 00:07:04,400 და შემდეგ იქ 3 ძალა 4. 122 00:07:04,400 --> 00:07:06,430 იქ მოედანზე ფესვები. 123 00:07:06,430 --> 00:07:07,270 >> იქ შესვლა. 124 00:07:07,270 --> 00:07:14,500 ასე რომ შედით გააკეთებს ბაზა exponential თავისთავად. 125 00:07:14,500 --> 00:07:18,337 და მაშინ, თუ თქვენ მიერ მითითებული ბაზა, მაშინ შეგიძლიათ გააკეთოთ რასაც ბაზაზე გსურთ. 126 00:07:18,337 --> 00:07:19,920 და მაშინ აქ არის რამოდენიმე სხვა ბრძანებები. 127 00:07:19,920 --> 00:07:22,180 ასე რომ თქვენ უნდა 23 mod 2. 128 00:07:22,180 --> 00:07:24,910 მაშინ თქვენ გაქვთ დარჩენილი. 129 00:07:24,910 --> 00:07:27,110 მაშინ თქვენ უნდა სამეცნიერო ნოტაცია თუ ასევე 130 00:07:27,110 --> 00:07:34,060 მინდა ამის გაკეთება მხოლოდ უფრო და უფრო რთული რამ. 131 00:07:34,060 --> 00:07:37,320 >> ასე რომ აქ არის დავალება. 132 00:07:37,320 --> 00:07:40,830 იმდენად ტიპიური დავალებები R კეთდება arrow 133 00:07:40,830 --> 00:07:43,440 ასე რომ, ნაკლები და შემდეგ დეფისი. 134 00:07:43,440 --> 00:07:47,250 ასე რომ, აქ მე უბრალოდ მინიჭების 3 ცვლადი val. 135 00:07:47,250 --> 00:07:50,160 >> და მაშინ მე დაბეჭდვისას val და მერე ბეჭდავს out სამი. 136 00:07:50,160 --> 00:07:53,920 სტანდარტულად in R თარჯიმანი, ის ბეჭდვა რამ out თქვენთვის 137 00:07:53,920 --> 00:07:57,280 ასე რომ თქვენ არ უნდა მიუთითოთ ბეჭდვა val ნებისმიერ დროს გსურთ ბეჭდვა რაღაც. 138 00:07:57,280 --> 00:08:00,200 შეგიძლიათ უბრალოდ val და შემდეგ ის ყველაფერს გააკეთებს, რომ თქვენ. 139 00:08:00,200 --> 00:08:04,380 >> ასევე, შეგიძლიათ გამოიყენოთ ტოლია ტექნიკურად როგორც დავალება ოპერატორი. 140 00:08:04,380 --> 00:08:07,190 არსებობს მცირე ნიუანსები შორის გამოყენებით arrow 141 00:08:07,190 --> 00:08:10,730 ოპერატორი და ტოლობის ოპერატორი დავალებები. 142 00:08:10,730 --> 00:08:15,470 ძირითადად კონვენციის, ყველას უბრალოდ გამოიყენოთ arrow ოპერატორი. 143 00:08:15,470 --> 00:08:21,850 >> და აქ, მე მინიჭების ეს oblique notation მოუწოდა 1 colon 6. 144 00:08:21,850 --> 00:08:26,010 ეს წარმოშობს ვექტორი 1-დან 6. 145 00:08:26,010 --> 00:08:29,350 და ეს მართლაც კარგია, რადგან მაშინ თქვენ დაავალოს ვექტორი val 146 00:08:29,350 --> 00:08:34,270 და რომ მუშაობს თავისთავად. 147 00:08:34,270 --> 00:08:37,799 >> ასე რომ, ეს უკვე მიმდინარეობს from single-- ძალიან ინტუიციური მონაცემები 148 00:08:37,799 --> 00:08:41,070 სტრუქტურა უბრალოდ ორმაგი ზოგიერთი ტიპის ტიპის შევიდა ვექტორი 149 00:08:41,070 --> 00:08:45,670 და რომელიც შეაგროვოს ყველა სკალარული ღირებულებების თქვენთვის. 150 00:08:45,670 --> 00:08:50,770 ასე შემდეგ აპირებს საწყისი სკალარული, თქვენ აქვს R ობიექტები და ეს არის ვექტორი. 151 00:08:50,770 --> 00:08:55,610 ვექტორი არის ნებისმიერი სახის კოლექცია იგივე ტიპის. 152 00:08:55,610 --> 00:08:58,150 ასე რომ, აქ არის რამოდენიმე ვექტორები. 153 00:08:58,150 --> 00:08:59,800 >> ასე რომ, ეს არის რიცხვითი. 154 00:08:59,800 --> 00:09:02,440 რიცხვითი არის R გზა ამბობდა ორმაგი. 155 00:09:02,440 --> 00:09:07,390 და ასე იყოს, რომ ნებისმიერი ნომერი იქნება ორმაგი. 156 00:09:07,390 --> 00:09:13,150 >> ასე რომ, თუ თქვენ გაქვთ c 1.1, 3, უარყოფითი 5.7, c ფუნქცია. 157 00:09:13,150 --> 00:09:16,760 ამ concatenates სამივე ნომრები შევიდა ვექტორი. 158 00:09:16,760 --> 00:09:19,619 და ეს be-- ასე რომ, თუ თქვენ შეამჩნევთ 3 თავისთავად, 159 00:09:19,619 --> 00:09:21,910 ჩვეულებრივ, თქვენ ვივარაუდოთ, რომ ეს არის, როგორც მთელი რიცხვი, 160 00:09:21,910 --> 00:09:25,050 არამედ იმიტომ, რომ ვექტორები არის იგივე ტიპის, 161 00:09:25,050 --> 00:09:28,660 ეს არის ვექტორი ორადგილიანი ან რიცხვითი ამ შემთხვევაში. 162 00:09:28,660 --> 00:09:34,920 >> rnorm არის ფუნქცია, რომელიც ქმნის სტანდარტული ნორმალური ცვლადის 163 00:09:34,920 --> 00:09:36,700 ან სტანდარტული ნორმალური ღირებულებებს. 164 00:09:36,700 --> 00:09:38,360 და მე მითითებით ორი მათგანი. 165 00:09:38,360 --> 00:09:43,840 ასე რომ მე ვაკეთებ rnorm 2, იმის, რომ devs, და შემდეგ მე დაბეჭდვისას devs. 166 00:09:43,840 --> 00:09:47,350 ასე რომ ეს არის მხოლოდ ორი შემთხვევითი ნორმალური ღირებულებებს. 167 00:09:47,350 --> 00:09:50,060 >> და შემდეგ ints თუ თქვენ აკეთებთ თქვენ აინტერესებს რიცხვებით. 168 00:09:50,060 --> 00:09:54,650 ასე რომ, ეს არის მხოლოდ მეხსიერება გამოყოფა და გადარჩენის მეხსიერების ზომა. 169 00:09:54,650 --> 00:10:01,460 ასე, რომ თქვენ უნდა დამატება თქვენი ნომრები კაპიტალის L. 170 00:10:01,460 --> 00:10:04,170 >> ზოგადად, ეს არის R ისტორიული notation 171 00:10:04,170 --> 00:10:06,940 რაღაც მოუწოდა ხანგრძლივი რიცხვი. 172 00:10:06,940 --> 00:10:09,880 ასე რომ ყველაზე მეტად დროს, თქვენ იქნება საქმე ორჯერ. 173 00:10:09,880 --> 00:10:15,180 და თუ ოდესმე მოგვიანებით on ოპტიმიზაცია თქვენი კოდი, 174 00:10:15,180 --> 00:10:18,110 თქვენ შეგიძლიათ დაამატოთ ეს L's ამის შემდეგ ან დროს, მასში 175 00:10:18,110 --> 00:10:22,280 თუ თქვენ, ისევე precognitive შესახებ, თუ რა თქვენ ვაპირებთ გავაკეთოთ ამ ცვლადებს. 176 00:10:22,280 --> 00:10:25,340 177 00:10:25,340 --> 00:10:26,890 >> ასე რომ, აქ არის ხასიათი ვექტორი. 178 00:10:26,890 --> 00:10:31,440 ასე რომ, კიდევ ერთხელ, მე ინტეგრირების სამი სტრიქონები ამ დროს. 179 00:10:31,440 --> 00:10:36,230 გაითვალისწინეთ, რომ ორმაგი strings და ერთი სიმები არის იგივე რ 180 00:10:36,230 --> 00:10:41,000 ასე რომ, მე arthur და marvin და ასე როდესაც მე ბეჭდვა ეს, ყველა მათგანი 181 00:10:41,000 --> 00:10:43,210 ვაპირებთ, რომ ნახოთ ორმაგი strings. 182 00:10:43,210 --> 00:10:45,880 და თუ თქვენ ასევე მინდა მოიცავს ორმაგი ან ერთჯერადი string 183 00:10:45,880 --> 00:10:50,070 თქვენი პერსონაჟი, მაშინ თქვენ შეგიძლიათ ან ალტერნატიული თქვენს სიმები. 184 00:10:50,070 --> 00:10:53,540 >> ასე marvin ის, მეორე ელემენტს, ეს არის 185 00:10:53,540 --> 00:10:56,380 აპირებს show-- თქვენ უბრალოდ ორმაგი strings 186 00:10:56,380 --> 00:10:59,050 და შემდეგ ერთი string ასე რომ, ეს არის ცვლადი. 187 00:10:59,050 --> 00:11:04,040 წინააღმდეგ შემთხვევაში, თუ გსურთ გამოიყენოთ ორმაგი string ოპერატორი ორმაგი სიმებიანი 188 00:11:04,040 --> 00:11:07,090 როდესაც თქვენ გამოცხადების მას, მაშინ უბრალოდ გამოიყენოთ გაქცევის ოპერატორი. 189 00:11:07,090 --> 00:11:10,600 ასე რომ თქვენ წარმატებული ორმაგი სიმებიანი. 190 00:11:10,600 --> 00:11:13,330 >> და ბოლოს, ჩვენ ასევე ლოგიკური ვექტორები. 191 00:11:13,330 --> 00:11:15,890 ასე logical-- ასე TRUE და FALSE, და ისინი 192 00:11:15,890 --> 00:11:18,880 იქნება ყველა ასოებით. 193 00:11:18,880 --> 00:11:22,370 და შემდეგ, კიდევ ერთხელ, მე ინტეგრირების მათ და შემდეგ იმის მათ bools. 194 00:11:22,370 --> 00:11:24,590 ასე bools აპირებს აჩვენებს თქვენ TRUE, FALSE, და სიმართლე. 195 00:11:24,590 --> 00:11:28,280 196 00:11:28,280 --> 00:11:31,620 >> ასე რომ აქ არის vectorized ინდექსირებას. 197 00:11:31,620 --> 00:11:34,870 ასე დასაწყისში, I ვიღებ ფუნქცია 198 00:11:34,870 --> 00:11:39,230 ეს ეწოდება sequence-- თანმიმდევრობა 2 დან 12. 199 00:11:39,230 --> 00:11:42,490 და მე აღების თანმიმდევრობა 2. 200 00:11:42,490 --> 00:11:46,660 ასე რომ, ის აპირებს 2, 4, 6, 8, 10 და 12. 201 00:11:46,660 --> 00:11:50,080 და მაშინ, მე ინდექსირებას მიიღოს მესამე ელემენტს. 202 00:11:50,080 --> 00:11:55,770 >> ასე რომ ერთი რამ უნდა გვახსოვდეს არის რომ R ინდექსები მიერ დაწყებული 1. 203 00:11:55,770 --> 00:12:00,550 ასე vals 3 აპირებს თქვენ მესამე ელემენტს. 204 00:12:00,550 --> 00:12:04,580 ეს არის ერთგვარი განსხვავდება სხვა ენებზე, სადაც იგი იწყებს ნულიდან. 205 00:12:04,580 --> 00:12:09,780 ასე რომ, C ან C ++, მაგალითად, თქვენ აპირებს მიიღოს მეოთხე ელემენტს. 206 00:12:09,780 --> 00:12:13,280 >> და აქ არის vals 3-დან 5. 207 00:12:13,280 --> 00:12:16,030 ასე რომ, ერთი რამ, რომ მართლაც მაგარი ის არის, რომ თქვენ 208 00:12:16,030 --> 00:12:20,410 შეგიძლიათ გენერირება დროებითი ცვლადები შიგნით და მხოლოდ მაშინ გამოიყენეთ მათ on the fly. 209 00:12:20,410 --> 00:12:21,960 ასე რომ აქ არის 3 დან 5. 210 00:12:21,960 --> 00:12:25,070 ასე რომ, მე მომტანი ვექტორი 3, 4, 5 და მაშინ 211 00:12:25,070 --> 00:12:29,700 მე ინდექსირებას მიიღოს მესამე, მეოთხე და მეხუთე ელემენტს. 212 00:12:29,700 --> 00:12:32,280 >> ისე ანალოგიურად, თქვენ შეგიძლიათ აბსტრაქტული ამ უბრალოდ 213 00:12:32,280 --> 00:12:35,280 ნებისმიერი სახის ვექტორი რომელიც გაძლევთ ინდექსირებას. 214 00:12:35,280 --> 00:12:40,050 ასე რომ აქ არის vals და შემდეგ პირველი, მესამე და მეექვსე ელემენტებს. 215 00:12:40,050 --> 00:12:42,800 და მაშინ, თუ გსურთ გავაკეთოთ დაკომპლექტდეს, 216 00:12:42,800 --> 00:12:45,210 ასე რომ თქვენ უბრალოდ მინუს შემდგომ და სწორედ ამას 217 00:12:45,210 --> 00:12:48,600 გაძლევთ ყველაფერი, რაც არ არის პირველი, მესამე, ან მეექვსე ელემენტს. 218 00:12:48,600 --> 00:12:51,590 ასე რომ, ეს იქნება 4, 8 და 10. 219 00:12:51,590 --> 00:12:54,380 >> და თუ გსურთ მიიღოთ კიდევ უფრო მოწინავე, 220 00:12:54,380 --> 00:12:57,610 თქვენ შეგიძლიათ concatenate ლოგიკური ვექტორები. 221 00:12:57,610 --> 00:13:05,210 ასე რომ, ეს ინდექსი აპირებს მოგცემთ ეს ლოგიკური ვექტორი სიგრძის 6. 222 00:13:05,210 --> 00:13:07,280 ასე rep TRUE მძიმით 3. 223 00:13:07,280 --> 00:13:09,680 ეს იქნება გავიმეორო TRUE სამჯერ. 224 00:13:09,680 --> 00:13:12,900 ასე რომ, ეს მოგცემთ ვექტორი TRUE, ნამდვილი, ჭეშმარიტი. 225 00:13:12,900 --> 00:13:17,470 >> rep FALSE 4-- ამ აპირებს მოგცემთ ვექტორი, ყალბი, ყალბი, ყალბი, ყალბი. 226 00:13:17,470 --> 00:13:21,280 და მაშინ c აპირებს concatenate ამ ორი Booleans ერთად. 227 00:13:21,280 --> 00:13:24,090 ასე რომ თქვენ აპირებთ მისაღებად სამი Trues და შემდეგ ოთხი FALSEs. 228 00:13:24,090 --> 00:13:28,460 >> ასე რომ, როდესაც თქვენ ინდექსი vals, თქვენ აპირებს მიიღოს ნამდვილი, ჭეშმარიტი, ნამდვილი. 229 00:13:28,460 --> 00:13:31,420 ასე რომ აპირებს ვთქვა, დიახ, მინდა იმ სამი ელემენტები. 230 00:13:31,420 --> 00:13:33,520 და მაშინ ყალბი, ყალბი, ყალბი, ყალბი აპირებს 231 00:13:33,520 --> 00:13:37,140 ვთქვათ, მე არ მინდა იმ ელემენტებს ასე რომ ის არ აპირებს დაბრუნებას მათ. 232 00:13:37,140 --> 00:13:41,490 >> და მე ვფიქრობ, რომ რეალურად ტექსტის არასწორი ფრაგმენტი აქ იმიტომ, რომ ეს ამბობს განმეორებითი TRUE 3 233 00:13:41,490 --> 00:13:47,990 და ვიმეორებ FALSE 4, ტექნიკურად, თქვენ მხოლოდ ექვსი ელემენტები ისე, ვიმეორებ FALSE, 234 00:13:47,990 --> 00:13:50,470 ეს უნდა იყოს განმეორებითი FALSE 3. 235 00:13:50,470 --> 00:13:55,260 მე ვფიქრობ, R, ასევე ჭკვიანი საკმარისი ასეთი იმ შემთხვევაში, თუ თქვენ უბრალოდ მიუთითოთ 4 აქ, მაშინ 236 00:13:55,260 --> 00:13:56,630 ის კი არ შეცდომას. 237 00:13:56,630 --> 00:13:58,480 ეს იქნება მხოლოდ გადმოგცეთ ეს მნიშვნელობა. 238 00:13:58,480 --> 00:14:00,970 ასე რომ, ეს უბრალოდ იგნორირება, რომ მეოთხე FALSE. 239 00:14:00,970 --> 00:14:05,310 240 00:14:05,310 --> 00:14:09,270 >> ასე რომ აქ არის vectorized დავალება. 241 00:14:09,270 --> 00:14:15,480 ასე set.seed-- ეს უბრალოდ ადგენს სათესლე pseudorandom ნომრები. 242 00:14:15,480 --> 00:14:20,110 ასე რომ, მე შექმნის თესლი 42, რაც იმას ნიშნავს, რომ თუ მე გენერირება 243 00:14:20,110 --> 00:14:22,950 სამი შემთხვევითი ნორმალური ღირებულებები, და შემდეგ, თუ 244 00:14:22,950 --> 00:14:27,400 აწარმოებს set.seed საკუთარი კომპიუტერის გამოყენებით იგივე ღირებულება 42, 245 00:14:27,400 --> 00:14:30,990 მაშინ თქვენ ასევე იგივე სამი შემთხვევითი normals. 246 00:14:30,990 --> 00:14:33,411 >> ასე რომ, ეს არის ძალიან კარგი for reproducibility. 247 00:14:33,411 --> 00:14:35,910 როგორც წესი, როდესაც თქვენ აკეთებთ ზოგიერთი ერთგვარი მეცნიერული ანალიზი, 248 00:14:35,910 --> 00:14:37,230 თქვენ სურს შექმნას თესლი. 249 00:14:37,230 --> 00:14:41,270 რომ გზა სხვა მეცნიერები შეგიძლიათ მხოლოდ რეპროდუცირება ზუსტად იგივე კოდი თქვენ 250 00:14:41,270 --> 00:14:44,790 კეთდება იმიტომ, რომ ისინი უნდა ზუსტი ამავე შემთხვევითი ცვლადები that-- ან შემთხვევითი 251 00:14:44,790 --> 00:14:47,270 ღირებულებები, რომ თქვენ მიღებული ასევე. 252 00:14:47,270 --> 00:14:49,870 253 00:14:49,870 --> 00:14:53,910 >> და ასე vectorized დავალება აქ ნაჩვენებია vals 1 2. 254 00:14:53,910 --> 00:14:59,290 ისე სჭირდება პირველი ორი ელემენტები of vals და შემდეგ ანიჭებს მათ 0. 255 00:14:59,290 --> 00:15:03,940 და შემდეგ, ასევე შეგიძლიათ მხოლოდ ამის მსგავსი რამ ერთად Booleans. 256 00:15:03,940 --> 00:15:09,340 >> ასე vals არ არის უტოლდება 0 ნება გაძლევთ ვექტორი ყალბი, ყალბი, TRUE 257 00:15:09,340 --> 00:15:10,350 ამ შემთხვევაში. 258 00:15:10,350 --> 00:15:13,770 და შემდეგ, ის აპირებს ვთქვათ, რომ ნებისმიერი იმ ინდექსები ეს იყო ნამდვილი, 259 00:15:13,770 --> 00:15:15,270 შემდეგ ის აპირებს დაავალოს, რომ 5. 260 00:15:15,270 --> 00:15:18,790 ისე სჭირდება მესამე ელემენტს აქ და შემდეგ ანიჭებს მას 5. 261 00:15:18,790 --> 00:15:22,300 >> და ეს მართლაც ლამაზი შედარებით დაბალი დონის ენებზე 262 00:15:22,300 --> 00:15:25,560 სადაც თქვენ უნდა გამოიყენოთ მარყუჟების ყველაფერი ეს vectorized პერსონალი 263 00:15:25,560 --> 00:15:30,281 რადგან ეს მხოლოდ ძალიან ინტუიტიური და ეს ერთი ლაინერი. 264 00:15:30,281 --> 00:15:32,030 და რა დიდი vectorized notation 265 00:15:32,030 --> 00:15:37,020 ის არის, რომ R, ეს არის ერთგვარი ჩაშენებული ისე, რომ ისინი თითქმის სწრაფად 266 00:15:37,020 --> 00:15:42,490 როგორც აკეთებს დაბალი დონის ენის, როგორც განსხვავებით მიღების for loop in R 267 00:15:42,490 --> 00:15:46,317 და შემდეგ მქონე ეს უნდა გააკეთოს დინამიური ინდექსირებას თავად. 268 00:15:46,317 --> 00:15:48,900 და რომ ვიქნები ნელა, ვიდრე აკეთებს ამ სახის vectorized რამ 269 00:15:48,900 --> 00:15:55,950 სადაც მას შეუძლია გააკეთოს ის პარალელურად, სადაც ის აკეთებს ამას threading ძირითადად. 270 00:15:55,950 --> 00:15:58,650 >> ასე რომ, აქ არის ვექტორიზებული ოპერაციებში. 271 00:15:58,650 --> 00:16:04,920 ასე რომ, მე მომტანი მნიშვნელობა 1-დან 3, მინიჭების, რომ vec1, 3 დან 5, vec2, 272 00:16:04,920 --> 00:16:05,950 დამატებით მათ ერთად. 273 00:16:05,950 --> 00:16:11,490 ის დასძენს, რომ მათ კომპონენტი ბრძენი ასე ეს არის 1 + 3, 2 პლუს 4, და ასე შემდეგ. 274 00:16:11,490 --> 00:16:13,330 >> vec1 ჯერ vec2. 275 00:16:13,330 --> 00:16:16,110 ამ მრავლდება ორ აფასებს კომპონენტი ბრძენი. 276 00:16:16,110 --> 00:16:21,830 ასე რომ, ეს 1-ჯერ 3, 2 ჯერ 4, და შემდეგ 3-ჯერ 5. 277 00:16:21,830 --> 00:16:28,250 >> და შემდეგ, ისევე, როგორც თქვენ შეგიძლიათ ამის გაკეთება comparisons-- ლოგიკური შედარება. 278 00:16:28,250 --> 00:16:33,640 ასე რომ, ეს FALSE FALSE TRUE ამ საქმე, რადგან 1 არ აღემატება 3, 279 00:16:33,640 --> 00:16:35,920 2 არ აღემატება 4. 280 00:16:35,920 --> 00:16:41,160 ეს არის, ვფიქრობ, კიდევ typo, 3 ნამდვილად არ აღემატება 5. 281 00:16:41,160 --> 00:16:41,660 Yeah. 282 00:16:41,660 --> 00:16:45,770 და ასე რომ თქვენ შეგიძლიათ უბრალოდ ყველა ეს მარტივი ოპერაციები 283 00:16:45,770 --> 00:16:48,350 იმიტომ, რომ მათ მემკვიდრეობით საწყისი კლასების თავს. 284 00:16:48,350 --> 00:16:51,110 285 00:16:51,110 --> 00:16:52,580 >> ისე, რომ მხოლოდ ვექტორი. 286 00:16:52,580 --> 00:16:56,530 და ეს ერთგვარი ყველაზე ფუნდამენტურ R ობიექტი რადგან მოცემულ ვექტორი, 287 00:16:56,530 --> 00:16:59,170 შეგიძლიათ აშენება უფრო მოწინავე ობიექტები. 288 00:16:59,170 --> 00:17:00,560 >> ასე რომ აქ matrix. 289 00:17:00,560 --> 00:17:05,030 ეს არის არსებითად აბსტრაქცია რა მატრიცა არის თავისთავად. 290 00:17:05,030 --> 00:17:10,099 ასე რომ, ამ შემთხვევაში, ეს სამი სხვადასხვა ვექტორები, სადაც თითოეული სვეტი, 291 00:17:10,099 --> 00:17:12,710 ან შეგიძლიათ განიხილოს ეს როგორც თითოეული ზედიზედ. 292 00:17:12,710 --> 00:17:18,250 >> ასე რომ, მე შენახვის matrix 1-დან 9 და შემდეგ მე მითითებით 3 რიგები. 293 00:17:18,250 --> 00:17:23,364 ასე 1-დან 9 მოგცემთ ვექტორი 1, 2, 3, 4, 5, 6, და ყველა გზა 9. 294 00:17:23,364 --> 00:17:29,250 >> ერთი რამ უნდა გავითვალისწინოთ ის არის, რომ R მაღაზიები ღირებულებების სვეტი ძირითადი ფორმატში. 295 00:17:29,250 --> 00:17:34,160 სხვა სიტყვებით, როდესაც ხედავთ 1 9, ის აპირებს შესანახად them-- 296 00:17:34,160 --> 00:17:36,370 ეს იქნება 1, 2, 3 პირველი სვეტი, 297 00:17:36,370 --> 00:17:38,510 და შემდეგ ის ყველაფერს გააკეთებს, 4, 5, 6 მეორე სვეტი, 298 00:17:38,510 --> 00:17:41,440 და შემდეგ 7, 8, 9, მესამე სვეტი. 299 00:17:41,440 --> 00:17:45,570 >> და აქ არის რამოდენიმე სხვა საერთო ფუნქციები შეგიძლიათ გამოიყენოთ. 300 00:17:45,570 --> 00:17:49,650 ასე dim mat, ეს მოგცემთ ზომები matrix. 301 00:17:49,650 --> 00:17:52,620 ის აპირებს დაბრუნებას თქვენ ვექტორი განზომილებაში. 302 00:17:52,620 --> 00:17:55,580 ასე რომ, ამ შემთხვევაში, რადგან ჩვენი matrix 3 3, 303 00:17:55,580 --> 00:18:01,900 ის აპირებს მოგცემთ რიცხვითი ვექტორი, რომ 3 3. 304 00:18:01,900 --> 00:18:05,270 >> და აქ მხოლოდ აჩვენებს matrix გამრავლება. 305 00:18:05,270 --> 00:18:11,970 ასე ჩვეულებრივ, თუ უბრალოდ asterisk-- ასე mat ვარსკვლავით mat-- 306 00:18:11,970 --> 00:18:15,380 ეს იქნება კომპონენტი ბრძენი ოპერაცია 307 00:18:15,380 --> 00:18:17,300 ან რასაც Hadamard პროდუქტი. 308 00:18:17,300 --> 00:18:21,310 ამიტომ აპირებს გააკეთოს ყოველ ელემენტის კომპონენტის ბრძენი. 309 00:18:21,310 --> 00:18:23,610 თუმცა, თუ გსურთ matrix გამრავლება 310 00:18:23,610 --> 00:18:29,380 ასე გამრავლებით პირველი რიგის ჯერ მეორე matrix პირველი სვეტი 311 00:18:29,380 --> 00:18:34,510 და ასე შემდეგ, თქვენ გამოიყენებს ეს პროცენტი ოპერაცია. 312 00:18:34,510 --> 00:18:38,110 >> და ტ mat მხოლოდ ოპერაცია transpose. 313 00:18:38,110 --> 00:18:42,590 ასე რომ, მე ვამბობ, მიიღოს transpose in მატრიცა, გავამრავლოთ ის მიერ matrix 314 00:18:42,590 --> 00:18:43,090 თავად. 315 00:18:43,090 --> 00:18:45,006 და შემდეგ ის აპირებს დაბრუნდება თქვენ კიდევ 3 316 00:18:45,006 --> 00:18:50,700 3 matrix ჩვენება პროდუქტის თქვენ მინდა. 317 00:18:50,700 --> 00:18:53,750 >> და ისე, რომ matrix. 318 00:18:53,750 --> 00:18:56,020 აქ არის ის, რაც ე.წ. მონაცემების ფარგლებში. 319 00:18:56,020 --> 00:19:00,780 მონაცემების ფარგლებში შეგიძლიათ წარმოიდგინოთ, როგორც მატრიცა, მაგრამ თითოეული სვეტის თავად 320 00:19:00,780 --> 00:19:02,990 იქნება სხვადასხვა ტიპის. 321 00:19:02,990 --> 00:19:07,320 >> რა არის მართლაც მაგარი მონაცემები ფარგლებში ის არის, რომ მონაცემთა ანალიზი თავად, 322 00:19:07,320 --> 00:19:11,260 თქვენ აპირებს ყველა ამ ჰეტეროგენული მონაცემები და ყველა ეს მართლაც 323 00:19:11,260 --> 00:19:15,640 ბინძურ რამ, სადაც თითოეული სვეტების თავად შეიძლება იყოს სხვადასხვა ტიპის. 324 00:19:15,640 --> 00:19:21,460 ასე რომ, აქ მე ვამბობ, შექმნას მონაცემების ფარგლებში, ნუ ints 1-დან 3, 325 00:19:21,460 --> 00:19:24,750 და შემდეგ ასევე აქვს ხასიათი ვექტორი. 326 00:19:24,750 --> 00:19:28,470 ასე რომ, შემიძლია ინდექსი მეშვეობით თითოეული ეს სვეტები 327 00:19:28,470 --> 00:19:30,930 და მაშინ მე კიდევ ღირებულებების თავს. 328 00:19:30,930 --> 00:19:34,370 და ასევე შეგიძლიათ გავაკეთოთ გარკვეული ოპერაციების მონაცემები ფარგლებში. 329 00:19:34,370 --> 00:19:38,040 და ყველაზე მეტი დრო, როდესაც თქვენ აკეთებს მონაცემთა ანალიზი და გარკვეული 330 00:19:38,040 --> 00:19:42,042 of preprocessing, თქვენ უნდა მუშაობს ამ მონაცემების სტრუქტურები 331 00:19:42,042 --> 00:19:44,250 სადაც ყოველი სვეტი აპირებს იყოს სხვადასხვა ტიპის. 332 00:19:44,250 --> 00:19:47,880 333 00:19:47,880 --> 00:19:52,970 >> საბოლოოდ, ასე რომ ეს არის არსებითად მხოლოდ ოთხი ძირითადი ობიექტების R. სია 334 00:19:52,970 --> 00:19:55,820 უბრალოდ შეგროვება ნებისმიერი სხვა ობიექტები გსურთ. 335 00:19:55,820 --> 00:20:00,130 ასე რომ შეინახავს ამ ერთ ცვლადი, რომ თქვენ შეგიძლიათ მარტივად. 336 00:20:00,130 --> 00:20:02,370 >> ასე რომ, აქ, მე აღების სიაში. 337 00:20:02,370 --> 00:20:04,460 მე ვამბობ, პერსონალის უდრის 3. 338 00:20:04,460 --> 00:20:08,060 ამიტომ, მე ვაპირებ აქვს ერთ ელემენტს სიაში, და ეს ეწოდება პერსონალი, 339 00:20:08,060 --> 00:20:10,570 და ის აპირებს აქვს მნიშვნელობა 3. 340 00:20:10,570 --> 00:20:13,140 >> მე ასევე შეგიძლიათ შექმნათ matrix. 341 00:20:13,140 --> 00:20:17,970 ასე რომ ეს არის 1 დან 4 და ბოლოს row უდრის 2, ასე რომ 2 by 2 matrix. 342 00:20:17,970 --> 00:20:20,270 სიაში ასევე და ეს ე.წ. mat. 343 00:20:20,270 --> 00:20:24,690 moreStuff, ხასიათი სიმებიანი, და კიდევ ერთი ნუსხა თავისთავად. 344 00:20:24,690 --> 00:20:27,710 >> ასე რომ, ეს სია რომ 5 და დათვი. 345 00:20:27,710 --> 00:20:30,990 ასე რომ, ეს ღირებულება 5 და ხასიათი აქვს string დათვი 346 00:20:30,990 --> 00:20:32,710 და ეს სიაში სიაში. 347 00:20:32,710 --> 00:20:35,965 ასე რომ თქვენ გაქვთ ეს რეკურსიული რამ, სადაც 348 00:20:35,965 --> 00:20:38,230 თქვენ უნდა another-- ჩაწერეთ ფარგლებში ტიპის. 349 00:20:38,230 --> 00:20:41,420 ისე ანალოგიურად, შეგიძლიათ აქვს matrix შიგნით კიდევ matrix და ასე შემდეგ. 350 00:20:41,420 --> 00:20:44,264 და სიაში არის მხოლოდ კარგი გზა შეგროვება და აგრეგაცია 351 00:20:44,264 --> 00:20:45,430 ყველა ამ სხვადასხვა ობიექტები. 352 00:20:45,430 --> 00:20:50,210 353 00:20:50,210 --> 00:20:57,150 >> და ბოლოს, აქ მხოლოდ დაეხმარება საქმე ეს მხოლოდ წავიდა ძალიან სწრაფად. 354 00:20:57,150 --> 00:21:01,350 ასე რომ ნებისმიერ დროს თქვენ დაბნეული შესახებ გარკვეული ფუნქცია, 355 00:21:01,350 --> 00:21:03,510 თქვენ შეგიძლიათ ამის დახმარებით, რომ ფუნქცია. 356 00:21:03,510 --> 00:21:07,120 ასე რომ თქვენ შეგიძლიათ დახმარებას matrix ან კითხვის ნიშნის matrix. 357 00:21:07,120 --> 00:21:11,430 და დახმარება და კითხვის ნიშნის არიან უბრალოდ სტენოგრამის იგივე 358 00:21:11,430 --> 00:21:13,040 ასე რომ, ისინი მაგალითი. 359 00:21:13,040 --> 00:21:16,820 >> lm არის ფუნქცია, რომელიც უბრალოდ არ წრფივი მოდელი. 360 00:21:16,820 --> 00:21:20,340 მაგრამ თუ უბრალოდ არ ვიცი როგორ, რომ სამუშაოები, თქვენ შეგიძლიათ უბრალოდ დახმარებით lm 361 00:21:20,340 --> 00:21:24,610 და რომ მოგცემთ ზოგიერთი სახის დოკუმენტაცია, რომ 362 00:21:24,610 --> 00:21:27,960 გამოიყურება სახის მოსწონს კაცი გვერდი Unix, სადაც 363 00:21:27,960 --> 00:21:34,210 თქვენ გაქვთ მოკლე აღწერა, თუ რა ეს ასეა, ასევე, რა არის მისი არგუმენტები, 364 00:21:34,210 --> 00:21:38,850 ის, რაც დააბრუნებს, და მხოლოდ რჩევა, თუ როგორ გამოიყენოს იგი, და რამდენიმე მაგალითები, ასევე. 365 00:21:38,850 --> 00:21:41,680 366 00:21:41,680 --> 00:21:52,890 >> ნება მომეცით წავიდეთ წინ და შოუ ზოგიერთი დემო გამოყენებით R. OK. 367 00:21:52,890 --> 00:21:55,470 ასე მივედი ძალიან სწრაფად მხოლოდ მონაცემები 368 00:21:55,470 --> 00:21:59,440 სტრუქტურები და გარკვეული op-- ზოგიერთი ოპერაცია. 369 00:21:59,440 --> 00:22:02,960 აქ არის გარკვეული ფუნქციები. 370 00:22:02,960 --> 00:22:06,750 >> ასე რომ, აქ მე უბრალოდ აპირებს განსაზღვროს ფუნქცია. 371 00:22:06,750 --> 00:22:09,970 ასე რომ მე ასევე გამოყენებით დავალება ოპერატორი აქ, 372 00:22:09,970 --> 00:22:12,610 და მაშინ მე ვამბობ, აცხადებენ ეს ფუნქცია. 373 00:22:12,610 --> 00:22:14,140 და ეს ხდება ღირებულება x. 374 00:22:14,140 --> 00:22:18,210 ასე რომ, ეს არის ნებისმიერი ღირებულების გსურთ და მე ვაპირებ დაბრუნებას x თავად. 375 00:22:18,210 --> 00:22:20,840 ასე რომ, ეს არის პირადობის ფუნქცია. 376 00:22:20,840 --> 00:22:23,670 >> და რა არის cool შესახებ ეს შედარებით სხვა ენებზე 377 00:22:23,670 --> 00:22:26,330 და კიდევ ერთი დაბალი დონის ენების, რომ x 378 00:22:26,330 --> 00:22:29,350 შეიძლება იყოს ნებისმიერი ტიპის თავად და ეს კიდე დაბრუნდება ტიპის. 379 00:22:29,350 --> 00:22:35,251 ასე რომ თქვენ შეგიძლიათ imagine-- ასე მიადევნე მე უბრალოდ გაუშვით ეს სწრაფად. 380 00:22:35,251 --> 00:22:35,750 უკაცრავად. 381 00:22:35,750 --> 00:22:40,300 >> ასე რომ, ერთი რამ უნდა აღინიშნოს, ის არის, რომ ამ რედაქტორი მე გამოყენებით 382 00:22:40,300 --> 00:22:41,380 ეწოდება rstudio. 383 00:22:41,380 --> 00:22:44,389 ეს არის ის, რაც ე.წ. IDE. 384 00:22:44,389 --> 00:22:46,180 და ერთი რამ, რომ მართლაც ლამაზი ამ 385 00:22:46,180 --> 00:22:51,500 არის ის, რომ აერთიანებს ბევრი რამ გვინდა გავაკეთოთ R თავისთავად 386 00:22:51,500 --> 00:22:53,180 უბრალოდ ძალიან ინტუიციურად. 387 00:22:53,180 --> 00:22:55,550 >> ასე რომ აქ არის თარჯიმნის კონსოლი. 388 00:22:55,550 --> 00:23:02,160 ისე ანალოგიურად, ასევე შეგიძლიათ ეს console ნედლეული უბრალოდ ამით დედაქალაქში R. 389 00:23:02,160 --> 00:23:05,630 და ეს არის ზუსტად იგივე როგორც კონსოლი. 390 00:23:05,630 --> 00:23:12,210 ასე რომ, მე შემიძლია უბრალოდ id ფუნქცია x, x, x. 391 00:23:12,210 --> 00:23:16,130 და შემდეგ, ხოლო შემდეგ კარგად იქნება თავად. 392 00:23:16,130 --> 00:23:19,200 393 00:23:19,200 --> 00:23:21,740 >> ასე rstudio დიდი იმიტომ, რომ მას კონსოლი. 394 00:23:21,740 --> 00:23:25,360 მას ასევე აქვს დოკუმენტები გსურთ აწარმოებს. 395 00:23:25,360 --> 00:23:28,629 და მაშინ მას აქვს რამდენიმე ცვლადი რომ თქვენ ხედავთ გარემოში. 396 00:23:28,629 --> 00:23:30,420 და მაშინ, თუ თქვენ გაქვთ უნდა გავაკეთოთ ნაკვეთები, მაშინ თქვენ 397 00:23:30,420 --> 00:23:33,730 შეგიძლიათ უბრალოდ ვხედავ აქ, როგორც ეწინააღმდეგებოდა მართვის ყველა ამ სხვადასხვა შუშები 398 00:23:33,730 --> 00:23:35,940 თავად. 399 00:23:35,940 --> 00:23:40,530 >> მე რეალურად პირადად გამოიყენოთ Vim, მაგრამ მე გრძნობს, როგორც rstudio არის შესანიშნავი მხოლოდ 400 00:23:40,530 --> 00:23:44,640 მიღების კარგი იდეა თუ როგორ გამოიყენოთ R. როგორც წესი, 401 00:23:44,640 --> 00:23:47,040 როდესაც თქვენ ცდილობთ ვისწავლოთ ახალი ამოცანა, 402 00:23:47,040 --> 00:23:49,590 თქვენ არ გსურთ გაუმკლავდეს ძალიან ბევრი რამ ერთდროულად. 403 00:23:49,590 --> 00:23:53,120 ასე R მხოლოდ very-- rstudio არის ძალიან კარგი გზა სწავლის R 404 00:23:53,120 --> 00:23:56,760 გარეშე გამკლავება ყველა ამ სხვა რამ. 405 00:23:56,760 --> 00:23:58,600 >> ასე რომ, აქ მე გაშვებული id hello. 406 00:23:58,600 --> 00:24:00,090 ამ ბრუნდება hello. 407 00:24:00,090 --> 00:24:01,740 id 123. 408 00:24:01,740 --> 00:24:04,610 აქ არის ვექტორული რიცხვებით. 409 00:24:04,610 --> 00:24:08,620 ასე ერთნაირად, რადგან თქვენ შეგიძლიათ მიიღოს ნებისმიერი გარკვეული ღირებულება, 410 00:24:08,620 --> 00:24:16,060 თქვენ შეგიძლიათ ამის დაბრუნების პირადობის x ამიტომ დააბრუნებს 1234 და 5. 411 00:24:16,060 --> 00:24:22,210 >> და ნება მომეცით უბრალოდ გაჩვენებთ, რომ ეს მართლაც რიცხვი. 412 00:24:22,210 --> 00:24:28,800 და ანალოგიურად, თუ კლასი id x, ეს იქნება მთელი რიცხვი. 413 00:24:28,800 --> 00:24:34,170 და შემდეგ, ასევე შეგიძლიათ შედარების ორი და ეს სიმართლეა. 414 00:24:34,170 --> 00:24:38,350 ასე რომ, მე შემოწმების თუ id of x შეადგენს შეადგენს x და ცნობა 415 00:24:38,350 --> 00:24:39,760 ის, რომ გაძლევთ ორი Trues. 416 00:24:39,760 --> 00:24:44,280 ასე რომ, ეს არ ვამბობ არიან ორი ობიექტები იდენტურია, 417 00:24:44,280 --> 00:24:46,845 მაგრამ თითოეული მასალა ფარგლებში ვექტორები იდენტურია. 418 00:24:46,845 --> 00:24:50,000 419 00:24:50,000 --> 00:24:52,090 >> აქ არის bounded.compare. 420 00:24:52,090 --> 00:24:58,470 ასე რომ ეს არის ოდნავ უფრო რთული რომ მას აქვს თუ მდგომარეობა და სხვა 421 00:24:58,470 --> 00:25:00,960 და მაშინ იგი იღებს ორი არგუმენტები დროს. 422 00:25:00,960 --> 00:25:02,640 ასე რომ X არის ნებისმიერი ტიპის. 423 00:25:02,640 --> 00:25:06,280 და მე რომ ამ მეორე არგუმენტი არის. 424 00:25:06,280 --> 00:25:08,380 ეს შეიძლება იყოს არაფერი, ისევე. 425 00:25:08,380 --> 00:25:12,490 მაგრამ ჩვეულებრივ, იგი აპირებს 5 თუ არ აკონკრეტებს არაფერი. 426 00:25:12,490 --> 00:25:16,730 >> ასე რომ აქ მე ვაპირებ ვთქვა თუ x მეტია. 427 00:25:16,730 --> 00:25:19,220 ასე რომ, თუ მე არ დააკონკრეტა, ეს ამბობს, თუ x მეტია 5, 428 00:25:19,220 --> 00:25:20,470 შემდეგ მე ვაპირებ დაბრუნებას TRUE. 429 00:25:20,470 --> 00:25:23,230 სხვას, მე ვაპირებ დაბრუნებას FALSE. 430 00:25:23,230 --> 00:25:24,870 ნება მომეცით წავიდეთ წინ და განისაზღვროს ამ. 431 00:25:24,870 --> 00:25:30,600 432 00:25:30,600 --> 00:25:34,550 >> და ახლა მე ვაპირებ აწარმოებს bounded.compare 3. 433 00:25:34,550 --> 00:25:39,150 ასე რომ, ეს ნათქვამია 3 ნაკლები ვიდრე 3 აღემატება 5. 434 00:25:39,150 --> 00:25:41,830 არა, ეს ასე არ არის FALSE. 435 00:25:41,830 --> 00:25:46,550 >> და bounded.compare 3 და მე ვაპირებ შედარების გამოყენებით უდრის 2. 436 00:25:46,550 --> 00:25:50,700 ასე რომ, ახლა მე ვამბობ დიახ, ახლა მე გინდათ, რომ იყოს რაღაც. 437 00:25:50,700 --> 00:25:52,750 ამიტომ, მე ვაპირებ ვთქვა, თქვენ უნდა იყოს 2. 438 00:25:52,750 --> 00:25:56,640 >> მე შეგიძლიათ ეს ერთგვარი notation და მე ვიტყვი უდრის 2. 439 00:25:56,640 --> 00:25:58,720 ეს უფრო იკითხება რომ, როდესაც თქვენ 440 00:25:58,720 --> 00:26:01,450 ეძებს ამ მართლაც რთული ფუნქციები, რომელიც 441 00:26:01,450 --> 00:26:08,110 მრავალჯერადი არგუმენტები და ეს შეიძლება იყოს ათობით oftentimes-- უბრალოდ ვამბობ, 442 00:26:08,110 --> 00:26:11,140 უდრის 2 უფრო იკითხება ასე რომ, მოგვიანებით მომავალში 443 00:26:11,140 --> 00:26:13,020 თქვენ იცით, რას ვაკეთებთ. 444 00:26:13,020 --> 00:26:17,120 >> ასე რომ, ამ შემთხვევაში, მე გამონათქვამი 3 მეტია 2. 445 00:26:17,120 --> 00:26:18,270 დიახ, ეს არის. 446 00:26:18,270 --> 00:26:22,350 და ანალოგიურად, მე შემიძლია მხოლოდ ამოიღონ ამ და აცხადებენ, 3 მეტია 2 447 00:26:22,350 --> 00:26:23,440 სადაც უდრის 2. 448 00:26:23,440 --> 00:26:26,230 და ეს ასეა. 449 00:26:26,230 --> 00:26:26,730 დიახ? 450 00:26:26,730 --> 00:26:29,670 >> აუდიტორია: თქვენ შესრულებაში ხაზს? 451 00:26:29,670 --> 00:26:30,670 >> DUSTIN TRAN: დიახ, მე ვარ. 452 00:26:30,670 --> 00:26:33,900 ასე, რასაც მე ვაკეთებ აქ აღების ამ ტექსტის document-- 453 00:26:33,900 --> 00:26:39,825 და რა დიდი rstudio ის არის, რომ შემიძლია უბრალოდ აწარმოებს short-- გასაღები კომბინაცია. 454 00:26:39,825 --> 00:26:41,820 ასე რომ მე ვაკეთებ Control-Enter. 455 00:26:41,820 --> 00:26:44,850 >> და მაშინ, მე აღების ხაზი ტექსტური დოკუმენტი 456 00:26:44,850 --> 00:26:46,710 და შემდეგ აყენებს კონსოლი. 457 00:26:46,710 --> 00:26:50,800 ასე რომ, აქ მე ვამბობ, bounded.compare და მე ამით Control-X. 458 00:26:50,800 --> 00:26:52,540 ასე, რომ შეიძლება უბრალოდ არ აწარმოებს აქაც. 459 00:26:52,540 --> 00:26:54,920 და მაშინ, რომ მიიღოს ხაზი და შემდეგ დააყენა აქ. 460 00:26:54,920 --> 00:26:57,900 და მაშინ ანალოგიურად, მე შემიძლია არ აწარმოებს აქ. 461 00:26:57,900 --> 00:27:04,630 და მაშინ ის უბრალოდ შეინახოს განსაზღვრის ხაზები შევიდა კონსოლი, როგორიცაა, რომ. 462 00:27:04,630 --> 00:27:10,690 >> და თუ თქვენ ასევე შეამჩნევთ curly braces არსებობს ისევე, როგორც C სინტაქსი. 463 00:27:10,690 --> 00:27:13,910 რომ X, თუ, თუ მდგომარეობა არის ასევე აპირებთ გამოიყენოთ ფრჩხილებში და შემდეგ 464 00:27:13,910 --> 00:27:15,350 შეგიძლიათ გამოიყენოთ სხვა. 465 00:27:15,350 --> 00:27:17,496 კიდევ ერთი არის სხვაგან თუ. 466 00:27:17,496 --> 00:27:21,440 ასე რომ, ეს იქნება x უდრის უდრის, მაგალითად. 467 00:27:21,440 --> 00:27:24,190 468 00:27:24,190 --> 00:27:26,350 და შემდეგ მე ვაპირებ დაბრუნდეს რაღაც აქ. 469 00:27:26,350 --> 00:27:29,490 >> შეამჩნია, რომ არსებობს ორი განსხვავებული რამ აქ რომ ხდება. 470 00:27:29,490 --> 00:27:34,360 ერთი ის არის, რომ აქ მე მითითებით დაბრუნების ღირებულება TRUE. 471 00:27:34,360 --> 00:27:35,950 აქ მე უბრალოდ ვამბობ x. 472 00:27:35,950 --> 00:27:39,970 ასე R, როგორც წესი, იყოს მიიღოს ბოლო არგუმენტები 473 00:27:39,970 --> 00:27:43,510 ან ბოლო ხაზი კოდი, და რომ იქნება, რასაც ის დაბრუნდა. 474 00:27:43,510 --> 00:27:46,920 ასე რომ, აქ ეს არის იგივე რამ, როგორც აკეთებს დაბრუნების x. 475 00:27:46,920 --> 00:27:49,450 476 00:27:49,450 --> 00:27:50,540 >> და მხოლოდ გაჩვენოთ. 477 00:27:50,540 --> 00:27:54,000 478 00:27:54,000 --> 00:27:57,052 და შემდეგ, ის იმუშავებს მხოლოდ, რომ. 479 00:27:57,052 --> 00:27:58,260 ნება მომეცით, გავაგრძელოთ ამ. 480 00:27:58,260 --> 00:28:00,630 >> ასე რომ სხვაგან თუ. 481 00:28:00,630 --> 00:28:04,060 და მართლაც, მე შეიძლება დაბრუნდეს არაფერი მინდა. 482 00:28:04,060 --> 00:28:06,680 ასე რომ, მე კი არ უნდა დაბრუნება Booleans ყველა დროის, 483 00:28:06,680 --> 00:28:08,410 მე შემიძლია უბრალოდ დააბრუნოს რაღაც. 484 00:28:08,410 --> 00:28:10,670 ასე შემიძლია დაბრუნების დათვი. 485 00:28:10,670 --> 00:28:12,989 >> ასე რომ, თუ x უდრის უდრის, ის დაბრუნებას აპირებს დათვი. 486 00:28:12,989 --> 00:28:14,530 წინააღმდეგ შემთხვევაში, ეს დაბრუნებას აპირებს TRUE. 487 00:28:14,530 --> 00:28:19,310 მე ასევე შეგიძლიათ ვექტორი ან მართლაც არაფერი. 488 00:28:19,310 --> 00:28:22,210 >> და ჩვეულებრივ statically აკრეფილი ენაზე, 489 00:28:22,210 --> 00:28:23,840 ნეტავ უნდა მიუთითოთ ტიპის აქ. 490 00:28:23,840 --> 00:28:25,750 და შეამჩნია, რომ მას შეუძლია უბრალოდ არაფერი. 491 00:28:25,750 --> 00:28:32,400 და R არის ჭკვიანი საკმარისი, რომ ეს უბრალოდ ამის გაკეთება და ეს იმუშავებს ჯარიმა. 492 00:28:32,400 --> 00:28:33,620 >> ნება მომეცით, განსაზღვროს ამ. 493 00:28:33,620 --> 00:28:39,460 494 00:28:39,460 --> 00:28:41,230 Unexpected-- ბოდიში. 495 00:28:41,230 --> 00:28:44,336 ეს უნდა იყოს Curly გაუწიოს აქ. 496 00:28:44,336 --> 00:28:44,836 OK. 497 00:28:44,836 --> 00:28:45,336 მაგარი. 498 00:28:45,336 --> 00:28:52,580 499 00:28:52,580 --> 00:28:54,530 ყველა უფლება. 500 00:28:54,530 --> 00:28:58,250 ახლა მოდით შედარების 3 და შეადგენს 3. 501 00:28:58,250 --> 00:29:01,860 ასე რომ უნდა დაბრუნდეს yeah-- ღირებულება დათვი. 502 00:29:01,860 --> 00:29:06,740 >> ასე რომ, ახლა უფრო ზოგადი რამ ჰგავს რაც შეეხება სხვა მონაცემთა სტრუქტურები. 503 00:29:06,740 --> 00:29:09,110 ასე რომ თქვენ გაქვთ ამ ფუნქციის. 504 00:29:09,110 --> 00:29:15,360 ეს იმუშავებს ნებისმიერ ღირებულება, როგორიცაა 3 ან ნებისმიერი რიცხვი, 505 00:29:15,360 --> 00:29:17,500 სხვა სიტყვებით რომ ვთქვათ, ორმაგი. 506 00:29:17,500 --> 00:29:19,330 >> მაგრამ რაც შეეხება რაღაც ვექტორი. 507 00:29:19,330 --> 00:29:27,750 რა მოხდება, თუ თქვენ გავაკეთოთ ასე ვარ აპირებს დაავალოს val, ვთქვათ, 4-დან 6. 508 00:29:27,750 --> 00:29:31,640 ასე რომ, თუ დავბრუნდები, ამ ვექტორული 4, 5, 6. 509 00:29:31,640 --> 00:29:34,935 >> ახლა ვნახოთ, რა მოხდება თუ ამის გაკეთება bounded.compare val. 510 00:29:34,935 --> 00:29:37,680 511 00:29:37,680 --> 00:29:42,450 ასე რომ, ეს აპირებს მოგცემთ 15 1251. 512 00:29:42,450 --> 00:29:46,440 ასე რომ, სხვა სიტყვებით რომ ვთქვათ, ის ამბობდა, თუ გადავხედავთ ამ მდგომარეობაში 513 00:29:46,440 --> 00:29:50,040 ასე რომ ამბობს x ნაკლებია მეტი ან რამე. 514 00:29:50,040 --> 00:29:51,880 ასე რომ ეს არის ოდნავ გაუგებარია, რადგან ახლა 515 00:29:51,880 --> 00:29:53,379 უბრალოდ არ ვიცი, რა ხდება. 516 00:29:53,379 --> 00:29:58,690 ამიტომ ვფიქრობ, რომ ერთი რამ, რომ ნამდვილად კარგი უბრალოდ ცდილობს გამართვის 517 00:29:58,690 --> 00:30:04,600 არის, რომ თქვენ შეგიძლიათ უბრალოდ val არის უფრო დიდი, მეტი და ვნახოთ, რა მოხდება იქ. 518 00:30:04,600 --> 00:30:09,720 >> ასე val-- სტანდარტულად 5 ასე მოდით უბრალოდ Val მეტია 5. 519 00:30:09,720 --> 00:30:14,280 ასე რომ, ეს არის ვექტორული FALSE FALSE TRUE. 520 00:30:14,280 --> 00:30:17,206 ასე რომ, ახლა, როდესაც თქვენ ეძებს ეს, ის აპირებს ვთქვა, თუ, 521 00:30:17,206 --> 00:30:20,080 და მაშინ ის გადმოგცეთ ეს არის ვექტორი FALSE FALSE TRUE. 522 00:30:20,080 --> 00:30:23,450 >> ასე რომ, როდესაც თქვენ გაიაროს ეს შევიდა R, R არ აქვს იდეა, თუ რას აკეთებს. 523 00:30:23,450 --> 00:30:26,650 იმის გამო, რომ იგი იმედოვნებს, ერთი ღირებულება, რომელიც არის ლოგიკური, და ახლა 524 00:30:26,650 --> 00:30:29,420 თქვენ ვაძლევთ მას ვექტორი Booleans. 525 00:30:29,420 --> 00:30:31,970 ასე რომ იყოს, R არის მხოლოდ ვაპირებ ვთქვა, თუ რა heck, 526 00:30:31,970 --> 00:30:35,440 მე ვაპირებ ვივარაუდოთ, რომ თქვენ აპირებს, რომ პირველი ელემენტი აქ. 527 00:30:35,440 --> 00:30:38,320 ამიტომ, მე ვაპირებ ვთქვა, მე ვაპირებ უნდა ვივარაუდოთ, რომ ეს არის მცდარი. 528 00:30:38,320 --> 00:30:40,890 ასე რომ, ის აპირებს ამბობენ არა, ეს არ არის სწორი. 529 00:30:40,890 --> 00:30:45,246 >> ანალოგიურად, ის აპირებს იყოს val უდრის უდრის. 530 00:30:45,246 --> 00:30:47,244 არა, ბოდიში 5. 531 00:30:47,244 --> 00:30:48,910 და ეს ასევე იქნება ყალბი, ასევე. 532 00:30:48,910 --> 00:30:52,410 ამიტომ აპირებს, უარი თქვას, ეს არ არის სიმართლე, ისევე, ასე, რომ ეს 533 00:30:52,410 --> 00:30:53,680 დაბრუნებას აპირებს ამ ბოლო ერთი. 534 00:30:53,680 --> 00:30:56,420 535 00:30:56,420 --> 00:31:01,360 >> ასე რომ, ეს არის ან კარგია, ან ცუდი რამ, რაც დამოკიდებულია იმაზე, თუ როგორ ჩაირთოს. 536 00:31:01,360 --> 00:31:05,104 რადგან, როდესაც თქვენ ქმნის ამ ფუნქციებს, 537 00:31:05,104 --> 00:31:06,770 თქვენ არ ვიცი რეალურად რა ხდება. 538 00:31:06,770 --> 00:31:10,210 ისე ხანდახან თქვენ მინდა შეცდომა, ან იქნებ უბრალოდ მინდა გაფრთხილება. 539 00:31:10,210 --> 00:31:12,160 ამ შემთხვევაში, R არ გაგვაჩნია. 540 00:31:12,160 --> 00:31:14,300 ასე რომ, ეს მართლაც მდე თქვენ ეფუძნება off რა 541 00:31:14,300 --> 00:31:17,310 როგორ ფიქრობთ, ენის უნდა გავაკეთოთ ამ შემთხვევაში 542 00:31:17,310 --> 00:31:22,920 თუ თქვენ გაივლის ვექტორი Booleans როდესაც თქვენ აკეთებთ თუ მდგომარეობა. 543 00:31:22,920 --> 00:31:31,733 >> ასე ვთქვათ, რომ თქვენ ჰქონდა ორიგინალური ერთი თუ სხვაგან დაბრუნების ჭეშმარიტი და თქვენ 544 00:31:31,733 --> 00:31:34,190 დაბრუნებას აპირებს FALSE. 545 00:31:34,190 --> 00:31:39,300 ასე რომ ერთი გზა abstracting ეს კი იმას ნიშნავს, რომ მე 546 00:31:39,300 --> 00:31:41,530 კი არ უნდა ამ პირობითი რამ. 547 00:31:41,530 --> 00:31:47,220 კიდევ ერთი რამ, რისი გაკეთებაც შემიძლია მხოლოდ დაბრუნების ღირებულებებს თავს. 548 00:31:47,220 --> 00:31:53,240 ასე რომ, თუ თქვენ შეამჩნევთ, თუ გავაკეთოთ val მეტია 5, 549 00:31:53,240 --> 00:31:56,350 ეს დაბრუნებას აპირებს ვექტორი FALSE FALSE TRUE. 550 00:31:56,350 --> 00:31:58,850 >> იქნებ ეს არის ის, რაც თქვენ გსურთ bounded.compare. 551 00:31:58,850 --> 00:32:02,940 გსურთ დაბრუნებას ვექტორი Booleans სადაც მას ადარებს თითოეული ღირებულებების 552 00:32:02,940 --> 00:32:04,190 საკუთარ თავს. 553 00:32:04,190 --> 00:32:11,165 ასე რომ თქვენ შეგიძლიათ უბრალოდ bounded.compare ფუნქცია x, შეადგენს 5. 554 00:32:11,165 --> 00:32:13,322 555 00:32:13,322 --> 00:32:15,363 და შემდეგ ნაცვლად აკეთებს ეს თუ სხვაგან მდგომარეობა, 556 00:32:15,363 --> 00:32:21,430 მე უბრალოდ დაბრუნებას აპირებს x მეტია 5. 557 00:32:21,430 --> 00:32:23,620 ასე რომ, თუ ეს სიმართლეა, მაშინ ის დაბრუნებას აპირებს TRUE. 558 00:32:23,620 --> 00:32:26,830 და მაშინ, თუ ის არ არის, ეს დაბრუნებას აპირებს FALSE. 559 00:32:26,830 --> 00:32:30,880 >> და ეს იმუშავებს ნებისმიერი ამ სტრუქტურებში. 560 00:32:30,880 --> 00:32:41,450 ასე, რომ შეიძლება bounded.compare გ 1 6 ან 9 და შემდეგ მე ვაპირებ ვთქვა ტოლია 6, 561 00:32:41,450 --> 00:32:42,799 მაგალითად. 562 00:32:42,799 --> 00:32:44,840 და შემდეგ ის აპირებს გაძლევთ უფლებას ლოგიკური 563 00:32:44,840 --> 00:32:48,240 ვექტორი, რომ თქვენ დიზაინის. 564 00:32:48,240 --> 00:32:50,660 >> ასე რომ, ეს უბრალოდ ფუნქციები და ახლა ნება მომეცით მხოლოდ 565 00:32:50,660 --> 00:32:54,980 გაჩვენებთ რამდენიმე ინტერაქტიული ვიზუალური. 566 00:32:54,980 --> 00:32:59,700 მე არ ვფიქრობ, რომ რეალურად აქვს Wi-Fi აქ ნება მომეცით, უბრალოდ წავიდეთ წინ 567 00:32:59,700 --> 00:33:01,970 და გამოტოვოთ ეს ერთი ვფიქრობ. 568 00:33:01,970 --> 00:33:05,260 >> მაგრამ ერთი რამ, რომ მაგარი მიუხედავად იმისა, რომ ის არის, რომ თუ თქვენ მხოლოდ 569 00:33:05,260 --> 00:33:09,600 გსურთ შეამოწმოთ რამოდენიმე სხვადასხვა მონაცემებით, ბრძანებები, 570 00:33:09,600 --> 00:33:13,320 არსებობს რამოდენიმე განსხვავებული მონაცემების რომ უკვე preloaded შევიდა R. 571 00:33:13,320 --> 00:33:15,770 ასე რომ ერთი მათგანი არის მოუწოდა iris ნაკრებს. 572 00:33:15,770 --> 00:33:18,910 ეს არის ერთ-ერთი ყველაზე ცნობილი პირობა მანქანა სწავლის. 573 00:33:18,910 --> 00:33:23,350 თქვენ, როგორც წესი, უბრალოდ გავაკეთოთ გარკვეული ტესტის, რომ თქვენი კოდი ეშვება. 574 00:33:23,350 --> 00:33:27,520 მოდით უბრალოდ შემოწმება, თუ რა iris არის. 575 00:33:27,520 --> 00:33:33,130 >> ასე რომ, ეს რამ აპირებს იყოს მონაცემების ფარგლებში. 576 00:33:33,130 --> 00:33:36,000 და ეს სახის ხანგრძლივი, რადგან მე მხოლოდ დაბეჭდილი iris. 577 00:33:36,000 --> 00:33:38,810 ეს დაბეჭდვისას მთელი რამ. 578 00:33:38,810 --> 00:33:42,830 ასე რომ ყველა ეს სხვადასხვა სახელები. 579 00:33:42,830 --> 00:33:45,505 ასე iris არის კოლექცია სხვადასხვა ყვავილები. 580 00:33:45,505 --> 00:33:48,830 ამ შემთხვევაში, ეს ეუბნება, თქვენ სახეობა ის, 581 00:33:48,830 --> 00:33:54,760 ყველა ამ სხვადასხვა widths და სიგრძის sepal და petal. 582 00:33:54,760 --> 00:33:58,880 >> და ასე, ჩვეულებრივ, თუ გსურთ ბეჭდვა iris, 583 00:33:58,880 --> 00:34:03,680 მაგალითად, თქვენ არ გინდათ ეს ყველაფერი ეს იმის გამო, რომ შეუძლია მიიღოს მეტი 584 00:34:03,680 --> 00:34:05,190 თქვენი კონსოლი. 585 00:34:05,190 --> 00:34:09,280 ასე რომ, ერთი რამ, რომ ნამდვილად ლამაზი არის ხელმძღვანელი ფუნქცია. 586 00:34:09,280 --> 00:34:12,929 ასე რომ, თუ თქვენ უბრალოდ უფროსი iris, ეს მოგცემთ 587 00:34:12,929 --> 00:34:17,389 პირველ ხუთ რიგები, ან ექვსი ვფიქრობ. 588 00:34:17,389 --> 00:34:19,909 და მაშინ კარგად, თქვენ შეგიძლიათ უბრალოდ მიუთითოთ აქ. 589 00:34:19,909 --> 00:34:22,914 ასე 20-- ეს მისცემს თქვენ პირველი 20 რიგები. 590 00:34:22,914 --> 00:34:24,830 და მე რეალურად იყო სახის გაკვირვებული, რომ ეს 591 00:34:24,830 --> 00:34:28,770 მომცა ექვსი ნება მომეცით წავიდეთ წინ და შემოწმება iris-- ან ხელმძღვანელი, უკაცრავად. 592 00:34:28,770 --> 00:34:31,699 593 00:34:31,699 --> 00:34:34,960 და აქ მისცემს თქვენ დოკუმენტაცია 594 00:34:34,960 --> 00:34:37,960 რა მნიშვნელობა ხელმძღვანელი აკეთებს. 595 00:34:37,960 --> 00:34:40,839 ამიტომ დააბრუნებს პირველი ან ბოლო ობიექტი. 596 00:34:40,839 --> 00:34:42,630 და შემდეგ მე ვაპირებ შევხედოთ დეფოლტის. 597 00:34:42,630 --> 00:34:47,340 და მერე ამბობს ნაგულისხმები მეთოდი ხელმძღვანელი x და n უდრის 6L. 598 00:34:47,340 --> 00:34:50,620 ასე რომ, ეს დააბრუნებს პირველი ექვსი ელემენტები. 599 00:34:50,620 --> 00:34:55,050 და ანალოგიურად, თუ თქვენ შეამჩნევთ აქ, მე არ უნდა მიუთითოთ n უდრის 6. 600 00:34:55,050 --> 00:34:56,840 იყოს იგი იყენებს ექვსი, ვფიქრობ. 601 00:34:56,840 --> 00:35:00,130 და მაშინ, თუ მინდა მიუთითოთ გარკვეული ღირებულება, მაშინ შემიძლია, რომ ისევე. 602 00:35:00,130 --> 00:35:02,970 603 00:35:02,970 --> 00:35:10,592 >> ასე რომ, არის რამდენიმე მარტივი ბრძანებები და აქ არის კიდევ ერთი, რომ just-- კარგად, 604 00:35:10,592 --> 00:35:12,550 მე can-- ეს არის რეალურად ცოტა უფრო რთული, 605 00:35:12,550 --> 00:35:17,130 მაგრამ ეს მხოლოდ მიიღოს კლასი ყოველი სვეტი iris ნაკრებს. 606 00:35:17,130 --> 00:35:20,910 ასე რომ, ეს გამოჩნდება, თუ რა თითოეული ეს სვეტების თვალსაზრისით მათი ტიპის. 607 00:35:20,910 --> 00:35:23,665 ასე sepal სიგრძე რიცხვითი, sepal სიგანე numeric. 608 00:35:23,665 --> 00:35:26,540 ყველა ამ ფასეულობების უბრალოდ რიცხვითი იმიტომ, რომ თქვენ შეუძლია თქვას, ეს მონაცემები 609 00:35:26,540 --> 00:35:29,440 სტრუქტურა ეს არის ყველა აპირებს numeric. 610 00:35:29,440 --> 00:35:34,310 >> და სახეობების სვეტი იქნება ფაქტორი. 611 00:35:34,310 --> 00:35:37,270 ასე რომ, ჩვეულებრივ, თქვენ ფიქრობთ, რომ ეს არის, როგორც ხასიათი სტრიქონი. 612 00:35:37,270 --> 00:35:48,830 მაგრამ თუ უბრალოდ irisSpecies, და შემდეგ მე ვაპირებ გავაკეთოთ ხელმძღვანელი 5, 613 00:35:48,830 --> 00:35:51,820 და ამ აპირებს ბეჭდვა out პირველი ხუთი ღირებულებებს. 614 00:35:51,820 --> 00:35:54,150 >> და შემდეგ შეამჩნევთ ამ დონეზე. 615 00:35:54,150 --> 00:35:58,870 ასე რომ, ეს saying-- ეს არის R გზა მქონე კატეგორიული ცვლადები. 616 00:35:58,870 --> 00:36:03,765 ასე რომ ნაცვლად მხოლოდ რომელსაც ხასიათის სტრიქონები, 617 00:36:03,765 --> 00:36:06,740 მას აქვს დონის მითითებით რომელიც ამ რამ. 618 00:36:06,740 --> 00:36:12,450 >> ასე ვთქვათ irisSpecies 1. 619 00:36:12,450 --> 00:36:17,690 ასე რომ, რა გსურთ აქ არის მე ვარ subsetting ამ სახეობების სვეტი. 620 00:36:17,690 --> 00:36:21,480 ასე რომ, ეს იღებს სახეობა, სვეტი და შემდეგ 621 00:36:21,480 --> 00:36:23,820 ეს ინდექსები მისაღებად პირველ ელემენტს. 622 00:36:23,820 --> 00:36:27,140 ასე რომ, ეს უნდა გადმოგცეთ setosa. 623 00:36:27,140 --> 00:36:28,710 და ასევე გაძლევთ დონეზე აქ. 624 00:36:28,710 --> 00:36:32,812 >> ასე რომ თქვენ ასევე შეგიძლიათ შეადაროთ ეს ხასიათი setosa 625 00:36:32,812 --> 00:36:34,645 და ეს არ აპირებს უნდა იყოს ჭეშმარიტი, რადგან ერთი 626 00:36:34,645 --> 00:36:37,940 არის სხვადასხვა ტიპის, ვიდრე სხვა. 627 00:36:37,940 --> 00:36:40,590 ან მე ვფიქრობ, რომ ეს მართლაც ასეა, რადგან R უფრო ჭკვიანი, ვიდრე. 628 00:36:40,590 --> 00:36:45,420 და ის უყურებს და შემდეგ ამბობს, იქნებ ეს არის ის, რაც გსურთ. 629 00:36:45,420 --> 00:36:51,860 ასე რომ, ის აპირებს ამბობენ ხასიათი string setosa არის იგივე როგორც ეს ერთი. 630 00:36:51,860 --> 00:37:01,290 და მაშინ ანალოგიურად, შეგიძლიათ ასევე უბრალოდ აითვისებდა ამ როგორიცაა ასე შემდეგ. 631 00:37:01,290 --> 00:37:05,580 >> ასე რომ, ეს მხოლოდ გარკვეული სწრაფი ბრძანებები ნაკრებს. 632 00:37:05,580 --> 00:37:08,030 ასე რომ, აქ ზოგიერთი მონაცემების მოძიება. 633 00:37:08,030 --> 00:37:11,360 ასე რომ, ეს ცოტა მეტი ჩართული მონაცემების ანალიზი. 634 00:37:11,360 --> 00:37:18,340 და ეს არის აღებული ზოგიერთი bootcamp in R წელს Berkeley. 635 00:37:18,340 --> 00:37:20,790 >> ასე ბიბლიოთეკა უცხო. 636 00:37:20,790 --> 00:37:24,880 ამიტომ, მე ვაპირებ ჩატვირთვა ბიბლიოთეკა, რომელიც ე.წ. უცხო. 637 00:37:24,880 --> 00:37:32,460 ასე რომ, ეს აპირებს მომეცი read.dta ამიტომ ვარაუდობენ, რომ მე ამ ნაკრებს. 638 00:37:32,460 --> 00:37:39,000 ამ ინახება მიმდინარე სამუშაო დირექტორია ჩემი კონსოლი. 639 00:37:39,000 --> 00:37:42,190 მოდით უბრალოდ ვნახოთ, რა სამუშაო დირექტორია. 640 00:37:42,190 --> 00:37:44,620 >> ასე რომ, აქ არის ჩემი სამუშაო დირექტორია. 641 00:37:44,620 --> 00:37:50,040 და წაიკითხეთ dot მონაცემებით, ამ რამ, განაცხადა, რომ ეს ფაილი 642 00:37:50,040 --> 00:37:54,650 მდებარეობს მონაცემები საქაღალდეში მიმდინარე სამუშაო დირექტორია. 643 00:37:54,650 --> 00:38:00,520 და read.dta ეს არ არის ნაგულისხმები ბრძანება. 644 00:38:00,520 --> 00:38:02,760 ვფიქრობ, მე დატვირთული ეს უკვე. 645 00:38:02,760 --> 00:38:04,750 Iei ვივარაუდოთ, მე დატვირთული ეს უკვე. 646 00:38:04,750 --> 00:38:08,115 >> მაგრამ ასე read.dta არ აპირებს იყოს ძირითადად ბრძანება. 647 00:38:08,115 --> 00:38:11,550 და ამიტომაც ვაპირებთ აქვს ჩატვირთვა ამ ბიბლიოთეკაში package-- 648 00:38:11,550 --> 00:38:14,500 ეს პაკეტი მოუწოდა უცხოელ. 649 00:38:14,500 --> 00:38:16,690 და თუ არ აქვს პაკეტი, მე ვფიქრობ, 650 00:38:16,690 --> 00:38:19,180 საგარეო ერთ-ერთი ჩაშენებული პირობა. 651 00:38:19,180 --> 00:38:31,150 წინააღმდეგ შემთხვევაში, შეგიძლიათ ასევე გავაკეთოთ install.packages 652 00:38:31,150 --> 00:38:33,180 და ეს იქნება დააყენოთ პაკეტი. 653 00:38:33,180 --> 00:38:36,878 და ეს მოგცემთ R. Uh, არა. 654 00:38:36,878 --> 00:38:39,830 655 00:38:39,830 --> 00:38:43,140 და მაშინ მე უბრალოდ აპირებს შეწყვიტოს ეს იმიტომ, რომ მე უკვე აქვს. 656 00:38:43,140 --> 00:38:46,920 >> მაგრამ რა მართლაც ლამაზი შესახებ R ის არის, რომ პაკეტი მართვა 657 00:38:46,920 --> 00:38:48,510 სისტემა არის ძალიან ელეგანტური. 658 00:38:48,510 --> 00:38:52,470 იმიტომ, რომ ეს შესანახად ყველაფერი მართლაც ლამაზად თქვენთვის. 659 00:38:52,470 --> 00:38:59,780 ასე რომ, ამ შემთხვევაში, ის აპირებს შესანახად მას, მე მჯერა, რომ ეს ბიბლიოთეკა აქ. 660 00:38:59,780 --> 00:39:02,390 >> ასე რომ ნებისმიერ დროს გსურთ დააყენოთ ახალი პაკეტი, 661 00:39:02,390 --> 00:39:04,980 ეს ისეთივე მარტივია, როგორც აკეთებს install.packages 662 00:39:04,980 --> 00:39:07,500 და R შეძლებს ყველა პაკეტების თქვენთვის. 663 00:39:07,500 --> 00:39:12,900 ასე რომ თქვენ არ უნდა გავაკეთოთ რაღაც Python, სადაც თქვენ უნდა გარე პაკეტი 664 00:39:12,900 --> 00:39:15,330 მენეჯერები, როგორიცაა ქაღალდი Anaconda, სადაც თქვენ 665 00:39:15,330 --> 00:39:18,310 აკეთებს თქვენ დააყენოთ პაკეტების გარეთ Python 666 00:39:18,310 --> 00:39:20,940 და მაშინ ცდილობენ აწარმოებს მათ თავს. 667 00:39:20,940 --> 00:39:22,210 ასე რომ, ეს მართლაც ლამაზი გზა. 668 00:39:22,210 --> 00:39:25,590 >> და install.packages მოითხოვს ინტერნეტით. 669 00:39:25,590 --> 00:39:31,950 ის იღებს სერვერზე და საცავი, 670 00:39:31,950 --> 00:39:33,960 აგროვებს ყველა პაკეტები ეწოდება Cran. 671 00:39:33,960 --> 00:39:40,690 და თქვენ შეგიძლიათ მიუთითოთ, თუ რა სახის სარკე გსურთ ჩამოტვირთოთ პაკეტები. 672 00:39:40,690 --> 00:39:43,420 >> ასე რომ, აქ ვიღებ ამ ნაკრებს. 673 00:39:43,420 --> 00:39:46,240 მე კითხულობს ის გამოყენებით ამ ფუნქციას. 674 00:39:46,240 --> 00:39:49,360 ნება მომეცით წავიდეთ წინ და ამის გაკეთება. 675 00:39:49,360 --> 00:39:52,900 >> მოდით ვივარაუდოთ, რომ თქვენ გაქვთ ეს ნაკრებს 676 00:39:52,900 --> 00:39:55,550 და თქვენ აბსოლუტურად არ ვიცი, რა არის ეს. 677 00:39:55,550 --> 00:39:58,560 და ეს რეალურად მოდის საკმაოდ ხშირად ინდუსტრიაში 678 00:39:58,560 --> 00:40:00,910 სადაც თქვენ უბრალოდ უნდა ეს ტონა და ტონა ბინძურ რამ 679 00:40:00,910 --> 00:40:02,890 და ისინი ძალიან unlabeled. 680 00:40:02,890 --> 00:40:06,380 ასე რომ აქ მაქვს ეს ნაკრებს და მე არ ვიცი, 681 00:40:06,380 --> 00:40:08,400 რა არის ასე ვარ ნაჩვენებია შეამოწმეთ იგი out. 682 00:40:08,400 --> 00:40:10,620 >> ამიტომ, მე ვაპირებ გავაკეთოთ ხელმძღვანელი პირველი. 683 00:40:10,620 --> 00:40:14,190 ასე რომ, მე შეამოწმოთ პირველი ექვსი სვეტები, რაც ამ ნაკრებს არის. 684 00:40:14,190 --> 00:40:21,730 ასე რომ ეს არის სახელმწიფო, pres04 და შემდეგ ყველა ამ სხვადასხვა სახის სვეტები. 685 00:40:21,730 --> 00:40:25,612 და რა არის საინტერესო აქ, ვფიქრობ, ის არის, რომ თქვენ 686 00:40:25,612 --> 00:40:27,945 რომ ვივარაუდოთ, რომ ეს გამოიყურება როგორიცაა გარკვეული არჩევნებში. 687 00:40:27,945 --> 00:40:30,482 688 00:40:30,482 --> 00:40:32,190 და ვფიქრობ, მხოლოდ ეხლა ეძებს ფაილი 689 00:40:32,190 --> 00:40:41,070 სახელი ეს გარკვეული კოლექცია მონაცემები კანდიდატების ან ამომრჩევლების 690 00:40:41,070 --> 00:40:44,920 ვინც ხმა მისცა კონკრეტული პრეზიდენტები ან პრეზიდენტის კანდიდატები 691 00:40:44,920 --> 00:40:46,550 2004 წლის არჩევნებისთვის. 692 00:40:46,550 --> 00:40:52,920 >> ასე რომ აქ არის ღირებულებების 1, 2 ასე რომ, ერთი გზა შენახვის 693 00:40:52,920 --> 00:40:56,540 პრეზიდენტის კანდიდატები მათი სახელები. 694 00:40:56,540 --> 00:40:59,780 ამ შემთხვევაში, როგორც ჩანს, ისინი უბრალოდ რიცხვი ღირებულებებს. 695 00:40:59,780 --> 00:41:04,030 ასე, 2004 წელს ეს იყო ბუშის წინააღმდეგ კერი მე მჯერა. 696 00:41:04,030 --> 00:41:09,010 და ახლა, ვთქვათ თქვენ უბრალოდ არ ვიცი თუ არა 1 შეესაბამება ბუშის ან 2 697 00:41:09,010 --> 00:41:11,703 შეესაბამება Kerry ან და ასე შემდეგ და ასე შემდეგ, არა? 698 00:41:11,703 --> 00:41:15,860 >> და ეს არის, უბრალოდ, ჩემთვის, საკმაოდ გავრცელებული პრობლემაა. 699 00:41:15,860 --> 00:41:18,230 რა შეგიძლიათ გააკეთოთ ამ შემთხვევაში? 700 00:41:18,230 --> 00:41:20,000 მოდით შევამოწმოთ ყველა ამ სხვა რამ. 701 00:41:20,000 --> 00:41:22,790 >> სახელმწიფო, მე თუ ვთქვათ ეს მოდის სხვადასხვა ქვეყნებში. 702 00:41:22,790 --> 00:41:25,100 partyid, შემოსავალი. 703 00:41:25,100 --> 00:41:27,710 მოდით შევხედოთ partyid. 704 00:41:27,710 --> 00:41:32,800 ასე რომ, შესაძლოა, ერთი რამ შეგიძლიათ გააკეთოთ შევხედოთ თითოეული დაკვირვებები 705 00:41:32,800 --> 00:41:36,250 რომ აქვს partyid რესპუბლიკური ან დემოკრატი ან რამე. 706 00:41:36,250 --> 00:41:38,170 მოდით უბრალოდ შეხედეთ რა partyid არის. 707 00:41:38,170 --> 00:41:41,946 >> ასე რომ, მე ვაპირებ dat და შემდეგ მე ვაპირებ 708 00:41:41,946 --> 00:41:47,960 გავაკეთოთ ეს დოლარის ნიშანი ოპერატორი, რომელიც მე ადრე 709 00:41:47,960 --> 00:41:50,770 და ამ აპირებს subset რომ სვეტი. 710 00:41:50,770 --> 00:41:57,760 და შემდეგ მე ვაპირებ უხელმძღვანელებს ამ 20, უბრალოდ, რა ამ ჰგავს. 711 00:41:57,760 --> 00:42:00,170 >> ასე რომ, ეს მხოლოდ რამოდენიმე NAS. 712 00:42:00,170 --> 00:42:02,800 ასე რომ, სხვა სიტყვებით, თქვენ უნდა დაკარგული მონაცემების შესახებ ამ ბიჭებს. 713 00:42:02,800 --> 00:42:08,100 მაგრამ თქვენ ასევე შეამჩნია ეს dat partyid არის ფაქტორი 714 00:42:08,100 --> 00:42:10,030 ასე რომ, ეს გაძლევთ სხვადასხვა კატეგორიები. 715 00:42:10,030 --> 00:42:14,170 ასე რომ, სხვა სიტყვებით რომ ვთქვათ, partyid შეუძლია დემოკრატი, რესპუბლიკური, დამოუკიდებელი, 716 00:42:14,170 --> 00:42:16,640 ან რაღაც. 717 00:42:16,640 --> 00:42:23,940 >> მოდით წავიდეთ წინ და მოდით ვნახოთ, რომელიც ამ is-- oh, OK. 718 00:42:23,940 --> 00:42:28,480 ასე რომ, მე ვაპირებ subset to partyid და შემდეგ 719 00:42:28,480 --> 00:42:32,780 შევხედოთ რაც პირობა არის დემოკრატი, მაგალითად. 720 00:42:32,780 --> 00:42:37,150 ამ აპირებს მოგცემთ ლოგიკური, დიდი ლოგიკური of Trues და FALSEs. 721 00:42:37,150 --> 00:42:41,630 >> და ახლა, ვთქვათ, მინდა to subset ამ ბიჭებს. 722 00:42:41,630 --> 00:42:47,260 ასე რომ, ეს აპირებს ჩემი dat და subset რომელი დაკვირვების 723 00:42:47,260 --> 00:42:48,910 აქვს partyid ტოლია ტოლია დემოკრატი. 724 00:42:48,910 --> 00:42:52,830 725 00:42:52,830 --> 00:42:55,180 და ეს არის საკმაოდ ხანგრძლივი, რადგან არსებობს ძალიან ბევრი მათგანი. 726 00:42:55,180 --> 00:42:59,060 ასე რომ, ახლა, მე ვაპირებ უხელმძღვანელებს ამ 20. 727 00:42:59,060 --> 00:43:05,690 728 00:43:05,690 --> 00:43:11,270 >> და თქვენ შეამჩნევთ, შეადგენს შეადგენს საინტერესოა, რომ თქვენ 729 00:43:11,270 --> 00:43:13,250 already-- თქვენ ასევე მათ შორის NAS. 730 00:43:13,250 --> 00:43:19,010 ასე რომ, ამ შემთხვევაში, თქვენ მაინც ვერ ნებისმიერი ინფორმაცია, რადგან ახლა თქვენ გაქვთ Nas 731 00:43:19,010 --> 00:43:22,650 და თქვენ უბრალოდ უნდა, თუ რომელი სადამკვირვებლო შეესაბამება დემოკრატი 732 00:43:22,650 --> 00:43:24,670 და არა ამ დაკარგული აფასებს საკუთარ თავს. 733 00:43:24,670 --> 00:43:27,680 ისე როგორ იქნებოდა თქვენ დავაღწიოთ ამ Nas? 734 00:43:27,680 --> 00:43:36,410 >> ასე რომ, აქ მე უბრალოდ გამოყენებით up გასაღები ჩემს კურსორი და თქვა მოძრაობდნენ. 735 00:43:36,410 --> 00:43:39,778 და მერე აქ მე უბრალოდ აპირებს ვთქვა is.na datpartyid. 736 00:43:39,778 --> 00:43:48,970 737 00:43:48,970 --> 00:43:52,720 ასე რომ, ეს და და მიიღებს ორი სხვადასხვა ლოგიკური ვექტორები 738 00:43:52,720 --> 00:43:57,160 და აცხადებენ, რომ ეს იქნება ჭეშმარიტი და ცრუ მაგალითად. 739 00:43:57,160 --> 00:43:59,190 ასე რომ, ის აპირებს ამის გაკეთებას კომპონენტი ბრძენი. 740 00:43:59,190 --> 00:44:02,910 ასე რომ, აქ მე ვამბობ, მიიღოს მონაცემები ჩარჩო, subset 741 00:44:02,910 --> 00:44:10,170 პირობა, რომელიც შეესაბამება დემოკრატი, და წაშალოს ნებისმიერი მათგანი, რომლებიც არ არიან NA. 742 00:44:10,170 --> 00:44:13,540 >> ასე რომ, ეს will-- უნდა მოგაწვდით რაღაც. 743 00:44:13,540 --> 00:44:16,540 744 00:44:16,540 --> 00:44:17,600 ვნახოთ, is.na. 745 00:44:17,600 --> 00:44:24,670 746 00:44:24,670 --> 00:44:27,690 მოდით ცდილობენ is.na datpartyid. 747 00:44:27,690 --> 00:44:36,290 748 00:44:36,290 --> 00:44:45,290 და ეს უნდა მისცეს თქვენგანი ბოდიში უბრალოდ ლოგიკური ვექტორი. 749 00:44:45,290 --> 00:44:49,260 და მაშინ, იმიტომ რომ ამდენი ხანი, მე ვაპირებ subset 20. 750 00:44:49,260 --> 00:44:49,760 OK. 751 00:44:49,760 --> 00:44:51,570 ასე რომ, ეს უნდა იმუშაოს. 752 00:44:51,570 --> 00:44:54,700 >> და ეს ასე იქნება Trues. 753 00:44:54,700 --> 00:45:01,830 Ah, ჩემი შეცდომა ის არის, რომ I'm-- I გამოყენება C ++ და R interchangeably ისე მე 754 00:45:01,830 --> 00:45:03,590 ეს შეცდომა ყველა დროის. 755 00:45:03,590 --> 00:45:05,807 და ოპერატორი რეალურად გსურთ. 756 00:45:05,807 --> 00:45:08,140 თქვენ არ გსურთ გამოიყენოთ ორი ampersands, მხოლოდ ერთი. 757 00:45:08,140 --> 00:45:14,970 758 00:45:14,970 --> 00:45:17,010 OK. 759 00:45:17,010 --> 00:45:18,140 >> ასე რომ, ვნახოთ. 760 00:45:18,140 --> 00:45:20,930 761 00:45:20,930 --> 00:45:23,920 ასე რომ, ჩვენ subsetted რომ partyid სადაც ისინი დემოკრატი 762 00:45:23,920 --> 00:45:25,300 და ისინი არ დაკარგული ღირებულებების. 763 00:45:25,300 --> 00:45:27,690 და ახლა მოდით შევხედოთ რომელიც პირობა მისცა ხმა. 764 00:45:27,690 --> 00:45:31,530 ასე რომ, როგორც ჩანს, ყველაზე მისცემდა ხმას 1. 765 00:45:31,530 --> 00:45:36,090 ამიტომ, მე ვაპირებ წავიდეთ წინ და ვთქვათ, რომ არის კერი. 766 00:45:36,090 --> 00:45:39,507 >> და ანალოგიურად, თქვენ შეგიძლიათ აგრეთვე რესპუბლიკური 767 00:45:39,507 --> 00:45:41,090 და იმედია, ეს უნდა მოგაწვდით 2. 768 00:45:41,090 --> 00:45:49,730 769 00:45:49,730 --> 00:45:51,770 ეს მხოლოდ bunch სხვადასხვა სვეტები. 770 00:45:51,770 --> 00:45:53,070 და მართლაც, ეს 2. 771 00:45:53,070 --> 00:45:55,750 ასე partyid ყველა რესპუბლიკური, მათი უმრავლესობა ხმას 2. 772 00:45:55,750 --> 00:45:58,390 >> ასე რომ, როგორც ჩანს, ისევე, მიერ ეძებს ამ, 773 00:45:58,390 --> 00:46:00,600 რესპუბლიკური იქნება very-- ან partyid 774 00:46:00,600 --> 00:46:02,790 იქნება ძალიან დიდი ფაქტორი განმსაზღვრელი 775 00:46:02,790 --> 00:46:05,420 რომელ კანდიდატს ისინი აპირებს ხმის მიცემას. 776 00:46:05,420 --> 00:46:07,120 და ეს არის აშკარად მართალია ზოგადად. 777 00:46:07,120 --> 00:46:10,139 და ეს შეესაბამება თქვენი ინტუიცია, რა თქმა უნდა. 778 00:46:10,139 --> 00:46:11,930 ასე რომ, როგორც ჩანს, როგორიც მე ვარ გადის დრო ასე 779 00:46:11,930 --> 00:46:17,040 ნება მომეცით უბრალოდ უნდა წავიდეთ წინ და აჩვენებს რამოდენიმე სწრაფი images. 780 00:46:17,040 --> 00:46:21,120 ასე რომ, აქ არის რაღაც, რომ ოდნავ უფრო რთული ვიზუალიზაცია. 781 00:46:21,120 --> 00:46:26,450 ასე რომ, ამ შემთხვევაში, ეს არის ძალიან მარტივი ანალიზი მხოლოდ შემოწმების რა 782 00:46:26,450 --> 00:46:28,500 პრეზიდენტი '04 არის. 783 00:46:28,500 --> 00:46:33,920 >> ასე რომ, ამ შემთხვევაში, ვთქვათ თქვენ სურდა ამ კითხვაზე პასუხი. 784 00:46:33,920 --> 00:46:38,540 ამიტომ ვარაუდობენ, გვინდოდა ვიცი ხმის მიცემის ქცევა 2004 პრეზიდენტის არჩევნები 785 00:46:38,540 --> 00:46:41,170 და როგორ, რომ მერყეობს რასის. 786 00:46:41,170 --> 00:46:44,380 ასე არა მხოლოდ გინდათ ვხედავ საარჩევნო ქცევის, 787 00:46:44,380 --> 00:46:47,860 მაგრამ გსურთ subset თითოეული რასის და ერთგვარი შეჯამება რომ. 788 00:46:47,860 --> 00:46:50,770 და თქვენ შეგიძლიათ მხოლოდ გითხრათ, ამ რთული notation 789 00:46:50,770 --> 00:46:52,580 რომ ეს არის სახის მიღების hazy. 790 00:46:52,580 --> 00:46:56,390 >> ასე რომ, ერთი მოწინავე R პაკეტი, რომელიც ასევე სახის ბოლო 791 00:46:56,390 --> 00:47:00,070 ეწოდება dplyr. 792 00:47:00,070 --> 00:47:03,060 ასე რომ ამ ერთი უფლება აქ. 793 00:47:03,060 --> 00:47:08,080 და ggg-- ggplot2 მხოლოდ ლამაზი გზა აკეთებს უკეთესი თვალსაჩინოება 794 00:47:08,080 --> 00:47:09,400 ვიდრე ჩაშენებული ერთი. 795 00:47:09,400 --> 00:47:11,108 >> ამიტომ, მე ვაპირებ ჩატვირთვა ამ ორ ბიბლიოთეკას. 796 00:47:11,108 --> 00:47:13,200 797 00:47:13,200 --> 00:47:16,950 და მერე, მე ვაპირებ წავიდეთ წინ და აწარმოებს ამ ბრძანებას. 798 00:47:16,950 --> 00:47:19,050 თქვენ შეგიძლიათ მხოლოდ ჩათვალოს როგორც შავი ყუთი. 799 00:47:19,050 --> 00:47:23,460 >> რა ხდება არის ის, რომ ეს მილსადენი ოპერატორი გავლის ეს არგუმენტი 800 00:47:23,460 --> 00:47:24,110 შევიდა აქ. 801 00:47:24,110 --> 00:47:28,070 ამიტომ მე ვამბობ ჯგუფი dat რასის და შემდეგ პრეზიდენტი 04. 802 00:47:28,070 --> 00:47:31,530 და შემდეგ, ყველა ეს სხვა ბრძანებები ფილტრაცია და მაშინ შემაჯამებელი 803 00:47:31,530 --> 00:47:34,081 სადაც მე ვაკეთებ რაოდენობა და მაშინ მე შეთქმულება აქ. 804 00:47:34,081 --> 00:47:39,980 805 00:47:39,980 --> 00:47:42,500 OK cool. 806 00:47:42,500 --> 00:47:44,620 მოდით წავიდეთ წინ და ვნახოთ, რა ამ ჰგავს. 807 00:47:44,620 --> 00:47:52,280 808 00:47:52,280 --> 00:47:57,290 >> ასე, რა ხდება აქ არის ის, რომ მე მხოლოდ პროპაგანდისტულ თითოეული რასის და შემდეგ 809 00:47:57,290 --> 00:47:59,670 რომელიც პირობა მისცა ხმა. 810 00:47:59,670 --> 00:48:03,492 და ეს ორი სხვადასხვა ღირებულებების შეესაბამება 2 და 1. 811 00:48:03,492 --> 00:48:05,325 თუ გვინდა, რომ იყოს უფრო ელეგანტური, ასევე შეგიძლიათ 812 00:48:05,325 --> 00:48:11,770 მხოლოდ დააკონკრეტა, რომ 2 Kerry-- ან 2 ბუში და შემდეგ 1 კერი. 813 00:48:11,770 --> 00:48:13,700 და ასევე შეგიძლიათ აქვს რომ თქვენს ლეგენდა. 814 00:48:13,700 --> 00:48:17,410 >> და ასევე შეგიძლიათ გაყოფილი ამ ბარი გრაფიკების. 815 00:48:17,410 --> 00:48:19,480 რადგან ერთი რამ რომ, თუ თქვენ შეამჩნევთ, 816 00:48:19,480 --> 00:48:24,560 ეს არ არის ძალიან ადვილი იდენტიფიკაცია რომელიც ამ ორი ღირებულებები უფრო დიდი. 817 00:48:24,560 --> 00:48:27,920 ასე რომ ერთი რამ მინდა მინდა არის მიიღოს ეს ლურჯი ნაკვეთი 818 00:48:27,920 --> 00:48:31,855 და მხოლოდ გადატანა მეტი აქ, ასე რომ თქვენ შეგიძლიათ შეადაროთ ეს ორი გვერდით. 819 00:48:31,855 --> 00:48:34,480 და ვფიქრობ, რომ ეს რაღაც მე არ გაქვთ დრო, რომ ახლა, 820 00:48:34,480 --> 00:48:36,660 მაგრამ ეს ასევე არის ძალიან ადვილია. 821 00:48:36,660 --> 00:48:40,310 შეგიძლიათ უბრალოდ შესასწავლად კაცი გვერდებზე ggplot. 822 00:48:40,310 --> 00:48:47,170 ასე რომ თქვენ შეგიძლიათ უბრალოდ ggplot, როგორიცაა რომ და წაიკითხავს ამ კაცს გვერდზე. 823 00:48:47,170 --> 00:48:51,920 >> ნება მომეცით, უბრალოდ სწრაფად გაჩვენებთ რამდენიმე მაგარი რამ. 824 00:48:51,920 --> 00:48:57,610 მოდით წავიდეთ წინ და რომელთა მიზანია მხოლოდ გამოყენების მანქანა სწავლის. 825 00:48:57,610 --> 00:49:02,450 ასე ვთქვათ ჩვენ გვაქვს ეს სამი პაკეტი, ასე რომ მე ვაპირებ ჩატვირთვა ამ წელს. 826 00:49:02,450 --> 00:49:05,500 827 00:49:05,500 --> 00:49:09,170 ასე რომ, ეს უბრალოდ ბეჭდავს out ზოგიერთი ინფორმაცია შემდეგ მე დატვირთული რამ. 828 00:49:09,170 --> 00:49:15,220 ასე რომ, მე ამას ვამბობ read.csv, ამ ნაკრებს, და ახლა 829 00:49:15,220 --> 00:49:18,940 მე ვაპირებ წავიდეთ წინ და შეხედეთ და ვნახოთ, რა არის შიგნით ამ ნაკრებს. 830 00:49:18,940 --> 00:49:22,080 >> ასე რომ, პირველი 20 დაკვირვებები. 831 00:49:22,080 --> 00:49:27,190 ამიტომ უბრალოდ უნდა X1, X2, და Y. ასე რომ როგორც ჩანს, bunch ამ ფასეულობების 832 00:49:27,190 --> 00:49:31,640 დაწყებული შესაძლოა 20-დან 80 ან იმდენად. 833 00:49:31,640 --> 00:49:37,700 და მაშინ ანალოგიურად for X2 და შემდეგ ამ Y ჩანს ეტიკეტები 0 და 1. 834 00:49:37,700 --> 00:49:49,500 >> გადაამოწმონ ამ, მე შემიძლია მხოლოდ ამის შემაჯამებელი მონაცემები X1. 835 00:49:49,500 --> 00:49:51,660 და მაშინ ანალოგიურად for ყველა ეს სხვა სვეტები. 836 00:49:51,660 --> 00:49:55,300 ასე შემაჯამებელი არის სწრაფი გზა უბრალოდ გვიჩვენებს თქვენ სწრაფი ღირებულებებს. 837 00:49:55,300 --> 00:49:56,330 ოჰ, უკაცრავად. 838 00:49:56,330 --> 00:49:58,440 ეს უნდა იყოს Y. 839 00:49:58,440 --> 00:50:03,420 >> ასე რომ, ამ შემთხვევაში, იძლევა quantiles, medians, maxes ასევე. 840 00:50:03,420 --> 00:50:07,130 ამ შემთხვევაში, dataY, ხედავთ რომ ის უბრალოდ იქნება 0 და 1. 841 00:50:07,130 --> 00:50:10,100 ასევე საშუალო ამბობს 0.6, მხოლოდ იმას ნიშნავს, რომ ეს 842 00:50:10,100 --> 00:50:13,380 როგორც ჩანს, როგორიც მე უფრო 1s, ვიდრე 0S. 843 00:50:13,380 --> 00:50:16,160 >> ნება მომეცით წავიდეთ წინ და შოუ თქვენ რა ამ ჰგავს. 844 00:50:16,160 --> 00:50:17,470 ასე რომ მე უბრალოდ აპირებს მონიშვნას. 845 00:50:17,470 --> 00:50:22,852 846 00:50:22,852 --> 00:50:24,636 ვნახოთ, როგორ გარკვევა ამ. 847 00:50:24,636 --> 00:50:30,492 848 00:50:30,492 --> 00:50:31,468 Oh OK. 849 00:50:31,468 --> 00:50:35,840 850 00:50:35,840 --> 00:50:36,340 OK. 851 00:50:36,340 --> 00:50:37,590 >> ასე რომ, ეს არის ის, რაც ჰგავს. 852 00:50:37,590 --> 00:50:46,310 ასე რომ, როგორც ჩანს, ყვითელი I მითითებული როგორც 0, და შემდეგ წითელი I მითითებული, როგორც 1s. 853 00:50:46,310 --> 00:50:52,190 ასე რომ, აქ ჰგავს ეტიკეტების რაოდენობა და ეს 854 00:50:52,190 --> 00:50:56,410 როგორც ჩანს, უბრალოდ სურდა სახის კლასტერული ამ. 855 00:50:56,410 --> 00:51:01,020 >> და ნება მომეცით უბრალოდ წავიდეთ წინ და შოუ თქვენ ზოგიერთი ჩაშენებული ფუნქციები. 856 00:51:01,020 --> 00:51:03,580 ასე რომ აქ არის lm. 857 00:51:03,580 --> 00:51:06,060 ასე რომ, ეს უბრალოდ ცდილობს შეესაბამება ხაზი, რომ ეს. 858 00:51:06,060 --> 00:51:08,640 ასე რომ, რა არის საუკეთესო გზა რომ შემიძლია ჯდება ხაზი, როგორიცაა 859 00:51:08,640 --> 00:51:14,020 რომ ეს იქნება საუკეთესო გამოყოფა ამ სახის კლასტერული. 860 00:51:14,020 --> 00:51:21,790 და იდეალურად, შეგიძლიათ უბრალოდ ნახეთ რომ მე უბრალოდ აწარმოებს ყველა ეს ბრძანებები 861 00:51:21,790 --> 00:51:25,450 და მაშინ, მე ვაპირებ წინ და დაამატოთ ხაზი. 862 00:51:25,450 --> 00:51:28,970 >> ასე რომ, ეს, როგორც ჩანს, საუკეთესო ვხვდები. 863 00:51:28,970 --> 00:51:34,150 ის აღების საუკეთესო, რომელიც ამცირებს შეცდომა ცდილობს მოერგოს ამ ხაზის. 864 00:51:34,150 --> 00:51:40,000 ცხადია, ეს გამოიყურება სახის კარგი, მაგრამ ეს არ არის საუკეთესო. 865 00:51:40,000 --> 00:51:43,130 და წრფივი მოდელების ზოგადად, იქნება 866 00:51:43,130 --> 00:51:46,811 მართლაც დიდი თეორია და მხოლოდ სახის სამშენებლო საფუძვლები მანქანა 867 00:51:46,811 --> 00:51:47,310 სასწავლო. 868 00:51:47,310 --> 00:51:50,330 მაგრამ პრაქტიკაში, თქვენ აპირებს მინდა, რომ რამე უფრო ზოგადი. 869 00:51:50,330 --> 00:51:54,280 >> ასე რომ თქვენ შეგიძლიათ ვცდილობთ გაშვებული რაღაც მოუწოდა ნერვული ქსელი. 870 00:51:54,280 --> 00:51:57,110 ეს ყველაფერი უფრო გავრცელებული. 871 00:51:57,110 --> 00:52:00,530 და ისინი უბრალოდ მუშაობა fantastically დიდი მონაცემების. 872 00:52:00,530 --> 00:52:07,080 ასე რომ, ამ შემთხვევაში, ჩვენ მხოლოდ ფლობის ვნახოთ, ჩვენ გვაქვს ÑROW. 873 00:52:07,080 --> 00:52:09,010 ასე ÑROW უბრალოდ ვამბობ, სტრიქონების რაოდენობა. 874 00:52:09,010 --> 00:52:11,790 ასე რომ, ამ შემთხვევაში, მე აქვს 100 დაკვირვებები. 875 00:52:11,790 --> 00:52:15,010 >> ნება მომეცით წავიდეთ წინ და რათა ნერვული ქსელი. 876 00:52:15,010 --> 00:52:18,620 ასე რომ, ეს მართლაც ლამაზი იმიტომ, რომ მე, უბრალოდ, ვამბობთ Nnet 877 00:52:18,620 --> 00:52:21,767 და მაშინ მე წავედით Y. ასე რომ Y არის, რომ სვეტი. 878 00:52:21,767 --> 00:52:23,850 და მერე წავედით ეს სხვა ორი ცვლადი. 879 00:52:23,850 --> 00:52:27,360 ასე რომ ეს არის მოკლე ნოტაცია X1 და X2. 880 00:52:27,360 --> 00:52:29,741 >> მოდით წავიდეთ წინ და აწარმოებს ამ. 881 00:52:29,741 --> 00:52:30,240 ოჰ, უკაცრავად. 882 00:52:30,240 --> 00:52:32,260 მე უნდა აწარმოებს ამ მთელი რამ. 883 00:52:32,260 --> 00:52:37,500 და ეს მხოლოდ დაბეჭდვის notation რამდენად სწრაფად თუ არა სწრაფად 884 00:52:37,500 --> 00:52:38,460 თანხვედრა. 885 00:52:38,460 --> 00:52:41,420 ასე გამოიყურება ეს არ გადავიდეს. 886 00:52:41,420 --> 00:52:44,970 ნება მომეცით წავიდეთ წინ და ბეჭდვა გაირკვეს, თუ რა ამ ჰგავს. 887 00:52:44,970 --> 00:52:51,260 >> იხილეთ აქ არის სურათი და აქ არის კონტური ნაჩვენებია, თუ რამდენად კარგად ჯდება. 888 00:52:51,260 --> 00:52:56,380 და ეს არის just-- თქვენ ხედავთ ეს, რომ ეს არის ძალიან ლამაზი. 889 00:52:56,380 --> 00:52:59,400 ეს შეიძლება იყოს overfitting, მაგრამ ასევე შეგიძლიათ 890 00:52:59,400 --> 00:53:03,390 ანგარიშზე ამ სხვა ტექნიკას, როგორიცაა ჯვარი დადასტურება. 891 00:53:03,390 --> 00:53:06,180 და ეს ასევე ჩაშენებული R. 892 00:53:06,180 --> 00:53:09,170 >> და ნება მომეცით უბრალოდ გაჩვენებთ მხარდაჭერა ვექტორი მანქანა. 893 00:53:09,170 --> 00:53:12,470 ეს არის კიდევ ერთი მართლაც საერთო ტექნიკა მანქანა სწავლის. 894 00:53:12,470 --> 00:53:18,550 ეს ძალიან ჰგავს წრფივი მოდელები, მაგრამ იგი იყენებს, რასაც kernel მეთოდი. 895 00:53:18,550 --> 00:53:22,790 და ვნახოთ, რამდენად კარგად რომ აკეთებს. 896 00:53:22,790 --> 00:53:26,430 ასე რომ, ეს არის ძალიან გავს როგორ ასევე ნერვული ქსელი ასრულებს, 897 00:53:26,430 --> 00:53:27,900 მაგრამ ეს ბევრად უფრო გამარტივებას. 898 00:53:27,900 --> 00:53:35,740 და ეს ეფუძნება off საქართველოს, რა, როგორ SVMs მუშაობა. 899 00:53:35,740 --> 00:53:40,250 >> ასე რომ, ეს უბრალოდ ძალიან სწრაფი მიმოხილვა ზოგიერთი 900 00:53:40,250 --> 00:53:43,822 ჩაშენებული ფუნქციები შეგიძლიათ გააკეთოთ და ასევე ზოგიერთი მონაცემები exploration. 901 00:53:43,822 --> 00:53:45,905 ნება მომეცით წავიდეთ წინ და დაბრუნდეს სლაიდები. 902 00:53:45,905 --> 00:53:50,290 903 00:53:50,290 --> 00:53:53,670 >> ამიტომ ცხადია, რომ ეს არის არ ძალიან ყოვლისმომცველი. 904 00:53:53,670 --> 00:53:57,140 და ეს მართლაც მხოლოდ teaser აჩვენებს, თუ რა შეგიძლიათ ნამდვილად არ რ 905 00:53:57,140 --> 00:53:59,100 ასე რომ, თუ თქვენ უბრალოდ მინდა მეტი, აქ 906 00:53:59,100 --> 00:54:01,210 არსებობს რამოდენიმე განსხვავებული რესურსები. 907 00:54:01,210 --> 00:54:06,890 >> ასე რომ, თუ თქვენ უყვარს სახელმძღვანელოების ან თქვენ უბრალოდ უყვარდა კითხულობს რამ შემოსული, 908 00:54:06,890 --> 00:54:09,670 მაშინ ეს არის ფანტასტიკური ერთი ჰედლიმ Wickham, 909 00:54:09,670 --> 00:54:13,010 რომელიც ასევე შექმნილია ყველა ეს მართლაც მაგარი პაკეტები. 910 00:54:13,010 --> 00:54:17,420 თუ თქვენ უყვარს videos, მაშინ Berkeley აქვს გასაოცარია bootcamp 911 00:54:17,420 --> 00:54:21,060 რომ არის several-- რომ სახის ხანგრძლივი. 912 00:54:21,060 --> 00:54:24,210 და ის თქვენ გასწავლით თითქმის ყველაფერი ნეტავ მინდა იცოდეთ R. 913 00:54:24,210 --> 00:54:27,770 >> და ანალოგიურად, არსებობს Codeacademy და ყველა ეს სხვა სახის 914 00:54:27,770 --> 00:54:29,414 ინტერაქტიული საიტებზე. 915 00:54:29,414 --> 00:54:31,580 ისინი ასევე მიღების common-- უფრო და უფრო გავრცელებული. 916 00:54:31,580 --> 00:54:33,749 ასე რომ, ეს ძალიან ჰგავს Codeacademy. 917 00:54:33,749 --> 00:54:35,790 და ბოლოს, თუ თქვენ მხოლოდ მინდა Community და დახმარება, 918 00:54:35,790 --> 00:54:38,800 ეს არის რამოდენიმე რამ შეგიძლიათ წასვლა. 919 00:54:38,800 --> 00:54:40,880 ცხადია, ჩვენ მაინც გამოყენება დაგზავნები, უბრალოდ 920 00:54:40,880 --> 00:54:44,860 ისევე როგორც თითქმის ყველა სხვა პროგრამირების ენა თანამეგობრობას. 921 00:54:44,860 --> 00:54:47,880 და #rstats, ეს არის ჩვენი საზოგადოების Twitter. 922 00:54:47,880 --> 00:54:49,580 რომ რეალურად საკმაოდ გავრცელებული. 923 00:54:49,580 --> 00:54:50,850 და მერე შესახებ! 924 00:54:50,850 --> 00:54:52,340 არის მხოლოდ ჩვენი კონფერენცია. 925 00:54:52,340 --> 00:54:55,390 >> და მაშინ, რა თქმა უნდა, თქვენ შეგიძლიათ გამოიყენონ ყველა ამ სხვა Q & A რამ, 926 00:54:55,390 --> 00:54:57,680 როგორიცაა Stack Overflow, Google, და შემდეგ GitHub. 927 00:54:57,680 --> 00:55:00,490 იმიტომ, რომ ყველაზე მეტად ამ პაკეტები და ბევრი თანამეგობრობას 928 00:55:00,490 --> 00:55:03,420 იქნება ორიენტირებული გარშემო ვითარდება კოდი, რადგან ის ღია წყარო. 929 00:55:03,420 --> 00:55:05,856 და ეს მხოლოდ მართლაც ლამაზი GitHub. 930 00:55:05,856 --> 00:55:08,730 და ბოლოს, თქვენ შეგიძლიათ დამიკავშირდეს თუ თქვენ უბრალოდ უნდა რაიმე სწრაფი შეკითხვებს. 931 00:55:08,730 --> 00:55:13,530 ასე რომ თქვენ შეგიძლიათ me on Twitter აქ, ჩემი ნახვა, და მხოლოდ ჩემი ელ. 932 00:55:13,530 --> 00:55:17,840 ასე რომ, იმედია, რომ იყო რაღაც მხოლოდ მოკლე teaser 933 00:55:17,840 --> 00:55:20,900 რა R მართლაც შეუძლია აკეთებს. 934 00:55:20,900 --> 00:55:23,990 და იმედია, თქვენ უბრალოდ შეამოწმეთ ამ სამი ბმულები 935 00:55:23,990 --> 00:55:25,760 და ვნახოთ, რა შეგიძლიათ გააკეთოთ მეტი. 936 00:55:25,760 --> 00:55:28,130 და ვფიქრობ, რომ ის მხოლოდ ამის შესახებ. 937 00:55:28,130 --> 00:55:28,630 მადლობა. 938 00:55:28,630 --> 00:55:30,780 >> [ტაში] 939 00:55:30,780 --> 00:55:31,968