1 00:00:00,000 --> 00:00:00,750 2 00:00:00,750 --> 00:00:09,800 >> [Παίζει μουσική] 3 00:00:09,800 --> 00:00:13,014 4 00:00:13,014 --> 00:00:13,680 DUSTIN TRAN: Γεια σου. 5 00:00:13,680 --> 00:00:14,980 Dustin όνομά μου. 6 00:00:14,980 --> 00:00:18,419 Γι 'αυτό θα πρέπει να παρουσιάσει Ανάλυση δεδομένων σε R. 7 00:00:18,419 --> 00:00:19,710 Ακριβώς λίγο για τον εαυτό μου. 8 00:00:19,710 --> 00:00:24,320 Είμαι σήμερα ένας μεταπτυχιακός φοιτητής στο Μηχανικής και Εφαρμοσμένων Επιστημών. 9 00:00:24,320 --> 00:00:28,330 Έχω μελετήσει ένα σημείο τομής μηχανική μάθηση και στατιστικές 10 00:00:28,330 --> 00:00:31,375 έτσι Ανάλυση δεδομένων σε R είναι πραγματικά θεμελιώδης σε ό, τι 11 00:00:31,375 --> 00:00:33,790 Κάνω σε καθημερινή βάση. 12 00:00:33,790 --> 00:00:35,710 >> Και το R είναι ιδιαίτερα καλό για ανάλυση δεδομένων 13 00:00:35,710 --> 00:00:39,310 γιατί είναι πολύ καλό για τη δημιουργία πρωτοτύπων. 14 00:00:39,310 --> 00:00:43,590 Και συνήθως, όταν κάνεις κάποιο είδος της ανάλυσης των δεδομένων, πολλά από τα προβλήματα 15 00:00:43,590 --> 00:00:44,920 πρόκειται να γνωστική. 16 00:00:44,920 --> 00:00:48,700 Και έτσι απλά θέλετε να έχετε κάποια πραγματικά καλή γλώσσα που 17 00:00:48,700 --> 00:00:53,770 είναι μόνο καλό για να κάνει ενσωματωμένες λειτουργίες, σε αντίθεση με 18 00:00:53,770 --> 00:00:57,430 να χρειάζεται να ασχοληθεί με πράγματα χαμηλό επίπεδο. 19 00:00:57,430 --> 00:01:01,040 Έτσι, στην αρχή, είμαι απλώς πρόκειται να εισαγάγει τι είναι R, γιατί θα 20 00:01:01,040 --> 00:01:04,540 θέλετε να το χρησιμοποιήσετε, και τότε πάει πάνω σε κάποιο demo, 21 00:01:04,540 --> 00:01:07,060 και να φύγουμε από εκεί. 22 00:01:07,060 --> 00:01:08,150 >> Έτσι τι είναι R; 23 00:01:08,150 --> 00:01:11,180 R είναι απλά μια γλώσσα που αναπτύχθηκε για στατιστικούς υπολογισμούς 24 00:01:11,180 --> 00:01:12,450 και την απεικόνιση. 25 00:01:12,450 --> 00:01:16,000 Έτσι, αυτό σημαίνει ότι Είναι ένα πολύ εξαιρετικό γλώσσα 26 00:01:16,000 --> 00:01:22,400 για κάθε είδος του πράγματος που ασχολείται με αβεβαιότητα ή οπτικοποίηση δεδομένων. 27 00:01:22,400 --> 00:01:24,850 Έτσι, έχετε όλα αυτά κατανομές πιθανότητας. 28 00:01:24,850 --> 00:01:27,140 Υπάρχουν πρόκειται να είναι ενσωματωμένες λειτουργίες. 29 00:01:27,140 --> 00:01:31,650 Θα έχετε επίσης εξαιρετικές σχεδίαση πακέτα. 30 00:01:31,650 --> 00:01:34,110 >> Η Python είναι μια άλλη ανταγωνίζονται γλώσσα για τα δεδομένα. 31 00:01:34,110 --> 00:01:40,020 Και ένα πράγμα που βρίσκω ότι η R είναι πολύ καλύτερα σε είναι η οπτικοποίηση. 32 00:01:40,020 --> 00:01:45,200 Έτσι, αυτό που θα δείτε στο demo ως καλά είναι απλά ένα πολύ έξυπνο γλώσσα 33 00:01:45,200 --> 00:01:48,050 ότι ακριβώς λειτουργεί εξαιρετικά καλά. 34 00:01:48,050 --> 00:01:53,140 Επίσης, είναι δωρεάν και ανοιχτού κώδικα, όπως είναι οποιαδήποτε άλλη καλή γλώσσα υποθέτω. 35 00:01:53,140 --> 00:01:55,440 >> Και εδώ, ένα μάτσο μόνο λέξεις-κλειδιά που ρίχνονται σε σας. 36 00:01:55,440 --> 00:02:00,450 Είναι δυναμική, που σημαίνει ότι αν έχετε ένα συγκεκριμένο τύπο αποδίδεται σε ένα αντικείμενο 37 00:02:00,450 --> 00:02:02,025 από ό, τι θα το αλλάξει μόνο με τη μύγα. 38 00:02:02,025 --> 00:02:05,670 Είναι τεμπέλης έτσι είναι έξυπνο για πώς το κάνει υπολογισμούς. 39 00:02:05,670 --> 00:02:12,250 Λειτουργική σημαίνει ότι μπορεί πραγματικά να λειτουργήσει βασίζεται στα ανοικτά των λειτουργιών έτσι anything-- 40 00:02:12,250 --> 00:02:16,910 κάθε είδους χειραγώγηση είστε αυτό, θα πρέπει να βασίζεται στα ανοικτά λειτουργίες. 41 00:02:16,910 --> 00:02:20,162 >> Έτσι δυαδικοί τελεστές, για παράδειγμα, είναι μόνο εγγενώς λειτουργίες. 42 00:02:20,162 --> 00:02:21,870 Και όλα αυτά που θα πάμε να κάνουμε είναι να 43 00:02:21,870 --> 00:02:24,690 πρόκειται να τρέξει λειτουργίες ίδια. 44 00:02:24,690 --> 00:02:27,140 Και στη συνέχεια, αντικειμενοστρεφής, καθώς και. 45 00:02:27,140 --> 00:02:30,930 >> Έτσι, εδώ είναι ένα οικόπεδο XKCD. 46 00:02:30,930 --> 00:02:34,350 Όχι μόνο γιατί νιώθω XKCD είναι θεμελιώδους σημασίας για κάθε είδος 47 00:02:34,350 --> 00:02:37,770 της παρουσίασης, αλλά επειδή Νιώθω σαν αυτό πραγματικά 48 00:02:37,770 --> 00:02:42,160 σφυριά το σημείο ότι πολλά από τα χρόνο όταν κάνετε κάποιο είδος των δεδομένων 49 00:02:42,160 --> 00:02:46,570 ανάλυση, το πρόβλημα δεν είναι τόσο πολύ το πόσο γρήγορα τρέχει, 50 00:02:46,570 --> 00:02:49,850 αλλά πόσο καιρό πρόκειται να παίρνετε να προγραμματίσετε το έργο. 51 00:02:49,850 --> 00:02:54,112 Έτσι, εδώ είναι απλά να εξετασθεί αν στρατηγική Α ή Β είναι πιο αποτελεσματική. 52 00:02:54,112 --> 00:02:55,820 Αυτό πρόκειται να είναι κάτι που είστε 53 00:02:55,820 --> 00:02:58,290 πρόκειται να ασχοληθεί πολύ με σε είδος γλώσσες χαμηλού επιπέδου 54 00:02:58,290 --> 00:03:03,440 όπου έχουμε να κάνουμε με σφάλματα SEG, κατανομή μνήμης, initializations, 55 00:03:03,440 --> 00:03:05,270 Ακόμα και η ενσωματωμένες λειτουργίες. 56 00:03:05,270 --> 00:03:09,920 Και αυτά τα πράγματα είναι όλα τα χειρίζεται πολύ, πολύ όμορφα στο R. 57 00:03:09,920 --> 00:03:12,839 >> Έτσι απλά για να σφυρί αυτό σημείο, το μεγαλύτερο εμπόδιο 58 00:03:12,839 --> 00:03:13,880 πρόκειται να είναι γνωστική. 59 00:03:13,880 --> 00:03:17,341 Έτσι, η ανάλυση των δεδομένων είναι ένα πολύ δύσκολο πρόβλημα. 60 00:03:17,341 --> 00:03:19,340 Είτε κάνετε μηχανικής μάθησης ή είστε 61 00:03:19,340 --> 00:03:22,550 κάνει ακριβώς κάποιο είδος του βασική διερεύνηση δεδομένων, 62 00:03:22,550 --> 00:03:25,290 δεν θέλετε να έχετε να λάβει ένα έγγραφο 63 00:03:25,290 --> 00:03:27,440 και στη συνέχεια να καταρτίσει κάτι κάθε φορά που 64 00:03:27,440 --> 00:03:31,010 θέλετε να δείτε τι μια στήλη μοιάζει, τι συγκεκριμένα στοιχεία ενός πίνακα 65 00:03:31,010 --> 00:03:32,195 μοιάζει. 66 00:03:32,195 --> 00:03:34,320 Έτσι απλά θέλετε να έχετε μερικά πραγματικά ωραία διεπαφή 67 00:03:34,320 --> 00:03:37,740 μπορείτε να εκτελέσετε μια απλή λειτουργία ότι ευρετήρια σε ό, τι 68 00:03:37,740 --> 00:03:41,870 θέλετε και απλά τρέξτε το από εκεί. 69 00:03:41,870 --> 00:03:44,190 Και θα πρέπει να έχετε τομέα συγκεκριμένες γλώσσες για αυτό. 70 00:03:44,190 --> 00:03:51,750 Και R θα βοηθήσει πραγματικά να ορίσετε το πρόβλημα και να λύσει αυτό με αυτόν τον τρόπο. 71 00:03:51,750 --> 00:03:58,690 >> Έτσι, εδώ είναι μια γραφική παράσταση που δείχνει τον προγραμματισμό δημοτικότητα του R ως έχει πάει την πάροδο του χρόνου. 72 00:03:58,690 --> 00:04:04,060 Έτσι, όπως μπορείτε να δείτε, όπως το 2013 ή γι 'αυτό ακριβώς ανατινάχθηκε τρομερά. 73 00:04:04,060 --> 00:04:09,570 Και αυτό ήταν μόνο και μόνο επειδή του ότι τεράστια τάση στον κλάδο της τεχνολογίας 74 00:04:09,570 --> 00:04:10,590 για μεγάλα δεδομένα. 75 00:04:10,590 --> 00:04:13,010 Επίσης, δεν είναι μόνο η τεχνολογία βιομηχανία, αλλά πραγματικά 76 00:04:13,010 --> 00:04:16,490 κάθε that-- βιομηχανία, επειδή πολλές από τις βιομηχανίες 77 00:04:16,490 --> 00:04:20,589 είναι είδος θεμελιώδους σημασίας για προσπαθεί να λύσει αυτά τα προβλήματα. 78 00:04:20,589 --> 00:04:24,590 Και συνήθως, μπορείτε να έχετε κάποια καλή τρόπος μέτρησης αυτών των προβλημάτων 79 00:04:24,590 --> 00:04:29,720 ή ακόμη και τον ορισμό τους ή επίλυσή τους με τη χρήση των δεδομένων. 80 00:04:29,720 --> 00:04:35,430 Έτσι, νομίζω ότι αυτή τη στιγμή το R είναι η 11η πιο δημοφιλή γλώσσα για Tiobe 81 00:04:35,430 --> 00:04:38,200 και είναι από τότε αναπτύσσεται συνεχώς. 82 00:04:38,200 --> 00:04:40,740 83 00:04:40,740 --> 00:04:43,080 >> Έτσι, εδώ είναι λίγο περισσότερο χαρακτηριστικά του R. Έχει 84 00:04:43,080 --> 00:04:46,900 ένας τεράστιος αριθμός των συσκευασιών και για όλα αυτά τα διαφορετικά πράγματα. 85 00:04:46,900 --> 00:04:52,470 Έτσι, κάθε φορά που έχετε συγκεκριμένο πρόβλημα, οι περισσότεροι 86 00:04:52,470 --> 00:04:55,060 ο χρόνος R θα έχει ότι η λειτουργία για σας. 87 00:04:55,060 --> 00:04:58,520 Έτσι, αν θέλετε να οικοδομήσουμε ένα είδος μηχανής 88 00:04:58,520 --> 00:05:02,770 learning αλγόριθμο που ονομάζεται Τυχαία Δάσος ή Δένδρα Απόφασης, 89 00:05:02,770 --> 00:05:07,530 ή ακόμη και προσπαθούν να πάρουν το μέσο όρο των μια λειτουργία ή σε οποιοδήποτε από αυτά τα πράγματα, 90 00:05:07,530 --> 00:05:10,000 R θα έχει αυτό. 91 00:05:10,000 --> 00:05:14,190 >> Και αν το κάνετε σας ενδιαφέρουν βελτιστοποίησης, ένα πράγμα που είναι κοινό 92 00:05:14,190 --> 00:05:17,430 είναι ότι αφού τελειώσετε πρωτοτύπων κάποιου είδους γλώσσα υψηλού επιπέδου, 93 00:05:17,430 --> 00:05:19,810 θα ρίξει ότι in-- απλά θα το λιμάνι ότι πάνω 94 00:05:19,810 --> 00:05:21,550 σε κάποια γλώσσα χαμηλού επιπέδου. 95 00:05:21,550 --> 00:05:26,090 Τι είναι καλό για το R είναι ότι όταν είστε γίνεται προτυποποίηση αυτό, μπορείτε να εκτελέσετε C ++, 96 00:05:26,090 --> 00:05:29,510 ή Fortran, ή οποιαδήποτε από αυτά χαμηλότερα επίπεδα απ 'ευθείας στο R. 97 00:05:29,510 --> 00:05:32,320 Έτσι αυτό είναι ένα πραγματικά δροσερό χαρακτηριστικό γνώρισμα για το R, 98 00:05:32,320 --> 00:05:35,930 αν πραγματικά νοιάζονται για το σημείο βελτιστοποίησης. 99 00:05:35,930 --> 00:05:39,490 >> Και είναι επίσης πολύ καλό για απεικονίσεις ιστοσελίδων. 100 00:05:39,490 --> 00:05:43,530 Έτσι D3.js, για παράδειγμα, είναι Υποθέτω ότι ένα άλλο σεμινάριο 101 00:05:43,530 --> 00:05:45,130 που παρουσιάστηκε σήμερα. 102 00:05:45,130 --> 00:05:48,510 Και αυτό είναι πραγματικά φοβερό για κάνει διαδραστικές απεικονίσεις. 103 00:05:48,510 --> 00:05:54,460 Και D3.js υποθέτει ότι έχετε κάποιο είδος των δεδομένων που πρέπει να παρίστανται γραφικώς 104 00:05:54,460 --> 00:05:58,080 και το R είναι ένας πολύ καλός τρόπος για να είναι σε θέση να κάνει Η ανάλυση των δεδομένων, πριν να το εξάγουν 105 00:05:58,080 --> 00:06:04,220 πάνω σε D3.js ή ακόμα και απλά τρέξτε D3.js εντολές στον εαυτό του R, 106 00:06:04,220 --> 00:06:08,240 καθώς και όλα αυτά άλλες βιβλιοθήκες, καθώς και. 107 00:06:08,240 --> 00:06:13,041 >> Έτσι, αυτό ήταν μόνο η εισαγωγή του τι είναι R και γιατί μπορείτε να το χρησιμοποιήσετε. 108 00:06:13,041 --> 00:06:14,790 Έτσι, ελπίζουμε, έχω σας έπεισε κάτι 109 00:06:14,790 --> 00:06:18,460 περίπου απλώς προσπαθεί να δει τι είναι σαν. 110 00:06:18,460 --> 00:06:23,930 Έτσι, Πάω να πάει μπροστά και να περάσει κάποιες βασικές αρχές σχετικά με το R αντικείμενα 111 00:06:23,930 --> 00:06:26,150 και τι μπορείτε να κάνετε πραγματικά. 112 00:06:26,150 --> 00:06:29,690 >> Έτσι, εδώ είναι μόνο ένα δέσμη εντολών μαθηματικά. 113 00:06:29,690 --> 00:06:35,000 Έτσι λένε you're-- θέλετε να χτίσετε τον εαυτό σας γλώσσα και απλά θέλετε 114 00:06:35,000 --> 00:06:38,080 να έχουν μια δέσμη των διαφορετικών εργαλείων. 115 00:06:38,080 --> 00:06:42,520 Κάθε είδος της λειτουργίας νομίζετε ότι θα θέλουν είναι λίγο πολύ θα είναι στο R. 116 00:06:42,520 --> 00:06:44,150 >> Έτσι, εδώ είναι 2 συν 2. 117 00:06:44,150 --> 00:06:46,090 Εδώ είναι 2 φορές πίν. 118 00:06:46,090 --> 00:06:51,870 R έχει ένα σωρό ενσωματωμένο σταθερές ότι θα χρησιμοποιείτε συχνά, όπως π, ε. 119 00:06:51,870 --> 00:06:56,230 >> Και στη συνέχεια, εδώ είναι 7 συν runif, έτσι runif 1. 120 00:06:56,230 --> 00:07:02,450 Αυτή είναι μια λειτουργία που παράγει είναι μία τυχαία ομοιόμορφη από 0 έως 1. 121 00:07:02,450 --> 00:07:04,400 Και έπειτα υπάρχει 3 στη δύναμη του 4. 122 00:07:04,400 --> 00:07:06,430 Υπάρχει τετραγωνικές ρίζες. 123 00:07:06,430 --> 00:07:07,270 >> Υπάρχει καταγραφής. 124 00:07:07,270 --> 00:07:14,500 Έτσι, θα κάνει log βάση εκθετική από μόνη της. 125 00:07:14,500 --> 00:07:18,337 Και τότε, αν ορίσετε μια βάση, τότε μπορείτε να κάνετε ό, τι βάσης που θέλετε. 126 00:07:18,337 --> 00:07:19,920 Και τότε εδώ είναι μερικές άλλες εντολές. 127 00:07:19,920 --> 00:07:22,180 Έτσι, έχετε 23 mod 2. 128 00:07:22,180 --> 00:07:24,910 Τότε έχετε το υπόλοιπο. 129 00:07:24,910 --> 00:07:27,110 Στη συνέχεια, έχετε την επιστημονική σημειογραφία, αν και 130 00:07:27,110 --> 00:07:34,060 θέλουν να κάνουν περισσότερα και πιο περίπλοκα τα πράγματα. 131 00:07:34,060 --> 00:07:37,320 >> Τόσο εδώ είναι η ανάθεση. 132 00:07:37,320 --> 00:07:40,830 Έτσι, τυπικά αναθέσεις σε R γίνεται με ένα βέλος 133 00:07:40,830 --> 00:07:43,440 γι 'αυτό είναι λιγότερο από ό, τι και στη συνέχεια το ενωτικό. 134 00:07:43,440 --> 00:07:47,250 Έτσι, εδώ είμαι μόνο με την εκχώρηση 3 με τη μεταβλητή val. 135 00:07:47,250 --> 00:07:50,160 >> Και τότε είμαι εκτύπωση Val και στη συνέχεια εκτυπώνει τρία. 136 00:07:50,160 --> 00:07:53,920 Από προεπιλογή στην Ε διερμηνέα, αυτό θα εκτυπώσει τα πράγματα για εσάς 137 00:07:53,920 --> 00:07:57,280 έτσι ώστε να μην χρειάζεται να καθορίσετε εκτυπώσετε ένα val κάθε φορά που θέλετε να εκτυπώσετε κάτι. 138 00:07:57,280 --> 00:08:00,200 Μπορείτε να κάνετε ακριβώς Val και τότε θα το κάνει αυτό για σας. 139 00:08:00,200 --> 00:08:04,380 >> Επίσης, μπορείτε να χρησιμοποιήσετε ισούται με τεχνικά ως φορέα ανάθεσης. 140 00:08:04,380 --> 00:08:07,190 Υπάρχουν μικρές λεπτές αποχρώσεις μεταξύ χρησιμοποιώντας το βέλος 141 00:08:07,190 --> 00:08:10,730 χειριστής και τα ισοδύναμα χειριστή για τις αναθέσεις. 142 00:08:10,730 --> 00:08:15,470 Κυρίως από τη Σύμβαση, ο καθένας θα χρησιμοποιήσετε μόνο το φορέα βέλος. 143 00:08:15,470 --> 00:08:21,850 >> Και εδώ, είμαι ανάθεση αυτή πλάγια σημειογραφία ονομάζεται 1 του παχέος εντέρου 6. 144 00:08:21,850 --> 00:08:26,010 Αυτό δημιουργεί ένα φορέα από 1 έως 6. 145 00:08:26,010 --> 00:08:29,350 Και αυτό πραγματικά ωραία γιατί τότε εκχωρήσετε το φορέα σε Val 146 00:08:29,350 --> 00:08:34,270 και ότι λειτουργεί από μόνη της. 147 00:08:34,270 --> 00:08:37,799 >> Έτσι, αυτό είναι ήδη πηγαίνει από ένα single-- ένα πολύ έξυπνο δεδομένα 148 00:08:37,799 --> 00:08:41,070 δομή του μόλις ένα διπλό του κάποιο είδος του τύπου εντός ενός φορέα 149 00:08:41,070 --> 00:08:45,670 και η οποία θα συγκεντρώσει όλα οι βαθμωτές τιμές για εσάς. 150 00:08:45,670 --> 00:08:50,770 Έτσι, μετά από να πάει από μονοδιάστατη, μπορείτε έχουν R αντικείμενα και αυτό είναι ένα διάνυσμα. 151 00:08:50,770 --> 00:08:55,610 Ένας φορέας είναι οποιοδήποτε είδος του συλλογή του ίδιου τύπου. 152 00:08:55,610 --> 00:08:58,150 Έτσι, εδώ είναι ένα μάτσο φορέων. 153 00:08:58,150 --> 00:08:59,800 >> Έτσι, αυτό είναι αριθμητικό. 154 00:08:59,800 --> 00:09:02,440 Αριθμητική είναι ο τρόπος R να λέει διπλό. 155 00:09:02,440 --> 00:09:07,390 Και έτσι από προεπιλογή, κάθε αριθμός θα είναι διπλό. 156 00:09:07,390 --> 00:09:13,150 >> Έτσι, εάν έχετε γ της παραγράφου 1.1, 3, αρνητικός 5.7, το Ο είναι μία λειτουργία. 157 00:09:13,150 --> 00:09:16,760 Αυτό συνενώνει όλες τρεις αριθμούς σε ένα φορέα. 158 00:09:16,760 --> 00:09:19,619 Και αυτό θα be-- οπότε αν θα παρατηρήσετε 3 από μόνη της, 159 00:09:19,619 --> 00:09:21,910 Κανονικά θα αναλάβει ότι αυτό είναι σαν ένα ακέραιο, 160 00:09:21,910 --> 00:09:25,050 αλλά επειδή όλα τα διανύσματα είναι του ίδιου τύπου, 161 00:09:25,050 --> 00:09:28,660 Αυτό είναι ένα διάνυσμα διπλασιάζεται ή αριθμητική σε αυτή την περίπτωση. 162 00:09:28,660 --> 00:09:34,920 >> rnorm είναι μια λειτουργία που παράγει τυπική κανονική variables-- 163 00:09:34,920 --> 00:09:36,700 ή τυπική κανονική αξίες. 164 00:09:36,700 --> 00:09:38,360 Και είμαι προσδιορίζοντας δύο από αυτούς. 165 00:09:38,360 --> 00:09:43,840 Έτσι κάνω rnorm 2, ορίζοντας ότι για να προγραμματιστές, και τότε είμαι εκτύπωση προγραμματιστές. 166 00:09:43,840 --> 00:09:47,350 Έτσι, αυτά είναι μόνο δύο τυχαία κανονικές τιμές. 167 00:09:47,350 --> 00:09:50,060 >> Και τότε Ints αν κάνετε νοιάζεσαι για ακέραιοι. 168 00:09:50,060 --> 00:09:54,650 Έτσι, αυτό είναι μόνο για τη μνήμη κατανομή και την εξοικονόμηση μέγεθος μνήμης. 169 00:09:54,650 --> 00:10:01,460 Έτσι, θα πρέπει να επισυνάψει αριθμούς σας από την πρωτεύουσα L. 170 00:10:01,460 --> 00:10:04,170 >> Σε γενικές γραμμές, αυτό είναι Ιστορικό συμβολισμό της R 171 00:10:04,170 --> 00:10:06,940 για κάτι που ονομάζεται μεγάλο ακέραιο. 172 00:10:06,940 --> 00:10:09,880 Έτσι, το μεγαλύτερο μέρος του χρόνου, θα να ασχολούνται με διπλά. 173 00:10:09,880 --> 00:10:15,180 Και αν ποτέ θα αργότερα για τη βελτιστοποίηση κωδικό σας, 174 00:10:15,180 --> 00:10:18,110 μπορείτε να προσθέσετε ακριβώς αυτά L's μετά ή κατά τη διάρκειά της 175 00:10:18,110 --> 00:10:22,280 αν είστε σαν προγνωστικά για το τι θα πάμε να κάνουμε αυτές τις μεταβλητές. 176 00:10:22,280 --> 00:10:25,340 177 00:10:25,340 --> 00:10:26,890 >> Έτσι, εδώ είναι ένα διάνυσμα χαρακτήρα. 178 00:10:26,890 --> 00:10:31,440 Έτσι, και πάλι, είμαι συνενώσει τρεις χορδές αυτή τη φορά. 179 00:10:31,440 --> 00:10:36,230 Παρατηρήστε ότι διπλές χορδές και μονές χορδές είναι η ίδια σε R. 180 00:10:36,230 --> 00:10:41,000 Έτσι έχω Άρθουρ και Marvin και έτσι όταν είμαι αυτό εκτύπωση, όλοι τους 181 00:10:41,000 --> 00:10:43,210 πρόκειται να δείξει διπλές χορδές. 182 00:10:43,210 --> 00:10:45,880 Και αν θέλετε επίσης να περιλαμβάνουν το διπλό ή χορδή 183 00:10:45,880 --> 00:10:50,070 με χαρακτήρες σας, τότε μπορείτε να είτε εναλλάσσονται χορδές σας. 184 00:10:50,070 --> 00:10:53,540 >> Έτσι, Μάρβιν για το δεύτερο στοιχείο, αυτό είναι 185 00:10:53,540 --> 00:10:56,380 πρόκειται να σας show-- Απλά πρέπει διπλές χορδές 186 00:10:56,380 --> 00:10:59,050 και στη συνέχεια ένα ενιαίο χορδή έτσι αυτό είναι εναλλασσόμενο. 187 00:10:59,050 --> 00:11:04,040 Διαφορετικά, αν θέλετε να χρησιμοποιήσετε ένα διπλό χειριστής σειρά σε ένα διπλό κορδόνι 188 00:11:04,040 --> 00:11:07,090 όταν είστε το δηλώνοντας, τότε μπορείτε απλά να χρησιμοποιήσετε το χειριστή διαφυγής. 189 00:11:07,090 --> 00:11:10,600 Έτσι κάνετε την ανάστροφη κάθετο διπλό κορδόνι. 190 00:11:10,600 --> 00:11:13,330 >> Και τέλος, έχουμε επίσης έχουν λογική φορείς. 191 00:11:13,330 --> 00:11:15,890 Έτσι logical-- τόσο αληθινό και το ψεύτικο, και είναι 192 00:11:15,890 --> 00:11:18,880 πρόκειται να είναι όλα κεφαλαία γράμματα. 193 00:11:18,880 --> 00:11:22,370 Και τότε, και πάλι, είμαι συνενώσει τους και στη συνέχεια να την απόδοση σε bools. 194 00:11:22,370 --> 00:11:24,590 Έτσι bools θα δείξει Σας true, false, και η αλήθεια. 195 00:11:24,590 --> 00:11:28,280 196 00:11:28,280 --> 00:11:31,620 >> Έτσι, εδώ είναι φορεοποιημένο ευρετηρίαση. 197 00:11:31,620 --> 00:11:34,870 Έτσι, στην αρχή, παίρνω ένα function-- 198 00:11:34,870 --> 00:11:39,230 Αυτό ονομάζεται sequence-- αλληλουχία από 2 μέχρι 12. 199 00:11:39,230 --> 00:11:42,490 Και παίρνω μια ακολουθία από 2. 200 00:11:42,490 --> 00:11:46,660 Γι 'αυτό πρόκειται να κάνει 2, 4, 6, 8, 10 και 12. 201 00:11:46,660 --> 00:11:50,080 Και τότε, είμαι ευρετηρίαση για να πάρει το τρίτο στοιχείο. 202 00:11:50,080 --> 00:11:55,770 >> Έτσι, ένα πράγμα που πρέπει να θυμάστε είναι ότι το R ευρετήρια ξεκινώντας από το 1. 203 00:11:55,770 --> 00:12:00,550 Έτσι Vals 3 πρόκειται να δώσει Σας το τρίτο στοιχείο. 204 00:12:00,550 --> 00:12:04,580 Αυτό είναι το είδος διαφορετικό από τα άλλα γλώσσες, όπου ξεκινάει από το μηδέν. 205 00:12:04,580 --> 00:12:09,780 Έτσι, σε C ή C ++, για παράδειγμα, είστε πρόκειται να πάρει το τέταρτο στοιχείο. 206 00:12:09,780 --> 00:12:13,280 >> Και εδώ είναι διαστήματα 3 έως 5. 207 00:12:13,280 --> 00:12:16,030 Έτσι, ένα πράγμα που είναι πραγματικά δροσερό είναι ότι σας 208 00:12:16,030 --> 00:12:20,410 μπορεί να δημιουργήσει προσωρινές μεταβλητές μέσα και στη συνέχεια να τα χρησιμοποιούν μόνο για τη μύγα. 209 00:12:20,410 --> 00:12:21,960 Τόσο εδώ είναι 3 έως 5. 210 00:12:21,960 --> 00:12:25,070 Έτσι είμαι δημιουργώντας ένα διάνυσμα 3, 4 και 5 και στη συνέχεια 211 00:12:25,070 --> 00:12:29,700 Είμαι ευρετηρίαση για να πάρει το τρίτο, τέταρτο, πέμπτο και στοιχεία. 212 00:12:29,700 --> 00:12:32,280 >> Έτσι Ομοίως, μπορείτε να αφηρημένο αυτό ακριβώς κάνουμε 213 00:12:32,280 --> 00:12:35,280 κάθε είδος ενός φορέα που σας δίνει τη δημιουργία ευρετηρίου. 214 00:12:35,280 --> 00:12:40,050 Έτσι, εδώ είναι διαστήματα και στη συνέχεια το πρώτη, τρίτη και έκτη στοιχεία. 215 00:12:40,050 --> 00:12:42,800 Και τότε, αν θέλετε να κάνει ένα συμπλήρωμα, 216 00:12:42,800 --> 00:12:45,210 έτσι απλά κάνουν το μείον στη συνέχεια και ότι θα 217 00:12:45,210 --> 00:12:48,600 να σας δώσει ό, τι δεν είναι ο πρώτη, τρίτη ή έκτη στοιχείο. 218 00:12:48,600 --> 00:12:51,590 Έτσι αυτό θα είναι 4, 8, και 10. 219 00:12:51,590 --> 00:12:54,380 >> Και αν θέλετε να πάρετε ακόμη πιο προχωρημένο, 220 00:12:54,380 --> 00:12:57,610 μπορείτε να ενώσετε Boolean φορείς. 221 00:12:57,610 --> 00:13:05,210 Έτσι, ο δείκτης αυτός θα σας δώσει Αυτή η Boolean διάνυσμα μήκους 6. 222 00:13:05,210 --> 00:13:07,280 Έτσι ύφασμα ΑΛΗΘΙΝΗ κόμμα 3. 223 00:13:07,280 --> 00:13:09,680 Αυτό θα επαναλάβει ΑΛΗΘΙΝΟ τρεις φορές. 224 00:13:09,680 --> 00:13:12,900 Έτσι, αυτό θα σας δώσει μια διάνυσμα ΑΛΗΘΕΣ, ΑΛΗΘΕΣ, ΑΛΗΘΕΣ. 225 00:13:12,900 --> 00:13:17,470 >> Rep ΛΑΘΟΣ 4-- αυτό πρόκειται να σας δώσω ένα διάνυσμα ψευδή, ψευδής, ψευδή, ψευδής. 226 00:13:17,470 --> 00:13:21,280 Και τότε το c πρόκειται να ενώσετε οι δύο Booleans μαζί. 227 00:13:21,280 --> 00:13:24,090 Έτσι θα πάμε να πάρετε τρία TRUEs και στη συνέχεια τέσσερις FALSEs. 228 00:13:24,090 --> 00:13:28,460 >> Έτσι ώστε όταν vals δείκτη, είστε πρόκειται να πάρει η ΠΡΑΓΜΑΤΙΚΗ, TRUE, TRUE. 229 00:13:28,460 --> 00:13:31,420 Έτσι, αυτό πρόκειται να πει ναι, Θέλω αυτά τα τρία στοιχεία. 230 00:13:31,420 --> 00:13:33,520 Και στη συνέχεια, ψευδή, ψευδής, Ψευδή, ψευδής πρόκειται 231 00:13:33,520 --> 00:13:37,140 να πω όχι, δεν θέλω αυτά τα στοιχεία γι 'αυτό δεν πρόκειται να τα επιστρέψει. 232 00:13:37,140 --> 00:13:41,490 >> Και υποθέτω ότι υπάρχει πράγματι ένα τυπογραφικό λάθος εδώ γιατί αυτό λέει επανάληψη ΑΛΗΘΙΝΟ 3 233 00:13:41,490 --> 00:13:47,990 και επαναλάβετε ΛΑΘΟΣ 4, και τεχνικά, που έχουν μόνο έξι στοιχεία έτσι εμφανίζει εσφαλμένα, 234 00:13:47,990 --> 00:13:50,470 θα πρέπει να επαναλάβετε Λάθος 3. 235 00:13:50,470 --> 00:13:55,260 Νομίζω ότι το R είναι επίσης αρκετά τέτοια έξυπνη ότι αν απλά καθορίσετε 4 εδώ, τότε 236 00:13:55,260 --> 00:13:56,630 δεν θα είναι καν λάθος έξω. 237 00:13:56,630 --> 00:13:58,480 Απλά θα σας δώσει αυτή την τιμή. 238 00:13:58,480 --> 00:14:00,970 Έτσι θα αγνοήσει απλά η τέταρτη ΛΑΘΟΣ. 239 00:14:00,970 --> 00:14:05,310 240 00:14:05,310 --> 00:14:09,270 >> Έτσι, εδώ είναι φορεοποιημένο ανάθεση. 241 00:14:09,270 --> 00:14:15,480 Έτσι set.seed-- αυτό θέτει απλώς το σπόρων για ψευδοτυχαίων αριθμών. 242 00:14:15,480 --> 00:14:20,110 Έτσι είμαι ρύθμιση των σπόρων προς 42, που σημαίνει ότι αν έχω δημιουργήσει 243 00:14:20,110 --> 00:14:22,950 τρία τυχαία κανονική αξίες, και στη συνέχεια, αν 244 00:14:22,950 --> 00:14:27,400 τρέχει set.seed για τη δική σας υπολογιστή χρησιμοποιώντας την ίδια τιμή 42, 245 00:14:27,400 --> 00:14:30,990 τότε μπορείτε επίσης να πάρετε το ίδιες τρεις τυχαία φυσιολογικά. 246 00:14:30,990 --> 00:14:33,411 >> Έτσι, αυτό είναι πραγματικά καλό για την επαναληψιμότητα. 247 00:14:33,411 --> 00:14:35,910 Συνήθως, όταν κάνετε κάποια είδος της επιστημονικής ανάλυσης, 248 00:14:35,910 --> 00:14:37,230 θα θέλετε να ρυθμίσετε το σπόρο. 249 00:14:37,230 --> 00:14:41,270 Με αυτόν τον τρόπο οι άλλοι επιστήμονες μπορούν μόνο αναπαράγουν ακριβώς το ίδιο κωδικό που έχετε 250 00:14:41,270 --> 00:14:44,790 γίνεται επειδή θα έχετε την ακριβή ίδια τυχαίες μεταβλητές that-- ή τυχαία 251 00:14:44,790 --> 00:14:47,270 αξίες που έχετε λάβει ως καλά. 252 00:14:47,270 --> 00:14:49,870 253 00:14:49,870 --> 00:14:53,910 >> Και έτσι ο φορεοποιημένο εκχώρηση εδώ δείχνει Βαλς 1-2. 254 00:14:53,910 --> 00:14:59,290 Γι 'αυτό παίρνει τα δύο πρώτα στοιχεία του Vals και στη συνέχεια να τα αναθέτει σε 0. 255 00:14:59,290 --> 00:15:03,940 Και στη συνέχεια, μπορείτε επίσης να κάνετε τα Κάτι παρόμοιο με τα Booleans. 256 00:15:03,940 --> 00:15:09,340 >> Έτσι διαστήματα δεν είναι ίση με 0-- αυτή τη θέληση να σας δώσω ένα διάνυσμα ψευδή, ψευδής, TRUE 257 00:15:09,340 --> 00:15:10,350 σε αυτή την περίπτωση. 258 00:15:10,350 --> 00:15:13,770 Και τότε, πρόκειται να πει οποιαδήποτε αυτών των δεικτών που ήταν αλήθεια, 259 00:15:13,770 --> 00:15:15,270 τότε πρόκειται να αναθέσει ότι έως 5. 260 00:15:15,270 --> 00:15:18,790 Έτσι ώστε να παίρνει το τρίτο στοιχείο εδώ και στη συνέχεια εκχωρεί σε 5. 261 00:15:18,790 --> 00:15:22,300 >> Και αυτό είναι πολύ ωραίο σε σύγκριση με γλώσσες χαμηλού επιπέδου 262 00:15:22,300 --> 00:15:25,560 όπου θα πρέπει να χρησιμοποιήσετε για βρόχους να κάνει όλα αυτά τα πράγματα φορεοποιημένο 263 00:15:25,560 --> 00:15:30,281 γιατί είναι απλά πολύ έξυπνο και αυτό είναι ένα μονό-liner. 264 00:15:30,281 --> 00:15:32,030 Και τι είναι μεγάλη γι ' φορεοποιημένο σημειογραφία 265 00:15:32,030 --> 00:15:37,020 είναι ότι στην έρευνα, αυτά είναι το είδος του built-in, ώστε να είναι σχεδόν τόσο γρήγορα 266 00:15:37,020 --> 00:15:42,490 όπως κάνει σε μια γλώσσα χαμηλού επιπέδου, όπως αντίθεση με την κατασκευή ενός βρόχου for Ε 267 00:15:42,490 --> 00:15:46,317 και στη συνέχεια, έχοντας να κάνουμε η ίδια η δυναμική ευρετηρίαση. 268 00:15:46,317 --> 00:15:48,900 Και αυτό θα είναι πιο αργή από ό, τι κάνουν Αυτό το είδος των πράγμα φορεοποιημένο 269 00:15:48,900 --> 00:15:55,950 όπου μπορεί να το κάνει παράλληλα, όπου αυτό το κάνει σε threading βασικά. 270 00:15:55,950 --> 00:15:58,650 >> Έτσι, εδώ είναι διανυσματοποιηθούν πράξεις. 271 00:15:58,650 --> 00:16:04,920 Έτσι είμαι δημιουργώντας μια τιμή από 1 έως 3, αναθέτοντας ότι για να vec1, 3-5, vec2, 272 00:16:04,920 --> 00:16:05,950 προσθήκη τους μαζί. 273 00:16:05,950 --> 00:16:11,490 Τους προσθέτει συστατικό-σοφός έτσι είναι 1 συν 3, συν 2 4, και ούτω καθεξής. 274 00:16:11,490 --> 00:16:13,330 >> vec1 φορές vec2. 275 00:16:13,330 --> 00:16:16,110 Αυτό πολλαπλασιάζει τα δύο τιμές των συνιστωσών σοφός. 276 00:16:16,110 --> 00:16:21,830 Έτσι είναι 1 φορές 3, 2 φορές 4, και στη συνέχεια 3 φορές 5. 277 00:16:21,830 --> 00:16:28,250 >> Και τότε, όπως και μπορείτε επίσης να κάνετε comparisons-- λογικές συγκρίσεις. 278 00:16:28,250 --> 00:16:33,640 Έτσι είναι ψευδής ψευδής αλήθεια σε αυτή περίπτωση, επειδή 1 δεν είναι μεγαλύτερη από 3, 279 00:16:33,640 --> 00:16:35,920 2 δεν είναι μεγαλύτερο από 4. 280 00:16:35,920 --> 00:16:41,160 Αυτό είναι, υποθέτω, μια άλλη τυπογραφικό λάθος, 3 Είναι σίγουρα δεν είναι μεγαλύτερη από 5. 281 00:16:41,160 --> 00:16:41,660 Ναι. 282 00:16:41,660 --> 00:16:45,770 Και έτσι απλά μπορεί να κάνει όλα Αυτές οι απλές εργασίες 283 00:16:45,770 --> 00:16:48,350 επειδή κληρονόμησε τους από τις ίδιες τάξεις. 284 00:16:48,350 --> 00:16:51,110 285 00:16:51,110 --> 00:16:52,580 >> Έτσι, αυτό ήταν μόνο ο φορέας. 286 00:16:52,580 --> 00:16:56,530 Και αυτό είναι το είδος του πιο θεμελιώδους Ε αντικείμενο, επειδή δίνεται ένα φορέα, 287 00:16:56,530 --> 00:16:59,170 μπορείτε να δημιουργήσετε πιο προηγμένα αντικείμενα. 288 00:16:59,170 --> 00:17:00,560 >> Έτσι, εδώ είναι μια μήτρα. 289 00:17:00,560 --> 00:17:05,030 Αυτή είναι ουσιαστικά η αφαίρεση από ό, τι μια μήτρα είναι η ίδια. 290 00:17:05,030 --> 00:17:10,099 Έτσι, σε αυτή την περίπτωση, είναι τρεις διαφορετικές φορείς, όπου το κάθε ένα είναι μια στήλη, 291 00:17:10,099 --> 00:17:12,710 ή μπορείτε να το εξετάσει καθώς κάθε μία είναι μια σειρά. 292 00:17:12,710 --> 00:17:18,250 >> Έτσι είμαι αποθήκευση ενός πίνακα από 1 9 και τότε είμαι διευκρινίζοντας 3 σειρές. 293 00:17:18,250 --> 00:17:23,364 Έτσι, 1-9, θα σας δώσει ένα διάνυσμα 1, 2, 3, 4, 5, 6, και σε όλη τη διαδρομή μέχρι 9. 294 00:17:23,364 --> 00:17:29,250 >> Ένα πράγμα που πρέπει να κρατήσει επίσης κατά νου είναι ότι Ε αποθηκεύει τιμές στη στήλη-μείζονα μορφή. 295 00:17:29,250 --> 00:17:34,160 Έτσι, με άλλα λόγια, όταν βλέπετε 1 έως 9, πρόκειται για την αποθήκευση them-- 296 00:17:34,160 --> 00:17:36,370 πρόκειται να είναι 1, 2, 3 στην πρώτη στήλη, 297 00:17:36,370 --> 00:17:38,510 και στη συνέχεια θα κάνουμε 4, 5, 6 στη δεύτερη στήλη, 298 00:17:38,510 --> 00:17:41,440 και στη συνέχεια 7, 8, 9 στην τρίτη στήλη. 299 00:17:41,440 --> 00:17:45,570 >> Και εδώ είναι μερικά άλλα κοινές λειτουργίες που μπορείτε να χρησιμοποιήσετε. 300 00:17:45,570 --> 00:17:49,650 Έτσι αμυδρό χαλί, αυτό θα σας δώσει οι διαστάσεις της μήτρας. 301 00:17:49,650 --> 00:17:52,620 Είναι πρόκειται να σας επιστρέψει ένας φορέας της διάσταση. 302 00:17:52,620 --> 00:17:55,580 Έτσι, στην περίπτωση αυτή, επειδή μήτρα μας είναι 3 με 3, 303 00:17:55,580 --> 00:18:01,900 πρόκειται να σας δώσει μια αριθμητικό φορέα που είναι 3 3. 304 00:18:01,900 --> 00:18:05,270 >> Και εδώ ακριβώς δείχνει πολλαπλασιασμός πινάκων. 305 00:18:05,270 --> 00:18:11,970 Έτσι, συνήθως, αν απλά κάνετε asterisk-- έτσι χαλάκι αστερίσκο mat-- 306 00:18:11,970 --> 00:18:15,380 Αυτό πρόκειται να είναι τη λειτουργία των τμημάτων-σοφός 307 00:18:15,380 --> 00:18:17,300 ή ό, τι λέγεται το προϊόν Hadamard. 308 00:18:17,300 --> 00:18:21,310 Γι 'αυτό πρόκειται να κάνει κάθε στοιχείο συστατικό-σοφός. 309 00:18:21,310 --> 00:18:23,610 Ωστόσο, αν θέλετε multiplication-- μήτρα 310 00:18:23,610 --> 00:18:29,380 έτσι πολλαπλασιάζοντας τις πρώτες φορές σειρά πρώτη στήλη του δεύτερου πίνακα του 311 00:18:29,380 --> 00:18:34,510 και έτσι on-- θα χρησιμοποιήσετε αυτό το ποσοστό λειτουργίας. 312 00:18:34,510 --> 00:18:38,110 >> Και τ ματ είναι απλώς ένα λειτουργία για τη μεταφορά της. 313 00:18:38,110 --> 00:18:42,590 Γι 'αυτό λέω να λάβει τη μεταφέρει στο η μήτρα, αυτό πολλαπλασιάζεται με τη μήτρα 314 00:18:42,590 --> 00:18:43,090 η ίδια. 315 00:18:43,090 --> 00:18:45,006 Και στη συνέχεια, πρόκειται να να επιστρέψει σε σας ένα άλλο 3 316 00:18:45,006 --> 00:18:50,700 από 3 δείχνει μήτρα το προϊόν που θα θέλατε. 317 00:18:50,700 --> 00:18:53,750 >> Και έτσι αυτό ήταν μήτρα. 318 00:18:53,750 --> 00:18:56,020 Εδώ είναι αυτό που ονομάζεται ένα πλαίσιο δεδομένων. 319 00:18:56,020 --> 00:19:00,780 Ένα πλαίσιο δεδομένων που μπορείτε να σκεφτείτε ως μια μήτρα, αλλά κάθε στήλη η ίδια 320 00:19:00,780 --> 00:19:02,990 πρόκειται να είναι διαφορετικού τύπου. 321 00:19:02,990 --> 00:19:07,320 >> Έτσι, αυτό που είναι πραγματικά δροσερό για τα δεδομένα πλαισίων είναι ότι στην ίδια ανάλυση δεδομένων, 322 00:19:07,320 --> 00:19:11,260 θα πάμε να τα έχουμε όλα αυτά ετερογενή δεδομένα και όλα αυτά πραγματικά 323 00:19:11,260 --> 00:19:15,640 βρώμικο πράγματα, όπου καθεμία από τις στήλες οι ίδιοι μπορούν να είναι διαφόρων τύπων. 324 00:19:15,640 --> 00:19:21,460 Εδώ, λοιπόν, λέω να δημιουργήσουν μια πλαίσιο δεδομένων, κάντε ints 1-3, 325 00:19:21,460 --> 00:19:24,750 και στη συνέχεια να έχουν επίσης ένα διάνυσμα χαρακτήρα. 326 00:19:24,750 --> 00:19:28,470 Έτσι μπορώ να δείκτης μέσω κάθε μία από αυτές τις στήλες 327 00:19:28,470 --> 00:19:30,930 και στη συνέχεια θα πάρω τα ίδια τιμές. 328 00:19:30,930 --> 00:19:34,370 Και μπορείτε επίσης να κάνετε κάποιο είδος των εργασιών σε πλαίσια δεδομένων. 329 00:19:34,370 --> 00:19:38,040 Και τις περισσότερες φορές όταν είστε κάνει ανάλυση δεδομένων ή κάποιο είδος 330 00:19:38,040 --> 00:19:42,042 της προεπεξεργασίας, θα είναι συνεργασία με αυτές τις δομές δεδομένων 331 00:19:42,042 --> 00:19:44,250 όπου κάθε στήλη πηγαίνει να είναι διαφορετικού τύπου. 332 00:19:44,250 --> 00:19:47,880 333 00:19:47,880 --> 00:19:52,970 >> Τέλος, ώστε αυτοί να έχουν ουσιαστικά μόνο τα τέσσερα βασικά αντικείμενα στο R. Λίστα 334 00:19:52,970 --> 00:19:55,820 θα συλλέξει ένα οποιοδήποτε άλλα αντικείμενα που θέλετε. 335 00:19:55,820 --> 00:20:00,130 Έτσι θα αποθηκεύσει αυτό σε ένα μεταβλητή που μπορείτε εύκολα να έχετε πρόσβαση. 336 00:20:00,130 --> 00:20:02,370 >> Μέχρι εδώ, παίρνω μια λίστα. 337 00:20:02,370 --> 00:20:04,460 Λέω πράγματα ισούται με 3. 338 00:20:04,460 --> 00:20:08,060 Έτσι, Πάω να έχουν ένα στοιχείο η λίστα, και αυτό ονομάζεται πράγματα, 339 00:20:08,060 --> 00:20:10,570 και πρόκειται να έχει την τιμή 3. 340 00:20:10,570 --> 00:20:13,140 >> Μπορώ επίσης να δημιουργήσει μια μήτρα. 341 00:20:13,140 --> 00:20:17,970 Έτσι αυτό είναι 1 έως 4 και το τέλος σειρά ισούται με 2, έτσι ώστε ένα 2 από 2 μήτρα. 342 00:20:17,970 --> 00:20:20,270 Επίσης, στη λίστα και ονομάζεται χαλί. 343 00:20:20,270 --> 00:20:24,690 moreStuff, μια σειρά χαρακτήρων, και ακόμα και ένα άλλο στην ίδια λίστα. 344 00:20:24,690 --> 00:20:27,710 >> Έτσι, αυτό είναι μια λίστα που είναι 5 και αρκούδα. 345 00:20:27,710 --> 00:20:30,990 Έτσι ώστε να έχει την τιμή 5 και έχει την ακολουθία χαρακτήρων αρκούδα 346 00:20:30,990 --> 00:20:32,710 και αυτό είναι μια λίστα μέσα σε μια λίστα. 347 00:20:32,710 --> 00:20:35,965 Έτσι μπορείτε να έχετε αυτά αναδρομικές πράγματα όπου 348 00:20:35,965 --> 00:20:38,230 έχετε μια another-- πληκτρολογήστε στο πλαίσιο του τύπου. 349 00:20:38,230 --> 00:20:41,420 Έτσι, ομοίως, μπορείτε να έχετε μια μήτρα μέσα σε ένα άλλο μήτρα και ούτω καθεξής. 350 00:20:41,420 --> 00:20:44,264 Και ο κατάλογος είναι απλά ένας καλός τρόπος της συλλογής και την άθροιση 351 00:20:44,264 --> 00:20:45,430 όλα αυτά τα διαφορετικά αντικείμενα. 352 00:20:45,430 --> 00:20:50,210 353 00:20:50,210 --> 00:20:57,150 >> Και τέλος, εδώ είναι μόνο να βοηθήσει στην περίπτωση Αυτό ήταν μόλις φύγει πολύ γρήγορα. 354 00:20:57,150 --> 00:21:01,350 Έτσι, ανά πάσα στιγμή είστε σε σύγχυση για κάποιο είδος της λειτουργίας, 355 00:21:01,350 --> 00:21:03,510 μπορείτε να κάνετε τη βοήθεια αυτής της λειτουργίας. 356 00:21:03,510 --> 00:21:07,120 Έτσι, μπορείτε να κάνετε τη βοήθεια μήτρας ή μια μήτρα ερωτηματικό. 357 00:21:07,120 --> 00:21:11,430 Και βοήθεια και το ερωτηματικό είναι απλώς συντομογραφία για το ίδιο πράγμα 358 00:21:11,430 --> 00:21:13,040 έτσι ώστε να είναι ψευδώνυμα. 359 00:21:13,040 --> 00:21:16,820 >> LM είναι μια λειτουργία που απλά κάνει ένα γραμμικό μοντέλο. 360 00:21:16,820 --> 00:21:20,340 Αλλά αν απλά δεν έχουν ιδέα για το πώς αυτό έργα, μπορείτε να κάνετε ακριβώς βοήθεια του lm 361 00:21:20,340 --> 00:21:24,610 και ότι θα σας δώσω μερικά είδος της τεκμηρίωσης που 362 00:21:24,610 --> 00:21:27,960 μοιάζει κάτι σαν ένα σελίδα man στο Unix, όπου 363 00:21:27,960 --> 00:21:34,210 έχετε μια σύντομη περιγραφή του τι το κάνει, επίσης, ποια είναι τα επιχειρήματά της, 364 00:21:34,210 --> 00:21:38,850 τι επιστρέφει, και μόνο συμβουλές για το πώς να το χρησιμοποιήσει, καθώς και μερικά παραδείγματα, όπως καλά. 365 00:21:38,850 --> 00:21:41,680 366 00:21:41,680 --> 00:21:52,890 >> Έτσι, επιτρέψτε μου να πάω μπροστά και να δείχνουν κάποια demo του χρησιμοποιώντας R. ΟΚ. 367 00:21:52,890 --> 00:21:55,470 Έτσι πήγα σε πολύ γρήγορα μόλις τα δεδομένα 368 00:21:55,470 --> 00:21:59,440 δομές και κάποιο είδος του op-- κάποιες από τις λειτουργίες. 369 00:21:59,440 --> 00:22:02,960 Εδώ είναι μερικές λειτουργίες. 370 00:22:02,960 --> 00:22:06,750 >> Έτσι, εδώ είμαι απλώς πρόκειται να ορίσει μια λειτουργία. 371 00:22:06,750 --> 00:22:09,970 Έτσι είμαι, επίσης, με τη χρήση τελεστή εκχώρησης εδώ, 372 00:22:09,970 --> 00:22:12,610 και στη συνέχεια λέω κηρύξει ως συνάρτηση. 373 00:22:12,610 --> 00:22:14,140 Και παίρνει την τιμή του x. 374 00:22:14,140 --> 00:22:18,210 Έτσι, αυτό είναι οποιαδήποτε τιμή θέλετε και Πάω να επιστρέψει ο x. 375 00:22:18,210 --> 00:22:20,840 Έτσι, αυτή είναι η ταυτοτική συνάρτηση. 376 00:22:20,840 --> 00:22:23,670 >> Και τι είναι δροσερό για αυτό σε σύγκριση με άλλες γλώσσες 377 00:22:23,670 --> 00:22:26,330 και άλλο χαμηλού επιπέδου γλώσσες είναι ότι το x 378 00:22:26,330 --> 00:22:29,350 μπορεί να είναι οποιουδήποτε τύπου αυτή καθαυτή και θα επιστρέψει αυτό το είδος. 379 00:22:29,350 --> 00:22:35,251 Έτσι, μπορείτε να imagine-- οπότε ας μου να τρέξει τόσο γρήγορα. 380 00:22:35,251 --> 00:22:35,750 Λυπάμαι. 381 00:22:35,750 --> 00:22:40,300 >> Έτσι, ένα πράγμα που πρέπει να αναφέρω είναι ότι αυτό το πρόγραμμα επεξεργασίας είμαι με τη χρήση 382 00:22:40,300 --> 00:22:41,380 καλείται rstudio. 383 00:22:41,380 --> 00:22:44,389 Αυτό είναι αυτό που ονομάζεται ένα IDE. 384 00:22:44,389 --> 00:22:46,180 Και ένα πράγμα που είναι πραγματικά ωραίο για αυτό 385 00:22:46,180 --> 00:22:51,500 είναι ότι ενσωματώνει ένα μεγάλο μέρος της πράγματα που θέλετε να κάνετε στην Ε από μόνη της 386 00:22:51,500 --> 00:22:53,180 απλά πολύ διαισθητικά. 387 00:22:53,180 --> 00:22:55,550 >> Έτσι, εδώ είναι μια κονσόλα διερμηνέα. 388 00:22:55,550 --> 00:23:02,160 Έτσι, ομοίως, μπορείτε επίσης να πάρετε αυτό το κονσόλα πρώτων απλά κάνοντας μια R. κεφαλαίου 389 00:23:02,160 --> 00:23:05,630 Και αυτό είναι ακριβώς η ίδιο πράγμα με την κονσόλα. 390 00:23:05,630 --> 00:23:12,210 Έτσι μπορώ να κάνω μόνο μία ταυτότητα λειτουργία x, x, x. 391 00:23:12,210 --> 00:23:16,130 Και then-- και, στη συνέχεια, ότι θα είναι μια χαρά από μόνη της. 392 00:23:16,130 --> 00:23:19,200 393 00:23:19,200 --> 00:23:21,740 >> Έτσι rstudio είναι μεγάλη επειδή έχει την κονσόλα. 394 00:23:21,740 --> 00:23:25,360 Έχει επίσης τα έγγραφα θέλετε να τρέξετε. 395 00:23:25,360 --> 00:23:28,629 Και τότε θα έχει κάποιες μεταβλητές ότι μπορείτε να δείτε σε περιβάλλοντα. 396 00:23:28,629 --> 00:23:30,420 Και τότε, αν έχετε να κάνουν οικόπεδα, τότε 397 00:23:30,420 --> 00:23:33,730 μπορεί να το δει μόνο εδώ, σε αντίθεση με διαχείριση όλων αυτών των διαφορετικών παραθύρων 398 00:23:33,730 --> 00:23:35,940 από μόνα τους. 399 00:23:35,940 --> 00:23:40,530 >> Εγώ πραγματικά προσωπικά χρησιμοποιώ το Vim, αλλά εγώ αισθάνονται σαν rstudio είναι εξαιρετική ακριβώς 400 00:23:40,530 --> 00:23:44,640 για να πάρει μια καλή ιδέα για το πώς να χρησιμοποιήσετε το R. Συνήθως, 401 00:23:44,640 --> 00:23:47,040 όταν προσπαθείτε να να μάθουν κάποια νέα εργασία, 402 00:23:47,040 --> 00:23:49,590 δεν θέλετε να χειριστεί πάρα πολλά πράγματα ταυτόχρονα. 403 00:23:49,590 --> 00:23:53,120 Έτσι, το R είναι απλά μια very-- rstudio Είναι ένας πολύ καλός τρόπος μάθησης R 404 00:23:53,120 --> 00:23:56,760 χωρίς να χρειάζεται να ασχοληθεί με όλα αυτά τα άλλα πράγματα. 405 00:23:56,760 --> 00:23:58,600 >> Έτσι, εδώ Τρέχω id γειά σου. 406 00:23:58,600 --> 00:24:00,090 Αυτό επιστρέφει γεια. 407 00:24:00,090 --> 00:24:01,740 ID 123. 408 00:24:01,740 --> 00:24:04,610 Εδώ είναι ένα διάνυσμα ακεραίων. 409 00:24:04,610 --> 00:24:08,620 Έτσι, ομοίως, επειδή μπορείτε να λάβει οποιαδήποτε κάποια αξία, 410 00:24:08,620 --> 00:24:16,060 μπορείτε να κάνετε την επιστροφή id του x έτσι ώστε να επιστρέφει 1234 και 5. 411 00:24:16,060 --> 00:24:22,210 >> Και επιτρέψτε μου να σας δείξω ακριβώς ότι Αυτό είναι πράγματι ένας ακέραιος. 412 00:24:22,210 --> 00:24:28,800 Και ομοίως, αν κάνετε την κατηγορία id x, πρόκειται να είναι ακέραιος. 413 00:24:28,800 --> 00:24:34,170 Και στη συνέχεια, μπορείτε επίσης να συγκρίνουμε τα δύο και αυτό είναι αλήθεια. 414 00:24:34,170 --> 00:24:38,350 Έτσι Φεύγω αν id του x ισούται ίσων x και ειδοποίηση 415 00:24:38,350 --> 00:24:39,760 ότι σας δίνει δύο TRUEs. 416 00:24:39,760 --> 00:24:44,280 Έτσι, αυτό δεν λέει είναι τα δύο αντικείμενα πανομοιότυπα, 417 00:24:44,280 --> 00:24:46,845 αλλά είναι το καθένα από τις ενδείξεις εντός οι φορείς πανομοιότυπα. 418 00:24:46,845 --> 00:24:50,000 419 00:24:50,000 --> 00:24:52,090 >> Εδώ είναι bounded.compare. 420 00:24:52,090 --> 00:24:58,470 Έτσι, αυτό είναι λίγο πιο περίπλοκη υπό την έννοια ότι έχει αν η κατάσταση και αλλού 421 00:24:58,470 --> 00:25:00,960 και τότε παίρνει δυο επιχειρήματα σε μια στιγμή. 422 00:25:00,960 --> 00:25:02,640 Έτσι το χ είναι οποιουδήποτε τύπου. 423 00:25:02,640 --> 00:25:06,280 Και το λέω αυτό Το δεύτερο επιχείρημα είναι ένα. 424 00:25:06,280 --> 00:25:08,380 Αυτό μπορεί να είναι οτιδήποτε, όπως καλά. 425 00:25:08,380 --> 00:25:12,490 Αλλά από προεπιλογή, πρόκειται να λάβει 5 αν δεν προσδιορίζουν τίποτα. 426 00:25:12,490 --> 00:25:16,730 >> Εδώ, λοιπόν, πάω να πω εάν το χ είναι μεγαλύτερο από ένα. 427 00:25:16,730 --> 00:25:19,220 Έτσι, αν δεν καθορίσετε μια, το λέει ότι αν το x είναι μεγαλύτερο από 5, 428 00:25:19,220 --> 00:25:20,470 τότε Πάω να επιστρέψει TRUE. 429 00:25:20,470 --> 00:25:23,230 αλλιώς, Πάω να επιστρέψει TRUE. 430 00:25:23,230 --> 00:25:24,870 Έτσι, επιτρέψτε μου να πάει μπροστά και να καθορίσει αυτό. 431 00:25:24,870 --> 00:25:30,600 432 00:25:30,600 --> 00:25:34,550 >> Και τώρα Πάω να τρέξει bounded.compare 3. 433 00:25:34,550 --> 00:25:39,150 Γι 'αυτό λέει ότι είναι λιγότερο 3 than-- είναι 3 μεγαλύτερο από 5. 434 00:25:39,150 --> 00:25:41,830 Όχι, δεν είναι τόσο ΛΑΘΟΣ. 435 00:25:41,830 --> 00:25:46,550 >> Και bounded.compare 3 και Πάω να το συγκρίνουμε με τη χρήση ενός ισούται με 2. 436 00:25:46,550 --> 00:25:50,700 Έτσι, τώρα λέω ναι, τώρα θέλουν ένα να είναι κάτι άλλο. 437 00:25:50,700 --> 00:25:52,750 Έτσι, Πάω να πω ένα, θα πρέπει να είναι 2. 438 00:25:52,750 --> 00:25:56,640 >> Μπορώ να το κάνετε αυτό είτε το είδος του σημειογραφία ή λέω ένα ισούται με 2. 439 00:25:56,640 --> 00:25:58,720 Αυτό είναι ένα πιο ευανάγνωστο από το γεγονός ότι όταν είστε 440 00:25:58,720 --> 00:26:01,450 Βλέποντας αυτά τα πραγματικά πολύπλοκες λειτουργίες που 441 00:26:01,450 --> 00:26:08,110 λαμβάνουν πολλαπλές arguments-- και αυτό μπορεί να είναι δεκάδες oftentimes-- απλά λέει 442 00:26:08,110 --> 00:26:11,140 Α ισούται με 2 είναι πιο ευανάγνωστο για εσάς, έτσι ώστε αργότερα στο μέλλον 443 00:26:11,140 --> 00:26:13,020 θα ξέρετε τι κάνετε. 444 00:26:13,020 --> 00:26:17,120 >> Έτσι, σε αυτή την περίπτωση, είμαι ρητό είναι μεγαλύτερη από 3 2. 445 00:26:17,120 --> 00:26:18,270 Ναι, είναι. 446 00:26:18,270 --> 00:26:22,350 Και ομοίως, μπορώ να καταργήσετε μόνο αυτό και να πω, είναι 3 μεγαλύτερο από 2 447 00:26:22,350 --> 00:26:23,440 όπου το α ισούται με 2. 448 00:26:23,440 --> 00:26:26,230 Και αυτό είναι επίσης αλήθεια. 449 00:26:26,230 --> 00:26:26,730 Ναι; 450 00:26:26,730 --> 00:26:29,670 >> ΚΟΙΝΟ: Είσαι εκτέλεσης ανά γραμμή; 451 00:26:29,670 --> 00:26:30,670 >> DUSTIN TRAN: Ναι, είμαι. 452 00:26:30,670 --> 00:26:33,900 Έτσι, αυτό που κάνω εδώ είναι παίρνετε αυτό το κείμενο document-- 453 00:26:33,900 --> 00:26:39,825 και τι είναι μεγάλος για rstudio είναι ότι Μπορώ να τρέξει μόνο ένα short-- ένα πλήκτρο συντόμευσης. 454 00:26:39,825 --> 00:26:41,820 Έτσι κάνω Έλεγχος-Enter. 455 00:26:41,820 --> 00:26:44,850 >> Και στη συνέχεια, παίρνω το γραμμή στο έγγραφο κειμένου 456 00:26:44,850 --> 00:26:46,710 και στη συνέχεια τη θέση στην κονσόλα. 457 00:26:46,710 --> 00:26:50,800 Εδώ, λοιπόν, λέω, bounded.compare και κάνω Ελέγχου-X. 458 00:26:50,800 --> 00:26:52,540 Έτσι, μπορώ απλά να τρέχουν εδώ. 459 00:26:52,540 --> 00:26:54,920 Και στη συνέχεια ότι θα λάβει η γραμμή και στη συνέχεια το βάζουμε εδώ. 460 00:26:54,920 --> 00:26:57,900 Και στη συνέχεια, ομοίως, μπορώ να τρέχει εδώ. 461 00:26:57,900 --> 00:27:04,630 Και τότε θα κρατήσει μόνο τον καθορισμό οι γραμμές στην κονσόλα σαν αυτό. 462 00:27:04,630 --> 00:27:10,690 >> Και αν παρατηρήσετε επίσης την σγουρά τιράντες είναι ακριβώς όπως στην σύνταξη C εκεί. 463 00:27:10,690 --> 00:27:13,910 x-- αν η κατάσταση αν είναι, επίσης, πρόκειται να χρησιμοποιήσετε παρενθέσεις και, στη συνέχεια, 464 00:27:13,910 --> 00:27:15,350 μπορείτε να χρησιμοποιήσετε άλλο. 465 00:27:15,350 --> 00:27:17,496 Ένας άλλος ένας είναι άλλος αν. 466 00:27:17,496 --> 00:27:21,440 Έτσι, αυτό πρόκειται να είναι x ισούται ισούται με ένα, για παράδειγμα. 467 00:27:21,440 --> 00:27:24,190 468 00:27:24,190 --> 00:27:26,350 Και στη συνέχεια, Πάω να επιστρέψω κάτι εδώ. 469 00:27:26,350 --> 00:27:29,490 >> Σημειώστε ότι υπάρχουν δύο διαφορετικές τα πράγματα εδώ που είναι σε εξέλιξη. 470 00:27:29,490 --> 00:27:34,360 Το ένα είναι ότι εδώ είμαι διευκρινίζοντας να επιστρέψει η τιμή TRUE. 471 00:27:34,360 --> 00:27:35,950 Εδώ απλά το λέω x. 472 00:27:35,950 --> 00:27:39,970 Έτσι R θα συνήθως από προεπιλογή να πάρει το τελευταίο arguments-- 473 00:27:39,970 --> 00:27:43,510 ή να πάρετε την τελευταία γραμμή του κώδικα, και ότι θα είναι ό, τι έχει επιστρέψει. 474 00:27:43,510 --> 00:27:46,920 Έτσι, εδώ είναι το ίδιο πράγμα που κάνει την επιστροφή x. 475 00:27:46,920 --> 00:27:49,450 476 00:27:49,450 --> 00:27:50,540 >> Και ακριβώς για να σας δείξω. 477 00:27:50,540 --> 00:27:54,000 478 00:27:54,000 --> 00:27:57,052 Και τότε, θα λειτουργεί ακριβώς έτσι. 479 00:27:57,052 --> 00:27:58,260 Έτσι, επιτρέψτε μου να συνεχίσω με αυτό. 480 00:27:58,260 --> 00:28:00,630 >> Έτσι, άλλο αν. 481 00:28:00,630 --> 00:28:04,060 Και πραγματικά, μπορώ να επιστρέψω κάτι που θα ήθελα. 482 00:28:04,060 --> 00:28:06,680 Γι 'αυτό και δεν χρειάζεται καν να επιστροφή Booleans όλη την ώρα, 483 00:28:06,680 --> 00:28:08,410 Δεν μπορώ ακριβώς να επιστρέψει κάτι άλλο. 484 00:28:08,410 --> 00:28:10,670 Έτσι, μπορώ να κάνω την επιστροφή αρκούδα. 485 00:28:10,670 --> 00:28:12,989 >> Έτσι, αν το x είναι ίσο ισούται με ένα, πρόκειται να επιστρέψει αρκούδα. 486 00:28:12,989 --> 00:28:14,530 Διαφορετικά, πρόκειται να επιστρέψει TRUE. 487 00:28:14,530 --> 00:28:19,310 Θα ήθελα επίσης να κάνω ένα διάνυσμα ή τίποτα. 488 00:28:19,310 --> 00:28:22,210 >> Και συνήθως σε στατικά δακτυλογραφημένο γλώσσες, 489 00:28:22,210 --> 00:28:23,840 τότε θα πρέπει να καθορίσετε έναν τύπο εδώ. 490 00:28:23,840 --> 00:28:25,750 Και παρατηρήσετε ότι μπορεί απλά να είναι οτιδήποτε. 491 00:28:25,750 --> 00:28:32,400 Και το R είναι αρκετά έξυπνο ώστε να θα κάνει ακριβώς αυτό και θα λειτουργήσει το πρόστιμο. 492 00:28:32,400 --> 00:28:33,620 >> Έτσι, επιτρέψτε μου να ορίζεις αυτό. 493 00:28:33,620 --> 00:28:39,460 494 00:28:39,460 --> 00:28:41,230 Unexpected-- ω συγνώμη. 495 00:28:41,230 --> 00:28:44,336 Θα πρέπει να είναι σγουρά στήριγμα εδώ. 496 00:28:44,336 --> 00:28:44,836 ΟΚ. 497 00:28:44,836 --> 00:28:45,336 Cool. 498 00:28:45,336 --> 00:28:52,580 499 00:28:52,580 --> 00:28:54,530 Εντάξει. 500 00:28:54,530 --> 00:28:58,250 Έτσι τώρα ας συγκρίνουμε 3 και το α ισούται με 3. 501 00:28:58,250 --> 00:29:01,860 Γι 'αυτό θα πρέπει να return-- yeah-- την τιμή αρκούδα. 502 00:29:01,860 --> 00:29:06,740 >> Έτσι τώρα μια γενικότερη πράγμα είναι σαν τι γίνεται με άλλες δομές δεδομένων. 503 00:29:06,740 --> 00:29:09,110 Έτσι, έχετε αυτή τη λειτουργία. 504 00:29:09,110 --> 00:29:15,360 Αυτό πρόκειται να λειτουργήσει σε οποιοδήποτε είδος της αξίας, όπως 3 ή οποιοδήποτε αριθμητικό, 505 00:29:15,360 --> 00:29:17,500 με άλλα λόγια, διπλό. 506 00:29:17,500 --> 00:29:19,330 >> Αλλά τι γίνεται με κάτι σαν ένα φορέα. 507 00:29:19,330 --> 00:29:27,750 Λοιπόν, τι θα συμβεί αν do-- έτσι είμαι πρόκειται να αναθέσει val, ας πούμε, 4 έως 6. 508 00:29:27,750 --> 00:29:31,640 Έτσι, αν επιστρέψω αυτό, αυτό είναι ένα διάνυσμα από 4, 5, 6. 509 00:29:31,640 --> 00:29:34,935 >> Τώρα ας δούμε τι θα συμβεί αν κάνω bounded.compare Val. 510 00:29:34,935 --> 00:29:37,680 511 00:29:37,680 --> 00:29:42,450 Έτσι, αυτό πρόκειται να σας δώσω 15 1251. 512 00:29:42,450 --> 00:29:46,440 Έτσι με άλλα λόγια, λέει αν κοιτάξετε αυτή την κατάσταση 513 00:29:46,440 --> 00:29:50,040 έτσι λέει το x είναι μικρότερο από ένα ή κάτι τέτοιο. 514 00:29:50,040 --> 00:29:51,880 Έτσι, αυτό είναι ελαφρώς σύγχυση, επειδή τώρα 515 00:29:51,880 --> 00:29:53,379 απλά δεν ξέρω τι συμβαίνει. 516 00:29:53,379 --> 00:29:58,690 Έτσι υποθέτω ότι ένα πράγμα που είναι πραγματικά καλό για απλά προσπαθούν να debug 517 00:29:58,690 --> 00:30:04,600 είναι ότι μπορείτε απλά να κάνετε Val είναι μεγαλύτερη από ένα και να δούμε τι συμβαίνει εκεί. 518 00:30:04,600 --> 00:30:09,720 >> Έτσι val-- ένας είναι από προεπιλογή 5 έτσι ας μην Val μεγαλύτερη από 5. 519 00:30:09,720 --> 00:30:14,280 Έτσι, αυτό είναι ένα διάνυσμα ψευδής ψευδής TRUE. 520 00:30:14,280 --> 00:30:17,206 Έτσι τώρα, όταν κοιτάτε αυτό, πρόκειται να πει εάν, 521 00:30:17,206 --> 00:30:20,080 και στη συνέχεια πρόκειται να σας δώσω αυτό είναι ένα διάνυσμα ψευδής ψευδής TRUE. 522 00:30:20,080 --> 00:30:23,450 >> Έτσι, όταν περάσει αυτό σε R, δεν έχει καμία ιδέα τι κάνετε. 523 00:30:23,450 --> 00:30:26,650 Επειδή αναμένει μια ενιαία τιμή, η οποία είναι μια Boolean, και τώρα 524 00:30:26,650 --> 00:30:29,420 δίνετε το ένα φορέα της Booleans. 525 00:30:29,420 --> 00:30:31,970 Έτσι, από προεπιλογή, το R είναι απλά πρόκειται να πω ό, τι στο καλό, 526 00:30:31,970 --> 00:30:35,440 Πάω να υποθέσουμε ότι είστε πρόκειται να πάρει το πρώτο στοιχείο εδώ. 527 00:30:35,440 --> 00:30:38,320 Έτσι, Πάω να say-- Πάω να υποθέσουμε ότι αυτό είναι λάθος. 528 00:30:38,320 --> 00:30:40,890 Έτσι πρόκειται να πω Όχι, αυτό δεν είναι σωστό. 529 00:30:40,890 --> 00:30:45,246 >> Επίσης, πρόκειται να είναι Val ισούται ισούται με ένα. 530 00:30:45,246 --> 00:30:47,244 Όχι, συγνώμη 5. 531 00:30:47,244 --> 00:30:48,910 Και αυτό είναι, επίσης, πρόκειται να είναι ψευδής, καθώς και. 532 00:30:48,910 --> 00:30:52,410 Έτσι, πρόκειται να πει όχι, αυτό δεν είναι αλήθεια, καθώς έτσι είναι 533 00:30:52,410 --> 00:30:53,680 πρόκειται να επιστρέψει αυτό το τελευταίο. 534 00:30:53,680 --> 00:30:56,420 535 00:30:56,420 --> 00:31:01,360 >> Έτσι, αυτό είναι είτε ένα καλό ή ένα κακό πράγμα, ανάλογα με το πώς μπορείτε να το δείτε. 536 00:31:01,360 --> 00:31:05,104 Γιατί όταν είσαι δημιουργώντας αυτές τις λειτουργίες, 537 00:31:05,104 --> 00:31:06,770 που δεν ξέρει πραγματικά τι συμβαίνει. 538 00:31:06,770 --> 00:31:10,210 Έτσι, μερικές φορές θα θέλατε ένα σφάλμα, ή ίσως απλά θέλετε μια προειδοποίηση. 539 00:31:10,210 --> 00:31:12,160 Σε αυτή την περίπτωση, το R δεν το κάνουμε αυτό. 540 00:31:12,160 --> 00:31:14,300 Έτσι, είναι πραγματικά μέχρι που βασίζεται στα ανοικτά του τι 541 00:31:14,300 --> 00:31:17,310 νομίζετε ότι η γλώσσα πρέπει να κάνουμε σε αυτή την περίπτωση 542 00:31:17,310 --> 00:31:22,920 αν περάσετε σε ένα διάνυσμα Booleans όταν κάνετε μία αν η κατάσταση. 543 00:31:22,920 --> 00:31:31,733 >> Ας πούμε ότι είχατε το αρχικό ένα με εάν άλλος επιστρέφουν τιμή TRUE και είστε 544 00:31:31,733 --> 00:31:34,190 πρόκειται να επιστρέψει TRUE. 545 00:31:34,190 --> 00:31:39,300 Έτσι, ένας τρόπος υδροληψίες Αυτό είναι να πω ότι 546 00:31:39,300 --> 00:31:41,530 Δεν χρειάζεται καν αυτό εξαρτάται από το πράγμα. 547 00:31:41,530 --> 00:31:47,220 Ένα άλλο πράγμα που μπορώ να κάνω είναι απλά την επιστροφή των ίδιων των αξιών. 548 00:31:47,220 --> 00:31:53,240 Έτσι, αν παρατηρήσετε, αν do Val είναι μεγαλύτερος από 5, 549 00:31:53,240 --> 00:31:56,350 Αυτό πρόκειται να επιστρέψει ένα διάνυσμα ψευδής ψευδής TRUE. 550 00:31:56,350 --> 00:31:58,850 >> Ίσως αυτό είναι ό, τι θέλουν για bounded.compare. 551 00:31:58,850 --> 00:32:02,940 Θέλετε να επιστρέψετε ένα διάνυσμα των Booleans όπου συγκρίνει κάθε μία από τις τιμές 552 00:32:02,940 --> 00:32:04,190 για τον εαυτό τους. 553 00:32:04,190 --> 00:32:11,165 Έτσι, μπορείτε απλά να κάνετε bounded.compare λειτουργία Χ, Α ισούται με 5. 554 00:32:11,165 --> 00:32:13,322 555 00:32:13,322 --> 00:32:15,363 Και στη συνέχεια, αντί να κάνει Αυτό, αν άλλο όρο, 556 00:32:15,363 --> 00:32:21,430 Είμαι ακριβώς πρόκειται να επιστρέψει χ είναι μεγαλύτερη από 5. 557 00:32:21,430 --> 00:32:23,620 Έτσι, αν είναι αλήθεια, τότε πρόκειται να επιστρέψει TRUE. 558 00:32:23,620 --> 00:32:26,830 Και στη συνέχεια, αν δεν είναι, είναι πρόκειται να επιστρέψει TRUE. 559 00:32:26,830 --> 00:32:30,880 >> Και αυτό θα λειτουργήσει για οποιαδήποτε από αυτές τις δομές. 560 00:32:30,880 --> 00:32:41,450 Έτσι μπορώ να bounded.compare c 1 6 ή 9 και, στη συνέχεια, Πάω να πω ένα ισούται με 6, 561 00:32:41,450 --> 00:32:42,799 για παράδειγμα. 562 00:32:42,799 --> 00:32:44,840 Και στη συνέχεια, πρόκειται να σας δίνουν το δικαίωμα Boolean 563 00:32:44,840 --> 00:32:48,240 φορέα που σχεδιάζετε. 564 00:32:48,240 --> 00:32:50,660 >> Έτσι, αυτά είναι μόνο λειτουργίες και τώρα επιτρέψτε μου να 565 00:32:50,660 --> 00:32:54,980 σας δείξω μερικά διαδραστικά γραφικά. 566 00:32:54,980 --> 00:32:59,700 Δεν νομίζω ότι έχω πραγματικά Wi-Fi εδώ οπότε επιτρέψτε μου απλά να προχωρήσει 567 00:32:59,700 --> 00:33:01,970 και παραλείψτε αυτό υποθέτω. 568 00:33:01,970 --> 00:33:05,260 >> Αλλά ένα πράγμα που είναι δροσερό όμως, είναι ότι αν απλά 569 00:33:05,260 --> 00:33:09,600 θέλουν να δοκιμάσουν ένα μάτσο διαφορετικές εντολές δεδομένων, 570 00:33:09,600 --> 00:33:13,320 υπάρχει μια δέσμη των διαφορετικών συνόλων δεδομένων που είναι ήδη προεγκατεστημένο στο R. 571 00:33:13,320 --> 00:33:15,770 Έτσι, ένα από αυτά είναι ονομάζεται το σύνολο δεδομένων της ίριδας. 572 00:33:15,770 --> 00:33:18,910 Αυτό είναι ένα από τα πιο γνωστά αυτά σε μηχανική μάθηση. 573 00:33:18,910 --> 00:33:23,350 Συνήθως θα κάνει ακριβώς κάποιο είδος περιπτώσεις δοκιμή για να δούμε αν κωδικό σας τρέχει. 574 00:33:23,350 --> 00:33:27,520 Έτσι, ας ελέγξει τι ίριδας είναι. 575 00:33:27,520 --> 00:33:33,130 >> Έτσι, αυτό το πράγμα πηγαίνει να είναι ένα πλαίσιο δεδομένων. 576 00:33:33,130 --> 00:33:36,000 Και αυτό είναι το είδος των μεγάλων, διότι Θέλω μόνο να εκτυπωθούν ίριδας. 577 00:33:36,000 --> 00:33:38,810 Είναι εκτύπωση το όλο πράγμα. 578 00:33:38,810 --> 00:33:42,830 Γι 'αυτό έχει όλα αυτά τα διαφορετικά ονόματα. 579 00:33:42,830 --> 00:33:45,505 Έτσι, ίριδα είναι μια συλλογή διαφορετικά λουλούδια. 580 00:33:45,505 --> 00:33:48,830 Σε αυτή την περίπτωση, είναι λέει Σας το είδος του, 581 00:33:48,830 --> 00:33:54,760 όλα αυτά τα διαφορετικά πλάτη και μήκη του σέπαλο και το πέταλο. 582 00:33:54,760 --> 00:33:58,880 >> Και έτσι κανονικά, εάν θέλετε να εκτυπώσετε ίριδα, 583 00:33:58,880 --> 00:34:03,680 για παράδειγμα, δεν θέλετε να το έχουν τα κάνουμε όλα αυτά, επειδή αυτό μπορεί να αναλάβει 584 00:34:03,680 --> 00:34:05,190 ολόκληρη την κονσόλα σας. 585 00:34:05,190 --> 00:34:09,280 Έτσι, ένα πράγμα που είναι πραγματικά Καλή είναι η λειτουργία της κεφαλής. 586 00:34:09,280 --> 00:34:12,929 Έτσι, αν το κάνετε μόνο με το μυαλό ίριδα, αυτό θα σας δώσει 587 00:34:12,929 --> 00:34:17,389 οι πρώτες πέντε σειρές, ή έξι υποθέτω. 588 00:34:17,389 --> 00:34:19,909 Και τότε ήταν καλά, εσείς μπορούμε να ορίσουμε εδώ. 589 00:34:19,909 --> 00:34:22,914 Έτσι 20-- αυτό θα δώσει Σας τα πρώτα 20 σειρές. 590 00:34:22,914 --> 00:34:24,830 Και εγώ πραγματικά ήταν το είδος έκπληκτος ότι αυτή η 591 00:34:24,830 --> 00:34:28,770 μου έδωσε έξι οπότε επιτρέψτε μου να πάει μπροστά και ελέγξτε iris-- ή το κεφάλι, συγγνώμη. 592 00:34:28,770 --> 00:34:31,699 593 00:34:31,699 --> 00:34:34,960 Και εδώ θα δώσει Είσαι ο τεκμηρίωση 594 00:34:34,960 --> 00:34:37,960 του τι κάνει η κεφαλή αξία. 595 00:34:37,960 --> 00:34:40,839 Έτσι επιστρέφει την πρώτη ή το τελευταίο ενός αντικειμένου. 596 00:34:40,839 --> 00:34:42,630 Και στη συνέχεια, Πάω να δείτε τις προεπιλογές. 597 00:34:42,630 --> 00:34:47,340 Και τότε, λέει η προεπιλεγμένη μέθοδος κεφάλι x και n ισούται με 6L. 598 00:34:47,340 --> 00:34:50,620 Έτσι, αυτό επιστρέφει τα έξι πρώτα στοιχεία. 599 00:34:50,620 --> 00:34:55,050 Και ομοίως αν παρατηρήσετε εδώ, δεν πρέπει να καθορίσετε n ισούται με 6. 600 00:34:55,050 --> 00:34:56,840 Από προεπιλογή χρησιμοποιεί έξι, υποθέτω. 601 00:34:56,840 --> 00:35:00,130 Και τότε, αν θέλω να καθορίσετε μια συγκεκριμένη τιμή, τότε μπορώ να δω και αυτό. 602 00:35:00,130 --> 00:35:02,970 603 00:35:02,970 --> 00:35:10,592 >> Έτσι ώστε να είναι μερικές απλές εντολές και Εδώ είναι ένα άλλο που είναι just-- καλά, 604 00:35:10,592 --> 00:35:12,550 Έχω can-- αυτό είναι στην πραγματικότητα λίγο πιο περίπλοκη, 605 00:35:12,550 --> 00:35:17,130 αλλά αυτό θα πάρει μόνο την κατηγορία κάθε στήλη του συνόλου δεδομένων ίριδας. 606 00:35:17,130 --> 00:35:20,910 Έτσι, αυτό θα σας δείξω τι το καθένα από αυτά στήλες είναι από την άποψη των τύπων τους. 607 00:35:20,910 --> 00:35:23,665 Έτσι σέπαλο μήκος είναι αριθμητικό, σέπαλο πλάτος είναι αριθμητικό. 608 00:35:23,665 --> 00:35:26,540 Όλες αυτές οι τιμές είναι μόνο αριθμητικό επειδή μπορείτε να πείτε από αυτά τα δεδομένα 609 00:35:26,540 --> 00:35:29,440 δομήσει αυτά είναι όλα θα αριθμητική. 610 00:35:29,440 --> 00:35:34,310 >> Και η στήλη Είδη πρόκειται να είναι ένας παράγοντας. 611 00:35:34,310 --> 00:35:37,270 Έτσι, κανονικά, θα έλεγε κανείς ότι Αυτό είναι σαν μια σειρά χαρακτήρων. 612 00:35:37,270 --> 00:35:48,830 Αλλά αν το κάνετε ακριβώς irisSpecies, και, στη συνέχεια, Πάω να κάνω το κεφάλι 5, 613 00:35:48,830 --> 00:35:51,820 και αυτό πρόκειται να εκτυπώσετε από τις πρώτες πέντε τιμές. 614 00:35:51,820 --> 00:35:54,150 >> Και στη συνέχεια παρατηρήσετε αυτό το επίπεδο. 615 00:35:54,150 --> 00:35:58,870 Έτσι, αυτό είναι saying-- αυτός είναι ο τρόπος της R έχουν κατηγορικές μεταβλητές. 616 00:35:58,870 --> 00:36:03,765 Έτσι, αντί απλώς έχοντας χορδές χαρακτήρα, 617 00:36:03,765 --> 00:36:06,740 έχει επίπεδα, προσδιορίζοντας ποια από αυτά τα πράγματα είναι. 618 00:36:06,740 --> 00:36:12,450 >> Ας πούμε irisSpecies 1. 619 00:36:12,450 --> 00:36:17,690 Έτσι, αυτό που θέλουμε να κάνουμε εδώ είναι ότι είμαι υποσυνόλων σε αυτή τη στήλη ειδών. 620 00:36:17,690 --> 00:36:21,480 Έτσι, αυτό παίρνει το Στήλη ειδών και, στη συνέχεια, 621 00:36:21,480 --> 00:36:23,820 το ευρετήρια για να πάρει το πρώτο στοιχείο. 622 00:36:23,820 --> 00:36:27,140 Έτσι, αυτό θα πρέπει να σας δώσει setosa. 623 00:36:27,140 --> 00:36:28,710 Και αυτό σας δίνει επίσης τα επίπεδα εδώ. 624 00:36:28,710 --> 00:36:32,812 >> Έτσι, μπορείτε επίσης να συγκρίνετε Αυτό το χαρακτήρα setosa 625 00:36:32,812 --> 00:36:34,645 και αυτό δεν πρόκειται να είναι αλήθεια, διότι ένας 626 00:36:34,645 --> 00:36:37,940 είναι διαφορετικού τύπου από το άλλο. 627 00:36:37,940 --> 00:36:40,590 Ή υποθέτω είναι αλήθεια, διότι η R είναι πιο έξυπνη από αυτό. 628 00:36:40,590 --> 00:36:45,420 Και αυτό φαίνεται σε αυτό και, στη συνέχεια, λέει, ίσως αυτό είναι ό, τι θέλετε. 629 00:36:45,420 --> 00:36:51,860 Έτσι, πρόκειται να πει το χαρακτήρα κορδόνι setosa είναι το ίδιο με αυτό. 630 00:36:51,860 --> 00:37:01,290 Και τότε Ομοίως, μπορείτε να Επίσης, απλά αρπάξτε αυτά όπως ούτω καθεξής. 631 00:37:01,290 --> 00:37:05,580 >> Έτσι, αυτό είναι μόνο ένα είδος γρήγορη εντολές του συνόλου δεδομένων. 632 00:37:05,580 --> 00:37:08,030 Έτσι, εδώ είναι μερικές εξερεύνηση δεδομένων. 633 00:37:08,030 --> 00:37:11,360 Έτσι, αυτό είναι λίγο πιο ασχολούνται με την ανάλυση των δεδομένων. 634 00:37:11,360 --> 00:37:18,340 Και αυτό έχει ληφθεί από κάποια Bootcamp στην Ε στο Μπέρκλεϊ. 635 00:37:18,340 --> 00:37:20,790 >> Έτσι βιβλιοθήκη ξένων. 636 00:37:20,790 --> 00:37:24,880 Έτσι, Πάω να φορτώσει σε ένα βιβλιοθήκη που ονομάζεται ξένο. 637 00:37:24,880 --> 00:37:32,460 Έτσι, αυτό δεν πρόκειται να μου δώσει read.dta έτσι υποθέσουμε ότι έχω αυτό το σύνολο δεδομένων. 638 00:37:32,460 --> 00:37:39,000 Αυτό αποθηκεύεται στην τρέχουσα κατάλογο της κονσόλας μου εργασίας. 639 00:37:39,000 --> 00:37:42,190 Έτσι, ας δούμε τι ο κατάλογος εργασίας είναι. 640 00:37:42,190 --> 00:37:44,620 >> Έτσι, εδώ είναι κατάλογο εργασίας μου. 641 00:37:44,620 --> 00:37:50,040 Και να διαβάσει δεδομένα τελεία, αυτό πράγμα, λέει αυτό το αρχείο 642 00:37:50,040 --> 00:37:54,650 βρίσκεται στο φάκελο δεδομένων του Αυτό τρέχοντα κατάλογο εργασίας. 643 00:37:54,650 --> 00:38:00,520 Και read.dta αυτό δεν είναι μια προεπιλεγμένη εντολή. 644 00:38:00,520 --> 00:38:02,760 Υποθέτω ότι αυτό έχει τοποθετηθεί στο ήδη. 645 00:38:02,760 --> 00:38:04,750 IEI υπέθεσα ότι φορτωθεί αυτό ήδη. 646 00:38:04,750 --> 00:38:08,115 >> Αλλά έτσι read.dta δεν πρόκειται να είναι μια προεπιλεγμένη εντολή. 647 00:38:08,115 --> 00:38:11,550 Και γι 'αυτό θα πάμε να έχουν να φορτώσει σε αυτή τη βιβλιοθήκη package-- 648 00:38:11,550 --> 00:38:14,500 Αυτό το πακέτο που ονομάζεται ξένο. 649 00:38:14,500 --> 00:38:16,690 Και αν δεν έχετε το πακέτο, νομίζω 650 00:38:16,690 --> 00:38:19,180 του εξωτερικού είναι μία από τις ενσωματωμένες σε αυτά. 651 00:38:19,180 --> 00:38:31,150 Διαφορετικά, μπορείτε επίσης κάνουν install.packages 652 00:38:31,150 --> 00:38:33,180 και αυτό θα εγκατασταθεί το πακέτο. 653 00:38:33,180 --> 00:38:36,878 Και αυτό θα σας δώσει R. Ε, όχι. 654 00:38:36,878 --> 00:38:39,830 655 00:38:39,830 --> 00:38:43,140 Και τότε εγώ είμαι απλώς πρόκειται να σταματήσει Αυτό γιατί το έχετε ήδη. 656 00:38:43,140 --> 00:38:46,920 >> Αλλά τι είναι πραγματικά ωραίο για Ε είναι ότι η διαχείριση πακέτων 657 00:38:46,920 --> 00:38:48,510 σύστημα είναι πολύ κομψό. 658 00:38:48,510 --> 00:38:52,470 Διότι θα αποθηκεύσει τα πάντα πραγματικά ωραία για σας. 659 00:38:52,470 --> 00:38:59,780 Έτσι, στην περίπτωση αυτή, πρόκειται για την αποθήκευση την, πιστεύω, ότι αυτή η βιβλιοθήκη εδώ. 660 00:38:59,780 --> 00:39:02,390 >> Έτσι, όποτε θέλετε να εγκαταστήσετε νέα πακέτα, 661 00:39:02,390 --> 00:39:04,980 είναι εξίσου απλό όσο κάνει install.packages 662 00:39:04,980 --> 00:39:07,500 και R θα διαχειριστεί όλα τα πακέτα για εσάς. 663 00:39:07,500 --> 00:39:12,900 Έτσι, δεν χρειάζεται να κάνουμε κάτι σε Python, όπου έχετε την εξωτερική συσκευασία 664 00:39:12,900 --> 00:39:15,330 διαχειριστές, όπως το χαρτί Anaconda όπου είστε 665 00:39:15,330 --> 00:39:18,310 doing-- να εγκαταστήσετε το συσκευασίες εκτός της Python 666 00:39:18,310 --> 00:39:20,940 και στη συνέχεια προσπαθήστε να τις εκτελέσετε μόνοι σας. 667 00:39:20,940 --> 00:39:22,210 Έτσι, αυτό είναι πραγματικά ωραίο τρόπο. 668 00:39:22,210 --> 00:39:25,590 >> Και install.packages απαιτεί τη χρήση Internet. 669 00:39:25,590 --> 00:39:31,950 Θα παίρνει από ένα διακομιστή και το αποθετήριο ότι 670 00:39:31,950 --> 00:39:33,960 συλλέγει όλα τα πακέτα ονομάζεται CRAN. 671 00:39:33,960 --> 00:39:40,690 Και μπορείτε να καθορίσετε ποια είδος καθρέφτη θέλετε να κατεβάσετε τα πακέτα. 672 00:39:40,690 --> 00:39:43,420 >> Έτσι, εδώ είμαι να παίρνετε αυτό το σύνολο δεδομένων. 673 00:39:43,420 --> 00:39:46,240 Είμαι αυτό που διαβάζετε στη χρήση αυτής της λειτουργίας. 674 00:39:46,240 --> 00:39:49,360 Επιτρέψτε μου λοιπόν να προχωρήσει και να το κάνουμε αυτό. 675 00:39:49,360 --> 00:39:52,900 >> Ας υποθέσουμε ότι έχετε αυτό το σύνολο δεδομένων 676 00:39:52,900 --> 00:39:55,550 και έχετε απολύτως Δεν ξέρω τι είναι. 677 00:39:55,550 --> 00:39:58,560 Και αυτό έρχεται πραγματικά πάνω αρκετά συχνά στη βιομηχανία 678 00:39:58,560 --> 00:40:00,910 όπου έχετε μόνο αυτά τόνους και τους τόνους των βρώμικο πράγματα 679 00:40:00,910 --> 00:40:02,890 και είναι απίστευτα σημασμένο. 680 00:40:02,890 --> 00:40:06,380 Έτσι, εδώ έχω αυτό σύνολο δεδομένων και δεν ξέρω 681 00:40:06,380 --> 00:40:08,400 τι είναι έτσι είμαι απλά δείχνει να το ελέγξουμε. 682 00:40:08,400 --> 00:40:10,620 >> Έτσι, Πάω να κάνω το κεφάλι πρώτα. 683 00:40:10,620 --> 00:40:14,190 Έτσι μπορώ να ελέγξω τους πρώτους έξι στήλες του τι είναι αυτό το σύνολο δεδομένων είναι. 684 00:40:14,190 --> 00:40:21,730 Έτσι, αυτό είναι κράτος, pres04, και στη συνέχεια, όλα αυτά διαφορετικό είδος των στηλών. 685 00:40:21,730 --> 00:40:25,612 Και αυτό που είναι ενδιαφέρον εδώ, υποθέτω, είναι ότι 686 00:40:25,612 --> 00:40:27,945 θα υποθέσουμε ότι αυτό φαίνεται σαν κάποιο είδος των εκλογών. 687 00:40:27,945 --> 00:40:30,482 688 00:40:30,482 --> 00:40:32,190 Και υποθέτω μόνο από κοιτάζοντας το αρχείο 689 00:40:32,190 --> 00:40:41,070 το όνομα αυτό είναι κάποιο είδος της συλλογής των δεδομένων σχετικά με τους υποψήφιους ή τους ψηφοφόρους 690 00:40:41,070 --> 00:40:44,920 που ψήφισαν για συγκεκριμένες πρόεδροι ή πρόεδρος των υποψηφίων 691 00:40:44,920 --> 00:40:46,550 για τις εκλογές του 2004. 692 00:40:46,550 --> 00:40:52,920 >> Έτσι, εδώ είναι οι τιμές 1, 2 έτσι ένας τρόπος για την αποθήκευση 693 00:40:52,920 --> 00:40:56,540 οι υποψήφιοι πρόεδρος είναι τα ονόματά τους. 694 00:40:56,540 --> 00:40:59,780 Σε αυτή την περίπτωση, μοιάζει είναι ακριβώς ακέραιες τιμές. 695 00:40:59,780 --> 00:41:04,030 Έτσι, το 2004, ήταν ο Μπους έναντι Κέρι πιστεύω. 696 00:41:04,030 --> 00:41:09,010 Και τώρα, ας πούμε απλά δεν ξέρω αν 1 αντιστοιχεί στον Μπους ή 2 697 00:41:09,010 --> 00:41:11,703 αντιστοιχεί προς Κέρι ή και ούτω καθεξής και ούτω καθεξής, σωστά; 698 00:41:11,703 --> 00:41:15,860 >> Και αυτό είναι, ακριβώς για μένα, ένα αρκετά κοινό πρόβλημα. 699 00:41:15,860 --> 00:41:18,230 Έτσι τι μπορείτε να κάνετε σε αυτή την περίπτωση; 700 00:41:18,230 --> 00:41:20,000 Ας ελέγξει όλα αυτά τα άλλα πράγματα. 701 00:41:20,000 --> 00:41:22,790 >> κατάσταση, υποθέτω αυτό προέρχεται από διαφορετικά κράτη. 702 00:41:22,790 --> 00:41:25,100 partyid, το εισόδημα. 703 00:41:25,100 --> 00:41:27,710 Ας δούμε partyid. 704 00:41:27,710 --> 00:41:32,800 Έτσι ίσως ένα πράγμα που μπορείτε να κάνετε είναι εξετάσουμε κάθε μία από τις παρατηρήσεις 705 00:41:32,800 --> 00:41:36,250 ότι έχουν partyid του Ρεπουμπλικανικού ή δημοκράτης ή κάτι τέτοιο. 706 00:41:36,250 --> 00:41:38,170 Έτσι, ας δούμε τι είναι partyid. 707 00:41:38,170 --> 00:41:41,946 >> Έτσι, Πάω να λάβει DAT και στη συνέχεια θα πάω 708 00:41:41,946 --> 00:41:47,960 να κάνετε αυτό το σύμβολο του δολαρίου χειριστή που έκανα προηγουμένως 709 00:41:47,960 --> 00:41:50,770 και αυτό πρόκειται να υποσύνολο για αυτή τη στήλη. 710 00:41:50,770 --> 00:41:57,760 Και στη συνέχεια, Πάω να το κεφάλι σε αυτό 20, ακριβώς για να δούμε τι αυτό μοιάζει. 711 00:41:57,760 --> 00:42:00,170 >> Έτσι, αυτό είναι απλώς ένα μάτσο ΕΓ. 712 00:42:00,170 --> 00:42:02,800 Έτσι, με άλλα λόγια, έχετε έλλειψης στοιχείων σχετικά με αυτά τα παιδιά. 713 00:42:02,800 --> 00:42:08,100 Αλλά μπορείτε επίσης να παρατηρήσετε αυτό DAT partyid είναι ένας παράγοντας 714 00:42:08,100 --> 00:42:10,030 έτσι αυτό σας δίνει διαφορετικές κατηγορίες. 715 00:42:10,030 --> 00:42:14,170 Έτσι με άλλα λόγια, μπορεί να λάβει partyid Δημοκρατών, Ρεπουμπλικάνος, Ανεξάρτητο, 716 00:42:14,170 --> 00:42:16,640 ή κάτι άλλο. 717 00:42:16,640 --> 00:42:23,940 >> Έτσι, ας προχωρήσουμε και ας δείτε ποια από αυτά τα is-- Ω, εντάξει. 718 00:42:23,940 --> 00:42:28,480 Έτσι, Πάω να υποσύνολο να partyid και, στη συνέχεια, 719 00:42:28,480 --> 00:42:32,780 εξετάσουμε ποιες είναι Δημοκρατών, για παράδειγμα. 720 00:42:32,780 --> 00:42:37,150 Αυτό πρόκειται να σας δώσει μια Boolean, ένα τεράστιο Boolean των TRUEs και FALSEs. 721 00:42:37,150 --> 00:42:41,630 >> Και τώρα, ας πούμε ότι θέλω να υποσύνολο σε αυτά τα παιδιά. 722 00:42:41,630 --> 00:42:47,260 Έτσι, αυτό πρόκειται να λάβει DAT μου και υποσύνολο για όποιο παρατηρήσεις 723 00:42:47,260 --> 00:42:48,910 έχουν partyid ίσων ισούται Δημοκρατών. 724 00:42:48,910 --> 00:42:52,830 725 00:42:52,830 --> 00:42:55,180 Και αυτό είναι αρκετά μεγάλη, διότι υπάρχουν τόσα πολλά από αυτούς. 726 00:42:55,180 --> 00:42:59,060 Μέχρι τώρα, πάω να το κεφάλι σε αυτό 20. 727 00:42:59,060 --> 00:43:05,690 728 00:43:05,690 --> 00:43:11,270 >> Και όπως μπορείτε να παρατηρήσετε, ισούται ίσων Είναι ενδιαφέρον το γεγονός ότι είστε 729 00:43:11,270 --> 00:43:13,250 already-- είστε, επίσης, συμπεριλαμβανομένου του ΕΓ. 730 00:43:13,250 --> 00:43:19,010 Έτσι, σε αυτή την περίπτωση, δεν μπορείτε ακόμα να πάρετε οποιαδήποτε πληροφορία, γιατί τώρα έχετε ΕΓ 731 00:43:19,010 --> 00:43:22,650 και απλά θέλετε να δείτε ποιες από τις παρατήρηση αντιστοιχούν σε Δημοκρατών 732 00:43:22,650 --> 00:43:24,670 και όχι αυτοί που λείπει οι ίδιοι τιμές. 733 00:43:24,670 --> 00:43:27,680 Λοιπόν, πώς θα απαλλαγούμε από αυτές ΕΓ; 734 00:43:27,680 --> 00:43:36,410 >> Έτσι, εδώ είμαι απλά χρησιμοποιώντας το πλήκτρο στο μου δρομέα και, στη συνέχεια, λέγοντας κινούνται γύρω. 735 00:43:36,410 --> 00:43:39,778 Και στη συνέχεια, εδώ είμαι απλώς πρόκειται να πω is.na datpartyid. 736 00:43:39,778 --> 00:43:48,970 737 00:43:48,970 --> 00:43:52,720 Έτσι αυτό και και θα λάβει δύο διαφορετικά δυαδικά διανύσματα 738 00:43:52,720 --> 00:43:57,160 και να πω ότι πρόκειται να είναι Αληθινό και το ψεύτικο, για παράδειγμα. 739 00:43:57,160 --> 00:43:59,190 Γι 'αυτό πρόκειται να κάνει αυτό το συστατικό-σοφός. 740 00:43:59,190 --> 00:44:02,910 Εδώ, λοιπόν, λέω να λάβει το πλαίσιο δεδομένων, το υποσύνολο 741 00:44:02,910 --> 00:44:10,170 με αυτές που αντιστοιχούν σε δημοκράτη, και αφαιρέστε κάποια από αυτά που δεν είναι NA. 742 00:44:10,170 --> 00:44:13,540 >> Έτσι, αυτό θα πρέπει να will-- να σας δώσω κάτι. 743 00:44:13,540 --> 00:44:16,540 744 00:44:16,540 --> 00:44:17,600 Ας δούμε is.na. 745 00:44:17,600 --> 00:44:24,670 746 00:44:24,670 --> 00:44:27,690 Ας προσπαθήσουμε is.na datpartyid. 747 00:44:27,690 --> 00:44:36,290 748 00:44:36,290 --> 00:44:45,290 Και αυτό θα πρέπει να δώσει you-- sorry-- μόνο μια Boolean φορέα. 749 00:44:45,290 --> 00:44:49,260 Και τότε, γιατί είναι τόσο πολύ καιρό, Πάω να υποσύνολο έως 20. 750 00:44:49,260 --> 00:44:49,760 ΟΚ. 751 00:44:49,760 --> 00:44:51,570 Έτσι, αυτό θα πρέπει να εργαστεί. 752 00:44:51,570 --> 00:44:54,700 >> Και αυτό θα είναι επίσης TRUEs. 753 00:44:54,700 --> 00:45:01,830 Αχ, έτσι το λάθος μου εδώ είναι ότι I'm-- μου χρησιμοποιούν C ++ και R εναλλακτικά έτσι κάνω 754 00:45:01,830 --> 00:45:03,590 Αυτό το λάθος όλη την ώρα. 755 00:45:03,590 --> 00:45:05,807 Ο χειριστής και είναι στην πραγματικότητα το μόνο που θέλετε. 756 00:45:05,807 --> 00:45:08,140 Δεν θέλετε να χρησιμοποιήσετε δύο συμπλεκτικά σύμβολα, απλά μόνο ένα. 757 00:45:08,140 --> 00:45:14,970 758 00:45:14,970 --> 00:45:17,010 ΟΚ. 759 00:45:17,010 --> 00:45:18,140 >> Ας δούμε λοιπόν. 760 00:45:18,140 --> 00:45:20,930 761 00:45:20,930 --> 00:45:23,920 Γι 'αυτό υποσύνολο με το partyid όταν είσαι δημοκράτης 762 00:45:23,920 --> 00:45:25,300 και δεν λείπουν τιμές. 763 00:45:25,300 --> 00:45:27,690 Και τώρα ας δούμε ποια ήταν αυτά που ψηφίσαμε. 764 00:45:27,690 --> 00:45:31,530 Έτσι, φαίνεται ότι οι περισσότεροι από αυτούς ψήφισαν για 1. 765 00:45:31,530 --> 00:45:36,090 Έτσι, Πάω να πάει μπροστά και να πω ότι είναι Κέρι. 766 00:45:36,090 --> 00:45:39,507 >> Και Ομοίως, μπορείτε να Επίσης, πηγαίνετε στο Ρεπουμπλικανικό 767 00:45:39,507 --> 00:45:41,090 και ελπίζουμε ότι αυτό θα πρέπει να σας δώσει 2. 768 00:45:41,090 --> 00:45:49,730 769 00:45:49,730 --> 00:45:51,770 Είναι απλά ένα μάτσο διαφορετικές στήλες. 770 00:45:51,770 --> 00:45:53,070 Και πράγματι, αυτό είναι 2. 771 00:45:53,070 --> 00:45:55,750 Έτσι partyid όλα Ρεπουμπλικάνων, οι περισσότεροι από αυτούς ψηφίζουν για 2. 772 00:45:55,750 --> 00:45:58,390 >> Φαίνεται λοιπόν ότι, ακριβώς κοιτάζοντας αυτό, 773 00:45:58,390 --> 00:46:00,600 Δημοκρατικός πρόκειται να είναι ένα very-- ή ο partyid 774 00:46:00,600 --> 00:46:02,790 πρόκειται να είναι ένα πολύ μεγάλος παράγοντας στον καθορισμό 775 00:46:02,790 --> 00:46:05,420 η οποία υποψήφιος από όπου και αν πρόκειται να ψηφίσουν. 776 00:46:05,420 --> 00:46:07,120 Και αυτό είναι προφανώς ισχύει γενικά. 777 00:46:07,120 --> 00:46:10,139 Και αυτό ταιριάζει σας διαίσθηση, φυσικά. 778 00:46:10,139 --> 00:46:11,930 Φαίνεται λοιπόν ότι είμαι ο χρόνος τελειώνει έτσι 779 00:46:11,930 --> 00:46:17,040 επιτρέψτε μου να πρέπει να προχωρήσει και δείχνουν κάποιες γρήγορες εικόνες. 780 00:46:17,040 --> 00:46:21,120 Έτσι, εδώ είναι κάτι που είναι ελαφρώς πιο περίπλοκη με την απεικόνιση. 781 00:46:21,120 --> 00:46:26,450 Έτσι, σε αυτή την περίπτωση, αυτό είναι ένα πολύ απλή ανάλυση του τι ακριβώς έλεγχο 782 00:46:26,450 --> 00:46:28,500 Ο Πρόεδρος του '04 είναι. 783 00:46:28,500 --> 00:46:33,920 >> Έτσι, σε αυτή την περίπτωση, ας λέτε θέλησε να απαντήσει σε αυτήν την ερώτηση. 784 00:46:33,920 --> 00:46:38,540 Έτσι, ας υποθέσουμε ότι θέλουμε να γνωρίζουμε την ψηφοφορία συμπεριφορά στις εκλογές του 2004 πρόεδρος 785 00:46:38,540 --> 00:46:41,170 και πώς αυτό διαφέρει ανάλογα με τη φυλή. 786 00:46:41,170 --> 00:46:44,380 Έτσι, όχι μόνο δεν θα θέλετε να δείτε την εκλογική συμπεριφορά, 787 00:46:44,380 --> 00:46:47,860 αλλά θέλετε να υποσύνολο κάθε φυλή και το είδος του συνοψίζουν αυτό. 788 00:46:47,860 --> 00:46:50,770 Και το μόνο που μπορεί να πει από αυτό το περίπλοκο συμβολισμό 789 00:46:50,770 --> 00:46:52,580 ότι αυτό είναι το είδος του να πάρει θολό. 790 00:46:52,580 --> 00:46:56,390 >> Έτσι, ένα από τα πιο προηγμένη Ε πακέτα που είναι επίσης και το είδος των πρόσφατων 791 00:46:56,390 --> 00:47:00,070 καλείται dplyr. 792 00:47:00,070 --> 00:47:03,060 Γι 'αυτό είναι αυτό ακριβώς εδώ. 793 00:47:03,060 --> 00:47:08,080 Και ggg-- ggplot2 είναι απλά ένα ωραίο τρόπος για να γίνει καλύτερα απεικονίσεις 794 00:47:08,080 --> 00:47:09,400 από την ενσωματωμένη σε ένα. 795 00:47:09,400 --> 00:47:11,108 >> Έτσι, Πάω να φορτώσει Αυτές οι δύο βιβλιοθήκες. 796 00:47:11,108 --> 00:47:13,200 797 00:47:13,200 --> 00:47:16,950 Και στη συνέχεια, Πάω να πάει μπροστά και να εκτελέσετε αυτήν την εντολή. 798 00:47:16,950 --> 00:47:19,050 Μπορείτε να θεωρούμε σαν ένα μαύρο κουτί. 799 00:47:19,050 --> 00:47:23,460 >> Αυτό που συμβαίνει είναι ότι αυτού του σωλήνα χειριστής περνά σε αυτό το επιχείρημα 800 00:47:23,460 --> 00:47:24,110 σε εδώ. 801 00:47:24,110 --> 00:47:28,070 Γι 'αυτό λέω ομάδα από DAT φυλή και στη συνέχεια πρόεδρος 04. 802 00:47:28,070 --> 00:47:31,530 Και στη συνέχεια, όλες αυτές οι άλλες εντολές Οι φιλτράρισμα και στη συνέχεια συνοπτικά 803 00:47:31,530 --> 00:47:34,081 όπου κάνω καταμέτρηση και τότε είμαι το συνωμοτούν εδώ. 804 00:47:34,081 --> 00:47:39,980 805 00:47:39,980 --> 00:47:42,500 ΟΚ δροσερό. 806 00:47:42,500 --> 00:47:44,620 Ας πάμε μπροστά και να δείτε τι αυτό μοιάζει. 807 00:47:44,620 --> 00:47:52,280 808 00:47:52,280 --> 00:47:57,290 >> Έτσι, αυτό που συμβαίνει εδώ είναι ότι εγώ ακριβώς σχεδιάζεται καθένα από τους αγώνες και, στη συνέχεια, 809 00:47:57,290 --> 00:47:59,670 ποια ήταν αυτά που ψηφίσαμε. 810 00:47:59,670 --> 00:48:03,492 Και τα δύο αυτά διαφορετικά τιμές αντιστοιχούν σε 2 και 1. 811 00:48:03,492 --> 00:48:05,325 Αν θέλετε να είναι πιο κομψό, μπορείτε επίσης 812 00:48:05,325 --> 00:48:11,770 απλώς διευκρινίζει ότι 2 είναι Kerry-- ή 2 είναι ο Μπους, και στη συνέχεια 1 είναι Κέρι. 813 00:48:11,770 --> 00:48:13,700 Και μπορείτε επίσης να έχετε ότι στο μύθο σας. 814 00:48:13,700 --> 00:48:17,410 >> Και μπορείτε επίσης να χωρίσετε αυτές γραφήματα μπαρ. 815 00:48:17,410 --> 00:48:19,480 Διότι ένα πράγμα είναι ότι, αν παρατηρήσετε, 816 00:48:19,480 --> 00:48:24,560 Αυτό δεν είναι πολύ εύκολο να εντοπιστούν ποια από τις δύο τιμές είναι μεγαλύτερες. 817 00:48:24,560 --> 00:48:27,920 Έτσι, ένα πράγμα που θα θέλατε να κάνουμε είναι να λάβουμε αυτήν την μπλε περιοχή 818 00:48:27,920 --> 00:48:31,855 και απλά κινούνται πάνω από εδώ, έτσι ώστε να να συγκρίνετε αυτές τις δύο πλάι-πλάι. 819 00:48:31,855 --> 00:48:34,480 Και υποθέτω ότι είναι κάτι που δεν έχουν το χρόνο να κάνουμε τώρα, 820 00:48:34,480 --> 00:48:36,660 αλλά αυτό είναι επίσης πολύ εύκολο να το κάνουμε. 821 00:48:36,660 --> 00:48:40,310 Μπορείτε απλά να εξετάσουμε οι σελίδες man του ggplot. 822 00:48:40,310 --> 00:48:47,170 Έτσι, μπορείτε απλά να κάνετε ggplot όπως ότι και να διαβάσετε σε αυτή τη σελίδα man. 823 00:48:47,170 --> 00:48:51,920 >> Έτσι, επιτρέψτε μου να γρήγορα σας δείξω μερικά δροσερά πράγματα. 824 00:48:51,920 --> 00:48:57,610 Ας πάμε μπροστά και να πάει to-- μόνο ένα εφαρμογή της μηχανικής μάθησης. 825 00:48:57,610 --> 00:49:02,450 Ας πούμε ότι έχουμε αυτά τα τρία συσκευασίες, έτσι Πάω να φορτώσετε αυτά τα μέσα. 826 00:49:02,450 --> 00:49:05,500 827 00:49:05,500 --> 00:49:09,170 Έτσι, αυτό εκτυπώνει μόνο μερικά πληροφορίες αφού έχει τοποθετηθεί στο πράγμα. 828 00:49:09,170 --> 00:49:15,220 Έτσι λέω αυτό read.csv, Αυτό το σύνολο δεδομένων, και τώρα 829 00:49:15,220 --> 00:49:18,940 Πάω να πάει μπροστά και να δούμε και να δούμε τι είναι μέσα σε αυτό το σύνολο δεδομένων. 830 00:49:18,940 --> 00:49:22,080 >> Έτσι, τα πρώτα 20 παρατηρήσεις. 831 00:49:22,080 --> 00:49:27,190 Έτσι έχω μόνο Χ1, Χ2, και Y. Γι 'αυτό Φαίνεται σαν ένα μάτσο από αυτές τις αξίες 832 00:49:27,190 --> 00:49:31,640 Οι κυμαινόμενες από ίσως 20 έως 80 ή έτσι. 833 00:49:31,640 --> 00:49:37,700 Και τότε ομοίως για το Χ2 και, στη συνέχεια, αυτό το Υ φαίνεται να είναι ετικετών 0 και 1. 834 00:49:37,700 --> 00:49:49,500 >> Για να το επιβεβαιώσετε αυτό, μπορώ απλά κάνουμε Χ1 συνοπτικά δεδομένα. 835 00:49:49,500 --> 00:49:51,660 Και τότε ομοίως για Όλες αυτές οι άλλες στήλες. 836 00:49:51,660 --> 00:49:55,300 Έτσι περίληψη είναι ένας γρήγορος τρόπος για να απλά δείχνοντάς σας γρήγορα αξίες. 837 00:49:55,300 --> 00:49:56,330 Ω, συγγνώμη. 838 00:49:56,330 --> 00:49:58,440 Αυτό και μόνο θα πρέπει να είναι Υ 839 00:49:58,440 --> 00:50:03,420 >> Έτσι, στην περίπτωση αυτή, δίνει το ποσοστιαία, διαμέσους, maxes επίσης. 840 00:50:03,420 --> 00:50:07,130 Σε αυτή την περίπτωση, dataY, μπορείτε να δείτε ότι είναι ακριβώς πρόκειται να είναι 0 και 1. 841 00:50:07,130 --> 00:50:10,100 Επίσης, η μέση λέει 0.6, σημαίνει απλά ότι 842 00:50:10,100 --> 00:50:13,380 Φαίνεται σαν να έχω περισσότερους από 1s 0s. 843 00:50:13,380 --> 00:50:16,160 >> Έτσι, επιτρέψτε μου να πάω μπροστά και να δείχνουν σας τι αυτό μοιάζει. 844 00:50:16,160 --> 00:50:17,470 Έτσι, είμαι απλώς πρόκειται να σχεδιάσετε αυτό. 845 00:50:17,470 --> 00:50:22,852 846 00:50:22,852 --> 00:50:24,636 Ας δούμε πώς μπορείτε να καθαρίσετε αυτό. 847 00:50:24,636 --> 00:50:30,492 848 00:50:30,492 --> 00:50:31,468 Ω OK. 849 00:50:31,468 --> 00:50:35,840 850 00:50:35,840 --> 00:50:36,340 ΟΚ. 851 00:50:36,340 --> 00:50:37,590 >> Έτσι, αυτό είναι ό, τι μοιάζει. 852 00:50:37,590 --> 00:50:46,310 Φαίνεται λοιπόν ότι τα κίτρινα έχω καθορίσει ως 0, και στη συνέχεια το κόκκινο έχω καθορίσει ως 1s. 853 00:50:46,310 --> 00:50:52,190 Έτσι, εδώ μοιάζει σημεία ετικέτα και 854 00:50:52,190 --> 00:50:56,410 Φαίνεται σαν να ήθελε απλά κάποια είδος της ομαδοποίησης σε αυτό. 855 00:50:56,410 --> 00:51:01,020 >> Και επιτρέψτε μου απλά να προχωρήσει και να δείξει σας μερικές από αυτές τις ενσωματωμένες λειτουργίες. 856 00:51:01,020 --> 00:51:03,580 Έτσι, εδώ είναι lm. 857 00:51:03,580 --> 00:51:06,060 Έτσι, αυτό είναι ακριβώς που προσπαθεί για να χωρέσει μια γραμμή σε αυτό. 858 00:51:06,060 --> 00:51:08,640 Έτσι τι είναι ο καλύτερος τρόπος ότι μπορώ να χωρέσει μια γραμμή, όπως 859 00:51:08,640 --> 00:51:14,020 ότι θα διαχωρίσει καλύτερα Αυτό το είδος της ομαδοποίησης. 860 00:51:14,020 --> 00:51:21,790 Και στην ιδανική περίπτωση, μπορείτε να δείτε μόνο ότι τρέχω μόνο όλες αυτές τις εντολές 861 00:51:21,790 --> 00:51:25,450 και, στη συνέχεια, Πάω μπροστά και προσθέστε τη γραμμή. 862 00:51:25,450 --> 00:51:28,970 >> Έτσι, αυτό φαίνεται να είναι η καλύτερη εικασία. 863 00:51:28,970 --> 00:51:34,150 Είναι λαμβάνοντας το καλύτερο που ελαχιστοποιεί το σφάλμα στην προσπάθεια να χωρέσει αυτή τη γραμμή. 864 00:51:34,150 --> 00:51:40,000 Προφανώς, αυτό φαίνεται το είδος του καλό, αλλά δεν είναι η καλύτερη. 865 00:51:40,000 --> 00:51:43,130 Και γραμμικά μοντέλα, σε Γενικά, πρόκειται να είναι 866 00:51:43,130 --> 00:51:46,811 πραγματικά μεγάλη για τη θεωρία και ακριβώς το είδος του κτιρίου βασικά στοιχεία της μηχανής 867 00:51:46,811 --> 00:51:47,310 μάθηση. 868 00:51:47,310 --> 00:51:50,330 Αλλά στην πράξη, θα πάμε να θέλουμε να κάνουμε κάτι πιο γενικό. 869 00:51:50,330 --> 00:51:54,280 >> Έτσι, μπορείτε απλά να δοκιμάσετε τρέξιμο κάτι που ονομάζεται ένα νευρωνικό δίκτυο. 870 00:51:54,280 --> 00:51:57,110 Αυτά τα πράγματα είναι όλο και πιο συχνές. 871 00:51:57,110 --> 00:52:00,530 Και το μόνο που εργάζονται φανταστικά για μεγάλα σύνολα δεδομένων. 872 00:52:00,530 --> 00:52:07,080 Έτσι, σε αυτή την περίπτωση, έχουμε μόνο have-- ας see-- έχουμε nrow. 873 00:52:07,080 --> 00:52:09,010 Έτσι nrow είναι ακριβώς λέει αριθμό των γραμμών. 874 00:52:09,010 --> 00:52:11,790 Έτσι, στην περίπτωση αυτή, θα έχει 100 παρατηρήσεις. 875 00:52:11,790 --> 00:52:15,010 >> Έτσι, επιτρέψτε μου να πάει μπροστά και κάνει ένα νευρωνικό δίκτυο. 876 00:52:15,010 --> 00:52:18,620 Έτσι, αυτό είναι πραγματικά ωραία γιατί μπορώ να πω μόνο nnet 877 00:52:18,620 --> 00:52:21,767 και τότε είμαι regressing Υ Έτσι, το Υ είναι η στήλη. 878 00:52:21,767 --> 00:52:23,850 Και τότε την παλινδρόμηση σε οι άλλες δύο μεταβλητές. 879 00:52:23,850 --> 00:52:27,360 Έτσι, αυτό είναι μικρότερο σημειογραφία για Χ1 και Χ2. 880 00:52:27,360 --> 00:52:29,741 >> Ας πάμε μπροστά και να τρέξει αυτό. 881 00:52:29,741 --> 00:52:30,240 Ω, συγγνώμη. 882 00:52:30,240 --> 00:52:32,260 Θα πρέπει να τρέξει όλο αυτό το πράγμα. 883 00:52:32,260 --> 00:52:37,500 Και αυτό είναι μόνο η εκτύπωση σημειογραφία για το πόσο γρήγορα ή όχι γρήγορα 884 00:52:37,500 --> 00:52:38,460 συγκλίνει. 885 00:52:38,460 --> 00:52:41,420 Έτσι φαίνεται σαν να είχε συγκλίνει. 886 00:52:41,420 --> 00:52:44,970 Έτσι, επιτρέψτε μου να πάει μπροστά και εκτύπωσης τι αυτό μοιάζει. 887 00:52:44,970 --> 00:52:51,260 >> Δείτε εδώ είναι η εικόνα και εδώ είναι ένα περίγραμμα που δείχνει πόσο καλά ταιριάζει. 888 00:52:51,260 --> 00:52:56,380 Και αυτό είναι just-- μπορείτε να δείτε αυτό ότι αυτό είναι πολύ, πολύ ωραία. 889 00:52:56,380 --> 00:52:59,400 Θα μπορούσε ακόμη και να είναι overfitting, αλλά μπορείτε επίσης να 890 00:52:59,400 --> 00:53:03,390 αντιπροσωπεύουν αυτό με άλλες τεχνικές όπως διασταυρωμένης επικύρωσης. 891 00:53:03,390 --> 00:53:06,180 Και αυτά είναι επίσης ενσωματωμένη στο R. 892 00:53:06,180 --> 00:53:09,170 >> Και επιτρέψτε μου απλά να σας δείξω υποστηρίζουν μηχανή φορέα. 893 00:53:09,170 --> 00:53:12,470 Αυτό είναι ένα άλλο πολύ κοινό τεχνική μηχανικής μάθησης. 894 00:53:12,470 --> 00:53:18,550 Είναι πολύ παρόμοια με γραμμικά μοντέλα, αλλά χρησιμοποιεί αυτό που ονομάζεται μια μέθοδος πυρήνα. 895 00:53:18,550 --> 00:53:22,790 Και ας δούμε πόσο καλά ότι κάνει. 896 00:53:22,790 --> 00:53:26,430 Έτσι αυτό είναι πολύ παρόμοιο με το πώς και ένα νευρωνικό δίκτυο εκτελεί, 897 00:53:26,430 --> 00:53:27,900 αλλά είναι πολύ πιο ομαλή. 898 00:53:27,900 --> 00:53:35,740 Και αυτό βασίζεται στα ανοικτά του what-- πώς το έργο SVMs. 899 00:53:35,740 --> 00:53:40,250 >> Έτσι, αυτό είναι απλά ένα πολύ γρήγορη επισκόπηση μερικών 900 00:53:40,250 --> 00:53:43,822 από τις ενσωματωμένες λειτουργίες που μπορείτε να κάνετε και επίσης μερικά από την εξερεύνηση των δεδομένων. 901 00:53:43,822 --> 00:53:45,905 Έτσι, επιτρέψτε μου να πάει μπροστά και να πάει πίσω στις διαφάνειες. 902 00:53:45,905 --> 00:53:50,290 903 00:53:50,290 --> 00:53:53,670 >> Έτσι, προφανώς, αυτό είναι δεν είναι πολύ περιεκτική. 904 00:53:53,670 --> 00:53:57,140 Και αυτό είναι πραγματικά μόνο ένα τρέιλερ σας δείχνει τι πραγματικά μπορείτε να κάνετε στην R. 905 00:53:57,140 --> 00:53:59,100 Έτσι, αν θέλετε ακριβώς όπως για να μάθετε περισσότερα, εδώ 906 00:53:59,100 --> 00:54:01,210 είναι μια δέσμη των διαφορετικών πόρων. 907 00:54:01,210 --> 00:54:06,890 >> Έτσι, αν είστε λάτρης των βιβλίων ή είστε απλώς λάτρης της ανάγνωσης πράγματα σε απευθείας σύνδεση, 908 00:54:06,890 --> 00:54:09,670 τότε αυτό είναι ένα φανταστικό ένα από Hadley Wickham, 909 00:54:09,670 --> 00:54:13,010 ο οποίος δημιούργησε επίσης όλα αυτά πραγματικά δροσερό πακέτα. 910 00:54:13,010 --> 00:54:17,420 Αν είστε λάτρης του βίντεο, στη συνέχεια, Berkeley έχει μια τρομερή Bootcamp 911 00:54:17,420 --> 00:54:21,060 ότι είναι several-- αυτό είναι το είδος των μεγάλων. 912 00:54:21,060 --> 00:54:24,210 Και αυτό θα σας διδάξει σχεδόν όλα όσα θα θέλατε να ξέρετε για το R. 913 00:54:24,210 --> 00:54:27,770 >> Και ομοίως, υπάρχει Codeacademy και όλα αυτά άλλου είδους 914 00:54:27,770 --> 00:54:29,414 των διαδραστικών ιστοσελίδων. 915 00:54:29,414 --> 00:54:31,580 Είναι, επίσης, να πάρει common-- όλο και πιο συχνές. 916 00:54:31,580 --> 00:54:33,749 Έτσι, αυτό είναι πολύ παρόμοιο με Codeacademy. 917 00:54:33,749 --> 00:54:35,790 Και τέλος, αν απλά θέλουν κοινότητα και να συμβάλει, 918 00:54:35,790 --> 00:54:38,800 αυτά είναι ένα μάτσο πράγματα που μπορείτε να πάτε. 919 00:54:38,800 --> 00:54:40,880 Προφανώς, έχουμε ακόμη χρησιμοποιούν λίστες, απλά 920 00:54:40,880 --> 00:54:44,860 όπως και σχεδόν κάθε άλλη γλώσσα προγραμματισμού κοινότητα. 921 00:54:44,860 --> 00:54:47,880 Και #rstats, αυτό είναι κοινότητα μας στο Twitter. 922 00:54:47,880 --> 00:54:49,580 Αυτό είναι πραγματικά αρκετά κοινό. 923 00:54:49,580 --> 00:54:50,850 Και τότε ο χρήστης! 924 00:54:50,850 --> 00:54:52,340 Είναι απλά συνεδρίου μας. 925 00:54:52,340 --> 00:54:55,390 >> Και τότε, φυσικά, μπορείτε να χρησιμοποιήσουμε όλα αυτά τα άλλα Q & A πράγματα, 926 00:54:55,390 --> 00:54:57,680 όπως Υπερχείλιση στοίβας, Η Google, και στη συνέχεια GitHub. 927 00:54:57,680 --> 00:55:00,490 Επειδή τα περισσότερα από αυτά τα πακέτα και ένα μεγάλο μέρος της κοινότητας 928 00:55:00,490 --> 00:55:03,420 θα επικεντρωθεί γύρω από την ανάπτυξη Κωδικός γιατί είναι ανοικτού κώδικα. 929 00:55:03,420 --> 00:55:05,856 Και είναι ακριβώς πραγματικά ωραίο στο GitHub. 930 00:55:05,856 --> 00:55:08,730 Και τέλος, μπορείτε να επικοινωνήσετε μαζί μου αν απλά κάποιες γρήγορες ερωτήσεις. 931 00:55:08,730 --> 00:55:13,530 Έτσι, μπορείτε να με βρείτε στο Twitter εδώ, ιστοσελίδα μου, και μόνο το email μου. 932 00:55:13,530 --> 00:55:17,840 Έτσι, ελπίζουμε, ότι ήταν something-- σε μικρή τρέιλερ 933 00:55:17,840 --> 00:55:20,900 από ό, τι το R είναι πραγματικά ικανοί να κάνουν. 934 00:55:20,900 --> 00:55:23,990 Και ελπίζω, απλά ελέγξτε έξω αυτές τις τρεις συνδέσεις 935 00:55:23,990 --> 00:55:25,760 και να δείτε τι μπορείτε να κάνετε περισσότερα. 936 00:55:25,760 --> 00:55:28,130 Και υποθέτω ότι είναι ακριβώς γι 'αυτό. 937 00:55:28,130 --> 00:55:28,630 Ευχαριστώ. 938 00:55:28,630 --> 00:55:30,780 >> [Χειροκρότημα] 939 00:55:30,780 --> 00:55:31,968