1 00:00:07,200 --> 00:00:09,100 [Powered by Google Translate] ROB BOWDEN: Ας μιλήσουμε για μεταγλωττιστές. 2 00:00:09,100 --> 00:00:11,490 Μέχρι αυτό το σημείο, έχετε μόλις πληκτρολογήσατε μέχρι τον πηγαίο κώδικα σε σας 3 00:00:11,490 --> 00:00:14,260 κάποια αρχεία, τους έστειλε μέσα από αυτό το μεγάλο μαύρο κουτί που είναι 4 00:00:14,260 --> 00:00:16,890 Clang, και βγαίνει εκτελέσιμο αρχείο σας που κάνει 5 00:00:16,890 --> 00:00:19,430 ακριβώς αυτό που έγραψε στον πηγαίο κώδικα σας. 6 00:00:19,430 --> 00:00:22,170 Όπως μαγικό ως που είναι ήδη, θα πάμε να ρίξουμε μια πιο προσεκτική 7 00:00:22,170 --> 00:00:23,590 δούμε τι πραγματικά συμβαίνει 8 00:00:23,590 --> 00:00:25,220 όταν θα καταρτίζουν φάκελο. 9 00:00:25,220 --> 00:00:28,580 Λοιπόν, τι σημαίνει αυτό για την κατάρτιση κάτι; 10 00:00:28,580 --> 00:00:31,150 >> Λοιπόν, στην πιο γενική έννοια, αυτό σημαίνει απλώς 11 00:00:31,150 --> 00:00:32,580 μετατροπή κώδικα γραμμένο σε ένα 12 00:00:32,580 --> 00:00:34,680 γλώσσα προγραμματισμού στην άλλη. 13 00:00:34,680 --> 00:00:37,550 Αλλά συνήθως όταν οι άνθρωποι λένε ότι συγκεντρώνουν κάτι, 14 00:00:37,550 --> 00:00:39,660 σημαίνει ότι είναι το παίρνετε από ένα υψηλότερο επίπεδο προγραμματισμού 15 00:00:39,660 --> 00:00:42,460 γλώσσας σε ένα χαμηλότερο επίπεδο γλώσσας προγραμματισμού. 16 00:00:42,460 --> 00:00:44,960 Αυτά μπορεί να φαίνεται σαν πολύ υποκειμενική άποψη. 17 00:00:44,960 --> 00:00:48,090 Για παράδειγμα, ίσως δεν σκέφτονται C ως υψηλή 18 00:00:48,090 --> 00:00:51,440 επιπέδου γλώσσα προγραμματισμού, αλλά εσείς το υπολογίσουν. 19 00:00:51,440 --> 00:00:52,730 Αλλά είναι όλα σχετικά. 20 00:00:52,730 --> 00:00:55,790 Όπως θα δούμε, ο κωδικός συναρμολόγησης και τελικά μηχανή 21 00:00:55,790 --> 00:00:59,270 κώδικα που συγκεντρώνει κάτω για να είναι αναμφισβήτητα ένα χαμηλότερο επίπεδο 22 00:00:59,270 --> 00:01:00,700 από το C. 23 00:01:00,700 --> 00:01:03,310 Αν και θα πρέπει να χρησιμοποιούν Clang σε διαδήλωση σήμερα, ένα 24 00:01:03,310 --> 00:01:06,360 Πολλές από τις ιδέες εδώ μεταφέρει σε άλλες μεταγλωττιστές. 25 00:01:06,360 --> 00:01:09,160 >> Για Clang, υπάρχουν τέσσερα βασικά βήματα στη συνολική 26 00:01:09,160 --> 00:01:10,200 σύνταξη. 27 00:01:10,200 --> 00:01:15,430 Αυτά είναι ένα, προεπεξεργασία γίνεται από τον προεπεξεργαστή? Δύο, 28 00:01:15,430 --> 00:01:19,530 συλλογή γίνεται από τον compiler? τρία, συναρμολόγηση 29 00:01:19,530 --> 00:01:22,010 γίνεται από το συναρμολογητή? και τέσσερα, 30 00:01:22,010 --> 00:01:24,640 σύνδεση γίνεται από το συνδέτη. 31 00:01:24,640 --> 00:01:27,600 Μπορεί να προκαλέσει σύγχυση ότι ένα από τα υποστάδια της συνολικής 32 00:01:27,600 --> 00:01:30,980 Μεταγλωττιστές Clang ονομάζεται ο compiler, αλλά 33 00:01:30,980 --> 00:01:32,530 θα φτάσουμε σε αυτό. 34 00:01:32,530 --> 00:01:35,050 Θα πρέπει να χρησιμοποιείτε ένα απλό πρόγραμμα Hello World ως παράδειγμα μας 35 00:01:35,050 --> 00:01:36,270 σε όλο αυτό το βίντεο. 36 00:01:36,270 --> 00:01:38,380 Ας ρίξουμε μια ματιά. 37 00:01:38,380 --> 00:01:40,330 >> Το πρώτο βήμα είναι η προεπεξεργασία. 38 00:01:40,330 --> 00:01:42,520 Τι κάνει η προεπεξεργαστή κάνει; 39 00:01:42,520 --> 00:01:45,560 Σε σχεδόν κάθε πρόγραμμα C που έχετε ποτέ διαβάσει ή να γράψει, 40 00:01:45,560 --> 00:01:48,310 έχετε χρησιμοποιήσει γραμμές κώδικα που αρχίζουν με ένα hash. 41 00:01:48,310 --> 00:01:51,730 Θα καλέσω το χασίς, αλλά μπορείτε επίσης να το ονομάσουμε κιλά, αριθμός 42 00:01:51,730 --> 00:01:53,280 υπογράψουν, ή αιχμηρά. 43 00:01:53,280 --> 00:01:56,840 Κάθε τέτοια γραμμή είναι μια οδηγία προεπεξεργαστή. 44 00:01:56,840 --> 00:02:00,650 Πιθανόν να έχετε δει # define και # include πριν, αλλά υπάρχει 45 00:02:00,650 --> 00:02:03,690 είναι αρκετά περισσότερο ότι το προεπεξεργαστή αναγνωρίζει. 46 00:02:03,690 --> 00:02:07,340 Ας προσθέσουμε μια # define για παράδειγμα γεια κόσμο μας. 47 00:02:07,340 --> 00:02:11,690 Τώρα ας τρέχει μόνο το προεπεξεργαστή σε αυτό το αρχείο. 48 00:02:11,690 --> 00:02:16,150 Με το πέρασμα clage η σημαία-Ε, είστε εντολή να τρέξει 49 00:02:16,150 --> 00:02:17,880 μόνο η προεπεξεργαστή. 50 00:02:17,880 --> 00:02:19,130 Ας δούμε τι θα συμβεί. 51 00:02:22,250 --> 00:02:24,020 Μοιάζει Clang φτύνει απλά τα πάντα 52 00:02:24,020 --> 00:02:25,200 στη γραμμή εντολών. 53 00:02:25,200 --> 00:02:27,800 Για να αποθηκεύσετε ολόκληρο το έξοδο να ονομάζεται ένα νέο αρχείο 54 00:02:27,800 --> 00:02:33,850 hello2.c, θα προσαρτήσει> hello2.c στην εντολή μας. 55 00:02:33,850 --> 00:02:37,800 Τώρα, ας ρίξουμε μια ματιά στο αρχείο μας προεπεξεργασμένων. 56 00:02:37,800 --> 00:02:40,810 >> Πω πω, τι συνέβη στο μικρό μικρό πρόγραμμα μας; 57 00:02:40,810 --> 00:02:43,890 Αν πάμε σε όλη τη διαδρομή προς τα κάτω αυτού του αρχείου, θα δούμε 58 00:02:43,890 --> 00:02:46,070 μερικές από τον κωδικό που πραγματικά έγραψε. 59 00:02:46,070 --> 00:02:49,800 Παρατηρήστε ότι το # define έχει φύγει και όλες οι περιπτώσεις της ονομασίας 60 00:02:49,800 --> 00:02:51,950 έχουν αντικατασταθεί με ακριβώς αυτό που ορίζεται στο 61 00:02:51,950 --> 00:02:53,590 το # define γραμμή. 62 00:02:53,590 --> 00:02:56,530 Έτσι, τι είναι όλα αυτά τα typedefs και δηλώσεις λειτουργία 63 00:02:56,530 --> 00:02:58,140 στην κορυφή του αρχείου; 64 00:02:58,140 --> 00:03:00,820 Παρατηρήστε ότι το # define δεν ήταν η μόνη προεπεξεργαστή 65 00:03:00,820 --> 00:03:02,390 οδηγίας που ορίζεται. 66 00:03:02,390 --> 00:03:05,280 Έχουμε επίσης συμπεριλάβει # stdio.h. 67 00:03:05,280 --> 00:03:09,560 Έτσι, όλα τα τρελά γραμμές είναι στην πραγματικότητα απλά stdio.h αντιγραφεί 68 00:03:09,560 --> 00:03:11,810 και επικολληθεί στην κορυφή αυτού του αρχείου. 69 00:03:11,810 --> 00:03:14,110 Αυτός είναι ο λόγος που τα αρχεία κεφαλίδας είναι τόσο χρήσιμα για τη λειτουργία 70 00:03:14,110 --> 00:03:15,160 δηλώσεις. 71 00:03:15,160 --> 00:03:17,740 Αντί να χρειάζεται να αντιγράψετε και να επικολλήσετε όλα της συνάρτησης 72 00:03:17,740 --> 00:03:21,050 δηλώσεις που σκοπεύετε να χρησιμοποιήσετε στην κορυφή του αρχείου σας, οι 73 00:03:21,050 --> 00:03:22,990 προεπεξεργαστή θα αντιγράψετε και να επικολλήσετε τους από την επικεφαλίδα 74 00:03:22,990 --> 00:03:24,140 αρχείο για εσάς. 75 00:03:24,140 --> 00:03:26,480 >> Τώρα που τελειώσαμε προεπεξεργασία, θα προχωρήσουμε σε 76 00:03:26,480 --> 00:03:27,680 σύνταξη. 77 00:03:27,680 --> 00:03:30,725 Ο λόγος που το ονομάζουμε συλλογή βήμα είναι επειδή αυτό είναι 78 00:03:30,725 --> 00:03:34,130 το βήμα όπου πραγματικά δεν Clang κατάρτιση του από C έως 79 00:03:34,130 --> 00:03:35,370 κώδικα assembly. 80 00:03:35,370 --> 00:03:38,280 Για να έχουμε Clang καταρτίζουν φάκελο κάτω από τη συναρμολόγηση, αλλά 81 00:03:38,280 --> 00:03:42,030 δεν συνεχιστεί περαιτέρω, να περάσει η σημαία-S 82 00:03:42,030 --> 00:03:43,560 στη γραμμή εντολών. 83 00:03:43,560 --> 00:03:44,790 Ας ρίξουμε μια ματιά στη συνέλευση 84 00:03:44,790 --> 00:03:47,390 αρχείο που εξάγεται. 85 00:03:47,390 --> 00:03:49,740 Μοιάζει αρκετά διαφορετική γλώσσα. 86 00:03:49,740 --> 00:03:52,660 Συνέλευση κώδικας είναι πολύ συγκεκριμένο επεξεργαστή. 87 00:03:52,660 --> 00:03:55,440 Σε αυτή την περίπτωση, δεδομένου ότι η συσκευή CS50 εκτελείται σε ένα 88 00:03:55,440 --> 00:04:00,470 εικονικό επεξεργαστή x86, αυτό είναι x86 κώδικα assembly. 89 00:04:00,470 --> 00:04:03,450 Πολύ λίγοι άνθρωποι γράφουν κατευθείαν σε κώδικα assembly αυτές τις μέρες, 90 00:04:03,450 --> 00:04:06,490 αλλά κάθε πρόγραμμα C Έχετε ποτέ γράψει μεταμορφώνεται κάτω 91 00:04:06,490 --> 00:04:07,940 σε συνέλευση. 92 00:04:07,940 --> 00:04:11,440 Και πάλι, καλούμε αυτό το βήμα την κατάρτιση του C σε συνέλευση 93 00:04:11,440 --> 00:04:14,170 αφού έχουμε μετάβαση από ένα υψηλότερο επίπεδο σε ένα χαμηλότερο επίπεδο 94 00:04:14,170 --> 00:04:15,480 γλώσσα προγραμματισμού. 95 00:04:15,480 --> 00:04:17,880 >> Αυτό που κάνει τη συναρμολόγηση χαμηλότερο επίπεδο από ό, τι C; 96 00:04:17,880 --> 00:04:21,660 Λοιπόν, στη συναρμολόγηση, είμαστε πολύ περιορισμένες σε ό, τι μπορούμε να κάνουμε. 97 00:04:21,660 --> 00:04:25,120 Δεν υπάρχουν αν, ενώ είναι, για είναι, ή βρόχους οποιουδήποτε είδους. 98 00:04:25,120 --> 00:04:27,560 Αλλά μπορείτε να πετύχετε τα ίδια πράγματα που αυτοί τον έλεγχο 99 00:04:27,560 --> 00:04:30,270 δομές προσφέρουν χρησιμοποιώντας τις περιορισμένες λειτουργίες που 100 00:04:30,270 --> 00:04:32,350 συνέλευση δεν παρέχουν. 101 00:04:32,350 --> 00:04:35,960 Αλλά για να δείτε πόσο χαμηλό επίπεδο συγκέντρωσης είναι πραγματικά, ας πάμε 102 00:04:35,960 --> 00:04:39,320 ένα βήμα παραπέρα στη συλλογή μας, τη συναρμολόγηση. 103 00:04:39,320 --> 00:04:41,890 Είναι δουλειά του συναρμολογητή να μετατρέψει τον κώδικα συναρμολόγησης 104 00:04:41,890 --> 00:04:44,740 σε αντικείμενο ή κώδικα μηχανής. 105 00:04:44,740 --> 00:04:47,610 Να θυμάστε ότι ο assembler δεν συνέλευση εξόδου? 106 00:04:47,610 --> 00:04:51,080 μάλλον, παίρνει στη συναρμολόγηση και εξόδους κώδικα μηχανής. 107 00:04:51,080 --> 00:04:54,040 Κώδικα μηχανής είναι η πραγματική 1 και 0 ότι η CPU μπορεί να 108 00:04:54,040 --> 00:04:57,290 κατανοήσουν, αν και έχουμε ακόμα ένα μικρό κομμάτι της εργασίας αριστερά 109 00:04:57,290 --> 00:04:59,380 για να μπορέσουμε να τρέξουμε το πρόγραμμά μας. 110 00:04:59,380 --> 00:05:01,400 Ας συγκεντρώσει κώδικα assembly μας με το πέρασμα 111 00:05:01,400 --> 00:05:04,080 Clang η σημαία-c. 112 00:05:04,080 --> 00:05:06,410 Τώρα, ας δούμε τι είναι στην συναρμολογημένη αρχείο. 113 00:05:06,410 --> 00:05:09,220 >> Λοιπόν, αυτό δεν μας βοηθά πάρα πολύ. 114 00:05:09,220 --> 00:05:11,340 Να θυμάστε ότι ο κώδικας μηχανής είναι αυτά και μηδενικά που 115 00:05:11,340 --> 00:05:13,240 ο υπολογιστής σας μπορεί να καταλάβει. 116 00:05:13,240 --> 00:05:16,080 Αυτό δεν σημαίνει ότι είναι εύκολο για μας να καταλάβουμε. 117 00:05:16,080 --> 00:05:19,160 Έτσι ακριβώς πόσο χαμηλό επίπεδο είναι η συνέλευση; 118 00:05:19,160 --> 00:05:21,480 Είναι σχεδόν ταυτόσημη με αντικειμενικό κώδικα. 119 00:05:21,480 --> 00:05:24,300 Η μετάβαση από τη συναρμολόγηση σε κώδικα αντικειμένου είναι κάτι πολύ περισσότερο από ένα 120 00:05:24,300 --> 00:05:27,540 μετάφραση από μια μεταμόρφωση, η οποία είναι ο λόγος 121 00:05:27,540 --> 00:05:29,310 κανείς δεν θα μπορούσε να εξετάσει το συναρμολόγησης να 122 00:05:29,310 --> 00:05:31,400 κάνει οποιαδήποτε πραγματική compiling. 123 00:05:31,400 --> 00:05:34,110 Στην πραγματικότητα, είναι αρκετά εύκολο να μεταφράσει από το χέρι 124 00:05:34,110 --> 00:05:36,050 συναρμολόγηση σε κώδικα μηχανής. 125 00:05:36,050 --> 00:05:39,040 Κοιτάζοντας το συγκρότημα για μια κύρια λειτουργία, ότι η πρώτη γραμμή 126 00:05:39,040 --> 00:05:42,100 συμβαίνει να αντιστοιχούν σε δεκαεξαδικό 0x55. 127 00:05:42,100 --> 00:05:45,470 Στο δυαδικό, αυτό είναι 1010101. 128 00:05:45,470 --> 00:05:49,300 Η δεύτερη γραμμή συμβαίνει να αντιστοιχούν δεκαεξαδικό 0x895. 129 00:05:49,300 --> 00:05:51,290 Και το επόμενο, 0x56. 130 00:05:51,290 --> 00:05:53,730 Λαμβάνοντας υπόψη ένα σχετικά απλό τραπέζι, θα μπορούσε να μεταφράσει 131 00:05:53,730 --> 00:05:57,130 συναρμολόγηση στον κώδικα ότι οι μηχανές μπορούν να καταλάβουν πάρα πολύ. 132 00:05:57,130 --> 00:05:58,810 >> Έτσι, υπάρχει ένα υπόλοιπο βήμα 133 00:05:58,810 --> 00:06:01,150 συλλογή, η οποία συνδέει. 134 00:06:01,150 --> 00:06:04,530 Η σύνδεση συνδυάζει μια δέσμη των αρχείων αντικειμένου σε ένα μεγάλο αρχείο 135 00:06:04,530 --> 00:06:06,380 ότι μπορείτε πραγματικά να εκτελέσει. 136 00:06:06,380 --> 00:06:08,570 Η σύνδεση είναι πολύ εξαρτάται από το σύστημα. 137 00:06:08,570 --> 00:06:11,030 Έτσι, ο ευκολότερος τρόπος για να πάρετε Clang να συνδέσει μόνο αντικείμενο 138 00:06:11,030 --> 00:06:13,920 αρχεία μαζί είναι να καλέσετε Clang για όλα τα αρχεία που 139 00:06:13,920 --> 00:06:15,190 θέλετε να συνδέσετε μαζί. 140 00:06:15,190 --> 00:06:18,740 Εάν καθορίσετε. O αρχεία, τότε δεν θα χρειαστεί να επανεπεξεργασία, 141 00:06:18,740 --> 00:06:21,680 καταρτίζουν και συγκεντρώνουν όλες του πηγαίου κώδικα σας. 142 00:06:21,680 --> 00:06:23,960 Ας ρίξει μια λειτουργία μαθηματικά στο αρχείο μας, έτσι έχουμε 143 00:06:23,960 --> 00:06:25,210 κάτι να συνδέσει μέσα 144 00:06:34,220 --> 00:06:37,010 Τώρα ας το υπολογίσουν πίσω κάτω από τον αντικειμενικό κώδικα και 145 00:06:37,010 --> 00:06:38,260 καλέστε Clang σε αυτό. 146 00:06:40,560 --> 00:06:41,420 Ωχ. 147 00:06:41,420 --> 00:06:43,790 Από τη στιγμή που περιλάμβανε μια λειτουργία μαθηματικά, θα πρέπει να συνδεθεί σε 148 00:06:43,790 --> 00:06:46,610 η βιβλιοθήκη με τα μαθηματικά-lm. 149 00:06:46,610 --> 00:06:48,990 >> Αν θέλαμε να συνδέσει μαζί μάτσο αρχεία. O ότι εμείς 150 00:06:48,990 --> 00:06:51,420 έγραψε τη δική μας, εμείς θα προσδιορίζει ακριβώς όλα αυτά σε ο 151 00:06:51,420 --> 00:06:52,460 γραμμή εντολών. 152 00:06:52,460 --> 00:06:55,320 Ο περιορισμός είναι ότι μόνο ένα από αυτά τα αρχεία πρέπει να 153 00:06:55,320 --> 00:06:57,790 πραγματικά καθορίσετε μια κύρια λειτουργία, ή αλλιώς η 154 00:06:57,790 --> 00:06:59,930 εκτελέσιμο που προκύπτει δεν θα ξέρουν από πού να αρχίσω 155 00:06:59,930 --> 00:07:00,910 εκτέλεση κώδικα σας. 156 00:07:00,910 --> 00:07:03,360 Ποια είναι η διαφορά μεταξύ καθορίζοντας ένα αρχείο για να συνδεθείτε σε 157 00:07:03,360 --> 00:07:06,600 με-l και μόνο προσδιορίζοντας ένα αρχείο απ 'ευθείας; 158 00:07:06,600 --> 00:07:07,440 Τίποτα. 159 00:07:07,440 --> 00:07:09,850 Είναι ακριβώς αυτό που συμβαίνει Clang να γνωρίζουμε ακριβώς τι αρχείο 160 00:07:09,850 --> 00:07:12,560 κάτι σαν-lm συμβαίνει να αναφερθώ. 161 00:07:12,560 --> 00:07:14,700 Αν ήξερα τον εαυτό σας ότι το αρχείο, μπορείτε να καθορίσετε το 162 00:07:14,700 --> 00:07:15,930 ρητά. 163 00:07:15,930 --> 00:07:18,990 Απλώς να θυμάστε ότι όλοι-l σημαίες πρέπει να έρθει στο τέλος 164 00:07:18,990 --> 00:07:20,770 της ζήτησης του πελάτη σας. 165 00:07:20,770 --> 00:07:22,300 >> Και αυτό είναι όλα υπάρχει σε αυτό. 166 00:07:22,300 --> 00:07:24,940 Όταν εκτελείτε μόνο Clang σε ορισμένα αρχεία, αυτό είναι ό, τι είναι 167 00:07:24,940 --> 00:07:26,350 πραγματικά κάνει. 168 00:07:26,350 --> 00:07:29,490 Το όνομά μου είναι Rob Bowden, και αυτό είναι CS50.