1 00:00:07,200 --> 00:00:09,100 [Powered by Google Translate] ROB Bowden: Poďme hovoriť o kompilátory. 2 00:00:09,100 --> 00:00:11,490 Až do tohto bodu, ste práve zadali svoj zdrojový kód do 3 00:00:11,490 --> 00:00:14,260 Niektoré súbory, poslal prostredníctvom tohto veľkého čierneho poľa, ktoré je 4 00:00:14,260 --> 00:00:16,890 Rinčať, a von vychádza na spustiteľný súbor, ktorý robí 5 00:00:16,890 --> 00:00:19,430 presne to, čo ste napísal v zdrojovom kóde. 6 00:00:19,430 --> 00:00:22,170 Ako magický ako to už, budeme sa bližšie 7 00:00:22,170 --> 00:00:23,590 pozrite sa na to, čo sa vlastne deje 8 00:00:23,590 --> 00:00:25,220 keď sme kompiláciu súboru. 9 00:00:25,220 --> 00:00:28,580 Takže čo to znamená zostaviť niečo? 10 00:00:28,580 --> 00:00:31,150 >> No, v tom najvšeobecnejšom slova zmysle, to jednoducho znamená, 11 00:00:31,150 --> 00:00:32,580 transformácie kód napísaný v jednom 12 00:00:32,580 --> 00:00:34,680 programovací jazyk na iný. 13 00:00:34,680 --> 00:00:37,550 Ale väčšinou, keď ľudia hovoria, že zostaviť niečo, že 14 00:00:37,550 --> 00:00:39,660 znamená, že berieš to z vyššej úrovne programovania 15 00:00:39,660 --> 00:00:42,460 jazyka na nižšej jazykovej úrovni programovania. 16 00:00:42,460 --> 00:00:44,960 Tie môže zdať ako veľmi subjektívne hľadiska. 17 00:00:44,960 --> 00:00:48,090 Napríklad, pravdepodobne si nemyslím, že C ako vysoko 18 00:00:48,090 --> 00:00:51,440 úrovni programovací jazyk, ale nemáte skompilovať. 19 00:00:51,440 --> 00:00:52,730 Ale je to všetko relatívne. 20 00:00:52,730 --> 00:00:55,790 Ako uvidíme, kód zhromaždenie a nakoniec stroj 21 00:00:55,790 --> 00:00:59,270 kód, ktorý sme skompilovať dolu, je nesporne nižšia úroveň 22 00:00:59,270 --> 00:01:00,700 ako C. 23 00:01:00,700 --> 00:01:03,310 Hoci budeme používať zvonenie v dnešnom demonštráciu, 24 00:01:03,310 --> 00:01:06,360 Mnohé z nápadov tu preniesť na iné kompilátory. 25 00:01:06,360 --> 00:01:09,160 >> Pre Clang, existujú štyri hlavné kroky v celkovej 26 00:01:09,160 --> 00:01:10,200 kompilácie. 27 00:01:10,200 --> 00:01:15,430 Jedná sa o jeden, predspracovanie vykonáva preprocesoru, dva, 28 00:01:15,430 --> 00:01:19,530 zostavovaní vykonáva kompilátor, tri, montáž 29 00:01:19,530 --> 00:01:22,010 vykonáva assembleri, a štyri, 30 00:01:22,010 --> 00:01:24,640 prepojenie vykonáva linker. 31 00:01:24,640 --> 00:01:27,600 To môže byť mätúce, že jeden z čiastkové kroky v celkovej 32 00:01:27,600 --> 00:01:30,980 Rinčať prekladača sa nazýva prekladač, ale 33 00:01:30,980 --> 00:01:32,530 budeme sa k tomu. 34 00:01:32,530 --> 00:01:35,050 Budeme používať jednoduché Hello World program ako náš príklad 35 00:01:35,050 --> 00:01:36,270 v tomto videu. 36 00:01:36,270 --> 00:01:38,380 Poďme sa pozrieť. 37 00:01:38,380 --> 00:01:40,330 >> Prvým krokom je predspracovanie. 38 00:01:40,330 --> 00:01:42,520 Čo preprocesor robiť? 39 00:01:42,520 --> 00:01:45,560 V takmer všetkých C programu, ktoré ste kedy čítal alebo písomné, 40 00:01:45,560 --> 00:01:48,310 ste použili riadky kódu, ktoré začínajú s hash. 41 00:01:48,310 --> 00:01:51,730 Zavolám to hash, ale môžete tiež volať to libier, číslo 42 00:01:51,730 --> 00:01:53,280 prihlásiť, alebo ostré. 43 00:01:53,280 --> 00:01:56,840 Každá takáto linka je preprocesor smernice. 44 00:01:56,840 --> 00:02:00,650 Pravdepodobne ste už videli # define a # include skôr, ale 45 00:02:00,650 --> 00:02:03,690 niekoľko viac, že ​​preprocesor rozpoznáva. 46 00:02:03,690 --> 00:02:07,340 Dodajme # define nášho Hello World príklade. 47 00:02:07,340 --> 00:02:11,690 Teraz poďme spustí iba preprocesor na tento súbor. 48 00:02:11,690 --> 00:02:16,150 Odovzdaním CLAGE-E príznak, že ste pokyn, aby bol spustený 49 00:02:16,150 --> 00:02:17,880 len preprocesor. 50 00:02:17,880 --> 00:02:19,130 Poďme sa pozrieť, čo sa stane. 51 00:02:22,250 --> 00:02:24,020 Vyzerá to, že zvonenie len vypľuje všetko 52 00:02:24,020 --> 00:02:25,200 na príkazovom riadku. 53 00:02:25,200 --> 00:02:27,800 Aby bolo možné uložiť celú výstup do nového súboru nazvaného 54 00:02:27,800 --> 00:02:33,850 hello2.c, budeme pridávať> hello2.c našej príkazu. 55 00:02:33,850 --> 00:02:37,800 Teraz sa poďme pozrieť na naše preprocessed súboru. 56 00:02:37,800 --> 00:02:40,810 >> Whoa, čo sa stalo s našou krátke malé programu? 57 00:02:40,810 --> 00:02:43,890 Ak by sme ísť celú cestu až na dno tohto súboru, uvidíme 58 00:02:43,890 --> 00:02:46,070 niektoré kódu, ktoré skutočne napísal. 59 00:02:46,070 --> 00:02:49,800 Všimnite si, že # define je preč a všetky inštancie skôr 60 00:02:49,800 --> 00:02:51,950 boli nahradené presne to, čo sme špecifikovali v 61 00:02:51,950 --> 00:02:53,590 # Define riadok. 62 00:02:53,590 --> 00:02:56,530 Takže aké sú všetky tieto typedefs a funkcie vyhlásenie 63 00:02:56,530 --> 00:02:58,140 v hornej časti súboru? 64 00:02:58,140 --> 00:03:00,820 Všimnite si, že # define nebola jedinou preprocesor 65 00:03:00,820 --> 00:03:02,390 smernice, ktorú sme špecifikovali. 66 00:03:02,390 --> 00:03:05,280 Máme tiež # include stdio.h. 67 00:03:05,280 --> 00:03:09,560 Takže všetky bláznivých tratí sú vlastne len stdio.h kopírovať 68 00:03:09,560 --> 00:03:11,810 a vloží do hornej časti tohto súboru. 69 00:03:11,810 --> 00:03:14,110 To je dôvod, prečo hlavičkové súbory sú tak užitočné pre funkciu 70 00:03:14,110 --> 00:03:15,160 vyhlásenie. 71 00:03:15,160 --> 00:03:17,740 Namiesto toho, aby museli skopírovať a vložiť všetky funkcie 72 00:03:17,740 --> 00:03:21,050 vyhlásenie plánujete používať v hornej časti súboru, je 73 00:03:21,050 --> 00:03:22,990 preprocesor bude skopírovať a vložiť z hlavičky 74 00:03:22,990 --> 00:03:24,140 súbor pre vás. 75 00:03:24,140 --> 00:03:26,480 >> Teraz sme skončili predspracovanie, ideme do 76 00:03:26,480 --> 00:03:27,680 kompilácie. 77 00:03:27,680 --> 00:03:30,725 Dôvodom nazývame tento krok kompilácie je, pretože to je 78 00:03:30,725 --> 00:03:34,130 krok, kde zvonenie vlastne robí jeho kompiláciu z C na 79 00:03:34,130 --> 00:03:35,370 kód assembleri. 80 00:03:35,370 --> 00:03:38,280 Aby mal zvonenie zostaviť súbor do zhromaždenia, ale 81 00:03:38,280 --> 00:03:42,030 pokračovať ďalej, odovzdať ho the-S flag 82 00:03:42,030 --> 00:03:43,560 na príkazovom riadku. 83 00:03:43,560 --> 00:03:44,790 Poďme sa pozrieť na zhromaždenie 84 00:03:44,790 --> 00:03:47,390 súbor, ktorý bol na výstupe. 85 00:03:47,390 --> 00:03:49,740 Vyzerá to ako celkom inom jazyku. 86 00:03:49,740 --> 00:03:52,660 Montáž kód je veľmi špecifický procesor. 87 00:03:52,660 --> 00:03:55,440 V tomto prípade, vzhľadom k tomu CS50 spotrebič beží 88 00:03:55,440 --> 00:04:00,470 virtuálne x86 procesor, to je x86 kód assembleri. 89 00:04:00,470 --> 00:04:03,450 Veľmi málo ľudí písať priamo v assembleri v týchto dňoch, 90 00:04:03,450 --> 00:04:06,490 ale každý program C ste niekedy písať dostane transformovaná dole 91 00:04:06,490 --> 00:04:07,940 do zostavy. 92 00:04:07,940 --> 00:04:11,440 Opäť, nazývame tento krok zostavenie C do zostavy 93 00:04:11,440 --> 00:04:14,170 pretože sme sa ísť na vyššej úrovni na nižšiu úroveň 94 00:04:14,170 --> 00:04:15,480 programovacím jazykom,. 95 00:04:15,480 --> 00:04:17,880 >> Čo robí montáž nižšej úrovne, ako C? 96 00:04:17,880 --> 00:04:21,660 No, v zostave, sme veľmi obmedzené v tom, čo môžeme urobiť. 97 00:04:21,660 --> 00:04:25,120 Nie sú k dispozícii žiadne ak je, kým to, za to, alebo slučky akéhokoľvek druhu. 98 00:04:25,120 --> 00:04:27,560 Ale môžete dosiahnuť rovnaké veci, ktoré tieto kontroly 99 00:04:27,560 --> 00:04:30,270 štruktúry poskytujú pomocou obmedzených operácií, ktoré 100 00:04:30,270 --> 00:04:32,350 Zostava sa poskytujú. 101 00:04:32,350 --> 00:04:35,960 Ale vidieť, ako nízka úroveň montáž je naozaj, poďme 102 00:04:35,960 --> 00:04:39,320 o krok ďalej v našej kompilácie, montáž. 103 00:04:39,320 --> 00:04:41,890 Je to assembler je úloha transformovať kód assembleri 104 00:04:41,890 --> 00:04:44,740 do objektu alebo v strojovom kóde. 105 00:04:44,740 --> 00:04:47,610 Pamätajte si, že assembler nie je výstupný zostavu; 106 00:04:47,610 --> 00:04:51,080 trochu, to sa berie v zostave a výstupy strojovom kóde. 107 00:04:51,080 --> 00:04:54,040 Strojový kód je skutočná 1 a 0, že CPU môže 108 00:04:54,040 --> 00:04:57,290 pochopiť, aj keď sme ešte trošku práce zostáva 109 00:04:57,290 --> 00:04:59,380 Než budeme môcť spustiť náš program. 110 00:04:59,380 --> 00:05:01,400 Poďme zostaviť náš kód assembleri odovzdaním 111 00:05:01,400 --> 00:05:04,080 Rinčanie-c vlajky. 112 00:05:04,080 --> 00:05:06,410 Teraz sa pozrime, čo je v zmontovanom súboru. 113 00:05:06,410 --> 00:05:09,220 >> No, to nám nepomôže moc. 114 00:05:09,220 --> 00:05:11,340 Pamätajte si, že strojový kód je jedničiek a núl, že 115 00:05:11,340 --> 00:05:13,240 Váš počítač môže pochopiť. 116 00:05:13,240 --> 00:05:16,080 To neznamená, že je to pre nás ľahké pochopiť. 117 00:05:16,080 --> 00:05:19,160 Tak presne tak, ako nízka úroveň je montáž? 118 00:05:19,160 --> 00:05:21,480 Je to takmer totožné s objektovým kódom. 119 00:05:21,480 --> 00:05:24,300 Prechod z montáže do strojového kódu, je oveľa viac 120 00:05:24,300 --> 00:05:27,540 Preklad ako transformácie, čo je dôvod, prečo 121 00:05:27,540 --> 00:05:29,310 človek nemusí považovať assembler 122 00:05:29,310 --> 00:05:31,400 robiť žiadnu skutočnú kompiláciu. 123 00:05:31,400 --> 00:05:34,110 V skutočnosti, je to celkom jednoduché, aby manuálne preložiť z 124 00:05:34,110 --> 00:05:36,050 montáž do strojového kódu. 125 00:05:36,050 --> 00:05:39,040 Pri pohľade na zostavy pre hlavné funkcie, ktoré prvý riadok 126 00:05:39,040 --> 00:05:42,100 stane odpovedať hexadecimálne 0x55. 127 00:05:42,100 --> 00:05:45,470 V binárne, je to 1010101. 128 00:05:45,470 --> 00:05:49,300 Druhý riadok sa stane odpovedať hexadecimálne 0x895. 129 00:05:49,300 --> 00:05:51,290 A ďalšie, 0x56. 130 00:05:51,290 --> 00:05:53,730 Vzhľadom k tomu, relatívne jednoduchá tabuľka, môžete preložiť 131 00:05:53,730 --> 00:05:57,130 montáž do kódu, že stroje môžu rozumieť tiež. 132 00:05:57,130 --> 00:05:58,810 >> Takže je tu ešte jedna zostávajúce krok 133 00:05:58,810 --> 00:06:01,150 zostavovanie, ktoré ich spája. 134 00:06:01,150 --> 00:06:04,530 Prepojenie kombinuje veľa objektových súborov do jedného veľkého súboru 135 00:06:04,530 --> 00:06:06,380 že môžete skutočne urobiť. 136 00:06:06,380 --> 00:06:08,570 Prepojenie je veľmi závislá na systéme. 137 00:06:08,570 --> 00:06:11,030 Takže najjednoduchší spôsob, ako sa dostať zvonenie len prepojiť objekt 138 00:06:11,030 --> 00:06:13,920 Súbory spoločne je zavolať zařinčení na všetkých súborov, ktoré 139 00:06:13,920 --> 00:06:15,190 Ak chcete prepojiť. 140 00:06:15,190 --> 00:06:18,740 Ak zadáte. O súbory, potom to nebude musieť znovu spracovať, 141 00:06:18,740 --> 00:06:21,680 zostaviť, a montujeme všetky vaše zdrojového kódu. 142 00:06:21,680 --> 00:06:23,960 Poďme hodiť matematickú funkciu do nášho súboru, takže máme 143 00:06:23,960 --> 00:06:25,210 niečo prepojiť palcov 144 00:06:34,220 --> 00:06:37,010 Teraz poďme zostaviť ho naspäť do objektového kódu a 145 00:06:37,010 --> 00:06:38,260 volanie zvoniť na neho. 146 00:06:40,560 --> 00:06:41,420 Chybička sa vlúdila. 147 00:06:41,420 --> 00:06:43,790 Vzhľadom k tomu, sme zaradili na matematickú funkciu, musíme prepojiť v 148 00:06:43,790 --> 00:06:46,610 matematická knižnica s-lm. 149 00:06:46,610 --> 00:06:48,990 >> Ak by sme chceli prepojiť veľa. O súbory, ktoré sme 150 00:06:48,990 --> 00:06:51,420 napísal na naše vlastné, by sme stačí zadať ich všetky 151 00:06:51,420 --> 00:06:52,460 príkazového riadku. 152 00:06:52,460 --> 00:06:55,320 Obmedzenie je, že iba jeden z týchto súborov musí byť 153 00:06:55,320 --> 00:06:57,790 skutočne určiť hlavnú funkciu, inak 154 00:06:57,790 --> 00:06:59,930 Výsledný spustiteľný by som nevedel, kde začať 155 00:06:59,930 --> 00:07:00,910 spustenie kódu. 156 00:07:00,910 --> 00:07:03,360 Aký je rozdiel medzi určením súboru prepojenie s 157 00:07:03,360 --> 00:07:06,600 s-l a len zadaním súbor priamo? 158 00:07:06,600 --> 00:07:07,440 Nič. 159 00:07:07,440 --> 00:07:09,850 Je to len, že zvonenie sa stane presne vedieť, čo súbor 160 00:07:09,850 --> 00:07:12,560 niečo ako-lm stane sa odkazovať na. 161 00:07:12,560 --> 00:07:14,700 Ak ste vedel, že súbor sami, môžete špecifikovať 162 00:07:14,700 --> 00:07:15,930 explicitne. 163 00:07:15,930 --> 00:07:18,990 Len nezabudnite, že all-l vlajky majú prísť na konci 164 00:07:18,990 --> 00:07:20,770 Vašej dopytu klientov. 165 00:07:20,770 --> 00:07:22,300 >> A to je všetko, čo je k tomu. 166 00:07:22,300 --> 00:07:24,940 Keď stačí spustiť zvonenie niektorých súborov, to je to, čo to je 167 00:07:24,940 --> 00:07:26,350 vlastne robí. 168 00:07:26,350 --> 00:07:29,490 Moje meno je Rob Bowden, a to je CS50.