1 00:00:07,200 --> 00:00:09,100 [Powered by Google Translate] ROB BOWDEN: Pojďme mluvit o kompilátory. 2 00:00:09,100 --> 00:00:11,490 Až do tohoto bodu, jste právě zadali svůj zdrojový kód do 3 00:00:11,490 --> 00:00:14,260 Některé soubory, poslal prostřednictvím tohoto velkého černého pole, které je 4 00:00:14,260 --> 00:00:16,890 Řinčet, a ven vychází na spustitelný soubor, který dělá 5 00:00:16,890 --> 00:00:19,430 přesně to, co jste napsal ve zdrojovém kódu. 6 00:00:19,430 --> 00:00:22,170 Jak magický jako to už, budeme se blíže 7 00:00:22,170 --> 00:00:23,590 podívejte se na to, co se vlastně děje 8 00:00:23,590 --> 00:00:25,220 když jsme kompilaci souboru. 9 00:00:25,220 --> 00:00:28,580 Takže co to znamená sestavit něco? 10 00:00:28,580 --> 00:00:31,150 >> No, v tom nejobecnějším slova smyslu, to prostě znamená, 11 00:00:31,150 --> 00:00:32,580 transformace kód napsaný v jednom 12 00:00:32,580 --> 00:00:34,680 programovací jazyk na jiný. 13 00:00:34,680 --> 00:00:37,550 Ale většinou, když lidé říkají, že sestavit něco, že 14 00:00:37,550 --> 00:00:39,660 znamená, že bereš to z vyšší úrovně programování 15 00:00:39,660 --> 00:00:42,460 jazyka na nižší jazykové úrovni programování. 16 00:00:42,460 --> 00:00:44,960 Ty může zdát jako velmi subjektivní hlediska. 17 00:00:44,960 --> 00:00:48,090 Například, pravděpodobně si nemyslím, že C jako vysoce 18 00:00:48,090 --> 00:00:51,440 úrovni programovací jazyk, ale nemáte zkompilovat. 19 00:00:51,440 --> 00:00:52,730 Ale je to všechno relativní. 20 00:00:52,730 --> 00:00:55,790 Jak uvidíme, kód assembleru a nakonec stroj 21 00:00:55,790 --> 00:00:59,270 kód, který jsme zkompilovat dolů, je nesporně nižší úroveň 22 00:00:59,270 --> 00:01:00,700 než C. 23 00:01:00,700 --> 00:01:03,310 Přestože budeme používat zvonění v dnešním demonstraci, 24 00:01:03,310 --> 00:01:06,360 Mnoho z nápadů zde přenést na jiné kompilátory. 25 00:01:06,360 --> 00:01:09,160 >> Pro Clang, existují čtyři hlavní kroky v celkové 26 00:01:09,160 --> 00:01:10,200 kompilace. 27 00:01:10,200 --> 00:01:15,430 Jedná se o jeden, předzpracování provádí preprocesoru, dva, 28 00:01:15,430 --> 00:01:19,530 sestavování provádí kompilátor, tři, montáž 29 00:01:19,530 --> 00:01:22,010 provádí assembleru, a čtyři, 30 00:01:22,010 --> 00:01:24,640 propojení provádí linker. 31 00:01:24,640 --> 00:01:27,600 To může být matoucí, že jeden z dílčí kroky v celkové 32 00:01:27,600 --> 00:01:30,980 Řinčet překladače se nazývá překladač, ale 33 00:01:30,980 --> 00:01:32,530 budeme se k tomu. 34 00:01:32,530 --> 00:01:35,050 Budeme používat jednoduché Hello World program jako náš příklad 35 00:01:35,050 --> 00:01:36,270 v tomto videu. 36 00:01:36,270 --> 00:01:38,380 Pojďme se podívat. 37 00:01:38,380 --> 00:01:40,330 >> Prvním krokem je předzpracování. 38 00:01:40,330 --> 00:01:42,520 Co preprocesoru dělat? 39 00:01:42,520 --> 00:01:45,560 V téměř všech C programu, které jste kdy četl nebo písemné, 40 00:01:45,560 --> 00:01:48,310 jste použili řádky kódu, které začínají s hash. 41 00:01:48,310 --> 00:01:51,730 Zavolám to hash, ale můžete také volat to liber, číslo 42 00:01:51,730 --> 00:01:53,280 přihlásit, nebo ostré. 43 00:01:53,280 --> 00:01:56,840 Každá taková linka je preprocesor směrnice. 44 00:01:56,840 --> 00:02:00,650 Pravděpodobně jste již viděli # define a # include dříve, ale 45 00:02:00,650 --> 00:02:03,690 několik více, že preprocesor rozpoznává. 46 00:02:03,690 --> 00:02:07,340 Dodejme # define našeho Hello World příkladu. 47 00:02:07,340 --> 00:02:11,690 Nyní pojďme spustí pouze preprocesor na tento soubor. 48 00:02:11,690 --> 00:02:16,150 Předáním CLAGE-E příznak, že jste pokyn, aby byl spuštěn 49 00:02:16,150 --> 00:02:17,880 jen preprocesor. 50 00:02:17,880 --> 00:02:19,130 Pojďme se podívat, co se stane. 51 00:02:22,250 --> 00:02:24,020 Vypadá to, že zvonění jen vyplivne všechno 52 00:02:24,020 --> 00:02:25,200 na příkazovém řádku. 53 00:02:25,200 --> 00:02:27,800 Aby bylo možné uložit celou výstup do nového souboru nazvaného 54 00:02:27,800 --> 00:02:33,850 hello2.c, budeme přidávat> hello2.c naší příkazu. 55 00:02:33,850 --> 00:02:37,800 Nyní se pojďme podívat na naše preprocessed souboru. 56 00:02:37,800 --> 00:02:40,810 >> Whoa, co se stalo s naší krátké malé programu? 57 00:02:40,810 --> 00:02:43,890 Pokud bychom jet celou cestu až na dno tohoto souboru, uvidíme 58 00:02:43,890 --> 00:02:46,070 některé kódu, které skutečně napsal. 59 00:02:46,070 --> 00:02:49,800 Všimněte si, že # define je pryč a všechny instance dříve 60 00:02:49,800 --> 00:02:51,950 byly nahrazeny přesně to, co jsme specifikovali v 61 00:02:51,950 --> 00:02:53,590 # define řádek. 62 00:02:53,590 --> 00:02:56,530 Takže jaké jsou všechny tyto typedefs a funkce prohlášení 63 00:02:56,530 --> 00:02:58,140 v horní části souboru? 64 00:02:58,140 --> 00:03:00,820 Povšimněte si, že # define nebyla jedinou preprocesor 65 00:03:00,820 --> 00:03:02,390 směrnice, kterou jsme specifikovali. 66 00:03:02,390 --> 00:03:05,280 Máme také # include stdio.h. 67 00:03:05,280 --> 00:03:09,560 Takže všechny bláznivých tratí jsou vlastně jen stdio.h kopírovat 68 00:03:09,560 --> 00:03:11,810 a vloží do horní části tohoto souboru. 69 00:03:11,810 --> 00:03:14,110 To je důvod, proč hlavičkové soubory jsou tak užitečné pro funkci 70 00:03:14,110 --> 00:03:15,160 prohlášení. 71 00:03:15,160 --> 00:03:17,740 Místo toho, aby museli zkopírovat a vložit všechny funkce 72 00:03:17,740 --> 00:03:21,050 prohlášení plánujete používat v horní části souboru, je 73 00:03:21,050 --> 00:03:22,990 preprocesor bude zkopírovat a vložit z hlavičky 74 00:03:22,990 --> 00:03:24,140 soubor pro vás. 75 00:03:24,140 --> 00:03:26,480 >> Teď jsme skončili předzpracování, jdeme do 76 00:03:26,480 --> 00:03:27,680 kompilace. 77 00:03:27,680 --> 00:03:30,725 Důvodem nazýváme tento krok kompilace je, protože to je 78 00:03:30,725 --> 00:03:34,130 krok, kde zvonění vlastně dělá jeho kompilaci z C na 79 00:03:34,130 --> 00:03:35,370 kód assembleru. 80 00:03:35,370 --> 00:03:38,280 Za účelem získání zvonění spis dolů na montáž, ale 81 00:03:38,280 --> 00:03:42,030 pokračovat dál, předat jej the-S flag 82 00:03:42,030 --> 00:03:43,560 na příkazovém řádku. 83 00:03:43,560 --> 00:03:44,790 Pojďme se podívat na shromáždění 84 00:03:44,790 --> 00:03:47,390 soubor, který byl na výstupu. 85 00:03:47,390 --> 00:03:49,740 Vypadá to jako docela jiném jazyce. 86 00:03:49,740 --> 00:03:52,660 Montáž kód je velmi specifický procesor. 87 00:03:52,660 --> 00:03:55,440 V tomto případě, vzhledem k tomu CS50 spotřebič běží 88 00:03:55,440 --> 00:04:00,470 virtuální x86 procesor, to je x86 kód assembleru. 89 00:04:00,470 --> 00:04:03,450 Velmi málo lidí psát přímo v assembleru v těchto dnech, 90 00:04:03,450 --> 00:04:06,490 ale každý program C jste někdy psát dostane transformována dolů 91 00:04:06,490 --> 00:04:07,940 do sestavy. 92 00:04:07,940 --> 00:04:11,440 Opět, nazýváme tento krok sestavení C do sestavy 93 00:04:11,440 --> 00:04:14,170 protože jsme se jít z vyšší úrovně na nižší úrovni 94 00:04:14,170 --> 00:04:15,480 programovací jazyk. 95 00:04:15,480 --> 00:04:17,880 >> Co dělá montáž nižší úrovně, než C? 96 00:04:17,880 --> 00:04:21,660 No, v sestavě, jsme velmi omezené v tom, co můžeme udělat. 97 00:04:21,660 --> 00:04:25,120 Nejsou k dispozici žádné pokud je, zatímco to, za to, nebo smyčky jakéhokoliv druhu. 98 00:04:25,120 --> 00:04:27,560 Ale můžete dosáhnout stejné věci, které tyto kontroly 99 00:04:27,560 --> 00:04:30,270 struktury poskytují pomocí omezených operací, které 100 00:04:30,270 --> 00:04:32,350 Sestava se poskytují. 101 00:04:32,350 --> 00:04:35,960 Ale vidět, jak nízká úroveň montáž je opravdu, pojďme 102 00:04:35,960 --> 00:04:39,320 o krok dál v naší kompilace, montáž. 103 00:04:39,320 --> 00:04:41,890 Je to assembler je úkol transformovat kód assembleru 104 00:04:41,890 --> 00:04:44,740 do objektu nebo strojovém kódu. 105 00:04:44,740 --> 00:04:47,610 Pamatujte si, že assembler není výstupní sestavu; 106 00:04:47,610 --> 00:04:51,080 poněkud, to se bere v sestavě a výstupy strojovém kódu. 107 00:04:51,080 --> 00:04:54,040 Strojový kód je skutečná 1 a 0, že CPU může 108 00:04:54,040 --> 00:04:57,290 pochopit, i když jsme ještě trošku práce zbývá 109 00:04:57,290 --> 00:04:59,380 Než budeme moci spustit náš program. 110 00:04:59,380 --> 00:05:01,400 Pojďme sestavit náš kód assembleru předáním 111 00:05:01,400 --> 00:05:04,080 Řinčení-c vlajky. 112 00:05:04,080 --> 00:05:06,410 Nyní se podívejme, co je ve smontovaném souboru. 113 00:05:06,410 --> 00:05:09,220 >> No, to nám nepomůže moc. 114 00:05:09,220 --> 00:05:11,340 Pamatujte si, že strojový kód je jedniček a nul, že 115 00:05:11,340 --> 00:05:13,240 Váš počítač může pochopit. 116 00:05:13,240 --> 00:05:16,080 To neznamená, že je to pro nás snadné pochopit. 117 00:05:16,080 --> 00:05:19,160 Tak přesně tak, jak nízká úroveň je montáž? 118 00:05:19,160 --> 00:05:21,480 Je to téměř totožné s objektovým kódem. 119 00:05:21,480 --> 00:05:24,300 Přechod z montáže do strojového kódu, je mnohem více 120 00:05:24,300 --> 00:05:27,540 Překlad než transformace, což je důvod, proč 121 00:05:27,540 --> 00:05:29,310 člověk nemusí považovat assembler 122 00:05:29,310 --> 00:05:31,400 dělat žádnou skutečnou kompilaci. 123 00:05:31,400 --> 00:05:34,110 Ve skutečnosti, je to docela snadné, aby manuálně přeložit z 124 00:05:34,110 --> 00:05:36,050 montáž do strojového kódu. 125 00:05:36,050 --> 00:05:39,040 Při pohledu na sestavy pro hlavní funkce, které první řádek 126 00:05:39,040 --> 00:05:42,100 stane odpovídat hexadecimální 0x55. 127 00:05:42,100 --> 00:05:45,470 V binární, je to 1010101. 128 00:05:45,470 --> 00:05:49,300 Druhý řádek se stane odpovídat hexadecimální 0x895. 129 00:05:49,300 --> 00:05:51,290 A další, 0x56. 130 00:05:51,290 --> 00:05:53,730 Vzhledem k tomu, relativně jednoduchá tabulka, můžete přeložit 131 00:05:53,730 --> 00:05:57,130 montáž do kódu, že stroje mohou rozumět také. 132 00:05:57,130 --> 00:05:58,810 >> Takže je tu ještě jedna zbývající krok 133 00:05:58,810 --> 00:06:01,150 sestavování, které je spojuje. 134 00:06:01,150 --> 00:06:04,530 Propojení kombinuje spoustu objektových souborů do jednoho velkého souboru 135 00:06:04,530 --> 00:06:06,380 že můžete skutečně provést. 136 00:06:06,380 --> 00:06:08,570 Propojení je velmi závislá na systému. 137 00:06:08,570 --> 00:06:11,030 Takže nejjednodušší způsob, jak se dostat zvonění jen propojit objekt 138 00:06:11,030 --> 00:06:13,920 Soubory společně je zavolat zařinčení na všech souborů, které 139 00:06:13,920 --> 00:06:15,190 Chcete-li propojit. 140 00:06:15,190 --> 00:06:18,740 Pokud zadáte. O soubory, pak to nebude muset znovu zpracovat, 141 00:06:18,740 --> 00:06:21,680 sestavit, a montujeme všechny vaše zdrojového kódu. 142 00:06:21,680 --> 00:06:23,960 Pojďme hodit matematickou funkci do našeho souboru, takže máme 143 00:06:23,960 --> 00:06:25,210 něco propojit palců 144 00:06:34,220 --> 00:06:37,010 Nyní pojďme sestavit ho zpět do objektového kódu a 145 00:06:37,010 --> 00:06:38,260 volání zvonit na něj. 146 00:06:40,560 --> 00:06:41,420 Chybička se vloudila. 147 00:06:41,420 --> 00:06:43,790 Vzhledem k tomu, jsme zařadili na matematickou funkci, musíme propojit v 148 00:06:43,790 --> 00:06:46,610 matematická knihovna s-lm. 149 00:06:46,610 --> 00:06:48,990 >> Pokud bychom chtěli propojit spoustu. O soubory, které jsme 150 00:06:48,990 --> 00:06:51,420 napsal na naše vlastní, bychom stačí zadat je všechny 151 00:06:51,420 --> 00:06:52,460 příkazového řádku. 152 00:06:52,460 --> 00:06:55,320 Omezení je, že pouze jeden z těchto souborů musí být 153 00:06:55,320 --> 00:06:57,790 skutečně určit hlavní funkci, jinak 154 00:06:57,790 --> 00:06:59,930 Výsledný spustitelný bych nevěděl, kde začít 155 00:06:59,930 --> 00:07:00,910 spuštění kódu. 156 00:07:00,910 --> 00:07:03,360 Jaký je rozdíl mezi určením souboru propojení s 157 00:07:03,360 --> 00:07:06,600 s-l a jen zadáním soubor přímo? 158 00:07:06,600 --> 00:07:07,440 Nic. 159 00:07:07,440 --> 00:07:09,850 Je to jen, že zvonění se stane přesně vědět, co soubor 160 00:07:09,850 --> 00:07:12,560 něco jako-lm stane se odkazovat na. 161 00:07:12,560 --> 00:07:14,700 Pokud jste věděl, že soubor sami, můžete specifikovat 162 00:07:14,700 --> 00:07:15,930 explicitně. 163 00:07:15,930 --> 00:07:18,990 Jen nezapomeňte, že all-l vlajky mají přijít na konci 164 00:07:18,990 --> 00:07:20,770 Vaší poptávky klientů. 165 00:07:20,770 --> 00:07:22,300 >> A to je všechno, co je k tomu. 166 00:07:22,300 --> 00:07:24,940 Když stačí spustit zvonění některých souborů, to je to, co to je 167 00:07:24,940 --> 00:07:26,350 vlastně dělá. 168 00:07:26,350 --> 00:07:29,490 Mé jméno je Rob Bowden, a to je CS50.