1 00:00:07,200 --> 00:00:09,100 [Powered by Google Translate] ROB BOWDEN: Låt oss tala om kompilatorer. 2 00:00:09,100 --> 00:00:11,490 Fram till denna punkt, har du skrivit bara upp din källkod till 3 00:00:11,490 --> 00:00:14,260 några filer, skickade dem genom denna stora svarta lådan som är 4 00:00:14,260 --> 00:00:16,890 Klang, och ut kommer din körbar fil som gör 5 00:00:16,890 --> 00:00:19,430 exakt vad du skrev i din källkod. 6 00:00:19,430 --> 00:00:22,170 Så magiskt som det har varit, vi ska ta en närmare 7 00:00:22,170 --> 00:00:23,590 titta på vad som faktiskt händer 8 00:00:23,590 --> 00:00:25,220 När vi sammanställer en fil. 9 00:00:25,220 --> 00:00:28,580 Så vad betyder det att sammanställa något? 10 00:00:28,580 --> 00:00:31,150 >> Jo, i den mest allmänna mening, det betyder bara 11 00:00:31,150 --> 00:00:32,580 omvandla kod skriven i ett 12 00:00:32,580 --> 00:00:34,680 programmering språk till ett annat. 13 00:00:34,680 --> 00:00:37,550 Men oftast när folk säger att de sammanställa något, de 14 00:00:37,550 --> 00:00:39,660 menar de tar det från en högre nivå programmering 15 00:00:39,660 --> 00:00:42,460 språk till en lägre nivå programmeringsspråk. 16 00:00:42,460 --> 00:00:44,960 Dessa kan tyckas mycket subjektiva termer. 17 00:00:44,960 --> 00:00:48,090 Till exempel har du förmodligen tänker inte på C som en hög 18 00:00:48,090 --> 00:00:51,440 nivå programmeringsspråk, men du kompilera den. 19 00:00:51,440 --> 00:00:52,730 Men det är alla relativa. 20 00:00:52,730 --> 00:00:55,790 Som vi ser det assemblerkod och så småningom maskin 21 00:00:55,790 --> 00:00:59,270 kod som vi sammanställer om är onekligen en lägre nivå 22 00:00:59,270 --> 00:01:00,700 än C. 23 00:01:00,700 --> 00:01:03,310 Även om vi kommer att använda klang i dagens demonstration, en 24 00:01:03,310 --> 00:01:06,360 många av de idéer här föra över till andra kompilatorer. 25 00:01:06,360 --> 00:01:09,160 >> För klang, finns det fyra viktiga steg i den totala 26 00:01:09,160 --> 00:01:10,200 sammanställning. 27 00:01:10,200 --> 00:01:15,430 Det är en, förbehandling görs av preprocessor, två, 28 00:01:15,430 --> 00:01:19,530 sammanställning görs av kompilatorn, tre, montering 29 00:01:19,530 --> 00:01:22,010 görs av montören, och fyra, 30 00:01:22,010 --> 00:01:24,640 länkning utförs av linkern. 31 00:01:24,640 --> 00:01:27,600 Det kan vara förvirrande att en av delstegen i den övergripande 32 00:01:27,600 --> 00:01:30,980 Klang kompilatorer kallas kompilator, men 33 00:01:30,980 --> 00:01:32,530 Vi kommer till det. 34 00:01:32,530 --> 00:01:35,050 Vi kommer att använda ett enkelt Hello World program som vårt exempel 35 00:01:35,050 --> 00:01:36,270 hela den här videon. 36 00:01:36,270 --> 00:01:38,380 Låt oss ta en titt. 37 00:01:38,380 --> 00:01:40,330 >> Det första steget är förbehandling. 38 00:01:40,330 --> 00:01:42,520 Vad gör preprocessorn? 39 00:01:42,520 --> 00:01:45,560 I stort sett varje C-program du någonsin läst eller skrivit, 40 00:01:45,560 --> 00:01:48,310 du har använt kodrader som börjar med en hash. 41 00:01:48,310 --> 00:01:51,730 Jag kallar det hash, men du kan också kalla det pounds, antal 42 00:01:51,730 --> 00:01:53,280 underteckna, eller skarp. 43 00:01:53,280 --> 00:01:56,840 En sådan linje är en preprocessor direktiv. 44 00:01:56,840 --> 00:02:00,650 Du har säkert sett # define och # include innan, men det 45 00:02:00,650 --> 00:02:03,690 finns flera mer att preprocessorn känner igen. 46 00:02:03,690 --> 00:02:07,340 Låt oss lägga till en # define till vår hallå världen exempel. 47 00:02:07,340 --> 00:02:11,690 Nu ska vi bara köra preprocessorn i detta ärende. 48 00:02:11,690 --> 00:02:16,150 Genom att skicka clage-E flaggan, du instruerar den att köra 49 00:02:16,150 --> 00:02:17,880 bara förbehandlaren. 50 00:02:17,880 --> 00:02:19,130 Låt oss se vad som händer. 51 00:02:22,250 --> 00:02:24,020 Det ser ut som klang bara spottar ut allt 52 00:02:24,020 --> 00:02:25,200 på kommandoraden. 53 00:02:25,200 --> 00:02:27,800 För att spara allt av denna produktion till en ny fil som heter 54 00:02:27,800 --> 00:02:33,850 hello2.c, vi lägga> hello2.c till vårt kommando. 55 00:02:33,850 --> 00:02:37,800 Nu ska vi ta en titt på vår förbehandlade fil. 56 00:02:37,800 --> 00:02:40,810 >> Oj, vad hände med våra kort litet program? 57 00:02:40,810 --> 00:02:43,890 Om vi ​​går hela vägen till botten av denna fil, vi får se 58 00:02:43,890 --> 00:02:46,070 en del av den kod som vi faktiskt skrev. 59 00:02:46,070 --> 00:02:49,800 Observera att # define är borta och alla förekomster av namn 60 00:02:49,800 --> 00:02:51,950 har ersatts med exakt vad vi specificeras i 61 00:02:51,950 --> 00:02:53,590 den # define linjen. 62 00:02:53,590 --> 00:02:56,530 Så vad är alla dessa typedefs och förklaringar funktion 63 00:02:56,530 --> 00:02:58,140 längst upp i filen? 64 00:02:58,140 --> 00:03:00,820 Observera att # define var inte den enda preprocessor 65 00:03:00,820 --> 00:03:02,390 direktiv som vi angett. 66 00:03:02,390 --> 00:03:05,280 Vi har även inkludera # stdio.h. 67 00:03:05,280 --> 00:03:09,560 Så alla de galna linjer är egentligen bara stdio.h kopieras 68 00:03:09,560 --> 00:03:11,810 och klistras in i toppen av denna fil. 69 00:03:11,810 --> 00:03:14,110 Det är därför huvudfiler är så användbart för funktion 70 00:03:14,110 --> 00:03:15,160 deklarationer. 71 00:03:15,160 --> 00:03:17,740 Istället för att behöva kopiera och klistra in hela funktionen 72 00:03:17,740 --> 00:03:21,050 deklarationer du tänker använda på toppen av din fil, 73 00:03:21,050 --> 00:03:22,990 preprocessorn kommer att kopiera och klistra in dem från huvudet 74 00:03:22,990 --> 00:03:24,140 fil för dig. 75 00:03:24,140 --> 00:03:26,480 >> Nu när vi är klara förbehandling flyttar vi till 76 00:03:26,480 --> 00:03:27,680 sammanställning. 77 00:03:27,680 --> 00:03:30,725 Anledningen till att vi kallar detta steg sammanställning är att det är 78 00:03:30,725 --> 00:03:34,130 steget där klang faktiskt gör sitt sammanställa från C till 79 00:03:34,130 --> 00:03:35,370 assemblerkod. 80 00:03:35,370 --> 00:03:38,280 För att få klang kompilera en fil ned till montering, men 81 00:03:38,280 --> 00:03:42,030 fortsätta längre, förbi den-S flaggan 82 00:03:42,030 --> 00:03:43,560 på kommandoraden. 83 00:03:43,560 --> 00:03:44,790 Låt oss ta en titt på församlingen 84 00:03:44,790 --> 00:03:47,390 fil som matas ut. 85 00:03:47,390 --> 00:03:49,740 Det ser ut som en helt annan språk. 86 00:03:49,740 --> 00:03:52,660 Assemblerkod är mycket processorn specifik. 87 00:03:52,660 --> 00:03:55,440 I detta fall, eftersom CS50 maskinen körs på en 88 00:03:55,440 --> 00:04:00,470 virtuell x86-processor, detta x86 assemblerkod. 89 00:04:00,470 --> 00:04:03,450 Mycket få människor skriva direkt i Assembler dessa dagar, 90 00:04:03,450 --> 00:04:06,490 men varje C-program du någonsin skriver blir transformeras ner 91 00:04:06,490 --> 00:04:07,940 in montering. 92 00:04:07,940 --> 00:04:11,440 Återigen, vi kallar detta steg sammanställningen av C i monteringen 93 00:04:11,440 --> 00:04:14,170 eftersom vi kommer från en högre nivå till en lägre nivå 94 00:04:14,170 --> 00:04:15,480 programmeringsspråk. 95 00:04:15,480 --> 00:04:17,880 >> Vad gör monteringen lägre nivå än C? 96 00:04:17,880 --> 00:04:21,660 Tja, i monteringen, är vi mycket begränsade i vad vi kan göra. 97 00:04:21,660 --> 00:04:25,120 Det finns inga IF: s, medan är, för det eller öglor av något slag. 98 00:04:25,120 --> 00:04:27,560 Men du kan åstadkomma samma saker som dessa styr 99 00:04:27,560 --> 00:04:30,270 strukturer erbjuder hjälp de begränsade operationer som 100 00:04:30,270 --> 00:04:32,350 montering faktiskt tillhandahåller. 101 00:04:32,350 --> 00:04:35,960 Men att se hur låg montering egentligen är, låt oss gå 102 00:04:35,960 --> 00:04:39,320 ytterligare ett steg i vår sammanställning, montering. 103 00:04:39,320 --> 00:04:41,890 Det är assembler uppgift att omvandla assemblerkod 104 00:04:41,890 --> 00:04:44,740 i objekt eller maskinkod. 105 00:04:44,740 --> 00:04:47,610 Kom ihåg att montören inte utgång montering; 106 00:04:47,610 --> 00:04:51,080 snarare, tar det i montering och utgångar maskinkod. 107 00:04:51,080 --> 00:04:54,040 Maskinkod är den verkliga 1 s och 0 är att en CPU kan 108 00:04:54,040 --> 00:04:57,290 förstå, även om vi fortfarande har en liten bit av arbete kvar 109 00:04:57,290 --> 00:04:59,380 innan vi kan köra vårt program. 110 00:04:59,380 --> 00:05:01,400 Låt oss samla våra assemblerkod genom att 111 00:05:01,400 --> 00:05:04,080 Klang-c flaggan. 112 00:05:04,080 --> 00:05:06,410 Låt oss nu se vad som finns i den monterade filen. 113 00:05:06,410 --> 00:05:09,220 >> Tja, hjälper det inte oss mycket. 114 00:05:09,220 --> 00:05:11,340 Kom ihåg att maskinen koden är ettor och nollor som 115 00:05:11,340 --> 00:05:13,240 datorn kan förstå. 116 00:05:13,240 --> 00:05:16,080 Det betyder inte att det är lätt för oss att förstå. 117 00:05:16,080 --> 00:05:19,160 Så exakt hur låg nivå är monteringen? 118 00:05:19,160 --> 00:05:21,480 Det är nästan identiskt med objektkod. 119 00:05:21,480 --> 00:05:24,300 Att gå från montering till objektkod är mycket mer av en 120 00:05:24,300 --> 00:05:27,540 översättning än en omvandling, vilket är anledningen till 121 00:05:27,540 --> 00:05:29,310 en kanske inte anser att montören att 122 00:05:29,310 --> 00:05:31,400 göra någon faktisk kompilerar. 123 00:05:31,400 --> 00:05:34,110 I själva verket är det ganska lätt att manuellt översätta från 124 00:05:34,110 --> 00:05:36,050 montering till maskinkod. 125 00:05:36,050 --> 00:05:39,040 Man tittar på sammansättningen för en huvudfunktion, att första raden 126 00:05:39,040 --> 00:05:42,100 råkar motsvara hexadecimala 0x55. 127 00:05:42,100 --> 00:05:45,470 I binär, det är 1.010.101. 128 00:05:45,470 --> 00:05:49,300 Den andra raden råkar motsvara hexadecimalt 0x895. 129 00:05:49,300 --> 00:05:51,290 Och nästa, 0x56. 130 00:05:51,290 --> 00:05:53,730 Med tanke på en relativt enkel tabell, kan du översätta 131 00:05:53,730 --> 00:05:57,130 enheten i den kod som maskiner kan förstå också. 132 00:05:57,130 --> 00:05:58,810 >> Så det finns en kvarvarande steg i 133 00:05:58,810 --> 00:06:01,150 sammanställning, som länkning. 134 00:06:01,150 --> 00:06:04,530 Länkning kombinerar ett gäng objektfiler till ett stor fil 135 00:06:04,530 --> 00:06:06,380 att du faktiskt kan köra. 136 00:06:06,380 --> 00:06:08,570 Länkning är mycket systemberoende. 137 00:06:08,570 --> 00:06:11,030 Så det enklaste sättet att få klang att bara koppla objekt 138 00:06:11,030 --> 00:06:13,920 filer tillsammans är att ringa klang på alla filer som 139 00:06:13,920 --> 00:06:15,190 du vill länka samman. 140 00:06:15,190 --> 00:06:18,740 Om du anger. O-filer, då det inte kommer att behöva bearbeta, 141 00:06:18,740 --> 00:06:21,680 sammanställa och montera all din källkod. 142 00:06:21,680 --> 00:06:23,960 Låt oss kasta en matematisk funktion i vår fil, så vi har 143 00:06:23,960 --> 00:06:25,210 något att koppla in 144 00:06:34,220 --> 00:06:37,010 Nu ska vi sammanställa det tillbaka ner till objektkod och 145 00:06:37,010 --> 00:06:38,260 kalla klang på det. 146 00:06:40,560 --> 00:06:41,420 Oops. 147 00:06:41,420 --> 00:06:43,790 Eftersom vi ingår en matematisk funktion måste vi knyta i 148 00:06:43,790 --> 00:06:46,610 matten biblioteket med-LM. 149 00:06:46,610 --> 00:06:48,990 >> Om vi ​​ville knyta ihop gäng. O filer som vi 150 00:06:48,990 --> 00:06:51,420 skrev på egen hand, skulle vi ange bara dem alla på 151 00:06:51,420 --> 00:06:52,460 kommandoraden. 152 00:06:52,460 --> 00:06:55,320 Begränsningen är att endast en av dessa filer måste 153 00:06:55,320 --> 00:06:57,790 faktiskt specificera en huvudfunktion, annars 154 00:06:57,790 --> 00:06:59,930 resulterande körbara inte vet var du ska börja 155 00:06:59,930 --> 00:07:00,910 kör din kod. 156 00:07:00,910 --> 00:07:03,360 Vad är skillnaden mellan att ange en fil att länka in 157 00:07:03,360 --> 00:07:06,600 med-l och bara ange en fil direkt? 158 00:07:06,600 --> 00:07:07,440 Inget. 159 00:07:07,440 --> 00:07:09,850 Det är bara att klang råkar veta exakt vad fil 160 00:07:09,850 --> 00:07:12,560 något som-LM råkar referera till. 161 00:07:12,560 --> 00:07:14,700 Om du visste att filen själv, kan du ange det 162 00:07:14,700 --> 00:07:15,930 explicit. 163 00:07:15,930 --> 00:07:18,990 Kom bara ihåg att alla-l flaggor måste komma i slutet 164 00:07:18,990 --> 00:07:20,770 av din klient efterfrågan. 165 00:07:20,770 --> 00:07:22,300 >> Och det är allt som finns till den. 166 00:07:22,300 --> 00:07:24,940 När du bara köra klang på vissa filer, det är vad det är 167 00:07:24,940 --> 00:07:26,350 faktiskt gör. 168 00:07:26,350 --> 00:07:29,490 Mitt namn är Rob Bowden, och detta är CS50.