1 00:00:07,200 --> 00:00:09,100 [Powered by Google Translate] Rob Bowden: La oss snakke om kompilatorer. 2 00:00:09,100 --> 00:00:11,490 Frem til dette punktet, har du nettopp skrev opp kildekoden til 3 00:00:11,490 --> 00:00:14,260 noen filer, sendte dem gjennom denne store svarte boksen som er 4 00:00:14,260 --> 00:00:16,890 Clang, og kommer ut kjørbar fil som gjør 5 00:00:16,890 --> 00:00:19,430 nøyaktig hva du skrev i kildekoden. 6 00:00:19,430 --> 00:00:22,170 Så magisk som det har vært, skal vi ta en nærmere 7 00:00:22,170 --> 00:00:23,590 se på hva som faktisk skjer 8 00:00:23,590 --> 00:00:25,220 når vi kompilere en fil. 9 00:00:25,220 --> 00:00:28,580 Så hva betyr det å kompilere noe? 10 00:00:28,580 --> 00:00:31,150 >> Vel, i den mest generelle forstand, det betyr bare 11 00:00:31,150 --> 00:00:32,580 transformere kode skrevet i ett 12 00:00:32,580 --> 00:00:34,680 programmeringsspråk til et annet. 13 00:00:34,680 --> 00:00:37,550 Men vanligvis når folk sier de kompilere noe, de 14 00:00:37,550 --> 00:00:39,660 mener de tar det fra et høyere nivå programmering 15 00:00:39,660 --> 00:00:42,460 språk til et lavere nivå programmeringsspråk. 16 00:00:42,460 --> 00:00:44,960 Disse kan virke som svært subjektive vilkår. 17 00:00:44,960 --> 00:00:48,090 For eksempel, har du sannsynligvis ikke tenke på C som en høy 18 00:00:48,090 --> 00:00:51,440 programmeringsspråk, men du kompilere den. 19 00:00:51,440 --> 00:00:52,730 Men det er alle forhold. 20 00:00:52,730 --> 00:00:55,790 Som vi vil se, forsamlingen koden og til slutt maskin 21 00:00:55,790 --> 00:00:59,270 kode som vi kompilere ned til er unektelig et lavere nivå 22 00:00:59,270 --> 00:01:00,700 enn C. 23 00:01:00,700 --> 00:01:03,310 Selv om vi skal bruke Clang i dagens demonstrasjon, en 24 00:01:03,310 --> 00:01:06,360 Mange av ideene her bære over til andre kompilatorer. 25 00:01:06,360 --> 00:01:09,160 >> For Clang det fire hovedtrinn i den samlede 26 00:01:09,160 --> 00:01:10,200 kompilering. 27 00:01:10,200 --> 00:01:15,430 Disse er en, preprosessering gjort av preprosessor, to, 28 00:01:15,430 --> 00:01:19,530 kompilering gjort av kompilatoren, tre, montering 29 00:01:19,530 --> 00:01:22,010 gjort av montøren, og fire, 30 00:01:22,010 --> 00:01:24,640 lenking gjort av linkeren. 31 00:01:24,640 --> 00:01:27,600 Det kan være forvirrende at en av de i den generelle substeps 32 00:01:27,600 --> 00:01:30,980 Clang kompilatorer kalles kompilatoren, men 33 00:01:30,980 --> 00:01:32,530 vi får til det. 34 00:01:32,530 --> 00:01:35,050 Vi skal bruke en enkel hello world program som vårt eksempel 35 00:01:35,050 --> 00:01:36,270 gjennom denne videoen. 36 00:01:36,270 --> 00:01:38,380 La oss ta en titt. 37 00:01:38,380 --> 00:01:40,330 >> Det første trinnet er forbehandling. 38 00:01:40,330 --> 00:01:42,520 Hva gjør den preprosessor? 39 00:01:42,520 --> 00:01:45,560 I ganske mye hver C program du noensinne har lest eller skrevet, 40 00:01:45,560 --> 00:01:48,310 du har brukt linjer med kode som begynner med en hash. 41 00:01:48,310 --> 00:01:51,730 Jeg vil kalle det hasj, men du kan også kalle det pounds, antall 42 00:01:51,730 --> 00:01:53,280 signere, eller skarp. 43 00:01:53,280 --> 00:01:56,840 Enhver slik linje er en preprosessor-direktiv. 44 00:01:56,840 --> 00:02:00,650 Du har sikkert sett # define og # include før, men det 45 00:02:00,650 --> 00:02:03,690 er flere mer at preprosessor gjenkjenner. 46 00:02:03,690 --> 00:02:07,340 La oss legge til et # define til vår hello world eksempel. 47 00:02:07,340 --> 00:02:11,690 Nå la oss kjøre bare preprosessor på denne filen. 48 00:02:11,690 --> 00:02:16,150 Ved å sende clage-E flagget, du instruksjoner om å kjøre 49 00:02:16,150 --> 00:02:17,880 bare preprosessor. 50 00:02:17,880 --> 00:02:19,130 La oss se hva som skjer. 51 00:02:22,250 --> 00:02:24,020 Det ser ut som Clang bare spytter ut alt 52 00:02:24,020 --> 00:02:25,200 på kommandolinjen. 53 00:02:25,200 --> 00:02:27,800 For å lagre alle av denne produksjonen til en ny fil som heter 54 00:02:27,800 --> 00:02:33,850 hello2.c, vil vi legge> hello2.c til kommandoen. 55 00:02:33,850 --> 00:02:37,800 La oss nå ta en titt på vår preprocessed fil. 56 00:02:37,800 --> 00:02:40,810 >> Jøss, skjedde det til vår korte lille programmet? 57 00:02:40,810 --> 00:02:43,890 Hvis vi går hele veien ned til bunnen av denne filen, vil vi se 58 00:02:43,890 --> 00:02:46,070 noen av koden at vi faktisk skrev. 59 00:02:46,070 --> 00:02:49,800 Legg merke til at # define er borte og alle forekomster av navn 60 00:02:49,800 --> 00:02:51,950 har blitt erstattet med nøyaktig hva vi angitt i 61 00:02:51,950 --> 00:02:53,590 den # define linjen. 62 00:02:53,590 --> 00:02:56,530 Så hva er alle disse typedefs og funksjon erklæringer 63 00:02:56,530 --> 00:02:58,140 øverst filen? 64 00:02:58,140 --> 00:03:00,820 Legg merke til at # define var ikke den eneste preprosessor 65 00:03:00,820 --> 00:03:02,390 direktiv som vi angitt. 66 00:03:02,390 --> 00:03:05,280 Vi har også # include stdio.h. 67 00:03:05,280 --> 00:03:09,560 Så alle de sprø linjene er faktisk bare stdio.h kopiert 68 00:03:09,560 --> 00:03:11,810 og limes inn i toppen av denne filen. 69 00:03:11,810 --> 00:03:14,110 Det er derfor header filer er så nyttig for funksjon 70 00:03:14,110 --> 00:03:15,160 erklæringer. 71 00:03:15,160 --> 00:03:17,740 I stedet for å måtte kopiere og lime inn alle funksjonen 72 00:03:17,740 --> 00:03:21,050 erklæringer du planlegger å bruke på toppen av filen, de 73 00:03:21,050 --> 00:03:22,990 preprosessor vil kopiere og lime dem fra topp 74 00:03:22,990 --> 00:03:24,140 fil for deg. 75 00:03:24,140 --> 00:03:26,480 >> Nå som vi er ferdig forbehandling, beveger vi oss inn på 76 00:03:26,480 --> 00:03:27,680 kompilering. 77 00:03:27,680 --> 00:03:30,725 Grunnen til at vi kaller dette trinnet samlealbum er fordi dette er 78 00:03:30,725 --> 00:03:34,130 trinnet der Clang faktisk gjør sin kompilering fra C til 79 00:03:34,130 --> 00:03:35,370 assemblykode. 80 00:03:35,370 --> 00:03:38,280 For å ha Clang kompilere en fil ned til montering, men 81 00:03:38,280 --> 00:03:42,030 fortsette lenger, passerer den-S flagget 82 00:03:42,030 --> 00:03:43,560 på kommandolinjen. 83 00:03:43,560 --> 00:03:44,790 La oss ta en titt på forsamlingen 84 00:03:44,790 --> 00:03:47,390 filen som ble generert. 85 00:03:47,390 --> 00:03:49,740 Det ser ut som en helt annen språk. 86 00:03:49,740 --> 00:03:52,660 Assemblykode er svært prosessor spesifikk. 87 00:03:52,660 --> 00:03:55,440 I dette tilfellet, siden CS50 apparatet kjører på en 88 00:03:55,440 --> 00:04:00,470 virtuell x86-prosessor, er dette x86 assembly kode. 89 00:04:00,470 --> 00:04:03,450 Svært få mennesker skrive direkte i assembly-kode i disse dager, 90 00:04:03,450 --> 00:04:06,490 men hver C-program du noen gang skriver blir transformert ned 91 00:04:06,490 --> 00:04:07,940 i forsamlingen. 92 00:04:07,940 --> 00:04:11,440 Igjen, vi kaller dette trinnet kompilere den C i forsamlingen 93 00:04:11,440 --> 00:04:14,170 siden vi kommer fra et høyere nivå til et lavere nivå 94 00:04:14,170 --> 00:04:15,480 programmeringsspråk. 95 00:04:15,480 --> 00:04:17,880 >> Hva gjør monteringen lavere nivå enn C? 96 00:04:17,880 --> 00:04:21,660 Vel, i forsamlingen, er vi svært begrenset hva vi kan gjøre. 97 00:04:21,660 --> 00:04:25,120 Det er ingen If, mens tallet, for er, eller løkker av noe slag. 98 00:04:25,120 --> 00:04:27,560 Men du kan oppnå de samme tingene som disse kontroll 99 00:04:27,560 --> 00:04:30,270 strukturer tilby hjelp de begrensede operasjoner som 100 00:04:30,270 --> 00:04:32,350 montering gjør gi. 101 00:04:32,350 --> 00:04:35,960 Men bare for å se hvor lavt nivå montering egentlig er, la oss gå 102 00:04:35,960 --> 00:04:39,320 ett skritt videre i samlingen vår, montering. 103 00:04:39,320 --> 00:04:41,890 Det er assembler jobb å transformere assemblerkode 104 00:04:41,890 --> 00:04:44,740 inn objekt eller maskinkode. 105 00:04:44,740 --> 00:04:47,610 Husk at assembler ikke kan sende montering; 106 00:04:47,610 --> 00:04:51,080 heller, det tar i montering og utganger maskinkode. 107 00:04:51,080 --> 00:04:54,040 Maskinkode er den faktiske 1 og 0-er som en CPU kan 108 00:04:54,040 --> 00:04:57,290 forstå, selv om vi fortsatt har en liten bit av arbeid igjen 109 00:04:57,290 --> 00:04:59,380 før vi kan kjøre programmet vårt. 110 00:04:59,380 --> 00:05:01,400 La oss sammen vår assemblykode ved å sende 111 00:05:01,400 --> 00:05:04,080 Clang-c flagget. 112 00:05:04,080 --> 00:05:06,410 La oss nå se hva som er i den sammensatte filen. 113 00:05:06,410 --> 00:05:09,220 >> Vel, som ikke hjelper oss veldig mye. 114 00:05:09,220 --> 00:05:11,340 Husk at maskinen koden er de enere og nuller som 115 00:05:11,340 --> 00:05:13,240 datamaskinen kan forstå. 116 00:05:13,240 --> 00:05:16,080 Det betyr ikke at det er lett for oss å forstå. 117 00:05:16,080 --> 00:05:19,160 Så nøyaktig hvor lavt nivå er montering? 118 00:05:19,160 --> 00:05:21,480 Det er nesten identisk med objektkode. 119 00:05:21,480 --> 00:05:24,300 Går fra forsamlingen til objektkode er mye mer av en 120 00:05:24,300 --> 00:05:27,540 oversettelse enn en transformasjon, som er grunnen til at 121 00:05:27,540 --> 00:05:29,310 man kan ikke vurdere assembler for å 122 00:05:29,310 --> 00:05:31,400 gjøre noe faktisk kompilering. 123 00:05:31,400 --> 00:05:34,110 Faktisk er det ganske lett å manuelt oversette fra 124 00:05:34,110 --> 00:05:36,050 montering til maskinkode. 125 00:05:36,050 --> 00:05:39,040 Ser på forsamlingen for en hovedfunksjon, som første linje 126 00:05:39,040 --> 00:05:42,100 skjer tilsvare heksadesimale 0x55. 127 00:05:42,100 --> 00:05:45,470 I binær, det er 1010101. 128 00:05:45,470 --> 00:05:49,300 Den andre linjen skjer å korrespondere heksadesimale 0x895. 129 00:05:49,300 --> 00:05:51,290 Og den neste, 0x56. 130 00:05:51,290 --> 00:05:53,730 Gitt en relativt enkel tabell, kan du oversette 131 00:05:53,730 --> 00:05:57,130 montering i koden som maskinene kan oppfatte også. 132 00:05:57,130 --> 00:05:58,810 >> Så det er en gjenværende skritt i 133 00:05:58,810 --> 00:06:01,150 kompilering, som er knytte. 134 00:06:01,150 --> 00:06:04,530 Linking kombinerer en haug med objekt-filer til én stor fil 135 00:06:04,530 --> 00:06:06,380 at du faktisk kan utføre. 136 00:06:06,380 --> 00:06:08,570 Linking er svært avhengig av systemet. 137 00:06:08,570 --> 00:06:11,030 Så den enkleste måten å få Clang å bare koble objekt 138 00:06:11,030 --> 00:06:13,920 filene sammen er å ringe Clang på alle filene som 139 00:06:13,920 --> 00:06:15,190 du vil koble sammen. 140 00:06:15,190 --> 00:06:18,740 Hvis du angir. O-filer, så det trenger ikke å behandle, 141 00:06:18,740 --> 00:06:21,680 kompilere og sette sammen alle kildekoden. 142 00:06:21,680 --> 00:06:23,960 La oss kaste et matematisk funksjon i filen vår, så vi har 143 00:06:23,960 --> 00:06:25,210 noe å knytte i. 144 00:06:34,220 --> 00:06:37,010 La oss nå samle den tilbake ned til objektkode og 145 00:06:37,010 --> 00:06:38,260 kaller Clang på den. 146 00:06:40,560 --> 00:06:41,420 Oops. 147 00:06:41,420 --> 00:06:43,790 Siden vi inkludert en matte funksjon, må vi koble inn 148 00:06:43,790 --> 00:06:46,610 regnestykket biblioteket med-lm. 149 00:06:46,610 --> 00:06:48,990 >> Hvis vi ønsket å knytte sammen haug med. O filer som vi 150 00:06:48,990 --> 00:06:51,420 skrev på vår egen, ville vi bare spesifisere dem alle på 151 00:06:51,420 --> 00:06:52,460 kommandolinjen. 152 00:06:52,460 --> 00:06:55,320 Begrensningen er at bare en av disse filene must 153 00:06:55,320 --> 00:06:57,790 faktisk angi en hovedfunksjon, ellers 154 00:06:57,790 --> 00:06:59,930 resulterer kjørbar ville ikke vite hvor du skal begynne 155 00:06:59,930 --> 00:07:00,910 kjører koden din. 156 00:07:00,910 --> 00:07:03,360 Hva er forskjellen mellom å angi en fil for å koble inn 157 00:07:03,360 --> 00:07:06,600 med-l og bare spesifisere en fil direkte? 158 00:07:06,600 --> 00:07:07,440 Ingenting. 159 00:07:07,440 --> 00:07:09,850 Det er bare det at Clang skjer for å vite nøyaktig hva filen 160 00:07:09,850 --> 00:07:12,560 noe som-LM skjer å referere til. 161 00:07:12,560 --> 00:07:14,700 Hvis du visste at filen selv, kan du angi det 162 00:07:14,700 --> 00:07:15,930 eksplisitt. 163 00:07:15,930 --> 00:07:18,990 Bare husk at all-l flagg må komme på slutten 164 00:07:18,990 --> 00:07:20,770 av din klient etterspørsel. 165 00:07:20,770 --> 00:07:22,300 >> Og det er alt som skal til. 166 00:07:22,300 --> 00:07:24,940 Når du bare kjøre Clang på noen filer, dette er hva det er 167 00:07:24,940 --> 00:07:26,350 faktisk gjør. 168 00:07:26,350 --> 00:07:29,490 Mitt navn er Rob Bowden, og dette er CS50.