1 00:00:07,200 --> 00:00:09,100 [Powered by Google Translate] ROB Bowden: Anem a parlar dels compiladors. 2 00:00:09,100 --> 00:00:11,490 Fins aquest punt, vostè acaba d'escriure seves fonts en 3 00:00:11,490 --> 00:00:14,260 alguns arxius, els va enviar a través d'aquesta gran caixa negre que és 4 00:00:14,260 --> 00:00:16,890 Clang, i surt l'arxiu executable que fa 5 00:00:16,890 --> 00:00:19,430 exactament el que va escriure en el seu codi font. 6 00:00:19,430 --> 00:00:22,170 Com màgica com la que ha estat, anem a prendre un tancador 7 00:00:22,170 --> 00:00:23,590 mirar el que està succeint realment 8 00:00:23,590 --> 00:00:25,220 Donat un arxiu. 9 00:00:25,220 --> 00:00:28,580 Llavors, què significa això per compilar alguna cosa? 10 00:00:28,580 --> 00:00:31,150 >> Doncs bé, en el sentit més general, només significa 11 00:00:31,150 --> 00:00:32,580 codi transformar escrit en un 12 00:00:32,580 --> 00:00:34,680 llenguatge de programació a un altre. 13 00:00:34,680 --> 00:00:37,550 Però en general quan la gent diu de compilar alguna cosa, 14 00:00:37,550 --> 00:00:39,660 significa que ho estan prenent d'una programació d'alt nivell 15 00:00:39,660 --> 00:00:42,460 llenguatge a un llenguatge de programació de baix. 16 00:00:42,460 --> 00:00:44,960 Aquests poden semblar termes molt subjectius. 17 00:00:44,960 --> 00:00:48,090 Per exemple, és probable que no pensi en C com un alt 18 00:00:48,090 --> 00:00:51,440 nivell de llenguatge de programació, però sí que és compilar. 19 00:00:51,440 --> 00:00:52,730 Però tot és relatiu. 20 00:00:52,730 --> 00:00:55,790 Com veurem, l'acoblament de codi màquina i eventualment 21 00:00:55,790 --> 00:00:59,270 codi que es compila fins és sens dubte un nivell més baix 22 00:00:59,270 --> 00:01:00,700 de C. 23 00:01:00,700 --> 00:01:03,310 Tot i que utilitzarà Clang a la manifestació d'avui, un 24 00:01:03,310 --> 00:01:06,360 Moltes de les idees aquí traslladen a altres compiladors. 25 00:01:06,360 --> 00:01:09,160 >> Per Clang, hi ha quatre passos principals en el total 26 00:01:09,160 --> 00:01:10,200 compilació. 27 00:01:10,200 --> 00:01:15,430 Aquests són un, preprocessament realitzat pel preprocessador, dos, 28 00:01:15,430 --> 00:01:19,530 compilació realitzada pel compilador, tres, muntatge 29 00:01:19,530 --> 00:01:22,010 fet per l'assemblador, i quatre, 30 00:01:22,010 --> 00:01:24,640 lligar fet pel enllaçador. 31 00:01:24,640 --> 00:01:27,600 Pot ser confús que una de les subetapes de la global 32 00:01:27,600 --> 00:01:30,980 Compiladors Clang es diu el compilador, però 33 00:01:30,980 --> 00:01:32,530 arribarem a això. 34 00:01:32,530 --> 00:01:35,050 Estarem usant un programa simple hola món com el nostre exemple 35 00:01:35,050 --> 00:01:36,270 al llarg d'aquest vídeo. 36 00:01:36,270 --> 00:01:38,380 Anem a fer una ullada. 37 00:01:38,380 --> 00:01:40,330 >> El primer pas és el preprocessament. 38 00:01:40,330 --> 00:01:42,520 Què fa el preprocessador fer? 39 00:01:42,520 --> 00:01:45,560 En gairebé tots els programes C que hagis llegit o escrit, 40 00:01:45,560 --> 00:01:48,310 que ha utilitzat les línies de codi que comencen amb un coixinet. 41 00:01:48,310 --> 00:01:51,730 El trucaré hash, però també es pot dir lliures, nombre 42 00:01:51,730 --> 00:01:53,280 signar, o agut. 43 00:01:53,280 --> 00:01:56,840 Qualsevol línia tal és una directiva de preprocessador. 44 00:01:56,840 --> 00:02:00,650 Vostè probablement ha vist # define i # include abans, però hi ha 45 00:02:00,650 --> 00:02:03,690 diversos més que el preprocessador reconeix. 46 00:02:03,690 --> 00:02:07,340 Anem a afegir un # defineix per al nostre exemple hello world. 47 00:02:07,340 --> 00:02:11,690 Ara anem a executar únicament el preprocessador en aquest arxiu. 48 00:02:11,690 --> 00:02:16,150 Amb l'aprovació de la bandera clage-E, que està instruint perquè s'executi 49 00:02:16,150 --> 00:02:17,880 només el preprocessador. 50 00:02:17,880 --> 00:02:19,130 Anem a veure què passa. 51 00:02:22,250 --> 00:02:24,020 Sembla Clang només escup tot 52 00:02:24,020 --> 00:02:25,200 en la línia d'ordres. 53 00:02:25,200 --> 00:02:27,800 Per tal de salvar a tots d'aquesta sortida a un nou arxiu anomenat 54 00:02:27,800 --> 00:02:33,850 hello2.c, anem a afegir> hello2.c al nostre comandament. 55 00:02:33,850 --> 00:02:37,800 Ara donem una ullada al nostre arxiu preprocessat. 56 00:02:37,800 --> 00:02:40,810 >> Whoa, què va passar amb el nostre programa poc curt? 57 00:02:40,810 --> 00:02:43,890 Si ens anem tot el camí fins a la part inferior d'aquest arxiu, ja veurem 58 00:02:43,890 --> 00:02:46,070 una part del codi que realment va escriure. 59 00:02:46,070 --> 00:02:49,800 Observeu que el # defineix s'ha anat i totes les instàncies de nom 60 00:02:49,800 --> 00:02:51,950 han estat reemplaçats amb exactament el que s'especifica en 61 00:02:51,950 --> 00:02:53,590 la línia # defineix. 62 00:02:53,590 --> 00:02:56,530 Llavors, què són totes aquestes definicions de tipus i declaracions de funcions 63 00:02:56,530 --> 00:02:58,140 a la part superior de l'arxiu? 64 00:02:58,140 --> 00:03:00,820 Observeu que el # defineix no va ser l'únic preprocessador 65 00:03:00,820 --> 00:03:02,390 Directiva que s'especifica. 66 00:03:02,390 --> 00:03:05,280 També hem # include stdio.h. 67 00:03:05,280 --> 00:03:09,560 Així que totes les línies boges són en realitat stdio.h copiat 68 00:03:09,560 --> 00:03:11,810 i s'enganxa a la part superior d'aquest arxiu. 69 00:03:11,810 --> 00:03:14,110 És per això que els arxius de capçalera són tan útils per a la funció 70 00:03:14,110 --> 00:03:15,160 declaracions. 71 00:03:15,160 --> 00:03:17,740 En lloc d'haver de copiar i enganxar tot de la funció 72 00:03:17,740 --> 00:03:21,050 declaracions que voleu utilitzar a la part superior del seu arxiu, els 73 00:03:21,050 --> 00:03:22,990 preprocessador copiar i enganxar des de la capçalera 74 00:03:22,990 --> 00:03:24,140 arxiu per a vostè. 75 00:03:24,140 --> 00:03:26,480 >> Ara que hem acabat preprocessament, passem a 76 00:03:26,480 --> 00:03:27,680 compilació. 77 00:03:27,680 --> 00:03:30,725 La raó per la qual anomenem aquesta compilació pas és perquè es tracta d' 78 00:03:30,725 --> 00:03:34,130 el pas on Clang realment fa la seva compilació de C a 79 00:03:34,130 --> 00:03:35,370 ensamblat de codi. 80 00:03:35,370 --> 00:03:38,280 Per tal de tenir Clang compilar un arxiu cap avall per al muntatge, però 81 00:03:38,280 --> 00:03:42,030 no continuar més enllà, passar el S-bandera 82 00:03:42,030 --> 00:03:43,560 en la línia d'ordres. 83 00:03:43,560 --> 00:03:44,790 Anem a fer una ullada a l'assemblea 84 00:03:44,790 --> 00:03:47,390 arxiu que s'emeten. 85 00:03:47,390 --> 00:03:49,740 Sembla bastant un idioma diferent. 86 00:03:49,740 --> 00:03:52,660 Codi assemblador és molt específic del processador. 87 00:03:52,660 --> 00:03:55,440 En aquest cas, ja que l'aparell CS50 s'executa en un 88 00:03:55,440 --> 00:04:00,470 processador x86 virtual, aquest és el codi assemblador x86. 89 00:04:00,470 --> 00:04:03,450 Molt poques persones escriure directament en codi assemblador en aquests dies, 90 00:04:03,450 --> 00:04:06,490 però cada programa en C Alguna vegada escriure es transforma cap avall 91 00:04:06,490 --> 00:04:07,940 en el conjunt. 92 00:04:07,940 --> 00:04:11,440 Un cop més, fem una crida aquest pas l'elaboració del C al conjunt de 93 00:04:11,440 --> 00:04:14,170 ja que estem passant d'un nivell superior a un nivell inferior 94 00:04:14,170 --> 00:04:15,480 llenguatge de programació. 95 00:04:15,480 --> 00:04:17,880 >> El que fa a nivell de conjunt inferior de C? 96 00:04:17,880 --> 00:04:21,660 Doncs bé, en conjunt, estem molt limitats en el que podem fer. 97 00:04:21,660 --> 00:04:25,120 No hi ha si, al mateix temps, perquè és, o bucles de la classe. 98 00:04:25,120 --> 00:04:27,560 Però vostè pot realitzar les mateixes coses que aquests controls 99 00:04:27,560 --> 00:04:30,270 estructures ofereixen mitjançant les operacions limitades que 100 00:04:30,270 --> 00:04:32,350 muntatge proporciona. 101 00:04:32,350 --> 00:04:35,960 No obstant això, per veure fins a quin conjunt de nivell baix és en realitat, anem a 102 00:04:35,960 --> 00:04:39,320 un pas més en la nostra recopilació, muntatge. 103 00:04:39,320 --> 00:04:41,890 És el treball del muntador de transformar el codi en assemblador 104 00:04:41,890 --> 00:04:44,740 en objecte o codi de màquina. 105 00:04:44,740 --> 00:04:47,610 Recordeu que l'assemblador no ensamblat de sortida; 106 00:04:47,610 --> 00:04:51,080 més aviat, es necessiten en el muntatge i sortides de codi màquina. 107 00:04:51,080 --> 00:04:54,040 Codi màquina és l'actual 1 i 0 que una CPU pot 108 00:04:54,040 --> 00:04:57,290 entendre, tot i que encara ens queda una mica de treball a l'esquerra 109 00:04:57,290 --> 00:04:59,380 abans de poder executar el nostre programa. 110 00:04:59,380 --> 00:05:01,400 Anem a muntar el nostre codi assemblador passant 111 00:05:01,400 --> 00:05:04,080 Clang el c-bandera. 112 00:05:04,080 --> 00:05:06,410 Ara anem a veure el que hi ha a l'arxiu de ensamblat. 113 00:05:06,410 --> 00:05:09,220 >> Bé, això no ens ajuda molt. 114 00:05:09,220 --> 00:05:11,340 Recordeu que el codi de màquina és dels uns i zeros que els 115 00:05:11,340 --> 00:05:13,240 l'ordinador pot entendre. 116 00:05:13,240 --> 00:05:16,080 Això no vol dir que sigui fàcil d'entendre per a nosaltres. 117 00:05:16,080 --> 00:05:19,160 Llavors, què tan baix és el nivell d'acoblament? 118 00:05:19,160 --> 00:05:21,480 És gairebé idèntic al codi objecte. 119 00:05:21,480 --> 00:05:24,300 Passar d'assemblador a codi objecte és molt més que un 120 00:05:24,300 --> 00:05:27,540 traducció d'una transformació, de manera 121 00:05:27,540 --> 00:05:29,310 no es pot considerar que l'assemblador 122 00:05:29,310 --> 00:05:31,400 fer qualsevol compilació actual. 123 00:05:31,400 --> 00:05:34,110 De fet, és bastant fàcil de traduir manualment des 124 00:05:34,110 --> 00:05:36,050 assemblador a codi màquina. 125 00:05:36,050 --> 00:05:39,040 Quant a l'assemblea per a una funció principal, que la primera línia 126 00:05:39,040 --> 00:05:42,100 succeeix per correspondre a 0x55 hexadecimals. 127 00:05:42,100 --> 00:05:45,470 En binari, que és 1010101. 128 00:05:45,470 --> 00:05:49,300 La segona línia passa a correspondre 0x895 hexadecimal. 129 00:05:49,300 --> 00:05:51,290 I el proper 0x56,. 130 00:05:51,290 --> 00:05:53,730 Donada una taula relativament simple, que podria traduir 131 00:05:53,730 --> 00:05:57,130 ensamblat en el codi que les màquines poden comprendre també. 132 00:05:57,130 --> 00:05:58,810 >> Així que hi ha un pas restant en 133 00:05:58,810 --> 00:06:01,150 compilació, que està vinculant. 134 00:06:01,150 --> 00:06:04,530 Vinculació combina un munt d'arxius d'objectes en un arxiu gran 135 00:06:04,530 --> 00:06:06,380 que en realitat es pot executar. 136 00:06:06,380 --> 00:06:08,570 La vinculació és molt dependent del sistema. 137 00:06:08,570 --> 00:06:11,030 Així que la manera més fàcil d'obtenir Clang per vincular només objecte 138 00:06:11,030 --> 00:06:13,920 arxius junts és cridar Clang en tots els arxius que els 139 00:06:13,920 --> 00:06:15,190 desitja vincular junts. 140 00:06:15,190 --> 00:06:18,740 Si especifiqueu. Arxius o, llavors no haurà de tornar a processar, 141 00:06:18,740 --> 00:06:21,680 compilar i reunir tot el codi font. 142 00:06:21,680 --> 00:06:23,960 Anem a llançar una funció matemàtica en el nostre fitxer, de manera que hem 143 00:06:23,960 --> 00:06:25,210 alguna cosa per lligar-se polz 144 00:06:34,220 --> 00:06:37,010 Ara anem a compilar de nou a codi objecte i 145 00:06:37,010 --> 00:06:38,260 cridar Clang-hi. 146 00:06:40,560 --> 00:06:41,420 Oops. 147 00:06:41,420 --> 00:06:43,790 Ja que incloïa una funció matemàtica, hem de vincular a 148 00:06:43,790 --> 00:06:46,610 la biblioteca matemàtica amb-lm. 149 00:06:46,610 --> 00:06:48,990 >> Si volem enllaçar munt d'arxius. O que 150 00:06:48,990 --> 00:06:51,420 escriure per nosaltres mateixos, ens tornaríem a especificar tots a la 151 00:06:51,420 --> 00:06:52,460 línia d'ordres. 152 00:06:52,460 --> 00:06:55,320 La restricció és que només un d'aquests arxius han 153 00:06:55,320 --> 00:06:57,790 realment especificar la funció principal, o l'altre 154 00:06:57,790 --> 00:06:59,930 executable resultant no sabria per on començar 155 00:06:59,930 --> 00:07:00,910 executar el seu codi. 156 00:07:00,910 --> 00:07:03,360 Quina és la diferència entre especificar un arxiu per enllaçar 157 00:07:03,360 --> 00:07:06,600 amb-l i només especifiqueu un arxiu directament? 158 00:07:06,600 --> 00:07:07,440 Res. 159 00:07:07,440 --> 00:07:09,850 És que passa Clang saber exactament un arxiu 160 00:07:09,850 --> 00:07:12,560 una mena-lm passa a referir. 161 00:07:12,560 --> 00:07:14,700 Si sabés que arxiu vostè mateix, vostè podria especificar 162 00:07:14,700 --> 00:07:15,930 explícitament. 163 00:07:15,930 --> 00:07:18,990 Només recordeu que tot l banderes han de venir al final 164 00:07:18,990 --> 00:07:20,770 de la demanda dels clients. 165 00:07:20,770 --> 00:07:22,300 >> I això és tot el que cal fer. 166 00:07:22,300 --> 00:07:24,940 Quan s'acaba d'executar Clang en alguns arxius, això és el que és 167 00:07:24,940 --> 00:07:26,350 fent en realitat. 168 00:07:26,350 --> 00:07:29,490 El meu nom és Rob Bowden, i això és CS50.