1 00:00:07,200 --> 00:00:09,100 [Powered by Google Translate] ROB BOWDEN: Porozmawiajmy o kompilatory. 2 00:00:09,100 --> 00:00:11,490 Do tego momentu, właśnie wpisałeś swój kod źródłowy do 3 00:00:11,490 --> 00:00:14,260 niektóre pliki, wysłał je przez tego wielkiego czarnej skrzynki, która jest 4 00:00:14,260 --> 00:00:16,890 Dzyń, a obecnie jest plik wykonywalny, który nie 5 00:00:16,890 --> 00:00:19,430 dokładnie to, co napisałem w kodzie źródłowym. 6 00:00:19,430 --> 00:00:22,170 Jak magiczne jak było, jedziemy do podjęcia bliżej 7 00:00:22,170 --> 00:00:23,590 patrzeć na to, co faktycznie dzieje się 8 00:00:23,590 --> 00:00:25,220 kiedy skompilować plik. 9 00:00:25,220 --> 00:00:28,580 Więc co to znaczy, aby skompilować coś? 10 00:00:28,580 --> 00:00:31,150 >> No cóż, w najbardziej ogólnym sensie, to tylko oznacza 11 00:00:31,150 --> 00:00:32,580 kod napisany w jednym przekształcania 12 00:00:32,580 --> 00:00:34,680 języka programowania na inny. 13 00:00:34,680 --> 00:00:37,550 Ale zwykle, gdy ludzie mówią, że coś skompilować, to 14 00:00:37,550 --> 00:00:39,660 znaczy, że bierzesz to z wyższego poziomu programowania 15 00:00:39,660 --> 00:00:42,460 język do niższego poziomu języka programowania. 16 00:00:42,460 --> 00:00:44,960 To może wydawać się sposób bardzo subiektywne. 17 00:00:44,960 --> 00:00:48,090 Na przykład, to prawdopodobnie nie myśleć o C, jak wysoki 18 00:00:48,090 --> 00:00:51,440 język programowania, poziom, ale można go skompilować. 19 00:00:51,440 --> 00:00:52,730 Ale to wszystko jest względne. 20 00:00:52,730 --> 00:00:55,790 Jak zobaczymy, kod montaż i ostatecznie maszyna 21 00:00:55,790 --> 00:00:59,270 Kod, który możemy skompilować dół jest niezaprzeczalnie niższy poziom 22 00:00:59,270 --> 00:01:00,700 niż C. 23 00:01:00,700 --> 00:01:03,310 Chociaż będziemy używać brzękiem w dzisiejszej demonstracji 24 00:01:03,310 --> 00:01:06,360 Wiele z pomysłów tutaj przenieść do innych kompilatorów. 25 00:01:06,360 --> 00:01:09,160 >> Dla Clang, istnieją cztery główne etapy ogólna 26 00:01:09,160 --> 00:01:10,200 kompilacji. 27 00:01:10,200 --> 00:01:15,430 Są to jedno, przerób wykonane przez preprocesor, dwa, 28 00:01:15,430 --> 00:01:19,530 Opracowanie wykonane przez kompilator, trzy, montaż 29 00:01:19,530 --> 00:01:22,010 dokonana przez montera, i cztery, 30 00:01:22,010 --> 00:01:24,640 łączenie robione przez linker. 31 00:01:24,640 --> 00:01:27,600 Może to być mylące, że jednym z podkroki ogólnej 32 00:01:27,600 --> 00:01:30,980 Kompilatory dzyń nazywa kompilator, ale 33 00:01:30,980 --> 00:01:32,530 dojdziemy do tego. 34 00:01:32,530 --> 00:01:35,050 Będziemy używać proste Hello World w naszym przykładzie 35 00:01:35,050 --> 00:01:36,270 przez cały ten film. 36 00:01:36,270 --> 00:01:38,380 Rzućmy okiem. 37 00:01:38,380 --> 00:01:40,330 >> Pierwszym krokiem jest przerób. 38 00:01:40,330 --> 00:01:42,520 Co preprocesor zrobić? 39 00:01:42,520 --> 00:01:45,560 W prawie każdym programie C kiedykolwiek przeczytać lub pisemne, 40 00:01:45,560 --> 00:01:48,310 użyłeś linii kodu, które zaczynają się od mieszania. 41 00:01:48,310 --> 00:01:51,730 Ja nazywam to hash, ale można również nazwać funtów, numer 42 00:01:51,730 --> 00:01:53,280 podpisania, lub ostry. 43 00:01:53,280 --> 00:01:56,840 Każda taka linia jest Dyrektywa preprocesora. 44 00:01:56,840 --> 00:02:00,650 Prawdopodobnie widziałeś # define i # include przed, ale nie 45 00:02:00,650 --> 00:02:03,690 kilka bardziej, że preprocesor uznaje. 46 00:02:03,690 --> 00:02:07,340 Dodajmy # define do naszego powitania przykład światowej. 47 00:02:07,340 --> 00:02:11,690 Teraz uruchom tylko preprocesor na tym pliku. 48 00:02:11,690 --> 00:02:16,150 Przekazując CLAGE flagi-E, jesteś pouczając go uruchomić 49 00:02:16,150 --> 00:02:17,880 tylko preprocesor. 50 00:02:17,880 --> 00:02:19,130 Zobaczmy, co się dzieje. 51 00:02:22,250 --> 00:02:24,020 To wygląda jak Clang tylko wypluwa wszystko 52 00:02:24,020 --> 00:02:25,200 w wierszu poleceń. 53 00:02:25,200 --> 00:02:27,800 Aby zapisać wszystkie tego wyjścia do nowego pliku o nazwie 54 00:02:27,800 --> 00:02:33,850 hello2.c będziemy dołączać> hello2.c do naszej komendy. 55 00:02:33,850 --> 00:02:37,800 Teraz rzućmy okiem na nasz przetworzonej pliku. 56 00:02:37,800 --> 00:02:40,810 >> Whoa, co stało się z naszego krótkiego małego programu? 57 00:02:40,810 --> 00:02:43,890 Jeśli idziemy aż do końca pliku, zobaczymy 58 00:02:43,890 --> 00:02:46,070 część kodu, że rzeczywiście napisał. 59 00:02:46,070 --> 00:02:49,800 Zauważ, że # define nie ma, a wszystkie wystąpienia nazwy 60 00:02:49,800 --> 00:02:51,950 zostały zastąpione dokładnie to, co określono w 61 00:02:51,950 --> 00:02:53,590 # define linię. 62 00:02:53,590 --> 00:02:56,530 Więc jakie są te wszystkie typedef i deklaracje funkcji 63 00:02:56,530 --> 00:02:58,140 na początku pliku? 64 00:02:58,140 --> 00:03:00,820 Zauważ, że # define nie tylko preprocesor 65 00:03:00,820 --> 00:03:02,390 dyrektywa, że ​​określona. 66 00:03:02,390 --> 00:03:05,280 Mamy też # include stdio.h. 67 00:03:05,280 --> 00:03:09,560 Więc wszystkie szalone linie są właściwie tylko stdio.h kopiowane 68 00:03:09,560 --> 00:03:11,810 i wkleić na górze tego pliku. 69 00:03:11,810 --> 00:03:14,110 Dlatego pliki nagłówkowe są przydatne dla funkcji 70 00:03:14,110 --> 00:03:15,160 deklaracje. 71 00:03:15,160 --> 00:03:17,740 Zamiast konieczności kopiowania i wklejania wszystkich funkcji 72 00:03:17,740 --> 00:03:21,050 Deklaracje planujesz używać na górze pliku, 73 00:03:21,050 --> 00:03:22,990 preprocesor będzie skopiować i wkleić je z nagłówka 74 00:03:22,990 --> 00:03:24,140 plik dla Ciebie. 75 00:03:24,140 --> 00:03:26,480 >> Teraz, kiedy skończyliśmy wstępne przetwarzanie, ruszamy na 76 00:03:26,480 --> 00:03:27,680 kompilacji. 77 00:03:27,680 --> 00:03:30,725 Powodem nazywamy to kompilacja krokiem jest, ponieważ jest to 78 00:03:30,725 --> 00:03:34,130 Krok, w którym faktycznie musi Clang jego kompilacji z C do 79 00:03:34,130 --> 00:03:35,370 Kod montaż. 80 00:03:35,370 --> 00:03:38,280 Aby mieć Clang skompilować plik w dół do montażu, ale 81 00:03:38,280 --> 00:03:42,030 kontynuować dalej, przekazać ją flag-S 82 00:03:42,030 --> 00:03:43,560 w wierszu poleceń. 83 00:03:43,560 --> 00:03:44,790 Rzućmy okiem na zgromadzeniu 84 00:03:44,790 --> 00:03:47,390 plik był wyprowadzany. 85 00:03:47,390 --> 00:03:49,740 To wygląda jak całkiem inny język. 86 00:03:49,740 --> 00:03:52,660 Kod Montaż jest bardzo procesor specyficzne. 87 00:03:52,660 --> 00:03:55,440 W tym przypadku, ponieważ CS50 urządzenie pracuje na 88 00:03:55,440 --> 00:04:00,470 wirtualny procesor x86, x86 to kod montaż. 89 00:04:00,470 --> 00:04:03,450 Bardzo niewielu ludzi pisać bezpośrednio w kodzie asemblera te dni, 90 00:04:03,450 --> 00:04:06,490 ale każdy program C kiedykolwiek napisać zostaje przekształcona w dół 91 00:04:06,490 --> 00:04:07,940 do montażu. 92 00:04:07,940 --> 00:04:11,440 Ponownie wzywamy ten krok kompilujesz C do montażu 93 00:04:11,440 --> 00:04:14,170 ponieważ będą z wyższego poziomu na niższy poziom 94 00:04:14,170 --> 00:04:15,480 języka programowania. 95 00:04:15,480 --> 00:04:17,880 >> Co sprawia, że ​​montaż niższym poziomie niż C? 96 00:04:17,880 --> 00:04:21,660 Cóż, w zespole, mamy bardzo ograniczony w tym, co możemy zrobić. 97 00:04:21,660 --> 00:04:25,120 Nie ma w razie, podczas gdy jest, za to, czy pętle jakiegokolwiek rodzaju. 98 00:04:25,120 --> 00:04:27,560 Ale można osiągnąć te same rzeczy, które ich kontrola 99 00:04:27,560 --> 00:04:30,270 konstrukcje oferują przy ograniczonych operacji, które 100 00:04:30,270 --> 00:04:32,350 Zespół ma zapewnić. 101 00:04:32,350 --> 00:04:35,960 Ale żeby zobaczyć, jak niski poziom naprawdę jest montaż, chodźmy 102 00:04:35,960 --> 00:04:39,320 kolejny krok w naszym zestawieniu, montaż. 103 00:04:39,320 --> 00:04:41,890 To assembler Zadaniem przekształcenie kodu assemblera 104 00:04:41,890 --> 00:04:44,740 do obiektu lub kodu maszynowego. 105 00:04:44,740 --> 00:04:47,610 Pamiętaj, że assembler nie zespół wyjściowego; 106 00:04:47,610 --> 00:04:51,080 raczej, trwa w montażu i kodu maszynowego wyjść. 107 00:04:51,080 --> 00:04:54,040 Kod maszynowy jest rzeczywisty 1 i 0, że CPU może 108 00:04:54,040 --> 00:04:57,290 rozumiem, choć mamy jeszcze odrobinę pracy lewo 109 00:04:57,290 --> 00:04:59,380 przed możemy uruchomić nasz program. 110 00:04:59,380 --> 00:05:01,400 Miejmy wykonujemy nasze kodu assemblera przechodząc 111 00:05:01,400 --> 00:05:04,080 -C Clang flag. 112 00:05:04,080 --> 00:05:06,410 Teraz zobaczmy, co jest w zmontowanym pliku. 113 00:05:06,410 --> 00:05:09,220 >> Dobrze, że nie pomoże nam bardzo. 114 00:05:09,220 --> 00:05:11,340 Pamiętaj, że kod maszynowy jest zer i jedynek, że 115 00:05:11,340 --> 00:05:13,240 Twój komputer może zrozumieć. 116 00:05:13,240 --> 00:05:16,080 To nie znaczy, że to łatwe dla nas do zrozumienia. 117 00:05:16,080 --> 00:05:19,160 Tak dokładnie, jak niski poziom jest montaż? 118 00:05:19,160 --> 00:05:21,480 Jest prawie identyczny z kodem wynikowym. 119 00:05:21,480 --> 00:05:24,300 Idąc od montażu do kodu wynikowego jest o wiele więcej 120 00:05:24,300 --> 00:05:27,540 Tłumaczenie niż transformacji, dlatego 121 00:05:27,540 --> 00:05:29,310 nikt nie może wziąć pod uwagę, aby assembler 122 00:05:29,310 --> 00:05:31,400 nie wykonują żadnej kompilacji. 123 00:05:31,400 --> 00:05:34,110 W rzeczywistości, jest to dość łatwe do ręcznie przetłumaczyć z 124 00:05:34,110 --> 00:05:36,050 montaż do kodu maszynowego. 125 00:05:36,050 --> 00:05:39,040 Patrząc na składzie dla głównej funkcji, że pierwsza linia 126 00:05:39,040 --> 00:05:42,100 zdarza się odpowiadać szesnastkowych 0x55. 127 00:05:42,100 --> 00:05:45,470 W formacie binarnym, to 1010101. 128 00:05:45,470 --> 00:05:49,300 Druga linia trafem odpowiada szesnastkową 0x895. 129 00:05:49,300 --> 00:05:51,290 I następna, 0x56. 130 00:05:51,290 --> 00:05:53,730 Biorąc pod uwagę stosunkowo prosty stół, można tłumaczyć 131 00:05:53,730 --> 00:05:57,130 montaż do kodu, że maszyny mogą zrozumieć też. 132 00:05:57,130 --> 00:05:58,810 >> Więc jest jeden krok w pozostałych 133 00:05:58,810 --> 00:06:01,150 kompilacji, który łączący. 134 00:06:01,150 --> 00:06:04,530 Powiązanie łączy kilka plików obiektów w jeden duży plik 135 00:06:04,530 --> 00:06:06,380 że rzeczywiście można wykonać. 136 00:06:06,380 --> 00:06:08,570 Łączenie jest bardzo zależna od systemu. 137 00:06:08,570 --> 00:06:11,030 Więc Najłatwiej dostać brzękiem po prostu połączyć obiekt 138 00:06:11,030 --> 00:06:13,920 pliki razem jest wywołanie brzękiem na wszystkie pliki, które 139 00:06:13,920 --> 00:06:15,190 chcesz połączyć ze sobą. 140 00:06:15,190 --> 00:06:18,740 Jeśli podasz. Plików Ó, to nie trzeba będzie ponownie przetworzyć, 141 00:06:18,740 --> 00:06:21,680 kompilacji i montaż wszystkich kodu źródłowego. 142 00:06:21,680 --> 00:06:23,960 Chodźmy rzucić funkcji matematycznej do naszego archiwum, więc mamy 143 00:06:23,960 --> 00:06:25,210 coś łączyć w. 144 00:06:34,220 --> 00:06:37,010 Teraz go skompilować z powrotem do kodu obiektu i 145 00:06:37,010 --> 00:06:38,260 zadzwoń brzękiem na nim. 146 00:06:40,560 --> 00:06:41,420 Ups. 147 00:06:41,420 --> 00:06:43,790 Ponieważ zawierał funkcji matematycznej, musimy połączyć w 148 00:06:43,790 --> 00:06:46,610 biblioteka matematyczna z-lm. 149 00:06:46,610 --> 00:06:48,990 >> Jeśli chcemy połączyć ze sobą kilka. Pliki o że 150 00:06:48,990 --> 00:06:51,420 napisał na nasz własny, że po prostu podać je wszystkie 151 00:06:51,420 --> 00:06:52,460 linii poleceń. 152 00:06:52,460 --> 00:06:55,320 Ograniczenie to, że tylko jeden z tych plików musi 153 00:06:55,320 --> 00:06:57,790 faktycznie określić główną funkcję, albo 154 00:06:57,790 --> 00:06:59,930 wykonywalny wynikające nie wiem od czego zacząć 155 00:06:59,930 --> 00:07:00,910 działa kod. 156 00:07:00,910 --> 00:07:03,360 Jaka jest różnica między określenia plik połączyć w 157 00:07:03,360 --> 00:07:06,600 z-l, a po prostu określenia plik bezpośrednio? 158 00:07:06,600 --> 00:07:07,440 Nic. 159 00:07:07,440 --> 00:07:09,850 Tyle tylko, że dzieje się Clang dokładnie wiedzieć, co plik 160 00:07:09,850 --> 00:07:12,560 like-lm coś dzieje się odwoływać. 161 00:07:12,560 --> 00:07:14,700 Gdybyś wiedział, że plik się, można określić ją 162 00:07:14,700 --> 00:07:15,930 jawnie. 163 00:07:15,930 --> 00:07:18,990 Wystarczy pamiętać, że wszystko-l flag musiał przyjść na koniec 164 00:07:18,990 --> 00:07:20,770 swojego zapotrzebowania klienta. 165 00:07:20,770 --> 00:07:22,300 >> I to wszystko, co jest do niej. 166 00:07:22,300 --> 00:07:24,940 Po prostu uruchom brzękiem na niektórych plików, to co to jest 167 00:07:24,940 --> 00:07:26,350 rzeczywiście robi. 168 00:07:26,350 --> 00:07:29,490 Nazywam się Rob Bowden, a to CS50.