1 00:00:07,200 --> 00:00:09,100 [Powered by Google Translate] ROB Бауден: Ајде да зборуваме за компајлери. 2 00:00:09,100 --> 00:00:11,490 До овој момент, сте само внеле вашиот изворен код во 3 00:00:11,490 --> 00:00:14,260 во некои датотеки, ги испрати преку оваа голема црна кутија која е 4 00:00:14,260 --> 00:00:16,890 Ѕвекот, и надвор доаѓа на вашиот извршна датотека која не 5 00:00:16,890 --> 00:00:19,430 токму она што го напиша во вашиот изворен код. 6 00:00:19,430 --> 00:00:22,170 Како магичен како што е создадено, ние ќе да се донесе поблиски 7 00:00:22,170 --> 00:00:23,590 погледнеме во она што е навистина се случува 8 00:00:23,590 --> 00:00:25,220 кога ќе состави датотека. 9 00:00:25,220 --> 00:00:28,580 Па што значи тоа да ги собере нешто? 10 00:00:28,580 --> 00:00:31,150 >> Па, во најопшта смисла, тоа само значи 11 00:00:31,150 --> 00:00:32,580 трансформирање на код напишан во една 12 00:00:32,580 --> 00:00:34,680 програмски јазик на друг. 13 00:00:34,680 --> 00:00:37,550 Но обично кога луѓето велат дека ги собере нешто, тие 14 00:00:37,550 --> 00:00:39,660 значи дека тие се земајќи го од повисоко ниво програмирање 15 00:00:39,660 --> 00:00:42,460 јазик на пониско ниво програмскиот јазик. 16 00:00:42,460 --> 00:00:44,960 Овие може да изгледа како многу субјективни услови. 17 00:00:44,960 --> 00:00:48,090 На пример, што веројатно не мисли на C како високо 18 00:00:48,090 --> 00:00:51,440 ниво програмски јазик, но вие не го компајлирате. 19 00:00:51,440 --> 00:00:52,730 Но, сето тоа е релативна. 20 00:00:52,730 --> 00:00:55,790 Како што ќе видиме, асемблерски код и на крајот машина 21 00:00:55,790 --> 00:00:59,270 код кој ние ги собере до сомнение претставува пониско ниво 22 00:00:59,270 --> 00:01:00,700 од В 23 00:01:00,700 --> 00:01:03,310 Иако ние ќе биде со користење ѕвекот во демонстрациите денес, 24 00:01:03,310 --> 00:01:06,360 многу од идеите тука носат во текот на други компајлери. 25 00:01:06,360 --> 00:01:09,160 >> За ѕвекот, постојат четири главни чекори во целокупниот 26 00:01:09,160 --> 00:01:10,200 компилација. 27 00:01:10,200 --> 00:01:15,430 Овие се едни, препроцесирачка направено од страна на препроцесори, две, 28 00:01:15,430 --> 00:01:19,530 компилација направено од страна на компајлерот, три, монтажа 29 00:01:19,530 --> 00:01:22,010 направено од страна на асемблер, и четири, 30 00:01:22,010 --> 00:01:24,640 поврзување направено од страна на linker. 31 00:01:24,640 --> 00:01:27,600 Тоа може да биде збунувачки дека еден од substeps на целокупната 32 00:01:27,600 --> 00:01:30,980 Ѕвекот компајлери се нарекува компајлер, но 33 00:01:30,980 --> 00:01:32,530 ние ќе дојдеме до тоа. 34 00:01:32,530 --> 00:01:35,050 Ние ќе биде со користење на едноставни Здраво светот програма како нашиот пример 35 00:01:35,050 --> 00:01:36,270 во текот на оваа видео. 36 00:01:36,270 --> 00:01:38,380 Ајде да ги разгледаме. 37 00:01:38,380 --> 00:01:40,330 >> Првиот чекор е препроцесирачка. 38 00:01:40,330 --> 00:01:42,520 Што значи препроцесори направи? 39 00:01:42,520 --> 00:01:45,560 Во речиси секоја програма C некогаш сте прочитана или напишана, 40 00:01:45,560 --> 00:01:48,310 сте користеле линии на код кој започнува со хаш. 41 00:01:48,310 --> 00:01:51,730 Јас ќе го наречеме хаш, но вие исто така може да го наречеме фунти, број 42 00:01:51,730 --> 00:01:53,280 потпише, или остри. 43 00:01:53,280 --> 00:01:56,840 Секоја таква линија е препроцесори директивата. 44 00:01:56,840 --> 00:02:00,650 Веројатно сте виделе # define и # include пред, но има 45 00:02:00,650 --> 00:02:03,690 уште неколку дека препроцесори препознава. 46 00:02:03,690 --> 00:02:07,340 Да додадете # define на нашите Здраво Светот пример. 47 00:02:07,340 --> 00:02:11,690 Сега ајде да се кандидира само препроцесори на оваа датотека. 48 00:02:11,690 --> 00:02:16,150 Со полагање clage на-Е знаме, ти си наложи да работи 49 00:02:16,150 --> 00:02:17,880 само препроцесори. 50 00:02:17,880 --> 00:02:19,130 Ајде да видиме што се случува. 51 00:02:22,250 --> 00:02:24,020 Тоа изгледа како ѕвекот само плука се 52 00:02:24,020 --> 00:02:25,200 на командната линија. 53 00:02:25,200 --> 00:02:27,800 Со цел да се спаси сето ова излез на нов фајл наречен 54 00:02:27,800 --> 00:02:33,850 hello2.c, ние ќе додадете> hello2.c на нашата команда. 55 00:02:33,850 --> 00:02:37,800 Сега ајде да ги разгледаме во нашата preprocessed датотека. 56 00:02:37,800 --> 00:02:40,810 >> Леле, што се случи со нашите кратки малку програма? 57 00:02:40,810 --> 00:02:43,890 Ако одиме по целиот пат до дното на оваа датотека, ќе видиме 58 00:02:43,890 --> 00:02:46,070 некои од код кој ние всушност го напишал. 59 00:02:46,070 --> 00:02:49,800 Забележете дека # define е нема и сите инстанци на името 60 00:02:49,800 --> 00:02:51,950 се заменува со точно она што е наведено во 61 00:02:51,950 --> 00:02:53,590 на # define линија. 62 00:02:53,590 --> 00:02:56,530 Значи она што се сите овие typedefs и функција декларации 63 00:02:56,530 --> 00:02:58,140 на врвот на датотеката? 64 00:02:58,140 --> 00:03:00,820 Забележете дека # define не беше само препроцесори 65 00:03:00,820 --> 00:03:02,390 директивата дека одреден. 66 00:03:02,390 --> 00:03:05,280 Ние, исто така, # include stdio.h. 67 00:03:05,280 --> 00:03:09,560 Значи сите луди линии се всушност само stdio.h копирани 68 00:03:09,560 --> 00:03:11,810 и атипичен во врвот на оваа датотека. 69 00:03:11,810 --> 00:03:14,110 Тоа е зошто насловот датотеки се толку корисни за функција 70 00:03:14,110 --> 00:03:15,160 декларации. 71 00:03:15,160 --> 00:03:17,740 Наместо да има потреба да копирате и залепите сите на функцијата 72 00:03:17,740 --> 00:03:21,050 декларации планирате за користење на врвот на вашата датотека, 73 00:03:21,050 --> 00:03:22,990 препроцесори ќе копирајте го и ставете ги во насловот 74 00:03:22,990 --> 00:03:24,140 датотека за вас. 75 00:03:24,140 --> 00:03:26,480 >> Сега дека ние сме направиле препроцесирачка, се движиме кон 76 00:03:26,480 --> 00:03:27,680 компилација. 77 00:03:27,680 --> 00:03:30,725 Причината што ние го нарекуваме овој чекор компилација е затоа што ова е 78 00:03:30,725 --> 00:03:34,130 чекор каде ѕвекот, всушност, не својата составувањето од C до 79 00:03:34,130 --> 00:03:35,370 асемблерски код. 80 00:03:35,370 --> 00:03:38,280 Со цел да се имаат ѕвекот состави датотека до собранието, но 81 00:03:38,280 --> 00:03:42,030 продолжи нема понатаму, тоа го положат-S знаме 82 00:03:42,030 --> 00:03:43,560 на командната линија. 83 00:03:43,560 --> 00:03:44,790 Ајде да ги разгледаме во собранието 84 00:03:44,790 --> 00:03:47,390 датотека која беше outputted. 85 00:03:47,390 --> 00:03:49,740 Тоа изгледа како сосема различен јазик. 86 00:03:49,740 --> 00:03:52,660 Асемблерски код е многу процесорот специфични. 87 00:03:52,660 --> 00:03:55,440 Во овој случај, бидејќи CS50 апаратот работи на 88 00:03:55,440 --> 00:04:00,470 виртуелен x86 процесор, ова е x86 асемблерски код. 89 00:04:00,470 --> 00:04:03,450 Многу малку луѓе пишуваат директно во асемблерски код, овие денови, 90 00:04:03,450 --> 00:04:06,490 но секоја програма Ц Дали некогаш сте се напише добива трансформираат надолу 91 00:04:06,490 --> 00:04:07,940 во собранието. 92 00:04:07,940 --> 00:04:11,440 Повторно, ние го нарекуваме овој чекор составувањето на C во собранието 93 00:04:11,440 --> 00:04:14,170 бидејќи ние се случува од повисоко ниво на пониско ниво 94 00:04:14,170 --> 00:04:15,480 програмскиот јазик. 95 00:04:15,480 --> 00:04:17,880 >> Она што ја прави собранието пониско ниво од Ц? 96 00:04:17,880 --> 00:04:21,660 Па, во собранието, ние сме многу ограничени во она што можеме да направиме. 97 00:04:21,660 --> 00:04:25,120 Нема ако, додека е, за, или јамки на било кој вид. 98 00:04:25,120 --> 00:04:27,560 Но може да се постигне истите работи што овие контролни 99 00:04:27,560 --> 00:04:30,270 структури нудат користење на ограничени операции кои 100 00:04:30,270 --> 00:04:32,350 собранието не се обезбеди. 101 00:04:32,350 --> 00:04:35,960 Но, да се види само колку ниско ниво собранието навистина е, ајде да одиме 102 00:04:35,960 --> 00:04:39,320 еден чекор понатаму во нашата компилација, монтажа. 103 00:04:39,320 --> 00:04:41,890 Тоа е работа на асемблер да се трансформира асемблерски код 104 00:04:41,890 --> 00:04:44,740 во објектот или машински код. 105 00:04:44,740 --> 00:04:47,610 Запомнете дека асемблер не излез собранието; 106 00:04:47,610 --> 00:04:51,080 а, тоа трае во собранието и излези машина код. 107 00:04:51,080 --> 00:04:54,040 Машина кодот е вистинската 1 и 0 е дека процесорот може да 108 00:04:54,040 --> 00:04:57,290 разбере, иако ние се уште имаат мал малку на работа остави 109 00:04:57,290 --> 00:04:59,380 пред да може да работи нашата програма. 110 00:04:59,380 --> 00:05:01,400 Да се ​​соберат нашите асемблерски код со полагање 111 00:05:01,400 --> 00:05:04,080 Ѕвекот на-в знаме. 112 00:05:04,080 --> 00:05:06,410 Сега да видиме со што е во собраа датотека. 113 00:05:06,410 --> 00:05:09,220 >> Па, тоа не ни помогне многу. 114 00:05:09,220 --> 00:05:11,340 Запомни што машина кодот е оние кои и нули дека 115 00:05:11,340 --> 00:05:13,240 вашиот компјутер може да се разбере. 116 00:05:13,240 --> 00:05:16,080 Тоа не значи дека тоа е лесно за нас да се разбере. 117 00:05:16,080 --> 00:05:19,160 Значи точно колку ниско ниво собранието? 118 00:05:19,160 --> 00:05:21,480 Тоа е речиси идентична со објектниот код. 119 00:05:21,480 --> 00:05:24,300 Одејќи од собранието на објектниот код е многу повеќе од 120 00:05:24,300 --> 00:05:27,540 превод од трансформација, која е причината зошто 121 00:05:27,540 --> 00:05:29,310 никој не може да сметаат на асемблер да 122 00:05:29,310 --> 00:05:31,400 направи било вистински составувањето. 123 00:05:31,400 --> 00:05:34,110 Всушност, тоа е прилично лесен за рачно превод од 124 00:05:34,110 --> 00:05:36,050 собранието на машински код. 125 00:05:36,050 --> 00:05:39,040 Гледајќи собранието за главната функција, дека првата линија 126 00:05:39,040 --> 00:05:42,100 се случува да одговараат на хексадецимално 0x55. 127 00:05:42,100 --> 00:05:45,470 Во бинарна, тоа е 1.010.101. 128 00:05:45,470 --> 00:05:49,300 Втората линија се случува да одговараат хексадецимален 0x895. 129 00:05:49,300 --> 00:05:51,290 И следниот, 0x56. 130 00:05:51,290 --> 00:05:53,730 Со оглед на релативно едноставна табела, можете да се преведе 131 00:05:53,730 --> 00:05:57,130 собранието во кодот кој машини може да се разбере премногу. 132 00:05:57,130 --> 00:05:58,810 >> Значи има една преостанатите чекор во 133 00:05:58,810 --> 00:06:01,150 компилација, која се поврзува. 134 00:06:01,150 --> 00:06:04,530 Поврзување комбинира еден куп на објектот датотеки во една голема датотека 135 00:06:04,530 --> 00:06:06,380 што всушност може да се изврши. 136 00:06:06,380 --> 00:06:08,570 Поврзување е самиот систем зависни. 137 00:06:08,570 --> 00:06:11,030 Па најлесен начин да се добие ѕвекот само да водат објект 138 00:06:11,030 --> 00:06:13,920 додадени фајлови заедно е да се јавите ѕвекот на сите датотеки кои 139 00:06:13,920 --> 00:06:15,190 сакате да ги поврзе заедно. 140 00:06:15,190 --> 00:06:18,740 Ако одредите. O датотеки, тогаш не ќе треба повторно да се процесуира, 141 00:06:18,740 --> 00:06:21,680 собере, и се соберат сите на вашиот изворен код. 142 00:06:21,680 --> 00:06:23,960 Ајде да фрли математика функција во нашата датотека, па имаме 143 00:06:23,960 --> 00:06:25,210 нешто да се поврзе внатре 144 00:06:34,220 --> 00:06:37,010 Сега ајде да го компајлирате назад до објектниот код и 145 00:06:37,010 --> 00:06:38,260 јавете ѕвекот на неа. 146 00:06:40,560 --> 00:06:41,420 Упс. 147 00:06:41,420 --> 00:06:43,790 Бидејќи ние вклучени математика функција, ние треба да се поврзат во 148 00:06:43,790 --> 00:06:46,610 математика библиотека со-филмот. 149 00:06:46,610 --> 00:06:48,990 >> Ако сакавме да се поврзат заедно куп. O датотеки кои ние 150 00:06:48,990 --> 00:06:51,420 напиша на нашите сопствени, ние само ќе си определи ги сите во 151 00:06:51,420 --> 00:06:52,460 командната линија. 152 00:06:52,460 --> 00:06:55,320 Ограничување е дека само еден од овие датотеки мора 153 00:06:55,320 --> 00:06:57,790 всушност се определи основна функција, или на друго место на 154 00:06:57,790 --> 00:06:59,930 резултира извршна не би знаеле каде да почнам 155 00:06:59,930 --> 00:07:00,910 водење на вашиот код. 156 00:07:00,910 --> 00:07:03,360 Која е разликата помеѓу утврдувањето датотека да се поврзат во 157 00:07:03,360 --> 00:07:06,600 со-l и само да одредува датотека директно? 158 00:07:06,600 --> 00:07:07,440 Ништо. 159 00:07:07,440 --> 00:07:09,850 Тоа е само дека ѕвекот случува да знаат точно што датотека 160 00:07:09,850 --> 00:07:12,560 нешто како-филмот се случува да се однесуваат. 161 00:07:12,560 --> 00:07:14,700 Ако знаеше дека датотеката сами, можете да го одредите 162 00:07:14,700 --> 00:07:15,930 експлицитно. 163 00:07:15,930 --> 00:07:18,990 Само сети се дека сите л знамиња треба да дојде на крајот 164 00:07:18,990 --> 00:07:20,770 на вашиот клиент побарувачка. 165 00:07:20,770 --> 00:07:22,300 >> И тоа е сè што постои на неа. 166 00:07:22,300 --> 00:07:24,940 Кога ли само ја стартувате ѕвекот на некои фајлови, тоа е она што е 167 00:07:24,940 --> 00:07:26,350 всушност прави. 168 00:07:26,350 --> 00:07:29,490 Моето име е Роб Бауден, и ова е CS50.