1 00:00:00,000 --> 00:00:02,210 [Powered by Google Translate] [Opis przejścia - Set Problem 6] 2 00:00:02,210 --> 00:00:04,810 [Zamyla Chan - Harvard University] 3 00:00:04,810 --> 00:00:07,240 [To jest CS50. - CS50.TV] 4 00:00:07,240 --> 00:00:12,180 >> Witam wszystkich i zapraszamy do Walkthrough 6: Puff Huff'n. 5 00:00:12,180 --> 00:00:17,440 W Puff Huff'n co robimy ma być do czynienia z pliku skompresowanego Huffmana 6 00:00:17,440 --> 00:00:20,740 a następnie zaciągając go ponownie, więc go dekompresji, 7 00:00:20,740 --> 00:00:25,810 tak, że możemy tłumaczyć z 0s i 1s, że użytkownik wysyła nam 8 00:00:25,810 --> 00:00:30,660 i przekształcić ją z powrotem do oryginalnego tekstu. 9 00:00:30,660 --> 00:00:34,360 Pset 6 będzie całkiem fajne, bo masz zamiar zobaczyć niektóre z narzędzi 10 00:00:34,360 --> 00:00:41,730 że stosowane w Pset 4 i Pset 5 i rodzaj łącząc je w 1 koncepcji całkiem zgrabny 11 00:00:41,730 --> 00:00:43,830 gdy przyjdziesz do myśleć o tym. 12 00:00:43,830 --> 00:00:50,110 >> Także, prawdopodobnie, pset 4 i 5 były najtrudniejszych psets które mieliśmy do zaoferowania. 13 00:00:50,110 --> 00:00:53,950 Tak więc od teraz mamy ten 1 więcej PSET w C, 14 00:00:53,950 --> 00:00:56,480 a po, że jesteśmy do programowania. 15 00:00:56,480 --> 00:01:02,310 Więc gratuluję siebie dla uzyskania nad najtrudniejszym garbu w CS50. 16 00:01:03,630 --> 00:01:09,760 >> Przechodząc do Puff Huff'n nasz przybornik do tego Pset będą drzewa Huffman 17 00:01:09,760 --> 00:01:14,700 więc zrozumienie nie tylko, jak drzewa binarnego pracę, ale także konkretnie drzewa Huffmana, 18 00:01:14,700 --> 00:01:16,240 jak są one zbudowane. 19 00:01:16,240 --> 00:01:20,210 I wtedy będziemy mieć dużo kodu dystrybucyjnego w tym zbior, 20 00:01:20,210 --> 00:01:22,480 a my się, aby zobaczyć, że rzeczywiście niektóre z kodu 21 00:01:22,480 --> 00:01:24,670 nie może być w pełni zrozumieć jeszcze 22 00:01:24,670 --> 00:01:30,080 więc te będą pliki. c, ale towarzyszące im pliki. h 23 00:01:30,080 --> 00:01:34,300 da nam wystarczająco dużo zrozumienia, że ​​musimy tak, że wiemy, jak te funkcje działają 24 00:01:34,300 --> 00:01:38,100 lub przynajmniej to, co mają robić - ich wejścia i wyjścia - 25 00:01:38,100 --> 00:01:40,760 nawet, jeśli nie wiemy, co dzieje się w czarnej skrzynce 26 00:01:40,760 --> 00:01:44,090 lub nie rozumieją, co się dzieje w czarnym pudełku wewnątrz. 27 00:01:44,090 --> 00:01:49,400 I w końcu, jak zwykle, mamy do czynienia z nowymi strukturami danych, 28 00:01:49,400 --> 00:01:51,840 szczególne rodzaje węzłów, które wskazują na pewne rzeczy, 29 00:01:51,840 --> 00:01:56,080 a więc o papier i pióro nie tylko dla procesu projektowania 30 00:01:56,080 --> 00:01:58,470 i gdy starasz się dowiedzieć w jaki sposób powinien działać pset 31 00:01:58,470 --> 00:02:00,520 ale także podczas debugowania. 32 00:02:00,520 --> 00:02:06,140 Możesz mieć GDB obok pióra i papieru podczas zdjąć jakie wartości są 33 00:02:06,140 --> 00:02:09,320 gdzie strzałki wskazują, i tego typu rzeczy. 34 00:02:09,320 --> 00:02:13,720 >> Najpierw spójrzmy na drzewa Huffmana. 35 00:02:13,720 --> 00:02:19,600 Drzewa Huffman są binarne drzewa, co oznacza, że ​​każdy węzeł ma tylko 2 dzieci. 36 00:02:19,600 --> 00:02:24,870 W drzewach Huffman charakterystyczną jest to, że najczęściej wartości 37 00:02:24,870 --> 00:02:27,140 reprezentuje najmniejszą liczbą bitów. 38 00:02:27,140 --> 00:02:32,690 Widzieliśmy w przykładach wykładowych alfabetem Morse'a, jaki rodzaj skonsolidowanego niektóre litery. 39 00:02:32,690 --> 00:02:38,030 Jeśli starasz się przetłumaczyć A lub e, na przykład, 40 00:02:38,030 --> 00:02:43,940 pan tłumaczyć, że często, więc zamiast korzystać z pełnego zestawu bitów 41 00:02:43,940 --> 00:02:48,640 przyznanej dla tego zwykłego typu danych, skompresować go do mniej, 42 00:02:48,640 --> 00:02:53,730 a następnie te litery, które są reprezentowane rzadziej reprezentowane są przy dłuższych bitów 43 00:02:53,730 --> 00:02:59,840 bo można sobie na to pozwolić, gdy zważyć, że częstotliwości te litery pojawiają się. 44 00:02:59,840 --> 00:03:03,020 Mamy ten sam pomysł tu drzew Huffmana 45 00:03:03,020 --> 00:03:12,360 gdzie robimy łańcuch, rodzaj drogi, aby dostać się do niektórych znaków. 46 00:03:12,360 --> 00:03:14,470 A potem bohaterowie, którzy mają najwięcej częstotliwości 47 00:03:14,470 --> 00:03:17,940 będą stanowiły o najmniejszej ilości bitów. 48 00:03:17,940 --> 00:03:22,020 >> Sposób, że można skonstruować drzewo Huffmana 49 00:03:22,020 --> 00:03:27,430 jest umieszczanie wszystkich znaków, które pojawiają się w tekście 50 00:03:27,430 --> 00:03:30,630 i obliczania ich częstotliwość, jak często się pojawiają. 51 00:03:30,630 --> 00:03:33,880 Może to być zarówno liczba, ile razy te litery pojawiają 52 00:03:33,880 --> 00:03:40,270 czy może procent spośród wszystkich znaków, ile każdy z nich występuje. 53 00:03:40,270 --> 00:03:44,270 A więc to, co możesz zrobić, to gdy już wszystkie tego wyznaczoną, 54 00:03:44,270 --> 00:03:49,060 potem poszukaj 2 częstotliwości najniższych, a następnie połączyć je jako rodzeństwo 55 00:03:49,060 --> 00:03:55,660 gdzie następnie węzeł nadrzędny ma częstotliwość, która jest sumą swoich 2 dzieci. 56 00:03:55,660 --> 00:04:00,870 A potem umownie powiedzieć, że lewy węzeł, 57 00:04:00,870 --> 00:04:03,770 przestrzegać, że po 0 filię, 58 00:04:03,770 --> 00:04:08,140 i prawej stronie węzeł jest 1 oddział. 59 00:04:08,140 --> 00:04:16,040 Jak widzieliśmy w alfabetem Morse'a, jeden haczyk, że jeśli miał tylko dźwięk i sygnał dźwiękowy 60 00:04:16,040 --> 00:04:18,120 to było dwuznaczne. 61 00:04:18,120 --> 00:04:22,430 To może być albo 1 litera lub może to być sekwencja 2 liter. 62 00:04:22,430 --> 00:04:27,790 A więc to, co robi, to drzewa Huffman, ponieważ z natury z bohaterów 63 00:04:27,790 --> 00:04:34,140 albo nasze końcowe rzeczywiste znaki jako ostatni węzeł w branży - 64 00:04:34,140 --> 00:04:39,300 tym, że odnosi się liści - ze względu, że nie może być niejasności 65 00:04:39,300 --> 00:04:45,160 zgodnie z którą pismo próbujesz kodowania z serii bitów 66 00:04:45,160 --> 00:04:50,670 bo nigdzie wzdłuż bitów reprezentujących 1 list 67 00:04:50,670 --> 00:04:55,960 natkniesz się cały list, i nie będzie żadnego zamieszania tam. 68 00:04:55,960 --> 00:04:58,430 Ale pójdziemy do przykładów, że chłopaki mogą zobaczyć, że faktycznie 69 00:04:58,430 --> 00:05:02,120 zamiast nam po prostu mówię, że to prawda. 70 00:05:02,120 --> 00:05:06,390 >> Spójrzmy na prosty przykład drzewa Huffmana. 71 00:05:06,390 --> 00:05:09,380 Mam ciąg znaków, który jest tu 12 znaków. 72 00:05:09,380 --> 00:05:14,010 Mam 4 As, 6 i 2 BS, CS. 73 00:05:14,010 --> 00:05:17,270 Moim pierwszym krokiem byłoby liczyć. 74 00:05:17,270 --> 00:05:20,760 Ile razy pojawia się? Wydaje się 4 razy w ciągu. 75 00:05:20,760 --> 00:05:25,060 B pojawia się 6 razy, a pojawia się 2 razy C. 76 00:05:25,060 --> 00:05:28,970 Oczywiście, mam zamiar powiedzieć, używam B najczęściej 77 00:05:28,970 --> 00:05:35,970 więc chcę reprezentować B z najmniejszą liczbę bitów, najmniejszą liczbę 0s i 1s. 78 00:05:35,970 --> 00:05:42,600 I wtedy ja również będzie oczekiwać C wymagać Najwiecej 0s i 1s, jak również. 79 00:05:42,600 --> 00:05:48,550 Pierwsze co zrobiłem, jest tutaj I umieścił je w kolejności rosnącej pod względem częstotliwości. 80 00:05:48,550 --> 00:05:52,710 Widzimy, że C i A, to nasze 2 najniższych częstotliwościach. 81 00:05:52,710 --> 00:06:00,290 Tworzymy węzeł nadrzędny, a węzeł nadrzędny nie posiada litera skojarzona z nią 82 00:06:00,290 --> 00:06:05,070 ale ma częstotliwość, która jest sumą. 83 00:06:05,070 --> 00:06:08,780 Suma się 2 + 4, które to 6. 84 00:06:08,780 --> 00:06:10,800 Następnie kierujemy się w lewo gałąź. 85 00:06:10,800 --> 00:06:14,970 Gdybyśmy byli w tym 6 węzłów, wówczas kierujemy 0 dostać się do C 86 00:06:14,970 --> 00:06:17,450 a następnie 1, aby uzyskać do A. 87 00:06:17,450 --> 00:06:20,300 Więc teraz mamy 2 węzły. 88 00:06:20,300 --> 00:06:23,920 Mamy wartość 6, a potem mamy też inny węzeł z wartością 6. 89 00:06:23,920 --> 00:06:28,550 I tak te 2 nie tylko 2, ale także tylko najniższy 2, które są w lewo, 90 00:06:28,550 --> 00:06:33,820 więc dołączyć do tych, przez innego rodzica, z sumą jest 12. 91 00:06:33,820 --> 00:06:36,300 Więc tutaj mamy drzewa Huffmana 92 00:06:36,300 --> 00:06:40,020 gdzie się do B, że będzie tylko 1 bit 93 00:06:40,020 --> 00:06:45,430 , a następnie dostać się do mielibyśmy 01, a następnie o 00 C. 94 00:06:45,430 --> 00:06:51,300 Więc widzimy, że w zasadzie jesteśmy reprezentujących te znaki z 1 lub 2 bity 95 00:06:51,300 --> 00:06:55,160 gdzie B, zgodnie z przewidywaniami, ma najmniej. 96 00:06:55,160 --> 00:07:01,730 A potem się spodziewaliśmy C mają większość, ale ponieważ jest to takie małe drzewo Huffman 97 00:07:01,730 --> 00:07:06,020 to jest reprezentowane przez 2 bity, w przeciwieństwie do gdzieś w środku. 98 00:07:07,820 --> 00:07:11,070 >> Wystarczy iść na inny prosty przykład drzewa Huffmana, 99 00:07:11,070 --> 00:07:19,570 Powiedzmy, że masz ciąg znaków "Hello". 100 00:07:19,570 --> 00:07:25,360 Co zrobić, jest najpierw powiesz, ile razy ma H występują w tym? 101 00:07:25,360 --> 00:07:34,200 H pojawia się raz, a potem pojawia się e raz, a potem mamy l pojawiający dwukrotnie 102 00:07:34,200 --> 00:07:36,580 oraz o pojawiające się raz. 103 00:07:36,580 --> 00:07:44,310 I tak to się spodziewać, jaka litera jest reprezentowana przez najmniejszą liczbą bitów? 104 00:07:44,310 --> 00:07:47,450 [Uczeń] l. L. >> Tak. l ma rację. 105 00:07:47,450 --> 00:07:50,730 Oczekujemy l być reprezentowana przez najmniejszą liczbę bitów 106 00:07:50,730 --> 00:07:55,890 bo l jest używany najczęściej w ciąg "Hello". 107 00:07:55,890 --> 00:08:04,280 Co mam teraz zrobić, to wyciągnąć te węzły. 108 00:08:04,280 --> 00:08:15,580 Mam 1, który jest H, a następnie kolejną 1, która jest e, a następnie na 1, czyli o - 109 00:08:15,580 --> 00:08:23,410 teraz jestem, umieszczając je w kolejności - a następnie 2, która jest l. 110 00:08:23,410 --> 00:08:32,799 Potem mówią, że sposób zbudować drzewo Huffmana jest znalezienie 2 węzły z najmniejszych częstotliwościach 111 00:08:32,799 --> 00:08:38,010 i uczynić je rodzeństwo, tworząc węzeł nadrzędny. 112 00:08:38,010 --> 00:08:41,850 Tutaj mamy 3 węzły z najniższej częstotliwości. Oni wszyscy 1. 113 00:08:41,850 --> 00:08:50,620 Więc tutaj wybrać, który mamy zamiar połączyć pierwszy. 114 00:08:50,620 --> 00:08:54,850 Powiedzmy, że mogę wybrać H i E. 115 00:08:54,850 --> 00:09:01,150 Suma 1 + 1 jest 2, a węzeł nie ma litera skojarzona z nią. 116 00:09:01,150 --> 00:09:04,440 To po prostu przechowuje wartość. 117 00:09:04,440 --> 00:09:10,950 Teraz patrzymy na najbliższe 2 częstotliwości najniższych. 118 00:09:10,950 --> 00:09:15,590 To jest 2 i 1. To może być jeden z tych 2, ale mam zamiar wybrać ten jeden. 119 00:09:15,590 --> 00:09:18,800 Suma jest 3. 120 00:09:18,800 --> 00:09:26,410 I w końcu, mam tylko 2 w lewo, więc wtedy, że staje się 5. 121 00:09:26,410 --> 00:09:32,010 To tutaj, zgodnie z oczekiwaniami, jeśli wypełnienie kodowanie, że 122 00:09:32,010 --> 00:09:37,480 1s zawsze rację oddział i 0s są lewe. 123 00:09:37,480 --> 00:09:45,880 Następnie mamy l reprezentowany przez tylko 1 bit, a następnie przez 2 Ö 124 00:09:45,880 --> 00:09:52,360 e, a następnie przez 2, a następnie spada z H 3 bitów. 125 00:09:52,360 --> 00:09:59,750 Więc można przekazać ten komunikat "Hello" zamiast rzeczywiście pomocą znaków 126 00:09:59,750 --> 00:10:02,760 po prostu 0s i 1s. 127 00:10:02,760 --> 00:10:07,910 Należy jednak pamiętać, że w kilku przypadkach mieliśmy więzi z naszym częstotliwości. 128 00:10:07,910 --> 00:10:11,900 Mogliśmy albo przyłączył się do H i O 1-sza może. 129 00:10:11,900 --> 00:10:15,730 Lub później, kiedy mieliśmy l reprezentowany przez 2 130 00:10:15,730 --> 00:10:19,410 oraz połączone było reprezentowane przez 2, że nie związany jeden. 131 00:10:19,410 --> 00:10:23,630 >> I tak podczas wysyłania 0s i 1s, że faktycznie nie gwarantuje 132 00:10:23,630 --> 00:10:27,090 że odbiorca może w pełni odczytać wiadomość tuż nietoperza 133 00:10:27,090 --> 00:10:30,490 bo nie może wiedzieć, co decyzja, którą tworzył. 134 00:10:30,490 --> 00:10:34,920 Tak więc, gdy mamy do czynienia z kompresją Huffmana, 135 00:10:34,920 --> 00:10:40,090 jakoś musimy powiedzieć odbiorcy naszej wiadomości, jak zdecydowaliśmy - 136 00:10:40,090 --> 00:10:43,470 Muszą wiedzieć, jakiś dodatkowych informacji 137 00:10:43,470 --> 00:10:46,580 Ponadto do wiadomości sprężonego. 138 00:10:46,580 --> 00:10:51,490 Muszą zrozumieć, co faktycznie wygląda drzewo, 139 00:10:51,490 --> 00:10:55,450 jak rzeczywiście te decyzje. 140 00:10:55,450 --> 00:10:59,100 >> Tu właśnie robi przykłady oparte na rzeczywistej liczby, 141 00:10:59,100 --> 00:11:01,550 ale czasem można również drzewa Huffmana 142 00:11:01,550 --> 00:11:05,760 na podstawie częstotliwości, przy której pojawiają się litery, i jest dokładnie taki sam sposób. 143 00:11:05,760 --> 00:11:09,090 Tutaj jestem wyrażając ją w kategoriach procentów lub części, 144 00:11:09,090 --> 00:11:11,290 a więc dokładnie to samo. 145 00:11:11,290 --> 00:11:15,300 Uważam, 2 mniejsze, sumują je, obok 2 mniejsze, sumują je, 146 00:11:15,300 --> 00:11:19,390 dopóki nie ma pełnego drzewa. 147 00:11:19,390 --> 00:11:23,610 Nawet jeśli możemy to zrobić tak czy inaczej, kiedy mamy do czynienia z procentów, 148 00:11:23,610 --> 00:11:27,760 co oznacza, że ​​mamy podział rzeczy i do czynienia z po przecinku, a raczej płynie 149 00:11:27,760 --> 00:11:30,900 jeśli myślimy o strukturach danych o głowę. 150 00:11:30,900 --> 00:11:32,540 Co wiemy o pływaków? 151 00:11:32,540 --> 00:11:35,180 Co znajduje się typowy problem, gdy mamy do czynienia z pływaków? 152 00:11:35,180 --> 00:11:38,600 [Uczeń] Nieprecyzyjne arytmetyki. >> Tak. Nieścisłości. 153 00:11:38,600 --> 00:11:43,760 Z powodu zmiennej precyzji punktów, w tym zbior abyśmy upewnić 154 00:11:43,760 --> 00:11:49,450 że nie stracisz żadnych wartości, to mamy rzeczywiście będzie mieć do czynienia z hrabią. 155 00:11:49,450 --> 00:11:54,880 Więc jeśli były, aby myśleć o węźle Huffman, jeśli spojrzeć na strukturę tutaj 156 00:11:54,880 --> 00:12:01,740 jeśli spojrzeć na zielone to ma częstotliwość z nim związane 157 00:12:01,740 --> 00:12:08,760 a także wskazuje na jej lewej stronie węzła oraz węzeł do prawej. 158 00:12:08,760 --> 00:12:13,970 , A następnie z nich jest czerwony znak również związane z nimi. 159 00:12:13,970 --> 00:12:18,900 Nie idziemy do tych, osobne dla rodziców, a następnie węzłów końcowych, 160 00:12:18,900 --> 00:12:23,680 które nazywamy liśćmi, ale raczej tych, będą po prostu wartości NULL. 161 00:12:23,680 --> 00:12:31,050 Dla każdego węzła musimy znak, symbol, że węzeł reprezentuje, 162 00:12:31,050 --> 00:12:40,490 Następnie częstotliwość oraz wskaźnik do dziecka z lewej, jak również jego dziecko prawej. 163 00:12:40,490 --> 00:12:45,680 Liście, które są na samym dole, miałby także węzłów wskaźniki 164 00:12:45,680 --> 00:12:49,550 po ich lewej stronie i ich prawa, ale ponieważ wartości te nie są skierowane do faktycznych węzłów, 165 00:12:49,550 --> 00:12:53,970 co by ich wartość będzie? >> [Uczeń] NULL. NULL. >> Dokładnie. 166 00:12:53,970 --> 00:12:58,430 Oto przykład, jak można reprezentować częstotliwość w pływaków, 167 00:12:58,430 --> 00:13:02,130 ale będziemy mieć do czynienia z tym z liczb całkowitych, 168 00:13:02,130 --> 00:13:06,780 więc wszystko zrobiłem to zmienić typ danych tam. 169 00:13:06,780 --> 00:13:09,700 >> Chodźmy na nieco trochę bardziej złożonego przykładu. 170 00:13:09,700 --> 00:13:13,360 Ale teraz, że zrobiliśmy te proste, to tylko sam proces. 171 00:13:13,360 --> 00:13:20,290 Znajdziesz 2 najniższych częstotliwości, Podsumowując częstotliwości 172 00:13:20,290 --> 00:13:22,450 i to jest nowa częstotliwość węzła nadrzędnego, 173 00:13:22,450 --> 00:13:29,310 które następnie wskazuje na jego lewej stronie z 0 oddział i prawa z 1 oddział. 174 00:13:29,310 --> 00:13:34,200 Jeśli mamy ciąg "To jest CS50", a następnie możemy liczyć, ile razy jest T wspomniano, 175 00:13:34,200 --> 00:13:38,420 h wspomniano, I, S, C, 5, 0. 176 00:13:38,420 --> 00:13:42,010 Więc co ja tutaj jest z czerwonych węzłów po prostu obsadzone, 177 00:13:42,010 --> 00:13:48,530 Powiedziałem, że będę miała te znaki w końcu na dole mojego drzewa. 178 00:13:48,530 --> 00:13:51,740 Te będą wszystkie liści. 179 00:13:51,740 --> 00:13:58,200 Wtedy to, co zrobiłem to ja sortując je według częstotliwości w porządku rosnącym, 180 00:13:58,200 --> 00:14:02,950 i to jest rzeczywiście sposób, że kod pset robi 181 00:14:02,950 --> 00:14:07,550 Czy to sortuje go przez częstotliwość, a następnie alfabetycznie. 182 00:14:07,550 --> 00:14:13,870 Tak więc ma numery a potem alfabetycznie częstotliwości. 183 00:14:13,870 --> 00:14:18,520 Wtedy to, co chciałbym zrobić, to znajdę 2 najniższy. To 0 i 5. 184 00:14:18,520 --> 00:14:22,390 Chciałbym podsumować je, i to 2. Następnie chciałbym kontynuować, znajdź następne 2 najniższy. 185 00:14:22,390 --> 00:14:26,100 Są dwa 1s, a następnie te się 2, a także. 186 00:14:26,100 --> 00:14:31,570 Teraz wiem, że moim następnym krokiem ma być połączenie najniższą liczbę, 187 00:14:31,570 --> 00:14:41,380 T, który jest, 1, a następnie wybiera jeden z węzłów ma 2 jako częstotliwości. 188 00:14:41,380 --> 00:14:44,560 Więc tutaj mamy 3 opcje. 189 00:14:44,560 --> 00:14:47,980 Co mam zamiar zrobić dla slajdu jest tylko wizualnie zmienić je dla Ciebie 190 00:14:47,980 --> 00:14:51,790 tak aby można było zobaczyć, jak buduję go. 191 00:14:51,790 --> 00:14:59,040 Jaki kod i kod dystrybucja zrobi będzie dołączyć jeden T 192 00:14:59,040 --> 00:15:01,410 z 0 do 5 węzła. 193 00:15:01,410 --> 00:15:05,060 Tak więc, że środki na 3, a potem kontynuować proces. 194 00:15:05,060 --> 00:15:08,660 2 i 2 teraz są najniższe, więc wtedy te kwoty do 4. 195 00:15:08,660 --> 00:15:12,560 Wszyscy po tej pory? Okay. 196 00:15:12,560 --> 00:15:16,410 Następnie, po, że mamy 3 i 3, które muszą być sumowane, 197 00:15:16,410 --> 00:15:21,650 więc znowu ja tylko przełączając go tak aby można zobaczyć wizualnie tak, że nie będzie zbyt brudny. 198 00:15:21,650 --> 00:15:25,740 Następnie mamy 6, a następnie nasz ostatni krok jest teraz, że mamy tylko 2 węzły 199 00:15:25,740 --> 00:15:30,440 podsumować te do korzenia naszego drzewa, które jest 10. 200 00:15:30,440 --> 00:15:34,100 A liczba 10 ma sens, ponieważ każdy węzeł reprezentowany, 201 00:15:34,100 --> 00:15:40,750 ich wartości, ich liczbę częstotliwości, było, ile razy pojawił się w ciągu, 202 00:15:40,750 --> 00:15:46,350 a następnie mamy 5 znaków w naszym łańcuchu, więc to ma sens. 203 00:15:48,060 --> 00:15:52,320 Jeśli przyjrzymy się w jaki sposób możemy właściwie zakodować, 204 00:15:52,320 --> 00:15:56,580 zgodnie z oczekiwaniami, I i S, które najczęściej się 205 00:15:56,580 --> 00:16:01,350 reprezentuje najmniejszą liczbą bitów. 206 00:16:03,660 --> 00:16:05,660 >> Bądź ostrożny. 207 00:16:05,660 --> 00:16:09,780 W drzewach Huffman sprawa rzeczywiście ważne. 208 00:16:09,780 --> 00:16:13,670 Wielka litera S jest inny niż małą s. 209 00:16:13,670 --> 00:16:21,260 Jeśli mieliśmy "To CS50" dużymi literami, a następnie s małe tylko wystąpiły dwukrotnie 210 00:16:21,260 --> 00:16:27,120 będzie węzeł z 2 jako wartość, a następnie wielkie S będzie tylko raz. 211 00:16:27,120 --> 00:16:33,440 Więc drzewo zmieni struktur bo rzeczywiście mają dodatkowy liść tutaj. 212 00:16:33,440 --> 00:16:36,900 Ale suma nadal będzie 10. 213 00:16:36,900 --> 00:16:39,570 To, co mamy w rzeczywistości będzie wywołanie kontrolną, 214 00:16:39,570 --> 00:16:44,060 dodanie wszystkich przypadkach. 215 00:16:46,010 --> 00:16:50,990 >> Teraz, gdy już objęte drzewa Huffmana, możemy zanurzyć się Puff Huff'n, zbior. 216 00:16:50,990 --> 00:16:52,900 Zamierzamy zacząć od części pytania, 217 00:16:52,900 --> 00:16:57,990 i to będzie Ci przyzwyczajeni binarnych drzew i jak działają wokół, że: 218 00:16:57,990 --> 00:17:03,230 węzły rysunkowe, tworząc własne typedef struct dla węzła, 219 00:17:03,230 --> 00:17:07,230 i zobaczyć, jak można wstawić do drzewa binarnego, jeden, który jest sortowane, 220 00:17:07,230 --> 00:17:09,050 przemierzając go, a takie rzeczy. 221 00:17:09,050 --> 00:17:14,560 Ta wiedza jest na pewno ci pomoże, gdy wkraczają w części Huff'n Puff 222 00:17:14,560 --> 00:17:17,089 z PSET. 223 00:17:19,150 --> 00:17:26,329 W standardowej edycji PSET, twoim zadaniem jest wdrożenie Puff, 224 00:17:26,329 --> 00:17:30,240 oraz w wersji hacker twoim zadaniem jest wdrożenie Huff. 225 00:17:30,240 --> 00:17:38,490 Co Huff robi jest potrzebny tekst, a potem przekłada go na 0s i 1s, 226 00:17:38,490 --> 00:17:41,990 więc proces, który zrobiliśmy powyżej, gdzie liczyliśmy częstotliwości 227 00:17:41,990 --> 00:17:50,970 a następnie wykonany z drzewa, a następnie powiedział: "Jak dostać T?" 228 00:17:50,970 --> 00:17:54,840 T jest reprezentowany przez 100, takie rzeczy, 229 00:17:54,840 --> 00:17:58,860 a następnie Huff weźmie tekst, a następnie wyjściowy binarny. 230 00:17:58,860 --> 00:18:04,920 Ale także dlatego, że wiemy, że chcemy umożliwić naszym odbiorcę wiadomości 231 00:18:04,920 --> 00:18:11,790 odtworzyć dokładnie to samo drzewo, ale także zawiera informacje na temat liczby częstotliwości. 232 00:18:11,790 --> 00:18:17,980 Następnie z Puff dostajemy plik binarny z 0s i 1s 233 00:18:17,980 --> 00:18:21,740 również biorąc pod uwagę i informacji o częstotliwości. 234 00:18:21,740 --> 00:18:26,740 Tłumaczymy wszystkie te plecy 0s i 1s do oryginalnej wiadomości, że był, 235 00:18:26,740 --> 00:18:29,350 więc jesteśmy dekompresji to. 236 00:18:29,350 --> 00:18:36,450 Jeśli robisz standardową edycję, nie musi wdrażać Huff, 237 00:18:36,450 --> 00:18:39,290 tak to możesz tylko korzystać z implementacji kadrowej Huffa. 238 00:18:39,290 --> 00:18:42,080 Istnieją instrukcje w specyfikacji, w jaki sposób to zrobić. 239 00:18:42,080 --> 00:18:48,780 Można uruchomić realizację kadrowej Huff o pewnych pliku tekstowego 240 00:18:48,780 --> 00:18:53,270 a następnie użyć tego wyjścia jako wkładu Puff. 241 00:18:53,270 --> 00:18:59,330 >> Jak już wspomniałem wcześniej, mamy dużo kodu dystrybucji dla tej jednej. 242 00:18:59,330 --> 00:19:01,810 Zamierzam uruchomić przez niego przechodzi. 243 00:19:01,810 --> 00:19:04,400 Mam zamiar spędzić większość czasu na pliki. H 244 00:19:04,400 --> 00:19:07,660 ponieważ w plików. c, ponieważ mamy. H 245 00:19:07,660 --> 00:19:11,650 i to daje nam prototypów funkcji, 246 00:19:11,650 --> 00:19:15,520 nie w pełni muszą zrozumieć dokładnie - 247 00:19:15,520 --> 00:19:20,280 Jeśli nie rozumieją, co się dzieje w plików. C, to nie martw się zbyt wiele, 248 00:19:20,280 --> 00:19:23,600 ale na pewno spróbować spojrzeć, ponieważ może to dać pewne wskazówki 249 00:19:23,600 --> 00:19:29,220 i jest to przydatne, aby przyzwyczaić się do czytania kodu innych ludzi. 250 00:19:38,940 --> 00:19:48,270 >> Patrząc na huffile.h, w komentarzach deklaruje warstwę abstrakcji dla plików zakodowanych Huffman. 251 00:19:48,270 --> 00:20:01,660 Jeśli idziemy w dół, widzimy, że jest maksymalnie 256 znaków, które możemy potrzebować kody. 252 00:20:01,660 --> 00:20:05,480 Obejmuje to wszystkie litery alfabetu - wielkich i małych - 253 00:20:05,480 --> 00:20:08,250 a następnie symbole i numery, itp. 254 00:20:08,250 --> 00:20:11,930 Następnie mamy tu magicznej liczby identyfikujące Huffman kodowalne plik. 255 00:20:11,930 --> 00:20:15,890 W ramach kodu Huffmana, że ​​będziemy mieć pewne magiczne 256 00:20:15,890 --> 00:20:18,560 związane z nagłówka. 257 00:20:18,560 --> 00:20:21,110 Może to wyglądać jak zwykłe liczby losowej magii, 258 00:20:21,110 --> 00:20:27,160 jeśli jednak to przetłumaczyć na ASCII, to faktycznie literuje Huffa. 259 00:20:27,160 --> 00:20:34,290 Tutaj mamy struct dla pliku Huffman zakodowany. 260 00:20:34,290 --> 00:20:39,670 Nie wszystkie z tych cech związanych z plikiem Huff. 261 00:20:39,670 --> 00:20:47,080 Potem tu mamy nagłówek pliku Huff, więc nazywamy to Huffeader 262 00:20:47,080 --> 00:20:50,810 zamiast dodawania dodatkowej godziny, ponieważ dźwięki tak samo. 263 00:20:50,810 --> 00:20:52,720 Cute. 264 00:20:52,720 --> 00:20:57,790 Mamy magiczną liczbę z nim związane. 265 00:20:57,790 --> 00:21:09,040 Jeśli jest to właściwy plik Huff, to będzie numer górze, ta magia jeden. 266 00:21:09,040 --> 00:21:14,720 A potem będzie miał tablicę. 267 00:21:14,720 --> 00:21:18,750 Tak więc dla każdego symbolu, które są 256 268 00:21:18,750 --> 00:21:24,760 to będzie lista, co częstotliwość tych symboli są w pliku Huff. 269 00:21:24,760 --> 00:21:28,090 I w końcu, mamy sumy kontrolnej częstotliwości, 270 00:21:28,090 --> 00:21:32,160 które powinny być suma tych częstotliwości. 271 00:21:32,160 --> 00:21:36,520 Więc to Huffeader jest. 272 00:21:36,520 --> 00:21:44,600 Następnie mamy do niektórych funkcji, które zwracają następny bit w pliku Huff 273 00:21:44,600 --> 00:21:52,580 oraz zapisuje w pliku bitu Huff, a następnie funkcja tu hfclose, 274 00:21:52,580 --> 00:21:54,650 faktycznie zamyka Huff. 275 00:21:54,650 --> 00:21:57,290 Wcześniej, mamy do czynienia z prostą tylko fclose, 276 00:21:57,290 --> 00:22:01,190 ale gdy masz plik Huff zamiast fclosing go 277 00:22:01,190 --> 00:22:06,080 co się naprawdę dzieje zrobić to hfclose i hfopen go. 278 00:22:06,080 --> 00:22:13,220 To są konkretne zadania do plików Huff, że idziemy do czynienia. 279 00:22:13,220 --> 00:22:19,230 To tutaj czytamy w nagłówku, a następnie napisać nagłówek. 280 00:22:19,230 --> 00:22:25,700 >> Tuż po przeczytaniu pliku. H możemy trochę zorientować się, co plik Huff może być, 281 00:22:25,700 --> 00:22:32,480 jakie cechy posiada, bez konieczności wchodzenia w huffile.c, 282 00:22:32,480 --> 00:22:36,750 które, jeśli będziemy nurkować w, będzie nieco bardziej złożona. 283 00:22:36,750 --> 00:22:41,270 Posiada on wszystkie pliku I / O tutaj do czynienia ze wskaźnikami. 284 00:22:41,270 --> 00:22:48,010 Tutaj widzimy, że gdy nazywamy hfread, na przykład, to jeszcze do czynienia z fread. 285 00:22:48,010 --> 00:22:53,050 Nie mamy pozbyć tych funkcji do końca, ale wysyłamy które będą pod opieką 286 00:22:53,050 --> 00:22:59,760 wewnątrz pliku Huff zamiast robić wszystko sami. 287 00:22:59,760 --> 00:23:02,300 Możesz tutaj skanować przez to, jeśli jesteś ciekawy 288 00:23:02,300 --> 00:23:08,410 i iść i skórką warstwy tylnej bitowym mało. 289 00:23:20,650 --> 00:23:24,060 >> Następny plik, że będziemy patrzeć na to tree.h. 290 00:23:24,060 --> 00:23:30,210 Przed w Walkthrough slajdy powiedzieliśmy oczekujemy Huffman węzeł 291 00:23:30,210 --> 00:23:32,960 i zrobiliśmy typedef struct węzeł. 292 00:23:32,960 --> 00:23:38,360 Spodziewamy się, że ma symbol, częstotliwość, a następnie 2 węzłów gwiazdy. 293 00:23:38,360 --> 00:23:41,870 W tym przypadku to, co robimy, jest to w zasadzie takie same 294 00:23:41,870 --> 00:23:46,880 wyjątkiem zamiast węzła będziemy nazywać ich drzew. 295 00:23:48,790 --> 00:23:56,760 Mamy funkcję, która podczas rozmowy, aby drzewo to powrót wskaźnika drzewa. 296 00:23:56,760 --> 00:24:03,450 Powrót do Speller, kiedy robili nowy węzeł 297 00:24:03,450 --> 00:24:11,410 mówiłeś node * new word = malloc (sizeof) i takie rzeczy. 298 00:24:11,410 --> 00:24:17,510 Zasadniczo mktree będzie się zajmować, że dla Ciebie. 299 00:24:17,510 --> 00:24:20,990 Podobnie, gdy chcesz usunąć drzewo, 300 00:24:20,990 --> 00:24:24,810 więc to zasadniczo uwalniając drzewo kiedy skończysz z nim, 301 00:24:24,810 --> 00:24:33,790 zamiast jawne wywołanie bezpłatny, że jesteś rzeczywiście tylko będzie użyć funkcji rmtree 302 00:24:33,790 --> 00:24:40,360 gdzie przechodzą w wskaźnik do tego drzewa, a następnie tree.c zajmie to za Ciebie. 303 00:24:40,360 --> 00:24:42,490 >> Patrzymy w tree.c. 304 00:24:42,490 --> 00:24:47,240 Oczekujemy te same funkcje z wyjątkiem patrz realizacji, jak również. 305 00:24:47,240 --> 00:24:57,720 Zgodnie z naszymi oczekiwaniami, gdy dzwonisz mktree to mallocs wielkość drzewa do wskaźnika, 306 00:24:57,720 --> 00:25:03,190 inicjalizuje wszystkie wartości na NULL, więc 0s lub wartości null, 307 00:25:03,190 --> 00:25:08,280 i zwraca wskaźnik do tego drzewa, które właśnie malloc'd do Ciebie. 308 00:25:08,280 --> 00:25:13,340 Oto kiedy zadzwonić usunąć drzewo najpierw upewnia się, że nie jesteś podwójnie uwolnienie. 309 00:25:13,340 --> 00:25:18,320 To daje pewność, że faktycznie masz drzewo, które chcesz usunąć. 310 00:25:18,320 --> 00:25:23,330 Tu, ponieważ drzewo obejmuje również jego dzieci, 311 00:25:23,330 --> 00:25:29,560 co to robi to rekursywnie wywołuje usunąć drzewo na lewym węźle drzewa 312 00:25:29,560 --> 00:25:31,650 oraz prawego węzła. 313 00:25:31,650 --> 00:25:37,790 Przed uwalnia rodzica, musi uwolnić dzieci, jak również. 314 00:25:37,790 --> 00:25:42,770 Dominująca jest też zamiennie z korzenia. 315 00:25:42,770 --> 00:25:46,500 Pierwszy w historii rodzic, więc jak pra-pra-pra-pra-dziadek 316 00:25:46,500 --> 00:25:52,130 lub drzewa babcia, najpierw musimy uwolnić dół poziom pierwszy. 317 00:25:52,130 --> 00:25:58,490 Więc przechodzić do dna, wolne osoby, a następnie wrócić do góry, uwolnić tych, itd. 318 00:26:00,400 --> 00:26:02,210 Więc to drzewo. 319 00:26:02,210 --> 00:26:04,240 >> Teraz patrzymy na las. 320 00:26:04,240 --> 00:26:09,860 Las jest gdzie umieścić wszystkie drzewa Huffmana. 321 00:26:09,860 --> 00:26:12,910 Jest powiedzenie, że będziemy mieć coś, co nazywa działki 322 00:26:12,910 --> 00:26:22,320 które zawiera wskaźnik do drzewa oraz wskaźnik do powierzchni zwanej dalej. 323 00:26:22,320 --> 00:26:28,480 Co robi struktura tego rodzaju wygląda? 324 00:26:29,870 --> 00:26:32,490 To niby mówi to tam. 325 00:26:34,640 --> 00:26:36,700 Prawo tutaj. 326 00:26:37,340 --> 00:26:39,170 Połączonej listy. 327 00:26:39,170 --> 00:26:44,590 Widzimy, że gdy mamy działkę to jak połączonej listy działek. 328 00:26:44,590 --> 00:26:53,020 Las zdefiniowane jako połączonego listy działek 329 00:26:53,020 --> 00:26:58,100 i tak struktura lasu jest my po prostu będziemy mieć wskaźnik do naszej pierwszej działce 330 00:26:58,100 --> 00:27:02,740 i że działka ma drzewo w jego obrębie, a raczej wskazuje na drzewie 331 00:27:02,740 --> 00:27:06,190 i wskazuje następną działki, itd. itd.. 332 00:27:06,190 --> 00:27:11,100 Aby do lasu nazywamy mkforest. 333 00:27:11,100 --> 00:27:14,930 Następnie mamy kilka bardzo przydatnych funkcji, tutaj. 334 00:27:14,930 --> 00:27:23,240 Musimy wybrać, gdzie przechodzą w lesie, a następnie zwracana jest wartość * Drzewo, 335 00:27:23,240 --> 00:27:25,210 wskaźnik do drzewa. 336 00:27:25,210 --> 00:27:29,370 Jakie pick będzie zrobić to to pójdzie do lasu, że jesteś wskazując 337 00:27:29,370 --> 00:27:35,240 następnie usunąć drzewo o najniższej częstotliwości z tego lasu 338 00:27:35,240 --> 00:27:38,330 a następnie daje wskaźnik do tego drzewa. 339 00:27:38,330 --> 00:27:43,030 Kiedy zadzwonić pick, drzewo nie będzie istnieć w lesie już, 340 00:27:43,030 --> 00:27:48,550 ale zwracana wartość jest wskaźnikiem do tego drzewa. 341 00:27:48,550 --> 00:27:50,730 Następnie trzeba roślinę. 342 00:27:50,730 --> 00:27:57,420 Pod warunkiem, że jest przekazywana w postaci wskaźnika do drzewa, które ma non-0 częstotliwości, 343 00:27:57,420 --> 00:28:04,040 co roślina będzie zrobić to potrwa do lasu, trochę drzew i roślin, że w środku drzewo z lasu. 344 00:28:04,040 --> 00:28:06,370 Tutaj mamy rmforest. 345 00:28:06,370 --> 00:28:11,480 Podobne do usunięcia drzewa, które w zasadzie uwolnił wszystkich naszych drzew, dla nas, 346 00:28:11,480 --> 00:28:16,600 usunąć las uwolni co jest zawarte w tym lesie. 347 00:28:16,600 --> 00:28:24,890 >> Jeśli spojrzymy na forest.c będziemy oczekiwać co najmniej 1 rmtree polecenia tam, 348 00:28:24,890 --> 00:28:30,090 bo do wolnej pamięci w lesie, jeśli las ma drzew w nim, 349 00:28:30,090 --> 00:28:32,930 następnie w końcu będziesz musiał usunąć te drzewa też. 350 00:28:32,930 --> 00:28:41,020 Jeśli spojrzymy na forest.c, mamy mkforest, który jest, jak oczekujemy. 351 00:28:41,020 --> 00:28:42,890 Mamy malloc rzeczy. 352 00:28:42,890 --> 00:28:51,740 Inicjujemy pierwszą działkę w lesie za nieważną, ponieważ jest pusta, aby rozpocząć, 353 00:28:51,740 --> 00:29:05,940 wtedy widzimy kostkę, która zwraca drzewo o najniższej masie, najniższej częstotliwości, 354 00:29:05,940 --> 00:29:13,560 a potem pozbywa się tego konkretnego węzła, który wskazuje na to drzewo, a następny, 355 00:29:13,560 --> 00:29:16,760 tak, że trwa, że ​​z połączonej listy lasu. 356 00:29:16,760 --> 00:29:24,510 A potem mamy tutaj rośliny, która wstawia się drzewo do połączonej listy. 357 00:29:24,510 --> 00:29:29,960 Co to jest las nie ładnie utrzymuje go posortowane dla nas. 358 00:29:29,960 --> 00:29:37,910 I w końcu, mamy rmforest i, zgodnie z oczekiwaniami, mamy rmtree nazywany tam. 359 00:29:46,650 --> 00:29:55,440 >> Patrząc na kod dystrybucji dotąd huffile.c było prawdopodobnie zdecydowanie najtrudniejszy do zrozumienia, 360 00:29:55,440 --> 00:29:59,990 natomiast inne pliki same były dość proste do naśladowania. 361 00:29:59,990 --> 00:30:03,090 Dzięki naszej wiedzy i listy wskaźników powiązanych oraz takich, 362 00:30:03,090 --> 00:30:04,860 byliśmy w stanie śledzić całkiem dobrze. 363 00:30:04,860 --> 00:30:10,500 Ale wszystko, czego potrzebujesz, aby naprawdę mieć pewność, że w pełni zrozumieć, jest pliki. H 364 00:30:10,500 --> 00:30:15,840 bo trzeba być wywołaniem tych funkcji, do czynienia z tych wartości powrotnych, 365 00:30:15,840 --> 00:30:20,590 więc upewnij się, że w pełni zrozumieć, jakie działanie ma być wykonywane 366 00:30:20,590 --> 00:30:24,290 kiedy tylko zadzwonić pod jeden z tych funkcji. 367 00:30:24,290 --> 00:30:33,020 Ale w rzeczywistości zrozumienie jej wnętrzu nie jest bardzo potrzebne, bo mamy te pliki. H. 368 00:30:35,170 --> 00:30:39,490 Mamy 2 więcej plików pozostawionych w naszym kodzie dystrybucji. 369 00:30:39,490 --> 00:30:41,640 >> Spójrzmy na wysypisko. 370 00:30:41,640 --> 00:30:47,230 Dump przez jego komentarz tutaj zajmuje Huffman-skompresowany plik 371 00:30:47,230 --> 00:30:55,580 a następnie przekłada i zrzuca wszystkie jego zawartości na zewnątrz. 372 00:31:01,010 --> 00:31:04,260 Tutaj widzimy, że to dzwoni hfopen. 373 00:31:04,260 --> 00:31:10,770 Jest to rodzaj dublowanie się plik wejściowy * = fopen, 374 00:31:10,770 --> 00:31:13,500 a następnie przesuń w informacji. 375 00:31:13,500 --> 00:31:18,240 To jest prawie identyczne, z wyjątkiem zamiast pliku * jesteś przechodzącej w Huffile; 376 00:31:18,240 --> 00:31:22,030 zamiast fopen jesteś przejazdem w hfopen. 377 00:31:22,030 --> 00:31:29,280 Oto czytamy w nagłówku pierwsze, co jest raczej podobny do tego, jak czytamy w nagłówku 378 00:31:29,280 --> 00:31:33,580 dla plików graficznych. 379 00:31:33,580 --> 00:31:38,000 Co my tu robimy jest sprawdzenie, czy informacje nagłówka 380 00:31:38,000 --> 00:31:44,330 zawiera odpowiednią liczbę magiczną wskazującą, że jest to właściwy plik Huff 381 00:31:44,330 --> 00:31:53,610 to wszystko z tych kontroli, aby upewnić się, że plik jest otwarty, że rzeczywista huffed plik czy nie. 382 00:31:53,610 --> 00:32:05,330 Co to znaczy, że wyprowadza częstotliwości wszystkie symbole, które możemy zobaczyć 383 00:32:05,330 --> 00:32:09,790 w terminalu w graficznym tabeli. 384 00:32:09,790 --> 00:32:15,240 Ta część będzie przydatna. 385 00:32:15,240 --> 00:32:24,680 Ma trochę i czyta po trochu do zmiennej trochę i następnie drukuje go. 386 00:32:28,220 --> 00:32:35,430 Więc gdybym miał zadzwonić zrzut na hth.bin, co jest wynikiem huffing plik 387 00:32:35,430 --> 00:32:39,490 używając roztworu personel, że dostanę to. 388 00:32:39,490 --> 00:32:46,000 To wyprowadzanie tych wszystkich znaków, a następnie oddanie częstotliwość ich wyświetlania. 389 00:32:46,000 --> 00:32:51,180 Jeśli spojrzeć, większość z nich to 0s poza tym: H, który pojawia się dwukrotnie, 390 00:32:51,180 --> 00:32:54,820 i T, które pojawia raz. 391 00:32:54,820 --> 00:33:07,860 A potem mamy tutaj rzeczywistą wiadomość w 0s i 1s. 392 00:33:07,860 --> 00:33:15,450 Jeśli spojrzymy na hth.txt, która jest przypuszczalnie oryginalna wiadomość, która została wzburzona, 393 00:33:15,450 --> 00:33:22,490 możemy spodziewać się jakiś Hs i TS tam. 394 00:33:22,490 --> 00:33:28,720 W szczególności, możemy spodziewać się w odległości zaledwie 1 T i 2 HS. 395 00:33:32,510 --> 00:33:37,440 Jesteśmy w hth.txt. To rzeczywiście ma HTH. 396 00:33:37,440 --> 00:33:41,270 Zawarte w tam, choć nie możemy go zobaczyć, to znak nowej linii. 397 00:33:41,270 --> 00:33:53,190 Hth.bin plik Huff jest również kodowanie znak nowej linii, jak również. 398 00:33:55,680 --> 00:34:01,330 Tutaj, bo wiemy, że zamówienie jest HTH i linią, 399 00:34:01,330 --> 00:34:07,340 widzimy, że prawdopodobnie H jest reprezentowany przez tylko 1 pojedynczym 400 00:34:07,340 --> 00:34:17,120 T i 01 i jest prawdopodobnie to następne H 1 oraz 401 00:34:17,120 --> 00:34:21,139 a następnie mamy newline pokazywane dwoma 0s. 402 00:34:22,420 --> 00:34:24,280 Cool. 403 00:34:26,530 --> 00:34:31,600 >> I wreszcie, ponieważ mamy do czynienia z wieloma. C i pliki. H, 404 00:34:31,600 --> 00:34:36,350 będziemy mieć całkiem złożone argument do kompilatora, 405 00:34:36,350 --> 00:34:40,460 i tak mamy tu sprawia, że ​​zrzut Makefile dla ciebie. 406 00:34:40,460 --> 00:34:47,070 Ale faktycznie, trzeba przejść o własne puff.c plik. 407 00:34:47,070 --> 00:34:54,330 Makefile w rzeczywistości nie zajmuje się co puff.c dla Ciebie. 408 00:34:54,330 --> 00:34:59,310 Wychodzimy, że do ciebie należy edytować plik Makefile. 409 00:34:59,310 --> 00:35:05,930 Po wpisaniu polecenia jak zrobić wszystko, na przykład, to pozwoli im wszystkim za Ciebie. 410 00:35:05,930 --> 00:35:10,760 Zapraszam do obejrzenia przykładów Makefile z przeszłości Pset 411 00:35:10,760 --> 00:35:17,400 jak również nie schodzili z tym jednym, aby zobaczyć jak może być w stanie zrobić plik Puff 412 00:35:17,400 --> 00:35:20,260 edytując tę ​​Makefile. 413 00:35:20,260 --> 00:35:22,730 To wszystko dla naszego kodu dystrybucyjnego. 414 00:35:22,730 --> 00:35:28,380 >> Gdy staliśmy się przez to, to tutaj jest po prostu kolejne przypomnienie 415 00:35:28,380 --> 00:35:30,980 jak będziemy mieć do czynienia z węzłami Huffmana. 416 00:35:30,980 --> 00:35:35,400 Nie zamierzamy się nazywając je węzły już, idziemy się nazywając je drzewa 417 00:35:35,400 --> 00:35:39,260 gdzie będziemy reprezentować ich symbolu z char, 418 00:35:39,260 --> 00:35:43,340 ich częstotliwości, liczba zdarzeń, z całkowitą. 419 00:35:43,340 --> 00:35:47,370 Używamy, bo to jest bardziej dokładny niż pływaka. 420 00:35:47,370 --> 00:35:52,980 A potem mamy kolejny wskaźnik do lewego dziecka, jak i dla dziecka w prawo. 421 00:35:52,980 --> 00:35:59,630 Las, jak widzieliśmy, jest tylko linked lista drzew. 422 00:35:59,630 --> 00:36:04,670 Ostatecznie, gdy budujemy nasz plik Huff 423 00:36:04,670 --> 00:36:07,580 chcemy, aby nasz las zawierać tylko 1 drzewo - 424 00:36:07,580 --> 00:36:12,420 1 drzewo, 1 korzeń z wieloma dziećmi. 425 00:36:12,420 --> 00:36:20,840 Wcześniej, gdy byliśmy tylko co nasze drzewa Huffmana, 426 00:36:20,840 --> 00:36:25,360 zaczęliśmy poprzez umieszczenie wszystkich węzłów na naszym ekranie 427 00:36:25,360 --> 00:36:27,790 i mówiąc będziemy mieć te węzły, 428 00:36:27,790 --> 00:36:32,920 W końcu będziesz w liście, i to jest ich symbol, to jest ich częstotliwość. 429 00:36:32,920 --> 00:36:42,070 W naszym lesie, jeśli mamy tylko 3 litery, to las 3 drzew. 430 00:36:42,070 --> 00:36:45,150 A potem jak iść dalej, gdy dodaliśmy pierwszego rodzica, 431 00:36:45,150 --> 00:36:48,080 zrobiliśmy las 2 drzew. 432 00:36:48,080 --> 00:36:54,930 Usunęliśmy 2 z tych dzieci z naszego lasu, a potem zastąpił go węzła nadrzędnego 433 00:36:54,930 --> 00:36:58,820 że mieli te 2 węzły jak dzieci. 434 00:36:58,820 --> 00:37:05,600 I w końcu, nasz ostatni krok w dokonaniu nasz przykład z AS, BS i Cs 435 00:37:05,600 --> 00:37:08,030 byłoby dokonać ostatecznego rodzica, 436 00:37:08,030 --> 00:37:13,190 a więc wtedy, że przyniesie naszą całkowitą liczbę drzew w lesie 1. 437 00:37:13,190 --> 00:37:18,140 Czy wszyscy zobaczyć, jak zaczniesz się z wielu drzew w lesie 438 00:37:18,140 --> 00:37:22,520 i kończy się z 1? Okay. Cool. 439 00:37:25,530 --> 00:37:28,110 >> Co musimy zrobić dla Puff? 440 00:37:28,110 --> 00:37:37,110 Co musimy zrobić, to upewnić się, że, jak zawsze, dają nam odpowiedni rodzaj wejścia 441 00:37:37,110 --> 00:37:39,090 tak, że rzeczywiście możemy uruchomić program. 442 00:37:39,090 --> 00:37:43,130 W tym przypadku, że będą dawać nam po pierwszym argument wiersza polecenia 443 00:37:43,130 --> 00:37:53,440 2 więcej: Plik, który chcemy rozpakować i wyjście rozpakowanego pliku. 444 00:37:53,440 --> 00:38:00,410 Ale gdy mamy pewność, że mijają nas w odpowiedniej ilości wartości, 445 00:38:00,410 --> 00:38:05,820 to mieć pewność, że wejście jest plik Huff, czy nie. 446 00:38:05,820 --> 00:38:10,420 A następnie raz możemy zagwarantować, że jest to plik Huff, to chcemy budować naszą drzewo 447 00:38:10,420 --> 00:38:20,940 zbudować drzewo tak, że pasuje do drzewa, że ​​osoba, która wysłała wiadomość zbudowany. 448 00:38:20,940 --> 00:38:25,840 Następnie po budujemy drzewo, to może mamy do czynienia z 0s i 1s, że minęli się, 449 00:38:25,840 --> 00:38:29,590 nazwom wzdłuż naszego drzewa, ponieważ jest identyczny, 450 00:38:29,590 --> 00:38:33,510 a potem napisać, że przesłanie, interpretują bity z powrotem do znaków. 451 00:38:33,510 --> 00:38:35,880 A potem na końcu, ponieważ mamy do czynienia ze wskaźnikami tutaj 452 00:38:35,880 --> 00:38:38,110 Chcemy się upewnić, że nie mamy żadnych wycieków pamięci 453 00:38:38,110 --> 00:38:41,330 i że mamy wolne wszystko. 454 00:38:42,820 --> 00:38:46,430 >> Zapewnienie prawidłowego użytkowania jest stary kapelusz dla nas teraz. 455 00:38:46,430 --> 00:38:51,980 Bierzemy w wejście, które ma być nazwa pliku, sapać, 456 00:38:51,980 --> 00:38:56,010 a potem określić wyjście, 457 00:38:56,010 --> 00:39:01,580 więc nazwa pliku na dmuchanej wyjścia, który będzie plikiem tekstowym. 458 00:39:03,680 --> 00:39:08,820 To użytkowania. I chcemy obecnie aby wejściowy huffed lub nie. 459 00:39:08,820 --> 00:39:16,420 Wracając, było coś w kodzie dystrybucji, które mogą pomóc nam 460 00:39:16,420 --> 00:39:21,570 ze zrozumieniem, czy plik jest wzburzona, czy nie? 461 00:39:21,570 --> 00:39:26,910 Nie było informacji w huffile.c o Huffeader. 462 00:39:26,910 --> 00:39:33,430 Wiemy, że każdy plik Huff ma Huffeader skojarzony z magicznej liczby 463 00:39:33,430 --> 00:39:37,240 a także tablica z częstotliwości dla każdego symbolu 464 00:39:37,240 --> 00:39:39,570 jak również sumy kontrolnej. 465 00:39:39,570 --> 00:39:43,180 Wiemy o tym, ale wzięliśmy również okiem na dump.c, 466 00:39:43,180 --> 00:39:49,120 w którym czytał w pliku Huff. 467 00:39:49,120 --> 00:39:53,990 I tak, aby to zrobić, musiał sprawdzić, czy to naprawdę była wzburzona, czy nie. 468 00:39:53,990 --> 00:40:03,380 Więc może moglibyśmy użyć dump.c jako struktury naszego puff.c. 469 00:40:03,380 --> 00:40:12,680 Powrót do PSET 4 kiedy mieliśmy copy.c pliku, skopiowany w trójek RGB 470 00:40:12,680 --> 00:40:14,860 i interpretować, że kryminał i rozmiaru, 471 00:40:14,860 --> 00:40:20,390 podobnie, co można zrobić, to uruchomić polecenie jak cp dump.c puff.c 472 00:40:20,390 --> 00:40:23,600 i korzystać z niektórych kodu tam. 473 00:40:23,600 --> 00:40:28,210 Jednakże, nie będzie w prosty procesu 474 00:40:28,210 --> 00:40:33,010 do tłumaczenia się dump.c do puff.c, 475 00:40:33,010 --> 00:40:36,160 ale przynajmniej daje gdzieś zacząć 476 00:40:36,160 --> 00:40:40,540 jak zapewnić, że sygnał wejściowy jest albo nie faktycznie huffed 477 00:40:40,540 --> 00:40:43,240 jak również kilku innych rzeczy. 478 00:40:45,930 --> 00:40:50,250 Mamy zapewnione prawidłowego użytkowania i zapewnił, że wejście jest wzburzona. 479 00:40:50,250 --> 00:40:53,570 Za każdym razem, że zrobiliśmy, że wykonaliśmy naszą prawidłowe sprawdzanie błędów, 480 00:40:53,570 --> 00:41:01,520 więc powrót i wyjście z funkcji, jeśli niektóre wystąpienia awarii, jeśli jest problem. 481 00:41:01,520 --> 00:41:07,170 >> Teraz to, co chcemy zrobić, to zbudować rzeczywiste drzewo. 482 00:41:08,840 --> 00:41:12,640 Jeśli spojrzymy w lesie, są 2 główne funkcje 483 00:41:12,640 --> 00:41:15,800 że będziemy chcieli się bardzo znane. 484 00:41:15,800 --> 00:41:23,870 Jest logiczne, że rośliny, roślin, funkcja non-0 drzewo częstotliwości wewnątrz naszego lasu. 485 00:41:23,870 --> 00:41:29,250 I tak nie jest przekazywana w postaci wskaźnika do lasu oraz wskaźnik do drzewa. 486 00:41:32,530 --> 00:41:40,340 Szybkie pytanie: Ile lasów trzeba będzie kiedy budowanie drzewa Huffmana? 487 00:41:44,210 --> 00:41:46,650 Nasz las jest jak nasz płótnie, prawda? 488 00:41:46,650 --> 00:41:50,800 Więc jesteśmy tylko będziemy mieć 1 las, ale będziemy mieć wiele drzew. 489 00:41:50,800 --> 00:41:57,590 Więc zanim zadzwonisz zakład, jesteś prawdopodobnie będzie chciał dokonać las. 490 00:41:57,590 --> 00:42:04,430 Jest poleceniem, że jeśli spojrzeć na forest.h jak można zrobić las. 491 00:42:04,430 --> 00:42:09,270 Możesz zasadzić drzewo. Wiemy, jak to zrobić. 492 00:42:09,270 --> 00:42:11,590 A następnie można również wybrać się na drzewo z lasu, 493 00:42:11,590 --> 00:42:17,540 usunięcie drzewa z najmniejszej masie i daje wskaźnik do tego. 494 00:42:17,540 --> 00:42:23,090 Wracając do tego, kiedy robiliśmy przykłady siebie, 495 00:42:23,090 --> 00:42:27,980 kiedy byliśmy rysowania go, po prostu po prostu dodaje linki. 496 00:42:27,980 --> 00:42:31,680 Ale tutaj zamiast dodawania linków 497 00:42:31,680 --> 00:42:40,630 myśleć bardziej jak jesteś usunięcie 2 z tych węzłów, a następnie zastąpienie go innym. 498 00:42:40,630 --> 00:42:44,200 Aby wyrazić, że w zakresie zbierania i sadzenie, 499 00:42:44,200 --> 00:42:48,840 jesteś zbierając 2 drzew i sadzenia inne drzewo 500 00:42:48,840 --> 00:42:54,060 że ma te 2 drzewa, które wybrałeś jako dzieci. 501 00:42:57,950 --> 00:43:05,280 Aby zbudować drzewo Huffmana jest, można przeczytać w symbole i częstotliwości w celu 502 00:43:05,280 --> 00:43:10,790 bo Huffeader daje to do ciebie, 503 00:43:10,790 --> 00:43:14,250 daje tablicę częstotliwości. 504 00:43:14,250 --> 00:43:19,660 Tak więc można śmiało i po prostu zignoruj ​​z 0 w nim 505 00:43:19,660 --> 00:43:23,760 bo nie chcemy 256 Liście na koniec. 506 00:43:23,760 --> 00:43:27,960 Chcemy tylko liczbę liści, które są znaki 507 00:43:27,960 --> 00:43:31,600 które są używane w pliku. 508 00:43:31,600 --> 00:43:37,590 Można przeczytać w tych symboli, a każdy z tych symboli, które non-0 częstotliwości, 509 00:43:37,590 --> 00:43:40,440 te będą drzewa. 510 00:43:40,440 --> 00:43:45,990 Co możesz zrobić, to za każdym razem czytać w non-0 symbol częstości 511 00:43:45,990 --> 00:43:50,660 można sadzić, że drzewa w lesie. 512 00:43:50,660 --> 00:43:56,620 Kiedy sadzić drzewa w lesie, można dołączyć te drzewa jako rodzeństwo, 513 00:43:56,620 --> 00:44:01,130 więc wracając do sadzenia i zbierania gdzie wybrać 2, a następnie roślin 1, 514 00:44:01,130 --> 00:44:05,820 jeżeli 1, że roślina jest rodzic z 2 dzieci, które wybrałeś. 515 00:44:05,820 --> 00:44:11,160 Więc Twój wynik końcowy będzie pojedyncze drzewa w lesie. 516 00:44:16,180 --> 00:44:18,170 W ten sposób można zbudować swoje drzewo. 517 00:44:18,170 --> 00:44:21,850 >> Jest kilka rzeczy, które mogą pójść źle tutaj 518 00:44:21,850 --> 00:44:26,580 ponieważ mamy do czynienia z wykonaniem nowych drzew i radzenia sobie z wskaźniki i tego typu rzeczy. 519 00:44:26,580 --> 00:44:30,450 Wcześniej, kiedy mieliśmy do czynienia ze wskaźnikami, 520 00:44:30,450 --> 00:44:36,580 ilekroć malloc'd chcieliśmy się upewnić, że nie zwróci nam wartość NULL wskaźnika. 521 00:44:36,580 --> 00:44:42,770 Tak więc w kilku etapach w tym procesie nie będą kilka przypadków 522 00:44:42,770 --> 00:44:45,920 gdzie program może się nie powieść. 523 00:44:45,920 --> 00:44:51,310 Co chcesz zrobić, to chcesz się upewnić, że można obsłużyć te błędy, 524 00:44:51,310 --> 00:44:54,580 w specyfikacji jest napisane, aby obsługiwać je z wdziękiem, 525 00:44:54,580 --> 00:45:00,280 tak jak wydrukować wiadomość do użytkownika mówiąc im, dlaczego program ma zakończyć 526 00:45:00,280 --> 00:45:03,050 a następnie szybko zamknąć go. 527 00:45:03,050 --> 00:45:09,490 Aby to zrobić, obsługę błędów, pamiętaj, że chcesz, aby to sprawdzić 528 00:45:09,490 --> 00:45:12,160 za każdym razem, że nie może być porażką. 529 00:45:12,160 --> 00:45:14,660 Za każdym razem, że robisz nowy wskaźnik 530 00:45:14,660 --> 00:45:17,040 chcesz się upewnić, że to jest sukces. 531 00:45:17,040 --> 00:45:20,320 Przed tym, co kiedyś zrobić, to nowy wskaźnik i malloc to, 532 00:45:20,320 --> 00:45:22,380 i wtedy możemy sprawdzić, czy wskaźnik jest NULL. 533 00:45:22,380 --> 00:45:25,670 Więc nie będą pewne przypadki, gdzie po prostu można zrobić, 534 00:45:25,670 --> 00:45:28,610 ale czasami jesteś rzeczywiście wywołanie funkcji 535 00:45:28,610 --> 00:45:33,100 oraz w ramach tej funkcji, to jest taki, który robi się mallocing. 536 00:45:33,100 --> 00:45:39,110 W tym przypadku, jeśli spojrzymy na niektóre z funkcji w kodzie, 537 00:45:39,110 --> 00:45:42,260 niektóre z nich są funkcje logiczne. 538 00:45:42,260 --> 00:45:48,480 W abstrakcyjnym przypadku jeśli mamy logiczną funkcję o nazwie foo, 539 00:45:48,480 --> 00:45:54,580 w zasadzie można przyjąć, że oprócz robi cokolwiek foo robi, 540 00:45:54,580 --> 00:45:57,210 ponieważ jest to funkcja logiczna, zwraca true lub false - 541 00:45:57,210 --> 00:46:01,300 true, jeśli sukces, false jeśli nie. 542 00:46:01,300 --> 00:46:06,270 Dlatego chcemy, aby sprawdzić, czy wartość zwracana foo jest prawdziwe lub fałszywe. 543 00:46:06,270 --> 00:46:10,400 Jeśli jest fałszywe, to oznacza, że ​​będziemy chcieli wydrukować jakieś wiadomości 544 00:46:10,400 --> 00:46:14,390 a następnie zamknij program. 545 00:46:14,390 --> 00:46:18,530 To, co chcemy zrobić, to sprawdzić wartość zwracaną foo. 546 00:46:18,530 --> 00:46:23,310 Jeśli foo zwraca false, wtedy wiemy, że napotkał jakiś błąd 547 00:46:23,310 --> 00:46:25,110 i musimy zakończyć nasz program. 548 00:46:25,110 --> 00:46:35,600 Sposobem na to jest mieć stan, w którym rzeczywista funkcja sam jest twój stan. 549 00:46:35,600 --> 00:46:39,320 Powiedz foo bierze w x. 550 00:46:39,320 --> 00:46:43,390 Możemy mieć za warunek if (foo (x)). 551 00:46:43,390 --> 00:46:50,900 Zasadniczo oznacza to, czy pod koniec realizacji foo zwraca prawda 552 00:46:50,900 --> 00:46:57,390 możemy to zrobić, ponieważ funkcja ma ocenić foo 553 00:46:57,390 --> 00:47:00,500 W celu oceny stanu cały. 554 00:47:00,500 --> 00:47:06,500 Więc to jest to, jak można zrobić coś, jeśli funkcja zwraca true i jest sukces. 555 00:47:06,500 --> 00:47:11,800 Ale kiedy jesteś sprawdzanie błędów, chcesz tylko rzucić, jeśli funkcja zwraca false. 556 00:47:11,800 --> 00:47:16,090 Co można zrobić, to po prostu dodaj == false lub po prostu dodać huk przed nim 557 00:47:16,090 --> 00:47:21,010 a potem masz if (! foo). 558 00:47:21,010 --> 00:47:29,540 W ramach tego organu tego warunku można mieć wszystkie obsługi błędów 559 00:47:29,540 --> 00:47:36,940 tak jak, "Nie można utworzyć tego drzewa", a następnie powrót 1 lub coś podobnego. 560 00:47:36,940 --> 00:47:43,340 Co to robi, jednak to, że nawet jeśli foo zwrócone false - 561 00:47:43,340 --> 00:47:46,980 Powiedz foo zwraca true. 562 00:47:46,980 --> 00:47:51,060 Wtedy nie trzeba wywołać foo ponownie. To błędne przekonanie. 563 00:47:51,060 --> 00:47:54,730 Dlatego, że był w stanie, to już ocenione, 564 00:47:54,730 --> 00:47:59,430 więc masz już wynik jeśli używasz zrobić drzewo czy coś takiego 565 00:47:59,430 --> 00:48:01,840 roślin lub pick czy coś. 566 00:48:01,840 --> 00:48:07,460 Ma już tę wartość. To już wykonana. 567 00:48:07,460 --> 00:48:10,730 Więc jest to przydatne do korzystania z funkcji boolowskich jako warunek 568 00:48:10,730 --> 00:48:13,890 z powodu tego, czy rzeczywiście wykonania tej pętli, 569 00:48:13,890 --> 00:48:18,030 wykonuje funkcję tak. 570 00:48:22,070 --> 00:48:27,330 >> Nasz drugi do ostatniego kroku jest pisanie wiadomości do pliku. 571 00:48:27,330 --> 00:48:33,070 Gdy budujemy drzewa Huffmana, to pisanie wiadomości do pliku jest bardzo proste. 572 00:48:33,070 --> 00:48:39,260 Jest to dość proste, teraz wystarczy wykonać 0s i 1s. 573 00:48:39,260 --> 00:48:45,480 I tak umownie wiemy, że w drzewie Huffmana na 0s wskazują lewo 574 00:48:45,480 --> 00:48:48,360 i 1s wskazać prawo. 575 00:48:48,360 --> 00:48:53,540 Więc jeśli czytasz w bit po bicie, za każdym razem, że masz 0 576 00:48:53,540 --> 00:48:59,100 pójdziesz za lewą gałąź, a następnie za każdym razem czytać w 1 577 00:48:59,100 --> 00:49:02,100 będziesz podążać właściwą gałąź. 578 00:49:02,100 --> 00:49:07,570 A potem idziesz dalej, aż trafisz liść 579 00:49:07,570 --> 00:49:11,550 ponieważ liście będzie na końcu gałęzi. 580 00:49:11,550 --> 00:49:16,870 Jak można powiedzieć, czy mamy uderzyć liść czy nie? 581 00:49:19,800 --> 00:49:21,690 Powiedzieliśmy wcześniej. 582 00:49:21,690 --> 00:49:24,040 [Uczeń] Jeżeli wskaźniki są NULL. >> Tak. 583 00:49:24,040 --> 00:49:32,220 Możemy powiedzieć, czy mamy uderzyć liść czy wskaźniki do drzew zarówno lewego i prawego są NULL. 584 00:49:32,220 --> 00:49:34,110 Perfect. 585 00:49:34,110 --> 00:49:40,320 Wiemy, że chcemy czytać krok po kroku do naszego pliku Huff. 586 00:49:43,870 --> 00:49:51,220 Jak widzieliśmy wcześniej w dump.c, to co zrobili to czytali w bit po bicie do pliku Huff 587 00:49:51,220 --> 00:49:54,560 i po prostu wydrukować, co te bity były. 588 00:49:54,560 --> 00:49:58,430 My nie zamierzamy tego robić. Będziemy robić coś, co jest nieco bardziej złożona. 589 00:49:58,430 --> 00:50:03,620 Ale co możemy zrobić, to możemy przyjąć, że fragment kodu, który czyta się na chwilę. 590 00:50:03,620 --> 00:50:10,250 Tutaj mamy trochę całkowitą reprezentującą aktualny trochę, że żyjemy. 591 00:50:10,250 --> 00:50:15,520 To pozwala na iterację wszystkich bitów w pliku aż dojdziesz do końca pliku. 592 00:50:15,520 --> 00:50:21,270 Na podstawie tego, to będziesz chciał mieć jakiś iterator 593 00:50:21,270 --> 00:50:26,760 przechodzenie drzewa. 594 00:50:26,760 --> 00:50:31,460 , A następnie na podstawie tego, czy bit jest 0 lub 1, 595 00:50:31,460 --> 00:50:36,920 będziesz chciał albo przenieść te iteracyjnej w lewo lub przesunąć go w prawo 596 00:50:36,920 --> 00:50:44,080 do końca, aż trafisz na skrzydło, tak do końca, aż w tym węźle, na której jesteś 597 00:50:44,080 --> 00:50:48,260 nie wskazuje na jakiekolwiek inne węzły. 598 00:50:48,260 --> 00:50:54,300 Dlaczego możemy to zrobić z plikiem, ale nie Huffmana alfabetem Morse'a? 599 00:50:54,300 --> 00:50:56,610 Ponieważ w kodzie Morse'a jest trochę niejasności. 600 00:50:56,610 --> 00:51:04,440 Moglibyśmy być jak, oh wait, mamy hit list po drodze, więc może to jest nasz list, 601 00:51:04,440 --> 00:51:08,150 natomiast jeżeli będziemy kontynuować tylko nieco dłużej, to wtedy mają trafić kolejne pismo. 602 00:51:08,150 --> 00:51:13,110 Ale to nie wydarzy się w kodowaniu Huffmana, 603 00:51:13,110 --> 00:51:17,540 więc możemy mieć pewność, że tylko w ten sposób mamy zamiar uderzyć znak 604 00:51:17,540 --> 00:51:23,480 jest, jeśli ten węzeł jest lewa i prawa dzieci są NULL. 605 00:51:28,280 --> 00:51:32,350 >> Wreszcie, chcemy uwolnić wszystkie z naszej pamięci. 606 00:51:32,350 --> 00:51:37,420 Chcemy zarówno zamknąć plik Huff, że mamy do czynienia z 607 00:51:37,420 --> 00:51:41,940 , jak również usunięcie wszystkich drzew w naszym lesie. 608 00:51:41,940 --> 00:51:46,470 W oparciu o swoje życie, pewnie będzie chciał zadzwonić usunąć las 609 00:51:46,470 --> 00:51:49,780 zamiast rzeczywiście będzie przez wszystkie drzewa samodzielnie. 610 00:51:49,780 --> 00:51:53,430 Ale jeśli masz już tymczasowe drzewa, będziemy chcieli, aby uwolnić to. 611 00:51:53,430 --> 00:51:59,060 Wiesz kod najlepiej, więc wiesz, gdzie jesteś przydzielania pamięci. 612 00:51:59,060 --> 00:52:04,330 A więc jeśli jesteś w, zaczynaj nawet kontrolować F'ing dla malloc, 613 00:52:04,330 --> 00:52:08,330 widząc kiedykolwiek malloc i upewniając się, że wszystko to uwolnić 614 00:52:08,330 --> 00:52:10,190 ale potem po prostu się przez kod, 615 00:52:10,190 --> 00:52:14,260 zrozumienie, gdzie mogłeś przydzielonej pamięci. 616 00:52:14,260 --> 00:52:21,340 Wysyłka może po prostu powiedzieć: "Na końcu pliku Idę do usunięcia lasu na moim lesie" 617 00:52:21,340 --> 00:52:23,850 więc w zasadzie jasne, że pamięć, wolne, że 618 00:52:23,850 --> 00:52:28,310 ", A następnie Mam zamiar zamknąć plik, a następnie mój program będzie zamknąć." 619 00:52:28,310 --> 00:52:33,810 Ale jest to, że tylko raz, że program zostanie zamknięty? 620 00:52:33,810 --> 00:52:37,880 Nie, bo czasami może być błąd, że się stało. 621 00:52:37,880 --> 00:52:42,080 Może nie mógł otworzyć pliku lub nie mogliśmy dokonać innego drzewa 622 00:52:42,080 --> 00:52:49,340 lub jakiś błąd się w proces alokacji pamięci i dlatego zwróciło NULL. 623 00:52:49,340 --> 00:52:56,710 Wystąpił błąd, a potem wróciliśmy i zamknąć. 624 00:52:56,710 --> 00:53:02,040 Więc chcesz, aby upewnić się, że każdy możliwy czas, że program można zamknąć, 625 00:53:02,040 --> 00:53:06,980 Aby zwolnić wszystkich pamięci tam. 626 00:53:06,980 --> 00:53:13,370 To nie tylko będzie na samym końcu głównej funkcji, którą zamknąć kod. 627 00:53:13,370 --> 00:53:20,780 Chcesz spojrzeć na każdy przykład, że Twój kod potencjalnie może wrócić przedwcześnie 628 00:53:20,780 --> 00:53:25,070 a następnie wolne cokolwiek pamięci sens. 629 00:53:25,070 --> 00:53:30,830 Powiedzmy, że nazwał się las i że wrócił false. 630 00:53:30,830 --> 00:53:34,230 To prawdopodobnie nie będzie trzeba usunąć las 631 00:53:34,230 --> 00:53:37,080 bo nie masz jeszcze las. 632 00:53:37,080 --> 00:53:42,130 Ale w każdym miejscu w kodzie, gdzie można wrócić przedwcześnie 633 00:53:42,130 --> 00:53:46,160 Aby upewnić się, że ewentualne zwolnienia pamięci. 634 00:53:46,160 --> 00:53:50,020 >> Tak więc, gdy mamy do czynienia z zwolnienie pamięci i konieczności ewentualnych nieszczelności, 635 00:53:50,020 --> 00:53:55,440 Chcemy nie tylko wykorzystać nasz osąd i logiki 636 00:53:55,440 --> 00:54:01,850 ale również użyć Valgrind aby ustalić, czy my wszyscy uwolnieni naszej pamięci prawidłowo. 637 00:54:01,850 --> 00:54:09,460 Można uruchomić Valgrind na Puff i wtedy musisz również przekazać je 638 00:54:09,460 --> 00:54:14,020 właściwa liczba argumentów wiersza polecenia do Valgrind. 639 00:54:14,020 --> 00:54:18,100 Można uruchomić, ale wyjście jest nieco tajemnicze. 640 00:54:18,100 --> 00:54:21,630 Staliśmy się trochę przyzwyczaić do Speller, ale nadal potrzebujemy nieco więcej pomocy, 641 00:54:21,630 --> 00:54:26,450 tak to działa to z kilku flag bardziej jak szczelne check = pełna, 642 00:54:26,450 --> 00:54:32,040 które prawdopodobnie dać nam trochę więcej jako wyjście na Valgrind. 643 00:54:32,040 --> 00:54:39,040 >> Następnie kolejna przydatna wskazówka kiedy jesteś debugowania jest komenda diff. 644 00:54:39,040 --> 00:54:48,520 Możesz przejść personel na realizację Huff, biegać, że w pliku tekstowym, 645 00:54:48,520 --> 00:54:55,400 , a następnie wyświetli ją do pliku binarnego, plik binarny Huff, za szczególne. 646 00:54:55,400 --> 00:54:59,440 Następnie, jeśli prowadzisz własną puff tego pliku binarnego, 647 00:54:59,440 --> 00:55:03,950 potem idealnie, Twój wyprodukowania plik tekstowy ma być identyczna 648 00:55:03,950 --> 00:55:08,200 do pierwotnego, który przeszedł w. 649 00:55:08,200 --> 00:55:15,150 Tutaj używam hth.txt jako przykład, i to jest jeden mówił o w spec. 650 00:55:15,150 --> 00:55:21,040 To dosłownie HTH a następnie linią. 651 00:55:21,040 --> 00:55:30,970 Ale na pewno czuć się swobodnie i jesteś zdecydowanie zachęca się do używania dłuższych przykładów 652 00:55:30,970 --> 00:55:32,620 do pliku tekstowego. 653 00:55:32,620 --> 00:55:38,110 >> Możesz nawet być może szansę na kompresowanie i dekompresję 654 00:55:38,110 --> 00:55:41,600 niektóre z plików, które wykorzystywane w Speller jak wojny i pokoju 655 00:55:41,600 --> 00:55:46,710 lub Jane Austen, czy coś w tym stylu - to byłoby fajne - czy Austin Powers, 656 00:55:46,710 --> 00:55:51,880 rodzaj czynienia z większymi plikami, ponieważ nie chciał przyjść do niego 657 00:55:51,880 --> 00:55:55,590 jeśli użyliśmy następne narzędzie tutaj, ls-l. 658 00:55:55,590 --> 00:56:01,150 Jesteśmy przyzwyczajeni do ls, które zasadniczo wymienia wszystkie treści w naszym katalogu. 659 00:56:01,150 --> 00:56:07,860 Przekazując flag-l rzeczywiście wyświetla wielkość tych plików. 660 00:56:07,860 --> 00:56:12,690 Jeśli przejdziesz przez spec PSET, faktycznie poprowadzi Cię przez proces tworzenia pliku binarnego, 661 00:56:12,690 --> 00:56:16,590 z huffing go, a zobaczysz, że dla bardzo małych plików 662 00:56:16,590 --> 00:56:23,910 Koszt przestrzeń ściskając go i tłumaczenie wszystkich tych informacji 663 00:56:23,910 --> 00:56:26,980 wszystkich częstotliwości i tego typu rzeczy przewyższają rzeczywiste korzyści 664 00:56:26,980 --> 00:56:30,000 sprasowania plik w pierwszej kolejności. 665 00:56:30,000 --> 00:56:37,450 Ale jeśli go uruchomić na kilka dłuższych plików tekstowych, to może zobaczyć, że zaczynają się pewne korzyści 666 00:56:37,450 --> 00:56:40,930 w kompresji tych plików. 667 00:56:40,930 --> 00:56:46,210 >> I w końcu mamy naszą starą GDB PAL, która na pewno będzie przydatna, too. 668 00:56:48,360 --> 00:56:55,320 >> Czy mamy jakiekolwiek pytania dotyczące drzew Huff lub proces może dokonywania drzewa 669 00:56:55,320 --> 00:56:58,590 lub jakiekolwiek inne pytania dotyczące Puff Huff'n? 670 00:57:00,680 --> 00:57:02,570 Okay. Zostanę wokół na trochę. 671 00:57:02,570 --> 00:57:06,570 >> Dzięki wszystkim. To był Walkthrough 6. Powodzenia. 672 00:57:08,660 --> 00:57:10,000 >> [CS50.TV]