1 00:00:00,000 --> 00:00:02,210 [Powered by Google Translate] [Walkthrough - Problem Set 6] 2 00:00:02,210 --> 00:00:04,810 [Zamyla Chan - Harvarduniversitetet] 3 00:00:04,810 --> 00:00:07,240 [Detta är CS50. - CS50.TV] 4 00:00:07,240 --> 00:00:12,180 >> Hej, alla, och välkommen till Walkthrough 6: Huff'n Puff. 5 00:00:12,180 --> 00:00:17,440 I Huff'n Puff vad vi gör kommer att ha att göra med en Huffman komprimerad fil 6 00:00:17,440 --> 00:00:20,740 och sedan blåsa tillbaka upp, så dekomprimering det, 7 00:00:20,740 --> 00:00:25,810 så att vi kan översätta från 0 och 1 som användaren skickar oss 8 00:00:25,810 --> 00:00:30,660 och omvandla den tillbaka till den ursprungliga texten. 9 00:00:30,660 --> 00:00:34,360 Pset 6 kommer att vara ganska coolt eftersom du kommer att se några av de verktyg 10 00:00:34,360 --> 00:00:41,730 som du använde i pset 4 och pset 5 och typ av kombinera dem till 1 ganska snyggt koncept 11 00:00:41,730 --> 00:00:43,830 när du kommer att tänka på det. 12 00:00:43,830 --> 00:00:50,110 >> Också utan tvekan var pset 4 och 5 de mest utmanande psets som vi hade att erbjuda. 13 00:00:50,110 --> 00:00:53,950 Så från och med nu har vi denna 1 mer pset i C, 14 00:00:53,950 --> 00:00:56,480 och sedan efter att vi är på att webbprogrammering. 15 00:00:56,480 --> 00:01:02,310 Så gratulerar er för att få över den tuffaste puckel i CS50. 16 00:01:03,630 --> 00:01:09,760 >> Flytta på för Huff'n Puff är vår verktygslåda för pset kommer att vara Huffman träd, 17 00:01:09,760 --> 00:01:14,700 så förstå inte bara hur binära träd arbete men också specifikt Huffman träd, 18 00:01:14,700 --> 00:01:16,240 hur de konstrueras. 19 00:01:16,240 --> 00:01:20,210 Och då ska vi ha en massa utdelning kod i pset, 20 00:01:20,210 --> 00:01:22,480 och vi kommer att se att faktiskt en del av koden 21 00:01:22,480 --> 00:01:24,670 Vi kanske inte kan till fullo förstå ännu, 22 00:01:24,670 --> 00:01:30,080 och så de kommer att vara. C-filer, men då deras medföljande. h-filer 23 00:01:30,080 --> 00:01:34,300 kommer att ge oss tillräckligt med kunskap som vi behöver, så att vi vet hur dessa funktioner fungerar 24 00:01:34,300 --> 00:01:38,100 eller åtminstone vad de ska göra - deras in-och utgångar - 25 00:01:38,100 --> 00:01:40,760 även om vi inte vet vad som händer i den svarta lådan 26 00:01:40,760 --> 00:01:44,090 eller förstår inte vad som händer i den svarta lådan i. 27 00:01:44,090 --> 00:01:49,400 Och slutligen, som vanligt har vi att göra med nya datastrukturer, 28 00:01:49,400 --> 00:01:51,840 specifika typer av noder som pekar på vissa saker, 29 00:01:51,840 --> 00:01:56,080 och så här med en penna och papper, inte bara för designprocessen 30 00:01:56,080 --> 00:01:58,470 och när du försöker lista ut hur din pset bör arbeta 31 00:01:58,470 --> 00:02:00,520 men också under felsökning. 32 00:02:00,520 --> 00:02:06,140 Du kan ha GDB tillsammans med ditt penna och papper medan du tar ner vad värdena, 33 00:02:06,140 --> 00:02:09,320 där dina pilarna pekar och sådana saker. 34 00:02:09,320 --> 00:02:13,720 >> Först ska vi titta på Huffman träd. 35 00:02:13,720 --> 00:02:19,600 Huffman träd är binära träd, vilket innebär att varje nod endast har 2 barn. 36 00:02:19,600 --> 00:02:24,870 I Huffman träd egenskapen är att de vanligaste värdena 37 00:02:24,870 --> 00:02:27,140 representeras av de minsta bitarna. 38 00:02:27,140 --> 00:02:32,690 Vi såg i föreläsningssalar exempel på morsekod, vilken typ av koncernens några brev. 39 00:02:32,690 --> 00:02:38,030 Om du försöker översätta ett A eller ett E, till exempel, 40 00:02:38,030 --> 00:02:43,940 du översätter det ofta, så istället för att behöva använda hela uppsättningen bitar 41 00:02:43,940 --> 00:02:48,640 avsatts för att vanliga datatyp komprimera du ner till färre, 42 00:02:48,640 --> 00:02:53,730 och sedan dessa bokstäver som utgjorde mindre ofta representerade med längre bitar 43 00:02:53,730 --> 00:02:59,840 eftersom du har råd att när du väga de frekvenser som dessa skrivelser visas. 44 00:02:59,840 --> 00:03:03,020 Vi har samma idé här i Huffman träd 45 00:03:03,020 --> 00:03:12,360 där vi gör en kedja, en slags väg för att komma till vissa tecken. 46 00:03:12,360 --> 00:03:14,470 Och sedan de tecken som har mest frekvensen 47 00:03:14,470 --> 00:03:17,940 kommer att vara representerade med minst antal bitar. 48 00:03:17,940 --> 00:03:22,020 >> Det sätt som du konstruera en Huffman träd 49 00:03:22,020 --> 00:03:27,430 är genom att placera alla de tecken som visas i texten 50 00:03:27,430 --> 00:03:30,630 och beräkna deras frekvens, hur ofta de förekommer. 51 00:03:30,630 --> 00:03:33,880 Detta kan antingen vara en räkningen på hur många gånger dessa bokstäver visas 52 00:03:33,880 --> 00:03:40,270 eller kanske en procentandel av av alla tecken hur många var och en visas. 53 00:03:40,270 --> 00:03:44,270 Och så vad du gör är när du har allt det utstakad, 54 00:03:44,270 --> 00:03:49,060 då du leta efter 2 lägsta frekvenserna och sedan gå med dem som syskon 55 00:03:49,060 --> 00:03:55,660 där då den överordnade noden har en frekvens som är summan av dess 2 barn. 56 00:03:55,660 --> 00:04:00,870 Och sedan genom konventionen säger att den vänstra noden, 57 00:04:00,870 --> 00:04:03,770 du följer det genom att följa 0 gren, 58 00:04:03,770 --> 00:04:08,140 och sedan längst till höger nod är 1 gren. 59 00:04:08,140 --> 00:04:16,040 Som vi såg i morsekod, var en gotcha att om du bara hade en ljudsignal och pip 60 00:04:16,040 --> 00:04:18,120 det var tvetydigt. 61 00:04:18,120 --> 00:04:22,430 Det kan antingen vara 1 bokstav eller det kan vara en sekvens av 2 bokstäver. 62 00:04:22,430 --> 00:04:27,790 Och så vad Huffman träd gör beror av naturen av tecknen 63 00:04:27,790 --> 00:04:34,140 eller våra sista faktiska tecken är de sista noderna på grenen - 64 00:04:34,140 --> 00:04:39,300 Vi hänvisar till de som löv - på grund av att det inte kan finnas någon tvetydighet 65 00:04:39,300 --> 00:04:45,160 enligt vilken bokstav du försöker koda med serien av bitar 66 00:04:45,160 --> 00:04:50,670 eftersom ingenstans längs de bitar som representerar 1 bokstav 67 00:04:50,670 --> 00:04:55,960 kommer du att stöta annan hela brevet, och det kommer inte finnas någon förvirring där. 68 00:04:55,960 --> 00:04:58,430 Men vi ska gå in exempel som ni faktiskt kan se att 69 00:04:58,430 --> 00:05:02,120 istället för oss berättar just om att det är sant. 70 00:05:02,120 --> 00:05:06,390 >> Låt oss titta på ett enkelt exempel på en Huffman träd. 71 00:05:06,390 --> 00:05:09,380 Jag har en sträng här som är 12 tecken långt. 72 00:05:09,380 --> 00:05:14,010 Jag har 4 As, 6 B, och 2 Cs. 73 00:05:14,010 --> 00:05:17,270 Mitt första steg skulle vara att räkna. 74 00:05:17,270 --> 00:05:20,760 Hur många gånger verkar A? Det verkar 4 gånger i strängen. 75 00:05:20,760 --> 00:05:25,060 B visas 6 gånger, och C visas 2 gånger. 76 00:05:25,060 --> 00:05:28,970 Naturligtvis, jag kommer att säga att jag med B oftast, 77 00:05:28,970 --> 00:05:35,970 så jag vill representera B med minst antal bitar, det minsta antalet 0 och 1. 78 00:05:35,970 --> 00:05:42,600 Och då jag också kommer att förvänta sig C för att kräva mest mängd av 0 och 1 samt. 79 00:05:42,600 --> 00:05:48,550 Först vad jag gjorde här är jag placerade dem i stigande ordning i fråga om frekvens. 80 00:05:48,550 --> 00:05:52,710 Vi ser att C och A, de är våra 2 lägsta frekvenserna. 81 00:05:52,710 --> 00:06:00,290 Vi skapar en förälder nod och att överordnade noden inte har ett brev i samband med det, 82 00:06:00,290 --> 00:06:05,070 men det har en frekvens, som är summan. 83 00:06:05,070 --> 00:06:08,780 Summan blir 2 + 4, vilket är 6. 84 00:06:08,780 --> 00:06:10,800 Sedan följer vi den vänstra grenen. 85 00:06:10,800 --> 00:06:14,970 Om vi ​​på det 6 nod, då skulle vi följa 0 för att komma till C 86 00:06:14,970 --> 00:06:17,450 och sedan 1 för att få till A. 87 00:06:17,450 --> 00:06:20,300 Så nu har vi 2 noder. 88 00:06:20,300 --> 00:06:23,920 Vi har värdet 6 och vi har också en annan nod med värdet 6. 89 00:06:23,920 --> 00:06:28,550 Och så de 2 är inte bara 2 lägst men också bara 2 som är kvar, 90 00:06:28,550 --> 00:06:33,820 så vi går dem av en annan förälder, med summan är 12. 91 00:06:33,820 --> 00:06:36,300 Så här har vi vår Huffmanträd 92 00:06:36,300 --> 00:06:40,020 om att få till B, det skulle bara vara lite 1 93 00:06:40,020 --> 00:06:45,430 och sedan komma till en vi skulle ha 01 och sedan C med 00. 94 00:06:45,430 --> 00:06:51,300 Så här ser vi att i princip vi representerar dessa tecken med antingen 1 eller 2 bitar 95 00:06:51,300 --> 00:06:55,160 där B, som förväntat, har minst. 96 00:06:55,160 --> 00:07:01,730 Och sedan vi hade förväntat C ha mest, men eftersom det är en så liten Huffman träd, 97 00:07:01,730 --> 00:07:06,020 då A är även representerad av 2 bitar i motsats till någonstans i mitten. 98 00:07:07,820 --> 00:07:11,070 >> Bara att gå över en annan enkelt exempel på Huffman träd, 99 00:07:11,070 --> 00:07:19,570 säga att du har strängen "Hej." 100 00:07:19,570 --> 00:07:25,360 Vad du gör är du först skulle säga hur många gånger gör H visas i detta? 101 00:07:25,360 --> 00:07:34,200 H visas en gång och sedan e visas en gång och sedan har vi l förekommer två gånger 102 00:07:34,200 --> 00:07:36,580 och o visas en gång. 103 00:07:36,580 --> 00:07:44,310 Och så då förväntar vi oss vilken bokstav som representeras av det minsta antalet bitar? 104 00:07:44,310 --> 00:07:47,450 [Studenten] L. >> L.. Ja. l är rätt. 105 00:07:47,450 --> 00:07:50,730 Vi förväntar jag att företrädas av det minsta antalet bitar 106 00:07:50,730 --> 00:07:55,890 för att jag används mest i strängen "Hello". 107 00:07:55,890 --> 00:08:04,280 Vad jag ska göra nu är att dra ut dessa noder. 108 00:08:04,280 --> 00:08:15,580 Jag har 1, vilket är H, och sedan en annan 1, som är e, och sedan en 1, som är o - 109 00:08:15,580 --> 00:08:23,410 just nu är jag sätta dem i ordning - och sedan 2, vilket är l. 110 00:08:23,410 --> 00:08:32,799 Då säger jag det sätt som jag bygger en Huffman träd är att hitta de 2 noder med de minst frekvenserna 111 00:08:32,799 --> 00:08:38,010 och göra dem syskon genom att skapa en förälder nod. 112 00:08:38,010 --> 00:08:41,850 Här har vi 3 noder med den lägsta frekvensen. De är alla 1. 113 00:08:41,850 --> 00:08:50,620 Så här väljer vi vilken vi ska länka först. 114 00:08:50,620 --> 00:08:54,850 Låt oss säga att jag väljer H och e. 115 00:08:54,850 --> 00:09:01,150 Summan av 1 + 1 är 2, men denna nod inte har ett brev i samband med det. 116 00:09:01,150 --> 00:09:04,440 Det håller bara värdet. 117 00:09:04,440 --> 00:09:10,950 Nu ser vi på de närmaste 2 lägsta frekvenserna. 118 00:09:10,950 --> 00:09:15,590 Det är 2 och 1. Det kan vara någon av dessa 2, men jag kommer att välja här. 119 00:09:15,590 --> 00:09:18,800 Summan är 3. 120 00:09:18,800 --> 00:09:26,410 Och slutligen har jag bara 2 kvar, så då blir 5. 121 00:09:26,410 --> 00:09:32,010 Då här, som förväntat, om jag fylla i kodning för att 122 00:09:32,010 --> 00:09:37,480 1s är alltid rätt gren och 0: or är den vänstra. 123 00:09:37,480 --> 00:09:45,880 Då har vi L representeras av bara 1 bit och sedan o med 2 124 00:09:45,880 --> 00:09:52,360 och därefter e med 2 och sedan H faller ned till 3 bitar. 125 00:09:52,360 --> 00:09:59,750 Så du kan skicka meddelandet "Hej" istället för att faktiskt använda tecknen 126 00:09:59,750 --> 00:10:02,760 genom att bara 0 och 1. 127 00:10:02,760 --> 00:10:07,910 Kom dock ihåg att i flera fall hade vi band med vår frekvens. 128 00:10:07,910 --> 00:10:11,900 Vi kunde ha antingen gått H och O 1. Kanske. 129 00:10:11,900 --> 00:10:15,730 Eller senare när vi hade L representeras av 2 130 00:10:15,730 --> 00:10:19,410 samt gick en representeras av 2, kunde vi ha kopplat antingen en. 131 00:10:19,410 --> 00:10:23,630 >> Och så när du skickar 0 och 1, som faktiskt inte garanterar 132 00:10:23,630 --> 00:10:27,090 att mottagaren kan helt läsa ditt meddelande höger utanför bat 133 00:10:27,090 --> 00:10:30,490 eftersom de kanske inte vet vilket beslut du gjort. 134 00:10:30,490 --> 00:10:34,920 Så när vi har att göra med Huffman-komprimering, 135 00:10:34,920 --> 00:10:40,090 på något sätt måste vi tala om för mottagaren av vårt budskap om hur vi bestämde - 136 00:10:40,090 --> 00:10:43,470 De behöver veta någon form av extra information 137 00:10:43,470 --> 00:10:46,580 Förutom den komprimerade meddelandet. 138 00:10:46,580 --> 00:10:51,490 De måste förstå vad trädet egentligen ser ut, 139 00:10:51,490 --> 00:10:55,450 hur vi gjorde faktiskt dessa beslut. 140 00:10:55,450 --> 00:10:59,100 >> Här var vi bara göra exempel baserade på faktiska räkningen, 141 00:10:59,100 --> 00:11:01,550 men ibland kan du också ha en Huffman träd 142 00:11:01,550 --> 00:11:05,760 baserat på den frekvens där bokstäverna visas, och det är exakt samma process. 143 00:11:05,760 --> 00:11:09,090 Här jag uttrycka det i termer av procent eller en fraktion, 144 00:11:09,090 --> 00:11:11,290 och så här exakt samma sak. 145 00:11:11,290 --> 00:11:15,300 Jag tycker att 2 lägsta, summera dem, nästa 2 lägsta, summera dem, 146 00:11:15,300 --> 00:11:19,390 tills jag har en full träd. 147 00:11:19,390 --> 00:11:23,610 Även om vi kunde göra det hur som helst, när vi har att göra med procentsatser, 148 00:11:23,610 --> 00:11:27,760 det betyder att vi dela saker och hantera decimaler eller snarare flyter 149 00:11:27,760 --> 00:11:30,900 Om vi ​​tänker på datastrukturer i ett huvud. 150 00:11:30,900 --> 00:11:32,540 Vad vet vi om flottar? 151 00:11:32,540 --> 00:11:35,180 Vad är ett vanligt problem när vi har att göra med flöten? 152 00:11:35,180 --> 00:11:38,600 [Elev] oprecisa aritmetik. >> Ja. Inexakthet. 153 00:11:38,600 --> 00:11:43,760 På grund av flyttal vaghet, för pset så att vi ser till 154 00:11:43,760 --> 00:11:49,450 att vi inte förlorar några värden, så vi faktiskt kommer att ha att göra med räkningen. 155 00:11:49,450 --> 00:11:54,880 Så om du skulle tänka på en Huffman nod, om man ser tillbaka till strukturen här, 156 00:11:54,880 --> 00:12:01,740 om man tittar på de gröna har en frekvens i samband med det 157 00:12:01,740 --> 00:12:08,760 liksom det pekar på en nod till vänster samt en nod till sin rätt. 158 00:12:08,760 --> 00:12:13,970 Och sedan de röda det också har en karaktär i samband med dem. 159 00:12:13,970 --> 00:12:18,900 Vi kommer inte att göra separata dem för föräldrarna och sedan de sista noder, 160 00:12:18,900 --> 00:12:23,680 som vi kallar löv, utan de kommer bara att ha NULL-värden. 161 00:12:23,680 --> 00:12:31,050 För varje nod kommer vi att ha ett tecken, en symbol som den noden representerar, 162 00:12:31,050 --> 00:12:40,490 då en frekvens samt en pekare till dess vänstra underordnade och dess högra underordnade. 163 00:12:40,490 --> 00:12:45,680 Bladen, som är längst ner, skulle också ha nod pekare 164 00:12:45,680 --> 00:12:49,550 till deras vänster och till höger, men eftersom dessa värden inte pekar på faktiska noder, 165 00:12:49,550 --> 00:12:53,970 vad skulle deras värde vara? >> [Elev] NULL. >> NULL. Exakt. 166 00:12:53,970 --> 00:12:58,430 Här är ett exempel på hur du kan representera frekvensen i flottar, 167 00:12:58,430 --> 00:13:02,130 men vi kommer att ha att göra med det med heltal, 168 00:13:02,130 --> 00:13:06,780 så allt jag gjorde är att ändra datatypen där. 169 00:13:06,780 --> 00:13:09,700 >> Låt oss gå vidare till lite mer av en komplex exempel. 170 00:13:09,700 --> 00:13:13,360 Men nu när vi har gjort de enkla, det är bara samma process. 171 00:13:13,360 --> 00:13:20,290 Du hittar 2 lägsta frekvenserna, summera frekvenserna 172 00:13:20,290 --> 00:13:22,450 och det är den nya frekvensen av din förälder nod, 173 00:13:22,450 --> 00:13:29,310 som pekar sedan till vänster med 0 grenen och höger med 1 gren. 174 00:13:29,310 --> 00:13:34,200 Om vi ​​har strängen "Detta är CS50," vi räkna hur många gånger T nämns, 175 00:13:34,200 --> 00:13:38,420 h nämnde, i, s, c, 5, 0. 176 00:13:38,420 --> 00:13:42,010 Sen vad jag gjorde här är de röda noderna jag planterade, 177 00:13:42,010 --> 00:13:48,530 Jag sa att jag kommer att ha dessa tecken så småningom på botten av mitt träd. 178 00:13:48,530 --> 00:13:51,740 De kommer att vara alla av bladen. 179 00:13:51,740 --> 00:13:58,200 Sen vad jag gjorde är jag sorterade dem efter frekvens i stigande ordning, 180 00:13:58,200 --> 00:14:02,950 och detta är faktiskt det sätt som pset koden gör det 181 00:14:02,950 --> 00:14:07,550 är det sorterar det efter frekvens och sedan i alfabetisk ordning. 182 00:14:07,550 --> 00:14:13,870 Så det har siffrorna först och sedan alfabetiskt efter frekvensen. 183 00:14:13,870 --> 00:14:18,520 Så vad jag skulle göra är jag skulle hitta 2 lägsta. Det är 0 och 5. 184 00:14:18,520 --> 00:14:22,390 Jag skulle sammanfatta dem, och det är 2. Då skulle jag fortsätta söka efter nästa 2 lägst. 185 00:14:22,390 --> 00:14:26,100 Dessa är de två 1s, och sedan de blivit 2 också. 186 00:14:26,100 --> 00:14:31,570 Nu vet jag att mitt nästa steg kommer att gå det lägsta antalet, 187 00:14:31,570 --> 00:14:41,380 som är T, 1, och sedan välja en av de noder som har 2 som frekvensen. 188 00:14:41,380 --> 00:14:44,560 Så här har vi 3 alternativ. 189 00:14:44,560 --> 00:14:47,980 Vad jag ska göra för bilden är bara visuellt ändra dem åt dig 190 00:14:47,980 --> 00:14:51,790 så att du kan se hur jag bygger upp den. 191 00:14:51,790 --> 00:14:59,040 Vad koden och din distribution kod kommer att göra skulle gå med T en 192 00:14:59,040 --> 00:15:01,410 med 0 och 5 nod. 193 00:15:01,410 --> 00:15:05,060 Så då summor till 3 och sedan fortsätter vi processen. 194 00:15:05,060 --> 00:15:08,660 Den 2 och 2 är nu den lägsta, så då de belopp till 4. 195 00:15:08,660 --> 00:15:12,560 Alla följer hittills? Okej. 196 00:15:12,560 --> 00:15:16,410 Sedan efter att vi har 3 och 3 som behöver läggas upp, 197 00:15:16,410 --> 00:15:21,650 så igen jag bara byta den så att du kan se visuellt så att det inte blir för rörigt. 198 00:15:21,650 --> 00:15:25,740 Sedan har vi en 6, och sedan vår sista steget är nu att vi bara har 2 noder 199 00:15:25,740 --> 00:15:30,440 Vi summerar dem för att göra rot vår träd, vilket är 10. 200 00:15:30,440 --> 00:15:34,100 Och antalet 10 vettigt eftersom varje nod representerade, 201 00:15:34,100 --> 00:15:40,750 deras värde, deras frekvens nummer, var hur många gånger de dök upp i strängen, 202 00:15:40,750 --> 00:15:46,350 och sedan har vi 5 tecken i vår sträng, så det är vettigt. 203 00:15:48,060 --> 00:15:52,320 Om vi ​​tittar upp på hur vi faktiskt skulle koda det, 204 00:15:52,320 --> 00:15:56,580 som väntat, i-och s, som förekommer det oftast 205 00:15:56,580 --> 00:16:01,350 representeras av det minsta antalet bitar. 206 00:16:03,660 --> 00:16:05,660 >> Var försiktig här. 207 00:16:05,660 --> 00:16:09,780 I Huffman träd fallet betyder faktiskt. 208 00:16:09,780 --> 00:16:13,670 Ett versalt S är annorlunda än ett gement s.. 209 00:16:13,670 --> 00:16:21,260 Om vi ​​hade "Detta är CS50" med versaler, då gement enda verkar två gånger, 210 00:16:21,260 --> 00:16:27,120 skulle vara en nod med 2 som dess värde, och sedan versaler S skulle bara vara en gång. 211 00:16:27,120 --> 00:16:33,440 Så då ditt träd skulle förändra strukturer eftersom du faktiskt har ett extra blad här. 212 00:16:33,440 --> 00:16:36,900 Men summan fortfarande skulle vara 10. 213 00:16:36,900 --> 00:16:39,570 Det är vad vi faktiskt kommer att vara ringa kontrollsumma, 214 00:16:39,570 --> 00:16:44,060 tillsats av samtliga räknas. 215 00:16:46,010 --> 00:16:50,990 >> Nu när vi har täckt Huffman träd, kan vi dyka in Huff'n Puff, den pset. 216 00:16:50,990 --> 00:16:52,900 Vi kommer att börja med en del av frågorna, 217 00:16:52,900 --> 00:16:57,990 och detta kommer att få dig van med binära träd och hur du använder runt det: 218 00:16:57,990 --> 00:17:03,230 ritning noder, skapa din egen typedef struct för en nod, 219 00:17:03,230 --> 00:17:07,230 och se hur du kan infoga i ett binärt träd, en som är sorterad, 220 00:17:07,230 --> 00:17:09,050 korsar den och sånt. 221 00:17:09,050 --> 00:17:14,560 Den kunskapen kommer definitivt att hjälpa dig när du dyker i Huff'n Puff delen 222 00:17:14,560 --> 00:17:17,089 av pset. 223 00:17:19,150 --> 00:17:26,329 I standardversionen av pset, är din uppgift att genomföra Puff, 224 00:17:26,329 --> 00:17:30,240 och i hacker versionen din uppgift är att genomföra Huff. 225 00:17:30,240 --> 00:17:38,490 Vad Huff gör är det tar text och sedan översätter det till 0 och 1, 226 00:17:38,490 --> 00:17:41,990 så den process som vi gjorde ovan där vi räknade frekvenserna 227 00:17:41,990 --> 00:17:50,970 och sedan gjorde trädet och sade sedan, "Hur får jag t?" 228 00:17:50,970 --> 00:17:54,840 T representeras av 100, saker, 229 00:17:54,840 --> 00:17:58,860 och sedan Huff skulle ta texten och sedan utgång som binär. 230 00:17:58,860 --> 00:18:04,920 Men också för att vi vet att vi vill att vår mottagare av meddelandet 231 00:18:04,920 --> 00:18:11,790 att återskapa exakt samma träd, innehåller den också information om frekvensen räknas. 232 00:18:11,790 --> 00:18:17,980 Sedan med Puff vi får en binär fil av 0 och 1 233 00:18:17,980 --> 00:18:21,740 och ges även information om frekvenserna. 234 00:18:21,740 --> 00:18:26,740 Vi översätter alla dessa 0 och 1 tillbaka till det ursprungliga meddelandet som var, 235 00:18:26,740 --> 00:18:29,350 så vi dekomprimering det. 236 00:18:29,350 --> 00:18:36,450 Om du gör det Standard Edition, behöver du inte genomföra Huff, 237 00:18:36,450 --> 00:18:39,290 så kan du bara använda den personal genomförandet av Huff. 238 00:18:39,290 --> 00:18:42,080 Det finns instruktioner i spec på hur man gör det. 239 00:18:42,080 --> 00:18:48,780 Du kan köra den personal genomförandet av Huff på en viss textfil 240 00:18:48,780 --> 00:18:53,270 och sedan använda denna utgång som din ingång till Puff. 241 00:18:53,270 --> 00:18:59,330 >> Som jag nämnde tidigare har vi en hel del utdelning kod för detta. 242 00:18:59,330 --> 00:19:01,810 Jag ska börja gå igenom den. 243 00:19:01,810 --> 00:19:04,400 Jag kommer att tillbringa större delen av tiden på. H-filer 244 00:19:04,400 --> 00:19:07,660 eftersom de. c-filer, eftersom vi har. h. 245 00:19:07,660 --> 00:19:11,650 och som ger oss med prototyper av de funktioner, 246 00:19:11,650 --> 00:19:15,520 vi inte helt behöver förstå exakt - 247 00:19:15,520 --> 00:19:20,280 Om du inte förstår vad som händer i de. C filerna ska du inte oroa dig för mycket, 248 00:19:20,280 --> 00:19:23,600 men definitivt försöka att ta en titt, eftersom det kan ge några tips 249 00:19:23,600 --> 00:19:29,220 och det är bra att vänja sig att läsa andra människors kod. 250 00:19:38,940 --> 00:19:48,270 >> Titta på huffile.h, i kommentarerna den förklarar ett lager av abstraktion för Huffman-kodade filer. 251 00:19:48,270 --> 00:20:01,660 Om vi ​​går ner, ser vi att det är högst 256 tecken som vi kanske behöver koder för. 252 00:20:01,660 --> 00:20:05,480 Detta inkluderar alla bokstäver i alfabetet - versaler och gemener - 253 00:20:05,480 --> 00:20:08,250 och sedan symboler och siffror, etc. 254 00:20:08,250 --> 00:20:11,930 Så här har vi ett magiskt nummer som identifierar en Huffman-kodad fil. 255 00:20:11,930 --> 00:20:15,890 Inom en huffmankod de ska ha ett visst magiskt tal 256 00:20:15,890 --> 00:20:18,560 associerad med huvudet. 257 00:20:18,560 --> 00:20:21,110 Detta kan se ut som bara en slumpmässig magiskt nummer, 258 00:20:21,110 --> 00:20:27,160 men om du verkligen översätta det till ASCII, då stavar faktiskt ut Huff. 259 00:20:27,160 --> 00:20:34,290 Här har vi en struct för en Huffman-kodad fil. 260 00:20:34,290 --> 00:20:39,670 Det finns alla dessa egenskaper som en Huff fil. 261 00:20:39,670 --> 00:20:47,080 Sen här nere har vi rubriken för en Huff fil, så vi kallar det Huffeader 262 00:20:47,080 --> 00:20:50,810 stället för att lägga den extra h eftersom det låter lika ändå. 263 00:20:50,810 --> 00:20:52,720 Söt. 264 00:20:52,720 --> 00:20:57,790 Vi har ett magiskt nummer associerade med den. 265 00:20:57,790 --> 00:21:09,040 Om det är en verklig Huff fil, kommer det att vara nummer upp ovan denna magiska en. 266 00:21:09,040 --> 00:21:14,720 Och så kommer det att ha en array. 267 00:21:14,720 --> 00:21:18,750 Så för varje symbol, av vilka det finns 256, 268 00:21:18,750 --> 00:21:24,760 det kommer att lista vad Frekvensen av dessa symboler inom Huff filen. 269 00:21:24,760 --> 00:21:28,090 Och slutligen har vi en kontrollsumma för frekvenserna, 270 00:21:28,090 --> 00:21:32,160 som bör vara summan av dessa frekvenser. 271 00:21:32,160 --> 00:21:36,520 Så det är vad en Huffeader är. 272 00:21:36,520 --> 00:21:44,600 Sedan har vi några funktioner som returnerar nästa bit i Huff filen 273 00:21:44,600 --> 00:21:52,580 samt skriver lite till Huff filen och sedan denna funktion här,, hfclose 274 00:21:52,580 --> 00:21:54,650 som stänger faktiskt Huff filen. 275 00:21:54,650 --> 00:21:57,290 Förut var vi att göra med rakt bara fclose, 276 00:21:57,290 --> 00:22:01,190 men när du har en Huff fil, i stället för att fclosing det 277 00:22:01,190 --> 00:22:06,080 vad du egentligen ska göra är hfclose och hfopen det. 278 00:22:06,080 --> 00:22:13,220 De är specifika funktioner till Huff filer som vi kommer att ha att göra med. 279 00:22:13,220 --> 00:22:19,230 Så här vi läser i huvudet och sedan skriva rubriken. 280 00:22:19,230 --> 00:22:25,700 >> Bara genom att läsa. H. filen kan vi slags få en känsla för vad en Huff fil kan vara, 281 00:22:25,700 --> 00:22:32,480 vilka egenskaper den har, utan att faktiskt gå in i huffile.c, 282 00:22:32,480 --> 00:22:36,750 som, om vi dyka i, kommer att vara lite mer komplicerat. 283 00:22:36,750 --> 00:22:41,270 Den har alla de I / O-här behandlar pekare. 284 00:22:41,270 --> 00:22:48,010 Här ser vi att när vi kallar hfread till exempel, det är fortfarande arbetar med fread. 285 00:22:48,010 --> 00:22:53,050 Vi ska inte bli av med dessa funktioner helt, men vi skickar dem tas om hand 286 00:22:53,050 --> 00:22:59,760 inuti Huff fil i stället för att göra allt det själva. 287 00:22:59,760 --> 00:23:02,300 Du kan gärna söka igenom detta om du är nyfiken 288 00:23:02,300 --> 00:23:08,410 och gå och skala lagret tillbaka lite. 289 00:23:20,650 --> 00:23:24,060 >> Nästa fil som vi kommer att titta på är tree.h. 290 00:23:24,060 --> 00:23:30,210 Tidigare i Walkthrough glider vi sagt att vi förväntar oss en Huffman nod 291 00:23:30,210 --> 00:23:32,960 och vi gjorde en typedef struct nod. 292 00:23:32,960 --> 00:23:38,360 Vi räknar med att ha en symbol, en frekvens, och sedan 2 stjärnor noden. 293 00:23:38,360 --> 00:23:41,870 I det här fallet vad vi gör är att detta är i stort sett samma 294 00:23:41,870 --> 00:23:46,880 utom i stället för nod ska vi kalla dem träd. 295 00:23:48,790 --> 00:23:56,760 Vi har en funktion som när du ringer gör träd returneras dig ett träd pekare. 296 00:23:56,760 --> 00:24:03,450 Tillbaka till Speller, när du gör en ny nod 297 00:24:03,450 --> 00:24:11,410 du sa nod * nytt ord = malloc (sizeof) och sådana saker. 298 00:24:11,410 --> 00:24:17,510 I grund och botten är mktree kommer att ha att göra med det för dig. 299 00:24:17,510 --> 00:24:20,990 Likaså när du vill ta bort ett träd, 300 00:24:20,990 --> 00:24:24,810 så som i huvudsak är att befria trädet när du är klar med det, 301 00:24:24,810 --> 00:24:33,790 i stället för att uttryckligen kalla fritt på det, är du faktiskt bara att använda funktionen rmtree 302 00:24:33,790 --> 00:24:40,360 där du passerar i pekaren till det trädet och sedan tree.c tar hand om det åt dig. 303 00:24:40,360 --> 00:24:42,490 >> Vi ser på tree.c. 304 00:24:42,490 --> 00:24:47,240 Vi förväntar oss samma funktioner förutom att se genomförandet också. 305 00:24:47,240 --> 00:24:57,720 Som vi väntat, när du ringer mktree det mallocs storleken av ett träd i en pekare, 306 00:24:57,720 --> 00:25:03,190 initierar alla värden till det NULL värde, så 0s eller nollor, 307 00:25:03,190 --> 00:25:08,280 och återgår sedan pekaren till det trädet som du bara har malloc'd till dig. 308 00:25:08,280 --> 00:25:13,340 Här när du ringer bort träd det gör först kontrollera att du inte dubbla är att befria. 309 00:25:13,340 --> 00:25:18,320 Det ser till att du faktiskt har ett träd som du vill ta bort. 310 00:25:18,320 --> 00:25:23,330 Här eftersom ett träd innefattar även dess barn, 311 00:25:23,330 --> 00:25:29,560 Vad detta innebär är man kallar rekursivt ta bort träd på vänster nod i trädet 312 00:25:29,560 --> 00:25:31,650 liksom rätt noden. 313 00:25:31,650 --> 00:25:37,790 Innan det frigör förälder måste det frigöra barnen också. 314 00:25:37,790 --> 00:25:42,770 Moderbolaget är även utbytbar med root. 315 00:25:42,770 --> 00:25:46,500 Den första föräldern, så som den store-store-store-store-farfar 316 00:25:46,500 --> 00:25:52,130 eller mormor träd, först måste vi frigöra ner nivåerna först. 317 00:25:52,130 --> 00:25:58,490 Så korsar till botten, fri dem, och sedan komma tillbaka upp, utan dem, etc. 318 00:26:00,400 --> 00:26:02,210 Så det är trädet. 319 00:26:02,210 --> 00:26:04,240 >> Nu tittar vi på skogen. 320 00:26:04,240 --> 00:26:09,860 Forest är där du placerar alla dina Huffman träd. 321 00:26:09,860 --> 00:26:12,910 Det säger att vi kommer att ha något som kallas en tomt 322 00:26:12,910 --> 00:26:22,320 som innehåller en pekare till ett träd och en pekare till en tomt som kallas nästa. 323 00:26:22,320 --> 00:26:28,480 Vilken struktur gör denna typ av ut? 324 00:26:29,870 --> 00:26:32,490 Det slags säger där borta. 325 00:26:34,640 --> 00:26:36,700 Här borta. 326 00:26:37,340 --> 00:26:39,170 En länkad lista. 327 00:26:39,170 --> 00:26:44,590 Vi ser att när vi har en tomt är det som en länkad lista av tomter. 328 00:26:44,590 --> 00:26:53,020 En skog definieras som en länkad lista av tomter, 329 00:26:53,020 --> 00:26:58,100 och så struktur skogen är vi bara kommer att ha en pekare till vår första tomten 330 00:26:58,100 --> 00:27:02,740 och att tomten har ett träd i den, eller snarare pekar på ett träd 331 00:27:02,740 --> 00:27:06,190 och sedan pekar på nästa tomt, så vidare och så vidare. 332 00:27:06,190 --> 00:27:11,100 För att göra en skog som vi kallar mkforest. 333 00:27:11,100 --> 00:27:14,930 Sedan har vi några ganska användbara funktioner här. 334 00:27:14,930 --> 00:27:23,240 Vi har plocka där du passerar i en skog och sedan returvärdet är ett träd *, 335 00:27:23,240 --> 00:27:25,210 en pekare till ett träd. 336 00:27:25,210 --> 00:27:29,370 Hur pick gör det kommer att gå in i skogen som du pekar på 337 00:27:29,370 --> 00:27:35,240 sedan bort ett träd med den lägsta frekvensen från skogen 338 00:27:35,240 --> 00:27:38,330 och sedan ge dig pekaren till det trädet. 339 00:27:38,330 --> 00:27:43,030 När du ringer plocka, kommer trädet finns inte i skogen längre, 340 00:27:43,030 --> 00:27:48,550 men returvärdet är pekaren till det trädet. 341 00:27:48,550 --> 00:27:50,730 Då har du växt. 342 00:27:50,730 --> 00:27:57,420 Förutsatt att du skickar in en pekare till ett träd som har en icke-0 frekvens, 343 00:27:57,420 --> 00:28:04,040 hur anläggningen kommer att göra är det kommer att ta skogen, ta trädet, och plantera det trädet inne i skogen. 344 00:28:04,040 --> 00:28:06,370 Här har vi rmforest. 345 00:28:06,370 --> 00:28:11,480 I likhet med avlägsna träd, som i princip befriade alla våra träd för oss, 346 00:28:11,480 --> 00:28:16,600 ta bort skog kommer fri allt som står i skogen. 347 00:28:16,600 --> 00:28:24,890 >> Om vi ​​tittar på forest.c, vi förväntar oss att se minst 1 rmtree kommando där, 348 00:28:24,890 --> 00:28:30,090 eftersom att frigöra minne i skogen om en skog har träd i den, 349 00:28:30,090 --> 00:28:32,930 så småningom du kommer att behöva ta bort dessa träd också. 350 00:28:32,930 --> 00:28:41,020 Om vi ​​tittar på forest.c har vi vår mkforest, vilket är som vi förväntar oss. 351 00:28:41,020 --> 00:28:42,890 Vi malloc saker. 352 00:28:42,890 --> 00:28:51,740 Vi initiera den första tomten i skogen som NULL eftersom det är tomt till att börja med, 353 00:28:51,740 --> 00:29:05,940 då ser vi plocka, som returnerar trädet med den lägsta vikten, den lägsta frekvensen, 354 00:29:05,940 --> 00:29:13,560 och sedan gör sig av just nod som pekar på att trädet och nästa en, 355 00:29:13,560 --> 00:29:16,760 så det tar att av den länkade listan av skogen. 356 00:29:16,760 --> 00:29:24,510 Och så här har vi växt, som infogar ett träd i den länkade listan. 357 00:29:24,510 --> 00:29:29,960 Vilken skog gör är det snyggt håller det sorteras för oss. 358 00:29:29,960 --> 00:29:37,910 Och slutligen har vi rmforest och som väntat har vi rmtree kallas där. 359 00:29:46,650 --> 00:29:55,440 >> Man tittar på fördelningen koden så långt var huffile.c förmodligen den absolut svåraste att förstå, 360 00:29:55,440 --> 00:29:59,990 medan de andra filerna själva var ganska enkla att följa. 361 00:29:59,990 --> 00:30:03,090 Med vår kunskap om pekare och länkade listor och sådant, 362 00:30:03,090 --> 00:30:04,860 vi kunde följa ganska bra. 363 00:30:04,860 --> 00:30:10,500 Men allt vi behöver verkligen se till att vi förstår är det. H-filer 364 00:30:10,500 --> 00:30:15,840 eftersom du måste ringa dessa funktioner, som handlar om de returvärden, 365 00:30:15,840 --> 00:30:20,590 så se till att du till fullo förstår vilka åtgärder kommer att genomföras 366 00:30:20,590 --> 00:30:24,290 när du ringer ett av dessa funktioner. 367 00:30:24,290 --> 00:30:33,020 Men egentligen förstå inuti det inte helt nödvändigt eftersom vi har dem. H-filer. 368 00:30:35,170 --> 00:30:39,490 Vi har 2 fler filer kvar i vår distribution kod. 369 00:30:39,490 --> 00:30:41,640 >> Låt oss titta på soptippen. 370 00:30:41,640 --> 00:30:47,230 Dumpa genom sin kommentar här tar Huffman-komprimerad fil 371 00:30:47,230 --> 00:30:55,580 och sedan översätter och dumpar allt innehåll ut. 372 00:31:01,010 --> 00:31:04,260 Här ser vi att det ringer hfopen. 373 00:31:04,260 --> 00:31:10,770 Detta är typ av spegling att lämna * ingång = fopen, 374 00:31:10,770 --> 00:31:13,500 och då du passerar i informationen. 375 00:31:13,500 --> 00:31:18,240 Det är nästan identiska med undantag istället för en fil * du passerar en Huffile, 376 00:31:18,240 --> 00:31:22,030 istället för fopen du passerar i hfopen. 377 00:31:22,030 --> 00:31:29,280 Här läser vi i huvudet först, vilket är typ av liknar hur vi läser i huvudet 378 00:31:29,280 --> 00:31:33,580 för en bitmappsfil. 379 00:31:33,580 --> 00:31:38,000 Vad vi gör här är att kontrollera för att se om rubrikinformationen 380 00:31:38,000 --> 00:31:44,330 innehåller rätt magiska nummer som anger att det är en verklig Huff fil, 381 00:31:44,330 --> 00:31:53,610 då alla dessa kontroller för att se till att filen som vi öppen är en verklig blåste fil eller inte. 382 00:31:53,610 --> 00:32:05,330 Vad detta innebär är det matar frekvenserna för alla de symboler som vi kan se 383 00:32:05,330 --> 00:32:09,790 inom en terminal i en grafisk tabell. 384 00:32:09,790 --> 00:32:15,240 Denna del kommer att vara användbar. 385 00:32:15,240 --> 00:32:24,680 Den har en lite och läser bit för bit in i variabel bit och sedan skriver ut det. 386 00:32:28,220 --> 00:32:35,430 Så om jag skulle kalla dump den hth.bin, som är resultatet av huffing en fil 387 00:32:35,430 --> 00:32:39,490 med personal lösningen, skulle jag få detta. 388 00:32:39,490 --> 00:32:46,000 Det mata alla dessa tecken och sedan sätta den frekvens med vilken de visas. 389 00:32:46,000 --> 00:32:51,180 Om vi ​​ser, de flesta av dem är 0s förutom detta: H, som visas två gånger, 390 00:32:51,180 --> 00:32:54,820 och sedan T, som visas en gång. 391 00:32:54,820 --> 00:33:07,860 Och så här har vi själva meddelandet i 0 och 1. 392 00:33:07,860 --> 00:33:15,450 Om vi ​​tittar på hth.txt, vilket förmodligen det ursprungliga meddelandet som blåste, 393 00:33:15,450 --> 00:33:22,490 Vi förväntar oss att se några Hs och Ts där. 394 00:33:22,490 --> 00:33:28,720 Specifikt förväntar vi oss att se bara 1 T och 2 HS. 395 00:33:32,510 --> 00:33:37,440 Här är vi i hth.txt. Det har verkligen HTH. 396 00:33:37,440 --> 00:33:41,270 Ingår i det, även om vi inte kan se det, är ett radmatningstecken. 397 00:33:41,270 --> 00:33:53,190 Den Huff Filen hth.bin också kodar för nyradstecken också. 398 00:33:55,680 --> 00:34:01,330 Här eftersom vi vet att ordern är HTH och sedan nyrad, 399 00:34:01,330 --> 00:34:07,340 kan vi se att förmodligen H representeras av bara en enda 1 400 00:34:07,340 --> 00:34:17,120 och då T är troligen 01 och sedan nästa H är 1 samt 401 00:34:17,120 --> 00:34:21,139 och sedan har vi en nyrad anges med två 0s. 402 00:34:22,420 --> 00:34:24,280 Cool. 403 00:34:26,530 --> 00:34:31,600 >> Och slutligen, eftersom vi har att göra med flera. C och. H-filer, 404 00:34:31,600 --> 00:34:36,350 vi kommer att ha en ganska komplex argument till kompilatorn, 405 00:34:36,350 --> 00:34:40,460 och så här har vi en Makefile som gör dumpa dig. 406 00:34:40,460 --> 00:34:47,070 Men faktiskt, måste du gå om att göra din egen puff.c fil. 407 00:34:47,070 --> 00:34:54,330 Makefile faktiskt inte behandlar göra puff.c för dig. 408 00:34:54,330 --> 00:34:59,310 Vi lämnar det upp till dig att redigera Makefile. 409 00:34:59,310 --> 00:35:05,930 När du anger ett kommando som gör allt, till exempel, kommer det att göra dem alla till dig. 410 00:35:05,930 --> 00:35:10,760 Känn dig fri att titta på exempel på Makefile från tidigare pset 411 00:35:10,760 --> 00:35:17,400 liksom att gå bort av denna för att se hur du skulle kunna göra ditt Puff fil 412 00:35:17,400 --> 00:35:20,260 genom att redigera den här Makefile. 413 00:35:20,260 --> 00:35:22,730 Det är ungefär det för vår distribution kod. 414 00:35:22,730 --> 00:35:28,380 >> När vi har fått igenom det, så här är bara en påminnelse 415 00:35:28,380 --> 00:35:30,980 hur vi ska ha att göra med Huffman noderna. 416 00:35:30,980 --> 00:35:35,400 Vi kommer inte att kalla dem noder längre, vi kommer att kalla dem träd 417 00:35:35,400 --> 00:35:39,260 där vi kommer att representera sin symbol med en röding, 418 00:35:39,260 --> 00:35:43,340 deras frekvens, antalet förekomster, med ett heltal. 419 00:35:43,340 --> 00:35:47,370 Vi använder det för att det är mer exakt än en flottör. 420 00:35:47,370 --> 00:35:52,980 Och då vi har en annan pekaren till vänster barnet samt rätt barn. 421 00:35:52,980 --> 00:35:59,630 En skog, som vi såg, är bara en länkad lista av träd. 422 00:35:59,630 --> 00:36:04,670 I slutändan, när vi bygger upp vår Huff fil, 423 00:36:04,670 --> 00:36:07,580 Vi vill att vår skog ska innehålla bara 1 träd - 424 00:36:07,580 --> 00:36:12,420 1 träd, 1 rot med flera barn. 425 00:36:12,420 --> 00:36:20,840 Tidigare när vi bara göra våra Huffman träd, 426 00:36:20,840 --> 00:36:25,360 Vi började genom att placera alla noder på vår skärm 427 00:36:25,360 --> 00:36:27,790 och säger att vi ska ha dessa noder, 428 00:36:27,790 --> 00:36:32,920 Så småningom ska bli bladen, och detta är deras symbol, det är deras frekvens. 429 00:36:32,920 --> 00:36:42,070 I vår skog om vi bara har 3 bokstäver, det är en skog av 3 träd. 430 00:36:42,070 --> 00:36:45,150 Och sedan när vi går på, när vi lagt den första föräldern, 431 00:36:45,150 --> 00:36:48,080 Vi gjorde en skog av 2 träd. 432 00:36:48,080 --> 00:36:54,930 Vi bort 2 av dessa barn från vår skog och ersatt det med en förälder nod 433 00:36:54,930 --> 00:36:58,820 som hade de 2 noder som barn. 434 00:36:58,820 --> 00:37:05,600 Och sedan slutligen, vår sista steget med att göra vårt exempel med As, B, och Cs 435 00:37:05,600 --> 00:37:08,030 skulle vara att göra det slutliga moderbolaget, 436 00:37:08,030 --> 00:37:13,190 och så då skulle föra vår totala räkningen på träd i skogen till 1. 437 00:37:13,190 --> 00:37:18,140 Ser alla hur du börjar med flera träd i skogen 438 00:37:18,140 --> 00:37:22,520 och sluta med 1? Okej. Cool. 439 00:37:25,530 --> 00:37:28,110 >> Vad behöver vi göra för Puff? 440 00:37:28,110 --> 00:37:37,110 Vad vi behöver göra är att se till att, som alltid, de ger oss rätt typ av ingång 441 00:37:37,110 --> 00:37:39,090 så att vi verkligen kan köra programmet. 442 00:37:39,090 --> 00:37:43,130 I detta fall kommer att ge oss efter deras första kommandoradsargument 443 00:37:43,130 --> 00:37:53,440 2 mer: den fil som vi vill expandera och utgången där den uppackade filen. 444 00:37:53,440 --> 00:38:00,410 Men när vi ser till att de passerar oss i rätt mängd värden, 445 00:38:00,410 --> 00:38:05,820 Vi vill se till att ingången är en Huff fil eller inte. 446 00:38:05,820 --> 00:38:10,420 Och sedan när vi garantera att det är en Huff fil, så vi vill bygga vårt träd, 447 00:38:10,420 --> 00:38:20,940 bygga upp trädet så att det matchar trädet att den person som skickade meddelandet byggas. 448 00:38:20,940 --> 00:38:25,840 Sedan efter vi bygger trädet, då kan vi ta itu med 0 och 1 som de gått i, 449 00:38:25,840 --> 00:38:29,590 Följ dem längs vår träd eftersom det är identiskt, 450 00:38:29,590 --> 00:38:33,510 och sedan skriva det budskap, tolka bitarna tillbaka i tecken. 451 00:38:33,510 --> 00:38:35,880 Och sedan i slutet eftersom vi har att göra med pekare här, 452 00:38:35,880 --> 00:38:38,110 Vi vill se till att vi inte har några minnesläckor 453 00:38:38,110 --> 00:38:41,330 och att vi gratis allt. 454 00:38:42,820 --> 00:38:46,430 >> Korrekt användning är gammal hatt för oss nu. 455 00:38:46,430 --> 00:38:51,980 Vi tar in en ingång, vilket kommer att bli namnet på filen att blåsa, 456 00:38:51,980 --> 00:38:56,010 och då vi anger en utgång, 457 00:38:56,010 --> 00:39:01,580 så namnet på filen för den puffade utmatning, som kommer att vara textfilen. 458 00:39:03,680 --> 00:39:08,820 Det är användningen. Och nu vill vi se till att ingången är huffed eller inte. 459 00:39:08,820 --> 00:39:16,420 Tänka tillbaka, var det något i distributionen kod som kan hjälpa oss 460 00:39:16,420 --> 00:39:21,570 med att förstå om en fil blåste eller inte? 461 00:39:21,570 --> 00:39:26,910 Det var information i huffile.c om Huffeader. 462 00:39:26,910 --> 00:39:33,430 Vi vet att varje Huff filen har en Huffeader i samband med det ett magiskt nummer 463 00:39:33,430 --> 00:39:37,240 såväl som en array av frekvenserna för varje symbol 464 00:39:37,240 --> 00:39:39,570 samt en kontrollsumma. 465 00:39:39,570 --> 00:39:43,180 Vi vet det, men vi tog också en titt på dump.c, 466 00:39:43,180 --> 00:39:49,120 där det läsa in en Huff fil. 467 00:39:49,120 --> 00:39:53,990 Och så för att göra det, måste den kontrollera om det verkligen var blåste eller inte. 468 00:39:53,990 --> 00:40:03,380 Så kanske vi kunde använda dump.c som en struktur för vår puff.c. 469 00:40:03,380 --> 00:40:12,680 Tillbaka till pset 4 när vi hade filen copy.c som kopieras i RGB tripplar 470 00:40:12,680 --> 00:40:14,860 och vi tolkade det för DECKARE och ändra storlek, 471 00:40:14,860 --> 00:40:20,390 liknande, vad du kan göra bara köra kommandot som cp dump.c puff.c 472 00:40:20,390 --> 00:40:23,600 och använda en del av koden där. 473 00:40:23,600 --> 00:40:28,210 Men, det kommer inte att vara så enkelt för en process 474 00:40:28,210 --> 00:40:33,010 för översättning din dump.c till puff.c, 475 00:40:33,010 --> 00:40:36,160 men åtminstone det ger dig någonstans att börja 476 00:40:36,160 --> 00:40:40,540 om hur man kan säkerställa att ingången faktiskt blåste eller inte 477 00:40:40,540 --> 00:40:43,240 liksom några andra saker. 478 00:40:45,930 --> 00:40:50,250 Vi har säkerställt korrekt användning och se till att ingången är huffed. 479 00:40:50,250 --> 00:40:53,570 Varje gång vi har gjort att vi har gjort vårt rätta felkontroll, 480 00:40:53,570 --> 00:41:01,520 så tillbaka och avsluta funktionen om något fel uppstår, om det finns ett problem. 481 00:41:01,520 --> 00:41:07,170 >> Nu vad vi vill göra är att bygga själva trädet. 482 00:41:08,840 --> 00:41:12,640 Om vi ​​tittar i Forest finns 2 huvudfunktioner 483 00:41:12,640 --> 00:41:15,800 att vi kommer att vilja bli väl förtrogen med. 484 00:41:15,800 --> 00:41:23,870 Det är den booleska funktionen växt som växter en icke-0 frekvens träd inne vår skog. 485 00:41:23,870 --> 00:41:29,250 Och så det du skickar i en pekare till en skog och en pekare till ett träd. 486 00:41:32,530 --> 00:41:40,340 Snabb fråga: Hur många skogar har du när du bygger en Huffman träd? 487 00:41:44,210 --> 00:41:46,650 Vår skog är som vår duk, eller hur? 488 00:41:46,650 --> 00:41:50,800 Så vi bara kommer att ha 1 skog, men vi kommer att ha flera träd. 489 00:41:50,800 --> 00:41:57,590 Så innan du ringer växt, du kommer förmodligen att vilja göra din skog. 490 00:41:57,590 --> 00:42:04,430 Det finns ett kommando för att om du tittar in forest.h på hur du kan göra en skog. 491 00:42:04,430 --> 00:42:09,270 Du kan plantera ett träd. Vi vet hur man gör det. 492 00:42:09,270 --> 00:42:11,590 Och då kan du också välja ett träd från skogen, 493 00:42:11,590 --> 00:42:17,540 bort ett träd med den lägsta vikt och ger dig pekaren till det. 494 00:42:17,540 --> 00:42:23,090 Tänker tillbaka på när vi gjorde de exempel själva, 495 00:42:23,090 --> 00:42:27,980 när vi drar ut, vi helt enkelt bara lagt till länkar. 496 00:42:27,980 --> 00:42:31,680 Men här i stället för att bara lägga länkarna, 497 00:42:31,680 --> 00:42:40,630 tänka på det mer som du tar bort 2 av dessa noder och sedan ersätta den med en annan. 498 00:42:40,630 --> 00:42:44,200 För att uttrycka det i termer av att plocka och plantera, 499 00:42:44,200 --> 00:42:48,840 du plockar 2 träd och sedan plantera ett annat träd 500 00:42:48,840 --> 00:42:54,060 som har de 2 träd som du plockat som barn. 501 00:42:57,950 --> 00:43:05,280 Att bygga Huffman s träd, kan du läsa i symboler och frekvenser för 502 00:43:05,280 --> 00:43:10,790 eftersom Huffeader ger det till dig, 503 00:43:10,790 --> 00:43:14,250 ger dig en rad av frekvenserna. 504 00:43:14,250 --> 00:43:19,660 Så du kan gå vidare och bara ignorera något med 0 i det 505 00:43:19,660 --> 00:43:23,760 eftersom vi inte vill 256 blad i slutet av den. 506 00:43:23,760 --> 00:43:27,960 Vi vill bara antalet blad som är tecken 507 00:43:27,960 --> 00:43:31,600 som faktiskt används i filen. 508 00:43:31,600 --> 00:43:37,590 Du kan läsa i dessa symboler, och var och en av dessa symboler som har icke-0 frekvenser, 509 00:43:37,590 --> 00:43:40,440 de kommer att bli träd. 510 00:43:40,440 --> 00:43:45,990 Vad du kan göra är varje gång du läser i en icke-0 frekvens symbol, 511 00:43:45,990 --> 00:43:50,660 du kan plantera det där trädet i skogen. 512 00:43:50,660 --> 00:43:56,620 När du plantera träden i skogen, kan du gå med dessa träd som syskon, 513 00:43:56,620 --> 00:44:01,130 så gå tillbaka till plantering och plocka där du väljer 2 och sedan växt 1, 514 00:44:01,130 --> 00:44:05,820 om detta 1 att du planterar är förälder till de 2 barnen som du plockat. 515 00:44:05,820 --> 00:44:11,160 Så då din slutresultatet kommer att bli ett enda träd i skogen. 516 00:44:16,180 --> 00:44:18,170 Det är hur du bygger ditt träd. 517 00:44:18,170 --> 00:44:21,850 >> Det finns flera saker som kan gå fel här 518 00:44:21,850 --> 00:44:26,580 eftersom vi har att göra med att göra nya träd och hantera pekare och sånt. 519 00:44:26,580 --> 00:44:30,450 Innan när vi hade att göra med pekare, 520 00:44:30,450 --> 00:44:36,580 när vi malloc'd vi ville se till att det inte returnera oss en NULL-pekare värde. 521 00:44:36,580 --> 00:44:42,770 Så vid flera steg i denna process det kommer att bli flera fall 522 00:44:42,770 --> 00:44:45,920 där ditt program kan misslyckas. 523 00:44:45,920 --> 00:44:51,310 Vad du vill göra är att du vill vara säker på att du hanterar dessa fel, 524 00:44:51,310 --> 00:44:54,580 och i spec står att hantera dem graciöst, 525 00:44:54,580 --> 00:45:00,280 så vill skriva ut ett meddelande till användaren berätta varför programmet måste sluta 526 00:45:00,280 --> 00:45:03,050 och sedan omgående avsluta det. 527 00:45:03,050 --> 00:45:09,490 För att göra detta felhantering, kom ihåg att du vill kontrollera den 528 00:45:09,490 --> 00:45:12,160 varje gång att det kan finnas ett fel. 529 00:45:12,160 --> 00:45:14,660 Varenda gång du gör en ny pekare 530 00:45:14,660 --> 00:45:17,040 du vill vara säker på att det är framgångsrikt. 531 00:45:17,040 --> 00:45:20,320 Innan vad vi brukade göra är att göra en ny pekare och malloc det, 532 00:45:20,320 --> 00:45:22,380 och då skulle vi kontrollera huruvida pekaren är NULL. 533 00:45:22,380 --> 00:45:25,670 Så det kommer att bli några fall där du bara kan göra det, 534 00:45:25,670 --> 00:45:28,610 men ibland du faktiskt ringer en funktion 535 00:45:28,610 --> 00:45:33,100 och inom den funktionen, det är den som gör det mallocing. 536 00:45:33,100 --> 00:45:39,110 I så fall, om vi ser tillbaka till vissa funktioner i koden, 537 00:45:39,110 --> 00:45:42,260 några av dem är booleska funktioner. 538 00:45:42,260 --> 00:45:48,480 I det abstrakta fallet om vi har en boolesk funktion som kallas foo, 539 00:45:48,480 --> 00:45:54,580 I princip kan vi anta att förutom att göra allt foo gör, 540 00:45:54,580 --> 00:45:57,210 eftersom det är ett booleskt funktion returnerar det sant eller falskt - 541 00:45:57,210 --> 00:46:01,300 sant om det lyckas, falskt om inte. 542 00:46:01,300 --> 00:46:06,270 Så vi vill kontrollera om returvärdet av foo är sant eller falskt. 543 00:46:06,270 --> 00:46:10,400 Om det är falskt, det betyder att vi kommer att vilja skriva ut någon form av meddelande 544 00:46:10,400 --> 00:46:14,390 och avsluta programmet. 545 00:46:14,390 --> 00:46:18,530 Vad vi vill göra är att kontrollera returvärdet foo. 546 00:46:18,530 --> 00:46:23,310 Om foo returnerar false, då vi vet att vi stött på någon typ av fel 547 00:46:23,310 --> 00:46:25,110 och vi måste avsluta vårt program. 548 00:46:25,110 --> 00:46:35,600 Ett sätt att göra detta är att ha ett tillstånd där den faktiska funktionen i sig är ditt tillstånd. 549 00:46:35,600 --> 00:46:39,320 Säg foo tar i x. 550 00:46:39,320 --> 00:46:43,390 Vi kan ha som ett villkor om (foo (x)). 551 00:46:43,390 --> 00:46:50,900 I grund och botten innebär att om i slutet av köra foo den returnerar sant, 552 00:46:50,900 --> 00:46:57,390 då kan vi göra detta eftersom funktionen måste utvärdera foo 553 00:46:57,390 --> 00:47:00,500 För att utvärdera hela tillståndet. 554 00:47:00,500 --> 00:47:06,500 Så då det är hur du kan göra något om funktionen returnerar true och är framgångsrik. 555 00:47:06,500 --> 00:47:11,800 Men när du är felkontroll, vill du bara sluta om din funktion returnerar false. 556 00:47:11,800 --> 00:47:16,090 Vad du kan göra är att lägga bara en == falska eller bara lägga en smäll framför den 557 00:47:16,090 --> 00:47:21,010 och då har du if (! foo). 558 00:47:21,010 --> 00:47:29,540 I detta organ av detta villkor du skulle ha alla felhantering, 559 00:47:29,540 --> 00:47:36,940 så vill, "Kunde inte skapa detta träd" och sedan återvända 1 eller något liknande. 560 00:47:36,940 --> 00:47:43,340 Vad som gör, är dock att även om foo återvände falskt - 561 00:47:43,340 --> 00:47:46,980 Säg foo returnerar true. 562 00:47:46,980 --> 00:47:51,060 Då behöver du inte ringa foo igen. Det är en vanlig missuppfattning. 563 00:47:51,060 --> 00:47:54,730 Eftersom det var i ditt tillstånd, det redan utvärderats, 564 00:47:54,730 --> 00:47:59,430 så har du redan ett resultat om du använder gör träd eller något liknande 565 00:47:59,430 --> 00:48:01,840 eller växt eller plocka eller något. 566 00:48:01,840 --> 00:48:07,460 Det har redan detta värde. Det är redan körs. 567 00:48:07,460 --> 00:48:10,730 Så det är bra att använda booleska funktioner som villkoret 568 00:48:10,730 --> 00:48:13,890 eftersom om du faktiskt utföra kroppen av slingan, 569 00:48:13,890 --> 00:48:18,030 den utför funktionen ändå. 570 00:48:22,070 --> 00:48:27,330 >> Vår näst sista steget är att skriva meddelandet till filen. 571 00:48:27,330 --> 00:48:33,070 När vi bygga Huffman träd, och sedan skriva meddelandet till filen är ganska enkelt. 572 00:48:33,070 --> 00:48:39,260 Det är ganska enkelt nu att bara följa 0 och 1. 573 00:48:39,260 --> 00:48:45,480 Och så genom konvention vet vi att i en Huffman trädet 0s indikerar kvar 574 00:48:45,480 --> 00:48:48,360 och 1s anger rätt. 575 00:48:48,360 --> 00:48:53,540 Så då om du läser i bit för bit, varje gång du får en 0 576 00:48:53,540 --> 00:48:59,100 du följa den vänstra grenen, och sedan varje gång du läser i en 1 577 00:48:59,100 --> 00:49:02,100 du kommer att följa den rätta grenen. 578 00:49:02,100 --> 00:49:07,570 Och då du kommer att fortsätta tills du träffar ett löv 579 00:49:07,570 --> 00:49:11,550 eftersom bladen kommer att vara i slutet av grenarna. 580 00:49:11,550 --> 00:49:16,870 Hur kan vi berätta om vi har träffat en löv eller inte? 581 00:49:19,800 --> 00:49:21,690 Vi sa det innan. 582 00:49:21,690 --> 00:49:24,040 [Eleven] Om pekare är NULL. >> Ja. 583 00:49:24,040 --> 00:49:32,220 Vi kan berätta om vi har drabbats ett löv om pekare till både vänster och höger träd är NULL. 584 00:49:32,220 --> 00:49:34,110 Perfekt. 585 00:49:34,110 --> 00:49:40,320 Vi vet att vi vill läsa i bit för bit i vår Huff fil. 586 00:49:43,870 --> 00:49:51,220 Som vi såg tidigare i dump.c, är vad de gjorde de läser i bit för bit in i Huff filen 587 00:49:51,220 --> 00:49:54,560 och bara skrivas ut vad dessa bitar var. 588 00:49:54,560 --> 00:49:58,430 Vi kommer inte att göra det. Vi kommer att göra något som är lite mer komplicerat. 589 00:49:58,430 --> 00:50:03,620 Men vad vi kan göra är att vi kan ta det lite kod som läser in i lite. 590 00:50:03,620 --> 00:50:10,250 Här har vi heltalet bit representerar den aktuella biten som vi är på. 591 00:50:10,250 --> 00:50:15,520 Detta tar hand om iterera alla bitar i filen tills du träffar i slutet av filen. 592 00:50:15,520 --> 00:50:21,270 Baserat på det, då du kommer att vilja ha någon form av iterator 593 00:50:21,270 --> 00:50:26,760 att korsa ditt träd. 594 00:50:26,760 --> 00:50:31,460 Och sedan baserat på huruvida biten är 0 eller 1, 595 00:50:31,460 --> 00:50:36,920 du kommer att vilja antingen flytta den iterator till vänster eller flytta det åt höger 596 00:50:36,920 --> 00:50:44,080 ända tills du träffar ett löv, så hela vägen tills den nod som du är på 597 00:50:44,080 --> 00:50:48,260 pekar inte på några fler noder. 598 00:50:48,260 --> 00:50:54,300 Varför kan vi göra detta med en Huffman-fil, men inte morsekod? 599 00:50:54,300 --> 00:50:56,610 För i morsekod finns lite tvetydighet. 600 00:50:56,610 --> 00:51:04,440 Vi kan vara som, oh vänta, vi har träffat en bokstav på vägen, så kanske det här är vårt brev, 601 00:51:04,440 --> 00:51:08,150 medan om vi fortsatte bara lite längre, då skulle vi ha hit en annan bokstav. 602 00:51:08,150 --> 00:51:13,110 Men det kommer inte att hända i Huffman-kodning, 603 00:51:13,110 --> 00:51:17,540 så att vi kan lita på att det enda sättet att vi kommer att träffa ett tecken 604 00:51:17,540 --> 00:51:23,480 är om det nodens vänstra och högra barn är NULL. 605 00:51:28,280 --> 00:51:32,350 >> Slutligen vill vi frigöra alla våra minne. 606 00:51:32,350 --> 00:51:37,420 Vi vill både nära den Huff fil som vi har att göra med 607 00:51:37,420 --> 00:51:41,940 samt ta bort alla träd i vår skog. 608 00:51:41,940 --> 00:51:46,470 Baserat på din implementering, du kommer förmodligen att vilja ringa bort skog 609 00:51:46,470 --> 00:51:49,780 istället för att faktiskt gå igenom alla träden själv. 610 00:51:49,780 --> 00:51:53,430 Men om du gjort några tillfälliga träd, kommer du vill frigöra det. 611 00:51:53,430 --> 00:51:59,060 Du vet att din kod bäst, så du vet vart du fördela minne. 612 00:51:59,060 --> 00:52:04,330 Och så om du går in, börja med att även Styrning F'ing för malloc, 613 00:52:04,330 --> 00:52:08,330 se när du malloc och se till att du befria allt det 614 00:52:08,330 --> 00:52:10,190 men sedan bara gå igenom din kod, 615 00:52:10,190 --> 00:52:14,260 förstå var du kan ha allokerat minne. 616 00:52:14,260 --> 00:52:21,340 Brukar du kanske bara säga, "I slutet av en fil jag bara tänker ta bort skog på min skog," 617 00:52:21,340 --> 00:52:23,850 så i princip klart att minnet, fri att, 618 00:52:23,850 --> 00:52:28,310 "Och sedan jag kommer också att avsluta ärendet och sedan mitt program kommer att sluta." 619 00:52:28,310 --> 00:52:33,810 Men är det den enda gången som ditt program avslutas? 620 00:52:33,810 --> 00:52:37,880 Nej, eftersom det ibland kan ha varit ett misstag som hände. 621 00:52:37,880 --> 00:52:42,080 Kanske kunde vi inte öppna en fil eller vi kunde inte göra annat träd 622 00:52:42,080 --> 00:52:49,340 eller någon form av fel hände i minnesallokering processen och det återvände NULL. 623 00:52:49,340 --> 00:52:56,710 Ett fel inträffade och sedan vi återvände och sluta. 624 00:52:56,710 --> 00:53:02,040 Så då du vill vara säker på att en eventuell tid som ditt program kan sluta, 625 00:53:02,040 --> 00:53:06,980 du vill frigöra all din minne där. 626 00:53:06,980 --> 00:53:13,370 Det är inte bara kommer att vara i slutet av de viktigaste funktionen som du avslutar din kod. 627 00:53:13,370 --> 00:53:20,780 Du vill se tillbaka på alla instanser att din kod eventuellt kan återvända i förtid 628 00:53:20,780 --> 00:53:25,070 och sedan fri oavsett minne vettigt. 629 00:53:25,070 --> 00:53:30,830 Säg att du hade ringt göra skog och det återvände falskt. 630 00:53:30,830 --> 00:53:34,230 Så har du förmodligen inte kommer att behöva ta bort din skog 631 00:53:34,230 --> 00:53:37,080 eftersom du inte har en skog än. 632 00:53:37,080 --> 00:53:42,130 Men vid varje punkt i koden där du kan återvända i förtid 633 00:53:42,130 --> 00:53:46,160 du vill vara säker på att du frigör eventuell minne. 634 00:53:46,160 --> 00:53:50,020 >> Så när vi har att göra med att frigöra minne och har potentiella läckor, 635 00:53:50,020 --> 00:53:55,440 Vi vill inte bara använda vårt omdöme och vår logik 636 00:53:55,440 --> 00:54:01,850 men även använda Valgrind att avgöra om vi har befriat alla våra minne korrekt eller ej. 637 00:54:01,850 --> 00:54:09,460 Du kan antingen köra Valgrind på Puff och då måste man också ge det 638 00:54:09,460 --> 00:54:14,020 rätt antal kommandoradsargument med valgrind. 639 00:54:14,020 --> 00:54:18,100 Du kan köra det, men utgången är lite kryptiskt. 640 00:54:18,100 --> 00:54:21,630 Vi har fått lite van vid det med Speller, men vi behöver fortfarande lite mer hjälp, 641 00:54:21,630 --> 00:54:26,450 så då kör det med några fler flaggor som läckan-check = full, 642 00:54:26,450 --> 00:54:32,040 som förmodligen kommer att ge oss lite mer användbar utgången på Valgrind. 643 00:54:32,040 --> 00:54:39,040 >> Sedan en annan bra tips när du felsöker är skillnad kommandot. 644 00:54:39,040 --> 00:54:48,520 Du kan komma åt den personal genomförande av Huff, köra den på en textfil, 645 00:54:48,520 --> 00:54:55,400 och sedan mata den till en binär fil, en binär Huff fil, för att vara specifik. 646 00:54:55,400 --> 00:54:59,440 Sen om du kör din egen puff på den binär fil, 647 00:54:59,440 --> 00:55:03,950 då helst är din utmatade textfil kommer att vara identiska 648 00:55:03,950 --> 00:55:08,200 till den ursprungliga som du gått i. 649 00:55:08,200 --> 00:55:15,150 Här Jag använder hth.txt som exempel, och det är en talade om i din spec. 650 00:55:15,150 --> 00:55:21,040 Det är bokstavligen bara HTH och sedan en ny rad. 651 00:55:21,040 --> 00:55:30,970 Men definitivt gärna och du definitivt uppmuntras att använda längre exempel 652 00:55:30,970 --> 00:55:32,620 för din textfil. 653 00:55:32,620 --> 00:55:38,110 >> Du kan även ta ett skott på kanske komprimera och sedan dekomprimering 654 00:55:38,110 --> 00:55:41,600 några av de filer som du använde i Speller som Krig och fred 655 00:55:41,600 --> 00:55:46,710 eller Jane Austen eller något liknande - det skulle vara ganska häftigt - eller Austin Powers, 656 00:55:46,710 --> 00:55:51,880 typ att hantera större filer eftersom vi inte skulle komma ner till den 657 00:55:51,880 --> 00:55:55,590 om vi använde nästa verktyg här, ls-l. 658 00:55:55,590 --> 00:56:01,150 Vi är vana vid ls, som i princip visar alla innehållet i vår nuvarande katalog. 659 00:56:01,150 --> 00:56:07,860 Passerar i flaggan-l faktiskt visar storleken på dessa filer. 660 00:56:07,860 --> 00:56:12,690 Om du går igenom pset spec, går det faktiskt dig att skapa den binära filen, 661 00:56:12,690 --> 00:56:16,590 av huffing det, och du ser att för mycket små filer 662 00:56:16,590 --> 00:56:23,910 utrymme kostnaden att komprimera den och översätta all denna information 663 00:56:23,910 --> 00:56:26,980 av alla frekvenser och sånt som uppväger den faktiska nyttan 664 00:56:26,980 --> 00:56:30,000 att komprimera filen i första hand. 665 00:56:30,000 --> 00:56:37,450 Men om du kör det på några längre textfiler, så du kanske se att du börjar få lite nytta 666 00:56:37,450 --> 00:56:40,930 att komprimera dessa filer. 667 00:56:40,930 --> 00:56:46,210 >> Och slutligen har vi vår gamle vän GDB, som definitivt kommer att komma väl till pass också. 668 00:56:48,360 --> 00:56:55,320 >> Har vi några frågor om Huff träd eller processen kanske att göra träden 669 00:56:55,320 --> 00:56:58,590 eller några andra frågor om Huff'n Puff? 670 00:57:00,680 --> 00:57:02,570 Okej. Jag stannar runt för lite. 671 00:57:02,570 --> 00:57:06,570 >> Tack, alla. Detta var Genomgång 6. Och lycka till. 672 00:57:08,660 --> 00:57:10,000 >> [CS50.TV]