1 00:00:00,000 --> 00:00:02,210 [Powered by Google Translate] [Walkthrough - Masalah Set 6] 2 00:00:02,210 --> 00:00:04,810 [Zamyla Chan - Harvard University] 3 00:00:04,810 --> 00:00:07,240 [Ini adalah CS50. - CS50.TV] 4 00:00:07,240 --> 00:00:12,180 >> Halo, semua orang, dan selamat datang Walkthrough 6: Puff Huff'n. 5 00:00:12,180 --> 00:00:17,440 Dalam Puff Huff'n apa yang kita lakukan akan berurusan dengan file terkompresi Huffman 6 00:00:17,440 --> 00:00:20,740 dan kemudian terengah-engah kembali ke atas, sehingga dekompresi itu, 7 00:00:20,740 --> 00:00:25,810 sehingga kita dapat menerjemahkan dari yang 0s dan 1s pengguna mengirimkan kami 8 00:00:25,810 --> 00:00:30,660 dan mengubahnya kembali ke teks asli. 9 00:00:30,660 --> 00:00:34,360 Pset 6 akan menjadi cukup keren karena Anda akan melihat beberapa alat 10 00:00:34,360 --> 00:00:41,730 yang digunakan dalam pset 4 dan 5 pset dan jenis menggabungkan mereka ke dalam 1 konsep yang cukup rapi 11 00:00:41,730 --> 00:00:43,830 ketika Anda datang untuk berpikir tentang hal itu. 12 00:00:43,830 --> 00:00:50,110 >> Juga, bisa dibilang, pset 4 dan 5 adalah yang paling menantang psets bahwa kita harus tawarkan. 13 00:00:50,110 --> 00:00:53,950 Jadi mulai sekarang, kita memiliki pset 1 lebih di C, 14 00:00:53,950 --> 00:00:56,480 dan kemudian setelah itu kita akan melanjutkan ke pemrograman web. 15 00:00:56,480 --> 00:01:02,310 Jadi selamat dirimu untuk mendapatkan lebih dari punuk terberat dalam CS50. 16 00:01:03,630 --> 00:01:09,760 >> Pindah untuk Puff Huff'n, toolbox kami untuk pset ini akan menjadi pohon Huffman, 17 00:01:09,760 --> 00:01:14,700 sehingga pemahaman tidak hanya bekerja bagaimana biner pohon tetapi juga secara khusus Huffman pohon, 18 00:01:14,700 --> 00:01:16,240 bagaimana mereka dibangun. 19 00:01:16,240 --> 00:01:20,210 Dan kemudian kita akan memiliki banyak kode distribusi di pset ini, 20 00:01:20,210 --> 00:01:22,480 dan kami akan datang untuk melihat bahwa sebenarnya beberapa kode 21 00:01:22,480 --> 00:01:24,670 kita tidak mungkin bisa memahami lagi, 22 00:01:24,670 --> 00:01:30,080 sehingga mereka akan menjadi c file., tapi kemudian menyertainya h file. 23 00:01:30,080 --> 00:01:34,300 akan memberi kita cukup memahami bahwa kita butuhkan sehingga kita tahu bagaimana fungsi-fungsi bekerja 24 00:01:34,300 --> 00:01:38,100 atau setidaknya apa yang mereka lakukan - input dan output mereka - 25 00:01:38,100 --> 00:01:40,760 bahkan jika kita tidak tahu apa yang terjadi di kotak hitam 26 00:01:40,760 --> 00:01:44,090 atau tidak mengerti apa yang terjadi di dalam kotak hitam. 27 00:01:44,090 --> 00:01:49,400 Dan akhirnya, seperti biasa, kita berhadapan dengan struktur data baru, 28 00:01:49,400 --> 00:01:51,840 tipe tertentu dari node yang menunjuk ke hal-hal tertentu, 29 00:01:51,840 --> 00:01:56,080 dan jadi di sini memiliki pena dan kertas tidak hanya untuk proses desain 30 00:01:56,080 --> 00:01:58,470 dan ketika Anda mencoba untuk mencari tahu bagaimana pset Anda harus bekerja 31 00:01:58,470 --> 00:02:00,520 tetapi juga selama debugging. 32 00:02:00,520 --> 00:02:06,140 Anda dapat memiliki GDB bersama pena dan kertas saat Anda mencatat apa nilai-nilai yang, 33 00:02:06,140 --> 00:02:09,320 di mana panah yang menunjuk, dan hal-hal seperti itu. 34 00:02:09,320 --> 00:02:13,720 >> Pertama mari kita lihat pohon Huffman. 35 00:02:13,720 --> 00:02:19,600 Pohon Huffman adalah pohon biner, yang berarti bahwa setiap node hanya memiliki 2 anak. 36 00:02:19,600 --> 00:02:24,870 Dalam pohon Huffman karakteristik adalah bahwa nilai-nilai yang paling sering 37 00:02:24,870 --> 00:02:27,140 diwakili oleh bit paling sedikit. 38 00:02:27,140 --> 00:02:32,690 Kami melihat dalam contoh ceramah kode Morse, yang jenis konsolidasi beberapa surat. 39 00:02:32,690 --> 00:02:38,030 Jika Anda mencoba untuk menerjemahkan A atau E, misalnya, 40 00:02:38,030 --> 00:02:43,940 Anda menerjemahkan yang sering, jadi daripada harus menggunakan set lengkap bit 41 00:02:43,940 --> 00:02:48,640 dialokasikan untuk tipe data yang biasa, Anda kompres ke sedikit, 42 00:02:48,640 --> 00:02:53,730 dan kemudian surat-surat yang diwakili kurang sering diwakili dengan bit lebih lama 43 00:02:53,730 --> 00:02:59,840 karena Anda mampu bahwa ketika Anda menimbang frekuensi yang huruf tersebut akan ditampilkan. 44 00:02:59,840 --> 00:03:03,020 Kami memiliki ide yang sama di sini di pohon Huffman 45 00:03:03,020 --> 00:03:12,360 di mana kita membuat rantai, semacam jalan untuk sampai ke karakter tertentu. 46 00:03:12,360 --> 00:03:14,470 Dan kemudian karakter yang memiliki frekuensi yang paling 47 00:03:14,470 --> 00:03:17,940 akan diwakili dengan bit paling sedikit. 48 00:03:17,940 --> 00:03:22,020 >> Cara yang Anda membangun pohon Huffman 49 00:03:22,020 --> 00:03:27,430 adalah dengan menempatkan semua karakter yang muncul dalam teks 50 00:03:27,430 --> 00:03:30,630 dan menghitung frekuensi, seberapa sering mereka muncul. 51 00:03:30,630 --> 00:03:33,880 Ini bisa berupa hitungan berapa kali huruf tersebut akan ditampilkan 52 00:03:33,880 --> 00:03:40,270 atau mungkin persentase dari semua karakter berapa banyak masing-masing muncul. 53 00:03:40,270 --> 00:03:44,270 Dan jadi apa yang Anda lakukan adalah setelah Anda memiliki semua itu keluar dipetakan, 54 00:03:44,270 --> 00:03:49,060 maka Anda mencari 2 frekuensi terendah dan kemudian bergabung dengan mereka sebagai saudara kandung 55 00:03:49,060 --> 00:03:55,660 mana maka simpul orangtua memiliki frekuensi yang merupakan jumlah dari 2 anak nya. 56 00:03:55,660 --> 00:04:00,870 Dan kemudian Anda dengan konvensi mengatakan bahwa node kiri, 57 00:04:00,870 --> 00:04:03,770 Anda mengikuti bahwa dengan mengikuti cabang 0, 58 00:04:03,770 --> 00:04:08,140 dan kemudian simpul paling kanan adalah cabang 1. 59 00:04:08,140 --> 00:04:16,040 Seperti yang kita lihat dalam kode Morse, yang satu gotcha adalah bahwa jika Anda memiliki hanya bip bip dan 60 00:04:16,040 --> 00:04:18,120 itu ambigu. 61 00:04:18,120 --> 00:04:22,430 Ini bisa berupa 1 huruf atau bisa menjadi urutan 2 huruf. 62 00:04:22,430 --> 00:04:27,790 Dan jadi apa Huffman pohon dilakukan adalah karena dengan sifat karakter 63 00:04:27,790 --> 00:04:34,140 atau akhir kami yang sebenarnya karakter menjadi node terakhir pada cabang - 64 00:04:34,140 --> 00:04:39,300 kita merujuk kepada mereka sebagai daun - berdasarkan yang ada tidak bisa ambiguitas 65 00:04:39,300 --> 00:04:45,160 dalam hal mana surat Anda mencoba untuk mengkodekan dengan rangkaian bit 66 00:04:45,160 --> 00:04:50,670 karena tempat sepanjang bit yang mewakili 1 huruf 67 00:04:50,670 --> 00:04:55,960 akan Anda temui lagi seluruh surat, dan tidak akan ada kebingungan di sana. 68 00:04:55,960 --> 00:04:58,430 Tapi kita akan pergi ke contoh bahwa kalian benar-benar dapat melihat bahwa 69 00:04:58,430 --> 00:05:02,120 bukannya kita hanya mengatakan bahwa itu benar. 70 00:05:02,120 --> 00:05:06,390 >> Mari kita lihat contoh sederhana dari pohon Huffman. 71 00:05:06,390 --> 00:05:09,380 Aku punya string di sini yang 12 karakter. 72 00:05:09,380 --> 00:05:14,010 Saya memiliki 4 Seperti, 6 B, dan 2 Cs. 73 00:05:14,010 --> 00:05:17,270 Langkah pertama saya akan menghitung. 74 00:05:17,270 --> 00:05:20,760 Berapa kali A muncul? Tampaknya 4 kali dalam string. 75 00:05:20,760 --> 00:05:25,060 B muncul 6 kali, dan C muncul 2 kali. 76 00:05:25,060 --> 00:05:28,970 Tentu, aku akan mengatakan saya menggunakan B paling sering, 77 00:05:28,970 --> 00:05:35,970 jadi saya ingin mewakili B dengan jumlah paling sedikit bit, jumlah paling sedikit 0s dan 1s. 78 00:05:35,970 --> 00:05:42,600 Dan kemudian aku juga akan berharap C untuk meminta paling jumlah 0s dan 1s juga. 79 00:05:42,600 --> 00:05:48,550 Pertama apa yang saya lakukan di sini adalah saya menempatkan mereka dalam urutan dalam hal frekuensi. 80 00:05:48,550 --> 00:05:52,710 Kita melihat bahwa C dan A, mereka adalah 2 kami frekuensi terendah. 81 00:05:52,710 --> 00:06:00,290 Kami membuat simpul orangtua, dan simpul orangtua tidak memiliki surat yang terkait dengan itu, 82 00:06:00,290 --> 00:06:05,070 tetapi tidak memiliki frekuensi, yang merupakan penjumlahan. 83 00:06:05,070 --> 00:06:08,780 Jumlahnya menjadi 2 + 4, yaitu 6. 84 00:06:08,780 --> 00:06:10,800 Kemudian kita mengikuti cabang kiri. 85 00:06:10,800 --> 00:06:14,970 Jika kita berada di simpul 6, maka kita akan mengikuti 0 untuk sampai ke C 86 00:06:14,970 --> 00:06:17,450 dan kemudian 1 untuk sampai ke A. 87 00:06:17,450 --> 00:06:20,300 Jadi sekarang kita memiliki 2 node. 88 00:06:20,300 --> 00:06:23,920 Kami memiliki nilai 6 dan kemudian kita juga memiliki node lain dengan nilai 6. 89 00:06:23,920 --> 00:06:28,550 Dan sehingga mereka 2 tidak hanya 2 terendah tetapi juga hanya 2 yang tersisa, 90 00:06:28,550 --> 00:06:33,820 jadi kami bergabung dengan mereka oleh orang tua lain, dengan jumlah itu menjadi 12. 91 00:06:33,820 --> 00:06:36,300 Jadi di sini kita memiliki pohon Huffman kami 92 00:06:36,300 --> 00:06:40,020 di mana untuk sampai ke B, yang hanya akan menjadi bit 1 93 00:06:40,020 --> 00:06:45,430 dan kemudian untuk mendapatkan ke A kita akan memiliki 01 dan kemudian C memiliki 00. 94 00:06:45,430 --> 00:06:51,300 Jadi di sini kita melihat bahwa pada dasarnya kita mewakili karakter ini dengan baik 1 atau 2 bit 95 00:06:51,300 --> 00:06:55,160 di mana B, seperti yang diperkirakan, memiliki sedikit. 96 00:06:55,160 --> 00:07:01,730 Dan kemudian kami diharapkan C untuk memiliki paling, tapi karena itu seperti pohon kecil Huffman, 97 00:07:01,730 --> 00:07:06,020 maka A juga diwakili oleh 2 bit sebagai lawan suatu tempat di tengah. 98 00:07:07,820 --> 00:07:11,070 >> Hanya untuk pergi ke lain contoh sederhana pohon Huffman, 99 00:07:11,070 --> 00:07:19,570 Katakanlah Anda memiliki string "Hello." 100 00:07:19,570 --> 00:07:25,360 Apa yang Anda lakukan adalah pertama-tama Anda akan mengatakan berapa kali H muncul dalam hal ini? 101 00:07:25,360 --> 00:07:34,200 H muncul sekali dan kemudian e muncul sekali dan kemudian kita memiliki l muncul dua kali 102 00:07:34,200 --> 00:07:36,580 dan o muncul sekali. 103 00:07:36,580 --> 00:07:44,310 Dan begitu kemudian kita berharap yang surat untuk diwakili oleh sedikitnya jumlah bit? 104 00:07:44,310 --> 00:07:47,450 [Mahasiswa] l. >> L. Ya. l benar. 105 00:07:47,450 --> 00:07:50,730 Kami berharap l untuk diwakili oleh sedikitnya jumlah bit 106 00:07:50,730 --> 00:07:55,890 karena aku digunakan paling dalam string "Hello." 107 00:07:55,890 --> 00:08:04,280 Apa yang akan saya lakukan sekarang adalah menarik keluar node tersebut. 108 00:08:04,280 --> 00:08:15,580 Saya memiliki 1, yaitu H, dan kemudian lagi 1, yaitu e, dan kemudian 1, yaitu o - 109 00:08:15,580 --> 00:08:23,410 sekarang saya menempatkan mereka dalam rangka - dan kemudian 2, yaitu l. 110 00:08:23,410 --> 00:08:32,799 Lalu aku mengatakan cara yang saya membangun pohon Huffman adalah untuk menemukan 2 node dengan frekuensi paling 111 00:08:32,799 --> 00:08:38,010 dan membuat mereka saudara dengan membuat simpul orangtua. 112 00:08:38,010 --> 00:08:41,850 Di sini kita memiliki 3 node dengan frekuensi terendah. Mereka semua 1. 113 00:08:41,850 --> 00:08:50,620 Jadi di sini kita memilih mana yang kita akan menghubungkan terlebih dahulu. 114 00:08:50,620 --> 00:08:54,850 Katakanlah saya memilih H dan e. 115 00:08:54,850 --> 00:09:01,150 Jumlah 1 + 1 adalah 2, tapi node ini tidak memiliki surat yang terkait dengannya. 116 00:09:01,150 --> 00:09:04,440 Itu hanya memegang nilai. 117 00:09:04,440 --> 00:09:10,950 Sekarang kita melihat 2 frekuensi terendah berikutnya. 118 00:09:10,950 --> 00:09:15,590 Itu 2 dan 1. Itu bisa menjadi salah satu dari mereka 2, tapi aku akan memilih satu ini. 119 00:09:15,590 --> 00:09:18,800 Jumlahnya adalah 3. 120 00:09:18,800 --> 00:09:26,410 Dan akhirnya, saya hanya memiliki 2 kiri, sehingga kemudian yang menjadi 5. 121 00:09:26,410 --> 00:09:32,010 Maka di sini, seperti yang diharapkan, jika saya mengisi pengkodean untuk itu, 122 00:09:32,010 --> 00:09:37,480 1s selalu cabang kanan dan 0s adalah yang kiri. 123 00:09:37,480 --> 00:09:45,880 Lalu kami memiliki l diwakili oleh hanya 1 bit dan kemudian o oleh 2 124 00:09:45,880 --> 00:09:52,360 dan kemudian e oleh 2 dan kemudian H jatuh ke 3 bit. 125 00:09:52,360 --> 00:09:59,750 Jadi Anda dapat mengirimkan pesan ini "Hello" bukan benar-benar menggunakan karakter 126 00:09:59,750 --> 00:10:02,760 dengan hanya 0s dan 1s. 127 00:10:02,760 --> 00:10:07,910 Namun, ingat bahwa dalam beberapa kasus kita memiliki hubungan dengan frekuensi kami. 128 00:10:07,910 --> 00:10:11,900 Kita bisa bergabung dengan baik dan H o pertama mungkin. 129 00:10:11,900 --> 00:10:15,730 Atau kemudian ketika kami memiliki l diwakili oleh 2 130 00:10:15,730 --> 00:10:19,410 serta bergabung dengan salah satu diwakili oleh 2, kita bisa dikaitkan salah satu. 131 00:10:19,410 --> 00:10:23,630 >> Dan jadi ketika Anda mengirim 0s dan 1s, yang benar-benar tidak menjamin 132 00:10:23,630 --> 00:10:27,090 bahwa penerima sepenuhnya dapat membaca pesan Anda langsung dari kelelawar 133 00:10:27,090 --> 00:10:30,490 karena mereka mungkin tidak tahu mana keputusan yang Anda buat. 134 00:10:30,490 --> 00:10:34,920 Jadi ketika kita sedang berhadapan dengan kompresi Huffman, 135 00:10:34,920 --> 00:10:40,090 entah bagaimana kita harus memberitahu penerima pesan kita bagaimana kita memutuskan - 136 00:10:40,090 --> 00:10:43,470 Mereka perlu tahu beberapa jenis informasi tambahan 137 00:10:43,470 --> 00:10:46,580 di samping pesan terkompresi. 138 00:10:46,580 --> 00:10:51,490 Mereka perlu memahami apa pohon benar-benar tampak seperti, 139 00:10:51,490 --> 00:10:55,450 bagaimana kita benar-benar membuat keputusan tersebut. 140 00:10:55,450 --> 00:10:59,100 >> Di sini kami hanya melakukan contoh berdasarkan pada hitungan yang sebenarnya, 141 00:10:59,100 --> 00:11:01,550 tapi kadang-kadang Anda juga dapat memiliki pohon Huffman 142 00:11:01,550 --> 00:11:05,760 berdasarkan frekuensi di mana huruf muncul, dan itu adalah proses yang sama persis. 143 00:11:05,760 --> 00:11:09,090 Di sini aku mengungkapkan hal itu dalam hal persentase atau pecahan, 144 00:11:09,090 --> 00:11:11,290 dan jadi di sini hal yang sama. 145 00:11:11,290 --> 00:11:15,300 Saya menemukan 2 terendah, jumlah mereka, 2 terendah berikutnya, jumlah mereka, 146 00:11:15,300 --> 00:11:19,390 sampai aku memiliki pohon penuh. 147 00:11:19,390 --> 00:11:23,610 Meskipun kita bisa melakukannya baik cara, ketika kita sedang berhadapan dengan persentase, 148 00:11:23,610 --> 00:11:27,760 itu berarti kita membagi hal-hal dan berurusan dengan desimal atau lebih tepatnya mengapung 149 00:11:27,760 --> 00:11:30,900 kalau kita berpikir tentang struktur data dari kepala. 150 00:11:30,900 --> 00:11:32,540 Apa yang kita ketahui tentang mengapung? 151 00:11:32,540 --> 00:11:35,180 Apa masalah umum ketika kita sedang berhadapan dengan mengapung? 152 00:11:35,180 --> 00:11:38,600 [Mahasiswa] aritmatika tidak tepat. >> Ya. Ketidaktepatan. 153 00:11:38,600 --> 00:11:43,760 Karena ketidaktepatan floating point, untuk pset ini sehingga kita pastikan 154 00:11:43,760 --> 00:11:49,450 bahwa kita tidak kehilangan nilai-nilai, maka kita benar-benar akan berurusan dengan hitungan. 155 00:11:49,450 --> 00:11:54,880 Jadi jika Anda adalah untuk memikirkan simpul Huffman, jika Anda melihat kembali ke struktur di sini, 156 00:11:54,880 --> 00:12:01,740 jika Anda melihat yang hijau itu memiliki frekuensi yang terkait dengan itu 157 00:12:01,740 --> 00:12:08,760 serta merujuk ke node ke kiri serta node ke kanan. 158 00:12:08,760 --> 00:12:13,970 Dan kemudian yang merah ada juga memiliki karakter yang terkait dengan mereka. 159 00:12:13,970 --> 00:12:18,900 Kami tidak akan membuat yang terpisah untuk orang tua dan kemudian node akhir, 160 00:12:18,900 --> 00:12:23,680 yang kita sebut sebagai daun, melainkan mereka hanya akan memiliki nilai NULL. 161 00:12:23,680 --> 00:12:31,050 Untuk setiap node kita akan memiliki karakter, simbol bahwa node yang mewakili, 162 00:12:31,050 --> 00:12:40,490 maka frekuensi serta pointer ke anak kiri serta anak kanan. 163 00:12:40,490 --> 00:12:45,680 Daun, yang berada di bagian paling bawah, juga akan memiliki pointer simpul 164 00:12:45,680 --> 00:12:49,550 ke kiri dan ke kanan mereka, tapi karena nilai-nilai tersebut tidak menunjuk ke node yang sebenarnya, 165 00:12:49,550 --> 00:12:53,970 apa yang akan menjadi nilai mereka? >> [Mahasiswa] NULL. >> NULL. Tepat. 166 00:12:53,970 --> 00:12:58,430 Berikut adalah contoh bagaimana Anda mungkin mewakili frekuensi dalam mengapung, 167 00:12:58,430 --> 00:13:02,130 tapi kita akan berurusan dengan itu dengan bilangan bulat, 168 00:13:02,130 --> 00:13:06,780 jadi semua saya lakukan adalah mengubah jenis data yang ada. 169 00:13:06,780 --> 00:13:09,700 >> Mari kita pergi ke sedikit lebih dari contoh yang kompleks. 170 00:13:09,700 --> 00:13:13,360 Tapi sekarang bahwa kami telah melakukan yang sederhana, itu hanya proses yang sama. 171 00:13:13,360 --> 00:13:20,290 Anda menemukan 2 frekuensi terendah, jumlah frekuensi 172 00:13:20,290 --> 00:13:22,450 dan itulah frekuensi baru simpul orangtua Anda, 173 00:13:22,450 --> 00:13:29,310 yang kemudian menunjuk ke kiri dengan cabang 0 dan kanan dengan cabang 1. 174 00:13:29,310 --> 00:13:34,200 Jika kita memiliki string "Ini adalah cs50," maka kita menghitung berapa kali ini T disebutkan, 175 00:13:34,200 --> 00:13:38,420 h disebutkan, i, s, c, 5, 0. 176 00:13:38,420 --> 00:13:42,010 Lalu apa yang saya lakukan di sini adalah dengan node merah saya hanya ditanam, 177 00:13:42,010 --> 00:13:48,530 Aku bilang aku akan memiliki karakter ini akhirnya di bawah pohon saya. 178 00:13:48,530 --> 00:13:51,740 Bagi para akan semua daun. 179 00:13:51,740 --> 00:13:58,200 Lalu apa yang saya lakukan adalah saya diurutkan berdasarkan frekuensi mereka dalam urutan, 180 00:13:58,200 --> 00:14:02,950 dan ini sebenarnya adalah cara yang kode pset melakukannya 181 00:14:02,950 --> 00:14:07,550 itu macam dengan frekuensi dan kemudian abjad. 182 00:14:07,550 --> 00:14:13,870 Sehingga memiliki angka pertama dan kemudian menurut abjad frekuensi. 183 00:14:13,870 --> 00:14:18,520 Lalu apa yang akan saya lakukan adalah saya akan menemukan 2 terendah. Itulah 0 dan 5. 184 00:14:18,520 --> 00:14:22,390 Saya akan jumlah mereka, dan itu 2. Lalu aku akan terus, menemukan 2 terendah berikutnya. 185 00:14:22,390 --> 00:14:26,100 Mereka adalah 1s dua, dan kemudian orang-orang menjadi 2 juga. 186 00:14:26,100 --> 00:14:31,570 Sekarang aku tahu bahwa langkah berikutnya saya akan bergabung dengan angka terendah, 187 00:14:31,570 --> 00:14:41,380 yang merupakan T, 1, dan kemudian memilih salah satu node yang memiliki 2 sebagai frekuensi. 188 00:14:41,380 --> 00:14:44,560 Jadi di sini kita memiliki 3 pilihan. 189 00:14:44,560 --> 00:14:47,980 Apa yang akan saya lakukan untuk slide hanya visual mengatur ulang mereka untuk Anda 190 00:14:47,980 --> 00:14:51,790 sehingga Anda dapat melihat bagaimana saya membangun itu. 191 00:14:51,790 --> 00:14:59,040 Apa kode dan kode distribusi Anda akan melakukan akan bergabung dengan salah satu T 192 00:14:59,040 --> 00:15:01,410 dengan node 0 dan 5. 193 00:15:01,410 --> 00:15:05,060 Jadi bahwa jumlah ke 3, dan kemudian kita melanjutkan proses. 194 00:15:05,060 --> 00:15:08,660 The 2 dan 2 sekarang adalah yang terendah, sehingga kemudian mereka jumlah ke 4. 195 00:15:08,660 --> 00:15:12,560 Semua orang mengikutinya begitu jauh? Oke. 196 00:15:12,560 --> 00:15:16,410 Kemudian setelah itu kita memiliki 3 dan 3 yang perlu ditambahkan, 197 00:15:16,410 --> 00:15:21,650 jadi sekali lagi aku hanya beralih sehingga Anda dapat melihat secara visual sehingga tidak terlalu berantakan. 198 00:15:21,650 --> 00:15:25,740 Lalu kami memiliki 6, dan kemudian langkah terakhir kita sekarang bahwa kita hanya memiliki 2 node 199 00:15:25,740 --> 00:15:30,440 kita menjumlahkan untuk membuat akar pohon kita, yaitu 10. 200 00:15:30,440 --> 00:15:34,100 Dan nomor 10 masuk akal karena simpul masing-masing diwakili, 201 00:15:34,100 --> 00:15:40,750 nilai mereka, jumlah frekuensi mereka, adalah berapa kali mereka muncul dalam string, 202 00:15:40,750 --> 00:15:46,350 dan kemudian kita memiliki 5 karakter dalam string kami, sehingga masuk akal. 203 00:15:48,060 --> 00:15:52,320 Jika kita melihat pada bagaimana kita benar-benar akan menyalinnya, 204 00:15:52,320 --> 00:15:56,580 seperti yang diharapkan, i dan s, yang muncul paling sering 205 00:15:56,580 --> 00:16:01,350 diwakili oleh jumlah paling sedikit bit. 206 00:16:03,660 --> 00:16:05,660 >> Hati-hati di sini. 207 00:16:05,660 --> 00:16:09,780 Dalam pohon Huffman kasus benar-benar penting. 208 00:16:09,780 --> 00:16:13,670 S huruf besar berbeda dari s huruf kecil. 209 00:16:13,670 --> 00:16:21,260 Jika kita memiliki "Ini adalah CS50" dengan huruf kapital, maka s huruf kecil hanya akan muncul dua kali, 210 00:16:21,260 --> 00:16:27,120 akan menjadi node dengan 2 sebagai nilainya, dan kemudian huruf S hanya akan sekali. 211 00:16:27,120 --> 00:16:33,440 Jadi pohon Anda akan mengubah struktur karena Anda benar-benar memiliki daun ekstra di sini. 212 00:16:33,440 --> 00:16:36,900 Tapi jumlah itu masih akan menjadi 10. 213 00:16:36,900 --> 00:16:39,570 Itulah apa yang kita benar-benar akan memanggil checksum, 214 00:16:39,570 --> 00:16:44,060 penambahan semua penghitungan. 215 00:16:46,010 --> 00:16:50,990 >> Sekarang kita telah membahas pohon Huffman, kita bisa menyelam ke Puff Huff'n, pset tersebut. 216 00:16:50,990 --> 00:16:52,900 Kita akan mulai dengan bagian pertanyaan, 217 00:16:52,900 --> 00:16:57,990 dan ini akan membuat Anda terbiasa dengan pohon-pohon biner dan cara mengoperasikan sekitar bahwa: 218 00:16:57,990 --> 00:17:03,230 node menggambar, membuat struct sendiri typedef Anda untuk node, 219 00:17:03,230 --> 00:17:07,230 dan melihat bagaimana Anda bisa memasukkan ke dalam pohon biner, salah satu yang diurutkan, 220 00:17:07,230 --> 00:17:09,050 melintasi itu, dan hal seperti itu. 221 00:17:09,050 --> 00:17:14,560 Bahwa pengetahuan pasti akan membantu Anda ketika Anda menyelam ke bagian Puff Huff'n 222 00:17:14,560 --> 00:17:17,089 dari pset tersebut. 223 00:17:19,150 --> 00:17:26,329 Dalam edisi standar pset, tugas Anda adalah untuk menerapkan Puff, 224 00:17:26,329 --> 00:17:30,240 dan dalam versi hacker tugas Anda adalah untuk menerapkan Huff. 225 00:17:30,240 --> 00:17:38,490 What Huff dilakukannya itu dibutuhkan teks dan kemudian menerjemahkannya ke dalam 0s dan 1s, 226 00:17:38,490 --> 00:17:41,990 sehingga proses yang kita lakukan di atas mana kita menghitung frekuensi 227 00:17:41,990 --> 00:17:50,970 dan kemudian membuat pohon dan kemudian berkata, "Bagaimana cara mendapatkan T?" 228 00:17:50,970 --> 00:17:54,840 T diwakili oleh 100, hal-hal seperti itu, 229 00:17:54,840 --> 00:17:58,860 dan kemudian Huff akan mengambil teks dan kemudian output yang biner. 230 00:17:58,860 --> 00:18:04,920 Tapi juga karena kita tahu bahwa kita ingin mengizinkan penerima kami pesan 231 00:18:04,920 --> 00:18:11,790 untuk menciptakan pohon yang sama persis, itu juga mencakup informasi tentang penghitungan frekuensi. 232 00:18:11,790 --> 00:18:17,980 Kemudian dengan Puff kita diberi sebuah file biner 0s dan 1s 233 00:18:17,980 --> 00:18:21,740 dan diberikan juga informasi tentang frekuensi. 234 00:18:21,740 --> 00:18:26,740 Kami menerjemahkan semua orang kembali 0s dan 1s menjadi pesan asli yang, 235 00:18:26,740 --> 00:18:29,350 jadi kita dekompresi itu. 236 00:18:29,350 --> 00:18:36,450 Jika Anda melakukan edisi standar, Anda tidak perlu untuk mengimplementasikan Huff, 237 00:18:36,450 --> 00:18:39,290 demikian maka Anda hanya dapat menggunakan implementasi staf Huff. 238 00:18:39,290 --> 00:18:42,080 Ada petunjuk di spec tentang cara untuk melakukan itu. 239 00:18:42,080 --> 00:18:48,780 Anda dapat menjalankan pelaksanaan staf Huff pada sebuah file teks tertentu 240 00:18:48,780 --> 00:18:53,270 dan kemudian menggunakan output itu sebagai masukan Anda untuk Puff. 241 00:18:53,270 --> 00:18:59,330 >> Seperti yang saya sebutkan sebelumnya, kita memiliki banyak kode distribusi untuk yang satu ini. 242 00:18:59,330 --> 00:19:01,810 Aku akan mulai pergi melalui itu. 243 00:19:01,810 --> 00:19:04,400 Aku akan menghabiskan sebagian besar waktu di. File h 244 00:19:04,400 --> 00:19:07,660 karena dalam file c., karena kita memiliki. h 245 00:19:07,660 --> 00:19:11,650 dan yang memberikan kita dengan prototipe dari fungsi, 246 00:19:11,650 --> 00:19:15,520 kita tidak sepenuhnya perlu memahami persis - 247 00:19:15,520 --> 00:19:20,280 Jika Anda tidak mengerti apa yang terjadi di dalam file c., Maka jangan khawatir terlalu banyak, 248 00:19:20,280 --> 00:19:23,600 tapi pasti mencoba untuk melihat karena mungkin memberikan beberapa petunjuk 249 00:19:23,600 --> 00:19:29,220 dan itu berguna untuk membiasakan diri membaca kode orang lain. 250 00:19:38,940 --> 00:19:48,270 >> Melihat huffile.h, dalam komentar yang menyatakan lapisan abstraksi untuk Huffman-kode file. 251 00:19:48,270 --> 00:20:01,660 Jika kita turun, kita melihat bahwa ada maksimal 256 simbol bahwa kita mungkin perlu kode untuk. 252 00:20:01,660 --> 00:20:05,480 Ini mencakup semua huruf abjad ini - huruf besar dan huruf kecil - 253 00:20:05,480 --> 00:20:08,250 dan kemudian simbol dan nomor, dll 254 00:20:08,250 --> 00:20:11,930 Maka di sini kita memiliki angka ajaib mengidentifikasi file-kode Huffman. 255 00:20:11,930 --> 00:20:15,890 Dalam kode Huffman mereka akan memiliki angka ajaib tertentu 256 00:20:15,890 --> 00:20:18,560 terkait dengan header. 257 00:20:18,560 --> 00:20:21,110 Ini mungkin terlihat seperti hanya nomor acak magis, 258 00:20:21,110 --> 00:20:27,160 tetapi jika Anda benar-benar menerjemahkannya ke ASCII, maka benar-benar merinci HUFF. 259 00:20:27,160 --> 00:20:34,290 Di sini kita memiliki struct untuk file Huffman-encoded. 260 00:20:34,290 --> 00:20:39,670 Ada semua karakteristik yang berhubungan dengan file Huff. 261 00:20:39,670 --> 00:20:47,080 Kemudian di sini kita memiliki header untuk file Huff, jadi kita menyebutnya Huffeader 262 00:20:47,080 --> 00:20:50,810 bukannya menambahkan h ekstra karena kedengarannya sama pula. 263 00:20:50,810 --> 00:20:52,720 Lucu. 264 00:20:52,720 --> 00:20:57,790 Kami memiliki angka ajaib yang terkait dengannya. 265 00:20:57,790 --> 00:21:09,040 Jika itu file Huff yang sebenarnya, itu akan menjadi nomor di atas, satu ini ajaib. 266 00:21:09,040 --> 00:21:14,720 Dan kemudian akan memiliki array. 267 00:21:14,720 --> 00:21:18,750 Jadi untuk setiap simbol, yang ada 256, 268 00:21:18,750 --> 00:21:24,760 itu akan daftar apa frekuensi simbol-simbol berada dalam file Huff. 269 00:21:24,760 --> 00:21:28,090 Dan akhirnya, kita memiliki checksum untuk frekuensi, 270 00:21:28,090 --> 00:21:32,160 yang seharusnya menjadi jumlah frekuensi tersebut. 271 00:21:32,160 --> 00:21:36,520 Jadi itulah yang Huffeader adalah. 272 00:21:36,520 --> 00:21:44,600 Lalu kami memiliki beberapa fungsi yang mengembalikan bit berikutnya dalam file Huff 273 00:21:44,600 --> 00:21:52,580 serta menulis sedikit ke file Huff, dan maka fungsi ini di sini, hfclose, 274 00:21:52,580 --> 00:21:54,650 yang benar-benar menutup file Huff. 275 00:21:54,650 --> 00:21:57,290 Sebelumnya, kita berurusan dengan lurus just fclose, 276 00:21:57,290 --> 00:22:01,190 tetapi ketika Anda memiliki file Huff, bukan fclosing itu 277 00:22:01,190 --> 00:22:06,080 apa yang Anda benar-benar akan lakukan adalah hfclose dan hfopen itu. 278 00:22:06,080 --> 00:22:13,220 Mereka adalah fungsi spesifik ke file Huff bahwa kita akan berurusan dengan. 279 00:22:13,220 --> 00:22:19,230 Maka di sini kita membaca di header dan kemudian menulis header. 280 00:22:19,230 --> 00:22:25,700 >> Hanya dengan membaca file. H kita bisa mendapatkan jenis rasa apa file Huff mungkin, 281 00:22:25,700 --> 00:22:32,480 apa karakteristik itu, tanpa benar-benar masuk ke huffile.c tersebut, 282 00:22:32,480 --> 00:22:36,750 yang, jika kita menyelam dalam, akan menjadi sedikit lebih kompleks. 283 00:22:36,750 --> 00:22:41,270 Ia memiliki semua file I / O di sini berurusan dengan pointer. 284 00:22:41,270 --> 00:22:48,010 Di sini kita melihat bahwa ketika kita sebut hfread, misalnya, itu masih berurusan dengan fread. 285 00:22:48,010 --> 00:22:53,050 Kami tidak menyingkirkan fungsi-fungsi sepenuhnya, tapi kami mengirim mereka untuk dijaga 286 00:22:53,050 --> 00:22:59,760 dalam berkas Huff bukannya melakukan semua itu sendiri. 287 00:22:59,760 --> 00:23:02,300 Anda dapat merasa bebas untuk memindai melalui ini jika Anda penasaran 288 00:23:02,300 --> 00:23:08,410 dan pergi dan kupas lapisan kembali sedikit. 289 00:23:20,650 --> 00:23:24,060 >> File berikutnya yang kita akan lihat adalah tree.h. 290 00:23:24,060 --> 00:23:30,210 Sebelum di Walkthrough meluncur kami katakan kami berharap simpul Huffman 291 00:23:30,210 --> 00:23:32,960 dan kami membuat simpul struct typedef. 292 00:23:32,960 --> 00:23:38,360 Kami berharap untuk memiliki simbol, frekuensi, dan kemudian 2 bintang simpul. 293 00:23:38,360 --> 00:23:41,870 Dalam hal ini apa yang kita lakukan ini pada dasarnya sama 294 00:23:41,870 --> 00:23:46,880 kecuali bukan simpul kita akan memanggil mereka pohon. 295 00:23:48,790 --> 00:23:56,760 Kami memiliki fungsi bahwa ketika Anda menelepon membuat pohon itu kembali Anda pointer pohon. 296 00:23:56,760 --> 00:24:03,450 Kembali ke Speller, ketika Anda sedang membuat node baru 297 00:24:03,450 --> 00:24:11,410 Anda mengatakan simpul * kata baru = malloc (sizeof) dan hal-hal seperti itu. 298 00:24:11,410 --> 00:24:17,510 Pada dasarnya, mktree akan berurusan dengan itu untuk Anda. 299 00:24:17,510 --> 00:24:20,990 Demikian pula, ketika Anda ingin menghapus sebuah pohon, 300 00:24:20,990 --> 00:24:24,810 jadi itu pada dasarnya membebaskan pohon ketika Anda selesai dengan itu, 301 00:24:24,810 --> 00:24:33,790 bukannya eksplisit panggilan gratis pada itu, Anda benar-benar hanya akan menggunakan fungsi rmtree 302 00:24:33,790 --> 00:24:40,360 di mana Anda lulus dalam pointer ke pohon itu dan kemudian tree.c akan mengurus itu untuk Anda. 303 00:24:40,360 --> 00:24:42,490 >> Kami melihat ke tree.c. 304 00:24:42,490 --> 00:24:47,240 Kami berharap fungsi yang sama kecuali untuk melihat implementasi serta. 305 00:24:47,240 --> 00:24:57,720 Seperti yang kita harapkan, ketika Anda menelepon mktree itu mallocs ukuran pohon ke pointer, 306 00:24:57,720 --> 00:25:03,190 menginisialisasi semua nilai dengan nilai NULL, sehingga 0s atau NULLs, 307 00:25:03,190 --> 00:25:08,280 dan kemudian mengembalikan pointer ke pohon bahwa Anda baru saja malloc'd kepada Anda. 308 00:25:08,280 --> 00:25:13,340 Di sini ketika Anda menelepon menghapus pohon pertama kali memastikan bahwa Anda tidak membebaskan ganda. 309 00:25:13,340 --> 00:25:18,320 Hal ini memastikan bahwa Anda benar-benar memiliki pohon yang ingin Anda hapus. 310 00:25:18,320 --> 00:25:23,330 Di sini karena pohon juga termasuk anak-anaknya, 311 00:25:23,330 --> 00:25:29,560 apa yang dilakukan adalah secara rekursif panggilan menghilangkan pohon pada node kiri pohon 312 00:25:29,560 --> 00:25:31,650 serta node yang tepat. 313 00:25:31,650 --> 00:25:37,790 Sebelum membebaskan orangtua, perlu untuk membebaskan anak-anak juga. 314 00:25:37,790 --> 00:25:42,770 Induk juga dipertukarkan dengan akar. 315 00:25:42,770 --> 00:25:46,500 Orang tua yang pertama, sehingga seperti besar-besar-besar-besar-kakek 316 00:25:46,500 --> 00:25:52,130 atau pohon nenek, pertama kita harus membebaskan ke tingkat pertama. 317 00:25:52,130 --> 00:25:58,490 Jadi melintasi ke bawah, bebas mereka, dan kemudian datang kembali, bebas mereka, dll 318 00:26:00,400 --> 00:26:02,210 Jadi itulah pohon. 319 00:26:02,210 --> 00:26:04,240 >> Sekarang kita melihat hutan. 320 00:26:04,240 --> 00:26:09,860 Hutan adalah di mana Anda menempatkan semua pohon Huffman Anda. 321 00:26:09,860 --> 00:26:12,910 Ini mengatakan bahwa kita akan memiliki sesuatu yang disebut plot 322 00:26:12,910 --> 00:26:22,320 yang berisi pointer ke pohon serta pointer ke plot yang disebut selanjutnya. 323 00:26:22,320 --> 00:26:28,480 Apa struktur melakukan semacam ini terlihat seperti? 324 00:26:29,870 --> 00:26:32,490 Ini semacam mengatakan itu di sana. 325 00:26:34,640 --> 00:26:36,700 Tepat di sini. 326 00:26:37,340 --> 00:26:39,170 Sebuah linked list. 327 00:26:39,170 --> 00:26:44,590 Kita melihat bahwa ketika kita memiliki plot itu seperti linked list dari plot. 328 00:26:44,590 --> 00:26:53,020 Hutan didefinisikan sebagai linked list dari plot, 329 00:26:53,020 --> 00:26:58,100 sehingga struktur hutan kita hanya akan memiliki pointer ke petak pertama kami 330 00:26:58,100 --> 00:27:02,740 dan plot yang memiliki pohon dalam atau lebih menunjuk ke sebuah pohon 331 00:27:02,740 --> 00:27:06,190 dan kemudian menunjuk ke plot selanjutnya, seterusnya, dan sebagainya. 332 00:27:06,190 --> 00:27:11,100 Untuk membuat hutan kita sebut mkforest. 333 00:27:11,100 --> 00:27:14,930 Lalu kami memiliki beberapa fungsi yang cukup berguna di sini. 334 00:27:14,930 --> 00:27:23,240 Kami memiliki memilih di mana Anda lulus di hutan dan kemudian nilai kembali adalah * Pohon, 335 00:27:23,240 --> 00:27:25,210 pointer ke pohon. 336 00:27:25,210 --> 00:27:29,370 Apa yang akan lakukan adalah memilih akan masuk ke hutan yang Anda menunjuk ke 337 00:27:29,370 --> 00:27:35,240 kemudian menghapus pohon dengan frekuensi terendah dari hutan yang 338 00:27:35,240 --> 00:27:38,330 dan kemudian memberikan pointer ke pohon itu. 339 00:27:38,330 --> 00:27:43,030 Setelah Anda memanggil memilih, pohon tidak akan ada di hutan lagi, 340 00:27:43,030 --> 00:27:48,550 tetapi nilai pengembalian adalah pointer ke pohon itu. 341 00:27:48,550 --> 00:27:50,730 Maka Anda memiliki tanaman. 342 00:27:50,730 --> 00:27:57,420 Asalkan Anda lulus dalam pointer ke sebuah pohon yang memiliki frekuensi non-0, 343 00:27:57,420 --> 00:28:04,040 apa tanaman akan lakukan itu akan mengambil hutan, mengambil pohon, dan tanaman yang pohon dalam hutan. 344 00:28:04,040 --> 00:28:06,370 Di sini kita memiliki rmforest. 345 00:28:06,370 --> 00:28:11,480 Mirip dengan menghilangkan pohon, yang pada dasarnya membebaskan semua pohon bagi kita, 346 00:28:11,480 --> 00:28:16,600 menghapus hutan akan segala sesuatu yang bebas yang terkandung dalam hutan itu. 347 00:28:16,600 --> 00:28:24,890 >> Jika kita melihat ke forest.c, kita akan mengharapkan untuk melihat setidaknya 1 perintah rmtree di sana, 348 00:28:24,890 --> 00:28:30,090 karena untuk membebaskan memori di hutan jika hutan memiliki pohon di dalamnya, 349 00:28:30,090 --> 00:28:32,930 maka akhirnya Anda akan harus menghapus pohon-pohon juga. 350 00:28:32,930 --> 00:28:41,020 Jika kita melihat ke forest.c, kita memiliki mkforest kami, yang seperti yang kita harapkan. 351 00:28:41,020 --> 00:28:42,890 Kami malloc hal. 352 00:28:42,890 --> 00:28:51,740 Kami menginisialisasi plot pertama di hutan sebagai NULL karena kosong untuk memulai dengan, 353 00:28:51,740 --> 00:29:05,940 maka kita lihat memilih, yang mengembalikan pohon dengan bobot terendah, frekuensi terendah, 354 00:29:05,940 --> 00:29:13,560 dan kemudian menghilangkan simpul tertentu yang menunjuk ke pohon itu dan yang berikutnya, 355 00:29:13,560 --> 00:29:16,760 sehingga dibutuhkan bahwa dari linked list dari hutan. 356 00:29:16,760 --> 00:29:24,510 Dan maka di sini kita memiliki pabrik, yang menyisipkan pohon ke dalam linked list. 357 00:29:24,510 --> 00:29:29,960 Apa hutan itu tidak baik menyimpannya diurutkan bagi kita. 358 00:29:29,960 --> 00:29:37,910 Dan akhirnya, kita memiliki rmforest dan, seperti yang diharapkan, kami memiliki rmtree disebut di sana. 359 00:29:46,650 --> 00:29:55,440 >> Melihat kode distribusi sejauh ini, huffile.c mungkin sejauh yang paling sulit untuk memahami, 360 00:29:55,440 --> 00:29:59,990 sedangkan file lain sendiri cukup sederhana untuk mengikuti. 361 00:29:59,990 --> 00:30:03,090 Dengan pengetahuan kita tentang pointer dan daftar terhubung dan semacamnya, 362 00:30:03,090 --> 00:30:04,860 kami mampu mengikuti cukup baik. 363 00:30:04,860 --> 00:30:10,500 Tapi semua kita harus benar-benar memastikan bahwa kita memahami adalah h file. 364 00:30:10,500 --> 00:30:15,840 karena Anda harus memanggil fungsi tersebut, berhubungan dengan nilai-nilai kembali, 365 00:30:15,840 --> 00:30:20,590 jadi pastikan bahwa Anda sepenuhnya memahami tindakan apa yang akan dilakukan 366 00:30:20,590 --> 00:30:24,290 setiap kali Anda memanggil salah satu fungsi. 367 00:30:24,290 --> 00:30:33,020 Tapi sebenarnya pemahaman di dalamnya tidak cukup diperlukan karena kita memiliki orang-orang. File h. 368 00:30:35,170 --> 00:30:39,490 Kami memiliki 2 lebih file tersisa di kode distribusi kami. 369 00:30:39,490 --> 00:30:41,640 >> Mari kita lihat di dump. 370 00:30:41,640 --> 00:30:47,230 Dump oleh komentar yang di sini mengambil file Huffman-terkompresi 371 00:30:47,230 --> 00:30:55,580 dan kemudian menerjemahkan dan pembuangan semua isinya keluar. 372 00:31:01,010 --> 00:31:04,260 Di sini kita melihat bahwa itu memanggil hfopen. 373 00:31:04,260 --> 00:31:10,770 Ini adalah jenis mirroring untuk mengajukan masukan * fopen =, 374 00:31:10,770 --> 00:31:13,500 dan kemudian Anda lulus dalam informasi. 375 00:31:13,500 --> 00:31:18,240 Ini hampir sama kecuali bukan file * Anda lewat di Huffile a; 376 00:31:18,240 --> 00:31:22,030 bukannya fopen Anda lewat di hfopen. 377 00:31:22,030 --> 00:31:29,280 Di sini kita membaca di header pertama, yang merupakan jenis mirip dengan bagaimana kita membaca di header 378 00:31:29,280 --> 00:31:33,580 untuk file bitmap. 379 00:31:33,580 --> 00:31:38,000 Apa yang kita lakukan di sini adalah memeriksa untuk melihat apakah informasi header 380 00:31:38,000 --> 00:31:44,330 berisi angka ajaib yang tepat yang menunjukkan bahwa itu file Huff yang sebenarnya, 381 00:31:44,330 --> 00:31:53,610 maka semua pemeriksaan ini untuk memastikan bahwa file yang kita buka adalah file huffed yang sebenarnya atau tidak. 382 00:31:53,610 --> 00:32:05,330 Apa yang dilakukan adalah itu output frekuensi dari semua simbol-simbol yang bisa kita lihat 383 00:32:05,330 --> 00:32:09,790 dalam terminal ke tabel grafis. 384 00:32:09,790 --> 00:32:15,240 Bagian ini akan berguna. 385 00:32:15,240 --> 00:32:24,680 Memiliki sedikit dan membaca sedikit demi sedikit ke dalam bit variabel dan kemudian mencetaknya. 386 00:32:28,220 --> 00:32:35,430 Jadi jika saya memanggil dump pada hth.bin, yang merupakan hasil dari huffing file 387 00:32:35,430 --> 00:32:39,490 menggunakan solusi staf, saya akan mendapatkan ini. 388 00:32:39,490 --> 00:32:46,000 Ini keluaran semua karakter dan kemudian menempatkan frekuensi di mana mereka muncul. 389 00:32:46,000 --> 00:32:51,180 Jika kita perhatikan, kebanyakan dari mereka adalah 0s kecuali ini: H, yang muncul dua kali, 390 00:32:51,180 --> 00:32:54,820 dan kemudian T, yang muncul sekali. 391 00:32:54,820 --> 00:33:07,860 Dan maka di sini kita memiliki pesan yang sebenarnya di 0s dan 1s. 392 00:33:07,860 --> 00:33:15,450 Jika kita melihat hth.txt, yang diduga pesan asli yang gusar, 393 00:33:15,450 --> 00:33:22,490 kami berharap untuk melihat beberapa Hs dan Ts di sana. 394 00:33:22,490 --> 00:33:28,720 Secara khusus, kami berharap untuk melihat hanya 1 T dan 2 Hs. 395 00:33:32,510 --> 00:33:37,440 Di sini kita berada dalam hth.txt. Ini memang memiliki HTH. 396 00:33:37,440 --> 00:33:41,270 Termasuk di sana, meskipun kita tidak bisa melihatnya, adalah karakter baris baru. 397 00:33:41,270 --> 00:33:53,190 The hth.bin File Huff juga pengkodean karakter baris baru juga. 398 00:33:55,680 --> 00:34:01,330 Di sini karena kita tahu bahwa urutannya adalah HTH dan kemudian newline, 399 00:34:01,330 --> 00:34:07,340 kita dapat melihat bahwa mungkin H diwakili oleh hanya 1 tunggal 400 00:34:07,340 --> 00:34:17,120 dan kemudian T mungkin adalah 01 dan kemudian H berikutnya adalah 1 juga 401 00:34:17,120 --> 00:34:21,139 dan kemudian kita memiliki newline ditunjukkan oleh dua 0s. 402 00:34:22,420 --> 00:34:24,280 Cool. 403 00:34:26,530 --> 00:34:31,600 >> Dan akhirnya, karena kita sedang berhadapan dengan beberapa. Dan c. H file, 404 00:34:31,600 --> 00:34:36,350 kita akan memiliki argumen yang cukup kompleks ke compiler, 405 00:34:36,350 --> 00:34:40,460 dan jadi di sini kita memiliki Makefile yang membuat dump untuk Anda. 406 00:34:40,460 --> 00:34:47,070 Tapi sebenarnya, Anda harus pergi tentang membuat file sendiri puff.c Anda. 407 00:34:47,070 --> 00:34:54,330 Makefile sebenarnya tidak berurusan dengan membuat puff.c untuk Anda. 408 00:34:54,330 --> 00:34:59,310 Kami meninggalkan bahwa sampai Anda untuk mengedit Makefile. 409 00:34:59,310 --> 00:35:05,930 Bila Anda memasukkan perintah seperti membuat semua, misalnya, itu akan membuat mereka semua untuk Anda. 410 00:35:05,930 --> 00:35:10,760 Jangan ragu untuk melihat contoh Makefile dari pset masa lalu 411 00:35:10,760 --> 00:35:17,400 serta pergi dari satu ini untuk melihat bagaimana Anda mungkin dapat membuat file Puff Anda 412 00:35:17,400 --> 00:35:20,260 dengan mengedit Makefile ini. 413 00:35:20,260 --> 00:35:22,730 Itu saja untuk kode distribusi kami. 414 00:35:22,730 --> 00:35:28,380 >> Setelah kita sudah melalui itu, maka di sini hanya pengingat lain 415 00:35:28,380 --> 00:35:30,980 bagaimana kita akan berurusan dengan node Huffman. 416 00:35:30,980 --> 00:35:35,400 Kami tidak akan menyebut mereka node lagi; kita akan memanggil mereka pohon 417 00:35:35,400 --> 00:35:39,260 di mana kita akan mewakili simbol mereka dengan char, 418 00:35:39,260 --> 00:35:43,340 frekuensi, jumlah kejadian, dengan integer. 419 00:35:43,340 --> 00:35:47,370 Kami menggunakan itu karena itu lebih tepat daripada pelampung. 420 00:35:47,370 --> 00:35:52,980 Dan kemudian kita memiliki pointer ke anak kiri serta anak kanan. 421 00:35:52,980 --> 00:35:59,630 Hutan, seperti yang kita lihat, hanya daftar link dari pohon. 422 00:35:59,630 --> 00:36:04,670 Pada akhirnya, ketika kita membangun kami berkas Huff, 423 00:36:04,670 --> 00:36:07,580 kami ingin hutan kita mengandung hanya 1 pohon - 424 00:36:07,580 --> 00:36:12,420 1 pohon, 1 root dengan beberapa anak. 425 00:36:12,420 --> 00:36:20,840 Sebelumnya ketika kami hanya membuat kami pohon Huffman, 426 00:36:20,840 --> 00:36:25,360 kita mulai dengan menempatkan semua node ke layar kami 427 00:36:25,360 --> 00:36:27,790 dan mengatakan kita akan memiliki node tersebut, 428 00:36:27,790 --> 00:36:32,920 akhirnya mereka akan menjadi daun, dan ini adalah simbol mereka, ini adalah frekuensi mereka. 429 00:36:32,920 --> 00:36:42,070 Di hutan kita jika kita hanya memiliki 3 huruf, itu adalah hutan pohon 3. 430 00:36:42,070 --> 00:36:45,150 Dan kemudian ketika kami pergi, ketika kita menambahkan induk pertama, 431 00:36:45,150 --> 00:36:48,080 kami membuat hutan 2 pohon. 432 00:36:48,080 --> 00:36:54,930 Kami dihapus 2 dari mereka anak-anak dari hutan kami dan kemudian menggantinya dengan simpul orangtua 433 00:36:54,930 --> 00:36:58,820 yang telah mereka 2 node sebagai anak-anak. 434 00:36:58,820 --> 00:37:05,600 Dan akhirnya, kami lalu langkah dengan membuat contoh kita dengan As, B, dan C 435 00:37:05,600 --> 00:37:08,030 akan membuat orangtua akhir, 436 00:37:08,030 --> 00:37:13,190 dan sebagainya maka yang akan membawa jumlah total pohon di hutan untuk 1. 437 00:37:13,190 --> 00:37:18,140 Apakah semua orang melihat bagaimana Anda mulai dengan beberapa pohon di hutan Anda 438 00:37:18,140 --> 00:37:22,520 dan berakhir dengan 1? Oke. Cool. 439 00:37:25,530 --> 00:37:28,110 >> Apa yang perlu kita lakukan untuk Puff? 440 00:37:28,110 --> 00:37:37,110 Apa yang perlu kita lakukan adalah memastikan bahwa, seperti biasa, mereka memberi kita hak jenis masukan 441 00:37:37,110 --> 00:37:39,090 sehingga kita dapat benar-benar menjalankan program. 442 00:37:39,090 --> 00:37:43,130 Dalam hal ini mereka akan memberikan kami setelah pertama argumen mereka baris perintah 443 00:37:43,130 --> 00:37:53,440 2 lagi: file yang kita inginkan untuk dekompresi dan output dari file didekompresi. 444 00:37:53,440 --> 00:38:00,410 Tapi begitu kita pastikan bahwa mereka melewati kita dalam jumlah yang tepat dari nilai-nilai, 445 00:38:00,410 --> 00:38:05,820 kami ingin memastikan bahwa input file Huff atau tidak. 446 00:38:05,820 --> 00:38:10,420 Dan kemudian setelah kami menjamin bahwa itu file Huff, maka kita ingin membangun pohon kita, 447 00:38:10,420 --> 00:38:20,940 membangun pohon sedemikian rupa sehingga cocok dengan pohon bahwa orang yang mengirim pesan dibangun. 448 00:38:20,940 --> 00:38:25,840 Kemudian setelah kita membangun pohon, maka kita bisa berurusan dengan, 0s dan 1s yang mereka disahkan pada 449 00:38:25,840 --> 00:38:29,590 mengikuti mereka sepanjang pohon kita karena itu identik, 450 00:38:29,590 --> 00:38:33,510 dan kemudian menulis pesan itu, menafsirkan bit kembali ke karakter. 451 00:38:33,510 --> 00:38:35,880 Dan kemudian di akhir karena kita sedang berhadapan dengan pointer di sini, 452 00:38:35,880 --> 00:38:38,110 kami ingin memastikan bahwa kami tidak memiliki kebocoran memori 453 00:38:38,110 --> 00:38:41,330 dan bahwa kita semuanya gratis. 454 00:38:42,820 --> 00:38:46,430 >> Memastikan penggunaan yang tepat adalah topi tua bagi kita sekarang. 455 00:38:46,430 --> 00:38:51,980 Kami mengambil sebuah input, yang akan menjadi nama file untuk membusungkan, 456 00:38:51,980 --> 00:38:56,010 dan kemudian kita tentukan output, 457 00:38:56,010 --> 00:39:01,580 sehingga nama file untuk output kembung, yang akan menjadi file teks. 458 00:39:03,680 --> 00:39:08,820 Itu penggunaan. Dan sekarang kami ingin memastikan bahwa input huffed atau tidak. 459 00:39:08,820 --> 00:39:16,420 Berpikir kembali, apakah ada sesuatu dalam kode distribusi yang mungkin bisa membantu kita 460 00:39:16,420 --> 00:39:21,570 dengan memahami apakah sebuah berkas huffed atau tidak? 461 00:39:21,570 --> 00:39:26,910 Ada informasi di huffile.c tentang Huffeader tersebut. 462 00:39:26,910 --> 00:39:33,430 Kita tahu bahwa setiap file Huff memiliki Huffeader yang terkait dengan itu dengan angka ajaib 463 00:39:33,430 --> 00:39:37,240 serta berbagai frekuensi untuk masing-masing simbol 464 00:39:37,240 --> 00:39:39,570 serta checksum. 465 00:39:39,570 --> 00:39:43,180 Kita tahu itu, tapi kami juga mengambil mengintip di dump.c, 466 00:39:43,180 --> 00:39:49,120 di mana ia membaca ke file Huff. 467 00:39:49,120 --> 00:39:53,990 Dan sehingga untuk melakukan itu, ia harus memeriksa apakah itu benar-benar huffed atau tidak. 468 00:39:53,990 --> 00:40:03,380 Jadi mungkin kita bisa menggunakan dump.c sebagai struktur untuk puff.c. kami 469 00:40:03,380 --> 00:40:12,680 Kembali ke pset 4 ketika kita memiliki file yang disalin copy.c dalam tiga kali lipat RGB 470 00:40:12,680 --> 00:40:14,860 dan kami ditafsirkan bahwa untuk cerita detektif dan Resize, 471 00:40:14,860 --> 00:40:20,390 sama, apa yang dapat Anda lakukan adalah hanya menjalankan perintah seperti cp dump.c puff.c 472 00:40:20,390 --> 00:40:23,600 dan menggunakan beberapa kode di sana. 473 00:40:23,600 --> 00:40:28,210 Namun, itu tidak akan menjadi seperti langsung dari proses 474 00:40:28,210 --> 00:40:33,010 untuk menerjemahkan dump.c Anda ke puff.c, 475 00:40:33,010 --> 00:40:36,160 tapi setidaknya itu memberi Anda tempat untuk memulai 476 00:40:36,160 --> 00:40:40,540 tentang cara untuk memastikan bahwa input sebenarnya huffed atau tidak 477 00:40:40,540 --> 00:40:43,240 serta beberapa hal lainnya. 478 00:40:45,930 --> 00:40:50,250 Kami telah memastikan penggunaan yang tepat dan memastikan bahwa input huffed. 479 00:40:50,250 --> 00:40:53,570 Setiap kali kita lakukan bahwa kita telah melakukan pengecekan error yang tepat kami, 480 00:40:53,570 --> 00:41:01,520 jadi kembali dan berhenti fungsi jika beberapa kegagalan terjadi, jika ada masalah. 481 00:41:01,520 --> 00:41:07,170 >> Sekarang apa yang ingin kita lakukan adalah membangun pohon yang sebenarnya. 482 00:41:08,840 --> 00:41:12,640 Jika kita melihat di Hutan, terdapat 2 fungsi utama 483 00:41:12,640 --> 00:41:15,800 bahwa kita akan ingin menjadi sangat akrab dengan. 484 00:41:15,800 --> 00:41:23,870 Ada tanaman fungsi Boolean bahwa tanaman non-0 frekuensi pohon dalam hutan kami. 485 00:41:23,870 --> 00:41:29,250 Dan jadi ada Anda lulus dalam pointer ke hutan dan pointer ke pohon. 486 00:41:32,530 --> 00:41:40,340 Pertanyaan singkat: Berapa banyak hutan akan Anda miliki ketika Anda sedang membangun pohon Huffman? 487 00:41:44,210 --> 00:41:46,650 Hutan kita seperti kanvas kami, kan? 488 00:41:46,650 --> 00:41:50,800 Jadi kita hanya akan memiliki 1 hutan, tapi kami akan memiliki beberapa pohon. 489 00:41:50,800 --> 00:41:57,590 Jadi sebelum Anda memanggil tanaman, Anda mungkin akan ingin membuat hutan Anda. 490 00:41:57,590 --> 00:42:04,430 Ada perintah untuk itu jika Anda melihat ke forest.h mengenai bagaimana Anda dapat membuat hutan. 491 00:42:04,430 --> 00:42:09,270 Anda dapat menanam pohon. Kita tahu bagaimana melakukan hal itu. 492 00:42:09,270 --> 00:42:11,590 Dan kemudian Anda juga dapat memilih pohon dari hutan, 493 00:42:11,590 --> 00:42:17,540 menghapus pohon dengan berat terendah dan memberikan Anda pointer untuk itu. 494 00:42:17,540 --> 00:42:23,090 Berpikir kembali ke ketika kami melakukan contoh diri kita sendiri, 495 00:42:23,090 --> 00:42:27,980 ketika kita sedang menggambar itu, kita hanya hanya menambahkan link. 496 00:42:27,980 --> 00:42:31,680 Tapi di sini bukan hanya menambahkan link, 497 00:42:31,680 --> 00:42:40,630 menganggapnya lebih sebagai Anda menghapus 2 orang node dan kemudian menggantinya dengan yang lain. 498 00:42:40,630 --> 00:42:44,200 Untuk menyatakan bahwa dalam hal memilih dan menanam, 499 00:42:44,200 --> 00:42:48,840 Anda memilih 2 pohon dan kemudian menanam pohon lain 500 00:42:48,840 --> 00:42:54,060 yang memiliki orang-2 pohon yang Anda memilih sebagai anak-anak. 501 00:42:57,950 --> 00:43:05,280 Untuk membangun pohon Huffman, Anda dapat membaca dalam simbol-simbol dan frekuensi dalam rangka 502 00:43:05,280 --> 00:43:10,790 karena Huffeader memberikan itu kepada Anda, 503 00:43:10,790 --> 00:43:14,250 memberi Anda sebuah array dari frekuensi. 504 00:43:14,250 --> 00:43:19,660 Jadi Anda dapat melanjutkan dan hanya mengabaikan apapun dengan 0 di dalamnya 505 00:43:19,660 --> 00:43:23,760 karena kita tidak ingin 256 daun pada akhir itu. 506 00:43:23,760 --> 00:43:27,960 Kami hanya ingin jumlah daun yang karakter 507 00:43:27,960 --> 00:43:31,600 yang benar-benar digunakan dalam file. 508 00:43:31,600 --> 00:43:37,590 Anda dapat membaca dalam simbol-simbol, dan masing-masing dari simbol-simbol yang memiliki non-0 frekuensi, 509 00:43:37,590 --> 00:43:40,440 Mereka adalah akan menjadi pohon. 510 00:43:40,440 --> 00:43:45,990 Apa yang dapat Anda lakukan adalah setiap kali Anda baca dalam simbol frekuensi non-0, 511 00:43:45,990 --> 00:43:50,660 Anda dapat menanam pohon di hutan. 512 00:43:50,660 --> 00:43:56,620 Setelah Anda menanam pohon-pohon di hutan, Anda dapat bergabung dengan pohon-pohon sebagai saudara kandung, 513 00:43:56,620 --> 00:44:01,130 sehingga akan kembali untuk menanam dan memetik di mana Anda memilih 2 dan kemudian tanaman 1, 514 00:44:01,130 --> 00:44:05,820 mana yang 1 yang Anda tanaman adalah induk dari 2 anak yang memilih. 515 00:44:05,820 --> 00:44:11,160 Jadi hasil akhir Anda akan menjadi satu pohon di hutan Anda. 516 00:44:16,180 --> 00:44:18,170 Itulah cara Anda membangun pohon Anda. 517 00:44:18,170 --> 00:44:21,850 >> Ada beberapa hal yang bisa salah di sini 518 00:44:21,850 --> 00:44:26,580 karena kita sedang berhadapan dengan membuat pohon-pohon baru dan berurusan dengan pointer dan hal-hal seperti itu. 519 00:44:26,580 --> 00:44:30,450 Sebelum ketika kita sedang berurusan dengan pointer, 520 00:44:30,450 --> 00:44:36,580 setiap kali kita malloc'd kami ingin memastikan bahwa itu tidak kembali kami nilai pointer NULL. 521 00:44:36,580 --> 00:44:42,770 Jadi pada beberapa langkah dalam proses ini ada akan menjadi beberapa kasus 522 00:44:42,770 --> 00:44:45,920 di mana program Anda bisa gagal. 523 00:44:45,920 --> 00:44:51,310 Apa yang ingin Anda lakukan adalah Anda ingin memastikan bahwa Anda menangani kesalahan-kesalahan, 524 00:44:51,310 --> 00:44:54,580 dan di spec itu mengatakan untuk menangani mereka dengan anggun, 525 00:44:54,580 --> 00:45:00,280 jadi seperti mencetak pesan ke pengguna memberitahu mereka mengapa program harus berhenti 526 00:45:00,280 --> 00:45:03,050 dan kemudian segera berhenti itu. 527 00:45:03,050 --> 00:45:09,490 Untuk melakukan hal ini penanganan error, ingat bahwa Anda ingin memeriksa 528 00:45:09,490 --> 00:45:12,160 setiap saat bahwa mungkin ada kegagalan. 529 00:45:12,160 --> 00:45:14,660 Setiap kali bahwa Anda membuat pointer baru 530 00:45:14,660 --> 00:45:17,040 Anda ingin memastikan bahwa itu berhasil. 531 00:45:17,040 --> 00:45:20,320 Sebelum apa yang kita digunakan untuk lakukan adalah membuat pointer baru dan malloc itu, 532 00:45:20,320 --> 00:45:22,380 dan kemudian kita akan memeriksa apakah pointer yang NULL. 533 00:45:22,380 --> 00:45:25,670 Jadi ada akan ada beberapa kejadian di mana Anda hanya dapat melakukan itu, 534 00:45:25,670 --> 00:45:28,610 tapi kadang-kadang Anda benar-benar memanggil fungsi 535 00:45:28,610 --> 00:45:33,100 dan dalam fungsi yang, itulah salah satu yang melakukan mallocing tersebut. 536 00:45:33,100 --> 00:45:39,110 Dalam hal ini, jika kita melihat kembali ke beberapa fungsi dalam kode, 537 00:45:39,110 --> 00:45:42,260 beberapa dari mereka adalah fungsi Boolean. 538 00:45:42,260 --> 00:45:48,480 Dalam kasus abstrak jika kita memiliki fungsi Boolean yang disebut foo, 539 00:45:48,480 --> 00:45:54,580 pada dasarnya, kita bisa berasumsi bahwa selain melakukan apapun foo tidak, 540 00:45:54,580 --> 00:45:57,210 karena itu fungsi Boolean, ia mengembalikan true atau false - 541 00:45:57,210 --> 00:46:01,300 benar jika berhasil, false jika tidak. 542 00:46:01,300 --> 00:46:06,270 Jadi kita ingin memeriksa apakah nilai kembali dari foo benar atau salah. 543 00:46:06,270 --> 00:46:10,400 Jika itu palsu, itu berarti bahwa kita akan ingin mencetak beberapa jenis pesan 544 00:46:10,400 --> 00:46:14,390 dan kemudian keluar dari program. 545 00:46:14,390 --> 00:46:18,530 Apa yang kita ingin lakukan adalah memeriksa nilai kembali dari foo. 546 00:46:18,530 --> 00:46:23,310 Jika foo mengembalikan false, maka kita tahu bahwa kita mengalami beberapa jenis kesalahan 547 00:46:23,310 --> 00:46:25,110 dan kita perlu berhenti program kami. 548 00:46:25,110 --> 00:46:35,600 Sebuah cara untuk melakukan ini adalah memiliki kondisi di mana fungsi yang sebenarnya itu sendiri adalah kondisi Anda. 549 00:46:35,600 --> 00:46:39,320 Katakanlah foo mengambil di x. 550 00:46:39,320 --> 00:46:43,390 Kita dapat memiliki kondisi if (foo (x)). 551 00:46:43,390 --> 00:46:50,900 Pada dasarnya, itu berarti jika pada akhir melaksanakan foo itu mengembalikan nilai true, 552 00:46:50,900 --> 00:46:57,390 maka kita dapat melakukan ini karena fungsi harus mengevaluasi foo 553 00:46:57,390 --> 00:47:00,500 dalam rangka untuk mengevaluasi kondisi seluruh. 554 00:47:00,500 --> 00:47:06,500 Jadi itulah bagaimana Anda dapat melakukan sesuatu jika fungsi mengembalikan nilai true dan berhasil. 555 00:47:06,500 --> 00:47:11,800 Tetapi ketika Anda sedang memeriksa kesalahan, Anda hanya ingin berhenti jika fungsi Anda kembali palsu. 556 00:47:11,800 --> 00:47:16,090 Apa yang Anda bisa lakukan hanyalah menambahkan == palsu atau hanya menambahkan bang di depannya 557 00:47:16,090 --> 00:47:21,010 dan kemudian Anda memiliki if (! foo). 558 00:47:21,010 --> 00:47:29,540 Dalam tubuh kondisi bahwa Anda akan memiliki semua penanganan error, 559 00:47:29,540 --> 00:47:36,940 jadi seperti, "Tidak bisa membuat pohon ini" dan kemudian kembali 1 atau sesuatu seperti itu. 560 00:47:36,940 --> 00:47:43,340 Apa yang tidak, meskipun, adalah bahwa meskipun foo kembali palsu - 561 00:47:43,340 --> 00:47:46,980 Katakanlah foo mengembalikan nilai true. 562 00:47:46,980 --> 00:47:51,060 Maka Anda tidak perlu menelepon foo lagi. Itu kesalahpahaman umum. 563 00:47:51,060 --> 00:47:54,730 Karena itu dalam kondisi Anda, itu sudah dievaluasi, 564 00:47:54,730 --> 00:47:59,430 sehingga Anda sudah memiliki hasilnya jika Anda menggunakan make pohon atau sesuatu seperti itu 565 00:47:59,430 --> 00:48:01,840 atau tanaman atau memilih atau sesuatu. 566 00:48:01,840 --> 00:48:07,460 Ini sudah memiliki nilai itu. Ini sudah dijalankan. 567 00:48:07,460 --> 00:48:10,730 Jadi berguna untuk menggunakan fungsi Boolean sebagai kondisi 568 00:48:10,730 --> 00:48:13,890 karena apakah Anda benar-benar melaksanakan tubuh loop, 569 00:48:13,890 --> 00:48:18,030 dijalankan fungsi pula. 570 00:48:22,070 --> 00:48:27,330 >> Kedua kami untuk langkah terakhir adalah menulis pesan ke file. 571 00:48:27,330 --> 00:48:33,070 Setelah kami membangun pohon Huffman, kemudian menulis pesan ke file tersebut cukup sederhana. 572 00:48:33,070 --> 00:48:39,260 Ini cukup sederhana sekarang hanya mengikuti 0s dan 1s. 573 00:48:39,260 --> 00:48:45,480 Dan sehingga dengan konvensi kita tahu bahwa dalam pohon Huffman 0s mengindikasikan kiri 574 00:48:45,480 --> 00:48:48,360 dan 1s menunjukkan tepat. 575 00:48:48,360 --> 00:48:53,540 Jadi jika Anda membaca sedikit demi sedikit, setiap kali Anda mendapatkan 0 576 00:48:53,540 --> 00:48:59,100 Anda akan mengikuti cabang kiri, dan kemudian setiap kali Anda baca dalam 1 577 00:48:59,100 --> 00:49:02,100 Anda akan mengikuti cabang kanan. 578 00:49:02,100 --> 00:49:07,570 Dan kemudian Anda akan terus sampai anda menekan daun 579 00:49:07,570 --> 00:49:11,550 karena daun akan berada di ujung cabang. 580 00:49:11,550 --> 00:49:16,870 Bagaimana kita bisa mengatakan apakah kita telah memukul daun atau tidak? 581 00:49:19,800 --> 00:49:21,690 Kami mengatakan itu sebelumnya. 582 00:49:21,690 --> 00:49:24,040 [Mahasiswa] Jika pointer NULL. >> Ya. 583 00:49:24,040 --> 00:49:32,220 Kita dapat mengetahui apakah kita sudah mencapai daun jika pointer ke pohon baik kiri dan kanan NULL. 584 00:49:32,220 --> 00:49:34,110 Sempurna. 585 00:49:34,110 --> 00:49:40,320 Kita tahu bahwa kita ingin membaca di sedikit demi sedikit ke dalam file Huff kami. 586 00:49:43,870 --> 00:49:51,220 Seperti yang kita lihat sebelumnya di dump.c, apa yang mereka lakukan adalah mereka baca dalam sedikit demi sedikit ke dalam file Huff 587 00:49:51,220 --> 00:49:54,560 dan hanya dicetak apa itu bit itu. 588 00:49:54,560 --> 00:49:58,430 Kami tidak akan melakukan itu. Kami akan melakukan sesuatu yang sedikit lebih kompleks. 589 00:49:58,430 --> 00:50:03,620 Tapi apa yang bisa kita lakukan adalah kita bisa mengambil sedikit kode yang dibaca ke dalam bit. 590 00:50:03,620 --> 00:50:10,250 Di sini kita memiliki bit integer yang mewakili bit saat ini bahwa kita berada di. 591 00:50:10,250 --> 00:50:15,520 Ini menangani iterasi semua bit dalam file sampai Anda mencapai akhir file. 592 00:50:15,520 --> 00:50:21,270 Berdasarkan hal tersebut, maka Anda akan ingin memiliki beberapa jenis iterator 593 00:50:21,270 --> 00:50:26,760 untuk melintasi pohon Anda. 594 00:50:26,760 --> 00:50:31,460 Dan kemudian berdasarkan apakah bit adalah 0 atau 1, 595 00:50:31,460 --> 00:50:36,920 Anda akan ingin pindahkan bahwa iterator ke kiri atau memindahkannya ke kanan 596 00:50:36,920 --> 00:50:44,080 sepanjang jalan sampai Anda mencapai daun, sehingga semua jalan sampai simpul bahwa Anda berada di 597 00:50:44,080 --> 00:50:48,260 tidak menunjuk ke node lagi. 598 00:50:48,260 --> 00:50:54,300 Mengapa kita melakukan ini dengan file Huffman namun tidak kode Morse? 599 00:50:54,300 --> 00:50:56,610 Karena dalam kode Morse ada sedikit ambiguitas. 600 00:50:56,610 --> 00:51:04,440 Kita bisa seperti, oh tunggu, kami telah memukul surat sepanjang jalan, jadi mungkin ini adalah surat kami, 601 00:51:04,440 --> 00:51:08,150 sedangkan jika kita terus hanya sedikit lebih lama, maka kita akan telah memukul surat lain. 602 00:51:08,150 --> 00:51:13,110 Tapi itu tidak akan terjadi dalam pengkodean Huffman, 603 00:51:13,110 --> 00:51:17,540 sehingga kita dapat yakin bahwa satu-satunya cara bahwa kita akan memukul karakter 604 00:51:17,540 --> 00:51:23,480 adalah jika anak-anak yang node kiri dan kanan NULL. 605 00:51:28,280 --> 00:51:32,350 >> Akhirnya, kami ingin membebaskan semua memori kita. 606 00:51:32,350 --> 00:51:37,420 Kami ingin keduanya dekat file Huff bahwa kita sudah berhadapan dengan 607 00:51:37,420 --> 00:51:41,940 serta menghapus semua pohon di hutan kita. 608 00:51:41,940 --> 00:51:46,470 Berdasarkan implementasi Anda, Anda mungkin akan ingin menelepon menghapus hutan 609 00:51:46,470 --> 00:51:49,780 bukan benar-benar akan melalui semua pohon sendiri. 610 00:51:49,780 --> 00:51:53,430 Tetapi jika Anda membuat setiap pohon sementara, Anda akan ingin untuk membebaskan itu. 611 00:51:53,430 --> 00:51:59,060 Anda tahu kode Anda yang terbaik, sehingga Anda tahu di mana Anda mengalokasikan memori. 612 00:51:59,060 --> 00:52:04,330 Dan jadi jika Anda pergi, mulailah dengan bahkan Pengendalian f'ing untuk malloc, 613 00:52:04,330 --> 00:52:08,330 melihat setiap kali Anda malloc dan memastikan bahwa Anda membebaskan semua itu 614 00:52:08,330 --> 00:52:10,190 tapi kemudian hanya akan melalui kode Anda, 615 00:52:10,190 --> 00:52:14,260 memahami di mana Anda mungkin telah dialokasikan memori. 616 00:52:14,260 --> 00:52:21,340 Biasanya Anda hanya bisa mengatakan, "Pada akhir file aku hanya akan menghapus hutan di hutan saya," 617 00:52:21,340 --> 00:52:23,850 jadi pada dasarnya menghapus memori itu, bebas itu, 618 00:52:23,850 --> 00:52:28,310 "Dan kemudian saya juga akan menutup file dan kemudian program saya akan berhenti." 619 00:52:28,310 --> 00:52:33,810 Tapi apakah itu satu-satunya waktu bahwa program Anda berhenti? 620 00:52:33,810 --> 00:52:37,880 Tidak, karena kadang-kadang mungkin ada kesalahan yang terjadi. 621 00:52:37,880 --> 00:52:42,080 Mungkin kita tidak bisa membuka file atau kita tidak bisa membuat pohon lain 622 00:52:42,080 --> 00:52:49,340 atau beberapa jenis kesalahan yang terjadi dalam proses alokasi memori dan jadi kembali NULL. 623 00:52:49,340 --> 00:52:56,710 Sebuah kesalahan terjadi dan kemudian kita kembali dan berhenti. 624 00:52:56,710 --> 00:53:02,040 Jadi Anda ingin memastikan bahwa setiap waktu mungkin bahwa program Anda dapat berhenti, 625 00:53:02,040 --> 00:53:06,980 Anda ingin membebaskan semua memori Anda di sana. 626 00:53:06,980 --> 00:53:13,370 Ini tidak hanya akan berada di akhir dari fungsi utama yang Anda berhenti kode Anda. 627 00:53:13,370 --> 00:53:20,780 Anda ingin melihat kembali ke setiap contoh bahwa kode Anda berpotensi akan kembali prematur 628 00:53:20,780 --> 00:53:25,070 dan kemudian bebas apapun memori masuk akal. 629 00:53:25,070 --> 00:53:30,830 Katakanlah Anda sudah disebut membuat hutan dan kembali palsu. 630 00:53:30,830 --> 00:53:34,230 Maka Anda mungkin tidak akan perlu menghapus hutan Anda 631 00:53:34,230 --> 00:53:37,080 karena Anda tidak memiliki hutan belum. 632 00:53:37,080 --> 00:53:42,130 Tetapi pada setiap titik dalam kode di mana Anda akan kembali prematur 633 00:53:42,130 --> 00:53:46,160 Anda ingin memastikan bahwa Anda membebaskan memori yang mungkin. 634 00:53:46,160 --> 00:53:50,020 >> Jadi ketika kita sedang berhadapan dengan membebaskan memori dan memiliki potensi kebocoran, 635 00:53:50,020 --> 00:53:55,440 kita ingin tidak hanya menggunakan pertimbangan dan logika kita 636 00:53:55,440 --> 00:54:01,850 tetapi juga menggunakan Valgrind untuk menentukan apakah kita telah membebaskan semua memori kita baik atau tidak. 637 00:54:01,850 --> 00:54:09,460 Anda juga dapat menjalankan Valgrind pada Puff dan kemudian Anda harus juga lulus 638 00:54:09,460 --> 00:54:14,020 nomor yang benar dari argumen baris perintah untuk Valgrind. 639 00:54:14,020 --> 00:54:18,100 Anda dapat menjalankan itu, tapi output agak samar. 640 00:54:18,100 --> 00:54:21,630 Kami telah mendapat sedikit terbiasa dengan Speller, namun kita masih membutuhkan bantuan sedikit lebih, 641 00:54:21,630 --> 00:54:26,450 sehingga kemudian menjalankannya dengan bendera lagi seperti kebocoran-check = penuh, 642 00:54:26,450 --> 00:54:32,040 yang mungkin akan memberi kita beberapa output lebih bermanfaat pada Valgrind. 643 00:54:32,040 --> 00:54:39,040 >> Kemudian tip lain berguna ketika Anda debugging adalah perintah diff. 644 00:54:39,040 --> 00:54:48,520 Anda dapat mengakses pelaksanaan staf dari Huff, menjalankan bahwa pada file teks, 645 00:54:48,520 --> 00:54:55,400 dan kemudian output ke sebuah file biner, file biner Huff, untuk lebih spesifik. 646 00:54:55,400 --> 00:54:59,440 Kemudian jika Anda menjalankan isapan Anda sendiri pada file biner, 647 00:54:59,440 --> 00:55:03,950 maka idealnya, file teks outputted Anda akan menjadi identik 648 00:55:03,950 --> 00:55:08,200 dengan yang asli yang Anda berlalu masuk 649 00:55:08,200 --> 00:55:15,150 Di sini saya menggunakan hth.txt sebagai contoh, dan itulah yang dibicarakan di spec Anda. 650 00:55:15,150 --> 00:55:21,040 Itu benar-benar hanya HTH dan kemudian baris baru. 651 00:55:21,040 --> 00:55:30,970 Tapi yang pasti merasa bebas dan Anda pasti dianjurkan untuk menggunakan contoh lagi 652 00:55:30,970 --> 00:55:32,620 untuk file teks Anda. 653 00:55:32,620 --> 00:55:38,110 >> Anda bahkan dapat mengambil gambar di mungkin mengompresi dan kemudian dekompresi 654 00:55:38,110 --> 00:55:41,600 beberapa file yang Anda gunakan dalam Speller seperti Perang dan Damai 655 00:55:41,600 --> 00:55:46,710 atau Jane Austen atau sesuatu seperti itu - itu akan menjadi agak dingin - atau Austin Powers, 656 00:55:46,710 --> 00:55:51,880 jenis berurusan dengan file yang lebih besar karena kita tidak akan datang ke sana 657 00:55:51,880 --> 00:55:55,590 jika kita menggunakan alat berikutnya di sini, ls-l. 658 00:55:55,590 --> 00:56:01,150 Kami sudah terbiasa dengan ls, yang pada dasarnya berisi semua isi dalam direktori kami saat ini. 659 00:56:01,150 --> 00:56:07,860 Melewati di l bendera-benar menampilkan ukuran file tersebut. 660 00:56:07,860 --> 00:56:12,690 Jika Anda pergi melalui spesifikasi pset, itu benar-benar menuntun Anda melalui penciptaan file biner, 661 00:56:12,690 --> 00:56:16,590 huffing itu, dan Anda melihat bahwa untuk file yang sangat kecil 662 00:56:16,590 --> 00:56:23,910 biaya ruang mengompresi dan menerjemahkan semua informasi yang 663 00:56:23,910 --> 00:56:26,980 dari semua frekuensi, dan hal seperti itu melebihi manfaat yang sebenarnya 664 00:56:26,980 --> 00:56:30,000 mengompresi file di tempat pertama. 665 00:56:30,000 --> 00:56:37,450 Tetapi jika Anda menjalankannya pada beberapa file teks yang lebih panjang, maka Anda mungkin melihat bahwa Anda mulai mendapatkan beberapa keuntungan 666 00:56:37,450 --> 00:56:40,930 dalam mengompresi file-file tersebut. 667 00:56:40,930 --> 00:56:46,210 >> Dan akhirnya, kita memiliki GDB lama kita sobat, yang pasti akan berguna juga. 668 00:56:48,360 --> 00:56:55,320 >> Apakah kita memiliki pertanyaan tentang pohon Huff atau proses mungkin membuat pohon 669 00:56:55,320 --> 00:56:58,590 atau pertanyaan lain pada Puff Huff'n? 670 00:57:00,680 --> 00:57:02,570 Oke. Saya akan tinggal di sekitar untuk sedikit. 671 00:57:02,570 --> 00:57:06,570 >> Terima kasih, semua orang. Ini adalah Walkthrough 6. Dan semoga berhasil. 672 00:57:08,660 --> 00:57:10,000 >> [CS50.TV]