[Powered by Google Translate] Nate Hardison: Vo videu na binárne, ukážeme, ako sa predstavujú súbor celých čísel, od nuly hore, použitie iba číslice nula a jedna. V tomto videu, budeme používať binárne notáciu predstavujú text, písmená a taký, rovnako. Prečo by sme sa obťažovať urobiť? No, pod kapotou, počítač naozaj len chápe núl a jedničiek, binárne číslice, pretože tieto môžu byť reprezentované ľahko s elektromagnetickými veci. Napríklad, myslím, že pamäte vášho počítača, ako je dlhá string žiaroviek, pričom každý jednotlivý žiarovka predstavuje nulu, ak je vypnutý, a jeden ak je zapnutý. Namiesto použitia veľa žiaroviek, niektoré moderné pamäti to pomocou kondenzátorov, ktoré drží nízke účtovať predstavujú nulu a vysokú poplatok reprezentovať jeden. Existujú aj iné techniky, rovnako. Každopádne, aby uložiť niečo do pamäti, musíme najprv previesť do niečoho, čo môže byť skutočne zastúpené vo fyzickom hardware. Takže poďme si o tom, ako by sme mohli reprezentovať listy s binárne zápis. V angličtine, máme 26 písmen v abecednom, A, B, C, D, a tak ďalej, a to až do Z. Môžeme priradiť každému z Tieto číslo, hovorí od nuly do 25, a potom sa za použitia binárny zápis, môžeme reprezentovať každého čísla ako postupnosť núl a jedničiek. To nie je tak zlé. Však, že to nebude stačiť. U tohto systému, môže sa v skutočnosti rozlišovať medzi horné a malé písmená. Ak chceme, aby naše počítač bude schopný rozlišovať medzi dva prípady, potom musíme ďalších 26 čísel. A čo období, čiarky, a iné interpunkčné znamienka? Na mojej klávesnice, mám 32 tých, vrátane všetkých špeciálne znaky, ako je strieška a ampersand. To nie je bez číselných znakov, nula až deväť, pretože stále chceme byť schopní písať čísla v desiatkovej sústave zápis na počítači, a to aj v prípade, že počítač len skutočne chápe binárny zápis pod kapotou. A konečne, budeme musieť predstavovať medzeru, aby že naše Space Bar funguje. Tak prísť na to, ako reprezentovať textu na počítači trvá trochu viac, než sme si mysleli pôvodne. Navyše predpokladajme, že sme potom prísť s vlastnou kódovanie režim reprezentovať znaky ako čísla. Avšak sme sa rozhodli kódovať znaky, bude nevyhnutne ľubovoľný, ako sme videli predtým, keď sme hovorili o použití Čísla nulu až 25 predstavujú písmená do Z. Prečo nevyužiť 10 až 35 tak, že môžeme ušetriť nula až deväť pre číselných znakov? Nie je tam žiadny skutočný dôvod, len sme zvolili, čo sa zdalo pre nás najlepšie. Späť na začiatku 1960, to bol skutočný problém. Rôzne výrobcovia počítačov boli pomocou rôzne kódovania režimy, a to z komunikácie medzi rôznymi strojmi veľmi náročná úloha. American National Standards Institute, ANSI, tvoril výbor vyvinúť spoločný systém. A v roku 1963, americký štandardný kód pre informácie Interchange, viac obyčajne známy ako ASCII, sa narodil. ASCII bol navrhnutý ako sedem-bit kódovanie, ktoré znamená, že každý znak je reprezentovaný kombináciou siedmich núl a jedničiek. S týmito dvoma možnými hodnotami, nula alebo jedna, pre každý zo siedmich bitov, sú tam dva na siedmom alebo 128 znaky, ktoré môžu byť reprezentované s ASCII kódovanie schéma. Takže 128 znakov znie ako veľa, nie? No, nezabudnite, že existujú 26 malé písmená v Angličtina, ďalších 26 veľké písmená, číslice 10 znakov, 32 interpunkcie a špeciálnych znakov, a jeden znak medzery. To nás stavia na 95, takže máme ďalší 33 znaky, ktoré sme môžu predstavovať. Takže čo zostáva? No, v dňoch vývoja ASCII, ďalekopisu stroje, ktoré sú písacie ktoré sa používajú na odosielať správy cez sieť, boli rozšírené. A tieto stroje mali ďalšie znaky používané na kontrolovať, napríklad, aby im povedal, keď presunúť tlačovú hlavu dole riadku, Line Feed, nový alebo tlačidlo linky, keď sa presuniete do ľavého okraja, návrat vozíka, alebo jednoducho vrátiť kľúče, a keď sa vrátite o jednu medzeru, backspace charakter, a tak ďalej. Tieto znaky sa nazývajú riadiace znaky, a tvoria zvyšok sady ASCII. Takže ak sa pozrieme na ASCII tabuľky, zistíme, že prvá 32 čísel, nula až 31, sú vyhradené pre ovládanie znakov. Ale my to jednoducho povedal, že to tam bolo 33 kontrolných znakov. O čo ide? No, číslo nula a 127, prvý a posledný z Znaková sada ASCII, majú špeciálne bitové vzory, všetky nuly a všetky ty, resp. Návrhári ASCII rozhodol preto, aby zachovanie týchto položiek na ďalšie špeciálne znaky, totiž null znak a znak DEL. Null a DEL boli určené pre editáciu dierne pásky, ktoré používa byť bežný spôsob ukladania dát. Papierová páska bola doslova dlhý pás papiera, a na v pravidelných intervaloch na pásku, mali by ste punč otvory pre ukladanie dát. V závislosti na šírke pásky, každý stĺpec sa schopná pojať päť, šesť, sedem, alebo osem kúskov. Ak chcete predstavujú nulovú trochu, že nebudete robiť nič na pásku, mali by ste nechaj medzeru. Pre jeden bit, by ste dieru. Null charakter by len tak nechať prázdny stĺpec, s uvedením všetkých nuly. A postava DEL by udrel stĺpec plný dier cez pásku. V dôsledku toho, môže použiť znak DEL odstrániť informácie. Predstavte si, že vyplnený volebný hlasovanie a potom dierovanie všetkých nedierované otvory. Môžete vyvrátiť hlasovací lístok, pretože to je nemožné, aby povedať, čo pôvodné hlasy boli. Kým znak DEL sa stále používa, je moderné Odstránenie kľúče, nulový znak prišiel byť používaný ako ukončovacie znak pre reťazce C a niektoré ďalšie formáty dát. Môžete viete, že ako znak spätného lomítka nulové, pretože to je to, ako sme ju zastupujú v písomnej forme. Takže späť k nášmu ASCII tabuľky. Po prvých 32 riadiace znaky príde 95 tlačiteľných znakov. Existuje niekoľko skvelých rozhodnutia o návrhu stojí hovoril o tom tu. Po prvé, desatinné číslice znaky, nula až deväť, zodpovedajú číslam 48 až 57, ktorý sa zdá byť všedný kým sa pozrieme na čísla 48 až 57 napísaný v binárnom zápise. Ak to urobíme, potom vidíme, že číslice znak, nula, zodpovedá 0110000, jeden máp do 0110001, dva 0110010, a tak ďalej. Pozrite sa na vzor? Každá číslica znak je mapovaná na jeho zodpovedajúce ekvivalent v binárnej notácii, s predponou 011. Ďalší na rade, zistíte, že veľké písmená začínajú na 65, s veľkým A, ale malými písmenami sa nespustí, kým 97. Takže tam je 32 miest v medzi. To sa zdá divné. Sú len 26 písmen v abecede. Prečo je rozdeliť takto? Opäť platí, že ak sa pozrieme na binárne reprezentácie, môžeme pozri vzor. Veľká je zastúpená 1000001, a malé písmená, je zastúpené 1100001. Veľké písmená B je zastúpená 1000010, a malá b je zastúpené 1100010. Môžeš mi povedať, čo sa tu deje? Bit, že je to druhá zľava, v dvoch až pätiny, pre 32ths pozíciu, je 0 pre všetky veľké Písmená, a 1 pre všetky malými písmenami. To znamená, že prevod z veľká na malé písmená, a naopak, je otázkou jednoduchého bit flip. Tak, že sa dostávame na koniec ASCII tabuľky. Spomeniete si na niečo sme zabudli? No, čo španielske enye, alebo Riek alebo cyrilika? A čo čínske znaky? Je tu veľa, že to bolo vynechané ASCII. Avšak, iný štandard nazvaný Unicode bola vyvinutý pre pokrytie všetkých týchto postavy a mnoho ďalších. Ale to je téma pre inú dobu. Moje meno je Nate Hardison. To je CS50.