[Powered by Google Translate] NATE Hardison: Ve videu na binární, ukážeme, jak se představují sadu celých čísel, od nuly nahoru, použití pouze číslice nula a jedna. V tomto videu, budeme používat binární notaci představují text, dopisy a jako, stejně. 

Proč bychom se obtěžovat udělat? No, pod kapotou, počítač opravdu jen chápe nul a jedniček, binární číslice, protože tyto mohou být reprezentovány snadno s elektromagnetickými věci. 

Například, myslím, že paměti vašeho počítače, jako je dlouhá string žárovek, přičemž každý jednotlivý žárovka představuje nulu, pokud je vypnutý, a jeden pokud je zapnutý. Namísto použití spoustu žárovek, některé moderní paměti to pomocí kondenzátorů, které drží nízké účtovat představují nulu a vysokou poplatek reprezentovat jeden. 

Existují i ​​jiné techniky, stejně. Každopádně, aby uložit něco do paměti, musíme nejprve převést do něčeho, co může být skutečně zastoupeny ve fyzickém hardware. Takže pojďme si o tom, jak bychom mohli reprezentovat dopisy s binární zápis. V angličtině, máme 26 písmen v abecedním, A, 

B, C, D, a tak dále, a to až do Z. Můžeme přiřadit každému z Tyto číslo, říká od nuly do 25, a pak se za použití binární zápis, můžeme reprezentovat každého čísla jako posloupnost nul a jedniček. To není tak špatné. Nicméně, že to nebude stačit. U tohoto systému, může se ve skutečnosti rozlišovat mezi horní a malá písmena. Pokud chceme, aby naše počítač bude schopen rozlišovat mezi dva případy, pak musíme dalších 26 čísel. A co období, čárky, a jiná interpunkční znaménka? 

Na mé klávesnice, mám 32 těch, včetně všech speciální znaky, jako je stříška a ampersand. To není bez číselných znaků, nula až devět, protože stále chceme být schopni psát čísla v desítkové soustavě zápis na počítači, a to i v případě, že počítač pouze skutečně chápe binární zápis pod kapotou. 

A konečně, budeme muset představovat mezeru, aby že naše Space Bar funguje. Tak přijít na to, jak reprezentovat textu na počítači trvá trochu víc, než jsme si mysleli původně. Navíc předpokládejme, že jsme pak přijít s vlastní kódování režim k reprezentaci znaků jako čísla. Nicméně jsme se rozhodli kódovat znaky, bude nevyhnutelně libovolný, jak jsme viděli dříve, když jsme hovořili o používání Čísla nulu až 25 představují písmena do Z. Proč nevyužít 10 až 35 tak, že můžeme ušetřit nula až devět pro číselných znaků? 

Není tam žádný skutečný důvod, jen jsme zvolili, co se zdálo pro nás nejlepší. Zpět na počátku 1960, to byl skutečný problém. Různé výrobci počítačů byly pomocí různé kódování režimy, a to z komunikace mezi různými stroji velmi obtížný úkol. American National Standards Institute, ANSI, tvořil výbor vyvinout společný systém. A v roce 1963, americký standardní kód pro informace Interchange, více obyčejně známý jako ASCII, se narodil. 

ASCII byl navržen jako sedm-bit kódování, které znamená, že každý znak je reprezentován kombinací sedmi nul a jedniček. S těmito dvěma možnými hodnotami, nula nebo jedna, pro každý ze sedmi bitů, jsou dvě na sedmou nebo 128 znaky, které mohou být reprezentovány s ASCII kódování schéma. Takže 128 znaků zní jako hodně, ne? No, nezapomeňte, že existují 26 malá písmena v Angličtina, dalších 26 velká písmena, číslice 10 znaků, 32 interpunkce a speciálních znaků, a jeden znak mezery. 

To nás staví na 95, takže máme další 33 znaky, které jsme mohou představovat. 

Takže co zbývá? No, ve dnech vývoje ASCII, dálnopisu stroje, které jsou psací, které se používají k odesílat zprávy přes síť, byly rozšířené. A tyto stroje měly další znaky používané k kontrolovat, například, říci, když se pohybovat tiskovou hlavu dolů řádku, posunu řádků nebo nový řádek klíč, když se přesunete do levého okraje, návrat vozíku, nebo jednoduše vrátit klíče, a když se vrátíte o jednu mezeru, backspace charakter, a tak dále. 

Tyto znaky se nazývají řídicí znaky, a tvoří zbytek sady ASCII. Takže pokud se podíváme na ASCII tabulky, zjistíme, že první 32 čísel, nula až 31, jsou vyhrazena pro ovládání znaků. Ale my to prostě řekl, že to tam bylo 33 kontrolních znaků. O co jde? No, číslo nula a 127, první a poslední Znaková sada ASCII, mají zvláštní bitové vzory, všechny nuly a všechny ty, resp. 

Návrháři ASCII rozhodl proto, aby zachování těchto čísel pro další speciální znaky, sice null charakter a charakter DEL. Null a DEL byly určeny pro editaci děrné pásky, které používá být běžný způsob ukládání dat. Papírová páska byla doslova jen dlouhý pás papíru, a na v pravidelných intervalech na pásku, měli byste punč otvory pro ukládání dat. V závislosti na šířce pásky, každý sloupec se schopna pojmout pět, šest, sedm, nebo osm kousků. 

Chcete-li představují nulovou trochu, že nebudete dělat nic na pásku, měli byste nech mezeru. Pro jeden bit, byste díru. Null charakter by jen tak nechat prázdný sloupec, s uvedením všech nuly. A postava DEL by udeřil sloupec plný děr přes pásku. V důsledku toho, může použít znak DEL odstranit informace. Představte si, že vyplněný volební hlasování a poté děrování všech neděrované otvory. 

Můžete vyvrátit hlasovací lístek, protože to je nemožné, aby říct, co původní hlasy byly. Zatímco charakter DEL se stále používá, je moderní Odstranění klíče, nulový znak přišel být používán jako ukončovací znak pro řetězce C a některé další formáty dat. Můžete víte, že jako znak zpětného lomítka nulové, protože to je to, jak jsme ji zastupují v písemné formě. Takže zpět k našemu ASCII tabulky. Po prvních 32 řídicí znaky přijde 95 tisknutelných znaků. 

Existuje několik skvělých rozhodnutí o návrhu stojí mluvil o tom tady. Za prvé, desetinná číslice znaky, nula až devět, odpovídají číslům 48 až 57, který se zdá být všední dokud se podíváme na čísla 48 až 57 napsán v binárním zápisu. Pokud to uděláme, pak vidíme, že číslice znak, nula, odpovídá 0110000, jeden map do 0110001, dva 0110010, a tak dále. Podívejte se na vzor? Každá číslice znak je mapována na jeho odpovídající ekvivalent v binární notaci, s předponou 011. Další na řadě, zjistíte, že velká písmena začínají na 65, s velkým A, ale malými písmeny se nespustí, dokud 97. Takže tam je 32 míst v mezi. To se zdá divné. Jsou jen 26 písmen v abecedě. 

Proč je rozdělit takto? Opět platí, že pokud se podíváme na binární reprezentace, můžeme viz vzor. Velká A je zastoupena 1000001, a malá písmena a je zastoupené 1100001. Velká písmena B je zastoupena 1000010, a malá b je zastoupené 1100010. Můžeš mi říct, co se tady děje? Bit, že je to druhá zleva, ve dvou až pětiny, pro 32ths pozici, je 0 pro všechny velká Písmena, a 1 pro všechny malými písmeny. 

To znamená, že převod z velká na malá písmena, a naopak, je otázkou jednoduchého bit flip. Tak, že se dostáváme na konec ASCII tabulky. Vzpomenete si na něco jsme zapomněli? No, co španělské enye, nebo Řek nebo cyrilice? A co čínské znaky? Tam je hodně, že to bylo vynecháno ASCII. Nicméně, jiný standard nazvaný Unicode byla vyvinut pro pokrytí všech těchto postavy a mnoho dalších. 

Ale to je téma pro jinou dobu. Mé jméno je Nate Hardison. To je CS50.