[Powered by Google Translate] NATE Hardison: W wideo na binarny, pokażemy jak stanowią zbiór liczb całkowitych od zera w górę, używając tylko cyfry zero i jeden. W tym filmie, będziemy używać notacji binarnej reprezentowania tekstu, liter i takie, jak również. 

Dlaczego mielibyśmy przejmować to zrobić? Cóż, pod maską, tak naprawdę tylko komputer rozumie zer i jedynek, cyfry binarne, ponieważ są można łatwo reprezentowane elektromagnetycznych rzeczy. 

Na przykład, myślę o pamięci komputera, jak długo ciąg żarówek, przy czym każdy żarówka oznacza zero, jeśli jest wyłączony, a jeden jeśli jest włączony. Zamiast używać kilka żarówek, niektóre nowoczesne pamięć czy to przy użyciu kondensatorów, które posiadają niski ładować do reprezentowania zero i wysoki ładunek do reprezentowania jednego. 

Istnieją również inne techniki. W każdym razie, w celu zapisania w pamięci nic, musimy najpierw przekształcić go w coś, co może być w rzeczywistości przedstawione w sprzętowym. Warto więc zastanowić się, jak możemy reprezentować listów z zapis binarny. W języku angielskim mamy 26 liter w alfabetycznych, A, 

B, C, D, i tak dalej, aż do Z. Możemy przypisać każdy z Te liczby, np. od zera do 25, a następnie za pomocą Zapis binarny, możemy reprezentować każdą liczbę jako ciąg zer i jedynek. To nie jest tak źle. Jednak, że nie będzie wystarczająco. Z tego systemu, nie możemy właściwie odróżnić małe i duże litery. Jeśli chcemy, komputer w stanie odróżnić te dwie sprawy, to musimy dodatkowo 26 numerów. A co z okresów, przecinków i inne znaki interpunkcyjne? 

Na klawiaturze, mam 32 osób, w tym wszystkie znaki specjalne, takie jak karetki i Ampersand. To nie w tym samych cyfr, od zera do dziewięciu, ponieważ chcemy nadal być w stanie wpisać numery w decimal zapis na komputerze, nawet jeśli komputer tylko naprawdę rozumie notacji binarnej pod maską. 

I wreszcie, musimy reprezentować znak spacji tak że nasza Spacja działa. Więc dowiedzieć się, jak do reprezentacji tekstu na komputerze zajmuje trochę więcej niż moglibyśmy początkowo myślałem. Dodatkowo zakładamy, że wtedy wymyślić własnego kodowania Program do reprezentowania znaków jako liczby. Jednak zdecydujemy się kodować znaków, będzie nieuchronnie arbitralny, jak widzieliśmy wcześniej, kiedy rozmawialiśmy o użyciu numery od zera do 25 w celu reprezentowania liter do Z. Dlaczego nie użyć 10 przez 35, tak, że możemy zapisać od zera do dziewięciu na cyfrowych znaków? 

Nie ma prawdziwego powodu, po prostu wybierz co wydawało dla nas najlepsze. Powrót na początku 1960 roku, to był prawdziwy problem. Różni producenci komputerów używali różnych systemów kodowania, a to sprawiło, komunikacja różnych maszyn zadanie bardzo trudne. American National Standards Institute, ANSI, utworzyła komisję do opracowania wspólnego systemu. A w 1963 roku, American Standard Code Informacji Interchange, bardziej znany jako ASCII, urodził. 

ASCII został zaprojektowany jako siedmio-bitowym kodowaniem, które Oznacza to, że każdy jest reprezentowany przez połączenie siedmiu zer i jedynek. Z tych dwóch możliwych wartości zero lub jeden, dla każdego siedmiu bitów, są dwa do siódmego lub 128 znaków, które mogą być reprezentowane przez ASCII kodowanie programu. Więc 128 znaków brzmi jak dużo, prawda? Cóż, należy pamiętać, że istnieje 26 małych liter Angielski, kolejne 26 wielkie litery, znaki, cyfry 10 32 interpunkcji i znaki specjalne, i jednym znaku. 

To stawia nas na 95, więc mamy kolejne 33 znaków, że mamy może reprezentować. 

Co więc pozostaje? Cóż, w czasach rozwoju ASCII, dalekopisowej maszyny, maszyny do pisania, które są używane do wysyłać wiadomości w sieci, były powszechne. A te maszyny miały dodatkowe znaki używane do kontrolować ich, na przykład, gdy ich powiedzieć przenieść wydrukować głową w dół linii, zasilanie linii lub linia, nowy klucz kiedy przejść do lewego marginesu, powrót karetki, lub po prostu zwrócić klucz i kiedy wrócić jednego pomieszczenia, znak backspace, i tak dalej. 

Znaki te są nazywane znaków sterujących, a oni resztę stanowi zestaw ASCII. Więc jeśli spojrzymy na ASCII tabeli widzimy, że pierwszy 32 numerów, zero do 31 są zarezerwowane dla kontroli znaków. Ale po prostu powiedział, że nie było 33 kontroli znaków. O co chodzi? Cóż, liczba zero i 127, pierwszy i ostatni ASCII, mają specjalne wzorce bitowe, wszystkie zera i wszystko z nich, odpowiednio. 

Projektanci ASCII postanowił zatem zachować te numery, na dodatkowych znaków specjalnych, mianowicie znak null i znak DEL. Null i DEL są przeznaczone do montażu na taśmie papierowej, które kiedyś się popularnym sposobem przechowywania danych. Papierowa taśma była dosłownie długi pasek papieru, a na regularnych odstępach czasu na taśmie, można uderzyć otwory do przechowywania danych. W zależności od szerokości taśmy, każda kolumna będzie w stanie pomieścić pięć, sześć, siedem lub osiem bitów. 

Do reprezentowania zero trochę, że nie zrobisz nic do taśmy, to że zostawić puste miejsce. Na jeden bit, można uderzyć dziurę. Znak null byłoby zostawić pustą kolumnę, wskazując wszystkie zer. I znak DEL by uderzyć kolumnę pełna dziur pośrednictwem taśmy. W rezultacie, można użyć znaku DEL, aby usunąć informacje. Wyobraź sobie wypełnioną kartę do głosowania, a następnie wyborów wbicie wszystkich unpunched otwory. 

Możesz unieważnić głosowanie, bo to niemożliwe powiedzieć, co oryginalne głosy były. Choć znak DEL jest nadal używany jest nowoczesny Usunięcie klucza znak null zaczęto jako znak kończący na smyczki C i inne formaty danych. Może wiesz to jako znak zera odwrotnym ukośnikiem, ponieważ jest to w jaki sposób reprezentuje ją na piśmie. Więc z powrotem do naszego ASCII tabeli. Po pierwsze 32 znaki sterujące pochodzą z 95 wydruku znaków. 

Istnieje kilka fajnych decyzje projektowe warto mówisz tutaj. Po pierwsze, liczba dziesiętna znaków, od zera do dziewięciu, odpowiadają numerom 48 przez 57, który wydaje nijaki, dopóki nie spojrzeć na liczby 48 przez 57 napisany w zapisie binarnym. Jeśli to zrobimy, to widzimy, że cyfrowy charakter, zero odpowiada 0110000, jeden do 0110001 mapy, dwa do 0110010, i tak dalej. Zobacz wzór? Każda cyfra znak jest mapowany na odpowiadający jej odpowiednik w zapisie dwójkowym, z prefiksem 011. Następna w kolejce, można zauważyć, że wielkie litery zaczynają się od 65, z wielkiej litery A, ale w małych liter nie zaczyna się aż do 97. Tak więc są 32 miejsca pomiędzy. To wydaje się dziwne. Oni są tylko 26 liter w alfabecie. 

Dlaczego podzielić je w ten sposób? Ponownie, jeśli spojrzymy na binarny, możemy patrz wzór. Wielkie jest reprezentowana przez 1000001, a małe jest reprezentowana przez 1100001. Duże litery B reprezentowany jest przez 1000010, i małe b jest reprezentowana przez 1100010. Czy możesz powiedzieć, co się tu dzieje? Bit to drugi od lewej, w dwóch do piąte, dla 32ths pozycji 0 dla wszystkich wielkich liter listów i 1 dla wszystkich małych liter. 

To oznacza, że ​​konwersja z wielkimi literami na małe i odwrotnie, jest sprawą prostą klapki bitowym. Tak, że daje nam końcu tabeli ASCII. Czy można myśleć o niczym zapomnieliśmy? A co z hiszpańskiego enye, lub Greckiego lub cyrylicy? A jak o chińskie znaki? Jest wiele, co zostało pominięte w ASCII. Jednak inny standard Unicode jest nazywana opracowany, aby pokryć wszystkie te znaków i wiele innych. 

Ale to temat na inny czas. Nazywam się Nate Hardison. To CS50.