[Powered by Google Translate] Nate HARDISON: Në video në binar, ne tregojnë se si për të paraqesin grup të numrave të tërë, nga zero në deri, Duke përdorur vetëm shifrat zero dhe një. Në këtë video, ne jemi duke shkuar për të përdorur simbol binar të përfaqësojnë tekst, letra dhe të tilla, si dhe. Pse do të kemi shqetësojë për të bërë këtë? E pra, nën kapuç, një kompjuter vetëm të vërtetë kupton zero dhe ato, shifrat binare, pasi që këto mund të përfaqësohet lehtë me gjërat elektromagnetike. Për shembull, mendoj se e kujtesën e kompjuterit tuaj si një kohë të gjatë varg i poqat, ku secili individ llambë përfaqëson një zero nëse është e fikur, dhe një në qoftë se ajo është kthyer më. Në vend të përdorimit të një bandë e bulbs dritë, disa moderne memorie e bën këtë duke përdorur kapacitoreve që mbajnë një të ulët ngarkuar për të përfaqësuar një zero dhe një zvogëlim të lartë për të përfaqësuar një të. Ka teknika të tjera si. Gjithsesi, në mënyrë për të ruajtur diçka në kujtesë, ne kemi nevojë për parë të kthyer atë në diçka që mund të jetë në fakt përfaqësuara në hardware fizike. Kështu që le të mendojmë rreth asaj se si ne mund të përfaqësojnë letra me simbol binar. Në anglisht, ne kemi marrë 26 letra në alfabetit, A, B, C, D, dhe kështu me radhë, deri me Z. Ne mund të caktojë çdo një nga këto një numër, thonë zero përmes 25, dhe pastaj duke përdorur simbol binar, ne mund të përfaqësojë çdo numër si një Sekuenca nga zero dhe ato. Kjo nuk është shumë e keqe. Megjithatë, kjo nuk do të jetë e mjaftueshme. Me këtë sistem, ne nuk mund të vërtetë të dallojë në mes të Letrat e sipërme dhe të vogla. Në qoftë se ne duam kompjuterin tonë të jenë në gjendje të dallojnë në mes të dy rastet, atëherë ne kemi nevojë për një shtesë prej 26 numra. Dhe çfarë lidhje me periudha, presje, dhe shenjat e pikësimit të tjera? Në tastierën e mia, unë kam marrë 32 nga ata, duke përfshirë të gjitha të karaktere të veçanta si caret dhe simbol. Kjo nuk është përfshirë karaktere shifror, zero përmes nëntë, pasi ne ende duan të jenë në gjendje të shkruani numrat në decimal simbol në kompjuter, edhe në qoftë se kompjuteri vetëm të vërtetë kupton simbol binar nën kapuç. Dhe në fund, ne do të duhet për të përfaqësuar një karakter hapësirë ​​në mënyrë se Bar tonë Space punon. Pra, duke parafytyruar se si për të përfaqësuar tekstin në kompjuter merr pak më shumë se ne mund të kemi menduar fillimisht. Përveç kësaj, të marrë ne pastaj të dalë me encoding tonë Skema për të përfaqësuar karaktere si numrat. Megjithatë ne të vendosë për të shifroj karaktere të pashmangshme do të jetë arbitrare, siç e pamë më herët, kur kemi folur për përdorimin e Numrat zero përmes 25 të përfaqësojnë letra Një nëpërmjet Z. pse nuk e përdorin 10 nëpërmjet 35 kështu që ne mund të shpëtojë zero përmes nëntë për personazhet shifror? Nuk ka asnjë arsye të vërtetë, ne vetëm zgjodhi çfarëdo dukej më e mirë për ne. Kthehu në fillim të viteve 1960, ky ishte një problem i vërtetë. Prodhuesit të ndryshme kompjuterike janë përdorur skema të ndryshme encoding, dhe ky komunikim bëhet në mes të makinave të ndryshme një detyrë shumë e vështirë. Kombëtar Amerikan Standardeve Instituti, ANSI, formuar një komision për të zhvilluar një skemë të përbashkët. Dhe në vitin 1963, Kodi American Standard për Informim Shkëmbimi, zakonisht më i njohur si ASCII, ka lindur. ASCII ishte projektuar si një encoding shtatë-bit, e cila do të thotë që çdo karakter është përfaqësuar nga një kombinim nga shtatë zero dhe ato. Me ato dy vlerat e mundshme, zero ose një, për çdo nga shtatë copa, ka dy të shtatë ose 128 karaktere që mund të përfaqësohen me ASCII kodimin skemë. Pra 128 karaktere tingëllon si një shumë, e drejtë? E pra, mos harroni se ka 26 shkronja te vogle ne Anglisht, edhe 26 shkronja, shifra 10 karaktere, 32 shenjat e pikësimit dhe karakteret e veçanta, dhe një karakter hapësirë. Që na vë në 95, kështu që ne kemi një tjetër 33 karaktere që ne mund të përfaqësojnë. Pra, çfarë ka mbetur? E pra, në ditët e zhvillimit të ASCII, teleshkrues Makinat, të cilat janë makina shkrimi që janë përdorur për dërgoni mesazhe nëpër një rrjet, ishin përhapur. Dhe këto makina kishte karaktere shtesë përdoren për kontrollin e tyre, për shembull, për të të treguar atyre kur për të lëvizur shtypur kokën poshtë një linjë, linjë feed apo kyç të ri të linjës, kur do të shkojë në margjina majtë, kthimi topi, ose thjesht kthehen kyçe, dhe kur do të shkojnë prapa një hapësirë, Karakteri Backspace, dhe kështu me radhë. Këto karaktere janë quajtur karaktere kontrollit, dhe ata përbëjnë pjesën tjetër të caktuar ASCII. Pra, nëse ne shikojmë në një tryezë ASCII, shohim se i pari 32 numra, zero përmes 31, janë të rezervuara për kontroll karaktere. Por ne vetëm tha se ka pasur 33 karaktere kontrollit. Çfarë është marrëveshje? E pra, numri zero dhe 127, i pari dhe i fundit i Set ASCII, kanë modele të veçanta bit, të gjitha zero dhe të gjitha ato, respektivisht. Designers e vendosi ASCII, prandaj, për të ruajnë këto numra për karaktere të veçanta shtesë, domethënë karakterin e pavlefshme dhe karakteri DEL. Pavlefshëm dhe DEL ishin të destinuara për përpunim kasetë letër, e cila përdoret të jetë një mënyrë e përbashkët e të dhënave ruajtjen. Shirit letre ishte fjalë për fjalë vetëm një rrip të gjatë të letrës, dhe në intervale të rregullta në kasetë, ju do të shënoj vrima për të ruajtur të dhënat. Në varësi të gjerësisë së kasetë, çdo kolonë do të jetë në gjendje për të akomoduar pesë, gjashtë, shtatë, ose tetë bit. Për të përfaqësuar një grimë zero, ju do të bëjë asgjë për të kasetë, ju do të vetëm lënë një hapësirë ​​bosh. Për një grimë një, ju do të shënoj një vrimë. Karakteri null vetëm do të lërë një kolonë bosh, treguar të gjitha zero. Dhe karakteri DEL do të shënoj një kolonë të plotë të vrimave me shirit tuaj. Si rezultat i kësaj, ju mund të përdorni karakterin DEL për të fshirë informacion. Imagjinoni duke marrë një fletëvotim mbushur-nga zgjedhor dhe pastaj punching gjitha vrimat unpunched. Ju zhvlerësojë votën, sepse është e pamundur të tregoni se çfarë votat ishin origjinale. Ndërsa karakteri DEL është përdorur ende është moderne Delete kyç, karakteri null erdhi për t'u përdorur si Karakteri ndërprerja për vargjet C dhe disa formate të tjera të të dhënave. Ju mund të dini atë si karakter zero backslash, pasi kjo është se si ne përfaqësojmë atë me shkrim. Pra, përsëri në tryezën tonë ASCII. Pas para 32 karaktere kontrollit ardhur 95 karaktere shtypshëm. Ka vendime të ftohtë çift projektimit me vlerë duke folur për këtu. Së pari, karaktere dhjetore shifra, zero përmes nëntë, korrespondojnë me numrat 48 deri 57, të cilat duket pavënë re deri ne shikojmë në numrat 48 deri 57 shkruar në simbol binar. Nëse ne bëjmë këtë, atëherë shohim se personazhi shifra, zero, korrespondon me 0110000, harta një të 0110001, dy të 0110010, dhe kështu në. Shih model? Secili karakter shifër është vendosur tek korrespondon saj ekuivalente në simbol binar, prefixed me 011. Tjetra, ju vëreni se letra uppercase të fillojë në 65, me MËDHAJA A, por me shkronja Fjala nuk fillojnë deri në 97. Pra, ka 32 hapësira në mes. Kjo duket e çuditshme. Ata janë vetëm 26 shkronja në alfabetin. Pse ndarë ato si kjo? Përsëri, nëse ne shikojmë në përfaqësitë binare, ne mund të shohim një model. Uppercase Një është përfaqësuara nga 1000001, dhe me të vogla një është përfaqësuara nga 1100001. Uppercase B është përfaqësuara nga 1000010, dhe b vogle është përfaqësuara nga 1100010. Mund të ju tregoni se çfarë po ndodh këtu? Pak që është i dyti nga e majta, në të dy pestat, për pozicionin 32ths, është 0 për të gjithë të uppercase letra, dhe 1 për të gjitha shkronja Fjala. Kjo do të thotë konvertimin nga uppercase në Fjala, dhe anasjelltas, është një çështje e një rrokullisje bit thjeshtë. Kështu që na sjell deri në fund të tabelës ASCII. A mund të mendoni për ndonjë gjë që ne kemi harruar? E pra, ajo që për enye spanjisht, ose Greke apo alfabetet cirilik? Dhe si për kineze karaktere? Ka shumë që është lënë jashtë ASCII. Megjithatë, një tjetër i quajtur Unicode standarde ka qenë zhvilluar për të mbuluar të gjitha këto karaktere dhe shumë më tepër. Por kjo është një temë për një tjetër kohë. Emri im është Nate Hardison. Kjo është CS50.