TALARE 1: Okej, sÃ¥ det hÃ¤r Ã¤r CS50 Detta Ã¤r slutet av veckan fem. Och minns att fÃ¶rra gÃ¥ngen vi bÃ¶rjade titta pÃ¥ snyggare uppgifter strukturer som bÃ¶rjade lÃ¶sa problem, som bÃ¶rjade infÃ¶ra nya problem, men nyckeln till detta var den typ av gÃ¤ng som vi bÃ¶rjade gÃ¶ra frÃ¥n nod till nod. SÃ¥ det hÃ¤r Ã¤r naturligtvis en enskilt lÃ¤nkad lista. Och genom att var fÃ¶r sig kopplade, Jag menar att det finns bara en trÃ¥d mellan var och en av dessa noder. SlÃ¥r ut kan du gÃ¶ra snyggare saker som dubbelt lÃ¤nkade listor dÃ¤r du har en pil gÃ¥r i bÃ¥da riktningarna, vilket kan hjÃ¤lpa till med vissa effektivitetsvinster. Men detta lÃ¶ste problemet? Vilket problem kunde detta lÃ¶sa? VarfÃ¶r vi bryr oss pÃ¥ mÃ¥ndag? VarfÃ¶r, i teorin, vi bryr oss pÃ¥ mÃ¥ndag? Vad gÃ¶r den? 

PUBLIK: Vi kan dynamiskt Ã¤ndra storlek pÃ¥ den. 

TALARE 1: OK, sÃ¥ vi kan dynamiskt Ã¤ndra storlek pÃ¥ den. Bra gjort bÃ¥de av er. SÃ¥ du kan dynamiskt Ã¤ndra storlek hÃ¤r datastruktur, medan en matris, minns, mÃ¥ste du veta en priori hur mycket utrymme du vill och om du behÃ¶ver lite mer utrymme, Ã¤r du typ av av lycka. Du mÃ¥ste skapa en helt ny uppsÃ¤ttning. Du mÃ¥ste flytta alla dina data frÃ¥n en till den andra, smÃ¥ningom befria gamla array om du kan, och sedan fortsÃ¤tta. Vilket kÃ¤nns bara mycket kostsamt och mycket ineffektiv, och faktiskt kan det vara. Men detta Ã¤r inte allt bra. Vi betalar ett pris, vad som var en av de mer uppenbara priser vi betala med hjÃ¤lp av en lÃ¤nkad lista? 

PUBLIK: Vi mÃ¥ste anvÃ¤nda dubbel utrymme fÃ¶r var och en. TALARE 1: Ja, sÃ¥ vi behÃ¶ver minst dubbelt sÃ¥ mycket plats. I sjÃ¤lva verket, insÃ¥g jag att detta bildens Ã¤ven lite missvisande, eftersom pÃ¥ CS50 IDE i en hel del modern datorer, en pekare eller en adress Ã¤r i sjÃ¤lva verket inte fyra byte. Det Ã¤r ofta dessa dagar Ã¥tta byte, som : den nedersta rektanglar dÃ¤r i verkligheten Ã¤r typ av dubbelt sÃ¥ stor som vad jag har ritat, vilket innebÃ¤r att du anvÃ¤nder tre gÃ¥nger sÃ¥ mycket utrymme som vi skulle ha annars. Nu samtidigt, vi Ã¤r fortfarande talar byte, eller hur? Vi Ã¤r inte nÃ¶dvÃ¤ndigtvis talar megabyte eller gigabyte, sÃ¥vida dessa uppgifter strukturer blir stora. 

Och sÃ¥ idag bÃ¶rjar vi att Ã¶vervÃ¤ga hur vi kan utforska data mer effektivt om i Faktum Ã¤r att uppgifterna blir stÃ¶rre. Men lÃ¥t oss fÃ¶rsÃ¶ka canonicalize verksamheten fÃ¶rst att du kan gÃ¶ra pÃ¥ dessa typer av datastrukturer. SÃ¥ nÃ¥got som en lÃ¤nkad Listan stÃ¶der generellt operationer gillar bort, infoga och sÃ¶ka. Och vad menar jag med det? Det betyder bara att vanligtvis om folk anvÃ¤nder lÃ¤nkad lista, de eller nÃ¥gon annan har genomfÃ¶rt funktioner som radera, infoga, och sÃ¶ka, sÃ¥ att du kan faktiskt gÃ¶ra nÃ¥got anvÃ¤ndbar med datastrukturen. SÃ¥ lÃ¥t oss ta en snabb titt pÃ¥ hur vi kan genomfÃ¶ra lite kod fÃ¶r en lÃ¤nkad lista som fÃ¶ljer. 

SÃ¥ det hÃ¤r Ã¤r bara nÃ¥gra C-kod, inte ens ett komplett program att jag verkligen snabbt piskade upp. Det Ã¤r inte online i distributionen kod, eftersom det kommer faktiskt inte kÃ¶ra. Men mÃ¤rker jag har bara med en kommentar sade, dot dot dot, det finns nÃ¥got dÃ¤r dot dot dot, nÃ¥got dÃ¤r. Och lÃ¥t oss titta bara pÃ¥ vad saftiga delar. SÃ¥ pÃ¥ linje tre, pÃ¥minna om att detta Ã¤r nu Vi fÃ¶reslog att fÃ¶rklara en nod sista tiden, en av de rektangulÃ¤ra fÃ¶remÃ¥l. Den har en int som vi kallar N, men vi skulle kunna kalla det nÃ¥got, och sedan en struct nod stjÃ¤rna kallas nÃ¤sta. Och bara fÃ¶r att vara tydlig, det andra line, on line sex, vad Ã¤r det? Vad gÃ¶r den fÃ¶r oss? Eftersom det verkligen ser mer kryptiska Ã¤n vÃ¥ra vanliga variabler. 

PUBLIK: Det gÃ¶r det gÃ¥ Ã¶ver en. 

TALARE 1: Det gÃ¶r det gÃ¥ Ã¶ver en. Och fÃ¶r att vara mer exakt, det kommer att lagra adressen av den nod som Ã¤r tÃ¤nkt att vara semantiskt bredvid den, eller hur? SÃ¥ det kommer inte att nÃ¶dvÃ¤ndigtvis flytta nÃ¥gonting. Det Ã¤r bara att gÃ¥ till lagra ett vÃ¤rde, som Ã¤r kommer att vara den adress av nÃ¥gon annan nod, och det Ã¤r dÃ¤rfÃ¶r vi har sagt struct nod stjÃ¤rna, stjÃ¤rnan betecknar en pekare eller en adress. OK, sÃ¥ nu om du antar att vi har denna N tillgÃ¤ngliga fÃ¶r oss, och lÃ¥t oss antar att nÃ¥gon annan har infÃ¶rt en massa heltal in i en lÃ¤nkad lista. Och det lÃ¤nkade listan Ã¤r pekas pÃ¥ av nÃ¥gon punkt en variabel som heter lista som Ã¤r passerade hÃ¤r som en parameter, Hur gÃ¶r jag linje 14 genomfÃ¶rande sÃ¶kning? Med andra ord, om jag genomfÃ¶ra funktion vars syfte i livet Ã¤r att ta en int och sedan bÃ¶rjan av en lÃ¤nkad lista, som Ã¤r en pekare till den lÃ¤nkade listan. Liksom fÃ¶rsta, som jag tror David var vÃ¥r volontÃ¤r pÃ¥ mÃ¥ndag, Han pekade pÃ¥ hela lÃ¤nkad lista, det Ã¤r som om vi passerar David i vÃ¥r argument hÃ¤r. Hur ska vi gÃ¶ra gÃ¥ igenom den hÃ¤r listan? Tja, visar det sig att Ã¤ven om pekare Ã¤r relativt nya nu till oss, Vi kan gÃ¶ra detta relativt rÃ¤ttframt. 

Jag kommer att gÃ¥ vidare och deklarerar en temporÃ¤r variabel som enligt praxis Ã¤r att bara gÃ¥ att kallas pekare eller PTR, men du kan kalla det vad du vill. Och jag kommer att initiera det till bÃ¶rjan av listan. SÃ¥ du kan slags tÃ¤nka pÃ¥ detta som jag lÃ¤raren hÃ¤romdagen, typ av pekar pÃ¥ nÃ¥gon bland vÃ¥ra mÃ¤nniskor som volontÃ¤rer. SÃ¥ jag Ã¤r en temporÃ¤r variabel som Ã¤r bara pekar pÃ¥ samma sak att vÃ¥r tillfÃ¤llighet namnges volontÃ¤r David var ocksÃ¥ pÃ¥peka. Nu nÃ¤r pekaren inte null, eftersom Ã¥terkallelse att noll Ã¤r nÃ¥gra speciella sentinel vÃ¤rde den avgrÃ¤nsar slutet av listan, sÃ¥ medan jag inte pekar pÃ¥ marken som vÃ¥r sista volontÃ¤r var, lÃ¥t oss gÃ¥ vidare och gÃ¶r fÃ¶ljande. Om pointer-- och nu har jag slags vill att gÃ¶ra vad vi gjorde med studenten structure-- om pekare dot nÃ¤sta equals-- snarare, om pekaren dot N Ã¤r lika lika med variabeln N, varvid argument som har fÃ¶rts in, dÃ¥ jag vill gÃ¥ vidare och sÃ¤ga return true. Jag har hittat antalet N insida en av noderna i min lÃ¤nkad lista. Men punkten inte lÃ¤ngre fungerar i detta sammanhang, eftersom pekare, PTR, Ã¤r verkligen en pekare, en adress, vi faktiskt kan underbart AnvÃ¤nd slutligen en bit av syntax den typen av fabrikat intuitiv kÃ¤nsla och faktiskt AnvÃ¤nd en pil hÃ¤r, vilket innebÃ¤r att gÃ¥ frÃ¥n adressen till heltal dÃ¤r i. SÃ¥ det Ã¤r vÃ¤ldigt lika i anda att punktoperatorn, men eftersom pekaren Ã¤r inte en pekare och inte en faktisk struct sjÃ¤lv, vi anvÃ¤nder bara pilen. 

SÃ¥ om den aktuella noden att jag, temporÃ¤r variabel, am pekar pÃ¥ Ã¤r inte N, vad vill jag gÃ¶ra? Tja, med mina frivilliga fÃ¶rsÃ¶kspersoner att vi hade hÃ¤r hÃ¤romdagen, om mitt fÃ¶rsta mÃ¤nniska Ã¤r inte den jag vill, och kanske andra mÃ¤nniskors inte den jag vill, och den tredje, jag behÃ¶ver fÃ¶r att hÃ¥lla fysiskt i rÃ¶relse. Liksom hur gÃ¶r jag stega igenom en lista? NÃ¤r vi hade en matris, du just gjorde som jag plus plus. Men i detta fall Ã¤r det tillrÃ¤ckligt att gÃ¶r pekare blir, pekare, nÃ¤sta. Med andra ord, nÃ¤sta fÃ¤lt Ã¤r som alla vÃ¤nster hand att vÃ¥ra frivilliga pÃ¥ mÃ¥ndag anvÃ¤nde fÃ¶r att peka pÃ¥ nÃ¥gon annan nod. Det var deras nÃ¤sta grannar. 

SÃ¥ om jag vill gÃ¥ igenom den hÃ¤r listan, Jag kan inte bara jag plus plus lÃ¤ngre, Jag har i stÃ¤llet fÃ¶r att sÃ¤ga I pekare, gÃ¥r till lika oavsett nÃ¤sta fÃ¤lt Ã¤r, nÃ¤sta fÃ¤lt, Ã¤r nÃ¤sta fÃ¤lt, efter alla dessa vÃ¤nster hand att vi hade pÃ¥ scenen pekar till vissa efterfÃ¶ljande vÃ¤rden. Och om jag fÃ¥r igenom att hela iteration, och slutligen, jag slog null inte ha hittade N Ã¤ndÃ¥, jag tillbaka bara falskt. SÃ¥ Ã¥terigen, allt som vi gÃ¶r hÃ¤r, enligt bilden fÃ¶r en stund sedan, bÃ¶rjar genom att peka pÃ¥ i bÃ¶rjan av listan fÃ¶rmodligen. Och dÃ¥ jag kolla, Ã¤r vÃ¤rdet Jag letar efter lika med nio? Om sÃ¥ Ã¤r fallet, Ã¥tervÃ¤nder jag sanna och jag Ã¤r klar. Om inte, uppdaterar jag min hand, AKA pekare, peka vid nÃ¤sta pilen lÃ¤ge, och sedan nÃ¤sta pilen lÃ¤ge, och nÃ¤sta. Jag Ã¤r helt enkelt gÃ¥ igenom denna uppsÃ¤ttning. 

SÃ¥ Ã¥terigen, vem bryr sig? Liksom vad Ã¤r detta en ingrediens fÃ¶r? Tja, minns att vi infÃ¶rde begreppet en stapel, som Ã¤r en abstrakt datatyp i den mÃ¥n det Ã¤r inte C sak, det Ã¤r inte en CS50 sak, Det Ã¤r en abstrakt idÃ©, denna idÃ© om stapla saker ovanpÃ¥ varandra som kan genomfÃ¶ras i klasar av olika sÃ¤tt. Och ett sÃ¤tt som vi fÃ¶reslog var med en array, eller med en lÃ¤nkad lista. Och det visar sig att canonically, en stack stÃ¶djer Ã¥tminstone tvÃ¥ operationer. Och modeord Ã¤r push, till skjut nÃ¥got pÃ¥ stacken, som en ny bricka i matsalen, eller pop, vilket innebÃ¤r att ta bort den Ã¶versta bricka frÃ¥n stapeln i matsalen hall, och sedan kanske en del Ã¶vrig verksamhet samt. SÃ¥ hur kan vi definierar strukturen att vi nu kallar en stapel? 

Tja, vi har alla erforderliga syntax till vÃ¥rt fÃ¶rfogande i C. Jag sÃ¤ger, ge mig en definition typ av en struct inne i en stapel, Jag kommer att sÃ¤ga Ã¤r en uppsÃ¤ttning av en massa siffror och sedan storlek. SÃ¥ med andra ord, om jag vill att genomfÃ¶ra detta i koden, lÃ¥t mig gÃ¥ och bara typ av rita vad det sÃ¤ger. SÃ¥ detta sÃ¤ger, ge mig en struktur som har fÃ¥tt en array, och jag vet inte vilken egenskap Ã¤r, Det Ã¤r tydligen nÃ¥gon konstant som jag har definieras pÃ¥ annat hÃ¥ll, och det Ã¤r bra. Men antar att det Ã¤r bara en, tvÃ¥, tre, fyra, fem. SÃ¥ kapacitet Ã¤r 5. Denna del insidan av min struktur kommer att kallas nummer. Och dÃ¥ behÃ¶ver jag en annan variabel tydligen kallas storlek som ursprungligen kommer jag att fÃ¶reskriva initieras till noll. Om det finns inget i stapeln, storleken Ã¤r noll, och det Ã¤r sopor vÃ¤rden i antal. Jag har ingen aning om vad som finns dÃ¤r Ã¤nnu. 

SÃ¥ om jag vill driva nÃ¥got pÃ¥ stacken, antar att jag kallar funktionen push, och Jag sÃ¤ger skjuta 50, liksom antalet 50, var skulle du fÃ¶reslÃ¥ Jag drar det i denna samling? Det finns fem olika svarsalternativ. Var vill du att driva antalet 50? Om mÃ¥let hÃ¤r, igen, ring funktions skjuta, passera i ett argument 50, var ska jag uttrycka det? Fem possible-- 20% chans att gissa korrekt. Ja? 

PUBLIK: LÃ¤ngst till hÃ¶ger. 

TALARE 1: LÃ¤ngst till hÃ¶ger. Det finns nu en chans 25% att gissa korrekt. SÃ¥ det skulle faktiskt vara bra. Av konvention, ska jag sÃ¤ga med en array, Vi skulle i allmÃ¤nhet bÃ¶rja frÃ¥n vÃ¤nster, men vi kunde sÃ¤kert starta vid rÃ¤tt. SÃ¥ spoiler hÃ¤r skulle vara jag fÃ¶rmodligen kommer att dra den till vÃ¤nster, precis som i en vanlig array dÃ¤r Jag bÃ¶rja gÃ¥ frÃ¥n vÃ¤nster till hÃ¶ger. Men om du kan vÃ¤nda det aritmetiska, bra. Det Ã¤r bara inte konventionella. OK, jag mÃ¥ste gÃ¶ra en mer fÃ¶rÃ¤ndring men. Nu nÃ¤r jag har drivit nÃ¥got pÃ¥ stacken, vad hÃ¤nder nu? 

Okej, jag mÃ¥ste Ã¶ka storleken. SÃ¥ lÃ¥t mig gÃ¥ vidare och bara uppdatera denna, som var noll. Och i stÃ¤llet nu, jag ska att sÃ¤tta i vÃ¤rdet ett. Och nu antar att jag trycker en annan numret pÃ¥ stacken, som 51. Tja, jag mÃ¥ste gÃ¶ra en mer fÃ¶rÃ¤ndring, som Ã¤r upp till storlek tvÃ¥. Och sedan antar jag trycker en mer numret pÃ¥ stacken som 61, Nu mÃ¥ste jag uppdatera storlek ytterligare tid, och fÃ¥ vÃ¤rdet 3 som storleken. Och nu antar att jag kallar pop. Nu pop, enligt konvention, tar inte ett argument. Med en stapel, hela punkt av brickan metafor Ã¤r att du inte har handlingsfrihet att gÃ¥ fÃ¥ det facket, kan du gÃ¶ra Ã¤r pop Ã¶versta en frÃ¥n stacken, bara fÃ¶r att. Det Ã¤r vad denna datastruktur gÃ¶r. 

SÃ¥ genom denna logik, om jag sÃ¤ger pop, vad som kommer ut? SÃ¥ 61. SÃ¥ vad som verkligen Ã¤r datorn kommer att gÃ¶ra i minnet? Vad min kod mÃ¥ste gÃ¶ra? Vad skulle du fÃ¶reslÃ¥ vi Ã¤ndrar pÃ¥ skÃ¤rmen? Vad ska fÃ¶rÃ¤ndras? FÃ¶rlÃ¥t? SÃ¥ vi bli av med 61. SÃ¥ jag kan definitivt gÃ¶ra det. Och jag kan bli av med 61. Och sedan vad andra fÃ¶rÃ¤ndringen mÃ¥ste ske? Storlek har antagligen gÃ¥ tillbaka till tvÃ¥. Och sÃ¥ gÃ¥r det bra. Men vÃ¤nta en minut, storlek en stund sedan var tre. LÃ¥t oss bara gÃ¶ra en snabb kontroll fÃ¶rstÃ¥nd. Hur visste vi att vi ville bli av med 61? Eftersom vi poppar. Och sÃ¥ jag har denna andra fastigheternas storlek. 

VÃ¤nta lite, jag Ã¤r tÃ¤nker tillbaka till vecka tvÃ¥ nÃ¤r vi bÃ¶rjade prata om matriser, dÃ¤r detta lÃ¤ge noll, detta var platsen en, var denna plats tvÃ¥, detta Ã¤r platsen tre, fyra, det ser ut som fÃ¶rhÃ¥llande mellan storlek och element som jag vill ta bort frÃ¥n gruppen verkar vara det? Storlek minus ett. Och sÃ¥ det Ã¤r hur som mÃ¤nniskor vi vet 61 kommer fÃ¶rst. Hur Ã¤r datorn kommer att veta? NÃ¤r koden, dÃ¤r du fÃ¶rmodligen vill gÃ¶ra storlek minus ett, sÃ¥ tre minus ett Ã¤r tvÃ¥, och att innebÃ¤r att vi vill bli av med 61. Och dÃ¥ kan vi verkligen uppdatera storleken sÃ¥ att storlek gÃ¥r frÃ¥n tre till endast tvÃ¥. Och bara fÃ¶r att vara pedantisk, jag kommer att fÃ¶reslÃ¥ att jag Ã¤r klar, eller hur? Ni fÃ¶reslog intuitivt korrekt jag skulle bli av med 61. Men har jag inte typ av sorts gjort sig av 61? Jag har faktiskt glÃ¶mt att det Ã¤r faktiskt dÃ¤r. Och tÃ¤nker tillbaka pÃ¥ PSET4, om du har lÃ¤st artikeln om kriminalteknik, PDF att vi hade ni lÃ¤sa, eller om du kommer att lÃ¤sa denna vecka fÃ¶r PSET4. Minns att detta Ã¤r faktiskt relevant fÃ¶r hela idÃ©n med dator kriminalteknik. Vilken dator gÃ¶r i allmÃ¤nhet Ã¤r det bara glÃ¶mmer dÃ¤r nÃ¥got Ã¤r, men det inte gÃ¥ in och ut fÃ¶rsÃ¶ka skrapa ut eller Ã¶verstyrning dessa bitar med nollor och ettor eller nÃ¥gon annan slumpmÃ¤ssigt mÃ¶nster om du inte sjÃ¤lv gÃ¶ra det medvetet. SÃ¥ din intuition var Okej, lÃ¥t oss bli av med 61. Men i verkligheten, har vi inte bry. Vi behÃ¶ver bara att glÃ¶mma att den finns dÃ¤r genom att Ã¤ndra vÃ¥r storlek. 

Nu finns det ett problem med den hÃ¤r stack. Om jag hÃ¥lla driver saker pÃ¥ stacken, vad Ã¤r uppenbarligen kommer att hÃ¤nda pÃ¥ bara nÃ¥gra Ã¶gonblick tid? Vi kommer att kÃ¶ra ut i rymden. Och vad gÃ¶r vi? Vi slags skruvad. Denna implementering inte lÃ¥ta oss Ã¤ndra storlek pÃ¥ matrisen, eftersom att anvÃ¤nda denna syntax, om du tÃ¤nker tillbaka pÃ¥ vecka tvÃ¥, nÃ¤r du har deklarerat storleken pÃ¥ en array, Vi har inte sett den mekanism dÃ¤r Du kan Ã¤ndra storleken pÃ¥ matrisen. Och faktiskt C inte har den funktionen. Om du sÃ¤ger ge mig fem Nths, kallar dem tal, det Ã¤r allt du kommer att fÃ¥ det. SÃ¥ vi gÃ¶r nu som mÃ¥ndagen, har fÃ¶rmÃ¥gan att uttrycka en lÃ¶sning Men vi behÃ¶ver bara justera Definitionen av vÃ¥r stack att inte vara en del hÃ¥rdkodade array, men bara fÃ¶r att lagra en adress. 

Nu varfÃ¶r Ã¤r detta? Nu har vi bara att vara bekvÃ¤m med det faktum att nÃ¤r mitt program kÃ¶rs Jag fÃ¶rmodligen kommer att mÃ¥ste be mÃ¤nniska, hur mÃ¥nga nummer vill du spara? SÃ¥ ingÃ¥ngen mÃ¥ste komma nÃ¥gonstans ifrÃ¥n. Men nÃ¤r jag vet att nummer, sÃ¥ jag kan bara anvÃ¤nda vilken funktion att ge mig en bit av minne? Jag kan anvÃ¤nda malloc. Och jag kan sÃ¤ga valfritt antal bytes Jag vill tillbaka fÃ¶r dessa Nths. Och allt jag har att lagra i siffrorna variabel hÃ¤r insidan av denna struct bÃ¶r vara vad? Vad som faktiskt gÃ¥r in i siffror i detta scenario? Ja, en pekare till den fÃ¶rsta byten i den bit av minne, eller mer specifikt, till adressen den fÃ¶rsta av dessa byte. Spelar ingen roll om det Ã¤r en byte eller en miljard byte, Jag behÃ¶ver bara bry sig om den fÃ¶rsta. FÃ¶r vad malloc garantier och mitt operativsystem garantier, Ã¤r att bit av minnes I fÃ¥, det kommer att vara sammanhÃ¤ngande. Det kommer inte att finnas luckor. SÃ¥ om jag har bett om 50 bytes eller 1000 bytes, De kommer alla att vara rygg mot rygg mot rygg. Och sÃ¥ lÃ¤nge jag minns hur stor, hur mycket jag bad om, allt jag behÃ¶ver veta Ã¤r den fÃ¶rsta adressen. 

SÃ¥ nu har vi mÃ¶jlighet i koden. Om Ã¤n, det kommer att ta oss mer tid att skriva upp detta, Vi kunde nu omfÃ¶rdela att minnet av bara lagra en annan adress dÃ¤r Om vi ââvill ha en stÃ¶rre eller ens en mindre bit av minnet. SÃ¥ hÃ¤r till en avvÃ¤gning. Nu fÃ¥r vi dynamik. Vi har fortfarande contiguousness Jag pÃ¥stÃ¥r. Eftersom malloc kommer att ge oss en sammanhÃ¤ngande del av minnet. Men detta kommer att vara en smÃ¤rta i nacken fÃ¶r oss, programmeraren, att faktiskt koda upp. Det Ã¤r bara mer arbete. Vi behÃ¶ver kod beslÃ¤ktad med vad jag var banka ut bara fÃ¶r en stund sedan. Mycket genomfÃ¶rbart, men det tillfÃ¶r komplexitet. Och sÃ¥ utvecklare tid, programmerare tid Ã¤r Ã¤nnu en resurs att vi kan behÃ¶va tillbringa lite tid att fÃ¥ nya funktioner. Och sÃ¥ naturligtvis finns det en kÃ¶. Vi kommer inte att gÃ¥ in pÃ¥ detta en i stor detalj. Men det Ã¤r vÃ¤ldigt lika i anden. Jag skulle kunna genomfÃ¶ra en kÃ¶, och dess motsvarande verksamhet, enqueue eller dequeue, liksom lÃ¤gga till eller ta bort, det Ã¤r bara en finare sÃ¤tt att sÃ¤ga det, enqueue eller dequeue, enligt fÃ¶ljande. Jag kan bara ge mig en struct som Ã¥terigen har ett antal s array, som Ã¥terigen har en storlek, men varfÃ¶r gÃ¶r jag nu behÃ¶ver att hÃ¥lla reda pÃ¥ den frÃ¤mre delen av en kÃ¶? Jag behÃ¶vde inte veta framsidan av min stack. Tja, om jag Ã¥terigen fÃ¶r en queue-- lÃ¥t oss bara hÃ¥rt koda det som har som fem heltal i hÃ¤r potentiellt. SÃ¥ det hÃ¤r Ã¤r noll, ett, tvÃ¥, tre, fyra. Detta kommer att bli uppringda numren igen. Och detta kommer att kallas storlek. 

VarfÃ¶r Ã¤r det inte tillrÃ¤ckligt att bara storlek? NÃ¥vÃ¤l, lÃ¥t oss skjuta samma nummer pÃ¥. SÃ¥ jag pushed-- jag kÃ¶, eller trycks in. Nu ska jag kÃ¶a 50, och sedan 51, och sedan 61, och dot dot dot. SÃ¥ det Ã¤r enqueue. Jag kÃ¶ 50, sedan 51, sedan 61. Och som ser identisk till en stapel sÃ¥ hÃ¤r lÃ¥ngt, fÃ¶rutom att jag behÃ¶ver gÃ¶ra en fÃ¶rÃ¤ndring. Jag behÃ¶ver uppdatera denna storlek, sÃ¥ jag gÃ¥r frÃ¥n noll till en till 2 till tre nu. Hur gÃ¶r jag avkÃ¶a? Vad hÃ¤nder med dequeue? Vem ska lossna hÃ¤r listan fÃ¶rst om det Ã¤r ledningen pÃ¥ Apple Store? SÃ¥ 50. SÃ¥ det Ã¤r typ av svÃ¥rare den hÃ¤r gÃ¥ngen. Medan fÃ¶rra gÃ¥ngen det var super lÃ¤tt att bara gÃ¶ra storlek minus ett, Jag kommer till slutet av min samling effektivt dÃ¤r siffrorna Ã¤r, tar bort det 61. Men jag vill inte ta bort 61. Jag vill ta 50, som var dÃ¤r vid 05:00 att rada upp fÃ¶r ny iPhone eller whatnot. Och sÃ¥ fÃ¶r att bli av 50, jag kan inte bara gÃ¶ra det, eller hur? Jag kan stryka 50. Men vi sa bara vi behÃ¶ver inte vara sÃ¥ anal att skrapa ut eller dÃ¶lja data. Vi kan bara glÃ¶mma dÃ¤r det Ã¤r. 

Men om jag Ã¤ndrar min storlek nu tvÃ¥, Ã¤r detta tillrÃ¤ckligt med information att veta vad som hÃ¤nder i mitt kÃ¶n? Inte riktigt. Liksom min storlek Ã¤r tvÃ¥, men Vari kÃ¶n bÃ¶rjar, speciellt om jag har fortfarande samma nummer i minnet. 50, 51, 61. SÃ¥ jag mÃ¥ste komma ihÃ¥g nu dÃ¤r den frÃ¤mre Ã¤r. Och sÃ¥ jag fÃ¶reslog upp dÃ¤r vi har bara kallas N: te front, vars ursprungliga vÃ¤rde borde ha varit vad? Zero, bara bÃ¶rjan pÃ¥ listan. Men nu fÃ¶rutom nedrÃ¤kning storlek, vi bara Ã¶ka fronten. Nu hÃ¤r Ã¤r ett annat problem. SÃ¥ nÃ¤r jag hÃ¥lla kommer. Antag att detta Ã¤r antalet liknande 121, 124, och sedan, helvete, Jag Ã¤r ute i rymden. Men vÃ¤nta en minut, jag inte. SÃ¥ vid denna tidpunkt i historien, antar att storleken Ã¤r en, tvÃ¥, tre, fyra, sÃ¥ anta att storlek Ã¤r fyra, fronten Ã¤r en, sÃ¥ 51 Ã¤r vid fronten. Jag vill sÃ¤tta ett annat nummer hÃ¤r, men, helvete, jag Ã¤r ute i rymden. Men jag Ã¤r inte riktigt, eller hur? Var kan jag sÃ¤tta nÃ¥gra mervÃ¤rde, som 171? Ja, jag kunde bara typ av gÃ¥ tillbaka dit, eller hur? Och sedan stryka 50, eller bara skriva det med 171. Och om du undrar varfÃ¶r vÃ¥ra siffror fick sÃ¥ slumpmÃ¤ssigt, dessa Ã¤r vanligen tas dator vetenskap kurser pÃ¥ Harvard efter CS50. Men det var en bra optimering, fÃ¶r nu jag inte slÃ¶sa utrymme. Jag har fortfarande komma ihÃ¥g hur stor denna sak Ã¤r total. Det Ã¤r fem totalt. Eftersom jag inte vill bÃ¶rja skriva Ã¶ver 51. SÃ¥ nu Ã¤r jag fortfarande slut pÃ¥ utrymme, sÃ¥ samma problem som tidigare. Men du kan se hur nu i din kod, du fÃ¶rmodligen mÃ¥ste skriva lite mer komplexitet fÃ¶r att fÃ¶rverkliga detta. Och faktiskt, vad operatÃ¶r i C fÃ¶rmodligen lÃ¥ter du magiskt gÃ¶ra detta cirkularitet? Ja modulo operatÃ¶r, procenttecknet. SÃ¥ vad Ã¤r ganska coolt om en kÃ¶, Ã¤ven om vi hÃ¥ller ritning arrayer eftersom dessa liknande raka linjer, om du typ av tycker om detta som krÃ¶kning runt som en cirkel, sedan bara intuitivt det slags fungerar mentalt Jag tror att en lite renare. Du skulle fortfarande behÃ¶va genomfÃ¶ra att mental modell i koden. SÃ¥ inte sÃ¥ svÃ¥rt, i slutÃ¤ndan, att genomfÃ¶ra, men vi fortfarande fÃ¶rlorar size-- snarare mÃ¶jligheten att Ã¤ndra storlek, om vi inte gÃ¶r detta. 

Vi mÃ¥ste bli av med array, vi ersÃ¤tta den med en enda pekare, och sedan nÃ¥gonstans i min kod jag har ett samtal vilken funktion att faktiskt skapa arrayen uppringda numren? Malloc, eller nÃ¥got liknande funktion, exakt. Har du frÃ¥gor om staplar eller kÃ¶er. Yeah? Bra frÃ¥ga. Vad modulo skulle du anvÃ¤nda hÃ¤r. SÃ¥ generellt, nÃ¤r du anvÃ¤nder mod, skulle du gÃ¶ra det med storleken av den Hela datastruktur. SÃ¥ nÃ¥got som fem eller kapacitet, om Det Ã¤r konstant, Ã¤r troligen inblandade. Men bara gÃ¶ra modulo fem fÃ¶rmodligen inte Ã¤r tillrÃ¤ckligt, eftersom vi behÃ¶ver veta vi lindas runt hÃ¤r eller hÃ¤r eller hÃ¤r. SÃ¥ du Ã¤r fÃ¶rmodligen ocksÃ¥ kommer att vilja engagera storleken pÃ¥ sak, eller front variabeln ocksÃ¥. SÃ¥ det Ã¤r just detta relativt enkla aritmetiska uttryck, men modulo skulle vara den viktigaste ingrediensen. 

SÃ¥ kortfilm om du kommer. En animering som en del folks vid ett annat universitet sÃ¤tta ihop att vi har anpassad fÃ¶r denna diskussion. Det handlar om Jack lÃ¤ra sig fakta om kÃ¶er och statistik. 

FILM: En gÃ¥ng i tiden, Det var en kille som heter Jack. NÃ¤r det kom till att gÃ¶ra vÃ¤nner, Jack hade inte en talang. SÃ¥ Jack gick att prata med mest populÃ¤r kille han kÃ¤nde. Han gick till Lou och frÃ¥gade, vad ska jag gÃ¶ra? Lou sÃ¥g att hans vÃ¤n var verkligen bedrÃ¶vad. Tja, bÃ¶rjade han, precis se hur du Ã¤r klÃ¤dd. Har du inte ha nÃ¥gra klÃ¤der med ett annorlunda utseende? Ja, sÃ¤ger Jack. Jag sÃ¤ker gÃ¶r. Kom till mitt hus och Jag ska visa dem till dig. SÃ¥ de gick till Jack. Och Jack visade Lou rutan dÃ¤r han hÃ¶ll alla hans skjortor, och hans byxor och hans strumpor. Lou sa, jag ser att du har alla dina klÃ¤der i en hÃ¶g. VarfÃ¶r inte du bÃ¤ra vissa andra gÃ¥ng pÃ¥ ett tag? 

Jack sa, ja, nÃ¤r jag ta bort klÃ¤der och strumpor, Jag tvÃ¤ttar dem och sÃ¤tta bort dem i lÃ¥dan. Sedan kommer nÃ¤sta morgon, och upp mig hopp. Jag gÃ¥r till lÃ¥dan och fÃ¥ mina klÃ¤der utanfÃ¶r toppen. Lou insÃ¥g snabbt problemet med Jack. Han hÃ¶ll klÃ¤der, CD-skivor, och bÃ¶cker i stapeln. NÃ¤r han strÃ¤ckte sig efter nÃ¥got att lÃ¤sa eller att bÃ¤ra, han skulle vÃ¤lja den Ã¶vre bok eller underklÃ¤der. Sen nÃ¤r han var klar, han skulle uttrycka det tillbaka. Tillbaka det skulle gÃ¥, ovanpÃ¥ stapeln. Jag vet lÃ¶sningen, sade en triumferande Loud. Du mÃ¥ste lÃ¤ra dig att bÃ¶rja anvÃ¤nda en kÃ¶. Lou tog Jack klÃ¤der och hÃ¤ngde dem i garderoben. Och nÃ¤r han hade tÃ¶mt rutan, han bara kastade den. 

DÃ¥ sade han, nu Jack, i slutet av dagen, sÃ¤tta dina klÃ¤der pÃ¥ vÃ¤nster nÃ¤r du lÃ¤gger undan dem. Sedan i morgon bitti nÃ¤r du se solen, fÃ¥ dina klÃ¤der till hÃ¶ger, frÃ¥n slutet av raden. Ser du inte? sade Lou. Det ska bli sÃ¥ skÃ¶nt. Du kommer att ha allt en gÃ¥ng innan du bÃ¤r nÃ¥got tvÃ¥ gÃ¥nger. Och med allt i kÃ¶er i sin garderob och hylla, Jack bÃ¶rjade kÃ¤nna helt sÃ¤ker pÃ¥ sig sjÃ¤lv. Allt tack vare Lou och hans underbara kÃ¶. TALARE 1: Okej, det Ã¤r bedÃ¥rande. SÃ¥ vad har egentligen kommer pÃ¥ under huven nu? Att vi har pekare, att vi har malloc, att vi har fÃ¶rmÃ¥gan att skapa bitar av minne fÃ¶r oss dynamiskt. SÃ¥ det hÃ¤r Ã¤r en bild vi skymtade bara hÃ¤romdagen. Vi visste inte riktigt bo pÃ¥ det, men den hÃ¤r bilden har pÃ¥gÃ¥tt under huven i flera veckor nu. Och sÃ¥ detta representerar bara en rektangel som vi har ritat, datorns minne. Och kanske din dator, eller CS50 ID, har en gigabyte minne eller RAM eller tvÃ¥ gigabyte eller fyra. Det spelar egentligen ingen roll. Operativsystemet Windows eller Mac OS eller Linux, i huvudsak gÃ¶r ditt program att tro att det har tillgÃ¥ng till helheten av datorns minne, Ã¤ven om du kanske kÃ¶ra flera program samtidigt. SÃ¥ i verkligheten, som egentligen inte fungerar. Men det Ã¤r typ av en illusion ges till alla dina program. SÃ¥ om du hade tvÃ¥ gig RAM, detta Ã¤r hur datorn kan tÃ¤nka pÃ¥ det. 

Nu tillfÃ¤llighet, en av dessa saker, ett av dessa segment av minnet, kallas en stapel. Och faktiskt helst hittills i att skriva kod att du har ringt en funktion, till exempel huvud. Minns att varje gÃ¥ng jag har dragen datorns minne, Jag drar alltid sorts hÃ¤lften av en rektangel hÃ¤r och inte bryr sig prata om vad som Ã¤r ovan. FÃ¶r nÃ¤r huvud kallas, hÃ¤vdar jag att du fÃ¥r den hÃ¤r flisa av minne som gÃ¥r hÃ¤r nere. Och om huvud kallas en funktion som swap, vÃ¤l swap gÃ¥r hÃ¤r. Och det visar sig, det Ã¤r dÃ¤r det hamna. PÃ¥ nÃ¥got som kallas en stapel insidan av din dators minne. Nu vid slutet av dagen, detta Ã¤r bara adresser. Det Ã¤r som byte noll, byte en, byte 2 miljarder kronor. Men om man tÃ¤nker pÃ¥ det eftersom detta rektangulÃ¤rt fÃ¶remÃ¥l, allt vi gÃ¶r varje NÃ¤r vi kallar en funktion Ã¤r skiktning en ny skiva minne. Vi ger denna funktion en skiva av sitt eget minne fÃ¶r att arbeta med. 

Och minns nu att detta Ã¤r viktigt. FÃ¶r om vi har nÃ¥got liknande swap och tvÃ¥ lokala variabler som A och B och vi Ã¤ndra dessa vÃ¤rden frÃ¥n en och tvÃ¥ till tvÃ¥ och en, minns att nÃ¤r vÃ¤xlings returnerar, det Ã¤r som om detta segment minne Ã¤r bara borta. I verkligheten Ã¤r det fortfarande dÃ¤r forensically. Och nÃ¥got Ã¤r fortfarande faktiskt dÃ¤r. Men begreppsmÃ¤ssigt Ã¤r det som om det Ã¤r helt borta. Och sÃ¥ huvud inte kÃ¤nner nÃ¥gon av arbetet som gjordes i den swap-funktion, om det Ã¤r faktiskt gÃ¥tt i dessa argument frÃ¥n pekare eller med hÃ¤nvisning. Nu, den grundlÃ¤ggande lÃ¶sningen till det problemet med swap passerar saker i efter adress. Men det visar sig ocksÃ¥, vad Ã¤r pÃ¥gÃ¥tt Ã¶ver den delen av rektangeln hela denna tid Ã¤r men det finns mer minne uppe. Och nÃ¤r du dynamiskt allokera minne, oavsett om det Ã¤r inne i getString, som vi har gjort pÃ¥ dig i CS50 bibliotek, eller om ni ringa malloc och frÃ¥ga operativsystemet fÃ¶r en bit av minne, men det kommer inte frÃ¥n stapeln. Den kommer frÃ¥n en annan plats i datorns minne som kallas hÃ¶gen. Och det Ã¤r inte annorlunda. Det Ã¤r samma RAM. Det Ã¤r samma minne. Det Ã¤r bara RAM som Ã¤r upp dÃ¤r i stÃ¤llet fÃ¶r hÃ¤r nere. 

SÃ¥ vad betyder det? Tja, om datorn har en begrÃ¤nsad mÃ¤ngd minne och stapeln vÃ¤xer upp, sÃ¥ att tala, och hÃ¶gen, enligt till den hÃ¤r pilen, vÃ¤xer ned. Med andra ord, varje gÃ¥ng du ringer malloc, du fÃ¥r en skiva minne frÃ¥n ovan, dÃ¥ kanske en lite lÃ¤gre, sedan lite lÃ¤gre, varje gÃ¥ng du ringer malloc, hÃ¶gen, det Ã¤r anvÃ¤ndning, Ã¤r typ att vÃ¤xa, allt nÃ¤rmare och nÃ¤rmare till vad? Stapeln. Det gÃ¶r detta verka som en bra idÃ©? Jag menar, om det inte Ã¤r riktigt klart vad du kan gÃ¶ra om du bara har en begrÃ¤nsad mÃ¤ngd minne. Men detta Ã¤r ju dÃ¥ligt. Dessa tvÃ¥ pilar Ã¤r pÃ¥ en krascha kurs fÃ¶r varandra. 

Och det visar sig att skurken, folk som Ã¤r sÃ¤rskilt bra med programmering, och fÃ¶rsÃ¶ker hacka in i datorer, kan utnyttja denna verklighet. I sjÃ¤lva verket, lÃ¥t oss betrakta lite kodavsnitt. SÃ¥ det hÃ¤r Ã¤r ett exempel som du kan lÃ¤sa om nÃ¤rmare pÃ¥ Wikipedia. Vi kommer att peka dig i artikeln om nyfikna. Men det finns en attack i allmÃ¤nhet kÃ¤nd som buffertspill som har funnits sÃ¥ lÃ¤nge som mÃ¤nniskor har haft fÃ¶rmÃ¥gan att manipulera datorns minne, i synnerhet i C. SÃ¥ det hÃ¤r Ã¤r ett mycket godtyckligt program, men lÃ¥t oss lÃ¤sa det nerifrÃ¥n och upp. Huvud in argC rÃ¶ding stjÃ¤rna argv. SÃ¥ det Ã¤r ett program som tar kommandoradsargument. Och alla huvud gÃ¶r tydligen Ã¤r samtal en funktion, kalla det F fÃ¶r enkelhetens skull. Och det passerar i vad? Argv av en. SÃ¥ det passerar in F oavsett ordet Ã¤r att anvÃ¤ndaren har skrivit vid prompten efter programmets namn alls. SÃ¥ mycket som Caesar eller VigenÃ¨re, som Du kanske kommer ihÃ¥g att gÃ¶ra med argv. 

SÃ¥ vad Ã¤r F? F tar i en strÃ¤ng som enda argument, AKA en rÃ¶ding stjÃ¤rna, samma sak, som en strÃ¤ng. Och det kallas godtyckligt bar i detta exempel. Och sedan char c 12, bara i lekmannasprÃ¥k, vad Ã¤r char c fÃ¤stet 12 gÃ¶r fÃ¶r oss? Hur Ã¤r det att gÃ¶ra? Allokering av minne, speciellt 12 byte fÃ¶r 12 tecken. Exakt. Och sedan den sista raden, rÃ¶r om och kopia, har du antagligen inte sett. Detta Ã¤r en strÃ¤ng kopia funktion vars syfte i livet Ã¤r att kopiera sitt andra argument i sitt fÃ¶rsta argument, men bara upp till en visst antal bitgrupper. SÃ¥ det tredje argumentet sÃ¤ger, hur mÃ¥nga bytes bÃ¶r du mig? LÃ¤ngden pÃ¥ bar, oavsett anvÃ¤ndaren har skrivit in. Och innehÃ¥llet i bar, den strÃ¤ngen, Ã¤r kopieras till minnet pekade pÃ¥ vid C. 

SÃ¥ detta verkar vara lite dum, och det Ã¤r. Det Ã¤r en konstruerad exempel, men det Ã¤r representativt av en klass av attack vektorer ett sÃ¤tt att angripa ett program. Allt Ã¤r fint och bra om anvÃ¤ndaren typer i ett ord som Ã¤r 11 tecken eller fÃ¤rre, plus backslash noll. Vad hÃ¤nder om anvÃ¤ndaren skriver i mer Ã¤n 11 eller 12 eller 20 eller 50 tecken? Vad Ã¤r det hÃ¤r programmet kommer att gÃ¶ra? Potentiellt seg fel. Det gÃ¥r blint kopiera allt i bar upp med dess lÃ¤ngd, som Ã¤r bokstavligen allt i bar, i adress pekade pÃ¥ C. Men C har endast fÃ¶rebyggande syfte ges som 12 byte. Men det finns ingen ytterligare kontroll. Det finns inget om fÃ¶rhÃ¥llandena. Det finns ingen felkontroll hÃ¤r. 

Och sÃ¥ vad detta program Ã¤r kommer att gÃ¶ra Ã¤r bara blint kopiera en sak till en annan. Och sÃ¥ om vi dra denna som en bild, hÃ¤r Ã¤r bara en flisa av minnesutrymmet. SÃ¥ mÃ¤rker pÃ¥ botten, vi har den lokala variabeln baren. SÃ¥ att pekare som kommer att store-- snarare att lokal argument som Ã¤r kommer att lagra strÃ¤ngen bar. Och sedan mÃ¤rker bara Ã¶ver den i en stapel, eftersom varje gÃ¥ng du frÃ¥gar fÃ¶r minnes pÃ¥ stacken, Det gÃ¥r lite ovanfÃ¶r pictorially, mÃ¤rker att vi har 12 byte dÃ¤r. Den Ã¶vre vÃ¤nstra Ã¤r C fÃ¤ste noll och det nedre hÃ¶gra en Ã¤r Ci konsol 11. Det Ã¤r bara hur datorerna kommer att lÃ¤gga ut det. SÃ¥ bara intuitivt, om bar har mer Ã¤n 12 tecken totalt, inklusive backslash noll, dÃ¤r Ã¤r 12 eller C fÃ¤stet 12 kommer att gÃ¥? Eller snarare var Ã¤r den 12: e fÃ¶rmÃ¥ga eller 13 tecken, hundrade karaktÃ¤r gÃ¥r att hamna i bilden? Ãver eller under? 

HÃ¶ger, fÃ¶r Ã¤ven om stapeln sjÃ¤lv vÃ¤xer uppÃ¥t, NÃ¤r du har lagt saker i det, konstruktionstekniska skÃ¤l, sÃ¤tter minnet frÃ¥n topp till botten. SÃ¥ om du har mer Ã¤n 12 byte, du kommer att bÃ¶rja skriva bar. Nu det Ã¤r en bugg, men det Ã¤r egentligen inte en big deal. Men det Ã¤r en stor sak, eftersom det finns mer grejer pÃ¥ gÃ¥ng i minnet. SÃ¥ hÃ¤r Ã¤r hur vi kanske sÃ¤tta hej, att vara tydlig. Om jag skrev i hello vid prompten. H-E-L-L-O snedstreck noll, hamnar inom dessa 12 bytes, och vi Ã¤r mycket sÃ¤kra. Allt Ã¤r bra. Men om jag skriver nÃ¥got lÃ¤ngre, potentiellt Ã¤r det kommer att krypa in bar utrymme. Men Ã¤nnu vÃ¤rre, visar det ut hela tiden, Ã¤ven om vi aldrig har talat om Det Ã¤r stacken anvÃ¤nds fÃ¶r andra saker. Det Ã¤r inte bara lokala variabler. 

C Ã¤r ett sprÃ¥k mycket lÃ¥g nivÃ¥. Och det slags hemlighet anvÃ¤nder stapeln ocksÃ¥ att komma ihÃ¥g nÃ¤r ett funktionen kallas, vad adressen Ã¤r av den fÃ¶regÃ¥ende funktion, sÃ¥ det kan gÃ¥ tillbaka till denna funktion. SÃ¥ nÃ¤r huvud samtal byta, bland de saker skjutas pÃ¥ stacken Ã¤r inte bara byter lokala variabler, eller sina argument, ocksÃ¥ i hemlighet drivit pÃ¥ stacken sÃ¥som representeras av den rÃ¶da skivan hÃ¤r, Ã¤r adressen till huvud fysiskt i datorns minne, sÃ¥ att nÃ¤r vÃ¤xlings Ã¤r gjort, datorn vet att jag mÃ¥ste gÃ¥ tillbaka till huvud och avsluta exekvera den viktigaste funktionen. SÃ¥ det hÃ¤r Ã¤r farligt nu, fÃ¶r om anvÃ¤ndaren skriver pÃ¥ vÃ¤l mer Ã¤n hej, sÃ¥dan att anvÃ¤ndarens indata clobbers eller skriver att rÃ¶da delen, logiskt om datorns bara att blint anta att de bytes i den rÃ¶da skiva Ã¤r adressen som den ska returnera, vad hÃ¤nder om motstÃ¥ndaren Ã¤r smart nog eller turen att sÃ¤tta en sekvens av bytes Det som ser ut som en adress, men det Ã¤r adressen till koden att han eller hon vill ha datorn att kÃ¶ra i stÃ¤llet fÃ¶r huvud? 

Med andra ord, om det som anvÃ¤ndaren Ã¤r att skriva vid prompten, Ã¤r inte bara nÃ¥got ofarlig som hej, men det Ã¤r faktiskt kod som Ã¤r likvÃ¤rdig att ta bort alla hÃ¤r anvÃ¤ndarens filer? Eller mejla sitt lÃ¶senord till mig? Eller bÃ¶rja logga deras tangenttryckningar, eller hur? Det finns ett sÃ¤tt, lÃ¥t oss faststÃ¤lla dag, att de kunde skriva in inte bara hej vÃ¤rld eller deras namn, de kunde i huvudsak passera kod, nollor och sÃ¥dana, att datorn misstag fÃ¶r bÃ¥de kod och en adress. SÃ¥ om Ã¤n nÃ¥got abstrakt, om anvÃ¤ndartyper i tillrÃ¤ckligt kontradiktoriska kod att vi ska generalisera hÃ¤r som A. A Ã¤r attack eller motstÃ¥ndare. SÃ¥ bara dÃ¥liga grejer. Vi bryr oss inte om siffror eller nollor och ettor idag, sÃ¥ att du hamnar skrivs det rÃ¶da delen, mÃ¤rker att bytesekvensen. O 835 C noll Ã¥tta noll. Och nu som Wikipedias artikel hÃ¤r har fÃ¶reslagit, om du nu verkligen bÃ¶rjar mÃ¤rkning av byte i datorns minne, vad Wikipedia artikeln fÃ¶reslÃ¥ Ã¤r att, tÃ¤nk om adressen av det Ã¶vre vÃ¤nstra byte Ã¤r 80 C 0 3508. 

Med andra ord, om den onde Ã¤r smart nog med hans eller hennes kod att faktiskt sÃ¤tta ett antal hÃ¤r som motsvarar adressen av koden han eller hon injicerade i datorn, du kan lura datorn till att gÃ¶ra nÃ¥gonting. Ta bort filer, e-post saker, sniffa din trafik, bokstavligen allt kan vara sprutas in i datorn. Och sÃ¥ en buffer overflow attack i sin kÃ¤rna Ã¤r bara en dum, dum tvingande av en matris som inte har sina grÃ¤nser kontrolleras. Och detta Ã¤r vad Ã¤r super farligt och samtidigt super kraftfull i C Ã¤r att vi har faktiskt tillgÃ¥ng till nÃ¥gonstans i minnet. Det Ã¤r upp till oss, programmerare, som skriver den ursprungliga koden att kontrollera allra lÃ¤ngden pÃ¥ arrayer som vi manipulerar. SÃ¥ fÃ¶r att vara tydlig, vad Ã¤r fix? Om vi âârullar tillbaka till denna kod, jag borde inte bara Ã¤ndra lÃ¤ngden pÃ¥ baren, vad annars ska jag kontrollera? Vad ska jag gÃ¶ra fÃ¶r att fÃ¶rhindra denna attack helt? Jag vill inte bara blint sÃ¤ga att du bÃ¶r kopiera sÃ¥ mÃ¥nga bytes som Ã¤r lÃ¤ngden pÃ¥ baren. Jag vill sÃ¤ga, kopiera som mÃ¥nga bytes som finns i bar upp till den tilldelade minne, eller 12 maximalt. SÃ¥ jag behÃ¶ver nÃ¥gon form av om tillstÃ¥nd som gÃ¶r kontrollera lÃ¤ngden pÃ¥ baren, men om den Ã¶verstiger 12, vi bara hÃ¥rdkoda 12 som den stÃ¶rsta mÃ¶jliga avstÃ¥nd. Annars sÃ¥ kallade buffert overflow attack kan hÃ¤nda. LÃ¤ngst ner pÃ¥ dessa bilder, Om du Ã¤r nyfiken pÃ¥ att lÃ¤sa mer Ã¤r den faktiska ursprungliga artikeln Om du vill ta en titt. 

Men nu, bland priserna betalade hÃ¤r var ineffektivitet. SÃ¥ det var en snabb lÃ¥g look nivÃ¥ pÃ¥ vad problem kan uppstÃ¥ nu nÃ¤r vi har tillgÃ¥ng till datorns minne. Men ett annat problem som vi redan snubblat pÃ¥ mÃ¥ndag var bara ineffektivitet av en lÃ¤nkad lista. Vi Ã¤r tillbaka till linjÃ¤r tid. Vi har inte lÃ¤ngre en sammanhÃ¤ngande matris. Vi har inte random access. Vi kan inte anvÃ¤nda klammer notation. Vi har bokstavligen att anvÃ¤nda en while-slinga som jag skrev fÃ¶r en stund sedan. Men pÃ¥ mÃ¥ndag, hÃ¤vdade vi att vi kan krypa tillbaka in i sfÃ¤ren av effektivitet uppnÃ¥ nÃ¥got som Ã¤r logaritmisk kanske, eller bÃ¤sta Ã¤nnu, kanske till och med nÃ¥got som Ã¤r s.k. konstant tid. SÃ¥ hur kan vi gÃ¶ra det genom att anvÃ¤nda dessa nya verktyg, dessa adresser, dessa pekare, och gÃ¤ng saker i vÃ¥r egen? Tja, antar att hÃ¤r, det Ã¤r ett gÃ¤ng av siffror som vi vill lagra i en datastruktur och sÃ¶kning effektivt. Vi kan absolut spola tillbaka till vecka tvÃ¥, kasta dessa i en matris, och sÃ¶ka dem med binÃ¤r sÃ¶kning. SÃ¶ndra och hÃ¤rska. Och i sjÃ¤lva verket du skrev binÃ¤r sÃ¶kning i PSET3, dÃ¤r du genomfÃ¶rt hitta programmet. Men vet du vad. Det Ã¤r lite av en mer smart sÃ¤tt att gÃ¶ra detta. Det Ã¤r lite mer sofistikerade och det kanske tillÃ¥ter oss att se varfÃ¶r binÃ¤ra SÃ¶kningen Ã¤r sÃ¥ mycket snabbare. LÃ¥t oss fÃ¶rst infÃ¶ra fÃ¶restÃ¤llningen av ett trÃ¤d. Vilket Ã¤ven om det i reality trÃ¤d typ av vÃ¤xa sÃ¥ hÃ¤r, i en vÃ¤rld av dator vetenskap de slags vÃ¤xa nedÃ¥t som ett slÃ¤kttrÃ¤d, dÃ¤r du har dina morfÃ¶rÃ¤ldrar eller stora morfÃ¶rÃ¤ldrar eller allt pÃ¥ toppen, patriarken och matriark av familjen, bara en s.k. rot, nod, nedan som Ã¤r dess barn, under vilken det Ã¤r dess barn, eller dess Ã¤ttlingar mer allmÃ¤nt. Och den hÃ¤ngande botten av familjen trÃ¤d, fÃ¶rutom att vara den yngst i familjen, kan ocksÃ¥ bara vara generiskt kallas blad av trÃ¤det. 

SÃ¥ det hÃ¤r Ã¤r bara ett gÃ¤ng ord och definitioner fÃ¶r nÃ¥got som kallas ett trÃ¤d i dator vetenskap, ungefÃ¤r som ett slÃ¤kttrÃ¤d. Men det finns snyggare inkarnationer av trÃ¤d, en av vilka kallas ett binÃ¤rt sÃ¶ktrÃ¤d. Och du kan typ av tease isÃ¤r vad den hÃ¤r saken gÃ¶r. Tja, det Ã¤r binÃ¤r i vilken mening? VarifrÃ¥n kommer den binÃ¤ra kommer hÃ¤rifrÃ¥n? FÃ¶rlÃ¥t? Det Ã¤r inte sÃ¥ mycket ett antingen eller. Det Ã¤r mer att var och en av noderna har ingen mer Ã¤n tvÃ¥ barn, som vi ser hÃ¤r. I allmÃ¤nhet Ã¤r ett tree-- och dina fÃ¶rÃ¤ldrar och farfÃ¶rÃ¤ldrar kan ha sÃ¥ mÃ¥nga barn eller barnbarn som de faktiskt vill, och sÃ¥ till exempel dÃ¤r har vi tre barn utanfÃ¶r den hÃ¶gra noden, men i ett binÃ¤rt trÃ¤d, har en nod noll, en eller tvÃ¥ barn maximalt. Och det Ã¤r en bra egenskap, fÃ¶r om det Ã¤r tÃ¤ckt av tvÃ¥, vi kommer att kunna fÃ¥ lite log bas tvÃ¥ Ã¥tgÃ¤rder som pÃ¥gÃ¥r hÃ¤r i slutÃ¤ndan. SÃ¥ vi har nÃ¥got logaritmisk. Men mer om det i ett Ã¶gonblick. SÃ¶ktrÃ¤d innebÃ¤r att siffrorna Ã¤r anordnade sÃ¥ att den vÃ¤nstra barnets vÃ¤rdet Ã¤r stÃ¶rre Ã¤n roten. Och dess rÃ¤tt barn Ã¤r stÃ¶rre Ã¤n roten. Med andra ord, om du tar nÃ¥got av noder, cirklarna i den hÃ¤r bilden, och tittar pÃ¥ dess vÃ¤nstra barn och dess rÃ¤tt barn, den fÃ¶rsta bÃ¶r vara mindre Ã¤n, den andra bÃ¶r vara stÃ¶rre Ã¤n. SÃ¥ sanity ta 55. Det som Ã¤r kvar barnet Ã¤r 33. Det Ã¤r mindre Ã¤n. 55, Ã¤r dess hÃ¶gra underordnade 77. Det Ã¤r stÃ¶rre Ã¤n. Och det Ã¤r en rekursiv definition. Vi kan kontrollera varenda en av dem noder och samma mÃ¶nster skulle hÃ¥lla. 

SÃ¥ vad Ã¤r trevligt i en binÃ¤rt sÃ¶ktrÃ¤d, Ã¤r att man kan vi genomfÃ¶ra det med en struct, precis som detta. Och Ã¤ven om vi kastar massor av strukturer pÃ¥ din, de Ã¤r nÃ¥got intuitiv nu fÃ¶rhoppningsvis. Syntaxen Ã¤r fortfarande svÃ¥rbegripliga fÃ¶r sÃ¤ker, men innehÃ¥llet i en nod i detta context-- och vi hÃ¥ller anvÃ¤nda ordet nod, oavsett om det Ã¤r en rektangel pÃ¥ skÃ¤rmen eller en cirkel, Det Ã¤r bara nÃ¥gra generiska behÃ¥llare, i detta fall av ett trÃ¤d, som en vi sÃ¥g, vi behÃ¶ver ett heltal i var och en av noderna och dÃ¥ jag behÃ¶ver tvÃ¥ pekare pekar till vÃ¤nster barnet och hÃ¶gra underordnade, respektive. SÃ¥ det Ã¤r hur vi kanske genomfÃ¶ra detta i en struct. Och hur kan jag genomfÃ¶ra det i koden? NÃ¥vÃ¤l, lÃ¥t oss ta en snabb titta pÃ¥ denna lilla exempel. Det Ã¤r inte funktionell, men jag har kopierat och klistrat denna struktur. Och om min funktion fÃ¶r en binÃ¤r sÃ¶ktrÃ¤d kallas sÃ¶kning, och detta tar tvÃ¥ argument, ett heltal N och en pekare till en nod, sÃ¥ en pekare till trÃ¤det eller en pekare till roten av ett trÃ¤d, Hur gÃ¶r jag fÃ¶r att sÃ¶ka efter N? Tja, fÃ¶rst, eftersom jag Ã¤r behandlar pekare, Jag kommer att gÃ¶ra en sanity check. Om trÃ¤d jÃ¤mlikar Ã¤r lika med noll, Ã¤r N I det hÃ¤r trÃ¤det eller inte i detta trÃ¤d? Det kan inte vara rÃ¤tt? Om jag fÃ¶rbi null, det finns inget dÃ¤r. Jag kan lika gÃ¤rna bara blint sÃ¤ger return false. Om du ger mig ingenting, jag kan ju inte hitta valfritt antal N. SÃ¥ vad mer jag kan Kontrollera nu? Jag kommer att sÃ¤ga bra annars om N Ã¤r mindre Ã¤n vad som Ã¤r pÃ¥ trÃ¤det noden att jag har gÃ¥tt i arv N-vÃ¤rdet. Med andra ord, om numret Ã¤r jag sÃ¶ker, N, Ã¤r mindre Ã¤n den nod att jag tittar pÃ¥. Och noden jag ser vid kallas trÃ¤d, och minns frÃ¥n fÃ¶regÃ¥ende exempel att komma Ã¥t vÃ¤rdet i en pekare, Jag anvÃ¤nder pilen notation. SÃ¥ om N Ã¤r mindre Ã¤n trÃ¤d pil N, jag vill begrepps gÃ¥ vÃ¤nster. Hur gÃ¶r jag uttrycker SÃKA kvar? FÃ¶r att vara tydlig, om detta Ã¤r bilden i frÃ¥ga, och jag har gÃ¥tt att Ã¶versta arrow som Ã¤r pekar nedÃ¥t. Det Ã¤r mitt trÃ¤d pekare. Jag pekar pÃ¥ roten av trÃ¤det. Och jag ser att sÃ¤ga, fÃ¶r siffran 44, godtyckligt. Ãr 44 mindre Ã¤n eller stÃ¶rre Ã¤n 55 sjÃ¤lvklart? SÃ¥ det Ã¤r mindre Ã¤n. Och sÃ¥ detta om villkor gÃ¤ller. SÃ¥ begreppsmÃ¤ssigt, vad jag vill SÃ¶k nÃ¤sta om jag letar efter 44? Yeah? 

Just det, jag vill sÃ¶ka i vÃ¤nstra underordnade, eller vÃ¤nster undertrÃ¤d av denna bild. Och i sjÃ¤lva verket, lÃ¥t mig igenom bilden hÃ¤r nere fÃ¶r bara ett Ã¶gonblick, eftersom Jag kan inte repa detta. Om jag bÃ¶rjar hÃ¤r vid 55, och Jag vet att vÃ¤rdet 44 Jag letar efter Ã¤r att vÃ¤nster, det Ã¤r typ som att riva telefonboken i halv eller riva trÃ¤det pÃ¥ mitten. Jag behÃ¶ver inte lÃ¤ngre bry sig om hela denna hÃ¤lften av trÃ¤det. Och Ã¤ndÃ¥, mÃ¤rkligt i termer av struktur, denna sak hit att bÃ¶rjar med 33, som i sig Ã¤r ett binÃ¤rt sÃ¶ktrÃ¤d. Jag sa ordet rekursiva innan eftersom faktiskt detta Ã¤r en datastruktur som per definition Ã¤r rekursiv. Du kanske har ett trÃ¤d som det hÃ¤r stor, men var och en av sina barn representerar ett trÃ¤d bara lite mindre. I stÃ¤llet fÃ¶r att det Ã¤r morfar eller mormor, nu Ã¤r det bara mamma eller-- jag kan inte sÃ¤ga-- inte mamma eller pappa, skulle det vara konstigt. IstÃ¤llet de tvÃ¥ barnen dÃ¤r skulle vara som bror och syskon. En ny generation av slÃ¤kttrÃ¤det. Men strukturellt, det Ã¤r samma idÃ©. Och det visade sig att jag har en funktion som jag kan sÃ¶ka en binÃ¤r sÃ¶kning trÃ¤d. Det kallas sÃ¶kning. Jag sÃ¶ker efter N trÃ¤d pil vÃ¤nster annars om N Ã¤r stÃ¶rre Ã¤n vÃ¤rdet att jag Ã¤r fÃ¶r nÃ¤rvarande pÃ¥. 55 i berÃ¤ttelsen fÃ¶r en stund sedan. Jag har en funktion som kallas sÃ¶kmotor som jag kan bara passera N detta och rekursivt sÃ¶ka sub-trÃ¤det och bara avkastning vad det svaret. Annars har jag nÃ¥gra slutliga bas fallet hÃ¤r. 

Vad Ã¤r det sista fallet? Tree Ã¤r antingen noll. VÃ¤rdet jag antingen letar efter Ã¤r mindre Ã¤n den eller stÃ¶rre Ã¤n den eller lika med det. Och jag kunde sÃ¤ga lika lika, men logiskt Ã¤r det motsvarar bara sÃ¤ga annat hÃ¤r. SÃ¥ sant Ã¤r hur jag hittar nÃ¥got. SÃ¥ fÃ¶rhoppningsvis Ã¤r ett Ã¤nnu mer Ã¶vertygande exempel Ã¤n den dumma sigma funktionen Vi gjorde nÃ¥gra fÃ¶relÃ¤sningar tillbaka, dÃ¤r det var lika enkelt att anvÃ¤nda en slinga att rÃ¤kna upp alla nummer frÃ¥n en till N. HÃ¤r med en datastruktur som i sig sjÃ¤lv Ã¤r rekursivt definierade och rekursivt dras, nu vi har fÃ¶rmÃ¥gan att uttrycka oss i kod som sjÃ¤lv Ã¤r rekursiv. SÃ¥ det hÃ¤r Ã¤r exakt samma kod hÃ¤r. 

SÃ¥ vad andra problem kan vi lÃ¶sa? SÃ¥ en snabb steg bort frÃ¥n trÃ¤d fÃ¶r bara ett Ã¶gonblick. HÃ¤r Ã¤r, sÃ¤ger den tyska flaggan. Och det Ã¤r helt klart en mÃ¶nstret till denna flagga. Och det finns massor av flaggor i vÃ¤rlden som Ã¤r sÃ¥ enkla som detta i termer av deras fÃ¤rger och mÃ¶nster. Men antag att detta lagras som en GIF, eller JPEG eller bitmapp, eller en ping, nÃ¥got grafiskt filformat som du Ã¤r bekant, varav vi Ã¤r leka med i PSET4. Detta verkar inte vÃ¤rt att lagra svart pixel, svart pixel, svart pixel, dot, punkt, punkt, en massa svarta pixlar fÃ¶r den fÃ¶rsta avsÃ¶kningsraden, eller rad, sedan en massa densamma, sedan en hel drÃ¶s av densamma, och sedan en massa rÃ¶da pixlar, rÃ¶da pixlar, rÃ¶da pixlar, sedan en hel gÃ¤ng gula pixlar, gul, eller hur? 

Det Ã¤r en sÃ¥dan ineffektivitet hÃ¤r. Hur skulle du intuitivt komprimera den tyska flaggan om att genomfÃ¶ra det som en fil? Liksom vilken information kan vi inte bry lagring pÃ¥ disk fÃ¶r att minska vÃ¥r filstorleken frÃ¥n liknande en megabyte till ett kilobyte, nÃ¥got mindre? Vari ligger redundans hÃ¤r fÃ¶r att vara klart? Vad kan du gÃ¶ra? Yeah? Exakt. VarfÃ¶r inte i stÃ¤llet minnas fÃ¤rgen pÃ¥ varje darn pixel precis som du gÃ¶r i PSET4 med bitmap-format, varfÃ¶r inte du bara representera vÃ¤nstra kolumnen av pixlar, t.ex. ett gÃ¤ng svarta pixlar, ett gÃ¤ng rÃ¶tt, och ett gÃ¤ng gul, och sedan bara nÃ¥got koda idÃ© upprepa detta 100 gÃ¥nger eller upprepa detta 1000 gÃ¥nger? DÃ¤r 100 eller 1000 Ã¤r bara ett heltal, sÃ¥ att du kan komma undan med bara ett enda nummer i stÃ¤llet fÃ¶r hundratals eller tusentals av ytterligare pixlar. Och faktiskt, det Ã¤r hur vi kan komprimera den tyska flaggan. Och Nu vad om fransk flagg? Och lite nÃ¥got slags mental trÃ¤ning, vilken flagga kan komprimeras mer pÃ¥ disk? Den tyska flaggan eller franska flagga, om vi tar detta synsÃ¤tt? Den tyska flaggan, eftersom det finns mer Ã¶vergripande redundans. Och genom design, mÃ¥nga grafiska filen format gÃ¶r verkligen fungerar som sveplinjer horisontellt. De kunde arbeta vertikalt, precis mÃ¤nskligheten beslutade Ã¥r sedan att vi ska i allmÃ¤nhet tÃ¤nka pÃ¥ saker rad genom rad istÃ¤llet fÃ¶r kolumn fÃ¶r kolumn. SÃ¥ ja om du var att titta pÃ¥ filen storleken pÃ¥ en tysk flagga och en fransk flagga, sÃ¥ lÃ¤nge som upplÃ¶sningen Ã¤r samma, samma bredd och hÃ¶jd, hÃ¤r hÃ¤r kommer att bli stÃ¶rre, eftersom du mÃ¥ste upprepa dig tre gÃ¥nger. Du mÃ¥ste ange blÃ¥tt, upprepa sjÃ¤lv, vit, upprepa dig sjÃ¤lv, rÃ¶tt, upprepa dig sjÃ¤lv. Du kan inte bara gÃ¥ alla vÃ¤gen till hÃ¶ger. Och som en sidoreplik, att gÃ¶ra rensa kompression Ã¤r Ã¶verallt, om dessa fyra bildrutor frÃ¥n en video-- du kanske kommer ihÃ¥g att en film eller video Ã¤r i allmÃ¤nhet som 29 eller 30 bilder per sekund. Det Ã¤r som en liten blÃ¤dderbok dÃ¤r du bara se bild, bild, bild, bild, image bara supersnabb sÃ¥ det ser ut aktÃ¶rerna pÃ¥ skÃ¤rmen rÃ¶r sig. HÃ¤r Ã¤r en humla pÃ¥ toppen av en blombukett. Och Ã¤ven om det kan vara typ av svÃ¥rt att se vid fÃ¶rsta anblicken, det enda som rÃ¶r sig i den hÃ¤r filmen Ã¤r biet. 

Vad Ã¤r dum om att lagra video okomprimerad? Det Ã¤r typ av avfall fÃ¶r att lagra video som fyra nÃ¤stan identiska bilder som skiljer sig endast i den mÃ¥n dÃ¤r biet Ã¤r. Du kan kasta bort det mesta av denna information och minns bara, till exempel, den fÃ¶rsta ramen och den sista ramen, nyckelrutor Om du har nÃ¥gonsin hÃ¶rt ordet, och bara lagra i mitten dÃ¤r biet Ã¤r. Och du behÃ¶ver inte lagra alla rosa, och det blÃ¥, och grÃ¶na vÃ¤rden. SÃ¥ detta Ã¤r att bara sÃ¤ga att komprimering Ã¤r Ã¶verallt. Det Ã¤r en teknik som vi anvÃ¤nder ofta eller tar fÃ¶r givet dessa dagar. 

Men hur gÃ¶r du komprimera text? Hur gÃ¥r du om att komprimera texten? Tja, vart och ett av tecknen i ASCII Ã¤r en bitgrupp, eller Ã¥tta bitar. Och det Ã¤r ganska dum, eller hur? Eftersom du fÃ¶rmodligen typ A och E och I och O och U mycket oftare Ã¤n som W eller Q eller Z, beroende pÃ¥ vilket sprÃ¥k du skriver verkligen. Och sÃ¥ varfÃ¶r anvÃ¤nder vi Ã¥tta bitar fÃ¶r varje bokstav, inklusive minst populÃ¤ra bokstÃ¤ver, eller hur? VarfÃ¶r inte anvÃ¤nda fÃ¤rre bitar fÃ¶r super populÃ¤ra bokstÃ¤ver, som E, de saker du gissa fÃ¶rst i Wheel of Fortune, och anvÃ¤nda fler bitar fÃ¶r mindre populÃ¤ra breven? VarfÃ¶r? Eftersom vi bara kommer att anvÃ¤nder dem mindre ofta. 

Tja, visar det sig att det har kommit fÃ¶rsÃ¶k gjorts fÃ¶r att gÃ¶ra detta. Och om du minns frÃ¥n Ã¥rskurs skolan eller gymnasiet, morsekod. Morsekod har prickar och streck som kan vara Ã¶verfÃ¶rs utmed en trÃ¥d som ljud eller signaler av nÃ¥gon form. Men morsekod Ã¤r en super clean. Det Ã¤r lite av en binÃ¤r system att du har prickar eller streck. Men om du ser, till exempel, tvÃ¥ punkter. Eller om du tÃ¤nker tillbaka till operatÃ¶ren som gÃ¥r som pip, pip, pip, pip, slÃ¥ en liten trigger som sÃ¤nder en signal, om du, mottagaren, fÃ¥r tvÃ¥ prickar, vilket budskap har du fÃ¥tt? Helt godtyckligt. 

Jag? Jag? Eller vad about-- eller jag? Kanske var det bara tvÃ¥ E rÃ¤tt? SÃ¥ det finns detta problem av decodability med Morse kod, varmed om inte den person som skickar meddelandet du faktiskt paus sÃ¥ att du kan sortera av se eller hÃ¶ra klyftorna mellan bokstÃ¤verna, det Ã¤r inte tillrÃ¤ckligt att endast skicka en strÃ¶m av ettor och nollor, eller prickar och streck, eftersom det finns tvetydighet. E Ã¤r en enda prick, sÃ¥ om du se tvÃ¥ punkter eller hÃ¶ra tvÃ¥ punkter, kanske Ã¤r det tvÃ¥ E: s eller kanske Ã¤r det ett I. SÃ¥ vi behÃ¶ver ett system som Ã¤r en lite mer smart Ã¤n sÃ¥. SÃ¥ en man vid namn Huffman Ã¥r sedan kom fram till just detta. SÃ¥ vi ska bara att ta en snabb blick hur trÃ¤den Ã¤r relevant fÃ¶r detta. Antag att detta Ã¤r nÃ¥gon dum meddelande som du vill skicka, sammansatt av bara A, B, C: s D: s och E: s, men det finns en hel del redundans hÃ¤r. Det Ã¤r inte tÃ¤nkt att vara engelska. Det Ã¤r inte krypterad. Det Ã¤r bara en dum meddelande med massor av upprepning. SÃ¥ om du verkligen rÃ¤kna ut alla A: s, B: s, C: s, D's, och E-talet, hÃ¤r Ã¤r frekvensen. 20% av bokstÃ¤verna Ã¤r A: s, 45% av bokstÃ¤verna Ã¤r E-talet, och tre andra frekvenser. Vi rÃ¤knade upp det manuellt och bara gjorde matten. 

SÃ¥ visar det sig att Huffman, fÃ¶r en tid sedan, insett att du vet vad, om jag bÃ¶rjar byggnad ett trÃ¤d eller skog av trÃ¤d, om ni sÃ¥ vill, enligt fÃ¶ljande, kan jag gÃ¶ra fÃ¶ljande. Jag kommer att ge en nod fÃ¶r varje av de brev som jag bryr mig om och jag kommer att lagra insidan av denna nod frekvenserna som ett flyttal vÃ¤rde, eller sÃ¥ kan du anvÃ¤nda det en N, ocksÃ¥, men vi bara anvÃ¤nda en flottÃ¶r hÃ¤r. Och algoritmen som han fÃ¶reslog Ã¤r att du ta denna skog av enda nod trÃ¤d, sÃ¥ super korta trÃ¤d, och du bÃ¶rjar ansluta dem med nya grupper, nya fÃ¶rÃ¤ldrar, om du kommer. Och du gÃ¶r det genom att vÃ¤lja tvÃ¥ minsta frekvenserna Ã¥t gÃ¥ngen. SÃ¥ jag tog 10% och 10%. Jag skapar en ny nod. Och jag kallar den nya noden 20%. 

Vilka tvÃ¥ noder jag kombinera nÃ¤sta? Det Ã¤r lite tvetydigt. SÃ¥ det finns vissa hÃ¶rn fall till Ã¶vervÃ¤ga, men att hÃ¥lla saker ganska, Jag kommer att vÃ¤lja 20% - Jag ignorerar nu barnen. Jag kommer att vÃ¤lja 20% och 15% och rita tvÃ¥ nya kanter. Och nu som tvÃ¥ noder jag logiskt kombinera? Ignorera alla barn, alla barnbarn, titta bara pÃ¥ rÃ¶tterna nu. Vilka tvÃ¥ noder jag knyta ihop? Punkt tvÃ¥ och 0,35. SÃ¥ lÃ¥t mig rita tvÃ¥ nya kanter. Och dÃ¥ har jag bara fÃ¥tt en vÃ¤nster. SÃ¥ hÃ¤r Ã¤r ett trÃ¤d. Och det dragits medvetet att titta slags sÃ¶t, men mÃ¤rker att kanterna har Ã¤ven mÃ¤rkts noll och ett. SÃ¥ alla de vÃ¤nsterkant Ã¤r noll godtyckligt, men konsekvent. Alla hÃ¶gra kanten Ã¤r sÃ¥dana. 

Och sÃ¥ vad Hoffman fÃ¶reslagna, Om du vill representera en B, snarare Ã¤n representerar antal 66 som en ASCII som Ã¤r Ã¥tta hela bitar, vet du vad, bara butiken mÃ¶nstret noll, noll, noll, noll, eftersom det Ã¤r den vÃ¤g frÃ¥n mitt trÃ¤d, Mr. Huffman trÃ¤d, till bladet frÃ¥n roten. Om du vill spara en E, dÃ¤remot, inte skicka Ã¥tta bitar som representerar ett E. IstÃ¤llet skickar vilket mÃ¶nster bitar? En. Och vad Ã¤r trevligt om det hÃ¤r Ã¤r att E Ã¤r den mest populÃ¤ra brev, och du anvÃ¤nder kortaste kod fÃ¶r det. Den nÃ¤st mest populÃ¤ra brev ser ut som det var A. Och sÃ¥ hur mÃ¥nga bitar gjorde han fÃ¶reslÃ¥r att anvÃ¤nda fÃ¶r det? Noll, en. 

Och eftersom det Ã¤r genomfÃ¶rs som detta trÃ¤d, fÃ¶r nu LÃ¥t mig faststÃ¤lla att det finns ingen tvetydighet som i Morse kod, eftersom alla bokstÃ¤ver du bryr dig om Ã¤r i slutet av dessa kanter. SÃ¥ det Ã¤r bara en applicering av ett trÃ¤d. Detta Ã¤r-- och jag vÃ¥g min hand pÃ¥ hur du kan genomfÃ¶ra detta som en C-struktur. Vi behÃ¶ver bara kombinera en symbol, som en rÃ¶ding, och frekvensen i vÃ¤nster och hÃ¶ger. Men lÃ¥t oss titta pÃ¥ tvÃ¥ slutliga exempel som du kan bli ganska bekant med efter quiz noll problem set fem. 

SÃ¥ det finns datastrukturen kÃ¤nd som en hashtabell. Och en hashtabell Ã¤r typ av kyla genom att den har hinkar. Och antar att det finns fyra hinkar HÃ¤r, bara fyra tomma utrymmen. HÃ¤r Ã¤r en kortlek, och hÃ¤r Ã¤r klubb, spade, klubba, diamanter, klubba, diamanter, klubba, diamanter, clubs-- sÃ¥ detta Ã¤r slumpmÃ¤ssigt. Hearts, Hearts-- sÃ¥ jag Ã¤r bucketizing alla ingÃ¥ngarna hÃ¤r. Och en hashtabell behÃ¶ver att titta pÃ¥ din input, och sedan lÃ¤gga den i en viss Placera baserat pÃ¥ vad du ser. Det Ã¤r en algoritm. Och jag anvÃ¤nde en super enkel visuell algoritm. Den svÃ¥raste delen av som var komma ihÃ¥g vad bilderna var. Och sedan finns det fyra totalt saker. 

Nu travar vÃ¤xte, vilket Ã¤r en avsiktlig konstruktion sak hÃ¤r. Men vad kan jag gÃ¶ra? SÃ¥ faktiskt hÃ¤r vi har en gÃ¤ng gamla skolan examen bÃ¶cker. Antag att ett gÃ¤ng elevernas namn Ã¤r hÃ¤r. HÃ¤r Ã¤r en stÃ¶rre hash-tabell. I stÃ¤llet fÃ¶r fyra hinkar, Jag har, lÃ¥t oss sÃ¤ga 26. Och vi ville inte gÃ¥ lÃ¥na 26 saker frÃ¥n utsidan [? Annenberg?], SÃ¥ HÃ¤r Ã¤r fem som representerar A till Z. Och om jag se en student vars namn bÃ¶rjar med A, Jag kommer att sÃ¤tta sin frÃ¥gesport dÃ¤r. Om nÃ¥gon bÃ¶rjar med C, dÃ¤r borta, A-- faktiskt, inte vill gÃ¶ra det. B gÃ¥r hit. SÃ¥ jag har A och B och C. And nu hÃ¤r Ã¤r en annan student. Men om detta hash-tabell Ã¤r genomfÃ¶rs med en array, Jag slags skruvad vid denna tidpunkt, eller hur? Jag slags behÃ¶ver fÃ¶r att sÃ¤tta den hÃ¤r nÃ¥gonstans. 

SÃ¥ ett sÃ¤tt jag kan lÃ¶sa detta Ã¤r, allt hÃ¶ger, Ã¤r en upptagen, B Ã¤r upptagen, C Ã¤r upptagen. Jag kommer att sÃ¤tta honom i D. SÃ¥ vid fÃ¶rst, jag har random omedelbar tillgÃ¥ng till var och en av skopor till eleverna. Men nu Ã¤r det typ av decentraliserade till nÃ¥got linjÃ¤r, fÃ¶r om jag vill sÃ¶ka efter nÃ¥gon vars namn bÃ¶rjar med A, kolla jag hÃ¤r. Men om detta inte Ã¤r en elev jag letar efter, Jag slags mÃ¥ste bÃ¶rja kontrollera hinkar, eftersom vad jag gjorde var typ av linjÃ¤rt sond datastrukturen. En dum sÃ¤tt att sÃ¤ga bara titta fÃ¶r fÃ¶rsta tillgÃ¤ngliga Ã¶ppningen, och satte som en plan B, sÃ¥ att sÃ¤ga, eller en plan D i detta fall vÃ¤rdet pÃ¥ den platsen i stÃ¤llet. Detta Ã¤r bara sÃ¥ att om du har fick 26 platser och inga studenter med namnet Q eller Z, eller nÃ¥got liknande att Ã¥tminstone du anvÃ¤nder utrymmet. 

Men vi har redan sett mer smarta lÃ¶sningar hÃ¤r, eller hur? Vad skulle du gÃ¶ra istÃ¤llet Om du har en kollision? Om tvÃ¥ personer har namnet A, vad skulle har varit ett smartare eller mer intuitiv lÃ¶sning Ã¤n bara sÃ¤tta A dÃ¤r D Ã¤r tÃ¤nkt att vara? VarfÃ¶r jag inte bara gÃ¥ utanfÃ¶r [? Annenberg?], som malloc, en annan nod, uttryckte det hÃ¤r, och sedan lÃ¤gga att en student hÃ¤r. SÃ¥ att jag har vÃ¤sentligen nÃ¥gon form av en matris, eller kanske mer elegant som vi Ã¤r bÃ¶rjar se en lÃ¤nkad lista. 

Och sÃ¥ en hashtabell Ã¤r en struktur som kan se ut precis som detta, men mer skickligt, du nÃ¥got som kallas separat kedja, varvid en hashtabell helt enkelt Ã¤r en array, vart och ett av vars element Ã¤r inte ett nummer, sjÃ¤lv Ã¤r en lÃ¤nkad lista. SÃ¥ att du fÃ¥r supersnabb tillgÃ¥ng besluta om att hash ditt vÃ¤rde fÃ¶r. UngefÃ¤r som med kort exempel Jag gjorde super snabba beslut. HjÃ¤rtan gÃ¥r hÃ¤r, diamanter gÃ¥r hÃ¤r. Samma hÃ¤r, gÃ¥r A hÃ¤r, D gÃ¥r hÃ¤r, B gÃ¥r hÃ¤r. SÃ¥ supersnabb uppslagningar, och om du rÃ¥kar stÃ¶ta pÃ¥ ett fall dÃ¤r du har fÃ¥tt kollisioner, tvÃ¥ personer med samma namn, ja dÃ¥ du bara bÃ¶rja lÃ¤nka ihop dem. Och kanske du hÃ¥lla dem sorterade alfabetiskt, kanske du inte. Men Ã¥tminstone nu har vi dynamik. SÃ¥ Ã¥ ena sidan har vi supersnabb konstant tid, och typ av linjÃ¤r tid inblandade om dessa lÃ¤nkade listor bÃ¶rjar bli lite lÃ¥ng. 

SÃ¥ denna typ av en dum, geeky skÃ¤mt Ã¥r sedan. Vid CS50 hacka-a-thon, nÃ¤r eleverna checkar in, vissa TF eller CA varje Ã¥r tycker att det Ã¤r roligt att sÃ¤tta upp ett tecken som detta, dÃ¤r det bara innebÃ¤r att om ditt namn bÃ¶rjar med en A, gÃ¥ denna vÃ¤g. Om ditt namn bÃ¶rjar med ett B, gÃ¥ this-- OK, det Ã¤r roligt kanske senare under terminen. Men det finns en annan sÃ¤tt att gÃ¶ra detta ocksÃ¥. Kom tillbaka till det. 

SÃ¥ det finns denna struktur. Och detta Ã¤r vÃ¥r sista struktur fÃ¶r idag, vilket Ã¤r nÃ¥got som kallas en trie. T-R-I-E, som av nÃ¥gon anledning Ã¤r kort fÃ¶r hÃ¤mtning, men det heter trie. SÃ¥ en trie Ã¤r en annan intressant blandning av en hel del av dessa idÃ©er. Det Ã¤r ett trÃ¤d, som vi har sett fÃ¶rut. Det Ã¤r inte ett binÃ¤rt sÃ¶ktrÃ¤d. Det Ã¤r ett trÃ¤d med valfritt antal barn, men vart och ett av barnen i en trie Ã¤r en array. En array av storlek, sÃ¤ger, 26 eller kanske 27 Om du vill stÃ¶dja bindestreck namn eller apostrofer i mÃ¤nniskors namn. 

Och sÃ¥ detta Ã¤r en datastruktur. Och om man tittar uppifrÃ¥n till botten, precis som om du titta pÃ¥ toppnoden dÃ¤r, M, Ã¤r pekar pÃ¥ vÃ¤nstra sak dÃ¤r, vilken sedan A, X, W, E, L, L. Detta Ã¤r bara en datastruktur som godtyckligt lagrar mÃ¤nniskors namn. Och Maxwell lagras genom att bara fÃ¶lja en vÃ¤g av matris till matris till matris. Men vad som Ã¤r fantastiskt om en trie Ã¤r att, medan en lÃ¤nkad lista och Ã¤ven en array, Ã¤r det bÃ¤sta som vi nÃ¥gonsin har fÃ¥tt linjÃ¤r tid eller logaritmisk tid pÃ¥ att leta upp nÃ¥gon. I denna datastruktur av en trie, om min datastruktur har ett namn i det och jag letar efter Maxwell, jag kommer att hitta honom ganska snabbt. Jag ser bara fÃ¶r M-A-X-W-E-L-L. Om denna datastruktur, dÃ¤remot, Om N Ã¤r en miljon, om det finns en miljoner namn i denna datastruktur, Maxwell fortfarande kommer att vara upptÃ¤ckbar efter bara M-A-X-W-E-L-L steg. Och David-- D-A-V-l-D steg. Med andra ord, genom att bygga en datastruktur som Ã¤r fick alla dessa matriser, vilka alla sjÃ¤lva stÃ¶der random access, Jag kan bÃ¶rja leta upp mÃ¤nniskors namn med en tid som Ã¤r proportionell mot inte antalet saker i datastrukturen, som en miljon befintliga namn. Hur lÃ¥ng tid det tar mig att hitta M-A-X-W-E-L-L i denna datastruktur Ã¤r proportionell inte till den storleken av den datastruktur, men till lÃ¤ngden av namnet. Och realistiskt namn vi letar upp kommer aldrig att vara galen lÃ¥ng. Kanske nÃ¥gon har en 10 tecken namn, 20 teckennamn. Det Ã¤r verkligen begrÃ¤nsad, eller hur? Det finns en mÃ¤nniska pÃ¥ jorden som har den lÃ¤ngsta mÃ¶jliga namn, men det namnet Ã¤r en konstant vÃ¤rde lÃ¤ngd, eller hur? Det varierar inte pÃ¥ nÃ¥got sÃ¤tt. SÃ¥ pÃ¥ detta sÃ¤tt, vi har uppnÃ¥tt en datastruktur som Ã¤r konstant tidsuppslags. Det tar ett antal steg beroende pÃ¥ lÃ¤ngden av den ingÃ¥ende, men inte antalet namn i datastrukturen. SÃ¥ om vi fÃ¶rdubbla antalet namn nÃ¤sta Ã¥r frÃ¥n en miljard till tvÃ¥ miljarder kronor, slutsats Maxwell kommer att ta exakt samma antal sju steg att hitta honom. Och sÃ¥ vi tycks ha uppnÃ¥tt vÃ¥r heliga graal gÃ¥ngtid. 

SÃ¥ ett par snabba meddelanden. Quiz noll kommer upp. Mer om det pÃ¥ kursens hemsida under de kommande dagarna. MÃ¥ndagens lecture-- det Ã¤r en helgdag hÃ¤r pÃ¥ Harvard pÃ¥ mÃ¥ndag. Det Ã¤r inte i New Haven, sÃ¥ vi tar klassen New Haven fÃ¶r fÃ¶relÃ¤sning pÃ¥ mÃ¥ndag. Allt kommer att filmas och streamas live som vanligt, men lÃ¥t oss avsluta idag med en 30 sekunders klipp kallade "djupa tankar" av Daven Farnham, som inspirerades fÃ¶rra Ã¥ret med lÃ¶rdag Night Live: s "djupa tankar" av Jack Handy, som bÃ¶r nu vara meningsfullt. 

FILM: Och nu, "Djup Tankar "av Daven Farnham. Hashtabell. 

TALARE 1: Okej, det Ã¤r det fÃ¶r nu. Vi ses nÃ¤sta vecka. 

DOUG: FÃ¶r att se det i handling. SÃ¥ lÃ¥t oss ta en titt pÃ¥ det just nu. SÃ¥ hÃ¤r har vi en osorterad array. 

IAN: Doug, kan du gÃ¥ vidare och starta om detta fÃ¶r bara en sekund, snÃ¤lla. Okej, Ã¤r kamerorna rullar, sÃ¥ Ã¥tgÃ¤rd nÃ¤r du Ã¤r klar, Doug, OK? DOUG: Okej, sÃ¥ vad vi har hÃ¤r Ã¤r en osorterad array. Och jag har fÃ¤rgat alla element rÃ¶tt fÃ¶r att indikera att det Ã¤r i sjÃ¤lva verket, osorterat. SÃ¥ minns att det fÃ¶rsta vi gÃ¶r Ã¤r vi sorterar vÃ¤nstra halvan av gruppen. DÃ¥ kan vi sortera rÃ¤tt halv av arrayen. Och ya-da, ya-da, ya-da, Vi sammanfoga dem tillsammans. Och vi har en helt sorterad array. SÃ¥ det Ã¤r hur merge sort fungerar. 

IAN: Whoa, whoa, whoa, cut, cut, cut, cut. Doug kan du inte bara ya-da, ya-da, ya-da, din vÃ¤g genom sammanslagning slag. 

DOUG: Jag gjorde bara. Det Ã¤r bra. Vi Ã¤r bra att gÃ¥. LÃ¥t oss bara hÃ¥lla rullande. SÃ¥ hur som helst, 

IAN: Du mÃ¥ste fÃ¶rklara det mera fullstÃ¤ndigt Ã¤n sÃ¥. Det Ã¤r bara inte tillrÃ¤ckligt. DOUG: Ian, gÃ¶r vi inte behÃ¶ver gÃ¥ tillbaka till en. Det Ã¤r bra. SÃ¥ hur som helst, om vi fortsÃ¤tter med merge-- Ian, vi Ã¤r mitt i inspelningen. 

IAN: Jag vet. Och vi kan inte bara ya-da, ya-da, ya-da, genom hela processen. Du mÃ¥ste fÃ¶rklara hur tvÃ¥ sidor slÃ¥s ihop. 

DOUG: Men vi har redan fÃ¶rklarade hur de tvÃ¥ sides-- 

IAN: Du har just visat dem en sammanfogning matris. DOUG: De vet processen. De Ã¤r bra. Vi har gÃ¥tt Ã¶ver den tio gÃ¥nger. 

IAN: Du hoppade precis rÃ¤tt Ã¶ver det. Vi kommer tillbaka till en, kan du inte ya-da, ya-da Ã¶ver den. Okej, tillbaka till en. 

DOUG: Jag mÃ¥ste gÃ¥ tillbaka igenom alla bilderna? Herregud. Det Ã¤r som sjÃ¤tte gÃ¥ngen, Ian. Det Ã¤r bra. 

IAN: Okej. Ãr du redo? Bra. Action.