DOUG LLOYD: SÃ¥ i CS50, har vi dekket en rekke forskjellige datastrukturer, ikke sant? Vi har sett arrays, og knyttes lister og hash tabeller, og prÃ¸ver, stabler og kÃ¸er. Vi vil ogsÃ¥ lÃ¦re litt om trÃ¦r og hauger, men egentlig alle disse bare ende opp som variasjoner over et tema. Det virkelig er disse form av fire grunnleggende ideer at alt annet kan koke ned til. Arrays, lenkede lister, hash tabeller og prÃ¸ver. Og som jeg sa, det er variasjoner pÃ¥ dem, men dette er ganske mye kommer til Ã¥ oppsummere alt vi kommer til Ã¥ snakke om i denne klassen nÃ¥r det gjelder C. Men hvordan gjÃ¸r alle disse mÃ¥ler opp, ikke sant? Vi har snakket om fordeler og ulemper av hver i separate videoer pÃ¥ dem, men det er mye av tall Ã¥ bli kastet rundt. Det er mye av generell tanker Ã¥ bli kastet rundt. La oss prÃ¸ve og konsolidere den inn i bare ett sted. La oss veie fordeler mot cons, og vurdere som datastruktur kan vÃ¦re det riktige data struktur for din situasjon, uansett hva slags data du lagrer. Du trenger ikke nÃ¸dvendigvis alltid trenger Ã¥ bruke super rask innsetting, sletting, og oppslag av en trie hvis du virkelig ikke bryr seg om Ã¥ sette inn og slette for mye. Hvis du bare trenger raskt tilfeldig tilgang til, kanskje en matrise er bedre. SÃ¥ la oss destillere det. La oss snakke om hver av de fire store typer datastrukturer at vi har snakket om, og bare se nÃ¥r de kan vÃ¦re bra, og nÃ¥r de ikke kan vÃ¦re sÃ¥ bra. SÃ¥ la oss starte med arrays. SÃ¥ innsetting, er den slags dÃ¥rlig. 

Innsetting i enden av en matrise er OK, hvis vi bygger en matrise som vi gÃ¥r. Men hvis vi trenger Ã¥ sette inn elementer i midten, tenker tilbake til innsetting sortere, det er mye av skiftende for Ã¥ passe et element i det. Og sÃ¥ hvis vi kommer til Ã¥ sette inn hvor som helst, men i enden av en matrise, det er nok ikke sÃ¥ stor. 

Tilsvarende sletting, med mindre vi er sletting fra enden av en matrise, er trolig heller ikke sÃ¥ stor hvis vi Ã¸nsker ikke Ã¥ la tomme hull, som vanligvis vi ikke. Vi Ã¸nsker Ã¥ fjerne et element, og da liksom gjÃ¸re det tett igjen. Og sÃ¥ slette elementer fra en matrise, heller ikke sÃ¥ stor. 

Oppslag, skjÃ¸nt, er stor. Vi har random access, konstant tid oppslag. Vi bare si syv, og vi gÃ¥r Ã¥ rekke flytting sju. Vi sier 20, med farten til matrise flytting 20. Vi har for Ã¥ iterere over. Det er ganske bra. 

Arrays er ogsÃ¥ relativt enkelt Ã¥ sortere. Hver gang vi snakket om en sortering algoritme, slik som valg sort, innsetting sortere, boble sortere, flette sortere, vi alltid brukt matriser til Ã¥ gjÃ¸re det, fordi arrays er ganske lett Ã¥ sort, i forhold til datastrukturene vi har sett sÃ¥ langt. 

De er ogsÃ¥ forholdsvis liten. Det er ikke mye ekstra plass. Du bare satt akkurat sÃ¥ mye som du trenger for Ã¥ holde dine data, og det er ganske mye det. SÃ¥ de er ganske smÃ¥ og effektiv pÃ¥ den mÃ¥ten. Men en annen ulempe, skjÃ¸nt, er at de er lÃ¸st i stÃ¸rrelse. Vi mÃ¥ erklÃ¦re nÃ¸yaktig hvordan big vi Ã¸nsker vÃ¥r rekke Ã¥ vÃ¦re, og vi fÃ¥r bare ett skudd pÃ¥ den. Vi kan ikke vokse og krympe det. 

Hvis vi trenger Ã¥ vokse eller krympe det, vi trenger Ã¥ erklÃ¦re en helt ny rekke, kopiere alle elementene i den fÃ¸rste rekke inn i den andre matrisen. Og hvis vi feilberegnet at tid, mÃ¥ vi gjÃ¸re det igjen. Ikke sÃ¥ stor. SÃ¥ arrays ikke gir oss fleksibilitet Ã¥ ha variable antall elementer. 

Med en lenket liste, innsetting er ganske enkelt. Vi tack bare pÃ¥ forsiden. Sletting er ogsÃ¥ ganske lett. Vi mÃ¥ finne elementene. Som involverer noen sÃ¸ker. 

Men nÃ¥r du har funnet elementet du leter etter, alt du trenger Ã¥ gjÃ¸re er Ã¥ endre en peker, muligens to hvis du har en koblet list-- en dobbelt lenket liste, rather-- og da kan du bare frigjÃ¸re node. Du trenger ikke Ã¥ skifte alt rundt. Du bare endre to pekere, sÃ¥ det er ganske rask. 

Oppslag er dÃ¥rlig skjÃ¸nt, ikke sant? For at vi skal finne en element i en lenket liste, enten enkeltvis eller dobbelt koblet, vi mÃ¥ lineÃ¦r sÃ¸ke den. Vi mÃ¥ begynne pÃ¥ begynnelsen og flytte til slutt, eller starte i slutten farten til begynnelsen. Vi har ikke random access lenger. SÃ¥ hvis vi gjÃ¸r en Mange sÃ¸ker, kanskje en lenket liste er ikke ganske sÃ¥ bra for oss. 

De er ogsÃ¥ veldig vanskelig Ã¥ sortere, ikke sant? Den eneste mÃ¥ten du kan virkelig sortere en lenket liste er Ã¥ sortere det som du konstruere den. Men hvis du sortere det som du konstruere det, er du ikke lenger gjÃ¸re raske innsett lenger. Du er ikke bare overvinne ting pÃ¥ forsiden. Du mÃ¥ finne den rett sted for Ã¥ si det, og deretter din innsetting blir omtrent like ille som du setter inn i en matrise. SÃ¥ lenkede lister er ikke sÃ¥ stor for Ã¥ sortere data. 

De er ogsÃ¥ ganske liten, stÃ¸rrelse-messig. Dobbelt lenket liste litt stÃ¸rre enn enkeltvis lenkede lister, som er litt stÃ¸rre enn arrays, men det er ikke en enorm mengde bortkastet plass. SÃ¥ hvis plassen er pÃ¥ en premie, men ikke en veldig intens premie, dette kan vÃ¦re den rette veien Ã¥ gÃ¥. 

Hash tabeller. Innsetting i en hash table er ganske grei. Det er en to-trinns prosess. FÃ¸rst mÃ¥ vi kjÃ¸re vÃ¥re data gjennom en hash-funksjon for Ã¥ fÃ¥ en hash-kode, og deretter vi sett elementet inn i hash table pÃ¥ at hash-kode plassering. 

Sletting, ligner lenket liste, er lett nÃ¥r du finner elementet. Du mÃ¥ finne det fÃ¸rst, men sÃ¥ nÃ¥r du sletter den, du trenger bare Ã¥ utveksle et par tips, hvis du bruker separat kjeding. Hvis du bruker sondering, eller hvis du ikke bruker kjeding i det hele tatt i hash table, sletting er faktisk veldig enkelt. Alt du trenger Ã¥ gjÃ¸re er hasj den data, og deretter gÃ¥ til stedet. Og forutsatt at du ikke gjÃ¸r det har noen kollisjoner, vil du vÃ¦re i stand til Ã¥ slette svÃ¦rt raskt. 

NÃ¥ er oppslag hvor ting fÃ¥ litt mer komplisert. Det er i gjennomsnitt bedre enn lenkede lister. Hvis du bruker kjeding, du har fortsatt en lenket liste, som betyr at du fortsatt har sÃ¸k skade en lenket liste. Men fordi du tar din linket liste og dele det over 100 eller 1000 eller n elementer i hash table, er du lenkede lister er alle ett NTH stÃ¸rrelsen. De er alle vesentlig mindre. Du har n knyttet lister i stedet av Ã©n lenket liste av stÃ¸rrelse n. 

Og sÃ¥ dette real-world konstant faktor, som vi vanligvis ikke snakke om i tide kompleksitet, det gjÃ¸r faktisk en forskjell her. SÃ¥ oppslag er fortsatt lineÃ¦r sÃ¸ke hvis du bruker kjeding, men lengden av listen du sÃ¸ker gjennom er veldig, veldig kort i sammenligning. Igjen, hvis sorteringen er din MÃ¥let her, hash tabellen sannsynligvis ikke den rette veien Ã¥ gÃ¥. Bare bruk en matrise hvis sortering er virkelig viktig for deg. 

Og de kan kjÃ¸re gamut av stÃ¸rrelsen. Det er vanskelig Ã¥ si om en hash table er liten eller stor, fordi det er egentlig avhengig av hvor stor hash table er. Hvis du bare skal lagre fem elementer i hash table, og du har en hash table med 10.000 elementer i det, er du sannsynligvis kaste bort mye plass. Kontrast til at du kan ogsÃ¥ har veldig kompakte hash tabeller, men mindre din hash table blir, jo lenger hver av disse lenkede lister blir. Og sÃ¥ det er egentlig ingen mÃ¥te Ã¥ definere nÃ¸yaktig stÃ¸rrelsen pÃ¥ en nÃ¸kkeltabell, men det er nok trygt Ã¥ si at det er generelt kommer til Ã¥ bli stÃ¸rre enn en koblet listen lagrer de samme data, men mindre enn en trie. 

Og prÃ¸ver er den fjerde av disse strukturene at vi har snakket om. Sette inn en trie er kompleks. Det er mye av dynamisk minnetildeling, sÃ¦rlig i begynnelsen, som du begynner Ã¥ bygge. Men det er konstant tid. Det er bare det menneskelige element her som gjÃ¸r det vanskelig. Ã mÃ¥tte mÃ¸te nullpeker, malloc plass, gÃ¥r det, muligens malloc plass derfra igjen. Den slags trusler faktor pÃ¥ pekere i dynamisk minne allokering er hinderet for Ã¥ fjerne. Men nÃ¥r du har ryddet det, innsetting kommer faktisk ganske enkelt, og det absolutt er konstant tid. 

Sletting er enkelt. Alt du trenger Ã¥ gjÃ¸re er Ã¥ navigere ned en par pekere og gratis noden, sÃ¥ det er ganske bra. Oppslag er ogsÃ¥ ganske fort. Det er bare basert pÃ¥ den lengden av dine data. SÃ¥ hvis alle dine data er fem tegnstrenger, for eksempel, du lagrer five tegnstrenger i din trie, det tar bare fem trinn til finne det du leter etter. Five er bare en konstant faktor, sÃ¥ igjen, innsetting, sletting, og oppslag her er alle konstant tid, effektivt. 

En annen ting er at din trie er faktisk slags allerede sortert, ikke sant? I kraft av hvordan vi er sette inn elementer, ved Ã¥ gÃ¥ bokstav for bokstav i tasten eller tall for tall av nÃ¸kkelen, vanligvis ender opp som din trie slags sortert som du bygger den. Det gjÃ¸r egentlig ikke gjÃ¸r fornuftig Ã¥ tenke pÃ¥ sortering pÃ¥ samme mÃ¥te som vi tenker pÃ¥ det med matriser, eller lenkede lister, eller hash tabeller. Men pÃ¥ en mÃ¥te, din trie er sortert som du gÃ¥r. 

Ulempen er selvfÃ¸lgelig at en trie raskt blir enorme. Fra hvert knutepunkt, kanskje du have-- hvis nÃ¸kkelen bestÃ¥r av tall, du har 10 andre steder du kan gÃ¥, som betyr at hver node inneholder informasjon om dataene du Ã¸nsker Ã¥ lagre pÃ¥ at node, pluss 10 pekere. Som pÃ¥ CS50 IDE, er 80 byte. SÃ¥ det er minst 80 byte for hver node som du oppretter, og det er ikke engang telle data. Og hvis nodene er bokstaver i stedet for tall, nÃ¥ har du 26 tips fra hvert sted. Og 26 ganger 8 er trolig 200 byte, eller noe sÃ¥nt. Og du har kapital og lowercase-- du kan se hvor jeg kommer med dette, ikke sant? Dine noder kan bli virkelig stor, og slik at trie selv, samlet, kan fÃ¥r virkelig stor, ogsÃ¥. SÃ¥ hvis plass er pÃ¥ et hÃ¸yt premie pÃ¥ systemet, en trie er kanskje ikke den rette mÃ¥ten Ã¥ gÃ¥, selv om de andre fordelene spiller inn. Jeg er Doug Lloyd. Dette er CS50.