[Musik spiller] DOUG LLOYD: Ved nu du ved en masse om arrays, og du ved en masse om hÃ¦gtede lister. Og vi har diskutere fordele og ulemper, vi har diskuteret, der er knyttet lister kan fÃ¥ stÃ¸rre og mindre, men de fylder mere stÃ¸rrelse. Arrays er meget mere ligetil at bruge, men de er restriktive i sÃ¥ meget som vi er nÃ¸dt til at indstille stÃ¸rrelsen pÃ¥ arrayet i begyndelsen og sÃ¥ er vi fast med det. 

Men det er, vi har temmelig meget udtÃ¸mt alle vores emner om hÃ¦gtede lister og arrays. Eller har vi? MÃ¥ske kan vi gÃ¸re noget endnu mere kreative. Og den slags lÃ¥ner tanken om en hash tabel. 

SÃ¥ i en hash tabel vil vi forsÃ¸ge kombinere et array med en sammenkÃ¦det liste. Vi kommer til at tage fordelene af array'et, som random access, at vÃ¦re i stand til at bare gÃ¥ til matrix element 4 eller arrayelement 8 uden at skulle gentage tvÃ¦rs. Det er temmelig hurtigt, ikke? 

Men vi Ã¸nsker ogsÃ¥ at have vores data struktur kunne vokse og skrumpe. Vi har ikke brug for, vi ikke Ã¸nsker at vÃ¦re begrÃ¦nset. Og vi Ã¸nsker at kunne at tilfÃ¸je og fjerne ting meget let, som hvis du husker, er meget kompleks med et array. Og vi kan kalde denne ny ting en hash tabel. 

Og hvis den gennemfÃ¸res korrekt, vi slags tager fordelene ved bÃ¥de data strukturer, som du allerede har set, arrays og hÃ¦gtede lister. IndsÃ¦ttelse kan begynde at tenderer mod theta 1. Theta har vi ikke rigtig diskuteret, men theta er bare den gennemsnitlige fald hvad der rent faktisk kommer til at ske. Du er ikke altid vil har det vÃ¦rst tÃ¦nkelige scenarie, og du ikke altid vil have bedste fald, sÃ¥ hvad er den gennemsnitlige scenario? 

NÃ¥ en gennemsnitlig indsÃ¦ttelse i en hashtabel kan begynde at komme tÃ¦t pÃ¥ konstant tid. Og sletning kan fÃ¥ tÃ¦t pÃ¥ konstant tid. Og opslag kan fÃ¥ tÃ¦t pÃ¥ konstant tid. That's-- vi ikke har et data struktur endnu, der kan gÃ¸re det, og sÃ¥ dette allerede lyder som en temmelig stor ting. Vi har virkelig afbÃ¸des den ulemper ved hver pÃ¥ egen hÃ¥nd. 

For at fÃ¥ denne ydelse opgradere selv, vi nÃ¸dt til at genoverveje, hvordan vi tilfÃ¸jer data i strukturen. Konkret Ã¸nsker vi data, selv at fortÃ¦lle os hvor det skal gÃ¥ i strukturen. Og hvis vi sÃ¥ nÃ¸dt til at se, om det er i strukturen, hvis vi har brug for at finde det, vi Ã¸nsker at se pÃ¥ data igen og vÃ¦re i stand til effektivt, ved hjÃ¦lp af data, tilfÃ¦ldigt adgang til den. Bare ved at se pÃ¥ data, som vi skal have en idÃ© om, hvor prÃ¦cis er vi kommer til at finde det i hash-tabellen. 

Nu ulempen ved en hash bordet er, at de er virkelig temmelig dÃ¥rlig til at bestille eller sortering af data. Og i virkeligheden, hvis du starter at bruge dem til orden eller sortere data, mister du alle de fordele, du tidligere havde i form af indsÃ¦ttelse og sletning. Tiden bliver tÃ¦ttere pÃ¥ theta pÃ¥ n, og vi har set svandt i en sammenkÃ¦det liste. Og sÃ¥ vi kun Ã¸nsker at bruge hash tabeller, hvis vi ikke bekymrer sig om hvorvidt dataene er sorteret. For den sammenhÃ¦ng, hvori du skal bruge dem i CS50 du sandsynligvis er ligeglad at dataene er sorteret. 

SÃ¥ en hash tabel er en kombination af to adskilte stykker som vi kender. Den fÃ¸rste er en funktion, som vi normalt kalder en hash-funktion. Og at hash-funktion vil vende tilbage en ikke-negativt heltal, som vi normalt kalder en hashCode, OK? Det andet stykke er et array, som er stand til at lagre data af typen vi Ã¸nsker at placere i datastrukturen. Vi vil holde ud pÃ¥ den sammenkÃ¦det liste element for nu og bare starte med det grundlÃ¦ggende i en hash tabel til at fÃ¥ dit hoved omkring det, og sÃ¥ vil vi mÃ¥ske blÃ¦se dit sind en lille smule, nÃ¥r vi kombinere arrays og link lister sammen. 

Den grundlÃ¦ggende idÃ© om er vi tager nogle data. Vi kÃ¸rer, at data gennem hash-funktionen. Og sÃ¥ data behandles og det spytter et tal, OK? Og derefter med dette nummer vi bare gemme data vi Ã¸nsker at gemme i vifte pÃ¥ det sted. SÃ¥ for eksempel har vi mÃ¥ske denne hash tabel af strenge. Det har fÃ¥et 10 elementer i det, sÃ¥ vi kan passe 10 strygere i den. 

Lad os sige, at vi Ã¸nsker at hash John. SÃ¥ John som de data, vi vil indsÃ¦tte i denne hash tabellen sted. Hvor skal vi sÃ¦tte det? NÃ¥ typisk med en vifte hidtil vi sandsynligvis ville sÃ¦tte det i matrix placering 0. Men nu har vi denne nye hash funktion. 

Og lad os sige, at vi kÃ¸rer John gennem denne hash-funktion og det er spytter 4. NÃ¥ det er, hvor vi er lyst til at sÃ¦tte John. Vi Ã¸nsker at sÃ¦tte John i matrix placering 4, for hvis vi hash John igen-- lad os sige senere vi vil sÃ¸ge og se hvis John eksisterer i denne hash table-- alt, hvad vi behÃ¸ver at gÃ¸re kÃ¸res det gennem den samme hash funktion, fÃ¥ nummeret 4, og vÃ¦re i stand til at finde John straks i vores datastruktur. Det er temmelig godt. 

Lad os sige, at vi nu gÃ¸r det igen, vi Ã¸nsker at hash Paul. Vi Ã¸nsker at tilfÃ¸je Paul i denne hash tabellen. Lad os sige, at vi denne gang kÃ¸re Paul gennem hash-funktionen, den hashCode, der genereres er 6. NÃ¥ nu kan vi sÃ¦tte Paulus i arrayet placeringen 6. Og hvis vi har brug for at slÃ¥ op, om Paulus er i denne hash tabel, alt, hvad vi skal gÃ¸re, er at kÃ¸re Paul gennem hash-funktionen igen og vi kommer til at fÃ¥ 6 ud igen. 

Og sÃ¥ har vi bare se ved opstilling placering 6. Er Paul der? Hvis ja, han er i hash tabellen. Er Paulus ikke er der? Han er ikke i hash tabellen. Det er ret ligetil. 

Nu hvordan kan du definere en hash-funktion? Tja der er virkelig ingen grÃ¦nse for Antallet af mulige hashfunktioner. Faktisk er der en rÃ¦kke virkelig, virkelig gode pÃ¥ internettet. Der er en rÃ¦kke virkelig, virkelig dÃ¥rlige pÃ¥ internettet. Det er ogsÃ¥ ret nemt at skrive en dÃ¥rlig en. 

SÃ¥ hvad gÃ¸r en god hash-funktionen, ikke? NÃ¥ en god hash-funktion bÃ¸r bruger kun de data, der hashed, og alle de data, der hashed. SÃ¥ vi Ã¸nsker ikke at bruge anything-- vi ikke indarbejde noget andet end dataene. Og vi Ã¸nsker at bruge alle data. Vi Ã¸nsker ikke at bare bruge et stykke af det, vi Ã¸nsker at bruge det hele. En hash-funktionen skal ogsÃ¥ vÃ¦re deterministisk. Hvad betyder det? NÃ¥ det betyder, at hver gang vi passere nÃ¸jagtig samme stykke data ind i hash-funktionen vi altid fÃ¥r den samme hashCode ud. Hvis jeg passerer Johannes ind i hash-funktion jeg kommer ud 4. Jeg skulle vÃ¦re i stand til at gÃ¸re det 10.000 gange, og jeg vil altid fÃ¥ 4. SÃ¥ ingen tilfÃ¦ldige tal effektivt kan inddrages i vores hash tables-- i vores hashfunktioner. 

En hash-funktionen skal ogsÃ¥ ensartet at fordele data. Hvis hver gang du kÃ¸rer data via hash-funktionen fÃ¥r du hashCode 0, det er nok ikke sÃ¥ stor, hÃ¸jre? Du Ã¸nsker sikkert at store en rÃ¦kke hash-koder. OgsÃ¥ ting kan spredes i hele tabellen. Og ogsÃ¥ det ville vÃ¦re dejligt, hvis virkelig lignende data, som John og Jonathan, mÃ¥ske blev spredt ud til at veje forskellige steder i hash tabellen. Det ville vÃ¦re en god fordel. 

Her er et eksempel pÃ¥ en hash-funktion. Jeg skrev denne ene op tidligere. Det er ikke en sÃ¦rlig god hashfunktion af Ã¥rsager, der ikke rigtig bÃ¦re at gÃ¥ ind lige nu. Men ser du, hvad der foregÃ¥r her? Det ser ud som vi erklÃ¦re en variabel kaldet sum og sÃ¦tte den lig med 0. Og sÃ¥ Ã¥benbart jeg gÃ¸r noget sÃ¥ lÃ¦nge strstr [j] er ikke lig at backslash 0. Hvad gÃ¸r jeg der? 

Dette er dybest set bare et andet mÃ¥de at gennemfÃ¸re [? strl?] og afslÃ¸re nÃ¥r du har nÃ¥et enden af ââstrengen. SÃ¥ jeg behÃ¸ver ikke at faktisk beregne lÃ¦ngden af ââstrengen, Jeg er bare at bruge, nÃ¥r jeg ramte backslash 0 tegn jeg kender Jeg har nÃ¥et slutningen af ââstrengen. Og sÃ¥ jeg har tÃ¦nkt mig at holde iteration gennem denne streng, tilfÃ¸jer strstr [j] for at opsummere, og derefter pÃ¥ slutningen af ââdagen vil returnere summen mod HASH_MAX. 

Dybest set alt dette hash funktion gÃ¸r, er at tilfÃ¸je op alle de ASCII vÃ¦rdier min snor, og sÃ¥ er det returnere nogle hashCode modded af HASH_MAX. Det er nok pÃ¥ stÃ¸rrelse af min matrix, ikke? Jeg Ã¸nsker ikke at vÃ¦re at fÃ¥ hash koder, hvis min array er i stÃ¸rrelse 10, Jeg Ã¸nsker ikke at vÃ¦re at fÃ¥ ud hash-kode 11, 12, 13, kan jeg ikke sÃ¦tte tingene i de steder af opstillingen, det ville vÃ¦re ulovligt. Jeg ville lide en segmentering fejl. 

Nu her er en anden hurtig til side. Generelt er du sandsynligvis ikke kommer til at Ã¸nsker at skrive dine egne hash funktioner. Det er faktisk lidt af en kunst, ikke en videnskab. Og der er en masse, der gÃ¥r ind i dem. Internettet, som jeg sagde, er fuld rigtig gode hashfunktioner, og du skal bruge internettet til at find hashfunktioner fordi det er virkelig lige slags en unÃ¸dvendig spild af tid at oprette din egen. 

Du kan skrive enkle til testformÃ¥l. Men nÃ¥r du rent faktisk kommer til at begynde hashing af data og lagring ind i en hash tabel, du er sandsynligvis vil Ã¸nsker at bruge en funktion, der blev genereret for dig, der findes pÃ¥ internettet. Hvis du bare vÃ¦re sikker at citere dine kilder. Der er ingen grund til at plagiere noget her. 

Den datalogi samfund er afgjort voksende, og virkelig vÃ¦rdier open source, og det er virkelig vigtigt at citere dine kilder, sÃ¥ folk kan fÃ¥ tilskrivning til det arbejde, de er gÃ¸r til gavn for samfundet. SÃ¥ altid vÃ¦re sure-- og ikke kun for hash funktioner, men generelt, nÃ¥r man bruge kode fra en ekstern kilde, altid nÃ¦vne din kilde. Give kredit til den person, der gjorde en del af arbejdet, sÃ¥ du ikke behÃ¸ver at. 

OK, sÃ¥ lad os revidere denne hash tabel til en anden. Det er her, vi forlod off efter vi indsat John og Paul ind i denne hash tabellen. Kan du se et problem her? Du kan se to. Men i sÃ¦rdeleshed, har du se dette mulige problem? 

Hvad hvis jeg hash Ringo, og det viser sig, at efter forarbejdning at data gennem hash-funktionen Ringo ogsÃ¥ genereret hashCode 6. Jeg har allerede fÃ¥et data hashcode-- matrix placering 6. SÃ¥ det er sandsynligvis kommer til at vÃ¦re en smule af et problem for mig nu, ikke? 

Vi kalder det en kollision. Og kollisionen sker, nÃ¥r to stykker af data lÃ¸ber gennem den samme hash Funktionen giver den samme hashCode. Formodentlig vi stadig Ã¸nsker at fÃ¥ bÃ¥de stykker af data til hash tabellen, ellers ville vi ikke kÃ¸re Ringo vilkÃ¥rligt gennem hash-funktionen. Vi formentlig Ã¸nsker at fÃ¥ Ringo i den opstilling. 

Hvordan gÃ¸r vi det selv, hvis han og Paul begge udbytte hashCode 6? Vi Ã¸nsker ikke at overskrive Paul, vi Ã¸nsker Paulus at vÃ¦re der ogsÃ¥. SÃ¥ vi har brug for at finde en mÃ¥de at fÃ¥ elementer i hash tabel, stadig bevarer vores hurtige indsÃ¦ttelse og hurtigt kig op. Og en mÃ¥de at hÃ¥ndtere det er at gÃ¸re noget, der hedder lineÃ¦r sondering. 

Ved hjÃ¦lp af denne metode, hvis vi har en kollision, ja, hvad gÃ¸r vi? NÃ¥ vi kan ikke sÃ¦tte ham i matrix placering 6, eller hvad hashCode blev genereret, lad os sÃ¦tte ham pÃ¥ hashCode plus 1. Og hvis der er fuld lad os sÃ¦tte ham i hashCode plus 2. Fordelen ved dette vÃ¦sen, hvis han er ikke prÃ¦cis, hvor vi tror, ââhan er, og vi er nÃ¸dt til at begynde at sÃ¸ge, mÃ¥ske vi behÃ¸ver ikke at gÃ¥ for vidt. MÃ¥ske har vi ikke at sÃ¸ge alle n elementer af hash tabellen. MÃ¥ske vi nÃ¸dt til at sÃ¸ge et par af dem. 

Og sÃ¥ vi er stadig en tendens i retning af at den gennemsnitlige fald vÃ¦re tÃ¦t pÃ¥ 1 vs tÃ¦t pÃ¥ n, sÃ¥ mÃ¥ske kommer til at arbejde. SÃ¥ lad os se, hvordan dette kan arbejde ud i virkeligheden. Og lad os se om mÃ¥ske kan vi afslÃ¸re det problem, at der kan forekomme her. 

Lad os sige, at vi hash Bart. SÃ¥ nu vil vi til at kÃ¸re et nyt sÃ¦t af strenge gennem hash-funktionen, og vi kÃ¸rer Bart gennem hash funktion, fÃ¥r vi hashCode 6. Vi tager et kig, ser vi 6 tom, sÃ¥ vi kan sÃ¦tte Bart der. 

Nu er vi hash Lisa, og at ogsÃ¥ genererer hashCode 6. NÃ¥ nu, at vi bruger denne lineÃ¦re sondering metode vi starter ved 6, ser vi, at 6 er fuld. Vi kan ikke sÃ¦tte Lisa i 6. SÃ¥ hvor skal vi hen? Lad os gÃ¥ til 7. 7 tomme, sÃ¥ der virker. SÃ¥ lad os sÃ¦tte Lisa der. 

Nu er vi hash Homer og vi fÃ¥r 7. OK godt vi ved, at 7 fulde nu, sÃ¥ kan vi ikke sÃ¦tte Homer der. SÃ¥ lad os gÃ¥ til 8. Er 8 til rÃ¥dighed? Ja, og 8 er tÃ¦t pÃ¥ 7, sÃ¥ hvis vi er nÃ¸dt til at begynde at sÃ¸ge vi er ikke vil have til at gÃ¥ for vidt. Og sÃ¥ lad os sÃ¦tte Homer 8. 

Nu er vi hash Maggie og returnerer 3, gudskelov vi er i stand til at bare sÃ¦tte Maggie der. Vi behÃ¸ver ikke at gÃ¸re noget slags sondering for. Nu er vi hash Marge, og Marge ogsÃ¥ returnerer 6. 

NÃ¥ 6 er fuld, 7 er fuld, 8 er fuld, 9, okay gudskelov 9 er tom. Jeg kan sÃ¦tte Marge ved 9. Vi kan allerede se, at vi er begyndt at have dette problem, hvor nu er vi begynder at strÃ¦kke ting form langt vÃ¦k fra deres hash-koder. Og at theta pÃ¥ 1, det gennemsnitlige tilfÃ¦lde af at vÃ¦re konstant tid, er begyndt at fÃ¥ lidt more-- begynder at tendens lidt mere mod theta pÃ¥ n. Vi er begyndt at miste denne fordel af hash-tabeller. 

Dette problem, som vi lige har set er noget, der hedder klyngedannelse. Og hvad er virkelig dÃ¥rligt om klyngedannelse er, at nÃ¥r du nu har to elementer, der ved siden af side gÃ¸r det endnu mere sandsynligt, du har dobbelt chance, at du vil at have en anden kollision med denne klynge, og klyngen vil vokse med en. Og du vil holde voksende og voksende din sandsynligheden for at have en kollision. Og i sidste ende er det lige sÃ¥ slemt som ikke sortere data overhovedet. 

Det andet problem er dog, at vi stadig, og sÃ¥ videre op til dette punkt, Vi har netop vÃ¦ret en slags at forstÃ¥, hvad en hash tabel er, vi stadig kun har plads til 10 strenge. Hvis vi Ã¸nsker at fortsÃ¦tte med at hash borgerne i Springfield, Vi kan kun fÃ¥ 10 af dem derinde. Og hvis vi forsÃ¸ge at tilfÃ¸je en 11. eller 12., vi ikke har et sted at sÃ¦tte dem. Vi kunne bare vÃ¦re spinning rundt i cirkler forsÃ¸ger at finde et tomt sted, og vi mÃ¥ske gÃ¥r i stÃ¥ i en uendelig lÃ¸kke. 

SÃ¥ denne slags lÃ¥ner til idÃ©en af noget, der hedder kÃ¦de. Og det er her, vi kommer til at bringe hÃ¦gtede lister tilbage ind i billedet. Hvad hvis stedet for at lagre lige selve dataene i arrayet, hvert element i arrayet kunne holde flere stykker af data? NÃ¥ det giver ikke mening, ikke? Vi ved, at et array kan kun hold-- hvert element i et array kan kun holde et stykke af data for denne datatype. 

Men hvad hvis det datatype er en linket liste, ikke? SÃ¥ hvad nu hvis hver element i arrayet var en pointer til lederen af ââen linket liste? Og sÃ¥ kunne vi bygge disse hÃ¦gtede lister og dyrke dem vilkÃ¥rligt, fordi hÃ¦gtede lister tillader os til at vokse og skrumpe meget mere fleksibelt end et array gÃ¸r. SÃ¥ hvad nu hvis vi nu bruger, vi udnytte dette, ikke? Vi begynder at vokse disse kÃ¦der ud af disse Array steder. 

Nu kan vi passer en uendelig datamÃ¦ngde, eller ikke uendelig, en vilkÃ¥rlig mÃ¦ngde data ind i vores hash tabel uden at lÃ¸be ind problemet med kollision. Vi har ogsÃ¥ fjernet klyngedannelse ved at gÃ¸re dette. Og godt vi ved, at nÃ¥r vi indsÃ¦tter ind i en linket liste, hvis du husker fra vores video pÃ¥ hÃ¦gtede lister, enkeltvis forbundne lister og dobbelt hÃ¦gtede lister, det er en konstant tid operation. Vi er blot at tilfÃ¸je til fronten. 

Og for udseende op, godt vi kender at slÃ¥ op i en sammenkÃ¦det liste kan vÃ¦re et problem, ikke? Vi er nÃ¸dt til at sÃ¸ge gennem det fra start til slut. Der er ingen tilfÃ¦ldig adgang i en sammenkÃ¦det liste. Men hvis man i stedet for at have en tilknytning liste, hvor et opslag ville vÃ¦re O i n, vi nu har 10 hÃ¦gtede lister, eller 1.000 hÃ¦gtede lister, nu er det O n divideret med 10, eller O n divideret med 1.000. 

Og mens vi talte teoretisk om kompleksitet vi bort konstanter, i den virkelige verden disse ting rent faktisk noget, hÃ¸jre? Vi vil faktisk mÃ¦rke at dette sker at kÃ¸re 10 gange hurtigere, eller 1.000 gange hurtigere, fordi vi distribuerer en lang kÃ¦de pÃ¥ tvÃ¦rs af 1.000 mindre kÃ¦der. Og sÃ¥ hver gang vi nÃ¸dt til at sÃ¸ge gennem en af ââdisse kÃ¦der, vi kan ignorere de 999 kÃ¦der, vi er ligeglade om, og bare sÃ¸ge at en. 

Som i gennemsnit til vÃ¦re 1000 gange kortere. Og sÃ¥ vi stadig er slags tendens i retning af dette gennemsnit sag for at vÃ¦re konstant tid, men kun fordi vi udnytte dividere med nogle enorme konstant faktor. Lad os se, hvordan dette kan faktisk ser dog. SÃ¥ det var hash tabellen havde vi fÃ¸r vi erklÃ¦rede en hash tabel, var i stand til at lagre 10 strenge. Vi kommer ikke til at gÃ¸re det lÃ¦ngere. Vi kender allerede begrÃ¦nsninger af denne metode. Nu er vores hash tabellen kommer til at vÃ¦re en vifte af 10 noder, pointers til lederne af hÃ¦gtede lister. 

Og lige nu er det nul. Hver enkelt af de 10 pejlemÃ¦rker er null. Der er ikke noget i vores hash tabellen lige nu. 

Lad os begynde at sÃ¦tte nogle ting i denne hash tabel. Og lad os se, hvordan denne metode er kommer til at gavne os lidt. Lad os nu hash Joey. Vi vil vil kÃ¸re strengen Joey gennem en hash-funktion, og vi vender tilbage 6. NÃ¥, hvad gÃ¸r vi nu? 

NÃ¥ nu arbejder med hÃ¦gtede lister, vi ikke arbejder med arrays. Og nÃ¥r vi arbejder med forbundne lister vi ved, at vi er nÃ¸dt til at starte dynamisk tildeling af plads og bygge kÃ¦der. Det er slags how-- disse er kernen elementer af at opbygge en linket liste. SÃ¥ lad os dynamisk afsÃ¦tte plads til Joey, og sÃ¥ lad os tilfÃ¸je ham til kÃ¦den. 

SÃ¥ nu ser, hvad vi har gjort. NÃ¥r vi hash Joey fik vi hashCode 6. Nu markÃ¸ren pÃ¥ arrayet placering 6 peger pÃ¥ lederen af ââen linket liste, og lige nu er det den eneste element i en sammenkÃ¦det liste. Og knudepunktet ved, at linket liste er Joey. 

SÃ¥ hvis vi har brug for at slÃ¥ op Joey senere, vi bare hash Joey igen, vi fÃ¥r 6 igen fordi vores hash-funktionen er deterministisk. Og sÃ¥ starter vi i spidsen af den linkede liste pegede til med matrix placering 6, og vi kan gentage tvÃ¦rs, der forsÃ¸ger at finde Joey. Og hvis vi bygger vores hash tabel effektivt, og vores hash-funktionen effektivt at distribuere data godt, i gennemsnit hver af dem der er knyttet lister pÃ¥ hver matrix placering vil vÃ¦re 1/10 af stÃ¸rrelsen pÃ¥ hvis vi lige haft det som en enkelt stor linket liste med alt i det. 

Hvis vi distribuerer, at enorme knyttet liste over 10 hÃ¦gtede lister hver liste vil vÃ¦re 1/10 af stÃ¸rrelsen. Og dermed 10 gange hurtigere at sÃ¸ge igennem. SÃ¥ lad os gÃ¸re det igen. Lad os nu hash Ross. 

Og lad os sige Ross, nÃ¥r vi gÃ¸r det hash kode, vi fÃ¥r tilbage er 2. NÃ¥ nu er vi dynamisk allokere en ny knude, vi sÃ¦tter Ross i den knude, og vi siger nu vifte placering 2, i stedet for at pege til null, peger pÃ¥ hovedet af en knyttet liste hvis eneste node er Ross. Og vi kan gÃ¸re det en gang mere, vi kan hash Rachel og fÃ¥ hashCode 4. malloc en ny knude, sÃ¦tte Rachel i node, og sige en rÃ¦kke placering 4 nu peger pÃ¥ hovedet en sammenkÃ¦det liste, hvis eneste element sker for at vÃ¦re Rachel. 

OK, men hvad sker der, hvis vi har en kollision? Lad os se, hvordan vi hÃ¥ndterer kollisioner ved hjÃ¦lp af den separate kÃ¦de metode. Lad os hash Phoebe. Vi fÃ¥r hashCode 6. I vores tidligere eksempel var vi lige lagring af strenge i arrayet. Dette var et problem. 

Vi Ã¸nsker ikke at tÃ¦ske Joey, og vi har allerede set, at vi kan fÃ¥ nogle clustering problemer, hvis vi forsÃ¸ger og trin gennem og probe. Men hvad nu, hvis vi bare lidt behandle denne pÃ¥ samme mÃ¥de, ikke? Det er ligesom at tilfÃ¸je et element til lederen af ââen linket liste. Lad os bare malloc plads til Phoebe. 

Vi vil sige Phoebe nÃ¦ste pointer punkter til den gamle leder af den linkede liste, og derefter 6 lige peger pÃ¥ nye leder af den linkede liste. Og nu ser vi har Ã¦ndret Phoebe i. Vi kan nu gemme to elementer med hashCode 6, og vi har ikke nogen problemer. 

Det er temmelig meget alle der er at kÃ¦de. Og kÃ¦de er afgjort den metode, der er vil vÃ¦re mest effektiv for dig, hvis du gemmer data i en hash-tabel. Men denne kombination af arrays og hÃ¦gtede lister sammen for at danne en hashtabel virkelig dramatisk forbedrer din evne til at lagre store mÃ¦ngder data, og meget hurtigt og effektivt sÃ¸ge gennem disse data. 

Der er stadig en mere datastruktur derude der kan endda vÃ¦re en smule bedre med hensyn til at sikre at vores insertion, deletion og ser op tider er endnu hurtigere. Og vi vil se, at i en video pÃ¥ forsÃ¸g. Jeg er Doug Lloyd, det er CS50.