DOUG LLOYD: Also in CS50, die wir behandelt haben viele verschiedene Datenstrukturen, Recht? Wir haben gesehen, Arrays und verknÃ¼pfte Listen und Hash-Tabellen, und versucht, Stacks und Warteschlangen. Wir werden auch ein wenig zu lernen Ã¼ber BÃ¤ume und Haufen, aber wirklich diese alle nur am Ende herauf Sein Variationen Ã¼ber ein Thema. Es gibt wirklich diese Art von vier Grundideen dass alles andere kÃ¶nnen bis zu kochen. Arrays, verkettete Listen, Hash-Tabellen und versucht. Und wie ich schon sagte, gibt sind Variationen davon, aber das ist ziemlich viel los zusammenzufassen alles, was werden wir reden etwa in dieser Klasse in Bezug auf C. Aber wie diese alle MaÃnahmen, oder? Wir haben Ã¼ber die Vor- und Nachteile gesprochen der jeweils in separaten Videos auf sie, aber es gibt eine Menge von Zahlen Kinder Umgebung geschleudert. Es gibt eine Menge von allgemeinem Gedanken immer um sich geworfen. Lassen Sie uns versuchen und zu konsolidieren, sie in nur einem Ort. Lassen Sie wÃ¤gen die Vor-gegen die Nachteile, und betrachten die Datenstruktur kÃ¶nnte die richtige Daten sein Struktur fÃ¼r Ihre spezielle Situation, welcher Art von Daten Sie speichern. Sie mÃ¼ssen nicht unbedingt immer brauchen, um verwenden Sie die super schnelle EinfÃ¼gen, LÃ¶schen, und Lookup eines Trie, wenn Sie wirklich nicht Ã¼ber EinfÃ¼gen und LÃ¶schen von Pflege zu viel. Wenn Sie nur schnell Zufalls brauchen Zugang, vielleicht ein Array ist besser. Lassen Sie uns also, dass zu destillieren. Lassen Sie uns Ã¼ber jede der vier sprechen Hauptarten von Datenstrukturen dass wir gesprochen haben, und nur sehen, wenn sie kÃ¶nnte gut sein, und wenn sie nicht so gut sein kÃ¶nnte. Lassen Sie uns also mit Arrays zu starten. So Insertion, ist diese Art von schlecht. 

Ansatz am Ende eines Arrays in Ordnung ist, wenn wir bauen ein Array als wir gehen. Aber wenn wir brauchen, um einfÃ¼gen Elemente in der Mitte, denken Sie zurÃ¼ck, um das EinfÃ¼hren Sortieren, es gibt eine Menge der Verschiebung, um ein Element in es passen. Und so, wenn wir gehen, um einfÃ¼gen Ã¼berall aber das Ende eines Arrays, das ist wahrscheinlich nicht so groÃ. 

Ebenso LÃ¶schen, es sei denn wir sind LÃ¶schen aus dem Ende des Arrays, ist wohl auch nicht so groÃ, wenn wir wollen nicht, um leere ZwischenrÃ¤ume zu verlassen, die in der Regel tun wir nicht. Wir wollen, um ein Element zu entfernen, und dann Art machen es wieder gemÃ¼tlich. Und so LÃ¶schen von Elementen aus ein Array, auch nicht so toll. 

Lookup, obwohl, ist groÃ. Wir haben mit wahlfreiem Zugriff, konstante Zeit Lookup. Wir sagen nur sieben, und wir gehen Array Verlagerung sieben. Wir sagen, 20, mit Gehe zu Array Umzug 20. Wir mÃ¼ssen nicht Ã¼ber laufen. Das ist ziemlich gut. 

Arrays sind auch relativ leicht zu sortieren. Jedes Mal, wenn wir Ã¼ber eine Sortier sprachen Algorithmus, wie Auswahl Sortieren, Insertion Sort, Bubble-Sort, fusionieren sort wir immer Arrays verwendet, es zu tun, weil Arrays sind ziemlich einfach, Sortieren, relativ zu den Datenstrukturen wir bisher gesehen haben. 

Sie sind auch relativ klein. Es gibt nicht viel mehr Platz. Sie haben genau so viel beiseite gesetzt wie Sie benÃ¶tigen, um Ihre Daten zu halten, und das ist so ziemlich alles. So sind sie ziemlich klein und effizient auf diese Weise. Aber ein anderer Nachteil, obwohl, ist, dass sie in der GrÃ¶Ãe festgelegt sind. Wir mÃ¼ssen uns genau erklÃ¤ren, wie big wollen wir unser Angebot zu sein, und wir nur einen Schuss auf sie. Wir kÃ¶nnen nicht wachsen und schrumpfen sie. 

Wenn wir brauchen, um zu wachsen oder schrumpfen, wir brauchen, um ein vÃ¶llig neues Array deklarieren, kopieren Sie alle Elemente der erste Array in das zweite Array. Und wenn wir uns verkalkuliert, dass Zeit, mÃ¼ssen wir es wieder tun. Nicht so gut. So Arrays nicht geben uns die FlexibilitÃ¤t, variable Anzahl von Elementen haben. 

Mit einer verknÃ¼pften Liste, Insertion ist recht einfach. Wir haben gerade tack auf die Vorderseite. Das LÃ¶schen ist auch recht einfach. Wir haben, um die Elemente zu finden. Das beinhalten einige der Suche. 

Aber sobald Sie das Element gefunden haben Dank fÃ¼r alles, was Sie tun mÃ¼ssen suchen ist zu Ã¤ndern einen Zeiger, mÃ¶glicherweise zwei, wenn Sie a list-- einer doppelt verketteten verknÃ¼pften Liste, rather-- und dann kÃ¶nnen Sie nur befreien den Knoten. Sie mÃ¼ssen nicht zu verschieben alles um sich herum. Sie Ã¤ndern nur zwei Zeigern, das ist also ziemlich schnell. 

Lookup ist schlecht, richtig? Damit wir um eine zu finden Element einer verketteten Liste, ob einfach oder zweifach verlinkt, wir suchen sie linear. Wir mÃ¼ssen am Anfang beginnen und bewegen das Ende, oder starten Sie am Ende bewegen zum Anfang. Wir haben nicht mit wahlfreiem Zugriff mehr haben. Wenn wir also tun ein viel Sucherei, vielleicht eine verkettete Liste ist nicht ganz so gut fÃ¼r uns. 

Sie sind auch wirklich schwer zu sortieren, oder? Die einzige MÃ¶glichkeit, eine verknÃ¼pfte Liste wirklich sortieren ist, sie zu sortieren, wie Sie es zu konstruieren. Aber wenn Sie es, wie Sie sortieren konstruieren, sind Sie nicht mehr machen schnelle Insertionen mehr. Sie sind nicht nur Heften Dinge, auf die Vorderseite. Sie mÃ¼ssen das zu finden richtige Stelle, um es zu setzen, und dann Sie die EinfÃ¼gemarke wird fast so schlimm, das EinfÃ¼gen in ein Array. So verknÃ¼pften Listen sind nicht so groÃ, fÃ¼r das Sortieren von Daten. 

Sie sind auch ziemlich klein, GrÃ¶Ãe her. Doppelt verknÃ¼pften Liste leicht grÃ¶Ãer als einfach verkettete Listen, die etwas grÃ¶Ãer sind als Arrays, aber es ist nicht eine riesige Menge an Platz verschwendet. Also, wenn Raum an einer PrÃ¤mie ist, aber kein wirklich intensiv Premium, kÃ¶nnte dies der richtige Weg zu gehen. 

Hash-Tabellen. Einsetzen in eine Hash-Tabelle ist recht unkompliziert. Es ist ein zweistufiger Prozess. ZunÃ¤chst mÃ¼ssen wir unsere Daten durchlaufen eine Hash-Funktion, um einen Hash-Code zu erhalten, und dann werden wir das Element in den Einsatz Hash-Tabelle zu dieser Hash-Code Standort. 

Deletion, Ã¤hnlich wie verknÃ¼pfte Liste, ist einfach, wenn Sie das Element zu finden. Sie mÃ¼ssen es zuerst finden, aber dann, wenn Sie es lÃ¶schen, Sie brauchen nur zu tauschen ein paar Hinweise, falls Sie getrennte Verkettung sind. Wenn Sie mit Sondieren bist, oder wenn Sie nicht Verwendung Verkettung haupt in Ihrer Hash-Tabelle, LÃ¶schen ist eigentlich ganz einfach. Alles, was Sie tun mÃ¼ssen, ist die Hash- Daten, und dann an diesen Ort zu gehen. Und vorausgesetzt, dass Sie das nicht tun keine Kollisionen, Sie in der Lage, sehr schnell zu lÃ¶schen. 

Nun, das ist, wo die Dinge Lookup ein wenig komplizierter. Es ist im Durchschnitt besser als verkettete Listen. Wenn Sie mit Verkettung bist, Sie haben noch eine verknÃ¼pfte Liste, was bedeutet, dass Sie immer noch die Such Schaden fÃ¼hren eine verknÃ¼pfte Liste. Aber weil du nimmst deinen verbunden Liste aus und leitet sie im Ã¼ber 100 oder 1000 oder n-Elemente in Ihre Hash-Tabelle, du bist verkettete Listen sind alle eine n-te GrÃ¶Ãe. Sie sind alle wesentlich kleiner. Sie haben n verkettete Listen statt einer verknÃ¼pften Liste der GrÃ¶Ãe n. 

Und so realen konstanten Faktor, der Allgemeinen wir reden nicht Ã¼ber in ZeitkomplexitÃ¤t ist es, hat tatsÃ¤chlich einen Unterschied machen hier. So Lookup ist immer noch linear zu suchen, wenn Sie mit Verkettung bist, aber die LÃ¤nge der Liste Sie durch suchst ist sehr, sehr kurz im Vergleich. Noch einmal, wenn Sortier ist Ihr Ziel ist hier, Hash-Tabelle wahrscheinlich nicht der richtige Weg zu gehen. Verwenden Sie einfach ein Array, wenn Sortier ist wirklich wichtig fÃ¼r Sie. 

Und sie die ganze Skala der GrÃ¶Ãe ausgefÃ¼hrt werden kÃ¶nnen. Es ist schwer zu sagen, ob ein Hash-Tabelle ist klein oder groÃ, weil es wirklich darauf an, wie groÃ Ihre Hash-Tabelle ist. Wenn Sie nur gehen, um die Speicherung fÃ¼nf Elemente in Ihrem Hash-Tabelle, und Sie haben eine Hash-Tabelle haben mit 10.000 Elemente in ihr, sind Sie wahrscheinlich verschwenden viel Platz. Kontrast sein, kÃ¶nnen Sie auch haben sehr kompakt Hash-Tabellen, aber die kleineren Ihren Hash-Tabelle erhÃ¤lt, je lÃ¤nger jeder dieser verknÃ¼pften Listen erhÃ¤lt. Und so gibt es wirklich keine MÃ¶glichkeit, zu definieren genau die GrÃ¶Ãe einer Hash-Tabelle, aber es ist wahrscheinlich sicher zu sagen, es ist in der Regel werde grÃ¶Ãer als eine verbunden zu sein Liste Speichern der gleichen Daten, aber kleiner als ein Trie. 

Und Versuchen sind die vierte dieser Strukturen dass wir gesprochen haben. EinfÃ¼gen in einen Trie ist komplex. Es gibt eine Menge von dynamischen Speicherzuweisung, insbesondere zu Beginn, Sie fangen an zu bauen. Aber es ist konstanter Zeit. Es ist nur das menschliche Element hier, die es schwierig macht. Mit den Null-Zeiger begegnen, malloc Raum, gehen dort, mÃ¶glicherweise malloc Raum von dort wieder. Die Art von EinschÃ¼chterung Faktor Zeiger in die dynamische Speicherzuordnung ist die HÃ¼rde zu lÃ¶schen. Aber wenn Sie es gelÃ¶scht haben, EinfÃ¼gung kommt eigentlich ganz einfach, und es ist sicherlich konstante Zeit. 

LÃ¶schen ist einfach. Alles, was Sie tun mÃ¼ssen, ist eine nach unten navigieren paar Hinweise und frei den Knoten, das ist also ziemlich gut. Lookup ist auch ziemlich schnell. Es ist nur auf der Grundlage der LÃ¤nge Ihrer Daten. Also, wenn Sie alle Ihre Daten fÃ¼nf Zeichenketten, Sie kÃ¶nnen beispielsweise die Speicherung sind fÃ¼nf Zeichenfolgen in Ihrem trie, es dauert nur fÃ¼nf Schritte finden, was Sie suchen. FÃ¼nf ist nur eine Konstante, so wieder, Insertion, Deletion und Lookup hier sind alle konstante Zeit, effektiv. 

Eine andere Sache ist, dass Ihr Trie ist eigentlich ganz bereits sortiert, nicht wahr? Aufgrund der, wie wir sind EinfÃ¼gen von Elementen, indem Sie Buchstaben fÃ¼r Buchstaben des SchlÃ¼ssel oder Ziffernfolge des SchlÃ¼ssels, in der Regel, endet Ihre Trie wobei Art sortiert, wie Sie es zu bauen. Es ist nicht wirklich macht Sinn, Ã¼ber Sortier denken in der gleichen Art, wie wir denken sie mit Arrays oder verkettete Listen, oder Hash-Tabellen. Aber in gewisser Weise Ihrer Trie wird sortiert, wie Sie gehen. 

Der Nachteil ist natÃ¼rlich, dass ein Trie wird schnell riesig. Von jedem Verbindungspunkt, kÃ¶nnten Sie have-- wenn Ihr SchlÃ¼ssel besteht aus Ziffern, Sie haben 10 weitere Orte, die Sie gehen kÃ¶nnen, die bedeutet, dass jedem Knoten enthÃ¤lt Informationen Ã¼ber die Daten, die Sie speichern wollen, an diesem Knoten, plus 10 Zeiger. Welche, auf CS50 IDE ist 80 Byte. So ist es mindestens 80 Bytes fÃ¼r jeder Knoten, die Sie erstellen, Und das ist nicht einmal eingerechnet Daten. Und wenn Ihr Knoten Buchstaben anstelle von Ziffern, Jetzt 26 Zeiger mÃ¼ssen Sie von jedem Ort. Und 26 mal 8 ist wahrscheinlich 200 Bytes oder so Ã¤hnlich. Und Sie Kapital und lowercase-- kÃ¶nnen sehen, wo ich mit diesem gehe, nicht wahr? Ihre Knoten kann wirklich groÃ, so dass der Trie selbst Insgesamt kann bekommen wirklich groÃ, zu. Also, wenn Raum an einer Hoch Premium auf Ihrem System, ein Trie ist vielleicht nicht der richtige Weg zu sein, zu gehen, obwohl seine anderen Leistungen komm in das Spiel. Ich bin Doug Lloyd. Dies ist CS50.