Doug LLOYD: EntÃ³n, en CS50, nÃ³s Cubrimos un gran nÃºmero de diferentes estruturas de datos, non? Vimos arrays, e ligados listas e tÃ¡boas de hash, e tenta, pilas e colas. TamÃ©n imos aprender un pouco sobre Ã¡rbores e montes, pero realmente todos estes acabar sendo variaciÃ³ns sobre un tema. Hai realmente estes tipo de catro ideas bÃ¡sicas que o resto pode ferver para abaixo. Arrays, listas ligadas, tÃ¡boas de hash, e intenta. E como dixen, hai son variaciÃ³ns sobre eles, pero iso Ã© moi moi indo para resumir todo o que vai falar Sobre esta clase en termos de C. Pero como estes todos medida, non? NÃ³s falamos sobre os pros e contras de cada un en vÃ­deos separados sobre eles, pero hai unha morea de nÃºmeros sendo xogado en torno. Hai unha morea de xeral pensamentos ser xogado ao redor. Imos tentar e consolidar Lo en sÃ³ un lugar. Imos pesar os pros contra os contra, e considere cal a estrutura de datos pode ser a datos dereita estrutura para a sÃºa situaciÃ³n particular, calquera tipo de datos que estÃ¡ a garda. Non necesariamente ten sempre usar o super rÃ¡pida inserciÃ³n, borrado, e investigaciÃ³n dunha trie se realmente non se preocupan inserir e eliminar Demasiado. Se precisa sÃ³ rapidamente aleatoria acceso, quizais unha matriz Ã© mellor. EntÃ³n, imos destilar iso. Imos falar sobre cada un dos catro principais tipos de estruturas de datos que xa falamos sobre, e basta ver cando pode ser bo, e cando poden non ser tan bo. EntÃ³n imos comezar coa matrices. EntÃ³n inserciÃ³n, que Ã© tipo de malo. 

A inserciÃ³n no extremo dunha matriz Ã© OK, se estamos a construÃ­r unha matriz como imos nÃ³s. Pero se nÃ³s necesitamos introducir elementos no medio, creo que volta a inserciÃ³n tipo, hai moito de desprazamento para axustar un elemento en alÃ­. E por iso, se nÃ³s estamos indo a introducir calquera lugar, pero ao final dunha matriz, que probablemente non Ã© tan grande. 

Do mesmo xeito, a exclusiÃ³n, a non ser que sexamos exclusiÃ³n dende o extremo dunha matriz, Ã©, probablemente, tampouco tan grande se nÃ³s non queremos deixar lagoas baleiras, que normalmente non. Queremos eliminar un elemento, e a continuaciÃ³n, tipo de facelo cÃ³modo de novo. E asÃ­ a exclusiÃ³n de elementos unha matriz, tampouco tan grande. 

Lookup, porÃ©n, Ã© grande. Temos de acceso aleatorio, investigaciÃ³n de tempo constante. NÃ³s sÃ³ dicir sete, e nÃ³s imos a matriz deslocalizaciÃ³n sete. Dicimos 20, coa go matriz deslocalizaciÃ³n 20. Non temos para percorrer transversalmente. Iso Ã© moi bo. 

Arrays tamÃ©n son relativamente fÃ¡ciles de clasificar. Cada vez que falamos dunha selecciÃ³n algoritmo, como selecciÃ³n de tipo, tipo de inserciÃ³n, bubble sort, merge tipo, sempre utilizado matrices para facelo, porque as matrices son moi fÃ¡ciles de tipo, con respecto Ã¡s estruturas de datos vimos ata agora. 

Eles tamÃ©n son relativamente pequeno. Non hai unha morea de espazo extra. SÃ³ anular exactamente tanto como precisa para almacenar os seus datos, e iso Ã© moi fermoso isto. EntÃ³n son moi pequenos e eficiente deste xeito. Pero outra desvantaxe, con todo, Ã© que son de tamaÃ±o fixo. Debemos declarar exactamente como gran queremos que a nosa matriz para ser, e nÃ³s sÃ³ temos unha oportunidade. Non podemos crecer e reduci-lo. 

Se necesitamos crecer ou encoller-lo, nÃ³s Debe declarar unha matriz enteiramente novo, copiar todos os elementos do primeira matriz para a segunda matriz. E se calculou mal que tempo, debemos facelo de novo. Non Ã© tan boa. EntÃ³n matrices non nos dan a flexibilidade ter nÃºmero variable de elementos. 

Cunha lista ligada, inserciÃ³n Ã© moi fÃ¡cil. NÃ³s sÃ³ alinhavar para adiante. EliminaciÃ³n tamÃ©n Ã© moi doado. Temos que atopar os elementos. Que implica algunha investigaciÃ³n. 

Pero unha vez que teÃ±a atopado o elemento estÃ¡ a buscar, todo o que precisa facer Ã© cambiar un punteiro, posiblemente dous, se ten unha ligada lista-- un dobre lista ligada, rather-- e entÃ³n pode sÃ³ liberar o no. Non ten que cambiar todo ao seu redor. Acaba de cambiar dous punteiros, de xeito que Ã© moi rÃ¡pido. 

Lookup Ã© malo, non? Co fin para nÃ³s atopar un elemento nunha lista ligada, illadamente ou dobremente conectado, temos a linear busca-lo. Temos que comezar a principios e move o fin, ou comezar a finais do movemento para o inicio. Non temos acceso aleatorio mÃ¡is. EntÃ³n, se estamos facendo un moita investigaciÃ³n, quizais unha lista ligada non Ã© tan bo para nÃ³s. 

Eles tamÃ©n son realmente difÃ­cil de resolver, non? O Ãºnico xeito que poida realmente clasificar unha lista ligada Ã© para clasificalos lo como construÃ­lo. Pero se clasificalos lo como constrÃºe-lo, non Ã© mÃ¡is facendo inserciÃ³ns rÃ¡pidas anymore. Non estÃ¡ sÃ³ alinhavando as cousas para adiante. Ten que atopar o punto axeitado para poÃ±elas, e, a continuaciÃ³n, a sÃºa inserciÃ³n pasa a ser case tan malo como a inserciÃ³n nunha matriz. EntÃ³n listas ligadas non son tan grande para clasificar os datos. 

Eles tamÃ©n son moi pequeno, tamaÃ±o-wise. Dobremente lista ligada lixeiramente maior que illadamente listas ligadas, que son lixeiramente maiores de matrices, pero non Ã© unha enorme cantidade de espazo desperdiÃ§ado. Polo tanto, se o espazo Ã© un premio, pero non un premio moi intenso, este pode ser o camiÃ±o certo a continuaciÃ³n. 

As tÃ¡boas de hash. InserciÃ³n nunha tÃ¡boa hash Ã© moi sinxelo. Ã un proceso de dÃºas etapas. En primeiro lugar, necesitamos realizar nosas informaciÃ³ns a travÃ©s unha funciÃ³n hash para obter un cÃ³digo de hash, e, despois, introduza o elemento para o tÃ¡boa hash naquel lugar do cÃ³digo hash. 

EliminaciÃ³n, semellante a lista ligada, Ã© doado xa que atopa o elemento. Ten que atopalo primeiro, pero, a continuaciÃ³n, cando excluÃ­lo, sÃ³ precisa cambiar un par de agullas, se estÃ¡ a usar o fÃ­o separado. Se estÃ¡ usando enquisa, ou se non estÃ¡ usando fÃ­o en todo na sÃºa tÃ¡boa de hash, eliminaciÃ³n Ã© realmente moi fÃ¡cil. Todo o que precisa facer Ã© botar o datos, e logo ir a ese lugar. E no caso de que non facer ten colisiÃ³ns, vai ser capaz de borrar moi rapidamente. 

Agora, a investigaciÃ³n Ã© onde as cousas estar un pouco mÃ¡is complicado. EstÃ¡ na mellor media de listas ligadas. Se estÃ¡ usando o fÃ­o, aÃ­nda ten unha lista ligada, o que significa que aÃ­nda ten a Busca detrimento unha lista ligada. SenÃ³n porque estÃ¡ tomando o seu ligada lista e divisiÃ³n lo mÃ¡is de 100 ou 1000 ou n elementos na sÃºa tÃ¡boa de hash, Ã© listas ligadas son todos un enÃ©simo o tamaÃ±o. Son todos substancialmente menor. Vostede listas n ligada ao contrario dunha lista ligada de tamaÃ±o n. 

E asÃ­, este mundo real constante factor, que xeralmente non falar da complexidade en tempo, fai realmente facer a diferenza aquÃ­. AsÃ­ investigaciÃ³n aÃ­nda Ã© lineal buscar se estÃ¡ a usar o fÃ­o, pero a lonxitude da lista EstÃ¡s a ver a Ã© moi, moi curto, por comparaciÃ³n. De novo, a clasificaciÃ³n Ã© a sÃºa obxectivo aquÃ­, hash de tÃ¡boa de probablemente non Ã© o camiÃ±o certo a continuaciÃ³n. SÃ³ ten que usar unha matriz clasificar Ã© realmente importante para ti. 

E poden realizar a gama de tamaÃ±o. Ã difÃ­cil dicir se unha tÃ¡boa hash Ã© pequeno ou grande, porque realmente depende de como gran sÃºa tÃ¡boa hash Ã©. Se estÃ¡ indo sÃ³ para estar almacenando cinco elementos na sÃºa tÃ¡boa hash, e ten unha tÃ¡boa hash con 10.000 elementos nel, probablemente estÃ¡ perdendo unha gran cantidade de espazo. Contraste sendo tamÃ©n pode ten tÃ¡boas de hash moi compactas, pero menor sÃºa tÃ¡boa hash queda, canto mÃ¡is cada unha destas listas ligadas recibe. E asÃ­ non hai realmente ningunha maneira de definir exactamente o tamaÃ±o dunha tÃ¡boa hash, pero pode ser seguro dicir que Ã© xeralmente vai ser maior que un conectado lista almacenar os mesmos datos, pero menor que un trie. 

E intentos son a cuarta destas estruturas que temos que chegou a falar. A inserciÃ³n nunha trie Ã© complexo. Hai unha morea de dinÃ¡mica distribuciÃ³n de memoria, especialmente no inicio, como estÃ¡ empezando a construÃ­r. Pero Ã© tempo constante. Ã sÃ³ o elemento humano aquÃ­ que fai que sexa complicado. Ter que atopar punteiro nulo, malloc espazo, ir alÃ­, o espazo posiblemente malloc a partir de aÃ­ de novo. O tipo de factor de intimidaciÃ³n de punteiros en distribuciÃ³n dinÃ¡mica de memoria Ã© o obstÃ¡culo para limpar. Pero unha vez que limpou-o, inserciÃ³n en realidade vÃ©n moi sinxelo, e Ã© sen dÃºbida tempo constante. 

A exclusiÃ³n Ã© doado. Todo o que precisa facer Ã© navegar abaixo a par de agullas e libre o no, de xeito que Ã© moi bo. Lookup tamÃ©n Ã© moi rÃ¡pido. Ã sÃ³ con base na lonxitude dos seus datos. Polo tanto, se os seus datos Ã© cinco cadeas de caracteres, por exemplo, estÃ¡ almacenando cinco cadeas de caracteres no seu trie, el sÃ³ ten cinco pasos para atopar o que estÃ¡ a procurar. Cinco Ã© sÃ³ un factor constante, polo que de novo, inserciÃ³n, exclusiÃ³n e investigaciÃ³n aquÃ­ estÃ¡n todos os tempos constante, de forma eficaz. 

Outra cousa Ã© que o seu trie Ã© de feito, medio que xa clasificadas, non? En virtude de como estamos elementos Inserir, indo letra por letra do clave, ou dÃ­xito por dÃ­xito da chave, normalmente, o trie acaba sendo tipo de clasificadas como construÃ­lo. Realmente non fai sentido pensar en clasificaciÃ³n do mesmo xeito que pensamos sobre con matrices ou listas ligadas, ou tÃ¡boas de hash. Pero, en certo sentido, o seu trie Ã© clasificada como vai. 

A desvantaxe, claro, Ã© que un trie rapidamente pasa a ser enorme. De todos os puntos de intersecciÃ³n, pode have-- sÃºa chave estÃ¡ composta de dÃ­xitos, ten 10 outros lugares que pode ir, o que significa que cada nodo contÃ©n informaciÃ³n sobre os datos que quere gardar no nodo que, ademais de 10 punteiros. Que, en CS50 IDE, Ã© de 80 bytes. EntÃ³n, Ã©, polo menos, 80 bytes para cada nodo que crear, e iso non o Ã© contando datos. E se os seus nodos son letras en vez de dÃ­xitos, agora ten 26 punteiros de todos os lugares. E 26 veces 8 pode ser 200 bytes, ou algo parecido. E ten o capital e pode lowercase-- ver onde estou indo con iso, non? Seus nÃ³s pode ser moi gran, e asÃ­ a trie Se, en xeral, pode estar realmente grande, demasiado. Polo tanto, se o espazo Ã© alta premio no seu sistema, un trie pode non ser o camiÃ±o certo para ir, a pesar dos seus outros beneficios entran en xogo. Eu son Doug Lloyd. Este Ã© CS50.