DOUG LLOYD: EntÃ£o, em CS50, nÃ³s cobrimos um grande nÃºmero de diferentes estruturas de dados, certo? NÃ³s vimos arrays, e ligados listas e tabelas de hash, e tenta, pilhas e filas. TambÃ©m vamos aprender um pouco sobre Ã¡rvores e montes, mas realmente todos estes acabar sendo variaÃ§Ãµes sobre um tema. HÃ¡ realmente estes tipo de quatro idÃ©ias bÃ¡sicas que tudo o resto pode ferver para baixo. Arrays, listas ligadas, tabelas de hash, e tenta. E como eu disse, hÃ¡ sÃ£o variaÃ§Ãµes sobre eles, mas isso Ã© muito muito indo para resumir tudo o que vai falar Sobre nesta classe em termos de C. Mas como estes todos medida, certo? NÃ³s conversamos sobre os prÃ³s e contras de cada um em vÃ­deos separados sobre eles, mas hÃ¡ um monte de nÃºmeros sendo jogado em torno. HÃ¡ um monte de geral pensamentos ser jogado ao redor. Vamos tentar e consolidar -lo em apenas um lugar. Vamos pesar os prÃ³s contra os contras, e considere qual a estrutura de dados pode ser a dados direita estrutura para sua situaÃ§Ã£o particular, qualquer tipo de dados que vocÃª estÃ¡ armazenando. VocÃª nÃ£o necessariamente precisa sempre usar o super rÃ¡pida inserÃ§Ã£o, eliminaÃ§Ã£o, e pesquisa de uma trie se vocÃª realmente nÃ£o se preocupam com inserir e excluir demais. Se vocÃª precisa apenas rapidamente aleatÃ³ria acesso, talvez uma matriz Ã© melhor. EntÃ£o, vamos destilar isso. Vamos falar sobre cada um dos quatro principais tipos de estruturas de dados que nÃ³s jÃ¡ conversamos sobre, e basta ver quando eles pode ser bom, e quando eles podem nÃ£o ser tÃ£o bom. EntÃ£o vamos comeÃ§ar com matrizes. EntÃ£o inserÃ§Ã£o, que Ã© tipo de ruim. 

A inserÃ§Ã£o na extremidade de uma matriz Ã© OK, se nÃ³s estamos construindo uma matriz como vamos nÃ³s. Mas se nÃ³s precisarmos inserir elementos no meio, acho que volta para inserÃ§Ã£o tipo, hÃ¡ muito de deslocamento para ajustar um elemento em lÃ¡. E por isso, se nÃ³s estamos indo para inserir qualquer lugar, mas no final de uma matriz, que provavelmente nÃ£o Ã© tÃ£o grande. 

Da mesma forma, a exclusÃ£o, a menos que sejamos exclusÃ£o a partir da extremidade de uma matriz, Ã©, provavelmente, tambÃ©m nÃ£o tÃ£o grande se nÃ³s nÃ£o queremos deixar lacunas vazias, que normalmente nÃ³s nÃ£o. Queremos remover um elemento, e em seguida, tipo de tornÃ¡-lo confortÃ¡vel novamente. E assim a exclusÃ£o de elementos uma matriz, tambÃ©m nÃ£o tÃ£o grande. 

Lookup, porÃ©m, Ã© grande. Temos de acesso aleatÃ³rio, pesquisa de tempo constante. NÃ³s apenas dizer sete, e nÃ³s vamos a matriz deslocalizaÃ§Ã£o sete. Dizemos 20, com a go matriz deslocalizaÃ§Ã£o 20. NÃ£o temos para percorrer transversalmente. Isso Ã© muito bom. 

Arrays tambÃ©m sÃ£o relativamente fÃ¡ceis de classificar. Cada vez que falamos sobre uma triagem algoritmo, tais como seleÃ§Ã£o de tipo, tipo de inserÃ§Ã£o, bubble sort, merge tipo, nÃ³s sempre utilizado matrizes para fazÃª-lo, porque as matrizes sÃ£o bastante fÃ¡ceis de tipo, em relaÃ§Ã£o Ã s estruturas de dados temos visto atÃ© agora. 

Eles tambÃ©m sÃ£o relativamente pequeno. NÃ£o hÃ¡ um monte de espaÃ§o extra. VocÃª sÃ³ anular exatamente tanto como vocÃª precisa para armazenar seus dados, e isso Ã© muito bonito isso. EntÃ£o eles sÃ£o muito pequenos e eficiente desta maneira. Mas uma outra desvantagem, no entanto, Ã© que eles sÃ£o de tamanho fixo. Temos de declarar exatamente como grande queremos que a nossa matriz para ser, e nÃ³s sÃ³ temos uma chance. NÃ³s nÃ£o podemos crescer e reduzi-lo. 

Se precisamos crescer ou encolher-lo, nÃ³s precisa declarar uma matriz inteiramente novo, copiar todos os elementos do primeira matriz para a segunda matriz. E se calculou mal que tempo, temos de fazÃª-lo novamente. NÃ£o Ã© tÃ£o boa. EntÃ£o matrizes nÃ£o nos dÃ£o a flexibilidade ter nÃºmero variÃ¡vel de elementos. 

Com uma lista ligada, inserÃ§Ã£o Ã© muito fÃ¡cil. NÃ³s apenas alinhavar para a frente. EliminaÃ§Ã£o tambÃ©m Ã© muito fÃ¡cil. Temos que encontrar os elementos. Que envolvem alguma pesquisa. 

Mas uma vez que vocÃª tenha encontrado o elemento vocÃª estÃ¡ procurando, tudo que vocÃª precisa fazer Ã© alterar um ponteiro, possivelmente dois, se vocÃª tem uma ligada lista-- um duplamente lista ligada, rather-- e entÃ£o vocÃª pode apenas liberar o nÃ³. VocÃª nÃ£o tem que mudar tudo ao seu redor. VocÃª acabou de mudar dois ponteiros, de modo que Ã© muito rÃ¡pido. 

Lookup Ã© ruim, certo? A fim para nÃ³s encontrar um elemento em uma lista ligada, isoladamente ou duplamente ligado, temos a linear busca-lo. Temos que comeÃ§ar no inÃ­cio e mova o fim, ou comeÃ§ar no final do movimento para o inÃ­cio. NÃ£o temos acesso aleatÃ³rio mais. EntÃ£o, se estamos fazendo um muita pesquisa, talvez uma lista ligada nÃ£o Ã© tÃ£o bom para nÃ³s. 

Eles tambÃ©m sÃ£o realmente difÃ­cil de resolver, certo? A Ãºnica maneira que vocÃª puder realmente classificar uma lista ligada Ã© para classificÃ¡-lo como vocÃª construÃ­-lo. Mas se vocÃª classificÃ¡-lo como vocÃª construÃ­-lo, vocÃª nÃ£o Ã© mais fazendo inserÃ§Ãµes rÃ¡pidas anymore. VocÃª nÃ£o estÃ¡ apenas alinhavando as coisas para a frente. VocÃª tem que encontrar o ponto certo para colocÃ¡-lo, e, em seguida, a sua inserÃ§Ã£o torna-se quase tÃ£o ruim como a inserÃ§Ã£o em uma matriz. EntÃ£o listas ligadas nÃ£o sÃ£o tÃ£o grande para classificar os dados. 

Eles tambÃ©m sÃ£o bastante pequeno, tamanho-wise. Duplamente lista ligada ligeiramente maior do que isoladamente listas ligadas, que sÃ£o ligeiramente maiores de matrizes, mas nÃ£o Ã© uma enorme quantidade de espaÃ§o desperdiÃ§ado. Portanto, se o espaÃ§o Ã© um prÃªmio, mas nÃ£o um prÃªmio muito intenso, este pode ser o caminho certo a seguir. 

As tabelas de hash. InserÃ§Ã£o em uma tabela hash Ã© bastante simples. Ã um processo de duas etapas. Primeiro, precisamos executar nossas informaÃ§Ãµes atravÃ©s uma funÃ§Ã£o hash para obter um cÃ³digo de hash, e, depois, insira o elemento para o tabela hash naquele local do cÃ³digo hash. 

EliminaÃ§Ã£o, semelhante a lista ligada, Ã© fÃ¡cil uma vez que vocÃª encontrar o elemento. VocÃª tem que encontrÃ¡-lo primeiro, mas, em seguida, quando vocÃª excluÃ­-lo, vocÃª sÃ³ precisa trocar um par de ponteiros, se vocÃª estiver usando o encadeamento separado. Se vocÃª estiver usando sondagem, ou se vocÃª nÃ£o estiver usando encadeamento em tudo em sua tabela de hash, eliminaÃ§Ã£o Ã© realmente muito fÃ¡cil. Tudo que vocÃª precisa fazer Ã© botar o dados, e em seguida, ir para esse local. E supondo que vocÃª nÃ£o fazer tem nenhum colisÃµes, vocÃª vai ser capaz de apagar muito rapidamente. 

Agora, a pesquisa Ã© onde as coisas ficar um pouco mais complicado. EstÃ¡ na melhor mÃ©dia de listas ligadas. Se vocÃª estiver usando o encadeamento, vocÃª ainda tem uma lista ligada, o que significa que vocÃª ainda tem a Pesquisa detrimento uma lista ligada. Mas porque vocÃª estÃ¡ tomando seu ligada lista e dividi-lo mais de 100 ou 1000 ou n elementos em sua tabela de hash, vocÃª Ã© listas ligadas sÃ£o todos um enÃ©simo o tamanho. Eles sÃ£o todos substancialmente menor. VocÃª listas n ligada ao invÃ©s de uma lista ligada de tamanho n. 

E assim, este mundo real constante fator, que geralmente nÃ£o falar sobre a complexidade em tempo, faz realmente fazer a diferenÃ§a aqui. Assim pesquisa ainda Ã© linear procurar se vocÃª estiver usando o encadeamento, mas o comprimento da lista VocÃª estÃ¡ vendo a Ã© muito, muito curto, por comparaÃ§Ã£o. Novamente, se a classificaÃ§Ã£o Ã© a sua objetivo aqui, hash de tabela de provavelmente nÃ£o Ã© o caminho certo a seguir. Basta usar uma matriz se classificar Ã© realmente importante para vocÃª. 

E eles podem executar a gama de tamanho. Ã difÃ­cil dizer se uma tabela hash Ã© pequeno ou grande, porque ele realmente depende de como grande sua tabela hash Ã©. Se vocÃª estÃ¡ indo sÃ³ para estar armazenando cinco elementos em sua tabela hash, e vocÃª tem uma tabela hash com 10.000 elementos nele, provavelmente vocÃª estÃ¡ desperdiÃ§ando uma grande quantidade de espaÃ§o. Contraste sendo vocÃª tambÃ©m pode tem tabelas de hash muito compactas, mas o menor sua tabela hash fica, quanto mais cada uma dessas listas ligadas recebe. E assim nÃ£o hÃ¡ realmente nenhuma maneira de definir exactamente o tamanho de uma tabela hash, mas Ã© provavelmente seguro dizer que Ã© geralmente vai ser maior do que um ligado lista armazenar os mesmos dados, mas menor do que um trie. 

E tentativas sÃ£o a quarta destas estruturas que temos vindo a falar. A inserÃ§Ã£o numa trie Ã© complexo. HÃ¡ um monte de dinÃ¢mica alocaÃ§Ã£o de memÃ³ria, especialmente no inÃ­cio, como vocÃª estÃ¡ comeÃ§ando a construir. Mas Ã© tempo constante. Ã apenas o elemento humano aqui que faz com que seja complicado. Ter de encontrar ponteiro nulo, malloc espaÃ§o, ir lÃ¡, o espaÃ§o possivelmente malloc a partir daÃ­ de novo. O tipo de fator de intimidaÃ§Ã£o de ponteiros em alocaÃ§Ã£o dinÃ¢mica de memÃ³ria Ã© o obstÃ¡culo para limpar. Mas uma vez que vocÃª limpou-o, inserÃ§Ã£o na verdade vem bastante simples, e Ã© certamente tempo constante. 

A exclusÃ£o Ã© fÃ¡cil. Tudo que vocÃª precisa fazer Ã© navegar para baixo a par de ponteiros e livre o nÃ³, de modo que Ã© muito bom. Lookup tambÃ©m Ã© bastante rÃ¡pido. Ã sÃ³ com base na comprimento de seus dados. Portanto, se todos os seus dados Ã© cinco cadeias de caracteres, por exemplo, vocÃª estÃ¡ armazenando cinco cadeias de caracteres em seu trie, ele sÃ³ tem cinco passos para encontrar o que vocÃª estÃ¡ procurando. Cinco Ã© apenas um fator constante, por isso, novamente, inserÃ§Ã£o, exclusÃ£o e pesquisa aqui estÃ£o todos os tempos constante, de forma eficaz. 

Outra coisa Ã© que seu trie Ã© na verdade, meio que jÃ¡ classificadas, certo? Em virtude de como estamos elementos Inserir, indo letra por letra do chave, ou dÃ­gito por dÃ­gito da chave, normalmente, o trie acaba sendo tipo de classificadas como vocÃª construÃ­-lo. Realmente nÃ£o faz sentido pensar em classificaÃ§Ã£o da mesma forma que pensamos sobre com matrizes ou listas ligadas, ou tabelas de hash. Mas, em certo sentido, o seu trie Ã© classificada como vocÃª vai. 

A desvantagem, claro, Ã© que um trie rapidamente torna-se enorme. De todos os pontos de junÃ§Ã£o, vocÃª pode have-- se sua chave Ã© composta de dÃ­gitos, vocÃª tem 10 outros lugares que vocÃª pode ir, o que significa que cada nÃ³ contÃ©m informaÃ§Ãµes sobre os dados que vocÃª deseja armazenar no nÃ³ que, alÃ©m de 10 ponteiros. Que, em CS50 IDE, Ã© de 80 bytes. EntÃ£o, Ã©, pelo menos, 80 bytes para cada nÃ³ que vocÃª criar, e isso nÃ£o Ã© mesmo contando dados. E se os seus nodos sÃ£o letras em vez de dÃ­gitos, agora vocÃª tem 26 ponteiros de todos os locais. E 26 vezes 8 Ã© provavelmente 200 bytes, ou algo parecido. E vocÃª tem o capital e vocÃª pode lowercase-- ver onde eu estou indo com isso, certo? Seus nÃ³s pode ficar muito grande, e assim a trie -se, em geral, pode ficar realmente grande, demasiado. Portanto, se o espaÃ§o Ã© alta prÃªmio em seu sistema, um trie pode nÃ£o ser o caminho certo para ir, apesar de seus outros benefÃ­cios entre no jogo. Eu sou Doug Lloyd. Este Ã© CS50.