1 00:00:00,000 --> 00:00:02,000 [Powered by Google Translate] [Merge sort] 2 00:00:02,000 --> 00:00:04,000 [Rob Bowden - Harvard University] 3 00:00:04,000 --> 00:00:07,000 [Esta é CS50. - CS50.TV] 4 00:00:07,000 --> 00:00:09,000 Vamos falar sobre o tipo de mesclagem. 5 00:00:09,000 --> 00:00:14,000 Até agora você já viu espécie de bolha, tipo de inserção e tipo de seleção. 6 00:00:14,000 --> 00:00:17,000 Embora eu vou tipo de onda minha mão do que eu quero dizer com melhor, 7 00:00:17,000 --> 00:00:21,000 merge sort geralmente tem um desempenho melhor do que qualquer um desses três tipos. 8 00:00:22,000 --> 00:00:27,000 >> Mas antes de falar sobre merge sort, vamos falar sobre a mesclagem de duas listas ordenadas. 9 00:00:27,000 --> 00:00:31,000 Vamos chamar o processo de tomar duas listas ordenadas, como estes, 10 00:00:31,000 --> 00:00:35,000 e fazer uma única lista ordenada fora delas - a fusão das listas. 11 00:00:35,000 --> 00:00:37,750 Como podemos fazer isso? 12 00:00:37,750 --> 00:00:41,290 Bem, uma idéia é se ater apenas uma lista para o final da lista de outro 13 00:00:41,290 --> 00:00:43,830 e depois ordenar a lista resultante. 14 00:00:43,830 --> 00:00:47,220 >> Enquanto isso funciona, é um monte de trabalho desnecessário. 15 00:00:47,220 --> 00:00:49,900 Nós podemos fazê-lo mais rápido do que apenas a classificação. 16 00:00:49,900 --> 00:00:54,100 Observe que uma idéia errada é apenas para tomar copos alternadas de cada lista. 17 00:00:54,100 --> 00:00:56,460 Embora isso possa parecer que funciona num primeiro momento, 18 00:00:56,460 --> 00:01:05,760 fazendo isso acabamos com 4, 8, 15, 23, 16 - aviso de que 16 e 23 estão fora de lugar. 19 00:01:05,760 --> 00:01:09,380 Isto porque dois elementos que devem aparecer consecutivo na lista mesclada 20 00:01:09,380 --> 00:01:11,720 estão na mesma lista inicial. 21 00:01:11,720 --> 00:01:14,850 Ambos 15 e 16 estão na lista do lado esquerdo. 22 00:01:14,850 --> 00:01:19,810 O truque é aproveitar o fato de que ambas as listas já estão classificados. 23 00:01:19,810 --> 00:01:23,320 Isto significa que, se apenas olhar para os primeiros elementos de ambas as listas - 24 00:01:23,320 --> 00:01:29,580 aqui, 4 e 8 - um deles também deve ser o primeiro elemento da lista resultante da fusão. 25 00:01:29,580 --> 00:01:31,620 Bem, por que isso? 26 00:01:31,620 --> 00:01:33,520 Ambas as listas já estão classificados, 27 00:01:33,520 --> 00:01:38,410 e então ou 4 ou 8 deve ser o elemento mais pequeno quando se combinam as duas listas. 28 00:01:38,410 --> 00:01:41,770 Neste caso, a mais pequena é 4, 29 00:01:41,770 --> 00:01:46,370 para que possamos tirar 4 e torná-lo o primeiro elemento da nossa lista mesclada. 30 00:01:46,370 --> 00:01:50,710 Agora vamos continuar a fusão das restantes três elementos da primeira lista 31 00:01:50,710 --> 00:01:52,920 e 4 elementos da segunda lista. 32 00:01:52,920 --> 00:01:57,150 >> Mais uma vez, nós só precisamos olhar para o primeiro elemento de ambas as listas. 33 00:01:57,150 --> 00:02:01,060 O menor dos dois deve ser o segundo elemento da nossa lista resultante da fusão. 34 00:02:01,060 --> 00:02:05,440 Desta vez, entre 8 e 15 o mais pequeno é de 8, e então inserir esse 35 00:02:05,440 --> 00:02:09,240 como o segundo elemento da nossa lista de classificados. 36 00:02:09,240 --> 00:02:12,180 Podemos continuar comparando os primeiros elementos de ambas as listas 37 00:02:12,180 --> 00:02:14,420 e removendo o menor dos dois. 38 00:02:14,420 --> 00:02:19,460 Comparando 15 e 23, 15 é menor e assim é o nosso terceiro elemento. 39 00:02:21,000 --> 00:02:23,910 Agora comparar 16 e 23, 16 for menor. 40 00:02:23,910 --> 00:02:26,820 Então esse é o quarto elemento. 41 00:02:26,820 --> 00:02:30,390 >> Observe que dois elementos vieram da mesma lista em uma fileira. 42 00:02:30,390 --> 00:02:34,400 É por isso que a lista resultante da fusão não pode apenas elementos alternados das duas listas. 43 00:02:34,400 --> 00:02:40,020 Comparando 50 e 23, 23 é menor, portanto, escolha que. 44 00:02:40,770 --> 00:02:44,070 Entre 50 e 42, 42 for menor. 45 00:02:44,070 --> 00:02:48,290 Entre 50 e 108, 50 for menor. 46 00:02:48,290 --> 00:02:52,330 E, finalmente, temos apenas 108, por isso deve ir no final de nossa lista. 47 00:02:53,750 --> 00:02:56,180 Observe que temos uma lista, bom ordenado. 48 00:02:56,180 --> 00:02:59,040 Cada vez que se compararam os 2 primeiros elementos das duas listas 49 00:02:59,040 --> 00:03:02,730 fomos capazes de determinar o elemento seguinte da lista resultante da fusão. 50 00:03:02,730 --> 00:03:08,070 Isto significa que se a lista final contém n números, onde n aqui é 8, 51 00:03:08,070 --> 00:03:12,610 então precisamos na maioria das comparações n para obter todos esses números para o lugar certo. 52 00:03:13,230 --> 00:03:16,230 Tal algoritmo é dito para ser executado em tempo linear, 53 00:03:16,230 --> 00:03:18,090 mas não se preocupe com isso aqui. 54 00:03:18,570 --> 00:03:22,810 >> Usando o nosso algoritmo de fusão, podemos fazer um algoritmo de ordenação rápido mesclagem. 55 00:03:22,810 --> 00:03:25,170 Então, vamos repor nossas listas. 56 00:03:35,210 --> 00:03:37,750 Existem dois grandes passos no processo de merge sort. 57 00:03:37,750 --> 00:03:41,500 Em primeiro lugar, de forma contínua dividir a lista de copos em metades 58 00:03:41,500 --> 00:03:44,860 até que tenhamos um monte de listas com apenas 1 xícara neles. 59 00:03:44,860 --> 00:03:47,350 Não se preocupe se uma lista contém um número ímpar 60 00:03:47,350 --> 00:03:49,880 e você não pode fazer um corte perfeitamente limpo entre eles. 61 00:03:49,880 --> 00:03:53,750 Apenas arbitrariamente escolher qual lista para incluir o copo extra dentro 62 00:03:53,750 --> 00:03:56,240 Então, vamos dividir essas listas. 63 00:03:58,140 --> 00:04:01,310 Agora temos duas listas. 64 00:04:04,120 --> 00:04:06,570 Agora temos quatro listas. 65 00:04:10,350 --> 00:04:13,870 >> E agora temos oito listas com um único copo em cada lista. 66 00:04:13,870 --> 00:04:16,630 Então é isso para o passo 1. 67 00:04:16,630 --> 00:04:22,230 Para a etapa 2, nós repetidamente fundir pares de listas usando o algoritmo de junção que aprendemos antes. 68 00:04:22,230 --> 00:04:29,160 Mesclando 108 e 15, vamos acabar com a lista de 15, 108. 69 00:04:30,330 --> 00:04:36,250 Mesclando 50 e 4, vamos acabar com 4, 50. 70 00:04:36,960 --> 00:04:41,400 Mesclando 8 e 42, vamos acabar com 8, 42. 71 00:04:42,790 --> 00:04:48,130 E fusão de 23 e 16, vamos acabar com 16, 23. 72 00:04:49,740 --> 00:04:52,450 Agora todas as nossas listas são de tamanho 2. 73 00:04:53,020 --> 00:04:56,180 Observe que cada uma das quatro listas são classificados. 74 00:04:56,180 --> 00:04:59,160 >> Assim, podemos começar a fundir pares de listas novamente. 75 00:04:59,160 --> 00:05:03,240 A fusão 15 e 108 e 4 e 50 - 76 00:05:03,240 --> 00:05:11,170 tira primeiro a 4, em seguida, a 15, em seguida a 50, em seguida a 108. 77 00:05:11,170 --> 00:05:15,120 Mesclando 8, 42 e 16, 23, 78 00:05:15,120 --> 00:05:22,440 que começou a tomar o 8, em seguida, a 16, em seguida a 23, em seguida a 42. 79 00:05:22,440 --> 00:05:27,370 Portanto, agora temos apenas 2 listas de tamanho 4, cada um dos quais está classificada. 80 00:05:27,370 --> 00:05:30,980 Então agora nós mesclar essas duas listas. 81 00:05:30,980 --> 00:05:33,440 Primeiro tomamos a 4. 82 00:05:33,440 --> 00:05:36,580 Então tomamos a 8. 83 00:05:36,580 --> 00:05:50,700 Em seguida, tomar a 15 e 16, e depois 23, depois 42, depois 50, depois 108. 84 00:05:50,700 --> 00:05:52,220 E estamos a fazer. 85 00:05:52,220 --> 00:05:54,900 Temos, agora, uma lista ordenada. 86 00:05:54,900 --> 00:05:57,890 Então, quão rápido foi isso, exatamente? 87 00:05:57,890 --> 00:06:02,000 Em termos técnicos, merge sort é O (n log n), 88 00:06:02,000 --> 00:06:07,380 Considerando que todos espécie de bolha, tipo de inserção e tipo de seleção são O (n ²). 89 00:06:07,380 --> 00:06:11,120 Na verdade, como você vai aprender logo, você não será capaz de chegar a uma espécie 90 00:06:11,120 --> 00:06:14,820 que tem um desempenho melhor do que O (n log n) no caso geral. 91 00:06:14,820 --> 00:06:19,120 Mais uma vez, não se preocupe com esta notação O grande se você não viu ainda. 92 00:06:19,120 --> 00:06:23,490 >> Só sei que isso significa que, se quiséssemos classificar uma lista muito grande 93 00:06:23,490 --> 00:06:26,820 tipo espécie de bolha, tipo de inserção e seleção poderia levar 94 00:06:26,820 --> 00:06:29,500 significativamente maior do que merge sort. 95 00:06:29,500 --> 00:06:33,210 Isso não significa que a classificação por intercalação será mais rápida para todas as listas 96 00:06:33,210 --> 00:06:36,220 ou mesmo para qualquer lista única em um determinado tamanho. 97 00:06:36,220 --> 00:06:41,950 Por exemplo, tipo de inserção pode ser o mais rápido de classificação para todas as listas de menores de 5 elementos. 98 00:06:41,950 --> 00:06:47,360 Na prática, merge sort é normalmente mais rápido para listas de tão pequenas quanto 50 elementos. 99 00:06:47,360 --> 00:06:51,120 >> Mas essa velocidade extra não vem sem um preço. 100 00:06:51,120 --> 00:06:54,770 Ao contrário dos nossos outros tipos, que levam uma lista e modificar a lista em lugar 101 00:06:54,770 --> 00:06:58,740 até chegarmos a uma lista ordenada, merge sort precisa de algum espaço adicional 102 00:06:58,740 --> 00:07:00,900 fundir duas listas. 103 00:07:00,900 --> 00:07:04,690 Nós não podemos usar imediatamente as listas que estão sendo incorporadas para armazenar a lista mesclada 104 00:07:04,690 --> 00:07:08,880 uma vez que podem substituir elementos que ainda precisam ser mescladas. 105 00:07:08,880 --> 00:07:13,540 Este espaço é um pouco de preço, mas, geralmente, não é razoável. 106 00:07:13,540 --> 00:07:15,330 E isso é tudo para merge sort. 107 00:07:15,330 --> 00:07:18,490 >> Meu nome é Rob Bowden, e este é o CS50. 108 00:07:18,490 --> 00:07:20,500 [CS50.TV] 109 00:07:20,500 --> 00:07:24,000 - Selecção e ordenação. 110 00:07:24,000 --> 00:07:25,880 [Risos] 111 00:07:25,880 --> 00:07:31,480 Ah, tem que ter isso também, porque eu mudei como eu estava me apresentando. 112 00:07:31,480 --> 00:07:35,680 Lista à esquerda. Isso foi um erro de digitação. 113 00:07:35,680 --> 00:07:39,290 [Misspoke] eu estraguei tudo - 114 00:07:39,290 --> 00:07:41,190 [Risos] 115 00:07:41,190 --> 00:07:44,190 Eu não sei o que -