Escolar Documentos
Profissional Documentos
Cultura Documentos
elaboradas por Fabiano C. Botelho, Leonardo Rocha, Leonardo Mata e Nivio Ziviani
Transparncias
Ordenao
Introduo - Conceitos Bsicos Ordenao Interna Ordenao por Seleo Ordenao por Insero Shellsort Quicksort Heapsort Ordenao Parcial Seleo Parcial Insero Parcial Heapsort Parcial Quicksort Parcial Ordenao Externa Intercalao Balanceada de Vrios Caminhos Implementao por meio de Seleo por Substituio Consideraes Prticas Intercalao Polifsica Quicksort Externo
Deve-se ampliar a interface Item sempre que houver necessidade de manipular a chave de um registro. O mtodo compara sobrescrito para determinar como so comparados dois objetos da classe MeuItem . Os mtodos alteraChave e recuperaChave so sobrescritos para determinar como alterar e como recuperar o valor da chave de um objeto da classe MeuItem .
10
Ordenao Interna
Na escolha de um algoritmo de ordenao interna deve ser considerado o tempo gasto pela ordenao. Sendo n o nmero registros no arquivo, as medidas de complexidade relevantes so: Nmero de comparaes C (n) entre chaves. Nmero de movimentaes M (n) de itens do arquivo. O uso econmico da memria disponvel um requisito primordial na ordenao interna. Mtodos de ordenao in situ so os preferidos. Mtodos que utilizam listas encadeadas no so muito utilizados. Mtodos que fazem cpias dos itens a serem ordenados possuem menor importncia.
11
Ordenao Interna
Classicao dos mtodos de ordenao interna: Mtodos simples: Adequados para pequenos arquivos. Requerem O(n2 ) comparaes. Produzem programas pequenos. Mtodos ecientes: Adequados para arquivos maiores. Requerem O(n log n) comparaes. Usam menos comparaes. As comparaes so mais complexas nos detalhes. Mtodos simples so mais ecientes para pequenos arquivos.
12
Ordenao Interna
A classe mostrada a seguir apresenta os mtodos de ordenao interna que sero estudados. Utilizaremos um vetor v de registros do tipo Item e uma varivel inteira n com o tamanho de v . O vetor contm registros nas posies de 1 at n, e a 0 utilizada para sentinelas.
package cap4. ordenacaointerna ; import cap4. Item ; / / vide transparncia 6
public class Ordenacao { public static void selecao ( Item v [ ] , int n) public static void insercao ( Item v [ ] , int n) public static void shellsort ( Item v [ ] , int n) public static void quicksort ( Item v [ ] , int n) public static void heapsort ( Item v [ ] , int n) }
13
14
n 2
M (n) = 3(n 1) A atribuio min = j executada em mdia n log n vezes, Knuth (1973).
15
16
17
A colocao do item no seu lugar apropriado na seqncia destino realizada movendo-se itens com chaves maiores para a direita e ento inserindo o item na posio deixada vazia.
18
19
Assumindo que todas as permutaes de n so igualmente provveis no caso mdio, temos: melhor caso : C (n) = (1 + 1 + + 1) = n 1 pior caso caso m edio : C (n) = (2 + 3 + + n) = : C (n) =
n 1 2 1 (3 + 4 + 2 n2 3n + 1 4 4 n2 + 2
+ n + 1) =
20
+ n + 3) =
21
22
Shellsort
Proposto por Shell em 1959. uma extenso do algoritmo de ordenao por insero. Problema com o algoritmo de ordenao por insero: Troca itens adjacentes para determinar o ponto de insero. So efetuadas n 1 comparaes e movimentaes quando o menor item est na posio mais direita no vetor. O mtodo de Shell contorna este problema permitindo trocas de registros distantes um do outro.
23
Shellsort
Os itens separados de h posies so rearranjados. Todo h-simo item leva a uma seqncia ordenada. Tal seqncia dita estar h-ordenada. Exemplo de utilizao:
1 Chaves iniciais: h=4 h=2 h=1 O N D A 2 R A A D 3 D D N E 4 E E E N 5 N O O O 6 A R R R
24
Shellsort
Como escolher o valor de h: Seqncia para h: h(s) = 3h(s 1) + 1, para s > 1 h(s) = 1, para s = 1.
Knuth (1973, p. 95) mostrou experimentalmente que esta seqncia difcil de ser batida por mais de 20% em ecincia. A seqncia para h corresponde a 1, 4, 13, 40, 121, 364, 1.093, 3.280, . . .
25
Shellsort
public static void shellsort ( Item v [ ] , int n) { int h = 1; do h = h 3 + 1; while (h < n) ; do { h /= 3; for ( int i = h + 1; i <= n ; i ++) { Item x = v [ i ] ; int j = i ; while ( v [ j h ] .compara ( x) > 0) { v [ j ] = v [ j h ] ; j = h; i f ( j <= h) break ; } v[ j ] = x; } } while (h ! = 1 ) ; }
A implementao do Shellsort no utiliza registros sentinelas. Seriam necessrios h registros sentinelas, uma para cada h-ordenao.
26
Shellsort
Anlise A razo da ecincia do algoritmo ainda no conhecida. Ningum ainda foi capaz de analisar o algoritmo. A sua anlise contm alguns problemas matemticos muito difceis. A comear pela prpria seqncia de incrementos. O que se sabe que cada incremento no deve ser mltiplo do anterior. Conjecturas referente ao nmero de comparaes para a seqncia de Knuth: Conjetura 1 : C (n) = O(n1,25 ) Conjetura 2 : C (n) = O(n(ln n)2 )
27
Shellsort
Vantagens: Shellsort uma tima opo para arquivos de tamanho moderado. Sua implementao simples e requer uma quantidade de cdigo pequena. Desvantagens: O tempo de execuo do algoritmo sensvel ordem inicial do arquivo. O mtodo no estvel,
28
Quicksort
Proposto por Hoare em 1960 e publiccado em 1962. o algoritmo de ordenao interna mais rpido que se conhece para uma ampla variedade de situaes. Provavelmente o mais utilizado. A idia bsica dividir o problema de ordenar um conjunto com n itens em dois problemas menores. Os problemas menores so ordenados independentemente. Os resultados so combinados para produzir a soluo nal.
29
Quicksort
A parte mais delicada do mtodo relativa ao mtodo particao . O vetor v [esq ..dir ] rearranjado por meio da escolha arbitrria de um piv x. O vetor v particionado em duas partes: A parte esquerda com chaves menores ou iguais a x. A parte direita com chaves maiores ou iguais a x.
30
Quicksort
Algoritmo para o particionamento: 1. Escolha arbitrariamente um piv x. 2. Percorra o vetor a partir da esquerda at que v [i] x. 3. Percorra o vetor a partir da direita at que v [j ] x. 4. Troque v [i] com v [j ]. 5. Continue este processo at os apontadores i e j se cruzarem. Ao nal, o vetor v [esq ..dir ] est particionado de tal forma que: Os itens em v [esq ], v [esq + 1], . . . , v [j ] so menores ou iguais a x. Os itens em v [i], v [i + 1], . . . , v [dir ] so maiores ou iguais a x.
31
Quicksort
Ilustrao do processo de partio:
1 O A A 2 R R D 3 D D R 4 E E E 5 N N N 6 A O O
O piv x escolhido como sendo v [(i + j ) / 2]. Como inicialmente i = 1 e j = 6, ento x = v [3] = D. Ao nal do processo de partio i e j se cruzam em i = 3 e j = 2.
32
Quicksort
Mtodo Partio:
private static class LimiteParticoes { int i ; int j ; } private static LimiteParticoes particao (Item v [ ] , int esq, int dir ) { LimiteParticoes p = new LimiteParticoes ( ) ; p. i = esq ; do { while ( x .compara ( v [p. i ] ) > 0 ) p. i ++; while ( x .compara ( v [p. j ] ) < 0 ) p. j ; i f (p. i <= p. j ) { Item w = v [p. i ] ; v [p. i ] = v [p. j ] ; v [p. j ] = w; p. i ++; p. j ; } } while (p. i <= p. j ) ; return p; } p. j = dir ; Item x = v [ (p. i + p. j ) / 2 ] ; / / obtm o pivo x
O modicador private nessa classe encapsula os mtodos para serem utilizados somente dentro da classe Ordenacao . O anel interno do procedimento Particao extremamente simples. Razo pela qual o algoritmo Quicksort to rpido.
33
Quicksort
Mtodo ordena e algoritmo Quicksort :
private static void ordena ( Item v [ ] , int esq, int dir ) { LimiteParticoes p = particao ( v , esq, dir ) ; i f (esq < p. j ) ordena ( v , esq, p. j ) ; i f (p. i < dir ) ordena ( v , p. i , dir ) ; } public static void quicksort ( Item v [ ] , int n) { ordena ( v , 1 , n) ; }
34
Quicksort
Exemplo do estado do vetor em cada chamada recursiva do procedimento Ordena:
Chaves iniciais: 1 2 3 4 5
O A A
R D D
D R E
E E R N
N N N R O O
A O O O R R
35
Quicksort
Anlise Seja C (n) a funo que conta o nmero de comparaes. Pior caso: C (n) = O(n2 ) O pior caso ocorre quando, sistematicamente, o piv escolhido como sendo um dos extremos de um arquivo j ordenado. Isto faz com que o procedimento Ordena seja chamado recursivamente n vezes, eliminando apenas um item em cada chamada. O pior caso pode ser evitado empregando pequenas modicaes no algoritmo. Para isso basta escolher trs itens quaisquer do vetor e usar a mediana dos trs como piv.
36
Quicksort
Anlise Melhor caso: C (n) = 2C (n/2) + n = n log n n + 1 Esta situao ocorre quando cada partio divide o arquivo em duas partes iguais. Caso mdio de acordo com Sedgewick e Flajolet (1996, p. 17): C (n) 1, 386n log n 0, 846n, Isso signica que em mdia o tempo de execuo do Quicksort O(n log n).
37
Quicksort
Vantagens: extremamente eciente para ordenar arquivos de dados. Necessita de apenas uma pequena pilha como memria auxiliar. Requer cerca de n log n comparaes em mdia para ordenar n itens. Desvantagens: Tem um pior caso O(n2 ) comparaes. Sua implementao muito delicada e difcil: Um pequeno engano pode levar a efeitos inesperados para algumas entradas de dados. O mtodo no estvel.
38
Heapsort
Possui o mesmo princpio de funcionamento da ordenao por seleo. Algoritmo: 1. Selecione o menor item do vetor. 2. Troque-o com o item da primeira posio do vetor. 3. Repita estas operaes com os n 1 itens restantes, depois com os n 2 itens, e assim sucessivamente. O custo para encontrar o menor (ou o maior) item entre n itens n 1 comparaes. Isso pode ser reduzido utilizando uma la de prioridades.
39
Heapsort
Filas de Prioridades uma estrutura de dados onde a chave de cada item reete sua habilidade relativa de abandonar o conjunto de itens rapidamente. Aplicaes: SOs usam las de prioridades, nas quais as chaves representam o tempo em que eventos devem ocorrer. Mtodos numricos iterativos so baseados na seleo repetida de um item com maior (menor) valor. Sistemas de gerncia de memria usam a tcnica de substituir a pgina menos utilizada na memria principal por uma nova pgina.
40
Heapsort
Filas de Prioridades - Tipo Abstrato de Dados Operaes: 1. Constri uma la de prioridades a partir de um conjunto com n itens. 2. Informa qual o maior item do conjunto. 3. Retira o item com maior chave. 4. Insere um novo item. 5. Aumenta o valor da chave do item i para um novo valor que maior que o valor atual da chave. 6. Substitui o maior item por um novo item, a no ser que o novo item seja maior. 7. Altera a prioridade de um item. 8. Remove um item qualquer. 9. Ajunta duas las de prioridades em uma nica.
41
Heapsort
Filas de Prioridades - Representao Representao atravs de uma lista linear ordenada: Neste caso, Constri leva tempo O(n log n). Insere O(n). Retira O(1). Ajunta O(n). Representao atravs de uma lista linear no ordenada: Neste caso, Constri tem custo linear. Insere O(1). Retira O(n). Ajunta O(1) para apontadores e O(n) para arranjos.
42
Heapsort
Filas de Prioridades - Representao A melhor representao atravs de uma estruturas de dados chamada heap: Neste caso, Constri O(n). Insere, Retira, Substitui e Altera so O(log n). Observao: Para implementar a operao Ajunta de forma eciente e ainda preservar um custo logartmico para as operaes Insere, Retira, Substitui e Altera necessrio utilizar estruturas de dados mais sosticadas, tais como rvores binomiais (Vuillemin, 1978).
43
Heapsort
Filas de Prioridades - Algoritmos de Ordenao As operaes das las de prioridades podem ser utilizadas para implementar algoritmos de ordenao. Basta utilizar repetidamente a operao Insere para construir a la de prioridades. Em seguida, utilizar repetidamente a operao Retira para receber os itens na ordem reversa. O uso de listas lineares no ordenadas corresponde ao mtodo da seleo. O uso de listas lineares ordenadas corresponde ao mtodo da insero. O uso de heaps corresponde ao mtodo Heapsort .
44
Heapsort
Heaps uma seqncia de itens com chaves c[1], c[2], . . . , c[n], tal que: c[i] c[2i], c[i] c[2i + 1], para todo i = 1, 2, . . . , n/2. A denio pode ser facilmente visualizada em uma rvore binria completa:
1 S
2 R
5 N
rvore binria completa: Os ns so numerados de 1 a n. O primeiro n chamado raiz. O n k/2 o pai do n k , para 1 < k n. Os ns 2k e 2k + 1 so os lhos esquerda e direita do n k , para 1 k k/2 .
45
Heapsort
Heaps As chaves na rvore satisfazem a condio do heap. As chaves em cada n s ao maiores do que as chaves em seus lhos. A chave no n raiz a maior chave do conjunto. Uma rvore binria completa pode ser representada por um arranjo:
1 S 2 R 3 O 4 E 5 N 6 A 7 D
A representao extremamente compacta. Permite caminhar pelos ns da rvore facilmente. Os lhos de um n i esto nas posies 2i e 2i + 1. O pai de um n i est na posio i / 2.
46
Heapsort
Heaps Na representao do heap em um arranjo, a maior chave est sempre na posio 1 do vetor. Os algoritmos para implementar as operaes sobre o heap operam ao longo de um dos caminhos da rvore. Um algoritmo elegante para construir o heap foi proposto por Floyd em 1964. O algoritmo no necessita de nenhuma memria auxiliar. Dado um vetor v [1], v [2], . . . , v [n]. Os itens v [n/2 + 1], v [n/2 + 2], . . . , v [n] formam um heap: Neste intervalo no existem dois ndices i e j tais que j = 2i ou j = 2i + 1.
47
Heapsort
Estrutura de dados la de prioridades implementada utilizando um heap
package cap4. ordenacaointerna ; import cap4. Item ; / / vide transparncia 6 public class FPHeapMax { private Item v [ ] ; private int n; public FPHeapMax ( Item v [ ] ) { this . v = v ; this .n = this . v . length 1; } public void refaz ( int esq, int dir ) public void constroi ( ) public Item max ( ) public Item retiraMax ( ) throws Exception public void aumentaChave ( int i , Object chaveNova) throws Exception public void insere ( Item x ) throws Exception }
48
Heapsort
Heaps Algoritmo:
1 Chaves iniciais: Esq = 3 Esq = 2 Esq = 1 O O O S 2 R R R R 3 D S S O 4 E E E E 5 N N N N 6 A A A A 7 S D D D
Os itens de v [4] a v [7] formam um heap. O heap estendido para a esquerda (esq = 3), englobando o item v [3], pai dos itens v [6] e v [7]. A condio de heap violada: O heap refeito trocando os itens D e S. O item R incluindo no heap (esq = 2), o que no viola a condio de heap. O item O incluindo no heap (esq = 1). A Condio de heap violada: O heap refeito trocando os itens O e S, encerrando o processo.
49
Heapsort
Heaps O Programa que implementa a operao que informa o item com maior chave:
public Item max ( ) { return this . v [ 1 ] ; }
50
Heapsort
Heaps Mtodo para construir o heap:
/ / Usa o mtodo refaz da transparncia 49 public void constroi ( ) { int esq = n / 2 + 1 ; while (esq > 1) { esq; this . refaz (esq, this .n) ; } }
51
Heapsort
Heaps Programa que implementa a operao de retirar o item com maior chave:
/ / Usa o mtodo refaz da transparncia 49 public Item retiraMax ( ) throws Exception { Item maximo; i f ( this .n < 1) throw new Exception ( "Erro : heap vazio" ) ; else { maximo = this . v [ 1 ] ; this . v[1] = this . v [ this .n]; refaz ( 1 , this .n) ; } return maximo; }
52
Heapsort
Heaps Programa que implementa a operao de aumentar o valor da chave do item i:
public void aumentaChave ( int i , Object chaveNova) throws Exception { Item x = this . v [ i ] ; i f (chaveNova == null ) throw new Exception ( "Erro : chaveNova com valor null " ) ; x . alteraChave (chaveNova) ; while ( ( i > 1) && (x .compara ( this . v [ i / 2 ] ) > = 0 ) ) { this . v [ i ] = this . v [ i / 2 ] ; i /= 2; } this . v [ i ] = x ; }
53
Heapsort
Heaps Exemplo da operao de aumentar o valor da chave do item na posio i:
(a)
S
(b)
i
E N S A D E N U
i
U D
(c)
(d) i
i
S
54
Heapsort
Heaps Programa que implementa a operao de inserir um novo item no heap:
/ / Usa o mtodo aumentaChave da tranparncia 52 public void insere ( Item x ) throws Exception { this .n++; i f ( this .n == this . v . length ) throw new Exception ( "Erro : heap cheio" ) ; Object chaveNova = x .recuperaChave ( ) ; this . v [ this .n] = x ; this . v [ this .n ] . alteraChave (new Integer ( Integer . MIN_VALUE ) ) ; / / this .aumentaChave ( this .n, chaveNova) ; }
55
Heapsort
Algoritmo: 1. Construir o heap. 2. Troque o item na posio 1 do vetor (raiz do heap) com o item da posio n. 3. Use o procedimento Refaz para reconstituir o heap para os itens v [1], v [2], . . . , v [n 1]. 4. Repita os passos 2 e 3 com os n 1 itens restantes, depois com os n 2, at que reste apenas um item.
56
Heapsort
Exemplo de aplicao do Heapsort :
1 S R O N E D A 2 R N N E D A D 3 O O A A A E 4 E E E D N 5 N D D O 6 A A R 7 D S
O caminho seguido pelo procedimento Refaz para reconstituir a condio do heap est em negrito. Por exemplo, aps a troca dos itens S e D na segunda linha da Figura, o item D volta para a posio 5, aps passar pelas posies 1 e 2.
57
Heapsort
Programa que mostra a implementao do Heapsort para um conjunto de n itens implementado como um vetor do tipo Item :
public static void heapsort ( Item v [ ] , int n) { / / Usa a classe FPHeapMax da transparncia 47 FPHeapMax fpHeap = new FPHeapMax ( v ) ; int dir = n; fpHeap. constroi ( ) ; / / constroi o heap while ( dir > 1 ) { / / ordena o vetor Item x = v [ 1 ] ; v[1] = v [ dir ] ; v [ dir ] = x ; dir ; fpHeap. refaz ( 1 , dir ) ; } }
Anlise O procedimento Refaz gasta cerca de log n operaes, no pior caso. Logo, Heapsort gasta um tempo de execuo proporcional a n log n, no pior caso.
58
Heapsort
Vantagens: O comportamento do Heapsort sempre O(n log n), qualquer que seja a entrada. Desvantagens: O anel interno do algoritmo bastante complexo se comparado com o do Quicksort . O Heapsort no estvel. Recomendado: Para aplicaes que no podem tolerar eventualmente um caso desfavorvel. No recomendado para arquivos com poucos registros, por causa do tempo necessrio para construir o heap.
59
60
61
62
63
1. O Shellsort bastante sensvel ordenao ascendente ou descendente da entrada; 2. Em arquivos do mesmo tamanho, o Shellsort executa mais rpido para arquivos ordenados. 3. O Quicksort sensvel ordenao ascendente ou descendente da entrada. 4. Em arquivos do mesmo tamanho, o Quicksort executa mais rpido para arquivos ordenados. 5. O Quicksort o mais rpido para qualquer tamanho para arquivos na ordem ascendente. 6. O Heapsort praticamente no sensvel ordenao da entrada.
64
65
66
67
68
69
70
71
Ordenao Parcial
Consiste em obter os k primeiros elementos de um vetor ordenado com n elementos. Quando k = 1, o problema se reduz a encontrar o mnimo (ou o mximo) de um conjunto de elementos. Quando k = n camos no problema clssico de ordenao.
72
Ordenao Parcial
Aplicaes: Facilitar a busca de informao na Web com as mquinas de busca: comum uma consulta na Web retornar centenas de milhares de documentos relacionados com a consulta. O usurio est interessado apenas nos k documentos mais relevantes. Em geral k menor do que 200 documentos. Normalmente so consultados apenas os dez primeiros. Assim, so necessrios algoritmos ecientes de ordenao parcial.
73
Ordenao Parcial
Algoritmos considerados: Seleo parcial. Insero parcial. Heapsort parcial. Quicksort parcial. A classe OrdenacaoParcial mostrada a seguir.
package cap4. ordenacaointerna ; import cap4. Item ; / / vide transparncia 5
public class OrdenacaoParcial { public static void selecaoParcial(Item v [ ] , int n, int k) public static void insercaoParcial (Item v [ ] , int n, int k) public static void insercaoParcial2(Item V[ ] , int n, int k) public static void quicksortParcial (Item v [ ] , int n, int k) public static void heapsortParcial (Item v [ ] , int n, int k) }
74
Seleo Parcial
Um dos algoritmos mais simples. Princpio de funcionamento: Selecione o menor item do vetor. Troque-o com o item que est na primeira posio do vetor. Repita estas duas operaes com os itens n 1, n 2 . . . n k .
75
Seleo Parcial
public static void selecaoParcial ( Item v [ ] , int n, int k) { for ( int i = 1; i <= k ; i ++) { int min = i ; for ( int j = i + 1; j <= n ; j ++) i f ( v [ j ] .compara ( v [min] ) < 0 ) min = j ; Item x = v [min ] ; v [min] = v [ i ] ; v [ i ] = x ; } }
k 2
76
Seleo Parcial
muito simples de ser obtido a partir da implementao do algoritmo de ordenao por seleo. Possui um comportamento espetacular quanto ao nmero de movimentos de registros: Tempo de execuo linear no tamanho de k .
77
Insero Parcial
Pode ser obtido a partir do algoritmo de ordenao por Insero por meio de uma modicao simples: Tendo sido ordenados os primeiros k itens, o item da k -sima posio funciona como um piv. Quando um item entre os restantes menor do que o piv, ele inserido na posio correta entre os k itens de acordo com o algoritmo original.
78
Insero Parcial
public static void insercaoParcial ( Item v [ ] , int n, int k) { int j ; for ( int i = 2; i <= n ; i ++) { Item x = v [ i ] ; i f ( i > k ) j = k ; else j = i 1; v[0] = x ; / / sentinela while ( x .compara ( v [ j ] ) < 0 ) { v [ j + 1] = v [ j ] ; j ; } v [ j + 1] = x ; } }
Obs: 1. A modicao realizada verica o momento em que i se torna maior do que k e ento passa a considerar o valor de j igual a k a partir deste ponto. 2. O algoritmo no preserva o restante do vetor.
79
Insero Parcial
Algoritmo de Insero Parcial que preserva o restante do vetor:
public static void insercaoParcial2 ( Item v [ ] , int n, int k) { int j ; for ( int i = 2; i <= n ; i ++) { Item x = v [ i ] ; if ( i > k) { j = k; i f ( x .compara ( v [ k] ) < 0 ) v [ i ] = v [ k ] ; } else j = i 1; v[0] = x ; / / sentinela while ( x .compara ( v [ j ] ) < 0 ) { i f ( j < k ) v [ j + 1] = v [ j ] ; j ; } i f ( j < k ) v [ j + 1] = x ; } }
80
Insero Parcial
Anlise: No anel mais interno, na i-sima iterao o valor de Ci :
melhor caso pior caso caso m edio : Ci (n) = 1 : Ci (n) = i : Ci (n) =
1 (1 i
+ 2 + + i) =
i+1 2
1 1
+ + k + 1 + (k + 1)(n k)) +
k 4
81
Insero Parcial
Anlise: O nmero de movimentaes na i-sima iterao :
Mi (n) = Ci (n) 1 + 3 = Ci (n) + 2
3k 2
3 2
+ + k + 3 + (k + 1)(n k)) +
5k 4
O nmero mnimo de comparaes e movimentos ocorre quando os itens esto originalmente em ordem. O nmero mximo ocorre quando os itens esto originalmente na ordem reversa.
82
Heapsort Parcial
Utiliza um tipo abstrato de dados heap para informar o menor item do conjunto. Na primeira iterao, o menor item que est em v [1] (raiz do heap) trocado com o item que est em v [n]. Em seguida o heap refeito. Novamente, o menor est em A[1], troque-o com A[n-1]. Repita as duas ltimas operaes at que o k -simo menor seja trocado com v [n k ]. Ao nal, os k menores esto nas k ltimas posies do vetor v .
83
Heapsort Parcial
public static void heapsortParcial ( Item v [ ] , int n, int k) { / / Coloca menor em v[n], segundo em v[n-1],...,k-esimo em v[n-k] FPHeapMin fpHeap = new FPHeapMin ( v ) ; int dir = n, aux = 0; fpHeap. constroi ( ) ; / / constroi o heap while (aux < k ) { / / ordena o vetor Item x = v [ 1 ] ; v[1] = v [ dir ] ; v [ dir ] = x ; dir ; aux++; fpHeap. refaz ( 1 , dir ) ; } }
84
Heapsort Parcial
Anlise: O Heapsort Parcial deve construir um heap a um custo O(n). O mtodo refaz tem custo O(log n). O mtodo heapsortParcial chama o mtodo refaz k vezes. Logo, o algoritmo apresenta a complexidade: O(n + k log n) =
O (n)
se k
O (k log n) se k >
n log n n log n
85
Quicksort Parcial
Assim como o Quicksort, o Quicksort Parcial o algoritmo de ordenao parcial mais rpido em vrias situaes. A alterao no algoritmo para que ele ordene apenas os k primeiros itens dentre n itens muito simples. Basta abandonar a partio direita toda vez que a partio esquerda contiver k ou mais itens. Assim, a nica alterao necessria no Quicksort evitar a chamada recursiva ordena (i, dir ).
86
Quicksort Parcial
Chaves iniciais: 1 2 3 4 5 A D E N O A A R D D E R N N R O O O O R R D R E E N N A O
Considere k = 3 e D o piv para gerar as linhas 2 e 3. A partio esquerda contm dois itens e a partio direita contm quatro itens. A partio esquerda contm menos do que k itens. Logo, a partio direita no pode ser abandonada. Considere E o piv na linha 3. A partio esquerda contm trs itens e a partio direita tambm. Assim, a partio direita pode ser abandonada.
87
Quicksort Parcial
private static void ordena(Item v [ ] , int esq, int dir , int k) { LimiteParticoes p = particao ( v , esq, dir ) ; i f (p. j esq >= k 1) { i f (esq < p. j ) ordena ( v , esq, p. j , k ) ; return ; } i f (esq < p. j ) ordena ( v , esq, p. j , k ) ; i f (p. i < dir ) ordena ( v , p. i , dir , k ) ; } public static void quicksortParcial (Item v [ ] , int n, int k) { ordena ( v , 1 , n, k ) ; }
88
Quicksort Parcial
Anlise: A anlise do Quicksort difcil. O comportamento muito sensvel escolha do piv. Podendo cair no melhor caso O(k log k ). Ou em algum valor entre o melhor caso e O(n log n).
89
Seleo
0 1
Quicksort 2,5 2,8 3 2,4 1,7 3,7 2,9 1,3 1 2,4 2,2 2,1 1 1 1 3,9 2,7 3,2 2,2 1 1 1 3,4 2,6 2,6 3,1 1,1 1 1 1
Insero2 1,2 1,1 1,4 1,2 1,1 1,6 1,2 1,4 4,2 1,1 1 1,1 1,3 43,3 1,3 1 1,1 1,1 6,4 1,1 1,1 1,1 1,1 1,2
Heapsort 1,7 2,8 4,5 3 2,3 9,1 6,4 1,9 1,6 5,3 4,9 4,8 2,3 1,7 1,9 8,1 7,3 6,6 5,7 1,9 1,7 1,8 7,4 6,7 6,8 6,6 2,6 2,2 1,2 1,7
k : 10 k : 10
1 1,2 1 1,9 3 1 4,6 11,2 15,1 1 5,9 67 304 1445 1 6,6 83,1 690 1 8,6 82,1
n : 102 k : 100 n : 10 n : 10
2 2
k : 10 k : 10
1 2
n : 103 k : 100 n : 10 n : 10 n : 10 n : 10 n : 10 n : 10 n : 10 n : 10
3 3 3 5 5 5
k : 10 k : 10 k : 10 k : 10 k : 10 k : 10 k : 10 k : 10
1 2 3 0 1 2
n : 105 k : 103
5 5 4 5
n : 106 k : 100 n : 10 n : 10 n : 10 n : 10 n : 10 n : 10
6 6 6 6 6 6
k : 10 k : 10 k : 10 k : 10 k : 10 k : 10
1 2 3 4 5 6
n : 107 k : 100 n : 10 n : 10 n : 10 n : 10 n : 10 n : 10
7 7 7 7 7 7
k : 10 k : 10 k : 10 k : 10 k : 10 k : 10
1 2 3 4 5 6
n : 107 k : 107
90
91
Ordenao Externa
A ordenao externa consiste em ordenar arquivos de tamanho maior que a memria interna disponvel. Os mtodos de ordenao externa so muito diferentes dos de ordenao interna. Na ordenao externa os algoritmos devem diminuir o nmero de acesso as unidades de memria externa. Nas memrias externas, os dados so armazenados como um arquivo seqencial. Apenas um registro pode ser acessado em um dado momento. Esta uma restrio forte se comparada com as possibilidades de acesso em um vetor. Logo, os mtodos de ordenao interna so inadequados para ordenao externa. Tcnicas de ordenao completamente diferentes devem ser utilizadas.
92
Ordenao Externa
Fatores que determinam as diferenas das tcnicas de ordenao externa: 1. Custo para acessar um item algumas ordens de grandeza maior. 2. O custo principal na ordenao externa relacionado a transferncia de dados entre a memria interna e externa. 3. Existem restries severas de acesso aos dados. 4. O desenvolvimento de mtodos de ordenao externa muito dependente do estado atual da tecnologia. 5. A variedade de tipos de unidades de memria externa torna os mtodos dependentes de vrios parmetros. 6. Assim, apenas mtodos gerais sero apresentados.
93
Ordenao Externa
O mtodo mais importante o de ordenao por intercalao. Intercalar signica combinar dois ou mais blocos ordenados em um nico bloco ordenado. A intercalao utilizada como uma operao auxiliar na ordenao. Estratgia geral dos mtodos de ordenao externa: 1. Quebre o arquivo em blocos do tamanho da memria interna disponvel. 2. Ordene cada bloco na memria interna. 3. Intercale os blocos ordenados, fazendo vrias passadas sobre o arquivo. 4. A cada passada so criados blocos ordenados cada vez maiores, at que todo o arquivo esteja ordenado.
94
Ordenao Externa
Os algoritmos para ordenao externa devem reduzir o nmero de passadas sobre o arquivo. Uma boa medida de complexidade de um algoritmo de ordenao por intercalao o nmero de vezes que um item lido ou escrito na memria auxiliar. Os bons mtodos de ordenao geralmente envolvem no total menos do que dez passadas sobre o arquivo.
95
Objetivo: Ordenar os 22 registros e coloc-los em uma ta de sada. Os registros so lidos um aps o outro. Considere uma memria interna com capacidade para para trs registros. Considere que esteja disponvel seis unidades de ta magntica.
96
97
98
99
100
101
102
103
104
105
Para f pequeno no vantajoso utilizar seleo por substituio para intercalar blocos: Obtm-se o menor item fazendo f 1 comparaes. Quando f 8 ou mais, o mtodo adequado: Obtm-se o menor item fazendo log2 f comparaes.
106
Consideraes Prticas
As operaes de entrada e sada de dados devem ser implementadas ecientemente. Deve-se procurar realizar a leitura, a escrita e o processamento interno dos dados de forma simultnea. Os computadores de maior porte possuem uma ou mais unidades independentes para processamento de entrada e sada. Assim, pode-se realizar processamento e operaes de E/S simultaneamente.
107
Consideraes Prticas
Tcnica para obter superposio de E/S e processamento interno: Utilize 2f reas de entrada e 2f de sada. Para cada unidade de entrada ou sada, utiliza-se duas reas de armazenamento: 1. Uma para uso do processador central 2. Outra para uso do processador de entrada ou sada. Para entrada, o processador central usa uma das duas reas enquanto a unidade de entrada est preenchendo a outra rea. Depois a utilizao das reas invertida entre o processador de entrada e o processador central. Para sada, a mesma tcnica utilizada.
108
Consideraes Prticas
Problemas com a tcnica: Apenas metade da memria disponvel utilizada. Isso pode levar a uma inecincia se o nmero de reas for grande. Ex: Intercalao-de-f -caminhos para f grande. Todas as f reas de entrada em uma intercalao-de-f -caminhos se esvaziando aproximadamente ao mesmo tempo.
109
Consideraes Prticas
Soluo para os problemas: Tcnica de previso: Requer a utilizao de uma nica rea extra de armazenamento durante a intercalao. Superpe a entrada da prxima rea que precisa ser preenchida com a parte de processamento interno do algoritmo. fcil saber qual rea car vazia primeiro. Basta olhar para o ltimo registro de cada rea. A rea cujo ltimo registro o menor, ser a primeira a se esvaziar.
110
Consideraes Prticas
Escolha da ordem de intercalao f : Para tas magnticas: f deve ser igual ao nmero de unidades de ta disponveis menos um. A fase de intercalao usa f tas de entrada e uma ta de sada. O nmero de tas de entrada deve ser no mnimo dois. Para discos magnticos: O mesmo raciocnio acima vlido. O acesso seqencial mais eciente. Sedegwick (1988) sugere considerar f grande o suciente para completar a ordenao em poucos passos. Porm, a melhor escolha para f depende de vrios parmetros relacionados com o sistema de computao disponvel.
111
Intercalao Polifsica
Problema com a intercalao balanceada de vrios caminhos: Necessita de um grande nmero de tas. Faz vrias leituras e escritas entre as tas envolvidas. Para uma intercalao balanceada de f caminhos so necessrias 2f tas. Alternativamente, pode-se copiar o arquivo quase todo de uma nica ta de sada para f tas de entrada. Isso reduz o nmero de tas para f + 1. Porm, h um custo de uma cpia adicional do arquivo. Soluo: Intercalao polifsica.
112
Intercalao Polifsica
Os blocos ordenados so distribudos de forma desigual entre as tas disponveis. Uma ta deixada livre. Em seguida, a intercalao de blocos ordenados executada at que uma das tas esvazie. Neste ponto, uma das tas de sada troca de papel com a ta de entrada.
113
Intercalao Polifsica
Exemplo: Blocos ordenados obtidos por meio de seleo por substituio:
ta 1: ta 2: ta 3: INRT AACEN ACEL AAD AABCLO
114
Intercalao Polifsica
Exemplo: Depois da intercalao-de-2-caminhos das tas 1 e 3 para a ta 2:
ta 1: ta 2: ta 3: AAAABCCEILNNORT AAACDEL
Finalmente:
ta 1: ta 2: ta 3: AAAAAAABCCCDEEILLNNORT
A intercalao realizada em muitas fases. As fases no envolvem todos os blocos. Nenhuma cpia direta entre tas realizada.
115
Intercalao Polifsica
A implementao da intercalao polifsica simples. A parte mais delicada est na distribuio inicial dos blocos ordenados entre as tas. Distribuio dos blocos nas diversas etapas do exemplo:
ta 1 3 1 0 1 ta 2 2 0 1 0 ta 3 0 2 1 0 Total 5 3 2 1
116
Intercalao Polifsica
Anlise: A anlise da intercalao polifsica complicada. O que se sabe que ela ligeiramente melhor do que a intercalao balanceada para valores pequenos de f . Para valores de f > 8, a intercalao balanceada pode ser mais rpida.
117
Quicksort Externo
Foi proposto por Monard em 1980. Utiliza o paradigma de diviso e conquista. O algoritmo ordena in situ um arquivo A = {R1 , . . . , Rn } de n registros. Os registros esto armazenados consecutivamente em memria secundria de acesso randmico. O algoritmo utiliza somente O(log n) unidades de memria interna e no necessria nenhuma memria externa adicional.
118
Quicksort Externo
So necessrios quatro mtodos adicionais para a classe MeuItem (transparncia 6). O mtodo toString especica como o objeto formatado. Os mtodos leArq e gravaArq so utilizados para ler e gravar um objeto da classe MeuItem em um arquivo de acesso aleatrio. O mtodo tamanho retorna o tamanho em bytes de um objeto da classe MeuItem .
public String toString ( ) { return " " + this .chave ; } public void gravaArq (RandomAccessFile arq) throws IOException { arq . writeInt ( this .chave) ; } public void leArq (RandomAccessFile arq) throws IOException { this .chave = arq . readInt ( ) ; } public static int tamanho ( ) { return 4 ; / 4 bytes / }
119
Quicksort Externo
Seja Ri , 1 i n, o registro que se encontra na i-sima posio de A. Algoritmo: 1. Particionar A da seguinte forma: {R1 , . . . , Ri } Ri+1 Ri+2 . . . Rj 2 Rj 1 {Rj , . . . , Rn }, 2. chamar recursivamente o algoritmo em cada um dos subarquivos A1 = { R 1 , . . . , R i } e A2 = { R j , . . . , R n } .
120
Quicksort Externo
Para o partionamento utilizanda uma rea de armazenamento na memria interna. Tamanho da rea: TamArea = j i 1, com TamArea 3. Nas chamadas recusivas deve-se considerar que: Primeiro deve ser ordenado o subarquivo de menor tamanho. Condio para que, na mdia, O(log n) subarquivos tenham o processamento adiado. Subarquivos vazios ou com um nico registro so ignorados. Caso o arquivo de entrada A possua no mximo TamArea registros, ele ordenado em um nico passo.
121
Quicksort Externo
i Li Ls j rea Linf Lsup i Li Ls j 4 rea Linf Lsup
a)
5 3 10 6 1 7 4 Ei i Li Ls Es j 4 5
b)
5 3 10 6 1 7 4 Ei i Li Ls Es j
c)
5 3 10 6 1 7 4 Ei i Li Ls Es j
d)
5 3 10 6 1 7 4 Ei i Li Ls Es j
4 5 7
e)
5 3 10 6 1 7 7 Ei i Li Ls Es j
4 5
f)
5 3 10 6 1 7 7 Ei i Li Ls 3 3 10 6 1 7 7 Ei Li Ls Es j Es j
3 4 5
g)
3 3 10 6 1 7 7 Ei i Li Ls Es j
4 5
h)
4 5
i 4 5 3 7
i)
3 1 10 6 1 7 7 Ei i Li Ls Es j
j)
3 1 10 6 1 7 7 Ei i Ls Li Es j
4 5
k)
3 1 10 6 1 10 7 Ei i Ls Li Es j
4 5
l)
3 1 10 6 1 10 7 Ei i Ls Li Es j
4 5 6
m) 3 1 10 6 6 10 7
Ei Es
4 5
n)
3 1 4 5 6 10 7 Es Ei
122
Quicksort Externo
O programa a seguir apresenta a classe QuicksortExterno , na qual so denidos as estruturas de dados e os mtodos utilizados pelo algoritmo Quicksort Externo.
package cap4.ordenacaoexterna; import cap3. arranjo .Area; import cap4.MeuItem; import java . io . ; public class QuicksortExterno { private static class LimiteParticoes { int i ; int j ; } private RandomAccessFile arqLi ; private RandomAccessFile arqEi ; private RandomAccessFile arqLEs; private boolean private MeuItem private Area private int ondeLer; ultLido ; area; tamArea;
/ / Mtodos utilizados pelo mtodo particao do quicksort externo private int leSup ( int ls ) throws IOException private int leInf ( int l i ) throws IOException private int inserirArea ( ) throws Exception / / Continua na prxima transparncia
123
Quicksort Externo
private int escreveMax ( int es) throws Exception private int escreveMin ( int ei ) throws IOException private int retiraMax ( ) throws Exception private int retiraMin ( ) throws Exception private LimiteParticoes particao ( int esq, int dir ) throws Exception public QuicksortExterno ( String nomeArq, int tamArea) throws FileNotFoundException { this . arqLi this . arqEi = new RandomAccessFile (nomeArq, "rws" ) ; = new RandomAccessFile (nomeArq, "rws" ) ;
this .arqLEs = new RandomAccessFile (nomeArq, "rws" ) ; this .tamArea = tamArea; } public void quicksortExterno ( int esq, int dir ) throws Exception public void fechaArquivos ( ) throws Exception { this . arqEi . close ( ) ; this . arqLi . close ( ) ; this .arqLEs. close ( ) ; } }
124
Quicksort Externo
public void quicksortExterno ( int esq, int dir ) throws Exception { i f ( dir esq < 1) return ; LimiteParticoes p = particao (esq, dir ) ; i f (p. i esq < dir p. j ) { / / ordene primeiro o subarquivo menor quicksortExterno (esq, p. i ) ; quicksortExterno (p. j , dir ) ; } else { quicksortExterno (p. j , dir ) ; quicksortExterno (esq, p. i ) ; } }
125
Quicksort Externo
Mtodos auxiliares utilizados pelo mtodo particao :
private int leSup ( int ls ) throws IOException { this . ultLido = new MeuItem ( 0 ) ; arqLEs.seek ( ( ls 1) MeuItem.tamanho ( ) ) ; this . ultLido . leArq (arqLEs ) ; ondeLer = false ; return ls ; } private int leInf ( int l i ) throws IOException { this . ultLido = new MeuItem ( 0 ) ; this . ultLido . leArq ( arqLi ) ; ondeLer = true ; return ++ l i ; } private int inserirArea ( ) throws Exception { area. insereItem ( this . ultLido ) ; return area.obterNumCelOcupadas ( ) ; }
126
Quicksort Externo
Mtodos auxiliares utilizados pelo mtodo particao :
private int escreveMax ( int es) throws Exception { arqLEs.seek ( ( es 1) MeuItem.tamanho ( ) ) ; this . ultLido .gravaArq (arqLEs) ; return es; } private int escreveMin ( int ei ) throws IOException { this . ultLido .gravaArq ( arqEi ) ; return ++ei ; } private int retiraMax ( ) throws Exception { this . ultLido = (MeuItem) area. retiraUltimo ( ) ; return area.obterNumCelOcupadas ( ) ; } private int retiraMin ( ) throws Exception { this . ultLido = (MeuItem) area. retiraPrimeiro ( ) ; return area.obterNumCelOcupadas ( ) ; }
127
Quicksort Externo
Mtodo Partio:
private LimiteParticoes particao ( int esq, int dir ) throws Exception { int ls = dir , es = dir , l i = esq, ei = esq, nrArea = 0; MeuItem l i n f = new MeuItem ( Integer .MIN_VALUE) ; / / MeuItem lsup = new MeuItem ( Integer .MAX_VALUE) ; / / this .ondeLer = true ; LimiteParticoes p = new LimiteParticoes ( ) ; this .area = new Area ( this .tamArea) ; arqLi .seek ( ( l i 1) MeuItem.tamanho ( ) ) ; arqEi .seek ( ( ei 1) MeuItem.tamanho ( ) ) ; p. i = esq 1; p. j = dir + 1; while ( ls >= l i ) { i f ( nrArea < this .tamArea 1) { i f (ondeLer) ls = this .leSup ( ls ) ; else l i = leInf ( l i ) ; nrArea = inserirArea ( ) ; } else { i f ( ls == es) ls = leSup ( ls ) ; else i f ( l i == ei ) l i = leInf ( l i ) ; else i f (ondeLer) ls = leSup ( ls ) ; else l i = leInf ( l i ) ; / / Continua na prxima transparncia
128
Quicksort Externo
Mtodo Partio:
i f ( ultLido .compara ( lsup ) > 0) { p. j = es ; es = escreveMax (es) ; } else i f ( ultLido .compara ( l i n f ) < 0) { p. i = ei ; ei = escreveMin ( ei ) ; } else { nrArea = inserirArea ( ) ; i f ( ei esq < dir es ) { nrArea = retiraMin ( ) ; l i n f = this . ultLido ; ei=escreveMin ( ei ) ; } else { nrArea = retiraMax ( ) ; lsup = this . ultLido ; es=escreveMax (es) ; } } } } while ( ei <= es ) { nrArea = retiraMin ( ) ; ei = escreveMin ( ei ) ; } return p; }
129
Quicksort Externo
Programa teste:
package cap4; import java . io .RandomAccessFile; import cap4.ordenacaoexterna. QuicksortExterno ; / / vide transparncia 122 public class TestaQuicksortExterno { public static void main ( String [ ] args ) { try { RandomAccessFile arq = new RandomAccessFile ( "qe. dat" , "rwd" ) ; MeuItem item = new MeuItem ( 5 ) ; item .gravaArq ( arq ) ; item = new MeuItem ( 3 ) ; item .gravaArq ( arq ) ; item = new MeuItem ( 1 0 ) ; item .gravaArq ( arq ) ; item = new MeuItem ( 6 ) ; item .gravaArq ( arq ) ; item = new MeuItem ( 1 ) ; item .gravaArq ( arq ) ; item = new MeuItem ( 7 ) ; item .gravaArq ( arq ) ; item = new MeuItem ( 4 ) ; item .gravaArq ( arq ) ; arq . close ( ) ; QuicksortExterno quicksortExterno=new QuicksortExterno( "qe. dat" ,3); quicksortExterno . quicksortExterno ( 1 , 7 ) ; quicksortExterno . fechaArquivos ( ) ; arq = new RandomAccessFile ( "qe. dat" , " r " ) ; item . leArq ( arq ) ; while ( arq . getFilePointer ( ) < arq . length ( ) ) { System. out . println ( "Registro=" + item . toString ( ) ) ; item . leArq ( arq ) ; } System. out . println ( "Registro=" + item . toString ( ) ) ; arq . close ( ) ; } catch ( Exception e ) { System. out . println (e.getMessage ( ) ) ; } } }
130
Quicksort Externo
Anlise: Seja n o nmero de registros a serem ordenados. Seja e b o tamanho do bloco de leitura ou gravao do Sistema operacional. ) Melhor caso: O( n b Por exemplo, ocorre quando o arquivo de entrada j est ordenado. Pior caso:
n2 O( TamArea )
ocorre quando um dos arquivos retornados pelo procedimento Particao tem o maior tamanho possvel e o outro vazio. A medida que n cresce, a probabilidade de ocorrncia do pior caso tende a zero.
n log ( )) Caso Mdio: O( n b TamArea