Escolar Documentos
Profissional Documentos
Cultura Documentos
19/12/2012
Desenvolver um programa que implementa uma rvore PATRICIA para efetuar a busca de strings. O programa receber uma lista palavras a serem buscadas em todos os arquivos ".txt"do diretrio atual.
Execuo do programa
O programa deve ser receber o nome do arquivo de entrada na linha de comando, conforme o seguinte formato:
<programa> <arquivo_com_palavras_buscadas>
Supondo que o nome do arquivo executvel criado seja "patricia", o nome do arquivo com a lista de palavras buscadas seja "procuradas.dat", a linha de comando caria da seguinte forma: Execuo do programa
1 ./ patricia procuradas . dat
8.1
A lista das palavras a serem buscadas ser passada por arquivo e para cada palavra do arquivo deve-se efetuar a busca na rvore. Em cada linha do arquivo existir apenas uma palavra para ser buscada. O arquivo seguir o seguinte formato:
palavra_1 palavra_2 palavra_3 palavra_4 ... palavra_n
Veja a seguir o exemplo de um arquivo de entrada com lista de palavras a serem buscadas. Lista de palavras a serem buscadas
test new news 4 dog
Indexao
O programa ao iniciar a sua execuo, deve percorrer o diretrio corrente[1] identicando todos os arquivos com extenso ".txt". Cada arquivo ".txt"encontrado deve ento ser aberto e percorrido. Ao percorrer cada arquivo o programa dever inserir cada palavra encontrada na rvore PATRICIA. 4
10
Resultados
Para cada palavra buscada o programa deve retornar a palavra que est sendo buscada e todas as ocorrncias da palavra em todos os arquivos ".txt"do diretrio, caso exista alguma, caso contrrio deve aparecer a expresso "Palavra no encontrada". Para identicar cada ocorrncia encontrada o programa dever retornar as seguintes informaes:
arquivo onde a ocorrncia foi encontrada; trecho de texto com a ocorrncia, iniciando-se 10 caracteres antes e terminando 20 caracteres aps a
that
the our
t e x t o 3 . t x t : thank t e x t o 3 . t x t : and
reach
primat
with
news
website .
This
encontrada
O programa deve ser escrito na linguagem de programao Ansi-C. Os programas submetidos sero testados usando-se o compilador GCC no sistema operacional Linux.
11
P A C E D
Critrios de correo
O trabalho ser corrigido segundo 5 critrios: Ausncia de plgio Adequao ao solicitado Correo dos resultados Entrega no prazo Desempenho computacional
Para a obteno da nota do trabalho, cada critrio receber um valor entre 0 e 1 seguindo os testes efetuados pelo professor. A nota ser o resultado da seguinte ponderao:
N ota = P A (6 C + 3 E + 1 D)
12
Grupo
Os trabalhos devem ser feitos em grupos de at 2 pessoas. Prof.: Paulo Roberto Nunes de Souza 5 19/12/2012
13
Entrega
Os resultados devem ser entregue em meio digital at o dia 08/02/2013 pelo e-mail paulonunes@cca.ufes.br.
Referncias
[1] Free Software Foundation, Inc. The GNU C Library. http://www.gnu.org/savannahcheckouts/gnu/libc/manual/html_node/Accessing-Directories.html#Accessing-Directories
19/12/2012