Use este identificador para citar ou linkar para este item: http://repositorio.ufla.br/jspui/handle/1/31284
Título: Junções por similaridade em múltiplos conjuntos utilizando MapReduce
Autor : Sousa, Luís Henrique Borges
Primeiro orientador: Ribeiro, Leonardo Andrade
Primeiro membro da banca: Pereira, Marluce Rodrigues
Pereira, Denilson Alves
Palavras-chave: Banco de dados
Junções de similaridade
MapReduce
Computação paralela
Computação Distribuída
Data da publicação: 26-Jan-2015
Referência: SOUSA, L. H. B. Junções por similaridade em múltiplos conjuntos utilizando MapReduce. 2013. 77 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2013.
Resumo: Operações de similaridade são operações fundamentais para busca, gerenciamento e análise de dados. Apesar dessas operações serem geralmente bastante onerosas computacionalmente, já foram desenvolvidos algoritmos eficientes. No entanto, para a realização de operações de similaridade sobre grandes volumes de dados, técnicas de programação paralela e distribuída são imprescindíveis. O objetivo deste trabalho é generalizar o algoritmo mpjoin para múltiplos conjuntos com pesos para execução em paralelo utilizando o framework MapReduce. Visto que até o presente momento apenas o algoritmo ppjoin (para um único conjunto e sem pesos) foi utilizado, este trabalho traz novidades para a área de pesquisa. Três estratégias para distribuição do algoritmo são propostas, sendo que, de acordo com os experimentos realizados, a terceira é a mais eficiente e escalável.
URI: http://repositorio.ufla.br/jspui/handle/1/31284
Idioma: pt_BR
Aparece nas coleções:PROGRAD - Ciência da Computação (Trabalhos de Conclusão de Curso)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
MONOGRAFIA_Juncoes_por_similaridade_em_multiplos_conjuntos_utilizando_mapreduce.pdf3,28 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.