Use este identificador para citar ou linkar para este item:
http://repositorio.ufla.br/jspui/handle/1/12162
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.creator | Castro, Eduardo Petrini Silva | - |
dc.date.accessioned | 2017-01-18T19:17:15Z | - |
dc.date.available | 2017-01-18T19:17:15Z | - |
dc.date.issued | 2017-01-17 | - |
dc.date.submitted | 2016-09-15 | - |
dc.identifier.citation | CASTRO, E. P. S. Implementação de algoritmos de regras de associação nos arcabouços Hadoop-MapReduce e Spark. 2016. 158 p. Dissertação (Mestrado em Ciência da Computação)-Universidade Federal de Lavras, Lavras, 2016. | pt_BR |
dc.identifier.uri | http://repositorio.ufla.br/jspui/handle/1/12162 | - |
dc.description.abstract | In midst to the big amount of data constantly produced on computerized information systems, there are data mining algorithms able to find hidden information in this data. One of techniques implemented by this algorithms is known as association rules, which aims to find associations between items on same dataset. A recent proposal uses association rules to deal with product offer classification in online store. However, for big amount of data, the proposed algorithm runtime becomes unfeasible. There are frameworks enabling distributed algorithms implementation in computer cluster like Hadoop and Spark. Many data mining algorithms, such as Apriori Algorithm for association rules, has several implementation proposals using MapReduce. This work performed a study of proposed solutions of Apriori implementation on Hadoop-MapReduce. The algorithms was also adapted to Spark and a comparative was performed between frameworks. The results show that Spark implementations overcomes Hadoop-MapReduce implementations at runtime in most experiments. However, there is no single implementation that is the best in all the evaluated situations. An alternative to the product offer classification in online store problem on Hadoop-MapReduce and Spark was also carried out. The results show large capacity of adaptation to process big amount of data. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Lavras | pt_BR |
dc.rights | acesso aberto | pt_BR |
dc.subject | Mineração de dados | pt_BR |
dc.subject | Algoritmos de computador | pt_BR |
dc.subject | Regras de associação (Computação) | pt_BR |
dc.subject | Data mining | pt_BR |
dc.subject | Computer algorithms | pt_BR |
dc.subject | Association rules (Computer science) | pt_BR |
dc.subject | Hadoop | pt_BR |
dc.subject | MapReduce | pt_BR |
dc.subject | Spark | pt_BR |
dc.title | Implementação de algoritmos de regras de associação nos arcabouços Hadoop-MapReduce e Spark | pt_BR |
dc.title.alternative | Association rules algorithms implementation on Hadoop-MapReduce and Spark frameworks | pt_BR |
dc.type | dissertação | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação | pt_BR |
dc.publisher.initials | UFLA | pt_BR |
dc.publisher.country | brasil | pt_BR |
dc.contributor.advisor1 | Pereira, Denilson Alves | - |
dc.contributor.referee1 | Esmin, Ahmed Ali Abdalla | - |
dc.contributor.referee2 | Naldi, Murilo Coelho | - |
dc.description.resumo | Em meio ao grande volume de dados produzidos constantemente em sistemas de informação computadorizados, há algoritmos de mineração de dados capazes de encontrar informações ocultas nesses dados. Uma das técnicas implementadas por esses algoritmos é conhecida como regras de associação, a qual visa encontrar relações entre itens de um mesmo conjunto de dados. Uma proposta recente utiliza regras de associação para tratar o problema de classificação de ofertas de produtos em lojas de vendas online. Porém, para grandes volumes de dados, o tempo de execução do algoritmo proposto se torna problemático, dificultando seu uso. Existem frameworks que possibilitam a implementação de algoritmos distribuídos em cluster de computadores, como o Hadoop e Spark. Muitos algoritmos de mineração de dados, como o algoritmo Apriori, que gera regras de associação, tiveram diversas propostas de implementações utilizando o modelo MapReduce. Este trabalho realizou um estudo das soluções propostas de implementações do algoritmo Apriori para o Hadoop-MapReduce. Os algoritmos também foram implementados no Spark e foi feito um comparativo entre as implementações de ambos frameworks. Os resultados mostram que as implementações no Spark superam as implementações no Hadoop-MapReduce na maioria das experimentos. Porém, não houve uma implementação única que se sobressaia em todas as situações avaliadas. Também foi implementada no Hadoop-MapReduce e Spark uma alternativa para o problema de classificação de ofertas de produtos de lojas de vendas online de modo a permitir o processamento de grandes volumes de dados em tempo hábil. Os resultados mostram elevada capacidade das adaptações em processar volume de dados maiores. | pt_BR |
dc.publisher.department | Departamento de Ciência da Computação | pt_BR |
dc.subject.cnpq | Análise de Algoritmos e Complexidade de Computação | pt_BR |
dc.creator.Lattes | http://lattes.cnpq.br/3221982681792493 | pt_BR |
Aparece nas coleções: | Ciência da Computação - Mestrado (Dissertações) |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
DISSERTAÇÃO_Implementação de algoritmos de regras de associação nos arcabouços Hadoop-MapReduce e Spark.pdf | 2,74 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.