Use este identificador para citar ou linkar para este item: http://repositorio.ufla.br/jspui/handle/1/50705
Registro completo de metadados
Campo DCValorIdioma
dc.creatorChaves, Aleson Gleik Silva-
dc.date.accessioned2022-07-25T18:02:47Z-
dc.date.available2022-07-25T18:02:47Z-
dc.date.issued2022-07-25-
dc.date.submitted2022-04-29-
dc.identifier.citationCHAVES, A. G. S. Classificação de produtos utilizando técnicas few-shot learning. 2022. 108 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) – Universidade Federal de Lavras, Lavras, 2022.pt_BR
dc.identifier.urihttp://repositorio.ufla.br/jspui/handle/1/50705-
dc.description.abstractE-commerce platforms (marketplaces) receive daily thousands of products belonging to new classes that have not participated in the training process of the algorithm responsible for automating the classification of products. Retraining with these new classes is a necessity, as incorrect categorization of products in marketplaces can lead consumers to unpleasant experiences in the purchase process. However, it is difficult to constantly update the system with these products, because the cost of retraining the classifiers currently in operation is high due to the large size of the databases. The proposal presented in this work is the use of product classifiers that use few-shot learning algorithms, which are capable of being trained with one or few samples per class. These have rapid training and need a small-scale database. The algorithms tested were: k-nearest neighbors (KNN), Matching Networks (MN) and DPGN (Distribution Propagation Graph Network). The proposed algorithms for product classification use characteristics previously extracted from the transfer learning process, except for encoder matching networks containing a Bi-LSTM network that received data in natural language extracted by embedding algorithms. The algorithms were tested with leave one out and k-fold cross validation. The selection of the best characteristics of the data base was also carried out, making it possible to reduce their dimension, facilitating training of neural networks with few-shot learning. Two databases were used for the tests, one containing 34 classes and 394 samples and the other containing 312 classes and 3120 samples. KNN was used as a baseline for the project and, despite its simplicity and no need for training, it presented satisfactory results. The matching and DPGN networks both presented results with 96.85% accuracy, managing to overcome the KNN using the database with 34 classes and for the database with 312 classes, the best result was obtained by matching with 93.78% accuracy. The proposed approach for classifying products belonging to new classes contributes to the correct categorization and maintenance of the accuracy required in marketplaces, without the need for constant retraining of the classifiers currently in operation. This can bring significant cost reduction of cloud server usage and better shopping experiences for customers.pt_BR
dc.description.sponsorshipOmnilogic Inteligência S/Apt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Lavraspt_BR
dc.rightsacesso abertopt_BR
dc.subjectComércio eletrônicopt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectRedes neurais artificiaispt_BR
dc.subjectFew-Shot learningpt_BR
dc.subjectE-commercept_BR
dc.subjectNatural language processingpt_BR
dc.subjectMachine learningpt_BR
dc.subjectArtificial neural networkspt_BR
dc.titleClassificação de produtos utilizando técnicas few-shot learningpt_BR
dc.title.alternativeProduct classification using few-shot learning techniquespt_BR
dc.typedissertaçãopt_BR
dc.publisher.programPrograma de Pós-Graduação em Engenharia de Sistemas e Automaçãopt_BR
dc.publisher.initialsUFLApt_BR
dc.publisher.countrybrasilpt_BR
dc.contributor.advisor1Barbosa, Bruno Henrique Groenner-
dc.contributor.advisor-co1Ferreira, Danton Diego-
dc.contributor.referee1Zegarra Rodriguez, Demostenes-
dc.contributor.referee2Vitor, Giovani Bernardes-
dc.description.resumoAs plataformas de comércio eletrônico (marketplaces) recebem diariamente milhares de produtos pertencentes a classes novas que não participaram do processo de treinamento do algoritmo responsável por automatizar a classificação de produtos. O retreinamento com estas classes novas é uma necessidade, pois a categorização incorreta de produtos nos marketplaces pode levar o consumidor a experiências desagradáveis no processo de compra. Porém, é difícil a constante atualização do sistema com estes produtos, pois o custo de retreinamento dos classificadores atualmente em operação é elevado devido à grande dimensão das bases de dados. A proposta apresentada neste trabalho é a utilização de classificadores de produtos que utilizam algoritmos do tipo few-shot learning, que são capazes de serem treinados com uma ou com poucas amostras por classes. Estes possuem treinamento rápido e necessitam de base de dados em dimensão reduzida. Os algoritmos testados foram: k-vizinhos mais próximos (KNN), redes Matching Networks (MN) e as redes DPGN (Distribuition Propagation Graph Network). Os algoritmos propostos para classificação de produtos utilizam características previamente extraídas a partir do processo de transfer learning, exceto para as redes matching com encoder contendo uma rede Bi-LSTM que recebe dados em linguagem natural extraídos por algoritmos embeddings. Os algoritmos foram testados com validação cruzada do tipo leave one out e k-fold. Também foi realizada a seleção das melhores características da base, possibilitando a redução de dimensão das mesmas, facilitando treinamento das redes neurais com few-shot learning. Foram utilizadas duas bases de dados para os testes, uma contendo 34 classes e 394 amostras e outra que possui 312 classes e 3120 amostras. O KNN foi utilizado como baseline do projeto e, apesar da simplicidade e não necessidade de treinamento, apresentou resultado satisfatório. As redes matching e DPGN ambas apresentaram resultados com 96,85% de acurácia conseguindo superar o KNN utilizando a base de dados com 34 classes e para a base de dados com 312 classes o melhor resultado foi obtido pelas redes matching com 93,78% de acurácia. A abordagem proposta de classificação de produtos pertencentes a classes novas traz como contribuição a correta categorização e a manutenção da acurácia exigida em marketplaces, sem a necessidade do retreinamento constante dos classificadores atualmente em operação. Isso pode trazer uma redução significativa de custo de uso do servidor em nuvem e melhores experiências de compras para os clientes.pt_BR
dc.publisher.departmentDepartamento de Engenhariapt_BR
dc.subject.cnpqCiência da computaçãopt_BR
dc.creator.Latteshttp://lattes.cnpq.br/3957294116337499pt_BR
Aparece nas coleções:Engenharia de Sistemas e automação (Dissertações)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO_Classificação de produtos utilizando técnicas few-shot learning.pdf2,83 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.