Use este identificador para citar ou linkar para este item:
http://repositorio.ufla.br/jspui/handle/1/50705
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.creator | Chaves, Aleson Gleik Silva | - |
dc.date.accessioned | 2022-07-25T18:02:47Z | - |
dc.date.available | 2022-07-25T18:02:47Z | - |
dc.date.issued | 2022-07-25 | - |
dc.date.submitted | 2022-04-29 | - |
dc.identifier.citation | CHAVES, A. G. S. Classificação de produtos utilizando técnicas few-shot learning. 2022. 108 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) – Universidade Federal de Lavras, Lavras, 2022. | pt_BR |
dc.identifier.uri | http://repositorio.ufla.br/jspui/handle/1/50705 | - |
dc.description.abstract | E-commerce platforms (marketplaces) receive daily thousands of products belonging to new classes that have not participated in the training process of the algorithm responsible for automating the classification of products. Retraining with these new classes is a necessity, as incorrect categorization of products in marketplaces can lead consumers to unpleasant experiences in the purchase process. However, it is difficult to constantly update the system with these products, because the cost of retraining the classifiers currently in operation is high due to the large size of the databases. The proposal presented in this work is the use of product classifiers that use few-shot learning algorithms, which are capable of being trained with one or few samples per class. These have rapid training and need a small-scale database. The algorithms tested were: k-nearest neighbors (KNN), Matching Networks (MN) and DPGN (Distribution Propagation Graph Network). The proposed algorithms for product classification use characteristics previously extracted from the transfer learning process, except for encoder matching networks containing a Bi-LSTM network that received data in natural language extracted by embedding algorithms. The algorithms were tested with leave one out and k-fold cross validation. The selection of the best characteristics of the data base was also carried out, making it possible to reduce their dimension, facilitating training of neural networks with few-shot learning. Two databases were used for the tests, one containing 34 classes and 394 samples and the other containing 312 classes and 3120 samples. KNN was used as a baseline for the project and, despite its simplicity and no need for training, it presented satisfactory results. The matching and DPGN networks both presented results with 96.85% accuracy, managing to overcome the KNN using the database with 34 classes and for the database with 312 classes, the best result was obtained by matching with 93.78% accuracy. The proposed approach for classifying products belonging to new classes contributes to the correct categorization and maintenance of the accuracy required in marketplaces, without the need for constant retraining of the classifiers currently in operation. This can bring significant cost reduction of cloud server usage and better shopping experiences for customers. | pt_BR |
dc.description.sponsorship | Omnilogic Inteligência S/A | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Lavras | pt_BR |
dc.rights | acesso aberto | pt_BR |
dc.subject | Comércio eletrônico | pt_BR |
dc.subject | Processamento de linguagem natural | pt_BR |
dc.subject | Aprendizado de máquina | pt_BR |
dc.subject | Redes neurais artificiais | pt_BR |
dc.subject | Few-Shot learning | pt_BR |
dc.subject | E-commerce | pt_BR |
dc.subject | Natural language processing | pt_BR |
dc.subject | Machine learning | pt_BR |
dc.subject | Artificial neural networks | pt_BR |
dc.title | Classificação de produtos utilizando técnicas few-shot learning | pt_BR |
dc.title.alternative | Product classification using few-shot learning techniques | pt_BR |
dc.type | dissertação | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Engenharia de Sistemas e Automação | pt_BR |
dc.publisher.initials | UFLA | pt_BR |
dc.publisher.country | brasil | pt_BR |
dc.contributor.advisor1 | Barbosa, Bruno Henrique Groenner | - |
dc.contributor.advisor-co1 | Ferreira, Danton Diego | - |
dc.contributor.referee1 | Zegarra Rodriguez, Demostenes | - |
dc.contributor.referee2 | Vitor, Giovani Bernardes | - |
dc.description.resumo | As plataformas de comércio eletrônico (marketplaces) recebem diariamente milhares de produtos pertencentes a classes novas que não participaram do processo de treinamento do algoritmo responsável por automatizar a classificação de produtos. O retreinamento com estas classes novas é uma necessidade, pois a categorização incorreta de produtos nos marketplaces pode levar o consumidor a experiências desagradáveis no processo de compra. Porém, é difícil a constante atualização do sistema com estes produtos, pois o custo de retreinamento dos classificadores atualmente em operação é elevado devido à grande dimensão das bases de dados. A proposta apresentada neste trabalho é a utilização de classificadores de produtos que utilizam algoritmos do tipo few-shot learning, que são capazes de serem treinados com uma ou com poucas amostras por classes. Estes possuem treinamento rápido e necessitam de base de dados em dimensão reduzida. Os algoritmos testados foram: k-vizinhos mais próximos (KNN), redes Matching Networks (MN) e as redes DPGN (Distribuition Propagation Graph Network). Os algoritmos propostos para classificação de produtos utilizam características previamente extraídas a partir do processo de transfer learning, exceto para as redes matching com encoder contendo uma rede Bi-LSTM que recebe dados em linguagem natural extraídos por algoritmos embeddings. Os algoritmos foram testados com validação cruzada do tipo leave one out e k-fold. Também foi realizada a seleção das melhores características da base, possibilitando a redução de dimensão das mesmas, facilitando treinamento das redes neurais com few-shot learning. Foram utilizadas duas bases de dados para os testes, uma contendo 34 classes e 394 amostras e outra que possui 312 classes e 3120 amostras. O KNN foi utilizado como baseline do projeto e, apesar da simplicidade e não necessidade de treinamento, apresentou resultado satisfatório. As redes matching e DPGN ambas apresentaram resultados com 96,85% de acurácia conseguindo superar o KNN utilizando a base de dados com 34 classes e para a base de dados com 312 classes o melhor resultado foi obtido pelas redes matching com 93,78% de acurácia. A abordagem proposta de classificação de produtos pertencentes a classes novas traz como contribuição a correta categorização e a manutenção da acurácia exigida em marketplaces, sem a necessidade do retreinamento constante dos classificadores atualmente em operação. Isso pode trazer uma redução significativa de custo de uso do servidor em nuvem e melhores experiências de compras para os clientes. | pt_BR |
dc.publisher.department | Departamento de Engenharia | pt_BR |
dc.subject.cnpq | Ciência da computação | pt_BR |
dc.creator.Lattes | http://lattes.cnpq.br/3957294116337499 | pt_BR |
Aparece nas coleções: | Engenharia de Sistemas e automação (Dissertações) |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
DISSERTAÇÃO_Classificação de produtos utilizando técnicas few-shot learning.pdf | 2,83 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.