Use este identificador para citar ou linkar para este item: http://repositorio.ufla.br/jspui/handle/1/45801
Registro completo de metadados
Campo DCValorIdioma
dc.creatorSilva, Douglas Henrique-
dc.date.accessioned2020-12-08T17:15:39Z-
dc.date.available2020-12-08T17:15:39Z-
dc.date.issued2020-12-08-
dc.date.submitted2020-10-05-
dc.identifier.citationSILVA, D. H. Classificação de gêneros e faixas etárias em redes sociais online por meio de técnicas de aprendizagem multidimensional. 2020. 70 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) – Universidade Federal de Lavras, Lavras, 2020.pt_BR
dc.identifier.urihttp://repositorio.ufla.br/jspui/handle/1/45801-
dc.description.abstractDue to the large volume of content generated by users on Online Social Networks (OSN), organizations have applied sentiment analysis or opinion mining techniques to obtain information about people or entities of interest. An entity can be products, services, people, governmental and non-governmental institutions, public policies, among other types. The classification of genders and age groups supports the analysis of sentiment and opinion, as they help to obtain a more precise feeling or opinion. However, information about gender and age-group may be hidden or incorrectly filled out in the OSN. In the literature, several approaches are used in order to classify genders and age groups. However, in this work, a new set of features is used to classify genders, and age groups, through multidimensional learning. Thus, the main objective of this work is to develop a new model of classification of genders and age groups with data extracted from OSN Twitter, using the transformation methods Classifier Chains (CC) and Label Powerset (LP), and through machine learning techniques based on rules, linear algebra, and probability. This study works with a new database containing 8000 instances extracted from Twitter. The best subsets of user profile features are evaluated, as well as multidimensional learning models using different performance metrics. Through the experiments, a multidimensional classification model was obtained in the test phase, with 0.999 of F1 micro-average for genders and 0.923 for age groups. The results of the classification of genders surpassed most of the related works, and the performance of the classification of age groups is quite competitive.pt_BR
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado de Minas Gerais (FAPEMIG)pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Lavraspt_BR
dc.rightsrestrictAccesspt_BR
dc.subjectClassificação de gênerospt_BR
dc.subjectClassificação de faixas etáriaspt_BR
dc.subjectMétodos de transformaçãopt_BR
dc.subjectAprendizagem multidimensionalpt_BR
dc.subjectClassificação multidimensionalpt_BR
dc.subjectRedes sociaispt_BR
dc.subjectGender classificationpt_BR
dc.subjectAge-group classificationpt_BR
dc.subjectTransformation methodspt_BR
dc.subjectMultidimensional learningpt_BR
dc.subjectMultidimensional classificationpt_BR
dc.subjectSocial mediapt_BR
dc.titleClassificação de gêneros e faixas etárias em redes sociais online por meio de técnicas de aprendizagem multidimensionalpt_BR
dc.typedissertaçãopt_BR
dc.publisher.programPrograma de Pós-Graduação em Engenharia de Sistemas e Automaçãopt_BR
dc.publisher.initialsUFLApt_BR
dc.publisher.countrybrasilpt_BR
dc.contributor.advisor1Rodríguez, Demóstenes Zegarra-
dc.contributor.advisor-co1Maziero, Erick Galani-
dc.contributor.advisor-co2Rosa, Renata Lopes-
dc.contributor.referee1Zegarra Rodríguez, Demóstenes-
dc.contributor.referee2Lacerda, Wilian Soares-
dc.contributor.referee3Gertrudes, Jadson Castro-
dc.description.resumoDevido ao grande volume de conteúdo gerado por usuários nas Redes Sociais Online (RSO), as organizações têm aplicado técnicas de análise de sentimento ou de mineração de opinião para obter informações sobre pessoas ou entidades de interesse. Uma entidade pode ser produtos, serviços, pessoas, instituições governamentais e não-governamentais, políticas públicas, entre outros tipos. A classificação de gêneros e faixas etárias dá suporte a análise de sentimento e de opinião, pois auxiliam na obtenção de um sentimento ou uma opinião mais precisa. Entretanto, informações sobre perfis de usuários podem estar ocultas ou preenchidas erroneamente nas RSO. Na literatura, várias abordagens são utilizadas com o intuito de efetuar a classificação de gêneros e faixas etárias. Porém, neste trabalho um novo conjunto de características é utilizado, por meio de uma aprendizagem multidimensional. Assim, o objetivo principal deste trabalho é desenvolver um novo modelo de classificação de gêneros e faixas etárias com dados extraídos da RSO Twitter, usando os métodos de transformação Classifier Chains (CC) e Label Powerset (LP), e através de técnicas de aprendizagem de máquina baseadas em regras, álgebra linear e probabilidade. Este estudo trabalha com uma nova base de dados contendo 8000 instâncias extraídas do Twitter. Os melhores subconjuntos de características de perfis de usuários são avaliados, assim como os modelos de aprendizagem multidimensional utilizando diferentes métricas de desempenho. Por meio dos experimentos, obteve-se um modelo de classificação multidimensional na fase de teste, com 0,999 de micro-média F1 para gêneros e 0,923 para faixas etárias. Os resultados da classificação de gêneros superou a maioria dos trabalhos relacionados, e o desempenho da classificação de faixas etárias é bastante competitivo.pt_BR
dc.publisher.departmentDepartamento de Engenhariapt_BR
dc.subject.cnpqSistemas de Computaçãopt_BR
dc.creator.Latteshttp://lattes.cnpq.br/2975736636373414pt_BR
Aparece nas coleções:Engenharia de Sistemas e automação (Dissertações)



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.