Use este identificador para citar ou linkar para este item: http://repositorio.ufla.br/jspui/handle/1/59313
Registro completo de metadados
Campo DCValorIdioma
dc.creatorBernardes, Danilo Serenini-
dc.date.accessioned2024-09-03T14:01:51Z-
dc.date.available2024-09-03-
dc.date.available2024-09-03T14:01:51Z-
dc.date.issued2024-09-03-
dc.date.submitted2024-03-26-
dc.identifier.citationBERNARDES, Danilo Serenini. Detecção e estimação de distância de marcos visuais por um veículo autônomo a partir de segmentação de imagens com aprendizado profundo e processos Gaussianos. 2024. 66p. Dissertação (Mestrado em Engenharia de Sistemas e Automação)–Universidade Federal de Lavras, Lavras, 2024.pt_BR
dc.identifier.urihttp://repositorio.ufla.br/jspui/handle/1/59313-
dc.description.abstractIn the constantly evolving scenario of technologies for autonomous vehicles implementation, precision in vehicle localization emerges as a significant challenge. The objective of this work is to propose an algorithm that applies distance prediction techniques to estimate the distance between a vehicle equipped with a camera and landmarks in the environment it will be exposed to. For this purpose, computer vision techniques were employed for landmark detection, followed by object segmentation to enhance the algorithm's perception of the environment. For the development of the prediction algorithm, the Python language was chosen, and a real database with approximately 8000 samples collected in the field at the University of Waterloo, through an instrumented autonomous vehicle, was considered. The use of YOLO-v8 network with Object Detection and Segmentation models, DeTr (Detection Transformers) network, and SAM (Segment Anything Model) network were evaluated to provide the input data that were related to distance estimation from deep learning techniques with a GPR (Gaussian Process Regression) model. At the end of the project, the superiority of YOLO-v8 network in the segmentation model when applied to object detection task was observed, with an average Recall of 0.76 and a maP@0.5 of 0.891, highlighting the benefit of using segmentation masks also for object detection. The analysis showed that the combination of YOLO-v8 Segmentation and SAM networks enhances the environment perception with a DICE coefficient of 71.039% and significantly reduces the error in distance prediction, achieving a MAE (Mean Absolute Error) of 0.65 meters. However, this combination resulted in an increase in processing time, standing out as a challenge for real-time application from the perspective of the hardware used. From the results, it is possible to note that the incorporation of segmentation characteristics to the input data substantially improves the performance of the GPR model in distance prediction, highlighting the potential of computer vision techniques in improving the localization and decision-making in autonomous vehicles.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Lavraspt_BR
dc.rightsacesso abertopt_BR
dc.rightsAttribution 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/*
dc.subjectVeículos autônomospt_BR
dc.subjectVisão computacionalpt_BR
dc.subjectDeep learningpt_BR
dc.subjectDetecção de imagenspt_BR
dc.subjectSegmentação de imagenspt_BR
dc.subjectRegressão por processos Gaussianospt_BR
dc.subjectEstimação de distânciapt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectAutonomous vehiclespt_BR
dc.subjectComputer visionpt_BR
dc.subjectImage detectionpt_BR
dc.subjectImage segmentationpt_BR
dc.subjectGaussian process regressionpt_BR
dc.subjectDistance estimationpt_BR
dc.subjectMachine learningpt_BR
dc.titleDetecção e estimação de distância de marcos visuais por um veículo autônomo a partir de segmentação de imagens com aprendizado profundo e processos Gaussianospt_BR
dc.title.alternativeDetection and distance estimation of visual landmarks by an autonomous vehicle using image segmentation with deep learning and Gaussian processespt_BR
dc.typedissertaçãopt_BR
dc.publisher.programDepartamento de Engenhariapt_BR
dc.publisher.initialsUFLApt_BR
dc.publisher.countrybrasilpt_BR
dc.contributor.advisor1Barbosa, Bruno Henrique Groenner-
dc.contributor.referee1Lima, Danilo Alves de-
dc.contributor.referee2Ferreira, Danton Diego-
dc.contributor.referee3Vitor, Giovani Bernardes-
dc.description.resumoNo cenário de evolução constante das tecnologias para a implementação de veículos autônomos, a precisão na localização do veículo emerge como um desafio significativo. O objetivo deste trabalho é propor um algoritmo que aplique técnicas de predição de distâncias para estimar a distância entre o veículo posicionado com uma câmera e marcos no ambiente ao qual ele será submetido. Para isso, foram empregadas técnicas de visão computacional para detecção dos marcos e em seguida foi feita a segmentação dos objetos de forma a incrementar a percepção do algoritmo quanto ao ambiente. Para o desenvolvimento do algoritmo de predição foi escolhida a linguagem Python e foi considerado um banco de dados real com aproximadamente 8000 amostras coletadas em campo na Universidade de Waterloo, por meio de um veículo autônomo instrumentado. A utilização da rede YOLO-v8 nos modelos de Detecção e de Segmentação de objetos, a rede DeTr (Detection Transformers) e a rede SAM (Segment Anything Model) foram avaliadas para fornecer os dados de entrada que foram relacionados a estimação da distância a partir de técnicas de aprendizado de máquinas com o modelo GPR (Gaussian Process Regression). Ao final do projeto, foi observada superioridade da rede YOLO-v8 no modelo de segmentação para a tarefa de detecção de objetos, com um Recall Médio de 0,76 e maP@0,5 de 0,891, evidenciando o benefício do uso das máscaras de segmentação também para detecção de objetos. A análise mostrou que a combinação das redes YOLO-v8 Segmentação e SAM aprimora a percepção do ambiente com um coeficiente DICE de 71,039% e reduz significativamente o erro na predição de distâncias, alcançando um MAE de 0,65 metros. No entanto, essa combinação resultou em um aumento do tempo de processamento, destacando-se como um desafio para a aplicação em tempo real a partir do hardware utilizado. A partir dos resultados, é possível notar que a incorporação de características de segmentação aos dados de entrada melhora substancialmente o desempenho do modelo GPR na predição de distâncias, ressaltando o potencial das técnicas de visão computacional na melhoria da localização e decisão em veículos autônomos.pt_BR
dc.publisher.departmentPrograma de Pós-Graduação em Engenharia de Sistemas e Automaçãopt_BR
dc.subject.cnpqEngenhariapt_BR
dc.creator.Latteshttp://lattes.cnpq.br/5149773499588702pt_BR
Aparece nas coleções:Engenharia de Sistemas e automação (Dissertações)



Este item está licenciada sob uma Licença Creative Commons Creative Commons