Use este identificador para citar ou linkar para este item: http://repositorio.ufla.br/jspui/handle/1/4873
Registro completo de metadados
Campo DCValorIdioma
dc.creatorFerreira Filho, Diógenes-
dc.date.accessioned2015-01-12T17:41:32Z-
dc.date.available2015-01-12T17:41:32Z-
dc.date.issued2015-01-12-
dc.date.submitted2014-08-14-
dc.identifier.citationFERREIRA FILHO, D. Torneios entre marcadores como forma de enriquecer predições genéticas. 2014. 121 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2014.pt_BR
dc.identifier.urihttp://repositorio.ufla.br/jspui/handle/1/4873-
dc.descriptionTese apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Estatística e Experimentação Agropecuária, área de concentração em Estatística e Experimentação Agropecuária, para a obtenção do título de Doutor.pt_BR
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado de Minas Gerais (FAPEMIG)pt_BR
dc.languagept_BRpt_BR
dc.publisherUNIVERSIDADE FEDERAL DE LAVRASpt_BR
dc.rightsacesso abertopt_BR
dc.subjectTorneiopt_BR
dc.subjectLasso Bayesianopt_BR
dc.subjectGWASpt_BR
dc.subjectGWSpt_BR
dc.subjectSNPspt_BR
dc.subjectTournamentspt_BR
dc.subjectBayesian Lassopt_BR
dc.titleTorneios entre marcadores como forma de enriquecer predições genéticaspt_BR
dc.title.alternativeTournaments between markers as a strategy to enhance genomic predictionspt_BR
dc.typetesept_BR
dc.publisher.programDEX - Programa de Pós-graduaçãopt_BR
dc.publisher.initialsUFLApt_BR
dc.publisher.countryBRASILpt_BR
dc.description.concentrationEstatística e Experimentação Agropecuáriapt_BR
dc.contributor.advisor1Bueno Filho, Júlio Sílvio de Sousa-
dc.contributor.referee1Ferreira, Daniel Furtado-
dc.contributor.referee1Nogueira, Denismar Alves-
dc.contributor.referee1Muniz, Joel Augusto-
dc.contributor.referee1Higa, Roberto Hiroshi-
dc.description.resumoEm estudos de associação genômica ampla (GWAS) e seleção genômica ampla (GWS) há dois problemas metodológicos que limitam a análise estatística: alta dimensionalidade (𝑛≪𝑝) e multicolinearidade. Neste trabalho, foi revisitada uma estratégia de organização de torneios entre amostras aleatórias de marcadores, em que cada amostra tem boas propriedades estatísticas para estimação (𝑛>𝑝). Tais torneios são elaborados de modo a eliminar marcadores mais lentamente, usando regressão linear múltipla, adaptando sugestões anteriores encontradas na literatura. Isto não apenas contorna o problema 𝑛≪𝑝, mas também minimiza associações espúrias. Outra possível melhoria foi investigada, e se baseia em formar os grupos com marcadores tomados de diferentes cromossomos para minimizar a colinearidade dentro de grupos. Foram comparadas as estratégias em ambos os estudos com dados simulados e reais. A simulação foi realizada com genótipos reais, os quais foram, posteriormente, analisados com fenótipos reais. Os dados são provenientes de um estudo de SNPs em gado de corte (384 animais da raça Canchin genotipados para 526.493 SNPs e fenotipados para área de olho de lombo). Foram utilizadas, como critério de comparação, a capacidade de selecionar SNPs próximos do efeito simulado, as capacidades de predição genotípica e fenotípica, e também uma validação cruzada para os dados reais. O Lasso Bayesiano (BL) foi utilizado como referência (estimando os efeitos de todos os marcadores para selecioná-los) e também para obter estimativas dos efeitos dos SNPs selecionados no final dos torneios. Na maioria das situações simuladas os torneios foram igualmente precisos e ligeiramente mais acurados que o BL. No entanto, quando se usou dados reais, os torneios (ambas as estratégias) superaram muito a acurácia de predição obtida pelo BL. Para fins de GWAS, ambas as estratégias de torneios tendem a selecionar os mesmos SNPs, de forma mais consistente que o BL, que tende a selecionar qualquer uma das segregações que representam o mesmo efeito. Reduzir a colinearidade mostrou-se uma boa estratégia, mesmo que posteriormente a análise seja feita com o BL. Entre as estratégias de torneios, a mais simples (grupos formados aleatoriamente) foi a melhor, produzindo o mesmo resultado e, em um tempo que foi uma fração das outras metodologias. Para os dados reais, os resultados são promissores. Ao selecionar 104 SNPs, a correlação entre GBVs preditos e fenótipos alcançou 90,32% no conjunto de validação, mostrando a eficiência dos torneios na identificação de SNPs relevantes (ou segregações) para GWS. O código R para melhores benefícios da estratégia de torneios por meio de programação paralela simples é disponibilizado.pt_BR
dc.description.resumoIn genome-wide association studies (GWAS) and genome-wide selection (GWS) there are two methodological issues that restrict statistical analysis: high dimensionality (𝑛≪𝑝) and multicollinearity. In this work, we revisit an organization strategy of tournaments between random marker samples, in which each sample presents good statistical properties for estimation (𝑛>𝑝). Such tournaments are elaborated in such a way to eliminate markers more slowly, using multiple linear regression, adapting previous suggestions found in literature. This not only circumvents the 𝑛≪𝑝 problem but also minimizes spurious associations. Another possible improvement was investigated, and is based on forming groups with markers taken from different chromosomes to minimize within group collinearity. The strategies were compared in both studies using simulated and real data. The simulation was performed with real genotypes, which were, subsequently, analyzed with real phenotypes. The data are derived from a study with SNPs in beef cattle (384 animals of the Canchim breed, genotyped for 526,493 SNPs and phenotyped for the loin eye area). As comparison criteria, we used the capacity of selecting SNPs near the simulated effect, the genotype and phenotype prediction capabilities, and also an cross validation for the real data. The Bayesian Lasso (BL) was used as reference (estimating the effects of all markers to select them) and also to obtain estimates of the effects of the SNPs selected at the end of the tournaments. In most simulated situations, the tournaments were equally precise and a slightly more accurate than the BL. However, when real data was used, the tournaments (both strategies) far overcomes the prediction accuracy obtained by the BL. For GWAS purposes, both tournament strategies tend to select the same SNPs, and clearly overcomes the BL, which tends to select any of the segregations that represent the same effect. Reducing collinearity showed to be a good strategy, even if later the analysis be performed with the BL. Among the tournament strategies, the simpler (groups randomly formed) was the best overall, producing the same result and, in time that was a fraction of the other methodologies. For real data, the results are promising. When selecting 104 SNPs, the correlation between predicted GBVs and phenotypes reached 90.32% in the validation set, showing the efficiency of the tournaments in identifying relevant SNPs (or segregations) for GWS. The R code for better benefits tournaments strategy by simple parallel programming is available.pt_BR
dc.subject.cnpqCNPQ_NÃO_INFORMADOpt_BR
Aparece nas coleções:Estatística e Experimentação Agropecuária - Doutorado (Teses)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE_Torneios entre marcadores como forma de enriquecer predições genéticas.pdf2,2 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.