Geminivirus data warehouse: a database enriched with machine learning approaches

Silva, Jose Cleydson F.; Carvalho, Thales F. M.; Basso, Marcos F.; Deguchi, Michihito; Pereira, Welison A.; R. Sobrinho, Roberto; Vidigal, Pedro M. P.; Brustolini, Otávio J. B.; Silva, Fabyano F.; Dal-Bianco, Maximiller; Fontes, Renildes L. F.; Santos, Anésia A.; Zerbini, Francisco Murilo; Cerqueira, Fabio R.; Fontes, Elizabeth P. B.

Use este identificador para citar ou linkar para este item: http://repositorio.ufla.br/jspui/handle/1/32708

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Silva, Jose Cleydson F.	-
dc.creator	Carvalho, Thales F. M.	-
dc.creator	Basso, Marcos F.	-
dc.creator	Deguchi, Michihito	-
dc.creator	Pereira, Welison A.	-
dc.creator	R. Sobrinho, Roberto	-
dc.creator	Vidigal, Pedro M. P.	-
dc.creator	Brustolini, Otávio J. B.	-
dc.creator	Silva, Fabyano F.	-
dc.creator	Dal-Bianco, Maximiller	-
dc.creator	Fontes, Renildes L. F.	-
dc.creator	Santos, Anésia A.	-
dc.creator	Zerbini, Francisco Murilo	-
dc.creator	Cerqueira, Fabio R.	-
dc.creator	Fontes, Elizabeth P. B.	-
dc.date.accessioned	2019-02-01T19:59:20Z	-
dc.date.available	2019-02-01T19:59:20Z	-
dc.date.issued	2017-05-05	-
dc.identifier.citation	SILVA, J. C. F. et al. Geminivirus data warehouse: a database enriched with machine learning approaches. BMC Bioinformatics, [S.l.], v. 18, p. 1-11, 2017.	pt_BR
dc.identifier.uri	http://repositorio.ufla.br/jspui/handle/1/32708	-
dc.description.abstract	Background: the Geminiviridae family encompasses a group of single-stranded DNA viruses with twinned and quasi-isometric virions, which infect a wide range of dicotyledonous and monocotyledonous plants and are responsible for significant economic losses worldwide. Geminiviruses are divided into nine genera, according to their insect vector, host range, genome organization, and phylogeny reconstruction. Using rolling-circle amplification approaches along with high-throughput sequencing technologies, thousands of full-length geminivirus and satellite genome sequences were amplified and have become available in public databases. As a consequence, many important challenges have emerged, namely, how to classify, store, and analyze massive datasets as well as how to extract information or new knowledge. Data mining approaches, mainly supported by machine learning (ML) techniques, are a natural means for high-throughput data analysis in the context of genomics, transcriptomics, proteomics, and metabolomics. Results: here, we describe the development of a data warehouse enriched with ML approaches, designated geminivirus.org. We implemented search modules, bioinformatics tools, and ML methods to retrieve high precision information, demarcate species, and create classifiers for genera and open reading frames (ORFs) of geminivirus genomes. Conclusions: the use of data mining techniques such as ETL (Extract, Transform, Load) to feed our database, as well as algorithms based on machine learning for knowledge extraction, allowed us to obtain a database with quality data and suitable tools for bioinformatics analysis. The Geminivirus Data Warehouse (geminivirus.org) offers a simple and user-friendly environment for information retrieval and knowledge discovery related to geminiviruses.	pt_BR
dc.language	en_US	pt_BR
dc.publisher	Springer	pt_BR
dc.rights	Attribution 4.0 International	*
dc.rights	acesso aberto	pt_BR
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/	*
dc.source	BMC Bioinformatics	pt_BR
dc.subject	Machine learning	pt_BR
dc.subject	Random forest	pt_BR
dc.subject	Knowledge Discovery in Databases (KDD)	pt_BR
dc.subject	Data mining	pt_BR
dc.subject	Data warehouse	pt_BR
dc.subject	Geminivirus	pt_BR
dc.title	Geminivirus data warehouse: a database enriched with machine learning approaches	pt_BR
dc.type	Artigo	pt_BR
Aparece nas coleções:	DBI - Artigos publicados em periódicos

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
ARTIGO_Geminivirus data warehouse - a database.pdf		1,29 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons