Skip navigation
Veuillez utiliser cette adresse pour citer ce document : http://repositorio.unb.br/handle/10482/51833
Fichier(s) constituant ce document :
Fichier TailleFormat 
SamuelGalvaoElias_TESE.pdf4,86 MBAdobe PDFVoir/Ouvrir
Affichage complet
Élément Dublin CoreValeurLangue
dc.contributor.advisorVale, Helson Mário Martins dopt_BR
dc.contributor.authorElias, Samuel Galvãopt_BR
dc.date.accessioned2025-03-12T19:15:34Z-
dc.date.available2025-03-12T19:15:34Z-
dc.date.issued2025-03-12-
dc.date.submitted2024-08-14-
dc.identifier.citationELIAS, Samuel Galvão. Ampliando o Potencial dos Dados Genômicos: Um Estudo sobre o Enriquecimento de Metadados e a Classificação Filogenética de Sequências Microbianas. 2024. 115 f. Tese (Doutorado em Biologia Microbiana) — Universidade de Brasília, Brasília, 2024.pt_BR
dc.identifier.urihttp://repositorio.unb.br/handle/10482/51833-
dc.description.abstractA presente tese aborda dois desafios cruciais na análise de dados genômicos: a agregação e complementação de metadados e a classificação filogenética de sequências biológicas. Para resolver o primeiro desafio, desenvolvemos o GeneConnector, uma ferramenta que agrega e complementa metadados de registros do GenBank, explorando informações compartilhadas entre diferentes sequências de um mesmo espécime. A aplicação do GeneConnector ao banco de dados GOPHY demonstrou sua eficácia na recuperação de informações valiosas sobre a origem, coleta e processamento das amostras, com ganhos de informação de até 60%. Adicionalmente, introduzimos os scores Observed Completeness Score - OCS e Reachable Completeness Score - RCS para avaliar a completude dos metadados e o potencial de enriquecimento de informações. Para o segundo desafio, desenvolvemos o Classeq, uma ferramenta de classificação de sequências biológicas baseada em posicionamento filogenético, rápida, precisa, independente de alinhamentos múltiplos de sequências e capaz de classificar sequências de genes inteiros. Nossos testes com o Bacillus subtilis group demonstraram a alta sensibilidade e especificidade da ferramenta, classificando corretamente quase todas as sequências do grupo em seus respectivos clados. Adicionalmente, o Classeq oferece uma interface de usuário amigável e uma API para facilitar sua integração em fluxos de trabalho existentes. Em suma, o GeneConnector e o Classeq representam avanços significativos na análise de dados genômicos, com potencial para impulsionar pesquisas em diversas áreas. Ao abordar os desafios de agregação de metadados e classificação filogenética, essas ferramentas oferecem novas perspectivas para a interpretação e utilização de dados genômicos, abrindo caminho para descobertas e aplicações inovadoras.pt_BR
dc.language.isoporpt_BR
dc.rightsAcesso Abertopt_BR
dc.titleAmpliando o potencial dos dados genômicos : um estudo sobre o enriquecimento de metadados e a classificação filogenética de sequências microbianaspt_BR
dc.typeTesept_BR
dc.subject.keywordMicologiapt_BR
dc.subject.keywordFitopatologiapt_BR
dc.subject.keywordFilogeniapt_BR
dc.subject.keywordBacillus subtilispt_BR
dc.subject.keywordGenBankpt_BR
dc.subject.keywordPosicionamento filogenéticopt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.pt_BR
dc.description.abstract1This thesis addresses two crucial challenges in genomic data analysis: metadata aggregation and complementation, and phylogenetic classification of biological sequences. To address the first challenge, we developed GeneConnector, a tool that aggregates and complements metadata from GenBank records by exploiting shared information among different sequences from the same specimen. The application of GeneConnector to the GOPHY database demonstrated its effectiveness in retrieving valuable information about the origin, collection, and processing of samples, with information gains of up to 60%. Additionally, we introduced the OCS (Observed Completeness Score) and RCS (Reachable Completeness Score) to assess metadata completeness and potential for information enrichment. For the second challenge, we developed Classeq, a tool for classifying biological sequences based on phylogenetic placement, which is fast, accurate, independent of multiple sequence alignments, and capable of classifying whole gene sequences. Our tests with the Bacillus subtilis group demonstrated the high sensitivity and specificity of the tool, correctly classifying almost all sequences of the group into their respective clades. Additionally, Classeq offers a user-friendly interface and an API to facilitate its integration into existing workflows. In summary, GeneConnector and Classeq represent significant advances in genomic data analysis, with the potential to drive research in various fields. By addressing the challenges of metadata aggregation and phylogenetic classification, these tools offer new perspectives for interpreting and utilizing genomic data, paving the way for innovative discoveries and applications.pt_BR
dc.description.unidadeInstituto de Ciências Biológicas (IB)pt_BR
dc.description.unidadeDepartamento de Biologia Celular (IB CEL)pt_BR
dc.description.ppgPrograma de Pós-Graduação em Biologia Microbianapt_BR
Collection(s) :Teses, dissertações e produtos pós-doutorado

Affichage abbrégé " class="statisticsLink btn btn-primary" href="/handle/10482/51833/statistics">



Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.