http://repositorio.unb.br/handle/10482/52220
Fichier | Description | Taille | Format | |
---|---|---|---|---|
JuliaAlvesLuz_DISSERT.pdf | 4,1 MB | Adobe PDF | Voir/Ouvrir |
Titre: | Fluxos de trabalho em bioinformática para análise de DNA extracromossômico |
Auteur(s): | Luz, Júlia Alves |
Orientador(es):: | Pappas Júnior, Georgios Joannis |
Assunto:: | Bioinformática Cromossomos DNA |
Date de publication: | 9-mai-2025 |
Data de defesa:: | 13-mar-2025 |
Référence bibliographique: | LUZ, Júlia Alves. Fluxos de trabalho em bioinformática para análise de DNA extracromossômico. 2025. 73 f., il. Dissertação (Mestrado em Biologia Molecular) — Universidade de Brasília, Brasília, 2025. |
Résumé: | DNAs circulares extracromossômicos (eccDNAs) são moléculas de DNA circularizadas, nucleares encontradas em todos os organismos eucarióticos investigados até agora. Desde sua descoberta na década de 1960, certas características dos eccDNAs foram esclarecidas; sua replicação independente fora dos cromossomos, variação em tamanho e quantidade e diversidade de conteúdo genético - alguns até abrigam genes codificadores de proteínas e impulsionam a amplificação da expressão. Essas características levaram os eccDNAs a ganharem destaque como potenciais alvos de pesquisa sobre câncer e envelhecimento, devido à sua aparente correlação com a instabilidade genômica. Recentemente, estratégias de sequenciamento de próxima geração foram usadas para caracterizar eccDNAs em diferentes espécies e tipos de células, mas até agora, relativamente poucos programas foram publicados para analisar eccDNAs a partir de dados de sequenciamento. Cada programa é único em termos de requisitos de instalação, parâmetros de execução e formatos de saída, dificultando a usabilidade, a comparação de ferramentas e a interpretação de dados para o usuário final. Nosso objetivo foi desenvolver um pipeline para automatizar a execução de quatro ferramentas diferentes de detecção e processamento de dados de eccDNA sequenciado por leituras-longas (Oxford Nanopore): FLEC, ecc_finder, cyrcular-calling e CReSIL. Utilizamos a linguagem Nextflow para coordenar a execução e o processamento de resultados para cada programa e utilizamos contêineres computacionais para garantir uma instalação simples. Testamos o pipeline usando dados de sequenciamento de nanoporos de amostras de fibroblastos humanos e vesículas extracelulares. Com as configurações padrão, resultados mostraram que o número de eccDNAs previstos variou significativamente entre os programas. Comparações e consolidações adicionais dessas previsões resultaram em um conjunto de eccDNAs consenso para cada amostra, que pode ser usado para anotação e interpretação biológica posterior. Esperamos que o desenvolvimento desta ferramenta facilite o processamento e interpretação de dados relacionados à pesquisa dos eccDNAs por sequenciamento de leituras-longas, ajudando a elucidar mais de suas características e permitir a eventual exploração de seu potencial biotecnológico, terapêutico e diagnóstico, contribuindo assim com a pesquisa sobre eccDNAs. |
Abstract: | Extrachromosomal circular DNAs (eccDNAs) are nuclear, circularised DNA molecules found in all eukaryotic organisms investigated so far. Since their discovery in the 1960s, certain characteristics of eccDNAs have been illuminated; their independent replication outside of chromosomes, variation in size and quantity, and diversity of genetic content - some even harbouring protein coding genes and driving expression amplification. These characteristics have led to eccDNAs gaining the spotlight as potential cancer and ageing research targets, due to their apparent correlation with genomic instability. Next-generation sequencing strategies have recently been used to characterise eccDNAs in different species and cell types, yet so far, relatively few programs have been published to analyse eccDNAs from sequencing data. Each program is unique in terms of installation requirements, execution parameters and output formats, making usability, tool comparison and data interpretation difficult for the final user. Our objective was to develop a pipeline that automates the execution of four different long-read (Oxford Nanopore) eccDNA data detection and processing tools: FLEC, ecc_finder, cyrcular-calling and CReSIL. We utilised the Nextflow domain-specific language to coordinate the execution and processing of results for each program and leveraged computational containers to ensure seamless installation. We tested the pipeline using nanopore sequencing data from human fibroblast and extracellular vesicle samples. Under default settings, preliminary results show the number of predicted eccDNAs varied among the programs. Further comparison and consolidation of these predictions resulted in a consensus set of eccDNAs for each sample, which can be used for annotation and further biological interpretation. We hope the development of this tool will facilitate the installation, validation and reproducibility of long-read eccDNA research data, helping elucidate more of their characteristics and allowing for the eventual exploration of their biotechnological, therapeutic and diagnostic potential, thus contributing to eccDNA research. |
metadata.dc.description.unidade: | Instituto de Ciências Biológicas (IB) Departamento de Biologia Celular (IB CEL) |
Description: | Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Biológicas, Departamento de Biologia Celular, Programa de Pós-Graduação em Biologia Molecular, 2025. |
metadata.dc.description.ppg: | Programa de Pós-Graduação em Biologia Molecular |
Licença:: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
Agência financiadora: | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES). |
Collection(s) : | Teses, dissertações e produtos pós-doutorado |
Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.