Please use this identifier to cite or link to this item: http://repositorio.unb.br/handle/10482/23520
Title: Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes
Authors: Soncco Álvarez, José Luis
Orientador(es):: Ayala-Rincón, Mauricio
Assunto:: Algoritmos genéticos
Filogenia
Data de defesa:: 3-Mar-2017
Citation: SONNCO ÁLVAREZ, José Luis. Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes. 2017. x, 93 f., il. Tese (Doutorado em Informática)—Universidade de Brasília, Brasília, 2017.
Abstract: O cálculo de distâncias evolutivas, como as distâncias de reversão e double cut and join, entre a ordem dos genes de dois organismos e um problema combinatório complexo. Este cenário pode ficar ainda mais complicado se quisermos construir árvores filogenéticas, visto que a maioria das abordagens da literatura primeiro solucionam o problema da mediana de três genomas, o qual foi demonstrado ser NP-Difícil para vários modelos evolutivos. Neste trabalho propomos vários algoritmos evolutivos para o problema de ordenação de permutações (sem sinal) por reversões, cuja saída e a distancia de reversão. Estes algoritmos são baseados em um algoritmo genético simples, sobre o qual foram incorporados varias heurísticas como busca local, busca por oposição, e eliminação de pontos de quebra. Experimentos foram realizados usando diferentes dados (permutações) baseados na ordem dos genes, os quais foram gerados artificialmente (de forma aleatória) e também a partir de dados biológicos. Dentre estes algoritmos os que melhores resultados tem para casos práticos, ou seja, permutações de comprimento ate 120, são os chamados AMBO e AMBO-Híbrido. Estes resultados foram validados usando testes estatísticos como Friedman e Holm. Adicionalmente, foi implementado um software para construir arvores filogenéticas chamado de HELPHY, que toma como entrada dados baseados na ordem dos genes (permutações com sinal). Primeiro foi proposto um algoritmo guloso para o problema da pequena filogenia, cujo objetivo e calcular o custo de uma determinada árvore. Logo, para o problema da grande filogenia foi proposta uma abordagem baseada em busca em vizinhança variável, cujo objetivo e explorar o espaço de soluções de estruturas de árvores. Experimentos mostraram que HELPHY conseguiu melhorar o tempo de execução para encontrar árvores com bons escores (distância de reversão) para o dataset Campanulaceae; além disso, uma nova árvore tendo o melhor escore (distância double cut and join) na literatura foi encontrado para o dataset Hemiascomycetes.
???metadata.dc.description.abstract1???: Calculating evolutionary distances, such as the reversal distance or the double cut and join distance, between the gene orders of two organisms is a complex combinatory problem. This scenario can be even more complicated if we want to build phylogenetic trees, since most of the approaches in the literature first solves the median problem for three genomes, which was shown to be NP-Hard for various evolutionary models. In this work, we are proposing several evolutionary algorithms for the problem of sorting (unsigned) permutations by reversals, whose output is the reversal distance. These algorithms are based on a simple genetic algorithm, on which were embedded different heuristics such as local search, opposition-based learning, and elimination of breakpoints. Experiments were performed using different types of data (permutations) based on gene orders which were generated artificially (in a random way) and also from biological data. From these algorithms, the ones with the best results for practical cases, that is, permutations of length up to 120, are called as AMBO and AMBO-Hibrido. These results were validated by applying the Friedman and Holm statistical tests. Moreover, a software called HELPHY for building phylogenetic trees was implemented, which takes as input data based on gene order (signed permutations). First, an greedy algorithm was proposed for the small phylogeny problem, whose aim is to calculate the cost (score) of a given tree structure. Then, an approach based on variable neighborhood search was proposed for the large phylogeny problem, whose aim is to explore the search space of tree structures. Results of the experiments showed that HELPHY improved the execution time for finding good scores (reversal distance) for the dataset Campanulaceae; besides, a new tree structure with the best score (double cut and join distance) in the literature was found for the dataset Hemiascomycetes.
Description: Tese (doutorado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2017.
Licença:: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Appears in Collections:CIC - Doutorado em Informática (Teses)

Files in This Item:
File Description SizeFormat 
2017_JoséLuisSonccoÁlvarez.pdf1.39 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.