Skip navigation
Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/53035
Arquivos associados a este item:
Arquivo TamanhoFormato 
RafaelCamposVieira_DISSERT.pdf90,28 MBAdobe PDFVisualizar/Abrir
Título: Métodos de data science e data analytics para o desenvolvimento de novos fármacos
Autor(es): Vieira, Rafael Campos
Orientador(es): Martins, João Batista Lopes
Coorientador(es): Nascimento, Érica Cristina Moreno
Assunto: Aprendizado de máquina
Desenho de fármacos
Ciência de dados
Canabinoides minoritários
Triagem virtual
Estrutura eletrônica
ADMET
AChE
Data de publicação: 12-nov-2025
Referência: VIEIRA, Rafael Campos. Métodos de Data Science e Data Analytics para o desenvolvimento de novos fármacos. 2025. 108 f., il. Dissertação (Mestrado em Ciências Farmacêuticas) — Universidade de Brasília, Brasília, 2025.
Resumo: Este trabalho investiga a aplicação de algoritmos de machine learning no campo do drug-design, com ênfase na descoberta de novas moléculas candidatas a inibidores da enzima acetilcolinesterase (AChE), um alvo terapêutico relevante na doença de Alzheimer. O estudo utiliza canabinoides e minorcannabinoids como moléculas de partida, com o objetivo não apenas de identificar compostos com potencial terapêutico, mas também de aprimorar o processo de virtual screening por meio de técnicas avançadas de data science. Para isso, foi desenvolvido um banco de dados contendo propriedades físicoquímicas dos compostos, que inclui informações sobre ADMET (Absorção, Distribuição, Metabolismo, Excreção e Toxicidade) e dados derivados de estudos de estrutura eletrônica e docking molecular, utilizando os softwares SwisADME e Gaussian, respectivamente. A metodologia adotada envolveu a aplicação de diversos algoritmos modernos de machine learning, como k-means para clusterização, support vector machines (SVM) para classificação, principal component analysis (PCA) para redução de dimensionalidade, além da construção de modelos de redes neurais para a geração de moléculas, usando o banco de dados ZINC20. Também foram empregadas técnicas de visão computacional para analisar as imagens das interações não covalentes (NCI), a fim de identificar padrões nas propriedades das moléculas. Para avaliar as interações entre os compostos e o sítio ativo da AChE, utilizou-se algoritmos de docking, como AutoDock e Vina, facilitando a triagem de compostos promissores. Além disso, a análise conjunta dos dados de ADMET e estrutura eletrônica, utilizando k-means e PCA, possibilitou a identificação dos parâmetros mais relevantes para a atividade biológica dessas moléculas. Os resultados obtidos sugerem que a combinação de machine learning com docking molecular, análise de propriedades físico-químicas e de estrutura eletrônica, pode ser uma ferramenta poderosa no desenvolvimento de novos fármacos para o tratamento da doença de Alzheimer. O estudo também contribui para a evolução do processo de virtual screening, ao fornecer modelos robustos para a análise de dados relevantes para a atividade biológica e a seleção de moléculas candidatas com maior potencial terapêutico.
Abstract: This work investigates the application of machine learning algorithms in the field of drug design, with an emphasis on the discovery of new candidate molecules as inhibitors of the human acetylcholinesterase enzyme (hAChE), a relevant therapeutic target in the treatment of Alzheimer’s disease. This study aims to use cannabinoids and minor cannabinoids as starting molecules, with the goal not only of identifying compounds with therapeutic potential, but also of improving the virtual screening process through advanced data science techniques. To this end, a database was developed containing physicochemical properties of the compounds, which includes ADMET descriptors (Absorption, Distribution, Metabolism, Excretion, and Toxicity) and electronic structure, using the software SwisADME and Gaussian, respectively. Different modern machine learning algorithms were applied, such as k-means for clustering, support vector machines (SVM) for classification, and principal component analysis (PCA) for dimensionality reduction. Neural network models were structured and applied for the generation of new molecules, using the total content of 310253 molecules, collected from three available molecular databases. To search for and identify significant patterns related to the physicochemical, structural, electronic, and ADMET properties of the studied molecules, computer vision techniques were employed to analyze the images of non-covalent interactions (NCI) and the molecular electrostatic potential (MEP) maps. The interactions of the complexes formed between the active site residues of hAChE and the studied compounds were predicted by means of receptor-ligand interaction simulations, applying the molecular docking technique, using the software AutoDock. The identification of the most relevant parameters for the biological activity of the candidates was obtained through the joint analysis of ADMET and electronic structure data, using the k-means and PCA algorithms. The results obtained suggest that the combination of machine learning with molecular docking, physicochemical property analysis, and electronic structure evaluation has proven to be a powerful tool in the development of new drug candidates for the treatment of Alzheimer’s disease. The study also contributes to the advancement of the virtual screening process by providing robust models for the analysis of data relevant to biological activity and the selection of candidate molecules with greater therapeutic potential. Among the studied molecules, seven stood out, with perrotetineno presenting a profile most similar to the reference ligand donepezil, mimicking cation-pi interactions and exhibiting a similar score of -10.32 kcal/mol.
Unidade Acadêmica: Faculdade de Ciências da Saúde (FS)
Departamento de Farmácia (FS FAR)
Informações adicionais: Dissertação (mestrado)—Universidade de Brasília, Faculdade de Ciências da Saúde, Departamento de Farmácia, Programa de Pós-Graduação em Ciências Farmacêuticas, 2025.
Programa de pós-graduação: Programa de Pós-Graduação em Ciências Farmacêuticas
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Agência financiadora: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) e Fundação de Apoio à Pesquisa do Distrito Federal (FAP/DF).
Aparece nas coleções:Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.