Skip navigation
Veuillez utiliser cette adresse pour citer ce document : http://repositorio.unb.br/handle/10482/53035
Fichier(s) constituant ce document :
Fichier TailleFormat 
RafaelCamposVieira_DISSERT.pdf90,28 MBAdobe PDFVoir/Ouvrir
Affichage complet
Élément Dublin CoreValeurLangue
dc.contributor.advisorMartins, João Batista Lopespt_BR
dc.contributor.authorVieira, Rafael Campospt_BR
dc.date.accessioned2025-11-12T17:30:48Z-
dc.date.available2025-11-12T17:30:48Z-
dc.date.issued2025-11-12-
dc.date.submitted2025-07-23-
dc.identifier.citationVIEIRA, Rafael Campos. Métodos de Data Science e Data Analytics para o desenvolvimento de novos fármacos. 2025. 108 f., il. Dissertação (Mestrado em Ciências Farmacêuticas) — Universidade de Brasília, Brasília, 2025.pt_BR
dc.identifier.urihttp://repositorio.unb.br/handle/10482/53035-
dc.descriptionDissertação (mestrado)—Universidade de Brasília, Faculdade de Ciências da Saúde, Departamento de Farmácia, Programa de Pós-Graduação em Ciências Farmacêuticas, 2025.pt_BR
dc.description.abstractEste trabalho investiga a aplicação de algoritmos de machine learning no campo do drug-design, com ênfase na descoberta de novas moléculas candidatas a inibidores da enzima acetilcolinesterase (AChE), um alvo terapêutico relevante na doença de Alzheimer. O estudo utiliza canabinoides e minorcannabinoids como moléculas de partida, com o objetivo não apenas de identificar compostos com potencial terapêutico, mas também de aprimorar o processo de virtual screening por meio de técnicas avançadas de data science. Para isso, foi desenvolvido um banco de dados contendo propriedades físicoquímicas dos compostos, que inclui informações sobre ADMET (Absorção, Distribuição, Metabolismo, Excreção e Toxicidade) e dados derivados de estudos de estrutura eletrônica e docking molecular, utilizando os softwares SwisADME e Gaussian, respectivamente. A metodologia adotada envolveu a aplicação de diversos algoritmos modernos de machine learning, como k-means para clusterização, support vector machines (SVM) para classificação, principal component analysis (PCA) para redução de dimensionalidade, além da construção de modelos de redes neurais para a geração de moléculas, usando o banco de dados ZINC20. Também foram empregadas técnicas de visão computacional para analisar as imagens das interações não covalentes (NCI), a fim de identificar padrões nas propriedades das moléculas. Para avaliar as interações entre os compostos e o sítio ativo da AChE, utilizou-se algoritmos de docking, como AutoDock e Vina, facilitando a triagem de compostos promissores. Além disso, a análise conjunta dos dados de ADMET e estrutura eletrônica, utilizando k-means e PCA, possibilitou a identificação dos parâmetros mais relevantes para a atividade biológica dessas moléculas. Os resultados obtidos sugerem que a combinação de machine learning com docking molecular, análise de propriedades físico-químicas e de estrutura eletrônica, pode ser uma ferramenta poderosa no desenvolvimento de novos fármacos para o tratamento da doença de Alzheimer. O estudo também contribui para a evolução do processo de virtual screening, ao fornecer modelos robustos para a análise de dados relevantes para a atividade biológica e a seleção de moléculas candidatas com maior potencial terapêutico.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) e Fundação de Apoio à Pesquisa do Distrito Federal (FAP/DF).pt_BR
dc.language.isoporpt_BR
dc.rightsAcesso Abertopt_BR
dc.titleMétodos de data science e data analytics para o desenvolvimento de novos fármacospt_BR
dc.typeDissertaçãopt_BR
dc.subject.keywordAprendizado de máquinapt_BR
dc.subject.keywordDesenho de fármacospt_BR
dc.subject.keywordCiência de dadospt_BR
dc.subject.keywordCanabinoides minoritáriospt_BR
dc.subject.keywordTriagem virtualpt_BR
dc.subject.keywordEstrutura eletrônicapt_BR
dc.subject.keywordADMETpt_BR
dc.subject.keywordAChEpt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.pt_BR
dc.contributor.advisorcoNascimento, Érica Cristina Morenopt_BR
dc.description.abstract1This work investigates the application of machine learning algorithms in the field of drug design, with an emphasis on the discovery of new candidate molecules as inhibitors of the human acetylcholinesterase enzyme (hAChE), a relevant therapeutic target in the treatment of Alzheimer’s disease. This study aims to use cannabinoids and minor cannabinoids as starting molecules, with the goal not only of identifying compounds with therapeutic potential, but also of improving the virtual screening process through advanced data science techniques. To this end, a database was developed containing physicochemical properties of the compounds, which includes ADMET descriptors (Absorption, Distribution, Metabolism, Excretion, and Toxicity) and electronic structure, using the software SwisADME and Gaussian, respectively. Different modern machine learning algorithms were applied, such as k-means for clustering, support vector machines (SVM) for classification, and principal component analysis (PCA) for dimensionality reduction. Neural network models were structured and applied for the generation of new molecules, using the total content of 310253 molecules, collected from three available molecular databases. To search for and identify significant patterns related to the physicochemical, structural, electronic, and ADMET properties of the studied molecules, computer vision techniques were employed to analyze the images of non-covalent interactions (NCI) and the molecular electrostatic potential (MEP) maps. The interactions of the complexes formed between the active site residues of hAChE and the studied compounds were predicted by means of receptor-ligand interaction simulations, applying the molecular docking technique, using the software AutoDock. The identification of the most relevant parameters for the biological activity of the candidates was obtained through the joint analysis of ADMET and electronic structure data, using the k-means and PCA algorithms. The results obtained suggest that the combination of machine learning with molecular docking, physicochemical property analysis, and electronic structure evaluation has proven to be a powerful tool in the development of new drug candidates for the treatment of Alzheimer’s disease. The study also contributes to the advancement of the virtual screening process by providing robust models for the analysis of data relevant to biological activity and the selection of candidate molecules with greater therapeutic potential. Among the studied molecules, seven stood out, with perrotetineno presenting a profile most similar to the reference ligand donepezil, mimicking cation-pi interactions and exhibiting a similar score of -10.32 kcal/mol.pt_BR
dc.description.unidadeFaculdade de Ciências da Saúde (FS)pt_BR
dc.description.unidadeDepartamento de Farmácia (FS FAR)pt_BR
dc.description.ppgPrograma de Pós-Graduação em Ciências Farmacêuticaspt_BR
Collection(s) :Teses, dissertações e produtos pós-doutorado

Affichage abbrégé " class="statisticsLink btn btn-primary" href="/handle/10482/53035/statistics">



Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.