Skip navigation
Please use this identifier to cite or link to this item: http://repositorio.unb.br/handle/10482/54560
Files in This Item:
File Description SizeFormat 
JoaoVitorRodriguesBaptista_DISSERT.pdf4,26 MBAdobe PDFView/Open
Title: Graphrag para prontuários eletrônicos : uma abordagem aumentada por grafos para acesso à informação em saúde
Authors: Baptista, Joao Vitor Rodrigues
Orientador(es):: Garcia, Luís Paulo Faina
Assunto:: Registros eletrônicos de saúde
Grafos de conhecimento
Issue Date: 2-Jun-2026
Citation: BAPTISTA, Joao Vitor Rodrigues. Graphrag para prontuários eletrônicos: uma abordagem aumentada por grafos para acesso à informação em saúde. 2026. 92 f. Dissertação (Mestrado profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2026.
Abstract: A crescente importância da saúde digital e a necessidade de uma maior literacia em saúde exigem métodos eficazes para acessar e compreender os Registos Eletrônicos de Saúde (EHRs). Embora os Modelos de Linguagem de Grande Escala (LLMs) se mostrem promissores neste domínio, a Geração Aumentada por Recuperação (RAG) tradicional enfrenta dificuldades em lidar com a natureza complexa e interconectada dos dados clíni cos. A Geração Aumentada por Recuperação baseada em Grafos (GraphRAG) emerge como uma alternativa poderosa, aproveitando grafos de conhecimento (KGs) para cap turar as relações semânticas nos EHRs. Este trabalho avalia a eficácia da expansão de grafos numa arquitetura GraphRAG para melhorar a recuperação de informação a partir de dados médicos formatados em FHIR. Propõem-se uma abordagem de expansão de 1– hop construída sobre uma base de pesquisa por similaridade e lexical que, embora herde algumas limitações da recuperação tradicional baseada em palavras-chave e similaridade, melhora significativamente o acesso dos LLMs a informações contextuais abrangentes e diversificadas. A nossa avaliação, utilizando dados sintéticos de pacientes e um conjunto direcionado de questões em cinco LLMs distintos, revela que a estratégia de expansão de 1– hop supera consistentemente a abordagem base em métricas subjetivas, como abrangência e diversidade, e frequentemente em métricas qualitativas, como a relevância da resposta e do contexto.
Abstract: The growing importance of digital health and the need for greater health literacy demand effective methods for accessing and understanding Electronic Health Records (EHRs). Although Large Language Models (LLMs) show promise in this domain, traditional Retrieval-Augmented Generation (RAG) struggles to handle the complex and intercon nected nature of clinical data. GraphRAG emerges as a powerful alternative, leveraging knowledge graphs (KGs) to capture the semantic relationships within EHRs. This research evaluates the effectiveness of graph expansion in a GraphRAG architecture to improve information retrieval from FHIR-formatted medical data. We propose a 1–hop expansion approach built upon a similarity and lexical search baseline which, while inheriting some limitations of traditional keyword and similarity-based retrieval, significantly improves LLMs’ access to comprehensive and diverse contextual information. Our evaluation, us ing synthetic patient data and a targeted set of questions across five distinct language models, reveals that the 1–hop expansion strategy consistently outperforms the baseline approach in subjective metrics, such as comprehensiveness and diversity, and frequently in qualitative metrics, like answer and contextual relevance.
metadata.dc.description.unidade: Instituto de Ciências Exatas (IE)
Departamento de Ciência da Computação (IE CIC)
Description: Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação em Computação Aplicada, 2026.
metadata.dc.description.ppg: Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional
Licença:: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Appears in Collections:Teses, dissertações e produtos pós-doutorado

Show full item record " class="statisticsLink btn btn-primary" href="/handle/10482/54560/statistics">



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.