Score de risco para priorização de auditoria em contratos públicos : uma abordagem com inteligência artificial explicável (xai)

Junior, Nilson Romero Michiles

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor	Souza, João Gabriel de Moraes	-
dc.contributor.author	Junior, Nilson Romero Michiles	-
dc.date.accessioned	2026-06-01T19:11:50Z	-
dc.date.available	2026-06-01T19:11:50Z	-
dc.date.issued	2026-06-01	-
dc.date.submitted	2025-12-18	-
dc.identifier.citation	JUNIOR, Nilson Romero Michiles. Score de risco para priorização de auditoria em contratos públicos: uma abordagem com inteligência artificial explicável (xai). 2025. 137 f., il. Dissertação (Mestrado profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2025.	pt_BR
dc.identifier.uri	http://repositorio.unb.br/handle/10482/54565	-
dc.description	Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação em Computação Aplicada, 2025.	pt_BR
dc.description.abstract	A priorização eficiente de auditorias em contratos públicos é fundamental para combater a corrupção, melhorar a governança e otimizar o uso dos recursos públicos. Este tra balho apresenta uma metodologia inovadora, organizada em um framework que integra aprendizado de máquina e explicabilidade de inteligência artificial (XAI) para classificar contratos e fornecedores com maior risco de irregularidades. Foram utilizadas bases públi cas para a construção do dataset, seguidas por etapas de pré-processamento, balancea mento(SMOTE, ADASYN, TOMEK Link e variações), seleção de atributos via LASSO e ajuste de Hiperparâmetros. Entre os modelos testados, com 177 variações de mod elo e balanceamento treinados, o modelo Ensemble (Tabular Prior-Data Fitted Network (TabPFN) + XGBoost +LightGBM) obteve o melhor desempenho, com AUC-ROC de 0,86, Recall de 0,767 e F2-Score de 0,631, métrica que mede a eficácia na detecção de em presas com padrão de fraude, porém com maior penalização de falsos negativos — visando reduzir o risco da auditoria. Para garantir a robustez da escolha, aplicou-se o Model Con fidence Set (MCS) com nível de confiança de 95%, permitindo a comparação e seleção dos modelos com menor variabilidade estatística (desvio padrão reduzido na métrica Weight LogLoss ao longo das validações cruzadas). Adicionalmente, foram aplicadas técnicas de interpretabilidade com valores de Shapley (SHAP), permitindo compreender os fatores determinantes no cálculo do risco para cada contrato ou fornecedor. Os resultados foram apresentados em um painel analítico de governança e priorização de auditorias, demon strando que a abordagem proposta pode transformar a auditoria pública ao torná-la mais estratégica, eficiente, transparente e orientada por dados.	pt_BR
dc.language.iso	por	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.title	Score de risco para priorização de auditoria em contratos públicos : uma abordagem com inteligência artificial explicável (xai)	pt_BR
dc.type	Dissertação	pt_BR
dc.subject.keyword	Contratações públicas	pt_BR
dc.subject.keyword	Auditoria preditiva	pt_BR
dc.rights.license	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.	pt_BR
dc.description.abstract1	Efficient prioritization of audits in public procurement is crucial for combating corruption, enhancing governance, and optimizing the use of public resources. This work presents an innovative methodology organized as a framework that integrates Machine Learning (ML) and Explainable Artificial Intelligence (XAI) to classify contracts and suppliers with a higher risk of irregularities. Public databases were used to construct the dataset, followed by preprocessing, balancing (SMOTE, ADASYN, Tomek Links, and variations), feature selection via LASSO, and hyperparameter tuning steps. Among the 177 trained models and balancing variations tested, the Ensemble Model (Tabular Prior-Data Fitted Network (TabPFN) + XGBoost + LightGBM) achieved the best performance, with an AUC-ROC of 0.86, a recall of 0.767, and an F2-Score of 0.631. The latter metric measures the effec tiveness of detecting companies with fraud patterns while imposing a higher penalty on false negatives, aiming to reduce audit risk. To ensure the robustness of the selection, the Model Confidence Set (MCS) procedure was applied with a 95% confidence level, allow ing for the comparison and selection of models with lower statistical variability (reduced standard deviation in the Weighted LogLoss metric) across cross-validations. Addition ally, interpretability techniques using Shapley values (SHAP) were applied, enabling the understanding of the determining factors in the risk calculation for each contract or sup plier. The results were presented in an analytical governance and audit prioritization dashboard, demonstrating that the proposed approach can transform public auditing by making it more strategic, efficient, transparent, and data-driven.	pt_BR
dc.description.unidade	Instituto de Ciências Exatas (IE)	pt_BR
dc.description.unidade	Departamento de Ciência da Computação (IE CIC)	pt_BR
dc.description.ppg	Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional	pt_BR
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado