| Campo DC | Valor | Idioma |
| dc.contributor.advisor | Souza, João Gabriel de Moraes | - |
| dc.contributor.author | Junior, Nilson Romero Michiles | - |
| dc.date.accessioned | 2026-06-01T19:11:50Z | - |
| dc.date.available | 2026-06-01T19:11:50Z | - |
| dc.date.issued | 2026-06-01 | - |
| dc.date.submitted | 2025-12-18 | - |
| dc.identifier.citation | JUNIOR, Nilson Romero Michiles. Score de risco para priorização de auditoria em contratos públicos: uma abordagem com inteligência artificial explicável (xai). 2025. 137 f., il. Dissertação (Mestrado profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2025. | pt_BR |
| dc.identifier.uri | http://repositorio.unb.br/handle/10482/54565 | - |
| dc.description | Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação em Computação Aplicada, 2025. | pt_BR |
| dc.description.abstract | A priorização eficiente de auditorias em contratos públicos é fundamental para combater
a corrupção, melhorar a governança e otimizar o uso dos recursos públicos. Este tra balho apresenta uma metodologia inovadora, organizada em um framework que integra
aprendizado de máquina e explicabilidade de inteligência artificial (XAI) para classificar
contratos e fornecedores com maior risco de irregularidades. Foram utilizadas bases públi cas para a construção do dataset, seguidas por etapas de pré-processamento, balancea mento(SMOTE, ADASYN, TOMEK Link e variações), seleção de atributos via LASSO
e ajuste de Hiperparâmetros. Entre os modelos testados, com 177 variações de mod elo e balanceamento treinados, o modelo Ensemble (Tabular Prior-Data Fitted Network
(TabPFN) + XGBoost +LightGBM) obteve o melhor desempenho, com AUC-ROC de
0,86, Recall de 0,767 e F2-Score de 0,631, métrica que mede a eficácia na detecção de em presas com padrão de fraude, porém com maior penalização de falsos negativos — visando
reduzir o risco da auditoria. Para garantir a robustez da escolha, aplicou-se o Model Con fidence Set (MCS) com nível de confiança de 95%, permitindo a comparação e seleção dos
modelos com menor variabilidade estatística (desvio padrão reduzido na métrica Weight
LogLoss ao longo das validações cruzadas). Adicionalmente, foram aplicadas técnicas de
interpretabilidade com valores de Shapley (SHAP), permitindo compreender os fatores
determinantes no cálculo do risco para cada contrato ou fornecedor. Os resultados foram
apresentados em um painel analítico de governança e priorização de auditorias, demon strando que a abordagem proposta pode transformar a auditoria pública ao torná-la mais
estratégica, eficiente, transparente e orientada por dados. | pt_BR |
| dc.language.iso | por | pt_BR |
| dc.rights | Acesso Aberto | pt_BR |
| dc.title | Score de risco para priorização de auditoria em contratos públicos : uma abordagem com inteligência artificial explicável (xai) | pt_BR |
| dc.type | Dissertação | pt_BR |
| dc.subject.keyword | Contratações públicas | pt_BR |
| dc.subject.keyword | Auditoria preditiva | pt_BR |
| dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
| dc.description.abstract1 | Efficient prioritization of audits in public procurement is crucial for combating corruption,
enhancing governance, and optimizing the use of public resources. This work presents an
innovative methodology organized as a framework that integrates Machine Learning (ML)
and Explainable Artificial Intelligence (XAI) to classify contracts and suppliers with a
higher risk of irregularities. Public databases were used to construct the dataset, followed
by preprocessing, balancing (SMOTE, ADASYN, Tomek Links, and variations), feature
selection via LASSO, and hyperparameter tuning steps. Among the 177 trained models
and balancing variations tested, the Ensemble Model (Tabular Prior-Data Fitted Network
(TabPFN) + XGBoost + LightGBM) achieved the best performance, with an AUC-ROC
of 0.86, a recall of 0.767, and an F2-Score of 0.631. The latter metric measures the effec tiveness of detecting companies with fraud patterns while imposing a higher penalty on
false negatives, aiming to reduce audit risk. To ensure the robustness of the selection, the
Model Confidence Set (MCS) procedure was applied with a 95% confidence level, allow ing for the comparison and selection of models with lower statistical variability (reduced
standard deviation in the Weighted LogLoss metric) across cross-validations. Addition ally, interpretability techniques using Shapley values (SHAP) were applied, enabling the
understanding of the determining factors in the risk calculation for each contract or sup plier. The results were presented in an analytical governance and audit prioritization
dashboard, demonstrating that the proposed approach can transform public auditing by
making it more strategic, efficient, transparent, and data-driven. | pt_BR |
| dc.description.unidade | Instituto de Ciências Exatas (IE) | pt_BR |
| dc.description.unidade | Departamento de Ciência da Computação (IE CIC) | pt_BR |
| dc.description.ppg | Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional | pt_BR |
| Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|