Skip navigation
Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/51979
Arquivos associados a este item:
Arquivo TamanhoFormato 
AlexAlvesBernardes_DISSERT.pdf4,28 MBAdobe PDFVisualizar/Abrir
Título: Abordagens univariáveis e multivariáveis de índices autonômicos cardíacos em modelos preditivos de diabetes tipo 2 : análises com técnicas estatísticas e de aprendizado de máquina
Autor(es): Bernardes, Alex Alves
Orientador(es): Oliveira, Flavia Maria Guerra de Sousa Aranha
Assunto: Processamento de sinais biomédicos
Diabetes mellitus tipo 2
Aprendizado de máquina
Análise estatística
Data de publicação: 18-Mar-2025
Referência: BERNARDES, Alex Alves. Abordagens univariáveis e multivariáveis de índices autonômicos cardíacos em modelos preditivos de diabetes tipo 2: análises com técnicas estatísticas e de aprendizado de máquina. 2024. 109 f. Dissertação (Mestrado em Engenharia Biomédica) — Universidade de Brasília, Brasília, 2024.
Resumo: A Diabetes Mellitus tipo 2 é uma doença metabólica cuja manifestação ocorre com mais regularidade em indivíduos adultos, normalmente associada a fatores como alimentação não saudável e falta de atividade física. Segundo a Organização Mundial de Saúde, sua incidência está em crescimento contínuo em todo o mundo. A Diabetes Mellitus está altamente associada à Neuropatia Autonômica Diabética (NAD), condição caracterizada como inicialmente assintomática nos primeiros anos de diagnóstico de diabetes, mas que afeta significativamente a qualidade de vida e aumenta a mortalidade dos pacientes. Indicadores precoces de NA, mesmo em sujeitos assintomáticos, podem ser utilizados como preditores para o desenvolvimento ou a identificação de diabetes. O Sistema Nervoso Autônomo (SNA), parte do sistema nervoso periférico, regula as ações involuntárias do corpo, como a função cardiovascular. Este controle influencia a frequência cardíaca, causando flutuações de intervalos entre os batimentos, conhecidas como Variabilidade da Frequência Cardíaca (VFC). A VFC também é influenciada pelo ciclo respiratório e pelas variações da pressão arterial. É possível avaliar quantitativamente a ação do SNA sobre a regulação cardíaca por índices quantitativos baseados em sinais fisiológicos, medindo o impacto da disfunção do SNA em indivíduos diabéticos, que podem ou não apresentar sintomas de NAD. Utilizando esta abordagem, o objetivo deste trabalho é determinar índices quantitativos do SNA, utilizando técnicas univariáveis e multivariáveis que consigam diferenciar indivíduos portadores de diabetes tipo 2 (IPDM) e indivíduos de controle (IC). Adicionalmente, deseja-se verificar combinações de índices que consigam realizar a predição de indivíduos diabéticos. Estes índices da função autonômica cardíaca são determinados a partir do processamento e análise de sinais fisiológicos como o eletrocardiograma (ECG), o sinal de pressão arterial contínuo e o sinal respiratório. Inicialmente, o estudo investiga o uso de modelos preditivos utilizando índices de função autonômica determinados a partir de um único sinal fisiológico, como ECG ou pressão arterial contínua. Em seguida, são desenvolvidos modelos preditivos usando índices multivariados, que requerem dados obtidos de pares de sinais fisiológicos, utilizando tanto técnicas espectrais quanto de identificação de sistemas no domínio do tempo como parâmetros para a predição. Os dados para este estudo foram obtidos da base de dados pública “Cerebromicrovascular Disease in Elderly with Diabetes” (CDED). A base é composta por dados de ECG, pressão arterial contínua e fluxo respiratório de indivíduos com idades entre 55 e 75 anos, com e sem diabetes tipo 2. Os dados foram filtrados e préprocessados utilizando a toolbox CRSIDLab no MATLAB para extrair índices da função autonômica cardíaca. Esses índices foram selecionados da literatura e categorizados em três abordagens: 1) índices estatísticos no domínio do tempo, 2) índices espectrais no domínio da frequência e 3) índices de identificação de sistemas nos domínios do tempo e da frequência. As análises univariadas no domínio do tempo fornecem características estatísticas sobre um sinal, como média, desvio padrão ou contagem de eventos de interesse. No domínio espectral, a estimativa da densidade espectral de potência (DEP) dos intervalos R-R (obtidos do ECG) e a série temporal dos valores sistólicos e/ou diastólicos da pressão arterial (respectivamente o pico máximo e o nadir em cada intervalo de batimento cardíaco) fornecem índices quantitativos úteis de função autonômica, baseados na densidade de potência em diferentes regiões de frequência da DEP, e têm sido utilizados em muitos estudos para se avaliar a função autonômica cardíaca em condições de saúde e doença. No entanto, por ser baseada em um único sinal, outras variáveis que podem estar relacionadas às oscilações medidas pela DEP em diferentes regiões de frequência não podem ser consideradas. Para entender mais especificamente como a influência de diferentes sinais fisiológicos, como pressão arterial e respiração, pode causar mudanças em outro sinal, como a VFC, tornase necessária uma abordagem alternativa que descreva explicitamente esse comportamento de causa e efeito temporal. Para superar as limitações inerentes às análises univariadas, são também utilizados modelos de identificação de sistemas no domínio do tempo para caracterizar matematicamente o acoplamento dinâmico entre pares de variáveis cardiovasculares, usando um modelo de resposta ao impulso (RI) causal (no qual a saída presente depende de valores presentes e passados, mas não futuros, da entrada), a partir do qual podem ser obtidos índices adicionais da função autonômica. Todos os índices de função autonômica extraídos foram então analisados usando correlações de Pearson e Spearman, e o método estatístico One-way Anova. As análises de correlação foram aplicadas para verificar a similaridade entre os índices e o grau de influência de um índice sobre outro, enquanto a técnica One-way Anova foi usada para identificar quais índices são capazes de medir uma diferença estatisticamente significativa entre os grupos diabéticos e de controle. Subsequentemente, os índices foram usados como parâmetros em algoritmos de classificação. Os índices foram primeiro usados individualmente e depois em agrupamentos. Diferentes modelos preditivos estatísticos e de aprendizado de máquina foram usados para quantificar seu desempenho na predição de IPDM versus IC. Quatro algoritmos de aprendizado de máquina foram usados neste estudo: 1) Support Vector Machines (SVM), 2) K-Nearest Neighbor (KNN), 3) Árvore de Decisão (DT), e 4) Regressão Logística (RL). Os diferentes modelos preditivos usaram índices que foram agrupados com base em sua origem de sinal e na metodologia de extração utilizada, conforme apresentado no Apêndice B.1. Os agrupamentos de índices resultaram em oito conjuntos: A) VFC - índices estatísticos no domínio do tempo e índices espectrais no domínio da frequência relacionados exclusivamente à VFC; B) VPA - índices espectrais no domínio da frequência da Variabilidade da Pressão Arterial (VPA); C) FRF - combinação de índices de função resposta em frequência obtidos da análise espectral da VFC, VPA e identificação de sistemas por resposta ao impulso (IR); D) IR - índices de identificação de sistemas por resposta ao impulso nos domínios do tempo e da frequência; E) VFC + VPA - a combinação dos índices nos conjuntos A e B; F) VFC + IR - a combinação dos índices nos conjuntos A e D; G) Especial 1 - índices cuja hipótese nula indicou uma possível distinção entre indivíduos diabéticos e de controle com significância estatística; H) Especial 2 - índices que obtiveram alto desempenho na predição de indivíduos diabéticos e de controle, presentes em todos os algoritmos de aprendizado de máquina utilizados. A classificação do conjunto de teste com base em índices individuais mostrou excelentes resultados ao usar índices calculados a partir de modelos multivariados, como os índices de ganho dinâmico associados ao acoplamento cardiorrespiratório (ACR) ou à entrada respiratória do sistema de acoplamento com influência mútua do ACR e do acoplamento barorreflexo (ABR). Seguindo os índices de respiração, os melhores índices para a predição de grupos foram os índices estatísticos da VFC combinados com a VPA, assim como também um modelo preditivo multivariado. Os resultados com agrupamentos de índices também mostraram que o uso de índices relacionados à VFC como parâmetros do modelo pode melhorar a acurácia, sensibilidade e precisão de outros conjuntos de marcadores na classificação e predição de indivíduos diabéticos e de controle. No entanto, o agrupamento de índices relacionados exclusivamente à VFC mostrou um desempenho inferior a modelos de predição multivariados. Os grupos especiais 1 e 2 se sobressaíram como melhores agrupamentos de índices para predição dos grupos de indivíduos estudados, ambos contendo índices estatísticos no domínio do tempo e índices de ganho dinâmico associados ao par VFC e respiração. A variação de desempenho entre os grupos especiais ocorreu de acordo com os algoritmos de aprendizado de máquina utilizados, onde os grupos se alternaram entre os melhores resultados. A exceção ocorreu para o grupo G com desempenho abaixo da média geral quando treinado com o algoritmo de Árvore de Decisão, que foi liderado pelo agrupamento E. Em todos os outros algoritmos os agrupamentos G e H lideraram o desempenho na predição. Ao final, os agrupamentos dos índices especiais mostraram uma pequena melhora na predição dos grupos de indivíduos quando comparados à predição com índices individuais utilizando índices de ganho dinâmico associados à respiração. Tal evento indica uma influência robusta da respiração sobre a VFC do ponto de vista da frequência. Este resultado mostra também a importância da exploração de características dos índices a fim de evitar possíveis conflitos de informação quando utilizados como atributos para o aprendizado de máquina, como é visto nos grupos especiais.
Abstract: Type 2 Diabetes Mellitus is a metabolic disease whose incidence occurs mainly in adults and is continuously growing worldwide. Its symptoms affect the autonomic nervous system (ANS), causing autonomic dysfunctions. Several pieces of evidence indicate that it is possible to predict the presence of the disease through quantitative assessments of autonomic activity on cardiac regulation. This work aims to determine quantitative indices of the ANS, using univariate and multivariate techniques, that can differentiate diabetes mellitus individuals (DMI) and control group (CG) using physiological signals obtained non-invasively such as electrocardiogram (ECG), continuous blood pressure (BP), and respiratory flow (RF). Additionally, using an insightful approach, the goal is to evaluate the effectiveness of different combinations of autonomic indices for use as attributes in machine learning algorithms for predicting DMI and CG. Initially, the study investigates the use of predictive models employing autonomic indices obtained from a single signal in isolation, such as ECG or BP. Subsequently, predictive models are developed using multivariable indices, which require the combination of physiological signals complementary to the ECG, relating them in parametric models where the causality constraint between the signals is imposed. The data for this study were obtained from the public database “Cerebromicrovascular Disease in Elderly with Diabetes”. The dataset consists of ECG, continuous BP, and RF data from individuals aged 55 to 75 years, with and without type 2 diabetes. The groupings of indices were based on the physiological signals of origin and mathematical extraction methodologies. Special groupings were proposed using statistical techniques such as correlation analysis and variance analysis, in addition to machine learning techniques. Four classification algorithms were used: 1) support vector machines (SVM), 2) decision tree (DT), 3) k-nearest neighbor (KNN), and 4) logistic regression (LR). Eight sets were obtained from the groupings of autonomic indices: A) VFC/HRV - indices exclusively related to heart rate variability (HRV); B) VPA/BPV - spectral indices of blood pressure variability (BPV); C) FRF - combination of FRF indices obtained from the spectral analysis of HRV, BPV, and system identification indices by impulse response (IR); D) RI/IR - system identification indices by IR; E) VFC/HRV + VPA/BPV - the combination of indices in sets A and B; F) VFC/HRV + RI/IR - the combination of indices in sets A and D; G) Special 1 – indices selected based on variance analysis results of the indices; H) Special 2 - indices that showed high performance in prediction with individual indices. The metrics from the machine learning models using autonomic indices indicated that the grouping of indices associated with HRV in combination with other groupings of indices tends to increase the accuracy, precision, and sensitivity of the models. However, the grouping of indices associated exclusively with HRV performed worse than the other groupings in predicting diabetic individuals. The groupings of indices called special, G and H, stood out by obtaining the best accuracy and F1-score results among the other groupings in 3 of the AAM used. The SVM algorithm presented the following metrics for grouping G: accuracy (A), precision (P), sensitivity (S), and F1-score (F1): A=80.72%; P=79.47%; S=97.14%; F1=87.26%. While grouping H presented the following results: A=78.78%; P=77.53%; S=94.28%; F1=84.78%. For the KNN algorithm, grouping G presented: A=80.72%; P=80.55%; S=93.80%; F1=86.5%. Grouping H: A=80.60%; P=79.47%; S=94.28%; F1=85.94%. For the LR algorithm, grouping G: A=72.90%; S=88.57%; P=76.36%; F1=81.28%. Grouping H: A=80.60%; P=80.47%; S=91.42%; F1=85.47%. The performance divergence occurred with the DT algorithm, where the performance metrics were led by grouping E, containing univariate indices of HRV and BPV. The metrics for grouping E are: A=78,21%; P=86,66%; S=84,0%; F1=83,32%. Among the individual indices evaluated, multivariate indices associated with the dynamic gain of cardiorespiratory coupling (CRC) presented more robust results, such as the dynamic gain of high-frequency 0.15 - 0.4Hz (HF) from CRC combined with baroreflex mechanism coupling, with A=80.75% and F1=84.89%. The same trend appears in the groupings of indices, where the most indices of groupings G and H are related to the CRC, in combination with univariable indices exclusively associated with HRV. The special groupings, using feature selection, showed a significant improvement in the prediction of DMI and CG compared to groupings of indices purely grouped by signal origin and extraction methodology. The special groupings also showed an improvement in some metrics for predicting individuals compared to using individual indices, but the improvement was less significant.
Unidade Acadêmica: Faculdade de Ciências e Tecnologias em Engenharia (FCTE) – Campus UnB Gama
Programa de pós-graduação: Programa de Pós-Graduação em Engenharia Biomédica
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Aparece nas coleções:Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.