Skip navigation
Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/53202
Arquivos associados a este item:
Arquivo TamanhoFormato 
HenriqueTiberioBrandaoVieiraAugusto_DISSERT.pdf1,36 MBAdobe PDFVisualizar/Abrir
Título: Classificação de intensidade das emoções na fala em português brasileiro por meio de deep learning
Autor(es): Augusto, Henrique Tibério Brandão Vieira
Orientador(es): Rocha Filho, Geraldo Pereira
Assunto: Aprendizado de máquina
Aprendizado profundo
Reconhecimento de emoção na voz
Intensidade da emoção
Português brasileiro
Verbos
Data de publicação: 24-nov-2025
Referência: AUGUSTO, Henrique Tibério Brandão Vieira. Classificação de Intensidade das Emoções na Fala em Português Brasileiro por meio de Deep Learning. 2024. 65 f., il. Dissertação (Mestrado em Informática) — Universidade de Brasília, Brasília, 2024.
Resumo: A fala costuma ser a nossa primeira forma de comunicação e de expressão de emoções. O Reconhecimento de Emoção na Fala é um problema complexo, pois a expressão emocional depende da linguagem falada, do dialeto, do sotaque e do histórico cultural dos indivíduos. A intensidade dessa emoção pode afetar nossa percepção e nos induzir a interpretar a informação de maneira inadequada, havendo perspectiva de aplicabilidade em diversas áreas, como: monitoramento de pacientes, segurança, sistemas comerciais e entretenimento. Este trabalho realizou uma tarefa de Aprendizado de Máquina utilizando Aprendizado Profundo para inferir a intensidade das emoções na voz em português, através da Fusão de Domínios com duas bases de dados distintas. Para tal, foi criado um Autoencoder para realizar a extração de características e, posteriormente, um modelo supervisionado para efetuar a classificação das intensidades entre quatro classes: (i) Fraca; (ii) Moderada; (iii) Alta; (iv) Pico de intensidade. Os resultados indicam a possibilidade de inferir a intensidade, embora o conjunto de dados seja reduzido, mesmo ao combinarmos dois datasets. Foram realizados dois cenários experimentais com arquiteturas análogas, variando apenas a quantidade de características representativas utilizadas como dado de entrada para os modelos. Além disso, observando as métricas de desempenho em ambos experimentos, foi possível notar reincidência da mesma classe (forte) com a menor variação, enquanto as classes mais distantes (fraca e pico) tiveram os melhores desempenhos, o que levanta questionamentos para estudos posteriores.
Abstract: Speech is often our first form of communication and expression of emotions. Speech Emotion Recognition is a complex problem, as emotional expression depends on spoken language, dialect, accent, and the cultural background of individuals. The intensity of this emotion can affect our perception and lead us to interpret information inappropriately, with potential applications in various fields such as: Patient monitoring, security, commercial systems, and entertainment. This work performed a Machine Learning task using Deep Learning to infer the intensity of emotions in Portuguese speech, employing Domain Fusion with two distinct databases. To do so, an Autoencoder was created to extract features, and then a supervised model to classify intensities into four classes: (i) Weak; (ii) Moderate; (iii) High; and (iv) Peak intensity. The results indicate the possibility of inferring intensity, although the final dataset is limited, even when combining two datasets. Two experimental scenarios were carried out, with analogous architectures, varying only the quantity of representative features used as input for the models. Additionally, observing the performance metrics on both experiments, it was possible to note the recurrence of the same class (strong) with the lowest variation while the most distant classes (weak and peak) had the best performance, which raises questions for further studies.
Unidade Acadêmica: Instituto de Ciências Exatas (IE)
Departamento de Ciência da Computação (IE CIC)
Informações adicionais: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação em Informática, 2025.
Programa de pós-graduação: Programa de Pós-Graduação em Informática
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Aparece nas coleções:Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.