Classificação de intensidade das emoções na fala em português brasileiro por meio de deep learning

Augusto, Henrique Tibério Brandão Vieira

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor	Rocha Filho, Geraldo Pereira	pt_BR
dc.contributor.author	Augusto, Henrique Tibério Brandão Vieira	pt_BR
dc.date.accessioned	2025-11-24T16:52:28Z	-
dc.date.available	2025-11-24T16:52:28Z	-
dc.date.issued	2025-11-24	-
dc.date.submitted	2024-12-18	-
dc.identifier.citation	AUGUSTO, Henrique Tibério Brandão Vieira. Classificação de Intensidade das Emoções na Fala em Português Brasileiro por meio de Deep Learning. 2024. 65 f., il. Dissertação (Mestrado em Informática) — Universidade de Brasília, Brasília, 2024.	pt_BR
dc.identifier.uri	http://repositorio.unb.br/handle/10482/53202	-
dc.description	Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação em Informática, 2025.	pt_BR
dc.description.abstract	A fala costuma ser a nossa primeira forma de comunicação e de expressão de emoções. O Reconhecimento de Emoção na Fala é um problema complexo, pois a expressão emocional depende da linguagem falada, do dialeto, do sotaque e do histórico cultural dos indivíduos. A intensidade dessa emoção pode afetar nossa percepção e nos induzir a interpretar a informação de maneira inadequada, havendo perspectiva de aplicabilidade em diversas áreas, como: monitoramento de pacientes, segurança, sistemas comerciais e entretenimento. Este trabalho realizou uma tarefa de Aprendizado de Máquina utilizando Aprendizado Profundo para inferir a intensidade das emoções na voz em português, através da Fusão de Domínios com duas bases de dados distintas. Para tal, foi criado um Autoencoder para realizar a extração de características e, posteriormente, um modelo supervisionado para efetuar a classificação das intensidades entre quatro classes: (i) Fraca; (ii) Moderada; (iii) Alta; (iv) Pico de intensidade. Os resultados indicam a possibilidade de inferir a intensidade, embora o conjunto de dados seja reduzido, mesmo ao combinarmos dois datasets. Foram realizados dois cenários experimentais com arquiteturas análogas, variando apenas a quantidade de características representativas utilizadas como dado de entrada para os modelos. Além disso, observando as métricas de desempenho em ambos experimentos, foi possível notar reincidência da mesma classe (forte) com a menor variação, enquanto as classes mais distantes (fraca e pico) tiveram os melhores desempenhos, o que levanta questionamentos para estudos posteriores.	pt_BR
dc.language.iso	por	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.title	Classificação de intensidade das emoções na fala em português brasileiro por meio de deep learning	pt_BR
dc.type	Dissertação	pt_BR
dc.subject.keyword	Aprendizado de máquina	pt_BR
dc.subject.keyword	Aprendizado profundo	pt_BR
dc.subject.keyword	Reconhecimento de emoção na voz	pt_BR
dc.subject.keyword	Intensidade da emoção	pt_BR
dc.subject.keyword	Português brasileiro	pt_BR
dc.subject.keyword	Verbos	pt_BR
dc.rights.license	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.	pt_BR
dc.description.abstract1	Speech is often our first form of communication and expression of emotions. Speech Emotion Recognition is a complex problem, as emotional expression depends on spoken language, dialect, accent, and the cultural background of individuals. The intensity of this emotion can affect our perception and lead us to interpret information inappropriately, with potential applications in various fields such as: Patient monitoring, security, commercial systems, and entertainment. This work performed a Machine Learning task using Deep Learning to infer the intensity of emotions in Portuguese speech, employing Domain Fusion with two distinct databases. To do so, an Autoencoder was created to extract features, and then a supervised model to classify intensities into four classes: (i) Weak; (ii) Moderate; (iii) High; and (iv) Peak intensity. The results indicate the possibility of inferring intensity, although the final dataset is limited, even when combining two datasets. Two experimental scenarios were carried out, with analogous architectures, varying only the quantity of representative features used as input for the models. Additionally, observing the performance metrics on both experiments, it was possible to note the recurrence of the same class (strong) with the lowest variation while the most distant classes (weak and peak) had the best performance, which raises questions for further studies.	pt_BR
dc.description.unidade	Instituto de Ciências Exatas (IE)	pt_BR
dc.description.unidade	Departamento de Ciência da Computação (IE CIC)	pt_BR
dc.description.ppg	Programa de Pós-Graduação em Informática	pt_BR
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado