| Campo DC | Valor | Idioma |
| dc.contributor.advisor | Rocha Filho, Geraldo Pereira | pt_BR |
| dc.contributor.author | Augusto, Henrique Tibério Brandão Vieira | pt_BR |
| dc.date.accessioned | 2025-11-24T16:52:28Z | - |
| dc.date.available | 2025-11-24T16:52:28Z | - |
| dc.date.issued | 2025-11-24 | - |
| dc.date.submitted | 2024-12-18 | - |
| dc.identifier.citation | AUGUSTO, Henrique Tibério Brandão Vieira. Classificação de Intensidade das Emoções na Fala em Português Brasileiro por meio de Deep Learning. 2024. 65 f., il. Dissertação (Mestrado em Informática) — Universidade de Brasília, Brasília, 2024. | pt_BR |
| dc.identifier.uri | http://repositorio.unb.br/handle/10482/53202 | - |
| dc.description | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação em Informática, 2025. | pt_BR |
| dc.description.abstract | A fala costuma ser a nossa primeira forma de comunicação e de expressão de emoções. O
Reconhecimento de Emoção na Fala é um problema complexo, pois a expressão emocional
depende da linguagem falada, do dialeto, do sotaque e do histórico cultural dos indivíduos.
A intensidade dessa emoção pode afetar nossa percepção e nos induzir a interpretar a informação de maneira inadequada, havendo perspectiva de aplicabilidade em diversas áreas,
como: monitoramento de pacientes, segurança, sistemas comerciais e entretenimento.
Este trabalho realizou uma tarefa de Aprendizado de Máquina utilizando Aprendizado
Profundo para inferir a intensidade das emoções na voz em português, através da Fusão
de Domínios com duas bases de dados distintas. Para tal, foi criado um Autoencoder para
realizar a extração de características e, posteriormente, um modelo supervisionado para
efetuar a classificação das intensidades entre quatro classes: (i) Fraca; (ii) Moderada; (iii)
Alta; (iv) Pico de intensidade. Os resultados indicam a possibilidade de inferir a intensidade, embora o conjunto de dados seja reduzido, mesmo ao combinarmos dois datasets.
Foram realizados dois cenários experimentais com arquiteturas análogas, variando apenas
a quantidade de características representativas utilizadas como dado de entrada para os
modelos. Além disso, observando as métricas de desempenho em ambos experimentos,
foi possível notar reincidência da mesma classe (forte) com a menor variação, enquanto
as classes mais distantes (fraca e pico) tiveram os melhores desempenhos, o que levanta
questionamentos para estudos posteriores. | pt_BR |
| dc.language.iso | por | pt_BR |
| dc.rights | Acesso Aberto | pt_BR |
| dc.title | Classificação de intensidade das emoções na fala em português brasileiro por meio de deep learning | pt_BR |
| dc.type | Dissertação | pt_BR |
| dc.subject.keyword | Aprendizado de máquina | pt_BR |
| dc.subject.keyword | Aprendizado profundo | pt_BR |
| dc.subject.keyword | Reconhecimento de emoção na voz | pt_BR |
| dc.subject.keyword | Intensidade da emoção | pt_BR |
| dc.subject.keyword | Português brasileiro | pt_BR |
| dc.subject.keyword | Verbos | pt_BR |
| dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
| dc.description.abstract1 | Speech is often our first form of communication and expression of emotions. Speech
Emotion Recognition is a complex problem, as emotional expression depends on spoken
language, dialect, accent, and the cultural background of individuals. The intensity of
this emotion can affect our perception and lead us to interpret information inappropriately, with potential applications in various fields such as: Patient monitoring, security,
commercial systems, and entertainment. This work performed a Machine Learning task
using Deep Learning to infer the intensity of emotions in Portuguese speech, employing
Domain Fusion with two distinct databases. To do so, an Autoencoder was created to
extract features, and then a supervised model to classify intensities into four classes: (i)
Weak; (ii) Moderate; (iii) High; and (iv) Peak intensity. The results indicate the possibility of inferring intensity, although the final dataset is limited, even when combining
two datasets. Two experimental scenarios were carried out, with analogous architectures,
varying only the quantity of representative features used as input for the models. Additionally, observing the performance metrics on both experiments, it was possible to note
the recurrence of the same class (strong) with the lowest variation while the most distant classes (weak and peak) had the best performance, which raises questions for further
studies. | pt_BR |
| dc.description.unidade | Instituto de Ciências Exatas (IE) | pt_BR |
| dc.description.unidade | Departamento de Ciência da Computação (IE CIC) | pt_BR |
| dc.description.ppg | Programa de Pós-Graduação em Informática | pt_BR |
| Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|