| Campo DC | Valor | Idioma |
| dc.contributor.advisor | Nascimento, Francisco Assis de Oliveira | - |
| dc.contributor.author | Sampaio, José Fabrizio Pereira | - |
| dc.date.accessioned | 2025-10-29T21:00:06Z | - |
| dc.date.available | 2025-10-29T21:00:06Z | - |
| dc.date.issued | 2025-10-29 | - |
| dc.date.submitted | 2020-12-11 | - |
| dc.identifier.citation | SAMPAIO, José Fabrizio Pereira. Detecção de compressão dupla AMR usando características de voz no domínio da compressão. 2020. 132 f., il. Tese (Doutorado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2020. | pt_BR |
| dc.identifier.uri | http://repositorio.unb.br/handle/10482/52989 | - |
| dc.description | Tese (doutorado) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, Programa de Pós-Graduação em Engenharia Elétrica, 2020. | pt_BR |
| dc.description.abstract | O codec AMR (adaptive multirate) é um padrão para compressão de sinal de voz na rede
móvel celular e também para armazenar áudio como um formato de arquivo com extensão
AMR em gravadores digitais e smartphones. O fácil acesso a programas para adulterar
arquivos AMR elevou a demanda por exames de autenticação de áudio nos processos
judiciais. Um dos procedimentos de triagem mais úteis é a detecção de compressão dupla,
pois, em termos gerais, um arquivo duplamente comprimido é incompatível com um
arquivo original. Nesta tese, um novo método baseado em máquina de vetor suporte
(SVM) é proposto para detectar arquivos AMR duplamente comprimidos usando apenas
características (features) no domínio da compressão, em contraste com os métodos
existentes que usam a forma de onda descomprimida. Parâmetros específicos do áudio
codificado são extraídos por desempacotamento, como os coeficientes de predição linear, e
então usados para computar um conjunto de características estatísticas. Para melhorar o
desempenho da SVM, um procedimento robusto é usado para escalonar as características.
A seleção do modelo SVM consiste em uma busca em grade seguida por um algoritmo
recursivo de eliminação de características com redução de polarização de correlação para
determinar o melhor número de características que maximiza a acurácia de validação
cruzada. A organização dos experimentos foi implementada usando o corpus de voz
TIMIT, permitindo comparar o método proposto com o estado da arte, revelando que ele
supera os métodos publicados. Uma análise de robustez exaustiva também foi feita para
quatro condições adversas: um corpus diferente (em português brasileiro), arquivos com
duração variável, ataque de descolamento de quadro (frame offset) e adição de ruído. Tais
experimentos demonstram que o método proposto é robusto, assim como apresenta alto
desempenho para arquivos de áudio AMR contaminados por ruído. | pt_BR |
| dc.language.iso | por | pt_BR |
| dc.rights | Acesso Aberto | pt_BR |
| dc.title | Detecção de compressão dupla AMR usando características de voz no domínio da compressão | pt_BR |
| dc.title.alternative | Detection of AMR double compression using compresseddomain speech features | pt_BR |
| dc.type | Tese | pt_BR |
| dc.subject.keyword | Codificador AMR | pt_BR |
| dc.subject.keyword | Áudio forense | pt_BR |
| dc.subject.keyword | Compressão dupla | pt_BR |
| dc.subject.keyword | Domínio da compressão | pt_BR |
| dc.subject.keyword | Escalonamento robusto | pt_BR |
| dc.subject.keyword | Seleção de características | pt_BR |
| dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
| dc.description.abstract1 | The adaptive multi-rate (AMR) codec is a speech signal compression standard designed for
mobile networks and to store audio as AMR extension file format in digital recorders and
smartphones. Easy access to software to tamper with AMR files has increased audio
authentication demand in court trials. One of the most useful screening procedures is the
double compression detection because, in general terms, a double compressed file is
incompatible with an original audio file. In this thesis, a new method based on support
vector machine (SVM) is proposed to detect double compressed AMR audio files by using
only compressed-domain speech features, in contrast to existing methods which use
decompressed waveform. Specific parameters from encoded audio are extracted by
unpacking, like linear prediction coefficients, and then used to compute a set of statistical
features. To improve SVM performance, a robust scaling procedure is used to scale
features. The SVM model selection consists of a grid search followed by a recursive
feature elimination with correlation bias reduction algorithm to determine the best number
of features that maximizes cross-validation accuracy. The experimental setup was
implemented using the TIMIT speech corpus to compare the proposed method with stateof-the-art, revealing that it outperforms the published methods. An extensive robust
analysis was performed for four different adverse conditions: different corpus (in Brazilian
Portuguese), variable duration files, frame offset attack and noise addition. Such
experiments show that the proposed method is robust, as well as presents high performance
for noise contaminated AMR audio files. | pt_BR |
| dc.description.unidade | Faculdade de Tecnologia (FT) | pt_BR |
| dc.description.unidade | Departamento de Engenharia Elétrica (FT ENE) | pt_BR |
| dc.description.ppg | Programa de Pós-Graduação em Engenharia Elétrica | pt_BR |
| Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|