http://repositorio.unb.br/handle/10482/51221
Arquivo | Tamanho | Formato | |
---|---|---|---|
LucasSilvaLopes_TESE.pdf | 39,47 MB | Adobe PDF | Visualizar/Abrir |
Título: | Adaptive context modeling and hyperparameter selection in neural-based data compression |
Outros títulos: | Modelagem de contextos adaptativa e seleção de hiperparâmetros em compressão de dados baseada em redes neurais |
Autor(es): | Lopes, Lucas Silva |
Orientador(es): | Queiroz, Ricardo Lopes de |
Assunto: | Codificação aritmética Modelagem de contextos Redes neurais (Computação) Otimização de hiperparâmetros |
Data de publicação: | 18-Dez-2024 |
Data de defesa: | 19-Jul-2024 |
Referência: | LOPES, Lucas Silva. Modelagem de contextos adaptativa e seleção de hiperparâmetros em compressão de dados baseada em redes neurais. 2024. 204 f., il. Tese (Doutorado em Informática) — Universidade de Brasília, Brasília, 2024. |
Resumo: | A compressão de dados baseada em redes neurais ainda não atingiu todo o seu potencial. A modelagem de contexto para codificação aritmética geralmente é feita por meio de contagem de frequência e tabelas de consulta (LUTs, do inglês, “look-up tables”). Esses modelos geralmente são atualizados continuamente à medida que novas amostras são vistas. Todos os modelos de contexto baseados em redes neurais que foram propostos até o momento fazem uso de pré-treinamento. Nós propomos um método de modelagem de contexto baseado em redes neurais para codificação aritmética em que as redes neurais são treinadas dinamicamente. O modelo começa essencialmente como uma distribuição uniforme, e gradualmente se aproxima da verdadeira distribuição de probabilidade dos dados, em vez da distribuição dos dados de treinamento. O método tem melhor desempenho do que a simples contagem de frequências, e permite o aumento do tamanho do contexto para níveis não possíveis com métodos baseados em LUT. Existem métodos caixa-preta de otimização de hiperparâmetros multiobjetivo (MOHPO, do inglês, “multi-objective hyperparameter optimization”) que podem ser usados na compressão de dados baseada em redes neurais. Porém, em compressão de dados, a complexidade do compressor é geralmente tão importante, ou mais, do que seu desempenho de compressão. Propomos um método de otimização de hiperparâmetros multiobjetivo que constrói naturalmente o conjunto de soluções ótimas, ou o casco convexo inferior, em ordem crescente de complexidade. Isso permite que o algoritmo seja interrompido ao se atingir o desempenho de compressão desejado, ou o valor de complexidade máximo aceitável. Comparamos este algoritmo com métodos do estado-da-arte presentes em uma popular plataforma de MOHPO, com o método proposto apresentando resultados competitivos. |
Abstract: | Neural-based data compression has not yet reached its full potential. Context modeling for arithmetic coding is usually done through frequency counting and look-up tables (LUTs). These models are usually continuously updated as new samples are seen. All neuralbased context models which have been proposed so far make use of previous training. We propose a neural-based method of context modeling for arithmetic coding in which the neural networks are trained on-the-fly. The model essentially begins as a uniform distribution, and gradually approaches the true probability distribution of the data, instead of the training data distribution. The method performs better than the simple frequency counting technique, and allows the increase of the context size to levels not possible with LUT-based methods. Black-box multi-objective hyperparameter optimization (MOHPO) methods exist which can be used in neural-based data compression. However, in data compression, the complexity of the compressor is generally as important, or more, than its compression performance. We propose a method of multi-objective hyperparameter optimization which naturally constructs the set of optimal solutions, or the lower-convex hull, in increasing order of complexity. This allows the algorithm to be stopped once the desireable value of compression performance, or the maximal value of acceptable complexity, is achieved. We compared this algorithm with state-of-the-art methods present in a popular MOHPO platform, with the proposed method showing competitive results. |
Unidade Acadêmica: | Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC) |
Informações adicionais: | Tese (Doutorado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2024. |
Programa de pós-graduação: | Programa de Pós-Graduação em Informática |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.