Saliency-driven dynamic point cloud coding using projections onto images

Figueiredo, Victor Fabre

Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/42027

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2021_VictorFabreFigueiredo.pdf		37,4 MB	Adobe PDF	Visualizar/Abrir

Título:	Saliency-driven dynamic point cloud coding using projections onto images
Autor(es):	Figueiredo, Victor Fabre
E-mail do autor:	fabre@ieee.org
Orientador(es):	Queiroz, Ricardo Lopes de
Assunto:	Nuvem de pontos Mapa de saliência Região de interesse
Data de publicação:	3-Set-2021
Data de defesa:	25-Jun-2021
Referência:	FIGUEIREDO, Victor Fabre. Saliency-driven dynamic point cloud coding using projections onto images. 2021. 58 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2021.Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2021.
Resumo:	As regiões de interesse (ROI) têm sido utilizadas na codicação tradicional de imagens e vídeos para melhorar a qualidade do quadro em certas regiões, como rostos, em detrimento de outras áreas. No entanto, a ROI na compressão de nuvens de pontos não foi amplamente abordada, as- sim como a criação de mapas de saliência. Ambos os pontos são abordados neste trabalho. É difícil identicar diretamente atributos como rostos em nuvens de pontos esparsas e foi desenvolvido um método alternativo para o fazer. São utilizadas projeções ortográcas em planos 2D que são sub- metidas a algoritmos de visão computacional bem conhecidos. Uma vez identicada uma região de interesse, os seus pixels são retroprojetados nos voxels correspondentes. Ao repetir as projeções ao longo de muitas vistas, a informação de múltiplas projeções é agregada para formar um conjunto de voxels que se acredita conter a ROI ou serem os com maior valor de saliência. Como método não supervisionado, foi concebido um algoritmo para procurar as melhores vistas para projeções, utilizando informação de consistência temporal que é herdada de um quadro para outro. Foram utilizados algoritmos de detecção facial, tais como Viola-Jones, para determinar a ROI 2D e foram também utilizados algoritmos de criação de mapas de saliências bem estabelecidos para imagens bidimensionais. A m de utilizar a ROI para compressão, foi desenvolvida uma estratégia de codi- cação baseada num critério de distorção modicada que pode ser aplicado a muitos codicadores e é naturalmente aplicável ao codicador que utiliza a transformação hierárquica por região adap- tável (RAHT). Na sua essência, os bits (e a qualidade) são deslocados para a ROI a partir de áreas não-ROI, assumindo que as partes não-ROI são visualmente menos importantes e têm valores de saliência inferiores. Os resultados revelam uma grande melhoria subjetiva global ao melhorar con- sideravelmente o ROI à custa de uma pequena degradação das regiões de menor saliência.
Abstract:	Regions of interest (ROI) have been used in traditional image and video coding to improve im- age quality in certain regions, like faces, at the expense of other areas. Nevertheless, ROI in point cloud compression have not been properly addressed, nor has the creation of saliency maps. Both points are addressed in this work. It is hard to directly identify features such as faces in unconnected point clouds and an alternative method to do so was developed. Orthographic projections in 2D planes which are subject to well established computer vision algorithms are used. Once an image region is identied, their pixels are back-projected onto the corresponding voxels. By repeating the projections over many orientations, the information of the many back projections is fused to form a collection of voxels believed to contain the ROI or to be the most salient. As an unsupervised method, it was devised an algorithm to search the projection orientations for the best views, which include temporal consistency information which is inherited from one frame to another. Face de- tection algorithms, such as Viola-Jones, were used to determine the 2D ROI and well established saliency map creation algorithms were also used in the 2D image case. In order to use ROI for com- pression, it was developed an encoding strategy based on a modied distortion criterion that can be applied to many coders and is naturally applicable to the region-adaptive hierarchical transform (RAHT) based coder, which is being adapted into compression standards. In essence, bits (and quality) are shifted towards the ROI from non-ROI areas, assuming non-ROI parts are visually less important and have lower salience values. Results reveal large overall subjective improvement by greatly improving the ROI at the expense of a small degradation of textured regions of lower salience.
Unidade Acadêmica:	Faculdade de Tecnologia (FT) Departamento de Engenharia Elétrica (FT ENE)
Informações adicionais:	Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2021.
Programa de pós-graduação:	Programa de Pós-Graduação em Engenharia Elétrica
Licença:	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Agência financiadora:	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas