Skip navigation
Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/33095
Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2018_JoãoBachiegaJunior.pdf1,45 MBAdobe PDFVisualizar/Abrir
Título: Otimização no custo para processamento de Big GeoSpatial Data em ambiente de nuvem computacional
Autor(es): Bachiega Junior, João
Orientador(es): Araújo, Aletéia Patrícia Favacho de
Coorientador(es): Holanda, Maristela Terto de
Assunto: Computação em nuvem
Dados geográficos
Base de dados
Data de publicação: 27-Nov-2018
Referência: BACHIEGA JUNIOR, João. Otimização no custo para processamento de Big GeoSpatial Data em ambiente de nuvem computacional. 2018. xi, 55 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2018.
Resumo: Os dados geográficos representam abstrações de entidades do Mundo real e podem ser obtidos de diversas formas. Além disso, eles possuem algumas propriedades que os diferenciam dos demais tipos de dados, tais como a estrutura complexa, a dinamicidade e o volume. Nos últimos anos, com o crescimento do volume dos dados geográficos, conceituado como big geospatial data, algumas ferramentas foram desenvolvidas para possibilitar o processamento eficiente desses dados, entre elas o SpatialHadoop, que é um framework incorporado ao Hadoop. A utilização da indexação correta dos dados baseado no conjunto de dados a ser processado, e também nas consultas e nas operações a serem realizadas é fundamental para que estas aplicações tenham o melhor desempenho. Por outro lado, como a tarifação em provedores públicos de computação em nuvem ocorre de acordo com o uso, é importante otimizar a execução das aplicações para evitar desperdício financeiro. Assim, este trabalho propõe a construção de uma Base de Conhecimento e de um Mecanismo de Inferência que buscam a otimização dos custos para o processamento de big geospatial data em provedores públicos de nuvem. Além disso, é apresentada uma compara ção entre os serviços oferecidos pelos três principais provedores de nuvem pública para o processamento de grande volume de dados. Os testes executados demonstraram que a utilização das regras geradas pelo Mecanismo de Inferência e a escolha do provedor de menor custo são capazes de otimizar os custos totais de processamento em até 71%.
Abstract: Spatial Data represents abstractions of real-world entities and can be obtained in various ways. They have properties that di erentiate them from other types of data, such as a complex structure and dynamism. In recent years with the increasing volume of spatial data, referred to as big geospatial data, some tools have been developed to process this data e ciently, such as SpatialHadoop, a framework incorporated into Hadoop. The use of appropriate data indices based on the dataset to be processed, queries and operations to be performed is essential for the optimal performance of these applications. In particular, since public cloud providers charge based on the resources used, it is imperative to optimize application execution to avoid unnecessary expense. This paper proposes the construction of a Knowledge Base and an Inference Engine that seek to minimize the cost of processing big geospatial data in public cloud providers. In addition, a comparison of the services o ered by three public cloud providers for large-volume data processing is presented. The tests performed demonstrate that the use of rules generated by the Inference Engine and the choice of the lowest-cost provider can reduce the total processing cost by up to 71%.
Informações adicionais: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2018.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Aparece nas coleções:CIC - Mestrado em Informática (Dissertações)

Mostrar registro completo do item Recomendar este item Visualizar estatísticas



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.