Skip navigation
Please use this identifier to cite or link to this item: http://repositorio.unb.br/handle/10482/34423
Files in This Item:
File Description SizeFormat 
2018_LucasBenevidesDias.pdf4,37 MBAdobe PDFView/Open
Title: Auto-Tuning de banco de dados NoSQL com dados de Internet das Coisas : um estudo de caso com o Cassandra
Authors: Dias, Lucas Benevides
Orientador(es):: Holanda, Maristela Terto de
Assunto:: Internet das coisas
Banco de dados
NoSQL (Not Only SQL)
Séries temporais
Issue Date: 23-Apr-2019
Citation: DIAS, Lucas Benevides. Auto-Tuning de banco de dados NoSQL com dados de Internet das Coisas: um estudo de caso com o Cassandra. 2018. xi, 75 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2018.
Abstract: Os dados provenientes de um ambiente de Internet das Coisas (IoT - Internet of Things) podem atingir um volume muito grande, proporcional à quantidade de dados gerados pelos sensores, à sua periodicidade de envio e ao número de dispositivos conectados. Estes dados são séries temporais e possuem características específicas que podem ser exploradas para facilitar seu armazenamento. Há sistemas gerenciadores de bancos de dados que possuem funcionalidades específicas para armazenar estes dados, entre eles está o banco NoSQL Cassandra, o qual provê duas estratégias de compactação, que organizam as páginas de dados de maneira otimizada para dados de séries temporais, como os de IoT. Este trabalho compara as duas estratégias e encontra a mais eficiente quanto ao tempo de resposta e throughput. A estratégia de compactação possui parâmetros de configuração, cuja definição fica a cargo do usuário. O efeito destes parâmetros no desempenho do sistema é estudado e pontos ótimos de configuração são definidos, por meio de testes e análises de resultados. Um mecanismo de auto-tuning chamado C*DynaConf foi desenvolvido, baseado nos pontos ótimos de configuração preestabelecidos. Os resultados apontaram que seu uso trouxe melhoria média de 4,52% no número de operações realizadas, quando comparado a um cenário de IoT que se inicia com configuração ótima, mas passa a ter suas características alteradas.
Abstract: Data provided by Internet of Things (IoT) may achieve very great volumes, proportional to the amount of data generated by sensors, to its periodicity and to the number of devices connected. This data, that is a case of time series, has some specific characteristics that can be used to favour its storage. There are some database management systems that provide mechanisms that are proper to time series data storage, between those is the NoSQL Cassandra database. These mechanisms in Cassandra are two compaction strategies, that organize data pages in an optimized way, in order to take advantage of IoT Data peculiarities. This work compares the two compaction strategies and finds the mos efficient in terms of response time and throughput. The compaction strategy has parameters that supply the configuration to the users. The effect of these parameters in performance is studied and optimal configuration points are defined, through tests and results analysis. An auto-tuning engine, called C*DynaConf was developed, based on the optimal configuration points obtained. The results show that the use of the engine has brought a 4.52% mean gain in terms of operations performed, when compared to an IoT test case where the initial configuration is optimal but the scenario’s characteristics are variated.
Description: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2018.
Licença:: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Appears in Collections:CIC - Mestrado em Informática (Dissertações)

Show full item record Recommend this item " class="statisticsLink btn btn-primary" href="/handle/10482/34423/statistics">



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.