Explorando paralelismo em big data no processamento de séries temporais de imagens de sensoriamento remoto
dc.contributor.advisor-co1 | Rodrigues, Vagner José do Sacramento | |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/4148896613580056 | eng |
dc.contributor.advisor1 | Martins, Wellington Santos | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/3041686206689904 | eng |
dc.contributor.referee1 | Martins, Wellington Santos | |
dc.contributor.referee2 | Costa, Fábio Moreira | |
dc.contributor.referee3 | Carvalho, Sérgio Teixeira de | |
dc.contributor.referee4 | Silva, Nilton Correia da | |
dc.contributor.referee5 | Davis Júnior, Clodoveu Augusto | |
dc.creator | Oliveira, Sávio Salvarino Teles de | |
dc.creator.Lattes | http://lattes.cnpq.br/1905829499839846 | eng |
dc.date.accessioned | 2019-09-16T12:00:07Z | |
dc.date.issued | 2019-08-30 | |
dc.description.abstract | The surface of planet Earth is changing at an unprecedented rate and the land use and land cover classification using remote sensing time series is now essential for identifying these changes. The TWDTW algorithm stands out in this task, but it has a quadratic complexity and high computational cost, making it difficult to use with Big Data. In this paper we tackle these problems by exploiting parallelism at both the vertical (multicore / manycore) and horizontal (cluster - distributed system) levels, in an integrated way for high performance. In the vertical dimension, we propose a parallel algorithm (P- INDEX) for the calculation of remote sensing indices, and another (P-TWDTW) for the calculation of similarity between time series. The speedup of P-INDEX was up to 9 times relative to the sequential algorithm in processing all images, while P-TWDTW was up to 12 times faster than its C++ centralized version and 246 times faster than the original in R TWDTW algorithm. In addition to enabling the quick calculation of a more sophisticated similarity measure, P- TWDTW also contributed to the generation of meta-characteristics for more robust machine learning methods. This increased the accuracy of the time series classification from 78% using TWDTW with KNN to almost 94% using the meta-characteristics obtained from P-TWDTW with SVM. In the horizontal dimension, we propose a distributed platform (BigSensing) that enables efficient handling of large volumes of remote sensing data. The platform includes a smart query engine that is able to choose, in real time, the best system to filter and retrieve data according to the spatial and temporal constraints of the query, with a nearly 22% reduction in response time over SciDB. | eng |
dc.description.provenance | Submitted by Ana Caroline Costa (ana_caroline212@hotmail.com) on 2019-09-13T20:32:19Z No. of bitstreams: 2 Tese - Sávio Salvarino Teles de Oliveira - 2019.pdf: 6810556 bytes, checksum: a3ad084daee37a7041bfaeed7cc60c15 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) | eng |
dc.description.provenance | Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2019-09-16T12:00:07Z (GMT) No. of bitstreams: 2 Tese - Sávio Salvarino Teles de Oliveira - 2019.pdf: 6810556 bytes, checksum: a3ad084daee37a7041bfaeed7cc60c15 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) | eng |
dc.description.provenance | Made available in DSpace on 2019-09-16T12:00:07Z (GMT). No. of bitstreams: 2 Tese - Sávio Salvarino Teles de Oliveira - 2019.pdf: 6810556 bytes, checksum: a3ad084daee37a7041bfaeed7cc60c15 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2019-08-30 | eng |
dc.description.resumo | A superfície do planeta Terra está mudando a uma taxa sem precedentes e a classificação do tipo de uso e cobertura do solo, utilizando séries temporais de sensoriamento remoto, é hoje imprescindível para a identificação dessas mudanças. O algoritmo TWDTW se destaca nesta tarefa, mas possui complexidade quadrática com alto custo computacional, dificultando o seu uso em grandes volumes de dados (Big Data). Neste trabalho atacamos esses problemas explorando paralelismo tanto em nível vertical (multicore/manycore) quanto horizontal (cluster de computadores), de forma integrada para oferecer alto desempenho. Na dimensão vertical, propomos um algoritmo paralelo (P-INDEX) para o cálculo dos índices de sensoriamento remoto, e outro (P-TWDTW) para o cálculo de medidas de similaridade entre séries temporais. O speedup do algoritmo P-INDEX foi de até 9 vezes no processamento de todas as imagens em relação ao algoritmo sequencial, enquanto o P-TWDTW conseguiu ser até 12 vezes mais rápido que sua versão centralizada em C++ e 246 vezes mais rápido que o algoritmo TWDTW original em R. Além de viabilizar o cálculo rápido de uma medida de similaridade mais sofisticada, a exploração de paralelismo no P-TWDTW também contribuiu para que essas medidas fossem usadas como meta- características para métodos de aprendizado de máquina mais robustos. Isso aumentou a acurácia da classificação das séries temporais de 78%, utilizando o TWDTW com o KNN, para quase 94%, utilizando as meta-características obtidas a partir do P-TWDTW com o SVM. Na dimensão horizontal, propomos uma plataforma distribuída (BigSensing) que permite o tratamento eficiente de grandes volumes de dados de sensoriamento remoto. A plataforma inclui um motor inteligente de busca que é capaz de escolher, em tempo real, o melhor sistema para filtrar e recuperar os dados, de acordo com as restrições espaciais e temporais da consulta, tendo uma redução de quase 22% do tempo de resposta em relação ao SciDB na filtragem e recuperação de dados. | eng |
dc.description.sponsorship | Fundação de Amparo à Pesquisa do Estado de Goiás - FAPEG | eng |
dc.format | application/pdf | * |
dc.identifier.citation | OLIVEIRA, S. S. T. Explorando paralelismo em big data no processamento de séries temporais de imagens de sensoriamento remoto. 2019. 128 f. Tese (Doutorado em Ciência da Computação em Rede) - Universidade Federal de Goiás, Goiânia, 2019. | eng |
dc.identifier.uri | http://repositorio.bc.ufg.br/tede/handle/tede/10020 | |
dc.language | por | eng |
dc.publisher | Universidade Federal de Goiás | eng |
dc.publisher.country | Brasil | eng |
dc.publisher.department | Instituto de Informática - INF (RG) | eng |
dc.publisher.initials | UFG | eng |
dc.publisher.program | Programa de Pós-graduação em Ciência da Computação em Rede UFG/UFMS (INF) | eng |
dc.rights | Acesso Aberto | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Séries temporais | por |
dc.subject | Sensoriamento remoto | por |
dc.subject | Sistemas distribuídos | por |
dc.subject | Processamento paralelo | por |
dc.subject | Big data | eng |
dc.subject | Time series | eng |
dc.subject | Remote sensing | eng |
dc.subject | Parallel processing | eng |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | eng |
dc.title | Explorando paralelismo em big data no processamento de séries temporais de imagens de sensoriamento remoto | eng |
dc.title.alternative | Exploring parallelism in big data on remote sensing image time series processing | eng |
dc.type | Tese | eng |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- Tese - Sávio Salvarino Teles de Oliveira - 2019.pdf
- Tamanho:
- 6.5 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 2.11 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: