Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Maximização de expectativas: diferenças entre revisões

[edição não verificada][edição não verificada]
Conteúdo apagado Conteúdo adicionado
Etiqueta: esvaziamento
Linha 141:
 
===Plataformas e Ferramentas===
 
Utilizamos o Hadoop File System (HFS) versão 1.03 para armazenamento dos nosso dados de forma distribuída e programas nossa estratégia de MapReduce utilizando a API do Apache Hadoop.
 
O Hadoop File System é um sistema distribuído, escalável, portável e open-source escrito em Java que suporta a execução de aplicações que exigem uma quantidade grande dados de forma distribuída. Ele foi inspirado nos artigos escritos pela Google descrevendo o Google File System que também implementa o paradigma de MapReduce.
 
A configuração do cluster onde trabalhamos foi feita a partir do OpenStack, software para fácil gerenciamento de infraestruturas virtualizadas. Nosso cluster continha quatro máquinas virtuais diferentes.
 
===Integração de Plataformas e Ferramentas===
===Detalhes de Implementação===