Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Maximização de expectativas: diferenças entre revisões
[edição não verificada] | [edição não verificada] |
Conteúdo apagado Conteúdo adicionado
Etiqueta: esvaziamento |
|||
Linha 141:
===Plataformas e Ferramentas===
Utilizamos o Hadoop File System (HFS) versão 1.03 para armazenamento dos nosso dados de forma distribuída e programas nossa estratégia de MapReduce utilizando a API do Apache Hadoop.
O Hadoop File System é um sistema distribuído, escalável, portável e open-source escrito em Java que suporta a execução de aplicações que exigem uma quantidade grande dados de forma distribuída. Ele foi inspirado nos artigos escritos pela Google descrevendo o Google File System que também implementa o paradigma de MapReduce.
A configuração do cluster onde trabalhamos foi feita a partir do OpenStack, software para fácil gerenciamento de infraestruturas virtualizadas. Nosso cluster continha quatro máquinas virtuais diferentes.
===Integração de Plataformas e Ferramentas===
===Detalhes de Implementação===
|