Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Maximização de expectativas: diferenças entre revisões

[edição não verificada][edição não verificada]
Conteúdo apagado Conteúdo adicionado
Linha 148:
===Plataformas e Ferramentas===
 
Utilizamos o Hadoop File System<ref name="Hadoop">[http://hadoop.apache.org/],Hadoop File System (HFS)</ref> versão 1.03 para armazenamento dos nosso dados de forma distribuída e programas nossa estratégia de MapReduce utilizando a API do Apache Hadoop.
 
O Hadoop File System é um sistema distribuído, escalável, portável e open-source escrito em Java que suporta a execução de aplicações que exigem uma quantidade grande dados de forma distribuída. Ele foi inspirado nos artigos escritos pela Google descrevendo o Google File System <ref name="Google File System">[http://research.google.com/archive/gfs.html] The Google File System, by Sanjay Ghemawat, Howard Gobioff, and Shun-Tak Leung</ref> que também implementa o paradigma de MapReduce.
 
A configuração do cluster onde trabalhamos foi feita a partir do OpenStack <ref name="OpenStack">[http://www.openstack.org/], OpenStack</ref>, software para fácil gerenciamento de infraestruturas virtualizadas. Nosso cluster continha quatro máquinas virtuais diferentes.
 
===Integração de Plataformas e Ferramentas===