Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/API para processamento estatístico: diferenças entre revisões

[edição não verificada][edição não verificada]
Conteúdo apagado Conteúdo adicionado
Edre (discussão | contribs)
Linha 519:
* Escalabilidade
 
As implementações não impõem limite ao volume de dados aque sersão processadocapazes de processar e nem ao número de nós de processamento. Por funcionar sobre a plataforma Hadoop, a escalabilidade da biblioteca depende diretamente da escalabilidade deste último.
 
* Tolerância a falhas
 
As implementações fornecem o mesmo nível de tolerância a falhas que o sistema de arquivos distribuído HDFS edo Hadoop.
 
* Armazenamento
 
As bases de dados a serem processadas podemficam serarmazenadas divididasno eHDFS, distribuídasque entreé, ospor diversosnatureza, um sistema de arquivos distribuído construído principalmente para facilitar o acesso aos dados pelos nós de processamento do cluster Hadoop.
 
* Latência
 
Os algoritmos implementados são pensados para trabalhar em batch, não sendo recomendados para processamento em tempo real, como é comum em operações estatísticas de sistema de banco de dados.
 
=== Paralelizações existentes ===