Processamento de Dados Massivos/Outros ambientes: diferenças entre revisões

[edição verificada][revisão pendente]
Conteúdo apagado Conteúdo adicionado
mSem resumo de edição
Correção da tradução de Eventual Consistency
 
Linha 35:
</syntaxhighlight>
 
Diversas soluções para estruturação dos arquivos armazenados no GFS ou HDFS de forma mais eficiente para consultas já foram propostas e são largamente utilizadas. Essas soluções são em geral sistemas de armazenamento denominados “chave-valor” (''key-value stores''), onde a informação é armazenada em função de uma chave pré-definida. Esses sistemas, ao contrário da interface padrão do sistema de arquivos, permitem consultas e atualizações de conteúdo associado a qualquer chave. Exemplos de sistemas desse tipo são o BigTable <ref>Chang, F., Dean, J., Ghemawat, S., Hsieh, W. C., Wallach, D. A., Burrows, M., Chandra, T., Fikes, A., and Gruber, R. E. Bigtable: A distributed storage system for structured data. ''ACM Transactions on Computer Systems'' 26, 2 (June 2008), 4:1–4:26.</ref>, proposta original da Google, o HBase <ref>Borthakur, D., Gray, J., Sarma, J. S., Muthukkaruppan, K., Spiegelberg, N., Kuang, H., Ranganathan, K., Molkov, D., Menon, A., Rash, S., Schmidt, R., and Aiyer, A. Apache hadoop goes realtime at facebook. In ''Proceedings of the 2011 ACM SIGMOD International Conference on Management of data'' (New York, NY, USA, 2011), SIGMOD ’11, ACM, pp. 1071–1080.</ref>, uma implementação do mesmo conceito para o Hadoop, e outros, como Apache Cassandra <ref>Lakshman, A., and Malik, P. Cassandra: a decentralized structured storage system. ''SIGOPS Operating Systems Review'' 44, 2 (Apr. 2010), 35–40.</ref> e Dynamo <ref>DeCandia, G., Hastorun, D. , Jampani, M., Kakulapati, G. , Lakshman, A., Pilchin, A. , Sivasubramanian, S. , Vosshall, P. , Vogels, W., Dynamo: amazon's highly available key-value store, ''Proceedings of twenty-first ACM SIGOPS symposium on Operating systems principles'', 2007, 14-17 </ref>. Em geral, esses sistemas garantem apenas [[w:Consistência_posterior|consistência eventualposterior]] do conteúdo e oferecem compromissos diferentes de implementação em função de diferentes requisitos de aplicação.
 
Outras soluções buscam novas formas de organização dos dados que ofereçam maior estrutura para os dados e poder de expressão nas consultas, bem como formas de organização que permitam a criação de bases de dados distribuídas geograficamente entre diversos ''datacenters''. Exemplos de projetos nessa linha incluem Megastore <ref> Baker, J., Bond, C., Corbett, J., Furman, J. J., Khorlin, A., Larson, J., Leon, J.-M., Li, Y., Lloyd, A., and Yushprakh, V. Megastore: Providing scalable, highly available storage for interactive services. In ''Proceedings of the Fifth Biennial Conference on Innovative Data Systems Research (CIDR)'' (Asilomar, CA, 2011), pp. 223–234.