Processamento de Dados Massivos/Introdução: diferenças entre revisões

sem resumo de edição
[edição não verificada][edição verificada]
(Adicionadas referências importantes)
Sem resumo de edição
 
Apesar desse modelo de processamento já ser largamente conhecido da comunidade de processamento paralelo, ele também vem ganhando larga aceitação nas tarefas de ''big-data'' pelo surgimento de ambientes de processamento desenvolvidos especificamente para esse tipo de atividade. Além disso, esses grandes volumes de dados surgem normalmente no contexto de aplicações em nuvem, que executam em grandes ''datacenters'', onde recursos para armazenamento e processamento distribuído já existem na forma de um grande número de máquinas convencionais interligadas por redes de alta velocidade.
 
Considerando todos esses fatores, o restante deste livro abordará os elementos principais para viabilizar o processamento de dados massivos. Na [[Processamento de Dados Massivos/Aspectos gerais do ambiente de Big Data|seção 2]], o ambiente dos ''datacenters'' atuais é discutido em mais detalhes, para caracterizar melhor as restrições e demandas impostas sobre os ambientes de execução. Um aspecto essencial associado ao ambiente de execução é o sistema de armazenamento dos dados, que também será discutido. Com base nessa análise, a [[Processamento de Dados Massivos/O desafio de escalabilidade|seção 3]] discute os desafios enfrentados para se garantir o alto desempenho nesse ambiente. Em seguida, a [[Processamento de Dados Massivos/O modelo de programação MapReduce|seção 4]] introduz o modelo de programação MapReduce, que se tornou um dos mais populares na área, e a [[Processamento de Dados Massivos/O ambiente Hadoop|seção 5]] dá detalhes do Hadoop, a principal implementação do modelo. Apesar de sua popularidade, entretanto, MapReduce e Hadoop não são a solução para todos os problemas. A [[Processamento de Dados Massivos/Outros ambientes|seção 6]] apresenta ambientes desenvolvidos para facilitar o processamento de certos tipos de dados e certos tipos de algoritmos que não se adaptam bem ao modelo MapReduce. Ainda nesse sentido, a [[Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data|seção 7]] descreve uma metodologia para o desenvolvimento de aplicações ''big-data'' e traz diversos estudos de caso desenvolvidos pelos alunos da disciplina Processamento de Dados Massivos do Departamento de Ciência da Computação da Universidade Federal de Minas Gerais (DCC/UFMG). Finalmente, a [[Processamento de Dados Massivos/Conclusão|seção 8]] apresenta algumas considerações finais.
 
{{AutoCat}}
5 327

edições