Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Mineração de Itemsets Frequentes: diferenças entre revisões

[edição não verificada][edição não verificada]
Conteúdo apagado Conteúdo adicionado
Linha 391:
==== Planejamento experimental ====
 
O objetivo deste trabalho é apresentar uma solução paralela distribuída que melhore a performance, em termos de tempo de execução, a tarefa de mineração de itemsets frequentes. Para tanto, seráserão apresentadoapresentados resultados de testes variando-se tanto o número de transações de uma base de dados, e tambémquanto o número de itens por transação, conforme detalhado na Seçãoseção anterior.
 
Para cada base de teste, a estratégia implementada foi executada utilizando 1, 2, 4 e 8 nós de processamento e o tempo total de processamento foi medido para posterior análise. Vale observar que a divisão da base de dados é uma etapa anterior ao processamento, isso representa bem os casos reais visto que o objetivo no final é aplicar o algoritmo em bases que não caibam em uma máquina apenas, portanto em casos reais no contexto de processamento massivo a divisão da base também seria feita previamente ao processamento. Assim, o tempo aqui medido desconsidera o trabalho de particionamento da base.