Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Mineração de Itemsets Frequentes: diferenças entre revisões

[edição não verificada][edição não verificada]
Conteúdo apagado Conteúdo adicionado
Linha 49:
A figura à direita apresenta um exemplo de entrada e a saída correspondente gerada por qualquer algoritmo de mineração de itemsets frequentes. Nesse exemplo, uma base contendo quatro transações é minerada considerando um suporte de 50%. Isso significa que um itemset é frequente se este aparece em duas ou mais transações dessa base.
 
Para gerar essa resposta, o algoritmo SON pode usar qualquer outro algoritmo algoritmo para mineração de itemsets frequentes, como o Apriori, Eclat, entre outros. O objetivo desse algoritmo minerar itemsets frequentes em bases maiores que a memória principal. Para tanto, o algoritmo SON usa uma estratégia de particionamento da base de dados por transações, onde cada partição é sequencialmente processada na memória principal e os resultados parciais são gravados em memória secundária. Grosso modo, o objetivo do algoritmo SON é fazer com que mineração de itemsets frequentes possa ser feito em um único computador cuja memória principal seja menor que o tamanho da base.
 
=== Exemplo de funcionamento ===