Diferenças entre edições de "Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Mineração de Itemsets Frequentes"

 
=== Contexto ===
 
Um dos conceitos mais poderosos no contexto de mineração de dados é a identificação de itemsets frequentes. Mineração de itemsets frequentes são uteis em inúmeros contextos, dentre as quais destacam-se: análise de logs na web, análise baseada em mercado, mineração de regras de associação, entre outras tarefas de mineração de dados.
 
Além disso, vários algoritmos dependem da geração eficiênte de itemsets frequentes. Um exemplo é o algoritmo LAC, cuja carga gasta na geração de regras de associação (que atua por meio da identificação de itemsets frequentes) corresponde a cerca de 90% do processamento. Esse algoritmo será discutido em outra seção desse WikiBook.
<!--Mineração de Itemsets Frequentes... contexto histórico, métodos existentes-->
 
Existem vários algoritmos para mineração de itemsets frequentes, dentre os quais destacam-se:
 
* Apriori
* Eclat
* FP-Growth
* SON
 
Na discussão apresentada ao longo dessa seção, usaremos o algoritmo SON.
 
=== Motivação ===
152

edições