Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Mineração de Itemsets Frequentes: diferenças entre revisões
[edição não verificada] | [edição não verificada] |
Conteúdo apagado Conteúdo adicionado
Linha 8:
<pre>Mineração de Itemsets Frequentes (MIFs)</pre>
Dado um conjunto de transações <math>T</math>, o objetivo da Mineração de Itemsets Frequentes é encontrar todos os conjuntos de itens (itemsets) tais que o suporte seja maior ou igual a um suporte mínimo previamente estabelecido. Define-se suporte de um itemset como sendo a porcentagem de transações onde este itemset aparece.
Linha 26 ⟶ 18:
* '''Itemset:''' Conjunto com um ou mais itens;
* '''Suporte:''' Frequência de ocorrência de um conjunto de itens (itemset);
* '''Suporte Mínimo:''' Frequência mínima de ocorrência que um itemset deve possuir para ser considerado frequente;
* '''Itemset frequente:''' Itemset que possui um suporte igual ou superior à um suporte mínimo;
* '''Itemset frequente maximal:''' Dado o conjunto frequente de itemsets F, um itenset X, pertencente à F, será maximal se e somente se para todo Y, também pertencente a F, X não seja um subconjunto de Y
A propriedade Apriori, muito importante na mineração de itemsets frequentes, estabelece o seguinte:
|