Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Mineração de Itemsets Frequentes: diferenças entre revisões

[edição não verificada][edição não verificada]
Conteúdo apagado Conteúdo adicionado
Linha 22:
 
Seja <math>I = \{i1, i2, \ldots, im\}</math> um conjunto de itens (o conjunto de todos os artigos de um supermercado, por exemplo). Seja <math>T</math> uma base de dados de transações, isto é, uma tabela de duas colunas, a primeira corresponde ao TID (identificador da transação) e o segundo corresponde à transação propriamente dita, ou seja, um conjunto de itens (por exemplo, os itens comprados por um cliente). Os elementos de <math>T</math> são chamados de transações. Um ''itemset'' é um subconjunto não vazio de <math>I</math>. Diz-se que uma transação <math>T</math> suporta um ''itemset'' <math>I</math> se <math>I \subseteq T</math>.
 
A seguir são apresentados, de forma sucinta, alguns termos relevantes ao desenvolvimento deste trabalho:
 
* '''Itemset:''' Conjunto com um ou mais itens;
* '''K-Itemset:''' Um itemset com k itens;
* '''Suporte:''' Freqüência de ocorrência de um conjunto de itens (itemset);
* '''Suporte Mínimo:''' Freqüência mínima de ocorrência que um itemset deve possuir para ser considerado frequente;
* '''Itemset frequente:''' Itemset que possui um suporte igual ou superior à um suporte mínimo;
* '''Itemset frequente maximal:''' Dado o conjunto frequente de itemsets F, um itenset X, pertencente à F, será maximal se e somente se para todo Y, também pertencente a F, X não seja um subconjunto de Y;
 
=== Contexto ===