Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Mineração de Itemsets Frequentes: diferenças entre revisões

[edição não verificada][edição não verificada]
Conteúdo apagado Conteúdo adicionado
Linha 6:
 
<!--<big>'''<u>Mineração de Itemsets Frequentes</u>'''</big>-->
 
<pre>Mineração de Itemsets Frequentes (MIFs)</pre>
 
<!--Sabir: Antonio, comentei essa parte e tirei os mathcal's, estava dando um erro grotesco em vermelho logo na introdução..
Dado um conjunto de transações <math>T</math>, o objetivo da Mineração de Itemsets Frequentes é encontrar todos os conjuntos de itens (itemsets) tais que o suporte seja maior ou igual a um
suporte mínimo previamente estabelecido. Define-se suporte de um itemset como sendo a porcentagem de transações onde este itemset aparece.
Linha 13 ⟶ 15:
Formalmente, podemos definir a tarefa de minerar itemsets frequentes como:
 
Seja <math>I = \{i1, i2, \ldots, im\}</math> um conjunto de itens (o conjunto de todos os artigos de um supermercado, por exemplo). Seja <math>\mathcal{T}</math> uma base de dados de transações, isto é, uma tabela de duas colunas, a primeira corresponde ao TID (identificador da transação) e o segundo corresponde à transação propriamente dita, ou seja, um conjunto de itens (por exemplo, os itens comprados por um cliente). Os elementos de <math>\mathcal{T}</math> são chamados de transações. Um ''itemset'' é um subconjunto não vazio de <math>I</math>. Diz-se que uma transação <math>T</math> suporta um ''itemset'' <math>I</math> se <math>I \subseteq T</math>.-->
 
Dado um conjunto de transações <math>T</math>, o objetivo da Mineração de Itemsets Frequentes é encontrar todos os conjuntos de itens (itemsets) tais que o suporte seja maior ou igual a um suporte mínimo previamente estabelecido. Define-se suporte de um itemset como sendo a porcentagem de transações onde este itemset aparece.
 
Formalmente, podemos definir a tarefa de minerar itemsets frequentes como:
 
Seja <math>I = \{i1, i2, \ldots, im\}</math> um conjunto de itens (o conjunto de todos os artigos de um supermercado, por exemplo). Seja <math>T</math> uma base de dados de transações, isto é, uma tabela de duas colunas, a primeira corresponde ao TID (identificador da transação) e o segundo corresponde à transação propriamente dita, ou seja, um conjunto de itens (por exemplo, os itens comprados por um cliente). Os elementos de <math>T</math> são chamados de transações. Um ''itemset'' é um subconjunto não vazio de <math>I</math>. Diz-se que uma transação <math>T</math> suporta um ''itemset'' <math>I</math> se <math>I \subseteq T</math>.
 
=== Contexto ===