Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Classificação associativa incremental (LAC): diferenças entre revisões

 
== Classificação Automática ==
Classificação automática é uma técnica desenvolvida em aprendizado de máquina e mineração de dados. Em se tratando da área de aprendizado de máquina, classificação automática se encaixa em aprendizado supervisionado que trata-se de um processo que induz uma função (modelo) <math>\text{f: X → Y}</math> inicialmente desconhecida (Mitchel 2006). Isto é feito a partir de um conjunto de dados de exemplo <math>(x_{i}, y_{i})</math>, em que xirepresenta os atributos de um dado e <math>y_{i}</math> a variável resposta referente a classe a que pertence. Tais dados são utilizados para “mostrar”"mostrar" ao algoritmo o mapeamento das entradas <math>x_{i}</math> para as saídas desejadas <math>y_{i} = f(x_{i})</math>.
 
Para realizar a indução desta função os algoritmos de classificação utilizam técnicas inspiradas em estatística até em computação natural (algoritmos genéticos, colônias de formigas, etc). Vários destes algrotimos possuem duas fazes: treino e classificação. A fase de treino é responsável pela indução da função que irá classificar dados ainda desconhecidos. A fase de teste é a aplicação de tal função a cada dado do conjunto de teste os quais são classificados.
 
Outros algoritmos não possuem a fase de treino separada da fase de classficificação. Este algoritmos são conhecidos como ''Lazy'' ou Sob Demanda. O processo de classificação realizado por estes algoritmos é tal que para cada dado do conjunto de teste é construída um modelo de classificação, ou seja, o modelo de classificação é construído sob demanda para cada dado do teste.
 
== Lazy Associative Classification (LAC) ==
40

edições