Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Classificação associativa incremental (LAC): diferenças entre revisões

[edição não verificada][edição verificada]
Conteúdo apagado Conteúdo adicionado
Linha 23:
Lazy Associative Classification (LAC) é um algoritmo de classificação associativo proposto por Veloso et al. (2006) <ref name="lac">[http://dl.acm.org/citation.cfm?id=1193367 Veloso, A., Meira Jr., W., and Zaki, M. J. (2006). Lazy associative classification. In Proceedings of the Sixth International Conference on Data Mining, ICDM ’06, pages 645--654, Washington, DC, USA. IEEE Computer Society.], </ref> . LAC é um algoritmo não paramétrico baseado em exemplos (conjunto de treinamento), ou seja, o processo de aprendizado se dá pela indução de um modelo de classificação durante a etapa de treino.
 
De acordo com Veloso et al. (2006)<ref name="lac">[http://dl.acm.org/citation.cfm?id=1193367 Veloso, A., Meira Jr., W., and Zaki, M. J. (2006). Lazy associative classification. In Proceedings of the Sixth International Conference on Data Mining, ICDM ’06, pages 645--654, Washington, DC, USA. IEEE Computer Society.], </ref> LAC não usa nenhuma estratégia para minimização de erros ou suposições inválidas sobre a distribuçãodistribuição dos dados. Assim, as regras estraídasextraídas são aplicadas para descrever os dados e estimar as probabilidades de uma determinada instância de teste pertencer a cada classe. O LAC gera, para cada instância de teste, um modelo sob demanda durante o processo de treinamento.
 
A Geração de modelo sob demanda para cada teste <math>t_{i}</math> é feita extraindo regras de associação que contém apenas os atributos de <math>t_{i}</math> usando o conjunto de treinamento. As regras extraídas são do tipo <math>X \text{→} c_{j}</math>, em que <math>X</math> é um subconjunto dos atributos de <math>t_{i}</math> e <math>c_{j}</math> é o rótulo da i-ésima classe. Este tipo de regra é conhecida como Regra de Associação de Classe (''Class Assocication Rule'') (CAR) devido ao fato de que os atributos estão sempre à esquerda e a classe à direita na regra. Extraídas as regras, a classe de cada tié computada através dos votos dados pelas regas. O LAC utiliza limiares mínimos de suporte e confiânçaconfiança para evitar a extração de regras de associação inúteis.
 
No Algoritmo 1 apresentamos o pseudo-código do LAC que recebe como entrada o conjunto de treinamento e teste, limiares mínimos de suporte e confiância e um limite máximo para o tamanho das regras extraídas. Para cada instância tipertencerpertencer a cada classe. Na linha 7 atribui-se o rótulo da classe que obteve maior probabilidade à tido conjunto de teste é extraído um conjunto de regras de associação que respeite os limiares de suporte, confiânça e tamanho da regra (linha 2). Seguindo, entre as linhas 3 à 6 são computadas as probabilidades da instância <math>t_{i}</math> pertencer a cada classe. Na linha 7 atribui-se o rótulo da classe que obteve maior probabilidade à <math>t_{i}</math>.
 
[[Ficheiro:Lac algorithm.png|commoldura|centro|Pseudo-código do Lazy Associative Classification. Adaptado de (Veloso et al. 2006)<ref name="lac">[http://dl.acm.org/citation.cfm?id=1193367 Veloso, A., Meira Jr., W., and Zaki, M. J. (2006). Lazy associative classification. In Proceedings of the Sixth International Conference on Data Mining, ICDM ’06, pages 645--654, Washington, DC, USA. IEEE Computer Society.], </ref>]]