Diferenças entre edições de "Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Classificação associativa incremental (LAC)"

 
No segundo conjunto de experimentos comparamos o particionamento (1) e (4) e optamos por criar conjuntos de treino com 60% da base e teste com 40%. Foram criados 5 conjuntos utilizando esta metodologia.
 
=== Algoritmos de Agrupamento ===
 
Foram avaliados os seguintes algoritmos de agrupamento:
 
* [http://en.wikipedia.org/wiki/K-means_clustering K-means]
* [http://en.wikipedia.org/wiki/DBSCAN DBSCAN]
* [http://en.wikipedia.org/wiki/Expectation%E2%80%93maximization_algorithm EM]
 
Em testes preliminares o que apresentou melhores resultados, no nosso caso gerou grupos mais balanceados foi o K-means. Portanto este algoritmo foi utilizado em todos os experimentos subsequentes.
 
=== Resultados ===