Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Classificação associativa incremental (LAC): diferenças entre revisões
[edição não verificada] | [edição não verificada] |
Conteúdo apagado Conteúdo adicionado
Linha 159:
No segundo conjunto de experimentos comparamos o particionamento (1) e (4) e optamos por criar conjuntos de treino com 60% da base e teste com 40%. Foram criados 5 conjuntos utilizando esta metodologia.
=== Algoritmos de Agrupamento ===
Foram avaliados os seguintes algoritmos de agrupamento:
* [http://en.wikipedia.org/wiki/K-means_clustering K-means]
* [http://en.wikipedia.org/wiki/DBSCAN DBSCAN]
* [http://en.wikipedia.org/wiki/Expectation%E2%80%93maximization_algorithm EM]
Em testes preliminares o que apresentou melhores resultados, no nosso caso gerou grupos mais balanceados foi o K-means. Portanto este algoritmo foi utilizado em todos os experimentos subsequentes.
=== Resultados ===
|