Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Agrupamento baseado em densidade: diferenças entre revisões

[edição não verificada][edição não verificada]
A principal limitação em termos de eficiência do DBScan é a sua primeira etapa que consiste em calcular a distância entre todos os pares possíveis de registros da base ''B'' para definir quantos vizinhos cada um possui e então classificá-los como ponto de centro, ponto de borda ou exceção. Os pontos de centro são aqueles que possuem ''N'' ou mais vizinhos. Os pontos de borda não possuem ''N'' ou mais vizinhos mas são vizinhos de um ponto de centro. Os registros considerados exceções possuem menos de ''N'' vizinhos e não são vizinhos de nenhum ponto de centro. A figura 2 ilustra as três classificações que um ponto pode receber nesse algoritmo.
 
[[Ficheiro:Classificacao.png|700px500px|miniaturadaimagem|centro|''Figura 2: Classificação dos pontos de acordo com o DBScan sendo o valor do parâmetro N igual a 5.'']]