60
edições
[edição não verificada] | [edição não verificada] |
Em <ref name="domenica">[http://www.di.unipi.it/~coppola/didattica/ccp0506/papers/LNCS2150_21500326.pdf Experiments in parallel clustering with dbscan], .</ref> é apresentado uma implementação paralela do ''DBScan'' com uma abordagem mestre-escravo: enquanto o núcleo mestre realiza a etapa de assimilação de grupos, os escravos respondem a consultas de vizinhança usando a estrutura ''R*-Tree'' para armazenamento.
Em ''P-DBSCAN'' <ref name="pdbscan">[http://bib.dbvis.de/uploadedFiles/17.pdf P-DBScan] </ref> , a base é particionada e o agrupamento é feito de forma independente entre os nós de forma distribuída. Ao final, há uma agregação dos resultados de cada nó para formar o resultado final. Quanto ao armazenamento, a estrutura utilizada é a ''Priority R-Tree'' <ref name="prtree">[http://www.daimi.au.dk/~large/Papers/prtreesigmod04.pdf The priority r-tree: A practically eficient and worst-case optimal r-tree], .</ref> que é uma variação eficiente da ''R-Tree''. Nessa implementação há a limitação de haver um único nó para juntar os resultados do agrupamento feito por todos os nós. Além disso, os pontos considerados exceções por um nó não são tratados posteriormente na junção dos grupos, portanto grupos densos podem ser perdidos se seus registros estiverem divididos entre os nós.
De forma similar ao ''P-DBSCAN'', o ''MR-DBSCAN'' <ref name="mrdbscan">[http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=6121313&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D6121313 MR-DBScan], </ref>, proposto em , é uma implementação distribuída do ''DBScan'' com quatro estágios e que utiliza o paradigma ''Map-reduce''
Em ''SDBDC'' <ref name="sdbdc">
Considerando os trabalhos existentes de paralelização do ''DBScan'', conclui-se que o agrupamento distribuído baseado em densidade não é uma tarefa trivial e há vários fatores a serem balanceados já que é inviável atender a todos. Alguns desses fatores são a comunicação, a descentralização de tarefas, a completude e a qualidade da solução.
|
edições