Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Avaliação do algoritmo PageRank: diferenças entre revisões

[edição não verificada][edição não verificada]
Conteúdo apagado Conteúdo adicionado
Linha 17:
Numa rede com n nodos, atribui-se inicialmente o valor de 1/n para cada um. Depois disso, realizamos uma regra de atualização um determinado número k de vezes. A regra de atualização é a seguinte: cada nodo compartilha seu valor atual de PageRank igualmente com todos os nodos que segue, e cada nodo atualiza seu valor para ser a soma das partes que recebeu. A teoria do PageRank diz que até mesmo uma pessoa que clica em links aleatoriamente vai, eventualmente, parar de clicar. A probabilidade, a qualquer passo, que uma pessoa continue clicando é dado por um fator de amortecimento (damping factor) d, que geralmente é configurado para ter o valor 0,85. O fator de amortecimento é subtraído de 1 e o resultado é adicionado ao produto do fator de amortecimento pela soma das partes que o nodo recebeu.
 
<codebig>
Para1 '''para cada''' vértice <math>v</math>:
2 <math>PR(v, 0) = \frac{1}{N}</math>
3 <math>VA = \{v \in V\}</math>
Para4 '''para cada''' iteração <math>t</math>, '''enquanto''' <math>|VA| > 0</math>:
5 Para '''para cada''' vértice <math>v \in VA</math>:
6 <math>PR(v, t+1) = \frac{1-d}{N} + d \sum_{u \in M(v)} \frac{PR(u, t)}{L(u)}</math>
7 <math>VA = \{v \in V : |PR(V, t+1) - PR(V, t)| > MAX_ERR \}</math>
</codebig>
 
=== Exemplo de Funcionamento ===