Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Maximização de expectativas: diferenças entre revisões

[edição não verificada][edição não verificada]
Conteúdo apagado Conteúdo adicionado
Arturhoo (discussão | contribs)
Inserção do contexto
Arturhoo (discussão | contribs)
Algoritmo parcialmente pronto
Linha 22:
 
===Algoritmo===
 
Como mencionado anteriormente, o algoritmo de Maximização de Expectativas é uma generalização da estimativa de máxima verossimilhança para o caso dos dados incompletos. Em particular, o EM tenta achar os parâmetros <math>\hat{\theta}</math> que maximizam a probabilidade logaritmica <math>logP(x;\theta)</math> dos dados observados. Em linhas gerais, o problema de otimização abordado pelo EM é mais difícil que a otimização realizada pela estimativa de máxima verossimilhança. No caso onde os dados estão completos, a função objetivo <math>logP(x;z;\theta)</math> tem um único ótimo global, e que na maioria das vezes pode ser encontrado de forma fechada. Em contraste, no caso dos dados incompletos, a função <math>logP(x;\theta)</math> tem múltiplos máximos locais e nenhuma solução de forma fechada.
 
Para lidar com isso, o EM reduz a difícil tarefa de otimizar <math>logP(x;\theta)</math> em uma sequência de subproblemas de otimização mais simples, cujas funções objetivo tem um único máximo global que, dessa vez, podem ser encontrados de forma fechada. Esses subproblemas são escolhidos de uma maneira que garante que suas soluções correspondentes <math>\hat{\theta}^{(1)}</math>, <math>\hat{\theta}^{(2)}</math>,... e irão convergir para um ótimo local de <math>logP(x;\theta)</math>.
 
===Exemplo de Funcionamento===