Iniciação à Pesquisa Científica em Saúde /REPOSITÓRIO DE EXERCÍCIOS RESOLVIDOS/ Exercício 15: Predição do peso ao nascer

Questão 15: Predição do peso ao nascer

editar

Um pesquisador resolveu analisar a influência da idade gestacional (IG) ao nascimento, em semanas e o peso dos recém-nascidos (PN), em gramas. Selecionou uma amostra aleatória de bebês e anotou para cada um deles a IG e PN em uma base de dados.

 

Correlations: IGN; PN

Pearson correlation of IGN and PN = 0,720 / P-Value = 0,000

Regression Analysis: PN versus IGN

The regression equation is PN = - 4217 + 192,1 IGN

S = 438,881   R-Sq = 51,9%  R-Sq(adj) = 50,9%

Analysis of Variance

Source         DF        SS        MS            F     P

Regression   1  10593351  10593351  55,00 0,000

Error       51   9823436    192616

Total       52  20416787

 

a) Analise o gráfico apresentado a seguir, obtido a partir deste estudo

b) Supondo que as duas variáveis apresentam histograma de frequência compatível com distribuição normal, qual seria o teste estatístico mais adequado neste caso?

c) Analise o resultado do teste de hipóteses apresentado

c) Seria possível prever o peso de nascimento de uma criança que nasce com 9 meses completos (40 semanas)? Qual seria ele?

Resposta da questão

editar

a) O gráfico apresentado é um gráfico de dispersão de pontos (scatter plot ou diagrama de dispersão). Esse tipo de gráfico é utilizado para a visualização de provável associação entre variáveis quantitativas. É possível observar por meio dos gráficos que há uma provável correlação positiva entre a idade gestacional e o peso ao nascer, ou seja, o peso ao nascimento aumenta, quanto maior for a idade gestacional.

Para provar isto é necessário primeiro realizar um teste de hipóteses. Os dados plotados no gráfico seguem uma distribuição que se aproxima de uma reta (obtida por regressão linear), indicando que as variáveis provavelmente se correlacionam de forma linear. Caso as variáveis fossem independentes, os dados estariam distribuídos de forma dispersa pelo plano, sem se concentrarem dessa maneira ao redor da reta em azul.

b) O teste mais adequado para esse caso seria o teste de correlação linear de Pearson. Justificativa: Essa ferramenta é um teste de associação linear entre duas variáveis e que permite a mensuração da correlação, assim como dizer se ela é positiva ou negativa.

Para utilizar este teste é preciso verificar se as variáveis possuem distribuição de frequência normal, ou tendendo para normal, pois este é um teste estatístico paramétrico. Isso é analisado por meio do coeficiente r, ou ρ de Pearson (coeficiente de correlação de Pearson). Esse coeficiente (ρ) varia entre os valores -1 e 1. O valor 0 (zero) significa que não há relação linear. O valor 1 indica uma relação linear forte enquanto o valor -1 também indica uma relação linear forte mas negativa, ou seja quando uma das variáveis aumenta a outra diminui. Quanto mais próximo estiver de 1 ou -1, mais forte é a associação linear entre as duas variáveis

c) Foi dado no exemplo, um coeficiente de correlação de Pearson (ρ) de valor igual a 0,720. Esse valor é indicativo de uma correlação forte entre as variáveis.

A analise desse coeficiente é realizada seguindo orientações convencionadas de que um ρ com valor entre ±0,10 e ±0,30 é considerado fraco, um ρ entre ±0,40 e ±0,6 é moderado e, por fim, um ρ entre ±0,70 e ±1 é considerado forte. Em resumo, o coeficiente é forte quando se aproxima do ±1, e é fraco quando se aproxima do zero. O sinal positivo de ρ indica que a correlação entre as variáveis é positiva, ou seja, o peso ao nascimento é maior quanto maior for a idade gestacional. Um coeficiente ρ forte significa que as variáveis provavelmente são dependentes a ponto de uma ser determinada por outra. Mas para ter certeza é preciso realizar um teste de hipóteses ou calcular um intervalo de confiança para este coeficiente.

No exemplo em questão, é preciso analisar o teste de hipóteses nos seguintes passos:

Hipotese nula: não há correlação entre idade gestacional (preditor) e o peso ao nascer (desfecho)

Escolher uma significância para o teste: escolhemos um nivel de confiança de 95%, ou seja, aceita-se um erro alfa de 5%.

Analisar o resultado do teste e concluir:

O valor de p encontrado esse índice de Pearson forte é suficiente para rejeitar a hipótese nula (as variáveis não se correlacionam) e aceitar a hipótese alternativa (as variáveis se correlacionam, ou seja, não são independentes).

d) É possível determinar o peso ao nascimento. Como o coeficiente de correlação de Person (ρ) é maior que 0,7, indicando uma correlação forte, é possível obter, por regressão linear, uma equação de primeiro grau (que determina a reta em azul no gráfico). Essa equação foi dada no exemplo

PN=-4217+192,1 ×IGN Sendo PN o peso ao nascimento (gramas) e IGN a idade gestacional ao nascimento (em semanas). PN=-4217+192,1 ×40 PN=3467 O peso estimado de uma criança que nasce com 40 semanas é de 3467 gramas.

Indexadores do tema deste exercício

editar

Comparação entre grupos amostrais em saúde

Teste de correlação linear simples

Bibliografia utilizada

editar

(1) MEDRONHO, Roberto de Andrade. Epidemiologia - 2a ed. 2008 - Editora Atheneus

(2) PAES, Ângela Tavares. Itens essenciais em bioestatística. Arq. Bras. Cardiol., São Paulo , v. 71, n. 4, p. 575-580, Oct. 1998 . Disponível em <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0066-782X1998001000003&lng=en&nrm=iso>. acessado em 17 June 2016.