Iniciação à Pesquisa Científica em Saúde/ REPOSITÓRIO DE EXERCÍCIOS RESOLVIDOS/ Exercício 54: O grupo controle

Questão 54 - O grupo controle

editar

Suponha que um pesquisador, queira comparar a ingestão calórica diária entre adultos obesos e adultos com peso adequado para idade e sexo. Ao analisar os dados seu estudo clínico, do tipo caso-controle, quer certificar-se que o grupo controle que selecionou é realmente constituído por indivíduos que consomem em média 2000Kcal/dia. Dado que o grupo selecionado para controle informou valores de consumo diário registrados na tabela a seguir, avalie estatisticamente tal hipótese.

  • Calcule o valor médio, desvio padrão e um intervalo de confiança de 95% para a média
  • Formule um teste de hipóteses, usando erro alfa de 5% e o resolva, explicando seus passos.
  • O resultado do teste de hipóteses e o intervalo de confiança são coerentes?
 
Consumo calórico diário (Kcal/dia)
1 1790
2 2004
3 1897
4 2360
5 1990
6 2005
7 2006
8 1995
9 1760
10 1670
11 1930
12 2340
13 2030
14 1990
15 1880
16 2004
17 2040
18 1967
19 2010
20 1850
21 1680
22 2010
23 1790
24 2146
25 2310

Explique suas respostas e fundamente-as com referências bibliográficas.

Resposta da questão:

editar

Antes de iniciar a resolução da questão, vale ressaltar que um estudo do tipo caso-controle, ou estudo observacional retrospectivo, é um estudo observacional, ou seja, os pesquisadores observam e medem características do sujeito, e não implica em uma modificação do sujeito objeto do estudo, o que o difere do estudo experimental. Nesse tipo de estudo, dois grupos são escolhidos a partir da presença ou ausência do desfecho, assim, o desfecho é o ponto de partida e determina a seleção ou agrupamento. Os dados são coletados do passado, voltando-se no tempo (através de exames de registros, entrevistas e assim por diante).

- Calcule o valor médio, desvio padrão e um intervalo de confiança de 95% para a média.

A média ou valor médio ( ) de um conjunto de valores é calculada como a soma de todas as observações de um conjunto de dados, no caso, a soma de todos os valores de consumo calórico diário ( ), e divisão do resultado pelo número total de medidas, no problema, o número total de dados de consumo calórico diário (ou número total de participantes -  ). Sabendo-se a definição de média, é fácil calcular seu valor no caso em questão:

 

Logo, o valor médio do consumo calórico diário dos participantes é 1978,16 Kcal/dia, como demonstrado pelo cálculo acima.

O desvio padrão de um conjunto de valores amostrais, denotado por  , é uma medida da variação dos valores em torno da média. É uma espécie de desvio médio da variação dos valores em torno da média. O desvio padrão é calculado através da fórmula abaixo.

 

Portanto, o valor do desvio padrão do consumo calórico diário dos participantes é 178,4549, como através da fórmula acima, utilizando o programa Excel 2010.

 
Histograma de frequência dos valores de ingestão calórica diária (Kcal/dia) do grupo controle da pesquisa. Utilização do programa estatístico SPSS.

O intervalo de confiança (IC) é uma faixa de valores usada para se estimar o verdadeiro valor de um parâmetro populacional. Para calcular IC de 95% para a média, deve-se utilizar a fórmula a seguir, pois o desvio padrão já é conhecido (178,4549). Vale ressaltar que a equação abaixo nos fornece os valores de consumo calórico diário limites do intervalo de confiança de 95%. O valor de   é tabelado e, para um intervalo de confiança de 95%, esse valor é 1,96.

 

Assim, o intervalo de confiança de 95% para a média é a faixa de valores compreendida entre 1908,2 e 2048,1 Kcal/dia.

- Formule um teste de hipóteses, usando um erro alfa de de 5% e o resolva, explicando seus passos.

Um teste de hipóteses é um procedimento para se testar uma afirmativa sobre uma propriedade da população, no caso, a ingestão calórica diária do grupo controle. Ele é dividido em etapas, sendo elas: identificações da hipótese nula (H0) e da hipótese alternativa (Ha); cálculo do valor da estatística do teste; identificação dos valores críticos, dado um nível de significância; identificação do valor p; e estabelecimento da conclusão do teste em termos simples.

Antes de iniciar as etapas do teste, é interessante fazer uma análise exploratória de dados:

- Conheça seus dados: os dados trabalhados são valores de consumo calórico diário do grupo controle e média de ingestão calórica diária de 2000 Kcal/dia.

- Número de casos é suficiente (amostra)? São apenas 25 casos, ou seja, estamos trabalhando com uma amostra.

- Dados independentes/dependentes (medidas repetidas): os dados em questão são independentes (os dados de consumo diário de cada participante são independentes da média de ingestão calórica diária de 2000 Kcal/dia).

- Avalie valores discrepantes: é possível observar valores discrepantes através de um histograma de frequência. No caso, não houve valores discrepantes.

- Descreva variáveis e sua distribuição: a ingestão calórica diária é um valor que pode ser inteiro ou racional, portanto, trata-se de uma variável numérica (quantitativa) contínua. A distribuição é normal, conforme mostrado pela curva normal no histograma de frequências na imagem acima.Como estamos lidando com comparação de médias (média da ingestão calórica diária dos participantes do teste e média de ingestão diária pré-estabelecida), o teste estatístico recomendado para o caso é o teste de média (teste-t). O teste-t de médias é um tipo de teste estatístico que utiliza observações independentes, compara médias entre duas amostras, o grupo de pessoas selecionadas só participa do teste uma vez e a distribuição da variável é normal. Para a utilização desse teste, o verdadeiro valor do desvio padrão populacional ( ) é desconhecido.

Além disso, como estamos lidando com uma Ha que leva em consideração valores de ingestão calórica diária diferentes, tanto maiores quanto menores, o teste em questão é também bicaudal (observe a imagem ao lado). Em um teste bicaudal (ou bilateral), a região crítica está nas duas regiões extremas (caudas) sob a curva de distribuição. Caso o teste considerasse apenas uma hipótese (ser maior ou menor), este seria unicaudal (à esquerda ou à direita).

1. Determinação da H0 e da Ha

A hipótese nula (Ho) é uma afirmativa de que o valor de um parâmetro populacional (como proporção, média ou desvio padrão) é igual a algum valor especificado. Testa-se a hipótese nula diretamente no sentido de que assumimos (ou supomos) que seja verdadeira e chegamos a uma conclusão de rejeitá-la ou deixar de rejeitá-la. A hipótese alternativa (Ha) é a afirmativa de que o parâmetro tem um valor que, de alguma forma, difere da hipótese nula. No caso em questão, queremos saber se a ingestão calórica diária de pessoas obesas e de pessoas com peso adequado para idade e sexo, ou seja, do grupo controle, é igual ao valor médio de ingestão calórica diária pré-estabelecido (2000 Kcal/dia). Assim, tem-se:

Ho: A ingestão calórica diária do grupo selecionado para controle é igual ao valor médio de ingestão calórica diária pré-estabelecido (2000 Kcal/dia).

Ha: A ingestão calórica diária do grupo selecionado para controle não é igual ao valor médio de ingestão calórica diária pré-estabelecido (2000 Kcal/dia).

 
Determinação do valor de estatística do teste (t-statistic), do nível de significância (valor de p) e do IC de 95% para a média (95% CI for mean) através do programa MedCalc.

2. Cálculo do valor de estatística do teste

Para calcular o valor de estatística do teste-t, é necessário utilizar a fórmula abaixo:

 

Também é possível calcular o valor de estatística do teste através do programa estatístico MedCalc, como mostrado na imagem.

3. Identificação dos valores críticos – escolha do nível de significância

O nível de significância é a probabilidade de a estatística de teste cair na região crítica quando a hipótese nula for realmente verdadeira. Se a estatística de teste cair na região crítica, rejeita-se a hipótese nula, de modo que   (alfa) é a probabilidade de cometermos o erro de rejeitar a hipótese nula quando ela é verdadeira. O valor de significância, ou erro  , é de 5%, conforme foi informado no enunciado.

4. Identificação do valor p

O valor p é a probabilidade de se obter um valor da estatística de teste que seja, pelo menos, tão extremo quanto aquele que representa os dados amostrais, supondo que a hipótese nula seja verdadeira. Valores p podem ser encontrados depois de se encontrar a área além da estatística do teste. Caso o valor p seja maior do que 0,05, se aceita a hipótese nula, em caso contrário (menor do que 0,05), rejeita-se a hipótese nula e se aceita a hipótese alternativa. O programa estatístico MedCalc informa o valor de p, que, no caso em questão, é p = 0,5463.

5. Conclusão do teste

Através do valor obtido de p, que foi maior do que 0,05, se aceita a hipótese nula (H0) e rejeita-se a hipótese alternativa (Ha), como explicado acima. Assim, devemos considerar, com 95% de confiança, que a ingestão calórica diária do grupo selecionado para controle é igual ao valor médio de ingestão calórica diária pré-estabelecido (2000 Kcal/dia).

- O resultado do teste de hipóteses e o intervalo de confiança estão coerentes?

O resultado obtido com o teste de hipóteses para o intervalo de confiança (IC) de 95% para a média foi o intervalo dos valores de ingestão calórica diária entre 1904,4974 e 2051,8226 Kcal/dia, como mostrado através da utilização do programa MedCalc. Esse valor de IC foi muito próximo do encontrado no primeiro item da questão (1908,2 e 2048,1 Kcal/dia), quando este foi calculado sem a utilização do programa. Quando se compara o resultado do teste de hipóteses com o IC, percebe-se que há coerência entre esses dados, pois o valor médio de ingestão calórica diária pré-estabelecido para os indivíduos (2000 Kcal/dia) está inserido no IC que corresponde aos valores nos quais ele (valor médio pré-estabelecido) equivaleria à média da amostra.

Indexadores do tema deste exercício

editar

Comparação entre grupos amostrais em saúde

Testes de hipóteses

Teste de médias

Bioestatística computacional

Bibliografia

editar

(1) TRIOLA, M. F. Introdução à estatística: atualização da tecnologia. 11ª Edição. Rio de Janeiro: LTC, 2015.

(2) PAGANO, M.& GAUVREAU, K.. Princípios de Bioestatística. 2ª Edição. São Paulo: Thompson Heinle, 2004.

(3) Cálculo e interpretação do p-valor, Portal Action. Disponível em: <http://www.portalaction.com.br/inferencia/512-calculo-e-interpretacao-do-p-valor>. Acesso em 21 de novembro de 2016.

(4) Free statistical calculators, MedCalc. Disponível em: <https://www.medcalc.org/calc/test_one_mean.php>. Acesso em 21 de novembro de 2016.

(5) IBM SPSS Statistics 19, IBM. Programa estatístico utilizado.

(6) Microsoft Office Excel 2010, Microsoft. Programa estatístico utilizado.