Iniciação à Pesquisa Científica em Saúde/ REPOSITÓRIO DE EXERCÍCIOS RESOLVIDOS/ Exercício 54: O grupo controle
Questão 54 - O grupo controle
editarSuponha que um pesquisador, queira comparar a ingestão calórica diária entre adultos obesos e adultos com peso adequado para idade e sexo. Ao analisar os dados seu estudo clínico, do tipo caso-controle, quer certificar-se que o grupo controle que selecionou é realmente constituído por indivíduos que consomem em média 2000Kcal/dia. Dado que o grupo selecionado para controle informou valores de consumo diário registrados na tabela a seguir, avalie estatisticamente tal hipótese.
- Calcule o valor médio, desvio padrão e um intervalo de confiança de 95% para a média
- Formule um teste de hipóteses, usando erro alfa de 5% e o resolva, explicando seus passos.
- O resultado do teste de hipóteses e o intervalo de confiança são coerentes?
Consumo calórico diário (Kcal/dia) | |
---|---|
1 | 1790 |
2 | 2004 |
3 | 1897 |
4 | 2360 |
5 | 1990 |
6 | 2005 |
7 | 2006 |
8 | 1995 |
9 | 1760 |
10 | 1670 |
11 | 1930 |
12 | 2340 |
13 | 2030 |
14 | 1990 |
15 | 1880 |
16 | 2004 |
17 | 2040 |
18 | 1967 |
19 | 2010 |
20 | 1850 |
21 | 1680 |
22 | 2010 |
23 | 1790 |
24 | 2146 |
25 | 2310 |
Explique suas respostas e fundamente-as com referências bibliográficas.
Resposta da questão:
editarAntes de iniciar a resolução da questão, vale ressaltar que um estudo do tipo caso-controle, ou estudo observacional retrospectivo, é um estudo observacional, ou seja, os pesquisadores observam e medem características do sujeito, e não implica em uma modificação do sujeito objeto do estudo, o que o difere do estudo experimental. Nesse tipo de estudo, dois grupos são escolhidos a partir da presença ou ausência do desfecho, assim, o desfecho é o ponto de partida e determina a seleção ou agrupamento. Os dados são coletados do passado, voltando-se no tempo (através de exames de registros, entrevistas e assim por diante).
- Calcule o valor médio, desvio padrão e um intervalo de confiança de 95% para a média.
A média ou valor médio ( ) de um conjunto de valores é calculada como a soma de todas as observações de um conjunto de dados, no caso, a soma de todos os valores de consumo calórico diário ( ), e divisão do resultado pelo número total de medidas, no problema, o número total de dados de consumo calórico diário (ou número total de participantes - ). Sabendo-se a definição de média, é fácil calcular seu valor no caso em questão:
Logo, o valor médio do consumo calórico diário dos participantes é 1978,16 Kcal/dia, como demonstrado pelo cálculo acima.
O desvio padrão de um conjunto de valores amostrais, denotado por , é uma medida da variação dos valores em torno da média. É uma espécie de desvio médio da variação dos valores em torno da média. O desvio padrão é calculado através da fórmula abaixo.
Portanto, o valor do desvio padrão do consumo calórico diário dos participantes é 178,4549, como através da fórmula acima, utilizando o programa Excel 2010.
O intervalo de confiança (IC) é uma faixa de valores usada para se estimar o verdadeiro valor de um parâmetro populacional. Para calcular IC de 95% para a média, deve-se utilizar a fórmula a seguir, pois o desvio padrão já é conhecido (178,4549). Vale ressaltar que a equação abaixo nos fornece os valores de consumo calórico diário limites do intervalo de confiança de 95%. O valor de é tabelado e, para um intervalo de confiança de 95%, esse valor é 1,96.
Assim, o intervalo de confiança de 95% para a média é a faixa de valores compreendida entre 1908,2 e 2048,1 Kcal/dia.
- Formule um teste de hipóteses, usando um erro alfa de de 5% e o resolva, explicando seus passos.
Um teste de hipóteses é um procedimento para se testar uma afirmativa sobre uma propriedade da população, no caso, a ingestão calórica diária do grupo controle. Ele é dividido em etapas, sendo elas: identificações da hipótese nula (H0) e da hipótese alternativa (Ha); cálculo do valor da estatística do teste; identificação dos valores críticos, dado um nível de significância; identificação do valor p; e estabelecimento da conclusão do teste em termos simples.
Antes de iniciar as etapas do teste, é interessante fazer uma análise exploratória de dados:
- Conheça seus dados: os dados trabalhados são valores de consumo calórico diário do grupo controle e média de ingestão calórica diária de 2000 Kcal/dia.
- Número de casos é suficiente (amostra)? São apenas 25 casos, ou seja, estamos trabalhando com uma amostra.
- Dados independentes/dependentes (medidas repetidas): os dados em questão são independentes (os dados de consumo diário de cada participante são independentes da média de ingestão calórica diária de 2000 Kcal/dia).
- Avalie valores discrepantes: é possível observar valores discrepantes através de um histograma de frequência. No caso, não houve valores discrepantes.
- Descreva variáveis e sua distribuição: a ingestão calórica diária é um valor que pode ser inteiro ou racional, portanto, trata-se de uma variável numérica (quantitativa) contínua. A distribuição é normal, conforme mostrado pela curva normal no histograma de frequências na imagem acima.Como estamos lidando com comparação de médias (média da ingestão calórica diária dos participantes do teste e média de ingestão diária pré-estabelecida), o teste estatístico recomendado para o caso é o teste de média (teste-t). O teste-t de médias é um tipo de teste estatístico que utiliza observações independentes, compara médias entre duas amostras, o grupo de pessoas selecionadas só participa do teste uma vez e a distribuição da variável é normal. Para a utilização desse teste, o verdadeiro valor do desvio padrão populacional ( ) é desconhecido.
Além disso, como estamos lidando com uma Ha que leva em consideração valores de ingestão calórica diária diferentes, tanto maiores quanto menores, o teste em questão é também bicaudal (observe a imagem ao lado). Em um teste bicaudal (ou bilateral), a região crítica está nas duas regiões extremas (caudas) sob a curva de distribuição. Caso o teste considerasse apenas uma hipótese (ser maior ou menor), este seria unicaudal (à esquerda ou à direita).
1. Determinação da H0 e da Ha
A hipótese nula (Ho) é uma afirmativa de que o valor de um parâmetro populacional (como proporção, média ou desvio padrão) é igual a algum valor especificado. Testa-se a hipótese nula diretamente no sentido de que assumimos (ou supomos) que seja verdadeira e chegamos a uma conclusão de rejeitá-la ou deixar de rejeitá-la. A hipótese alternativa (Ha) é a afirmativa de que o parâmetro tem um valor que, de alguma forma, difere da hipótese nula. No caso em questão, queremos saber se a ingestão calórica diária de pessoas obesas e de pessoas com peso adequado para idade e sexo, ou seja, do grupo controle, é igual ao valor médio de ingestão calórica diária pré-estabelecido (2000 Kcal/dia). Assim, tem-se:
Ho: A ingestão calórica diária do grupo selecionado para controle é igual ao valor médio de ingestão calórica diária pré-estabelecido (2000 Kcal/dia).
Ha: A ingestão calórica diária do grupo selecionado para controle não é igual ao valor médio de ingestão calórica diária pré-estabelecido (2000 Kcal/dia).
2. Cálculo do valor de estatística do teste
Para calcular o valor de estatística do teste-t, é necessário utilizar a fórmula abaixo:
Também é possível calcular o valor de estatística do teste através do programa estatístico MedCalc, como mostrado na imagem.
3. Identificação dos valores críticos – escolha do nível de significância
O nível de significância é a probabilidade de a estatística de teste cair na região crítica quando a hipótese nula for realmente verdadeira. Se a estatística de teste cair na região crítica, rejeita-se a hipótese nula, de modo que (alfa) é a probabilidade de cometermos o erro de rejeitar a hipótese nula quando ela é verdadeira. O valor de significância, ou erro , é de 5%, conforme foi informado no enunciado.
4. Identificação do valor p
O valor p é a probabilidade de se obter um valor da estatística de teste que seja, pelo menos, tão extremo quanto aquele que representa os dados amostrais, supondo que a hipótese nula seja verdadeira. Valores p podem ser encontrados depois de se encontrar a área além da estatística do teste. Caso o valor p seja maior do que 0,05, se aceita a hipótese nula, em caso contrário (menor do que 0,05), rejeita-se a hipótese nula e se aceita a hipótese alternativa. O programa estatístico MedCalc informa o valor de p, que, no caso em questão, é p = 0,5463.
5. Conclusão do teste
Através do valor obtido de p, que foi maior do que 0,05, se aceita a hipótese nula (H0) e rejeita-se a hipótese alternativa (Ha), como explicado acima. Assim, devemos considerar, com 95% de confiança, que a ingestão calórica diária do grupo selecionado para controle é igual ao valor médio de ingestão calórica diária pré-estabelecido (2000 Kcal/dia).
- O resultado do teste de hipóteses e o intervalo de confiança estão coerentes?
O resultado obtido com o teste de hipóteses para o intervalo de confiança (IC) de 95% para a média foi o intervalo dos valores de ingestão calórica diária entre 1904,4974 e 2051,8226 Kcal/dia, como mostrado através da utilização do programa MedCalc. Esse valor de IC foi muito próximo do encontrado no primeiro item da questão (1908,2 e 2048,1 Kcal/dia), quando este foi calculado sem a utilização do programa. Quando se compara o resultado do teste de hipóteses com o IC, percebe-se que há coerência entre esses dados, pois o valor médio de ingestão calórica diária pré-estabelecido para os indivíduos (2000 Kcal/dia) está inserido no IC que corresponde aos valores nos quais ele (valor médio pré-estabelecido) equivaleria à média da amostra.
Indexadores do tema deste exercício
editarBibliografia
editar(1) TRIOLA, M. F. Introdução à estatística: atualização da tecnologia. 11ª Edição. Rio de Janeiro: LTC, 2015.
(2) PAGANO, M.& GAUVREAU, K.. Princípios de Bioestatística. 2ª Edição. São Paulo: Thompson Heinle, 2004.
(3) Cálculo e interpretação do p-valor, Portal Action. Disponível em: <http://www.portalaction.com.br/inferencia/512-calculo-e-interpretacao-do-p-valor>. Acesso em 21 de novembro de 2016.
(4) Free statistical calculators, MedCalc. Disponível em: <https://www.medcalc.org/calc/test_one_mean.php>. Acesso em 21 de novembro de 2016.
(5) IBM SPSS Statistics 19, IBM. Programa estatístico utilizado.
(6) Microsoft Office Excel 2010, Microsoft. Programa estatístico utilizado.