Logística/Técnicas de previsão/Representação gráfica

A acção mais importante a tomar quando se analisam dados é a sua visualização através de gráficos. As características básicas dos dados, tais como comportamento e valores estranhos são mais facilmente detectáveis em gráficos. Por vezes, os gráficos também sugerem explicações possíveis para algumas variações nos dados. Por exemplo, disputas laborais geralmente afectam as séries temporais da produção; mudanças governamentais afectam séries temporais económicas. Os gráficos são a maneira mais eficaz de identificar o efeito de tais eventos nos dados. O tipo de dados determina o tipo de gráfico mais apropriado (Makridakis, 1998, p. 23-27).


Gráfico temporal e comportamento de série temporal

Para as séries temporais, a representação gráfica mais usual é o gráfico temporal, no qual os dados são representados em função do tempo. Um gráfico temporal revela qualquer tendência ao longo do tempo, comportamento sazonal regular e outras características sistemáticas dos dados. Estas características necessitam de ser identificadas para que possam ser incorporadas num modelo estatístico.

Um passo importante ao seleccionar o modelo de previsão mais apropriado é considerar os tipos de comportamentos dos dados, de modo a que os modelos mais apropriados para esses comportamentos sejam utilizados. Podem-se distinguir quatro tipos de comportamentos em séries temporais:

Figura 1. Série com sazonalidade.
  • Horizontal (H). Verifica-se quando os valores dos dados oscilam em relação a uma média constante, numa série chamada de «estacionária» em relação à média.[1] Dois exemplos são as vendas de um produto que não variam ao longo do tempo e a carta de controlo estatístico de qualidade de um processo de produção contínua.
  • Sazonal (S). A série é influenciada por factores sazonais tais como a estação do ano, o mês, o dia da semana ou a hora do dia. O consumo doméstico de electricidade ou vendas de produtos como gelados e refrigerantes exibem comportamento sazonal. Embora não se repitam exactamente ao longo de cada período, as séries sazonais são por vezes denominadas de periódicas (Figura 1).
Figura 2. Série com ciclicidade.
  • Cíclico (C). Verifica-se quando os dados apresentam subidas e descidas de período variável. Por exemplo, nas séries de dados económicos, tais como as vendas de automóveis, aço e grandes electrodomésticos, as subidas e descidas devem-se, normalmente, a flutuações económicas como as que resultam dos ciclos económicos. Enquanto o comportamento sazonal tem duração, periodicidade e amplitude mais ou menos constantes e um ciclo curto, o comportamento cíclico varia de duração, é mais prolongado e de periodicidade e amplitude mais variáveis (Figura 2).
Figura 3. Série com tendência positiva.
  • Tendência (T). Verifica-se quando existe um aumento ou uma diminuição dos dados a longo prazo como, por exemplo, o que se pode observar em relação às vendas de muitas empresas, o Produto Nacional Bruto (PNB) e muitos outros indicadores económicos e de negócios (Figura 3).

O grande desafio e motivo de interesse por detrás da previsão prende-se com a grande variedade de comportamentos (fruto da combinação dos diferentes tipos de comportamento referidos acima) presentes em séries temporais reais. Como tal, devem ser empregues modelos de previsão capazes de distinguir cada comportamento, caso seja necessário efectuar a separação dos seus componentes, bem como identificar o comportamento e efectuar um melhor ajuste dos dados para que se possam efectuar previsões de valores futuros.


Gráfico sazonal

Um gráfico sazonal [2] é semelhante a um gráfico temporal com os dados para cada época sobrepostos, como se estivessem representados em função da época em que foram observados. Este tipo de gráfico permite observar o comportamento sazonal com mais facilidade, assim como identificar quaisquer desvios substanciais do comportamento sazonal.


Gráfico de dispersão

Figura 4. Gráfico de dispersão.

A relação entre duas variáveis é representada em gráficos de dispersão (Figura 4) que exibem os dados num gráfico bidimensional. A variável resposta é representada no eixo enquanto que no eixo se representa a variável explicativa (Scatter, [2010]).

Os gráficos de dispersão fornecem informação acerca da intensidade, forma (linear, curva), direcção (positiva ou negativa) e presença de valores estranhos na relação entre duas variáveis. São de especial utilidade quando existe um grande número de dados.

O agrupamento de pontos ao longo de uma linha é o resultado da correlação entre as variáveis.


Alisamento de um gráfico de dispersão

O alisamento de um gráfico de dispersão é realizado através do ajuste aos dados de uma linha, que tenta mostrar a componente não-aleatória da associação entre as variáveis. O alisamento pode ser feito através de uma linha recta, uma linha quadrática ou polinomial ou splines de alisamento que permitem uma maior flexibilidade nas associações não-lineares. O melhor ajuste da curva é definido como o ajuste que resulta na soma mínima dos erros quadrados (critério dos mínimos quadrados).[3]

As previsões da variável resposta baseadas no valor da variável explicativa são realizadas usando o alisamento para separar as variações não-aleatórias das variações aleatórias.


Causa e efeito

Não existe necessariamente uma relação causa e efeito sempre que um gráfico de dispersão exibe uma associação entre duas variáveis, pois ambas podem estar relacionadas com uma terceira variável ou pode existir ainda uma outra causa. A associação aparente pode, simplesmente, derivar de um acaso.


Uso

A representação gráfica da relação entre duas variáveis é útil na fase inicial de análise dos dados, antes de se calcular o coeficiente de correlação ou de se ajustar uma curva de regressão, porque pode, por exemplo, ajudar a determinar se um modelo de regressão linear é apropriado ou não.