Segundo Sousa (2009, p. 20) deve-se utilizar a regressão linear múltipla quando se está perante observações de amostras com variáveis, , , , …, cujos valores estão relacionados de forma linear entre si.
Um exemplo dado por Henriques (2009, p. 18) é a relação entre o volume de vendas efectuadas num dado período de tempo por um vendedor, a sua pontuação num teste de inteligência e os seus anos de experiência.
Sousa (2009, p. 20) define regressão linear simples como uma relação entre uma variável aleatória dependente, , e duas ou mais variáveis independentes, , com a seguinte expressão:
Que pode ser re-escrita na forma matricial como:
Onde:
:
|
matriz das observações da variável dependente;
|
:
|
matriz das observações da variável independente, ou matriz significativa do modelo;
|
:
|
vector dos parâmetros de regressão a serem estimados;
|
:
|
vector do erro que resulta do facto de ter características aleatórias.
|
Admite-se que , , ..., são variáveis aleatórias independentes de média 0 e desvio padrão .
Da mesma forma que na regressão simples se utiliza o método dos mínimos quadrados para estimar os parâmetros da regra de regressão, o mesmo acontece na regressão múltipla, da qual se obtém que o vector dos parâmetros da regressão é dado por:
Caso ocorra , está-se perante um problema de regressão linear simples, que também pode ser resolvido desta forma.