Sousa (2009, p. 20) define regressão linear múltipla como uma relação entre uma variável aleatória dependente, , e variáveis independentes, , , …, , com a seguinte expressão:
Onde, tal como no caso da regressão simples, se utiliza o método dos mínimos quadrados para determinar os parâmetros
De acordo com Henriques (2009, p. 22), a expressão acima pode ser re-escrita na forma matricial como:
Onde:
:
|
matriz das observações da variável dependente;
|
:
|
matriz das observações da variável independente, ou matriz significativa do modelo;
|
:
|
vector dos parâmetros de regressão a serem estimados;
|
:
|
vector do erro que resulta do facto de ter características aleatórias.
|
Admite-se que , , ..., são variáveis aleatórias independentes de média 0 e desvio padrão .
Da mesma forma que na regressão simples se utiliza o método dos mínimos quadrados para estimar os parâmetros da regra de regressão, o mesmo acontece na regressão múltipla, da qual se obtém que o vector dos parâmetros da regressão é dado por:
Caso ocorra , está-se perante um problema de regressão linear simples, que também pode ser resolvido desta forma.
Um exemplo de regressão múltipla, dado por Henriques (2009, p. 18), é a relação entre o volume de vendas efectuadas num período de tempo por um vendedor, os seus anos de experiência, e a sua pontuação num teste de inteligência.