Você está na página 1de 3

em que Y representa o fenômeno em estudo (variável dependente quantitativa), a

representa o intercepto (constante ou coeficiente linear), bj (j = 1, 2, ..., k) são os


coeficientes de cada variável (coeficientes angulares), Xj são as variáveis explicativas
(métricas ou dummies) e u é o termo de erro (diferença entre o valor real de Y e o valor
previsto de Y por meio do modelo para cada observação). Os subscritos i representam cada
uma das observações da amostra em análise (i = 1, 2, ..., n, em que n é o tamanho da
amostra).

Resíduo: diferença do modelo teórico x realidade. devem ter distribuição normal e variância
constante (plotar gráfico); se a variãncia não for constante , teremos um caso de
heterocedasticidade. nesse caso a suposição nao atende
https://www.youtube.com/watch?v=usTzmEGibco&t=627s

Dummies: Ajuste feito quando se tem variáveis categóricas

Interpolação e extrapolação: https://qastack.com.br/stats/418803/extrapolation-v-


interpolation#:~:text=Em%20ess%C3%AAncia%2C%20a%20interpola%C3%A7%C3%A3o
%20%C3%A9,al%C3%A9m%20do%20suporte%20de%20dados%20.&text=Uma%20raz
%C3%A3o%20para%20a%20distin%C3%A7%C3%A3o,estatisticamente%2C%20se%20n
%C3%A3o%20na%20pr%C3%A1tica.

Anova: Análise de variância

Segundo Fávero et al. (2009), se conseguirmos, por exemplo, encontrar uma variável que
explique 40% do retorno das ações, num primeiro momento pode parecer uma capacidade
explicativa baixa. Porém, se uma única variável conseguir capturar toda esta relação numa
situação de existência de inúmeros outros fatores econômicos, financeiros, perceptuais e
sociais, o modelo poderá ser bastante satisfatório.

Teste F:Inicialmente, é de fundamental importância que estudemos a significância estatística


geral do modelo estimado. Com tal finalidade, devemos fazer uso do teste F, cujas hipóteses
nula e alternativa, para um modelo geral de regressão, são, respectivamente: o teste F avalia a
significância conjunta das variáveis explicativas, acaba por não se definir qual ou quais destas
variáveis consideradas no modelo apresentam parâmetros estimados estatisticamente
diferentes de zero, a determinado nível de significância.

Método dos mínimos quadrados: Usado para encontrarmos os coeficientes de cada


variável na equação
hipótese do nulo:

Estatisticamente significativo: valor p <0,05

Graus de liberade: Esse é o tipo de ideia que há por trás dos graus de liberdade na
estatística. Em geral, os graus de liberdade são definidos como o número de
"observações" (pontos de dados individuais) nos dados que são livres para variar
quando é feita a estimativa dos parâmetros estatísticos.

Mas suponha que você queira testar a média populacional com uma amostra de 10
valores, e que utilize um teste t para 1 amostra. Agora você tem uma restrição — a
estimativa da média. O que é essa restrição, exatamente? Para a definição de média, a
seguinte relação deve ser mantida: A soma de todos os valores nos dados deve ser igual
a n x a média, em que n é o número de valores no conjunto de dados.
Portanto, se um conjunto de dados tiver 10 valores, a soma dos 10 valores deverá ser
igual à média x 10. Se a média dos 10 valores for 3.5 (você pode escolher qualquer
número), essa restrição exige que a soma dos 10 valores seja igual a 10 x 3.5 = 35.

Com essa restrição, o primeiro valor no conjunto de dados é livre para variar. Seja qual
for o valor, ainda é possível que a soma de todos os 10 números tenha o valor de 35. O
segundo valor também é livre para variar, porque não importa o valor escolhido, ele ainda
possibilita que a soma de todos os valores seja 35.

Lembre-se de que, de maneira geral, os graus de liberdade são iguais ao número de


observações (pontos de dados) menos o número de parâmetros estimados. Quando você
realiza a regressão, um parâmetro é estimado para cada termo no modelo e cada um
deles consome um grau de liberdade. Portanto, incluir termos em excesso em um modelo
de regressão múltipla reduz os graus de liberdade disponíveis para estimar a
variabilidade dos parâmetros. Na verdade, se a quantidade de dados não for suficiente
para o número de termos em seu modelo, pode não haver graus de liberdade (GL)
suficientes para o termo de erro e nenhum valor-p ou valores-F poderão ser calculados de
forma alguma. Você terá uma saída assim:

Você também pode gostar