Duas Variáveis O conceito de Função de Regressão Populacional (FRP) • A cada média condicional é uma função de . Simbolicamente, em que , indica alguma função linear de . Em exemplo hipotético, é função linear de .A equação é conhecida como função de regressão populacional (FRP) de duas variáveis ou, abreviadamente, regressão populacional (RP). Ela expressa simplesmente que a média populacional da distribuição Y, dado X, se relaciona funcionalmente com X. Cont. Que forma assume a função ? É uma questão importante porque, nas situações reais, não temos a população inteira disponível para exame. A forma funcional da FRP é, portanto, uma questão empírica, embora em casos específicos a teoria possa ter algo a dizer. Então, como uma primeira aproximação ou uma hipótese de trabalho, podemos supor que FRP seja uma função linear de , do tipo O significado do termo Linear Uma vez que esta cadeira se ocupa principalmente de modelos lineares como é essencial saber o que significa realmente o termo linear, já que este pode ser interpretado de duas maneiras. Linearidade nas Variáveis O primeiro- e talvez mais ‘’natural’- significado de linearidade é que a expectativa condicional de Y é função linear de X. Cont. Geometricamente, a curva de regressão neste caso é uma reta.
Linearidade nos Parâmetros
A segunda interpretação de linearidade é que a expectativa condicional de Y, E(Y/X), é uma função linear dos parâmetros, os Bs, isso pode ou não ser linear na variáveis. Linearidade nos Linearidade nas Resultado exemplo parâmetros variáveis
Sim Sim MRL
Sim Não MRL
Não Sim Não é MRL
Não Não Não é MRL
Especificação Estocástica da FRP Podemos expressar o desvio de um Y, individual em torno do seu valor esperado, assim: ou em que o desvio é uma variável aleatória não-observável que pode assumir valores positivos ou negativos. Tecnicamente, é conhecido como termo erro estocástico ou perturbação estocástica. Ler página 28,29,30 Damodar N. Gujarati A função de Regressão Amostral Agora é a hora de encaramos os problemas da amostragem, já que temos na maioria das situações práticas é somente uma amostra de valores Y correspondentes a alguns Xs fixos. Por isso, nossa tarefa agora é estimar a FRP com base nas informações da amostra. Para podermos determinar o valor médio da população nos usamos a amostra porque na maioria das vezes não temos a população interna para um determinado estudo. Tabela1 tabela2 Y X Y X 70 80 55 80 65 100 88 100 90 120 90 120 95 140 80 140 110 160 118 160 115 180 120 180 120 200 145 200 140 220 135 220 155 240 145 240 150 260 175 260 Cont. A questão é: pela amostra da tabela 1, podemos prever o consumo médio semanal Y, da população como um todo, correspondente aos Xs escolhidos? Em outras palavras, podemos estimar a FRP a partir dos dados da amostra? Como vocês devem suspeitar, não conseguiremos estimar a FRP ‘’acuradamente’’ por causa das flutuações da amostragem. Para ver isso supunha que tiramos uma amostra aleatória da população tabela 1 e 2. Cont. consumo
200 FRP2
FRP1 150
100
50
80 100 120 140 160 180 200 260
Renda Cont. Agora, analogamente à FRP, que fundamenta a recta da população, podemos desenvolver o conceito de função de regressão amostral (FRA) para representar a recta de regressão amostral temos a equação: em que = estimador de E(Y/X) = estimador de = estimador de Cont. Observe que um estimador, também conhecido como uma estatística (da mostra), é simplesmente uma regra, fórmula ou método que nos diz como estimar o parâmetro da população a a partir das informações dadas pela amostra disponível. representa o termo resíduo (da amostra). Conceitualmente, é uma estima de O Problema da estimativa A nossa tarefa é estimar a função de regressão populacional (FRP) com base na função de regressão amostral (FRA) de tão acurado possível. Há vários métodos de construção da FRA, mas, no que interessa à análise de regressão, o método utilizado com mais frequência é o método dos mínimos quadrados ordinários (MQO). MQO O método dos mínimos quadrados ordinários é atribuído a Carl Friedrich Gauss, um matemático alemão. Sob certas hipóteses, o método dos mínimos quadrados tem algumas propriedades estatísticas muito atraentes, que fizeram dele um dos mais poderosos e populares métodos de análise de uma regressão. formulas Exemplo Y X