Você está na página 1de 10

FACULDADE ESTADUAL DE CINCIAS E LETRAS DE CAMPO MOURO CURSO DE ENGENHARIA DE PRODUO AGROINDUSTRIAL DEPARTAMENTO DE ENGENHARIA DE PRODUO AGROINDUSTRIAL DISCIPLINA

DE METODOS ESTATISTISCOS APLICADA A ENGENHARIA

Joice Kelli Menegarde

Correlao Linear, Regresso Linear Simples e Mltipla

CAMPO MOURO 2010

Joice Kelli Menegarde

Correlao Linear, Regresso Linear Simples e Mltipla

Trabalho elaborado como requisito bsico para obteno de nota parcial no 2 bimestre na disciplina de Mtodos Estatisticoss aplicados a Engenharia. Disciplina do Curso de Engenharia de Produo Agroindustrial. Ministrada pelo Professor Luciano Ferreira

CAMPO MOURO 2010

1 CORRELAO LINEAR

Em Costa (2010) o termo de Correlao tem como significado a relao entre dois sentidos sendo este utilizado na Estatstica para indicar a fora que mantm conectados dois conjuntos de valores. Exemplo 1 Costa (2005) - Vamos imaginar que tenhamos sorteados 5 pessoas adultas (mais de 30 anos), num centro urbano, e que a cada uma tenham sido feitas as seguintes perguntas 1 Durante quantos anos voc freqentou a escola regularmente a escola? 2 quantos livros voc tem em sua biblioteca (estante, armrio particular)? Resoluo: Admitamos pela Tabela 1 que as respostas obtidas tenham sido: Tabela 1 Respostas Obtidas
Sujeitos Freqentou escola (anos):X Biblioteca particular (livros): Y
Fonte: Costa (2005)

A 5

B 8

C 10

D 12

E 15

50

10

30

45

50

75

210

Sendo o representante do nmero de anos que cada sujeito freqentou escola. o sujeito E freqentou

Por exemplo o sujeito C freqentou .

Ento i=5 corresponde ordem, da esquerda pra direita, em que se encontra o sujeito E. Onde representa o nmero de livros que cada desses sujeitos tem em sua

biblioteca particular. Assim o sujeito C possui Observando as mdias aritmticas acima, verificamos que para cada 10 anos de escola (em mdia), o sujeito correspondente possui 42 Livros (tambm em mdia).

Ainda em Costa (2010) a media aritmtica sozinha precria para revelar bem a fora que mantm unidas as variveis X e Y. Sendo assim utilizada a estatstica de Pearson chamada de coeficiente de correlao.

1.1 Coeficiente de Correlao Linear

Segundo Costa (2005) este nome foi Introduzido por F.Y Edgerworth, sendo este conceito de correlao devido a Bravis. Person foi a quem coube o mrito de desenvolver a Frmula de . Para este clculo de . necessrio encontra primeiro o . Posteriormente deve-se valor das seguintes quantidades

acertar essas quantidades convenientemente numa frmula:

Retornando ao exemplo da Seo 1 vamos a Tabela 2 onde foram calculadas as quantidades: Tabela 2 Quantidades Calculadas
Sujeito Escolaridade Xi (anos) A B C D E
Fonte: Costa (2005)

Biblioteca Yi (livros) 10 30 45 50 75 210 50 240 450 600 1125 2465 25 64 100 144 225 558 100 900 2025 2500 5625 11150

5 8 10 12 15 50

Costa (2005) diz que o n da formula naturalmente corresponde ao nmero de pares de informaes, isto , n=5.

2. REGRESSO LINEAR

2.1 Regresso Linear Simples

Em Reis (1994) a Regresso Linear em estatstica um mtodo para estimar o valor esperado de uma varivel Y, onde so dados os valores de X. Trata-se da estimao de um valor esperado. chamado de Regresso Linear por considerar que a relao da resposta as variveis uma funo linear de alguns parmetros. Os modelos de regresso que no so uma funo linear so chamados de regresso no linear. Reis (1994) diz que para estimar o valor esperado, usa-se a equao que determina as variveis X e Y.

Em Leme (1970) a configurao matemtica mais simples que a funo pode assumir ( ) , onde, denominada a regresso linear sem termo

independente de x, correspondendo a uma reta a qual passa pela origem. Assim

Onde:

- Varivel explicada (dependente); o valor que se quer atingir;

- uma constante que representa a interceptao da reta com o eixo vertical; - outra constante que define o declive da reta; - varivel explicativa (independente), representando fator explicativo na equao; Varivel que inclui todos os fatores residuais mais os possveis erros de medio, tendo um comportamento aleatrio, devido natureza dos fatores que encerra. Para que essa 2.1 Calculando os fatores e

Por Reis (1994) so definidos

, tendo e se relacionam por:

Exemplo 2: A pesquisadora deseja encontrar o modelo de regresso da porcentagem de acertos sobre o tamanho da cache. Tabela 3 Valores de quantidades calculadas 2
Tamanho da cache (X) Porcentagem de acertos (Y)

(X i X )

(Yi Y )

( X i X )(Yi Y )

(X i X )2

(Yi Y ) 2

Total = 3900000 Mdia = 325000

584,52 48,71

2408500

37500000000

181,438

Assim, estimamos que a porcentagem de acerto da cach aumente cerca de 0,00006 % para cada byte do tamanho da cach.

2.2 Regresso Linear Polinomial

Segundo Leme (1970) esse modelo de regresso pode ser generalizado para o caso em que a varivel funo y depende dos valores assumidos x1, x2 ... xm por m Variaveis independentes. Neste exemplo de aplicao visto a aplicao do modelo Dada a seguinte srie de termos de valores (Silva e Leme O Processo simples na regresso mltipla Boletim de Estatstica Aplicada a Engenharia, n 3, 1957, Escola Politcnica)
x 1 1 1 1,5 2 2,5 3 w 1 2 3 2 1 3 2 y 6,9 12,2 19,0 16,7 11,9 33,4 26,4

Estimando os parmetros de regresso: ( Soluo: )

Temos a regresso:

Cujas estimativas dos parmetros a1, a2 e b2, so dadas pelo sistema

Substituindo os coeficientes do sistema pelos valores calculados diretamente dos dados:

Obtemos:

Ou a seguinte regresso: Substituindo os valores:

3. O MODELO MATEMTICO

Segundo a Faculdade de Economia, Administrao e Contabilidade da USP FEA/USP a equao da regresso mltipla tem a forma seguinte:

Yc = a + b1x1 + b2x2 + ... + bkxk, onde: a = intercepto do eixo y; bi = coeficiente angular da i-sima varivel; k = nmero de variveis independentes. ou, como define WONNACOTT (1981, p. 326):

YI = + XI + ZI + EI Ainda em FEA/USP interpretado geometricamente como o coeficiente angular do plano, na medida em que nos deslocamos na direo do eixo dos Xs, mantendo Z constante: , assim, o efeito marginal da varivel X sobre Y. Continuando em FEA/USP o coeficiente do plano na medida em que nos movemos na direo do eixo dos Zs, mantendo X constante: , assim, o efeito marginal da varivel Z sobre Y. Enquanto uma regresso simples de duas variveis resulta na equao de uma reta, um problema de trs variveis implica num plano, e um problema de k variveis implica em um hiperplano.Na regresso mltipla, nosso melhor ajustamento para Y, neste mesmo contexto, no um plano, mas sim uma reta, segundo FEA/USP. Quando duas variveis independentes X e Z so colineares, ou quase colineares (isto , altamente correlacionadas), temos o problema da multicolinearidade (no caso de 2 variveis, apenas colinearidade).De forma anloga regresso simples, isso no gera problemas na predio de Y, desde que no procuremos predizer a partir de valores de X e Z afastados de nossa reta de colinearidade. Entretanto no possvel investigar a influncia de X somente (ou Z somente) sobre Y( FEA/USP). O problema da multicolinearidade surge, num exemplo simples, quando um pesquisador considera X como a quantidade de fertilizante em libras por are e comete o erro de medir a quantidade de fertilizante em onas por are, usando-a como outro regressor, Z.Como qualquer peso avaliado em onas deve ser 16 vezes seu valor em libras (Z = 16X), todas as combinaes de X e Z devem recair sobre esta reta, num exemplo de colinearidade perfeita.Mais sutilmente, a colinearidade pode surgir, por exemplo, quando so usados dois regressores medidos em termos de preos, exigindo cuidado especial para que tal fato no ocorra ( FEA/USP).

REFERENCIAS

COSTA, S. F. Introduo Ilustrada Estatstica. 4 edio, Harbra, So Paulo, 2005.

Faculdade de Economia, Administrao e Contabilidade da USP FEA/USP. Disponivel em < www.erudito.fea.usp.br/.../Regresso%20Mltipla_Dummy.doc > Acesso em 28/07/2010.

LEME, R.A. DA S. Curso de Estatistica. 3 Edio. Livro Tecnico S.A., Rio de Janeiro, 1970.

REIS, E., Estatistica Descritiva. 2 Edi. Lisboa: Edies Slabo, 1994

Você também pode gostar