Você está na página 1de 20

Regressão Linear e correlação

Prof. Jorge Targino

Em experimentos que procuram determinar a relação existente entre duas ou mais


variáveis, dois tipos de situação podem ocorrer:
a) Uma variável (X) pode ser medida minuciosamente e seu valor escolhido pelo
experimentador. Por exemplo, a dose de uma droga a ser administrada no animal.
Esta variável e chamada de variável independente. A outra variável (Y), chamada
variável dependente ou resposta, está sujeita a erro experimental, e seu valor
depende do valor escolhido para a variável independente. Assim, a resposta (Y) é uma
variável dependente da variável independente (X). Este é o caso da regressão.
b) As duas variáveis estão sujeitas a erros experimentais, isto é, erros de natureza
aleatória, inerentes ao experimento. Por exemplo, produção de leite e produção de
gorduras medidas em vacas em lactação. Este tipo de associação entre duas variáveis
constitui o caso da correlação.
Em estatítica, regressão linear é um método para se estimar a condicional (valor esperado)
de uma variável y, dados os valores de algumas outras variáveis x. A regressão, em geral, trata
da questão de se estimar um valor condicional esperado. É frequente, no cotidiano, termos
não só que explicar fatos, observado por nós mesmos ou por outras pessoas, como fazer
estimativas ou previsões sobre suas ocorrências futuras. Tais exigências podem ser
atendidadas quando, dado o fenômeno, conhecem-se suas variáveis significativas e o modo
como elas se relacionam.

Ao conjunto das variáveis consideradas, combinando com o modo como elas se relacionam,
dá-se o nome de “modelo matemático” do fenômeno. Quanto a qualidade de um dado
modelo, duas observações devem ser feitas: uma, é que ela é diretamente proporcional à
significância das variáveis para o fenômeno considerado; outra, é que, na prática, modelos
preditos são impossíveis simplesmente porque não há como identificar, e muito menos
controlar, todas as variáveis envolvidas nos fenômenos em estudo (exceção feita a alguns
testes realizados em condições muito especiais em laboratório).

Portanto, os resultados fornecidos pelos modelos são sempre, bem ou mal, aproximados. Isso
faz com que os modelos precisem ser avaliados antes de aplicados. Para medir a qualidade de
um dado modelo matemático podemos aplicá-lo a situações reais cujos resultados reais com
os teóricos, obtivermos valores razoavelmente próximos, o modelo é bom. No entanto, se
1
constatarmos grandes disparidades entre eles, deveremos reavaliar tanto as variáveis
consideradas quanto as relações entre elas. A regressão linear é chamada "linear" porque se
considera que a relação da resposta às variáveis é uma função linear de alguns parâmetros. Os
modelos de regressão que não são uma função linear dos parâmetros se chamam modelos de
regressão não-linear.

Principais Aplicações

Enquanto as técnicas de regressão são largamente utilizadas nas atividades em que o


planejamento do futuro próximo é fundamental (particularmente nas administração das
organizações), as técnicas de correlação tem uso frequente nas chamadas “ciências do
comportamento”, tais como educação, psicologia e sociologia. Tais técnicas podem ser
aplicadas para se determinar e avaliar a relação existente entre variáveis diversas, como, por
exemplo, a distribuição do consumo de cerveja pelos meses do ano, os gastos gerais do
orçamento de uma família em função de sua renda mensal e do número de dependentes, a
variação da produção agrícola de uma região em razão do uso de diferentes tipos de
fertilizantes, a importação e consumo de petróleo em comparação com a produção de veículos
automotores, o aumento nas vendas devido a uma nova campanha publicitária e/ou nos
preços e até o número de nascidos em fevereiro dado o número de casamentos em maio. Mas
o que vem a ser ou qual a diferença entre regressão e correlação?
Regressão e correlação são técnicas estatísticas baseadas nos conceitos de amostragem que
permitem saber se – e como – duas ou mais variáveis estatísticas, de uma mesma população
ou não, estão relacionadas umas com as outras. Tais técnicas têm as seguintes funções
básicas: a regressão fornece as equações que relacionam as variáveis consideradas; com essas
equações faremos as predições sobre o comportamento futuro do fenômeno, a correlação
mede o grau (ou qualidade) da relação entre essas mesmas variáveis (isso também mede,
indiretamente de modo tal que o grau de correlação seja uma das variáveis das próprias
equações de regressão.
Elas podem classificar-se quanto ao número de variáveis ou quanto à qualidade da relação.
Quanto ao número temos as simples: quando uma variável independente explica bem o
fenômeno ou as Múltiplas: quanto o fenômeno exige mais de uma variável indenpendente
para sua boa explicação. Quanto à qualidade temos as Lineares: quanto os fenômenos podem
ser razoavelmente bem explicados por equações do 1º grau, ou Não lineares: quando os
fenômenos não podem ser adequadamente explicados por equações do 1º grau, exigindo
funções de ordem superior.
Análise de Regressão
2
Definição
A análise de regressão fornece uma funçao matemática que descreve as relações entre
duas ou mais variáveis. A natureza da relação é caracterizada por essa função ou equação de
regressão.
Essa equação pode ser usada´para estimar ou predizer valores futuros de uma variável,
com base em valores conhecidos ou supostos, de uma ou mais variáveis relacionadas. A
análise de regressão é útil em agricultura, veterinária, engenharia, administração, economia
etc.

Procedimento Matemático
Em termos matemáticos, e para funções simples (uma variável dependente explicada
por uma única independente), o processo consiste nas seguintes etapas:

 Correlação e Regressão Simples: envolve somente duas variáveis


 Correlação e Regressão Múltipla: envolve mais de duas variáveis

Para poder explicar os modelos desenvolvidos para análise de regressão, torna-se


importante diferenciar os modelos matemáticos e os modelos estatísticos. O modelo
matemático descreve uma relação entre diferentes variáveis. Por exemplo, um modelo
matemático descrê uma relação entre duas variáveis, do tipo y = f(x), ou então y = a + bx, pode
ser apresentado graficamente pela figura seguinte.
Observe que os valores de x estão diretamente associados aos valores de y que são
inteiramente explicados pelos valores de x. Portanto, quando x = 3 temos y=6
Já o modelo estatístico costuma envolver a determinação do melhor modelo exato ou
preciso. Se aceita que, uma relação do tipo y= a + bx, possa existir outras variáveis que
interfiram nos valores de Y. O modelo matemático pode ser representado por y = a + bx + e,
onde e consiste em um erro associado ao processo de terminação dos valores de y como base
em x Veja a figura 2. O processo de estimação do modelo deve ser feito de forma a diminuir
ao máximo possível os valores dos erros encontrados.
Observe que os valores de x estão diretamente associados aos valores de y que são
inteiramente explicados pelos valores de x. Portanto, quando x = 3 temos y=6
Já o modelo estatístico costuma envolver a determinação do melhor modelo exato ou
preciso. Se aceita que, uma relação do tipo y= a + bx, possa existir outras variáveis que
interfiram nos valores de Y. O modelo matemático pode ser representado por y = a + bx + e,
onde e consiste em um erro associado ao processo de terminação dos valores de y como base

3
em x Veja a figura 2. O processo de estimação do modelo deve ser feito de forma a diminuir
ao máximo possível os valores dos erros encontrados.
Figura1

Observe que os valores de x estão diretamente associados aos valores de y que são
inteiramente explicados pelos valores de x. Portanto, quando x = 3 temos y=6
Já o modelo estatístico costuma envolver a determinação do melhor modelo exato ou
preciso. Se aceita que, uma relação do tipo y= a + bx, possa existir outras variáveis que
interfiram nos valores de Y. O modelo matemático pode ser representado por y = a + bx + e,
onde e consiste em um erro associado ao processo de terminação dos valores de y como base
em x Veja a figura 2. O processo de estimação do modelo deve ser feito de forma a diminuir
ao máximo possível os valores dos erros encontrados.

4
Figura 2
Regressão Linear Simples
O termo regressão é usado para designar a expressão de uma variável dependente (Y)
em função de outra (X), considerada independente. Diz-se regressão de Y sobre X. Se a relação
funcional entre elas é expressa por uma equação de 1º grau, cuja representação geométrica é
uma linha reta, a regressão é dita linear.
Postulada a existência de uma relação linear entre duas variáveis, pode-se representar
aquele conjunto de pontos pela equação da reta: yi = a + bxi, que expressa o valor de Y em
função de X.
Y é a variável dependente, ou resposta
X é a variável independente, ou explanatória
É importante ressaltar que a análise simples de regressão linear apenas se preocupa em
determinar a forma numérica de associação entre x e Y. Não estabelece nenhuma relação de
causa.
No processo de determinação da equação de regressão linear simples, objetiva-se elaborar
a equação geral da reta, como o modelo y = ax + b. Assim, devem ser determinadas as duas
constantes.
No processo de valores das constantes a e b, costuma-se aplicar o método dos mínimos
quadrados, desenvolvidos originalmente por Legendre e aperfeiçoados pelas idéias de Galton
e Pearson. O método permite obter o valor das duas constantes a e b, determinando a reta
estimada, ou equação de regressão. Não será desenvolvida aqui a dedução das fórmulas, no
entanto ao aplicarmos o método dos mínimos quadrados teremos três características
importantes relacionadas como a reta obtida:

5
a) É mínima a soma dos quadrados dos desvios para a reta de regressão, menor que a de
qualquer outra reta de ajuste;
b) É igual a zero a soma algébrica dos desvios verticais entre o valor da ordenada de dada
ponto da amostra analisada e correspondente ordenada da reta estimada;
c) A reta estimada passa pelo ponto de coordenadas (x,y), que correspondem à medida
dos pares da amostra.
A reta estimada de regressão é y = a + bx, onde:
Y= valor calculado na reta de regressão para os valores de x
a = ordenada do intercepto da reta no eixo y
b= coeficiente angular da reta de regressão
O método dos mínimos quadrados determina que a e b devem ser obtidos de modo que:

(∑ X )(∑ Y )
∑ XY − n ∑X ∑Y
b= e a = Y − b X onde X = eY=
(∑ X )2 n n
∑X 2

n
Há algumas hipóteses a serem consideradas na aplicação do método dos mínimos
quadrados:
a) Para cada valor de x haverá possíveis valores para y
b) A variável y é aleatória
c) Para cada valor de x há uma distribuição condicional de y que é normal
d) S desvios-padrões de todas as distribuições condicionais são iguais
Para ilustrar a aplicação do método dos mínimos quadrados, observe o exemplo de
uma empresa que analisou a relação entre os gastos como publicidade e vendas nos
últimos anos. Os dados coletados (todos em mil reais) estão apresentados na tabela
seguinte.

6
Representando em gráfico a relação entre x e y, formamos o diagrama de dispersão,
exibida na figura 3, nota-se a inexistência de uma relação linear exata. A disposição
dos pontos, porém sugere o fato de se aceitar a construção de uma estimativa linear,
que minimize os erros dos ajustes.

Para facilitar a obtenção das somas, foi construída a tabela abaixo:

Para ajustar uma reta aos dois pontos, considere n = 5 já que o número de par analisados
foi igual a 5 e aplicando a fórmulas:

(∑ 41)(∑ 96)
∑ 981 − 5 41 96
b= = 2.0884 X = = 8.2 Y= = 19.2
(∑ 41)2 5 5
∑ 429 − 5
a = 19,2 – (2,0884)(8,2) = 2,751, portanto a equação de regressão será:

7
y= 2.0751 + 2.0884x

Com base nos valores obtidos para a e b, é possível determinar que a reta que melhor ajusta
os pontos é do tipo y= 2.0751 + 2.0884x. A reta de ajuste pode ser vista no diagrama de
dispersão abaixo, são os pontos ajustados para os novos valores de y cuja notação é ,
portanto temos que é o y ajustado:
X y

Para x = 3 = 2.0751 + 2.0884(3) = 8.31 3 7 8.31


Para x = 4 = 2.0751 + 2.0884(4) = 10.42 4 16 10.42
Para x = 8 = 2.0751 + 2.0884(8) = 18.78 8 15 18.78
Para x =12 = 2.0751 + 2.0884(12)= 27.13 12 28 27.13
Para x = 14 = 2.0751 + 2.0884(32) = 31.13 14 32 31.13

Coeficiente de determinação

Um modo de medir a qualidade do ajuste linear simples é através do coeficiente de


determinação.

 (∑ X) 
2

b ∑ X −
2 2

 n 
R2 =   Onde 0 ≤ R 2 ≤ 1
(∑ Y )2

∑Y 2 − n
Quanto mais próximo o coeficiente de determinação estiver da unidade melhor será o ajuste.
Assim para o nosso exemplo temos:

 (41) 2 
2,0884 2 429 − 
 5 
R2 = 2
= 0.93 como o coeficiente está próximo da unidade temos
2278 −
(96)
5
um bom ajuste, ou seja, os gastos como publicidade influenciam as vendas

8
Correlação

A correlação determina um número que expressa uma medida numérica de do grau de


relação encontrada. Esse tipo de análise é muito útil em trabalhos exploratórios em várias
áreas do conhecimento, quando se procura determinar as variáveis potencialmente
importantes.
Denomina-se simples a análise de correlação ou de regressão linear que envolve apenas
duas variáveis. Nesse caso, a amostra é formada por um conjunto de pares de valores. O
resultado da análise de correlação linear é expresso na forma de um coeficiente de correlação
– número que quantifica o grau de relação linear obtido para os pares de valores de duas
variáveis que formam a amostra analisada. Para calcularmos a correlação utilizaremos a
seguinte fórmula:

(∑ X )(∑ Y )
∑ XY − n
rxy = onde − 1 ≤ rxy ≤ 1
 ( X )   
∑ X − ∑
2
(∑ Y ) 2


2

n 
∑ Y − 2

n


 

Como o intervalo de variação é − 1 ≤ rxy ≤ 1 temos:

. quanto mais próximo r estiver de + 1, mais próximo estarão os pontos de ajuste integral de
uma reta crescente;
. quanto mais próximo r estiver de -1, mais próximos estarão os pontos de ajuste integral a
uma reta decrescente;
. se r = 0, não existe nenhuma relação numérica linear para os pares de valores da amostra
analisada.

Correlação positiva

Quando o valor do coeficiente de correlação estiver no intervalo 0 < r < 1

Correlação perfeita positiva

9
Quando o valor do coeficiente de correlação for r = 1

Correlação negativa

Quando o valor do coeficiente de correlação estiver no intervalo – 1<r<0

Correlação perfeita negativa

Quando o valor do coeficiente de correlação for r= - 1

Correlação nula

A correlação é nula quando não há relação entre x e y. As variáveis ocorrem


independentemente. Nessa situação o coeficiente de correlação é nulo, r = 0

10
Utilizando o nosso exemplo vamos calcular o coeficiente de correlação.

(41)(96)
981 −
rxy = 5 = 0,96
 (41)  
2
(96) 2 
429 − 5  2278 − 5 
  
Portanto temos uma correlação positiva forte, já que = 0,96

Teste t para o coeficiente de correlação

O teste t pode ser usado para testar a hipótese de que o coeficiente de correlação entre duas
variáveis é igual a zero, contra a hipótese de que é diferente de zero. Como foi visto
anteriormente o coeficiente de correlação varia entre -1 e+1. Se o coeficiente de correlação
for igual a zero, não existe correlação linear entre elas. Mas e se o coeficiente calculado for
= 0,20? Não se pode julgar o valor desse coeficiente sem saber o tamanho da amostra.
Quando a amostra é muito pequena, mesmo coeficiente de correlação como valores altos têm
pouco significado. Para aplicar teste t será utilizado a seguinte formula;

Onde é o valor calculado do coeficiente de correlação


N é o tamanho da amostra
E esse valor de t está associado a n-2 graus de liberdade

O t encontrado é o t calculado

Voltando ao nosso exemplo vamos calcular o valor de t, Sabemos que =0,96

= 8,313

Temos então t calculado = 8,13

Já o t tabelado para uma significância de 0,05 como n-2 graus de liberdade, ou seja, 5-
2=3 observado na tabela da distribuição t de Student é igual 3,18 e, portanto nos leva a
considerar que existe um alto grau de correlação, pois t calculado é maior que t
tabelado.
Para buscar na tabela divida o nível de significância por 2 , ou seja, 0,05/2 = 0,025 l e
faça a interseção como o grau de liberdade n-2= 3 , cujo valor encontrado será 3,18.

11
Análise no software SISVAR

Estimativas dos parâmetros


--------------------------------------------------------------------------------
Estimativa dos t para H0:
Variável GL parâmetros EP parâmetro = 0 Pr>|t|
--------------------------------------------------------------------------------
b ( 0) 1 2.07543103448 3.044492851 0.681700085 0.5443
b ( 1) 1 2.08836206897 0.328678514 6.353813774 0.0079
--------------------------------------------------------------------------------

R^2 paciais e semi parciais tipo I e tipo II


--------------------------------------------------------------------------------
R^2 Parcial R^2 semi Parcial R^2 Parcial R^2 Semi Parcial
Variável tipo I tipo I tipo II tipo II
--------------------------------------------------------------------------------
b ( 1) 0.93082927545 0.93082927545 0.93082927545 0.93082927545

Obs Valor observado Valor predito valor predito Resíduos


--------------------------------------------------------------------------------

1 7.00000 8.34052 2.21949 -1.34052


2 14.00000 10.42888 1.97754 3.57112
3 15.00000 18.78233 1.41752 -3.78233
4 28.00000 27.13578 1.88811 0.86422
5 32.00000 31.31250 2.37469 0.68750

Estimativas dos parâmetros padronizados


--------------------------------------------------------------------------------
Estimativa dos coeficientes
Variável GL de regressão padronizados
--------------------------------------------------------------------------------
b ( 1) 1 0.96479493959

Como podemos observar os valores calculados conferem com os analisados pelo SISVAR

12
a = 2.0751 b = 2.0883 R2 = 0.93 e rxy = 0,96

Os ajustes múltiplos serão somente analisados no SISVAR, já que os mesmos requerem um


bom conhecimento de matrizes e linearização de funções.

13
14
Exercícios de Correlação e Regressão Linear

1) Os dados abaixo se referem ao peso (gramas) e a idade (semanas), de codornas:

Idade (X1) 1 2 3 4 5 6 7 8 9 10
Peso (Y) 60 100 120 150 200 210 310 320 330 360

Pede-se:

a) Construir o diagrama de dispersão e discutir sua tendência;


b) Determinar e interpretar o coeficiente de correlação; e faça o teste t
c) Determinar a equação de regressão linear de Y em X;
d) Determinar e interpretar o coeficiente de determinação;
e) Representar graficamente a reta no diagrama de dispersão;
f) Estimar o valor de Y para X igual ao valor médio.

2) Sorteamos 5 pessoas adultas, num centro urbano e a cada uma fizemos as seguintes
perguntas:

- Durante quantos anos você freqüentou regularmente a escola?


- Quantos livros você tem em sua biblioteca?
Sujeitos A B C D E Σ
AnosX 5 8 10 12 15 50
LivrosY 10 30 45 50 75 210

a) Que tipo de correlação existe? Faça o teste t

3) Efeito da porcentagem de gordura na alimentação sobre o aumento do perímetro


abdominal (cm).
% gordura (Y) aumento perímetro (X)
5,4 2,1
6,8 2,2
6,9 2,9
7,3 2,9
7,7 3,0
8,1 3,1
8,2 3,1
8,5 3,1
8,6 3,4
8,9 3,5

a) Faça o diagrama de dispersão;


b) Ajuste um modelo aos dados acima;
c) Ache o coeficiente de determinação;
d) Ache a correlação.
15
e) a Hipótese Nula (H0) a correlação é significativa deve ser aceita?

4) Dados referentes a nota de 10 alunos do curso de especialização em Agronomia em


um este de 40 pontos e o tempo de estudo (expresso em porcentagem do total de horas
estudadas na semana que foi dedicado a esta disciplina) de determinados alunos.

Alunos Nota do teste Tempo (%)


1 25 23
2 26 21
3 31 28
4 29 27
5 27 23
6 31 28
7 32 27
8 28 22
9 30 26
10 30 25
a) Ajustar os dados a uma reta..
b) A partir de uma porcentagem 24, qual deverá ser a nota esperada?
c)Faça um comentário sobre o coeficiente de determinação

5) Considere X o número de horas (em milhões) de trabalho na Construção Civil e Y o


número acidentes ocorridos.
X Y X*Y X2 Y2
3 12
5 13
10 17
14 18
16 22
17 23
20 25

a) Complete a tabela.
b) Determine os parâmetros a e b da reta de regressão.
c) Calcule o coeficiente de determinação

11. Uma empresa recolheu informação relativa à relação existente entre as notas no teste
de
admissão (X) e uma certa medida de produtividade (Y).
X Y X*Y X2 Y2
8 21
10 29
14 30
16 43
18 45
20 48
a)Complete a tabela.
b) Determine os parâmetros a e b da reta de regressão.
16
c) Calcule o coeficiente de determinação

12) Suponha que os dados a seguir tenham sido obtidos de 10 pacientes que sofrem de
enfisema. Esses dados registram o número de anos que cada paciente fumou e tragou
(X), versus um diagnóstico médico subjetivo sobre o grau em que os pulmões dos
pacientes foram afetados (Y).

X 20 15 10 10 20 25 25 10 10 20
Y 55 60 50 30 70 30 60 60 70 60

a)Faça um diagrama de dispersão


b) Faça a correlação e comente
c) verifique se a correlação é singificativa

13). A tabela abaixo apresenta os dados referentes à variação da demanda de um


produto produzido (yi) em relação à variação do preço da venda (xi):
xi 40 45 52 58 65 70 85 90 100 120
yi 320 305 290 280 275 270 250 245 230 210

a. construa o diagrama de dispersão;


b. ajuste uma reta aos dados, ou seja, estabeleça a equação de regressão de y sobre x;
c. trace a reta no diagrama de dispersão;
d. determine y quando x = 80 e y quando x = 130.

14. Calcule o coeficiente de correlação relativo à tabela abaixo que apresenta as notas
de Cálculo e Estatística de catorze alunos (n=14) e:

Cálculo (xi) 8 7 4 9 6 4 7 6 5 8 2 7 3 6
Estatística 7 9 4 7 5 6 9 6 8 9 4 6 2 7
(yi)

a) construa o diagrama de dispersão;


b) estabeleça a equação de regressão de y sobre x;
c) trace a reta no diagrama de dispersão;

15. A tabela abaixo apresenta os dados referentes à variação do preço de venda do seu
produto (yi) em função do preço de custo (xi):
xi 40 50 70 75 80 95 110 120
yi 130 140 145 160 160 170 180 200

a) construa o diagrama de dispersão;


b) estabeleça a equação de regressão de y sobre x;

17
c) trace a reta no diagrama de dispersão;
d) determine x quando y = 165 e x quando y = 190.

16). A tabela abaixo apresenta valores que mostram como o comprimento de uma barra
de aço varia conforme a temperatura:

Temperat. (graus C) 10 15 20 25 30
Comprim/o (mm) 1003 1005 1010 1011 1014

a) determine o coeficiente de correlação;


b) estabeleça a equação de regressão de y sobre x;
c) o valor estimado do comprimento da barra para a temperatura de 18 graus C e
para a temperatura de 35 graus C.
17) Uma empresa que produz bens de alta tecnologia está preocupada com a
produtividade de funcionários que exercem atividades repetitivas e procura
descobrir como algumas variáveis podem influenciar no rendimento dessas pessoas.
Para isso implementa em cada uma de suas três fábricas um programa específico
alimentação especial sugerida pelos nutricionistas; intervalos para a prática de
exercícios de relaxamento sugerido pelos fisioterapeutas, rodízio de funções
sugerido pelos psicólogos. A tabela a seguir mostra o resultado da produtividade
para diversos níveis implementados no programa.

Produtividade (menor 100%) 100 102 105 108 112 120


Alimentação ( freq semanal ) 4 5 1 3 6 2
Exercícios ( freq semanal ) 1 3 2 4 5 6
Rodízio ( freq semanal ) 3 1 2 6 4 5

a) Construa o diagrama de dispersão da produtividade contra cada uma das quatro


variáveis explicativas. Qual variável parece manter melhor correlação linear com a
produtividade?
b) Calcule o coeficiente de correlação linear nos três casos. O coeficiente confirma a
impressão visual dos diagramas?
c) Calcule a reta de regressão linear da produtividade contra a melhor variável
explicativa.
d) Calcule o coeficiente de explicação. O modelo parece eficiente para previsões?

18) Oito Ursos do zoológico Tabajara foram anestesiados e os pesquisadores mediram o


comprimento (em polegadas) e obtiveram seus pesos (em libras), os quais são
apresentados na tabela a seguir.
Comprimento x (pol.) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0
Peso y (libras) 80 344 416 348 262 360 332 34

a) Construa o diagrama de dispersão;


b) Ache o valor do coeficiente de correlação linear; e faça o teste t
c) Determine a equação de regressão;
d) Se um urso tem comprimento de 71,0 polegadas, qual será o seu peso?
e) Com base nos resultados, existe relação do comprimento e do peso dos ursos?

18
19) A tabela a seguir relaciona os pesos (em centenas de libras) e as taxas de consumo
de combustível em rodovia (em milhas/galão) para uma amostra de carros de passeio
novos.
Peso x 29 35 28 44 25 34 30 33 28 24
Combustível y 31 27 29 25 31 29 28 28 28 33
a) Construa o diagrama de dispersão;
b) Ache o valor do coeficiente de correlação linear;
c) Determine a equação de regressão;
d) Se um carro pesa de 4200 libras, qual será o consumo de combustível?
e) Com base nos resultados, espera-se um maior consumo de combustível se adquirir
um carro mais pesado?

20) A tabela a seguir dá os pesos (em libras) de restos de comida descartados por uma
amostra de residências, juntamente com o tamanho destas.

Comida 1,04 3,68 4,43 2,98 6,30 1,46 8,82 9,62


Tamanho da Residência 2 3 3 6 4 2 1 5

a) Construa o diagrama de dispersão;


b) Ache o valor do coeficiente de correlação linear; faça o teste t
c) Determine a equação de regressão;
d) Se uma residência descarta 8,0 libras de alimentos, qual será o tamanho da
residência?

21) Fez-se um estudo para investigar a relação da idade (em anos) e a CAS
(Concentração de Álcool no Sangue) medida quando os motoristas intoxicados
condenados foram presos pela primeira vez.
Idade 17,2 43,5 30,7 53,1 37,2 21,0 27,6 46,3
CAS 0,19 0,20 0,26 0,16 0,24 0,20 0,18 0,23
a) Construa o diagrama de dispersão;
b) Ache o valor do coeficiente de correlação linear;
c) Determine a equação de regressão;
d) Se uma pessoa de 21 anos de idade foi condenada e presa por dirigir embriagada,
qual será o nível de álcool no seu sangue?
e) Com base nos resultados, parece haver relação do nível de CAS e a idade da pessoa
testada?
22) A tabela a seguir dá o número (em milhares) de armas automáticas registradas,
juntamente com a taxa de criminalidade (em crimes por100.000), para estados
selecionados aleatoriamente.
Armas automáticas 11,6 8,3 3,6 0,6 6,9 2,5 2,4 2,6
Taxa de criminalidade 13,1 10,6 10,1 4,4 11,5 6,6 3,6 5,3
a) Construa o diagrama de dispersão;
b) Ache o valor do coeficiente de correlação linear; faça o teste t
c) Determine a equação de regressão;
d) Em um estado com 10.000 armas automáticas registradas, qual será a taxa de
criminalidade?
e) Com base nos resultados, os crimes com armas de fogo parecem estar relacionados
com as armas automáticas?
19
Bibliografia

Obras Referenciadas

1 - DONAIRE, Denis, Princípios de Estatística,1.ed.São Paulo: Atlas,


2- VIEIRA, Sonia, Introdução a bioestatística, 1.ed.Rio de Janeiro:Campus, 1980
3- FARIAS, Alfredo Alves de, Estatística Aplicada,2.ed.São Paulo:Saraiva, 2002
4- LEÔNIDAS, Conceição Barroso, Cálculo Numérico, 2 ed.São Paulo:Saraiva,1987

20