Escolar Documentos
Profissional Documentos
Cultura Documentos
18 de fevereiro de 2022
Os dados seguintes são provenientes de informações demográficas e sócio-econômicas
dos 50 estados norte-americanos da década de 70. Dentre elas temos:
• ndias: número de dias do ano com temperatura abaixo de 0o Celsius na cidade mais
importante do estado;
1
estado com a maior área (em milhas quadradas) é o Alasca, seguido de Nova Iorque e
Utah, no entanto a Carolina do Sul possui a menor área; o estado com o maior número
de dias muito frios é Nevada, enquanto que o Havaı́ não apresenta temperaturas abaixo
de 0o C ao longo do ano. Os padrões atı́picos dessas variáveis podem ser observados pelos
gráficos da Figura 2.
Apesar de a renda per capita não ter apresentado grande variabilidade em sua distri-
buição, o estado com a maior renda é o Alaska, onde o mesmo se apresenta como outlier
na Figura 2. Por outro lado, o estado do Mississippi possui a menor renda per capita.
expectativa de vida
72
70
68
2
população estimada área
0e+00 3e+05
10000
0
6000
2.0
4500
1.0
3000
0.0
6
0.5
50
40
3
Expectativa de vida
Expectativa de vida
72
72
70
70
68
68
0.0 1.0 2.0 3000 4000 5000 6000
Expectativa de vida
72
72
70
70
68
68
Expectativa de vida
72
72
70
70
68
68
40 50 60 0 50 100 150
4
A investigação da relação linear entre a expectativa de vida e as demais covariáveis
é apresentada na Figura 3. Pode-se observar indı́cios de tendência linear negativa entre
a expectativa de vida e a proporção de analfabetos e a taxa de criminalidade; significa
que quanto maiores a criminalidade e o analfabetismo, menor será o tempo de vida da
população. Em relação às variáveis renda per capita, proporção de estudantes que con-
cluem o ensino médio e número de dias com temperatura abaixo de 0o C, há uma tendência
positiva; significa que quanto maior a renda per capita, mais dias de muito frio e mais
estudantes concluindo o ensino médio, maior será a expectativa de vida da populaç ao.
Quanto à relação com a densidade, a tendência de linearidade não é aparente com o tempo
de vida dos norte-americados.
5
Tabela 2: Estimativas e testes marginais dos coeficientes do modelo selecionado.
o valor da estatı́stica D(y; µ̂) = 1.189, com 2 graus de liberdade e p-valor de 0.552,
indicando que o modelo em (2) está bem ajustado, ao nı́vel de significância de 5%.
Dado o modelo selecionado pelo critério AIC, uma análise de diagnóstico é realizada
para validação e adequação do modelo. Na Figura 4, observa-se que existem dois pontos de
alavanca, referentes aos estados de Nevada (ponto 28), cujo padrão atı́pico incide no maior
número de dias de temperatura abaixo de 0o C; e Carolina do Sul (ponto 40), cuja padrão
atı́pico reside na maior densidade populacional. Os gráficos não mostram evidências
de pontos aberrantes e pontos influentes. Além disso, o gráfico dos resı́duos do desvio
apresenta um comportamento aleatório de seus valores, o que indica homoscedasticidade
do modelo.
Para verificar o impacto dos pontos de alavanca no modelo, foi realizada uma análise
confirmatória dos dados retirando esses pontos do ajuste. A verificação do impacto foi
dada pelas variações percentuais das estimativas do modelo com todas as observações de
primeira ordem e dos modelos sem as outliers. Com isso, os resultados foram interpretados
de acordo com as variações percentuais entre as estimativas dos parâmetros do modelo
original e o modelo sem a observação. A variação percentual pode ser calculada da seguinte
forma: !
β̂(−i) − β̂
VP(−i) = × 100.
β̂
6
0.8
40
2
residuos do desvio
0.6
1
alavancagem
0.4
0
28
−1
0.2
−2
0.0
0 10 20 30 40 50 0 10 20 30 40 50
0.10
0.00
0 10 20 30 40 50
7
1.0
0.6
correlacao residual
0.6
densidade
0.4
0.2
0.2
−0.2
0.0
0 5 10 15 −1.5 −0.5 0.5 1.5
−1
−3
−2 −1 0 1 2
Percentil da N(0,1)
8
A Tabela 3 mostra que para o modelo (2) sem o estado de Nevada, o impacto é
praticamente irrelevante nas estimativas do modelo. Porém, a exclusão do estado da
Carolina do Sul causa um impacto de grandes proporções na estimativa da densidade
populacional.
Tabela 3: Variações percentuais no ajuste do modelo com a retirada dos estados de Nevada
e Carolina do Sul.
Covariável VP(−28) VP(−40) VP(−28,−40)
Intercepto 0.73 0.07 0.79
crime 6.76 1.03 7.67
estud 12.64 0.66 11.87
ndias 14.30 1.99 16.04
dens 1.37 53.99 52.78