Você está na página 1de 16

PROF.

: THIAGO REZENDE
DEPTO. ESTATÍSTICA – UFMG

Gabarito Lista de Exercícios I


Exercício 1:
1. N, Contagem
2. N, Contagem
3. N, Contínua
4. D, Qualitativa (nominal)
5. D, Qualitativa (nominal)
6. N, Contínua
7. N, Contínua
8. D, Qualitativa (nominal)
9. D, Qualitativa (nominal)
10. D, Qualitativa (ordinal)
11. N, Contagem
12. N, Contínua
13. N, Contagem
14. N, Contínua
15. N, Contagem
16. N, Contagem
17. D, Qualitativa (nominal)
18. D, Qualitativa (nominal)
19. N, Contínua

Exercício 2:
a) Habitantes da região metropolitana de Belo Horizonte
b) Estatística, pois se trata de um dado obtido através de uma amostra retirada da
população, ou seja, descreve um característica da amostra.

Exercício 3:
População: 1.831 Alunos sendo 876 do sexo masculino (H) e 955 do sexo feminino (M)
na escola
Amostra estratificada proporcional de 120 alunos:

Estratos População Cálculo Amostra


H 876 876 x 0,0655 = 57,4 57
M 955 955 x 0,0655 = 62,6 63
Total 1831 120

1
Como 120 alunos de um total de 1.831 representam 6,55% para obter a amostra basta
multiplicar o número correspondente a cada população por essa porcentagem.

Exercício 4:
Estratos População Cálculo Amostra
1 40 40 x 0,15 = 6 6
2 100 100 x 0,15 = 15 15
3 60 60 x P = 9 9
Total 200 30

60 x P = 9
P = 9 / 60 = 0,15
Observe que 9 representa 15% do estrato 3 e para obter as demais amostras devemos
fazer os cálculos indicados na tabela. Logo, o número total de elementos é igual a 30.

Exercício 5:
a) Quem: Escolares da rede pública
Onde: Juiz de Fora, Minas Gerais.
Quando: Junho a Novembro de 2006
b) 480 escolares (241 do sexo feminino e 239 do sexo masculino) da rede pública
com idades entre 4 e 18 anos
c) Peso, altura, sexo, idade, IMC, prática de atividades físicas, excesso de peso dos
pais, alimentação escolar (frequências que compra lanches e faz uso da merenda
escolar e quantidade de refeições diárias)
d) Peso: Numérica contínua
Altura: Numérica contínua
Sexo: Qualitativa nominal
Idade: Numérica contínua
IMC: Numérica contínua
Atividade física: Qualitativa ordinal
Excesso do peso dos pais: Qualitativa ordinal
Alimentação escolar: Quantitativa discreta
OBS: “foi elaborado para atender aos objetivos desta pesquisa e possuía perguntas a
respeito de seus hábitos alimentares, como a frequência com a qual a criança compra
lanches na escola, considerando opções de uma vez a cinco vezes e incluindo as
opções não compra lanche na escola e a escola não possui cantina.”

e) Sobrepeso e obesidade
f) Variáveis consideradas como POSSIVELMENTE associadas ao sobrepeso
estudadas: Padrão de atividade física, obesidade dos pais, frequência de uso da
merenda escolar, frequência de lanches em cantinas particulares
Variável explicativa que significativamente afetou os resultados: Peso do pai

2
OBS: “Na análise dos fatores de risco para a obesidade da criança e adolescente, apenas
a obesidade do pai demonstrou-se ser significativa. Como o nível de significância
utilizado para selecionar possíveis fatores de risco foi inferior a 5%, todos os intervalos
de confiança incluem a unidade. Em relação à prática de atividade física, comprar lanche
na escola, número de refeições diárias e frequência de uso da merenda escolar, os
adolescentes com IMC normal e os com sobrepeso se distribuíram de forma bastante
próxima. Nenhum dos parâmetros avaliados mostrou associação significativa”.

Exercício 6:
A estatística descritiva é responsável por descrever um conjunto de dados,
ou seja, sintetizar os dados de maneira direta. Exemplos: média, moda,
variância...
Exercício 7:
As variáveis qualitativas, que são definidas por categorias, podem ser
classificadas como nominais ou ordinais.
Variável nominal: não existe ordenação dentre as categorias.
Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio.
Variável ordinal: existe uma ordenação entre as categorias.
Exemplos: escolaridade (1º, 2º, 3º graus), estágio da doença (inicial,
intermediário, terminal), etc.
Exercício 8:
Vantagens: Agrupar os dados em classes para facilitar a análise das
variáveis, já que essas podem assumir valores infinitos,...
Desvantagens: Perda de informações dos dados,...
Exercício 9:
A frequência absoluta é o número total de observações da classe ou
intervalo, enquanto que a frequência relativa pode representar a
porcentagem da razão entre a frequência absoluta e o número total de
observações. Portanto, durante a análise pode ser mais benéfico e
simples comparar as frequências relativas dos dados.

Exercício 10:

3
Para observações nominais ou ordinais: Gráfico de setores e gráfico de
barras principalmente.
Para observações discretas ou contínuas: Gráfico de barras,
histograma, ogivas, diagrama de pontos, diagrama de ramo e folhas,
gráfico de linhas, entre outros.
Exercício 11:
Os percentis são medidas que dividem os dados da amostra por ordem
crescente em 100 partes, portanto podem ser de 1 a 100%.
Exercício 12:
a) Variável quantitativa discreta
b) Variável quantitativa contínua
b) Variável quantitativa contínua
c) Variável quantitativa discreta

Exercício 13:
a) Classificação livre, desde que faça sentido.
b) Comandos no R para construir um histograma:
x<-c(1032,1093,980,836,1683, ..., 2354)
hist(x,breaks="Sturges",freq=T,col="darkblue",border ="black",xlab="Per Capita
Expenditure (U.S.$)",ylab="Frequencia Absoluta",main="Histograma")

4
Histograma

12
10
Frequencia Absoluta

8
6
4
2
0

0 500 1000 1500 2000 2500

Per Capita Expenditure (U.S.$)

c) Comentários: Aparentemente, entre as nações os gastos per capita


dedicados a saúde se concentram entre 1000 e 1500 U.S.$ no ano
de 1989.
Exercício 14:
Sim, pois a moda dos dados está no intervalo de 16 a 30 minutos.
Exercício 15: Similar aos Exercícios 14 e 16.
Exercício 16:
a) Considere grupo 1 como sendo o grupo de trabalhadores de 1991 e
grupo 2 como os de 1992:
Comandos no R:
grupo1<-c(325,312,346,340,355,342,358,346,365,355,324,342)
grupo2<-c(334,304,360,330,361,333,352,350,357,345,332,325)
mean(grupo1)
median(grupo1)
mean(grupo2)

5
median(grupo2)

Como podemos perceber a média da concentração de chumbo no


sangue do grupo 1 é maior que a média do grupo 2, portanto, a menor
concentração esteve presente no grupo de trabalhadores de 1992.
Exercício 17:
Código em R:
unicefdata<- read.table("unicef.csv",header=T,sep=";")
names(unicefdata)
lowbwt<-unicefdata$lowbwt
summary(lowbwt)

install.packages('fdth')
library(fdth)

#Histograma e Polígono de frequencias


#Tabela de frequencia
tab=fdt(lowbwt, start=4,h=6,end=52)
#print
print(tab)
#Graficos
par(mfrow=c(2,2))
plot(tab)
plot(tab,type='fp')
plot(tab,type='cfp')
boxplot(lowbwt)
#Coeficiente de assimetria de Pearson:
P=3*(mean(lowbwt,na.rm=T)-median(lowbwt,na.rm=T))/sd(lowbwt,na.rm=T)
P

Exercício 18:
a) Estado com maior número de residentes em casas de repouso por
mil habitantes: Hawaii (13.6)
Estado com maior número de residentes em casas de repouso por mil
habitantes: South Dakota (74.9)
Diversos fatores, como renda, qualidade das casas de repouso, etc.
6
b) Comandos no R:
re<-
c(35.7,22.5,21.7,50.5,26.7,40.0,54.6,43.2,34.4,23.1,45.5,13.6,31.3,52.1,59.2,70.5,6
5.4,47.8,59.7,51.4,44.6,54.0,36.1,67.6,40.6,57.6,44.2,67.4,18.6,52.7,33.4,30.2,37.0,
30.4,59.5,49.3,59.1,30.2,40.6,60.3,28.8,74.9,45.8,47.7,29.1,46.2,33.8,37.8,32.3,62.
1,37.8)
boxplot(re,ylab="Frequência Absoluta", col="darkblue",
norder="black",main="Boxplot")
hist(re,freq=T,col="darkblue",border="black",xlab="Número de
residentes",ylab="Frequência Absoluta",main="Histograma")

Histograma
14
12
10
Frequência Absoluta

8
6
4
2
0

10 20 30 40 50 60 70 80

Número de residentes

Boxplot
70
60
Frequência Absoluta

50
40
30
20

c) As observações aparentam ser simétricas e nenhum outlier foi


observado.

7
d) No boxplot é possível observar a localização dos 1º,2º(mediana) e
3º quartis, presença de outliers, dispersão e simetria ou não dos dados.
No histograma é possível analisar a distribuição dos dados, a frequência
relativa ou absoluta, a densidade e a simetria ou não dos dados.
Portanto, para esse caso o boxplot é mais informativo que o histograma.

Exercício 19:
Comandos no R:
y <-
c(32,37,36,32,51,53,33,61,39,76,37,42,40,32,60,38,40,43,62,43,42,44,41,56,50,44,
35,80,26,28,41,56,33,74,30,33,41,31,35,41)
hist(y,frq=T,col="darkblue",border="black",xlab="Diâmetro",ylab="Frequência
Absoluta",main="Histograma")

Histograma
15
Frequência Absoluta

10
5
0

20 30 40 50 60 70 80

Diâmetro

Exemplo de Tabela de frequências:

8
Diagrama de Ramos e folhas:
2 68
3 012223335567789
4 001111223344
5 01366
6 012
7 46
8 0

Exercício 20:
a) Comandos no R:
mean(y)
median(y)
Média = 43.7 Mediana = 41
b) Comandos no R:
quantile(y,0.25)
quantile(y,0.75)
1º Quartil (25%) = 34.5 3º Quartil (75%) = 50.25
Interpretação: 25% dos dados estão abaixo de 34.5 e 75% dos dados
estão abaixo de 50.25.
c) [43.7 – 1.96*13.15 ; 43.7 + 1.96*13.15] = [17.93 ; 69.47]
d) Comandos no R:
var(y)
sd(y)
max(y)
min(y)
Variância = 172.8821 Desvio Padrão = 13.14846
Amplitude Total = 80-26 = 54
Coeficiente de variação = desvio padrão / média = 0.301
9
Analisando esses resultados os dados aparentam não serem
homogêneos, pois todas as medidas indicaram que os dados parecem
serem heterogêneos.
e) Coeficiente de assimetria de Pearson:
P = (43.7-41) /13.15 = 0.21
Curtose:
C= Q3 - Q1 / 2(P90 - P10) = 50.25 - 34.5 / 2(61.1 - 31.9) = 49.66
Exercício 21:
a) Média = 5.72 Mediana = 5.35
b) Moda = 4.5 (frequência = 2)
c) Apesar das média e mediana estarem próximas, é através da
mediana conseguimos mais informações sobre os dados
(porcentagem de dados acima e abaixo do valor 5.35). Além
disso a moda representa apenas 2 valores dos dados. Logo, a
mediana é o melhor.
Exercício 23:
a) Comandos no R:
estados<-c("Norte","Nordeste","Sudeste","Sul","Centro-Oeste")
n<-c(45.25,18.28,10.85,6.76,18.86)
pie(x=n,estados,main="Área Terrestre do
Brasil",col=c("darkviolet","red","green","darkblue","yellow"))

10
Área Terrestre do Brasil

Norte

Nordeste

Centro-Oeste

Sudeste
Sul

Comentários: Através do gráfico de setores acima é possível perceber


que a maior Área terrestre do Brasil se concentra na Região Norte,
enquanto que a menor na Região Sul.
Exercício 24:
a) Comandos no R:
ano<-c(1991,1992,1993)
q<-c(36180.40,36410.50,37164.30)
barplot(q,ano,main="Produção Brasileira de Petróleo
Bruto",ylab="Quantidade",col="darkblue",xlab="Ano",ylim=c(35000,38000))

Comentários: No ano de 1993 a produção de petróleo bruto cresceu


grandemente quando comparada aos últimos dois anos.
Exercício 28:
Como a tabela abaixo mostra os matriculados na 1º série representam
43% dos dados, enquanto que apenas 9% dos dados se refém a 4º série.

Matriculados Freq. Abs. Freq. Abs. Ac. Freq. Rel. Freq. Rel. Ac.

1ª 546 546 0,43 0,43

11
2ª 328 874 0,26 0,69

3ª 280 1154 0,22 0,91

4ª 120 1274 0,09 1,00

Total 1274

Exercício 32:
a) Comandos no r:
provas<-
c(6,12,12,12,14,15,15,15,15,16,17,18,18,19,19,19,20,21,21,22,22,22,23,23,23,23,2
3,23,24,25,25,25,27,27,28,32)
mean(provas)
median(provas)
Média = 20.03 Mediana = 21
b) Comandos no R:
quantile(provas,0.25)
quantile(provas,0.75)
1º Quartil (25%) = 15.75 3º Quartil (75%) = 23
Comentários: 75% dos dados estão acima de 15.75 e 25% acima de 23.
d) Comandos no R:
hist(provas,xlab="Notas",ylab="Frequência
Absoluta",col="darkblue",border="black",main="Histograma",freq=T)
boxplot(provas,ylab="Frequência Absoluta",
col="darkblue",border="black",main="Boxplot")
Comentários: Os dados não são simétricos, não há outliers , as notas de
maior frequência estão entre 20 e 25, etc.

12
Frequência Absoluta
Frequência Absoluta
5 10 15 20 25 30
0 5 10 15

5
10
15

Boxplot
20

Notas
Histograma

25
30
35

13
Exercício 33:
a)

CV Mediana Q1 Q3
macho 8,59% 38 37 39
femea 15,46% 40 38 43

b) As fêmeas possuem uma altura mediana (percentis) e dispersão da


altura maiores que os machos.

Exercício 35:
Tabela 1.2: Número de erros de tradução dos estudantes da escola A.

No. de erros Frequência Simples Frequência Acumulada

de tradução Absoluta Relativa (%) Absoluta Relativa (%)

10 |- 15 5 3,3 5 3,3
15 |- 20 57 38,0 62 41,3
20 |- 25 42 28,0 104 69,3
25 |- 30 28 18,7 132 88,0
30 |- 35 17 11,3 149 99,3
35 |- 40 1 0,7 150 100,0

150 100,0
Total

Tabela 1.3: Número de erros de tradução dos estudantes da escola B.

No. de erros Frequência Simples Frequência Acumulada

de tradução Absoluta Relativa (%) Absoluta Relativa (%)

10 |- 15 4 2,0 4 2,0
15 |- 20 18 9,0 22 11,0
20 |- 25 43 21,5 65 32,5
25 |- 30 76 38,0 141 70,5
30 |- 35 43 21,5 184 92,0
35 |- 40 16 8,0 200 100,0

14
200 100,0
Total

Exercício 37:
Código:
Mode = function(x){
ta = table(x)
tam = max(ta)
if (all(ta == tam))
mod = NA
else
if(is.numeric(x))
mod = as.numeric(names(ta)[ta == tam])
else
mod = names(ta)[ta == tam]
return(mod)
}
peso<-c(3.3, 3.1, 2.8, 2.7, 2.9, 3.1, 3.2, 3.0, 3.5, 4.4)
summary(peso)
Mode(peso)

Output:
> peso<-c(3.3, 3.1, 2.8, 2.7, 2.9, 3.1, 3.2, 3.0, 3.5, 4.4)
> summary(peso)
Min. 1st Qu. Median Mean 3rd Qu. Max.
2.700 2.925 3.100 3.200 3.275 4.400
> Mode = function(x){
+ ta = table(x)
+ tam = max(ta)
+ if (all(ta == tam))
+ mod = NA
+ else
+ if(is.numeric(x))
+ mod = as.numeric(names(ta)[ta == tam])
+ else
+ mod = names(ta)[ta == tam]
+ return(mod)
+}

15
> Mode(peso)
[1] 3.1
>

16

Você também pode gostar