Você está na página 1de 6

dy Silvio

dx Sandro
Lista de Atividades de P.E. para a turma do 2º semestre do Curso de Engenharia Elétrica Lista nº 1
Visite o nosso canal no YouTube Matemática Aqui

1 Lista nº 1 - Estatística Descritiva


1.1 Exercícios retirados do livro: Triola, M. F. Introdução à Estatística. Rio de Janeiro - LTC, 12ª
edição, 2017.
1. [Amostra de resposta voluntária] de O que é uma amostra de resposta voluntária e por que tal amostra não é, em
geral, apropriada para um estudo estatístico? [pág. 11]

2. [Origem dos dados] Na realização de um estudo estatístico, por que é importante considerar-se a fonte dos dados?
[pág. 11]

3. [Determine se a fonte dada tem potencial para criar um viés no estudo estatístico] O Comitê de Médicos para Medic-
ina Responsável tende a se opor ao uso de carne e de laticínios em nossas dietas, e essa organização tem recebido
centenas de milhares de dólares de financiamento da Fundação de Apoio à Proteção Animal.[pág. 11]

4. [Determine se a fonte dada tem potencial para criar um viés no estudo estatístico] Um artigo no Journal of Nutrition
(Vol. 130. Nº 8) observou que o chocolate é rico em flavonoides. O artigo aponta que “o consumo regular de alimentos
ricos em flavonoides pode reduzir o risco de doença coronariana" O estudo recebeu financiamento e Mars, Inc., a
companhia de doces e da Associação de Fabricantes de Chocolate. [pág. 11]

5. [Determine se o método de amostragem parece ser sólido ou falho] Em uma pesquisa com 109 sujeitos, perguntou-
se a cada um quantas mensagens de texto eles enviavam e recebiam a cada dia. A amostra consistia naqueles que
decidiram responder a um pedido postado no site do StarCrunch. [pág. 12]

6. [Determine se o método de amostragem parece ser sólido ou falho] Em uma pesquisa com 514 profissionais de re-
cursos humanos, perguntou-se a cada um sobre a importância da aparência de um candidato a emprego. Os sujeitos
da pesquisa foram selecionados aleatoriamente pelos entrevistadores da Harris Interactive. [pág. 12]

1.2 Exercícios retirados do livro: Magalhães, M. N.; Lima, A. C. P. Noções de Probabilidade e Estatís-
tica. São Paulo - Edusp, 7ª edição, 2015.
1. Classifique como verdadeira ou falsa cada uma das seguintes afirmações: [pág. 4]

(a) Estatística é um conjunto de técnicas destinadas a organizar um conjunto de valores numéricos.


(b) Sempre que estivermos trabalhando com números, deveremos utilizar a Inferência Estatística.
(c) A Estatística Descritiva fornece uma maneira adequada de tratar um conjunto de valores, numéricos ou não, com
a finalidade de conhecermos o fenômeno de interesse.
(d) Qualquer amostra representa, de forma adequada, uma população.
(e) As técnicas estatísticas não são adequadas para casos que envolvam experimentos destrutivos como, por exem-
plo, queima de equipamentos, destruição de corpos de provas etc.

2. Classifique cada uma das variáveis abaixo em qualitativa (nominal/ordinal) ou qualitativa (discreta/contínua): [pág.
30-31]

(a) Ocorrência de hipertensão pré-natal em grávidas com mais de 35 anos (sim ou não são possíveis respostas para
esta variável).
(b) Intenção de voto para presidente (possíveis respostas são os nomes dos candidatos, além de não sei)
(c) Perda de peso de atletas na Corrida de São Silvestre, em quilos.
(d) Intensidade da perda de peso de maratonistas na Corrida de São Silvestre (leve, moderada, forte)
(e) Grau de satisfação da população brasileira com relação ao trabalho de seu presidente (valores de 0 a 5, com 0
indicando totalmente insatisfeito e 5 totalmente satisfeito).

3. Quinze pacientes de uma clínica de ortopedia foram entrevistados quanto ao número de meses previstos de fisioter-
apia, se haverá (S) ou não (N) sequelas após o tratamento e o grau de complexidade da cirurgia realizada; alto (A),
médio (M) ou baixo (B). Os dados são apresentados na tabela abaixo: [pág. 31]
dy Silvio
dx Sandro
Lista de Atividades de P.E. para a turma do 2º semestre do Curso de Engenharia Elétrica Lista nº 1

Pacientes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Fisioterapia 7 8 5 6 4 5 7 7 6 8 6 5 5 4 5
Sequelas S S N N N S S N N S S N S N N
Cirurgia A M A M M B A M B M B B M M A

(a) Classifique cada uma das variáveis.


(b) Para cada variável, construa a tabela de frequência e faça uma representação gráfica.
(c) Para o grupo de pacientes que não ficaram com sequelas, faça um gráfico de barras para a variável Fisioterapia.
Você acha que essa variável se comporta de modo diferente nesse grupo?

4. Os dados abaixo referem-se ao salário (em salários mínimos) de 20 funcionários administrativos em uma indústria.
[pág. 31]

10,1 7,3 8,5 5,0 4,2 3,1 2,2 9,0 9,4 6,1
3,3 10,7 1,5 8,2 10,0 4,7 3,5 6,5 8,9 6,1

(a) Construa uma tabela de frequência, agrupando os dados em faixas a partir de 1 com amplitude 2. Escolha incluir
o limite inferior e excluir o superior.
(b) Construa o histograma e calcule o 1ª e o 3ª quartil.
(c) Construa o box-plot utilizando os dados brutos.

5. Em um estudo clínico dois anestésicos estão sendo avaliados. Cada um dos medicamentos Alpha e Beta foram apli-
cados em grupos diferentes de 18 cobaias, sendo que todas elas tinham aproximadamente as mesmas características
físicas, incluindo peso e idade. O tempo para o completo efeito dos anestésicos foi medido, em segundos, para cada
animal. Os resultados após ordenação, são apresentados a seguir. [pág. 33]
Medicamento Alpha:
24, 24, 24, 25, 25, 26, 26, 27, 28, 29, 30, 30, 30, 31, 31, 32, 32 e 33.
Medicamento Beta:
19, 19, 19, 20, 22, 25, 26, 26, 27, 29, 29, 31, 34, 34, 37, 40, 41 e 42.
Construa um box-plot para o tempo de efeito de cada anestésico e comente as diferenças encontradas.
Solução

> a<-c(24,24,24,25,25,26,26,27,28,29,30,30,30,31,31,32,32,33)
> b<-c(19,19,19,20,22,25,26,26,27,29,29,31,34,34,37,40,41,42)
> boxplot(a,b,names=c("Alpha","Beta"),ylab="Tempo (s)")

As medianas dos tempos de efeito dos anestésicos não muito próximas uma da outra (de fato, 28,50 e 28,00, respecti-
vamente). Os tempos do medicamento alpha são ligeiramente assimétricos à direita. Os tempos do medicamento beta
são simétricos. A variabilidade do tempo de completo efeito para o anestético Alpha é menor do que para o anestésico
Beta. Para os dois conjuntos de dados não há outliers.
dy Silvio
dx Sandro
Lista de Atividades de P.E. para a turma do 2º semestre do Curso de Engenharia Elétrica Lista nº 1

1.3 Exercícios retirados do livro: Bussab, W de O.; Morettin, P. A. Estatística Básica. São Paulo -
Saraiva, 9ª edição, 2017.
Os conjuntos de dados, bem como os comandos do R usados no livro estão disponíveis na página
https://www.ime.usp.br/ pam/EstBas.html

1. Usando os dados da Tabela 2.1, construa a distribuição de frequências das variáveis: [pág. 18]

(a) Estado civil


(b) Região de procedência.
(c) Número de filhos dos empregados casados.
(d) Idade.

Solução:

(a) Usando o R:
> # carregando o arquivo dados.RData no R à partir da página da Web.
> load(url(description = "https://www.ime.usp.br/~pam/dados.RData"))
> # lendo a tabela tabela2_1.csv no arquivo carregado.
> # tab_2_1 é o nome da tabela com dados dos 36 funcionários da seção de orçamentos
> # da Companhia MB.
> ni<-table(tab2_1$estado_civil) # Calcula a tabela de frequências absolutas
> fi<-prop.table(ni) # Calcula a tabela de frequêcias relativas
> p_fi<-100*fi # Converte para porcentagem
> ni<-c(ni,sum(ni)) # Adiciona linha de total.
> fi<-c(fi,sum(fi))
> p_fi<-c(p_fi,sum(p_fi))
> names(ni)[3]<-"Total" # Adiciona o nome Total a terceira linha criada.
> cbind(ni,fi=round(fi,digits=4),p_fi=round(p_fi,digits=2)) # Junta as três colunas.
ni fi p_fi
casado 20 0.5556 55.56
solteiro 16 0.4444 44.44
Total 36 1.0000 100.00
Estado Civil Frequência n i Proporção f i Porcentagem 100 f i
casado 20 0,5556 55,56
solteiro 16 0,4444 44,44
Total 36 1,0000 100,00

(b) Usando o R:
> ni<-table(tab2_1$reg_procedencia)
> fi<-prop.table(ni)
> p_fi<-100*fi

> ni<-c(ni,sum(ni))
> fi<-c(fi,sum(ni))
> p_fi<-c(fi,sum(p_fi))
> names(ni)[4]<-"Total"

> cbind(ni,fi=round(fi,digits=4),p_fi=round(p_fi,digits=2))
ni fi p_fi
capital 11 0.3056 30.56
interior 12 0.3333 33.33
outra 13 0.3611 36.11
Total 36 1.0000 100.00
dy Silvio
dx Sandro
Lista de Atividades de P.E. para a turma do 2º semestre do Curso de Engenharia Elétrica Lista nº 1

Região de procedência Frequência n i Proporção f i Porcentagem 100 f i


Capital 11 0,3056 30,56
Interior 12 0,3333 33,33
Outra 13 0,3611 36,11
Total 36 1,0000 100,00

(c) Usando o R:

> ni<-table(tab2_1$n_filhos)
> fi<-prop.table(ni)
> p_fi<-100*fi

> ni<-c(ni,sum(ni))
> fi<-c(fi,sum(fi))
> p_fi<-c(p_fi,sum(p_fi))

> names(ni)[6]<-"Total"
> cbind(ni,fi=round(fi,digits=4),p_fi=round(p_fi,digits=2))
ni fi p_fi
0 4 0.20 20
1 5 0.25 25
2 7 0.35 35
3 3 0.15 15
5 1 0.05 5
Total 20 1.00 100
Número de filhos Frequência n i Proporção f i Porcentagem 100 f i
0 4 0,20 20
1 5 0,25 25
2 7 0,35 35
3 3 0,15 15
5 1 0,05 5
Total 20 1,00 100

(d) Usando o R
> ni<-table(cut(tab2_1$idade_anos,breaks=seq(20,50,by=5),right=FALSE))
> fi<-prop.table(ni)
> p_fi<-100*fi

> ni<-c(ni,sum(ni))
> fi<-c(fi,sum(fi))
> p_fi<-c(p_fi,sum(p_fi))
> names(ni)[7]<-"Total"

> cbind(ni,fi=round(fi,digits=4),p_fi=round(p_fi,digits=2))
ni fi p_fi
[20,25) 2 0.0556 5.56
[25,30) 6 0.1667 16.67
[30,35) 10 0.2778 27.78
[35,40) 8 0.2222 22.22
[40,45) 8 0.2222 22.22
[45,50) 2 0.0556 5.56
Total 36 1.0000 100.00
dy Silvio
dx Sandro
Lista de Atividades de P.E. para a turma do 2º semestre do Curso de Engenharia Elétrica Lista nº 1

Idade Frequência n i Proporção f i Porcentagem 100 f i


[20, 25) 2 0,0556 5,56
[25, 30) 6 0,1667 16,67
[30, 35) 10 0,2778 27,78
[35, 40) 8 0,2222 22,22
[40, 45) 8 0,2222 22,22
[45, 50) 2 0,0556 5,56
Total 36 1,0000 100,00

2. Para o Conjunto de Dados 1 (CD-Brasil), construa a distribuição de frequências para as variáveis população e densi-
dade populacional. [pág. 18]
Solução:

3. Contou-se o número de erros de impressão da primeira página de um jornal durante 50 dias, obtendo-se os resultados
abaixo: [pág. 25]

8 11 8 12 14 13 11 14 14 15
6 10 14 19 6 12 7 5 8 8
10 16 10 12 12 8 11 6 7 12
7 10 14 5 12 7 9 12 11 9
14 8 14 8 12 10 12 22 7 15

(a) Represente os dados graficamente.


(b) Faça um histograma e um ramo-e-folhas.

Solução:

(a) Vamos resolver no R. Inicialmente temos


> p_4_cap_2<-c(8,11,8,12,14,13,11,14,14,15,
+ 6,10,14,19,6,12,7,5,8,8,
+ 10,16,10,12,12,8,11,6,7,12,
+ 7,10,14,5,12,7,9,12,11,9,
+ 14,8,14,8,12,10,12,22,7,15)
> barplot(table(p_4_cap_2),xlab="Número de erros de impressão",
ylab="Frequência",col="blue")
8
6
Frequência

4
2
0

5 6 7 8 9 10 11 12 13 14 15 16 19 22

Número de erros de impressão

(b) Vamos fazer o histograma no R.


dy Silvio
dx Sandro
Lista de Atividades de P.E. para a turma do 2º semestre do Curso de Engenharia Elétrica Lista nº 1

> hist(p_4_cap_2,breaks=seq(4,24,by=4),xlab="Número de erros",


+ylab="Densidade de frequência",col="blue",border="white",freq=F)

Histogram of p_4_cap_2
0.10
0.08
Densidade de frequência

0.06
0.04
0.02
0.00

5 10 15 20

Número de erros

Agora famos fazer o ramo-e-folhas.


> stem(p_4_cap_2,scale=2)
The decimal point is at the |
5 | 00
6 | 000
7 | 00000
8 | 0000000
9 | 00
10 | 00000
11 | 0000
12 | 000000000
13 | 0
14 | 0000000
15 | 00
16 | 0
17 |
18 |
19 | 0
20 |
21 |
22 | 0

Você também pode gostar