Você está na página 1de 3

Universidade de São Paulo - USP

Instituto de Matemática e Estatística - IME


Curso de Verão 2020

Lista 1

As questões marcadas com (∗) devem sem entregues.

1. Seja fi = ni /n a frequência relativa da observação xi , para i = 1, . . . , n. Mostre que


n
X
x= fi xi .
i=1

2. Mostre que, para qualquer valores observados x1 , . . . , xn ,

a)
n
X
(xi − x) = 0.
i=1

b)
n
X n
X
(xi − x)2 = xi2 − nx 2 .
i=1 i=1

3. Existem diferentes formas de obter informação sobre determinada variável, ou de medi-la. Exis-
tem quatro escalas de medidas que podem ser utilizadas: escala nominal, escala ordinal, escala
intervalar e escala razão. A forma como os dados são analizados depende de como eles foram
obtidos e/ou medidos. Defina, exemplifique cada uma dessas escalas e identifique qual medida
de posição é apropriada para resumir as informações. Para cada uma das variáveis abaixo,
indique a escala usualmente adotada.

a) Salários dos empregados de uma indústria.


b) Número de respostas certas de alunos num teste com dez itens.
c) Temperatura diária da cidade de Manaus.
d) Opinião dos empregados da Companhia MB sobre a realização ou não de cursos obriga-
tórios de treinamento.
e) Porcentagem da receita de municípios aplicada em educação.

4. (∗) De forma simplificada, poderíamos dizer que existem três formas de classificar a distribuição
de um conjunto de observações quanto a sua forma, são elas: simétrica, assimétrica à direita,
assimétrica à esquerda. Difina essas três formas e relacione essa definição com a média, moda
e mediana da distribuição.

1
5. Estamos interessados em estudar a idade dos 12.325 funcionários da Cia. Distribuidora de Leite
Teco, e isso será feito por meio de uma amostra. Para determinar que tamanho deverá ter essa
amostra, foi colhida uma amostra-piloto. As idades observadas foram: 42, 35, 27, 21, 55, 18, 27,
30, 21, 24.

a) Determine as principais medidas descritivas dos dados que você conhece.


b) Qual dessas medidas você acredita que será a mais importante para julgar o tamanho final
da amostra? Por quê?

6. Estudando-se o consumo diário de leite, verificou-se que, em certa região, 20% das famílias
consomem até um litro, 50% consomem entre um e dois litros, 20% consomem entre dois e três
litros e o restante consome entre três e cinco litros.

a) Qual a variável em estudo?


b) Escreva as informações acima na forma de uma tabela de freqüências.
c) Construa o histograma.
d) Calcule a média e a mediana.
e) Calcule a variância e o desvio padrão.
f) Qual o valor do 1o quartil?

7. (∗) Numa pesquisa realizada com 100 famílias, levantaram-se as seguintes informações

Número de filhos 0 1 2 3 4 5 mais que 5


Frequência de famílias 17 20 28 19 7 4 5

a) Qual a mediana do número de filhos?


b) E a moda?
c) Que problemas você enfrentaria para calcular a média? Faça alguma suposição e encontre-
a.

8. (∗) Na companhia A, a média dos salários é 10.000 unidades e o 3o quartil é 5.000.

a) Se você se apresentasse como candidato a funcionário nessa firma e se o seu salário fosse
escolhido ao acaso entre todos os possíveis salários, o que seria mais provável: ganhar
mais ou menos que 5.000 unidades?
b) Suponha que na companhia B a média dos salários seja 7.000 unidades, a variância pra-
ticamente zero e o salário também seja escolhido ao acaso. Em qual companhia você se
apresentaria para procurar emprego?

2
9. Usando os dados da variável qualitativa região de procedência, da Tabela 1 das notas de aula,
transforme-a na variável quantitativa X, definida do seguinte modo: X = 1, se a região de
procedência for capital; X = 0, se a região de procedência for interior ou outra.

a) Calcule x e S.
b) Qual a interpretação de x?
c) Construa um histograma para X .

10. Uma companhia de seguros analisou a freqüência com que 2.000 segurados (1.000 homens e
1.000 mulheres) usaram o hospital. Os resultados foram:

Homens Mulheres
Usaram o hospital 100 150
Não usaram o hospital 900 850

a) Calcule a proporção amostral de homens entre os indivíduos que usaram o hospital.


b) Calcule a proporção amostral de homens entre os indivíduos que não usaram o hospital.
c) Você diria que o uso do hospital independe do sexo do segurado?

11. (∗) Abaixo estão os dados referentes à porcentagem da população economicamente ativa empre-
gada no setor primário e o respectivo índice de analfabetismo para algumas regiões metropoli-
tanas brasileiras.
Regiões metropolitanas Setor primário Índice de analfabetismo
São Paulo 2,0 17,5
Rio de Janeiro 2,5 18,5
Belém 2,9 19,5
Belo Horizonte 3,3 22,2
Salvador 4,1 26,5
Porto Alegre 4,3 16,6
Recife 7,0 36,6
Fortaleza 13,0 38,4
Fonte: Indicadores Sociais para Áreas Urbanas — IBGE — 1977.

a) Faça o diagrama de dispersão.


b) Você acha que existe uma dependência linear entre as duas variáveis?
c) Calcule o coeficiente de correlação.
d) Existe alguma região com comportamento diferente das demais? Se existe, elimine o valor
correspondente e recalcule o coeficiente de correlação.

Você também pode gostar