Você está na página 1de 90

Lista 3

1. Medidas de dispersão: variância, desvio padrão


2. Coeficiente de correlação
Propriedades da média e da variância
Propriedades

Formulas alternativas
E se ao invés de um conjunto de dados temos uma variável aleatória?
Com calcular a média e a variancia? (será uma nova lista)
Questão 7
Questão 7: coeficiente de variação: Resolução
A média ( ) é o valor que representa a concentração dos dados de uma distribuição. Ela corresponde ao
somatório dos valores de um grupo dividido pelo número de elementos desse grupo.

Já o Coeficiente de Variação (CV) é uma variável utilizada para medir a dispersão de uma distribuição de
probabilidade ou de uma distribuição de frequências. O CV é calculado pelo quociente entre o desvio padrão e a
média.

Nesse contexto, o desvio padrão (σ) trata-se de um indicador que mede o grau de dispersão de um conjunto de
dados. Ele é calculado pela seguinte equação:

Em que xi é o valor do dado que ocupa a posição “i” do conjunto de dados, é a média do conjunto de dados e
n é o número de elementos no conjunto de dados.

Ao adicionar 3 em todos os dados, a média amostral μ aumenta em 3 também, isto é, torna-se (μ + 3). Por sua
vez, o desvio padrão permanece o mesmo valor, visto que o somatório da diferença entre xi e a média não vai se
alterar, pois tanto a média quanto os valores xi foram acrescidos em 3. Portanto, após realizar a correção, o valor
do coeficiente de variação amostral passou a ser CV = σ/(μ + 3). Logo, a alternativa C está correta.
Questão 10: propriedades da média e da variância:
Questão 10: resolução

GABARITO: ALTERNATIVA E
Questão 21: propriedades da média e da variância:
Resolução questão 21
Questão 22: coeficiente de variação
Questão 22: coeficiente de variação
Resolução:
 I. Correto
CV= (104/520) = 0,20 -> 20%
 II. Correto
( 620 - 545) corresponde à diferença entre o terceiro quartil e o segundo quartil (mediana)
 III. Errada
Moda > média -> assimetria à esquerda ou negativa
 IV. Errada
Quem divide a distribuição ao meio é a mediana (545)
Questão 23:

Questão 23: resolução


Questão 26 Medida de dispersão
Questão 26 Resolução
ALTERNATIVA A CORRETA

Representando os valores dos salários por x1, x2, ...x100, podemos utilizar e desenvolver a fórmula da
variância:

2835600 = [(x1 - 2380)² + (x2 - 2380)² + ... + (x100 - 2380)²]/100

(x1² - 2.2380.x1 + 2380² + x2² - 2.2380.x2 + 2380² + ... + x100² - 2.2380.x100 + 2380²)/100 = 2835600

(x1² - 4760.x1 + 2380² + ... +x100² - 4760.x100 + 2380²)/100 = 2835600

Organizando:

[x1² + x2² + ... + x100² - 4760(x1 + x2 + ... x100) + 100.2380²]/100 = 2835600

Perceba que podemos obter a soma dos salários a partir da média dos salários. Chamando a média de M e
sabendo que n = 100 e a média é 2380:

M = S/n

2380 = S/100

S = 238000 reais

Com a soma dos salários podemos substituir e desenvolver mais a equação:

[x1² + x2² + ... + x100² - 4760(238000) + 566440000]/100 = 2835600

[x1² + x2² + ... + x100² - 1132880000 + 566440000]/100 = 2835600

[x1² + x2² + ... + x100² - 566440000]/100 = 2835600

Podemos estruturar assim:

[(x1² + x2² + ... + x100²)/100] - [566440000/100] = 2835600

[(x1² + x2² + ... + x100²)/100] - 5664400 = 2835600

[(x1² + x2² + ... + x100²)/100] = 8500000

x1² + x2² + ... + x100² = 850000000

Assim, obtemos a soma dos quadrados dos salários. Porém, estamos em busca da média dos quadrados dos
salários sem as observações nulas. Sabemos que 15% dos trabalhadores deram respostas nulas,
portanto sobram 85 trabalhadores.

Assim, 85 trabalhadores não deram resposta nula. Portanto, podemos calcular agora para n = 85:

Média = (x1² + x2² + ... + x100²)/85

Média = 850000000/85

Média = 10000000 reais²

Portanto, a média dos quadrados dos salários é 10.000.000,00 reais².


Questão 35 Medida de dispersão
Questão 35 resolução
Questão 33 coeficiente de variação
Questão 33 resolução

GABARITO LETRA D.

Aqui, devemos recordar o conceito de coeficiente de variação (ou CV).

Portanto, devemos calcular o CV, ou seja, o quociente entre o desvio padrão e a média para cada
uma das variáveis.
Questão 35: propriedade da média e da variancia
Questão 35: Resolução
Questão 38: Propriedades da média e da variância
Questão 38: resolução
A
Questão 40: Coeficiente de variação
Resolução
Questão 48 média e variância e coeficiente de variação
Questão 48 resolução
Questão 54
Resolução 54
Solução em texto
rápida
completa
Alternativa D: 50 reais e 18,2 reais²

Para encontrar a média amostral, usamos a seguinte fórmula para média de dados agrupados em classes:

Em que ci é o membro central de uma classe, Fi é o número de ocorrências de uma classe e n é o número total de
observações (100, no nosso caso).

Substituindo os valores do enunciado, ficamos com:

Para encontrar a variância amostral, usamos a fórmula para variância amostral de dados agrupados em
classes:

Lembre-se de que os resultados finais devem ser multiplicados por 10, pois a tabela do enunciado nos traz
informações de 10 em 10 reais. Assim, uma média de 5 equivale a 5 x 10 = 50 reais e uma variância de 1,82
equivale a 1,82 x 10 = 18,2 reais ao quadrado.
Questão 56 média e variância
Questão 56 resolução

Alternativa D.

Sabendo que

Mediana X2 = 3,0; 4,0; 4,5; 5,5; 6,0; 7,0.


Mediana: (4,5 + 5,5) /2 = 5

A média dos dois experimentos é igual a 5.

X1= (4+4+5+5+6+6)
X2: (3+4+4,5+5,5+6+7)

Podemos ver que os dados de X1 tem um desvio menor do que os dados de X2. Logo, X1 é mais preciso.
Questão 58 variância, desvio padrão
Questão 58 resolução
Questão 65 (observação, essa lista está falando de apenas um
conjunto de dados. Covariância e correlação é quando queremos
comparar dois conjuntos de dados, veremos em outra lista)
Questão 65 resultados

Dados: 1, 1, 2, 4, 4, 4, 5, 5, 6, 6.

Sabendo que a moda é o valor que aparece com mais frequência:


O número 4 aparece 3 vezes. É o que mais se repete, portanto a moda é 4.
Questão 65 resultados

Dados: 1, 1, 2, 4, 4, 4, 5, 5, 6, 6.

Sabendo que a moda é o valor que aparece com mais frequência:


O número 4 aparece 3 vezes. É o que mais se repete, portanto a moda é 4.
Questão 66 média e variância
Questão 79 Media desvio padrão e variância
Questão 79 resolução
GABARITO: LETRA D

A questão nos solicitou o cálculo da média e o desvio padrão da amostra dada.

Para o Cálculo da Média, temos:

Portanto, após o cálculo da Média da Amostra, podemos calcular o Desvio Padrão, utilizando a seguinte
fórmula:

Assim, para facilitar o cálculo do desvio padrão, vamos esquematizar os cálculos necessários:

Portanto, temos:
Questão 82
Questão 82 resolução
Questão 85 Media variância e desvio padrão
Questão 85 resolução

Alternativa E: 36 e 6 anos.

Primeiramente, vamos calcular a média das idades de todos os 50 gerentes (X').

A empresa possui 50 gerentes no total, dos quais 30 foram selecionados e 20 não foram selecionados:

A soma das idades dos selecionados é dada pela multiplicação da média dos selecionados (X' = 40)
pela quantidade de selecionados (n = 30):

Soma das idades dos selecionados = 1.200

A soma das idades dos não selecionados é dada pela multiplicação da média dos não selecionados (X' = 30)
pela quantidade de não selecionados (n = 20):

Soma das idades dos não selecionados = 600

A soma das idades de todos os 50 gerentes é dada pela somatório da soma das idades dos
selecionados (1.200) com a soma das idades dos não selecionados (600):

Soma das idades de todos os 50 gerentes = 1.800

A média das idades de todos os 50 gerentes (X') é dada pela razão entre a soma das idades de todos os 50
gerentes (soma = 1.800) e a quantidade de gerentes (n = 50):

X' = 1.800/50 = 36

Agora, vamos calcular o desvio padrão das idades de todos os 50 gerentes (σ).

De acordo com o enunciado, o desvio padrão das idades dos gerentes selecionados é igual a 4 (σ = 4). Portanto,
a variância das idades dos gerentes selecionados (σ²) é igual a 16.

A variância das idades dos gerentes selecionados (σ² = 16) é dada pela diferença entre a média da soma dos
quadrados das idades dos gerentes selecionados ((X²)') e o quadrado ((X')²) da média das idades dos
gerentes selecionados (X' = 40):

16 = (X²)' - 40²

(X²)' = 1616

A soma dos quadrados das idades dos selecionados é dada pela multiplicação da média dos quadrados
selecionados ((X²)' = 1616) pela quantidade de selecionados (n = 30):

Soma dos quadrados das idades dos selecionados = 1616 * 30

Soma dos quadrados das idades dos selecionados = 48.480

De acordo com o enunciado, o desvio padrão das idades dos gerentes não selecionados é igual a 2,4 (σ = 2,4).
Portanto, a variância das idades dos gerentes não selecionados (σ²) é igual a, aproximadamente, 6.

A variância das idades dos gerentes não selecionados (σ² = 6) é dada pela diferença entre a média da soma
dos quadrados das idades dos gerentes não selecionados ((X²)') e o quadrado ((X')²) da média das idades
dos gerentes selecionados (X' = 30):
6 = (X²)' - 30²

(X²)' = 906

A soma dos quadrados das idades dos não selecionados é dada pela multiplicação da média dos quadrados
não selecionados ((X²)' = 906) pela quantidade de não selecionados (n = 20):

Soma dos quadrados das idades dos não selecionados = 906 * 20

Soma dos quadrados das idades dos não selecionados = 18.120

A soma dos quadrados das idades de todos os 50 gerentes é dada pela somatório da soma dos quadrados das
idades dos selecionados (48.480) com a soma dos quadrados das idades dos não selecionados (18.120):

Soma dos quadrados das idades de todos os 50 gerentes = 66.600

A média das idades dos quadrados de todos os 50 gerentes (X²') é é dada pela razão entre a soma dos
quadrados das idades de todos os 50 gerentes (soma = 66.600) e a quantidade de gerentes (n = 50):

X²' = 66.600/50

X²' = 1.332

A variância das idades de todos os 50 gerentes (σ²) é dada pela diferença entre a média da soma dos
quadrados das idades de todos os 50 gerentes (X²' = 1.332) e o quadrado da média das idades dos gerentes
selecionados (X' = 36):

σ² = 1.332 - 36²

σ² = 36

Finalmente, o desvio padrão das idades de todos os 50 gerentes (σ) é:

σ = √36

σ=6

Portanto, a média (X') e o desvio padrão (σ), aproximada e respectivamente, das idades de todos os 50 gerentes
eram 36 e 6 anos.
Questão 88 variancia
Resolução questão 88

LETRA D CORRETA (Média amostral (em salários mínimos): 4,1 / Variância amostral (em salários
mínimos²): 5,0).
Questão 92 coeficiente de variação
Questão 92 resolução

GABARITO: E.
Questão 97
Questão 97 Resolução
 I - FALSA. Basta observar que o desvio-padrão dos alunos ingressantes é de 9,3; ao passo que dos concluintes é
11,3.
 II - FALSA. Amplitude total (AT) = dos ingressantes = 54,4; é menor do que a dos concluintes = 68,2.
 III - VERDADEIRA. variância dos alunos ingressantes = 9,3²; é menor do que a dos concluintes é 11,3².
 IV - VERDADEIRA. a média: ingressantes = 26,8; é menor do que a dos concluintes = 32,2; bem como para a
Mediana: ingressantes = 27,2; é menor do que a dos concluintes = 31,5. Nada se falou em relação à moda na
tabela dada.
Questão 99
Questão 99 resolução
I - Os preços da região Sul são bem representados pelo preço médio, visto que a distribuição é homogênea, pois
apresenta coeficiente de variação de aproximadamente 10%.

Correta.

O coeficiente de varição é:

0,25 / 2,47 = 0,1012.

Assim, o coeficiente de variação é de aproximadamente 10%.

II - Os preços da região Centro-Oeste são melhor representados pelo preço médio, pois esta região apresenta o
maior desvio padrão entre todas as regiões.

Incorreta.

Apresentar o maior desvio padrão não significa que o preço médio represente melhor os preços da região.

III - Nas regiões Sudeste e Sul existe, em cada uma, pelo menos um posto de combustível que adota um preço
considerado outlier, utilizando-se como critério os limites inferiores e superiores obtidos em função dos quartis.

Correta.

O maior preço nas regiões Sul e Sudeste é 2,89 e 2,88, respectivamente. O valor obtido no 3º quartil nessas
regiões é 2,49 e 2,48, respectivamente.

Como a diferença entre esses valores é 0,4 em ambos os casos, podemos dizer que o preço máximo pode ser
considerado um outlier.
Questão 104
Questão 104 resolução
Questão 106
Questão 106 resolução

ALTERNATIVA CORRETA: A (9 e 4)

As informações do gráfico foram transcritas para a tabela abaixo. As colunas "MIN" e "MAX" representam,
respectivamente, a área mínima e a área máxima que será considerada para o cálculo da média e do desvio
padrão.

Como a média é a razão entre o somatório de elementos e o número de elementos, para o cálculo da média
mínima devemos multiplicar a frequência pela área mínima (coluna "MIN"), visto que a frequência indica
quantas vezes a área foi observada. Então, temos:

MÉDIA MIN = (2*2 + 6*5 + 8*9 + 3*13 + 1*17) / (2 + 6 + 8 + 3 + 1) = 8,1

Da mesma forma, vamos calcular a média máxima multiplicando a frequência pela área máxima (coluna
"MAX"):

MÉDIA MAX = (2*3 + 6*7 + 8*11 + 3*15 + 1*19) / (2 + 6 + 8 + 3 + 1) = 10

Podemos, então, obter uma média geral (MÉDIA MIN + MÉDIA MAX) / 2 = (8,1 + 10) / 2 = 9,05

Já o desvio padrão, pode ser obtido da seguinte forma:

DESVIO PADRÃO "MIN"

DESVIO PADRÃO "MAX" , em que f é a


frequência e n é o somatório da frequência.

Fazendo as contas:

Desvio médio = (desvio "MIN" + desvio "MAX") / 2 = (3,9 + 4,1) / 2 = 4

Portanto, média (média entre "MIN" e "MAX") e desvio (média entre desvio "MIN" e desvio "MAX")
aproximados são, respectivamente, 9 e 4.
Questão 119 variância
Questão 119 resolução
Questão 134
Questão 134 resolução
Questão 141
Questão 141 resolução

Você também pode gostar