Escolar Documentos
Profissional Documentos
Cultura Documentos
Aula 02
Curso: Estatística – Regular Área Fiscal
Professor: Fábio Amorim
Assunto Página
1- Introdução 04
2- Tabelas estatísticas 06
3- Gráficos 08
4- Distribuição de frequências 10
5- Medidas de posição 16
6- Medidas de variabilidade 35
7- Questões comentadas 45
8- Resumo da aula 104
9- Lista de exercícios 107
10- Gabarito 124
1- Introdução
2- Tabelas estatísticas
Cabeçalho
Corpo
Rodapé
Classificação
As tabelas são também chamadas de séries, e podem ser
classificadas em três tipos: cronológicas, geográficas ou específicas.
3- Gráficos
4- Distribuição de frequências
b) , para
c) (Fórmula de Sturges)
Limites das Classes: são os extremos de uma classe (inferior e
superior), e podem ser representados por:
a) a ├── b: inclui o limite inferior “a” e exclui limite superior “b”;
b) a ──| b: exclui o limite inferior “a” e inclui limite superior “b”;
c) a ├──| b: inclui o limite inferior “a” e o limite superior “b”;
d) a ── b: exclui o limite inferior “a” e o limite superior “b”.
Ponto Médio de uma Classe: é a média aritmética entre o limite
inferior e o limite superior de uma classe.
Amplitude das Classes (h): é a diferença entre o limite superior e o
inferior de uma classe. Pode ser calculada a partir da divisão entre a
amplitude total e o número de classes.
a) ou;
b) (Fórmula de Sturges)
a) Frequência Absoluta ( )
É o número observações que aparecem em cada classe da
distribuição. No exemplo anterior, a frequência inserida na distribuição é
uma frequência absoluta.
Distância de Frequências
frenagem (m) Absolutas
13,50 ├── 13,75 11
13,75 ├── 14,00 1
14,00 ├── 14,25 9
14,25 ├── 14,50 3
14,50 ├── 14,75 3
14,75 ├── 15,00 4
Total 31
12
Frequências Absolutas
10
0
13,25 13,50 13,75 14,00 14,25 14,50 14,75 15,00
Classes
o Polígono de frequências
É o gráfico que se obtém a partir da união, por linhas retas, dos
pontos médios das bases superiores dos retângulos do histograma.
12
10 Polígono de
Frequências Absolutas
frequências
8
0
13,25 13,50 13,75 14,00 14,25 14,50 14,75 15,00
Classes
35
Polígono de
30 frequências
Frequências Acumuladas
Acumuladas
25
20
15
10
0
13,25 13,50 13,75 14,00 14,25 14,50 14,75 15,00
Classes
5- Medidas de posição
Total
Distribuição de Frequências
Vamos calcular agora a média aritmética da distribuição de
frequências de uma variável contínua X descrita a seguir.
Variável Frequências
Absolutas ( )
0 ├── 20 5
20 ├── 40 4
40 ├── 60 8
60 ├── 80 4
80 ├── 100 2
100 ├── 120 7
n ve es
Produto e divisão
Agora, se multiplicássemos ou dividíssemos todos os valores de uma
série por uma constante “a”, qual seria o comportamento da nova média
aritmética?
Vamos tomar novamente como exemplo a série de dados X: (2, 3,
7). Calculamos anteriormente a média dessa série em . O que
acontecerá com a média se nós multiplicarmos por 2 todos os valores de X?
Dados Agrupados
No caso de dados agrupados:
Ou então:
Distribuição de Frequências
Para a distribuição de frequências, basta substituir o valor de pelo
ponto médio de cada classe , assim:
Ou então:
Resposta, letra C.
Dados Agrupados
Distribuição de Frequências
5.5– Mediana
Sejam dados de uma variável X. Se colocarmos esses
valores numa ordem crescente, a mediana (Md) de X é o valor que divide
quantitativamente os dados em duas partes iguais:
0 Mediana n
Seja a série de dados (0, 40, 82, 74, 93, 25, 66). Qual o
valor da sua mediana?
Resolução:
1º passo
O primeiro passo para o cálculo da mediana é colocar os dados em
ordem crescente: (0, 25, 40, 66, 74, 82, 93), assim temos o chamado rol.
2º passo
O segundo passo é verificar o número de elementos ( ) da série.
Neste exemplo, elementos. Tratando-se de um número ímpar, o
elemento de posição representará o valor da mediana.
Mediana
0 n/2 elementos n/2 elementos n
4ª posição
Mediana = 66
Seja a série de dados (11, 16, 19, 14, 13, 13). Qual o valor
da sua mediana?
Resolução:
1º passo
Repetindo o primeiro passo, colocamos o conjunto de dados em
ordem crescente: (11, 13, 13, 14, 16, 19).
2º passo
3ª posição 4ª posição
Mediana = 13,5
Dados Agrupados
Dada a seguinte série de dados agrupados, qual o valor da
sua mediana?
Variável Frequências
Absolutas ( )
1 35
2 45
3 90
4 35
5 25
6 70
Total 300
Total 30
Percebam que, como se trata de variável contínua, o valor do limite
superior de uma classe é igual ao valor do limite inferior da classe
subsequente. Sendo assim, a mediana (15ª posição) estará posicionada na
classe 40 ├── 60, pois esta classe contempla os elementos que variam da
9ª à 18ª posição.
3º passo
O terceiro passo será estabelecer o valor da Mediana, que pertence à
classe 40 ├── 60. Para isso, precisamos fazer uma interpolação linear nesse
intervalo.
Existem alguns modos de fazer esses cálculos, proponho a vocês o
mais intuitivo, em minha opinião, sem precisarmos decorar fórmulas
prontas.
35
30
Frequências Acumuladas
25
20
Posição 18
Posição 15
15
10 Posição 9
0
0 20 40 Md 60 80 100 120
Variável
Posição 18
Posição 15
Posição 9
Mediana
40 60
Na linha vertical do triângulo, temos as posições da distribuição de
frequências, e na linha horizontal, os limites inferiores e superiores da
classe onde se encontra a mediana.
Dessa forma, precisamos encontrar o valor correspondente à 15ª
posição da distribuição de frequências.
Para fazermos esse cálculo, basta calcularmos a proporção entre o
triângulo maior e o menor:
18
15
3
1
9
40 Md 60
4
2
5.6– Quartis
Sejam dados de uma variável X. Se colocarmos esses
valores numa ordem crescente, os quartis de X são os valores que dividem
os dados em quatro partes iguais:
Q1 Q2 Q3
Sejam os dados (0, 40, 82, 74, 93, 25, 66). Qual o valor dos
quartis dessa série?
Resolução:
1º passo
O primeiro passo para o cálculo dos quartis é colocar os dados em
ordem crescente: (0, 25, 40, 66, 74, 82, 93).
2º passo
O segundo passo é verificar o número de elementos ( ) do conjunto.
Neste exemplo, elementos. Tratando-se de um número ímpar, o
elemento de posição representará o limite do primeiro quartil, o
elemento de posição , o limite do segundo quartil, e o elemento
, o limite do terceiro quartil.
Sejam os dados (11, 16, 14, 20, 19, 14, 13, 13). Qual o
valor dos quartis dessa série?
Resolução:
1º passo
Repetindo o primeiro passo, colocamos o conjunto de dados em
ordem crescente: (11, 13, 13, 14, 14, 16, 19, 20).
2º passo
O segundo passo é verificar o número de elementos ( ) do conjunto.
Neste exemplo, elementos. Tratando-se de um número par, os
elementos de posição e o subsequente cercam a posição de Q1, os
elementos de posição e o subsequente cercam a posição de Q2, e os
elementos de posição e o subsequente cercam a posição de Q3.
Desse modo:
Q1 Q2 Q3
3º passo
Para encontrar os quartis da série, vamos calcular a média aritmética
das variáveis entre as quais estão inseridos Q1, Q2 e Q3.
Variável Contínua
Dada a seguinte distribuição de frequências da variável X,
qual o valor dos seus quartis?
Variável Frequências
Absolutas ( )
0 ├── 20 5
20 ├── 40 4
40 ├── 60 8
60 ├── 80 6
80 ├── 100 2
100 ├── 120 7
Total 32
Resolução:
1º passo
Para as variáveis contínuas, o primeiro passo é calcular a posição de
Q1: “ ”, Q2: “ ” e Q3: “ ”, não interessando se “ ” é par ou ímpar.
Sendo assim:
2º passo
O segundo passo é identificar em que classe o 8º, 16º e 24º
elementos se encontram. Para isso, precisamos calcular valores das
frequências acumuladas :
Total 32
3º passo
O terceiro passo será estabelecer o valor dos quartis. Desenhando
nosso triângulo de apoio:
9ª posição
8ª posição
5ª posição
Q1
40
20Depois, fazemos a proporção entre os triângulos:
9
8
5
Q1
20 40
16ª posição
9ª posição
Q2
40 60
17
16
40 Q2 9
60
Assim:
Multiplicação e Divisão
O que acontece com a mediana de uma variável X quando
multiplicamos ou dividimos o valor de uma constante “a” a todos os seus
dados? Vamos tomar como exemplo a variável X: (4, 7, 10), cuja mediana
é igual a 7.
Vamos analisar o comportamento da mediana se multiplicarmos por 2
todos os dados da variável X?
5.8– Moda
Sejam dados de uma variável X. A Moda é uma
medida de posição que representa a variável mais frequente, ou seja,
aquela que aparece mais vezes na série, possuindo a maior frequência
absoluta.
Para variáveis discretas, a moda decorre de simples observação.
Variável Frequências
Absolutas ( )
1 14
2 17
3 16
4 22
5 15
Onde,
= limite inferior da classe modal;
Δ1 = diferença entre a frequência da classe modal e a imediatamente
anterior
Δ2 = diferença entre a frequência da classe modal e a imediatamente
posterior
= amplitude da classe
6- Medidas de variabilidade
15 8
Frequências (Fi)
Frequências (Fi)
6
10
4
5
2
0 0
1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9
Xi Yi
Frequências
Absolutas ( )
10 ├── 20 11
20 ├── 30 1
30 ├── 40 9
40 ├── 50 3
Agora, DM:
Frequências
Absolutas ( )
1 7 7
2 5 10
3 7 21
4 6 24
5 5 25
Total 30 87
1 7 1,9 13,3
2 5 0,9 9
87/30=
3 7 0,1 2,1
2,9
4 6 1,1 26,4
5 5 2,1 52,5
Total 30 103,3
Portanto,
6.3– Variância
A variância (²) é uma medida de variabilidade que consiste em
somar os quadrados de cada desvio de em relação à média. Sendo assim,
dada uma variável X, de valores , cuja média é igual a , a
variância ² é calculada por:
Agora, :
Dados Agrupados
Para dados agrupados por frequências absolutas Fi, o cálculo da
variância é feito da seguinte forma:
1 7 7 4 28
2 5 10 1 5
99/33=
3 7 21 0 0
3,0
4 9 36 1 9
5 5 25 4 20
Total 33 99 62
Distribuição de Frequências
Para uma distribuição de frequências, de variável contínua,
calculamos substituindo pelo ponto médio de cada classe . Sendo
assim:
6.4– Desvio-padrão
O Desvio padrão () é a medida de variabilidade mais importante da
estatística descritiva e, consequentemente, a mais cobrada nas provas.
O Desvio padrão possui a mesma dimensão da variável, e representa
a dispersão existente dos dados em relação à média. Variáveis com desvio-
padrão baixo indicam que os dados se encontram próximos à média.
Média
No caso da variância:
E, por conseguinte:
Resolução:
Alternativa A
O nível de dispersão é representado pelo coeficiente de variação, igual a
20% para a qualidade e 24% para a tempestividade. Não se pode afirmar
que essas medidas representam um “elevado nível” de dispersão. Seria, se
os valores de CV fossem superiores a 50%. Alternativa incorreta.
Alternativa B
Ao contrário, o valor do coeficiente de variação da qualidade é inferior ao da
tempestividade. Sendo assim, as avaliações da qualidade foram menos
dispersas. Alternativa incorreta.
Alternativa C
Como o coeficiente de variação da qualidade é inferior em comparação com
a tempestividade, está correto afirmarmos que as avaliações de qualidade
são mais homogêneas, ou seja, mais próximas da média. Alternativa
correta.
Alternativa D
7- Questões Comentadas
Resolução:
Assertiva I
Está correto, como vimos nesta aula, o histograma é um gráfico de
distribuição de frequências, formados por retângulos justapostos, cuja área
de cada um é obtida a partir da multiplicação entre o intervalo de classe e o
valor da frequência absoluta. Assertiva correta.
Assertiva II
As variáveis quantitativas são aquelas que podem ser expressas em termos
numéricos, seja da forma discreta ou da forma contínua.
Vimos que o gráfico de setores é adequado para representar proporções, o
que pode acontecer tanto para as variáveis qualitativas quanto para as
quantitativas.
Portanto, alternativa incorreta.
(A) (B)
(C) (D)
(E)
máximo
Q3
mediana
Q2
mínimo
Distribuição
Média = Mediana = Desvio-padrão
Simétrica
Alternativa (B)
Moda é a medida de posição que representa os salários que possuem
a maior frequência absoluta. Neste problema, Mo=R$ 4.000,00.
Dessa forma, o número de funcionários que ganha acima da Moda, ou
seja, acima de R$ 4.000,00 é igual a 60, conforme indicado no gráfico de
colunas:
Resposta, letra C.
, NA=37,5%
, NB=50%.
, NC=12,5%
Resposta, letra A.
.
Para calcular a mediana, precisamos dos valores da frequência
acumulada:
Variável i
0 9 9
1 16 9+16=25
2 21 25+21=46
3 24 46+24=70
4 25 70+25=95
5 24 95+24=119
6 21 119+21=140
Total 140
0
1
2
3
4
Variável k Frequência
0 10 0
1 45 45
2 60 120
3 55 165
4 30 120
Total 200 450
Variável k Frequência
0 10 10
1 45 10+45=55
2 60 55+60=115
3 55 115+55=170
4 30 170+30=200
Total 200
70ª posição
60ª posição
30ª posição
Md
1500 2000
70
60
30
1500 Md 2000
Resposta, letra C.
15. (FCC / Prefeitura de São Paulo / 2008) A tabela abaixo refere-se
a um levantamento efetuado pela Cia. De Parafusos SPF sobre o número de
parafusos com defeito em cada lote de 100 unidades no mês de fevereiro de
2008. A companhia fabricou 600 lotes nesse mês
Portanto, .
Portanto,
2ª Tabela
Variável (z) Frequência (Fz) PM
1000 ├── 2000 10 1500 15000
2000 ├── 3000 15 2500 37500
3000 ├── 4000 15 3500 52500
4000 ├── 5000 10 4500 45000
Total 50 150000
Portanto,
Desvio-padrão:
2ª Tabela – Vamos dividir os valores dos dados por 100 para facilitar:
Variável (z) Frequência (Fz) PM Fs x
Desvio-padrão:
25
10
2000 Md 3000
Sabe-se que a mediana dos salários desses funcionários calculada por meio
dessa tabela pelo método da interpolação linear é igual a 8,8 SM. Nessas
condições, o salário médio desses 400 funcionários, em número de salários
mínimos, considerando que todos os valores incluídos em um intervalo de
classe são coincidentes com o ponto médio do intervalo, é igual a
(A) 8,72 (B) 8,54 (C) 8,83 (D) 8,62 (E) 8,93
200ª posição
148ª posição
Md=8,8
8 10
Depois, fazemos a proporção entre os triângulos:
(148+x)
200
148
8 10
8,8
Resposta, letra E.
18. (FGV / SEFAZ-RJ / 2010) A média, a mediana e a variância das
idades de um grupo de vinte pessoas são, hoje, iguais, respectivamente, a
34, 35 e 24. Daqui a dez anos, os valores da média, da mediana e da
variância das idades dessas pessoas serão, respectivamente:
(A) 44, 35 e 34.
(B) 44, 45 e 12.
(C) 44, 45 e 24.
(D) 34, 35 e 12.
(E) 44, 45 e 124.
R. Se média das idades das pessoas, hoje, é igual a 34. Obviamente, daqui
a dez anos, as pessoas terão a idade de hoje, mais 10. Portanto,
precisamos avaliar o comportamento da média com a adição de um valor
constante a todos os elementos.
Nesse sentido, aprendemos nesta aula que se somarmos o valor de
uma constante aos elementos de uma série, o valor da sua média também
Fi 2 3 4 5 6 4 3 1 1 2 1 1 1 1 1 1
Fi 2 3 4 5 6 4 3 1 1 2 1 1 1 1 1 1
2 5 9 14 20 24 27 28 29 31 32 33 34 35 36 37
Resposta, letra B.
Segundo o enunciado:
(A) 1,429. (B) 1,225. (C) 1,5. (D) 1,39. (E) 1,4.
R.
A variância amostral é dada pela fórmula:
5 2 10
6 6 36
7 6 42
8 4 32
9 3 27
Total 21 147
Portanto:
Variável (xi) Fi
5 2 -2 4 8
6 6 -1 1 6
7 6 0 0 0
8 4 1 1 4
9 3 2 4 12
Total 21 30
Resposta, letra C.
-2 6a -12a
1 1a a
2 3a 6a
Total 10a -5a
A média é igual a:
Variável (xi) Fi
Resposta, letra A.
Resposta, letra C.
R.
Inicialmente, vamos calcular a média da distribuição, após a campanha:
Idade Frequência Frequência Ponto Médio PM x
Absoluta (F) Relativa (f) da Classe Porcentagem
(PM)
18 - 25 20 40% 21,5 8,6
25 - 30 15 30% 27,5 8,25
30 - 35 10 20% 32,5 6,5
35 - 40 5 10% 37,5 3,75
Total 50 100% 27,1
Portanto, a média aritmética subiu para 27,1 anos.
Resposta, letra A.
Média Geométrica
Média Harmônica
Portanto,
Resposta, letra D.
0 ├── 2 10 1 10
2 ├── 4 20 3 60
4 ├── 6 240 5 1200
6 ├── 8 410 7 2870
8 ├── 10 120 9 1080
Total 800 5220
Resposta, letra E.
39 4,6 21,16
33 -1,4 1,96
25 -9,4 88,36
30 34,4 -4,4 19,36
41 6,6 43,56
36 1,6 2,56
37 2,6 6,76
Total 183,72
50 2,2 4,84
52 4,2 17,64
47 -0,8 0,64
49 47,8 1,2 1,44
54 6,2 38,44
40 -7,8 60,84
43 -4,8 23,04
Total 146,88
Moda
A Moda é uma medida é uma medida de posição que indica a variável com o
maior número de frequências na população ou amostra.
Nesse sentido, observando a tabela acima, percebe-se que a classe que
possui o maior número de alunos é a classe compreendida por alunos entre
7 e 8 anos.
Portanto, a assertiva I é falsa.
Mediana
A Mediana é uma medida de posição que indica a posição da variável onde
se divide os dados em duas partes iguais.
Sendo o número total de alunos igual a 84.000, e a variável contínua, a
mediana seria a classe a que pertence o aluno que está na 42.000ª posição.
12 – 14 8.500 76.000
15 - 18 5.500 81.500
>18 2.500 84.000
Total 84.000
Percebe-se, pois, que a classe composta pelos alunos que possuem entre 9
e 10 anos é a que contem o aluno de posição 42.000. Portanto, a mediana
dos dados encontra-se nessa classe.
Portanto, a assertiva III é falsa.
Média
Como a Moda é menor que a Mediana, a distribuição de frequências do
enunciado é simétrica à direita:
Isso indica que a média pode estar na classe igual ou superior à mediana.
Porém, com as informações do enunciado, não é possível identificarmos
qual a classe da média, pois as classes dos alunos com idade abaixo de 6
anos e acima de 18 anos não foram definidas para que possamos fazer os
cálculos com precisão.
Pressupondo o ponto médio dessa classe como sendo 6 e 18 anos,
respectivamente, chegaríamos a uma média de 9,6 anos,
aproximadamente, bastante longe da classe indicada na assertiva.
Portanto, a assertiva II é falsa.
Resposta, letra D.
PROPRIEDADES
Influenciado por
Soma e Multiplicação e
Subtração? Divisão?
Coeficiente de
sim não
Variação
As medidas de X são:
Por fim:
Resposta, letra C.
(A)
(B)
(C)
(D)
(E)
R.
Conforme vimos nas propriedades das medidas de posição e dispersão:
Influenciado por
Soma e Multiplicação e
Subtração? Divisão?
Coeficiente de
sim não
Variação
Resposta, letra E.
Mediana:
Sendo o número “n” de elementos, ímpar, a mediana está na posição
(n+1)/2=3
O elemento do conjunto que está na 3ª posição é o número 3.
Portanto, a mediana é igual a 3.
Desvio Padrão:
Coeficiente de Variação:
Variância Relativa:
A variância relativa é o quociente entre a variância absoluta e o quadrado
da média. Em outras palavras, é o quadrado do coeficiente de variação.
Resposta, letra A.
Resposta, letra E.
A média é igual a .
Resposta, letra B.
Resposta, letra C.
35ª posição
25ª posição
22ª posição
Md
10 20
25
35
22
10 Md 20
8- Resumo da Aula
Discreta
Variável
Quantitativa
Contínua
Nominal
Variável Qualitativa
Ordinal
Estatística Descritiva
Tabelas Gráficos Medidas
• Série Temporal • Colunas • de Posição
• Série • Barras • de Variabilidade
Geográfica • Setores
• Série Específica • Polar
• Distribuição de • Linhas
Frequências
Média
Mediana
Número de
Md → (n+1)/2
Elementos Ímpar
Série e
Dados Agrupados
Número de Md → entre n/2
Elementos Par e (n/2)+1
Distribuição de Interpolação
Md → n/2
Frequências Linear
Maior
Maior
Fórmula de
Moda número de Frequência
Czuber
elementos
Média Geométrica
Série
Dados
Agrupados
Distribuição
de
Frequências
Média Harmônica
Série
Dados
Agrupados
Distribuição
de
Frequências
Variância Populacional*
Série
Dados
Agrupados
Frequências
Acumuladas
Desvio
Padrão
Coeficiente
de Variação
PROPRIEDADES
Influenciado por
Soma e Multiplicação e
Subtração? Divisão?
Média sim sim
Mediana sim sim
Moda sim sim
Desvio-padrão sim, na mesma
não
proporção
Variância sim, no quadrado
não
da proporção
Coeficiente de
sim não
Variação
9- Lista de Exercícios
(A) (B)
(C) (D)
(F)
(A) o número médio de aviões que decolaram por hora é igual a 27.
(B) o número mediano de aviões que decolaram por hora é igual a 29.
(C) em 50% das horas o número de aviões que decolaram por hora ficou
abaixo da média.
(D) o número mediano de aviões que decolaram por hora é igual a 27.
(E) em 30% das horas o número de aviões que decolaram por hora foi
superior a 30.
(A) 4,0 (B) 2,5. (C) 4,5. (D) 5,5 (E) 3,0
Se a escola tem como meta para 2003 ampliar 50% o número de alunos em
relação a média dos últimos quatro anos, a escola terá em 2003, caso atinja
a meta, um total de alunos igual a
(A) 890. (B) 960. (C) 1020. (D) 1100. (E) 1218.
Sabe-se que a mediana dos salários desses funcionários calculada por meio
dessa tabela pelo método da interpolação linear é igual a 8,8 SM. Nessas
condições, o salário médio desses 400 funcionários, em número de salários
mínimos, considerando que todos os valores incluídos em um intervalo de
classe são coincidentes com o ponto médio do intervalo, é igual a
(A) 8,72 (B) 8,54 (C) 8,83 (D) 8,62 (E) 8,93
Xi 5 6 7 8 9
fi 2 6 6 4 3
(A)
(B)
(C)
(D)
(E)
10- Gabarito
1 A 12 B 23 E 34 C
2 C 13 E 24 B 35 A
3 B 14 C 25 A 36 E
4 B 15 C 26 C 37 ANULADA
5 D 16 B 27 A 38 A
6 C 17 E 28 C 39 E
7 B 18 C 29 A 40 B
8 C 19 C 30 D 41 C
9 A 20 D 31 E 42 D
10 B 21 D 32 B
11 E 22 ANULADA 33 D