Escolar Documentos
Profissional Documentos
Cultura Documentos
Sabemos que estudar para concurso público não é tarefa fácil, mas acreditamos na sua
dedicação e por isso elaboramos nossa apostila com todo cuidado e nos exatos termos do
edital, para que você não estude assuntos desnecessários e nem perca tempo buscando
conteúdos faltantes. Somando sua dedicação aos nossos cuidados, esperamos que você
tenha uma ótima experiência de estudo e que consiga a tão almejada aprovação.
Caso existam dúvidas em disciplinas diferentes, por favor, encaminhar em e-mails separados,
pois facilita e agiliza o processo de envio para o tutor responsável, lembrando que teremos até
cinco dias úteis para respondê-lo (a).
TABELAS E GRÁFICOS
O nosso cotidiano é permeado das mais diversas informações, sendo muito delas expressas em
formas de tabelas e gráficos1, as quais constatamos através do noticiários televisivos, jornais, revistas,
entre outros. Os gráficos e tabelas fazem parte da linguagem universal da Matemática, e compreensão
desses elementos é fundamental para a leitura de informações e análise de dados.
A parte da Matemática que organiza e apresenta dados numéricos e a partir deles fornecer conclusões
é chamada de Estatística.
Tabelas: as informações nela são apresentadas em linhas e colunas, possibilitando uma melhor
leitura e interpretação. Exemplo:
Fonte: SEBRAE
Observação: nas tabelas e nos gráficos podemos notar que a um título e uma fonte. O título é utilizado
para evidenciar a principal informação apresentada, e a fonte identifica de onde os dados foram obtidos.
Tipos de Gráficos
Gráfico de linhas: são utilizados, em geral, para representar a variação de uma grandeza em certo
período de tempo.
Marcamos os pontos determinados pelos pares ordenados (classe, frequência) e os ligados por
segmentos de reta. Nesse tipo de gráfico, apenas os extremos dos segmentos de reta que compõem a
linha oferecem informações sobre o comportamento da amostra. Exemplo:
Gráfico de barras: também conhecido como gráficos de colunas, são utilizados, em geral, quando há
uma grande quantidade de dados. Para facilitar a leitura, em alguns casos, os dados numéricos podem
ser colocados acima das colunas correspondentes. Eles podem ser de dois tipos: barras verticais e
horizontais.
1
https://www.infoenem.com.br
http://mundoeducacao.bol.uol.com.br
1
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Gráfico de barras verticais: as frequências são indicadas em um eixo vertical. Marcamos os pontos
determinados pelos pares ordenados (classe, frequência) e os ligamos ao eixo das classes por meio de
barras verticais. Exemplo:
Observação: em um gráfico de colunas, cada barra deve ser proporcional à informação por ela
representada.
Gráfico de setores: são utilizados, em geral, para visualizar a relação entre as partes e o todo.
Dividimos um círculo em setores, com ângulos de medidas diretamente proporcionais às frequências
de classes. A medida α, em grau, do ângulo central que corresponde a uma classe de frequência F é
dada por:
360°
𝛼= .𝐹
𝐹𝑡
Onde:
Ft = frequência total
Exemplo
Para acharmos a frequência relativa, podemos fazer uma regra de três simples:
400 --- 100%
160 --- x
x = 160 .100/ 400 = 40%, e assim sucessivamente.
2
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Aplicando a fórmula teremos:
360° 360°
−𝐹𝑢𝑡𝑒𝑏𝑜𝑙: 𝛼 = .𝐹 → 𝛼 = . 160 → 𝛼 = 144°
𝐹𝑡 400
360° 360°
−𝑉ô𝑙𝑒𝑖: 𝛼 = .𝐹 → 𝛼 = . 120 → 𝛼 = 108°
𝐹𝑡 400
360° 360°
−𝐵𝑎𝑠𝑞𝑢𝑒𝑡𝑒: 𝛼 = .𝐹 → 𝛼 = . 60 → 𝛼 = 54°
𝐹𝑡 400
360° 360°
−𝑁𝑎𝑡𝑎çã𝑜: 𝛼 = .𝐹 → 𝛼 = . 20 → 𝛼 = 18°
𝐹𝑡 400
Como o gráfico é de setores, os dados percentuais serão distribuídos levando-se em conta a proporção
da área a ser representada relacionada aos valores das porcentagens. A área representativa no gráfico
será demarcada da seguinte maneira:
3
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Histograma: o consiste em retângulos contíguos com base nas faixas de valores da variável e com
área igual à frequência relativa da respectiva faixa. Desta forma, a altura de cada retângulo é denominada
densidade de frequência ou simplesmente densidade definida pelo quociente da área pela amplitude da
faixa. Alguns autores utilizam a frequência absoluta ou a porcentagem na construção do histograma, o
que pode ocasionar distorções (e, consequentemente, más interpretações) quando amplitudes diferentes
são utilizadas nas faixas. Exemplo:
Polígono de Frequência: semelhante ao histograma, mas construído a partir dos pontos médios das
classes. Exemplo:
Gráfico de Ogiva: apresenta uma distribuição de frequências acumuladas, utiliza uma poligonal
ascendente utilizando os pontos extremos.
Cartograma: é uma representação sobre uma carta geográfica. Este gráfico é empregado quando o
objetivo é de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.
4
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Interpretação de tabelas e gráficos
Para uma melhor interpretação de tabelas e gráficos devemos ter em mente algumas considerações:
- Observar primeiramente quais informações/dados estão presentes nos eixos vertical e horizontal,
para então fazer a leitura adequada do gráfico;
- Fazer a leitura isolada dos pontos.
- Leia com atenção o enunciado e esteja atento ao que pede o enunciado.
Exemplos
(Enem) O termo agronegócio não se refere apenas à agricultura e à pecuária, pois as atividades
ligadas a essa produção incluem fornecedores de equipamentos, serviços para a zona rural,
industrialização e comercialização dos produtos.
O gráfico seguinte mostra a participação percentual do agronegócio no PIB brasileiro:
Resolução
5
1678859 E-book gerado especialmente para DANIEL CRISTIAN
(Enem) O gráfico mostra a variação da extensão média de gelo marítimo, em milhões de quilômetros
quadrados, comparando dados dos anos 1995, 1998, 2000, 2005 e 2007. Os dados correspondem aos
meses de junho a setembro. O Ártico começa a recobrar o gelo quando termina o verão, em meados de
setembro. O gelo do mar atua como o sistema de resfriamento da Terra, refletindo quase toda a luz solar
de volta ao espaço. Águas de oceanos escuros, por sua vez, absorvem a luz solar e reforçam o
aquecimento do Ártico, ocasionando derretimento crescente do gelo.
Com base no gráfico e nas informações do texto, é possível inferir que houve maior aquecimento global
em
(A)1995.
(B)1998.
(C) 2000.
(D)2005.
(E)2007.
Resolução
O enunciado nos traz uma informação bastante importante e interessante, sendo chave para a
resolução da questão. Ele associa a camada de gelo marítimo com a reflexão da luz solar e
consequentemente ao resfriamento da Terra. Logo, quanto menor for a extensão de gelo marítimo, menor
será o resfriamento e portanto maior será o aquecimento global.
O ano que, segundo o gráfico, apresenta a menor extensão de gelo marítimo, é 2007.
Resposta: E
6
1678859 E-book gerado especialmente para DANIEL CRISTIAN
(A) A caneca
(B) A jarra
(C) O garrafão
(D) O tambor
O caminho é identificar grandezas que fazem parte do dia a dia e conhecer unidades de medida, no
caso, o litro. Preste atenção na palavra exatamente, logo a resposta está na alternativa B.
Questões
01. (Pref. Fortaleza/CE – Pedagogia – Pref. Fortaleza) “Estar alfabetizado, neste final de século,
supõe saber ler e interpretar dados apresentados de maneira organizada e construir representações, para
formular e resolver problemas que impliquem o recolhimento de dados e a análise de informações. Essa
característica da vida contemporânea traz ao currículo de Matemática uma demanda em abordar
elementos da estatística, da combinatória e da probabilidade, desde os ciclos iniciais” (BRASIL, 1997).
Observe os gráficos e analise as informações.
7
1678859 E-book gerado especialmente para DANIEL CRISTIAN
A partir das informações contidas nos gráficos, é correto afirmar que:
(A) nos dias 03 e 14 choveu a mesma quantidade em Fortaleza e Florianópolis.
(B) a quantidade de chuva acumulada no mês de março foi maior em Fortaleza.
(C) Fortaleza teve mais dias em que choveu do que Florianópolis.
(D) choveu a mesma quantidade em Fortaleza e Florianópolis.
03. (TJ/SP – Estatístico Judiciário – VUNESP) A distribuição de salários de uma empresa com
30 funcionários é dada na tabela seguinte.
8
1678859 E-book gerado especialmente para DANIEL CRISTIAN
(C) 10% dos trabalhadores ganham mais de 10 salários.
(D) 20% dos trabalhadores detêm mais de 40% da renda total.
(E) 60% dos trabalhadores detêm menos de 30% da renda total.
xi fi
30-35 4
35-40 12
40-45 10
45-50 8
50-55 6
TOTAL 40
Assinale a alternativa em que o histograma é o que melhor representa a distribuição de
frequência da tabela.
9
1678859 E-book gerado especialmente para DANIEL CRISTIAN
I. Em 2010, o aumento percentual de matrículas em cursos tecnológicos, comparado com 2001,
foi maior que 1000%.
II. Em 2010, houve 100,9 mil matrículas a mais em cursos tecnológicos que no ano anterior.
III. Em 2010, a razão entre a distribuição de matrículas no curso tecnológico presencial e à
distância foi de 2 para 5.
É correto o que se afirma em
(A) I e II, apenas.
(B) II, apenas.
(C) I, apenas.
(D) II e III, apenas.
(E) I, II e III.
( ) Certo ( ) Errado
Comentários
01. Resposta: C.
A única alternativa que contém a informação correta com os gráficos é a C.
03. Resposta: D.
(A) 1,8*10+2,5*8+3,0*5+5,0*4+8,0*2+15,0*1=104 salários
(B) 60% de 30, seriam 18 funcionários, portanto essa alternativa é errada, pois seriam 12.
(C)10% são 3 funcionários
(D) 40% de 104 seria 41,6
10
1678859 E-book gerado especialmente para DANIEL CRISTIAN
20% dos funcionários seriam 6, alternativa correta, pois5*3+8*2+15*1=46, que já é maior.
(E) 60% dos trabalhadores: 18
30% da renda: 31,20, errada pois detêm mais.
04. Resposta: A.
A menor deve ser a da primeira 30-35
Em seguida, a de 55
Depois de 45-50 na ordem 40-45 e 35-40
05. Resposta: E.
I- 69,8------100%
781,6----x
X=1119,77
II- 781,6-680,7=100,9
10 2
III- 25 = 5
MÉDIA ARITMÉTICA
Considere um conjunto numérico A = {x1; x2; x3; ...; xn} e efetue uma certa operação com todos os
elementos de A.
Se for possível substituir cada um dos elementos do conjunto A por um número x de modo que o
resultado da operação citada seja o mesmo diz – se, por definição, que x será a média dos elementos de
A relativa a essa operação.
A média dos elementos do conjunto numérico A relativa à adição é chamada média aritmética.
3 + 4 + 6 + 9 + 13 35
𝑥= ↔𝑥= ↔𝑥=7
5 5
2
IEZZI, Gelson – Matemática – Volume Único
11
1678859 E-book gerado especialmente para DANIEL CRISTIAN
A média aritmética é 7.
Assim podemos concluir que o gasto médio do grupo de turistas foi de R$ 71,70.
Questões
01. (Câmara Municipal de São José dos Campos/SP – Analista Técnico Legislativo – Designer
Gráfico – VUNESP) Na festa de seu aniversário em 2014, todos os sete filhos de João estavam
presentes. A idade de João nessa ocasião representava 2 vezes a média aritmética da idade de seus
filhos, e a razão entre a soma das idades deles e a idade de João valia
(A) 1,5.
(B) 2,0.
(C) 2,5.
(D) 3,0.
(E) 3,5.
02. (TJ/SC - Técnico Judiciário - Auxiliar TJ-SC) Os censos populacionais produzem informações
que permitem conhecer a distribuição territorial e as principais características das pessoas e dos
domicílios, acompanhar sua evolução ao longo do tempo, e planejar adequadamente o uso sustentável
dos recursos, sendo imprescindíveis para a definição de políticas públicas e a tomada de decisões de
investimento. Constituem a única fonte de referência sobre a situação de vida da população nos
municípios e em seus recortes internos – distritos, bairros e localidades, rurais ou urbanos – cujas
realidades socioeconômicas dependem dos resultados censitários para serem conhecidas.
http://www.ibge.gov.br/home/estatistica/populacao/censo2010/default.shtm
(Acesso dia 29/08/2011)
Um dos resultados possíveis de se conhecer, é a distribuição entre homens e mulheres no território
brasileiro. A seguir parte da pirâmide etária da população brasileira disponibilizada pelo IBGE.
http://www.ibge.gov.br/censo2010/piramide_etaria/index.php
(Acesso dia 29/08/2011)
O quadro abaixo, mostra a distribuição da quantidade de homens e mulheres, por faixa etária de uma
determinada cidade. (Dados aproximados)
Considerando somente a população masculina dos 20 aos 44 anos e com base no quadro abaixo a
frequência relativa, dos homens, da classe [30, 34] é:
(A) 64%.
12
1678859 E-book gerado especialmente para DANIEL CRISTIAN
(B) 35%.
(C) 25%.
(D) 29%.
(E) 30%.
03. (EsSA - Sargento - Conhecimentos Gerais - Todas as Áreas – EB) Em uma turma a média
aritmética das notas é 7,5. Sabe-se que a média aritmética das notas das mulheres é 8 e das notas dos
homens é 6. Se o número de mulheres excede o de homens em 8, pode-se afirmar que o número total
de alunos da turma é
(A) 4.
(B) 8.
(C) 12.
(D) 16.
(E) 20.
04. (SAP/SP - Oficial Administrativo – VUNESP) A altura média, em metros, dos cinco ocupantes de
um carro era y. Quando dois deles, cujas alturas somavam 3,45 m, saíram do carro, a altura média dos
que permaneceram passou a ser 1,8 m que, em relação à média original y, é
(A) 3 cm maior.
(B) 2 cm maior.
(C) igual.
(D) 2 cm menor.
(E) 3 cm menor.
05. (PC/SP – Oficial Administrativo – VUNESP) Em uma empresa com 5 funcionários, a soma dos
dois menores salários é R$ 4.000,00, e a soma dos três maiores salários é R$ 12.000,00. Excluindo-se o
menor e o maior desses cinco salários, a média dos 3 restantes é R$ 3.000,00, podendo-se concluir que
a média aritmética entre o menor e o maior desses salários é igual a
(A) R$ 3.500,00.
(B) R$ 3.400,00.
(C) R$ 3.050,00.
(D) R$ 2.800,00.
(E) R$ 2.500,00.
Comentários
01. Alternativa: E.
Foi dado que: J = 2.M
𝑎+𝑏+⋯+𝑔
𝐽= = 2. 𝑀 (I)
7
𝑎+𝑏+⋯+𝑔
Foi pedido: =?
𝐽
7 𝑎+𝑏+⋯+𝑔
2
= 𝑀
𝑎 + 𝑏 + ⋯+ 𝑔
= 3,5
𝑀
02. Alternativa: E.
[30, 34] = 600, somatória de todos os homens é: 300+400+600+500+200= 2000
600 600
300+400+600+500+200
= 2000 = 0,3 . (100) = 30%
13
1678859 E-book gerado especialmente para DANIEL CRISTIAN
03. Alternativa: D.
Do enunciado temos m = h + 8 (sendo m = mulheres e h = homens).
𝑆
A média da turma é 7,5, sendo S a soma das notas: 𝑚+ℎ = 7,5 → 𝑆 = 7,5(𝑚 + ℎ)
𝑆1
A média das mulheres é 8, sendo S1 a soma das notas: = 8 → 𝑆1 = 8𝑚
𝑚
𝑆2
A média dos homens é 6, sendo S2 a soma das notas: ℎ
= 6 → 𝑆2 = 6ℎ
04. Alternativa: A.
Sendo S a soma das alturas e y a média, temos:
𝑆
= 𝑦 → S = 5y
5
𝑆−3,45
3
= 1,8 → S – 3,45 = 1,8.3
S – 3,45 = 5,4
S = 5,4 + 3,45
S = 8,85, então:
5y = 8,85
y = 8,85 : 5 = 1,77
1,80 – 1,77 = 0,03 m = 3 cm a mais.
05. Alternativa: A.
x1 + x2 + x3 + x4 + x5
x1 + x2 = 4000
x3 + x4 + x5 = 12000
𝑥2 + 𝑥3 + 𝑥4
= 3000
3
x2 + x3 + x4 = 9000
𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 = 4000 + 12000 = 16000
14
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Média Aritmética Ponderada
A média dos elementos do conjunto numérico A relativa à adição e na qual cada elemento tem um
“determinado peso” é chamada média aritmética ponderada3.
P1 . x + P2 . x + P3 . x + ... + Pn . x =
= P1 . x1 + P2 . x2 + P3 . x3 + ... + Pn . xn ↔ (P1 + P2 + P3 + ... + Pn) . x =
= P1 . x1 + P2 . x2 + P3 . x3 + ... + Pn . xn e, portanto,
𝑥1 ; 𝑥2 ; 𝑥3 ; …; 𝑥𝑛
Observe que se P1 = P2 = P3 = ... = Pn = 1, então 𝑥 = 𝑛
: que é a média aritmética simples.
A média aritmética ponderada dos n elementos do conjunto numérico A é a soma dos produtos
de cada elemento multiplicado pelo respectivo peso, dividida pela soma dos pesos.
Exemplos:
1) Calcular a média aritmética ponderada dos números 35, 20 e 10 com pesos 2, 3, e 5,
respectivamente.
2) Em um dia de pesca nos rios do pantanal, uma equipe de pescadores anotou a quantidade de peixes
capturada de cada espécie e o preço pelo qual eram vendidos a um supermercado em Campo Grande.
Vamos determinar o preço médio do quilograma do peixe vendido pelos pescadores ao supermercado.
Considerando que a variável em estudo é o preço do quilo do peixe e fazendo a leitura da tabela,
concluímos que foram pescados 18 kg de peixe ao valor unitário de R$ 3,00, 10 kg de peixe ao valor
unitário de R$ 5,00 e 6 kg de peixe ao valor de R$ 9,00.
Vamos chamar o preço médio de p:
Neste caso o fator de ponderação foi a quantidade de peixes capturadas de cada espécie.
A palavra média, sem especificações (aritmética ou ponderada), deve ser entendida como média
aritmética.
3
IEZZI, Gelson – Matemática – Volume Único
15
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Questões
01. (EPCAR – Cadete – EPCAR) Um líquido L1 de densidade 800 g/l será misturado a um líquido L2
de densidade 900 g/l Tal mistura será homogênea e terá a proporção de 3 partes de L1 para cada 5 partes
de L2 A densidade da mistura final, em g/l, será
(A) 861,5.
(B) 862.
(C) 862,5.
(D) 863.
02. (TJM-SP – Oficial de Justiça – VUNESP) Ao encerrar o movimento diário, um atacadista, que
vende à vista e a prazo, montou uma tabela relacionando a porcentagem do seu faturamento no dia com
o respectivo prazo, em dias, para que o pagamento seja efetuado.
O prazo médio, em dias, para pagamento das vendas efetuadas nesse dia, é igual a
(A) 75.
(B) 67.
(C) 60.
(D) 57.
(E) 55.
03. (SEDUC/RJ - Professor – Matemática – CEPERJ) Uma loja de roupas de malha vende camisetas
com malha de três qualidades. Cada camiseta de malha comum custa R$15,00, de malha superior custa
R$24,00 e de malha especial custa R$30,00. Certo mês, a loja vendeu 180 camisetas de malha comum,
150 de malha superior e 70 de malha especial. O preço médio, em reais, da venda de uma camiseta foi
de:
(A) 20.
(B) 20,5.
(C) 21.
(D) 21,5.
(E) 11.
16
1678859 E-book gerado especialmente para DANIEL CRISTIAN
(A) R$ 248,50
(B) R$ 252,50
(C) R$ 255,50
(D) R$ 205,50
(E) R$ 202,50
Sabendo-se que o salário médio desses funcionários é de R$ 1.490,00, pode-se concluir que o salário
de cada um dos dois gerentes é de
(A) R$ 2.900,00.
(B) R$ 4.200,00.
(C) R$ 2.100,00.
(D) R$ 1.900,00.
(E) R$ 3.400,00.
Disciplina Nota
Português 77
Matemática 62
Informática 72
Se a nota do candidato no concurso foi 80, qual foi a sua nota na prova de Conhecimentos Específicos?
(A) 95
(B) 96
(C) 97
(D) 98
(E) 99
09. (SAAE/SP - Fiscal Leiturista – VUNESP) A tabela mostra os valores de algumas latinhas de
bebidas vendidas em um clube e a quantidade consumida por uma família, em certo dia.
17
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Considerando-se o número total de latinhas consumidas por essa família nesse dia, na média, o preço
de uma latinha saiu por R$ 5,00. Então, o preço de uma latinha de cerveja era
(A) R$ 5,00.
(B) R$ 5,50.
(C) R$ 6,00.
(D) R$ 6,50.
(E) R$ 7,00.
Comentários
01. Alternativa: C.
3.800+5.900 2400+4500 6900
3+5
= 8
= 8 = 862,5
02. Alternativa: D.
Média aritmética ponderada: multiplicamos o porcentual pelo prazo e dividimos pela soma dos
porcentuais.
15.0+20.30+35.60+20.90+10.120
=
15+20+35+20+10
600+2100+1800+1200
= 100
=
5700
= = 57
100
03. Alternativa: C.
Também média aritmética ponderada.
180.15+150.24+70.30
180+150+70
=
2700+3600+2100
= 400
=
8400
= 400
= 21
04. Alternativa: B.
Na média ponderada multiplicamos o peso da prova pela sua nota e dividimos pela soma de todos os
pesos, assim temos:
8.1 + 6,5.2 + 9.3 8 + 13 + 27 48
𝑀𝑃 = = = = 8,0
1+2+3 6 6
05. Alternativa: B.
18
1678859 E-book gerado especialmente para DANIEL CRISTIAN
06. Alternativa: C.
2𝑥 + 8 ∙ 1700 + 10 ∙ 1200
𝑀é𝑑𝑖𝑎 =
20
2𝑥 + 8 ∙ 1700 + 10 ∙ 1200
1490 =
20
07. Alternativa: C.
4x + 412 = 80 . 10
4x = 800 – 412
x = 388 / 4
x = 97
08. Alternativa: A.
2.8 + 3.5 16 + 15 31
𝑀𝑝 = = = = 6,2
2+3 5 5
09. Alternativa: E.
8.4 + 6.5 + 4. 𝑥
=5
8+6+4
62 + 4. 𝑥
=5
18
4.x = 90 – 62
x = 28 / 4
x = R$ 7,00
10. Resposta: C.
𝟏𝟒 . 𝟗𝟑𝟎 + 𝟐𝟖 . 𝒙
= 𝟕𝟓𝟎
𝟏𝟒 + 2𝟖
𝟏𝟑𝟎𝟐𝟎 + 𝟐𝟖 . 𝒙
= 𝟕𝟓𝟎
𝟒𝟐
MÉDIA GEOMÉTRICA
19
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Em uma fórmula: a média geométrica de a1, a2, ..., an é
A média geométrica de um conjunto de números é sempre menor ou igual à média aritmética dos
membros desse conjunto (as duas médias são iguais se e somente se todos os membros do conjunto são
iguais). Isso permite a definição da média aritmética geométrica, uma mistura das duas que sempre tem
um valor intermediário às duas.
A média geométrica é também a média aritmética harmônica no sentido que, se duas sequências (an)
e (hn) são definidas:
Exemplo:
Digamos que tenhamos os números 4, 6 e 9, para obtermos média geométrica deste conjunto,
multiplicamos os elementos e obtemos o produto 216.
Pegamos então este produto e extraímos a sua raiz cúbica, chegando ao valor médio 6.
Extraímos a raiz cúbica, pois o conjunto é composto de 3 elementos. Se fossem n elementos,
extrairíamos a raiz de índice n.
Progressão Geométrica
Uma das utilizações deste tipo de média é na definição de uma progressão geométrica que diz que
em toda PG., qualquer termo é média geométrica entre o seu antecedente e o seu consequente:
Vejamos:
Outra utilização para este tipo de média é quando estamos trabalhando com variações percentuais em
sequência.
Exemplo
20
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Digamos que uma categoria de operários tenha um aumento salarial de 20% após um mês, 12% após
dois meses e 7% após três meses. Qual o percentual médio mensal de aumento desta categoria?
Sabemos que para acumularmos um aumento de 20%, 12% e 7% sobre o valor de um salário,
devemos multiplicá-lo sucessivamente por 1,2, ; 1,12 e 1,07 que são os fatores correspondentes a tais
percentuais.
A partir daí podemos calcular a média geométrica destes fatores:
Observe que o resultado final de R$ 1.438,08 é o mesmo nos dois casos. Se tivéssemos utilizado a
média aritmética no lugar da média geométrica, os valores finais seriam distintos, pois a média aritmética
de 13% resultaria em um salário final de R$ 1.442,90, ligeiramente maior como já era esperado, já que o
percentual de 13% utilizado é ligeiramente maior que os 12, 8417% da média geométrica.
Exemplo:
A média geométrica entre os números 12, 64, 126 e 345, é dada por:
Aplicação Prática:
Dentre todos os retângulos com a área igual a 64 cm², qual é o retângulo cujo perímetro é o menor
possível, isto é, o mais econômico? A resposta a este tipo de questão é dada pela média geométrica entre
as medidas do comprimento a e da largura b, uma vez que a.b = 64.
Resposta:
É o retângulo cujo comprimento mede 8 cm e é lógico que a altura também mede 8 cm, logo só pode
ser um quadrado! O perímetro neste caso é p = 32 cm. Em qualquer outra situação em que as medidas
dos comprimentos forem diferentes das alturas, teremos perímetros maiores do que 32 cm.
Interpretação gráfica
A média geométrica entre dois segmentos de reta pode ser obtida geometricamente de uma forma
bastante simples.
Sejam AB e BC segmentos de reta. Trace um segmento de reta que contenha a junção dos segmentos
AB e BC, de forma que eles formem segmentos consecutivos sobre a mesma reta.
21
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Dessa junção aparecerá um novo segmento AC. Obtenha o ponto médio O deste segmento e com um
compasso centrado em O e raio OA, trace uma semicircunferência começando em A e terminando em C.
O segmento vertical traçado para cima a partir de B encontrará o ponto D na semicircunferência. A medida
do segmento BD corresponde à média geométrica das medidas dos segmentos AB e BC.
MÉDIA HARMÔNICA
Exemplo:
Calcular a média Harmônica entre 3 e 4.
Basta calcular a média entre os inversos dos números 3 e 4 e depois inverte-los, ou seja,
1 1
3+4= 7
2 24
7 −1 24
Logo a Média Harmônica é: 𝐻 = ( ) = ≅ 3,42
24 7
Questões
01. (Pref. de Pinhais/PR – Médico Veterinário – FAFIPA) Qual é a média geométrica dos números
2 e 8?
(A) 2
(B) 4
(C) 6
(D) 8
03. (SEFAZ/RJ – Analista de Controle Interno – FGV) A média geométrica simples entre os valores
{3; 9; 3; 1} é
(A) 2.
(B) 3.
(C) 4.
(D) 3,25.
(E) 3,5.
22
1678859 E-book gerado especialmente para DANIEL CRISTIAN
04. (FUB – Assistente Administrativo – CESPE) Os números x, y e z estão, nessa ordem, em
progressão aritmética de razão 3 e os números x, z e w estão, nessa ordem, em progressão geométrica
de razão 4. Com relação a essa situação,
Julgue os itens que se seguem.
A média geométrica entre os números x, z e w é igual a 9.
( ) Certo ( ) Errado
05. (ANAC – Especialista em Regulação de Aviação Civil – CESPE) Considerando que uma
pesquisa de satisfação referente a um novo terminal de passageiros tenha sido realizada com 50 pessoas
e o resultado em uma amostra de notas conforme apresentado na tabela abaixo, julgue os itens seguintes.
06. (IF/RN – Professor – FUNCERN) Considere que os números a,b e c são reais positivos e que a é
a média geométrica entre x2 e b.
Se, b é a média geométrica entre a/3 e 2x, então, o valor de y para b3=xy é
(A)
(B)
(C)
(D)
07. (TSE – Analista Judiciário – CONSULPLAN) O valor absoluto da diferença entre a média
geométrica e a média aritmética de X = {2, 2, 2, 2, 4, 16, 128, 128} é
(A) 19,5.
(B) 33,5.
(C) 31,5.
(D) 27,5.
Comentários
01. Resposta: B
Para encontrar a média geométrica basta multiplicarmos os termos e extrairmos a raiz cujo índice é
igual a quantidade de termos, então teremos:
2 2
√2.8 = √16 = 4
23
1678859 E-book gerado especialmente para DANIEL CRISTIAN
02. Resposta: C
Para encontrar a média geométrica basta multiplicarmos os termos e extrairmos a raiz cujo índice é
igual a quantidade de termos, então teremos:
3 3 3
√4.8.16 = √512 = √29 = 23 = 8.
03. Resposta: B
Para encontrar a média geométrica basta multiplicarmos os termos e extrairmos a raiz cujo índice é
igual a quantidade de termos, então teremos:
4 4 4
√3.9.3.1 = √81 = √34 = 3.
x + 6 = z = 4x
x + 6 = 4x
6 = 4x – x
6 = 3x
6/3 = x
x=2
06. Resposta: A
Para resolver este problema, devemos expressar os valores de forma a gerar uma equação.
Temos o seguinte:
2
√𝑥 2 . 𝑏 = 𝑎 (*)
e também,
2 𝑎
√ 3 . 2𝑥 = 𝑏 (**)
Vamos isolar o “a” em (**) e substituir em (*).
𝑎
3
. 2𝑥 = 𝑏 2
𝑏2 .3 3𝑏²
𝑎= 2𝑥
= 2𝑥
24
1678859 E-book gerado especialmente para DANIEL CRISTIAN
2
3𝑏2
𝑥 2 . 𝑏 = ( 2𝑥 )
9.𝑏4
𝑥2. 𝑏 = 4𝑥 2
𝑏4
𝑥 2 . 4𝑥 2 = 9. 𝑏
4𝑥 4
9
= 𝑏³
Agora foi pedido para calcular o valor de y para b3=xy, vamos arrumar essa equação, ou seja, isolando
o y.
𝑏³ 4𝑥 4
𝑥
= 𝑦, mas sabemos que b³ = 9
, substituindo então:
4𝑥4
9
𝑥 = 𝑦
1
4𝑥 4
9𝑥
= 𝑦
4𝑥 3
9
= 𝑦
Portanto alternativa A.
07. Resposta: D
Para resolver este problema precisamos calcular a média aritmética e a média geométrica dos termos.
Média aritmética:
2+2+2+2+4+16+128+128 284
8
= 8
= 35,5
Média geométrica:
8 8 8
√2.2.2.2.4.16.128.128 = √2¹. 2¹. 2¹. 2¹. 2². 24 . 27 . 27 = √224 = 23 = 8
08. Resposta: B
Para resolver este problemas devemos encontrar a média harmônica de I e a média geométrica de II,
a seguir basta calcular a média aritmética simples dos dois resultados obtidos, portanto vamos lá!
Média harmônica de I.
Para o cálculo da média harmônica, basta calcularmos o inverso da média dos inversos, ou seja,
𝑛
Média harmônica = 1 1 1 1
+ + +⋯+
𝑥1 𝑥2 𝑥3 𝑥𝑛
3
H=1 1 1 =
+ +
4 6 12
1 1 1
Primeiramente vamos calcular a soma + + através do MMC.
4 6 12
1 1 1
4
+ 6 + 12 =
3 2 1 6 1
12
+ 12 + 12 = 12 = 2
3 2
H = 1 = 3. = 6
1
2
3 3 3
√6.12.24 = √21 . 31 . 22 . 31 . 23 . 3¹ = √26 . 3³ = 22 . 31 = 12
25
1678859 E-book gerado especialmente para DANIEL CRISTIAN
MEDIANA E MODA
A moda e a mediana são utilizados para resumirem um conjunto de valores dado uma série estatística.
Vamos ver os conceitos de cada uma delas:
A mediana, é uma medida de localização do centro da distribuição dos dados.
A moda, é o valor que aparece com maior frequência, ou seja, podemos dizer que é o termo que está
na “moda”.
Exemplo:
Em um time de futebol temos as seguintes altura dos atletas:
(Fonte: http://geniodamatematica.com.br)
Resolução:
Primeiramente precisamos colocar os dados de forma ordenada, ou seja, montar o rol:
Altura Frequência
1,48 1
1,52 1
1,60 1
1,61 1
1,62 1
1,64 1
1,66 3
1,68 1
1,69 1
Para acharmos a mediana precisamos ver se a quantidade de valores, se for ímpar a mediana é o
valor que ocupa a posição central, se for par a mediana corresponde à média aritmética dos dois
valores centrais.
No nosso caso temos que é ímpar:
Altura Frequência
1º 1,48 1
2º 1,52 1
3º 1,60 1
4º 1,61 1
5º 1,62 1
6º 1,64 1
7º 1,66 3
8º 1,68 1
9º 1,69 1
26
1678859 E-book gerado especialmente para DANIEL CRISTIAN
E a moda é 1,66, que é o valor que aparece com maior frequência.
Questões
02. (IF/GO – Assistente de Alunos – UFG) A tabela a seguir apresenta o índice de desenvolvimento
humano (IDH) de alguns países da América Latina referente ao ano 2012.
Países IDH
Argentina 0,811
Bolívia 0,645
Brasil 0,730
Chile 0,819
Colômbia 0,719
Cuba 0,780
México 0,775
Uruguai 0,792
Venezuela 0,758
Disponível em: <http://www.abinee.org.br/abinee/decon/decon55a.htm>. Acesso em: 24 fev. 2014. (Adaptado).
Dentre os países listados, aquele cujo IDH representa a mediana dos dados apresentados é:
(A) Brasil
(B) Colômbia
(C) México
(D) Venezuela
Sabendo-se que a moda, a mediana e a média aritmética das alturas desses alunos são,
respectivamente, 173 cm, 174,5 cm e 175,5 cm, pode-se concluir que a altura do aluno Ferreira é igual,
em centímetros, a
(A) 177.
(B) 178.
(C) 179.
(D) 180.
(E) 182.
27
1678859 E-book gerado especialmente para DANIEL CRISTIAN
(SEFAZ/RJ – ANALISTA DE CONTROLE INTERNO – CEPERJ) Observe os números relacionados
a seguir, e responda às questões de números 04 e 05.
4 7 3
9 6 8
8 7 8
Comentários
01. Resposta: C.
Coloquemos os valores em ordem crescente:
8, 9, 10, 10, 10, 11, 11, 11, 12, 12
Como a Mediana é o elemento que se encontra no meio dos valores colocados em ordem crescente,
temos que:
10 + 11 21
𝑀= = = 10,5
2 2
02. Resposta: C.
Vamos colocar os números em ordem crescente:
0,645 0,719 0,730 0,758 0,775 0,780 0,792 0,811 0,819
O número que se encontra no meio é 0,775 (México).
03. Resposta: C.
* Se a moda é 173 cm, então q = 173 cm (Gonçalves, Camargo e Pacheco).
* Se a mediana é 174,5 cm, então (q + p) / 2 = 174,5.
q + p = 174,5 . 2
q + p = 349 cm
* Se a média aritmética é 175,5 cm, então:
3. 𝑞 + 𝑝 + 2. 𝑚
𝑀= = 17
6
2. 𝑞 + 𝑞 + 𝑝 + 2. 𝑚
= 175,5
6
04. Resposta: C.
Colocando em ordem crescente:
3; 4; 6; 7; 7; 8; 8; 8; 9
São 9 elementos, então a mediana é o quinto elemento(9+1/2)
Mediana 7
28
1678859 E-book gerado especialmente para DANIEL CRISTIAN
05. Resposta: A.
Moda é o elemento que aparece com mais frequência: 8
As medidas de posição visam localizar com maior facilidade onde está a maior concentração de valores
de uma dada distribuição, podendo estar ela no início, meio ou fim; e também se esta distribuição está
sendo feita de forma igual.
As medidas de posição mais importantes são as de tendência central (veremos aqui para dados
agrupados):
- Média;
- Moda;
- Mediana.
MÉDIA ARITMÉTICA (𝒙 ̅)
A média aritmética é o quociente da divisão da soma dos valores da variável pelo número deles.
Anteriormente tratamos a média para dados não agrupados, agora veremos para dados agrupados.
Nº de meninos fi
0 2
1 6
2 10
3 12
4 4
∑ = 34
As frequências são números indicadores da intensidade de cada valor da variável, elas funcionam
como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada por:
𝚺𝒙𝒊 𝒇𝒊
̅=
𝒙
𝚺𝒇𝒊
O método mais prático de resolvermos é adicionarmos mais uma coluna para obtenção da média
ponderada:
Nº de meninos fi xi.fi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
∑ = 34 ∑ = 78
Aplicando a fórmula temos:
Σ𝑥𝑖 𝑓𝑖 78
𝑥̅ = = = 2,29 → 𝑥̅ = 2,3 𝑚𝑒𝑛𝑖𝑛𝑜𝑠
Σ𝑓𝑖 34
Nota: quando a variável apresenta um valor 2 meninos, 3 décimos de meninos, como devemos
interpretar o resultado? Como o valor médio 2,3 meninos sugere (para este caso) que o maior número de
famílias tem 2 meninos e 2 meninas, sendo uma tendência geral, certa superioridade numérica em relação
ao número de meninos.
29
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Σ𝑥𝑖 𝑓𝑖
𝑥̅ = , 𝑜𝑛𝑑𝑒 𝑥𝑖 é 𝑜 𝑝𝑜𝑛𝑡𝑜 𝑚é𝑑𝑖𝑜 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒.
Σ𝑓𝑖
Exemplo:
i Estaturas (cm) fi
1 150 ├ 154 4
2 154 ├ 158 9
3 158 ├ 162 11
4 162 ├ 166 8
5 166 ├ 170 5
6 170 ├ 174 3
∑ = 40
Vamos abrir uma coluna para os pontos médios e outra para os produtos:
Σ𝑥𝑖 𝑓𝑖
∑xifi = 6440, ∑fi = 40 e 𝑥̅ =
Σ𝑓𝑖
Aplicando:
6440
𝑥̅ = = 161 → 𝑥̅ = 161 𝑐𝑚
40
MODA (Mo)
A moda é o valor que aparece com maior frequência em uma série de valores. Podemos dizer é o
valor que “está na moda”.
- Para dados não agrupados: ela é facilmente reconhecida, pois observamos o valor que mais se
repete, como dito na definição.
Exemplo:
A série: 7,8,9,10,11, 11, 12, 13, 14 tem moda igual a 10.
Observações:
- Quando uma série não apresenta valor modal, ou seja, quando nenhum valor aparece com
frequência, dizemos que ela é AMODAL.
- Quando uma série tiver mais de um valor modal, dizemos que é BIMODAL (dois valores modas),
TRIMODAL, etc.
30
1678859 E-book gerado especialmente para DANIEL CRISTIAN
- Para dados agrupados
1) Sem intervalo de classe: para determinarmos a moda basta observamos a variável com maior
frequência. Vejamos o exemplo:
Nº de meninos fi
0 2
1 6
2 10
3 12
4 4
∑ = 34
Observamos que a maior frequência(fi) é 12, que corresponde ao valor de variável 3, logo: Mo = 3
2) Com intervalo de classe: a classe que apresenta maior frequência é denominada classe modal. A
moda é o valor dominante que está compreendido entre os limites da classe modal. O método mais
simples para o cálculo é tomar o ponto médio da classe modal. A este valor damos o nome de moda
bruta.
𝒍 ∗ +𝑳 ∗
𝑴𝒐 =
𝟐
Onde:
l* → limite inferior da classe modal
L* → limite superior da classe modal
Exemplo:
i Estaturas (cm) fi
1 150 ├ 154 4
2 154 ├ 158 9
3 158 ├ 162 11
4 162 ├ 166 8
5 166 ├ 170 5
6 170 ├ 174 3
∑ = 40
Observe que a classe com maior frequência é a de i = 3, nela temos que l* = 158 e o L* = 162, aplicando
na fórmula:
Existem ainda outros métodos mais elaborados para encontramos a moda, um deles seria a fórmula
de Czuber, onde:
𝑫𝟏
𝑴𝒐 = 𝒍 ∗ + .𝒉 ∗
𝑫𝟏 + 𝑫𝟐
Onde temos:
l*→ limite inferior da classe modal
h* → amplitude da classe modal
D1 → f* - f(ant)
D2 → f* - f(post)
f*→ frequência simples da classe modal
f(ant)→ frequência simples da classe anterior à classe modal
f(post) → frequência simples da classe posterior à classe modal.
31
1678859 E-book gerado especialmente para DANIEL CRISTIAN
𝐷1 11 − 9 2
𝑀𝑜 = 𝑙 ∗ + . ℎ ∗= 158 + . (162 − 158) = 158 + .4
𝐷1 + 𝐷2 (11 − 9) + (11 − 8) 2+3
8
𝑀𝑜 = 158 + = 158 + 1,6 = 159,6 ≅ 160 𝑐𝑚
5
Gráficos da moda
Observe que a moda é o valor correspondente, no eixo das abcissas, ao ponto de ordenada máxima.
Assim temos:
A moda é utilizada:
- Quando desejamos obter uma medida rápida e aproximada de posição;
- Quando a medida de posição deve ser o valor mais típico da distribuição.
1) Não depende de todos os valores da série, nem de sua ordenação, podendo mesmo não se alterar
com a modificação de alguns deles.
2) Não é influenciada por valores extremos (grandes) da série.
3) Sempre tem existência real, ou seja, sempre é representada por um elemento do conjunto de
dados, excetuando o caso de classes de frequências, quando trabalhamos com subconjuntos (dados
agrupados) e não com cada elemento isoladamente.
MEDIANA (Md)
Como o próprio nome sugere, a mediana é o valor que se encontra no centro de uma série de
números, estando estes dispostos segundo uma ordem. É o valor situado de tal forma no conjunto
que o separa em dois subconjuntos de mesmo número de elementos.
32
1678859 E-book gerado especialmente para DANIEL CRISTIAN
- Para dados não agrupados: para identificarmos a mediana, precisamos ordenar os dados
(crescente ou decrescente) dos valores, para depois identificarmos o valor central. Exemplo:
Dada a série de valores:
5, 13, 10, 2, 18, 15, 6, 16, 9, vamos ordenar os valores em ordem crescente:
2, 5, 6, 9, 10, 13, 15, 16,18; como temos uma sequência de 9 números precisamos identificar aquele
que divide o conjunto em 2 subconjuntos com a mesma quantidade de elementos. Neste caso o valor é
10, pois temos a mesma quantidade de elementos tanto a esquerda quanto a direita:
Md = 10
Neste caso como a série tem número ímpar de termos, ficou fácil identificarmos a mediana. Porém se
a série tiver número par, a mediana será, por definição, qualquer dos números compreendidos entre dois
valores centrais desta série, ao qual utilizaremos o ponto médio entre as duas. Exemplo:
2, 6, 7, 10, 12, 13, 18, 21 (8 termos), vamos utilizar os valores mais centrais que neste caso são o 4º
e o 5º termo. Então a mediana será:
10 + 12 22
𝑀𝑑 = = = 11
2 2
Observações: estando ordenado os valores de uma série e sendo n o número de elementos desta
série, o valor mediano será:
𝑛+1
- o termo de ordem 2 , se n for ímpar;
𝑛 𝑛
- a média aritmética dos termos de ordem 2 𝑒 2 + 1, se n for par.
Observando os exemplos dados:
𝑛+1 9+1 10
- Para n = 9, temos 2 = 2 = 2 = 5, a mediana é o 5º temo, que é Md = 10.
- Para n = 8, temos 8/2 = 4 e 8/2 + 1 = 4 + 1 = 5. Logo a mediana é a média aritmética do 4º e 5º termo:
10 + 12 / 2 = 22 / 2 = 11 → Md = 11
Notas:
- O valor da mediana pode coincidir ou não com um elemento da série. Se for ímpar há
coincidência, se for par já não há;
- A mediana e a média aritmética não têm necessariamente, o mesmo valor;
- A mediana depende da posição dos elementos e não dos valores dos elementos na
série ordenada. Essa é uma diferença marcante entre mediana e a média;
- A mediana também pode ser chamada de valor mediano.
- Para dados agrupados: o cálculo da mediana se processa de modo semelhante ao dos dados não
agrupados, implicando na determinação prévia das frequências acumuladas.
1) Sem intervalo de classe: neste caso basta identificarmos a frequência acumulada imediatamente
superior à metade da soma da frequências. A mediana será o valor da variável que corresponde a tal
frequência acumulada. Exemplo:
Nº de meninos fi Fa
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
∑ = 34
Logo teremos:
Σfi 34
2
= 2 = 17, a menor frequência acumulada que supera este valor é 18, que corresponder ao valor 2
da variável, sendo esta a mediana ou valor mediano. Md = 2 meninos.
33
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Nota:
Σfi
- Caso exista uma frequência acumulada (Fa ou Fi), tal que: 𝐹𝑖 = 2 , a mediana será dada por:
𝑥𝑖 + 𝑥𝑖+1
𝑀𝑑 =
2
Ou seja, a mediana será a média aritmética entre o valor da variável correspondente a essa frequência
acumulada e a seguinte. Exemplo:
xi fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
∑=8
Temos: 8/2 = 4 = F3
Então:
15 + 16 31
𝑀𝑑 = = = 15,5
2 2
1) Com intervalo de classe: precisamos, neste caso, determinar o ponto do intervalo em que está
compreendido a mediana. Para tal, precisamos determinar a classe mediana, que será aquela
Σfi
correspondente à frequência acumulada imediatamente superior a . Fazendo isso podemos interpolar
2
os dados (inserção de uma quantidade de valores entre dois números), admitindo-se que os valores se
distribuam uniformemente em todo o intervalo de classe. Exemplo:
i Estaturas (cm) fi Fi
1 150 ├ 154 4 4
2 154 ├ 158 9 13
3 158 ├ 162 11 24
4 162 ├ 166 8 32
5 166 ├ 170 5 37
6 170 ├ 174 3 40
∑ = 40
34
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Baseado no exemplo anterior temos:
l* = 158 ; F(ant) = 13 ; f* = 11 e h* = 4
Empregamos a mediana quando:
- Desejamos obter o ponto que divide a distribuição em partes iguais;
- Há valores extremos que afetam de uma maneira acentuada a média;
- A variável em estudo é salário.
Referência
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002
OUTLIERS
Os outliers são dados que se diferenciam drasticamente de todos os outros, são pontos fora da curva.
Em outras palavras, um outlier é um valor que foge da normalidade e que pode (e provavelmente irá)
causar anomalias nos resultados obtidos por meio de algoritmos e sistemas de análise.
Entender os outliers é fundamental em uma análise de dados por pelo menos dois aspectos:
1. os outliers podem visar negativamente todo o resultado de uma análise;
2. o comportamento dos outliers pode ser justamente o que está sendo procurado.
35
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Os outliers possuem diversos outros nomes, como: dados discrepantes, pontos fora da curva,
observações fora do comum, anomalias, valores atípicos, entre outros.
A seguir elencamos algumas situações comuns em que os outliers surgem na análise de dados e
apontamos sugestões de como lidar com eles em cada caso.
Em uma pequena amostra a tarefa de encontrar outliers com o uso de tabelas pode ser fácil. Porém,
quando a quantidade de observações passa para a casa dos milhares ou milhões fica impossível de
encontrar quais são os dados que destoam do geral. Essa tarefa fica ainda mais difícil quando muitas
variáveis (as colunas da planilha) são envolvidas.
Questões
01. (TRT-8ª – Analista Judiciário – CESPE) Com relação à definição das medidas de tendência
central e de variabilidade dos dados em uma estatística, assinale a opção correta.
(A) A moda representa o centro da distribuição, é o valor que divide a amostra ao meio.
(B) A amplitude total, ou range, é uma medida de tendência central pouco afetada pelos valores
extremos.
(C) A mediana é o valor que ocorre mais vezes, frequentemente em grandes amostras.
(D) A variância da amostra representa uma medida de dispersão obtida pelo cálculo da raiz quadrada
positiva do valor do desvio padrão dessa amostra.
(E) A média aritmética representa o somatório de todas as observações dividido pelo número de
observações.
02. (Pref. Fortaleza/CE – Matemática – Pref. Fortaleza/CE) A medida estatística que separa as
metades superior e inferior dos dados amostrados de uma população é chamada de:
(A) mediana.
(B) média.
(C) bissetriz.
(D) moda.
03. (SSP/AM – Técnico de Nível Superior – FGV) A sequência a seguir mostra o número de gols
marcados pelo funcionário Ronaldão nos nove últimos jogos disputados pelo time da empresa onde ele
trabalha:
2, 3, 1, 3, 0, 2, 0, 3, 1.
Sobre a média, a mediana e a moda desses valores é verdade que:
(A) média < mediana < moda;
36
1678859 E-book gerado especialmente para DANIEL CRISTIAN
(B) média < moda < mediana;
(C) moda < média < mediana;
(D) mediana < moda < média;
(E) mediana < média < moda.
07. (FUNDUNESP – Auxiliar Administrativo – VUNESP) Um concurso é composto por três fases,
com pesos 1, 2 e 3, respectivamente. Pedro ficou sabendo que na 1.ª fase desse concurso sua nota foi
7,0 e que na 2.ª fase sua nota foi 4,0.
Sabendo-se que para ser aprovado a média aritmética ponderada final tem que ser, no mínimo, 5, que
as notas apresentadas ainda não estão multiplicadas pelos respectivos fatores, e que em cada fase as
notas variam de zero a dez, pode-se afirmar corretamente que
(A) não há como Pedro ser aprovado no concurso.
(B) Pedro já está aprovado no concurso, independentemente da nota que tirar na 3.ª fase.
(C) se Pedro tirar 5,0 ou mais na 3.ª fase, então ele estará aprovado no concurso.
(D) Pedro precisa tirar, no mínimo, 7,0 na 3.ª fase, para ser aprovado no concurso.
(E) tirando 4,0, Pedro estará aprovado no concurso.
37
1678859 E-book gerado especialmente para DANIEL CRISTIAN
08. (IF/GO – Assistente de Alunos – UFG) A tabela a seguir apresenta o índice de desenvolvimento
humano (IDH) de alguns países da América Latina referente ao ano 2012.
Países IDH
Argentina 0,811
Bolívia 0,645
Brasil 0,730
Chile 0,819
Colômbia 0,719
Cuba 0,780
México 0,775
Uruguai 0,792
Venezuela 0,758
Disponível em: <http://www.abinee.org.br/abinee/decon/decon55a.htm>. Acesso em: 24 fev. 2014. (Adaptado).
Dentre os países listados, aquele cujo IDH representa a mediana dos dados apresentados é:
(A) Brasil
(B) Colômbia
(C) México
(D) Venezuela
09. (QC – Segundo Tenente – Ciências Contábeis – MB) Analise a tabela a seguir.
Classe Velocidade (em nós) Tempo(h)
1 0 |------- 5 1
2 5 |------ 10 7
3 10 |------ 15 15
4 15 |------ 20 9
5 20 |------ 25 3
6 25 |------ 30 2
10. (Pref. Paulistana/PI – Professor de Matemática – IMA) Considere o conjunto de dados abaixo,
referente ao salário médio dos funcionários de uma empresa.
O valor da Mediana é:
(A) 1240
(B) 1500
(C) 1360
(D) 1600
(E) 1420
38
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Respostas
01.Resposta: E.
Pela definições apresentadas a única que responde de forma correta a questão é sobre a média.
02. Resposta: A.
Pela definição temos que esta medida é a Mediana.
03.Resposta: A.
Reordenando temos:
0,0,1,1,2,2,3,3,3
Fica evidente o valor da moda, Mo = 3
A mediana é o meio, como é uma sequência com 9 números temos: n+1/2 → 9 +1 / 2 → 10/2 → 5,
logo a mediana será o 5º termo, então Md = 2
A média é a somatória de todos os valores, dividido pela quantidade 1+1+2+2+3+3+3 = 15, 15/9 = 1,66
Logo: média < mediana < moda
04. Resposta: C.
Coloquemos os valores em ordem crescente:
8, 9, 10, 10, 10, 11, 11, 11, 12, 12
Como a Mediana é o elemento que se encontra no meio dos valores colocados em ordem crescente,
temos que:
10 + 11 21
𝑀= = = 10,5
2 2
05. Resposta: A.
63,5+70,3+82,2 + 59+71,5 346,5
A média é: 𝑀 = 5
= 5 = 69,3
Para verificar a mediana, basta colocar os valores em ordem crescente e verificar o elemento que se
encontra no meio deles:
59 63,5 70,3 71,5 82,2
06. Resposta: E.
7,3+7,5 14,8
Média das mulheres: = = 7,4 anos = 7,4 . 12 = 88,8 meses
2 2
7+7,1 14,1
Média dos homens: 2 = 2 = 7,05 anos = 7,05 . 12 = 84,6 meses
Assim, 88,8 – 84,6 = 4,2 meses
07. Resposta: C.
Pesos 1, 2 e 3, respectivamente. Pedro ficou sabendo que na 1.ª fase desse concurso sua nota foi 7,0
e que na 2.ª fase sua nota foi 4,0.
Sabendo-se que para ser aprovado a média aritmética ponderada final tem que ser, no mínimo, 5
1.7 + 2.4 + 3. 𝑥
𝑀= =5
1+2+3
15 + 3. 𝑥
=5
6
15 + 3𝑥 = 6 . 5
3𝑥 = 30 − 15
15
𝑥= =5
3
39
1678859 E-book gerado especialmente para DANIEL CRISTIAN
08. Resposta: C.
Vamos colocar os números em ordem crescente:
0,645 0,719 0,730 0,758 0,775 0,780 0,792 0,811 0,819
O número que se encontra no meio é 0,775 (México).
09. Resposta: C.
Vamos calcular a média de cada classe:
* Classe 1: (0 + 5) / 2 = 5 / 2 = 2,5
2,5 . 1 = 2,5
* Classe 2: (5 + 10) / 2 = 15 / 2 = 7,5
7,5 . 7 = 52,5
* Classe 3: (10 + 15) / 2 = 25 / 2 = 12,5
12,5 . 15 = 187,5
* Classe 4: (15 + 20) / 2 = 35 / 2 = 17,5
17,5 . 9 = 157,5
* Classe 5: (20 + 25) / 2 = 45 / 2 = 22,5
22,5 . 3 = 67,5
* Classe 6: (25 + 30) / 2 = 55 / 2 = 27,5
27,5 . 2 = 55
* Soma das médias = 522,5
* Total de horas = 37h
Por final: 522,5 / 37 = 14,12
10. Resposta: C.
Colocando na ordem crescente:
1100;1200;1210;1250;1300;1420;1450;1500;1600;1980
A mediana é o número que se encontra no meio. Nesse caso que tem 10 números(par) é a média do
5º e 6º números:
São números que dividem a sequência ordenada de dados em partes que contêm a mesma quantidade
de elementos da série.
Desta forma, a mediana que divide a sequência ordenada em dois grupos, cada um deles contendo
50% dos valores da sequência, é também uma medida separatriz.
Além da mediana, as outras medidas separatrizes são: quartis, quintis, decis e percentis.
Quartis
Nos quartis, a série é dividida em quatro partes iguais. Os elementos separatrizes da serie são Q1, Q2,
e Q3.
Q1: é o primeiro quartil, corresponde à separação dos primeiros 25% de elementos da serie.
Q2: é o segundo quartil, coincide com a mediana (Q2 = Md).
Q3: é o terceiro quartil, corresponde à separação dos últimos 25% de elementos da série, ou seja, os
75% dos elementos da série.
Para o cálculo dos quartis utilizam-se técnicas semelhantes àquelas do cálculo da mediana.
Consequentemente, podem-se utilizar as mesmas fórmulas do calculo da mediana, levando em conta
40
1678859 E-book gerado especialmente para DANIEL CRISTIAN
que onde houver a expressão f será substituída por K f , sendo K o número da ordem do quartil,
i i
2 4
em que K =1 corresponde ao primeiro quartil; K = 2 corresponde ao segundo quartil e K = 3 ao terceiro
quartil.
Quintis
Ao dividir a série ordenada em cinco partes, cada uma ficará com seus 20% de seus elementos.
Os elementos que separam estes grupos são chamados de quintis.
Assim, o primeiro quintil, indicado por K1, separa a sequência ordenada deixando 20% de seus valores
à esquerda e 80% de seus valores à direita.
41
1678859 E-book gerado especialmente para DANIEL CRISTIAN
De modo análogo são definidos os outros quintis.
Decis
Ao dividir a série ordenada em dez partes, cada uma ficará com seus 10% de seus elementos.
Os elementos que separam estes grupos são chamados de decis.
Assim, o primeiro decil, indicado por D1, separa a sequência ordenada deixando 10% de seus valores
à esquerda e 90% de seus valores à direita.
De modo análogo são definidos os outros decis.
Os decis dividem a distribuição em dez partes iguais. A fórmula é semelhante à que vimos
anteriormente:
i.n
a) Calcula-se onde i 1,2,3,4,5,6,7,8,9
10
b) Identifica-se a classe do decil (Di) pela freqüência acumulada.
i.n
f .h
Di l Di
10
c) Aplica-se a fórmula
FDi
onde,
Exemplo:
Estaturas(cm) fi Fi
150 ├ 154 4 4
154 ├ 158 9 13
158 ├ 162 11 24
162 ├ 166 8 32
166 ├ 170 5 37
170 ├ 174 3 40
40
4.40
13.4
D4 158 159,09
i.n 4.40 10
Para o 4º Decil: 16
10 10 11
8.40
24 .4
D8 162 166
i.n 8.40 10
Para o 8º Decil 32
10 10 8
Percentis
Ao dividir a série ordenada em cem partes, cada uma ficará com 1% de seus elementos.
Os elementos que separam estes grupos são chamados de centis ou percentis.
Assim, o primeiro percentil, indicado por P1, separa a sequência ordenada deixando 1% de seus
valores à esquerda e 99% de seus valores à direita.
De modo análogo são definidos os outros percentis.
São as medidas que dividem a amostra em 100 partes iguais. O cálculo é semelhante aos anteriores:
42
1678859 E-book gerado especialmente para DANIEL CRISTIAN
i.n
a) Calcula-se , onde i 1,2,3,...,99
100
b) Identifica-se a classe do percentil (Pi) pela freqüência acumulada.
i.n
f .h
Pi l Pi
100
c) Aplica-se a fórmula
FPi
Exemplo:
Seja a tabela abaixo, obtida da amostra sobre salários em um determinado bairro de uma cidade.
fi Fi
Sal.Mínimo(SM)
4 ├ 9 8 8
9 ├ 14 12 20
14 ├ 19 17 37
19 ├ 24 3 40
40
i.n 4.40
4º Decil. : 16 A classe do 4º Decil é a de freqüência igual a 12
10 10
4.40
8 .5
D4 9 12,33
10
12
72º Percentil : .
i.n 72 .40
28,8 P72 14
28,8 20 .5 16,59
100 100 17
Conclusão: Nessa distribuição temos que o valor de 12,33 SM divide a amostra em duas partes: 40%
(4º decil) estão abaixo dele e 60% estão acima. Temos também que 16,59 SM divide a amostra em duas
partes: 72% (P72) estão abaixo dele e 28% estão acima.
Cálculo da separatriz:
Identifica-se a medida que se pretende obter com o percentil correspondente, Pi.
Calcula-se i% de n para localizar a posição do percentil i no Rol, ou seja:
Questões
01. A tabela apresenta uma distribuição hipotética. Não há observações coincidentes com os limites
das classes.
43
1678859 E-book gerado especialmente para DANIEL CRISTIAN
A melhor estimativa para o terceiro quartil da distribuição é, aproximadamente, de
(A)34,75
(B)34,9
(C)35
(D)35,75
(E)35,9
02. Um teste de raciocínio abstrato foi aplicado a 816 alunos de uma escola de 1° grau, dando
os seguintes resultados:
a) Qual é o máximo de pontos que classifica um aluno entre os 25% mais fracos?
b) Qual é o mínimo de pontos necessários para um aluno se classificar entre os 25% mais fortes?
c) Qual é o máximo de pontos que ainda classifica um aluno entre os 10% mais fracos?
d) Qual é o mínimo de pontos para que um aluno esteja entre os 10% mais fortes?
e) Qual é o máximo de pontos que ainda classifica o aluno entre os 1% mais fracos?
f) Qual é o mínimo de pontos para que um aluno esteja entre os 5% mais fortes?
Respostas.
01. Resposta: E.
3 Quartil = L1 + ((3*N/4 - Som. freq. anteriores)/Frequência quartil) * amplitude do intervalo
3 quartil = 30 + ((3*164/4 - 64)/100) * 10
3 Quartil = 35,90
02. Resposta:
a)
44
1678859 E-book gerado especialmente para DANIEL CRISTIAN
b)
c)
d)
e)
f)
MEDIDAS DE DISPERSÃO
As medidas de tendência central fornecem informações valiosas mas, em geral, não são suficientes
para descrever e discriminar diferentes conjuntos de dados. As medidas de Dispersão ou variabilidade
permitem visualizar a maneira como os dados espalham-se (ou concentram-se) em torno do valor central.
Para mensurarmos está variabilidade podemos utilizar as seguintes estatísticas: amplitude total; distância
interquartílica; desvio médio; variância; desvio padrão e coeficiente de variação.
45
1678859 E-book gerado especialmente para DANIEL CRISTIAN
quartil é o valor que deixa três quartos dos dados abaixo e um quarto acima dele. O segundo quartil é a
mediana. (O primeiro e o terceiro quartis fazem o mesmo que a mediana para as duas metades
demarcadas pela mediana.) Ex.: quando se discutir o boxplot.
- Desvio Médio: é a diferença entre o valor observado e a medida de tendência central do conjunto
de dados.
- Variância: é uma medida que expressa um desvio quadrático médio do conjunto de dados, e sua
unidade é o quadrado da unidade dos dados.
- Desvio Padrão: é raiz quadrada da variância e sua unidade de medida é a mesma que a do conjunto
de dados.
- Coeficiente de variação: é uma medida de variabilidade relativa, definida como a razão percentual
entre o desvio padrão e a média, e assim sendo uma medida adimensional expressa em percentual.
Boxplot: Tanto a média como o desvio padrão podem não ser medidas adequadas para representar
um conjunto de valores, uma vez que são afetados, de forma exagerada, por valores extremos. Além
disso, apenas com estas duas medidas não temos ideia da assimetria da distribuição dos valores. Para
solucionar esses problemas, podemos utilizar o Boxplot. Para construí-lo, desenhamos uma "caixa" com
o nível superior dado pelo terceiro quartil (Q3) e o nível inferior pelo primeiro quartil (Q1). A mediana (Q2)
é representada por um traço no interior da caixa e segmentos de reta são colocados da caixa até os
valores máximo e mínimo, que não sejam observações discrepantes. O critério para decidir se uma
observação é discrepante pode variar; por ora, chamaremos de discrepante os valores maiores do que
Q3+1.5*(Q3-Q1) ou menores do que Q1-1.5*(Q3-Q1).
O Boxplot fornece informações sobre posição, dispersão, assimetria, caudas e valores discrepantes.
Variância: Define-se a variância, como sendo a medida que se obtém somando os quadrados dos
desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações
da amostra menos um.
Desvio-Padrão: Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime
não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as
mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão: O
46
1678859 E-book gerado especialmente para DANIEL CRISTIAN
desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será
a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da
definição, são: o desvio padrão será maior, quanta mais variabilidade houver entre os dados.
Exemplo: Em uma turma de aluno, verificou-se através da análise das notas de 15 alunos, os seguintes
desempenhos:
Conceito
Alunos
na Prova
1 4,3
2 4,5
3 9
4 6
5 8
6 6,7
7 7,5
8 10
9 7,5
10 6,3
11 8
12 5,5
13 9,7
14 9,3
15 7,5
Total 109,8
Média 7,32
Desvio
1,77
Padrão
Observamos no exemplo, que a média das provas, foi estimada em 7,32 com desvio padrão em 1,77.
Concluímos que a maioria das notas concentrou-se em 9,09 e 5,55.
Como a medida de localização mais utilizada é a média, será relativamente a ela que se define a
principal medida de dispersão - a variância, apresentada a seguir.
Define-se a variância, e representa-se por s2, como sendo a medida que se obtém somando os
quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número
de observações da amostra menos um:
47
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Se afinal pretendemos medir a dispersão relativamente à média. Por que é que não somamos
simplesmente os desvios em vez de somarmos os seus quadrados?
Experimenta calcular essa soma e verás que (x1-x) + (x2-x) + (x1-x) + ... + (xn – x) ≠ 0. Poderíamos ter
utilizado módulos, para evitar que os desvios negativos, mas é mais fácil trabalhar com quadrados, não
concorda?! E por que é que em vez de dividirmos pó “n”, que é o número de desvios, dividimos por (n-
1)? Na realidade, só aparentemente é que temos “n” desvios independentes, isto é, se calcularmos (n-1)
desvios, o restante fica automaticamente calculado, uma vez que a sua soma é igual a zero. Costuma-se
referir este fato dizendo que se perdeu um grau de liberdade.
Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma
que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades
que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão:
O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior
será a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da
definição, são:
- o desvio padrão é sempre não negativo e será tanto maior, quanta mais variabilidade houver entre
os dados.
- se s = 0, então não existe variabilidade, isto é, os dados são todos iguais.
Exemplo: Na 2ª classe de certa escola o professor deu uma tarefa constituída por um certo número
de contas para os alunos resolverem. Pretendendo determinar a dispersão dos tempos de cálculo,
observam-se 10 alunos durante a realização da tarefa, tendo-se obtido os seguintes valores:
Tempo
Aluno
(minutos)
i
xi
1 13 - 3.9 15.21
2 15 - 1.9 3.61
3 14 - 2.9 8.41
4 18 1.1 1.21
5 25 8.1 65.61
6 14 - 2.9 8.41
7 16 -0.9 0.81
8 17 0.1 0.01
9 20 3.1 9.61
10 17 0.1 0.01
169 0.0 112.90
Resolução: Na tabela anterior juntamos duas colunas auxiliares, uma para colocar os desvios das
observações em relação à média e a outra para escrever os quadrados destes desvios. A partir da coluna
das observações calculamos a soma dessas observações, que nos permitiu calcular a média = 16.9. Uma
vez calculada a média foi possível calcular a coluna dos desvios. Repare-se que, como seria de esperar,
a soma dos desvios é igual a zero. A soma dos quadrados dos desvios permite-nos calcular a variância
donde s = 3.54.
48
1678859 E-book gerado especialmente para DANIEL CRISTIAN
s2 112.9 =
= 9 12.54
O tempo médio de realização da tarefa foi de aproximadamente 17 minutos com uma variabilidade
medida pelo desvio padrão de aproximadamente 3.5 minutos. Na representação gráfica ao lado
visualizamos os desvios das observações relativamente à média (valores do exemplo anterior):
Do mesmo modo que a média, também o desvio padrão é uma medida pouco resistente, pois é
influenciado por valores ou muito grandes ou muito pequenos (o que seria de esperar já que na sua
definição entra a média que é não resistente). Assim, se a distribuição dos dados for bastante enviesada,
não é conveniente utilizar a média como medida de localização, nem o desvio padrão como medida de
variabilidade. Estas medidas só dão informação útil, respectivamente sobre a localização do centro da
distribuição dos dados e sobre a variabilidade, se as distribuições dos dados forem aproximadamente
simétricas.
Propriedades para dados com distribuição aproximadamente normal: Uma propriedade que se verifica
se os dados se distribuem de forma aproximadamente normal, ou seja, quando o histograma apresenta
uma forma característica com uma classe média predominante e as outras classes se distribuem à volta
desta de forma aproximadamente simétrica e com frequências a decrescer à medida que se afastam da
classe média, é a seguinte:
Aproximadamente 68% dos dados estão no intervalo .
Como se depreende do que atrás foi dito, se os dados se distribuem de forma aproximadamente
normal, então estão praticamente todos concentrados num intervalo de amplitude igual a 6 vezes o desvio
padrão.
A informação que o desvio padrão dá sobre a variabilidade deve ser entendida como a variabilidade
que é apresentada relativamente a um ponto de referência - a média, e não propriamente a variabilidade
dos dados, uns relativamente aos outros.
A partir da definição de variância, pode-se deduzir sem dificuldade uma expressão mais simples, sob
o ponto de vista computacional, para calcular ou a variância ou o desvio padrão e que é a seguinte:
49
1678859 E-book gerado especialmente para DANIEL CRISTIAN
É a medida de variabilidade que em geral é expressa em porcentagem, e tem por função determinar o
grau de concentração dos dados em torno da média, geralmente utilizada para se fazer a comparação
entre dois conjuntos de dados em termos percentuais, esta comparação revelará o quanto os dados estão
próximos ou distantes da média do conjunto de dados.
Exemplo
Considere a tabela abaixo que contém as estaturas e os pesos de um mesmo grupo de indivíduos:
Média Desvio-padrão
Estaturas 175 cm 5 cm
Pesos 68 kg 2 kg
Pergunta: Qual das medidas (Estatura ou Peso) possui maior homogeneidade?
Como não é possível responder a essa pergunta utilizando o desvio-padrão, pois é uma medida de
dispersão absoluta, teremos que calcular o CVP da Estatura e o CVP do Peso. A série que apresentar a
menor variação, ou seja, o menor valor do coeficiente CVP, será a série de maior homogeneidade.
Seguindo a fórmula do coeficiente CVP, temos:
CVP Estatura
CVP Peso
50
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os pesos.
Amplitude: Uma medida de dispersão que se utiliza por vezes, é a amplitude amostral r, definida como
sendo a diferença entre a maior e a menor das observações: r = xn:n - x1:n, onde representamos por x1:n e
xn:n, respectivamente o menor e o maior valor da amostra (x1, x2, ..., xn), de acordo com a notação
introduzida anteriormente, para a amostra ordenada.
Amplitude Inter-Quartil: A medida anterior tem a grande desvantagem de ser muito sensível à
existência, na amostra, de uma observação muito grande ou muito pequena. Assim, define-se uma outra
medida, a amplitude inter-quartil, que é, em certa medida, uma solução de compromisso, pois não é
afetada, de um modo geral, pela existência de um número pequeno de observações demasiado grandes
ou demasiado pequenas. Esta medida é definida como sendo a diferença entre os 1º e 3º quartis.
Amplitude inter-quartil = Q3/4 - Q1/4
Do modo como se define a amplitude inter-quartil, concluímos que 50% dos elementos do meio da
amostra, estão contidos num intervalo com aquela amplitude. Esta medida é não negativa e será tanto
maior quanto maior for a variabilidade nos dados. Mas, ao contrário do que acontece com o desvio padrão,
uma amplitude inter-quartil nula, não significa necessariamente, que os dados não apresentem
variabilidade.
Amplitude inter-quartil ou desvio padrão: Do mesmo modo que a questão foi posta relativamente
às duas medidas de localização mais utilizadas - média e mediana, também aqui se pode por o problema
de comparar aquelas duas medidas de dispersão.
- A amplitude inter-quartil é mais robusta, relativamente à presença de "outliers", do que o desvio
padrão, que é mais sensível aos dados.
- Para uma distribuição dos dados aproximadamente normal, verifica-se a seguinte relação. Amplitude
inter-quartil 1.3 x desvio padrão.
- Se a distribuição é enviesada, já não se pode estabelecer uma relação análoga à anterior, mas pode
acontecer que o desvio padrão seja muito superior à amplitude inter-quartil, sobretudo se se verificar a
existência de "outliers".
Questões
02. (ANAC – Analista Administrativo – ESAF) Os valores a seguir representam uma amostra
331546248
Então, a variância dessa amostra é igual a
(A) 4,0
(B) 2,5
(C) 4,5
(D) 5,5
(E) 3,0
03. (MPE/AP – Analista Ministerial – FCC) Ao considerar uma curva de distribuição normal, com
uma média como medida central, temos a variância e o desvio padrão referentes a esta média. Em
relação a estes parâmetros,
51
1678859 E-book gerado especialmente para DANIEL CRISTIAN
(C) o desvio padrão é a raiz quadrada da variância.
(D) a média dividida pelo desvio padrão forma a variância.
(E) a variância elevada ao quadrado indica qual é o desvio padrão.
200, 250, 300, 250, 250, 200, 150, 200, 150, 200.
O desvio padrão amostral dos números diários de merendas escolares é superior a 50.
( ) Certo ( ) Errado
Respostas
01. Resposta: C.
Como visto, o desvio padrão é a raiz quadrada da variância.
02. Resposta: C.
Tem-se que a amostra contém as seguintes observações: 3 3 1 5 4 6 2 4 8. Para chegar à variância,
nessa questão, encontramos primeiro o valor da média.
A média desses valores é dada por: soma das observações/nº de observações menos 1.
Logo, 3+3+1+5+4+6+2+4+8/ 9 = 4
Após isso, aplicamos a construção: (3-4)²+(3-4)²+(1-4)²+(5-4)²+(4-4)²+(6-4)²+(2-4)²+(4-4)²+(8-4)²/9-1
Calculando: [(-1)²+(-1)²+(-3)²+(1)²+(0)²+(2)²+(-2)²+(0)²+(4)²]/9-1
(1+1+9+1+0+4+4+0+16)/8
36/8 = 4,5
03. Resposta: C.
Conforme visto anteriormente, desvio padrão é a raiz quadrada da variância.
PROBABILIDADE
A teoria das probabilidades surgiu no século XVI, com o estudo dos jogos de azar, tais como jogos de
cartas e roleta. Atualmente ela está intimamente relacionada com a Estatística e com diversos ramos do
conhecimento.
52
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Definições4:
A teoria da probabilidade é o ramo da Matemática que cria e desenvolve modelos matemáticos para
estudar os experimentos aleatórios. Alguns elementos são necessários para efetuarmos os cálculos
probabilísticos.
Experimentos aleatórios
São fenômenos que apresentam resultados imprevisíveis quando repetidos, mesmo que as condições
sejam semelhantes.
Exemplos:
a) lançamento de 3 moedas e a observação das suas faces voltadas para cima
b) jogar 2 dados e observar o número das suas faces
c) abrir 1 livro ao acaso e observar o número das suas páginas.
Espaço amostral
Exemplo:
a) quando lançamos 3 moedas e observamos suas faces voltadas para cima, sendo as faces da moeda
cara (c) e coroa (k), o espaço amostral deste experimento é:
S = {(c,c,c); (c,c,k); (c,k,k); (c,k,c); (k,k,k,); (k,c,k); (k,c,c); (k,k,c)}, onde o número de elementos do
espaço amostral n(A) = 8
Evento
É qualquer subconjunto de um espaço amostral (S); muitas vezes um evento pode ser caracterizado
por um fato. Indicamos pela letra E.
Exemplo:
a) no lançamento de 3 moedas:
E1→ aparecer faces iguais
E1 = {(c,c,c);(k,k,k)}
O número de elementos deste evento E1 é n(E1) = 2
Evento certo: que possui os mesmos elementos do espaço amostral (todo conjunto é subconjunto de
si mesmo); E = S.
E: a soma dos resultados nos 2 dados ser menor ou igual a 12.
53
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Evento simples: evento que possui um único elemento.
E: a soma do resultado de dois dados ser igual a 12.
E: {(6,6)}
E: {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3) (2,4), (2,5), (2,6)}
Como, C = S – E
C = {(3,1), (3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4),
(5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}
Eventos mutuamente exclusivos: dois ou mais eventos são mutuamente exclusivos quando a
ocorrência de um deles implica a não ocorrência do outro. Se A e B são eventos mutuamente exclusivos,
então: A ∩ B = Ø.
Sejam os eventos:
A: quando lançamos um dado, o número na face voltada para cima é par.
A = {2,4,6}
B: quando lançamos um dado, o número da face voltada para cima é divisível por 5.
B = {5}
Os eventos A e B são mutuamente exclusivos, pois A ∩ B = Ø.
𝐧(𝐄)
𝐏(𝐄) =
𝐧(𝐒)
Exemplo:
Lançando-se um dado, a probabilidade de sair um número ímpar na face voltada para cima é obtida
da seguinte forma:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
E = {1, 3, 5} n(E) = 3
n(E) 3 1
P(E) = = = = 0,5 𝑜𝑢 50%
n(S) 6 2
54
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Probabilidade da União de dois Eventos
Sendo n(S) o número de elementos do espaço amostral, vamos dividir os dois membros da equação
por n(S) a fim de obter a probabilidade P (A U B).
𝑛(𝐴 ∪ 𝐵) 𝑛(𝐴) 𝑛(𝐵) 𝑛(𝐴 ∩ 𝐵)
= + −
𝑛(𝑆) 𝑛(𝑆) 𝑛(𝑆) 𝑛(𝑆)
P (A U B) = P(A) + P(B) – P (A ∩ B)
P (A U B) = P(A) + P(B)
Exemplo:
A probabilidade de que a população atual de um país seja de 110 milhões ou mais é de 95%. A
probabilidade de ser 110 milhões ou menos é de 8%. Calcule a probabilidade de ser 110 milhões.
Sendo P(A) a probabilidade de ser 110 milhões ou mais: P(A) = 95% = 0,95
Sendo P(B) a probabilidade de ser 110 milhões ou menos: P(B) = 8% = 0,08
P (A ∩ B) = a probabilidade de ser 110 milhões: P (A ∩ B) = ?
P (A U B) = 100% = 1
Utilizando a regra da união de dois eventos, temos:
P (A U B) = P(A) + P(B) – P (A ∩ B)
1 = 0,95 + 0,08 - P (A ∩ B)
P (A ∩ B) = 0,95 + 0,08 - 1
P (A ∩ B) = 0,03 = 3%
Probabilidade Condicional
𝒏(𝑨 ∩ 𝑩) 𝑷(𝑨 ∩ 𝑩)
𝑷(𝑨|𝑩) = =
𝒏(𝑩) 𝑷(𝑩)
55
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Exemplo:
No lançamento de 2 dados, observando as faces de cima, para calcular a probabilidade de sair o
número 5 no primeiro dado, sabendo que a soma dos 2 números é maior que 7.
Montando temos:
S = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1), (3,2), (3,3), (3,4),
(3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1), (6,2), (6,3), (6,4),
(6,5), (6,6)}
Evento A: o número 5 no primeiro dado.
A = {(5,1), (5,2), (5,3), (5,4), (5,5), (5,6)}
𝐏(𝐀 ∩ 𝐁) 𝐏(𝐀 ∩ 𝐁)
𝐏(𝐀|𝐁) = 𝐨𝐮 𝐏(𝐁|𝐀) =
𝐏(𝐁) 𝐏(𝐀)
P (A ∩ B) = P(A). P(B)
Exemplo:
Lançando-se simultaneamente um dado e uma moeda, determine a probabilidade de se obter 3 ou 5
no dado e cara na moeda.
Sendo, c = coroa e k = cara.
S = {(1,c), (1,k), (2,c), (2,k), (3,c), (3,k), (4,c), (4,k), (5,c), (5,k), (6,c), (6,k)}
Evento A: 3 ou 5 no dado
A = {(3,c), (3,k), (5,c), (5,k)}
4 1
𝑃(𝐴) = =
12 3
Os eventos são independentes, pois o fato de ocorrer o evento A não modifica a probabilidade de
ocorrer o evento B. Com isso temos:
P (A ∩ B) = P(A). P(B)
1 1 1
𝑃(𝐴 ∩ 𝐵) = . =
3 2 6
56
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Observamos que A ∩ B = {(3,k), (5,k)} e a P (A ∩ B) poder ser calculada também por:
𝑛(𝐴 ∩ 𝐵) 2 1
𝑃(𝐴 ∩ 𝐵) = = =
𝑛(𝑆) 12 6
No entanto nem sempre chegar ao n(A ∩ B) nem sempre é fácil dependendo do nosso espaço
amostral.
Vamos considerar um experimento que se repete n número de vezes. Em cada um deles temos:
P(E) = p, que chamamos de probabilidade de ocorrer o evento E com sucesso.
P(𝐸̅ ) = 1 – p, probabilidade de ocorrer o evento E com insucesso (fracasso).
A probabilidade do evento E ocorrer k vezes, das n que o experimento se repete é dado por uma lei
binomial.
Exemplo:
Lançando-se uma moeda 4 vezes, qual a probabilidade de ocorrência 3 caras?
Está implícito que ocorrerem 3 caras deve ocorrer uma coroa. Umas das possíveis situações, que
satisfaz o problema, pode ser:
Temos que:
n=4
k=3
1 1
̅̅̅ = 1 −
𝑃(𝐸) = , 𝑃(𝐸)
2 2
57
1678859 E-book gerado especialmente para DANIEL CRISTIAN
1 3 1 1
Podemos também resolver da seguinte forma: (43) maneiras de ocorrer o produto ( ) . (1 − ) ,
2 2
portanto:
4 1 3 1 1 1 1 1
𝑃(𝐸) = ( ) . ( ) . (1 − ) = 4. . =
3 2 2 8 2 4
Questões
(A) 1/4;
(B) 1/3;
(C) 1/2;
(D) 2/3;
(E) 3/4.
02. (ENEM – CESGRANRIO) Em uma escola, a probabilidade de um aluno compreender e falar inglês
é de 30%. Três alunos dessa escola, que estão em fase final de seleção de intercâmbio, aguardam, em
uma sala, serem chamados para uma entrevista. Mas, ao invés de chamá-los um a um, o entrevistador
entra na sala e faz, oralmente, uma pergunta em inglês que pode ser respondida por qualquer um dos
alunos.
A probabilidade de o entrevistador ser entendido e ter sua pergunta oralmente respondida em inglês é
(A) 23,7%
(B) 30,0%
(C) 44,1%
(D) 65,7%
(E) 90,0%
03. (ENEM – CESGRANRIO) Em uma central de atendimento, cem pessoas receberam senhas
numeradas de 1 até 100. Uma das senhas é sorteada ao acaso.
Qual é a probabilidade de a senha sorteada ser um número de 1 a 20?
(A) 1/100
(B) 19/100
(C) 20/100
(D) 21/100
(E) 80/100
04. (Pref. Niterói – Agente Fazendário – FGV) O quadro a seguir mostra a distribuição das idades
dos funcionários de certa repartição pública:
Escolhendo ao acaso um desses funcionários, a probabilidade de que ele tenha mais de 40 anos é:
(A) 30%;
(B) 35%;
58
1678859 E-book gerado especialmente para DANIEL CRISTIAN
(C) 40%;
(D) 45%;
(E) 55%.
05. (UFES – Economista – UFES/2018) Um casal pretende ter 3 filhos. A probabilidade de nascerem
2 meninos e 1 menina, desse casal, é
(A) 45,5%
(B) 37,5%
(C) 33,3%
(D) 30%
(E) 26,5%
06. (TJ/RO – Técnico Judiciário – FGV) Um tabuleiro de damas tem 32 quadradinhos pretos e 32
quadradinhos brancos.
07. (Pref. Jucás/CE – Professor de Matemática – INSTITUTO NEO EXITUS) Fernanda organizou
um sorteio de amigo secreto entre suas amigas. Para isso, escreveu em pedaços de papel o nome de
cada uma das 10 pessoas (incluindo seu próprio nome) que participariam desse sorteio e colocou dentro
de um saco. Fernanda, como organizadora, foi a primeira a retirar um nome de dentro do saco. A
probabilidade de Fernanda retirar seu próprio nome é:
(A) 3/5.
(B) 2/10.
(C) 1/10.
(D) ½.
(E) 2/3.
08. (Corpo de Bombeiros Militar/MT – Oficial Bombeiro Militar – COVEST) Uma loja de
eletrodoméstico tem uma venda mensal de sessenta ventiladores. Sabe-se que, desse total, seis
apresentam algum tipo de problema nos primeiros seis meses e precisam ser levados para o conserto
em um serviço autorizado.
Um cliente comprou dois ventiladores. A probabilidade de que ambos não apresentem problemas nos
seis primeiros meses é de aproximadamente:
(A) 90%
(B) 81%
(C) 54%
(D) 11%
(E) 89%
09. (Corpo de Bombeiros Militar/MT – Oficial Bombeiro Militar – COVEST) Em uma caixa estão
acondicionados uma dúzia e meia de ovos. Sabe-se, porém, que três deles estão impróprios para o
consumo.
Se forem escolhidos dois ovos ao acaso, qual a probabilidade de ambos estarem estragados?
(A) 2/153
(B) 1/9
(C) 1/51
59
1678859 E-book gerado especialmente para DANIEL CRISTIAN
(D) 1/3
(E) 4/3
Comentários
01. Resposta: D
Vamos fazer o total de possíveis resultados entre os conjuntos A e B.
Como em A temos 3 elementos e em B temos 4 elementos, teremos um total de 12 possibilidades de
fazer A vezes B,
Vamos ver quais serão pares agora:
A = {1, 2, 3} e B = {4, 5, 6, 7},
A.B
1.4=4
1.6=6
2.4=8
2 . 5 = 10
2 . 6 = 12
2 . 7 = 14
3 . 4 = 12
3 . 6 = 18
Assim, teremos 8 possibilidades de um total de 12, logo a probabilidade desse número ser par será de
8/12 = 2/3 (simplificando a fração)
02. Resposta: D
A probabilidade de nenhum dos três alunos responder à pergunta feita pelo entrevistador é
0,70 . 0,70 . 0,70 = 0,343 = 34,3%
Portanto, a possibilidade dele ser entendido é de: 100% – 34 ,3% = 65,7%
03. Resposta: C
A probabilidade de a senha sorteada ser um número de 1 a 20 é 20/100, pois são 20 números entre
100.
04. Resposta: D
O espaço amostral é a soma de todos os funcionário:
2 + 8 + 12 + 14 + 4 = 40
O número de funcionário que tem mais de 40 anos é: 14 + 4 = 18
Logo a probabilidade é:
18
𝑃(𝐸) = = 0,45 = 45%
40
05. Resposta: B
1 1
Como terá três filhos a probabilidade de sair menino será 2 e de sair menina será 2, assim como terá
1 1 1 1
três filhos será: 2 𝑥 2 𝑥 2 = 8, mas atente-se pelo fato que ele não pediu em determinada ordem, ou seja,
podemos ter:
Menino/Menino/Menina
Menino/Menina/Menino
Menina/Menino/Menino
1 3
Três ordens, logo a resposta será: 8 𝑥3 = 8 = 0,375 = 37,5%
06. Resposta: E
Como são 14 quadrinhos pretos na borda e 64 quadradinhos no total, logo a probabilidade será de:
14 7
𝑃(𝐸) = =
64 32
07. Resposta: C
𝑟𝑒𝑡𝑖𝑟𝑎𝑑𝑜
A probabilidade é calculada por 𝑃 = 𝑡𝑜𝑡𝑎𝑙
1
Assim, 𝑃 = 10
60
1678859 E-book gerado especialmente para DANIEL CRISTIAN
08. Resposta: B
6 / 60 = 0,1 = 10% de ter problema
Assim, se 10% tem problemas, então 90% não apresentam problemas.
90 90 8100
𝑃= .
100 100
= 10000
= 81%
09. Resposta: C
3 2 6 1
𝑃= . = = (: 6 / 6)
18 17 306 51
4 - Teorema de Bayes.
TEOREMA DE BAYES
Os símbolos P(B ǀ A) e P(A ǀ B) podem ter aparência similar, mas há grande diferença no que eles
representam. Por exemplo, faça A representar ter treinamento técnico e faça B representar executar um
bom serviço. Veja:
P(BǀA) = probabilidade de “bom serviço” dado o “treinamento técnico”.
P(AǀB) = probabilidade de “ter treinamento técnico” dado o “bom serviço”.
Outro exemplo: faça A representar ser bom aluno e faça B representar ser aprovado no vestibular.
Veja:
P(BǀA) = probabilidade de “ser aprovado no vestibular” dado “ser bom aluno”.
P(AǀB) = probabilidade de “ser bom aluno” dado “ser aprovado no vestibular”.
Muitos problemas envolvem um par de probabilidades condicionais. Vamos buscar a fórmula para
obter P(A ǀ B). Para isso, veja a 2ª regra da multiplicação em postagem anterior (teorema da multiplicação
de probabilidades ou a regra do e) e lembre-se de que A e B são dois eventos que ocorrem em
sequência, A antecede B. Temos, pela "regra do e":
Donde:
Portanto:
Exemplo
Uma urna contém cinco bolas diferentes apenas quanto à cor: duas são vermelhas, três são azuis.
Retiram-se duas bolas da urna ao acaso, uma em seguida da outra, sem recolocar na urna a primeira
bola retirada.
Pergunta: qual é a probabilidade de a primeira bola retirada ser azul, sob a condição de a segunda
bola retirada ser vermelha?
Veja o diagrama de árvore, que ajuda entender tudo o que pode acontecer quando você retira duas
bolas de uma urna, na situação descrita.
61
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Bola vermelha na segunda retirada acontece de duas maneiras, isto é,
azul e vermelha ou vermelha e vermelha:
O evento de interesse é sair bola azul na primeira retirada e sair bola vermelha na segunda retirada, ou
seja:
Então a probabilidade de a primeira bola retirada ser azul sob a condição de a segunda
bola retirada ser vermelha é dada por:
62
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Lembrando: o teorema de Bayes é o “reverso” de probabilidade condicional:
A probabilidade condicional trata a probabilidade de ocorrer um evento B sob a condição de ocorrer
seu antecedente A.
O teorema de Bayes trata a probabilidade de ocorrer o evento A sob a condição de ocorrer o evento B
que sucede A.
Exemplo
Em uma cidade em que o teste do bafômetro é obrigatório, 25% dos motoristas têm o hábito de dirigir
depois de beber. Quando testados, 99% dos motoristas que beberam positivam para álcool. No entanto,
17% dos motoristas que não bebem também positivam no bafômetro. Você é um agente da lei. Qual é a
probabilidade de uma pessoa positivar no bafômetro mas não ter feito uso de bebida alcoólica?
Os eventos “bebe” e “não bebe” serão indicados pelas letras BB e NB e o fato de positivar no bafômetro
por + e - respectivamente. Veja o diagrama de árvore.
Exemplo
Você vai a uma corrida de cavalos. Dois cavalos estão no páreo: o Branco e o Negro. Branco venceu
5 das 12 vezes que correu com o Negro. E qual cavalo você apostaria? É razoável apostar no Negro
porque, da informação que você tem, a probabilidade de o Branco ganhar é 5/12 e de o Negro ganhar é
7/12. Mas você recebe outra informação: chovia, em 3 das 5 corridas que Branco venceu e chovia, em 1
das 7 corridas que Negro venceu. Como está chovendo, você aposta em Branco. Qual a probabilidade
de ele (e você!) ganhar? Veja o diagrama de árvore e ache a probabilidade pedida, que é ¾.
Referência
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002
soniavieira.blogspot.com.br/2015/08/empostagem-anterior-foi-introduzido-o.html
fm2s.com.br/teorema-de-bayes/
63
1678859 E-book gerado especialmente para DANIEL CRISTIAN
5 - Probabilidade condicional.
Caro(a) Candidato(a), esse assunto já foi abordado no tópico: 3 - Variáveis aleatórias e distribuição
de probabilidade.
Introdução
Todas as ciências têm suas raízes na história do homem.
Desde a Antiguidade muitos povos já faziam uso dos recursos da Estatística, através de registro de
número de óbitos, nascimentos, número de habitantes, além das estimativas das riquezas individuais e
sociais, entre muitas outras.
Na Idade Média as informações colhidas tinham como finalidade tributária e bélica.
Somente a partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais,
originando as primeiras tábuas e tabelas e os primeiros números relativos.
No século XVII o estudo de tais fatos foi adquirido, aos poucos, feição verdadeiramente científica.
Godofredo Achenwall batizou a nova ciência (ou método) com o nome de Estatística, determinando o seu
objetivo e suas relações com as ciências.
A estatística não se limita somente a compilar tabelas de dados e os ilustrar graficamente. Ela é, hoje
em dia, um instrumento útil e, em alguns casos, indispensável para tomadas de decisão em diversos
campos: científico, econômico, social, político….
Todavia, antes de chegarmos à parte de interpretação para tomadas de decisão, há que proceder a
um indispensável trabalho de recolha e organização de dados, sendo a recolha feita através de
recenseamentos (ou censos ou levantamentos estatísticos) ou sondagens.
Estatística pode ser pensada como a ciência de aprendizagem a partir de dados. No nosso cotidiano,
precisamos tomar decisões, muitas vezes decisões rápidas.
Em linhas gerais a Estatística fornece métodos que auxiliam o processo de tomada de decisão através
da análise dos dados que possuímos.
Podemos ainda dizer que a Estatística é:
É a ciência que se ocupa de coletar, organizar, analisar e interpretar dados para que se tomem
decisões.
Em resumo:
A ESTATÍSTICA é uma parte da Matemática Aplicada que fornece métodos para a coleta,
organização, análise e interpretação de dados e para utilização dos mesmos na tomada de
decisões.
Divisão da estatística
- Estatística Descritiva: coleta, organização e descrição dos dados. Ela preocupa-se com a forma
pela qual podemos apresentar um conjunto de dados em tabelas e gráficos, e também resumir as
informações contidas nestes dados mediante a utilização de medidas estatísticas.
64
1678859 E-book gerado especialmente para DANIEL CRISTIAN
- Estatística Indutiva ou Inferencial: análise e a interpretação desses dados. A inferência estatística
baseia-se na teoria das probabilidades para estabelecer conclusões sobre todo um grupo (chamado
população), quando se observou apenas uma parte (amostra) representativa desta população.
Método Estatístico
Atualmente quase todo acréscimo de conhecimento resulta da observação e do estudo. A verdade é
que desenvolvemos processos científicos para seu estudo e para adquirirmos tais conhecimentos, ou
seja desenvolvemos maneiras ou métodos para tais fins.
- Método estatístico: diante da impossibilidade de manter as causas constantes, admite todas essas
causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final,
que influências cabem a cada uma delas.
- Crítica dos dados: depois de obtidos os dados, os mesmos devem ser cuidadosamente criticados,
à procura de possível falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo
vulto, que possam influir sensivelmente nos resultados.
A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má
interpretação das perguntas que lhe foram feitas.
A crítica é interna quando visa observar os elementos originais dos dados da coleta.
- Apuração dos dados: soma e processamento dos dados obtidos e a disposição mediante critérios
de classificação, que pode ser manual, eletromecânica ou eletrônica.
- Exposição ou apresentação de dados: os dados devem ser apresentados sob forma adequada
(tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico.
65
1678859 E-book gerado especialmente para DANIEL CRISTIAN
- Análise dos resultados: realizadas anteriores (Estatística Descritiva), fazemos uma análise dos
resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução
ou inferência, e tiramos desses resultados conclusões e previsões.
Mais alguns conceitos devem ser aprendidos para darmos continuidade ao nosso entendimento sobre
Estatística.
- População estatística ou universo estatístico: conjunto de entes portadores de, pelo menos, uma
característica comum.
Exemplos: estudantes (os que estudam), concurseiros (os que prestam concursos), ...
Podemos ainda pesquisar uma ou mais características dos elementos de alguma população, as quais
devem ser perfeitamente definidas. É necessário existir um critério de constituição da população, válido
para qualquer pessoa, no tempo ou no espaço.
A Estatística Indutiva tem por objetivo tirar conclusões sobre as populações, com base em resultados
verificados em amostras retiradas dessa população. É preciso garantir que a amostra possua as mesmas
características da população, no que diz respeito ao fenômeno que desejamos pesquisar.
Estimação: é uma avaliação indireta de um parâmetro, com base em um estimador através do cálculo
de probabilidades.
Principais da Estimação:
- Admite erro processual positivo e tem confiabilidade menor que 100%.
- É barata.
- É rápida.
- É atualizada.
- É sempre viável.
Dados brutos: quando observamos ou fazemos n perguntas as quais nos dão n dados ou respostas,
obtemos uma sequência de n valores numéricos. A toda sequência denominamos dados brutos.
66
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Dados brutos é uma sequência de valores numéricos não organizados, obtidos diretamente da
observação de um fenômeno coletivo.
Rol: é uma sequência ordenada dos dados brutos.
Exemplo: Um aluno obteve as seguintes notas no ano letivo em Matemática: 5,5 ; 7 ; 6,5 ; 9
Os dados brutos é a sequência descrita acima
Rol: 5,5 – 6,5 – 7 – 9 (ordenação crescente das notas).
Referências
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002
SILVA, Ermes Medeiros, Elio Medeiros...- Estatística para os cursos de: Economia, Administração, Ciências Contábeis - 3ª edição – São Paulo – Editora Atlas
S. A: 1999
TAVARES, Prof. Marcelo – Estatística Aplicada à Administração – Sistema Universidade Aberta do Brasil- 2007
Reis, Marcelo Menezes - Estatística aplicada à administração / Marcelo Menezes Reis. –Florianópolis: Departamento de Ciências da Administração /UFSC, 2008.
Questões
03. (EBSERH – Médico do Trabalho – IADES) “Costuma ser encontrada com maior frequência em
jornais, revistas ou relatórios. Essa parte da estatística utiliza números para descrever fatos. Seu foco é
a representação gráfica e o resumo e organização de um conjunto de dados, com a finalidade de
simplificar informações.” O texto faz referência à:
(A) Estatística inferencial
(B) Estatística de probabilidade
(C) Estatística por amostragem
(D) Estatística descritiva
(E) Média aritmética
Respostas
67
1678859 E-book gerado especialmente para DANIEL CRISTIAN
8 - Correlação linear simples.
CORRELAÇÃO
Diz-se que existe correlação entre duas ou mais variáveis quando as alterações sofridas por uma delas
são acompanhadas por modificações nas outras. Ou seja, no caso de duas variáveis x e y os aumentos
(ou diminuições) em x correspondem a aumentos (ou diminuições) em y. Assim, a correlação revela se
existe uma relação funcional entre uma variável e as restantes. Note-se que a palavra regressão em
Estatística corresponde à palavra função em Matemática. Ou seja, enquanto o matemático diz que y é
função de x, o estatístico fala em regressão de y sobre x.
Reta de regressão
Uma função muito interessante é a que representa a linha reta, cuja expressão matemática é
y = a + bx em que
y= variável dependente
x= variável independente
a= constante = intercepto (ponto em que a reta corta o eixo
dos y)
b= constante = coeficiente de regressão
Ressalte-se que necessariamente o ponto determinado pela média das variáveis está contido na reta.
A melhor reta que descreve a regressão. Supondo uma amostra em que um caráter métrico tenha a
seguinte distribuição de idades e larguras de um órgão:
Idade Largura
(x) (y)
1 30 Em que:
2 40 total de larguras = 520
3 50 total de idades = 36
4 60
5 70 média de larguras = 65
6 80 média de idades = 4,5
7 90
8 100 Supondo a = 20 e b =
10
Quando se deseja desenhar uma reta, para facilitar, atribui-se 2 valores de x próximos aos extremos
dos dados. Depois, usa-se esses valores na equação: y = y + b.(x - x) . Portanto, para a idade x = 1 ano,
largura: y = 65 + 10 (1 - 4,5) = 30 para a idade x = 8 anos, largura: y = 65 + 10 (8 - 4,5) = 100
68
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Essa reta, que passa pelos pontos médios dos valores de x e y é a melhor reta que descreve a
regressão. Evidentemente, pode-se usar o mesmo processo em gráficos feitos em programas
computacionais.
Interpolação x Extrapolação
Existe correlação?
Para se decidir sobre a existência de correlação e o sentido da variação da reta de regressão, calcula-
se b e o erro de b. Depois efetua-se um teste t, testando as seguintes hipóteses:
H0 : b = 0, ou seja, H. Nula: a reta de regressão em y é paralela ao eixo dos x.
Ha : b ≠ 0, isto é, H. Alternativa: a reta de regressão em y não é paralela ao eixo dos x.
Como calcular
Recordando que as somatórias de quadrados (SQ) e de produtos (SP) são calculadas por:
SQx = x2 – [( x)2 / n]
SQy = y2 – [( y)2 / n]
SP = (x.y) – n.x.y
Para se testar a significância de b, ou seja, para testar se b pode ser considerado ou não como
significativamente diferente de zero, calcula-se t, com GL = n - 2, sendo: t = b / sb
t < tc tc t > tc
t não é significativo t é significativo
b não é significativamente b é significativamente diferente
diferente de 0 de 0
(a reta é paralela ao eixo dos x) (a reta não é paralela ao eixo
dos x)
69
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Portanto:
1. Se t não for significativo os caracteres não estão correlacionados: (t = 0)
Se t for significativo os caracteres estão correlacionados: (t ≠ 0)
Exemplo: Os seguintes dados foram obtidos amostrando dimensões do mesmo órgão de 10 indivíduos.
comprimento x 40 25 65 75 65 40 50 40 15 25
largura y 25 15 50 65 50 25 40 40 15 15
x 440 y 340 n 10
x 44 y 34 (x.y) 17950
Observando as duas últimas fórmulas rapidamente percebe-se que se não houver correlação entre x
e y, ou seja, se r = 0, então b = 0 e a reta será paralela ao eixo dos x. O coeficiente r varia entre -1 e +1.
Portanto, a correlação pode ser:
70
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Para testar a significância usamos um teste t. Estabelecemos as hipóteses:
H0 : r = 0 , ou seja, H. Nula: Não há correlação entre as variáveis x e y.
Ha : r ≠ 0, isto é, H. Alternativa: Há correlação entre as variáveis x e y.
Coeficiente de determinação
O coeficiente de determinação é simbolizado por r2 e indica quanto da variação total é comum aos
elementos que constituem os pares analisados. Assim, a qualidade da regressão é indicada por este
coeficiente.
É importante notar que r2 varia entre 0 (zero) e 1 (um). Evidentemente, quanto mais próximo da unidade
for o coeficiente de Determinação, tanto maior será a validade da regressão.
Exemplo 1: Supondo que numa certa amostra tivessem sido obtidos os seguintes valores:
b = 0,86; SP = 2990; SQy = 2790
Assim, pode-se dizer que apenas 8% da variância da regressão não depende das variáveis estudadas.
Exemplo 2: Dados obtidos de 7 pares de pai-filho, amostrando o número de anos de escola cursados
pelo pai (x) e o número de anos de escola cursados pelo filho (y). Qual é o valor do coeficiente de
correlação entre esses dados? Qual é o seu significado?
x x2 y y2 x.y
12 144 12 144 144
10 100 8 64 80
6 36 6 36 36
16 256 11 121 176
8 64 10 100 80
9 81 8 64 72
12 144 11 121 132
x= x2 = 825 y = 66 y2 = 650 (x.y) = 720
73
Conclui-se que como t calculado é maior que tc, pode-se rejeitar a hipótese nula (r = 0) e aceitar a
hipótese alternativa em que r ≠ 0, admitindo-se que o número de anos de escola cursados pelo pai está
positivamente correlacionado (r = + 0,754) ao número de anos de escola cursados pelo filho nesta
amostra.
71
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Como r2 = 0,5685 e 1 - 0,5685 = 0,4315, pode-se dizer que nessa amostra, o número de anos de
escola cursados pelo pai explica 56,85% da variância do número de anos de escola cursados pelo filho.
Assim, 43,15% da variância da regressão depende de outras variáveis, não estudadas aqui.
Coeficiente de associação
Para verificar se dois caracteres qualitativos são interdependentes pode-se:
- empregar um teste de x2.
- calcular o coeficiente de associação.
Yule propôs esse coeficiente e o chamou de Q, para homenagear um pioneiro da Estatística, Lambert
A. J. Quételet (1796-1874). Monta-se uma tabela 2 x 2 e designa-se as células pelas letras a, b, c e d,
ficando a-d e b-c nas diagonais.
a b
c d
Exemplo: Supondo que a distribuição de 200 pacientes adultos (92 homens e 108 mulheres) segundo
as formas maligna e benigna de uma doença foi:
Q = (ad - bc) / (ad + bc) = (60 x 68) - (40 x 32) / (60 x 68) + (40 x 32)
Q = (4080 - 1280) / ( 4080 + 1280 ) = 2800 / 5360
Q = 0,5224
Como o valor calculado de Q (0,5224 ) se encontra entre esses 2 valores (,3115 e 0,7333), conclui-se
que existe associação entre o sexo e as formas da doença, estando o sexo masculino associado à forma
maligna, pois nesse sexo há maior frequência dessa forma.
Questões
01. (SEAD/AP – Fiscal da Receita Estadual – FGV) Se no ajuste de uma reta de regressão linear
simples de uma variável Y em uma variável X o coeficiente de determinação observado foi igual a 0,64,
então o módulo do coeficiente de correlação amostral entre X e Y é igual a:
72
1678859 E-book gerado especialmente para DANIEL CRISTIAN
(A) 0,24
(B) 0,36
(C) 0,50
(D) 0,64
(E) 0,80
02. Considere um experimento em que se analisa a octanagem da gasolina (Y) em função da adição
de um aditivo (X). Para isto, foram realizados ensaios com os percentuais de 1, 2, 3, 4, 5 e 6% de aditivo.
Os resultados seguem.
03. (Colégio Pedro II – Estatístico – IDECAN) As quantidades a seguir foram obtidas a partir de
uma amostra de 60 indivíduos com relação a duas características: X e Y.
Respostas
01. Resposta: E.
Numa regressão, o coeficiente de determinação é R² e o coeficiente de correlação é R. Foi dito que R²
= 0,64, o que resulta R = 0,80.
02.
6.(1754,3)−(21).(496,8) 93
Β= 6.(91)−(21)²
= 105
= 0,886
496,8−(0,886).(21)
α= 6
= 79,7
y = 79,7 + 0,886x.
73
1678859 E-book gerado especialmente para DANIEL CRISTIAN
03. Resposta: D.
66
Coef. de correlação = = 0,911
√82 . 64
Distribuição de Bernoulli
Definição
Considere o lançamento de uma moeda. A característica desse experimento aleatório é que ele possui
apenas dois resultados possíveis. Uma situação análoga surge quando da extração da carta de um
baralho, onde o interesse está apenas na cor (preta ou vermelha) da carta sorteada.
Um experimento de Bernoulli é um experimento aleatório com apenas dois resultados possíveis; por
convenção, um deles é chamado “sucesso” e o outro “fracasso”.
A distribuição de Bernoulli é a distribuição de uma v.a. X associada a um experimento de Bernoulli,
onde se define X = 1 se ocorre sucesso e X = 0 se ocorre fracasso. Chamando de p a probabilidade de
sucesso (0 < p < 1), a distribuição de Bernoulli é:
Obviamente, as condições definidoras de uma fdp são satisfeitas, uma vez que p > 0, 1 − p > 0 e p+(1
−p) = 1. O valor de p é o único valor que precisamos conhecer para determinar completamente a
distribuição; ele é, então, chamado parâmetro da distribuição de Bernoulli. Vamos denotar a distribuição
de Bernoulli com parâmetro p por Bern(p).
A função de distribuição acumulada é dada por:
Esperança
Seja X ∼ Bern(p) (lê-se: a variável aleatória X tem distribuição de Bernoulli com parâmetro p).
Então, E(X) = 0 × (1 − p) + 1 × p. Logo,
X ∼ Bern(p) ⇒ E(X) = p
74
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Variância
Seja X ∼ Bern(p). Então,
Logo,
X ∼ Bern(p) ⇒ V ar(X) = p(1 − p)
Distribuição Geométrica
Definição
Considere a situação descrita no exercício 3 do capítulo 1: uma moeda com probabilidade p de cara é
lançada até que apareça cara pela primeira vez. Como visto, tal experimento gera uma v.a. discreta X =
“número de repetições necessárias até a ocorrência da primeira cara” com infinitos valores. Essa é uma
situação onde é impossível encontrar algum paralelo na prática; no entanto, o “infinito” na prática, em
geral, é substituído por um “valor muito grande”. Considere uma população muito grande onde p% das
pessoas sofrem de uma doença desconhecida. Precisa-se encontrar uma pessoa portadora da doença
para que os médicos possam estudá-la. Quantas pessoas teremos que examinar até encontrar uma
portadora? Em ambas as situações, cada repetição do experimento (lançamento da moeda ou exame de
uma pessoa) tem dois resultados possíveis (cara ou coroa e Portadora ou não protadora da doença), ou
seja, temos experimentos de Bernoulli.
Consideremos repetições independentes de um experimento de Bernoulli com parâmetro p. Vamos
definir a seguinte v.a. associada a esse experimento aleatório:
ou seja,
Dizemos que X tem distribuição geométrica com parâmetro p (o único valor necessário para especificar
completamente a fdp) e vamos representar tal fato por X ∼ Geom(p).
As características definidoras desse modelo são: (i) repetições de um mesmo experimento de
Bernoulli, o que significa que em todas elas a probabilidade de sucesso (e, portanto, de fracasso) é a
mesma e (ii) as repetições são independentes. No caso do lançamento de uma moeda essas hipóteses
são bastante plausíveis mas no caso da doença a hipótese de independência pode não ser satisfeita; por
exemplo, pode haver um componente de hereditariedade.
Para mostrar que (2.5) realmente define uma fdp, temos que mostrar que a soma das probabilidades,
isto é, a probabilidade do espaço amostral é 1 (obviamente, Pr(X = k) ≥ 0). Para isso vamos usar o seguinte
resultado sobre séries geométricas:
75
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Temos que:
Esperança
Logo,
Variância
Para calcular a variância, temos que calcular E(X2). Por definição,
No primeiro somatório, a parcela correspondente a k = 1 é nula, logo, podemos escrever (note o índice
do somatório!):
76
1678859 E-book gerado especialmente para DANIEL CRISTIAN
1
O segundo somatório é a esperança da distribuição geométrica com parâmetro p; logo, ele é igual a 𝑝.
Fazendo a mudança de variável k −2 = j no primeiro somatório, resulta que
Segue que:
Logo,
Exemplo
1. Um atirador acerta na mosca do alvo, 20% dos tiros. Qual a probabilidade de ele acertar na mosca
pela primeira vez no 10o tiro?
Solução:
Podemos pensar os tiros como experimentos independentes de Bernoulli (acerta ou não acerta). A
probabilidade de sucesso (acertar no alvo) é p = 0, 20. Estamos querendo o número de tiros até o primeiro
acerto e calcular a probabilidade desse número ser 10. Seja X = número de tiros até primeiro acerto.
Então, X ∼ Geom(0, 20) e Pr (X = 10) = 0, 89×0,2 = 0, 02684.
Distribuição Binomial
Definição
Consideremos n repetições independentes de um experimento de Bernoulli com parâmetro p (pense
em n lançamentos de uma moeda com probabilidade p de cara). Vamos definir a seguinte v.a. associada
a este experimento:
Lembre-se que você encontrou esta situação no exercício 5 do capítulo 1. Os valores possíveis de X
são 0 (só ocorrem fracassos), 1 (ocorre apenas 1 sucesso), 2 (ocorrem 2 sucessos), . . . , n (ocorrem
apenas sucessos). Vamos calcular a probabilidade de X = k, onde k = 0, 1, 2, . . . , n. O evento X = k
equivale à ocorrência de k sucessos e n − k fracassos. Consideremos uma situação específica: as k
primeiras repetições são “sucesso”. Como as repetições são independentes, temos a probabilidade da
interseção de eventos independentes; logo,
77
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Mas essa é uma ordenação específica, onde os sucessos são os primeiros resultados. Na verdade, os
k sucessos podem estar em qualquer posição e ainda teremos X = k. O número de maneiras possíveis
de obter k sucessos em n repetições nada mais é que o número de combinações de n elementos tomados
k a k, ou seja, Como cada uma dessas maneiras tem a mesma probabilidade acima e elas são eventos
mutuamente exclusivos, resulta que
Essa é a distribuição binomial; note que para determiná-la precisamos conhecer os valores de n e p,
que são os parâmetros da distribuição. Vamos usar a seguinte notação: X ∼ bin (n; p).
Note que na distribuição binomial, o número de lançamentos é fixo e o número de sucessos é a variável
de interesse; note o contraste com a distribuição binomial negativa onde o número de lançamentos é
variável e o número de sucessos é um número fixo (pré-determinado).
Para mostrar que realmente define uma fdp falta mostrar que
já que, obviamente, Pr(X = k) ≥ 0. De fato: o teorema do binômio de Newton nos diz que, se x e y são
números reais e n é um inteiro positivo, então
Esperança
78
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Quando k = 0, a parcela correspondente no somatório é nula. Logo, podemos escrever (note o índice
do somatório!):
Mas nesse somatório temos as probabilidades de uma distribuição binomial com parâmetros (n −1) e
p; como estamos somando as probabilidades de todos os pontos do espaço amostral, segue que esse
somatório é igual a 1 (note que essa é a expressão do binômio de Newton para (x+y)n−1 com x = p e y = 1
− p) e, portanto,
Variância
Vamos calcular E (X2) . Usando raciocínio análogo ao usado no cálculo da esperança, temos que:
79
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Mas o primeiro somatório é a esperança de uma binomial com parâmetros (n − 1) e p; portanto, pelo
resultado (2.20), é igual a (n − 1) p. Já o segundo somatório é a soma das probabilidades dos valores de
uma binomial com esses mesmos parâmetros (ou binômio de Newton); logo, é igual a 1.
Segue, então, que
e, portanto,
ou seja,
Exemplos
1. Um atirador acerta na mosca do alvo, 20% dos tiros. Se ele dá 10 tiros, qual a probabilidade de ele
acertar na mosca no máximo 1 vez?
Solução:
80
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Vamos fazer agora algumas comparações entre as distribuições binomial e hipergeométrica.
Colocando ambas em termos de extrações de bolas verdes de uma urna com bolas verdes e brancas, a
binomial equivale a extrações independentes com reposição. Note que, repondo as bolas, a probabilidade
de sucesso (isto é, bola verde) permanece constante ao longo das extrações. Já a hipergeométrica
corresponde a extrações sem reposição.
Exemplo
1. Um caçador, após um dia de caça, verificou que matou 5 andorinhas e 2 aves de uma espécie rara,
proibida de ser caçada. Como todos os espécimes tinham o mesmo tamanho, ele os colocou na mesma
bolsa, pensando em dificultar o trabalho dos fiscais. No posto de fiscalização há dois fiscais, Manoel e
Pedro, que adotam diferentes métodos de inspeção. Manoel retira três espécimes de cada bolsa dos
caçadores. Pedro retira um espécime, classifica-o e o repõe na bolsa, retirando em seguida um segundo
espécime. Em qualquer caso, o caçador é multado se é encontrado pelo menos um espécime proibido.
Qual dos dois fiscais é mais favorável para o caçador em questão?
Solução:
Seja X = número de aves proibidas (sucessos) encontradas por um fiscal. No caso de Manoel, temos
que X ∼ hiper(7; 2; 3) e no caso do fiscal Pedro, X ∼ bin
Logo, a probabilidade de multa é maior no caso do fiscal Manoel, e, portanto, Pedro é o fiscal mais
favorável para o caçador.
A distribuição de Poisson
81
1678859 E-book gerado especialmente para DANIEL CRISTIAN
H1) Em um intervalo de tempo suficientemente curto, apenas 0 ou 1 evento ocorre, ou seja, 2 ou mais
ocorrências não podem acontecer simultaneamente. Então, em cada um desses intervalos temos um
experimento de Bernoulli.
H2) A probabilidade de exatamente 1 ocorrência nesse pequeno intervalo de tempo, de comprimento
Δt, é proporcional a esse comprimento, ou seja, é λΔt. Logo, a ocorrência de nenhum evento é 1 − λΔt.
H3) As ocorrências em intervalos pequenos e disjuntos são experimentos de Bernoulli independentes.
Estamos interessados na v.a. X = número de ocorrências do evento no intervalo (0, t]. Particionando
esse intervalo em n pequenos subintervalos de comprimento Δt, temos que o número total de ocorrências
será a soma do número de ocorrências em cada subintervalo. Mas em cada subintervalo podemos aplicar
Para mostrar que realmente define uma fdp, temos que provar que , temos que:
Esperança e variância
Vamos agora calcular a esperança e a variância de tal distribuição.
82
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Logo,
Logo,
ou
A distribuição de Poisson
Vamos apresentar, agora, a definição geral da distribuição de Poisson, usando uma outra
parametrização.
Diz-se que a v.a. X tem distribuição de Poisson com parâmetro μ se sua fdp é dada por
83
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Exemplo
1. Uma central telefônica recebe uma média de 5 chamadas por minuto. Supondo que as chamadas
que chegam constituam uma distribuição de Poisson, qual é a probabilidade de a central não receber
nenhuma chamada em um minuto? e de receber no máximo 2 chamadas em 2 minutos?
Solução:
Seja X = número de chamadas por minuto. Então, X ∼ P oi(5). Logo,
Questões
01. Joga-se um dado equilibrado. Qual é a probabilidade de serem necessários 10 lançamentos até a
primeira ocorrência de um seis?
(A) 0,0323
(B) 0,0677
(C) 0,0548
(D) 0,0452
(E) 0,0125
02. Dois adversários A e B disputam uma série de 8 partidas de um determinado jogo. A probabilidade
de A ganhar uma partida é 0,6 e não há empate. Qual é a probabilidade de A ganhar a série?
(A) 24,5%
(B) 59,4%
(C) 36%
(D) 48%
(E) 20%
03. Joga-se uma moeda não viciada. Qual é a probabilidade de serem obtidas 5 caras antes de 3
coroas?
(A) 35%
(B) 77,3%
(C) 65%
(D) 50%
(E) 22,7%
04. Entre os 16 programadores de uma empresa, 12 são do sexo masculino. A empresa decide sortear
5 programadores para fazer um curso avançado de programação. Qual é a probabilidade dos 5 sorteados
serem do sexo masculino?
(A) 18,13%
(B) 50%
(C) 75%
(D) 25,45%
(E) 74,55%
05. Em um certo tipo de fabricação de fita magnética, ocorrem cortes a uma taxa de um corte por 2000
pés. Qual é a probabilidade de que um rolo com comprimento de 4000 pés apresente no máximo dois
cortes? Pelo menos dois cortes?
(A) 0,676676 e 0,593994
(B) 0,323324 e 0,406006
(C) 0,5 e 0,5
84
1678859 E-book gerado especialmente para DANIEL CRISTIAN
(D) 0,125885 e 0,365896
(E) 0,478963 e 0,258963
Comentários
01. Resposta: A.
Nesse caso, sucesso é a ocorrência de face seis. Logo, Pr(sucesso) = p = e Pr(fracasso) =
1−p= Seja X = número de lançamentos até primeiro seis. Então, X ∼ geom e o problema pede
Pr (X = 10) = = 0, 03230.
02. Resposta: B.
Note que só podem ocorrer vitórias ou derrotas, o que significa que temos repetições de um
experimento de Bernoulli com probabilidade 0,6 de sucesso (vitória). Assumindo a independência das
provas, se definimos X = número de vitórias de A, então X ∼ bin(8; 0, 6) e o problema pede Pr (X ≥ 5) ,
isto é A ganha mais partidas que B.
03. Resposta; E.
Vamos definir sucesso = cara e fracasso = coroa. Então, Pr(sucesso) = Pr(fracasso) = 0, 5 e temos
repetições de um experimento de Bernoulli. A ocorrência de 5 sucessos antes de 3 fracassos só é possível
se nas 7 primeiras repetições tivermos pelo menos 5 sucessos. Seja, então, X = número de sucessos em
7 repetições. Logo, X ∼ bin(7; 0, 5) e o problema pede Pr(X ≥ 5).
04. Resposta: A.
Sucesso = sexo masculino. Se X = número de homens sorteados, então X ∼ hiper(16; 12; 5) e o
problema pede
05. Resposta: A.
Seja Y = número de cortes num rolo de 4000 pés. Então, Y ∼ P oi(2).
85
1678859 E-book gerado especialmente para DANIEL CRISTIAN
10 - Noções de amostragem e inferência estatística.
AMOSTRAGEM
Amostragem é um técnica especial para recolher amostras, que garante, tanto quanto possível, o
acaso na escolha.
AMOSTRAGEM PROBABILÍSTICA
Amostragem casual ou aleatória simples: este tipo de amostragem se assemelha ao sorteio lotérico.
Ela pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um
dispositivo aleatório qualquer, k números dessa sequência, os quais serão pertentes à amostra.
Exemplo: 15% dos alunos de uma população de notas entre 8 e 10, serão sorteados para receber uma
bolsa de estudos de inglês.
Vantagens Desvantagens
- Facilidade de cálculo estatístico; - Requer listagem da população;
- Probabilidade elevada de compatibilidade - Trabalhosa em populações elevadas;
dos dados da amostra e da população. - Custos elevados se a dispersão da amostra
for elevada.
86
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Exemplo: Supondo que dos noventa alunos de uma escola, 54 sejam meninos e 36 sejam meninas
vamos obter a amostra proporcional estratificada de 10% desta população.
Temos dois estratos: sexo masculino e feminino.
57 28 92 90 80 22 56 79 53 18 53 03 27 05 40
Eliminamos os números maiores que 90 e os números repetidos.
87
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Assim temos:
28 22 53 18 03 – para os meninos;
57 90 80 56 – para as meninas.
Vantagens Desvantagens
- Pressupõe um erro de amostragem menor; - Necessita de maior informação sobre a
- Assegura uma boa representatividade das população;
variáveis estratificadas; - Cálculo estatístico mais complexo.
- Podem empregar-se metodologias diferentes
para cada estrato;
- Fácil organização do trabalho de campo.
O mapa mostra os conglomerados selecionados (neste caso os municípios), que apresentaram a maior
proporção de casos de dengue confirmados no Estado de São Paulo até março de 2015.
Vantagens Desvantagens
- Não existem listagem de toda a população; - Maior erro de amostragem;
- Concentra os trabalhos de campo num - Cálculo estatístico mais complexo na
número limitado de elementos da população. estimação do erro de amostragem.
AMOSTRAGEM NÃO-PROBABILÍSTICA
Amostragem por cotas: consiste em uma amostragem por julgamento que ocorre em suas etapas.
Em um primeiro momento, são criadas categorias de controle dos elementos da população e, a seguir,
selecionam-se os elementos da amostra com base em um julgamento.
Amostragem por conveniência: é uma amostra composta de indivíduos que atendem os critérios de
entrada e que são de fácil acesso do investigador. Para o critério de seleção arrolamos uma amostra
consecutiva.
88
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Exemplo: Em uma pesquisa sobre dengue, arrolar os 200 pacientes que receberam diagnostico em
um hospital.
Vantagens Desvantagens
- Mais econômica; - Maior erro de amostragem que em amostras
- Fácil administração; aleatórias;
- Não necessita de listagem da população. - Não existem metodologias válidas para o
cálculo do erro de amostragem;
- Limitação representativa;
- Maior dificuldade de controle de trabalho de
campo
Tamanho da Amostra
O tamanho da amostra deve ser determinado antes de se iniciar a pesquisa.
Deve-se usar a maior amostra possível, pois quanto maior a amostra, maior a representatividade da
população. Amostras menores possuem resultados menos precisos.
É muito importante usarmos amostras de tamanhos adequados, para que os dados tenham maior
confiabilidade e precisão.
Consideramos:
Erros de amostragem
Diferença randômica(aleatória) entre a amostra e população da qual a amostra foi retirada. O tamanho
do erro pode ser medido em amostras probabilísticas, expressa como “erro padrão” (ou precisão) de
média, proporção entre outros.
Erro padrão da média: é usado para estimar o desvio padrão da distribuição das médias amostrais,
tanto para populações finitas ou infinitas (será abordado em medidas de dispersão).
Referências
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2004.
SILVA, Ermes Medeiros, Elio Medeiros...- Estatística para os cursos de: Economia, Administração, Ciências Contábeis - 3ª edição – São Paulo – Editora Atlas
S. A: 1999.
DORA, Filho U – Introdução à Bioestatística para simples mortais – São Paulo – Elsevier: 1999.
http://www.andremachado.org
Questões
01. (TRT/MG – Analista Judiciário – FCC) O objetivo de uma pesquisa era o de se obter,
relativamente aos moradores de um bairro, informações sobre duas variáveis: nível educacional e renda
familiar. Para cumprir tal objetivo, todos os moradores foram entrevistados e arguídos quanto ao nível
educacional, e, dentre todos os domicílios do bairro, foram selecionados aleatoriamente 300 moradores
para informar a renda familiar. As abordagens utilizadas para as variáveis nível educacional e renda
familiar foram, respectivamente,
(A) censo e amostragem por conglomerados.
(B) amostragem aleatória e amostragem sistemática.
(C) censo e amostragem casual simples.
(D) amostragem estratificada e amostragem sistemática.
(E) amostragem sistemática e amostragem em dois estágios.
89
1678859 E-book gerado especialmente para DANIEL CRISTIAN
(D) amostragem sistemática
(E) amostragem por cotas
03. (MTur – Estatístico – ESAF) Com relação à amostragem, pode-se afirmar que:
(A) na amostragem por quotas, tem-se uma amostra não probabilística na qual divide-se a população
em subgrupos e determina-se uma quota (proporcional) a cada subgrupo. A seleção dos objetos
individuais obedece o critério de uma amostra sistemática.
(B) na amostragem estratificada, divide-se a população em grupos (ou classes, ou estratos), de modo
que os elementos pertencentes ao mesmo estrato sejam o mais heterogêneos possível com respeito à
característica em estudo. Para cada grupo toma-se uma subamostra pelo procedimento a.a.s., e a
amostra global é o resultado da combinação das subamostras de todos os estratos
(C) na amostragem por conglomerados, seleciona-se primeiro, ao acaso, grupos (conglomerados) de
elementos individuais da população. A seguir, toma-se ou todos os elementos ou uma subamostra de
cada conglomerado. Nos conglomerados, as diferenças entre eles devem ser tão grandes quanto
possível, enquanto as diferenças dentro devem ser tão pequenas quanto possível.
(D) na amostragem por quotas, tem-se uma amostra probabilística na qual divide-se a população em
subgrupos e determina-se uma quota (proporcional) a cada subgrupo. A seleção dos objetos individuais
é por sorteio.
(E) na amostragem sistemática, toma-se cada k-ésima unidade da população previamente ordenada,
em que k é a razão de amostragem. O procedimento deve começar ao acaso, sorteando-se um número
entre 1 e k.
04. (TJ-ES – Analista Jurídico – CESPE) No que concerne aos planos amostrais, julgue os itens a
seguir.
Respostas
01. Resposta: C.
Vide a definição apresentada em nosso material.
02. Resposta: B.
Amostragem por conglomerado: é uma amostra aleatória de agrupamentos naturais de indivíduos
(conglomerados) na população. Dividimos em seções a área populacional, selecionamos aleatoriamente
algumas dessas seções e tomamos todos os elementos das mesmas.
03. Resposta: E.
Escolher cada elemento de ordem k. Assemelha-se à amostragem aleatória simples, porque
inicialmente enumeram-se as unidades da população. Mas difere da aleatória porque a seleção da
amostra é feita por um processo periódico pré-ordenado. Os elementos da população já se acham
ordenados, não havendo necessidade de construir um sistema de referência.
INFERÊNCIA
Inferência estatística é um ramo da Estatística cujo objetivo é fazer afirmações a partir de um conjunto
de valores representativo (amostra) sobre um universo. Tal tipo de afirmação deve sempre vir
acompanhada de uma medida de precisão sobre sua veracidade. Para realizar este trabalho o estatístico
coleta informações de dois tipos, experimentais (as amostras) e aquelas que obtém na literatura. As duas
principais escolas de inferência são a inferência frequentista (ou clássica) e a inferência bayesiana. A
inferência estatística é geralmente distinta da estatística descritiva. A descrição estatística pode ser vista
como a simples apresentação dos fatos, nos quais o modelo de decisões feito pelo analista tem pouca
90
1678859 E-book gerado especialmente para DANIEL CRISTIAN
influência. É natural que análises estatísticas avancem, indo da descrição para a inferência de padrões.
Essa última tarefa depende do modelo usado e/ou criado pelo analista dos dados.
Inferência bayesiana é um tipo de inferência estatística que descreve as incertezas sobre quantidades
invisíveis de forma probabilística. Incertezas são modificadas periodicamente após observações de novos
dados ou resultados. A operação que calibra a medida das incertezas é conhecida como operação
bayesiana e é baseada na fórmula de Bayes. A fórmula de Bayes é muitas vezes denominada Teorema
de Bayes.
Em teoria da probabilidade o Teorema de Bayes mostra a relação entre uma probabilidade condicional
e a sua inversa; por exemplo, a probabilidade de uma hipótese dada a observação de uma evidência e a
probabilidade da evidência dada pela hipótese. Esse teorema representa uma das primeiras tentativas de
modelar de forma matemática a inferencia estatística, feita por Thomas Bayes (pronunciado /ˈbeɪz/ ou
"bays"). O teorema de Bayes é um corolário do teorema da probabilidade total que permite calcular a
seguinte probabilidade:
A regra de Bayes mostra como alterar as probabilidades a priori tendo em conta novas evidências de
forma a obter probabilidades a posteriori. Podemos aplicar o Teorema de Bayes com o jogo das três
portas. Alguns preferem escrevê-lo na forma:
91
1678859 E-book gerado especialmente para DANIEL CRISTIAN
Questão
01. Considerando a tabela
Calcule o índice ponderado para preços, empregando a fórmula de Laspeyres e tomando 1993 = 100.
Resposta
Temos:
= 1,625 ou 162,5%.
92
1678859 E-book gerado especialmente para DANIEL CRISTIAN