Você está na página 1de 134

CURSO BÁSICO DE ESTATÍSTICA INFERENCIAL

# Conceitos Iniciais Imprescindíveis


A prova não vai lhe perguntar o que é a Estatística, mas convém que saibamos que ela é
um ramo da matemática, e que trabalha com elementos de pesquisa ou com modelos
probabilísticos.
Como nosso alvo é a Estatística Básica, a maior parte do nosso trabalho será focado nos
elementos de pesquisa, ficando os tais modelos probabilísticos (Distribuição Binomial e
Distribuição Normal) para o final do nosso Curso. Daí, por hora, basta ficarmos com a ideia de
que trabalharemos com elementos de pesquisa.
Como é isso?
o? Por exemplo: suponhamos que há uma sala com duzentas pessoas, e eu
pretendo realizar uma pesquisa, para saber qual a idade de cada uma delas. Ora, como não
tenho bola de cristal, o jeito será perguntar, de uma por uma: Quantos anos você tem? Já
pensaram,, que pergunta deselegante...
Mas é o jeito! Para eu trabalhar com elementos de pesquisa, o primeiro e inevitável passo
será a coleta dos dados.
Pois bem, eu acabei de questionar aquelas duzentas pessoas e já estou de posse das
respostas que cada uma delas
las me passou. Ok? Vejamos algumas dessas respostas:
{28 anos, 35 anos, 17 anos, 14 anos, 22 anos, 31 anos, 45 anos, ...}
Facilmente se vê que esses dados estão desordenados, uma vez que acabaram de ser
recebidos (coletados) e ainda não foram submetidos a nenhuma espécie de organização. São os
chamados dados brutos!
É fácil supor que, se pretendo fazer uma análise, um estudo mais aprofundado desses
elementos, será imprescindível que os organizemos. Claro! Será mais fácil trabalhar com os
dados organizadoss que com dados brutos.
Organizar os dados é, portanto, a segunda etapa do processo estatístico!
estatístico
A forma mais básica de organização dos dados é o conhecido rol,
rol o qual consiste, tão
somente, em um arranjo dos dados brutos em ordem crescente ou decrescente.
decrescent Normalmente,
em prova, o rol vem com dados em ordem crescente!
Tomando aqueles dados brutos e os transformando em rol, teremos:
{14 anos, 17 anos, 22 anos, 28 anos, 31 anos, 35 anos, 45 anos, ...}
O rol não é a única maneira de organização dos dados. É apenas uma delas, a mais
simples!
Uma vez que estivermos com os elementos da pesquisa, coletados e organizados, será
conveniente descrevê-los.. Descrever os dados é o mesmo que apresentá-los.
apresentá E isso poderá ser
feito também de várias formas. Poderemos apresentar
apresentar os dados por meio de uma tabela, por
meio de um gráfico, ou outra qualquer.
O fato é que, ao concluirmos essas três fases iniciais do processo estatístico – coleta,
organização e descrição dos dados – somente então estaremos aptos a passar às duas etapas
finais, que consistem em proceder à análise dos elementos para, enfim, chegarmos a uma
conclusão ou tomada de decisão.
decisão
Obviamente que a Estatística não se prestará a um objetivo tão pobre como o de
meramente coletar dados de pesquisa para dispô-los
dispô numa tabela. Claro que não! O alcance da
Estatística é maior: aqueles elementos servirão a uma análise, porque, ao final, queremos chegar
a uma conclusão! Existe uma decisão a ser tomada, e o será com base na conclusão a qual a
análise dos dados nos conduzir!
ir!

1 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
A Estatística está na vida das pessoas, muito mais do que elas imaginam!
Não há um só medicamento vendido nas farmácias que não tenha sido submetido a
rigorosos controles estatísticos! Antes de virar “remédio”, aquela droga foi testada um zilhão de
vezes. Primeiro em bichos e depois em gente. E foram anotados os efeitos colaterais causados
pela droga, em cada uma das vezes que elas foram tomadas pelos pacientes. Esses dados foram
analisados, para gerar uma conclusão. Aquela substância só se transforma
transforma em medicamento e
chega às prateleiras se a conclusão for satisfatória e os riscos estiverem dentro de um padrão
aceitável.
Esse é apenas um minúsculo exemplo. São milhares deles!
Os autores costumam classificar a Estatística em Descritiva e Inferencial.
Inferencia Nossa
memorização passará pelo alfabeto: neste, o D vem antes do I. Assim, a Estatística Descritiva
(a do D) englobará as etapas iniciais do processo estatístico, quais sejam, a coleta, a organização
e a descrição dos dados. Já a Estatística Inferencial (a do I), se encarregará da análise dos
dados e tomada de decisão, que são as etapas finais do processo.
Ficou fácil: a Estatística do D vem antes da Estatística do I.
Pode-se
se resumir as três etapas da Estatística Descritiva em uma única palavra: síntese!
Daí, coletar os dados, organizá--los e descrevê-los
los é o mesmo que fazer a síntese dos dados. Ok?
Voltemos àquele exemplo inicial, das duzentas pessoas na sala. Minha pesquisa é sobre a
idade de cada uma delas. Ora, se eu tiver tempo e paciência para extrair
extrair a informação de todas
as pessoas da sala, estarei trabalhando com a população inteira. População, na Estatística, é,
pois, o conjunto universo do qual extraímos a informação! No exemplo da sala, aquelas duzentas
pessoas serão a população!
E se trabalho com a população inteira, estarei fazendo um estudo estatístico chamado
censo!! Ou seja, o censo é uma forma de fazer uma pesquisa estatística, em que todos os
elementos da população são consultados!
Mas se eu considerar que duzentas pessoas é muita gente, e que eu perderia muito tempo
e dinheiro para coletar os dados de todos eles, haveria uma outra forma possível para
trabalharmos? Sim! Ao invés de usarmos toda a população para coletar as respostas,
escolheremos apenas uma parte menor dela, um subgrupo, que terá o poder de representá-la
representá por
inteiro.
Suponhamos, então, que eu decidi fazer a pergunta a apenas cinqüenta pessoas. Esse
grupo menor será chamado de amostra,, e estaremos realizando um estudo estatístico por
amostragem.
Atentemos para o fato de que amostra
amostra não é meramente um pedaço menor da população!
Não é só isso! A característica fundamental da amostra é a da representatividade! Claro! Não
adiantaria eu escolher uma única pessoa e perguntar a sua idade. Essa única resposta,
certamente, não teria o poder
oder de representar a população toda. Não poderíamos estender à
população uma conclusão oriunda de um subgrupo não-significativo.
não significativo. Concordam?
Daí, uma pergunta: Mas, professor, qual seria o número mínimo de elementos de uma
população que poderia ser adotado,
adotado para que possamos considerá--lo uma amostra? Boa
pergunta! Existem cálculos para isso! E os veremos, oportunamente!
Por enquanto, basta-nos
nos saber que de um lado existe a população, e esta relaciona-se
relaciona
com o conceito de censo; de outro lado existe a amostra,
amostra, relacionada com o conceito de
amostragem! Ok?
Mais adiante, numa próxima aula, veremos como o conhecimento desses dois conceitos
tem sido exigido em questões de provas recentes, envolvendo cálculos e tudo mais! (E veremos
como é um negócio fácil...)
Se eu estudei a idade das pessoas daquela sala, então a minha variável estatística era
idade. Se eu for estudar peso, a variável será o peso. Se eu for estudar a religião praticada pelas
pessoas, essa será a variável. Em suma, variável estatística é o objeto do estudo!

2 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Podemos classificar as variáveis estatísticas em variáveis quantitativas e em variáveis
qualitativas.
Serão quantitativas quando lhes pudermos atribuir um valor numérico. Qual a sua idade?
A resposta é um número? Sim! Então, idade é uma variável quantitativa. Quantos livros você lê
por ano? A resposta é um número? Sim! Então, número de livros lidos por ano é uma variável
quantitativa. Por outro lado, se pergunto qual a sua cor preferida, a resposta não é um valor
numérico. Logo, a variável será dita
d qualitativa.
Essa primeira classificação é bem simples. Concordam? Existe ainda uma subclassificação!
Variáveis Quantitativas poderão ser ditas discretas ou contínuas..
Serão variáveis quantitativas discretas (também chamadas descontínuas)
descontínuas aquelas que
forem obtidas por um processo de contagem. Se para responder à pergunta “Quantas pessoas
moram na sua casa?” você precisa fazer uma contagem, então estamos diante de uma variável
discreta.
Já as variáveis contínuas são aquelas obtidas por um processo de medição!
me Se alguém
perguntar o seu peso, você precisará subir numa balança e medir. Assim, peso é uma variável
contínua.
Essas dicas – contagem para variável discreta e medição para variável contínua – são
conceitos mnemônicos, ou seja, usados para auxiliar a memorização. E os conceitos formais,
quais seriam? Vamos aprender por meio de dois exemplos.
Considere a reta abaixo, formada por resultados possíveis à pergunta “Quantas pessoas
moram na sua casa?” Teremos:

1 2 3 4 5 6 7 8 9 ...

Ora, sejam quantas forem as pessoas entrevistadas, todas as respostas recairão sempre
sobre os valores inteiros (1, 2, 3, 4, 5 etc). Ou seja, jamais alguém poderá dizer que moram 3,75
pessoas em sua casa! Concordam?
Por isso dizemos que a variável discreta
discreta é também chamada variável descontínua. Porque
entre um resultado possível e outro existe uma descontinuidade. Certo?
Agora, consideremos a seguinte reta de resultados possíveis abaixo, e que estejamos
investigando o peso de um grupo de pessoas. Vejamos:
Vejamos

10 20 30 40 50 60 70 80 90 ...

Poderia alguém responder que pesa 64,325kg? Claro! Observamos facilmente que para
esta variável não há qualquer descontinuidade entre um resultado possível e outro! Ou seja, a
variável contínua pode assumir qualquer resultado.
Esses conceitos – variável discreta e variável contínua – bem como a quase totalidade dos
demais conceitos estudados nesta aula inaugural, não têm sido cobrados nas provas mais
recentes da Esaf. Costumavam
ostumavam sê-lo,
sê lo, e muito, em provas mais antigas. Sendo assim, por que
temos que estudá-los?
los? Primeiramente, porque ainda continuam presentes nos programas atuais.
E depois porque não há, simplesmente, como saltar esse conhecimento básico. Ele terá, sim, suasu
utilidade, como veremos ao longo das aulas.
Constarão de qualquer programa de Estatística Básica de concurso tópicos como Medidas
de Posição, Medidas Separatrizes, Medidas de Dispersão, Medidas de Assimetria, Medidas de
Curtose, entre outros. Ora, estudaremos
estudaremos o que significa e como se calcula cada uma dessas
medidas! O que precisamos saber é que todos esses cálculos serão realizados com base nos
dados de um determinado conjunto.

3 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Chegamos ao ponto: a maneira mais usual de um conjunto de dados ser apresentado
apresen em
uma prova qualquer é por meio de uma tabela, que receberá o nome de Distribuição de
Frequências!
Voltemos ao exemplo daquela sala de aula, com duzentas pessoas, e eu quero saber agora
quantos livros cada um lê por ano. Pois bem, para simplificar minha
minha vida, eu posso estabelecer
alguns intervalos,, que representarão as respostas daquelas pessoas. Por exemplo: pessoas que
lêem de 0 a 5 livros por ano (cinco exclusive!); que lêem de 5 a 10 livros por ano (dez
exclusive!); que lêem de 10 a 15 (quinze exclusive!);
exclusive!); e de 15 a 20. Colocando essas classes de
resultados numa coluna da tabela, teremos:
Classes fi
(número de livros (pessoas)
lidos por ano)
0 !--- 5
5 !--- 10
10 !--- 15
15 !--- 20
Total

Para complementar a tabela, agora eu pedirei: “Por gentileza, pessoas que lêem entre
zero e quatro livros por ano, levantem a mão!” Percebam que nesse momento se fará um silêncio
constrangedor... e todos meio com vergonha de erguer a mão e revelar que não são leitores
assim tão assíduos como gostariam de ser... Mas aí eu insisto: “Vamos lá, minha gente! É só para
eu preencher a tabela...” Resultado: 108 corajosas (e preguiçosas) pessoas ergueram a mão.
Repetindo a pergunta para leitores de cinco a nove livros
livros por ano, 72 pessoas se pronunciaram.
Nova pergunta, agora para o intervalo de 10 a 14 livros, e apenas 18 pessoas ergueram o braço.
Finalmente, na última pergunta, duas míseras pessoas (o que é diferente de duas pessoas
míseras!), levantaram a mão.
Informando
ormando o resultado desta pesquisa na tabela, teremos o seguinte:

Classes fi
(número de livros (pessoas)
lidos por ano)
0 !--- 5 108
5 !--- 10 72
10 !--- 15 18
15 !--- 20 2
Total 200

Pronto, meus amigos! Estamos diante de uma Distribuição de Frequências! Trata-se,


portanto, de uma tabela que retratará o resultado de uma pesquisa realizada. A característica
marcante da Distribuição de Frequências
Frequências é que a variável estudada estará subdivida
subdivi em classes!
Dedicaremos o restante desta aula inteira a conhecer e a dissecar uma Distribuição de
Frequências!
s! Exploraremos ao máximo essa tabela, pois ela se tornou, por assim dizer, a alma de
uma prova de Estatística Básica! Saber trabalhar com uma Distribuição de Frequências é meio
caminho andado para se fazer uma boa prova!
No sentido inverso, se você não tiver desenvoltura para trabalhar com a Distribuição,
estará em maus lençóis na hora da prova! Ok?
A Distribuição de Frequências
Frequência é nada mais que uma tabela, por meio da qual
conheceremos o resultado de uma pesquisa realizada.

4 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
O exemplo mostrado na aula de apresentação contemplava um grupo de duzentas pessoas
que seriam questionadas sobre o número de livros que cada uma delas lêem por ano.
(Lembrados?) Assim, o resultado desta enquete foi transcrito para uma tabela, e apresentado da
forma seguinte:
Classes fi
(número de livros (pessoas)
lidos por ano)
0 !--- 5 108
5 !--- 10 72
10 !--- 15 18
15 !--- 20 2
Total 200

Pronto, meus amigos! Estamos diante de uma Distribuição de Frequências! Trata-se,


portanto, de uma tabela que retratará o resultado de uma pesquisa realizada. A característica
marcante da Distribuição de Frequências
Frequências é que a variável estudada estará subdivida
subdivi em classes!
As classes serão, portanto, as subdivisões da nossa variável. É um conceito intuitivo.
Basta olharmos, e concluímos que essa Distribuição acima possui quatro classes:
1ª Classe) Pessoas que lêem entre zero e cinco livros por ano;
2ª Classe) Pessoas que lêem entre cinco e dez livros por ano;
3ª Classe) Pessoas que lêem entre dez e quinze livros por ano;
4ª Classe) Pessoas que lêem entre quinze e vinte livros por ano;
Observem que cada classe será margeada por dois limites, chamados
hamados respectivamente de
limite inferior (linf) e limite superior (lsup).
Esses limites são justamente os valores que você está enxergando no início e no fim de
cada classe. Assim, teremos que:
1ª Classe) linf=0 e lsup=5
2ª Classe) linf=5 e lsup=10
=
3ª Classe) linf=10 e lsup=15
4ª Classe) linf=15 e lsup=20
Facilmente vocês já observaram que onde acaba uma classe, começa a próxima! próxima Não é
verdade? Ou seja, o limite superior de uma classe é igual ao limite inferior da classe seguinte.
Agora uma pergunta interessante, a qual você deverá tentar responder apenas olhando
para a tabela. Ok? Uma pessoa que lê exatamente 10 (dez) livros por ano entrará na contagem
da segunda classe ou da terceira? Veja a tabela novamente:
Classes fi
(número de livros (pessoas)
lidos por ano)
0 !--- 5 108
5 !--- 10 72
10 !--- 15 18
15 !--- 20 2
Total 200

Vemos que 10 é limite superior da segunda classe e inferior da terceira. Mas, e aí? Quem
lê 10 livros participará de qual das classes, segunda ou terceira?

5 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Para responder a essa pergunta, precisamos conhecer o significado de intervalo de
classe!! E esse conceito será definido com base no símbolo que estiver presente entre os limites
da classe.
No caso do exemplo acima, o símbolo presente é este: !----
Essa simbologia tem um significado. Ampliemos o símbolo para explicarmos melhor:

Linf Lsup

A presença do tracinho vertical no lado do limite inferior significa que ele estará incluído
no intervalo de classe. Falamos em intervalo fechado à esquerda.
A ausência do tracinho vertical no lado do limite superior quer dizer que este limite estará
excluído
uído do intervalo! Falaremos em intervalo aberto à direita.
Daí, se analisarmos a segunda classe, teremos:

5 10

Esta classe possui como limites os valores 5 e 10. Porém, uma pessoa que lê exatamente
10 (dez) livros não entrará na contagem desta segunda classe, uma vez que 10 é limite superior
desta classe, e aqui temos que o intervalo é aberto à direita.. Ou seja, o limite superior está
excluído desta contagem, embora faça parte da classe como um de seus
seus limites!
Você conclui: classe é uma coisa; intervalo de classe é outra. Quem define o intervalo é a
simbologia que separa os limites das classes.
Este símbolo que vimos acima (ı----)
( ) é aquele com o qual trabalharemos sempre! É, por
assim dizer, a simbologia
bologia clássica!
Trabalharemos sempre com essa consideração: intervalo fechado à direita e aberto à
esquerda.
E por que será sempre assim? Porque nossa elaboradora, a Esaf, considera que em uma
Distribuição de Frequências,
s, trabalha-se
trabalha sempre com variáveis
is contínuas!
contínuas
Todos lembrados do que é uma variável contínua?
? É aquela que pode assumir qualquer
resultado. Em outras: entre um resultado possível e outro, não pode haver qualquer
descontinuidade.
E se não pode haver descontinuidade entre resultados possíveis da variável, faz-se
faz
necessário que onde termine uma classe, comece a próxima.
Alguém dirá: mas professor, número de livros lidos por ano é uma variável discreta! Sim.
Eu sei que é. Eu só usei essa variável para ilustrar o que é uma Distribuição de Frequências. Não
fui muito rigoroso com o exemplo. Ok?
Mas na prova, para efeito de uma questão teórica, fica valendo o seguinte: na Distribuição
de Frequências,
s, trabalhamos com variáveis contínuas!
Outras simbologias há na definição de outros tipos de intervalos de classe. Como não são
de nosso interesse, não trataremos a seu respeito.
O próximo elemento que estudaremos é a amplitude da classe.classe Um conceito muito
simples. Amplitude será, para nós, sinônimo de tamanho. Amplitude da classe será, portanto, o
tamanho da classe. Representaremos esse conceito com a letra h (minúscula).

6 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Observando a nossa tabela, percebemos facilmente que todas as classe apresentam a
mesma amplitude (o mesmo tamanho). Senão, vejamos:
Classes
0 !--- 5 h=5
5 !--- 10 h=5
10 !--- 15 h=5
15 !--- 20 h=5

Pergunta: é obrigatório que todas as classes tenham a mesma amplitude? Não! Não é
obrigado!! Mas é isso é algo esperado. A quase totalidade das Distribuições de Frequência trazidas
em provas usa classes de mesma amplitude. Mas isso não é uma regra. É apenas o usual. Na
prova do AFRF de 2005, por exemplo, a Esaf inovou e apresentou uma Distribuição em que nem
todas as classes possuíam a mesma amplitude.
Oportunamente veremos os efeitos, na resolução das questões, do fato de estarmos
diante de uma Distribuição de Frequência com classes de amplitudes diversas. Ok? A rigor, não
muda quase nada.
Falemos agora sobre o chamado Ponto Médio.. O que vem a ser? Ora, Ora o nome é
sugestivo: Ponto Médio (PM) é aquele valor que está rigorosamente no meio da classe. Cada
classe possui, portanto, seu próprio Ponto Médio. Às vezes é possível determinar o PM de uma
classe, só de olhar para ela. É o caso do nosso exemplo. Vejamos:
Vejamos: qual é o valor que está
exatamente entre 0 e 5? É 2,5. Concordam? Claro!
Daí, 2,5 é o PM da primeira classe.
Mas se tivéssemos uma classe com os seguintes limites: 19,5 !---
! 24,5. Pode ser que não
seja assim tão imediata a determinação desse PM.
Assim,
sim, calcularemos o PM da classe somando seus limites, e dividindo esse resultado por
dois. Ou seja: PM=(Linf+Lsup)/2.
PM=(Linf+Lsup)/2
Assim, para a classe 19,5 !---
! 24,5 , teríamos: PM=(19,5+24,5)/2=22.
Só isso! Agora voltemos a nossa Distribuição de Frequências,
s, e construamos
con a coluna dos
Pontos Médios. Teremos:
Classes PM
0 !--- 5 2,5
5 !--- 10 7,5
10 !--- 15 12,5
15 !--- 20 17,5

Alguém conseguiu observar uma relação qualquer entre os Pontos Médios? Sim? Vemos
que a diferença entre dois pontos médios consecutivos foi sempre igual a uma constante.
Perceberam? Ou dito de outra forma: o próximo Ponto Médio é sempre igual ao anterior somado
s
a uma constante.
Neste caso, essa constante é 5. Ora, onde foi mesmo que vimos esse valor 5? Foi este
também o valor da amplitude das classes!
Concluiremos assim: sempre que todas as classes de uma Distribuição de Frequências
tiverem a mesma amplitude (mesmo h), ), observaremos que o próximo Ponto Médio será igual
ao anterior somado àquela amplitude.
É este o primeiro atalho do nosso Curso! Um bem simples, é verdade, mas não deixa de
ser um atalho! Assim, na hora de construirmos a coluna dos Pontos Médios, a primeira coisa a
observar é se todas as classes têm a mesma amplitude. Se for o caso, você irá apenas descobrir
o valor do primeiro Ponto Médio (o PM da primeira classe).

7 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Daí, basta sair somar este PM com o h e prosseguir realizando essa mesma operação, até
chegar à última classe. No nosso exemplo, sabemos que h=5,
=5, logo, teremos:
Classes PM
0 !--- 5 2,5 1º PM, calculado!
5 !--- 10 (2,5+5) = 7,5
10 !--- 15 (7,5+5) = 12,5
15 !--- 20 (12,5+5)= 17,5

Pois bem! Já conhecemos quais os elementos de uma Distribuição de Frequências. Agora


precisamos saber por que essa tabela é chamada assim. O que vêm a ser essas tais frequências?
É sobre isso que falaremos a seguir.
Comecemos repetindo a tabela do nosso exemplo:
Classes fi
(número de livros (pessoas)
lidos por ano)
0 !--- 5 108
5 !--- 10 72
10 !--- 15 18
15 !--- 20 2
Total 200

Observemos que a segunda coluna nos revela o número de elementos que participa da
classe correspondente. Ou seja, o valor 108 na primeira classe da coluna do fi significa que há
108 pessoas no conjunto que lêem entre zero e cinco livros por ano (cinco exclusive).
Assim, concluímos: a coluna do fi, chamada frequência absoluta simples,
simples indica o
número de elementos que faz parte da classe correspondente. Só isso. É a frequência de mais
fácil compreensão! E a mais importante delas também! Precisaremos conhecer os valores da fi
para podermos resolver quase todas as questões de uma prova.
Isso nos leva a uma conclusão importantíssima: será preciso, como primeiro passo,
pass saber
reconhecer o tipo de frequência apresentado na tabela da prova! Uma vez feito esse
reconhecimento, se a frequência fornecida houver sido a fi (frequência absoluta simples), então
já podemos resolver as questões. Caso contrário, se a prova houver fornecido
fornecido um outro tipo de
coluna de frequência,, diferente do fi, então precisaremos fazer algum trabalho preliminar,
preliminar no
intuito de transformar a coluna de frequência da tabela na frequência absoluta simples fi.
Ou seja, diante de uma Distribuição de Frequências,
s, convém seguirmos os seguintes
passos:
1º) Reconhecer o tipo de frequência fornecida na tabela;
2º-A) Se for a frequência absoluta simples (fi),
), ótimo: começamos a resolver a prova;
2º-B)
B) Se for um outro tipo de frequência, diferente do fi,, teremos
terem que fazer algum
trabalho preliminar,, no sentido de transformar a frequência fornecida na frequência absoluta
simples (fi).
Eu lhes digo que de nada adiantará você decorar todas as fórmulas deste Curso, se não
souber fazer esse tal de trabalho preliminar!
prelimina ! Saber fazer isso se tornou, por assim dizer, a
alma da prova! Ok? Vamos a esse estudo.
Existem seis tipos de colunas de frequências, s, as quais podem estar presentes numa
Distribuição. A primeira delas já conhecemos: a fi, frequência absoluta simples.

8 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Há ainda outros dois tipos de frequências absolutas: a fac – frequência absoluta
acumulada crescente, e a fad – frequência absoluta acumulada decrescente.
Haverá também três tipos de frequências relativas: a Fi, frequência relativa simples; a
Fac – frequência relativa acumulada crescente; e a Fad – frequência relativa acumulada
decrescente.
Relacionando-as
as todas, teremos:
Frequências Absolutas:
- fi : frequência absoluta simples;
- fac: frequência absoluta acumulada crescente;
- fad: frequência absoluta acumulada decrescente.
Frequências Relativas:
- Fi : frequência relativa simples;
- Fac: frequência relativa acumulada crescente;
- Fad: frequência relativa acumulada decrescente.

A primeira delas (fi)) está em destaque para que não nos esqueçamos:
esq é a mais
importante de todas! É a imprescindível. Teremos que conhecê-la
conhecê la previamente, antes de
começarmos a resolver a prova!
Vou criar outro exemplo de Distribuição de Frequências.
s. Ok? Suponhamos que a tabela
abaixo represente os pesos de um grupo
gru de crianças. Certo? Teremos:
Classes fi
(pesos, em Kg)

0 !--- 10 3
10 !--- 20 6
20 !--- 30 7
30 !--- 40 4

Já sabemos o significado da fi.. Assim, temos que 3 crianças têm peso até 10 quilos
(exclusive); 6 crianças têm peso variando entre 10 e 20 quilos; 7 crianças, peso variando entre
20 e 30 quilos; finalmente, 4 crianças têm peso variando entre 30 e 40 quilos. Assim, se
perguntarmos quantos os elementos há neste conjunto, ou seja, quantas crianças há neste grupo?
Para responder isso, basta somarmos os valores da coluna do fi.
Designaremos o número total de elementos de um conjunto por um n (minúsculo). Assim,
teremos:
Classes fi
(pesos, em Kg)

0 !--- 10 3
10 !--- 20 6
20 !--- 30 7
30 !--- 40 4
n=20

9 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Será sempre assim: na tabela, o número de elementos de um conjunto será encontrado
somando a coluna do fi.. Guarde isso!
Suponhamos agora que precisamos construir a coluna da fac (frequência absoluta
acumulada crescente).
Neste caso, devemos saber do seguinte:
1º) A fac é construída diretamente a partir da fi. (São frequências
s irmãs!)
2º) A fac será construída de cima para baixo, uma vez que seus valores são crescentes,
partindo da primeira classe;
3º) A fac e a fi apresentam o mesmo valor naquela classe em que a fac começa a ser
construída, ou seja, são iguais na primeira classe.
4º) Os demais valores da fac serão obtidos somando-sese o valor da fac anterior com a fi da
diagonal. (Isso será mais bem esclarecido quando virmos o exemplo).
Voltemos à tabela do nosso exemplo e sigamos os passos acima:
Classes fi fac
(pesos, em Kg)

0 !--- 10 3 3 Iguais na primeira


10 !--- 20 6 classe
20 !--- 30 7
30 !--- 40 4
n=20

E para construir os demais valores da fac,, seguiremos o comando de somar com a


diagonal. Teremos:
Classes fi fac
(pesos, em Kg)

0 !--- 10 3 3
10 !--- 20 6 9 (=3+6)
20 !--- 30 7
30 !--- 40 4
n=20

E depois:
Classes fi fac
(pesos, em Kg)

0 !--- 10 3 3
10 !--- 20 6 9
20 !--- 30 7 16 (=9+7)
30 !--- 40 4
n=20

E finalmente:

10 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Classes fi fac
(pesos, em Kg)

0 !--- 10 3 3
10 !--- 20 6 9
20 !--- 30 7 16
30 !--- 40 4 20 (=16+4)
n=20

Observação importante: a fac termina sempre com o mesmo valor de n (número de


elementos do conjunto)!
É isso! Aprendemos a construir a coluna da fac, a partir da frequência absoluta simples
(fi).
). Todos entenderam? Basta lembrar:
# De fi para fac:
fi e fac são frequências irmãs!
fi e fac são iguais na primeira classe;
o resto da fac se constrói somando com a diagonal..

E se for preciso fazer o caminho inverso? Ou seja, se quisermos construir a fi partindo da


? Como se fará isso? Vejamos:
fac?
1º) fac e fi são iguais na primeira classe. Teremos:
Classes fi fac
(pesos, em Kg)

0 !--- 10 3 3 Iguais na primeira


10 !--- 20 6
classe
20 !--- 30 7
30 !--- 40 4
n=20

2º) O restante da coluna da fi será construída subtraindo a próxima fac da fac anterior.
Vejamos como se faz isso:
Classes fi fac
(pesos, em Kg)

0 !--- 10 3 3
10 !--- 20 (9-3=) 6 9
20 !--- 30 16
30 !--- 40 20

E depois:

11 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Classes fi fac
(pesos, em Kg)

0 !--- 10 3 3
10 !--- 20 6 9
20 !--- 30 (16-9=) 7 16
30 !--- 40 20
n=20

E finalmente:
Classes fi fac
(pesos, em Kg)

0 !--- 10 3 3
10 !--- 20 6 9
20 !--- 30 7 16
30 !--- 40 (20-16=) 4 20
n=20

Daí, concluímos, que:


# De fac para fi:
fi e fac são frequências irmãs!
fi e fac são iguais na primeira classe;
o resto da fi se constrói subtraindo a próxima fac da fac
anterior.

Passemos a uma outra situação. Suponhamos que agora conhecemos a coluna da


frequência absoluta simples fi e pretendemos construir a coluna da fad – frequência absoluta
acumulada decrescente.
A primeira coisa a saber é que fi e fad são frequências
s irmãs, ou seja, são construídas
uma por meio da outra.
A fad,, por sua vez, será construída começando pela última classe. E lá, nesta última
classe, fad e fi terão o mesmo valor!
O restante da coluna da fad seguirá um comando já conhecido nosso. Qual? Somar com
a diagonal. Vejamos:
1º) fad e fi são iguais na última classe. Teremos:
Classes fi fad
(pesos, em Kg)

0 !--- 10 3
10 !--- 20 6
20 !--- 30 7
30 !--- 40 4 4 Iguais na última
classe
n=20

12 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
2º) Subindo e somando com a diagonal, teremos:
Classes fi fad
(pesos, em Kg)

0 !--- 10 3
10 !--- 20 6
20 !--- 30 7 11 (=4+7)
30 !--- 40 4 4
n=20

E depois:
Classes fi fad
(pesos, em Kg)

0 !--- 10 3
10 !--- 20 6 17 (=11+6)
20 !--- 30 7 11
30 !--- 40 4 4
n=20

E, finalmente:
Classes fi fad
(pesos, em Kg)

0 !--- 10 3 20 (=17+3)
10 !--- 20 6 17
20 !--- 30 7 11
30 !--- 40 4 4
n=20

Entendido? E se for preciso fazer o caminho de volta? Ou seja, se precisarmos construir a


coluna da frequência absoluta simples fi a partir do conhecimento da frequência absoluta
acumulada decrescente fad,, como fazê-lo?
fazê
Simples. Basta lembrar que: 1º) fi e fad são iguais na última classe; 2º) O restante da
coluna da fi será construída fazendo próxima acumulada menos acumulada anterior.
anterior Vejamos:
1º) fad e fi são iguais na última classe. Teremos:
Classes fi fad
(pesos, em Kg)

0 !--- 10 20
10 !--- 20 17
20 !--- 30 11
30 !--- 40 4 4 Iguais na última
classe

2º) O restante da coluna da fi será construída subindo e subtraindo a próxima fad da fad
anterior.. Vejamos como se faz isso:

13 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Classes fi fad
0 !--- 10 20
10 !--- 20 17
20 !--- 30 (11-4=) 7 11
30 !--- 40 4 4

E depois:
Classes fi fad
0 !--- 10 20
10 !--- 20 (17-11=) 6 17
20 !--- 30 7 11
30 !--- 40 4 4

E finalmente:
Classes fi fad
0 !--- 10 (20-17=) 3 20
10 !--- 20 6 17
20 !--- 30 7 11
30 !--- 40 4 4

Se tentarmos esquematizar o que vimos até aqui, podemos fazê-lo


fazê lo da seguinte forma:
De simples para acumulada:: somar com a diagonal
fac (iguais na primeira classe)
fi
fad (iguais na última classe)
De acumulada para simples: próxima acumulada – acumulada anterior

Agora passamos a falar sobre as Frequências Relativas!


A primeira coisa a saber é que as frequências s relativas dizem respeito a valores
percentuais, ou seja, a porcentagens de elementos! Ok? Essa é a diferença entre frequências
absolutas e relativas:
Frequências Absolutas dizem respeito a número de elementos;
s Absolutas: elementos
Frequências Relativas dizem respeito a porcentagem de elementos.
s Relativas: elementos
Se quisermos construir a coluna da Frequência Relativa Simples Fi, partindo do
conhecimento da frequência absoluta simples fi,, faremos apenas o seguinte:
1º) Compararemos os somatórios das duas colunas (fi
( e Fi),
), sabendo que:
a soma da frequência simples é sempre n (número de elementos do conjunto); e
a soma da frequência relativa simples é sempre 100%.
2º) Estabeleceremos uma relação (de produto ou divisão) entre estes dois somatórios. Ou
seja, compararemos n com 100%,
100%, e descobriremos qual a relação entre esses dois valores.
(Vocês vão já entender isso melhor!)
Voltemos
temos ao nosso exemplo. Teremos:

14 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Classes fi Fi
0 !--- 10 3
10 !--- 20 6
20 !--- 30 7
30 !--- 40 4
n=20 100%

1º) Qual a relação que se verifica entre 20 e 100%? Ora, com 20 é menor do que 100,
então multiplicaremos! (Se fosse o contrário, dividiríamos). Pois bem: multiplicaremos por
quanto? Por 5, já que 20x5=100.
Uma vez estabelecida esta relação entre os somatórios destas duas colunas de frequências
(fi e Fi),
), teremos enfim que repetir essa mesma relação com os demais valores da frequência
conhecida, e teremos construído a coluna desconhecida!
Vejamos:
Classes fi Fi
0 !---
! 10 3 15% (=3x5)
10 !---
! 20 6 30% (=6x5)
20 !---
! 30 7 35% (=7x5)
30 !---
! 40 4 20% (=4x5)
n=20 100%

(x5)

A mesma lógica se utiliza para fazer o caminho inverso, ou seja, para se construir a coluna
da fi partindo do conhecimento da Fi. Teremos:
Classes fi Fi
0 !--- 10 15%
10 !--- 20 30%
20 !--- 30 35%
30 !--- 40 20%
n=? 100%

Neste instante, teremos que reler o enunciado, para ver se foi revelado o valor do n
(número de elementos do conjunto). Caso, eventualmente, a questão não revele o valor do n,
adotaremos que n=100.. Ok? (Isso foi feito na prova do AFRF de 2003)!
Suponhamos aqui, em nosso exemplo, que o enunciado tenha dito que n=20 elementos.
Teremos:
Classes fi Fi
0 !---
! 10 3 (=15÷5) 15%
10 !---
! 20 6 (=30÷5) 30%
20 !---
! 30 7 (=35÷5) 35%
30 !---
! 40 4 (=20÷5) 20%
n=20 100%

(÷5)

15 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Lembrem-se se apenas de pôr o sinal de porcentagem % nas frequências
frequência relativas e de não
colocá-lo nas frequências
s absolutas!
Resta agora aprendermos como construir as colunas das frequências
frequência relativas acumuladas
(Fac e Fad). Para construí-las,
las, partiremos de um mesmo lugar: da frequência relativa simples Fi.
E o faremos seguindo o mesmo esquema utilizado nas transformações entre as
frequências
s absolutas. Teremos:
De simples para acumulada:: somar com a diagonal
Fac (iguais na primeira classe)
Fi
Fad (iguais na última classe)
De acumulada para simples: próxima acumulada – acumulada anterior
Vejamos estas transformações:
# De Fi para Fac:
Classes fi Fi Fac
0 !--- 10 3 15% 15%
10 !--- 20 6 30% 45% (=15%+30%)
20 !--- 30 7 35% 80% (=45%+35%)
30 !--- 40 4 20% 100% (=35%+20%)
n=20 100%

# De Fac para Fi:


Classes fi Fi Fac
0 !--- 10 3 15% 15%
10 !--- 20 6 30% (=45%-15%) 45%
20 !--- 30 7 35% (=80%-45%) 80%
30 !--- 40 4 20% (=100%-80%) 100%
n=20 100%

# De Fi para Fad:
Classes fi Fi Fad
0 !--- 10 3 15% 100%(=85%+15%)
10 !--- 20 6 30% 85% (=55%+30%)
20 !--- 30 7 35% 55% (=20%+35%)
30 !--- 40 4 20% 20%
n=20 100%

16 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
# De Fad para Fi:
Classes fi Fi Fad
0 !--- 10 3 15% (=100%-85%) 100%
10 !--- 20 6 30% (=85%-55%) 85%
20 !--- 30 7 35% (=55%-20%) 55%
30 !--- 40 4 20% 20%
n=20 100%

Certamente vocês observaram que a coluna da Frequência Relativa Acumulada Crescente


Fac termina sempre com 100%.
100% E a da Frequência Relativa Acumulada Decrescente começa
sempre com 100%.
Será sempre assim! Anote:
Fac: apresenta 100% na última classe!
Fad: apresenta 100% na primeira classe!

Vocês perceberam também que as duas frequências s absolutas acumuladas (fac


( e fad)
nascem da frequência absoluta simples (fi).
( ). E viram que as duas frequências relativas
acumuladas (Fac e Fad) nascem da frequência relativa simples (Fi).
Podemos, assim, unir os dois esquemas de transformação em um só, e chegaremos ao
seguinte:

De simples para acumulada:: somar com a diagonal


ac (iguais na primeira classe)
fac
fi
ad (iguais na última classe)
fad

(comparam
(comparam-se os dois somatórios)

Fac (iguais na primeira classe)


Fi
Fad (iguais na última classe)
De acumulada para simples: próxima acumulada – acumulada anterior

Meus queridos, conhecer bem este trabalho de transformar uma coluna de frequências em
outra, até chegar à frequência absoluta simples fi, é algo simplesmente fundamental.
Nas últimas provas de AFRF, por pelo menos três ocasiões a Esaf forneceu Distribuições de
Frequênciass com as quais se precisaria fazer o trabalho preliminar de descobrir qual a frequência
daquela tabela e, a partir daquela frequência, construir a fi.. Vejamos abaixo duas destas
Distribuições. Vamos a elas.

17 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
# (AFRF-2000) Utilize a tabela que se segue.

Classes de Salário Frequências


Acumuladas
( 3 ; 6] 12
( 6 ; 9] 30
( 9 ; 12] 50
(12 ; 15] 60
(15 ; 18] 65
(18 ; 21] 68

Sol.: O primeiro passo nosso será descobrir que frequência foi essa trazida na tabela. A primeira
conclusão a tomar é se se trata de uma frequência absoluta ou de uma frequência relativa.
Será Frequência Relativa em três casos:
casos
1º) Se o enunciado o disser expressamente;
2º) Se houver um sinal de porcentagem (%)
( ) no cabeçalho da coluna;
3º) Se houver sinais de porcentagem nos valores da coluna.
Nesta tabela, nenhum sinal indicativo de frequência relativa esteve presente, o que nos
leva a concluir que estamos diante de uma coluna de frequências
s absolutas.
Sabendo disso, resta-nos
nos uma segunda decisão a tomar: que tipo de frequência absoluta é
essa? Há três tipos: fi (frequência
frequência absoluta simples), fac (frequência
frequência absoluta acumulada
crescente) e fad (frequência absoluta acumulada decrescente).
Ora, foi dito expressamente (no cabeçalho da coluna) que se trata de uma frequência
acumulada. Logo, restam-nos
nos duas possibilidades: fac ou fad.. Para decidir se a frequência é
acumulada crescente ou decrescente,
crescente, basta observar os seus valores: começamos com 12; e
aumentamos para 30, para 50, para 60 etc. Ou seja, estamos diante de uma frequência
absoluta acumulada crescente (fac).
Feita esta descoberta, concluímos pela necessidade de realizar um trabalho preliminar, no
sentido de construir agora a coluna da frequência absoluta simples fi. Já sabemos fazer isso:
Classes fac fi
( 3 ; 6] 12 12
( 6 ; 9] 30 18 (=30-12)
( 9 ; 12] 50 20 (=50-30)
(12 ; 15] 60 10 (=60-50)
(15 ; 18] 65 5 (=65-60)
(18 ; 21] 68 3 (=68-65)

Somente então seria possível começar a resolver a prova! Vamos ao próximo exemplo.
# (AFRF-2002) Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram
examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu
a tabela de frequências
s abaixo. A coluna Classes representa intervalos de valores de
d X em reais e
a coluna P representa a frequência relativa acumulada. Não existem observações coincidentes
com os extremos das classes.

Classes P (%)
70-90 5
90-110 15
110-130 40
130-150 70
150-170 85
170-190 95
190-210 100

18 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Sol.: Comecemos identificando a coluna de frequência fornecida. O cabeçalho apresenta um sinal
de porcentagem. Daí, concluímos que se trata de uma frequência relativa, e é muito conveniente
que coloquemos logo o sinal de porcentagem em todos os valores desta coluna. Teremos:
Classes P (%)
70-90 5%
90-110 15%
110-130 40%
130-150 70%
150-170 85%
170-190 95%
190-210 100%

Ora, aprendemos que as duas frequências


s relativas acumuladas começarão ou terminarão
com 100%. Lembrados? Daí, consultaremos imediatamente essas duas classes: a primeira e a
última. Encontramos 100% por lá? Sim! Na última classe! Conclusão: trata-se
trata de uma frequência
relativa acumulada.
Mas será acumulada crescente ou decrescente? Ora, basta verificar os seus valores.
Começou com 5%; cresceu para 15%; cresceu para 40%; e assim por diante.
Conclusão: estamos diante da coluna da frequência relativa acumulada crescente,
crescente
Fac.
No intuito
o de construir a coluna da frequência absoluta simples (fi
fi), construiremos, como
primeiro passo, a coluna da frequência relativa simples (Fi). Teremos:
Classes Fac Fi
70-90
90 5% 5%
90-110
110 15% 10% (=15%-5%)
110-130
130 40% 25% (=40%-15%)
15%)
130-150
150 70% 30% (=70%-40%)
40%)
150-170
170 85% 15% (=85%-70%)
70%)
170-190
190 95% 10% (=95%-85%)
85%)
190-210
210 100% 5% (=100%-95%)
95%)

Daí, finalmente, faremos a transformação da frequência relativa simples para a frequência


absoluta simples. Ou seja, passaremos de simples para simples.. Neste caso, conforme
aprendemos, iremos nos concentrar apenas nos somatórios destas duas colunas de frequências.
Precisamos reler o enunciado, para sabermos qual o número de elementos do conjunto n.
A questão disse que foram examinados 200 itens... Traduzindo: n=200.. Daí, teremos:

Classes Fac Fi fi
70-90
90 5% 5% 10
90-110
110 15% 10% 20
110-130
130 40% 25% 50
130-150
150 70% 30% 60
150-170
170 85% 15% 30
170-190
190 95% 10% 20
190-210
210 100% 5% 10
Total 100% n=200
(x2)

E somente neste momento a tabela estaria pronta para deixar você começar a resolver a
prova!

19 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Amigos, o objetivo desta aula de hoje está, creio, alcançado. Na seqüência, trocaremos
apenas algumas palavras sobre o que venha a ser um Histograma.
O Histograma é o gráfico estatístico que existe para representar os dados de uma
Distribuição de Frequências.
s. Relacione sempre: Histograma para Distribuição de Frequências! Ok?
É muito fácil construir um Histograma. No eixo horizontal, anotaremos os limites das classes; e
no eixo vertical, as frequências
s absolutas simples.
Trabalhemos com a seguinte Distribuição
Distri de Frequências,
s, e tentemos construir o
Histograma. Teremos:
Xi fi
0 --- 10 3
10 --- 20 4
20 --- 30 3
30 --- 40 2
40 --- 50 1
n=13
fi

0 10 20 30 40 50 (
(Classes)
A primeira classe, que vai de zero a dez, tem fi igual a 3. Assim, o retângulo que
representará essa classe no histograma será o seguinte:

fi

0 10 20 30 40 50 (
(Classes)

Viram? A base do retângulo é definida pelos limites da classe, enquanto sua altura é
definida pela frequência absoluta simples daquela classe. Não é fácil? Facílimo! Para a segunda
classe, sabendo que o fi=4,
=4, teremos:

20 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
fi

0 10 20 30 40 50 (
(Classes)
A essa altura, todos já entenderam a feitura do Histograma, não é isso? Assim, vou logo
completar o gráfico, com base nos dados daquela Distribuição de Frequências
Frequência apresentada acima.
Teremos:
fi

0 10 20 30 40 50 (
(Classes)
Enfim! Professor, mas por que foi mesmo que você apresentou o Histograma exatamente
neste momento? Porque é possível, embora muito raro, que a sua prova apresente o conjunto a
ser trabalhado por meio de um gráfico como esse!
Ou seja, em vez de apresentar a Distribuição de Frequências, s, a questão trará um
Histograma! E aí? O que fazer? Ora, com a mesma facilidade que você construiu um Histograma
partindo de uma Distribuição de Frequências, você poderá fazer o caminho de volta,
volta e construir a
Distribuição, partindo de um Histograma! Concordam? Repito: é muito raro vir um Histograma na
prova. Mas não é impossível. E já aconteceu!
Querem ver um exemplo? Caiu numa prova bem antiga de Técnico da Receita Federal, do
tempo em que esse cargo se chamava TTN. O Histograma trazido pela prova foi o seguinte:

fi

12

10
8

4
2

2 4 6 8 10 12 14 16 idades

21 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
E aí? Você saberia transformar esse gráfico numa Distribuição de Frequências? Claro.
Ficaria o seguinte:
Classes fi
2 --- 4 2
4 --- 6 6
6 --- 8 10
8 --- 10 12
10 --- 12 8
12 --- 14 6
14 --- 16 4

Exercícios Propostos

Identificar a coluna de frequência fornecida na Distribuição e, se for o caso, fazer o trabalho


necessário para chegar aos valores da frequência absoluta simples fi.

01. (AFRF 2003) Considere a tabela de frequências s seguinte correspondente a uma amostra da
variável X. Não existem observações coincidentes com os extremos das classes.

Classes Frequências
Acumuladas (%)
2.000 – 4.000 5
4.000 – 6.000 16
6.000 – 8.000 42
8.000 – 10.000 77
10.000 – 12.000 89
12.000 – 14.000 100

02.(IRB-Brasil
Brasil Resseguros S.A. – 2004 ESAF) Na distribuição de frequências
frequência abaixo, não existem
observações coincidentes com os extremos das classes.

Classe Frequência Acumulada


129,5-139,5
129,5 4
139,5
139,5-149,5 12
149,5
149,5-159,5 26
159,5
159,5-169,5 46
169,5
169,5-179,5 72
179,5
179,5-189,5 90
189,5
189,5-199,5 100

03. (AFRF-2002.2)
2002.2) Para a solução das duas próximas questões utilize o enunciado que segue. O
atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida
de uma população de 1000 indivíduos, produziu a tabela de frequências
s seguinte:
seguin
Classes Frequência (f)
29,5-39,5 4
39,5-49,5 8
49,5-59,5 14
59,5-69,5 20
69,5-79,5 26
79,5-89,5 18
89,5-99,5 10
22 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Resoluções dos Exercícios Propostos
Identificar a coluna de frequência fornecida na Distribuição e, se for o caso, fazer o trabalho
necessário para chegar aos valores da frequência absoluta simples fi.
01. (AFRF 2003) Considere a tabela de frequênciass seguinte correspondente a uma
amostra da variável X. Não existem observações coincidentes com os extremos das
classes.
Classes Frequências
Acumuladas (%)
2.000 – 4.000 5
4.000 – 6.000 16
6.000 – 8.000 42
8.000 – 10.000 77
10.000 – 12.000 89
12.000 – 14.000 100

Sol.: Esta Distribuição de Frequências


Frequências fornecida pela prova acima apresentou-nos
apresentou duas colunas:
a das classes e uma outra, a qual chamou de frequências acumuladas,, seguido de um sinal de
porcentagem. Ora, aprendemos que este sinal de porcentagem é um indicativo de que estamos
diante de uma frequência relativa. Uma vez que foi revelado, expressamente, que se trata de
frequências
s acumuladas, restaram-nos
restaram nos duas alternativas:
Frequência relativa acumulada crescente (Fac
Fac); ou
Frequência relativa acumulada decrescente (Fad
Fad).
Para saber se é uma ou outra, basta examinarmos os valores da coluna: eles estão
crescendo ou decrescendo? Crescendo! Daí, matamos a charada: a frequência fornecida na tabela
foi a Fac – Frequência Relativa Acumulada Crescente.
Esse será sempre o primeiro passo: identificar
identif a frequência trazida pela prova.
O segundo passo é fazer o trabalho preliminar, que consiste em migrar da frequência
apresentada na tabela para a coluna da frequência absoluta simples fi.
Relembrando o desenho das transformações que criamos na aula passada, teremos:

De simples para acumulada:: somar com a diagonal


ac (iguais na primeira classe)
fac
fi
ad (iguais na última classe)
fad

(comparam
(comparam-se os dois somatórios)

Fac (iguais na primeira classe)


Fi
Fad (iguais na última classe)
De acumulada para simples: próxima acumulada – acumulada anterior

23 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Nosso trabalho preliminar se fará, neste caso, em dois passos:
1º) Passaremos da Fac para a Fi (frequência relativa simples);
2º) Passaremos da Fi para a fi.
Fazendo isso, teremos:
Classes Fac Fi
2.000 – 4.000 5% 5%
4.000 – 6.000 16% 11%
6.000 – 8.000 42% 26%
8.000 – 10.000 77% 35%
10.000 – 12.000 89% 12%
12.000 – 14.000 100% 11%

Sabemos que nesta transformação que fizemos acima, as duas frequências


frequência (Fac e Fi) são
iguais na primeira classe, e o restante da coluna da Fi se constrói subtraindo: próxima acumulada
menos a acumulada anterior.
Ficou claro para todos? (Isso aprendemos na aula passada!).
Agora vamos aos finalmentes:
finalmentes partindo da Fi construiremos a coluna
oluna da fi.
Aprendemos que, de simples para simples,
simples, teremos apenas que nos concentrar no
somatório destas duas colunas! Lembrados? Sabemos que o somatório da coluna da frequência
relativa simples (Fi)) será sempre igual a 100%. E que o somatório da frequência
freq absoluta simples
(fi) é sempre igual a n (número de elementos do conjunto).
É nesse instante que nos cabe reler o enunciado, para ver o que foi dito acerca deste n.
Foi dito alguma coisa no enunciado? Não! A questão não revelou quantos elementos há h neste
conjunto!
O que fazer agora? Neste caso, adotaremos n=100.
Essa foi a pergunta de uma colega do Fórum.
Embora talvez sem o destaque necessário, essa informação foi apresentada na aula 1. Ok?
Para frisar mais adequadamente este fato, ei-lo
ei novamente:
Sempre que estivermos trabalhando com as duas colunas frequências
frequência simples, construindo
a fi a partir da Fi,, precisaremos conhecer o n (número de elementos do conjunto). Caso este n
não tenha sido fornecido pelo enunciado, adotaremos apenas que n=100..
Certo agora?
Daí, facilmente verificamos que os valores da fi (frequência absoluta simples) serão iguais
aos da Fi (frequência relativa simples), apenas tirando o sinal de porcentagem!
Teremos:
Classes Fac Fi fi
2.000 – 4.000 5% 5% 5
4.000 – 6.000 16% 11% 11
6.000 – 8.000 42% 26% 26
8.000 – 10.000 77% 35% 35
10.000 – 12.000 89% 12% 12
12.000 – 14.000 100% 11% 11
100% n=100

É isso! Está feito. Próxima questão.

24 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
02.(IRB-Brasil
Brasil Resseguros S.A. – 2004 ESAF) Na distribuição de frequências abaixo,
não existem observações coincidentes com os extremos das classes.
Classe Frequência Acumulada
129,5-139,5
129,5 4
139,5
139,5-149,5 12
149,5
149,5-159,5 26
159,5
159,5-169,5 46
169,5
169,5-179,5 72
179,5
179,5-189,5 90
189,5
189,5-199,5 100

Sol.: Este enunciado apresentou-nos,


apresentou nos, além da coluna das classes, uma outra que foi dita
frequência acumulada.
Pergunta: houve algum sinal indicativo de frequência relativa? O enunciado falou
expressamente que é relativa? Não! Existe sinal de porcentagem no cabeçalho
cab da coluna? Não!
Existe sinal de porcentagem ao longo dos valores da coluna? Não!
Conclusão inicial: não se trata de uma frequência relativa, mas absoluta!
Foi dito expressamente que é uma frequência acumulada. Assim, sabendo que é absoluta
e que é acumulada, restam-nos
nos duas alternativas: ou será
frequência absoluta acumulada crescente (fac);
( ou
frequência absoluta acumulada decrescente (fad).
(
Para saber qual das duas, basta vermos os valores da coluna, se estão aumentando ou
diminuindo. E aí?
í? Estão aumentando! Conclusão final: estamos diante de uma coluna de
frequência absoluta acumulada crescente (fac). (fac). Uma perguntinha: de antemão, apenas
olhando para os valores desta nossa fac, já é possível afirmar quem é o n (número de elementos
do conjunto)?
O que você responde? SIM.
SIM Pois a fac termina sempre com o n.
Daí, já sabemos que n=100 elementos. Ok?
Pois bem! Precisaremos agora realizar o trabalho preliminar
preliminar, no sentido de
transformarmos a fac na fi (frequência
frequência absoluta simples).
Fazendo isso, teremos:

Classe fac fi
129,5-139,5 4 4
139,5-149,5 12 8
149,5-159,5 26 14
159,5-169,5 46 20
169,5-179,5 72 26
179,5-189,5 90 18
189,5-199,5 100 10

Qual o indicativo de que acertamos nos valores da fi?


? Ora, somando os seus valores, o
resultado da soma terá que ser igual a n. E n,, conforme vimos acima, é igual a 100. Vamos
conferir?

25 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Classe fac fi
129,5-139,5 4 4
139,5-149,5 12 8
149,5-159,5 26 14
159,5-169,5 46 20
169,5-179,5 72 26
179,5-189,5 90 18
189,5-199,5 100 10
n=100

03. (AFRF-2002.2)
2002.2) Para a solução das duas próximas questões utilize o enunciado que
segue. O atributo do tipo contínuo X, observado como um inteiro, numa amostra de
tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de
frequências seguinte:
Classes Frequência (f)
29,5-39,5 4
39,5-49,5 8
49,5-59,5 14
59,5-69,5 20
69,5-79,5 26
79,5-89,5 18
89,5-99,5 10

Sol.: Nossa análise começará sempre no sentido de sabermos se a coluna fornecida na tabela da
prova é de frequências absolutas ou relativas. Certo?
No caso acima, não está presente nenhum sinal indicativo de frequências
frequência relativas. Daí,
concluímos que se trata de uma frequência absoluta!
Ora, diante disso, temos ainda três possibilidades: ou será
frequência absoluta simples (fi);
( ou
frequência absoluta acumulada crescente (fac);
( ou
frequência absoluta acumulada decrescente (fad).
(
Foi dito em algum lugar do enunciado que esta coluna é de frequências
frequência acumuladas? Não!
Logo, por via de exceção, estamos diante de uma
um frequência absoluta simples (fi).
(
Assim sendo, não há qualquer trabalho preliminar exigido para esta tabela. Já poderíamos
começar a resolver a prova! Ok?
Curiosamente, esta coluna de frequência absoluta simples fornecida nesta Distribuição de
Frequências
s é exatamente a mesma a qual chegamos no exemplo anterior. Perceberam? Uma
mera coincidência!

26 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
# Medidas de Posição:
Nosso presente estudo dará início à análise das chamadas Medidas de Posição.
Porém, antes de as conhecermos, convém muitíssimo que nós saibamos quais são as
formas pelas quais um conjunto pode ser apresentado numa prova. As mais comuns formas de
apresentação de um conjunto são as três seguintes:
1ª) Rol:: aqui os elementos do conjunto estarão dispostos numa ordem que pode
po ser
crescente ou decrescente. São exemplos de rol:
(1,2,3,4,5)
(1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5)
E assim por diante!
Não é muito comum encontrarmos um rol numa questão de prova, mas também não é
algo impossível. Entre as últimas provas da Receita,
Rece pôde-se
se ver um rol na prova de 1998 e na de
2005. Entendido o que é um rol? Ótimo.

2ª) Dados Tabulados::


Vamos trabalhar com esse segundo exemplo de rol, acima. Será possível apresentarmos
os elementos desse conjunto na forma de uma tabela? Claro que
qu sim!
Vamos ver como é que fica:
Xi fi
1 3
2 4
3 3
4 2
5 1

Vejam que a coluna do Xi apresenta os elementos (individualizados) do conjunto; e a


coluna do fi (a nossa conhecidíssima frequência absoluta simples) indica o número de vezes que
o elemento aparece no conjunto! Assim, vemos que o elemento 1 (Xi=1) aparece três vezes
naquele rol (fi=3);
fi=3); o elemento 2 (Xi=2) aparece quatro vezes (fi=4), e assim por diante.
Se quisermos saber quantos elementos há neste conjunto, o que teremos que fazer? Ora,
teremos que somar a coluna da frequência absoluta simples – fi.
Daí, já podemos guardar a seguinte
seguinte informação: sempre que quisermos saber o n
(número de elementos de um conjunto), e esse conjunto estiver apresentado na forma de uma
tabela,, basta somarmos os valores da coluna da frequência absoluta simples!
simples
Ok? Assim, teremos:
Xi fi
1 3
2 4
3 3
4 2
5 1
n=13
27 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Uma discussão existe acerca desta segunda forma de apresentação dos dados: há autores
que dizem que se e trata de um tipo de Distribuição de Frequências;
s; outros dizem que não! Ora,
para efeito de concurso, essa discussão não nos interessa em nada!
O que interessa é que você precisará saber trabalhar a questão de todo jeito! Assim, para
nós, aparecendo um conjunto
onjunto na prova, e esse conjunto estando apresentado desta forma que
acabamos de ver acima, diremos que estamos diante de Dados Tabulados!
Tabulados E só! Ok?

3ª) Distribuição de Frequências:


Frequência
Essa já é nossa velha conhecida! Na Distribuição de Frequências,s, diferentemente do que
ocorre no rol e nos dados tabulados, os elementos do conjunto estarão agrupados em classes, em
vez de serem apresentados de forma individualizada! Exemplo:
Xi fi
0 -- 10 3
10 -- 20 4
20 -- 30 3
30 -- 40 2
40 -- 50 1
n=13

Essencialmente, o que diferencia a Distribuição de Frequências


s das outras duas formas de
apresentação de um conjunto, vistas acima, é exatamente o fato de aqui, na Distribuição, os
dados estarem agrupados em classes!
Já usamos uma aula anterior para estudar com minúcia os elementos de uma Distribuição,
não é verdade?
Essencialmente, são essas as três formas mais usuais de apresentação de um conjunto:
Rol, Dados Tabulados e Distribuição de Frequências.
Porém, não são as únicas. Vamos aproveitar o ensejo para apresentar um tipo de gráfico,
chamado de Histograma!! Já falamos sobre esse gráfico na aula passada! Lembrados?
Trabalhemos com a Distribuição de Frequências do exemplo acima, e tentemos construir o
Histograma. (Isso, inclusive, já foi feito)! Teremos:
fi

0 10 20 30 40 50 (
(Classes)
Ultimamente, isto é, em algumas provas muito recentes, a Esaf andou inovando, e
apresentou um conjunto por meio de um gráfico até então pouquíssimo conhecido: o Diagrama
de Ramos e Folhas.. Daí, muita e muita gente ficou olhando para as tais das folhas, e não soube
absolutamente o que fazer com elas!
O tal Diagrama de Ramos e Folhas é algo semelhante ao seguinte:

28 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
8 2
8
9 003
10 0011222344
10 577777
11 013
11 55679
12 00114
12 5557
13 004
13 5556
14 03
14 5
15
15 8

Vamos lá! O Diagrama acima será transformado num rol. Repetindo: o Diagrama de
Ramos e Folhas vai virar um Rol. Se bem observarmos, veremos uma coluna de valores no lado
esquerdo. E outra no lado direito. Vejam melhor:
8 2
8
9 003
10 0011222344
10 577777
11 013
11 55679
12 00114
12 5557
13 004
13 5556
14 03
14 5
15
15 8

Esses valores da esquerda (em azul) permanecerão exatamente na esquerda! Serão as


dezenas! E os valores que os acompanham à sua direita (em vermelho) permanecerão –
adivinhem onde? – na direita! Serão as unidades! Assim, teremos:
8 2 que vai virar: 82
9 003 que vai virar: 90, 90, 93
10 0011222344 que vai virar: 100, 100, 101, 101, 102, 102,, 102, 103, 104, 104
10 577777 que vai virar: 105, 107, 107, 107, 107, 107
11 013 que vai virar: 110, 111, 113
11 55679 que vai virar: 115, 115, 116, 117, 119
12 00114 que vai virar: 120, 120, 121, 121, 124
12 5557 que vai virar: 125, 125, 125, 127
13 004 que vai virar: 130, 130, 134
14 03 que vai virar: 140,
14 143
15 8 que vai virar: 158
15

29 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Assim, nosso Diagrama de Ramos e Folhas acima se transformou no seguinte rol:
{82, 90, 90, 93, 100, 100, 101, 101, 102, 102, 102, 103, 104, 104, 105, 107, 107,
107, 107, 107, 110, 111, 113, 115, 115, 116, 117, 119, 120, 120, 121, 121, 124,
125, 125, 125, 127, 130, 130, 134, 140, 143,
1 158}
Entendido?
Pois bem! O que fizemos nesta aula, até o momento, foi conhecer as maneiras pelas quais
a Esaf, ou qualquer outra elaboradora, pode se utilizar para apresentar um conjunto de
elementos numa prova de Estatística.
Uma vez fornecido o conjunto – seja na forma de um rol, ou de dados tabulados,
tabulados ou de
Distribuição de Frequências s, ou de um Histograma, ou de um Diagrama de Ramos e
Folhas – já poderão ser solicitados, nas questões da prova, os cálculos de uma infinidade de
medidas estatísticas!
Ou seja, para um determinado conjunto, pode-se
pode se pedir o cálculo de:
Medidas de Tendência Central (Média, Moda, Mediana);
Medidas Separatrizes (Mediana, Quartis, Decis, Centis);
Medidas de Dispersão (Amplitude Total, Desvio Absoluto, Desvio Padrão, Variância,
Coeficiente de Variação, Desvio Quartílico, Variância Relativa);
etc, etc.
Considerando que o Histograma será transformado em uma Distribuição de Frequências e
que o Diagrama
ama de Ramos e Folhas será transformado num Rol, resta que as três formas básicas
de apresentação dos dados serão, realmente: o Rol, os Dados Tabulados e a Distribuição de
Frequências.
Assim, para cada uma das medidas estatísticas que formos estudar, aprenderemos
apre como
ela será calculada para o caso de o conjunto estar na forma de um Rol, ou de Dados Tabulados
ou de Distribuição de Frequências.
Frequência Ok?
Então vamos lá!
Começaremos conhecendo as Medidas de Tendência Central – Média Aritmética, Moda
e Mediana.
Uma vez considerando que a maior parte do programa do ICMS/RJ diz respeito a temas da
Estatística Avançada, pareceu--nos
nos mais conveniente usar de maior brevidade no estudo das
Medidas de Posição, resumindo esta teoria o quanto possível, haja vista, sobretudo,
sobretud que a
maioria dos alunos (muito provavelmente) já a conheceu, durante o estudo da Estatística Básica.
Ok?
Pelo histórico de provas passadas, outros concursos cujos Editais exigem tópicos da
Estatística Básica e da Estatística Avançada, praticamente só a Avançada é a que vem nas
questões! Normalmente, o elaborador põe alguns temas da Básica, porque seria impossível
trabalhar assuntos da Avançada sem noção de conceitos básicos, como o que é uma distribuição
de frequências,
s, o que é a média do conjunto, o que
que é o desvio padrão, a variância, entre outros.

# A Média Aritmética: X
Quando falarmos simplesmente em Média, saiba que estaremos nos referindo à Média
Aritmética. Ok? Existem outras espécies de Média, além da Aritmética, que serão estudadas
oportunamente.
Comecemos pelo cálculo da Média de um Rol.
Estou certo que esse é um cálculo que todos nós já realizamos. Suponhamos que você
ainda está na faculdade. O semestre começou, e você nem se deu conta disso. Eis que chegou o
dia da primeira prova! A sua nota foi um desastre: nota 3 (três).

30 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Que lástima! Aí você disse: “Valha-me
“Valha Deus,
eus, as aulas já começaram!” (Meio tardia essa
descoberta...!) O fato é que você procurou se redimir da nota baixa que tirou, e dedicou esforços
para a segunda prova. O resultado se fez perceber, e você conseguiu agora tirar um 8 (oito).
Ora, você sabia que
ue para passar por média, teria que tirar um notaço na terceira e última
prova, uma vez que a média naquela sua faculdade era 7 (sete).
Assim, virou várias noites estudando e se dedicando àquela disciplina, de sorte que
conseguiu, merecidamente, tirar um 10 (dez) na terceira prova.
Tão logo recebeu esta última nota, você correu às contas, pois desejava saber se havia
passado por média,, ou se necessitaria fazer a prova final.
Suas contas foram as seguintes:
(3 + 8 + 10 ) = 21 =7,0
3 3
Parabéns! Você acaba de provar que é um aluno cobra!! (Aquele que passa se
arrastando)! Mas passou, não foi? Isso é o que importa! (Igual no concurso: se você passar em
último lugar, vai ganhar o mesmo salário de quem passou em primeiro)!
Vejamos novamente as notas das
d três provas dessa pessoa: (3,
3, 8, 10).
10
Isto é um rol? Sim!
Então, esta conta que foi feita para o cálculo da média das notas foi, rigorosamente, o
mesmo cálculo que se faz para se descobrir a Média Aritmética de um conjunto apresentado na
forma de um rol.
Ou seja: somam-se
se as notas, e divide-se
divide se este resultado pelo número de provas.
Falando-se
se de um modo genérico: somam-se
somam se os elementos do conjunto, e divide-se
divide esse
resultado pelo número de elementos do conjunto!
Colocando-se
se essa definição em uma fórmula,
fórmula usando-se
se da linguagem estatística,
teremos que:

X=
∑ Xi
n
Onde:

X é a Média Aritmética;
Σ é o sinal de somatório.
somatório. O que vier após este símbolo deverá ser somado!
Xi é cada elemento do conjunto;
n é o número de elementos do conjunto.
Só isso! Nada mais fácil que se calcular a Média de um rol.
Pena que o Rol seja tão raro em provas...!

# A TRANSIÇÃO:
Esta palavra – Transição – está em destaque, porque nos acompanhará longamente
durante nosso Curso!
Aprenderemos, meus queridos, que há uma maneira facílima de migrarmos de uma
fórmula de Rol para a fórmula de Dados Tabulados.. Da mesma forma, há como migrarmos da
fórmula dos Dados Tabulados para a fórmula da Distribuição de Frequências!
Frequência
E essa maneira de fazer a migração de uma fórmula para outra é justamente a tal da
Transição que vamos aprender agora! Vamos lá!

31 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
1º) Como passar da fórmula do Rol para a dos Dados Tabulados?
?
Manda a primeira transição que façamos o seguinte:
Repete-se a fórmula do rol; e
Acrescenta-se
se no numerador da fórmula, sempre junto ao sinal de somatório (Σ), a
frequência absoluta simples fi.
Só isso!
Assim, se eu já aprendi que a fórmula usada para se calcular a Média Aritmética de um
conjunto apresentado naa forma de um rol é:

X=
∑ Xi ...
n
... então, querendo agora construir a fórmula da Média Aritmética para um conjunto
apresentado na forma de Dados Tabulados,
Tabulados, eu só precisarei seguir o que manda a transição! E
teremos:
Para Dados Tabulados:

X = ∑fi......Xi
n

Viram? Bastou repetir a fórmula do Rol (já conhecida!) e acrescentar o fi no numerador,


junto ao sinal de somatório!!
Usamos a primeira Transição!
Transição
E agora, caso queiramos construir a fórmula da Média Aritmética para uma Distribuição de
Frequências,
s, como devemos proceder? Aí surge a segunda transição.. Vejamos.
2º)
º) Como passar da fórmula dos
do Dados Tabulados para a da
d Distribuição de
Frequências?
Manda a segunda transição que façamos o seguinte:
Repete-se
se a fórmula dos Dados Tabulados; e
Troca-se o Xi (elemento individualizado do conjunto) por PM (Ponto Médio) da classe!
E é só isso!
Mas qual seria o motivo de essa transição se fazer desta forma? Ora, por uma razão muito
simples. Basta comparar
rar as duas primeiras formas de apresentação (Rol
(Rol e Dados Tabulados)
com a Distribuição de Frequências,
Frequência , e veremos que naquelas estamos sempre trabalhando com
Xi (elementos individualizados do conjunto). Mas na Distribuição de Frequências,
Frequência nós deixamos
de trabalhar
rabalhar com elementos individualizados, uma vez que agora nossa variável passará a ser
agrupada em classes!
Daí, na Distribuição, não há mais que se falar em elemento individualizado Xi. Terá ele
que ser substituído por aquele elemento que melhor representa cada classe. E esse elemento é
justamente o Ponto Médio!
Assim, conhecendo a fórmula da Média Aritmética para Dados Tabulados, e aplicando o
que nos manda a segunda transição, teremos que a Média para uma Distribuição de Frequências
será dada por:

X=
∑ fi.PM
n

32 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
A boa notícia, meus amigos, é que essa mesmíssima transição, que acabamos de
aprender, não se aplica somente a fórmulas de Média Aritmética. Não! Vai muito além disso!
Vamos usá-lala para a memorização de várias outras medidas estatísticas, a exemplo do Desvio
Absoluto, do Desvio Padrão, da Variância, entre outras.
Primeiro, vejamos se ficou mesmo bem memorizada a nossa Transição!
Transição
Teremos:
Resumo da Transição:
1º) Você memoriza a fórmula do Rol;
2º) Repete a fórmula do Rol e acrescenta fi no numerador, sempre junto ao sinal de
somatório, e aqui chegamos à fórmula dos Dados Tabulados;
3º) Repete a fórmula dos Dados Tabulados e troca-se Xi por PM (Ponto Médio), e aqui
chegamos à fórmula da Distribuição de Frequências!

# Resumo das Fórmulas da Média Aritmética:


Média Aritmética para Rol:

X=
∑ Xi
n
Média Aritmética para Dados Tabulados:

X =
∑ fi.Xi
n
Média Aritmética para Distribuição de Frequências:

X =
∑ fi.PM
n
Agora, considerando que em aproximadamente 99% dos casos o conjunto vem, na prova,
expresso na forma de uma Distribuição de Frequências,
s, convém que nos dediquemos mais a esta
forma de apresentação!
Passemos a alguns exemplos:
Exemplo 1) A tabela abaixo representa os pesos de um grupo de crianças. Obtenha o peso
médio desse conjunto. Não existem observações coincidentes com os extremos das classes.
classes
Classes fi
(em Kg)
0 --- 10 2
10 --- 20 3
20 --- 30 8
30 --- 40 6
40 --- 50 1

Antes de mais nada, viram a frase em destaque no enunciado? Foi pergunta de algumas
pessoas no Fórum de aulas passadas. Vamos entendê-la.
entendê la. Quais são os extremos das classes? São
os limites (inferior e superior).

33 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Se o enunciado diz que não existem observações ões coincidentes com os extremos das
classes,, é porque não há nenhum elemento do conjunto cujo valor coincida exatamente com
algum dos limites (inferiores ou superiores) de nenhuma das classes.
No caso em tela, como tratamos de pesos de crianças, diremos que nenhuma dessas
crianças tem peso coincidente com os limites das classes. Ou seja, nenhuma delas pesa 0, 10,
20, 30, 40, nem 50 quilos.
Em termos práticos, o que isso importará para nós? Importará que, sabendo disso, a
tabela pode trazer o símbolo que quiser para definir os intervalos de classe,
classe e nós poderemos
simplesmente considerá-lo lo como aquela simbologia clássica, de intervalo fechado à esquerda e
aberto à direita, que não haverá problema algum! Só isso!
Voltemos ao exemplo. A questão pede o peso médio,, o que traduziremos como a média
dos pesos!
Se o conjunto representasse salários, a questão pediria o salário médio.
médio Se o conjunto
representasse alturas,, a questão pediria a altura média. Se o conjunto representasse idades, a
questão pediria a idade média.. (E não é prova de História, hein!). E assim por diante!
(Quem já foi meu aluno presencial deve, a esta hora, estar balançando a cabeça e
dizendo: puxa, até as mesmas piadas bestas que ele diz em sala...)
Vamos repetir o conjunto, para podermos
poderm trabalhar com ele:
Classes fi
0 --- 10 2
10 --- 20 3
20 --- 30 8
30 --- 40 6
40 --- 50 1

Se eu quero a média aritmética de uma Distribuição de Frequências,


Frequência começarei colocando
a fórmula no papel. E será sempre assim! A fórmula é quem guiará os nossos passos de
resolução! Teremos:

X=
∑ fi.PM
n
Olhando para o numerador da fórmula, perguntaremos: já conhecemos a coluna do fi?
Sim, já é nossa conhecida! E se não fosse? E se a coluna de frequência fornecida na tabela fosse
alguma daquelas outras cinco (fac,
( fad, Fi, Fac ou Fad)?
)? Então, teríamos que fazer todo aquele
trabalho preliminar,, que aprendemos na primeira aula, a fim de construirmos a coluna da fi
(frequência absoluta simples).
Neste nosso exemplo, isso não se fez necessário!
Próxima pergunta, ainda olhando para o numerador: já conhecemos a coluna dos Pontos
Médios (PM)?)? Ainda não! Assim, será nosso primeiro trabalho: construir a coluna dos Pontos
Médios! Já sabemos fazer isso! Teremos:

Classes fi PM
0 --- 10 2 5
10 --- 20 3 15
20 --- 30 8 25
30 --- 40 6 35
40 --- 50 1 45

34 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Reparem que todas as classes têm a mesma amplitude, não é isso? Quanto? h=10.
Assim, se vocês estiverem bem lembrados, basta calcular o valor do primeiro ponto médio, e os
próximos serão obtidos apenas somando com a amplitude (h).
( ). Viram? Isso já foi falado!
Ainda tratando do numerador da fórmula, perguntaremos agora: já conhecemos a coluna
do produto fi.PM? ? Ainda não! Conhecemos essas colunas separadamente,
separadamente mas não o seu
produto! Daí, está definido o nosso próximo passo: construir a coluna do fi.PM.
fi.PM Teremos:

Classes fi PM fi.PM
0 --- 10 2 5 10
10 --- 20 3 15 45
20 --- 30 8 25 200
30 --- 40 6 35 210
40 --- 50 1 45 45

O que nos pede mesmo o numerador da fórmula? Pede o somatório (a soma) dos
elementos desta coluna que acabamos de construir.
E o denominador, o que nos pede? Pede-nos
Pede o valor de n (número de elementos do
conjunto). Ora, sabemos que n é obtido somando-se a coluna da frequência absoluta simples (fi).
Fazendo esses dois somatórios, teremos:
Classes fi PM fi.PM
0 --- 10 2 5 10
10 --- 20 3 15 45
20 --- 30 8 25 200
30 --- 40 6 35 210
40 --- 50 1 45 45
n=20 510

Finalmente, aplicando a fórmula da Média Aritmética para uma Distribuição de


Frequências, teremos:

X=
∑ fi.PM X=
510
X =25,5 Resposta!
n 20

# Algumas Propriedades da Média Aritmética:


Considere o seguinte conjunto original (um rol): {1, 2, 3, 4, 5}

Qual é a média deste conjunto? Teremos: (1+2+3+4+5)/5=15/5 X =3


E se agora tomarmos cada elemento (Xi) daquele conjunto original, e resolvermos
adicionar cada um deles à constante 10, por exemplo. O que teremos? Ora, teremos um novo
conjunto: {11, 12, 13, 14, 15}.
15} Concordam?
Assim, já não mais estamos diante daquela variável original,, e sim de uma variável
transformada!! Transformada por meio de quê? De uma operação de soma!
soma!
E qual é a Média desse novo conjunto (dessa nova variável)? Façamos as contas:
(11+12+13+14+15)/5=65/5 X =13.
Ora, nem precisaríamos ter feito essa conta! Pois existe uma propriedade que diz:
somando-sese todos os elementos do conjunto com uma constante, a Média do novo conjunto será
igual à Média do conjunto original também somada com aquela mesma constante!
constante

35 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Foi verdade isso? Sim. A Média do conjunto original era X =3. = Nós somamos cada
elemento do conjunto original com constante 10.. Daí, a Média do novo conjunto será a média
anterior (3) somada também à constante 10. Ou seja, a nova Média será 13.
13
E se serve para soma, serve também para subtração!
Agora consideremos que cada elemento daquele conjunto original será multiplicado pela
constante 10. Ok? O que ocorrerá àquele conjunto? Será transformado em outro. Passaremos a
ter: {10, 20, 30, 40, 50}.
Não se trata mais da variável original e sim de uma variável transformada!
transformada Transformada
por quem? Por uma operação de multiplicação! Calculando a média do novo conjunto, teremos:
(10+20+30+40+50)/5=150/5 X =30.
E nem precisaríamos ter feito este cálculo, pois existe uma propriedade da Média que diz:
multiplicando-se
se cada elemento de um conjunto original por uma constante, a nova Média será
igual à média anterior também multiplicada pela mesma constante!
constante

ejamos: a média do conjunto original era X =3.. Nós multiplicamos cada


Senão, vejamos:
elemento do conjunto original pela constante 10.. Daí, a Média do novo conjunto será a média
anterior (3) multiplicada também pela constante 10. Ou seja, a nova Média será 30.
E se serve para produto, serve também para divisão!
Para melhorar a nossa vida e a nossa memorização, resumiremos essas propriedades
todas em uma única (e pequena) frase:
A MÉDIA É INFLUENCIADA PELAS QUATRO OPERAÇÕES!
Ok? É essa a frase que deve
dev ficar guardada em nossa memória!

# Outras Propriedades da Média:


Vejamos logo duas propriedades irmãs:
A soma dos desvios dos elementos do conjunto em torno da Média é igual a
zero!
Como é isso? Vamos considerar o seguinte conjunto: {1, 2, 3, 4, 5}

Qual é a Média desse conjunto? Faremos (1+2+3+4+5)/5=15/5 X =3.


Pois bem! O que construiremos agora é o conjunto dos desvios!! Desvio é sinônimo de
diferença. Daí, vamos construir o conjunto formado pela diferença entre cada elemento
element Xi do
conjunto original e a Média. Teremos:

(Xi- X ) = {(1-3),
3), (2-3),
(2 (3-3), (4-3), (5-3)}

(Xi- X ) = {-2, -1,


1, 0, 1, 2}
Fazendo o somatório dos desvios em torno da média, teremos:

∑(Xi- X ) = {(-2)+(
2)+(-1)+(0)+(1)+(2)}=0

Enfim, esse é o resumo da propriedade: ∑(Xi- X ) = 0

De uma forma resumida, memorizaremos: A soma dos desvios é zero!


zero
Só isso! Esta propriedade poderá ser objeto
objeto de uma questão teórica, como já foi, em
provas mais antigas.

36 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
A soma dos quadrados dos desvios dos elementos do conjunto em torno da
Média é um valor mínimo!
Essa é de compreensão menos imediata. Mas igualmente fácil.
Tomemos novamente o conjunto: {1, 2, 3, 4, 5}.. Já sabemos que a Média é 3.
Assim, tomando a média 3 como referência, e construindo o conjunto dos desvios em
torno da média, teremos:

(Xi- X ) = {-2, -1,


1, 0, 1, 2}
Agora, se elevarmos cada um desses valores ao quadrado,
quadrado, teremos:

(Xi- X )2 = {-22, -12, 02, 12, 22} = {4, 1, 0, 1, 4}


Fazendo o somatório dos quadrados dos desvios, teremos:

∑(Xi- X ) 2
= {4+1+0+1+4}=10
{4+1+0+1+4}= Este é um valor mínimo!

Mínimo por quê? Porque encontraríamos um valor maior que 10, caso percorrêssemos
todo esse mesmo trajeto, tendo partido do conjunto dos desvios em torno de uma origem
qualquer diferente da Média.
Entenderam? Ainda não? Então, escolham um valor qualquer diferente da Média (3) do
conjunto. Qualquer valor serve! Pode ser o 2, então? Ok! Lembrem-se
Lembrem se que 2 não é a Média do
conjunto! Comecemos. Vamos construir o conjunto dos desvios, em torno dessa origem 2.
Teremos:
(Xi-2) = {(1-2),(2-2),
2), (3-2),
(3 (4-2), (5-2)} = {-1, 0, 1, 2, 3}
Construindo os quadrados desses desvios, teremos:

(Xi-2)2 = {-12, 02, 12, 22, 32} = {1, 0, 1, 4, 9}


Fazendo o somatório dos quadrados desses desvios, teremos:

∑(Xi-2) 2
= {1+0+1+4+9}=15
{1+0+1+4+9}= E 15 é maior que 10.

Por quê? Porque 10 é um valor mínimo!


Ficou compreendido?
Professor, como é que essas duas propriedades podem ser cobradas numa prova?
Basicamente, numa questão teórica. Nas provas mais antigas, nos idos dos anos noventa, era
muito comum a presença de questões mais conceituais.
conceituais. Hoje, são questões mais raras, embora
nada impeça de você se deparar com uma delas!
Então, resumindo essas duas propriedades irmãs, teremos:
A soma dos desvios é igual a zero!
A soma dos quadrados dos desvios é um valor mínimo!
É isso! Há ainda outra propriedade importante da Média que precisamos conhecer:

A Média das Médias:


Essa propriedade tratará de uma situação em que haverá alguns conjuntos menores. Para
cada um desses conjuntos menores, a questão fornecerá o valor do seu número de elementos, e
o valor da sua Média. Assim, supondo que estejamos trabalhando com apenas dois conjuntos
menores (A e B), teremos, como dados da questão, os seguintes:

37 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
conjunto A: número de elementos do conjunto A (n
( A)

Média dos elementos do conjunto


conj A ( X A)

conjunto B: número de elementos do conjunto B (n


( B)

Média dos elementos do conjunto B ( X B )

O que nos irá perguntar a questão da prova? Irá nos perguntar o seguinte: se juntarmos
todos os elementos do conjunto A com todos os elementos do conjunto B, e os unirmos em um só
conjunto maior, qual será a Média desse conjunto global?
Responderemos a esta
ta pergunta usando a seguinte fórmula:

X GLOBAL =
[(n .X ) + (n .X )]
A A B B

(nA + nB )

Trata-se
se de uma das questões mais fáceis da prova, pois se resume a aplicar a fórmula
acima. Faz-se o copiar-colar e chega-se
chega à resposta! Ok?
Virão duas questões que exploram o conhecimento desta propriedade no dever de casa
que deixarei nesta aula de hoje.
Existe ainda uma informação acerca da Média, e que às vezes, inclusive, é tratada como
uma propriedade, que diz o seguinte:
A Média é influenciada
nfluenciada por valores extremos!
O que quer dizer isso? Vejamos o conjunto abaixo:
{1, 2, 3, 4, 5}
A média desse conjunto, já fizemos esse cálculo hoje, é igual a 3.
E se trocarmos o valor extremo 5 por, digamos, 500? Teremos:
{1, 2, 3, 4, 500}
A média desse novo conjunto será, feitos os cálculos, igual 102.
Houve um grande salto, não é verdade? Sim! E por quê? Porque a média é influenciada
pelos valores extremos!
Essa propriedade costumava ser mais exigida para efeitos comparativos com outras
medidas estatísticas, como Moda e Mediana. Assim, mais adiante, voltaremos a falar sobre ela.
Ok?
Pois bem! Acho que agora já podemos passar a falar na segunda medida de tendência
central: a Moda!

# MODA: Mo
Esse é um dos assuntos prediletos das alunas! Qualquer concurseira de respeito sabe que
Moda é aquilo que está em evidência. É isso mesmo? Assim na vida, assim na Estatística.
Moda, em sentido estatístico, será aquele elemento que mais aparece no conjunto!
Só isso! Nada mais fácil! Vamos aprender a reconhecer a moda de um rol, de dados
tabulados e de uma distribuição de frequências. Vamos lá.

38 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Moda do Rol:
Analise o conjunto abaixo, e me diga qual é o elemento que se sobressai aos
a demais:
{1, 1, 2, 2, 2, 3, 3, 3, 3, 5, 5, 7, 7, 10}
Facilmente se vê que o elemento de maior frequência,, aquele que mais aparece no
conjunto, é o elemento Xi=3,0..
Está terminado! A Moda desse conjunto é 3. Diremos: Mo=3.
E não se fala mais nisso! Vocês
Vocês acham, sinceramente, que a Esaf iria colocar uma questão
como essa em prova?
Quem pensou que não errou! Confira a questão abaixo, extraída do AFRF-1998:
AFRF
(AFTN-98)
98) Os dados seguintes, ordenados do menor para o maior, foram obtidos de
uma amostra aleatória,
tória, de 50 preços (Xi) de ações, tomada numa bolsa de valores
internacional. A unidade monetária é o dólar americano.
4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10,
10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13,14, 15, 15, 15, 16, 16, 18, 23
Com base nestes dados, assinale a opção que corresponde ao preço modal.
a) 7 b) 23 c) 10 d) 8 e) 9

Sol.: Vejam que o conjunto foi apresentado na forma de um rol. E seus elementos
representam preços. Daí, a questão pede que se calcule o preço modal.
Se os elementos representassem salários, a questão pediria o salário modal.
Se os elementos representassem pesos,
pesos, a questão pediria o peso modal.
Se representassem idades, a idade modal. E assim por diante!
Pois bem! Aqui, usaremos a técnica milenar do dedo.. Basta colocar o dedo em cima dos
elementos do conjunto, e contar, para descobrir aquele que aparece mais vezes que os demais!
Conclusão: o elemento Xi=8 é o que mais aparece. É aquele de maior frequência. Logo, é
a Moda desse conjunto e a resposta da questão!
E acreditem: isso valeu um ponto numa prova de Auditor-Fiscal
Auditor Fiscal da Receita Federal.
Isso corrobora a minha tese de que nem só de questões difíceis se faz uma prova!
Também existem as fáceis, as muito fáceis, as facílimas, e as estupidamente bestas!
E essas nós não podemos errar, nem em pesadelo.
Pois bem. Mais algumas informações:
Se o conjunto apresenta uma só moda, será dito conjunto modal.
modal
Mas, considere o rol abaixo:
{1, 2, 2, 2, 3, 3, 5, 7, 7, 7, 9, 10}
Quem é a moda desse conjunto? Não é apenas uma, mas são duas: o elemento 2 e o
elemento 7. Estamos, pois, diante de um conjunto
con dito bimodal.
E se houver três ou mais modas em um conjunto? Então estaremos diante de um conjunto
multimodal.
Atente agora para o seguinte conjunto:
{1, 2, 3, 4, 5}
Quem arrisca dizer qual é a Moda dele? Existe algum elemento que se destaca em relação
aos demais? Um elemento que aparece mais que os outros? Não! Nenhum elemento se destaca.
Daí, concluímos que não há moda neste rol, de sorte que estamos diante de um conjunto
con amodal.

39 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Conclusão: diferentemente da Média Aritmética, que sempre existe e é única, a Moda pode
existir, pode não existir e, no primeiro caso, pode haver uma, ou duas, ou várias Modas em um
mesmo conjunto!
Alguma dúvida para a Moda de um rol? Creio
Crei que não! Adiante.

Moda de Dados Tabulados:


Aqui estamos diante do que há de mais fácil neste Curso!
Ora, sabemos que a Moda é o elemento de maior frequência.. Assim, diante do conjunto
seguinte, tente dizer qual é o elemento modal:
Xi fi
1 2
2 3
3 7
4 5
5 1

Neste caso, de o conjunto estar apresentado na forma de Dados Tabulados, sequer


precisamos aplicar a técnica do dedo.
dedo Basta deslizar pela coluna da frequência absoluta simples
(fi), procurando pela maior fi.. Ao encontrarmos, saberemos que o elemento Xi a que ela se
refere será a Moda do conjunto!
Assim:
Xi fi
1 2
2 3
3 7
4 5
5 1
A Moda do conjunto é 3.
Só e somente só!
Viram como é fácil? Essa aí nunca caiu em prova, até agora!

Moda para Distribuição de Frequências:


Aqui estamos diante de uma questão de prova em potencial.
Há dois métodos distintos para calcularmos a Moda de uma Distribuição: A Moda de
Czuber e a Moda de King.
Precisamos saber que a regra é trabalharmos com o método de Czuber.
Czuber
Dito de outra forma: só calcularemos a Moda de uma distribuição de frequências pelo
método de King se a questão expressamente o determinar! Ok?
Consideremos o seguinte conjunto, supondo que represente os pesos de um grupo de
crianças:
Classes fi
0-10 2
10-20 4
20-30 7
30-40 5
40-50 2

40 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Comecemos aprendendo o cálculo da Moda de Czuber.. São dois passos:
1º) Identificar a classe modal.
Ora, classe modal é aquela de maior frequência absoluta simples (maior fi). Só isso! Neste
caso, a maior fi é 7, de sorte que a terceira classe será a classe modal. Teremos:
Classes fi
0-10 2
10-20 4
20-30 7
30-40 5
40-50 2

Até aqui, tudo tranqüilo? Tranqüilíssimo! Pois bem. O segundo passo consiste em:
2º) Aplicar a Equação da Moda de Czuber. É a seguinte:

 ∆a 
Mo = l inf +  .h
 ∆a + ∆p 
Observem que os elementos desta fórmula serão extraídos daquela Classe Modal que
acabamos de identificar no primeiro passo. Ok? Assim, o limite inferior (linf)
( a que se refere a
equação é o limite inferior da classe modal; a amplitude (h)
( ) a que se refere a equação é a
amplitude da classe modal.
E esses deltas da fórmula, significam o quê? Delta significa diferença.
diferença
Quando falamos em ∆a estamos nos referindo à diferença anterior E quando falamos em
a anterior.
∆p estamos nos referindo à diferença posterior.
posterior
Tanto ∆a quanto ∆p serão calculados com base em um mesmo referencial: a frequência
absoluta simples da classe modal. Assim:
∆a é a diferença entre a fi da classe modal e a fi da classe anterior; e
∆p é a diferença entre a fi da classe modal e a fi da classe posterior.
No caso do nosso exemplo teremos:

Classes fi
0-10 2
10-20 4 ∆a=3
20-30 7
30-40 5 ∆p=2
40-50 2

Finalmente, resta-nos
nos aplicar a fórmula de Czuber. E teremos que:

 ∆a   3 
Mo = l inf +  .h Mo = 20 +  .10 Mo=26 Resposta!
 ∆a + ∆p   3 + 2 

Pode haver questão mais fácil do que esta? Não pode! E cai na prova, exatamente desse
jeito! Um ponto garantido a mais para nós.
Aprendamos agora o cálculo da Moda de King. Em dois passos:
1º) Identificar a Classe Modal.

41 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Já sabemos fazer isso: a classe modal é sempre aquela de maior frequência absoluta
simples!
2º) Aplicar a equação de King, que é a seguinte:

 fp 
Mo = l inf +  .h
 fp + fa 

Os dados da equação da Moda de King serão também extraídos da Classe Modal.


Assim: linf se referirá ao limite inferior da classe modal; h é a amplitude da classe modal.
E estas fp e fa,, o que são? São, respectivamente:
fp: frequência absoluta simples da classe posterior à da classe modal; e
fa: frequência absoluta simples da classe anterior à da classe modal.
Nesta fórmula não calcularemos deltas,, ou seja, não faremos diferenças. Tomaremos as
próprias frequências
s simples, a anterior e a posterior à fi da classe modal.
Assim, para o nosso exemplo, teremos que:
Classes fi
0-10 2
10-20 4 fa
20-30 7
30-40 5 fp
40-50 2
Daí:

 fp   5 
Mo = l inf +  .h Mo = 20 +  .10 Mo=25,56 Resposta!
 fp + fa   4 + 5 
Quero chamar atenção para um detalhe: na Moda de Czuber (que é a regra!), o
numerador do colchete é o ∆a,, enquanto o numerador da Moda de King é a fp. Perceberam isso?
Não pode errar a fórmula, senão a questão está perdida!
Vou frisar novamente: só usaremos
usaremos o cálculo da Moda de King se a questão mandar
expressamente. Se ela não o fizer, trabalharemos com a Moda de Czuber, que é a moda dos
deltas, que é a regra! Ok?
Vamos dar uma olhadinha no rol abaixo:
{1, 2, 2, 3}
Quem é a Moda deste rol? É 2. Concordam? E se tomarmos cada elemento deste conjunto
original e os somarmos à constante 10, por exemplo, o que ocorrerá? Passaremos a ter um novo
conjunto. O seguinte:
{11, 12, 12, 13}
Quem é a nova Moda? É 12.. E nem precisávamos ter feito este cálculo, uma vez que
existe uma propriedade que afirma que: somando todos os elementos do conjunto a uma mesma
constante, a nova moda será a anterior também somada àquela constante!
constante
E se serve para soma, serve também para subtração!
Tomemos novamente o conjunto original. E se multiplicarmos cada elemento daquele
conjunto pela constante 10,, o que ocorreria? Chegaríamos ao seguinte conjunto:
{10, 20, 20, 30}

42 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
E a nova Moda é 20,, como já poderíamos prever. Sim! Pois há uma propriedade, segundo
a qual: multiplicando todos os elementos de um conjunto original por uma mesma constante, a
nova moda será a anterior também multiplicada pela mesma constante!
constante
E se serve para multiplicação, serve também para divisão!
Resumo da história: a Moda, a exemplo da Média Aritmética, também é influenciada pelas
quatro operações!

# Mediana: Md
Como o próprio nome pode sugerir, a Mediana é aquele elemento que está rigorosamente
no meio do conjunto, dividindo--o
o em duas partes iguais, ou seja, em duas metades!
metade
O cálculo da Mediana é quase sempre uma questão certa na prova! Uma questão que não
podemos e não iremos errar de jeito nenhum!

Mediana para o Rol:


Consideremos o seguinte conjunto:
{10, 20, 30, 40, 50}
}
Só olhando, seremos capazes de dizer qual é o elemento que está no meio deste
conjunto? Claro! É o elemento 30.
30. Concordam? Ficaram dois elementos à sua direita, e dois à sua
esquerda. Ele está, portanto, no meio do conjunto. E sendo assim, é a Mediana!
{10, 20, 30, 40, 50}
}
Md=30
Vocês perceberam que o conjunto acima tem um número ímpar de elementos. Para ele,
temos que n=5.
Sempre que isso ocorrer, ou seja, sempre que o conjunto tiver um número ímpar de
elementos, significa que só haverá uma posição central.
E o elemento que ocupar esta posição central será a própria Mediana do conjunto!
Há um cálculo que podemos fazer para descobrir qual é a posição central, no caso de o
conjunto apresentar um número ímpar de elementos.
elementos. Este cálculo é o seguinte:
Posição Central = (n+1)/2
Isto é para quando n for um número ímpar!
Reparem bem que o resultado desta conta não é a Mediana do conjunto, e sim a sua
posição central. O elemento que ocupar esta posição central será, este
este sim, a Mediana.
No nosso exemplo, tínhamos n=5.. (Um número ímpar, o que indica a existência de uma
única posição central)! Assim, faremos: (n+1)/2=(5+1)/2=3ª
(n+1)/2=(5+1)/2= Posição!
Esta é a posição central do conjunto! Daí, usando novamente a técnica milenar do dedo,
você vai contar as posições do conjunto, até chegar à terceira. O elemento que a ocupar será a
Mediana que estamos procurando! Teremos:
{10, 20, 30, 40, 50}
}
3ª Posição Md=30

E se o conjunto tiver um número par de elementos? Aí a história é outra. Vejamos. Se


nosso conjunto for o seguinte:
{10,
10, 20, 30, 40, 50, 60}
60

43 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Quantos elementos há? Seis elementos. Temos, pois: n=6.. Um número par de elementos!
Sempre que isso ocorrer, ou seja, sempre que houver um número par de elementos no conjunto,
significa que haverá duas posições centrais!
centrais
Estas posições centrais poderão ser encontradas da seguinte forma:
1ª Posição Central: (n/2)
2ª Posição Central: a vizinha posterior.
posterior
Neste caso, em que n=6,
n=6 teremos:
1ª Posição Central: (n/2)=6/2= 3ª Posição!
2ª Posição Central: a vizinha posterior = 4ª Posição!
As duas posições centrais estão, portanto, identificadas. Resta descobrir
descobrir quais são os dois
elementos que as ocupam.
E vejam o que será feito para calcularmos a Mediana.
Teremos:

{10, 20, 30, 40,, 50, 60}


60
4ª Posição 30
Md=(30+40)/2 Md=35,
3ª Posição 40

Ou seja, se n é um número par, descobriremos quais são os dois elementos que ocupam
as duas posições
ões centrais, somaremos esses elementos e dividiremos o resultado desta soma por
dois. Assim, chegaremos à Mediana do conjunto!
Ficou evidenciado neste exemplo que a Mediana não necessariamente terá que ser um dos
elementos do conjunto! Viram? Esse valor 35 não é um dos elementos! E no entanto é a Mediana!
A prova do Fiscal da Receita de 1998 cobrou uma questão para se determinar a Mediana
de um rol. Fazendo uma pequena e irrelevante adaptação, foi o seguinte:
(AFTN-98)
98) Os dados seguintes, ordenados do menor para o maior, foram obtidos de
uma amostra aleatória, de 50 preços (Xi) de ações, tomada numa bolsa de valores
internacional. A unidade monetária é o dólar americano.

4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9,
9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13,14, 15, 15,
15, 16, 16, 18, 23

Assinale a opção que corresponde à mediana:


mediana:
a) 9,0 b) 9,5 c) 8,0 d) 8,5 e) 10

Sol.: Estamos diante de um rol de 50 elementos.


ele Portanto, n=50,, que é um número par! Se n é
um número par, teremos duas posições centrais, que serão, respectivamente:
1ª Posição Central: (n/2)=50/2= 25ª Posição
2ª Posição Central: a vizinha posterior = 26ª Posição
Sabendo disso, e usando a milenar técnica do dedo, contaremos os elementos, para saber
quais deles ocupam estas duas posições centrais. Vamos lá:
4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9,
9,
, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13,
13 13,14, 15, 15,
15, 16, 16, 18, 23

44 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Os dois elementos que ocupam as duas posições centrais são, ambos, iguais a 9. Nem
precisaremos perder tempo somando-os
somando os e dividindo o resultado por dois. Concordam?
Basta dizer que a Mediana é igual a 9 e pronto! Daí: Md=9 Resposta!

# Mediana para Distribuição de Frequências:


Esta, sim, é questão muito provável na sua prova!
Consideremos o seguinte conjunto:
Classes fi
0-10 2
10-20 4
20-30 7
30-40 5
40-50 2

Se ele representa, suponhamos, os pesos de um grupo de crianças, então a questão lhe


pedirá que encontre o peso mediano;
mediano; se fossem idades, a questão pediria a idade mediana; se
fossem salários, o salário mediano.
mediano E assim por diante!
O primeiro passo é identificar
ntificar a Classe Mediana!
Para isso, trilharemos o seguinte caminho:
Calcular a fração da Mediana: (n/2).
No cálculo da mediana de uma distribuição de frequências,s, não faz nenhuma diferença se
n é par ou é ímpar. Seja como for, o nosso cálculo será sempre
sempre esse mesmo: (n/2).
Construirmos a coluna da fac (frequência absoluta acumulada crescente).
Compararemos os valores da fac com o resultado da fração da mediana (n/2), fazendo
a seguinte pergunta: Esta fac é maior ou igual a (n/2)?
Começaremos a fazer esta pergunta desde a fac da primeira classe (lá em cima) e a
repetiremos, descendo fac por fac,
fac até que a resposta seja SIM.
Quando a resposta for sim,, pararemos, procuraremos a classe correspondente, e esta
será a nossa Classe Mediana.
Vamos fazer isso? Teremos:
Classes fi
0-10 2
10-20 4
20-30 7
30-40 5
40-50 2
n=20
n/2 = 10
Agora, construindo a fac,
fac teremos:
Classes fi fac
0-10 2 2
10-20 4 6
20-30 7 13
30-40 5 18
40-50 2 20
n=20

45 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Fazendo a pergunta, teremos:
Classes fi fac
0-10 2 2 2 é maior ou igual a 10? Não! (Adiante!)
10-20 4 6 6 é maior ou igual a 10? Não! (Adiante!)
20-30 7 13 13 é maior ou igual a 10? SIM! (PARAMOS AQUI!)
30-40 5 18
40-50 2 20
n=20

E a terceira classe é a nossa classe mediana!


Uma vez conhecedores da Classe Mediana, faremos com ela um desenho!
Vejamos novamente nosso conjunto:
Classes fi fac
0-10 2 2
10-20 4 6
20-30 7 13 Classe Mediana!
30-40 5 18
40-50 2 20
n=20

Traremos essa classe mediana aqui para fora, e nosso desenho será construído da
seguinte maneira:
Na parte de cima do desenho, colocaremos os limites da classe. Teremos:

Limites da Classe: 20 30

Até aqui, tudo bem?


Na parte de baixo do desenho, colocaremos as frequências
s absolutas acumuladas
crescentes (fac)) associadas a esses dois limites!
Como assim? Vejamos: se eu perguntar quantos elementos já foram acumulados até o
limite inferior 20, o que você responderá? Veja
Ve o conjunto novamente:
Classes Fi Fac
0-10 2 2
10-20 4 6
20-30 7 13
30-40 5 18
40-50 2 20
n=20

Teremos acumulado 6 elementos, concordam?


E se eu perguntar quantos elementos já foram acumulados até o limite superior 30, o que
você dirá? Vejamos no conjunto:
Classes Fi Fac
0-10 2 2
10-20 4 6
20-30 7 13
30-40 5 18
40-50 2 20

46 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Teremos acumulado 13 elementos!
Conclusão: na hora de identificar as frequências
s acumuladas associadas aos dois limites
da classe mediana, estas fac serão, sempre e respectivamente, a fac da classe anterior,
anterior e a
mediana! Assim, complementando nosso desenho, teremos:
fac da própria classe mediana!

Limites da Classe: 20 30
fac associadas: 6 13
Faltando quase nada para terminarmos o desenho! Agora perguntaremos: qual é a posição
da Mediana? É o resultado da fração (n/2). Quanto? 10. Pois bem! Esse 10 corresponde à
posição, e posição corresponde à frequência acumulada. Assim, localizaremos a décima
décim posição
do conjunto na parte de baixo do desenho. Teremos:

Limites da Classe: 20 30
fac associadas: 6 10 13

Ora, a esta décima posição corresponde qual elemento dentro da classe? Corresponde à
Mediana. Assim, concluiremos o desenho, fazendo:

Limites da Classe: 20 Md 30
fac associadas: 6 10 13

É preciso agora que você releia com calma os passos necessários à feitura deste desenho
acima. À primeira vista, parece ser complicado. Mas não é!! Quando nos habituarmos a trabalhar
com ele, estejam certos de que se tornará facílimo!
Uma vez diante deste desenho, marcaremos o pedaço da classe que vai do limite inferior
até a Mediana, e procuraremos
s por quatro valores. Os seguintes:

Limites da Classe: 20 Md 30
fac associadas: 6 10 13

47 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Encontrando estes quatro valores, teremos:

10

Limites da Classe: 20 Md 30
fac associadas: 6 10 13
4

Os quatro valores encontrados preencherão os quatro espaços de uma igualdade entre


duas frações. Uma dessas frações será composta pelos valores referentes à classe inteira. E a
segunda delas, pelos valores referentes à classe quebrada! Teremos:

10 x
7 4
Multiplica-se
se cruzando, e teremos: X=(4x10)/7 X=5,71
Agora, resta-nos
nos olhar para o desenho, e constataremos que para chegar à Mediana,
teremos que somar o limite inferior ao X que acabamos de calcular.

Teremos: Md=20+X Md=20+5,71 Md=25,71 Resposta!

Façamos mais um exemplo: uma questão recente de AFRF.


(AFRF-2002.2)
2002.2) Para a solução das duas próximas questões utilize o enunciado que
segue. O atributo do tipo contínuo X, observado como um inteiro, numa amostra de
tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de
frequências seguinte:
Classes Frequência (f)
29,5-39,5 4
39,5-49,5 8
49,5-59,5 14
59,5-69,5 20
69,5-79,5 26
79,5-89,5 18
89,5-99,5 10

48 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Assinale a opção que corresponde à estimativa da mediana amostral do atributo
X.
a) 71,04 d) 68,08
b) 65,02 e) 70,02
c) 75,03

Sol.: A questão pediu o cálculo da Mediana da Distribuição de Frequências.


Frequência Vamos fazer isso
apenas seguindo os passos que aprendemos acima, como se estivéssemos seguindo uma receita
de bolo. Não tem errada! Vamos:
1º) Encontrar o valor do n (somando a coluna da fi)) e calcular a fração da Mediana (n/2).
(
Teremos:
Classes fi
29,5-39,5 4
39,5-49,5 8
49,5-59,5 14
59,5-69,5 20
69,5-79,5 26
79,5-89,5 18
89,5-99,5 10
n=100
(n/2)=50

2º) Construir a coluna da fac (frequência absoluta acumulada crescente):

Classes fi fac
29,5-39,5 4 4
39,5-49,5 8 12
49,5-59,5 14 26
59,5-69,5 20 46
69,5-79,5 26 72
79,5-89,5 18 90
89,5-99,5 10 100
n=100

3º) Comparar os valores da fac com o valor da fração da Mediana (n/2),


( fazendo a velha
pergunta: esta fac é maior ou igual a (n/2)? até que a resposta seja sim!
Classes fi fac
29,5-39,5 4 4 4 é maior ou igual a 50? Não! (Adiante!)
39,5-49,5 8 12 12 é maior ou igual a 50? Não! (Adiante!)
49,5-59,5 14 26 26 é maior ou igual a 50? Não! (Adiante!)
59,5-69,5 20 46 46 é maior ou igual a 50? Não! (Adiante!)
69,5-79,5 26 72 72 é maior ou igual a 50? SIM! (PARAMOS AQUI!)
79,5-89,5 18 90
89,5-99,5 10 100
n=100

Com esses passos iniciais, conseguimos identificar qual é a Classe Mediana (69,5-79,5).
Resta-nos preparar o desenho,
desenho para cálculo da Mediana!

49 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Comecemos com a parte de cima do desenho, onde colocaremos os limites da Classe
Mediana. Teremos:

Limites da Classe: 69,5 79,5

Na parte de baixo do desenho, colocaremos as frequências s absolutas acumuladas


crescentes associadas àqueles dois limites. Já sabemos: serão sempre a fac da classe anterior
e a fac da própria classe mediana
diana. Teremos:

Limites da Classe: 69,5 79,5


fac associadas: 46 72

Quase lá! Qual é a posição da Mediana neste conjunto? É o resultado da fração: 50. Assim,
associada à posição 50 teremos a Mediana.
Mediana. Nosso desenho completo é o seguinte:

Limites da Classe: 69,5 Md 79,5


fac associadas: 46 50 72

Uma vez que o desenho já está completo, iremos à procura de quatro valores. Faremos:

10

Limites da Classe: 69,5 Md 79,5


fac associadas: 46 50 72
4

26

50 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Com esses quatro valores, formamos uma igualdade entre duas frações. A seguinte:

10 x
26 4
Multiplica-se
se cruzando, e teremos: X=(4x10)/26 X=1,54
Finalmente, o que falta ser feito é apenas somar o limite inferior da classe mediana ao
valor do X que acabamos de calcular. Teremos:

Md=69,5+1,54 Md=71,04 Resposta!

E aí? Fácil, não? Facílimo! E vai ficar ainda mais quando você praticar, resolvendo várias
questões de provas recentes!
Convém que você repita as resoluções até que esses passos fiquem todos automatizados
em sua mente. Na hora da prova, é só ligar o piloto automático e sair resolvendo a questão sem
dificuldade alguma!
Mais algumas informações. Considere o seguinte conjunto:
{1, 2, 3}
A Mediana, todos concordam, é Md=2.
Se somarmos os elementos deste conjunto com a constante 10, teremos:
{11, 12, 13}
E a nova mediana é 12. Ou seja, valeu aqui também para a Mediana a propriedade da
soma (e da subtração)!
Se multiplicarmos todos os elementos do conjunto original por 10, teremos:
{10, 20, 30}
A nova mediana é 20. Vale também para a Mediana a propriedade
proprieda do produto (e da
divisão)!
Em suma: a Mediana também é influenciada pelas quatro operações!
Se você trocar 3 por 300, nosso conjunto original agora será:
{1, 2, 300}
E a Mediana continuará a ser 2. Ou seja, a Mediana, assim como a Moda (e
diferentemente
emente da Média), não é influenciada por valores extremos!

51 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
# Medidas de Dispersão (ou de Variabilidade):
O Edital do ICMS/RJ não especificou, no programa de Estatística, quais são as Medidas de
Dispersão que poderão ser cobradas na prova! Disse apenas: Medidas de Variabilidade.
Variabilidade E pronto!
Pelo histórico de provas anteriores, em casos semelhantes a este, em que há exigência da
Estatística Básica e da Avançada, é praxe que tenhamos que conhecer o Desvio Padrão, a
Variância e o Coeficiente de Variação.
E este conhecimento será bastante para seguirmos adiante, no estudo da Estatística
Inferencial. Ok? Adiante!
# Desvio Padrão: S
É sinônimo de Dispersão Absoluta!
Absoluta (Guarde isso!).
Essa é, de longe, a medida de dispersão mais presente em prova! E por uma razão bem
simples: além
lém da memorização das fórmulas,
fórmulas, teremos sobretudo que conhecer com segurança as
suas propriedades. Ok? Comecemos pelas fórmulas!
Aqui novamente a transição (aquela que aprendemos para as fórmulas da Média
Aritmética!) vai nos socorrer! Você só terá o trabalho de memorizar a fórmula do Desvio Padrão
para um rol. O restante das fórmulas (para
(para Dados Tabulados e para Distribuição de Frequências)
você leva de graça! (Pague uma e leve três!). Teremos:

∑ (Xi − X )
2

Desvio Padrão para Rol: S=


n
E agora você vai lembrar: a fórmula do Desvio Padrão é a fórmula da raiz! Ok?
E se aplicarmos aquela
quela nossa conhecida transição?
? Como ficarão as outras duas fórmulas?
Teremos:
1ª transição: colocando fi junto ao sinal de somatório:

∑ fi.(Xi − X )
2

Desvio Padrão para Dados Tabulados: S=


n
2ª transição: trocando Xi por PM:

∑ fi.(PM − X )
2

Desvio Padrão para Distribuição de Frequências: S=


n

Até agora, o que temos? Temos três fórmulas. Mas atenção: o Desvio Padrão é a primeira
medida deste Curso em que haverá diferença na fórmula, caso estejamos trabalhando com um
conjunto
o que represente toda a população, ou apenas uma amostra!! Entendido? Faz diferença
na fórmula do Desvio Padrão se o conjunto é a população ou se é uma amostra!
Essas três fórmulas que vimos acima servem para o cálculo do Desvio Padrão
Populacional.. Nós as aplicaremos se o conjunto for uma população! E quando saberemos que o
conjunto da questão é a população? Quando não for dito que é uma amostra!
Ou seja, a regra é a seguinte: o conjunto da questão da prova só será uma amostra se
isso for dito pelo
lo enunciado! Caso contrário, não será amostra: será população! Ok?
Mas, e se a questão disser que o conjunto é uma amostra ou, por outra, pedir o cálculo do
Desvio Padrão Amostral?

52 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
O que faremos? Ora, saberemos que amostral se refere a amostra,
amostra de sorte que todas as
três fórmulas vistas acima, que servem para o cálculo populacional, terão que sofrer uma
pequena modificação, para se adequar ao cálculo amostral. Essa pequena modificação consiste
em acrescentarmos um menos 1 no denominador. Assim, teremos:

∑ (Xi − X )
2

Desvio Padrão Amostral para Rol: S=


n −1
1ª transição: colocando fi junto ao sinal de somatório:

∑ fi.(Xi − X )
2

Desvio Padrão Amostral para Dados Tabulados: S=


n −1
2ª transição: trocando Xi por PM:

∑ fi.(PM − X )
2

Desvio Padrão Amostral para Distribuição de Frequências: S=


n −1

Mas, professor, e se a questão disser que o conjunto é uma amostra, e eu esquecer de


colocar o menos 1 no denominador da fórmula? Bem, neste caso, você errará a questão.
Simplesmente isso! Ou seja, o menos um no denominador do desvio padrão amostral é
imprescindível! Se esquecer, erra!
Aliás, só a título de informação, esse menos um é chamado de fator de correção de
Bessel.. Esse nome não é importante. Pode ser esquecido sem problemas. O que não podemos
esquecer de colocá-lo
lo na fórmula.
Pois bem, ainda não acabou o estudo das fórmulas!
Se você reparar bem as equações que já dispomos, verá que em todas elas existe um
produto notável no numerador. Repararam? É o que está no parêntese! Esse produto notável
pode ser desenvolvido, de sorte que podemos realizar um desenvolvimento algébrico com essas
fórmulas básica, até chegarmos a novas fórmulas, que nada mais serão
serão que as primeiras,
apresentadas de outro jeito.
Entendido? Obviamente que irei poupar a todos do tal desenvolvimento algébrico.
algébrico (E nem
pense que na prova você teria tempo para fazê-lo!).
fazê lo!). O que nos interessa é o resultado. Qual é a
fórmula desenvolvida do Desvio Padrão para um rol? É a seguinte:

1
Fórmula Desenvolvida do S para Rol: S =  .∑ Xi −
2
(∑ Xi ) 
2


 n   n 

E aí? O que acharam? Ninguém se assuste, por favor! Tenho certeza que se você repetir
esta fórmula umas dez vezes, na décima vez já estará parecendo fácil.
Uma pergunta: vocês acham que se tomarmos os elementos de um mesmo conjunto, e
aplicarmos a eles as duas fórmulas do Desvio Padrão, a básica e a desenvolvida, chegaremos ao
mesmo resultado? O que você diz?
Claro que sim! Trata-se,se, na verdade, de uma
uma mesma fórmula, apenas apresentada de
duas maneiras diferentes! O resultado será necessariamente o mesmo!
Então você dirá: se é assim, eu vou ficar apenas com a básica, que é menorzinha...”
menorzinha... E eu
respondo: péssimo negócio! Haverá questões que serão imediatamente
imediatamente resolvidas na prova, se
você se lembrar da equação desenvolvida! Já veremos isso.

53 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Antes, porém, precisamos conhecer também as fórmulas desenvolvidas do desvio padrão
para Dados Tabulados, e para Distribuição de Frequências!
E como faremos isso? Aplicando a transição! Teremos:
1ª transição: colocando fi junto ao sinal de somatório:
Fórmula Desenvolvida do S para Dados Tabulados:

1
S =  .∑ fi. Xi −
2
(∑ fi. Xi ) 
2


 n   n 

2ª transição: trocando Xi por PM:


Fórmula Desenvolvida do S para Distribuição de Frequências:

1
S =  .∑ fi.PM −
2
(∑ fi.PM ) 
2


 n   n 

Quase lá! Só resta lembrar que essas três fórmulas desenvolvidas do desvio padrão que
vimos acima servem apenas no caso de o conjunto trabalhado representar toda a população!
populaçã Mas
se a questão disser que o conjunto é uma amostra, ou exigir o cálculo do desvio padrão amostral,
então precisaremos modificar também as fórmulas desenvolvidas, acrescentando aquele mesmo
menos um no denominador.
Teremos:
Fórmula Desenvolvida do Desvio Padrão Amostral de um Rol:

 1  (∑ Xi ) 
2

S=  .∑ Xi − 
2

 n − 1   n 

1ª transição: colocando fi junto ao sinal de somatório:

Fórmula Desenvolvida do S Amostral para Dados Tabulados:

 1  (∑ fi. Xi ) 
2

S=  .∑ fi. Xi − 
2

 n − 1   n 

2ª transição: trocando Xi por PM:

Fórmula Desenvolvida do S Amostral para Dist. de Frequências:


Frequência

 1  (∑ fi.PM ) 
2

S=  .∑ fi.PM − 
2

 n − 1   n 

E com isso, concluímos a primeira etapa do estudo do Desvio Padrão: a memorização das
fórmulas.

54 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
A rigor, se você prestar bem atenção, são doze fórmulas. Mas você pagou apenas duas,
e levou todas as outras para casa! Como foi isso? Bastou você memorizar a fórmula básica para o
rol, e a fórmula desenvolvida para o rol. Daí, aplica-se
aplica a transição,, e pronto! E mais: se a questão
disser que o conjunto é amostra, você vai
va e põe um menos 1 no denominador!
Para estas fórmulas ficarem bem memorizadas, vou repeti-las
repeti las todas na seqüência.
Teremos:
# Fórmulas do Desvio Padrão: S

Fórmula Básica do Desvio Padrão Populacional para Rol:

∑ (Xi − X )
2

S=
n
Esta acima é a primeira que você terá realmente que memorizar!
Fórmula Básica do Desvio Padrão Populacional para Dados Tabulados:

∑ fi.(Xi − X )
2

S=
n
Fórmula Básica do Desvio Padrão Populacional para Distribuição de Frequências:

∑ fi.(PM − X )
2

S=
n
Fórmula Básica do Desvio Padrão Amostral para Rol:

∑ (Xi − X )
2

S=
n −1

Fórmula Básica do Desvio Padrão Amostral para Dados Tabulados:

∑ fi.(Xi − X )
2

S=
n −1

Fórmula Básica do Desvio Padrão Amostral para Distribuição de Frequências:

∑ fi.(PM − X )
2

S=
n −1

Fórmula Desenvolvida do Desvio Padrão Populacional para Rol:

1
S =  .∑ Xi −
2
(∑ Xi ) 
2


 n   n 

Esta acima é a segunda que você terá realmente que memorizar!

55 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Fórmula Desenvolvida do Desvio Padrão Populacional para Dados Tabulados:

1
S =  .∑ fi. Xi −
2
(∑ fi. Xi ) 
2


 n   n 

Fórmula Desenvolvida do Desvio Padrão Populacional para Distribuição de


Frequências:

1
S =  .∑ fi.PM −
2
(∑ fi.PM ) 
2


 n   n 

Fórmula Desenvolvida do Desvio Padrão Amostral para Rol:

 1  (∑ Xi ) 
2

S=  .∑ Xi − 
2

 n − 1   n 

Fórmula Desenvolvida do Desvio Padrão Amostral para Dados Tabulados:

 1  (∑ fi. Xi ) 
2

S=  .∑ fi. Xi − 
2

 n − 1   n 

Fórmula Desenvolvida do Desvio Padrão Amostral para Distribuição de Frequências:

 1  (∑ fi.PM ) 
2

S=  .∑ fi.PM − 
2

 n − 1   n 

IMPORTANTE: Reparem nestas últimas três fórmulas, que o fator de correção (o menos 1) só
entra no denominador que fica dentro do parêntese! Ok?
Temos doze fórmulas no papel. E você só precisou memorizar duas delas! As demais
saíram por transição!

# Propriedades do Desvio Padrão:


O desvio padrão não é influenciado por operações de soma ou subtração.
Assim, se umaa questão de prova nos der o seguinte rol: (101, 102, 103, 104, 105),
105) e
pedir que calculemos o seu desvio padrão, o que podemos fazer?
Ora, as contas seriam muito grandes para chegarmos à resposta! Mas você pode pensar
assim: já que soma e subtração não alteram
alteram o desvio padrão, eu posso pegar todos os elementos
desse conjunto original, e subtrair cada um deles de uma mesma constante. Cem, por exemplo. E
chegaremos a um novo conjunto, que é o seguinte: (1, 2, 3, 4, 5).
São valores mais baixos? Sim, consideravelmente!
consideravelmente! E se encontrarmos para este novo
conjunto o valor do Desvio Padrão, esse resultado encontrado será exatamente o mesmo Desvio
Padrão daquele outro conjunto original! O mesmo!

56 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
O desvio padrão somente é influenciado por operações de produto ou divisão:
multiplicaremos ou dividiremos pela própria constante.
Significa o quê? Significa que se conhecermos o desvio padrão de um conjunto original
(por exemplo, S=2), e se todos os elementos desse conjunto original forem multiplicados por
uma constante
nte (por exemplo, multiplicados por 5), então chegaremos a um novo conjunto, cujo
novo desvio padrão será o S do conjunto original também multiplicado por 5.
Entendido isso?
Muitas questões de provas recentes elaboradas pela Esaf têm explorado esse
conhecimento. São questões que nos falam em variável transformada!! Passemos a um exemplo.

Exemplo: Considere a seguinte transformação: (X-2)/3.. Se o desvio padrão da variável


transformada
formada é igual a 4, qual será o desvio padrão da variável original X?
Sol.: Sempre que o enunciado nos fornecer uma transformação da variável, já podemos, de
imediato, fazer o desenho de transformação.
transformação. Esse desenho é simples, é rápido de ser feito, e não
deixará você errar a questão de jeito nenhum!
Podemos chamar a variável transformada de Y, por exemplo. Assim, nossa transformação
é a seguinte: Y=(X-2)/3.. Fazendo a parte de cima do desenho, teremos:
1º)-2 2º)÷3

Xi Yi

Todos entenderam como se fez esse caminho de ida do desenho acima? Tomamos a
variável original X e, com ela, realizamos duas operações (aquelas da transformação!):
subtraímos todo mundo por 2, e depois dividimos todo mundo por 3.
E se agora resolvermos desenhar o caminho de volta,, ou seja, as operações que nos farão
voltar à variável original. O que faremos? Fácil: inverteremos as operações do caminho de ida. Só
isso! Nada mais fácil. Teremos:
1º)-2 2º)÷3

Xi Yi

2º)+2 1º)x3

Observem todos que se inverteu também a seqüência das operações: onde terminou lá
em cima, começou aqui embaixo; e onde começou lá em cima, acabou cá em baixo. Ok? Pronto!
Não dá mais para errar essa questão!
O dado fornecido pelo enunciado foi que o Desvio Padrão da variável transformada é igual
a 4. Quem é a variável transformada? É o Y.. Assim, do lado do Y, teremos que:

57 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
1º)-2 2º)÷3

Xi Yi Sy=4,0

2º)+2 1º)x3

Mas o Sy não me interessa! Interessa-me


Interessa me o Sx. Assim, partindo do Desvio Padrão de um
lado, chegarei ao Desvio Padrão do outro! Para tanto, precisarei percorrer as operações do
caminho
inho adequado (de cima ou de baixo), lembrando-me
lembrando me das propriedades do Desvio Padrão!
Façamos isso: estamos partindo com Sy=4. A primeira operação que surge no caminho de
volta (de baixo) é um produto! Você vai fazer esse produto? Claro que sim! (Desvio padrão
pa só
não é alterado por soma e subtração!). Teremos:
4 x 3 = 12
Por enquanto, temos S=12. Na seqüência, surge uma soma (+2). Faremos essa soma? O
que vocês me dizem? Não! E por que não faremos? Porque operações de soma (ou subtração)
não alteram o desvio
esvio padrão. Passaremos direto pela soma, e teremos, enfim, que:
Sx=12,00
Entendido?
Alguém se lembra de como são as propriedades da Média Aritmética? Não? Elas cabem
todas numa única frase. Ninguém lembra? A Média é influenciada pelas quatro operações!
operaçõ
Assim, se a questão nos falasse sobre aquela mesma transformação da variável que vimos
acima, e dissesse ainda que a média da variável transformada é igual a Y =8,0, e pedir que
calculemos a média da variável original ( X )? Vejamos:

1º)-2 2º)÷3

Xi Yi Y =8,0

2º)+2 1º)x3

Ora, simplesmente percorreremos as operações do caminho de volta (caminho de baixo),


lembrando-nos
nos das propriedades da Média, já que é com ela que estamos trabalhando.
Se a Média é influenciada pelas quatro operações, então qualquer conta que aparecer
neste caminho
aminho de volta nós teremos que realizar. Assim, teremos que:
8 x 3 = 24 e 24 +2 =26

Ou seja: X =26,0

58 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
# Variância: S2
Neste momento, vou aproveitar a ótima oportunidade, e dizer a todos que a próxima
medida de dispersão que iremos estudar será a chamada Variância.
Precisamos saber, precisamente agora, que a Variância é, conceitualmente, o quadrado do
Desvio Padrão!
Ou seja: Variância = (Desvio Padrão)2
Ou seja de novo: Variância = S2
Ora, sabendo disso, e sabendo também que todas as fórmulas do desvio padrão têm raiz
quadrada, se as elevarmos ao quadrado, o que ocorrerá com todas elas? Perderão o sinal da raiz.
Só isso!
Em suma: se eu conheço as fórmulas do Desvio Padrão, então também conheço as
fórmulas da Variância: basta
sta tirar o sinal da raiz! Assim, teremos:
# Fórmulas da Variância:

Fórmula Básica da Variância Populacional para Rol:

S 2
=∑
(Xi − X )2

n
Fórmula Básica da Variância Populacional para Dados Tabulados:

∑ fi.(Xi − X )
2

S 2
=
n
Fórmula Básica da Variância Populacional para Distribuição de Frequências:
Frequência

∑ fi.(PM − X )
2

S 2
=
n
Fórmula Básica da Variância Amostral para Rol:

S 2
=∑
(Xi − X )2

n −1
Fórmula Básica da Variância Amostral para Dados Tabulados:

∑ fi.(Xi − X )
2

S 2
=
n −1
Fórmula Básica da Variância Amostral para Distribuição de Frequências:
Frequência

∑ fi.(PM − X )
2

S 2
=
n −1
Fórmula Desenvolvida da Variância Populacional para Rol:

1
S =  .∑ fi. Xi −
2 2
(∑ fi. Xi ) 
2


 n   n 

59 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Fórmula Desenvolvida da Variância Populacional para Dados Tabulados:

1
S =  .∑ fi. Xi −
2 2
(∑ fi. Xi ) 
2


 n   n 

Fórmula Desenvolvida da Variância Populacional para Distribuição de Frequências:

1
S =  .∑ fi.PM −
2 2
(∑ fi.PM ) 
2


 n   n 
Fórmula Desenvolvida da Variância Amostral para Rol:

 1  (∑ Xi ) 
2

S = .∑ Xi − 
2 2

 n − 1   n 

Fórmula Desenvolvida da Variância Amostral para Dados Tabulados:

 1  (∑ fi. Xi ) 
2

S = .∑ fi. Xi − 
2 2

 n − 1   n 
Fórmula Desenvolvida da Variância Amostral para Distribuição de Frequências:

 1  (∑ fi.PM ) 
2

S = .∑ fi.PM − 
2 2

 n − 1   n 

Vejam que negócio da China nós fizemos: memorizamos duas fórmulas (as duas do rol), e
levamos vinte e quatro
o para casa! Pague duas, e leve vinte e quatro! Excelente, não acham?
Basta você lembrar de fazer a transição, e lembrar de pôr o menos 1 no denominador, se
o conjunto for uma amostra!
Pois bem! Ainda não acabamos o estudo do Desvio Padrão. Eu apenas abri um parêntese,
para aproveitar as suas fórmulas que estavam no papel, para mostrar que bastava tirar o sinal da
raiz, e já estaremos com as fórmulas da Variância.
Voltemos agora ao estudo das Propriedades do Desvio Padrão.

# Propriedades do Desvio Padrão:


Pa
O desvio padrão não é influenciado por operações de soma ou subtração.
Assim, se uma questão de prova nos der o seguinte rol: (101, 102, 103, 104, 105),
105) e
pedir que calculemos o seu desvio padrão, o que podemos fazer?
Ora, as contas seriam muito grandes para chegarmos à resposta! Mas você pode pensar
assim: já que soma e subtração não alteram o desvio padrão, eu posso pegar todos os elementos
desse conjunto original, e subtrair cada um deles de uma mesma constante. Cem, por exemplo. E
chegaremos a um novo conjunto, que é o seguinte: (1, 2, 3, 4, 5).
São valores mais baixos? Sim, consideravelmente! E se encontrarmos para este novo
conjunto o valor do Desvio Padrão, esse resultado encontrado será exatamente o mesmo Desvio
Padrão daquele outro conjunto
unto original! O mesmo!

60 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
O desvio padrão somente é influenciado por operações de produto ou divisão:
multiplicaremos ou dividiremos pela própria constante.
Significa o quê? Significa que se conhecermos o desvio padrão de um conjunto original
(por exemplo,
lo, S=2), e se todos os elementos desse conjunto original forem multiplicados por
uma constante (por exemplo, multiplicados por 5), então chegaremos a um novo conjunto, cujo
novo desvio padrão será o S do conjunto original também multiplicado por 5.
Entendido isso?
Muitas questões de provas recentes elaboradas pela Esaf têm explorado esse
conhecimento. São questões que nos falam em variável transformada!! Passemos a um exemplo.

Exemplo: Considere a seguinte transformação: (X-2)/3.. Se o desvio padrão da variável


transformada é igual a 4, qual será o desvio padrão da variável original X?
Sol.: Sempre que o enunciado nos fornecer uma transformação da variável, já podemos, de
imediato, fazer o desenho de transformação.
transformação. Esse desenho é simples, é rápido de ser feito, e não
deixará você errar a questão de jeito nenhum!
Podemos chamar a variável transformada de Y, por exemplo. Assim, nossa transformação
é a seguinte: Y=(X-2)/3.. Fazendo a parte de cima do desenho, teremos:
1º)-2 2º)÷3

Xi Yi

Todos entenderam como se fez esse caminho de ida do desenho acima? Tomamos a
variável original X e, com ela, realizamos duas operações (aquelas da transformação!):
subtraímos todo mundo por 2, e depois dividimos todo mundo por 3.
E se agora resolvermos desenhar o caminho de volta,, ou seja, as operações que nos farão
voltar à variável original. O que faremos? Fácil: inverteremos as operações do caminho de ida. Só
isso! Nada mais fácil. Teremos:
1º)-2 2º)÷3

Xi Yi

2º)+2 1º)x3

Observem todos que inverteu-se


inverteu se também a seqüências das operações: onde terminou lá
em cima, começou aqui embaixo; e onde começou lá em cima, acabou cá em baixo. Ok? Pronto!
Não dá mais para errar essa questão!
O dado fornecido pelo enunciado foi que o Desvio
Desvio Padrão da variável transformada é igual
a 4. Quem é a variável transformada? É o Y.. Assim, do lado do Y, teremos que:

61 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
1º)-2 2º)÷3

Xi Yi Sy=4,0

2º)+2 1º)x3

Mas o Sy não me interessa! Interessa-me


Interessa me o Sx. Assim, partindo do Desvio Padrão de um
lado, chegarei ao Desvio Padrão do outro! Para tanto, precisarei percorrer as operações do
caminho
inho adequado (de cima ou de baixo), lembrando-me
lembrando me das propriedades do Desvio Padrão!
Façamos isso: estamos partindo com Sy=4. A primeira operação que surge no caminho de
volta (de baixo) é um produto! Você vai fazer esse produto? Claro que sim! (Desvio padrão
pa só
não é alterado por soma e subtração!). Teremos:
4 x 3 = 12
Por enquanto, temos S=12. Na seqüência, surge uma soma (+2). Faremos essa soma? O
que vocês me dizem? Não! E por que não faremos? Porque operações de soma (ou subtração)
não alteram o desvio
esvio padrão. Passaremos direto pela soma, e teremos, enfim, que:
Sx=12,00
Entendido?
Alguém se lembra de como são as propriedades da Média Aritmética? Não? Elas cabem
todas numa única frase. Ninguém lembra? A Média é influenciada pelas quatro operações!
operaçõ
Assim, se a questão nos falasse sobre aquela mesma transformação da variável que vimos
acima, e dissesse ainda que a média da variável transformada é igual a Y =8,0, e pedir que
calculemos a média da variável original ( X )? Vejamos:
1º)-2 2º)÷3

Xi Yi Y =8,0

2º)+2 1º)x3

Ora, simplesmente percorreremos as operações do caminho de volta (caminho de baixo),


lembrando-nos
nos das propriedades da Média, já que é com ela que estamos trabalhando.
Se a Média é influenciada pelas quatro operações, então qualquer conta que aparecer
neste caminho
minho de volta nós teremos que realizar. Assim, teremos que:
8 x 3 = 24 e 24 +2 =26

Ou seja: X =26,0
Pois bem! Só falta misturar tudo agora com as propriedades da Variância. Vejamos quais
são elas:

62 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
# Propriedades da Variância:

A Variância não é influenciada por operações de soma ou subtração.


Mesmo entendimento que tivemos para o desvio padrão!

A Variância somente é influenciada por operações de produto ou divisão:


multiplicaremos ou dividiremos pelo quadrado da constante.

Ou seja, se a variância de um conjunto original é 2, e nós multiplicarmos todos os seus


elementos por uma constante (3, por exemplo), qual será a nova variância? A nova variância será
igual à anterior, agora multiplicada pelo quadrado da constante, ou ou seja, multiplicada pelo
quadrado de 3, ou seja, multiplicada por 9.
Vejamos o exemplo abaixo:
Exemplo: Considere a seguinte transformação: (X-2)/3.. Se a variância da variável
transformada é igual a 5, qual será o desvio padrão da variável original X?
Sol.: Também em questões de variância poderemos trabalhar com a tal da variável
transformada. Todos viram que há uma transformação bem aí, no enunciado? Ótimo! Podemos
fazer, de pronto, o desenho de transformação.
Teremos:
1º)-2 2º)÷3

Xi Yi

2º)+2 1º)x3

Mas o que nos disse o enunciado? Que a variância do lado do Y é igual a 5. Assim,
teremos:
1º)-2 2º)÷3

Xi Yi S2y=5,0

2º)+2 1º)x3
E o que faremos agora? Percorreremos as operações do caminho de volta (em vermelho),
lembrando-nos
nos das propriedades da variância, já que agora é com ela que estamos trabalhando!
Teremos:
Logo de cara surgiu um produto! Você multiplica? Sim. Mas multiplica por 3 ou pelo
quadrado de 3? Pelo quadrado!
adrado! Pois é exatamente o que reza a propriedade do produto (ou
divisão)!

63 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Assim, teremos:
5 x (3)2 = 5 x 9 = 45
Na seqüência surge uma soma (+2). Você vai somar? Claro que não, uma vez que soma
não altera a variância! OK?
Para matarmos várias questões de provas recentes, resta-nos
resta nos ainda conhecer a próxima
medida de dispersão: o coeficiente de variação. Vamos lá!

# Coeficiente de Variação: CV
O CV é também conhecido por dispersão relativa!
Conceitualmente, teremos que:
S
CV =
X
Estão lembrados que o desvio padrão também se chama dispersão absoluta?
Pois bem! O CV é dito dispersão relativa,, exatamente porque ele é igual à dispersão
absoluta (o desvio padrão) em relação a alguém. E esse alguém é a Média Aritmética! Ok?
Precisamos s saber ainda que o CV é uma medida adimensional,, ou seja, não depende da
unidade da variável trabalhada!
Essa informação já caiu muitas vezes, em questões teóricas de provas mais antigas!
Mas o que significa isso? Ora, considere que estamos com um conjunto
con que representa os
pesos de um grupo de crianças. Ok? Assim, nossa variável é peso, e é medida na unidade quilos.
Assim, se calcularmos a Média, será um valor em kg. Se calcularmos o desvio padrão, será um
valor em Kg. Finalmente, colocando Desvio Padrão
Padrão e Média na fórmula do CV, teremos que Kg
corta com Kg.
Conclusão: o CV é adimensional. (Isso não cai mais em prova há um bom tempo...)
Finalmente, vejamos o seguinte exemplo:
Exemplo: Considere a seguinte transformação: Y=(X-2)/3.. Sabendo que, para a variável
transformada Y,, a média é igual a 8,0 e o desvio padrão é igual a 4,0, calcule o coeficiente de
variação da variável original X.
Sol.: Esta é, talvez, a mais típica das questões de uma prova de estatística básica! Cai o tempo
todo em prova! Ora, o enunciado apresentou uma transformação da variável? O que você diz?
Sim! Daí, nosso primeiro passo será desenhar essa transformação. Teremos:
1º)-2 2º)÷3

Xi Yi

2º)+2 1º)x3

O que foi mais que a questão nos disse? Disse-nos


Disse nos que a variável transformada Y possui
dois valores já conhecidos: a média (igual a 8) e o desvio padrão (igual a 4). Teremos:
Ter

64 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
1º)-2 2º)÷3

Xi Yi Y =8,0 e Sy=4,0

2º)+2 1º)x3

E a questão pede o cálculo do CV do lado da variável X.


Ora, sabemos que CV=desvio padrão/média.
padrão/média
Mas não conhecemos nem o desvio padrão e nem a média, do lado do X. Mas os
conhecemos a ambos do lado do Y. Assim, tomaremos as duas medidas, uma por vez, e as
transportaremos para o lado do X.
Como faremos isso? Percorrendo as operações do caminho de volta, e recordando as
propriedades da média e do desvio padrão. Já fizemos isso agora há pouco. Teremos:
Média: 8x3=24 e 24+2=26
Desvio Padrão: 4x3=12 e só!
Assim, teremos que:
1º)-2 2º)÷3

CVx=12/26=0,461 Xi Yi Y =8,0 e Sy=4,0

2º)+2 1º)x3

65 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
# Probabilidade:
Pelo exame das últimas questões de concurso (sobretudo da Esaf), percebemos que há sete
tópicos relacionados à Probabilidade, os quais, se bem compreendidos, serão a chave para
acertarmos qualquer questão de prova. Senão, vejamos!
Esses referidos tópicos são os seguintes:
Conceito de probabilidade;
Árvore de probabilidades;
Situações excludentes;
“Caminho de probabilidades”
Eventos independentes;
Probabilidade da união de dois eventos; e
Probabilidade condicional.

Aprenderemos esses tópicos, um a um, por meio da resolução de exercícios diversos.

# Conceito de Probabilidade:
Exemplo 01) Uma urna contém dez bolinhas, sendo quatro delas azuis azu e seis
vermelhas. Ao retirar aleatoriamente uma dessas bolas da urna, qual a probabilidade
que ela seja vermelha?

Sol.:
O conceito de Probabilidade é facílimo. Trata-se
Trata de uma divisão!
Antes de mais nada, convém saber que a questão de Probabilidade é inconfundível.
Haverá no enunciado sempre a pergunta: Qual a probabilidade de ...? No máximo, a questão
trocará a palavra probabilidade pela palavra chance.. (Mas isso também não é algo comum de
ocorrer)!
Daí, procuraremos saber qual é a probabilidade de realização de um determinado evento!
Teremos, então, que o conceito que buscamos é o seguinte:
n° de resultados favoráveis
Probabilidade =
n° de resultados possíveis
Pois bem! Vejamos como é fácil a coisa. Qual é o evento em análise neste exemplo?
Retirar uma bola azul da urna! Ora, a tal urna contém dez bolas. Daí, se quero retirar apenas
uma delas, quantos serão os resultados possíveis para essa retirada? Dez, é claro! Já temos o
nosso denominador!
Passemos ao numerador, os resultados favoráveis.. A pergunta é: favoráveis a quem?
Favoráveis à realização do evento! Ora, se eu pretendo retirar uma bola azul da urna, então
quantos serão os resultados que satisfarão essa exigência do evento (bola azul)? Quatro! (Só há
quatro bolas azuis na urna!).
De posse dos resultados favoráveis e possíveis para o evento em tela, faremos:
P = 4 / 10 = 0,40 = 40% Resposta!

66 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
De antemão, convém sabermos que a Probabilidade tem valor máximo de 100%. Neste
caso (P=100%), estaremos diante do chamado evento certo!
Por exemplo: qual a probabilidade de obtermos um valor menor que 7 no lançamento de
um dado? Ora, trata-sese de um evento certo! Há aqui uma certeza matemática! A probabilidade
probabili
será, portanto, de 100%.
A ideia oposta ao do evento certo é a do evento impossível:: aquele cuja probabilidade de
ocorrência é de 0% (zero por cento)! Exemplo: qual a probabilidade de eu ganhar na loteria sem
jogar? Nenhuma! Qualquer criança acerta essa resposta!
Entre um evento impossível e um evento certo, infindáveis são as possibilidades (e as
probabilidades!).
Este é, pois, o conceito de probabilidade! Façamos outro exemplo:

Exemplo 02) Uma urna contém dez bolinhas, numeradas de 1 a 10. Ao retirar
aleatoriamente uma dessas bolas da urna, qual a probabilidade que ela tenha um
número par?

Sol.:
Retomemos o nosso conceito:
n° de resultados favoráveis
Probabilidade =
n° de resultados possíveis
O evento agora é retirar uma bola da urna, e queremos que ela seja par!
Daí, para retirar uma bola de urna que contém dez bolas, haverá – irrefutavelmente – dez
resultados possíveis! Concordam? (Já temos o denominador!)
Acerca do numerador, perguntaremos: qual é a exigência do evento? É que a bola retirada
tenha um número par. Quantos são os resultados que atendem, que satisfazem, essa exigência?
Ora, são cinco (as bolas de números 2, 4, 6, 8 e 10).
Pronto! Lançando os valores no conceito, teremos:
P=(5/10)=0,50=50% Resposta!

# Situações Excludentes, Árvore de Probabilidades e Eventos Independentes:


Vejamos esses conceitos, por meio do exemplo seguinte:
Exemplo 03) (TCE-RN
RN 2000 ESAF) A probabilidade de um gato estar vivo daqui a 5
anos é 3/5. A probabilidade de um cão estar vivo daqui a 5 anos é 4/5. Considerando
os eventos independentes,
dependentes, a probabilidade de somente o cão estar vivo daqui a 5 anos
é de:

Sol.:
Vamos analisar a primeira frase do enunciado: “a probabilidade de um gato estar vivo
daqui a 5 anos é 3/5”.
Temos que nos habituar a ler uma frase que fala da probabilidade
probabilidade de ocorrência de um
evento, já tentando vislumbrar se existe uma situação excludente para aquele evento. Como é
isso? Ora, o evento que estamos tratando é o gato estar vivo daqui a 5 anos.anos A situação
excludente para o gato estar vivo é justamente o gato estar morto!

67 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Claro! Por que razão chamamos situações excludentes? ? Porque uma exclui a outra! Ou
seja, se o gato estiver vivo é porque não estará morto; e vice-versa:
vice versa: se estiver morto é porque
não estará vivo. E não há uma terceira possibilidade!
O que devemos saber sobre as situações excludentes? Devemos saber que a soma das
probabilidades de ocorrência de situações excludentes será sempre igual a 100%.
Ou seja, se somarmos a probabilidade de o gato estar vivo daqui a cinco anos e a
probabilidade de o gato estar morto daqui a cinco anos, teremos que 100% será o resultado
desta soma!
Daí, sabendo que a probabilidade de o gato estar vivo é de (3/5), então a fração que
representará o evento de o gato estar morto será exatamente de (2/5). Claro! Pois somando
(2/5) a (3/5) dará igual a 1, que é 100%.
Ora, apenas analisando essa primeira frase, já podemos começar a compor a nossa
árvore de probabilidades!! O que é isso? É apenas um desenho, que nos ajudará a enxergar
melhor a questão. Daí, até aqui, teremos
ter que:
VIVO (3/5)

GATO
MORTO (2/5)
Prosseguindo a leitura do enunciado, é dito que a probabilidade de um cão estar vivo
daqui a 5 anos é 4/5.. Facilmente conseguimos imaginar a situação excludente para o cão estar
vivo. Qual
al será? O cão estar morto! Claro! E se somarmos essas duas probabilidades (cão vivo e
cão morto), o resultado será 100% (ou então 1, se estivermos trabalhando com a notação
unitária)!
Daí, de quanto será a probabilidade de o cão estar morto daqui a cinco anos? É a fração
que falta a 4/5 para chegar a 5/5, ou seja, para chegar a 100%. Será, portanto, de 1/5.
Com isso, já dá para completarmos a árvore de probabilidades dessa questão.
Teremos:
VIVO (3/5)

GATO
MORTO (2/5)

VIVO (4/5)

CÃO
MORTO (1/5)

Pois bem! Até aqui, já aprendemos a desenhar uma árvore de probabilidades,


probabilidades e a saber
o que são situações excludentes,
excludentes, e que a soma das probabilidades dessas situações
excludentes será sempre 100% (ou sempre 1, que é o mesmo que 100%)!
Prosseguindo a leitura do enunciado, veremos o seguinte: “Considerando os eventos
independentes...”
Então esses quatro eventos que temos acima na árvore de probabilidades (gato vivo, gato
morto, cão vivo, cão morto) são eventos independentes!
O que temos que saber acerca de eventos independentes? ? Apenas que se quisermos
calcular a probabilidade de ocorrência
ocorrência simultânea de dois ou mais desses eventos, teremos que
multiplicar as probabilidades de cada um deles.

68 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Ou seja, se temos que:
P(cão vivo)=4/5 e P(gato vivo)=3/5
E quisermos saber a probabilidade, ao mesmo tempo,, de o cão estar vivo e de o gato
estar vivo, faremos:
P(gato vivo & cão vivo) = P(gato vivo) x P(cão vivo) = (3/5) x (4/5) = 12/25
Então é isso que precisamos saber sobre eventos independentes!
independentes
Agora retornemos ao enunciado: a probabilidade de somente o cão estar vivo daqui
a 5 anos é de?

A palavra chave dessa pergunta é a palavra somente!! Ora, a questão falava de duas
figuras: o cão e o gato. Se se deseja saber a probabilidade de somente o cão estar vivo daqui a
5 anos, podemos traduzir essa pergunta de outra forma: “Qual a probabilidade de o cão estar
vivo daqui a 5 anos & o gato estar morto?”
Ora, se quero somente o cão vivo, é porque quero também o gato morto!
Olhemos de novo para a nossa árvore de probabilidades:
VIVO (3/5)

GATO
MORTO (2/5)

VIVO (4/5)

CÃO
MORTO (1/5)

Já vimos que esses eventos (cão vivo & gato morto) são eventos independentes! Daí, se
procuramos a probabilidade de ocorrência simultânea desses dois eventos, faremos:
P(cão vivo & gato morto)= P(cão vivo) x P(gato morto)
P(cão vivo & gato morto)= (4/5)x(2/5) =8/25
=8/25 (Resposta!)

Com base nessa resolução, você já temos plenas condições de resolver a questão
seguinte, que por sinal também é da Esaf, e foi cobrada na prova do MPOG/2003. Foi a seguinte:

EXEMPLO 04) (MPOG/2003/ESAF) Paulo e Roberto foram indicados para participarem


de um torneio de basquete. A probabilidade de Paulo ser escolhido para participar do
torneio é 3/5. A probabilidade de Roberto ser escolhido para participar
par do mesmo
torneio é 1/5. Sabendo que a escolha de um deles é independente da escolha do outro,
a probabilidade de somente Paulo ser escolhido para participar do torneio é igual a:
a) 4/5 b) 10/25 c) 12/25 d) 3/5 e) 4/5
Sol.:
Procuremos, na primeira
imeira leitura, verificar a existência de algum evento que admita uma
situação excludente. Tem? Sim: Paulo ser escolhido! Qual seria a situação excludente?
excludente Ora, seria
Paulo não ser escolhido,, obviamente! O mesmo se dá para o evento Roberto ser escolhido,
escolhido cuja
situação excludente seria Roberto não ser escolhido.
escolhido
Aprendemos há pouco que a soma das probabilidades de situações excludentes é sempre
igual a 100%. Daí, nossa árvore de probabilidades para esse exemplo será a seguinte:

69 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
PARTICIPAR (3/5)

PAULO
NÃO PARTICIPAR (2/5)

PARTICIPAR (1/5)

ROBERTO
NÃO PARTICIPAR (4/5)

A questão também informa que estamos diante de eventos independentes!


independentes Ou seja, caso
queiramos descobrir a probabilidade
probabil simultânea de mais de um deles, teremos que fazer o
produto das respectivas probabilidades!
Por fim, a questão pergunta qual é a probabilidade de somente o Paulo participar do
torneio. Ora, ninguém se engana mais! Traduziremos esse questionamento da seguinte forma:
Qual a probabilidade de o Paulo participar &,, ao mesmo tempo, de o Roberto não participar do
torneio? Entendido? Teremos:

PARTICIPAR (3/5)

PAULO
NÃO PARTICIPAR (2/5)

PARTICIPAR (1/5)

ROBERTO
NÃO PARTICIPAR (4/5)

P(Paulo participar & Roberto não participar) = (3/5) x (4/5) = 12/25 Resposta!

# Caminho de Probabilidades:
Conheceremos esse conceito por meio do exemplo seguinte:
EXEMPLO 05) Um juiz de futebol possui três cartões no bolso. Um é todo amarelo, o
outro é todo vermelho e o terceiro é vermelho de um lado e amarelo do outro. Num
determinado jogo, o juiz retira, ao acaso, um cartão do bolso e mostra, também ao
acaso, uma face do cartão a um jogador. Assim,
Assim, a probabilidade de a face que o juiz vê
ser vermelha e de a outra face, mostrada ao jogador, ser amarela é igual a:
Sol.:
Começaremos analisando a questão dos cartões que o juiz tem no bolso. São três, e o
enunciado disse que o juiz irá tirar qualquer
qualquer um deles, de forma aleatória! Ora, se a retirada é
feita de forma aleatória, a probabilidade de ser retirado qualquer dos três cartões será a mesma e
igual a 1/3 (um cartão favorável em três possíveis)!

Daí, já podemos começar a desenhar nossa árvore de probabilidades!


probabilidades Teremos:

70 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Cartão (vermelho-vermelho)
(vermelho (1/3)

Cartão (amarelho-amarelo)
(amarelho (1/3)

Cartão (amarelo-vermelho)
(amarelo (1/3)

Só que a questão não pára por aí. Segue com a seguinte pergunta: qual a probabilidade
de, ao retirar o cartão do bolso, a face vermelha fique voltada para o juiz e a face amarela fique
voltada para o jogador?
Ora, para que fique uma cor voltada para o juiz e outra cor voltada para o jogador, é
óbvio que o cartão retirado do bolso terá que ser o de duas cores! De outra forma, seria
impossível. Concordam?
Ocorre que, ao retirar o cartão de duas cores do bolso, surgem aqui duas novas situações,
as quais deverão ser acrescidas à nossa árvore de probabilidades! São as seguintes:

Cartão (vermelho-vermelho)
(vermelho (1/3)

Cartão (amarelho-amarelo)
(amarelho (1/3)

Face Vermelha p/ o juiz e


Face Amarela p/ o jogador
Cartão (amarelo-vermelho)
(amarelo (1/3)
Face Amarela p/ o juiz e
Face Vermelha p/
p o jogador

Observemos que essas duas novas situações são também situações excludentes!
excludentes Claro! Se
ocorrer a de cima, é porque não ocorreu a de baixo, e vice-versa!
vice versa! Como são apenas duas
situações excludentes,, as probabilidades de cada uma ocorrer é 1/2.

Concluindo, portanto, nossa árvore de probabilidades, teremos:

71 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Cartão (vermelho-vermelho)
(vermelho (1/3)

Cartão (amarelho-amarelo)
(amarelho (1/3)

Vermelho p/ o juiz e (1/2)


Amarelo p/ o jogador
Cartão (amarelo-vermelho)
(amarelo (1/3)
Amarelo p/ o juiz e (1/2)
Vermelho p/ o jogador

Aqui, olhando para essa árvore acima, veremos que surge um novo conceito! Estamos
falando do caminho de probabilidades!
probabilidades O que é isso? É tão-somente
somente um caminho em que há
duas (ou mais) probabilidades que se sucedem! Ou em outras palavras, é um caminho em que há
mais de um evento, de modo que um é posterior ao outro.
Olhando para o desenho acima, vemos que existem dois caminhos
inhos de probabilidade.
probabilidade
Vou destacar primeiro um, e depois o outro. Vejamos:

Cartão (vermelho-vermelho)
(vermelho (1/3)

Cartão (amarelho-amarelo)
(amarelho (1/3)

Vermelho p/ o juiz e (1/2)


Amarelo p/ o jogador
Cartão
o (amarelo-vermelho)
(amarelo (1/3)
Amarelo p/ o juiz e (1/2)
Vermelho p/ o jogador

Está em azul nosso caminho de probabilidades.


probabilidades. Nele, vemos que um evento se sucede
ao outro. O primeiro é a escolha do cartão de duas faces; o segundo é o fato de a face vermelha
ficar voltada para o juiz, e a amarela para o jogador!
O que interessa saber acerca de um caminho de probabilidade é que quando
estivermos diante de um, não nos interessará mais a probabilidade individual de um evento ou do
outro: interessar-nos-á a probabilidade de todo o caminho!
caminho
E para descobrirmos a probabilidade que é o resultado de um caminho de
probabilidades,, teremos sempre que multiplicar as probabilidades individuais de cada evento
que compõe aquele caminho.
Daí, para chegarmos à probabilidade que resulta deste caminho azul acima, faremos
(1/3)x(1/2), e chegaremos ao seguinte:

72 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Cartão (vermelho-vermelho)
(vermelho (1/3)

Cartão (amarelho-amarelo)
(amarelho (1/3)

Vermelho p/ o juiz e (1/2) ⇒ (1/6)


Amarelo p/ o jogador
Cartão (amar.-verm.) (1/3)
Amarelo p/ o juiz e (1/2)
Vermelho p/ o jogador

Essa probabilidade que encontramos (1/6) é o resultado deste caminho de


probabilidade e representa a ocorrência dos dois eventos que compõem este caminho.
Ou seja, (1/6) é justamente a probabilidade de a face que o juiz vê ser vermelha e
amarela. É exatamente isso o que a questão está
de a outra face, mostrada ao jogador, ser amarela.
perguntando!
Daí, nossa resposta, encontrada apenas pelo resultado de um caminho de
probabilidades, é igual a (1/6).
(1/6)
Observemos que para acertar essa questão, tivemos que usar os seguintes
conhecimentos: 1º) saber o que são situações excludentes;; 2º) saber desenhar uma
um árvore de
probabilidades;; 3º) saber o que é um caminho de probabilidades,, e como se chega a sua
probabilidade resultante!

Passemos a mais um exemplo!

EXEMPLO 06) (SERPRO 2001 ESAF) Há apenas dois modos, mutuamente excludentes,
de Genésio ir para Genebra participar de um congresso: ou de navio ou de avião. A
probabilidade de Genésio ir de navio é de 40% e de ir de avião é de 60%. Se ele for de
navio, a probabilidade de chegar ao congresso
congresso com dois dias de atraso é de 8,5%. Se
ele for de avião a probabilidade de chegar ao congresso com dois dias de atraso é de
1%. Sabe-sese que Genésio chegou com dois dias de atraso para participar do congresso
em Genebra. A probabilidade de ele ter ido de
d avião é:
Sol.:
Numa leitura calma deste enunciado, vemos que ele é todo muito propício para que
façamos o desenho da árvore de probabilidades,
probabilidades, observando atentamente as situações
excludentes que nos são apresentadas!
Senão, vejamos: a primeira coisa que
que nos diz a questão é que o Genésio só pode viajar de
dois modos: navio ou avião.. E diz também que estes dois modos de ele viajar são mutuamente
excludentes!! Ora, aqui foi dito de forma expressa: são duas situações excludentes!
Foi dito ainda quais são as probabilidades de o Genésio viajar de navio e de avião.
Daí, já podemos iniciar o desenho da árvore de probabilidades!
Teremos:

73 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Navio (40%)

Avião (60%)

Só uma observação: na hora que o enunciado falou que viajar de navio e viajar de avião
são situações excludentes, e acrescentou que a probabilidade de o Genésio ir de navio é de 40%,
então não seria necessário ter informado que a probabilidade de ele ter ido de avião é de 60%. Já
seria nossa obrigação saber disso, uma vez que a soma das probabilidades de situações
excludentes é sempre 100%. Não é verdade?
Pois bem! Só que o enunciado não parou por aí! Surgem, na seqüência da leitura, mais
duas outras situações. Quer tenha o Genésio viajado de navio, quer tenha viajado de avião,
avião ele
poderá chegar com atraso ao congresso! Isso é dito pelo enunciado!
E se pode chegar com atraso, nós já somos capazes de deduzir que, contrariamente, ele
pode também chegar em tempo,
tempo, ou seja, sem atraso. É evidente que se Genésio chegar em
tempo é porque
que não atrasou; e se atrasar, é porque não conseguiu chegar em tempo.
Concordam? Ou seja, essas duas situações – chegar atrasado e chegar em tempo – são situações
excludentes! O enunciado traz quais são as probabilidades de Genésio chegar atrasado nos dois
doi
casos (tendo ido de navio e tendo ido de avião), de modo que já teremos como completar a
nossa árvore de probabilidades, da seguinte forma:
Atrasado (8,5%)
Navio (40%)
Em tempo (91,5%)

Atrasado (1%)
Avião (60%)
Em tempo (99%)
Boa oportunidade essa para nós explorarmos o desenho acima!
Quantos caminhos de probabilidade nós temos nessa árvore de probabilidades?
Temos quatro caminhos:
1º) viajar de navio & chegar atrasado;
2º) viajar de navio & chegar em tempo;
3º) viajar de avião & chegar atrasado;
4º) viajar de avião & chegar em tempo.
Já sabemos que, diante de um caminho de probabilidades, as probabilidades individuais
já deixaram de ser interessantes para nós! Só nos vão interessar as probabilidades resultantes de
cada caminho! Sabemos também que, para chegar a essas probabilidades resultantes,
resultantes teremos
que multiplicar as probabilidades individuais de cada caminho! Não é isso mesmo? É isso
mesmo!
árvor e esses caminhos,, caso a questão fizesse uma dessas
Daí, analisemos esta árvore
seguintes perguntas:

74 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
1) Qual a probabilidade de Genésio ir de navio e de chegar atrasado?
O que lhes parece? Será que isso que está sendo pedido acima é o resultado de algum
? Claro!
caminho de probabilidade? Claro É logo do primeiro caminho! Vejamos:
Atrasado (8,5%)
Navio (40%)
Em tempo (91,5%)

Atrasado (1%)
Avião (60%)
Em tempo (99%)
Daí, multiplicando-se
se as probabilidades individuais desse caminho, teremos:
(0,40)x(0,085)= 0,034 = 3,4% Resposta!
Na linguagem da probabilidade, diremos: P(navio & atrasado)=0,034

2) Qual a probabilidade de Genésio ir de avião e chegar atrasado?


Novamente a pergunta feita acima nos remete a um dos caminhos de probabilidade. Qual
deles? O terceiro. Vejamos:

Atrasado (8,5%)
Navio (40%)
Em tempo (91,5%)

Atrasado (1%)
Avião (60%)
Em tempo (99%)

Multiplicando-se as probabilidades individuais desse caminho, teremos:


(0,60)x(0,01)= 0,006 = 0,6% Resposta!
Na linguagem da probabilidade, diremos: P(avião & atrasado)=0,006

3) Qual a probabilidade de Genésio chegar atrasado?


A pergunta aqui foi diferente! Só falou no evento “atraso”, sem estabelecer o meio de
transporte! Daí, fica claro que há dois caminhos que nos conduzem a esse resultado chegar
atrasado.. E são justamente os seguintes:

75 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Atrasado (8,5%) ⇒ 3,4%
Navio (40%)
Em tempo (91,5%)

Atrasado (1%) ⇒ 0,6%


Avião (60%)
Em tempo (99%)
Ora, como são dois os caminhos que nos conduzem ao resultado procurado, teremos
portanto que somar essas duas probabilidades resultantes de ambos. Teremos, pois, que:
3,4% + 0,6% = 4% Resposta!
Na linguagem da probabilidade, diremos: P(chegar atrasado)=0,04

4) Qual a probabilidade de Genésio chegar em tempo?


Aqui também não foi estabelecido qual seria o meio de transporte que levaria Genésio a
não se atrasar! De modo que essa pergunta ficou muito fácil de ser respondida. Senão, vejamos:
no item anterior, encontramos que a probabilidade de Genésio chegar atrasado (independente do
transporte utilizado) foi de 4%.
Ora, será que chegar atrasado e chegar em tempo não são situações excludentes? Claro
que sim! Já sabemos disso! Logo, se somarmos as probabilidades dessas duas situações (chegar
atrasado e chegar em tempo), teremos que chegar a 100%. Daí, faremos:
faremos:
P(atrasado) + P(em tempo) = 100%
4% + P(em tempo) = 100%
P(em tempo)=100% - 4%
P(em tempo) = 96% Resposta!
Na linguagem da probabilidade, diremos: P(em tempo)=0,96

Com essas quatro perguntas acima, queremos mostrar que uma questão de probabilidade
pode morrer tão somente pela análise desses tais caminhos de probabilidade,
probabilidade oriundos da
árvore de probabilidades!! Ou não!
Por que “ou não”? Porque pode haver mais! E o que
que pode haver a mais? Pode haver a
mais o seguinte: pode ocorrer de a questão, após fornecer todos os elementos necessários e
suficientes para que nós desenhemos a árvore de probabilidades,, ela trazer (assim como
quem não quer nada!) mais uma informação.
Essa informação adicional, que muito pode nos parecer inservível, será na verdade
essencial para nossa resolução. O que temos de saber é que essa informação adicional não virá
probabilidade Não! Ela virá falando de um FATO!
nos falando de uma probabilidade! FATO
Ou seja, uma
ma informação que é um fato dado;; algo que passa a ser do nosso
conhecimento!
Vamos fazer um teste: vamos recolocar abaixo o nosso enunciado. Você vai lê-lo lê
novamente, com muita calma e muita atenção, tentando descobrir se foi fornecida pela questão
esta tal de informação adicional;
adicional este fato dado,, que passa a ser do seu conhecimento. Ok? Aí
segue o enunciado:

76 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
“Há apenas dois modos, mutuamente excludentes, de Genésio ir para Genebra
participar de um congresso: ou de navio ou de avião. A probabilidade de Genésio ir de
navio é de 40% e de ir de avião é de 60%. Se ele for de navio, a probabilidade de
chegar ao congresso com dois dias de atraso é de 8,5%. Se ele for de avião a
probabilidade de chegar ao congresso com dois dias de atraso é de 1%. Sabe-se
Sabe que
Genésio
enésio chegou com dois dias de atraso para participar do congresso em Genebra. A
probabilidade de ele ter ido de avião é:”
E aí? Alguém achou uma frase suspeita? Uma frase que veio sozinha? E que não falou
nada de probabilidade? E que só nos informou um fato dado?
NÃO?????? Não é possível...! Tente novamente:
“Há apenas dois modos, mutuamente excludentes, de Genésio ir para Genebra
participar de um congresso: ou de navio ou de avião. A probabilidade de Genésio ir de
navio é de 40% e de ir de avião é de 60%. 60%. Se ele for de navio, a probabilidade de
chegar ao congresso com dois dias de atraso é de 8,5%. Se ele for de avião a
probabilidade de chegar ao congresso com dois dias de atraso é de 1%. Sabe-se que
Genésio chegou com dois dias de atraso para participar
participar do congresso em Genebra.
Genebra A
probabilidade de ele ter ido de avião é:”
E agora, melhorou? Agora todo mundo vai dizer que já tinha visto da primeira vez...
Pois é, minha gente! Aqui teremos novidades: quando a questão fornecer todos os
elementos necessários
os para desenharmos a árvore de probabilidades e para construirmos os
caminhos de probabilidades, mas não se contentar apenas com isso, de modo a nos revelar ainda
um fato,, estaremos diante de uma questão da chamada probabilidade condicional.
condicional
E o que é isso?
so? É muito fácil. Probabilidade condicional será a probabilidade de
ocorrência de um evento “A”, dado que sabemos que ocorreu um outro evento “B”.
“B”
Esse evento “B”” é justamente aquele que nos é dado a conhecer pela informação
adicional; por aquela frase que
ue vem sozinha, e apenas nos revela um fato dado;
dado algo que passa
a ser do nosso conhecimento.
Retornemos novamente ao nosso enunciado, para ver se entendemos o que está sendo
solicitado por esta questão.
Vamos por partes! Podemos dividir esse enunciado em
em três pedaços, representados abaixo
em cores diferentes:
“Há apenas dois modos, mutuamente excludentes, de Genésio ir para Genebra
participar de um congresso: ou de navio ou de avião. A probabilidade de Genésio ir de
navio é de 40% e de ir de avião é de 60%. Se ele for de navio, a probabilidade de
chegar ao congresso com dois dias de atraso é de 8,5%. Se ele for de avião a
probabilidade de chegar ao congresso com dois dias de atraso é de 1%. Sabe-se que
Genésio chegou com dois dias de atraso para participar
participar do congresso em Genebra. A
probabilidade de ele ter ido de avião é:”
1º) O primeiro pedaço que destacamos (em vermelho) servirá apenas para uma coisa: para
desenharmos a árvore de probabilidades e os respectivos caminhos de probabilidade.
2º) A segunda parte do enunciado (destacada em azul) se resume a uma única frase: é o fato
dado!! É aquela informação que passa a ser conhecida por nós todos! Repito: não é uma
probabilidade: é um fato!
3º) A terceira e última parte do enunciado (destacada em verde) é a pergunta!

Pronto! Estamos quase lá! Agora só nos resta definir exatamente o que a questão quer de
nós. Para saber isso, começaremos pela pergunta do enunciado: a terceira parte! Qual a
probabilidade de Genésio ter ido de avião?

77 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Sabendo que esta é a pergunta da questão, só nos falta averiguar uma coisa: foi fornecido
pelo enunciado aquela informação adicional? Aquele fato dado? Foi? Sim!!
E qual foi mesmo esse fato dado? Foi que Genésio chegou atrasado!
atrasado
Daí, o que a questão está mesmo querendo saber é o seguinte:
“Qual a probabilidade de Genésio ter ido de avião, dado que chegou atrasado?”
atrasado
Essa é a pergunta completa!
Essa é a pergunta da probabilidade condicional.. Por que condicional? Porque está
submetida a uma condição! Qual condição?
condiç A de que exista um fato que nós estamos certos que
ocorreu!
Veja como a pergunta acima se enquadra perfeitamente no modelo da probabilidade
condicional:
“Qual a probabilidade de ocorrência de um evento “A”, dado que sabemos
que ocorreu um evento “B”?
Observemos que o que virá após o dado que será sempre o fato fornecido pelo
enunciado!
Utilizando a nomenclatura própria da matemática, reduziremos a pergunta acima ao
seguinte: P(A dado B)=?
condicional Para respondê--la, teremos que aplicar
Esta é a pergunta da probabilidade condicional.
a seguinte fórmula:
P( A e B)
P ( A dado B ) =
P( B)
Aplicando a fórmula acima à nossa questão, teremos:
P(avião dado atrasado) = P(avião & atrasado) / P(atrasado)

Vejamos que o numerador desta fórmula P(avião & atrasado) é exatamente a resposta
da “pergunta b”,, que foi analisado há pouco por nós, e em que concluímos que: P(avião &
atrasado)=0,006.
Vejamos ainda que o denominador da fórmula P(atraso) corresponde, por sua vez, à
resposta da “pergunta c” , vista acima, com o que concluímos que: P(atrasado)=0,04.
P(atrasado)=0,04
Pronto! Dispondo dos elementos todos da fórmula da probabilidade condicional,
chegaremos ao seguinte:
P(avião dado atraso) = P(avião & atraso) / P(atraso)
P(avião dado atraso) = 0,006 / 0,04 = 0,15 = 15% Res
Resposta!

Passemos a outro exemplo, cobrado na prova do Analista do MPU, ainda recente!


Exemplo 07) (Analista MPU/2004) Carlos diariamente almoça um prato de sopa no
mesmo restaurante. A sopa é feita de forma aleatória por um dos três cozinheiros que
lá trabalham: 40% das vezes a sopa é feita por João; 40% das vezes por José, e 20%
das vezes por Maria. João salga demais a sopa 10% das vezes; José o faz em 5% das
vezes, e Maria 20% das vezes. Como de costume, um dia qualquer Carlos pede a sopa
e, ao experimentá-la,
la, verifica que está salgada demais. A probabilidade de que essa
sopa tenha sido feita por José é igual a?
Sol.: Convém
onvém relermos o enunciado, tentado já ver se é possível estabelecermos aquela divisão
em partes! Será que é possível. Vejamos:

78 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
“Carlos diariamente almoça um prato de sopa no mesmo restaurante. A sopa é feita de
forma aleatória por um dos três cozinheiros que lá trabalham: 40% das vezes a sopa é
feita por João; 40% das vezes por José, e 20% das vezes por Maria. João salga demais
a sopa 10% das vezes; José o faz em 5% das vezes, e Maria 20% das vezes. Como de
costume, um dia qualquer Carlos pede a sopa e, ao ao experimentá-la,
experimentá verifica que está
salgada demais. A probabilidade de que essa sopa tenha sido feita por José é igual a?”

A primeira parte é aquela que usaremos para desenhar a árvore de probabilidades,


observando as situações excludentes,
excludentes e construindo, se for o caso, os caminhos de probabilidade.
A segunda parte (em vermelho) é um informação adicional que nos revela um fato. Algo
que passa a ser do nosso conhecimento! Não é uma probabilidade: é um fato dado!
A terceira parte é a pergunta
pergu da questão!

Trabalhando a primeira parte do enunciado, chegaremos à seguinte árvore de


probabilidades:
sopa salgada (10%)
JOÃO (40%)
sopa normal (90%)

sopa salgada (5%)


JOSÉ (40%)
sopa normal (95%)

sopa salgada (20%)


MARIA (20%)
sopa normal (80%)

Agora temos que formular a pergunta completa da questão!


O que está sendo questionado na última parte do enunciado? A pergunta é qual a
probabilidade de José ter feito a sopa?
Existe dentro do enunciado uma informação adicional, que nos dá a conhecer um fato?
Sim! Qual é esse fato? É que a sopa ficou salgada! Ora, que a sopa ficou salgada é um fato dado
pela questão. É algo do quall agora temos conhecimento.
Daí, a pergunta completa desta questão é a seguinte:
“Qual a probabilidade de José ter feito a sopa, dado que a sopa ficou salgada?”
salgada
Estamos diante de uma probabilidade condicional.
condicional
Na linguagem da probabilidade, teremos: P(José dado salgada)=?
)=?
Aí é só aplicar a fórmula da probabilidade condicional.. Teremos:
P(José dado salgada)= P(José & salgada) / P(salgada)
O numerador P(José & salgada) será a probabilidade resultante de um único caminho de
probabilidade. O primeiro deles!
eles! Vejamos:

79 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
sopa salgada (10%)
JOÃO (40%)
sopa normal (90%)

sopa salgada (5%) ⇒ 0,40 x 0,05 = 0,02


JOSÉ (40%)
sopa normal (95%)

sopa salgada (20%)


MARIA (20%)
sopa normal (80%)

Já no tocante ao denominador P(salgada), teremos que somar as probabilidades


resultantes de três caminhos de probabilidades para chegarmos a ele. Teremos:

sopa salgada (10%) ⇒ 0,40 x 0,10 = 0,04


JOÃO (40%)
sopa normal (90%)

sopa salgada (5%) ⇒ 0,40 x 0,05 = 0,02


JOSÉ (40%)
sopa normal (95%)

sopa salgada (20%) ⇒ 0,20 x 0,20 = 0,04


MARIA (20%)
sopa normal (80%)

Daí, jogando os dados na fórmula da probabilidade condicional,, teremos que:

P(José dado salgada)= 0,02 / (0,04+0.02+0,04)


P (José dado salgada) = 0,02/0,10 = 20% Resposta!

Dando continuidade ao estudo da Probabilidade, veremos agora mais alguns conceitos que
ainda não foram comentados. Quais sejam:
Probabilidade da união de dois eventos; e
Probabilidade binomial.
Aprenderemos igualmente esses tópicos por meio da resolução de exercícios diversos.

80 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
# Probabilidade da União de Dois Eventos:
Eventos
Esta situação se verificará sempre que a questão de probabilidade trouxer uma pergunta
referente a dois eventos, conectados entre si pela partícula ou.
Por exemplo, pode ser que a questão apresente uma série de dados e no final pergunte:
Qual a probabilidade de ocorrência do evento A ou do evento B?
Saberemos, então, de imediato, que a partícula ou significará união! Trabalharemos,
assim, com uma fórmula própria: a da Probabilidade da União de Dois Eventos:
Eventos
P(evento A ou evento B)=P(evento A)+P(evento B) – P(evento A e evento B)
Reparemos bem na terceira parcela da fórmula acima: P(evento A e evento B). Esta
parcela trata acerca da probabilidade de ocorrência simultânea dos eventos A e B.
Aprendemos na aula passada que, caso os eventos A e B sejam eventos independentes,
então a probabilidade de ocorrência de A e B, ao mesmo tempo, será encontrada pelo produto
das probabilidades individuais! Lembrados disso?
Pois bem! Vejamos alguns exemplos que nos ajudarão a entender melhor
me essa teoria.

Exemplo 1) Uma urna contém 10 bolinhas numeradas de 1 a 10. Uma bolinha é


escolhida ao acaso. Qual a probabilidade de se observar um múltiplo de 2 ou de 4?
4
Sol.: Vemos facilmente que esta questão trata de dois eventos, e não apenas de um!
u Quais são
esses dois eventos?
Retirar uma bolinha numerada com um múltiplo de dois; e
retirar uma bolinha numerada com um múltiplo de quatro.
Na pergunta da questão, esses dois eventos estão conectados entre si pela partícula ou, o
que nos leva a concluir que estamos trabalhando com a probabilidade da união de dois eventos!
eventos
Teremos, pois, que:
P(múltiplo de 2 ou múltiplo de 4)=P(múltiplo de 2)+P(múltiplo de 4)-P(múltiplo
4) de 2
e múltiplo de 4)

O que temos a fazer é descobrir o valor de cada uma das parcelas. Vamos lá!
P(múltiplo de 2)=?
Sabemos que probabilidade é uma fração: Resultados favoráveis / resultados possíveis!
Daí, na hora de retirarmos uma bolinha de uma urna que contém dez delas, quantos serão
os resultados possíveis? Serão 10, obviamente! É esse nosso denominador.
Queremos agora que a bolinha retirada seja múltiplo de 2. Quantos são os resultados que
satisfazem essa exigência (resultados favoráveis)? Ora, são 5. Senão, vejamos:
resultados favoráveis)?
8 9, 10} ⇒ (cinco múltiplos de 2)!
{1, 2, 3, 4, 5, 6, 7, 8,
Daí, teremos:
P(múltiplo de 2)= (5/10)
Passemos a trabalhar a segunda parcela da equação:
P(múltiplo de 4)=?
Quantos são os resultados possíveis para a retirada de uma bola, se a urna tem dez bolas?
Dez. (É o nosso denominador)!
E quantos são os resultados que satisfazem a exigência de a bola retirada ser múltiplo de
4? Ou seja, quantos são os resultados favoráveis?
favoráveis São 2. Vejamos:

81 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
{1, 2, 3, 4, 5, 6, 7, 8,, 9, 10} ⇒ (dois múltiplos de 4)!
Daí, teremos que:
P(múltiplo de 4)=(2/10)
Pois bem! Só nos falta calcular agora a terceira parcela da equação:
P(múltiplo de 2 e múltiplo de 4)=?
Já sabemos que há dez resultados possíveis para a retirada de uma bola dessa urna!
Mas quantos serão os resultados favoráveis? Ou seja, quantos serão os resultados que
satisfazem, ao mesmo tempo,, a exigência de a bola retirada ser um múltiplo de 2 e um múltiplo
de 4? Essa é fácil. Vejamos:
8 9, 10} ⇒ (são também apenas 2 resultados, ao mesmo tempo,
{1, 2, 3, 4, 5, 6, 7, 8,
múltiplos de 2 e múltiplos de 4)!
Daí, teremos que:
P(múltiplo de 2 e múltiplo de 4)=(2/10)
Finalmente, lançando todos esses resultados na equação da união de dois eventos,
teremos:
P(múltiplo de 2 ou múltiplo de 4)=(5/10)+(2/10)–(2/10)
4)=(5/10)+(2/10)
E:
P(múltiplo de 2 ou múltiplo de 4)=(5/10)=0,50= 50% Resposta!

Ou seja, não tem segredo! Basta recordar da fórmula e aplicá-la!


aplicá la! Mais um exemplo.
Exemplo 2) (ESAF) Um dado “honesto” é lançado juntamente com uma moeda não
viciada. Assim, a probabilidade de se obter um número ímpar no dado ou coroa na
moeda é:
a) 1/5
b) 1/4
c) 2/4
d) 3/5
e) 3/4

Sol.: Percebemos que aqui também haverá dois eventos envolvidos: o lançamento de um dado
e o lançamento de uma moeda. Obviamente que lançar um dado e lançar uma moeda são
eventos que não dependem um do outro, ou seja, o resultado de um não influencia em nada o
resultado do outro. Em outras palavras, são eventos independentes, embora o enunciado não
tenha dito isso expressamente!
expressamente
Pois bem! Vamos ao nosso raciocínio.
Trabalhando primeiro com o dado. Quantas possibilidades
possibilidades de resultado há no lançamento
de um dado? Ora, há seis possibilidades: {1, 2, 3, 4, 5, 6}.
E quantos modos diferentes há de esse resultado ser um numero ímpar? Vejamos: {1,
{ 2,
3, 4, 5,, 6}. Ora, haverá três possibilidades.
Daí, ao lançarmos um dado, a probabilidade de o resultado ser ímpar será:
3 1
P(resultado ímpar no dado) = =
6 2
Passemos ao caso da moeda! Quantos resultados possíveis há no lançamento de uma
moeda “não viciada”? Dois: {cara, coroa}.

82 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Quantos resultados possíveis de “coroa”? Apenas um. Logo, a probabilidade de, ao
lançarmos uma moeda, dar coroa é de:
1
P(coroa na moeda) =
2
Quase lá! Quando o enunciado pede que se determine a probabilidade de se obter um
número ímpar no dado ou coroa na moeda, estará falando, obviamente, da união entre esses
dois eventos. Já sabemos que a existe uma fórmula própria para esses casos. Teremos:
P(ímpar no dado ou coroa na moeda)=P(ímpar dado)+P(coroa moeda)–P(ímpar
moeda) dado e
coroa moeda)

Pois bem! As duas primeiras parcelas da equação acima já foram calculadas. Resta-nos
Resta a
última! Eis o xis da questão: esta última parcela há que ser muito bem pensada por nós. Por quê?
Porque se estivermos trabalhando com eventos independentes – e esse é o nosso caso! – então
esta parcela será encontrada pelo produto das probabilidades dos dois eventos.
Teremos:
P(ímpar no dado e coroa na moeda)=P(ímpar no dado) x P(coroa na moeda)
Daí, encontraremos que:
P(ímpar no dado e coroa na moeda)= (1/2) x (1/2) = (1/4)
Finalmente, aplicando os resultados obtidos na nossa equação, encontraremos que:

P(ímpar no dado ou coroa na moeda)=(1/2)+(1/2)–(1/4)=(3/4)


moeda)=(1/2)+(1/2) (3/4) Resposta!

83 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
# Distribuições de Probabilidade:
Distribuição Binomial:

Como reconhecer a questão de Distribuição Binomial?


Ela perguntará por uma probabilidade;
Ela tratará de um experimento que se repetirá n vezes, sempre mantidas as
mesmas condições originais.
Este experimento só admite dois resultados: sucesso e fracasso..
Este experimento diz respeito a uma variável discreta.
Tais resultados (sucesso e fracasso) são mutuamente excludentes, ou seja,
ocorrendo um, o outro está automaticamente descartado.
A cada repetição do experimento, as probabilidade de sucesso p e de fracasso q
se mantêm constantes.
Cada tentativa é independente da outra.

E a questão de distribuição binomial fará a seguinte pergunta:


Qual a probabilidade de se obter S sucessos, em n tentativas?

Se uma variável tem distribuição binomial, diremos que:

X B(n,p)
Equações:
Probabilidade Binomial:

P(S sucessos)=Cn,S.(p)S.(q)F
Onde:
Cn,s== n!/[s!(n-s)!]
n!/[s!(n
n é o número de repetições do experimento;
p é a probabilidade de ocorrência de sucesso;
q é a probabilidade de ocorrência de fracasso;
S é o número de sucessos desejados;
F é o número de fracassos.
Valor Esperado:

E(x)= µ = n.p
Variância:

Var(x)= σ2 = n.p.q
Desvio Padrão:

Desvio Padrão(x)= σ = n. p.q

84 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Questões de Fixação:
1ª) Uma moeda será lançada cinco vezes consecutivas. Qual a probabilidade de se verificarem 3
resultados cara?
2ª) Um casal quer ter oito filhos. Qual a probabilidade de nascerem exatamente 5 meninas,
considerando que não venham gêmeos?
3ª) Um candidato
andidato tem apenas 2% das intenções de voto. Qual a probabilidade de que, em 100
eleitores escolhidos ao acaso, encontremos cinco que desejem votar nesse candidato?

Questões de Concursos:
4ª) (ESAF) Em uma cidade, 10% das pessoas possuem carro importado.
importado Dez pessoas dessa
cidade são selecionadas, ao acaso e com reposição. A probabilidade de que exatamente 7 das
pessoas selecionadas possuam carro importado é:
a) (0,1)7 . (0,9)3 d) 120 . (0,1) . (0,9)7
3 7
b) (0,1) . (0,9) e) 120 . (0,1)7 . (0,9)
7 3
c) 120 . (0,1) . (0,9)

5ª) (ESAF) São lançadas 4 moedas distintas e não viciadas. Qual é a probabilidade de resultar
exatamente duas caras e duas coroas?
a) 25% b) 37,5% c) 42% d) 44,5% e) 50%

Distribuição Poisson:

Como reconhecer a questão de Distribuição Poisson?


Ela perguntará por uma probabilidade;
Ela também é uma distribuição discreta;
Ela se parece muito com a binomial;
Não é empregada em experimentos nos quais se está interessado no número de
sucessos obtidos em n tentativas, como ocorre no caso
caso da distribuição binomial.
Está-se
se interessado em saber o número de sucessos ocorridos durante um intervalo
contínuo, que pode ser um intervalo de tempo, de espaço etc. Exemplos:
- O número de vezes que o telefone toca durante um dia;
- O número de acidentes
identes automobilísticos ocorridos numa rodovia durante um mês;
- O número de defeitos encontrados em um rolo de arame de 500 metros.

E a questão de distribuição de Poisson fará a seguinte pergunta:


Qual a probabilidade de se obter S sucessos, neste determinado intervalo (de tempo, de
espaço etc)?

85 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Equação:
Probabilidade de Poisson:

P(S) = (e-µµ . µS) / S!


Onde:
P(S) é a probabilidade de S ocorrências no intervalo;
µ é o valor esperado ou número médio de ocorrências no
intervalo;
e = 2,71828
Valor Esperado:

E(x)= µ
Variância:

Var(x)= σ2 = µ
Desvio Padrão:

Desvio Padrão(x)= σ = µ

Questões de Fixação:
1ª) Suponha que, em média, o telefone toque 4 vezes ao dia em uma casa. Qual a probabilidade
de que, num certo dia qualquer, ele toque exatamente duas vezes? (Considere que: e-4=1,83).

2ª) Suponha que, em média, o telefone toque 4 vezes ao dia em uma casa. Qual a probabilidade
máximo duas vezes? (Considere que: e-4=1,83).
de que, num certo dia qualquer, ele toque no máximo

3ª) Uma aluna, quando assiste a aulas em salas com ar-condicionado,


ar condicionado, espirra, em média, três
vezes por hora. Qual a probabilidade de que, em uma hora, ela espirre cinco vezes?

4ª) Uma aluna, quando assiste a aulas


aula em salas com ar-condicionado,
condicionado, espirra, em média, três
vezes por hora. Qual a probabilidade de que, em três horas, ela espirre dez vezes?

5ª) O número médio de vezes por ano que um concurseiro faz vôo doméstico para fazer prova de
concurso é quatro.
a) Qual é a probabilidade de que concurseiro faça dois vôos domésticos para fazer concurso
em um ano?
b) Qual é o número médio de vôos domésticos para fazer concurso em um período de três
meses?
c) Qual é a probabilidade de um concurseiro fazer um ou mais vôos domésticos
doméstic para fazer
concurso em um período de seis meses?

86 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Distribuição Normal:

Como reconhecer a questão de Distribuição Normal?


Ela perguntará por uma probabilidade;
Esta probabilidade estará relacionada a um intervalo e dirá respeito a uma
variável contínua.. Exemplos:
- Qual a probabilidade de que uma pessoa pese entre 45 kg e 58 kg?
- Qual a probabilidade de que uma pessoa pese acima de 72 kg? (Intervalo: de 72 kg
até mais infinito)
- Qual a probabilidade de que uma pessoa gaste, para ler um jornal,
jornal entre 32
minutos e 43 minutos?
- Qual a probabilidade de que uma pessoa gaste menos de 25 minutos para ler um
jornal? (Intervalo: de menos infinito até 25 minutos).
Esta probabilidade não será calculada por uma fórmula, e sim pela área verificada
sob uma curva: a curva Normal ou de Gauss. Esta curva é construída pela seguinte
fórmula:


( x − µ )2
1
f ( x) = .e 2.σ 2

2.π .σ 2
NÃO É PRECISO DECORAR ESTA FÓRMULA!!!
Ela serve apenas para sabermos que haverá infinitas curvas normais,
normais cada uma
delas definidas pela média (µ)
( e pela variância (σ2) do conjunto! Ou seja, média e
variância são os parâmetros de uma distribuição normal.
Assim, se uma variável tem distribuição normal, diremos que:

X µ,σ
N(µ σ 2)
Se são infinitas curvas normais, precisaríamos de infinitas tabelas para nos
auxiliar no cálculo da área sob a curva!
Mas só existe uma tabela: a da CURVA NORMAL PADRONIZADA!!
PADRONIZADA
Esta Curva Normal Padronizada apresenta: µ=0 e σ2=1.
A variável normal padronizada será chamada de Z
Com a tabela da curva Z encontramos a área da curva entre 0 (zero) e um outro
valor especificado. Esta área será a própria probabilidade!
Ocorre que qualquer distribuição normal particular (X) pode ser transformada na
variável
ável normal padronizada (Z), da seguinte forma:

( X − µ)
Z=
σ
Fazendo essa transformação, encontraremos na tabela a área sob a curva normal
padronizada, e que corresponderá à probabilidade que estamos procurando!
Em outras palavras: haverá uma única tabela para descobrirmos probabilidades
de toda e qualquer variável contínua que tenha distribuição normal!

87 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Características da Curva Normal:
- E simétrica:
Frequência

µ Variável

- Apresenta a seguinte propriedade:


Frequência

σ
-3σ σ
-2σ σ
-1σ µ σ
+1σ σ
+2σ σ
+3σ Variável

68,26%
95,44%
99,74%

# Exemplificando uma Questão de Distribuição Normal:


Suponhamos que um conjunto represente os pesos de um grupo de pessoas. Para este
conjunto, verificou-se
se que a média dos pesos era de µ =25 kg e a variância era de σ 2 =9 kg2.
(Reparem na unidade da variância, que estará
estará sempre elevada ao quadrado)!
Consideremos ainda que se saiba que esta variável se distribui normalmente. Assim,
diremos apenas que: X N(25, 9).
9)
Entendido até aqui? Reparem que se a variância deste conjunto é 9, então o seu desvio
padrão (definido como a raiz quadrada da variância) será igual a 3.
Pois bem! Reparem agora na pergunta que será feita: sabendo que a variável X tem
distribuição normal, qual a probabilidade de que uma pessoa qualquer deste conjunto apresente
peso variando entre 25 e 28 quilogramas?
quilog
Vejam que no estudo da probabilidade associada à distribuição normal, estaremos sempre
investigando a probabilidade referente a um intervalo da variável.
88 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Neste caso, a primeira coisa a fazer é reduzir a variável X à variável padronizada Z. Os
dois
s valores de X que conhecemos são 25 (que é a média do conjunto) e 28.
Assim, usando a fórmula da redução, teremos:
( Xi − µ ) (25 − 25)
Para X=25 Z= Z= Z=0,00
σ 3
( Xi − µ ) (28 − 25)
Para X=28 Z= Z= Z=1,00
σ 3
Assim, realizamos a transformação da variável, e já estamos trabalhando com a Curva
Normal Padronizada! Modificou--se, portanto, a pergunta da questão!
A nova pergunta agora é a seguinte: considerando a Curva Normal Padronizada (ou
Reduzida), qual a probabilidade de Z estar dentro do intervalo que vai de Z=0 até Z=1?
E para esta pergunta, meus queridos, existe uma tabela prontinha, que nos dará a
resposta quase que de forma imediata!

# A Tabela da Distribuição Normal Padronizada:


Precisamos conhecer bem como se faz a pesquisa a esta tabela, pois é por meio dela que
chegaremos à solução desejada.
Já é do conhecimento de todos que a curva normal é simétrica em torno da média
aritmética, e que cada metade da área sob a curva representa
representa 50%. Pois bem!

IMPORTANTE:
A tabela da Curva Normal Padronizada nos indicará sempre o percentual de elementos que
está no intervalo que vai de Z=0 até um Z qualquer.

No caso, desejamos conhecer o percentual que há entre Z=0 e Z=1.


Z=1
Ilustrativamente, teremos:

z=0 z=1

Neste momento, resta conhecermos a tabela. Ela será mais ou menos assim:

89 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 00,00 00,40 00,80 01,20 01,60 01,99 02,39 02,79 03,19 03,59
0.1 03,98 04,38 04,78 05,17 05,57 05,96 06,36 06,75 07,14 07,53
0.2 07,93 08,32 08,71 09,10 09,48 09,87 10,26 10,64 11,03 11,41
0.3 11,79 12,17 12,55 12,93 13,31 13,68 14,06 14,43 14,80 15,17
0.4 15,54 15,91 16,28 16,64 17,00 17,36 17,72 18,08 18,44 18,79

0.5 19,15 19,50 19,85 20,19 20,54 20,88 21,23 21,57 21,90 22,24
0.6 22,57 22,91 23,24 23,57 23,89 24,22 24,54 24,86 25,17 25,49
0.7 25,80 26,11 26,42 26,73 27,04 27,34 27,64 27,94 28,23 28,52
0.8 28,81 29,10 29,39 29,67 29,95 30,23 30,51 30,78 31,06 31,33
0.9 31,59 31,86 32,12 32,38 32,64 32,90 33,15 33,40 33,65 33,89

1.0 34,13 34,38 34,61 34,85 35,08 35,31 35,54 35,77 35,99 36,21
1.1 36,43 36,65 36,86 37,08 37,29 37,49 37,70 37,90 38,10 38,30
1.2 38,49 38,69 38,69 39,07 39,25 39,44 39,62 39,80 39,97 40,15
1.3 40,32 40,49 40,66 40,82 40,99 41,15 41,31 41,47 41,62 41,77
1.4 41,92 42,07 42,22 42,36 42,51 42,65 42,79 42,92 43,06 43,19

1.5 43,32 43,45 43,57 43,70 43,83 43,94 44,06 44,18 44,29 44,41
1.6 44,52 44,63 44,74 44,84 44,95 45,05 45,15 45,25 45,35 45,45
1.7 45,54 45,64 45,73 45,82 45,91 45,99 46,08 46,16 46,25 46,33
1.8 46,41 46,49 46,56 46,64 46,71 46,78 46,86 46,93 46,99 46,06
1.9 47,13 47,19 47,26 47,32 47,38 47,44 47,50 47,56 47,61 47,67

2.0 47,72 47,78 47,83 47,88 47,93 47,98 48,03 48,08 48,12 48,17
2.1 48,21 48,26 48,30 48,34 48,38 48,42 48,46 48,50 48,54 48,57
2.2 48,61 48,64 48,68 48,71 48,75 48,78 48,81 48,84 48,87 48,90
2.3 48,93 48,96 48,98 49,01 49,04 49,06 49,09 49,11 49,13 49,16
2.4 49,18 49,20 49,22 49,25 49,27 49,29 49,31 49,32 49,34 49,36

2.5 49,38 49,40 49,41 49,43 49,45 49,46 49,48 49,49 49,51 49,52
2.6 49,53 49,55 49,56 49,57 49,59 49,60 49,61 49,62 49,63 49,64
2.7 49,65 49,66 49,67 49,68 49,69 49,70 49,71 49,72 49,73 49,74
2.8 49,74 49,75 49,76 49,77 49,77 49,78 49,79 49,79 49,80 49,81
2.9 49,81 49,82 49,82 49,83 49,84 49,84 49,85 49,85 49,86 49,86

3.0 49,87

4.0 49,997

A consulta a esta tabela se faz olhando-se


olhando se primeiramente para a coluna da esquerda, e em
seguida para a primeira linha.
Não esqueçamos que as porcentagens constantes no miolo da tabela representam a área
sob a curva normal, delimitada pela linha do z=0 e de um outro valor de z qualquer. Assim, na
tabela acima, procuraremos sempre por este z qualquer.
Se queremos, como em nosso
nosso exemplo, descobrir a porcentagem de elementos entre z=0
e z=1,00, interessa-nos
nos encontrar este 1,00 na tabela. Começamos procurando pelo 1,0 na
coluna da esquerda. Uma vez encontrado, correremos nossa vista pela linha de cima, procurando
pelo 0,00. E por
or que isso? Porque 1,00 é o mesmo que 1,0 (encontrado na coluna da esquerda)
+ 0,00 (encontrado na linha de cima).
Vejamos na tabela:

90 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 00,00 00,40 00,80 01,20 01,60 01,99 02,39 02,79 03,19 03,59
0.1 03,98 04,38 04,78 05,17 05,57 05,96 06,36 06,75 07,14 07,53
0.2 07,93 08,32 08,71 09,10 09,48 09,87 10,26 10,64 11,03 11,41
0.3 11,79 12,17 12,55 12,93 13,31 13,68 14,06 14,43 14,80 15,17
0.4 15,54 15,91 16,28 16,64 17,00 17,36 17,72 18,08 18,44 18,79

0.5 19,15 19,50 19,85 20,19 20,54 20,88 21,23 21,57 21,90 22,24
0.6 22,57 22,91 23,24 23,57 23,89 24,22 24,54 24,86 25,17 25,49
0.7 25,80 26,11 26,42 26,73 27,04 27,34 27,64 27,94 28,23 28,52
0.8 28,81 29,10 29,39 29,67 29,95 30,23 30,51 30,78 31,06 31,33
0.9 31,59 31,86 32,12 32,38 32,64 32,90 33,15 33,40 33,65 33,89

1.0 34,13 34,38 34,61 34,85 35,08 35,31 35,54 35,77 35,99 36,21
1.1 36,43 36,65 36,86 37,08 37,29 37,49 37,70 37,90 38,10 38,30
... ... ... ... ... ... ... ... ... ... ...
4.0 49,997

Qual foi o resultado encontrado? Foi 34,13. Isso significa que 34,13% dos elementos do
conjunto estão localizados entre o z=0 e o z=1.. Ou, dito de outra forma, 34,13% dos elementos
situam-se
se entre os pesos 25kg e 28kg. Esta porcentagem, para ser convertida em probabilidade,
basta que seja dividida por 100, o que equivale a deslocar a vírgula duas casas para a esquerda.
Assim, ao z=1 corresponde
rresponde o valor 34,13%, ou a probabilidade de 0,3413.
Concluímos: a probabilidade de que uma pessoa qualquer desse conjunto apresente peso
entre 25 kg e 28 kg é 34,13% (ou de 0,3413)!

# Outro Exemplo:
Alteremos o enunciado: considerando aquele mesmo conjunto de pesos de um grupo de
pessoas, em que X N(25,9),, se a questão perguntasse agora pelo percentual de elementos com
peso acima de 28 quilogramas, o que faríamos?
Inicialmente, faríamos a transformação
transformaç da variável. Assim:
( Xi − µ ) (28 − 25)
Para X=28 Z= Z= Z=1,00
σ 3
Daí, ilustrativamente, o que estamos buscando é a seguinte área:

Z=0 Z=1

91 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Ora, para descobrirmos o valor da área marcada no desenho acima, teremos, na verdade,
que fazer uma subtração entre duas porcentagens!
Sabemos que toda a metade do desenho
desenh à direita do z=0 representa 50% do conjunto.
Uma vez sabendo que o percentual de elementos entre z=0 e z=1 é de 34,13%
(resultado do exercício anterior), então poderemos dizer que:
P(z>1)=0,50-0,3413
0,3413
P(z>1)=0,1587
Percebam que, neste caso, a resposta não vem diretamente da tabela, uma vez que esta
expressará sempre (não podemos esquecer isto!) a porcentagem de elementos que se encontram
entre z=0 e um z qualquer.
Ok?
Assim, 15,87% dos elementos do conjunto têm pes peso
o acima de 28 kg. Ou, por outra,
0,1587 é a probabilidade de alguém deste conjunto pesar mais que 28 kg.

Questões de Fixação:

1ª) Qual a probabilidade de z pertencer à região destacada?


Frequência

σ
-3σ σ
-2σ σ
-1σ µ σ
+1σ σ
+2σ σ
+3σ Variável

2ª) Qual a probabilidade de z pertencer à região destacada?


Frequência

σ
-3σ σ
-2σ σ
-1σ µ σ
+1σ σ
+2σ σ
+3σ Variável

92 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
3ª) Qual a probabilidade de z pertencer à região destacada?
Frequência

σ
-3σ σ
-2σ σ
-1σ µ σ
+1σ σ
+2σ σ
+3σ Variável

4ª) Qual a probabilidade de z pertencer à região destacada?


Frequência

σ
-3σ σ
-2σ σ
-1σ µ σ
+1σ σ
+2σ σ
+3σ Variável

5ª) Qual a probabilidade de z pertencer à região destacada?


Frequência

σ
-3σ σ
-2σ σ
-1σ µ σ
+1σ σ
+2σ σ
+3σ Variável

93 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
6ª) Determinar a área limitada pela curva normal em cada um dos casos:
a) entre z = 0 e z = 1,2
b) entre z = -0,68 e z = 0
c) entre z = -0,46 e z = 2,21
d) entre z = 0,81 e z = 1,94
e) à esquerda de z = -0,6

7ª) Considerando que X N(40,16), qual o valor de Z para Xi=44?

8ª) Seja X com os seguintes parâmetros: N(25,36). Qual o valor de Z para Xi=18?

9ª) Supondo que X N(40,16), qual a probabilidade de X pertencer ao intervalo 40 a 45?

10ª) Considerando que X N(30,16). Calcular:


a) P(X>40)=?
b) P(X<20)=?
c) P(35<X<42)=?

11ª) Um grupo de crianças apresenta peso médio de 25 kg e desvio padrão de 3 kg. Sabendo
que o peso tem distribuição normal, qual a probabilidade de que uma pessoa qualquer desse
conjunto apresente peso variando entre 25kg e 28kg?

12ª) Para o mesmo conjunto de crianças da questão anterior, X N(25,9), qual o percentual de
elementos com peso acima de 28 kg?

13ª) O tempo necessário para se resolver uma determinada prova é distribuído normalmente,
com uma média de 80 minutos e um desvio padrão de 10 minutos. Responda às seguintes
perguntas:
a) Qual é a probabilidade de se completar a prova em uma hora ou menos?
b) Qual
al é a probabilidade de que um estudante complete a prova em mais de 60 minutos
porém em menos de 75 minutos?
c) Considere que a classe tenha 60 estudantes e que o período de exame seja de 90 minutos
de duração. Quantos estudantes você espera que serão incapazes
incapazes de completar o exame
no tempo determinado?

14ª) Os pesos de 600 estudantes são normalmente distribuídos com média 65kg e desvio padrão
5kg. Qual é o número de alunos que se pode esperar encontrar entre 60 e 70kg? Considere
P(0<z<1)=0,34 .
a) 400 c)) 416 e) 430
b) 408 d) 420

Questão de Concurso:

15ª) (ESAF) Um fabricante de baterias de automóvel afirma que a média de vida útil de sua
bateria é 60 meses. Entretanto, a garantia dada à sua marca é apenas de 36 meses. Assuma que
o desvio padrão da vida útil dessas baterias seja 10 meses, e que a distribuição de frequência é
aproximadamente normal. Qual a probabilidade de as baterias desse fabricante durarem mais de
50 meses?
a) 68% c) 84%
b) 76% d) 92%

94 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Distribuição Qui-Quadrado:
Quadrado:
Como reconhecer que a utilizaremos?
A questão vai apresentar uma tabela de dupla entrada,, como nos exemplos seguintes:

a) Pesquisa realizada com uma amostra de 200 fumantes (homens e mulheres), classificados
como usuários das marcas de cigarro A, B e C.
Marca A B C Total
Sexo
Masculino (M) 20 70 30 120
Feminino (F) 40 15 25 80
Total 60 85 55 200

b) Pesquisa realizada com uma amostra de 50 lançamentos simultâneos de uma moeda e de


um dado (honestos).
Moeda Cara Coroa Total
Dado
Face ímpar 14 13 27
Face par 10 13 23
Total 24 26 50

O que o estudo da distribuição do Qui-Quadrado


Qui Quadrado nos informará é se as variáveis em
análise (as que estão na tabela) são dependentes ou independentes entre si!

Com os dados da tabela, calcularemos o Qui-Quadrado


Qui Quadrado observado: χ o2
Como? Construindo uma tabela paralela: a Tabela de Valores Esperados!
Esperados Como se faz
isso? Repete-se
se a estrutura da tabela dos valores observados, pondo nela apenas os valores dos
somatórios (os valores totais).
Assim:
Marca A B C Total
Sexo
Masculino (M) 120
Feminino (F) 80
Total 60 85 55 200

E agora, os espaços em branco serão calculados da seguinte maneira:

(total
total .da.linha ) x(total .da.coluna )
(total .geral )
95 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Assim, qual seria o valor esperado a ser preenchido na célula do cruzamento da primeira
linha com a primeira coluna?

Marca A B C Total
Sexo
Masculino (M) ? 120
Feminino (F) 80
Total 60 85 55 200

Basta fazer o cálculo visto acima. Para este caso, o total da linha é 120, o total da coluna
é 60, e o total geral é 200. Vejam:

Marca A B C Total
Sexo
Masculino (M) ? 120
Feminino (F) 80
Total 60 85 55 200

O total geral estará


sempre aqui, nesta
esquina inferior direita!

(120 x 60)
Assim, fazendo as contas, teremos: = 36
200
De sorte que aquela célula será agora preenchida com este resultado (36).
O mesmíssimo procedimento terá que ser realizado para todas as demais células em
branco desta nova tabela dos valores esperados!

Quando concluirmos estes cálculos, teremos, finalmente, a Tabela de Valores Esperados:

Marca A B C Total
Sexo
Masculino (M) 36 51 33 120
Feminino (F) 24 34 22 80
Total 60 85 55 200

96 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Agora confrontemos as duas tabelas: a de Valores Observados (fornecida na questão) e a
de Valores Esperados (calculada por nós).
Teremos:

Marca A B C Total Marca A B C Total


Sexo Sexo
Masculino (M) 20 70 30 120 Masculino (M) 36 51 33 120
Feminino (F) 40 15 25 80 Feminino (F) 24 34 22 80
Total 60 85 55 200 Total 60 85 55 200

Tabela de Valores Observados


bservados Tabela de Valores Esperados

Com os valores do miolo (os valores que não são os somatórios) dessas duas tabelas,
construiremos uma única tabela, na qual chamaremos a primeira coluna de O (valores
observados) e a segunda coluna de E (valores esperados). Assim, teremos:
O E
20 36
70 51
30 33
40 24
15 34
25 22
200 200

Perceba-se
se que os valores destas duas colunas foram dispostos na mesma seqüência em
que aparecem nas linhas de suas respectivas tabelas. Ok? Feito isto, resta completarmos a tabela
acima com mais três colunas: (O-E),
(O (O-E)2, e finalmente (O-E)2/E.
Fazendo isso, teremos:

O E (O-E) (O-E)2 (O-E)2/E


20 36 -16 256 7,1111
70 51 19 361 7,0784
30 33 -3 9 0,2727
40 24 16 256 10,6667
15 34 -19 361 10,6176
25 22 3 9 0,4091
200 200 0
36,156 = χ o2

97 http://www.olaamigos
olaamigos.com.br Prof. Sérgio Carvalho
Uma vez de posse do Qui-Quadrado
Qui Observado ( χ o2 ), passamos à busca do Qui-
Qui

Quadrado Tabelado ( χt2 )!


Este, como o próprio nome indica, será descoberto por meio de uma rápida consulta à
Tabela do Qui-Quadrado,
Quadrado, a qual será
ser fornecida pela prova!
Esta consulta se fará com base em dois parâmetros: o nível de significância ( α ), que
será dado da questão, e o número de graus de liberdade (GLIB), que será calculado, facilmente,
da seguinte forma:
GLIB = (número
ero de linhas – 1).(número de colunas – 1)
Assim, usando esses dois parâmetros – α e GLIB – procedemos à consulta na Tabela do

Qui-Quadrado
Quadrado e descobrimos quem é o Qui-Quadrado
Qui Tabelado ( χt2 ).
Finalmente, de posse desses
de dois valores de Qui-Quadrado – χ o2 e χt2 - tomaremos a
seguinte decisão:

Se χ o2 > χt2 , então as variáveis são dependentes uma da outra;

Se χ o2 < χt2 , então as variáveis são independentes entre si.

Para esse mesmo exercício abaixo, verificar se as variáveis marca do cigarro e sexo do
fumante são dependentes ou não, considerando uma significância α =5%.
A tabela original (a dos valores observados) apresenta duas linhas e três colunas,
conforme vemos abaixo:
Moeda Cara Coroa Total
Dado
Face ímpar 14 13 27
2 linhas
Face par 10 13 23
Total 24 26 50

3 colunas

Assim, teremos que o número de graus de liberdade (GLIB) será dado por:
GLIB = (2-1).(3-1)
1) = 1x2 = 2

Confrontando na Tabela do Qui Quadrado


Qui-Quadrado os parâmetros α =5% e GLIB=2,

encontraremos que χ 2
t =5,99.

Assim, concluiremos que:

98 http://www.olaamigos
olaamigos.com.br
Como χ o2 (36,15) > χt2 (5,99), então as variáveis são dependentes! Ou seja, o sexo
do fumante e a marca de cigarro preferida são variáveis que estão “amarradas” uma
a outra por uma relação de dependência!

Questão de Fixação:
1ª) Considerando os valores da tabela abaixo, a qual ilustra os resultados de 50 lançamentos
sucessivos de uma moeda e de um dado honestos, verifique, com α =5%, se estas variáveis são
dependentes ou independentes entre si.
Moeda Cara Coroa Total
Dado
Face ímpar 14 13 27
Face par 10 13 23
Total 24 26 50

IMPORTANTE: A distribuição Qui-Quadrado


Qui Quadrado também será utilizada para definirmos intervalos
de confiança para o Desvio Padrão e para a Variância populacionais.

99 http://www.olaamigos
olaamigos.com.br
# Intervalos de Confiança:

Intervalo de Confiança para a Média:


CRIAÇÃO DE UM INTERVALO DE CONFIANÇA PARA UMA MÉDIA DA POPULAÇÃO

SIM O n é grande? NÃO


(n ≥ 30)?

SIM
O valor de NÃO SIM
O valor de NÃO
σé σé
conhecido? conhecido?

Use: Use: Use: Use:


σ S σ S
X ± Zα / 2 . X ± Zα / 2 . X ± Zα / 2 . X ± tα / 2 .
n n n n

Equações:

σ
X ± Zα / 2 . , para amostra grande (n≥30),
(n com σ conhecido;
n

S
X ± Zα / 2 . , para amostra grande (n≥30),
(n com σ desconhecido;
n

σ
X ± Zα / 2 . , para amostra pequena (n<30), com σ conhecido;
n

S
X ± tα / 2 . , para amostra pequena (n<30) e com σ desconhecido;
desconhecido
n

σ S
# Erro Padrão da Média: ou
n n

σ S S
# Margem de Erro: Zα / 2 . ou Zα / 2 . ou tα / 2 .
n n n

100 http://www.olaamigos
olaamigos.com.br
Quem é esse tal de α?
A questão fornecerá um nível de confiança,, para podermos definir o intervalo! Dada
esta confiança desejada, teremos que:

α =100% - confiança
Assim, se a confiança é de 90%, teremos: α =100%-90%=10%.
Desse modo: α /2=5%=0,05

Questões de Fixação:

1ª) Uma amostra aleatória de 40 itens resultou em uma média amostral de 25. O desvio padrão
da população é σ=5.

a) Qual é o erro padrão da média, σX ?

b) Qual é a margem de erro para uma probabilidade de 95%?

2ª) Uma amostra aleatória de 50 itens


itens resultou em uma média amostral de 32 e um desvio
padrão da amostra de 6.
a) Forneça um intervalo de confiança de 90% para a média da população.
b) Forneça um intervalo de confiança de 95% para a média da população.
c) Forneça um intervalo de confiança de 99% para a média da população.

3ª) Uma amostra aleatória simples de 20 observações de uma população normal resultou em
uma média de amostra de 17,25 e um desvio padrão da amostra de 3,3.
a) Desenvolva um intervalo de confiança de 90% para a média da população.
b) Desenvolva
esenvolva um intervalo de confiança de 95% para a média da população.
c) Desenvolva um intervalo de confiança de 99% para a média da população.

Tamanho da Amostra:
Será calculada com base na margem de erro (E)
( ) do intervalo de confiança!
σ
Vimos que a margem de erro é dada por: E= Z α / 2 .
n
Assim, isolando n na equação acima, chegaremos ao seguinte:

 Z α 2 .σ
2

n =  
 E 

101 http://www.olaamigos
olaamigos.com.br
Questões de Fixação:

1ª) Que tamanho de amostra deveria ser selecionada para fornecer um intervalo de confiança
de 95%, com uma margem de erro de 5? Considere o desvio padrão da população de 25.

2ª) Uma empresa de seguros usou uma amostra aleatória de 36 proprietários de apólice para
estimar a idade média da população de proprietários de apólice. À confiança
confiança de 95%, a margem
de erro foi de 2,35 anos. Esse resultado foi baseado em um desvio padrão da amostra de 7,2
anos.
a) Que tamanho de amostra aleatória seria necessário para reduzir a margem de erro para
2 anos? E para 1,5 ano? E para 1 ano?

Questões de Concurso:

3ª) (ESAF) Tem-sese uma população normal com média µ e variância 225. Deseja-se
Deseja construir, a
partir de uma amostra de tamanho n dessa população, um intervalo de confiança para µ com
amplitude 5 e coeficiente de 95%. Assinale a opção que corresponde
corresponde ao valor de n. Use como
aproximadamente 2 o quantil de ordem 97,5% da distribuição normal padrão.
a) 225 b) 450 c)500 d) 144 e) 200

4ª) (ESAF) Numa firma com um número grande de contas a pagar, supõe-sesupõe que essas se
distribuem, aproximadamente, como uma normal com média µ e desvio padrão conhecido de R$
se determinar o tamanho de amostra n necessário para estimar µ por meio de
1.000,00. Quer-se
um intervalo de confiança de 95% e amplitude de R$ 250,00. Assinale a opção que dá o valor
correto de n. Suponha
ha que o quantil de ordem 97,5% da distribuição normal padrão seja 2.
a) 200 b) 156 c) 256 d) 190 e) 100

Intervalo de Confiança para Proporções:

Equações:

Usaremos apenas uma:

p.q
p ± Zα / 2 .
n
Onde:
p é a proporção da amostra;
q é o complemento de p, ou seja: p=100%-p
p=100%
n é o número de elementos da amostra;
Z é o valor tabelado da distribuição normal.

102 http://www.olaamigos
olaamigos.com.br
Questões de Fixação:

1ª) Em uma pesquisa eleitoral, entre 1000 eleitores, 240 declararam que pretendem votar no
candidato A. Construir um intervalo com 95% de confiança para as intenções de voto para esse
candidato. (R: 21,4% a 26,6%)

2ª) Em uma pesquisa eleitoral, entre 1000 eleitores, a agência de pesquisa concluiu que o
candidato A ficou com 55% da preferência. Considerando
Considerando uma confiança de 95%, qual será o
intervalo das proporções para as intenções de voto desse candidato? (52% a 58%)

Questão de Concurso:

3ª) (ESAF) Uma grande empresa de processamento de dados leva a efeito uma pesquisa de
opinião sobre o nível de satisfação de seus empregados com os respectivos empregos. Neste
contexto, 100 empregados de uma população infinita são selecionados ao acaso e questionados.
Destes, 50 mostraram-se se satisfeitos ou muito satisfeitos com seus empregos. Assinale a opção
que caracteriza
aracteriza o intervalo com coeficiente de confiança de 95%, simétrico, para a proporção
populacional desconhecida de empregados satisfeitos ou muito satisfeitos com seu emprego.
a) 0,40 a 0,60 d) 0,20 a 0,80
b) 0,49 a 0,51 e) 0,45 a 0,55
c) 0,30 a 0,70

Tamanho da Amostra:
Será igualmente calculada com base na margem de erro (E)
( ) do intervalo de confiança!

p.q
Vimos que a margem de erro é dada por: E= Zα / 2 .
n
Assim, isolando n na equação acima, chegaremos ao seguinte:

n=
(Z ) . p.q
α 2
2

E2

Questões de Fixação:
1ª) A secretaria de turismo de um Estado litorâneo brasileiro planeja amostrar visitantes das
suas maiores praias para estimar a proporção de visitantes que não residem neste Estado. As
estimativas preliminares são de que 55% dos visitantes
visitantes não sejam residentes.
a) Que tamanho de amostra deve ser tomada para se estimar a proporção de visitantes de fora
do Estado com uma margem de erro de 3%? Considere um nível de confiança de 95%.
b) Que tamanho de amostra deve ser tomada se a margem de erro for aumentada para 6%?

103 http://www.olaamigos
olaamigos.com.br
2ª) Para avaliar a proporção de estudantes que se utilizam de livros comprados em sebos, um
pesquisador pretende, 30 dias após o início do período letivo, entrevistar alunos do campus. Que
tamanho deverá ter sua amostra para que, com 95% de confiança, o erro não ultrapasse 4%?

Intervalo de Confiança para a Variância:


Será calculado com base na distribuição Qui-Quadrado,
Qui Quadrado, da seguinte maneira:

S 2 .(n − 1) S 2 .(n − 1)
≤σ2 ≤
χsup
2
χinf
2

Onde:
n é o número de elementos da amostra;
S2 é a variância amostral;

χsup
2
é o Qui-Quadrado
Quadrado superior, encontrado na tabela do Qui-Quadrado,
Qui Quadrado, com base na
confiança desejada e nos graus de liberdade (GLIB).

χinf
2
é o Qui-Quadrado
Quadrado inferior, também encontrado na tabela do Qui-Quadrado,
Qui com
base na confiança desejada e nos graus de liberdade (GLIB).

Como fazer para encontrar χsup


2
e χinf
2
?
É muito fácil! Teremos:
Se a confiança for 95%: α =5% e α /2=2,5%=0,025

Assim: χinf
2
= χ02,025 E: χsup
2
= (1-0,025)=0,975 = χ02,975
Se a confiança for 90%: α =10% e α /2=5%=0,05

Assim: χinf
2
= χ02,05 E: χsup
2
= (1-0,05)=0,95 = χ02,95

Questão de Fixação:
Uma amostra aleatória simples de tamanho 25 foi selecionada para estimar a média
desconhecida de uma população normal. A média amostral encontrada
encontrada foi 4,2, e a variância
amostral foi de 1,44.

01. O intervalo de 95% de confiança para a variância populacional é:

a) (0,88 ; 2,79) d) (0,55 ; 3,16)

b) (0,72 ; 3,05) e) (0,44 ; 3,44)

c) (0,64 ; 3,20)

104 http://www.olaamigos
olaamigos.com.br
Intervalo de Confiança para o Desvio Padrão:
Será também calculado com base na distribuição Qui-Quadrado,
Qui Quadrado, da seguinte maneira:

S. n S. n
≤σ ≤
χsup χinf
Onde:
n é o número de elementos da amostra;
S é o desvio padrão amostral;

χsup é a raiz quadrada do Qui-Quadrado


Qui Quadrado superior, encontrado na tabela do Qui-
Quadrado, com base na confiança desejada e nos graus de liberdade (GLIB).

χinf é a raiz quadrada do Qui-Quadrado


Qui Quadrado inferior, também encontrado na tabela do
Qui-Quadrado,
Quadrado, com base na confiança desejada e nos graus de liberdade (GLIB).

Questão de Fixação:
O desvio padrão das alturas de 16 estudantes do sexo masculino, escolhidos aleatoriamente em
uma escola de 1000 estudantes desse sexo é 2,4 cm. Determinar o intervalo de confiança do
desvio padrão para todos os estudantes do sexo masculino
masculino da escola, considerando:
a) Uma confiança de 95%;
b) Uma confiança de 99%.

105 http://www.olaamigos
olaamigos.com.br
Teste de Hipótese para Média:
O Teste de Hipótese é tão-somente
tão somente um procedimento estatístico utilizado para decidir se
devemos aceitar ou rejeitar uma hipótese qualquer, tomando por base elementos oriundos de
uma amostra!
Na verdade, haverá sempre um confronto entre duas hipóteses, as quais serão chamadas
da seguinte forma:
Hipótese Nula: HO (agá-zero);
(agá e
Hipótese Alternativa: H1 (ou HA).
Os enunciados desse tipo de questão falarão a respeito de uma média que se supõe (se
imagina) que seja a correta para uma determinada população. Ou seja, haverá uma suposta
média populacional.. Todavia, alguém suspeita que esta média populacional informada pelo
enunciado não seja, de fato, verdadeira.
Com o surgimento desta suspeita, são coletadas informações de uma amostra! E a
análise dos dados amostrais revelará que a média amostral não coincide com aquela média
populacional que se supunha ser a correta!
correta
Com base nisso, teremos condições de formular as duas hipóteses que serão
confrontadas:
Na Hipótese Nula (H0), diremos que a média populacional é aquela mesma que fora
informada pelo enunciado, e que se supõe correta; e
Na Hipótese Alternativa (H1), que nasce de uma desconfiança, diremos que a
verdadeira média populacional não será igual àquela tida de início como supostamente correta!
Ora, quando se diz que um valor A não é igual a outro valor B,, haverá, na verdade, três
possibilidades:
1ª) A ≠ B ou 2ª) A > B ou 3ª) A < B .
Estamos falando, obviamente, da Hipótese Alternativa! E o que definirá se a H1 trará um
sinal de ≠ ou de > ou de < será o resultado obtido na amostra!
De todo o exposto, já podemos tirar algumas conclusões:
A Hipótese
ótese Nula será sempre uma hipótese de igualdade:

H0: µ = µ0
Onde µ é a verdadeira média populacional e µ0 é a suposta média populacional.
A Hipótese Alternativa será sempre de desigualdade:

H1: µ ≠ µ0 ou H1: µ > µ0 ou H1: µ < µ0

É preciso sabermos que a Hipótese Nula (H ( 0) é aquela que será, de fato, testada! É
sempre assim! Por este motivo, ela poderá ser também chamada de Hipótese Probanda!
Probanda
Uma vez realizado o teste com a Hipótese Nula, poderão advir dois resultados:
H0 é verdadeira, de
e sorte que será aceita (ou não será rejeitada,
rejeitada como preferem os
estatísticos);
H0 é falsa, devendo, pois, ser rejeitada.
Uma vez rejeitando-se
se a Hipótese Nula (H
( 0), aceitaremos, por via de exceção, a Hipótese
Alternativa (H1).

106 http://www.olaamigos
olaamigos.com.br
O fato é que ao realizar
izar um Teste de Hipótese, o pesquisador não quer cometer nenhum
erro! E quais seriam os possíveis erros que ele poderia cometer? Ora, ele poderia errar de duas
formas:
Se H0 for verdadeira e ele a rejeitar; ou
Se H0 for falsa e ele a aceitar.
Cada um desses erros possui um nome! Teremos:

ERRO TIPO 1: H0 é verdadeira, mas rejeitada!


Na feliz analogia criada pelo Prof. Pedro Bello, o erro tipo 1 corresponde a condenar um
inocente.. É como se o réu dissesse a verdade, mas seus argumentos fossem rejeitados!

ERRO TIPO 2: H0 é falsa, mas aceita!


Contrariamente, o erro tipo 2 corresponderia a inocentar um culpado!
culpado Ele, o réu,
mentia, mas seu argumento foi aceito.
Condenar um inocente é algo terrível! Este tipo de erro (erro tipo 1) o pesquisador quer
evitar a todo o custo! Porém, infelizmente, há sempre uma probabilidade de cometê-lo.
cometê Esta
probabilidade é o que chamaremos de nível de significância (α).
Assim, nível de significância (
(αα) é a probabilidade de se cometer um erro do tipo 1.
O pesquisadorr deseja sempre que este α seja o menor possível!
Tudo bem até aqui?
Neste momento, precisamos saber que existem 3 diferentes tipos de Teste de Hipótese
para a Média, e que são os seguintes:
# Teste Bilateral (ou Bicaudal):

Aqui, teremos as duas seguintes hipóteses:

H0: µ = µ0
H1: µ ≠ µ0

Neste desenho, temos que as duas áreas laterais que estão destacadas (em vermelho)
correspondem à chamada região crítica,
crítica ou região de rejeição de H0.
Vemos, pois, que neste primeiro tipo de Teste de Hipótese, a região crítica localiza-se
localiza nas
duas laterais
is (nas duas caudas) do desenho. Daí o nome teste bilateral (ou bicaudal).

107 http://www.olaamigos
olaamigos.com.br
Por sua vez, a área central do desenho será dita região de aceitação de H0.
# Teste Unilateral à Direita (ou Unicaudal à Direita):

As hipóteses serão, neste segundo caso, as seguintes:

H0: µ = µ0
H1: µ > µ0

Neste caso, só haverá uma região crítica,, na lateral direita do desenho (daí o nome
desse teste), enquanto a região de aceitação corresponde a todo o restante da área sob a
curva!

# Teste Unilateral à Esquerda (ou Unicaudal à Esquerda):

Neste último caso, teremos as seguintes hipóteses:

H0: µ = µ0
H1: µ < µ0

108 http://www.olaamigos
olaamigos.com.br
A única região crítica agora estará bem na lateral esquerda do desenho, enquanto a
região de aceitação corresponde a todo o restante da área sob a curva!
Estou certo que todos já estão reconhecendo que tipo de curva é esta que será usada nos
testes de hipótese! Sim? Claro! É a curva normal padronizada!
Aquela curva normal cujos parâmetros são µ=0 e σ2=1. E para a qual existe uma tabela
de probabilidades já pronta para ser consultada!
Se estivermos bem lembrados, convenciona-se
convenciona se chamar a variável normal padronizada de
Z. (Vide a “parte 1” deste Curso!).
Agora vamos chegar aos finalmentes!
Para realizar o teste será preciso descobrir dois valores de Z:: um deles será encontrado
na tabela da curva normal padronizada.
padronizada Será o Z tabelado!! E o outro deles será determinado
por meio de
e uma fórmula (um cálculo). Esse será chamado Z calculado!
De novo: uma vez que já reconhecemos que a questão versa sobre o teste de hipóteses,
uma vez que já definimos, por meio do enunciado, quais serão as hipóteses a serem
confrontadas, uma vez que já sabemos qual é o tipo de teste a ser utilizado (se bilateral ou
unilateral), falta apenas descobrir dois valores de Z:
Z tabelado:: determinado via consulta à tabela da curva normal padrão;
Z calculado:: determinado por meio de uma fórmula.
É importante saber que o Z tabelado é o primeiro a ser buscado! Ele será encontrado na
tabela, a partir do nível de confiança estabelecido pela questão. (Daqui a pouco vamos aprender
a encontrá-lo!).
lo!). É ele que definirá o limite entre a região crítica e a região
r de aceitação da
curva! Por esse motivo, o Z tabelado será também chamado de Z crítico, crítico podendo ser
designado por Zc.. Neste Curso, por uma questão de didática, chamaremos o Z tabelado de
Ztab,, seguindo a melhor lição do eminente Prof. Pedro Bello.
Assim,
sim, vejamos onde aparecerá o Ztab (Z tabelado = Z crítico) nos três desenhos:
a) No teste bilateral:

Região de Aceitação
de Ho.

-ZTAB +ZTAB

Região Crítica Região Crítica


(= região de (= região de
rejeição de Ho) rejeição de Ho)

109 http://www.olaamigos
olaamigos.com.br
Como se vê no desenho acima, o ZTAB é o limite entre a região de aceitação e a de
rejeição de Ho. Trata-se
se de um Z que, repito, será encontrado na tabela de probabilidades da
(α) adotado.
curva normal padrão, com base no valor do nível de significância (α
O teste bilateral é o único em que o ZTAB aparece duas vezes no desenho (como ZTAB e
–ZTAB), uma vez que há duas regiões críticas. Nos demais testes – unilaterais – só haverá uma
região crítica e, portanto, o ZTAB só vai aparecer uma vez. Senão vejamos!
b) No teste unilateral à direita:

Região de Aceitação
de Ho.

ZTAB

Região Crítica
(= região de
rejeição de Ho)
c) No teste unilateral à esquerda:

Região de Aceitação
de Ho.

-ZTAB

Região Crítica
(= região de
rejeição de Ho)

110 http://www.olaamigos
olaamigos.com.br
Até aqui, tudo bem?
Agora vamos aprender como determinar esse valor de ZTAB. Ora, é muito fácil fazer isso!

Na verdade, só precisamos perguntar: quanto é o valor de α (nível de significância) que


o enunciado está admitindo para esse teste?

Este percentual - α - será a própria área que estará sob a curva, na região crítica do
desenho!
Assim, conhecendo a área da região crítica, poderemos facilmente, mediante uma rápida
consulta à tabela das probabilidades da curva normal padrão, determinar o valor do ZTAB.
Atenção para o seguinte: no caso dos testes unilaterais (direito e esquerdo), a região
crítica é uma só, de sorte que à sua área corresponderá diretamente o α.
Já no caso do teste bilateral, como são duas as regiões críticas, o α estará dividido em
duas metades, uma para cada lado do desenho.
Visualizando isto tudo o que foi dito, teremos:
a) Para o teste bilateral:

α α
2 2

-ZTAB +ZTAB

b) Para o teste unilateral à direita:

ZTAB

111 http://www.olaamigos
olaamigos.com.br
c) Para o teste unilateral à esquerda:

-ZTAB

Aprendemos no módulo inicial deste Curso que a tabela de probabilidades da


curva normal padronizada nos fornece sempre a área que varia entre o Z=0 e um Z qualquer,
à direita do primeiro.
Assim, no teste de hipótese bilateral, considerando o que já aprendemos sobre a simetria
da curva normal, para descobrir o valor do ZTAB, trabalharemos com a seguinte área do desenho
(a área das bolinhas azuis):

50% – α
2

α α
2 2

-ZTAB +ZTAB

Ou seja, na Tabela da Curva Normal Padronizada – Curva Z – nós procuraremos, no


miolo da tabela, o valor (50 – α/2).
α/2). Vejam que este 50 é o mesmo que 50%, apenas sem o sinal
de %!
stivermos num teste de hipóteses bilateral, e a questão disser que α=10%,
Assim, se estivermos
teremos que α/2=5%.
/2=5%. Na notação da tabela: α/2=5.
Daí, faremos a seguinte subtração: 50 – 5 = 45.
E é esse valor (45) que será procurado por nós na tabela da curva normal padronizada!
padronizada
Fazendo isso, encontraremos:

112 http://www.olaamigos
olaamigos.com.br
Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 00,00 00,40 00,80 01,20 01,60 01,99 02,39 02,79 03,19 03,59
0.1 03,98 04,38 04,78 05,17 05,57 05,96 06,36 06,75 07,14 07,53
0.2 07,93 08,32 08,71 09,10 09,48 09,87 10,26 10,64 11,03 11,41
0.3 11,79 12,17 12,55 12,93 13,31 13,68 14,06 14,43 14,80 15,17
0.4 15,54 15,91 16,28 16,64 17,00 17,36 17,72 18,08 18,44 18,79

0.5 19,15 19,50 19,85 20,19 20,54 20,88 21,23 21,57 21,90 22,24
0.6 22,57 22,91 23,24 23,57 23,89 24,22 24,54 24,86 25,17 25,49
0.7 25,80 26,11 26,42 26,73 27,04 27,34 27,64 27,94 28,23 28,52
0.8 28,81 29,10 29,39 29,67 29,95 30,23 30,51 30,78 31,06 31,33
0.9 31,59 31,86 32,12 32,38 32,64 32,90 33,15 33,40 33,65 33,89

1.0 34,13 34,38 34,61 34,85 35,08 35,31 35,54 35,77 35,99 36,21
1.1 36,43 36,65 36,86 37,08 37,29 37,49 37,70 37,90 38,10 38,30
1.2 38,49 38,69 38,69 39,07 39,25 39,44 39,62 39,80 39,97 40,15
1.3 40,32 40,49 40,66 40,82 40,99 41,15 41,31 41,47 41,62 41,77
1.4 41,92 42,07 42,22 42,36 42,51 42,65 42,79 42,92 43,06 43,19

1.5 43,32 43,45 43,57 43,70 43,83 43,94 44,06 44,18 44,29 44,41
1.6 44,52 44,63 44,74 44,84 44,95 45,05 45,15 45,25 45,35 45,45

Vejam que o valor exato 45 está, na tabela acima, entre 44,95 e 45,05. Se quiséssemos
ser muito rigorosos, teríamos que dizer que o Z corresponde a esta área (45%) seria 1,645. Pois
1,645 está entre 1,64 e 1,65.
Mas, para efeito de concurso (e vários autores
autores consagrados fazem o mesmo!), podemos
considerar que o Z,, para esta área de 45%, é apenas 1,64.
Este Z=1,64 é o ZTAB que será usado no teste. Considerando a simetria da curva normal,
o valor de -ZTAB será, obviamente, -1,64.
Assim, encontramos, para o exemplo proposto acima, o seguinte desenho:

-1,64 1,64

Caso estivéssemos trabalhando com um teste de hipótese unilateral à direita, na hora de


descobrir o ZTAB , teríamos que fazer o seguinte:

113 http://www.olaamigos
olaamigos.com.br
50% – α

+ZTAB

Se a questão houvesse dito que α=10%, faríamos: 50% - 10% = 40%. E este valor 40
(sem o sinal de %) seria procurado por nós no miolo da tabela da curva normal padronizada.
Faremos:
Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 00,00 00,40 00,80 01,20 01,60 01,99 02,39 02,79 03,19 03,59
0.1 03,98 04,38 04,78 05,17 05,57 05,96 06,36 06,75 07,14 07,53
0.2 07,93 08,32 08,71 09,10 09,48 09,87 10,26 10,64 11,03 11,41
0.3 11,79 12,17 12,55 12,93 13,31 13,68 14,06 14,43 14,80 15,17
0.4 15,54 15,91 16,28 16,64 17,00 17,36 17,72 18,08 18,44 18,79

0.5 19,15 19,50 19,85 20,19 20,54 20,88 21,23 21,57 21,90 22,24
0.6 22,57 22,91 23,24 23,57 23,89 24,22 24,54 24,86 25,17 25,49
0.7 25,80 26,11 26,42 26,73 27,04 27,34 27,64 27,94 28,23 28,52
0.8 28,81 29,10 29,39 29,67 29,95 30,23 30,51 30,78 31,06 31,33
0.9 31,59 31,86 32,12 32,38 32,64 32,90 33,15 33,40 33,65 33,89

1.0 34,13 34,38 34,61 34,85 35,08 35,31 35,54 35,77 35,99 36,21
1.1 36,43 36,65 36,86 37,08 37,29 37,49 37,70 37,90 38,10 38,30
1.2 38,49 38,69 38,69 39,07 39,25 39,44 39,62 39,80 39,97 40,15
1.3 40,32 40,49 40,66 40,82 40,99 41,15 41,31 41,47 41,62 41,77
1.4 41,92 42,07 42,22 42,36 42,51 42,65 42,79 42,92 43,06 43,19

1.5 43,32 43,45 43,57 43,70 43,83 43,94 44,06 44,18 44,29 44,41
1.6 44,52 44,63 44,74 44,84 44,95 45,05 45,15 45,25 45,35 45,45

Novamente trabalhamos com a melhor aproximação possível da tabela!


Neste caso, Z=1,28 é o ZTAB que será usado no teste.

114 http://www.olaamigos
olaamigos.com.br
1,28
Idêntico raciocínio a este que acabamos de utilizar para o teste unilateral direito aplicar-
aplicar
se-á também
bém ao teste unilateral esquerdo!
E já que estamos aqui, ilustremos esta última observação por meio de mais um exemplo.
Suponhamos, agora, que α=1%,
=1%, e que o teste seja unilateral à esquerda. Neste caso, o desenho
desse teste será o seguinte:

50% – 1% = 49%

α=1%

-ZTAB

Considerando a simetria da Curva Normal Padronizada, rebateremos este desenho para o


lado direito, tal como se o tracejado central da curva fosse um espelho, e teremos então o
seguinte:

49%

1%

+ZTAB

115 http://www.olaamigos
olaamigos.com.br
No miolo da tabela da Curva Normal Padrão, procuraremos pelo valor 49 (sem o sinal de
%), e encontraremos que:
Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 00,00 00,40 00,80 01,20 01,60 01,99 02,39 02,79 03,19 03,59
0.1 03,98 04,38 04,78 05,17 05,57 05,96 06,36 06,75 07,14 07,53
... ... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ... ...
2.3 48,93 48,96 48,98 49,01 49,04 49,06 49,09 49,11 49,13 49,16

Usando excelente aproximação, teremos que o ZTAB neste caso será 2,33. Ocorre que, na
verdade, este teste é unilateral à esquerda, de sorte que o -ZTAB que aparecerá no desenho
deste exercício será -2,33.. Assim, teremos:

-2,33

Creio que já temos elementos suficientes para sabermos descobrir o valor do ZTAB em
qualquer caso!
Como já dito anteriormente, o teste de hipótese será uma comparação entre dois valores
de Z (curva normal padrão). Um deles é o ZTAB que já conhecemos!
O outro deles é o chamado Z calculado! Chama-se
se assim porque será obtido por meio
de um cálculo. Aprendamos:

X −µ
Z CALC =
σ
n
Onde:

X é a média da amostra;
µ é a média presumida para a população;
σ é o desvio padrão populacional; e
n é o número de elementos da amostra.

116 http://www.olaamigos
olaamigos.com.br
Ora, conforme vimos anteriormente, o Z tabelado servia para definir qual seria a área
de aceitação e a área de rejeição de Ho.. Pois bem! Uma vez definidas estas áreas no desenho,
faremos este cálculo acima, para determinação do Z calculado (ZcalcZcalc). Haverá, pois, duas
possibilidades:
1ª) Se o Z calculado estiver na área de aceitação de Ho, diremos que Ho será
aceita;
2ª) Se o Z calculado estiver na área de rejeição de Ho, diremos que Ho será
rejeitada.
Não parece tudo muito intuitivo? Claro!
Este último caso – a rejeição de Ho – implica, conseqüentemente, que aceitaremos H1.
Ok? Não acabou ainda!
Algo importante deve ser considerado no tocante à fórmula apresentada
apresent acima! Vejam
que o desvio padrão nela utilizado foi o populacional (σ).
(
Mas, se ocorrer de este σ ser um valor desconhecido, e a questão nos disser apenas
quem é o desvio padrão amostral (S)?
( O que faremos neste caso?
Muito simples: substituiremos σ por S na fórmula, e teremos o seguinte:

X −µ
Z CALC =
S
n
Onde:

X é a média da amostra;
µ é a média presumida para a população;
S é o desvio padrão amostral; e
n é o número de elementos da amostra.

Essa alteração não foi, por certo, algo tão difícil de aceitar, concordam? Só podemos
trabalhar com os elementos que dispomos! Se o enunciado não nos der o desvio padrão
populacional, e sim o amostral, usaremos este último no lugar daquele primeiro!
Tem mais!
odos lembrados do estudo que foi feito sobre a criação de intervalos de
Estamos todos
confiança para a média? Naquela ocasião, vimos que seria utilizada a Curva Normal Padronizada
(Z) para a determinação dos intervalos.
Porém, havia uma única situação em que a curva Z (normal) seria substituída por uma
outra – a Curva t de Student – a chamada distribuição das pequenas amostras!
amostras Lembram-se?
Isto ocorreria somente se duas características estivessem ao mesmo tempo presentes no
enunciado:
1ª) O número de elementos do conjunto
conj n teria que ser menor que 30.
2ª) O desvio padrão populacional teria que ser um valor desconhecido.
E aí, somente nestas circunstâncias, trocávamos a Curva Z pela Curva t.

117 http://www.olaamigos
olaamigos.com.br
Agora a novidade: este mesmo entendimento será aplicado também aqui, na teoria dos
Testes de Hipótese, de modo que nestas idênticas condições, trocaremos a Curva Normal (Z)
pela de Student (t).
Assim, se tivermos que n<30 e, além disso, σ é um valor desconhecido,
desconhecido os dois valores
a serem confrontados no Teste de Hipótese não serão Z tabelado e Z calculado, e sim
t tabelado (tTAB) e t calculado (tCALC).
Trocaremos o Z pelo t.
Como se descobre o t tabelado (tTAB)? Por meio da tabela da Curva t, utilizando, como
já é do nosso conhecimento, dois parâmetros:
o nível de significância α que será fornecido pela questão;
o número de graus de liberdade (GL), calculado como GL=n-1.
1.
Com esses dois parâmetros, consultamos a tabela da Curva t,, cruzando
cruza linha com coluna,
e encontramos quem será o t tabelado.
tabelado
Facílimo!
Uma vez conhecendo esse valor de t tabelado,, faremos o desenho da Curva t
(semelhante à Curva Z, simétrica, do mesmo jeito, em forma de sino), e aquele t tabelado será
o divisor de águas entre a área de aceitação e a área de rejeição da hipótese Ho.

Exatamente da mesma forma que vimos para a curva normal,, também aqui no teste de
hipótese com uso da curva t haverá três possibilidades de teste:
a) Teste bilateral:

Região de Aceitação
de Ho.

α/2

-tTAB +tTAB

Região Crítica Região Crítica


(= região de (= região de
rejeição de Ho) rejeição de Ho)

118 http://www.olaamigos
olaamigos.com.br
b) Teste unilateral à direita:
Região de Aceitação
de Ho.

tTAB

Região Crítica
(= região de
rejeição de Ho)

c) Teste unilateral à esquerda:

Região de Aceitação
de Ho.

-tTAB

Região Crítica
(= região de
rejeição de Ho)

E quanto ao t calculado (tCALC), como o encontraremos? Por meio da seguinte fórmula:

X −µ
tCALC =
S
n

119 http://www.olaamigos
olaamigos.com.br
Ou seja, não há diferença na fórmula acima, em relação àquela utilizada para o Z
calculado, no caso em que σ é desconhecido! Mesma fórmula!
Pois bem! Havíamos primeiro encontrado o valor do t tabelado,, para assim podermos
definir as áreas de aceitação e rejeição de Ho.
Agora, que já calculamos o valor do t calculado,, haverá duas possibilidades:
1ª) Se o t calculado estiver na área de aceitação de Ho, diremos que Ho será
aceita;
2ª) Se o t calculado estiver na área de rejeição de Ho, diremos que Ho será
rejeitada.
É isso!
Creio que já temos teoria suficiente! Vamos passar, finalmente, a trabalhar alguns
exercícios, objetivando fixar este conhecimento teórico.
Antes, porém, vejamos na seqüência um passo a passo de resolução
solução que pode (e deve!)
ser utilizado por nós na hora de resolver uma questão de Teste de Hipótese para a Média.
Vejamos:
Passo a Passo do Teste de Hipótese para Média
1º Passo) Definir, de acordo com o enunciado, quais são as duas hipóteses a serem
confrontadas (Ho e H1);
Lembraremos que Ho será uma hipótese de igualdade, e H1, de desigualdade (≠,
( > ou <).
Conforme o sinal de H1, teremos a definição do teste a ser realizado, se bilateral (H1 com
sinal de ≠),
), ou unilateral esquerdo (H1 com sinal de <),
), ou unilateral direito (H1 com sinal de >).

2º Passo) Definir, conforme os dados da questão, se será utilizada a Curva Normal (Z) ou a
Curva de Student (t).
Lembraremos que a Curva t só será usada em um único caso: se n<30 e, ao mesmo
tempo, σ (desvio padrão populacional) for desconhecido.

3º Passo) Fazer o desenho do teste, definindo na linha horizontal inferior, sob a curva, onde
estará localizado o Z tabelado ou o t tabelado.
São as seguintes possibilidades:
Com a Curva Z (Normal Padronizada):

Teste Bilateral Teste Unilateral Direito Teste Unilateral Esquerdo

-ZTAB ZTAB ZTAB - TAB


-Z

120 http://www.olaamigos
olaamigos.com.br
Com a Curva t (de Student):
Teste Bilateral Teste Unilateral Direito Teste Unilateral Esquerdo

-tTAB tTAB tTAB -tTAB

4º Passo) Descobrir, usando a tabela adequada à situação (a da Curva Normal ou a da


t-Student), o Z tabelado ou o t tabelado.
Lembrando que para achar o Z tabelado usaremos apenas o nível de significância α
que será fornecido pela questão.
Já no caso do t tabelado,
tabelado usaremos, para encontrá-lo, além do nível de significância
α, também o número de graus de liberdade da curva: GL=n-1. 1. (Onde n é o número de
elementos da amostra)!
Com este passo, definimos no desenho do teste quais são as áreas de aceitação e de
rejeição de Ho. Nos desenhos que vemos acima, no terceiro passo, as áreas de rejeição de Ho,
também m chamadas de regiões críticas, estão sempre marcadas com tracinhos vermelhos.

5º Passo) Calcular, usando a fórmula adequada à situação, o Z calculado ou o t calculado.


Para tanto, haverá três possibilidades:
≥30 e desvio padrão populacional σ conhecido:
1ª) Se n≥

X −µ
Z CALC =
σ
n
≥30 e desvio padrão populacional σ desconhecido:
2ª) Se n≥

X −µ
Z CALC =
S
n
3ª) Se n<30 e desvio padrão populacional σ desconhecido:

X −µ
tCALC =
S
n
6º Passo) Localizar no desenho do teste onde está o Z calculado ou o t calculado,
calculado se na área
de aceitação ou na área de rejeição de Ho, para, finalmente, decidir.
O critério de decisão será sempre o mesmo:
Se o t calculado ou o Z calculado estiver:
na área de aceitação de Ho, diremos que Ho será aceita;
na área de rejeição de Ho, diremos que Ho será rejeitada.

121 http://www.olaamigos
olaamigos.com.br
Basicamente, é isso! Fácil até demais!
E vamos treinar agora, por meio de vários exercícios. Adiante!

Exemplo 01) Uma amostra de 36 elementos de uma variável X, normalmente


distribuída, forneceu X =42,3 e S=5,2. Testar, no nível de significância de 5%, a
hipótese de que µ>40.
Sol.: Vamos seguir o passo a passo!
1º Passo) Definir, de acordo com o enunciado,
enunciado, quais são as duas hipóteses a serem
confrontadas (Ho e H1).
A hipótese alternativa (H1) foi explicitada pelo próprio enunciado: µ>40.
µ Já sabíamos que
ela deve trazer uma desigualdade.
Em relação à hipótese nula (Ho), basta trocar o sinal de > pelo de igualdade (=).
Assim, chegamos ao seguinte:
Ho: µ =40
H1: µ >40

2º Passo) Definir, conforme os dados da questão, se será utilizada a Curva Normal (Z) ou a
Curva de Student (t).
Uma vez que n=36,, ou seja, n≥30,
n usaremos a Curva Normal nesta resolução!

3º Passo) Fazer o desenho do teste, definindo na linha horizontal inferior, sob a curva, onde
estará localizado o Z tabelado ou o t tabelado.
Uma vez que H1 apresenta sinal de >, então se trata de um teste unilateral à direita.
Teremos:
Teste Unilateral à Direita

ZTAB

4º Passo) Descobrir, usando a tabela adequada à situação (a da Curva Normal ou a da


t-Student), o Z tabelado ou o t tabelado.
Neste caso, trabalharemos com a curva Z (normal padronizada).
Uma vez que a questão definiu que α=5%,
=5%, e usando a metade direita da curva Z,
raciocinaremos assim:
50% - 5% = 45%
Procurando o valor 45 na tabela da curva normal, encontraremos que: ZTAB=1,64.
Assim:

122 http://www.olaamigos
olaamigos.com.br
1,64

5º Passo) Calcular, usando a fórmula adequada à situação, o Z calculado ou o t calculado.


n≥30 e σ desconhecido.
Usando os dados da questão, aplicaremos a equação para n≥
Teremos:

X −µ 42,3 − 40 2,3 x6 13,8


Z CALC = Z CALC = = = = 2,65
S 5,2 5,2 5,2
n 36
6º Passo) Localizar no desenho do teste onde está o Z calculado ou o t calculado,
calculado se na área
de aceitação ou na área de rejeição de Ho, para, finalmente, decidir.
Como vemos facilmente, o ZCALC é um valor que pertence à região de rejeição de Ho
(região crítica), de sorte que Ho será, portanto, rejeitada!

Exemplo 02) Uma amostra de 20 elementos de uma variável X, normalmente


distribuída, forneceu X =53,4 e S=7,5. Testar, no nível de significância de 5%, a
hipótese de que µ=50.
Sol.: Novamente, sigamos o passo a passo de resolução!
1º Passo) Definir, de acordo com o enunciado, quais são as duas hipóteses a serem
confrontadas (Ho e H1).
O enunciado nos fala na hipótese µ=50.. Ora, sabemos que, por apresentar a igualdade,
trata-se
se da Hipótese Nula (Ho).
Considerando que o enunciado não sugere que a média populacional deva ser maior ou
menor que 50, fica implícito que o sinal da hipótese alternativa
alternativa (H1) será, portanto, o de
µ ≠50.. Teremos, pois, que:
diferença (≠):µ
Ho: µ =50
H1: µ ≠ 50

2º Passo) Definir, conforme os dados da questão, se será utilizada a Curva Normal (Z) ou a
Curva de Student (t).
Uma vez que n=20,, ou seja, n<30, e, ao mesmo tempo, σ (desvio padrão populacional)
é um valor desconhecido,, usaremos a Curva t de Student nesta resolução!

3º Passo) Fazer o desenho do teste, definindo na linha horizontal inferior, sob a curva, onde
estará localizado o Z tabelado ou o t tabelado.
Uma vez que H1 apresenta sinal de ≠, então se trata de um teste bilateral.
Teremos:

123 http://www.olaamigos
olaamigos.com.br
Teste Bilateral

-tTAB tTAB

4º Passo) Descobrir, usando a tabela adequada


adequada à situação (a da Curva Normal ou a da
t-Student), o Z tabelado ou o t tabelado.
Neste caso, trabalharemos com a curva t (de Student).
Os dois parâmetros de consulta, conforme já sabemos, são os seguintes:
α/2=2,5%
Número de graus de liberdade: GL=n-1
GL=n GL=20-1 GL=19
Fazendo, na tabela da curva t, o cruzamento destes dois parâmetros, vamos encontrar o
seguinte:

Tabela da Distribuição t de Student

α
25% 10% 5% 2,5% 1% 0,5%
GL
1 1,0000 3,0777 6,3138 12,7062 31,8207 63,6574
2 0,8165 1,8856 2,9200 4,3027 6,9646 9,9248
3 0,7649 1,6377 2,3534 3,1824 4,5407 5,8409
4 0,7407 1,5332 2,1318 2,7764 3,7469 4,6041
5 0,7267 1,4759 2,0150 2,5706 3,3649 4,0322

6 0,7176 1,4398 1,9432 2,4469 3,1427 3,7074


7 0,7111 1,4149 1,8946 2,3646 2,9980 3,4995
8 0,7064 1,3968 1,8595 2,3060 2,8965 3,3554
9 0,7027 1,3830 1,8331 2,2622 2,8214 3,2498
10 0,6998 1,3722 1,8125 2,2281 2,7638 3,1693

11 0,6974 1,3634 1,7959 2,2010 2,7181 3,1058


12 0,6955 1,3562 1,7823 2,1788 2,6810 3,0545
13 0,6938 1,3502 1,7709 2,1604 2,6503 3,0123
14 0,6924 1,3450 1,7613 2,1448 2,6245 2,9768
15 0,6912 1,3406 1,7531 2,1315 2,6025 2,9467

16 0,6901 1,3368 1,7459 2,1199 2,5835 2,9208


17 0,6892 1,3334 1,7396 2,1098 2,5669 2,8982
18 0,6884 1,3304 1,7641 2,1009 2,5524 2,8784
19 0,6876 1,3277 1,7291 2,0930 2,5395 2,8609
20 0,6870 1,3253 1,7247 2,0860 2,5280 2,8453

21 0,6864 1,3232 1,7207 2,0796 2,5177 2,8314


22 0,6858 1,3212 1,7171 2,0739 2,5083 2,8188
23 0,6853 1,3195 1,7139 2,0687 2,4999 2,8073
24 0,6848 1,3178 1,7109 2,0639 2,4922 2,7969
25 0,6844 1,3163 1,7081 2,0595 2,4851 2,7874

124 http://www.olaamigos
olaamigos.com.br
26 0,6840 1,3150 1,7056 2,0555 2,4786 2,7787
27 0,6837 1,3137 1,7033 2,0518 2,4727 2,7707
28 0,6834 1,3125 1,7011 2,0484 2,4671 2,7633
29 0,6830 1,3114 1,6991 2,0452 2,4620 2,7564
30 0,6828 1,3104 1,6973 2,0423 2,4573 2,7500

40 0,6807 1,3031 1,6839 2,0211 2,4233 2,7045


50 0,6794 1,2987 1,6759 2,0086 2,4033 2,6778
60 0,6786 1,2958 1,6706 2,0003 2,3901 2,6603
70 0,6780 1,2938 1,6669 1,9944 2,3808 2,6479
80 0,6776 1,2922 1,6641 1,9901 2,3739 2,6387

90 0,6772 1,2910 1,6620 1,9867 2,3685 2,6316


100 0,677 1,290 1,660 1,984 2,364 2,626
120 0,677 1,289 1,658 1,980 2,358 2,617
∝ 0,674 1,282 1,645 1,960 2,326 2,576

Este valor encontrado pela consulta acima é exatamente o t tabelado!


tabelado
Assim: tTAB = 2,093
No desenho, teremos:

-2,093 2,093

Com isso, definimos quais são as áreas de aceitação e de rejeição de Ho. Adiante!

5º Passo) Calcular, usando a fórmula adequada à situação, o Z calculado ou o t calculado.


Usando os dados da questão, aplicaremos a equação para n<30 e σ desconhecido.
Teremos:

X −µ 53,4 − 50
tCALC = tCALC = ≅ 2,03
S 7,5
n 20
6º Passo) Localizar no desenho do teste onde está o Z calculado ou o t calculado,
calculado se na área
de aceitação ou na área de rejeição de Ho, para, finalmente, decidir.
Como vemos facilmente, o ZCALC é um valor que está fora da região crítica, ou seja, fora
da região de rejeição de Ho (região crítica), de sorte que Ho será, portanto, aceita!
aceita

É isso! Na seqüência, apresento-lhes


apresento lhes questões propostas que versam sobre este assunto,
o Teste de Hipóteses para a Média.

Questões de Fixação:
125 http://www.olaamigos
olaamigos.com.br
01) Uma indústria produz lâmpadas cuja duração segue uma distribuição N (800, 1600).
Testar a hipótese de que µ=800 contra a alternativa de µ≠800,
800, se uma amostra aleatória
de 30 lâmpadas tem um tempo médio de vida de 788 horas. Adotar α=0,05.

02) Uma amostra de tamanho n=18 de população normal tem média X =31,5 e desvio
padrão S=4,2. Ao nível de significância de 5%, estes dados sugerem que a média
populacional seja superior a 30?

03) Em uma amostra de 10 elementos, a média da amostra observada foi de 230. Sabe-se
Sabe
que a variância da população é igual a 160. Testar a hipótese de µ=218 contra a
alternativa µ>218, ao nível de significância de 10%.

04) O diâmetro médio de parafusos em uma amostra de 400 parafusos forneceu o valor de
25 mm. Sendo 4 mm o desvio padrão do processo de fabricação, pode-se
pode afirmar, ao
nível de significância de 5%, que o diâmetro médio de todos os
os parafusos seja inferior a
25,4 mm?

05) Um ensaio de tensões de ruptura de 6 cabos produzidos por uma companhia mostrou a
tensão média de ruptura de 7.750 kg, e o desvio padrão de 145 kg, ao passo que o
fabricante declara que aquela tensão média é de 8.000 kg.
kg. Será verdadeira a declaração
do fabricante, ao nível de significância de 5%?

Questões de Concurso:

01) (Esaf) Em uma distribuição de sinistro S, formulando-se


formulando se a hipótese de que não há
diferença entre a frequência esperada e a observada (hipótese nula: Ho). Donde,
segundo um determinado nível de significância, podemos afirmar que ocorreu:
a) um erro do tipo I, se for aceita a hipótese Ho
b) um erro do tipo II, se for rejeitada a hipótese Ho
c) um erro do tipo I, se for aceita a hipótese Ho, estando ela correta.
d) Um erro
rro do tipo II, se for rejeitada a hipótese Ho, estando ela correta.
e) Um erro do tipo I, se for rejeitada a hipótese Ho, sendo esta correta.

02) (NCE-UFRJ) Considere uma amostra aleatória de tamanho 36 de uma distribuição


normal com média µ e desvio padrão 1,8. Deseja-se
Deseja testar Ho: µ=10
µ versus H1: µ>10.
O teste uniformemente mais poderoso de tamanho 1% rejeitará Ho se a média amostral
for, no mínimo, igual a:
a) 10,7 b) 11,1 c) 11,5 d) 11,9 e) 12,3

03) (FCC) Uma amostra aleatória de 9 valores de salários extraída de uma população,
considerada normal e de tamanho infinito, apresentou média igual a R$ 800,00 , com
um desvio padrão igual a R$ 120,00. Os registros históricos indicam que a média dos
salários da população é igual a R$ 740,00. Deseja-se
Deseja se testar a hipótese, ao nível de
significância α,, para testes bicaudais com 8 graus de liberdade. Sabendo-se
Sabendo que Ho foi
rejeitada, tem-se que:
a) tα/2 < 1,5.
b) tα/2 > 1,5.

126 http://www.olaamigos
olaamigos.com.br
c) para qualquer nível de significância Ho seria rejeitada, pois (800-740)
(800 740)≠0.
d) o valor da variável do teste (t calculado) obtido através da amostra e necessário para
comparação com -tα/2 e tα/2 é igual a 0,5.
e) a um nível de significância β, β>α, Ho não teria sido rejeitada.

04) (Esaf) Um teste de hipóteses foi aplicado e, ao nível de significância de 5% rejeitou-se


Ho. O que acontecerá, se forem adotados níveis de significância de 1% e de 10%,
respectivamente?
a) Rejeitar-se-á
á Ho em ambos os casos.
b) Rejeitar-se-á
á Ho a 1% e nada se pode afirmar quanto ao de 10%.
c) Nada se pode afirmar quanto ao de 1% e rejeitar-se-á
rej á Ho a 10%.
d) Nada se pode afirmar em ambos os casos.
e) Aceitar-se-á
á Ho a 1% e rejeitar-se-á
rejeitar Ho a 10%.

05) (FGV) Em um teste de hipóteses, a hipótese nula foi rejeitada no nível de 3%.
Portanto, a hipótese nula:
a) será aceita no nível de 1%
b) será aceita no nível de 5%
c) pode ser aceita ou rejeitada no nível de 5%
d) será rejeitada no nível de 1%
e) será rejeitada no nível de 5%

06) (FCC) Seja X uma variável aleatória representando o valor arrecadado de um


determinado atributo. Suponha que X tem distribuição normal (população
(pop de tamanho
infinito) com média µ e desvio padrão de 500 reais. Desejando-se
Desejando se testar:
Ho: µ = 1000 reais (hipótese nula)
H1: µ ≠ 1000 reais (hipótese alternativa)
Tomou-sese uma amostra aleatória de 400 valores de X, obteve
obteve-se
se para a média amostral
o valor de 1.060 reais. Seja α o nível de significância do teste e suponha que a região
de rejeição de Ho é {|Z| > Zα/2}
Z = α. Tem-se que:
nív de significância β (β>α
a) Se Ho foi rejeitada, existe um nível α) tal que Ho não seria
rejeitada.
b) Para qualquer nível de significância α,, Ho será rejeitada, uma vez que
1.060>1.000.
c) Ho não será rejeitada para Zα/2
Z < 3.
d) Ho será rejeitada para Zα/2
Z = 2.
e) Para Zα/2,
/2, Ho não será rejeitada.

07) (Esaf) Uma amostra aleatória de 9 valores de salários extraída de uma população
considerada normal e de tamanho infinito apresentou uma média igual a R$ 800,00
com um desvio padrão igual a R$ 120,00. Os registros históricos indicam que a média
127 http://www.olaamigos
olaamigos.com.br
dos salários da população é igual a R$ 740,00. Deseja-se
Deseja se testar a hipótese, ao nível de
significância α,, se o valor da média verificada na amostra difere do valor de R$ 740,00.
Seja Ho a hipótese nula do teste (µ ( = 740), H1 a hipótese alternativa (µ ( ≠ 740) e
ntil da distribuição “t” de Student, no nível de significância α para testes
tα/2>0 o quantil
bicaudais com 8 graus de liberdade. Sabendo-se
Sabendo se que Ho foi rejeitada, tem-se
tem que:
a) o valor da variável do teste (t calculado) obtido através da amostra e necessário
para comparação com -tα/2 e tα/2 é igual a 0,5.
b) Para qualquer nível de significância Ho seria rejeitada, pois (800-740)
(800 ≠ 0.
c) tα/2 > 1,5
d) tα/2 < 1,5
e) a um nível de significância β (β>α),
), Ho não teria sido rejeitada.

Tabela da Distribuição Normal – Curva Z

Área sob a curva Z, entre Z=0


128 http://www.olaamigos
olaamigos.com.br
e um Z qualquer à sua direita.
Z=0 Z

z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 00,00 00,40 00,80 01,20 01,60 01,99 02,39 02,79 03,19 03,59
0.1 03,98 04,38 04,78 05,17 05,57 05,96 06,36 06,75 07,14 07,53
0.2 07,93 08,32 08,71 09,10 09,48 09,87 10,26 10,64 11,03 11,41
0.3 11,79 12,17 12,55 12,93 13,31 13,68 14,06 14,43 14,80 15,17
0.4 15,54 15,91 16,28 16,64 17,00 17,36 17,72 18,08 18,44 18,79

0.5 19,15 19,50 19,85 20,19 20,54 20,88 21,23 21,57 21,90 22,24
0.6 22,57 22,91 23,24 23,57 23,89 24,22 24,54 24,86 25,17 25,49
0.7 25,80 26,11 26,42 26,73 27,04 27,34 27,64 27,94 28,23 28,52
0.8 28,81 29,10 29,39 29,67 29,95 30,23 30,51 30,78 31,06 31,33
0.9 31,59 31,86 32,12 32,38 32,64 32,90 33,15 33,40 33,65 33,89

1.0 34,13 34,38 34,61 34,85 35,08 35,31 35,54 35,77 35,99 36,21
1.1 36,43 36,65 36,86 37,08 37,29 37,49 37,70 37,90 38,10 38,30
1.2 38,49 38,69 38,69 39,07 39,25 39,44 39,62 39,80 39,97 40,15
1.3 40,32 40,49 40,66 40,82 40,99 41,15 41,31 41,47 41,62 41,77
1.4 41,92 42,07 42,22 42,36 42,51 42,65 42,79 42,92 43,06 43,19

1.5 43,32 43,45 43,57 43,70 43,83 43,94 44,06 44,18 44,29 44,41
1.6 44,52 44,63 44,74 44,84 44,95 45,05 45,15 45,25 45,35 45,45
1.7 45,54 45,64 45,73 45,82 45,91 45,99 46,08 46,16 46,25 46,33
1.8 46,41 46,49 46,56 46,64 46,71 46,78 46,86 46,93 46,99 46,06
1.9 47,13 47,19 47,26 47,32 47,38 47,44 47,50 47,56 47,61 47,67

2.0 47,72 47,78 47,83 47,88 47,93 47,98 48,03 48,08 48,12 48,17
2.1 48,21 48,26 48,30 48,34 48,38 48,42 48,46 48,50 48,54 48,57
2.2 48,61 48,64 48,68 48,71 48,75 48,78 48,81 48,84 48,87 48,90
2.3 48,93 48,96 48,98 49,01 49,04 49,06 49,09 49,11 49,13 49,16
2.4 49,18 49,20 49,22 49,25 49,27 49,29 49,31 49,32 49,34 49,36

2.5 49,38 49,40 49,41 49,43 49,45 49,46 49,48 49,49 49,51 49,52
2.6 49,53 49,55 49,56 49,57 49,59 49,60 49,61 49,62 49,63 49,64
2.7 49,65 49,66 49,67 49,68 49,69 49,70 49,71 49,72 49,73 49,74
2.8 49,74 49,75 49,76 49,77 49,77 49,78 49,79 49,79 49,80 49,81
2.9 49,81 49,82 49,82 49,83 49,84 49,84 49,85 49,85 49,86 49,86

3.0 49,87

4.0 49,997

Tabela da Distribuição t de Student

129 http://www.olaamigos
olaamigos.com.br
α

tα,GL

α
25% 10% 5% 2,5% 1% 0,5%
GL
1 1,0000 3,0777 6,3138 12,7062 31,8207 63,6574
2 0,8165 1,8856 2,9200 4,3027 6,9646 9,9248
3 0,7649 1,6377 2,3534 3,1824 4,5407 5,8409
4 0,7407 1,5332 2,1318 2,7764 3,7469 4,6041
5 0,7267 1,4759 2,0150 2,5706 3,3649 4,0322

6 0,7176 1,4398 1,9432 2,4469 3,1427 3,7074


7 0,7111 1,4149 1,8946 2,3646 2,9980 3,4995
8 0,7064 1,3968 1,8595 2,3060 2,8965 3,3554
9 0,7027 1,3830 1,8331 2,2622 2,8214 3,2498
10 0,6998 1,3722 1,8125 2,2281 2,7638 3,1693

11 0,6974 1,3634 1,7959 2,2010 2,7181 3,1058


12 0,6955 1,3562 1,7823 2,1788 2,6810 3,0545
13 0,6938 1,3502 1,7709 2,1604 2,6503 3,0123
14 0,6924 1,3450 1,7613 2,1448 2,6245 2,9768
15 0,6912 1,3406 1,7531 2,1315 2,6025 2,9467

16 0,6901 1,3368 1,7459 2,1199 2,5835 2,9208


17 0,6892 1,3334 1,7396 2,1098 2,5669 2,8982
18 0,6884 1,3304 1,7641 2,1009 2,5524 2,8784
19 0,6876 1,3277 1,7291 2,0930 2,5395 2,8609
20 0,6870 1,3253 1,7247 2,0860 2,5280 2,8453

21 0,6864 1,3232 1,7207 2,0796 2,5177 2,8314


22 0,6858 1,3212 1,7171 2,0739 2,5083 2,8188
23 0,6853 1,3195 1,7139 2,0687 2,4999 2,8073
24 0,6848 1,3178 1,7109 2,0639 2,4922 2,7969
25 0,6844 1,3163 1,7081 2,0595 2,4851 2,7874

26 0,6840 1,3150 1,7056 2,0555 2,4786 2,7787


27 0,6837 1,3137 1,7033 2,0518 2,4727 2,7707
28 0,6834 1,3125 1,7011 2,0484 2,4671 2,7633
29 0,6830 1,3114 1,6991 2,0452 2,4620 2,7564
30 0,6828 1,3104 1,6973 2,0423 2,4573 2,7500

40 0,6807 1,3031 1,6839 2,0211 2,4233 2,7045


50 0,6794 1,2987 1,6759 2,0086 2,4033 2,6778
60 0,6786 1,2958 1,6706 2,0003 2,3901 2,6603
70 0,6780 1,2938 1,6669 1,9944 2,3808 2,6479
80 0,6776 1,2922 1,6641 1,9901 2,3739 2,6387

90 0,6772 1,2910 1,6620 1,9867 2,3685 2,6316


100 0,677 1,290 1,660 1,984 2,364 2,626
120 0,677 1,289 1,658 1,980 2,358 2,617
∝ 0,674 1,282 1,645 1,960 2,326 2,576

Tabela da Distribuição Qui-Quadrado


Qui

130 http://www.olaamigos
olaamigos.com.br
α

χα,GL

0,995 0,99 0,975 0,95 0,90 0,75 050 0,25 0,10 0,05 0,025 0,01 0,005
α

GL
1 0,0004 0,002 0,001 0,004 0,016 0,102 0,455 1,323 2,706 3,841 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 0,575 1,386 2,773 4,605 5,991 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 0,584 1,213 2,366 4,108 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 1,923 3,357 5,385 7,779 9,488 11,143 13,277 14,860
5 0,412 0,554 0,831 1,145 1,610 2,675 4,351 6,626 9,236 11,071 12,833 15,086 16,750

6 0,676 0,872 1,237 1,635 2,204 3,455 5,348 7,841 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,690 2,167 2,833 4,255 6,346 9,037 12,017 14,067 16,013 18,475 20,278
8 1,344 1,646 2,180 2,733 3,490 5,071 7,344 10,219 13,362 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 5,899 8,343 11,389 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 6,737 9,342 12,549 15,987 18,307 20,483 23,209 25,188

11 2,603 3,053 3,816 4,575 5,578 7,584 10,341 13,701 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 8,438 11,340 14,845 18,549 21,026 23,337 26,217 28,299
13 3,565 4,107 5,009 5,892 7,042 9,299 12,340 15,984 19,812 22,362 24,736 27,688 29,819
14 4,075 4,660 5,629 6,571 7,790 10,165 13,339 17,117 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 11,036 14,339 18,245 22,307 24,996 27,488 30,578 32,801

16 5,142 5,812 6,908 7,962 9,312 11,912 15,338 19,369 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 12,792 16,338 20,489 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,390 10,865 13,675 17,338 21,605 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 14,562 18,338 22,718 27,204 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 12,443 15,452 19,337 23,828 28,412 31,410 34,170 37,566 39,997

21 8,034 8,897 10,283 11,591 13,240 16,344 20,337 24,935 29,615 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,042 17,240 21,337 26,039 30,813 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 14,848 18,137 22,337 27,141 32,007 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 19,037 23,337 28,241 33,196 36,415 39,364 42,980 45,559
25 10,520 11,524 13,120 14,611 16,473 19,939 24,337 29,339 34,382 37,652 40,646 44,314 46,928

26 11,160 12,198 13,844 15,379 17,292 20,843 25,336 30,434 35,563 38,885 41,923 45,642 48,290
27 11,808 12,879 14,573 16,151 18,114 21,749 26,336 31,528 36,741 40,113 43,194 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 22,657 27,336 32,620 37,916 41,337 44,461 48,278 50,993
29 13,12 14,257 16,047 17,708 19,768 23,567 28,336 33,711 39,087 42,557 45,722 49,588 52,336
30 13,787 14,954 16,791 18,493 20,599 24,478 29,336 34,800 40,256 43,773 46,979 50,892 53,672

31 14,458 15,655 17,539 19,281 21,434 25,390 30,336 35,887 41,422 44,985 48,232 52,191 55,003
32 15,134 16,362 18,291 20,072 22,271 26,304 31,336 36,973 42,585 46,194 49,480 53,486 56,328
33 15,815 17,074 19,047 20,867 23,110 27,219 32,336 38,058 43,745 47,400 50,725 54,776 57,648
34 16,501 17,789 19,806 21,664 23,952 28,136 33,336 39,141 44,903 48,602 51,966 56,061 58,964
35 17,192 18,509 20,569 22,465 24,797 29,054 34,336 40,223 46,059 49,802 53,203 57,342 60,275

40 20,707 22,164 24,433 26,509 29,051 33,660 39,335 45,616 51,805 55,758 59,342 63,691 66,766
50 27,991 29,707 32,357 34,764 37,689 42,942 49,335 56,334 63,167 67,505 71,420 76,154 79,490
60 35,534 37,485 40,482 43,188 46,459 52,294 59,335 66,981 74,397 79,082 83,298 88,379 91,952
70 43,275 45,442 48,758 51,739 55,329 61,698 69,335 77,577 85,527 90,531 95,023 100,425 104,215
80 51,172 53,540 57,153 60,391 64,278 71,145 79,335 88,130 96,578 101,879 106,629 112,329 116,321
90 59,196 61,754 65,647 69,126 73,291 80,625 89,335 98,650 107,565 113,145 118,136 124,116 128,299
100 67,328 70,065 74,222 77,929 82,358 90,133 99,335 109,141 118,498 124,342 129,561 135,807 140,169

131 http://www.olaamigos
olaamigos.com.br
QUESTÕES DE ESTATÍSTICA INFERENCIAL – FGV
PARTE I

01. Analise as afirmativas a seguir, a respeito da Mediana:


I. A soma dos resíduos em relação à mediana é sempre igual a zero.
II. É em relação à mediana que a soma dos valores absolutos dos resíduos é mínima.
III. É em relação à mediana que a soma dos quadrados dos resíduos é mínima.
Assinale:
a) Se somente a afirmativa II estiver correta.
b) Se somente as afirmativas
afirma I e II estiverem corretas.
c) Se somente as afirmativas I e III estiverem corretas.
d) Se somente as afirmativas II e III estiverem corretas.
e) Se todas as afirmativas estiverem corretas.

O enunciado a seguir refere--se às questões de números 02 e 03.

Uma amostra
mostra aleatória simples de tamanho 25 foi selecionada para estimar a média
desconhecida de uma população normal. A média amostral encontrada foi 4,2, e a variância
amostral foi de 1,44.

02. O intervalo de 95% de confiança para a média populacional é:


a) 4,2 ± 0,49 d) 4,2 ± 0,75
b) 4,2 ± 0,64 e) 4,2 ± 0,81
c) 4,2 ± 0,71

03. O intervalo de 95% de confiança para a variância populacional é:


a) (0,88 ; 2,79) d) (0,55 ; 3,16)
b) (0,72 ; 3,05) e) (0,44 ; 3,44)
c) (0,64 ; 3,20)

04. Se X tem distribuição normal com média 4 e variância 9, a probabilidade de X>6 vale,
aproximadamente:
a) 0,25 d) 0,37
b) 0,28 e) 0,46
c) 0,33

O enunciado a seguir refere--se


se às questões de números 05, 06 e 07.

A tabela a seguir mostra os resultados obtidos em Matemática por três turmas:

Aprovados Reprovados Total


Turma X 30 10 40
Turma Y 35 5 40
Turma Z 15 5 20
Total 80 20 100

Desejamos testar, usando o teste qui-quadrado:


qui
Ho: os seis resultados possíveis têm probabilidades iguais versus
H1: os seis resultados possíveis não têm probabilidades iguais.

05. O valor observado da estatística qui-quadrado


qui quadrado é, aproximadamente:
a) 1,16 d) 4,66
b) 2,34 e) 5,58
c) 3,44

132 http://www.olaamigos
olaamigos.com.br
06. O número de graus de liberdade é:
a) 2 d) 6
b) 3 e) 99
c) 4

07. Nos níveis de 1%, 5% e 10%, a decisão sobre H0 é:

α=1% α=5% α=10%


a) Não rejeitar Não rejeitar Não rejeitar
b) Não rejeitar Não rejeitar Rejeitar
c) Não rejeitar rejeitar Rejeitar
d) rejeitar rejeitar Não rejeitar
e) rejeitar rejeitar rejeitar

08. Uma amostra aleatória de tamanho 400 revelou que 64% dos torcedores brasileiros
acham que conquistaremos o hexacampeonato mundial de futebol. O intervalo de 95%
de confiança para a proporção de torcedores na população que acreditam no
hexacampeonato é:
a) 64% ± 3,9%
b) 64% ± 4,2%
c) 64% ± 4,7%
d) 64% ± 5,1%
e) 64% ± 5,6%

09. Analise as afirmativas a seguir, a respeito da média aritmética:


I. A soma dos resíduos em relação à média aritmética é sempre igual a zero.
II. É em relação à média aritmética que a soma dos valores absolutos dos resíduos é
mínima.
III. É em relação à média aritmética que a soma dos quadrados dos resíduos é
mínima.
Assinale:
a) Se somente a afirmativa II estiver correta.
b) Se somente as afirmativas I e II estiverem corretas.
c) Se somente as afirmativas I e III estiverem corretas.
d) Se somente as afirmativas II e III estiverem corretas.
e) Se todas as afirmativas estiverem corretas.

10. O tamanho mínimo que deve ter uma amostra aleatória simples para estimar, com 95%
de confiança e erro de 1 ponto percentual, a preferência do eleitorado por determinado
candidato é:
a) 912 d) 4800
b) 1200 e) 9604
c) 2401

133 http://www.olaamigos
olaamigos.com.br
11. A tabela apresenta uma distribuição hipotética de frequência do número de anos
trabalhados, em uma amostra de 150 aposentados.

Classe Frequência
0 – 10 20
10 – 20 30
20 – 30 50
30 – 40 60

A mediana da distribuição vale, aproximadamente:


a) 20 d) 27
b) 23,3 e) 30
c) 25

134 http://www.olaamigos
olaamigos.com.br