Você está na página 1de 186

Estatística

Estatística

1ª edição
2017
Palavras do professor
Caro(a) aluno(a), você já notou o quanto as coisas são imprevisíveis na
nossa vida? Por mais detalhistas e planejadores que tentemos ser, certas
situações acabam fugindo do nosso controle. Não são raros os relatos de
pessoas que planejam ir para a praia em determinados períodos e locais
onde a chance de chuva é pequena, mas voltam frustradas de sua viagem
porque quase não viram a cor do sol durante sua estada a beira-mar.
Situações como a relatada são típicas do mundo imprevisível e caótico em
que vivemos. Há situações que podemos afirmar de maneira precisa que
ocorrerão, mas há tantas outras cuja ocorrência pode no máximo ser pre-
vista. Por exemplo, ao ver um fruto pendurado em uma árvore, é possível
afirmar que um dia ele sairá de lá (ou cairá ou alguém o irá arrancar). No
entanto, saber qual será esse dia já é uma pergunta que não sabemos res-
ponder, apesar de às vezes conseguirmos prever (a menos que queiramos
interferir e ir arrancar o fruto da árvore hoje!).
É para ajudar a entender como funcionam essas situações aleatórias que
existe a Estatística. Fazer previsões parece coisa de vidente. No entanto,
todos nós podemos ser um pouco “videntes” se soubermos usar a Estatís-
tica e tivermos dados suficientes para analisar.
O objetivo desta disciplina é compreender o uso prático da Estatística na
análise de fenômenos reais que nos envolvem, saber calcular alguns parâ-
metros e medidas que ajudam a entender os resultados de uma pesquisa
realizada com base em um conjunto de elementos (amostra) - tais como
as medidas de posição, de dispersão e de assimetria, elaborar e analisar
tabelas e gráficos e entender os conceitos de probabilidades e alguns de
seus principais modelos.
Nosso estudo será dividido em duas partes, cada uma com quatro unida-
des. Na primeira parte estudaremos como fazer a análise exploratória de
um conjunto de dados: amostragem, distribuição de frequências, gráfi-
cos, medidas de posição, medidas de dispersão e medidas de assimetria.
Na segunda parte entenderemos os conceitos principais de probabilida-
des e conheceremos dois tipos de distribuições aleatórias. Nessa última
parte estudaremos as probabilidades e suas propriedades, as variáveis
aleatórias discretas e contínuas, o modelo binomial e o modelo normal.

3
Palavras do professor
A disciplina também oferta um grande desafio a você, apresentado em
forma de tarefas a serem cumpridas articulando teoria com a prática con-
textualizada. O primeiro desafio será organizar-se em pequenos grupos
de 3 a 4 alunos e dividir proporcionalmente as tarefas apresentadas em
cada unidade. No fórum você terá os detalhes do desafio. Acesse!
Esperamos que você percorra esse caminho do aprendizado da Estatística
com foco nos objetivos e alegria nos olhos.
Bons estudos!

4
Unidade 1
Introdução à Estatística

Para iniciar seus estudos


1
A estatística é uma ciência largamente aplicada em diversos e distintos
contextos. Seja na avaliação sobre a eficácia de um remédio, no cálculo do
crescimento populacional ou na previsão de estocagem de produtos em
supermercados, a Estatística tem sido indispensável nas análises de dados
e tomadas de decisões. Sabe-se que nem tudo no mundo é certo. A bem
da verdade, a maior parte dos fenômenos que ocorrem são aleatórios.
Em meio a esse caos, a Estatística oferece um tratamento matemático
requintado que ajuda a entender com eficiência inúmeros fenômenos
aleatórios, fazer previsões e consequentemente tomar decisões. Nesta
unidade de estudo conheceremos os aspectos básicos da Estatística e
veremos exemplos do quão útil ela pode ser na prática.

Objetivos de Aprendizagem

• Entender o que é a estatística e o método estatístico.


• Compreender a utilidade da estatística e também os abusos
cometidos com ela.
• Diferenciar a estatística dedutiva da estatística indutiva.
• Definir população e amostra.
• Entender como coletar dados corretamente.
• Diferenciar variáveis qualitativas de variáveis quantitativas.
• Informar sobre ferramentas digitais que facilitam os cálculos
estatísticos.

5
Estatística | Unidade 1 - Introdução à Estatística

1.1 A estatística e o método estatístico


A Estatística é uma ciência que buscar observar a ocorrência de fenômenos dos mais diversos tipos e, a partir
dessas observações, tirar conclusões que permitam modelar teoricamente a realidade.
No Ensino Médio, todo aluno costuma ter contato com a Física. Numa das aulas dessa disciplina, os estudantes
ouvem falar que Newton estabeleceu numa de suas leis que a força aplicada a um objeto é igual ao produto de
sua massa pela aceleração realizada. Isso é um fato certo! No entanto, Newton não conseguiria afirmar com
certeza qual é o peso de uma maçã qualquer sem o uso de uma balança. O máximo que ele pode fazer é uma
previsão desse peso. De fato, existem muitas maçãs espalhadas pelo mundo e cada uma delas tem um peso dife-
rente. O peso das maçãs é, portanto, algo aleatório, que varia de uma maçã para outra sem uma regra fixa. Isso
é um fato incerto!
Generalizando os exemplos citados no parágrafo anterior, podemos dizer que existem dois tipos de fenômenos
na natureza: os determinísticos e os aleatórios. Antes de defini-los, saiba que fenômeno é qualquer ocorrên-
cia que pode ser verificada. Para observar um fenômeno utilizam-se experimentos (ou ensaios). Os fenômenos
determinísticos são aqueles que apresentam a mesma resposta, independentemente do experimento realizado.
Por sua vez, os fenômenos aleatórios são aqueles que ora apresentam uma resposta, ora apresentam outra,
estando sujeitos ao acaso. De modo mais simples, podemos dizer que os fenômenos determinísticos são fatos
certos enquanto os fenômenos aleatórios são fatos incertos.

Fenômeno é qualquer ocorrência que pode ser verificada. Os fenômenos determinísticos


são aqueles que apresentam a mesma resposta, independentemente do experimento reali-
zado. Fenômenos aleatórios são aqueles que ora apresentam uma resposta, ora apresentam
outra, estando sujeitos ao acaso.

Por exemplo, pode-se analisar o fenômeno do nascimento de uma pessoa. Escolhendo-se pessoas ao acaso,
queremos saber quais delas nasceram da fecundação entre um óvulo e um espermatozoide. A resposta é clara
e certa: todas! Portanto, esse é um fenômeno determinístico. Independente das pessoas que sejam escolhidas
num experimento, todas elas terão nascido da fecundação entre um óvulo e um espermatozoide. Por sua vez,
escolhendo pessoas ao acaso, queremos saber qual era o peso de cada uma delas no instante do seu nascimento.
Note que cada pessoa, mesmo que não saiba a resposta, terá um peso que possivelmente é diferente do seu peso
quando você nasceu ou do peso do Barack Obama, ex-presidente dos Estados Unidos. Assim sendo, notamos
que o fenômeno que analisa o peso de recém-nascidos é um fenômeno aleatório.
Um curso de Estatística não está interessado em analisar fenômenos determinísticos. Eles podem ser deixados
para outras ciências o fazerem. No entanto, a Estatística preocupa-se com o estudo de fenômenos aleatórios.
Essa ciência tenta buscar no caos desses fenômenos algum padrão que permita entendê-los ao menos na maio-
ria das vezes.
Para analisar fenômenos aleatórios lançamos mão da probabilidade. O fenômeno de jogar uma moeda e obser-
var a face voltada para cima é aleatório, visto que ora essa face é cara, ora ela é coroa. Por mais caótico que isso
possa parecer, é possível calcular qual é a probabilidade de ocorrer cara ou coroa nesse lançamento (normal-
mente 50% para cara e 50% para coroa).

6
Estatística | Unidade 1 - Introdução à Estatística

Figura 1.1 - Lançamento de uma moeda cerimonial no início do Pro Bowl 2013

Fonte: Wikimedia Commons

No início de um jogo de futebol, um árbitro costuma lançar uma moeda para decidir qual time dará o pontapé
inicial. Esse é um típico exemplo de fenômeno aleatório em que cada time tem a mesma chance de sair vitorioso
no lançamento da moeda.
Ao analisar um fenômeno aleatório, um pesquisador usualmente deseja transformar dados de um experimento
em informações concretas que permitam uma consciente tomada de decisão. Para isso, ele pode utilizar a Esta-
tística em três momentos distintos. No primeiro, ele faz a coleta de dados, organiza-os e os sumariza - é a cha-
mada Estatística Descritiva ou Estatística Dedutiva. No segundo momento, ele utiliza da Probabilidade para obter
modelos que se adaptam às conclusões obtidas no primeiro momento. Por fim, no terceiro momento, ele faz a
análise e interpretação dos dados a fim de fazer afirmações sobre o todo a partir de uma amostra - é a Inferência
Estatística ou Estatística Indutiva. Neste curso, focaremos apenas os dois primeiros momentos: a Estatística Des-
critiva e a Probabilidade.
O método estatístico consiste numa série de passos que um pesquisador faz para obter as informações que
deseja de um determinado fenômeno aleatório:
1. Formulação clara do problema a ser tratado e definição do processo que será usado para resolvê-lo
(forma, cronograma etc.).
2. Coleta dos dados por algum meio: questionários, observações sobre registros ou documentos, experi-
mentos, material bibliográfico, entre outros.
3. Apuração dos dados, a fim de contá-los, resumi-los e separá-los em grupos.
4. Organização dos dados por meio de tabelas e/ou gráficos.
5. Análise e interpretação dos dados, por meio das quais podem ser percebidas algumas características que
ajudem a propor uma solução para o problema proposto inicialmente. Geralmente é aqui que entra a
Inferência Estatística.
Por um lado, a Estatística tem se tornado cada vez mais útil ao mundo moderno, já que a busca por informações a
partir de dados e observações têm sido cada vez mais motivada pela alta competitividade entre empresas e pelas
novas tecnologias. Não é à toa que Estatística está envolvida em diversos contextos: na economia (variações nas
bolsas de valores, cálculo de inflação etc.), nas engenharias (transmissão de mensagens por meio de canais rui-
dosos, dimensões e pesos de equipamentos, instrumentos e imóveis etc.), na medicina (verificação da eficácia
de remédios no tratamento de determinadas doenças), na biologia (genética, controle de epidemias etc.), nas

7
Estatística | Unidade 1 - Introdução à Estatística

ciências sociais (análise de comportamentos, demografia etc.), nas indústrias (controle de qualidade, tempo de
produção etc.), entre outros.
Por outro lado, muitos se utilizam de falsos argumentos estatísticos para fazer conclusões incorretas ou tendencio-
sas acerca de determinados assuntos. Por vezes em nossas vidas já devemos ter tirado conclusões que se pautavam
exclusivamente na nossa experiência pessoal, sem levar em consideração a experiência de outras pessoas. Esse
é um erro estatístico causado pelo baixo tamanho da amostra (uma única pessoa). Além disso, é comum vermos
na imprensa notícias que se utilizam de números falsos ou de resultados obtidos de amostragens viciadas para se
defender uma tese. Outros maus usos de argumentos estatísticos consistem na interferência externa de um pesqui-
sador no resultado, na desconsideração de variáveis importantes, nas perguntas mal formuladas ou tendenciosas,
na imprecisão dos números, entre outros. Portanto, é preciso realizar os procedimentos e técnicas estatísticas de
maneira correta e ética, a fim de não obter resultados falsos e incorretos para um determinado problema.

Benjamin Disraeli é autor da frase “Há três tipos de mentiras: as mentiras, as mentiras sérias
e as estatísticas” (SHIGUTI, W. A.; SHIGUTI, V.S.C. Apostila de Estatística. Disponível em:
<http://www.inf.ufsc.br/~paulo.s.borges/Download/Apostila5_INE5102_Quimica.pdf>) que
nos alerta sobre os perigos do mau uso da Estatística.

Figura 1.2 - Benjamin Disraeli, o Conde de Beaconsfield

Fonte: Wikimedia Commons

8
Estatística | Unidade 1 - Introdução à Estatística

Você já viu em algum programa de TV ou na internet alguma “enquete tendenciosa” feita aos
telespectadores ou leitores? Se sim, que efeito os formuladores da enquete queriam causar?

Enfim, podemos notar que a Estatística está envolvida nos mais diversos contextos científicos e na análise de
muitas situações cotidianas. Conscientes do potencial que as ferramentas estatísticas têm, nos motivamos a
investir no aprendizado dessas técnicas. Afinal, como o uso de Estatística na nossa vida também é um fenômeno
aleatório, nunca sabemos quando precisaremos dela! (Apesar de podermos opinar que a chance é grande, visto
que esta disciplina está na sua grade curricular).

1.2 População e amostra


Você já deve ter percebido que a cada dez anos no Brasil é realizado o censo demográfico. O objetivo desse
recenseamento é obter informações sobre todos os brasileiros, tais como sexo, idade, profissão, entre outros. No
entanto, há uma diferença formal entre o conceito de censo e o de Estatística. Enquanto a Estatística utiliza-se de
amostras “pequenas” de uma população para obter informações, o censo deve coletá-las observando todos os
elementos da população. Por exemplo, imagine que o reitor de uma faculdade queira saber qual é o número de
alunos dessa faculdade que têm olhos verdes. Uma maneira de ele fazer isso seria conferir com todos os alunos
da faculdade qual a cor de seus olhos - a isso se chama censo. Outra maneira seria escolher aleatoriamente um
grupo menor de alunos, conferir qual a cor de seus olhos e depois deduzir quantos alunos de sua faculdade têm
olhos verdes a partir dos dados obtidos utilizando a Estatística. Apesar do resultado obtido pela Estatística não ser
tão preciso como o do censo, ela é preferida na maioria das vezes porque custa menos para ser realizada, é mais
rápida e possui um erro que pode ser controlado.
Há situações em que é inviável realizar censo. Por exemplo, se quiséssemos descobrir qual é a durabilidade média
das pilhas e testássemos todas até acabarem, não restaria pilha para usar. Assim, fica evidente que a melhor
solução para descobrir a durabilidade média das pilhas é selecionar um conjunto aleatório delas e recorrer à
Estatística. Ao invés de se verificar todas as situações possíveis, se verifica apenas algumas delas. Isso nos leva a
definir dois conceitos importantes em Estatística: o de população e o de amostra.

9
Estatística | Unidade 1 - Introdução à Estatística

Figura 1.3 - População e amostra

Amostra População

Fonte: Elaboração própria, realizada no software GeoGebra.

Numa comparação com a teoria de conjuntos, o diagrama acima (conhecido como diagrama de Venn) tem
representado um retângulo, que corresponde à população de um determinado experimento, e um círculo, que
corresponde a uma amostra dessa população.
Apesar do conceito de população ser costumeiramente utilizado para designar o número de pessoas em um
determinado local, a Estatística trabalha com uma definição mais geral dele. Chama-se de população ou uni-
verso estatístico o conjunto de todos os elementos que podem ser observados num certo experimento. Por sua
vez, qualquer subconjunto que pode ser extraído de uma população é chamado de amostra.
Por exemplo, considere uma situação em que um guarda de trânsito deseja saber quantos motoristas de uma cidade
carregam o documento de seu carro consigo ao dirigir. Nesse experimento, a população é o conjunto de todos
os motoristas daquela cidade. Para tentar estimar esse número de motoristas portando documento, esse guarda
decide parar todos os motoristas que passarem em frente à sua delegacia e conferir se eles estão com seu docu-
mento. Nessa situação, os motoristas que passarem em frente à delegacia constituirão uma amostra da população.
Imagine outro exemplo, em que o dono de uma fábrica de parafusos deseje saber quantos dos parafusos pro-
duzidos numa semana são defeituosos. Se essa fábrica produzir 10 mil parafusos nessa semana, todos esses
parafusos constituem a população do experimento descrito. Para facilitar a verificação, o dono da fábrica pode
mandar recolher alguns lotes com 200 parafusos e verificar quantos deles são defeituosos. Cada um desses lotes
representa uma amostra da população.
Consideremos agora o exemplo de uma loja de roupas que tenha 500 camisetas em seu estoque. O dono da loja
gostaria de saber quantas dessas camisetas são do tamanho P. Ao invés de verificar todas, ele pede que um de
seus vendedores retire do estoque um conjunto aleatório contendo 20 camisetas para, a partir delas, fazer uma
previsão sobre a quantidade de camisetas P existentes no estoque. Nesse exemplo, as 500 camisetas constituem
a população, enquanto as 20 camisetas selecionadas aleatoriamente formam uma amostra.
Utilizando argumentos da teoria dos conjuntos, que você deve ter estudado no início de seu Ensino Médio, pode-
mos afirmar que de uma população finita com n elementos é possível obter 2n amostras distintas.

10
Estatística | Unidade 1 - Introdução à Estatística

Considere a seguinte situação. Um vendedor deseja saber quantos de seus clientes são
mulheres. Qual é a população desse experimento? Pense em três exemplos de amostras que
podem ser retiradas dessa população.

Para realizar uma análise sem grandes distorções de um determinado fenômeno aleatório deve-se extrair uma
amostra da população que contenha essencialmente as mesmas características desse universo estatístico. Isso
exige certa cautela e bom planejamento para realizar a seleção da amostra. Em geral, recomenda-se que essa
amostra seja feita aleatoriamente.
Quando se deseja analisar a quantidade de hemácias no sangue de uma pessoa, um coletor costuma retirar
uma amostra de sangue do braço dela. A partir dessa amostra é possível afirmar com precisão qual é quantidade
de hemácias em todo o sangue dessa pessoa, já que o sangue se distribui uniformemente no corpo humano.
Portanto, esse processo de amostragem é fiel e não distorce as informações devido ao tipo de distribuição das
hemácias no sangue, mesmo que não seja uma amostra obtida aleatoriamente.

Figura 1.4 - Coleta de sangue

Fonte: Wikimedia Commons

A coleta de sangue em seres humanos é geralmente realizada no braço e pode e é representativa da caracterís-
tica do sangue em qualquer parte do corpo, já que a composição do sangue é distribuída uniformemente nele.
Agora, imagine que um prefeito deseje saber qual é a renda per capita média de um morador de sua cidade. Para
isso é preciso obter uma amostra aleatória dessa população. De fato, se o prefeito optar por realizar o processo de
amostragem majoritariamente em bairros nobres, ele possivelmente obterá resultados tendenciosos, indicando
que a renda per capita média dos habitantes de seu município é bem maior que a da realidade. Situações como
essa contêm viés de seleção, imprimindo resultados que não conferem com a realidade. Por isso, a má seleção
das amostras constitui um dos abusos cometidos em nome da Estatística.
Para evitar os erros no momento da seleção da amostra, existem alguns processos de amostragem que podem
ser aplicados pelo pesquisador. A seguir citamos alguns deles:

11
Estatística | Unidade 1 - Introdução à Estatística

• Amostragem aleatória simples (AAS): nesse processo o pesquisador enumera todos os elementos da
população e posteriormente realiza um sorteio com reposição sucessivamente até obter o número
de elementos desejados para a amostra. Esse procedimento é randômico, geralmente fácil de utilizar e
garante que todos os elementos da população tenham mesma probabilidade de serem selecionados. Por
exemplo, se um professor deseja fazer uma pesquisa com todos os alunos de uma sala que contém 50
integrantes e prefere retirar uma amostra com 5 deles, ele pode aplicar ASS enumerando todos os alunos
com números de 1 a 50 e realizando o sorteio.

Glossário

Sorteio com reposição é aquele em que após o sorteio de um item entre todos os disponíveis,
esse item continua disponível para seleção novamente. Por exemplo, se numa caixa existem
três bolas de cores diferentes e se deseja retirar duas delas, é permitido num sorteio com
reposição que uma bola de mesma cor seja sorteada duas vezes.

• Amostragem sistemática (AS): se uma população já está ordenada (como num catálogo, por exem-
plo), o investigador pode realizar a amostragem sistemática da seguinte forma: define N como sendo o
número total de elementos da população e n como sendo o número de elementos que ele deseja sele-

cionar na amostra; depois, calcula a razão N/n; posteriormente ele sorteia um número s entre 1 e N/n; por

fim, ele forma sua amostra com os elementos numerados por s, s + N , s + 2N , S + 3N ,... Por exemplo,
n n n
se o professor citado no item anterior deseja realizar uma amostragem sistemática naquela sala de aula,
ele pode utilizar os números que cada aluno tem na lista de chamadas. O procedimento consiste em ele

determinar a razão N = 50 = 10 , sortear um número x entre 1 e 10 (digamos que ) e selecionar a


n 5
amostra com os alunos de número x, x + 10, x + 20, x + 30, x + 40 (com x = 7, a amostra é formada pelos

alunos de número 7, 17, 27, 37 e 47).


• Amostragem estratificada (AE): se uma população não for homogênea, o investigador pode optar pelo
tipo de amostragem estratificada. Nesse caso, ele divide a população com N elementos em m grupos
cujos elementos possuam características similares, cada um com ni elementos (i = 1, 2, ..., m ). Note que
N = n1 + n2 + ... + nm. Cada um desses grupos é chamado estrato da população. Posteriormente, após a
definição dos estratos, o investigador seleciona randomicamente um conjunto de cada estrato para for-
mar a amostra. Geralmente, esse conjunto possui um número de elementos proporcional ao número de
elementos do seu estrato em relação ao total de elementos da população. Por exemplo, se um prefeito
deseja saber a renda per capita média dos 100 mil moradores de uma cidade que contém 10 bairros,
sendo 3 deles considerados bairros ricos e 7 considerados pobres, ele pode definir dois estratos: morado-
res de bairros ricos e moradores de bairros pobres. Se ele deseja retirar uma amostra com 100 moradores,
pode optar pela amostra estratificada selecionando aleatoriamente 30 moradores do estrato composto
pelos moradores dos bairros ricos e 70 do estrato composto pelos moradores dos bairros pobres. Note
que essa estratificação seria mais “justa” se o número de moradores em cada bairro da cidade fosse pra-
ticamente o mesmo (de aproximadamente 10 mil moradores).

12
Estatística | Unidade 1 - Introdução à Estatística

1.3 Tipos de variáveis


Os fenômenos aleatórios possuem realizações das mais diversas naturezas. Enquanto o fenômeno das alturas
das pessoas recebe como resposta um número real, o fenômeno sexo das pessoas recebe como resposta umas
das opções masculino ou feminino. Cada um desses fenômenos pode ser considerado uma variável e suas
observações ou respostas são os valores que essa variável pode assumir.
Dizemos que uma variável é quantitativa quando seus valores são números. Por sua vez, dizemos que uma vari-
ável é qualitativa quando seus valores são qualidades ou atributos não numéricos. São exemplos de variáveis
quantitativas: o número de cabelos na cabeça de uma pessoa, a distância percorrida por um carro, a altura de
voo de um avião, o salário de um funcionário, entre outros. São exemplos de variáveis qualitativas: a cor do cabelo
de uma pessoa, a marca de um carro, o país de fabricação de um avião, o nome de um funcionário, entre outros.
A seguir, vamos construir um exemplo fictício de uma exposição de cachorros que servirá para nosso estudo
sobre tipos de variáveis.
Exemplo 1.1: Numa cidade mineira foi realizada uma exposição de cachorros que contava com mais de 200 desses ani-
mais. A fim de analisar algumas características dos cachorros à mostra, um visitante da exposição selecionou aleatoria-
mente 20 deles e elaborou a seguinte tabela contendo as informações obtidas sobre alguns aspectos desses animais:

Tabela 1.1 - Características de alguns cachorros de uma exposição

Nome do Raça Idade Cor Altura Peso Intensidade do latido Habilidade


cachorro (anos) (cm) (kg)
Andy Poodle 2 Azul 25 7,0 Agudo Doméstico
Babalu Maltês 3 Branco 21 3,4 Agudo Doméstico
Blue Pitbull 5 Preto 51 29,0 Grave Caça
Bolt Maltês 1 Branco 21 3,2 Agudo Doméstico
Flufy Shih-tzu 1 Preto 20 4,5 Agudo Doméstico
Kiara Buldogue 2 Branco 39 20,0 Grave Proteção
Kitty Poodle 1 Branco 28 6,5 Agudo Doméstico
Lala Shih-tzu 2 Marrom 27 5,7 Agudo Doméstico
Lassie Pitbull 2 Marrom 49 23,0 Grave Proteção
Lica Maltês 1 Branco 23 3,1 Agudo Doméstico
Meg Buldogue 1 Marrom 32 23,0 Grave Proteção
Nina Shih-tzu 1 Preto 20 4,1 Agudo Doméstico
Rex Maltês 2 Branco 22 3,6 Agudo Doméstico
Sam Maltês 2 Branco 22 3,5 Agudo Doméstico
Scooby Buldogue 3 Marrom 47 25,0 Grave Caça
Tino Poodle 4 Marrom 37 7,2 Agudo Doméstico
Tintin Pitbull 1 Marrom 47 19,0 Grave Caça
Totó Shih-tzu 2 Branco 26 5,7 Agudo Doméstico
Tuta Shih-tzu 1 Marrom 21 4,5 Agudo Doméstico
Xuxa Maltês 3 Branco 21 3,9 Agudo Doméstico
Legenda: Nome, espécie, idade, cor, altura, peso, intensidade da voz e habilidade dos cachor-
ros presentes na amostra selecionada pelo visitante da exposição.
Fonte: Elaboração própria (2017).
13
Estatística | Unidade 1 - Introdução à Estatística

Nesse exemplo da exposição de cachorros podemos classificar as variáveis nome, espécie, cor, intensidade do latido
e habilidade como variáveis qualitativas. Por sua vez, as variáveis idade, altura e peso são variáveis quantitativas.
Uma variável qualitativa pode ainda ser classificada como nominal ou ordinária. Uma variável qualitativa nomi-
nal é aquela cujos atributos não costumam ser ordenados. Por sua vez, uma variável qualitativa ordinal é aquela
cujos atributos podem ser ordenados segundo algum critério. No exemplo 1.1 (da exposição de cachorros), as
variáveis qualitativas espécie, cor e habilidade são nominais, enquanto as variáveis nome e intensidade do latido
são ordinais, já que agudo é uma intensidade abaixo de grave e os nomes podem ser postos na ordem alfabética.
Por sua vez, as variáveis quantitativas podem ser classificadas como discretas ou contínuas. A variável quantita-
tiva discreta é aquela que apresenta uma quantidade finita de valores ou uma quantidade infinita enumerável
(geralmente números inteiros). A variável quantitativa contínua é aquela que apresenta uma quantidade não
enumerável de valores, geralmente dentro de um intervalo real. No exemplo 1.1, da exposição de cachorros,
podemos classificar a variável idade como discreta, pois ela assume valores 0, 1, 2, 3…, referente ao número de
anos já vividos por cada cachorro. As variáveis altura e peso são contínuas, pois elas podem assumir qualquer
valor real, mesmo que usualmente utilizemos aproximações desses valores. Por exemplo, segundo a tabela 1.1 o
cachorro Rex tem 22 cm de altura. Possivelmente esse valor foi arredondado, já que sua altura real poderia ser até
mesmo um número irracional próximo de 22, tal como 21,967725...

Quadro 1.1 - Tipos de variáveis

Nominal
Qualitativa
Ordinal
Variável
Discreta
Quantitativa

Contínua

Legenda: Quadro-resumo sobre a classificação das variáveis.


Fonte: Elaboração própria (2017).

Adotando as classificações do quadro 1.1, como você classificaria as variáveis sexo de uma
pessoa, estado civil, tamanho de uma camiseta, país de nascimento, altura de um prédio,
grau de escolaridade e preço do arroz em um supermercado?

14
Estatística | Unidade 1 - Introdução à Estatística

Exemplo 1.2: Considere a tabela 1.2, que possui informações sobre um conjunto de cidades brasileiras.

Tabela 1.2 - Informações sobre algumas cidades brasileiras

Mês de
Cidade População Área (km²) Altitude (m) Estado
aniversário
Belo Horizonte 2.513.451 330,95 852 Dezembro MG
Brasília 2.977.216 5.801,94 1.171 Abril DF
Campinas 1.164.098 797,6 685 Julho SP
Diamantina 47.647 3.869,83 1.280 Março MG
Maringá 403.063 487,93 515 Maio PR
Natal 877.662 167,26 30 Dezembro RN
Rio de Janeiro 6.498.837 1.197,46 2 Março RJ
São Paulo 12.038.175 1.522,99 760 Janeiro SP
Legenda: Informações sobre a população, área, altitude, mês de aniversário e estado de algumas cidades brasileiras.
Fonte: Elaboração própria (2017), com dados do portal Wikipedia.

A tabela 1.2 apresenta algumas características de oito cidades brasileiras. A variável população é classificada
como quantitativa discreta, pois o número de habitantes de uma cidade é sempre um número inteiro positivo.
A variável área é classificada como quantitativa contínua, já que a área de uma cidade geralmente é um número
real não necessariamente racional, apesar das aproximações que são feitas. A variável altitude também é con-
siderada uma variável quantitativa contínua, pois medidas de comprimento sempre assumem valores reais não
necessariamente racionais, apesar das aproximações apresentadas na tabela. A variável mês de aniversário é
qualitativa ordinal, pois recebe valores não numéricos que, no entanto, podem ser ordenados de acordo com os
12 meses do ano (janeiro, fevereiro...). Por fim, a variável estado é qualitativa nominal, já que seus valores são não
numéricos e não costumam ter uma ordem natural (a menos que alguém prefira pô-los em ordem alfabética).
Exemplo 1.3: O técnico do time de futebol Laranjeiras FC pediu uma tabela com alguns dados dos 16 jogado-
res de seu elenco contendo informações pessoais de cada um e o número de gols que cada um deles fez numa
determinada temporada. A tabela fornecida ao técnico foi a seguinte:

15
Estatística | Unidade 1 - Introdução à Estatística

Tabela 1.3 - Características dos jogadores de futebol do Laranjeiras FC

Número da Idade (em Altura Massa


Jogador Posição Gols feitos
camiseta anos) (em cm) (em kg)
Arnaldinho 8 Meia 32 170 72 8
Bruno 12 Goleiro 27 188 76 0
Caio 11 Atacante 28 181 77 13
Fabinho 15 Meia 17 173 71 0
Hallison 13 Lateral 23 163 65 0
Lelê 10 Atacante 30 165 70 10
Nino 6 Lateral 21 170 71 3
Pedrão 4 Zagueiro 33 185 83 1
Pipo 7 Meia 26 172 73 5
Rogério 5 Meia 21 183 82 1
Rony 9 Atacante 31 170 72 17
Tiago 14 Zagueiro 25 177 73 1
Tião 1 Goleiro 38 195 81 0
Tiburcio 16 Atacante 20 174 73 3
Ulisses 3 Zagueiro 18 180 79 2
Yuri 2 Lateral 29 177 80 1
Legenda: Informações sobre número de camiseta, posição, idade, massa, altura
e número de gols feitos pelos 16 jogadores do Laranjeiras FC.
Fonte: Elaboração própria (2017).

As variáveis da tabela 1.3 analisadas pelo técnico do Laranjeiras FC podem ser classificadas da seguinte forma: a
posição dos jogadores é a única variável qualitativa nessa tabela, sendo subclassificada como nominal; o número
de camisetas, a idade e o número de gols feitos pelos jogadores são variáveis quantitativas discretas, pois são
dados por números inteiros positivos; a altura e a massa de cada jogador são variáveis quantitativas contínuas,
pois são números reais, mesmo que sejam apresentados com valores aproximados na tabela.

No exemplo 1.2 poderíamos ter considerado ainda outras tantas variáveis na análise das
cidades do quadro: número de escolas na cidade, partido do prefeito, número de distritos,
densidade, IDH, PIB per capita, clima predominante, ano de fundação, entre outras. Como
você classificaria cada uma dessas variáveis entre os quatro tipos expostos no quadro 1.1?

16
Estatística | Unidade 1 - Introdução à Estatística

1.4 Adendo: ferramentas digitais no tratamento estatístico


Nas próximas unidades dos nossos estudos, por vezes precisaremos fazer cálculos, aplicar fórmulas, esboçar grá-
ficos e obter valores numéricos complicados de fazer à mão. Nessas tarefas, o auxílio das ferramentas digitais é
sempre bem-vindo.
Se você possui uma calculadora científica, ela pode ser sua grande parceira na realização dos cálculos estatísticos,
já que ela dispõe de uma série de recursos programados para esses fins. A calculadora usual auxilia na realização
das operações básicas, mas deixa o usuário na mão quando ele precisa de recursos um pouco mais avançados.
Se você possui uma calculadora científica, você pode deixá-la do seu lado enquanto estuda e pode aproveitá-la
para a realização dos cálculos que forem sendo sugeridos ao longo das unidades de estudo.

Figura 1.5 - Calculadora científica

Legenda: A calculadora científica oferece muitos recursos para cálculos estatísticos.

Fonte: Wikimedia Commons

Aqueles que não têm uma calculadora científica ou mesmo aqueles que preferem o uso do computador podem
utilizar softwares estatísticos. Os softwares mais conhecidos são o Minitab e o S-Plus, mas eles são pagos. Um
bom software estatístico gratuito é o R, que você pode baixar no seu computador e aprender a usar para suas
necessidades estatísticas ao longo desse curso ou posteriormente.
Além dos softwares utilizados acima, você também pode utilizar o Microsoft Office Excel caso o tenha instalado
em seu computador. Conforme Levine (2008) esse software também possui importantes funções estatísticas dis-
poníveis que podem nos auxiliar em várias tarefas.

Agora que você já tem uma boa base inicial do que é Estatística, acesse o fórum e inicie suas
tarefas do desafio. Organize-se em grupo e comece suas pesquisas.

17
Estatística | Unidade 1 - Introdução à Estatística

Por fim, encerramos essa seção recomendando que você tenha disponível algum dos recursos comentados acima
(e aprenda a usá-lo), a fim de poder usá-los para facilitar eventuais cálculos dispendiosos que venham a surgir
neste curso ou em seu trabalho cotidiano que envolva Estatística.

Para saber mais sobre o software R e baixá-lo em seu computador consulte o portal (R-PRO-
JECT) - em inglês. Para aprender a trabalhar com o R, você pode ler o seguinte tutorial dis-
ponível na internet em português. Acesse: R-PROJECT <https://www.r-project.org/>; LAN-
DEIRO <https://cran.r-project.org/doc/contrib/Landeiro-Introducao.pdf>

18
Considerações finais
Nesta unidade buscamos entender a importância da Estatística no mundo
atual e apresentamos definições básicas dessa ciência. Buscamos entender:
• A diferença entre os fenômenos determinísticos e aleatórios.
• A aplicação da Estatística ao mundo real a partir da coleta de
dados e do tratamento de informações.
• Os passos do método estatístico.
• A utilidade da Estatística no mundo moderno aplicada aos mais
diversos contextos.
• O mau uso ou uso tendencioso da Estatística para corroborar
teses interesseiras.
• A definição de população ou universo estatístico e a definição de
amostra.
• A importância da realização do processo de amostragem de
maneira independente e livre de vícios.
• Três diferentes procedimentos de amostragem: AAS, AS e AE.
• A definição de variável em um fenômeno aleatório.
• A classificação das variáveis aleatórias como qualitativas nominais
ou ordinais ou como quantitativas discretas ou contínuas.
• Os benefícios e possibilidades do uso das ferramentas digitais
para fins estatísticos.

19
Referências bibliográficas
LANDEIRO, Victor Lemes. Introdução ao uso do programa R. Manaus:
Instituto Nacional de Pesquisas da Amazônia, 4 mar. 2011. Disponível
em: <https://cran.r-project.org/doc/contrib/Landeiro-Introducao.pdf>.
Acesso em: 2017.

LEVINE, David M. Estatística: teoria e aplicações: usando Microsoft Excel


em português. 5. ed. Rio de Janeiro: LTC Ed., 2008. 752 p.

SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de Estatística. Disponível em:


<http://www.inf.ufsc.br/~paulo.s.borges/Download/Apostila5_INE5102_
Quimica.pdf>. Acesso em: 2017.

20
Unidade de estudo 2
Análise exploratória de dados

Para iniciar seus estudos


Caro estudante, esperamos que você tenha entendido na unidade ante-
rior a importância que a Estatística tem no mundo atual. Cientes disso,
2
podemos progredir nos nossos estudos. Nesta unidade, aprenderemos a
contar a frequência dos valores observados pelas variáveis aleatórias em
uma amostra. Veremos também que os gráficos e o dispositivo de ramo-
-e-folhas são grandes auxiliadores quando se busca obter informações
a partir de um conjunto de dados qualquer. Portanto, saímos do campo
mais subjetivo, que norteou nossos estudos na primeira unidade, para
entrar num campo mais pragmático. Esperamos que você possa saborear
esses novos conhecimentos!

Objetivos de Aprendizagem

• Estudar a distribuição de frequências de uma variável.


• Analisar e elaborar gráficos de setores, de barras, de dispersão e
histogramas.
• Apresentar o dispositivo de ramo-e-folhas.

Tópicos de estudo
1) Distribuição de frequências
2) Gráficos
3) Ramo-e-folhas

22
Estatística | Unidade de estudo 2 – Análise exploratória de dados

2.1 Distribuição de frequências


A partir desta seção, nos dedicamos a interpretar os dados de uma amostra com relação a uma variável. Quere-
mos, na prática, saber como os valores de uma variável se distribuem numa amostra, a fim de tirar conclusões
sobre essa variável para a população.
Uma das formas de analisar como os valores de uma variável aleatória se distribuem é por meio da contagem
de frequência. Tal valor nos dá a proporção dos resultados e nos ajudam a entender, por exemplo, quais valores
ocorrem mais ou menos numa variável.
Iniciemos resgatando um dos exemplos que fizemos na Unidade 1, que se referia a uma exposição de cachor-
ros. Naquela situação, havia numa cidade mineira uma exposição com mais de 200 cachorros. Uma amostra
contendo 20 deles foi obtida aleatoriamente e as ocorrências de algumas variáveis foram observadas. A seguir,
resgatamos a tabela apresentada na primeira unidade contendo esses valores:

Tabela 2.1 - Características de alguns cachorros de uma exposição

Nome do Raça Idade Cor Altura Peso Intensidade Habilidade


cachorro (anos) (cm) (kg) do latido

Andy Poodle 2 Azul 25 7,0 Agudo Doméstico

Babalu Maltês 3 Branco 21 3,4 Agudo Doméstico

Blue Pitbull 5 Preto 51 29,0 Grave Caça

Bolt Maltês 1 Branco 21 3,2 Agudo Doméstico

Flufy Shih-tzu 1 Preto 20 4,5 Agudo Doméstico

Kiara Buldogue 2 Branco 39 20,0 Grave Proteção

Kitty Poodle 1 Branco 28 6,5 Agudo Doméstico

Lala Shih-tzu 2 Marrom 27 5,7 Agudo Doméstico

Lassie Pitbull 2 Marrom 49 23,0 Grave Proteção

Lica Maltês 1 Branco 23 3,1 Agudo Doméstico

Meg Buldogue 1 Marrom 32 23,0 Grave Proteção

Nina Shih-tzu 1 Preto 20 4,1 Agudo Doméstico

Rex Maltês 2 Branco 22 3,6 Agudo Doméstico

Sam Maltês 2 Branco 22 3,5 Agudo Doméstico

Scooby Buldogue 3 Marrom 47 25,0 Grave Caça

Tino Poodle 4 Marrom 37 7,2 Agudo Doméstico

23
Estatística | Unidade de estudo 2 – Análise exploratória de dados

Tintin Pitbull 1 Marrom 47 19,0 Grave Caça

Totó Shih-tzu 2 Branco 26 5,7 Agudo Doméstico

Tuta Shih-tzu 1 Marrom 21 4,5 Agudo Doméstico

Xuxa Maltês 3 Branco 21 3,9 Agudo Doméstico

Legenda: Essa tabela foi apresentada na Unidade 1.


Fonte: Elaboração própria.

O número de ocorrências de um determinado valor assumido por uma variável qualitativa ou por uma
variável quantitativa discreta é chamado de frequência absoluta desse valor. Por sua vez, se é o número de
elementos da amostra, a razão chamada de frequência relativa (ou apenas frequência, ou proporção)
daquele determinado valor.
Para exemplificar e esclarecer essas definições, considere os valores obtidos pela variável qualitativa “raça” na
tabela 2.1. Essa variável assumiu 5 valores distintos. A frequência absoluta de cada um deles é o número de
ocorrências na amostra. Por exemplo, a frequência absoluta do valor “Poodle” é , enquanto a fre-
quência absoluta do valor “Shih-Tzu” é . Por sua vez, a frequência relativa de cada um desses valores
é definida como sendo a razão da frequência relativa pelo número 20, que é o total de elementos amostrados.
Assim, a frequência relativa de Poodles na amostra é dada por a frequência relativa de Shih-
-Tzus é dada por Essas frequências foram dadas na forma de fração. Dependendo do
contexto, pode ser preferível que tais valores sejam dados na forma decimal ou em porcentagem. Por exemplo,

e A tabela a seguir apresenta a frequência absoluta e a


frequência relativa de todos os 6 valores observados para a variável “raça”, à qual chamamos de tabela de distri-
buição de frequências.

Tabela 2.2 - Distribuição de frequências da variável “raça”

Raça Frequência Frequência Frequência relativa Frequência relativa


absoluta relativa (decimal) (porcentagem)

Poodle 3 3/20 0,15 15%

Maltês 6 6/20=3/10 0,3 30%

Pitbull 3 3/20 0,15 15%

Shih-tzu 5 5/20=1/4 0,25 25%

Buldogue 3 3/20 0,15 15%

Total 20 1 1 100%

Legenda: Frequências dos valores assumidos pela variável raça na tabela 2.1.
Fonte: Elaboração própria.

24
Estatística | Unidade de estudo 2 – Análise exploratória de dados

Numa tabela de distribuição de frequência, como a tabela 2.2, costuma-se informar, na última linha, o total dos
elementos em cada coluna. Note que o total da frequência absoluta deve coincidir com o número de elementos
amostrados e o total da frequência relativa deve ser igual a 1 (ou 100%, se a frequência for dada em porcenta-
gem).
Outro item que pode ser considerado na tabela de distribuição de frequências de uma variável é a frequência
acumulada. A frequência acumulada de um determinado valor, utilizada quando os valores assumidos pela vari-
ável estão ordenados, consiste na soma de todos os valores anteriores até o referido valor. Por sua vez, frequência
relativa acumulada consiste na fração que cada frequência acumulada representa do todo. No exemplo ante-
rior, supondo que a variável “raça” seja ordenada conforme na tabela 2.2, a frequência acumulada de Maltês é a
soma das frequências absolutas de Poodle e Maltês, isto é, 3+6=9, enquanto a frequência relativa acumulada é
9/20=45%. A tabela completa da distribuição de frequências da variável “Raça” contendo a frequência acumu-
lada está presente abaixo:

Tabela 2.3 - Distribuição de frequências da variável “raça”

Raça Frequência Frequência relativa Frequência Frequência relativa


absoluta (porcentagem) acumulada acumulada

Poodle 3 15% 3 15%

Maltês 6 30% 9 45%

Pitbull 3 15% 12 60%

Shih-tzu 5 25% 17 85%

Buldogue 3 15% 20 100%

Legenda: Frequências dos valores assumidos pela variável raça na tabela 2.1.
Fonte: Elaboração própria.

Considere agora a variável qualitativa “Cor” na tabela 2.1, que no exemplo da exposição de animais assume os
valores azul, branco, preto e marrom. A distribuição de frequência dessa variável está disponível na tabela a seguir:

25
Estatística | Unidade de estudo 2 – Análise exploratória de dados

Tabela 2.4 - Distribuição de frequências da variável “cor”

Cor Frequência Frequência Frequência Frequência relativa


absoluta relativa acumulada acumulada
(porcentagem)

Azul 1 5% 1 5%

Branco 9 45% 10 50%

Preto 3 15% 13 65%

Marrom 7 35% 20 100%

Total 20 100% - -

Legenda: Frequências dos valores assumidos pela variável raça na tabela 2.1.
Fonte: Elaboração própria.

Na tabela 2.1, a variável “intensidade de latido” assume apenas dois valores: agudo e grave. A distribuição da
proporção entre esses valores é dada na tabela seguinte:

Tabela 2.5 - Distribuição de frequências da variável “intensidade de latido”

Intensidade Frequência Frequência Frequência Frequência relativa


de latido absoluta relativa acumulada acumulada

Agudo 14 14/20=70% 14 70%

Grave 6 6/20=30% 20 100%

Total 20 1=100% - -

Legenda: Frequências dos valores assumidos pela variável intensidade de latido na tabela 2.1.
Fonte: Elaboração própria.

Como ficaria a distribuição de frequências da variável “Habilidade” no exemplo da tabela


2.1? Tente fazer você mesmo!

26
Estatística | Unidade de estudo 2 – Análise exploratória de dados

Com base na distribuição de proporção de uma variável em uma amostra, é possível deduzir qual seria a distribui-
ção de proporção em toda a população, mesmo que nisso ocorra um erro. O objetivo da estatística, obviamente,
é que esse erro seja controlado e minimizado. Por isso a escolha da amostra deve ser aleatória.
Por exemplo, utilizando “regra de três”, é possível prever que 140 cães dos cachorros presentes na exposição, do
exemplo apresentado aqui, têm intensidade de latido aguda, já que há 200 cachorros ao todo na exposição e já
que, segundo a tabela 2.4, 70% dos cachorros da amostra analisada na tabela 2.1 têm esse tipo de característica.
Na prática, os organizadores do evento poderiam saber previamente que havia 143 cachorros com latido agudo.
Essa diferença 143-140=3 é o erro ocorrido na previsão. Como estatística está pautada em fenômenos aleató-
rios, erros sempre devem ser esperados.
Agora, vamos analisar a variável quantitativa discreta “idade” no exemplo da tabela 2.1. Da mesma forma como
fizemos para as variáveis qualitativas, podemos fazer a tabela de distribuição de frequências dos valores assumi-
dos por essa variável:

Tabela 2.6 - Distribuição de frequências da variável “Idade”

Idade Frequência Frequência Frequência Frequência relativa


absoluta relativa acumulada (porcentagem)

1 8 8/20=40% 8 40%

2 7 7/20=35% 15 75%

3 3 3/20=15% 18 90%

4 1 1/20=5% 19 95%

5 1 1/20=5% 20 100%

Total 20 1=100% - -

Legenda: Frequências dos valores assumidos pela variável idade na tabela 2.1.
Fonte: Elaboração própria.

Também é possível fazer uma tabela de distribuição de frequências para uma variável quantitativa contínua. No
entanto, como uma variável quantitativa contínua pode assumir uma quantidade não enumerável de valores,
fica inviável fazer uma tabela de distribuição com todos os valores assumidos por essa variável. Note, por exemplo,
na tabela 2.1, que a variável “Peso” assume 18 valores distintos (apenas os valores 4,5 e 23,0 se repetem). Por isso,
se fizéssemos uma tabela de distribuição desses valores, não conseguiríamos concluir nada da observação dos
dados.
Para solucionar o problema exposto no parágrafo anterior e conseguir construir uma tabela de distribuição de
frequências de uma variável quantitativa contínua, inicialmente devemos determinar faixas de valores que essa
variável pode assumir.
Vejamos, por exemplo, como construir a tabela de distribuição de frequências da variável “Peso” no exemplo da
tabela 2.1. Inicialmente, notamos que o menor valor assumido por essa variável é 3,1 e que o maior valor é 29.
Vamos fazer cinco classes para essa distribuição (esse número pode ser adaptado em cada contexto), ou seja,

27
Estatística | Unidade de estudo 2 – Análise exploratória de dados

cinco intervalos disjuntos que, quando unidos, contêm o intervalo real [3,1; 29]. Como a diferença entre o maior
valor assumido e o menor valor é 25,9, podemos considerar cada classe (intervalo) com tamanho de aproximada-
mente 5,2. Por exemplo, poderíamos considerar as classes [3,1; 8,3[, [8,3; 13,5[, [13,5; 18,7[, [18,7; 23,9[ e [23,9,
30[. Note que os intervalos considerados são da forma [a,b[, ou seja, fechados no início do intervalo e abertos
no final do intervalo. Além disso, observe que a união dos intervalos é [3,1; 30[, contendo o intervalo [3,1; 29].
O próximo passo consiste em contar quantos valores assumidos pela variável “Peso” estão em cada intervalo.
Por exemplo, no intervalo [3,1; 8,3[ existem 14 valores, ao passo que nos intervalos [8,3; 13,5[ e [13,5; 18,7[ não
existem valores assumidos na tabela 2.1 pela variável “Peso”. A contagem de cada intervalo é, na verdade, a fre-
quência absoluta de cada classe. Assim, a tabela de distribuição de frequências da variável “Peso” fica da seguinte
forma:

Tabela 2.7 - Distribuição de frequências da variável “Peso”

Peso Frequência Frequência Frequência Frequência relativa


absoluta relativa acumulada acumulada

3,1 |-- 8,3 14 14/20 = 70% 14 70%

8,3 |-- 13,5 0 0=0% 14 70%

13,5 |-- 0 0=0% 14 70%


18,7

18,7 |-- 4 4/20=20% 18 90%


23,9

23,9 |-- 30 2 2/20=10% 20 100%

Total 20 1=100% - 100%-

Legenda: Frequências dos valores assumidos pela variável peso na tabela 2.1.
Fonte: Elaboração própria.

Na tabela 2.6, o símbolo |-- foi utilizado para determinar os intervalos, deixando claro que o valor inicial está
incluído e o valor final não. Portanto, o símbolo a |-- b é outra representação para o intervalo semiaberto [a,b[.
Note que podíamos ter usado outros intervalos ao invés desses. Uma outra sugestão (talvez mais agradável) seria
usar os intervalos [3,8[, [8,13[, [13,18[, [18,23[, [23,28[ e [28,33[. Enfim, a escolha dos intervalos fica a critério
de quem está analisando os dados. Geralmente, recomenda-se apenas que os intervalos sejam escolhidos em
quantidade suficiente para observar um padrão nos dados (nem muito, nem pouco) e de maneira homogênea e/
ou representativa da situação.
Podemos perceber ainda que a distribuição de frequências para uma variável quantitativa contínua não mais se
refere a valores individuais assumidos pela variável, mas sim a um agrupamento de valores (classes).
Para encerrar esta seção, façamos a tabela de distribuição de frequências da variável quantitativa contínua
“Altura” no exemplo da tabela 2.1. Vamos optar pelas classes [15,25[, [25,35[, [35, 45[, [45, 55[. Como o menor
valor assumido por essa variável é 20 e o maior é 51, então a união dos intervalos acima contém todos os valores
assumidos pela variável na tabela. Assim, a tabela de distribuição de frequências é dada da seguinte forma:

28
Estatística | Unidade de estudo 2 – Análise exploratória de dados

Tabela 2.8 - Distribuição de frequências da variável “Altura”

Altura Frequência Frequência Frequência Frequência relativa


absoluta relativa acumulada acumulada

15 |-- 25 9 9/20=45% 9 45%

25 |-- 35 5 5/20=25% 14 70%

35 |-- 45 2 2/20=10% 16 80%

45 |-- 55 4 4/20=20% 20 100%

Total 20 1=100% - -

Legenda: Frequências dos valores assumidos pela variável altura na tabela 2.1.
Fonte: Elaboração própria.

Observe que a altura 25, assumida pela cachorra Andy, é o extremo de duas classes: [15, 25[ e [25, 35[. Porém,
observe que no primeiro intervalo o número 25 não está incluído. Portanto, ele foi contado na classe [25, 35[.

2.2 Gráficos
Após a coleta de dados, costumeiramente, apresentamos os resultados em tabelas, sejam tabelas contendo
todos os resultados dos experimentos ou tabelas de distribuição de frequência. Apesar dessa prática ser muito
útil e necessária, muitas vezes não conseguimos “enxergar” o comportamento das variáveis estudadas apenas
olhando para os dados da tabela. É para colaborar nessa análise que costumamos utilizar os gráficos. Além de
ajudar na interpretação dos dados, os gráficos constituem uma ferramenta importante para que o investigador
faça a apresentação dos resultados aos interessados (em artigos, jornais, palestras, aulas etc.). (BUSSAB; MORET-
TIN, 2012).
Os principais tipos de gráficos utilizados pela Estatística, e que conheceremos nesta seção, são o gráfico de barras
(horizontais ou verticais), o gráfico de setor ou de pizza, o gráfico de linha, o gráfico de dispersão e o histograma.
A escolha sobre qual gráfico utilizar depende do problema analisado e do tipo de variável estudada.
O gráfico de barras geralmente é utilizado para apresentar a distribuição de frequências de uma variável qua-
litativa ou quantitativa discreta. Existem dois tipos de gráficos de barras: o horizontal e o vertical. O gráfico de
barras vertical (ou também chamado gráfico de colunas) apresenta no eixo horizontal os valores assumidos
pela variável e no eixo vertical as suas frequências. Por sua vez, o gráfico de barras horizontal apresenta no eixo
vertical os valores assumidos pela variável e no eixo horizontal as suas frequências.
Consideremos novamente o exemplo da exposição de cachorros estudado na primeira seção desta unidade. A
seguir apresentamos o gráfico de barras vertical da variável “Raça” cuja distribuição de frequências foi feita na
tabela 2.2:

29
Estatística | Unidade de estudo 2 – Análise exploratória de dados

Figura 2.1 - Gráfico de barras vertical da variável “Raça” na tabela 2.1.

Legenda: Gráfico de barras vertical com a distribuição de frequências da variável “Raça” da tabela 2.1.
Fonte: Elaboração própria.

No gráfico 2.1 podemos observar facilmente que o número de cachorros malteses, 6, é maior do que os de outras
raças.
A seguir, apresentemos o gráfico de barras horizontal da variável qualitativa “Cor”, com base na tabela de distri-
buição de frequências 2.3:

Figura 2.2 - Gráfico de barras horizontal da variável “Cor” na tabela 2.1.

Legenda: Gráfico de barras horizontal com a distribuição de frequências da variável “Cor” da tabela 2.1.
Fonte: Elaboração própria.

30
Estatística | Unidade de estudo 2 – Análise exploratória de dados

Variáveis quantitativas discretas também podem ser apresentadas em gráficos de barras. Por exemplo, a variável
“Idade” da tabela 2.1 tem o seguinte gráfico de barras vertical, criado com base na tabela 2.5:

Figura 2.3 - Gráfico de barras vertical da variável “Idade” na tabela 2.1.

Legenda: Gráfico de barras vertical com a distribuição de frequências da variável “Idade” da tabela 2.1.
Fonte: Elaboração própria.

Na elaboração de gráficos de barras é importante manter proporcionalmente distribuídos os números dos eixos
horizontal e vertical entre o mínimo e o máximo assumidos.

Como ficaria o gráfico de barras vertical e o gráfico de barras horizontal da variável “Habili-
dade” no exemplo da tabela 2.1?

Outro tipo de gráfico utilizado para variáveis qualitativas e quantitativas discretas é o gráfico de setores, popu-
larmente conhecido como gráfico de pizza. Este tipo de gráfico tem o formato de círculo. Cada setor deste
círculo (fatia da pizza) deve representar cada valor assumido pela variável, de modo que seu ângulo central seja
proporcional à sua frequência. Isto significa que se a frequência de um determinado valor é de x% então o ângulo
central do setor correspondente a esse valor é de 3,6x graus. Para chegar a esta conclusão, basta aplicar uma
“regra de três”, sendo 360° a angulação total do círculo.
Para exemplificar, vamos construir o gráfico de setores da variável “Intensidade de latido” no exemplo da tabela
2.1, cuja distribuição de frequências foi dada na tabela 2.4. Essa variável só assume dois valores: agudo e grave.
Na amostra, 70% dos animais tinham latido agudo e 30% latido grave. Logo, o setor do círculo correspondente
aos cachorros com latido agudo tem ângulo central 3,6.70=252° enquanto o setor correspondente aos cachor-

31
Estatística | Unidade de estudo 2 – Análise exploratória de dados

ros com latido grave tem ângulo central 3,6.30=108°. Sendo assim, podemos desenhar o gráfico da seguinte
forma:

Figura 2.4- Gráfico de setores da variável “Intensidade de latido” na tabela 2.1.

Legenda: Gráfico de setores com a distribuição de frequências da variável “Intensidade de latido”


da tabela 2.1. Cada setor recebeu um dos dois valores assumidos pela variável. Na figura, ao lado do
valor encontra-se a sua frequência absoluta. Note que o ângulo central do setor correspondente a
“Grave” tem 108°, enquanto o ângulo central do setor correspondente a “Agudo” tem 252°.
Fonte: Elaboração própria.

Da mesma forma, podemos elaborar o gráfico de setores da variável “Raça” no exemplo da tabela 2.1 com base
na tabela de distribuição de frequências 2.2. São cinco valores assumidos por essa variável. Como os valores “Poo-
dle”, “Pitbull” e “Buldogue” ocorrem 15% das vezes cada um, o ângulo de seus setores é 3,6.15=54°. O setor
correspondente a Maltês é de 3,6.30=108°, pois esse valor tem frequência de 30%. Analogamente, o setor de
Shih-Tzu tem angulação 3,6.25=90°. Assim, o gráfico pode ser representado da seguinte forma:

Figura 2.5 - Gráfico de setores da variável “Raça” na tabela 2.1.

Legenda: Gráfico de setores com a distribuição de frequências da variável “Raça” da


tabela 2.1. Neste gráfico, o ângulo central de cada setor foi informado.
Fonte: Elaboração própria.

32
Estatística | Unidade de estudo 2 – Análise exploratória de dados

Como ficaria o gráfico de setores da variável “Habilidade” no exemplo da tabela 2.1?

O gráfico de linhas também é utilizado para variáveis qualitativas e quantitativas discretas. Neste caso, os valo-
res assumidos pela variável são colocados no eixo horizontal e suas frequências no eixo vertical. Depois, marcam-
-se os pontos cartesianos que têm primeira entrada como o valor da variável e segunda entrada como sua fre-
quência: (valor, frequência). Posteriormente, pontos “vizinhos” (em relação ao eixo horizontal) são ligados por
segmentos de reta.
Para esclarecer a definição acima, exemplifiquemos com a criação do gráfico de linhas da variável “Cor” do
exemplo da tabela 2.1, cuja distribuição de frequências foi dada na tabela 2.3. Os pares ordenados são (Azul, 1),
(Branco, 9), (Preto, 3) e (Marrom, 7).

Figura 2.6 - Gráfico de linhas da variável “Cor” na tabela 2.1.

Legenda: Gráfico de linhas com a distribuição de frequências da variável “Cor” da tabela 2.1.
Fonte: Elaboração própria.

O exemplo apresentado foi feito para uma variável qualitativa nominal. No entanto, os gráficos de linhas são mais
indicados para variáveis quantitativas discretas ou para variáveis qualitativas ordinais, pois, como nesses casos as
variáveis podem ser ordenadas, tais gráficos podem indicar a “evolução” das frequências à medida que os valores
da variável vão crescendo ou decrescendo. Veja a seguir, como exemplo, o gráfico de linhas com a variável quan-
titativa discreta “Idade” do exemplo da tabela 2.1, cuja distribuição de frequências foi apresentada na tabela 2.5:

33
Estatística | Unidade de estudo 2 – Análise exploratória de dados

Figura 2.7 - Gráfico de linhas da variável “Idade” na tabela 2.1.

Legenda: Gráfico de linhas com a distribuição de frequências da variável “Idade” da tabela 2.1.
Fonte: Elaboração própria.

Com base no gráfico 2.7, podemos concluir claramente que o número de cachorros na exposição vai decres-
cendo em função da idade.

Como ficaria o gráfico de linhas da variável “Habilidade” no exemplo da tabela 2.1?

O gráfico de dispersão costuma ser utilizado para variáveis quantitativas. Ele é elaborado da mesma forma que
o gráfico de linhas, com exceção da conexão dos pontos pelos segmentos de reta. Sendo assim, marcam-se no
plano cartesiano apenas os pares ordenados (valor, frequência) para cada valor assumido pela variável.

Glossário

Plano cartesiano é um gráfico bidimensional constituído de duas retas ortogonais, uma hori-
zontal e outra vertical. A reta horizontal usualmente é chamada de eixo das abscissas (eixo
do X) e a reta vertical é chamada de eixo das ordenadas (eixo do Y). Cada ponto com duas
coordenadas (x, y) é marcado no plano cartesiano no encontro entre a reta vertical passando
por X=x e à reta horizontal passando por Y=y.

34
Estatística | Unidade de estudo 2 – Análise exploratória de dados

Para exemplificar, façamos o gráfico de dispersão da variável “Idade” do exemplo da tabela 2.1, com base na sua
distribuição de frequências feita na tabela 2.5:

Figura 2.8 - Gráfico de dispersão da variável “Idade” na tabela 2.1.

Legenda: Gráfico de dispersão com a distribuição de frequências da variável “Idade” da tabela 2.1.
Fonte: Elaboração própria.

É importante ressaltar, no entanto, que o gráfico de dispersão costuma ser utilizado para comparar duas variáveis
quantitativas X e Y (mesmo contínuas). Nesse caso, para elemento amostral com X=x e Y=y (ou seja, a variável
X tem valor x e a variável Y tem valor y), é marcado no plano cartesiano o par ordenado (x,y). O gráfico formado
por todos esses pontos constitui um gráfico de dispersão, o qual serve para observarmos se há relação entre as
variáveis.
Para exemplificar, vamos fazer o gráfico de dispersão das variáveis “Altura” (X) e “Peso” (Y) do exemplo da tabela
2.1. Para isso, marcamos no plano cartesiano o par ordenado (x,y) de cada um dos 20 cachorros da amostra com
relação a essas variáveis:

Figura 2.9 - Gráfico de dispersão das variáveis “Altura” e “Peso” na tabela 2.1.

Legenda: Gráfico de dispersão comparativo entre as variáveis X=Altura e Y=Peso no exemplo da tabela 2.1.
Fonte: Elaboração própria.

35
Estatística | Unidade de estudo 2 – Análise exploratória de dados

No gráfico da figura 2.9 podemos observar que parece haver uma relação entre as variáveis altura e peso. A
tendência observada no gráfico de dispersão é que, à medida que a altura de um animal cresce, o peso também
cresce. Como podemos perceber, por este exemplo, o gráfico de dispersão se apresenta como uma útil ferra-
menta visual para comparar variáveis.
Agora, vejamos o que é um histograma. O histograma é um gráfico utilizado para variáveis quantitativas con-
tínuas. Visualmente, esse gráfico assemelha-se com o gráfico de barras verticais. No entanto, o eixo vertical do
histograma é demarcado pelas classes utilizadas para fazer a distribuição de frequências da variável. Devido à
continuidade dessa variável, porém, não podemos espaçar as barras verticais.

Note que há uma diferença importante entre gráfico de barras vertical e histograma.
Enquanto o primeiro é aplicado para variáveis quantitativas discretas ou qualitativas, o
segundo é aplicado para variáveis quantitativas contínuas. Apesar de parecidos visualmente,
o histograma possui suas barras encostadas, ao passo que as barras do outro gráfico são
espaçadas.

Para exemplificar, construamos o histograma da variável “Peso” da tabela 2.1. Nesta figura, utilizamos como
extremos para as classes os múltiplos positivos de 5:

Figura 2.10 - Histograma da variável “Peso” na tabela 2.1.

Legenda: Histograma da variável “Peso” da tabela 2.1, utilizando como classes para a distri-
buição de frequências os intervalos [0,5[, [5,10[, [10,15[, [15,20[, [20,25[ e [25,30[.
Fonte: Elaboração própria.

36
Estatística | Unidade de estudo 2 – Análise exploratória de dados

Como ficaria um histograma da variável “Altura” no exemplo da tabela 2.1?

Por fim, outro tipo de gráfico que costuma ser mais utilizado para variáveis qualitativas ordinais ou variáveis quan-
titativas é o gráfico de ogiva. Esse é um gráfico de linhas usado para registrar a frequência acumulada de uma
variável. Esse gráfico, obviamente, é sempre crescente, indo de frequência absoluta do primeiro valor até o total
de elementos amostrados. Para exemplificar, vamos construir o gráfico de ogivas da variável “Idade” da tabela
2.1, cuja distribuição de frequência está explicitada na tabela 2.6:

Figura 2.11 - Gráfico de ogiva da variável “Idade” na tabela 2.1.

Legenda: Gráfico de ogiva da variável “Idade” da tabela 2.1, conforme distribuição de frequências dada na tabela 2.6.
Fonte: Elaboração própria.

Como ficaria um gráfico de ogiva da variável “Altura” no exemplo da tabela 2.1?

37
Estatística | Unidade de estudo 2 – Análise exploratória de dados

2.3 Ramo-e-Folhas
Uma alternativa ao histograma e aos outros gráficos vistos na seção anterior, quando se deseja fazer o resumo de
dados de uma variável quantitativa, é o dispositivo de ramo-e-folhas. Esse dispositivo apresenta os dados de
uma variável analisada em uma amostra de maneira resumida e organizada.
O dispositivo de ramo-e-folhas de uma variável consiste em duas colunas separadas por uma barra. Na coluna
da direita fica geralmente o último dígito de um número assumido pela variável (a folha), enquanto na coluna
da esquerda é inserido o número com os outros dígitos (o ramo). Por exemplo, considere o conjunto de dados
formado pelos números:

2,5 3,3 4,3 3,7 3,8 2,1 2,5 3,2 4,6

Assim, podemos criar o dispositivo de ramo-e-folhas colocando à esquerda o ramo, dado pelo digito antes da
vírgula de cada número, e à direita os dígitos decimais dos números que têm o mesmo ramo. Procedendo dessa
forma, o dispositivo de ramo-e-folhas desse conjunto de dados é:

Figura 2.12 - Dispositivo de ramo-e-folhas

Legenda: Dispositivo de ramo-e-folhas do conjunto de dados acima.


Fonte: Elaboração própria.

Observe que há dois dados iguais a 2,5. O prefixo 2, comum a ambos, foi escrito na coluna dos ramos, enquanto
a parte decimal 5 foi inserida duplicadamente na coluna da direita, significando que há dois números com ramo
2 e folha 5.
Considere agora, por exemplo, o conjunto de números dado abaixo:

401,7 387,8 354,7 347,8 332,8 321,6


361,9 387,5 317,4 389,7 356,4 396,7
367,8 321,5 364,8 331,9 337,4 349,1

38
Estatística | Unidade de estudo 2 – Análise exploratória de dados

Para construir o dispositivo de ramo-e-folhas desse conjunto de dados, consideraremos a parte inteira desses
números:

401 387 354 347 332 321


361 387 317 389 356 396
367 321 364 331 337 349

Agora, as folhas serão formadas pelo último dígito de cada número, enquanto os ramos serão formados pelos
primeiros dois dígitos:

Figura 2.13 - Dispositivo de ramo-e-folhas

Legenda: Dispositivo de ramo-e-folhas do conjunto de dados acima.


Fonte: Elaboração própria.

O dispositivo de ramo-e-folhas é útil quando se possui um conjunto relativamente pequeno de dados e deseja-
-se fazer observações sobre o comportamento dos dados, tal como os gráficos que vimos na seção anterior. Por
exemplo, olhando para a figura 2.12 notamos que não há nenhum padrão na distribuição dos números.
Para finalizar, façamos o dispositivo de ramo-e-folhas para a variável “Altura” do exemplo da tabela 2.1. Os ramos
serão o primeiro dígito de cada dado e as folhas serão o segundo dígito. Temos o seguinte gráfico:

39
Estatística | Unidade de estudo 2 – Análise exploratória de dados

Figura 2.14 - Dispositivo de ramo-e-folhas da variável “Altura” na tabela 2.1.

Legenda: Dispositivo de ramo-e-folhas da variável “Altura” na tabela 2.1.


Fonte: Elaboração própria.

Com base no ramo-e-folhas acima podemos notar que há uma frequência maior de cães com menor altura na
amostra coletada.

Como ficaria o dispositivo de ramo-e-folhas da variável “Peso” no exemplo da tabela 2.1?

Para saber mais curiosidades sobre o diagrama de ramo-e-folhas e ver como obtê-los no
software Minitab (link para download < https://www.minitab.com/pt-br/downloads/>),
veja o link < https://www.sites.google.com/site/qualidadeeprodutividade/six-sigma/dmaic/
analyze/2-1-3-1-analise-exploratoria-de-dados-eda/2-1-3-1-2-ramo-e-folhas>.

40
Considerações finais
Nesta unidade vimos diversas formas de organizar, visualizar e apresentar
os dados obtidos em uma amostra estatística. Aprendemos:
• As definições de frequência absoluta e de frequência relativa;
• As definições de frequência acumulada e frequência relativa acu-
mulada;
• Como fazer a distribuição de frequências das variáveis qualitativas
e quantitativas discretas usando contagem;
• Como fazer a distribuição de frequências das variáveis quantitati-
vas contínuas utilizando classes;
• Construir gráficos de barras verticais e horizontais, gráficos de
setor, gráficos de linha e gráficos de dispersão;
• Utilizar o gráfico de dispersão para ver se há dependência entre
duas variáveis numa amostra;
• Construir histogramas para variáveis quantitativas contínuas;
• Construir gráfico de ogiva para representar a distribuição acumu-
lada de uma variável; e
• Construir dispositivos de ramo-e-folhas.

41
Referências bibliográficas
BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística Básica. 7. ed. São
Paulo: Saraiva, 2012. 540 p.

42
Estatística
Estatística

1ª edição
2017
Unidade 3
Medidas de posição e de
dispersão
3
Para iniciar seus estudos

Caro estudante, como vão seus estudos em Estatística? Neste curso já


aprendemos a lidar com a seleção de dados numa pesquisa estatística,
a analisar a frequência desses dados e a apresentá-los de forma gráfica.
Nesta unidade estamos interessados em encontrar valores que sejam
representativos de todo o conjunto de dados, como a média, a moda e
a mediana. Claro que essa simplificação, apesar de extremamente útil,
vem acompanhada de “erros”, pois os dados costumam apresentar vários
valores diferentes dos representantes escolhidos. Para isso, definiremos
alguns medidores desses erros, como a variância, o desvio-padrão e o
desvio médio. Com o auxílio desses representantes e dessas medidas de
erros, chamadas medidas de dispersão, poderemos fazer análises e pre-
visões mais acertadas sobre os fenômenos aleatórios. #Partiu estudar?

Objetivos de Aprendizagem

• Definir média aritmética, moda, mediana e separatrizes (quartil,


decil e percentil) de um conjunto de dados.
• Definir desvio-padrão, variância e coeficiente de variação de um
conjunto de dados.
• Entender a aplicabilidade das medidas de posição e de dispersão
na análise de dados.

46
Estatística | Unidade 3 - Medidas de posição e de dispersão

3.1 Medidas de posição


Já vimos na Unidade 2 uma medida importante para compreender um conjunto de dados: a frequência. Ela pode
ser especialmente útil quando as variáveis analisadas são qualitativas, apesar de também poder ser aplicada a
variáveis quantitativas, como vimos. Agora, vamos definir três outras medidas que ajudam a compreender um
conjunto de dados, principalmente para variáveis quantitativas. São elas: a moda, que verifica quais dados são
mais frequentes; a mediana, que verifica qual dado possui uma posição “geometricamente” central; e a média,
que verifica qual número ocupa uma posição “aritmeticamente” central num conjunto de dados.
A seguir faremos a definição formal de cada um dos três conceitos mencionados, que são chamados de medi-
das de posição, e usaremos eles aplicados em exemplo com rol (dados brutos), em intervalos agrupados sem
intervalos de classe e em intervalos agrupados com intervalos de classe. Cada uma dessas três medidas funciona
como representante do conjunto de dados.
Definição 3.1.1: Moda: Também conhecida como valor típico e valor dominante. Seja um
conjunto de dados. Assim, a moda de x é o elemento de x que tem maior frequência absoluta, isto é, aquele que
aparece mais vezes no conjunto x.
Acompanhe os exemplos que seguem:
1o Exemplo: Dados brutos
Considere o conjunto formado pelos seguintes números:
1 2 5 3 2 3 3 4 5 1 3 5
O número “1” tem frequência absoluta igual a 2 (isto é, aparece duas vezes no conjunto de dados), o número “2”
tem frequência 2, o número “3” tem frequência 4, o número “4” tem frequência 1 e o número “5” tem frequência
3. Logo, o número que tem maior frequência absoluta nesse conjunto é o “3”, ou seja, esse é o número que mais
aparece nos dados. De acordo com a definição 3.1, o número 3 é a moda do conjunto de dados.
Observação: Se os dados forem ordenados, ficará mais fácil a determinação da moda. Acompanhe!
1 1 2 2 3 3 3 3 4 5 5 5
Entendeu? Seguindo...
Denotamos a moda de um conjunto de dados pelo símbolo M0. Assim, nesse exemplo, M0 = 3.
2o Exemplo: Dados agrupados sem intervalos de classe.
Considere a tabela abaixo:

Cor (xi) Quantidade de Latas existente no estoque (fi)


Amarela 12
Branca 9
Preta 5
Azul 15

47
Estatística | Unidade 3 - Medidas de posição e de dispersão

Primeiro vamos entender que xi corresponde à variável observada ou ao objeto observado e, fi à frequência, ou
seja, à quantidade de vezes que a variável ou o objeto se repete. Entendendo isso, fica fácil entender que a moda
é a cor azul, pois a frequência com que esta aparece é maior de todas.
Lembre-se: “A moda sempre será o objeto analisado, nunca a frequência dele!”
3o Exemplo: Dados agrupados com intervalos de classe.
Considere a tabela abaixo:

Faixa de idade dos funcionários da Quantidade de


empresa XYW (anos) funcionários
16  |––  26 12
26  |––  36 18
36  |––  46 5
46  |––  56 3

O símbolo |–– significa que o valor à esquerda faz parte do intervalo enquanto o valor à direita não. Se o símbolo
fosse |––, tanto o valor à esquerda como o valor à direita fariam parte do intervalo.
Na tabela, o intervalo 16 |–– 26 com 12 funcionários significa que esses doze podem ter de 16 anos até 25,9 anos.
O funcionário que tiver 26 anos pertencerá ao intervalo seguinte.
Agora, voltando ao cálculo da moda, observando as faixas de idade dos funcionários da empresa XYW e a quan-
tidade existente em cada uma delas, a moda é a faixa que tem mais funcionários. Portanto, concluímos que a
moda é a faixa de 26 |–– 36 anos. Muitas vezes o intervalo modal não resolve nosso problema.
Existe uma forma de se calcular qual a idade que mais aparece dentro desse intervalo.

Com o auxílio dessa fórmula vamos, então, determinar qual a idade modal:

Substituindo os valores,

48
Estatística | Unidade 3 - Medidas de posição e de dispersão

Concluímos que a idade que mais aparece é, aproximadamente, 29 anos.

Observação: Um conjunto de dados pode apresentar mais que uma moda, como também não ter moda. Se não
tem moda, afirmamos que o conjunto é amodal; se apresenta duas modas, é bimodal; se apresenta três valores
modais, é trimodal. Quando há mais de três valores, dizemos que o conjunto de dados ou a série de dados é plu-
rimodal ou polimodal. Acompanhe alguns exemplos:
Exemplo A:
Seja o conjunto:
1 7 5 3 2 8 9 4
Ordenando, temos:
1 2 3 4 5 7 8 9
Observamos que, nesse conjunto, cada número aparece uma vez, portanto esse conjunto é amodal, não tem
moda.

Exemplo B:
Observe a tabela:
Faixa etária (anos) Quantidade de adultos pesquisados
18  |––  28 25
28  |––  38 33
38  |––  48 27
48  |––  58 17
58  |––  68 33

Observamos que tanto a faixa etária de 28 a 38 anos como a de 58 a 68 anos possuem 33 funcionários. As duas
faixas são as que mais têm funcionários, portanto a moda são as duas faixas, porém, como já sabemos da exis-
tência da fórmula para intervalos, vamos fazer uso dela para cada intervalo que mais apareceu, isto é, o primeiro
e o quinto intervalo.
Primeiro intervalo:

49
Estatística | Unidade 3 - Medidas de posição e de dispersão

Quinto intervalo:

Conclusão:
A tabela apresenta duas idades modais, 34 e 61 anos, portando ela é bimodal.
Exemplo C:
Admita a seguinte amostra com 6 animais: {macho, fêmea, fêmea, fêmea, macho, fêmea}. Apesar de não ser um
conjunto numérico, podemos perceber que há um elemento com maior frequência que outros: “fêmea” aparece
quatro vezes, enquanto “macho” aparece duas vezes na amostra. Assim, a moda amostral é o elemento “fêmea”.

ID da imagem : 1106497 – 123rf

CONCLUSÃO:
A moda está intimamente relacionada com o conceito de frequência num conjunto de dados, ou ainda, é na
verdade, o(s) elemento(s) mais frequente(s) do conjunto.
Definição 3.1.2: Mediana: É o elemento que ocupa a posição central numa série de valores ou dados. Ela divide
os dados observados em duas partes iguais. É considerada uma separatriz, o que veremos mais adiante. Seja
um conjunto “ordenado” de forma crescente ou decrescente. A mediana de x é o elemento
de x que ocupa a posição central nesse conjunto, e é indicada por Md. Como se refere à posição, temos duas fór-
mulas de cálculo, uma para quando o total de dados observados for par e outra para quando for ímpar.
Quando for ímpar:
Devemos somar 1 ao total de valores existentes e, a seguir, dividir por dois. O resultado indicará a posição em que
o elemento mediana estará. Importante: o cálculo não indica o elemento mediana, apenas onde ele se encontra.
Matematicamente, devemos fazer:

Vamos ver, então, alguns exemplos:

50
Estatística | Unidade 3 - Medidas de posição e de dispersão

1o exemplo: Dados brutos


Temos dois casos: Quando o total dos elementos for par e quando for impar. Cada um apresenta uma forma para
o cálculo. Vejamos:

Quando n for ímpar: Utilizamos para localizar o elemento mediana. Acompanhe o exemplo:

Seja a série de valores {2,3,5,7,8,6,3}.


Primeiro colocamos em ordem: {2,3,3,5,6,7,8}.

A mediana é o 4o elemento, portanto Md = 5.

Quando n for par: Utilizamos para localizar o elemento mediana. Nesse caso encontraremos

dois elementos ocupando as posições centrais: e e, portanto, a mediana nesse caso é definida como

sendo o número que é a média desses dois elementos centrais.


Acompanhe o exemplo:
Seja a série de valores {2,3,5,7,8,6}.
Primeiro colocamos em ordem: {2,3,5,6,7,8}.

, pegaremos o terceiro elemento que é o 5.

, pegaremos o quarto elemento que é o 6.

Então, a mediana é:

Concluímos que a mediana da série analisada é 5,5.

Entendeu? Lembre-se de que a mediana pode não aparecer na série de dados observada, como foi o caso!

51
Estatística | Unidade 3 - Medidas de posição e de dispersão

2o Exemplo: Dados agrupados sem intervalos de classe.


Considere a tabela abaixo:

Cor (xi) Quantidade de latas existente no estoque (fi)


Amarela 12
Branca 9
Preta 5
Azul 15

Para dados não agrupados em intervalos, precisaremos da frequência acumulada, Fac, incluiremos então uma
outra coluna à direita.

Cor (xi) Quantidade de latas existente no Frequência


estoque (fi) acumulada (Fac)
Amarela 12 12
Branca 9 21
Preta 5 26
Azul 15 41

Como o total de latas observadas é ímpar, procedemos ao cálculo através de , isto é:

a mediana é a cor da lata que estiver na 21o posição. Observando a tabela, verifica-

mos que a cor branca está na 21o posição, portanto ela é a mediana.
3o Exemplo: Dados agrupados com intervalos de classe.
Considere a tabela abaixo:
Faixa de idade dos funcionários Quantidade
da empresa XYW (anos) de funcionários
16  |––  26 12
26  |––  36 18
36  |––  46 5
46  |––  56 3

52
Estatística | Unidade 3 - Medidas de posição e de dispersão

Para o cálculo da mediana em dados agrupados necessitaremos da frequência acumulada (Fac).

Xi Fi Fac
Faixa de idade dos funcionários da Quantidade Frequência
empresa XYW (anos) de funcionários acumulada
16  |––  26 12 12
26  |––  36 18 30
36  |––  46 5 35
46  |––   56 3 38
Total 38

Como temos 38 no total e este número sendo par, procedemos ao cálculo da mediana através do segundo caso
passado em dados brutos.

19o elemento à a faixa etária correspondente à 19o posição é 26 a 36 anos.

→ 20o elemento à a faixa etária correspondente à 20o posição também é 26 a 36 anos


Como são iguais, a mediana é o próprio intervalo. A mediana nesse exemplo não será um elemento, mas um
intervalo, pois não sabemos como esses elementos estão distribuídos no intervalo. Portanto Md = 26 a 36 anos.
Observação: Se o cálculo tivesse indicado o 30o e 31o elementos, somaríamos o limite inferior do 30o com o limite
superior do 31o e dividiríamos por dois, isto é:

, portanto nesse caso a mediana seria 36 anos, Md=36.

Às vezes, o conhecimento do intervalo modal não resolve o problema. Precisamos algo mais pontual. Da mesma
forma que escrevemos para moda em intervalos com classes, temos também uma fórmula para o cálculo de
medianas em intervalos com classe. Acompanhe:

Agora, com auxílio da fórmula acima, vamos calcular:


Observando a tabela e dividindo 38 por 2, chegamos a 19. Percebemos que a classe mediana é a segunda, pois
possui o 19º elemento. Então, temos:

53
Estatística | Unidade 3 - Medidas de posição e de dispersão

Agora, substituindo na fórmula, temos:

, aproximadamente 28.
Conclusão: A mediana da tabela de idades dos funcionários da empresa XYW é 28 anos.
Definição 3.1.3: Média: É o valor mais representativo de uma frequência, ou ainda, é o valor onde mais se con-
centram os dados de uma distribuição. É indicada por Me ou . Vamos ver aqui a média aritmética e a média
ponderada. Acompanhe os exemplos que se seguem:
1o Exemplo: Dados brutos
Se X é a variável que se apresenta em valores observados, podemos escrever que a média aritmética é dada pela soma
de todos esses valores, x1, x2, x3, ..., xn divididos pela quantidade existente deles. Matematicamente, escrevemos:

ou simplesmente .

Considere o conjunto . De acordo com a definição 3.1.3, a média aritmética de x é dada por

Ainda com dados brutos:


Seja X o conjunto dado pelos números
1 1 3 3 2 1 3 3 2 1 3 3
Nesse caso há 12 elementos na lista, mas apenas três números distintos: “1”, “2” e “3”, os quais têm frequência
absoluta 4, 2 e 5, respectivamente. Assim, quando formos calcular a média desse conjunto, ao invés de somar-
mos todos os números podemos somar apenas cada um dos números distintos multiplicados por sua frequência.
Nesse caso:

A média acima, calculada de forma agrupada, costuma ser chamada de média ponderada. Os pesos são as fre-
quências de cada valor numérico presente na amostra.

54
Estatística | Unidade 3 - Medidas de posição e de dispersão

2o Exemplo: Dados agrupados sem intervalos de classe.


Para dados agrupados sem e com intervalos de classe, a média a ser calculada é a ponderada. Mais à frente você
encontrará referências dela no glossário.
Sua fórmula de cálculo é dada por:

ou simplesmente .

Considere a tabela abaixo:


Quantidade de Quantidade Xi.fi
filhos (Xi) de casais (Fi)
0 10 0
1 8 8
2 6 12
3 4 12
Total 28 32

Conclusão: Os 32 casais possuem em média, 1 filho.


3o Exemplo: Dados agrupados com intervalos de classe.
Considere a tabela abaixo:

Faixa de idade dos funcionários da empresa XYW Quantidade


(anos)
de funcionários
16  |––  26 12
26  |––  36 18
36  |––  46 5
46  |––  56 3

55
Estatística | Unidade 3 - Medidas de posição e de dispersão

Observe que, nesse caso, não temos o Xi. Como já sabemos que ele é o ponto médio do intervalo, criaremos duas
colunas à direita, uma para o cálculo dele e outra para Xi.Fi.

Faixa de idade dos Quantidade PM f.PM


funcionários da empresa XYW de funcionários
(anos)
16 |–– 26 12 21 252
26 |–– 36 18 31 558
36 |–– 46 5 41 205
46 |–– 56 3 51 153
Total 38 1168

Calculando então...

Conclusão: Os 38 funcionários possuem em média, 28 anos.

Glossário

A média ponderada de n elementos , cada um com peso , respecti-

vamente, é dada por:


Por exemplo, suponha que um professor dê duas provas para uma turma, a primeira com
peso 2 e a segunda com peso 3, e que a nota final de um aluno seja dada pela média pon-
derada das notas nas duas provas. Joãozinho tirou nota 3 e nota 8, respectivamente, nessas
provas. Assim, a nota final de Joãozinho foi:

Exemplo geral: Considere o seguinte conjunto de dados:


4 4 8 9 11 15 17 21

Assim, a moda desse conjunto é , pois esse é o único elemento da lista que tem frequ-
ência absoluta maior do que um. A mediana é o número

56
Estatística | Unidade 3 - Medidas de posição e de dispersão

pois há 8 elementos no conjunto (quantidade par) e os números “9” e “11” são aqueles que

ocupam as posições centrais (posições e ). Por fim, a média aritmética da lista


acima é:

Note que as três medidas de posição resultaram em números diferentes: , e


. Esse exemplo deixa evidente que as três medidas não têm mesma natureza e
podem resultar em valores completamente diferentes. No entanto, cada uma dessas medidas
tem uma “missão” importante numa análise de dados.

INÍCIO DO REFLITA. Calcule você mesmo(a) a moda, a mediana e média de


cada um dos seguintes conjuntos de dados: e
. FIM DO REFLITA.

Definição 3.1.4: Separatrizes – Decil, quartil e Percentil


As separatrizes são valores que dividem em partes iguais um conjunto de dados coletados
e organizados. Dessa forma entendemos que a mediana também é uma separatriz. Vamos
entendê-los:
Quartil à Divide em quatro partes iguais. Teremos Q1, Q2 e Q3.
O primeiro quartil, Q1, separa a sequência observada e já ordenada, deixando 25% dela à sua
esquerda e 75% à sua direita. O segundo quartil, Q2, é a mediana! Ele separa 50% dos valores
à sua esquerda e 50% à sua direita.
Decil à Divide em dez partes iguais. Teremos D1, D2, ..., D9.
O primeiro Decil, D1, separa 10% dos valores à sua esquerda e 90% à sua direita. E assim são
entendidos os demais.
Percentil à Divide em cem partes iguais. Teremos P1, P2, ..., P99.
O primeiro Percentil, P1, separa 1% dos valores à sua esquerda e 99% deles à sua direita. De
modo análogo, os demais.
Agora que entendemos sua interpretação, vamos entender seus cálculos:

57
Estatística | Unidade 3 - Medidas de posição e de dispersão

Exemplos com dados brutos:


1o Exemplo: Decil:
Sejam as idades de um grupo de cães observados em uma competição: 2,4,5,6,7,8,9,10,6,6.
Vamos determinar o 3o e o 7o decis.
Primeira coisa a fazer é ordenar os elementos: 2,4,5,6,6,6,7,8,9,10.

D 3= à portanto o terceiro decil é o elemento 5.

D 7= à portanto o sétimo decil é o elemento 7.


2o Exemplo: Quartil:
Vamos utilizar as mesmas idades de cães observadas na competição do exemplo anterior já
ordenadas e calcular o 1o e o 3o Quartil:
Idades: 2,4,5,6,6,6,7,8,9,10.

Q1= (sempre arredondar) à portanto o primeiro quartil é o terceiro elemento, 5.

Q3= (sempre arredondar) à portanto o sétimo decil é o elemento 7.

“O cálculo para distribuição de frequência sem intervalos de classes é muito parecido com
o cálculo para dados brutos. A diferença é que através da frequência acumulada (Fac) você
localizará os elementos na posição determinada. Por essa razão, continuemos com exemplos
para distribuição de frequência com intervalos de classes.”

Exemplos para distribuição de frequência com intervalos de classes:


1o Exemplo: Quartil:
Fórmula para o primeiro Quartil - Q1

Fórmula para o terceiro Quartil – Q3

58
Estatística | Unidade 3 - Medidas de posição e de dispersão

Acompanhe o cálculo no exemplo que segue:


Considere a tabela abaixo e determine os quartis (Q1 e Q3) e mediana.

Primeiro quartil? Md? Terceiro quartil

1º Passo:

2º Passo: Pela Fac identificam-se as classes de Q1, Md e Q3


Para Q1, temos: lQ1= 17; n=56; åf=6; h=10; FQ1=15
Para Md, temos: lMd=27; n=56; åf=21; h=10; FQ1=20
Para Q3, temos: lQ3=37; n=56; åf=41; h=10; FQ1=10

59
Estatística | Unidade 3 - Medidas de posição e de dispersão

2o Exemplo: Decil

Procedimento para o cálculo:

1º Passo: Calcula-se em que i = 1, 2, 3, 4, 5, 6,7, 8, 9.


2º Passo: Identifica-se a classe Di pela Fac.
3º Passo: Aplica-se a Fórmula:

Vamos considerar a tabela abaixo e determinar o 4º decil


Faixa etária Funcionários pesquisados Fac
4½¾ 14 8 8
14½¾ 24 12 20
24½¾ 34 17 37
34½¾ 44 3 40
Total 40 -----

3o Exemplo: Percentis
Procedimento para o cálculo:

1º Passo: Calcula-se em que i = 1, 2, 3, ..., 98, 99.


2º Passo: Identifica-se a classe Pi pela Fac.
3º Passo: Aplica-se a fórmula:

60
Estatística | Unidade 3 - Medidas de posição e de dispersão

Considere a tabela abaixo e determine o 72º percentil


4½¾ 9 8 8
9½¾ 15 12 20
15½¾ 19 10 30
19½¾ 23 6 36
Total 36 -----

3.2 Medidas de dispersão: Variância e Desvio-padrão

Conforme Bussab e Morettin (2012), apenas as medidas de posição não são capazes
de fornecer informações suficientes sobre um conjunto de dados. Um exemplo claro disso é a
renda per capita em um país. No Brasil, por exemplo, segundo a Agência Brasil (2016), a renda
per capita “média” dos brasileiros foi de R$ 1.113 em 2015. No entanto, o próprio texto afirma
que a média no Maranhão é de pouco mais de R$ 500. Além disso, existem muitas famílias no
Brasil cuja renda per capita fica abaixo dos R$ 200 (uma pesquisa informal nos bairros pobres
de sua cidade pode confirmar essa frase). Isso ocorre porque a média é afetada pelos extre-
mos no conjunto de dados. Assim, mesmo que existam muitos brasileiros com uma renda per
capita abaixo de R$ 200 mensais, existem alguns cuja renda per capita fica acima dos milhões.
Essa disparidade é considerada pelo cálculo da média.
Para entender como os dados se distribuem em torno das medidas de posição, em
especial da média, existem as chamadas medidas de dispersão. Tais medidas ajudam a
entender a distribuição dos dados em uma amostra e o quão díspares são esses dados. Nesta
seção, definiremos quatro principais medidas de dispersão: a variância, o desvio-padrão, des-
vio médio e coeficiente de variação.

3.2.1 Variância: É uma medida que permite saber o quanto os valores observados estão dis-
tantes da média e é indicada por s2. A variância de é definida de forma diferente quando
se trabalha com amostra de população. Aqui iremos trabalhar sempre com amostras somente.
Vamos apresentar duas formas para o cálculo de cada uma das situações existentes: em
dados brutos, em distribuição sem intervalos de classe e em distribuição com intervalos de
classe.
1o exemplo: Dados brutos

61
Estatística | Unidade 3 - Medidas de posição e de dispersão

Para dados brutos a expressão para o cálculo da variância é:

, onde:

n à é o total pesquisado.

à é a soma do quadrado de cada valor existente, cada xi.

à é o quadrado da soma de todos os valores existentes.

Seja nosso primeiro exemplo:


Vamos fazer uso de tabelas auxiliares:

7 49
6 36
8 64
8 64
7 49
6 36

= 42 = 298

Agora substituímos na expressão:

62
Estatística | Unidade 3 - Medidas de posição e de dispersão

2o exemplo: Dados agrupados sem intervalos de classe


Para dados agrupados sem intervalos de classe o cálculo da variância é:

Percebemos que nesse caso, primeiro usamos a soma da multiplicação da frequência


por cada valor ao quadrado e, em seguida, é o quadrado da soma da multiplicação dela
com cada valor. Vamos ao exemplo:
Vamos calcular a variância na tabela abaixo:
Idade de
adultos fi
pesquisados
30 3
34 5
38 10
42 2
46 3
Total à 23

Vamos fazer uso de tabelas auxiliares:


Idade de f.xi X2 f.x2
adultos fi
pesquisados
x
30i 3
90 900 2700
34 5
170 1156 5780

63
Estatística | Unidade 3 - Medidas de posição e de dispersão

38 10
380 1444 14440
42 2
84 1764 3528
46 3
138 2116 6348
Total à 23

=
32796
= 862

Agora substituímos na expressão:

= = 22.26

3o exemplo: Dados agrupados com intervalos de classe.


Para dados agrupados com intervalos de classe a cálculo da variância é:

Observem que para esse tipo de distribuição, utilizamos o ponto médio do intervalo com
valor x.

Vamos calcular a variância na tabela abaixo:


Faixa etária Fi

64
Estatística | Unidade 3 - Medidas de posição e de dispersão

3
30 34
34 38 5
38 42 10
42 46 2
46 50 3
Total à 23

Vamos fazer uso de tabelas auxiliares:


Idade de pm f.pm pm2 f.pm2
adultos fi
pesquisados
xi
32 3
30
34 96 1024 3072
34 38 36 5
180 1296 6480
38 42 40 10
400 1600 16000
42 46 44 2
88 1936 3872
46 50 48 3
144 2304 6912
Total à 23

=
= 908 36336

Agora substituímos na expressão:

65
Estatística | Unidade 3 - Medidas de posição e de dispersão

3.2.2 Desvio-padrão: É uma medida muito utilizada que indica o grau de variação dos dados
observados em um conjunto em relação à média. É mais utilizado do que a variância. Seja
um conjunto de dados cuja variância é
. O desvio padrão de é a raiz quadrada da variância, e é indicado por s,

1o Exemplo: No primeiro exemplo de dados brutos para o conjunto


, calculamos a variância e chegamos ao valor de 0.8. O desvio-padrão é
sua raiz!

.
Isso significa que os valores observados estão distantes da média em 0,89.
2o Exemplo: Dados agrupados sem intervalo de classe.
Vamos calcular o desvio-padrão da tabela apresentada no segundo exemplo de dados agru-
pados sem intervalo de classe, a qual apresenta a idade de adultos pesquisados e variância
de 24,05.
O desvio-padrão dela é sua raiz, ou seja:

3o Exemplo: Dados agrupados com intervalo de classe.


Agora vamos calcular o desvio-padrão da tabela apresentada no terceiro exemplo de dados
agrupados com intervalo de classe, a qual apresenta uma faixa etária não identificada e vari-
ância de 22,26.
O desvio-padrão dela é sua raiz, ou seja:

Uma alternativa ao desvio-padrão quando se deseja verificar, “em média”, quanto a média arit-
mética de um conjunto de dados difere dos seus valores é o desvio médio:

3.2.3 Desvio Médio: Seja um conjunto de dados


cuja média aritmética é . O desvio médio de é definido por

66
Estatística | Unidade 3 - Medidas de posição e de dispersão

Exemplo 3.18: Seja . A média arit-


mética de é:

Assim, o desvio médio de é dado por:

INÍCIO DO REFLITA. Calcule você mesmo(a) a variância, o desvio-padrão e o desvio


médio de cada um dos seguintes conjuntos de dados:
e
. FIM DO REFLITA.

Veja outros detalhes sobre as medidas de dispersão na seção 3.2 do livro de Bussab e
Morettin (2012).

INÍCIO DO SAIBA MAIS. O desvio-padrão e a variância costumam ser utilizados por inves-
tidores para avaliar o risco de uma aplicação financeira. Se tiver interesse, pesquise sobre o
assunto em fontes confiáveis na web. FIM DO SAIBA MAIS.

3.2.4 Coeficiente de Variação – CV


O coeficiente de variação é uma medida de dispersão que apresenta o quão os valores obser-
vados estão distantes da média. Ele não possui unidade, é uma taxa percentual. Ele pode
ainda ser utilizado como comparação da dispersão dos dados de certos conjuntos com médias
diferentes quando não se tem o desvio-padrão.

Sua fórmula de cálculo é:

Onde representa o desvio-padrão e a média.


Vários autores indicam diferentes métodos para se classificar o coeficiente de variação.
Segundo Ferreira (1991) ele é classificado de acordo com a precisão do processo:

67
Estatística | Unidade 3 - Medidas de posição e de dispersão

Fonte: Disponível em: <http://www.ufscar.br/jcfogo/EACH/Arquivos/Classif_CV.pdf>. Acesso


em: 16 maio 2017.

Já a classificação obtida pela internet, no site <www.datalyser.com.br>, utilizada em Controle


Estatístico do Processo (CEP), utiliza o grau de dispersão:

Fonte: Disponível em: <http://www.ufscar.br/jcfogo/EACH/Arquivos/Classif_CV.pdf>. Acesso


em: 16 maio 2017.

Vamos entender sua interpretação:


Por exemplo, você é o(a) supervisor(a) no setor de controle da qualidade em uma empresa
ensacadora de arroz, que ensaca embalagens de arroz pequenas e grandes. Você obtém
uma amostra de cada embalagem do produto e observa que o volume médio das embalagens
menores é 1 kg com desvio-padrão de 0,08 kg, e o volume médio das embalagens maiores
é 5 kg, com desvio-padrão de 0,48 kg. Embora o desvio-padrão da embalagem maior, 5 kg,
seja seis vezes maior que o desvio-padrão da embalagem menor, 1 kg, seus coeficientes de
variação (CV) admitem uma conclusão diferente:

Pacote grande Pacote pequeno

68
Estatística | Unidade 3 - Medidas de posição e de dispersão

Percebe-se claramente que os coeficientes de variação de ambos estão próximos, não obs-
tante o volume de um ser cinco vezes maior que o outro. Concluímos que o pacote grande
apresenta um pouco mais de variabilidade em relação à média do que o pacote pequeno.

3.3 Exemplo extra

Nesta seção vamos fazer exemplos contextualizados envolvendo as medidas de posi-


ção e as medidas de dispersão que definimos nas duas primeiras seções.

Exemplo 1. Considere a tabela 3.1 contendo dados sobre população, área, altitude, mês de
aniversário e estado de oito cidades brasileiras. Essa tabela já foi apresentada na Unidade 1
(tabela 1.2).

Tabela 3.1 - Informações sobre algumas cidades brasileiras


Mês de ani-
Cidade População Área (km²) Altitude (m) Estado
versário
Belo Hori-
2.513.451 330,95 852 Dezembro MG
zonte
Brasília 2.977.216 5801,94 1171 Abril DF
Campinas 1.164.098 797,6 685 Julho SP
Diamantina 47.647 3869,83 1280 Março MG
Maringá 403.063 487,93 515 Maio PR
Natal 877.662 167,26 30 Dezembro RN
Rio de
6.498.837 1197,46 2 Março RJ
Janeiro
São Paulo 12.038.175 1522,99 760 Janeiro SP
Legenda: Informações sobre a população, área, altitude, mês de aniversário e estado de algu-
mas cidades brasileiras.
Fonte: Elaboração própria (2017), com dados do portal Wikipédia.

Note que apenas duas variáveis da tabela 3.1 têm moda. A variável “Mês de Aniversá-
rio” é bimodal, cujas modas são “março” e “dezembro”, ambas com frequência absoluta igual
a 2. Por sua vez, a variável “Estado” possui como moda “São Paulo”, o único com frequência
absoluta maior que 1.
Vamos calcular a média, a mediana, a variância, o desvio-padrão e o desvio médio da
variável “População”.

69
Estatística | Unidade 3 - Medidas de posição e de dispersão

Com relação aos valores assumidos pela variável “População”, podemos usar os recur-
sos digitais que tivermos disponível para calcular a média, a variância, o desvio padrão e des-
vio médio. Assim, obtemos:

Vamos calcular a variância apenas nesse caso, assumindo que estamos trabalhando,
não como uma amostra e sim com o todo pesquisado, a população. Dessa forma, o
denominador não será n-1, apenas n.

Para calcular a mediana da variável “População”, devemos ordenar os números:


47.647 403.063 877.662 1.164.098 2.513.451
2.977.216 6.498.837 12.038.175
Como há 8 números na lista (quantidade par), devemos selecionar os dois elementos centrais
e fazer a média:

Nesse exemplo, podemos perceber que a média aritmética está distante da maioria
dos valores na tabela. Por isso, as medidas de dispersão deram valores altos. De fato, há uma
grande heterogeneidade de valores nessa tabela. Enquanto há cidades como “São Paulo”, que
tem mais de 12 milhões de habitantes, há também “Diamantina”, com menos de 50 mil.
INÍCIO DO REFLITA. Calcule você mesmo(a) a média aritmética, a mediana, a variância, o
desvio-padrão e o desvio médio da variável “Área” na tabela 3.1. Dica: utilize calculadora ou
softwares computacionais para fazer os cálculos. FIM DO REFLITA.

Observe que o exemplo da tabela 3.1 é de grande praticidade, pois lida com dados
reais de variáveis importantes sobre cidades brasileiras. Note, no entanto, que os cálculos são
muito complicados de fazer “à mão”. Isso mostra a necessidade de utilizar ferramentas digitais

70
Estatística | Unidade 3 - Medidas de posição e de dispersão

(calculadora, aplicativos, softwares computacionais etc.) para a realização dos cálculos em


situações não hipotéticas.

INÍCIO DO FIQUE ATENTO! Note que para uma variável X, o intervalo


costuma concentrar a maior parte dos seus valores. Geralmente,
quanto maior é esse intervalo, maior deve ser a variabilidade dos dados. FIM DO FIQUE
ATENTO!

INÍCIO DO FIQUE ATENTO! Lembre-se de acessar o fórum para fazer com seu grupo a tarefa
desta unidade que é calcular as medidas de posição e de dispersão para cada uma das vari-
áveis e fazer gráficos de dispersão comparativos entre ao menos quatro pares de variáveis
quantitativas. FIM DO FIQUE ATENTO!

Síntese da Unidade:

Nesta unidade aprendemos sobre algumas medidas de posição e de dispersão muito


importantes na análise exploratória dos dados de uma variável. Vimos:
· A definição de moda e o que são amostras amodais, bimodais e trimodais.
· A definição de mediana para uma quantidade par ou ímpar de elementos amostrais.
· A definição de média aritmética e de média ponderada.
· A definição de decis, quartis e percentis.
· A definição de variância.
· A definição de desvio-padrão.
· A definição de desvio médio.
· A utilidade das medidas de dispersão (variância, desvio-padrão e desvio médio) para
comparar a variabilidade dos dados em uma amostra, de modo a verificar o quanto eles
estão próximos ou distantes da média.
· A utilidade da comparação entre os valores da média aritmética e da mediana para con-
cluir sobre a simetria dos dados de uma variável em uma amostra.

Referências

71
Estatística | Unidade 3 - Medidas de posição e de dispersão

AGÊNCIA BRASIL. IBGE: renda per capita média do brasileiro atinge R$ 1.113 em 2015.
[Publicado em: 26 fev. 2016]. Disponível em: <http://agenciabrasil.ebc.com.br/economia/noti-
cia/2016-02/ibge-renda-capita-media-do-brasileiro-atinge-r-1113-em-2015>. Acesso em: 14
fev. 2017.

BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística Básica. 7. ed. São Paulo: Saraiva,
2012. 540 p.

FERREIRA, P. V. Estatística Experimental aplicada à Agronomia. Maceió: EDUFAL, 1991.


437p.

72
Considerações finais
Nesta unidade buscamos entender a importância da Estatística no mundo
atual e apresentamos definições básicas dessa ciência. Buscamos entender:
• A diferença entre os fenômenos determinísticos e aleatórios.
• A aplicação da Estatística ao mundo real a partir da coleta de
dados e do tratamento de informações.
• Os passos do método estatístico.
• A utilidade da Estatística no mundo moderno aplicada aos mais
diversos contextos.
• O mau uso ou uso tendencioso da Estatística para corroborar
teses interesseiras.
• A definição de população ou universo estatístico e a definição de
amostra.
• A importância da realização do processo de amostragem de
maneira independente e livre de vícios.
• Três diferentes procedimentos de amostragem: AAS, AS e AE.
• A definição de variável em um fenômeno aleatório.
• A classificação das variáveis aleatórias como qualitativas nominais
ou ordinais ou como quantitativas discretas ou contínuas.
• Os benefícios e possibilidades do uso das ferramentas digitais
para fins estatísticos.
Referências bibliográficas
LANDEIRO, Victor Lemes. Introdução ao uso do programa R. Manaus:
Instituto Nacional de Pesquisas da Amazônia, 4 mar. 2011. Disponível
em: <https://cran.r-project.org/doc/contrib/Landeiro-Introducao.pdf>.
Acesso em: 2017.

LEVINE, David M. Estatística: teoria e aplicações: usando Microsoft Excel


em português. 5. ed. Rio de Janeiro: LTC Ed., 2008. 752 p.

SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de Estatística. Disponível em:


<http://www.inf.ufsc.br/~paulo.s.borges/Download/Apostila5_INE5102_
Quimica.pdf>. Acesso em: 2017.
Unidade 4
Medidas de assimetria

Para iniciar seus estudos


4
Caro(a) estudante, nesta unidade finalizaremos o tópico da análise explo-
ratória de dados. Até agora vimos como interpretar os dados por meio de
gráficos e aprendemos a construir a sua distribuição de frequências e a
escolher representantes para esses valores (medidas de posição, de sepa-
ratrizes e de dispersão). Na Unidade 4 analisaremos a simetria de um con-
junto de dados, já que apenas a média e a variância podem não ser precisos
sobre a distribuição dos dados quando eles não se distribuem simetrica-
mente. Apesar disso, já percebemos na unidade anterior que a mediana
é uma medida que colabora na análise sobre a simetria dos dados. Agora
vamos generalizar a noção de mediana e veremos como isso pode colabo-
rar na análise da simetria. Além disso, conheceremos um tipo de diagrama
que ajuda a visualizar essa simetria: o box plot. Enfim, vamos aos estudos!

Objetivos de Aprendizagem

• Definir quantis, apresentando os principais quantis utilizados; ana-


lisar e elaborar box plots; definir assimetria à direita e à esquerda;
analisar a simetria de dados a partir de gráficos de simetria.

76
Estatística | Unidade 4 - Medidas de assimetria

4.1 O box plot


O box plot, que também é chamado de diagrama de caixa, ou diagrama de caixa e bigodes, é um diagrama que
ajuda a verificar a existência de simetria em um conjunto de dados. Ele é desenhado esquematicamente utili-
zando como parâmetros os quartis definidos na seção anterior.
Para descrever um box plot, vamos precisar definir o que é um limite inferior (LI) e um limite superior (LS) nesse
contexto. Seja A um conjunto de dados com n elementos ordenados de forma crescente que tenha como valor
mínimo o número x1, como valor máximo o número xn e como quartis os números q1, q2 e q3. Definimos:

Sabendo dessas definições, podemos descrever a construção do box plot do conjunto de números X da seguinte
forma:
• Estabelece-se uma régua de escala vertical à esquerda do diagrama contendo a maior parte dos elemen-
tos de X;
• Cria-se um retângulo cujos lados horizontais estejam alinhados aos pontos da régua que marcam q1 e q2;
• Cria-se um retângulo de mesma largura e alinhado ao retângulo anterior tendo lados horizontais na
altura dos pontos da régua que indicam q2 e q3;
• Faz-se um segmento de reta partindo do meio do segmento desenhado na altura de q3 e chegando até LS;
• Faz-se um segmento de reta vertical partindo do meio do segmento desenhado na altura de q1 e che-
gando até LI;
• Na altura de LS e LI traça-se um pequeno segmento cujos pontos médios estejam sobre o fim dos seg-
mentos desenhados anteriormente.

77
Estatística | Unidade 4 - Medidas de assimetria

Figura 4.1 - Exemplo de box plot

Legenda: Exemplo de um box plot genérico, construído conforme indicam os passos acima.
Fonte: Elaboração própria (2017). Box plot gerado pelo software R.

A seguir vamos ver alguns exemplos do que foi dito até aqui para facilitar a compreensão de como é desenhado
um box plot:
1o Exemplo: Considere o conjunto X dado pelos números ordenados abaixo:
3 5 6 7 9 11 13
O 1º Quartil é dado por

;
o 2º Quartil (mediana) é dado por

;
e o 3º Quartil é dado por

.
O valor mínimo de X é x1 = 3, o valor máximo é x7 = 13 e os quartis são q1 = 5, q2 = 7 e q3 = 11. Logo,

78
Estatística | Unidade 4 - Medidas de assimetria

Dessa forma, devemos construir retângulos cujos lados horizontais estejam na reta das coordenadas 5 e 7, e 7 e
11. Um dos segmentos verticais deve ir de 11 a 13 e o outro de 5 a 3. Portanto, o box plot fica conforme a figura
a seguir:

Figura 4.2 - Box plot do 1o exemplo

Legenda: Diagrama correspondente à construção do primeiro exemplo.


Fonte: Site Alcula (2017).

79
Estatística | Unidade 4 - Medidas de assimetria

2o Exemplo: Vamos considerar que a tabela abaixo contenha a temperatura média nos primeiros catorze dias de
fevereiro em uma determinada cidade:

Tabela 4.1 - Temperaturas médias em uma cidade

Dia Temperatura
1 32 °C
2 31 °C
3 30 °C
4 32 °C
5 31 °C
6 29 °C
7 31 °C
8 33 °C
9 34 °C
10 35 °C
11 33 °C
12 32 °C
13 34 °C
14 33 °C
Legenda: Temperaturas médias na primeira quinzena de fevereiro em uma determinada cidade (valores hipotéticos).
Fonte: Elaboração própria (2017).

Se colocarmos as temperaturas da tabela 4.1 de maneira ordenada, temos a seguinte sequência:


29 30 31 31 31 32 32
32 33 33 33 34 34 35
Vamos agora calcular os quartis desse conjunto de temperaturas:

q3 = x[10,5]+1 = x 11 = 33

O valor mínimo de X é x1 = 29. O valor máximo de X é x14 = 35. Como vimos, os quartis são q1 = 31, q2 = 32 e q3 = 33.
Então:

80
Estatística | Unidade 4 - Medidas de assimetria

Portanto, os retângulos devem ter extremos em 31 e 32, e em 32 e 33. Por sua vez, os segmentos que partem dos
retângulos devem ir até os pontos 29 e 35. Dessa forma, podemos desenhar o box plot conforme a figura seguinte:

Figura 4.3 - Box plot do 2o exemplo

Legenda: O diagrama corresponde à construção realizada no 2o exemplo.


Fonte: Diagrama obtido no software R (2017).

A diferença de definições de quartis utilizadas pelos softwares estatísticos pode causar dife-
renças nos box plots gerados por eles. Por isso, não estranhe se um box plot obtido por você com
base nas definições dessa unidade for diferente do box plot gerado por um software estatístico.

81
Estatística | Unidade 4 - Medidas de assimetria

3o Exemplo: Vamos trabalhar com a lista abaixo, contendo o salário recebido e o número de filhos dos 15 funcio-
nários de uma empresa.

Tabela 4.2 - Lista de funcionários de uma empresa

Funcionário Salário (em R$) Número de filhos


1 2500 2
2 2000 1
3 1152 2
4 1268 0
5 1021 3
6 1118 0
7 1280 1
8 1059 1
9 1050 1
10 1097 7
11 1104 2
12 1141 0
13 1194 2
14 1212 2
15 1132 1
Legenda: A tabela contém o salário e o número de filhos dos quinze funcionários de uma empresa (dados fictícios).
Fonte: Elaboração própria (2017).

Vamos construir o box plot referente à variável contínua “Salário” dos funcionários da tabela 4.2. Primeiramente,
temos de ordenar crescentemente os dados obtidos na tabela para essa variável:
1021 1050 1059 1097 1104 1118 1132 1141
1152 1194 1212 1268 1280 2000 2500
Como há n = 15 elementos no conjunto acima, a mediana é o 8º número: q2 = 1141. Calculando os outros quartis,
temos q1 = 1097 e q3 = 1268. Além disso,

82
Estatística | Unidade 4 - Medidas de assimetria

Assim, o box plot pode ser representado conforme a figura abaixo:

Figura 4.4 - Box plot da variável “Salário” da tabela 4.3.

Legenda: Box plot referente à variável “Salário” da situação tratada no 3o exemplo.


Fonte: Diagrama obtido no site Alcula (2017).

Observe no box plot da figura anterior que existem dois pontos fora das caixas (os retângulos) e das caudas
(segmentos originários nas caixas e com outro extremo em LI ou LS). Esses dois pontos são chamados outliers ou
valores atípicos, pois são pontos do conjunto de dados que destoam dos outros elementos do conjunto.

Enquanto a média da variável “Salário” da tabela 4.2 é R$ 1.289,14, a mediana é R$ 1.141,00.


Note no conjunto de dados, porém, que apenas os outliers têm salários maiores que a média.
Isso ocorre porque a média é muito afetada pelos valores extremos. No entanto, a mediana
tem “o poder” de não sofrer essa interferência. Por isso, a mediana é uma medida mais realista
do que a média para amostras com valores atípicos, e por isso costuma ser qualificada como
uma medida resistente.

83
Estatística | Unidade 4 - Medidas de assimetria

Encontre os quartis, LI e LS dos valores obtidos pela variável “Número de filhos” na tabela 4.2.
Posteriormente, esboce à mão o box plot dessa variável.

4.2 Simetria e assimetria


Podemos dizer que simetria é algo que pode ser dividido em partes iguais de formas e tamanhos. Quando fala-
mos de curvas, elas são consideradas simétricas quando existe uma exata e perfeita repartição de valores em
torno de um eixo. Já para uma distribuição de frequências, a repartição de valores tem de estar em torno de um
ponto central. Quando esse ponto central coincidir com a moda, a mediana e a média, dizemos que ela é simé-
trica. Quando os valores dessas medidas ficarem acima ou abaixo de ponto central, dizemos que a curva ou a
distribuição é assimétrica.
Em seguida vamos classificar a simetria em relação à moda, à mediana e à média:

Figura 4.5 – Simétrica

Legenda: Simétrica

Fonte: Elaboração própria (2017).

84
Estatística | Unidade 4 - Medidas de assimetria

Figura 4.6 – Assimetria à esquerda (Negativa)

Legenda: Assimetria
Fonte: Elaboração própria (2017).

Figura 4.7 – Assimetria à direita Positiva)

Legenda: Assimetria

Fonte: Elaboração própria (2017).

4.2.1 Coeficiente de Assimetria

O grau de assimetria de uma curva se dá pela análise do valor do coeficiente de assimetria. Esse grau pode ser cal-
culado de várias maneiras. Aqui você aprenderá o Coeficiente de Assimetria de Pearson. A análise do grau de assi-
metria da curva de uma distribuição é importante na escolha do método estatístico correto para análise dos dados.
O coeficiente de simetria de Peason A é calculado por:

sendo

85
Estatística | Unidade 4 - Medidas de assimetria

De acordo com os valores obtidos de A, temos a classificação do grau de simetria:


Se A = 0 → Temos distribuição Simétrica;
Se A < 0 → Temos distribuição Assimétrica à esquerda (negativa);
Se A > 0 → Temos distribuição Assimétrica à direita (positiva).
Uma vez identificada a simetria e o calculado de seu coeficiente, podemos classificá-la como fraca, forte e mode-
rada, ou seja:
A distribuição terá assimetria fraca se: 0 < |A| < 0,15; terá assimetria moderada se: 0,15 < |A| < 1 e terá assimetria
forte se: |A| > 1.
Também temos a análise de simetria quando comparamos elementos de um conjunto e seu histograma. Pode-
mos dizer que um conjunto de dados costuma ser simétrico se seu histograma for uma figura simétrica. Caso
contrário, esse conjunto é entendido como assimétrico. O uso de quartis ganha destaque quando o objetivo é
verificar a simetria de um conjunto de dados. Na prática, um conjunto de dados pode ser entendido simétrico
quando:
• a dispersão inferior for aproximadamente igual à dispersão superior; (Lembre-se de que tanto a dispersão
inferior como a superior se referem à quantidade de elementos antes e após a mediana, respectivamente;
• a mediana for aproximadamente igual à média aritmética da distância interquartil;
• a distância entre a mediana e os outros quartis for menor que a distância entre os extremos e os quartis.

Figura 4.8 - Esquema de uma distribuição de dados simétrica

Legenda: Desenho esquemático de uma distribuição de dados que pode ser con-
siderada simétrica segundo os tópicos acima.
Fonte: Elaboração própria (2017).

Outra forma de verificar se um conjunto de dados tem uma distribuição simétrica é observar seu box plot. Caso
as duas caixas tenham aproximadamente a mesma altura e a mediana esteja aproximadamente no ponto médio
entre os pontos LI e LS, há bons indícios para se concluir que os dados são simétricos. Note, por exemplo, que o
conjunto X do 2o exemplo pode ser considerado simétrico. Basta observar seu box splot na figura 4.3 e notar a
simetria.
Além disso, é possível perceber assimetria num conjunto de dados quando sua média tem um valor muito dife-
rente da mediana. Nesse caso, observamos que a média foi afetada pela existência de valores atípicos.

86
Estatística | Unidade 4 - Medidas de assimetria

Quando um conjunto de dados é assimétrico, podemos classificar a assimetria de duas formas: à esquerda e à
direita. Dizemos que a assimetria de um conjunto de dados é à esquerda (ou negativa) se a maior parte dos dados
do conjunto se concentra à direita. Por sua vez, dizemos que a assimetria é à direita (ou positiva) se a maior parte
dos dados está à esquerda. As figuras a seguir ajudam na compreensão desses conceitos:

Figura 4.9 - Assimetria à esquerda

Legenda: Distribuição de um histograma assimétrica à esquerda, evidenciada pelo traço em vermelho.


Fonte: Histograma obtido no software R. Elaboração própria (2017).

87
Estatística | Unidade 4 - Medidas de assimetria

Figura 4.10 - Assimetria à direita

Legenda: Distribuição de um histograma assimétrica à direita, evidenciada pelo traço em vermelho.


Fonte: Histograma obtido no software R. Elaboração própria (2017).

4o Exemplo: Considere que a tabela a seguir contém a densidade demográfica de dez países africanos:

Tabela 4.3 - Densidade demográfica de alguns países africanos

País Densidade demográfica aproximada (em hab/km²).


África do Sul 45
Egito 91
Etiópia 99
Gana 120
Libéria 47
Mali 14
Marrocos 77
Moçambique 36
Nigéria 200
Sudão 23
Legenda: Densidade demográfica aproximada de dez países africanos
Fonte: Site do IBGE (2017).

88
Estatística | Unidade 4 - Medidas de assimetria

Vamos agora analisar a simetria dos dados da variável “Densidade demográfica” que consta na tabela 4.3. Para
isso, precisamos obter o histograma dessa variável:

Figura 4.11 - Histograma da variável “Densidade demográfica” na tabela

Legenda: Histograma da variável “Densidade demográfica” na tabela 4.3.


Fonte: Diagrama obtido no software R (2017).

Observe na figura que o histograma da variável “Densidade demográfica” tem a maior parte dos seus dados con-
centrados à esquerda, abaixo de 100 hab/km². Isso significa que os dados da variável têm distribuição assimétrica
à direita. Isso pode ser evidenciado pelo box plot da variável, pois nesse diagrama observamos que a cauda e a
caixa superiores são muito maiores do que a cauda e a caixa inferiores:

89
Estatística | Unidade 4 - Medidas de assimetria

Figura 4.12 - Box plot da variável “Densidade demográfica” na tabela 4.3

Legenda: Box plot da variável “Densidade demográfica” na tabela 4.3.


Fonte: Diagrama obtido no site Alcula (2017).

Para finalizar esta seção, vamos aprender a construir os gráficos de simetria, que constituem outra ferramenta
para analisar a simetria na distribuição de um conjunto de dados. Seja X um conjunto de dados formado pelos
elementos:

Seja q2 a mediana do conjunto X. Defina e , para (se n é par)

ou (se n é ímpar). O gráfico formado pelos pares ordenados (ui, vi) é chamado gráfico de sime-

tria. Quanto mais próximos os pontos (ui, vi) estiverem da reta diagonal v = u, mais simétrico é o gráfico.

90
Estatística | Unidade 4 - Medidas de assimetria

5o Exemplo: Vamos construir o gráfico de simetria da variável “Densidade demográfica” da Tabela 4.3. Pondo
os dados em ordem, obtemos: x1 = 14, x2 = 23, x3 = 36, ..., x10 = 200. Logo, os pares ,
para , são: . Logo, o gráfico de simetria é dado por esses pontos,
conforme a figura a seguir:

Figura 4.13 - Gráfico de simetria de “Densidade demográfica” da Tabela 4.3

Legenda: Os cinco pontos referem-se aos pares ordenados (ui,vi). Note o quão dis-
tante eles estão da reta v = u. Apenas um dos cinco pontos está sobre a reta.
Fonte: Gráfico elaborado no software Winplot (2017).

Podemos dizer, com base na figura anterior, que a informação de que a distribuição da variável “Densidade demo-
gráfica” é assimétrica à direita, já que a maior parte dos pontos encontra-se acima da reta diagonal.
6o Exemplo: Vamos construir o gráfico de simetria da variável “Temperatura” na tabela 4.2. Neste caso, os pares
(ui,vi), com i = 1,2,3,4,5,6 são dados por:
(3,3), (2,2), (1,2), (1,1), (1,1), (0,1), (0,0).

91
Estatística | Unidade 4 - Medidas de assimetria

Note que apenas dois pontos não estão sobre a reta v = u: (1,2) e (0,1). Isso garante que o conjunto de dados pode
ser considerado (quase) simétrico. Observe o gráfico na figura a seguir:

Figura 4.14 - Gráfico de simetria da variável “Temperatura” da tabela 4.2.

Legenda: Os sete pontos referem-se aos pares ordenados (ui,vi). Note que apenas dois pontos não
estão sobre a reta v = u demarcada, o que indica que o conjunto de dados é quase simétrico.
Fonte: Gráfico elaborado no software Winplot (2017).

Verifique se o conjunto X do 1o exemplo é simétrico, assimétrico à direita ou assimétrico à


esquerda. Justifique sua análise construindo o histograma de X, o box plot de X e o gráfico de
simetria de X.

92
Considerações finais
Nesta unidade finalizamos nossos estudos sobre análise exploratória de
dados aprendendo como verificar a simetria ou assimetria de um con-
junto. Vimos:
• As definições dos quartis, do limitante inferior (LI) e do limitante
superior (LS).
• As definições de distância interquartil, dispersão inferior e disper-
são superior.
• O que é e como construir um box plot.
• As definições de caixa, cauda e outliers (valores atípicos) em um
box plot.
• As noções de simetria, assimetria à direita e assimetria à esquerda
em um conjunto de dados.
• O que é e como construir um gráfico de simetria.
• Como verificar se um conjunto de dados é simétrico ou assimé-
trico utilizando histograma, box splot ou gráfico de simetria.

93
Referências bibliográficas
AUCULA. Statistics Calculator: Box Plot. Disponível em: <http://www.
alcula.com/calculators/statistics/box-plot/>. Acesso em: 18 fev. 2017.

BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 7. ed. São Paulo:


Saraiva, 2012. 540 p.

IBGE. Instituto Brasileiro de Geografia e Estatística. Disponível em: <http://


www.ibge.gov.br/home/>. Acesso em: 24 mai. 2017.

MARTINS, E. G. Quantis. Disponível em: <http://wikiciencias.casadas-


ciencias.org/wiki/index.php/Quantis>. Acesso em: 17 fev. 2017.

SILVA, B. F.; DINIZ, J.; BORTOLUZZI, M. A. Minicurso de Estatística Básica:


Introdução ao software R. Disponível em: <http://www.uft.edu.br/engam-
biental/prof/catalunha/arquivos/r/r_bruno.pdf>. Acesso em: 17 fev. 2017.

TRIOLA, M. F. Introdução à estatística. 10. ed. Rio de Janeiro: LTC Ed.,


2008. 696 p.

94
Estatística
Estatística

1ª edição
2017
Palavras do professor
Caro(a) aluno(a), você já notou o quanto as coisas são imprevisíveis na
nossa vida? Por mais detalhistas e planejadores que tentemos ser, certas
situações acabam fugindo do nosso controle. Não são raros os relatos
de pessoas que planejam ir para a praia em determinados períodos e
locais onde a chance de chuva é pequena, mas voltam frustradas de sua
viagem porque quase não viram a cor do sol durante sua estada a beira-
-mar.
Situações como a relatada são típicas do mundo imprevisível e caótico
em que vivemos. Há situações que podemos afirmar de maneira precisa
que ocorrerão, mas há tantas outras cuja ocorrência pode no máximo
ser prevista. Por exemplo, ao ver um fruto pendurado em uma árvore,
é possível afirmar que um dia ele sairá de lá (ou cairá ou alguém o irá
arrancar). No entanto, saber qual será esse dia já é uma pergunta que
não sabemos responder, apesar de às vezes conseguirmos prever (a
menos que queiramos interferir e ir arrancar o fruto da árvore hoje!).
É para ajudar a entender como funcionam essas situações aleatórias que
existe a Estatística. Fazer previsões parece coisa de vidente. No entanto,
todos nós podemos ser um pouco “videntes” se soubermos usar a Esta-
tística e tivermos dados suficientes para analisar.
O objetivo desta disciplina é compreender o uso prático da Estatística
na análise de fenômenos reais que nos envolvem, saber calcular alguns
parâmetros e medidas que ajudam a entender os resultados de uma
pesquisa realizada com base em um conjunto de elementos (amostra) -
tais como as medidas de posição, de dispersão e de assimetria, elaborar
e analisar tabelas e gráficos e entender os conceitos de probabilidades e
alguns de seus principais modelos.
Nosso estudo será dividido em duas partes, cada uma com quatro unida-
des. Na primeira parte estudaremos como fazer a análise exploratória de
um conjunto de dados: amostragem, distribuição de frequências, gráfi-
cos, medidas de posição, medidas de dispersão e medidas de assimetria.
Na segunda parte entenderemos os conceitos principais de probabilida-
des e conheceremos dois tipos de distribuições aleatórias. Nessa última

98
Palavras do professor
parte estudaremos as probabilidades e suas propriedades, as variáveis
aleatórias discretas e contínuas, o modelo binomial e o modelo normal.
A disciplina também oferta um grande desafio a você, apresentado em
forma de tarefas a serem cumpridas articulando teoria com a prática
contextualizada. O primeiro desafio será organizar-se em pequenos gru-
pos de 3 a 4 alunos e dividir proporcionalmente as tarefas apresentadas
em cada unidade. No fórum você terá os detalhes do desafio. Acesse!
Esperamos que você percorra esse caminho do aprendizado da Estatís-
tica com foco nos objetivos e alegria nos olhos.
Bons estudos!

99
Unidade 5
Probabilidades

Para iniciar seus estudos


5
Enfim chegamos à metade do nosso curso! Esperamos que até aqui já
tenha valido a pena o sacrifício ao qual você se dispôs quando iniciou
seus estudos. Nas primeiras quatro unidades vimos como analisar dados
em uma amostra. Agora, na segunda metade do curso, vamos para outro
ramo da Estatística, o das probabilidades. Possivelmente você já teve
contato com elas no seu Ensino Médio. Nesta unidade 5 retomaremos os
principais conceitos envolvendo probabilidades, muitos dos quais você
já deve estar familiarizado (mesmo que não esteja, não se preocupe!
Suporemos que você nunca tenha tido contato com o assunto). Veremos
nas unidades seguintes que há modelos probabilísticos que podem ser
adequados para situações reais tratadas pela Estatística. Aperte o cinto.
Vamos viajar para o mundo das probabilidades!

Objetivos de Aprendizagem

• Definir espaço amostral, evento e probabilidade.


• Entender as principais propriedades das probabilidades.
• Definir probabilidade condicional.
• Definir e compreender o significado de independência de pro-
babilidades.

100
Estatística | Unidade 5 - Probabilidades

5.1 Espaço amostral e eventos


A definição de probabilidade é simples, mas depende dos conceitos de espaço amostral e evento. Por isso, esta
seção será dedicada a entendê-los. Iremos agora recapitular algumas noções básicas envolvendo a teoria de
conjuntos, que possivelmente você estudou no seu Ensino Médio. Vamos lá!
Qualquer coleção de objetos (números, nomes, coisas, etc.) é denominada conjunto, o qual geralmente é deno-
tado por uma letra maiúscula (A, B, E, F, X, Y, etc.). Os objetos dentro de um conjunto são chamados de elementos
e são denotados por letras minúsculas (a, b, x, etc.). Dado um conjunto, qualquer coleção dentro dele (ou seja,
contendo elementos desse conjunto) é chamada de subconjunto.
Se B é um subconjunto de A, denotamos B ⊂ A. Note que A ⊂ A Um conjunto não contendo elementos é cha-
mado conjunto vazio e costuma ser denotado por ∅ Note que ∅ ⊂ A, para qualquer conjunto A.
Há um diagrama muito comum no estudo da teoria de conjuntos: o diagrama de Venn. Tal figura consiste de um
retângulo, representando um conjunto U (chamado conjunto universo), dentro do qual inserem-se elipses ou
círculos, representando subconjuntos desse conjunto U.

Figura 5.1 - Diagrama de Venn

Legenda: Na figura está representado um conjunto universo e dois de seus subconjuntos: A ⊂ U e B ⊂ U.


Fonte: Elaboração própria.

Existem algumas operações envolvendo conjuntos que merecem destaque, pois serão frequentemente conside-
radas em nosso estudo. Sejam e dois conjuntos. Chamamos de união de A e B ao conjunto.

Contendo os elementos que estão em ao menos um dos conjuntos e . Chamamos de intersecção de A e B ao


conjunto.

Contendo os elementos que estão em ambos os conjuntos A e B. Por fim, chamamos de complemento de A com
relação a B ao conjunto.

101
Estatística | Unidade 5 - Probabilidades

Contendo os elementos de B que não estão em A. Se A é um subconjunto de um conjunto U, então podemos


denotar CUA simplesmente por AC, quando não houver risco de confusão (o conceito de AC está relacionado com
a negação do conjunto A, ou seja, ou um elemento está em A ou em AC ). Vale observar que se AC = X então XC =A.
A figura abaixo apresenta diagramas de Venn representando cada uma das definições dadas acima:

Figura 5.2 - Diagrama de Venn da união, intersecção e complemento de conjuntos

Legenda: (a) O tom acinzentado representa A ∪ B (b) O tom acinzentado representa A ∩ B


(c) O tom acinzentado representa CBA (d) O tom acinzentado representa AC
Fonte: Elaboração própria.

De posse desses conceitos, podemos agora definir os conceitos principais desta seção, iniciando pela definição
de espaço amostral:
Definição 5.1: Chamamos de espaço amostral de um experimento aleatório ao conjunto de todas as possibili-
dades de ocorrência desse experimento, ao qual denotamos por Ω (a letra grega maiúscula ômega).
Exemplo 5.1: O lançamento de um dado convencional e a verificação da face voltada para cima consiste em um
experimento aleatório. Nesse caso, o espaço amostral é composto pelos números de todas as suas faces, isto é,
Ω = {1,2,3,4,5,6}.
Exemplo 5.2: Considere o experimento aleatório consistindo do lançamento de uma moeda e a verificação da
face voltada para cima. Neste caso, o espaço amostral tem apenas dois elementos, cara e coroa, os quais deno-
taremos por K e C, respectivamente.
Assim, Ω = {K,C}.
Exemplo 5.3: Ao invés de lançarmos um dado apenas uma vez, poderíamos querer analisar os resultados de dois
lançamentos do dado consecutivamente. Para representar os elementos do espaço amostral deste experimento
precisaremos recorrer aos pares ordenados (x,y), onde x representa o resultado do dado no primeiro lançamento
e y representa o lançamento do dado no segundo lançamento. Portanto, todas as combinações possíveis de
pares ordenados com números inteiros entre 1 e 6 compõem o espaço amostral deste experimento, isto é:
Ω = {(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),
(4,2),(4,3),(4,4),(4,5),(4,6), (5,1),(5,2),(5,3),(5,4),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)}.
Exemplo 5.4: Ao invés de verificar o resultado do lançamento de uma moeda apenas uma vez, podemos analisar
o experimento que verifica o resultado no lançamento de uma moeda 3 vezes seguidas. Neste caso continuamos
usando coordenadas para representar os resultados, mas, para facilitar a notação, não utilizaremos vírgula. Por-

102
Estatística | Unidade 5 - Probabilidades

tanto, o resultado KCK significa cara no primeiro lançamento, coroa no segundo e cara no terceiro. Dessa forma,
o espaço amostral deste experimento é dado pelo seguinte conjunto:
Ω = {KKK, KKC, KCK, CKK, KCC, CKC, CCK, CCC}
Exemplo 5.5: Considere o experimento aleatório que avalia quantos parafusos defeituosos foram produzidos
por uma fábrica em um dia. Sendo N o número total de parafusos produzidos pela fábrica naquele dia, então o
espaço amostral deste experimento é
Ω = {0,1,2,..., N}
O valor 0 significa que não houve parafusos defeituosos, o número 1 significa que houve apenas um parafuso
defeituoso, assim por diante.
Exemplo 5.6: Considere o experimento aleatório que verifica a altura máxima atingida por uma bola após o chute
dela por um jogador de futebol. Assim, o espaço amostral deve ser um intervalo real, já que a variável é contínua:
Ω = [0, + ∞ [.
Note que os valores de Ω são as alturas atingidas pela bola, em metros, após o chute. Note que o valor 0 ocorre
quando a bola não sai do chance. Naturalmente não há valores negativos, já que podemos supor que o campo
de futebol é plano.
Exemplo 5.7: Uma urna contém 10 bolas, sendo 3 azuis (A), 5 vermelhas (V) e 2 brancas (B). Um experimento
consiste em retirar três bolas sem reposição da urna. Assim, o espaço amostral desta situação pode ser dado por
Ω = {AAA, AAV, AVV, VVV, AAB, ABB, VVB, VBB, AVB}
em que cada “palavra” XYZ significa que foram retiradas 3 bolas, uma da cor X, uma da cor Y e outra da cor Z,
não necessariamente nessa ordem. Por exemplo, VVB significa que foram retiradas duas bolas vermelhas e uma
branca, mas isso não impede que a bola branca tenha sido a primeira retirada.
Agora que vimos os exemplos e entendemos o que é um espaço amostral, vamos aprender a definição de evento:
Definição 5.2: Seja Ω o espaço amostral de um determinado experimento aleatório. Chamamos de evento a
qualquer subconjunto E ⊂ Ω.
Geralmente, os eventos são descritos por alguma característica ou condição que se deseja verificar dentro da
amostra. No entanto, a definição em termos da teoria de conjuntos nos deixa claro que essas características e
condições literais devem ser convertidas em informações numéricas.
Exemplo 5.8: Considere o experimento do lançamento de um dado convencional, no exemplo 5.1. Considere o
evento “observar número par”. Em termos de conjunto, E = {2,4,6} ⊂ Ω.

Exemplo 5.9: Considere o experimento do exemplo 5.4. A seguir, vamos descrever vários eventos que podemos
observar neste experimento:
• O evento “observar ao menos duas caras” pode ser representado pelo conjunto A = {KKC, KCK, CKK,
KKK} ⊂ Ω.
• O evento “não observar caras” consiste em apenas um elemento: B = {CCC}.
• O evento “retirar ao menos uma cara e ao menos uma coroa” corresponde ao conjunto C = {KKC, KCK,
CKK, KCC, CKC, CCK}.

103
Estatística | Unidade 5 - Probabilidades

• O evento “retirar quatro caras” soa estranho, porque só lançamos a moeda três vezes neste exemplo. De
fato, KKK não pertence ao espaço amostral Ω. Logo, tal evento não pode ocorrer. Isso significa que ao
evento “retirar quatro caras” corresponde o conjunto vazio, ∅.
• O evento “retirar três faces quaisquer” também pode soar estranho por ser óbvio que sempre vai ocorrer.
De fato, o conjunto que representa este evento é Ω, o próprio espaço amostral.

O evento ∅ é chamado evento impossível, enquanto o evento Ω (que é o espaço amostral)


é chamado evento certo.

Exemplo 5.10: Considere o experimento aleatório do exemplo 5.6, referente à altura máxima atingida por uma
bola de futebol chutada por um jogador. O evento A referente a “atingir altura maior do que 3 metros” é dado por
A = ]3, + ∞ [. Por sua vez, o evento B referente a “atingir altura entre 2 e 5 metros” é representado por um intervalo
fechado, B = [2.5].

Imagine um experimento aleatório contínuo. Posteriormente, descreva seu espaço amostral


e defina ao menos três eventos interessantes desse experimento.

104
Estatística | Unidade 5 - Probabilidades

5.2 Análise Combinatória
A análise combinatória é parte da matemática que se preocupa na representação de
possibilidades de ocorrência de certa variável sem que seja necessário desenvolver cada uma delas.
Acompanhe o exemplo onde iremos mostrar seus agrupamentos. Seja o conjunto de quatro algarismos A =
{1,2,3,4}. Necessitamos saber qual a quantidade de números de três algarismos que conseguiremos formar ape-
nas com os elementos do conjunto A, sendo eles, números naturais.
Temos então que juntar ou formar o maior número de agrupamentos de três algarismo.
Sem a utilização de fórmulas, poderíamos preceder da seguinte maneira:

Nesse esquema observamos que foi possível formar 24 agrupamentos de 3 algarismos cada utilizando apenas
os algarismos 1,2,3 e 4.
É lógico que existe uma fórmula dentro da análise combinatória que nos possibilite saber essa quantidade sem
necessitar abrir todo um esquema como esse.
Vamos então explorar cada um de seus cinco tópicos de estudo:

5.2.1. Princípio fundamental da contagem

105
Estatística | Unidade 5 - Probabilidades

Definição 5.3: Esse princípio evidencia que se um evento que ocorre em n situações sucessivas e independentes,
e, sendo a primeira situação ocorrendo de m1 formas, a segunda de m2 formas, a terceira situação ocorrendo de
m3 formas e assim sucessivamente até a n - ésima forma ocorrendo de mn formas, temos que a quantidade total
de situações que ocorrem desse evento é dado por:
m1. m2. m3. ... mn
Exemplo 5.11 Vamos determinar quantos múltiplos de 5 podemos formar com números naturais de dois alga-
rismos.
Os números naturais se iniciam por zero, porém, ele a esquerda não nos resultará um número com dois algaris-
mos portanto, esses números devem começar não com zero, e sim com os outros, ou seja, 1,2,3,4,5,6,7,8 e 9.
Temos portanto nove possibilidades no início. E, para que o número seja múltiplo de 5, sabemos que ele dever ter-
minar ou em zero ou em 5, certo? Temos aqui duas possibilidades. Ao multiplicarmos essas duas possibilidades, 9
e 2, obteremos o resultado dos números múltiplos de cinco com dois algarismos existentes. 18 é nosso número.
Exemplo 5.12 Suponha que voce possua 5 pares de tênis e 12 pares de meias e deseja saber de quantas formas
diferentes poderá utilizar um par de tênis ou um par de meias. Usando o raciocínio do princípio de contagem,
devemos multiplicar a quantidade de tênis pela quantidade de meias. Isso nos dará o resultado pretendido. Por-
tanto, dispomos de 60 maneiras diferentes de usar um par de tênis com um par meias.

5.2.2. Permutação simples

Definição 5.4: A permutação simples determina a quantidade de formas ou agrupamentos possíveis entre certo
número de objetos ou coisas, de forma que a diferença entre cada grupo seja apenas pela mudança de posição
de seus objetos. Quando apenas essa diferença existe, calculamos por:
Pn = n!, onde
Pn significa permutação simples de n elementos distintos
Exemplo 5.13 Suponha que tenha cinco livros diferentes e deseje saber de quantas formas eles podem ser empi-
lhados. Como não importa a posição de cada livro, temos um caso de permutação simples.
P5 = 5! = 5.4.3.2.1 =120
Portanto, você poderá empilhar seus cinco livros de 120 formas diferentes.
Exemplo 5.14. Um anagrama é uma palavra ou frase formada com todas as letras de uma outra palavra. Na
maioria dos casos, as palavras resultantes não têm significado. Ciente disso, determine quantos anagramas
poderemos formar com a palavra ROMA?
Lembrando que ordem ou a posição das letras da palavra ROMA não interessa, então seu cálculo é dado por:
P4 = 4! = 4.3.2.1 =24
Portanto, podemos formar 24 anagramas com a palavra ROMA.

5.2.3. Permutação com repetição

106
Estatística | Unidade 5 - Probabilidades

Definição 5.5: A permutação com repetição determina a quantidade de formas ou agrupamentos possíveis entre
certo número de objetos ou coisas, onde um deles aparece mais de uma vez, de forma que a diferença entre cada
grupo seja apenas pela mudança de posição de seus objetos. Quando encontramos um ou mais elementos que
surgem mais de uma vez entre os objetos ou coisas analisadas, entendemos que estamos diante de um caso de
permutação com elementos repetidos ou simplesmente permutação com repetição.
Matematicamente, podemos entender:
Se em um conjunto analisado, certo elemento aparece a vezes, outro elemento b vezes, e outros também suces-
sivamente, a quantidade total de permutações que podemos ter é dada por:

Exemplo 5.15. Determine quantos anagramas são possíveis na palavra ARARA.


Percebemos que a letra A se repete tres vezes e a letra R, duas vezes. Através da fórmula temos:

Portanto, são possíveis escrever 10 anagramas com a palavra ARARA.


Exemplo 5.16. Suponha que possua uma coleção de bolinhas de vidro onde, 4 delas são leitosas, 3 pretas, 2
brancas e a última de ferro. Voce pretende agrupá-las sobre uma placa para apresentação. Determine quantas
maneiras poderá organiza-las?
Temos um total de dez bolinhas de vidro com quatro cores diferentes. De acordo com a quantidade de cores
repetidas temos:

Portanto, poderei organizá-las de 12600 maneiras diferentes.

5.2.4. Arranjo Simples

107
Estatística | Unidade 5 - Probabilidades

Definição 5.6: Quando a ordem ou a posição dos elementos verificados importa, estamos diante de um caso de
Arranjo Simples. É o caso de campeonatos, competições, torneios, etc, onde ser o primeiro colocado é diferente
do segundo e vice versa. Matematicamente escrevemos:
Se tivermos n elementos diferentes agrupados p a p elementos, o cálculo desse arranjo será dado por:

Exemplo 5.17. Em um campeonato de futebol com 20 times, qual seria o número total de possibilidades para os
três primeiros colocados?
Aqui temos 20 times que se agruparão 3 a 3. Então pela fórmula temos:

Portanto, poderíamos ter 6840 possibilidades para os três primeiros colocados.


Exemplo 5.18. Em um torneio de futebol de 8 times, quantos jogos podem ser realizados no turno e returno do
torneio? Turno e returno significa que as partidas de ida são diferentes da volta.

Portanto, teríamos 56 partidas nesse torneio.

5.2.5. Combinação Simples

Quando a ordem ou a posição dos elementos verificados não importa. São exemplos grupos de crianças numa
excursão, grupo de cursos a estudar, etc, onde a ordem ou a posição não interessam. Estamos diante de uma
Combinação Simples. Matematicamente escrevemos:
Se tivermos n elementos diferentes agrupados p a p elementos, o cálculo dessa Combinação será dado por:

Exemplo 5.19. Suponha que pretenda estudar três idiomas de cada vez dentre cinco escolhido por você. Qual o
número de possibilidades de escolhermos três de cada vez?
Então temos 5 cursos que serão agrupados três a três. Como a ordem dos três escolhidos não importa, é claro um
caso de Combinação com repetição.

108
Estatística | Unidade 5 - Probabilidades

Portanto, teria 10 maneiras diferentes de agrupar três cursos dos cinco escolhidos.
Exemplo 5.20. Uma empresa de refrigerantes dispõe de 6 tipos de refrigerantes. Pretende várias misturas com
dois tipos deles. Determine quantas misturas diferentes serão possíveis de serem realizadas.
Temos a informação de que a ordem da mistura não importa, o refrigerante A com B será o mesmo de refrige-
rante de B com A. Então estamos diante de um caso de combinação com repetição.

Portanto, teríamos 20 misturas diferentes.

5.3 Noções básicas sobre probabilidade


Acabamos de conhecer os conceitos de espaço amostral e evento de um experimento aleatório. No entanto, para
fins probabilísticos, mais interessante do que descrever explicitamente quais são os elementos desses conjuntos
é saber contar quantos elementos têm nesses conjuntos (mesmo que eles sejam infinitos, caso no qual precisa-
remos de ferramentas matemáticas mais complexas). Denotaremos o número de elementos de um conjunto
finito X por n(X).
Para entender o conceito de probabilidade, inicialmente o façamos para experimentos com espaço amostral
finito:
Definição 5.7: Considere um experimento aleatório com espaço amostral finito Ω. A probabilidade de um evento
qualquer E ocorrer é dada por

Exemplo 5.21: Vamos calcular as probabilidades dos eventos descritos no exemplo 5.9. Note que n (Ω)=8, pois
Ω= {KKK, KKC, KCK, CKK, KCC, CKC, CCK, CCC} possui 8 elementos. Note que n (A) = 4 n(B) = 1 e n(C)=6.
Logo,

Ou seja, a probabilidade de observar ao menos duas caras no lançamento de uma moeda três vezes de 1/2 ou
50%. Por sua vez, a probabilidade de não observar caras é

109
Estatística | Unidade 5 - Probabilidades

enquanto a probabilidade de retirar ao menos uma cara e ao menos uma coroa é de

A probabilidade de ocorrer o evento “ocorrer quatro caras” é

enquanto a probabilidade de ocorrer o evento “retirar três faces quaisquer” é

De fato, valem algumas propriedades sobre probabilidades advindas da teoria de conjuntos, as quais enunciamos
abaixo para um experimento aleatório qualquer com espaço amostral finito Ω:

Exemplo 5.22: Numa comunidade há 200 pessoas. Sabe-se que 150 delas comem carne vermelha, 90 delas
comem carne branca e 20 delas não comem nem carne vermelha nem carne branca. Selecionando ao acaso uma
pessoa dessa comunidade, desejamos descobrir qual a probabilidade dos seguintes eventos: “a pessoa comer
carne vermelha” (A), “a pessoa comer carne branca” (B), “a pessoa não comer carne branca nem vermelha” (C)”, “a
pessoa comer carne branca ou vermelha” (D) e “a pessoa comer branca e vermelha” (E). Facilmente percebemos
que

110
Estatística | Unidade 5 - Probabilidades

Agora, note que o evento D corresponde ao conjunto A ∪ B . Note também que C = Dc, pois ambos esses con-
juntos contêm as pessoas que não comem carne vermelha nem branca. Portanto Cc = D. Assim, usando a pro-
priedade (P6), temos:

Tente refazer o exemplo anterior utilizando a teoria de conjuntos, com o auxílio dos diagra-
mas de Venn.

Consulte (MEYER, seção 2.3) ou (WALPOLE et al., seção 2.3) para estudar conceitos básicos
envolvendo noções de contagem.

111
Estatística | Unidade 5 - Probabilidades

5.4 Fatorial de um número


Definição 5.8: Podemos definir o fatorial de um número qualquer como uma expressão cuja função é determinar
um número sucessor com ajuda do anterior ou anteriores. Tal processo recebe o nome de recursividade. Podemos
ainda escrever seja n um número natural, fatorial de n é o produto dos números antecessores de n até 1 e indica-
mos por n!. Matematicamente fica assim:
n! = n. (n - 1).(n - 2).(n - 3). ...(1)!
Exemplos:
1) 4! = 4.3.2.1 = 24
2) 7! = 7.6.5.4.3.2.1 = 5040
Obs.: Por definição 0! = 1
Definição 5.9: Sejam e números inteiros tais que . Chamamos de combinação de n elementos k a k ao número

É um resultado básico de contagem que o número de conjuntos distintos com elementos retirados de uma

amostra com elementos de modo que a ordem dessa retirada não seja importante é dada por Por exemplo,
. que podem
há um grupo com 5 pessoas (A, B, C, D, E) do qual se deseja escolher 3 representantes. Os grupos
ser formados, de modo que a ordem não importe, pode ser descrita pelas triplas ABC, ABD, ABE, ACD, ACE, ADE,
BCD, BCE, BDE e CDE. Note que há 10 grupos que podem ser formados. Essa contagem poderia ter sido feita
conforme comentado acima:

Exemplo 5.23: Uma máquina produziu 40 parafusos, dos quais 4 eram defeituosos. Ao selecionar aleatoria-
mente 3 desses parafusos para um pacote, calculemos a probabilidade de que haja um parafuso defeituoso
nesse pacote. O evento cuja probabilidade queremos calcular (E) consiste em ter 1 parafuso defeituoso e 2 não
defeituosos. Devemos selecionar 1 parafuso defeituoso em 4 disponíveis e 2 não defeituosos em 40-4=36 dis-
poníveis. Logo,

ou seja, há 2520 pacotes contendo 1 parafuso defeituoso e 2 não defeituosos. Agora, o espaço amostral Ω con-
siste em qualquer pacote contendo 3 parafusos dentre os 40 disponíveis:

112
Estatística | Unidade 5 - Probabilidades

Assim, a probabilidade de obter pacote com 1 parafuso defeituoso é:

Apesar de termos definido e buscado compreender o conceito de probabilidade para experimentos com finitas
possibilidades, na maioria das vezes precisamos, na prática, de probabilidades sobre experimentos com infinitas
possibilidades (como o experimento do exemplo 5.6). Para isso, precisamos definir probabilidade de maneira
mais geral:
Definição 5.10: Considere um experimento com espaço amostral Ω . A probabilidade de um evento E em Ω é
um número P (E) satisfazendo as propriedades (P2), (P3), (P4) e (P5) acima.
A definição acima é axiomática. Quando Ω é finito, a definição 5.3 insere-se na definição 5.5, sem ressalvas.
Quando Ω é infinito enumerável, não há grandes problemas em considerar a definição 5.3. Porém, quando Ω é
não enumerável, a definição 5.3 não serve. Nas próximas unidades lidaremos com situações em que isso ocorre.
Porém, as propriedades (P1), (P6) e (P7) continuam válidas para a definição de probabilidade feita acima.

5.5 Probabilidade condicionada


É comum queremos calcular alguma probabilidade restrita a uma determinada condição. São situações em que
não nos interessa saber a probabilidade de um evento em relação ao espaço amostral, mas sim de maneira res-
trita a um outro evento, como definimos a seguir:
Definição 5.11: Considere um experimento aleatório com espaço amostral Ω (não necessariamente finito) e A e
B dois eventos desse experimento. Chamamos de probabilidade condicionada de A dado B ao número

Na prática, ao calcular a probabilidade condicional de A dado B estamos alterando o espaço amostral pelo novo
espaço amostral Ω. A expressão “dado” pode aparecer nos exercícios e situações como “sabendo que”, “condi-
cionado a”, “dado que”, entre outras.

Figura 5.3: Diagrama de Venn

Legenda: Na probabilidade condicional de A dado B, o espaço amostral deixa de ser U e passa a ser
B. Assim, nos interessa apenas a probabilidade do conjunto A∩B em relação ao conjunto B.
Fonte: Elaboração própria.

113
Estatística | Unidade 5 - Probabilidades

Exemplo 5.24: No lançamento consecutivo de uma moeda 3 vezes, desejamos saber qual é a probabilidade de
obter cara duas vezes sabendo que no primeiro lançamento foi obtido cara. Note que queremos uma probabi-
lidade condicionada. A condição aqui é que cara já tenha sido obtida no primeiro lançamento. Denote por A o
evento “obter duas caras” e por B o evento “obter cara na primeira jogada”. Se não tivéssemos posto essa condi-
ção B, a probabilidade de A seria

já que A = {KKC, KCK, CKK}. Porém, restrito à condição B, precisamos saber a probabilidade de A ∩ B = e de P(B)
como A ∩ B = {KKC, KCK}. (evento com duas caras, sendo o primeiro lançamento uma cara) e B = {KKK, KKC,
KCK, KCC} então a probabilidade condicionada é dada por

Note que o que calculamos foi a probabilidade do evento obter duas caras considerando como espaço amostral
o conjunto . Observe ainda que P(A) ≠ P(A\B).
Exemplo 5.25: Admita que tenhamos uma urna com dez bolas numeradas de 1 a 10, da qual retiraremos apenas
uma bola. Assim, podemos enumerar os elementos do espaço amostral pelo conjunto Ω={1,2,3,4,5,6,7,8,9,10}.
Queremos saber as seguintes probabilidades: obter um número par; obter um número múltiplo de 3; obter um
número par sabendo que o número obtido é múltiplo de 3. Seja A o evento “obter um número par”. Claramente
A ={2,4,6,8,10}.

Note que a fórmula da definição 5.6 nos dá uma forma de calcular a probabilidade da intersecção de dois even-
tos, caso conheçamos a probabilidade condicional:

Esse resultado é conhecido como teorema da multiplicação de probabilidades. O exemplo a seguir nos mostra
o quanto essas igualdades podem ser úteis.
Exemplo 5.26: Suponha que tenhamos um lote com 50 parafusos, dos quais 5 são defeituosos. Queremos sele-
cionar, ao acaso, 2 parafusos desse lote. Calculemos a probabilidade de que os dois parafusos sejam não defeitu-
osos. Seja A o evento “o primeiro parafuso é não defeituoso” e B o evento “o segundo parafuso é não defeituoso”.
Queremos descobrir qual a probabilidade de ocorrer A e B , ou seja, o valor P (B A ∩ B). Pela fórmula acima,

114
Estatística | Unidade 5 - Probabilidades

Exemplo 5.27: Considere a situação do exemplo 5.26. Porém, suponha que ao invés de formar lotes com 2, que-
remos formar lotes com 3 parafusos. Calculemos a probabilidade de obter três parafusos não defeituosos. Sejam
A e B os mesmos eventos do exemplo 5.16 e C o evento “obter o terceiro parafuso não defeituoso”. Assim, que-
remos P (A ∩ B ∩ C). Pelo resultado acima, temos:

Exemplo 5.28: Suponha que em uma urna haja 7 bolas, sendo 3 brancas e 4 pretas. Consideremos quatro situ-
ações:
I) Ao retirar sucessivamente e sem reposição 2 bolas dessa urna, calculemos a probabilidade de que a primeira
bola seja branca e a segunda seja preta. Sejam A o evento “retirar a primeira bola branca” e B o evento “retirar a
segunda bola preta”. Assim, pelo teorema da multiplicação de probabilidades:

II) Ao retirar sucessivamente e sem reposição 2 bolas dessa urna, calculemos a probabilidade de que as bolas
retiradas tenham cores diferentes. Considere os eventos A, “retirar a primeira bola branca”, e B, “retirar a segunda
bola preta”. Como não retirar bola branca (preta) é o mesmo que retirar bola preta (branca), então o que se pede
é a probabilidade de ocorrer o evento (primeira bola branca e a segunda preta) ou o evento Ac ∩ Bc (primeira
bola preta e a segunda branca). Assim, o que queremos é P ((A ∩ B) ∪(Ac ∩ Bc)). Observando o diagrama de Venn
(como na figura 5.4), notamos que a intersecção de A ∩ B e Ac ∩ Bc é vazia. Logo, usando a propriedade (P5) e o
teorema da multiplicação de probabilidades, obtemos:

115
Estatística | Unidade 5 - Probabilidades

Figura 5.4: Diagrama de Venn da situação II do exemplo 5.18.

Legenda: Em vermelho destaca-se e em amarelo Ac ∩ Bc.


Fonte: Elaboração própria.

III) Ao retirar simultaneamente 2 bolas dessa urna, vamos calcular a probabilidade de obtê-las de cores distintas.
Nesse caso, devido à simultaneidade, devemos utilizar os conceitos de combinação. O número de elementos do

( ), pois devemos escolher 2 bolas qualquer dentre as 7 disponíveis. Por sua vez, o
espaço amostral é dado por
7
2

número de elementos do evento é dado por ( ) ( ), pois queremos uma bola branca dentre as três disponíveis
3 4
1 1
e uma preta dentre as quatro disponíveis. Logo,

No exemplo 5.28, calcule a probabilidade de obter duas bolas brancas e duas pretas ao
retirar 4 bolas da urna: a) simultaneamente; b) sucessivamente, sendo as duas primeiras
brancas e as duas últimas pretas.

116
Estatística | Unidade 5 - Probabilidades

5.6 Independência de probabilidades


Dizemos que dois eventos são independentes quando um não interfere na ocorrência do outro. Em termos mais
precisos, temos a seguinte definição:
Definição 5.12: Sejam A e B dois eventos de um mesmo experimento aleatório. Dizemos que A e B são indepen-
dentes se P (B\A) = P (B) ou P (A\B) = P (A).
Note que P (B\A) = P (B) significa que a probabilidade de B dado que A ocorreu coincide com a probabilidade de
B. Portanto, no caso de independência de eventos, a condicional A não modifica a probabilidade de B, justifi-
cando essa denominação de “independência”.
Observe da definição 5.7 e do teorema da multiplicação de probabilidades que dois eventos A e B de um mesmo
experimento aleatório são independentes se, e somente se,

Exemplo 5.29: Eventos observados no lançamento de dois dados convencionais distintos consecutivamente são
independentes, pois a ocorrência do primeiro dado não interfere na ocorrência do segundo. Por exemplo, con-
sidere o evento A, “obter número par no primeiro dado”, e o evento B, “obter número menor que 3 no segundo

dado”. Claro que e que Como a ocorrência do número do primeiro dado não interfere na
ocorrência do número do segundo dado, então A e B são eventos independentes. Em particular, a probabilidade
do evento C descrito por “obter número par no primeiro dado e número menor que 3 no segundo” (A = A ∩ B)
é dado por

Exemplo 5.30: Uma cachorra obteve três filhotes. Considere os eventos “obter duas fêmeas e um macho” (A) e
“obter pelo menos uma fêmea” (B). Supondo que a probabilidade de obter fêmea é 1/2 em cada nascimento,
então

Disso concluímos que A e B não são eventos independentes.


Exemplo 5.31: Uma urna contém 10 bolas, sendo 4 azuis e 6 verdes. Calculemos a probabilidade de extrair a
primeira bola azul e a segunda bola verde dessa urna, com reposição (isto é, após verificar a cor da primeira bola
ela é devolvida à urna para a segunda extração). Considere os eventos “extrair a primeira bola azul” (A ) e “extrair
a segunda bola verde” (B). Como há reposição, os eventos A e B podem ser considerados independentes. De

117
Estatística | Unidade 5 - Probabilidades

fato, P(B| A)= P(B) (pois a extração de bola azul na primeira retirada não interfere na segunda retirada). Logo, a
probabilidade pedida é

A noção de independência entre eventos pode ser estendida para mais de dois eventos. Sejam E1, E2, ..., En even-
tos distintos de um mesmo experimento aleatório. Dizemos que E1, E2, ..., En são independentes se, e somente,
eles forem independentes dois a dois, ou equivalentemente:

Exemplo 5.32: Considere que a probabilidade de um determinado disco conter uma partícula radioativa é de
0,01. Num conjunto com dez desses discos obtidos em locais e condições distintas, desejamos saber qual é a
probabilidade de que nenhum deles possua essa partícula radioativa. Considere o evento Ei descrito por “o disco
i não possua partícula radioativa”, i = 1,2,...,10. Como os discos vêm de origens distintas, podemos supor que há
independência entre todos os eventos Ei. Note que

Logo, devido à independência dos eventos, a probabilidade de nenhum disco possuir essa partícula radioativa é:

Um lote contém 40 peças, sendo 3 defeituosas. Ao retirar duas bolas aleatoriamente com
reposição, calcule a probabilidade de que as duas peças sejam defeituosas.

118
Considerações finais
Nesta unidade aprendemos noções básicas de probabilidades. Os tópicos
abordados foram:
• Revisão sobre a teoria de conjuntos: conjunto, subconjunto, união,
intersecção, complemento, diagrama de Venn, etc.
• Definição de espaço amostral, seguida de vários exemplos.
• Definição e exemplificação do conceito de evento.
• Definição do conceito de combinação de n elementos k a k,
advinda das noções de contagem.
• Definição de probabilidade para espaço amostrais finitos, seguida
de exemplos e de propriedades fundamentais.
• Generalização da definição de probabilidade para qualquer
espaço amostral, mesmo infinito.
• Definição e exemplificação do conceito de probabilidade condi-
cionada.
• Enunciação do teorema de multiplicação de probabilidades para
dois ou mais eventos.
• Definição e exemplificação do conceito de independência de pro-
babilidades para dois ou mais eventos.

119
Referências bibliográficas
MEYER, Paul L. Probabilidade: aplicações a estatística. Rio de Janeiro: LTC
Ed., 2010, p. 426.

WALPOLE, Ronald E. et al. Probabilidade e estatística: para engenharia e


ciências. 8 ed. São Paulo: Pearson Prentice Hall, 2009, p. 491.

120
Unidade de estudo 6
Variáveis aleatórias

Para iniciar seus estudos


Por fim chegamos à última unidade dos nossos estudos. Na unidade ante-
rior estudamos o principal tipo de distribuição de probabilidades para uma
6
variável aleatória discreta. Nesta unidade estudaremos a mais utilizada
entre todos os tipos de distribuição de probabilidade, em particular den-
tre as variáveis contínuas: a distribuição normal. Tal tipo de distribuição
é tão útil que até mesmo variáveis com distribuição binomial (discretas)
podem ser aproximadas por uma distribuição normal em determinadas
circunstâncias. São inúmeras as utilidades práticas da distribuição normal
para a modelagem de variáveis, como veremos nesta unidade. Atentos à
riqueza oferecida pela distribuição normal ao nosso processo de aprendi-
zagem, fechemos com chave de ouro nossos estudos introdutórios sobre
Estatística. Bons estudos!

Objetivos de Aprendizagem

• Definir formalmente a distribuição normal de uma variável con-


tínua.
• Analisar o gráfico “de sino” e as principais características da distri-
buição normal.
• Fazer exemplos práticos com o uso de tabelas e/ou ferramentas
digitais.
Tópicos de estudo:
• 8.1 A distribuição normal
• 8.2 A distribuição normal padrão
• 8.3 Aplicações da distribuição normal

122
Estatística | Unidade de Estudo 8 – Distribuição Normal

8.1 A distribuição normal


A mais utilizada entre as distribuições de probabilidade é a distribuição normal, assunto desta unidade. Ela é
importante porque modela inúmeros fenômenos, como: a altura média das pessoas, clima e tempo, medições
de produtos manufaturados, entre outros. A distribuição normal também ganha destaque por conta do cha-
mado Teorema do Limite Central de Abraham De Moivre (1733). Este teorema que prova que a variável que mede
o resultado médio de um mesmo experimento realizado várias vezes pode ser modelado pela distribuição normal.
Por exemplo: Considere que iremos retirar, de tempos em tempos, um pacote dentre todos os pacotes produzi-
dos de um determinado produto em uma fábrica. A variável que mede o peso médio desses pacotes retirados de
tempos em tempos pode ser modelada pela distribuição normal.

Para saber mais sobre os assuntos abordados até aqui, leia seção 4-6 do livro: MONTGO-
MERY, Douglas C., RUNGER, George C. Estatística aplicada e probabilidade para engenheiros.
Rio de Janeiro: LTC Ed., 2009. Nessa leitura você irá ver a aplicação do Teorema do Limite
Central em alguns outros exemplos.

Vejamos algumas definições:


2
Definição 8.1: Dizemos que uma variável aleatória contínua X tem distribuição normal com parâmetros μ e ó 2
se a sua função de densidade de probabilidade for dada por:

( xì − )2
1 −
=f ( x) e 2ó 2
, x ∈ .
ó 2ð

Em que π é número “pi” (comprimento dividido pelo diâmetro de qualquer circunferência) e e é o número de
Neper.

123
Estatística | Unidade de Estudo 8 – Distribuição Normal

NC ( F )
P(E) =
NC ( P)

Em que: P(E) é a probabilidade de ocorrência de um determinado evento; NC(F) é o número de casos favoráveis,
ou seja, o número de casos que estamos interessados que ocorram; NC(C) é o número de casos possíveis, que
pode ser obtido por meio da análise do espaço amostral.

Exemplo 6.1:

Considere um lançamento de dois dados, de seis faces cada, simultaneamente.


a) Qual é o espaço amostral?
Inicialmente é preciso detalhar todos os resultados que podem ser encontrados com o lançamento em questão:
(1;1), (1;2), (1;3), (1;4), (1;5), (1;6)
(2;1), (2;2), (2;3), (2;4), (2;5), (2;6)
(3;1), (3;2), (3;3), (3;4), (3;5), (3;6)
(4;1), (4;2), (4;3), (4;4), (4;5), (4;6)
(5;1), (5;2), (5;3), (5;4), (5;5), (5;6)
(6;1), (6;2), (6;3), (6;4), (6;5), (6;6)
Assim, o espaço amostral é dado por: Ω = {(1;1), (1;2), (1;3), (1;4), (1;5), (1;6), (2;1), (2;2), (2;3), (2;4), (2;5), (2;6),
(3;1), (3;2), (3;3), (3;4), (3;5), (3;6), (4;1), (4;2), (4;3), (4;4), (4;5), (4;6), (5;1), (5;2), (5;3), (5;4), (5;5), (5;6), (6;1), (6;2),
(6;3), (6;4), (6;5), (6;6)}.
b) Qual é a probabilidade de ambos os números serem menores ou iguais a três?
Os casos favoráveis são: {(1;1), (1;2), (1;3), (2;1), (2;2), (2;3), (3;1), (3;2), (3;3)}. Logo, temos 9 casos favoráveis.
Os casos possíveis são 36, que podemos contar por meio do espaço amostral da letra a.
Logo, a probabilidade é:

NC ( F )
P(E) =
NC ( P)
9
P( x1 , x2 ≤ 3) =
36
P( x1 , x2 ≤ 3) =25%

Assim, a probabilidade de ambos os números serem menores ou iguais a três é de 25%.


c) Qual é a probabilidade de que a soma dos dois números obtidos seja no máximo nove?

124
Estatística | Unidade de Estudo 8 – Distribuição Normal

Os casos favoráveis são: {(1;1), (1;2), (1;3), (1;4), (1;5), (1;6), (2;1), (2;2), (2;3), (2;4), (2;5), (2;6), (3;1), (3;2), (3;3), (3;4),
(3;5), (3;6), (4;1), (4;2), (4;3), (4;4), (4;5), (5;1), (5;2), (5;3), (5;4), (6;1), (6;2), (6;3)}. Logo, temos 30 casos favoráveis.
O número de casos possíveis é 36, que podemos contar por meio do espaço amostral da letra a.
Logo, a probabilidade é:

NC ( F )
P(E) =
NC ( P)
30
P( x1 + x2 ≤ 9) =
36
P( x1 + x2 ≤ 9) =
83,33%

Assim, a probabilidade de obter uma soma de no máximo nove é de 83,33%.

Exemplo 6.2:

Considere o lançamento simultâneo de três moedas.


a) Qual é o espaço amostral?
Os resultados possíveis de serem encontrados são:
(Cara, Cara, Cara); (Cara, Coroa, Cara); (Cara, Cara; Coroa);
(Cara, Coroa, Coroa); (Coroa, Cara, Cara); (Coroa, Coroa, Cara);
(Coroa, Cara, Coroa); (Coroa, Coroa, Coroa)
Dessa forma, temos que o espaço amostral é dado por: Ω = {(Cara, Cara, Cara); (Cara, Coroa, Cara); (Cara, Cara;
Coroa); (Cara, Coroa, Coroa); (Coroa, Cara, Cara); (Coroa, Coroa, Cara); (Coroa, Cara, Coroa); (Coroa, Coroa, Coroa)}.
b) Qual é a probabilidade de obtermos no máximo duas caras?
Os casos favoráveis são: {(Cara, Coroa, Cara); (Cara, Cara; Coroa);
(Cara, Coroa, Coroa); (Coroa, Cara, Cara); (Coroa, Coroa, Cara);
(Coroa, Cara, Coroa); (Coroa, Coroa, Coroa)}. Logo, temos sete casos favoráveis.
Os casos possíveis são oito, que podemos contar por meio do espaço amostral da letra a.
Logo, a probabilidade é:
NC ( F )
P(E) =
NC ( P)
7
P ( N º Caras ≤ 2) =
8
P ( N º Caras ≤ 2) = 87,5%

Assim, a probabilidade de obter no máximo duas caras é de 87,5%.

125
Estatística | Unidade de Estudo 8 – Distribuição Normal

Em problemas que envolvem o cálculo de probabilidades, é muito comum utilizarmos a ideia de complemento
para facilitar nos cálculos. A probabilidade de um evento é igual a um – a probabilidade de seu evento comple-
mentar. Ou seja: ( ).
P ( A ) = 1 − P Ac

Vamos calcular para o exemplo 6.2 a probabilidade de encontrarmos no máximo duas caras utilizando a ideia de
complemento.
A probabilidade em questão pode ser escrita da seguinte maneira:

P ( N º Caras ≤ 2 ) =−
1 P( N º Caras > 2)
P ( N º Caras ≤ 2 ) =−
1 P( N º Caras =3)
1
P( N º Caras ≤ 2) =1 −
8
7
P( N º Caras ≤ 2) =
8

Caso não tenha ficado claro como calculamos a probabilidade com base no complemento, tenha em mente o
seguinte raciocínio: queremos que o número de caras seja no máximo dois. Como temos três moedas, a única
situação que não estamos interessados no seu acontecimento é quando ocorre três caras.

Exemplo 6.3:

Fizemos o lançamento de um dado de seis faces e uma moeda.


a) Qual é o espaço amostral?
Precisamos elencar todas as situações possíveis, que são:
(1; Cara), (1; Coroa), (2; Cara); (2; Coroa); (3; Cara); (3; Coroa);
(4; Cara), (4; Coroa), (5; Cara); (5; Coroa); (6; Cara); (6; Coroa).
Finalmente, temos que o espaço amostral é: Ω = (1; Cara), (1; Coroa), (2; Cara); (2; Coroa); (3; Cara); (3; Coroa); (4;
Cara), (4; Coroa), (5; Cara); (5; Coroa); (6; Cara); (6; Coroa).
b) Qual é a probabilidade de obter o número três e coroa?
Os casos favoráveis são: {(3, Coroa)}. Logo, temos um caso favorável.
Os casos possíveis são 12, que podemos contar por meio do espaço amostral da letra a.
Logo, a probabilidade é:

126
Estatística | Unidade de Estudo 8 – Distribuição Normal

NC ( F )
P(E) =
NC ( P)
1
( x1 3,=
P= x2 Coroa
= )
12
( x1 3,=
P= x2 Coroa
= ) 8,33%

Assim, a probabilidade de obter o número três e coroa é de 8,33%.


c) Qual é a probabilidade de obter um número maior que três e coroa?
Os casos favoráveis são: {(4, Coroa), (5, Coroa), (6, Coroa)}. Logo, temos três casos favoráveis.
Os casos possíveis são 12, que podemos contar por meio do espaço amostral da letra a.
Logo, a probabilidade é:

NC ( F )
P(E) =
NC ( P)
3
P( x1 > 3, x=
2 )
Coroa=
12
P( x1 > 3, x=
2 Coroa=) 25%

Assim, a probabilidade de obter um número maior que três e coroa é de 25%.

Exemplo 6.4:

Uma empresa possui quatro tratores. Em determinado momento, deseja-se saber quais deles estão em opera-
ção. Por exemplo, o primeiro trator pode estar funcionando, o segundo não, o terceiro funcionando e o quarto
não. Esse é um dos 16 elementos do experimento aleatório que verifica quais tratores estão funcionando no
instante observado. De fato, cada trator pode ser classificado segundo um dos status “funcionando” ou “parado”.
Assim, como há quatro tratores, segue o princípio multiplicativo de contagem que há 2^4=16 elementos amos-
trais possíveis. Se considerarmos cada trator como sendo uma coordenada de uma quádrupla, então (funcionan
do,parado,parado,parado) significa que apenas o primeiro trator está em operação.

Figura 6.1: Trator.

127
Estatística | Unidade de Estudo 8 – Distribuição Normal

Fonte: <https://pt.123rf.com/search.php?word=10107952&srch_lang=pt&imgtype=&Submit=+&t_word=&t_
lang=pt&orderby=0>.

Considere que existem quatro tratores e que a probabilidade de cada trator estar parado é de 0,4. Diante disso,
calcule:
A probabilidade de dois tratores estarem funcionando
Vamos definir uma variável aleatória X que representa o número de tratores funcionando. Podemos ter os seguin-
tes valores assumidos pela variável aleatória X, que são {0,1,2,3,4}.
Foi dito que a probabilidade de um trator estar parado é 0,4, e que a probabilidade de um trator estar funcio-
nando deve ser de 0,6.
Observação: Antes, porém, cabe aqui uma observação importante em relação à notação: em vez de denotar a
probabilidade de X ser igual a 2 por P({2}), é mais comum usarmos a notação P(X=2).
Agora precisamos definir nosso espaço amostral com base no que foi pedido na letra a).
Assim, Ω = {(FFPP), (FPFP), (FPPF), (PFFP), (PFPF), (PPFF)}, em que F significa “funcionando” e P “parado”.
Como a probabilidade de obter P é 0,4 e a de obter F é 0,6, a probabilidade de obter qualquer um dos seis casos
anteriores é (0,4)^2 (0,6)^2 (supondo que o funcionamento de cada trator independe do funcionamento de

128
Estatística | Unidade de Estudo 8 – Distribuição Normal

outro). Mas, como temos seis resultados possíveis, precisamos multiplicar a probabilidade supracitada por seis.
Logo:

P ( X= 2=
) 6. ( 0, 4 ) ( 0, 6 )=
2 2
0, 3456

b) A probabilidade de um trator estar parado


O espaço amostral é Ω = {(FFFP), (FFPF), (FPFF), (PFFF)}.
Como a probabilidade de obter P é 0,4 e a de obter F é 0,6, a probabilidade de obter qualquer um dos quatro
casos anteriores é (0,4)^1 (0,6)^3 (supondo que o funcionamento de cada trator independe do funcionamento
de outro). Mas, como temos quatro resultados possíveis, precisamos multiplicar a probabilidade supracitada por
quatro. Logo:

P ( X= 1=
) 4. ( 0, 6 ) ( 0, 4=) 0,3456
3

c) A probabilidade de ter no máximo dois tratores funcionando


Como já temos P(X=1) e P(X=2), basta calcular P(X=0). Os elementos cuja imagem por X é 0 são aqueles em que
não haja trator parado, ou seja, apenas FFFF. Logo:

P ( X= 0=
) 1. ( 0, 6 )= 0,1296
4

Assim,

P ( X ≤ 2) =
P(X =
0) + P ( X =
1) + P ( X ==
2 ) 0,1296 + 0,3456 + 0,3456 =
0,8206

A probabilidade de ter três ou mais tratores funcionando


Para calcular P(X≥3), basta usar a propriedade do complemento que já falamos anteriormente, que é:
( ) . Como os elementos maiores que dois são aqueles que não são menores ou iguais a dois (óbvia
P ( A ) = 1 − P Ac

afirmação), então:

P ( X ≥ 3) =P ( X > 2 ) =−
1 P ( X ≤ 2 ) =−
1 0,8206 =0,1792

Fica a seu cargo verificar que P(X=3)=0,1536 e que P(X=4)=0,0256. Finalmente, observe que P(0≤X≤4)=1, pois
todos os valores assumidos por X são 0, 1, 2, 3 e 4.

6.2 Variáveis aleatórias discretas


Uma variável aleatória discreta é uma variável que possui uma quantidade enumerável (que podemos contar) de
valores possíveis.

Exemplo 6.5:

129
Estatística | Unidade de Estudo 8 – Distribuição Normal

Imagine que estejamos interessados em analisar se três pessoas possuem ou não diabetes. Vamos chamar de D a
pessoa que tem diabetes e N a pessoa que não possui a doença.
Podemos elencar o espaço amostral da seguinte maneira:
Ω = {DDD, DDN, DND, NDD, NND, NDN, DNN, NNN}
Pelo espaço amostral anterior você pode ver todas as possibilidades de combinações para as três pessoas no que
se refere à presença ou ausência de diabetes.
Podemos criar uma variável aleatória discreta X que representa o número de pessoas portadoras da doença.
Sendo assim, os valores que podem ser assumidos pela variável aleatória são {0, 1, 2 ou 3}. Perceba que podemos
contabilizar o número de valores que a variável aleatória possui. Esse é o conceito de variável aleatória discreta
que você precisa memorizar.
Existem duas propriedades para o caso de variáveis aleatórias discretas que são extremamente importantes. São
elas:

p ( xi ) ≥ 0 x ∈ X (Ù )
1) , para todo i . Isso implica que todas as probabilidades dos valores assumidos pelas vari-
áveis aleatórias discretas devem ser maiores ou iguais a zero.

∑ p ( xi ) = 1
2) i∈I A soma das probabilidades de todos os valores assumidos pela variável aleatória discreta deve
ser igual a um.
Definição 6.2: A função p definida anteriormente é denominada função de probabilidade (f.p.) de uma variável X.

O gráfico dado pelos i


( x , p ( xi ) ) é chamado de distribuição de probabilidade de X.
Vamos voltar ao exemplo 6.5, para que possamos mostrar que as duas propriedades são verdadeiras. Podemos
calcular as probabilidades para os diferentes valores que a variável aleatória pode assumir. Tais probabilidades
são:

1
P ( X= 0=
)
8
3
P ( X= 1=
)
8
3
P ( X= 2=
)
8
1
P ( X= 3=
)
8

No que tange a propriedade 1, observe que todos os valores de probabilidade encontrados são maiores ou iguais
a zero. Logo, a propriedade 1 foi verificada.
Em relação à propriedade 2, vamos encontrar a soma das probabilidades.

1 3 3 1
P= + + +
8 8 8 8
P =1

Como o valor encontrado foi igual a 1, a propriedade 2 foi satisfeita.

130
Estatística | Unidade de Estudo 8 – Distribuição Normal

No exemplo 6.6, você aprenderá sobre cálculo de probabilidade em lançamento de moeda

Figura 6.2: Lançamento de uma moeda.

Fonte: <https://previews.123rf.com/images/zestmarina/zestmarina1507/zestmarina150700351/43179569-Business-
man-tossing-a-coin-closeup-shot-Stock-Photo.jpg>

Exemplo 6.6:

Suponha que desejamos lançar uma moeda convencional várias vezes até que a primeira face “cara” seja verifi-
cada. Seja X a variável aleatória que analisa quantos lançamentos são feitos até que a face “cara” ocorra. Assim,
X=1,2,3,…, ou seja, X pode assumir valores desde 1 (“cara” ocorre no primeiro lançamento) até infinito. Por exem-
plo, X=5 significa que ocorreu “coroa” nos quatro primeiros lançamentos e “cara” no quinto (CCCCK). Portanto,
X é uma variável aleatória discreta. Vamos agora determinar a f.p. de X. Como a probabilidade de ocorrer “cara”
em um lançamento é 1/2 e a de ocorrer “coroa” também, e como os lançamentos são independentes, temos
1
P ( X= 1=
)
2 (“cara” no primeiro lançamento),
2
1 1 1
) . =  
P ( X= 2=
2 2 2

(“coroa” no primeiro e “cara” no segundo),


2 3
1 1 1
)   . =  
P ( X= 3=
2 2 2

131
Estatística | Unidade de Estudo 8 – Distribuição Normal

(“coroa” nos dois primeiros e “cara” no segundo), assim por diante. Logo, podemos definir, para cada n∈{1,2,3,…},
a função
n
1
) P ( X= n=)  
p ( n=
2

Note que p está definida para todos os valores assumidos por X e, por isso, é a f.p. de X. Note que p(n)≥0 para todo
n. Além disso,
n

1 ∞


= p ( n) ∑=   1
=n 1= n 1 2

 1  1   1  
2 3

 ,   ,   , …
 2  2   2  
A última igualdade acima ocorre porque é uma progressão geométrica infinita com razão
1
q= <1
2

{ x , x , x , …}
Seja 1 2 3 uma sequência infinita de números, tal que i
x = qx
i −1 , para todo i≥2,

em que 0<q<1 é um número real fixo. É fato básico da Matemática, sobre progressões geo-

x
∑ xi = 1
1− q
métricas, que . i =1

Existem famílias de variáveis aleatórias que têm distribuição semelhante. Isso quer dizer que elas têm o mesmo
tipo função de probabilidade (ou seja, a mesma função, a menos de alguns parâmetros). Dentre as variáveis
aleatórias discretas, o principal tipo de distribuição é a binomial, que será estudada exclusivamente na próxima
unidade. Aqui vamos estudar outro tipo mais básico de distribuição: a uniforme discreta.

Definição 6.3: Seja X uma variável aleatória discreta cuja função de probabilidade é constante, ou seja, ( i )
p x =c

x ∈ X (Ù )
para todo i . Neste caso, dizemos que X tem distribuição uniforme discreta. Notação: X ∼ U (c) .
Como a soma das probabilidades de todos os elementos de X deve resultar em 1, segue da definição acima que
não existem variáveis aleatórias discretas não finitas que tenham distribuição uniforme. Além disso, é possível
notar que c = 1/ n ,se X tem n elementos.
No exemplo 6.7, apresentamos o caso do lançamento de dado.

Figura 6.3: Jogo de dados.

132
Estatística | Unidade de Estudo 8 – Distribuição Normal

Fonte: <https://pt.123rf.com/search.php?word=17247546&srch_lang=pt&imgtype=&t_word=17247546&t_
lang=pt&oriSearch=65413272&__ncforminfo=p7ifhj8lXJZiMWzQlCc2ok3i5uXyao-j9f15mlU6Q-sxIDgYkGMNT2UjT-
TvjuRWfhZfJ9s2djq4dSY5QdBbN-ksSO3u6G7h2B2ncROKNxTvu6h0uisHEVkIrn_eImUjwtOWEnj8Eyss%3D>.

Exemplo 6.7:

Ao lançar um dado convencional, queremos analisar a face voltada para cima. Seja X a variável aleatória que
informa a face voltada para cima após o lançamento. Logo, X={1,2,3,4,5,6} é discreta. Além disso,

1
p ( n=
) P ( X= n=)
6

para cada n ∈ {1,2,3,4,5,6}, ou seja, a função de probabilidade é constante. Portanto, essa variável tem distribui-
ção uniforme discreta.
A seguir vamos tratar de três importantes parâmetros no estudo de uma variável aleatória discreta. Certamente
você associará esses conceitos com outros já aprendidos nesta disciplina.
=
Definição 6.4: Seja X uma variável aleatória discreta tal que X { x1 , x2 , x3 , …} e com função de probabilidade
p. Chamamos de esperança de X (ou valor esperado, ou valor médio) o número

133
Estatística | Unidade de Estudo 8 – Distribuição Normal


E ( X ) = ∑ xi p ( xi ) .
i =1

Por sua vez, chamamos de variância de X o valor


∑( x − E ( X ) ) p( xi )
2
(X)
Var= i
i =1

DP ( X ) = Var ( X )
e de desvio padrão de X o valor

Exemplo 6.8:

Considere a variável aleatória discreta X do exemplo 6.7. A esperança de X é calculada da seguinte forma:
∞ 6
1 1 21
E ( X )=
i i ∑x p ( x ) = ∑i. 6 = (1 + 2 + 3 + 4 + 5 + 6 ) = = 3,5
=i 1 =i 1 6 6

A variância de X é dada por:

( i − 3,5) =
2
∞ 6
17,5
( xi − E ( X ) ) p( xi ) =
2
Var ( X ) =
∑ ∑
=i 1 =i 1 6 6

17,5
=DP ( X ) Var ( X )
=
Por fim, o desvio padrão de X é 6

Exemplo 6.9:

Considere a variável aleatória discreta X tratada no exemplo 6.6. Segundo a definição 6.6, a esperança de X
naquele exemplo é dada por
i
∞ ∞
1 1 2 3 4 5
E(X) =
i i ∑x p ( x ) = ∑i  2  = + + + + …
=i 1 =i 1 2 4 8 16 32

Denotemos por S essa última série. Assim,

S 1 2 3 4 5
= + + + + +…
2 4 8 16 32 64
S
S de
2
Subtraindo , obtemos:

134
Estatística | Unidade de Estudo 8 – Distribuição Normal

135
Estatística | Unidade de Estudo 8 – Distribuição Normal

S 1 2 1 3 2  4 3 
S− = +  −  +  −  +  −  +… =
2 2  4 4   8 8   16 16 

1 1 1 1
= + + + +…= 1
2 4 8 16

Logo, 2S-S=2, donde segue que S=2. Portanto, E(X)=S=2. Por sua vez,
i

1 ∞
( xi − E ( X ) ) p ( xi ) = ( i − 2 )   =
2
Var ( X ) =
∑ ∑
2

=i 1 =i 1 2

i i i
1 ∞∞
1 ∞
1
= ∑i   − 4∑i   + 4∑   =
2

=i 1 =2 2
i 1= i 12

=R − 4.E ( X ) + 4.1 =R − 4 E ( X ) + 4

i

1
R = ∑i 2  
em que i =1  2  precisamos calcular. Note que

1 4 9 16 25 2 8 18 32 50
R= + + + + +… ⇒ 2 R= + + + + +…
2 4 8 16 32 2 4 8 16 32

Daí,

2  8 1   18 4   32 9   50 16 
R =2 R − R = +  −  +  −  +  −  +  −  =
2  4 2   8 4   16 8   32 16 

3 5 7 9  2 1  4 1 6 1  8 1 
1
=+ 1  +  +  +  +  +  +  +  +… =
+ + + +… =+
2 4 8 16  2 2   4 4   8 8   16 16 

1 2 3 4  1 1 1 1
=1 + 2  + + + +… + + + + +… =
 2 4 8 16  2 4 8 16

= 1 + 2 S + 1 = 1 + 2.2 + 1 = 6

Var ( X ) = R − 4.E ( X ) + 4 = 6 − 4.2 + 4 = 2


Logo, .

DP ( X ) = 2.
Consequentemente,
1
1
X ∼U   p ( xi ) = xi ∈ X
Se nou seja, se X tem uma distribuição uniforme discreta, tal que n para todo , então a
esperança de X é dada por
n n
xi
E(X)
= i i x p( x ) ∑
∑=
=i 1 =i 1 n

ou seja, E(X) é a média dos elementos de X.

136
Estatística | Unidade de Estudo 8 – Distribuição Normal

1
X ∼U  
Calcule a expressão da variância para n

Outra função interessante é a função de distribuição acumulada (f.d.a.) relacionada a uma variável aleatória dis-
creta X com f.p. p. Essa função é definida por:

( x ) P ( X ≤ x)
F=

para qualquer x ∈ X (Ù ) . Neste caso, é claro que

F ( x) = ∑p( x j )
xj

xj ≤ x
para todo em X.
A função de distribuição acumulada, como o próprio nome diz, acumulará todos os valores de probabilidade
assumidos pelos elementos que se situam antes daquele assumido por x. Em outras palavras, suponha que que-
remos que em um lançamento de um dado de seis faces saia um número menor ou igual a três. Assim, devemos
somar a probabilidade de sair um com a probabilidade de obtermos dois com a probabilidade de encontrarmos
a face três.
Exemplo 6.10: Considere o lançamento de três moedas. Qual é a probabilidade de obtermos no máximo duas
caras, utilizando o conceito de função de distribuição acumulada?
Queremos que ocorram no máximo duas caras, logo:

( 2 ) P ( X ≤ 2)
F=
F ( 2) =
P ( X =+
0) P ( X =
1) + P ( X =
2)
1 1 1 1 1 1 1 1 1 7
F ( 2 ) = . . + 3. . . + 3. . . =
2 2 2 2 2 2 2 2 2 8

Também podemos calcular a probabilidade da função de distribuição acumulada por meio da enumeração do
espaço amostral.

6.2 Variáveis aleatórias contínuas

137
Estatística | Unidade de Estudo 8 – Distribuição Normal

Diferentemente das variáveis aleatórias contínuas, que podemos enumerar os valores assumidos por tais variá-
veis, no caso das variáveis aleatórias contínuas não podemos fazer este procedimento.
Definição 6.5: Uma variável aleatória X, associada a um experimento com espaço amostral Ω, é chamada de vari-
ável aleatória contínua se X(Ω) é um conjunto não enumerável.
Variáveis aleatórias relacionadas a tempo, distância, velocidade, comprimento, massa, volume, temperatura,
demanda de produtos em um supermercado, entre outras, geralmente são variáveis aleatórias contínuas. Daí já
podemos perceber sua enorme aplicabilidade.

Exemplo 6.11:

Suponha que desejamos verificar a duração da carga de uma pilha. Para isso, vamos utilizar a variável T que veri-
fica, em horas, a duração dessa carga. Assim, T=5 significa uma duração de cinco horas, T=13,4 significa uma
duração de 13,4 horas (ou seja, 13 horas e 24 minutos), assim por diante. Note que, apesar de constantemente
trabalharmos com aproximações de tempo, a variável T pode assumir qualquer valor real no intervalo [0,+∞),
mesmo que na prática pudéssemos restringir esse tempo ao intervalo [0,20]. Enfim, não importa “qual intervalo”,
mas sim que “é um intervalo” o conjunto de possibilidades de T. Por isso, a variável aleatória T é contínua.
Exemplo 6.12: Seja Z a variável aleatória correspondente ao tamanho de uma bactéria, em μm (micrômetros).
Essa variável aleatória pode assumir qualquer valor real entre 0 +∞, ou, se quisermos ser mais precisos, qualquer
valor pertencente ao intervalo [0,2;1,5]. Assim como o conjunto de valores possíveis assumidos por Z é não enu-
merável, dizemos que Z é uma variável aleatória contínua.
De maneira análoga àquela que vimos para o caso de variáveis aleatórias discretas, para o caso de variáveis alea-
tórias contínuas temos as seguintes propriedades:

f ( x ) ≥ 0, para todo x ∈ X ( Ù )
1)
2) A área abaixo da curva dada pelo gráfico de f “tende” a um.
Definição 6.6: A função f definida anteriormente é chamada de função de distribuição de probabilidade (f.d.p.)
de X.

138
Estatística | Unidade de Estudo 8 – Distribuição Normal

Exemplo 6.13: A central de reclamações de uma empresa selecionou aleatoriamente 20 clientes que haviam
ligado em dois dias distintos em uma mesma semana para reclamarem de alguma falha em seu produto e ano-
tou o tempo (em dias) entre as duas ligações. Os dados obtidos foram os seguintes:
0,1 0,7 0,6 0,4 0,8 0,7 1,2 1,5 1,1 2,1
2,2 2,3 3,2 3,1 4,1 4,2 4,2 5,1 5,2 5,1
O histograma com esses valores está apresentado na Figura 6.4.

Figura 6.4 - Histograma do exemplo 6.13.

Legenda: Histograma do número de dias entre as duas ligações feitas por clien-
tes a uma central de reclamações em uma mesma semana.
Fonte: Gráfico gerado no R e adaptado ao contexto.

O histograma anterior pode ser aproximado pela curva contínua da Figura 6.5 a seguir:

Figura 6.5 - Aproximação do histograma da figura 6.4 por uma curva.

139
Estatística | Unidade de Estudo 8 – Distribuição Normal

Legenda: O histograma da figura 6.4 pode ser aproximado pela curva deste gráfico.
Fonte: Figura obtida no software R.

A curva obtida na Figura 6.5 corresponde ao traço do gráfico de uma função f , que pode ser considerada a f.d.p.
da variável aleatória X que informa o tempo (em dias) entre duas ligações de clientes à central de reclamações da
referida empresa.
Assim como para variáveis aleatórias discretas, existem tipos de distribuição de probabilidade para as variáveis
aleatórias contínuas. A mais importante delas é a chamada distribuição normal, que será estudada com exclusi-
vidade na Unidade 8. A título de exemplo, vamos abaixo tratar do tipo mais simples de distribuição de probabili-
dade para variáveis aleatórias contínuas: as distribuições uniformes.
Uma variável aleatória contínua X tem distribuição uniforme com parâmetros a e b se sua f.d.p. for dada por

 1
 , se x ∈ [a, b]
b − a
 0, se x ∉ [a, b]

Neste caso, denotamos X ∼ U (a , b) O gráfico da f.d.p de X está dado na Figura 6.7 a seguir, no caso a=0 e b=2:

Figura 6.7 - Gráfico da distribuição uniforme com parâmetros a=0 e b=2.

140
Considerações finais
Esta unidade foi dedicada ao estudo geral sobre variáveis aleatórias. Os
tópicos que estudamos foram:
• Conceituação de variável aleatória e de probabilidade neste con-
texto.
• Definição de variável aleatória discreta e de sua função de proba-
bilidade (f.p.).
• Estudo da distribuição uniforme discreta.
• Definição de esperança, variância e desvio padrão de uma variável
aleatória discreta.
• Definição de função de distribuição acumulada (f.d.a.) de uma
variável aleatória discreta.
• Definição de variável aleatória contínua como sendo aquela que
não é discreta.
• Definição da função de distribuição de probabilidade (f.d.p.) de
uma variável aleatória contínua.
• Definição de esperança, variância e desvio padrão de uma variável
aleatória contínua.
• Definição de função de distribuição acumulada (f.d.a.) de uma
variável aleatória contínua.
• Estudo da distribuição uniforme contínua.

141
Referências bibliográficas
ABCMED. Grupos Sanguíneos: Quais São? Como são a Compatibilidade
e a Incompatibilidade entre Sangues de Tipos Diferentes? Disponível em:
<http://www.abc.med.br/p/529659/grupos+sanguineos+quais+sao+co
mo+sao+a+compatibilidade+e+a+incompatibilidade+entre+sangues+d
e+tipos+diferentes.htm>. Acesso em: 22 fev. 2017.

MEYER, P. L. Probabilidade: Aplicações à Estatística. Rio de Janeiro: LTC,


2010.

142
Unidade 7
Distribuição binomial

Para iniciar seus estudos


7
Caro estudante, qual é a probabilidade de você já estar “manjando” tudo
sobre variáveis aleatórias? Na unidade passada, descobrimos enormes
vantagens em converter resultados práticos de experimentos aleatórios
em números por meio das funções chamadas de “variáveis aleatórias”.
Vimos que há dois tipos delas: as discretas e as contínuas. Vimos também
que podemos classificar as variáveis segundo sua distribuição. Nesta uni-
dade, estudaremos o principal tipo de distribuição para variáveis discre-
tas: a distribuição binomial. Quando lidamos com situações que envol-
vem sucessivas respostas binárias (sim ou não, zero ou um etc.), tal tipo
de distribuição pode ser a “chave do sucesso”. Sim ou não? Bons estudos!

Objetivos de Aprendizagem

• Apresentar introdutoriamente a distribuição de Bernoulli.


• Definir distribuição binomial e analisar suas principais caracterís-
ticas.
• Fazer exemplos práticos com o uso de tabelas e/ou ferramentas
digitais.

144
Estatística | Unidade 7 -Distribuição binomial

7.1 A distribuição de Bernoulli


Existem experimentos dicotômicos, ou seja, que geram apenas dois resultados distintos: sucesso e fracasso, sim e
não, macho e fêmea, com defeito e sem defeito, positivo e negativo, verdadeiro e falso etc. Uma variável aleatória
para representar essa situação pode ser dada por:

X= { 1, se sucesso
0, se fracasso

(claramente “sucesso” e “fracasso” podem ser trocados pelos resultados dicotômicos de cada diferente situação:
“sim” e “não”, “positivo” e “negativo” etc.). A variável X é, portanto, uma variável binária.

Glossário

Algo é dito dicotômico quando é dividido em duas partes, ou seja, quando é bifurcado. Um
experimento dicotômico é aquele que possui dois resultados opostos.

Como uma variável binária X só tem dois valores, então um deles deve ter probabilidade p de ocorrer e outro q =
1 - p. Nessas condições, dizemos que X tem distribuição de Bernoulli, X ~ Ber(p), se a função de probabilidade
de é dada por:

f(n) = P(X=n) =
{ p, se n = 1
q = 1 - p, se n=0

Figura 7.1 - Jacob Bernoulli.

Legenda: A figura é uma representação de Jacob Bernoulli, matemático suíço cujo sobrenome denomina a dis-
tribuição que estamos estudando nesta seção. A família Bernoulli é famosa por ter tido oito matemáticos.
Fonte: Wikimedia Commons.
145
Estatística | Unidade 7 -Distribuição binomial

A Figura 7.2 a seguir apresenta a distribuição de probabilidades de uma variável X ~ Ber(p) para alguns valores
de p.

Figura 7.2 - Distribuição de Bernoulli.

Legenda: Distribuição de Bernoulli Ber(p) para p=1, p=0,8, p=0,5 e p=0,3,


em que p é a probabilidade de X=1 (sucesso) ocorrer.
Fonte: Wikimedia Commons.

Exemplo 7.1: No lançamento de uma moeda comum, não viciada, há apenas dois resultados possíveis: cara e
coroa. Podemos definir X=1 se ocorrer cara, e X=0 se ocorrer coroa. Note que as probabilidades de ocorrer cara e
coroa são iguais a p=1/2 e q=1-p = 1/2. Assim, X ~ Ber(0,5).
Exemplo 7.2: Uma fábrica produz diariamente cem peças de um determinado produto, dos quais quatro são
defeituosos. A retirada aleatória de um produto produzido pela fábrica é uma variável dicotômica, pois seus
resultados são «sem defeito» e «com defeito». Se X=0 caso a variável seja não defeituosa e X=1 caso a variável
seja defeituosa, então X ~ Ber(p), em que
4
p= = 0,04
100

é a probabilidade de retirar uma peça defeituosa. Assim,


P(X=0)=q=1-p=1-0,04=0,96.

146
Estatística | Unidade 7 -Distribuição binomial

Exemplo 7.3: Um investigador está procurando saber se um determinado fato é verdadeiro ou falso. O experi-
mento que verifica essa condição, como é dicotômico, pode ser modelado pela variável

X=
{ 1, se verdadeiro
0, se falso

Sabendo que P(X=1)=0,4 é a probabilidade de sucesso, então p=0,4. Logo, X~Ber(0,4). Note que P(X=0)=q=1-
-p=0,6 é a probabilidade do fato ser falso.
Se X tem distribuição de Bernoulli com parâmetro p, isto é, X~Ber(p), então a esperança de X é
E(X)=1.p+0.(1-p)=p
enquanto a variância de X é
Var(X)=(1-p)2.p+(0-p)2.(1-p)=p-2p2+p3+p2-p3=
=p-p2=p(1-p),
ou seja, Var(X)=p(1-p). A função de distribuição acumulada de X é

{
0, se x < 0
F = (X ≤ x) = q, se 0 ≤ x <1
1, se x ≥ 1

O gráfico da f.d.a. de X está dado na Figura 7.3 a seguir para alguns valores de X:

Figura 7.3 - Gráfico da f.d.a. de X.

Legenda: Gráfico da f.d.a. de X~Ber(p) para p=1, p=0,8, p=0,5 e p=0,3.


Fonte: Wikimedia Commons.

147
Estatística | Unidade 7 -Distribuição binomial

Exemplo 7.4: Uma loja está sorteando prêmios para alguns de seus clientes. Para isso, foi colocada uma máquina
na entrada da loja, a qual possui um único botão e um visor que responde SIM ou NÃO quando o botão é aper-
tado: se o visor responder SIM, o cliente que apertou o botão foi premiado; se o visor responder NÃO, o cliente não
recebeu o prêmio. A máquina foi programada para, aleatoriamente, responder SIM a um em cada oito clientes
que apertarem o botão. Assim, podemos definir a variável X=0 se a resposta da máquina for NÃO e X=1 se a res-
posta da máquina for SIM. Note que
1
p = P(X =1) = = 0,125
8

então, X˜Ber(0,125). Logo, a esperança de X é 0,125 e variância de X é p(1-p)=0,125.0,875=0,109375. A f.d.a. de


X é:

{0, se x < 0
F(X ≤ x) = 0,875, se 0 ≤ x < 1
1, se x ≥ 1

Os gráficos de distribuição de X e da f.d.a. de X estão na Figura 7.4:

Figura 7.4 - Gráfico da distribuição (à esquerda) e gráfico da f.d.a. (à direita) da variável X do exemplo 7.4.

Legenda: Os gráficos foram elaborados no software R. Para fazê-los, respectivamente, use os seguintes comandos:
> x <- 0:1
> fx <- dbinom(x, 11, 0.125)
> plot(x, fx, type=’h’)
e
> Fx <- pbinom(x, 1, 0.125)
> plot(x, Fx, type=’S’)
Fonte: Gráficos gerados no software R.

148
Estatística | Unidade 7 -Distribuição binomial

7.2 A distribuição binomial


A distribuição de Bernoulli, estudada na seção anterior, foi só um aperitivo para o verdadeiro banquete dado pela
distribuição binomial. Ela se refere a um experimento dicotômico repetido n vezes de forma independente.
Suponha que um experimento dicotômico, digamos com resultados “sucesso” e “fracasso”, seja realizado de
forma independente n vezes consecutivas. Considere a variável X que conta o número de sucessos. Nessas con-
dições, dizemos que X tem distribuição binominal. Se p é probabilidade de sucesso no experimento dicotômico,

( nk
P (X = k) =
( pk (1 - p)n-k

n
é a probabilidade de haver exatamente k≤n sucessos na sequência de n resultados obtidos, em que ( k é outra
(
notação para C(n,k), a combinação de n elementos k a k, isto é,

( nk n!
( =
k! (n-k)!

Portanto, uma variável X tem distribuição binomial com parâmetros n e p quando ela conta o número de suces-
sos ocorridos na realização de n experimentos dicotômicos, nos quais a probabilidade de ocorrer sucesso é p. A
notação para essa distribuição é X~Bin(n;p).
Exemplo 7.5: Uma moeda é lançada cinco vezes consecutivas. Os resultados, cara (K) ou coroa (C), são apresen-
tados sequencialmente. Assim, por exemplo, CCKCK significa que o primeiro lançamento deu coroa, o segundo
deu coroa, o terceiro deu cara, o quarto deu coroa e o quinto deu cara. Temos que X é a variável que conta o
número de caras que ocorreram nesses lançamentos: por exemplo, X(CCKCK)=2, pois ocorreram duas caras. Ana-
logamente, X(KKCKK)=X(KKKKC)=4, pois em ambos os casos ocorreram quatro caras. Note que os lançamentos
podem ser considerados independentes (o resultado do primeiro lançamento não interfere no segundo, assim
por diante). Logo, podemos dizer que X tem uma distribuição binomial com parâmetros n=5 e p=0,5, já que a
probabilidade de ocorrer cara no lançamento de uma moeda é 0,5. Assim, para cada k entre 0 e 5, temos:
5 0,5n
( 5k (
P(X = k) =
( = 0,5k0,5n-k =
(
k

Por exemplo, a probabilidade de obter quatro caras no lançamento das cinco moedas é dada por:

( 54 5! . 1 = 5
P(X = 4) =
( = 0,54 =
4!(5-4)! 16 16

Denotamos X~Bin(5; 0,5).


Exemplo 7.6: Em uma urna há 20 bolas, das quais oito são brancas e 12 são pretas. Deseja-se retirar, com repo-
sição, seis bolas dessa urna. Considere X a variável aleatória que conta os números de bolas pretas retiradas.
Como as retiradas se dão com reposição, então elas podem ser consideradas como experimentos dicotômicos
independentes. Em cada retirada, a probabilidade de sair uma bola preta é p= 12 3
30 = 5 = 0,6. Logo, X~Bin(6; 0,6). A pro-
babilidade de serem retiradas k bolas pretas é dada por:

( 6k (0,6)k(1-0,6)6-k = 6 (0,6)k 0,46-k


(
P(X = k) =
( (
k

Por exemplo, a probabilidade de serem retiradas exatamente duas bolas pretas é dada por:
6!
( 62
P(X = 2) =
( (0,6)20,46-2 = (0,6)2 0,42 = 15 . 0,009216 = 0,13824
2!4!

ou seja, de 13,824%.

149
Estatística | Unidade 7 -Distribuição binomial

Por sua vez, a probabilidade de serem retiradas até duas bolas pretas é dada por:
P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) =

( 60 (0,6)00,46-0 + 6
(
=
( ( (0,6)10,46-1 + 0,13842 =
1
= 0,46 + 6.0,6.(0,4)5 + 0,13842 = 0,004096 + 0,036864 + 0,13842 =
= 0,1792

ou seja, de 17,92%. Finalmente, a probabilidade de serem retiradas até quatro bolas brancas é:
P(X≥2)=1-P(X<2)=1-P(X=0)-P(X=1)=1-0,004096-0,036864=0,95904
ou seja, de 95,904%.

Considere X a variável do exemplo 7.6. Calcule P(X=5) e P(X≤5).

Exemplo 7.7: Considere a situação do exemplo 7.2, na qual uma fábrica produzia por dia cem unidades de um
produto, das quais quatro eram defeituosas. Suponha que o dono da fábrica queira coletar aleatoriamente três
peças e verificar sua qualidade (defeituosa ou não defeituosa). Note que cada retirada de peça é um experimento
dicotômico, pois se deseja saber se ela tem ou não defeito. No entanto, se chamarmos de X a variável que conta
o número de peças não defeituosas coletadas pelo dono da fábrica, devemos notar que X não tem distribuição
binomial. Por quê? Note que, na extração da primeira peça, a probabilidade de obter uma peça não defeituosa
é 96/100. Porém, na segunda extração, essa probabilidade não se mantém, pois uma peça já foi retirada (o que
altera a probabilidade). Isso significa que as coletas não são independentes, já que altera a probabilidade de
“sucesso”. Portanto, não podemos utilizar a distribuição binomial para a modelar X.

É possível adaptar a situação do exemplo 7.7 de modo a obter uma variável com distribuição
binomial?

150
Estatística | Unidade 7 -Distribuição binomial

Assim como fizemos para a distribuição de Bernoulli, é possível fazer o gráfico da função de probabilidade de
uma variável com distribuição binomial:

Figura 7.5 - Gráfico da distribuição binomial.

Legenda: Gráfico da distribuição de X~Bin(n;p) para alguns pares (n,p).


Fonte: Wikimedia Commons.

Note na Figura 7.6 a seguir, por exemplo, o gráfico de distribuição da variável do exemplo 7.6:

Figura 7.6 - Gráfico de distribuição da variável X do exemplo 7.6.

Legenda: O gráfico foi gerado no R com os seguintes comandos:


> x<- 0:6
> fx <- dbinom(x, 6, 0.6)
> plot(x, fx, type=’h’)
151
Fonte: Gráfico gerado no software R.
Estatística | Unidade 7 -Distribuição binomial

Observe na Figura 7.6 que a probabilidade de X=4 (ou seja, de obter quatro bolas pretas e duas brancas) é a maior
de todas as situações possíveis.
Às vezes, o cálculo de uma determinada probabilidade para um variável binomial pode ser mais complicado
do que os exemplos que estamos fazendo nesta seção. Para facilitar esses cálculos, você pode adotar uma das
seguintes estratégias:
1. Utilizar tabelas da distribuição binomial, as quais apresentam centenas de valores de probabilidades
de X(X=k) para variáveis de alguns tipos X~Bin(n,p).. Veja, por exemplo, a tabela disponível na p. 508 em
“Estatística Básica”, de Bussab; Morettin (2012).
2. Utilizar calculadoras científicas ou softwares de computador específicos para Estatística (como o R ou até
mesmo o Excel). No Excel, por exemplo, você pode usar a função distrbinom.
É claro que a estratégia número dois é mais moderna e traz um conjunto infindável de possibilidades muito maior
do que a estratégia número um. Apesar disso, as tabelas ainda não perderam sua função.
Exemplo 7.8: Considere uma variável aleatória X com distribuição X~Bin(20;0,12). Para calcular P(X=7)“na mão”,
é preciso ter muita paciência. No entanto, utilizando o comando distrbinom do Excel, por exemplo, rapidamente
obtemos esse valor. Se você tiver esse software próximo de você, clique em qualquer célula e digite nela o comando:
distrbinom(7; 20; 0,12; FALSO)
Rapidamente você obterá que P(X=7)=0,005272, ou seja, 0,53% aproximadamente. Este comando tem quatro
parâmetros: para calcular a probabilidade de P(X=k), use o primeiro parâmetro igual a k, o segundo igual a n=20,
o terceiro igual a p=0,12 e o quarto igual a “FALSO” (esse último parâmetro diz para o Excel que queremos o valor
da função de probabilidade).

Considere a variável X~Bin(30;0,2). Calcule P(X≤3).

Para saber como utilizar o software R no cálculo de probabilidades de distribuições binomiais,


veja a seção 6.2 em “Distribuições de Probabilidade” (LEG/UFPR), a qual disponibilizamos o
link de acesso nas referências.

152
Estatística | Unidade 7 -Distribuição binomial

Se X~Bin(n,p) então sua esperança é dada por


E(X)=np
enquanto sua variância é dada por
Var(X)=np(1-p)

Para ver a demonstração de por que a esperança e a variância da distribuição binomial são
dadas pelas expressões anteriores, consulte Meyer (p. 141; p. 160).

Exemplo 7.9: Considere a variável X~N(5;0,5) do exemplo 7.5. A esperança de X é dada por E(x)=5.0,5=2,5 e a
variância por Var(X)=5.0,5.(1-0,5)=1,25.
Exemplo 7.10: A variável X~N(20;0,12) do exemplo 7.8 tem esperança E(X)=20.0,12=2,4 e variância igual a
Var(X)=20.0,12.0,88=2,112.
Podemos também calcular a função de distribuição acumulada de uma variável X~Bin(n;p):

{
0, se x < 0
k
F(x) = Σ0 P(x = k), se 0 ≤ x <n
1, se x > n

em que é o maior inteiro positivo menor ou igual a x.

Figura 7.7 - Gráfico da f.d.a. de X~Bin(n;p) para alguns valores.

Legenda: Gráfico da f.d.a. de X~Bin(n;p), para alguns pares (n;p).


153 Fonte: Wikimedia Commons.
Estatística | Unidade 7 -Distribuição binomial

A seguir vemos, por exemplo, o gráfico da f.d.a. da variável X do exemplo 7.6:

Figura 7.8 - Gráfico da f.d.a. da variável X do exemplo 7.6.

Legenda: Gráfico da f.d.a. de X~Bin(6;0,6).


Fonte: Gráfico obtido no software R.

Antes de finalizar esta seção, vamos entender por que a probabilidade de uma variável binomial X~Bin(n,p)
é dada por:

( nk
P(X = k) =
( = pk(1 - p)n-k

Se X~Bin(n,p), então X conta o número de sucessos obtidos na realização de n experimentos dicotômicos inde-
pendentes. Denote sucesso por S e fracasso por F. Vamos calcular a probabilidade de P(X=k), ou seja, a probabili-
dade de obter k S e n-k F na sequência que enumera os experimentos realizados. A probabilidade de ocorrer S em
cada experimento é p e de ocorrer F é q=1-p. Logo, a probabilidade de cada sequência com k S e n-k F é:
pk q(n-k)
Resta saber quantas sequências com k letras S e n-k letras F existem. Para isso, devemos escolher k posições da
sequência com n letras para por as letras S, de modo que a ordem em que elas serão colocadas não importe e,
n
depois, escolher as outras posições já ficarão determinadas para serem a letra F. Logo, há C(n,k) = ( k sequências
(
determinadas por k letras S e n-k letras F. Portanto, a probabilidade de uma sequência conter k letras S e n-k letras
F é dada por

( nk
( = pkqn-k

como queríamos demonstrar.

154
Estatística | Unidade 7 -Distribuição binomial

7.3 Aplicações da distribuição binomial


A distribuição binomial tem enorme utilidade prática, como já podemos ter notado na seção anterior. Nesta
seção, faremos uma série de exemplos de distribuição binomial aplicada a várias áreas.
Exemplo 7.11: (aplicação à indústria) Várias circunstâncias envolvendo o controle de qualidade de produtos pro-
duzidos por uma indústria podem ser modeladas por variáveis aleatórias com distribuição binomial. Considere,
por exemplo, que uma indústria tenha produzido em um dia mil unidades de um produto. Dessas unidades, 30
estão fora do padrão de qualidade. Um analista de qualidade selecionará, com reposição, dez unidades desse
produto. Vamos calcular a probabilidade de que no máximo uma unidade dentre as dez selecionadas esteja fora
do padrão de qualidade. Podemos considerar a variável aleatória X que conta o número de unidades fora do
padrão de qualidade na amostra selecionada. Como a seleção é feita com reposição, então a variável X tem dis-
tribuição binomial Bin(10,p), em que p é a probabilidade de selecionar uma unidade fora do padrão em uma
30
retirada, ou seja, p =1000 = 0,03. Assim, a probabilidade de que no máximo uma unidade dentre as dez selecionadas
esteja fora do padrão de qualidade é:
P(X≤1)=P(X=0)+P(X=1) ≈ 0,7374+0,2281=0,9655
ou seja, 96,55% aproximadamente (cálculos feitos no software Excel). Note que o valor esperado da variável X é:
E(X)=np=10.0,03=0,3
ou seja, “em média”, a amostra selecionada terá até um produto selecionado fora do padrão de qualidade. O
gráfico da f.d.a. de X está representado na Figura7.9 a seguir:

Figura 7.9 - Gráfico da f.d.a. da variável X do exemplo 7.11.

Legenda: Gráfico da f.d.a. de X~Bin(10;0,03) do exemplo 7.11.


Fonte: Gráfico obtido no software R.

155
Estatística | Unidade 7 -Distribuição binomial

Exemplo 7.12: (aplicação à medicina) Exemplos básicos de variáveis binárias aplicadas ao contexto da medicina
são a existência, o diagnóstico e a cura de uma doença. Suponha que um indivíduo tenha uma determinada
doença, mas que um médico ainda não saiba isso. Devido ao desconhecimento do profissional, ele pede para que
seja feito um exame. A probabilidade de que o resultado dê “positivo” é de 80%. A fim de minimizar a possibili-
dade de erro, o médico pede que o paciente faça o exame duas vezes. Calculemos a probabilidade de ambos os
resultados darem “negativo”. Para isso, vamos considerar a variável X que conta o número de resultados positivos
obtidos nos dois exames. Assim, X˜Bin(2;0,8), pois serão realizados dois testes e a probabilidade de cada um deles
dar positivo é de 80% (podemos supor independência nos testes). Logo, a probabilidade pedida é:

( 20
P(X = 0) =
( 0,80(1-0,8)2-0 = 1.1.0,22 = 0,04

Portanto, a probabilidade de que ambos os exames serem negativo é de 4%. Note que esse é o único caso em que
o médico daria alta ao paciente, já que se o resultado desse positivo em ambos os testes o médico certamente iria
iniciar o tratamento. Se desse positivo em um e negativo em outro, certamente seria recomendado um terceiro
teste para “tirar a prova”.
Exemplo 7.13: (aplicação à construção civil) Em uma obra, suponhamos que a chance de um pedreiro sofrer
um acidente seja de 1% e que haja 250 pedreiros trabalhando no local. Calculemos o valor esperado e a variân-
cia correspondente ao número de pedreiros acidentados nesta obra. Defina a variável X que conta esse número
desses trabalhadores acidentados. Admitindo que haja independência entre os pedreiros nesse assunto, pode-
mos admitir que X é uma variável aleatória com distribuição binomial com parâmetros n=250 e p=0,01, isto é,
X~Bin(250;0,01). Logo, o valor esperado é:
(X)=np=250.0,01=2,5
A variância é dada por:
Var(X)=np(1-p)=250.0,01.0,99=2,475
Isso implica um desvio padrão de:
DP(X) = √Var(X) = √2,475 ≈ 1,57

Isso nos leva a concluir que, “em média”, dois ou três pedreiros devem sofrer algum tipo de acidente, pois a
esperança é 2,5. Deve haver um erro nessa contagem na prática, pois estamos fazendo uma previsão. Porém,
prevendo também o erro ocorrido (que corresponde ao desvio padrão de 1,57), concluímos que o número de
pedreiros acidentados muito possivelmente estará no intervalo:
[2,5-1,57;2,5+1,57]=[0,93;4]
Isso deve levar o responsável pela obra ao bom senso de fazer um seguro para o local, pois ele sabe (com base
nesses dados) que muito possivelmente pelo menos um pedreiro deve ser acidentado.
Exemplo 7.14: (aplicação militar) Em uma operação militar, o comandante deseja saber qual é a probabilidade
de seu atirador acertar seus alvos. Com base nos treinos desse atirador, o comandante sabe que a chance de
acertá-lo é de 75%. Suponha que na operação militar em questão o atirador precise acertar três alvos utilizando
uma arma com silenciador. Calculemos a probabilidade de esse atirador acertar os três alvos. Seja X a variável que
conta o número de acertos do atirador nesses alvo, podemos considerar que o tiro a cada um dos alvos é inde-
pendente – supondo que cada um dos alvos não esteja em contato com os outros (isso é suficiente, já que a arma
tem silenciador). Então, X pode ser considerada uma variável aleatória com distribuição binomial com parâmetros
n=3 e p=0,75. Assim, a probabilidade do atirado acertar os três alvos é dada por:

( 33
P(X = 3) =
( (0,75)3(1-0,75)3-0 = 0,421875 ≈ 42,19%

156
Estatística | Unidade 7 -Distribuição binomial

Portanto, a chance do atirador acertar os três alvos é menor do que 50%. Sabendo disso, o comandante pode
concluir que a estratégia de atirar nos três alvos não parece ser a melhor.
Exemplo 7.15: (aplicação às escolas) Suponhamos que a probabilidade de uma pessoa ser canhota é de 10%.
Uma sala de aula deverá ter capacidade para 40 alunos. A fim de mobiliar essa sala de aula, o diretor da escola
decide comprar carteiras “com braço” para preencher a sala. Porém, ele precisa saber quantas dessas cadeiras
devem ser para canhotos e quantas para destros. Para isso, ele deve usar a variável X que conta o número de
canhotos dessa sala de aula. De acordo com o contexto, podemos supor que X~Bin(40;0,1). Assim, a esperança
de X é:
E(X)=n.p=40.0,1=4
a variância de X é:
Var(X)=n.p.(1-p)=40.0,1.0,9=3,6
e o desvio padrão de X é:
DP(X) = √Var(X) = √3,6 ≈ 1,897

Logo, o diretor pode decidir comprar quatro cadeiras para essa sala (já que este é o número esperado de alunos
canhotos). No entanto, para manter o erro sob controle, ele pode garantir que haja um número de cadeiras de
canhotos dentro do intervalo [E(X)-DP(X),E(X)+DP(X)], isto é, [2,103;6,897]. Portanto, poderíamos aconselhá-lo
a comprar não só as 40 cadeiras previstas (das quais quatro são para canhotos), mas também comprar duas
cadeiras a mais para destros (caso haja apenas duas canhotos, o que corresponde praticamente ao valor mínimo
do intervalo anterior) e mais três para canhotos (caso haja sete canhotos, o que corresponde aproximadamente
ao valor máximo do intervalo anterior). A função de distribuição acumulada de X é dada na Figura 7.10 a seguir:

Figura 7.10 - Gráfico da f.d.a. da variável X do exemplo 7.15.

Legenda: Gráfico da f.d.a. de X~Bin(40;0,1) do exemplo 7.15.


Fonte: Gráfico obtido no software R.

157
Estatística | Unidade 7 -Distribuição binomial

Nosso desafio continua no Fórum. Organize-se com seu grupo para a tarefa da unidade que
é: Utilizando os conhecimentos adquiridos sobre variáveis discretas, calcule a probabilidade
de retirar amostras com cinco cidades das quais três possuam “sim” (ou similar) como res-
posta para uma de suas variáveis binárias.

158
Referências bibliográficas
O itinerário percorrido nesta unidade nos levou a conhecer a distribuição
binomial. Estudamos:
• Distribuição de Bernoulli: vimos sua definição para experimentos
dicotômicos, expressões para sua esperança, variância e função
de distribuição acumulada, e visualizamos uma série de exemplos.
• Distribuição binomial: percebemos que ela pode ser aplicada
a variáveis que contenham o número das ocorrências de inte-
resse na realização de diversos experimentos dicotômicos inde-
pendentes. Vimos e justificamos a sua função de probabilidade,
definimos expressões para sua esperança, variância e função de
distribuição acumulada. Estudamos a aplicação dos conceitos
em vários exemplos.
• Um exemplo de situação em que a distribuição binomial não deve
ser aplicada.
• Exemplos em situações práticas em que podemos utilizar a dis-
tribuição binomial para tirar conclusões e estabelecer estratégias.

159
Referências bibliográficas
BUSSAB, W. de O.; MORETTIN, P. A. Estatística Básica. 7. ed. São Paulo:
Saraiva, 2012.

LEG/UFPR. Distribuições de Probabilidade. Disponível em: <http://www.


leg.ufpr.br/Rpira/Rpira/node7.html>. Acesso em: 24 Fev. 2017.

MEYER, P. L. Probabilidade: Aplicações à Estatística. Rio de Janeiro: LTC,


2010.

160
Unidade de estudo 8

Distuibuição Normal
Para iniciar seus estudos
Por fim chegamos à última unidade dos nossos estudos. Na unidade ante-
8
rior estudamos o principal tipo de distribuição de probabilidades para uma
variável aleatória discreta. Nesta unidade estudaremos a mais utilizada
entre todos os tipos de distribuição de probabilidade, em particular den-
tre as variáveis contínuas: a distribuição normal. Tal tipo de distribuição
é tão útil que até mesmo variáveis com distribuição binomial (discretas)
podem ser aproximadas por uma distribuição normal em determinadas
circunstâncias. São inúmeras as utilidades práticas da distribuição normal
para a modelagem de variáveis, como veremos nesta unidade. Atentos à
riqueza oferecida pela distribuição normal ao nosso processo de aprendi-
zagem, fechemos com chave de ouro nossos estudos introdutórios sobre
Estatística. Bons estudos!

Objetivos de Aprendizagem

• Definir formalmente a distribuição normal de uma variável con-


tínua.
• Analisar o gráfico “de sino” e as principais características da distri-
buição normal.
• Fazer exemplos práticos com o uso de tabelas e/ou ferramentas
digitais.
Tópicos de estudo:
• 8.1 A distribuição normal
• 8.2 A distribuição normal padrão
• 8.3 Aplicações da distribuição normal

162
Estatística | Unidade de Estudo 8 – Distribuição Normal

8.1 A distribuição normal


A mais utilizada entre as distribuições de probabilidade é a distribuição normal, assunto desta unidade. Ela é
importante porque modela inúmeros fenômenos, como: a altura média das pessoas, clima e tempo, medições
de produtos manufaturados, entre outros. A distribuição normal também ganha destaque por conta do cha-
mado Teorema do Limite Central de Abraham De Moivre (1733). Este teorema que prova que a variável que mede
o resultado médio de um mesmo experimento realizado várias vezes pode ser modelado pela distribuição normal.
Por exemplo: Considere que iremos retirar, de tempos em tempos, um pacote dentre todos os pacotes produzi-
dos de um determinado produto em uma fábrica. A variável que mede o peso médio desses pacotes retirados de
tempos em tempos pode ser modelada pela distribuição normal.

Para saber mais sobre os assuntos abordados até aqui, leia seção 4-6 do livro: MONTGO-
MERY, Douglas C., RUNGER, George C. Estatística aplicada e probabilidade para engenheiros.
Rio de Janeiro: LTC Ed., 2009. Nessa leitura você irá ver a aplicação do Teorema do Limite
Central em alguns outros exemplos.

Vejamos algumas definições:


2
Definição 8.1: Dizemos que uma variável aleatória contínua X tem distribuição normal com parâmetros μ e ó 2
se a sua função de densidade de probabilidade for dada por:

( xì − )2
1 −
=f ( x) e 2ó 2
, x ∈ .
ó 2ð

Em que π é número “pi” (comprimento dividido pelo diâmetro de qualquer circunferência) e e é o número de
Neper.

Nesse caso, denotamos (


X  N µ ,σ 2 )

A distribuição normal também costuma ser chamada de distribuição gaussiana, devido aos estudos de Gauss no
século XIX, muitos dos quais já haviam sido feitos por De Moivre no século anterior, mas que eram desconhecidos
por Gauss.
A expressão dada na definição de distribuição normal é um tanto quanto esquisita para uma primeira impressão.
No entanto, seu gráfico é dado por uma figura muito interessante:

163
Estatística | Unidade de Estudo 8 – Distribuição Normal

Figura 8.1 - Gráfico da função de densidade de probabilidade de

Legenda: O traço em forma de “sino” é o gráfico da função de densidade de probabilidade de ( )


X  N µ ,σ 2

. Na figura estão indicados os pontos μ, que corresponde ao ponto máximo do gráfico, e os pontos μ±3 σ .
Fonte: Wikimedia Commons.

Como podemos perceber na figura 8.1, o gráfico de uma distribuição normal tem forma de sino. Essa curva é
usualmente chamada de curva normal ou curva gaussiana. Observe alguns fatores importantes a respeito desta
curva:
• O ponto máximo da curva normal se dá em μ, indicando que a moda da distribuição normal é μ;
• A curva é simétrica em relação do eixo determinado por μ, o que nos leva a concluir que μ é a mediana de
(
X  N µ ,σ 2 ) e que a distribuição normal é perfeitamente simétrica;

• À medida em que os pontos no eixo X se afastam de μ o valor da função diminui abruptamente, de


maneira mais acentuada a partir dos pontos μ± σ ;
• A
“área” abaixo da curva normal e acima do eixo x é igual a 1 (seria melhor se disséssemos que tende a 1),
o que justifica o fato de que a f(x) seja, de fato, uma função de densidade de probabilidade;
• E ntre os pontos μ- σ e μ+ σ a área sob o gráfico (ou seja, a probabilidade nesse intervalo) corresponde a
aproximadamente 0,68, entre os pontos μ-2 σ e μ+3 σ esse valor chega a mais de 95%, e entre os pontos
μ-3 σ e μ+3 σ ele passa de 99% (veja a figura 8.2).

164
Estatística | Unidade de Estudo 8 – Distribuição Normal

com µ 0, 48e σ ≅ 0,31


Figura 8.2 - Gráfico da distribuição normal=

Legenda: Na figura é indicada a porcentagem da área abaixo do gráfico em determinados intervalos µ ± kσ


Fonte: Wikimedia Commons

2
Se X é uma variável aleatória com distribuição normal com parâmetros μ e ó então a esperança de X é dada por
2
μ e a variância é dada por ó . É por isso que costumamos dizer que X é uma variável aleatória com distribuição
2
normal com média μ e variância ó

Figura 8.3 - Gráfico da função de densidade de probabilidade de (


X  N µ ,σ 2 ) para alguns valores de μ e ó 2 .

Legenda: Notamos nesta figura que o gráfico de uma distribuição normal pode ser mais concentrado
em torno da média (se a variância é pequena) ou pode ser mais distribuído (se a variância é alta).
Fonte: Wikimedia Commons.

165
Estatística | Unidade de Estudo 8 – Distribuição Normal

A seguir vemos o gráfico da função de distribuição acumulada de X em cada um dos casos da figura 8.3:

Figura 8.4 - Gráfico da função de distribuição acumulada de (


X  N µ ,σ 2 ) em alguns casos.

Legenda: O gráfico da função de distribuição acumulada nos permite obser-


var que há um intervalo onde o crescimento é acentuado.
Fonte: Wikimedia Commons.

Exemplo 8.1: Seja X a variável que mede o tamanho de parafusos em uma amostra, a qual tem média 3 cm e vari-
ância 0,5 cm. Assim, podemos admitir que X ∼ N ( 3;0,5) . A esperança de X é 3 (e coincide com a mediana e a moda
dessa amostra) e o desvio padrão é ó = 0, 5 . Assim, a função de densidade de probabilidade de X é dada por:

1 − ( x − 3)2
=f ( x) e , x∈
ð

O gráfico dessa função e também o gráfico da função de distribuição acumulada de X estão dados abaixo:

166
Estatística | Unidade de Estudo 8 – Distribuição Normal

X ∼ N ( 3;0,5 )
Figura 8.5 - Gráfico da função de densidade de probabilidade de

Legenda: Gráfico da função de densidade de probabilidade de X no exem-


plo 8.1, obtido no software R utilizando os seguintes comandos:
> x <- seq(0, 6, len=100)
> fx <- dnorm(x, 3, sqrt(0.5))
> plot(x, fx, type=’l’)
Fonte: Gráfico obtido no software R.

167
Estatística | Unidade de Estudo 8 – Distribuição Normal

X ∼ N ( 3;0,5 )
Figura 8.6 - Gráfico da função de distribuição acumulada de

Legenda: Gráfico da função de densidade de probabilidade de X no exem-


plo 8.1, obtido no software R utilizando os seguintes comandos:
> x <- seq(0, 6, len=100)
> fx <- pnorm(x, 3, sqrt(0.5))
> plot(x, fx, type=’l’)
Fonte: Gráfico obtido no software R.

A probabilidade de uma variável aleatória X ∼ N ( 3;0,5) admitir valores em um intervalo [ 1 2 ] é dada pela área
x ,x

x1 x2
abaixo do gráfico da função de densidade de probabilidade de X entre os extremos e , conforme indica a
figura seguinte.
Calcular essa probabilidade utilizando a função de densidade de probabilidade é algo não recomendado. O cál-
x x
culo da integral dessa função é inviável. Observe que 1 e 2 podem assumir valores de -∞ e +∞ (mas nesse caso
o conceito de “área” deve ser entendido no sentido assintótico).

168
Estatística | Unidade de Estudo 8 – Distribuição Normal

Figura 8.7 - Representação gráfica de P ( x1 ≤ X ≤ x2 ) , quando (


X  N µ ,σ 2 ).

Legenda: A região em vermelho tem área igual à probabilidade de (


X  N µ ,σ 2 ) assumir valores entre x1 e x2 .
Fonte: Wikimedia Commons.

8.2 A distribuição normal padrão


Já vimos que o cálculo da probabilidade de uma variável com distribuição normal em um determinado intervalo é
inviável de ser feito utilizando a integral da função de densidade de probabilidade. Porém, computacionalmente
é possível calcular essa probabilidade. Isso nos indica que devemos, mais do que nunca, recorrer a tabelas ou sof-
twares em nossos cálculos. As tabelas e softwares disponíveis, em geral, calculam valores de probabilidades para
uma variável com distribuição binomial com parâmetros ì = 0 ó = 1 :
2

Definição 8.2: A distribuição normal N(0,1) é chamada de distribuição normal padrão.


A maior parte das tabelas de distribuição normal disponíveis em livros e a maior parte dos softwares estatísticos
dão valores de probabilidades para variáveis com distribuição normal que seja padrão. Quando a variável não tem
distribuição padrão, precisamos convertê-la em uma que seja, a fim de calcular a probabilidade desejada.
X −µ
O fato importante aqui é que, se X é uma variável aleatória com distribuição N ( µ , σ ) então a variável σ tem
2

distribuição normal padrão. É esse fato que nos permite calcular probabilidades utilizando tabelas ou softwares.
A tabela de distribuição da normal de P(0≤Z≤z) é:

169
Estatística | Unidade de Estudo 8 – Distribuição Normal

Tabela 8.1: Tabela de distribuição normal

No software Excel, que vamos usar como base para os cálculos nesta seção, você pode utilizar a função dist.normp,
que dá a função de distribuição acumulada da distribuição normal padrão em um ponto z, ou seja, P(X≤z). Se
você prefere utilizar outro software, informe-se sobre quais recursos pode utilizar para calcular probabilidades de
uma variável com distribuição normal padrão.
Quando uma variável segue uma distribuição (binomial, exponencial, gama, geométrica, etc), nem sempre ela é
=
considerada distribuição normal padrão (que possui ì 0=e ó 2 1 ). Sendo assim, devemos utilizar um mecanismo

170
Estatística | Unidade de Estudo 8 – Distribuição Normal

para transformar essa variável em normal padrão, visto que a tabela que conhecemos, que é a tabela de distribui-
ção da variável normal padrão, utiliza valores padrões para a variável aleatória normal.
As tabelas para a variável normal padronizada podem ser do tipo P(∞<Z≤z) ou P(0≤Z≤z). No primeiro caso, os
valores negativos para Z estão inclusos no cálculo da probabilidade. No segundo caso esses valores não estão
incluídos. Você deve estar atento a qual tipo de tabela que você está analisando.
Para calcular as probabilidades associadas à distribuição normal, devemos utilizar o seguinte artifício.

x−µ
Z=
σ
Dessa forma, com os valores de média μ e desvio padrão σ fornecidos, com o x relatado no enunciado do exercí-
cio, encontramos o valor para a variável normal padronizada. Feito isso, precisamos recorrer à tabela de distribui-
ção da variável normal padrão e utilizar o valor de Z encontrado. Geralmente, as tabelas nos dão a probabilidade
P(Z≤z), que possui o mesmo significado que P(∞<Z≤z), abrangendo também os valores negativos de z. Por fim,
caso queiramos encontrar a probabilidade de obtermos valores superiores àquele x fornecido no exercício, deve-
mos utilizar o artificio 1-P(Z≤z). No entanto, se estivermos interessados em calcular a probabilidade de valores
inferiores ou iguais a x, utilizamos a probabilidade fornecida por P(Z≤z).
Mas você pode estar se perguntando: qual é a utilidade da utilização de uma variável normal padronizada Z? Não
seria mais fácil calcular diretamente a probabilidade pela função densidade de probabilidade da variável que
estou analisando?
A grande utilidade do artifício acima é evitar cálculos dispendiosos de probabilidade. Você pode padronizar as
variáveis aleatórias e encontrar o valor referente a variável normal padrão e obter a probabilidade de maneira
extremamente rápida. Mas lembre-se, você precisará ter ao seu alcance a tabela de distribuição da variável nor-
mal padronizada para encontrar os valores de probabilidade que foram pedidos. É extremamente importante que
você veja como é a tabela fornecida, se ela fornece valores P(∞<Z≤z) ou P(0≤Z≤z).
E não, não é mais fácil calcular diretamente a probabilidade pela função densidade de probabilidade da variável.
Para calcularmos as probabilidades por meio do uso de funções densidades de probabilidades, precisamos cal-
cular os valores das integrais, sendo que algumas são de complexa resolução.
O Exemplo a seguir irá esclarecer o conceito de padronização de variável aleatória normal e você verá o quão
simples e rápidos são os cálculos de probabilidades.
Exemplo 8.2: Uma determinada variável aleatória normal possui os seguintes parâmetros μ=1 e σ =2. Sendo
assim, faça o que se pede:
a) Qual é a probabilidade de encontrarmos valores menores ou iguais a 3?
Primeiro precisamos encontrar qual é o valor da variável normal padrão para o caso em questão.
Temos a seguinte expressão:

x−µ
Z=
σ
3 −1
Z=
2
Z =1
Agora precisamos recorrer à tabela da variável normal padronizada.

171
Estatística | Unidade de Estudo 8 – Distribuição Normal

A tabela é:

Tabela 8.2: Tabela da variável normal padronizada

Legenda: Tabela da Variável normal padronizada


Fonte: Adaptada de Bussab e Morettin (2012, p 511)

Temos que o valor fornecido para P(0≤Z≤1) é 0,3413. Devemos somar 0,5 da probabilidade P(-∞<Z≤0), porque
essa tabela fornece apenas P(0≤Z<∞).
Assim, podemos dizer que a probabilidade de encontrarmos valores menores ou iguais a 3 é igual a 0,8413 ou
84,13%.
b) Qual é a probabilidade de encontrarmos valores maiores do que 4?
A expressão para encontrar a variável normal padronizada é:

x−µ
Z=
σ
4 −1
Z=
2
Z = 1,5

172
Estatística | Unidade de Estudo 8 – Distribuição Normal

A tabela é:

Tabela 8.3: Variável normal padronizada

Legenda: Tabela da Variável normal padronizada


Fonte: Adaptada de Bussab e Morettin (2012, p 511)

Temos que o valor fornecido para P(0≤Z≤1,5) é 0,4332. Devemos somar 0,5 da probabilidade P(-∞<Z≤0), porque
essa tabela fornece apenas P(0≤Z<∞).
Desse modo, temos que P(Z≤1,5) é 0,9332. No entanto estamos interessados em calcular a probabilidade de
valores maiores dou que 4. Logo, devemos utilizar 1-P(Z≤1,5), que é 0,0668 ou 6,68%.
c) Qual é a probabilidade de encontrarmos valores entre 1 e 3?
Primeiro vamos encontrar a probabilidade de serem encontrados valores menores ou iguais a 3.
A expressão para a variável normal padronizada é:

x−µ
Z=
σ
3 −1
Z1 =
2
Z1 = 1

173
Estatística | Unidade de Estudo 8 – Distribuição Normal

Veja na tabela:

Tabela 8.4: Variável normal padronizada

Legenda: Tabela da Variável normal padronizada


Fonte: Adaptada de Bussab e Morettin (2012, p 511)

Temos que o valor fornecido para P(0≤Z≤1) é 0,3413. Devemos somar 0,5 da probabilidade P(-∞<Z≤0), porque
essa tabela fornece apenas P(0≤Z<∞).
Logo, temos que P(Z_1≤1) é 0,8413.
Agora vamos encontrar a probabilidade de valores menores ou iguais a 1.
A expressão para a variável normal padronizada é:

x−µ
Z=
σ
1−1
Z2 =
2
Z2 = 0

174
Estatística | Unidade de Estudo 8 – Distribuição Normal

Veja na tabela:

Tabela 8.5: Variável normal padronizada

Legenda: Tabela da Variável normal padronizada


Fonte: Adaptada de Bussab e Morettin (2012, p 511)

Temos que o valor fornecido para P(Z=0) é 0,0000. Devemos somar 0,5 da probabilidade P(-∞<Z≤0), porque
essa tabela fornece apenas P(0≤Z<∞).
Logo, temos que P(Z_2≤0) é 0,5.
Agora é necessário que façamos a subtração das probabilidades encontradas, pois queremos encontrar valores
que se situam entre os dois limites que foram fornecidos.
Assim, a probabilidade de encontrarmos valores situados entre 1 e 3 é dada pela diferença dos valores encontra-
dos, ou seja P(1≤x≤3)=0,8413-0,5=0,3413 ou 34,13%.
Veja como foram simples os cálculos. Caso você queira fazer as contas por meio das funções densidades de pro-
babilidade, elas seriam bem mais complexas e apresentariam resultados semelhantes a esses encontrados.
Os exemplos a seguir irão mostrar como realizar esses cálculos utilizando o Excel.

Exemplo 8.3: Considere uma variável X com distribuição N(10,4). Assim, como σ = 4 , então σ = 2 (pois σ deve
2

ser sempre positivo). Considere a variável

X −ì X − 10
=Y = .
ó 2

Pelo que dissemos acima, Y ∼ N ( 0,1) . Vamos calcular algumas probabilidades envolvendo X:
a) Qual é a probabilidade de X ser maior do que 10?
Note que 10 é a média de X. Neste caso, basta observar o gráfico da função de densidade de probabilidade de X
para ver que P(X>10)=0,5, já que o gráfico é simétrico e metade do gráfico se encontra à direita de 10:

175
Estatística | Unidade de Estudo 8 – Distribuição Normal

Figura 8.8 - Gráfico da função de densidade de probabilidade de Y ∼ N ( 0,1) .

Legenda: A figura indica a região delimitada pelo gráfico a partir de X=10.


Fonte: Gráfico obtido no software R.

a) Qual é a probabilidade de X ser menor do que 12?


O que queremos, neste caso, é calcular P(X≤12). Porém, vamos utilizar Y como auxiliar. Precisamos “trocar” X por
Y na expressão acima. Para isso, devemos subtrair μ de ambos os lados da desigualdade e dividir por σ :

 X − 10 12 − 10 
P ( X ≤ 12 ) = P  ≤  = P (Y ≤ 1) .
 2 2 

Portanto, calcular P(X≤12) é o mesmo que calcular P(Y≤1). Porém P(Y≤1) é a função de distribuição acumulada
de uma distribuição normal padrão calculada no ponto z=1. Utilizando a função dist.normp(z) no Excel aplicada
em z=1, obtemos:

P ( X ≤ 12=
) P (Y ≤ 1) ≅ 0,8413.
Portanto, a probabilidade de X ser menor do que 12 é de aproximadamente 84%.
c) Qual é a probabilidade de X estar entre 7 e 11?
O que queremos é calcular P(7≤X≤11). Para isso, vamos trocar X por Y, subtraindo μ em todos os termos da desi-
gualdade e dividindo por σ :

 7 − 10 X − 10 11 − 10   3 1
P ( 7 ≤ X ≤ 11) = P  ≤ ≤  = P− ≤Y ≤ 
 2 2 2   2 2

Agora o que precisamos é calcular P(-3/2≤Y≤1/2). Para isso, vamos utilizar a função de distribuição acumulada
de Y, denotada por F:

 3 1 1  3
P− ≤Y ≤ = F  − F − 
 2 2 2  2

176
Estatística | Unidade de Estudo 8 – Distribuição Normal

pois a probabilidade de uma variável em um intervalo é sempre igual à diferença entre a função de distribui-
ção acumulada calculada no extremo superior menos a função de distribuição acumulada calculada no extremo
inferior. Note que F(z) é dada exatamente pela função dist.normp(z) no Excel. Utilizando esse software, vemos
1  3
F   ≅ 0, 6915 0, 0668
F −  =
que  2  e que  2  . Logo,

 3 1
P  − ≤ Y ≤  ≅ 0, 6915 − 0, 0668 =
0, 6247
 2 2

ou seja, a probabilidade de X entre 7 e 11 é igual a aproximadamente 62,47%.


Exemplo 8.4: Seja X a variável aleatória correspondente ao “peso” de recém-nascidos, em gramas. Suponha que
X tenha uma distribuição normal N(2800,250000), ou seja, μ=2800 e σ =√250000=500.
a) Vamos calcular a probabilidade de um recém-nascido pesar menos de 3000 quilos, isto é P(X≤3000). Seja
X − 2800
=Y ∼ N (0,1)
500 . Então, sendo F(z)=P(Y≤z) a função de distribuição acumulada de Y, temos:

 X − 2800 3000 − 2800   2 2


P ( X ≤ 3000 )= P  ≤ = P  Y ≤ = F   ≅ 0, 6554.
 500 500   5  5

Portanto, a probabilidade de um recém-nascido peso menos de 3000 quilos é de 65,54% aproximadamente.


b) Vamos calcular a probabilidade de um recém-nascido pesar entre 2500 quilos e 3000 quilos, isto é,
P(2500≤X≤3000). Assim,

 X − 8 10 − 8 
P ( X > 10 ) =1 − P ( X ≤ 10 ) = 1− P  ≤ =
 2 2 
= 1 − P (Y ≤ 1) = 1 − F (1) ≅ 1 − 0,84134 = 0,15866

Portanto, a probabilidade de que o limite regulatório seja extrapolado é de aproximadamente 16%.


Em certas ocasiões pode ser necessário que apliquemos esse processo de maneira reversa. Suponha que você
deseja saber um intervalo em torno da média de uma variável com distribuição normal que contenha determi-
nada probabilidade. Isso significa que você quer descobrir valores x_1 e x_2 tais que P(x_1≤X≤x_2 )=p, onde p é
a probabilidade que você deseja. O exemplo a seguir elucida este fato:

Exemplo 8.6: Seja X ∼ N (0,1) . Desejamos encontrar um intervalo que contenha 95% de probabilidade de ocorrên-
cia, ou seja, [a,b] tal que P(a≤X≤b)=0,95.
Sendo F(z)=P(X≤z) a função de distribuição acumulada de X, então o que queremos é descobrir [a,b] tal que
F(b)-F(a)=0,95. Tomemos, por exemplo, valores a e b que sejam simétricos em torno da média μ=0, ou seja,
a=-b. Logo, devido à simetria da curva normal, 1-F(a)=F(b), isto é,
0, 05
1 − F ( a ) − F ( a ) =0,95 ⇔ F ( a ) = =0, 025
2

Isso significa que 2,5% do gráfico está abaixo de a, 2,5% do gráfico está acima de b e, logo, os outros 95% estão
entre a e b. A figura a seguir esclarece este fato:

177
Estatística | Unidade de Estudo 8 – Distribuição Normal

Figura 8.9 - Gráfico da função de densidade de probabilidade de X no exemplo 8.7.

Legenda: 47,5% do gráfico está entre a e μ=0, enquanto 47,5% do gráfico está entre μ=0 e b.
Fonte: Wikimedia Commons.

Logo, o que precisamos descobrir é o valor de a<0 tal que F(a)=0,025. Isso significa que precisamos da inversa de
−1 −1
F, denotada por F , e do valor a = F (0, 025) . No software Excel, essa inversa é dada pela função inv.normp.

Podemos também utilizar as tabelas presentes nos livros para esse cálculo. Por exemplo, pela
tabela de Estatística Básica. 7. ed. (BUSSAB & MORETTIN, 2012, p. 511)..

Perceba que a=-1,96, já que P(0≤X≤1,96)=0,475=1-0,025. Por sua vez, utilizando o Excel, calculamos a função
inv.normp(0,025) que resulta em:

=a F −1 ( 0, 025 ) ≅ −1,96.

Portanto, o intervalo [a,b]=[-1,96;1,96] tem probabilidade de 95% de ocorrência da variável X.

Exemplo 8.7: Seja X ∼ N (15,9) . Vamos encontrar um intervalo em que a probabilidade de ocorrência de X seja de
90%. Ao invés de acharmos um intervalo simétrico, como fizemos no exemplo anterior, podemos encontrar um
valor a tal que o intervalo ]-∞,a] tenha probabilidade de 90% de ocorrência. Assim, basta-nos encontrar a tal que
X − 15 X − 15
=Y = ∼ N (0,1)
P(X≤a)=90%. Porém, como X não é padrão, precisamos convertê-la para 9 3 . Assim:

 X − 15 a − 15   a − 15 
P ( X ≤ a) =P ≤ =P Y ≤ =0,9.
 3 3   3 

Denotemos b=(a-15)/3. Assim, queremos b tal que F(b)=P(Y≤b)=0,9, em que F é a função de distribuição acu-
mulada de Y ∼ N ( 0,1) . . Calculando inv.normp(0,9) no Excel, obtemos
=b F −1 ( 0, 9 ) ≅ 1, 28.

178
Estatística | Unidade de Estudo 8 – Distribuição Normal

Daí, encontramos a:

a − 15
b= ⇔ a = 3b + 15 ⇔ a = 18,84
3

Logo, o intervalo ]-∞;18,84] tem probabilidade de 90% de ocorrência para a variável X.

Figura 8.10 - Gráfico da função de densidade de probabilidade de X no exemplo 8.7.

Legenda: 90% da área abaixo do gráfico encontra-se até 18,84.


Fonte: Gráfico obtido no software R.

Seja X ∼ N (3;0,5) Encontre um intervalo com 97% de probabilidade de ocorrência de X

179
Estatística | Unidade de Estudo 8 – Distribuição Normal

8.3 Aplicações da distribuição normal


A distribuição normal pode ser aplicada a inúmeros contextos. A seguir faremos alguns exemplos que nos aju-
dam a entender essa imensa aplicabilidade:

Exemplo 8.8: A altura média dos alunos de uma certa sala de aula pode ser modelada por uma variável X ∼ N (168,50)
já que a média é 168 cm e o desvio padrão é de √50 cm. Vamos calcular a probabilidade de essa sala ter um aluno
X − 168
=Y ∼ N (0,1)
com mais de 1,80 m de altura. Para isso, vamos usar a variável auxiliar 50 , cuja função de distri-
buição acumulada é denotada por F. Assim,

 X − 168 180 − 168 


P ( X > 180 ) = 1 − P ( X ≤ 180 ) = 1− P  ≤ =
 50 50 
 12 
= 1 − P Y ≤  = 1 − P (Y ≤ 1, 697 ) = 1 − F (1, 697 ) ≅ 1 − 0,955 = 0, 045.
 50 

Portanto, a probabilidade de haver um aluno com mais de 1,80 m nessa sala de aula é de 4,5%.
Exemplo 8.9: Uma determinada fábrica produz rolamentos com diâmetros em média de 15 mm e desvio padrão
de 1 mm. Segundo especificações de órgãos reguladores, esse tipo de rolamento deve ter entre 14,5 e 15,5 mm.
De uma produção de 1000 rolamentos, calculemos quantos deles, em média, serão descartados por estarem
fora dessa especificação. Para resolver esse problema, primeiramente vamos considerar X a variável que mede
o diâmetro dos rolamentos dessa fábrica. Segundo as informações, podemos considerar X uma variável com
distribuição normal N(15,1). Precisamos calcular a probabilidade de X estar fora do intervalo entre 14,5 e 15,5
X − 15
=Y ∼ N (0,1)
mm, ou seja, 1-P(14,5≤X≤15,5). Considere 1 e F sua função de distribuição acumulada. Assim,

P (14,5 ≤ X ≤ 15,5
= ) P (14,5 − 15 ≤ X − 15 ≤ 15,5 − 15
= )
= P ( −0,5 ≤ Y ≤ 0,5 ) = F ( 0,5 ) − F ( −0,5 ) ≅ 0, 6915 − 0,3085 = 0,383

e daí,

1 − P (14,5 ≤ X ≤ 15,5 ) ≅ 1 − 0,383 =0, 617

donde concluímos que 61,7% dos rolamentos estão fora da especificação. Logo, de uma produção de 1000 rola-
mentos, aproximadamente 617 serão descartados.
Exemplo 8.10: Para uma instalação elétrica, será utilizado um tipo de fio cuja corrente elétrica suportada seja
em média de 28 ampères e desvio padrão de 3 ampères. Assim, podemos supor que a variável que mede a cor-
rente suportada por esse tipo de fio seja X ∼ N ( 28, 9 ) . . Se nessa instalação, o fio utilizado suportar menos de 26
ampères, haverá um problema elétrico que se deseja evitar. Vamos calcular a probabilidade de que um fio do
referido tipo, selecionado ao acaso, suporte menos de 26 ampères. Para isso, vamos considerar a variável auxiliar
X − 28
=Y ∼ N (0,1)
3 , cuja função de distribuição acumulada é denotada por F. Logo,
 X − 28 26 − 28   2  2
P ( X ≤ 26 ) = P  ≤  = P  Y ≤ −  = F  −  ≅ 0, 2525.
 3 3   3  3

Portanto, a probabilidade de obter um fio com menos de 26 ampères é de 25,25% aproximadamente.

180
Estatística | Unidade de Estudo 8 – Distribuição Normal

Exemplo 8.11: O tempo de viagem que uma certa mulher demora de sua casa até seu trabalho é calculado por
uma variável aleatória X. Como, em média, ela demora 15 minutos, com desvio padrão de 2 minutos, podemos
dizer que X ∼ N (15,4) . Em um determinado dia, ela precisa chegar no seu trabalho em menos de 16 minutos. Cal-
X − 15
=Y ∼ N (0,1)
culemos a probabilidade dela conseguir isso. Para tal cálculo, definamos 4 , cuja função de distribui-
ção de probabilidade é denotada por F. Assim,

 X − 15 16 − 15   1 1
P ( X < 16 )= P  < = P  Y < = F   ≅ 0, 6915.
 2 2   2  2

Assim, a probabilidade de essa mulher conseguir chegar no seu trabalho em menos de 16 minutos é de quase
70%.

Figura 8.11 - Gráficos relacionados à variável X do exemplo 8.12.

X ∼ N (15, 9).
Legenda: Gráficos da f.d.p. e da f.d.a. de
Fonte: Gráfico obtido no software R.

A vida útil de um certo motor é, em média, de 50 anos, com desvio padrão de 4 anos. Calcule
a probabilidade de que esse motor tenha vida útil de mais de 55 anos

181
Estatística | Unidade de Estudo 8 – Distribuição Normal

A distribuição normal também pode ser usada para modelar uma variável que calcula a média de certo experi-
mento, conforme comentado no início desta unidade. Além dessa, outra aplicação da distribuição normal é o
fato de podermos aproximar a distribuição binomial por uma normal. Falemos um tiquinho sobre isso.
Quando uma variável aleatória discreta (um num espaço amostral discreto) tem uma distribuição simétrica,
geralmente a distribuição normal pode ser uma boa aproximação para essa variável. O teorema a seguir nos dá
uma relação clara entre as distribuições normal e binomial, que apesar de serem de naturezas distintas, podem
ser oportunamente bem relacionadas:
X − np
Y=
X ∼ Bin ( n; p ) npq
Teorema 8.1: Seja . Assim, converge a ter uma distribuição N(0,1) à medida em que n
cresce, sendo q=1-p.
Como podemos ver no Teorema 8.1, há uma enorme vantagem em aproximar uma variável com distribuição
binomial por uma com distribuição normal quando n grande, já que os cálculos da binomial nesses casos tendem
a ser muito custosos, enquanto os cálculos da normal padrão são fáceis de serem relacionados computacional-
mente.

Figura 8.12 - Comparação entre o histograma de uma variável com uma distribuição binomial e o gráfico da função de
distribuição de probabilidade de uma variável com distribuição normal.

Legenda: O histograma da figura refere-se a uma variável com distribuição binomial com esperança apro-
ximadamente igual a 3, a qual é bem aproximada por uma distribuição normal com μ=3.
Fonte: Wikimedia Commons.

182
Estatística | Unidade de Estudo 8 – Distribuição Normal

Exemplo 8.12: Uma prova contém 90 questões, cada uma com cinco alternativas, das quais apenas uma é cor-
reta. Se um estudante chutar todas as questões dessa prova, calculemos a probabilidade dele acertar mais do
que 30 questões. Para isso, seja X a variável que conta o número de acertos desse estudante. Como a chance de
1
p= = 0, 2
acertar cada questão é de 5 , então X ∼ Bin(90; 0, 2) . Queremos calcular P(X>30). Note que utilizando a
função de probabilidade de X essa expressão envolverá cálculos muito cansativos para serem feitos “à mão”. No
entanto, vamos aproximar X pela variável aleatória contínua

X − 90.0, 2 X − 18
Y
= ≅ ∼ N ( 0,1) .
90.0, 2.0,8 3,8

Logo, sendo F a função de distribuição acumulada de Y, então

 X − 18 30 − 18 
P ( X >=
30 ) P  > ≅ P (Y > 3,158
= )
 3,8 3,8 
= 1 − P (Y ≤ 3,158 ) ≅ 1 − 0,999 = 0, 001

Portanto, a probabilidade do aluno acertar mais do que 30 questões é de aproximadamente 0,1%.

Um dado será lançado 2000 vezes sucessivamente. Calcule a probabilidade de que em no


máximo 400 vezes o resultado seja um número quadrado perfeito.

A aproximação de uma distribuição binomial por uma distribuição normal é recomendada quando o número n
de realizações dos experimentos dicotômicos seja grande. Quando n é pequeno, essa aproximação pode incorrer
num erro alto.

Sua ultima tarefa do Desafio é, junto com seu grupo, utilizando os conhecimentos adqui-
ridos sobre variáveis contínuas, calcular alguma probabilidade de interesse sobre uma de
suas variáveis contínuas que tenha distribuição próxima à de uma normal. Poste no fórum e
interaja com os outros grupos.

183
Considerações finais
Nesta última unidade deste curso, estudamos a distribuição normal, a
mais largamente utilizada entre todos os tipos de distribuição. Ao longo
da unidade, vimos:
• A definição de distribuição normal a partir da sua função de den-
sidade de probabilidade.
• O gráfico de uma distribuição normal, que é a curva gaussiana, e
suas particularidades.
• A esperança e a variância de uma variável com distribuição nor-
mal.
• A definição de distribuição normal padrão e as vantagens de sua
utilização no cálculo de probabilidades.
• A utilização da função de distribuição acumulada para o cálculo
de probabilidades de variáveis com distribuição normal padrão;
• Exemplos práticos da utilização da distribuição normal para
modelar problemas reais.
• Como aproximar uma variável aleatória binomial com grande
número de realizações de experimentos dicotômicos por uma
variável aleatória com distribuição normal padrão.

184
Referências bibliográficas
MONTGOMERY, Douglas C., RUNGER, George C. Estatística aplicada e pro-
babilidade para engenheiros. Rio de Janeiro: LTC Ed., 2009.

BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística Básica. 7. ed. São


Paulo: Saraiva, 2012, p. 540.

185

Você também pode gostar