Você está na página 1de 200

Estatística

Núcleo de Educação a Distância


www.unigranrio.com.br
Rua Prof. José de Souza Herdy, 1.160
25 de Agosto – Duque de Caxias - RJ

Reitor
Arody Cordeiro Herdy

Pró-Reitoria de Pós-Graduação e Pesquisa Pró-Reitoria de Graduação


(PROPEP) (PROGRAD)
Emilio Antonio Francischetti Virginia Genelhu de Abreu Francischetti

Pró-Reitoria de Administração Acadêmica Pró-Reitoria de Pós-Graduação Lato Sensu e Extensão


(PROAC) (PROPEX)
Carlos de Oliveira Varella Nara Pires

Núcleo de Educação a Distância


(NEAD)
Márcia Loch

1ª Edição
Produção: Gerência de Desenho Educacional - NEAD Desenvolvimento do material: Jhoab Pessoa de
Negreiros, Sergio Ricardo Pereira de Mattos e Tereza Luzia
de Mello Canalli
Copyright © 2020, Unigranrio
Nenhuma parte deste material poderá ser reproduzida, transmitida e gravada, por qualquer meio eletrônico, mecânico, por
fotocópia e outros, sem a prévia autorização, por escrito, da Unigranrio.
Sumário
Apresentação ...................................................................................... 9
Objetivos Gerais .................................................................................. 11

Conceitos Básicos
Para início de conversa... ...................................................................... 13

Objetivo ............................................................................................. 15

1. População ............................................................................ 17

2. Amostra ............................................................................... 18

2.1 Tamanho de uma Amostra ...................................................... 19

2.2 Amostragem ......................................................................... 22

2.3 Técnicas de Amostragem ........................................................ 23

3. Variáveis .............................................................................. 26

Referências ......................................................................................... 29

Exercícios ........................................................................................... 30
Representação Gráfica e Tabular
Para início de conversa… .................................................................... 33
Objetivo ............................................................................................ 35
1. Tipos de Gráficos ................................................................... 37
1.1 Gráficos em Coluna ................................................................ 37
1.2 Gráfico de Linha .................................................................... 37
1.3 Gráfico em Setor Circular ........................................................ 38
1.4 Histograma ........................................................................... 40
1.5 Pictograma ........................................................................... 41
2. Tipos de Tabelas .................................................................... 42
2.1 Confecção de uma Tabela Simples ........................................... 42
2.1.1 Título da Tabela .................................................................... 43
2.1.2 Cabeçalho ............................................................................ 44
2.1.3 Coluna Indicadora ................................................................. 44
2.1.4 Corpo da Tabela .................................................................... 45
2.2 Séries Estatísticas .................................................................. 46
2.2.1 Histórica, Cronológica ou Temporal ........................................... 46
2.2.2 Geográfica, Espacial ou Territorial ............................................. 47
2.2.3 Específica ou Categórica ......................................................... 48
3. Distribuição de Frequência ..................................................... 48
3.1 Tabela Primitiva ..................................................................... 49
3.2 Rol ...................................................................................... 49
3.3 Construção de Distribuição de Frequências ................................. 50
Referências ......................................................................................... 59
Medidas de Posição
Para início de conversa… .................................................................... 61
Objetivo ............................................................................................. 63
1. Média .................................................................................. 65
1.1 Média Aritmética Simples de uma Amostra de Dados ................. 65
1.1.1 Dados não Agrupados em Classes ............................................ 65
1.1.2 Dados Agrupados em Classes .................................................. 66
1.2 Média Aritmética Ponderada .................................................... 67
1.3 Média Geométrica (G) ........................................................... 68
1.4 Média Harmônica Simples (H) ................................................ 69
2. Moda ................................................................................... 71
2.1 Dados Não Agrupados em Classes ............................................ 71
2.2 Dados Agrupados em Classes .................................................. 72
3. Mediana ( Md ) ..................................................................... 73
3.1 Dados Não Agrupados em Classes ........................................... 74
3.2 Dados Agrupados em Classes .................................................. 75
3.3 Separatriz ............................................................................ 75
3.3.1 Percentil ............................................................................... 76
3.3.1.1 Dados Agrupados em Classes ................................................. 76
3.3.2 Decil .................................................................................... 79
3.3.2.1 Dados Agrupados em Classes .................................................. 79
3.3.3 Quartil ................................................................................. 79
2.3.3.1 Dados Agrupados em Classes .................................................. 80
Referências ......................................................................................... 83
Exercícios Resolvidos ............................................................................ 85
Medidas de Dispersão
Para início de conversa… .................................................................... 91
Objetivos ............................................................................................ 93
1. Variância e Desvio Padrão ....................................................... 95
1.1 Variância e Desvio Padrão de Dados Não Agrupados em Classes ... 95
1.1.1 Variância e Desvio Padrão de uma População ............................ 95
1.1.2 Variância e Desvio Padrão de uma Amostra de Dados ................. 96
1.2 Variância e Desvio Padrão de Dados Agrupados em Classes ........ 99
2. Coeficiente de Variação (CV) ................................................... 100
3. Desvio Médio (DM) ......................................................................... 106
Referências ......................................................................................... 109
Exercícios ........................................................................................... 110

Medidas de Assimetria e Curtose


Para início de conversa… .................................................................... 113
Objetivos ............................................................................................ 115
1. Assimetria ............................................................................ 117
2. Curtose ................................................................................ 124
Referências ......................................................................................... 129
Exercícios ........................................................................................... 131

Correlação e Regressão Linear


Para início de conversa… .................................................................... 135
Objetivos ........................................................................................... 137
1. Diagrama de Dispersão ........................................................... 139
2. Coeficiente de Correlação Linear de Pearson .............................. 141
2.1 Nível de Significância ............................................................. 145
3. Equação de Regressão ............................................................ 147
Referências ......................................................................................... 153
Exercícios ........................................................................................... 155

Introdução ao Estudo da Probabilidade


Para início de conversa... ...................................................................... 159
Objetivos ............................................................................................ 161
1. Espaço Amostral .................................................................... 163
2. Evento ................................................................................. 164
3. Definição Clássica de Probabilidade .......................................... 166
3.1 Propriedades da Probabilidade ................................................. 168
Exercícios Propostos: ............................................................................ 175
Referências ......................................................................................... 177

Probabilidade Condicional e Teorema de Bayes


Para Início de Conversa… ................................................................... 179
Objetivo ............................................................................................. 181
1. Probabilidade Condicionada ..................................................... 183
2. Teorema de Bayes ................................................................. 186
Exercícios Propostos ............................................................................. 195
Referências ......................................................................................... 199
Considerações Finais ............................................................................ 200
Apresentação
A Estatística, ainda que não da maneira como a conhecemos
atualmente, é utilizada desde antes da Era Cristã. De acordo com relatos
históricos, no ano de 2238 a.C., o imperador chinês Yao realizou um censo
(do latim, Censere, que significa “taxar”) populacional. Um outro exemplo,
datado de 578-534 a.C., relata que o imperador romano Sérvio Túlio fez um
censo para determinar o número de pessoas “aptas” para compor seu exército.

Naquele período, a Estatística ainda não tinha status de ciência, e


seus objetivos eram basicamente tributários (calcular o imposto devido por
cada família em função do número de pessoas que a compunham), bélicos
(total de possíveis “soldados” de um império) e para aferição da riqueza de
um governante. Cabe também comentar que o Livro de Números, da Bíblia
Sagrada, recebeu esse nome (na versão de origem latina) em alusão aos dois
censos nele relatados. Na Idade Média, foram realizados diversos censos, dentre
os quais destacamos o Doomsday Book (FERNANDES apud PARANÁ,
2010), realizado em 1066, na Inglaterra, por Guilherme, o Conquistador.

No século XVI, os dados sociais coletados – como nascimentos e


óbitos – começaram a passar por uma análise sistemática. No século XVIII,
a Estatística, batizada com esse nome por Godofredo Achenwall em alusão
ao termo latino status, obteve estrutura de ciências. Os dados que antes eram
o objetivo final, tornaram-se o ponto de partida para busca de regularidades
e possíveis previsões. Dessa forma, buscavam-se conclusões sobre o todo,
partindo da observação de uma de suas “partes”.

As tabelas foram aperfeiçoadas e surgiram as representações gráficas.


O aprimoramento do Cálculo de Probabilidades – que já existia desde o

Estatística 9
século XVII – alavancou ainda mais tal ciência. Atualmente, ela é aplicada
em praticamente todas as áreas de conhecimento humano, nos auxiliando
na tomada de decisões de uma maneira mais estruturada. Com o advento da
tecnologia e por uma necessidade cada vez maior de analisar dados e deles
tirar conclusões, precisamos aprender essa ciência e utilizá-la como uma
pujante ferramenta.

As tabelas foram aperfeiçoadas e surgiram as representações gráficas.


O aprimoramento do Cálculo de Probabilidades (que já existia desde o
século XVII) alavancou mais ainda tal ciência. Atualmente ela é aplicada
em praticamente todas as áreas de conhecimento humano, nos auxiliando
na tomada de decisões de uma maneira mais estruturada. Com o advento
da tecnologia, e uma necessidade cada vez maior de analisar dados e deles
tirar conclusões, precisamos aprender esta Ciência e utilizá-la como uma
pujante ferramenta.

10 Estatística
Objetivos Gerais
Desenvolver o pensamento estatístico por meio de situações-problema.

Estatística 11
Conceitos Básicos
Para início de conversa...
Antes de nos aprofundarmos no estudo desta disciplina, veremos
alguns conceitos básicos necessários à aprendizagem dos temas. Falaremos
sobre o Método Estatístico, população, amostra, técnicas de amostragem e os
diferentes tipos de variáveis.

Um método, de maneira geral, é um conjunto de meios dispostos


convenientemente para se chegar ao fim desejado. Existem diferentes tipos
de método: científicos (dedutivo, experimental, estatístico etc.) e outros
não científicos (tentativa e erro etc.). No Método Estatístico, em virtude da
impossibilidade de mantermos constantes as causas, admitimos suas variações
e tentamos determinar a influência que coube a cada uma delas. Esse método
é de suma importância quando se deseja, partindo da análise de uma parte dos
dados (amostra), obter resultados (inferir) válidos para o todo (população).
Neste capítulo, veremos algumas técnicas de amostragem que nos permitirão
extrapolar conclusões, ainda que não seja possível avaliar todos os elementos
do conjunto.

Estatística 13
Objetivo
Conceituar os principais termos estatísticos: População, Amostra
e Variável.

Estatística 15
1. População
Estatisticamente falando, uma população é o conjunto da totalidade dos
indivíduos sobre o qual se faz uma inferência. Isto é, é o conjunto constituído
por todas as unidades experimentais (ou observacionais) que apresentam
pelo menos uma característica comum e ela pode ser finita ou infinita. Por
exemplo, todos os professores da Unigranrio formam uma população (no
caso, finita). Eles poderiam até ter outras coisas em comum, mas o fato de
todos lecionarem na mesma instituição faz deles um exemplo de população.

Mas, qual a importância disso? Com o auxílio da Estatística


podemos, dentre outras coisas, fazer previsões sobre uma população,
tomando como base os dados de apenas um “pedaço” desse conjunto (isto é,
uma inferência). Por exemplo, não precisamos entrevistar todos os eleitores
para prever qual candidato deve vencer a eleição. É importante observar que
isso é uma previsão e, como tal, está sujeita a uma margem de erro (que
pode ser previamente determinada).

Quando a pesquisa envolve dados de toda a população, dizemos que houve


um censo. No Brasil, o censo demográfico começou em 1872, com o objetivo
de contar a população brasileira e extrair informações sobre as características
desses habitantes. Atualmente, o Instituto Brasileiro de Geografia e Estatística
(IBGE) é o responsável pelo recenseamento, sendo que tal processo costuma
ocorrer a cada dez anos (1940,1950, 1960, 1970 etc.).

Para fazermos uma pesquisa Estatística com resultados válidos,


devemos executar algumas tarefas. A seguir, explicaremos cada passo a
ser seguido.

1. Definir a variável
É a delimitação do problema, isto é, definir o que você irá pesquisar.
2. Realizar a pesquisa
É o momento de coletar os dados correspondentes às variáveis
escolhidas.

Estatística 17
3. Organizar os dados
É a parte de elaborar tabelas ou gráficos a partir dos dados coletados.
4. Analisar os resultados
Utilizando diferentes conceitos estatísticos, analisamos os
resultados obtidos na amostra, objetivando tirar conclusões válidas
para a população.

2. Amostra
Na Estatística, é necessário definir um outro conjunto além da
população. Esse conjunto é chamado de amostra e, à medida que você
avançar nos estudos nesta disciplina, perceberá a sua importância. Contudo,
a definição de uma amostra é bem simples, trata-se do subconjunto finito de
uma população. Veja os seguintes exemplos:

▪▪ Exemplo 1
População: O conjunto de todos os torcedores de um determinado
time de futebol.
Amostra: O conjunto dos torcedores desse mesmo time que têm
mais que 18 anos.
▪▪ Exemplo 2
População: O conjunto de todas as baleias de uma determinada região.
Amostra: O conjunto de baleias dessa mesma região que possuem
um chip de monitoramento remoto, de coleta de dados, que visa o
estudo e preservação desse animal.
▪▪ Exemplo 3
População: Conjunto de pessoas portadoras de HIV (soropositivas
HIV), no Brasil.
Amostra: Conjunto das pessoas portadoras de HIV
(soropositivas HIV) que fazem tratamento no Hospital
Universitário Gaffrée Guinle.

18 Estatística
Veja, agora, um esquema em que exemplificamos uma população
estatística e algumas de suas possíveis amostras:

Exemplos de
amostras

População

Figura 1: Exemplo de uma população e algumas de suas diferentes amostras. Fonte: Elaborado pelos autores.

Importante
Dependendo do contexto, um mesmo conjunto pode desempenhar o papel de população
ou de amostra. Por exemplo, todos os alunos da Universidade Unigranrio podem ser
considerados uma população, da qual todos os alunos que estudam no Campus Duque
de Caxias compõem uma amostra. Porém, se consideramos como população todos os
universitários brasileiros, o conjunto de todos os alunos da Unigranrio se torna uma amostra.

2.1 Tamanho de uma Amostra


Na maioria das vezes, não é possível trabalhar com o universo
populacional, isto é, realizar o censo. Em alguns casos, por se tratar de uma
população infinita; em outros; por se tratar de uma população demasiadamente
extensa, o que normalmente demanda muito tempo e um custo elevado. Em
algumas situações, existem inviabilizações naturais, por exemplo: ao pesquisar
uma determinada espécie de um pássaro, é praticamente impossível capturar
todos. Por isso, precisamos “escolher” alguns elementos da população para

Estatística 19
a realização da pesquisa. Mas, quantos elementos precisam ser utilizados de
modo que a amostra seja representativa? Para esse cálculo, podemos utilizar a
fórmula descrita a seguir:

Para o cálculo do tamanho da amostra de uma população considerada


finita, utilizaremos:

( 0,5. Z ) N
2

n=
( 0,5.Z ) + ( N − 1.) e2
2

Sendo o valor correspondente ao nível de confiança que o pesquisador


deseja para a sua pesquisa. O nível de confiança, também chamado de
coeficiente de confiança, é a probabilidade de uma pesquisa ter os mesmos
resultados quando a mesma é aplicada em um conjunto de dados, dentro do
mesmo perfil amostral e com a mesma margem de erro. Por exemplo, se o
nível de confiança de uma pesquisa é de 95%, isso implica que se a mesma
for aplicada 100 vezes, gerará resultados dentro da margem de erro estipulada
em 95 casos.

Normalmente, consideramos um nível de confiança maior ou igual


a 95%. Cada percentual remete a um valor para . Por exemplo, um nível
de confiança de 95% equivale ao valor de . Veja, na tabela a seguir, alguns
valores de em função do nível de confiança desejado na pesquisa.

Nível de confiança Valor de Z


80% 1,28
90% 1,64
95% 1,96
99% 2,58

Os valores apresentados na tabela surgem a partir de alguns cálculos


baseados em algumas teorias matemáticas. Entretanto, foge ao escopo deste
capítulo abordar tais assuntos.

O “N” na fórmula representa o tamanho da população; e o , a margem


de erro estipulada para as pesquisas. Um erro de 3% significa que o resultado

20 Estatística
obtido pode ter uma variação aceitável de até 3 pontos percentuais, para mais
ou para menos, em relação ao valor real. Se em uma pesquisa, o candidato
A tem 25% das intenções de votos, e o candidato B tem 27%, eles serão
considerados tecnicamente empatados, em virtude da margem de erro que,
no primeiro caso, varia entre 22% e 28%, e no segundo, entre 24% e 30%.

Para reduzirmos a margem de erro, precisamos aumentar o nível de


confiança ou o tamanho da amostra e vice e versa.

Normalmente, quando uma população possui mais de 100.000


elementos, ela é considerada como infinita. Para esses casos, utilizamos a
seguinte fórmula:
2
 Z 
n= 
 2.e 
Como é de se esperar, a fórmula depende somente do “Z”, que é o
nível de confiança, e do “e” que representa o erro na pesquisa, já que estamos
considerando uma população infinita.

Importante
Existem outras fórmulas para a determinação do número de elementos de uma amostra,
estas envolvem outros parâmetros não estudados neste material.

▪▪ Exemplo 4:
Calcule o tamanho de uma amostra, de nível de 95%, com uma
margem de erro de 4%, sabendo-se que a população possui
5000 elementos.
Como a população é finita, temos: (Importante: 4% equivale
a 0,04)
( 0,5.Z ) .N
2

n=
( 0,5.Z ) + ( N − 1) .e2
2

( 0,5. 1,96 ) .5000


2

n =
( 0,5. 1,96 ) + ( 5000 − 1) .0, 042
2

4802
=n = 534,83
8,9784
Aproximadamente, 535 pessoas.

Estatística 21
Se esse mesmo problema fosse relativo à uma população com mais
100.000 elementos, usaríamos a fórmula para uma população infinita do
seguinte modo.
2
 Z 
n= 
 2.e 
2
 1,96 
n= 
 2. 0, 04 
2
 1,96 
n = 
 0, 08 
n = ( 24,5 )
2

n = 600, 25
Aproximadamente, 600 pessoas.

2.2 Amostragem
Para que uma amostra seja representativa e, consequentemente, possa
ser utilizada para extrapolarmos as conclusões para a população, é necessário
que sigamos determinadas regras na seleção de seus elementos. Esse processo
de escolha se chama amostragem. Observe o exemplo a seguir:
▪▪ Exemplo 5:
Uma nutricionista decide verificar a incidência de obesidade em um
determinado município, com cerca de cento e vinte mil habitantes.
Como é inviável pesar e medir todos os habitantes, ela decidiu fazê-
lo com alguns moradores (amostra). Para tal, montou um quiosque
de assistência em uma praça do centro desta cidade, no qual ofereceu
alguns serviços básicos de saúde, dentre eles, o cálculo do Índice
de Massa Corpórea (IMC) de todos os voluntários. Os resultados
foram alocados na tabela a seguir:

Peso Normal Obesidade grau 1 Obesidade grau 2 Obesidade grau 3


Homens 21 19 23 7
Mulheres 558 186 120 66

22 Estatística
Analisando os resultados obtidos, ela verificou que 21 homens
estavam com o peso normal (30%) e 49 tinham algum grau de obesidade.
Daí, concluiu que 70% dos homens do referido município tinham algum
grau de obesidade.

Será que essa conclusão é válida? Se não, por quê? Antes de


respondermos a tais indagações, primeiro veremos as técnicas de amostragem.

2.3 Técnicas de Amostragem


A amostragem pode ser probabilística ou não probabilística. Na
primeira, cada elemento da população tem a mesma chance de ser escolhido,
atribuindo à amostra maior caráter de representatividade e ressaltando
sua importância, uma vez que as conclusões da pesquisa estão vinculadas
exatamente a essas amostras. Na segunda, a seleção dos elementos da
população que irão compor a amostra depende exclusivamente do julgamento
do pesquisador ou do entrevistador no campo (que é algo muito subjetivo).
Nela, não se pode extrapolar os resultados da pesquisa para a população. A
seguir, explicaremos alguns casos e daremos exemplos.

a. Aleatória simples: É feito um sorteio por meio de um dispositivo


aleatório. Por exemplo, associar cada elemento da população a um
papel com um número diferente e colocá-lo dentro de uma urna
para, depois, enfiar a mão na urna e escolher um papel qualquer.
b. Estratificada: Nessa técnica, a população é dividida em
subpopulações, denominadas estratos, dos quais retiramos os
elementos. Por exemplo, se queremos uma amostra de 300 pessoas,
podemos dividi-la em dois estratos (sexo masculino e feminino)
e pesquisar 150 homens e 150 mulheres. Voltando ao exemplo 5,
foram entrevistados 70 homens e 930 mulheres, ou seja, o resultado
obtido não pode ser extrapolado para a população, pois a quantidade
de homens entrevistados foi insignificante em relação à de mulheres
(ao compararmos com esses percentuais na população).
c. Por conveniência: Se um pesquisador precisa testar um novo
medicamento antirretroviral (ARV) em portadores do vírus HIV,
não seria conveniente ele ficar no calçadão da cidade perguntando

Estatística 23
a cada transeunte se o mesmo é portador do vírus e se deseja
participar do teste de um novo medicamento? Nesse caso, ele deve
utilizar a amostra que lhe convém, como ir em um hospital de
referência da doença e procurar voluntários para o teste.

Curiosidade
Os medicamentos antirretrovirais (ARV) agem inibindo a multiplicação do HIV no organismo,
evitando assim o enfraquecimento do sistema imunológico. Atualmente, há 22 desses
medicamentos. O AZT é bem conhecido.

d. Sistemática: Nesse caso, o pesquisador cria uma “regra” de escolha


da amostra. Por exemplo, ele dispõe de 2000 prontuários médicos,
organizados em gavetas, por ordem alfabética. Decide escolher os
dez primeiros de cada gaveta, para fazer parte de sua amostra.

A distribuição das técnicas de amostragem habitualmente utilizadas


pode ser resumida no esquema da Figura 2:

Aleatória simples

Por conglomerado
Probabilística
(ou aleatória)
Sistemática

Técnicas habituais Estratificada


de amostragem

Por conveniência
Não probabilística
Intencional

Figura 2: Técnicas habituais de amostragem. Fonte: Elaborado pelos autores.

▪▪ Exemplo: Vamos supor que um cientista social deseja investigar


a democratização do acesso à internet em um determinado

24 Estatística
município que possui cerca de 130.000 habitantes e um baixo
Índice de Desenvolvimento Humano (IDH). Faremos, a seguir,
uma descrição de todo o processo:

I. Definição do problema: ele quer verificar se o acesso à internet


está disponível a todos os moradores ou apenas aos de melhor
poder aquisitivo. Além disso, em qual local esse acesso se dá (na
residência, no trabalho, na escola, universidade etc.).
II. Realização da pesquisa com a definição do tipo de amostragem
e do tamanho da amostra: como a população tem mais do que
100.000 indivíduos (que para efeito de cálculo de tamanho de
amostra é considerada infinita) se torna inviável a realização da
pesquisa em todas as residências. Após a escolha dos parâmetros
(95% de nível de confiança e 3% de erro máximo), foi feito o
seguinte cálculo para a determinação do tamanho da amostra:
2 2 2
 Z   1,96   1,96 
=n =   =     1067,11
 2.e   2. 0, 03   0, 06 

O pesquisador decidiu que faria 1068 entrevistas e optou pela


amostragem estratificada, por entender que o acesso a tal
serviço variava de acordo com algumas especificidades. Cada um
dos quatro distritos foi considerado um estrato; nestes, foram
realizadas 267 entrevistas. Além disso, foram visitados bairros de
periferia e os principais centros comerciais de cada distrito. Foram
visitados também os arredores das instituições de ensino em
diversos horários. À medida do possível, foram escolhidas pessoas
de diferentes faixas etárias. Formando, assim, um diversificado
público-alvo.
III. Após as entrevistas, o pesquisador organizou os dados em diversas
tabelas (por local e por faixa etária). Expôs, convenientemente, os
resultados em gráficos.
IV. Analisou os resultados, em busca de possíveis erros e não os
encontrou. Concluiu que o percentual de pessoas com acesso à
internet, geograficamente falando, era praticamente o mesmo em
todo o município. Porém, ao observar os gráficos por faixa etária,

Estatística 25
verificou que os mais idosos não dispunham desse serviço. De
posse deste estudo, solicitou à prefeitura que ofertasse um curso
de informática voltado à terceira idade e que definisse políticas
públicas nesse sentido.

3. Variáveis
Uma variável é o conjunto de resultados possíveis de um fenômeno.
As variáveis podem ser divididas em qualitativas ou quantitativas.

Na variável qualitativa, os valores são expressos por atributos. Caso


esses atributos possam ser ordenados, ela é chamada de qualitativa ordinal.
Caso não admitam tal ordenação, é chamada de qualitativa nominal.

No caso da quantitativa, se os valores forem expressos apenas por


números inteiros, dizemos que ela é discreta. Se os valores forem números
decimais, dizemos que é contínua.

▪▪ Exemplo 6:
Cor dos olhos: Qualitativa (pois é um atributo) nominal (não existe
uma ordem predeterminada, que organize as cores dos olhos).
▪▪ Exemplo 7:
Nível de escolaridade: Qualitativa (é um atributo, não um número)
ordinal (aceita ordenação). Por exemplo, nível fundamental
completo, nível médio completo, nível superior completo.
▪▪ Exemplo 8:
Número de seguidores no Facebook, de uma determinada pessoa:
Quantitativa (é um número) discreta (não podemos ter, por exemplo,
41,5 seguidores, apenas um número inteiro de seguidores).
▪▪ Exemplo 9:
Velocidade de download de um plano de internet: Quantitativa (é
um número) contínua (podemos ter um valor que não seja um
número inteiro, por exemplo, 131,37 Mbps).

26 Estatística
Nominal
Qualitativa
(ou categórica)
Ordinal

Tipos de variáveis

Discreta
Quantitativa
(ou numérica)
Contínua

Figura 3: Resumo dos diferentes tipos de variáveis. Fonte: Elaborado pelos autores.

Importante
Ao realizarmos uma pesquisa, devemos nos preocupar com os possíveis resultados de um
fenômeno (variáveis). Por exemplo, se o pesquisador fizer a pergunta “Que comida você
mais gosta?”, teria uma quantidade praticamente infinita de variáveis possíveis. Isso tornaria
inviável a organização e a análise dos dados.
Nesse caso, uma opção seria reescrever a pergunta como “Dentre as opções de comida a
seguir, qual você mais gosta?” Isso restringiria o número de possíveis respostas para um
quantitativo aceito pelo pesquisador.

Neste capítulo, conhecemos um pouco da história da Estatística e


sua ascensão ao status de ciência. Vimos as principais etapas na realização
de uma pesquisa (definir o problema, coletar e organizar os dados, expô-
los por meio de gráficos e analisá-los objetivando tirar conclusões válidas).
Diferenciamos o conceito de amostra do de população estatística, dando
exemplos em diferentes áreas do conhecimento científico. Em seguida,
estudamos as principais técnicas de amostragem e o uso das fórmulas para
determinação do tamanho ideal de amostra, dados os parâmetros (nível de
confiança e erro máximo). Vimos que as variáveis podem ser classificadas
em qualitativa (nominal ou ordinal) ou quantitativas (discreta ou contínua),
citando exemplos de cada caso. Assim, de uma maneira geral, trabalhamos
com os conceitos básicos da disciplina Estatística.

Estatística 27
28 Estatística
Referências
FERNANDES, M. C. Estudando estatística e conhecendo um pouco de
história da matemática. O professor PDE e os desafios da escola pública
paranaense. (Cadernos PDE). Curitiba, 2010. Disponível em: www.
diaadiaeducacao.pr.gov.br/portals/cadernospde/pdebusca/producoes_
pde/2010/2010_utfpr_mat_artigo_maria_concilia_fernandes.pdf. Acesso
em: 17 jun. 2019.

Estatística 29
Exercícios
1. Classifique as asserções em verdadeiras (V) ou falsas (F) e marque
o item que exibe a ordem correta das respostas.
( ) A cor dos olhos de uma pessoa é um exemplo de variável
quantitativa ordinal.
( ) O bairro onde uma pessoa reside é um exemplo de variável
qualitativa nominal.
( ) O nível de escolaridade de uma pessoa é um exemplo de variável
qualitativa ordinal.

a. V, F, V.
b. F, V, V.
c. V, V, F.
d. F, F, V.
e. V, V, V.

2. A série estatística que se caracteriza por apresentar o tempo variável,


mantendo-se fixos o local e a espécie, é denominada de:
a. Série Finita.
b. Série Variável.
c. Série Específica.
d. Série Geográfica.
e. Série Temporal.

30 Estatística
3. Estatisticamente falando, uma amostra é:
a. Qualquer exemplo de variável.
a. Algo no qual você testa as tuas hipóteses.
b. Um subconjunto finito de uma população.
c. É um conjunto que tem um exemplo que representa bem o
conjunto de dados.
d. A metade da população.

Gabarito

1)B; 2)E; 3)C.

Estatística 31
Representação Gráfica
e Tabular
Para início de conversa…
É comum vermos, no nosso cotidiano, reportagens que fazem uso
de gráficos e tabelas para resumir as informações que pretendem difundir.
Assuntos como a variação do câmbio, o grau de satisfação do cidadão com seu
governante ou as intenções de voto dos eleitores são frequentemente divulgadas
de maneira gráfica e tabular. Essa utilização se dá em função da facilidade de
“leitura” de um gráfico – por exemplo, uma variação de um determinado
dado, exibida por meio de um gráfico em linha, pode ser percebida até mesmo
por uma pessoa fora do meio acadêmico.

Apesar dessa aparente simplicidade, essa forma de apresentação de


dados deve seguir rigorosos critérios de elaboração. A exposição, de forma
adequada, dos resultados de uma pesquisa é de suma importância. Nesta
unidade de aprendizagem, veremos os principais tipos de gráficos e tabelas e
quais os critérios utilizados para a escolha do tipo que melhor se adequada
aos dados em questão.

Estatística 33
Objetivo
Identificar os principais elementos de uma Distribuição de Frequências
e interpretar tabelas e gráficos.

Estatística 35
1. Tipos de Gráficos
A exposição de dados por meio de gráficos facilita a “leitura” e o
entendimento dos resultados da pesquisa. Existem inúmeros tipos de gráficos,
mas, aqui, trataremos apenas dos mais importantes. Cabe lembrar que os
exemplos a seguir foram construídos com o auxílio do software Excel.

1.1 Gráficos em Coluna


Normalmente, esse tipo de gráfico exibe as categorias ao longo do
eixo horizontal e os valores no eixo vertical. Quando há muitas categorias de
dados, esse tipo de gráfico se torna inviável, pelo espaço que ocupa. O Gráfico
1, a seguir, exibe o preço da cesta básica, no Rio de janeiro.

Preço da cesta básica, em reais, Rio de Janeiro, abril/18 a março/19


500.00
480.00
460.00
440.00
420.00
400.00
380.00
360.00
8

18

9
8

18

8
8

9
8

9
8
18
/1

r/1
/1

/1
/1

/1
/1

/1
/1
io/

v/
jul/
abr

ago

dez
out

fev
jun

jan
set

ma
ma

no

Gráfico 1: Gráfico em coluna. Fonte: Elaborado pelo autor.

1.2 Gráfico de Linha


Esse tipo de gráfico é recomendado para mostrar dados contínuos,
exibidos em intervalos de tempo iguais. As linhas ou colunas de uma

Estatística 37
tabela podem ser facilmente plotadas em um gráfico de linha. Ele é muito
utilizado para mostrar a variação periódica (quinzenal, mensal, bimestral,
semestral etc.) de um valor, como o preço de um produto. O Gráfico 2, a
seguir, exibe os mesmos dados do exemplo anterior, porém, utilizando um
gráfico de linha.

Preço da cesta básica, em reais, Rio de Janeiro, abril/18 a março/19

510.00

490.00

470.00

450.00

430.00

410.00

390.00
18

9
8

18

8
8
8

9
8

9
8
18

r/1
/1

/1
/1
/1

/1
/1

/1
/1
io/

v/
jul/

ago

dez
out
abr

fev
jun

jan
set

ma
ma

no

Gráfico 2: Gráfico de linha. Fonte: Elaborado pelo autor.

Importante

Para plotar um gráfico no Excel, digite os dados no programa, selecione as colunas que
deseja representar graficamente, clique no menu “Inserir”, depois na opção “Gráfico”, e
escolha o tipo que deseja usar.

1.3 Gráfico em Setor Circular

Esse gráfico é construído com base em um círculo, que é dividido em


tantos setores circulares quantos forem os tipos de dados, e a área ocupada
por cada setor é proporcional aos valores que cada um deles representam.

38 Estatística
As condições necessárias à utilização desse tipo de gráfico são:

▪▪ os dados devem exibir os tamanhos dos itens de uma série, de


maneira proporcional à soma de seus valores;
▪▪ temos que ter apenas uma série de dados e nenhum dos dados
pode ser negativo;
▪▪ é aconselhável que não tenhamos valores nulos (nem desprezíveis
em relação ao todo) e que o número de categorias seja no
máximo seis.

Exemplos de utilização de gráfico em setor circular:

▪▪ mostrar a contribuição de cada filial, no faturamento de uma


empresa;
▪▪ mostrar a composição (quais os ingredientes e suas proporções)
de um determinado produto;
▪▪ exibir os diferentes tipos de despesas que compõem o custo
total de uma empresa, mostrando que parte do todo cada uma
delas representa.

Vejamos um exemplo de uma tabela de dados e sua respectiva


representação gráfica em setor circular:

Gasto de uma família, por tipo de despesa (março, 2019)

Tipos de despesa Valor gasto (em Reais)


Alimentação 500
Educação 300
Saúde 100
Moradia 1000
Transporte 100

A soma de todas as despesas é R$ 2.000,00. Para determinarmos a


porcentagem relativa a cada uma delas, dividimos cada valor por dois mil e,

Estatística 39
depois, multiplicamos o resultado por cem. Por exemplo, se quisermos saber
a porcentagem correspondente à alimentação, fazemos . Assim, a alimentação
corresponde à 25% do total, a Educação consome 15%, Saúde 5%, Moradia
50% e Transporte 5%. Representando graficamente, temos:

Representando graficamente, temos:

Alimentação
Educação
Saúde
Moradia
Transporte

1.4 Histograma
Esse tipo de gráfico é utilizado para a representação de dados oriundos
de uma tabela de distribuição de frequência. Vejamos, a seguir, uma tabela de
distribuição de frequência e sua representação gráfica.

Idade dos alunos da disciplina Estatística, Unigranrio, em 2018

Classes (Idades, em anos) Frequência simples


20 |– 30 14

30 |– 40 13

40 |– 50 10

50 |– 60 7

40 Estatística
60 |– 70 1

70 |– 80 5

Idade dos alunos da disciplina Estatística, Unigranrio, 2018.


15
14
13
12
11
10
9
Frequência

8
7
6
5
4
3
2
1
0
20 30 40 50 60 70 80

1.5 Pictograma
É um gráfico no qual se utiliza um símbolo ou imagem sugestiva da
variável em estudo. Por exemplo, para cada cinco clientes insatisfeitos, foi
utilizado um “emoji zangado”. Para cada cinco clientes muito satisfeitos, foi
utilizado um “emoji feliz”.

Grau de satisfação com o pós-venda da empresa (março, 2019)

Grau de satisfação Número de clientes


Insatisfeito 20
Satisfeito 25
Muito satisfeito 15

Estatística 41
Grau de satisfação com o pós-venda da empresa, março de 2019
30

25

20

15

10

0
Insatisfeito Satisfeito Muito satisfeito

2. Tipos de Tabelas
De acordo com o Instituto Brasileiro de Geografia e Estatística
(IBGE), uma tabela é a forma não discursiva de apresentação de informações,
das quais os dados numéricos, dispostos em uma ordem determinada,
se destacam como informação central. Quando há uma grande variedade
(qualitativa ou quantitativa) de dados a ser exposta, o uso da tabela facilita
sua leitura e interpretação.

2.1 Confecção de uma Tabela Simples

Uma tabela deve ser completa em si mesma, de maneira que não


precisemos recorrer ao texto para saber do que trata. Seus elementos
fundamentais são: título, cabeçalho, coluna indicadora e corpo. Para
complementar uma tabela, devemos citar a fonte dos dados (a fim de dar-lhes
credibilidade) e, caso haja necessidade, as notas (que esclarecem o conteúdo)
e as chamadas.

42 Estatística
2.1.1 Título da Tabela

O título deve ser explicativo, contendo a natureza do fato (o que),


as variáveis (como), a abrangência geográfica (onde) e temporal dos dados
(quando). Vejamos exemplos de títulos adequados:

Exemplo 1: Distribuição dos indivíduos no mercado formal de empregos, por sexo, no


município do Rio de Janeiro, 2018.

Ocupação Feminino Masculino


Engenharias 22% 78%
Educação 64% 36%
Saúde 71% 29%
Outros 51% 49%

Exemplo 2: Número de registro de agravo de violência contra mulher, por estado da Região
Sudeste, Brasil, 2018.

Estados da Região Sudeste Número de Registros


Espírito Santo 1.108
Minas Gerais 941
Rio de Janeiro 1.460
São Paulo 1.852
Total 5.361

Exemplo 3: Frequências das ocorrências das características gerais da violência familiar


e doméstica contra a mulher, por mês, em Duque de Caxias – RJ, Brasil, no primeiro
quadrimestre de 2018.

Violência Familiar e Doméstica Número de Registros


Janeiro 527
Fevereiro 386
Março 178

Estatística 43
Abril 292
Total 1383

2.1.2 Cabeçalho
É a parte superior da tabela, na qual se especifica o conteúdo das colunas.

Exemplo: Distribuição dos indivíduos no mercado formal de empregos, por sexo, no município
do Rio de Janeiro, 2018.

Cabeçalho

Ocupação Feminino Masculino


Engenharias 22% 78%
Educação 64% 36%
Saúde 71% 29%
Outros 51% 49%

2.1.3 Coluna Indicadora


É a parte da tabela na qual se especifica o conteúdo das linhas.

Exemplo: Número de registros de agravo de violência contra mulher, por estado da Região
Sudeste, Brasil, 2018.

Coluna indicadora

Estados da Região Sudeste Número de Registros


Espírito Santo 1.108
Minas Gerais 941
Rio de Janeiro 1.460
São Paulo 1.852
Total 5.361

44 Estatística
2.1.4 Corpo da Tabela
É o conjunto de linhas e colunas. Ele deve conter apenas os dados
realmente relevantes à análise a qual se propõe. As linhas são retas horizontais
imaginárias, nas quais se inscrevem os dados. Uma célula é a intersecção entre
uma linha e uma coluna.

Exemplo: Frequências das ocorrências das características gerais da violência familiar


e doméstica contra a mulher, por mês, em Duque de Caxias – RJ, Brasil, no primeiro
quadrimestre de 2018.

Corpo da tabela

Violência Familiar e Doméstica Número de Registros


Janeiro 527
Fevereiro 386
Março 178
Abril 292
Total 1383

Importante
A figura a seguir exibe um resumo dos itens que compõem uma tabela.
Tabela 1: Título

Coluna indicadora Cabeçalho


Conteúdo da linha Célula
Coluna

Fonte:
Nota
Corpo da tabela

Exemplo de tabela: Número de casos notificados e confirmados de sarampo, por município


de residência, Amazonas, 2018.

Estatística 45
Municípios Notificados Confirmados
Manaus 8.561 7.729
Outros municípios 2.343 1.748
Total 10.904 9.477

Note que a célula de uma tabela não pode ser deixada vazia. De
acordo com as normas tabulares do IBGE, quando o valor for zero, devemos
preenchê-la com um traço horizontal (um hífen). Se não tivermos os dados,
colocamos três pontos. Se houver dúvida quanto à exatidão de determinado
valor, escrevemos um ponto de interrogação. Caso o valor seja muito pequeno
para ser expresso pela unidade utilizada, preenchemos a célula com um
número zero.

2.2 Séries Estatísticas


Estatisticamente falando, uma série é um tipo de tabela que exibe a
distribuição de um conjunto de dados, em função de sua espécie, época ou
do local ao qual se referem. Uma série pode ser classificada de acordo com o
elemento que sofre variação. Vejamos, agora, essa classificação.

2.2.1 Histórica, Cronológica ou Temporal


Quando ocorre a variação do tempo, em um determinado local.

Exemplo: Número de casos confirmados de sarampo, no município do Rio de Janeiro,


2011-2018.

Variação dos anos

Ano Casos confirmados


2011 3
2012 0
2013 0

46 Estatística
2014 3
2015 0
2016 0
2017 0
2018 16

Observe que a tabela acima mostra a evolução de uma mesma doença,


no mesmo local, em diferentes anos (há variação apenas do período).

2.2.2 Geográfica, Espacial ou Territorial


Quando há a variação do local, em um determinado instante.

Exemplo 1: Número de homicídios, por região, Brasil, em 2016.

Variação das regiões

Região Número de mortes


Norte 7.903
Nordeste 24.863
Sudeste 16.815
Sul 7.289
Centro-Oeste 5.647

Exemplo 2: Número de homicídios por cem mil habitantes, por região, Brasil, 2016.

Variação das regiões

Região Taxa por cem mil habitantes


Norte 44,55
Nordeste 43,68
Sudeste 19,47
Sul 24,76
Centro-Oeste 36,06

Estatística 47
Note que a tabela acima exibe o número absoluto de homicídios, por
região brasileira, em 2016. Observe que, se expusermos os mesmos dados
de maneira relativa (taxa a cada cem mil habitantes), perceberemos que a
região onde houve mais homicídios no período citado, em relação ao total da
população, é a Norte. Observe, ainda, que uma exposição de dados de maneira
não adequada (por má-fé ou por desconhecimento) pode nos levar a uma
interpretação errada do fato.

2.2.3 Específica ou Categórica


Quando houver variação da especificação, em um determinado
tempo e local.

Exemplo 1: Número de escolas por etapa de ensino, Brasil, 2017.

Variação das etapas de ensino

Etapa de ensino Número de escola


Creches 67.902
Pré-escolas 105.200
Anos iniciais do + Ensino Fundamental 115.372
Anos finais do Ensino Fundamental 62.394
Ensino Médio 28.558

3. Distribuição de Frequência
Ao estudarmos conjuntos de dados numéricos com uma grande
quantidade de elementos, é conveniente organizá-los e resumi-los em tabelas
chamadas distribuição de frequências. Por constituir-se no tipo de série
estatística mais importante para a Estatística Descritiva, faremos um estudo
mais detalhado a respeito dessas distribuições.

Como a confecção de uma tabela de distribuição de frequência pode


ser um processo longo, para melhor entendimento, explicaremos cada uma de
suas etapas, a partir dos seguintes exemplos:

48 Estatística
3.1 Tabela Primitiva
Denominamos tabela primitiva um agrupamento de dados não
ordenados numericamente.

Exemplo 1: Os dados abaixo representam a idade, por paciente, após o diagnóstico, em uma
amostra de 24 pacientes tratados na Clínica-Escola de Fisioterapia da Unigranrio, em 2005.

8 7 11 10 8 9
7 8 10 12 11 7
7 6 9 10 9 11
9 10 6 12 8 8

Exemplo 2: Supondo que um administrador, objetivando excelência no atendimento em sua


empresa, decidiu fazer uma pesquisa de satisfação e entrevistou 50 clientes. A fim de adequar
os produtos oferecidos à faixa etária atendida, perguntou (dentre outras coisas) a idade de
cada entrevistado. As respostas dadas nesse item do questionário estão listadas a seguir:

23 59 31 22 38 75 36 72 29 38
29 55 56 41 50 45 32 45 25 79
35 25 73 37 57 39 22 34 28 21
42 51 54 25 36 72 26 23 44 33
45 44 42 28 43 22 41 69 31 41

3.2 Rol
Denominamos rol o agrupamento de dados após a sua ordenação
numérica (em geral, usa-se a ordenação crescente).

Exemplo 3: O conjunto abaixo representa o rol do Exemplo 1 deste tópico.

6 6 7 7 7 7
8 8 8 8 8 9

Estatística 49
9 9 9 10 10 10
10 11 11 11 12 12

Exemplo 4: O conjunto abaixo representa o rol do Exemplo 2 deste tópico.

21 22 22 22 23 23 25 25 25 26
28 28 29 29 31 31 32 33 34 35
36 36 37 38 38 39 41 41 41 42
42 43 44 44 45 45 45 50 51 54
55 56 57 59 69 72 72 73 75 79

3.3 Construção de Distribuição de Frequências

O nosso desafio, agora, consiste em dispor dados de uma tabela


primitiva (ou rol) de outro modo. A tabela que construiremos a seguir recebe
o nome de Distribuição de Frequências, assim chamada porque relaciona
variáveis quantitativas com contagens (ou frequências) do número de valores
que se enquadram em cada categoria. Uma distribuição de frequências pode
ser sem intervalos de classes ou com intervalos de classes. Os exemplos 5 e 6
elucidam a construção de cada um desses dois tipos.

Exemplo 5: Construir uma distribuição de frequências para os dados abaixo:

Número de sessões de fisioterapia, por paciente, após o diagnóstico, em uma amostra de


24 pacientes tratados na Clínica-Escola de Fisioterapia da Unigranrio, em 2005

6 6 7 7 7 7
8 8 8 8 8 9
9 9 9 10 10 10
10 11 11 11 12 12

Note que esse agrupamento é formado por números inteiros e com


uma amplitude pequena, pois o menor deles é 6 e o maior é 12, o que sugere

50 Estatística
a construção de uma distribuição de frequência sem intervalos de classes.
Assim, após a sua construção, vamos obter a seguinte tabela:

Número de sessões de fisioterapia, por paciente, após o diagnóstico, em uma amostra de


24 pacientes tratados na Clínica-Escola de Fisioterapia da Unigranrio, em 2005

Idade (xi) frequência (fi)


6 2
7 4
8 5
9 4
10 4
11 3
12 2
Total 24

Fonte: Clínica-Escola de Fisioterapia da Unigranrio.

Exemplo 6: Construir uma distribuição do mesmo tipo para os dados abaixo:

Idade dos clientes entrevistados, da empresa Y (março, 2019)

21 22 22 22 23 23 25 25 25 26
28 28 29 29 31 31 32 33 34 35
36 36 37 38 38 39 41 41 41 42
42 43 44 44 45 45 45 50 51 54
55 56 57 59 69 72 72 73 75 79

Observe que, diferentemente dos dados do exemplo 5, agora temos


uma amplitude grande, o que torna inviável construir uma distribuição de
frequência sem intervalos de classe. Existem algumas regras para determinar
o número de classes e a amplitude delas; optamos por utilizar, neste texto, o
método conhecido como Regra de Sturges.

a. Determinação do número de classe (representado pela letra


“K”), em função do total de dados (representado pela letra n)

Estatística 51
K=1+3,22 . log10n

Número de classes Total de dados

Substituindo “n” por 50 (já que temos 50 dados) e, depois, calculando,


com o auxílio de uma calculadora científica, o valor do logaritmo de 50, temos:

K=1+3,22 =.log log 50


K=1+3,22 .1,69
K=1+5,44
K=6,44

Utilizaremos 6 classes, ou seja, 6 linhas.

b. Determinação da amplitude total (ou amostral) e da amplitude


da classe

A amplitude total (AT) é a diferença entre o maior e o menor valor da


tabela. No nosso caso, esses valores são, respectivamente, 79 e 21. Daí:

AT = 79-21=58

A amplitude de cada classe (h) é definida pela fórmula. h = AT


k
Substituindo os valores de e de , calculados anteriormente, temos:

h = AT = 58 9,7
k 6

Arredondando esse valor, cada classe terá a amplitude igual a 10.

c. Construção da tabela, utilizando os resultados anteriores

No nosso exemplo, teremos seis linhas, e cada linha terá amplitude


igual a 10. A primeira classe tem como limite inferior o número 20 e limite
superior o número 30. Essa classe, representada por , deve conter todos os
valores maiores ou iguais a 20 e menores do que 30. Observe que, se o
valor fosse exatamente igual a 30, faria parte da classe . As classes precisam
englobar todos os dados iniciais.

52 Estatística
Idade dos clientes entrevistados, Filial 1 (março, 2019)

Classes (Idades, em
Frequência simples
anos)
20 |– 30 14
30 |– 40 12
40 |– 50 11
50 |– 60 7
60 |– 70 1
Ou seja, nos dados, há 14 números
70 |– 80 5
que estão entre 20 (inclusive) e 30

O limite inferior da primeira classe é 20


e o superior é 30

Determinação das frequências acumuladas, pontos médios e


frequências relativas simples de cada classe

Idade dos clientes entrevistados, Filial 1 (março, 2019)

Classes (Idades, em anos) Frequência simples Frequência acumulada


20 |– 30 14 14
30 |– 40 12 14+12=26
40 |– 50 11 14+12+11=37
50 |– 60 7 14+12+11+7=44
60 |– 70 1 14+12+11+7+1=45
70 |– 80 5 14+12+11+7+1+5=50

A frequência acumulada de uma


determinada classe é igual à soma
de todas as frequências simples até
a classe em questão.

Estatística 53
Para determinarmos a frequência relativa simples de uma classe,
dividimos a frequência simples pelo total e, depois, multiplicamos o resultado
obtido por cem. Se quisermos o ponto médio de uma classe, basta somarmos
os seus limites (inferiores e superiores) e dividirmos o resultado por dois.
Completando a tabela com esses dados, teremos:

Classes (Idades, Frequência Frequência Ponto médio da Frequência relativa


em anos) simples acumulada classe simples (em %)
14 . 100 = 28
20 |– 30 14 14 25
50
12 . 100 = 24
30 |– 40 12 26 35
50
11 . 100 = 22
40 |– 50 11 37 45
50
7 . 100 = 14
50 |– 60 7 44 55
50
1 . 100 = 2
60 |– 70 1 45 65
50
5 . 100 = 10
70 |– 80 5 50 75
50

Nesta unidade, vimos as normas do Instituto Brasileiro de Geografia e


Estatística (IBGE) para a confecção de uma tabela. Aprendemos a identificar
o título, o cabeçalho, a fonte e o corpo de uma tabela. Definimos série
estatística e sua classificação (em histórica, geográfica ou específica). Vimos,
detalhadamente, a confecção de uma tabela de distribuição de frequências,
inclusive com o cálculo do número de classes e sua amplitude. Em seguida,
aprendemos a confeccionar os principais tipos de gráficos e a identificar o
mais adequado para cada caso.

Esse tema é de suma importância tanto no meio acadêmico, quanto no


nosso cotidiano, visto que é comum o uso de gráficos em reportagens sobre
finanças, esportes, saúde, previsão do tempo, educação e em tantos outros
temas relevantes.

54 Estatística
Exercícios

1. Os dados a seguir representam o peso (massa) em Quilogramas,


de 70 pacientes atendidos em uma clínica ortopédica, no mês de
março de 2019. Complete a tabela de distribuição de frequência
desses dados e responda o que se pede:

Frequência Frequência Ponto médio da Frequência relativa


Classes (em kg)
simples acumulada classe simples (em %)

40 |– 50 10

50 |– 60 15

60 |– 70 20

70 |– 80 10

80 |– 90 7

90 |– 100 8

a. Qual a porcentagem de pacientes que têm 40 kg ou mais,


porém, menos do que 70 kg?
b. Qual a porcentagem de pacientes que têm 60 kg ou mais,
porém, menos do que 90 kg?
c. Qual a frequência acumulada da terceira classe?
d. Qual o limite inferior da segunda classe?
e. Um paciente com 70 kg está enquadrado em qual dessas classes?

2. A tabela a seguir representa os dados de 150 pacientes


atendidos em um determinado hospital, no mês de abril de
2019. Represente os dados por meio de um gráfico de setor
circular, com o auxílio do Excel.

Estatística 55
Número de consultas, por Especialidade Médica (abril, 2019)

Especialidade médica Número de consultas


Ortopedia 20
Clínica Médica 45
Pediatria 38
Otorrino 12
Ginecologia 35
Total 150

3. Represente a tabela a seguir, por meio de um gráfico em barras:

Gasto de uma família, por tipo de despesa (março, 2019)

Tipos de despesa Valor gasto (em reais)

Alimentação 500

Educação 300

Saúde 100

Moradia 1000

Transporte 100

GABARITO

1. Preenchendo a tabela, temos:

Frequência Frequência Ponto médio Frequência relativa


Classes (em kg)
simples acumulada da classe simples (em %)
10 . 100 = 14,29
40 |– 50 10 10 45
70
15 . 100 = 21,43
50 |– 60 15 25 55
70

56 Estatística
20 . 100 = 28,57
60 |– 70 20 45 65
70
10 . 100 = 14,29
70 |– 80 10 55 75
70
7 . 100 = 10
80 |– 90 7 62 85
70
8 . 100 = 11,42
90 |– 100 8 70 95
70

a. Qual a porcentagem de pacientes que têm 40 kg ou mais, porém,


menos do que 70 kg?

Podemos somar as frequências simples até a terceira classe e dividir o


resultado pelo total.

10 + 15 + 20 45
Assim, teremos: = = 64,29%.
70 70

Outra maneira de fazer seria somar as frequências relativas até a


terceira classe (14,29% + 21,43% + 28,57% = 64,29%).

b. Qual a porcentagem de pacientes que têm 60 kg ou mais, porém,


menos do que 90 kg?

20 + 10 + 7 37
= = 52,85%
70 70

c. Qual a frequência acumulada da terceira classe? 45.

d. Qual o limite inferior da segunda classe? 50.

e. Um paciente com 70 kg está enquadrado em qual destas classes?


Na quarta classe, pois a terceira contempla valores maiores ou iguais
a 60, porém, menores do que 70 kg. Por exemplo, um paciente
com 69,9 kg estaria na terceira.

Estatística 57
2. Para fazermos o gráfico no Excel, precisamos seguir os seguintes passos:

▪▪ Digitamos a tabela no Excel e a selecionamos.


▪▪ No menu “Inserir”, clicamos na opção “Gráfico” e, depois,
escolhemos o tipo “Pizza”.

Número de consultas por especialidade médica (abril, 2019)

Ortopedia
Clínica Médica
13%
Pediatria
23% Otorrinolaringologista
Ginecologia
8% 30%

25%

3. Utilizando o Excel, teremos:

Gasto de uma família, por tipo (março, 2019)


1100
1000
900
800
700
600
500
400
200
100
0
Alimentação Educação Saúde Moradia Transporte

58 Estatística
Referências
FONSECA, J. S.; MARTINS, G. A. Curso de estatística. 6 ed. São Paulo:
Atlas, 1992.

MEYER, P. L. Probabilidade: aplicações à estatística. 2 ed. Rio de Janeiro:


LTC, 1983.

TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2 ed. São Paulo:


Atlas, 1985.

TRIOLA, M. F. Introdução à estatística. 10 ed. Rio de Janeiro: LTC, 2008.

Estatística 59
Medidas de Posição
Para início de conversa…
Neste capítulo, veremos que as Medidas de Posição nos fornecem,
de forma resumida, o comportamento de fenômeno em estudo. Dentre elas,
destacamos as Medidas de Tendência Central (as principais são a Média,
Moda e a Mediana) e as Separatrizes (Percentis, Decis, Quartis etc.).

Estudaremos, também, que as Separatrizes têm como função separar


os dados em “n” partes, com a mesma quantidade de elementos cada. Já as de
Tendência Central são usadas quando queremos escolher adequadamente um
valor que represente, de alguma forma, o conjunto de todos os dados.

Estatística 61
Objetivo
Reconhecer e utilizar as Medidas de Posição na resolução de problemas. 

Estatística 63
1. Média
Para iniciarmos nossos estudos, é importante compreendermos o
conceito de média. Esta é encontrada quando somamos todos os dados e os
dividimos pelo número de dados. É o número “médio”.

1.1 Média Aritmética Simples de uma Amostra de Dados


Vamos, agora, conhecer alguns exemplos de média aritmética simples,
com casos de dados agrupados e não agrupados em classes.

1.1.1 Dados não Agrupados em Classes


Seja uma lista de n (n > 1) números Reais, x1, x2, x3, ..., xn. A média
aritmética simples é definida como:

_ x1+x2+x3+...+ xn
x=
n

Isto é, a média aritmética simples é igual à soma de todos os valores


dividida pela quantidade total de dados.

Exemplo 1: A média aritmética simples da seguinte sequência (12, 30,


13, 9, 12, 8, 7) é calculada da seguinte maneira:

_ 12 + 30 + 9 + 12 + 8 + 7 91
x= = = 13
n 7

Importante
A média é uma medida que depende de todos os dados da sequência. Por isso, não
deve ser utilizada quando a sequência tiver valores extremos (outliers). Cada número
tem exatamente a mesma importância (o mesmo peso) que os demais. Note que, se
somarmos, subtrairmos, multiplicarmos ou dividirmos cada elemento de uma determinada
sequência por uma constante, a média aritmética simples ficará acrescida, diminuída,
multiplicada ou dividida por essa constante.

Estatística 65
1.1.2 Dados Agrupados em Classes
Se estivermos trabalhando com uma distribuição de frequências
com intervalos de classes, devemos utilizar a seguinte fórmula para
determinar a média:

_ ∑ ( x1 . fi )
x=
n

Em que:

O sinal ∑ significa somatório.

xi representa o ponto médio da classe i

fi representa a frequência simples da classe i

Exemplo 2: Suporemos que a tabela de distribuição de frequência a seguir represente o peso


(em kg) de 42 pacientes de uma clínica de tratamento renal.

Classes (em kg) Frequência simples ( fi )

20 |– 30 4

30 |– 40 9

40 |– 50 16

50 |– 60 7

60 |– 70 1

70 |– 80 5

n = 42

66 Estatística
Para determinarmos a média aritmética simples, primeiro precisamos
determinar ∑ ( xi . fi ). Depois, substituímos esse valor na fórmula. Completando
a tabela, teremos:

Frequência simples Ponto médio da classe


Classes (em kg) xi . fi
( fi ) ( xi )
20 |– 30 4 25 25 . 4 = 100
30 |– 40 9 35 35 . 9 = 315
40 |– 50 16 45 45 . 16 = 720
50 |– 60 7 55 55 . 7 = 385
60 |– 70 1 65 65 . 1 = 65
70 |– 80 5 75 75 . 5 = 375

n = 42 ∑ ( xi . fi ) = 1960

Substituindo os valores na fórmula, temos:

_ ∑ ( xi . fi ) 1960 ~
x= = = 46,66
n 42

1.2 Média Aritmética Ponderada


Nesse tipo de média, os números possuem pesos diferentes. É
muito utilizada, por exemplo, no cálculo de notas compostas por diversos
instrumentos avaliativos, que têm importâncias (pesos) diferentes.

Exemplo 3: A nota bimestral de um colégio é composta de três instrumentos avaliativos,


valendo dez pontos cada. Cada aluno deverá fazer um teste (peso 1), um trabalho (peso 2)
e uma prova (peso 7).
Digamos que um aluno tenha obtido nota 6,5 no teste, 7,0 no trabalho e 5,5 na prova. Para
determinarmos sua nota, devemos efetuar o seguinte cálculo:

1 . (nota do teste) + 2 . (nota do trabalho) + 7 . (nota da prova)


Nota bimestral =
1+2+7

Estatística 67
1.3 Média Geométrica (G)
Seja uma sequência com n (n > 1) números reais positivos. A
média geométrica será igual à raiz n-ésima do produto de todos os seus
elementos. Ou seja,

G= √
n
(x1 ) . (x2 ) . (x3 ) . … . (xn )

Exemplo 4: Determine a média geométrica dos dados (9; 11 e 15).

Substituindo os valores na fórmula, obtemos:

G=
a
√ 9 . 11 . 15 = √
a
1.485 =~ 11,40

Exemplo 5: A tabela a seguir exibe a taxa de aumento do salário mínimo, entre os anos de
2015 e 2018. Determine a taxa média de aumento, no período citado.

Aumento percentual do salário mínimo no Brasil, de 2015 a 2018

Ano Taxa de Reajuste Concedida


2015 8,84%
2016 11,68%
2017 6,48%
2018 1,81%

A média pedida equivale a um valor (percentual), que, se fosse


concedido igualmente mês a mês, produziria o mesmo montante (valor final)
que essas taxas aplicadas sucessivamente no valor inicial. Esse problema
pode ser resolvido utilizando-se o conceito de média geométrica, conforme
descrito a seguir:

G=
4
√ (1 + 8,84 ) . (1 + 11,68 ) . (1 + 6,48 ) . ( 1+ 1,81 )
100 100 100 100

68 Estatística
G=
4
√ (1 + 0,884) . (1 + 0,1168) . (1 + 0,0648) . (1 + 0,0181)

G= √
4
(1 + 1,0884) . (1 + 1,1168) . (1 + 1,0648) . (1 + 1,0181) =~ 1,071409

1,071409 - 1 = 0,071409 (ou 7,1409%)

Isso significa que, se fossem concedidos quatro aumentos anuais,


iguais e sucessivos de 7,1409%, teríamos o mesmo valor final que temos
ao conceder, respectivamente, 8,84%, 11.68%, 6,48% e, depois, 1,81%.
Para efeito de comparação, faremos o cálculo mês a mês, das duas situações,
supondo um salário inicial de R$ 1.000,00.

Valor final com as taxas dadas Valor final com as taxas médias
(8,84%, 11,68%, 6,48% e 1,81%) (7,1409% em todos os meses)
Primeiro mês 1.088,40 1.071,40
Segundo mês 1.215,52 1.147,90
Terceiro mês 1.294,28 1.229,87
Quarto mês 1.317,70 1.317,70

Importante
Isso não significa que, para o trabalhador, seria a mesma coisa receber esses aumentos
ou a média de aumento salarial anual. Observe, na tabela, que ele teria uma perda
mensal nos salários.

1.4 Média Harmônica Simples (H)


Seja uma lista de n (n > 1) números reais positivos, x1, x2, x3, ..., xn. A
média harmônica simples é definida como:

H- = n
1 + 1 + 1 ... + 1
x1 x2 x3 xn

Estatística 69
Isto é, é igual ao inverso da média aritmética simples dos inversos dos
dados. Normalmente utilizamos esse tipo de média quando estamos tratando
de dados inversamente proporcionais entre si, tais como vazão de um fluído e
o tempo de escoamento ou velocidade e tempo de viagem.

Exemplo 6: Calcule a média harmônica da sequência 3, 8, 6 e 12:

Substituindo na fórmula, obtemos:


_ 4 4
H= = = 4 = 96 =~ 5,65
1 +1 + 1 + 1 8+3+4+2 17 17
3 8 6 12 24 24

Exemplo 7: Uma padaria recebeu uma encomenda de última hora. O administrador sabe
que a matriz, sozinha, demoraria 6 horas para produzir o pedido. Se fosse só a filial, seriam
necessárias 8 horas. Se elas trabalhassem simultaneamente, quanto tempo seria necessário
para terminar a encomenda?

Calculando a média harmônica simples, temos:


_ 2
H= = 2 = 48 =~ 6,85 horas
1 +1 + 7 7
6 8 24

Como as duas fariam simultaneamente, o tempo se reduziria à metade.


Ou seja, juntas, demorariam, aproximadamente, 3,42 horas.

Só para conferir, vamos supor que a encomenda fosse de 240 bolos. Se a


matriz levaria 6 horas para concluir, isso significa que ela faz 40 bolos por hora; já
a filial precisaria de 8 horas, ela faz 30 unidades por hora. Logo, juntas, fazem 70
bolos por hora. Se têm que fazer 240 bolos, precisam de 240 = 3,42 horas.
70

Exemplo 8: Uma torneira demora 6 horas para encher um reservatório. Uma segunda saída
de água, sozinha, demoraria 12 horas para encher o mesmo recipiente. Quanto tempo seria
necessário para que as duas torneiras, simultaneamente abertas, enchessem o recipiente?
_ 2
H= = 2 =8
1 +1 + 3
6 12 12

70 Estatística
Como as duas torneiras estarão abertas simultaneamente, esse tempo
se reduz ao meio, ou seja, serão necessárias 4 horas.

Para fazer um teste, supomos que a capacidade do reservatório seja


de 120 litros. Se uma torneira demora 6 horas para enchê-lo, ela derrama 20
litros a cada hora; a segunda, pelo mesmo raciocínio, entorna 10 litros por
hora. Juntas, derramam 30 litros por hora. Como são 120 litros, precisam de
4 horas, juntas, para completar a tarefa.

2. Moda
A moda (Mo ) é o dado que tem maior frequência simples, ou seja, é
o que mais se repete. Essa medida pode ser utilizada para dados qualitativos
ou quantitativos, isto é, podemos determinar a moda de dados não numéricos
ou numéricos.

2.1 Dados Não Agrupados em Classes


Uma sequência pode ser amodal (não ter moda), bimodal (ter
exatamente duas modas) ou multimodal (ter três ou mais modas).

Se todos os valores tiverem a mesma frequência absoluta, a sequência


será amodal.

Exemplo 9: A moda da sequência a seguir é o elemento “21”, pois ele tem a maior frequência
absoluta, isto é, é o número que mais se repete nessa sequência.

12 21 10 11 30 31 21 31 21 17
16 14 16 22 21 11 25 12 31 15

Exemplo 10: A moda da sequência a seguir é o elemento “Paulo”, que se repete mais vezes
que os demais.

Ana Diana Paulo Marta João Andressa Ricardo Paulo


Carlos José Maria Pedro Carla Paulo Alessa Ygor

Estatística 71
2.2 Dados Agrupados em Classes
Existem diferentes maneiras para determinarmos a moda de uma
distribuição de frequência em intervalos de classes. Destacamos a Moda de
King, a Moda de Pearson e a Moda de Czuber. Neste capítulo, optamos pelo
uso da fórmula da Moda de Czuber, abaixo descrita:

[ ]
Mo = l i + h . ( fi - fi -1
)
( fi - fi - 1 ) + ( fi - fi + 1 )

Em que:

i é a classe modal (a classe que tem maior frequência simples)

h é a amplitude da classe

li é o limite inferior da classe modal

fi é a frequência absoluta simples da classe modal

f i - 1 é a frequência absoluta simples da classe anterior à classe modal

Exemplo 11: A tabela a seguir exibe a altura, em centímetros, de 50 alunos participantes


de um projeto de Educação Física, denominado “Projeto Futebol”. Determine a moda desse
conjunto de dados.

Altura (em cm) dos alunos participantes do “Projeto Futebol”, da Escola X, 2018

Classes (em centímetros) Frequência simples ( Fi )
130 |– 140 2
140 |– 150 5
150 |– 160 4
160 |– 170 21 Classe modal
170 |– 180 14
180 |– 190 4
n = 50

72 Estatística
Nesse caso, teremos:

[ ]
h . ( fi - fi )
Mo = li + -1

( fi - fi - 1 ) + ( fi - fi + 1 )

Em que:

i é a quarta classe, pois é a que possui a maior frequência simples

h é a amplitude da classe, que, no nosso caso, é igual a 10

li é o limite inferior da quarta classe, que é 160

fi é a frequência absoluta simples da quarta classe, que é 21

f i - 1 é a frequência absoluta simples da terceira classe, que é 4

f i + 1 é a frequência absoluta simples da quinta classe, que é 14

Substituindo os valores na fórmula, temos:

[ ]
Mo = 160 + 10 . ( 21 - 4 )
( 21 - 4 ) + ( 21 - 14 )

[ ]
10 . (17 )
Mo = 160 +
(17 ) + ( 7 )

Mo = 160 + 170 =~ 167,08


24

3. Mediana ( Md )
A mediana é o termo que ocupa a posição central da sequência, já
organizada de forma crescente ou decrescente.

Estatística 73
3.1 Dados Não Agrupados em Classes

Se a sequência tiver uma quantidade ímpar de elementos, a mediana


será o termo central. Se a quantidade de elementos for par, devemos somar os
dois elementos centrais da sequência e dividir o resultado por dois.

Exemplo 12: Esta sequência possui 9 elementos. A mediana é o termo do meio.

8 11 15 22 25 29 32 37 41

4 elementos 4 elementos
Mediana

Exemplo 13: Esta sequência possui 8 elementos. Precisamos somar os dois elementos do
meio e dividir a resposta por dois.

11 19 21 24 26 29 41 43

Md = 24 + 26 = 50 = 25
2 2

Importante

A mediana, ao contrário da média, não é afetada por valores extremos.

Observe que as duas sequências a seguir têm a mesma mediana, apesar


de o último elemento da segunda ser o cêntuplo da primeira.

Glossário

Cêntuplo é um número multiplicativo que significa aquele que contém cem vezes a mesma
quantidade, ou seja, o que é cem vezes o outro.

74 Estatística
2 14 15 27 31 39 42 49 51

Mediana

2 14 15 27 31 39 42 49 5100

3.2 Dados Agrupados em Classes


A mediana é o número que divide uma série ordenada de dados em
duas outras com a mesma quantidade de elementos. Para dados distribuídos
em classes, utilizamos a seguinte fórmula para determinação da mediana:

[ ]
( )
∑ fi
- fi
2 -1
.h
P50 = li +
fi
Em que:

i é a classe que contém o elemento mediano da distribuição, ou seja,


que contém a posição ∑ fi . Essa classe é denominada de classe mediana.
2

h é a amplitude da classe mediana

li é o limite inferior da classe mediana

fi é a frequência absoluta simples da classe mediana

Fi - 1 é a frequência acumulada da classe anterior à classe mediana.


Observe que a letra “F” maiúscula diz respeito à frequência acumulada,
enquanto a letra “f ” minúscula representa a frequência simples.

3.3 Separatriz
São valores que ocupam posições no rol (ou seja, uma amostra já
ordenada), dividindo-o em partes iguais. As principais separatrizes são o
percentil, o decil e o quartil.

Estatística 75
3.3.1 Percentil
Divide um rol em cem partes de mesma frequência. Existem 99
percentil: P1, P2, P3, ..., P97, P98, P99. Como os quartis e decis são um subcaso
de percentil, estudaremos apenas o caso geral (o percentil).

1% 1% 1% 1% 1% ... 1% 1% 1% 1%
P1 P99

3.3.1.1 Dados Agrupados em Classes


Para determinarmos um percentil x, representado por Px, de dados
agrupados em classes, utilizamos a seguinte fórmula:

[( ) ]
x . ∑ fi
- fi
100 -1
.h
Px = li +
fi

Em que:

i é a classe que contém o elemento central da distribuição, ou seja, a


n.∑ f .
classe que contém a posição 100i . No caso da mediana, esse valor sempre
será a metade do somatório das frequências simples

h . é a amplitude da classe

li é o limite inferior da classe que contém a posição central da


distribuição

f1 é a frequência absoluta simples da classe que contém a posição


central da distribuição

Fi - 1 é a frequência acumulada da classe anterior à classe que contém


a posição central da distribuição. Observe que a letra “F” maiúscula diz

76 Estatística
respeito à frequência acumulada, enquanto a letra “f ” minúscula representa a
frequência simples.

Exemplo 14: Determine o percentil 50 da seguinte tabela de distribuição de frequência:

Altura (em cm) dos alunos participantes do “Projeto Futebol”, da Escola X, 2018

Classes (em centímetros) Frequência simples ( fi )


130 |– 140 2
140 |– 150 5
150 |– 160 4
160 |– 170 21
170 |– 180 14
180 |– 190 10

∑ f = 56
i

Primeiro, devemos determinar a frequência acumulada de cada classe:

Classes (em Frequência simples


Frequência acumulada ( Fi )
centímetros) ( fi )
130 |– 140 2 2
140 |– 150 5 2+ 5 =7
150 |– 160 4 2 +5 + 4 = 11 Classe utilizada
para o percentil 50.
160 |– 170 21 2 +5+ 4+ 21 = 32
Nela, encontra-se o
170 |– 180 14 2 +5+ 4 + 21 +14= 46 28o termo
180 |– 190 10 2 +5+ 4 + 21 +14+ 10 = 56

Essa sequência possui 56 elementos (∑ fi = 56). Nós queremos


determinar o percentil 50 (x = 50). A posição central é determinada por

Estatística 77
x.∑ fi 50.56
= = 28
100 100

Isto é, a classe que buscamos é aquela que possui o vigésimo oitavo


elemento da sequência. No nosso exemplo, será a quarta classe. Observe que
o percentil 50 equivale à mediana de uma distribuição de frequências, pois
ambos a dividem ao meio.

i é a quarta classe

h é a amplitude da quarta classe,que é igual a

li é o limite inferior da quarta classe, que é 160

fi é a frequência (absoluta) simples da quarta classe, que é 21

Fi - 1 é a frequência acumulada da terceira classe, que é 11

Substituindo na fórmula, temos:

[ ]( )
x . ∑ fi
- fi
100 -1
.h
Px = l i +
fi

[ ]
( ) 50 . 56 - 11
100 . 10
P50 = 160 +
21

[ ]
P50 = 160 + 28 . 11 . 10
21

[ ]
P50 = 160 + 28 . 11 . 10 = 160 + 8,09 = 168,09
21

78 Estatística
3.3.2 Decil

Divide o conjunto de dados em dez partes, todas com a mesma


quantidade de elementos. Há 9 decis: D1, D2, D3, D4, D5, D6, D7, D8 e D9.
Observe que 10% dos dados são menores ou iguais ao primeiro decil (D1 )
ou, ainda, 30% dos dados são iguais ou menores que o terceiro decil (D3 ).

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1 D2 D3 D4 D5 D6 D7 D8 D9

3.3.2.1 Dados Agrupados em Classes

Se quisermos calcular um decil de dados agrupados, calculamos


o percentil equivalente a ele. Assim, utilizaremos apenas a fórmula de
percentil. Por exemplo, o sexto decil tem o mesmo valor do percentil 60,
conforme tabela abaixo.

Decil Percentil equivalente Decil Percentil equivalente


Primeiro Percentil 10 Sexto Percentil 60
Segundo Percentil 20 Sétimo Percentil 70
Terceiro Percentil 30 Oitavo Percentil 80
Quarto Percentil 40 Nono Percentil 90
Quinto Percentil 50

3.3.3 Quartil
Divide o conjunto de dados em quatro partes, todas com a mesma
quantidade de elementos. Note que 25% dos dados têm valores menores
ou iguais ao primeiro quartil (Q 1 ) ou, ainda, 75% dos dados têm valores
menores ou iguais ao terceiro quartil (Q 3 ).

Estatística 79
25% 25% 25% 25%
Q1 Q2 Q3

2.3.3.1 Dados Agrupados em Classes

Se quisermos determinar um quartil de dados agrupados, devemos


calcular o percentil equivalente a ele, conforme a tabela abaixo.

Quartil Percentil equivalente

Primeiro Percentil 25
Segundo Percentil 50
Terceiro Percentil 75

Exemplo 15: Determine o terceiro quartil (Q3 ) da seguinte distribuição:

Frequência Frequência
Classes (em centímetros)
simples ( fi ) acumulada ( Fi )

28,5 |– 30 2 2
30,0 |– 31,5 2 4
31,5 |– 33,0 19 23
33,0 |– 34,5 17 40
34,5 |– 36,0 10 50

36,0 |– 37,5 8 58
37,5 |– 39,0 2 60

∑f i = 56

80 Estatística
Como o terceiro quartil equivale ao percentil 75, temos:

[ ( )
]
x . ∑ fi
- fi
100 -1
.h
Px = li +
fi

[ ]
( ) 75 . 60 - 40
100 . 1,5
P75 = 34,5 +
10

[ ]
P75 = 34,5 + 45 - 40
10
. 1,5

[]
P75 = 34,5 + 5
10
. 1,5 = 34,5 + 0,75 = 35,25

Nesta unidade, estudamos as Medidas de Posição. Vimos,


detalhadamente, as medidas de tendência central (especialmente a média
aritmética, a moda e a mediana) e as separatrizes (as principais são percentis,
decis, quintis e quartis). As medidas de tendência central recebem esse nome
pelo fato de os dados observados tenderem, em geral, a se agrupar em torno
dos valores centrais. Já as separatrizes são assim chamadas, pois têm como
finalidade separar (dividir) uma distribuição em partes iguais.

Vimos a definição e a fórmula para o cálculo dessas medidas, tanto


para dados agrupados em classes quanto para os dados não agrupados. Em
seguida, vimos exemplos em diferentes áreas de conhecimento.

Estatística 81
Referências
FONSECA, J. S.; MARTINS, G. A. Curso de estatística. 6 ed. São Paulo:
Atlas, 1992.

MEYER, P. L. Probabilidade: aplicações à estatística. 2 ed. Rio de Janeiro:


LTC, 1983.

TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2 ed. São Paulo: Atlas,


1985.

TRIOLA, M. F. Introdução à estatística. 10 ed. Rio de Janeiro: LTC, 2008.

Estatística 83
Exercícios Resolvidos
Questão 1:

A tabela a seguir exibe a medida do perímetro cefálico (em


centímetros) de 60 recém-nascidos (nascidos a termo), do sexo feminino, em
uma determinada maternidade, no ano de 2018. De acordo com estes dados,
determine o que se pede:

Perímetro cefálico de recém-nascidos (a termo), sexo feminino, Maternidade A, 2018

Classes (em Frequência Frequência


centímetros) simples ( fi ) acumulada ( Fi )

28,5 |– 30 2 2

30,0 |– 31,5 2 4
Classe utilizada para o
31,5 |– 33,0 19 23 percentil 10. Nela, encontra-se
o 6o termo
33,0 |– 34,5 17 40

34,5 |– 36,0 10 50
Classe utilizada para o
36,0 |– 37,5 8 58 percentil 90. Nela, encontra-se
o 54o termo
37,5 |– 39,0 2 60

∑ f = 60
i

Estatística 85
a. O percentil 10.
b. O percentil 90.
c. O primeiro decil.
d. O limite superior da terceira classe.
e. O limite inferior da primeira classe.
f. A classe em que se encontra um bebê cujo perímetro cefálico seja
igual a 33.

Questão 2:

Determine a média harmônica simples e a geométrica da sequência a seguir:

5 ; 4 ; 2 ; 10

Questão 3:

Determine a mediana da seguinte sequência de dados: (11, 25, 10,


12, 14, 17, 32).

Respostas:

Questão 1:

a. Percentil 10

[( )
]
x . ∑ fi
- Fi
100 -1
.h
Px = l i +
fi

[ ]
( ) 10 . 60 - 4
100 . 1,5
P10 = 31,5 +
19

86 Estatística
[ ]
P10 = 31,5 + 6 - 4
19
. 1,5

P10 = 31,5 + 2
[]
19
. 1,5 = 31,5 + 0,1578 = 31,65

b. Percentil 90

[ ( )
]
x . ∑ fi
- Fi
100 -1
.h
Px = l i +
fi

[ ]
( ) 90 . 60 - 50
100 . 1,5
P90 = 36,0 +
8

[ ]
P90 = 36,0 + 54 - 50 . 1,5
8

P90 = 36,0 + 4
8[] . 1,5 = 36,0 + 0,75 = 36,75

c. O primeiro decil tem o mesmo valor do percentil 10, ou seja,


D1 = P10 = 31,65.
d. 33 cm.
e. 28,5 cm.
f. 4a classe.

Estatística 87
Questão 2:

a. Substituindo os valores na fórmula de média harmônica, temos:


_ n
H=
1 + 1 + 1 + ... + 1
x1 x2 x3 xn

_ 4 4
H= = = 4 = 80 =~ 3,809
1 +1 + 1 + 1 4 + 5 + 10 + 2 21 21
5 4 2 10 20 20

b. Utilizando a fórmula de média geométrica, encontramos:

G=
n
√ ( x1 ) . ( x2 ) . ( x3 ) . ... . ( xn )

G=
4
√ 5 . 4 . 2 . 20 =
4
√ 800 . ~= 5,318

Questão 3:

Organizando, de maneira crescente, os dados, temos: 10, 11, 12, 14,


17, 25, 32.

Como a mediana é o termo que ocupa a posição central, ela será o


elemento 14.

88 Estatística
Medidas de Dispersão
Para início de conversa…
As medidas de dispersão indicam o grau de dispersão dos dados em
torno de um valor médio. Mas, o que isto significa efetivamente? Para melhor
entendermos, vamos analisar o seguinte resultado, publicado pelo Hospital
John Radcliffe, em Oxford, na Grã-Bretanha. Após o acompanhamento de 8
mil pacientes que haviam sofrido um infarto, foi descoberto que aqueles que
sofriam com variabilidade da pressão arterial estavam seis vezes mais sujeitos
a ter um derrame do que aqueles com constante pressão alta.

Vamos imaginar que haja uma pessoa cujas medidas de pressão arterial
sistólica (máxima), em uma determinada semana, tenham sido 170 mmHg,
120 mmHg, 180 mmHg, 120mmHg, 190 mmHg, 120 mmHg e 170 mmHg.
De acordo com esse estudo, ela estaria (supostamente) até seis vezes mais
sujeita a ter um derrame do que outra pessoa que esteve com sua pressão alta
(por exemplo, 160 mmHg) durante toda a semana em questão. Ainda que
em grande parte (moda) do tempo sua pressão tenha estado em um valor
considerado bom (120 mmHg ou 12, como normalmente falamos), a variação
ofereceu riscos à sua saúde. Se analisássemos apenas a média ou a moda destes
dados, não perceberíamos o problema.

Em situações como estas, as Medidas de Posição não são representativas


do todo. Para quantificar (medir) tais variações, utilizamos as Medidas de
Dispersão. Elas indicam o quão disperso estão os dados em relação à média,
podendo ser de dispersão absoluta (como o desvio médio, a variância, o desvio
padrão e o desvio quartílico) ou de dispersão relativa (como o coeficiente
de variação e a variância relativa). Neste capítulo aprenderemos a fazer
esses cálculos e conheceremos suas aplicabilidades em diferentes ramos de
conhecimento.

Estatística 91
Objetivos
▪▪ Relacionar Desvio Padrão com variância e com as medidas de
posição.
▪▪ Analisar e tirar conclusões a partir das informações transmitidas no
estudo das Medidas de Dispersão. 

Estatística 93
1. Variância e Desvio Padrão
A variância é a média dos quadrados dos desvios em relação à média
dos dados, por isso ela é expressa em unidade quadrada, quando comparada à
unidade da variável em estudo. O cálculo desta medida é de suma importância
na inferência estatística e em combinações de amostras.

1.1 Variância e Desvio Padrão de Dados Não Agrupados em Classes

Vamos conhecer, agora, os procedimentos e cálculos que precisamos


realizar para encontrarmos a variância e o Desvio Padrão de uma população.

1.1.1 Variância e Desvio Padrão de uma População

Ao extrairmos a raiz quadrada (não negativa) da variância,


encontraremos uma medida denominada desvio padrão. Ela sempre será um
número não negativo e expresso na mesma unidade da variável. As fórmulas
a seguir são utilizadas para o cálculo da variância e do Desvio Padrão de uma
população.

Variância de uma população Desvio padrão de uma população

σ2 = ∑
( xi − µ ) 2 ∑ (x − µ )
i
2

σ=
n n

Importante
O símbolo σ representa a letra Sigma. Ela é a décima oitava letra do alfabeto grego e
corresponde à letra s, do nosso alfabeto. Quando nos referimos ao desvio padrão de uma
população, utilizamos o símbolo σ . Se for o desvio de uma amostra, usamos s.

Estatística 95
1.1.2 Variância e Desvio Padrão de uma Amostra de Dados
Quando, partindo de uma amostra de dados, objetivamos tirar
conclusões válidas para a população da qual ela foi retirada, devemos fazer
um ajuste na fórmula e utilizar o denominador como sendo n-1 . Assim, as
fórmulas dos cálculos de variância e Desvio Padrão de uma amostra de dados,
são, respectivamente:

Variância de uma amostra de dados Desvio padrão de uma amostra de dados

s 2
=
∑ ( x − x)
i
2

s=
∑ (x − x)
i
2

n −1 n −1

Exemplo 1: A tabela a seguir exibe o número de contratos diários


de empréstimo efetivados em um determinado banco, durante sete dias de
serviço. Determine o que se pede:

11 6 10 12 8 14 9

a. O desvio padrão desta amostra de dados.


Primeiro, precisamos calcular a média:

Depois, calculamos a distância entre cada elemento e a média, elevando


ao quadrado cada resultado obtido.

xi ( xi − x) 2

11 (11 - 10)2 = 1

6 (6 - 10)2 = 16

96 Estatística
10 (10 - 10)2 = 0

12 (12 - 10)2 = 4

8 (8 - 10)2 = 4

14 (14 - 10)2 = 16

9 (9 - 10)2 = 1

∑ ( x − x)
i
2
42
=

Substituindo o resultado, na fórmula, obtemos:

s
=
∑ (x − x=
i ) 2
42
=
42
= 7 ≅ 2, 645
n −1 7 −1 6

b. Se o gerente determinar que, quem conseguir efetivar uma


quantidade de contratos acima do valor de “média mais dois
desvios” ganhará um prêmio, qual o mínimo de contratos que deve
ser feito para que se ganhe o prêmio?
Como a média ( x ) é 10 e o desvio (s) é 2,645, temos:

x + 2.s =10 + 2.(2, 645) =15, 29

Ou seja, quem fizer pelo menos 16 contratos receberá o prêmio.

c. Se ficar determinado que, quem não conseguir um mínimo de


vendas superior ao resultado de “média menos um desvio” deverá
trabalhar aos sábados, qual o número mínimo de contratos para
que não se precise trabalhar sábado?

x − s = 10 − 2, 645 = 7,355

Ou seja, quem fizer 8 ou mais contratos estará dispensado de


trabalhar sábado.

Estatística 97
Exemplo 2: Para melhor entendermos o conceito de desvio padrão,
faremos a representação gráfica de três diferentes amostras de dados.
Para facilitar a análise, já calculamos (por meio das fórmulas estudadas
anteriormente), os valores da média e do desvio.

Média Desvio

Amostra A x=5 s=0

Amostra B x=5 s = 1,309

Amostra C x=5 s = 3,625

Amostra A Amostra B
9 3
8
7
6 2
Frequência

Frequência

5
4
3 1
2
1
0 0
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9
Dados Dados

Amostra C

4
3
Frequência

2
1
Média

0
1 2 3 4 5 6 7 8 9 10
Dados

Como as médias das três amostras são iguais e os dados estão na


mesma unidade, o desvio padrão é uma boa medida de comparação para
a variação dos dados. Se as médias não tivessem valores aproximadamente
iguais ou as unidades fossem diferentes, deveríamos utilizar o Coeficiente de
Variação. Observe que a amostra C é a mais dispersa em relação à média e, na
amostra A, não há dispersão em relação à média.

98 Estatística
Dica: Para calcular o Desvio Padrão de uma amostra de dados
utilizando o Microsoft Excel, abra uma nova planilha do programa e digite
cada número da sequência dada, em uma célula (consecutiva) diferente. Em
seguida, em outra célula vazia, digite a sintaxe “=DESVPAD.A” (observe que
ao começar a digitar, o programa já te dará esta opção) e selecione (com o
mouse) todas as células onde se encontram os dados para os quais você quer
determinar o desvio. Feche o parêntese e dê “enter”. O resultado já aparecerá
automaticamente.

A figura a seguir exibe o cálculo, no Excel, do Desvio Padrão da


amostra composta pelos números 2, 2, 2, 3, 3, 9, 9 e 10.

1.2 Variância e Desvio Padrão de Dados Agrupados em Classes


Se os dados estiverem dispostos em uma tabela de distribuição de
frequências com intervalos de classes, devemos utilizar a fórmula a seguir
para calcular a variância. Caso também se deseje determinar o desvio padrão,
basta extrair a raiz quadrada do valor encontrado (ou seja, extrair a raiz da
variância).

=s 2 ∑ ( x . f ) −  ∑ f .x 
2
i i i i

n  n 
 

Estatística 99
Exemplo 3: A tabela a seguir exibe o peso, em Kg, de 42 pacientes
atendidos em um hospital, no mês de maio. Determine a variância e o desvio
padrão desta amostra.

Classes Frequência simples Ponto médio da xi . fi xi2 . fi


(em Kg) ( fi ) classe ( xi )
20  30 4 25 25 .4 = 100 252 . 4 = 2500
30  40 9 35 35 . 9 = 315 352 . 9 = 11.025
40  50 16 45 45 . 16 = 720 452 . 16 = 32.400
50  60 7 55 55 . 7 = 385 552 . 7 = 21.175
60  70 1 65 65 . 1 = 65 652 . 1 = 4.225
70  80 5 75 75 . 5 = 375 752 . 5 = 28.125
n = 42 ∑ ( x . f ) = 1960
i i ∑ ( x . f ) = 99.450
2
i i

Substituindo os resultados da tabela acima, na fórmula, obtemos:

=s2
∑ ( x . f ) −  ∑ f .x 
2
i i i i

n  n 
 
2
99450  1960 
s2 = −  =2.367,86 − 2.177, 77 =
190, 08
42  42 

Ou seja, a variância é 190,08.

Para calcularmos o desvio padrão, basta extrair a raiz quadrada da


variância, ou seja,
= s 190, 08 ≅ 13, 78 .

2. Coeficiente de Variação (CV)


Analisando o valor do desvio padrão, de maneira absoluta, podemos
ser induzidos ao erro. Vamos supor as duas situações a seguir:

100 Estatística
Média Simples x Desvio padrão (s)

Amostra A 40 15
Amostra B 550 15

Observe que as duas amostras possuem o mesmo desvio. Porém, se


pensarmos em relação à média, vamos perceber que, na Amostra A, a variação
é bem mais significativa do que na amostra B. Para medirmos a variabilidade
dos dados, em termos relativos ao seu valor médio, utilizamos uma medida
de dispersão denominada Coeficiente de Variação (CV).

Para calcularmos o coeficiente de variação, utilizamos a fórmula CV = xs .


Se quisermos este valor expresso em porcentagem, basta multiplicarmos o valor
obtido por cem, isto é, CV (%) =  xs  . Por eliminar a influência da magnitude dos
dados, o CV é útil para compararmos duas ou mais variáveis.

Calculando os coeficientes de variação das amostras supracitadas,


obtemos:

Coeficiente de variação (CV)

15
Amostra A CV
= (%) = .100 37,50%
40

15
Amostra B CV (%)
= = .100 2, 72%
550

Exemplo 4: Uma empresa fabrica pães e bolos. Apesar do uso de


fôrmas, as peças acabam variando um pouco de peso, o que é aceitável
pelo controle de qualidade da firma. O peso médio do pão é 100 gramas.
O peso médio do bolo é 400 gramas. O gerente pegou uma amostra de
50 pães e 50 bolos, de um determinado dia. O desvio padrão de ambas
amostras deu 25 gramas. Ao calcular o coeficiente de variação, obtiveram-
se os seguintes valores:

Estatística 101
25
CV pão
= = .100 25%
100
25
CVbolo
= = .100 6, 25%
400

Se o gerente considerasse como aceitável uma peça ter um peso que


distasse um desvio em relação à média, a mais ou a menos, teríamos a seguinte
situação:

Peso aceitável

(100 - 25) ≤ peso do pão ≤ (100 + 25)


Pão
75 gramas ≤ peso do pão ≤ 125 gramas

(400 - 25) ≤ peso do bolo ≤ (400 + 25)


Bolo
375 gramas ≤ peso do bolo ≤ 425 gramas

Note que 25 gramas a menos no bolo não fariam tanta diferença. Mas,
se estivessem faltando as mesmas 25 gramas no pão, seria inaceitável para o
consumidor. E 25 gramas a mais, em cada pão, representariam um grande
prejuízo para a empresa.

Observe que o Coeficiente de Variação indica que a fabricação de pão


está com ta variabilidade (25%) nos pesos; estaria fora do padrão aceitável.
Quanto ao Coeficiente do bolo (6,25%), estaria bom.

Exemplo 5: Determine o coeficiente de variação da seguinte amostra de dados:

20 11 9 13 10 12 9

A média dos dados é igual a:


20 + 11 + 9 + 13 + 10 + 12 + 9 84
x
= = = 12
7 7

102 Estatística
Calculando o desvio, temos:

( xi − x) 2 ( xi − x) 2

20 (20 - 12)2 = 64

11 (11 - 12)2 = 1

9 (9 - 12)2 = 9

13 (13 - 12)2 = 1

10 (10 - 12)2 = 4

12 (12 - 12)2 = 0

9 (9 - 12)2 = 9

∑ ( x − x)
i
2
88
=

Substituindo o resultado, na fórmula, obtemos:

=s
∑ (x −=
x)
i
2
88
=
88
= 14, 66666 ≅ 3,829
n −1 7 −1 6

O coeficiente de variação será:

3,829
CV (%)
= = .100 31,90%
12

Exemplo 6: Uma escola está desenvolvendo um projeto sobre a


importância da prática de atividades físicas. Após a realização de uma
pesquisa, com uma amostra de alunos, foram calculadas algumas medidas de
dispersão. Os dados foram expostos na tabela a seguir. Calcule os coeficientes
de variação e analise os resultados obtidos.

Estatística 103
Média ( x ) Desvio padrão (s) Coeficiente de variação (CV)
Horas diárias de prática de CV
=
0, 2
.100 ≅ 9,52
2,1 0,2 2,1
atividades físicas
3, 0
Peso 62 Kg 3,0 CV
=
62
.100 ≅ 4,83

Se analisarmos em relação à média, os estudantes são duas vezes mais


dispersos quanto à atividade física do que quanto ao peso.

Exemplo 7: Analise a informação a seguir, divulgada no Fórum


Mundial de Davos, pela Oxfam (Organização Internacional de Combate à
Pobreza), e verifique se a média aritmética seria uma boa medida representativa:
“As 26 pessoas mais ricas do planeta possuem a mesma riqueza que os demais
3,8 bilhões de pessoas que compõem a metade mais pobre da humanidade”.
(O GLOBO, 2019).

Se somarmos toda a riqueza das 3,8 bilhões de pessoas mais pobres,


com a riqueza destas 26 pessoas mais ricas do mundo e dividirmos o valor
total por 3.000.000.026 (três bilhões e vinte seis), teremos a média de riqueza
(ou riqueza per capita) deste grupo. Mas, será que esta medida representaria
a real situação destas pessoas? Claro que não. Bilhões de pessoas precisam
sobreviver com a mesma quantidade de dinheiro que as 26 outras pessoas, ou
seja, a média não seria representativa.

Exemplo 8: A tabela a seguir exibe a idade (em anos) dos usuários que
acessaram um determinado aplicativo de jogo, recém-lançado no mercado,
durante a primeira semana de maio. Determine o coeficiente de variação desta
amostra.

Classes Frequência Ponto médio da xi . fi xi2 . fi


(em anos) simples ( fi ) classe ( xi )
10  14 21 12 12. 21 = 252 122. 21 = 3.024

14  18 12 16 16.12 = 192 162.12 = 3.072

104 Estatística
18  22 18 20 20.18 = 360 202.18 = 7.200

22  26 15 24 24.15 = 360 242.15 = 8.640

26  30 6 28 28.6 = 168 282. 6 = 4.704

30  34 3 32 32.3 = 96 322.3 = 3.072

n = 75 ∑ ( xi . fi ) = 1428 (
∑ xi2 . fi ) = 29.712

Substituindo os resultados da tabela acima, na fórmula para cálculo da


variância, obtemos:
2

=s 2 ∑ ( x . f ) −  ∑ f .x 
2
i i i i

n  n 
 
2
29712  1428 
s2 = −  = 396,16 − 362,52 = 33, 64
75  75 

Como a variância é igual a 33,64, extraímos a raiz quadrada deste valor


para obtermos o desvio padrão:

=s 33, 64 5,8
=

Para o cálculo da média, substituímos os valores na fórmula a seguir:

∑ ( xi . fi ) 1428
=x = = 19, 04
n 75

Como o Coeficiente de Variação é a razão entre o desvio padrão e a


média (para expressarmos em porcentagem, temos que multiplicar o resultado
por 100), temos:

5,8
CV ( % )
= .100 ≅ 30, 46%
19, 04

Estatística 105
3. Desvio Médio (DM)
O Desvio Médio é definido como a média das distâncias entre cada
elemento da amostra e seu valor médio. A fórmula para o cálculo do Desvio
Médio é:

∑ xi − x
DM =
n

Exemplo 1: Determine o Desvio Médio da seguinte sequência de dados:

3, 5, 5, 7, 2, 8

Número xi − x

3 3−5 =2

5 5−5 =
0

5 5−5 =
0

7 7−5 =2

2 2−5 =
3

8 8−5 =
3

10
∑ xi − x =


∑ xi − x 10
DM= = ≅ 1, 67
n 6

Dica: Para calcular o desvio médio de uma sequência de dados


utilizando o Microsoft Excel, abra uma nova planilha do programa e digite
cada número da sequência dada em uma célula (consecutiva) diferente. Em

106 Estatística
seguida, em outra célula vazia, digite a sintaxe “=DESV.MÉDIO” (observe
que, ao começar a digitar, o pgrama já te dará esta opção) e selecione (com o
mouse) todas as células onde se encontram os dados para os quais você quer
determinar o desvio. Feche o parêntese e dê “enter”. O resultado já aparecerá
automaticamente. As figuras a seguir exibem o cálculo, no Excel, do Desvio
Médio do exemplo anterior.

Nesta unidade, estudamos as medidas de dispersão, que recebem este


nome por indicar o grau de dispersão dos dados em torno de um valor médio.
Vimos que elas podem ser de dispersão absoluta (como o desvio médio, a
variância, o desvio padrão e o desvio quartílico) ou de dispersão relativa (como
o coeficien de variação e a variância relativa).

De uma maneira detalhada, vimos algumas aplicações dos conceitos e


seus cálculos, por meio de fórmulas ou softwares. Vimos também que, apesar
da importância das Medidas de Posição, nem sempre elas são suficientes para
analisarmos a amostra, e muitas vezes, precisamos de mais dados que nos
permitam inferir corretamente.

Estatística 107
Referências
FONSECA, J. S.; MARTINS, G. A. Curso de estatística. 6 ed. São Paulo:
Atlas, 1992.

MEYER, P. L. Probabilidade: aplicações à estatística. 2 ed. Rio de Janeiro:


LTC, 1983.

O GLOBO. Os 26 mais ricos do mundo concentram a mesma riqueza


dos 3,8 bilhões mais pobres. Disponível em: https://oglobo.globo.com/
economia/os-26-mais-ricos-do-mundo-concentram-mesma-riqueza-dos-
38-bilhoes-mais-pobres-23391701. Acesso em: 21 ago. 2019.

REVISTA VEJA. Pressão arterial variável pode causar derrame. Disponível


em: https://veja.abril.com.br/saude/pressao-arterial-variavel-pode-causar-
derrame/. Acesso em: 21 ago. 2019.

TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2 ed. São Paulo: Atlas,


1985.

TRIOLA, M. F. Introdução à estatística. 10 ed. Rio de Janeiro: LTC, 2008.

Estatística 109
Exercícios
1. Observe as asserções a seguir:

I. Se somarmos uma determinada constante em cada um dos valores


de uma amostra de dados, o desvio padrão da nova amostra não
irá se alterar.
II. Se somarmos uma determinada constante em cada um dos valores
de uma amostra de dados, o desvio padrão da nova amostra ficará
aumentado desta constante.
III. Se a variância de uma amostra de dados for igual a 9, o seu desvio
padrão será igual a 81.

É correto o que se afirma em:

a. I, apenas.
b. II, apenas.
c. III, apenas.
d. I e III, apenas
e. I, II e III.

2. Determine o Desvio Padrão e o Coeficiente de variação da seguinte


amostra de dados:
8, 12, 7, 10, 6, 5

3. A tabela a seguir exibe a altura e o peso de uma amostra de dados.


Qual das duas medidas (estatura ou peso) apresenta maior grau de
dispersão?

110 Estatística
x s
Altura (em cm) 182 4,5
Peso (em Kg) 62 2,5

Respostas

1. Letra A.
2. Desvio Padrão:
S = 2,607

s 2, 607
CV
= = .100 = .100 32,58% .
x 8

3. 4,5
CVAltura
= .100 ≅ 2, 47
182

2,5
CVPeso
= .100 ≅ 4, 03
62

Ou seja, a medida peso apresenta maior grau de dispersão do que a


altura.

Estatística 111
Medidas de Assimetria
e Curtose
Para início de conversa…
Para analisarmos estatisticamente o formato de uma distribuição
contínua de dados, utilizamos as medidas de assimetria e de curtose.
Neste capítulo, estudaremos essas medidas, assim como seus significados
e importância.

A assimetria mede o grau de deslocamento lateral (em relação


a uma curva normal) de uma distribuição. Já a curtose mede o grau de
“achatamento” da curva em relação à curva normal (ou Gaussiana). Essas
medidas nos mostram o quão próximo uma distribuição está do modelo
normal, permitindo-nos (ou não) tratá-la como se assim o fosse.

Estatística 113
Objetivos
▪▪ Identificar a distribuição por meio da Assimetria.
▪▪ Identificar, classificar e utilizar as estatísticas na resolução de
exercícios.

Estatística 115
1. Assimetria
Antes de falarmos de Assimetria e Curtose, precisamos apresentar
uma distribuição denominada normal. Esse tipo de distribuição tem um papel
fundamental na Estatística Inferencial, pois diversas variáveis aleatórias (por
exemplo, o peso de recém-nascidos e pressão arterial) podem ser descritas pelo
seu padrão de comportamento. A sua representação é chamada de curva normal
e tem a forma de um sino. Em razão de sua importância, ela já foi totalmente
tabelada e seus valores são conhecidos – como esses valores foram obtidos,
inicialmente, com base em observações relativas à população de determinada
variável aleatória, utilizamos o símbolo para representar média, e para o desvio
padrão. Assim, sempre que uma distribuição for normal (ou se aproximar disso),
já sabemos seu comportamento e temos suas probabilidades calculadas.

A Figura 1 exibe uma distribuição unimodal, simétrica e centrada no


valor da média. A proporção de observações contidas no intervalo ( μ-σ , μ+σ )
é de 68,3%. Se aumentarmos para uma distância de dois desvios padrão, a mais
ou a menos que a média, ou seja, no intervalo ( μ-2σ , μ+2σ ), esse valor subirá
para 95,4% do total de observações. No intervalo ( μ-3σ , μ+3σ ), encontram-se
99,7% do total de observações. No jargão Estatístico, dizemos que valores abaixo
ou acima de três desvios são os outliers, ou seja, são dados que diferem totalmente
de todos os outros.

μ -3σ μ -2σ μ-σ μ μ+σ μ + 2σ μ + 3σ


68,3%
95,4%
99,7%

Em que μ representa a média, e σ o desvio padrão.


(Quando estivermos trabalhando com uma amostra, utilizaremos para média e para desvio padrão.)

Figura 1: Distribuição unimodal. Fonte: Elaborado pelos autores.

Estatística 117
A função densidade de probabilidade de uma distribuição normal é dada por:
f (x,μ,σ2) = 1 e - (x-μ)
2

20 2

σ√2π
Em que: -∞ < x < ∞; -∞ < μ < ∞; σ > 0.

Mas como saber se uma distribuição é normal ou o quão próxima ela


está disso? Para tal finalidade, utilizamos as medidas de Assimetria e Curtose.
Elas nos fornecem critérios para definirmos a razoabilidade, ou não, de tratarmos
uma distribuição como se ela fosse normal. No que diz respeito à assimetria,
uma distribuição unimodal pode ser classificada em simétrica, assimétrica à
direita (ou positiva) ou assimétrica à esquerda (ou negativa). Na simétrica, os
valores da média, da moda e da mediana coincidem (e, por isso, x̅ -Mo=0). No
caso da assimétrica positiva, a média é maior do que a moda (daí, x̅ -Mo>0). Na
assimétrica negativa, a média é menor do que a moda (daí, x̅ -Mo<0)

A Figura 2 nos mostra as posições de média, moda e mediana, nas três


classificações citadas acima:

Assimétrica à esquerda Simétrica Assimétrica à direita


(ou negativa) (ou positiva)

Moda Moda
Média Média
Média, moda e
Mediana mediana Mediana

Figura 2: Posições de média, moda e mediana na assimetria. Fonte: Elaborado pelos autores.

Vamos ver alguns exemplos?

Exemplo 1: De acordo com os valores dados, classifique as distribuições a seguir em


simétrica, assimétrica positiva ou assimétrica negativa:

118 Estatística
a. Média: 18
Moda: 12

Como x̅ -Mo = 18-12 = 6, ela é assimétrica positiva.

b. Média: 11
Moda: 11

Como x̅ -Mo = 11-11 = 0, é simétrica.

c. Média: 8,9
Moda: 11

Como x̅ -Mo = 8, 9-11 = -2,1, é assimétrica negativa.

Como o critério de classificação baseado apenas na diferença entre a


média e a moda é absoluto, não podemos utilizá-lo para comparar as medidas
de duas (ou mais) distribuições. Para a comparação entre distribuições,
existem alguns métodos. Optamos pelo uso do Coeficiente de Assimetria de
Pearson ( As ), descrito a seguir:

3.( x̅ -Md )
As =
s

O resultado desse coeficiente ( As ) nos permite classificar uma assimetria


quanto ao tipo e quanto a sua intensidade, como veremos no Quadro 1:

Quanto ao tipo Quanto à intensidade da Assimetria

Assimétrica negativa As < 0 Assimetria muito fraca 0 < | As |≤< 0,5

Simétrica As = 0 Assimetria fraca 0,5 < | As | <≤1,5

Assimétrica positiva As > 0 Assimetria forte | As | > 1,5

Quadro 1: Classificação de assimetria. Fonte: Elaborado pelos autores.

Estatística 119
Importante

Se uma distribuição tiver uma assimetria muito fraca, para efeito de análise, ela
poderá ser tratada como normal.
Se uma distribuição de frequência tiver uma assimetria muito forte, ou seja, o módulo
do coeficiente for maior do que 1,5, a medida de posição mais adequada para
representá-la será a mediana.

Exemplo 2: A Figura 3 exibe uma comparação entre três distribuições, com seus
respectivos valores de média ( μ ) e desvio ( σ ).

μ= 0 | σ =1
μ = 0 | σ = 0.447214
0.8
μ = 1 | σ = 2.23607
0.6

0.4

0.2
0.0
-4 -2 0 2 4 6

Figura 3: Comparação entre distribuições. Fonte: Elaborado pelos autores.

Importante
Quanto mais simétricos os dados forem, mais o valor do coeficiente de assimetria se
aproximará de zero. Porém, o fato de o coeficiente de assimetria ser próximo de zero (ou
nulo) não nos garante que a distribuição seja normal.

A distribuição a seguir tem assimetria nula, porém, não é uma


distribuição normal. Por isso, é recomendável, sempre que possível, a
construção do gráfico da distribuição.

120 Estatística
160
150
140
130
120
110
100
90
Frequência

80
70
60
50
40
30
20
10
0
10 20 30 40 50 60 70 80

Figura 4: Distribuição. Fonte: Elaborado pelos autores.

Exemplo 3: A distribuição de frequências a seguir representa a idade dos participantes de um


determinado jogo. Ela tem o valor de média igual a 19,04, mediana 19 e desvio padrão 5,80.
Determine o coeficiente de Assimetria de Pearson e classifique quanto ao tipo e a intensidade.

Classes Frequência simples ( fi ) Frequência acumulada ( Fi )


10 |– 14 21 21
14 |– 18 12 33

18 |– 22 18 51
22 |– 26 15 66
26 |– 30 6 7
30 |– 34 3 75
∑ fi = 75

Tabela 1: Distribuição de frequências. Fonte: Elaborado pelos autores.

Estatística 121
Substituindo os valores na fórmula, temos:

3 .( x̅ - Md ) 3. (19,04 - 19) 3.(0,04) 0,12


As = = = = = 0,020
s 5,80 5,80 5,80

Como As é um valor maior do que zero (0,020), ela é assimétrica


positiva. Em relação a sua intensidade, ela é muito fraca, pois 0 < | As | ≤ 0,5.

Exemplo 4: Um administrador decidiu fazer um plano de cargos e salários, de acordo com o


número de anos de serviço de cada funcionário. Após consulta ao DRH, construiu a seguinte
tabela de distribuição de frequências. Classifique o tipo de assimetria e sua intensidade.

Classes
Frequência Frequência Ponto médio
(em anos fi . xi xi2. fi
simples ( fi ) acumulada ( Fi ) da classe ( xi )
de firma)

1 |– 3 21 21 2 42 84

3 |– 5 12 33 4 48 192

5 |– 7 18 51 6 108 648

7 |– 9 4 55 8 32 256

9 |– 11 2 57 10 20 200

11 |– 13 1 58 12 12 144

∑ fi = 58 ∑ fi . xi = 262 ∑ (x2i . fi ) = 1.524

Tabela 2: Tabela de distribuição de frequências. Fonte: Elaborado pelos autores.

▪▪ Calculando a média, obtemos:

∑ ( xi . fi ) 262
x̅ = = = 4,51
n 58

122 Estatística
▪▪ Calculando a mediana, ou seja, o percentil 50, obtemos:

[ ( )
]
x . ∑ fi
- Fi
100 -1
.h
Px = l i +
fi

[ ( )
] [ ]
50 . 58 - 21 (29) - 21
100 .2=3+ . 2 = 3 +1,33 = 4,33
P50 = 3 +
12 12

▪▪ Calculando o desvio, temos:

S2 =
∑ (x12 .fi)
n

s = √5,87=2,42
-
( ) ()
∑ fi . xi
n
=
1.524
58
-
2622
58
= 26,27 - 20,40 = 5,87

▪▪ Substituindo os valores na fórmula de assimetria de Pearson,


temos:

As = 3.( x̅ - Md ) = 3.(4,51- 4,33) - 3.(0,18) = 0,54 = 0,22


s 2,42 2,42 2,42

De acordo com esse resultado, a assimetria é positiva e


muito fraca.

Exemplo 5: Uma empresa de empacotamento de grãos vende um produto em


embalagens que devem conter 2 kg. Em uma amostra de dados, observou-se uma
média aritmética igual a 2,05 kg e um desvio padrão igual 0,05 (conforme apresentado
na Figura 5). Se em estudos anteriores realizados na empresa foi constatado que a
distribuição dos pesos (em kg) é normal, qual a possibilidade de um pacote ter um
peso menor do que 1,90 kg?

Estatística 123
8

1.90 1.95 2.00 2.05 2.10 2.15 2.20

(Média - desvio) (Média + desvio)

Figura 5: Amostra de dados. Fonte: Elaborado pelos autores.

Como a distribuição é normal, a proporção de observações contidas


em cada intervalo segue a regra a seguir:

▪▪ No intervalo ( μ-σ , μ+σ ), temos 68,3 % dos dados.


▪▪ No intervalo ( μ-2σ , μ+2σ ), temos 95,4% dos dados.
▪▪ No intervalo ( μ-3σ , μ+3σ ), encontram-se 99,7% dos dados.

Por estarmos trabalhando com uma amostra, utilizaremos os símbolos


x̅ e s, ao invés de μ e σ, para média e desvio padrão, respectivamente. Como
x̅ = 2,05 e s = 0,05, no intervalo (x̅ - 3.s, x̅ + 3.s), ou seja, entre 1,90 e 2,20,
temos 99,7% dos dados. Fora desse intervalo há apenas 0,3% dos dados.
Dividindo para os dois lados, temos 0,15% de chance de o pacote ter menos
do que 1,90 kg e 0,15% dele ter mais do que 2,20 kg.

2. Curtose
O coeficiente de curtose de uma distribuição unimodal representa uma
comparação entre a concentração de observações próximas ao valor central e a

124 Estatística
concentração próxima às suas extremidades. Geometricamente, ele representa
o grau de “achatamento” de uma curva em relação à normal. Para calcularmos
o coeficiente de curtose de uma distribuição, utilizaremos os valores de seus
percentis (10, 25, 75 e 90), de acordo com a fórmula a seguir:
P75 - P25
K=
2. ( P90 - P10 )

Para classificarmos uma distribuição em relação à curtose, utilizamos


o seguinte critério (baseado no valor de K):

Leptocúrtica Mesocúrtica Platicúrtica


(achatamento pequeno) (achatamento normal) (achatamento grande)
K < 0,263 K = 0,263 K > 0,263

Note que, na leptocúrtica, os dados são muito concentrados ao redor


do centro. Na platicúrtica, os dados não são tão concentrados perto do centro.

Exemplo 6: A Tabela 3 representa a altura, em centímetros, dos atletas de uma escolinha de


futebol. Calcule o coeficiente de Curtose e classifique o tipo.

Classes (em Frequência


Frequência acumulada ( Fi )
centímetros) simples
130 |– 140 2 2
140 |– 150 5 7 Classe do P10
150 |– 160 4 11
160 |– 170 21 32 Classe do P25

Estatística 125
170 |– 180 14 46 Classe do P75
180 |– 190 10 56 Classe do P90
∑ fi = 56

Tabela 3: Distribuição de frequência. Fonte: Elaborado pelos autores.

Calculando os Percentis, de acordo com a fórmula, temos:

[ ( )
]
x . ∑ fi
- Fi
100 -1
.h
Px = l i +
fi

[ ( )
] [ ] []
10 . 56
-2
100 . 10 = 140 + (5,6) - 2 . 10 = 140 + 3,6 . 10 = 140 + 7,2 = 147,20
P10 = 3 +
5 5 5

[( )
] [ ] []
25 . 56
- 11
100 . 10 = 160 + (14) - 11 . 10 = 160 + 3 . 10 = 160 + 1,42 = 161,42
P25 = 160 +
21 21 21

[( )
] [ ] []
75 . 56
- 32
100 . 10 = 170 + 42 - 32 . 10 = 170 + 10 . 10 = 170 + 7,14 = 177,14
P75 = 170 +
14 14 14

[( )
] [ ]
90 . 56
- 46
100 . 10 = 180 + 50,4 - 46 . 10 = 180 + 4,4 = 184,40
P90 = 180 +
10 10

Substituindo os valores desses percentis, na fórmula de curtose, obtemos:

P75 - P25 177,14 - 161,42 15,72 30,57


K= = = = = 0,370
2.(P90 - P10 ) 2.(184,40 - 147,20) 2. (41,2) 82,4

126 Estatística
Como K = 0,370, a distribuição é platicúrtica (K > 0,263).

Neste capítulo, estudamos as medidas de assimetria e curtose que,


junto com as medidas de posição e dispersão, nos permitem uma melhor
descrição e compreensão de uma distribuição de frequências. As medidas
de assimetria e curtose nos auxiliam a determinar o quão próximo uma
distribuição está da normal.

Quanto à assimetria, podemos ter simétrica, assimétrica positiva ou


assimétrica negativa. Em relação ao tipo de curtose, podemos ter platicúrtica,
mesocúrtica ou leptocúrtica.

Ao verificarmos que uma distribuição se aproxima da normal, podemos


utilizar os valores tabelados, facilitando os cálculos e permitindo uma tomada
de decisão apoiada em parâmetros estatísticos.

Estatística 127
Referências
FONSECA, J. S.; MARTINS, G. A. Curso de estatística. 6 ed. São Paulo:
Atlas, 1992.

MEYER, P. L. Probabilidade: aplicações à estatística. 2 ed. Rio de Janeiro:


LTC, 1983.

TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2 ed. São Paulo: Atlas,


1985.

TRIOLA, M. F. Introdução à estatística. 10 ed. Rio de Janeiro: LTC, 2008.

Estatística 129
Exercícios
1. Classifique cada distribuição do quadro a seguir, de acordo com o
tipo de assimetria e sua intensidade.

Distribuição Média Mediana Desvio Padrão


A 7 7 3,36
B 96,2 95,8 4,24
C 38,7 40,5 12,6

2. Classifique as asserções em verdadeira (V) ou falsa (F) e marque o


item que exibe a ordem correta das respostas.

( ) Em uma distribuição simétrica, os valores da média aritmética


e da moda coincidem.
( ) Em uma distribuição assimétrica negativa, o valor da média
aritmética é maior do que o da moda.
( ) Em uma distribuição assimétrica positiva, o valor da média
aritmética é maior do que o da mediana.

a. (F), (F), (F)


b. (F), (V), (V)
c. (V), (F), (V)
d. (F), (F), (V)
e. (V), (V), (V)

Estatística 131
3. A tabela a seguir exibe o comprimento (em milímetros) do fêmur
de 50 fetos em idade gestacional de 20 semanas, em exames
realizados no hospital X. Classifique a distribuição quanto ao tipo
de curtose.

Comprimento do fêmur (em Frequência


Frequência acumulada ( Fi )
milímetros) simples
28 |– 30 7 7 Classe do P10
30 |– 32 12 19 Classe do P25
32 |– 34 14 33
34 |– 36 10 43 Classe do P75
36 |– 38 7 50 Classe do P90
∑ fi = 50

Gabarito:

1 -
3.( x̅ - Md ) 3.(7-7)
Distribuição A: As = = = 0 =0
s 3,36 3,36
(Distribuição simétrica)

3.( x̅ - Md ) 3.(96,2 - 95,8) 3.(0,4) 1,2


Distribuição B: As = = = = = 0,271
s 4,42 4,42 4,42
(Distribuição assimétrica positiva e muito fraca)

3.( x̅ - Md ) 3.(38,7 - 40,5) 3.(-1,8) -5,4


Distribuição C: As = = = = = 0,428
s 12,6 12,6 12,6
(Distribuição assimétrica negativa, muito fraca)

2-C

3 - Primeiro, determinamos, usando a fórmula, os percentis 10,


25, 75, e 90.

132 Estatística
[ ( )
]
x . ∑ fi
- Fi
100 -1
.h
Px = l i +
fi

[ ( )
] [] []
10 . 50
-0
100 . 2 = 28 + (5) - 0 . 2 = 28 + 10 = 28 + 1,42 = 29,42
P10 = 28 +
7 7 7

[( )
] [ ] []
25 . 50
-7
100 . 2 = 30 + (12,5) - 7 . 2 = 30 + 11 = 30 + 0,91 = 30,91
P25 = 30 +
12 12 12

[( )
] [ ] []
75 . 50
- 33
100 . 2 = 34 + (37,5) - 33 . 2 = 34 + 9 = 34 + 0,9 = 34,90
P75 = 34 +
10 10 10

[( )
] [] []
90 . 50
- 43
100 . 2 = 36 + (45) - 43 . 2 = 36 + 4 = 36 + 0,51 = 36,51
P90 = 36 + 7 7
7

Ou seja, ela possui os seguintes percentis:

P10 = 29,42 P25 = 30,91 P75 = 34,90 P90 = 36,51



Substituindo os valores, na fórmula de Curtose, temos:

P75 - P25 34,90 -30,91 3,99 3,99


K= = = = = 0,281
2.(P90 - P10) 2.(36,51-29,42) 2.(7,09) 14,18

Como 0,281 é maior do que 0,263, então, a distribuição é classificada


como platicúrtica.

Estatística 133
Correlação e Regressão
Linear
Para início de conversa…
Neste capítulo, estudaremos as Medidas de Correlação e Regressão
Linear em distribuições normais (ou que se comportem como tal).

O coeficiente de correlação linear de Pearson visa verificar a existência


de correlação linear entre duas variáveis quantitativas e, em caso afirmativo,
determinar sua intensidade e o seu tipo (correlação positiva ou negativa). Já a
regressão se propõe a estimar o valor de uma variável (dependente), baseada
no conhecimento da outra (independente), com o auxílio de uma equação de
regressão.

Apesar de existirem correlações não lineares (quadrática, exponencial,


logarítmica e cúbica), trataremos apenas da correlação linear simples. Também
veremos a aplicabilidade desses conceitos em diversas áreas do conhecimento e
faremos os cálculos por meio da fórmula e com o auxílio do software Excel.

Estatística 135
Objetivos
▪▪ Fazer correlações entre variáveis e calcular o coeficiente.
▪▪ Identificar a reta de regressão e prever dados.

Estatística 137
1. Diagrama de Dispersão
Em diversas situações do nosso cotidiano ou em pesquisas científicas,
é comum fazermos a seguinte pergunta: “Será que isto tem alguma coisa a
ver com aquilo?” Para respondermos tal indagação, estatisticamente falando,
precisamos verificar se há correlação entre as variáveis e, em caso positivo,
que tipo de correlação existe (linear, exponencial, quadrática etc.). Segundo
Farber e Larson (2007), “Uma correlação é uma relação entre duas variáveis.
Os dados podem ser representados por pares ordenados (x, y) onde x é a
variável independente (variável explicativa) e y é a variável dependente (variável
resposta)”.

Ao representarmos, em um sistema cartesiano ortogonal, esses pares


ordenados, teremos um gráfico denominado diagrama de dispersão. Esse
gráfico é um bom indicativo da possível existência e do tipo de correlação
entre as variáveis x e y, mas não pode ser o único parâmetro para classificação.
Olhando para o diagrama, é possível imaginarmos o traçado de uma curva
que mais se aproxime dos pontos marcados (dados) – essa curva recebe o
nome de Curva de Ajustamento.

Os gráficos a seguir são exemplos de diagramas de dispersão feitos


no Excel. Observe que, na Figura 1, os dados estão dispostos de maneira
“alinhada” (a curva de ajustamento é a reta desenhada em vermelho), na
Figura 2, não há uma correlação entre os pontos, enquanto, na Figura 3, há
uma correlação, porém, não é linear.

30

25
20

15

10

5
0
2 4 6 8 10 12

Figura 1: Dados dispostos de forma alinhada. Fonte: Elaborado pelos autores.

Estatística 139
30

25

20

15

10

0
2 4 6 8 10 12

Figura 2: Ausência de correlação entre pontos. Fonte: Elaborado pelos autores.

1,2

0,8

0,6

0,4

0,2

0
1 2 3 4 5 6 7 8 9 10 11

Figura 3: Correlação. Fonte: Elaborado pelos autores.

É importante notar que não podemos julgar se duas variáveis têm


correlação apenas pelo gráfico. Dependendo da escala utilizada, podemos ter
impressões diferentes sobre o mesmo conjunto de dados. A Figura 4, por
exemplo, é o mesmo diagrama da Figura 5, porém, a imagem foi “achatada”.
Olhando a figura dessa maneira, temos a impressão que a curva de ajustamento
é uma reta, o que não é verdadeiro (basta observar a Figura 3 para perceber o
quão longe os pontos estão de formar uma reta).

140 Estatística
1,2

0,8

0,6

0,4

0,2

0 1 2 4 6 8 10 12

Figura 4: Dados dispostos de forma alinhada. Fonte: Elaborado pelos autores.

2. Coeficiente de Correlação Linear de Pearson


A fim de não dependermos da nossa percepção para verificarmos se
há correlação linear entre duas variáveis, podemos utilizar o Coeficiente de
Correlação Linear de Pearson (r) , definido por:

∑ ( x ⋅ y) − ∑ n ∑
( x) ⋅ ( y)
r=
(∑ x ) 2
(∑ y ) 2

(∑ ( x ) −2
)(∑ y ) − 2
)
n n

Em que n representa o número de pares da amostra.

Esse coeficiente mede o grau de relacionamento linear entre os


valores de duas variáveis quantitativas, “x” e “y”, de um mesmo conjunto
de dados. Esse coeficiente pode assumir valores apenas no intervalo [-1, +1].
Isto é, o valor de r está entre -1 (inclusive) e +1 (inclusive). Dentro desse
intervalo, quanto mais próximo o valor de r estiver de -1 ou +1, mais forte
será a intensidade da correlação. Por outro lado, quanto mais o seu valor se
aproximar de zero, mais fraca será a intensidade da correlação linear entre as
variáveis em questão. De acordo com o valor de r , podemos classificar uma
correlação linear da seguinte maneira:

Estatística 141
Valor do coeficiente de correlação linear ( r ) Tipo de correlação linear

0<r≤1 Correlação linear positiva

r=0 Não há correlação linear entre as variáveis

-1 ≤ r < 0 Correlação linear negativa

Tabela 1: Tipos de correlação linear simples. Fonte: Elaborado pelos autores.

É importante observar que o resultado do coeficiente de correlação


linear de Pearson nos indica apenas se há uma correlação linear entre as
variáveis, nada diz a respeito de outros tipos de correlação. Ou seja, o fato
de o valor de r ser nulo, não indica que não há correlação entre as variáveis,
apenas que não tem correlação linear simples. Por exemplo, o coeficiente de
correlação dos dados apresentados no diagrama de dispersão a seguir é quase
nulo (r = 0,01), mas a existência de relação entre elas é nítida.

120

100

80

60

40

20

Figura 5: Exemplo de coeficiente de correlação. Fonte: Elaborado pelos autores.

Vamos ver outros exemplos?

Exemplo 1

142 Estatística
A tabela a seguir exibe as medidas das variáveis x e y de uma amostra
de dados. Verifique se há correlação linear entre elas.

Variáveis Dados
x 2 4 3 5 6 8 10 8 6 7
y 5 7 8 9 11 15 18 14 11 12

Vamos completar a tabela com os valores que precisamos substituir na


fórmula do coeficiente de Pearson.

x y x y x. y
2 5 4 25 10
4 7 16 49 28
3 8 9 64 24
5 9 25 81 45
6 11 36 121 66
8 15 64 225 120
10 18 100 324 180
8 14 64 196 112
6 11 36 121 66
7 12 49 144 84

Somando todas as colunas, temos: ∑ x = 59 , ∑ y = 110 , ∑ x 2 = 403 ,


∑ y = 1350 e ∑ xy = 735 . Substituindo esses valores na fórmula, temos:
2

∑ ( x ⋅ y) − ∑ n ∑
( x) ⋅ ( y )
r=
(∑ ( x ) − ∑ ) ⋅ (∑ y ) − ∑
2 2
2 ( x) 2 ( y)
)
n n

(59) ⋅ (110)
735 −
= 10
(59) 2 (110) 2
(403 − ) ⋅ (1350 − )
10 10

735 − 649
=
(54,9) ⋅ (140)

Estatística 143
86
=
87, 669

= 0,9809

O valor de r é muito próximo de 1 e há correlação linear positiva e


muito forte, ou seja, os pontos no diagrama de dispersão estão “bem próximos”
da reta de ajustamento.

Em situações práticas reais, não precisamos fazer todos esses cálculos


manualmente. Há diversos softwares que nos fornecem esse resultado, apenas
inserindo os dados. Optamos por fazê-lo passo a passo neste exemplo para
que você entenda o processo utilizado na determinação do Coeficiente de
Correlação Linear de Pearson.

Exemplo 2

Com o auxílio do Excel, verifique se há correlação linear entre as


variáveis “x” e “y”, exibidas na tabela a seguir:

Variáveis Dados
x 2 4 3 5 6 8 10 8 6 7
y 5 7 8 9 11 15 18 14 11 12

Observe que os dados são os mesmos do Exemplo 1, só que, agora,


faremos o cálculo de r, com o auxílio do Excel. Primeiro digitamos, em
uma planilha do Excel, as duas colunas de dados; em seguida, clicamos em
qualquer célula em branco e nela digitamos a fórmula associada à correlação.
No nosso caso, de acordo com a imagem a seguir, a primeira coluna começa
em A2 e termina em A11, enquanto a segunda coluna começa em B2 e
termina com B11. Assim, temos que digitar na “célula em branco” escolhida,
a seguinte fórmula: =CORREL(A2:A11;B2:B11). Ao clicar na tecla “enter”,
automaticamente o valor do coeficiente linear de Pearson aparecerá na célula.

144 Estatística
Observe que o valor dado pelo Excel confere com o obtido por meio
da fórmula.

2.1 Nível de Significância

O fato de estarmos trabalhando com uma amostra visando extrapolar


a conclusão para a população nos impõe a necessidade de verificação da
significância do coeficiente de correlação amostral obtido, isto é, saber se ele
realmente é significante para a população. Para verificarmos isso, utilizamos
os valores críticos – esses valores são tabelados e estão disponíveis em vários
livros de Estatística e também podem ser obtidos com o auxílio do Excel. A
seguir, mostraremos uma parte dessa tabela e faremos o teste de significância
do valor encontrado no Exemplo 1.

Se |r| for maior do que o valor crítico, então, a correlação será


significante para aquele valor de α. Em caso contrário, não há evidência que
haja significância. Um valor de α = 0,05 significa que, em 5% das vezes, você
estará considerando o coeficiente como significante, quando ele realmente
não é.

Estatística 145
Valor de n Nível de significância αα = 0,05 Nível de significância αα = 0,01
4 0,950 0,999
5 0,878 0,959
6 0,811 0,917
7 0,754 0,875
8 0,707 0,834
9 0,666 0,798
10 0,632 0,765
11 0,602 0,735
12 0,576 0,708
13 0,553 0,684
14 0,532 0,661
15 0,514 0,641
16 0,497 0,623
17 0,482 0,606
18 0,468 0,590
19 0,456 0,575
20 0,444 0,561
25 0,396 0,505
30 0,361 0,463
35 0,334 0,430
40 0,312 0,403

Tabela 2: Valores críticos para o coeficiente de Correlação de Pearson (α = 0,05 e αα = 0,01).


Fonte: Elaborado pelos autores.

Como o valor do |r| encontrado no Exemplo 1 é igual a 0,9809, e


esse valor é maior do que o tabelado (0,632) para uma amostra de 10 dados

146 Estatística
(n = 10), então, a correlação é significante para α = 0,05. Observe que
também seria significante para α = 0,01, pois 0,9809 também é maior do
que o valor tabelado (0,765).

Existem alguns outros testes que podem ser feitos para determinar
se a correlação entre duas variáveis é significante, porém, não fazem parte do
escopo deste capítulo.

3. Equação de Regressão
Uma vez constatado que há correlação linear entre duas variáveis e
que é significante, podemos determinar a equação da reta que melhor modela
os dados. Essa reta é conhecida como Reta de Regressão e sua equação serve
para estimarmos um valor para a variável dependente (y) a partir de um valor
dado para a variável independente (x). Essa estimativa só pode ser feita dentro
de um intervalo contemplado na amostra. Assim, dada uma amostra de dados
emparelhados, a Equação de Regressão definida como ŷ = a . x + b descreve
a relação entre as variáveis em questão.

A seguir, temos as fórmulas para cálculo dos valores de “a” e de “b”,


que compõem a equação de regressão acima.

∑ ( x ⋅ y) − ∑ n ∑
( x) ⋅ ( y )
a=
(∑ ( x ) − ∑
2
2 ( x)
n

b = y −a⋅x

Em que x=
∑x e y=
∑ y são, respectivamente, as médias aritméticas
n n
entre as variáveis x e y.

Vamos ver alguns exemplos?

Estatística 147
Exemplo 3

A tabela a seguir exibe o valor mensal gasto (x) com propagandas e o


lucro líquido mensal (y), do respectivo mês, de uma rede de Pousadas.

a. Calcule o coeficiente de correlação linear entre x e y.


b. Verifique se há correlação linear significante para α = 0,05.
c. Caso exista correlação linear significante, estime o valor do lucro,
caso sejam investidos 2,7 mil reais em propagandas.

Gasto mensal com propaganda Lucro mensal


(em milhares de Reais) (em milhares de Reais)
3,5 84,0
2,8 69,5
2,0 46,0
1,8 42,2
2,2 56,0
3,8 91,5
4,0 94,0
2,4 57,0
3,1 75,9
2,9 72,2
3,0 73,2
3,6 87,0

a. Com o auxílio do Excel, determinamos o coeficiente de correlação


linear de Pearson (r) e o somatório das variáveis x e y:

148 Estatística
b. Como r = 0,995, existe forte correlação linear positiva entre x e
y. Já que o valor do |r| é maior do que o valor crítico tabelado,
que é 0,576 (Tabela 1, n = 12 e α = 0,05), então, a correlação é
significante.
c. Agora, determinaremos os valores de a e b para montarmos a
equação de regressão:

∑ ( x ⋅ y) − ∑ n ∑
( x) ⋅ ( y )
a=
(∑ ( x ) − ∑
2
2 ( x)
n

(35,1) ⋅ (848,5
2617, 73 −
a= 12
(35,1) 2
108, 4 −
12
135,87
a=
5, 74

a = 23, 67

Estatística 149
=x
∑=x 35,1
= 2,92
n 12

=y

=
y 848,5
= 70, 70
n 12

b = y −a⋅x
b =70, 70b− =
(23,
70,67)
70 ⋅−(2,92)
(23, 67) ⋅ (2,92)
b = 1,59 b = 1,59

Daí, a equação de regressão será ŷ = 23,76 . x + 1,59.

Para sabermos a estimativa para o valor de y quando x for igual a 2,7,


substituímos “x” por “2,7”, na equação de regressão. Daí, temos: ŷ = 23,76 . (2,7)
+ 1,59 = 65,74. Ou seja, quando forem investidos R$ 2.700,00 em propaganda,
estima-se um lucro de R$ 65.740,00. Porém, isso é apenas uma estimativa, uma
previsão.

É importante observar que só podemos estimar valores de y para x que


estejam dentro do intervalo dessa amostra, ou seja, para valores entre o menor
(1,8) e o maior (4,0) valor de x da tabela.

Exemplo 4

A tabela a seguir exibe a medida do pH (variável x) e a porcentagem


de área (variável y) do transepto de uma lagoa ocupada pela planta aquática
da espécie Cabomba furcata, em diferentes análises.

a. Calcule o coeficiente de correlação linear entre x e y.


b. Verifique se há correlação linear significante para α = 0,01.

150 Estatística
pH da água (x) Área ocupada do transepto, em % (y)

6,8 80
6,9 90
7,5 100
7,1 100
6,7 100
6,8 100
6,9 100
7,1 100
7,8 100
6,5 50
6,4 80
7,1 100
6,2 25
6,4 20
6,1 10
5,2 20
6,8 100
6,3 20
8,3 100
8,1 100

Tabela 3: Medida do pH da água e porcentagem de área ocupada pela Cabomba furcata, Silva Jardim, Rio de Janeiro,
2019. Fonte: Adaptado de Canalli (2019).

Estatística 151
Solução:

a. Os dados foram digitados no Excel e, após a digitação da fórmula


de correlação, nos foi dado o valor coeficiente de correlação linear
de Pearson, que é igual a 0,7409.

b. Como o valor do coeficiente de correlação é 0,7409, e esse valor é


maior do que o encontrado na Tabela 2, para n = 20 e α = 0,01, que
é 0,561, então, a correlação é significante.

O coeficiente de correlação de Pearson serve para verificarmos se há


uma correlação linear entre duas variáveis (x e y), seu tipo e intensidade.
Caso a correlação exista e seja significante, podemos determinar a equação da
reta de regressão. Essa equação nos permite estimar o valor de y, dado um x
pertencente ao intervalo em estudo.

152 Estatística
Referências
CANALLI, Y. M. Dados Abióticos da Lagoa de Juturnaíba. Silva Jardim,
2019.

FARBER, B.; LARSON, R. Estatística aplicada. São Paulo: Prentice Hall,


2007.

Estatística 153
Exercícios
1. Um pesquisador deseja descobrir se há alguma correlação entre a
variável x e y. Para isso, ele determinou o coeficiente de correlação
linear entre duas variáveis. Se o valor encontrado foi r = −0,985,
podemos garantir que:

a. Há uma correlação linear positiva e muito fraca entre as variáveis.


b. Há uma correlação linear negativa e muito fraca entre as variáveis.
c. Há uma correlação linear negativa e muito forte entre as variáveis.
d. Há uma correlação linear positiva e muito forte entre as variáveis.
e. Há uma correlação, mas não podemos garantir que seja linear.

2. A tabela a seguir exibe a idade (x) dos entrevistados e número de


livros (y) lidos por eles nos últimos 12 meses. O valor do coeficiente
de correlação linear de Pearson entre x e y é igual a 0,0374. De
acordo com esses dados, é possível fazer uma estimativa de quantos
livros uma pessoa de 19 anos teria lido no período citado?

Estatística 155
3. Dentre os valores a seguir, qual não pode representar o coeficiente
de correlação linear de Pearson entre as variáveis x e y?
a. r = −0,995
b. r = 0,625
c. r = 0
d. r = 1,1
e. r = 0,312

Respostas

1. Letra C.
2. Como o valor de r é muito próximo de zero, não há correlação
linear significante entre a idade do leitor e o número de livros que
ele lê. Observe que, para n = 15, com nível de significância igual
0,05, o valor do |r| deveria ser maior do que 0,514. Portanto, não
há como estimar o valor de y apenas com esses dados.
3. Letra D, pois o valor de r tem que ser um número maior ou igual
a −1 e menor ou igual a +1. Isto é, -1 ≤ r ≤ + 1 .

156 Estatística
Estatística 157
Introdução ao Estudo da
Probabilidade
Para início de conversa...
Neste capítulo, estudaremos os conceitos básicos de um campo da
Matemática denominado Probabilidade. O estudo da teoria da probabilidade
se justifica pelo fato de que a maioria dos casos que a estatística trata é de
natureza aleatória ou probabilística.

Nos fenômenos aleatórios, os resultados são incertos, mesmo quando


ocorre um grande número de repetições deste mesmo fenômeno. Por exemplo,
no lançamento de uma moeda, sabemos que os resultados possíveis são: cara
ou coroa, mas não é possível assegurar o resultado de cada lançamento.

Portanto, neste capítulo, vamos introduzir as ideias fundamentais


da teoria das probabilidades, que serão desenvolvidas nos seguintes tópicos:
espaço amostral, evento, conceito clássico de probabilidade e principais
propriedades de probabilidade.

Estatística 159
Objetivos
▪▪ Definir e utilizar os principais conceitos de Probabilidade nas
atividades propostas.
▪▪ Definir as propriedades da Probabilidade.

Estatística 161
1. Espaço Amostral
Quando um experimento repetido em condições semelhantes conduz
a resultados essencialmente idênticos é chamado de determinístico. Por
outro lado, é comum que, na realização de diversos experimentos, possamos
observar o acaso, ou seja, mesmo conhecendo todos os resultados possíveis,
não é possível saber exatamente um determinado resultado.

Definição: Experimento aleatório é um experimento no qual podemos


descrever o conjunto de todos os resultados possíveis, mas não podemos dizer,
a priori, qual desses resultados vai ocorrer.

Exemplo 1

No lançamento de um dado, sabemos que os resultados possíveis são:


1, 2, 3, 4, 5 e 6, mas não é possível garantir qual será o resultado da face
voltada para cima em cada lançamento.

Os experimentos aleatórios correspondem, em geral, a diversos


resultados, e o conjunto formado por todos esses resultados é denominado de
espaço amostral. Por exemplo, de uma turma com 50 alunos, escolhe-se, ao
acaso, um aluno e pergunta-se o mês de nascimento. Sabemos que o conjunto
de todos os resultados é formado por todos os meses do ano.

Definição 1: Espaço amostral é o conjunto de todos os resultados


possíveis do experimento aleatório. Será denotado por Ω .

Um espaço amostral é denominado finito uniforme, caso ele tenha


uma quantidade finita de elementos, sendo todos eles igualmente prováveis.

Exemplo 2
Construa o espaço amostral para cada experimento aleatório a seguir:

a. Lançamento de uma moeda.

Ù = {cara, coroa}
Ω

Estatística 163
b. Lançamento de duas moedas.

Ù = {( k , k ) , ( k , C ) , ( C , K ) , ( C , C )}
Ω

c. Lançamento de um dado.

Ù = {1, 2, 3, 4, 5, 6}
Ω

d. Lançamento de dois dados.

 (1,1) (1, 2 ) (1,3) (1, 4 ) (1,5) (1, 6 ) 



( 2,1) ( 2, 2 ) ( 2,3) ( 2, 4 ) ( 2,5) ( 2, 6 )
( 3,1) ( 3, 2 ) ( 3,3) ( 3, 4 ) ( 3,5) ( 3, 6 ) 
Ù=
Ω
( 4,1) ( 4, 2 ) ( 4,3) ( 4, 4 ) ( 4,5) ( 4, 6 )
( 5,1) ( 5, 2 ) ( 5,3) ( 5, 4 ) ( 5,5) ( 5, 6 ) 
 
( 6,1) ( 6, 2 ) ( 6,3) ( 6, 4 ) ( 6,5 ) ( 6, 6 ) 

e. Lançamento de uma moeda e um dado.


Ù = {(1, K ) , ( 2, K ) , ( 3, K ) , ( 4, K ) , ( 5, K ) , ( 6, K ) ,
Ω

(1, C ) , ( 2, C ) , ( 3, C ) , ( 4, C ) , ( 5, C ) , ( 6, C )}

2. Evento
No momento em que realizamos um experimento aleatório, são
obtidos diversos resultados; desses, em particular, podemos estar interessados
em alguns. Por exemplo, em um lançamento de dois dados, pode-se estar
interessado em uma soma igual a sete, ou poderia ser um número seis em um
desses dois dados e, ainda, resultados iguais nos dois dados etc. O conjunto
formado por esses elementos é chamado de evento.

164 Estatística
Definição 2: Evento é um subconjunto do espaço amostral. Geralmente,
é denotado por uma letra maiúscula: A, B, C etc.

Exemplo 3

Construa o evento associado a cada experimento aleatório.

a. Sair cara no lançamento de uma moeda.

A = {cara}

b. Sair resultados iguais no lançamento de duas moedas.

B = {( k , k ) , ( C , C )}

c. Sair um número primo no lançamento de um dado.

C = {2, 3, 5}

d. Sair resultados diferentes no lançamento de dois dados.

 − (1, 2 ) (1,3) (1, 4 ) (1,5) (1, 6 ) 



( 2,1) − ( 2,3) ( 2, 4 ) ( 2,5) ( 2, 6 )
( 3,1) ( 3, 2 ) − ( 3, 4 ) ( 3,5) ( 3, 6 ) 
D=
( 4,1) ( 4, 2 ) ( 4,3) − ( 4,5 ) ( 4, 6 )
( 5,1) ( 5, 2 ) ( 5,3) ( 5, 4 ) − ( 5, 6 ) 
 
( 6,1) ( 6, 2 ) ( 6,3) ( 6, 4 ) ( 6,5 ) − 

Sair um número par e cara no lançamento de uma moeda e um dado.

E = {( 2, K ) , ( 4, K ) , ( 6, K )}

Estatística 165
3. Definição Clássica de Probabilidade
Quando conhecemos o espaço amostral e um evento associado a
esse espaço, é possível calcular a probabilidade de ocorrer este even to. Essa
abordagem é conhecida como o Conceito Clássico de Probabilidade.

Definição 3: Seja Ω um espaço amostral finito uniforme, e E um


evento qualquer desse espaço. A probabilidade de A , denotada por P ( E ) ,
é dada por:
#( E ) (1)
P( E ) =
#(Ω)

Em que #(Ω) é o número de resultados possíveis do experimento, e


#( E ) é o número de resultados favoráveis à ocorrência do evento E .

Exemplo 4

Calcule as probabilidades:

a. Sair cara no lançamento de uma moeda.

Ù = {cara, coroa}
Espaço amostral: Ω
Evento: A = {cara}

# ( A) 1
P ( A=
) = = 0,5 ou 50%
# (Ω) 2

b. Sair resultados iguais no lançamento de duas moedas.

Ù = {( k , k ) , ( k , C ) , ( C , K ) , ( C , C )}
Espaço amostral: Ω
Evento: B = {( k , k ) , ( C , C )}

#( B) 2
P ( B=
) = = 0,5 ou 50%
# (Ω) 4

166 Estatística
c. Sair um número primo no lançamento de um dado.

Ù = {1, 2, 3, 4, 5, 6}
Espaço amostral: Ω
Evento: C = { 2, 3, 5}

# (C ) 3
P ( C )= = = 0,5 ou 50%
# (Ω) 6

d. Sair resultados diferentes no lançamento de dois dados.

 (1,1) (1, 2 ) (1,3) (1, 4 ) (1,5) (1, 6 ) 



( 2,1) ( 2, 2 ) ( 2,3) ( 2, 4 ) ( 2,5) ( 2, 6 )
( 3,1) ( 3, 2 ) ( 3,3) ( 3, 4 ) ( 3,5) ( 3, 6 ) 
Ù=
Espaço amostral: Ω
( 4,1) ( 4, 2 ) ( 4,3) ( 4, 4 ) ( 4,5) ( 4, 6 )
( 5,1) ( 5, 2 ) ( 5,3) ( 5, 4 ) ( 5,5) ( 5, 6 ) 
 
( 6,1) ( 6, 2 ) ( 6,3) ( 6, 4 ) ( 6,5) ( 6, 6 ) 

 − (1, 2 ) (1,3) (1, 4 ) (1,5) (1, 6 ) 



( 2,1) − ( 2,3) ( 2, 4 ) ( 2,5) ( 2, 6 )
( 3,1) ( 3, 2 ) − ( 3, 4 ) ( 3,5) ( 3, 6 ) 
Evento: D = 
( 4,1) ( 4, 2 ) ( 4,3) − ( 4,5 ) ( 4, 6 )
( 5,1) ( 5, 2 ) ( 5,3) ( 5, 4 ) − ( 5, 6 ) 
 
( 6,1) ( 6, 2 ) ( 6,3) ( 6, 4 ) ( 6,5 ) − 

# ( D ) 30 5
( D)
P= = = = 0,8333… ou aproximadamente 83,3%
# ( Ω ) 36 6

e. Sair um número par e cara no lançamento de uma moeda e um


dado.
Espaço amostral: ΩÙ = {(1, K ) , ( 2, K ) , ( 3, K ) , ( 4, K ) , ( 5, K ) , ( 6, K ) ,

( )( )( )( )(
1, C , 2, C , 3, C , 4, C , 5, C , 6, C } )( )

Estatística 167
Evento: E = {( 2, K ) , ( 4, K ) , ( 6, K )}

#(E) 3 1
P(E=
) = = = 0, 25 ou 25%
# ( Ω ) 12 4

3.1 Propriedades da Probabilidade

Um subconjunto qualquer do espaço amostral Ω é um evento E


qualquer, e, por sua vez, todo evento E corresponde a uma probabilidade
P ( E ) , em que 0 ≤ P ( E ) ≤ 1 . Vejamos as propriedades da probabilidade.

I. A probabilidade de ocorrência do evento certo, representado pelo


próprio espaço amostral Ω, é igual a:

P (Ω) = 1

Exemplo 5

Qual é a probabilidade de sair um número menor ou igual a seis em


um lançamento de um dado?

Essa probabilidade é igual a 100%, pois o evento é o próprio espaço


amostral, ou seja, é claro que em um lançamento de um dado, o número
obtido será menor ou igual a seis.

II. A probabilidade de ocorrência do evento impossível, representado


pelo conjunto vazio, é igual a zero, isto é:

P (∅ ) = 0

Exemplo 6

Qual é a probabilidade de sair um número maior que seis em um


lançamento de um dado?

168 Estatística
Essa probabilidade é igual a 0, pois o evento é o conjunto vazio, isto é,
em um lançamento de um dado, os números obtidos sempre serão menores
ou iguais a seis.

III. Se os eventos A e B são mutuamente exclusivos, ou seja, não


podem ocorrer simultaneamente, então:

P ( A ou
= B) P ( A) + P ( B ) .

No caso geral, temos de descontar dessa soma a probabilidade de A e


B ocorrerem simultaneamente.

P ( A ou B ) = P ( A ) + P ( B ) − P ( Ae B ) .

Exemplo 7

Uma urna contém 100 bolas de mesmo tamanho numeradas de 1 a


100. Retira-se ao acaso uma bola.

a. Qual é a probabilidade de ocorrer um número menor que 11 ou


maior que 90?
Considere os seguintes eventos:
Evento A (número menor que 11) A = {1, 2, 3, 4, 5, 6, 7,8, 9,10}
Evento B (número maior que 90) B = {91, 92, 93, 94, 95, 96, 97, 98, 99,100}

10 10 20
P ( A ou B ) = + = = 0, 2 ou 20%
100 100 100
b. Qual é a probabilidade de ocorrer um número múltiplo de seis ou
de oito?
Considere os seguintes eventos:
Evento A (múltiplo de 6) A = {6, 12, 18, 24, 30, 36, 42, 48, 54, 60,
66, 72, 78, 84, 90, 96}
Evento B (múltiplo de 8) B = {8, 16, 24, 32, 40, 48, 56, 64, 72, 80, 88, 96}

Estatística 169
Note que, diferentemente do item (a), agora, há uma interseção
{24, 48, 72, 96} .
entre os eventos, isto é, A ∩ B =

16 12 4 24
P ( A ou B ) = + − = = 0, 24 ou 24%
100 100 100 100

IV. A probabilidade de A não ocorrer é igual a 1 − P ( A ) . Observe


que A c representa o chamado evento complementar de A , isto
é, o conjunto dos elementos do espaço amostral Ω que não estão
em A , isto é:

( )
P Ac = 1 − P ( A ) .

Importante

A noção de complementar um conjunto só faz pleno sentido quando se fixa um conjunto


universo Ω. Como todos os elementos a serem considerados pertencerão a Ω,e todos os
conjuntos serão subconjuntos de Ω, então, um subconjunto E (isto é, subconjunto de
Ω) chama-se complementar de E ao conjunto Ωc, formado pelos objetos de Ω que não
pertencem a E .

Exemplo 8

Qual é a probabilidade de sair, pelo menos, uma cara no lançamento


de cinco moedas?

O espaço amostral associado a esse experimento aleatório possui


32 elementos, pois há dois resultados para cada moeda lançada, ou seja,
2× 2× 2× 2× 2 =32 . O evento complementar a sair pelo menos uma cara é sair
nenhuma cara, que é composto por um único elemento Ac = {( C , C , C , C , C )} .

( )
P ( A ) = 1 − P Ac

1
P ( A ) =−
1 =0,96875 ou 96,875%
32

170 Estatística
Em que o evento A corresponde a sair, pelo menos, uma cara no
lançamento de cinco moedas.

Definição 4: Dizemos que dois eventos P1 e P2 são independentes,


quando a ocorrência de um evento não influencia a ocorrência do outro.
Se dois eventos são independentes, a probabilidade de que eles se realizem
simultaneamente é igual ao produto das probabilidades de realização dos dois
eventos.

P ( A )= P1 × P2

Exemplo 9

Foram lançados três dados. Qual a probabilidade de se obter 1 no


primeiro, 2 no segundo e 3 no terceiro?

A probabilidade de sair 1 no primeiro é:


1
P (A) =
6
A probabilidade de sair o número 2 no segundo dado é:

1
P ( B) =
6

A probabilidade de sair o número 3 no terceiro dado é:

1
P (C) =
6

Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro


dado, 2 no segundo, e 3 no terceiro, é:

1 1 1 1
P ( A ∩ B ∩ C) = × × = = 0, 004629 ou 0, 46 %
6 6 6 216

Estatística 171
Exemplo 10

Um baralho possui 52 cartas distribuídas em 4 naipes: copas, ouro,


paus e espada. Suponha que foi retirada, simultaneamente, uma carta de cada
baralho. Calcule a probabilidade de sair um ás no primeiro baralho e uma
dama de espadas no segundo.

Como em cada baralho há 52 cartas, 13 de cada naipe (espadas, paus,


ouro e copas), existem 4 ases em cada baralho e uma dama de espadas. A
probabilidade de sair um ás no primeiro baralho é:

4 1
P ( A=
) =
52 13

A probabilidade de sair uma dama de espadas no segundo baralho é:

1
P ( B) =
52

Como esses dois eventos são independentes, a probabilidade de sair no


primeiro baralho um ás e no segundo uma dama de espadas é:

1 1 1
P ( A ∩ B) = × = = 0, 0015 ou 0,15%
52 13 676

Exemplo 11

O campeonato brasileiro (série A) é composto por 20 clubes, e um


deles é o Flamengo. Considerando que as chances de o Flamengo vencer,
empatar ou perder são as mesmas, após 5 rodadas, qual a probabilidade de o
Flamengo ter vencido quatro jogos e empatado um?

Observe que, em cada jogo, existem tem três resultados possíveis


(vitória, empate ou derrota). Além disso, o resultado de um determinado jogo
não interfere no resultado dos demais jogos (são rodadas distintas).

172 Estatística
A probabilidade de o Flamengo vencer quatro jogos é de:
4
1 1 1 1 1 1
P (A) = × × × =  = = 0, 012 ou 1, 2%
3 3 3 3  3  81

A probabilidade de o Flamengo empatar um jogo é de:

1
P ( B) =
3

Logo, a probabilidade de o Flamengo vencer 4 jogos e empatar um é:

4
1 1 1
)   × =
P ( A ∩ B= = 0, 004 ou 0, 4%
 3  3 243

Exemplo 12

Uma urna A contém: 3 bolas azuis, quatro vermelhas e duas pretas;


uma urna B contém: cinco bolas azuis, duas vermelhas e uma preta; uma
urna C contém: duas bolas azuis, três vermelhas e quatro pretas. Uma bola
é retirada de cada urna. Qual a probabilidade de as três bolas retiradas da
primeira, segunda e terceira urnas serem, respectivamente, azul, vermelha e
preta?

Observe que os eventos são independentes e simultâneos, portanto, a


probabilidade da bola retirada da urna A ser azul é:

3 1
P ( A )= =
9 3

A probabilidade da bola retirada da urna B ser vermelha é:

2 1
P ( B=
) =
8 4

Estatística 173
A probabilidade da bola retirada da urna C ser preta é:

4
P (C) =
9

Logo, a probabilidade de as três bolas retiradas da primeira, segunda


e terceira urnas serem, respectivamente, azul, vermelha e preta é:

1 1 4 1
P ( A ∩ B ∩ C) = × × = = 0, 037 ou 3, 7%
3 4 9 27

Neste capítulo, apresentamos uma introdução acerca da teoria das


probabilidades, ramo da matemática que estuda experimentos ou fenômenos
aleatórios, por meio de modelos matemáticos específicos, de acordo com o
fenômeno estudado.

Para que você compreendesse o significado de espaço amostral e


evento na definição do conceito clássico de probabilidade e algumas de suas
propriedades, foram apresentados, por meio de vários exemplos, diferentes
situações em que podemos aplicar a teoria das probabilidades.

174 Estatística
Exercícios Propostos:
1. Em um lote de 12 peças, quatro são defeituosas. Sendo retiradas
aleatoriamente duas peças, determine a probabilidade de ambas
serem defeituosas.
2. A probabilidade de um atirador X acertar um alvo é de 80%, e a
probabilidade do atirador Y acertar o mesmo alvo é de 90%. Se os
dois atirarem uma vez, qual é a probabilidade de que, pelo menos,
um atinja o alvo?
3. Em uma urna há duas moedas aparentemente iguais. Uma delas
é uma moeda comum, com uma cara e uma coroa. A outra, no
entanto, é uma moeda falsa, com duas caras. Suponhamos que
uma dessas moedas seja sorteada e lançada. Qual a probabilidade
de sair cara?
4. Uma urna contém 50 bolas idênticas, numeradas de 1 a 50. Uma
bola é extraída ao acaso da urna, e seu número é observado. Qual a
probabilidade de o número sorteado ser menor ou igual a 20?
5. Uma loja dispõe de 12 televisores do mesmo tipo, dos quais quatro
apresentam defeito. Se um freguês vai comprar uma televisão, qual
a probabilidade de levar uma televisão defeituosa?

Respostas:

1
1. P=
11
20 10 49
2. 1−
P= × =
100 100 50

3. P=
3
4

4. P=
2
5

5. P=
1
3

Estatística 175
Referências
HAZZAN, S. Fundamentos de matemática elementar. São Paulo: Atual,
1993.

LOVÁSZ, L. et al. Matemática discreta. Rio de Janeiro: SBM, 2003.

MORGADO, A. C. O. et al. Análise combinatória e probabilidade. Rio de


Janeiro: IMPA, 1991.

SANTOS, J. P. O. et al. Introdução à análise combinatória. Rio de Janeiro:


Ciência Moderna, 2008.

SCHEINERMAN, E. R. Matemática discreta: Uma introdução. São Paulo:


Cengage Learning, 2010.

Estatística 177
Probabilidade Condicional e
Teorema de Bayes
Para Início de Conversa…
Neste capítulo, estudaremos os conceitos de probabilidade, a priori
e a posteriori, a Lei da Probabilidade Total (que se refere à probabilidade
total de ocorrência de um resultado, por meio de vários eventos distintos), a
Lei da Multiplicação (que serve para definir a probabilidade de intersecção
entre dois eventos), a probabilidade condicional (que se refere à probabilidade
de ocorrência de um evento A, sabendo-se que um outro evento B já tenha
ocorrido) e o Teorema de Bayes (que recebe esse nome em homenagem ao
pastor presbiteriano e matemático Thomas Bayes (1702-1761), que formulou
seu caso especial).

Com o estudo desse capítulo você perceberá que esse ramo de estudo
tem aplicabilidades em diferentes áreas de conhecimento, auxiliando os
profissionais na tomada de decisões.

Estatística 179
Objetivo
Identificar situações que envolvam probabilidades condicionadas.

Estatística 181
1. Probabilidade Condicionada
Se A e B são eventos que podem ocorrer em um dado experimento, a
probabilidade condicional de B ter ocorrido, quando se sabe que A ocorreu, é
representada por P( B | A) (lê-se “probabilidade de B dado A”).

Exemplo 1: A tabela a seguir mostra a distribuição dos alunos de uma


escola por sexo e por turno.

  Masculino Feminino Total

1° Turno 150 50 200


2° Turno 30 70 100
Total 180 120 300

Escolhe-se, ao acaso, um aluno:

a. Qual é a probabilidade de o aluno ser do sexo masculino?

180
P ( Masculino
= ) = 0, 6 ou 60%
300

b. Qual é a probabilidade de o aluno ser do sexo masculino, sabendo-se


que ele estuda no primeiro turno?

150
P ( Masculino|1° Turno ) = = 0, 75 ou 75%
200

Observe que, no item (b), o conhecimento a priori de saber que o


aluno é do primeiro turno muda o valor da probabilidade em relação ao valor
obtido no item (a).

Definição: Dados dois eventos A e B, a probabilidade condicional de B


é dada que A é o número P ( A ∩ B ) / P ( A ) . Temos, então, simbolicamente:

Estatística 183
P ( A ∩ B)
P ( B|A ) = (1)
P (A)

A fórmula (1) é facilmente entendida observando-se a Figura 1. Note


que, no momento em que você tem conhecimento de que ocorreu o evento
A , o seu espaço amostral se restringe a ele e a interseção com o evento B
torna-se o evento que deve ser considerado.

Ω
B A

A ∩ B

Figura 1: Representação gráfica da fórmula. Fonte: Elaborada pelos autores.

Exemplo 2: Na probabilidade condicional no lançamento de um dado,


considere os seguintes eventos:

Eventos A = o resultado é um número par


Evento B = o resultado não é número primo

a. Calcule a probabilidade condicional P( B | A) .

Para calcularmos P( B | A) , devemos considerar todos os resultados


favoráveis de B = {1, 4, 6} dentre os resultados de A = {2, 4, 6} , ou seja, os
resultados comuns de B e A. Há apenas dois resultados nessas condições: 4
e 6. Assim, P ( B|A ) = 2 / 3 ; isso significa que procedemos como se A fosse
o novo espaço amostral. Outra maneira seria calcular P( B | A) usando a
propriedade das probabilidades condicionais:

184 Estatística
2/6 2
P ( B=
|A ) =
3/ 6 3

b. Calcule a probabilidade condicional P( A | B) .

Note que, no item (b), foi mudada a condicional, ou seja, estamos


interessados em calcular a probabilidade de ocorrer A dado que B ocorreu.

2/6 2
P ( A=
|B ) =
3/ 6 3

Observe que o valor da probabilidade condicional encontrada no item


(b) foi igual ao valor encontrado no item (a). Mas será que isso foi uma
coincidência ou esse resultado é válido para quaisquer eventos A e B ? A
resposta é não! Para compreender, basta igualar P ( A|B ) a P ( B|A ) .

P ( A ∩ B) P ( A ∩ B)
=
P ( B) P (A)

Logo, P ( A|B ) é igual a P ( B|A ) , se P ( A ∩ B ) =


0 ou se
P ( A ) = P ( B ) . É o que ocorre neste exemplo:

A fórmula (1) será raramente utilizada. Como no exemplo 2, ela acaba


sendo muito mais útil quando escrita da seguinte maneira:

P ( A ∩ B) =
P ( B|A ) .P ( A )

Exemplo 3: Sabe-se que 80% dos pênaltis marcados a favor do


Brasil são cobrados por jogadores que atuam em algum clube do exterior.
A probabilidade de um pênalti ser convertido é de 40%, se o cobrador é um
jogador que atua no exterior, e de 70% em caso contrário. Um pênalti a
favor do Brasil acabou de ser marcado. Qual a probabilidade de o pênalti ser
cobrado por um jogador que atua no exterior e ser convertido?

Estatística 185
O “e” na pergunta equivale a interseção entre o evento ser cobrado por
um jogador que atua no exterior e o evento ser convertido. Observe que são
dois eventos independentes, isto é, a probabilidade de ocorrer um deles não
depende do fato de o outro ter ou não ter ocorrido.

Seja A a probabilidade de um jogador que atua no exterior cobrar o


pênalti, e B a probabilidade de o pênalti ser convertido, temos:

P ( A ∩ B) =
P ( B|A ) .P ( A )

P ( A ∩ B ) = 0, 4 × 0,8 = 0,32 ou 32%

2. Teorema de Bayes
Um resultado muito importante obtido pela probabilidade condicional
é chamado de Teorema de Bayes. Esse teorema descreve a probabilidade de
um evento fundamentado em um conhecimento anterior que está associado
ao evento. O teorema demostra como alterar a probabilidade condicional, isto
é, calcular P( A | B) conhecendo a probabilidade condicional P( B | A) .

Partição do espaço amostral Ω: Dizemos que os eventos


A1 , A2 , A3 , …, An formam uma partição do espaço amostral Ω se as seguintes
condições são todas satisfeitas.

(1) P ( Ai ) > 0 para todo i,=i 1, 2, …, n


(2) P ( Ai e=
Aj ) 0, sei ≠ j
(3) P ( A1 ou A2 ou A3 ou … ou An ) =
1

A primeira condição requer que nenhum evento seja impossível, a


segunda, que a interseção entre todos os eventos tomados dois a dois seja
sempre o conjunto vazio, e a terceira diz que a união de todos os eventos é o
próprio espaço amostral.

186 Estatística
Exemplo 4: A Figura 2 mostra um exemplo de uma partição de um
espaço amostral em quatro eventos. Note que as três condições são satisfeitas,
ou seja, todos os eventos são não vazios, não há interseção entre eles e, quando
unidos, formam o próprio espaço amostral.

Ω
A1
A3 A4

A2

Figura 2: Partição de um espaço amostral Ω. Fonte: Elaborada pelos autores.

Teorema da Probabilidade Total: Se os eventos A1 , A2 , A3 , …, An


formam uma partição do espaço amostral Ω, e B é um evento qualquer desse
espaço, então:
=P ( B ) P ( B|A1 ) P ( A1 ) + P ( B|A2 ) P ( A2 ) + P ( B|A3 ) P ( A3 ) +…+ P ( B|An ) P ( An )

Demonstração: Como os eventos A1 , A2 , A3 , …, An formam uma


partição no espaço amostral Ω, podemos escrever o evento B da seguinte
maneira:

) P ( ( B ∩ A1 ) ∪ ( B ∩ A2 ) ∪ ( B ∩ A3 ) ∪…∪ ( B ∩ An ) )
P ( B=

Note que algumas dessas interseções com o evento B podem ser o


conjunto vazio, entretanto, isso não causa nenhum problema na decomposição
de B . Como todas as interseções com o evento B são mutuamente excludentes,
é possível reescrever a decomposição de B do seguinte modo:

P ( B ) = P ( B ∩ A1 ) + P ( B ∩ A2 ) + P ( B ∩ A3 ) +…+ P ( B ∩ An )

Contudo, cada parcela do segundo membro pode ser reescrita pela


fórmula da probabilidade condicional da seguinte maneira:

Estatística 187
P ( B ∩ A1 ) =
P ( B|A1 ) .P ( A1 )
P ( B ∩ A2 ) =
P ( B|A2 ) .P ( A2 )
P ( B ∩ A3 ) =
P ( B|A3 ) .P ( A3 )

P ( B ∩ An ) =
P ( B|An ) .P ( An )

Chegamos à fórmula (2), denominada Teorema da Probabilidade Total:

=P ( B ) P ( B|A1 ) P ( A1 ) + P ( B|A2 ) P ( A2 ) + P ( B|A3 ) P ( A3 ) +…+ P ( B|An ) P ( An ) (2)

Exemplo 5: A fábrica SnakeEyes compra peças de três fornecedores


A1 , A2 e A3 nas proporções de 40%, 35% e 25%, respectivamente. Sabe-se
que, em média:

▪▪ 3% das peças fabricadas por A1 apresentam defeitos.


▪▪ 2% das peças fabricadas por A2 apresentam defeitos.
▪▪ 1% das peças fabricadas por A3 apresenta defeito.

Se uma peça é extraída, ao acaso, do estoque da fábrica SnakeEyes:

a. Qual a probabilidade de que ela seja defeituosa?

Note que os três fornecedores representam o espaço amostral e


satisfazem as propriedades de uma partição desse espaço. Seja P ( D )
a probabilidade de uma peça ser defeituosa, então, pelo Teorema da
Probabilidade Total, temos:
P ( D ) = P ( D|A1 ) P ( A1 ) + P ( D|A2 ) P ( A2 ) + P ( D|A3 ) P ( A3 )

P ( D ) = 0, 03 × 0, 4 + 0, 02 × 0,35 + 0, 01× 0, 25

P ( D ) = 0, 0215 ou 2,15%

188 Estatística
É comum e bem visual aplicar o Teorema da Probabilidade Total na
forma de uma árvore de probabilidade, isto é:

Defeituosa 0,03

0,4 A1
Não defeituosa 0,97

Defeituosa 0,02
0,35 A2

Não defeituosa 0,98

0,25 A3 Defeituosa 0,01

Não defeituosa 0,99

Para utilizar a árvore de probabilidades a fim de calcular a probabilidade


de uma peça não ser defeituosa, deve-se percorrer os ramos da árvore e
calcular:

0, 40 × 0, 03 =
0, 012 a probabilidade de ser defeituosa e ser fornecida por A1
0,35 × 0, 02 =
0, 007 a probabilidade de ser defeituosa e ser fornecida por A2
0, 25 × 0, 01 =
0, 0025 a probabilidade de ser defeituosa e ser fornecida por A3

Em seguida, deve-se somar esses resultados:

P ( D ) = 0, 012 + 0, 007 + 0, 0025

P ( D ) = 0, 0215

Note que a solução obtida por meio da árvore de probabilidade é o


próprio Teorema da Probabilidade Total.

Estatística 189
b. Qual a probabilidade de que ela não seja defeituosa?

Conhecendo a solução do item (a), o caminho natural para chegar à


resposta deste é fazer uso da probabilidade complementar, isto é:

( )
P D = 1 − P ( D )

P ( D ) = 1 − 0, 0215

P ( D ) = 0,9785 ou 97,85%

Sem o conhecimento do resultado do item (a), mas dispondo da árvore


de probabilidade, chegamos à solução calculando:

0, 40 × 0,97 =
0,388 a probabilidade de não ser defeituosa e ser fornecida por A1
0,35 × 0,98 =
0,343 a probabilidade de não ser defeituosa e ser fornecida por A2

0, 25 × 0,99 =
0, 2475 a probabilidade de não ser defeituosa e ser fornecida por A3

Somando essas probabilidades, temos:

( )
P D = 0,388 + 0,343 + 0, 2475

P ( D ) = 0,9785 ou 97,85%

Teorema de Bayes: Sob as mesmas condições do Teorema da


Probabilidade Total:

P ( B|Ai ) P ( Ai )
P ( Ai |B ) =
P ( B)

para todo=i 1, 2, …, n .

Demonstração: Por (1) sabemos que a probabilidade de ocorrência


simultânea de dois eventos, A e B , é dada por:

190 Estatística
P ( A ∩ B) =
P ( B|A ) .P ( A )

P ( B ∩ A) =
P ( A|B ) .P ( B )

Como P ( A ∩ B )= P ( B ∩ A) , podemos escrever:

P ( A|B ) .P ( B ) = P ( B|A ) .P ( A )

Ou:
P ( B|A ) P ( A )
P ( A|B ) =
P ( B)

Pensando em termos de eventos Ai (com= i 1, 2,…, n ) que formam


uma partição de um espaço amostral Ω, escreve-se o teorema de Bayes do
seguinte modo:
P ( B|Ai ) P ( Ai )
P ( Ai |B ) =
P ( B)

Mas, como, em geral P ( B ) , não é conhecido, pode-se escrever usando


o Teorema da Probabilidade Total:

P ( B|Ai ) P ( Ai )
P ( Ai |B ) =
P ( B|A1 ) P ( A1 ) + P ( B|A2 ) P ( A2 ) +…+ P ( B|An ) P ( An )

Exemplo 6: Considere o enunciado e as informações dadas no exemplo


4 para responder os itens a seguir:

a. Se uma peça é extraída ao acaso do estoque da fábrica SnakeEyes:


Qual a probabilidade condicional de ela ter sido produzida pelo
fornecedor A1 , dado que é defeituosa?

Note que o problema fornece uma probabilidade condicional,


mas não é a que está sendo pedida, ou seja, é conhecida a probabilidade
condicional de ser defeituosa dado que foi fornecida por A1 ( P ( D|A1 ) = 0, 03 ) e

Estatística 191
a probabilidade pedida é P ( A1|D ) . Para chegar ao resultado desejado, deve-se
utilizar o Teorema de Bayes.

P ( D|A1 ) P ( A1 )
P ( A1|D ) =
P ( D)
0, 03 × 0, 4
P ( A1|D ) =
0, 0215
P ( A1|D )  0,558 ou 55,8%

b. Se uma peça é extraída ao acaso do estoque da fábrica SnakeEyes:


Qual a probabilidade condicional de ela ter sido produzida pelo
fornecedor A2 (e também para o fornecedor A3 ), dado que é
defeituosa?

De forma análoga ao item (a), temos:

P ( D|A2 ) P ( A2 )
P ( A2 |D ) =
P ( D)

0, 02 × 0,35
P ( A2 |D ) =
0, 0215

P ( A2 |D )  0,326 ou 32, 6%

Para o fornecedor, A3 podemos repetir os passos ou usar a probabilidade


complementar.

P ( D|A3 ) P ( A3 )
P ( A3 |D ) =
P ( D)
0, 01× 0, 25
P ( A3 |D ) =
0, 0215
P ( A3 |D )  0,116 ou 11, 6%

192 Estatística
Ou pela probabilidade complementar:

1 − ( P ( A1|D ) + P ( A2 |D ) )
P ( A3 |D ) =

P ( A3 |D )  1 − ( 0,558 + 0,326 )

P ( A3 |D ) = 0,116 ou 11, 6%

Aplicações: Probabilidade Condicional e Teorema de Bayes

Agora que já definimos o conceito clássico de probabilidade e vimos


as suas principais propriedades, aplicaremos as técnicas de combinatória na
determinação do espaço amostral e de eventos em alguns problemas.

Exemplo 7: A tabela a seguir exibe a porcentagem de peças produzidas


e de peças defeituosas feitas por cada uma das três máquinas de uma fábrica:

Máquina Porcentagem de peças fabricadas Peças defeituosas


A 50% 1%
B 30% 2%
C 20% 5%

De acordo com essas informações, determine:

a. Ao escolhermos, ao acaso, uma peça feita nessa fábrica, qual a


probabilidade, representada por P ( D ) , de ela ter defeito?

P ( D ) = ( 0,5.0, 01) + ( 0,3.0, 02 ) + ( 0, 2.0, 05 )

P ( D ) = 0, 021ou 2,1%.

b. Qual a probabilidade de uma peça defeituosa ter sido feita pela


máquina C ?

P (C | D ) =
( 0, 2 ) . ( 0, 05)
0, 021

Estatística 193
P ( C | D ) = 0, 4761ou 47, 61%

Exemplo 8: Em uma pesquisa realizada durante um evento esportivo,


100 torcedores responderam. A tabela a seguir exibe os resultados obtidos:

Time para o qual o entrevistado torce


A B C
Sexo Masculino 10 12 13
Sexo Feminino 15 41 9

Ao ser escolhido um torcedor do time B para receber um brinde


oferecido pelos atletas, qual a probabilidade de ele ser homem?

Seja P ( M ) : Ser do sexo masculino e P ( B ) : ser torcedor do time B .


Então, ser do sexo masculino, dado que é torcedor do time B , é representado
por P( M | B) e é calculado da seguinte maneira:

12
P (M | B) =
53
P ( M | B ) = 0, 2264 ou 22, 64%

Nesse capítulo, utilizamos os conceitos de espaço amostral, eventos e


conceito clássico de probabilidade para estudarmos probabilidade condicional,
o Teorema da Probabilidade Total e Teorema de Bayes.

Diferenciamos probabilidade “a priori” de “a posteriori” e vimos que


probabilidade condicional se refere à probabilidade de ocorrência de um
evento A, dado que o evento B já tenha ocorrido.

Também estudamos que dois eventos são ditos independentes se a


ocorrência de um deles não interfere na probabilidade de ocorrência do outro
(e dependentes em caso contrário), e que são mutuamente exclusivos se não
puderem ocorrer simultaneamente (ou seja, se a ocorrência de um deles exclui
a possibilidade de ocorrer o outro).

194 Estatística
Exercícios Propostos
1. Dados dois eventos A e B que podem ocorrer em um experimento.
Chamamos de Probabilidade Condicional, representada por
P ( B | A) :

a. A probabilidade condicional de B ocorrer, quando se sabe que A


ocorreu.
b. A probabilidade condicional de B ocorrer, quando se sabe que A
é provável.
c. A probabilidade condicional de A ocorrer, quando se sabe que B
é provável.
d. A probabilidade condicional de B e A ocorrerem, dado que são
eventos mutuamente exclusivos.
e. A probabilidade condicional de B e A ocorrerem, dado que são
eventos independentes entre si.

2. Uma doceira fez 30 docinhos de festa, sendo 10 brigadeiros e 20


beijinhos, e os acondicionou em uma caixa de entrega. Se dessa
caixa forem retirados aleatoriamente dois doces, um de cada vez
e sem reposição, qual será a probabilidade do primeiro ser um
brigadeiro e o segundo ser um beijinho?
3. A tabela a seguir exibe o curso de graduação e as disciplinas
cursadas no semestre atual, de cada um dos alunos participantes de
uma pesquisa.

Bacharel em Engenharia Civil Tecnólogo


Cálculo Diferencial e Integral IV 30 8
Estatística 32 30
Trabalho Conclusão de Curso – TCC 12 0
Álgebra Linear 8 4

Estatística 195
Se cada aluno entrevistado estiver matriculado em exatamente um
curso, e se for escolhido ao acaso um desses alunos, responda:

a. Qual a probabilidade de ele ser matriculado em Engenharia Civil?


b. Qual a probabilidade de ele cursar a disciplina Cálculo IV?
c. Qual a probabilidade de ele ser aluno da Engenharia Civil, dado
que ele cursa a disciplina Cálculo IV?

4. Dentre as opções a seguir, qual exibe eventos A e B, mutuamente


exclusivos entre si?
a. A: Ser um número par.
B: Ser um número divisível por 3.
b. A: Ser um número par.
B: Ser um número ímpar.
c. A: Ser um vegetal.
B: Ser um vegetal na cor vermelha.
d. A: Ser um triângulo.
B: Ser equilátero.
e. A: Ter menos do que 18 anos de idade.
B: Cursar medicina em uma instituição de ensino superior.

5. Dê um exemplo de dois eventos, A e B, independentes.

Respostas:

1. Letra A
2. Sejam:
A: Ser um brigadeiro (na primeira retirada).
B: Ser um beijinho (na segunda retirada).

196 Estatística
Então:
10 20
=P ( A) = e P ( B)
30 29
10 20 200 20
P ( Ae=
B ) P ( A ) . P ( B /=
A) .= =
30 29 870 87

3. Sejam:
E: O aluno é matriculado na Engenharia Civil.
C: O aluno cursa Cálculo IV neste semestre.
82 41
a.
a ) P (=
E) =
124 62
38 19
b.
b) P (=
C) =
124 62
30 15
c. c) P ( E / C=) =
38 19

4. Letra B, pois um número não pode ser, ao mesmo tempo, par e


ímpar.

5. A: O aluno João foi aprovado na disciplina Estatística.


B: O aluno Pedro foi reprovado na disciplina Cálculo II.

Estatística 197
Referências
HAZZAN, S. Fundamentos de matemática elementar. São Paulo, Atual,
1993.

LOVÁSZ, L. et al. Matemática discreta. Rio de Janeiro, SBM, 2003.

MORGADO, A. C. O. et al. Análise combinatória e probabilidade. Rio de


Janeiro, IMPA, 1991.

SANTOS, J. P. O. et al. Introdução à análise combinatória. Rio de Janeiro,


Ciência Moderna, 2008.

SCHEINERMAN, E. R. Matemática Discreta: uma introdução. São Paulo,


Cengage Learning, 2010.

Estatística 199
Considerações Finais
Nessa disciplina, estudamos importantes tópicos da Matemática
relacionados à Estatística e à Probabilidade.

Aprendemos os conceitos de população e de amostra e vimos que


as variáveis podem ser qualitativas ou quantitativas. Também pudemos
compreender que a tabela é a forma não discursiva de apresentação de
informações, representadas por dados dispostos de acordo com as variáveis
analisadas de um fenômeno. Aprendemos a construir e a interpretar diferentes
formas de gráficos.

De igual modo, estudamos os diferentes tipos de média, a moda e


mediana para dados distribuídos ou não em classes e aprendemos, também,
as principais medidas de dispersão e exemplos de aplicabilidades em diversas
áreas de conhecimento.

Em nosso estudo, também analisamos a classificação de um conjunto


de dados de acordo com o valor do coeficiente de assimetria, além de
calcular o coeficiente de curtose de Pearson. Esse resultado mede o grau de
“achatamento” da curva, tomando como referência a curva normal.

Por fim, aprendemos sobre os conceitos iniciais de Probabilidade e


algumas de suas possíveis funcionalidades no cotidiano. Com os conteúdos
abordados em nossa disciplina você terá seus conhecimentos de Matemática
ampliados e poderá aplicá-los em diferentes situações de sua vida cotidiana e
profissional.

200 Estatística

Você também pode gostar