Você está na página 1de 189

Estatística

para os cursos de:


Economia
Administração e
Ciências Contábeis

BPDEA
-w
SEA
w A
Associação Bras~leimpara
a Proteçao dos Direitos

-
Editoriais e Automis
R E S P E IT E
O AUTOR
C~PIA
N AO F A Ç A
EDITORA ATLAS S.A.
Rua Conselheiro Nébias, 1384 (Campos Elísios)
01203-904 São Paulo (SP)
Tel.: (O 11) 3357-9144
Ermes da Silva
Elio da Silva
Walter Gonçalves
Afrânio Carlos Murolo

Estatística
para os cursos de:
Economia
Administração e
Ciências Contábeis

Volume 1

PAULO
EDITORA ATLAS S.A. -- 1999
1994 by EDITORA ATLAS S.A.

ed. 1995; 2. ed. 1996; 3. ed. 1999;

Capa: Aldo
Composição: Formato Serviços de Editoração Ltda.

Dados Internacionais de Catalogação na Publicação (CIP)


(Câmara Brasileira do Livro, SP, Brasil)

Estatística Ermes da Silva ... let - 3. ed. São Paulo: Atlas, 1999.

Outros autores: Walter Gonçalves, Elio da Silva, Afrânio Carlos


Murolo.
ISBN 85-224-2236-2

Estatística I. Silva, Ermes Medeiros. Gonçalves, Walter, 1942- 111.


Silva, Elio da. Murolo, Afrânio Carlos. V. Título.

94-4177 CDD-519.5

índice para catálogo sistemático:


1. Estatística 519.5

TODOS OS DIREITOS RESERVADOS - É proibida a reprodução total ou parcial, de


qualquer forma ou por qualquer meio. A violação dos direitos de autor (Lei
9.610198) é crime estabelecido pelo artigo 184 do Código Penal.

Depósito legal na Biblioteca Nacional conforme Decreto de 20 de dezembro


de 1907.

Impresso no ín Brazíl
Sumário

t CONCEITOS BASICOS, 11
1.1 Introdução, 11
1.2 Conceitos Fundamentais, 12
1.2.1 Objetivo, 12
1.2.2 População e Amostra, 12
1.3 Processos Estatísticos de Abordagem, 12
1.4 Dados Estatísticos, 14
1.5 Estatística Descritiva, 14
1.6 Dados Brutos, 15
1.7 Rol, 16
1.8 Exercícios Propostos, 17

SÉRIES ESTAT~STICAS,I 8
2.1 Apresentação de Dados Estatísticos, 18
2.2 Distribuição de Frequência - Variável Discreta, 18
2.3 Distribuição de Frequência - Variável Contínua, 19
2.4 Construção da Variável Discreta, 20
2.5 Construção da Variável Contínua, 21
2.6 Exercícios Propostos, 26
2.7 Distribuição de Frequências - Variável Discreta, 29
2.7.1 Frequência Relativa de um Elemento da Série - fr, 29
2.7.2 Frequência Acumulada de um Elemento da Série - Fi, 30
2.7.3 Frequência Acumulada Relativa de um Elemento da Série - FR,,31
2.8 Distribuição de Frequências - Variável Contínua, 32
2.8.1 Frequência Relativa de uma Classe - fh 32
2.8.2 Frequência Acumulada de uma Classe - Fi, 33
2.8.3 Frequência Acumulada Relativa de uma Classe - FR,34
2.9 Exercícios Propostos, 35
6 Sumário

2.1 0 Representação Gráfica de Séries Estatísticas, 38


2.10.1 Histograma - Variável Discreta, 39
2.10.2 Histograma - Variável Contínua, 40
2.11 Exercícios Propostos, 42

3 MEDIDAS DE TENDÊNCIA CENTRAL, 46


3.1 Introdução, 46
3.2 Somatório - Notação Sigma (C ), 46
3.3 Exercícios Propostos, 51
3.4 . Médias, 54
3.4.1 Média Aritmética Simples, 54
3.4.2 Média Aritmética Ponderada, 54
3.4.3 Média Geométrica Simples, 55
3.4.4 Média Geométrica Ponderada, 55
3.4.5 Média Harrnônica Simples, 55
3.4.6 Média Harmônica Ponderada, 56
3.5 Cálculo da Média Aritmética, 57
3.6 Exercícios Propostos, 60
3.7 Mediana, 66
3.8 Cálculo da Mediana, 66
3.9 Exercícios Propostos, 71
3.10 Moda, 74
3.11 Cálculo da Moda, 74
3.12 Utilização das Medidas de Tendência Central, 83
3.13 Exercícios Propostos, 85

4 MEDIDAS SEPARATRIZES, 89
4.1 Conceitos, 89
4.2 Cálculo das ~edidasseparatrizes,90
4.3 Exercícios Propostos, 95

5 MEDIDAS DE DISPERSÃO, 100


5.1 Introdução, 100
5.2 Medidas de Dispersão Absoluta, 101
5.3 Amplitude Total, 101
5.4 Cálculo da Amplitude Total, 101
5.5 Exercícios Propostos, 102
5.6 Desvio Médio Simples, 103
Sumário 7

5.7 Cálculo do Desvio Médio Simples, 103


5.8 Exercícios Propostos, 108
5.9 Variância e Desvio Padrão, 109
5.1 0 Cálculo da Variância e Desvio Padrão, 110
5.11 Interpretação do Desvio Padrão, 116
5.1 2 Exercícios Propostos, 118
5.13 Medidas de Dispersão Relativa, 121
5.14 Exercícios Propostos, 122

i MEDIDAS DE ASSIMETRIA E CURTOSE, 124


6.1 Introdução, 124
6.2 Medidas de Assimetria, 125
6.2.1 Coeficiente de Pearson, 125
6.2.2 Coeficiente de Bowley, 125
6.3 Medida de Curtose, 126
6.4 Exercícios Propostos, 132

- PROBABILIDADES, 143
7.1 Introdução, 143
7.1.1 Fenômenos Aleatórios, 143
7.2 Teoria das Probabilidades - Espaço Amostral, 145
7.3 Eventos, 147
7.4 Operações com Eventos, 148
7.5 Exercícios Propostos, 149
7.6 Função de Probabilidade, 151
7.7 Definição de Probabilidade, 151
7.8 Exercícios Propostos, 155
7.9 Probabilidade de um Evento, 158
7.10 Exercícios Propos'tos, 159
7.11 Axiomas de Probabilidade, 162

i CÁLCULO DE PROBABILIDADES, 163


8.1 Teoremas Fundamentais, 163
8.1.1 Probabilidade do Conjunto Vazio, 163
8.1 -2 Probabilidade do Complementar, 163
8.1.3 Probabilidade da Reunião, 163
8.1.4 Exercícios Propostos, 165
8.1.5 Probabilidade Condicional, 165
8 Sumário

8.1.6 Exercícios Propostos, 170


8.1.7 Teorema da Probabilidade Total, 172
8.1.8 Exercícios Propostos, 174
8.1.9 Teorema de Bayes, 176
8.1.1 0 Exercícios Propostos, 178
8.2 Exercícios Gerais, 179

Bibliografia, 189
Prefácio

Estamos colocando a disposição dos colegas professores e aos inte-


?ssadosem estatística de modo geral uma coleção de livros da qual este é o
primeiro volume. O conteúdo deste volume apresenta os conceitos básicos
iniciais de um curso de estatística, isto é, enfoca a estatística descritiva, as
medidas sobre uma distribuição, e coloca os principais estimadores necessá-
rios ao desenvolvimento posterior de inferência estatística. Encerra o volume
o estudo do cálculo de probabilidades. Este conteúdo foi escolhido por alguns
motivos. A nossa experiência ao desenvolver cursos nesta área nos conven-
zu de que este conteúdo pode ser desenvolvido com bom aproveitamento
um curso anual de 72 horas ou em curso semestral equivalente. Além disso,
conteúdo está adequado ao novo currículo dos cursos de administração de
empresa que estão sendo implantados nas diversas faculdades.
Entretanto, o que nos parece mais importante é a maneira como o
assunto foi desenvolvido. Uma crítica frequente de professores e alunos com
respeito aos textos de estatística é que eles apresentam os conceitos estatísti-
cos do ponto de vista matemático, com ênfase nos cálculos das medidas. A
conseqüência deste enfoque é que os estudantes, embora possam desenvol-
ver os cálculos necessários a solução de problemas não são capazes de
realizar o que nos parece fundamental em estatística, que é o conhecimento e
as possíveis interpretações do fenômeno estatístico envolvido.
Para atingir este objetivo procuramos desenvolver os conceitos dando
anfase a interpretação das medidas sobre o fenômeno estatístico. Desta for-
ia, a apresentação de cada conceito é seguida de sua interpretação específi-
a, completada por questões teóricas e práticas que fixem esse conhecimen-
,a. A idéia é que fique claro o que o conceito significa do ponto de vista
estatístico e quais são as possíveis utilidades que ele pode ter, principalmente
no campo da Administração.
Tendo em vista este objetivo, muitas vezes restringimos a abrangência
do conceito com a finalidade de torná-lo acessível ao estudante. Desta forma,
os professores da área certamente notarão alguns conceitos particularizados
ou pouco abrangentes. Achamos necessária esta restrição para não desviar o
enfoque do significado do conceito e sua interpretação.
10 Prefácio

Acreditamos que a medida que o estudante for adquirindo experiência


nesta área, a generalização dos conceitos ocorrerá de maneira natural.
Com a finalidade de fixar os conceitos elaboramos grande quantidade
de exercícios. O leitor deverá notar que tivemos o cuidado de apresentar
problemas enfocando a aplicação da estatística a diversas áreas da adminis-
tração de empresas; cumprindo desta forma uma de suas finalidades que é de
disciplina de apoio as áreas profissionais deste campo.
Esperamos que este texto e os demais que o seguirão sejam de utili-
dade para professores e estudantes que necessitam de estatística em sua
vida profissional.
Gostaríamos de receber sugestões e críticas dos colegas. Essa aten-
ção para com nosso trabalho nos farão agradecidos e certamente colaborarão
para a correção de rumo, aumentando a adequação, utilidade e competência
desta obra.

São Paulo, outubro de 94.


Os Autores
1/ Conceitos Básicos

1 .I Introdução
O termo Estatística provém da palavra Estado e foi utilizado original-
mente para denominar levantamentos de dados, cuja finalidade era orientar o
Estado em suas decisões.
Neste sentido foi utilizado em épocas remotas para determinar o valor
dos impostos cobrados dos cidadãos, para determinar a estratégia de uma
nova batalha em guerras que se caracterizavam por uma sucessão de bata-
lhas. (Era fundamental aos comandantes saber de quantos homens, armas,
cavalos etc. dispunham após a última batalha.)
Atualmente, a estatística é definida da seguinte forma:

Estatística é um conjunto de métodos e processos


quantitativos que serve para estudar e medir os fe-
nômenos coletivos.

A estatística teve acelerado desenvolvimento a partir do século XVII,


com os estudos de BERNOULLI, FERMAT, PASCAL, LAPLACE, GAUSS, GALTON,
PEARSON, FISHER, POISSON e outros que estabeleceram suas características
atuais.
Ela não alcançou ainda um estado definitivo. Continua a progredir na
razão direta do desejo de investigação dos fenômenos coletivos.
A Estatística é considerada por alguns autores como Ciência no senti-
do do estudo de uma população. É considerada como método quando utiliza-
da como instrumento por outra Ciência.
A Estatística mantém com a Matemática uma relação de dependência,
solicitando-lhe auxílio, sem o qual não poderia desenvolver-se.
Com as outras Ciências mantém a relação de complemento, quando
utilizada como instrumento de pesquisa.
12 Estatística 1

Em especial esta última é a relação que a Estatística mantém com a


Administração, Economia, Ciências Contábeis, servindo como instrumento au-
xiliar na tomada de decisões.

1.2 Conceitos Fundamentais


1.2.1 OBJETIVO

Estatística tem como objetivo o estudo dos fenômenos coletivos.

1.2.2 POPULAÇAO E AMOSTRA

Conceituaremos População como sendo o conjunto de todos os itens


(pessoas, coisas, objetos) que interessam ao estudo de um fenômeno coletivo
segundo alguma característica.
Entenderemos por Amostra, qualquer subconjunto não vazio de uma
população.
Uma característica numérica estabelecida para toda uma população é
denominada parâmetro.
Uma característica numérica estabelecida para uma amostra é deno-
minada estimador.
Por exemplo: no fenômeno coletivo eleição para governador no Estado
de São Paulo, a população é o conjunto de todos os eleitores habilitados no
Estado de São Paulo. Um parâmetro é a proporção de votos do candidato A.
Uma amostra ,é um grupo de 1000 eleitores selecionados em todo o Estado.
Um estimador é a proporção de votos do candidato A obtida na amostra.
Em aplicações efetivas, o número de elementos componentes de uma
amostra é bastante reduzido em relação ao número de elementos componen-
tes da população.

1.3 Processos Estatísticos de Abordagem


Quando solicitados a estudar um fenômeno coletivo podemos optar
entre os seguintes processos estatísticos:

a) Estimação.
b) Censo.
Conceitos Básicos 13

Censo: é uma avaliação direta de um parâmetro, utilizando-se todos


9s componentes da população.
Estimação: é uma avaliação indireta de um parâmetro, com base em
IJm estimador através do cálculo de probabilidades.

Propriedades Principais do Censo:


i Admite erro processual zero e tem confiabilidade 100%.
i É caro.
i É lento.
É quase sempre desatualizado.
i Nem sempre é viável.
Propriedades Principais da Estimação:
i Admite erro processual positivo e tem confiabilidade menor que
100%.
i É barata.
i É rápida.
i É atualizada.
i É sempre viável.

COMENTÁRIO: estatisticamente, a precisão de um valor numérico é avalia-


da através do binômio: confiança e erro processual.
Se admitirmos que podemos retirar do Censo todo tipo de erro de
natureza humana (erro de cálculo de avaliação, de anotação etc.), restará
apenas outro tipo de erro devido ao procedimento empregado.
Este erro é chamado erro processual. No caso de um Censo, o erro
processual é zero, pois avaliamos um por um, todos os elementos componen-
tes da População.
Como o erro processual na avaliação é zero, a confiabilidade no parâ-
metro obtido é 100%. A precisão, no Censo é total.
Na estimação, como avaliamos apenas parte e não todos os elemen-
tos que compõem a população, admitimos um erro processual positivo na
avaliação do valor numérico e por conseqüência uma confiabilidade menor
que 100%, sendo, portanto, menos precisa que o Censo.
Como o número de elementos que compõem uma amostra é conside-
ravelmente menor que o número de elementos que compõem uma População,
a Estimação é sempre bem mais barata que o Censo, é concluída mais
rapidamente que o Censo e, portanto, mais atualizada.
14 Estatística 1

Se a maneira de avaliar um elemento é um teste destrutivo, o Censo


se torna um processo inviável, pois destruiria a população objeto do estudo.
Entretanto, na maioria das vezes em que o Censo é considerado inviá-
vel é por razões econômicas e de tempo.
Na sociedade moderna, a maioria dos problemas exigem decisões de
curto prazo. Por isso, as informações estatísticas úteis a resolução destes
problemas devem ser obtidas rapidamente.
Pela rapidez e facilidade da obtenção destas informações, a estimação
tem sido cada vez mais utilizada como procedimento estatístico.

1.4 Dados Estatísticos


Normalmente, no trabalho estatístico o pesquisador se vê obrigado a
lidar com grande quantidade de valores numéricos resultantes de um Censo
ou de uma estimação.
Estes valores numéricos são chamados dados estatisticos.
No sentido de disciplina, a Estatística ensina métodos racionais para a
obtenção de informações a respeito de um fenômeno coletivo, além de obter
conclusões válidas para o fenômeno e também permitir tomada de decisões,
através de dados estatisticos observados.
Desta forma, a estatística pode ser dividida em duas áreas:

a) Estatística Descritiva - é a parte da Estatística que tem por obje-


to descrever os dados observados.
b) Estatística Indutiva - é a parte da Estatística que tem por objetivo
obter e generalizar conclusões para a população a partir de uma
amostra, através do cálculo de probabilidade.
O cálculo de probabilidade é que viabiliza a inferência estatística.

1.5 Estatística Descritiva


A Estatística Descritiva, na sua função de descrição dos dados, tem as
seguintes atribuições:

a) A obtenção dos dados estatísticos.


b) A organização dos dados.
c) A redução dos dados.
d) A representação dos dados.
Conceitos Básicos 15

e) A obtenção de algumas informações que auxiliam a descrição do


fenômeno observado.

i A obtenção ou coleta de dados é normalmente feita através de


gm questionário ou de observação direta de uma população ou amostra.

i A organização dos dados consiste na ordenação e crítica quanto


a correção dos valores observados, falhas humanas, omissões, abandono de
dados duvidosos etc.

i Redução dos dados - O entendimento e compreensão de grande


quantidade de dados através da simples leitura de seus valores individuais é
uma tarefa extremamente árdua e difícil mesmo para o mais experimentado
pesquisador.
A Estatística descritiva apresenta duas formas básicas para a redução
do número de dados com os quais devemos trabalhar, chamadas variável
discreta e variável contínua.

i A representação dos dados - 0 s dados estatísticos podem ser


mais facilmente compreendidos quando apresentados através de uma repre-
sentação gráfica, o que permite uma visualização instantânea de todos os
dados.
Os gráficos, quando bem representativos, tornam-se importantes ins-
trumentos de trabalho.

É ainda atributo da Estatística Descritiva a obtenção de algumas infor-


mações como médias, proporções, dispersões, tendências, índices, taxas,
coeficientes, que facilitam a descrição dos fenômenos observados. Isto encer-
ra as atribuições da Estatística Descritiva.
Completando o processamento estatístico, no caso de uma Estimação,
a Estatística Indutiva estabelece parâmetros a partir de estimadores usando o
cálculo de probabilidade. Esta última etapa será desenvolvida posteriormente.

1.6 Dados Brutos


Quando fazemos n observações diretas em um fenômeno coletivo ou
observamos as respostas a uma pergunta em uma coleção de n questioná-
rios, obtemos uma sequência de n valores numéricos.
Tal sequência é denominada dados brutos.
16 Estatística 1

Representando por X a característica observada no fenômeno coletivo


ou na pergunta dos questionários, então x, representa o valor da característi-
ca obtida na primeira observação do fenômeno coletivo ou o valor da caracte-
rística observado no primeiro questionário; x2 representa o valor da caracterís-
tica X na segunda observação do fenômeno coletivo ou o valor da característi-
ca Xobservada no segundo questionário e assim sucessivamente.
Desta forma, os dados brutos podem ser representados por X: x,, x2,
x3, ..., X".
Esta sequência de valores assim obtida apresenta-se completamente
desordenada. De modo geral, podemos afirmar que:

Dados brutos é uma. sequência de valores numéri-


cos não organizados, obtidos diretamente da obser-
vação de um fenômeno coletivo.

1.7 Rol
Quando ordenamos na forma crescente ou decrescente, os Dados
Brutos passam a se chamar Rol.
Portanto:

Rol é uma sequência ordenada dos Dados Brutos.

Exemplo: No final do ano letivo, um aluno obteve as seguintes notas


bimestrais em Matemática: 4; 8; 7,5; 6,5.
Neste exemplo, X representa nota bimestral e pode ser apresentada
na forma:

X 4;, 8; 7,5; 6,5. (Dados Brutos)


OU

X 4; 6,5; 7,5; 8. (Rol)

OBSERVAÇÃO: Após uma atenta leitura desta parte inicial, o interessado


deve responder as seguintes questões:
Conceitos Básicos 17

1.8 Exercícios Propostos


'. O que é Estatística?
2. O que é População?
. O que é Amostra ?
. O que é Parâmetro?
5. O que é Estimador?
3. Quais são os processos estatísticos de abordagem para o estudo de um fenôme-
no coletivo?
: O que é Censo?
2. O que é Estimação?
3. Explique as propriedades principais do Censo.
' O . Explique as propriedades principais da Amostragem.
1. O que é Dado Estatístico?
'2. O que é Estatística Descritiva e quais são suas tarefas?
'3. O que é Estatística Indutiva?
' 4 . O que são Dados Brutos?
'5. O que é Rol?
'6. Construa o Rol para sequência de dados brutos:
a) X : 2 4, 12, 7, 8, 15, 21, 20.
b) Y:3, 5, 8, 5, 12, 14, 13, 12, 18.
c) Z: 12,2; 13,9; 14,7; 21,8; 12,2; 14,7.
d) W:8, 7,8, 7,8, 7, 9.

RESPOSTAS
?f Séries Estatis ficas

2.1 Apresentação de Dados Estatísticos


Quando lidamos com poucos valores numéricos, o trabalho estatístico
fica sensivelmente reduzido. No entanto, normalmente teremos que trabalhar
com grande quantidade de dados.
Um dos objetivos da Estatística Descritiva neste caso, é obter uma
significativa redução na quantidade de dados com os quais devemos operar
diretamente. Isto pode ser conseguido modificando-se a forma de apresenta-
ção destes dados.
Suponha que observamos as notas de 30 alunos em uma prova e
obtivemos os seguintes valores:

Se entendermos como frequência simples de um elemento o número


de vezes que este elemento figura no conjunto de dados, podemos reduzir
significativamente o número de elementos com os quais devemos trabalhar.
Para isto organiza-se o conjunto de dados na forma de uma série
estatística chamada variável discreta.

2.2 Distribuição de Frequência - Variável Discreta


É uma representação tabular de um conjunto de valores em que colo-
camos na primeira coluna em ordem crescente apenas os valores distintos
da série e na segunda coluna colocamos os valores das frequências simples
correspondentes.
Se usarmos f para representar frequência simples, a sequência (1)
pode ser representada pela tabela:
Séries Estatísticas 19

OBSERVAÇOES: (1) Note que a colocação de um índice i para x e para f


tem a finalidade de referência. Deste modo, x, repre-
senta o primeiro valor distinto da série, x2 representa o
segundo valor distinto da série, f, representa a fre-
quência simples do primeiro valor distinto da série, f2
representa a frequência simples do 2Qalor distinto da
série e assim sucessivamente.
(2) Note que conseguimos reduzir de 30 elementos que
constituíam a série original para apenas 12 elementos.
(3) Note também que a variável discreta só é uma forma
eficiente de redução dos dados, quando o número de
elementos distintos da série for pequeno.

Devemos optar por uma variável discreta na repre-


sentação de uma série de valores quando o número
de elementos distintos da série for pequeno.

2.3 Distribuição de Frequência - Variável Contínua


Suponha que a observação das notas de 30 alunos em uma prova nos
:3nduzisse aos seguintes valores:

Observando estes valores notamos grande número de elementos dis-


??tos, O que significa que neste caso a variável discreta não é aconselhável
- a redução de dados.
20 Estatística 1

Nesta situação é conveniente agrupar os dados por faixas de valores,


ficando a série com a seguinte apresentação:

Classe Notas fi
1 2 1 4 4
2 4 1 6 12
3 6 1 8 10
4 8 1 1O 4

Esta apresentação da série de valores é denominada variável contí-


nua.

Devemos optar por uma variável contínua na repre-


sentação de uma série de valores quando o número
de elementos distintos da série for grande.

2.4 Construção da Variável Discreta


A construção de uma variável discreta é bastante simples. Basta ob-
servar quais são os elementos distintos da sequência, ordená-los, e colocá-los
na primeira coluna da tabela. Em seguida computar a frequência simples de
cada elemento distinto e colocá-la na segunda coluna da tabela.
Exemplo de construção de uma variável discreta: A sequência abaixo
representa a observação do numero de acidentes por dia, em uma rodovia,
durante 20 dias.
x: 0,2,0,1,1,0,0,0,3,2
1,0,1,2,0,1,3,2,2,0.
Os valores distintos da sequência são: O, 1, 2, 3.
As frequências simples respectivas são: 8, 5, 5, 2.
Portanto, a variável discreta representativa desta sequência é:
Séries Estatísticas 21

.5 Construção da Variável Contínua


A construção da variável contínua requer o conhecimento de alguns
~nceitosque vamos estabelecer aproveitando a tabela abaixo como exempli-
:ação:

Classe Intervalo de fi
classe

1. AMPLITUDE TOTAL DE UMA SEQUÊNCIA é a diferença entre o


riaior e o menor elemento de uma sequência.
Representando a amplitude total por A,, o maior elemento da sequên-
cia Xpor XmA, e o menor elemento por Xmín,a amplitude total é denotada por:

No exemplo da sequência que deu origem a tabela (2), Xmáx = 9,5 e


Xmín = 2, portanto:

A amplitude total representa o comprimento total da sequência e é


dada na mesma unidade de medida dos dados da sequência.
2. INTERVALO DE CLASSE é qualquer subdivisão da amplitude to-
tal de uma série estatística.
No exemplo da tabela (2) subdividimos a amplitude total em quatro
classes, obtendo os intervalos de classe 2 1- 4, 4 1- 6, 6 1- 8, 8 1- 10.
Note que na realidade não trabalhamos com a At = 7,5 e sim com a
amplitude total ajustada para 8 como justificaremos adiante.
3. LIMITE DE CLASSE: cada intervalo de classe fica caracterizado
9or dois números reais. O menor valor é chamado limite inferior da classe e
será indicado por I. O maior valor é chamado limite superior da classe e será
Indicado por L. Por exemplo, na Classe 2 1- 4, I = 2 e L = 4.
22 Estatística 1

4. AMPLITUDE DO INTERVALO DE CLASSE é a diferença entre o


limite superior e o limite inferior da classe. Se usarmos h para representar a
amplitude do intervalo de classe podemos estabelecer:

OBSERVAÇOES: (1) Na realidade, as classes não precisam necessariamen-


te ter a mesma amplitude como no exemplo acima.
Porém, sempre que possível, devemos trabalhar com
classes de mesma-amplitude. Isto facilita sobremaneira
os cálculos posteriores.
(2) Note que usamos para representar as classes, interva-
los reais semiabertos a direita. Isto significa que o in-
tervalo contém o limite inferior, masnão contém o limi-
te superior, ou seja, o intervalo de classe 2 1- 4 con-
tém os valores reais maiores ou iguais a 2 e menores
que 4.
Desta forma, o último intervalo da série que é 8 1- 10
não contém o valor 10. É por isso que não utilizamos a
amplitude 7,5, pois se isto fosse feito, o limite superior
da última classe seria 9,5 e como o limite superior não
deve pertencer a classe, o elemento 9,5 da sequência
estatística original ficaria sem classificação.
Como vamos utilizar este critério, precisaremos ajustar
sempre o valor máximo da série ao definir a amplitude
total.
Outros critérios poderiam ser adotados como o interva-
. loreal semiaberto a esquerda ou mesmo o intervalo
real aberto, mas nenhum destes critérios é melhor que
o critério adotado.

5. NÚMERO DE CLASSES: o número de classes a ser utilizado


depende muito da experiência do pesquisador e das questões que ele preten-
de responder com a variável contínua.
Isto pode ser verificado facilmente pelo próprio interessado ao longo
desta exposição.
Para efeito de nossos exemplos, utilizaremos o critério da raiz para a
determinação do número de classes.
Séries Estatísticas 23

) CRITÉRIO DA RAIZ

Se a sequência estatística contém n elementos e se indicarmos por K


número de classes a ser utilizado, então pelo critério da raiz:

Como o número K de classes deve ser necessariamente um número


iteiro e como dificilmente 6, é um número inteiro, deixaremos como opção
ara o valor de K o valor inteiro mais próximo de fi,uma unidade a menos ou
mais que este valor.
. No exemplo da tabela (2),n = 30 e conseqüentemente k = 1130 =
,477, portanto o valor inteiro mais próximo de v% é 5. As opções para k
ntão são: 4 ou 5 ou 6.
A amplitude do intervalo de classe que designamos por h é determina-
da da seguinte forma:

8
o portanto h = - = 2.
4
observe que a opção por quatro classes, foi feita em função de um
valor de h mais fácil de se operar.
Se tivéssemos optado por cinco classes, o valor de h seria 8/5 = 1,6; se
véssemos optado por seis classes, o valor de h seria 8/6 = 1,3333...
Veja que o melhor valor para se trabalhar em cálculos é o h = 2. Foi
?or isto que optamos por quatro classes.
Conhecendo-se o valor Xmin= 2 e a amplitude de classe h = 2, conclui-
70s que o limite superior da primeira classe é 4. Portanto, a primeira classe é
r! intervalo 2 1- 4. O limite inferior da segunda classe é 4. Somando-se a
zrnplitude de classe obteremos 6. Portanto, a segunda classe é 4 1- 6. A
:srceira classe por analogia é 6 1- 8 e a quarta classe é 8 1- 10.
6. FREQUÊNCIASIMPLES DE UMA CLASSE fi: chama-se frequên-
::a simples de uma classe ao número de elementos da sequência que são
ai ores ou iguais ao limite inferior desta classe e menores que o limite supe-
-3r desta classe.
24 Estatística 1

No exemplo 2, a frequência simples da primeira classe é o número de


elementos da sequência que são maiores ou iguais a 2 e menores que 4.
Note que os valores da sequência nestas condições são os valores 3,
2,5, 2, 3,5.
Portanto, a frequência simples da primeira classe é 4.
Da mesma forma determinamos as frequências simples das demais
classes, completando o quadro representativo da variável contínua.
COMENTÁRIO: Existem outros critérios para a determinação do número de
classes, como por exemplo a fórmula de STURGES.

Segundo STURGES, O número K d e classes é dado por:

Para valores de n muito grandes, esta fórmula apresenta mais vanta-


gens que o critério da raiz, embora apresente o mesmo problema de aproxi-
mação do valor de K.
Como acreditamos que na prática a experiência do pesquisador é que
na verdade vai determinar o número de classes, optamos pelo método mais
simples que é o critério da Raiz.

EXEMPLO DE CONSTRUÇÃO DE UMA VARIÁVEL CONT~NUA


Um teste para aferir o Quociente de Inteligência em determinada clas-
se de alunos de uma Faculdade deu origem a sequência de valores

Para a construção da variável contínua, devemos determinar o número


de elementos da sequência. Verificamos que a sequência possui n = 70 ele-
mentos.
Séries Estatísticas 25

Pelo critério da raiz K = fi.No caso, K = .\170 = 8,37. O valor inteiro


iis próximo é 8. Portanto, temos opção para construir a variável contínua
m 7 ou 8 ou 9 classes.
O maior valor da sequência é,,X
, = 139 e o menor valor da sequên-
[ é Xmí, =61.
Portanto, a amplitude total da sequência é At = 139 - 61 = 78. No
tanto, sabemos que pelo fato de o critério adotado do intervalo de classe
. , ,X
r semi-aberto a direita, devemos ajustar o valor Se ajustássemos
'máx para 140, a amplitude ajustada passaria a ser At = 140 - 61 = 79. Este
!alar não é divisível de forma inteira nem por 7 nem por 8 e nem por 9, que
áo nossas opções de classes.
Nesta situação devemos ajustar Xmáxpara 141 obtendo a At = 141 -
31 = 80 que é divisível exatamente por 8, obtendo-se ama amplitude do
-itervalo de classe h dada por:

Observe que o ajuste do valor Xmáxfoi de duas unidades, passando de


'39 para 141.
A experiência do pesquisador, nesta situa~ão,o levaria a distribuir este
srro de duas unidades, iniciando a representação da série em 60 e terminan-
29 em 140. A amplitude total ajustada para a série é: At = 140 - 60 = 80.
O comprimento do intervalo de classe é h = 10 e o número de classes
iK = 8 .
Computando as frequências simples de cada classe, construímos a
:ariável contínua representativa desta série.

Classe Intervalo de fi
classe
1 60 1 70 1
2 70 1 80 5
3 80 1 90 6
4 90 1 1O0 10
5 100 1 110 12
6 110 1 120 19
7 120 1 130 14
8 130 1 140 3

A variável contínua é conceituada como uma representação tabular em


x e colocamos na primeira coluna os intervalos de classe e na segunda
zz~lunaos valores das frequências simples correspondentes.
26 Estatística 1

A coluna "classe" tem a finalidade apenas de facilitar a referência as


classes, não fazendo parte da variável contínua.
O quadro final tanto da variável discreta como da variável contínua
recebe o nome de distribuição de frequência.

2.6 Exercícios Propostos


1. Qual é o objetivo de agrupar os dados por frequência?
2. O que é uma variável discreta?
3. Qual é a característica de um conjunto de dados que indique o uso de uma
variável discreta ao se agrupar os dados por frequência?
4. O que é uma variável contínua?
5. Qual é a característica de um conjunto de dados que indique o uso de uma
variável contínua ao se agrupar os dados por frequência?
6, Uma pesquisa sobre a idade, em anos de uma classe de calouros de uma faculda-
de, revelou os seguintes valores:
18, 17, 18, 20, 21, 19, 20, 18, 17, 19
20, 18, 19, 18, 19, 21, 18, 19, 18, 18
19, 19, 21, 20, 17, 19, 19, 18, 18, 19
18,21, 18, 19, 19, 20, 19, 18, 19, 20
18, 19, 19, 18,20, 20, 18, 19, 18, 18
Agrupe, por frequência, estes dados.
7. Uma auditoria em uma grande empresa observou o valor de 50 notas fiscais
emitidas durante um mês. Esta amostra apresentou os seguintes valores em dóla-
res:
15.315,OO 23.440,OO 6.551,OO 13.253,OO 25.312,OO
35.780,OO 42.320,OO 34.782,OO 27.435,OO 17.661,OO
20.4 14,OO 23.3 13,OO 26.432,OO 30.5 15,OO 27.61O,O0
8.598,OO 12.417,OO 22.300,OO 25.400,OO 21.200,OO
16.820,OO 38.000,00 40.300,OO 15.800,OO 18.300,OO
21.780,OO 32.414,OO 32.000,OO 18.700,OO 19.600,00
22.540,OO 22.010,OO 30.000,OO 21.380,OO 24.780,OO
29.000,OO 30.400,OO 12.3 19,OO 36.728,OO 36.483,OO
27.312,OO 35.318,OO 18.620,OO 38.661,OO 40.681,OO
19.302,OO 23.300,OO 21.350,OO 28.412,OO 21.313,OO
Agrupe, por frequência, estes dados.
8. Uma empresa automobilística selecionou ao acaso, uma amostra de 40 revende-
dores autorizados em todo o Brasil e anotou em determinado mês o número dc
unidades adquiridas por estes revendedores. Obteve os seguintes dados:
Séries Estatísticas 27

10 15 25 21 6 23 15 21 26 32
9 14 19 20 32 18 16 26 24 20
7 18 17 28 35 22 19 39 18 21
15 18 22 20 25 28 30 16 12 20
Agrupe, por frequência, estes dados.
9. Uma indústria embala peças em caixas com 100 unidades. O controle de qualida-
de selecionou 48 caixas na linha de produção e anotou em cada caixa o número
de peças defeituosas. Obteve os seguintes dados:
2 0 0 4 3 0 0 1 0 0
1 1 2 1 1 1 1 1 1 0
o 0 3 0 0 0 2 0 0 1
1 2 0 2 0 0 0 0 0 0
o 0 0 0 0 0 1 0
Agrupe, por frequência, estes dados.
10. Um banco selecionou ao acaso 25 contas de pessoas físicas em uma agência, em
determinado dia, obtendo os seguintes saldos em dólares:
52.500,OO 18.300,OO 35.700,00 43.800,OO 22.150,OO
6.830,OO 3.250,OO 1 7.603,OO 35.600,OO 7.800,OO
16.323,OO 42.130,OO 27.606,OO 18.350,OO 12.521,OO
25.300,OO 3 1.452,OO 39.61O,O0 22.450,OO 7.380,OO
28.000,OO 21.000,OO 14.751,OO 39.512,OO 17.319,OO
Agrupe, por frequência, estes dados.

I (anos) Número de alunos


xi fl
17 3
18 18
19 17
20 8
21 4
.' Uma solução com uma margem de erro mínima é:

Classe Valor da nota US$ Número de notas


r,
1 6.551 ,O0 -1 11.661 ,O0 2
2 11.661 ,O0 - 1 16.771 ,O0 5
3 16.771 ,O0 - 1 21.881,O0 13
4 21 .E81,O0- 1 26.991,O0 1O
5 26.991,O0- 1 32.101 ,O0 9
6 32.1 O1 ,O0 - 1 37.211 ,O0 6
7 37.21 1 ,O0 - 1 42.321 ,O0 5
28 Estatística 1

A, = 42.320,OO - 6.55 1,00 = 35.769,OO


A, ajustada = 42.321.00 - 6.551,00 = 35.770,OO

8.
K = v%
t
7 A melhor opção para dividir 35.770 é 7

Uma solução com uma margem de erro mínima é:


* A = 5.110

Classe Número de carros Número de revendedores


f/

1 5-1 1o 3
2 10 - 1 15 3
3 15 - 1 20 12
4 20 -1 25 11
5 25 -1 30 6
6 30 -1 35 3
7 35 -1 40 2

A,=39-6=33
A,ajustada = 40 - 6 = 34, o que não é exatamente divisível por 6, nem por 7,nem por 8.
Ajustamos a amplitude para 40 - 5 = 35 para distribuir o erro. Assim, A, ajustada é 35.
Podemos optar por 5 ou por 7 classes. Obviamente, a melhor opção é por sete classes.

Número de peças Número de caixas


defeituosas por caixa fi
x/
O. 28
1 12
2 5
3 2
4 1

Classe Número de contas

3.249,,00 -I 15.562,OO
2 15.562,OO-I 27.875,OO 10
3 27.875,OO- 1 40.1 88,OO
4 40.188.00- 1 52.501 ,O0 3

A, ajustada 52.501 - 3.250 = 49.251, que não é divisível por forma inteira nem por 4, nem por 5 e nem
por 6. Neste caso, consideramos a A, ajustada 52.501 - 3.249, para distribuir o erro. Assim:
Séries Estatísticas 29

2.7 Distribuição de Frequências - Variável Discreta


Uma vez que o interessado tenha colocado os dados na forma de uma
distribuição de frequência, ele poderá rapidamente obter algumas informações
adicionais e úteis para a compreensão da série, se considerar os seguintes
conceitos:

2.7.1 FREQUÊNCIA RELATIVA DE UM ELEMENTO DA SÉRIE - f,

É a divisão da frequência simples deste elemento pelo número total de


elementos da série.

Exemplo: Considere a variável discreta:

O total de elementos desta série é 25. Portanto, a frequência relativa


30 primeiro elemento distinto da série, que é 2, vale:

A frequência relativa do segundo elemento distinto, que é 3, vale:

Da mesma forma determinamos a frequência relativa dos elementos


seguintes da série:
30 Estatística 1

Note que estes valores representam a participação percentual de cada


elemento distinto na série. Assim, podemos fazer a interpretação: 12% dos
valores da série são iguais a 2; 28% dos valores da série são iguais a 3; 32%
dos valores da série são iguais a 4; 24% dos valores da série são iguais a 6; e
4% dos valores da série são iguais a 7.

É a soma da frequência simples deste elementocom as frequências


simples dos elementos que o antecedem.

Desta forma, a frequência acumulada para os elementos 2, 3, 4, 6 e 7


valem respectivamente:

Estes valores podem ser interpretados da seguinte forma:


- 3 elementos componentes da série são valores menores ou iguais
a 2.
- 10 elementos componentes da série são valores menores ou iguais
a 3.
- 18 elementos componentes da série são valores menores ou iguais
a 4.
Séries Estatísticas 31

- 24 elementos componentes da série são valores menores ou iguais


a 6.
- 25 elementos componentes da série são valores menores ou iguais
a 7.

7.3 FREQUÊNCIA ACUMULADA RELATIVA DE UM ELEMENTO DA


SÉRIE - FR.
I

É a divisão da frequência acumulada deste elemento, pelo número


al de elementos da série:

Assim, a frequência acumulada relativa dos elementos 2, 3, 4, 6 e 7


Aem respectivamente:

Estes valores podem ser interpretados da seguinte forma:


- 12% dos valores da série são menores ou iguais a 2.
- 40% dos valores da série são menores ou iguais a 3.
- 72% dos valores da série são menores ou iguais a 4.
- 96% dos valores da série são menores ou iguais a 6.
- 100% dos valores da série são menores ou iguais a 7.

Quando acrescentamos estes valores a tabela original, esta passa a


:e chamar distribui~áode frequências. Para o exemplo estabelecido, a distri-
I - S o de frequências é:
32 Estatística 1

2.8 Distribuição de Frequências - Variável Contínua


No caso da variável contínua, pelo fato de termos utilizado intervalos
de classe, semi-aberto a direita, as interpretações são diferentes. Portanto,
redefiniremos estes tipos de frequência.

2.8.1 FREQDÊNCIA RELATIVA DE UMA CLASSE - f ,


I

É a divisão da frequência simples desta classe pelo número total de


elementos da série.

Exemplo: Considere a distribuição de frequência:

Classe Int. cl. fi


1 21 4 6
2 41 6 18
3 61 8 10
4 81 1O 6

O total de elementos desta série é 40.


Portanto, a frequência relativa da primeira classe é:
Séries Estatísticas 33

A frequência relativa da segunda classe é:

A frequência relativa da terceira classe é:

f3 10
f = - = - = 0,25 ou 25% e a frequência relativa da quarta classe
r3 n 40
é:

Observe que estes valores representam a participação percentual dos


elementos por classe. A interpretação para estes valores é:
- 15% dos valores da série são maiores ou iguais a 2 e menores que
4.
- 45% dos valores da série são maiores ou iguais a 4 e menores que
6.
- 25% dos valores da série são maiores ou iguais a 6 e menores que
8.
- 15% dos valores da série são maiores ou iguais a 8 e menores que
10.

2.8.2 FREQUÊNCIA ACUMULADA DE UMA CLASSE - Fj

É a soma da frequência simples desta classe com as frequências


simples das classes anteriores.

Desta forma, as frequências acumuladas para estas classes são:


34 Estatística 1

Estes valores podem ser interpretados da seguinte forma, lembrando


que são todos maiores ou iguais a 2.
- 6 elementos da série são valores menores que 4.
- 24 elementos da série são valores menores que 6.
- 34 elementos da série são valores menores que 8.
- 40 elementos da série são valores menores que 10.

2.8.3 FREQUÊNCIA ACUMULADA RELATIVA DE UMA CLASSE - FR.


I

É a divisão da frequência acumulada desta classe pelo número total de


elementos da série:

Deste modo, a frequência acumulada relativa para cada classe é:

Estes valores podem ser interpretados da seguinte forma, lembrando


que são todos maiores ou iguais a 2:
- 15% dos valores da série são menores que 4.
- 60% dos valores da série são menores que 6.
- 85% dos valores da série são menores que 8.
- 100% dos valores da série são menores que 10.
Quando acrescentamos estes valores a tabela original, esta passa a
se chamar distribui~ãode frequências. Para o exemplo estabelecido, a distri-
buição de frequências é:
Séries Estatísticas 35
~ - ~ p

Classe Int. cl. fi f


'i
% 5 F
Ri
%

1 2 1 4 6 15 6 15
2 4 1 6 18 45 24 60
3 6 1 8 10 25 34 85
4 8 1 10 6 15 40 1O0

Exercícios Propostos
O que é amplitude total de uma sequência de dados?
O que é limite inferior de uma classe?
O que é frequência simples de um elemento?
O que é frequência relativa de um elemento?
O que é frequência acumulada de um elemento?
O que é frequência acumulada relativa de um elemento?
O que é frequência simples de uma classe?
O que é frequência relativa de uma classe?
O que é frequência acumulada de uma classe?
O que é frequência acumulada relativa de uma classe?
Construa a distribuição de frequências para a série representativa da idade de 50
unos do primeiro ano de uma Faculdade.
idade (anos) Número de alunos
Xi fi
17 3
18 18
19 17
20 8
21 4

I --cprefe os valores colocados na 3Vinha da distribui~ãode frequências do


i--Yema anterior.
- -- 1molete o quadro.
--
36 Estatística 1

Número de Número
acidentes por dia de dias
xi fi
O 30
1 5
2 3
3 1
4 1

15. Interprete todos os valores da segunda linha da distribuição de frequências do


problema anterior.
16. Construa a distribuição de frequências para a série abaixo que representa uma
amostra dos salários de 25 funcionários selecionados em uma empresa.

Classe Salários US$ Número de funcionários


fi
1 1.000,00 -1 1.200,oo 2
2 1.200,OO-1 1.400,OO 6
3 1.400,OO - 1 1.600,OO 1O
4 1.600,OO- 1 1.800,OO 5
5 1.800,OO - 1 2.000,OO 2

17. Interprete os valores obtidos na quarta linha da distribuição de frequências do


problema anterior.
18. Construa a distribuição de frequências para a série abaixo que representa o saldo
de 25 contas de pessoas fíçicas em uma agência em determinado dia.

Classe Número de funcionlrios

o- I 10.000,00
10.000,00- 1 20.000,00
3 20.000,OO- 1 30.000,OO
4 30.000,OO- 1 40.000,OO 2

19. Interprete os valores da terceira linha da distribuição de frequências do problema


anterior.
20. Complete o quadro de distribuição de frequências.

Classe Int. cl. fi f, YO Fi FR %


1 6- 1 10 1
2 10- 1 14 25
3 14 -1 18 14
4 18 -1 22 90
5 22 -1 26 2
Séries Estatísticas 37

Idade (anos) Número de alunos frl % FI FRI %


xi fl
17 3 6 3 6
18 18 36 21 42
19 17 34 38 76
20 8 16 46 92
21 4 8 50 1O0

'2. Interpretações:
19 - Há alunos nesta classe com 19 anos.
17 - Há 17 alunos nesta classe com 19 anos.
34 - 34% dos alunos desta classe têm 19 anos.
38 - Nesta classe há 38 alunos com 19 anos ou menos.
76 - 76% dos alunos desta classe têm 19 anos ou menos.
'3.

Número de Número de dias frl % FI FRi %


acidentes fl
por dia: xl
-
O 30 75 30 75
1 5 12,5 35 87,5
2 3 73 38 95
3 I 2,s 39 97,5
4 1 2.5 40 1 O0
40
$5. Interpretações:
1 - Há dias em que ocorre um acidente por dia neste cruzamento.
5 - Em cinco dias dos 40 observados, ocorreu um acidente por dia.
12,5- 12,5% dos dias observados ocorreu um acidente por dia.
35 - Em 35 dias dos 40 observados ocorrereu um ou nenhum acidente por dia neste cruzamento.
87,5 - 87,5 % dos dias observados ocorreram um ou nenhum acidente por dia neste cruzamento.
'6.
Classe Salários US$ Número de frl % FI FRl %
funcionários
fi
1 1.000,OO- 1 1.200,OO 2 8 2 8
2 1.200,OO- 1 1.400,OO 6 24 8 32
3 1.400,OO- 1 1.600,OO 1O 40 18 72
4 1.600,OO- I 1.800,OO 5 20 23 92
5 1.800,OO- 1 2.000,OO 2 8 25 1O0
38 Estatística 1

17. Interpretações:
4 - Estamos enfocando na ordem crescente a quarta classe de salários desta empresa.
1.600,00 1- 1.800.00 - 0 s salários desta classe são maiores ou iguais a US$ 1.600,00e menores
que US$1.800,00.
5 - Há cinco funcionários com salários maiores ou iguais a US$ 1.600,00 e menores que US$
1.800,OO.
20 - 20% dos funcionários selecionados têm salários maiores ou iguais a US$1.600,00 e menores que
US$ 1.800,OO.
23 - Há 23 funcionários entre os selecionados com salários menores que US$1.800,00.
92 - 92% dos funcionários selecionados têm salários menores que US$ 1.800,OO.
18.
Classe Saldos US$ Número de fr, % FI FRi %
contas
f,

1 o-
I 1 o.ooo,oo 5 20 5 20
2 10.000,OO - 1 20.000,OO 1O 40 15 60
3 20.000,OO- 1 30.000,OO 8 32 23 92
4 30.000,OO- 1 40.000,OO 2 8 25 1O0

19. Interpretações:
3 - Estamos enfocando, na ordem crescente, a terceira faixa de saldos nas contas das pessoas físicas.
20.000,OO -
1 30.000,OO - Os valores desta faixa compreendem valores maiores ou iguais a US$
20.000,OO e menores que US$30.000,00.
8 - Há oito contas entre as pesquisadas com saldos maiores ou iguais a US$20.000,00 e menores
que US$30.000,00.
32 - 32% das contas pesquisadas têm saldos maiores ou iguais a US$20.000,00 e menores que US$
30.000,OO.
23 - Há 23 contas entre as pesquisadas com saldos menores que US$30.000,00.
92 - 92% das contas pesquisadas têm saldos menores que US$30.000,00.

Int. cl.

10 - 1
3 14 - 1 18 8 40
4 18- 1 22 4 20
5 22- 1 26 2 1O

2.10 Representação Gráfica de Séries Estatísticas


Existem muitas formas de se representar graficamente uma série es-
tatística.
Podemos citar entre elas: gráfico em linhas; em colunas; em barras, em
setores; em porcentagens complementares; gráficos polares; gráficos pictóri-
cos, cartogramas etc.
Séries Estatísticas 39

-10 entanto, a maioria deles são simplesmente gráficos de apresenta-


cão, que o interessado com pequeno esforço poderá facilmente compreender.
Nosso interesse estará completamente voltado para os gráficos de
análise da série estatística que são: Histograma, Polígono de frequência e a
curva polida de frequência.
Estas representações gráficas assumem aspectos diferenciados para
variável discreta e variável contínua.

É um conjunto de hastes, representadas em um sistema de coordena-


das cartesianas que tem por base os valores distintos da série (xi)e por altura,
valores proporcionais as frequências simples correspondentes destes elemen-
tos (fí).
Exemplo: Se considerarmos a série:

então o histograma assume a forma:

fi t
40 Estatística 1

É um conjunto de retângulos justapostos, representados em um siste-


ma de coordenadas cartesianas, cujas bases são os intervalos de classe e
cujas alturas são valores proporcionais as frequências simples corresponden-
tes.
Exemplo: Se considerarmos a série:

Classe Int. cl. f,.


1 o1 2 3
2 2 1 4 6
3 4 1 6 8
4 6 1 8 5
5 8 1 1O 2

então o histograma assume a forma:

'i f

i Observe que não colocamos o zero no eixo horizontal na origem


do sistema por uma questão de clareza da representação gráfica.
Deixamos, intencionalmente, um espaço igual a um intervalo de classe
no início e no final da representação gráfica.
Se considerarmos este espaçamento inicial e final como sendo classes
fictícias com frequência zero e unirmos os pontos médios das bases supe-
riores destes retângulos, obtemos uma nova figura chamada polígono de
frequência.
Séries Estatísticas 41

fi t

0 2 4 6 8 1 0 lnt. cl.

i Observe que a área do polígono de frequência é a mesma área do


-,i~tograma.
i Quando estamos lidando com um censo, o histograma representa
!;retamente a distribuição de frequência da população, mas quando estamos
dando com uma amostra, a histograma representa apenas a distribuição de
-equência da amostra e não da população.
No entanto, se imaginarmos o número n de elementos da amostra
iumentando progressivamente, o número de classes iria aumentando pro-
:ressivamente e a amplitude do intervalo de classe iria diminuindo, o que
-ansformaria o polígono de frequência praticamente em uma figura polida,
:+amada curva polida de frequência.
Esta figura nos dará uma noção da distribuição de frequência da popu-
3920.

0 2 4 6 8 1 0 lnt. cl.
42 Estatística 1

2.11 Exercícios Propostos


1. Conceitue histograma para uma variável discreta.
2. Conceitue histograma para uma variável contínua.
3. Quando a série representa uma amostra qual é o principal objetivo da construção
do histograma ?
4. Construa um histograma para a distribuição de frequência:

5. Construa um histograma para a série representativa da idade de 50 alunos do


primeiro ano de uma Faculdade:
Idade (anos) Número de alunos
Xl fl
17 3
18 18
19 17
20 8
21 4

6. Construa um histograma para a série representativa do número de acidentes por


dia observados em determinado cruzamento, durante 40 dias:
Número de Número de dias
acidentes por dia fi
Xl
O 30
1 5
2 3
3 1
4 1

7. Construa um histograma para a série representativa de uma amostra dos salários


de 25 funcionários selecionados em uma empresa.

Classe Salários US$ Número de funclon~rios


fl
1 1.000,oo - 1 1.200,oo 2
2 1.200,OO - 1 1.400,OO 6
3 1.400,OO - 1 1.600,OO 10
4 1.600,OO - 1 1.800,OO 5
5 1.800,OO - 1 2.000,OO 2

8. Construa o polígono de frequência para a distribuição do problema anterior.


Séries Estatísticas 43

Construa um histograma para a série representativa do saldo de 25 contas de


pessoas físicas em uma agência em determinado dia.

Classe Número de contas

o-
I 1o.ooo,oo
10.000,00- 1 20.000,00
20.000,OO- 1 30.000,OO
4 30.000,OO- 1 40.000,OO 2

- 7 Construa o polígono de frequência para a distribuição do problema anterior.


44 Estatística 1

I .ooo,oo I .200,00I .400,00I .600,00I .aoo,oo2.000,00 Salários

I.I oo,oo 1.300,oo1.500,oo1.700,oo1.900,oo Salários


Séries Estatísticas 45

o I o.ooo,oo 20.oo0,oo 30.000,OO 40.000,OO Saldos


3f Medidas de
Tendência Central

3.1 Introdução
No estudo de uma série estatística é conveniente o cálculo de algumas
medidas que a caracterizam.
Estas medidas, quando bem interpretadas, podem fornecer-nos infor-
mações muito valiosas com respeito a série estatística.
Em suma, podemos reduzi-la a alguns valores, cuja interpretação for-
nece-nos uma compreensão bastante precisa da série.
Um destes valores é a medida de tendência central.
É um valor intermediário da série, ou seja, um valor compreendido
entre o menor e o maior valor da série. É também um valor em torno do qual
os elementos da série estão distribuídos e a posiciona em relação ao eixo
horizontal.
Em resumo, a medida de tendência central procura estabelecer um
número no eixo horizontal em torno do qual a série se concentra.
As principais medidas de tendência central são: média, mediana e
moda.
No cálculo de várias medidas estatísticas, vamos utilizar somas de um
grande número de parcelas.
Para facilitar a representação destas somas, introduziremos o conceito
de somatório.

3.2 Somatório - Notação Sigma (C )


Quando queremos representar uma soma de n valores do tipo x, + x2
+ ... + x,,podemos codificá-la através da expressão:
Medidas de Tendência Central 47

1 ide:
X - é utilizada para representar as operações de adição entre as
parcelas.
xi - é a parcela genérica
A parcela genérica é obtida tomando-se os termos constantes em
-:das as parcelas, no caso x. Para representar a parte variável em cada
zsrcela, no caso os índices, utilizamos a letra i e indicamos a variação de i.
'do exemplo i varia, segundo números inteiros consecutivos de 1 até n.)
n
A expressão C xi deve ser lida "soma dos valores xi, para i varian-
) de 1 até n." i= 1
Para que uma soma possa ser representada por esta notação é funda-
~ e n t aque
l i assuma todos os valores inteiros consecutivos entre dois valores
2sdos. Assim, a soma:
4
X, + X2 + X4 # C Xi
i= 1
Exemplos:
48 Estatística 1

Da mesma forma que codificamos a soma através da notação Sigma,


podemos decodificar obtendo as parcelas componentes.
4
Para obter a primeira parcela da soma: C (3xJ
i= 2
basta substituir na parcela genérica 3x, a variável i pela valor indicado no
extremo inferior, i= 2.
A primeira parcela da soma é 3x2.
Para obter a segunda parcela, basta substituir na parcela genérica 3 x ,
a variável i por 3. A segunda parcela vale 3x3. A última parcela da soma é
obtida quando substituímos na parcela genérica 3xi o valor de ipor 4, que é o
valor indicado no extremo superior.
A última parcela é 3x4.
4
Portanto, C (3x> = 3x2 + 3x3 + 3x4.
i= 2
Exemplos:

3
3. C (x, 3 3
b) = (x, - b) + (x2 - b13 + (x3 - b13
, i= 1

Apesar de ser apenas um código e não uma operação, a notação


Sigma tem algumas propriedades que podem simplificar operações. Entre
elas destacamos:
Medidas de Tendência Central 49

1. O somatório de uma soma é a soma dos somatórios.

n
De fato, se desenvolvermos C (xi + yi)obtemos:
i= 1
n

2. O somatório de uma diferença é a diferença dos somatórios.

A demonstração é análoga a anterior.


3. O somatório do produto de uma constante por uma variável é
o produto da constante pelo somatório da variável.

n
Considerando a um número real qualquer e desenvolvendo ( a . x,),
obtemos: i= I
50 Estatística 1

n
C ( a . x i ) = ax, +ax2+ax3+ ... +axn =
i= 1 n
= a . (x1 + x 2 + x 3 + . . . + x n ) = a . C xi
i= 1
4, O somatório da divisão de uma variável por uma constante é a
divisão do somatório da variável pela constante.

n
De fato, desenvolvendo

Um caso particular da notação Sigma é a representação de uma soma


cujas parcelas são todas iguais.
Neste caso, as parcelas são constituídas por valores constantes e a
variável iserá utilizada apenas para estabelecer o número de parcelas.
O número de parcelas é determinado pela diferença entre o valor de i
indicado no extremo superior e o valor indicado no extremo inferior, adicionan-
do-se uma unidade.
Assim, a soma 15 + 15 + 15 + 15 pode ser representado por:
4 5 6
15 oupor C 15 o u x 15
i= 1 i= 2
--
i= 3
1 Notéque em todos os casos a diferença entre o valor de i indicado no
extremo superior e o valor de i indicado no extremo inferior, acrescida de uma
unidade conduz a 4, que é o número de parcelas.
I
Medidas de Tendência Central 51

Desta forma, 3 é constituída de (7 - 2) + 1 = 6 parcelas. Portan-


to: i= 2

Nas aplicações estatísticas estaremos sempre interessados na


i
soma de todos os valores da série. Portanto, i varia sempre de 1 a n e
conseqüentemente não precisaremos indicar na notação sigma a variação de i.
Desta forma, identificaremos:

Isto facilita a apresentação das fórmulas de cálculos.

3.3 Exercícios Propostos


I. Escreva na notação Sigma, as somas:
a) x l + x 2 + x 3 + x 4 + x 5
6) x 3 + x 4 + x 5 + x s
c) (x, + 2) + (x* + 2) + (x3 + 2)
d) (x,- 10)+(x2- 10)+(x3- 10)+(x4- 10)
e) (xI - 3)2 + (x2 - 312 + (x3- 3)'
(x,-15ff,+(x2-15ff2+(x3-15ff3
2. Escreva as parcelas da soma indicada.
52 Estatística 1

3. Calcule para a tabela abaixo, o valor numérico das somas indicadas:

I 4. Usando as propriedades do somatório, desenvolva:

5. Usando a tabela do problema 3, verifique que:


Medidas de Tendência Central 53

SESPOSTAS

3. a) C xi fi = 60 C xiC fi = 252. Portanto, xi fi # C xi fi

c) C 4 = 125 (C x$ = 441. Portanto, 4 + (Cxj2


54 Estatística 1

3.4 Médias
Do ponto de vista teórico, vários tipos de média podem ser calculados
para uma massa de dados.
Focalizaremos neste estudo as médias aritméticas geométricas e har-
mônicas.

3.4.1 MÉDIA ARITMETICA SIMPLES

Para uma sequência numérica X x,, x2, ......, x, a média aritmética


simples, que designaremos por X é definida por:

2+0+5+3
Exemplo: Se X 2, 0, 5, 3, então X=
- 4

Para uma sequência numérica X x,, x2: ......, xn afetados de pesos p,,
p2, ......., pn, respectivamente, a média aritmetica ponderada, que designare-
X,
mos por é definida por:

Exemplo: Se X: 2, 4, 5, com pesos 1, 3, 2 respectivamente, então:


Medidas de Tendência Central 55

3.4.3 MÉDIA GEOMÉTRICA SIMPLES

Para uma sequência numérica X xl, x2, ......, xn, a média geométrica
simples, que designaremos por %
é definida por:

Exemplo: Se X: 2, 4, 6, 9, então:

3.4.4 MÉDIA GEOMÉTRICA PONDERADA

Para uma sequência numérica X: xl,x2, ..., X, afetados de pesos pl,


c)2,..2 pn respectivamente, a média geométrica ponderada que designaremos
por Xg é definida por:

Exemplo: Se X: 1, 2,5 com pesos 3, 3, 1 respectivamente, então:

3.4.5 MÉDIA HARMONICA SIMPLES

Para uma sequência numérica de elementos não nulos X: x,, x2,..., x,,
a média harmônica simples, que designaremos por %,
é definida por:
Note que a média harmônica é o inverso da média aritmética dos
inversos dos elementos.
Exemplo: Se X: 2, 5 , 10, então:

3.4.6 MÉDIA HARMONICA PONDERADA

Para uma sequência numérica de elementos não nulos X: xl, x2,..., xn


afetados de pesos pl, p2,... p, respectivamente, a média harmônica pondera-
. .
da que designaremos por xh é definida por:
Medidas de Tendência Central 57

Exemplo: Se X: 2, 4, 12 com pesos 3, 2,2 respectivamente, então:

Observando-se que:

1. A média harmônica aplica-se naturalmente quando se quer a ob-


tenção de uma média cuja unidade de medida seja o inverso da
unidade de medida dos componentes da sequência original.
2. A média geométrica só é indicada para representar uma série de
valores aproximadamente em progressão geométrica.
3. Os casos anteriores não são muito frequentes nas aplicações. Va-
mos restringir o desenvolvimento de médias ao caso de média
aritmética, que é a média mais utilizada nas aplicações.

3.5 Cálculo da Média Aritmética


I

f T a s o- DADOS BRUTOS OU ROL

Neste caso, devemos utilizar uma média aritmética simples:

Exemplo: Calcule a média da variável X: 3, 5 , 8, 12, 7, 12, 15, 18, 20,

Interpretagão: O valor médio desta série é 12, ou seja, os valores


desta série concentram-se em torno do valor 12.
58 Estatística 1

2 T a s o - VARIÁVEL DISCRETA
Se os dados estão apresentados na forma de uma variável discreta,
utilizaremos a média aritmética ponderada, considerando as frequências sim-
ples fi como sendo as ponderações dos elementos xi correspondentes.
C x, P,
A fórmula de cálculo de Xque originalmente era 2 = 7 rn passa a
L ri
ser escrita como:

Exemplo: Determinar a média da distribuição:

Solução: Inicialmente devemos somar a coluna de frequências simples


para obter o número total de elementos da série: C fi = 10 elementos.
Em seguida, utilizamos a própria disposição da tabela para efetuar os
produtos xi f , acrescentando estes valores dispostos em uma nova coluna.
Em seguida somamos os valores desta coluna.

Na sequência substituímos estes valores na expressão Xobtendo:


Medidas de Tendência Central 59

Interpreta~ão:O valor médio da série é 5,6, isto é, 5,6 é o ponto de


::~centração dos valores da série.

F Caso - VARIÁVEL CONT~NUA

Se os dados estão apresentados na forma de uma variável continua,


-:-izaremos a média aritmética ponderada, considerando as frequências sim-
: ss das classes como sendo as ponderações dos pontos médios destas
:asses.
O ponto médio, de cada classe é definido por:

2 Xi Pi
A fórmula de cálculo de Rque originalmente era 2 = - passa a
s r escrita como: L Pi

Exemplo: Determinar a média da distribuição:

Classe Int. cl. fi


1 21 5 1
2 51 8 10
3 81 11 8
4 11 I 14 1

Solu~ão:Inicialmente, devemos somar a coluna das frequências sim-


ples, obtendo fj. = 20.
Na sequência, calculamos os pontos médios de classe: o ponto médio
da primeira classe é = 3,5; O ponto médio da segunda classe é
2
= 6,5; o ponto médio da terceira classe é = 9,5 e o ponto médio da
11+14 -
quarta classe é 2- - 12,5.
60 Estatística 1

Estes valores serão dispostos em uma nova coluna na tabela. Como


no caso anterior, usaremos a própria tabela para a sequência de cálculos.

Classe Int. cl. fi xi xi fi


1 21 5 1 3,5 3,5
2 51 8 10 6,5 65
3 81 11 8 9,5 76
4 11 I 14 1 12,5 12,5

- xj fi
Portanto, X = -- - 157 - 7,85
C fi 20

Interpretação: O valor médio desta série é 7,85, isto é, 7,85 é o valor


em torno do qual os elementos desta série se concentram.
COMENTÁRIO: Quando agrupamos os dados na disposição de uma
variável contínua, passamos a trabalhar com os dados sem conhecimento de
seus valores individuais.
Note no exemplo acima, que o máximo que podemos afirmar com
respeito ao menor valor desta série é que ele é um valor maior ou igual a 2 e
menor que 5. Mas não conhecemos seu valor individualizado.
O mesmo ocorre com todos os outros valores da série.
Este fato é que nos leva a substituir as classes pelos seus pontos
médios ao calcular a média da série.

3.6 Exercícios Propostos


1. Calcule a média aritmética da série:
(a)X: 1,2,8, 10, 12, 16,21,30.
(b) Y: 5, 6, 6, 10, 11, 11, 20.
(c) Z: 3,4; 7,8;9,23; 12,15.
2. Um produto é acondicionado em lotes contendo cada um deles 10 unidades. O
lote só é aprovado se apresentar um peso superior a 40 quilos.
Se as unidades que compõem determinado lote pesam: 3; 4; 3,5; 5,O; 3,5; 4; 5;
5,5; 4; 5, este lote será aprovado? Qual o peso médio do produto?
3. Calcule a média geométrica para as séries:
X: 1, 2, 4, 7, 16
Y: 81, 26, 10, 3, 1
Medidas de Tendência Central 61

2 Calcule a média harmônica da série:

I Um produto é vendido em três supermercados por $ 13,00/kg, $ 13,20/kg e $


13,50/kg. Determine quantos $/kg se paga em média pelo produto.
I Um produto é vendido em três supermercados por $ 130/kg, $ 132/kg e $ 135/kg.
Determine, em média quantos quilos do produto se compra com $1,00.
-
Calcule a média harmônica da série 130, 132, 135.
? Calcr~lea média aritmética da série:
I

. Calcule a média geométrica da série anterior.


' .: Calcule a média harmônica da série anterior.
- Verifique pelos cálculos anteriores qual relação é válida entre estas médias.

'2.Uma loja vende cinco produtos básicos A, B, C, D, E. O lucro por unidade comer-
cializada destes produtos vale respectivamente $200,00; $300,00; $500,00;
$ 1.000,OO; $ 5.000,OO. A loja vendeu em determinado mês 20; 30; 20; 10; 5
unidades respectivamente. Qual foi o lucro médio por unidade comercializada por
esta loja?
-3. Um caminhão cujo peso vazio é 3.000 kg será carregado com 480 caixas de 10 kg
cada, 350 caixas de 8 kg cada, 500 caixas de 4 kg cada e 800 caixas de 5 kg
cada. O motorista do caminhão pesa 80 kg e a lona de cobertura da carga pesa 50
kg. (a) Se este caminhão tem que passar por uma balança que só permite passa-
gens a caminhões com peso máximo de 15 toneladas, este caminhão passará
pela balança? (b) Qual o peso médio das caixas carregadas no caminhão?
1
I
'2. Calcule a idade média dos alunos de uma classe de primeiro ano de determinada
Faculdade, em anos.
7-

62 Estatística 1

Idade (anos) NQde alunos


Xl fl
17 3
18 18
19 17
20 8
21 4

15. Calcule o número médio de acidentes por dia em uma determinada esquina.

N q e acidentes NQde dias


por dia: x, fr
O 30
1 5
2 3
3 1
4 1

16. O salário de 40 funcionários de um escritório está distribuído segundo o quadro


abaixo. Calcule o salário médio destes funcionários.
Classe Salários $ NQde funcionhrios
r,
1 400,OO -1 500,OO 12
2 500,OO - 1 600,OO 15
3 600,OO- 1 700,OO 8
4 700,OO -1 800,OO 3
5 800,OO -1 900,OO 1
6 900,OO -1 1.000,OO 1

17. Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro


abaixo:

Classe Aluguel $ NQde casas


fl
1 O- I 200,OO 30
2 200,OO -1 400,OO 52
3 400,OO -1 600,OO 28
4 600,OO- 1 800,OO 7
5 800,OO -1 1 .OOO,OO 3

Calcule o aluguel,médiopara estas residências.


18. Uma empresa de aviação observou em seus registros recentes, o tempo de mão-
de-obra gasto na revisão completa de um motor de jato.
O seguinte quadro foi obtido:
Classe Tempo de mão-de-obra No de motores
(horas) f~
1 o-
I 4 1
2 4 -1 8 5
3 8 -I 12 1O
4 12- 1 16 12
5 16 -1 20 4
Medidas de Tendência Central 63

a) Determine o número médio de horas de mão-de-obra necessário para a revi-


são de cada motor.
b) Com base nesta informação, qual deve ser o tempo total de mão-de-obra para
a revisão de dez motores que aguardam revisão?
c) Se a empresa dispõe no momento de dois homens trabalhando 12 horas por
dia nestas revisões conseguirá provavelmente revisar estes dez motores em
quatro dias?
?. Uma empresa de âmbito nacional, fornecedora de supermercados, fez um levanta-
mento do consumo de seu principal produto em vários supermercados obtendo em
determinado mês, a tabela:
Classe Número de unidades No de supermercados
consumidas fi
1 O-I 1.000 1o
2 1.000 - 1 2.000 50
3 2.000 - 1 3.000 200
4 3.000 -1 4.000 320
5 4.000 -1 5.000 150
6 5.000 -I 6.000 30

Determine o consumo médio deste produto'por supermercado pesquisado.


13. Uma pesquisa para determinar a eficiência de uma nova ração para animais, em
termos de ganho de peso, mostrou que após um mês em que a ração normal foi
substituída pela nova ração, os animais apresentaram um aumento de peso se-
gundo a tabela:
Classe Aumento de peso Ngde animais
em kg fi
1 o -1 1 1
2 1- I 2 5
2 -I 3 35
3 -1 4 37
4 -1 5 28

a) Calcular o aumento médio de peso por animal.


b) Se a ração antiga proporcionava em iguais circunstâncias um aumento médio
de peso de 3.100 kg/animal, esta nova ração pode a princípio ser considerada
mais eficiente?
1'. Refaça o problema anterior acrescentando a todos os limites de classe mais 2 kg.
Compare a média com a média anterior,

1 -
=xercicios Especiais
2. Prove que se X: x,, x2,,.., xn e a E R, então x + a = X+ a
13. Prove que se X: x,, x2,..., xn e a E R, então x - a = x- a
= a.F
22. Prove que se X: x,, x2,..., xn e a E R, então CX
25. Prove que se X: x,, x2,..., xn , a E R e a # 0, então = 'Ya
64 Estatística 1

n
26. Mostre que a média geométrica simples X9 = 4x, x2 ... xn também pode ser
calculada por
Z ln x
- -
n
i

X = e
9 C fi
27. Mostre que a média geométrica ponderada kg= 4x, 1' x,% ... xnfn também
pode ser calculada por:
Z (f, ln X )
-
X = e "'i
9 z xifi
28. Mostre que a média ponderada 2 = -pode também ser calculada no caso
de uma variável continua pela fórmula: fi '

onde: xo é o ponto médio de classe de uma classe qualquer escolhida.


I
ai são valores de uma nova variável obtidos pela transformação ai = -
h
Esta fórmula é chamada Processo Breve do Cálculo da Média.
29. Calcule a média da tabela do problema 16, usando o Processo Breve.
30. Calcule a média da tabela do problema 17, usando o Processo Breve.

RESPOSTAS
1. a) 12,5 b) 9,857 c) 8,145
2. Sim. = 4,25
3. a) 3,8946 b) 9,1225
4. a) 9,6 b) 3,36
5. 13,33/kg
6. O,0075585 kg/$
7. 132,3015kg
8. 3,6
9. 3,478
1O. 3,352
17. d
12. 682,35/peça
13. a) Não b) 6,385 kg
14. 18,84 anos/aluno
15. 0,45 ac/dia
16. $572,5/f
17. $335/res
18. a)11,625h b) 116,25h C) não
19. 3.342,l unid.
20. a) 3.37 7 kg b) Sim.
21. a) 5,311 kg. A m6dia da nova série é a média da série antiga acrescida de duas unidades.
b) Sim.
Medidas de Tendência Central 65

- -L xi + -na
-
C xi
=-+a=F+a
n n n

Da mesma forma demonstram-se, usando propriedades do somatório, os próximos exercícios.

- n
X = 4 xl 3 ... x, . Portanto,
- 1
In Xg = In (x, 3 ... x,) n. Usando as propriedades do logaritmo:

ln Xg = -1n (ln x,+In % + . . . + h x,)


- Clnxi
I n X =-
n
. Aplicando a operação antilogaritmo, obtemos:

--. x9 =
- C'i
... xntn . portanto,
4 x, '1 3%
-
ln Xg = ln (x,1' $5 ... x,'n)q . Usando as propriedades do logaritmo:
- 1 f
ln X = - ln( x l f i ~...
5 x,n) =
g C'i
- 1
In X g = - ( I n
f f
x , l + I n x22+ ...+ Inx,'n)=
C 'i
- 1
ln X =
g Cf,
-
(f, In x, f, + In x2 + ... + f, ln x,) =

- CfiInxj
I n X =-. Aplicando a operação antilogaritmo obtemos:
g C'i

- Z a,5 xj - xo
23. X = xo + - . h . Como q = - , substituindo-se, obtém-se:
L r; h
1
- [ h f x O C ~ +h- C ( x j - x J f , h
X=xo+ .h =
Cf, Cf,
66 Estatística 1

3.7 Mediana
É um valor real que separa o rol em duas partes deixando a sua
esquerda o mesmo número de elementos que a sua direita. Portanto, a me-
diana é um valor que ocupa a posição central em uma série.
Notação: A mediana será denotada por md

3.8 Cálculo da Mediana


1" Caso - DADOS BRUTOS OU ROL
Inicialmente devemos ordenar os elementos caso sejam dados bru-
tos, obtendo o Rol.
Em seguida determinamos o número n de elementos do Rol.

1.1. Se n é impar - O Rol admite apenas um termo central que


ocupa a posição "
mediana.
( 7 '1
Y 0 valor do elemento que ocupa esta posição é a
+

Exemplo: Determinar a mediana do conjunto:

Solução: Ordenando estes elementos obtemos o rol. X: 2, 8, 12, 12,


20, 20,23.
O número de elementos é n = 7 (ímpar), a posição do termo central é
[F]
0 = 40.

A mediana é o quarto elemento do Rol: md = 12.


O valor 12 deixa a sua esquerda e à sua direita o mesmo número de
elementos, sendo, portanto, o elemento central da série.
Quando lidamos com sériss com urn grailde número de elementos, a
quantidade de elementos à esquerda é â direita é aproximadamente 50% do
total de elementos, o que conduz a veguinie interpreta~ãogenérica para a
mediana: "50% dos valores da série são valores menores ou iguais a 12 e
50% dçzs valores da série são valor?s maiores ou iguais a 12".

1.2. Se n é par - Neste caso, o rol admite dois termos centrais que
ocupam as posições ("/2)O e ("/2 + l)O. A mediana é convencionada como
sendo a média dos valores que ocupam estas posições centrais.
Medidas de Tendência Central 67.

Exemplo: Determinar a mediana da série:


X:7, 21, 13, 15, 10, 8, 9, 13.
Solução: Ordenando estes elementos, obtemos o rol: X 7, 8, 9, 10, 13,
-3,15,21:
O número de elementos é n = 8 (par).
As posições dos termos centrais são: (8/2)" 44"e (8/2 + 1)" s5"
O elemento que ocupa a quarta posição na série é 10 e o elemento
z.ie ocupa a quinta posição é 13. Portanto,

Interpretação: 50% dos valores do rol são valores menores ou iguais a


-:
,5 e 50% dos valores do rol são valores maiores ou iguais a 11,5.

P Caso - VARIÁVEL DISCRETA

Se os dados estão apresentados na forma de uma variável discreta,


5'ss já estão naturalmente ordenados.
Assim, basta verificar se o número de elementos da série é ímpar ou
i z r e aplicar o mesmo raciocínio do caso anterior.
Para facilitar a localização dos termos centrais, construímos a frequên-
s acumulada da série.
Exemplo 1: Determinar a mediana da série:

Solução: O número de elementos da série é n = C fi = 23 (ímpar).


Portanto, a série admite apenas um termo central que ocupa a posição
3 4 1 o
-)- = 129.
2
Construindo a frequência acumulada podemos localizar com facilidade
:décimo segundo elemento da série.
68 Estatística 1

Note que o elemento que ocupa a primeira posição na série é 2. Em


seguida aparecem quatro elementos iguais a 5. Estes elementos ocupam na
série as posições de segundo a quinto. Depois aparecem mais dez elementos
iguais a 8 que ocupam na série as posições de sexto a décimo quinto.
Conseqüentemente, o elemento que ocupa a décima segunda posição
vale 8, e podemos afirmar que md= 8.
Interpretação: 50% dos valores da série são menores'ou iguais a 8 e
50% dos valores da série são maiores ou iguais a 8.

Exemplo 2: Calcular a mediana da série:

Solução: O número de elementos da série é 32 (par) e a série admite


dois termos centrais que ocupam as posições: (32/2)" leO e (32/2 + l)o = 17°..
Para localizar estes elementos, construímos a frequência acumulada da série.
Medidas de Tendência Central 69

As três primeiras posições da série são ocupadas por elementos iguais


2 3.
Da quarta a oitava posição os elementos são iguais a 1. Da nona a
:+cima sexta posição os elementos são iguais a 2. Da décima sétima a
- lésima sexta posição os elementos valem 3.

Portanto, o elemento que ocupa a décima sexta posição é 2 e o ele-


-rnto que ocupa a décima sétima posição é 3 e, consequentemente, a me-
: m a é:

Interpreta@o: 50% dos valores da série são valoreqmenores ou iguais


i e 50% dos valores da série são valores maiores ou i&ais a 2,5.

F Caso - VARIÁVEL CONT~NUA


Se a dados são apresentados na forma de uma variável contínua, o
~ciocínioanterior não pode ser utilizado, uma vez que mesmo identificada a
zzsição da mediana na série, o valor do elemento da série que ocupa esta
i x i ç ã o não é identificável.
Utilizaremos um exemplo, para generalizar a fórmula de cálculo da
-ediana.
Considere a distribuição de frequência:

Classe Int. cl. fj


1 31 6 2
2 61 9 5
3 91 12 8
4 12 1 15 3
5 15 1 18 1

O número de elementos da série é n = Ç fí = 19.


A mediana, por definição, separa o número de elementos da série em
dois grupos, contendo cada um deles 50% dos elementos.
Portanto, a posição da mediana na série é "/2. No exemplo (I%)" 9,5".,
O valor decimal 9,5 indica que a mediana é um elemento posicionado
rntre o nono e o décimo elemento da série.
70 Estatística 1

Construiremos a frequência acumulada para identificar em qual classe


estão situados o nono e o décimo elemento da série.

Classe Int. cl. fi fA


1 3 1 6 2 2
2 6 1 9 5 7
3 9 1 12 8 15
4 12 1 15 3 18
5 15 1 18 1 19

Note que o nono e o décimo elementos estão posicionados na terceira


classe, o que indica que a mediana é um valor compreendido entre 9 e 12. A
classe que contém a mediana será identificada como classe mediana.
Este intervalo de três unidades contém oito elementos. Supondo que
eles estão uniformemente distribuídos neste intervalo, então poderemos dividir
este intervalo de modo proporcional a posição da mediana na série.

15- 7 9,5-7
Ou seja: -- -
3 X
. Simplificando:

Portanto:
md=9+x

Observando na fórmula em destaque acima que:


- 9 é o limite inferior da classe mediana.
- 9,5 é a metade dos elementos da série, isto é, "/2.
- 7 é a frequência acumulada da classe anterior a classe mediana.
- 8 é a frequência simples da classe mediana.
Medidas de Tendência Central 71

- 3 é a amplitude do intervalo de classe, poderemos generalizar a


fórmula de cálculo da mediana para variável contínua:

- limite inferior da classe mediana.


Im,
n - número de elementos da série.
Fant- Frequência acumulada da classe anterior a classe mediana.
- frequência simples da classe mediana.
fmd
h - amplitude do intervalo de classe.

COMENTÁRIO: Devido as condições impostas na obtenção da fórmu-


a da mediana, fica evidente que o valor obtido pela fórmula é um valor
zproximado do verdadeiro valor da mediana da série.
De modo geral, todas as medidas calculadas para uma variável contí-
l u a serão valores aproximados para estas medidas, uma vez que ao agrupar-
70s os dados segundo uma variável contínua, há perda de informações quan-
:3 a identidade dos dados.

3.9 Exercícios Propostos


. Calcule a mediana da sequência:
a) X:2,5,8, 10, 12, 15,8,5, 12
b) Y:3,4;5,2;4,7;6;8,4;9,3;2,1;4,8
2. Interprete os valores obtidos no exercício anterior.
3. Calcule a mediana da distribuição.
72 Estatística 1

4. Calcule a mediana da distribuição do número de acidentes por dia, observados em


determinado cruzamento, durante 40 dias.

por dia de dias

4 1

5. Interprete o valor da mediana obtida no problema anterior:


6. Calcule a mediana para a série representativa da idade de 50 alunos de uma
classe do primeiro ano de uma Faculdade.

7. Inferprete o valor obtido para a mediana no problema anterior.


8. Uma máquina produz peças que são embaladas em caixas contendo 48 unidades.
Uma pesquisa realizada com 59 caixas, revelou a existência de peças defeituosas
seguindo a tabela:

NQde peças Número de


defeituosas caixas
por caixa
o 20
1 15
2 12
3 6
4 4
5 2

Determine o valor mediano da série.


9. Interprete o valor obtido no problema anterior.
10. Determine o valor mediano da distribuição a seguir que representa os salários de
25 funcionários selecionados em uma empresa.
I

0
Medidas de Tendência Central 73

Classe Salários $ NP de funcionários


1 .ooo,oo- 1 1.200,oo
1.200,OO- 1
1.400,OO 1.400,OO
1.600,OO 10

4 1.600,OO- 1 1.800,OO 5
5 1.800,OO- 1 2.000,OO 2

'. Interprete o valor mediano obtido no problema anterior.


'

-2. Uma loja de departamentos, selecionou um grupo de 54 notas fiscais, durante um


dia, e obteve o seguinte quadro:

Classe Consumo por nota $ No de notas


1 O- I 50 1O
2 50- 1 1O0 28
3 100- 1 150 12
4 150- 1 200 2
5 200- 1 250 1
6 250- 1 300 1

Determine o valor mediano da série.


- 3. Interprete o valor obtido.
-4O departamento de recursos humanos de uma empresa, tendo em vista o aumen-
to de produtividade de seus vendedores, resolveu, premiar com um aumento de
5% no salário, a metade de seus vendedores mais eficientes. Para isto, fez um
levantamento de vendas semanais, por vendedor, obtendo a tabela:

Classe Vendas $ NP de vendedores


10.000
10.000- 1 20.000
3 20.000- 1 30.000 27
4 30.000- 1 40.000 31
5 40.000 -1 50.000 1O

A partir de qual volume de vendas o vendedor será premiado?


- 2-. O consumo de energia elétrica verificado em 250 residências de famílias da classe
média, com dois filhos, revelou a distribuição:

Classe Consumo kwh NQde familias


1 O- I 50 2
2 50- 1 1O0 15
3 100- 1 150 32
4 150- 1 200 47
5 200- 1 250 50
6 250 -1 300 80
7 300- 1 350 24

Calcule a mediana da distribuição.


' 3. Interprete o valor obtido.
74 Estatística 1

RESPOSTAS
1. a)m,=8 b)m,=5
2. a) 50% dos valores da série são menores ou iguais a 8 e 50% são valores maiores ou iguais a 8.
b) 50% dos valores da série são menores ou iguais a 5 e 50% dos valores da série são maiores ou
iguais a 5.
3. m, = 5.
4. md= O
5. Em 50% dos dias observados não ocorreu acidente e em 50% dos dias observados ocorre O ou mais
acidentes por dia.
6. md=19.
7. 50% dos alunos desta sala tem 19 anos ou menos e 50% têm 79 anos ou mais.

9. 50% das caixas contêm uma ou nenhuma peça defeituosa e 50% contêm uma ou mais peças defeitu-
osas.
10. m d = $ 1.490.
11. 50% dos funcionários desta empresa recebem $1.490 ou menos e 50% recebem $1.490 ou mais.
12. m, = $80,36.
13. 50% das notas apresentavam consumo menor ou igual a $ 80, 36 e 50% apresentavam consumo
maior ou igual a $80,36.
14. md=$30.161,29
15. md= 229 Kwh.
16. 50% das residências da classe m6dia com dois filhos consomem 229 kwh ou menos e 50% consomem
229 kwh ou mais.

3.10 Moda
É o valor de maior frequência em um conjunto de dados.
Nota~ão:A moda será denotada por m,.

3.11 Cálculo da Moda


1" Caso - DADOS BRUTOS OU ROL

Basta identificar o elemento de maior frequência.


Exemplos:
1. X:2,8,3,5,4,5,3,5,5,1
O elemento de maior frequência é 5. Portanto, m, 5. É uma sequência
unimodal.
Medidas de Tendência Central 75

Esta sequência apresenta o elemento 6 e o elemento 10 como ele-


- o ~ t o sde maior frequência. Portanto, mo = 6 e mo = 10. É uma sequência
: -odal.
Poderemos encontrar sequências trimodais, tetramodais e assim 'su-
-,=sivamente. Estas sequências serão chamadas de forma genérica por se-
--e

::3ncias polimodais.

Observe que todos os elementos da série apresentam a mesma fre-


113ncia.
Nesta situação, não há um elemento que se destaque pela maior
--lquência, e diremos que a série é amodal.

P Caso - VARIÁVEL DISCRETA


Este caso é ainda mais simples. Note que na apresentação da variável
1 screta, as frequências já estão computadas na segunda coluna. Basta identi-
' x r o elemento de maior frequência.
Exemplos:

A maior frequência observada na segunda coluna é 8 e corresponde


20 elemento 3 da série. Portanto é, uma série unimodal com mo = 3.
2.
76 Estatística 1

A maior frequência observada na segunda coluna é 5 e corresponde


aos valores 2 e 4. Portanto, é uma série bimodal com mo = 2 e mo= 4.

Observe que todos os elementos da série possuem a mesma frequên-


cia. Portanto, a série é amodal.

Para determinar a moda de uma variável contínua, podemos optar por


vários processos. Daremos destaque para a moda de Pearson, a moda de
King e a moda de Czuber.

1" Processo: MODA DE PEARSON

Segundo PEARSON, a moda de uma variável contínua pode ser obtida


através do valor da média e da mediana:

Classe Int. cl. fj


1 o1 1o 1
2 10 1 20 3
3 20 1 30 6
4 30 1 40 2
Medidas de Tendência Central 77

Solupão:
Cálculo da média:

Classe Int. cl. fi xi xi fj


1 0 1 10 1 5 5
2 10 1 20 3 15 45
3 20 1 30 6 25 150
4 30 1 40 2 35 70

Cálculo da mediana:

Classe Int. cl. fi Fi


1 o1 10 1 1
2 10 1 20 3 4
3 20 1 30 6 1O
4 30 1 40 2 12

A mediana corresponde ao sexto elemento da série. o sexto elemento


i a série está na terceira classe. Esta é a classe mediana. A mediana vale:
78 Estatística 1

Conseqüentemente:

Note que a moda está situada na terceira classe que é a classe de


maior frequência da série.
A classe de maior frequência será chamada de classe modal.

2" Processo: MODA DE KING


KING levou em consideração, em sua fórmula, a frequência simples da
classe anterior e a frequência simples da classe posterior a classe modal.

onde:
Imo - limite inferior da classe modal.
fpost- frequência simples da classe posterior a classe modal.
fant - frequência simples da classe anterior a classe modal.
h - amplitude do intervalo de classe.
Exemplo: Calcule a moda de King para a distribuição:

Classe Int. cl. fj


1 o1 1o 1
2 10 1 20 3
3 20 1 30 6
4 30 1 40 2

Solução: A classe modal é a de maior frequência portanto é a terceira


classe e a moda vale:
2
mo = 20 +
-. I 0 = 24
3+2
~ Interpretação:24 é o valor mais frequente nesta distribuição.
Medidas de Tendência Central 79

3"Processo: MODA DE CZUBER


CZUBER levou em consideração, em sua fórmula a frequência simples
da classe anterior, a frequência simples da classe posterior, além da frequên-
cia simples da classe modal.
É, portanto, uma fórmula mais completa que a fórmula de King.

onde:
Imo - limite inferior da classe modal.
fmo - frequência simples da classe modal.
fant - frequência simples da classe anterior a classe modal.
fpost - frequência simples da classe posterior a classe modal.
h - amplitude do intervalo de classe.

Exemplo: Calcule a moda de Czuber para a distribuição:

Classe Int. cl. fj


1 o1 10 1
2 10 1 20 3
3 20 1 30 6
4 30 1 40 2

Soluqão: A classe modal é a terceira classe, portanto, a moda vale:

Interpreta~áo:24,29 é o valor mais frequente nesta distribuição.

COMENTÁRIO: A fórmula de Pearson tem normalmente interesse teó-


rico. Se não dispusermos da média e da mediana da distribuição, a fórmula de
Pearson é a mais trabalhosa.
A fórmula de King é a mais simples delas, mas não é a mais precisa.
A fórmula de Czuber é mais precisa que a fórmula de King, pois leva
também em consideração a frequência da classe modal.
80 Estatística 1

Observe que no exemplo utilizado o cálculo da moda pelos três pro-


cessos determinou três valores diferentes.
É claro que os três valores obtidos são valores aproximados do verda-
deiro valor da moda.
Normalmente o mais confiável é o valor da moda de Czuber.
As fórmulas de King e Czuber podem ser justificadas, de modo seme-
lhante, com o histograma da distribuição.

a) Fórmula de King

Identifica-se a classe modal como sendo a de maior altura (frequência)


e caracteriza-se a seu limite inferior I e seu limite superior L
mo mo'
Projeta-se a frequência da classe posterior na reta representativa da
frequência da classe anterior obtendo-se o ponto A. Em seguida projeta-se a
partir do L no sentido vertical, uma distância igual a frequência da classe
mo'
anterior obtendo o ponto B.

O segmento de reta unindo os pontos A e B intercepta o eixo horizontal


no-pontoP, que identifica-se como sendo a moda da distribuição.
A amplitude do intervalo de classe é h e está dividida em duas partes.
Se chamarmos a prime.iraparte de x, então a segunda parte será h - x.
Medidas de Tendência Central 81

Assim, observando a figura concluímos que:

Como os triângulos ACP e PDB são semelhantes (A, A, A), os lados


530 proporcionais.

Então,

AC -
X
DB h- x'

Usando propriedade das proporções, podemos afirmar:

de onde conclui-se que:

Lembrando que AC = fpOst e que DB = Gnt,obtém-se

fpoçt
X = .h
fant + fpoçt

Substituindo o valor de x na expressão mo=I + x obtém-se:


mo
82 Estatística 1

Imo M Lmo Int. cl.

Identifica-se a classe modal e caracteriza-se o seu limite inferior I e o


mo
seu limite superior L .
mn
Unindo-se os pontos A e D e os pontos B e C, os segmentos de reta
determinados se interceptam no ponto P.
Em seguida projeta-se verticalmente este ponto no eixo horizontal ob-
tendo o ponto M, que identifica-se como sendo a moda da distribuição.
A amplitude do intervalo de classe é h e está dividida em duas partes.
Se chamarmos a primeira parte de x, então a segunda parte será h - x.
Estes valores correspondem as alturas dos triângulos ABP e CDP
respectivamente. *
Como estes triângulos são semelhantes (A, A, A), os lados e as alturas
são proporcionais. Então:

AB -
X
CD h- x'

Usando a propriedade das proporções, podemos afirmar:


Medidas de Tendência Central 83

1 3 onde se conclui que:

Lembrando que AB = A E - BE = f - fant e que CD = CF - DF =


- fp, , obtém-se: mo

I
fmo - fant mo
- fant
I
x = h = .h
fmo - fant+ fmo - fpost *fmo - ( h n t + $os>

Como a moda é identificada como sendo o ponto M da figura, pode-


rios afirmar que:

Substituindo o valor de x obtido anteriormente nesta expressão, a


moda fica escrita:

m = I,
fmo - (fant + fpost)

OBSERVAÇÃO: Se a classe modal for a primeira classe, então fant= O


e se a classe modal for a última então fpost = 0.

3.12 Utilização das Medidas de Tendência Central


Na maioria das situações, não necessitamos calcular as três medidas
de tendência central.
Normalmente precisamos de apenas uma das medidas para caracteri-
zar o centro da série.
Surge, então, a questão: qual medida deve ser utilizada?
84 Estatística 1

A medida ideal em cada caso é aquela que melhor representa a maio-


ria dos dados da série.
Quando todos os dados de uma série estatística são iguais, a média, a
mediana e a moda coincidirão com este valor e, portanto qualquer uma delas
representará bem a série. No entanto, este caso dificilmente ocorrerá na
prática.
Na maioria das vezes, teremos valores diferenciados para a série e
conseqüentemente a medida irá representar bem, apenas os dados da série
que se situam próximos a este valor. Os dados muito afastados em relação ao
valor da medida não serão bem representados por ela.
Desta forma, se uma série apresenta forte concentração de dados em
sua área central, a média, a mediana e a moda ficam também situadas em
sua área central representando bem a série como na figura a). Como a mais
conhecida é a média, optamos por esta medida de tendência central. Con-
cluindo, devemos optar pela média, quando houver forte concentração de
dados na área central da série.

Se uma série apresenta forte concentração de dados em seu início, a


mediana e a moda estarão posicionadas mais no início da série, repre-
sentando bem esta concentração. A média que é fortemente afetada por al-
guns valores posicionados no final da série se deslocará para a direita desta
concentração não a representando bem.
Como a mais conhecida entre mediana e moda é a mediana, esta será
a medida indicada neste caso.
i A mesma situação ocorre se a série apresenta forte concentração de
dados em seu final.
Concluindo, devemos optar pela mediana, quando houver forte con-
centração de dados no início ou no final da série.
A moda deve ser a opção como medida de tendência central apenas
em séries que apresentam um elemento típico, isto é, um valor cuja frequên-
cia é muito superior a frequência dos outros elementos da série.
Medidas de Tendência Central 85

3.13 Exercícios Propostos


. Calcule a moda das séries abaixo:
a) X:2,3,5,4,5,2,5,7
b) Y:4, 12,5, 9, 12,4, 3
c) J: 7, 7, 7, 7, 7
d) Z:4,5,6,6, 6, 7,8,8,8,9, 10, 10, 10, 11
e) t : 2 5, 9, 8, 10, 12.
2. Interprete os valores obtidos na 1"uestão.
3. Calcule a moda da distribuição:

4. Interprete o valor obtido no problema anterior:


5. Calcule a moda da série:

6. Calcule a moda da distribuição do número de acidentes diários, observados em


um cruzam-ento, durante 40 dias:

NQde acidentes NQde dlas


por dia
O 30
1 5
2 3
3 1
4 1

7. Interprete o valor obtido no problema anterior.


8. Calcule a moda da série representativa da idade de 50 alunos de uma classe de
primeiro ano de uma Faculdade:

Idade (anos) N de alunos


Q

20

9. Interprete o valor obtido no problema anterior.


86 Estatística 1

10. Calcule a moda de King para a distribuição representativa dos salários de 25


funcionários selecionados em uma empresa.

Classe Salários $ NQde funcionários


1.ooo,oo -1 1.200,oo
1.200,OO - 1 1.400,OO
1.400,OO -1 1.600,OO 1O
4 1.600,OO -1 1.800.00 5
5 1.800,OO - 1 2.000,OO 2

11. Calcule a moda de Czuberpara a tabela do problema anterior.


12. Interprete o valor da moda obtida no problema anterior.
13. Calcule a moda de King para a distribuição de valores de 54 notas fiscais emitidas
na mesma data, selecionadas em uma loja de departamentos:

Classe Consumo por nota $ No de notas


1 O -1 50 10
2 50 -1 1O0 28
3 100 -1 150 12
4 150-1 200 2
5 200 -1 250 1
6 250 -1 300 1

14. Calcule a moda de Czuber para a tabela do problema anterior.


15. Interprete o valor obtido no problema anterior.

16. Calcule a moda de Czuber para a distribuição abaixo que representa a nota de 60
alunos em uma prova de Matemática:

Classe Notas NQde alunos

4- 1
4 6 -1 20
8 -1 1O 3

17. Interprete a moda de Czuber do problema anterior.


18. A distribuição abaixo representa o número de acidentes de trabalho, por dia, em
uma indústria Petroquímica, verificados durante um mês. Calcule a Moda de Czu-
ber para a distribuição.

Classe NQde acidentes NQde dias


1 o- I 2 20

1
4 ,
2 -1
4 -1
6
4
6
8
3
6

19. Interprete o valor obtido no problema anterior.


Medidas de Tendência Central 87

20. A distribuição abaixo representa as alturas de 70 alunos de uma classe. Calcule a


moda de Czuber para esta distribuição:

Classe Alturas (cm) NQde alunos


1 150- 1 160 2
2 160 -1 170 15
3 170 - 1 180 18
4 180 -1 190 18
5 190-1 200 16
6 200- 1 21O 1

21. Interprete o valor obtido no problema anterior.


22. A distribuição abaixo representa o consumo, em kg, de um produto colocado em
oferta em um supermercado, que limitou o consumo máximo por cliente em 5 kg.
Calcule a Moda de King.
N" de clientes

2- 1
4 3- 1 32
5 4 -1 54

23. Calcule a Moda de Czuber para a tabela do problema anterior.


24. Interprete o valor obtido no problema anterior.
25. Qual é a medida de tendência central que melhor representa a série do problema
5?
26. Qual é a medida de tendência central que melhor representa a série do problema
6?
27. Qual é a medida de tendência central que melhor representa a série do problema
13?
28. Qual é a medida de tendência central que melhor representa a série do problema
16?
29. Qual é a medida de tendência central que melhor representa a série do problema
10?
'30. Qual é a medida de tendência central que melhor representa a série do problema
20?

RESPOSTAS
1.
a) mo = 5
b) mo = 4; mo = 12
C) mo= 7
d) m,=6;m0=8;m0=10
e) Amodal.
88 Estatística 1

2. a) O valor rnais frequente da série X é 5.


b) Os valores mais frequentes da série Y são: 4 e 12.
c) O valor mais frequentes da série W é 7.
d) Os valores mais frequentes da série Zsão: 6, 8 e 10.
e) A série não admite um elemento mais repetitivo.
3. mo = 3
4. O valor mais frequente da série é 3.
5. mo =5;mo = 6
6. mo=O
7. O número de acidentes mais frequente neste cruzamento é zero.
8. m0=18
9. A idade mais frequente nesta sala é 18 anos.
10. mo = $ 1.490,91.
11. m o = $ 1.488,89.
12. O salário mais frequente entre os funcionários selecionados é $ 1.488,89.
13. mo = $77,27.
14. mo=$76,47.
15. O consumo, por nota, mais frequente é $76,47.
16. m0=3,30;m0=6,64.
17. As notas mais frequentes nesta prova foram 3,30 e 6,64.
18. mo= 1,18.
19. O número de acidentes mais frequente por dia nesta indústria é 1,18.
20. mo = 180.
21. A altura mais frequente nesta sala é 180 cm.
22. mo = 4.
23. mo = 4,29.
24. O consumo rnais frequentepor cliente é 4,29 kg.
25. Média.
26. Moda.
27. Mediana.
28. Média.
29. Média.
30. Média.
4/ Medidas Separatrizes

4.1 Conceitos
São números reais que dividem a sequência ordenada de dados em
=.artesque contêm a mesma quantidade de elementos da série.
Desta forma, a mediana que divide a sequência ordenada em dois
grupos, cada um deles contendo 50% dos valores da sequência, é também
Jma medida separatriz.
Além da mediana, as outras medidas separatrizes que destacaremos
são: quartis, quintis, decis e percentis.
Se dividirmos a série ordenada em quatro partes, cada uma ficará com
35% de seus elementos.
Os elementos que separam estes grupos são chamados quartis.
Assim, o primeiio quartil, que indicaremos por Q1, separa a sequência
~denada deixando 25% de seus valores a esquerda e 75 % de seus valores a
jireita.
O segundo quartil, que indicaremos por Q2, separa a sequência orde-
iada, deixando 50% de seus valores a esquerda e 50% de seus valores a
direita.
Note que o Q2 é a mediana da série.
O terceiro quartil, que indicaremos por Q3, separa a sequência ordena-
da deixando a sua esquerda 75% de seus elementos e 25% de seus elemen-
tos a direita.
Se dividirmos a sequência ordenada em cinco partes, cada uma ficará
com 20% de seus elementos.
0 s elementos que separam estes grupos são chamados quintis.
Assim, o primeiro quintil, que indicaremos por K1, separa a sequência
ordenada, deixando a sua esquerda 20% de seus valores e a sua direita 80%
de seus valores.
De modo análogo são definidos os outros quintis.
90 Estatística 1

Se dividirmos a sequência ordenada em dez partes, cada uma fic2-E


com 10% de seus valores.
Os elementos que separam estes grupos são chamados decis.
Assim, o primeiro decil, que indicaremos por D1 separa a sequênc'r
ordenada, deixando a sua esquerda 10% de seus valores e 90% de sec:
valores a direita.
De modo análogo são definidos os outros decis.
Se dividirmos a sequência ordenada em 100 partes, cada uma ficar?
com 1% de seus elementos.
Os elementos que separam estes grupos são chamados centis OL
percentis.
Assim, o primeiro percentil, que indicaremos por P1,separa a sequên-
cia ordenada deixando a sua esquerda 1% de seus valores e 99% de seus
valores a direita.
De modo análogo são definidos os outros percentis.
Note que o Q4, K5, DI.? Plo0 são elementos que deixam a sua esquer-
da 100% dos valores da sequencia ordenada e correspondem diretamente ao
último valor da sequência.
Se observarmos que os quartis, quintis e decis são múltiplos dos per-
centis, então basta estabelecer a fórmula de cálculo de percentis. Todas as
outras medidas podem ser identificadas como percentis.
Desta forma:

4.2 Cálculo das Medidas Separatrizes


1 2 Caso - DADOS BRUTOS OU ROL
Devemos ordenar os elementos, caso sejam Dados Brutos obtendo o
Rol.
1 Medidas Separatrizes 91

Identificamos a medida que queremos obter com o percentil correspon-


:ente, Pi.
Calculamos i% de n, ou seja, para localizar a posição do percentil i
?o Rol.
Em seguida, identificamos o elemento que ocupa esta posição.
Note que se for um número inteiro, então Pique estamos procuran-
3'0 identificar é um dos elementos da sequência ordenada.
Se não for um número inteiro, isto significa que o Pi é um elemento
100
itermediário entre os elementos que ocupam as posições aproximadas por
'alta e por excesso do valor S. Neste caso, o Pi é definido como sendo a
nédia dos valores que ocupam estas posições aproximadas.
Exemplo 1. Calcule o Q1 da sequência X: 2, 5, 8, 5, 5, 10, 1, 12, 12,
11, 13, 15.
Solução: Ordenando a seqüência, obtemos o Rol:
X 1,2, 5, 5,5, 8, 10, 11, 12, 12, 13, 15.
Identificamos Q1 = P25.
Calculamos 25% de 12 que é o número de elementos da série obten-
do:

Este valor indica a posição do P25 no Rol, isto é, o P25 é O terceiro


elemento do Rol. Observando o terceiro elemento do Rol obtém-se 5.
Portanto, Q1 = PZ5= 5.
Interpretação: 25% dos valores desta sequência são valores menores
ou iguais a 5 e 75 % dos valores desta sequência são valores maiores ou
iguais a 5.
Exemplo 2. Calcule o KJ da sequência X: 2; 8; 7,5; 6; 10; 12; 2; 9.
Solução: Ordenando a seqüência. obtemos: X: 2; 2; 6; 7,5; 8; 9; 10; 12.
Identificamos K3 = PC0.
Calculamos 60% de 8, que é o número de elementos da série, obten-
do:

Este valor não-inteiro indica que o P60 é um valor situado entre o


quarto e o quinto elemento da sequência.
92 Estatistica 1

Observando diretamente no Rol, os elementos que ocupam a quarta e


a quinta posição obtemos 7,5 e 8. Portanto,

Interpretação: 60% dos valores da sequência são valores menores ou


iguais a 7,75 e 40% dos valores da sequência são valores maiores ou iguais a
7,75.
Note que se o número de elementos da sequência for menor que 100?
alguns percentis podem coincidir em valores tornando estas interpretações
não totalmente verdadeiras.

-
2Waso VARIÁVEL DISCRETA

Se os dados estão apresentados na forma de uma variável discreta,


eles já estão naturalmente ordenados.
Identifica-se a medida que queremos obter com o percentil correspon-
dente: P,
I
ixn
Calcula-se i% de n ou seja, -para localizar a posição do percentil i
1O0
na série.
Em seguida utilizamos a frequência acumulada da série para localizar
o elemento que ocupa esta posição.
O valor deste elemento é o Pi.
Exemplo I. Calcule o D4 para a série:

Solução: O número de elementos da série é Z fi = 24


Identificamos D4 = P40 e calculamos 40% de 24, ou seja,
Medidas Separatrizes 93

I Esta posição não-inteira significa que o P40 é um valor compreendido


i-tre o nono e o décimo elemento da série.
I Construindo a frequência acumulada:

zbservamos que o nono elemento é 5, e o décimo elemento também é 5.

5 + 5
Assim, D4 = P40 = -= 5.
2

Interpretação: 40% dos valores desta série são valores menores ou


guais a 5 e 60% dos valores desta série são valores maiores ou iguais a 5.

3" Caso - VARIÁVEL CONT~NUA

Se os dados estão apresentados na forma de uma variável contínua,


eles já estão naturalmente ordenados e o número de elementos da série é
n = E$.
Para se obter uma fórmula geral para o cálculo dos percentis, vamos
generalizar a fórmula da mediana:

Identificando md = P50,podemos obter uma fórmula particular para o


'50-
Note que a classe que contém a mediana é a mesma classe que
contém o P50.
Portanto, identificamos o limite inferior da classe que contém a Media-
na (I ) com o limite inferior da classe que contém o PS0(I5&.
md
94 Estatística 1

n 50 x n
O termo - pode ser representado na linguagem do PS0como -
2 100 '
A frequência simples da classe mediana (f ) é a mesma frequênc 2
md
simples da classe que contém o P50 (f50).
A frequência acumulada da classe anterior a classe mediana (F,,,) é F
frequência acumulada da classe anterior a classe que contém o PS0. ES'F
termo não se modifica, assim como h, que é a amplitude do intervalo c:
classe.
Assim, a fórmula da mediana, adaptada para a linguagem do P50 podc
ser escrita:

Substituindo-se 50 pelo índice i, generalizamos a fórmula para o cálcu-


lo de qualquer percentil:

onde:
Pi - Percentil i( i = 1 , 2, 3,...,99).
li - limite inferior da classe que contém o percentil i.
n - número de elementos da série.
Fant - frequência acumulada da classe anterior a classe que contém o
Pi.
fi - frequência simples da classe que contém o percentil i.
h - amplitude do intervalo de classe.
Exemplo: Calcule o Q3 da série:

Classe Int. cl. fi


1 0 -1 10 16
2 10 -1 20 18
3 20 -1 30 24
4 30 I--- 40 35
5 40 -1 50 12
Medidas Separatrizes 95

O número de elementos da série é dado por C fi= 105. Identificamos

ixn -

Iniciamos o cálculo do valor P75 lembrando que neste caso i= 75 e


xe:

-i x-n - 75x105 = 78,75.


1O0 1O0

Isto nos dá a posição do P75 na série.


Construindo a frequência acumulada da série obtemos:

Classe Int. cl. fi Fi


1 O -I 10 16 16
2 10 -1 20 18 34
3 20 -I 30 24 58
4 30 -I 40 35 93
5 40 -1 50 12 105

A classe que contém o elemento que ocupa a posição 78,75 na série é


3 quarta classe. Esta é a classe que contém o P75.
Substituindo os valores indicados na fórmula, obtém-se:

Portanto Q3 = P75 = 35,93


Interpretação: 75% dos valores da série são menores ou iguais a 35,93
e 25% dos valores da série são maiores ou iguais a 35,93.

4.3 Exercícios Propostos


I. Em uma série ordenada, qual é o percentual de elementos que ficam a esquerda
de cada uma das medianas separatrizes:
a) 0 , b) Q, c) K, d) D2 e) K3
) os S) K4 h) Q2 0 D8 P70
96 Estatistica 1 1
2. Em uma série ordenada, qual é o percentual de elementos que ficam a direita
cada uma das medidas separatrizes:
a) D4 b, '80 c) Q3 d) K2
e) p20 f) D5 g) Q1 h) p2
3. Qual é o percentual de elementos de uma série ordenada que se situam entre:

a) Ql eQ3
b, P10eP90
C) D2e D6
d' Q 1 e K 3
e) D3e K4
0 K2eDg
9) K3 e Q3
4. Se uma série ordenada possui 180 elementos, dê o número aproximado de ele
mentos que se situam:
a) Acima do PZo
b) abaixo do K3
c) acima do Q3
d) abaixo do Pgo
e) entre o Pl o e o PBO
f) entreoQ1eQ3
g) entre o Q3 e PBo
h) entre o PgOe Pg2
5. Dada a série X: 3, 15, 6, 9, 10, 4, 12, 15, 17, 20, 29, calcule:

a) Q1 b, K2 c) O4 4 Q3 e) '90

6. A distribuição de frequência abaixo representa idade de 50 alunos de uma classe


de primeiro ano de uma Faculdade.

Idade (anos) Ngde alunos

20
21

Calcule:
a) Ql b) K3
Medidas Separatrizes 97

7. A distribuição de frequência abaixo representa o consumo por nota de 54 notas


fiscais emitidas durante um dia em uma loja de departamentos.

Classe Consumo por nota US$ No de notas


1 O -I 50 1O
2 50 -1 1O0 28
3 1O0- 1 150 12
4 150 -1 200 2
5 200 -1 250 1
' 6 250 - 1 300 1

Calcule:
a) Q, 6) K, c) 0 3
d) Q3 e) D7 0 "98
8. Interprete os valores obtidos no problema anterior.
9. Tomando como amostra a tabela do problema ne 7, o gerente desta loja de
departamentos decidiu premiar a nível promocional com um brinde, 10% dos
fregueses que mais consumirem, nos próximos 30 dias. A partir de qual valor de
consumo da nota fiscal os clientes seriam premiados?
10. Uma empresa estabelece o salário de seus vendedores com base na produtivida-
de. Desta forma, 10% é fixo e 90% são comissões sobre venda. Uma amostra de
salários mensais nesta empresa revelou o quadro abaixo. Se a empresa decidir; a
nível de incentivo, fornecer uma cesta básica para 5% dos vendedores que pior
desempenho tiveram durante o próximo mês com base nesta amostra, qual será o
maior salário que receberá esta cesta básica?

Classe Salários US$ Node vendedores


1 70 -1 120 8
2 120 -1 170 28
3 170 -1 220 54
4 220 -1 270 32
5 270 -1 320 12
6 320 - 1 370 6

1I. A tabela abaixo representa a venda de livros didáticos em uma editora na primeira
semana de março.

Classe Preço unitário US$ NQde livros comercializados


1 O -1 1O 4.000
2 10 -1 20 13.500
3 20 -1 30 25.600
4 30 - 1 40 43.240
5 40 -1 50 26.800
6 50 -1 60 1.750

Determine:
a) Q1 b) Q3 C) "90 4 P1O
12. Interprete os valores obtidos no problema anterior.
98 Estatística 1

13. A tabela abaixo representa o número de faltas anuais dos funcionários de u r r


empresa.
NQde NQde
faltas empregados
o 20
1 42
2 53
3 125
4 84
5 40
6 14
7 3
8 2

Determine:
a) D3 b) K3 C) ' 9 0
d) Q3 e) Q1 PIO
14. Interprete os valores obtidos no problema anterior.
15. Uma amostra do tempo de vida útil de uma peça forneceu a seguinte distribuição:

NQde horas (vida útil) NQde peças


O- I 1O0 6
1O0- 1 200 42
200 -1 300 86
300 -1 400 127
400 -1 500 64
500- 1 600 8

Se o produtor deseja estabelecer uma garantia mínima para o múmero de horas


de vida útil de uma peça, trocando a peça que não apresentar este número
mínimo de horas, qual é a garantia, se ele está disposto a trocar 8% das peças?

RESPOSTAS
a ) 10% b) 25% c) 20% d) 20% e) 60%
f) 75% g) 80% h) 50% i) 80% j) 70%
a ) 60% b) 20% c) 25% d) 60%
e) 80% f ) 50% g) 75% h) 98%
a) 50% b) 80% c) 40% d) 35%
e) 50% f) 40% g) 15%
a ) 144 b) 108 c) 45 d) 162
e) 126 f ) 90 9) 9 h) 4
a) 5 b) 9,5 C) 9,5 d) 16 e) 18,5
a) 18 b) 19 c) 18 d) 19 e) 21
a) 56,25 b) 70,71 c) 61,07
d) 11442 e) 99,64 f ) 246
a) 25% das notas indicavam consumo menor ou igual a US$56,25 e 75% indicavam consumo maior
ou igual a US$56,25.
7

i Medidas Separatrizes 99
j
b) 40% das notas indicavam consumo menor ou igual a US$70,71 e 60% indicavam consumo maior
3c ou igual a US$70,71.
c) 30% das notas indicavam consumo menor ou igual a US$61,07 e 70% indicavam consumo maior
ou igual a US$61,07.
d) 75% das notas indicavam consumo menor ou igual a US$ 110,42 e 25% indicavam consumo
maior ou igual a US$ 110,42.
e) 70% das notas indicavam consumo menor ou igual a US$99,64 e 30% indicavam consumo maior
ou igual a US$99,64.
f) 98% das notas indicavam consumo menor ou igual a US$246,00 e 2% indicavam consumo maior
ou igual a US$246,00.
. US$ 144,17.
.O. US$113,75.
* I . a)US$24,38 b)US$39,96
c) US$46,37 d) US$15,55
72. a) 25% dos livros vendidos tinham preço unitário menor ou igual a US$ 24,38 e 75% dos livros
vendidos tinha preço unitário maior ou igual a US$24,38.
b) 75% dos livros vendidos tinham preço unitário menor ou igual a US$ 39,96 e 25% dos livros
vendidos tinham preço unitário maior ou igual a US$39,96.
c) 90% dos livros vendidos tinham preço unitário menor ou igual a US$ 46,37 e 10% dos livros
vendidos tinham preço unitário maior ou igual a US$46,37.
d) 10% dos livros vendidos tinham preço unitário menor ou igual a US$ 15,55 e 90% dos livros
vendidos tinham preço unitário maior ou igual a US$ 15,55.
13. a) 2 b) 3 c) 5
d) 4 e) 2 07
14. a) 30% dos empregados tiveram um número de faltas anuais menor ou igual a 2 e 70% dos
empregados tiveram um número de faltas anuais maior ou igual a 2.
b) 60% dos empregados tiveram um número de faltas anuais menor ou igual a 3 e 40% dos
empregados tiveram um número de faltas anuais maior ou igual a 3.
I
c) 90% dos empregados tiveram um número de faltas anuais menor ou igual a 5 e 10% dos
empregados tiveram um número de faltas anuais maior ou igual a 5.
d) 75% dos empregados tiveram um número de faltas anuais menor ou igual a 4 e 25% dos
empregados tiveram um número de faltas anuais maior ou igual a 4.
e) 25% dos empregados tiveram um número de faltas anuais menor ou igual a 2 e 75% dos
empregados tiveram um número de faltas anuais maiores ou iguais a 2.
f) 10% dos empregados tiveram um número de faltas anuais menor ou igual a 1 e 90% dos
empregados tiveram um número de faltas anuais maior ou igual a I .
15. 149.14 horas.
5/ Medidas de Dispersão

5.1 Introdução
Uma breve reflexão sobre as medidas de tendência central permite
nos concluir que elas não são 'suficientes para caracterizar totalmente u r r ~
sequência numérica.
Se observarmos as sequências:

concluiremos que todas possuem a mesma média 13.


No entanto, são sequências completamente distintas do ponto de vistz
da variabilidade de dados.
Na sequência Znão h á variabilidade de dados.
A média 13 representa bem qualquer valor da série.
Na sequência Y, a média 13 representa bem a série, mas existem
elementos da série levemente diferenciados da média 13.
Na sequência X existem muitos elementos bastante diferenciados da
média 13.
Concluímos que a média 13 representa otimamente a sequência Z,
representa bem a sequência Y, mas não representa bem a sequência X.
O nosso objetivo é construir medidas que avaliem a representatividade
da média. Para isto usaremos as medidas de dispersão.
Observe que na sequência Z os dados estão totalmente concentrados
sobre a média 13.
Não h á dispersão de dados. Na sequência Y h á forte concentração
dos dados sobre a média 13, mas h á fraca dispersão de dados. Já na série X
h á fraca concentração de dados em torno da média 13 e forte dispersão de
dados em relação a média 13.
Medidas de Dispersão 101

f .2 Medidas de Dispersão Absoluta


-As principais medidas de dispersão absolutas são: amplitude total,
::wio médio simples, variância e desvio padrão.

5.3 Amplitude Total


É a diferença entre o maior e o menor valor da sequência.

3.4 Cálculo da Amplitude Total


'-Caso - DADOS BRUTOS OU ROL

Basta identificar o maior e o menor valor da sequência e efetuar a


iferença entre estes valores.
Exemplo: Determine a amplitude total da sequência X: 11, 12, 9, 10,
:O, 15.
Solução: O maior valor desta sequência é 15 e o menor valor é 9.
=ortanto, a amplitude total da sequência é A, = 15 - 9 = 6 unidades.

2" Caso - VARIÁVEL DISCRETA

Como os valores já se apresentam ordenados, a amplitude total é a


diferença entre o último e o primeiro elemento da série.
Exemplo: Determine a amplitude total da série.

1 Solução: O maior valor da série é 7 e o menor valor da série é 2.


Portanto, a amplitude total da série é A, = 7 - 2 = 5 unidades.
r

102 Estatística 1

Nesta situação, por desconhecer o maior e o menor valor da r i


devemos fazer um cálculo aproximado da amplitude total da série.
~
Consideraremos como maior valor da série o ponto médio da i
classe e como menor valor da série o ponto médio da primeira class
amplitude total é a diferença entre estes valores.
I

I Exemplo: Determine a amplitude total da série:

Classe Int. cl. fi


1 2 -1 4 5
2 4 -1 6 10
3 6 -1 8 20
4 8 -1 1O 7
5 10 -1 12 2

Solução: O ponto médio da última classe é 11 e o ponto médio rr


primeira classe é 3. Portanto, At = 11 - 3 = 8 unidades.
COMENTÁRIO: Apesar da facilidade de obtenção da amplitude tots
esta medida apresenta a inconveniência de depender apenas de dois valor~s
da série. É possível modificar completamente a dispersão ou a concentra@:
dos elementos em torno da média, sem alterar a amplitude total da série. f
uma medida que tem pouca sensibilidade estatística.

5.5 Exercícios Propostos


1. Calcule a amplitude total da série:
X: 2, 8, 10, 15, 20; 22, 30.
2. Calcule a amplitude total da série:
V: 12,9, 15, 40,22, 34, 8.
3. Calcule a amplitude total da série:
Medidas de Dispersão 103

- Zalcule a amplitude total da série:

Classe SalBrlos US$ NPde vendedores


1 70-1 120 8
2 120-1 170 28
3 170-1 220 54
4 220- 1 270 32
5 270 -I 320 12
6 320-1 370 6

- Considerando as série X e Y da 1" e 2Questões, qual delas apresenta maior


dispersão absoluta?

I A, = 28 unidades.
i A, = 32 unidades.
I A, = 17 unidades.
I A, = US$250.
A série Y,pois A, da série Y é maior que A, da série X.

5.6 Desvio Médio Simples


O conceito estatístico de desvio corresponde ao conceito matemático
de distância.
A dispersão dos dados em relação a média de uma sequência pode
ser avaliada através dos desvios de cada elemento da sequência em relação a
nédia da sequência.
O desvio médio simples que indicaremos por DMS é definido como
sendo uma média aritmética dos desvios de cada elemento da série para a
média da série.

5.7 Cálculo do Desvio Médio Simples


1" Caso - DADOS BRUTOS OU ROL

Calculamos inicialmente a média da sequência. Em seguida identifica-


mos a distância de cada elemento da sequência para sua média. Finalmente,
calculamos a média destas distâncias.
104 Estatística 1

Se a sequência for representada por X x,, x2,..., x, então o DMS


admite como fórmula de cálculo:

Exemplo: Calcule o DMS para a sequência:


X 2, 8, 5, 6.
Solução: Determinamos inicialmente a média da série:

em seguida determinamos as distâncias de cada elemento da série para c.


média da série:

O DMS é a média aritmética simples destes valores.


3,25 + 2,75 + 0,25 + 0,75 - -
7
DMS = = 1,75
4 - 4
Interpretação: Em média, cada elemento da sequência está afastado
do valor 5,25 por 1,75 unidades.

2?Caso - VARIÁVEL DISCRETA


No caso da apresentação de uma variável discreta, lembramos que a
frequência simples de cada elemento representa o número de vezes que este
valor figura na série. Conseqüentemente, haverá repetições de distâncias
iguais de cada elemento distinto da série para a média da série. Assim, a
média indicada para estas distâncias é uma média aritmética ponderada.
Medidas de Dispersão 105

A fórmula para o cálculo do DMS é:

xixi - x i fi
DMS =

Exemplo: Determine o DMS para a série:

Solu$ío: O número de elementos da série é n = C fi = 10.


A média da série é:

Usaremos a disposição da tabela, acrescentando novas colunas para


3 resolução dos cálculos.

A média da série é:

O DMS é dado por:


C lx:I - X l f:I
DMS =
C fj
106 Estatística 1

Incluiremos outra coluna para efetuar estes cálculos:

O desvio médio simples é:


XIxi-XIfi. 8
DMS = -
- - = 0,8 unidades.
C fi 10

Interpretação: Em média, cada elemento da série está afastado c:


valor 3 por 0,8 unidade.

3" Caso - VARIÁVEL CONT~NUA

Nesta situação, por desconhecer os valores individuais dos elementos


componentes da série, substituiremos estes valores X , pelos pontos médios
de classe.
Desta forma, o desvio médio simples tem por cálculo a fórmula:

Xixi - X I fj
DMS =

onde X j é o ponto médio da classe i.


Exemplo: Determine o DMS para a série.

Classe Int. cl. fi


1 2 -1 4 5
2 4 -1 6 1O
3 6 -1 8 4
4 8 -1 10 1
Medidas de Dispersão 107

Soluçáo: O número de elementos da série é n = C t;. = 20.


Usaremos a disposição da tabela acrescentando as colunas necessá-
-3s para a resolução dos cálculos.
Inicialmente acrescentamos a coluna dos pontos médios das classes:

Classe Int. cl. fi xi


1 2 -I 4 5 3
2 4 -1 6 10 5
3 6 -1 8 4 7
4 8 -1 10 1 9

ç xi 4
Em seguida, calculamos a média da série: X=-C f;.

Classe Int. cl. fi xi xifi


1 2 -1 4 5 3 15
2 4 -I 6 1O 5 50
3 6 -1 8 4 7 28
4 8 -1 10 1 9 9
c fi= 20 C xit;.= 102

I A média da série é:

Classe Int. cl. fi xi xjfi lxi-Xl fj


1 2 -I 4 5 3 15 10,50
2 4 -1 6 10 5 50 1,O0
3 6 -I 8 4 7 28 7,60
4 8- I 10 1 9 9 3,90

O DMS =
ç lxi - x i fi --
- 23 = 1,15 unidades.
C fi 20
108 Estatística 1

Interpretagão: Em média, cada elemento da série está afastado de 5.-


por 1,15 unidades.
COMENTÁRIO: O desvio médio simples depende de cada componer-
te da série. Se mudarmos .o valor de um único elemento da série, mudamcr
também o DMS. Portanto, o desvio médio simples tem perfeita sensibilidad~
estatística. A maior dificuldade desta medida é envolver módulos, cujas prc-
priedades, em geral não são suficientemente conhecidas pelos estagiárics
que normalmente desenvolvem estes cálculos.

5.8 Exercícios Propostos


1. Calcule o DMS da série:
X: 3, 8, 12, 3, 9, 7.
2. Interprete o valor obtido na 1Wuestão.
3. Calcule o DMS da série:
Y: 2; 2,5; 3,5; 7; 10; 14,5; 20.
4. Interprete o valor obtido na 3"Questão.
5. Calcule o DMS da série:

6. Interprete o valor obtido na 5Wuestão.


7, Calcule o DMS da série:

Classe Salários US$ N V e vendedores


1 70 -1 120 8
2 120 -1 170 28
3 170- 1 220 54
4 220 -1 270 32
5 270 -1 320 12
6 320 -1 370 6

8. Interprete o valor obtido na 7Wuestão.


9. Responda, justificando: Qual das série X e Y da 1% e3"questões possui maior
dispersão absoluta?
10. Qual das variáveis da 5% 7" questões possui maior dispersão absoluta?
Medidas de Dispersão 109

RESPOSTAS

- DMS = 2,67.
. Os valores da série estão afastados de 7, em média, por 2, 67 unidades.
i. DMS = 5,43.
. Os valores da série estão afastados de 8,5, em média, por 5,43 unidades.
. DMS = 1,13.
. Em média, os valores da série estão afastados de 5 por 1.13 unidades.
. DMS = US5 45,20.
. Em média, os salários dos vendedores estão afastados de US$205,71 por US$45,20.
. A série Y, pois o DMS da série Y é maior que o DMS da série X.
'O. A variável contínua, pois o DMS da variável contínua 6 maior que o DMS da variável discreta.

5.9 Variância e Desvio Padrão

Introdução: Observamos no item anterior que a dificuldade em se


operar com o DMS se deve a presença do módulo, para que as diferenças
xi - 2 possam ser interpretadas como distâncias.
Outra forma de se conseguir que as diferenças xi - 2 se tornem sem-
pre positivas ou nulas é considerar o quadrado destas diferenças, isto é:
(x, - x ) ~ .
Se substituirmos, nas fórmulas do DMS a expressão Ix, - 21 por
(x, - x)', obteremos nova medida de dispersão chamada variância.
Portanto, variância é uma média aritmética calculada a partir dos qua-
drados dos desvios obtidos entre os elementos da série e a sua média.
O desvio padrão é a raiz quadrada positiva da variância.
Em particular, para estas medidas levaremos em consideração o fato
de a sequência de dados representar toda uma população ou apenas uma
amostra de uma população.
No final desta secção justificaremos esta necessidade.
Notações: Quando a sequência de dados representa uma Popula-
ção a variância será denotada por 02(x)e o desvio padrão correspondente por
W).
Quando a sequência de dados representa uma amostra, a variância
será denotada por z ( x ) e o desvio padrão correspondente por s(x).
110 Estatística 1

5.1 0 Calculo da Variância e Desvio Padrão


1Waso - DADOS BRUTOS OU ROL

a) Se a sequência representa uma População, a variância é calcu'z-


da pela fórmula:

Exemplo: Calcule a variância e o desvio padrão da sequência: X: 4, 5.


8, 5.
A sequência contém n = 4 elementos e tem por média:

0 s quadrados das diferenças (xi - x ) valem:


~

Somando-se estes valores obtem-se: Z (x,- x ) =~9.


Substituindo esses valores na fórmula da variância, teremos:

o2(x) = z ( x , - ~ )-~-
g = 2,25.
n 4

Como o desvio padrão é a raiz quadrada positiva da variância,

G(X) = d z = i/Zi5 = 1,5 unidades.

b) Se a sequência anterior representasse apenas uma amostra, a


variância seria denotada por s2(x)e o desvio padrão por s(x).
Medidas de Dispersão 111

Neste caso,

Note que a Única diferença entre a fórmula de 02(x) (indicado para


Populações) e z ( x ) (indicado para amostras) é o denominador.
Assim,
Z(X,-X)~ g
?(x) = n- 1
- -
3
= 3 e o desvio padrão s(x) = 6= 1,73.

2" Caso - VARIÁVEL DISCRETA


Como há repetições de elementos na série, definimos a variância
como sendo uma média aritmética ponderada dos quadrados dos desvios dos
elementos da série para a média da série.

a) Se a variável discreta é representativa de uma População, então a


variância é dada por:

e o desvio padrão é:
112 Estatística 1

b) Se a variável discreta é representativa de uma amostra, então =


variância é:

e o desvio padrão é:

Exemplo 1: Calcule a variância da série abaixo, representativa de uma


população.

Solução: O número de elemento da série é n = C fi= 20.


z
xi 5
A média desta série é 2 = -
z4

- CXi$
A média da série é X = -- - 73 - 3,65
c fj 20
Medidas de Dispersão 113

Como estamos trabalhando com uma População a variância é dada


3or:

o2 (x) = (xi- fi
2 fi
Desenvolvendo nova coluna para estes cálculos, obtém-se:

A variância é:

e o desvio padrão correspondente é o(* = = 0,963.


Exemplo 2: Se a variável discreta fosse representativa de uma amos-
tra, a variância seria indicada por $(x) e seria calculada por:

O desvio padrão seria calculado por s(x)= 110,9763=0,988.

Novamente, por desconhecer os particulares valores xi da série, subs-


tituiremos nas fórmulas anteriores estes valores pelos pontos médios de classe.
A fórmula da variância para uma variável contínua representativa de

7
1
uma população é:

o (x) =
2 fi

onde xi é o ponto médio da classe i.


114 Estatística 1

Se a variável contínua representa uma amostra então a variâncici


deriotada por s2(x) e sua fórmula de cálculo é:
-

Exemplo I:Calcule a variância e o desvio padrão para a série reprF


sentativa de uma População:

Classe Int. cl. fi


1 o -1 4 1
2 4 -1 8 3
3 8 -1 12 5
4 12 -1 16 1

Solugão: O número de elementos da série é n = C fi= 10.


C xi 5
A média da série é 2=-C fi
onde xi são os pontos médios de
classe.

Classe Int. cl. fi xi xifi


1 o -1 4 1 2 2
2 4 -1 8 3 6 18
3 8 -I 12 5 1O 50
4 12 -1 16 1 14 14

A média da série é:

Como a variável contínua é representativa de uma população, então a


variância é dada por:
x (xi- x)* fi
o2(x) =
C fi
r-

Medidas de Dispersão 115

Classe Int. cl. fi xi xifi ( x , - E ) * fi


1 O -I 4 1 2 2 40,96
2 4 -I 8 3 6 18 17,28
3 8 -1 12 5 1O 50 12,80
4 12 -1 16 1 14 14 31.36

A variância é, portanto:

o2(x) = z ( x i - x ) * f j -
102,4 - 10,24
C fi 10

e o desvio padrão é: o(x) = = 3,2.

Exemplo 2: Se a variável contínua fosse representativa de uma amos-


tra, a variância seria indicada por 2 ( x ) e sua fórmula de cálculo seria:

Desta forma, Z(X)= - - 11,38 e o desvio padrão seria


s(x) = m= 3,373.
9

1. No cálculo da variância, quando elevamos ao quadrado a diferen-


ça (xi- i),a unidade de medida da série fica também elevada ao quadrado.
Portanto, a variância é dada sempre no quadrado da unidade de medi-
da da série.
Se os dados são expressos em metros, a variância é expressa em
metros quadrados.
Em algumas situações, a unidade de medida da variância nem faz
sentido.
É o caso, por exemplo, em que os dados são expressos em litros. A
variância será expressa em litros quadrados.
Portanto, o valor da variância não pode ser comparado diretamente
com os dados da série, ou seja: variância não tem interpretação.
2. Exatamente para suprir esta deficiência da variância é que se
define o desvio padrão.
116 Estatística 1

Como o desvio padrão é a raiz quadrada da variância, o desvio padr2:


terá sempre a mesma unidade de medida da série e portanto admite interprc-
tação.

5.11 Interpretação do Desvio Padrão


O desvio padrão é, sem duvida, a mais importante das medidas d f
dispersão.
É fundamental que o interessado consiga relacionar o valor obtido dr
desvio padrão com os dados da série.
Quando uma curva de frequência representativa da série é perfeita-
mente simétrica como a curva abaixo, podemos afirmar que o intervalc
p-o, ?+ o]contém aproximadamente 68% dos valores da série.

O intervalo p-20,%+201 contém aproximadamente 95% dos valores


da série.
Medidas de Dispersão 117

O intervalo E-30,X + 301 contém aproximadamente 99% dos valores


?a série.

Estes percentuais 68%, 95% e 99% que citamos na interpretação po-


derão mais tarde ser comprovados, com maior precisão, no estudo da distri-
Suição normal de probabilidades.
Para uma compreensão inicial do desvio padrão, estas noções são
suficientes.
Quando a distribuição não é perfeitamente simétrica estes percentuais
apresentam pequenas variações para mais ou para menos, segundo o caso.
De modo que, quando se afirma que uma série apresenta média x =
100 e desvio padrão o(x) = 5, podemos interpretar estes valores da seguinte
forma:

1. Os valores da série estão concentrados em torno de 100.

2. O intervalo [95, 1051 contém aproximadamente, 68% dos valores


da série.
O intervalo [90, 1101 contém aproximadamente 95% dos valores da
série.
O intervalo [85, 1151 contém aproximadamente 99% dos valores da
série.

É importante que se tenha percebido que, ao aumentar o tamanho do


intervalo, aumenta-se o percentual de elementos contido no intervalo.
Adiante verificaremos que é possível controlar o tamanho do intervalo
de modo que contenha exatamente o percentual que queremos.

3. As medidas de dispersão vistas até agora são medidas absolutas


e portanto avaliam a dispersão absoluta da série. Todas elas são diretamente
proporcionais a dispersão absoluta.
F-

118 Estatística 1

tay=
x
Assim, se a série Xapresenta = 20 e o(x) = 3 e se a série Y apreser-
22 e o(y) = 2, podemos afirmar, comparando os desvios padrão, que ?
série Xapresenta maior dispersão absoluta.
1
,:
I:
1:
4. Para justificar que o denominador da variância amostra1 d e v ~
ser n - 1 e não n, usaremos o seguinte argumento:
O modelo matemático que calcula a variância de uma amostra nãc
pode ser
z (xi- x)*
o2 (x) =
n '
pois caso isto fosse verdadeiro, este modelo deveria determinar a variância
para qualquer tamanho de amostra.
Suponha uma amostra constituída de um único elemento X,.
O valor médio da amostra também é xl.
Calculando a variância pelo modelo acima, teremos:

2
C (xi - X J ~
o (x) =
1
= o.

Seríarnos induzidos a afirmar que a dispersão da população de onde


provém a amostra é zero, isto é, a população é constituída em sua totalidade
por elementos idênticos. O que é, em geral, uma afirmação falsa.
I Para corrigir o modelo matemático, basta colocar no denominador
t n - 1 . O modelo é escrito então:

Observe que agora o modelo é coerente. Mesmo quando a amostra


tiver apenas um elemento xl, o cálculo de s2(x) leva-nos a uma indetermina-
I
i.
çáo do tipo O que significa que a variância existe, mas não está determina-
da.
Significa também que amostras de apenas um elemento não nos for-
nece informações sobre a variância da série.

5.12 Exercícios Propostos


1. Calcule a variância e o desvio padrão da População:
X:2, 3, 7, 9, 11, 13.
Medidas de Dispersão 119

2. Calcule a variância e o desvio padrão da População:


Y: 5, 12, 4, 20, 13, 17.
3. Calcule a variância e o desvio padrão da amostra:
Z: 15, 16, 17, 20, 21.
4. Calcule a variância e o desvio padrão da amostra:
T:6, 5, 10, 12, 19.
5. Calcule a variância e o desvio padrão da população:
Idade (anos) No de alunos

20
21

6. Calcule a variância e o desvio padrão para o número de acidentes diários, obser-


vados em um cruzamento, durante 40 dias. (Amostra.)
NQde acidentes NVe
por dia dias

3 1
4 1

7. Calcule a variância e o desvio padrão para a distribuição de valores de 54 notas


fiscais emitidas na mesma data, selecionadas em uma loja de departamentos.
(Amostra.)

Classe Consumo por nota US$ NQde notas


1 O- I 50 1O
2 50- 1 1O0 28
3 100- 1 150 12
4 150- 1 200 2
5 200- 1 250 1
6 250- 1 300 1

8. Calcule a variância e o desvio padrão para as alturas de 70 alunos de uma classe


(Amostra.)
Classe Alturas (cm) NQde alunos
1 150 -1 160 2
2 160- 1 170 15
3 170- 1 180 18
4 180- 1 190 18
5 190- 1 200 16
6 200- 1 21O 1

9. Interprete os valores obtidos na Questão 6.


10. Interprete os valores obtidos na Questão 7.
120 Estatística 1

1I . Interprete os valores obtidos na Questão 8.


12. Uma série estatística X simétrica apresenta: k = 10, d(x)= 4 e o(x) = 2.
Interprete estes valores.
13. Uma série estatística Y simétrica apresenta: y = 20, = 6,25 e o(y) = 2,5.
Interprete estes valores.

RESPOSTAS
d ( x ) = 1592 3 e o(x) = 3,99 u
d(y)= 33,81 2 e o ~= 5,sl ) u
?(z) = 6,70 4 e s(z) = 2,59 u
s2(0 = 31,30 3 e $0 = 5,59 u
d ( x ) = 1,05 a2 e o(x) = 1,03 a
$(x) = 0,87 ( a ~ e) s(x)
~ = 0,93 ac
?(x) = 2.446,72 (us$)~ e ç(x) = US$49,46
&x)=141,28cn? e s(x)=11,89cm
a) variancia não tem interpretação.
b) desvio padrão:
Aproximadamente 68% dos dias ocorrem entre O e 1,38 acidYdia
Aproximadamente 95% dos dias ocorrem entre O e 2,31 acid/da
Aproximadamente 99% dos dias ocorrem entre O e 3,24 acid/dia
As aproximações neste caso não são razoáveis, pois a série é muito assimétrica.
a) variância não tem interpretação
b) desvio padrão:
Aproximadamente 68% das notas têm valor entre US$37,58 e US$136,50
Aproximadamente 95% das notas têm valor entre US$ O e US$185,96
Aproximadamente 99% das notas tem valor entre US$ Oe US$235,42
As aproximações neste caso são apenas razoáveis, pois a série é assimétrica.
a) variância não tem interpretação
b) desvio padráo:
Aproximadamente 68% dos alunos têm altura entre 167,97 cm e 191,75 cm.
Aproximadamente 95% dos alunos têm altura entre 156,08cm e 203,64 cm.
Aproximadamente 99% dos alunos têm altura entre 144,19 cm e 215,53 cm.
As aproximações neste caso são bem razoáveis, pois a curva é praticamente simétrica.
-
a) X = 10. Os valores da série estatistica X estão concentrados em torno de 10 unidades.
b) $(x) = 4. Varíãncia não tem interpretação.
C) 6(X)= 2:
68% dos valores da sbrie estão compreendidos entre 8 e 12 unidades.
95% dos valores da s6rie estão compreendidos entre 6 e 14 unidades.
99% dos valores da s6rie estão compreendidos entre 4 e 16 unidades.
-
a) Y = 20.0s valores da série estatística Y estão concentrados em torno de 20 unidades.
b) d ( y ) = 6.25. Variância não tem interpretação.
C) o(y) = 2,5:
68% dos valores da série estão compreendidos entre 17,5 e 22,s unidades.
95% dos valores da série estão compreendidos entre 15 e 25 unidades.
99% dos valores da série estão compreendidos entre 12,5 e 27,5 unidades.
Medidas de Dispersão 121

5.1 3 Medidas de dispersão relativa


Introdução: Se uma série X apresenta X = 10 e o(x) = 2 e uma série
Y apresenta y= 100 e o(y) = 5, do ponto de vista da dispersão absoluta, a
série Y apresenta maior dispersão que a série X.
No entanto, se levarmos em consideração as médias das séries, o
desvio padrão de Y que é 5 em relação a 100 é um valor menos significativo
que o desvio padrão de Xque é 2 em relação a 10.
Isto nos leva a definir as medidas de dispersão relativas: coeficiente de
variação e variância relativa.
O coeficiente de variação de uma série X é indicado por C?), definido
por:

A variância relativa de uma série X é indicada por V(x)e definida por:

Note que o coeficiente de variação, como é uma divisão de elementos


de mesma unidade, é um número puro. Portanto, pode ser expresso em
percentual.
Este fato justifica a utilização do denominador ( x ) na~ definição de
V(x).
Deste modo, se calcularmos o coeficiente de variação da série Xcitada
no início obteremos:

Calculando o coeficiente de variação da série Y obteremos:

Comparando os valores destes dois coeficientes concluímos que a


série X admite maior dispersão relativa.
Como a medida de dispersão relativa leva em consideração a medida
de dispersão absoluta e a média da série, é uma medida mais completa que a
medida de dispersão absoluta.
122 Estatística 1

Portanto, a medida de dispersão relativa prevalece sobre a medida r i


dispersão absoluta. Podemos afirmar que a série que tem a maior disperss:
relativa, tem de modo geral a maior dispersão.
Concluindo o exemplo anterior:
A série Y apresenta maior dispersão absoluta.
A série Xapresenta maior dispersão relativa.
Portanto, a série Xapresenta maior dispersão.

5.14 Exercícios Propostos


Responda,justificando em cada caso, as questões abaixo:
a) Qual das séries apresenta maior dispersão absoluta?
b) Qual das séries apresenta maior dispersão relativa?
c) Qual das séries apresenta maior dispersão?

RESPOSTAS
1. A série B possui maior dispersão absoluta, pois apresenta maior desvio padrão.
A série B possui maior dispersão relativa, pois apresenta maior coeficiente de variação.
A série B possui maior dispersão, pois a dispersão relativa prevalece sobre a dispersão absoluta.
2. A série B apresenta maior dispersão absoluta, pois apresenta maior desvio padrão.
A série A apresenta maior dispersão relativa, pois apresenta maior coeficiente de variação.
A série A apresenta maior dispersão, pois a dispersão relativa prevalece sobre a dispersão absoluta.
Medidas de Dispersão 123

3. A série B apresenta maior dispersão absoluta, pois apresenta maior desvio padrão.
A série A apresenta maior dispersão relativa, pois apresenta maior coeficiente de variação.
A série A apresenta maior dispersão, pois a dispersão relativa prevalece sobre a dispersão absoluta.
4. A série A apresenta maior dispersão absoluta, pois apresenta o maior desvio padrão.
A série A apresenta maior dispersão relativa, pois apresenta maior coeficiente de variação.
A série A apresenta maior dispersão, pois a dispersão relativa prevalece sobre a dispersão absoluta.
5. As duas séries apresentam a mesma dispersão absoluta, pois os desvios padrão são iguais.
A s6rie A apresenta maior dispersáo relativa, pois apresenta maior coeficiente de variação.
A série A apresenta maior dispersão, pois a dispersão absoluta prevalece sobre a dispersão relativa.
6. A série B apresenta maior dispersão absoluta, pois apresenta maior desvio padrão.
As séries A e B apresentam mesma dispersão relativa, pois apresentam mesmo coeficiente de varia-
ção.
As séries A e B apresentam a mesma dispersão, pois a dispersão relativa prevalece sobre a dispersão
absoluta.
Medidas de
Assimetria e Curtose

6.1 Introdução
Para conceituar assimetria, obviamente precisamos conceituar sime-
tria.
Diremos que uma distribuição é simétrica quando k = Md = M,
Se isto de fato ocorrer, a curva de frequência tem a seguinte caracte-
rística gráfica:

Se uma distribuição não for simétrica, será classificada como assimé-


trica.
Existem duas alternativas para uma distribuição assimétrica:

No caso (a) A distribuição é classificada de assimétrica positiva.


No caso (b) A distribuição é classificada de assimétrica negativa.
Medidas de Assimetria e Curtose 125

:.2 Medidas de Assimetria


-2.1 COEFICIENTE DE PEARSON

Se A, = O então a distribuição é simétrica.


Se A, < O então a distribuição é assimétrica negativa.
Se A, > O então a distribuição é assimétrica positiva.
Segundo este critério, as distribuições são classificadas da seguinte
Irma:
Se A, 5 -1 : assimétrica negativa forte.
Se -1 < A, < O : assimétrica negativa fraca.
Se A,=O : simétrica.
Se O c A, < 1 : assimétrica positiva fraca.
Se A,> 1 : assimétrica positiva forte.

6.2.2 COEFICIENTE DE BOWLEY

Se A, = O então a distribuição é simétrica.


Se A, < O então a distribuição é assimétrica negativa.
Se A, > O então a distribuição é assimétrica positiva.
O coeficiente de Bowley é um valor que varia de -1 a 1.
Por este critério, as distribuições são classificadas da seguinte forma:
-1 5 A, < -0,3 assimétrica negativa forte.
-0,3 < A, < -0,l assimétrica negativa moderada.
-0,l I A, < O assimétrica negativa fraca.
r 126 Estatística 1

A,=O
O < A, I 0,l
0,l < A, < 0,3
simétrica.
assimétrica positiva fraca.
assimétrica positiva moderada.
0,3 5 A, I I assimétrica positiva forte.

6.3 Medida de Curtose


Observando a concentração dos valores de uma série em torno de scz
moda, podemos observar três situações especiais.
1"aso - Os dados estão fortemente concentrados em torno da modc.
o que faria a curva de frequência ser bastante afilada, como na figura:

2 9 a s o - Os dados estão razoavelmente concentrados em torno da


moda, o que faria a curva de frequência ser razoavelmente afilada, como na
figura:

3Qaso - Os dados estão fracamente concentrados em torno da


moda, o que faria a curva de frequência ser fracamente afilada, como na
figura:
Medidas de Assimetria e Curtose 127

I
I
*
Mo X
(curva achatada no centro)

A medida de curtose procura classificar estes tipos de curvas com


respeito ao afilamento ou achatamento de sua área central.
Para isto, padroniza-se a curva do 2"aso.
Este tipo de curva é classificada como mesocúrtica.
A curva do 1%aso, bastante afilada em sua área central, é denomina-
da leptocúrtica, e a curva do 3" caso, bastante achatada em sua área central,
é denominada platicúrtica.
Para classificar uma distribuição quanto a sua curtose, podemos utili-
zar o coeficiente de curtose dado por:

Se K = O a distribuição é mesocúrtica.
Se K > O a distribuição é leptocúrtica.
Se K < O a distribuição é platicúrtica.

OBSERVAÇÃO: 1) O valor 3, que figura na fórmula de K, representa o


valor da curtose para uma distribuição teórica de pro-
babilidades chamada distribuição normal padrão, que
caracteriza a distribuição mesocúrtica. Esta distribuição
será estudada na sequência do curso.
Se uma distribuição apresenta,
C (xi- x14 4

ela é mesocúrtica e conseqüentemente K = O.


128 Estatística 1

2) A medida de curtose tem a finalidade de complemeri-z


a caracterização da dispersão em uma distribuição.

Exemplos:
1. Classifique, quanto a assimetria, a distribuição abaixo, segundo :
Coeficiente de Pearson.

Cálculo de %

Cálculo da M,: Mo = 2
Medidas de Assimetria e Curtose 129

Cálculo de o(x):

Substituindo-se estes valores obtém-se:

É uma distribuição assimétrica positiva fraca.


2. Classifique, quanto a assimetria a distribuição abaixo segundo o
coeficiente de Bowley.

Classe Int. cl. fi


1 o -1 2 2
2 2 -1 4 5
3 4 -1 6 12
4 6 -1 8 15
5 8 -1 10 1

Cálculo de Q3:
75 x 35
1O0 - %nt 26,25 - 19
Q3 = P75 = G5 + . h = 6+
15
. 2 = 6,97
f75
130 Estatística 1

Cálculo de Q,:
25 x 35
1O 0 - 'ant 8,75 - 7
Q, = P2, = I,, + h = 4+
12
. 2 = 4,29
$5

Cálculo de M;
50 x 35 -

Substituindo-se estes valores, obtém-se:

É uma distribuição assimétrica negativa fraca.


3. Classifique, quanto a curtose, a distribuição abaixo:
População

Classe Int. cl. fj


1 3 -1 5 1
2 5 -1 7 2
3 7 -1 9 13
4 9 -1 11 3
5 11 -I 13 1

Solução:

Cálculo de k
Medidas de Assimetria e Curtose 131

sse Int. cl. - ) 4 f;


(x;-X (xí--
X )2 f;
f; x; xifj
! 3 I- 5 1 4 4 282,5761 16,81
2 5 I- 7 2 6 12 38,8962 8,82
3 71--9 13 8 104 0,0013 0,13
4 9 -1 11 3 10 30 39,0963 10,83
5 11 -I ' 13 1 12 12 231,3441 15,21

Z(X~-X)~ 5 - 591,914 = 29,5957


Cálculo de:
c f; I
- 20
z ( ~ ~ - k )-~-51,8
f-j
Cálculo de: 04(x): 02(x)= - 2,59
z fi - 20

Substituindo-se estes valores, obtém-se:

Como K > O a distribuição é leptocúrtica.

4. Suponha que a tabela do exemplo 1 representasse apenas uma


amostra de uma população.
Neste caso, não conhecemos o desvio padrão populacional o(*.
Devemos substituir o(x) por s(x) nas fórmulas que dependem de o(x).
Desta forma, o coeficiente de Pearson para amostras é escrito:

e o coeficiente de curtose para amostras é escrito:


132 Estatística 1

Com estas considerações, para o exemplo 1


z (x,.- x ) fi~
2(x) = - 38'64 - 1,61 e s(x) = jr;61 = 1,27
xfi-1 25-1
O coeficiente de Pearson é:

A distribuição é assimétrica positiva fraca.


Quanto ao exemplo 3, se a tabela representa apenas uma amostra da
população, então:

Portanto,

O coeficiente de curtose vale:

Como K > O, a distribuição é leptocúrtica.

6.4 Exercícios Propostos


1. Classifique, quanto a assimetria, a distribuição abaixo, segundo o coeficiente de
Pearson.
População
Medidas de Assimetria e Curtose 133

2. Classifique, quanto a curtose a distribuição do problema anterior.


3. Classifique, quanto a assimetria, a distribuição abaixo, segundo o coeficiente de
Bowley
Amostra

10

1o
11

4. Classifique, quanto a curtose, a distribuição do problema anterior.


5. Classifique, quanto a assimetria, a distribuição abaixo, segundo o coeficiente de
Pearson.
Amostra
classe I Int. cl. I f;

6. Classifique, quanto a curtose, a distribuição do problema anterior.


7. Classifique, quanto a assimetria, a distribuição abaixo, segundo o coeficiente de
Bowley
Amostra
Classe Int. cl.

7 -1
4 9 -1 11 19
5 11 -1 13 17

8. Classifique quanto a curtose, a distribuição do problema anterior.

RESPOSTAS
- 5-5
1. x = 5: Mo= 5; o(x) = 1,53. A, = -= O. Distribuição simétrica.
133

- E (xi-i)4 464
2. x = 5; ----
34 - 13,6471; o(x) = 153; 04(x)= 5,4798. K = -0,51. Distribuiçãoplaticúriica.
L 'i

8+6,5-14
3. Q3=8;Q,=6,5;Md=7;A,= = 0,33. Distribuição assimétrica positiva forte.
8 - 6,5
134 Estatística 1

- 6,35 - 5,43
5. x = 6,35; Mo = 5,43; s2(x) = 15,87;~ ( x=) 3,98; A, = = 0,23. Distribuição assimétrica pos? ?
3,98
fraca.

A distribuição é leptocúrtica.
7. Q, = 10,58; Q,= 5,875; M, = 8,33. A, = -0,044. Curva assimétrica negativa fraca.

Exercícios Gerais
1. Uma empresa produz caixas de papelão para embalagens e afirma que o númer
de defeitos por caixa se distribui conforme a tabela:
População

Pede-se:
1.1. O número médio de defeitos por caixa.
1.2. A distribuição de frequências.
1.3. A porcentagem de caixas com dois defeitos.
1.4. A porcentagem de caixas com menos que três defeitos.
1.5. A porcentagem de caixas com mais que três defeitos.
1.6. O histograma.
1.7. O número mediano de defeitos por caixa.
1.8. A moda.
1.9. A amplitude.total da série.
1.10. O desvio médio simples.
1.11. A variância.
1.12. O desvio padrão.
1.13. O coeficiente de variação,
1.14. A variância relativa.
1.15. Q,.
1.16. Q3.
1.17. PIO.
1.18. D6.
Medidas de Assimetria e Curtose 135

1.19. Pgo.
1.20. K4.
1.21. O percentual de elementos da série situados entre Q1 e K4.
1.22. O número aproximado de caixas entre o Plo e Q3.
1.23. Classifique, quanto a assimetria, a distribuição segundo o coeficiente de
Pearson.
1.24. Classifique, quanto a assimetria, a distribuição segundo o coeficiente de
Bowley
1.25, Classifique, quanto a curtose, a distribuição.
2. Uma amostra aleatória de 250 residências de famílias, classe média, com dois
filhos, revelou a seguinte distribuição do consumo mensal de energia elétrica.
Classe Consumo mensal (kwh) NQde famíiias
1 O- I 50 2
2 50- 1 1O0 15
3 100- 1 150 32
4 150- 1 200 47
5 200- 1 250 50
6 250- 1 300 80
7 300- 1 350 24

Pede-se:
2.1. O consumo médio por residência.
2.2. A distribuição de frequências.
2.3. A porcentagem de famílias com consumo mensal maior ou igual a 200 e
menor que 250 kwh.
2.4. A porcentagem de famílias com consumo mensal menor que 200 kwh.
2.5. A porcentagem de famílias com consumo maior ou igual a 250 kwh.
2.6. O histograma e o polígono de frequência.
2.7. O consumo mediano.
2.8. A moda.
2.9. A amplitude total da série.
e 2.10. O desvio médio simples.
2.11. A variância.
2.12. O desvio padrão.
2.13. O coeficiente de variação.
2.14. A variância relativa.
2.15. Q,.
2.16. Q3.
2.17. P,,.
2.18. D6.
2.19. Pgo.
136 Estatlstica 1

2.20. K4.
2.21. O percentual de famílias classificadas entre Q1 e K4.
2.22. O número aproximado de famílias classificadas entre PIO e Q3.
2.23. Classifique, quanto a assimetria, a distribuição segundo o coeficiente de
Pearson.
2.24. Classifique, quanto a assimetria, a distribuição segundo o coeficiente de Bowley
2.25, Classifique, quanto a curtose, a distribuição.
Uma rede de lojas afirma que as vendas diárias de televisores obedecem a se-
guinte distribuição:
População
Classe NQe televiçoresldia N V e dias
1 o -I 20 5
2 20- 1 40 25
3 40- 1 60 40
4 60- 1 80 15
5 80- 1 1 O0 1O
6 1 O0- 1 120 5
Pede-se:
3.1. O número médio de televisores vendidos por dia.
3.2. A distribuição de frequências.
3.3. A porcentagem de dias em que a venda de televisores é maior ou igual a 60
e menor que 80.
3.4. A porcentagem de dias em que a venda de televisores é menor que 60.
3.5. A porcentagem de dias em que a venda de televisores é maior ou igual a 80.
3.6. O histograma e o polígono de frequência.
3.7. O número mediano de televisores vendidos.
3.8. A moda.
3.9. A amplitude total da série.
3.10. O desvio médio simples.
3.11. A variância.
3.12. O desvio padrão.
3.13. O coeficiente de variação.
3.14. A variância relativa.
3.15. Q,.
3.16. Q3.
3.17. Pl,.
3.18. D,.
3.19. P,.
3.20. K4.
3.21, O percentual de dias entre Ql e K4.
Medidas de Assimetria e Curtose 137

3.22. O número aproximado de dias entre P1 e Q3.


3.23. Classifique, quanto a assimetria, a distribuição segundo o coeficiente de
Pearson.
3.24. Classifique, quanto a assimetria, a distribuição segundo o coeficiente de
i30wley
3.25. Classifique a distribuição, quanto a curfose.
4. Uma auditoria em uma grande empresa observou o valor de 50 notas fiscais
emitidas durante um mês. Esta amostra apresentou a seguinte distribuição:

Classe Valor da nota NWe notas


io3 $
1 7 -1 12 2
2 12 -1 17 5
3 17 -1 22 13
4 22 -1 27 10
5 27- 1 32 9
6 32 -1 37 6
7 37- 1 42 5

Pede-se:
4.1. O valor médio das notas.
4.2. A distribuição de frequências.
4.3. A porcentagem de notas com valor maior ou igual a $ 17.000 e menor que
$22.000
4.4. A porcentagem de notas com valor menor que $32.000.
4.5. A porcentagem de notas com valor maior ou igual a $32.000.
4.6. O histograma e o polígono de frequência.
4.7. O valor mediano das notas.
4.8. A moda.
4.9. A amplitude da série.
4.10. O desvio médio simples.
4.11. A variância.
, 4.12. O desvio padrão.
4.13. O coeficiente de variação.
4.14. A variância relativa.
4.15. Q,.
4.16. Q3.
4.17. PIO.
4.18. D6'
4.19. Pgo.
4.20. K4.
4.21. O percentual de notas entre Q1 e K4.
138 Estatística 1 i

4.22. O número aproximado de notas entre PIO e Q3. 1


4.23. Classifique, quanto a assimetria, a distribuição segundo o coeficiente dc I

Pearson. I

4.24. Classifique, quanto a assimetria, a distribuição segundo o coeficiente c-r I


Bowley
4.25. Classifique a distribuição quanto a curtose.

RESPOSTAS
-
1.1. x = 1
1.2.
Xl fl fr! 'Yo Fl Fr, 'Yo
O 32 32/79 40,51 32 32/79 40,51
1 28 28/79 35,44 60 60/79 75,95
2 11 I 1/79 13,92 71 71/79 a9,87
3 4 4/79 5,06 75 75/79 94,93
4 3 3/79 3,80 78 78/79 98,73
5 1 1/79 1,27 79 79/79 I 00

1.7. Md= 1
1.8. M,=O
1.9. A, = 5
1.70. DMS = 0,81
1.1 1. C?(*
= 1,29
1.12. o(* = 1,14
1.13. Cyii>=1,14
1.14. V(X) = 1.29
1.15. Q, =O
1.16. Q3= 1
1.17. P,, =O
Medidas de Assimetria e Curtose 139

1.18. D, = 1
1.19. P9,=2,5
1.20. K, = 2
1.21. 55%
1.22. 52
1.23 A, = 0,88. Assimétrica positiva fraca.
1.24. A, = -1. Assimétrica negativa forte.
1.25. K = 1,54. Leptocurtica.
2.1. 217,8
2.2.
XI Int. CI. fl f.; 70 FI FR, 70
1 O- I 50 2 21250 0,80 2 21250 0,80
2 50- 1 100 15 151250 6,OO 17 171250 6,80
3 100 -1 150 32 321250 12.80 49 491250 19,60
4 150- 1 200 47 471250 18,80 96 961250 38,40
5 200- 1 250 50 501250 20,OO 146 1461250 58,40
6 250- 1 300 80 801250 32,OO 226 2261250 90,40
7 300- 1 350 24 241250 9,60 250 2501250 100,OO
140 Estatística 1

2.17. 112,5
2.18. 252,5
2.19. 299,38
2.20. 283,75
2.21. 55%
2.22. 163
2.23. - 0,69.Assimétrica negativa fraca.
2.24. - 0,159.Assimétrica negativa moderada.
-
2.25. 0,65.Platicúrtica.
3.1. 53
3.2.
Classe No de
televisores1 dia
N9de
dias
f., Yo FI F., Yo

1 O- I 20 2 511 O0 5 5 51100 5
2 201- 40 25 251100 25 30 301100 30
3 40- 1 60 40 401100 40 70 701100 70
4 601- 80 15 15l100 15 85 851100 85
5 80- 1 100 10 101100 10 95 951100 95
6 100- 1 120 5 511 O0 5 100 1001100 100
Medidas de Assimetria e Curtose 141

66,67
24
55
90
73,33
55%
65
0,23.Assimétrica positiva fraca.
0,087.Assimétrica positiva fraca.
- O,031. Platicúrtica.
$25.200

Classe Valor da nota Nede fr, 'XO F~ F ~ i %


103 $ notas
1 7 -1 12 2 2/50 4 2 2/50 4
2 121- 17 5 5/50 10 7 7/50 14
3 171- 22 13 13/50 26 20 20150 40
4 22- 1 27 10 10/50 20 30 30150 60
5 27- 1 32 9 9150 18 39 39/50 78
6 32- 1 37 6 6/50 12 45 45/50 90
7 371- 42 5 5/50 10 50 50150 100
142 Estatística 1

4.13. 32%
4.14. 10,29%
4.15. $ 19.115,38
4.16. $31.166,67
4.17. $ 15.000,OO
4.18. $27.000,00
4.19. $37.000,00
4.20. $32.833,33
4.21 55%
4.22. 33
4.23. 0,56. Assimétrica positiva fraca.
4.24. 0,106. Assimétrica positiva moderada.
4.25. - 0.85. Platicúrtica.
7.1 Introdução
Quando solicitados a estudar um fenômeno coletivo, verificamos a
necessidade de descrever tal fenômeno por um modelo matemático que per-
mita explicar da melhor forma possível este fenômeno.
A teoria das probabilidades permite construir modelos matemáticos
que explicam um grande número de fenômenos coletivos e fornecem estraté-
gias para a tomada de decisões.
Iniciaremos o estudo da teoria das probabilidades enfocando o objeto
de estudo do cálculo de probabilidades.

Entendemos por fenômeno qualquer acontecimento natural.


Se observarmos os fenômenos com respeito a seus possíveis resulta-
dos, podemos classificá-los em dois tipos:

a) determinísticos;
b) aleatórios.

a) Fenômenos determinísticos - são aqueles que repetidos sob


mesmas condições iniciais conduzem sempre a um só resultado. As condi-
ções iniciais determinam o único resultado possível do fenômeno.
b) Fenômenos aleatórios - são aqueles que repetidos sob mesmas
condições iniciais podem conduzir a mais que um resultado. As condições
iniciais não determinam o resultado do fenômeno.

COMENTÁRIO: Embora teoricamente tenhamos exigido as repetições,


nas mesmas condições iniciais, isto na prática dificilmente ocorre. Mesmo
quando procuramos manter as mesmas condições iniciais, pequenas varia-
ções certamente ocorrerão. Isto provocará alterações no resultado final.
144 Estatística 1

i Se estas alterações forem mínimas, para a maioria das aplicações


práticas elas poderão ser desprezadas. Poderemos afirmar que c
resultado final é único, e classificar o fenômeno como determinísti-
CO.

i Se estas alterações forem significativas, então o fenômeno será


classificado de aleatório.

Exemplos:
1. Se deixarmos uma massa M cair em queda livre de uma altura de
1 metro sobre uma superfície, poderemos anotar o tempo t, de queda livre.
Ao tentarmos repetir o fenômeno, dificilmente conseguiremos as mes-
mas condições iniciais. Certamente repetiremos o fenômeno em condições
muito próximas das iniciais.
Estas pequenas alterações nas condições iniciais provocarão peque-
nas alterações no tempo de queda. Para a maioria das aplicações, estas
pequenas alterações no tempo de queda podem ser desprezadas e afirma-
mos que o resultado é único. O fenômeno é classificado como determinístico.

2. Se lançarmos um dado sobre uma superfície, podemos anotar o


número de pontos da face superior do dado.
Da mesma forma que no exemplo anterior, dificilmente conseguiremos
repetir o lançamento nas mesmas condições anteriores.
Estas pequenas variações que certamente ocorrerão na repetição do
lançamento podem provocar substanciais mudanças no número de pontos
apresentados na face superior do dado.
Estas mudanças não podem em geral ser desprezadas e consequen-
temente o fenômeno admitirá, por repetição, mais que um resultado. Desta
forma, este fenômeno é classificado como aleatório.
Quando um fenômeno é determinístico, a teoria das probabilidades
não fornece um modelo adequado para a explicação do fenômeno.
A teoria das probabilidades só é útil e deve ser aplicada quando lidar-
mos com um fenômeno aleatório.
Portanto, o objeto de estudo da teoria das probabilidades são os fenô-
menos aleatórios.
Para facilitar o desenvolvimento da teoria sem usar recursos matemáti-
cos mais sofisticados, vamos restringir nosso estudo a uma classe de fenôme-
nos aleatórios chamados experimentos.
Os experimentos são fenômenos aleatórios que possuem as seguintes
características:
Probabilidades 145

a) repetitividade;
b) regularidade.

a) Repetitividade: é a característica de um fenômeno de poder ser


repetido quantas vezes quisermos.
Se por algum motivo não pudermos repetir sistematicamente o fenô-
meno, ele não será classificado como experimento.
b) Regularidade: é a característica que diz respeito a possibilidade
da ocorrência dos resultados do fenômeno. A avaliação numérica da possibili-
dade de ocorrência destes resultados dará origem as probabilidades.

7.2 Teoria das Probabilidades - Espaço Amostral


Como o objeto de nosso estudo são os experimentos e eles admitem
mais do que um resultado, faz sentido definir o conjunto de todos os possíveis
resultados do experimento.
Este conjunto será denotado por S e denominado espaço amostral do
experimento.
Exemplos: O experimento consiste em:

1. Lançar uma moeda e anotar a face superior.


Se representamos cara com a letra c e coroa com a letra k, então o
espaço amostral do experimento é S = {c, k}

OBSERVAÇÃO: Para evitar complicações, recomendamos que o inte-


ressado sempre raciocine em termos de materiais ideais.

A moeda que utilizamos no caso anterior deve ser imaginada como


duas calotas coladas adequadamente com as faces cara e coroa convencio-
nadas por duas cores distintas. O material, é claro, deve ser homogêneo.
O dado idealizado, com o qual trabalharemos no próximo exemplo,
deve ser um cubo perfeito com o número de pontos convencionado por cores.

2. Lançar um dado e anotar o número de pontos da face superior.


O espaço amostral é: S = (1, 2,3, 4, 5,6).

3. Retirar uma carta de um baralho comum de 52 cartas e anotar o


naipe da carta selecionada.
O espaço amostral é: S = {paus, copas, ouros, espadas}
146 Estatística 1

4. Lançar duas moedas e observar as faces superiores.


1
O espaço amostral é: S = {cc, ck, kc, kk}.
I
5. Lançar uma moeda sucessivamente, até que se obtenha a primei-
ra face cara. Anota-se como resultado do experimento a sequência de caras e
coroas do primeiro ao último lançamento.
O espaço amostral é: S = {c, kc, kkc, kkkc, ...}.
6. Escolher um ponto P ao acaso no intervalo [3, 121 e anotar a
distância do ponto escolhido P ao ponto 5.
O espaço amostral é: S = { d E R I O I d á 7).
Os espaços amostrais podem ser finitos ou infinitos.
Os exemplos 1, 2, 3 e 4 apresentam espaços amostrais finitos.
Os exemplos 5 e 6 apresentam espaços amostrais infinitos.
Para evitar recursos matemáticos mais sofisticados, vamos estudar
apenas os espaços amostrais finitos.
Uma excelente técnica para não omitirmos resultados do experimento
na construção de seu espaço amostral está baseada no princípio fundamental
da contagem, que estabelece:
Se um procedimento A pode ser realizado de n maneiras diferentes e
um procedimento B pode ser realizado de rn maneiras diferentes, então o
encadeamento dos procedimentos A e B pode ser feito de n.m maneiras
diferentes.
Isto sugere uma disposição gráfica chamada diagrama de árvore.
O espaço amostral do exemplo 4, lançamento de duas moedas e
observação das faces superiores, pode ser obtido utilizando-se esta técnica.
Para efeito da observação das faces superiores, lançar simultanea-
mente duas moedas é o mesmo que-lançar uma moeda duas vezes.
No primeiro lançamento há duas ocorrências possíveis. No segundo
lançamento há também duas ocorrências possíveis. A sequência dos dois
lançamentos terá 2.2 = 4 ocorrências possíveis, que podem ser representadas
na forma do diagrama de árvore:
l Qlançamento ZQlançamento
Probabilidades 147

0 s possíveis resultados estão estabelecidos em cada ramo da árvore:


S = {cc, ck, kc, kk}.

7.3 Eventos
Evento é qualquer subconjunto do espaço amostral do experimento.
Exemplo: Se considerarmos o lançamento de um dado e a observação
l a face superior, então o espaço amostral do experimento é: S = (1, 2, 3, 4, 5 ,
5).
Note que A = { I , 2); B = (2,4, 6); C = { j; S são subconjuntos de S e
~ortantosão eventos.
Os eventos podem ser enunciados na linguagem usual. Assim, enun-
ciaremos A como: sair face 1 ou face 2 no lançamento de um dado.
Há, normalmente, várias maneiras equivalentes de se enunciar um
mesmo evento.
O evento A também poderia ser enunciado como: sair face menor que
3 no lançamento de um dado.
O evento B é enunciado como: sair face 2 ou face 4 ou face 6 no
lançamento de um dado. Isto é equivalente a afirmar: sair face par no lança-
mento de um dado.
Para enunciar o evento C, basta usar qualquer propriedade que não
caracterize nenhum dos valores de S.
Deste modo, C pode ser enunciado como: sair face 8 no lançamento
de um dado.
Note que cada elemento que constitui o evento é um possível resulta-
do do experimento.
Assim sendo, quando realizamos o experimento uma só vez, apenas
um dos elementos do espaço amostral irá ocorrer não ocorrendo os demais.
Diremos então que um evento A ocorre quando ocorrer, como resulta-
do do experimento, um dos elementos de A.
De modo resumido, podemos afirmar que um evento A ocorre quando
ocorrer um de seus pontos.
No exemplo inicial, se lançarmos o dado e sair face 4, diremos que:
não ocorreu o evento A; ocorreu o evento B; não ocorreu o evento C; ocorreu
o evento S.
O conjunto vazio é subconjunto de qualquer conjunto. Portanto, em
qualquer espaço amostral C = { } é sempre um evento.
148 Estatística 1

Observe que o evento C = { ) não possui elementos, portanto este


evento nunca ocorrerá. Neste sentido, C é denominado evento impossível.
Note também que todo conjunto é subconjunto de si próprio.
Desta forma, o próprio espaço amostra1 S é sempre um evento.
Como S contém todos os possíveis resultados do experimento, S cer-
tamente ocorrerá.
Neste sentido, S é denominado evento certo.

7.4 Operações com Eventos


Como eventos são conjuntos, podemos usar as operações de conjun-
tos para os eventos.
Assim:

Exemplo: Se considerarmos o lançamento de um dado e a observação


da face superior, então S = { I , 2, 3, 4, 5, 6}.
Se A = {I, 2, 3); B = {2,3 ,6); C = {2, 3, 4) então:
A U B = { l , 2, 3, 6)
A n C={2, 3)
CA= (4, 5, 6)
C B = {I, 4,s)
C(Au B) = (4,s)
Quando um evento possui apenas um elemento, ele é chamado even-
to simples.
Eventos com mais de um elemento são chamados eventos compostos.
Se considerarmos o lançamento de um dado e a observação da face
superior, então S = { I , 2, 3, 4, 5, 6). A = (21, B = (51, C = {3} são exemplos de
eventos simples.
Os eventos D = { 2, 31, E = (4, 61, F = {2, 3, 4, 5) são exemplos de
eventos compostos.
Observando os eventos D = (2, 3} e B = (5) notamos que eles não
possuem elemento comum, isto é, D n B = { }.
Probabilidades 149

Portanto, se D ocorre, B não pode ocorrer ao mesmo tempo; e. se B


ocorrer, D não pode ocorrer ao mesmo tempo.
Dizemos então que a ocorrência de D exclui a possibilidade de ocor-
rência de A e a ocorrência de A exclui a possibilidade de ocorrência de B. Eles
se excluem mutuamente. Portanto, são mutuamente exclusivos.
De modo geral, se A e B são eventos quaisquer, diremos que:

A e B são mutuamente exclusivos se A n B = 0

7.5 Exercícios Propostos


1. Considere o espaço amostral do lançamento de um dado e a observação da face
superior.
Descreva, por seus elementos, os seguintes eventos:
a) A: sair face par.
b) 9: sair face primo.
c) C: sair face maior que 3.
d) D: sair face maior que 6.
e) E: sair face múltipla de 3.
f) F: sair face menor ou igual a 4.
2. Considere o espaço amostral S = {I,2, 3, 4, 5, 6, 7, 8, 9, 10) e os seguintes
eventos:
A = 12, 3, 4)
B = {I, 3, 5, 7, 9)
c = {5}
D = {1,2, 3)
E = 12,4, 6)
Determine:
a) A u B
b) A n B
C) CA
d) CB
e) C ( A u B)
f) A n C
3. Dos eventos A, B, C, D e E do problema anterior, quais são mutuamente exclusi-
vos ?
4. O experimento consiste em lançar dois dados e observar a soma dos pontos das
faces superiores.
Determine o espaço amostral (Sugestão: use o diagrama de árvore).
150 Estatística 1

5. O experimento consiste em lançar dois dados e observar a diferença dos pontos I


das faces superiores. Determine o espaço amostral do experimento. (Sugestão:
use o diagrama de árvore).
6. O experimento consiste em lançar dois dados e observar o produto dos pontos
das faces superiores. Determine o espaço amostral do experimento. (Sugestão:
use o diagrama de árvore).
7. O experimento consiste em lançar dois dados e observar, em módulo, a diferença
dos pontos das faces superiores. Determine o espaço amostral do experimento.
(Sugestão: use o diagrama de árvore).
8. O experimento consiste em lançar três moedas e observar a diferença entre o
número de caras e o número de coroas obtidos neste lançamento. (Sugestão: use
o diagrama de árvore).
9. O experimento consiste em retirar duas cartas de um baralho comum e anotar
ordenadamente os naipes destas cartas. Determine o espaço amostral do experi-
mento, (Sugestão: use o diagrama de árvore).
10. Uma urna contém duas peças defeituosas e três peças boas. Uma a uma as
peças serão retiradas sem reposição, e analisadas. O experimento será encerrado
quando as peças defeituosas forem identificadas.
Anota-se como resultado do experimento a sequência de peças boas e defei-
tuosas analisadas. Determine o espaço amostral do experimento (Sugestão: use
o diagrama de árvore).

RESPOSTAS
1. a) A={2,4,6)
I
b) B = (2, 3, 5)
C) C = {4, 5, 6)
d) D = { )
e) E = (3, 6)
i) F={1, 2,3,4)
2. a) AuB={1,2,3,4,5,6,7,9)
b) A v B = {3)
C) CA= {I, 5, 6, 7, 8, 9, 10)
d) C s = { 2 , 4 , 6,8, 10).
e) C ( A U B ) = { ~ ,10)~,
i) A v C = { )
3. AeC;BeE;CeD;CeE.
4. S={2, 3, 4,5, 6, 7, 8, 9, 10, 11, 12)
5. S={-5,-4,-3,-2,-1,0,1,2,3,4,5)
6. S = { l , 2 , 3,4,5,8, 9, 10, 12, 15, 16, 18,20,24,25, 30,361
7. S={O, 1,2,3,4,5}
8. S={-3,-1, 1.3)
9. Espadas = E, Paus = F! Ouros = O, Copas = C; S = {CC, CE, CF: CO, PC, PE, PF: PO, EC, EE, EF: EO,
o c , OF: OE, 0 0 )
10. S = {BBB, BBDB, BBDD, BDBB, BDBD, BD4 DBBB, DBBD, DBD, DO)
Probabilidades 151

7.6 Função de Probabilidade


Uma vez identificado o espaço amostral S = {a,, a2,...,a}, de um expe-
rimento, podemos associar a cada elemento a,, a2,...,a, sua possibilidade de
ocorrência.
Do ponto de vista matemático, esta associação é uma função chamada
função de probabilidade, que definiremos da seguinte forma:
Função de probabilidade é uma função definida no espaço amostral S
1 do experimento, assumindo valores reais, com as seguintes propriedades:

COMENTÁRIO: O valor p(aJ é denominado probabilidade de ocorrên-


cia do resultado ai.
É evidente que quando um elemento não tem possibilidade de ocorrer,
dizemos que sua probabilidade de ocorrer é zero. E quando um elemento
ocorrerá certamente, dizemos que sua probabilidade de ocorrência é 100% ou 1.
Por outro lado, quando somarmos as probabilidades de ocorrências de
todos os elementos do espaço amostral, isto deve corresponder a prob-
abilidade máxima possível, que é 100%.
Veja na sequência como determinar os valores p(aJ.

1 7.7 Definição de Probabilidade


1
Existem três formas de se definir probabilidade. A escolha da forma
1 depende da natureza da situação.

Aplica-se as situações em que os resultados que compõem o espaço


amostral ocorrem com mesma regularidade, ou seja, os resultados são equi-
prováveis.
Deste modo definimos:
152 Estatística 1

onde:
n(ai)é o número de casos favoráveis a realização de a,
n é o número total de casos possíveis.

I
I
2" Forma: PROBABILIDADE FREQUENCIALISTA

Deve ser aplicada quando não se conhece a regularidade dos resulta-


dos.
Este processo baseia-se na evolução da frequência relativa do resulta-
do a , a medida que o número de repetições do experimento cresce. Matemati-
camente:

r - 7
P(aJ = lim (fr (ai))

38 Forma: PROBABILIDADE PERSONALISTA

Há situações em que os resultados do experimento não ocorrem com


mesma regularidade e não há possibilidade de se repetir sucessivamente o
experimento, ou seja, não podemos aplicar nem a forma clássica e nem a
forma frequencialista de probabilidades.
Nesta situação, devemos socorrer-nos de um especialista neste tipo de
experimento, para que ele nos dê sua opinião pessoal a respeito do valor da
probabilidade de cada resultado.
Este é um processo subjetivo de avaliação de probabilidades.
Exemplos:
1. O experimento consiste no lançamento de uma moeda e na obser-
vação da face superipr. Determine o espaço amostral do experimento e a
função de probabilidades.
Solu~ão:O espaço amostral é S = {c, k}.
Os elementos c e k que compõem o espaço amostral são equiprová-
veis.
Usando o conceito clássico de probabilidades, avaliamos:
Probabilidades 153

Portanto, a função de probabilidade neste caso é:

2. O experimento consiste no lançamento de um dado e na observa-


ção da face superior. Determine o espaço amostral do experimento e a função
de probabilidade.
Solução: O espaço amostral é S = { I , 2, 3, 4, 5, 6). Os elementos que
compõem o espaço amostral são equiprováveis.
Usando o conceito clássico de probabilidades, avaliamos:

A função de probabilidade neste caso tem a apresentação:

3. O experimento consiste no lançamento de duas moedas e na ob-


servação do número de caras obtidas neste lançamento. Determine o espaço
amostral e a função de probabilidade.
Solução: O espaço amostral do experimento é S = {O,1,2}.
O resultado O (zero) caras só ocorre quando ocorrer (k, k) no lança-
mento das moedas.
O resultado 2 só ocorre quando ocorrer (c, c) no lançamento das moedas.
O resultado 1 ocorre quando ocorrer (c, k) ou (k, c) no lançamento das
moedas.
Portanto, o resultado 1 tem o dobro de possibilidade de ocorrer que o
resultado 2 ou o resultado zero.
154 Estatística 1

A função de probabilidade neste caso é:


S R
1 ~ ( 0=) '4 (k, k)
2 ~(1)='/2 (c,k)(k,c)
3 p(2)='4 (c,c)
4. O experimento consiste no lançamento de dois dados e na obser-
vação da soma dos pontos das faces superiores. Determine o espaço amos-
tral do experimento e a função de probabilidade.
Solução: O espaço amostral do experimento é S = (2, 3, 4, 5, 6, 7, 8, 9,
10,11,12}.
Estes resultados não são equiprováveis, pois há várias combinações
que conduzem a soma 6, enquanto apenas uma combinação conduz a soma
2.
A função de probabilidade é:

5. O experimento consiste em selecionar ao acaso uma família e


observar o número de filhos do casal. Determine o espaço amostral do experi-
mento e a função de probabilidade.
Solução: O espaço amostral do experimento é S = {O, 1, 2, 3, ..., n}.
Estes resultados não são equiprováveis e, embora haja regularidade
dos resultados, esta regularidade não pode ser avaliada pelo processo clássi-
co.
Como o experimento pode ser facilmente repetido, recorremos ao con-
ceito frequencialista de probabilidades.
I Probabilidades 155

Vejamos como calcular a probabilidade do primeiro resultado. Os de-


mais podem ser obtidos exatamente da mesma maneira.
Selecionamos inicialmente 10 famílias e verificamos a frequência relati-
va de famílias com zero filho.
Aumentamos o número de famílias para 20 e novamente calculamos a
frequência relativa de famílias com zero filho.
Aumentamos sucessivamente o número de famílias para 30, 40, 50,
100, sempre recalculando a frequência relativa de famílias com zero filho.
Com isto, obtemos uma sequência de valores para a frequência relati-
va de famílias com zero filho que convergirá rapidamente para um valor real c,
isto é,

lim fqO) = c
n+-

I Diremos então que P(0) = c.


Este procedimento pode ser adotado em todos os casos onde o con-
ceito clássico de probabilidades é aplicado. No entanto, é um processo mais
caro, mais demorado e mais trabalhoso.
6. O experimento consiste em verificar o resultado da tramitação de
um projeto de lei na Câmara dos Deputados. Determine o espaço amostral e a
função de probabilidade associada.
Solução: O espaço amostral do experimento é S = {aprovado, reprova-
do).
A regularidade destes resultados não pode ser avaliada pelo conceito
clássico de probabilidade.
A repetição do experimento neste caso não é um processo eficiente
devido a diferença entre as naturezas dos projetos julgados.
Só nos resta a possibilidade de usar o processo personalista de pro-
babilidade. Devemos consultar um especialista neste tipo de assunto que irá
avaliar a probabilidade de o projeto ser aprovado ou rejeitado.

7.8 Exercícios Propostos


1. Considere o seguinte espaço amostral de um experimento: S = 12, 3, 5, 8). Verifi-
que se a função:
156 Estatística 1

S- P R
2- p(2) = 0,25
3- p(3) = 0,25
5- p(5) = O, 15
8- p(8) = 0,05
pode ser uma função de probabilidade associada a este espaço amostral.
2. Considere o seguinte espaço amostral de um experimento: S = { I , 2, 4, 7, 8).
Verifique se a função:
S ~ R
1- ~ ( 1=) o, 1
2- ~ ( 2=) 0 2
4- ~ ( 4=) 0 4
7- ~ ( 7=) o, 7
8- ~ ( 8=) Ora
pode ser uma função de probabilidade associada, a este espaço amostral.
3. Considere o seguinte espaço amostral de um experimento: S = {O, 2, 4, 5)
Verifique se a função:
S ~ R
o- ~ ( 0=) 0,3
2- ~ ( 2=) 0 2
4- ~ ( 4=) 0,3
5- ~ ( 5=) 0 2
pode ser uma função de probabilidade associada a este espaço amostral.
4. O experimento consiste em lançar dois dados e observar o dobro da soma dos
pontos das faces superiores. Determine a função de probabilidade.
5. O experimento consiste em lançar dois dados e observar a diferença dos pontos
das faces superiores. Determine a função de probabilidade.
6. O experimento consisfe em lançar dois dados e observar, em módulo, a diferença
dos pontos das faces superiores. Determine a função de probabilidades.
7. O experimento consiste em lançar dois dados e observar o produto dos pontos
das faces superiores. Determine a função de probabilidade.
8. O experimento consiste em lançar três moedas e observar a diferença entre o
número de caras e o número de coroas obtidos neste lançamento. Determine a
função de probabilidade.
9. O experimento consiste em retirar ao acaso uma bola de uma urna que contém 20
bolas iguais em peso e volume; sendo 5 bolas brancas, 8 bolas pretas e 7 bolas
amarelas, e anotar sua cor. Determine a função de probabilidade.
10. O espaço amostral de um experimento é S = {1, 2, 7, 10). Se as probabilidades de
ocorrência destes valores são diretamente proporcionais aos respectivos valores,
determine a função de probabilidade associado a este espaço amostral.
Probabilidades 157

RESPOSTAS
1. +
Não, pois L p(aJ 1
2. Não, pois L p(aJ # 1
3. Sim, pois as condições (1) O lp(aJ S 1 e (2) L p(aJ = 1 estão satisfeitas.
158 Estatística 1

7.9 Probabilidade de um Evento


A probabilidade de ocorrência de um evento A, que indicaremos por
p(A), é a soma das probabilidades dos elementos que pertencem a A.
Exemplo: O experimento consiste no lançamento de um dado e na
observação da face superior. Determine a probabilidade de cada um dos
eventos abaixo:

a) Sair face 2 ou face 3.


b) Sair face ímpar.
c) Sair face maior que 1.
d) Sair face 5.
e) Sair face 1 ou 2 ou 3 ou 4 ou 5 ou 6.
f) Sair face múltiplo de 9.
Solução: Inicialmente, determinaremos o espaço amostral e a função
de probabilidade.
O espaço amostral é S = {I, 2, 3, 4,5, 6).
A função de probabilidade é dada por:
Probabilidades 159

a) A = (2, 3). Segundo a definição de probabilidade de um evento,


P(A) = ~ ( 2+) ~ ( 3 ) .
1 1
A função de probabilidade estabelece que p(2) = - e p(3) = -.
6 6
Desta forma,

b) B = (1, 3, 5) e p(B) = p(1) + p(3) + p(5). Portanto:

7.10 Exercícios Propostos


1. No lançamento de dois dados e na observação da soma dos pontos das faces
superiores, determine a probabilidade de cada um dos eventos seguintes:
1.1. A-Asomaserpar.
1.2. B - A soma ser ímpar.
1.3. C - A soma ser múltiplo de 3.
1.4. D - A soma ser número primo.
1.5. E - A soma ser maior ou igual a 7.
1.6. F - A soma ser maior que 12.
160 Estatística 1

2. No lançamento de dois dados e na obsen/ação do produto dos pontos das face:


superiores determine a probabilidade dos seguintes eventos:
2.1. A - O produto ser menor que 10.
2.2. B - O produto ser um número de 5 a 12.
2.3. C - O produto ser um número entre 5 e 12.
2.4. D - O produto ser menor ou igual a 10.
2.5. E - O produto ser no máximo 20.
2.6. F - O produto ser múltiplo de 4.
3. O quadro abaixo representa a classificação por sexo e por estado civil, de u r
conjunto de 50 deputados presentes em uma reunião.
H M

Casado 1O 8
Solteiro 5 3
Desquitado 7 5
Divorciado 8 4

Uma pessoa é sorteada ao acaso. Determine a probabilidade dos eventos:


3.1. A - Ser um homem.
3.2. B - Ser uma mulher.
3.3. C - Ser uma pessoa casada.
3.4. D - Ser uma pessoa solteira.
3.5. E - Ser uma pessoa desquitada.
3.6. F - Ser uma pessoa divorciada.
4. O quadro abaixo representa a classificação de um grupo de 30 mulheres, segundo
o estado civil e a cor dos cabelos:
Cor dos cabelos Loira Morena Ruiva

Casada 5 8 3
Solteira 2 4 1
Viúva O 1 1
Divorciada 3 1 1

Uma mulher é sorteada neste grupo. Determine a probabilidade dos eventos:


4.1. A - Ser casada.
4.2. B - Não ser loira.
4.3. C - Não ser morena nem ruiva.
4.4. D - Ser viúva.
4.5. E - Ser solteira ou casada.
4.6. F - Ser loira e casada.
4.7. G - Ser morena e solteira.
4.8. H - Ser viúva e ruiva.
Probabilidades 161

5. Um experimento consiste em sortear um aluno em uma classe pela lista de cha-


mada ( I a 20).
Determine a probabilidade dos seguintes eventos:
5.1. A - Ser sorteado um número par.
5.2. B - Não ser sorteado múltiplo de 5.
5.3. C - Ser sorteado um número maior que 12 e múltiplo de 3.
5.4. D - Ser sorteado um número menor que 7 e múltiplo de 4.
5.5. E - Ser sorteado um número menor que 13, maior que 8 e múltiplo de 7.
5.6. F - Ser sorteado um número real.

RESPOSTAS
162 Estatística 1

7.11 Axiomas de Probabilidade


O cálculo de probabilidades pode ser desenvolvido a partir de três
axiomas que o interessado aceitará facilmente, tendo em vista o que foi ex-
posto anteriormente.
1) O I P ( A ) I 1
2) P(S) = 1
3) Se A e B são eventos mutuamente exclusivos, então,
P ( A u B) = P(A) + P(B).
Cálculo de
Probabilidades

8.1 Teoremas Fundamentais


8.1.1 1 P(0)= O I PROBABILIDADE DO CONJUNTO VAZIO
Prova: De fato, como o conjunto 0 não possui elementos, S u 0 = S.
Eventos iguais possuem os mesmos elementos e portanto a mesma
probabilidade de ocorrência. Portanto, P(S u 0) = P(S).
Com relação ao primeiro membro da igualdade, S e 0 são eventos
mutuamente exclusivos, e pelo axioma (3), P(S u 0 ) = P(S) + P(0).
Substituindo na expressão anterior, obtemos:

8.1.2 1 HCA)= 1 - H A ) I PROBABILIDADE DO COMPLEMENTAR

Prova: A u CA= S. Eventos iguais possuem os mesmos elementos e


portanto a mesma probabilidade de ocorrência: P(A u CA) = P(S). Com
relação ao primeiro membro da igualdade, A e CAsão eventos mutuamente
. exclusivos, portanto, pelo axioma (3), P(A u CA) = P(A) + P(CA). Com relação
ao segundo membro, pelo axioma (2),P(S) = 1. Substituindo estes valores,
obtém-se:
P(A) + P(CA) = 1
P(CA) = I- P(A)

8.1.3 PROBABILIDADE DA REUNIÁO

Se A e B são eventos quaisquer, então:


164 Estatística 1

Prova: observando o diagrama

verificamos que: A u B = (A - B) u 9. Eventos iguais possuem os mesmos


elementos e portanto a mesma probabilidade de ocorrência:

Com relação ao segundo membro, A - B e B são eventos mutuamente


exclusivos e, pelo axioma (3),

Substituindo este valor na expressão anterior obtém-se:

Por outro lado, ( A - B) u (A n B) = A. Eventos iguais possuem os


mesmos elementos e portanto a mesma probabilidade de ocorrência:

q ( A - B) u (A n B)] = P(A).

Com relação ao primeiro membro, A - B e A n B são eventos mutua-


mente exclusivos e, pelo axioma (3),

q ( A - B) u (A n B)] = P(A - B) + P(A n B)

Substituindo-se este valor na expressão anterior obtém-se:

P(A - B) + P(A n B) = P(A). Então:


P(A - B) = P(A)- P(A n B)
Cálculo de Probabilidades 165

Portanto, P(A u B) = P(A) - P(A n B) + P(5)


P(A u 5) = P(A) + P(B) - P(A n 5)

8.1.4 EXERC~CIOSPROPOSTOS
1. Se P(A) = 0,3, P(B) = 0,5 e P(A n B) = 0,1, determine P(A u B).
2. Se P(A) = 0,5, P(A n B) = 0,2 e P(A u B) = 0,9, determine P(B).
3. Se P(A u B) = 0,8, P(A) = 0,6 e P(B) = 0,5, determine P(A n 13).
4. Se P(A u B) = 0,8, P(A) = 0,7 e P(B) = 0,4, os eventos A e B são mutuamente
exclusivos?
5. Se P(A u B) = 0,9, P(A) = 0,4, P(B) = 0,5, os eventos A e B são mutuamente
exclusivos?
6. Se P(A u B) = 0,7 e P(A) = 0,2, determine P(B), sendo A e B eventos mutuamente
exclusivos.
7. Se a probabilidade de não chover em determinada data é 0,25, qual é a probabili-
dade de chover nesta mesma data?
8. Uma caixa contém 15 peças defeituosas em um total de 40 peças. Qual é a
probabilidade de se selecionar ao acaso uma peça não defeituosa desta caixa?
9. Qual é a probabilidade de sair face 4 ou 5 em um lançamento de um dado?
10. Qual é a probabilidade de não sair face 4 ou 5 em um lançamento de um dado?

Respostas
1. 70%
2. 60%
3. 30%
4. Não.
5. Sim.
6. 50%
7. 75%
a 8. 5/8
9. 1/3
10. 213

8.5 Probabilidade Condicional


Introdução: Considere o lançamento de um dado e a observação da
face superior.
O espaço amostra1 do experimento é S = (1, 2,3,4,5,6) e a função de
probabilidade é:
168 Estatística 1

Os valores Pfb/,) = I/' no primeiro exemplo e P(TA)= 2/4 no segundo


exemplo poderiam ser obtidos mais facilmente, sem a necessidade de reduzir
o espaço amostral nem redefinir a função de probabilidade.
Podemos usar so o espaço amostral original e a função de probabili-
dade original se considerarmos a seguinte definição:
Se P(A) z 0:

Assim, no primeiro exemplo, A = (2, 3, 5 , 6) e B = (1, 2}


As probabilidades simples de A e B são: P(A) = 4/6 e P(B) = */6.
A intersecção de A e B é A n B = {2} e P(A n B) =
A probabilidade condicional de B em relação a A é:

No segundo exemplo, A = (2, 3, 4, 5) e B = (1, 3, 4)


As probabilidades simples de A e B são: P(A) = 9 6 e P(B) = 76.
A intersecção de A e B é A n B = (3, 4) e P(A n B) = 2/6.
A probabilidade condicional de B em relação a A é:

Da expressão

podemos obter a fórmula de cálculo da probabilidade para a intersecção de


eventos:
Cálculo de Probabilidades 169

RA B) = RB/~)- 4 4

Esta fórmula pode ser generalizada para vários eventos segundo uma
regra baseada na associatividade de eventos:

Em particular, se A e B são eventos independentes, então


P(B/A) = P(B), e substituindo-se o valor na fórmula de P(A n B), obtém-se:

Se A B, C e D são eventos independentes, então:

EXERC~CIOSRESOLVIDOS

1. Os estudantes de um colégio, presentes em uma reunião, foram classifica-


dos por sexo e por opção da área de formação segundo o quadro abaixo:

M F

ADM 10 8
CC 6 5
EC 8 4

Calcular as probabilidade de que:


a) Alunas optem por Administração.
b) Aluno opte por Economia.
c) Seja aluno sabendo-se que optou por Ciências Contábeis.
d) Aluno opte por Ciências Contábeis
M F

ADM 10 8 18
CC 6 5 11
EC 8 4 12

2. Uma rifa composta por 15 números irá definir o ganhador de dois prêmios
sorteados um de cada vez. Se você adquiriu três números, qual é a prob-
abilidade de ganhar os dois prêmios?
Soluçáo:
G,: Ganhar o primeiro prêmio
G2: Ganhar o segundo prêmio

8.1.6 EXERC~CICISPROPOSTOS
I. Duas bolas são retiradas, sem reposição, de uma urna que contém duas bolas
brancas, três bolas pretas e cinco bolas vermelhas. Determine a probabilidade de
que:
a) ambas sejam pretas
b) ambas sejam vermelhas
c) ambas sejam da mesma cor
d) ambas sejam de cores diferentes.
2. Resolva o problema anterior considerando as retiradas com reposição.
Cálculo de Probabilidades 171

3. Se P(A) = 0,3, P(B) = 0,5 e P(A n B) = 0,1, os eventos A e B são independentes?


4. Se P(A u B) = 0,8 e P(A) = 0,5, determine P(B) sendo A e B independentes.
5. Se P(A u B) = 0,8, P(A) = 0,6 e P(B) = 0,5, os eventos A e B são independentes?
6. Uma empresa garante, na embalagem de seu produto, que apenas 2% das peças
produzidas por ela são defeituosas. Se adquirirmos uma caixa contendo 12 peças
produzidas por esta empresa, qual é a probabilidade de que as duas primeiras
peças selecionadas ao acaso desta caixa sejam defeituosas?
7. Um projeto para ser transformado em lei deve ser aprovado pela Câmara dos
Deputados e pelo Senado. A probabilidade de ser aprovado pela Câmara dos
Deputados é de 40%. Caso seja aprovado na Câmara dos Deputados, a probabili-
dade de ser aprovado no Senado é 80%. Calcule a probabilidade deste projeto ser
transformado em lei.
8. As pesquisas de opinião apontam que 20% da população é constituída por mulhe-
res que votam no partido X. Sabendo-se que 56% da população são mulheres,
qual é a probabilidade de que uma mulher selecionada ao acaso na população
vote no partido X?
9. Uma empresa avalia em 60% a sua probabilidade de ganhar uma concorrência
para o recolhimento do lixo em um bairro A da capital. Se ganhar a concorrência
no bairro A, acredita que tem 90% de probabilidade de ganhar outra concorrência
para o recolhimento do lixo em um bairro B próximo a A.
Determine a probabilidade de a empresa ganhar ambas as concorrências.
10. No primeiro ano de uma faculdade, 25% dos estudantes são reprovados em
Matemática, 15% são reprovados em Estatística e 10% são reprovados em am-
bas.
Um estudante é selecionado ao acaso, nesta faculdade. Calcule a probabilidade
de que:
a) Ele seja reprovado em Matemática, sabendo-se que foi reprovado em Estatísti-
ca.
b) Ele não seja reprovado em Estatística, sabendo-se que foi reprovado em
Matemática.

RESPOSTAS
1. (a) l/15 fb) % (C) '%5 (4 31/45
2. (a) %OO (b) V4 (c) 38/100 (d) 62/100
3. Não
4. 0,6
5. Sim
6. 0,0004
7. 0,32
a. 5/14
9. 0,54
10. (a) 9 3 (b) 0,6
172 Estatística 1

8.1.7 TEOREMA DA PROBABILIDADE TOTAL

Introdução: Suponha que o espaço amostral S de um experimento


seja dividido em três eventos RI, R2, R3 de modo que:

R, n R2 = 0
R2 n R3 = 0
RI n R3 = 0
R, u R2 u R, = S
e considere um evento B qualquer. O evento B pode ser escrito como:
B = B n S.
Como S = RI u R2 u R3, então B = B n (R, u R2 u R3) ou

P(B) = P [ ( B n R,) u ( B n R2) u ( B n R,)]

Pelo fato de ( B n R,), ( B n R2), ( B n R3) serem eventos mutuamente


excIusivos,

P(B) = P ( B n R,) + P ( B n R2) + P ( B n R3).

As intersecções do 2Wembro podem ser desenvolvidas segundo a


fórmula P(A n B) = P(A/s). P(B).
Assim:

Nesta dedução, dividimos o espaço amostral S em três partes, R,, R2


e R.,
O resultado final P(B) independe do número de divisões do espaço
amostral.
Cálculo de Probabilidades 173

Assim, se tivéssemos dividido S em duas regiões apenas, R, e R2,


então P(B) seria dado por:

Se tivéssemos dividido S em quatro regiões R,, R2, R3 e R4, então


P(B) seria dado por:

O teorema da probabilidade total pode ser escrito de forma geral:

Exemplos:
1. Um piloto de Fórmula Um tem 50% de probabilidade de vencer
determinada corrida, quando esta se realiza sob chuva. Caso não chova
durante a corrida, sua probabilidade de vitória é de 25%. Se o serviço de
Meteorologia estimar em 30% a probabilidade de que chova durante a corrida,
qual é a probabilidade deste piloto ganhar esta corrida?
Solugáo: Definindo os eventos:
G: o piloto ganhar a corrida
Ch: chover durante a corrida
NCh: não chover durante a corrida

Então:

2. A experiência com testes psicotécnicos para habilitação de moto-


ristas indica que 90% dos candidatos a habilitação aprovados no primeiro
leste tornam-se excelentes motoristas.
70% dos candidatos reprovados no primeiro teste tornam-se péssimos
'motoristas. Admitindo-se a classificação dos motoristas apenas em excelentes
ou péssimos, responda:
174 Estatística 1

a) Um candidato acaba de ser reprovado em seu primeiro teste psico-


técnico. Qual é a probabilidade de que se torne um excelente
motorista?
b) Um candidato acaba de ser aprovado em seu primeiro teste psico-
técnico. Qual é a probabilidade de que se torne um péssimo moto-
rista?
c) Um indivíduo acaba de fazer um teste psicotécnico. Se 80% dos
candidatos são aprovados neste teste, qual é a probabilidade de
que se torne um excelente motorista?

Solução: Definindo os eventos:


A: o candidato ser aprovado no primeiro teste
R: o candidato ser reprovado no primeiro teste
E: o candidato tornar-se excelente motorista
P: o candidato tornar-se péssimo motorista
Então:

a) P(VR) = 1 - -(?R) = 1 - 0,70 = 0,30 OU 30%

b) P(qA) = 1 - P(VA) = 1 - 0,90 = 0,10 OU 10%

C) P(E) = P(%) . P(A) + P(%) . P(R)


P(E) = 0,90 . 0,80 + 0,30 . 0,20

P(E) = 0,78 ou 78%

8.1.8 EXERC~CIOSPROPOSTOS
1. As máquinas A e B são responsáveis por 70% e 30% respectivamente da produ-
ção de uma empresa.
A máquina A produz 2% de peças defeituosas e a máquina B produz 8% de peças
defeituosas.
Calcule o percentual de peças defeituosas na produção desta empresa.
2. Um aluno propõe-se a resolver uma questão de um trabalho.
A probabilidade de que consiga resolver a questão sem necessidade de uma
pesquisa é de 40%. Caso faça a pesquisa, a probabilidade de que consiga resol-
ver a questão é de 70%.
Se a probabilidade do aluno fazer a pesquisa é de 80%, calcule a probabilidade de
que consiga resolver a questão.
Cálculo de Probabilidades 175

3. Uma junta apuradora de votos recebe 50 urnas. Sabe-se que cinco urnas são de
bairros habitados por indivíduos da classe A, 15 urnas de bairros habitados por
indivíduos da classe B e 30 urnas são de bairros habitados por indivíduos da
classe C. A última pesquisa realizada mostrou o quadro de intenções de votos:

Intenção de votos por bairros (%)

Candidato BAIRRO A BAIRRO B BAIRRO C

Ventarola

I Calcule a probabilidade de que:

I a) O primeiro voto anunciado seja do candidato Ventarola.

~ b) O primeiro voto anunciado não seja do candidato H.C,


4. Um pesquisador desenvolve sementes de quatro tipos de plantas, P,, P2, P3 e P4.
Plantados canteiros-pilotos destas sementes, a probabilidade de todas germi-
narem é de 40% para P1, 30% para P2, 25% para P3 e 50% para P4.
Um canteiro-piloto é selecionado ao acaso. Qual é a probabilidade de que todas as
sementes ali plantadas tenham germinado?
5. Um médico plantonista está examinando uma vítima de envenenamento que
acaba de dar entrada no hospital. Um rápido exame preliminar leva o médico a
concluir que o envenenamento é devido a ingestão de uma das drogas A ou B ou
C. Ele dispõe de dois tipos de medicamentos com o seguinte quadro de eficácia:

Eficácia específica (%)


Medicamento Mi MP

Droga ingerida
A 70 50
B 40 90
C 80 60

Qual é o medicamento que o plantonista deve ministrar, se a urgência da situação


não lhe permite outras opções?

I
I RESPOSTAS
1. 3,8%
2. 64%
3. a) 5,5%
b) 72%
4. 36,25%
5. O medicamento M2'
176 Estatística 1

8.1.9 TEOREMA DE BAYES

Note que no caso da determinação de P(B) através da utilização do


teorema da probabilidade total
P(B) = P(B/R,).P(R1) + P('/R~).P(R~)+-..+ P(B/RJ.P(R~),
precisamos obviamente conhecer as probabilidades condicionais
P(B/n), P(B/n,),..., P(B/~), que representaremos de modo genérico por P ( 9 ,
para i = 1, 2,..., n.
Se desejarmos avaliar uma probabilidade condicional do tipo P(Ri/&,
devemos utilizar o teorema 4. Assim,

A expressão do numerador P(Ri n B) pode ser desenvolvida para:

e a expressão do denominador P(B) pode ser desenvolvida pelo teorema 5.

Substituindo-se estes valores, obtém-se:

Esta particular combinação dos teoremas 4 e 5 é denominada teore-


ma de Bayes.

EXERC~CIOSRESOLVIDOS

1. As máquinas A e B são responsáveis por 60% e 40% respectivamente, da


produção de uma empresa.
Os índices de peças defeituosas na produção destas máquinas valem 3%
e 7% respectivamente. Se uma peça defeituosa foi selecionada da produ-
ção desta empresa, qual é a probabilidade de que tenha sido produzida
pela máquina B3
Cálculo de Probabilidades 177

Solução: Definidos os eventos:


A: a peça ter sido produzida pela máquina A.
B: a peça ter sido produzida pela máquina B.
d a peça ser defeituosa.

Então:

Uma empresa de material cerâmico está desenvolvendo um modelo de


caneca para chope e deverá lançá-la numa tradicional festa do chope em
Santa Catarina. Esta empresa sabe que uma concorrente está desenvol-
vendo um projeto similar com as mesmas intenções e acredita que a
probabilidade de o concorrente lançar o produto ainda este ano é de 40%.
Um fornecedor comum se oferece para bisbilhotar a concorrente para
saber ao certo se o lançamento será ou não efetuado este ano. A empresa
acredita que se ele confirmar o fato, há 60% de probabilidade dele estar
correto. Caso o fornecedor não confirme o lançamento, a probabilidade de
estar correto é de 90%. Avalie a nova expectativa da empresa:
a) No caso de o fornecedor confirmar o evento.
b) No caso de o fornecedor negar o evento.
Solução: Definindo os eventos:
L: A empresa concorrente lançar o produto este ano.
NL: A empresa concorrente não lançar o produto este ano.
DS: O fornecedor dizer que a concorrente lançará o produto este ano.
DM O fornecedor dizer que a concorrente não lançará o produto este ano.
178 Estatística 1

8.1.1 0 EXERC~CIOSPROPOSTOS
I. Em uma agência bancária, 30% das contas são de clientes que possuem cheque
especial, O histórico do banco mostra que 3% dos cheques apresentados são
devolvidos por insuficiência de fundos e que dos cheques especiais, 1% são
devolvidos por insuficiência de fundos. Calcule a probabilidade de que:
a) Um cheque não especial que acaba de ser apresentado ao caixa seja de-
volvido.
b) um cheque seja especial, sabendo-se que acaba de ser devolvido.
2. A associação das seguradoras de veículos afirma que 40% dos veículos em
circulação possuem seguro e que dos veículos sinistrados 45% possuem seguro.
O Departamento de Trânsito informa que 8% dos veículos sofrem algum tipo de
sinistro durante um ano. Calcule a probabilidade de que um veículo segurado não
sofra um sinistro durante um ano.
3. Um pesquisador desenvolve sementes de quatro tipos de plantas, P,, P2, P3 e Pq.
Plantados canteiros-pilotos destas sementes, a probabilidade de todas germr-
narem é de 40% para P,, 30% para P2, 25% para P3 e 50% para P,.
a) Escolhido um canteiro ao acaso, verificou-se que nem todas as sementes
haviam germinado. Calcule a probabilidade de que o canteiro escolhido seja o
de sementes de P,.
b) Escolhido um canteiro ao acaso, verificou-se que todas as sementes haviam
germinado. Calcule a probabilidade de que o canteiro escolhido seja o de
sementes de P,.
4. Um candidato e seus correligionários têm uma expectativa de 90% de que gan-
harão as próximas eleições. Um auxiliar de campanha resolveu por conta própria
fazer uma pesquisa sobre o fato, entrevistando indivíduos do comitê do candidato
e de pessoas que lá compareciam para pedir favores em troca de votos.
Se o resultado desta pesquisa confirmar o fato, nada se altera ou seja, a probabili-
dade de a pesquisa acertar o resultado é de 90%.
Se o resultado não confirmar a expectativa, o ambiente se modifica, já que nestas
circunstâncias, a pesquisa tem credibilidade quase total. Considerando estes fatos,
ele atribui a pesquisa uma probabilidade de 98% de acertar, se concluir pela
derrota nas eleições.,Se este fato ocorrer, qual é a nova expectativa do candidato?
5. O encarregado de uma agência de detetives comenta com uma cliente: Se chegar-
mos a conclusão de que seu marido é infiel, pode acreditar, pois nossa margem de
erro é de apenas 5%. Entretanto, se as provas que conseguirmos não forem
convincentes, diremos que ele é fiel. Neste caso, nossa margem de erro é 30%. A
cliente diz ter quase certeza de que o marido é infiel, isto é, acha que a prob-
abilidade disto ocorrer é de 90%.
a) Se a investigação concluir que o marido é infiel, qual é a nova expectativa da
cliente ?
b) E se a investigação concluir que não?
Cálculo de Probabilidades 179

RESPOSTAS

8.2 Exercícios Gerais


Os funcionários de uma empresa foram classificados de acordo com seu grau de
escolaridade e nível salarial segundo o quadro abaixo:
- -

l oGrau 3" Grau

Nível l
Nível II
Nível III
Nível IV

Um funcionário é escolhido ao acaso. Determine a probabilidade de que:


1. Tenha somente o primeiro grau.
2. Tenha o segundo grau.
3. Tenha somente o segundo grau.
4. Tenha nível salarial I1 e 2"grau.
5. Tenha nível salarial 111 sabendo-se que tem 3"grau.
6. Tenha 2"grau sabendo-se que tem nível salarial 111.
7. Tenha 3" grau e nível salarial I.
8. Tenha nível salarial 111 ou 2" grau.
9. Tenha nível salarial menor que 111.
10. Tenha 1" ou 2Qrau sabendo-se que tem nível salarial maior que 11.
I I. Uma empresa produz 4% de peças defeituosas. O controle de qualidade da
empresa é realizado em duas etapas independentes. A primeira etapa acusa
uma peça defeituosa com 80% de probabilidade de acerto. A segunda etapa
acusa uma peça defeituosa com 90% de probabilidade.
Calcule a probabilidade de que:
a) Uma peça defeituosa passe pelo controle de qualidade.
b) Ao adquirir uma peça produzida por esta empresa, ela seja defeituosa.
180 Estatística 1

12. Uma pesquisa realizada sobre a preferência dos consumidores por três categorias
de veículos A, B e C de uma indústria automobilística revelou que dos 500 entre-
vistados,
2 10 preferiam o veículo A
230 preferiam o veículo B
160 preferiam o veículo C
90 preferiam o veículo A e B
90 preferiam os veículos A e C
70 preferiam os veículos B e C.
120 dos entrevistados não preferiam nenhuma das três categorias.
Um consumidor é selecionado ao acaso entre os entrevistados. Calcule a proba-bi-
lidade de que:
a) Ele prefira as três categorias.
b) Ele prefira somente uma das categorias.
c) Ele prefira pelo menos duas categorias.
13. As fábricas A, B e C são responsáveis por 50%, 30% e 20% do total de peças
produzidas por uma companhia. Os percentuais de peças defeituosas na produção
destas fábricas valem respectivamente 1%, 2% e 5%. Uma peça produzida por
esta companhia é adquirida em um ponto de venda. Determine a probabilidade de
que:
a) A peça seja defeituosa.
b) A peça tenha sido produzida pela fábrica C, sabendo-se que é defeituosa.
c) Não tenha sido produzida pela fábrica A se ela é boa.
14. Uma pessoa compra três bilhetes de uma rifa de 100 bilhetes, que dá vários
prêmios. Calcule a probabilidade de que esta pessoa:
a) ganhe o prêmio do primeiro sorteio.
b) ganhe o prêmio do segundo sorteio, se ela não ganhou o prêmio do primeiro
sorteio.
c) ganhe os prêmios do primeiro e do segundo sorteios.
d) não ganhe nenhum dos prêmios dos cinco sorteios realizados.
e) ganhe pelo menos um prêmio nos cinco sorteios realizados.
15. Uma máquina produz parafusos e sabe-se que o percentual de parafusos defeituo-
sos produzidos é de 0,5%. Sabendo-se que a fabricação constitui um processo
independente, calcule a probabilidade de:
a) Aparecer dois parafusos defeituosos em sequência.
b) Aparecer um parafuso defeituoso e um parafuso perfeito, em sequência nesta
ordem.
c) Aparecer um parafuso perfeito e um parafuso defeituoso em sequência.
d) Aparecer três parafusos perfeitos em sequência.
Cálculo de Probabilidades 181

16. Uma junta apuradora de votos recebe 50 urnas, dos quais 5 vindas de bairro
classe A, 15 de bairros classe B e 30 de bairros classe C, A última pesquisa
realizada mostrou o quadro de intenções de votos:

Intenção de votos por bairros (%)

Candidato BAIRRO A BAIRRO B BAIRRO C

Ventarola

O primeiro voto anunciado foi do candidato HC. Um partidário de LALÚ disse que
o voto é de um indivíduo da classe A. Qual a probabilidade de ele estar certo?
17. Uma pesquisa realizada entre 200 clientes de uma agência de automóveis mos-
trou que 150 preferem carros nacionais, 100 preferem carros populares e 80
preferem carros populares nacionais. Calcule a probabilidade de que o próximo
cliente a ser atendido nesta agência:
a) solicite um carro nacional
b) não solicite um carro popular
c) solicite um carro popular ou nacional
18. No dapartamento de métodos quantitativos de uma Faculdade, 60% dos professo-
res lecionam Matemática, 30% lecionam Estatística e 20% dos professores de
Matemática também lecionam Estatística. Calcule a probabilidade de que um pro-
fessor selecionado ao acaso no Departamento:
a) lecione Matemática e Estatística
b) lecione Matemática e não lecione Estatística
c) lecione Estatística e não Matemática
d) lecione Matemática ou Estatística
e) não lecione Matemática, sabendo-se que leciona Estatística.
19. O departamento de desenvolvimento de projetos de uma empresa emprega cinco
engenheiros. O encarregado deste departamento foi informado da presença de um
espião industrial entre eles, e organizou um teste que identifica o espião.
Se o teste for aplicado mais que duas vezes, por problemas de intercomunicação,
ele perde 80% de sua eficácia a cada vez que é aplicado. Calcule a probabilidade
de que:
a) O espião seja identificado no máximo no segundo teste
b) O espião seja identificado somente no terceiro teste
c) O espião não seja identificado pelo teste.
20. A probabilidade de que um carro apresente problemas de carburação é de 40%, e
de distribuição é de 30%.
Se o problema for de carburação, a probabilidade de conserto no local é de 80%.
Se o problema for de distribuição, a probabilidade de conserto no local é de 60%.
Se o problema for de outra natureza, a probabilidade de conserto no local é d e
10%.
182 Estatística 1

Um carro acaba de apresentar problemas. Calcule a probabilidade de que seja


concertado no local.
21. Uma pessoa deseja fazer sua barba de manhã.
Ele possui para isto apenas um barbeador elétrico que funciona com um conversar
ligado a rede elétrica, ou com duas pilhas.
A probabilidade de que não haja problemas de energia elétrica no momento é de
90%.
Caso haja problemas de energia elétrica, ele possui duas pilhas usadas, cuja
probabilidade individual de funcionamento é de 40%.
Calcule a probabilidade de que esta pessoa consiga fazer sua barba de manhã.
22. Uma empresa está desenvolvendo três projetos. Uma avaliação no estágio atual
de desenvolvimento dos projetos resultou na tabela abaixo:

A B C
Probabilidade de
terminar no prazo 80% 70% 50%
- Otimista -
Probabilidade de
terminar no prazo 40% 20% 5%
- Pessimista -

Qual é a probabilidade de a empresa terminar pelo menos dois projetos no prazo,


se:
a) O avaliador é otimista
b) O avaliador é pessimista
23. Em determinada corrida, a chance de um piloto vencer é, segundo os especialis-
tas, de "3 para 2".
Calcule a probabilidade de que:
a) o piloto vença a corrida
b) o piloto não vença a corrida, se um defeito inesperado reduzir sua chance para
"40 para 100".
24. Um defeito na fabricação produziu um dado cuja probabilidade de apresentar face
par em um lançamento é o dobro da probabilidade de apresentar face ímpar.
Efetua-se um lançamento deste dado e observa-se o número de pontos da face
superior.
a) Defina a função de probabilidade associada ao espaço amostra1 do experi-
mento.
b) Calcule a probabilidade de se obter um número primo.
c) Calcule a probabilidade de em dois lançamentos deste dado obtermos a soma
dos pontos observados maior que 9.
d) Calcule a probabilidade de que em dois lançamentos destes dados a soma
dos pontos seja ímpar, sabendo-se que o número de pontos no primeiro
lançamento é superior a 4.
Cálculo de Probabilidades 183

25. Uma peça é processada em três máquinas A, B e C. A probabilidade de cada uma


delas acarretar defeitos na peça é de 1%, 2% e 3% independentemente. Calcule a
probabilidade de que:
a) Uma peça seja processada sem defeitos
b) Exatamente duas peças entre três processadas apresentem defeito
c) Apenas uma em mil peças processadas em um dia seja defeituosa.
26. Uma fábrica de bonecas tem três linhas de produção. Um levantamento no final do
dia forneceu as informações:
Linha Produção N q e peças
defeituosas

Calcule a probabilidade de que uma boneca escolhida ao acaso:


a) Não apresente defeitos
b) Apresentando defeitos, seja proveniente da linha A.
27. Os jogadores A e B jogam 12 partidas de xadrez. A vence seis, B vence quatro e
duas terminam empatadas. Eles irão disputar mais três partidas constantes de um
torneio. Qual é a probabilidade de:
a) A vencer as três partidas.
6) Duas partidas terminarem empatadas.
c) B vencer pelo menos uma partida.
28. Uma pessoa foi contactada por uma agência de turismo afirmando que ela havia
sido sorteada e ganho uma viagem de graça para a cidade de Natal. A pessoa
acredita que haja uma probabilidade de 70% de a proposta ser séria. Consultando
um amigo familiarizado com estas promoções, ele afirmou que a proposta era
séria. A expectativa de que o amigo acerte um caso afirmativo é de 90% e em
caso negativo é de 50%. Qual é a nova confiança da pessoa na lisura da propos-
ta ?
29. Uma empresa de consultoria, especialista em solucionar problemas relativos a
lançamentos de produtos, classifica os problemas apresentados em três catego-
rias A, B e C.
50% dos problemas são classificados na categoria A, 40% na categoria B e o
restante na categoria C.
A capacidade histórica de resolver problemas das diversas categorias é de 80% se
o problema for da categoria A, 90% se for da B e 10% se for da C.
Calcule a probabilidade de que:
a) A empresa consiga solucionar o primeiro problema a dar entrada no dia de
hoje.
b) A empresa consiga solucionar os três problemas que entraram no dia de hoje.
c) Um dos problemas que entraram hoje, acaba de ser resolvido. Qual é a
probabilidade que seja da categoria C?
184 Estatística 1

30. Uma imobiliária trabalha com os vendedores A e B.


A probabilidade de A vender um imóvel é de 5% e a de B vender é de 8%.
Operando normalmente, qual é a probabilidade de que:
a) um deles venda um imóvel
b) apenas um deles venda um imóvel
c) nsnhum deles venda
31. Dois homens e três mulheres disputam um torneio de pôquer. As pessoas do
mesmo sexo são igualmente hábeis porém sabe-se que historicamente a probabili-
dade de um homem ganhar o torneio é o dobro da probabilidade de uma mulher
ganhar. Calcule a probabilidade de que:
a) Uma mulher vença o torneio.
b) Se existe entre os participantes apenas um homem solteiro e uma mulher
solteira, uma pessoa solteira ganhe o torneio.
32. Uma urna contém dois cartões vermelhos numerados 1 e 2 e dois cartões pretos
também numerados 1 e 2. Os cartões são idênticos, exceto na cor e no índice
anotado. Dois cartões são selecionados ao acaso sem reposição.
a) Determine o espaço amostra1 do experimento.
b) Determine a função de probabilidade associada.
c) Determine a probabilidade de que ambos sejam vermelhos.
d) Determine a probabilidade de cores e índices diferentes.
e) Determine a probabilidade de que ambos sejam vermelhos, sabendo-se que o
primeiro é vermelho.
f)Determine a probabilidade de que ambos tenham o mesmo índice, dado que
têm a mesma cor.
33. Um grupo de 150 modelos disputam um concurso de beleza. Elas foram classifica-
das por estatura e cor dos cabelos.

Média Baixa

Cabelos
Loira
Morena
Ruiva 20

A ordem de entrada das concorrentes para o desfile é feita por um sorteio executa-
do pelo apresentador.
Calcule a probabilidade de que:
a) A próxima concorrente a desfilar seja loira.
b) Se a próxima concorrente a desfilar for ruiva, ter estatura baixa.
c) A próxima concorrente a desfilar seja alta e que tenha cabelos morenos ou
ruivos.
34. Se os eventos A e B são tais que: P(A) = 0,3, P(B) = 0,6, calcule:
Cálculo de Probabilidades 185

a) P(A n B) se A e B são independentes,


b) P(A u B) se A e B são mutuamente exclusivos.
C) P(%) se P(A n B) = 0,2.
d) P(A u B) se P(A n B) = 0,2.
35. No lançamento de um dado e na observação do número de pontos da face
superior, os eventos:
A = 12, 3, 4, 51
B = 13, 6)
a) são mutuamente exclusivos?
b) são independentes?
36. No lançamento de dois dados e na observação do número de pontos ,das faces
superiores, determine a probabilidade de que:
a) O número de pontos de uma face supere a outra em mais que duas unidades.
b) O número de pontos de uma face seja o dobro do número de pontos da outra
face.
37. O espaço amostral de um experimento é S = {2,4,3, 71 e a probabilidade de cada
elemento é diretamente proporciona/ ao valor destes elementos.
a) Determine a função de probabilidade associada ao espaço amostral.
b) Se A = {2, 31, determine P(A).
c) determine P(CA)
d) Se B = 12, 71, determine P(A u B).
38. Se A e B são eventos, com P(A) = 0,2 e P(B) = 0,3, e A e B são independentes,
calcule:
a) P(CA)
b) P(CB)
C) P(A U S)
d) P(B / ~ )
39. Numa igreja, 60% dos fiéis são mulheres. Das mulheres, 30% são iniciantes. Entre
os homens, 80% são veteranos. Levando-se em conta esta classificação, o pastor
sorteia grupos de duas pessoas, para diretoria e tesouraria de uma quermesse.
a) Qual é o espaço amostral deste experimento em função da classificaçáo?
b) Qual é a probabilidade de que um casal sorteado ao acaso tenha dois vetera-
nos?
c) Qual é a probabilidade de que um grupo sorteado ao acaso tenha dois inician-
tes?
40. Um par é escolhido ao acaso do produto cartesiano A x B, onde:
A = { 1 , 2, 3) e B = { I , 2, 3, 4). Descreva os eventos:
a) E, = { ( x , y ) ~A x B I x = y )
b) E,={(x,y)~ A x B l x + y = 4 }
186 Estatística 1

Se os pares ordenados do produto cartesiano A x B são igualmente prováveis,


determine a probabilidade do seguinte evento:
C) E, = { ( x , ~ ) Q A x B I ~ = ) ? }

RESPOSTAS
Cálculo de Probabilidades 187

21. 91.60%
22. a) 75%
b) 10,2%
23. a) 60%
b) 28,57%
24. a) P(l) = (P3) = P(5) = 1/9
P(2) = P(4) = P(6) = 24
b) 4/9
c) 17/81
d) 4/27
25. a) 94,11%
b) 0,98%
c) zero
26. a) 87.5%
b) 60%
27. a) 1/8
b) 5/72
c) 19/27
28. 80,77%

~ 29. a) 77%
b) 45,65%
C) 1,30%
I 30. a) 12,60%
I b) 12,20%
I C) 87,4%
31. a) 3/7
6) 3/7
32. a) V1V2,VIP,, V,P,, V,Vl, V2Pl, V2P2
PlV1, P1V2,PlP2, p2v7, p2v* P2P,
b) P(Vl V,) = P(VIPl) = ... = P(P2P,) = 1/12
C) 1/6 d) 7/3 e) 1/6
33. a) 30%
b) 37,5%
C) 14.67%
34. a) 18%
b) 90%
C) 1/3
d) 0,7
35. a) Não
"
,

b) Não
-' . 36. a) 1/3
b) 1/6
37. a) P(2) = 2/16, P(4) = 4/16, P(3) = 3/16, P(7) = 7/16
b) 5/16
C) 11/!6
d) 75%
38. a) 80%
b) 70%
188 Estatística 1
Bibliografia

BUSSAB, W. O., MORETIN, F? A. Estatística básica. 3. ed. São Paulo : Atual,


1986.
CHACON, P. E. Curso breve de estatística. 2. ed. Universidad de Duesto, 1965.
CLARKE, A. B., DISNEY, R. L. Probabilidade e processos estatísticos. Rio de
Janeiro : LTC, 1979.
COSTA NETO, F? L. O. Estatística. São Paulo : Edgard Blucher, 1977.
FONSECA, J. S., MARTINS, G. A. Curso de estatística. 3. ed. São Paulo : Atlas,
1984.
GATTÁS, R. R. Elementos de probabilidades e inferência. São Paulo : Atlas,
1978.
GÓES, L. A. C. Estatística: uma abordagem decisorial. São Paulo : Saraiva,
1980. v. 1.
GUERRA, J. G., DONAIRE, D. Estatística indutiva. 4. ed. São Paulo : LCTE,
1990.
KARMEL, F? H., POLASEK, M. Estatística geral e aplicada a economia. 2. ed.
São Paulo : Atlas, 1976.
MARTINS, G. A., DONAIRES, D. Princ@ios de estatística. São Paulo : Atlas,
1979.
MEYER, P. L. Probabilidade: aplicações a estatística. Rio de Janeiro : LTC,
1969.
SPIEGEL, M. R. Estatística. 2. ed. São Paulo : McGraw-Hill, 1985.
STEVENSON, W. J. Estatktica aplicada a administração. São Paulo : Harbra,
1981.
WONNACOTT, T. H., WONNACOTT, R. J. Estatística aplicada a economia e
administração. Rio de Janeiro : LTC, 1981.