Você está na página 1de 64

UNIVERSIDADE FEDERAL DA BAHIA

INSTITUTO DE MATEMÁTICA
DEPARTAMENTO DE ESTATÍSTICA

NOTAS DE AULA
MAT236 – MÉTODOS ESTATÍSTICOS
1ª UNIDADE

Elaborada pelas professoras:


Giovana Silva, Lia Moraes,
Rosana Castro e Rosemeire Fiaccone

Revisada em 2010.2
Monitora: Tatiana Felix da Matta
1. INTRODUÇÃO

1.1 O que é estatística e suas divisões

Para muitos a Estatística não passa de conjuntos de tabelas de dados numéricos.


Mas será que a estatística é só isso?

A Estatística originou-se com a coleta e construção de tabelas de dados para o


governo. A situação evoluiu e esta coleta de dados representa somente um dos aspectos
da Estatística. Hoje em dia podemos adotar a seguinte definição para a Estatística:

A Estatística constitui-se num conjunto de técnicas e métodos científicos que


tratam da coleta, análise e interpretação de informações numéricas, cujo objetivo
principal é auxiliar na tomada de decisões ou tirar conclusões em situações de
incerteza, a partir de informações numéricas.

A Teoria Estatística moderna se divide em dois grandes campos:

Estatística Descritiva - consiste num conjunto de métodos que ensinam a reduzir


uma quantidade de dados bastante numerosa por um número pequeno de
medidas, substitutas e representantes daquela massa de dados.

Estatística Indutiva ou Inferência Estatística - consiste em inferir (deduzir ou


tirar conclusões a respeito das) propriedades de um universo a partir de
uma amostra. O processo de generalização, que é característico do
método indutivo, está associado a uma margem de incerteza. A medida
da incerteza é tratada mediante técnicas e métodos que se fundamentam
na Teoria das Probabilidades.

A Estatística Descritiva abrange métodos gráficos e numéricos, utilizados para


resumir dados de maneira que características importantes da amostra possam ser
expostas.

A disponibilidade de uma grande quantidade de dados e de métodos


computacionais muito eficientes revigorou a área da Estatística denominada “Estatística
Descritiva”.

Na maioria das vezes não podemos investigar o fenômeno que estamos


interessados em estudar em todos os elementos da população por ser o custo muito alto,
por necessitar de muito tempo para o levantamento dos dados. Para resolver o problema
devemos trabalhar com um subconjunto da população, chamado de AMOSTRA.

Se selecionarmos os elementos da amostra de acordo com critérios estatísticos,


podemos conhecer as informações relativas à população através da amostra.

A inferência estatística procura com base nos dados amostrais tirar conclusões
sobre a população. Considere o exemplo abaixo para ilustrar as definições dadas.

1
Exemplo: (Notas de Aula da Disciplina MAT116 - USP) Numa pesquisa eleitoral um
Instituto de Pesquisa procura com base nos resultados de um levantamento aplicado a
uma amostra da população prever o resultado da eleição. Considere o candidato “A”:
a) Denomine por p a proporção de pessoas que votarão em “A” na eleição.
b) Denomine por p̂ a proporção de pessoas no levantamento de opinião (amostra)
que expressam intenção de voto em “A”.

Podemos usar o valor de p̂ para estimar a proporção p da população.

O esquema a seguir resume as etapas de um trabalho estatístico:

Técnicas de Amostragem
População Amostra

Análise
Descritiva

Inferência
Conclusões Estatística
sobre as
características Informações contidas
da população nos dados

1.2 Por que precisamos aprender Estatística?


Quase toda atividade e experiência humana envolvem coleta e análise de algum
tipo de informação (dados). Na coleta de dados relativos ao comportamento ou outras
características de um grupo de indivíduos, amostras aleatórias de um processo ou
resultados de repetitivas medições, sempre envolvem variação.

Métodos estatísticos representam as ferramentas básicas para compreender as


variações, porque a análise estatística é a única base para tentar entender variabilidade.

Os métodos estatísticos são consciente ou inconscientemente usados em várias


situações, especialmente na apresentação de informações oriundas de dados numéricos.
Diversas vezes, apresentações são baseadas, principalmente, em algum tipo de técnica
utilizando teorias matemáticas; porém durante a preparação e apresentação dos dados,
métodos estatísticos são utilizados para definir a técnica de coleta de dados e chegar a
uma conclusão através das informações coletadas. Os métodos estatísticos têm
aplicações em:
• Indústrias: coleta de dados na linha de produção, para manter e controlar o
processo produtivo, o que assegura o nível de produção e os padrões de
qualidade; otimização do processo produtivo; detecção das variáveis que
realmente influenciam o processo, viabilizando-se as experiências que possam
levar a alterações efetivas nesse processo; planejamento de experimentos

2
viáveis, com vistas à economia de observações e, portanto, de custo;
planejamento de métodos de coleta e análise de dados para a exploração mineral;
• Instituições públicas: planejamento da coleta, do armazenamento e do
processamento de informações; processamento de dados com o objetivo de
sintetizar e divulgar resultados; montagem de tecnologia adequada de geração de
indicadores econômicos; previsão de safras, projeção de demandas;
• Hospitais e instituições de pesquisa médica: prestação de assessoria estatística
no exame da validade de testes clínicos; no estabelecimento de padrões de
referência; na determinação de fatores de risco de doenças; na comparação de
resultados de diversos tratamentos clínicos e no planejamento de experimentos
clínicos controlados, de estudos de casos e de estudos prospectivos;
• Empresas de pesquisa de opinião e mercado: prestação de assessoria estatística
no levantamento de audiências de programas de televisão, da popularidade de
candidatos a cargos políticos; na avaliação da aceitação de novos produtos; na
realização de pesquisas para determinação do perfil do consumidor e no
planejamento e execução e pesquisa para determinação das características sócio-
econômicas dos habitantes da região;
• Bancos e companhias de seguro: elaboração de previsões a serem utilizadas
como instrumento gerencial; trabalho em associação com a atuária nos cálculos
das probabilidades de morte, doença, roubo de carro, etc.; otimização de
procedimentos de atendimento ao público
• Centros de pesquisa: prestação de assessoria estatística em todas as fases de um
projeto de pesquisa que envolva coleta, tratamento e análise de dados.

Os empregados de uma empresa devem tornar-se mais familiarizados com


estatística. Eles devem entender e conhecer as técnicas estatísticas disponíveis, e
adaptação de dados de experimentos para a análise estatística. Um profissional treinado
em Estatística terá maior facilidade em identificar um problema em sua área de atuação,
determinar os tipos de dados que irão contribuir para a sua análise, coletar estes dados e
a seguir estabelecer conclusões e determinar um plano de ação para a solução do
problema detectado. Qualquer um que derive informações a partir de dados está agindo
como um estatístico.

1.3 População e amostra


População - Conjunto de indivíduos, objetos ou informações que apresentam
pelo menos uma característica comum, cujo comportamento interessa-nos analisar. Ou,
em outras palavras, conjunto de todas as medidas, observações relativas ao estudo de
determinado fenômeno.

i) Deseja-se conhecer o consumo total de energia elétrica em MWH nas residências da


cidade de Salvador no ano de 1998.
População ou universo: todos as residências que estavam ligadas a rede elétrica em
Salvador, em 1998.
Características: X = consumo anual de energia elétrica em MWH.
ii) Deseja-se saber se nas indústrias situadas no Estado da Bahia, em 1997, existia
algum tipo de controle ambiental.
População ou universo: indústrias situadas no Estado da Bahia em1997.
3
Característica: X = existência ou não de algum tipo de controle ambiental na
indústria.

iii) Estudo sobre a precipitação pluviométrica na Região Nordeste no ano 1997.


População ou universo: área referente à Região Nordeste.
Característica: X = precipitação pluviométrica.

Populações finitas e infinitas: Quanto ao número de elementos, as populações podem


ser classificadas em finita ou infinita, dependendo do número de elementos que a
compõe.

Exemplos :
i) População finita: empresas do Pólo Petroquímico de Camaçari.
ii) População infinita: as pressões atmosféricas ocorridas nos diversos pontos do
Continente em determinado momento.

Em geral, como os universos são grandes, investigar todos os elementos populacionais


para determinarmos a característica necessita muito tempo, e/ou o custo é elevado, e/ou
o processo de investigação leva a destruição do elemento observado, ou, como no caso
de populações infinitas, é impossível observar a totalidade da população. Assim, estudar
parte da população constitui-se um aspecto fundamental da Estatística.

Amostra: É qualquer subconjunto da população.

1.4 Tipos de variáveis


As características da população que nos interessa analisar recebem o nome de
variáveis. As características ou variáveis podem ser divididas em dois tipos:
qualitativas e quantitativas.

Variáveis qualitativas - quando o resultado da observação é apresentado na


forma de qualidade ou atributo. Exemplos: sexo; estado civil; grau de escolaridade; etc.

Variáveis quantitativas - quando o resultado da observação é um número,


decorrente de um processo de mensuração ou contagem. Exemplos: número de filhos;
salário mensal; altura; peso; idade; tamanho da família; etc.

As variáveis qualitativas são divididas em dois tipos: nominal, para a qual não
existe nenhuma ordenação nas possíveis respostas da referida variável, e ordinal, para a
qual existe uma ordenação. Por exemplo,

Qualitativa NOMINAL (SEXO, COR DOS OLHOS,TIPOS DE DEFEITOS...)


ORDINAL (CLASSE SOCIAL, GRAU DE INSTRUÇÃO, PORTE DE
EMPRESA...)

As variáveis quantitativas são divididas em: discretas, que assumem valores em um


conjunto finito ou enumerável de números, contínuas, que assumem valores em um intervalo
números reais.
Quantitativa CONTÍNUA (PESO, ALTURA, VIDA ÚTIL DE BATERIA...)
DISCRETA (NÚMERO DE FILHOS, NÚMERO DE CARROS,
NÚMERO DE DEFEITOS...)

4
Para resumir as informações levantadas durante uma pesquisa usaremos a
técnica e a representação mais apropriada, a depender do tipo de variável que estamos
analisando.

2. APRESENTAÇÃO DOS DADOS


Esta seção apresenta alguns procedimentos que podem ser utilizados para
organizar e descrever um conjunto de dados, tanto em uma população como em uma
amostra.
O conjunto de informações disponíveis, após a tabulação do questionário ou
pesquisa de campo, é denominado de tabela de dados brutos. Apesar de conter muita
informação, a tabela de dados brutos pode não ser prática para respondermos às
questões de interesse.

Exemplo: Banco de dados (dados brutos)


Foi realizada uma pesquisa por amostragem junto às indústrias de matérias
plásticas nas principais regiões metropolitanas do Brasil e investigou-se as seguintes
variáveis: constituição jurídica; porte; número total de empregados em 1999;
faturamento anual em 1998 e 1999; tempo de existência; região metropolitana; e setor
de atividade. As observações referentes às 106 empresas amostradas encontram-se no
arquivo Empresa.xls.

Dado um conjunto de dados o modo de condensação ou apresentação das


informações pode ser na forma de tabelas de frequências ou de gráficos que facilitam a
visualização do fenômeno, permitem a comparação com outros elementos ou, ainda,
fazer previsões.

2.1 Tabela ou Distribuição de frequências


O fenômeno considerado é uma variável qualitativa ou quantitativa (discreta ou
contínua) e seus valores observados são descritos considerando o número de vezes que
ocorreram na tabela de dados brutos (frequência).
Algumas definições:

Frequência simples absoluta( fi ): é o número de ocorrências ou repetições de um valor


individual ou um intervalo de valores.

Frequência simples relativa(fri): é a razão entre a frequência simples absoluta e o


número total de dados (soma de todas as frequências simples absolutas).

Agora vamos exemplificar distribuições de frequência para cada tipo de variável.

1ª) Variável qualitativa Nominal ou Ordinal

As variáveis qualitativas obtidas em uma pesquisa podem ser organizadas em formas de


tabelas para facilitar a visualização e análise dos dados.

Exemplo 2.1: Considere a planilha de dados empresa.xls. Para a variável “porte de


empresa” construa uma tabela:

5
Tabela 2.1: Porte das indústrias de matérias plásticas nas principais regiões metropolitanas do
Brasil - 1999
%
Porte da Indústria Números de indústrias
(100xfri )
Grande 23 21,7
Média 70 66,0
Pequena 13 12,3
Total geral 106 100,0
Fonte: Dados fictícios

a) Variável Quantitativa Discreta

Exemplo 2.2: Foi observado o número de defeitos apresentados por uma máquina
industrial durante o período de 30 dias. Os resultados foram os seguintes:
1 1 1 0 1 1
0 2 1 3 1 0
1 1 1 2 0 1
1 1 4 1 0 3
2 2 1 1 0 1

Tabela 2.2: Número de defeitos em uma máquina industrial durante o período de 30 dias
Número de Quantidade (fi) %
defeitos (100xfri)
0 6 20,0
1 17 56,7
2 4 13,3
3 2 6,67
4 1 3,33
Total 30 100,0
Fonte: Dados fictícios

b) Variável Quantitativa Contínua

Para certo conjunto de dados, vamos adotar a seguinte nomenclatura:

1. Máximo (max): maior valor do conjunto.


2. Mínimo (min): menor valor do conjunto.
3. Amplitude total (AT): é a diferença entre o valor máximo e mínimo.
AT = MAX – MIN
4. Classe: é cada um dos intervalos em que se subdivide a amplitude total.
Representação: k = número de classes
5. Limite superior ( lsup): é a cota superior para os valores da classe.
6. Limite inferior ( linf): é a cota inferior para os valores da classe.
7. Amplitude do intervalo de classe (hi): é o comprimento da classe, definida como a
diferença entre o limite superior e inferior.
8. Ponto médio (Xi): é a média entre os limites superior e inferior da classe i.

6
Determinação do número de classes e amplitude do intervalo de classes:

Não existem regras gerais, universalmente aceitas, para a determinação do número de


classes. Existem, no entanto, algumas regras propostas por diferentes autores, que dão
ideia aproximada do número de classes em função do número de dados.

Um dos métodos utilizado é chamado de regra de Sturges ou regra do logaritmo. Ele


estabelece que
k ≅ 1 + 3,3 log 10 n,
em que k é o número de classes e n é o número de dados. Outra maneira para obter o
número de classes é
k ≅ n.
Mesmo conhecendo alguns métodos para a determinação do k, deve-se saber que a
escolha dependerá antes da natureza dos dados, da unidade de medida e da experiência e
do bom senso de quem fará a organização dos dados da pesquisa.

Uma vez encontrado o número de classes, determina-se a amplitude do intervalo de


classes através da fórmula:

AT
h= .
k

Exemplo 2.3: (Werkema, 1995) Os dados abaixo representam o rendimento em (%) de


uma reação para fabricação de uma substância química, em 80 bateladas produzidas por
uma indústria. A empresa decidiu construir uma tabela de frequência para obter um
resumo do conjunto de dados.
70,7 71,8 73,9 74,4 75,9 76,0 76,6 76,7 77,4 78,0 78,1 78,1
78,2 78,4 78,4 78,4 78,5 78,5 78,5 78,9 79,0 79,1 79,3 79,3
79,5 79,5 79,7 79,8 79,9 79,9 80,1 80,2 80,4 80,4 80,5 80,7
80,7 80,7 80,9 81,3 81,4 81,6 81,8 81,9 82,0 82,0 82,1 82,3
82,5 82,7 82,9 83,0 83,0 83,2 83,4 83,5 83,6 83,6 83,7 83,8
84,3 84,5 84,5 84,5 84,6 85,2 85,5 85,5 85,7 86,4 86,5 86,8
86,8 86,8 87,1 87,1 87,1 87,3 88,5 90,0

Procedimento para construir uma tabela de distribuição de frequências com intervalos


de classes.

Solução: Neste caso, n = 80 ⇒ k = (80)1/2 ≅ 9

A amplitude total será dada por AT = 90 – 70,7 = 19,3.

Assim, a amplitude de cada intervalo de classe será: h ≅ 2,2

Dessa forma, a tabela de distribuição de frequências para dados agrupados em classes


fica da seguinte maneira:

7
Tabela 2.3: Rendimento (em %) de uma reação para fabricação de uma substância
química.
Rendimento Número de %
substância (fi) (100xfri)
70,5 |— 72,7 2 2,50
72,7 |— 74,9 2 2,50
74,9 |— 77,1 4 5,00
77,1 |— 79,3 14 17,50
79,3 |— 81,5 19 23,75
81,5 |— 83,7 17 21,25
83,7 |— 85,9 11 13,75
85,9 |— 88,1 9 11,25
88,1 |— 90,3 2 2,50
Total 80 100,00
Fonte: Dados fictícios

2.1.1 Tabela de múltipla entrada

Em alguns casos é necessário apresentar mais de uma variável em uma única tabela.
Quando são utilizadas apenas duas variáveis tem-se uma tabela de dupla entrada.

Tabela 2.4: Porte das indústrias de matérias plásticas por região metropolitana do Brasil -
1999
Porte da empresa
Região Metropolitana Total
Grande Média Pequena
Belo Horizonte 2 9 3 14
Curitiba 1 4 0 5
Porto Alegre 0 7 1 8
Rio de Janeiro 3 13 2 18
Salvador 8 18 4 30
São Paulo 9 19 3 31
Total 23 70 13 106
Fonte: Dados fictícios

2.2 Representação gráfica


Serão apresentados alguns tipos de gráfico: setor ou pizza, barra, colunas, Pareto
e histograma.

1º) Gráfico em barras

Utilizado para representação de variáveis qualitativas e quantitativas discretas.

8
Exemplo 2.4:

Tabela 2.5: Tipo de fraude nos cartões de crédito da


Mastercard Internacional no Brasil - 2000
Tipo de fraude Quantidade
Cartão roubado 243
Cartão falsificado 85
Pedido por correio/telefone 52
Outros 46
Fonte: Triola, Mario F.

Figura 2.1:: Tipo de fraude nos cartões de crédito da Mastercard Internacional no Brasil -
2000

Fonte: Triola, Mario F.

2º) Gráfico em colunas

Utilizado para representação de variáveis qualitativas e quantitativas


discretas.

Exemplo 2.5:

Tabela 2.6: Número de crianças de baixa renda, segundo o bairro


de residência, que participaram do ensino de música na
Escola XYZ, em Salvador - 1998
Bairro Número de crianças
Paripe 11
Periperi 39
Plataforma 45
Praia Grande 25
Total 120
Fonte: Escola de Música XYZ, Salvador.

9
Figura 2.2: Número de crianças de baixa renda, segundo o bairro de residência,
que participaram do ensino de música na Escola XYZ, em Salvador - 2008

Fonte: Escola de Música XYZ, Salvador

Exemplo 2.6:

Tabela 2.7: Estudantes da Universidade XYZ


Segundo área de estudo e ano de ingresso
Área / Ano 1998 1999 2000
Exatas 120 156 68
Humanas 72 85 112
Biológicas 169 145 73
Fonte: Dados Fictícios

Figura 2.3: Estudantes da Universidade XYZ


Segundo área de estudo e ano de ingresso

Fonte: Dados Fictícios

10
Exemplo 2.7: Gráfico para o exemplo 1.2.
Figura 2.4: Número de defeitos em uma máquina industrial durante o período de 30 dias

Fonte: Dados fictícios

3º) Gráfico de Pareto

O gráfico de Pareto é composto por colunas e por uma curva representando a


percentagem acumulada. As barras estão disponíveis em ordem decrescente, tornando
evidente a priorização de temas. Este gráfico é muito utilizado na área de Controle de
Qualidade.

Exemplo 2.8: (Werkema, 1995)

Uma indústria fabricante de lentes tem como objetivo resolver o seguinte problema:
aumento do número de lentes defeituosas produzidas pela empresa a partir de fevereiro
de 1995. A empresa classificou uma amostra de lentes fabricadas durante uma semana
de produção de acordo com os tipos de defeitos detectados. O resultado está na tabela a
seguir:

Tabela 2.8: Defeitos encontrados em uma amostra de lentes fabricadas durante uma
semana de produção de uma indústria em 1200 lentes inspecionada.

Tipo de Defeito Quantidade


Arranhão 12
Trinca 41
Revestimento Inadequado 55
Muito Fina ou Muito Grossa 11
Não Acabada 05
Outros 03
Total 127
Fonte: Dados fictícios

Uma maneira de representarmos graficamente estes dados é através do gráfico de


Pareto, para que seja possível identificar com mais facilidade o defeito que apareceu

11
com maior frequência. Para construirmos o gráfico de Pareto é necessário obtermos a
planilha de dados mostrada na tabela a seguir.

Tabela 2.9: Planilha de dados para construção de gráfico de Pareto.


Tipo de defeito Quantidade de Total Percentagem do Percentagem
defeito acumulado total geral (%) acumulada
Revest. Inadeq. 55 55 43,3 43,3
Trinca 41 96 32,3 75,6
Arranhão 12 108 9,4 85,0
Fina ou Grosa 11 119 8,7 93,7
Não- Acabada 5 124 3,9 97,6
Outros 3 127 2,4 100,0
Total 127 / 100 /
Fonte: Dados fictícios

Na Tabela 2.9 os tipos de defeitos foram listados em ordem decrescente de quantidade


na coluna 1, a quantidade de defeitos aparece na coluna 2 e o total acumulado está na
coluna 3. Nas colunas 4 e 5 estão as percentagens totais e as percentagens acumuladas
respectivamente. As barras do gráfico de Pareto foram construídas a partir dos dados da
coluna 2 e a curva acumulada conhecida como curva de Pareto, foi traçada a partir dos
números da coluna 5.

Figura 2.5: Gráfico de Pareto para os defeitos de lentes

100
Percentagem
100 80 Acumulada
Controle

60

50 40

20

0 0
do sa
qua oG
ros
nade ca o uit ada
Defeitos nto
I nh M cab ros
Trin Arra ao
u
oA Out
ime n
est ito
Fi N
Rev Mu
Quantidade 55 41 12 11 5 3
Percentagem 43.3 32.3 9.4 8.7 3.9 2.4
Perc. Acumulada 43.3 75.6 85.0 93.7 97.6 100.0

Observando a Figura 2.5, foi imediato para indústria perceber que os dois tipos de
defeitos mais frequentes, “Revestimento inadequado” e “trinca”, representavam 75,6%
dos defeitos detectados nas lentes produzidas pela empresa. Portanto, “Revestimento
inadequado” e “trinca” foram considerados os defeitos mais importantes, que devem ser
eliminados em primeiro lugar esse tipo de defeito é chamado de poucos defeitos vitais,
enquanto que os outros representam apenas os muitos defeitos triviais pois
representam a minoria das observações.

12
4º) Gráfico em linhas ou curvas
Utilizado para descrever séries temporais que são dados observados em instantes
ordenados do tempo.

Exemplo 2.9:
Tabela 2.10: Índice de Produto Industrial
Brasil – 1979
Meses IPI
Janeiro 18.633
Fevereiro 17.497
Março 19.470
Abril 18.884
Maio 20.308
Junho 20.146
Julho 20.258
Agosto 21.614
Setembro 19.717
Outubro 22.133
Novembro 20.503
Dezembro 18.800
Fonte: FIBGE

Figura 2.6: Índice de Produto Industrial


Brasil – 1979

Fonte: FIBGE

13
5º) Gráfico em setores

Exemplo 2.10:
Tabela 2.11: Percentual de funcionários da
Companhia Milsa segundo região de procedência
Procedência Percentual
Interior 33,30
Capital 30,60
Outro 36,10
Fonte: Bussab e Morettin (2002)

Figura 2.7: Percentual de funcionários da


Companhia Milsa segundo região de procedência

Fonte: Bussab e Morettin (2002)

6º) Histograma

Quando os dados estão agrupados em intervalos de classes, o gráfico mais


apropriado é o histograma. No caso de classes de mesma amplitude, é construído um
retângulo para cada classe, com base igual à amplitude do intervalo classe e altura
proporcional a frequência da classe. Neste caso,
altura ~ frequência (absoluta ou relativa)
Quando temos classes com amplitudes diferentes, devemos construir um
retângulo para cada classe, com base igual à amplitude do intervalo de classe e altura
dada por:
frequência
d=
amplitude da classe

Note que, neste caso, a área do retângulo é igual a frequência da classe. A altura d
definida acima é chamada de densidade de frequência.

Exemplo 2.11: Histograma para a distribuição de frequência do exemplo 2.3.


14
Figura 2.8: Rendimento (%) de uma Reação para Produção de uma Substância Químic

Fonte: Dados fictícios

Exercício: As especificações estabelecem um limite inferior para o rendimento igual a


78%. A partir de um histograma, você acredita que o processo está satisfazendo a
especificação? Justifique.

2.2.1 Cuidados na representação gráfica

Distribuição das vendas do produto X por trimestre


segundo as zonas

90
80
70
60
Leste
50
40 Oeste
30 Norte
20
10
0
primeiro segundo terceiro quarto

Fonte: Dados fictícios

Há vários problemas com este gráfico. Ele impressiona mais pela tecnologia
utilizada do que pela informação que passa para o leitor. Os dados não são
tridimensionais. As grades do fundo mais o efeito tridimensional distraem a visão e
dificultam comparações entre trimestre e regiões. Uma forma de melhorar o gráfico é
dar-lhe
lhe a dimensão correta. Ass linhas de grade. Não utilize faixas horizontais, verticais
ou similares, que só atrapalham a visão do leitor. Faça mais de um gráfico até encontrar
um que seja informativo,
ormativo, claro, e que não possua objetos desnecessários.

15
Distribuição das vendas do produto X por trimestre
segundo as zonas

100
90
80
70
Leste
60
Oeste
50
Norte
40
30
20
10
0
primeiro segundo terceiro quarto

Não apresente gráficos supérfluos. Se retirarmos a figura abaixo, toda a


informação poderá ser transmitida textualmente, com uma simples frase: “20% das
respostas foram positivas
tivas e 80% negativas”.
negat

Sim
20%

Não
80%

Observe que o efeito 3-D


3 D dificulta o julgamento das porcentagens relativas de
cada categoria da variável. A retirada do efeito 3-D
3 D ajudará o leitor a julgar melhor as
proporções relativas observadas em cada amostra.

16
3. MEDIDAS DE POSIÇÃO CENTRAL

As distribuições de frequências e os gráficos fornecem mais informações sobre o


comportamento de uma variável do que a própria série original de dados. Mas,
queremos resumir ainda mais esses dados. Com esse objetivo usaremos métodos da
Estatística Descritiva que ensinam a reduzir a informação contida em uma grande
quantidade de dados a um pequeno número de medidas, substitutas e representantes
daquela massa de dados. Vamos agora estudar as medidas da Estatística Descritiva,
agrupadas em medidas de posição (ou de locação ou de localização) central: média,
mediana e moda.

Exemplo de aplicação: (Azulejos)

Uma fábrica de azulejos nos últimos meses passou a receber reclamações de seus
clientes. A maioria das reclamações era relativa aos seguintes problemas:

• Os azulejos, ao serem manuseados, quebravam-se facilmente.


• O assentamento dos azulejos, quando era utilizada argamassa, não produzia um
resultado uniforme em relação ao nível da parede.

Em vista dessa situação, a indústria decidiu formar um grupo de trabalho para resolver
esses problemas. Na etapa de identificação do problema, o grupo de trabalho concluiu
que a produção de azulejos com espessura não adequada poderia estar provocando as
reclamações dos clientes. Esta conclusão resultou do conhecimento dos seguintes fatos:

• Azulejos com espessura muito fina quebram-se facilmente.


• A falta de uniformidade na espessura dos azulejos provoca dificuldades durante o
seu assentamento.

Para avaliar se estavam ocorrendo problemas com a espessura dos azulejos produzidos,
o grupo decidiu retirar uma amostra aleatória dos azulejos fabricados pela empresa,
medir a espessura destes azulejos e comparar os resultados obtidos com as
especificações. Como a empresa empregava duas turmas de trabalho (turmas A e B) e
poderia haver diferença na qualidade dos azulejos produzidos por cada turma, foi
utilizada uma estratificação, sendo então retirada uma amostra de 80 azulejos
produzidos pela turma A e 80 fabricados pela turma B. Os dados coletados, já
ordenados, estão na Tabela 3.1.

Ao observarmos o conjunto de dados já fazemos alguma ideia sobre o comportamento


das duas turmas de trabalho, em termos da espessura dos azulejos que produzem.
Entretanto, claramente necessitamos calcular algumas medidas que resumam a
informação contida nos dados. Vamos começar tentando responder: Qual o valor típico
da turma A? E da turma B? A primeira ideia para obter um valor típico é a de calcular
uma média.

17
Tabela 3.1: Medidas da Espessura (mm) de 160 Azulejos do Estoque (dados ordenados)
TURMA A TURMA B
2,3 3,1 3,8 4,5 4,9 5,6 5,8 6,2
2,4 3,1 3,9 4,5 4,9 5,6 5,8 6,2
2,4 3,3 3,9 4,5 5,0 5,6 5,8 6,3
2,4 3,3 3,9 4,5 5,1 5,7 5,8 6,3
2,6 3,4 4,0 4,5 5,1 5,7 5,9 6,4
2,7 3,4 4,0 4,6 5,1 5,7 5,9 6,4
2,7 3,5 4,0 4,6 5,3 5,7 5,9 6,4
2,8 3,5 4,0 4,7 5,3 5,7 5,9 6,4
2,8 3,5 4,0 4,7 5,3 5,7 5,9 6,4
2,8 3,5 4,1 4,9 5,3 5,7 5,9 6,5
2,9 3,5 4,1 4,9 5,3 5,7 6,0 6,5
2,9 3,5 4,1 5,1 5,3 5,7 6,0 6,5
2,9 3,6 4,2 5,2 5,3 5,7 6,0 6,5
3,0 3,6 4,2 5,4 5,4 5,7 6,1 6,6
3,0 3,7 4,2 5,4 5,4 5,7 6,1 6,7
3,0 3,7 4,3 5,5 5,4 5,7 6,1 6,7
3,1 3,7 4,3 5,6 5,4 5,8 6,1 6,7
3,1 3,7 4,3 5,6 5,4 5,8 6,1 6,8
3,1 3,8 4,4 5,7 5,5 5,8 6,2 6,9
3,1 3,8 4,4 5,9 5,5 5,8 6,2 7,0
Fonte: Dados fictícios

3.1. Média aritmética simples

A média aritmética simples de n números x 1 , x 2 ,..., x n é um valor x tal que


x1 + x2 + ... + xn = x + x + ... + x = nx
logo temos que,
n

x1 + x2 + ... + xn ∑x i
x= = i =1

n n

Podemos pensar na média aritmética como o valor “típico” do conjunto de dados e é


considerada a principal medida de posição central. Algumas das razões que fazem com
que seja a medida de posição mais recomendada são:

• É definida rigorosamente e pode ser interpretada sem ambigüidades;

• Leva em consideração todas as observações efetuadas;

• Calcula-se com facilidade.

Entretanto, esta medida apresenta alguns inconvenientes como o fato de ser muito
sensível a valores extremos, isto é, a valores excessivamente pequenos ou
excessivamente grandes, em relação às demais observações do conjunto de dados.

18
Exemplo 3.1: Estamos interessados em conhecer o salário médio mensal de certa
empresa com cinco funcionários. Temos o seguinte conjunto de salários mensais, em
reais: 123 - 145 - 210 - 225 - 2.500. Podemos observar que quatro dos cinco salários
apresentam valores entre 123 e 225 reais, porém a média salarial de 640,6 reais é
bastante distinta desse conjunto pela influência do salário de 2.500 que puxou o valor
médio para cima.

Em algumas situações, os números que queremos sintetizar têm graus de


importância diferentes. Utiliza-se então uma média ponderada. Vamos ver a seguir a
definição da média aritmética ponderada.

A média aritmética ponderada dos números x1 , x2 ,..., xn , n com pesos p1, p2,
..., pn é definida por

n
∑ xi .pi ∑ x.p .
i =1
xp = , ou simplesmente por x p =
n
∑ pi ∑p
i =1

Obs: Quando os dados estão agrupados por frequências (absolutas ou relativas) os


ponderadores serão as frequências.

Exemplo 3.2: Em um grupo de pessoas, 70% são adultos e 30% são crianças. O peso
médio dos adultos é 70 kg e o peso médio das crianças é 40 kg. Qual o peso médio do
grupo?
Solução: É a média aritmética ponderada dos dois subgrupos. A resposta é
70 × 0,7 + 40 × 0,3
xp = = 61kg
0,7 + 0,3

Exemplo de aplicação: (Azulejos)

Para responder à questão do valor típico da espessura dos azulejos produzidos pelas
Turmas A e B calculamos então as médias aritméticas, pois o desejado é obter a
espessura média M tal que se a espessura de cada azulejo fosse sempre igual a M a
soma total seria a mesma.

Resumindo em uma tabela as médias aritméticas (em mm), temos:

Tabela 3.2: Valor da média aritmética por turma para dados da espessura dos azulejos
Turma Média aritmética
A 3,8575
B 5,8725

Observando as médias aritméticas das amostras observadas, parece existir diferença, em


termos médios, entre as espessuras dos azulejos que estão sendo continuamente
produzidos pelas turmas A e B.

19
3.2 Moda

A moda é outra medida de locação, mas diferentemente da média, não utiliza em seu
cálculo todos os valores do conjunto de dados analisado.

A moda é o valor que ocorre com maior frequência no conjunto de dados.

Notação: Mo = moda

Exemplo 3.3:

a) X = {2, 3, 3, 5, 5, 5, 6, 7} ⇒ Mo = 5

b) Y = {10, 12, 17, 21, 32} ⇒ Mo = não existe, a distribuição é amodal.

c) Z = {2, 2, 5, 5, 7, 7} ⇒ Mo = não existe

d) W = {10, 12, 12, 12, 13, 13, 15, 18, 18, 18, 21} ⇒ A distribuição apresenta dois
valores modais: 12 e 18 (distribuição bimodal).

Obs: A moda é a única medida de posição central que pode ser usada em tabelas com
variáveis qualitativas.

Quando o conjunto de dados apresenta mais de uma moda damos o nome de


distribuição plurimodal.

A moda é uma medida mais adequada ao caso de dados agrupados. Quando a


distribuição de frequências está organizada por classes de valores, devemos identificar a
classe modal (classe em que observamos a maior frequência). O ponto médio da classe
modal será o valor estimado para a moda que é denominada moda bruta.

hi
Mo = li nf +
2
em que: linf = limite inferior da classe modal;
hi = amplitude da classe modal;

No caso de dados não agrupados, a moda nem sempre tem utilidade com elemento
representativo ou sintetizador do conjunto. Consideremos por exemplo o seguinte
conjunto de dados:

20
Tabela 3.3: Quantidade de operários das empresas de telemarketing na cidade de
Salvador - 2010.
Quantidade de Quantidade de
operários empresas
7 1
11 1
15 1
17 2
19 1
21 1
25 3
Fonte: Dados fictícios

De acordo com a definição a moda é 25, entretanto este valor não é representativo do
conjunto de dados e, portanto a moda não é uma boa medida de locação neste caso.

Exemplo de aplicação: (Azulejos)

Para obtermos a moda bruta é necessário construir uma distribuição de frequência.


(número de classes definido arbitrariamente)

Tabela 3.4: Espessura (em mm) dos azulejos fabricados pela Turma A
Espessura Nº de
azulejos
2,25  2,75 7
2,75  3,25 15
3,25  3,75 16
3,75  4,25 17
4,25  4,75 14
4,75  5,25 4
5,25  5,75 6
5,75  6,25 1
Fonte: Dados fictícios

Tabela 3.5: Espessura (em mm) dos azulejos fabricados pela Turma B
Espessura Nº de
azulejos
4,75  5,25 6
5,25  5,75 30
5,75  6,25 26
6,25  6,75 15
6,75  7,25 3
Fonte: Dados fictícios

Resumindo em uma tabela os valores modais (em mm), temos:

21
Tabela 3.6: Valor da moda por turma para dados da espessura dos azulejos
Turma Moda
A 4,0
B 5,5

3.4 Mediana

Notação: Md = mediana

Definição: Chamamos de mediana o elemento do conjunto que ocupa a posição central


na distribuição ordenada (crescente ou decrescente). Isto é, divide a distribuição em
duas partes iguais de modo que 50% dos valores observados são inferiores ao valor
mediano e 50% superiores a esse valor.
Notação: X(i)= elemento que ocupa a i-ésima posição da série ordenada.
n =número de elementos da série.

X n  + X n 
   +1
2 2 
1) Md = , n é par
2

2) Md = X  n +1  , n é ímpar
 
 2 

A mediana é uma medida de posição resistente, pois é pouco afetada por mudanças de
pequena porção dos dados, ao contrário da média aritmética que é sensível a valores
atípicos.

Exemplo 3.4: Comparação entre a média aritmética e a mediana para os conjuntos de


salários (em reais) dados.

X = { 200, 250, 250, 300, 450, 460, 510} ⇒ X = 345,7; Md = 300.

Y = { 200, 250, 250, 300, 450, 460, 2.300} ⇒ Y = 601,0; Md = 300.

Podemos observar que no caso do conjunto Y a média não sintetiza adequadamente o


conjunto de dados, pois apenas um valor é superior a ela.

Exemplo de aplicação: (Azulejos)

As mesmas comparações feitas para a média podem ser feitas para a mediana para o
nosso conjunto de dados. Resumindo em uma mesma tabela as médias e as medianas
(em mm), temos:

Tabela 3.7: Medidas- resumo por turma para dados da espessura dos azulejos
Turma Média aritmética Mediana
A 3,857 3,8
B 5,865 5,8
Fonte: Dados fictícios

22
Para ambas as turmas, a média aritmética e a mediana apresentam valores semelhantes.
A mediana indica que 50% dos azulejos produzidos pela turma A estão com espessura
inferior a 3,8mm e 50% dos produzidos pela turma B apresentam espessuras superior a
5,8mm.

3.5 Indicações para utilização das três principais medidas de posição


central
Vimos que as três principais medidas de posição - a média aritmética, a mediana e a
moda - têm o mesmo objetivo: determinar um valor típico do conjunto de dados. Surge,
então, a seguinte questão: quando deveremos utilizar cada uma dessas medidas?

De maneira geral, a moda é a menos empregada e a mais difícil de calcular


satisfatoriamente. No entanto, é adequada para caracterizar situações onde estejam em
causa os casos ou valores mais usuais. Por exemplo, em estudos de mercado, o
empresário pode estar interessado nas medidas que mais se vendem.

Correntemente a escolha é feita entre a média e a mediana, dependendo da natureza do


problema a estudar e de outros fatores, muitos dos quais não podem abordar-se a nível
elementar.

A mediana tem vantagem: é mais resistente do que a média, isto é, a alteração drástica
de um só valor do conjunto de dados reflete-se substancialmente no valor da média e
pode não refletir-se, ou refletir-se muito pouco, no valor da mediana.

A média tem vantagens: quando a curva de frequências tem forma de sino, mais ou
menos simétrica, com abas decaindo rapidamente (valores erráticos muito improváveis),
a média é mais eficiente do que a mediana; a média é uma função linear das
observações, propriedade que também pode pesar na sua adoção.

Por fim, uma vantagem da mediana e da moda em relação à média aritmética é que esta
última não pode ser calculada quando ocorrem classes de frequências com limites
indefinidos (classes abertas). Entretanto, nesta situação, a moda e a mediana podem ser
encontradas sem qualquer dificuldade.

4. SEPARATRIZES
As separatrizes são medidas que permitem calcularmos valores da variável que dividem
ou separam a distribuição em partes iguais. Temos três tipos de separatrizes, também
chamadas de quantis: os quartis; os decis; e os percentis.

As medidas de posição denominadas quartis, decis e percentis têm construção análoga a


da mediana. Enquanto a mediana separa a distribuição em duas partes iguais, a
característica principal de cada uma dessas medidas é:

• Quartis: dividem a distribuição em quatro partes iguais;


• Decis: dividem em dez partes iguais;
• Percentis: dividem em cem partes iguais.

23
Notações:
Qi = quartil de ordem i;
Di = decil de ordem i;
Pi = percentil de ordem i

Observações:

i) Temos a seguinte igualdade: C50 = D5 = Q2 = Md

ii) O cálculo para os decis e os percentis é análogo ao dos quartis.

iii) O intervalo interquartil ou interquartílico, definido por (Q1; Q3), contém 50% do
total de observações localizadas mais ao centro da distribuição.

iv) Podemos também ter idéia sobre a forma da distribuição utilizando apenas seus
quartis:
• Se (Md - Q1) < (Q3 - Md) => assimetria à direita ou positiva;
• Se (Md - Q1) > (Q3 - Md) => assimetria à esquerda ou negativa;
• Se (Md - Q1) = (Q3 - Md) => distribuição simétrica;

As Figuras a seguir ilustram uma distribuição simétrica e distribuições assimétricas,


respectivamente.

Figura 4.1: Distribuição Simétrica: X =Md=Mo

Fonte: Bussab e Morettin (2002)

Figura 4.2: Distribuições Assimétricas:


Mo ≤Md≤ X X ≤ Md≤ Mo

Fonte: Bussab e Morettin (2002)

24
Cálculo dos percentis

A posição do percentil de ordem i no conjunto de dados ordenado será definida como:


n
Posi = i . , em que Posi = posição do percentil de ordem i; e n = número de
100
elementos da série

1) Se Posi = valor inteiro, então o percentil é definido como a média dos valores que
ocupam a posição Posi e Posi + 1.

2) Se Posi = valor não inteiro, então o percentil é definido como o valor que ocupa a
posição u + 1 , em que u = inteiro mais próximo que seja menor que Posi .

Exemplo 4.1: Calcule Q1 para o seguinte conjunto de dados:


21 23 18 25 24 28

Resolução: Lembrar que Q1 corresponde ao percentil de ordem 25.


1. Ordenar os valores: 18 21 23 24 25 28
2. Pos 25 = 25 (6/100) = 1,5 (valor não inteiro) ⇒ u = 1 e portanto o Q1 é o valor que
ocupa a 2ª posição na série ordenada.
3. Q1 = 21

Exemplo de aplicação: (Azulejos)


Verificar por meio dos quartis o tipo de assimetria para os dados de espessura de
azulejos.

Medidas Turma A Turma B


Q1 3,10 5,55
Md 3,80 5,80
Q3 4,45 6,20
Md – Q1 0,70 0,25
Q3 – Md 0,65 0,40
Assimetria Negativa Positiva

5. MEDIDAS DE DISPERSÃO
Exemplo 5.1: Duas máquinas foram reguladas para encher cada pacote de café com
500g. Com o objetivo de verificar a regulagem dessas máquinas, um fiscal de
área anotou o peso dos 5 primeiros pacotes produzidos por cada máquina e
calculou o peso médio dos pacotes. Os resultados encontram-se abaixo:

Máquinas Peso dos pacotes Peso


1° 2° 3° 4° 5° médio
A 500 497 498 500 495 498
B 490 500 505 510 495 500

25
Observando apenas o peso médio dos pacotes, poderíamos concluir que a
máquina B apresentou melhor desempenho do que A. Porém, quando
observamos cada informação separadamente, verificamos que o peso dos
pacotes vindos da máquina A variou entre 495 e 500g, enquanto que o da B
variou entre 490 e 510g. Isto quer dizer que a máquina A enche os pacotes
mais uniformemente que a máquina B.

As medidas de dispersão servem para avaliar o grau de variabilidade dos valores de


um conjunto de dados. Estas medidas permitem estabelecer comparações entre
fenômenos de mesma natureza ou de natureza distinta e, em geral, essa variabilidade é
observada em torno de uma medida de posição central. Essas medidas podem ser
absolutas ou relativas.

5.1 Amplitude total ( medida de dispersão absoluta)


Notação: AT = Amplitude Total

Definição: A amplitude total de um conjunto de números é a diferença entre os valores


extremos do conjunto.

Exemplo 5.2: Calcular as amplitudes totais do exemplo anterior e identificar qual a


máquina que apresentou a menor dispersão no peso dos pacotes de café.

Resolução: A : AT = 500 - 495 = 5 gramas;


B: AT = 510 - 490 = 20 gramas;

A máquina A apresentou uma menor variabilidade nos pesos dos pacotes de café.

Observações:

1ª) A amplitude total é a medida mais simples de dispersão.

2ª) A desvantagem desta medida de dispersão é que leva em conta apenas os valores
mínimo e máximo do conjunto. Se ocorrer qualquer variação no interior do
conjunto de dados, a amplitude total não nos dá qualquer indicação dessa mudança.

3ª) A amplitude total também sofre a influência de um valor "atípico" na distribuição


(um valor muito elevado ou muito baixo em relação ao conjunto).

Exemplo de aplicação: (Azulejos)


Vamos observar no nosso conjunto de dados as médias aritméticas e as amplitudes
totais (ranges) para termos uma primeira ideia sobre a variabilidade das espessuras dos
azulejos para as diferentes turmas.

Tabela 5.1: Medidas-resumo para dados da espessura dos azulejos


Turma Média aritmética Amplitude total
A 3,8575 3,6
B 5,8725 2,1
Podemos observar que a amplitude total para a turma B é menor que a da turma A.

26
5.2 Desvio-padrão amostral ( medida de dispersão absoluta)
Notação: s = desvio-padrão

Vejamos a seguinte ilustração:

Cinco pessoas são levadas a um laboratório para medir suas respectivas taxas de
colesterol. O laboratório sugere utilizar dois métodos diferentes de medição para efeitos
de controle. Os resultados são dados abaixo:

X =200

* * * * * Método A
177 193 195 209 226

* * * * * Método B
192 196 201204 207

Pode-se observar que em média os métodos de medição do colesterol são iguais porém,
se analisarmos melhor os dados percebemos que no método A os valores estão mais
afastados da média do que no método B. Este fato, nos leva a pensar numa medida que
possa avaliar a dispersão dos dados em torno de sua média. Tal medida é conhecida
como desvio padrão e veremos sua definição a seguir.

Definição: Sejam x1 , x2 ,..., xn , n valores que a variável X assume. O desvio padrão


amostral é definido como:

∑ (x )
n
2
i −x
S= i =1

n −1
Exercício: Calcule o desvio padrão para as taxas de colesterol: método A e método B.

SA = 18,43909 SB= 6,041523

Exemplo de aplicação: (Azulejos)


Da mesma maneira que trabalhamos com a amplitude total, vamos observar no nosso
conjunto de dados as médias aritméticas e os desvios padrões (S) para termos uma
primeira idéia sobre a variabilidade nas espessuras dos azulejos produzidos pelas turmas
A e B.

Tabela 5.2: Medidas-Resumo para dados da espessura dos azulejos

Turma Média Aritmética Desvio Padrão


A 3,8575 0,8706
B 5,8725 0,4802

27
Podemos observar que a Turma B apresenta maior média que a da turma A e além disso
a sua variabilidade é menor. Parece que esta turma atinge mais os objetivos, ou seja,
uniformidade na espessura (menor dispersão) e azulejos com espessura mais grossa.

5.3 Variância ( medida de dispersão absoluta)


Definição: A variância é o quadrado do desvio padrão.

Notação: s2

Observações:

i) O desvio padrão tem a unidade de medida igual a unidade de medida original da


variável, enquanto que a variância apresentará a unidade de medida elevada ao
quadrado.

ii) Ao trabalharmos com os dados de toda a população calculamos a variância e o


desvio padrão populacional dividindo por N (tamanho da população) e não por
N-1.

5.4 Coeficiente de variação de pearson (medida de dispersão relativa)


Quando se deseja comparar a variabilidade de duas ou mais distribuições, mesmo
quando essas se referem a diferentes fenômenos e sejam expressas em unidades de
medida distintas, podemos utilizar o coeficiente de variação de Pearson (medida de
dispersão relativa).

Notação: CV = coeficiente de variação de Pearson ou apenas coeficiente de variação.

Definição: O coeficiente de variação para um conjunto de n observações é definido


como o quociente entre o desvio padrão e a média aritmética da distribuição.

S
CV = ,
X
em que S = desvio padrão amostral.

Observe que esta é uma medida adimensional. Normalmente é expressa em


porcentagem.

Exemplo de aplicação:(Azulejos)

Considerando o exemplo anterior para calcularmos o coeficiente de variação:

Tabela 5.3: Medidas-Resumo para dados da espessura dos azulejos


Turma Média Aritmética Desvio Padrão Coeficiente de Variação (%)
A 3,8575 0,8706 22,57
B 5,8650 0,4855 08,28

Os azulejos produzidos pela turma B são mais homogêneos quanto a espessura.

28
6. Box-plot
O Box-plot é um método alternativo para representar os dados e está ilustrado na
Figura 6.1. O Box-plot fornece informações sobre as seguintes características de um
conjunto de dados: locação, dispersão, assimetria e outliers (observações discrepantes).

Máximo

Quartil 3

Mediana

Quartil 1

Q1-1,5(Q3-Q1)
Ponto exterior

O centro da distribuição é indicado pela linha da mediana. A dispersão é


representada pela altura do retângulo (Q3-Q1), o qual contém 50% dos valores do
conjunto de dados. A posição da linha mediana no retângulo informa sobre a assimetria
da distribuição. Uma distribuição simétrica teria mediana no centro do retângulo. Se a
mediana é próxima de Q1 então os dados são positivamente assimétricos. Se a mediana
é próxima de Q3 os dados são negativamente assimétricos.

Os valores fora de Q1–1,5(Q3-Q1), denotado por limite inferior, e Q3+1,5(Q3-Q1),


denotado por limite superior, geralmente são chamados de pontos exteriores e devem
ser investigados como possíveis outliers ou valores atípicos. Pontos exteriores não são
necessariamente outliers, mas um outlier usualmente aparece no gráfico como um ponto
exterior.

29
Exercício de aplicação: (Azulejos) Observemos os Box plots para as turmas A e B.

Temos que para turma A, o limite inferior é Q1–1,5(Q3-Q1)= 3,1-1,5(4,45-3,1)= 1,075 e


o limite superior é Q3+1,5(Q3-Q1)= 4,45+1,5(4,45-3,1)=6,475. E para a turma B, o
limite inferior é 5,55-1,5(6,2-5,55)=4,575 e o superior é 6,2+1,5(6,2-5,55)=7,175.
Então, não há pontos exteriores. Os Box-plots correspondentes as turmas A e B estão na
Figura 6.2. Podemos perceber que a distribuição da espessura dos azulejos fabricados
pela turma A aparentemente apresenta assimetria negativa. Enquanto que para a turma
B observa-se assimetria positiva.

Figura 6.2: Box-plot para as espessuras (mm) dos azulejos por turma

Observações sobre a construção e interpretação de Box-plots:

1. Quando a distribuição dos dados é simétrica, a linha que representa a mediana estará
localizada mais ou menos no centro do retângulo e as duas linhas que partem das
extremidades do retângulo terão aproximadamente os mesmos comprimentos.
2. De modo geral, quando a distribuição dos dados é assimétrica à direita, a linha que
representa a mediana estará mais próxima de Q1 do que de Q3. Isto acontece porque
a metade inferior dos dados está dispersa em uma faixa de comprimento menor que
o comprimento da região ocupada pela metade superior do conjunto de dados.

30
3. Quando a distribuição dos dados é assimétrica à esquerda, a linha que representa a
mediana estará mais próxima de Q3 do que de Q1. Isto acontece porque a metade
superior dos dados está dispersa em uma faixa de comprimento menor que o
comprimento da região ocupada pela metade inferior do conjunto de dados.
4. O Box-plot também pode ser desenhado na posição vertical.
5. Os Box-plots são muito úteis para a comparação de dois ou mais conjuntos de
dados.

Exercício de aplicação: (Azulejos)

Utilizando agora todos os novos conhecimentos que você adquiriu, responda:

a) Sabendo que os limites de especificação para a espessura dos azulejos são (5,0 ±
1,5) mm, você considera que a espessura não adequada dos azulejos pode estar
provocando as reclamações dos clientes? Por que?

b) A forma do histograma construído para todos os dados considerados em conjunto


está indicando que pode haver diferença na qualidade dos azulejos produzidos em
diferentes níveis dos fatores de manufatura do processo de fabricação dos azulejos?
Por quê?

c) Você considera que as duas turmas trabalham do mesmo modo ou existe diferença
entre a qualidade dos azulejos produzidos pelas duas turmas? Justifique sua
resposta.

d) O problema de quebra dos azulejos parece ser comum aos azulejos produzidos por
ambas as turmas de trabalho da empresa ou parece estar associado a uma turma
específica? Por que?

e) O problema de falta de uniformidade no assentamento dos azulejos parece ser


comum aos azulejos fabricados por ambas as turmas de trabalho da empresa ou
parece estar associado a uma turma específica? Por que?

31
1ª LISTA DE EXERCÍCIOS

1) Classifique cada uma das variáveis abaixo em qualitativa (nominal/ordinal) ou quantitativa


(discreta/contínua):
a) Ocorrência de hipertensão arterial em grávidas com mais de 35 anos (sim ou não são
possíveis respostas para esta variável).
b) Intenção de voto para presidente (possíveis respostas são os nomes dos candidatos, além de
“indeciso”).
c) Perda de peso de maratonistas na Corrida de São Silvestre, em quilos.
d) Intensidade da perda de peso de maratonistas na Corrida de São Silvestre (leve, moderada,
forte).
e) Grau de satisfação da população brasileira com relação ao trabalho de seu presidente
(valores de 0 a 5, com 0 indicando totalmente insatisfeito e 5 totalmente satisfeito).

2) Um questionário foi aplicado aos dez funcionários do setor de contabilidade de uma empresa
fornecendo os dados apresentados na tabela:
Funcionário Sexo Curso Idade Salário (R$) Anos de
(completo) empresa
1 masculino superior 34 1100,00 5
2 feminino superior 43 1450,00 8
3 feminino médio 31 960,00 6
4 masculino médio 37 960,00 8
5 masculino médio 24 600,00 3
6 feminino médio 25 600,00 2
7 masculino médio 27 600,00 5
8 feminino médio 22 450,00 2
9 masculino fundamental 21 450,00 3
10 feminino fundamental 26 450,00 3
a) Classifique cada uma das variáveis;
b) Faça uma representação gráfica para a variável curso;
c) Faça uma tabela para a variável curso por sexo.

3) Uma empresa do ramo automobilístico apresentou nos últimos anos os seguintes dados:
Ano Veículos Vendidos Gastos com propaganda (R$) Renda per capita
(US$)
1990 116002 1713 429
1991 154972 2835 455
1992 178179 3585 482
1993 233011 5566 514
1994 295725 7251 556
1995 343533 8146 596
1996 379370 9148 632
Dados fictícios
a) represente graficamente cada série separadamente;
b) analisando essas tabelas e gráficos pode-se concluir que os gastos com propaganda foram
compensados com o aumento da quantidade de veículos vendidos? Justifique.

4) Uma indústria automobilística verificou que, nos últimos meses, ocorreu um aumento no
número de reclamações sobre a ocorrência de defeitos no suporte da lanterna traseira de um
modelo de automóvel por ela fabricado. A empresa desejava eliminar esta situação indesejável e
para isto iniciou estudos para melhorar resultados. Na etapa de identificação do problema, os
técnicos da indústria classificaram o número total de peças defeituosas encontradas em uma
amostra de peças produzidas durante uma semana de trabalho, segundo os tipos de defeitos que
foram detectados. Os dados obtidos são apresentados na tabela abaixo.

32
Defeitos encontrados em uma amostra de suportes da lanterna traseira
de um modelo de automóvel durante uma semana de produção de uma indústria.
Tipo de defeito Quantidade de
defeitos
Moldagem solta 14
Solda quebrada 01
Centro da moldagem 04
deslocado
Lateral da moldagem 24
deslocada
Moldagem arranhada 01
Moldagem dentada 44
Plástico arranhado 07
Limpeza incompleta 79
Orifício deslocado 01
Pino deslocado 05
Total 180

a) Construa um gráfico adequado para esta série.


b) Identifique os tipos de defeitos que os técnicos da empresa deveriam “atacar” em primeiro
lugar, com o objetivo de melhorar os resultados que vinham sendo obtidos pela indústria.
Justifique sua resposta.

5) De acordo com uma pesquisa, vê-se que dos 36 empregados da seção de orçamentos
da Cia. Milsa, 12 têm o primeiro grau de educação, 18 o segundo e 6 possuem título
universitário. Apresente esta distribuição em uma tabela (com as proporções) e em um
gráfico.

6) Uma empresa procurou estudar a ocorrência de acidentes com seus empregados, tendo, para
isso, realizado um levantamento abrangendo um período de 36 meses, onde foi observado o
número de operários acidentados para cada mês. Os dados correspondentes são:
1 2 2 3 3 3 3 4 4 4 4 4
5 5 5 5 5 5 5 6 6 6 6 6
6 7 7 7 7 7 8 8 8 9 9 10
a) Construa uma distribuição de freqüência adequada;
b) Represente graficamente a distribuição do item a;
c) Em qual porcentagem de meses houve, exatamente, seis acidentes?
d) Em qual porcentagem de meses houve até quatro acidentes?

7) Contou-se o número de erros de impressão da primeira página de um jornal durante 50 dias,


obtendo-se os resultados abaixo:
08 11 08 12 14 13 11 14 14 05 06 10 14 13 06 12 07
05 08 08 10 16 10 12 12 08 11 06 07 12 07 10 14 05
12 07 09 12 11 09 14 08 14 08 12 10 12 13 07 15
a) Construa uma distribuição de frequência adequada;
b) Represente a distribuição graficamente;
c) Calcule o número médio de erros de impressão por primeira página;
d) Calcule a mediana;
e) Determine a moda.

8) A distribuição de freqüências do salário anual dos moradores do bairro A que têm alguma
forma de rendimento é apresentada na tabela abaixo:

33
Faixa Salarial fi
(x10 S.M.)
0 − 2 10.000
2 − 4 3.900
4 − 6 2.000
6 − 8 1.100
8 − 10 800
10 − 12 700
12 − 14 2.000
a) Construa um histograma da distribuição e identifique o tipo de assimetria;
b) A média é uma boa medida para representar estes dados? Justifique sua resposta.

9) Os dados abaixo se referem ao diâmetro, em polegadas, de uma amostra de 40 rolamentos de


esferas produzidas por uma companhia:
0.738 0.729 0.743 0.740 0.736 0.741 0.735 0.731 0.726 0.737
0.728 0.737 0.736 0.735 0.724 0.733 0.742 0.736 0.739 0.735
0.745 0.736 0.742 0.740 0.728 0.738 0.725 0.733 0.734 0.732
0.733 0.730 0.732 0.730 0.739 0.734 0.738 0.739 0.727 0.735
a) construa uma tabela de distribuição de freqüência por intervalos de classe;
b) represente graficamente a distribuição do item a.

10) Coloque V(verdadeiro) e F(falso) e justifique:


a) ( ) 50% dos dados de qualquer amostra situam-se acima da média;
b) ( ) Numa turma de 50 alunos onde todos tiraram a nota máxima, o desvio padrão é zero;
c) ( ) Quando queremos verificar a questão de uma prova que apresentou maior número de
erros, utilizamos a média;
d) ( ) Somando-se (ou subtraindo-se) um valor constante e arbitrário a cada um dos elementos de um
conjunto de dados, a média aritmética fica adicionada (ou subtraída) dessa constante.
e) ( ) Multiplicando-se (ou dividindo-se) um valor constante e arbitrário a cada um dos
elementos de um conjunto de dados, a média aritmética fica multiplicada (ou dividida) por essa
constante.
f) ( ) Somando-se (ou subtraindo-se) um valor constante e arbitrário a cada um dos elementos de um
conjunto de dados, o desvio padrão fica adicionado (ou subtraído) dessa constante.
e) ( ) Multiplicando-se (ou dividindo-se) um valor constante e arbitrário a cada um dos
elementos de um conjunto de dados, o desvio padrão fica multiplicado (ou dividido) por essa
constante.

11) Na companhia A, a média dos salários é 10.000 unidades e o 750 percentil é 5.000.
Justifique.
a) Se você se apresentasse como candidato a essa firma e se o seu salário fosse escolhido ao
acaso entre todos os possíveis salários, o que seria mais provável: ganhar mais ou menos
que 5.000 unidades?
b) Suponha que na companhia B a média dos salários é 7.000 unidades e a variância é
praticamente zero, e lá o seu salário também seria escolhido ao acaso. Em qual companhia
você se apresentaria para procurar emprego?

12) Uma indústria de alimentos estava interessada em analisar seu processo de produção de
determinado alimento. Existem nesta indústria duas máquinas responsáveis pelo controlam o
processo de desidratação do alimento. Um importante item de controle do processo é a umidade
do produto final, que segundo as especificações, deve estar na faixa de 8,0% a 12%. Foi
detectado incapacidade do processo em atender às especificações. A equipe técnica suspeitava
de que podia haver diferenças na forma de funcionamento das duas máquinas de desidratação.
Com o objetivo de observar o funcionamento das máquinas foram feitas medidas do teor de
umidade do produto final, estratificadas por máquina de desidratação. Os resultados estão
apresentados a seguir:
34
Máquina 1
11,7 11,8 12,1 10,7 11,7 10,9 10,7 11,6 12,5 10,7 11,5 11,1 11,2 11,2 11,8 11,2 11,0
11,7 11,1 11,3 11,0 12,2 10,7 12,2 11,9 11,1 11,4 10,7 11,2 11,6 11,0 10,9 11,2 11,2
11,3 12,1 10,9 11,7 11,3 11,5

Máquina 2
11,4 11,5 11,5 10,4 11,0 9,9 10,5 10,8 11,4 11,5 10,9 10,2 11,1 11,0 10,2 11,2 11,9
10,8 11,2 11,0 10,2 10,9 11,5 10,9 10,1 11,2 10,7 11,8 11,1 10,4 11,8 11,9 10,7 10,8
10,8 10,4 10,8 11,2 10,8 10,6

Para cada máquina, calcule a média, a mediana, o desvio padrão, o coeficiente de variação e o
intervalo interquartil da variável teor de umidade e construa o histograma e box plot. A partir
das medidas descritivas e dos histogramas e box plots, compare o desempenho das duas
máquinas comentando os aspectos de posição e variabilidade dos dados.

13) Construa a planilha e em seguida o gráfico de Pareto para a tabela abaixo:

Tipo de Defeito Quantidade de Defeito


Moldagem Solta 14
Solda Quebrada 01
Centro de Moldagem Deslocado 04
Lateral de moldagem deslocado 24
Moldagem Arranhada 01
Plástico Arranhado 08
Limpeza Imcompleta 28
Total 80

Gabarito (1ª lista)


1) a)Qualitativa Nominal b) Qualitativa Nominal c)Quantitativa Contínua
d)Qualitativa Ordinal e) Qualitativa Ordinal

2) a)sexo- qualitativa nominal curso- qualitativa ordinal idade- quantitativa


continua salario- quantitativa continua anos de empresa- quantitativa continua
b)grafico colunas , barras , setor
c) Tabela: Funcionários do setor de contabilidade de uma empresa por sexo e grau de
instrução.
Grau de Instrução Fundamental Medio Superior Total
Sexo
Feminino 1 3 1 5

Masculino 1 3 1 5
Total 2 6 2 10
Fonte: exercicio

3) a) Gráfico em colunas ou barras ou linhas (preferência).


b) sim. Quanto mais gasto com propaganda, maior foi o número de carros vendindos
e teve aumento na renda.

4) a)grafico em colunas ou barras ou pareto (preferência).


b) limpeza incompleta e moldagem dentada (maior frequencia).

35
5) Tabela: Grau de instrução empregados da seção de orçamentos da cia. Milsa.
Grau de
Quantidade (fi) fri
instrução
1º grau 12 0,33

2º grau 18 0,50

3º grau 6 0,17
Total 36 1,00
Fonte: exercicio

b) grafico barra ou coluna

6) Tabela: Nº de acidentes ocorridos, por mês, com empregados da empresa no periodo


de trinta e seis meses.
Números de meses
Nº de acidentes fri
(fi)
1 1 0,028
2 2 0,055
3 4 0,111
4 5 0,139
5 7 0,195
6 6 0,167
7 5 0,139
8 3 0,083
9 2 0,055
10 1 0,028
Total 36 1,00
Fonte: exercicio

b) colunas c)1/6 d)1/3

7) Tabela: Número de erros de impressão da primeira página do jornal.


Nº de erros Números de %
páginas(fi) (100xfri)
5 3 6
6 3 6
7 5 10
8 7 14
9 2 4
10 5 10
11 4 8
12 9 18
13 3 6
14 7 14
15 1 2
16 1 2
Total 50 100
Fonte: exercicio

36
b) grafico barras ou colunas. c)10,24 d)10,5 e)12

8) a) positiva ou à direita b) não. Devido a assimetria.

9) a) n= 40 k= 6,32 AT = 0,021 h=0,004

Tabela: Diâmetro (mm) de rolamentos de esferas produzidas por uma companhia.


Diametro Números de %
rolamentos rolamentos(fi) (100xfri)
0,724− 0,728 4 10
0,728 − 0,732 6 15
0,732 − 0,736 11 27,5
0,736 − 0,740 12 30
0,740 − 0,744 6 15
0,744 − 0,748 1 2,5
Total 40 100,0
Fonte: exercicio
b) histograma

10) F,V,F,V,V,F,V 11) a) ganhar menos. b) B

12)
Maquina 1 Maquina 2
Média=11,365 Média=10,95
Mediana=11,25 Mediana=10,9
Desvio Padrão=0,4715 Desvio Padrão=0,5109
CV=0,0415 CV=0,0467
Quartil 1: 11,0 Quartil 1: 10,7
Quartil 3: 11,7 Quartil 3: 11,3

37
7. PROBABILIDADE

7.1 Breve histórico.

Diz–se geralmente que a teoria da probabilidade originou-se com Blaise Pascal


(1623-1662) e Pierre de Fermat (1601-1665), devido à curiosidade de um cavalheiro
Chevalier de Meré, jogador apaixonado, que em cartas discutiu com Pascal problemas
relativos à probabilidade de ganhar em jogos de cartas. Despertado pelo assunto Pascal
discutiu com Fermat sobre o que hoje chamaríamos de probabilidades finitas. Mas em
verdade a teoria elementar das probabilidades já tinha sido objeto de atenção bem antes,
uma vez que os jogos de azar sempre exerceram fascínio sobre os homens.
A primeira obra conhecida em que se estudam as probabilidades é o livro De
Ludo Aleae (Sobre os jogos de azar) de Girolamo Cardano (1501-1576), publicado em
1663. Também Galileu (1564-1642) preocupou-se com as probabilidades, estudando os
jogos de dados para responder a pergunta de um amigo.
A teoria das probabilidades passou a desenvolver-se de maneira mais organizada
a partir do século XVII e importantes contribuições de ilustres matemáticos devem ser
registradas. No famoso livro, Ars Cnjectandi de Jaime Bernoulli (1654-1705)
encontramos um teorema de importância decisiva para a teoria das probabilidades,
conhecido com a Lei dos Grandes Números , nome que lhe foi dado pelo matemático
francês Siméon Poisson (1781-1840). Poderíamos citar muitos outros com importantes
contribuições, mas certamente o matemático que mais contribuiu para a teoria das
probabilidades foi Laplace (1749-1827). Seus inúmeros trabalhos sobre as
probabilidades foram incorporados em seu monumental Tratado Analítico das
Probabilidades.
Atualmente as teorias das probabilidades têm extrema importância nas mais
diversa áreas desde a engenharia, medicina, epidemiologia, demografia, economia,
administração, meteorologia, fotografias de satélites, marketing, predição de desastres
naturais, ciências sociais entre outras.
Além das muitas aplicações formais, o conceito de probabilidade está no nosso
dia a dia. Sempre ouvimos e falamos frases como: ‘Provavelmente vai chover amanhã” ,
“É provável que o avião se atrase” , “Há boas chances de que eu possa comparecer”.
Cada uma desta expressões está baseada no conceito de probabilidade de que certo
evento ocorra.

38
7.2 CONCEITOS BÁSICOS.

Fenômenos ou experimentos aleatórios (E): São aqueles em que o processo de


experimentação está sujeito a incertezas, logo, não é possível controlar todas as
circunstâncias relevantes e, portanto, não é possível prever com exatidão os resultados
individuais.

• Características de um experimento aleatório:

a.1) Poderá ser repetido um grande número de vezes sob as mesmas condições;

a.2) Não podemos afirmar que um resultado particular ocorrerá, porém, podemos
descrever o conjunto de todos os resultados possíveis do experimento - as
possibilidades de resultado.

a.3) Quando o experimento é repetido um grande número de vezes, surgirá uma


regularidade nos resultados. Esta regularidade, chamada de regularidade
estatística, é que torna possível construir um modelo matemático preciso com
o qual se analisará o experimento.

A Teoria da Probabilidade é utilizada para descrever matematicamente experimentos


cujos resultados não podem ser completamente pré-determinados, ou seja, visa definir
um modelo matemático que seja adequado à descrição e interpretação de fenômenos
aleatórios.

Exemplo 7.1: Considere o experimento aleatório de jogar uma moeda uma única vez.
Antes da moeda ser jogada não se sabe o resultado. Conhecem-se apenas os possíveis
resultados: cara ou coroa. Admitindo-se que a moeda é honesta, cada resultado tem a
mesma chance de ocorrer. Neste exemplo, modelos podem ser estabelecidos para
quantificar as incertezas das diversas ocorrências.

Fazendo-se algumas suposições adequadas, é possível escrever distribuições de


probabilidades (modelos probabilísticos) que representem muito bem as distribuições de
freqüências, que só são obtidas quando o fenômeno é observado.

Modelo probabilístico é definido por:


a) Um espaço amostral (Ω);
b) Uma probabilidade, P( · ), para cada ponto amostral.

Espaço amostral (Ω): conjunto de todos os resultados possíveis de um experimento


aleatório.
Exemplos de experimentos aleatórios e seus respectivos espaços amostrais:
E1: Jogar uma moeda e observar a face superior.
Ω1 = { Cara, Coroa }
E2: Jogar um dado e observar a face superior.
Ω2 = { 1, 2, 3, 4, 5, 6 }
E3: Determinar o tempo de vida útil de uma lâmpada.
Ω3 = { t ∈ ℜ / t ≥ 0 }
Espaços amostrais podem ser finitos ou infinitos.

39
Evento: Qualquer subconjunto de um espaço amostral.
Representado pelas letras latinas maiúsculas A, B, C,...

Exemplo 7.2:
No lançamento de um dado consideremos o evento “ocorrer um número par”.
A: ocorrer um número par, em que Ω = {1, 2, 3, 4, 5, 6}.
A = {2, 4, 6} ⊂ Ω

Exemplo 7.3:
Vai chover no litoral baiano no fim de semana? Ω = {chove, não chove}
Em geral, temos interesse em eventos particulares do experimento.
O evento A pode representar a ocorrência de chuva
A = {chove} ⊂ Ω

Os conjuntos Ω e ∅ também são eventos:


Ω é o evento certo
∅ é o evento impossível

Exercício: Descreva o espaço amostral para cada um dos seguintes experimentos a


seguir:

a) Numa linha de produção conta-se o número de peças defeituosas num período


de 1 hora;

Resposta: Ω={0,1,2,...,N} em que N é o número máximo de peças que podem ser


produzidas no período de 1 hora.

b) Mede-se a duração de lâmpadas, deixando-as acesas até que queimem;

Resposta: Ω={t ∈ ℜ / 0 ≤ t ≤ t0 } em que t0 é o tempo máximo de duração da


lâmpada acesa, até que ela se queime ou Ω={t ∈ ℜ / t ≥ 0 }.

c) Lançar uma moeda três vezes, sucessivamente, e anotar a seqüência de caras e


coroas;

Resposta: Ω={ (ca, ca, ca); (ca, ca, co); (ca, co, ca); (co, ca, ca); (ca, co, co); (co, ca,
co); (co, co, ca); (co, co, co)}.

d) Escolher ao acaso um ponto do círculo de raio um centrado na origem.

Resposta: Ω={ ( x, y ) ∈ ℜ2 ; x 2 + y 2 ≤ 1 }.

7.3 OPERAÇÕES COM EVENTOS


Ao realizar um experimento aleatório diz-se que o evento A ocorreu se o resultado
observado for um elemento do subconjunto A.

Dados dois eventos A e B de um mesmo espaço amostral:


• A∩B é o evento em que A e B ocorrem simultaneamente;
40
• A∪B é o evento em que A ocorre ou B ocorre (ou ambos ocorrem);
• Ac ou A é o evento em que A não ocorre.

Exemplo 7.4: E: Lançamento de um dado Ω = {1, 2, 3, 4, 5, 6}

Evento B: representa sair face par => B = {2, 4, 6}


Evento C : representa sair uma face ímpar => C = {1, 3, 5}
Evento D: representa sair uma face maior que 3 => D = {4, 5, 6}
Evento E: representa sair face 1 => E = {1}
Evento B ∩ D: representa sair uma face par e maior que 3 => {2, 4, 6} ∩ {4, 5, 6} = {4,
6}
Evento B ∩ C: representa sair uma face par e ímpar => {2, 4, 6} ∩ {1, 3, 5} = ∅
Evento B ∪ D : representa sair uma face par ou maior que 3 => {2, 4, 6} ∪ {4, 5, 6} =
{2, 4, 5, 6}
Evento B ∪ C : representa sair uma face par ou ímpar => {2, 4, 6} ∪ {1, 3, 5} = {1, 2,
3, 4, 5, 6}
Evento Bc = C
Evento Cc = B

Se dois eventos quaisquer têm intersecção vazia, isto é, eles não podem ocorrer
simultaneamente, dizemos que eles são mutuamente exclusivos ou disjuntos. No
exemplo 7.4, os eventos B e C são mutuamente exclusivos ou disjuntos, visto que B ∩
C= ∅.

7.4 COMO ATRIBUIR PROBABILIDADE A UM EVENTO?

Calcular uma probabilidade é medir a incerteza ou associar um grau de confiança aos


resultados possíveis de um experimento. Por exemplo, ao escolher, ao acaso, uma carta
de um baralho comum (bem embaralhado), o que é mais provável, sair uma figura ( K,
Q, J ) ou sair o dois de copas?

As probabilidades associam aos eventos um valor no intervalo [0,1]. Quanto maior o


valor associado ao evento, maior a certeza de sua possibilidade de ocorrência.

Seja Ω um espaço amostral. Uma função P definida para todos os subconjuntos de Ω


(chamados eventos) é chamada de probabilidade se:
1) 0 ≤ P(A) ≤ 1, para todo evento A ⊂ Ω
2) P(Ω) = 1
3) Se A1, A2, ..., An forem, dois a dois, eventos mutuamente exclusivos, isto é, (Ai ∩
Aj) = ∅ para todo i ≠ j, então
n n
P( U Ai ) = P( A1) + P( A2) + ... + P( An) = ∑ P ( Ai )
i =1 i =1

Existem várias maneiras de atribuir probabilidade a um evento do espaço amostral.


Vamos estudar duas formas. Uma das formas é baseada em espaços amostrais finitos.

41
Um espaço amostral é equiprovável quando todos os elementos têm a mesma
probabilidade de ocorrer, isto é, todos os seus elementos são igualmente prováveis.

Definição: Seja A um evento associado ao espaço amostral finito Ω, no qual todos os


resultados são igualmente possíveis (ou equiprováveis). Vamos definir a probabilidade
do evento A, P(A) como o quociente entre o número de elementos em A e o número de
elementos em Ω:
#A
P ( A) = ,
#Ω
isto é, a razão entre os casos favoráveis ao evento e o total de casos possíveis.
Limitações:
– Dificuldade em enumerar #A e #Ω em alguns casos;
– Ω infinito;
– Modelo adequado apenas para a classe de fenômenos cujo o espaço amostral é
equiprovável.

Exemplo 7.5: Qual a probabilidade de obter um número par no lançamento de um


dado?
Ω = {1,2,3,4,5,6}
A = número par = {2, 4, 6}
3
P(A) =
6

Para calcular probabilidade utilizando a definição clássica, em geral utilizam-se os


métodos de enumeração: Combinações, arranjos e permutações.

Resumo de algumas técnicas sistemáticas de enumeração

1 – Princípios básicos da multiplicação

Dados dois eventos, o primeiro dos quais pode ocorrer de m maneiras distintas e
o segundo pode ocorrer de n maneiras distintas , então os dois eventos
conjuntamente podem ocorrer de m.n maneiras distintas.

Exemplo 7.6: Uma bandeira é formada por 7 listras que devem ser coloridas
usando apenas as cores verde, azul e cinza. Se cada listra deve ter apenas uma
cor e não se pode usar cores iguais em listras adjacentes, de quantos modos se
pode colorir a bandeira?

Solução: Colorir a bandeira equivale a escolher a cor de cada listra. Há 3 modos


de escolher a cor da primeira listra e , a partir daí, 2 modos de escolher a cor de
cada uma das outras 6 listras. A resposta é 3x26 = 192.

42
2 – Permutações

Uma coleção de n objetos diferentes pode ser ordenada de n! maneiras distintas.


Portanto, o nº de permutações de n objetos diferentes é dado por Pn=n! (Essa
regra de permutação, traduz o fato de que o primeiro objeto pode ser escolhido
de n maneiras diferentes, o segundo objeto pode ser escolhido de n-1 maneiras
distintas, e assim por diante).

Exemplo 7.7: De quantos modos podemos arrumar em fila 5 livros diferentes de


Matemática, 3 livros diferentes de Estatística e 2 livros diferentes de Física, de
modo que livros de uma mesma matéria permaneçam juntos?

Solução: Podemos escolher a ordem das matérias de 3! Modos. Feito isso, há 5!


Modos de colocar os livros de Matemática nos lugares que lhe foram destinados,
3! Modos para os de Estatísticas e 2! Modos para os de Física. A resposta é:
3!5!3!2!= 6 x 120 x 6 x 2 = 86400.

3 - Arranjos

É o número de maneiras de escolher p objetos dentre n objetos diferentes (sem


repetição), sendo a ordem importante, e permutar os escolhidos (0 ≤ p ≤ n).
n!
Portanto, o número de arranjos é dado por: Anp =
( n − p )!

Exemplo 7.8: No planejamento de um programa noturno da rede de televisão


NBC, devem ser escolhidos 6 shows dentre 30 disponíveis. Quantas
programações diferentes são possíveis?

Solução: Devemos selecionar p=6 dentre n=30 programas disponíveis. Aqui a


ordem tem importância, por que os espectadores variam no decorrer do tempo.
Logo devemos calcular o número de arranjos Anp = n ! = 30! = 427.518.000 .
(n − p)! (30 − 6)!

4 – Combinação

É o número de maneiras de selecionar p objetos distintos dentre n objetos


distintos dados, sem considerarmos a ordem. Cada seleção de p objetos é
chamada de uma combinação simples de classe p dos n objetos. Representamos
n
o número de combinações simples de classe p de n elementos por C np ou   .
 p
Assim o número de combinações de p objetos extraídos de um conjunto de n
n!
objetos diferentes é Cnp = . ( Basta notar que selecionar p entre os n
p! (n − p )!
objetos equivale a dividir os n objetos em um grupo de p objetos, que são
selecionados, e um grupo de n-p objetos, que são os não-selecionados.)

Exemplo 7.9: Com 5 homens e 4 mulheres, quantas comissões de 5 pessoas,


com exatamente 3 homens, podem ser formadas?

43
Solução: Para formar a comissão devemos escolher 3 dos 5 homens e 2 das 4
 5   4  5! 4!
mulheres. Assim, C53 . C42 =   .   = . = 60 podem ser formadas.
 3   2  3!2! 2!2!

Exemplo 7.10: Um lote é formado de 2 artigos bons e 1 defeituoso. Dois artigos


são selecionados ao acaso:

a) Quantos lotes de 2 artigos diferentes podem ser formados sem considerarmos


a ordem?

Trata-se aqui do número de combinações de p=2 artigos a serem


3!
selecionados dentre 3. Temos C 32 = = 3 , (PP, DP, PD)
2!1!

b) Quantos lotes de 2 artigos diferentes podem ser formados considerando a


ordem?

Aqui, desejamos o número de seqüências (ou permutações) de p=2 artigos a


3!
serem escolhidos dentre os 3. Temos A32 = = 6 , (P1P2, P2P1, D1P1, P1D1,
1!
D1P2, P2D1).

Exercícios:

a) Três garotos e 3 garotas sentam-se em fila. Encontre a probabilidade das 3 garotas


sentarem juntas. Resposta: 0,2.

b) Um lote é formado de 10 artigos bons, 4 com defeitos menores e 2 com defeitos


graves. Dois artigos são escolhidos (sem reposição) ache a probabilidade de que:

i- Ambos tenham defeitos graves? Resposta: 0,00833.

ii- Exatamente um seja perfeito? Resposta: 0,5.

As limitações da definição clássica de probabilidade, que só se aplica a espaços


amostrais finitos e equiprováveis, levaram a considerar outra forma de calcular
probabilidade de um evento partindo da freqüência relativa do evento ao se repetir o
experimento, n vezes, sob as mesmas condições. Em linguagem matemática, quando n
cresce, o limite da freqüência relativa de ocorrência de A é igual a P(A), isto é,
# de repetições que A ocorre
lim f n ( A) = lim = P(A) .
n→∞ n →∞ n

Exemplo 7.11: Suponha que vamos realizar um experimento de lançar 20 vezes uma
moeda e observar o número de caras. A cada lançamento vamos considerar o número de
caras que até então ocorreram (n) dividido pelo número de lançamentos (na), ou seja, a
freqüência relativa de caras. Os resultados referentes a esse experimento encontram-se
na tabela abaixo:

44
N na fa=na/n n na na/n
1 1 1 11 6 6/11
2 1 1/2 12 7 7/12
3 2 2/3 13 7 7/13
4 3 3/4 14 8 8/14
5 3 3/5 15 8 8/15
6 3 3/6 16 8 8/16
7 3 3/7 17 8 8/17
8 4 4/8 18 8 8/18
9 5 5/9 19 9 9/19
10 5 5/10 20 9 9/20

Vejamos o comportamento das freqüências relativas por meio do gráfico a


seguir:

Lançamentos sucessivos de uma moeda


Número de repetições versus freqüência relativa de caras
1,0

0,9

0,8

0,7
Freqüência

0,6

0,5

0,4

0,3

0,2

0,1

0,0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

A partir desta Figura vemos que a medida que aumenta o número de lançamentos, a
freqüência relativa se aproxima de 0,5. Em linguagem matemática dizemos que a
freqüência relativa “converge” para 0,5. Dificuldade do ponto de vista matemático: o
número do limite real pode não existir.

Exercício:

Em uma pesquisa entre estudantes de uma faculdade, 1162 afirmaram que


“colavam”nos exames, enquanto 2468 afirmaram não “colar” [com base em dados do
Josephson Institute of Ethics (Instituto Josephson de Ética)]. Selecionando
aleatoriamente um desses estudantes, determine a probabilidade deste estudante ter
“colado” em um exame. Resposta: 0,3201.

Teoremas:

1. P(∅) = 0

2. Se Ac é o evento complementar de A, então P(Ac) = 1- P(A)

45
3. Sejam A e B dois eventos quaisquer, então:
P (A ∪ B) = P(A) + P(B) - P(A ∩ B)

Demonstração: A∪B= A∪[B∩Ac]


B= (A ∩ B) ∪ (B∩Ac)
P(A∪B) = P(A) + P (B∩Ac)
-P(B) = -P(A ∩ B) - P (B∩Ac)
P (A∪B) = P(A) + P(B) - P(A ∩ B)

4. Se A, B e C forem três eventos quaisquer, então:


P (A ∪ B ∪ C)=P(A) + P(B) + P(C) - P(A ∩ B) - P(A ∩ C) - P(B ∩ C) + P(A ∩ B ∩ C)

Generalização:

P( A1 ∪ K ∪ An ) = ∑ P( Ai ) − ∑ P(Ai ∩ Aj ) + ∑ P(A ∩ A ∩ Ar ) + K + (− 1)
n n n
P( A1 ∩ K ∩ An )
n −1
i j
i =1 i< j i< j <r

Exemplo 7.12: Se P(A∩Bc)=0,2 e P(Bc)=0,7. Achar P(A∪B)? (Use diagrama de Veen)

P(A∩Bc)= P(A) – P(A∩B) ⇒ 0,2 = P(A) - P(A∩B) ⇒ P(A) = 0,2 + P(A∩B)

P(Bc)= 1 – P(B) ⇒ 0,7 = 1 - P(B) ⇒ P(B)= 0,3

P (A ∪ B) = 0,2 + 0,3 = 0,5

Exercícios:

1. Um lote é formado por 10 peças boas, 4 com defeitos menores e 2 com defeitos
graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de que:
a) a peça não tenha defeito grave? Resposta:0,875.
b) a peça não tenha defeito? Resposta:0,625.
c) a peça seja boa ou tenha defeito grave? Resposta:0,75.

2. Dois processadores tipo A e B são colocados em teste por 50 mil horas. A


probabilidade que um erro de cálculo aconteça em um processador do tipo A é de
1 , no tipo B, 1 e em ambos, 1 . Qual a probabilidade de que:
30 80 1000

a) Pelo menos um dos processadores tenha apresentado erro? Resposta:0,045.


b) Nenhum processador tenha apresentado erro? Resposta:0,955.
c) Apenas o processador A tenha apresentado erro? Resposta:0,032.

3. Determine a probabilidade de que n pessoas façam aniversário em dias distintos.


Para resolver este problema, ignoramos as idades, anos bissextos e supomos que os
aniversários de cada pessoa podem cair em qualquer dia com a mesma
probabilidade. Resposta: 365. 364K (365
n
− n + 1)
.
365

46
4. O seguinte grupo de pessoas está numa sala: 5 homens maiores de 21 anos; 4
homens com menos de 21 anos de idade; 6 mulheres maiores de 21 anos e 3
mulheres menores de 21 anos. Uma pessoa é escolhida ao acaso. Define-se os
seguintes eventos: A: a pessoa é maior de 21 anos; B: a pessoa é menor de 21 anos ;
C: a pessoa é homem e D: a pessoa é mulher. Calcule:
a) P(B ∪ D)
b) P( A ∩ C )
c) P(A ∩ B)
Respostas: a)0,722; b)0,167; c)0 ; d)0,389

5. Uma remessa de 30 arruelas contém 5 peças defeituosas e 25 perfeitas. Dez arruelas


são escolhidas ao acaso (sem reposição) e classificadas.
a) Qual a probabilidade de que sejam encontradas exatamente 3 peças defeituosas?
Resposta:0,160
b) Qual a probabilidade de que se encontrem ao menos 2 peças defeituosas?
Resposta: 0,5512

7.5 PROBABILIDADE CONDICIONAL

Considere o exemplo abaixo:


Dados do Censo Demográfico de 91 publicado pelo IBGE relativos aos habitantes de
Sergipe, na faixa etária entre 20 a 24 anos com relação às variáveis Sexo e Leitura.

Sexo Lê Não lê Total


Masculino 39.577 8.672 48.249
Feminino 46.304 7.297 53.601
Total 85.881 15.969 101.850

E: Um jovem entre 20 e 24 anos é escolhido ao acaso em Sergipe.

• Ω : conjunto de jovens de Sergipe, com idade entre 20 e 24 anos. #Ω=101.850.

Eventos de interesse:
• M: “jovem sorteado é do sexo masculino”
• F: “jovem sorteado é do sexo feminino”
• L: “ jovem sorteado sabe ler”
• M ∩ L: “ jovem sorteado é do sexo masculino e sabe ler”
• M ∪ L: “ jovem sorteado é do sexo masculino ou sabe ler”

Podemos obter algumas probabilidades:

nº de jovens que sabem ler 85.881


P( L) = = = 0,843
nº de jovens de Ω 101.850

n º de jovens do sexo masculino 48.245


P( M ) = = = 0,473
nº de jovens de Ω 101.850

P(F) = P(Mc) = 1 - P(M) = 1 - 0,473 = 0,527

47
n º de jovens do sexo masculino e que sabem ler 39.557
P ( M ∩ L) = =
nº de jovens Ω 101.850

P (M ∪ L) = P(M) + P(L) - P(M ∩ L)


= 0,473 + 0,843 - 0,388 = 0,928

No exemplo anterior, se soubermos que o jovem sorteado é do sexo masculino, qual é a


probabilidade de que saiba ler? Temos uma informação parcial: o jovem é do sexo
masculino.
Vamos designar a probabilidade de L quando se sabe que o jovem é do sexo masculino
por P (L M ) e denominá-la probabilidade condicional de L dado M.
É natural atribuirmos:

nº de jovens que sabem ler dentre aqueles do sexo masculino 39.577


P (L M) = = = 0,820
nº total de jovens do sexo masculino 48.249

Note que:

nº jovens do sexo masculino e que sabem ler


nº total de jovens
P (L M) =
nº jovens do sexo masculino
nº total de jovens
P (M ∩ L)
P (L M) =
P (M)

Por exemplo, a probabilidade de ser do sexo masculino dado que lê é dada por:
39 .577
P (M ∩ L) 101 . 850 = 0,460
P (M L ) = =
P (L) 85 .881
101 . 850

DEFINIÇÃO DE PROBABILIDADE CONDICIONAL

Sejam A e B eventos de um experimento aleatório qualquer, com P(B) > 0. A


probabilidade condicional de A dado B(denota-se por P (A B) é definida como:

P(A ∩ B)
P(A B) =
P(B)

7.6 REGRA OU TEOREMA DO PRODUTO

Como conseqüência da definição de probabilidade condicional, podemos calcular a


probabilidade da ocorrência conjunta de dois eventos A e B.

48
P( A ∩ B)
P( A | B ) = ⇒ P( A ∩ B) = P( A | B ) ⋅ P( B)
P( B)

Exemplo 7.13:
Uma urna contém fichas numeradas de 1 a 4. Retira-se uma ficha da urna ao acaso e
anota-se o número. Esta ficha então é recolocada na urna, e retira-se novamente uma
ficha, ao acaso, da urna. Qual a probabilidade de ter saído a ficha com número 1, na
primeira retirada, e de ser 5 a soma dos números das duas fichas retiradas?

Resolução:
Evento A: sair o número 1 na primeira retirada =>P(A) = 1
4
Evento B: soma = 5

Evento B|A : {soma = 5 | a primeira ficha é 1} , se queremos que a soma seja 5, então é
preciso que a segunda ficha seja o número 4 ⇒ P(B|A) = 1
4

Pelo teorema do produto temos que,


P ( A ∩ B ) = P (B | A) ⋅ P ( A) = 1 ⋅ 1 = 1
4 4 16

Exemplo 7.14:
Duas válvulas defeituosas se misturam com duas válvulas perfeitas. As válvulas são
ensaiadas, uma a uma, até que ambas defeituosas sejam encontradas. Qual a
probabilidade de que a última válvula defeituosa seja encontrada no segundo ensaio?

Resolução:
Evento A : sair uma válvula defeituosa =>P(A) = 2
4
Evento B : a última válvula é defeituosa

Evento B|A : sair a última válvula defeituosa | saiu uma válvula defeituosa ⇒ P(B|A) =
1
3

Pelo teorema do produto temos que,

P ( A ∩ B ) = P(B | A) ⋅ P ( A) = 2 ⋅ 1 = 2
4 3 12

De modo geral, considere 3 eventos A, B e C, tem-se que

 ∩  ∩  = | ∩  ∩  = | ∩ |

Esta relação pode ser estendida para um número finito qualquer de eventos.

49
Exercícios:

a) As falhas na fundação de um grande edifício podem ser de dois tipos: A (capacidade


de suportar) e B (fundação excessiva). Sabendo-se que P(A)=0,001, P(B)=0,008 e
P(A|B)=0,1, determinar a probabilidade:

i) De haver falha na fundação? Resposta:0,0082


ii) De ocorrer A e não B? Resposta:0,0002

b) Um sistema eletrônico consta de dois sub-sistemas digamos A e B. De testes prévios


sabe-se que: P(A falhe)=0,20; P(A e B falhem)=0,15 e P(B falhe sozinho)=0,15.
Calcule:

i) P(A falhe | B falhou); Respostas: 0,5


ii) P(A falhe sozinho); Respostas: 0,05

c) Duas lâmpadas queimadas foram acidentalmente misturadas com seis lâmpadas boas.
Se vamos testando as lâmpadas, uma por uma, até encontrar duas defeituosas, qual é a
probabilidade de que a última defeituosa seja encontrada no quarto teste? Resposta: 3/28

7.7 REGRA DA PROBABILIDADE TOTAL

Sejam A e B dois eventos de um experimento qualquer. Há duas maneiras de B ocorrer,


considerando a ocorrência ou não do evento A: ou A e B ocorrem (A ∩ B) ou Ac e B

B ∩ AC B∩A

Ac A

ocorrem (Ac ∩ B).

Deste modo, B = (A ∩ B) ∪ (Ac ∩ B), em que A ∩ B e Ac ∩ B são conjuntos disjuntos.

Então, P(B) = P(A ∩ B) + P(Ac ∩ B).

Pela regra do produto P(B) = P(A) . P(B | A) + P(Ac) P(B | Ac)

DEFINIÇÃO DE PARTIÇÃO:

Tem-se uma partição de um espaço amostral em um número finito de eventos Ai ( i =


1,2,...,n) se:
1) Se A1, A2, ..., An forem, dois a dois, eventos mutuamente exclusivos, isto é, (Ai ∩ Aj)
= ∅ para todo i ≠ j.
50
n
2) U Ai = Ω , isto é, os eventos A são exaustivos.
i =1

REGRA DA PROBABILIDADE TOTAL: se a seqüência de eventos aleatórios A1 ,


A2 , ..., An formar uma partição de Ω, então:

A1 A2 A3
..... A
( )
n n
P(B) = ∑ P(A i ∩ B) = ∑ P(Ai )P B Ai B
i i

Exemplo 7.15:
Um lote de 100 peças é composta de 20 peças defeituosas e 80 peças perfeitas, do qual
extrairemos 2 peças sem reposição. Qual a probabilidade da segunda peça extraída ser
defeituosa?

Solução:

Evento A: a primeira peça extraída é defeituosa


Evento B: a segunda peça extraída é defeituosa

Pela regra da probabilidade total temos que,


P(B) = P(A) . P(B | A) + P(Ac) P(B | Ac) = 20 .19 + 80 . 20 = 1
100 99 100 99 5

Exemplo 7.16:
Em uma fábrica de parafusos são utilizadas n máquinas. Sejam P(Ai) a probabilidade de
um parafuso provir da i-ésima máquina, i = 1,2,...,n e P(B Ai ) indica a probabilidade do
parafuso ser defeituoso sabendo-se que foi produzido pela i–ésima máquina. Do total
de parafusos produzidos pela fábrica, escolhe-se ao acaso um parafuso. Qual a
probabilidade de que o parafuso seja defeituoso?

Solução:

Se B representa o evento “parafuso escolhido defeituoso”, pela regra da probabilidade


total, temos que:

P(B) = P(B A1 ) P(A1) + P(B A 2 ) P(A2) + …......+ P(B A n ) P(An)

Podemos ainda estar interessados em saber a probabilidade da i-ésima máquina ter


produzido o parafuso defeituoso.

51
7.8 REGRA DE BAYES (probabilidade das causas de um evento observado)

P(Ai ∩ B) P(Ai )P(B Ai )


P(Ai B) = ⇒ P(Ai B) =
P(B) ( )
∑ P A j P(B Aj )
j
Esta regra é útil quando conhecemos as probabilidades dos Ai e as probabilidades
condicionais de B dado Ai, mas não conhecemos diretamente a probabilidade de B.

Exemplo 7.17: Admita que na fábrica de parafusos tenham três maquinas. Suponha que
as máquinas A, B e C produzem 25%, 35% e 40% do total produzido, respectivamente.
Da produção de cada máquina 5%, 4% e 2%, respectivamente, são parafusos
defeituosos. Escolhe-se ao acaso um parafuso:
a) Qual a probabilidade dele ser defeituoso?
b) Verifica-se que ele é defeituoso. Qual a probabilidade de que o parafuso venha da
máquina A?

Solução:

P(A)=0,25 probabilidade da máquina A produzir um parafuso.


P(B)=0,35 e P(C) =0,4
P(D|A)=0,05 , P(D|B)=0,04 e P(D|C)=0,02

P(D) = P(D ∩ A) + P(D ∩ B) + P(D ∩ C) = P(A) P(D|A) + P(B) P(D|B) + P(C) P(D|C)
= 0,25×0,05 + 0,35×0,04 + 0,4×0,02 = 0.0345

P ( A ∩ D) P ( A) P ( D | A) 0,25 × 0,05
P(A | D) = = = = 0,3623
P ( D) P( D) 0,0345

Exemplo 7.18:
Em uma urna, há 10 bolas: 4 brancas e 6 vermelhas. Duas bolas são sorteadas
sucessivamente, sem reposição. Qual é a probabilidade da 2ª bola ser vermelha?

Resolução:

Sejam os eventos:
V1: primeira bola retirada é vermelha;
V2: segunda bola retirada é vermelha;
B1: primeira bola retirada é branca;
B2: segunda bola retirada é branca;

52
Queremos calcular P(V2). Temos que:

6
P (V1 ) =
10

6 4
P( V1 ) = 1 − P( V1 ) = 1 − =
c
10 10

Se V1 ocorreu, isto é, saiu vermelha na primeira retirada, então a composição da urna

fica
Pela regra de probabilidade total, temos que:

 = 

|
 +  
| 

P(V2 V1) = P (sortear 1 bola vermelha dentre 5 vermelhas e 4 brancas restantes)


5
P(V2 V1) =
9
P(V2 B1) = P (sortear 1 bola vermelha dentre 6 vermelhas e 3 brancas restantes)
6
P(V2 B1) =
9

5 6 6 4
P(V2 ) = ⋅ + ⋅
9 10 9 10
Portanto, 6 5 4
P(V2 ) =  + 
10  9 9 
6
P(V2 ) =
10

Podemos fazer o diagrama em árvore ou árvore de probabilidades da situação descrita


neste exercício.

53
→ 6 5
*
5 10 9
6 9
10

4
9 6 4
→ *
10 9

6 → 4 6
*
4 10 9
9
10

3
4 3
9 → *
10 9

6 5 4 6 6
P ( A) = ⋅ + ⋅ =
10 9 10 9 10

Exercício:

1) Numa indústria de enlatados, as linhas de produção I , II e III respondem por 50%,


30% e 20% da produção, respectivamente. As proporções de latas com defeito de
produção nas linhas I , II e III são 0,4% , 0,6% e 1,2%. Qual a probabilidade de uma lata
defeituosa (descoberta ao final de inspeção do produto acabado) provir da linha I?
Resposta: 10
31

2) Considere 2 caixas com parafusos. Em ambas as caixas temos parafusos longos (L)
e curtos (C). Na caixa 1 temos 60 L e 40 C e na caixa 2 temos 10 L e 20 C. Vamos
selecionar uma caixa ao acaso e dessa caixa tirar um parafuso ao acaso. Calcule :
a) A probabilidade do parafuso ser longo ? Resposta: 1
2
b) A probabilidade do parafuso ser curto e não ser da caixa 2 ? Resposta: 1
5

7.9 INDEPENDÊNCIA ESTATÍSTICA

Dois eventos são ditos independentes quando a ocorrência de um deles não interfere na
probabilidade de ocorrência do outro.

Em linguagem matemática, dados A,B ⊆ Ω, A e B são ditos independentes, se e


somente se :
P( AB) = P(A) e P( BA) = P(B)
Nesse caso, temos que
P(A ∩ B) = P(A) . P(B)

54
Exemplo 7.19:

A probabilidade de que A resolva um problema é de 2/3 e a probabilidade de que B


resolva é de 3/4. Se ambos tentarem independentemente, qual a probabilidade do
problema ser resolvido?
Resolução:
A : A resolve
B : B resolve
A ∩ B: A e B resolvem
A ∪ B : A ou B resolvem => o problema é resolvido
Como são eventos independentes, P(A ∩ B) = P(A).P(B) e
P(A ∪ B) = P(A) +P(B) - P(A).P(B) = 2/3 + 3/4 – (2/3)(3/4) = 2/3 + 3/4 – 2/4 =
8−3 5
= .
12 12

Generalizando:
Os eventos A1, A2,..., An ⊆ Ω, são independentes se e somente se a independência for
verificada para todos os subconjuntos de dois ou mais eventos desta família.

• Para que três eventos sejam independentes é necessário verificar quatro


igualdades:

P(A ∩ B) = P(A) P(B)


P(A ∩ C) = P(A) P(C)
P(B ∩ C) = P(B) P(C)
P(A ∩ B ∩ C) = P(A) P(B) P(C)

que corresponde à  3  +  3  = 3 + 1 = 4 , igualdades a serem verificadas


 2 3

• Para quatro eventos é necessário verificar onze igualdades que são:

 4  +  4  +  4  = 6 + 4 + 1 = 11
2 3 4

• Para “n” eventos é necessário verificar:

n n
∑  k  = 2n − n − 1 igualdades
k =2  

Se Ai, i= 1, 2, 3, ..., n , é uma família finita de eventos independentes, então

n  n
P I Ai  = ∏ P(Ai)
 i =1  i =1
Observar que:

 P ( A ∩ B ) = P ( B | A) P ( A)
 para eventos quaisquer (condicional)
P( A ∩ B) = P( A | B) P( B)
55
{P( A ∩ B) = P( A) P( B) para eventos independentes

Como conseqüência dos resultados acima, têm-se que ∅ e Ω são independentes de


qualquer evento A, ∀ A ⊆ Ω. Para ver isto note que:
1) P(∅ ∩ A) = P( ∅ ) = 0 = P(∅) P(A)
2) P(Ω ∩ A) = P(A) = P(Ω) P(A)

Exercícios

a) Uma máquina consiste de 4 componentes ligados em paralelo de tal forma que a


máquina falha apenas quando todos os componentes falharem. Supondo que as falhas
são independentes entre si e se cada componente tem respectivamente as probabilidade
0,1 , 0,2 , 0,3 , e 0,4 de falhar quando a máquina é ligada, qual é a probabilidade da
máquina não falhar ? Resposta: 0,9976.

b) A probabilidade de um homem viver, mais dez anos é ¼ e a probabilidade de uma


mulher viver mais dez anos é 1 . Encontre a probabilidade de ambos estarem vivos
3
dentro de dez anos e de ao menos um estar vivo dentro de dez anos. Resposta: 1 e
12
1 .
2

2ª LISTA DE EXERCÍCIOS

l) Descrever o espaço amostral (S) e eventos associados a cada um dos experimentos a


seguir:
E1: Lançam-se dois dados perfeitos e observam-se os números nas faces voltadas
para cima;
A1: A soma das faces é sete;

E2: Lançar uma moeda três vezes, sucessivamente, e anotar a seqüência de caras
(K) e coroas (C );
A2: Sair pelo menos duas caras;

E3: Lançar uma moeda e um dado, simultaneamente, e registrar os resultados;


A3: Obtenção de face impar no dado;

E4: Lançar uma moeda três vezes, sucessivamente, e registrar o número de caras
ocorrido;
A4: Sair pelo menos duas caras;

E5: Numa linha de produção conta-se o número de peças defeituosas num


período de 1 hora;
A5: Obter menos de 3 defeituosas

E6: Mede-se a duração de lâmpadas, deixando-as acesas até que queimem;


A6: O tempo de vida da lâmpada é inferior a 30 horas;

56
E7: Um fabricante produz um determinado artigo. Da linha de produção são
retirados 3 artigos e cada um é classificado como bom(B) ou defeituoso(D).
A7: Pelo menos dois artigos são bons.

E8:Um lote de dez peças contém três defeituosas. As peças são retiradas uma a
uma, sem reposição, até que a última peça defeituosa seja encontrada. O número
total de peças retiradas é registrado.
A8: Menos de cinco peças foram retiradas.

E9: Peças são fabricadas até que dez peças perfeitas sejam produzidas. O número
total de peças fabricadas é anotado.
A9: Quinze ou mais peças foram fabricadas

2) Suponha-se duas urnas contendo, cada uma, quatro bolas numeradas de 1 a 4.


Considera-se o experimento que consiste, em retirar, ao acaso, uma bola de cada urna.
Determine os seguintes eventos:
a) descreva o espaço amostral;
b) a soma do número de pontos é ímpar;
c) a bola extraída da primeira urna contém o número dois.

3) Sejam A, B e C três eventos quaisquer. Estabeleça uma expressão para os eventos


abaixo:
a) A e B ocorrem; b) A ou B ocorrem; c) B ocorre, mas A não ocorre; d) A não ocorre;
e) não ocorre A e não ocorre B; f) A e B ocorrem, mas C não ocorre; g) somente A
ocorre.

4) Um produto é montado em 3 estágios. No primeiro estágio, existem 5 linhas de


montagem; no segundo estágio, existem 4 linhas de montagem e no terceiro estágio,
existem 6 linhas de montagem. De quantas maneiras diferentes poderá o produto se
deslocar durante o processo de montagem?

5) Um inspetor visita 6 máquinas diferentes durante um dia. A fim de evitar que os


operários saibam quando ele os irá inspecionar, o inspetor varia a ordenação de suas
visitas. De quantas maneiras isto poderá ser feito?

6) Um mecanismo complexo pode falhar em 15 estágios. De quantas maneiras poderá


falhar em exatamente 3 desses estágios?

7) Dados P(A) = 1/2 ; P(B) = 3/8; P(A ∩ B) =1/8, calcule:


a) P(A ∪ B); b) P(A ∩B) ; c) P(A ∪B ) ; d) P(A ∩B ) ; e) P(A ∩ B).

8) A MasterCard Internacional efetuou um estudo de fraudes em cartões de crédito; os


resultados estão consubstanciados na tabela a seguir:

Tipo de Fraude Quantidade


Cartão roubado 243
Cartão falsificado 85
Pedido por correio / telefone 52
Outros 46

57
Selecionando aleatoriamente um caso de fraude nos casos resumidos na tabela, qual a
probabilidade de a fraude resultar de um cartão falsificado?

9) Um certo tipo de motor elétrico falha se ocorrer uma das seguintes situações:
emperramento dos mancais, queima dos enrolamentos, desgaste das escovas. Suponha
que o emperramento seja duas vezes mais provável do que a queima, esta sendo quatro
vezes mais provável do que o desgaste das escovas. Qual será a probabilidade de que a
falta seja devida a cada uma dessas circunstâncias?

10) Uma urna U1 contem 5 bolas brancas e 2 pretas; outra urna U2 contem 3 bolas
brancas e 6 bolas pretas; e outra urna U3 contem 4 bolas brancas e 4 bolas pretas. Tira-
se uma bola de cada urna. Calcular a probabilidade de que saiam uma bola branca e
duas bolas pretas.

11) Lança-se uma moeda viciada de modo que a probabilidade de cara(K) é igual a 2/3 e
a probabilidade de coroa(C ) é igual a 1/3. Se aparecer cara, então seleciona-se
aleatoriamente um número dentre os de 1 a 9 ; se aparecer coroa, seleciona-se
aleatoriamente um número dentre os de 1 a 5. Ache a probabilidade de um número par
ser selecionado. Construa o diagrama em árvore.

12) Em uma sala, 10 pessoas estão usando emblemas numerados de 1 até 10. Três
pessoas são escolhidas ao acaso e convidadas a saírem da sala simultaneamente. O
número de seu emblema é anotado.
a) Qual é a probabilidade de que o menor número de emblema seja cinco?
b) Qual é a probabilidade de que o maior número de emblema seja cinco?

13) Suponha que A e B sejam eventos independentes associados a um experimento. Se a


probabilidade de A ou B ocorrerem for igual a 0,6, enquanto a probabilidade de
ocorrência de A for igual a 0,4 determine a probabilidade de ocorrência de B.

14) Na tabela abaixo, os números que aparecem são probabilidades relacionadas com a
ocorrência de A, B, A ∩ B, e assim por diante.. Verifique se A e B são independentes.
B Bc
A 0,04 0,06 0,10
Ac 0,08 0,82 0,90
0,12 0,88 1,00

15) Uma associação de indústrias transformadoras de resinas plásticas é composta de 20


empresas que produzem sacos plásticos (S), 10 que produzem garrafas (G), 8 que
produzem utensílios domésticos (U) e 2 que se encarregam de brinquedos (B). Ao
escolhermos uma empresa ao acaso, achar a probabilidade de que:
a) seja uma indústria que produza sacos plásticos ou utensílios domésticos; b) seja uma
indústria produtora de sacos plásticos ou brinquedos; c) não seja uma indústria que
produza garrafas.

16) Três alarmes estão dispostos de tal maneira que qualquer um deles funcionará
independentemente, quando qualquer coisa indesejável ocorrer. Se cada alarme tem
probabilidade 0,9 de trabalhar eficientemente, qual é a probabilidade de se ouvir o
alarme quando necessário?

58
17) Suponha que todos os componentes da figura a seguir tenham a mesma
confiabilidade (probabilidade de funcionar) p e funcionem independentemente ,
obtenha a confiabilidade do sistema. .
1 2

L 3 R

4 5

18) As 500 propriedades rurais de certa região foram classificadas de acordo com a
extensão em hectares, conforme tabela abaixo. Sejam os eventos:

A = {X: X < 5 ha} ; B = { X : 5 ≤ X < 20 } ; C ={X: X ≥ 10 ha }

Determine: a) P(A) ; b) P(B ) ; c) P(B∪C) ; d) P(A∪B).

Área (ha) N.º de Propriedades


<5 130
5  10 170
10  20 90
20  50 50
50  100 40
≥ 100 20

19) Sejam A e B dois eventos associados a um experimento. Suponha que P(A) = 0,4,
enquanto P(AUB) =0,7. Seja P(B) = p.
a) Para que valor de p, A e B serão mutuamente exclusivos?
b) Para que valor de p, A e B serão independentes?

20) Sob a ação de uma força F, as probabilidades de falha nas barras a , b e c da


estrutura mostrada na figura abaixo são respectivamente 0,06 ; 0,05 e 0,04. Se ocorrer
a falha em qualquer uma das barras, isto leva a falha em toda a estrutura. Supondo que
as falhas nas barras são estatisticamente independentes, ache a probabilidade de ocorrer
a falha da estrutura.

b a

21) Um sistema é composto de 3 componentes 1, 2 e 3, com confiabilidade 0,9 , 0,8 e


0,7, respectivamente. O componente 1 é indispensável ao funcionamento do sistema; se
2 ou 3 não funcionam, o sistema funciona, mas com rendimento inferior. A falha
59
simultânea de 2 e 3 implica o não funcionamento do sistema. Supondo que os
componentes funcionem independentemente, calcular a confiabilidade do sistema.

22)Um processo industrial produz 4% de itens defeituosos. A experiência mostra que


25% dos itens defeituosos produzidos não são percebidos pelo inspetor de qualidade. Os
itens bons sempre são aceitos satisfatoriamente pela inspeção. Qual a probabilidade de
que , se você comprar um desses itens ,seja um item defeituoso?

23) Uma fábrica dispõe de 3 máquinas para fabricar o mesmo produto . Essas máquinas
são antigas e apresentam freqüentemente defeitos de funcionamento com as
seguintes percentagens do tempo de utilização:

MÁQUINA TEMPO COM DEFEITO (%)


A 40
B 35
C 25

Verificam-se nas peças produzidas as seguintes porcentagens de peças


defeituosas:

MÁQUINA PEÇAS DEFEITUOSAS (%)


A 2
B 4
C 5

A gerência decide substituir uma das máquinas a fim de diminuir a porcentagem de


peças defeituosas. Qual das três máquinas deve ser substituída?

24)Um artigo manufaturado que não pode ser usado se for defeituoso, deve passar por
duas inspeções antes de receber embalagem. A experiência mostra que um dos
inspetores deixará passar 5% dos defeituosos, ao passo que o segundo inspetor deixará
passar 4% dos tais artigos. Se os artigos sem defeito sempre passam pela inspeção e se
10% dos artigos processados são defeituosos, que percentagem dos artigos que
passaram pelas duas inspeções são defeituosos?

25) Numa faculdade 30% dos homens e 20% das mulheres estudam matemática . Além
disso, 45% dos estudantes são mulheres. Se um estudante selecionado aleatoriamente
está estudando matemática, qual a probabilidade de que este estudante seja mulher?

26) Uma companhia de seguros analisou a freqüência com que 2000 segurados usaram
o hospital, distribuídos segundo a tabela abaixo .

DISCRIMINAÇÃO HOMENS MULHERES


usaram o hospital 100 150
não usaram o hospital 900 850
Escolhe-se um segurado ao acaso. Sendo definidos os eventos:
A = {o segurado usou o hospital } e B = {o segurado é homem }, determine:

a) P(A ∪B); b) P(A ∩B); c) P(AUB).

60
Calcule também as seguintes probabilidades:
d) o segurado escolhido ser homem, sabendo-se que utilizou o hospital; e) o segurado
escolhido ter utilizado o hospital ,dado que era homem; f)o segurado ser mulher dado
que não utilizou o hospital.

27) Um empreiteiro apresentou orçamentos separados para a execução da parte elétrica


e da parte de encanamento de um edifício. Ele acha que a probabilidade de ganhar a
concorrência da parte elétrica é de 1/2. Caso ele ganhe a parte elétrica, a probabilidade
de ganhar a parte de encanamento é de 3/4; caso contrário, essa probabilidade é de 1/3.
Qual a probabilidade de ele:
a) ganhar os dois contratos; b) ganhar apenas um.

28) Uma grande empresa tem dois departamentos de produção : Produtos Marítimos e
Produtos para Oficinas. A probabilidade de que a divisão de Produtos Marítimos tenha
no corrente ano fiscal, uma margem de lucros de no mínimo 10% é estimada em 0,30; a
probabilidade de que a divisão de Equipamentos para Oficinas tenha uma margem de
lucros de pelo menos 10% é 0,20; e a probabilidade de que ambas as divisões tenham
uma margem de lucros de no mínimo 10% é 0,06. Determine a probabilidade de que a
divisão de Equipamentos para Oficinas tenha uma margem de lucros de no mínimo 10%
dado que a divisão de Produtos Marítimos tenha alcançado tal nível de lucro.

29) Se A e B são dois eventos relacionados com uma experiência E e são conhecidas
as probabilidades P(A) , P(B) e P(A∩ B), deseja-se em função destas, as expressões das
probabilidades dos seguintes eventos:
a) (A ∪B) ; b) (A ∩ B ) ; c) (A∪ B) ; d) (A ∩ B) .

30) Suponha que temos duas urnas 1 e 2, cada uma com duas gavetas. A urna 1 contém
uma moeda de ouro em uma gaveta e uma moeda de prata na outra gaveta; enquanto a
urna 2 contém uma moeda de ouro em cada gaveta. Uma urna é escolhida ao acaso; a
seguir uma de suas gavetas é aberta ao acaso. Verifica-se que a moeda encontrada nesta
gaveta é de ouro. Qual a probabilidade de que a moeda provenha da urna 2?

31) Três times de futebol são formados selecionando-se jogadores de três países
diferentes da seguinte maneira:
Time A1 – 5 brasileiros, 4 americanos, 2 argentinos
Time A2 - 4 brasileiros, 2 americanos, 5 argentinos
Time A3 - 2 brasileiros, 5 americanos, 4 argentinos
Um time é selecionado ao acaso e deste time dois jogadores também são selecionados
ao acaso. Os jogadores selecionados são 1 americano e 1 argentino. Qual a
probabilidade do time A3 ter sido escolhido?

32) Uma companhia produz circuitos integrados em três fábricas, I , II e III. A fábrica I
produz 40% dos circuitos, enquanto a II e III produzem 30 % cada uma. As
probabilidades de que um circuito integrado produzido por estas fábricas não funcione
são 0,01, 0,04 e 0,03, respectivamente. Escolhido um circuito da produção conjunta das
três fábricas, Qual a probabilidade de o mesmo não funcionar?

33) Considere a situação do problema anterior, mas suponha agora que um circuito é
escolhido ao acaso e seja defeituoso. Determinar qual a probabilidade de ele ter sido
fabricado por I.

61
34) Uma indústria química produz uma grande variedade de produtos usando quatro
diferentes processos; a mão de obra disponível é suficiente somente para que apenas
um processo seja executado num dado instante. O gerente da indústria sabe que a
descarga de uma poluição perigosa no rio que passa em volta da mesma , depende do
processo que está em operação . As probabilidades de ocorrer poluição perigosa para os
vários processos , denotando por F uma descarga de poluição perigosa, são: P(F|A)
=0,40; P(F|B) = 0,05 ; P(F|C) = 0,30 ; P(F|D) = 0,10 . Todos os outros produtos da
fábrica são considerados inofensivos. Em um determinado mês sabe-se que em 20% ,
40% , 30% e 10% do tempo respectivamente usam-se os processos A, B , C e D.
Deseja-se saber qual a probabilidade de não termos uma descarga de poluição perigosa
no determinado mês?

Gabarito (2ª lista)

l) E1: Ω1 = {(1,1); (1,2); .....; (1,6) ; (2,1) ; (2,2) ; .....; (2,6); ......... ; (6,1) ; (6,2) ; .... ;
(6,6) }
A1 = {(1,6): (2,5); (3,4); (4,3); (5,2); (6,1) }

E2: Ω2 = {KKK; KKC: KCK; CKK; KCC; CKC; CCK; CCC }


A2 = {KKK, KKC, KCK, CKK }

E3: Ω3 = {(K,1); (K,2);......;(K,6); (C,1); (C,2).....; (C,6) }


A3 = {(K,1); (K,3); (K,5); (C,1); (C,3); (C,5) }

E4: Ω4 = {0, 1, 2, 3 }
A4 = { 2}

E5: Ω5 = {0, 1, 2, 3,.., N } em que N é o n.º máximo de peças defeituosas no período de


1 hora
A5 = { 0,1, 2}

E6: Ω6 = {t : t ≥ 0 } ou Ω6 = { t : 0 ≤ t ≤ to } onde to é o tempo máximo de vida da


lâmpada.
A6 = { t : 0 ≤ t < 30 }

E7: Ω7 = {BBB, BBD, BDB, DBB, BDD, DBD, DDB , DDD }


A7 = {BBB; BBD; BDB; DBB }

E8: Ω8 = {3, 4, 5,...., 10 } E9: Ω9 = {10, 11, 12,....}


A8 = { 3, 4} A9 = { 15, 16, 17,...}

2) a) Ω ={(1,1), (1,2), (1,3), (1,4), (2,1), (2,2), (2,3), (2,4), (3,1), (3,2), (3,3), (3,4),
(4,1), (4,2), (4,3), (4,4)}
b) A={(1,2), (1,4), (2,1), (2,3), (3,2), (3,4), (4,1), (4,3)}
c) B = {(2,1), (2,2), (2,3), (2,4)}

3) a) A∩ B; b) A ∪ B ; c) A ∩B ; d)A ; e) A ∩ B ; f) A∩B∩C g)
(A∩B∩C ).

62
4) 120 5) 720 6) 455 7) a) 0,75 ; b) 0,25 ; c) 0,875 ; d) 0,375 ;
e) 0,25

8) 0,1995 9) 8/13, 4/13 e 1/13 10) 0,3809 11) 0,4296

12) a) 1/12 b)1/20 13) 2/6 14) A e B não são independentes

15) a) 7/10 b) 11/20 c) 3/4 16) 1-(0,1)3 17) p + 2p2 - 2p3 - p4 + p5

18 ) a) 0,26 ; b) 0,48 ; c) 0,74 ; d) 0,78

19 ) a )0,3 b ) 0,5 20 ) 0,1427 21 ) 0,846 22 ) 0,01 23 ) B

24 ) 0,02% 25 ) 0,3529 26 ) a) 1900/2000; b) 900/2000; c) 1150/2000;


d) 100/250; e) 100/1000; f) 850/1750

27) a) 0,375 b ) 0,2917 28) 0,2

29) a) 1 - P(A∩B) ; b) 1 - P(A) - P(B) + P(A∩B) ; c) 1 - P(A) + P(A∩B) ; d) P(B) -


P(A∩B).

30) 2/3 31) 10/19 32) 0,025 33) 0,16 34 ) 0,8

REFERÊNCIAS BIBLIOGRÁFICAS

MEYER, Paul L. Probabilidade : aplicações à estatística. 2. ed. Rio de Janeiro: Livros


Técnicos e Científicos, 1983. 426.

MONTGOMERY, Douglas C.; RUNGER, George C.; HUBELE, Norma Faris. Estatística
aplicada à engenharia. Rio de Janeiro: LTC, 2004. 335 p.

MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatística básica. 5. ed. São
Paulo: Saraiva, 2006. 526 p.

WERKEMA, Maria Cristina Catarino. Ferramentas estatisticas basicas para o


gerenciamento de processos. Belo Horizonte, MG: UFMG, 1995. 384 p. (Ferramentas
da qualidade ; 2)

63

Você também pode gostar