Você está na página 1de 152

APOSTILA DA DISCIPLINA DE

PROBABILIDADE E ESTATSTICA




Aluno(a):______________________________________
Curso: ________________________________________
Turma:________________________________________





2 Semestre/2012
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

1

I CONCEITOS INICIAIS
1.1- INTRODUO
A Estatstica a parte da matemtica aplicada que apresenta processos prprios
para coletar, apresentar e interpretar adequadamente conjuntos de dados, sejam eles
numricos ou no. Podemos dizer que seu objetivo o de apresentar informaes
sobre dados em anlise para que tenhamos maior compreenso dos fatos que os
mesmos representam.
As aplicaes da estatstica esto presentes em todos os campos de estudo: na
medicina (por exemplo, no controle de doenas que antecipam epidemias), na biologia
(por exemplo, no caso de espcies ameaadas de extino, onde so criados
regulamentos e leis para a proteo das mesmas a partir das estimativas estatsticas
de modificao de tamanho destas populaes), nas cincias sociais (para o
planejamento de aes que busquem o equilbrio social), na fsica, na administrao,
na economia, na poltica, e em muitas outras reas do conhecimento.
Na engenharia, um dos maiores usos est no controle de processos, produtos e
servios. Podemos observar isso, por exemplo, nas tcnicas de controle de qualidade.
Com base nas anlises estatsticas temos melhores justificativas para propor medidas
de controle como as que regem a poluio ambiental, as inspees de automveis, a
utilizao de equipamentos de proteo individual, etc. A estatstica pode ser aplicada
na produo para acompanhar a estabilidade dos processos, por meio das cartas de
acompanhamento (cartas de controle estatstico de processo). Tambm utilizamos a
estatstica para analisar ensaios destrutivos e no destrutivos, onde pode ser verificada
a porcentagem de peas no conformes ou probabilidade de vida til de equipamentos
ou peas. Utilizamos a estatstica em calibrao de equipamentos de medio e na
verificao da condio de uso desses meios de medio e em muitas outras
aplicaes.
As informaes estatsticas so concisas, especficas e eficazes, fornecendo
assim subsdios imprescindveis para as tomadas racionais de deciso. Neste sentido,
a Estatstica fornece ferramentas importantes para que as empresas e instituies
possam definir melhor suas metas, avaliar seu desempenho, identificar seus pontos
fracos e atuar na melhoria contnua de seus produtos e servios.
A estatstica descritiva, cujo objetivo bsico o de sintetizar uma srie de
valores de mesma natureza, permitindo dessa forma que se tenha uma viso global da
variao desses valores, organiza e descreve os dados de trs maneiras: por meio de
tabelas, de grficos e de medidas descritivas, que sero vistos neste e nos prximos
mdulos.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

2

1.2- O MTODO, A COLETA DE DADOS EM ENGENHARIA E OS CONCEITOS
FUNDAMENTAIS
Primeiramente vamos tratar do mtodo de engenharia, que a abordagem para
formular e resolver problemas. Segundo Montgomery (2009), as etapas do mtodo de
engenharia so dadas por:
I Desenvolver uma descrio clara e concisa do problema;
II Identificar os fatores importantes que afetam esse problema ou que possam
desempenhar um papel em sua soluo;
III Propor um modelo para o problema, usando o conhecimento cientfico ou de
engenharia do fenmeno estudado. Estabelecer qualquer limitao ou suposio do
problema;
IV Conduzir experimentos apropriados e coletar dados para testar ou validar o
modelo-tentativa ou concluses feitas nas etapas II e III;
V Refinar o modelo com base nos dados observados;
VI Tratar do modelo (manipular) de modo a ajudar no desenvolvimento da
soluo do problema;
VII Conduzir um experimento apropriado para confirmar que a soluo
proposta para o problema efetiva e eficiente;
VIII Tirar concluses ou fazer recomendaes baseadas na soluo do
problema.
Analisando estas etapas podemos ver o quanto o engenheiro tem de saber
como planejar eficientemente os experimentos, coletar dados, analisar e interpretar os
mesmos, entendendo como os dados observados esto relacionados com o modelo
que foi proposto para o problema em estudo.
Os mtodos estatsticos so usados para nos ajudar a entender a variabilidade.
Vamos conhecer agora conceitos importantes para nossos estudos, com aplicaes em
engenharia:
Variabilidade: quando sucessivas observaes de um sistema ou fenmeno
no produzem exatamente o mesmo resultado. Por exemplo, considere o desempenho
do consumo de gasolina em seu carro. Em cada tanque de combustvel o desempenho
pode variar consideravelmente, dependendo de muitos fatores como o tipo de estrada,
as condies do veculo, a marca da gasolina, as condies climticas, etc. Esses
fatores representam as fontes potenciais de variabilidade.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

3

O raciocnio (inferncia estatstica) do engenheiro para analisar os fatores de
uma amostra para uma populao.
Populao: todo conjunto de elementos, finito ou infinito, que tem pelo menos
uma caracterstica em comum.
Amostra: uma parte da populao adequadamente selecionada de acordo
com uma regra ou um plano. Este subconjunto deve ter dimenso menor que o da
populao e seus elementos devem ser representativos da populao.
Em se tratando de conjuntos-subconjuntos, estes podem ser finitos quando
possuem um nmero limitado de elementos e infinitos quando possuem um nmero
ilimitado de elementos.
Um Parmetro a medida numrica que descreve uma caracterstica da
populao.
Uma Estatstica uma a medida numrica que descreve uma caracterstica
da amostra.
Vamos observar o esquema abaixo que apresenta alguns parmetros como a
mdia, a varincia, o desvio padro, a proporo, que veremos detalhadamente ao
longo do nosso curso.

1.3- PLANEJAMENTO DE UM ESTUDO ESTATSTICO
Aps a definio do problema a ser estudado e o estabelecimento do
planejamento da pesquisa, que inclui a forma pela qual os dados sero coletados, o
cronograma das atividades, o levantamento dos custos envolvidos, o exame das
informaes disponveis, o delineamento da amostra, etc., o passo seguinte a coleta
de dados, que consiste na busca ou aplicao dos dados das variveis, componentes
do fenmeno a ser estudado.
A coleta de dados chamada de direta quando os dados so obtidos na fonte
originria. Os valores assim compilados so chamados de dados primrios, como, por
exemplo, dados obtidos em pesquisas de opinio pblica, vendas registradas em notas
fiscais da empresa, medio de chuva em pluvimetros, contagem do nmero de
carros que passa por dia em um cruzamento, etc.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

4

A coleta de dados dita indireta quando os dados obtidos provm de coleta
direta. Os valores assim compilados so denominados de dados secundrios, como,
por exemplo, o clculo do tempo de vida mdia de um produto, obtido por pesquisa, em
tabelas publicadas.
Quanto ao tempo, a coleta pode ser classificada em:
- Contnua: quando realizada permanentemente, sem interrupo,
automaticamente e na vigncia de um determinado perodo, por exemplo, consumo de
energia eltrica em uma residncia, medida mensalmente;
- Peridica: quando feita em intervalos de tempo curtos determinados, por
exemplo, o censo industrial e o controle de trfego em feriados;
- Ocasional: quando efetuada sem poca preestabelecida, atendendo a uma
conjuntura qualquer ou a uma emergncia, por exemplo, dados de desastres naturais.
Os mtodos possveis de coleta de dados em um estudo estatstico so:
- Censo: uma avaliao direta de um parmetro, utilizando-se dados relativos a
todos os elementos da populao. 100% confivel, porm caro, lento, s vezes
desatualizado (dependendo do tempo gasto para realizao) e nem sempre vivel.
- Estimao: uma avaliao indireta de um parmetro populacional com base
em um estimador. Tem menos de 100% de confiabilidade, porm barato, rpido e
atualizado.
- Simulao: o uso de um modelo fsico ou matemtico para reproduzir as
condies de uma determinada situao, por exemplo, teste para eficincia de airbags
em automveis.
- Experimentao: quando aplicado um tratamento a uma parte da populao
e so verificadas as respostas, por exemplo, uso de medicamentos.
- Estudo observacional: so observadas e medidas caractersticas especficas,
mas os objetos do estudo no so modificados, por exemplo, uma pesquisa de
satisfao de clientes
Na coleta de dados a amostra deve ser representativa da populao. Devemos
usar tcnicas de amostragem apropriadas para que se garanta que as inferncias
sobre a populao sejam vlidas. As regras de amostragem podem ser classificadas
em duas categorias gerais:
- Probabilsticas: so amostragens em que a seleo aleatria onde cada
elemento tenha uma chance conhecida, mas no necessariamente igual, de ser
selecionado para a amostra.
Em uma amostra aleatria, membros de uma populao so selecionados de tal
modo que cada membro individual tem chance igual de ser selecionado.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

5

Uma amostra aleatria simples de tamanho n selecionada de tal modo que
toda a amostra possvel de mesmo tamanho n tenha a mesma chance de ser
escolhida.
- No-probabilsticas ou intencionadas: so amostragens em que h uma
escolha deliberada dos elementos da amostra.
A reviso crtica dos dados tem a finalidade de descartar os valores estranhos
ao levantamento, os quais so capazes de provocar futuros enganos. importante
sempre identificarmos todos os possveis erros.
A apresentao dos dados o prximo passo, que pode ser feita por meio das
tabelas e dos grficos. A tabela um quadro que resume um conjunto de observaes,
enquanto os grficos so formas de apresentao dos dados, cujo objetivo o de
produzir uma impresso mais rpida e viva do fenmeno em estudo.
Para ressaltar as tendncias caractersticas observadas nas tabelas,
isoladamente, ou em comparao com outras, necessrio expressar tais tendncias
atravs de nmeros ou medidas descritivas. As medidas descritivas so conhecidas
como medidas de posio, medidas de disperso, de assimetria e de curtose, e
veremos todas essas detalhadamente nos prximos mdulos.
A anlise dos dados permite a emisso da concluso final do estudo.
A Estatstica Descritiva pode assim ser resumida no diagrama a seguir:

1.4. VARIVEIS
Aps a determinao dos elementos nos perguntamos: o que fazer com estes?
Podemos medi-los, observ-los, cont-los surgindo um conjunto de respostas que
receber a denominao de varivel.
Varivel: a caracterstica que vai ser observada, medida ou contada nos
elementos da populao ou da amostra e que pode variar, ou seja, assumir um valor
diferente de elemento para elemento. Dividem-se em:
I) Varivel Qualitativa (ou dados categricos): podem ser separados em
diferentes categorias, atributos, que se distinguem por alguma caracterstica no
numrica. Divide-se em:
COLETA
DOS
DADOS
CRTICA
DOS
DASDOS
APRESENTA
O DOS
DADOS
TABELAS ANLISE
GRFICOS ANLISE
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

6

- Varivel Qualitativa Nominal: uma varivel que assume como possveis
valores, atributos ou qualidades e estes no apresentam uma ordem natural de
ocorrncia. Exemplo: meios de informao: televiso, revista, internet, jornal.
- Varivel Qualitativa Ordinal: uma varivel que assume como possveis valores
atributos ou qualidades e estes apresentam uma ordem natural de ocorrncia. Por
exemplo: estado civil (solteiro, casado, separado, divorciado).
II) Varivel Quantitativa: consistem em nmeros que representam contagens
ou medidas. Divide-se em:
- Variveis Quantitativas Discretas: resultam de um conjunto finito, enumervel de
valores possveis. Por exemplo: nmero de filhos, nmero de provas, nmero de
acidentes do trabalho, etc.
- Variveis Quantitativas Contnuas: resultam de nmeros infinitos de valores
possveis que podem ser associados a pontos em uma escala contnua, e em geral,
resultantes de mensuraes. Por exemplo: temperatura, altura, peso, comprimento de
uma estrada, etc.
Resumidamente, quanto ao nvel de mensurao temos as variveis:

Exemplo 1.1:
Classificar as variveis abaixo segundo o nvel de mensurao:
a) Cor de sinalizao de segurana:
b) Nmero de peas defeituosas:
c) rea de uma construo:
d) Profisso:
Variveis
QUALITATIVAS: SUAS
REALIZAESSO
ATRIBUTOS DOS
ELEMENTOS
PESQUISADOS
NOMINAIS: APENAS
IDENTIFICA AS
CATEGORIAS
ORDINAIS: POSSVEL
ORDENAR AS
CATEGORIAS
QUANTITATIVAS
(INTERVALARES): SUAS
REALIZAES SO
NMEROS
RESULTANTES DE
CONTAGEM OU
MENSURAO
DISCRETAS: PODEM
ASSUMIR APENAS
ALGUNS VALORES
CONTNUAS: PODEM
ASSUMIR INFINITOS
VALORES
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

7

e) Nmero de empregados de uma fbrica:
f) Tipo sanguneo:
g) Sexo:
h) Valor obtido na face superior de um dado:
i) Salrio dos Empregados de uma empresa:
j) Resultado da extrao da loteria Federal:
k) Comprimento de um seguimento de reta:
l) rea de um Crculo:
m) Raa:
n) Volume de gua contido numa piscina:
o) Letras do alfabeto:
1.5. SRIES ESTATSTICAS
importante organizar os dados de maneira prtica e racional, para o melhor
entendimento do fenmeno que se est estudando. A Estatstica Descritiva pode extrair
e apresentar a informao contida nos dados coletados e apresent-los de trs formas
(tabelas, grficos e medidas descritivas), que possibilitam uma rpida viso geral do
fenmeno estudado. Neste mdulo veremos as tabelas representadas pelas sries
estatsticas.
As tabelas podem ser consideradas quadros em que esto resumidos um
conjunto de dados organizados e dispostos sistematicamente em linhas e colunas.
Assim como existem algumas regras e normas que devem ser observadas
quando vamos elaborar um texto cientfico ou acadmico, para organizar os dados em
sries estatsticas ou em distribuio de frequncias, existem algumas normas
nacionais definidas pela Associao Brasileira de Normas Tcnicas (ABNT) que devem
ser respeitadas. Dessa forma, toda tabela estatstica deve conter elementos essenciais
e elementos complementares, quando necessrio.
Temos como elementos essenciais:
- Ttulo: no ttulo indicada a natureza do fato estudado, ou seja, o que foi
estudado. Tambm deve conter as variveis escolhidas na anlise do fato, o local e a
poca em que os dados foram obtidos.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

8

- Corpo: formado pelo conjunto de linhas e colunas, em que podemos observar
as sries horizontais e verticais de informaes.
- Cabealho: no incio de cada coluna devemos designar a natureza do contedo
de que a coluna trata.
- Coluna indicadora: nessa coluna devemos evidenciar a natureza do contedo de
cada linha.
Temos como elementos complementares:
- Fonte: onde se indica a entidade responsvel pela sua organizao ou que
forneceu dos dados primrios. Deve ficar no rodap da tabela.
- Notas: quando necessrio algum outro esclarecimento alm dos essenciais,
eles devem ser colocados em forma de notas no rodap da tabela.
- Chamadas: so colocadas tambm no rodap da tabela e so necessrias para
esclarecer pormenores ou detalhes em relao s clulas, colunas ou linhas.
Obs: Nenhuma clula deve ficar em branco, deve sempre apresentar um nmero ou sinal. O
lado direito e esquerdo das tabelas devem sempre ser abertos (sem bordas).
Agora vamos a definio de srie estatstica:
Srie Estatstica qualquer coleo de dados colocada numa tabela e
classificada segundo as variaes do fenmeno observado.
As sries estatsticas podem ser divididas em srie de dados no agrupados e
srie de dados agrupados, como segue:
I) Srie de dados no agrupados
Podem estar relacionadas a poca de ocorrncia, a localizao, ou a um fator
especfico relacionado ao problema estudado, ou ainda fazer referncia a mais de um
destes fatores. So elas:
a) Srie Cronolgica, Temporal, Evolutiva ou Histrica: a srie estatstica em
que os dados so observados segundo a poca de ocorrncia.
Exemplo 1.2:
Tabela 1.1 Taxa de domiclios particulares permanentes com acesso internet, no
Brasil, de 2005 a 2009
Perodo Domiclios particulares permanentes
com acesso internet
2005 13,7
2006 16,7
2007 20
2008 23,8
2009 27,4
Fonte: IBGE, Diretoria de Pesquisas, Coordenao de Trabalho e Rendimento, 2009
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

9

b) Srie Geogrfica ou de Localizao: a srie estatstica em que os dados so
observados segundo a localidade de ocorrncia.
Exemplo 1.3:
Tabela 1.2. Chuva observada no Cear relativa ao ms de maio de 2000
Regio Precipitao (mm)
Litoral Norte 70,8
Litoral do Pecm 96,9
Litoral de Fortaleza 148,1
Macio de Baturit 148,0
Serto Central e Inhamuns 43,5
Fonte: www.funceme.br
c) Srie Especfica: a srie estatstica em que os dados so agrupados
segundo a modalidade (espcie) de ocorrncia.
Exemplo 1.4:
Tabela 1.3. Indicadores Conjunturais da Indstria, ndice Ms/Ms Anterior
com ajustamento sazonal - Brasil - Outubro- 2011
Variveis
ndice Ms/Ms Anterior (1)
Ind. Geral Ind. Extrativa Ind. Transformao
Pessoal Ocupado Assalariado (2) 99,56 100,68 99,52
Nmero de Horas Pagas 99,08 99,64 99,06
Folha de Pagamento Real 97,84 86,26 98,97
Fonte: IBGE, Diretoria de Pesquisas, Coordenao de Indstria.
(1) Base: Ms imediatamente anterior = 100.
(2) Varivel sem movimento sazonal significativo e, portanto, sem ajuste sazonal, nas indstrias
extrativas.
d) Srie Mista: a srie estatstica em que os dados so agrupados com a
variao do fenmeno em funo de mais de uma das sries anteriores.
Exemplo 1.5:
Tabela 1.4 Incidncia de acidentes de trabalho (nmero de acidentes tpicos e de
trajeto, por 1000 trabalhadores segurados no Brasil em 1997, 1998 e 2000
Incidncia de acidentes de trabalho (n
o
de acidentes
tpicos e de trajeto, por 1000 trabalhadores segurados
1997 1998 2000
Brasil 21,9 23,1 20,4
Regio Norte 11,9 14,1 13,2
Regio Nordeste 11,4 11 9,2
Regio Sudeste 23,7 25,8 22,9
Regio Sul 30,1 27,9 24,9
Regio Centro-Oeste 13,1 15,1 13,4
Fonte: Ministrio da Sade, Secretaria de Polticas de Sade (SPS).
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

10

II) Srie de dados agrupados:
Dependendo do volume de dados, torna-se difcil ou impraticvel tirar
concluses a respeito do comportamento das variveis e, em particular, de variveis
quantitativas. Uma das maneiras de sumarizar os valores de uma varivel discreta ou
contnua a montagem de uma distribuio de frequncia.
Por definio, uma distribuio de frequncia (ou tabela de frequncia) lista os
valores dos dados, juntamente com suas frequncias correspondentes (ou contagens).
- Distribuio de Frequncia por Intervalos: srie estatstica na qual a varivel
observada est dividida em subintervalos do intervalo total, neste caso temos uma
varivel contnua;
- Distribuio de Frequncia por Pontos: srie estatstica na qual as frequncias
observadas esto associadas a um ponto real observado, neste caso temos uma
varivel discreta.
Para iniciar, podemos colocar os dados brutos de cada uma das variveis
quantitativas em uma ordem crescente ou decrescente, o que denominaremos de rol. A
visualizao de algum padro ou comportamento pode continuar sendo de difcil
observao ou at mesmo cansativa, mas conseguimos de forma rpida identificar
maiores e menores valores ou concentraes de valores no caso de variveis
quantitativas.
Estes nmeros (menor e maior valor observado) servem de ponto de partida
para a construo de tabelas para estas variveis. A seguir, esto alguns conceitos,
aliados a procedimentos comuns para a representao das distribuies de
frequncias, onde:
Dados brutos
o conjunto dos dados numricos obtidos aps a crtica dos valores coletados.
Exemplo 1.6:
24 23 22 28 35 21 23 33 34 24 21 25 36 26 22
30 32 25 26 33 34 21 31 25 31 26 25 35 33 31
Rol
o arranjo dos dados brutos em ordem de frequncias crescente ou
decrescente. No exemplo 6 colocamos os dados brutos do exemplo 5 em rol (de forma
crescente).
Exemplo 1.7:
21 21 21 22 22 23 23 24 24 25 25 25 26 26 26
28 30 31 31 31 32 33 33 33 34 34 34 35 35 36
Amplitude total (A
T
)
a diferena entre o maior e o menor valor observados. No exemplo 6 temos:
A
T
= x
max
x
min

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

11

A
T
= 36 21 = 15.
Nmero de classes (k)
De modo a interpretar melhor o que esses nmeros exprimem, devemos criar
intervalos (classes), preferencialmente, igualmente espaados. O nmero deles
depende do nmero de observaes (n) e o quo dispersos os dados esto. No h
uma frmula exata para o clculo do nmero de classes. Apresentamos a seguir, duas
solues.
- O nmero de classes (k) ser k = 5 para n 25 e k= n , para n > 25.
- Frmula de Sturges: k 1 + 3,3 log n, em que n = tamanho da amostra.
Exemplo 1.8:
Para um total de 30 dados, n = 30, temos que:
k = 30 = 5,48 ou k 1 + 3,3 log 30 5,87 .
Geralmente utilizamos k como um nmero inteiro, neste caso adotamos k = 5.
Amplitude das classes (h)
A especificao da largura do intervalo uma considerao importante.
Intervalos muito grandes resultam em um nmero menor de classes de intervalo. A
amplitude das classes dada pela relao:


Assim como no caso do nmero de classes (K), a amplitude das classes (h)
deve ser aproximada para o maior inteiro.
A amplitude das classes (h) deve estar entre os nmeros 1, 2, 3, 5, 7, 10 e os
mltiplos de 5.
A amplitude das classes (h) a diferena entre dois limites inferiores ou
superiores de classe consecutivos.
Limites das classes
Limites inferiores de classe (Li) so os menores nmeros que podem
pertencer s diferentes classes.
Limites superiores de classe (Ls) so os maiores nmeros que podem
pertencer s diferentes classes.
Existem diversas maneiras de expressar os limites das classes. Apresentamos a
seguir algumas:
- 21 26: compreende todos os valores entre 21 e 26 (incluindo-os);
- 21 26: compreende todos os valores entre 21 e 26, excluindo o 26;
- 21 26: compreende todos os valores entre 21 e 26; excluindo o 21.
Neste exemplo, temos Li = 21 e Ls = 26.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

12

Agora podemos introduzir os elementos de uma distribuio de frequncias:
Pontos mdios das classes (PM)
a mdia aritmtica entre o limite superior e o limite inferior da classe. Assim,
se a classe for, por exemplo de 21 26, temos:
=
21+2
2
= 23,5, como ponto mdio da classe.
Frequncia simples ou absoluta (Fi)
o nmero de vezes que o elemento aparece na amostra, ou o nmero de
elementos pertencentes a uma classe. No exemplo 6, F(21) = 3.
Frequncia absoluta acumulada (Fac)
a soma das frequncias de todos os valores inferiores ao limite superior do
intervalo de uma dada classe, mais a frequncia simples da classe.
Frequncia relativa (fi) e Frequncia relativa percentual (fi%)
a porcentagem daquele valor na amostra. Note que fi = 1. A frequncia
relativa de um valor dada por:

ou


Passos para a montagem de uma Distribuio de Frequncia por
intervalos:
1 passo: ordenar os elementos em ordem crescente, indicando a frequncia
simples de cada elemento (distribuio de frequncia por intervalos);
2 passo: Determinar a amplitude total (A
T
);
3 passo: Determinar o nmero de intervalos de classe (k);
4 passo: Determinar a amplitude da classe (h);
5 passo: Montagem da distribuio de frequncia com ttulo e fonte.

Exemplo 1.9:
Com as notas da turma de Probabilidade e Estatstica, do curso de Engenharia
Civil, turma A, da Faculdade Redentor 1sem/2007, vamos montar uma distribuio
de frequncia.

5,0 4,0 5,8 3,3 6,8 3,5 4,0 7,0 7,0 - 8,3 9,3 9,8 7,5 8,8 7,5 6,8 - 10,0
zero 6,5 2,0 8,8 9,3 7,5 5,8 9,8 9,0 7,8 6,5 9,5 5,0 7,0 8,3 6,5
Soluo:
1 passo: colocar os elementos em rol (crescente), aqui teremos uma distribuio de frequncia
por pontos.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

13


Notas (xi) N Alunos (Fi)
0,0 1
2,0 1
3,3 1
3,5 1
4,0 2
5,0 2
5,8 2
6,5 3
6,8 2
7,0 3
7,5 3
7,8 1
8,3 2
8,8 2
9,0 1
9,3 2
9,5 1
9,8 2
10 1
total 33

2 passo: calcular A
T
A
T
= xi
(mx)
- xi
(min)
A
T
= 10 0 = 10

3 passo: calcular k K = 1 + 3,3 log 33
K = 6,01

4 passo: calcular h h = A
T
/ k

h = 10 / 6,01 = 1,66
podemos adotar h = 2

5 passo: montar a distribuio de frequncia (por intervalos) com ttulo e fonte

Notas da turma de Probabilidade e Estatstica, do curso de Engenharia Civil, turma A, da
Faculdade Redentor 1sem/2007
Notas N alunos (Fi) Fiac fi fi % PM
0 2 1 1 0,03 3,03% 1
2 4 3 4 0,09 9,09% 3
4 6 6 10 0,18 18,18% 5
6 8 12 22 0,36 36,36% 7
8 10 11 33 0,33 33,33% 9
Total 33 1,00 100,00%
Fonte: Prof
a
. Muriel
Comentrios:
- A tabela de distribuio de frequncias composta das duas primeiras colunas.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

14

- As demais colunas foram colocadas para mostrar os elementos de uma distribuio de
frequncias, que sero utilizados para o clculo das medidas descritivas de posio e de
disperso. A usamos:
Fiac = por exemplo, no ltimo intervalo de classe: Fiac = 22 + 11 = 33
fi = (Fi/n), por exemplo, f = (1/33) = 0,03
f% = (Fi/n)*100, por exemplo: f% = (1/33)*100 = 3%
PM = (Li+Ls)/2, por exemplo: PM = (0+2)/2 = 1
- Observe que quando calculamos k, achamos k = 6, mas adotamos k = 5, e colocamos o
ltimo intervalo fechado para 10. Para k = 6, teramos mais um intervalo, de 10 12, o que
no usual, pois nossa maior nota 10.
Exemplo 1.10:
Vamos completar a distribuio de frequncia a seguir e logo aps interpretar os
valores da terceira linha da distribuio de frequncia:
Notas da turma x, do curso y, turma z, da Faculdade w 2sem/2011
Notas N de estudantes Fiac fi(%)
|---2 10%
|---4 18
|--- 20
6 |---
|--- 2,5%
Total 40
Fonte: Dados fictcios
Soluo:











SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

15

Exemplo 1.11:
Dadas as sries estatsticas abaixo, vamos dizer se so sries simples ou
compostas (mistas) e ainda se so referentes a sries geogrficas, temporais, ou
especficas.


Fonte: Cincias e agrotecnologia vol.34 no.1 Lavras Jan./Feb. 2010.
Soluo:

Tabela 2 - Municpio de procedncia dos alunos da disciplina Inferncia Estatstica da
Universidade Estadual de Maring, 21/03/2005

Fonte: Departamento de Estatstica (DES)/UEM
Soluo:

Tabela 3 - Taxa de Urbanizao no Brasil 1940 a 2007

Fonte: IBGE, Censo demogrfico 1940-2007. At 1970 dados extrados de: Estatsticas do sculo XX.
Rio de Janeiro: IBGE, 2007 no Anurio Estatstico do Brasil, 1981, vol. 42, 1979.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

16

Soluo:


Tabela 4 Caracterizao das bacias hidrogrficas

http://www.funceme.br/index.php/revista-eletronica-2008/doc_details/20-avaliacao-da-influecia-
dos-dados-de-evapotranspiracao (acesso em 04/01/2012)
Soluo:

Tabela 5 - Consumo de energia eltrica (Gwh), segundo as grandes Regies do Brasil, 1993-
1995
Regio
Ano
1993 1994 1995
Norte 11.154 11.506 12.563
Nordeste 35.810 36.910 38.808
Sudeste 137.167 141.746 149.096
Sul 32.884 34.566 37.451
Centro Oeste 10.106 10.899 11.939
Total 215.967 235.627 249.857
Fonte: Anurio Estatstico do Brasil, IBGE,1995
Soluo:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

17


Soluo:
Exemplo 1.12:
Vamos considerar a distribuio de frequncia abaixo, correspondente aos
diferentes preos de um determinado produto em 20 lojas pesquisadas.
Preos (R$) N de lojas
70 2
71 5
72 6
73 6
74 1
Total 20
Fonte: dados fictcios
a) Quantas lojas apresentaram um preo de R$ 73?
b) Quantas lojas apresentaram um preo de at R$ 72 (inclusive)?
c) Qual o percentual de lojas com preo maior de que R$ 71 e menor de que R$ 74?
d) Qual o percentual de lojas com preo menor de que R$ 73?






SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

18

Exerccios:
1 Os dados a seguir, referem-se a estatura (em cm) de 70 funcionrios da empresa
NS, que passaram por exames peridicos do trabalho em Nov/2011.
150 156 160 163 167 168 170 172 174 178 150 156
161 163 167 168 170 173 175 179 150 158 161 163
167 169 171 173 175 179 151 158 162 166 168 170
172 173 175 179 152 158 162 166 168 170 172 174
176 181 153 160 162 167 168 170 172 174 176 182
156 160 163 167 168 170 172 174 176 182
Pede-se:
a) montar uma distribuio de frequncias segundo as regras de Sturges;
b) o ponto mdio da 4 classe;
c) a frequncia simples da 3 classe;
d) a frequncia relativa da 6 classe;
e) a frequncia acumulada da 5 classe;
f) o n de funcionrios cuja altura no atinge 170;
g) a percentagem de funcionrios cuja altura no atinge a 165;
h) a percentagem de funcionrios cuja altura maior e igual a 175;
i) a percentagem de funcionrios cuja altura de no mnimo 155 e inferior a 175;
j) interprete os valores da 2 classe;
k) interprete os valores da ltima classe.

2 Descreva as etapas do mtodo de engenharia e comente sobre a importncia da
estatstica na Engenharia.





SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

19



























SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

20

II - REPRESENTAO GRFICA DE SRIES ESTATSTICAS
2.1. INTRODUO
A representao grfica das sries estatsticas tem por finalidade dar uma idia,
a mais imediata possvel, dos resultados obtidos, permitindo chegar-se a concluses
sobre a evoluo do fenmeno ou sobre como se relacionam os valores da srie em
estudo. Podemos dizer que os grficos se constituem num recurso visual da Estatstica
utilizado para representar um fenmeno.
Embora os grficos forneam um menor grau de detalhes do que as tabelas,
estes apresentam um ganho na compreenso global dos dados, permitindo uma viso
geral da situao em estudo sem deixar de evidenciar alguns aspectos particulares que
sejam de interesse do pesquisador.
Uma representao grfica coloca em evidncia as tendncias, as ocorrncias
ocasionais, os valores mnimos e mximos e tambm as ordens de grandezas dos
fenmenos que esto sendo observados. Quanto ao uso, temos os grficos de
informao e os grficos de anlise, como escritos a seguir:
- Grficos de informao: Esses grficos so usados geralmente quando
queremos proporcionar ao pblico em geral uma visualizao rpida e clara. Como so
grficos caracteristicamente expositivos, devem ser o mais com pleto possvel,
podendo dispensar comentrios adicionais. Tambm podemos omitir as legendas,
desde que as informaes relevantes estejam presentes no grfico.
- Grficos de anlise: Esses tipos de grficos so mais adequados ao trabalho
com o estudo estatstico, pois fornecem elementos teis para a anlise dos dados,
alm de serem tambm informativos. Normalmente, os grficos de anlise so
acompanhados de sua respectiva tabela estatstica. Tambm podemos incluir um texto
explicativo que tem como objetivo esclarecer ao leitor dos pontos principais divulgados
no grfico.
Contudo, os elementos simplicidade, clareza e veracidade devem ser
considerados quando da elaborao de um grfico. Devemos ficar atentos, pois um
grfico mal construdo pode transmitir uma informao deturpada em relao
informao verdadeira. Normalmente isso ocorre por problemas de escala, em que as
propores entre os dados no so respeitadas.
Nosso objetivo principal aqui no a construo de grficos, embora isso seja
muito importante para o desenvolvimento de algumas disciplinas do curso de
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

21

engenharia, mas sim entender melhor um conjunto de dados pelo uso de grficos
adequados que sejam eficazes na revelao de caractersticas importantes.
Encontram-se a seguir os principais tipos de grficos.
Grfico de barras
um grfico formado por retngulos horizontais de larguras iguais, onde cada
um deles representa a intensidade de uma modalidade ou atributo. recomendvel
que cada coluna conserve uma distncia entre si de aproximadamente metade ou 2/3
da largura da base de cada barra, evidenciando deste modo, a no continuidade na
sequncia dos dados.
O objetivo deste grfico de comparar grandezas e recomendvel para
variveis cujas categorias tenham designaes extensas. o grfico mais utilizado
para representar variveis qualitativas.
Exemplo 2.1:
Acidentes no trecho das cidades de Barbacena e Barroso at a cidade de Itutinga - MG.


Fonte: Dados da 13 CIA PM Ind. de Meio Ambiente e Trnsito, 1 Peloto PM Rodovirio


Exemplo 2.2:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

22


Fonte: http://www.admit.com.br/page/14 (acesso em 02/01/2012)
Grfico de colunas
Difere do grfico de barras por serem seus retngulos dispostos verticalmente
ao eixo das abscissas sendo mais indicado quando as designaes das categorias so
breves. Tambm para este tipo de grfico deve ser preservada a distncia entre cada
retngulo de, aproximadamente, metade ou 2/3 da largura da base de cada coluna. O
nmero de colunas ou barras do grfico no deve ser superior a 12 (doze).
Os grficos de colunas so muito utilizados para a representao e anlise de
dados relacionados com sries temporais, sendo assim as colunas devem estar
dispostas em ordem cronolgica.
Exemplo 2.3:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

23


Fonte: www.library.com.br/Filosofia/terremot.htm (acesso em 20/11/2011)
Exemplo 2.4:

Fonte: www.library.com.br/Filosofia/terremot.htm (acesso em 20/11/2011)
Grfico de setores
Conhecido tambm como grfico tipo pizza ou circular o tipo de grfico onde a
varivel em estudo projetada num crculo, de raio arbitrrio, dividido em setores com
reas proporcionais s frequncias das suas categorias. So indicados quando se
deseja comparar cada valor da srie com o total. Recomenda-se seu uso para o caso
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

24

em que o nmero de categorias no muito grande e no obedecem a alguma ordem
especfica.
O procedimento para o clculo do ngulo correspondente a cada categoria
feito por meio de simples propores: 360 que corresponde a um crculo completo
est para o total, assim como x est para a parte que pertencem categoria desejada.
A legenda pode ser dispensada e escrevemos no interior de cada setor (fatia) a
porcentagem ou quantidade adequada de cada um.
Exemplo 2.5:
Setores das Organizaes da Pesquisa

Fonte: www.elogroup.com.br/base_pesquisa2009_perfil.html (acesso em 28/11/2011)
Exemplo 2.6:

http://www.edukbr.com.br/mochila/vitrine_conteudo.asp?Id=119 (acesso em 28/11/2011)
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

25

Grfico Polar
representao de uma srie por meio de um polgono. Geralmente presta-se
para apresentao de sries temporais. Para constru-lo, dividimos uma circunferncia
em tantos arcos iguais quantos forem os dados a representar. Pelos pontos de divisas
traamos os raios. Em cada raio representado um valor da srie, marcamos um ponto
cuja distncia ao centro diretamente proporcional a esse valor. A seguir unimos os
pontos (linhas em laranja e azul).
Exemplo 2.7:

Fonte: besp.mercatura.pt/Pagina.php?codPagina=4 (acesso em 28/11/2011)
Vamos interpretar o grfico acima:
O grfico polar produzido para mostrar simultaneamente os percentuais de
cada um dos exames. Para cada nmero no grfico, a legenda mostra a que indicador
se refere e o nmero de exames por disciplina efetuados na escola. Assim nota-se, por
exemplo, que a mdia de exame de Histria est perto do percentil 86% enquanto que
a mdia das CFD da mesma disciplina encontrase perto de 78%, observamos
tambm que na disciplina de matemtica, estes alunos tiveram um desempenho inferior
as outras disciplinas.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

26

Exemplo 2.8:
Comparao dos valores do momento toror (na base do prdio), obtido por meio de
ensaios em tnel de vento e pelo indicado na NBR 6.123, em funo da incidncia do vento,
para o projeto Brascan Century Staybridge Suites

Fonte: http://www.arcoweb.com.br/tecnologia/aerodinamica-das-construcoes-modelos-reduzidos-02-03-
2006.html (acesso em 28/11/2011)
Grfico de linhas
Sua aplicao mais indicada para representaes de sries temporais, pois
quando a srie cobre um grande nmero de perodos de tempo, a representao dos
valores atravs das colunas pode conduzir a uma excessiva concentrao de dados.
Sua construo feita colocando-se no eixo vertical (y) a mensurao da
varivel em estudo e na abscissa (x), as unidades da varivel numa ordem crescente.
Este tipo de grfico permite representar sries longas, o que auxilia detectar suas
flutuaes tanto quanto analisar tendncias. Tambm podem ser representadas vrias
sries em um mesmo grfico.



SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

27

Exemplo 2.9:
Evoluo a concorrncia no vestibular da FUVEST

Fonte: http://petcivilufjf.wordpress.com/tag/ufjf/ (acesso em 03/01/2012)
Exemplo 2.10:

Fonte: www.bansen.com.br/SALAdeIMPRENSA/mlivre/25072 (acesso em 05/08/2011)
Vamos interpretar o grfico acima:
O grfico acima mostra que desde abril de 2004, sucessivamente, em todos os
meses, a venda dos portteis tem superado a dos tradicionais computadores pessoais.
Nota-se que o grfico mostra quatro pontos marcantes:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

28


Ponto 1: Em janeiro de 2004, pela primeira vez a venda de notebooks superou a
de PCs em unidades: 2.032 notebooks e 1.175 PCs;

Ponto 2: Em abril de 2004, foram vendidos 1.431 notebooks e 1.121 PCs atravs
do Mercado Livre. Desde ento, as vendas de portteis tm sempre superado a de PCs;

Ponto 3: Em setembro de 2004, foram vendidos 2.481 notebooks, recorde em
2004;

Ponto 4: Em junho de 2005, houve venda recorde de PCs (2.531 unidades), mas
a venda de notebooks tambm foi recorde (2.656 unidades) e se manteve maior que a
de PCs.
Grfico de Pontos ou de Disperso
Os diagramas ou grficos de pontos fornecem uma apresentao simples, que
reflete a disperso, os extremos, o centro e as falhas ou picos nos dados. Escolhemos
uma linha horizontal, na qual colocamos a amplitude dos valores dos dados. Plotamos
ento cada observao como um ponto diretamente acima dessa linha graduada e,
quando vrias observaes tem o mesmo valor, os pontos so empilhados
verticalmente naquele ponto da escala.
Exemplo 2.11:

Fonte: Dados fictcios

Quando desejamos conjuntamente resultados para duas variveis, o equivalente
do grfico de pontos se chama diagrama de disperso. Construmos um sistema
retangular de coordenadas associando o eixo horizontal a uma das variveis e ao eixo
vertical a outra varivel, e plotamos cada observao como um ponto desse plano.


Exemplo 2.12:
Item A


Item B
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

29

Diagrama de disperso: E dinmico X E esttico, de 326 peas estruturais de madeira Southern
Pine

Fonte: http://www.scielo.br/scielo.php?pid=S1415-43662003000200025&script=sci_arttext (acesso em
04/01/2012)
Exemplo 2.13:

Fonte: http://www.devmedia.com.br/post-4584-Data-Mining-na-Pratica--Algoritmo-K-Means.html (acesso
em 04/01/2012)
Grfico de Caixa, Boxplot
O grfico de caixa, boxplot, grfico das cinco medidas ou grfico de bigodes
til na comparao de duas ou mais amostras.
Este grfico estende-se do 1 quartil ao 3 quartil que correspondem,
respectivamente, s bases inferior e superior do retngulo e representa 50% das
observaes totais. A mediana representada por uma linha grossa dentro da caixa;
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

30

se a amostra for aproximadamente simtrica, a linha que corresponde mediana divide
a caixa em duas partes aproximadamente iguais. A caixa esquerda prolonga-se para
baixo do 1 quartil, at ao menor valor da amostra no outlier e a caixa direita prolonga-
se para cima do 3 quartil, at ao maior valor da amostra no outlier (observemos o
exemplo 2.14).
Os outliers, que so assinalados com um crculo, podem representar erros de
introduo de dados, caso em que devemos elimin-los, ou fazer parte do fenmeno
em estudo, caso em que devemos mant-los, assinalando-se a sua existncia.
comum fazermos a anlise com e sem outliers e registrar as diferenas.
Exemplo 2.14:

Fonte: Prof. Luiz Augusto Pinto Lemos DMAT FURG 2008


Exemplo 2.15:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

31


Fonte: http://www.blogcmmi.com.br/geral/serie-indicadores-produtividade (acesso em 04/01/2012)
Temos tambm os grficos representativos de distribuies de frequncias, que
so os histogramas e os polgonos de frequncia, que so tipicamente grficos de
anlise. A representao das frequncias simples feita atravs do histograma ou
polgono de frequncias, enquanto que as frequncias acumuladas so representadas
por meio do polgono de frequncia acumulado ou ogiva de Galton.
Histograma
um grfico de barras ou colunas justapostas (sem separao) que representa
uma distribuio de frequncia para dados contnuos ou uma varivel discreta quando
esta apresentar muitos valores distintos.
No eixo horizontal so dispostos os limites das classes segundo as quais os
dados foram agrupados enquanto que o eixo vertical corresponde s frequncias
absolutas ou relativas das mesmas.
Quando os dados so distribudos em classes de mesma amplitude, exemplo
2.16 (a esquerda), todas as colunas apresentam bases iguais com alturas variando em
funo das suas frequncias absolutas ou relativas. Neste caso, temos que a rea de
cada retngulo depende apenas da sua altura enquanto que no caso de dados
agrupados em classes de dimenses diferentes, como mostra a exemplo 2.16 (a
direita), a rea de cada coluna j no mais proporcional sua altura.



Exemplo 2.16:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

32


Fonte: http://www.ime.usp.br/~rt/mmfina/apost3a.html (acesso em 04/01/2012)

Exemplo 2.17:

Fonte: http://bi.gave.min-edu.pt/bi/es/860/1446?uid=1446&add (acesso em 04/01/2012)




Polgono de Frequncia
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

33

um grfico de linha cuja construo feita quando unimos os pontos de
coordenadas de abscissas correspondentes aos pontos mdios de cada classe e as
ordenadas, s frequncias absolutas ou relativas dessas mesmas classes.
O polgono de frequncia um grfico que deve ser fechado no eixo das
abscissas. Ento, para finalizar sua elaborao, devemos acrescentar distribuio,
uma classe esquerda e outra direita, ambas com frequncias zero. Tal
procedimento permite que a rea sob a linha de frequncias seja igual rea do
histograma.
Uma das vantagens da aplicao de polgonos de frequncias que, por serem
grficos de linhas, permitem a comparao entre dois ou mais conjuntos de dados por
meio da superposio dos mesmos.
Exemplo 2.18:
Polgono de frequncia do nmero de pessoas que chegam ao banco diariamente.

Fonte: http://mundodaimpermeabilizacao.blogspot.com/2011/03/distribuicao-de-frequencia.html (acesso
em 04/01/2012)


Exemplo 2.19:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

34


Fonte: www.definicionabc.com/tecnologia/histograma.php (acesso em 04/01/2012)

O exemplo 2.20 mostra o polgono de frequncia relativas acumulada (Ogiva de
Galton) da idade dos habitantes do local X. Neste grfico, a altura de cada coluna o
nmero total de observaes que menor ou igual ao limite superior do intervalo.
Distribuies cumulativas so tambm teis na interpretao dos dados. Quando o
tamanho da amostra for grande, o histograma ou polgono de frequncia poder ser um
indicador confivel da forma geral da distribuio ou da populao de medidas da qual
a amostra foi retirada.
Exemplo 2.20:

Fonte: http://alfaconnection.net/pag_avsm/est0201.htm (acesso em 04/01/2012)
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

35

Grfico em escala logartmica
Podemos usar a escala logartmica para a representao de valores em que a
amplitude total muito grande, quando for invivel ou pouco prtica a utilizao da
escala aritmtica devido ao seu tamanho.
Na escala logartmica alteramos as propores entre as grandezas, deformando
as figuras. Podemos observar que o processo se torna imprprio quando o objetivo
destacar as relaes entre valores absolutos, e por outro lado, possvel comparar
mais facilmente propores, percentuais e taxas de crescimento de funes
exponencial, de potncia, geomtrica, etc.
Isso pode ser visto no exemplo 2.21, onde desejamos comparar a evoluo
produtiva de um determinado produto (caf), entre o pas X e o estado Y. A tabela 2.1
apresenta os dados, o grfico (a) est numa escala aritmtica ou linear e o grfico (b)
apresentado numa escala logartmica.
Pela tabela notamos que o crescimento da produo de caf foi o mesmo, mas o
grfico (a) evidencia que a produo de caf do pas X foi bem maior que a do estado
Y. Assim mais apropriado o uso do grfico em escala logartmica, grfico (b).
Exemplo 2.21:

Tabela 2.1: Produo de caf no Pas X e Estado Y - 1960 a 1985

(a) Grfico em escala aritmtica (b) Grfico em escala logartmica
Fonte: Dados fictcios
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

36

Estereogramas
So grficos geomtricos dispostos em trs dimenses, pois representam
volume. So usados nas representaes grficas das tabelas de dupla entrada. Em
alguns casos este tipo de grfico fica difcil de ser interpretado dada a pequena
preciso que oferecem.
Exemplo 2.22:

Fonte: http://globalsistensnews.blogspot.com/2009_04_01_archive.html (acesso em 04/01/2012)

Pictogramas
So construdos a partir de figuras representativas da intensidade do fenmeno.
Este tipo de grfico tem a vantagem de despertar a ateno do pblico leigo, pois sua
forma atraente e sugestiva. Os smbolos devem ser auto-explicativos. A desvantagem
dos pictogramas que apenas mostram uma viso geral do fenmeno, e no de
detalhes minuciosos.
Exemplo 2.23:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

37


Fonte: http://www.oocities.org/paris/rue/5045/2A5.HTM (acesso em 04/01/2012)
Cartogramas
So ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico
o de figurar os dados estatsticos diretamente relacionados com reas geogrficas ou
polticas.
Exemplo 2.24:

Fonte: http://cartageografica.blogspot.com/2011/06/visualizando-dados-geoambientais-no_5827.html
(acesso em 04/01/2012)




SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

38

Exemplo 2.25:


Os grficos podem ser criados em vrios programas de computador, como, por
exemplo, Excel, Minitab, Statdisk, Calculadoras Programveis, etc.


Exemplo 2.26:
Baseando-se no grfico a seguir, responda as seguintes questes:
a) Que tipo de srie estatstica o grfico representa?
b) Que tipo de grfico este?
c) Interprete o grfico:



SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

39

Distribuio de conceitos de alunos por categoria administrativa pblica e privada-
ENADE 2006.

Fonte: MEC/INEP/DEAES - ENADE 2006
Soluo:







Exemplo 2.27:
Os dados a seguir, referem-se ao peso (em gramas) de uma amostra de 70
conectores de metal produzidos pela empresa YY. (obs: dados fictcios).
150 156 160 163 167 168 170 172 174 178 150 156
161 163 167 168 170 173 175 179 150 158 161 163
167 169 171 173 175 179 151 158 162 166 168 170
172 173 175 179 152 158 162 166 168 170 172 174
176 181 153 160 162 167 168 170 172 174 176 182
156 160 163 167 168 170 172 174 176 182
Pede-se:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

40

a) montar uma distribuio de frequncia segundo as regras de Sturges;
b) o ponto mdio da 4 classe;
c) a frequncia simples da 3 classe;
d) a frequncia relativa da 6 classe;
e) a frequncia acumulada da 5 classe;
f) o n de conectores cujo peso no atinge 170;
g) o n de conectores cujo peso no atinge a 175;
h) a percentagem de conectores cujo peso no atinge a 165;
i) a percentagem de conectores cujo peso maior e igual a 175;
j) a percentagem de conectores cujo peso de no mnimo 155 e inferior a 175;
k) interprete os valores da 2 classe;
l) interprete os valores da ltima classe;
m) o histograma;
n) o polgono de frequncias.
Soluo:











SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

41























SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

42























SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

43

III MEDIDAS DE POSIO
3.1- INTRODUO
As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e
mediana. Outros promdios menos usados so as mdias: geomtrica, harmnica,
quadrtica, cbica e biquadrtica, que no sero vistas nesta unidade.
As outras medidas de posio so as separatrizes.
Temos trs formas diferentes (mdia aritmtica, moda e mediana) para trs
situaes distintas (dados no agrupados, dados agrupados sem intervalo de classe e
dados agrupados com intervalo de classe), como veremos a seguir.
3.2- MDIA ARITMTICA
Existem duas mdias:
Populacional: representada letra grega
Amostral: representada por
X
, sobre a qual as expresses e os clculos sero
demostrados.
1 SITUAO: Dados no agrupados
Sejam os elementos x
1
, x
2
, x
3
,...,x
n
de uma amostra, portanto n valores da
varivel X. A mdia aritmtica da varivel aleatria de X definida por,
n
Xi
X
n
i

=
=
1
ou
n
Xi
X

=
onde n o nmero de elementos do conjunto.
Exemplo 3.1:
Suponha que os dados sejam o conjunto de tempo de servio (em anos) de cinco
funcionrios: 3, 7, 8, 10 e 11. Determine a mdia aritmtica deste conjunto de dados.
Soluo:
8 , 7
5
39
5
11 10 8 7 3
= =
+ + + +
=

=
n
Xi
X
Interpretao: o tempo mdio de servio deste grupo de funcionrios de 7,8
anos.

2 SITUAO: Dados agrupados em uma distribuio de frequncia por valores
simples
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

44

Quando os dados estiverem agrupados numa distribuio de frequncia
usaremos a mdia aritmtica dos valores x
1
, x
2
, x
3
,...,x
n
, ponderados pelas respectivas
frequncias absolutas: F
1
, F
2
, F
3
, ... , F
n
. Assim:

=
=
=
n
i
n
i
Fi
Fi Xi
X
1
1
.
ou
n
Fi Xi
X

=
.

onde

= Fi n , o nmero de elementos do conjunto.


Exemplo 3.2:
A tabela abaixo representa o nmero de peas de preciso defeituosas
desenvolvidas mensalmente pelo controle de qualidade:
Nmero de peas
com defeito (Xi)
Nmero de meses
(Fi)
Xi.Fi
0 2 0
1 3 3
2 6 12
3 8 24
4 4 16
5 2 10
6 1 6
TOTAL 26 71
Determine a mdia de peas defeituosas por ms.
Soluo:
73 , 2
26
71
.
= = =

n
Fi Xi
X

Interpretao: em mdia, foram encontradas 2,73 peas com defeito por ms.
3 SITUAO: Dados agrupados em uma distribuio de frequncia por
intervalos de classes
a) Processo Longo

=
=
=
n
i
i
n
i
i M
F
F P
X
1
1
.

onde P
M
o ponto mdio de cada intervalo de classe.
b) Processo Breve
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

45

h
F
F d
P X
n
i
i
n
i
i i
Me M

|
.
|

\
|
+ =

=
=
1
1
.

onde P
M Me
o ponto mdio da mediana e d
i
o desvio, ou seja, a diferena entre o
ponto mdio de cada intervalo de classe e o ponto mdio da mediana. Ento,
h
P P
di
Me M M

= .
Em seguida, veremos que a mediana a medida que divide a distribuio em
duas partes, a medida do elemento central.
Exemplo 3.3:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos
matriculados em uma determinada disciplina. Calcule a mdia aritmtica pelos dois
processos:

Escores Alunos (Fi) P
M
Fac P
M
.Fi di di. Fi
35 |- 45 5 40 5 200 -2 -10
45 |- 55 12 50 17 600 -1 -12
55 |- 65 18 60 35 1080 0 0
65 |- 75 14 70 49 980 1 14
75 |- 85 6 80 55 480 2 12
85 |- 95 3 90 58 270 3 9
Total 58 3610 13
Soluo:
a)
24 , 62
58
3610
.
1
1
= = =

=
=
n
i
i
n
i
i M
F
F P
X

b)
24 , 62 24 , 2 60 10
58
13
60
.
1
1
= + = |
.
|

\
|
+ =

|
.
|

\
|
+ =

=
=
x h
F
F d
P X
n
i
i
n
i
i i
Me M

PM
Me
obtido pela Fac, se temos 58 dados, a mediana est no intervalo que
contm o 29 dado, logo no intervalo de 55 |- 65, ento temos PM
Me
= 60.
Interpretao: o desempenho mdio deste grupo de alunos foi de 62,24 pontos
nesta disciplina.

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

46

Mdia Aritmtica Ponderada (
P
X ) (para dados no agrupados)
Se os elementos x
1
, x
2
, x
3
,...,x
n
de uma amostra, forem associados a pesos p
1
,
p
2
, p
3
,...,p
n
, a mdia aritmtica ponderada, representada por
P
X calculada por,
i n
n n
P
p
pi Xi
p p p p
p x p x p x p x
X

=
+ + + +
+ + + +
=
.
...
. ... . . .
3 2 1
3 3 2 2 1 1

Exemplo 3.4:
Um professor de Estatstica adotou para o ano de 2010 os seguintes pesos para
as notas bimestrais: 1 bimestre peso 1; 2 bimestre peso 2; 3 bimestre peso 3; e, 4
bimestre peso 4. Qual ser a mdia de um aluno que obteve as seguintes notas em
Estatstica: 5, 4, 3 e 2 nos respectivos bimestres ?
Soluo:
3
10
30
10
8 9 8 5
4 3 2 1
) 4 . 2 ( ) 3 . 3 ( ) 2 . 4 ( ) 1 . 5 (
= =
+ + +
=
+ + +
+ + +
=
p
X
Interpretao: a nota mdia deste aluno foi de 3 pontos.
3.2. MODA - Mo
Dentre as principais medidas de posio, destacamos a moda. Moda o valor
mais frequente da distribuio (aquele que aparece mais vezes).
1 SITUAO: Dados no agrupados
Sejam os elementos x
1
, x
2
, x
3
,...,x
n
de uma amostra, o valor da moda para este
tipo de conjunto de dados simplesmente o valor com maior frequncia.
Exemplo 3.5:
Suponha o conjunto de tempo de servio (em anos) de cinco funcionrios: 3, 7,
8, 8 e 11. Determinar a moda deste conjunto de dados.
Soluo:
Mo = 8, distribuio unimodal ou modal
Interpretao: o tempo de servio com maior frequncia de 8 anos.
Exemplo 3.6:
Suponha o conjunto de tempo de servio (em anos) de cinco funcionrios: 3, 3,
7, 8, 8 e 11. Determinar a moda deste conjunto de dados.
Soluo:
Mo = 3 e Mo = 8, distribuio bimodal
Interpretao: os tempos de servio com maior frequncia foram de 3 e 8 anos.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

47

Exemplo 3.7:
Suponha o conjunto de tempo de servio (em anos) de cinco funcionrios: 3, 7,
8, 10 e 11. Determinar a moda deste conjunto de dados.
Soluo:
No existe Mo, logo a distribuio amodal
Interpretao: no existe o tempo de servio com maior frequncia.
2 SITUAO: Dados agrupados em uma distribuio de frequncia por valores
simples
Para este tipo de distribuio, a identificao da moda facilitada pela simples
observao do elemento que apresenta maior frequncia.
Exemplo 3.8:
A tabela abaixo representa o nmero de peas de preciso defeituosas
desenvolvidas mensalmente pelo controle de qualidade. Determine a moda.
Nmero de peas
com defeito (Xi)
Nmero de meses
(Fi)
0 2
1 3
2 6
3 8
4 4
5 2
6 1
TOTAL 26
Soluo:
Se a maior frequncia Fi = 8, logo Mo = 3.
Interpretao: Esse resultado indica que a rejeio de 3 peas defeituosas por
ms foi o resultado mais observado.
3 SITUAO: Dados agrupados em uma distribuio de frequncia por classes
Para dados agrupados em classes, temos diversas frmulas para o clculo da
moda. A utilizada ser:
Frmula de Czuber
Procedimento:
a) Identificamos a classe modal (aquela que possuir maior frequncia)
CLASSE (Mo).
b) Utiliza-se a frmula:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

48

h
Fi Fi Fi
Fi Fi
Li Mo
post ant Mo
ant Mo
Mo
.
) ( 2 +

+ =
em que:
Li
Mo
: limite inferior da classe modal
Fi
Mo
: frequncia simples do intervalo da classe modal
Fi
ant
: frequncia simples anterior do intervalo da classe modal
Fi
post
: frequncia simples posterior do intervalo da classe modal
h: amplitude do intervalo de classe
Exemplo 3.9:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos
matriculados em uma determinada disciplina. Determine a moda.
Escores Alunos (Fi)
35 |- 45 5
45 |- 55 12
55 |- 65 18
65 |- 75 14
75 |- 85 6
85 |- 95 3
Total 58
Soluo:
Classe que contm a Moda: 55 |- 65
h
Fi Fi Fi
Fi Fi
Li Mo
post ant Mo
ant Mo
Mo
.
) ( 2 +

+ =

61 10 .
) 14 12 ( 18 2
12 18
55 =
+

+ =
x
Mo
Interpretao: O escore com maior frequncia entre o grupo de 58 alunos foi de
61 pontos.
3.3. MEDIANA Me ou Md
Aps colocarmos os dados em ROL, o valor da mediana o elemento que
ocupa a posio central, ou seja, o elemento que divide a distribuio em 50% de
cada lado. considerada uma separatriz, por ser um promdio que divide o conjunto
de dados em partes iguais:

1 SITUAO: Dados no agrupados
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

49

Sejam os elementos x
1
, x
2
, x
3
,..., x
n
de uma amostra, portanto n valores da
varivel X. A mediana da varivel aleatria de X definida por,
- Se n mpar, ento o valor da mediana ser o valor central, localizado na
posio:
2
1 n
Pos
Me
+
=
- Se n par, ento o valor da mediana ser a mdia das duas observaes
adjacentes posio
2
n
Pos
Me
=
e
1
2
n
Pos
Me
+ =
Exemplo 3.10:
Suponha o conjunto de tempo de servio (em anos) de cinco funcionrios: 3, 7,
8, 10 e 11. Vamos determinar a mediana deste conjunto de dados.
Soluo:
Como n = 5, ento o valor da mediana estar localizado na posio:
3
2
1 5
2
1
=
+
=
+
=
n
Pos
Me
, ou seja, 3 elemento, portanto, Me = 8
Interpretao: 50% dos funcionrios possuem at 8 anos de tempo de servio,
ou, 50% dos funcionrios possuem no mnimo 8 anos de tempo de servio.
Exemplo 3.11:
Suponha o conjunto de tempo de servio de cinco funcionrios: 3, 7, 8, 10, 11 e
13. Vamos determinar a mediana deste conjunto de dados.
Soluo:
Como n = 6, ento o valor da mediana estar localizado na posio 3
2
6
= =
Me
Pos ,
(3 elemento), e 4 1
2
6
Pos
Me
= + = (4 elemento).
E a mediana ser calculada como a mdia aritmtica deles.
Assim, no exemplo, teremos: 9
2
10 8
=
+
= Me
Interpretao: 50% dos funcionrios possuem at 9 anos de tempo de servio,
ou, 50% dos funcionrios possuem no mnimo 9 anos de tempo de servio.
2 SITUAO: Dados agrupados em uma distribuio de frequncia por valores
simples
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

50

Quando os dados estiverem agrupados numa distribuio de frequncia
identificaremos a mediana dos valores x
1
, x
2
, x
3
,...,x
n
pela posio da mediana
2
n
Pos
Me
= atravs da frequncia absoluta acumulada (Fac).
Exemplo 3.12:
A tabela abaixo representa o nmero de peas de preciso defeituosas
desenvolvidas mensalmente pelo controle de qualidade. Calcule a mediana.
Nmero de peas
com defeito (Xi)
Nmero de meses
(Fi)
Fac
0 2 2
1 3 5
2 6 11
3 8 19
4 4 23
5 2 25
6 1 26
TOTAL 26
Soluo:
13
2
26
2
= = =
n
Pos
Me

Interpretao: em 50% dos meses no mximo 3 peas defeituosas foram
desenvolvidas, ou ento, em metade dos meses foram encontradas pelo menos 3
peas defeituosas.
3 SITUAO: Dados agrupados em uma distribuio de frequncia por classes
Procedimento:
1. Calcula-se a posio da mediana:
2
n
Pos
Me
=
2. Pela Fac identifica-se a classe que contm o valor da mediana Classe(Me)
3. Utiliza-se a frmula:
h .
Fi
Fac ) Me ( POS
Li Me
Me
ant
Me

+ =

onde:
Li
Me
= Limite inferior da classe mediana
Fac,
ant
= Frequncia acumulada anterior classe mediana
h = Amplitude do intervalo de classe
Fi
Me
= Frequncia absoluta simples da classe mediana
n = Tamanho da amostra ou nmero de elementos
Exemplo 3.13:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

51

A tabela abaixo representa os escores obtidos por um grupo de 58 alunos
matriculados em uma determinada disciplina. Calcule a mediana.
Escores Alunos (Fi) Fac
35 |- 45 5 5
45 |- 55 12 17
55 |- 65 18 35
65 |- 75 14 49
75 |- 85 6 55
85 |- 95 3 58
Total 58 -
Soluo:
1. = = 29
2
58
Me
Pos

elemento, observando a Fac temos:
2. Classe(Me) = 55 | 65
3. 67 , 61 10 .
18
17 29
55 =

+ = Me
Interpretao: 50% dos alunos obtiveram escore mximo de 61,67 pontos, ou
ento, metade dos alunos obtiveram escore maior que 61,67 pontos.


INDICAES PARA UTILIZAO DAS TRS PRINCIPAIS MEDIDAS DE
POSIO
De maneira geral, a mdia a mais empregada e a moda a menos empregada
e a mais difcil de calcular satisfatoriamente. No entanto, a moda adequada para
caracterizar situaes onde estejam em causa os casos ou valores mais usuais. Por
exemplo, em estudos de mercado, o fabricante pode estar interessado nas medidas
que mais se vendem.
A mediana tem vantagens: mais fcil de calcular do que a mdia; mais
resistente do que a mdia, isto , a alterao drstica de um s valor do rol reflete-se
substancialmente no valor da mdia e pode no refletir-se, ou refletir-se muito pouco,
no valor da mediana.
A mdia tem vantagens: quando a curva de frequncia tem forma mais ou
menos simtrica (veremos isso adiante), com abas decaindo rapidamente (valores
errticos muito improvveis), a mdia mais eficiente do que a mediana, isto , est
menos sujeita variabilidade de rol para rol (menos sujeita a variaes de
amostragem); a mdia uma funo linear das observaes, propriedade que tambm
pode pesar na sua adoo.
Por fim, uma vantagem da mediana e da moda em relao mdia aritmtica
que esta ltima no pode ser calculada quando ocorrem classes de frequncias com
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

52

limites indefinidos (classes abertas). Entretanto, nesta situao, a moda e a mediana
podem ser encontradas sem qualquer dificuldade.
A seguir, na Figura 3.1 podemos ver uma comparao da mdia, mediana e
moda, as medidas de centro mais utilizadas:
A Figura 3.2 mostra a distribuio dos dados quanto simetria. Temos que uma
distribuio assimtrica quando se estende mais para um lado do que para o outro.
Pode ser assimtrica negativa Figura 3.2 (a) ou assimtrica positiva Figura 3.2 (c), ou
ainda simtrica Figura 3.2 (b), quando os dados do histograma no apresentam
diferenas significativas, a esquerda e a direita.

Figura 3.1: Comparao das medidas de centro
Fonte: TRIOLA (2008)
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

53


Figura 3.2: Assimetria
Fonte: TRIOLA (2008)
RELAO EMPRICA ENTRE A MDIA, A MODA E A MEDIANA
Existe uma frmula emprica de relao entre as medidas de posio, criada por
Pearson, para distribuies de frequncia unimodais:
) ( 3 Me x Mo x =

Calculando cada medida a partir dessa relao temos:
2
3 Mo Me
x

=

x Me Mo 2 3 =

3
2 Mo x
Me
+
=

Exemplo 3.14:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos
matriculados em uma determinada disciplina:

Escores Alunos (Fi) P
M
Fac P
M
.Fi
35 |- 45 5 40 5 200
45 |- 55 12 50 17 600
55 |- 65 18 60 35 1080
65 |- 75 14 70 49 980
75 |- 85 6 80 55 480
85 |- 95 3 90 58 270
Total 58 3610

Nos exemplos 3.3, 3.9 e 3.13, calculamos a mdia a moda e a mediana obtendo
os seguintes valores:
24 , 62
58
3610
.
1
1
= = =

=
=
n
i
i
n
i
i M
F
F P
X

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

54

61 10 .
) 14 12 ( 18 2
12 18
55 =
+

+ =
x
Mo
67 , 61 10 .
18
17 29
55 =

+ = Me

Agora vamos comparar estes valores com os calculados pela relao emprica:
00 , 62
2
61 ) 67 , 61 ( 3
2
3
=

=
Mo Me
x

53 , 60 ) 24 , 62 ( 2 ) 67 , 61 ( 3 2 3 = = = x Me Mo

83 , 61
3
61 ) 24 , 62 ( 2
3
2
=
+
=
+
=
Mo x
Me

Como vemos no h uma diferena acentuada entre as medidas pelos dois
processos.
3.5. MEDIDAS SEPARATRIZES
Alm das medidas de posio que estudamos, h outras que, consideradas
individualmente, no so medidas de tendncia central, mas esto ligadas mediana
relativamente sua caracterstica de separar a srie em duas partes que apresentam o
mesmo nmero de valores.
Essas medidas - os quartis, os decis e os percentis - so, juntamente com a
mediana, conhecidas pelo nome genrico de separatrizes.
3.5.1. QUARTIS
Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:

Onde:
Q
1
= 1 quartil, deixa 25% dos elementos
Q
2
= 2 quartil, coincide com a mediana, deixa 50% dos elementos
Q
3
= 3 quartil, deixa 75% dos elementos
Procedimento:
1. Calcula-se a posio do quartil: i
n
Qi Pos .
4
) ( = , onde: i = 1, 2, 3.
2. Pela Fac identifica-se a classe que contm o valor do quartil - Classe(Qi)
3. Utiliza-se a frmula: h
Fi
Fac Q POS
Li Q
ant i
i
.
) (
,

+ =
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

55

onde:
Li = Limite inferior da classe quartlica
Fac
,ant
= Frequncia acumulada anterior classe quartlica
h = Amplitude do intervalo de classe
Fi = Frequncia absoluta simples da classe quartlica
n = Tamanho da amostra ou nmero de elementos
Exemplo 3.15:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos
matriculados em uma determinada disciplina. Calcule o primeiro e o terceiro quartil.

Escores Alunos (Fi) Fac
35 |- 45 5 5
45 |- 55 12 17
55 |- 65 18 35
65 |- 75 14 49
75 |- 85 6 55
85 |- 95 3 58
Total 58 -
Soluo:
Primeiro Quartil
1. 5 , 14 1 .
4
58
) 1 ( = = Q Pos
2. Classe(Q1) = 45 | 55
3.
92 , 52 92 , 7 45 10 .
12
5 5 , 14
45
1
= + =

+ = Q

Interpretao: 25% dos alunos obtiveram escore mximo de 52,92 pontos, ou
ento, 75% dos alunos obtiveram escore maior que 52,92 pontos.

Terceiro Quartil
1. 5 , 43 3 .
4
58
) 3 ( = = Q Pos
2. Classe(Q3) = 65 | 75
3. 07 , 71 07 , 6 65 10 .
14
35 5 , 43
65
3
= + =

+ = Q
Interpretao: 75% dos alunos obtiveram escore menor que 71,07 pontos, ou
ento, 25% dos alunos obtiveram escore de pelo menos 71,07 pontos.

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

56

3.5.2. DECIS
So valores que dividem a srie em dez partes.

Procedimento:
1. Calcula-se a posio da medida: i
n
Di Pos .
10
) ( =
onde: i = 1,2,3,4,5,6,7,8,9
2. Pela Fac identifica-se a classe que contm o valor do decil - Classe(Di)
3. Utiliza-se a frmula: h
Fi
Fac D POS
Li D
ant i
i
.
) (
+ =
onde:
Li = Limite inferior da classe do decil
Fac,
ant
= Frequncia acumulada anterior classe do decil
h = Amplitude do intervalo de classe
Fi = Frequncia absoluta simples da classe do decil
n = Tamanho da amostra ou nmero de elementos
Exemplo 3.16:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos
matriculados em uma determinada disciplina. Calcule o sexto decil.

Escores Alunos (Fi) Fac
35 |- 45 5 5
45 |- 55 12 17
55 |- 65 18 35
65 |- 75 14 49
75 |- 85 6 55
85 |- 95 3 58
Total 58 -
Soluo:
1. 8 , 34 6 .
10
58
) 6 ( = = D Pos
2. Classe(D
6
) = 55 | 65
3. 89 , 64 89 , 9 55 10 .
18
17 8 , 34
55 6 = + =

+ = D
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

57

Interpretao: 60% dos alunos obtiveram escore inferior a 64,89 pontos, ou
ento, 40% dos alunos obtiveram escore mnimo de 64,89 pontos.
3.5.3. PERCENTIS
So as medidas que dividem a amostra em 100 parte iguais.

Procedimento:
1. Calcula-se a posio da medida: i
n
Pi Pos .
100
) ( = , onde : i = 1,2,3,..., 98,99
2. Pela Fac identifica-se a classe que contm o valor do percentil - Classe(Pi)
3. Utiliza-se a frmula: h
Fi
Fac P POS
Li P
ant i
i
.
) (
,

+ =
onde:
Li = Limite inferior da classe do percentil
Fac,
ant
= Frequncia acumulada anterior classe do percentil
h = Amplitude do intervalo de classe
Fi = Frequncia absoluta simples da classe do percentil
n = Tamanho da amostra ou nmero de elementos
Exemplo 3.17:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos
matriculados em uma determinada disciplina. Calcule o percentil de ordem 23.
Escores Alunos (Fi) Fac
35 |- 45 5 5
45 |- 55 12 17
55 |- 65 18 35
65 |- 75 14 49
75 |- 85 6 55
85 |- 95 3 58
Total 58 -
Soluo:
1. 34 , 13 23 .
100
58
) 23 ( = = P Pos
2. Classe(P23) = 45 | 55
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

58

3. 95 , 51 95 , 6 45 10 .
12
5 34 , 13
45
23
= + =

+ = P
Interpretao: 23% dos alunos com os menores escores obtiveram pontuao
inferior a 51,95 pontos, ou ento, 77% dos alunos obtiveram escore maior que 51,95
pontos.
FRMULA GERAL DAS SEPARATRIZES
1 situao: Para dados no agrupados e dados agrupados sem intervalos de
classe, uma separatriz genrica S de ordem p determinvel pela seguinte frmula:
)
`

+
+
(

+
+
(

+
=
q
n p
X
q
n p
X x
q
n p
frac
q
n p
X Sp
) 1 (
int 1
) 1 (
int
) 1 ( ) 1 (
int

Onde:
X: qualquer elemento de um conjunto ordenado;
q
n p ) 1 ( +
: um ndice que indica a posio do elemento X no conjunto ordenado;
(

+
q
n p ) 1 (
int
: indica a parte inteira do ndice;
frac
(

+
q
n p ) 1 (
: indica a parte fracionria do ndice;
q: o nmero de parties do conjunto. qe N e q>1;
p: a ordem da separatriz 1< p q 1.
2 situao: Para dados agrupados com intervalos de classe, uma separatriz
genrica S determinvel pela seguinte frmula:
h
Fi
Fac S POS
Li S
ant i
.
) (
,

+ =
onde:
Li = Limite inferior da classe que contm a separatriz
POS(S
i
): posio da separatriz
Fac,
ant
= Frequncia acumulada anterior classe que contm a separatriz
h = Amplitude do intervalo de classe
Fi = Frequncia absoluta simples da classe que contm a separatriz
Exemplo 3.18:
Suponha o conjunto de tempo de servio (em anos) de quatro funcionrios: 1, 9,
13, 20. Determinar o terceiro quartil (Q
3
) deste conjunto de dados.
Soluo:
Dados em rol: 1, 9, 13, 20
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

59

Q
3
= ?, q = 4, p = 3, n = 4
(

+
q
n p ) 1 (
= 75 , 3
4
) 1 4 ( 3
=
(

+
(posio)
)
`

+
+
(

+
+
(

+
=
q
n p
X
q
n p
X x
q
n p
frac
q
n p
X Sp
) 1 (
int 1
) 1 (
int
) 1 ( ) 1 (
int

25 , 18 ) 7 ( 75 , 0 13 ] 13 20 [ 75 , 0 13
3
= + = + = x Q
Interpretao: 75% funcionrios tem tempo de servio menor ou igual a 18,25
anos e 25% dos funcionrios tem tempo de servio maior ou igual a 18,25 anos.
Exemplo 3.19:
Calcule o Primeiro quartil (Q
1
) do conjunto de dados abaixo:
2 - 5 - 8 - 5 - 5 - 10 - 1 - 12 - 12 - 11 - 13 - 15.
Soluo:
Primeiro, devemos ordenar os dados:
1- 2 - 5 - 5 - 5 - 8 - 10 - 11 - 12 - 12 - 13 15.
Assim,
Q
1
= ?, q = 4, p = 1, n = 12
(

+
q
n p ) 1 (
=
25 , 3
4
) 1 12 ( 1
=
(

+
(posio)
)
`

+
+
(

+
+
(

+
=
q
n p
X
q
n p
X x
q
n p
frac
q
n p
X Sp
) 1 (
int 1
) 1 (
int
) 1 ( ) 1 (
int

5 ] 5 5 .[ 25 , 0 5
1
= + = Q
Interpretao: 25% dos valores so menores ou igual a 5 e 75% dos valores so
maiores ou igual a 5.
Exemplo 3.20:
Calcule o Quarto Decil (D
4
) da srie:
Xi (Fi) Fac
2 1 1
5 4 5
6 3 8
8 2 10
Total 10 -
Soluo:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

60

D
4
= ?, q = 10, p = 4, n = 10
(

+
q
n p ) 1 (
=
40 , 4
10
) 1 10 ( 4
=
(

+
(posio)
)
`

+
+
(

+
+
(

+
=
q
n p
X
q
n p
X x
q
n p
frac
q
n p
X Sp
) 1 (
int 1
) 1 (
int
) 1 ( ) 1 (
int

5 ] 5 5 .[ 40 , 0 5
4
= + = D
Interpretao: 40% dos valores so menores ou igual a 5 e 60% dos valores so
maiores ou igual a 5.
Para finalizar este captulo, vamos observar no diagrama de caixa abaixo as
medidas de posio, incluindo as separatrizes que acabamos de ver:

Fonte: http://www.scielo.br/scielo.php?pid=S0103-84782008000500041&script=sci_arttext
(acesso em 11/01/2012)










SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

61

4 MEDIDAS DE VARIAO
4.1- INTRODUO
Nesta fase da descrio dos dados, uma anlise completa requer muito mais do
que a apresentao dos dados em tabelas ou grficos, e do clculo das medidas de
posio. No podemos apenas caracterizar um conjunto pela sua mdia, por exemplo,
pois os dados diferem entre si em maior ou menor grau.
As medidas de disperso ou de variabilidade indicam se os valores esto
relativamente prximos um dos outros, ou separados em torno de uma medida de
posio, geralmente, a mdia como falamos acima.
As medidas so representadas segundo a sua natureza, sendo divididas em
medidas de disperso ou de variabilidade absoluta e medidas de disperso ou de
variabilidade relativa. Consideraremos as seguintes medidas de disperso absoluta:
Amplitude total (AT), Amplitude semi-interquartlica (IQ), Desvio mdio (DM), Varincia
(2) e Desvio adro (). As medidas de disperso relativa consideradas so:
Coeficiente de Variao ou Coeficiente de Pearson (CVP) e Coeficiente de Variao ou
Coeficiente de Thorndike (CVT). Ainda sero vistas nessa unidade, medidas de
assimetria e de curtose, que so medidas complementares de disperso.
4.2. MEDIDAS DE DISPERSO ABSOLUTA
4.2.1. AMPLITUDE TOTAL (A
T
)
Como no caso das medidas de posio, temos trs situaes diferentes: dados
no agrupados, dados agrupados sem e com intervalo de classe.
1 SITUAO: Dados no agrupados
a diferena entre o maior e menor dos valores da srie, ou seja, a diferena
entre os extremos do conjunto de dados.
mn mx T
Xi Xi A =
A utilizao da amplitude total como medida de disperso muito restrita, pois
uma medida que depende apenas dos valores extremos, no sendo afetada pela
variabilidade interna dos valores da srie, sendo muito instvel.
A amplitude total tambm sensvel ao tamanho da amostra. Ao aumentar a
amostra, a A
T
tende a aumentar, ainda que no proporcionalmente. Tambm apresenta
grande variao de uma amostra para a outra, mesmo que ambas sejam extradas da
mesma populao.
O uso da amplitude total feito apenas em situaes em que ela se apresenta
satisfatria. Um exemplo de aplicao a amplitude da variao da temperatura em
um dia, um ano, ou num processo de resfriamento. Outras aplicaes so encontradas
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

62

quando os dados so raros ou esparsos, que no justificam o uso de uma medida mais
precisa.
Exemplo 4.1:
Sejam as duas series a seguir:
a) 1, 1, 1, 1, 1, 100
b) 1, 30, 32, 45, 75, 100
Ambas possuem A
T
= 100 1 = 99.
2 SITUAO: Dados agrupados em uma distribuio de frequncia por valores
simples
Como na situao anterior, a amplitude total a diferena entre o maior e menor
dos valores da srie.
mn mx T
Xi Xi A =

3 SITUAO: Dados agrupados em uma distribuio de frequncia por
intervalos de classe
a diferena entre o limite superior do ltimo intervalo de classe e o limite
inferior do primeiro intervalo de classe, ou seja:
mn mx T
Li Ls A =
4.2.2. DESVIO-MDIO
O desvio-mdio ou mdia dos desvios a mdia aritmtica dos valores
absolutos dos desvios tomados em relao a mdia ou a mediana. Sua vantagem
que leva em conta todos os elementos. Aqui apresentaremos as frmulas utilizando a
mdia.
1 SITUAO: Dados no agrupados
Sejam os elementos x
1
, x
2
, x
3
,...,x
n
de uma amostra, portanto n valores da
varivel X, com mdia igual a X . O desvio mdio da varivel aleatria de X ,
n
X Xi
D
n
i
m

=

=
1

onde n o nmero de elementos do conjunto.

Exemplo 4.2:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

63

Suponha o conjunto de tempo de servio de cinco funcionrios: 3, 7, 8, 10 e 11.
Determinar o desvio mdio deste conjunto de dados.
Soluo:
No exemplo 3.1 calculamos a mdia, 8 , 7 = X
24 , 2
5
2 , 11
5
) 8 , 7 11 ( ) 8 , 7 10 ( ) 8 , 7 8 ( ) 8 , 7 7 ( ) 8 , 7 3 (
1
= =
+ + + +
=

=
n
X Xi
D
n
i
m

Interpretao: em mdia, o tempo de servio deste grupo de funcionrios se
desviou em 2,24 anos em torno dos 7,8 anos de tempo mdio de servio.
2 SITUAO: Dados agrupados em uma distribuio de frequncia por valores
simples
Quando os dados estiverem agrupados numa distribuio de frequncia
usaremos o desvio mdio dos valores x
1
, x
2
, x
3
,...,x
n
, ponderados pelas respectivas
frequncias absolutas: F
1
, F
2
, F
3
, ... , F
n
, como no clculo da mdia aritmtica. Assim,
n
Fi X Xi
D
n
i
m
.
1

=

=
onde:
Fi = n = Frequncia absoluta total
Exemplo 4.3:
A tabela abaixo representa o nmero de peas de preciso defeituosas
desenvolvidas mensalmente pelo controle de qualidade. Calcule o desvio mdio.
Nmero de peas
com defeito (Xi)
Nmero de
meses (Fi)
,Xi- X , ,Xi- X ,.Fi
0 2 2,73 5,46
1 3 1,73 5,19
2 6 0,73 4,38
3 8 0,27 2,16
4 4 1,27 5,08
5 2 2,27 4,54
6 1 3,27 3,27
TOTAL 26 30,08
Soluo:
A mdia foi calculada no exemplo 3.2: 73 , 2 = X
O clculo do desvio mdio ser:
16 , 1
26
08 , 30
.
1
= =

=

=
n
Fi X Xi
D
n
i
m

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

64

Interpretao: em mdia, o nmero de peas defeituosas possui uma distncia
de 1,16 em torno das 2,73 peas defeituosas em mdia por ms.
3 SITUAO: Dados agrupados em uma distribuio de frequncia por classes
Quando os dados estiverem agrupados numa distribuio de frequncia
usaremos o desvio-mdio dos pontos mdios x
1
, x
2
, x
3
,...,x
n
de cada classe,
ponderados pelas respectivas frequncias absolutas: F
1
, F
2
, F
3
, ... , F
n
. Desta forma, o
clculo do desvio-mdio passa a ser igual ao da 2

situao. Assim,
n
Fi X Xi
D
n
i
m
.
1

=

=
, onde

=
=
=
n
i
i
n
i
i M
F
F P
X
1
1
.

Exemplo 4.4:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos
matriculados em uma determinada disciplina. Calcule o desvio mdio.
Escores Alunos (Fi) P
M
P
M
-X (P
M
X).
Fi
35 |- 45 5 40 22,24 111,20
45 |- 55 12 50 12,24 146,88
55 |- 65 18 60 2,24 40,32
65 |- 75 14 70 7,76 108,64
75 |- 85 6 80 17,76 106,56
85 |- 95 3 90 27,76 83,28
Total 58 596,88
Soluo:
A mdia foi calculada no exemplo 3.3: 24 , 62 = X
O clculo do desvio-mdio ser:
29 , 10
58
88 , 596
.
1
= =

=

=
n
Fi X Xi
D
n
i
m

Interpretao: Em mdia, a nota de cada aluno deste grupo teve um
distanciamento de 10,29 pontos em torno do desempenho mdio deste grupo de
alunos que foi de 62,24 pontos nesta disciplina.
4.2.3. VARINCIA E DESVIO PADRO
So as medidas de disperso mais usadas e conhecidas.
A varincia de um conjunto de dados a mdia dos quadrados dos desvios dos
valores a contar da mdia. A frmula da varincia poder ser calculada de duas
formas:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

65

A populacional: representada letra grega
2

A amostral: representada por s
2

1 SITUAO: Dados no agrupados
Sejam os elementos x
1
, x
2
, x
3
,...,x
n
, portanto n valores da varivel X, com mdia
igual a X . A varincia da varivel aleatria de X ,

( )
n
Xi
n
i

=

=
1
2
2

o ou
( )
1
1
2
2

=
n
X Xi
S
n
i


Obs: Para valores grandes da amostra (n>30), no h grande diferena entre os
resultados obtidos com n ou n-1, mas o mais comum utilizarmos n quando se trata de
populao e n-1 quando for amostra.
Exemplo 4.5:
Suponha o conjunto de tempo de servio de cinco funcionrios: 3, 7, 8, 10 e 11.
Determinar o desvio-padro deste conjunto de dados.
Soluo:
( )
2
2 2 2 2 2
1
2
2
7 , 9
4
8 , 38
1 5
) 8 , 7 11 ( ) 8 , 7 10 ( ) 8 , 7 8 ( ) 8 , 7 7 ( ) 8 , 7 3 (
1
anos
n
X Xi
S
n
i
= =

+ + + +
=

=

=

Interpretao: encontramos ento uma varincia para o tempo de servio de 9,7
anos
2
.
Para eliminarmos o quadrado da unidade de medida, extramos a raiz quadrada
do resultado da varincia, que chegamos a outra medida de disperso, chamada de
DESVIO PADRO:
A populacional: representada letra grega
2
o o =
A amostral: representada por
2
S S =
Portanto, o desvio-padro do exemplo foi de 3,11 anos. Ou seja, se calcularmos
um intervalo utilizando um desvio-padro em torno da mdia, encontraremos a
concentrao da maioria dos dados.

2 SITUAO: Dados agrupados em uma distribuio de frequncia por valores
simples
Quando os dados estiverem agrupados numa distribuio de frequncia
usaremos a varincia dos valores x
1
, x
2
, x
3
,...,x
n
, ponderados pelas respectivas
frequncias absolutas: F
1
, F
2
, F
3
, ... , F
n
. Assim, temos
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

66


n
Fi Xi
n
i

=

=
1
2
2
. ) (
o

n
Fi Xi
Fi xi
n
2
2 2
) . (
.
1

= o
ou
1
. ) (
1
2
2

=

=
n
Fi X Xi
S
n
i

n
Fi Xi
Fi xi
n
S
2
2 2
) . (
.
1
1

=
onde:
Fi = n = Frequncia absoluta total
Exemplo 4.6:
A tabela abaixo representa o nmero de peas de preciso defeituosas
desenvolvidas mensalmente pelo controle de qualidade. Calcule o desvio padro.
Nmero de peas
com defeito (Xi)
Nmero de
meses (Fi)
(Xi- X ) (Xi- X ).Fi
Xi.Fi Xi.Fi
0 2 7,45 14,91 0,00 0,00
1 3 2,99 8,98 3,00 3,00
2 6 0,53 3,20 12,00 24,00
3 8 0,07 0,58 24,00 72,00
4 4 1,61 6,45 16,00 64,00
5 2 5,15 10,31 10,00 50,00
6 1 10,69 10,69 6,00 36,00
TOTAL 26 55,12 71,00 249,00
Soluo:
2 1
2
2
20 , 2
1 26
12 , 55
1
. ) (
peas
n
Fi X Xi
S
n
i
=

=

=

peas S S 48 , 1 20 , 2
2
= = =
ou
2
2
2
2 2
20 , 2
26
71
249
1 26
1
) . (
.
1
1
peas
n
Fi Xi
Fi xi
n
S =
(


peas S S 48 , 1 20 , 2
2
= = =
Interpretao: Portanto, o desvio-padro do exemplo foi de 1,48 peas em torno
da mdia, ou seja, se calcularmos um intervalo utilizando um desvio-padro em torno
da mdia, encontraremos a concentrao da maioria das peas defeituosas por ms.
3 SITUAO: Dados agrupados em uma distribuio de frequncia por classes
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

67

Quando os dados estiverem agrupados numa distribuio de frequncia
usaremos a seguinte expresso:
2
2
2
2
.
. .
h
n
Fi di
n
Fi di
(
(

|
|
.
|

\
|
=

o
onde:
h
P P
di
Me M M

=

P
M Me
: ponto mdio da classe que contm mediana
P
M
: ponto mdio do intervalo de classe
di.Fi: somatrio do produto da frequncia absoluta pelo respectivo desvio
di
2
.Fi: somatrio do produto da frequncia absoluta pelo respectivo desvio ao
quadrado
h = Amplitude do intervalo de classe
n= Frequncia absoluta total
Obs: Alguns autores utilizam n - 1 no lugar de n, principalmente quando a
amostra pequena n < 30.
Exemplo 4.7:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos
matriculados em uma determinada disciplina. Como a mdia calculada no exemplo 3.3
62,24, clculo do desvio padro ser:
Escores Alunos (Fi) P
M
di di. Fi di
2
. Fi
35 |- 45 5 40 -2 -10 20
45 |- 55 12 50 -1 -12 12
55 |- 65 18 60 0 0 0
65 |- 75 14 70 1 14 14
75 |- 85 6 80 2 12 24
85 |- 95 3 90 3 9 27
Total 58 13 97
Como vimos anteriormente, a mediana est no intervalo de classe de 55 |- 65,
seu P
M
60, ento calculando o di para o primeiro intervalo temos:
2
10
60 40
=

=
h
P P
di
Me M M
, agora podemos completar e tabela e calcular a
varincia para em seguida o desvio padro:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

68

pontos h
n
Fi di
n
Fi di
98 , 161 10 .
58
13
58
97
.
. .
2
2
2
2
2
2
=
(
(

|
.
|

\
|
=
(
(

|
|
.
|

\
|
=

o

pontos 73 , 12 98 , 161
2
= = = o o
Interpretao: O desvio-padro do exemplo foi de 12,73 pontos. Ou seja, se
calcularmos um intervalo utilizando um desvio-padro em torno do escore mdio de
62,24 pontos, encontraremos a concentrao da maioria dos alunos dentro deste
intervalo de pontuao.
Sobre o desvio padro:
Podemos concluir que o desvio padro S a medida de disperso mais usada,
tendo padro em comum com o desvio mdio D
m
o fato de ambos serem considerados
os desvios com relao a mdia. A diferena est que no clculo do desvio padro S,
em lugar de serem considerados os valores absolutos dos desvios, calculamos os
quadrados desses. O desvio padro tambm se apresenta maior que o desvio mdio.
O valor do desvio padro S usualmente positivo. zero quando todos os
valores dos dados so iguais (o mesmo nmero). S nunca ser negativo. Maiores
valores de S indicam uma maior variao.
O valor do desvio padro pode crescer muito com a incluso de um ou mais
outliers (valores dos dados que esto muito longe dos demais).
As unidades do desvio padro S, como por exemplo, metros, polegadas,
minutos, libras, etc. so as mesmas unidades dos dados originais. Quando tivermos a
varincia, essas unidades estaro elevadas ao quadrado.
RELAES EMPRICAS ENTRE AS MEDIDAS DE DISPERSO
I) Regra prtica para a determinao do desvio padro de dados tpicos
Podemos usar uma aproximao para o desvio padro, visto que a amplitude
mede aproximadamente 4 desvios padres (= 4S), assim:
4
mn mx
Xi Xi
S

=

Quando as distribuies so fracamente assimtricas (pequeno enviesamento
da curva), podemos considerar tambm:
S D
m
5
4
=
e
S Dq
3
2
=


II) Regra prtica 68 95 99,7 ou Gaussiana
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

69

Essa regra s utilizvel quando o conjunto de dados apresenta histograma
simtrico e uma distribuio em forma aproximadamente de sino.
S X 1 : Cerca de 68% das observaes ficam a 1 desvio padro da mdia.
S X 2 : Cerca de 95% das observaes ficam a 1 desvio padro da mdia.
S X 3 : Cerca de 99,7% das observaes ficam a 1 desvio padro da mdia.

Figura 4.1: Regra emprica
Fonte: TRIOLA (2008)
4.3. MEDIDAS DE DISPERSO RELATIVA
A disperso relativa permite compararmos duas ou mais distribuies, mesmo
que estas se refiram a diferentes fenmenos e sejam expressas em unidade de
medidas distintas. Geralmente, as medidas de disperso relativas resultam de
comparao entre uma medida de disperso absoluta e uma medida de posio, sendo
seu resultado expresso em termos percentuais.
4.3.1. COEFICIENTE DE VARIAO DE PEARSON (CV)
O coeficiente de variao de Pearson a medida de disperso relativa mais
utilizada, sendo definida como a razo entre o desvio padro e a mdia:
100 .
X
CV
o
=
ou
100 .
X
S
CV =

se os dados so populacionais ou amostrais, no-negativos.
A partir do coeficiente de variao pode-se avaliar a homogeneidade do conjunto
de dados e, consequentemente, se a mdia uma boa medida para representar estes
dados.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

70

Uma desvantagem do coeficiente de variao que ele deixa de ser til quando
a mdia est prxima de zero. Uma mdia muito prxima de zero pode inflacionar o
CV. Por outro lado, quanto mais prximo de zero, mais homogneo o conjunto de
dados e mais representativa ser sua mdia.
Um coeficiente de variao superior a 50% sugere alta disperso o que indica
heterogeneidade dos dados. Quanto maior for este valor, menos representativa ser a
mdia. Neste caso, optamos pela mediana ou moda, no existindo uma regra prtica
para a escolha de uma destas medidas.
Exemplo 4.8:
Numa empresa o salrio mdio dos funcionrios do sexo masculino de R$
4.000,00, com um desvio padro de R$ 1.500,00, e os funcionrios do sexo feminino
em mdia de R$ 3.000,00, com um desvio padro de R$ 1.200,00.
Ento calculando o coeficiente de variao temos que:
Sexo masculino: % 50 , 37 100 .
4000
1500
100 . = = =
X
S
CV
Sexo feminino: % 00 , 40 100 .
3000
1200
100 . = = =
X
S
CV
Interpretao: Podemos concluir que o salrio das mulheres apresenta maior
disperso relativa que o dos homens.
Classificao da distribuio quanto disperso:
- Disperso baixa: CV 15%
- Disperso mdia: 15% < CV < 30%
- Disperso alta: CV 30%
4.4. MEDIDAS DE ASSIMETRIA
As medidas de assimetria e de curtose so as ltimas que temos para
completarmos o quadro de estatsticas descritivas, que proporcionam, juntamente com
as medidas de posio e de disperso, a descrio e compreenso completas da
distribuio de frequncia em estudo.
A medida de assimetria um indicador da forma da distribuio dos dados.
Quanto ao grau de deformao ou assimetria, podemos ter trs tipos de curvas de
frequncia:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

71


a) Curva assimtrica negativa

b) Curva simtrica

c) Curva assimtrica positiva
Figura 4.2 - Classificao quanto simetria
Uma distribuio classificada como:
- Assimtrica negativa: se mdia mediana moda ou As < 0. O lado mais longo
do polgono de frequncia (cauda da distribuio) est esquerda do centro;
- Assimtrica positiva: se moda mediana mdia ou As > 0. O lado mais longo
do polgono de frequncia est direita do centro;
- Simtrica: se mdia = mediana = moda ou As = 0.
O grau de assimetria de uma distribuio medido pelo coeficiente de
assimetria.
Mo Me X varivel
Fi
X varivel
Me
Mo

X Me Mo varivel
Fi
Fi
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

72

4.4.1. CRITRIO DE PEARSON
O coeficiente de assimetria de Pearson (As) definido para dados populacionais e
amostrais, respectivamente, como:
o
Mo
As

=
ou
S
Mo X
As

=

recomendvel no caso de distribuies unimodais ou
o
) ( 3 Me
As

= ou
S
Me X
As
) ( 3
=
no caso de distribuies plurimodais.
Classificao do coeficiente de Pearson:
As = 0: distribuio simtrica
0 < As < 1: distribuio assimtrica positiva fraca
As 1: distribuio assimtrica positiva forte
-1 < As < 0:distribuio assimtrica negativa fraca
As -1: distribuio assimtrica negativa forte
Fonte: TRIOLA (2008)
4.4.2. CRITRIO DE KELLEY
Aqui utilizamos os valores dos 10 e 90 percentis e da mediana. O valor da
assimetria varia entre 1.
10 90
90 10
2
P P
Me P P
As

+
=
4.4.3. CRITRIO DE BOWLLEY
Aqui utilizamos os valores dos 1 e 3 quartis e da mediana. O valor da
assimetria varia entre 1.
1 3
1 3
2
Q Q
Me Q Q
As

+
=

4.5. MEDIDAS DE CURTOSE
A medida de curtose o grau de achatamento ou de afilamento da distribuio,
ou seja, um indicador da forma desta distribuio.
A medida de curtose determinada pelo seu coeficiente de curtose k :
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

73

) ( 2
10 90
1 3
P P
Q Q
K

=

A curtose mais uma medida com a finalidade de complementar a
caracterizao da disperso em uma distribuio. Esta medida quantifica a
concentrao ou disperso dos valores de um conjunto de dados em relao s
medidas de tendncia central em uma distribuio de frequncias.
Uma distribuio classificada quanto ao grau de achatamento segundo a figura
abaixo:

Figura 4.3 - Classificao da distribuio quanto curtose.
- Leptocrtica: quando a distribuio apresenta uma curva de frequncia bastante
fechada, com os dados fortemente concentrados em torno de seu centro, K < 0,263;
- Mesocrtica: quando os dados esto razoavelmente concentrados em torno de
seu centro, K= 0,263;
- Platicrtica: quando a distribuio apresenta uma curva de frequncia mais
aberta, com os dados fracamente concentrados em torno de seu centro, K > 0,263.
Veremos depois que as distribuies simtricas e mesocrticas so distribuies
normais.

Exemplo 4.9:
Os dados da distribuio de frequncia abaixo representam os salrios
semanais de 27 funcionrios de um determinado setor uma empresa:


SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

74

Salrio (R$) Fi
230,00 2
250,00 4
320,00 6
360,00 8
420,00 4
430,00 2
540,00 1
TOTAL 27
Em relao aos salrios vamos calcular:
a) a mdia;
b) a moda;
c) a mediana;
d) a varincia;
e) o desvio padro;
f) o coeficiente de variao;
g) o coeficiente de assimetria e classificar a distribuio.
Soluo:














SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

75



























SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

76

V INTRODUO A PROBABILIDADE
5.1- INTRODUO
Aqui voc ser apresentado ao conceito bsico e interpretao de probabilidade
de um evento.
Probabilidade ou Possibilidade? A diferena entre as palavras possibilidade e
probabilidade que a probabilidade mede a possibilidade de em experimento aleatrio.
5.2. EXPERIMENTO
Um experimento qualquer processo que permite fazer observaes e que o
resultado est sujeito a incertezas.
Temos como exemplos: o lanamento de um dado para observar a face
vencedora; o comprimento e o peso; a seleo de um eleitor para indicar seu candidato
nas prximas eleies, o levantamento da resistncia de compresso em diversas
vigas metlicas, etc.
Os experimentos podem determinsticos ou aleatrios.
- Experimentos determinsticos: so aqueles cujos resultados so sempre os
mesmos, apesar de se repetirem vrias vezes em condies semelhantes. Por
exemplo, nascimento de um beb ( certo que haver o nascimento).
- Experimentos aleatrios: so aqueles cujos resultados no so sempre os
mesmos, apesar de se repetirem vrias vezes em condies semelhantes, ou ainda,
o experimento que a cada repetio impossvel prever, com absoluta certeza, qual o
resultado ser obtido, e, alm disso, a ocorrncia de um deles exclui a possibilidade de
ocorrncia dos demais (o que chamamos de eventos mutuamente exclusivos). Por
exemplo, o sexo do beb que nasceu (pode ser masculino ou feminino).
5.3. ESPAO AMOSTRAL
O espao amostral (S) de um experimento aleatrio (E) o conjunto de todos os
resultados possveis desse experimento.
Por exemplo, no lanamento de um dado honesto, temos: S = {1, 2, 3, 4, 5, 6}
5.4. EVENTO
Evento qualquer resultado possvel, obtido da realizao de um experimento
E, ou seja, evento qualquer subconjunto do espao amostral S. O evento
denominado simples se consistir em um nico resultado e composto se consistir em
mais de um resultado.
Quando o experimento realizado, um determinado evento A ocorre se o
resultado experimental estiver contido em A. Geralmente, ocorre exatamente um
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

77

evento simples, mas diversos eventos compostos tambm podem ocorrer
simultaneamente.
Seja, por exemplo, os eventos A, B e C:
A: observar face mpar no lanamento de um dado. A = {1, 3, 5}
B: observar face maior do que 4. B = {5, 6}
C: observar face par. C = {2, 4, 6}
D: observar face maior do que cinco. D = {6} (evento simples).
5.4.1. Tipos de eventos
- Evento Impossvel o evento igual ao conjunto vazio (C ou { }). A probabilidade
de ocorrer zero.
Exemplo: D: observar face maior do que 6. D = { }
- Evento certo o evento igual ao espao amostral S. A probabilidade de ocorrer
certa, ou seja, igual a 1.
Exemplo: E: observar face menor do que 7. E = {1, 2, 3, 4, 5, 6}
5.4.2. Operao com eventos
Usamos frequentemente diagramas para mostrar a relao entre conjuntos,
sendo estes diagramas tambm utilizados para descrever a relao entre os eventos.
So os chamados diagramas de Venn.
- Unio: A B o evento que ocorre se, e somente se, A ocorre ou B ocorre ou
ambos ocorrem simultaneamente.

- Interseco: A B o evento que ocorre se, e somente se, A e B ocorrem
simultaneamente.

Obs: se A B = C, ento A e B so ditos mutuamente exclusivos (excludentes)
ou disjuntos.

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

78

- Complementar: A o evento que ocorre se, e somente se, A no ocorrer.

5.5. APROXIMAO DA PROBABILIDADE PELA FREQUNCIA RELATIVA
Tambm chamada de probabilidade emprica, dada pelo nmero de vezes em
que ocorreu um determinado evento pelo nmero de vezes que o procedimento foi
repetido.
Por exemplo, ao tentarmos determinar a probabilidade de uma tachinha cair de
ponta para cima, devemos repetir o procedimento de jogar muitas vezes a tachinha e
depois achar a razo entre o nmero de vezes que ela caiu de ponta para cima e o
nmero de jogadas.
5.6. PROBABILIDADE CLSSICA (CONCEITO HISTRICO)
A probabilidade clssica se aplica a situaes em que os resultados que
compem o espao amostral tem a mesma possibilidade de ocorrerem, ou seja, os
eventos simples so considerados equiprovveis e o espao amostral finito.
Por exemplo, no lanamento de um dado a probabilidade de ocorrer face 2
igual a probabilidade de ocorrer qualquer outra face (1, 3, 4, 5 ou 6).
) (
) (
) (
S n
A n
A P =
5.7. PROBABILIDADE SUBJETIVA
Um exemplo quando os meteorologistas usam seus conhecimentos
especficos de condies do tempo para saber se ir chover no dia de amanh, ento
desenvolvem uma estimativa de probabilidade.
Notao para probabilidades:
- P representa a probabilidade
- A, B, C,representam eventos especficos
- P(A) representa a probabilidade de ocorrer o evento A
- n(A) o nmero de elementos de A,
- n(S) o nmero de elementos de S.
0 s P(A) s 1 ou 1 ) (
1
=

=
n
i
i
A P

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

79

5.8. TEOREMA DA SOMA
Seja S um espao amostral e A e B eventos de S. A probabilidade da unio
desses eventos dada por:
P(A B) = P(A) + P(B) P(A B)
Se A e B so eventos mutuamente exclusivos, ento: P(A B) = P(A) + P(B)
P(A B) ou P(A ou B) representa a probabilidade de que ocorra o evento A ou o
evento B (ou ocorram ambos) como um nico resultado de um experimento.
A palavra-chave para lembrar ou com adio.
Exemplo 5.1:
Se retirarmos uma carta de um baralho normal de 52 cartas, qual a
probabilidade de sair um s ou uma carta de ouros?
Soluo:



Exemplo 5.2:
Uma urna contm 4 bolas amarelas, 2 bolas brancas e 3 bolas vermelhas.
Retirando-se uma bola, calcular a probabilidade de ela ser amarela ou branca.
Soluo:



5.9. PROBABILIDADE DO COMPLEMENTAR DE UM EVENTO
Se A o complemento de um evento A, ento: P( A ) = 1 P(A)
Os eventos A e A tem que ser disjuntos, pois como falado, impossvel que o
evento e seu complementar ocorram ao mesmo tempo, assim:
P( A
) +
P(A) = 1 e P (A)= 1 P( A )
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

80

5.10. PROBABILIDADE CONDICIONAL
Uma probabilidade condicional a probabilidade de ocorrer um evento, dado
que um outro evento j ocorreu.
Seja A c S e B c S. A probabilidade condicional de A dado que B ocorreu (A/B)
definida como:
) (
) (
) / (
B P
B A P
B A P

= se P(B) = 0
Como tambm a probabilidade condicional de B dado que A ocorreu (B/A):
) (
) (
) / (
A P
A B P
A B P

= se P(A) = 0
Exemplo 5.3:
Duas cartas so selecionadas de um baralho comum, sem reposio. Qual a
probabilidade da segunda carta ser uma dama, dado que a primeira foi um rei?
Soluo:



Exemplo 5.4:
Lana-se um par de dados no viciados. Se a soma 6, qual a probabilidade de
ter ocorrido face 2 em um deles?
Soluo:
No lanamento de um par de dados temos 36 possibilidades, para que a soma
das faces seja 6, podemos ter 4 e 2 ou 2 e 4, ou seja, 2 em 36.
Se a soma 6, temos 5 possibilidades (1 e 5, 5 e 1, 2 e 4, 4 e 2, 3 e 3), em 36.



5.11. TEOREMA DO PRODUTO
Esta regra utilizada para encontrarmos a probabilidade de o evento A
acontecer em uma primeira prova e o evento B acontecer em uma segunda prova. Se o
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

81

resultado do primeiro evento A afeta a probabilidade do segundo evento B,
importante que ajustemos a probabilidade de B para refletir a ocorrncia de A.
P(A B) = P(A/B).P(B) ou P(A B) = P(B/A).P(A)
Podemos assim dizer que:
P(A
1
A
2
A
3
... A
n
) = P(A
1
).P(A
2
/A
1
).P(A
3
/A
2
A
1
)...
A palavra-chave para lembrar e com multiplicao.
Exemplo 5.5:
Num lote de 12 peas, 4 so defeituosas. Trs peas so retiradas
aleatoriamente, uma aps a outra. Encontre a probabilidade de todas essas 3 peas
serem no defeituosas.
Soluo:






5.12. EVENTOS INDEPENDENTES
Dois eventos A e B so ditos independentes caso a probabilidade de um no
influenciar a probabilidade de outro ocorrer ou no, ou seja, se a probabilidade de B
ocorrer igual probabilidade condicional de B dado A, tem-se:
P(B) = P(B/A)
Pelo Teorema do Produto tem-se:
P(A B) = P(B/A).P(A)
Substituindo P(B/A) por P(B)
P(A B) = P(B).P(A)
A equao acima usada como definio formal de independncia.
Obs: Se A e B so mutuamente exclusivos, ento A e B so dependentes, pois
se A ocorre, B no ocorre, isto , a ocorrncia de um evento condiciona a no-
ocorrncia do outro.


SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

82









Figura 5.1: Aplicando o teorema do produto.
Exemplo 5.6:
Jogamos uma moeda e um dado. Qual a probabilidade de sair cara e depois um
seis?
Soluo:



Exemplo 5.7:
Duas cartas so selecionadas de um baralho comum, sem reposio. Qual a
probabilidade de escolhermos um rei e da segunda carta ser uma dama?
Soluo:




5.13. PROCESSOS ESTOCSTICOS FINITOS E DIAGRAMAS DE RVORE
Um processo estocstico finito uma sequncia finita de experimentos, na qual
cada experimento tem um nmero finito de resultados. Esses processos podem ser
representados pelo diagrama da rvore e podemos aplicar a seguinte regra prtica: a
probabilidade de um ramo da rvore o produto das probabilidades que o compem,
as probabilidades entre ramos devem ser somadas quando convier, pois so eventos
mutuamente exclusivos.
Exemplo 5.8:
Incio
P(A B) teorema do produto
multiplica
A e B so independentes?
P(A B) = P(B/A).P(A)
P(A B) = P(B).P(A)
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

83

Vamos considerar trs caixas: A caixa I tem 10 lmpadas, das quais 4 so
defeituosas; a caixa II tem 6 lmpadas, das quais 1 defeituosa; e, a caixa III tem 8
lmpadas, das quais 3 so defeituosas. Selecionamos uma caixa aleatoriamente e
ento retiramos uma lmpada, tambm aleatoriamente. Qual a probabilidade da
lmpada ser defeituosa?
Soluo:
Fazendo o diagrama de rvore, temos






Onde, D: lmpadas defeituosas e P: lmpadas perfeitas.
314 , 0
8
3
.
3
1
6
1
.
3
1
10
4
.
3
1
) D ( P
) III / D ( P ). III ( P ) II / D ( P ). II ( P ) I / D ( P ). I ( P P(D)
) D III ( P ) D II ( P ) D I ( P P(D)
= + + =
+ + =
+ + =

5.14. TEOREMA DE BAYES
Sejam A
1
, A
2
, ..., A
n
uma partio de S e B um evento qualquer. Para qualquer
A
i
:
) / ( ). ( ... ) / ( ). ( ) / ( ). (
) / ( ). (
) / (
2 2 1 1 n n
i i
i
A B P A P A B P A P A B P A P
A B P A P
B A P
+ + +
=
Exemplo 5.9:
Suponhamos que a pergunta do exemplo 5.8 anterior fosse: Se uma lmpada for
selecionada ao acaso e for defeituosa, qual a probabilidade de ter vindo da caixa I?
Soluo:
D: 4/10
I
P: 6/10

D: 1/6
II
P: 5/6

D: 3/8
III
P: 5/8
1/3
1/3
1/3
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

84

424 , 0
314 , 0
133 , 0
8
3
.
3
1
6
1
.
3
1
10
4
.
3
1
10
4
.
3
1
) D / I ( P
) D ( P
) I / D ( P ). I ( P
) D ( P
) D I ( P
P(I/D)
= =
+ +
=
=

=

Exerccios:
Exemplo 5.10:
Considere a tabela a seguir, que mostra os resultados de um levantamento no
qual foi perguntado a 102 homens e 103 mulheres, trabalhadores, com idade entre 25 e
64 anos, se tinham poupado para emergncia pelo menos um ms de salrio.
(LARSON, 2007)
Homens Mulheres Total
Menos de um salrio mensal 47 59 106
Um salrio mensal ou mais 55 44 99
Total 102 103 205
a) Qual a probabilidade de um(a) trabalhador(a) selecionado(a) ao acaso, ter
poupado um ms ou mais para emergncia?
Soluo:

b) Dado que um trabalhador selecionado ao acaso homem, qual a
probabilidade dele ter poupado um ms ou menos?
Soluo:

c) Dado que um trabalhador poupou um ms ou mais, qual a probabilidade de se
tratar de uma mulher?
Soluo:

d) Os eventos de ter poupado um ms ou mais e de ser homem so
dependentes ou independentes? Explique.
Soluo:


SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

85

Exemplo 5.11:
Numa certa cidade 40% da populao tem cabelos castanhos, 25% tem olhos
castanhos e 15% tem olhos e cabelos castanhos. Uma pessoa da cidade selecionada
aleatoriamente.
a) Se ela tem cabelos castanhos, qual a probabilidade de ter tambm olhos
castanhos?
Soluo:


b) Se ela tem olhos castanhos, qual a probabilidade de no ter cabelos
castanhos?
Soluo:


c) Qual a probabilidade de no ter olhos nem cabelos castanhos?
Soluo:

Exemplo 5.12:
So dadas duas urnas. Uma urna A contm 5 bolas vermelhas, 3 brancas e 8
azuis. Uma urna B contm 3 bolas vermelhas e 5 brancas. Lanamos um dado no
viciado: se ocorrer 3 ou 6 uma bola escolhida de B, caso contrrio, uma bola
escolhida de A.
Para auxiliar na soluo vamos esquematizar o problema:




Qual a probabilidade de:
a) Uma bola vermelha ser escolhida?
Soluo:




V
A B
A
B V
B
4/6
2/6
8/16
5/8
3/8
3/16
5/16
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

86

b) Uma bola branca ser escolhida?

Soluo:
c) Uma bola azul ser escolhida?
Soluo:



Exemplo 5.13:
Uma urna contm 7 bolas gravadas com as letras A, A, A, C, C, R, R. Se
extrairmos as bolas uma por uma, qual a probabilidade de se obter a palavra
CARCARA?
Soluo:

Exemplo 5.14:
Uma urna A contm 5 bolas vermelhas e 3 brancas. Uma urna B contm 2 bolas
vermelhas e 6 brancas.
Vamos esquematizar:



a) Se uma bola retirada de cada urna, qual a probabilidade de ambas serem
da mesma cor?
Soluo:


b) Se duas bolas so retiradas de cada urna, qual a probabilidade de todas as 4
serem da mesma cor?
Soluo:



SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

87

Exemplo 5.15:
Em uma prova caram 2 problemas. Dos 60 alunos que realizaram a prova,
sabe-se que 37 alunos acertaram o primeiro problema, 40 acertaram o segundo e 25
acertaram ambos. Qual a probabilidade de que um aluno escolhido ao acaso tenha
acertado pelo menos 1 problema?
Soluo:


Exemplo 5.16:
Em uma fbrica de parafusos, as mquinas X, Y e Z produzem 25%, 35% e
40%, respectivamente. Da produo de cada mquina, 5%, 4% e 2%, respectivamente,
so parafusos defeituosos. Escolhemos ao acaso um parafuso. Se ele defeituoso,
qual a probabilidade de que tenha vindo da mquina Y?
Soluo:
Fazendo o diagrama de rvore, onde, D: parafusos defeituosos e P: parafusos
perfeitos, temos:








Exemplo 5.17:
Na seo de relaes pblicas de uma grande loja de departamentos, a
probabilidade de uma queixa de um consumidor se referir a mercadoria defeituosa
(MD) 0,65, a probabilidade de se referir a atraso na entrega (AE) 0,30, e a
probabilidade de se referir a erros de faturamento (EF) 0,05. As queixas sobre
mercadoria defeituosa tm 0,70 de probabilidade de serem resolvidas a contento, as
queixas sobre atraso na entrega tm 0,10 de probabilidade de ser resolvidas
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

88

satisfatoriamente, e as queixas sobre erros no faturamento tm 0,90 de probabilidade
de uma soluo satisfatria.
a) Determine a probabilidade de uma queixa ser resolvida satisfatoriamente;
b) Se uma queixa foi resolvida satisfatoriamente, ache a probabilidade de ela se
referir a erro de faturamento.
Soluo:
Fazendo o diagrama de rvore, e considerando R: queixa resolvida
satisfatoriamente e NR: queixa no resolvida satisfatoriamente.










Exemplo 5.18:
Um lote formado por 10 peas boas, 4 com defeitos e 2 com defeitos graves.
Uma pea escolhida ao acaso. Calcule a probabilidade de que:
a) Ela no tenha defeitos graves;
b) Ela no tenha defeitos;
c) Ela seja boa ou tenha defeitos graves.
Soluo:



SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

89





Exemplo 5.19:
Considere o mesmo lote do exemplo 5.18. Retiram-se duas peas ao acaso.
Calcule a probabilidade de que:
a) Ambas sejam perfeitas;
Soluo:


b) Nenhuma seja perfeita;


Soluo:


c) Nenhuma tenha defeitos graves;


Soluo:


d) Pelo menos uma seja perfeita.
Soluo:



Exemplo 5.20:
Uma moeda lanada trs vezes. Calcule a probabilidade de obtermos:
a) Trs caras;
b) Duas caras e uma coroa;
c) Uma cara somente;
d) Nenhuma cara;
e) Pelo menos uma cara.
Soluo:



SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

90










5.15 PRINCPIOS DA CONTAGEM
Os princpios da contagem podem ser utilizados para obtermos o nmero de
maneiras em que dois ou mais eventos podem ocorrer em sequncia. Podemos
tambm encontar o nmero de formas nas quais um grupo de objetos pode ser
arranjado em ordem, e ainda, podemos encontar o nmero de maneiras de escolher
vrios objetos e um grupo sem lervar em conta a ordem. Isso tudo com o intuito de
obtermos probabilidades.
Abaixo segue um quadro resumo com os princpios da contagem.

Princpio Descrio Frmulas
Princpio
fundamental da
contagem
Se um evento puder ocorrer em m maneiras e
um segundo evento em n maneiras, o nmero
de maneiras que os dois eventos podero
ocorrer em sequncia ser m.n.
m.n
Permutaes
O nmero de arranjos ordenados diferentes de
n objetos distintos.
n!
O nmero de permutaes de n objetos
distintos, tornando k a cada vez, em que k s n.
)! k n (
! n
P
k , n

=
O nmero de permutaes distiguveis de n
objetos, sendo n
1
de um tipo, n
2
de outro tipo e
assim por diante.
! n !... n !. n
! n
k 2 1

Combinaes O nmero de combinaes de k objetos
selecionados em um grupo de n objetos, sem
importar a ordem.
! k )! k n (
! n
C
k , n

=
Fonte: adaptado de LARSON, 2007


SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

91

VI VARIVEIS ALEATRIAS
6.1- INTRODUO
Considere S um espao amostral. Nem sempre os pontos amostrais de um
espao amostral so nmeros. Neste caso, necessrio definirmos uma funo que
associe ou transforme o espao amostral no numrico em espao amostral numrico.
A funo que faz essa associao o que chamamos de varivel aleatria.
A palavra aleatria indica que X determinado por uma possibilidade. As
variveis aleatrias podem ser discretas ou contnuas.
Se os possveis valores de X(S) for um conjunto finito (ou infinito numervel) ou
se os possveis valores de X(S) provm de uma contagem, isto , possam ser
enumerados, diremos que varivel aleatria discreta (VAD).
Se os possveis valores de X(S) podem assumir infinitos valores (infinito no
numervel), ou se os possveis valores de X(S) provm de uma medio, representada
por um intervalo sobre o eixo real, diremos que varivel aleatria contnua (VAC).
Vejamos agora os dois tipos de variveis aleatrias:
6.2. VARIVEL ALEATRIA DISCRETA
Vamos iniciar com um exemplo:
Exemplo 6.1:
Lanamento de duas moedas. Seja X: contar o nmero de caras que ocorrem,
onde, c = cara e k = coroa.
S = {(c, c), (c, k), (k, c), (k, k)}
X = {0, 1, 2}
O nmero de eventos que correspondem ocorrncia de nenhuma, uma ou
duas caras respectivamente dado pela seguinte associao:
X Evento
0 A
1
= {(k, k)}
1 A
2
= {(c, k), (k, c)}
2 A
3
= {(c, c)}
Podemos tambm associar as probabilidades de X assumir um dos valores, as
probabilidades dos eventos correspondentes:
P(X = 0) = P(A
1
) = 1/4
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

92

P(X = 1) = P(A
2
) = 2/4
P(X = 2) = P(A
3
) = 1/4
A cada valor de uma varivel aleatria discreta podemos atribuir uma
probabilidade. Ao enumerar cada valor da varivel aleatria com a sua probabilidade
correspondente, temos uma distribuio de probabilidade.
A distribuio de probabilidade da varivel aleatria X :
X P(X)
0 1/4
1 1/2
2 1/4
Assim temos:
- Definio 1: Uma varivel aleatria discreta uma funo que associa a cada
ponto amostral um nmero real.
- Definio 2: Uma distribuio discreta de probabilidade enumera cada valor que
a varivel aleatria pode assumir, ao lado de uma probabilidade. Uma distribuio de
probabilidade deve satisfazer as seguintes condies:

> 0 ) x ( p ) i (

= 1 ) x ( p ) ii (

6.2.1. Construo de uma distribuio discreta de probabilidade
Tenha em mente que x uma varivel aleatria discreta com os resultados
possveis x
1
, x
2
, ..., x
n
.
- Estabelea uma distribuio de frequncia para os resultados possveis.
- Obtenha a soma de todas as frequncias para os resultados possveis.
- Calcule a probabilidade de cada resultado possvel dividindo sua frequncia pela
soma das frequncias.
- Verifique se cada probabilidade est entre 0 e 1 e se sua soma 1.
6.2.2. Mdia ou valor esperado ou esperana matemtica
Dada uma varivel aleatria discreta X, com a funo de probabilidade p(x),
ento a mdia ou valor esperado de X, denotada por E(X) ou , definida por:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

93

) ( . ... ) ( . ) ( . ) ( . ) (
2 2 1 1
1
n n
n
i
i i
x p x x p x x p x x p x X E + + + = =

=

Exemplo 6.2:
Obtenha o nmero mdio de caras da distribuio de probabilidade para o
exemplo de lanamento de 2 moedas e contar o nmero de caras.
Soluo:
A distribuio de probabilidade do exemplo est descrita na tabela a seguir:
X P(X)
0 1/4
1 1/2
2 1/4
Assim, a mdia (esperana) da distribuio :
1
4
1
2
2
1
1
4
1
0 ) ( . ) (
2
0
= + + = =

=
x x x x p x X E
i
i i

Propriedades da mdia:
Sendo X uma varivel aleatria e k um nmero real, ento:
1) E(k) = k
2) E(k.X) = k . E(X)
3) E(X Y) = E(X) E(Y)
4) ( ) | | ( ) ( ) ( ) ( )
n 2 1 n 2 1
n
1 i
i
n
1 i
i
X E ... X E X E X ... X X E X E X E + + + = + + + = =
|
|
.
|

\
|

= =

5) E(aX bY) = a.E(X) b.E(Y)
6.2.3. Varincia
A medida de disperso ou espalhamento da distribuio da varivel aleatria X
ser dada por:
( ) ( ) ( )

=
= =
n
i
i x i
X E x p x X VAR
1
2 2
) ( . ) (
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

94

Notaes utilizadas: VAR(X), V(X), o
2
(X), o
2
.
Da definio de varincia possvel deduzir uma frmula mais fcil
operacionalmente de ser aplicada.
( ) ( )
2 2
) ( ) ( X E X E X VAR =

Onde: ( ) ( )

=
=
n
1 i
i
2
i
2
x p . x X E
O Desvio Padro dado por:
) (X VAR = o

Exemplo 6.3:
Obtenha a varincia e o desvio padro da distribuio de probabilidade para o
exemplo de lanamento de 2 moedas e contar o nmero de caras.
Soluo:
Lembramos que o valor da esperana (mdia) calculada no exemplo 6.2 foi de
E(X) = 1 e a distribuio de probabilidade encontra-se na tabela a seguir.
X P(X)
0 1/4
1 1/2
2 1/4
Precisamos calcular o valor de E(X
2
):
2
3
4
1
2
2
1
1
4
1
0 ) ( . ) (
2 2 2
2
0
2 2
= + + = =

=
x x x x p x X E
i
i i

Assim:
( ) ( ) ( )
2
1
1
2
3
) ( ) (
2 2 2
= = = X E X E X VAR

71 , 0
2
1
) ( = = = X VAR o

Propriedades da Varincia:
Sendo X uma varivel aleatria e k um nmero real ento:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

95

1) VAR(k) = 0
2) VAR(X + k) = VAR(X)
3) VAR(k.X) = k
2
.VAR(X)
4) VAR(aX + b) = a
2
.VAR(X)
5) Cov(X,Y) = E(XY) E(X).E(Y)
6) VAR(X Y) = VAR(X) + VAR(Y) 2.Cov(X, Y)
Exemplo 6.4:
O psiclogo de uma empresa ministrou um teste de personalidade para
determinar caractersticas passivas/agressivas em 150 funcionrios. Aos indivduos
foram atribudos valores de 1 a 5, em que 1 representava o extremo passivo e 5, o
extremo agressivo. Um escore de 3 indicava no haver nenhuma caracterstica
preponderante. Os resultados constam no quadro abaixo. Estabelea uma distribuio
de probabilidade para a varivel aleatria x, calcule a mdia, a varincia e o desvio
padro.
x fi
1 24
2 33
3 42
4 30
5 21
Soluo:









SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

96












6.3. VARIVEL ALEATRIA CONTNUA
A distribuio de probabilidade de uma varivel aleatria contnua dada por
uma curva contnua, essa curva ou funo matemtica f(x) chamada funo
densidade de probabilidade (f.d.p).
- Definio: Uma varivel aleatria X contnua em R se existir uma funo f(x),
tal que:
(i) f(x) > 0, para qualquer x
(ii)
}
9
=1 ). ( dx x f
, (a rea total da curva sempre igual a 1)
(iii)
}
= s s
b
a
dx x f b x a P ). ( ) (
- Interpretao grfica da probabilidade:

Figura 6.1: Probabilidade como rea sob a curva entre dois pontos
Podemos estender todas as definies de variveis aleatrias discretas para
variveis contnuas:
a b
P(a<X<b)
}
= s s
b
a
dx x f b x a P ). ( ) (

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

97

Esperana:
}
= =
R
dx ) x ( f . x ) x ( E

Varincia:
( ) { }
}
=
R
2
dx ) x ( f . X E x ) x ( VAR
ou { }
2 2
) X ( E ) X ( E ) X ( VAR =
onde
dx ) x ( f x ) X ( E
R
2 2
}
=

Exemplo 6.5:
Verificar se

+
=
0
3 x 2
) x ( f
2 x , 0 x
2 x 0
> s
s <
uma f.d.p.
Soluo:
Para que f(x) seja uma f.d.p. necessrio que
}
9
=1 dx ). x ( f . Assim,
( ) ( )
}
= + = + = +
2
0
2
0
2
10 6 4 3 3 2 x x dx x

Logo f(x) NO uma f.d.p.

6.4. VARIVEL ALEATRIA PADRONIZADA OU REDUZIDA
Seja X uma varivel aleatria com mdia () e desvio padro (), a varivel
resultante da operao:

X
z

=
dita varivel aleatria padronizada ou reduzida.

Propriedades de Z
- Mdia: ( ) ( ) ( ) ( ) ( ) | | ( ) 0

1
E X E

1
X E

1
X

1
E

X
E z E = = = =
(

=
(


=
- Varincia: ( ) ( ) ( ) 1

1
X VAR

1
X

1
VAR

X
VAR z VAR
2
2 2
= = =
(

=
(


=
- Z: N (0, 1)


SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

98

6.5. DISTRIBUIES DE PROBABILIDADE PARA VARIVEIS ALEATRIAS
DISCRETAS
6.5.1. DISTRIBUIO BINOMIAL
H muitos experimentos probabilsticos para os quais a concluso de cada
tentativa pode ser reduzida a dois resultados: sucesso ou fracasso. Quando um jogador
de basquete tente um lanamento livre, por exemplo, das duas, uma: ou ele faz a cesta
ou no. Experimentos probabilsticos como esse so chamados binomiais.
Um experimento binomial tem as seguintes caractersticas:
- So realizadas n tentativas independentes de um mesmo experimento aleatrio;
- Cada tentativa admite apenas dois resultados. Os resultados podem ser
classificados como um sucesso (p) ou um fracasso (q).
- A probabilidade p de sucesso em cada tentativa constante
Seja X: nmero de sucessos em n tentativas. A funo de probabilidade da
varivel X ser obtida pela relao:
k n k
k , n
q . p . C ) k X ( P

= = , com
( )! k n ! k
! n
C
k , n

=

Onde:
k: o nmero de sucessos
n: o nmero de tentativas ou observaes
p: probabilidade de sucesso em cada tentativa
q: probabilidade de fracasso em cada tentativa
A varivel X tem distribuio binomial, com parmetros n e p, e indicaremos pela
notao: X: B ( n, p).
Parmetros da Distribuio Binomial
- Mdia: E(X) = n.p
- Varincia: VAR(X) = n.p.q
Exemplo 6.6:
Os registros de uma empresa prestadora de servios indicam que 40% das
faturas por ela emitidas so pagas aps o vencimento. De 14 faturas expedidas,
determine:
a) a probabilidade de nenhuma ser paga aps o vencimento;
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

99

b) a probabilidade de no mximo duas serem pagas aps o vencimento;
c) a probabilidade de ao menos trs serem pagas aps o vencimento;
d) o valor esperado do nmero de faturas pagas aps o vencimento e o desvio
padro.
Soluo:
Seja X: nmero de faturas pagas aps o vencimento, ento:
a) P(X = 0) = ? temos que: p = 0,40; q = 0,60; k = 0
k n k
k , n
q . p . C ) k X ( P

= =

! k )! k n (
! n
C
k , n

=


00078 , 0 ) 0 X ( P
) 60 , 0 .( ) 40 , 0 .(
! 14
! 14
) 60 , 0 .( ) 40 , 0 .(
! 0 )! 0 14 (
! 14
) 60 , 0 .( ) 40 , 0 .( C ) 0 X ( P
14 0 14 0 0 14 0
0 , 14
= =
=

= = =



b)














SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

100

6.5.2. DISTRIBUIO DE POISSON
A distribuio de Poisson uma distribuio de probabilidade discreta muito
importante para descrever o comportamento de eventos raros, com a probabilidade do
nmero de ocorrncias num intervalo contnuo (tempo ou espao).
Por exemplo: nmero de defeitos por lote em determinado produto, nmero de
chamadas telefnicas em um certo minuto, usurios de internet que tentam entrar em
um certo site.
A unidade de medida (tempo ou espao) uma varivel contnua, mas a varivel
aleatria (nmero de ocorrncias) discreta. Alm disso, as falhas no so contveis,
por exemplo, no podemos determinar a probabilidade do nmero de carros que
deixaram de passar num cruzamento.
A funo de probabilidade da varivel X ser obtida pela relao:
! k
. e
) k X ( P
k
= = onde = .t
Onde:
= coeficiente de proporcionalidade
t = tempo ou espao
A distribuio de Poisson difere da distribuio binomial em dois aspectos
importantes:
i) A distribuio Binomial afetada pelo n e por p, enquanto que a distribuio
de Poisson afetada pela mdia ();
ii) Na distribuio Binomial os possveis valores da varivel aleatria x so 0, 1,
2, ..., n; enquanto que na distribuio de Poisson os possveis valores da varivel
aleatria x so 0, 1, 2, ... sem o limite superior.
Parmetros da Distribuio de Poisson
- Mdia: E(X) =
- Varincia: VAR(X) =
Exemplo 6.7:
As chamadas de emergncia chegam a uma delegacia de polcia a razo de 4
por hora em dias teis.

a) quantas chamadas de emergncia so esperadas num perodo de 30
minutos?
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

101

b) qual a probabilidade de nenhuma chamada num perodo de 30 minutos?
c) qual a probabilidade de ocorrer ao menos duas chamadas no mesmo
perodo?
Soluo:
X: nmero de chamadas e = 4/h










6.5.3. APROXIMAO DA DISTRIBUIO BINOMIAL PELA DISTRIBUIO DE
POISSON
Uma outra aplicao imediata deste modelo foi estudada por Poisson que
verificou o que acontecia com a funo Binomial, quando o nmero de repeties
crescia e p diminua e concluiu que:
( )
( )
! k
np . e
q . p . C lim
k
np
k n k
k , n
0 p
n


=

Onde:
n.p = a mdia de sucessos dentro do espao considerado.
Na distribuio Binomial quando n > 100 e n.p s 10 a distribuio de Poisson
pode ser utilizada como aproximao de probabilidades Binomiais.


SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

102

Exemplo 6.8:
A probabilidade de uma lmpada se queimar ao ser ligada 1/100. Numa
instalao com 100 lmpadas, qual a probabilidade de 2 lmpadas se queimarem ao
serem ligadas?
Soluo:
X: nmero de lmpadas que queimam ao serem ligadas
Pela distribuio Binomial: p = 0,01 e q = 0,99
184 , 0 ) 2 X ( P
) 99 , 0 .( ) 01 , 0 .(
! 2 )! 2 100 (
! 100
) 99 , 0 .( ) 01 , 0 .( C ) 2 X ( P
98 2 2 100 2
2 , 100
= =

= = =


Pela distribuio de Poisson:
1 01 , 0 . 100 p . n = = =

< 5 e n > 30, ok! Podemos aproximar por Poisson

! k
. e
) k X ( P
k
= =

184 , 0
! 2
1 . e
) 2 X ( P
2 1
= = =


As distribuies Binomial e Poisson so distribuies discretas de probabilidade.
Agora vamos ver uma distribuio contnua.

6.6. DISTRIBUIO NORMAL
uma das mais importantes distribuies de probabilidades (contnua), sendo
aplicada em inmeros fenmenos e constantemente utilizada para o desenvolvimento
terico da inferncia estatstica. tambm conhecida como distribuio de Gauss,
Laplace ou Laplace-Gauss.
Foi notado que diversas variveis contnuas possuam um comportamento
semelhante independente do experimento de que eram provenientes. Notou-se
tambm que em diversos experimentos, quando se usavam amostras grandes existia
tendncia do comportamento ser semelhante. Este comportamento era senoidal, numa
curva simtrica e mesocrtica.
O grfico da funo densidade de uma varivel normal tem a forma de um sino e
simtrico em relao mdia .
Notao: N (, o
2
).
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

103


Figura 6.2: Curva normal
Fixando-se a mdia, verificamos que o achatamento est diretamente ligado ao
valor de , ou seja,

Figura 6.3: Assimetria e curtose
Gauss estudando este comportamento chegou concluso que a equao
dessa curva seria:
2
2
1
2
1
) (
|
.
|

\
|

=
o

t o
X
e x p
para - < x <
Onde:
t = constante (3,1416...);
o = desvio padro da distribuio;
e = nmero neperiano (2,7183...);
= mdia da distribuio.



o
: mdia
o: desvio padro
x
f(x)
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

104

6.6.1. A CURVA NORMAL PADRO
Qualquer distribuio normal pode ser transformada em distribuio normal
padro. O artifcio consiste em transformar a varivel X em varivel Z, com mdia zero
e varincia um.
Notao: Z (0, 1).
o

=
X
Z

A funo normal padro ter funo:
2
2
1
2
1
) (
Z
e z p

=
t

As probabilidades da distribuio normal padronizada j esto em uma tabela,
no havendo necessidades de serem calculadas:
P( x
1
s x s x
2
) = P( z
1
s z s z
2
)
Caractersticas da curva normal e da curva normal padro:
- simtrica em relao mdia ;
- A curva normal se caracteriza por ter uma forma de sino;
- f(x) tem dois pontos de inflexo cujas abscissas valem + e - ou (z)
(curva normal padro) tem dois pontos de inflexo cujas abscissas valem -1 e +1.
- A rea total limitada pela curva e pelo eixo das abscissas 1 ou 100%;
- A curva assinttica em relao ao eixo dos x;
- Tem achatamento proporcional ao desvio padro o ou a varincia o
2
.

Figura 6.4: Curva normal e curva normal padro
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

105


Figura 6.5: Possveis escores de Z
6.6.2. USO DA TABELA DA CURVA NORMAL PADRO
Tabela da Distribuio Normal Padro

As entradas na tabela da curva normal so as probabilidades de uma varivel
aleatria, com distribuio normal padro, tomar um valor entre 0 e z, as probabilidades
so dadas pela rea da regio marcada na tabela abaixo.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

106


SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

107

A figura abaixo nos auxilia na interpretao das expresses mais comuns no
clculo de probabilidades utilizando a curva normal:

Figura 6.6: Clculo de probabilidades usando a curva normal
Exemplo 6.9:
1) Para cada item abaixo monte a curva normal, pinte a rea e encontre a
probabilidade.
a) P(0 < z < 1)
P = 0,3413

b) P(-2,25 < z < 1,2)





SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

108

c) P(z > 1,93)




d) z = 0 e z = 2,52






e) z = 1,02 e z = 3,2






f) z s -2,67





g) z > -1,53





SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

109

Exemplo 6.10:
As alturas dos alunos de determinada escola so normalmente distribudas com
mdia 1,60m e desvio padro de 0,30m. Encontre a probabilidade de um aluno medir:
a) Entre 1,50 e 1,80m
b) Mais de 1,75
c) Menos de 1,48
Soluo: Temos que a mdia = 1,60 e o desvio padro o = 0,30 e

x
z

=
a) P(1,50 s X s 1,80)
33 , 0
30 , 0
60 , 1 50 , 1
z
1
=

=

67 , 0
30 , 0
60 , 1 80 , 1
z
2
=

=
Obs: arredondamos o resultado de z para duas casas decimais para entrar na tabela.
Com os valores de z entramos na tabela e calculamos a probabilidade pedida:
P(1,50 s X s 1,80) = P(-0,33s z s 0,67) = 0,1293 + 0,2486 = 0,3779

b)












SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

110

6.6.3. APROXIMAO NORMAL PARA DISTRIBUIO BINOMIAL
Os casos em que o tamanho da amostra n > 30 o clculo pela distribuio
Binomial comea a ser trabalhoso, no entanto, atravs do Teorema do Limite Central
as distribuies de probabilidade tendem normal, quando aumenta o tamanho da
amostra, nesse caso necessrio adaptar uma distribuio discreta a uma contnua.
Teorema Central do Limite
Uma razo para a distribuio Normal ser considerada to importante porque
qualquer que seja a distribuio da varivel de interesse para grande amostras, a
distribuio das mdias amostrais sero aproximadamente normalmente distribudas, e
tendero a uma distribuio normal medida que o tamanho de amostra crescer.
Ento podemos ter uma varivel original com uma distribuio muito diferente da
Normal (pode at mesmo ser discreta), mas se tomarmos vrias amostras grandes
desta distribuio, e ento fizermos um histograma das mdias amostrais, a forma se
parecer como uma curva Normal.
A distribuio da mdia amostral X aproximadamente Normal com
mdia e desvio padro
n

, onde n o tamanho da amostra.


A aproximao para a normal melhora medida que o tamanho amostral cresce.
Este resultado conhecido como o Teorema Central do Limite e notvel porque nos
permite conduzir alguns procedimentos de inferncia sem qualquer conhecimento da
distribuio da populao.
Quando usar uma distribuio normal para aproximar uma probabilidade
binomial necessrio mover 0,5 unidades para esquerda e para direita de ponto mdio
a fim de incluir todos os valores possveis de x no intervalo.
Exemplo 6.11:
Consideremos o lanamento de 10 vezes uma moeda e vamos achar a
distribuio de probabilidade do evento cara:
xi 0 1 2 3 4 5 6 7 8 9 10
P(xi) 0,001 0,01 0,045 0,12 0,21 0,25 0,21 0,12 0,045 0,01 0,001
Determine: P(5 s x s 8)
Soluo:
Por Binomial: p= 0,5; q = 0,5; n =10
P(5 s x s 8) = P(x=5) + P(x=6) + P(x=7) + P(x=8)
P(x=5) = C
10,5
.(0,5)
5
.(0,5)
5
= 0,25
P(x=6) = C
10,6
.(0,5)
6
.(0,5)
4
= 0,21
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

111

P(x=7) = C
10,7
.(0,5)
7
.(0,5)
3
= 0,12
P(x=8) = C
10,5
.(0,5)
8
.(0,5)
2
= 0,045
P(5 s x s 8) = 0,25 + 0,21 + 0,12 + 0,045 = 0,625
Por aproximao
Grfico de f(x):

Para transformar a altura (que a probabilidade) da barra em rea, para ser
procurada na curva normal, construmos um retngulo de base unitria ao redor da
barra de modo que:
A = b. h = 1. h = h
Na curva Normal, corresponde determinar, para a probabilidade calculada
anteriormente, o clculo seguinte:
P(4,5 s x s 8,5) = ?
= n.p = 10.0,5 = 5 o = n.p.q = 10.0,5.0,5 = 2,5 o = 1,58
q . p . n
) p . n ( ' x

' x
z

=

=
32 , 0
58 , 1
5 5 , 4
z
1
=

= e 22 , 2
58 , 1
5 5 , 8
z
2
=

=

P(4,5 s x s 8,5) = 0,1255 + 04868 = 0,6123
Comparando os resultados pelos dois mtodos vemos que so aproximados.
0
0,05
0,1
0,15
0,2
0,25
0,3
0 5 10 15
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

112

No entanto, se obedecermos regra que n > 30 e n.p > 5, o resultado da
aproximao ainda melhor.
Vale a pena utilizar a aproximao pois dependendo do que quisermos calcular,
a distribuio binomial pode envolver muitos clculos e se tornar trabalhosa.
Exemplo 6.12:
Vamos fazer a correo para:
a) P(4 < x s 7) =
b) P(3 s x s 8) =
c) P(x > 2) =
d) P(x < 5) =
e) P(x = 4) =

Exemplo 6.13:
Sabe-se que 20% das peas produzidas por uma siderurgia so defeituosas.
Selecionam-se, ao acaso e com reposio, 100 peas da produo. Qual a
probabilidade de encontrarmos de 15 a 30 defeituosas?
Soluo:













SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

113

6.6.4. APROXIMAO NORMAL PARA DISTRIBUIO DE POISSON
Podemos fazer uso desta aproximao quando: = .t >10
A distribuio de Poisson pode ser aproximada pela curva normal, mas no
podemos esquecer-nos de fazer a correo de continuidade.
Exemplo 6.14:
O SAC de uma empresa recebe em mdia 6,1 chamadas por minuto. Qual a
probabilidade de chegarem de 700 a 750 chamadas em 2 horas?
Soluo:






















SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

114

7- TEORIA DA AMOSTRAGEM E DA DECISO
7.1- INTRODUO
A inferncia estatstica pode ser dividida em estimao de parmetros e em
teste de hipteses. importante destacarmos que sempre que uma estatstica seja
uma varivel aleatria, ela ter uma distribuio de probabilidades. Chamamos a
distribuio de probabilidades de uma estatstica de uma distribuio amostral.
Amostragem o processo de determinao de uma amostra a ser pesquisada.
Desta forma, a teoria da amostragem estuda as relaes existentes entre uma
populao e as amostras extradas dessa populao. til para avaliao de
grandezas desconhecidas da populao (como a mdia, a varincia, etc), ou para
determinar se as diferenas observadas entre duas amostras so devidas ao acaso ou
se so verdadeiramente significativas (Teste de Hipteses).
A diferena entre censo e amostragem, como vimos no captulo 1, que,
enquanto um censo envolve um exame a todos os elementos de um dado grupo, a
amostragem envolve um estudo de apenas uma parte dos elementos. A amostragem
consiste em selecionar parte de uma populao e observ-la com vista a estimar uma
ou mais caractersticas para a totalidade da populao.
7.2. AMOSTRAGEM ALEATRIA SIMPLES
o processo mais elementar e frequentemente utilizado. Esse tipo de
amostragem utiliza uma tcnica probabilstica. A caracterstica principal que todos os
elementos da populao tm igual probabilidade de pertencer amostra.
Na prtica a amostragem aleatria simples pode ser realizada numerando-se a
populao de 1 a N e sorteando-se, a seguir, por meio de um dispositivo aleatrio
qualquer, k nmeros dessa sequncia, os quais correspondero aos elementos
pertencentes amostra.
7.3. AMOSTRAS COM E SEM REPOSIO
Como vimos, se cada elemento da populao pode ser escolhido mais de uma
vez para participar de uma mesma amostra temos a chamada amostra com reposio.
Se cada elemento da populao puder ser escolhido apenas uma nica vez para
participar de uma mesma amostra, temos a chamada amostra sem reposio.
Na prtica, demonstrado que o uso de amostras sem reposio acarreta em
menores erros do que com amostras com reposio.

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

115

7.4. DISTRIBUIES AMOSTRAIS
Toda a varivel aleatria chamada de uma estatstica, logo uma estatstica
qualquer funo das observaes em uma amostra aleatria.
Consideremos todas as amostras possveis de tamanho n que podem ser
retiradas de uma populao de tamanho N (com ou sem reposio).
Para cada amostra podemos calcular uma grandeza estatstica, como a mdia, o
desvio padro etc., que varia de amostra para amostra. Com os valores obtidos para
determinada grandeza, podemos construir uma distribuio de probabilidades, que ser
denominada de distribuio amostral.
O quadro abaixo mostra as notaes mais utilizadas pra algumas medidas:
Medidas
Populao
(Parmetros)
Amostra
(Estatstica)
Tamanho N n
Mdia Aritmtica
x

Varincia o
2
s
2

Desvio Padro o s
7.5. DISTRIBUIO AMOSTRAL DAS MDIAS
Se os valores da mdia e do desvio padro de uma populao, de tamanho N,
forem respectivamente e o, e desta populao so retiradas todas as possveis
amostras de tamanho n, sendo n N, temos os valores da mdia e do desvio padro
da distribuio amostral das mdias dados por:
- Teorema 1:
A mdia da distribuio amostral das mdias, denotada por
x
igual mdia
populacional . Ou seja:

x
=

- Teorema 2:
Se a populao infinita ou se a amostragem com reposio, ento a
varincia (
2
x
) e o desvio-padro (
x
) da distribuio amostral das mdias so dados
por:
n

2
2
x
=
e
n

x
=

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

116

onde n o nmero de elementos da amostra.

- Teorema 3:
Se a distribuio finita ou se amostragem sem reposio, ento a varincia e
o desvio-padro da distribuio amostral das mdias so dados por:
|
.
|

\
|

o
= o
1 N
n N
.
n
2
2
x
e
1 N
n N
.
n
x

o
= o
onde
1 N
n N

representa o fator de correo para populao finita.



- Teorema 4 (Teorema do Limite Central):
Se a populao tem ou no distribuio normal com mdia e varincia o
2
,
ento a distribuio das mdias amostrais ser normalmente distribuda com mdia

x
= e varincia
n

2
2
x
= para populaes infinitas e |
.
|

\
|

o
= o
1 N
n N
.
n
2
2
x
para
populaes finitas. Alm disso, temos:
Varivel aleatria padronizada de x :
x
x

x
z

=
Validade do teorema do limite central:
n > 30, entretanto, em vrias situaes, dependendo da forma da distribuio da
populao, amostras com n < 30 so suficientes para garantir a validade da teoria
central do limite. O teorema central do limite muito utilizado na inferncia estatstica.
Obs: O fator de correo para populao finita pode ser omitido sempre que
n < 0,05 N.
A distribuio amostral das propores pode ser considerada como normal para
grandes valores (n 30). Neste caso, devemos subtrair ou acrescentar de P, uma
correo de continuidade para podermos utilizar a tabela da curva normal. A soma ou
subtrao de CC a P ocorre de forma a sempre aumentar a rea de probabilidade a ser
calculada.
Correo de continuidade (CC) :
n
5 , 0
n 2
1
CC = =



SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

117

7.6. DISTRIBUIO AMOSTRAL DAS PROPORES
Admita uma populao infinita distribuda binomialmente, onde p a
probabilidade de sucesso da populao e q a probabilidade de fracasso da populao
e p + q = 1.
Consideremos todas as possveis amostras de tamanho n retiradas de uma
populao de tamanho N, com reposio. Se para cada amostra calcularmos a
probabilidade de sucesso desta amostra
|
.
|

\
|
=
n
x
p onde x o nmero de sucessos da
amostra, obtemos desta maneira a distribuio amostral das propores:
P
P
=
n
pq

2
P
=
n
pq

P
=
ara n 30, a distribuio amostral de propores ser normal e
P
P

P
z

= .
Se a populao for finita ou se a amostragem for tomada sem reposio, os
valores acima passam a ser:
P
P
= |
.
|

\
|

=
1 N
n N
.
n
pq

2
P

1 N
n N
.
n
pq

=
7.7. ERRO PADRO
O desvio padro da distribuio amostral de uma grandeza estatstica
freqentemente denominado de seu erro padro.
Ento temos que
x
chamado de erro padro da mdia e
P
chamado de
erro padro da proporo.
7.8. DISTRIBUIO AMOSTRAL DAS DIFERENAS DAS MDIAS OU DAS
PROPORES
Considere duas populaes onde so retiradas amostras de tamanho n
1
e n
2
cujas mdias so 1 x e 2 x , respectivamente. Sendo as mdias e os desvios padres
das populaes
1
,
1
e
2
,
2
, respectivamente.
Na distribuio amostral das diferenas entre as mdias, temos:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

118

2 1
x x

2 1
=


2
2
2
1
2
1
x x
2
n

2 1
+ =
2
2
2
1
2
1
x x
n

2 1
+ =


( )
2 1
2 1
x x
x x
2 1

x x
z


=
Na distribuio amostral das diferenas entre as propores, temos:
2 1 P P
P P
2 1
=


2
2 2
1
1 1
P P
2
n
q . p
n
q . p

2 1
+ =
2
2 2
1
1 1
P P
n
q . p
n
q . p

2 1
+ =


( )
2 1
2 1
P P
P P 2 1

P P
z


=
Vamos ver agora alguns exemplos de aplicao.
Exemplo 7.1:
Considere a seguinte populao x = {2, 3, 4, 5}.
Podemos calcular a mdia, a varincia e o desvio-padro para a populao,
assim:
12 , 1 25 , 1
25 , 1
4
) 5 , 3 5 ( ) 5 , 3 4 ( ) 5 , 3 3 ( ) 5 , 3 2 (

5 , 3
4
5 4 3 2

4 N
2 2 2 2
2
= =
=
+ + +
=
=
+ + +
=
=


Exemplo 7.2:
A mdia das notas obtidas na disciplina de Estatstica num determinado curso de
graduao tem sido igual a 7,7 e a varincia igual a 1,96. Caso sejam extradas vrias
amostras de 49 alunos cada uma, do total de 586 que esto matriculados na disciplina,
determine o desvio padro da distribuio amostral das mdias, levando-se em conta
que a amostra foi efetuada:
a) com reposio;
b) sem reposio.
Soluo:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

119

a) Com reposio (populao finita): 2 , 0
49
96 , 1
n

x
= = =
b) Sem reposio (populao infinita)
n < 0,05 N?
49 < 0,05(586)?
49 > 29,3, logo necessita o fator de correo

1916 , 0
1 586
49 586
.
49
96 , 1
1 N
n N
.
n

x
=

=

Exemplo 7.3:
Numa prova de matemtica e fsica, constante de 80 questes, referente a um
vestibular simulado realizado no Rio de Janeiro, observou-se que a mdia de acertos
foi de 24,12 com desvio padro de 9,78. Dos 22102 vestibulandos que participaram da
prova, retirou-se aleatoriamente uma amostra de 200 concorrentes. Determinar:
a) a probabilidade de que a mdia dessa amostra se localize entre 25 e 26;
b) a probabilidade de que a mdia dessa amostra apresente um valor inferior a
22.
Soluo:
a) P(25s
x
s 26)?
Sem reposio n < 0,05N?
200 < 0,05 (22102)
200 < 1105,1 (podemos omitir o fator de correo)
6916 , 0
200
78 , 9
n

x
= = =

x
x

x
z

=
x
=


27 , 1
6916 , 0
12 , 24 25
z
1
=

= 72 , 2
6916 , 0
12 , 24 26
z
2
=

=
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

120

P(25s
x
s 26) = P(1,27s zs 1,72) = 04967 0,3980 = 0,0987

b)






Exemplo 7.4:
Verificou-se que 2% das ferramentas produzidas por uma certa mquina so
defeituosas. Qual a probabilidade de que numa remessa de 400 dessas ferramentas,
revelarem-se;
a) 3% ou mais defeituosas;
b) 2% ou menos defeituosas.
Soluo:
p=2% = 0,02; q = 0,98;
n = 400 > 30 (requer CC) 0125 , 0
400 . 2
1
n 2
1
CC = = =
02 , 0 p P
P
= = = 007 , 0
400
98 , 0 . 02 , 0
n
pq

P
= = =
a) P(P> 0,03)?
02875 , 0 00125 , 0 03 , 0 CC 03 , 0 P = = =


25 , 1
007 , 0
02 , 0 02875 , 0
z =

=

P(P> 0,03) = P(z > 1,25) = 0,5 0,3944 = 0,1056
b)
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

121















Exemplo 7.5:
Considere duas populaes: I - adultos do sexo masculino; II - adultos do sexo
feminino. Supondo que a proporo de pessoas com dificuldades na rea de
matemtica nessas duas populaes seja de 30% e 20%, respectivamente. Qual a
probabilidade de que numa dada amostra de 100 adultos de I e 120 adultos de II,
resultem num valor (
2 1
P P ) < 0,18?
Soluo:








SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

122





7.9. TEORIA DA DECISO
Em Inferncia Estatstica, a teoria da deciso significa tomar decises sobre
populaes, com base em informaes amostrais. Muitos problemas em engenharia
requerem que decidamos entre aceitar ou rejeitar uma afirmao sobre um parmetro.
A afirmao chamada de hiptese e o procedimento de tomada de deciso sobre a
hiptese chamado de teste de hipteses. Estas decises estatsticas ocorrem com
relao a qualidade de algum processo, igualdade de parmetros, igualdade ou
diferena de tratamentos, natureza da populao, etc.
7.10. HIPTESE ESTATSTICA
Podemos dizer que uma suposio quanto ao valor de um parmetro
populacional, ou quanto natureza da distribuio de probabilidade de uma varivel
populacional, de uma ou mais populaes.
7.11. TESTE DE HIPTESE
uma regra de deciso para aceitar ou rejeitar uma hiptese estatstica com
base nos elementos amostrais.
Como vimos, toda avaliao feita sobre um parmetro populacional, o qual no
possumos nenhuma informao, pode ser resultado do processo de estimao. Se j
possumos alguma informao, podemos test-la no sentido de aceit-la como
verdadeira ou rejeit-la.
Os Testes de Significncia ou testes de hipteses tem por finalidade, a partir da
elaborao de uma Hiptese Nula H
0
e de uma Hiptese Alternativa H
1
, verificar a
aceitabilidade ou no da informao, por isso conhecida como uma Regra de
Deciso.
O objetivo ento do teste de hipteses determinar se o parmetro variou.
- HIPTESE DE NULIDADE OU HIPTESE NULA (H
0
)
a hiptese estatstica a ser testada. O parmetro populacional a ser testado
chamado de referncia, por exemplo, se for a mdia, ser: .

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

123

- HIPTESE ALTERNATIVA (H
1
)
a hiptese complementar Hiptese de Nula, isto , aquela que ser aceita
como verdadeira, caso seja rejeitada a hiptese de nula.
7.12. TIPOS DE ERROS DE HIPTESE
Quando nos propomos a utilizar tal procedimento, devemos ter em mente que
estamos sujeitos a erros e acertos na deciso. De um modo geral, em qualquer tipo de
deciso, os acertos e os erros podem ser dispostos segundo o quadro a seguir:
Estado da natureza
Deciso H
0
verdadeira H
0
falsa
Aceitamos H
0
Deciso correta Erro tipo II
Rejeitamos H
0
Erro tipo I Deciso correta
- Erro Tipo I: Consiste em rejeitar H
0
quando H
0
verdadeira
- Erro Tipo II: Consiste em aceitar H
0
quando H
0
falsa
Nvel de Significncia do Teste: a probabilidade de se cometer o erro Tipo I, ou
seja, rejeitar uma hiptese verdadeira. O nvel de significncia ser denotado por .
A probabilidade do erro Tipo II no possui um nome em especial mais ser
conhecida como erro .
A fixao da hiptese alternativa que diferencia os vrios tipos de Teste.
Por exemplo, vamos considerar julgar a responsabilidade de um funcionrio pela
ocorrncia de um acidente do trabalho.
Estado da natureza
Deciso No Responsvel Responsvel
No Responsvel Deciso correta Erro tipo II
Responsvel Erro tipo I Deciso correta
O erro Tipo I, no caso, seria julgar o funcionrio como responsvel, quando na
verdade ele no responsvel.
O erro Tipo II, seria julgar o funcionrio como no responsvel, quando na
verdade ele responsvel.

7.13. TIPOS DE TESTES
Estudaremos testes de hipteses com uma hiptese nula (H
0
) e uma hiptese
alternativa (H
1
). A partir da formulao de H
0
e H
1
, podemos definir o tipo do teste a ser
utilizado.
Consideremos u o parmetro estudado e u
0
o valor inicialmente suposto para u.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

124

Seja: AR: rea de rejeio (crtica);
AA: rea de aceitao;
Za ou Z
t
: estatstica do teste (calculada por ns).
As hipteses formuladas podem ser dos seguintes tipos:
7.13.1. TESTE BILATERAL
A rea crtica est nas duas regies extremas (caudas) sob a curva.
H
0
: u = u
0

H
1
: u u
0

Uma vez que a hiptese nula (H
0
) determina se o parmetro analisado ou no
igual, a hiptese alternativa (H
1
) especifica valores que poderiam ser maiores ou
menores que o valor do parmetro analisado.

Em testes bilaterais o nvel de significncia o dividido igualmente entre as duas
caudas que constituem a regio crtica. Por exemplo,um teste bilateral com o nvel de
significncia igual a 5% (o = 0,05), h uma rea de 0,025 em cada uma das caudas.
7.13.2. TESTE UNILATERAL DIREITA
A rea crtica est na regio extrema (cauda) direita sob a curva.
H
0
: u = u
0
(ou H
0
: u s u
0
)
H
1
: u > u
0
Uma vez que a hiptese nula (H
0
) determina se o parmetro analisado menor
ou igual (ou simplesmente igual), a hiptese alternativa (H
1
) especifica valores que so
maiores que o valor do parmetro analisado.

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

125

7.13.3. TESTE UNILATERAL ESQUERDA
A rea crtica est na regio extrema (cauda) esquerda sob a curva.
H
0
: u = u
0
(ou H
0
: u > u
0
)
H1: u < u
0
Uma vez que a hiptese nula (H
0
) determina se o parmetro analisado maior
ou igual (ou simplesmente igual), a hiptese alternativa (H
1
) especifica valores que so
menores que o valor do parmetro analisado.

A tabela abaixo apresenta os valores crticos de Z para testes unilaterais e
bilaterais, em vrios nveis de significncia. Os valores Z para outros nveis de
significncia so determinados mediante o emprego das tabelas das reas da curva
normal.
Nvel de significncia o 0,10 0,05 0,01 0,005 0,002
Valores crticos de Z para testes
unilaterais
-1,28
ou 1,28
-1,65 ou
1,65
-2,33
ou 2,33
-2,58
ou 2,58
-2,88
ou 2,88
Valores crticos de Z para testes
bilaterais
-1,65 e
1,65
-1,96 e
1,96
-2,58 e
2,58
-2,81 e
2,81
-3,08 e
3,08
7.14. ETAPAS DE UM TESTE DE HIPOTESES
1. Identifique o parmetro de interesse, a partir do contexto do problema;
2. Estabelea a hiptese nula H
0
;
3. Especifique a hiptese alternativa apropriada H
1
(ateno, pois H
1
define o
tipo de teste a ser empregado);
4. Especifique o nvel de significncia para o teste, por exemplo, o 1% ou 5%;
5. Selecione o teste estatstico ou Z amostral (Za ou Zt (do teste)), que ser
usada para decidir rejeitar ou no a hiptese nula, ou seja, estabelecer o(s) valor(es)
crtico(s) e Identifique qual o valor da Estatstica de Teste necessrio para rejeitar H
0
.
(valor tabelado);
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

126

6. Calcule o estimador e verificar se est na regio de aceitao ou na regio de
rejeio da hiptese H0. Por exemplo:
S
S
a

S
Z

= , o valor de S pode ser: x , P ,
( ) 2 1 x x , ( )
2 1
P P
;

7. Tomada de deciso: O valor observado da medida estatstica da amostra
comparado com o(s) valor(es) crtico(s) estabelecido para o teste estatstico;
8. Decida se H
0
deve ou no ser rejeitada e reporte isso no contexto do
problema:
- Se o estimador estiver na rea de aceitao, aceita-se H
0
;
- Se o estimador estiver na rea de rejeio, rejeita-se H
0
;
Assim, agora podem ser emitidas as concluses.
7.15. TESTE DE HIPOTESES PARA MDIAS
x x
0
x
x
a
s ou
x

x
Z

=

=
7.16. TESTE DE HIPOTESES PARA PROPORES
p
0
a

p P
Z

= onde
n
x
P = e
n
) p 1 ( p

0 0
p

=
x: nmero de elementos da amostra que possuem caractersticas de interesse;
n: tamanho da amostra
7.17. TESTE DE HIPOTESES PARA A DIFERENA DAS MDIAS
( )
2 1
2 1
x x
x x
2 1
a

x x
Z


=
( )
2 1 x x
2 1
a

x x
Z

=
Neste caso, H
0
:
1
=
2
.
7.18. TESTE DE HIPOTESES PARA A DIFERENA DAS PROPORES
Como o valor de p
1
e p
2
so desconhecidos, devemos substituir por suas
estimativas. Mas H
0
: p
1
= p
2
, suas estimativas devem ser iguais. Desta forma, tomamos
para as suas estimativas a mdia aritmtica entre P
1
e P
2
, logo:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

127

2
P P
p
2 1
^
+
= ou
2 1
2 2 1 1
^
n n
P . n P . n
p
+
+
= ou
2 1
2 1
^
n n
x x
p
+
+
= e
|
|
.
|

\
|
+
|
.
|

\
|
=
2 1
^ ^
P P
^
n
1
n
1
. p 1 . p
2 1

( )
2 1
2 1
P P
^
P P 2 1
a

P P
Z


=
( )
2 1
P P
^
2 1
a

P P
Z

=
Exemplo 7.6:
Uma amostra aleatria de 40 elementos retirados de uma populao normal com
desvio padro igual a 3 apresentou um valor mdio igual a 60. Teste, ao nvel de
significncia de 5%, a hiptese de que a mdia populacional seja igual a 59, supondo a
hiptese alternativa >59.
Soluo:










Exemplo 7.7:
Uma amostra aleatria de 20 elementos selecionados de uma populao normal
com varincia 3 apresentou mdia 53. Teste ao nvel de significncia de 5% a hiptese
de que = 50.
Soluo:

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

128












Exemplo 7.8:
Em um estudo de eficincia do air bag em automveis, constatou-se que em 821
colises de carros equipados com airbag, 46 colises resultaram em hospitalizao do
motorista. Ao nvel de significncia de 0,01, teste a afirmao de que a taxa de
hospitalizao nos casos de acidentes com carros com airbag inferior a taxa de 7,8%
para colises de carros equipados somente com cinto se segurana.
Soluo:









SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

129





Exemplo 7.9:
Ao nvel de 0,01 de significncia, teste a afirmao de que as latas de 0,0109 in
(polegadas) de espessura tem carga axial mdia inferior a das latas de 0,0111 in de
espessura. As estatsticas resumo esto no quadro abaixo:

Soluo:














SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

130

8 ANLISE DE REGRESSO E CORRELAO
8.1- INTRODUO
A anlise de regresso e correlao um estudo da relao de uma
determinada varivel (dependente) em funo de outra ou de outras variveis
(independente). Por exemplo:
A = {propaganda; vendas de um produto; preo}
B= {resistncia de um concreto e relao gua/cimento}
C = {investimento em segurana e reduo do numero de acidentes}
De maneira geral, queremos encontrar alguma forma de medir a relao entre as
variveis de cada conjunto, de tal modo que essa medida possa mostrar:
- Se h relao entre as variveis e, caso exista, se fraca ou forte;
- Se essa relao existir, como obter a equao que relacione essas variveis;
- Aps obtida a equao, ela poder ser usada para fins de predio.
Suponhamos que y seja uma varivel que nos interessa estudar e prever seu
comportamento. de se esperar que os valores da varivel (dependente) sofram
influncia dos valores de um nmero finito de variveis: x
1
, x
2
,...., x
k
(independentes) e
que exista uma funo f que expresse essa dependncia. Esta funo f pode ser linear,
polinomial, exponencial, logartmica, etc.
8.2. DIAGRAMA DE DISPERSO
um grfico que nos fornece o tipo de relao existente entre as variveis x e y,
isto , mostra se a relao linear ou no-linear.
Aps determinado o tipo de relao e traado o grfico, o prximo passo
determinar uma equao da reta que represente essa relao. A reta obtida chamada
de reta de regresso, e sua equao a equao de regresso.

Figura 8.1: Diagrama de Disperso e reta de regresso
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

131

Os diagramas da Figura 8.2 mostram alguns tipos de correlao.

Figura 8.2: Tipos de correlao
Fonte: LARSON (2008)
Definies:
Dado um conjunto de dados amostrais emparelhados, podemos determinar a
equao de regresso. Esta equao descreve a relao entre as variveis e
determinada por:
bx a y
^
+ =
onde: a: o coeficiente linear da reta (onde a reta intercepta o eixo das ordenadas);
b: o coeficiente angular da reta.
O grfico da equao a melhor reta ajustada, tambm chamada de reta de
mnimos quadrados.
8.3. ESTIMAO DOS PARMETROS
Consideremos uma amostra de n pares (x
i
, y
i
) com i = 1, 2, 3,..., n. Para um
dado x
i
, existe uma diferena di entre o valor y
i
observado e o seu correspondente
^
y ,
dado pela reta estimada. Os valores de di so os erros ou desvios, dados por:
^
i i
y y d = ou ( ) bx a y d
i i
+ =
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

132

O Mtodo dos Mnimos Quadrados um mtodo pelo qual determinamos os
valores de a e b, de tal forma que a soma dos desvios ao quadrado seja mnima, ou
seja,
= + + +
2
n
2
2
2
1
d ... d d mnima =

2
i
d mnima
Como
^
i i
y y d = ento:
( ) | | ( )

+ + + = + =
2
i
2
i
2
i i i
2
i
2
i i
2
i
x b abx 2 a y bx 2 ay 2 y bx a y d
Por convenincia, vamos abandonar os ndices das variveis x e y.
Derivando dj
2
em relao aos coeficientes a e b temos:
( )

=
=
+ + =
c
c
n
1 i
n
1 i
2
i
bx 2 a 2 y 2
a
d
(I)
( )

=
=
+ + =
c
c
n
1 i
2
n
1 i
2
i
bx 2 ax 2 xy 2
b
d
(II)
O dj
2
ser um mnimo se as derivadas parciais em relao a a e b forem nulas.
Portanto, a equao (I) dada por:
( ) 0 bx 2 a 2 y 2
n
1 i
= + +

=

0 x b na y = + +



+ = x b na y
(III)
Da equao (II) tem-se
( ) 0 bx 2 ax 2 xy 2
n
1 i
2
= + +

=

0 x b x a xy
2
= + +



+ =
2
x b x a xy (IV)
As equaes (III) e (IV) so as equaes normais para a determinao de a e b.
Dividindo todos os termos da equao (III) por n, tem-se:
n
x b
n
na
n
y

+ = (V)
onde
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

133

y
n
y
=

e
x
n
x
=

(VI)
Substituindo-se (VI) na equao (V) encontra-se:
x . b
n
na
y + =

x . b y a =
(VII)
Substituindo o valor de a na equao (IV), tem-se:
( )

+ =
2
x b x x . b y xy

+
|
|
.
|

\
|
=
2
x b x
n
x b
n
y
xy
( )( ) ( )

+ =
2
2
x b
n
x b
n
y x
xy
( )( ) ( )
(
(

+ =

n
x
x b
n
y x
xy
2
2

( )( )
( )
n
x
x
n
y x
xy
b
2
2

= (VIII)
Substituindo o numerador da equao (VIII) por ( )( ) | |

= y y . x x SS
xy
e o
denominador por ( )

=
2
x
x x SS temos que:
( )( ) | |
( )


= =
2
x
xy
x x
y y . x x
SS
SS
b e x . b y a =
Exemplo 8.1:
Determinar a reta de mnimos quadrados com os dados da tabela 1, sendo:
x: Despesas com propaganda (milhes de reais)
y: Vendas de um produto (milhares de unidades)

Tabela 1: Dados do exemplo
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

134




Figura 8.3: Diagrama de Disperso para dos dados da tabela 1
Calculamos agora os coeficientes a e b da equao de regresso. Para isso,
temos que calcular os valores mdios de x e y para construirmos a tabela 2:
82 , 7
11
86
n
x
x = = =

e 45 , 195
11
2150
n
y
y = = =











SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

135

Tabela 2:

Podemos ento calcular os coeficientes a e b.
( )( ) | |
( )
691 , 13
6 , 197
9 , 2705
x x
y y . x x
SS
SS
b
2
x
xy
= =


= =

e
413 , 88 82 , 7 . 69 , 13 45 , 195 x . b y a = = =
Assim, a equao da reta de mnimos quadrados :
x 691 , 13 413 , 88 y bx a y
^ ^
+ = + =

Figura 8.4: Ajuste dos dados da Tabela 1: Regresso linear




SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

136

8.4. REGRESSES QUE SE TORNAM LINEARES POR TRANSFORMAO
H vrias funes que, por simples transformaes, se tornam lineares, e cujos
parmetros podem ser estimados pelas frmulas anteriores. Mostraremos alguns tipos
de transformaes mais usados para linearizar a relao entre as variveis. Assim:
I) Funo Exponencial
A linearizao da funo exponencial obtida aplicando-se a ela a definio e
as propriedades dos logaritmos. Algebricamente, temos:
Funo Exponencial:
x
ab y =
Aplicando logaritmo a ambos os termos da igualdade, temos:
x
ab log y log =
Da, considerando as propriedades dos logaritmos, tem-se:
x
b log a log y log + = => b log . x a log y log + =
Fazendo log y = Y, log a = A e log b = B, resulta: Y = A + B x.
Os processos lineares fornecem A e B. Para obterem-se os valores das
constantes originalmente procuradas, devemos fazer: a = 10A e b = 10B.
Exemplo 8.2:
Determinar a equao da funo exponencial que melhor aproxima os dados da
Tabela 1:
Soluo:
Devemos calcular os coeficientes a e b da equao
x
ab y = .
Precisamos inicialmente substituir a coluna dos valores de y por Y = log y. A
seguir, calculamos os coeficientes A e B como foi calculado para a reta dos mnimos
quadrados.
Calculados ento os coeficientes A e B, podemos calcular a e b da equao
x
ab y = fazendo
A
10 a = e
B
10 b = .
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

137


Calculamos agora os coeficientes A e B.
82 , 7
11
86
n
x
x = = =

e 2691 , 2
11
96 , 24
n
y
y = = =


( )( ) | |
( )
0307 , 0
64 , 197
07 , 6
x x
y y . x x
SS
SS
B
2
x
xy
= =


= =

e
0289 , 2 82 , 7 . 0307 , 0 2691 , 2 x . B y A = = =

Assim temos:
87 , 106 10 10 a
0289 , 2 A
= = = e 0732 , 1 10 10 b
0307 , 0 B
= = = .
Logo, a equao exponencial :
x x
0732 , 1 . 87 , 106 ab y = = que pode ser escrita da forma:
x 0708 , 0 cx
e . 88 , 106 ae y = =

A Figura 8.5 apresenta a aproximao da funo exponencial para os dados da
Tabela 1.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

138


Figura 8.5: Ajuste dos dados da tabela 1 - Regresso no linear

II) Funo Potncia (funo geomtrica)
A linearizao da funo geomtrica idntica exponencial; consiste
basicamente na aplicao da definio e propriedades dos logaritmos.
Funo Potncia:
b
ax y =
Podemos aplicar a definio de logaritmo aos dois lados da equao, assim:
b
ax log y log = , da usando as propriedades dos logaritmos, temos:
b
x log a log y log + = => x log . b a log y log + =
Fazendo log y = Y, log a = A e log x = X, resulta: Y = A + b X.
Aqui, os processos linearizados fornecem A e b. Para se obter o valor de a
originalmente procurado, devemos fazer: a = 10A.
6.5. CLCULO DA ESTIMATIVA DA VARINCIA OU DESVIO PADRO
O erro padro de estimativa s uma medida de quanto os pontos amostrais se
afastam da reta de regresso (isto , uma medida da disperso dos pontos amostrais
em torno da reta de regresso).
- Quanto menor valor de s os pontos esto mais prximos da reta de regresso;
- Quanto maior valor de s os pontos esto mais afastados da reta.
A frmula geral para a estimativa da varincia dada por:
2 n
SS
s
e 2

=
, onde
xy y e
SS . b SS SS =

SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

139

( )


=
n
y
y SS
2
2
y
ou
( )

=
2
y
y y SS
e
( )( )
n
y x
xy SS
xy

=
ou
( )( ) | |

= y y . x x SS
xy

A frmula geral para a estimativa do desvio padro dada por:
2
s s =
Ou ainda por
2 n
y y
s
2
i
^
i

|
.
|

\
|

=

onde
i i
^
bx a y + =
8.6. DISTRIBUIO t DE STUDENT
ara casos de grandes amostras (n 30), podemos aplicar o teorema do limite
central para concluir que as mdias amostrais se distribuem normalmente,
independente da distribuio da populao original. Porm, no podemos utilizar este
teorema quando as amostras so pequenas. Neste caso, deve-se utilizar a distribuio
t de Student.
As condies para usar a Distribuio t de Student so as seguintes:
- A amostra pequena (n < 30);
- O desvio padro (o) desconhecido;
- A populao original tem distribuio essencialmente normal.
Considerando amostras de tamanho n, retiradas de uma populao normal de
mdia , e se para cada amostra, calcularmos o valor de:
x
x
s
x
t

=
obtemos uma distribuio amostral de t. Essa distribuio dada por:
2
1
2
0
2
n
2
0

t
1
y
1 n
t
1
y
y
+
|
|
.
|

\
|
+
=
|
|
.
|

\
|

+
=
onde y
0
uma constante que depende de n, de modo que a rea subentendida pela
curva 1, e esta curva distribui-se simetricamente com relao a mdia zero.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

140

A constante = (n - 1) denominada nmero de graus de liberdade, definida
como o nmero de observaes independentes da amostra menos o nmero dos
parmetros populacionais que devem ser estimados por meio das observaes
amostrais.
Quando as trs condies citadas acima so satisfeitas, utilizamos a distribuio
t de Student, com a estatstica do teste e os valores crticos dados pela tabela a seguir.
(Observao: Na tabela, = df)
8.6.1. PROPORES DE REAS PARA AS DISTRIBUIES t
Os valores de t apresentados a seguir indicam a proporo entre o ponto dado e
a cauda superior da distribuio, ao invs da proporo entre a cauda inferior e o ponto
dado, como na distribuio normal.
Aps determinar o nmero de graus de liberdade, recorre-se a tabela e localiza-
se na coluna da esquerda. Com uma determinada linha de valores identificada,
selecionar o valor crtico t
c
que corresponde ao cabealho apropriado. Se um valor est
localizado na cauda esquerda, devemos consider-lo como negativo.


* Exemplo: Para que a rea sombreada represente 0,05 da rea total de 1,0, o valor de t
com 10 graus de liberdade 1,812.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

141

Exemplo 8.3:
Os sete valores relacionados a seguir so cargas axiais (em libras) de latas de
alumnio de 0,0109 in. A carga axial de uma lata o peso mximo que seus lados
podem suportar, e deve ser superior a 165 libras, visto que esta a presso mxima
aplicada quando se fixa a tampa no lugar. Ao nvel de 0,01 de significncia, teste a
afirmao do engenheiro supervisor de que esta amostra provm de uma populao
com mdia superior a 165 libras.
270; 273; 258; 204; 254; 228; 282
Soluo:
o = 1%
n = 7
H
0
:
1
15
H
1
:
1
> 165
7 , 252
7
282 228 254 204 258 273 270
n
x
x
i
=
+ + + + + +
= =


( )
( ) ( )
63 , 27 76 , 763 s 76 , 763
6
7 , 252 282 ... 7 , 252 270
1 n
x x
s
2 2
2
i 2
= = =
+ +
=

=


4439 , 10
7
63 , 27
n
s
s
x
= = =
397 , 8
4439 , 10
165 7 , 252
s
x
t
x
x
a
=

=

( ) 143 , 3 01 , 0 e 6 t
c
= tabela
Como ta > tc, rejeita-se a hiptese H0 ao nvel de significncia de 1%, isto , a
amostra provm de uma populao com > 165.
8.7. ESTIMATIVAS
Duas variveis possuem uma distribuio normal bivariada se, para cada valor
de x, os valores correspondentes de y tem distribuio normal e, para cada valor de y,
os valores correspondentes de x so normalmente distribudos. Podemos construir um
intervalo de previso para o verdadeiro valor de y.
As estatsticas amostrais so usadas como estimadores de parmetros
populacionais. As estimativas obtidas podem ser pontuais ou intervalares:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

142

- Estimativa pontual: O parmetro estimado unicamente pelo valor do estimador.
Por exemplo, a estimativa por ponto para a mdia populacional dada atravs da
mdia da amostra.
- Estimativa por intervalo: Quando a partir de uma amostra procuramos calcular
um intervalo de variao, chamado intervalo de confiana, de modo que, este intervalo
tem uma probabilidade conhecida de conter o verdadeiro parmetro populacional.
Quanto maior a probabilidade do intervalo conter o parmetro, maior ser o intervalo.
Tomando-se S como uma estatstica normal N(
S
,
S
), temos a equao geral
para os intervalos de confiana, onde (1 - o) determina o nvel de confiana:
( ) 1 . Z S . Z S P
s c s s c
= + s s
onde Zc definido como coeficiente de confiana, que o valor obtido atravs da
distribuio normal com o nvel de confiana especificado.
O nvel de confiana (1-o) a probabilidade de que o intervalo construdo
contenha o verdadeiro valor do parmetro que est sendo estimado.
A Distribuio Normal pode ser utilizada, nesse caso, sempre que tivermos uma
das seguintes situaes:
- Se n = 30, conforme o Teorema do Limite Central;
- Se n < 30, sendo a populao estudada normalmente distribuda e o desvio
padro populacional conhecido.
.Em termos de distribuio normal Z, o nvel de confiana representa a rea
central sob a curva normal entre os pontos
2

Z e
2

Z .

Figura 8.6: Representao sobre a cura normal
Observe que a rea total sob a curva normal unitria. Se a rea central (1-),
a notao
2

Z representa o valor de Z que deixa a sua esquerda


2

, e a notao
2

Z
representa o valor de Z que deixa a sua direita a rea
2

.
A tabela abaixo apresenta os valores mais usados do nvel de confiana e seu
respectivo coeficiente de confiana:
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

143

Nvel de Confiana (1- o) Zc
0,90 1,65
0,95 1,96
0,99 2,58
8.7.1. INTERVALO DE CONFIANA PARA ESTIMAR A MDIA POPULACIONAL
Um intervalo de estimao para a mdia populacional construdo, a partir do
valor de x , levando-se em conta ainda um erro de estimativa que considera a
probabilidade de que este intervalo inclua o valor real de , e a variabilidade dos dados.
Ento o intervalo de estimao, ou confiana, para a mdia populacional,
utilizando-se a distribuio normal, dado por:
x S =
x
S
= =
( ) 1 . Z x . Z x P
x
c
x
c
= + s s
assim:
| |
x
c
. Z x
8.7.2. INTERVALO DE CONFIANA PARA ESTIMAR A PROPORO
POPULACIONAL
P S =

^
p
n
x
P = =
n
q . p

P
=
n
p 1 . p
s
^ ^
P
|
.
|

\
|

=
( ) 1 . Z P p . Z P P
P c P c
= + s s
assim:
| |
P c
s . Z P
8.7.3. INTERVALO DE CONFIANA PARA ESTIMAR A DIFERENA ENTRE DUAS
MDIAS POLULACIONAIS
2 1 x x S =

( ) ( ) | | 1 . Z x x . Z x x P
2 1 2 1 x x
c
2 1
2 1
x x
c
2 1 = + s s


assim:
( ) | |
2 1 x x
c
2 1 . Z x x




SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

144

8.7.4. INTERVALO DE CONFIANA PARA ESTIMAR A DIFERENA ENTRE DUAS
PROPORES POLULACIONAIS
2 1
P P S =

^
1
1
1
1
p
n
x
P = =

^
2
2
2
2
p
n
x
P = =

2
2 2
1
1 1
P P
n
q . p
n
q . p

2 1
+ =

e
2
^
2
^
2
1
^
1
^
1
P P
n
p 1 . p
n
p 1 . p
s
2 1
|
.
|

\
|

+
|
.
|

\
|

=


( ) ( ) | | 1 . Z P P p p . Z P P P
2 1 2 1
P P c 2 1 2 1 P P c 2 1
= + s s


assim:
( ) | |
2 1
P P c 2 1
s . Z P P



Exemplo 8.4:
A vida mdia de operao para uma amostra de 10 lmpadas 4000 horas, com
desvio padro da amostra igual 200 horas. Supe-se o tempo de operao das
lmpadas tenha uma distribuio aproximadamente normal. Estime a vida mdia de
operao para a populao de lmpadas usando um intervalo de confiana de 95%.
Soluo:
n = 10; h 4000 x = ; h 200 s = ; o = 5%
3 , 63
10
200
n
s
s
x
= = =
( ) 262 , 2 025 , 0
2
05 , 0
; 9 1 10 t
2

; t
c c
= |
.
|

\
|
= = =
| | | | horas 4143 a 3857 3 , 63 . 262 , 2 4000 s . t x
x
c
= =

8.8. INTERVALOS DE PREDIO
Vamos analisar a seguinte situao:
Para a equao de regresso obtida x . 691 , 13 394 , 88 y
^
+ = , onde y representa
venda de um produto e x despesas com propagandas. Portanto, quando x = 2,0
obtemos o valor 115,77 como a melhor venda de um produto de um gasto de 2 milhes
de reais em propagandas. Neste caso, obtemos uma estimativa pontual.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

145

A estimativa pontual tem a desvantagem de no dar qualquer idia de sua
preciso. Portanto, utilizaremos um intervalo de predio, que uma estimativa
intervalar de confiana de um valor predito y.
a) Intervalo de confiana para o valor esperado de y para um determinado valor
de x = x
p
(isto , predizer a mdia de todos os valores de y para um dado x = x
p
).
( )
x
2
p
2

^
SS
x x
n
1
. s . t y

+ com = n-2
b) Intervalo de Predio ou Previso de y para um determinado valor de x (isto ,
para um y individual).
( )
x
2
p
2

^
SS
x x
n
1
1 . s . t y

+ + com = n-2
c) Intervalo de Confiana para | (coeficiente angular da reta)
x 2

SS
s
. t b com = n-2
d) Intervalo de confiana para o (coeficiente linear da reta)
x
2
2

SS
x
n
1
. s . t a + com = n-2
8.9. TESTE DO COEFICIENTE ANGULAR DA RETA (|)
Utilizaremos a seguinte estatstica teste:
x
0
teste
SS .
s
b
t

= com = n-2
e as seguintes hipteses: H
0
: |
0
= 0 e H
1
: |
0
0.

8.10. ANLISE DE CORRELAO
8.10.1. INTRODUO - Coeficiente de correlao de Pearson (r)
A interpretao da existncia de uma correlao usando o diagrama de
disperso pode ser subjetiva. Uma maneira mais precisa de medir o tipo de e o grau de
uma correlao linear entre duas variveis por meio do clculo do coeficiente de
correlao. Desta forma, a correlao ou coeficiente de correlao de Pearson (r) mede
o grau do relacionamento linear entre duas variveis.
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

146

Podemos destacar algumas caractersticas importantes:
- Seu valor est sempre entre -1 e 1 e r tem o mesmo sinal do coeficiente angular
da reta de regresso.
- Um valor de correlao vizinho de +1 ou -1 indica que h uma relao linear
muito forte entre as duas variveis (isto , existe correlao linear significativa entre x e
y). O valor 1 indica uma relao linear perfeita e o valor -1 tambm indica uma relao
linear perfeita mas inversa, ou seja quando uma das variveis aumenta a outra diminui.
- Uma correlao vizinha de zero significa que no h grande relacionamento
linear entre as duas variveis.
O coeficiente de correlao pode ser calculado pela frmula a seguir:
y x
xy
SS . SS
SS
r = ou

( )( )
( ) ( ) |
.
|

\
|
|
.
|

\
|


=

2
i
2
i
i i
y y . x x
y y . x x
r ou
( )( )
( ) | | ( ) | |




=
2
2
2
2
y y n . x x n
y . x xy n
r
Podemos ver na Figura 8.6 alguns exemplos do valor de r.

Figura 8.6: Exemplos de correlao linear
Fonte: LARSON, (2008)
8.10.2. TESTE PARA CORRELAO LINEAR
Formulamos as hipteses, onde a correlao linear a ser testada.
H
0
: = 0 (no h correlao linear significativa)
H
1
: 0 (h correlao linear significativa)
2 n
r 1
r
t
2
teste

= com = n-2
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

147

Obs.: Ao predizer um valor de y com base em determinado valor de x pode-se
concluir que:
- Se no h correlao linear significativa, o melhor valor predito de y y .
- Se h correlao linear significativa obtm-se o melhor valor predito de y
substituindo-se o valor de x na equao de regresso.
8.10.3. COEFICIENTE DE DETERMINAO OU DE EXPLICAO
O coeficiente de determinao igual a razo entre a variao explicada e a
variao total. Ele verifica quanto o modelo adotado explica a realidade. obtido pela
seguinte frmula:
100 .
SS
SS . b
r
y
xy
2
=
Onde:
( )

=
2
y
y y SS e ( )( ) | |

= y y . x x SS
xy

Tem-se que: 0 r 1
- Se r = 0, o modelo adotado no explica nada da realidade;
- Se r = 1, o modelo adotado explica a realidade com perfeio.
Assim, quanto maior o coeficiente de explicao, melhor o modelo adotado.
importante interpretar o coeficiente de determinao corretamente. Por exemplo, se o
coeficiente de correlao r = 0,90, o coeficiente de determinao r = 0,90 = 0,81.
Isso significa que 81% da variao de Y pode ser explicada pela relao entre X e Y.
Os 19% restantes da variao so inexplicados e se devem a outros fatores ou a erros
amostrais.
Exemplo 8.5:
Dada a tabela abaixo (do exemplo 8.1), onde:
x: Despesas com propaganda (milhes de reais)
y: Vendas de um produto (milhares de unidades)
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

148


a) Determinar a reta de mnimos quadrados.
x 69 , 13 41 , 88 y bx a y
^ ^
+ = + =
b) Ajustar uma funo exponencial aos dados.
x x
0732 , 1 . 87 , 106 ab y = =
c) Qual o modelo que voc escolheria?
Funo linear: % 33 , 89 100 .
7 , 41472
9 , 2705 . 69 , 13
100 .
SS
SS . b
r
y
xy 2
= = =
Funo exponencial: % 4 , 87 100 .
2134 , 0
0732 , 6 . 0307 , 0
100 .
SS
SS . b
r
y
xy 2
= = =
Devemos escolher a funo linear. O modelo est explicando que 89,33% da
variao total das vendas est relacionada com as despesas gastas com propaganda.
d) Determine o coeficiente de correlao de Pearson. Interprete o resultado.
94514 , 0
7 , 41472 . 63 , 197
9 , 2705
SS . SS
SS
r
y x
xy
= = =
Como o coeficiente de correlao de Pearson positivo e est prximo de 1,
pode-se dizer que quanto mais se investe em propaganda, mais se vende o produto.
e) Teste a afirmao de que h uma correlao linear entre vendas de um
produto e despesas com propaganda, considere o = 5%;
Hipteses: H
0
: = 0 (no h correlao linear significativa)
H
1
: 0 (h correlao linear significativa)
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

149

= n 2 = 11 2 = 9 ( ) 262 , 2 025 , 0 ; 9 t
2

=
( )
679 , 8
2 11
94514 , 0 1
94514 , 0
2 n
r 1
r
t
2 2
teste
=

=
Como t
teste
> tc, rejeita-se a hiptese nula ao nvel de significncia de 5%, isto ,
h correlao linear significativa.
f) Estimar a quantidade de vendas de um produto para um gasto de 6,0 milhes
de reais com propaganda.
x = 6,0
55 , 170 0 , 6 . 69 , 13 41 , 88 y x 69 , 13 41 , 88 y
^ ^
= + = + =
Vende-se aproximadamente 170 mil unidades do produto para um gasto de 6,0
milhes de reais com propaganda.
g) Calcule o I.C. para | (coeficiente angular da reta), sendo o = 5%.
( ) 262 , 2 025 , 0 ; 9 t
2

=
18 , 22 1 , 492 s 1 , 492
9
9 , 4428
2 11
9 , 2705 . 69 , 13 7 , 41472
2 n
SS . b SS
s
xy y 2
= = = =

=
57 , 3 69 , 13 578 , 1 . 262 , 2 69 , 13
6 , 197
18 , 22
. 262 , 2 69 , 13
SS
s
. t b
x 2

= = =
Assim, Ic = 10,12 a 17,2 ou (10,12 | 17,2) = 0,95

h) Calcule o I.C. para o (coeficiente linear da reta), sendo o = 5%.
75 , 31 41 , 88
6 , 197
82 , 7
11
1
. 18 , 22 . 262 , 2 41 , 88
SS
x
n
1
. s . t a
2
x
2
2

= + = +
Assim, Ic = 56,66 a 120,16
i) Calcule o I.C. para a mdia de vendas de um produto com o investimento de 7
milhes de reais.
22 , 184 0 , 7 . 69 , 13 41 , 88 y x 69 , 13 41 , 88 y
^ ^
= + = + =
SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

150

( )
( )
36 , 15 22 , 184
6 , 197
82 , 7 7
11
1
. 18 , 22 . 262 , 2 22 , 184
SS
x x
n
1
. s . t y
2
x
2
p
2

^
=

+ =

+
Assim, Ic = 168,86 a 199,58

j) Calcule o I.C. para y quando x = 7, ou seja, o I.C. para a venda, quando
investimos 7 milhes de reais.
22 , 184 0 , 7 . 69 , 13 41 , 88 y x 69 , 13 41 , 88 y
^ ^
= + = + =
( )
( )
421 , 52 22 , 184
6 , 197
82 , 7 7
11
1
1 . 18 , 22 . 262 , 2 22 , 184
SS
x x
n
1
1 . s . t y
2
x
2
p
2

^
=

+ + =

+ +
Assim, Ic = 131,80 a 236,64


















SOCIEDADE UNIVERSITRIA REDENTOR
FACULDADE REDENTOR
CURSOS DE GRADUAO EM ENGENHARIAS E SISTEMAS DE INFORMAO
PROBABILIDADE E ESTATSTICA - Prof M.Sc. Muriel B. de Oliveira

151

REFERNCIAS BIBLIOGRFICAS

BUSSAB, W.O. e MORETTIN, P.A. Estatstica Bsica. So Paulo: Editora Saraiva,
2003.
CRESPO, A. A., Estatstica Fcil. 17 ed. So Paulo: Ed. Saraiva, 2002.
DEVORE, J.L. Probabilidade e Estatstica para Engenharia e Cincias. So Paulo:
Pioneira Thomson Learning, 2006.
FREUND, J.E.; Estatstica Aplicada: economia, administrao e contabilidade. 11
ed. Porto Alegre: Bookman, 2006.
HINES, W.W. et al. Probabilidade e Estatstica na Engenharia. Rio de Janeiro: Livros
Tcnicos e Cientficos Editora S.A., 2006.
KAZMIER, L. Introduo Estatstica Aplicada Economia e Administrao. Rio
de Janeiro: Mac-Graw Hill, 2007.
LARSON, R.; FARBER, B. Estatstica Aplicada. 2 edio. So Paulo: Editora
Pearson Education. 2008.
MILONE, Giuseppe. Estatstica Geral e Aplicada. So Paulo: Pioneira Thomson
Learning, 2004.
MONTGOMERY, D.C. e RUNGER, G.C. Estatstica Aplicada e Probabilidade para
Engenheiros. 4 edio. Rio de Janeiro: Livros Tcnicos e Cientficos Editora S.A.,
2009.
SPIEGEL, M.R. Estatstica. 4 ed. So Paulo: Pearson Makron Books. 2009.
TOLEDO, G.L, OVALLE, I.I. Estatstica Bsica. 2 edio. So Paulo: Editora Atlas.
1992.
TRIOLA, M.F. Introduo Estatstica. 10 edio, Rio de Janeiro: Livros Tcnicos e
Cientficos Editora S.A., 2008.
icos Editora S.A., 2008.

Você também pode gostar