Você está na página 1de 116

voltar

sumrio

Probabilidade e Estatstica
Sonia Maria Barros Barbosa Correa
2 Edio

voltar

sumrio

voltar

sumrio

PUCMINAS, 2003

Pontifcia Universidade Catlica de


Minas Gerais
Gro Chanceler
Dom Serafim Fernandes de Arajo
Reitor
Prof. Pe. Geraldo Magela Teixeira

Design Grfico e diagramao:


Simone Nogueira / Slvia Fonseca (Trainee I)
Reviso:
PUC Minas Virtual

PUC Minas Virtual

Reproduo proibida. Art. 184 do Cdigo Penal


e Lei 9.610 de 19 de fevereiro de 1998.

Diretora de Ensino a Distncia


Maria Beatriz Ribeiro de Oliveira Gonalves

Todos os direitos reservados


PONTIFCIA UNIVERSIDADE
CATLICA DE MINAS GERAIS

Coordenao Acadmico-pedaggica
Stela Beatris Trres Arnold (coordenadora)
Agnela da Silva Giusta

DIRETORIA DE ENSINO A DISTNCIA

Liana Portilho Mattos

R. Esprito Santo, 1.059 - 12 andar Centro


CEP 30160-922 - Belo Horizonte - MG
Telefone: (0xx31) 3273-7898 - Fax: 3274-2805
http://www.virtual.pucminas.br
e-mail: ead@pucminas.br

Maria Ceclia de Ruiz Combat Stortini


Mercia Moreira
Wilba Lcia Maia Bernardes
Coordenao Tecnolgica
Luiz Flvio F. B. Oliveira (coordenador)

ATENDIMENTO E INFORMAES:

Antnio Bosco de Oliveira Jnior

Belo Horizonte: (0xx31) 3274-1862


Demais localidades: 0300 313 3 313*
e-mail: atendimento@virtual.pucminas.br

Eduardo Marques Duarte


Guilherme C. V. Costa
Mrcio Tlio Morato

* O custo da ligao 0300 de R$ 0,27/min, para telefones fixos,


ou de R$ 0,63/min, para telefones celulares, e ser pago pelo
usurio. Os valores indicados no incluem impostos
(ref. 30/06/03). Valores sujeitos a alteraes sem aviso prvio.
Confira os valores atualizados em
http://www.virtual.pucminas.br/0300

Rosiane C. M. Oliveira
Simone Nogueira
Tlio Nogueira
Coordenao da rea de Televiso
Iara Cordeiro de Melo Franco (coordenadora)

FICHA CATALOGRFICA
Elaborada pela Biblioteca da
Pontifcia Universidade Catlica de Minas Gerais

Assessoria de Comunicao e Marketing


Jnia Cludia Carvalho (assessora de comunicao)
Carolina Franco

Correa, Sonia Maria Barros Barbosa


C824p

Gerncia de Projetos
Eduardo Silva Ladeira

Probabilidade e estattica / Sonia Maria


Barros Barbosa Correa. 2 ed. - Belo Horizonte: PUC Minas Virtual, 2003
116 p.

Secretaria
Eloisa A. T. Lott Carvalho (secretria)

Bibliografia

Cludio Elias Marques

1. Probabilidade. 2. Estatstica matemtica.


3. Amostragem (Estatstica). I. Pontifcia Universidade Catlica de Minas Gerais.
II. Ttulo.

Cristina Maria Isoni Auad


Jacqueline C. Carvalho

CDU: 519.2
Bibliotecria - Eunice dos Santos - CRB 6/1515

Impresso no Brasil

voltar

sumrio

voltar

sumrio

sumrio
Unidade 1 Natureza e Fundamentos do Mtodo Estatstico........................

07

1.1 - Introduo Estatstica ........................................................

07

1.2 - Importncia da Estatstica .....................................................

08

1.3 - Grandes reas da Estatstica ..................................................

09

1.4 - Fases do Mtodo Estatstico ...................................................

12

1.5 - Sries Estatsticas ...............................................................

15

1.6 - Apresentao de dados


Tabelas e Grficos: Construo e Interpretao ..........................

22

Unidade 2 Amostragem ....................................................................

28

2.1 Importncia da Amostragem...................................................

28

2.2 Conceitos Fundamentais .......................................................

29

2.3 Amostragem Aleatria Simples................................................

31

2.4 Amostragem Aleatria Estratificada .........................................

32

2.5 Amostragem por Conglomerado ..............................................

34

2.6 Amostragem Sistemtica ......................................................

34

Unidade 3 Distribuio de Freqncia .................................................

37

3.1 Conceitos .........................................................................

37

3.2 - Elementos de uma distribuio de freqncia: amplitude total,


limites de classe, amplitude do intervalo de classe, ponto mdio
da classe, freqncia absoluta, relativa e acumulada ....................

40

3.3 - Regras Gerais para a elaborao de uma distribuio de freqncia...

44

3.4 - Grficos representativos de uma distribuio de freqncia:


histograma, polgono de freqncia e ogiva ................................

voltar

sumrio

45

voltar

sumrio

Unidade 4 - Medidas de Posio ...........................................................

48

4.1. Introduo.........................................................................

48

4.2. Mdia aritmtica simples e ponderada e suas propriedades ..............

49

4.3. Moda: Dados agrupados e no agrupados em classes.......................

50

4.4. Mediana: Dados agrupados e no agrupados em classes ...................

52

4.5. Mdia Geomtrica: Dados agrupados e no agrupados em classes.......

54

4.6. Mdia Harmnica: Dados agrupados e no agrupados em classes ........

54

4.7. Separatrizes: Quartis, Decis e Percentis .....................................

55

Unidade 5 Medidas de Disperso ........................................................

59

5.1 Disperso .........................................................................

59

5.2 Assimetria .......................................................................

61

5.3 Curtose............................................................................

63

Unidade 6 Probabilidade ..................................................................

65

6.1 Experimento aleatrio, espao amostral e eventos .......................

65

6.2 Probabilidade:Definio clssica; Probabilidade e


freqncia relativa .............................................................

70

6.3 Tipos de eventos ................................................................

70

6.4 Axiomas de Probabilidade .....................................................

72

6.5 Probabilidade condicional e independncia de eventos .................

74

Unidade 7 Variveis Aleatrias ..........................................................

78

7.1 Conceito de varivel aleatria ...............................................

78

7.2 Distribuio de probabilidade .................................................

79

7.3. Funo de densidade de probabilidade.......................................

79

7.4. Esperana matemtica, varincia e desvio padro: propriedades .......

79

7.5. Distribuies discretas: Hipergeomtrica, Binomial e Poisson............

80

7.6. Distribuio contnua: Normal - propriedades, distribuio


normal padro, a Normal como aproximao da Binomial ................

85

voltar

sumrio

voltar

sumrio

Unidade 8 - Inferncia Estatstica .........................................................

93

8.1. Populao e amostra; Estatsticas e parmetros;


Distribuies amostrais .........................................................

93

8.2. Estimao .........................................................................

96

8.3. Testes de Hipteses .............................................................

100

Unidade 9 Correlao e Regresso Linear .............................................

106

9.1. Diagrama de disperso ..........................................................

107

9.2. Correlao Linear ................................................................

107

9.3. Coeficiente de Correlao Linear .............................................

108

9.4. Regresso Reta de regresso .................................................

112

Referncias Bibliogrficas ..................................................................

116

voltar

sumrio

voltar

sumrio

voltar

sumrio

voltar

sumrio

UNIDADE 1
Natureza e Fundamentos do Mtodo Estatstico
1.1.
1.2.
1.3.
1.4.
1.5.
1.6.

Introduo Estatstica
Importncia da Estatstica
Grandes reas da Estatstica
Fases do Mtodo Estatstico
Sries Estatsticas
Apresentao de dados Tabelas e Grficos:
Construo e Interpretao

Nesta unidade, sero abordados temas relacionados ao mtodo estatstico. Oferecer exemplos de tabelas e grficos que podem representar, de
forma sinttica, as informaes obtidas atravs de processos de pesquisa, so objetivos especficos desta unidade, que tem o propsito de:
Demonstrar a importncia da Estatstica na vida diria;
Mostrar como podemos utiliz-la de forma correta;
Ensinar como compor tabelas a partir de dados numricos;
Ensinar como representar dados numricos em grficos.

1.1. Introduo Estatstica


A palavra estatstica lembra, maioria das pessoas, recenseamento. Os censos
existem h milhares de anos e constituem um esforo imenso e caro feito pelos
governos, com o objetivo de conhecer seus habitantes, sua condio socioeconmica, sua cultura, religio, etc. Portanto, associar estatstica a censo perfeitamente
correto do ponto de vista histrico, sendo interessante salientar que as palavras
estatstica e estado tm a mesma origem latina: status.
A estatstica tambm comumente associada s pesquisas de opinio pblica, aos
vrios ndices governamentais, aos grficos e s mdias publicados diariamente na
imprensa. Na realidade, entretanto, a estatstica engloba muitos outros aspectos,
sendo fundamental na anlise de dados provenientes de quaisquer processos onde
exista variabilidade.

PUC Minas Virtual

voltar

Probabilidade e Estatstica

sumrio

voltar

sumrio

possvel distinguir duas concepes para a palavra ESTATSTICA: no plural (estatsticas), indica qualquer coleo de dados numricos, reunidos com a finalidade de
fornecer informaes acerca de uma atividade qualquer. Assim, por exemplo, as
estatsticas demogrficas referem-se aos dados numricos sobre nascimentos,
falecimentos, matrimnios, desquites, etc. As estatsticas econmicas consistem
em dados numricos relacionados com emprego, produo, vendas e com outras
atividades ligadas aos vrios setores da vida econmica. No singular (Estatstica),
indica a atividade humana especializada ou um corpo de tcnicas, ou ainda uma
metodologia desenvolvida para a coleta, a classificao, a apresentao, a anlise e
a interpretao de dados quantitativos e a utilizao desses dados para a tomada
de decises.

1.2. Importncia da Estatstica


O mundo est repleto de problemas. Para resolvermos a maioria deles, necessitamos de informaes. Mas, que tipo de informao? Que quantidade de informaes? Aps obt-las, que fazer com elas? A Estatstica trabalha com essas informaes, associando os dados ao problema, descobrindo como e o que coletar, assim
capacitando o pesquisador (ou profissional ou cientista) a obter concluses a partir
dessas informaes, de tal forma que possam ser entendidas por outras pessoas.
Portanto, os mtodos estatsticos auxiliam o cientista social, o economista, o engenheiro, o agrnomo e muitos outros profissionais a realizarem o seu trabalho com
mais eficincia.
A Estatstica uma parte da Matemtica que fornece mtodos para a
coleta, organizao, descrio, anlise e interpretao de dados, viabilizando a utilizao dos mesmos na tomada de decises.

Vejamos alguns exemplos:


Os estatsticos do governo conduzem censos de populao, moradia, produtos
industriais, agricultura e outros. So feitas compilaes sobre vendas, produo,
inventrio, folha de pagamento e outros dados das indstrias e empresas. Essas
estatsticas informam ao administrador como a sua empresa est crescendo, seu
crescimento em relao a outras empresas e fornece-lhe condies de planejar
aes futuras. A anlise dos dados muito importante para se fazer um planejamento adequado.

PUC Minas Virtual

voltar

Probabilidade e Estatstica

sumrio

voltar

sumrio

Na era da energia nuclear, os estudos estatsticos tm avanado rapidamente e,


com seus processos e tcnicas, tm contribudo para a organizao de empresas
e utilizao dos recursos do mundo moderno.
Em geral, as pessoas, quando se referem ao termo estatstica, desconhecem que o
aspecto essencial o de proporcionar mtodos inferenciais, que permitam concluses que transcendam os dados obtidos inicialmente.

1.3. Grandes reas da Estatstica


Para fins de apresentao, usual se dividir a estatstica em trs grandes reas,
embora no se trate de ramos isolados:
Estatstica Descritiva e Amostragem Conjunto de tcnicas que objetivam coletar, organizar, apresentar, analisar e sintetizar os dados numricos de uma populao, ou amostra;
Estatstica Inferencial Processo de se obter informaes sobre uma populao
a partir de resultados observados na amostra;
Probabilidade - Modelos matemticos que explicam

os fenmenos estudados

pela Estatstica em condies normais de experimentao.


Em estatstica, utilizamos extensamente os termos: populao, amostra, censo,
parmetros, estatstica, dados discretos, dados contnuos, dados quantitativos e
dados qualitativos; que estaremos definindo abaixo para maior compreenso::

Populao: uma coleo completa de todos os elementos a serem


estudados.

Amostra: uma subcoleo de elementos extrados de uma populao.

Censo: uma coleo de dados relativos a todos os elementos de


uma populao.

Parmetros: uma medida numrica que descreve uma caracterstica de uma populao.

Estatstica: uma medida numrica que descreve uma caracterstica


de uma amostra.

Dados contnuos: resultam de um nmero infinito de valores possveis que podem ser associados a pontos em uma escala contnua de
tal maneira que no haja lacunas.

PUC Minas Virtual

voltar

Probabilidade e Estatstica

sumrio

voltar

sumrio

Dados discretos: resultam de um conjunto finito de valores possveis,


ou de um conjunto enumervel de valores.

Dados quantitativos: consistem em nmeros que representam contagens ou medidas.

Dados qualitativos:podem ser separados em diferentes categorias


que se distinguem por alguma caracterstica no-numrica.

Amostragem
o processo de escolha da amostra. a parte inicial de qualquer estudo estatstico.
Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo. Geralmente, as pesquisas so realizadas atravs de estudo dos elementos que compem uma amostra, extrada da populao que se pretende analisar.
Exemplo 1.1. Pesquisas sobre tendncias de votao
Em pocas de eleio, comum a realizao de pesquisas com o objetivo de se conhecer as tendncias do eleitorado. Para que os resultados
sejam de fato representativos, toma-se o cuidado de se entrevistar um
conjunto de pessoas com caractersticas socioeconmicas, culturais, religiosas, etc. to prximas quanto possvel da populao qual os resultados da pesquisa sero estendidos. A escolha da amostra, a redao do
questionrio, a entrevista, a codificao dos dados e a apurao dos resultados so as etapas deste tipo de pesquisa.

Populao e amostra
O estudo de qualquer fenmeno, seja ele natural, social, econmico ou biolgico,
exige a coleta e a anlise de dados estatsticos. A coleta de dados , pois, a fase
inicial de qualquer pesquisa.
sobre os dados da amostra que se desenvolvem os estudos, visando a fazer inferncias sobre a populao.
Exemplo 1.2. Avaliao de um programa de ensino
Toma-se certo nmero de pares de turmas: a um conjunto de turmas
ensina-se um assunto por um novo mtodo e, ao outro, pelo mtodo
clssico. Aplica-se uma prova a ambos os grupos. As notas observadas

PUC Minas Virtual

voltar

10

Probabilidade e Estatstica

sumrio

voltar

sumrio

nesses conjuntos de turmas constituem a nossa amostra. Se os resultados do novo mtodo forem melhores, iremos aplic-lo a todas as turmas, isto , populao. A partir da amostra, estabelecemos o que
conveniente para a populao, ou seja, fazemos uma inferncia sobre a
populao.
Exemplo 1.3. Renda mdia per capita em diversas regies do pas
Toma-se um conjunto de indivduos em cada regio, escolhidos ao acaso, e sobre esse grupo so feitos os estudos. Os indivduos assim escolhidos constituem a amostra e os resultados nela observados sero estendidos populao.

Estatstica Descritiva
a parte mais conhecida. Quem v o noticirio, na televiso ou nos jornais, sabe
quo freqente o uso de mdias, ndices e grficos nas notcias.
Exemplo 1.4. INPC (ndice Nacional de Preos ao Consumidor)
Sua construo envolve a sintetizao, em um nico nmero, dos aumentos dos produtos de uma cesta bsica.
Exemplo 1.5. Anurio Estatstico Brasileiro
O IBGE publica esse anurio apresentando, em vrias tabelas, os mais
diversos dados sobre o Brasil: educao, sade, transporte, economia,
cultura, etc. Embora simples, fceis de serem entendidas, as tabelas so
o produto de um processo demorado e extremamente dispendioso de
coleta e apurao de dados.
Exemplo 1.6. Anurio Estatstico da Embratur
A Embratur publica esse anurio apresentando, em vrias tabelas e grficos, os mais diversos dados sobre Turismo Interno e dados sobre entrada de turistas estrangeiros no Brasil.

PUC Minas Virtual

voltar

11

Probabilidade e Estatstica

sumrio

voltar

sumrio

Estatstica Inferencial (ou Indutiva)


A tomada de decises sobre a populao, com base em estudos feitos sobre os dados da amostra, constitui o problema central da inferncia estatstica.
Exemplo 1.7. Suponha que a distribuio das alturas de todos os habitantes de um pas possa ser representada por uma distribuio normal.
Mas no conhecemos de antemo a mdia da distribuio. Devemos,
pois, estim-la.
Exemplo 1.8. Anlise financeira. Os analistas financeiros estudam dados
sobre a situao da economia, visando explicar tendncias dos nveis de
produo e de consumo, projetando-os para o futuro.
Exemplo 1.9. Ocorrncia de terremotos. Os gelogos esto continuamente coletando dados sobre a ocorrncia de terremotos. Gostariam de
inferir quando e onde ocorrero tremores, e qual a sua intensidade. Trata-se, sem dvida, de uma questo complexa, que exige longa experincia geolgica, alm de cuidadosa aplicao de mtodos estatsticos.

Probabilidade
O processo de generalizao, que caracterstico do mtodo indutivo, est associado a uma margem de incerteza. A existncia da incerteza deve-se ao fato de que a
concluso, que se pretende obter para o conjunto de todos os indivduos analisados
quanto a determinadas caractersticas comuns, baseia-se em uma parcela do total
das observaes. A medida da incerteza tratada mediante tcnicas e mtodos que
se fundamentam na Teoria da Probabilidade. Essa teoria procura quantificar a
incerteza existente em determinada situao.

1.4. Fases do Mtodo Estatstico


Quando se pretende empreender um estudo estatstico completo, existem diversas
fases do trabalho que devem ser desenvolvidas para se chegar aos resultados finais
de um

estudo capaz de produzir resultados vlidos. As fases principais so as

seguintes:
Definio do problema

PUC Minas Virtual

voltar

12

Probabilidade e Estatstica

sumrio

voltar

sumrio

Planejamento
Coleta de dados
Apurao dos dados
Apresentao dos dados
Anlise e Interpretao dos dados

Definio do problema
A primeira fase do trabalho consiste em uma definio ou formulao correta do
problema a ser estudado. Alm de considerar detidamente o problema objeto do
estudo, o analista dever examinar outros levantamentos realizados no mesmo
campo e que sejam anlogos, uma vez que parte da informao de que se necessita pode, muitas vezes, ser encontrada nesses ltimos.

Planejamento
O passo seguinte, aps a definio do problema, compreende a fase do planejamento, que consiste em se determinar o procedimento necessrio para se resolver
o problema e, em especial, como levantar informaes sobre o assunto, objeto do
estudo. preciso planejar o trabalho a ser realizado tendo em vista o objetivo que
se pretende atingir. nessa fase que ser escolhido o tipo de levantamento a ser
utilizado. Sob esse aspecto, pode haver dois tipos de levantamento:
Levantamento censitrio, quando a contagem for completa, abrangendo todo o
universo;
Levantamento por amostragem, quando a contagem for parcial.

Outros elementos importantes que devem ser tratados nesta mesma fase so:
Cronograma das atividades, atravs do qual so fixados os prazos para as vrias
fases;
Custos envolvidos;
Exame das informaes disponveis;
Delineamento da amostra, etc.

PUC Minas Virtual

voltar

13

Probabilidade e Estatstica

sumrio

voltar

sumrio

Coleta dos dados


O terceiro passo essencialmente operacional, compreendendo a coleta das informaes propriamente ditas. Nesta fase do mtodo estatstico, conveniente estabelecer uma distino entre duas espcies de dados:
Dados primrios quando so publicados ou coletados pelo prprio pesquisador
ou organizao que os escolheu;
Dados secundrios quando so publicados ou coletados por outra organizao.
Um conjunto de dados , pois, primrio ou secundrio em relao a algum. As
tabelas do Censo Demogrfico so fontes primrias. Quando determinado jornal
publica estatsticas extradas de vrias fontes e relacionadas com diversos setores
industriais, os dados so secundrios para quem desejar utilizar-se deles em alguma pesquisa que esteja desenvolvendo.
A coleta de dados pode ser realizada de duas maneiras:
Coleta Direta quando obtida diretamente da fonte, como no caso da empresa
que realiza uma pesquisa para saber a preferncia dos consumidores pela sua
marca;
Coleta Indireta quando inferida a partir dos elementos conseguidos pela coleta direta, ou atravs do conhecimento de outros fenmenos que, de algum modo, estejam relacionados com o fenmeno em questo.

Apurao dos dados


Antes de comear a analisar os dados, conveniente que lhes seja dado algum tratamento prvio, a fim de torn-los mais expressivos. A quarta etapa do processo ,
ento, a da apurao ou sumarizao, que consiste em resumir os dados atravs de
sua contagem e agrupamento. Pode ser manual, eletromecnica ou eletrnica.

Apresentao dos dados


Por mais diversa que seja a finalidade, os dados devem ser apresentados sob forma
adequada, tornando mais fcil o exame do fenmeno que est sendo objeto de tratamento estatstico.

PUC Minas Virtual

voltar

14

Probabilidade e Estatstica

sumrio

voltar

sumrio

H duas formas de apresentao ou exposio dos dados observados, que no se


excluem mutuamente:
Apresentao tabular uma apresentao numrica dos dados. Consiste em
dispor os dados em linhas e colunas distribudas de modo ordenado, segundo algumas regras prticas adotadas pelos diversos sistemas estatsticos. As tabelas
tm a vantagem de conseguir expor, sinteticamente e em s local, os resultados
sobre determinado assunto, de modo a se obter uma viso global mais rpida
daquilo que se pretende analisar.
Apresentao grfica uma apresentao geomtrica dos dados numricos.
Embora a apresentao tabular seja de extrema importncia no sentido de facilitar a anlise numrica de dados, no permite ao analista obter uma viso to
rpida, fcil e clara do fenmeno e sua variao como aquela conseguida atravs de um grfico.

Anlise e interpretao dos dados


Nesta ltima etapa, o interesse maior reside em tirar concluses que auxiliem o
pesquisador a resolver seu problema. A anlise dos estatsticos est ligada essencialmente ao clculo de medidas, cuja finalidade principal descrever o fenmeno.
Assim, o conjunto de dados a ser analisado pode ser expresso por nmerosresumo, as estatsticas que evidenciam as caractersticas particulares desse conjunto. O significado exato de cada um dos valores obtidos atravs do clculo das vrias
medidas estatsticas disponveis deve ser bem interpretado. possvel mesmo, nesta fase, arriscar algumas generalizaes, as quais envolvero, como mencionado
anteriormente, algum grau de incerteza, porque no se pode estar seguro de que o
que foi constatado para aquele conjunto de dados (a amostra) se verificar igualmente para a populao.

1.5. Sries Estatsticas


Define-se srie estatstica como toda e qualquer coleo de dados estatsticos referidos a uma mesma ordem de classificao: quantitativa. No sentido mais amplo,
srie uma sucesso de nmeros referidos a qualquer varivel. Se os nmeros
expressarem dados estatsticos, a srie ser chamada de srie estatstica.
Em sentido mais restrito, pode-se dizer que uma srie estatstica uma sucesso
de dados estatsticos referidos a caracteres qualitativos, ao passo que uma suces-

PUC Minas Virtual

voltar

15

Probabilidade e Estatstica

sumrio

voltar

sumrio

so de dados estatsticos referidos a caracteres quantitativos configurar uma Distribuio de Freqncia.


Em outros termos, a palavra srie usada normalmente para designar um conjunto
de dados dispostos de acordo com um carter varivel, residindo a qualidade serial
na disposio desses valores, e no em uma disposio temporal ou espacial de
indivduos.
Tabela um quadro que resume um conjunto de observaes.
Uma tabela compe-se de:
Corpo conjunto de linhas e colunas que contm informaes sobre a varivel
em estudo;
Cabealho parte superior da tabela que especifica o contedo das colunas;
Coluna indicadora parte da tabela que especifica o contedo das linhas;
Linhas retas imaginrias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas;
Casa ou clula espao destinado a um s nmero;
Ttulo conjunto de informaes, as mais completas possveis, respondendo s
perguntas: O qu?- Quando?- Onde?- localizado no topo da tabela.
Fonte referncia de onde se obteve os dados, colocado, de preferncia, no rodap.
As tabelas servem para apresentar sries estatsticas. Conforme varie um dos elementos da srie, podemos classific-la em:
Cronolgicas - Tempo (fator temporal ou cronolgico) a que poca refere-se o
fenmeno analisado;
Geogrficas - Local (fator espacial ou geogrfico) onde o fenmeno acontece;
Especficas - Fenmeno (espcie do fato ou fator especificativo) o que descrito.
As sries tambm so divididas em:
Sries Homgradas - aquelas em que a varivel descrita apresenta variao discreta ou descontnua. So sries homgradas a srie temporal, a srie geogrfica e a srie especfica;

PUC Minas Virtual

voltar

16

Probabilidade e Estatstica

sumrio

voltar

sumrio

Sries Hetergradas - aquelas nas quais o fenmeno ou o fato apresenta graduaes ou subdivises. Embora fixo, o fenmeno varia em intensidade. A Distribuio de freqncias ou seriao uma srie hetergrada.
Os dados estatsticos resultantes da coleta direta da fonte, sem outra manipulao
seno a contagem ou medida, o chamados dados absolutos. Dados Relativos so o
resultado de comparaes por quociente (razes) que se estabelecem entre dados
absolutos e tm por finalidade realar ou facilitar as comparaes entre quantidades.
1.5.1. Tipos de Sries Estatsticas Simples (ou de uma entrada)
As sries estatsticas diferenciam-se de acordo com a variao de um dos trs elementos: tempo, local e fenmeno.

PUC Minas Virtual

voltar

17

Probabilidade e Estatstica

sumrio

voltar

sumrio

Srie Cronolgica
Tambm chamada de srie temporal, srie histrica, srie evolutiva ou marcha,
identifica-se pelo carter varivel do fator cronolgico. Assim, deve-se ter:
Elemento varivel: poca
Elementos Fixos: Local e Fenmeno
Exemplo:
Tabela 1.1 - Operadora WKX Venda de bilhetes areos
Mercado Interno 1995

Vendas (em milhares

Meses

de reais)

Janeiro

2300

Fevereiro

1800

Maro

2200

Abril

2210

Maio

2360

Junho

2600

Julho

2690

Agosto

3050

Setembro

3500

Outubro

3440

Novembro

3100

Dezembro

2760

TOTAL ANUAL

31510

Fonte: Departamento de Anlise de Mercado

PUC Minas Virtual

voltar

18

Probabilidade e Estatstica

sumrio

voltar

sumrio

Srie Geogrfica
Tambm chamada de srie territorial, srie espacial ou srie de localizao, identifica-se pelo carter varivel do fator geogrfico. Assim, deve-se ter:
Elemento varivel: Local
Elementos Fixos: poca e Fenmeno Exemplo:
Tabela 1.2 Operadora WKX - Vendas por Unidade da Federao 1995

Unidades da Federao

Vendas (em milhares de reais)

Minas Gerais

4000

Paran

2230

Rio Grande do Sul

6470

Rio de Janeiro

8300

So Paulo

10090

Outros

420

TOTAL BRASIL

31510

Fonte: Departamento de Anlise de Mercado

PUC Minas Virtual

voltar

19

Probabilidade e Estatstica

sumrio

voltar

sumrio

Srie Especfica
Tambm chamada de srie categrica ou srie por categoria, identifica-se pelo carter varivel de fator especificativo. Assim, deve-se ter:
Elemento varivel: Fenmeno
Elementos Fixos: Local e poca
Exemplos:
Tabela 1.3. Operadora WKX Venda de bilhetes areos por Linha 1995
Linha do Produto

Vendas (em milhares de reais)

Linha A

6450

Linha B

9310

Linha C

15750

TODAS AS LINHAS

31510

Fonte: Departamento de Anlise de Mercado

Tabela 1.4. Nmero de empregados das vrias classes


de salrios no estado de So Paulo 1998
Classes de Salrios (R$)

Nmero de Empregados

At 80

41 326

De 80 a 119

123 236

De 120 a 159

428 904

De 160 a 199

324 437

De 200 a 399

787 304

De 400 a 599

266 002

De 600 a 799

102 375

De 800 a 999

56 170

1000 e mais

103 788

TOTAL

2 233 542

Fonte: Servio de Estatstica da Previdncia e Trabalho


(Dados alterados para melhor compreenso)

PUC Minas Virtual

voltar

20

Probabilidade e Estatstica

sumrio

voltar

sumrio

1.5.2. Tabelas Compostas (ou de dupla entrada)


As tabelas apresentadas anteriormente so tabelas estatsticas simples, onde apenas uma srie est representada. comum, todavia, haver necessidade de apresentar, em uma nica tabela, mais do que uma srie. Quando as sries aparecem
conjugadas, tem-se uma tabela de dupla entrada. Em uma tabela desse tipo so
criadas duas ordens de classificao: uma horizontal (linha) e uma vertical (coluna).
Exemplos:
A) Srie especfico-temporal
B) Srie geogrfico-temporal
A) Tabela 1.5 Populao economicamente ativa
por setor de atividades Brasil

Populao (1 000 Hab.)

Setor
1940

1950

1960

Primrio

8 968

10 255

12 163

Secundrio

1 414

2 347

2 962

Tercirio

3 620

4 516

7 525

Fonte: IPEA

B) Tabela 1.6 Populao Indgena Brasileira

Unidade de
Produo

Produo
1937

1938

1939

Acre

5 007

4 765

4 727

Amazonas

6 858

5 998

5 631

Par

4 945

4 223

4 500

Mato Grosso

1 327

1 285

1 235

333

539

337

Outros Estados

Fonte: Anurio Estatstico do Brasil IBGE - (Dados alterados para melhor compreenso)

PUC Minas Virtual

voltar

21

Probabilidade e Estatstica

sumrio

voltar

sumrio

Podem existir, se bem que mais raramente, pela dificuldade de representao, sries compostas de trs ou mais entradas.
Observao:
Nem sempre uma tabela representa uma srie estatstica. Por vezes, os dados
reunidos no revelam uniformidade, sendo meramente um aglomerado de informaes gerais sobre determinado assunto, as quais, embora teis, no apresentam a consistncia necessria para se configurar uma srie estatstica.
Exemplo: Tabela com resumos de dados, mas que no representa uma
srie estatstica.
Tabela 1.8 Situao dos espetculos cinematogrficos no Brasil 1967
Especificao

Dados Numricos

Nmero de cinemas

2 488

Lotao dos cinemas

1 722 348

Sesses por dia

3 933

Filmes de longa metragem


Meia-entrada

131 330 488


89 581 234

Fonte: Anurio Estatstico do Brasil IBGE

1.6. Apresentao de dados - Tabelas e Grficos:


Construo e Interpretao
A representao grfica das sries estatsticas tem por finalidade representar os
resultados obtidos, permitindo que se chegue a concluses sobre a evoluo do
fenmeno ou sobre como se relacionam os valores da srie. A escolha do grfico
mais apropriado ficar a critrio do analista. Contudo, os elementos simplicidade,
clareza e veracidade devem ser considerados, quando da elaborao de um grfico.
Simplicidade o grfico deve ser destitudo de detalhes de importncia secundria, assim como de traos desnecessrios que possam levar o observador a uma
anlise morosa ou sujeita a erros.
Clareza o grfico deve possibilitar uma correta interpretao dos valores representativos do fenmeno em estudo.
Veracidade o grfico deve expressar a verdade sobre o fenmeno em estudo.

PUC Minas Virtual

voltar

22

Probabilidade e Estatstica

sumrio

voltar

sumrio

Diretrizes para a construo de um grfico:


O ttulo do grfico deve ser o mais claro e completo possvel. Quando necessrio,
deve-se acrescentar subttulos;
A orientao geral dos grficos deve ser da esquerda para a direita;
As quantidades devem ser representadas por grandezas lineares;
Sempre que possvel, a escala vertical h de ser escolhida de modo a aparecer a
linha 0 (zero);
S devem ser includas no desenho as coordenadas indispensveis para guiar o
olhar do leitor ao longo da leitura. Um tracejado muito cerrado dificulta o exame
do grfico;
A escala horizontal deve ser lida da esquerda para a direita, e a vertical de baixo
para cima;
Os ttulos e marcaes do grfico devem ser dispostos de maneira que sejam
facilmente lidos, partindo da margem horizontal inferior ou da margem esquerda.
Leitura e interpretao de um grfico:
Declarar qual o fenmeno ou fenmenos representados, a regio considerada, o
perodo de tempo, a fonte dos dados, etc;
Examinar o tipo de grfico escolhido, verificar se o mais adequado, criticar a
sua execuo, no conjunto e nos detalhes;
Analisar cada fenmeno separadamente, fazendo notar os pontos mais em evidncia, o mximo e o mnimo, assim como as mudanas mais bruscas;
Investigar se h uma tendncia geral crescente ou decrescente ou, ento, se o
fato exposto estacionrio;
Procurar descobrir a existncia de possveis ciclos peridicos, qual o perodo aproximado, etc.

PUC Minas Virtual

voltar

23

Probabilidade e Estatstica

sumrio

voltar

sumrio

Eis os tipos mais comuns de grficos:


Grfico em Linhas

Constitui uma aplicao do processo de representao das funes num sistema de


coordenadas cartesianas
Exemplo: Vendas em Cr$ 1000,00 nos anos de 1971 a 1977 de determinado produto da empresa x.

Vendas em Cr$ 1000,00


500

vendas

400
300
200
100
0
1971 1972 1973 1974 1975 1976 1977

anos
Fonte: Dados Fictcios.

Grfico em Colunas
a representao de uma srie por meio de retngulos, dispostos verticalmente.
Exemplo:Populao Brasileira nas dcadas de 40 a 70.

Populao
100
80
60

Populao

40
20
0

1940

1950

1960

1970

Fonte: Dados Fictcios

PUC Minas Virtual

voltar

24

Probabilidade e Estatstica

sumrio

voltar

sumrio

Grfico em Barras
semelhante ao grfico em colunas, porm, os retngulos so dispostos horizontalmente.
Exemplo:Populao Brasileira nas dcadas de 40 a 70

Populao do Brasil
1970
1960
Populao do
Brasil

1950
1940
0

20

40

60

80

100

Fonte: Dados Fictcios

Grfico em Setores
a representao grfica de uma srie estatstica em crculo, por meio de setores.
utilizado principalmente quando se pretende comparar cada valor da srie com o
total.
Exemplo:
Receita (em R$ 1.000.000,00) do Municpio X de 1975-77
Anos

Receita (em R$ 1.000.000,00)

1975

90

1976

120

1977
Total
Fonte: Departamento da Fazenda, Municpio X.

O total representado pelo crculo, que fica dividido em tantos setores quantas so
as partes. Os setores so tais que suas reas so respectivamente proporcionais
aos dados da srie.

PUC Minas Virtual

voltar

25

Probabilidade e Estatstica

sumrio

voltar

sumrio

Obtemos cada setor por meio de uma regra de trs simples e direta, lembrando
que o total da srie corresponde a 360.
Total __________360
Parte___________ x

Para 1975:

360 -

360

90 -

Para 1976:

360 - 360
120 -

x = 90

Para 1977:

x = 120

360 - 360
150 -

x = 150

Receita do Municipio X

1975
1976
1977

Fonte: Departamento da Fazenda, Municpio X

Grfico Polar
o grfico ideal para representar sries temporais cclicas, isto , sries que apresentam em seu desenvolvimento determinada periodicidade, como, por exemplo, a
variao da precipitao pluviomtrica ao longo do ano, ou da temperatura ao longo do dia, o consumo de energia eltrica durante o ms ou o ano, etc.

PUC Minas Virtual

voltar

26

Probabilidade e Estatstica

sumrio

voltar

sumrio

Exemplo:
Movimento Mensal de Compras de uma agencia em 1972
Meses

Valores (R$1.000,00)

Janeiro

12

Fevereiro

13

Maro

14

Abril

12

Maio

15

Junho

19

Julho

17

Agosto

18

Setembro

14

Outubro

16

Novembro

12

Dezembro

18

Fonte: Departamento financeiro da Agncia (dados Fictcios)

Movimento Mensal de Compras de uma agencia em 1972

Dez
Nov

Jan
20
15

Fev
Mar

10
5

Out

Abr

Set

Mai
Ago

Jun
Jul

Fonte: Departamento financeiro da Agncia (dados Fictcios)

PUC Minas Virtual

voltar

27

Probabilidade e Estatstica

sumrio

voltar

sumrio

UNIDADE 2
Amostragem
2.1.
2.2.
2.3.
2.4.
2.5.
2.6.

Importncia da Amostragem
Conceitos Fundamentais
Amostragem Aleatria Simples
Amostragem Aleatria Estratificada
Amostragem por Conglomerado
Amostragem Sistemtica

Nesta unidade, veremos quais as tcnicas que podemos utilizar para


compor uma amostra. So objetivos especficos desta unidade:
Familiarizar o leitor com a terminologia empregada na pesquisa de
um fenmeno;
Identificar os fatores que afetam a quantidade de informaes de um
fenmeno;
Explicar como utilizar a Tabelas de Nmeros Aleatrios (TNA) para
selecionar amostras aleatrias.
2.1. Importncia da Amostragem
Na realizao de qualquer estudo, quase nunca possvel examinar todos os elementos da populao

de interesse. Temos usualmente que trabalhar com uma

amostra da populao. A inferncia estatstica nos d elementos para generalizar,


de maneira segura, as concluses obtidas da amostra para a populao. Mas, para
as inferncias serem corretas, necessrio garantir que a amostra seja
representativa da populao, isto , a amostra deve possuir as mesmas
caractersticas bsicas da populao no que diz respeito ao fenmeno pesquisado.
errneo pensar que, caso tivssemos acesso a todos os elementos da populao,
seramos mais precisos. Os erros de coleta e manuseio de um grande nmero de
dados so maiores do que as imprecises a que estamos sujeitos quando generalizamos, via inferncia, as concluses de uma amostra bem selecionada.

PUC Minas Virtual

voltar

28

Probabilidade e Estatstica

sumrio

voltar

sumrio

Em se tratando de amostra, a preocupao central que ela seja representativa.


preciso que a amostra, ou as amostras que vo ser usadas sejam obtidas por processos adequados.
Assim que decidimos obter informaes atravs de um levantamento amostral, temos imediatamente dois problemas:
Definir cuidadosamente a populao de interesse;
Selecionar a caracterstica que iremos pesquisar.
Dados coletados de forma descuidada podem ser to inteis que nenhum processamento estatstico consegue salv-los.
2.2. Conceitos Fundamentais
O conceito de populao intuitivo; trata-se do conjunto de indivduos ou objetos
que apresentam em comum determinadas caractersticas definidas para o estudo.

Amostra - um subconjunto da populao.

Amostragem - so procedimentos para extrao de amostras que representem bem a populao.

Riscos - a margem de erro motivado pelo fato de investigarmos parcialmente (amostras) o universo (populao).

Populao-alvo - a populao sobre a qual vamos fazer inferncias baseadas na amostra.

Para que possamos fazer inferncias vlidas sobre a populao a partir de uma amostra, preciso que essa seja representativa. Uma das formas de se conseguir
representatividade fazer com que o processo de escolha da amostra seja, de alguma forma, aleatrio. Alm disso, a aleatoriedade permite o clculo de estimativas
dos erros envolvidos no processo de inferncia.
Quanto extrao dos elementos, as amostras podem ser:
Com reposio - quando um elemento sorteado puder ser sorteado novamente;
Sem reposio - quando o elemento sorteado s puder figurar uma nica vez na
amostra.
Basicamente, existem dois mtodos para composio da amostra: probabilstico e
no probabilstico (intencional).

PUC Minas Virtual

voltar

29

Probabilidade e Estatstica

sumrio

voltar

sumrio

O mtodo de amostragem probabilstica exige que cada elemento da populao


possua determinada probabilidade de ser selecionado. Normalmente, possuem a
mesma probabilidade. Assim, se N for o tamanho da populao, a probabilidade
de cada elemento ser 1/N. Somente com base em amostragens probabilsticas
pode-se realizar inferncias sobre a populao, a partir dos parmetros estudados na amostra. So elas:
Amostragem Aleatria Simples;
Amostragem Aleatria Estratificada;
Amostragem Sistemtica;
Amostragem por Conglomerado.
Por serem as principais tcnicas estudas, sero mais detalhadamente exploradas no
item 2.3.
Os mtodos no probabilsticos so amostragens em que h uma escolha deliberada dos elementos que compem a amostra. No se pode generalizar os resultados das pesquisas para a populao, uma vez que as amostras no probabilsticas no garantem a representatividade da populao. So elas:

Amostragem Acidental;

Amostragem Intencional;

Amostragem por Quotas.

Amostragem Acidental - formada por elementos que vo aparecendo, que so


possveis de se obter at completar o nmero de elementos da amostra.
Ex: Pesquisa de opinio, em que os entrevistados so acidentalmente escolhidos.
Amostragem Intencional - formada por elementos escolhidos por determinado
critrio, ou seja, escolhe-se intencionalmente um grupo de elementos que iro
compor a amostra.
Amostragem por Cotas - Classificao da populao em termos de propriedades
que se sabe serem relevantes para a caracterstica a ser estudada. Determinao
da proporo da populao para cada caracterstica com base na constituio conhecida, ou estimada, da populao. Fixao de quotas para cada observador, ou
entrevistador, a quem tocar a responsabilidade de selecionar interlocutores ou
entrevistados, de modo que a amostra total observada, ou entrevistada, contenha a
proporo de cada classe.

PUC Minas Virtual

voltar

30

Probabilidade e Estatstica

sumrio

voltar

sumrio

2.3. Amostragem Aleatria Simples


A amostragem aleatria simples um processo para selecionar amostras de tamanho n dentre as N unidades em que foi dividida a populao. Sendo a amostragem realizada sem reposio, que o caso mais comum, existem (N,n) possveis
amostras, todas igualmente provveis. As amostras aleatrias podem ser escolhidas por diversos mtodos, inclusive por tabelas de nmeros aleatrios (TNA) e de
computadores para gerar nmeros aleatrios Na prtica, a amostra aleatria simples escolhida unidade por unidade. As unidades da populao so numeradas de
1 a N. Em seguida, escolhe-se, na tabela de nmeros aleatrios (TNA), (ou por
computador) n nmeros compreendidos entre 1 e N. Esse processo equivalente a
um sorteio no qual se colocam todos os nmeros misturados dentro de uma urna.
As unidades correspondentes aos nmeros escolhidos formaro a amostra.
Observao:
1. Um exemplo de TNA encontra-se no final da unidade 2.
2. A TNA (Tabela de Nmeros Aleatrios) consiste em tabelas que apresentam seqncias dos dgitos de 0 a 9 distribudos aleatoriamente nas linhas(horizontais)

e colunas (verticais). Para obtermos os elementos da

amostra usando a TNA, sorteamos uma linha e uma coluna qualquer para
comearmos a leitura. Por exemplo: escolho 3 linha 15 coluna o digito
encontrado 5. A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa), verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou descendente). A opo, porm, deve ser feita antes de iniciado o processo.
Assim, em nossos exerccios, avaliaes e trabalhos, utilizaremos sempre a TNA
lendo na vertical,

de cima para baixo, considerando sempre as colunas da

esquerda para a direita.


Exemplo de utilizao da TNA
Procure os 10 primeiros nmeros na TNA comeando a leitura na 9 linha e na 5 coluna (lembre-se que cada dgito representa uma coluna.
(Resposta: 1, 0, 0, 1, 8, 4, 7, 0, 1, 3)
3. Para retirar amostras em populaes com mais de 10 itens, necessitaremos ler
as colunas quantos dgitos comporem o nmero total de itens da populao. Exemplo: para retirarmos 5 amostras de uma populao com 300 itens, temos

PUC Minas Virtual

voltar

31

Probabilidade e Estatstica

sumrio

voltar

sumrio

que ler trs colunas para conseguirmos valores entre 001 e 300. Se o nmero
sorteado superar o nmero de elementos rotulados, abandona-se o nmero sorteado, prosseguindo-se o processo. Considerando 9 linha e 5 coluna temos
como resposta : 124,056,094,143,014.
Outras tcnicas de amostragem so preferveis aleatria simples, pois levam
em considerao a composio da populao, facilitando o trabalho de seleo
de amostras e aumentando a preciso.
Exemplo:
Vamos obter uma amostra representativa de 8 itens para a pesquisa da
estatura de noventa alunos de uma escola. Utilize a TNA (3 linha e 8
Coluna).
Resoluo:
Numeramos os alunos de 01 a 90;
Iniciamos o processo de sorteio dos itens da amostra na TNA considerando as colunas 8 e 9, pois 90 so dois dgitos;
A amostra ser os alunos correspondentes aos nmeros: 46, 58, 16,
51, 88, 09, 89, 14.
2.4. Amostragem Aleatria Estratificada
Uma amostra estratificada obtida separando-se as unidades da populao em
grupos no superpostos chamados estratos, e selecionando-se independentemente
uma amostra aleatria simples de cada estrato. Existem dois tipos de amostragem
estratificada:
De igual tamanho;
Proporcional.
No primeiro tipo, sorteia-se igual nmero de elementos em cada estrato. Esse processo utilizado quando o nmero de elementos por estrato for aproximadamente
o mesmo.

PUC Minas Virtual

voltar

32

Probabilidade e Estatstica

sumrio

voltar

sumrio

No outro caso, utiliza-se a amostragem estratificada proporcional, cujo processo de


calcular o nmero de amostras por estrato :
N N de unidades da populao
n N de unidades das amostras
Na N de unidades do estrato A
na N de amostras de A

Na na
n
= na = .Na
N n
N

Exemplo:
Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam meninos e 36 sejam meninas, vamos obter uma amostra proporcional estratificada de 10%.
Resoluo:
So, portanto, dois estratos (sexo masculino e feminino) e queremos
uma amostra de 10% da populao;
Calcula-se o nmero de amostras de cada estrato.

Sexo

Populao

10%

Nmero de amostras

54

5,4

36

3,6

Total

90

9,0

Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90, meninas. O prximo passo o mesmo do
exemplo anterior.

PUC Minas Virtual

voltar

33

Probabilidade e Estatstica

sumrio

voltar

sumrio

2.5. Amostragem por Conglomerado


Uma amostra por conglomerado uma amostra aleatria simples na qual cada unidade de amostragem um grupo, ou um conglomerado de elementos.
O primeiro passo na amostragem por conglomerado especificar conglomerados
apropriados. Os elementos em um conglomerado tendem a ter caractersticas similares, portanto, o fato de novas medidas serem tomadas num conglomerado no
implica necessariamente aumento de informao sobre o parmetro populacional.
Como regra geral, o nmero de elementos num conglomerado dever ser pequeno
em relao ao tamanho da populao e o nmero de conglomerados dever ser
razoavelmente grande.
Na amostragem por conglomerado a populao dividida em grupos. E selecionamse amostras aleatrias simples de grupos e, ento, todos os itens dos grupos (conglomerados) selecionados faro parte da amostra.
Exemplo:
Em um levantamento da populao de uma cidade, podemos dispor do
mapa indicando cada quarteiro e no dispor de uma relao atualizada
dos seus moradores. Pode-se, ento, colher uma amostra dos quarteires e fazer a contagem completa de todos os que residem naqueles
quarteires sorteados.
2.6. Amostragem Sistemtica
Quando os elementos da populao j se encontram ordenados, no h necessidade de se construir o sistema de referncia. Nesses casos, a seleo dos elementos
que constituiro a amostra pode ser por um sistema imposto pelo pesquisador.
Em geral, para se obter uma amostra sistemtica de n elementos de uma populao de tamanho N, K deve ser menor ou igual a N/n. No possvel determinar K,
precisamente, quando o tamanho da populao desconhecido, mas pode-se supor
um valor de k de tal modo que seja possvel obter uma amostra de tamanho n. Em
vez da amostragem aleatria simples, pode-se empregar a amostragem sistemtica
pelas seguintes razes:
a amostragem sistemtica mais fcil de se executar e, por isso, est menos
sujeita a erros do entrevistador do que aqueles que acontecem na aleatria simples;

PUC Minas Virtual

voltar

34

Probabilidade e Estatstica

sumrio

voltar

sumrio

a amostragem sistemtica freqentemente proporciona mais informaes por


custo unitrio do que a aleatria simples.
Diretrizes para calcular as amostras:
1 - Estabelecer o intervalo de amostragem K:

K=

N
n

OBS: Para valores de K=N/n , arredondar para o valor inteiro menor.


2 - Iniciar aleatoriamente a composio da amostra.
b inicio (n de ordem inicial sorteado na TNA).
OBS:

0<b K

3 - Composio da Amostra:
1 item b
2 item b + K
3 item b + 2k
Exemplo:
1 Suponhamos uma rua contendo quinhentos prdios, dos quais desejamos obter uma amostra formada de vinte prdios. (TNA, 3Linha e 5
Coluna)
Soluo:
a)

Calcular K (intervalo de amostragem)

b)

K=500/20, K=25

c)

b= 12 (valor encontrado na TNA)

d)

Composio da amostra
1 item 12
2 item 12 + 25 = 37
3 item 12 + 2*25 = 62
20 item 12 +19*25 = 487

PUC Minas Virtual

voltar

35

Probabilidade e Estatstica

sumrio

voltar

sumrio

Tabela de Nmeros Aleatrios


COLUNA

01
02
03
04
05
06
07
08
09
10

9486
3155
6136
7249
0071
1558
2204
7285
1735
2709

9821
9878
2824
9182
9871
4775
5318
8390
1248
0561

11
12
13
14
15

3522
6074
3359
6030
8669

16
17
18
19
20
21
22
23
24
25

13

17

21

6074
3359
6030
8669
6678
1699
8337
9134
9807
4397

1432
8244
4256
7423
0140
1652
3867
9863
1910
1135

0995
8952
3870
1768
9522
2555
6184
9486
3155
6136

0941
1432
8244
4256
7423

5569
0995
8952
3870
1768

5800
0157
0084
5725
8147

7249
0071
1558
2204
7285

9182
9871
4775
2318
8390

6678
1699
8337
9134
9807
4397
5569
0995
8952
3870

0140
1652
3867
9863
1910
1135
5800
0157
0084
5725

9522
2555
6184
9486
3155
6136
7249
0071
1558
2204

0995
4765
2018
9821
9878
2824
9182
9871
4775
5318

1735
2709
3522
6074
3359
6030
8669
6678
1699
8337

26
27
28
29
30

7425
8961
3298
2276
9557

3566
8175
6173
4898
8114

6151
0879
1741
2394
1576

4731
6945
3874
1098
9767

31
32
33
34
35

8650
2885
1841
4638
1320

1920
8101
8626
8030
7033

2533
1467
0344
0018
1218

36
37
38
39
40

1488
4353
7816
8600
1057

5803
4347
5817
9738
1550

6790
8565
9764
5415
8773

25

LINHA
0157 0071
0084 1558
5725 2204
8147 7285
0995 1735
4765 2709
2018 3522
9821 6074
9878 3359
2824 6030

29

33

37

41

45

49

9871
4775
5318
8390
1248
0561
0941
1432
8244
4256

6678
1699
8337
9134
9807
4397
5569
0995
8952
3870

0140
1652
3867
9863
1910
1135
5800
0157
0084
5725

9522
2555
6184
9486
3155
6136
7249
0071
1558
2204

0995
4765
2018
9821
9878
2824
9182
9871
4775
5318

1735
2709
3522
6074
3359
6030
8669
6678
1699
8337

8669
6678
1699
8337
9134

7423
0140
1652
3867
9863

1768
9522
2555
6184
9486

8147
0995
4765
2018
9821

7285
1735
2709
3522
6074

8390
1248
0561
0941
1432

9134
9807
4397
5569
0995

1248
0561
0941
1432
8244
4256
7423
0140
1652
3867

9807
4397
5569
0995
8952
3870
1768
9522
2555
6184

1910
1135
5800
0157
0084
5725
8147
0995
4765
2018

3155
6136
7249
0071
1558
2204
7285
1735
2709
3522

9878
2824
9182
9871
4775
5318
8390
1248
0568
0941

3359
6030
8669
6678
1699
8337
9134
9807
4397
5569

8244
4256
7423
0140
1652
3867
9863
1910
1135
5800

8952
3870
1768
9522
2555
6184
8486
3155
6136
7249

6489
8029
9321
4063
1486

2491
9119
3748
5393
7161

2765
5990
7507
0226
5606

8525
1063
0170
8144
6295

7849
9444
0568
4778
3503

1488
8320
9112
7471
5050

8833
1740
1275
1764
9549

2597
6131
0924
4939
2500

1333
9907
3054
8063
9666

7755
0080
4344
7760
5605

5324
7962
7446
9819
4206

3731
5999
0867
4276
2878

3414
9562
6157
0650
0230

2153
5819
8935
3516
1740

3815
1562
4413
5159
4553

0626
6793
2363
9236
8729

5718
2065
7187
3257
5827

8679
0239
8980
1694
7176

6801
8253
2488
7157
8703

9368
2231
8789
8426
3003

0465
8789
7387
7152
4302

4819
4231
2172
8705
4034

0065
2585
0896
5829
2478

7633
0157
1038
0164
1078

3950
2037
6047
8330
0429

2109
7835
9539
9152
7189

7027
1320
3510
6045
0778

5824
8999
1343
8129
3260

5057
9181
8098
2293
5969

PUC Minas Virtual

voltar

36

Probabilidade e Estatstica

sumrio

voltar

sumrio

UNIDADE 3
Distribuio de Freqncia
3.1. Conceitos
3.2. Elementos de uma distribuio de freqncia: amplitude total,
limites de classe, amplitude do intervalo de classe, ponto
mdio da classe, freqncia absoluta, relativa e acumulada
3.3. Regras Gerais para a elaborao de uma distribuio
de freqncia
3.4. Grficos representativos de uma distribuio de freqncia:
histograma, polgono de freqncia e ogiva

Vamos considerar, nesta unidade, o estudo detalhado da distribuio de


freqncia, que a forma pela qual podemos descrever os dados estatsticos resultantes de variveis quantitativas. So objetivos desta unidade:
Compor uma distribuio de freqncia com ou sem intervalos de
classe;
Determinar o quadro de freqncias, eles so teis para condensar
grandes conjuntos de dados, facilitando o sua utilizao;

Representar uma distribuio de freqncia atravs de histograma,


polgono e ogiva.
3.1. Conceitos
Ao analisarmos um conjunto de dados, devemos determinar se temos uma amostra ou uma populao. Essa determinao afetar no somente os mtodos utilizados, mas tambm as concluses, pois se estamos trabalhando com uma amostra os
resultados encontrados so estimativas da populao.
Nem sempre possvel compreender o significado contido numa amostragem por
simples inspeo visual dos dados numricos coletados. Entretanto, entendemos
que o sucesso de uma deciso depender da nossa habilidade em compreender as
informaes contidas nesses dados. O objetivo deste estudo mostrar a organizao, apresentao e anlise grfica de uma srie de dados, matria prima das distribuies de freqncias e dos histogramas. Freqncia de uma observao o

PUC Minas Virtual

voltar

37

Probabilidade e Estatstica

sumrio

voltar

sumrio

nmero de repeties dessa observao, ou seja, quantas vezes determinado fenmeno acontece.
Os dados podem ser classificados como:

Dados brutos so os dados originais, que ainda no se encontram prontos


para anlise, por no estarem numericamente organizados. (Tambm so conhecidos como Tabela Primitiva).

Exemplo: Nmero mensal de aparelhos defeituosos na Empresa X.

1995

1996

1997

1998

Rol so os dados brutos, organizados em ordem crescente ou decrescente.


Exemplo: Considerando o exemplo anterior temos:

PUC Minas Virtual

voltar

38

Probabilidade e Estatstica

sumrio

voltar

sumrio

Dados discretos a varivel discreta quando assume valores em pontos da


reta real.
Exemplo: nmero de erros em um livro: 0,1,2,3,4,....
nmero de filhos de vrios casais: 1,2,3,4,.....
quantidade de acidentes em determinada rodovia: 4,10,12,15,....

Dados contnuos a varivel pode assumir, teoricamente, qualquer valor em


certo intervalo da reta real.
Exemplo: peso de alunos: 55,5 kg; 61,0kg; 63,4 kg; 68,1 kg.......
distncia entre cidades: 35,5 km; 48,6 km; 100,10 km; ....

Dados Tabelados no agrupados em classes os valores da varivel aparecem individualmente.


Exemplo, considerando os dados da tabela anterior:

N de aparelhos
com defeitos

N de meses

06

11

09

08

08

05

01

Total

48

PUC Minas Virtual

voltar

39

Probabilidade e Estatstica

sumrio

voltar

sumrio

Dados Tabelados agrupados em classes - os valores da varivel no aparecem individualmente, mas agrupados em classes.

Notas

N de alunos

0 |--- 20

020

20 |--- 40

065

40 |--- 60

230

60 |--- 80

160

80 |--- 100

025

Total

580

3.2. Elementos de uma distribuio de freqncia:


amplitude total, limites de classe, amplitude do intervalo de classe,
ponto mdio da classe, freqncia absoluta, relativa e acumulada
3.2.1.

Amplitude total (A) - a diferena entre o maior e o menor nmero


do rol.
Exemplo: Estatura de 40 alunos do Colgio A em cm. (Dados ordenados
em ordem crescente, por colunas)

150

154

155

157

160

161

162

164

166

169

151

155

156

158

160

161

162

164

167

170

152

155

156

158

160

161

163

164

168

172

153

155

156

160

160

161

163

165

168

173

A = 173 150 = 23

PUC Minas Virtual

voltar

40

Probabilidade e Estatstica

sumrio

voltar

3.2.2.

sumrio

Nmero de classes (K) e Classe (i) no existe regra fixa para se


determinar o nmero de classes. Podemos utilizar:

A Regra de Sturges, que nos d o nmero de classes em funo do nmero de


valores da varivel:

K = 1+ 3,3. log n , onde n o nmero de itens que compe a amostra;


Ou

K = 5 para n 25 e k n , para n > 25.


Exemplo: considerando o exemplo anterior n=40

Pela formula de Sturges: K= 1+3,3log40 = 6,28 K=6


Adotando K = n , temos k = 40 =6,3 K=6
3.2.3.

Amplitude de um intervalo de classe (h) ou simplesmente intervalo de classe a medida do intervalo que define a classe.
h=A/K
Exemplo, considerando o exemplo anterior:
H = 23/ 6 = 3,83 h = 4

3.2.4.

Limites de Classe denominamos limites de classe os extremos de


cada classe. Assim temos:

limite inferior (linf) e


limite superior (Lsup)
Observao: Vamos trabalhar com intervalos fechados esquerda e abertos
direita; isso significa que valores iguais ou superiores ao limite inferior so considerados nessa classe e valores iguais e/ou superiores ao limite superior so considerados na classe abaixo.

PUC Minas Virtual

voltar

41

Probabilidade e Estatstica

sumrio

voltar

sumrio

Exemplo: Do exemplo anterior, temos:

Classes

150 | 154

154 | 158

158 | 162

11

162 | 166

166 | 170

170 | 174

40

Na segunda classe, temos:

L2=158
l2 = 154
3.2.5.

Ponto Mdio da Classe - (xi) , como o prprio nome indica, o


ponto que divide o intervalo de classe em duas partes iguais. Para
obtermos o ponto mdio de uma classe, calculamos:

xi =

linf + Lsup
2

Exemplo: considerando a segunda classe do exemplo anterior, temos:

x2 =

154 + 158
= 156 x 2 = 156
2

3.2.6. Freqncias

Freqncias simples ou absoluta da classe i (ni) - so os valores que realmente representam o nmero de dados de cada classe. A soma das freqncias
simples igual ao nmero total dos dados.
Exemplo: considerando a segunda classe do exemplo anterior, temos:
n2 = 9 .

PUC Minas Virtual

voltar

42

Probabilidade e Estatstica

sumrio

voltar

sumrio

Freqncias relativas (fi) so os valores das razes entre as freqncias


simples e o nmero total de dados.

fi =

ni
n

Exemplo: considerando a segunda classe do exemplo anterior, temos:


f2 = 9/40=0,225 .
Obs: as freqncias relativas permitem a anlise ou facilitam as
comparaes.

Freqncia acumulada (Ni) o total das freqncias de todos os valores


inferiores ao limite superior do intervalo de uma dada classe:
Exemplo: Considerando a freqncia acumulada da quarta classe (N4),
temos:
N4= n1+n2+n3+n4= 4+9+11+8 = 32

Freqncia acumulada relativa (Fi) a freqncia acumulada da classe,


dividida pela freqncia total da distribuio.

Fi =

Ni
n

Exemplo: para o exemplo anterior, F4 = 0,8 .


NOTA Usualmente, denominamos:
Freqncia relativa acumulada crescente da classe i Fi.
Obs: Fi pode ser entendido como sendo a percentagem de observaes abaixo
do limite superior da classe i.
Freqncia relativa acumulada decrescente da classe i Fi.
Obs: Fi e a porcentagem de observaes acima do limite inferior da classe i.

PUC Minas Virtual

voltar

43

Probabilidade e Estatstica

sumrio

voltar

sumrio

3.3. Regras Gerais para a elaborao de uma distribuio de freqncia


Os principais estgios na construo de uma distribuio de freqncia para dados
amostrais so:
1. Encontrar a amplitude total do conjunto de valores observados;
2. Escolher o nmero de classes;

K = 1 + 3,3 log n ou k = n
3. Determinar a amplitude do intervalo de classe;

h=

A
k

4. Determinar os limites de classe;


5. Construir a tabela de freqncias.
Exemplo:
Calcule as freqncias e o ponto mdio dos dados abaixo:
Alturas de 50 estudantes do sexo masculino da Univesidade XYZ
33

35

35

39

41

41

42

45

47

48

50

52

53

54

55

55

57

59

60

60

61

64

65

65

65

66

66

66

67

68

69

71

73

73

74

74

76

77

77

78

80

81

84

85

85

88

89

91

94

97

Soluo: Amplitude : A = 97-33 = 64


Nmero de Classes : K = 50 7
Intervalo de classe : h =64/7 10

PUC Minas Virtual

voltar

44

Probabilidade e Estatstica

sumrio

voltar

sumrio

Classes

Ni

fi

Fi

xj

30 | 40

0,08

0,08

35

40 | 50

10

0,12

0,20

45

50 | 60

18

0,16

0,36

55

60 | 70

13

31

0,26

0,62

65

70 | 80

40

0,18

0,80

75

80 | 90

47

0,14

0,94

85

90 |100

50

0,06

1,0

95

50

3.4. Grficos representativos de uma distribuio de freqncia:


histograma, polgono de freqncia e ogiva
Uma distribuio de freqncia pode ser representativa graficamente pelo histograma, pelo polgono de freqncia e pelo polgono de freqncia acumulada (Ogiva
de Galton).
Histograma formado por um conjunto de retngulos justapostos, cujas bases
se localizam sobre o eixo horizontal, de tal modo que seus pontos mdios coincidem com os pontos mdios dos intervalos de classe.

As larguras dos retngulos so iguais s amplitudes dos intervalos de classe.


As alturas dos retngulos devem ser proporcionais s freqncias das classes,
sendo igual a amplitude dos intervalos.

Histograma
ni
12

30

40

50

PUC Minas Virtual

voltar

60

45

70

80

90

100

Probabilidade e Estatstica

sumrio

voltar

sumrio

Polgono de freqncia um grfico em linha, sendo as freqncias marcadas


sobre perpendiculares ao eixo horizontal, levantada pelos pontos mdios dos intervalos de classe.
Para realmente obtermos um polgono (linha fechada), devemos completar a figura,
ligando os extremos da linha obtida aos pontos mdios da classe anterior primeira
e da posterior ltima, da distribuio.
Polgono de Freqncia

ni
12

35

45

55

65

75

85

95

Ponto mdio

Polgono de freqncia acumulada traado marcando-se as freqncias acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe.
Polgono de Freqncia Acumulada
F
50
47
40
31

18
10
4

30
100

40

50

PUC Minas Virtual

voltar

60

46

70

80

90

Probabilidade e Estatstica

sumrio

classes

voltar

Observao:

Uma

distribuio

sumrio

de

freqncia

sem

intervalos

de

classe

representada graficamente por um diagrama onde cada valor da varivel


representado por um segmento de reta vertical e de comprimento proporcional
respectiva freqncia.

ni
12

PUC Minas Virtual

voltar

47

Probabilidade e Estatstica

sumrio

xi

voltar

sumrio

UNIDADE 4
Medidas de Posio
4.1.
4.2.
4.3.
4.4.
4.5.

Introduo
Mdia aritmtica simples e ponderada e suas propriedades
Moda: Dados agrupados e no agrupados em classes
Mediana: Dados agrupados e no agrupados em classes
Mdia Geomtrica: Dados agrupados
e no agrupados em classes
4.6. Mdia Harmnica: Dados agrupados
e no agrupados em classes
4.7. Separatrizes: Quartis, Decis e Percentis

Nesta unidade, veremos as tendncias caractersticas de cada distribuio, destacando as medidas de posio central, que recebem tal denominao pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. So objetivos desta unidade:

Calcular as medidas de posio central;

Diferenciar as medidas - moda, mdia e mediana;

Utilizar as separatrizes para melhor interpretar os resultados.

4.1. Introduo
Nas sees anteriores, vimos a sintetizao dos dados sob a forma de tabelas, grficos e distribuies de freqncias. Agora, vamos destacar o clculo das medidas
que possibilitam localizar a maior concentrao de valores de uma dada distribuio, isto , se ela se localiza no incio, no meio ou no final, ou, ainda, se h uma
distribuio por igual. Tais medidas possibilitam comparaes de sries de dados
entre si pelo confronto desses nmeros.
No entanto, para ressaltar as tendncias caractersticas de cada distribuio, isoladamente, ou em confronto com outras, necessitamos introduzir os elementos tpicos da distribuio, que so:

Medidas de posio;

Medidas de variabilidade ou disperso;

Medidas de assimetria;

Medidas de curtose.

PUC Minas Virtual

voltar

48

Probabilidade e Estatstica

sumrio

voltar

sumrio

As medidas de posio mais importantes so as medidas de tendncia central, que


destacamos:

A mdia aritmtica;

A mediana;

A moda.

As outras medidas de posio so as separatrizes, que englobam:

A mediana;

Os quartis;

Os decis;

Os percentis.

Primeiramente, vamos estudar as principais medidas de tendncia central, depois


veremos as separatrizes e, na prxima unidade, as medidas de Disperso, Assimetria e Curtose.
4.2. Mdia aritmtica simples e ponderada e suas propriedades

o quociente da diviso da soma dos valores da varivel pelo nmero deles. A mdia (aritmtica) , de modo geral, a mais importante de todas as medidas descritivas.
Dados no tabelados
n

x=

xi : valor observado
n : nmero total de observaes

xi
i =1

Exemplo: Suponha que o tempo de vida til de 10 aparelhos de telefone so:


10

29

26

28

15

23

17

25

20. Qual a mdia de vida til

destes aparelhos?
Soluo:

X = 10 + 29 + 26 + 28 + 15 + 23 + 17 + 25 + 0 + 20 = 193
x = 193 = 19,3 ,
x=
n

10

portanto mdia de vida til dos aparelhos so 19,3 anos.

PUC Minas Virtual

voltar

49

Probabilidade e Estatstica

sumrio

voltar

sumrio

Dados Tabelados

Sem intervalo de Classe


n

x =

x n
i

i =1

Xi : valor observado
ni : n de observaes por classe
n : n de observaes totais

Com intervalo de Classe


n

X =

x i ni

x i : ponto mdio da classe

i =1

ni : n de observaes

s vezes, a mdia pode ser um nmero diferente de todos os da srie de dados


que ela representa.
4.3. Moda (Mo): Dados agrupados e no agrupados em classes
o valor que ocorre com maior freqncia em um conjunto de dados, e que denominado valor modal. Baseado nesse contexto, um conjunto de dados pode apresentar mais de uma moda. Nesse caso, dizemos ser multimodais; caso contrrio,
quando no existe um valor predominante, dizemos que amodal.
Dados no tabelados: o valor modal o predominante na distribuio.
Exemplo: Nos valores abaixo, qual o valor modal?
3

10

11

12

13

Soluo: Mo= 9
Dados tabelados

Sem intervalo de Classe: O valor modal o valor que possuir maior freqncia.
Exemplo:
Classes

PUC Minas Virtual

voltar

50

Probabilidade e Estatstica

sumrio

voltar

06

11

sumrio

09

08

08

05

01

48

Soluo: o valor predominante o nmero 1, que ocorreu 11 vezes.


Temos, portanto, Mo=1.

Com intervalo de classe: tratando-se de dados agrupados em classe, a moda


no percebida to facilmente como nos casos anteriores. Para calcular o valor modal nesses casos, podemos utilizar os seguintes processos:
1 Processo: Frmula de Czuber

Mo = linf + hMo

nmo nant
(nmo nant ) + (nmo n post )

onde constatamos:
Classe Modal: Classe de maior freqncia
n

mo:

freqncia simples da classe modal

nant : freqncia simples anterior classe modal


npost : freqncia simples posterior classe modal
linf: limite inferior da classe modal
hMo: intervalo de classe modal

2 Processo: Frmula de Pearson

M o = 3Md 2 X
onde constatamos:
Md = Mediana
X

= Mdia

PUC Minas Virtual

voltar

51

Probabilidade e Estatstica

sumrio

voltar

sumrio

Exemplo - Determinar a moda para a distribuio:

Classes

0|--- 1

1|--- 2

2|--- 3

3|--- 4

4|--- 5

ni

10

17

43

Soluo: Utilizando a frmula de Czuber

a classe modal a classe 2|----3


linf = 2
hMo = 1
nMo = 17
nant = 10
npost =8
Substituindo esses valores na frmula, encontramos: Mo= 2,44
4.4. Mediana (Md): Dados agrupados e no agrupados em classes
A mediana uma medida de posio. , tambm, uma separatriz, pois divide o
conjunto em duas partes iguais, com o mesmo nmero de elementos. O valor da
mediana encontra-se no centro da srie estatstica organizada, de tal forma que o
nmero de elementos situados antes desse valor (mediana) igual ao nmero de
elementos que se encontram aps esse mesmo valor (mediana).
Dados no tabelados

Para uma srie com nmero mpar de itens: a mediana corresponde ao valor
central.
EMd - elemento mediano: indica a posio da mediana.

n mpar
EMd = (n+1)/2

Md = X (E Md )

A mediana ser o termo de ordem (n+1)/2.

PUC Minas Virtual

voltar

52

Probabilidade e Estatstica

sumrio

voltar

sumrio

Para uma srie com nmero par de itens: no h termo central nico, mas,
sim, dois termos centrais. A mediana ser dada por:

n par
EMd = n/2

Md =

X (E Md ) + X (E Md +1)
2

A mediana ser a mdia aritmtica entre os termos centrais.


Dados tabelados:
Neste caso, o problema consiste em determinar o ponto do intervalo em que est
compreendida a mediana.

Sem intervalo de classe: devemos, primeiro, obter a localizao da mediana


na srie atravs do termo de ordem:

E MD =

n
2

Uma vez localizada a posio da mediana, devemos verificar o valor numrico da


varivel correspondente a essa posio.

Com intervalo de classe: localizada a classe mediana, calculamos o valor da


mediana pela frmula:

Md = linf + hMd

Nant

nMd

onde temos:
linf: limite inferior da classe mediana.
hMo: intervalo de classe mediana.
nMd : freqncia simples absoluta na classe mediana.
Nant : freqncia acumulada absoluta anterior classe mediana.
Classe Mediana: classe onde est o elemento mediano.

PUC Minas Virtual

voltar

53

Probabilidade e Estatstica

sumrio

voltar

sumrio

4.5. Mdia Geomtrica (MG): Dados agrupados e no agrupados em classes


Dados no tabelados
A mdia geomtrica de um conjunto de N nmeros x1, x2,x3,......xn a raiz de ordem N do produto desses nmeros:

M G = N x1.x2 . x3 .....xn
Dados agrupados

Sem intervalo de classe


Xi : valor observado
ni : n de observaes da classe

M G = N x1n1 x2 n 2 x3 n3 ....xn n n
Com intervalo de classe

M G = N x1n1 x 2 n2 x 3 n3 ....x n nn

x i : ponto mdio

ni : n de observaes

4.6. Mdia Harmnica (Mh): Dados agrupados e no agrupados em classes


Sejam x1, x2, x3,......xn, valores de x, associados s freqncias absolutas n1, n2,
n3,......nn, respectivamente.
A mdia harmnica de X definida por:

Mh =

n
=
n1 n 2 n 3
nn
+
+
+ ........ +
x1 x 2
x3
xn

n
n

i =1

ni
xi

Para dados no agrupados n = 1.


Para dados agrupados sem intervalo de classe xi o valor da varivel.
Para dados agrupados com intervalo de classe xi o ponto mdio da classe.

PUC Minas Virtual

voltar

54

Probabilidade e Estatstica

sumrio

voltar

sumrio

4.7. Separatrizes: Quartis, Decis e Percentis


So valores que ocupam determinados lugares de uma distribuio de freqncia.
Podemos classific-las em:
Quartis: dividem a distribuio em 4 partes iguais
Qi = quartil

i=1,2,3

Q1 = 1 quartil, valor situado de tal modo na srie que uma quarta parte (25%)
dos dados menor que ele e as trs quartas partes restantes (75%) so maiores.

Q2 = 2 quartil, evidentemente, coincide com a Mediana (Q2 = Md).


Q3 = 3 quartil, valor situado de tal modo que as trs quartas partes (75 %) dos
termos so menores que ele e uma quarta parte 25 % maior.

3n

N ant
4
.h
Q3 = lQ3 +
nQ3

N ant
4
.h
Q1 = lQ1 +
nQ1
Onde temos:
linf : limite inferior da classe do quartil considerado
hQ: intervalo de classe do quartil considerado

nQ : freqncia simples absoluta do quartil considerado


Nant : freqncia acumulada anterior classe do quartil considerado
Decis: dividem a distribuio em 10 partes iguais
Di = decil

i=1,2,3, , 9

1 Passo: Calcula-se em que K = 1,2,3,......,9;


2 Passo: Identifica-se a classe DK , pela Nac ;
3 Passo: Aplica-se a frmula:

DK = l DK

lDK: limite inferior da Classe Dk


N : tamanho da amostra
h : amplitude da classe
nDK: freqncia da classe
N(ant): freqncia acumulada da classe

KN

N ( ant )

10
h
+
nDK

PUC Minas Virtual

voltar

55

Probabilidade e Estatstica

sumrio

voltar

sumrio

Percentis:: dividem a distribuio em 100 partes iguais.


Pi = centil

i=1,2,3, , 99

1 Passo: Calcula-se em que K = 1,2,3,4,............98,99


2 Passo: Pela Nac identifica-se a classe Pi
3 Passo: Aplica-se a frmula

PK = l PK

lPK: limite inferior da classe


em que, K = 1,2,3,...,98,99.
N : tamanho da amostra
N(ant): freqncia acumulada anterior classe
h : amplitude da classe
nPK: freqncia da classe

KN

N ( ant )

100
h
+
n PK

Exemplo:
1- Num acampamento infantil, foram obtidas as seguintes estaturas:
Estaturas

120|--- 128

128|---136

136|--- 144

144|--- 152

152|--- 160

frequencia

12

16

13

Calcule:
a) O 1 Quartil (Q1);
b) o 4 Decil (D4);
Soluo:
Primeiro vamos estruturar a tabela de distribuio de Freqncias, como estamos trabalhando com intervalos de classe , temos que calcular os pontos mdios de cada classe. Depois iremos utilizar as frmulas para cada item que queremos calcular.

PUC Minas Virtual

voltar

56

Probabilidade e Estatstica

sumrio

voltar

sumrio

Estaturas (cm)

Xi (Ponto mdio)

120|--- 128

124

128 |--- 136

12

18

132

136 |--- 144

16

34

138

144 |--- 152

13

47

148

152 |--- 160

54

156

Total

54

a) Calculo de Q1,
Para calcular Q1, temos que primeiro identificar a classe que esta o valor, para
isto consideramos :

N 54
=
= 13,5 , que vamos neste momento arredondar para 14, pela frequencia
4
4
acumulada procuramos a classe que encontra o 14 elemento, que a 2 classe
com limites de 128 |--- 136.
Agora usamos a formula para calcular Q1

N ant
4
.h
Q1 = lQ1 +
nQ1
Onde:
linf : limite inferior da classe do quartil considerado = 128
hQ: intervalo de classe do quartil considerado = 8
nQ : freqncia simples absoluta do quartil considerado = 12
Nant : freqncia acumulada anterior classe do quartil considerado =6
Substituindo estes valores na expresso acima temos

Q1 = 128 +

(13,5 6) * 8 = 133
12

PUC Minas Virtual

voltar

57

Probabilidade e Estatstica

sumrio

voltar

sumrio

b) Calculo de D4
Primeiro identificamos a classe que esta o valor;

KN 4 x54
=
= 21,6 = 27 , atravs da freqncia acumulada identificamos a clas10
10
se que encontra o 27 , que a 3 classe com limites de 136 |--- 144
Agora usamos a frmula

DK = l DK

KN

N ( ant )

10
h
+
nDK

onde:
lDK: limite inferior da Classe Dk = 136
N : tamanho da amostra = 54
h : amplitude da classe = 8
nDK: freqncia da classe = 16
N(ant): freqncia acumulada da classe anterior = 18
Substituindo estes valores na expresso acima temos:

D4 = 136 +

(21,6 18) * 8 = 137,8


16

PUC Minas Virtual

voltar

58

Probabilidade e Estatstica

sumrio

voltar

sumrio

UNIDADE 5
Medidas de Disperso
5.1. Disperso
5.2. Assimetria
5.3. Curtose

A interpretao de dados estatsticos exige que se realize um nmero


maior de estudos, alm das medidas de posio. Nesta unidade, veremos que as medidas de disperso servem para verificar a representatividade das medidas de posio, que o nosso principal objetivo.
5.1. Disperso
So medidas estatsticas utilizadas para avaliar o grau de variabilidade, ou disperso, dos valores em torno da mdia. Servem para medir a representatividade da
mdia.
Absoluta

Amplitude (A)
Varincia (S2)
Desvio padro (S)
Relativa

Coeficiente de Variao (CV)

PUC Minas Virtual

voltar

59

Probabilidade e Estatstica

sumrio

voltar

sumrio

Amplitude Total (A)


a diferena entre o maior e o menor dos valores da srie. A utilizao da amplitude total como medida de disperso muito limitada, pois sendo uma medida que
depende apenas dos valores externos, instvel, no sendo afetada pela disperso
dos valores internos.
Varincia (S2)
A varincia leva em considerao os valores extremos e os valores intermedirios,
isto , expressa melhor os resultados obtidos. A varincia relaciona os desvios em
torno da mdia, ou, mais especificamente, a mdia aritmtica dos quadrados dos
desvios.
Dados Brutos
_

S =
2

( xi x)

Dados Agrupados

xi2 ni

xi ni
S2 =

n 1
n 1

i =1

n 1

Onde temos que:

Para dados agrupados sem intervalo de classe, xi o valor da varivel.


Para dados agrupados com intervalo de classe, xi o ponto mdio da classe.
Para dados amostrais, o denominador n-1; para dados
populacionais, usamos no denominador o valor de n.

Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero
em unidade quadrada em relao varivel em questo, o que, sob o ponto de
vista prtico, um inconveniente; por isso, tem pouca utilidade na estatstica descritiva, mas extremamente importante na inferncia estatstica e em combinaes
de amostras.

PUC Minas Virtual

voltar

60

Probabilidade e Estatstica

sumrio

voltar

sumrio

Desvio Padro (S)


O desvio-padro a medida mais usada na comparao de diferenas entre conjuntos de
dados, por ter grande preciso. O desvio padro determina a disperso dos valores em relao mdia e calculado por meio da raiz quadrada da varincia.

S = S2

Coeficiente de Variao (CV)


Trata-se de uma medida relativa de disperso til para a comparao em termos
relativos do grau de concentrao. O coeficiente de variao a relao entre o
desvio padro (S) e a mdia x . da mdia de sries distintas.

CV =

S
x

Diz- se que uma distribuio tem:


Baixa disperso: CV

15%

Mdia disperso: 15%< CV<30%


Alta disperso: CV

30%

5.2. Assimetria
Estas medidas referem-se forma da curva de uma distribuio de freqncia,
mais especificamente do polgono de freqncia ou do histograma.
Denomina-se assimetria o grau de afastamento de uma distribuio da unidade de
simetria.
Em uma distribuio simtrica, tem-se igualdade dos valores da mdia, mediana
e moda.

PUC Minas Virtual

voltar

61

Probabilidade e Estatstica

sumrio

voltar

sumrio

Simetria

X = Mo = Md

Toda distribuio deformada sempre assimtrica. Entretanto, a assimetria pode


dar-se na cauda esquerda ou na direita da curva de freqncias.

Em uma distribuio assimtrica positiva, ou assimetria direita, tem-se:


Assimetria direita (ou positiva)

Mo < Md < X

Mo Md X

Em

uma

distribuio

assimtrica

negativa,

ou

assimetria

predominam valores inferiores Moda.


Assimetria esquerda (ou negativa)

X < Md < Mo

X Md Mo

PUC Minas Virtual

voltar

62

Probabilidade e Estatstica

sumrio

esquerda,

voltar

sumrio

Existem vrias frmulas para o clculo do coeficiente de assimetria. As mais utilizadas so:

1 Coeficiente de Pearson

AS =

Mo: valor modal (moda)


S : Desvio padro
X : Mdia

x Mo
S

2 coeficiente de Pearson

AS =

Q1 + Q3 2Md
Q3 Q1

Q1 : valor do 1 Quartil
Q3 : valor do 3 Quartil
Md : valor da Mediana

Quando
AS = 0, diz-se que a distribuio simtrica.

AS > 0, diz-se que a distribuio assimtrica positiva ( direita)

AS > 0, diz-se que a distribuio assimtrica positiva ( direita)

5.3. Curtose
Curtose o grau de achatamento (ou afilamento) de uma distribuio em comparao com
uma distribuio padro (chamada curva normal). De acordo com o grau de curtose, classificamos trs tipos de curvas de freqncia:

Mesocrtica: uma curva bsica de referncia chamada curva padro ou curva normal;

PUC Minas Virtual

voltar

63

Probabilidade e Estatstica

sumrio

voltar

sumrio

Platicrtica: uma curva mais achatada (ou mais aberta) que a curva normal;

Leptocrtica: uma curva mais afilada que a curva normal;

Para medir o grau de curtose utiliza-se o coeficiente:

Q3 Q1
K=
2(P90 P10 )

Q1 : valor do 1 Quartil
Q3 : valor do 3 Quartil
P10 : valor do percentil 10
P90 : valor do percentil 90

Se K= 0,263, diz-se que a curva correspondente distribuio de freqncia


mesocrtica.
Se K > 0,263, diz-se que a curva correspondente distribuio de freqncia
platicrtica.

Se K < 0,263, diz-se que a curva correspondente distribuio de freqncia


leptocrtica.

PUC Minas Virtual

voltar

64

Probabilidade e Estatstica

sumrio

voltar

sumrio

UNIDADE 6
Probabilidade
6.1. Experimento aleatrio, espao amostral e eventos
6.2. Probabilidade: Definio clssica; Probabilidade e
freqncia relativa
6.3. Tipos de eventos
6.4. Axiomas de Probabilidade
6.5. Probabilidade condicional e independncia de eventos

Nesta unidade, vamos ver que a probabilidade expressa por meio de valores numricos as possibilidades da ocorrncia dos resultados de um
fenmeno. So objetivos desta unidade:
Definir e determinar os possveis espaos amostrais de determinados
fenmenos;
Determinar a probabilidade de ocorrncia de um determinado fenmeno.
Formar um conhecimento slido dos valores probabilsticos que sero
utilizados nas prximas unidades.

6.1. Experimento aleatrio, espao amostral e eventos


Introduo
Todas as vezes que se estudam fenmenos de observao, cumpre-se distinguir o
prprio fenmeno e o modelo matemtico (determinstico ou probabilstico) que
melhor o explique.
Os fenmenos estudados pela estatstica so fenmenos cujo resultado, mesmo em
condies normais de experimentao, varia de uma observao para outra, dificultando dessa maneira a previso de um resultado.
A observao de um fenmeno casual recurso poderoso para se entender a variabilidade do mesmo. Entretanto, com suposies adequadas e sem observar diretamente o fenmeno, podemos criar um modelo terico que reproduza de forma bas-

PUC Minas Virtual

voltar

65

Probabilidade e Estatstica

sumrio

voltar

sumrio

tante satisfatria a distribuio das freqncias quando o fenmeno observado


diretamente. Tais modelos so os chamados modelos de probabilidades.
Os fenmenos determinsticos conduzem sempre a um mesmo resultado quando as
condies iniciais so as mesmas. Ex: tempo de queda livre de um corpo. Mantidas
as mesmas condies, as variaes obtidas para o valor do tempo de queda livre de
um corpo so extremamente pequenas (em alguns casos, desprezveis).
Os fenmenos aleatrios podem conduzir a diferentes resultados e mesmo quando
as condies iniciais so as mesmas, existe a imprevisibilidade do resultado. Ex:
lanamento de um dado.
Podemos considerar os experimentos aleatrios como fenmenos produzidos pelo
homem.
Lanamento de uma moeda honesta;
Lanamento de um dado;
Lanamento de duas moedas;
Retirada de uma carta de um baralho completo, de 52 cartas;
Determinao da vida til de um componente eletrnico.
A anlise desses experimentos revela que:
Cada experimento poder ser repetido indefinidamente sob as mesmas
condies;
No se conhece em particular valor o do experimento a priori, porm pode-se descrever todos os possveis resultados as possibilidades;
Quando o experimento for repetido um grande nmero de vezes, surgir
uma regularidade.
Para a explicao desses fenmenos (fenmenos aleatrios), adota-se um modelo
matemtico probabilstico.
Para melhor entendimento desta unidade, interessante relembrar alguns conceitos bsicos no estudo das probabilidades tais como:
Espao Amostral
Um dos conceitos matemticos fundamentais utilizados no estudo das probabilidades o de conjunto. Um conjunto uma coleo de objetos ou itens que possuem

PUC Minas Virtual

voltar

66

Probabilidade e Estatstica

sumrio

voltar

sumrio

caracterstica(s) comum(ns). importante definir cuidadosamente o que constitui o


conjunto em que estamos interessados, a fim de podermos decidir se determinado
elemento ou no membro do conjunto.
Conjunto uma coleo bem definida de objetos ou itens.

A probabilidade s tem sentido no contexto de um espao amostral, que o conjunto de todos os resultados possveis de um experimento. O termo experimento sugere a incerteza do resultado antes de fazermos as observaes. Os resultados de um experimento (ex: a ocorrncia de um raio, uma viagem etc.) chamamse eventos.
Evento Aleatrio (E)
qualquer subconjunto de um espao amostral. tambm o resultado obtido de
cada experimento aleatrio, que no previsvel.
Espao Amostral (S)
Espao amostral de um experimento aleatrio o conjunto de todos os possveis
resultados desse experimento.
Exemplos de Espaos Amostrais:
S = { c, r }

( composto de 2 eventos)

S = { 1, 2, 3, 4, 5, 6 }

( composto de 6 eventos)

S = { (c, r), (c, c), (r, c), (r, r)}

( composto de 8 eventos)

Genericamente, se o n de pontos (elementos do espao amostral) amostrais de


um espao amostral finito n, ento o nmero de eventos dado por 2n.
Exemplo: No lanamento de 5 moedas, o nmero de pontos amostrais
(resultados possveis) 25 = 32. Portanto, S= 32.
O complemento de um evento constitudo de todos os resultados no espao amostral que no faam parte do evento.
Os eventos so mutuamente excludentes, quando no tm elemento em comum.
Ou se no podem ocorrer simultaneamente.

PUC Minas Virtual

voltar

67

Probabilidade e Estatstica

sumrio

voltar

sumrio

Exemplo:
Na extrao de uma s carta, os eventos a carta de copas e a carta
de ouros so mutuamente excludentes, porque uma carta no pode
ser ao mesmo tempo de copas e de ouros.
J os eventos a carta de copas e a carta uma figura no so mutuamente excludentes, porque algumas cartas de copas so tambm figuras.
Muitas vezes, til representar graficamente um espao amostral, porque isso torna mais fcil visualizar-lhe os elementos.

Os eventos A e A so complementares.

A
S

Os eventos A e B so mutuamente

excludentes porque no se interceptam.


S

Os eventos A e B no so mutuamente excludentes,


pois tm alguns elementos em comum.

Operaes com Eventos Aleatrios


Consideremos um espao amostral finito:

S = { 1 , 2 , 3 .... n }

PUC Minas Virtual

voltar

68

Probabilidade e Estatstica

sumrio

voltar

sumrio

Sejam A e B dois eventos de S, as seguintes operaes so definidas:


A) Reunio A B O evento reunio formado pelos pontos amostrais que pertencem a pelo menos um dos eventos.

A B = {1 () S / 1 A ou 1 B }
S

o evento que ocorre se A


ocorre ou B ocorre, ou ambos ocorrem

B) Interseo A B O evento interseo formado pelos pontos amostrais que


pertencem simultaneamente aos eventos A e B.

A B = {i S i A e i B }

o evento que ocorre se A e


B ocorrem

Obs: Se A B = , A e B so eventos
mutuamente exclusivos

C) Complementao S A = Ac o evento que ocorre se A no ocorre.

Ac = {i S i A}

AC
A

PUC Minas Virtual

voltar

69

Probabilidade e Estatstica

sumrio

voltar

sumrio

6.2. Probabilidade: Definio Clssica; Probabilidade e freqncia relativa


Dado um experimento aleatrio, E e S o espao amostral, probabilidade de um
evento A P(A) - uma funo definida em S que associa a cada evento um
nmero real, satisfazendo os seguintes axiomas:

0 < P(A) <1

P(S) = 1

Se A e B forem eventos mutuamente exclusivos, ( A B)=), ento:

P (A B)=P(A)+P(B)
Chamamos de probabilidade de um evento A (A S) o nmero real P(A), tal que:

P(A) =

Nmero de Casos Favorveis ( A) NCF(A)


=
Nmero Total de Casos
NTC

6.3. Tipos de eventos


Chamamos de evento qualquer subconjunto do espao amostral S de um experimento aleatrio.
Assim, qualquer que seja E, se E S (E est contido em S), ento E um evento
de S.
Evento Certo aquele que ocorre em qualquer realizao do experimento aleatrio.
Se E = S, E chamado evento certo.
Evento Elementar aquele formado por um nico elemento do espao amostral.
Se E S e E um conjunto unitrio, E chamado evento elementar.
Evento Impossvel - aquele que no ocorre em nenhuma realizao de um experimento aleatrio. Se E = , E chamado evento impossvel.
Evento Complementar seja um evento A qualquer, o evento A (chamado de
complementar de A), tal que A=S-A, ou seja, um outro conjunto formado pelos
elementos que pertencem a S e no pertencem a A.

PUC Minas Virtual

voltar

70

Probabilidade e Estatstica

sumrio

voltar

sumrio

Eventos Equiprovveis
Quando se associa a cada ponto amostral a mesma probabilidade, o espao amostral chama-se equiprovvel ou uniforme. Os eventos Ei,i=1,2,3......n so equiprovveis quando P(Ei)=P(E2)=P(En)=P, isto , quando todos tm a mesma probabilidade de ocorrer: P=1/n.
Se os n pontos amostrais (eventos) so equiprovveis, a probabilidade de cada um
dos pontos amostrais 1/n .

r
1
P ( A) = r P ( A) =
n
n
Exemplo:
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um rei ou uma carta de espadas?
Soluo:

P( A B) = P ( A) + P( B) P ( A B )
Eventos mutuamente exclusivos
Dois eventos A e B so denominados mutuamente exclusivos se eles no puderem
ocorrer simultaneamente, isto , A B = .
Evento impossvel

Exemplo:
E = Jogar um dado e observar o resultado. Sejam os eventos A= ocorrer
n par e B= ocorrer n mpar.

S = {1,2,3,4,5,6}
Ento, A e B so mutuamente exclusivos, pois a ocorrncia de um nmero par e mpar no pode ser verificada em decorrncia da mesma experincia.

PUC Minas Virtual

voltar

71

Probabilidade e Estatstica

sumrio

voltar

sumrio

6.4. Axiomas de Probabilidade


1 Se o conjunto vazio (evento impossvel), ento P()=0.
2 Teorema do evento complementar: Se Ac o complemento do evento A, ento:
P(Ac) = 1 P(A)
3 Teorema da soma: Se A e B so dois eventos quaisquer, ento:
P(A B) = P (A) + P (B) P (A B)
Se tomssemos apenas P(A B) = P (A) + P (B), estaramos, considerando duas
vezes a probabilidade de interseo.
Teoria da Contagem
Dados dois eventos, o primeiro dos quais pode ocorrer de m maneiras distintas e o
segundo pode ocorrer de n maneiras distintas, ento os dois eventos conjuntamente podem ocorrer de m.n maneiras distintas. O clculo da probabilidade de um evento reduz-se a um problema de contagem. Assim que a Anlise Combinatria
tem fundamental importncia para se contar o n de casos favorveis e o total de
casos. Para problemas simples ou com poucos elementos, pode-se contr o nmro
de resultados de forma direta, sem necessidade de recorrer s frmulas matemticas da anlise combinatria. Para problemas menos simples, recorre-se s combinaes e arranjos para determinar o nmero de casos.
Combinao
o

O Nmero de combinaes de r elementos combinados p a p sendo


p<r e calculado por:

r
r!
Cr ,p = =
p p! (r p )!
Notao: O Smbolo fatorial ! denota o produto dos inteiros positivos em ordem
decrescente. Por exemplo, 6! = 6.5.4.3.2.1= 720. Por definio , 0! = 1.

PUC Minas Virtual

voltar

72

Probabilidade e Estatstica

sumrio

voltar

sumrio

Exemplo: Quantas comisses de trs pessoas podem ser formadas com


um grupo de dez pessoas?

10 10.9.8.7!
C10,3 = =
= 120
3.2.7!
3
Podemos ter 120 comisses diferentes compostos com 3 pessoas.
Arranjos

O nmero de arranjos de r elementos calculado por:

Ar , p =

r!
(r p)!

Exemplo: Considerando um grupo de dez pessoas, quantas chapas diferentes podemos ter para uma eleio de presidente, tesoureiro e secretrio?

A10,3 =

10!
3628800 3628800
=
=
= 720
(10 3)!
7!
5040

Podemos ter 720 chapas diferentes.


OBS: Quando queremos selecionar r elementos de um conjunto de n elementos
distintos sem levar em conta a ordem, estamos considerando combinaes, quando
contamos separadamente ordenaes diferentes dos mesmos elementos temos
arranjos.

PUC Minas Virtual

voltar

73

Probabilidade e Estatstica

sumrio

voltar

sumrio

6.5. Probabilidade Condicional e Independncia de Eventos


Probabilidade Condicional
O evento em que ambos, A e B, ocorrem chamado A interseo B; portanto, a
probabilidade do evento A ocorrer, dado que B ocorreu, de:

P( A B) =

P( A B)
P (B )

Isso significa que a probabilidade de A ocorrer, dado que B ocorreu, igual probabilidade de ocorrncia simultnea de A e B dividida pela probabilidade de ocorrncia de B. (Note-se que essa definio no se aplica quando P(B)=0, porque ento estaramos dividindo por zero).
Exemplo:
Dois dados so lanados. Consideremos os eventos
A={(x1,x2) / x1+x2=10} e B={(x1,x2) / x1 > x2},
onde x1 o resultado do dado 1 e x2 o resultado do dado 2. Avaliar
P(A); P(B); P(A/B) e P(B/A).
Soluo:
P(A)= 3/36 =1/12
P(B) =15/36 =5/12
P(A/B)=1/15
P(B/A)=1/3
Teorema do Produto
A probabilidade da ocorrncia simultnea de dois eventos, A e B, do mesmo espao amostral, igual ao produto da probabilidade de um deles pela probabilidade
condicional do outro, dado o primeiro.

PUC Minas Virtual

voltar

74

Probabilidade e Estatstica

sumrio

voltar

P( A B) =

sumrio

P( A B)
P (B )

P (B A ) =

P( A B)
P ( A)

Independncia Estatstica
Um evento A considerado independente de um outro evento B se a probabilidade
de A igual probabilidade condicional de A dado B.
Exemplo: Em um lote de 12 peas, 4 so defeituosas, 2 peas so retiradas uma aps a outra, sem reposio. Qual a probabilidade de que
ambas sejam boas?
A={a 1 pea boa}
B={a 2 pea boa}
P(A B)= P(A). P(B/A)= 8/12.7/11=14/33
Isto , se P(A)=P(A/B) evidente que, se A independente de B, B
independente de A; P(B)=P(B/A). Se A e B so independentes, ento
temos que
P(A B)=P(A).P(B)
Regra de Bayes
Sejam A1, A2, A3,......An, n eventos mutuamente exclusivos tais que A1 A2 An =
S.
Sejam P(Ai) as probabilidades conhecidas dos vrios eventos e B um evento qualquer de S, tal que so conhecidas todas as probabilidades condicionais P(B/Ai).

P ( Ai / B) =

P( Ai ).P( B / Ai )
P ( A1 ).P ( B / A1 ) + P( A2 ).P( B / A2 ) + ...... + P( An ).P( B / An )

OBS: O Teorema de Bayes tambm chamado de Teorema da Probabilidade a Posteriori. Ele relaciona uma das parcelas da probabilidade total com a prpria probabilidade total.

PUC Minas Virtual

voltar

75

Probabilidade e Estatstica

sumrio

voltar

sumrio

uma generalizao da probabilidade condicional ao caso de mais de dois eventos.


Exemplos:
1. Sendo P(A) = 1/3, P(B)= e P(A B)=11/12, calcular P(A/B).
Soluo:
Como P ( A / B ) =

P( A B)
, devemos calcular P(A B).
P( B)

Como P(A B) = P(A) + P(B) - P(A B),


temos: 11/12= 1/3 + - P(A B)
P(A B)= 2/12=1/6

logo, P(A/B) =

1/ 6 2
=
3/ 4 9

2. Em certo colgio, 5% dos homens e 2% das mulheres tm mais do que


1,80 m de altura. Por outro lado, 60% dos estudantes so homens. Se um
estudante selecionado aleatoriamente e tem mais de 1,80m de altura,
qual a probabilidade de que o estudante seja mulher?
Soluo:
Temos que :
P(Ma/H) = 0,05

(Probabilidade de Homem ter mais de 1,80 m)

P(Ma/M) = 0,02

(Probabilidade de Mulher ter mais de 1,80 m)

P(H) = 0,6

(Probabilidade de ser homem)

P(M) = 0,4

(Probabilidade de ser mulher)

P(M/Ma)= ?

(Probabilidade de ser mulher dado que tem mais que 1,80 m)

PUC Minas Virtual

voltar

76

Probabilidade e Estatstica

sumrio

voltar

sumrio

Utilizando a Regra de Bayes temos:

P( M ) * P( Ma / M )
0,4 * 0,02
=
P( M ) * P( Ma / M ) + P ( H ) * P( Ma / H ) (0,4 * 0,02) + (0,6 * 0,05)
0,008
P ( M / Ma) =
= 0,21 = 21%
0,038
P ( M / Ma) =

3. Trs mquinas, A, B e C produzem respectivamente 40%, 50% e 10% do


total de peas de uma fbrica. As porcentagens de peas defeituosas nas
respectivas mquinas so 3%, 5% e 2%. Uma pea sorteada ao acaso e
verifica-se que defeituosa. Qual a probabilidade de que a pea tenha vindo da mquina B? E da mquina A?
Soluo
Temos que :
P(A) = 0,4
P(B) = 0,5
P(C)= 0,10
P(D/A) = 0,03
P(D/B) = 0,05
P(D/C) = 0,02
P(B/D) = ?
Utilizando a Regra de Bayes temos:

P( B) * P( D / B)
P( A) * P ( D / A) + P( B) * P( D / B) + P(C ) * P ( D / C )
0,5 * 0,05
P( B / D) =
0,4 * 0,03 + 0,5 * 0,05 + 0,1 * 0,02
0,025
P( B / D) =
= 0,641 = 64,1%
0,039

P( B / D) =

PUC Minas Virtual

voltar

77

Probabilidade e Estatstica

sumrio

voltar

sumrio

UNIDADE 7
Variveis Aleatrias
7.1.
7.2.
7.3.
7.4.

Conceito de varivel aleatria


Distribuio de probabilidade
Funo de densidade de probabilidade
Esperana matemtica, varincia e desvio padro:
propriedades
7.5. Distribuies discretas: Bernoulli, Binomial e Poisson
7.6. Distribuio contnua: Normal - propriedades, distribuio
normal padro, a Normal como aproximao da Binomial

Muitos experimentos aleatrios produzem resultados no-numricos.


Antes de analis-los, conveniente transformar seus resultados em nmeros, o que feito atravs da varivel aleatria, que uma regra de
associao de um valor numrico a cada ponto do espao amostral. Portanto, variveis aleatrias so variveis numricas s quais iremos associar modelos probabilsticos. Veremos que uma varivel aleatria tem
um nmero para cada resultado de um experimento e que uma distribuio de probabilidades associa uma probabilidade a cada resultado numrico de um experimento.
7.1. Conceito de varivel aleatia
Sejam E um experimento e S o espao associado ao experimento. Uma funo X,
que associe a cada elemento s S um nmero real X(s), denominada varivel
aleatria.

R
s
Varivel
Aleatria

X(s)

Exemplo:
E: lanamento de duas moedas;
X: n de caras obtidas nas duas moedas;

PUC Minas Virtual

voltar

78

Probabilidade e Estatstica

sumrio

Simetr

voltar

sumrio

S={(C,C), (C,R), (R,C),(R,R)}


X=0 corresponde ao evento (r,r) com probabilidade
X= 1 corresponde ao evento (r,c), (c,r) com probabilidade 2/4
X= 2 corresponde ao evento (c,c) com probabilidade .
Empregamos a termo varivel aleatria para descrever o valor que corresponde ao resultado de determinado experimento.
As variveis aleatrias tambm podem ser discretas ou continuas e temos as seguintes definies:
Variveis Aleatrias Discretas Admite um nmero finito de valores ou
tem uma quantidade enumervel de valores.
Variveis Aleatrias Continuas pode tomar um nmero infinito de valores, e esses valores podem ser associados a mensuraes em uma escala contnua.
7.2. Distribuio de probabilidade
Uma vez definida a varivel aleatria, existe interesse no clculo dos valores das
probabilidades correspondentes.
O conjunto das variveis e das probabilidades correspondentes denominado distribuio de probabilidades, isto :

{(xi,p(xi), I=1,2,.n}
7.3. Funo de densidade de probabilidade
a funo que associa a cada valor assumido pela varivel aleatria a probabilidade do evento correspondente, isto :

P(X=xi)= P(Ai), i=1,2,.,n


7.4. Esperana matemtica, varincia e desvio padro: propriedades
Existem caractersticas numricas que so muito importantes em uma distribuio
de probabilidades de uma varivel aleatria discreta. So os parmetros das distribuies, a saber:
Esperana matemtica (ou simplesmente mdia) - E (x) um nmero real,
tambm uma mdia aritmtica;

PUC Minas Virtual

voltar

79

Probabilidade e Estatstica

sumrio

voltar

sumrio

Varincia - VAR (x) a medida que d o grau de disperso (ou de concentrao) de probabilidade em torno da mdia. O fato de conhecermos a mdia de
uma distribuio de probabilidades j nos ajuda bastante, porm, precisamos de
uma medida que nos d o grau de disperso de probabilidade em torno dessa
mdia.
Desvio Padro DP(X) a raiz quadrada da varincia.
7.5. Distribuies discretas: Bernoulli, Binomial e Poisson
Uma funo X, definida sobre o espao amostral e assumindo valores num conjunto
enumervel de pontos do conjunto real, dita uma varivel aleatria discreta.
Uma varivel aleatria X do tipo discreto estar bem caracterizada se indicarmos os
possveis valores x1, x2, , xk que ela pode assumir e as respectivas probabilidades
p(x1), p(x2), , p(xk), ou seja, se conhecermos a sua funo de probabilidade (x;
p(x)), onde

p(x) = P(X = x)
Dada a v.a. discreta X, assumindo os valores x1, x2, , xk , chamamos esperana
matemtica de X ao valor:

E ( X ) = x p( x)
Chamamos varincia de X ao valor:

Var ( X ) = E ( X 2 ) [ E ( X )] 2
onde
E ( X 2 ) = x 2 p( x)
E de desvio padro de X a

DP( X ) = Var ( X )

PUC Minas Virtual

voltar

80

Probabilidade e Estatstica

sumrio

voltar

sumrio

Distribuies Discretas de Probabilidade


1. Distribuio de Bernoulli
Seja um experimento aleatrio E realizado repetidas vezes, sempre nas mesmas
condies, de tal forma que o resultado pode ser um Sucesso (s) (se acontecer o
evento que nos interessa) ou um Fracasso (f) (se o evento no se realizar).
Seja X a varivel aleatria: Sucesso ou Fracasso

X x1 = 1 (sucesso)

x 2 = 0 (fracasso)

ou

P(X) p(x 1 ) = p

p(x 2 ) = 1 p = q

P ( x = 0) = q

P(x = 1 ) = p

Essas condies caracterizam um conjunto de Provas de Bernoulli ou um experimento de Bernoulli, e sua funo probabilidade dada por:

P ( X = x) = p x .q 1 x
Principais caractersticas
1

Mdia:

E ( X ) = xi P( xi ) = 0.q + 1. p = p
i =0

Varincia:

Var ( X ) = E ( X 2 ) [ E ( X )]2
1

E ( X 2 ) = xi2 P ( xi ) = 0 2 q + 12 p = p
i =0

Var ( X ) = p p 2 = p (1 p) = pq

PUC Minas Virtual

voltar

81

Probabilidade e Estatstica

sumrio

voltar

sumrio

2. Distribuio Binomial
Uma varivel aleatria tem distribuio binomial quando o experimento ao qual
est relacionada apresenta apenas dois resultados (sucesso ou fracasso). Este modelo fundamenta-se nas seguintes hipteses:

n provas independentes e do mesmo tipo so realizadas;

cada prova admite dois resultados Sucesso ou Fracasso;

a probabilidade de sucesso em cada prova p e de fracasso 1- p = q

Define-se a Varivel X que conta o nmero de sucesso nas n realizaes do experimento.


(X pode assumir os valores 0, 1, 2, 3, ......., n.)
Fazendo sucesso corresponder a 1 e fracasso, a 0, temos:
Para X = 0 , uma seqncia de n zeros : 000000....000.
P ( X = 0) = q.q.q.q.q.....q = q n

Para X = 1, uma seqncia do tipo: 1000....0; 01000....0; 001000...0; sero n


seqncias, cada uma com um nico sucesso e n-1 fracassos:

P ( X = 1) = n. p.q n 1

Para X= x, tem-se x sucessos e (n-x) fracassos, correspondendo s seqncias

com x algarismos 1 e n-x zeros. Cada seqncia ter probabilidade

p x q n x

h seqncias distintas, tem-se:


x

n
P( X = x) = p x q n x
x

PUC Minas Virtual

voltar

82

Expresso geral da
distribuio Binomial

Probabilidade e Estatstica

sumrio

e como

voltar

sumrio

Principais caractersticas:

Mdia: E ( X ) = n. p

Varincia: Var ( X ) = n. p.q


Exemplo: Uma moeda no viciada lanada 8 vezes. Encontre a probabilidade de:
a)

dar 5 caras;

b)

pelo menos uma cara;

c)

no mximo 2 caras.

Soluo:
a) x = sair cara, p=0,5 ( probabilidade do sucesso de X), q= 0,5 ( probabilidade do fracasso de X0, n = 8 ( nmero de repeties do evento).

P ( X = 5) =

8!
40320
.0,5 5.0,585 =
.0,58 = 0,21875 = 21,88%
5!(8 5)!
120.6

b) P(x1)= 1 { P(X=0)} = 1-{ qn} = 1- 0,58 = 0,9960 = 99,6%

c) P(X2) = P(X=0)+ P(x=1) + P(X=2) , utilizando as frmulas dos itens anteriores calcula-se as probabilidades.

3. Distribuio de Poisson
Consideremos a probabilidade de ocorrncia de sucessos em um determinado intervalo. A probabilidade da ocorrncia de um sucesso no intervalo proporcional ao
intervalo. A probabilidade de mais de um sucesso nesse intervalo bastante pequena em relao probabilidade de um sucesso.

PUC Minas Virtual

voltar

83

Probabilidade e Estatstica

sumrio

voltar

sumrio

Seja X o nmero de sucessos no intervalo; temos, ento:

P( X = k ) =

e .k
k!

onde a mdia.

A varivel X assim definida tem distribuio de Poisson.


A distribuio de Poisson muito usada na distribuio do nmero de:
Carros que passam por um cruzamento por minuto, durante uma certa hora do
dia;
Erros tipogrficos por pgina, em um material impresso;
Defeitos por unidade (m, m, m, etc.,,) por pea fabricada;
Colnias de bactrias numa dada cultura por 0,01mm, numa plaqueta de microscpio;
Mortes por ataque de corao por ano, numa cidade;
Problemas de filas de espera em geral, e outros.
Principais caractersticas:

Mdia: E ( X ) =

Varincia: Var ( X ) =

OBS: Muitas vezes, no uso da binomial, acontece que n muito grande e p muito
pequeno. Podemos, ento, fazer uma aproximao de binomial pela distribuio de
Poisson, da seguinte forma:

= np
Exemplo: Em mdia, so feitas 2 chamadas por hora para certo telefone. Calcular a probabilidade de se receber no mximo 3 chamadas em 2
horas e a probabilidade de nenhuma chamada em 90 minutos.
Soluo:
= 2 por hora, para 2 horas = 4
P(X3)= P(X=0)+P(X=1)+P(X=2)+P(X=3)

PUC Minas Virtual

voltar

84

Probabilidade e Estatstica

sumrio

voltar

P(X3) =

sumrio

e .0 e .1 e .2 e .3
+
+
+

0!
1!
2!
3!

e 4 .4 0 e 4 .41 e 4 .4 2 e 4 .4 3
+
+
+

1
1
2
6
4
4
4
4
4
P(X3) = e + 4e + 8e + 10,666e = 23,66e = 0,4334 = 43,34%

P(X3) =

Agora para 90 minutos =3 ( 1 hora (60 minutos) =2)


P(X=0)=

e 3 .30
= e 3 = 0,0498 = 4,98 %
1

7.6. Distribuio contnua: Normal - propriedades, distribuio normal


padro, a Normal como aproximao da Binomial
Uma varivel aleatria, cujos valores so expressos em uma escala contnua,
chamada de varivel aleatria contnua.
Podemos construir modelos tericos para v.a.s contnuas, escolhendo adequadamente a funo de densidade de probabilidade (f.d.p.), que uma funo indicadora da probabilidade nos possveis valores de X.
Assim, a rea sob a f.d.p. entre dois pontos a e b nos d a probabilidade da varivel
assumir valores entre a e b, conforme ilustrado na figura 1, apresentada a seguir.

P(a<X<b)

Figura 1 Probabilidade como rea sob a curva entre dois pontos

PUC Minas Virtual

voltar

85

Probabilidade e Estatstica

sumrio

voltar

sumrio

Portanto, podemos escrever:


b

P (a < X < b) = f ( x)dx


a

Da relao entre a probabilidade e a rea sob a funo, a incluso, ou no, dos extremos a e b na expresso acima no afetar os resultados. Assim, iremos admitir

P ( a < X < b) = P ( a X < b) = P ( a < X b) = P ( a X b)


Teoricamente, qualquer funo f(x) que seja no negativa e cuja rea total sob a
curva seja igual unidade, isto ,

f ( x)dx = 1
caracterizar uma v.a. contnua.
Dada a v.a. contnua X, assumindo os valores no intervalo entre a e b, chamamos
valor mdio ou esperana matemtica de X ao valor
b

E ( X ) = x f ( x)dx
a

Chamamos varincia de X ao valor

Var ( X ) = E ( X 2 ) [ E ( X )] 2
onde
b

E ( X 2 ) = x 2 f ( x)dx
a

e de desvio padro de X a

DP( X ) = Var ( X )
Se X uma v.a. contnua com f.d.p. f(x), definimos a sua funo de distribuio
acumulada F(x) como:
x

F ( x) = P ( X x) =

f (t )dt

PUC Minas Virtual

voltar

86

Probabilidade e Estatstica

sumrio

voltar

sumrio

1 - Distribuio Normal
A distribuio normal a mais importante das distribuies de probabilidades. Conhecida como a curva em forma de sino, a distribuio normal tem sua origem
associada aos erros de mensurao. sabido que quando se efetuam repetidas
mensuraes de determinada grandeza com um aparelho equilibrado, no se chega
ao mesmo resultado todas as vezes; obtm-se, ao contrrio, um conjunto de valores que oscilam, de modo aproximadamente simtrico, em torno do verdadeiro valor. Construindo-se o histograma desses valores, obtm-se uma figura com forma
aproximadamente simtrica. Gauss deduziu matematicamente a distribuio normal
como distribuio de probabilidade dos erros de observao, denominando-a ento
lei normal dos erros.
Supunha-se inicialmente que todos os fenmenos da vida real devessem ajustar-se
a uma curva em forma de sino; em caso contrrio, suspeitava-se de alguma anormalidade no processo de coleta de dados. Da a designao de curva normal.
A observao cuidadosa subseqente mostrou, entretanto, que essa pretensa universalidade da curva, ou distribuio normal, no correspondia realidade. De fato,
no so poucos os exemplos de fenmenos da vida real representados por distribuies no normais, curvas assimtricas, por exemplo. Mesmo assim, a distribuio
normal desempenha papel preponderante na estatstica, e os processos de inferncia nela baseados tm larga aplicao.
A distribuio normal tem sua funo de densidade de probabilidade dada por

f(x) =

(x )2

exp
2 2

< x <

Como pode-se observar atravs da equao acima, a distribuio normal inclui os


parmetros e , os quais possuem os seguintes significados:

: posio central da distribuio (mdia, x)


: disperso da distribuio (desvio padro, x)
2

Se uma varivel aleatria X tem distribuio normal com mdia e varincia ,


2

escrevemos: X N( , ).
A figura 2 ilustra uma curva normal tpica, com seus parmetros descritos graficamente.

PUC Minas Virtual

voltar

87

Probabilidade e Estatstica

sumrio

voltar

sumrio

f(x)

: mdia
: desvio padro

Figura 2 - Curva normal tpica

Propriedades da distribuio normal


Para uma mesma mdia e diferentes desvios padro , a distribuio que tem
maior desvio padro se apresenta mais achatada, acusando maior disperso em
torno da mdia. A que tem menor desvio padro apresenta pico mais acentuado e
maior concentrao em torno da mdia. A figura 3 compara trs curvas normais,
com a mesma mdia, porm, com desvios padro diferentes. A curva A se apresenta mais dispersa que a curva B, que por sua vez se apresenta mais dispersa que a
curva C. Nesse caso, A > B > C.
Distribuies normais com o mesmo desvio padro e mdias diferentes possuem a
mesma disperso, mas diferem quanto localizao. Quanto maior a mdia, mais
direita est a curva. A figura 4 ilustra o fato, onde a curva A possui mdia maior
que a curva B (A > B).

B
A

Figura 3 - Distribuies normais com mesma mdia e desvios padro diferentes

PUC Minas Virtual

voltar

88

Probabilidade e Estatstica

sumrio

voltar

sumrio

Figura 4 - Distribuies normais com mesmo desvio padro e mdias diferentes

Como descrito anteriormente, a probabilidade de uma varivel assumir valores entre a e b igual rea sob a curva entre esses dois pontos. A determinao dessas
probabilidades realizada matematicamente atravs da integrao da funo de
densidade de probabilidade entre os pontos a e b de interesse. No caso da normal,
a integral no pode ser calculada exatamente e a probabilidade entre dois pontos
s pode ser obtida de forma aproximada, por mtodos numricos. Essa tarefa
facilitada atravs do uso da distribuio normal padro definida a seguir.
No caso da distribuio normal, algumas dessas reas - com os pontos a e b, funo da mdia e do desvio padro so bastante difundidas e esto representadas na figura 5:
99.73 %
95.46 %
68.26 %

-3

-2

+2

+3

Figura 5 - Probabilidades da distribuio normal

Portanto, 68,26% dos valores populacionais caem entre os limites definidos como
mdia mais ou menos um desvio padro ( 1); 95,46% dos valores caem entre

PUC Minas Virtual

voltar

89

Probabilidade e Estatstica

sumrio

voltar

sumrio

mdia mais ou menos dois desvios padro ( 2); e 99,73% dos valores caem
entre mdia mais ou menos trs desvios padro ( 3).
A distribuio normal padro
A distribuio normal particular com mdia 0 e desvio padro 1 chamada de distribuio normal padro e costuma ser denotada por Z.
2

Se X N( , ), ento, a varivel aleatria definida por

Z=

ter uma distribuio N(0,1). Essa transformao ilustrada pela figura 6:

X
-3

-2

+2

+3

X-

-3

-2

-1

Z
1

Figura 6 - Transformao de uma N(

,2) para uma N(0,1)

A rea esquerda de um valor especificado da N(0,1) encontra-se tabelada.


Utilizando-se a transformao acima, podemos obter as probabilidades para
2

qualquer N( , ). O procedimento ilustrado atravs do exemplo abaixo.


Exemplo:
Extrudados tubulares possuem tenso de escoamento (tenso a partir da qual o
material se deforma plasticamente), que segue uma distribuio normal com mdia
de 210 MPa com desvio padro de 5 MPa. Em notao estatstica, X N(210 ,52).
desejado que tais extrudados tenham tenso de escoamento de pelo menos 200
MPa. Portanto, a probabilidade do extrudado no atingir a especificao desejada :

PUC Minas Virtual

voltar

90

Probabilidade e Estatstica

sumrio

voltar

sumrio

Soluo:

200 210

P(X < 200) = P Z <


= P(Z < -2).

5
A figura 7 mostra a transformao realizada e a rea desejada.

P(X<200)

180

190

200

210

220

230

240

-2

P(Z<-2)

-6

-4

Figura 7 - Probabilidade do extrudado no atingir a especificao desejada

Para clculo dessa probabilidade, utilizamos a tabela de distribuio normal padronizada ( que esta no apndice do livro indicado na bibliografia bsica). Observe que
a tabela traz apenas a P(Z<z) para z no negativo (z 0). As propriedades que se
seguem podem ser deduzidas a partir da simetria da densidade em relao mdia
0, e so teis na obteno de outras reas no tabuladas.
P(Z>z) = 1 - P(Z<z)
P(Z<-z) = P(Z>z)
P(Z>-z) = P(Z<z)

PUC Minas Virtual

voltar

91

Probabilidade e Estatstica

sumrio

voltar

sumrio

P(Z < -z)

1 - P(Z < z)
-z

Figura 8 - reas correspondentes na distribuio normal

Utilizando as relaes apresentadas acima, a probabilidade do extrudado no atender especificao


P(X < 200) = P(Z < -2) = P(Z > 2) = 1 - P(Z < 2)
que, atravs da tabela da N(0,1) igual a
P (X < 200) = 1 - 0,97725 = 0,02275.
= 2,275%

PUC Minas Virtual

voltar

92

Probabilidade e Estatstica

sumrio

voltar

sumrio

UNIDADE 8
Inferncia Estatstica
8.1. Populao e amostra; Estatsticas e parmetros;
Distribuies amostrais
8.2. Estimao
8.3. Testes de Hipteses

Trata-se do processo de obter informaes sobre uma populao a partir


de resultados observados na amostra.
De modo geral, tem-se uma populao com grande nmero de elementos e deseja-se, a partir de uma amostra dessa populao, conhecer o
mais prximo possvel algumas caractersticas da populao.
Toda concluso tirada por uma amostragem, quando generalizada para
a populao, vir acompanhada de um grau de incerteza ou risco.
Ao conjunto de tcnicas e procedimentos que permitem dar ao pesquisador um grau de confiabilidade, de confiana nas afirmaes que faz
para a populao, baseadas nos resultados das amostras, damos o nome de Inferncia Estatstica.
O problema fundamental da Inferncia Estatstica, portanto, medir o
grau de incerteza ou risco dessas generalizaes. Os instrumentos da
Inferncia Estatstica permitem a viabilidade das concluses por meio de
afirmaes estatsticas.
8.1. Populao e amostra; Estatsticas e parmetros;
Distribuies amostrais
Se um conjunto de dados consiste de todas as observaes possveis (concebveis
ou hipotticas), chamado uma populao; se um conjunto de dados se consiste
apenas de uma parte dessas observaes, chamado uma amostra.

PUC Minas Virtual

voltar

93

Probabilidade e Estatstica

sumrio

Simetr

voltar

sumrio

Um dos principais objetivos da maioria dos estudos, anlises ou pesquisas estatsticas fazer generalizaes seguras - com base em amostras em relao s populaes das quais se extraram as amostras.
Definies
Parmetro: a medida usada para escrever uma caracterstica numrica populacional. Genericamente representado por . A mdia (), a varincia (2) e o coeficiente de correlao () so alguns exemplos de parmetros populacionais.
Estimador: tambm denominado estatstica de um parmetro populacional. uma
caracterstica numrica determinada na amostra, uma funo de seus elementos.
Genericamente, representado por . A mdia amostral (x) e a varincia amostral
(s2) so alguns dos exemplos de estimadores.

POPULAO

PARMETROS:

AMOSTRAS

ESTIMADORES:

Distribuio Amostral
Considere todas as possveis amostras de tamanho n que podem ser extradas de
determinada populao. Se para cada uma delas se calcular um valor do estimador,
tem-se uma distribuio amostral desse estimador. Como o estimador uma varivel aleatria, pode-se determinar suas caractersticas, isto , encontrar sua mdia,
varincia, desvio-padro.
As distribuies amostrais so fundamentais para o processo de inferncia estatstica.
Distribuio amostral da Mdia
Sabe-se que x' =

x
n

(mdia aritmtica) um estimador da mdia populacional .

O estimador x uma varivel aleatria; portanto, busca-se conhecer sua distribuio de probabilidade.

PUC Minas Virtual

voltar

94

Probabilidade e Estatstica

sumrio

voltar

sumrio

Teorema 1 A mdia da distribuio amostral das mdias, denotada por (x),


igual mdia populacional .

E (x) = (x) =

Assim, provado que a mdia das mdias amostrais igual mdia populacional.
Teorema 2 Se a populao infinita, ou se a amostragem com reposio, ento
a varincia da distribuio amostral das mdias, denotada por 2(x), dada por:

VAR ( x ' ) =

2
x'

Teorema 3 Se a populao finita, ou se a amostragem sem preposio, ento


a varincia da distribuio amostral das mdias dada por:

( x' ) =
2

2 N n

x' =

n N 1

N n
N 1

Sendo que: (x) =


Teorema 4 - Se a populao tem ou no distribuio normal com mdia e varincia 2, ento a distribuio das mdias amostrais ser normalmente distribuda com
mdia e varincia

2
n

Esses quatro teoremas provam que a mdia amostral (x) tem distribuio normal
com mdia igual mdia da populao () e varincia dada por

es infinitas, assim como

2 N n

para populaes finitas.


n N 1

x' N ;
n

2 N n
x' N ;


n
N

ou

PUC Minas Virtual

voltar

95

Probabilidade e Estatstica

sumrio

para popula-

Ou, ainda:

voltar

sumrio

com distribuies padronizadas dadas por:

xi

Zi =

Zi =

ou

xi

N n

N 1

Exemplo:
Temos uma populao de 5000 alunos de uma faculdade. Sabemos que
a altura mdia dos alunos de 175 cm e o desvio padro, de 5 cm. Retiramos uma amostra sem reposio, de tamanho n = 100. Qual o valor
do desvio padro amostral?
Soluo:
X : N (175 ,

Ento

x =

25 cm)

= 175cm

= 5cm

()

x = E x = 175

N n
5 5000 25
=
= 0,4988
N 1 10 5000 1

8.2. Estimao
H dois tipos fundamentais de estimao: por ponto e por intervalo.
Estimao pontual
O problema da estimao pontual surge quando estamos interessados em alguma
caracterstica numrica de uma distribuio desconhecida (ex: mdia, varincia) e
desejamos calcular, a partir de observaes, um nmero que inferimos que seja
uma aproximao da caracterstica numrica em questo.
Para ilustrar alguns dos problemas com os quais nos deparamos quando estimamos
a mdia de uma populao com base em dados amostrais, vamos recorrer a um

PUC Minas Virtual

voltar

96

Probabilidade e Estatstica

sumrio

voltar

sumrio

estudo em que planejadores industriais procuraram determinar o tempo mdio que


um adulto leva para montar um rob fcil de montar. Com uma amostra aleatria, obtm-se os seguintes dados (em minutos) para 36 pessoas que montaram o
rob:
17

13

18

19

17

21

29

22

16

28

21

15

26

23

24

20

17

17

21

32

18

25

22

16

10

20

22

19

14

30

22

12

24

28

11

A mdia desta amostra x = 19,9 minutos. Na ausncia de qualquer outra informao, podemos tomar esta cifra como uma estimativa de , o verdadeiro tempo
mdio que um adulto leva para montar o rob.
Esse tipo de estimativa chamada estimativa pontual, pois consiste de um nico
nmero, ou um nico ponto na escala dos nmeros reais. Embora se trate da forma
mais comum de expressar estimativas, ela deixa margem para no poucas questes. Por exemplo, no nos diz em quantas informaes a estimativa se baseia,
nem tampouco nos informa sobre o tamanho possvel do erro.
Estimao por intervalo
A estimao por pontos de um parmetro no possui uma medida do possvel erro
cometido na estimao, da surge a idia de construir os intervalos de confiana,
que so baseados na distribuio amostral do estimador pontual.
Uma maneira de expressar a preciso da estimao estabelecer limites que, com
certa probabilidade, incluam o verdadeiro valor do parmetro da populao. Esses
limites so chamados limites de confiana: determinam um intervalo de confiana, no qual dever estar o verdadeiro valor do parmetro. Logo, a estimao por
intervalo consiste na fixao de dois valores tais que (1 - ) seja a probabilidade de
que o intervalo, por eles determinado, contenha o verdadeiro valor do parmetro.

: nvel de incerteza ou grau de desconfiana


1 - : coeficiente de confiana ou nvel de confiabilidade.

Portanto, nos d a medida da incerteza desta inferncia (nvel de significncia).


Logo, a partir das informaes de amostra, devemos calcular os limites de um in-

PUC Minas Virtual

voltar

97

Probabilidade e Estatstica

sumrio

voltar

sumrio

tervalo, valores crticos que em (1 - )% dos casos inclua o valor do parmetro a


estimar e em % dos casos no inclua o valor do parmetro.
Intervalo de confiana (IC) para a mdia populacional ()
quando a Varincia (2) conhecida.
Como se sabe, o estimador de x. Tambm conhecida a distribuio de
probabilidade de x:

x' N ;
n

2
x' N ;
n

para as populaes infinitas,

N n

para as populaes finitas.

Assim, para o caso de populaes infinitas, a varivel padronizada de x ser:

Z =

x'

n
Fixando-se um nvel de confiana 1 - , tem-se:

Ou seja:

P Z Z Z = 1
2
2

PUC Minas Virtual

voltar

98

Probabilidade e Estatstica

sumrio

voltar

sumrio

Substituindo-se o valor de Z, tem-se:

x'

P Z
Z
=1

2
2

Resolvendo-se as duas inequaes para , tem-se o intervalo de confiana para a


mdia populacional () quando a varincia (2) conhecida:

P x' Z
x '+ Z
=1
2 n
2 n

Como poder ser verificado, a aplicao da frmula extremamente simples. Fixase o valor de 1 - , ou (1 - )100= %, e observa-se na tabela de distribuio normal padro o valor das abscissas que deixam /2 em cada uma das caudas. Com
os valores de x (mdia amostral), =desvio padro da populao, que neste caso
conhecido, e n (tamanho da amostra), constri-se o intervalo.
Para o caso de populaes finitas, usa-se a seguinte frmula:


P x ' Z
2 n


N n
x '+ Z
N 1
2 n

N n
=1
N 1

Exemplo:
A durao da vida de uma pea de equipamento tal que =5 horas.
Foram amostradas 100 dessas peas, obtendo-se a mdia de 500 horas.
Deseja-se construir um intervalo de confiana para a verdadeira durao
mdia da pea com um nvel de 95%.
Soluo:
= 5 ; n = 100 x=500

PUC Minas Virtual

voltar

(1 - )100=95%

99

Probabilidade e Estatstica

sumrio

voltar

sumrio

o grfico da distribuio normal padro ser:

2,5%

2,5%

95%

-1,96

1,96

lembre-se que para descobrir a abscissa 1,96, entrou-se na tabela de


distribuio normal padronizada com o valor 0,475 = 47,5 , j que a tabela de faixa central.
Substituindo na formula :

P x' Z
x '+ Z
=1
2 n
2 n

5
5

P 500 1,96
500 + 1,96
= 95%
100
100

Efetuando os clculos temos:


P(499,02 500,98) = 95%

8.3. Testes de Hipteses


Trata-se de uma tcnica para se fazer inferncia estatstica. Ou seja, a partir de um
teste de hipteses realizado com os dados amostrais, pode-se fazer inferncias sobre a populao.
Principais conceitos
Hipteses Estatstica Trata-se de uma suposio quanto ao valor de um parmetro populacional, ou quanto natureza da distribuio de probabilidade de uma
varivel populacional. So exemplos de hipteses estatsticas:
a)

Os chips da marca A tm vida mdia H : = 0;

PUC Minas Virtual

voltar

100

Probabilidade e Estatstica

sumrio

voltar

sumrio

b)

O nvel de inteligncia de uma populao de universitrios H : = 0;

c)

O ao produzido pelo processo A mais duro que o ao produzido pelo processo B:A > B;

d)

A altura mdia da populao brasileira de 1,65m, isto : H :=1,65m;

e)

A varincia populacional dos salrios vale R$ 5.0002, isto : H :2=5.0002 ;

f)

A proporo de paulistas com a doena X de 40 %, ou seja: H : p=0,40;

g)

A distribuio dos pesos dos alunos da nossa faculdade normal;

h)

A chegada de navios ao porto de Santos descrita por uma distribuio de


Poisson.

Formulamos duas hipteses bsicas:


Ho: hiptese nula ou da existncia;
H1: hiptese alternativa.
Testamos hipteses para tomarmos uma deciso entre duas alternativas. Por essa
razo, o Teste de Hiptese um Processo de Deciso Estatstica.
Tipos de Hiptese Designa-se por H0, chamada hiptese nula, a hiptese estatstica a ser testada, e por H1 a hiptese alternativa. A hiptese nula expressa uma igualdade, enquanto a hiptese alternativa dada por uma desigualdade.
Exemplo:
H 0 : = 1,65m
para testes bilaterais (d origem a um teste bicaudal)
H1 : 1,65m

H 0 : = 1,65m
para testes unilaterais direita (d origem a um teste unilateral direita)
H1 : > 1,65m
H 0 : = 1,65m
para testes unilaterais esquerda (d origem a um teste unicaudal esquerda)
H1 : < 1,65m

O procedimento padro para a realizao de um Teste de Hipteses o seguinte:


Define-se as hipteses do teste: nula e alternativa;
Fixa-se um nvel de significncia ;
Levanta-se uma amostra de tamanho n e calcula-se uma estimativa 0 do parmetro ;

PUC Minas Virtual

voltar

101

Probabilidade e Estatstica

sumrio

voltar

sumrio

Usa-se para cada tipo de teste uma varivel cuja distribuio amostral do estimador dos parmetros seja a mais concentrada em torno do verdadeiro valor do
parmetro;
Calcula-se com o valor do parmetro 0, dado por H0, o valor crtico, valor observado na amostra ou valor calculado (Vcalc);
Fixa-se duas regies: uma de no rejeio de H0 (RNR) e uma de rejeio de H0
ou crtica (RC) para o valor calculado, ao nvel de risco dado;
Se o valor observado (Vcalc) Regio de No Rejeio, a deciso a de no rejeitar H0;
Se Vcalc Regio Crtica, a deciso a de rejeitar H0.
Devemos observar que quando se fixa , determinamos para os testes bilaterais,
por exemplo, valores crticos (tabelados), V, tais que:
P(|Vcalc|< V)=1 - RNR
P(|Vcalc| V)= RC

Testes de Hipteses para a Mdia de Populaes


normais com varincias (2) conhecidas
Testes Bilaterais
De uma populao normal com varincia 36, toma-se uma amostra casual de tamanho 16, obtendo-se x=43. Ao nvel de 10%, testar as hipteses:

H 0 : = 45

H1 : 45
Soluo: Como o teste para mdia de populaes normais com varincia conhecida, usaremos a varivel Z: N(0,1) como critrio.
2=36

x=43

n=16

PUC Minas Virtual

voltar

102

Probabilidade e Estatstica

sumrio

voltar

Z=

sumrio

x ' H 0

'

x' =

Como o teste bilateral e =10%, a Regio de No Rejeio, (RNR), :


P(|Z|< Z)=1 - P(|Z|<1,64)=0,90

Z=Z5%=1,64
E a Regio de Rejeio (RC) dada por

P ( Z Z ) = P ( Z 1,64) = 0,10

Como Zcalc=-1,33
Temos que Zcalc RNR
Logo, a deciso no rejeitarmos H0, isto , a mdia de 45, com 10% de risco de
no rejeitarmos uma hiptese falsa.

Testes Unilateral (Monocaudal) Esquerda


Uma fbrica anuncia que o ndice de nicotina dos cigarros da marca X apresenta-se
abaixo de 26 mg por cigarro. Um laboratrio realiza 10 anlises do ndice obtendo:
26,24,23,22,28,25,27,26,28,24. Sabe-se que o ndice de nicotina dos cigarros da
marca X se distribui normalmente com varincia 5,36 mg2. Pode-se aceitar a afirmao do fabricante, ao nvel de 5%?

PUC Minas Virtual

voltar

103

Probabilidade e Estatstica

sumrio

voltar

sumrio

H 0 : = 26

H1 : < 26

RNR= (-1,64; +)
RC = (- ; -1,64]
Zcalc RNR

No se rejeita H0, isto , ao nvel de 5% podemos concluir que a afirmao do fabricante falsa.

Testes Unilateral (Monocaudal) Direita


Um fabricante de lajotas de cermica introduz um novo material em sua fabricaao
e acredita que aumentar a resistncia mdia, que de 206 kg. A resistncia das
lajotas tem distribuio normal, com desvio padro de 12 kg. Retira-se uma amostra de 30 lajotas, obtendo-se X =210 kg. Ao nvel de 10%, pode o fabricante aceitar que a resistncia mdia de suas lajotas tenha aumentado?

H 0 : = 206

H1 : > 206

PUC Minas Virtual

voltar

104

Probabilidade e Estatstica

sumrio

voltar

sumrio

RNR=(- ; 1,28)
RC = [1,28; +)
Zcalc RC
Como Zcalc > Z, rejeita-se H0, isto , ao nvel de 10% o fabricante pode concluir
que a resistncia mdia de suas lajotas aumentou.
Erros de Deciso
Tipos de Erro H dois tipos possveis de erro ao testar uma hiptese estatstica.
Pode-se rejeitar uma hiptese quando ela , de fato, verdadeira, ou aceitar uma
hiptese quando ela , de fato, falsa. A rejeio de uma hiptese verdadeira
chamada erro tipo I. A aceitaao de uma hiptese falsa constitui um erro tipo II.
As probabilidades desses dois tipos de erros so designadas, respectivamente, por
e .
A probabilidade do erro tipo I denomidada nvel de significncia do teste.
Resumindo:

Realidade
H0 verdadeira

H0 falsa

Aceitar H0

Deciso Correta (1-)

Erro tipo II ()

Rejeitar H0

Erro tipo I ()

Deciso Correta (1 - )

Deciso

Observe que o erro tipo I s poder ser cometido se se rejeitar H0; e o erro do tipo
II, quando se aceitar H0.
O objetivo, obviamente, reduzir ao mnimo as probabilidades dos dois tipos de
erros. Infelizmente, essa uma tarefa difcil porque, para uma amostra de determinado tamanho, a probabilidade de se incorrer em um erro tipo II aumenta medida que diminui a probabilidade do erro I. E vice-versa. A reduo simultnea dos
erros poder ser alcanada pelo aumento do tamanho da amostra.

PUC Minas Virtual

voltar

105

Probabilidade e Estatstica

sumrio

voltar

sumrio

UNIDADE 9
Correlao e Regresso Linear
9.1. Diagrama de disperso

Simetr

9.2. Correlao Linear


9.3. Coeficiente de Correlao Linear
9.4. Regresso Reta de regresso
(ou reta de mnimos quadrados ou reta de ajuste)

Em muitas situaes, torna-se interessante e til estabelecer uma relao entre duas ou mais variveis. A matemtica estabelece vrios tipos
de relaes entre variveis, por exemplo, as relaes funcionais e as
correlaes.
Relaes Funcionais
So relaes matemticas expressas por sentenas matemticas, cujos exemplos
apresentamos a seguir:
rea do retngulo (A=a.b) a relao entre os lados do retngulo;
Densidade de massa (dm= m/v) a relao entre a massa e o volume de um
corpo;
Permetro de uma circunferncia (C=2R) a relao entre o comprimento da
circunferncia e o valor do raio.
Relaes Estatsticas e Correlaes
So relaes estabelecidas aps uma pesquisa. Com base nos resultados da pesquisa, so feitas comparaes que eventualmente podem conduzir (ou no) ligao entre as variveis.
Exemplo: relao entre a idade e a estatura de uma criana, ou a relao entre a classe social de uma pessoa e o nmero de viagens por ela
realizado.

PUC Minas Virtual

voltar

106

Probabilidade e Estatstica

sumrio

voltar

sumrio

No estudo estatstico, a relao entre duas ou mais variveis denomina-se correlao. A utilidade e importncia das correlaes entre duas variveis podem conduzir
descoberta de novos mtodos, cujas estimativas so vitais em tomadas de decises.

9.1. Diagrama de disperso


O diagrama de disperso um grfico cartesiano em que cada um dos eixos corresponde s variveis correlacionadas. A varivel dependente (Y) situa-se no eixo
vertical e o eixo das abscissas reservado para a varivel independente (X). Os
pares ordenados formam uma nuvem de pontos.
A configurao geomtrica do diagrama de disperso pode estar associada a uma
linha reta (correlao linear), uma linha curva (correlao curvilnea) ou, ainda, ter
os pontos dispersos de maneira que no definam nenhuma configurao linear;
nesta ltima situao, no h correlao.

100

18

90

16

80

14

70

12

60

10

50

40
30

20

10

Correlao Linear

Correlao Curvilnea

Figura 9.1. Diagramas de disperso

9.2. Correlao Linear


Correlao linear uma correlao entre duas variveis, cujo grfico aproxima-se
de uma linha. uma linha de tendncia, porque procura acompanhar a tendncia
da distribuio de pontos, que pode corresponder a uma reta ou a uma curva. Por
outro lado, , tambm, uma linha mdia, porque procura deixar a mesma quantidade de pontos abaixo e acima da linha.

PUC Minas Virtual

voltar

107

Probabilidade e Estatstica

sumrio

voltar

sumrio

25

100
90
80

20

70
60

15

50
40

10

30
20

10
0

0
0

Correlao Linear negativa

Correlao Linear positiva

8,5

18

16
14

7,5

12

10

6,5

8
6

5,5

0
0

10

12

14

No h correlao

Relao curvilnea direta

Figura 9.2. Diagramas de disperso de diversos tipos de correlao.

Para definir se a correlao entre as variveis corresponde a uma linha reta ou a


uma curva, pode-se utilizar modos qualitativos ou quantitativos.
No modo qualitativo, vai imperar o bom senso do pesquisador para verificar qual
o grau de intensidade na correlao entre as variveis; isso significa o estabelecimento de uma relao numrica que medir o nvel da correlao.

9.3. Coeficiente de Correlao Linear (r)


O coeficiente de correlao linear pode ser apresentado como uma medida de
correlao, pois tem como objetivo indicar o nvel de intensidade que ocorre na
correlao entre as variveis. O coeficiente de correlao linear pode ser positivo ou
negativo. O sinal positivo do coeficiente de correlao linear indica que o sentido da
correlao corresponde a uma reta de inclinao descendente, e o sinal negativo
corresponde a uma reta de inclinao ascendente. Uma das formas de medir o coeficiente de correlao linear foi desenvolvido por Pearson e recebe o nome de coefi-

PUC Minas Virtual

voltar

108

Probabilidade e Estatstica

sumrio

voltar

sumrio

ciente de correlao de Pearson. O coeficiente de correlao de Pearson mede o


grau de ajustamento dos valores em torno de uma reta.
Coeficiente de Correlao de Pearson (r):

r=

[n x

n xi yi ( xi )( yi )
2
i

][

( xi ) * n yi2 ( yi )
2

Temos
r = o coeficiente de Pearson
n = o nmero de observaes
xi = varivel independente
yi =varivel dependente
O valor do coeficiente de correlao r tem a variao entre +1 e 1, ou seja, est
limitado entre os valores do Intervalo[-1,+1].
r = +1 (correlao positiva entre as variveis);
r = - 1 (correlao perfeita negativa entre as variveis);
r = 0 (no h correlao entre as variveis ou, ainda, a correlao no linear,
caso exista).
Quanto mais prximo o valor de r estiver do valor 1, mais forte a correlao linear.
Quanto mais prximo o valor de r estiver do valor 0, mais fraca a correlao linear.
Em geral, multiplica-se o valor de r por 100; dessa forma, o resultado passa a ser
expresso em porcentagem. Na prtica, estabelecem-se critrios para verificar os
diversos nveis do fraco ao forte, chegando at o perfeito:
0<|r|<0,3 : a correlao fraca e fica difcil estabelecer relao entre as variveis. Em porcentagem: 0<|r|< 30%;
0,3 |r|< 0,6 : a correlao fraca, porm, podemos considerar a existncia de
relativa correlao entre as variveis. Em porcentagem: 30% |r| <60%;

PUC Minas Virtual

voltar

109

Probabilidade e Estatstica

sumrio

voltar

sumrio

0,6 |r| <1 : a correlao de mdia para forte; a relao entre as variveis
significativa, o que permite coerncia com poucos conflitos na obteno das concluses. Em porcentagem: 60% |r| 100%.
Exemplo:
Uma pesquisa pretende verificar se h correlao significativa entre o
peso total do lixo descartado, por dia, numa empresa com o peso do
papel contido nesse lixo.

Hotel

H1

Peso

10,4 19,85 21,2 24,3 27,38 58,09 33,6 35,75 38,33

total

H2

H3

Peso do 2,43 5,12

H4

H5

H6

H7

H8

H9

H10
49,14

6,88 6,22 8,84

8,76

7,54 8,47

9,55

11,43

papel

De acordo com os dados, fazemos a representao grfica. Os pares ordenados


formam o diagrama de disperso.

14

Peso do papel

12
10
8
6
4
2
0
10

20

30

40

50

60

Peso total do lixo

Figura 9.3. Correlao entre o peso total do lixo


descartado e o peso do papel contido nesse lixo

PUC Minas Virtual

voltar

110

Probabilidade e Estatstica

sumrio

70

voltar

sumrio

Para se verificar o grau de correlao entre as variveis, calcula-se o coeficiente de


correlao linear pela frmula do coeficiente de correlao de Pearson:

r=

[n x

n xi yi ( xi )( yi )
2
i

][

( xi ) * n yi2 ( yi )
2

Peso total (xi)

Peso papel (yi)

xi yi

xi 2

yi 2

H1

10,47

2,43

25,44

109,62

5,90

H2

19,85

5,12

101,63

394,02

26,21

H3

21,25

6,88

146,20

451,56

47,33

H4

24,36

6,22

151,52

593,41

38,69

H5

27,38

8,84

242,04

749,66

78,15

H6

28,09

8,76

246,07

789,05

76,74

H7

33,61

7,54

253,42

1129,63

56,85

H8

35,73

8,47

302,63

1276,63

71,74

H9

38,33

9,55

366,05

1469,19

91,20

H10

49,14

11,43

561,67

2414,74

130,64

288,21

75,24

2396,68

9377,52

623,47

r=

r=

r=

[n x

n xi yi ( xi )( yi )

2
i

][

( xi ) * n yi2 ( yi )
2

10 * 2396,68 288,21 * 75,24


[10 * 9377,52 (288,21) 2 ] * [10 * 623,47 (75,24) 2 ]

23966 ,8 21684 ,9
2281,83
2281,83
=
=
= 0,9206
[93775 ,2 83065 ] * [6234 ,7 - 5661,1]
10 * 710,21 * 573,59 2478 ,57

PUC Minas Virtual

voltar

111

Probabilidade e Estatstica

sumrio

voltar

r = 0,921

sumrio

ou

r = 92,1%

Observamos, assim: 0,6 r 1 . Esse resultado indica que h uma forte correlao
entre as variveis ou, ainda, que a correlao entre as duas variveis bastante
significativa. Nesse caso, podemos concluir haver coerncia na afirmao de que
existe correlao entre o peso total do lixo descartado e o peso do papel contido
nesse lixo.

9.4. Regresso Reta de regresso


(ou reta de mnimos quadrados ou reta de ajuste)
A correlao linear uma correlao entre duas variveis, cujo grfico aproxima-se
de uma linha. O grfico cartesiano que representa essa linha denominado diagrama de disperso. Para poder avaliar melhor a correlao entre as variveis,
interessante obter a equao da reta; essa reta chamada de reta de regresso e
a equao que a representa a equao de regresso. O diagrama de disperso
construdo de acordo com os dados amostrais de n observaes e a equao de
regresso dada pela expresso:
Y= aX + b Y = aX + b
X a varivel independente
YY a varivel dependente; na verdade, a varivel correlacionada com a varivel X e sobre a qual se obtm um valor estimado.
Esse tipo de notao, de Y para Y, caracteriza que no se trata de uma relao
funcional para a determinao da reta, e sim de uma relao estatstica, em que a
distribuio est baseada em estimativas de dados colhidos por amostragem.
Sendo a e b os parmetros de equao da reta, esses podem ser calculados por
meio das frmulas:

a=

n xi yi xi * yi

b = y ax

n xi2 ( xi ) 2

PUC Minas Virtual

voltar

112

Probabilidade e Estatstica

sumrio

voltar

sumrio

Sendo:
n = nmero de observaes dos dados amostrais

= valor mdio da varivel y; o clculo faz-se pela expresso y =

x = valor mdio da varivel x; o clculo faz-se pela expresso x =

yi
n

xi
n

Exemplo:
Determine a equao da reta de regresso do exemplo anterior, que trata de uma pesquisa entre o peso total do lixo descartado por dia com o
peso do papel contido nesse lixo.
Para a obteno da equao da reta de regresso, elabora-se inicialmente uma tabela contendo nas colunas as variveis dependentes (yi), as independentes (xi) e os
produtos xiyi e xi2.
Clculo do parmetro a da equao da reta:

a=

n xi yi xi * yi
n

xi2

( xi )

10 * 2396 ,68 288 * 75,24 23996,8 - 21684,9


=
93775,2 - 83065
10 * 9377 ,52 ( 288,21) 2

a=

2281,83
= 0,213
10710,2

Clculo do parmetro b da equao da reta:

y=

75,24
= 7,52
10

x=

288,21
= 28,82
10

b = y a x = 7,52 - 0,213 * 28,82 = 7,52 - 6,14 = 1,38


Uma vez calculados os parmetros a e b, pode-se escrever a equao da reta:
Y = 0,213 X + 1,38

PUC Minas Virtual

voltar

113

Probabilidade e Estatstica

sumrio

voltar

sumrio

Para o traado de uma reta, basta que se conhea dois de seus pontos. Assim, com
base na equao da reta acima, pode-se estabelecer dois pontos para X e Y.
Para X = 0, temos Y = 1,38
Para X = 50, temos Y = 12,03
De acordo com os pontos P1(0;1,38) e P2(50;12,03), pode-se traar a reta de regresso.

14
y = 0,2131x + 1,3836

12
10
8
6
4
2
0
0

10

20

30

40

50

60

Figura 9.4. Correlao entre o peso total do lixo


descartado e o peso do papel contido nesse lixo

Com base no conhecimento da equao da reta, pode-se interpolar e extrapolar


valores.
Interpolao: a interpolao ocorre quando o valor considerado pertence ao intervalo da tabela, porm, no figura entre os dados coletados.
Supondo-se o valor 15 kg para o peso total do lixo descartado, pode-se estimar o
peso de papel contido nesse lixo. Uma vez que 15 kg no um dado coletado e,
conseqentemente, no pertence tabela de dados, utiliza-se a equao da reta
para determinar o valor correspondente ao peso do papel.
Para 15 kg de lixo descartado, estima-se que haja 4,58 kg de papel contido nesse
lixo.

PUC Minas Virtual

voltar

114

Probabilidade e Estatstica

sumrio

voltar

sumrio

Extrapolao: a extrapolao ocorre quando o valor considerado no pertence ao


intervalo da tabela, e tambm no figura entre os dados coletados.
Suponha que o peso do lixo descartado seja de 60 kg. Esse valor no um dado
coletado e nem se encontra dentro do intervalo [10,47, 49,14]. Essa situao
semelhante anterior e utiliza-se a equao de reta para determinar o peso do
papel.
Para 60 kg de lixo descartado, estima-se, por extrapolao, que haja 14,16 kg de
papel contido nesse lixo.

PUC Minas Virtual

voltar

115

Probabilidade e Estatstica

sumrio

voltar

sumrio

Referncias Bibliogrficas

BUSSAB, W.O. e Morettin, P.A. Estatstica Bsica. So Paulo: Atual, 1987.


FONSECA, J.S. e Martins, G.A. Curso de Estatstica. So Paulo: Atlas, 1993.
LAPPONI, J.C. Estatstica usando Excel 5 e 6. So Paulo: Lapponi Treinamento e
Editora, 1997.
MORETTIN, L.G. Estatstica Bsica Vol. 2 Inferncia. So Paulo: Makron Books,
1999.
MORETTIN, L.G. Estatstica Bsica Vol.1 Probabilidade. So Paulo: Makron Books, 1999.
STEVENSON,W.J. Estatstica Aplicada Administrao. So Paulo: Harbra, 1996.
TIBONI,C.G. R. Estatstica Bsica para o curso de Turismo. So Paulo: Atlas, 2002.
TOLEDO, G. L. e Ovalle, I.I. Estatstica Bsica. So Paulo: Atlas, 1985.

PUC Minas Virtual

voltar

116

Probabilidade e Estatstica

sumrio

Você também pode gostar