Você está na página 1de 66

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof.

Mnica Barradas 1






ESTATSTICA
BSICA
(Prof Mnica Barradas)


















Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 2



NDICE



1. Introduo Geral Compreenso Estatstica........................................................................3

2. Distribuio de Freqncia.................................................................................................10

3. Medidas de Centralidade ou de Tendncia Central............................................................14

4. Medidas de Assimetria e Curtose.......................................................................................23

5. Principais Tipos de Representao Grfica........................................................................25

6. Medidas de Disperso ou de Variabilidade........................................................................28

7. Correlao e Regresso.......................................................................................................32

8. Introduo Amostragem...................................................................................................47

9. Probabilidade......................................................................................................................53

10. Variveis Aleatrias Discretas ........................................................................................56

11. Distribuies de Variveis Aleatrias Discretas..............................................................60

12. Distribuies de Variveis Aleatrias Contnuas............................................................62




















Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 3

CAPTULO 1 INTRODUO A ESTATISTICA
1. Objeto da Estatstica
Estatstica uma cincia exata que visa fornecer subsdios ao analista para coletar,
organizar, resumir, analisar e apresentar dados. Trata de parmetros extrados da populao,
tais como mdia ou desvio padro.
A estatstica fornece-nos as tcnicas para extrair informao de dados, os quais so muitas
vezes incompletos, na medida em que nos do informao til sobre o problema em estudo,
sendo assim, objetivo da Estatstica extrair informao dos dados para obter uma melhor
compreenso das situaes que representam.
Quando se aborda uma problemtica envolvendo mtodos estatsticos, estes devem ser
utilizados mesmo antes de se recolher amostra, isto , deve-se planejar a experincia que
nos vai permitir recolher os dados, de modo que, posteriormente, se possa extrair o mximo
de informao relevante para o problema em estudo, ou seja, para a populao de onde os
dados provm.
Quando de posse dos dados, procura-se agrupa-los e reduzi-los, sob forma de amostra,
deixando de lado a aleatoriedade presente.
Seguidamente o objetivo do estudo estatstico pode ser o de estimar uma quantidade ou
testar uma hiptese, utilizando-se tcnicas estatsticas convenientes, as quais realam toda a
potencialidade da Estatstica, na medida em que vo permitir tirar concluses acerca de uma
populao, baseando-se numa pequena amostra, dando-nos ainda uma medida do erro
cometido.
2. Ferramentas Estatsticas

2.1 - O que Estatstica?

Segundo JURAN:
1. a cincia da tomada de deciso perante incertezas;
2. Coleta, anlise e interpretao de dados;
3. um kit de ferramentas que ajuda a resolver problemas;
4. Base para a maior parte das decises tomadas quanto ao controle da qualidade, assim
como em quase todas as outras reas da atividade humana moderna.

Vista dessa forma, a Estatstica no deve ser confundida como uma disciplina isolada, e sim,
compreendida como uma ferramenta ou um conjunto de ferramentas, disponvel para a
soluo de problemas em diversas reas do conhecimento.

Segundo FEIGENBAUM: Preciso significativamente aumentada em produo de itens e
produtos tem sido acompanhada pela necessidade de mtodos aperfeioados para medio,
especificao e registro dela. A estatstica, denominada cincia das medies, representa
uma das tcnicas mais valiosas utilizadas nas quatro tarefas, e isso tem ficado cada vez mais
evidente.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 4

2.2 Onde se aplica a Estatstica na Engenharia?

As aplicaes concentram-se fundamentalmente em dois campos de ao: o Controle
Estatstico do Processo e o Controle Estatstico da Qualidade.

Definies segundo JURAN:
1. Processo: qualquer combinao especfica de mquinas, ferramentas, mtodos, materiais
e/ou pessoas empregadas para atingir qualidades especficas num produto ou servio. Estas
qualidades so chamadas de caractersticas de qualidade, que podem ser uma dimenso,
propriedade do material, aparncia, etc.
2. Controle: um ciclo de feedback (realimentao) atravs da qual medimos o desempenho
real, comparando-o com o padro, e agimos sobre a diferena.
3. Controle Estatstico do Processo (CEP): aplicao de tcnicas estatsticas para medir e
analisar a variao nos processos.
4. Controle Estatstico da Qualidade (CEQ): aplicao de tcnicas estatsticas para medir e
aprimorar a qualidade dos processos. CEQ inclui CEP, ferramentas de diagnstico, planos de
amostragem e outras tcnicas estatsticas.
Segundo FEIGENBAUM, provavelmente, mais importante do que os prprios mtodos
estatsticos tm sido o impacto causado sobre o pensamento industrial pela filosofia que
representam. O ponto de vista estatstico resume-se essencialmente nisto: a variabilidade
na qualidade do produto deve ser constantemente estudada:







Esse ponto de vista, que enfatiza o estudo da variao, exerce efeito significativo sobre
certas atividades no controle da qualidade. Ainda segundo FEIGENBAUM, cinco
ferramentas estatsticas tornaram-se amplamente utilizadas nas tarefas de controle da
qualidade:

1. Distribuio de freqncias;
2. Grficos de controle;
3. Aceitao por amostragem;
4. Mtodos especiais;
5. Confiabilidade.

Na abordagem do papel dos mtodos estatsticos no gerenciamento de processos de
produo, KUME tambm faz referncia variabilidade. Diz que, (...) independentemente
dos tipos de produtos ou de mtodos de produo usados, as causas de produtos defeituosos
so universais. Variao, esta a causa., Variaes nos materiais, na condio dos
equipamentos, no mtodo de trabalho e na inspeo so as causas dos defeitos. Ainda
segundo KUME, (...) os mtodos estatsticos so ferramentas eficazes para a melhoria do
processo produtivo e reduo de seus defeitos.

O primeiro passo na busca da verdadeira causa de um defeito a cuidadosa observao do
fenmeno do defeito. Aps tal observao cuidadosa, a verdadeira causa torna-se evidente.
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 5

As ferramentas estatsticas, diz KUME, conferem objetividade e exatido observao. As
mximas da forma estatstica de pensar so:

1. Dar maior importncia aos fatos do que os conceitos abstratos;
2. No expressar fatos em termos de intuio ou idias. Usar evidncias obtidas a partir de
resultados especficos da observao;
3. Os resultados da observao, sujeitos como so a erros e variaes, so partes de um todo
obscuro. A principal meta da observao descobrir esse todo obscuro;
4. Aceitar o padro regular que aparece em grande parte dos resultados observados como
uma informao confivel.
5. O conhecimento dominado ato o presente momento no nada mais que um
embasamento para hipteses futuras. Uma vez que isso tenha sido compreendido, a forma de
pensar mencionada pode ser aproveitada para aprofundar a compreenso do processo
produtivo e dos meios para melhor-lo.

2.3 Definies Bsicas da Estatstica

1) FENMENO ESTATSTICO: qualquer evento que se pretenda analisar, cujo estudo
seja possvel da aplicao do mtodo estatstico. So divididos em trs grupos:
Fenmenos de massa ou coletivo: so aqueles que no podem ser definidos por uma simples
observao. A estatstica dedica-se ao estudo desses fenmenos.

Fenmenos individuais: so aqueles que iro compor os fenmenos de massa.
Fenmenos de multido: quando as caractersticas observadas para a massa no se
verificam para o particular.

2) DADO ESTATSTICO: um dado numrico e considerado a matria-prima sobre a
qual iremos aplicar os mtodos estatsticos.
3) POPULAO: o conjunto total de elementos portadores de, pelo menos, uma
caracterstica comum.
4) AMOSTRA: uma parcela representativa da populao que examinada com o
propsito de tirarmos concluses sobre a essa populao.
5) PARMETROS: So valores singulares que existem na populao e que servem para
caracteriz-la.Para definirmos um parmetro devemos examinar toda a populao.
6) ESTIMATIVA: um valor aproximado do parmetro e calculado com o uso da
amostra.
7) ATRIBUTO: quando os dados estatsticos apresentam um carter qualitativo, o
levantamento e os estudos necessrios ao tratamento desses dados so designados
genericamente de estatstica de atributo.
8) VARIVEL: , convencionalmente, o conjunto de resultados possveis de um fenmeno.

Varivel Qualitativa: Quando seus valores so expressos por atributos
Varivel Quantitativa: Quando os dados so de carter nitidamente quantitativo, e o
conjunto dos resultados possui uma estrutura numrica, trata-se, portanto da estatstica de
varivel e se dividem em:
Varivel Discreta ou Descontnua: Seus valores so expressos geralmente atravs de
nmeros inteiros no negativos. Resulta normalmente de contagens. Ex: N de alunos
presentes s aulas de introduo estatstica econmica no 1 semestre de 1997: mar = 18,
abr = 30 , mai = 35 , jun = 36.
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 6
Varivel Contnua: Resulta normalmente de uma mensurao, e a escala numrica de seus
possveis valores corresponde ao conjunto R dos nmeros Reais, ou seja, podem assumir,
teoricamente, qualquer valor entre dois limites. Ex.: Quando voc vai medir a temperatura de
seu corpo com um termmetro de mercrio o que ocorre o seguinte: O filete de mercrio,
ao dilatar-se, passar por todas as temperaturas intermedirias at chegar na temperatura
atual do seu corpo.

2.4 Planejamento para Coleta e Anlise de Dados

As ferramentas devem ser utilizadas de maneira eficiente para alcanar o sucesso. Para tanto,
o processo deve incluir:
1. planejamento cuidadoso da coleta de dados;
2. anlise de dados para tirar concluses estatsticas e
3. transio para a resposta ao problema tcnico original.

Segundo JURAN, alguns passos-chave so:
1. Coletar informaes anteriores suficientes para traduzir o problema de engenharia em
problema especfico que possa ser avaliado por mtodos estatsticos;
2. Planejar a coleta de dados:
a. Determinar o tipo de dados necessrios quantitativos (mais custo, mais til) e
qualitativos;
b. Determinar se quaisquer dados prvios esto disponveis e so aplicveis ao presente
problema;
c. Se o problema exigir uma avaliao de vrias decises alternativas, obter informaes
sobre as conseqncias econmicas de uma deciso errada.
d. Se o problema exigir a estimao de um parmetro, definir a preciso necessria para a
estimativa;
e. Determinar se o erro de medio grande o suficiente para influenciar o tamanho
calculado da amostra ou o mtodo da anlise de dados;
f. Definir as suposies necessrias para calcular o tamanho da amostra exigido;
g. Calcular o tamanho da amostra necessrio considerando a preciso desejada do resultado,
erro amostral, variabilidade dos dados, erros de medio e outros fatores;
h. Definir quaisquer requisitos para preservar a ordem das medies quando o tempo for um
parmetro chave;
i.Determinar quaisquer requisitos para coletar dados em grupos definidos diferentes
condies a serem avaliadas;
j. Definir o mtodo de anlise de dados e quaisquer hipteses necessrias;
k.Definir os requisitos para quaisquer programas de computador que venham a ser
necessrios.
3. Coletar dados:
a. Usar mtodos para assegurar que a amostra selecionada de forma aleatria;
b. Registrar os dados e tambm as condies presentes no momento de cada observao;
c. Examinar os dados amostrais para assegurar que o processo mostra estabilidade suficiente
para se fazer previses vlidas para o futuro.
4. Analisar os dados:
a. Selecionar os dados;
b. Avaliar as hipteses previamente estabelecidas. Se necessrio, tomar atitudes corretivas
(novas observaes);
c. Aplicar tcnicas estatsticas para avaliar o problema original;
d. Determinar se dados e anlises adicionais so necessrios;
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 7
e. Realizar anlises de sensibilidade variando estimativas amostrais importantes e outros
fatores na anlise e observando o efeito sobre as concluses finais.
5. Rever as concluses da anlise de dados para determinar se o problema tcnico original
foi avaliado ou se foi modificado para se enquadrar nos mtodos estatsticos.
6. Apresentar os resultados:
a. Estabelecer as concluses de forma significativa, enfatizando os resultados nos termos do
problema original, e no na forma dos ndices estatsticos usados na anlise;
b. Apresentar graficamente os resultados quando apropriado. Usar mtodos estatsticos
simples no corpo do relatrio e colocar as anlises complexas em um apndice.
7. Determinar se as concluses do problema especfico so aplicveis a outros
problemas ou se os dados e clculos poderiam ser teis para outros problemas.


3. ESTATSTICA DESCRITIVA
Viu-se anteriormente um roteiro para coleta e anlise de dados. As sries de dados,
basicamente, so provenientes de duas fontes: os dados histricos e os dados de
experimentos planejados.

Os dados histricos so sries de dados existentes e, em geral, analisar estatisticamente
esses dados mais econmico (tempo e despesas) se comparado com dados obtidos a partir
de experimentos planejados. Mesmo com uma anlise estatstica complexa, em geral, pouco
sucesso se obtm com tais dados. No controle de um processo, algumas razes para esse
insucesso ocorrer so:
impossvel distinguir a origem de um determinado efeito.
processo.
operao do processo.
odem no ter sido mantidas
constantes, e serem as reais causadoras dos efeitos observados no processo.
Por essas razes, recomenda-se a anlise de sries de dados histricos apenas para a
indicao de variveis importantes a serem observadas em um experimento planejado.

Os dados de experimentos planejados so coletados com o objetivo estudar e analisar um
problema. So dados reunidos em diversas sries de variveis com aparente importncia em
um processo, enquanto se mantm constantes (com valores registrados) todas as outras
variveis que possivelmente poderiam alterar o resultado. Aqui tratar-se- de mtodos
prticos de organizao de dados. Segundo SPIEGEL4: A parte da estatstica que procura
somente descrever e analisar um certo grupo, sem tirar quaisquer concluses ou inferncias
sobre um grupo maior, chamada estatstica descritiva ou dedutiva.
Freqentemente dois ou mais mtodos de organizao so utilizados para descrever com
clareza dados coletados. Alguns desses mtodos so: grficos dos dados na ordem
cronolgica, distribuio e histogramas de freqncia, caractersticas amostrais, medidas de
tendncia central e medidas de disperso.




Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 8
4. SRIES ESTATSTICAS
TABELA: Resume um conjunto de dados dispostos segundo linhas e colunas de maneira
sistemtica.
De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemos colocar:
- um trao horizontal ( - ) quando o valor zero;
- trs pontos ( ... ) quando no temos os dados;
- zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade utilizada;
- um ponto de interrogao ( ? ) quando temos dvida quanto exatido de
determinado valor.
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. "Salientamos que
nestes documentos as tabelas no sero abertas devido a limitaes do editor html".
qualquer tabela que apresenta a distribuio de um conjunto de dados estatsticos em
funo da poca, do local ou da espcie.
Sries Homgradas: so aquelas em que a varivel descrita apresenta variao discreta ou
descontnua. Podem ser do tipo temporal, geogrfica ou especfica.
a) Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O local e a
espcie (fenmeno) so elementos fixos. Esta srie tambm chamada de histrica ou
evolutiva.
ABC VECULOS LTDA.
Vendas no 1 bimestre de 2002
PERODO

UNIDADES VENDIDAS *

JAN/2002 2 0
FEV/2002 1 0
TOTAL 3 0
* Em mil unidades
.





Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 9
b) Srie Geogrfica: Apresenta como elemento varivel o fator geogrfico. A poca e o fato
(espcie) so elementos fixos. Tambm chamada de espacial, territorial ou de localizao.
ABC VECULOS LTDA.
Vendas no 1 bimestre de 2002
FILIAIS

UNIDADES VENDIDAS *

So Paulo 1 3
Rio de Janeiro 1 7
TOTAL 3 0
* Em mil unidades
c) Srie Especfica: O carter varivel apenas o fato ou espcie. Tambm chamada de
srie categrica.
ABC VECULOS LTDA.
Vendas no 1 bimestre de 2002
MARCA

UNIDADES VENDIDAS *

FIAT 1 8
GM 1 2
TOTAL 3 0
* Em mil unidades
Sries Conjugadas: Tambm chamadas de tabelas de dupla entrada. So apropriadas
apresentao de duas ou mais sries de maneira conjugada, havendo duas ordens de
classificao: uma horizontal e outra vertical. O exemplo abaixo de uma srie geogrfica-
temporal.
ABC VECULOS LTDA.
Vendas no 1 bimestre de 2002
FILIAIS Janeiro/2002 Fevereiro/2002
So Paulo 1 0 3
Rio de Janeiro 1 2 5
TOTAL 2 2 8
* Em mil unidades
Obs: as sries hetergradas sero estudas no captulo 2 ( distribuio de frequncias ).
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 10
CAPTULO 2 DISTRIBUIO DE FREQUNCIAS


uma ferramenta estatstica apropriada para a apresentao de grandes massas de dados
numa forma que torna mais clara a tendncia central e a disperso dos valores ao longo da
escala de medio, bem como a freqncia relativa de ocorrncia dos diferentes valores.

Quando da anlise de dados, comum procurar conferir certa ordem aos nmeros tornando-
os visualmente mais amigveis. O procedimento mais comum o de diviso por classes ou
categorias, verificando-se o nmero de indivduos pertencentes a cada classe.
um tipo de tabela que condensa uma coleo de dados conforme as frequncias (repeties
de seus valores).
Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que no foram
numericamente organizados. difcil formarmos uma idia exata do comportamento do
grupo como um todo, a partir de dados no ordenados.
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
ROL: Tem-se um rol aps a ordenao dos dados (crescente ou decrescente).
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
Distribuio de frequncia sem intervalos de classe: a simples condensao dos dados
conforme as repeties de seus valores. Para um tabela de tamanho razovel esta distribuio
de frequncia inconveniente, j que exige muito espao. Veja exemplo abaixo:
Tabela 1
Dados Frequncia
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
52 1
54 1
57 1
58 2
60 2
Total 20
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 11
Distribuio de frequncia com intervalos de classe:Quando o tamanho da amostra
elevado mais racional efetuar o agrupamento dos valores em vrios intervalos de classe.
Tabela 2
Classes Frequncias
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20

2.1 Elementos de uma Distribuio de Freqncia com classes
CLASSE: so os intervalos da varivel simbolizada por i e o nmero total de classes
simbolizada por k. Ex: na tabela anterior k=5 e 49 |------- 53 a 3 classe, onde i=3. Para a
construo de uma tabela a partir de um dado bruto calcularemos o k atravs da Regra de
Sturges" k=1+3,3logn (para n<25) ou k=\n (para n>25).
LIMITES DE CLASSE: so os extremos de cada classe. O menor nmero o limite
inferior de classe (li) e o maior nmero, limite superior de classe (Ls). Ex: em 49 |--- 53
Li
3
= 49 e Ls
3
= 53. O smbolo |--- representa um intervalo fechado esquerda e aberto
direita. O dado 53 no pertence classe 3 e sim a classe 4 representada por 53 |--- 57.
AMPLITUDE DO INTERVALO DE CLASSE: obtida atravs da diferena entre o
limite superior e inferior da classe simbolizada por a =Ls - li. Ex: na tabela anterior a= 53 -
49 = 4. Obs: Na distribuio de frequncia c/ classe o c ser igual em todas as classes. Para
a construo de uma tabela a partir de um dado bruto temos: a=Ls-Li/K
AMPLITUDE TOTAL DA DISTRIBUIO: a diferena entre o valor mximo e o
valor mnimo da amostra. Onde At =Xmax - Xmin. Em nosso exemplo At = 60 - 41 = 19.
PONTO MDIO DE CLASSE: o ponto que divide o intervalo de classe em duas partes
iguais. Ex: em 49 |------- 53 o ponto mdio x
3
= (53+49)/2 = 51, ou seja, x
3
=(Li+Ls)/2.





Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 12

Os dados brutos a seguir apresentam um conjunto de tempos para determinada operao.

5,1 5,3 5,3 5,6 5,8 5,9 6 6,1 6,2 6,2
6,3 6,3 6,3 6,4 6,4 6,4 6,5 6,5 6,6 6,7
6,7 6,8 6,8 6,9 6,9 7 7,1 7,1 7,2 7,2
7,3 7,4 7,5 7,5 7,6 7,6 7,6 7,7 7,7 7,8
7,8 7,9 7,9 8 8 8,1 8,2 8,3 8,3 8,4
8,5 8,5 8,6 8,7 8,8 8,8 8,9 9 9,1 9,2
9,4 9,4 9,5 9,5 9,6 9,8 9,9 10 10,2 10,2
10,4 10,6 10,8 10,9 11,2 11,5 11,8 12,3 12,7 14,9
2.2 Regras para a elaborao de uma distribuio de freqncias com classes
1 Organize os dados brutos em um ROL.
2 Calcule a amplitude total At.
No nosso exemplo: At =14,9 5,1 = 9,8
3 Calcule o nmero de classes (K), que ser calculado usando K = . Obrigatoriamente
deve estar compreendido entre 5 a 20. Neste caso, K igual a 8,94, aproximadamente, 8. No
nosso exemplo: n = 80 dados, ento , k=\n = 8,9 .
4 Conhecido o nmero de classes define-se a amplitude de cada classe:

No exemplo, a ser igual a:

5 Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo. Podemos
montar a tabela, com o cuidado para no aparecer classes com frequncia = 0 (zero).
6 Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe
(inferior e superior), onde limite Inferior ser 5,1 e o limite superior ser 15 + 1,23.

Intervalo de
Classe
Freqncia
Absoluta (fi)
Freqncia
Acumulada (Fi)
Freqncia
Relativa (fr)
Freqncia
Acumulada (Fr)
05,10 |---| 06,33 13 13 16,25 16,25
06,34 |---| 07,57 21 34 26,25 42,50
07,58 |---| 08,81 22 56 27,50 70,00
08,82 |---| 10,05 15 71 18,75 88,75
10,06 |---| 11,29 4 75 5,00 93,75
11,30 |---| 12,53 3 78 3,75 97,50
12,54 |---| 13,77 1 79 1,25 98,75
13,78 |---| 15,01 1 80 1,25 100
Total 80 - 100 -

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 13

Obs: Agrupar os dados em classes uma importante ferramenta para resumir grandes massas
de dados brutos, no entanto acarreta perda de alguns detalhes.
Frequncias simples ou absolutas (fi): so os valores que realmente representam o nmero
de dados de cada classe. A soma das frequncias simples igual ao nmero total dos dados
da distribuio.
Frequncias relativas (fr): so os valores das razes entre as frequncias absolutas de cada
classe e a frequncia total da distribuio. A soma das frequncias relativas igual a 1 (100
%).
Frequncia simples acumulada de uma classe (Fi): o total das frequncias de todos os
valores inferiores ao limite superior do intervalo de uma determida classe.
Frequncia relativa acumulada de um classe (Fr): a frequncia acumulada da classe,
dividida pela frequncia total da distribuio.
















Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 14

CAPTULO 3 MEDIDAS DE CENTRALIDADE


H vrias medidas de tendncia central, entretanto nesta apostila, ser abordado o estudo de
apenas aquelas que so mais significativas. As mais importante medidas de tendncia central
so: a mdia aritmtica, mdia aritmtica para dados agrupados, mdia aritmtica ponderada,
mediana, moda.

3. Medidas de Centralidade
3.1 Mdia Aritmtica=
Sendo a mdia uma medida to sensvel aos dados, preciso ter cuidado com a sua
utilizao, pois pode dar uma imagem distorcida dos dados.
A mdia possui uma particularidade bastante interessante, que consiste no seguinte:
se calcularmos os desvios de todas as observaes relativamente mdia e somarmos esses
desvios o resultado obtido igual a zero.
A mdia tem uma outra caracterstica, que torna a sua utilizao vantajosa em certas
aplicaes: Quando o que se pretende representar a quantidade total expressa pelos dados,
utiliza-se a mdia.
Na realidade, ao multiplicar a mdia pelo nmero total de elementos, obtemos a quantidade
pretendida.
igual ao quociente entre a soma dos valores do conjunto e o nmero total dos valores.
...onde xi so os valores da varivel e n o nmero de valores.
.Dados no-agrupados:
Quando desejamos conhecer a mdia dos dados no-agrupados em tabelas de frequncias,
determinamos a mdia aritmtica simples.
Exemplo: Os dados a seguir apresentam leituras de concentrao de um processo qumico
feitas a cada duas horas 10, 14, 13, 15, 16, 18 e 12, temos, uma concentrao mdia de:
.= (10+14+13+15+16+18+12) / 7 = 14
Desvio em relao mdia: a diferena entre cada elemento de um conjunto de valores e
a mdia aritmtica, ou seja:.. di = Xi -
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 15
No exemplo anterior temos sete desvios:.d1 = 10 - 14 = - 4 ,.d2 = 14 - 14 = 0 , d3 = 13 - 14 =
- 1 ,.d4 = 15 - 14 = 1 ,.d5 = 16 - 14 = 2 ,..d6 = 18 - 14 = 4 e.d7 = 12 - 14 = - 2.
Propriedades da mdia
1 propriedade: A soma algbrica dos desvios em relao mdia nula.
No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0
2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de
uma varivel, a mdia do conjunto fica aumentada (ou diminuda) dessa constante.
Se no exemplo original somarmos a constante 2 a cada um dos valores da varivel temos:
Y = 12+16+15+17+18+20+14 / 7 = 16 ou
Y = .+ 2 = 14 +2 = 16
3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma varivel
por uma constante (c), a mdia do conjunto fica multiplicada (ou dividida) por essa
constante.
Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da varivel
temos:
Y = 30+42+39+45+48+54+36 / 7 = 42 ou
Y = x 3 = 14 x 3 = 42
.
Dados agrupados:
Sem intervalos de classe
Consideremos a distribuio relativa de um canal de comunicao que est sendo
monitorado pelo registro do n de erros em um conjunto de caracteres (string) 1.000 bits.
Dados para 34 desses conjuntos so vistos a seguir.
N de erros frequncia = fi
0 2
1 6
2 10
3 12
4 4
total 34
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 16
Como as frequncias so nmeros indicadores da intensidade de cada valor da varivel, elas
funcionam como fatores de ponderao, o que nos leva a calcular a mdia aritmtica
ponderada, dada pela frmula:

..xi. ..fi. ..xi.fi .
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
total 34 78
onde 78 / 34 = 2,3 erros
Com intervalos de classe
Neste caso, convencionamos que todos os valores includos em um determinado intervalo de
classe coincidem com o seu ponto mdio, e determinamos a mdia aritmtica ponderada por
meio da frmula:
..onde Xi o ponto mdio da classe.
Exemplo: Calcular o nmero de molas fora de conformidade, em cada batelada de produo,
com um tamanho igual a 40 conforme a tabela abaixo.
N de molas frequncia = fi ponto mdio = xi ..xi.fi.
50 |---- 54 4 52 208
54 |---- 58 9 56 504
58 |---- 62 11 60 660
62 |---- 66 8 64 512
66 |---- 70 5 68 340
70 |---- 74 3 72 216
Total 40 2.440
Aplicando a frmula acima temos: 2.440 / 40.= 61. logo... = 61 molas



Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 17

MODA
o valor que ocorre com maior frequncia em uma srie de valores.
Mo o smbolo da moda.
Desse modo, a fora modal de remoo para um conector a fora mais comum, isto , a
fora de remoo medida em um teste de laboratrio para um conector.
.
A Moda quando os dados no esto agrupados
- A moda facilmente reconhecida: basta, de acordo com definio, procurar o valor
que mais se repete.
Exemplo: Na srie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda igual a 10.
- H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea
mais vezes que outros.
Exemplo: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.
- .Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos, ento,
que a srie tem dois ou mais valores modais.
Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A srie
bimodal.
.A Moda quando os dados esto agrupados
a) Sem intervalos de classe
Uma vez agrupados os dados, possvel determinar imediatamente a moda: basta fixar o
valor da varivel de maior frequncia.
Exemplo: Qual a temperatura mais comum medida no ms abaixo:
Temperaturas Frequncia
0 C 3
1 C 9
2 C 12
3 C 6
Resp: 2 C a temperatura modal, pois a de maior frequncia.
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 18
.
b) Com intervalos de classe
A classe que apresenta a maior frequncia denominada classe modal. Pela definio,
podemos afirmar que a moda, neste caso, o valor dominante que est compreendido entre
os limites da classe modal. O mtodo mais simples para o clculo da moda consiste em
tomar o ponto mdio da classe modal. Damos a esse valor a denominao de moda bruta.
Mo = ( Li+ Ls) / 2
onde Li = limite inferior da classe modal e Ls= limite superior da classe modal.
Exemplo: Calcule a resistncia modal dos 33 resistores conforme a tabela abaixo.
Resistencia (em ohms) Frequncia
54 |---- 58 9
58 |---- 62 11
62 |---- 66 8
66 |---- 70 5
Resp: a classe modal 58|--- 62, pois a de maior frequncia. Li=58 e Ls=62
Mo = (58+62) / 2 = 60 cm (este valor estimado, pois no conhecemos o valor real da
moda).
Mtodo mais elaborado pela frmula de CZUBER:
Mo = Li + ((f
mo
- f
ant
) / ( 2f
mo
(f
ant
+ f
post
))) x c
Li= limite inferior da classe modal
f
mo
= frequncia da classe modal
f
ant
=frequncia da classe anterior da classe modal
f
post
=frequncia da classe posterior da classe modal
c = amplitude da classe modal
Obs: A moda utilizada quando desejamos obter uma medida rpida e aproximada de
posio ou quando a medida de posio deva ser o valor mais tpico da distribuio. J a
mdia aritmtica a medida de posio que possui a maior estabilidade.


Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 19

MEDIANA
A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou
decrescente), o valor situado de tal forma no conjunto que o separa em dois subconjuntos
de mesmo nmero de elementos.
Smbolo da mediana: Md
.A mediana em dados no-agrupados
Dada uma srie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 }
De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao
(crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 }
O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9.
Mtodo prtico para o clculo da Mediana
Se a srie dada tiver nmero mpar de termos:
O valor mediano ser o termo de ordem dado pela frmula :
O elemento mediano ser:..E
Md
= n + 1 / 2
Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 2, 5 }
1 - ordenar a srie { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
n = 9 logo (n + 1)/2 dado por (9+1) / 2 = 5, ou seja, o 5 elemento da srie ordenada ser a
mediana.
A mediana ser o 5 elemento, ou seja, Md = 2
Se a srie dada tiver nmero par de termos:
O elemento mediano ser:..E
Md
= n / 2
Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }
1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
n = 10 logo a frmula ficar: :..E
Md
= 10 / 2 = 5
Ser na realidade (5 termo + 6 termo) / 2
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 20
A mediana ser = (2+3) / 2, ou seja, Md = 2,5 . A mediana no exemplo ser a mdia
aritmtica do 5 e 6 termos da srie.
Notas:
- Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da
mediana com um dos elementos da srie.
- Quando o nmero de elementos da srie estatstica for par, nunca haver
coincidncia da mediana com um dos elementos da srie. A mediana ser sempre a
mdia aritmtica dos 2 elementos centrais da srie.
- Em um srie a mediana, a mdia e a moda no tm, necessariamente, o mesmo valor.
- A mediana, depende da posio e no dos valores dos elementos na srie ordenada.
Essa uma da diferenas marcantes entre mediana e mdia (que se deixa
influenciar, e muito, pelos valores extremos). Vejamos:
Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10
Em { 5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10
Isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia
dos valores extremos, ao passo que a mediana permanece a mesma.
.
A mediana em dados agrupados
a) Sem intervalos de classe
Neste caso, o bastante identificar a frequncia acumulada imediatamente superior metade
da soma das frequncias. A mediana ser aquele valor da varivel que corresponde a tal
frequncia acumulada.
Exemplo conforme tabela abaixo:
Varivel xi Frequncia fi Frequncia acumulada
0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
Total 35 -
Quando o somatrio das frequncias for mpar o valor mediano ser o termo de ordem dado
pela frmula :.
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 21

Como o somatrio das frequncias = 35 a frmula ficar: ( 35+1 ) / 2 = 18 termo = 3..
Quando o somatrio das frequncias for par o valor mediano ser o termo de ordem dado
pela frmula :.

Exemplo - Calcule Mediana da tabela abaixo:
Varivel xi Frequncia fi Frequncia acumulada
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8 -
Aplicando a frmula acima teremos: [(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 +
16) / 2 = 15,5
b) Com intervalos de classe
Devemos seguir os seguintes passos: 1) Determinamos as frequncias acumuladas ; 2)
Calculamos ; 3) Marcamos a classe correspondente frequncia acumulada
imediatamente superior . Tal classe ser a classe mediana; 4) Calculamos a
Mediana pela seguinte frmula:..Li + [(E
Md
- F
ant
) x c] / f
Md

Li = o limite inferior da classe mediana.
F
ant
= a frequncia acumulada da classe anterior classe mediana.
f
Md
= a frequncia simples da classe mediana.
c = a amplitude do intervalo da classe mediana.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 22

Exemplo:
classes frequncia = fi Frequncia acumulada
50 |---- 54 4 4
54 |---- 58 9 13
58 |---- 62 11 24
62 |---- 66 8 32
66 |---- 70 5 37
70 |---- 74 3 40
Total 40 -
= 40 / 2 =.20..logo.a classe mediana ser 58 |---- 62
Li = 58....... F
ant
= 13........... f
Md
= 11........... c = 4
Substituindo esses valores na frmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11
= 60,54
OBS: Esta mediana estimada, pois no temos os 40 valores da distribuio.
Emprego da Mediana
- Quando desejamos obter o ponto que divide a distribuio em duas partes iguais.
- Quando h valores extremos que afetam de maneira acentuada a mdia aritmtica.










Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 23

CAPTULO 4 - MEDIDAS DE ASSIMETRIA E CURTOSE

Denominamos curtose o grau de achatamento de uma distribuio em relao a uma
distribuio padro, denominada curva normal (curva correspondente a uma distribuio
terica de probabilidade).

Distribuies simtricas
A distribuio das frequncias faz-se de forma aproximadamente simtrica, relativamente a
uma classe mdia. Quando a distribuio simtrica, a mdia e a mediana coincidem.


Caso especial de uma distribuio simtrica
Quando dizemos que os dados obedecem a uma distribuio normal, estamos tratando de
dados que se distribuem em forma de sino.

Distribuies Assimtricas
A distribuio das freqncias apresenta valores menores num dos lados:






Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 24

Distribuies com "caudas" longas
Observamos que nas extremidades h uma grande concentrao de dados em relao aos
concentrados na regio central da distribuio.


A partir do exposto, deduzimos que se a distribuio dos dados:
1.for aproximadamente simtrica, a mdia aproxima-se da mediana
2.for enviesada para a direita (alguns valores grandes como "outliers"), a mdia tende a ser
maior que a mediana
3. for enviesada para a esquerda (alguns valores pequenos como "outliers"), a mdia tende a
ser inferior mediana.
So representaes visuais dos dados estatsticos que devem corresponder, mas nunca
substituir as tabelas estatsticas. Tm como caractersticas principais, o uso de escalas, a
existncia de um sistema de coordenadas, a simplicidade, clareza e veracidade de sua
representao.






















Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 25

CAPTULO 5 - REPRESENTAO GRFICA


Os grficos podem ser:

1. Grficos de informao: grficos destinados principalmente ao pblico em geral,
objetivando proporcionar uma visualizao rpida e clara. So grficos tipicamente
expositivos, dispensando comentrios explicativos adicionais. As legendas podem ser
omitidas, desde que as informaes desejadas estejam presentes ou

2. Grficos de anlise: grficos que prestam-se melhor ao trabalho estatstico, fornecendo
elementos teis fase de anlise dos dados, sem deixar de ser tambm informativos. Os
grficos de anlise freqentemente vm acompanhados de uma tabela estatstica. Inclui-se,
muitas vezes um texto explicativo, chamando a ateno do leitor para os pontos principais
revelados pelo grfico.

Mas o uso indevido de Grficos pode trazer uma idia falsa dos dados que esto sendo
analisados, chegando mesmo a confundir o leitor, tratando-se, na realidade, de um problema
de construo de escalas.
.
Os grficos pode ser classificados em: Diagramas, Estereogramas, Pictogramas e
Cartogramas.
.
4.1 - Diagramas
So grficos geomtricos dispostos em duas dimenses. So os mais usados na
representao de sries estatsticas. Eles podem ser :

1 - Grficos em barras horizontais.

2 - Grficos em barras verticais (colunas). Quando as legendas no so breves usa-se de
preferncia o grfico em barras horizontais. Nesses grficos os retngulos tm a mesma base
e as alturas so proporcionais aos respectivos dados. A ordem a ser observada a
cronolgica, se a srie for histrica, e a decrescente, se for geogrfica ou categrica.


Fig 1. Grfico de barras de harmnicos da rede eltrica em uma determinada regio.
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 26


3 - Grficos em barras compostas.

4 - Grficos em colunas superpostas. Eles diferem dos grficos em barras ou colunas
convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes
componentes. Servem para representar comparativamente dois ou mais atributos.

5 - Grficos em linhas ou lineares. So freqentemente usados para representao de sries
cronolgicas com um grande nmero de perodos de tempo. As linhas so mais eficientes do
que as colunas, quando existem intensas flutuaes nas sries ou quando h necessidade de
se representarem vrias sries em um mesmo grfico. Quando representamos, em um mesmo
sistema de coordenadas, a variao de dois fenmenos, a parte interna da figura formada
pelos grficos desse fenmeno denominada de rea de excesso.

6 - Grficos em setores. Este grfico construdo com base em um crculo, e empregado
sempre que desejamos ressaltar a participao do dado no total. O total representado pelo
crculo, que fica dividido em tantos setores quantas so as partes. Os setores so tais que
suas reas so respectivamente proporcionais aos dados da srie. O grfico em setores s
deve ser empregado quando h, no mximo, sete dados.

Obs: As sries temporais geralmente no so representadas por este tipo de grfico.
.

4.2 - Estereogramas
So grficos geomtricos dispostos em trs dimenses, pois representam volume. So usados
nas representaes grficas das tabelas de dupla entrada. Em alguns casos este tipo de
grfico fica difcil de ser interpretado dada a pequena preciso que oferecem.

4.3 - Pictogramas
So construdos a partir de figuras representativas da intensidade do fenmeno. Este tipo de
grfico tem a vantagem de despertar a ateno do pblico leigo, pois sua forma atraente e
sugestiva. Os smbolos devem ser auto-explicativos. A desvantagem dos pictogramas que
apenas mostram uma viso geral do fenmeno, e no de detalhes minuciosos. Veja o
exemplo abaixo:





Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 27
4.4 - Cartogramas
So ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico o de figurar
os dados estatsticos diretamente relacionados com reas geogrficas ou polticas.

Dados obtidos de uma amostra servem como base para uma deciso sobre a populao.
Quanto maior for o tamanho da amostra, mais informao obtemos sobre a populao.
Porm, um aumento do tamanho da amostra tambm implica um aumento da quantidade de
dados e isso torna difcil compreender a populao, mesmo quando esto organizados em
tabelas. Em tal caso, precisa-se de um mtodo que possibilite conhecer a populao num
rpido exame.
Um histograma atende s necessidades, por meio da organizao de muitos dados num
histograma, pode-se conhecer a populao de maneira objetiva.

4.5 - Grficos dos Dados na Ordem Cronolgica
Representao grfica do resultado Y versus a ordem cronolgica de execuo do
experimento (diagrama do resultado Y versus tempo t). Nesse tipo de grfico, alguns dos
possveis fenmenos que podem ser observados so:

freqentemente em funo de aquecimento, fadiga, e outros fatores relacionados com o
tempo.
curva de aprendizagem ou caractersticas relativas ao material.

4.6 - Histogramas de Freqncia ou Distribuio de Freqncias
uma ferramenta estatstica apropriada para a apresentao de grandes massas de dados
numa forma que torna mais clara a tendncia central e a disperso dos valores ao longo da
escala de medio, bem como a freqncia relativa de ocorrncia dos diferentes valores.



















Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 28
CAPTULO 6 - MEDIDAS DE DISPERSO OU DE
VARIABILIDADE

No captulo 3 vimos algumas medidas de localizao do centro de uma distribuio de
dados. Veremos agora como medir a variabilidade presente num conjunto de dados.
Um aspecto importante no estudo descritivo de um conjunto de dados o da determinao
da variabilidade ou disperso desses dados, relativamente medida de localizao do centro
da amostra.

DESVIO PADRO ( S )
a medida de disperso mais empregada, pois leva em considerao a totalidade dos valores
da varivel em estudo. um indicador de variabilidade bastante estvel. O desvio padro
baseia-se nos desvios em torno da mdia aritmtica e a sua frmula bsica pode ser traduzida
como: a raiz quadrada da mdia aritmtica dos quadrados dos desvios e representada
por S.
Uma vez que a varincia envolve a soma de quadrados, a unidade em que se exprime no a
mesma que a dos dados. Assim, para obter uma medida da variabilidade ou disperso com as
mesmas unidades que os dados, tomamos a raiz quadrada da varincia e obtemos o desvio
padro.


O desvio padro uma medida que s pode assumir valores no negativos e quanto maior
for, maior ser a disperso dos dados.

A frmula acima empregada quando tratamos de uma populao de dados no-
agrupados.





Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 29

Exemplo: Calcular o desvio padro da populao representada por - 4 , -3 , -2 , 3 , 5
Xi


- 4 - 0,2 - 3,8 14,44
- 3 - 0,2 - 2,8 7,84
- 2 - 0,2 - 1,8 3,24
3 - 0,2 3,2 10,24
5 - 0,2 5,2 27,04
Total - - 62,8
Sabemos que n = 5 e 62,8 / 5 = 12,56.
A raiz quadrada de 12,56 o desvio padro = 3,54
Quando os dados esto agrupados (temos a presena de frequncias) a frmula do desvio
padro ficar:
ou
Exemplo: Calcule o desvio padro populacional da tabela abaixo:
Xi f i Xi . f i

. f i
0 2 0 2,1 -2,1 4,41 8,82
1 6 6 2,1 -1,1 1,21 7,26
2 12 24 2,1 -0,1 0,01 0,12
3 7 21 2,1 0,9 0,81 5,67
4 3 12 2,1 1,9 3,61 10,83
Total 30 63 - - - 32,70
Sabemos que fi = 30 e 32,7 / 30 = 1,09.
A raiz quadrada de 1,09 o desvio padro = 1,044
Se considerarmos os dados como sendo de uma amostra o desvio padro seria a raiz
quadrada de 32,7 / (30 -1) = 1,062
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 30
Obs: Nas tabelas de frequncias com intervalos de classe a frmula a ser utilizada a
mesma do exemplo anterior.

VARINCIA ( S
2
)
Define-se a varincia, como sendo a medida que se obtm somando os quadrados dos
desvios das observaes da amostra, relativamente sua mdia, e dividindo pelo nmero de
observaes da amostra menos um.




A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm
extremamente importante na inferncia estatstica e em combinaes de amostras.

MEDIDAS DE DISPERSO RELATIVA
CVP: Coeficiente de Variao de Pearson
Na estatstica descritiva o desvio padro por si s tem grandes limitaes. Assim, um desvio
padro de 2 unidades pode ser considerado pequeno para uma srie de valores cujo valor
mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito.
Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu
emprego quando desejamos comparar duas ou mais sries de valores, relativamente sua
disperso ou variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou
variabilidade dos dados em termos relativos a seu valor mdio, medida essa denominada de
CVP: Coeficiente de Variao de Pearson ( a razo entre o desvio padro e a mdia
referente aos dados de uma mesma srie).
A frmula do CVP = (S / ) x 100 (o resultado neste caso expresso em percentual,
entretanto pode ser expresso tambm atravs de um fator decimal, desprezando assim o valor
100 da frmula).



S
2
=

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 31
Exemplo 1:
Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivduos:
Discriminao M D I A DESVIO PADRO
ESTATURAS 175 cm 5,0 cm
PESOS 68 kg 2,0 kg
Qual das medidas (Estatura ou Peso) possui maior homogeneidade?
Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor
ser o de maior homogeneidade (menor disperso ou variabilidade).
CVP estatura = ( 5 / 175 ) x 100 = 2,85 %
CVP peso = ( 2 / 68 ) x 100 = 2,94 %.
Logo, nesse grupo de indivduos, as estaturas apresentam menor grau de disperso que os
pesos.

Exemplo 2:
O risco de uma ao de uma empresa pode ser devidamente avaliado atravs da variabilidade
dos retornos esperados. Portanto, a comparao das distribuies probabilsticas dos
retornos, relativas a cada ao individual, possibilita a quem toma decises perceber os
diferentes graus de risco. Analise, abaixo, os dados estatsticos relativos aos retornos de 5
aes e diga qual a menos arriscada?

Discriminao Ao A Ao B Ao C Ao D Ao E
Valor esperado 15 % 12 % 5 % 10 % 4 %
Desvio padro 6 % 6,6 % 2,5 % 3 % 2,6 %
Coeficiente de variao 0,40 0,55 0,50 0,30 0,65











Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 32

CAPTULO 7 CORRELAO E REGRESSO




7.1 DIAGRAMAS DE DISPERSO

Na prtica, muitas vezes essencial estudar a relao entre duas variveis associadas como,
por exemplo, o grau a dimenso de uma pea de mquina ir variar em funo da mudana
da velocidade de um torno.

Para estudar a relao entre duas variveis, tais como dito acima, pode-se usar o chamado
diagrama de disperso. Diagrama de Disperso uma forma de grfico onde simplesmente
representa-se graficamente cada par de variveis de uma srie de dados em um sistema de
eixos.

Tomando como exemplo os dados da Tabela abaixo, pode-se construir um diagrama de
disperso:





7.1.1 COMO CONSTRUI R UM DI AGRAMA DE DI SPERSO

Um diagrama de disperso construdo conforme as seguintes etapas:

Etapa 1
Coletar dados em pares (X,Y) entre os quais deseja-se estudar as relaes, e organize-os em
uma tabela. desejvel que se tenha pelo menos 30 pares de dados.

Etapa 2
Encontrar os valores mximo e mnimo, tanto para X como para Y. Defina as escalas dos
eixos horizontal e vertical de forma que ambos os comprimentos sejam aproximadamente
iguais; assim, o diagrama ficar mais fcil de interpretar.

Determinar, para cada eixo, entre 3 e 10 divises para as unidades da escala de graduao, e
utilize nmeros inteiros para torna-lo mais fcil de ler. Quando duas variveis consistirem
em um fator e uma caracterstica da qualidade, use o eixo horizontal X para o fator e o eixo
vertical Y para a caracterstica da qualidade.

Etapa 3
Marcar os dados num papel milimetrado. Quando os mesmos valores de dados forem obtidos
a partir de diferentes observaes, mostre estes pontos, desenhando crculos concntricos
ou marcando o segundo ponto rente ao primeiro.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 33


Etapa 4
Inserir todos os itens necessrios. Certificar de que os seguintes itens sejam includos para
que qualquer pessoa, alm do autor do diagrama, possa entende-lo num rpido exame:
a. Ttulo do diagrama;
b. Perodo de tempo;
c. Quantidade de pares de dados;
d. Denominao e unidade de medida de cada eixo;

Exemplo 1:
Um fabricante de tanques plsticos, que os fabricava pelo processo de moldagem a sopro,
encontrou problemas de tanques defeituosos com paredes finas. Suspeitou-se que a variao
da presso do ar, dia a dia, era a causa das paredes finas no-conformes. A Tabela a seguir
mostra dados sobre a presso de sopro e a percentagem defeituosa.

Tabela 1 Dados da Presso de Sopro e Percentagem Defeituosa
de Tanques de Plstico



Conforme visto na Tabela acima, existem 30 pares de dados.

Etapa 2
Neste exemplo, indicamos a presso de sopro por X (eixo horizontal) e a percentagem
defeituosa por Y (eixo vertical).
Assim:
O valor mximo de x: xmx = 9,4 (kgf/cm)
O valor mnimo de x: xmn = 8,2 (kgf/cm)
O valor mximo de y: ymx = 0,928 (%)
O valor mnimo de y: ymn = 0,864 (%)

Marca-se divises para graduao:
no eixo horizontal em intervalos de 0,5(kgf/cm) de 8,0 a 9,5(kgf/cm)
no eixo vertical em intervalos de 0,01(%) de 0,85 a 0,93(%)

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 34


Etapa 3
Marca-se os pontos no grfico.

Etapa 4
Anota-se o perodo de tempo a que se refere amostra coletada (1 de outubro a 9 de
novembro), a quantidade de amostras (n = 30), o eixo horizontal (presso de sopro
[kgf/cm]), o eixo vertical (percentagem defeituosa [%]), e o ttulo do diagrama (diagrama de
disperso da presso do sopro e a percentagem defeituosa).



Figura 1 Exemplo de Diagrama de Disperso


7.1.2 Como Interpretar os Diagramas de Disperso

Assim como possvel avaliar o formato de uma distribuio em um histograma, a
distribuio global dos pares de dados pode ser interpretada a partir de um diagrama de
disperso. Ao proceder a leitura, a primeira coisa que se deve fazer examinar se h ou no
pontos atpicos no diagrama. Geralmente, pode-se julgar que quaisquer pontos afastados do
grupo principal (Figura 2) resultaram de erros na medio ou registro de dados, ou foram
causados por alguma mudana nas condies de operao. necessrio excluir esses pontos
para anlise da correlao. Contudo, ao invs de desprezar completamente estes pontos,
deveria ser dada a devida ateno causa de tais irregularidades, pois muitas vezes,
informaes inesperadas, porm muito teis, so obtidas descobrindo-se por que eles
ocorreram.

Existem muitos tipos de padres de disperso, e alguns destes so dados da Figura 3. Nesta
figura, tanto na .1 como na .2, Y aumenta com X; este o caso da correlao positiva. E
ainda, como a .1 mostra esta tendncia de forma notvel, diz-se que ela apresenta forte
correlao positiva. As Figuras .4 e .5 mostram o oposto da correlao positiva, pois
medida que X aumenta, Y diminui; este o caso da chamada correlao negativa. A Figura
4 indica uma forte correlao negativa. A Figura .3 mostra o caso em que X e Y no tm
nenhuma relao especfica; portanto, dizemos que no h correlao. Na Figura .6,
medida que X aumenta, Y varia num padro curvo. Isto ser explicado posteriormente.
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 35


Figura 2 Exemplo de Pontos Suspeitos



.1 - Correlao Positiva
.2 - Correlao Negativa
.3 - Pode haver Correlao Positiva
.4 - Pode haver Correlao Negativa
.5 - No H Correlao
.6 - No H Correlao



Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 36


Figura 3 Exemplos de Correlao



7.2 Clculo de Coeficientes de Correlao

Para estudar a relao entre X e Y importante traar primeiro um diagrama de disperso,
entretanto, a fim de conhecer a fora da relao em termos quantitativos, til calcular o
coeficiente de correlao de acordo com a seguinte definio:


onde:
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 37


onde n a quantidade de pares de dados

O coeficiente de correlao, r, est no intervalo 1 s r s r for
maior que 1, houve claramente um erro de clculo e deve-se refaze-lo. No caso de forte
correlao positiva, ele atinge um valor prximo de +1 e, de forma anloga, numa forte
correlao negativa, ele fica prximo de 1. Quando | r | est prximo de 1, ele indica uma
forte correlao entre X e Y. Quando se aproxima de 0 (zero), implica numa correlao fraca.
Quando | r | = 1, os dados estaro sobre uma linha reta.

Exemplo 2
Calculemos o coeficiente de correlao para o Exemplo 1, dos tanques de plstico. A Tabela
2 abaixo apresenta os clculos, a partir dela obtm-se os resultados desejados.




O valor de r 0,59, existindo portanto uma correlao positiva entre a presso de sopro e a
percentagem defeituosa de tanques de plstico.




Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 38

Tabela 2 Preparao para o clculo do coeficiente de correlao.



7.3 AJUSTAMENTO DE CURVAS E O MTODO DOS MNIMOS QUADRADOS

Num diagrama de disperso possvel, freqentemente, visualizar uma curva regular que se
aproxima dos dados. Essa curva denominada de ajustamento.



Figura 4 Exemplo de Curvas em Diagramas de Disperso





Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 39

O problema geral da determinao das equaes de curvas que se acomodem a certos
conjuntos de dados denominado AJUSTAMENTO DE CURVAS.


7.4 Equaes das Curvas de Ajustamento

Para fins de referncia, relaciona-se abaixo alguns tipos de curvas de ajustamento e suas
equaes. Todas as letras, exceto X e Y, representam constantes. As letras X e Y referem-se,
freqentemente, a variveis independentes e dependentes, respectivamente, embora esses
papis possam ser permutados.



onde o segundo membro das equaes so denominados polinmios do 1, 2, 3, 4 e
n-simo graus.

As funes definidas pelas quatro primeiras equaes so, s vezes, denominadas Funes
Linear, Quadrtica, Cbica e do 4 Grau, respectivamente.

Como outras equaes possveis (entre muitas usadas na prtica), menciona-se as seguintes:



Para decidir qual a curva a adotar, conveniente a obteno de diagramas de disperso das
variveis transformadas. Por exemplo, se o diagrama de disperso de log Y em funo de X
apresentar uma relao linear, a equao ter o aspecto da (7), enquanto, se o de log Y em
funo de log X for linear, a equao ter o formato de (8).

Emprega-se, freqentemente, para tal finalidade, grficos no qual uma ou ambas as escalas
so logartmicas (semilog ou log-log [dilog]).



Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 40

7.5 O Mtodo dos Mnimos Quadrados
Antes, necessrio instituir uma definio da melhor reta de ajustamento, da melhor
parbola de ajustamento, etc.



Figura 5 - A melhor curva de ajustamento


Para conseguir uma definio possvel, considere-se a Figura 6.2 na qual os dados esto
representados pelos pontos (X1,Y1), (X2,Y2), ..., (Xn,Yn). Para um valor dado de X, por
exemplo X1, haver uma diferena entre y1 e p valor correspondente determinado na curva
C.

Como est representado na figura, essa diferena e1, que , muitas vezes, designada como
desvio, erro ou resduo e pode ser positivo, negativo ou nulo. De modo semelhante, obtm-se
os desvios e2, e3, ..., en.

Uma medida de qualidade do ajustamentoda Curva C aos dados apresentados (aderncia)
proporcionada pela quantidade e2 + e3 + ... + en. Se ela pequena, o ajustamento bom,
se grande, o ajustamento est ruim.

Portanto, uma definio pode ser feita:

De todas as curvas que se ajustam a um conjunto de pontos, a que tem a propriedade de
apresentar o mnimo valor de e2 + e3 + ... + en denominada a melhor curva de
ajustamento.

Diz-se que uma curva que apresenta essa propriedade ajusta os dados no sentido dos
mnimos quadrados e denominada curva de mnimos quadrados.








Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 41
7.6 REGRESSO
Deseja-se, freqentemente, com base em dados amostrais estimar o valor de uma varivel Y,
correspondente ao conhecido de uma varivel X. Isso pode ser alcanado mediante a
avaliao do valor de Y, a partir de uma curva de mnimo quadrado que se ajuste aos dados
amostrais. A curva resultante denominada de regresso de Y para X, visto que Y
avaliado a partir de X.
Se se desejar estimar o valor de X a partir de um atribudo a Y, usa-se uma curva de
regresso de X para Y, o que importa em uma permutao das varveis no diagrama de
disperso, de modo que X passa a ser a varivel dependente e Y a independente.
Em geral, a reta ou curva de regresso de Y para X no igual de X para Y.

Exemplo 3
No Exemplo 1, dos tanques plsticos com paredes finas defeituosas, constatou-se que havia
uma correlao positiva entre a presso de sopro e a percentagem defeituosa. A fim de evitar
esse problema, pergunta-se:
- Quando a presso de sopro estiver em um certo valor, qual ser a espessura das paredes
formadas?
- Como a presso de sopro deve ser controlada para que as paredes do tanque no fiquem
finas?

Para realizar essa anlise e poder responder s perguntas feitas, necessrio compreender,
quantitativamente, a relao entre a presso de sopro e a espessura da parede.

A Tabela 3 mostra os dados de uma experincia na qual a presso de sopro foi mudada e, em
cada vez, a espessura das paredes foi medida. A Figura 6 um diagrama de disperso
baseado nestes dados.

Tabela 3 Presso de Sopro x Espessura da Parede

Figura 6 Relao entre a Presso de Ar e a Espessura da Parede

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 42
Pode-se representar a presso do sopro por x e a espessura da parede por y, admitindo uma
relao linear:

onde:
o uma constante
| chamado de coeficiente de regresso

Tal reta geralmente chamada de reta de regresso, onde y a varivel resposta (ou
varivel dependente), e x a varivel explicativa (ou varivel independente). A forma
quantitativa de entender a relao entre x e y, pela busca de uma forma de regresso entre x e
y , chamada de Anlise de Regresso.

Seja (Xi,Yi) (para 1 s i s n) um conjunto de n pares de dados observados. Sejam os
valores estimados e a e b, e seja ei o resduo entre , isto :



Pelo mtodo dos mnimos quadrados, so obtidos como os valores que minimizam
soma dos quadrados dos resduos. Esse mtodo aplicado atravs das seguintes
etapas:


os valores de a e b obtidos dessas etapas minimizam a soma dos quadrados dos resduos.
Agora, usando os dados da Tabela 4, pode-se calcular a reta de regresso.





Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 43
Tabela 4


A cada aumento de 1(kgf/cm) da presso do ar, a espessura da parede diminui de 1,28(mm).



Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 44



Figura 7 - mostra a reta de regresso calculada acima.

7.8 Problemas que envolvem mais de duas variveis
Podem ser tratadas de maneira anloga aos de duas. Por exemplo, pode haver uma relao
entre trs variveis X, Y e Z que pode ser descrita pela expresso:

que denominada equao linear das variveis X, Y e Z.

Em um sistema tridimensional de coordenadas retangulares, essa equao representa um
plano e os pontos amostrais reais (X1,Y1), (X2,Y2), ..., (Xn,Yn) podem dispersar-se em
posies no muito distantes desse plano, que pode ser denominado de ajustamento.

Mediante a extenso do mtodo dos mnimos quadrados, pode-se falar de um plano de
mnimos quadrados de ajustamento dos dados.

Se o nmero de variveis exceder a trs, perde-se a intuio geomtrica porque, ento, seria
necessrio considerar espaos de quatro ou mais dimenses.
Os problemas que envolvem a avaliao de uma varivel a partir de duas ou mais outras so
denominados problemas de regresso mltipla.









Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 45

Exerccios:
1) A quantidade de libras de vapor usadas por ms por uma planta qumica esta relacionada
temperatura (F) mdia ambiente para aquele ms. O consumo do ano passado e a temperatura
so mostrados na seguinte tabela:

Meses Temperatura Consumo/1.000
Janeiro 21 185,79
Fevereiro 24 214,47
Maro 32 288,03
Abril 47 424,84
Maio 50 454,58
Junho 59 539,03
Julho 68 621,55
Agosto 74 675,06
Setembro 62 562,03
Outubro 50 452,93
Novembro 41 369,95
Dezembro 30 273,98

a) Construa um diagrama de disperso
b) Encontre a equao da reta
c) Calcule a correlao
d) Qual ser a estimativa do consumo esperado de vapor quando a temperatura mdia for de
55F?

2) Um artigo publicado numa revista (maro de 1986) apresentou dados sobre a concentrao de
licor verde de Na
2
S e da produo de uma mquina de papel.

Nmero de
observaes
Concentrao
(g/l) de licor
verde de Na
2
S

Produo (t/dia)
1 40 825
2 42 830
3 49 890
4 46 895
5 44 890
6 48 910
7 46 915
8 43 960
9 53 990
10 52 1010
11 54 1012
12 57 1030
13 58 1050
a) Encontre o valor ajustado y, correspondente a x = 910
b) Encontre a correlao entre as variveis estudadas

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 46
3) A tabela a seguir representa o nmero de horas de estudo fora da sala de aula para
determinada turma de alunos de Estatstica, ao longo de trs semanas e as notas obtidas
numa prova aplicada ao final do perodo:
Estudante 1 2 3 4 5 6 7 8
Horas de Estudo 20 16 34 23 27 32 18 22
Grau obtido 64 61 84 70 88 92 72 77
a. Trace o diagrama de disperso correspondente.
b. Determine a equao de regresso dos mnimos quadrados para predizer o grau
obtido na prova com base nas horas de estudo. Desenhe a reta do item anterior
sobre o diagrama.
c. Estime o grau que seria obtido na prova por algum que estudasse 30 horas fora
da sala de aula.
d. Calcule o coeficiente de correlao e interprete-o.
e. Teste se o coeficiente de correlao populacional () pode ser considerado nulo
ao nvel de 5% de significncia? Interprete o resultado obtido.















Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 47

CAPTULO 8 INTRODUO AMOSTRAGEM



8- Definies
8.1 Populao e amostra
Qualquer estudo cientfico enfrenta o dilema de estudo da populao ou da amostra.
Obviamente teria-se uma preciso muito superior se fosse analisado o grupo inteiro, a
populao, do que uma pequena parcela representativa, denominada amostra. Observa-se
que impraticvel na grande maioria dos casos, estudar-se a populao em virtude de
distncias, custo, tempo, logstica, entre outros motivos.
A alternativa praticada nestes casos o trabalho com uma amostra confivel. Se a amostra
confivel e proporciona inferir sobre a populao, chamamos de inferncia estatstica. Para
que a inferncia seja vlida, necessria uma boa amostragem, livre de erros, tais como falta
de determinao correta da populao, falta de aleatoriedade e erro no dimensionamento da
amostra.

Quando no possvel estudar, exaustivamente, todos os elementos da populao, estudam-
se s alguns elementos, a que damos o nome de Amostra.
Quando a amostra no representa corretamente a populao diz-se enviesada e a sua
utilizao pode dar origem a interpretaes erradas.

8.2 Recenseamento
Recenseamento a contagem oficial e peridica dos indivduos de um Pas, ou parte de um
Pas. Ele abrange, no entanto, um leque mais vasto de situaes. Assim, pode definir-se
recenseamento do seguinte modo:
Estudo cientfico de um universo de pessoas, instituies ou objetos fsicos com o propsito
de adquirir conhecimentos, observando todos os seus elementos, e fazer juzos quantitativos
acerca de caractersticas importantes desse universo.





Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 48
8.3 Amostragem

Amostragem o processo que procura extrair da populao elementos que atravs de
clculos probabilsticos ou no, consigam prover dados inferenciais da populao-alvo.

Tipos de Amostragem
No Probabilstica
Acidental ou convenincia
Intencional
Quotas ou proporcional
Desproporcional
Probabilstica
Aleatria Simples
Aleatria Estratificada
Conglomerado
8.3.1.No Probabilstica
A escolha de um mtodo no probabilstico, via de regra, sempre encontrar desvantagem
frente ao mtodo probabilstico. No entanto, em alguns casos, se faz necessrio a opo por
este mtodo. Fonseca (1996), alerta que no h formas de se generalizar os resultados
obtidos na amostra para o todo da populao quando se opta por este mtodo de
amostragem.
- Acidental ou convenincia
Indicada para estudos exploratrios. Freqentemente utilizados em super mercados
para testar produtos.
- Intencional
O entrevistador dirige-se a um grupo em especfico para saber sua opinio. Por
exemplo, quando de um estudo sobre automveis, o pesquisador procura apenas
oficinas.
- Quotas ou proporcional
Na realidade trata-se de uma variao da amostragem intencional. Necessita-se ter
um prvio conhecimento da populao e sua proporcionalidade. Por exemplo, deseja-
se entrevistar apenas indivduos da classe A, que representa 12% da populao. Esta
ser a quota para o trabalho. Comumente tambm subestratifica-se uma quota
obedecendo a uma segunda proporcionalidade.
- Desproporcional
Muito utilizada quando a escolha da amostra for desproporcional populao.
Atribuem-se pesos para os dados, e assim obtm-se resultados ponderados
representativos para o estudo.


Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 49
8.3.2 Probabilstica
Para que se possa realizar inferncias sobre a populao, necessrio que se trabalhe com
amostragem probabilstica. o mtodo que garante segurana quando investiga-se alguma
hiptese. Normalmente os indivduos investigados possuem a mesma probabilidade de ser
selecionado na amostra.
- Aleatria Simples
o mais utilizado processo de amostragem. Prtico e eficaz, confere preciso ao processo de
amostragem. Normalmente utiliza-se uma tabela de nmeros aleatrios e nomeia-se os
indivduos, sorteando-se um por um at completar a amostra calculada.


Uma variao deste tipo de amostragem a sistemtica. Em um grande nmero de
exemplos, o pesquisador depara-se com a populao ordenada. Neste sentido, tem-se os
indivduos dispostos em seqncia o que dificulta a aplicao exata desta tcnica.
Quando se trabalha com sorteio de quadras de casas, por exemplo, h uma regra crescente
para os nmeros das casas. Em casos como este, divide-se a populao pela amostra e
obtm-se um coeficiente (y). A primeira casa ser a de nmero x, a segunda ser a de
nmero x + y; a terceira ser a de nmero x + 3. y. Supondo que este coeficiente seja 6. O
primeiro elemento ser 3. O segundo ser 3 + 6. O terceiro ser 3 + 2.6. O quarto ser 3 +
3.6, e assim sucessivamente.
- Aleatria Estratificada
Quando se deseja guardar uma proporcionalidade na populao heterognea. Estratifica-se
cada subpopulao por intermdio de critrios como classe social, renda, idade, sexo, entre
outros.
- Conglomerado
Em corriqueiras situaes, torna-se difcil coletar caractersticas da populao. Nesta
modalidade de amostragem, sorteia-se um conjunto e procura-se estudar todo o conjunto.
exemplo de amostragem por conglomerado, famlias, organizaes e quarteires.






Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 50






Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 51

8.4 Tipos de dados
VARIVEL: , convencionalmente, o conjunto de resultados possveis de um fenmeno.

Varivel Qualitativa: Quando seus valores so expressos por atributos: sexo, cor da pele, etc.

Varivel Quantitativa: Quando os dados so de carter nitidamente quantitativo, e o conjunto
dos resultados possui uma estrutura numrica, trata-se, portanto da estatstica de varivel e
se dividem em:

Varivel Discreta ou Descontnua: Seus valores so expressos geralmente atravs de
nmeros inteiros no negativos. Resulta normalmente de contagens. Ex: N de alunos
presentes s aulas de introduo estatstica econmica no 1 semestre de 1997: mar = 18,
abr = 30, mai = 35, jun = 36.

Varivel Contnua: Resulta normalmente de uma mensurao, e a escala numrica de seus
possveis valores corresponde ao conjunto R dos nmeros Reais, ou seja, podem assumir,
teoricamente, qualquer valor entre dois limites. Ex.: Quando voc vai medir a temperatura de
seu corpo com um termmetro de mercrio o que ocorre o seguinte: O filete de mercrio,
ao dilatar-se, passar por todas as temperaturas intermedirias at chegar na temperatura
atual do seu corpo.
De acordo com o que dissemos anteriormente, numa anlise estatstica distinguem-se
essencialmente duas fases:
Uma primeira fase em que se procura descrever e estudar a amostra: Estatstica Descritiva e
uma segunda fase em que se procura tirar concluses para a populao:
1 Fase Estatstica Descritiva
Procura-se descrever a amostra, pondo em evidncia as caractersticas principais e as
propriedades.
2 Fase Estatstica Indutiva
Conhecidas certas propriedades (obtidas a partir de uma anlise descritiva da amostra),
expressas por meio de proposies, imaginam-se proposies mais gerais, que exprimam a
existncia de leis (na populao).
No entanto, ao contrrio das proposies deduzidas, no podemos dizer que so falsas ou
verdadeiras, j que foram verificadas sobre um conjunto restrito de indivduos e, portanto
no so falsas, mas no foram verificadas para todos os indivduos da Populao, pelo que
tambm no podemos afirmar que so verdadeiras.
Existe, assim, um certo grau de incerteza (percentagem de erro) que medido em termos de
Probabilidade.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 52

Considerando o que foi dito anteriormente sobre a Estatstica Indutiva, precisamos aqui da
noo de Probabilidade, para medir o grau de incerteza que existe, quando tiramos uma
concluso para a populao, a partir da observao da amostra.
8.5 Espao Amostral

A estatstica trabalha com os resultados dos experimentos. Quando algum experimento
realizado, algum resultado ocorre; denota-se um resultado tpico pelo smbolo e. Tal
resultado chamado evento simples.

Se for feita uma lista de todos os possveis resultados de interesse do experimento, essa srie
chamada de espao amostral.

8.6 Dimensionamento da amostra Plano Amostral
Quando deseja-se dimensionar o tamanho da amostra, o procedimento desenvolve-se em trs
etapas distintas:
- Avaliar a varivel mais importante do grupo e a mais significativa;
- Analisar se ordinal, intervalar ou nominal;
- Verificar se a populao finita ou infinita;
Varivel intervalar e populao infinita

Varivel intervalar e populao finita

Varivel nominal ou ordinal e populao infinita

Varivel nominal ou ordinal e populao finita

Obs: A proporo (p) ser a estimativa da verdadeira proporo de um dos nveis escolhidos
para a varivel adotada. Por exemplo, 60% dos telefones da amostra Nokia, ento p ser
0,60.
A proporo (q) ser sempre 1 - p. Neste exemplo q, ser 0,4. O erro representado por d.
Para casos em que no se tenha como identificar as propores confere-se 0,5 para p e q.









Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 53
CAPTULO 9 PROBABILIDADE

9. Conceito de Probabilidade
Chamamos de probabilidade de um evento A (sendo que A est contido no Espao amostral)
o nmero real P(A), tal que: nmero de casos favorveis de A / nmero total de casos.
9.1 Eventos Equiprovveis
OBS: Quando todos os elementos do Espao amostral tem a mesma chance de acontecer, o
espao amostral chamado de conjunto equiprovvel.
Ex: No lanamento de uma moeda qual a probabilidade de obter cara em um evento A?
O = { ca, co } = 2 A = {ca} = 1 P(A) = 1/2 = 0,5 = 50%

9.2 Probabilidade Condicional
Se A e B so dois eventos, a probabilidade de B ocorrer, depois de A ter acontecido
definida por: P (B/A), ou seja, chamada probabilidade condicional de B. Neste caso os
eventos so dependentes e definidos pela frmula:
P (A e B ) = P (A) x P(B/A)
Ex: Duas cartas so retiradas de um baralho sem haver reposio. Qual a probabilidade de
ambas serem COPAS ?
P (Copas1 e Copas2) = P(Copas1) x P(Copas2/Copas1) = 13/52 x 12/51 = 0,0588 = 5,88 %
P(Copas1) = 13/52
P(Copas2/Copas1) = 12/51
Obs: No exemplo anterior se a 1 carta retirada voltasse ao baralho o experimento seria do
tipo com reposio e seria um evento independente. O resultado seria:
P(Copas1) x P(Copas2) = 13/52 x 13/52 = 0,625 = 6,25 %
Espao amostral do baralho de 52 cartas:
Carta pretas = 26
Pus = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Espadas = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 54
Cartas vermelhas = 26
Ouros = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Copas = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
9.3 Eventos Independentes
Quando a realizao ou no realizao de um dos eventos no afeta a probabilidade da
realizao do outro e vice-versa.
Ex: Quando lanamos dois dados, o resultado obtido em um deles independe do resultado
obtido no outro. Ento qual seria a probabilidade de obtermos, simultaneamente, o n 4 no
primeiro dado e o n 3 no segundo dado?
Assim, sendo P1 a probabilidade de realizao do primeiro evento e P2 a probabilidade de
realizao do segundo evento, a probabilidade de que tais eventos se realizem
simultaneamente dada pela frmula:
P(1 n 2) = P(1 e 2) = P(1) x P(2)
P1 = P(4 dado1) = 1/6 P2 = P(3 dado2) = 1/6
P total = P (4 dado1) x P (3 dado2) = 1/6 x 1/6 = 1/36
9.3.1 Eventos Mutuamente Exclusivos - Eventos Dependentes
Dois ou mais eventos so mutuamente exclusivos quando a realizao de um exclui a
realizao do(s) outro(s). Assim, no lanamento de uma moeda, o evento "tirar cara" e o
evento "tirar coroa" so mutuamente exclusivos, j que, ao se realizar um deles, o outro no
se realiza.
Se dois eventos so mutuamente exclusivos, a probabilidade de que um ou outro se realize
igual soma das probabilidades de que cada um deles se realize:
P(1 U 2) = P(1 ou 2) = P(1) + P(2)
Ex: No lanamento de um dado qual a probabilidade de se tirar o n 3 ou o n 4 ?
Os dois eventos so mutuamente exclusivos ento: P = 1/6 + 1/6 = 2/6 = 1/3
Obs: Na probabilidade da unio de dois eventos A e B, quando h elementos comuns,
devemos excluir as probabilidades dos elementos comuns a A e B (elementos de A n B )



Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 55
9.4 Teorema de Bayes ou Teorema da Probabilidade Total
Sabemos que:
P(A) = E P(Bi) . P(A|Bi)
P(A n Bi) = P(A) . P(Bi|A) logo P(Bi|A) = P(A n Bi) / P(A) ento substituindo teremos:
P (Bi|A) = P (Bi) . P (A|Bi) / E P(Bi) . P(A|Bi) que a frmula de Bayes
Ex: Certo professor 4/5 das vezes vai trabalhar usando um fusca e usando um carro
importado nas demais vezes. Quando ele usa o fusca, 75 % das vezes ele chega em casa
antes das 23 horas e quando usa o carro importado s chega em casa antes das 23 horas em
60% das vezes. Ontem o professor chegou em casa aps s 23 horas. Qual a probabilidade
de que ele, no dia de ontem, tenha usado o fusca ?
B1 = usar o fusca B2 = usar carro importado A = chegar em casa aps 23 horas
P(B1) = 4/5 = 0,80 P(B2) = 1/5 = 0,20
P( A | B1) = 1 - 0,75 = 0,25 P( A | B2) = 1 - 0,60 = 0,40
P (B1 | A) = P (B1) . P( A | B1) / P (B1) . P( A | B1) + P (B2) . P( A | B2)
P (B1 | A) = 0,80 x 0,25 /(0,80 x 0,25) + (0,20 x 0,40) =
P (B1 | A) = 0,20 / (0,20 + 0,08) = 0,7143 ou 71,43 %




Exerccio: Em um lote de 12 peas, 4 s defeituosas. Sendo retirada uma pea, calcule: a) a
probabilidade de essa pea ser defeituosa. b) a probabilidade de essa pea no ser defeituosa.














Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 56

CAPTULO 10 VARIVEL ALEATRIA DISCRETA


10.1 Distribuio de Probabilidades
Apresentaremos neste captulo trs modelos tericos de distribuio de probabilidade, aos
quais um experimento aleatrio estudado possa ser adaptado, o que permitir a soluo de
grande nmero de problemas prticos.
10.1.1 Varivel Aleatria
Suponhamos um espao amostral S e que a cada ponto amostral seja atribudo um nmero.
Fica, ento, definida uma funo chamada varivel aleatria.
Muitas vezes no estamos interessados propriamente no resultado de um experimento
aleatrio, mas em alguma caracterstica numrica a ele associada. Essa caracterstica ser
chamada varivel aleatria.
Assim, se o espao amostral relativo ao "lanamento simultneo de duas moedas"
S={(ca,ca), (ca,co), (co,ca), (co,co)} e se X representa o "nmero de caras" que aparecem, a
cada ponto amostral podemos associar um nmero para X, de acordo com a tabela abaixo (X
a varivel aleatria associada ao nmero de caras observado):
Ponto Amostral X
(ca,ca) 2
(ca,co) 1
(co,ca) 1
(co,co) 0

Logo podemos escrever:
Nmero de caras (X) Probabilidade (X)
2 1/4
1 2/4
0 1/4

Total 4/4 = 1


Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 57

Exemplo prtico de uma distribuio de probabilidade:
Consideremos a distribuio de frequncia relativa ao nmero de acidentes dirios em uma
rodovia durante o ms de nov/2003:
Nmero de Acidentes Frequncia
0 22
1 5
2 2
3 1
Podemos ento escrever a tabela de distribuio de probabilidade:
Nmero de Acidentes (X) Probabilidade (X)
0 0,73
1 0,17
2 0,07
3 0,03
Total 1,00
Construmos acima uma tabela onde aparecem os valores de uma varivel aleatria X e as
probabilidades de X ocorrer que a tabela de distribuio de probabilidades.
Funes de probabilidades: f(X) = p(X= xi)
Ao definir a distribuio de probabilidade, estabelecemos uma correspondncia unvoca
entre os valores da varivel aleatria X e os valores da varivel P (probabilidade). Esta
correspondncia define uma funo onde os valores xi formam o domnio da funo e os
valores pi o seu conjunto imagem. Assim, ao lanarmos um dado, a varivel aleatria X,
definida por "pontos de um dado", pode tomar os valores 1,2,3,4,5 e 6. Ento resulta a
seguinte distribuio de probabilidade:
X P (X)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
T o t a l 6/6 = 1

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 58


10.2 Valor Esperado (Esperana Matemtica)


Valor esperado de uma varivel aleatria ou de funo de varivel aleatria corresponde
mdia ponderada dos valores que esta varivel aleatria ou esta funo assume, usando-se
como pesos para ponderao, as probabilidades correspondentes a cada valor.

Para o caso de uma varivel aleatria discreta x, podemos escrever:


E (x) = ( xi . pi )


Exemplo:

Numa empresa, as previses de despesa para o prximo ano foram calculadas como; R$ 9,
10, 11 , 12 e 13 bilhes. Supondo que as despesas do ano corrente sejam desconhecidas, as
seguintes probabilidades foram atribudas respectivamente: 30%, 20%, 25%, 5% e 20%.

Qual a distribuio de probabilidade para o prximo ano?

DISTRIBUIO DE PROBABILIDADES

ANO DESPESA* (X) P (X)
1 9 0,30
2 10 0,20
3 11 0,25
4 12 0,05
5 13 0,20
total = 1,00
* em R$ bilhes


Qual o valor esperado das despesas para o prximo ano?

VALOR ESPERADO DAS DESPESAS

ANO DESPESA* X P (X) X . P (X)
1 9 0,30 2,70
2 10 0,20 2,00
3 11 0,25 2,75
4 12 0,05 0,60
5 13 0,20 2,60
VALOR ESPERADO E(X) = 10,65
* em R$ bilhes



Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 59


Qual a varincia das despesas para o prximo ano?

Var(X) = [ E(X) - E(X) ]

VARINCIA DAS DESPESAS

ANO DESPESA* ( x) P (x) x . P (x) x . P (x)
1 9 0,30 2,70 24,30
2 10 0,20 2,00 20,00
3 11 0,25 2,75 30,25
4 12 0,05 0,60 7,20
5 13 0,20 2,60 33,80
10,65 115,55
* em R$ bilhes


VARINCIA DAS DESPESAS
Var(x) = [E(X) E(X) ] = 113,42 115,55 = 2,13

Conseqentemente o Desvio Padro igual a: o = \Var(x)

Caso as projees ao longo do ano tenham sido estimadas em R$ 12 bilhes, comente a
posio financeira da empresa.

























Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 60

CAPTULO 11 DISTRIBUIES DE VARIVEL
ALEATRIA DISCRETA


Segundo JURAN (1992, p.33), Uma distribuio de probabilidade uma frmula
matemtica que relaciona os valores da caracterstica com a sua probabilidade de ocorrncia
na populao.

Quando a caracterstica que est sendo medida puder assumir qualquer valor (sujeito
exatido do processo de medio), sua distribuio de probabilidade chamada distribuio
contnua de probabilidade.

A partir das conceituaes anteriores, apresenta-se a conceituao de distribuio de
probabilidade e suas classificaes: distribuio contnua de probabilidade e distribuio
discreta de probabilidade.

Exemplo: a distribuio de freqncias dos dados de resistncias eltricas medidas. As
distribuies discretas de probabilidade mais comuns so:
(1) a Distribuio de Poisson;
(2) a Distribuio Binomial;

11.1 Distribuio Binomial
Vamos imaginar fenmenos cujos resultados s podem ser de dois tipos, um dos quais
considerado como sucesso e o outro insucesso. Este fenmeno pode ser repetido tantas vezes
quanto se queira (n vezes), nas mesmas condies. As provas repetidas devem ser
independentes, isto , o resultado de uma no deve afetar os resultados das sucessivas. No
decorrer do experimento, a probabilidade p do sucesso e a probabilidade de q (q = 1 - p) do
insucesso manter-se-o constantes. Nessas condies X uma varivel aleatria discreta que
segue uma distribuio binomial.
P(x) =
P(x) = a probabilidade de que o evento se realize x vezes em n provas.
p = a probabilidade de que o evento se realize em uma s prova = sucesso.
q = a probabilidade de que o evento no se realize no decurso dessa prova = insucesso.
OBS: O nome binomial devido frmula, pois representa o termo geral do
desenvolvimento do binmio de Newton.


Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 61

11.1.1 Parmetros da Distribuio Binomial
Mdia = n . p Desvio padro = a raiz quadrada do produto de n . p . q
Varincia = n . p . q


Exerccio: Seis parafusos so escolhidos ao acaso da produo de certa mquina, que
apresenta 10% de peas defeituosas. Qual a probabilidade de serem defeituosos dois deles?

11.2 Distribuio de Poisson
Distribuio de probabilidades aplicada para acontecimentos raros, entretanto o seu maior
uso prtico como aproximao para a distribuio binomial.
A P(x) calculada pela frmula abaixo:


Onde:
a mdia da distribuio ( n . p)
e representa a constante de valor igual a 2,718
x ! o fatorial de x
OBS: 0 ! = 1 e qualquer nmero elevado a zero igual a 1
OBS: quando um acontecimento segue a distribuio binomial com um p (sucesso) muito
pequeno de tal modo que temos que ter um n muito grande para que o sucesso ocorra.
Podemos simplificar os clculos usando a distribuio de Poisson como aproximao para a
distribuio binomial.
Para que os resultados aproximados pela distribuio de Poisson sejam satisfatrios ns s
devemos fazer a substituio da distribuio binomial pela de Poisson quando n for maior
ou igual a 50 e p menor ou igual a 0,1 ou p maior ou igual a 0,9 ( p prximo de 0 ou
prximo de 1).
Ex: Se 2% dos fusveis so defeituosos.Qual a probabilidade de que uma amostra de 400
fusveis exatamente 6 sejam defeituosos?
p = 0,02 n = 400 = n . p = 0,02 . 400 = 8
P (x = 6) = 0,1222 ou 12,24%
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 62

CAPTULO 12 - DISTRIBUIES DE VARIVEL CONTNUA



Distribuies Contnuas de Probabilidade so usadas para moldar situaes onde o resultado
de interesse pode assumir valores numa escala contnua, por exemplo, os valores maiores
que zero para o tempo de falha de um motor que est trabalhando continuamente.

12.1 Distribuio Normal
Quando a variao de uma caracterstica gerada pela soma de um grande nmero de erros
infinitesimais independentes devidos a diferentes fatores, a distribuio da caracterstica se
torna, em muitos casos, aproximadamente uma distribuio normal. A Distribuio Normal
pode ser simplesmente descrita como tendo a forma de um sino ou montanha, e numa
descrio mais detalhada:
a) a densidade de probabilidade mais alta no meio e diminui gradualmente em direo s
caudas e
b) ela simtrica.
Entre as distribuies tericas de varivel aleatria contnua, uma das mais empregadas a
distribuio Normal.
Muitas das variveis analisadas na pesquisa scio-econmica correspondem distribuio
normal ou dela se aproximam.
Considerando a probabilidade de ocorrncia, a rea sob sua curva soma 100%. Isso quer
dizer que a probabilidade de uma observao assumir um valor entre dois pontos quaisquer
igual rea compreendida entre esses dois pontos.


68,26% => 1 desvio 95,44% => 2 desvios 99,73% => 3 desvios
Na figura acima, tem as barras na cor marrom representando os desvios padres. Quanto
mais afastado do centro da curva normal, mais rea compreendida abaixo da curva haver. A
um desvio padro, temos 68,26% das observaes contidas. A dois desvios padres,
possumos 95,44% dos dados compreendidos e finalmente a trs desvios, temos 99,73%.
Podemos concluir que quanto maior a variabilidade dos dados em relao mdia, maior a
probabilidade de encontrarmos o valor que buscamos embaixo da normal.
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 63
12.2 Propriedades da distribuio normal
1 - A varivel aleatria X pode assumir todo e qualquer valor real.
2 - A representao grfica da distribuio normal uma curva em forma de sino, simtrica
em torno da mdia, que recebe o nome de curva normal ou de Gauss.
3 - A rea total limitada pela curva e pelo eixo das abscissas igual a 1, j que essa rea
corresponde probabilidade de a varivel aleatria X assumir qualquer valor real.
4 - A curva normal assinttica em relao ao eixo das abscissas, isto , aproxima-se
indefinidamente do eixo das abscissas sem, contudo, alcan-lo.
5 - Como a curva simtrica em torno da mdia, a probabilidade de ocorrer valor maior que
a mdia igual probabilidade de ocorrer valor menor do que a mdia, isto , ambas as
probabilidades so iguais a 0,5 ou 50%. Cada metade da curva representa 50% de
probabilidade.
Quando temos em mos uma varivel aleatria com distribuio normal, nosso principal
interesse obter a probabilidade de essa varivel aleatria assumir um valor em um
determinado intervalo.
Exemplo: Seja X a varivel aleatria que representa os dimetros dos parafusos produzidos
por certa mquina. Vamos supor que essa varivel tenha distribuio normal com mdia = 2
cm e desvio padro = 0,04 cm. Qual a probabilidade de um parafuso ter o dimetro com
valor entre 2 e 2,05 cm ?
P ( 2 < X < 2,05) = ?
Com o auxlio de uma distribuio normal reduzida, isto , uma distribuio normal de
mdia = 0 e desvio padro = 1. Resolveremos o problema atravs da varivel z,
onde z = (X - ) / S
Utilizaremos tambm uma tabela normal reduzida, que nos d a probabilidade de z tomar
qualquer valor entre a mdia 0 e um dado valor z, isto : P ( 0 < Z < z)
Temos, ento, que se X uma varivel aleatria com distribuio normal de mdia e
desvio padro S, podemos escrever: P( < X < x ) = P (0 < Z < z)
No nosso problema queremos calcular P(2 < X < 2,05) para obter essa probabilidade,
precisamos, em primeiro lugar, calcular o valor de z que corresponde a x = 2,05
z = (2,05 - 2) / 0,04 = 1,25


Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 64

Utilizao da Tabela Z
Procuremos, agora, na tabela Z o valor de z = 1,25
Na primeira coluna encontramos o valor at uma casa decimal = 1,2. Em seguida,
encontramos, na primeira linha, o valor 5, que corresponde ao ltimo algarismo do nmero
1,25. Na interseco da linha e coluna correspondentes encontramos o valor 0,3944, o que
nos permite escrever:
P (0 < Z < 1,25) = 0,3944 ou 39,44 %, assim a probabilidade de um certo parafuso
apresentar um dimetro entre a mdia = 2cm e x = 2,05 cm de 39,44 %.
















Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 65




Tabela normal (distribuio z)
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
-4.0 0.00003 0.00003 0.00003 0.00003 0.00003 0.00003 0.00002 0.00002 0.00002 0.00002
-3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003
-3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005
-3.7 0.00011 0.00010 0.00010 0.00010 0.00009 0.00009 0.00008 0.00008 0.00008 0.00008
-3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011
-3.5 0.00023 0.00022 0.00022 0.00021 0.00020 0.00019 0.00019 0.00018 0.00017 0.00017
-3.4 0.00034 0.00032 0.00031 0.00030 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024
-3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.00040 0.00039 0.00038 0.00036 0.00035
-3.2 0.00069 0.00066 0.00064 0.00062 0.00060 0.00058 0.00056 0.00054 0.00052 0.00050
-3.1 0.00097 0.00094 0.00090 0.00087 0.00084 0.00082 0.00079 0.00076 0.00074 0.00071
-3.0 0.00135 0.00131 0.00126 0.00122 0.00118 0.00114 0.00111 0.00107 0.00103 0.00100
-2.9 0.00187 0.00181 0.00175 0.00169 0.00164 0.00159 0.00154 0.00149 0.00144 0.00139
-2.8 0.00256 0.00248 0.00240 0.00233 0.00226 0.00219 0.00212 0.00205 0.00199 0.00193
-2.7 0.00347 0.00336 0.00326 0.00317 0.00307 0.00298 0.00289 0.00280 0.00272 0.00264
-2.6 0.00466 0.00453 0.00440 0.00427 0.00415 0.00402 0.00391 0.00379 0.00368 0.00357
-2.5 0.00621 0.00604 0.00587 0.00570 0.00554 0.00539 0.00523 0.00508 0.00494 0.00480
-2.4 0.00820 0.00798 0.00776 0.00755 0.00734 0.00714 0.00695 0.00676 0.00657 0.00639
-2.3 0.01072 0.01044 0.01017 0.00990 0.00964 0.00939 0.00914 0.00889 0.00866 0.00842
-2.2 0.01390 0.01355 0.01321 0.01287 0.01255 0.01222 0.01191 0.01160 0.01130 0.01101
-2.1 0.01786 0.01743 0.01700 0.01659 0.01618 0.01578 0.01539 0.01500 0.01463 0.01426
-2.0 0.02275 0.02222 0.02169 0.02118 0.02067 0.02018 0.01970 0.01923 0.01876 0.01831
-1.9 0.02872 0.02807 0.02743 0.02680 0.02619 0.02559 0.02500 0.02442 0.02385 0.02330
-1.8 0.03593 0.03515 0.03438 0.03362 0.03288 0.03216 0.03144 0.03074 0.03005 0.02938
-1.7 0.04456 0.04363 0.04272 0.04181 0.04093 0.04006 0.03920 0.03836 0.03754 0.03673
-1.6 0.05480 0.05370 0.05262 0.05155 0.05050 0.04947 0.04846 0.04746 0.04648 0.04551
-1.5 0.06681 0.06552 0.06425 0.06301 0.06178 0.06057 0.05938 0.05821 0.05705 0.05592
-1.4 0.08076 0.07927 0.07780 0.07636 0.07493 0.07353 0.07214 0.07078 0.06944 0.06811
-1.3 0.09680 0.09510 0.09342 0.09176 0.09012 0.08851 0.08691 0.08534 0.08379 0.08226
-1.2 0.11507 0.11314 0.11123 0.10935 0.10749 0.10565 0.10383 0.10204 0.10027 0.09852
-1.1 0.13566 0.13350 0.13136 0.12924 0.12714 0.12507 0.12302 0.12100 0.11900 0.11702
-1.0 0.15865 0.15625 0.15386 0.15150 0.14917 0.14686 0.14457 0.14231 0.14007 0.13786
-0.9 0.18406 0.18141 0.17878 0.17618 0.17361 0.17105 0.16853 0.16602 0.16354 0.16109
-0.8 0.21185 0.20897 0.20611 0.20327 0.20045 0.19766 0.19489 0.19215 0.18943 0.18673
-0.7 0.24196 0.23885 0.23576 0.23269 0.22965 0.22663 0.22363 0.22065 0.21769 0.21476
-0.6 0.27425 0.27093 0.26763 0.26434 0.26108 0.25784 0.25462 0.25143 0.24825 0.24509
-0.5 0.30853 0.30502 0.30153 0.29805 0.29460 0.29116 0.28774 0.28434 0.28095 0.27759
-0.4 0.34457 0.34090 0.33724 0.33359 0.32997 0.32635 0.32276 0.31917 0.31561 0.31206
Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 66
Exerccios:

1) Um fabricante de lmpadas verifica, atravs de uma distribuio de freqncias, que o
tempo de queima de um determinado modelo de lmpada distribudo normalmente. Uma
amostra de 50 lmpadas foi testada e o tempo mdio de vida encontrado foi 60 dias, com um
desvio-padro de 20 dias. Quantas lmpadas, na populao total de lmpadas fabricadas por
ele, pode se esperar que ainda estejam funcionando aps 100 dias de vida?

O problema aqui dado encontrar a rea sob a curva alm dos 100 dias. A rea sob uma
curva de distribuio entre dois limites estabelecidos representa a probabilidade de
ocorrncia. Portanto, a rea alm dos 100 dias a probabilidade que uma lmpada tem de
durar mais de 100 dias.

2) Um produto pesa, em mdia, 10g, com desvio-padro de 2 g. embalado em caixas com
50 unidades. Sabe-se que as caixas vazias pesam 500g, com desvio-padro de 25g.
Admitindo-se uma distribuio normal dos pesos e independncia entre as variveis dos
pesos do produto e da caixa, calcular a probabilidade de uma caixa cheia pesar mais de
1050g.

Utilize a figura acima para o desenvolvimento da questo, onde a primeira repartio,
direita, representa a probabilidade da caixa pesar 1050g.