Você está na página 1de 76

APOSTILA

CONCURSO
ENGENHEIRO 2011
Caderno
Conhecimentos Especficos

www.certificadoonline.net

APOSTILA DE ESTATSTICA

Autor:

Prof ARLINDO DELLA GIUSTINA

2
www.certificadoonline.net

Sumrio

1 - Introduo ...............................................................................................
p.
1.1Panorama Histrico...................................................................................
p.
1.2 - Mtodo Estatstico....................................................................................... p.
1.2.1- O Mtodo Cientfico .................................................... ......................
p.
1.2.2 - O Mtodo Experimental .......................... ................................................ p.
1.2.3 - O Mtodo Estatstico............................. ..........................................
p.
1.3 - A Estatstica.............................................. ...........................................
p.
1.4 - Fases do Mtodo Estatstico.................. ............................................
p.
1.4.1 - Definio do Problema......................................................................
p.
1.4.2 - Coleta de Dados........................................ ......................................
p.
1.4.3 - Crtica dos Dados ........................................ ....................................... p.
1.4.4 - Apurao dos Dados .................................. ...................................
p.
1.4.5 - Exposio ou Apresentao dos Dados .................................................. p.
1.4.6 - Anlise e Interpretao dos Resultados...........................................
p.
1.5 - O Uso de Modelos em Estatstica........................................................
p.
1.6 - A Estatstica nas Empresas ................................................................
p.

4
4
4
4
5
5
5
6
6
6
7
7
7
7
7
8

2 - Populao e Amostra................................... .. ..............................................p. 9


2.1 - Variveis .................................................... ................................................ p. 9
2.2 - Populao e Amostra ............................................. ...........................
p. 9
2.3 - Amostragem ............................................................... .............................. p.10
2.3.1- Amostragem Casual ou Aleatria Simples .....................................
p.10
2.3.2 - Amostragem Proporcional Estratificada .............. ..........................p.11
2.4 - Amostragem Sistemtica .................................................................. p.12
3 - Grficos Estatsticos .................................... ...............................................p.13
3.1 - Diagramas .............................................. ................. ................................ p.13
3.1.1 - Grfico em Linha ou em Curva ............................................................... p.13
3.2. Grfico em colunas ou em barras ................................................................ p.14
3.3 - Grfico em Colunas ou em Barras Mltiplas .........................................
p.16
3.4 - Grfico em Setores, Circulares ou de Pizza ........................................... p.17
4 - Distribuio de Freqncia .................. ................. ......................................p.19
4.1 - Tabela Primitiva - ROL .......................... ................................................... p.19
4.2 - Distribuio de Freqncia ..................................................................
p.20
4.3 - Elementos de uma Distribuio de Freqncia ......................................... p.21
4.3.1 - Classe .......................................................... ....................................
p.21
4.3.2 - Limites de Classe ...................................... ....................................
p.21
4.3.3 - Amplitude de um Intervalo de Classe ........ .......................................
p.21
4.3.4 - Amplitude Total da Distribuio .............................................................. p.22
4.3.5 - Amplitude Amostral ..........................................................................
p.22
4.3.6 - Ponto Mdio de uma Classe ....................... ............................................. p.22
4.3.7 - Freqncia Simples ou Absoluta ......................................................... p.23
4.4 - Tipos de Freqncias ........................................................................
p.23
3
www.certificadoonline.net

4.6 - Distribuio de Freqncia sem Intervalos de Classe .........................


4.7 - Representao Grfica de uma Distribuio .....................................
4.7.1 - Histograma ............................................... ........................................
4.7.2 - Polgono de Freqncia .................................... ................. ....................
4.7.3 - Polgono de freqncia acumulada ..................................................
4.8 - A Curva de Freqncia ..................................................................... p.28
4.8.1 - A Curva de Freqncia. Curva Polida .......... ................. ........................
4.8.2 - As Formas das Curvas de Freqncia ..............................................
4.8.2.1 - Curvas em Forma de Sino ..............................................................
4.8.2.2 - Curvas em Forma de Jota ..................... .......................................
4.8.2.3 - Curvas em Forma de U ...............................................................

p.25
p.26
p.26
p.27
p.28
p.28
p.30
p.30
p.31
p.31

5 - Medidas de Posio..............................................................................
p.32
5.1 - Introduo .........................................................................................p.32
5.2 - Media Aritmtica........................................................................................... p.32
5.2.1 - Dados No-agrupados ........................................................................
p.32
5.2.2 - Desvio em Relao Mdia ................................................................... p.33
5.2.4-Dados Agrupados .......................................................................................p.33
5.2.4.1 - Sem Intervalos de Classe ........................................................... p.33
5.2.4.2 - Com Intervalos de Classe ..................................................................... p.34
5.2.5 - Emprego da Mdia .........................................................................
p.35
5.3 - A Moda .......................................................................................................p.36
5.3.1 - Dados No-agrupados ........................................................................... p.36
5.3.2 - Dados Agrupados ..............................................................................
p.36
5.3.2.1 - Sem Intervalos de Classe .................................................................. p.36
5.3.2.2 - Com intervalos de Classe ................................................................... p.36
5.3.3 - Emprego da Moda ......................................... ................. ....................... p.37
5.4 - A Mediana.....................................................................................................p.37
5.4.1 - Dados No-agrupados ...................................................................p.38
5.4.2 - Dados Agrupados ............................................................................
p.39
5.4.2.1 - Sem Intervalos de Classe ...............................................................
p.39
5.4.2.2 - Com Intervalos de Classe ...............................................................
p.40
5.4.3 - Emprego da Mediana .......................................................................
p.42
6 - Medidas de Disperso ..................................................................................p.43
6.1 - Disperso ou Variabilidade ................................................................
p.43
6.2 - Amplitude Total .....................................................................................
p.44
6.2.1 - Dados No-agrupados ................ ...................................................
p.44
6.2.2 - Dados Agrupados .......................................................................... p.44
6.2.2.1 - Sem Intervalos de Classe ........................................................... p.44
6.2.2.2 - Com Intervalos de Classe .............................................................
p.45
6.3 - Varincia - Desvio Padro .................................................................
p.45
6.3.1 - Introduo ......................................................................................p.45
6.3.2 - Dados No-agrupados ....................................................................p.47
6.3.3 - Dados Agrupados ............................................................................
p.47
6.3.3.1 - Sem Intervalos de Classe ........................................................... p.47
6.3.3.2 - Com Intervalos de Classe ............................................................
p.48
6.4 - Coeficiente de Variao .....................................................................
p.49

4
www.certificadoonline.net

7 - Correlao e Regresso ................................................................................p.51


7.1 - Introduo ..........................................................................................
p.51
7.2 - Correlao ..........................................................................................
p.51
7.2.1 - Relao Funcional e Relao Estatstica ............................................
p.51
7.2.2 - Diagrama de Disperso ...................................................................
p.52
7.2.3 - Correlao Linear .................................................................................. p.52
7.2.4 - Coeficiente de Correlao Linear ....................................................
p.54
7.3 - Regresso .........................................................................................
p.55
7.3.1 - Ajustamento da Reta .........................................................................
p.55
7.3.2 - Interpolao e Extrapolao ......................... .......................................... p.58
8 - Probabilidade ..................................................... ...................... ....................p.59
8.1 - Introduo ................................................................................................. p.59
8.2 - Experimento Aleatrio ..................................... .......................................... p.59
8.3 - Espao Amostral .............................................. .......................................... p.59
8.4 - Eventos ................................................................................................
p.60
8.5 - Probabilidade ........................................................................................... p.60
8.6 - Eventos Complementares ...................................................................
p.62
8.7 - Eventos Independentes .................................................................... p.62
8.8 - Permutaes ............................................................................................ p.63
8.8.1 - Permutaes que a Ordem no Importa . ........................................... p.63
8.8.2 - Permutaes que a Ordem Importa ....... .......................................
p.63
8.9 - Eventos Mutuamente Exclusivos ............... ..........................................
p.64
8.9.1 - Teorema de Bayes .................................... .............................................. p.64
9 Anexo I.................................................................. .........................................p.66
10 Bibliografia .............................................. ...................................................p.67

5
www.certificadoonline.net

CAPTULO 1 - INTRODUO
1.1 - PANORAMA HISTRICO
Todas as cincias tm suas razes na histria do homem.
A Matemtica, que considerada a cincia que une clareza do raciocnio a sntese
da linguagem, originou-se do convvio social, das trocas, da contagem, com carter prtico, utilitrio, emprico (experimental).
A Estatstica, ramo da Matemtica Aplicada, teve origem semelhante.
Desde a Antiguidade, vrios povos j registravam o nmero de habitantes, de nascimentos, de bitos, faziam estimativas das riquezas individual e social, na distribuio de
terras ao povo, cobravam impostos e realizavam inquritos quantitativos por processos
que, hoje, chamaramos de estatsticas.
Na Idade Mdia colhiam-se informaes, geralmente com finalidades tributrias ou blicas.
A partir do sculo XVI comearam a surgir as primeiras anlises sistemticas de fatos
sociais, como batizados, casamentos, funerais, originando as primeiras tbuas e tabelas e
os primeiros nmeros relativos.
No sculo XVIII o estudo de tais fatos foi adquirindo, aos poucos, feio verdadeiramente cientfica. Godofredo Achenwall batizou a nova cincia (ou mtodo) com o nome
de Estatstica, determinando o seu objetivo e suas relaes com as cincias.
As tabelas tornaram-se mais completas, surgiram as representaes grficas e o clculo das probabilidades, e a Estatstica deixou de ser simples catalogao de dados numricos coletivos para se tornar o estudo de como chegar a concluses sobre o todo (populao), partindo da observao de partes desse todo (amostras).
Na era da informao os estudos estatsticos tm avanado rapidamente e, com seus
processos e tcnicas, tm contribudo para a organizao dos negcios e recursos do
mundo moderno.

1.2 - MTODO ESTATSTICO


O mtodo estatstico classificado em dois mtodos: o cientifico e o experimental.

1.2.1- O Mtodo Cientfico


Muitos dos conhecimentos que temos foram obtidos na Antiguidade por acaso e, outros, por necessidades prticas, sem aplicao de um mtodo.
Atualmente, quase todo acrscimo de conhecimento resulta da observao e do estudo. Se bem que muito desse conhecimento possa ter sido observado inicialmente por acaso, a verdade que desenvolvemos processos cientficos para seu estudo e para adquirirmos tais conhecimentos.
6
www.certificadoonline.net

Podemos dizer, ento, que:


MTODO um conjunto de meios dispostos convenientemente para se chegar a um
fim que se deseja.

1.2.2 - O Mtodo Experimental


O mtodo experimental consiste em manter constantes todas as causas (fatores),
menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos,
caso existam.
o mtodo preferido no estudo da Fsica, da Qumica, etc.

1.2.3 - O Mtodo Estatstico


Muitas vezes temos necessidade de descobrir fatos em um campo em que o mtodo
experimental no se aplica (nas cincias sociais), j que os vrios fatores que afetam o
fenmeno em estudo no podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa.
Como exemplo, podemos citar a determinao das causas que definem o preo de
uma mercadoria. Para aplicarmos o mtodo experimental, teramos de fazer variar a
quantidade da mercadoria e verificar se tal fato iria influenciar seu preo.
Porm, seria necessrio que no houvesse alterao nos outros fatores. Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salrios, o gosto dos consumidores deveria permanecer constante, seria necessria a fixao do nvel geral dos preos das outras necessidades, etc. Mas isso tudo impossvel.
Nesses casos, lanamos mo de outro mtodo, embora mais difcil e menos preciso,
denominado mtodo estatstico.
O mtodo estatstico, diante da impossibilidade de manter as causas constantes,
admite todas essas causas presentes variando-as, registrando essas variaes e procurando determinar, no resultado final, que influncias cabem a cada uma delas.

1.3 - A ESTATSTICA
A Estatstica uma parte da Matemtica Aplicada que fornece mtodos para a coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises.
Estatstica um conjunto de mtodos e processos quantitativos que serve para
estudar e medir os fenmenos coletivos.
A Estatstica utiliza mtodos cientficos para coleta, organizao, resumo, apresentao e anlise de dados, bem como na obteno de concluses vlidas e na tomada de
decises razoveis baseadas em tais anlises.

7
www.certificadoonline.net

A coleta, a organizao e a descrio dos dados esto a cargo da Estatstica Descritiva, enquanto a anlise e a interpretao desses dados ficam a cargo da Estatstica
Indutiva ou Inferencial (raciocinar, concluir).
Em geral, as pessoas, quando se referem ao termo estatstica, o fazem no sentido da
organizao e descrio dos dados (estatstica do Ministrio da Educao, estatstica dos
acidentes de trfego etc.), desconhecendo que o aspecto essencial da Estatstica o
de proporcionar mtodos inferenciais, que permitam concluses que transcendam
os dados obtidos inicialmente.
Assim, a anlise e a interpretao dos dados estatsticos tornam possvel o diagnstico
de uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condies de funcionamento, produtividade), a formulao de solues apropriadas e um
planejamento objetivo de ao.

1.4 - FASES DO MTODO ESTATSTICO


Quando se pretende empreender um estudo estatstico completo, existem diversas
fases do trabalho que devem ser desenvolvidas para se chegar aos resultados finais do
estudo. Essas etapas ou operaes so chamadas de Fases do Mtodo Estatstico.
Podemos distinguir no mtodo estatstico as seguintes fases:

1.4.1 - Definio do Problema


A primeira fase do trabalho estatstico consiste em uma definio ou formulao
correta e cuidadosa do problema a ser estudado. Certificar-se de que clara a finalidade
de um estudo ou anlise.

1.4.2 - Coleta de Dados


Aps cuidadoso planejamento e a devida determinao das caractersticas mensurveis do fenmeno coletivamente tpico que se quer pesquisar, damos inicio coleta dos
dados numricos necessrios sua descrio.
A coleta pode ser direta e indireta.
A coleta direta quando feita sobre elementos informativos de registro obrigatrio
(nascimentos, casamentos e bitos, importao e exportao de mercadorias), elementos
pertinentes aos pronturios dos alunos de uma escola ou, ainda, quando os dados so
coletados pelo prprio pesquisador atravs de inquritos e questionrios, como o caso
das notas de verificao e de exames, do censo demogrfico, etc.
A coleta direta de dados pode ser classificada relativamente ao fator tempo em:
a) contnua (registro) quando feita continuamente, tal como a de nascimentos e
bitos e a de freqncia dos alunos s aulas;
b) peridica quando feita em intervalos constantes de tempo, como os censos (de
10 em 10 anos) e as avaliaes mensais dos alunos;
8
www.certificadoonline.net

c) ocasional quando feita esporadicamente, a fim de atender a uma conjuntura ou


a uma emergncia, como no caso de epidemias que assolam ou dizimam rebanhos inteiros.
A coleta se diz indireta quando inferida de elementos conhecidos (coleta direta) e/ou
do conhecimento de outros fenmenos relacionados com o fenmeno estudado. Como
exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que feita atravs de dados colhidos por uma coleta direta.

1.4.3 - Crtica dos Dados


Obtidos os dados, eles devem ser cuidadosamente criticados, procura de possveis
falhas e imperfeies, a fim de no incorrermos em erros grosseiros ou de certo vulto, que
possam influir sensivelmente nos resultados.
A critica externa quando visa s causas dos erros por parte do informante e, por distrao ou m interpretao das perguntas que lhe foram feitas; interna quando visa observar os elementos originais dos dados da coleta.

1.4.4 - Apurao dos Dados


Nada mais do que a soma e o processamento dos dados obtidos e a disposio mediante critrios de classificao. Pode ser manual ou eletrnica.

1.4.5 - Exposio ou Apresentao dos Dados


Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada (tabelas ou grficos), tornando mais fcil o exame daquilo que est sendo objeto de tratamento estatstico e ulterior obteno de medidas tpicas.

1.4.6 - Anlise e Interpretao dos Resultados


Como j dissemos, o objetivo ltimo da Estatstica tirar concluses sobre o todo (populao) a partir de informaes fornecidas por parte representativa do todo (amostra).
Assim, realizadas as fases anteriores (Estatstica Descritiva), fazemos uma anlise dos
resultados obtidos, atravs dos mtodos da Estatstica Indutiva ou Inferencial, que tem
por base a induo ou inferncia e tiramos desses resultados concluses e previses.
O relato destas concluses dever ser de maneira que sejam facilmente entendidas
por quem as for usar na tomada de decises.

9
www.certificadoonline.net

1.5 - O USO DE MODELOS EM ESTATSTICA


Um modelo uma verso simplificada de algum problema ou situao da vida real
destinado a ilustrar certos aspectos do problema sem levar em conta todos os detalhes.
Um dos principais instrumentos extensamente usados na estatstica o modelo. Os
modelos so verses simplificadas de algum problema ou situao da vida real. So usados para ilustrar certos aspectos da situao, evitando grande nmero de detalhes que
talvez sejam irrelevantes para o problema; podem, assim, ajudar a reduzir o grau de complexidade de um problema.
H muitos exemplos da utilizao de modelos na vida cotidiana. Um globo, por exemplo, um modelo da Terra. Permite focalizar a ateno em aspectos como a forma da
Terra, e o tamanho relativo, a forma e a posio de oceanos e continentes, deixando de
lado inmeros outros detalhes tais como densidade de populaes, diferenas de lngua,
clima, indstria, etc. Os manequins so usados para modelar roupas. Todos constituem
verses simplificadas de algo mais complexo.
Desnecessrio dizer que cada tipo de modelo sempre incompleto, de alguma forma, pois se refere apenas a parte do problema. Mas esse precisamente o objetivo da
utilizao de modelos: focalizar apenas uma pequena parte do problema.
Os modelos tm como principais utilidades:
- comunicar uma idia ou conceito;
- padres de comparao;
- processos padronizados de soluo;
- simplificao para anlise de problemas (pode-se variar somente o que se deseja
analisar e permanecendo constante as outras variveis, ex.: fatores humanos, ambientais,
etc.);
- fornece idia para quantificar e formalizar no que conhece acerca de um problema ou
projeto;
- e principalmente, como maneira relativamente barata e segura de testar idias antes
de implement-las.

1.6 - A ESTATSTICA NAS EMPRESAS


No mundo atual, a empresa uma das vigas-mestras da Economia dos povos.
A direo de uma empresa, de qualquer tipo, incluindo as estatais e governamentais,
exige de seu administrador a importante tarefa de tomar decises, e o conhecimento e o
uso da Estatstica facilitaro seu trplice trabalho de organizar, dirigir e controlar a empresa.
Por meio de sondagem, de coleta de dados e de recenseamento de opinies, podemos conhecer a realidade geogrfica e social, os recursos naturais, humanos e financeiros disponveis, as expectativas da comunidade sobre a empresa, e estabelecer suas
metas, seus objetivos com maior possibilidade de serem alcanados a curto, mdio ou
longo prazos.

10
www.certificadoonline.net

A Estatstica ajudar em tal trabalho, como tambm na seleo e organizao da estratgia a ser adotada no empreendimento e, ainda, na escolha das tcnicas de verificao e avaliao da quantidade e da qualidade do produto e mesmo dos possveis lucros
e/ou perdas.
Tudo isso que se pensou, que se planejou, precisa ficar registrado, documentado para
evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e do material e,
ainda, para um controle eficiente do trabalho.
O esquema do planejamento o plano, que pode ser resumido, com auxilio da Estatstica, em tabelas e grficos, que facilitaro a compreenso visual dos clculos matemtico-estatsticos que lhes deram origem.

11
www.certificadoonline.net

CAPTULO 2 - POPULAO E AMOSTRA

2.1 - VARIVEIS
A cada fenmeno corresponde um nmero de resultados possveis. Assim, por exemplo:
- para o fenmeno sexo so dois os resultados possveis: sexo masculino e sexo
feminino;
- para o fenmeno nmero de filhos h um nmero de resultados possveis expresso atravs dos nmeros naturais: 0, 1, 2, 3, ...., n;
- para o fenmeno estatura temos uma situao diferente, pois os resultados podem tomar um nmero infinito de valores numricos dentro de um determinado intervalo.
Varivel , convencionalmente, o conjunto de resultados possveis de um fenmeno.
Os exemplos acima nos dizem que uma varivel pode ser:
a) qualitativa - quando seus valores so expressos por atributos: sexo (masculino
feminino), cor da pele (branca, preta, amarela, vermelha, parda) etc.;
b) quantitativa - quando seus valores so expressos em nmeros (salrios dos operrios, idade dos alunos de uma escola etc.). Uma varivel quantitativa que pode assumir,
teoricamente, qualquer valor entre dois limites recebe o nome de varivel contnua; uma
varivel que s pode assumir valores pertencentes a um conjunto enumervel recebe o
nome de varivel discreta.
Assim, o nmero de alunos de uma escola pode assumir qualquer um dos valores do
conjunto N = {1, 2, 3, ..., 58,...} mas nunca valores como 2,5 ou 3,78 ou 4,325 etc. Logo,
uma varivel discreta. J o peso desses alunos uma varivel contnua, pois um dos
alunos tanto pode pesar 72 kg, como 72,5 kg, como 72,54 kg etc., dependendo esse valor
da preciso da medida.
De modo geral, as medies do origem a variveis continuas e as contagens ou
enumeraes, a variveis discretas.
Designamos as variveis por letras latinas, em geral, as ltimas: x, y, z
Por exemplo, sejam 2, 3, 5 e 8 todos os resultados possveis de um dado fenmeno.
Fazendo uso da letra x para indicar a varivel relativa ao fenmeno considerado, temos:
x {2, 3, 5, 8}

12
www.certificadoonline.net

2.2 - POPULAO E AMOSTRA


Ao conjunto de entes portadores de, pelo menos, uma caracterstica comum denominamos populao estatstica ou universo estatstico.
Assim, os estudantes, por exemplo, constituem uma populao, pois apresentam pelo
menos uma caracterstica comum: so os que estudam.
Como em qualquer estudo estatstico temos em mente pesquisar uma ou mais caractersticas dos elementos de alguma populao, esta caracterstica deve estar perfeitamente definida. E isto se d quando, considerado um elemento qualquer, podemos afirmar,
sem ambigidade, se esse elemento pertence ou no populao. necessrio, pois,
existir um critrio de constituio da populao vlido para qualquer pessoa, no tempo ou
no espao.
Por isso, quando pretendemos fazer uma pesquisa entre os alunos das escolas de 3
grau, precisamos definir quais so os alunos que formam o universo: os que atualmente
ocupam as carteiras das escolas, ou devemos incluir tambm os que j passaram pela
escola? claro que a soluo do problema vai depender de cada caso em particular.
Na maioria das vezes, por impossibilidade ou inviabilidade econmica ou temporal, limitamos as observaes referentes a uma determinada pesquisa a apenas uma parte da
populao. A essa parte proveniente da populao em estudo denominamos amostra.
Uma amostra um subconjunto finito de uma populao.
Como vimos anteriormente, a Estatstica Indutiva tem por objetivo tirar concluses sobre as populaes, com base em resultados verificados em amostras retiradas dessa populao.
Mas, para as inferncias serem corretas, necessrio garantir que a amostra seja
representativa da populao, isto , a amostra deve possuir as mesmas caractersticas
bsicas da populao, no que diz respeito ao fenmeno que desejamos pesquisar.
preciso, pois, que a amostra ou as amostras que vo ser usadas sejam obtidas por
processos adequados.
H casos, como o de pesquisas sociais, econmicas e de opinio, em que os
problemas de amostragem so de extrema complexidade. Mas existem tambm casos em
que os problemas de amostragem so bem mais fceis. Como exemplo, podemos citar a
retirada de amostras para controle de qualidade dos produtos ou materiais de
determinada indstria.

2.3 - AMOSTRAGEM
Existe uma tcnica especial - amostragem - para recolher amostras, que garante,
tanto quanto possvel, o acaso na escolha.
Dessa forma, cada elemento da populao passa a ter a mesma chance de ser
escolhido, o que garante amostra o carter de representatividade, e isto muito
importante, pois, como vimos, nossas concluses relativas populao vo estar
baseadas nos resultados obtidos nas amostras dessa populao.
Daremos, a seguir, trs das principais tcnicas de amostragem.

13
www.certificadoonline.net

2.3.1 - Amostragem Casual ou Aleatria Simples


Este tipo de amostragem equivalente a um sorteio lotrico.
Na prtica, a amostragem casual ou aleatria simples pode ser realizada
numerando-se a populao de 1 a n e sorteando-se, a seguir, por meio de um dispositivo
aleatrio qualquer, k nmeros dessa seqncia, os quais correspondero aos elementos
pertencentes amostra.
Exemplo:
Vamos obter uma amostra representativa para a pesquisa da estatura de noventa
alunos de uma escola:
a) Numeramos os alunos de 01 a 90;
b) Escrevemos os nmeros, de 01 a 90, em pedaos iguais de um mesmo papel,
colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os
pedaos de papel e retiramos, um a um, nove nmeros que formaro a amostra. Neste
caso, 10% da populao.
Quando o nmero de elementos da amostra grande, esse tipo de sorteio torna-se
muito trabalhoso. A fim de facilit-lo, foi elaborada uma tabela - Tabela de Nmeros
Aleatrios -, construda de modo que os dez algarismos (0 a 9) so distribudos ao acaso
nas linhas e colunas (Anexo 1).
Tambm, em algumas calculadoras cientificas possuem a tecla RND que gera
nmeros aleatrios com 3 casas decimais. No programa Excel da Microsoft gera nmeros
aleatrios [aleatrio()].
Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo
qualquer da mesma, a partir do qual iremos considerar nmeros de dois, trs ou mais
algarismos, conforme nossa necessidade. Os nmeros assim obtidos iro indicar os
elementos da amostra.
A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou viceversa), verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido
ascendente ou descendente) ou formando o desenho de uma letra qualquer. A opo,
porm, deve ser feita antes de iniciado o processo.
Assim, para o nosso exemplo, considerando a 18 linha, tomamos os nmeros de dois
algarismos (tantos algarismos quantos formam o maior nmero da populao), obtendo:
61 02 01 81 73 92 60 66 73 58 53
Evidentemente, o numeral 92 ser desprezado, pois no consta da populao, como
ser tambm abandonado um numeral que j tenha aparecido ( 73 ). Temos, ento:
61 02 01 81 73 60 66 58 53
Medindo as alturas dos alunos correspondentes aos nmeros sorteados, obteremos
uma amostra das estaturas dos noventa alunos.

14
www.certificadoonline.net

2.3.2 - Amostragem Proporcional Estratificada


Muitas vezes a populao se divide em subpopulaes - estratos.
Como provvel que a varivel em estudo apresente, de estrato em estrato, um
comportamento heterogneo e, dentro de cada estrato, um comportamento homogneo,
convm que o sorteio dos elementos da amostra leve em considerao tais estratos.
exatamente isso que fazemos quando empregamos a amostragem proporcional
estratificada, que, alm de considerar a existncia dos estratos, obtm os elementos da
amostra proporcional ao nmero de elementos dos mesmos.
Exemplo:
Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam homens e 36 sejam
mulheres, vamos obter a amostra proporcional estratificada.
So, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma
amostra de 10% da populao. Logo, temos:
Tabela 2.1:

SEXO POPULAO

10%

AMOSTRA

54

10 X 54 = 5,4
100

36

Total

90

10 X 36 = 3,6
100
10 X 90 = 9
100

a) numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem homens e


de 55 a 90, mulheres. Tomando na Tabela de Nmeros Aleatrios a primeira e a segunda
colunas da esquerda, de cima para baixo, obtemos os seguintes nmeros:
57 28 92 90 80 22 56 79 53 18 53 03 27 05 40 Temos, ento:
28 22 53 18 03 - para os homens;
57 90 80 56 - para as mulheres.

2.4 - AMOSTRAGEM SISTEMTICA


Quando os elementos da populao j se acham ordenados, no h necessidade de
construir o sistema de referncia. So exemplos os pronturios mdicos de um hospital,
os prdios de uma rua, as linhas de produo etc. Nestes casos, a seleo dos elementos
que constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador. A
esse tipo de amostragem denominamos sistemtica.
Assim, no caso de uma linha de produo, podemos, a cada dez itens produzidos,
retirar um para pertencer a uma amostra da produo diria. Neste caso, estaramos
fixando o tamanho da amostra em 10% da populao.

15
www.certificadoonline.net

Exemplo:
Suponhamos uma rua contendo novecentas casas, dos quais desejamos obter uma
amostra formada de cinqenta casas. Podemos, neste caso, usar o seguinte
900
procedimento: como
= 18, escolhemos por sorteio casual um nmero de 1 a 18
50
(inclusive), o qual indicaria o primeiro elemento sorteado para a amostra; os demais
elementos seriam periodicamente considerados de 18 em 18.
Assim, se o nmero sorteado fosse o 4, tomaramos, pelo lado direito da rua, o 4
casa, o 22, o 40 etc., at voltarmos ao incio da rua, pelo lado esquerdo.

16
www.certificadoonline.net

CAPTULO 3 - GRFICOS ESTATSTICOS


O grfico estatstico uma forma de apresentao dos dados estatsticos, cujo
objetivo o de produzir, no investigador ou no pblico em geral, uma impresso mais
rpida e viva do fenmeno em estudo, j que os grficos falam mais rpido
compreenso que as sries.
Para tornarmos possvel uma representao grfica, estabelecemos uma
correspondncia entre os termos da srie e determinada figura geomtrica, de tal modo
que cada elemento da srie seja representado por uma figura proporcional.
A representao grfica de um fenmeno deve obedecer a certos requisitos
fundamentais para ser realmente til:
a) Simplicidade - o grfico deve ser destitudo de detalhes de importncia
secundria, assim como de traos desnecessrios que possam levar o observador a uma
anlise morosa ou com erros;
b) Clareza - o grfico deve possibilitar uma correta interpretao dos valores
representativos do fenmeno em estudo.
e) Veracidade - o grfico deve expressar a verdade sobre o fenmeno em estudo;
f) Realce - quanto mais chamativo (colorido) e realando as diferenas ou
tendncias, melhor ser para chamar ateno em observadores no grfico.
Os principais tipos de grficos so os diagramas.

3.1 - DIAGRAMAS
Os diagramas so grficos geomtricos de no mximo, duas dimenses para sua
construo, em geral, fazemos uso do sistema cartesiano.
Dentre os principais diagramas, destacamos:

3.1.1 - Grfico em Linha ou em Curva


Este tipo de grfico se utiliza da linha poligonal para representar a srie estatstica.
O grfico em linha constitui uma aplicao do processo de representao das funes
num sistema de coordenadas cartesianas.
Como sabemos, nesse sistema fazemos uso de duas retas perpendiculares; as retas
so os eixos coordenados e o ponto de interseco, a origem. O eixo horizontal
denominado eixo das abscissas (ou eixo dos x) e o vertical, eixo das ordenadas (ou eixo
dos y).
Para tornar bem clara a explanao, consideremos a seguinte srie:

17
www.certificadoonline.net

Tabela 3.1:
PRODUO BRASILEIRA
DE LEO DE DEND
1999 - 2004
QUANTIDADE
ANOS
(1.000 t)
1999
39,3
2000
39,1
2001
53,9
2002
65,1
2003
69,1
2004
59,5
FONTE: Fictcia

Vamos tomar os anos como abscissas e as quantidades como ordenadas.


Assim, um ano dado (x) e a respectiva quantidade (y) formam um par ordenado (x, y),
que pode ser representado num sistema cartesiano.
Determinados, graficamente, todos os pontos da srie, usando as coordenadas,
ligamos todos esses pontos, dois a dois, por segmentos de reta, o que ir nos dar uma
poligonal, que o grfico em linha ou em curva correspondente srie em estudo:
Figura 3.1:

Produo Brasileira de leo de Dend


80
70

Mil Ton.

60
50
40
30
20
10
0
1999

2000

2001

2002

Ano

18
www.certificadoonline.net

2003

2004

3.2 - GRFICO EM COLUNAS OU EM BARRAS


a representao de uma srie por meio de retngulos, dispostos verticalmente (em
colunas) ou horizontalmente (em barras).
Quando em colunas, os retngulos tm a mesma base e as alturas so proporcionais
aos respectivos dados.
Quando em barras, os retngulos tm a mesma altura e os comprimentos so
proporcionais aos respectivos dados.
Assim estamos assegurando a proporcionalidade entre as reas dos retngulos e os
dados estatsticos.
Exemplos:
a) Grfico em colunas:
Tabela 3.2:

PRODUO BRASILEIRA DE
CARVO MINERAL BRUTO
2000 - 2004
QUANTIDADE
ANOS
PRODUZIDA
(1.000 T)
2000
18.196
2001
11.186
2002
10.468
2003
9.241
2004
15.360
FONTE: Fictcia

Figura 3.2:
Produo Brasileira de Carvo
Mineral Bruto

Mil Ton

20000
18000
16000
14000
12000
10000
8000
6000
4000
2000
0

2000

2001

2002

Anos

19
www.certificadoonline.net

2003

2004

b) Grfico em Barras:
Tabela 3.3:
EXPORTAES BRASILEIRAS
MARO - 2003
VALOR
ESTADOS
(US$ MILHOES)
So Paulo
1.344
Paran
250
Rio Grande do Sul
432
Esprito Santo
285
Minas Gerais
742
Santa Catarina
202
FONTE: Fictcia

Figura 3.3:

Exportaes Brasileiras
Maro - 2004

Estados

500

1000

Milhes de US$
So Paulo
Esprito Santo

Paran
Minas Gerais

20
www.certificadoonline.net

Rio G. Sul
S. Catarina

1500

3.3 - GRFICO EM COLUNAS OU EM BARRAS MLTIPLAS


Este tipo de grfico geralmente empregado quando queremos representar,
simultaneamente, dois ou mais fenmenos estudados com o propsito de comparao.
Tabela 3.4:
BALANA COMERCIAL DO BRASIL
2000 - 2004
ESPECIFICAES
VALOR (US$ 1.000.000)
2000
2001
2002
2003
Exportao (FOB)
Importao

34.383
18.263

31414
20661

31620
21041

35793
20554

2004
38783
25711

FONTE: Fictcia

Figura 3.4:
BALANA COMERCIAL DO BRASIL 1999 - 2003
40000
35000

US$ Milhoes

30000
25000
20000
15000
10000
5000
0

1999

2001

2002

2003

2004

Anos
Exportao

Importao

3.4 - GRFICO EM SETORES, CIRCULARES OU DE PIZZA


Este grfico construdo com base em um circulo, e empregado sempre que
desejamos ressaltar a participao do dado no total.
O total representado pelo crculo, que fica dividido em tantos setores quantas so as
partes.
Os setores so tais que suas reas so respectivamente proporcionais aos dados da
serie.
Obtemos cada setor por meio de uma regra de trs simples e direta, lembrando que o
total da srie corresponde a 360.
21
www.certificadoonline.net

Ex.: Dada a srie:


Tabela 3.5:
REBANHO SUINO DO SUDESTE
DO BRASIL - 2004
QUANTIDADE
ESTADOS
(mil cabeas)
Minas Gerais
3.363,7
Esprito Santo
430,4
Rio da Janeiro
308,5
So Paulo
2.035,9
6.138,5
Total
FONTE: Fictcia

Temos: 6138,5 360

3363,7 X1

X1 = 197,2 X1 = 197

X2 = 25,2 X2 = 25
X3 = 18,0 X3 = 18
X4 = 119,3 X4 = 119
Com estes dados (valores em graus), marcamos num circulo de raio arbitrrio, com um
transferidor, os arcos correspondentes, obtendo o grfico:
Figura 3.5:
REBANHO SUNO DO SUDESTE
DO BRASIL - 2004

So Paulo
Espirito Santo

Rio de Janeiro
Minas Gerais

Notas:
- O grfico em setores s deve ser empregado quando h, no mximo, sete dados.
- Se a srie j apresenta os dados percentuais, obtemos os respectivos valores em graus multiplicando
o valor percentual por 3,6.

22
www.certificadoonline.net

CAPTULO 4 - DISTRIBUIO DE FREQUNCIA


4.1 - TABELA PRIMITIVA - ROL
Vamos considerar, a forma pela qual podemos descrever os dados estatsticos
resultantes de variveis quantitativas, como o caso de notas obtidas pelos alunos de
uma classe, estaturas de um conjunto de pessoas, salrios recebidos pelos operrios de
uma fbrica etc.
Suponhamos termos feito uma coleta de dados relativos s estaturas de quarenta
alunos, que compem uma amostra dos alunos de um colgio A, resultando a seguinte
tabela de valores:
Tabela 4.1:
ESTATURAS EM cm DE 40 ALUNOS DO COLEGIO A
166
162
155
154

160
161
152
161

161
168
163
156

150
163
160
172

162
156
155
153

160
173
155
157

165
160
169
156

167
155
151
158

164
164
170
158

160
168
164
161

A esse tipo de tabela, cujos elementos no foram numericamente organizados,


denominamos tabela primitiva.
Partindo dos dados acima - tabela primitiva - difcil averiguar em torno de que valor
tendem a se concentrar as estaturas, qual a menor ou qual a maior estatura ou, ainda,
quantos alunos se acham abaixo ou acima de uma dada estatura.
Assim, conhecidos os valores de uma varivel, difcil formarmos uma idia exata do
comportamento do grupo como um todo, a partir dos dados no ordenados.
A maneira mais simples de organizar os dados atravs de uma certa ordenao
(crescente ou decrescente). A tabela obtida aps a ordenao dos dados recebe o nome
de rol.
Tabela 4.2:
ESTATURAS EM cm DE 40 ALUNOS DO COLEGIO A
150
151
152
153

154
155
155
155

155
156
156
156

157
158
158
160

160
160
160
160

161
161
161
161

162
162
163
163

164
164
164
165

166
167
168
168

169
170
172
173

Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual
a maior (173 cm); que a amplitude de variao foi de 173 - 150 = 23 cm; e, ainda, a
ordem que um valor particular da varivel ocupa no conjunto.

23
www.certificadoonline.net

Com um exame mais acurado, vemos que h uma concentrao das estaturas em algum
valor entre 160 cm e 164 cm e, mais ainda, que h poucos valores abaixo de 154 cm e
acima de 170 cm.

4.2 - DISTRIBUIO DE FREQNCIA


No exemplo que trabalhamos, a varivel em questo, estatura, ser observada e
estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna e
colocarmos, ao lado de cada valor, o nmero de vezes que aparece repetido.
Denominamos freqncia o nmero de alunos que fica relacionado a um determinado
valor da varivel. Obtemos, assim, uma tabela que recebe o nome de distribuio de
freqncia:
Tabela 4.3:
ESTAT
(cm)
150
151
152
153
154
155
156
157

FREQ.
1
1
1
1
1
4
3
1

ESTAT
(cm)
158
160
161
162
163
164
165
166

FREQ.
2
5
4
2
2
3
1
1

ESTAT
(cm)
167
168
169
170
172
173

FREQ.
1
2
1
1
1
1

Total

40

Mas o processo dado ainda inconveniente, j que exige muito espao, mesmo
quando o nmero de valores da varivel (n) de tamanho razovel. Sendo possvel, a
soluo mais aceitvel, pela prpria natureza da varivel contnua, o agrupamento dos
valores em vrios intervalos.
Assim, se um dos intervalos for, por exemplo, 154 -157 (154 x < 158 , ou 154
158
), em vez de dizermos que a estatura de 1 aluno de 154 cm; de 4 alunos, 155 cm; de 3
alunos, 156 cm; e de 1 aluno, 157 cm, diremos que 9 alunos tm estaturas entre 154, e
158 cm.
Deste modo, estaremos agrupando os valores da varivel em intervalos, sendo que,
em Estatstica, preferimos chamar os intervalos de classes.
Chamando de freqncia de uma classe o nmero de valores da varivel pertencentes
classe, os dados da Tabela 4.3 podem ser dispostos como na Tabela 4.4, denominada
distribuio de freqncia com intervalos de classe:

24
www.certificadoonline.net

Tabela 4.4:
ESTATURAS DE 40 ALUNOS
DO COLGIO A
ESTATURAS FREQUNCIA
(cm)
150 x < 154
4
154 x < 158
9
158 x < 162
11
162 x < 166
8

166 x < 170


5
170 x < 174
3
40

Total

Ao agruparmos os valores da varivel em classes, ganhamos em simplicidade mas


perdemos em pormenores. Assim, na Tabela 4.3 podemos verificar, facilmente, que
quatro alunos tm 161 cm de altura e que no existe nenhum aluno com 171 cm de altura.
J na Tabela 4.4 no podemos ver se algum aluno tem a estatura de 159 cm. No entanto,
sabemos, com segurana, que onze alunos tm estatura compreendida entre 158 e 162
cm.
O que pretendemos com a construo dessa nova tabela realar o que h de
essencial nos dados e, tambm, tornar possvel o uso de tcnicas analticas para sua total
descrio, at porque a Estatstica tem por finalidade especfica analisar o conjunto de
valores, desinteressando-se por casos isolados.
Notas:
- Se nosso intuito , desde o incio, a obteno de uma distribuio de freqncia com intervalos de
classe, basta, a partir da Tabela 4.1, fazermos uma tabulao, e construir direto a tabela 4.4.
- Quando os dados esto organizados em uma distribuio de freqncia, so comumente
denominados dados agrupados.

4.3 - ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA


4.3.1 - Classe
Classes de freqncia ou, simplesmente, classes so intervalos de variao da
varivel.

As classes so representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k (onde k o


nmero total de classes da distribuio).
Assim, em nosso exemplo, o intervalo 154
158 define a segunda classe (i = 2).
Como a distribuio formada de seis classes, podemos afirmar que k = 6.

25
www.certificadoonline.net

Clculos:
- Para definir o Nmero de Classes: K = n ; sendo: k o nmero de classes e n o
nmero total de dados (ou valores);
- Para definir a Amplitude da Classe: Amplitude Amostral
K ( n de classes)
Obs.: Para efeito didtico, utilizaremos de 4 a 7 intervalos de classe;

4.3.2 - Limites de Classe


Denominamos limites de classe os extremos de cada classe.
O menor nmero o limite inferior da classe ( li ) e o maior nmero, o limite
superior da classe ( Li ).
L2 = 158
Na segunda classe, por exemplo, temos: l2 = 154

4.3.3 - Amplitude de um Intervalo de Classe


Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe a
medida do intervalo que define a classe.

Ela obtida pela diferena entre os limites superior e inferior dessa classe e indicada
por hi. Assim:

h i = L i li

Na distribuio da Tabela 4.4, temos:


hi = L i li h2 = 158 - 154 = 4 cm

4.3.4 - Amplitude Total da Distribuio


Amplitude total da distribuio (AT) a diferena entre o limite superior da ltima
classe (limite superior mximo) e o limite inferior da primeira classe (limite inferior
mnimo):

AT = L(mx.) - l (mn.)
Em nosso exemplo, temos:
AT = 174 - 150 = 24

AT = 24 cm

26
www.certificadoonline.net

4.3.5 - Amplitude Amostral


Amplitude amostral (AA) a diferena entre o valor mximo e o valor mnimo da
amostra:

AA = x(mx.) x(mn.)
Em nosso exemplo, temos:
AA = 173 - 150 = 23 AA = 23 cm
Observe que a amplitude total da distribuio pode ou no coincidir com a amplitude
amostral.

4.3.6 - Ponto Mdio de uma Classe


Ponto mdio de uma classe ( xi ) , como o prprio nome indica, o ponto que divide o
intervalo de classe em duas partes iguais.

Para obtermos o ponto mdio de uma classe, calculamos a semi-soma dos limites da
classe (mdia aritmtica):

xi =

li + L i
2

Assim, o ponto mdio da segunda classe, em nosso exemplo, :


l + Li
154 + 158
xi = i
xi =
= 156 cm
2
2

4.3.7 - Freqncia Simples ou Absoluta


Freqncia simples ou freqncia absoluta ou, simplesmente, freqncia de uma
classe ou de um valor individual o nmero de observaes correspondentes a essa
classe ou a esse valor.

A freqncia simples simbolizada por fi (lemos: f ndice i ou freqncia da classe i).


Assim, em nosso exemplo, temos:
f1 = 4, f2 = 9, f3 = 11, f4 = 8, f5 = 5 e f6 = 3
k

A soma de todas as freqncias representada pelo smbolo de somatrio:

fi
i =1

evidente que:

fi = n
i=1

27
www.certificadoonline.net

fi

Para a distribuio em estudo, temos:

= 40

i=1

fi = 40

No havendo possibilidade de engano, usamos:

Podemos, agora, dar distribuio de freqncia das estaturas dos quarenta alunos
do Colgio A a seguinte representao tabular tcnica:
Tabela 4.5:

ESTATURAS DE 40 ALUNOS
DO COLGIO A
i
1
2
3
4
5
6

ESTATURAS
(cm)
150 x < 154
154 x < 158
158 x < 162
162 x < 166
166 x < 170
170 x < 174

fi

4
9
11
8
5
3
fi = 40

4.4 - TIPOS DE FREQNCIAS


Freqncias simples ou absolutas ( fi ) so os valores que realmente representam o
nmero de dados de cada classe.
Como vimos, a soma das freqncias simples igual ao nmero total dos dados:

fi = n
Freqncias relativas (fri) so os valores das razes entre as freqncias simples e a
freqncia total:

fri =

fi

fi

Logo, a freqncia relativa da terceira classe, em nosso exemplo (Tabela 4.5), :

fr3 =

f3

fi

Evidentemente:

fr3 =

11
= 0,275
40

fri = 1 ou 100%

Nota:
- O propsito das freqncias relativas o de permitir a anlise ou facilitar as comparaes.

28
www.certificadoonline.net

Freqncia acumulada (Fi) o total das freqncias de todos os valores inferiores ao


limite superior do intervalo de uma dada classe:

Fk = f1 + f2 + ..... + fn

Fk = fi ( i = 1, 2, ...., k)

ou

Assim, no exemplo apresentado, a freqncia acumulada correspondente terceira


classe e:
3

F3 = fi = f1 + f2 + f3 F3 = 4 + 9 + 11 F3 = 24
i=1

o que significa existirem 24 alunos com estatura inferior a 162 cm (limite superior do
intervalo da terceira classe).
Freqncia acumulada relativa (Fri) de uma classe a freqncia acumulada da

classe, dividida pela freqncia total da distribuio:

Fri =

Fi

fi

Assim, para a terceira classe, temos:

Fri =

Fi

fi

Fri =

24
= 0,6
40

Considerando a Tabela 4.4, podemos montar a seguinte tabela com as freqncias


estudadas:
Tabela 4.6:

ESTATURAS

fi

xi

fri

Fi

Fri

4
9
11
8
5
3
= 40

152
156
160
164
168
172

0,100
0,225
0,275
0,200
0,125
0,075
= 1,000

4
13
24
32
37
40

0,100
0,325
0,600
0,800
0,925
1,000

(cm)

1
2
3
4
5
6

150 x < 154


154 x < 158
158 x < 162
162 x < 166
166 x < 170
170 x < 174

O conhecimento dos vrios tipos de freqncia ajuda-nos a responder a muitas


questes com relativa facilidade, como as seguintes:
a) Qual a amplitude total da distribuio?
o limite superior da ultima classe 174 cm, menos o limite inferior da 1 classe
150. A Amplitude total 24 cm.

11

b) Quantos alunos tm estatura entre 154 cm, inclusive, e menor que 168 cm?
Esses so os valores da varivel que formam a 2, 3 e 4 classe. Como f2 = 9, f3 =
e f4 = 9 a resposta : 28 alunos.

29
www.certificadoonline.net

c) Qual a percentagem de alunos cujas estaturas so inferiores a 154 cm?


Esses valores so os que formam a primeira classe. Como fr1 = 0,100, obtemos a
resposta multiplicando a freqncia relativa por 100: 0,100 x 100 = 10
Logo, a percentagem de alunos 10%.
d) Quantos alunos tm estatura abaixo de 162 cm?
evidente que as estaturas consideradas so aquelas que formam as classes de
ordem 1, 2 e 3. Assim, o nmero de alunos dado por:
3

f1 + f2 + f3 F3 = fi f3 = 24
i=1

e) Quantos alunos tm estatura igual ou maior que a 158 cm? O nmero de alunos
dado por:
6

fi

= f3 + f4 + f5 + f6 = 11 + 8 + 5 +3 = 27

i=3

4.6 - DISTRIBUIO DE FREQNCIA SEM INTERVALOS DE CLASSE


Quando se trata de varivel discreta de variao relativamente pequena, cada valor
pode ser tomado como um intervalo de classe (intervalo degenerado) e, nesse caso, a
distribuio chamada distribuio sem intervalos de classe, tomando a seguinte
forma:
Tabela 4.7:

xi

fi

x1

f1

x2

f2

x3
.
.
xn

f3
.
.
fn
fi = n

Ex.: Seja x a varivel numero de cmodos das casas ocupadas por vinte famlias
entrevistadas:
Tabela 4.8:
i
1
2
3
4
5
6

xi
2
3
4
5
6
7

fi
4
7
5
2
1
1
= 20

30
www.certificadoonline.net

Tabela 4.9:
i
1
2
3
4
5
6

fi
4
7
5
2
1
1
= 20

xi
2
3
4
5
6
7

fri
0,20
0,35
0,25
0,10
0,05
0,05
= 1,00

Fi
4
11
16
18
19
20

Fri
0,20
0,55
0,80
0,90
0,95
1,00

4.7 - REPRESENTAO GRFICA DE UMA DISTRIBUIO


Uma distribuio de freqncia pode ser representada graficamente pelo histograma,
pelo polgono de freqncia e pelo polgono de freqncia acumulada.
Construmos qualquer um dos grficos mencionados utilizando o primeiro quadrante
do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das
abscissas) colocamos os valores da varivel e na linha vertical (eixo das ordenadas), as
freqncias.

4.7.1 - Histograma
O histograma formado por um conjunto de retngulos justapostos, cujas bases se
localizam sobre o eixo horizontal, de tal modo que seus limites dos intervalos de classe
coincidam com os pontos mdios dos intervalos de classe.
As larguras dos retngulos so iguais s amplitudes dos intervalos de classe.
As alturas dos retngulos devem ser proporcionais s freqncias das classes, sendo
a amplitude dos intervalos igual. Isso nos permite tomar as alturas numericamente iguais
s freqncias.
distribuio da Tabela 4.6 corresponde o seguinte histograma:
Figura 4.1:

fi
12
11
10
9
8
7
6
5
4
3
2
1
0

150

154

158

162

31
www.certificadoonline.net

166

170
174
Intervalo de Classe

Notas:
- O histograma goza de uma propriedade da qual faremos considervel uso: a rea de um histograma
proporcional soma das freqncias.
- No caso de usarmos as freqncias relativas, obtemos um grfico de rea unitria.
- Quando queremos comparar duas distribuies, o ideal faz-lo pelo histograma de freqncias
relativas.

4.7.2 - Polgono de Freqncia


O polgono de freqncia um grfico em linha, sendo as freqncias marcadas
sobre perpendiculares ao eixo horizontal, levantadas pelos pontos mdios dos intervalos
de classe.
Para realmente obtermos um polgono (linha fechada), devemos completar a figura,
ligando os extremos da linha obtida aos pontos mdios da classe anterior primeira e da
posterior ltima, da distribuio.
distribuio da Tabela 4.6 corresponde o seguinte polgono de freqncia:

fi

Figura 4.2:

14
12
10
8
6
4
2
0
144

148

152

156

160

164

168

172

176

180
Xi

4.7.3 - Polgono de freqncia acumulada


O polgono de freqncia acumulada traado marcando-se as freqncias
acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos
correspondentes aos limites superiores dos intervalos de classe.

32
www.certificadoonline.net

Fi

Assim, a distribuio da Tabela 4.6 corresponde o seguinte polgono de freqncia


acumulada:
50
40

Figura 4.3:
30
20
10
0
146

150

154

158

162

166

170

174

Intervalo de Classe

4.8 - A CURVA DE FREQNCIA


4.8.1 - A Curva de Freqncia. Curva Polida
Como, em geral, os dados coletados pertencem a uma amostra extrada de uma
populao, podemos imaginar as amostras tornando-se cada vez mais amplas e a
amplitude das classes ficando cada vez menor, o que nos permite concluir que a linha
poligonal (contorno do polgono de freqncia) tende a se transformar numa curva - a
curva de freqncia - mostrando, de modo mais evidente, a verdadeira natureza da
distribuio da populao.
Podemos dizer, ento, que, enquanto o polgono de freqncia nos d a imagem real
do fenmeno estudado, a curva de freqncia nos d a imagem tendencial.
Assim, aps o traado de um polgono de freqncia, desejvel, muitas vezes, que
se lhe faa um polimento, de modo a mostrar o que seria tal polgono com um nmero
maior de dados.
Esse procedimento, claro, no nos dar uma certeza absoluta de que a curva obtida
- curva polida - seja tal qual a curva resultante de um grande nmero de dados. Porm,
podemos afirmar que ela assemelha-se mais curva de freqncia do que ao polgono de
freqncia obtido de uma amostra limitada.
O polimento, geometricamente, corresponde eliminao dos vrtices da linha
poligonal. Consegue-se isso com o emprego de uma frmula bastante simples, a qual, a
partir das freqncias reais, nos fornece novas freqncias freqncias
calculadas - que se localizaro, como no polgono de freqncia, nos pontos mdios.

33
www.certificadoonline.net

A frmula que nos d a freqncia calculada (fci) :

fc i =

fi1 + 2fi + fi+1


4

onde:
- fci a freqncia calculada da classe considerada;
- fi a freqncia simples da classe considerada;
- fi - 1 a freqncia simples da classe anterior classe considerada;
- fi + 1 a freqncia simples da classe posterior classe considerada.
Quando fazemos uso da curva polida, convm mostrar as freqncias realmente
observadas por meio de pontos ou pequenos crculos, de modo que qualquer interessado
possa, por si mesmo, julgar at que ponto os dados originais foram polidos.

fc 1 =

0 + 2x 4 + 9 17
=
= 4,25
4
4

fc 4 =

11 + 2x8 + 5 32
=
=8
4
4

fc 2 =

4 + 2 x9 + 11 33
=
= 8,25
4
4

fc 5 =

8 + 2 x5 + 3 21
=
= 5,25
4
4

fc 3 =

9 + 2 x11 + 8 39
=
= 9,75
4
4

fc 6 =

5 + 2 x3 + 0 11
=
= 2,75
4
4

Tabela 4.10:

ESTATURAS DE 40 ALUNOS
DO COLGIO A
i
1
2
3
4
5
6

ESTATURAS
(cm)
150 x < 154
154 x < 158
158 x < 162
162 x < 166
166 x < 170
170 x < 174

fi

fci

4
9
11
8
5
3

4,3
8,3
9,8
8,0
5,3
2,8

fi = 40

34
www.certificadoonline.net

fc

Figura 4.4:

12
11
10
9
8
7
6
5
4
3
2
1
0
144 148 152 156 160 164 168 172 176 180
Xi

A representao melhor seria como mostra abaixo:


Figura 4.5:

4.8.2 - As Formas das Curvas de Freqncia


As curvas de freqncia assumem as seguintes formas caractersticas:

4.8.2.1 - Curvas em Forma de Sino


As curvas em forma de sino caracterizam-se pelo fato de apresentarem um valor
mximo na regio central.

35
www.certificadoonline.net

So muitos os fenmenos que oferecem distribuies em forma de sino:


a estatura de adultos, o peso de adultos, a inteligncia medida em testes mentais, os
preos relativos.
Distinguimos a curva em forma de sino simtrica e a assimtrica.
1) - Curva simtrica:
Esta curva caracteriza-se por apresentar o valor mximo no ponto central e os
pontos eqidistantes desse ponto terem a mesma freqncia.

2) - Curva assimtrica:
Na prtica, no encontramos distribuies perfeitamente simtricas. As distribuies
obtidas de medies reais so mais ou menos assimtricas, em relao freqncia
mxima. Assim, as curvas correspondentes a tais distribuies apresentam a cauda de
um lado da ordenada mxima mais longa do que do outro. Se a cauda mais alongada fica
direita, a curva chamada assimtrica positiva ou enviesada direita. Se a cauda se
alonga esquerda, a curva chamada assimtrica negativa ou enviesada esquerda.

4.8.2.2 - Curvas em Forma de Jota


As curvas em forma de jota so relativas a distribuies extremamente assimtricas,
caracterizadas por apresentarem o ponto de ordenada mxima em uma das
extremidades.
So curvas comuns aos fenmenos econmicos e financeiros: distribuio de
vencimentos ou rendas pessoais.

36
www.certificadoonline.net

curva em jota

curva em jota invertido

4.8.2.3 - Curvas em Forma de U


As curvas em forma de U so caracterizadas por apresentarem ordenadas mximas
em ambas as extremidades.
Como exemplo de distribuio que d origem a esse tipo de curva podemos citar a de
mortalidade por idade.

37
www.certificadoonline.net

CAPTULO 5 - MEDIDAS DE POSIO

5.1 - INTRODUO
O estudo que fizemos sobre distribuies de freqncia, at agora, permite-nos
descrever, de modo geral, os grupos dos valores que uma varivel pode assumir. Dessa
forma, podemos localizar a maior concentrao de valores de uma dada distribuio, isto
, se ela se localiza no incio, no meio ou no final, ou, ainda, se h uma distribuio por
igual.
Porm, para ressaltar as tendncias caractersticas de cada distribuio, isoladamente,
ou em confronto com outras, necessitamos introduzir conceitos que se expressem atravs
de nmeros, que nos permitam traduzir essas tendncias.
As medidas de posio - estatsticas que representam uma srie de dados
orientando-nos quanto posio da distribuio em relao ao eixo horizontal (eixo das
abscissas).
As medidas de posio mais importantes so as medidas de tendncia central, que
recebem tal denominao pelo fato de os dados observados tenderem, em geral, a se
agrupar em torno dos valores centrais. Dentre as medidas de tendncia central,
destacamos:
a) a mdia aritmtica;
b) a moda;
c) a mediana.

5.2 - MEDIA ARITMTICA ( X )


Em um conjunto de dados, podemos definir vrios tipos de mdias. Porm, em nossos
estudos iremos nos limitar mais importante: a mdia aritmtica.
Mdia aritmtica o quociente da diviso da varivel pelo nmero deles:

X=

x1 + x 2 + x 3 + ... + x n
n

ou

sendo:
x a mdia aritmtica;
xi os valores da varivel;
n o numero de valores.

38
www.certificadoonline.net

x=

xi
n

5.2.1 - Dados No-agrupados


Quando desejamos conhecer a mdia dos dados dos dados no-agrupados,
determinamos a mdia aritmtica simples.
Exemplo:
Sabendo-se que a produo leiteira diria da vaca A, durante uma semana, foi de 10,
14, 13, 15, 16, 18 e 12 litros, temos, para produo mdia da semana:

x=

10 + 14 + 13 + 15 + 16 + 18 + 12 98
=
= 14
7
7

logo: x = 14 litros

As vezes, a mdia pode ser um nmero diferente de todos os da srie de dados que
ela representa. o que acontece quando temos os valores 1, 4, 8 e 11, para os quais a
mdia 6. Esse ser o nmero representativo dessa srie de valores, embora no esteja
representado nos dados originais. Neste caso, costumamos dizer que a mdia no tem
existncia concreta.

5.2.2 - Desvio em Relao Mdia


Denominamos desvio em relao mdia a diferena entre cada elemento de um
conjunto de valores e a mdia aritmtica.

di = x i x

Designando o desvio por di, temos:


Para o exemplo dado, temos:
d1 = x 1 x d1 = 10 - 14 = - 4

d5 = x 5 x d5 = 16 - 14 = 2

d 2 = x 2 x d2 = 14 - 14 = 0

d 6 = x 6 x d6 = 18 - 14 = 4

d3 = x 3 x d3 = 13 - 14 = - 1

d 7 = x 7 x d7 = 12 - 14 = - 2

d 4 = x 4 x d4 = 15 - 14 = 1

5.2.4 - Dados Agrupados


5.2.4.1 - Sem Intervalos de Classe
Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando para
varivel o nmero de filhos do sexo masculino:

39
www.certificadoonline.net

Tabela 5.1:

N de

fi

Meninos

0
1
2
3
4

2
6
10
12
4
= 34

Neste caso, como as freqncias so nmeros indicadores da intensidade de cada


valor da varivel, elas funcionam como fatores de ponderao, o que nos leva a calcular a
mdia aritmtica ponderada, dada pela frmula:
X=

x1 * f1 + x 2 * f 2 + x 3 * f3 + ... + x n * fn
f1 + f2 + f3 + ... + fn

ou

x=

x i fi
fi

O modo mais prtico de obteno da mdia ponderada abrir, na tabela, uma coluna
correspondente aos produtos xifi:
Tabela 5.2:
N de
Meninos

0
1
2
3
4

Temos, ento:

Logo: x =

x i fi
fi

fi
2
6
10
12
4
= 34

x ifi

0
6
20
36
16
= 78

xifi = 78 e fi = 34

x=

78
= 2,29 x = 2,3 ;
34

isto : x = 2,3 meninos;

Nota:
- Sendo x uma varivel discreta, como interpretar o resultado obtido, 2 meninos e 3 dcimos de menino?

40
www.certificadoonline.net

5.2.4.2 - Com Intervalos de Classe


Neste caso, convencionamos que todos os valores includos em um determinado
intervalo de classe coincidem com o seu ponto mdio, e determinamos a mdia aritmtica
ponderada por meio da frmula:

x=

x i fi
fi

onde xi o ponto mdio da classe.


Consideremos a distribuio:

Tabela 5.3:
i
1
2
3
4
5
6

ESTATURAS
(cm)

150 x < 154


154 x < 158
158 x < 162
162 x < 166
166 x < 170
170 x < 174

fi

4
9
11
8
5
3
= 40

Pela mesma razo do caso anterior, vamos, inicialmente, abrir uma coluna para os
pontos mdios e outra para os produtos xifi:
Tabela 5.4:
i
1
2
3
4
5
6

ESTATURAS
(cm)
150 x < 154
154 x < 158
158 x < 162
162 x < 166
166 x < 170
170 x < 174

fi

xi

fixi

4
9
11
8
5
3

152
156
160
164
168
172

608
1404
1760
1312
840
516

= 40

= 6440

41
www.certificadoonline.net

Como, neste caso: xifi = 6440 e fi = 40


Logo: x =

x i fi
fi

x=

6440
= 161 ;
40

isto : x = 161 cm;

5.2.5 - Emprego da Mdia


A mdia utilizada quando:
a) desejamos obter a medida de posio que possui a maior estabilidade;
b) houver necessidade de um tratamento algbrico ulterior.

5.3 - A Moda (Mo)


Denominamos moda o valor que ocorre com maior freqncia em uma srie de
valores.
Desse modo, o salrio modal dos empregados de uma indstria o salrio mais
comum, isto , o salrio recebido pelo maior nmero de empregados dessa indstria.

5.3.1 - Dados No-agrupados


Quando lidamos com valores no-agrupados, a moda facilmente reconhecida: basta,
de acordo com a definio, procurar o valor que mais se repete.
A srie de dados:
7, 8, 9, 10, 10, 10, 11, 12, 13, 15
tem moda igual a 10.
Podemos, entretanto, encontrar sries nas quais no exista valor modal, isto , nas
quais nenhum valor aparea mais vezes que outros. E o caso da srie:
3, 5, 8, 10, 12, 13,
que no apresenta moda (amodal).
Em outros casos, ao contrrio, pode haver dois ou mais valores de concentrao.
Dizemos, ento, que a srie tem dois ou mais valores modais. Na srie:
2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9
temos duas modas: 4 e 7 (bimodal).

42
www.certificadoonline.net

5.3.2 - Dados Agrupados


5.3.2.1 - Sem Intervalos de Classe
Um vez agrupados os dados, possvel determinar imediatamente a moda: basta fixar
o valor da varivel de maior freqncia.
Na distribuio abaixo, freqncia mxima (12) corresponde o valor 3 da varivel.
Logo: Mo = 3
N de

fi

Meninos

0
1
2
3
4

2
6
10
12
4
= 34

---------

5.3.2.2 - Com intervalos de Classe


A classe que apresenta a maior freqncia denominada classe modal. Pela
definio, podemos afirmar que a moda, neste caso, o valor dominante que est
compreendido entre os limites da classe modal.
O mtodo mais simples para o clculo da moda consiste em tomar o ponto mdio da
classe modal.
Damos a esse valor a denominao de moda bruta.
Temos, ento:

Mo =

l * +L *
2

onde:
- l* o limite inferior da classe modal;
- L* o limite superior da classe modal.
Assim, para a distribuio:
Tabela 5.5:

i
1
2
3
4
5
6

ESTATURAS
(cm)
150 x < 154
154 x < 158
158 x < 162
162 x < 166
166 x < 170
170 x < 174

fi

4
9
11
8
5
3
= 40

43
www.certificadoonline.net

-------

temos que a classe modal i = 3, l* = 158 e L* = 162.


Como:

Mo =

l * +L *
158 + 162 320
Mo =
=
= 160 ; Logo Mo = 160 cm;
2
2
2

5.3.3 - Emprego da Moda


A moda utilizada:
- quando desejamos obter uma medida rpida e aproximada de posio;
- quando a medida de posio deve ser o valor mais tpico da distribuio.

5.4 - A MEDIANA (Md)


A mediana outra medida de posio definida como o nmero que se encontra no
centro de uma srie de nmeros, estando estes dispostos segundo uma ordem. Em
outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem
de grandeza, o valor situado de tal forma no conjunto que o separa em dois
subconjuntos de mesmo nmero de elementos.

5.4.1 - Dados No-agrupados


Dada uma srie de valores, como, por exemplo:
5, 13, 10, 2, 18, 15, 6, 16, 9,
de acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao
(crescente ou decrescente) dos valores:
2, 5, 6, 9, 10, 13, 15, 16, 18
Em seguida, tomamos aquele valor central que apresenta o mesmo nmero de
elementos direita e esquerda. Em nosso exemplo, esse valor o 10, j que, nessa
srie, h quatro elementos acima dele e quatro abaixo.
Temos, ento: Md = 10
Se, porm, a srie dada tiver um nmero par de termos, a mediana ser, por definio,
qualquer dos nmeros compreendidos entre os dois valores centrais da srie.
Convencionou-se utilizar o ponto mdio.
Assim, a srie de valores:
2, 6, 7, 10, 12, 13, 18, 21

44
www.certificadoonline.net

tem para mediana a mdia aritmtica entre 10 e 12.


Logo: Md =

10 + 12 22
=
= 11 ;
2
2

donde: Md = 11

Verificamos que, estando ordenados os valores de uma srie e sendo n o nmero de


elementos da srie, o valor mediano ser:

n +1
, se n for mpar;
2
n
n
e + 1, se n for par.
- a mdia aritmtica dos termos de ordem
2
2
- o termo de ordem

Podemos comprovar tal fato nas sries dadas:


- para n = 9, temos ,

9 +1
= 5 . Logo, a mediana o 5 termo da srie, isto : Md =
2

10

8
8
=4 e
+ 1 = 5 . Logo, a mediana a mdia aritmtica do
2
2
10 + 12 22
4 e do 5 termos da serie, isto : Md =
=
= 11 . Logo: Md = 11
2
2
- para n = 8, temos ,

Notas:
- O valor da mediana pode coincidir ou no com um elemento da srie, como vimos. Quando o nmero de
elementos da srie mpar, h coincidncia. O mesmo no acontece, porm, quando esse nmero par.
- A mediana e a mdia aritmtica no tm, necessariamente, o mesmo valor. Na primeira srie
apresentada, por exemplo, temos: x = 10,4 e Md = 10
- A mediana, como vimos, depende da posio e no dos valores dos elementos na srie ordenada. Essa
uma das diferenas marcantes entre a mediana e a mdia (que se deixa influenciar, e muito, pelos valores
extremos). Esta propriedade da mediana pode ser constatada atravs dos exemplos a seguir:
5, 7, 10, 13, 15

x = 10 e Md = 10
x = 20 e Md = 10

5, 7, 10, 13, 65
isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos valores
extremos, ao passo que a mediana permanece a mesma.
- A mediana designada, muitas vezes, por valor mediano.

5.4.2 - Dados Agrupados


Se os dados se agrupam em uma distribuio de freqncia, o clculo da mediana se
processa de modo muito semelhante quele dos dados no-agrupados, implicando,
porm, a determinao prvia das freqncias acumuladas. Ainda aqui, temos que
determinar um valor tal que divida a distribuio em dois grupos que contenham o mesmo
nmero de elementos.

45
www.certificadoonline.net

Para o caso de uma distribuio, porm, a ordem, a partir de qualquer um dos


extremos, dada por:

fi

Md =

5.4.2.1 - Sem Intervalos de Classe


Neste caso, o bastante identificar a freqncia acumulada imediatamente superior
metade da soma das freqncias. A mediana ser aquele valor da varivel que
corresponde a tal freqncia acumulada.
Tomemos a distribuio relativa Tabela 5.1, completando-a com a coluna
correspondente freqncia acumulada:
Tabela 5.6:

N DE

fi

Fi

MENINOS

0
1
2
3
4

Sendo:

fi
2

2
6
10
12
4
= 34

2
8
18
30
34

34
= 17
2

a menor freqncia acumulada que supera esse valor 18, que corresponde ao valor 2
da varivel, sendo este o valor mediano. Logo: Md = 2 meninos
Obs.: No caso de coincidir o valor da mediana exatamente igual a uma freqncia

acumulada (Fi ), tal que :

Fi =

fi
2

. A Mediana dada por: Md =

X i + (X i.+.1 )
2

Isto , a Mediana ser dada pela mdia aritmtica entre o valor da


varivel correspondente a essa freqncia acumulada e a seguinte.
Ex.: Tabela 5.7:
xi

fi

Fi

1
3
4
7
9
10

2
4
6
8
3
1

2
6
12
20
23
24

= 24

46
www.certificadoonline.net

Md =

fi
2

Md =

24
Md = 12, coincidiu com freqncia F3 .
2

Logo, a mediana dada por:

Md =

X i + (X i.+.1 )
2

Md =

4+7
2

Md =

11
Md = 5,5
2

5.4.2.2 - Com Intervalos de Classe


Neste caso, o problema consiste em determinar o ponto do intervalo em que est
compreendida a mediana.
Para tanto, temos inicialmente que determinar a classe na qual se acha a mediana classe mediana. Tal classe ser, evidentemente, aquela correspondente freqncia
acumulada imediatamente superior a

fi .
2

Feito isto, um problema de interpolao resolve a questo, admitindo-se, agora, que os


valores se distribuam uniformemente em todo o intervalo de classe.
Assim, considerando a distribuio da Tabela 5.3, acrescida das freqncias
acumuladas:

Tabela 5.8:

i
1
2
3
4
5
6

ESTATURAS
(cm)
150 x < 154
154 x < 158
158 x < 162
162 x < 166
166 x < 170
170 x < 174

fi

Fi

4
9
11
8
5
3

4
13
24
32
37
40

------- Classe Mediana

= 40

Temos:

fi
2

40
= 20
2

Como h 24 valores includos nas trs primeiras


pretendemos determinar o valor que ocupa o 20 lugar,
que este deve estar localizado na terceira classe (i =
dessas classes estejam uniformemente distribudas.
Como h 11 elementos nessa classe e o intervalo
tomar, a partir do limite inferior, a distancia:

47
www.certificadoonline.net

classes da distribuio e como


a partir do incio da srie, vemos
3), supondo que as freqncias
de classe igual a 4, devemos

20 13
7
x4 =
x4
11
11
e a mediana ser dada por:
Md = 158 +

7
28
x 4 = 158 +
= 158 + 2,55 = 160,55
11
11

Logo: Md = 160,55 cm;


Na pratica, executamos os seguintes passos:
1 - Determinamos as freqncias acumuladas;
2 - Calculamos

fi ;
2

3 - Marcamos a classe correspondente freqncia acumulada imediatamente


superior

fi
2

- classe mediana - e, em seguida, empregamos a frmula:

fi

F(ant ).h *

Md = l * +
f*
na qual:
- l* o limite inferior da classe mediana;
- F (ant) a freqncia acumulada da classe anterior classe mediana;
- f* a freqncia simples da classe mediana;
- h* a amplitude do intervalo da classe mediana;
Encontrando a Classe Mediana baseado-se na tabela 5.8:

Md = 158 +

[20 13].4
11

Md = 158 +

7.4
11

Md = 158 +

Md = 160,55

48
www.certificadoonline.net

28
Md = 158 + 2,55
11

Obs.:
No caso de coincidir o valor da mediana exatamente igual a uma freqncia acumulada
(Fi ), tal que : Fi =

fi
2

. A Mediana ser o limite superior da classe correspondente.

Ex.: Tabela 5.9:


i

ESTATURAS
(cm)
0 x < 10
10 x < 20
20 x < 30
30 x < 40
40 x < 50
50 x < 60

1
2
3
4
5
6

fi

Fi

1
3
9
7
4
2

1
4
13
20
24
26

----- Classe Mediana

= 26

Temos:

fi
2

Logo: Md = L*

26
= 13, coincidiu com a freqncia acumulada F3 .
2
Md = 30

5.4.3 - Emprego da Mediana


Empregamos a mediana quando:
a) desejamos obter o ponto que divide a distribuio em partes iguais;
b) h valores extremos que afetam de uma maneira acentuada a mdia;
c) a varivel em estudo salrio.

49
www.certificadoonline.net

CAPTULO 6 - MEDIDAS DE DISPERSO

6.1 - DISPERSO OU VARIABILIDADE


Vimos anteriormente que um conjunto de valores pode ser convenientemente
sintetizado, por meio de procedimentos matemticos, em poucos valores representativos mdia aritmtica, mediana e moda. Tais valores podem servir de comparao para dar
a posio de qualquer elemento do conjunto.
No entanto, quando se trata de interpretar dados estatsticos, mesmo aqueles j
convenientemente simplificados, necessrio ter-se uma idia retrospectiva de como se
apresentavam esses mesmos dados nas tabelas.
Assim, no o bastante dar uma das medidas de posio para caracterizar
perfeitamente um conjunto de valores, pois, mesmo sabendo, por exemplo, que a
temperatura mdia de duas cidades a mesma, e igual a 24C, ainda assim somos
levados a pensar a respeito do clima dessas cidades. Em uma delas poder a
temperatura variar entre limites de muito calor e de muito frio e haver, ainda, uma
temperatura mdia de 24C. A outra poder ter uma variao pequena de temperatura e
possuir, portanto, no que se refere temperatura, um clima mais favorvel.
Vemos, ento, que a mdia - ainda que considerada como um nmero que tem a
faculdade de representar uma srie de valores - no pode, por si mesma, destacar o grau
de homogeneidade ou heterogeneidade que existe entre os valores que compem o
conjunto.
Consideremos os seguintes conjuntos de valores das variveis x, y e z:
X: 70, 70, 70, 70, 70.
Y: 68, 69, 70, 71, 72.
Z: 5, 15, 50, 120, 160.
Calculando a mdia aritmtica de cada um desses conjuntos, obtemos:

x=

xi

n
yi
y=
n
zi
z=
n

350
= 70
5
350
y=
= 70
5
350
z=
= 70
5
x=

Vemos, ento, que os trs conjuntos apresentam a mesma mdia aritmtica: 70.
Entretanto, fcil notar que o conjunto X mais homogneo que os conjuntos Y e Z,
j que todos os valores so iguais mdia.
O conjunto Y, por sua vez, mais homogneo que o conjunto Z, pois h menor
diversificao entre cada um de seus valores e a mdia representativa.

50
www.certificadoonline.net

Chamando de disperso ou variabilidade a maior ou menor diversificao dos valores


de uma varivel em torno de um valor de tendncia central tomado como ponto de
comparao, podemos dizer que o conjunto X apresenta disperso ou variabilidade nula
e que o conjunto Y apresenta uma disperso ou variabilidade menor que o conjunto Z.
Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior ou
menor disperso ou variabilidade entre esses valores e a sua medida de posio, a
Estatstica recorre s medidas de disperso ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, a varincia, o desvio padro e o
coeficiente de variao.

6. 2 - AMPLITUDE TOTAL
6.2.1 - Dados No-agrupados
A amplitude total a diferena entre o maior e o menor valor observado:
AT = x(mx.) - x(min.)
Exemplo:
Para os valores: 40, 45, 48, 52, 54, 62 e 70
temos: AT = 70 - 40 = 30
Logo: AT = 30
Quando dizemos que a amplitude total dos valores 30, estamos afirmando alguma
coisa do grau de sua concentrao. evidente que, quanto maior a amplitude total, maior
a disperso ou variabilidade dos valores da varivel.
Relativamente aos trs conjuntos de valores mencionados no incio deste captulo,
temos:
ATx = 70 - 70 = 0, (disperso nula)
ATy = 72 - 68 = 4
ATz = 160 - 5 =155

6.2.2 - Dados Agrupados


6.2.2.1 - Sem Intervalos de Classe
AT = x(mx.) x(mn.)

Neste caso, ainda temos:


Exemplo:
Considerando a tabela abaixo:
Tabela 6.1:

xi

fi

12

51
www.certificadoonline.net

Temos: AT = 4 - 0 = 4
Logo: AT = 4

6.2.2.2 - Com Intervalos de Classe


Neste caso, a amplitude total a diferena entre o limite superior da ltima classe e o
limite inferior da primeira classe:
AT = L(mx.) - l (mn.)
Exemplo:
Considerando a distribuio abaixo:
Tabela 6.2:
i
1
2
3
4
5
6

ESTATURAS
(cm)
150 x < 154
154 x < 158
158 x < 162
162 x < 166
166 x < 170
170 x < 174

fi

4
9
11
8
5
3
= 40

temos: AT = 174 - 150 = 24;


Logo: AT = 24
A amplitude total tem o inconveniente de s levar em conta os dois valores extremos
da srie, descuidando do conjunto de valores intermedirios, o que quase sempre invalida
a idoneidade do resultado. Ela apenas uma indicao aproximada da disperso ou
variabilidade.
Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura
em um dia ou no ano, no controle de qualidade ou como uma medida de clculo rpido, e
quando a compreenso popular mais importante que a exatido e a estabilidade.

6.3 - VARINCIA - DESVIO PADRO


6.3.1 - Introduo
Como vimos, a amplitude total instvel, por se deixar influenciar pelos valores
extremos, que so, na sua maioria, devidos ao acaso.

52
www.certificadoonline.net

A VARINCIA E O DESVIO PADRO so medidas que fogem a essa falha, pois


levam em considerao a totalidade dos valores da varivel em estudo, o que faz delas
ndices de variabilidade bastante estveis e, por isso mesmo, os mais geralmente
empregados.
A varincia baseia-se nos desvios em torno da mdia aritmtica, porm determinando
a mdia aritmtica dos quadrados dos desvios. Assim, representando a varincia por
s2, temos:

( x i x )2

=
fi

Ou, lembrando que fi = n

( x i x)2

=
n

Nota:
- Quando nosso interesse no se restringe descrio dos dados mas, partindo da amostra, visamos
tirar inferncias vlidas para a respectiva populao, convm efetuar uma modificao, que consiste em
usar o divisor n - 1 em lugar de n. Ficando assim a frmula: s 2 =

( x i x )2
n 1

Podemos, ainda, com o intuito de conservar a definio, calcular a varincia usando o divisor n e, em
seguida, multiplicar o resultado por:

n
n 1

Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero em
unidade quadrada em relao varivel em questo, o que, sob o ponto de vista prtico,
um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretao
prticas, denominada desvio padro, definida como a raiz quadrada da varincia e
representada por s:

Assim:

s=

s = s2 .

( x i x)2
n

(1)

Nota:
- Em algumas calculadores cientificas o smbolo s representado por (sigma).
- Tanto o desvio padro como a varincia so usados como medidas de disperso ou variabilidade. O
uso de uma ou de outra depender da finalidade que se tenha em vista.
- A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extremamente
importante na inferncia estatstica e em combinaes de amostras.

Se bem que a frmula dada para o clculo do desvio seja a que torna mais fcil a sua
compreenso, ela no uma boa frmula para fins de computao, pois, em geral, a
mdia aritmtica ( x ) um nmero fracionrio, o que torna pouco prtico o clculo das
quantidades
(xi - x )2 .

53
www.certificadoonline.net

Podemos simplificar os clculos fazendo uso da igualdade:

(xi x)

= x
2
i

( x i )2
n

Assim, substituindo (xi - x )2 por seu equivalente em (1), obtemos:

s=

2
i

( x i )2

que pode ser escrita do seguinte modo:

s=

x i2
n

xi

(2)

No apenas este mtodo. usualmente mais prtico, como tambm mais preciso.
Quando a mdia no exata e tem de ser arredondada, cada desvio fica afetado
ligeiramente do erro, devido a esse arredondamento. O mesmo menos exatos do que
quando a frmula (2) usada.

6.3.2 - Dados No-agrupados


Tomemos, como exemplo, o conjunto de valores da varivel x :
40, 45, 48, 52, 54, 62, 70
O modo mais prtico para se obter o desvio padro formar uma tabela com duas
colunas: uma para x i e outra para x i2 . Assim:
Tabela 6.3:

xi

40
45
48
52
54
62
70
= 371

xi
1600
2025
2304
2704
2916
3844
4900
= 20293

Como n = 7, temos:

54
www.certificadoonline.net

s=

x i2
n

xi


n
2

s=

20293 371
2

= 2899 53 = 2899 2809 = 90 = 9,486


7
7

Logo: s = 9,49

6.3.3 - Dados Agrupados


6.3.3.1 - Sem Intervalos de Classe
Como, neste caso, temos a presena de freqncias, devemos lev-las em
considerao, resultando a frmula:

s=

x i2
n

xi

Consideremos, como exemplo, a distribuio da tabela 6.1.


O modo mais pratico para se obter o desvio padro abrir, na tabela dada, uma
coluna para os produtos fixi e outra para fi x i2 , lembrando que para obter fi x i2 basta
multiplicar cada fixi pelo seu respectivo xi . Assim:
Tabela 6.4:

Logo:

s=

N Meninos Familias

fi x i2
fi

xi

fi

0
1
2
3
4

2
6
12
7
3
= 30

fi x i

f
i

fixi
0
6
24
21
12
= 63

xi
0
1
4
9
16
=30

165 63
s=
= 5,5 4,41 = 1,09 = 1,044
30 30
Da: s = 1,04

55
www.certificadoonline.net

fixi
0
6
48
63
48
= 165

6.3.3.2 - Com Intervalos de Classe


Tomemos como exemplo a distribuio da Tabela 6.2.
Comeamos por abrir as colunas para xi (ponto mdio), para fixi e para fi x i2 . Assim:
Tabela 6.5:

ESTATURAS
(cm)
150 x < 154
154 x < 158
158 x < 162
162 x < 166
166 x < 170
170 x < 174

1
2
3
4
5
6

fi

xi

4
9
11
8
5
3

152
156
160
164
168
172

= 40

Logo:

fi x i2
fi

s=

fi x i

f
i

fixi
608
1404
1760
1312
840
516
= 6440

xi

fixi

23104
24336
25600
26896
28224
29584

92416
219024
281600
215168
141120
88752

= 157744

= 1038080

1038080 6440
s=

= 25952 25921 = 31 = 5,567


40
40
Da: s = 5,57

6.4 - COEFICIENTE DE VARIAO


O desvio padro por si s no nos diz muita coisa. Assim, um desvio padro de duas
unidades pode ser considerado pequeno para uma srie de valores cujo valor mdio
200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm disso, o fato
de o desvio padro ser expresso na mesma unidade dos dados limita o seu emprego
quando desejamos comparar duas ou mais sries de valores, relativamente sua
disperso ou variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou
variabilidade dos dados em termos relativos a seu valor mdio, medida essa denominada
coeficiente de variao (CV):

CV =

s
x 100
x

56
www.certificadoonline.net

Para a distribuio da Tabela 7.5, onde:


- a mdia: x =

x i fi
fi

x=

6440
= 161
40

Temos ento: a Mdia de x = 161 cm e o Desvio Padro de s = 5,57 cm, ficando:


CV =

5,57
x 100 = 0,03459 x 100 = 3,459%
161

Da: CV = 3,5%
Exemplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de
indivduos:

ESTATURAS
PESOS

Mdia

175 cm

5,0 cm

68 kg

2,0 Kg

Temos:

5
x 100 = 0,0285 x 100 = 2,85%
175
2
x 100 = 0,0294 x 100 = 2,94%
CVP =
68
CVE =

Logo, nesse grupo de indivduos, os pesos apresentam maior grau de disperso que
as estaturas.
Nota:
- Se bem que, para qualificar a disperso de uma distribuio, seja mais proveitoso o coeficiente de
variao, no devemos deduzir da que a varincia e o desvio padro caream de utilidade. Pelo contrrio,
so medidas muito teis no tratamento de assuntos relativos inferncia estatstica, como j dissemos.

57
www.certificadoonline.net

CAPTULO 7 - CORRELAO E REGRESSO

7.1 - INTRODUO
Nos captulos anteriores, nossa preocupao era descrever a distribuio de valores
de uma nica varivel. Com esse objetivo, aprendemos a calcular medidas de tendncia
central e variabilidade.
Quando, porm, consideramos observaes de duas ou mais variveis, surge um novo
problema: as relaes que podem existir entre as variveis estudadas. Nesse caso, as
medidas estudadas no so eficientes.
Assim, quando consideramos variveis como peso e altura de um grupo de pessoas,
uso do cigarro e incidncia do cncer, vocabulrio e compreenso da leitura, dominncia
e submisso, procuramos verificar se existe alguma relao entre as variveis de cada
um dos pares e qual o grau dessa relao. Para isso, necessrio o conhecimento de
novas medidas.
Sendo a relao entre as variveis de natureza quantitativa, a correlao o
instrumento adequado para descobrir e medir essa relao.
Uma vez caracterizada a relao, procuramos descrev-la atravs de uma funo
matemtica. A regresso o instrumento adequado para a determinao dos parmetros
dessa funo.
Nota:
- Ficaremos restritos s relaes entre duas variveis (correlao simples).

7.2 - CORRELAO
7.2.1 - Relao Funcional e Relao Estatstica
Como sabemos, o permetro e o lado de um quadrado esto relacionados. A relao
que os liga perfeitamente definida e pode ser expressa por meio de uma sentena
matemtica: p = 4l , onde p o permetro e l o lado.
Atribuindo-se, ento, um valor qualquer a l, possvel determinar exatamente o valor
de p.
Consideremos, agora, a relao que existe entre o peso e a estatura de um grupo de
pessoas. E evidente que essa relao no do mesmo tipo da anterior; ela bem menos
precisa. Assim, pode acontecer que a estaturas diferentes correspondam pesos iguais ou
que a estaturas iguais correspondam pesos diferentes. Porm, em mdia, quanto maior a
estatura, maior o peso.
As relaes do tipo permetro-lado so conhecidas como relaes funcionais e as do
tipo peso-estatura, como relaes estatsticas.

58
www.certificadoonline.net

Quando duas variveis esto ligadas por uma relao estatstica, dizemos que existe
correlao entre elas.

7.2.2 - Diagrama de Disperso


Consideremos uma amostra aleatria, formada por dez dos 98 alunos de uma classe
da faculdade A e pelas notas obtidas por eles em Matemtica e Estatstica:
Tabela 7.1:

NOTAS

MATEMTICA

ESTATSTICA

xi

yi

5
8
7
10
6
7
9
3
8
2

6
9
9
10
5
7
8
4
6
2

1
8
24
38
44
58
59
72
80
92

Representando, em um sistema coordenado cartesiano ortogonal, os pares ordenados


(xi., yi), obtemos uma nuvem de pontos que denominamos diagrama de disperso. Esse
diagrama nos fornece uma idia grosseira, porm til, da correlao existente:
10
9
8
7

Estatstica

Figura 7.1:

6
5
4
3
2
1
0
0

59
www.certificadoonline.net

8
9
10
Matemtica

7.2.3 - Correlao Linear


Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal. Podemos
imaginar que, quanto mais fina for a elipse, mais ela se aproximar de uma reta. Dizemos,
ento, que a correlao de forma elptica tem como imagem uma reta, sendo, por isso,
denominada correlao linear.
possvel verificar que a cada correlao est associada como imagem uma relao
funcional. Por esse motivo, as relaes funcionais so chamadas relaes perfeitas.
Figura 7.2:

Estatstica

10
9

Reta Imagem

8
7
6
5
4
3
2
1
0
0

10

Matem tica

Como a correlao em estudo tem como imagem uma reta ascendente, ela
chamada correlao linear positiva.
Assim, uma correlao :
a) linear positiva se os pontos do diagrama tm como imagem uma reta
ascendente;
b) linear negativa se os pontos tm como imagem uma reta descendente;
c) no-linear se os pontos tm como imagem uma curva. Se os pontos
apresentam-se dispersos, no oferecendo uma imagem definida, conclumos que no h
relao alguma entre as variveis em estudo. Temos, ento:

60
www.certificadoonline.net

7.2.4 - Coeficiente de Correlao Linear


O instrumento empregado para a medida da correlao linear o coeficiente de
correlao. Esse coeficiente deve indicar o grau de intensidade da correlao entre duas
variveis e, ainda, o sentido dessa correlao (positivo ou negativo).
Faremos uso do coeficiente de correlao de Pearson, que dado por:

r=

n x i y i ( x i )( y i )
[n x i2 ( x i ) 2 ][n y i2 ( y i ) 2 ]

onde n o nmero de observaes.


Os valores limites de r so - l e +1, isto , o valor de r pertence ao intervalo [- 1, + 1].
Assim:
a) se a correlao entre duas variveis perfeita e positiva, ento r = +1;
b) se a correlao perfeita e negativa, ento r = - 1;
c) se no h correlao entre as variveis, ento r = 0.

61
www.certificadoonline.net

Logicamente:
a) se r = +1, h uma correlao perfeita e positiva entre as variveis;
b) se r = - 1, h uma correlao perfeita e negativa entre as variveis;
c) se r = 0, ou no h correlao entre as variveis, ou a relao que porventura
exista no linear.
Notas:
- Para que uma relao possa ser descrita por meio do coeficiente de correlao de Pearson
imprescindvel que ela se aproxime de uma funo linear. Uma maneira prtica de verificarmos a
linearidade da relao a inspeo do diagrama de disperso: se a elipse apresenta salincias ou
reentrncias muito acentuadas, provavelmente trata-se de correlao curvilnea.

Para podermos tirar algumas concluses significativas sobre o comportamento


simultneo das variveis analisadas, necessrio que: 0,6 | r | 1
Se 0,3 | r |< 0,6, h uma correlao relativamente fraca entre as variveis.
Se 0 < | r |< 0,3, a correlao muito fraca e, praticamente, nada podemos concluir
sobre a relao entre as variveis em estudo.
Vamos, ento, calcular o coeficiente de correlao relativo Tabela 7.1. O modo mais
prtico para obtermos r abrir, na tabela, colunas correspondentes aos valores de xiyi ,
x i2 e y i2 . Assim:

Tabela 7.2:

MATEMTICA

ESTATSTICA

xi

yi

5
8
7
10
6
7
9
3
8
2
= 65

6
9
9
10
5
7
8
4
6
2

xiyi
30
72
63
100
30
49
72
12
48
4

xi
25
64
49
100
36
49
81
9
64
4

yi
36
81
81
100
25
49
64
16
36
4

= 66

=480

= 481

= 492

Logo:

62
www.certificadoonline.net

r=
r=

n x i y i ( x i )( y i )

[n x ( x i ) ][n y ( y i ) ]
2
i

2
i

10x 480 65x 66


[10x 481 (65) 2 ][(10x 492 (66) 2 ]

r=

4800 4290
=
( 4810 4225)( 4920 4356

510
510
=
= 0,888
585x564 574,40

Ento: r = 0,89
resultado que indica uma correlao linear positiva altamente significativa entre as duas
variveis.

7.3 - REGRESSO
7.3.1 - Ajustamento da Reta
Sempre que desejamos estudar determinada varivel em funo de outra, fazemos
uma anlise de regresso.
Podemos dizer que a anlise de regresso tem por objetivo descrever, atravs de um
modelo matemtico, a relao entre duas variveis, partindo de n observaes das
mesmas.
A varivel sobre a qual desejamos fazer uma estimativa recebe o nome de varivel
dependente e a outra recebe o nome de varivel independente.
Assim, supondo X a varivel independente e Y a dependente, vamos procurar
determinar o ajustamento de uma reta relao entre essas variveis, ou seja, vamos
obter uma funo definida por:
Y = aX + b
,
onde a e b so os parmetros.
Sejam duas variveis X e Y, entre as quais exista uma correlao acentuada, embora
no perfeita, como, por exemplo, as que formam a Tabela 9.2.
Ento, temos:
Tabela 7.3:
xi

10

yi

10

cujo diagrama de disperso dado por:

63
www.certificadoonline.net

Figura 7.3:
Y Estatstica

10
9
8
7
6
5
4
3
2
1
0
0

10

X Matem tica

Podemos concluir, pela forma do diagrama, que se trata de uma correlao retilnea,
Y
de modo a permitir o ajustamento de uma reta, imagem da funo definida por:

= aX + b
Vamos, ento, calcular os valores dos parmetros a (coeficiente angular) e b (coeficiente
linear) com a ajuda das frmulas:

a=

n x i y i x i y i

n x i2 ( x i ) 2

onde:
- n o nmero de observaes;

- x a mdia dos valores de xi x =


- y a mdia dos valores de yi

y =

b = y ax

x i ;

n
y i .
n

Nota:
- Como estamos fazendo uso de uma amostra para obtermos os valores dos parmetros, o resultado,
na realidade, uma estimativa da verdadeira equao de regresso. sendo assim, escrevemos:

Y = aX + b
Onde

o Y estimado.

64
www.certificadoonline.net

Formamos, ento, a tabela de valores:


Tabela 7.4:

5
8
7
10
6
7
9
3
8
2

6
9
9
10
5
7
8
4
6
2

xiyi
30
72
63
100
30
49
72
12
48
4

= 65

= 66

=480

xi
n = 10

yi

xi
25
64
49
100
36
49
81
9
64
4
2

= 481

Temos, assim:

a=

n x i y i x i y i
n x ( x i )
2
i

Como: x =

x i

x=

vem: b = y a x

a=

65
= 6,5
10

10 x 480 65x66 4800 4290 510


=
=
= 0,8718
4810 4225 585
10x 481 (65) 2

y =

y i

y=

66
= 6,6 ;
10

b = 6,6 - 0,8718 x 6,5 = 6,6 - 5,6667 = 0,9333 ;

donde: a = 0,87 e b = 0,93 .


Logo: Y = aX + b

y = 0,87X + 0,93

Figura 7.4:

Y Estatstica

Para traarmos a reta no grfico, basta determinar dois de seus pontos:


X = 0 y = (0,87 x 0) + 0,93 = 0,93
X = 5 y = (0,87 x 5) + 0,93 = 5,28
assim, temos:
10
9
8
7

Y = 0,87 X + 0,93

5,28 5
4
3
2

0,93 1

0
0

65
www.certificadoonline.net

10

X Matem tica

7.3.2 - Interpolao e Extrapolao


Voltando tabela 7.1, vemos que 4,0 no figura entre as notas de Matemtica. Entretanto, podemos estimar a nota correspondente em Estatstica fazendo X = 4,0 na equao:
y= 0,87X + 0,93
Assim: X = 4 y = 0,87 x 4 + 0,93 = 4,41
O mesmo acontece com a nota 1,0. Repetindo o procedimento, temos:
X = 1 y = 0,87 x 1 + 0,93 = 1,80
Como 4 [2, 10], dizemos que foi feita uma interpolao; e como 1[2,10], dizemos
que foi feita uma extrapolao.
Nota:
- Uma norma fundamental no uso de equaes de regresso a de nunca extrapolar, exceto quando
consideraes tericas ou experimentais demonstrem a possibilidade de extrapolao.

66
www.certificadoonline.net

CAPTULO 8 - PROBABILIDADE

8.1 - INTRODUO
Embora o clculo das probabilidades pertena ao campo da Matemtica, sua incluso
neste contedo programtico, se justifica pelo fato de a maioria dos fenmenos de que
trata a Estatstica ser de natureza aleatria ou probabilstica. Conseqentemente, o
conhecimento dos aspectos fundamentais do clculo de probabilidades uma
necessidade essencial para o estudo da Estatstica Indutiva ou Inferencial.
Procuramos resumir aqui os conhecimentos que julgamos necessrios para termos um
ponto de apoio em nossos primeiros passos no caminho da Estatstica Inferencial.

8.2 - EXPERIMENTO ALEATRIO


Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim, da afirmao
provvel que o meu time ganhe a partida de hoje pode resultar:
a) que, apesar do favoritismo, ele perca;
b) que, como pensamos, ele ganhe;
c) que empate.
Como vimos, o resultado final depende do acaso. Fenmenos como esse so
chamados fenmenos aleatrios ou experimentos aleatrios.
Experimentos ou fenmenos aleatrios so aqueles que, mesmo repetidos vrias
vezes sob condies semelhantes, apresentam resultados imprevisveis.

8.3 - ESPAO AMOSTRAL


A cada experimento correspondem, em geral, vrios resultados possveis. Assim, ao
lanarmos uma moeda, h dois resultados possveis: ocorrer cara ou ocorrer coroa. J
ao lanarmos um dado h seis resultados possveis: 1, 2, 3, 4, 5 ou 6.
Ao conjunto desses resultados possveis damos o nome de espao amostral ou
conjunto universo, representado por S.
Os dois experimentos citados anteriormente tm os seguintes espaos amostrais:
- lanamento de uma moeda: S = {Ca, Co};
- lanamento de um dado: S = {1, 2, 3, 4, 5, 6}.

67
www.certificadoonline.net

Do mesmo modo, como em dois lanamentos sucessivos de uma moeda podemos


obter cara nos dois lanamentos, ou cara no primeiro e coroa no segundo, ou coroa no
primeiro e cara no segundo, ou coroa nos dois lanamentos, o espao amostral :
S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)}.
Cada um dos elementos de S que corresponde a um resultado recebe o nome de
ponto amostral. Assim:
2 S 2 um ponto amostral de S.

8.4 - EVENTOS
Chamamos de evento qualquer subconjunto do espao amostral S de um experimento
aleatrio.
Assim, qualquer que seja E, se E S (E est contido em S), ento E um evento de
S.

Se E = S, E chamado evento certo.


Se E S e E um conjunto unitrio, E chamado evento elementar.
Se E = , E chamado evento impossvel.
Exemplo:
No lanamento de um dado, onde S = {1, 2, 3, 4, 5, 6}, temos:
A = {2, 4, 6} S; logo, A um evento de S.
B = {1, 2, 3, 4, 5, 6} S; logo, B um evento certo de S (B = S).
C = {4} S; logo, C um evento elementar de S.
D = S; logo, D um evento impossvel de S.
Um evento sempre definido por uma sentena. Assim, os eventos acima podem ser
definidos pelas sentenas:
Obter um nmero par na face superior.
Obter um nmero menor ou igual a 6 na face superior.
Obter o nmero 4 na face superior.
Obter um nmero maior que 6 na face superior.

8.5 - PROBABILIDADE
Dado um experimento aleatrio, sendo S o seu espao amostral, vamos admitir que
todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S um
conjunto equiprovvel.
Chamamos de probabilidade de um evento A (A S) o nmero real P(A), tal que:

68
www.certificadoonline.net

P( A ) =

n( A )
n(S)

Onde:
- n(A) o nmero de elementos de A;
- n(S) o nmero de elementos de S.
Exemplos:
a) Considerando o lanamento de uma moeda e o evento A obter cara, temos:
S = {Ca, Co} n(S) = 2
A = {Ca} n(A) = 1
Logo: P( A ) =

1
2

O resultado acima nos permite afirmar que, ao lanarmos uma moeda equilibrada, temos
50% de chance de que aparea cara na face superior.
b) Considerando o lanamento de um dado, vamos calcular:
- a probabilidade do evento A obter um nmero par na face superior.
Temos:
S = {1, 2, 3, 4, 5, 6} = n(S) = 6
A = {2, 4, 6} n(A) = 3
Logo:

P( A ) =

3 1
=
6 2

- a probabilidade do evento B obter um nmero menor ou igual a 6 na face superior.


Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
B = {1, 2, 3, 4, 5, 6} n(B) = 6
Logo:

P(B) =

6
=1
6

- a probabilidade do evento C obter um nmero 4 na face superior.


Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
C = {4} n(C) = 1

Logo:

P(C) =

1
6

- a probabilidade do evento D obter um nmero maior que 6 na face superior.


Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6

69
www.certificadoonline.net

D = n(D) = O
Logo:

P(D) =

0
=0
6

Pelos exemplos que acabamos de v, podemos concluir que, sendo n(S) = n:


a) a probabilidade do evento certo igual a 1: P(S) = 1
b) a probabilidade do evento impossvel igual a zero: P() = 0
c) a probabilidade de um evento E qualquer (E S) um nmero real P(E), tal que:
0 P(E) 1
d) a probabilidade de um evento elementar E qualquer , lembrando que n(E) = 1:

P(E) =

1
n

8.6 - EVENTOS COMPLEMENTARES


Sabemos que um evento pode ocorrer ou no. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele no ocorra (insucesso), para um mesmo
evento existe sempre a relao:
p + q =1 q = 1 - p
Assim, se a probabilidade de se realizar um evento p =
ele no ocorra e:

q = 1 - p q = 1

1
, a probabilidade de que
5

1 4
=
5 5

Sabemos que a probabilidade de tirar o 4 no lanamento de um dado p =


a probabilidade de no tirar o 4 no lanamento de um dado : q = 1

1
. Logo,
6

1 5
=
6 6

8.7 - EVENTOS INDEPENDENTES


Dizemos que dois eventos so independentes quando a realizao ou a norealizao de um dos eventos no afeta a probabilidade da realizao do outro e viceversa.
Por exemplo, quando lanamos dois dados, o resultado obtido em um deles independe
do resultado obtido no outro.

70
www.certificadoonline.net

Se dois eventos so independentes, a probabilidade de que eles se realizem


simultaneamente igual ao produto das probabilidades de realizao dos dois eventos.
Assim, sendo p1 a probabilidade de realizao do primeiro evento e p2 a probabilidade
de realizao do segundo evento, a probabilidade de que tais eventos se realizem
simultaneamente dada por:
p = p1 x p2
Exemplo:
Lanamos dois dados. A probabilidade de obtermos 1 no primeiro dado :

p2 =

A probabilidade de obtermos 5 no segundo dado :

p1 =

1
6

1
6

Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro e 5 no segundo :

p=

1
1 1
x
=
6
6 36

8.8 - PERMUTAES
Como se observa, o calculo da probabilidade de um evento reduz-se a um problema
de contagem. Assim que a Anlise Combinatria tem fundamental importncia para se
contar o nmero de casos favorveis e o total de casos. Uma parte dos problemas tratados em nosso estudo, a combinao a tcnica que pode ser aplicada.

8.8.1 - Permutaes que a Ordem no Importa


A combinao de n elementos tomados (combinados) calculado por:

n(a ).!
n.! (n(a ) n).!

p =

Nos casos de:


- evento independente;
- sem reposio.
Ex.: Quantas combinaes de 3 pessoas podem-se formar com um grupo de 15 pessoas?

n(a ).!
n.! (n(a ) n).!

R.

p =

p =

15.!
3.! (15 3).!

p =

15.14.13.12!
3.2.1.12!

p =

455

71
www.certificadoonline.net

15.14.13
3.2.1

p =

2730
p =
6

8.8.2 - Permutaes que a Ordem Importa


As permutaes com repetio (ou distinguveis): alguns itens so idnticos, e a ordem
importante
A combinao de n elementos tomados (combinados) calculado por: p =

n.!
(n1.!)(n 2 .!)...(nk .!)
Ex.: Quantas combinaes distintas de 3 letras podemos formar com as seguintes letras:
QQQTTTTPP?
R. H 9 letras: 3 Qs, 4 Ts e 2 Ps. Usando a frmula: p =
p =

9.!
3!. 4!. 2!

p =

9.8.7.6.5.4!
3.2.1.4!. 2.1

p =

15120
12

n.!
(n1.!)(n 2 .!)...(nk .!)

p = 1260 combinaes poss-

veis.

8.9 - EVENTOS MUTUAMENTE EXCLUSIVOS


Dizemos que dois ou mais eventos so mutuamente exclusivos quando a
realizao de um exclui a realizao do(s) outro(s).
Assim, no lanamento de uma moeda, o evento tirar cara e o evento tirar coroa so
mutuamente exclusivos, j que, ao se realizar um deles, o outro no se realiza.
Se dois eventos so mutuamente exclusivos, a probabilidade de que um ou outro se
p = p1 +
realize igual soma das probabilidades de que cada um deles se realize:
p2
Exemplo:
Lanamos um dado. A probabilidade de se tirar o 3 ou o 5 :

p=

1 1 2 1
+ = = ,
6 6 6 3

pois, como vimos, os dois eventos so mutuamente exclusivos.

8.9.1 - Teorema de Bayes


Seja A1 , A2 , A3 , .... An , n eventos mutuamente exclusivos e An = S . sejam P (Ai) as
probabilidades conhecidas dos vrios eventos e B um evento qualquer de S tal que so
conhecidas todas as probabilidades condicionais P( B / Ai ) .
Ento, para cada i, tem-se:

P(A i / B ) =

P(A i ) * P(B / A i )
P(A 1 ) * P(B / A 1 ) + P(A 2 ) * P(B / A 2 ) + .... + P(A n ) * P(B / A n )
72
www.certificadoonline.net

A soma das probabilidades 1: p1 + p2 + ... + pn = 1


Ex.: Admitindo a seguinte configurao:
Urnas
Cores
Azuis
Pretas
Brancas

2
1
6

2
3
1

1
2
3

Escolheu-se uma urna ao acaso e dela extraiu-se uma bola ao acaso, verificando-se que
a bola preta. Qual a probabilidade da bola ter vindo da 1 urna? e da 2 urna?
R. Total de bolas: 21 bolas (5 azul, 6 preta e 10 branca);
Bolas por urna: 1 = 9; 2 = 6 e 3 = 6.
Pu1 =

1
1
1
; Pu2 = ; Pu3 = ;
3
3
3

probabilidade da bola preta por urna:

P(pr / u1 ) =

1
3 1
2 1
; P(pr / u2 ) = =
; P(pr / u3 ) = = ;
9
6
2
6 3

deseja-se calcular P(1/pr) e P(2/pr).


Aplicando-se o teorema de Bayes, tem-se:

P(u1 / pr ) =

P(u1) * P(pr / u1)


P(u1) * P(pr / u1) + P(u2 ) * P(pr / u2 ) + P(u3) * P(pr / u3)

1 1
*
3
9

P(u1 / pr ) =
1 1 1 1 1 1
* + * + *
3 9 3 2 3 3
P(u1 / pr ) =

1
27
P(u1 / pr ) =
P(u1 / pr ) =
1 1 1
+ +
27 6 9

1
27
17
54

54
P(u1/pr) = 0,11765 P(u1/pr) = 11,77%
459

ou seja, a probabilidade inicialmente de u1 era

1
, 33,3%. Dada a informao que saiu
3

uma bola preta, a probabilidade da u1 passou a ser 11,77%.

P(u2 / pr ) =

P(u2 ) * P(pr / u2 )
P(u1) * P(pr / u1) + P(u2 ) * P(pr / u2 ) + P(u3) * P(pr / u3)

1 1
*
3
2

P(u2 / pr ) =
1 1 1 1 1 1
* + * + *
3 9 3 2 3 3

1
6
P(u2 / pr ) =
P(u2 / pr ) =
1 1 1
+ +
27 6 9

73
www.certificadoonline.net

1
6
17
54

P(u2 / pr ) =

54
P(u2/pr) = 0,52941 P(u2/pr) = 52,94%
102

ou seja, a probabilidade inicialmente de u2 era

1
, 50,0%. Dada a informao que saiu
2

uma bola preta, a probabilidade da u2 passou a ser 52,94%.


Se necessitarmos calcular a probabilidade de a bola preta sair da 3 urna, pode-se
fazer por:
P(u1/pr) + P(u2/pr) + P(u3/pr) = 1
Tem-se que: P(u3/pr) = 1 - (P(u1/pr) + P(u2/pr) )
P(u3/pr) = 1 - (0,11765 + 0,52941) P(u3/pr) = 1 - (0,64706)
P(u3/pr) = 0,35294 P(u3/pr) = 35,29%

9 - ANEXOS

74
www.certificadoonline.net

ANEXO - 1

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

5
2
9
9
8
2
5
7
5
1
5
0
2
0
4
5
7
6
8
8
0
6
9
4
9
3
6
0
4
7
2
7
0
0
6

7
8
2
0
0
2
6
9
3
8
3
3
7
5
0
4
1
1
2
9
0
2
4
4
7
9
0
3
1
7
8
4
0
5
2

7
8
5
3
9
0
2
4
9
9
0
5
0
2
3
6
5
0
5
9
9
4
2
8
3
1
7
1
2
5
6
2
2
4
6

2
0
9
8
1
1
4
4
9
2
8
8
7
1
6
0
1
2
5
8
9
1
7
9
0
6
8
9
8
4
3
4
4
1
9

0
5
1
1
1
7
1
9
6
8
5
8
8
0
1
2
6
0
9
5
8
5
9
2
7
5
1
2
5
9
4
4
0
4
8

0
3
8
2
6
0
0
2
6
7
8
0
1
8
3
5
3
1
3
4
4
0
0
9
6
8
1
3
2
8
1
8
3
7
4

3
5
5
9
9
3
0
6
4
3
9
2
8
5
2
2
4
8
1
1
8
7
6
2
9
0
0
4
6
5
6
8
3
6
9

9
1
2
1
4
1
4
2
5
5
6
9
8
9
7
8
0
1
3
4
4
8
9
8
5
4
3
7
7
0
1
5
7
9
7

8
5
8
7
6
3
3
0
0
8
6
2
6
0
8
8
7
7
4
2
1
2
2
8
3
4
2
6
5
3
9
4
9
6
9

4
9
7
4
7
2
0
2
8
8
3
8
5
1
4
5
6
3
6
1
4
0
4
4
3
4
6
2
6
9
1
0
6
9
7

Nota: 0 - 10

8
0
3
3
5
9
2
9
8
5
0
7
6
0
3
8
7
9
3
7
6
4
6
3
2
8
6
8
2
2
6
1
4
4
4

4
9
0
0
8
6
0
6
9
5
5
6
9
6
0
8
1
2
0
4
7
8
8
6
1
0
7
9
5
5
4
2
6
5
7

4
9
4
1
6
9
4
8
7
0
6
8
4
2
8
2
1
6
9
1
9
0
0
2
1
1
5
5
3
3
2
3
6
3
2

1
3
8
9
0
1
6
6
8
5
1
9
9
2
2
0
1
0
5
3
5
5
9
8
0
5
0
7
9
7
4
3
8
6
3

7
9
8
7
8
9
2
6
5
2
2
5
9
2
3
0
7
6
2
5
1
8
9
2
5
5
3
7
5
4
8
5
7
1
6

9
8
6
5
2
2
9
4
0
1
5
1
8
4
3
0
3
6
6
7
3
8
2
5
4
9
4
7
9
2
3
9
5
6
6

00 - 100

6
8
9
8
0
7
9
3
7
3
7
1
0
9
3
1
7
7
5
6
7
4
1
1
2
5
0
9
9
5
8
6
0
7
5

7
7
7
9
6
5
0
0
7
6
0
8
0
8
6
0
3
3
5
8
7
3
1
5
6
9
9
1
6
2
1
7
5
1
1

7
5
4
0
6
4
5
0
5
5
2
2
2
9
3
5
5
5
0
1
5
5
8
8
9
8
6
3
6
9
3
5
3
1
5

1
8
8
7
6
0
3
0
3
1
2
4
8
1
9
9
2
8
6
9
8
2
6
2
5
3
1
3
5
7
7
0
2
8
6

4
7
3
5
9
1
5
9
3
3
5
8
0
8
6
6
3
5
9
8
9
9
0
8
6
9
3
8
5
1
3
1
4
9
1

0
0
5
0
0
6
3
4
7
9
0
8
4
1
9
1
7
3
6
6
0
8
7
7
6
0
1
8
1
0
4
4
2
5
3

2
2
2
6
4
5
1
5
2
2
4
8
7
1
4
0
3
3
1
2
1
0
6
7
6
9
3
4
3
0
4
9
1
5
0

000 - 1000

1
7
5
4
7
4
1
6
5
8
1
9
0
7
2
5
1
4
7
8
4
3
3
4
5
5
0
7
6
3
8
8
6
1
8

1
7
1
1
5
2
0
6
7
5
2
4
5
5
0
3
6
4
6
6
5
1
8
1
5
5
2
6
9
5
8
1
6
9
6

3
1
8
5
6
9
5
9
7
0
8
6
1
5
5
6
0
2
5
0
0
9
3
8
2
4
0
0
0
6
3
4
3
7
9

9
7
8
5
1
7
8
3
4
1
9
4
3
4
5
6
4
6
9
8
7
9
1
9
0
6
7
5
3
0
2
2
3
2
1

7
7
8
9
8
2
4
0
1
4
6
7
0
4
8
1
5
8
1
9
9
3
9
7
4
6
6
9
2
4
7
6
3
2
1

5
1
7
7
4
7
4
2
2
6
6
4
0
6
6
3
8
2
7
4
4
9
3
2
9
8
9
3
2
9
9
4
2
0
5

etc.

75
www.certificadoonline.net

6
7
4
1
6
4
1
0
7
6
2
8
1
6
4
3
8
6
2
7
2
2
2
5
9
1
3
7
2
2
6
2
8
4
2

4
0
0
8
4
9
2
5
6
8
6
5
4
1
6
7
9
3
3
3
7
0
9
7
3
8
6
5
3
8
3
7
9
1
7

9
6
3
8
5
9
1
9
2
5
6
9
7
6
1
2
2
8
9
3
3
3
9
6
6
4
6
4
9
1
8
9
7
3
5

8
3
6
1
1
0
6
8
3
7
4
1
1
0
1
0
7
3
7
1
6
0
5
1
5
3
3
3
3
6
7
7
2
2
5

6
2
2
3
1
0
4
7
8
9
3
9
8
7
2
1
3
4
9
5
3
4
1
0
8
9
0
9
3
6
1
9
6
3
9

5
0
9
7
1
9
7
8
0
3
6
2
9
7
3
0
4
0
9
2
3
9
1
6
4
6
8
4
0
8
6
1
3
9
2

4
2
8
4
2
5
9
7
2
0
3
9
7
3
3
1
3
3
6
6
1
7
5
3
8
0
3
8
5
6
9
3
6
6
6

0
7
3
9
3
9
1
3
2
1
0
8
3
0
8
1
7
2
1
2
0
2
5
2
0
8
5
7
2
7
7
5
4
5
8

8
8
8
5
5
7
9
5
3
9
6
7
3
7
9
9
1
7
2
8
6
5
5
6
3
5
1
7
2
0
3
2
7
8
6

9
6
5
3
3
6
7
4
5
7
6
0
2
6
2
0
2
4
4
7
6
8
7
7
0
3
0
6
9
0
0
8
2
6
8

3
2
8
0
2
1
6
4
7
9
3
3
1
6
7
1
8
4
9
7
0
4
1
6
8
8
9
7
9
1
6
9
7
0
1

2
1
6
5
4
0
2
2
6
7
0
1
8
1
8
6
0
9
5
4
4
9
0
0
9
8
3
4
0
4
7
6
7
0
8

9
6
5
2
5
0
9
2
2
2
1
0
5
0
9
1
4
6
2
5
3
5
9
2
3
8
3
9
3
8
7
9
3
3
0

6
7
8
7
5
9
5
5
0
6
3
3
8
1
5
1
9
0
8
3
4
9
2
2
6
6
8
8
3
8
5
7
6
6
4

8
4
6
8
0
8
1
0
1
6
2
3
2
2
2
0
8
4
0
8
0
5
7
6
3
6
3
5
9
9
0
8
5
9
3

7
6
4
3
4
2
6
9
4
6
7
9
4
3
6
5
0
4
6
4
1
0
0
7
5
3
6
3
9
5
2
8
3
4
0

4
9
2
0
1
4
2
7
1
4
9
9
5
1
6
1
9
6
3
8
2
3
2
4
8
3
4
8
7
5
5
0
8
8
0

5
6
4
1
1
3
6
7
6
3
8
6
4
7
7
2
0
6
2
0
5
6
6
5
1
3
7
4
9
8
6
4
3
7
9

4
5
1
1
3
0
0
8
0
1
5
7
3
8
1
0
2
5
6
8
5
3
7
3
7
5
6
3
6
2
4
4
4
9
8

8
1
0
7
4
0
6
1
3
4
2
1
2
5
9
9
4
9
9
0
0
3
0
2
9
6
0
9
9
1
6
7
4
8
9

3
7
3
5
3
7
6
9
5
5
2
2
4
8
3
1
8
3
9
8
4
1
0
8
6
9
5
1
9
0
0
1
6
3
2

10 - BIBLIOGRAFIA

BARBETTA, Pedro Albnerto. Estatstica aplicada s cincias sociais. 4. ed.


Florianpolis: UFSC, 2001. 338 p.
CRESPO, Antnio Arnot. Estatstica fcil. 18. ed. So Paulo: Saraiva, 2002. 223 p.
DOWNING, Douglas; CLARK, Jeffrey. Estatstica Aplicada. 2. ed. So Paulo: Saraiva,
2003. 351 p.
FARIAS, Alfredo Alves de; CSAR, Cibele Comini et al.. Introduo estatstica. 2. ed.
Rio de Janeiro: LTC, 2002. 340 p.
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de Estatstica. 7. ed.
So Paulo: Atlas, 1996. 326 p.
GATTI, Bernardete A.; FERES, Nagib Lima. Estatstica bsica para cincias humanas.
So Paulo: Alfa-Omega, 1977. 163 p.
LEVIN, Jack. Estatstica aplicada a cincias humanas. 2. ed. So Paulo: Harbra, 1987.
392 p.
MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princpios de Estatstica. 4. ed. So
Paulo: Atlas, 1990. 255 p.
MORETTIN, Luiz Gonzaga. Estatstica bsica - probabilidade. 7. ed. So Paulo:
Makron Books, 1999. 210 p.
STEVENSON, Willian J.. Estatstica aplicada administrao. So Paulo: Harbra,
2001. 495 p.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatstica aplicada. 2. ed. So Paulo:
Atlas, 1985. 459 p.

76
www.certificadoonline.net