P. 1
Apostila de Estatística Básica

Apostila de Estatística Básica

|Views: 13.781|Likes:
Publicado porIsmael Teixeira
Apostila de Estatística Básica para cursos de ensino médio e técnico em contabilidade.
Apostila de Estatística Básica para cursos de ensino médio e técnico em contabilidade.

More info:

Categories:Types, Resumes & CVs
Published by: Ismael Teixeira on Aug 03, 2010
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

03/10/2014

pdf

text

original

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 1
ESTATÍSTICA BÁSICA


Podemos dividi-la em duas: Estatística
descritiva, que apenas descreve e analisa um
conjunto de dados, sem tirar conclusões; e
Estatística indutiva ou Inferência Estatística,
que trata das inferências e conclusões, isto é,
a partir da análise de dados são tiradas
conclusões.

MÉTODO CIENTÍFICO

Método científico é um conjunto de
meios dispostos convenientemente para se
chegar a um fim que se deseja.

Dos métodos científicos, vamos destacar o
método experimental e o estatístico.

Método Experimental

O Método experimental consiste em
manter constante todas as causas (fatores),
menos uma, e variar esta causa de modo que o
pesquisador possa descobrir seus efeitos, caso
existam. É o método preferido no estudo da
Física, da Química etc.

Método Estatístico

Muitas vezes temos necessidade de
descobrir fatos em um campo em que o
método experimental não se aplica (nas
ciências sociais), já que os vários fatores que
afetam o fenômeno em estudo não podem
permanecer constantes enquanto fazemos
variar a causa que, naquele momento, nos
interessa.
Nesses casos, lançamos mão do método
estatístico.
O método estatístico, diante da
impossibilidade de manter as causas
constantes, admite todas essas causas
presentes variando-as, registrando essas
variações e procurando determinar, no
resultado final, que influências cabem a cada
uma delas.

Fases do Método Estatístico

Podemos distinguir no método estatístico
as seguintes fases:

1. Planejamento

Consiste em determinar quais são os dados
a serem levantados e como estes serão
levantados, fazendo uma análise de material e
custos necessários durante a pesquisa.

2. Coleta de dados

Após cuidadoso planejamento, damos
início à coleta de dados.
A coleta pode ser direta e indireta.
A coleta é direta quando os dados são
coletados diretamente na fonte. A coleta direta
de dados pode ser classificada relativamente ao
fator tempo em;
a. contínua (registro) – quando feita
continuamente, tal como a de
nascimentos e óbitos e a de freqüência
dos alunos às aulas;
b. periódica - quando feita em intervalos
constantes de tempo, como os censos (de
10 em 10 anos) e as avaliações mensais
dos alunos;
c. ocasional – quando feita
extemporaneamente, a fim de atender a
uma conjuntura ou a uma emergência,
como no caso de epidemias que assolam
ou dizimam rebanhos inteiros.

A coleta pode ser indireta quando os
dados são levantados em órgãos que já tenham
efetuado a pesquisa de campo. Como exemplo,
podemos citar a pesquisa sobre a mortalidade
infantil, que é feita através de dados colhidos
por uma coleta direta.

3. Crítica dos dados

Obtidos os dados, eles devem ser
cuidadosamente criticados, à procura de
possíveis falhas e imperfeições, a fim de não
incorrermos em erros grosseiros ou de certo
A Estatística é a parte da
Matemática Aplicada que trata dos
métodos científicos para coleta,
organização, resumo, apresentação e
análise de dados.
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 2
vulto, que possam influir sensivelmente nos
resultados.

4. Apuração dos dados

É a soma e o processamento dos dados
obtidos e a disposição mediante critérios de
classificação.

5. Exposição ou apresentação dos dados
Por mais diversa que seja a finalidade que
se tenha em vista, os dados devem ser
apresentados sob forma adequada (tabelas ou
gráficos), tornando mais fácil o exame
daquilo que está sendo objeto de tratamento
estatístico.

6. Análise dos resultados

É o objetivo último da Estatística que
consiste em tirar conclusões sobre o todo
(população) a partir de informações
fornecidas por parte representativa do todo
(amostra).Assim, fazemos uma análise dos
resultados obtidos e tiramos desses resultados
conclusões e previsões.

7. Conclusão

Significado matemático da pesquisa,
podendo apresentar comentários e críticas aos
resultados.

Exercícios:

1) Defina Estatística e exemplifique a sua
utilização.

2) Defina método científico.

3) Cite e explique detalhadamente as fases do
método estatístico.

POPULAÇÃO E AMOSTRA

Variáveis

A cada fenômeno corresponde um número
de resultados possíveis. Assim, por exemplo:
- para o fenômeno “sexo”são dois os
resultados possíveis: sexo masculino e
sexo feminino;
- para o fenômeno “número de filhos”há um
número de resultados possíveis expresso
através dos números naturais: 0, 1, 2, 3,
...,n;
- para o fenômeno “estatura”temos uma
situação diferente, pois os resultados
podem tomar um número infinito de
valores numéricos dentro de um
determinado intervalo.

Variável é, convencionalmente, o conjunto
de resultados possíveis de um fenômeno.

Os exemplos nos dizem que uma variável
pode ser:

a. qualitativa – quando seus valores são
expressos por atributos: sexo (masculino-
feminino), cor da pele (branca, preta,
amarela, vermelha, parda) etc.;
b. quantitativa – quando seus valores são
expressos em números (salários dos
operários, idade dos alunos de uma escola
etc.). Uma variável quantitativa que pode
assumir, teoricamente, qualquer valor
entre dois limites recebe o nome de
variável contínua (exemplos: peso dos
alunos de uma escola) ; uma variável que
só pode assumir valores pertencentes a um
conjunto enumerável recebe o nome de
variável discreta ( exemplos: número de
alunos de uma escola).
De modo geral, as medições dão origem a
variáveis contínuas e as contagens ou
enumerações, a variáveis discretas.

Exercícios:

1) Classifique as variáveis em qualitativas ou
quantitativas (contínuas ou descontínuas):

a) Universo: alunos de uma escola.
Variável: cor dos cabelos –
b) Universo: casais residentes em uma cidade.
Variável: número de filhos –
c) Universo: as jogadas de um dado.
Variável: o ponto obtido em cada jogada –
d)Universo: peças produzidas por certa
máquina.
Variável: número de peças produzidas por
hora
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 3
e) Universo: peças produzidas por certa
máquina
Variável: diâmetro externo –

2) Diga quais das variáveis abaixo são
discretas e quais são contínuas:

a) População: alunos de uma cidade.
Variável: cor dos olhos.
b) P.: estação meteorológica de uma cidade.
V.: precipitação pluviométrica, durante um
ano.
c) P.: Bolsa de Valores de São Paulo.
V.: número de ações negociadas.
d) P.: pregos produzidos por uma máquina.
V.: comprimento.
e) P.: casais residentes em uma cidade.
V.: sexo dos filhos.
f) P.: bibliotecas da cidade de São Paulo.
V.: número de volumes.

3) Como se separa as variáveis em discretas e
contínuas? Dê pelo menos, três exemplos
de cada tipo de variáveis.


População

Ao conjunto de entes portadores de, pelo
menos, uma característica comum
denominamos população estatística ou
universo estatístico.
Assim, os estudantes, por exemplo,
constituem uma população, pois apresentam
pelo menos uma característica comum: são os
que estudam.

Amostra

Na maioria das vezes, por impossibilidade
ou inviabilidade econômica ou temporal,
limitamos as observações referentes a uma
determinada pesquisa a apenas uma parte da
população. A essa parte proveniente da
população em estudo denominamos amostra.
Uma amostra é um subconjunto finito de
uma população.
Para as inferências serem corretas, é
necessário garantir que a amostra seja
representativa da população, isto é, a amostra
deve possuir as mesmas características
básicas da população, no que diz respeito ao
fenômeno que desejamos pesquisar. É preciso,
pois, que a amostra ou as amostras que vão ser
usadas sejam obtidas por processos adequados.

Amostragem

Consiste em uma técnica especial para
recolher amostras, que garante, tanto quanto
possível, o acaso na escolha.
Dessa forma, cada elemento da população
passa a ter a mesma chance de ser escolhido, o
que garante à amostra o caráter de
representatividade, e isto é muito importante,
pois nossas conclusões relativas à população
vão estar baseadas nos resultados obtidos nas
amostras dessa população.
Principais técnicas de amostragem:

1- Amostragem casual ou aleatória simples

Este tipo de amostragem é equivalente a
um sorteio lotérico.
Na prática, a amostragem casual ou
aleatória simples pode ser realizada
numerando-se a população de 1 a n e
sorteando-se, a seguir, por meio de um
dispositivo aleatório qualquer, k números dessa
seqüência, os quais corresponderão aos
elementos pertencentes à amostra.
Exemplo:
Vamos obter uma amostra representativa
para a pesquisa da estatura de noventa alunos
de uma escola:
a. Numeramos os alunos de 01 a 90.
b. Escrevemos os números, de 01 a 90, em
pedaços iguais de um mesmo papel,
colocando-os dentro de uma caixa.
Agitamos sempre a caixa para misturar
bem os pedaços de papel e retiramos,
um a um, nove números que formarão a
amostra. Neste caso, 10% da
população.
Quando o número de elementos da amostra
é grande, esse tipo de sorteio torna-se muito
trabalhoso. A fim de facilita-lo, foi elaborada
uma tabela – Tabela de Números Aleatórios -
, construída de modo que os dez algarismos (0
a 9) são distribuídos ao acaso nas linhas e
colunas (Anexo I)
Para obtermos os elementos da amostra
usando a tabela, sorteamos um algarismo
qualquer da mesma, a partir do qual iremos
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 4
considerar números de dois, três ou mais
algarismos, conforme nossa necessidade. Os
números assim obtidos irão indicar os
elementos da amostra.
A leitura da tabela pode ser feita
horizontalmente (da direita para a esquerda
ou vice-versa), verticalmente ( de cima para
baixo ou vice-versa), diagonalmente (no
sentido ascendente ou descendente) ou
formando desenhos de uma letra qualquer. A
opção, porém, deve ser feita antes de iniciado
o processo.

2 – Amostragem proporcional estratificada

Muitas vezes a população se divide em
subpopulações – estratos.
Como é provável que a variável em estudo
apresente, de estratos em estratos, um
comportamento heterogêneo e, dentro de
cada estrato, um comportamento homogêneo,
convém que o sorteio dos elementos da
amostra leve em consideração tais estratos.
É exatamente isso que fazemos quando
empregamos a amostragem proporcional
estratificada, que, além de considerar a
existência dos estratos, obtém os elementos
da amostra proporcional ao número de
elementos dos mesmos.
Exemplo:
Supondo, no exemplo anterior, que, dos
noventa alunos, 54 sejam meninos e 36 sejam
meninas, vamos obter a amostra proporcional
estratificada.
São, portanto, dois estratos (sexo
masculino e sexo feminino) e queremos uma
amostra de 10% da população. Logo, temos:

SEXO POPUL. 10% AMOSTRA

M


F

54


36
4 , 5
100
54 10
=
×


6 , 3
100
36 10
=
×


5


4


TOTAL

90

0 , 9
100
90 10
=
×


9



Numeramos os alunos de 01 a 90, sendo
que de 01 a 54 correspondem meninos e de
55 a 90, meninas. Usando a tabela de números
aleatórios retiramos os elementos da
população.

3 – Amostragem sistemática

Quando os elementos da população já se
acham ordenados, não há necessidade de
construir o sistema de referência. São
exemplos os prédios de uma rua, as linhas de
produção etc. Nestes casos, a seleção dos
elementos que constituirão a amostra pode ser
feita por um sistema imposto pelo
pesquisador. A esse tipo de amostragem
denominamos sistemática.
Exemplo:
No caso de uma linha de produção,
podemos, a cada dez itens produzidos, retirar
um para pertencer a uma amostra da
população diária. Neste caso, estaríamos
fixando o tamanho da amostra em 10% da
população.

Exercícios:

1) Descreva as técnicas de amostragens.
Quando se utiliza cada uma delas?



2) O que é população estatística?

3) O que é amostra?

4) O que é amostragem?


5) O diretor de uma escola, na qual estão
matriculados 280 meninos e 320 meninas,
desejoso de conhecer as condições de vida
extra-escolar de seus alunos e não
dispondo de tempo para entrevistar todas
as famílias, resolveu fazer um
levantamento, por amostragem, em 10%
dessa clientela. Obtenha, para esse diretor,
os elementos componentes da amostra.

Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 5

6) Uma cidade X apresenta o seguinte
quadro relativo às suas escolas de 1º
grau:

Nº DE ESTUDANTES ESCOLAS
MASCULINO FEMININO
A
B
C
D
E
F
80
102
110
134
150
300
95
120
92
228
130
290
Total 876 955

Obtenha uma amostra proporcional
estratificada de 120 estudantes.

7) Em uma escola existem 250 alunos, sendo
35 na 1ª série, 32 na 2ª, 30 na 3ª, 28 na 4ª,
35 na 5ª, 32 na 6ª, 31 na 7ª e 27 na 8ª.
Obtenha uma amostra de 40 alunos e
preencha o quadro seguinte.

Série População Cálculo
Proporcional
Amostra









Total 250 40

SÉRIES ESTATÍSTICAS

Um dos objetivos da Estatística é
sintetizar os valores que uma ou mais
variáveis podem assumir, para que tenhamos
uma visão global da variação dessa ou dessas
variáveis. E isto ela consegue, inicialmente,
apresentando esses valores em tabelas e
gráficos, que irão nos fornecer rápidas e
seguras informações a respeito das variáveis
em estudo, permitindo-nos determinações
administrativas e pedagógicas mais coerentes
e científicas.

Tabela

Tabela é um quadro que resume um
conjunto de observações.

Uma tabela compõe-se de:
a. corpo – conjunto de linhas e colunas
que contêm informações sobre a
variável em estudo;
b. cabeçalho – parte superior da tabela
que especifica o conteúdo das colunas;
c. coluna indicadora – parte da tabela
que especifica o conteúdo das linhas;
d. linhas – retas imaginárias que facilitam
a leitura, no sentido horizontal, de
dados que se inscrevem nos seus
cruzamentos com as colunas;
e. casa ou célula – espaço destinado a um
só número;
f. título – conjunto de informações, as
mais completas possíveis, localizado no
topo da tabela;
g. rodapé – são os elementos
complementares da tabela, tais como
fonte, as notas e as chamadas,
colocados, de preferência, no fecho da
tabela.

Exemplo:

PRODUÇÃO DE CAFÉ
BRASIL – 1996-2000
ANOS PRODUÇÃO
(1.000 t)

1996
1997
1998
1999
2000

2.535
2.666
2.122
3.750
2.007

FONTE: Dados Hipotéticos

Séries Estatísticas

Denominamos série estatística toda tabela
que apresenta a distribuição de um conjunto de
dados estatísticos em função da época, do local
ou da série.
Daí podemos concluir que numa série
estatística observamos a existência de três
elementos ou fatores: o tempo, o espaço e a
espécie.
Cabeçalho
Coluna
Indicadora
Corpo
Rodapé
Cabeçalho
Coluna
Numérica
Casa ou Célula
Linhas
Título
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 6
Conforme varie um dos elementos da
série, podemos classifica-la em histórica,
geográfica e específica.

Séries históricas

Descrevem os valores da variável, em
determinado local, descriminados segundo
intervalos de tempo variáveis.

Exemplo:
PRODUÇÃO DE FERTILIZANTES
FOSFATADOS – BRASIL
1995 – 1999
ANOS QUANTIDADE
(t)
1995
1996
1997
1998
1999
3.570.115
4.504.201
5.448.835
4.373.226
4.024.813
Fonte: Dados Hipotéticos

Séries Geográficas

Descrevem os valores da variável, em
determinado instante, discriminados segundo
regiões.

Exemplo:

PRODUÇÃO DE OVOS DE
GALINHA NO BRASIL – 2000
REGIÃO QUANTIDADE
(1.000 dúzias)
Norte
Nordeste
Sudeste
Sul
Centro-Oeste
66.092
356.810
937.463
485.098
118.468
Fonte: Dados hipotéticos


Séries Específicas

Descrevem os valores da variável, em
determinado tempo e local, discriminados
segundo especificações ou categorias.


Exemplo:



REBANHOS BRASILEIROS
2000
ESPÉCIE QUANTIDADE
(1.000 cabeças)
Bovinos
Eqüinos
Suínos
Ovinos
Caprinos
Coelhos
139.599
5.855
32.121
20.085
11.313
909
Fonte: Dados hipotéticos

Séries Conjugadas – Tabela de Dupla
Entrada

Muitas vezes temos necessidade de
apresentar, em uma única tabela, a variação de
valores de mais de uma variável, isto é, fazer
uma conjugação de duas ou mais séries.
Conjugando duas séries em uma única
tabela, obtemos uma tabela de dupla entrada.
Em uma tabela desse tipo ficam criadas duas
ordens de classificação: uma horizontal (linha)
e uma vertical (coluna).

Exemplo:
TELEFONES INSTALADOS – 1997-99
REGIÃO 1997 1998 1999
Norte
Nordeste
Sudeste
Sul
Centro-Oeste
373.312
1.440.531
8.435.308
2.106.145
803.013
403.712
1.567.006
8.892.409
2.192.762
849.401
457.741
1.700.467
8.673.660
2.283.581
944.075
Total 13.158.309 13.905.290 14.059.524
Fonte: Dados Hipotéticos

A conjugação, no exemplo dado, foi série
geográfico-histórica.

Exercícios
1) Classifique as séries
a) PRODUÇÃO BRASILEIRA DE
CARVÃO MINERAL BRUTO 1998-00
ANO QUANTIDADE
PRODUZIDA
(1.000 t)
1998
1999
2000
22.700
18.115
20.984
Fonte: Dados Hipotéticos
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 7
b) AVICULTURA BRASILEIRA - 1999
ESPÉCIE NÚMERO
(1.000 cabeças)
Galinhas
Patos, marrecos e gansos
Perus
511.834
5.888
3.823
Fonte: Dados Hipotéticos


c) CRIANÇAS NÃO-VACINADAS
CONTRA A PÓLIO - 1999
REGIÕES QUANTIDADE
Nordeste
Sudeste
Norte
Centro-Oeste
Sul
512.900
299.585
148.818
124.791
105.371
Total 1.191.465
Dados fictícios

d)
AQUECIMENTO DE UM MOTOR
DE AVIÃO DE MARCA X
MINUTOS TEMPERATURA
(º C)
0
1
2
3
4
5
6
20
27
34
41
49
56
63
Dados Fictícios


e) PRODUÇÃO DE LAMINADOS
NÃO-PLANOS - BRASIL - 1998-2000
QUANTIDADE (1.000 t) TIPOS
1998 1999 2000
Barras
Vergalhões
Perfilados
Tubos
1.414
2.203
526
390
1.272
2.140
538
344
1.139
2.209
425
330
Dados Fictícios

f) PESSOAL DOCENTE DO ESTADO
DE SÃO PAULO - 1999
REDES 1º GRAU 2º GRAU
Estadual
Municipal
Particular
171.910
18.429
31.514
38.281
1.304
19.902
Total 221.853 59.487
Dados hipotéticos

2)(Enem)A tabela abaixo apresenta dados
referentes à mortalidade infantil, à
porcentagem de famílias de baixa renda
com crianças menores de 6 anos e às taxas
de analfabetismo das diferentes regiões
brasileiras e do Brasil como um todo.

Regiões
do
Brasil
Mortalidade
infantil*
Famílias de
baixa renda
com
crianças
menores de
6 anos (em
%)
Taxa de
analfabetismo
em maiores
de 15 anos
(em %)
Norte 35,6 34,5 12,7
Nordeste 59,0 54,9 29,4
Sul 22,5 22,4 8,3
Sudeste 25,2 18,9 8,6
Centro-
Oeste
25,4 25,5 12,4
Brasil 36,7 31,8 14,7
Fonte: Folha de S. Paulo, 11/3/99
* A mortalidade infantil indica o número de crianças que
morrem antes de completar um ano de idade para cada grupo
de 1.000 crianças que nasceram vivas.

Suponha que um grupo de alunos recebeu a
tarefa de pesquisar fatores que interferem na
manutenção da saúde ou no desenvolvimento
de doenças. O primeiro grupo deveria colher
dados que apoiasses a idéia de que, se
combatendo agentes biológicos e químicos,
garante-se a saúde. Já o segundo grupo deveria
coletar informações que reforçassem a idéia de
que a saúde de um indivíduo está diretamente
relacionada à sua condição socioeconômica.
Os dados da tabela podem ser utilizados
apropriadamente para:
a) apoiar apenas a argumentação do primeiro
grupo.
b) apoiar apenas a argumentação do segundo
grupo.
c) refutar apenas a posição a ser defendida
pelo segundo grupo.
d) apoiar a argumentação dos dois grupos.
e) refutar as posições a serem defendidas
pelos dois grupos.
3)(Enem)Lâmpadas incandescentes são
normalmente projetadas para trabalhar com
a tensão da rede elétrica em que serão
ligadas. Em 1997, contudo, lâmpadas
projetadas para funcionar com 127 V
foram retiradas do mercado e, em seu
lugar, colocaram-se lâmpadas concebidas
para uma tensão de 120 V. Segundo dados
recentes, essa substituição representou uma
mudança significativa no consumo de
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 8
energia elétrica para cerca de 80 milhões
de brasileiros que residem nas regiões em
que a tensão da rede é de 127 V.
A tabela abaixo apresenta algumas
características de duas lâmpadas de 60 W,
projetadas respectivamente para 127 V
(antiga) e 120 V (nova), quando ambas se
encontram ligadas numa rede de 127 V.

Lâmpada
(projeto
original)
Tensão
da rede
elétrica
Potência
medida
(watt)
Lumino
sidade
medida
(lúmens)
Vida
útil
média
(horas)
60 W – 127 V 127 V 60 750 1.000
60 W – 120 V 127 V 65 920 452

Acender uma lâmpada de 60 W e 120 V
em um local onde a tensão na tomada é de
127 V, comparativamente a uma lâmpada de
60 W e 127 V no mesmo local, tem como
resultado:
a) mesma potência, maior intensidade de luz e
maior durabilidade.
b) mesma potência, maior intensidade de luz e
menor durabilidade.
c) maior potência, maior intensidade deluz e
maior durabilidade.
d) maior potência, maior intensidade de luz e
menor durabilidade.
e) menor potência, menor intensidade de luz e
menor durabilidade.


GRÁFICOS ESTATÍSTICOS

O gráfico estatístico é uma forma de
apresentação dos dados estatísticos, cujo
objetivo é o de produzir, no investigador ou
no público em geral, uma impressão mais
rápida e viva do fenômeno em estudo, já que
os gráficos falam mais rápido à compreensão
que as séries.
Para tornarmos possível uma
representação gráfica, estabelecemos uma
correspondência entre os termos da série e
determinada figura geométrica, de tal modo
que cada elemento da série seja representado
por uma figura proporcional.
A representação gráfica de um fenômeno
deve obedecer a certos requisitos
fundamentais, para ser realmente útil:
a) Simplicidade – o gráfico deve ser
destituído de detalhes de importância
secundária, assim como de traços
desnecessários que possam levar o
observador a uma análise morosa ou
com erros.
b) Clareza – o gráfico deve possibilitar
uma correta interpretação dos valores
representativos do fenômeno em
estudo.
c) Veracidade – o gráfico deve expressar
a verdade sobre o fenômeno em estudo.

Os principais tipos de gráficos são os
diagramas, os cartogramas e os
pictogramas.

DIAGRAMAS

Os diagramas são gráficos geométricos de,
no máximo, duas dimensões; para sua
construção, em geral, fazemos uso do sistema
cartesiano.
Dentre os principais diagramas,
destacamos: Gráfico em linha ou em curva;
Gráfico em coluna ou em barras; Gráfico
em colunas ou em barras múltiplas; Gráfico
em setores.

Gráfico em linha ou em curva

Os dados, geralmente de uma série (tabela),
são colocados num sistema cartesiano
ortogonal. Graficamente, temos pontos ligados
por segmentos de reta.

Exemplos:

a)
VENDA DE TRATORES DE UMA
FÁBRICA - 2000
Mês Unidades vendidas
Janeiro 20
Fevereiro 12
Março 16
Abril 24
Maio 8
Junho 18
Dados fictícios
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 9
0
4
8
12
16
20
24
J F M A M J
v
e
n
d
a
s
mês

b) DESEMPENHO DOS CANDIDATOS
1º SEMESTRE - 2001
Desempenho (%)
Candidatos
Mês A B C
Janeiro 12 30 40
Fevereiro 16 25 36
Março 20 20 40
Abril 24 18 32
Maio 30 20 35
Dados fictícios

0
5
10
15
20
25
30
35
40
45
J F M A M
A
B
C
D
e
s
e
m
p
e
n
h
o

(
%
)
Mês

Exercícios

Construa o gráfico de linhas para as tabelas a
seguir:
a) VENDA DE AUTOMÓVEIS
1º SEMESTRE 2001
Mês Unidades vendidas
Janeiro 12
Fevereiro 20
Março 18
Abril 24
Maio 16
Junho 8
Dados hipotéticos

b)
PRONTO SOCORRO – CASOS
Dias da semana Atendimento
Segunda 12
Terça 20
Quarta 18
Quinta 24
Sexta 16
Sábado 8
Dados fictícios
c)
DISCOS VENDIDOS
(em milhões)
Anos Vendas
1992 76,6
1993 44,8
1994 44,3
1995 34,5
1996 44
1997 60
Dados hipotéticos

d) COMÉRCIO EXTERIOR
BRASIL – 1989-98
Anos Quantidade (1.000 t)
Exportação Importação
1989 98.010 75.328
1990 109.100 71.855
1991 123.994 64.066
1992 119.990 60.718
1993 178.790 55.056
1994 141.737 53.988
1995 146.351 48.870
1996 133.832 60.605
1997 142.382 61.975
1998 169.396 58.085
Fonte: Dados hipotéticos


Gráfico em colunas ou em barras

É a representação de uma série por
meio de retângulos, dispostos verticalmente
(em colunas) ou horizontalmente (em barras).
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 10
Quando em colunas, os retângulos têm
a mesma base e as alturas são proporcionais
aos respectivos dados.
Quando em barras, os retângulos têm a
mesma altura e os comprimentos são
proporcionais aos respectivos dados.
Assim estamos assegurando a
proporcionalidade entre as áreas dos
retângulos e os dados estatísticos.


Exemplos:


a) Gráfico em colunas

CONSTRUÇÃO DE AERONAVES
BRASIL - 1994-99
ANOS UNIDADES
1994 184
1995 171
1996 167
1997 203
1998 199
1999 197
Fonte: Dados Hipotético




Construção de Aeronaves
Brasil – 1994-99
0
50
100
150
200
250
1994 95 96 97 98 99
U
n
i
d
a
d
e
s
Anos






b) Gráfico em barras
PRODUÇÃO DE ALHO
BRASIL – 2000
Estados Quantidade
(t)
Santa Catarina 13.973
Minas Gerais 13.389
Rio Grande do Sul 6.892
Goiás 6.130
São Paulo 4.179
Fonte fictícia

Produção de Alho
Brasil – 2000
0 2 4 6 8 10 12 14
São Paulo
Goiás
Rio Grande do Sul
Minas Gerais
Santa Catarina
toneladas

c) Gráfico em colunas ou em barras
múltiplas

Este tipo de gráfico é geralmente empregado
quando queremos representar,
simultaneamente, dois ou mais fenômenos
estudados com o propósito de comparação.

Exemplo:

PÚBLICO NO BRASIL QUE
FREQÜENTA CINEMA - 1994-2000
Ano Filmes nacionais
%
Filmes
estrangeiros %
1994 16 84
1995 18 82
1996 21 79
1997 25 75
1998 30 70
1999 29 71
2000 31 69
Fonte hipotética
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 11

Público no Brasil que Freqüenta Cinema

0
10
20
30
40
50
60
70
80
90
100
94 95 96 97 98 99 00
Filmes nacionais
Filmes estrangeiros
P
e
r
c
e
n
t
u
a
l
Ano
Fonte hipotética

Exercícios

1) Represente as tabelas usando o gráfico em
colunas:

a)

CHEGADA DE VISITANTES
BRASIL - 1997-2000
ANOS NÚMERO
(milhares)
1997 1.450
1998 1.550
1999 1.700
2000 1.900
Fonte: hipotética
b)
ENTREGA DE GASOLINA PARA
CONSUMO - BRASIL – 1997-00
ANOS QUANTIDADE
(1.000 m
3
)
1997 9.700
1998 11.100
1999 9.727
2000 9.347
Dados hipotéticos


2) Usando o gráfico em barras, represente as
tabelas:



a)

PRODUÇÃO DE OVOS DE GALINHA
BRASIL - 1999
REGIÃO QUANTIDADE
(1.000 dúzias)
Norte 66.092
Nordeste 356.810
Sudeste 937.463
Sul 485.098
Centro-Oeste 118.468
Fonte: Hipotética

b)
MORADORES DO BAIRRO A, SEGUNDO
O HÁBITO DE ASSISTIR A NOVELAS
HÁBITO PERCENTUAL
Sim 82%
Não 18%
Total 100%
Fonte: fictícia



3) Represente as tabelas por meio de um
gráfico de colunas múltiplas.

a)
NATALIDADE SEGUNDO
AS REGIÕES DO PAÍS

(em %)
1940 1960 1980
Norte 54,4 57,4 43,6
Nordeste 53,5 52,6 41,5
Sudeste 43,7 42,5 28,9
Sul 39,2 41,7 29,4
Centro-Oeste 46,8 47,0 35,9
Fonte: jornal Folha de S. Paulo, 21/7/88




Gráfico em Setores

Este gráfico é construído com base em
um círculo, e é empregado sempre que
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 12
desejamos ressaltar a participação do dado no
total.
O total é representado pelo círculo,
que fica dividido em tantos setores quantas
são as partes.
Os setores são tais que suas áreas são
respectivamente proporcionais aos dados da
série.
Obtemos cada setor por meio de uma
regra de três simples e direta, lembrando que
o total da série corresponde a 360º.

Exemplo:

REBANHOS BRASILEIROS
1988
ESPÉCIE QUANTIDADE
(milhões de cabeças)
Bovinos 140
Suínos 32
Ovinos 20
Caprinos 11
Total 203
Fonte: IBGE

Temos:




x
2
= 56,7

x
2
= 57º
x
3
= 35,4

x
3
= 35º
x
4
= 19,5

x
4
= 20º
Com esses dados (valores em graus),
marcamos num círculo de raio arbitrário, com
um transferidor, os arcos correspondentes,
obtendo o gráfico:

REBANHOS BRASILEIROS – 1988
Bovino
Suíno
Ovino
Caprino
Fonte:
IBGE

Exercícios:

1) Represente as tabelas por meio de
gráficos em setores.
a)
QUEM DOMINA O SETOR
FARMACÊUTICO
% de participação
no mercado
Número de
companhias
Americana 22
Italiana 4
Inglesa 6
Francesa 5
Alemã 10
Austríaca/Holandesa 2
Suíça 6
Subtotal 280
Origem nacional 55
Total 335
Fonte: Jornal Folha de S, Paulo, 23/7/88

c)
A OCUPAÇÃO DE CADA UM
Fonte: Revista Veja, jun/87
c)
ÁREA TERRESTRE BRASIL
REGIÕES RELATIVA
(%)
Norte 45,25
Nordeste 18,28
Sudeste 10,85
Sul 6,76
Centro-Oeste 18,86
Total 100,00
Fonte: IBGE
x
1
= 248,2

x
1
= 248º 203 __ 360º
140 __ x
1



Fazendeiros e
empresários
Executivos,
profissionais
liberais e
outros
Operários
Total no
Congresso 37% 62% 1%
PMDB 39% 60% 0,3%
PFL 37% 62% 0,0%
PDS 50% 50% 0,0%
PDT 19% 76% 4%
PT 0% 80% 19%
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 13
Cartograma

O cartograma é a representação sobre
uma carta geográfica.

Este gráfico é empregado quando o
objetivo é o de figurar os dados estatísticos
diretamente relacionados com áreas
geográficas ou políticas.
Distinguimos duas aplicações:

a) Representar dados absolutos
(população) – neste caso, lançamos
mão, em geral, dos pontos, em
número proporcional aos dados.
b) Representar dados relativos
(densidade) – neste caso, lançamos
mão, em geral, de hachuras.

Exemplo:

POPULAÇÃO PROJETADA DA REGIÃO
SUL DO BRASIL - 1990
ESTADO POPULAÇÃO
(hab.)
ÁREA
(Km
2
)
DENSIDADE
Paraná 9.137.700 199.324 45,8
Santa
Catarina
4.461.400 95.318 46,8
Rio
Grande do
Sul
9.163.200 280.674 32,6
Fonte: IBGE

POPULAÇÃO PROJETADA DA REGIÃO
SUL DO BRASIL - 1990

DENSIDADE POPULACIONAL
PROJETADA DA REGIÃO SUL DO
BRASIL - 1990








Pictograma

O pictograma constitui um dos
processos que melhor fala ao público, pela sua
forma ao mesmo tempo atraente e sugestiva. A
representação gráfica consta de figuras.

Exemplos:

AUMENTA CONSUMO DE GÁS
(Consumo mensal de gás de nafta na região
metropolitana de São Paulo em milhões me m
3
)


Fonte: Jornal Folha de S. Paulo, jul./88


Menos de 33,0 hab/Km
2


Menos de 46,0 hab/Km
2


Menos de 47,0 hab/Km
2

• 400.000 habitantes
27,39
JAN./88
28,00
FEV./
28,71
MAR./
29,03
ABR./
30,15
MAI./
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 14
CRESCE O NÚMERO DE
PASSAGEIROS NOS ÔNIBUS
URBANOS DE CAMPINAS (SP)
(em milhões)

Fonte: Jornal Folha de São Paulo, jul./98



APURAÇÃO DOS VOTOS PARA
PRESIDENTE
Até 22h34, em %

Fonte: jornal Folha de S. Paulo, 5 out. 1994


Exercícios

1)(Enem) Um estudo sobre o problema do
desemprego na Grande São Paulo, no
período 1985-1996, realizado pelo SEADE-
DIEESE, apresentou o seguinte gráfico
sobre taxa de desemprego.

Pela análise do gráfico, é correto afirmar que,
no período considerado:
a) a maior taxa de desemprego foi de
14%.
b) A taxa de desemprego no ano de 1995
foi a menor do período.
c) A partir de 1992, a taxa de
desemprego foi decrescente.
d) No período 1985-1996, a taxa de
desemprego esteve entre 8% e 16%.
e) A taxa de desemprego foi crescente no
período compreendido entre 1988 e
1991.

MÉDIAS ANUAIS DA TAXA DE
DESEMPREGO TOTAL
GRANDE SÃO PAULO
1985-1996
0%
2%
4%
6%
8%
10%
12%
14%
16%
85 86 87 88 89 90 91 92 93 94 95 96

Fonte: SEP, Convênio SEADE-DIEESE

2)(Enem) Uma pesquisa de opinião foi
realizada para avaliar os níveis de audiência de
alguns canais de televisão, entre 20h e 21h,
durante uma determinada noite. Os resultados
obtidos estão representados no gráfico de
barras a seguir:

0
20
40
60
80
100
TvA TvB TvC TvD Nenhum
canal
N
º

d
e

r
e
s
i
d
e
n
c
i
a
I. O número de residências atingidas nessa
pesquisa foi, aproximadamente , de:
a) 100 c) 150 e) 220
b) 135 d) 200

II. A percentagem de entrevistados que
declararam estar assistindo à TvB é
aproximadamente igual a:
a) 15% c) 22% e) 30%
b) 20% d) 27%


140,1
1993
152,4
1994
158,8
1995
162,1
1996
166,2
1997
FHC
(PSDB)
Lula
(PT)
Enéas
(Prona)
Quércia
(PMDB)
Amim
(PPR)
Brizola
(PDT)
54,0
24,2
6,7
5,8
5,6
2,9
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 15
3)(Univali) O gráfico mostra as vendas de
televisores em uma loja:

0
10
20
30
40
50
60
Jan. Fev. Mar. Abr. Maio Jun.
Mês
U
n
i
d
a
d
e
s

v
e
n
d
i
d
a
s

Pode-se afirmar que:
a) as vendas aumentaram mês a mês.
b) foram vendidos 100 televisores até
junho.
c) as vendas do mês de maio foram
inferiores à soma das vendas de
janeiro e fevereiro.
d) foram vendidos 90 televisores até
abril.
e) Se cada televisor é vendido por
R$240,00, em maio a loja faturou,
com as vendas desse produto,
R$7.200,00.

4)(Enem) Para convencer a população local
da ineficiência da Companhia Telefônica
Vilatel na expansão da oferta de linhas, um
político publicou no jornal local o gráfico I,
abaixo representado. A companhia Vilatel
respondeu publicando dias depois o gráfico II,
onde pretende justificar um grande aumento
na oferta de linhas. O fato é que, no período
considerado, foram instaladas, efetivamente,
200 novas linhas telefônicas.

Gráfico I
2.000
2.020
2.040
2.060
2.080
2.100
2.120
2.140
2.160
2.180
2.200
Jan. Abr. Ago. Dez.
N
º

t
o
t
a
l

d
e

l
i
n
h
a
s

t
e
l
e
f
ô
n
i
c
a
s



GRÁFICO II

2.000
2.050
2.100
2.150
2.200
Jan. Abr. Ago. Dez.
N
º

t
o
t
a
l

d
e

l
i
n
h
a
s

t
e
l
e
f
ô
n
i
c
a
s


Analisando os gráficos, pode-se concluir que:
a) o gráfico II representa um crescimento
real maior do que o do gráfico I.
b) o gráfico I apresenta o crescimento real.
Sendo o II incorreto.
c) o gráfico II apresenta o crescimento
real, sendo o gráfico I incorreto.
d) a aparente diferença de crescimento nos
dois gráficos decorre da escolha das
diferentes escalas.
e) os dois gráficos são incomparáveis,
pois usam escalas diferentes.

5) Analisando o gráfico responda:
a) Quantas unidades do produto A foram
vendidas em janeiro? E em fevereiro?
b) Em que mês o produto B atingiu a venda de
70.000 unidades?
c) Em que mês os dois produtos tiveram o
mesmo número de unidades vendidas?
d) Em que meses o produto B foi mais vendido
que o produto A?

6) O gráfico nos mostra o número de chamadas
telefônicas ocorridas numa determinada
cidade de 1995 a 1999. Construa uma
tabela que represente esse gráfico.

0
10
20
30
40
50
60
70
80
90
JAN FEV MAR ABR MAI JUN
meses
v
e
n
d
a

(
e
m

m
i
l

Produto A
Produto B
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 16

7) O gráfico a seguir fornece a evolução do
preço médio de um videocassete brasileiro, de
1994 a 1999. Construa a tabela referente ao
gráfico e responda:

0
200
400
600
800
1000
1200
1994 1995 1996 1997 1998 1999
anos
p
r
e
ç
o
s

(
U
S
$
)















8) O gráfico nos mostra o movimento de
importações e das exportações de um país,
de 1995 a 1999. Faça uma tabela que
represente esse gráfico.
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
1995 1996 1997 1998 1999
Importação
Exportação
anos
m
i
l
h
õ
e
s

d
e

d
ó
l
a
r
e
s


9) O gráfico abaixo nos mostra a participação
em 47 vôos semanais para o exterior de
algumas empresas brasileiras (dados de
outubro de 1991). Construa a tabela
referente ao gráfico apresentado.

9%
23%
68%
Varig
Transbrasil
Vasp



TÉCNICA DE SOMATÓRIO

Para indicarmos a soma dos x
i
(x índice
i) valores de uma variável x, isto é, a soma de
x
1
+ x
2
+ x
3
+ ... + x
n
, utilizamos o símbolo
grego sigma (Σ), denominado, em Matemática,
SOMATÓRIO.
Assim, a soma x
1
+ x
2
+ x
3
+ ... + x
n
pode ser representado

por

=
n
1 i
i
x
(somatório de
x
i
, onde x varia de 1 a n).

TÉCNICAS DE SOMATÓRIO são as
técnicas que auxiliam na soma dos x
i
valores
de uma variável x.

VARIÁVEL é o conjunto de valores
possíveis que representam um fenômeno.
0
50
100
150
200
250
300
350
400
450
1995 1996 1997 1998 1999
anos
n
ú
m
e
r
o

d
e

c
h
a
m
a
d
a
s
a) Que nome se dá a esse tipo de gráfico?

b) Qual era o preço médio do
videocassete brasileiro em 1987?

c) Qual a variação do preço médio do
videocassete brasileiro entre 1986 e
1991?

Fonte: revista Veja
Fonte: revista Isto É
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 17

Ex.: x = {0, 1, 2, 3, ..., 10}
x = variável
i = índice ou ordem que o elemento
ocupa na seqüência
x
1
= 0 x
3
= 2
x
2
= 1 x
4
= 3 , e assim por diante.

SEQÜÊNCIA é uma função cujo
domínio é o conjunto de números positivos
que indicam a posição.

Ex.: X = {x
1
, x
2
, x
3
, ... , x
n
} ⇒ {1, 2,
3, .. , n} é o conjunto das posições


PROPRIEDADES:

a) ∑
=
n
1 i
i
x
= x
1
+ x
2
+ x
3
+ ... + x
n


Ex.: Sendo o conjunto X = {1, 3, 5, 6, 8, 9}
faça:



=
6
1 i
i
x
= x
1
+ x
2
+ x
3
+ x
4
+ x
5
+ x
6
= 1 + 3
+ 5 + 6 + 8 + 9 = 32
• ∑
=
5
3 i
i
x
= x
3
+ x
4
+ x
5
= 5 + 6 + 8 =19

b)

=
n
1 i
k
= 4 4 3 4 4 2 1
vezes n
k ... k k k + + + +
= n· k, onde k é
uma constante real.
Ex.: Determine
8
1
7
i =
∑ = 8 + 8 + 8 + 8 + 8 + 8
+ 8 = 7· 8 = 56

c) i
n
1 i
x k

=
= kx
1
+ kx
2
+ kx
3
+ kx
4
+ ...+ kx
n
=


=
n
1 i
i
x
, onde k é uma constante real.

Ex.: Sendo o conjunto x = {1, 3, 5, 6, 8, 9}
determine:

=
6
2 i
i
x 3
= 3x
2
+ 3x
3
+ 3x
4
+ 3x
5
+ 3x
6
= 3· 3 +
3· 5 + 3· 6 + 3· 8 + 3· 9 = 93

Aplicando a propriedade temos,

=
6
2 i
i
x 3
= 3·

=
6
2 i
i
x
= 3(x
2
+ x
3
+ x
4
+ x
5
+ x
6
) =
3(3 + 5 + 6 + 8 + 9) = 3· 31 = 93


d)
x
i
j
j i
∑ ∑
= x
11
+ x
12
+ ... + x
ij


Seja por exemplo a tabela

J
Níveis fator 2
i
Níveis
fator 1
1 2 3

1 X
11
X
12
X
13 Σx
1j
2 X
21
X
22
X
23 Σx
2j

Σx
i1
Σx
i2
Σx
i3
Σx
ij


P


N
1 2 3
1 28 35 46 109
2 36 48 62 146
64 83 108 255

x
ij
⇒ i → linha
j → coluna

como fica a notação de somatório:
da 1ª coluna → x
11
+ x
21
= ∑
=
2
1 i
x
i1
= 28 + 36 =
64
da 1ª linha → x
11
+ x
12
+ x
13
= ∑
=
3
1 j
x
1j
= 28 +
35 + 46 = 109


Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 18
Ex. Seja a matriz M =
|
|
¹
|

\
|
9 8
6 4
determine
∑∑
= = 2 i
2
1 j
ij
x
= x
21
+ x
22
= 8 + 9 = 17


e) ∑
=
n
1 i
i i
y x
= x
1
· y
1
+ x
2
· y
2
+ ... +

x
n
· y
n


Ex.: Sejam os conjuntos X={0,1,2,3,4,5,6} e
Y = {5,6,7,8,9}, determine:


=
5
3 i
i i
y x
= 2· 7 + 3· 8 + 4· 9 = 14 + 24 + 36 =
74

f) ∑
=
+
n
1 i
i i
) y x (
= (x
1
+ y
1
)+(x
2
+ y
2
)+...+(x
n
+ y
n
)
=

=
n
1 i
i
x
+

=
n
1 i
i
y


Ex.: Sejam os conjuntos X = {0,1,2,3, 4,5,6}
e Y = {5,6,7,8,9}, determine:

=
+
5
2 i
i i
) y x (
= ∑
=
5
2 i
i
x
+

=
5
2 i
i
y
= 2 + 3 + 4 + 5 +
6 + 7 + 8 + 9 = 44

g)

=
+
n
1 i
t
i
) a x (
= (x
1
+ a)
t
+ (x
2
+ a)
t
+ (x
3
+ a)
t

+ ... + (x
n
+ a)
t
, onde a é uma constante real

Ex.: Seja X = {2, 3, 4, 5, 6}, determine:

=
+
4
1 i
2
i
) 1 x (
= ( 2 + 1)
2
+ (3 + 1)
2
+ (4 + 1)
2

+ (5 + 1)
2
= 3
2
+ 4
2
+ 5
2
+ 6
2
= 9 + 16 + 25 +
36 = 86







EXERCÍCIOS

1) Desenvolva os seguintes somatórios:
a)

=
7
1 i
i
x
c) ∑
=
7
3 i
i
x

b) ∑
=
3
1 i
i
y
d) ∑
=
10
4 i
i
y


2) Sendo X = {2, 5, 6, 7} calcule:
a) ∑
=
4
1 i
i
x
b) ∑
=
2
1 i
i
x

c)

=
+
3
1 i
i
) 1 x (
d)

=
+
4
2 i
2
i
) 3 x (



3) Sendo X = {1, 2, 3, 6}, calcule:
a) ∑
=

4
1 i
i
x 10
b) ∑
=
⋅ +
4
1 i
i
) x 10 2 (


4) Calcule os seguintes somatórios, sendo
Y = {0, 4, 3, 7}
a) ∑
=
3
1 i
i
y
b) ∑
=
4
1 i
8
c)

=
4
1 i
i
y 4

d)

=

3
1 i
i
10 y
e)

=
+
3
1 i
i
) y 12 5 (

f) ∑
=

3
1 i
i
) y 3 (
g) ∑
=
− +
4
1 i
i i
) 10 y 3 y 4 (

h) ∑
=
+ −
4
1 i
i i
) y 2 y 3 (


5) Sendo X = {3, 7, 2, 1} e Y = {0, 3, 1, 2},
calcule:

a) ∑
=
+
4
1 i
i i
) y x (
b) ∑
=

4
1 i
i i
) y x (

c)

=
+
2
1 i
2
i
) x 2 (
d) ∑
=
+
4
1 i
2
i i
) y x (

Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 19
e)

=
4
1 i
i i
y x
f) ∑
=
+
4
1 i
i
) 1 x (


f) ∑
=
4
1 i
i
x
+ ∑
=
4
1 i
i
y
g)

=
+ +
4
1 i
i i
) y 2 x (


6) Sendo

=
4
1 i
i
x
=10 ,

=
4
1 i
i
y
=20 e

=
4
1 i
2
i
x
=30,
calcule:
a) ∑
=
+
4
1 i
i i
) y x (
b) ∑
=
+
4
1 i
2
i
) 3 x (

c) ∑
=
+
4
1 i
i i
) y x 4 (


7) Sendo M =
|
|
|
¹
|

\
|
− −
− −
1 2 5 3
5 4 2 1
3 3 6 2
, determine:
a) ∑
=
3
1 i
2 i
x
b) ∑
=
4
1 j
j 3
x

c)
∑ ∑
= =
3
1 i
3
2 j
ij
x
d) ∑∑
= =
3
1 i
4
1 j
ij
x




DISTRIBUIÇÃO DE FREQÜÊNCIA













Exemplo:

Tabela primitiva

Estatura de 40 alunos do Colégio A
166 160 161 150 162 160
165 167 164 160 162 161
168 163 156 173 160 155
164 168 155 152 163 160
155 155 169 151 170 164
154 161 156 172 153 157
156 158 158 161

Rol

Estatura de 40 alunos do Colégio A
150 151 152 153 154 155
155 155 155 156 156 156
157 158 158 160 160 160
160 160 161 161 161 161
162 162 163 163 164 164
164 165 166 167 168 168
169 170 172 173

No exemplo dado, a variável em
questão, estatura, será observada e estudada
muito mais facilmente quando dispusermos
valores ordenados em uma coluna e
colocarmos, ao lado de cada valor, o número
de vezes que aparece repetido.]
Denominamos freqüência o número de
alunos que fica relacionado a um determinado
valor da variável. Obtemos, assim, uma tabela
que recebe o nome de distribuição de
freqüência:

Tabela I

ESTATURA DE 40 ALUNOS DO COLÉGIO
A

ESTAT.
(cm)
FREQ. ESTAT.
(cm)
FREQ.
150 1 163 2
151 1 164 3
152 1 165 1
153 1 166 1
154 1 167 1
155 4 168 2
156 3 169 1
157 1 170 1
158 2 172 1
160 5 173 1
161 4
162 2

TOTAL

40

Freqüência – repetição de determinado
dado.
Tabela Primitiva – tabela cujos
elementos não foram numericamente
organizados
Rol – tabela obtida após a ordenação
dos dados .

Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 20
O processo dado exige muito espaço,
mesmo quando o número de valores da
variável (n) é de tamanho razoável. A
solução mais aceitável, pela própria natureza
da variável contínua, é o agrupamento dos
valores em vários intervalos.
Deste modo, estaremos agrupando os
valores da variável em intervalos, sendo que,
em estatística, preferimos chamar os
intervalos de classes.
Chamando de freqüência de uma
classe o número de valores da variável
pertencentes à classe, os dados da tabela
anterior podem ser dispostos em uma tabela
denominada distribuição de freqüência com
intervalos de classe.

Tabela II

ESTATURA DE 40 ALUNOS DO
COLÉGIO A
ESTATURAS
(cm)
FREQÜÊNCIA
150├ 154 4
154 ├ 158 9
158 ├ 162 11
162 ├ 166 8
166 ├ 170 5
170 ├ 174 3
Total 40

OBS: Os intervalos de classe devem
ser escritos, de acordo com a Resolução
886/66 do IBGE, em termos de desta
quantidade até menos aquela, empregando,
para isso o símbolo ├ (inclusão de l
i
e
exclusão de L
i
).

Ao agruparmos os valores da variável
em classes, ganhamos em simplicidade mas
perdemos em pormenores. Assim, na tabela I,
podemos verificar, facilmente, que quatro
alunos têm 161 cm de altura e que não existe
nenhum aluno com 171 cm de altura. Já na
tabela II não podemos ver se algum aluno tem
a estatura de 159 cm. No entanto, sabemos,
com segurança, que onze alunos têm estatura
compreendida entre 158 e 162 cm.
O que se pretende com a construção
dessa nova tabela é realçar o que há de
essencial nos dados e, também, tornar
possível o uso de técnicas analíticas para sua
total descrição, até porque a Estatística tem por
finalidade analisar o conjunto de valores,
desinteressando-se por casos isolados.

Exercício:

1) Observe a tabela seguinte.

Algumas informações sociais sobre os 30
funcionários da Indústria Santo Afonso.

Nº Estado
Civil
Nº de
depen
dentes
Grau de
instrução
Salário
(x mínimo)
1 casado 2 1º grau 3
2 casado 2 1º grau 3
solteiro 0 2º grau 6
4 divorc. 2 2º grau 6
5 casado 2 superior 15
6 solteiro 0 1º grau 3
7 casado 2 2º grau 6
8 casado 3 1º grau 3
9 solteiro 0 1º grau 3
10 casado 2 1º grau 3
11 divorc. 3 1º grau 3
12 casado 2 1º grau 3
13 casado 2 1º grau 3
14 casado 2 2º grau 15
15 solteiro 0 1º grau 4
16 solteiro 0 2º grau 8
17 solteiro 1 1º grau 4
18 casado 2 1º grau 4
19 casado 2 2º grau 8
20 divorc. 2 1º grau 4
21 solteiro 1 superior 15
22 casado 3 1º grau 4
23 casado 2 2º grau 8
24 solteiro 0 1º grau 4
25 casado 2 2º grau 8
26 solteiro 1 1º grau 4
27 solteiro 0 2º grau 8
28 casado 2 1º grau 4
29 solteiro 0 2º grau 8
30 solteiro 0 1º grau 4
Fonte: dados hipotéticos

Elabore uma tabela de freqüência (absoluta e
relativa) considerando como variável:

a) o estado civil.
b) o número de dependentes.
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 21
c) O grau de instrução.
d) O salário.

2) As notas de Estatística de uma turma de 50
alunos estão anotadas na tabela a seguir.
Faça uma tabela de freqüência (absoluta e
relativa) para essas notas.

NOTAS DE ESTATÍSTICA

4 6 8 5 8 5 7
4 10 6 7 5 6 4
6 7 10 10 5 10 5
7 5 8 7 4 5 6
7 6 7 9 9 6 5
9 6 5 9 8 10 8
5 6 7 5 6 8 5
4

ELEMENTOS DE UMA DISTRIBUIÇÃO
DE FREQÜÊNCIA

1 – Classe





As classes são representadas
simbolicamente por i, sendo i = 1,2,3, ... ,K
(onde K é o número total de classes da
distribuição).

2 – Limites de classe




O menor número é o limite inferior
da classe ( l
i
) e o maior número, o limite
superior da classe ( L
i
) .

3 – Amplitude de um intervalo de classe






Ela é obtida pela diferença entre os
limites superior e inferior dessa classe e
indicada por h
i
. Assim:




4 – Amplitude total da distribuição











5 – Amplitude amostral










6 – Ponto médio de uma classe







Para obtermos o ponto médio de uma
classe, calculamos a semi-soma dos limites da
classe ( média aritmética):





7 – Freqüência simples ou absoluta





Classes de freqüência ou,
simplesmente, classes são intervalos de
variação da variável.
Determinamos limites de
classe os extremos de cada classe.
Amplitude de um intervalo
de classe ou, simplesmente, intervalo
de classe é a medida do intervalo que
define a classe.
h
i
= L
i
- l
i
Amplitude total da distribuição
( AT ) é a diferença da última classe (
limite superior máximo) e o limite
inferior da primeira classe ( limite
inferior mínimo).
AT = L
(máx.)
– l
(mín.)
Amplitude amostral ( AA ) é a
diferença entre o valor máximo e o valor
mínimo da amostra.
AA = x(max.) – x(min.)
Ponto médio de uma classe ( x
i
)
é, como o próprio nome indica, o ponto
que divide o intervalo de classe em duas
partes iguais.
2
L l
x
i i
i
+
=
Freqüência simples ou freqüência
absoluta ou, simplesmente freqüência de
uma classe ou de um valor individual é o
número de observações correspondentes a
essa classe ou a esse valor.
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 22
A freqüência simples é simbolizada
por f
i
( lemos: f índice i ou freqüência da
classe i ).
A soma de todas as freqüências é
representada pelo símbolo de somatório:






NÚMERO DE CLASSES
INTERVALO DE CLASSE

Para a determinação do número de
classes de uma distribuição podemos lançar
mão da regra de Sturger, que nos dá o
número de classes em função do número de
valores da variável:



onde:
i é o número de classe;
n é o número total de dados.

Decidido o número de classes que
deve ter a distribuição, resta-nos resolver o
problema da determinação da amplitude do
intervalo de classe, o que conseguimos
dividindo a amplitude total pelo número de
classes:




Quando o resultado não é exato,
devemos arredonda-lo para mais.

Exercício:

1) As notas obtidas por 50 alunos de uma
classe foram:
1 2 3 4 5 6 6 7 7 8
2 3 3 4 5 6 6 7 8 8
2 3 4 4 5 6 6 7 8 9
2 3 4 5 5 6 6 7 8 9
2 3 4 5 5 6 7 7 8 9

a) Complete a distribuição de freqüência :


i Notas x
i
f
i

1 0 ├ 2
2 2 ├ 4
3 4 ├ 6
4 6 ├ 8
5 8 ├10


=
i
f

b) Agora, responda:

1) Qual a amplitude amostral?
2) Qual a amplitude da distribuição?
3) Qual o número de classes da
distribuição?
4) Qual o limite inferior da quarta classe?
5) Qual o limite superior da classe de
ordem 2?
6) Qual a amplitude do segundo intervalo
de classe?

c) Complete:

1) h
3
= _____ 2) l
1
= _____ 3) x
2
= ___

4) n = _____ 5) L
3
= ____ 6) f
5
= ____

TIPOS DE FREQÜÊNCIA







A soma das freqüências simples é igual
ao número total dos dados:















=
k
1 i
fi
i ≅ 1 + 3,3 . log n
h ≅
i
AT

Freqüências simples ou
absolutas (f
i
) são os valores que
realmente representam o número de
dados de cada classe.
n f
i
=


Freqüência relativa (fr
i
) são
os valores das razões entre as
freqüências simples e a freqüência
total

=
i
i
i
f
f
fr
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 23
O propósito das freqüências relativas é
o de permitir a análise ou facilitar as
comparações.





















DISTRIBUIÇÃO DE FREQÜÊNCIA SEM
INTERVALO DE CLASSE

Quando se trata de variável discreta
de variação relativamente pequena, cada valor
pode ser tomado como um intervalo de classe
e, nesse caso, a distribuição é chamada
distribuição sem intervalo de classe,
tomando a seguinte forma:

x
i
f
i

x
1
f
1
x
2
f
2
: :
x
n
f
n


= n f
i




Exemplo:



Seja X a variável “número de cômodos das
casas ocupadas por vinte famílias
entrevistadas”:


i x
i
f
i

1 2 4
2 3 7
3 4 5
4 5 2
5 6 1
6 7 1


= 20


Exercícios:

1) Considerando as notas de um teste de
inteligência aplicado a 100 alunos:

64 78 66 82 74 103 78 86 103 87
73 95 82 89 73 92 85 80 81 90
78 86 78 85 98 75 73 90 86 101
86 84 86 76 76 83 86 84 85 103
76 80 92 73 87 70 85 79 93 102
82 90 83 81 85 72 81 96 81 85
68 96 86 70 72 74 84 99 81 89
71 73 63 74 98 78 78 83 96 105
95 94 88 62 91 83 98 93 83 76
94 75 67 95 708 98 71 92 72 73

Forme uma distribuição de freqüência.
Determine:
a)

i
f b) fr
i
c) F
i
d) Fr
i


2) A distribuição abaixo indica o número de
acidentes ocorridos com 70 motoristas de
uma empresa de ônibus:

Nº acidentes 0 1 2 3 4 5 6 7
Nº motoristas 20 10 16 9 6 5 3 1

Determine:
a) o número de motoristas que não sofreram
nenhum acidente:
b) o número de motoristas que sofreram pelo
menos 4 acidentes;
c) o número de motoristas que sofreram
menos de 3 acidentes;
d) o número de motoristas que sofreram no
mínimo 3 e no máximo 2 acidentes;
e) a percentagem dos motoristas que sofreram
no máximo 2 acidentes.

3) Sejam as alturas (em centímetros) de 25
alunos de uma determinada classe:


Freqüência acumulada (F
i
) é o
somatório de todas as classes anteriores
da referida classe.
F
k
= f
1
+ f
2
+ ... + f
k

Freqüência acumulada
relativa (Fr
i
) de uma classe é a
freqüência acumulada da classe,
dividida pela freqüência total da
distribuição.

=
i
i
i
f
F
Fr
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 24
150 159 157 151 152
156 153 163 159 175
162 162 164 158 159
164 168 166 160 162

a) Calcule a amplitude do rol.
b) Calcule a amplitude para cada intervalo de
classe.
c) Ache a distribuição de freqüência com
intervalos de classe, a freqüência relativa, a
freqüência acumulada e a freqüência
acumulada relativa.

4) A tabela abaixo apresenta uma distribuição
de freqüência das áreas de 400 lotes:

ÁREAS
(m
2
)
Nº DE
LOTES
300 ├ 400 14
400 ├ 500 46
500 ├ 600 58
600 ├ 700 76
700 ├ 800 68
800 ├ 900 62
900 ├ 1000 48
1000 ├ 1100 22
1100 ├ 1200 6

Com referência a essa tabela, determine:
a) a amplitude total;
b) o limite superior da quinta classe;
c) o limite inferior da oitava classe;
d) o ponto médio da sétima classe;
e) a amplitude do intervalo da segunda classe;
f) a freqüência da quarta classe;
g) a freqüência relativa da sexta classe;
h) a freqüência acumulada da quinta classe;
i) o número de lotes cuja área não atinge 700
m
2
;
j) o número de lotes cuja área atinge e
ultrapassa 800 m
2
;
k) a percentagem dos lotes cuja área não
atinge 600 m
2
;
l) a percentagem dos lotes cuja área seja
maior ou igual a 900 m
2
;
m) a percentagem dos lotes cuja área é de
500m
2
, no mínimo, mas inferior a 1.000m
2
;
n) a classe do 72º lote;
o) até que classe estão incluídos 60% dos lotes.

5) Baseando que um amostra apresentou os
resultados abaixo, clacule a amplitude do
intervalo de classe ( h ) e o número total de
classes ( i ).

a) n=50 AA=150

b) n=70 AA=10

6) Complete os dados que faltam na
distribuição de freqüência:

a)
I X
i
f
i
fr
i
f
i

1 0 1 0.05
2 1 0.15 4
3 2 4
4 3 0.25 13
5 4 3
6 5 18
7 6 19
8 7


= 20

= 00 1.



b)
i Classes x
i
f
i
F
i
fr
i
1 0 ├ 2 1 4 0,04
2 2 ├ 4 8
3 4 ├ 6 5 30 0,18
4 7 27 0,27
5 15 72
6 10 ├ 12 83
7 13 10 93 0,10
8 14 ├ 16 0,07


=


=


REPRESENTAÇÃO GRÁFICA DE UMA
DISTRIBUIÇÃO

Uma distribuição de freqüência pode
ser representada graficamente pelo
histograma, pelo polígono de freqüência e
pelo polígono de freqüência acumulada
(ogiva de Galton).
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 25
Construímos qualquer um dos gráficos
mencionados utilizando o primeiro quadrante
do sistema de eixos coordenados cartesianos
ortogonais. Na linha horizontal (eixo das
abscissas) colocamos os valores da variável e
na linha vertical ( eixo das ordenadas), as
freqüências.

HISTOGRAMA









As larguras dos retângulos são iguais
às amplitudes dos intervalos de classe.
As alturas dos retângulos devem ser
proporcionais às freqüências das classes,
sendo a amplitude dos intervalos iguais. Isso
nos permite tomar as alturas numericamente
iguais às freqüências.

Exemplo: À distribuição da tabela
corresponde o seguinte histograma:

ESTATURA DE 40 ALUNOS DO
COLÉGIO A
i ESTATURAS
(cm)
f
i
1 150├ 154 4
2 154 ├ 158 9
3 158 ├ 162 11
4 162 ├ 166 8
5 166 ├ 170 5
6 170 ├ 174 3
Total

= 40 f
i


0
2
4
6
8
10
12
150 158 162 166 170 174
f
r
e
q
u
ê
n
c
i
a
classes
154

O histograma goza de uma propriedade
da qual faremos considerável uso: a área de
um histograma é proporcional à soma das
freqüências.

POLÍGONO DE FREQÜÊNCIA








Para realmente obtermos um polígono
(linha fechada), devemos completar a figura,
ligando os extremos da linha obtida aos pontos
médios da classe anterior à primeira e da
posterior à última, da distribuição.

Exemplo:
ESTATURA DE 40 ALUNOS DO COLÉGIO
A
i ESTATURAS
(cm)
f
i
1 150├ 154 4
2 154 ├ 158 9
3 158 ├ 162 11
4 162 ├ 166 8
5 166 ├ 170 5
6 170 ├ 174 3
Total

= 40 f
i


0
2
4
6
8
10
12
148 152 156 160 164 168 172 176
f
r
e
q
u
ê
n
c
i
a
Estatura

No caso de termos uma variável
essencialmente positiva, cuja distribuição se
inicie no valor zero, devemos considerar um
intervalo anterior localizado no semi-eixo
negativo. Porém consideraremos apenas a parte
positiva do segmento que liga o ponto médio
O histograma é formado por um
conjunto de retângulos justapostos, cujas
bases se localizam sobre o eixo
horizontal, de tal modo que seus pontos
médios coincidam com os pontos médios
dos intervalos de classe.
O polígono de freqüência é um
gráfico em linha, sendo as freqüências
marcadas sobre perpendiculares ao eixo
horizontal, levantadas pelos pontos
médios dos intervalos de classe.
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 26
desse intervalo com a freqüência do intervalo
0├ ... .

POLÍGONO DE FREQÜÊNCIA
ACUMULADA









Exemplo:

ESTATURA DE 40 ALUNOS DO
COLÉGIO A
i ESTATURAS
(cm)
f
i
1 150├ 154 4
2 154 ├ 158 9
3 158 ├ 162 11
4 162 ├ 166 8
5 166 ├ 170 5
6 170 ├ 174 3
Total

= 40 f
i



0
10
20
30
40
150 154 158 162 166 170 174
F
r
e
q
ü
e
n
c
i
a
Estatura


GRÁFICO DE UMA DISTRIBUIÇÃO DE
FREQÜÊNCIA SEM INTERVALO DE
CLASSE

Uma distribuição de freqüência sem
intervalo de classe é representada
graficamente por um diagrama onde cada
valor da variável é representado por um
segmento de reta vertical e de comprimento
proporcional à respectiva freqüência.

Exemplo:

i x
i
f
i
F
i
1 2 4 4
2 3 7 11
3 4 5 16
4 5 2 18
5 6 1 19
6 7 1 20


= 20



0
2
4
6
8
1 2 3 4 5 6 7
F
r
e
q
ü
ê
n
c
i
a

Também podemos representar a
distribuição pelo gráfico da freqüência
acumulada, o qual se apresentará com pontos
de descontinuidade nos valores observados da
variável:






Exercícios:

1) Dada a distribuição abaixo, construa para os
dados apresentados:

Áreas
(m
2
)
nº de
lotes
300 ├ 400 14
400 ├ 500 46
500 ├ 600 58
600 ├ 700 76
700 ├ 800 68
800 ├ 900 62
900 ├ 1000 48
1000 ├ 1100 22
1100 ├ 1200 6

O polígono de freqüência
acumulada é traçado marcando-se as
freqüências acumuladas sobre
perpendiculares ao eixo horizontal,
levantadas nos pontos correspondentes aos
limites superiores dos intervalos de classe.
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 27
a) O histograma;
b) o polígono de freqüência;
c) o polígono de freqüência acumulada.

2) Dada a distribuição abaixo, construa para
os dados apresentados:

i Classes f
i

1 4 ├ 8 2
2 8 ├ 12 5
3 12 ├ 16 9
4 16 ├ 20 6
5 20 ├ 24 2
6 24 ├ 28 1

Σ = 25





3) Conhecidas as notas de 50 alunos:

68 85 33 52 66 77 84 65 74 57
71 35 81 50 35 64 74 47 54 68
80 61 41 91 55 73 59 53 77 45
41 55 78 48 69 85 67 39 60 76
94 88 66 66 73 42 65 94 88 89

pede-se:
a) A distribuição de freqüência começando
por 30 e adotando-se o intervalo de classe
de amplitude igual a 10.
b) A freqüência acumulada.
c) O histograma.
d) O polígono de freqüência.
f) O polígono de freqüência acumulada.

4) A tabela abaixo apresenta os coeficientes
de liquidez obtidos da análise de balanço
em 50 indústrias

3,9 7,4 10,0 11,8 2,3 4,5 10,5 8,4 15,6
18,8 2,9 2,3 0,4 5,0 9,0 5,5 9,2 12,4
4,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8
7,1 3,2 2,7 16,2 2,7 9,5 13,1 3,8 6,3
4,8 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6
7,5 8,7 4,4 7,9 16,0

pede-se:
a) Formar com esses dados uma distribuição
com intervalos de classe igual a 3, tais que
os limites inferiores sejam múltiplos de 3.
b) Confeccionar o histograma.
c) O polígono de freqüência.
d) O polígono de freqüência acumulada
correspondente.

5) Um grau de nebulosidade, registrado em
décimos, ocorre de acordo com a distribuição
abaixo:

Nebulo
sidade
0 ├ 0,5├ ,5├ 2,5├ 3,5├ 4,5├ 5,5 ├ 6,5├ 7,5├ 8,5├ 9,5├ 10
f
i
320 125 75 65 45 45 55 65 90 145 676

Pede-se:
a) A freqüência acumulada.
b) O histograma.
c) O polígono de freqüência.
d) O polígono de freqüência acumulada.

6) Dado o histograma abaixo, construa:
0
2
4
6
8
10
12
8 10 12 14 16 18 20 22
f
r
e
q
u
ê
n
c
i
a
classes






7) Dado o polígono de freqüência abaixo,
construa:

0
2
4
6
8
10
12
14
16
10 14 18 22 26 30 34 36
f
r
e
q
u
ê
n
c
i
a
X



a) O histograma.
b) O polígono de freqüência.
c) O polígono de freqüência acumulada
a) Uma tabela de freqüência para os dados
apresentados.
b) O polígono de freqüência.
c) O polígono de freqüência acumulada.

a)Uma tabela de freqüência para os
dados apresentados.
b) O histograma.
c) O polígono de freqüência acumulada.

Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 28
8) Examinando o histograma abaixo, que
corresponde às notas relativas à aplicação
de um teste de inteligência a um grupo de
alunos, responda:

a) Qual é o intervalo de classe que tem
maior freqüência?
b) Qual a amplitude total da distribuição?
c) Qual o número total de alunos?
d) Qual é a freqüência do intervalo de
classe 110 ├ 120?
e) Quais os dois intervalos de classe que
têm a mesma freqüência?
f) Quais são os dois intervalos de classe
tais que a freqüência de um é o dobro
da freqüência do outro?
g) Quantos alunos receberam notas de
teste entre 90 (inclusive) e 110?
h) Quantos alunos receberam notas não-
inferiores a 100?

0
5
10
15
20
25
30
40 60 80 100 120 160
f
r
e
q
u
ê
n
c
i
a
classes
140
9) O gráfico mostra a distribuição de uma
amostra de garrafas de refrigerantes e seus
respectivos volumes em mililitros:

0
100
200
300
400
500
280 300 320
Volume (ml)
F
r
e
q
ü
ê
n
c
i
a
(
n
º

d
e

g
a
r
r
a
f
a
s
a) Quantas garrafas compõem essa amostra?
b) Qual a freqüência relativa da classe “300
ml”?
MEDIDAS DE POSIÇÃO

As medidas de posição mais
importantes são as medidas de tendência
central, que recebem tal denominação pelo
fato de os dados observados tenderem, em
geral, a se agrupar em torno dos valores
centrais. Dentre as medidas de tendência
central, destacamos a média aritmética, a
mediana e a moda.

MÉDIA ARITMÉTICA (
_
X)










sendo:

_
x a média aritmética;

i
x os valores da variável;
n o número de valores.

Dados não-agrupados

Quando desejamos conhecer a média
dos dados não-agrupados, determinamos a
média aritmética simples.

Exemplo:
Sabendo-se que a produção leiteira
diária da vaca A, durante uma semana, foi de
10, 14, 13, 15, 16, 18 e 12 litros, temos, para
produção média da semana:

14
7
98
7
12 18 16 15 13 14 10
x = =
+ + + + + +
=
_
Logo:
14 x =
_
litros


Dados agrupados

Sem intervalo de classe

Média aritmética é o quociente da
divisão da soma dos valores da variável
pelo número deles.
n
x
x
i

=
_

Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 29
Neste caso, como as freqüências são
números indicadores de cada valor da
variável, elas funcionam como fatores de
ponderação, o que nos leva a calcular a média
aritmética ponderada, dada pela fórmula:






Exemplo:

Considere a distribuição relativa a 34
famílias de quatro filhos, tomando para
variável o número de filhos do sexo
masculino:

Nº DE FILHOS f
i
x
i
f
i
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16


= 34

= 78

Temos, então:
3 2 x 29 2
34
78
x
f
f x
x
i
i i
, ,
_ _ _
= ⇒ = = ⇒ =



isto é:
3 2 x ,
_
= meninos

Com intervalo de classe

Neste caso, convencionamos que
todos os valores incluídos em um
determinado intervalo de classe coincidem
com o seu ponto médio, e determinamos a
média aritmética ponderada por meio da
fórmula:





Onde x
i
é o ponto médio da classe.

Exemplo:
Consideremos a distribuição:

i ESTATURAS
(cm)
f
i
x
i
x
i
f
i
1 150 ├ 154 4 152 608
2 154├ 158 9 156 1.404
3 158├ 162 11 160 1.760
4 162├ 166 8 164 1.312
5 166├ 170 5 168 840
6 170├ 174 3 172 516


= 40


= 440 6.

cm 161 x 161
40
440 6
f
f x
x
i
i i
= ⇒ = = =


_ _
.


Exercícios:

1) As idades dos jogadores de um time de
basquetebol são 18, 23, 19, 20 e 21 anos.
Qual é a média de idade desses jogadores?

2) Entre sessenta números, vinte são iguais a
5, dez são iguais a 6, quinze são iguais a 8,
dez são iguais a 12, e cinco são iguais a 1.
Determine a média aritmética desses
números.

3) Quatro funcionários A, B, C e D de uma
empresa têm respectivamente 8, 6, 10 e 16
anos de trabalho nessa empresa. O
funcionário A recebeu um prêmio de R$
500,00 por ano de casa; B recebeu um
prêmio de R$ 600,00 por ano de casa; e C e
D receberam, cada um, R$ 800,00 de
prêmio por ano de casa. Qual foi o prêmio
médio recebido por ano de casa por esses
funcionários?

4) As classes A, B e C da segunda série do
ensino médio tiveram respectivamente as
seguintes médias na prova de matemática:
6,5; 6,0 e 7,0. Sabendo que a classe A é
formada por 28 alunos, B é formada por 25
alunos e C, por 22 alunos, calcule a nota
média de todos os 75 alunos.

5) A tabela mostra a distribuição de freqüência
da carga, em toneladas, dos caminhões que
passaram por uma estrada num certo
período.
Calcule a carga média desses caminhões.



=
i
i i
f
f x
x
_



=
i
i i
f
f x
x
_

Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 30
Carga
(em toneladas)
Número de
caminhões
[ 9,5;14,5 [ 18
[ 14,5;19,5 [ 33
[ 19,5;25,5 ] 9


A MODA ( Mo )






Dados não-agrupados

Quando lidamos com valores não-
agrupados, a moda é facilmente reconhecida:
basta, de acordo com a definição, procurar o
valor que mais se repete.

Exemplo:

A série de dados:

7, 8, 9, 10, 10, 10, 11, 12, 13, 15

tem moda igual a 10.

Podemos, entretanto, encontrar séries
nas quais não exista valor modal, isto é, nas
quais nenhum valor apareça mais vezes que
outros. É o caso da série:

3, 5, 8, 10, 12, 13

que não apresenta moda ( amodal ).

Em outros casos, ao contrário, pode
haver dois ou mais valores de concentração.
Dizemos, então, que a série tem dois ou mais
valores modais. Na série:

2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9

temos duas modas: 4 e 7 ( bimodal ).

Dados agrupados

Sem intervalo de classe

Uma vez agrupados os dados, é
possível determinar imediatamente a moda:
basta fixar o valor da variável de maior
freqüência.

Exemplo:

Dada a distribuição

Nº DE FILHOS f
i
0 2
1 6
2 10
3 12
4 4


= 34

A freqüência máxima ( 12 ) corresponde o
valor 3 da variável. Logo:
Mo = 3

Com intervalo de classe

A classe que apresenta a maior
freqüência é denominada classe modal. Pela
definição, podemos afirmar que a moda, neste
caso, é o valor dominante que está
compreendido entre os limites da classe modal.
O método mais simples para o cálculo
da moda consiste em tomar o ponto médio da
classe modal.
Damos a esse valor a denominação de
moda bruta.
Temos, então:






onde:

l é o limite inferior da classe modal;
L é o limite superior da classe modal.


Exemplo:

Para a distribuição:

i Estaturas f
i

Denominamos moda o valor
que ocorre com maior freqüência em
uma série de valores.
2
L l
Mo
+
=
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 31
(cm)
1 150 ├ 154 4
2 154 ├ 158 9
3 158 ├ 162 11
4 162 ├ 166 8
5 166 ├ 170 5
6 170 ├ 174 3


= 40

2
L l
Mo
+
=
160
2
320
2
162 158
Mo = =
=
=
Logo:

Mo = 160 cm

A MEDIANA ( Md )









Dados não-agrupados

Dada uma série de valores:

5, 13, 10, 2, 18, 15, 6, 16, 9,

o primeiro passo é o da ordenação ( crescente
ou decrescente ) dos valores:

2, 5, 6, 9, 10, 13, 15, 16, 18

em seguida, tomamos aquele valor central que
apresenta o mesmo número de elementos à
direita e à esquerda. Em nosso exemplo, esse
valor é o 10, já que, nessa série, há quatro
elementos acima dele e quatro abaixo.
Temos, então:
Md = 10

Se, porém, a série dada tiver um
número par de termos, a mediana será, por
definição, qualquer dos números
compreendidos entre os dois valores centrais
da série. Convencionou-se utilizar o ponto
médio.
Assim, a série de valores:

2, 6, 7, 10, 12, 13, 18, 21

tem para mediana a média aritmética entre 10 e
12
Logo:
11
2
22
2
12 10
Md = =
=
=
donde:
Md = 11

Dados agrupados

Se os dados agrupam em uma
distribuição de freqüência, o cálculo da
mediana se processa de modo muito
semelhante àquele dos dados não-agrupados,
implicando, porém, a determinação prévia das
freqüências acumuladas. Ainda aqui, temos
que determinar um valor tal que divida a
distribuição em dois grupos que contenham o
mesmo número de elementos.
Para o caso de uma distribuição, porém,
a ordem, a partir de qualquer um dos extremos,
é dada por:




Sem intervalo de classe

Neste caso, basta identificar a
freqüência acumulada imediatamente superior
à metade da soma das freqüências. A mediana
será aquele valor da variável que corresponde a
tal freqüência acumulada.

Exemplo:

Dada a distribuição de freqüência:
Nº DE
MENINOS
f
i
F
i

0 2 2
1 6 8
2 10 18
3 12 30
4 4 34


= 34

A mediana é definida como o
número que se encontra no centro de um
série de números, estando estes dispostos
segundo uma ordem.. É o valor situado de
tal forma no conjunto que o separa em dois
subconjuntos de mesmo número de
elementos.

2
f
Pos
i ∑
=
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 32
Sendo:
17
2
34
2
f
i
= =


a menor freqüência acumulada que supera
esse valor é 18, que corresponde ao valor 2 da
variável, sendo este o valor mediano. Logo:

Md = 2 meninos

No caso de existir uma freqüência
acumulada (F
i
), tal que:

2
f
F
i
i

= ,
a mediana será dada por:





isto é, a mediana será a média aritmética entre
o valor da variável correspondente a essa
freqüência acumulada e o seguinte.

Exemplo:

Dada a distribuição de freqüência:

x
i
f
i
F
i

12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8


= 8


Temos:
4
2
8
2
f
Pos
i
= = =


Logo:
5 15
2
31
2
16 15
Md , = =
+
=
Donde:
Md = 15,5


Com intervalo de classe

Neste caso, o problema consiste em
determinar o ponto do intervalo em que está
compreendida a mediana.
Para tanto, temos inicialmente que
determinar a classe na qual se acha a mediana
– classe mediana. Tal classe será,
evidentemente, aquela correspondente à
freqüência acumulada imediatamente superior
a
2
f
i ∑
.

Seguimos os seguintes passos:

1º) Determinamos as freqüências acumuladas.
2º) Calculamos
2
f
i ∑

3º) Marcamos a classe correspondente à
freqüência acumulada imediatamente superior
à
2
f
i ∑
- classe mediana – e, em seguida,
empregamos a fórmula:






na qual:
l é o limite inferior da classe mediana;
F(ant) é a freqüência acumulada da
classe anterior à classe mediana;
f é a freqüência simples da classe
mediana;
h é a amplitude do intervalo da classe
mediana.

Exemplo:

Dada a distribuição de freqüência:

i Estaturas
(cm)
f
i
F
i

1 150 ├ 154 4 4
2 154 ├ 158 9 13
3 158 ├ 162 11 24
4 162 ├ 166 8 32
5 166 ├ 170 5 37
6 170 ├ 174 3 40


= 40


2
x x
Md
1 i i +
+
=
f
h ant F
2
f
l Md
i


+ =

) (

Classe
mediana
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 33
Temos:
20
2
40
2
f
i
= =


Logo, a classe mediana é a de ordem 3. Então:

l = 158, F(ant) = 13, f = 11 e h = 4

substituindo na fórmula:
( )
11
28
158
11
4 13 20
158 Md + =

+ =
Md 54 160 54 2 158 , , = + =

isto é:
Md = 160,5 cm

Exercícios

1) Considerando os conjuntos de dados:
a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
b) 51,6; 48,7; 50,3; 49,5; 48,9
c) 20, 9, 7, 2, 12, 7, 20, 15, 7
d) 15, 18, 20, 13, 10, 16, 14

calcule:

I - a média;
II - a mediana;
III - a moda.

2) Os salários-hora de cinco funcionários de
uma companhia são:

R$ 75,00; R$ 90,00; R$ 83,00;R$ 142,00 e
R$ 88,00.

Determine:
a) a média dos salários-hora;
b) o salário-hora mediano;
c) o salário modal.

3) As notas de um candidato, em seis provas
de um concurso, foram: 8,4; 9,1; 7,2; 6,8;
8,7 e 7,2. Determine:

a) a nota média;
b) a nota mediana;
c) a nota modal

4) Considerando as distribuições:
x
i
3 4 5 6 7 8
f
i
4 8 11 10 8 3

calcule:
a) a média;
b) a mediana;
c) a moda.

5) Quando trabalhamos com variáveis
contínuas e em grande número, pode ser
interessante classificá-las em intervalos
iguais, a fim de reduzir o tempo das
operações. Nestes casos, para os cálculos
das medidas de posição costumamos
considerar todos os valores de cada
intervalo iguais ao ponto médio do
intervalo. Assim, se no intervalo de 10 a 15
tivermos 18 valores, consideraremos que
todos os 18 são iguais a 12,5, que é o valor
médio entre 10 e 15. Esta medida não
costuma acarretar erro considerável.
Com base no que afirmamos acima,
determine a média, a mediana e a moda das
seguintes distribuições de freqüências:

INTERVALO FREQÜÊNCIA
2 ├ 8 4
8 ├ 14 6
14 ├ 20 8
20 ├ 26 6


INTERVALO FREQÜÊNCIA
1 ├ 2 1
2 ├ 3 4
3 ├ 4 6
4 ├ 5 3
5 ├ 6 1


6) Numa pesquisa feita dentre os alunos de
uma escola para saber da existência de
irmãos mais novos, obtiveram-se os dados
mostrados na tabela abaixo:







Calcule:
a) o número médio de irmãos mais novos;
b) o número mediano de irmãos mais novos;
c) a moda de irmãos mais novos.
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 34
nº de irmãos
mais novos
Freqüência
6 4
5 6
4 10
3 12
2 22
1 31
0 18


7) Determine a média, a mediana e a moda
das seguintes distribuições de freqüências:

INTERVALO FREQÜÊNCIA
1,60 ├ 1,65 4
1,65 ├ 1,70 7
1,70 ├ 1,75 9
1,75 ├ 1,80 12
1,80 ├ 1,85 6
1,85 ├ 1,90 2

8) (UFRJ) O gráfico mostra a distribuição de
uma prova de matemática.

0
2
4
6
8
10
1 2 3 4 5 6 7 8 9 10
N
ú
m
e
r
o

d
e

a
l
u
n
o
s
Notas

a) Quantos alunos fizeram a prova?
b) Determine a média aritmética das
notas dessa prova.

9) (Unicamp-SP) O gráfico, em forma de
pizza, representa as notas obtidas em uma
questão pelos 32.000 candidatos presentes
à primeira fase de uma prova de vestibular.
Ele mostra, por exemplo, que 32% desses
candidatos tiveram nota 2 nessa questão.

Pergunta-se:

a) Quantos candidatos tiveram nota 3?
b) É possível afirmar que a nota média,
nessa questão, foi ≤ 2? Justifique sua
resposta.
c) Qual é a moda do conjunto das notas de
todos os alunos?
d) Qual é a mediana do conjunto das notas
de todos os alunos?


4 (12%)
5 (10%)
0 (10%)
1 (20%)
2 (32%)
3 (16%)


10) (Vunesp) Suponhamos que nos
vestibulares desse ano uma universidade
tivesse tido, para os seus diversos cursos,
uma média de 3,60 candidatos por vaga
oferecida. Se para os vestibulares do ano
que vem o número de vagas for aumentado
de 20% e o número de candidatos aumentar
em 10%, qual a média de candidatos por
vaga que essa universidade terá no próximo
ano?

a) 3,24 b) 3,30 c) 3,36 d) 3,40 e) 3,46


MEDIDAS DE DISPERSÃO OU DE
VARIABILIDADE

A média aritmética, a mediana e a
moda, são valores que podem servir de
comparação para dar a posição de qualquer
elemento do conjunto.
Entretanto, quando se trata de
interpretar dados estatísticos, mesmo aqueles já
convenientemente simplificados, é necessário
ter-se uma idéia retrospectiva de como se
apresentavam esses mesmos dados nas tabelas.
Assim, não é o bastante dar uma das
medidas de posição para caracterizar
perfeitamente um conjunto de valores, pois,
mesmo sabendo, por exemplo, que a
temperatura média de duas cidades é a mesma,
e igual a 24º C, ainda assim somos levados a
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 35
pensar a respeito do lima dessas cidades. Em
uma delas poderá a temperatura variar entre
limites de muito calor e de muito frio e haver,
ainda, uma temperatura média de 24º C. A
outra poderá ter uma variação pequena de
temperatura e possuir, portanto, no que se
refere à temperatura, um clima mais
favorável.
As medidas de posição, ainda que
considerada como um número que tem a
faculdade de representar uma série de valores,
não pode, por si mesma, destacar o grau de
homogeneidade ou heterogeneidade que
existe entre os valores que compões o
conjunto.
Consideremos os seguintes conjuntos
de valores das variáveis x, y e z:

X: 70, 70, 70, 70, 70
Y: 68, 69, 70, 71, 72
Z: 5, 15, 50, 120, 160.

Calculando a média aritmética de cada
um desses conjuntos, obtemos:

70 z
70 y
70 x
=
=
=
_
_
_


Vemos, então, que os três conjuntos
apresentam a mesma média aritmética: 70.
Entretanto, é fácil notar que o
conjunto X é mais homogêneo que os
conjuntos Y e Z, já que todos os valores são
iguais à média.
O conjunto Y, por sua vez, é mais
homogêneo que o conjunto Z, pois há menor
diversificação entre cada um de seus valores e
a média representativa.











Portanto, para qualificar os valores de
uma variável, ressaltando a maior ou menor
dispersão ou variabilidade entre esses valores e
a sua medida de posição, a Estatística recorre às
medidas de dispersão ou de variabilidade.
Dessas medidas, estudaremos a
amplitude total, a variância, o desvio padrão
e o coeficiente de variação.

AMPLITUDE TOTAL






Dados não-agrupados





Para os valores:
40, 45, 48, 52, 54, 62 e 70
temos:
AT = 70 – 40 = 30
Logo:
AT = 30


Quando dizemos que a amplitude total
dos valores é 30, estamos afirmando alguma
coisa do grau de sua concentração. É evidente
que, quanto maior a amplitude total, maior é a
dispersão ou variabilidade dos valores da
variável.
Considerando os conjuntos X, Y e Z
citados anteriormente, temos:

AT
x
= 70 – 70 = 0 (dispersão nula)

AT
y
= 72 – 68 = 4

AT
z
= 160 – 5 = 155

Dados agrupados

Sem intervalo de classe



Considerando a tabela:
Chamando de dispersão ou
variabilidade a maior ou menor
diversificação dos valores de uma variável
em torno de um valor de tendência central
tomado como ponto de comparação,
podemos dizer que o conjunto X apresenta
dispersÃo ou variabilidade nula e que o
conjunto Y apresenta uma dispersão ou
variabilidade menor que o conjunto Z .
A amplitude total é a diferença
entre o maior e o menor valor
observado.
AT = x(max.) – x(min.)
AT = x(max.) – x(min.)
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 36

x
i
0 1 2 3 4
f
i
2 6 12 7 3

Temos:
AT = 4 – 0 = 4
Logo:
AT = 4

Com intervalo de classe

Neste caso a amplitude total é a
diferença entre o limite superior da última
classe e o limite inferior da primeira classe:




Considerando a distribuição:

i Estaturas
(cm)
f
i

1 150 ├ 154 4
2 154 ├ 158 9
3 158 ├162 11
4 162 ├ 166 8
5 166 ├ 170 5
6 170 ├ 174 3


= 40

temos:
AT = 174 – 150 = 24
Logo:
AT = 24 cm

A amplitude total tem o inconveniente
de só levar em conta os dois valores extremos
da série, descuidando de valores
intermediários, o que quase sempre invalida a
idoneidade do resultado. Ela é apenas uma
indicação aproximada da dispersão ou
variabilidade.
Faz-se uso da amplitude total quando
se quer determinar a amplitude da temperatura
em um dia ou no ano, no controle da
qualidade ou como uma medida de cálculo
rápido, e quando a compreensão popular é
mais importante que a exatidão e a
estabilidade.

Exercícios:
1) Calcule a amplitude total dos conjuntos de
dados:
a) 1, 3, 5, 9
b) 20, 14, 15, 19, 21, 22, 20
b) -10, -6, 2, 3, 7, 9, 10
c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2

2)Calcule a amplitude total das distribuições:
a)

x
i


2

3

4

5

6

7

8

f
i


1

3

5

8

5

4

2
b)

CLASSES

1,5├1,6├1,7├1,8├1,9├2,0├ 2,1├ 2,2

f
i


4 8 12 15 12 8 4

VARIÂNCIA

Uma outra medida que indica o
afastamento dos elementos de uma amostra,
em relação à média aritmética, é a variância,
que se representa por σ
2
. define-se essa medida
como a média aritmética entre os quadrados
dos desvios dos elementos da amostra, isto é:







Ou, lembrando que
∑ i
f = n







DESVIO PADRÃO

Na interpretação da variância podem
surgir algumas dificuldades em relação à
unidade de medida dos elementos da amostra.
Por exemplo, se os elementos da amostra
representam capacidades em litros ( l ), a
variância representará um resultado em l
2
;
como essa unidade não tem significado físico,
não é conveniente utilizar a variância nesse
AT = L(max.) – l(mín.)
σ
2
=


|
|
¹
|

\
|


i
2
i
f
x x

σ
2
=
n
x x
2
i ∑
|
|
¹
|

\
|



Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 37
caso. Por causa de dificuldades como essa, foi
criado o desvio padrão, representado por σ, e
definido como a raiz quadrada da variância.






Dados não-agrupados

Tomemos, como exemplo, o conjunto
de valores da variável x:

40, 45, 48, 52, 54, 62, 70

O modo mais prático para se obter o
desvio padrão é formar uma tabela com duas
colunas: Uma para x
i
e outra para x
i
2
. Assim:

x
i
X
i
2

40 1.600
45 2.025
48 2.304
52 2.704
54 2.916
62 3.844
70 4.900

= 371

= 293 20.

Como n = 7, temos:
2
i
2
i
n
x
n
x
|
|
¹
|

\
|
− = σ
∑ ∑


= − =
|
¹
|

\
|
− = σ
2
2
53 899 2
7
371
7
293 20
.
.

= 486 9 90 809 2 899 2 , . . = = −

Logo:
σ = 9,49

Dados agrupados

Sem intervalo de classe

Como, neste caso, temos a presença de
freqüências, devemos leva-las em
consideração, resultando a fórmula:





Exemplo:

x
i
f
i
f
i
x
i
f
i
x
i
2

0 2 0 0
1 6 6 6
2 12 24 48
3 7 21 63
4 3 12 48


= 30

= 63

= 165

Logo:

2
i i
2
i i
n
x f
n
x f
|
|
¹
|

\
|
− = σ
∑ ∑


044 1 09 1
41 4 5 5
30
63
30
165
2
, ,
, ,
=
= − = |
¹
|

\
|
− = σ


Então:
σ = 1,04

Com intervalos de classe

Começamos por abrir as colunas para x
i
que é o
ponto médio do intervalo de classe.

Exemplo:

i Estaturas
(cm)
f
i
x
i
f
i
x
i
f
i
x
i
2
1 150├154 4 152 608 92.416
2 154├158 9 156 1.404 219.024
3 158├162 11 160 1.760 281.600
4 162├166 8 164 1.312 215.168
5 166├170 5 168 840 141.120
6 170├174 3 172 516 88.752


= 40


= 440 6.


= 080 038 1 . .



Logo:
2
i
2
i
n
x
n
x
|
|
¹
|

\
|
− = σ
∑ ∑

2
i i
2
i i
n
x f
n
x f
|
|
¹
|

\
|
− = σ
∑ ∑

Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 38

= − =
|
¹
|

\
|
− = σ 921 25 952 25
40
440 6
40
080 038 1
2
. .
. . .

567 5 31 , = =
Então:
σ = 5,57 cm

COEFICIENTE DE VARIAÇÃO
O desvio padrão por si só não nos diz
muita coisa. Assim, um desvio padrão de duas
unidades pode ser considerado pequeno para
uma série de valores cujo valor médio é 200;
no entanto, se a média for igual a 20, o mesmo
não pode ser dito. Além disso, o fato de o
desvio padrão ser expresso na mesma unidade
dos dados limita o seu emprego quando
desejamos comparar duas ou mais séries de
valores, relativamente à sua dispersão ou
variabilidade, quando expressas em unidades
diferentes.
Para contornar essas dificuldades e
limitações, podemos caracterizar a dispersão
ou variabilidade dos dados em termos
relativos a seu valor médio, medida essa
denominada coeficiente de variação (CV):





Exemplo:

Tomemos os resultados das medidas
das estaturas e dos pesos de um mesmo grupo
de indivíduos:



x
σ
Estaturas 175 cm 5,0 cm
Pesos 68 Kg 2,0 Kg

Temos:
CV
E
= % , , 85 2 100 x 0285 0 100 x
175
5
= =
CV
P
= % , , 94 2 100 x 0294 0 100 x
68
2
= =

Logo, nesse grupo de indivíduos, os
pesos apresentam maior grau de dispersão que
as estaturas.

Exercícios

1)Sabendo que um conjunto de dados apresenta
para média aritmética e para desvio padrão,
respectivamente, 18,3 e 14,7, calcule o
coeficiente de variação.

2) Em um exame final de Matemática, o grau
médio de um grupo de 150 alunos foi 7,8 e o
desvio padrão, 0,80. Em Estatística,
entretanto, o grau médio final foi 7,3 e o
desvio padrão de 0,76. Em que disciplina foi
maior a dispersão?

3) Medidas as estaturas de 1.017 indivíduos,
obtivemos x =162,2 cm e s=8,01 cm. O peso
médio desses mesmos indivíduos é 52 Kg,
com um desvio padrão de 2,3 Kg. Esses
indivíduos apresentam maior variabilidade
em estatura ou peso?

4) Um grupo de cem estudantes tem uma
estatura média de 163,8 cm, com um
coeficiente de variação de 3,3%. Qual o
desvio padrão desse grupo?

5) Uma distribuição apresenta as seguintes
estatísticas: s=1,5 e CV=2,9%. Determine a
média da distribuição.

6) Mostre que os conjuntos 2, 4, 6, 8, 10 e 3, 5,
7, 9, 11 têm o mesmo desvio padrão.
Verifique, também, se há alguma relação
entre as médias.

7) Num exame de História, duas classes
obtiveram as seguintes médias e desvios:
classe A: x = 5,4 s= 2,6
classe B: x = 5,4 s= 3,1
Se for sorteado um aluno em cada classe, em
qual delas é mais provável que a nota desse
aluno esteja entre 3,0 e 7,0? Por quê?

8) (Fuvest-SP) Dois atiradores X e Y
obtiveram numa série de vinte tiros, num
alvo de forma indicada na figura, os
seguintes resultados:

100 x
x
CV
_
σ
=
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 39












Resultado Atirador
50 30 20 10 0
X 4 6 5 4 1
Y 6 3 5 3 3

Calcule e compare os desvios padrões
de cada uma das séries de tiros e decida qual é
o atirador com desempenho mais regular.

9) Para preencher uma vaga de gerente de
produção, o departamento de recursos
humanos de uma empresa realizou um
teste com vários candidatos, selecionando
os dois melhores: Leonor e Felipe. A
tabela mostra os desempenhos dos dois
candidatos nas provas a que se
submeteram:

Candidato

Assunto

Felipe

Leonor
Conhecimentos
de informática
8,5 9,5
Língua
Portuguesa
9,5 9,0
Língua Inglesa 8,0

8,5
Matemática

7,0 8,0
Conhecimentos
de Economia
7,0 5,0
Média =
8,0
Média = 8,0







10)(Fuvest-SP, modificado) A distribuição dos
salários de uma empresa é dada na seguinte
tabela:
Salário em R$ Número de
funcionários
500,00 10
1.000,00 5
1.500,00 1
2.000,00 10
5.000,00 4
10.500,00 1
Total 31

a) Qual é a média e qual é a mediana dos
salários dessa empresa?
b) Suponha que sejam contratados dois
novos funcionários com salários de
R$2.000,00 cada. A variância da nova
distribuição de salários ficará menor,
igual ou maior do que a anterior?

11) O gráfico abaixo mostra a istribuição de
freqüência das notas obtidas pelos alunos da
segunda série do ensino médio numa prova
de educação física.

0
3
6
9
12
15
18
21
1 2 3 4 5 6 7 8 9 10
Nota
N
ú
m
e
r
o

d
e

a
l
u
n
o
s

Determinar:
a) a nota média desses alunos;
b) a mediana dessa distribuição;
c) a moda dessa distribuição.


PROBABILIDADE

Em condições normais podemos prever
a que temperatura o leite ferve. Esse tipo de
experimento, cujo resultado é previsível, recebe
o nome de determinístico. Mas, ao lançar um
dado uma ou mais vezes, não podemos saber
com antecedência o número que se vai obter;
sabemos apenas que os possíveis resultados são
1, 2, 3, 4, 5 ou 6. Esse tipo de experimento,
50 10 30 20
Os dois candidatos obtiveram a
mesma média. Como proceder,
cientificamente, para determinar qual dos
dois teve o melhor desempenho nessa
avaliação?
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 40
cujo resultado não pode ser previsto, é
chamado aleatório.
Como exemplos de experimentos
aleatórios temos:
• o sorteio de uma loteria de números;
• a escolha de um número de 1 a 50;
• o sorteio do primeiro prêmio da loteria
federal;
• o lançamento de uma moeda.

Na teoria das probabilidades, estudamos
os experimentos aleatórios equiprováveis, ou
seja, aqueles em que qualquer resultado pode
ocorrer com a mesma chance. É o caso do
lançamento de uma moeda: a possibilidade de
ocorrer cara ou coroa é a mesma.








ESPAÇO AMOSTRAL

A cada experimento correspondem, em
geral, vários resultados possíveis. Assim, ao
lançarmos uma moeda, há dois resultados
possíveis: ocorrer cara ou ocorrer coroa. Já ao
lançarmos um dado há seis resultados
possíveis: 1, 2, 3, 4, 5, ou 6.
Ao conjunto desses resultados
possíveis damos o nome de espaço amostral
ou conjunto universo, representado por S.
O número de elemento desse conjunto
é indicado por n(S).
Os dois experimentos citados
anteriormente têm os seguintes espaços
amostrais:

• lançamento de uma moeda S = { Ca, Ko}
• lançamento de um dado S={1,2, 3, 4, 5, 6}
• lançamento de duas moedas
S = {(Ca,Ko); (Ca,Ca); (Ko,Ca); (Ko,Ko)}

Cada um dos elementos de S que
corresponde a um resultado recebe o nome de
ponto amostral.



EVENTOS

Chamamos de evento qualquer
subconjunto do espaço amostral S de um
experimento aleatório.
Assim, qualquer que seja E, se E⊂S (E
está contido em S), então E é um evento de S.
Se E=S, E é chamado evento certo;
Se E⊂S e E é um conjunto unitário, E é
chamado evento elementar;
Se E = ∅ ∅∅ ∅, E é chamado evento
impossível.
Exemplo:
No lançamento de um dado, onde
S={1,2,3,4,5,6},
• obter um número par na face superior
A = {2,4,6} A ⊂ S; logo, A é um
evento de S.

• obter um número menor ou igual a 6 na
face superior
B = {1,2,3,4,5,6} B ⊂ S; logo, B é
um evento certo de S (B = S).

• obter o número 4 na face superior
C = {4} C ⊂ S; logo, C é um evento
elementar de S.

• obter um número maior que 6 na face
superior
D = ∅ logo, D é um evento
impossível de S

Exercícios

1) Determine o espaço amostral do experimento
aleatório “lançamento simultâneo de duas
moedas”.

2) considerando o experimento aleatório
“nascimento de três filhos de um casal”,
determine o espaço amostral e o subconjunto
que representa o evento nascimento de
exatamente dois meninos em três filhos do
casal.

3) No lançamento de um dado, determine o
evento para obter:
a) um número maior que 4.
Experimentos ou fenômenos
aleatórios são aqueles que, mesmo
repetidos várias vezes sob condições
semelhantes, apresentam resultados
imprevisíveis.
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 41
b) Um número primo

4) Considerando o experimento “sorteio de
um número de 1 a 20”, determine o evento
para obter um número:
a) múltipla de 3.
b) múltiplo de 5.
c) Primo

5) No lançamento simultâneo de dois dados
diferentes, determine os seguintes eventos:
a) números iguais nos dois dados;
b) números cuja soma seja 2;
c) números cuja soma seja 7;
d) números cuja soma seja 13.

Probabilidade

Dado um experimento aleatório, sendo
S o seu espaço amostral, vamos admitir que
todos os elementos de S tenham a mesma
chance de acontecer, ou seja, que S é um
conjunto equiprovável.
Chamamos de probabilidade de um
evento A (A ⊂ S) o número real P(A), tal que:




onde:
n(A) é o número de elementos de A
n(S) é o número de elementos de S

Exemplos:

1) Lançamento de uma moeda e o evento
obter cara.

S = {Ca, Ko} E = {Ca}
n(S) = 2 n(E) = 1
logo:
) (
) (
) (
S n
A n
A P = =
2
1
= 50%

2) Lançamento de um dado, calcular:

a) obter um número primo

S = {1,2,3,4,5,6} E = {2,3,5}
n(S) = 6 n(E) = 3
2
1
6
3
A P = = ) (
b) obter um número par na face superior

S = {1,2,3,4,5,6} E = {2,4,6}
n(S) = 6 n(E) = 3
2
1
6
3
B P = = ) (

c) obter um número menor ou igual a 6 na face
superior

S = {1,2,3,4,5,6} E = {1,2,3,4,5,6}
n(S) = 6 n(E) = 6
1
6
6
C P = = ) (

d) obter um número maior que 6 na face
superior

S = {1,2,3,4,5,6} E = ∅
n(S) = 6 n(E) = 0
0
6
0
D P = = ) (

Propriedades

1ª) Se E = ∅ ∅∅ ∅, então n(E) = 0 e, portanto,
P(E)=0 ( probabilidade do evento
impossível).

2ª) Se E = S, então n(E) = n(S) e P(E) = 1
(probabilidade do evento certo).

3ª) Se E ⊂ ⊂⊂ ⊂ S, então 0 ≤ n(E) ≤ n(S)
0 ≤ P(E) ≤ 1

4ª) Se A é conjunto unitário, então n(E) = 1
(evento elementar E qualquer)
n
1
E P = ) (

Exercícios:

1) Na escolha de um número de 1 a 30, qual a
probabilidade de que seja sorteado um
múltiplo de 5?

2) Qual a probabilidade de, no lançamneto
simultâneo de dois dados diferentes, obter
soma igual a 7?

3) Qual a probabilidade de sair o ás de ouro
quando retiramos uma carta de um baralho
de 52 cartas?
) (
) (
) (
S n
A n
A P =
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 42

4) Qual a probabilidade de sair um rei quando
retiramos uma carta de um baralho de52
cartas?

5) Uma urna contém 10 bolas brancas, 8
vermelhas e 6 pretas, todas iguais e
indistinguíveis ao tato. Retirando-se uma
bola ao acaso, qual a probabilidade de ela
não ser preta?

6) a probabilidade de você ganhar uma
bicicleta numa rifa de 100 números da qual
você comprou quatro números é:

a)
5
2
b)
10
1
c)
25
1

d)
30
1
e)
50
1


Eventos Complementares

Sabemos que um evento pode ocorrer
ou não. Sendo p a probabilidade de que ele
ocorra (sucesso) e q a probabilidade de que
ele não ocorra (insucesso), para um evento
existe sempre a relação:




Assim, se a probabilidade de se
realizar um evento é p =
5
1
, a probabilidade de
que ele não ocorra é:

q = 1 – p q = 1 –
5
1
=
5
4


Exemplo:

Sabemos que a probabilidade de tirar 4
no lançamento de um dado é p =
6
1
. Logo, a
probabilidade de não tirar o 4 no lançamento
de um dado é

q = 1 -
6
5
6
1
=
Eventos Independentes

Dizemos que dois eventos são
independentes quando a realização ou a não
realização de um dos eventos não afeta a
probabilidade do outro e vice-versa.

Exemplo:

Quando lançamos dois dados, o
resultado obtido em um deles independe do
resultado obtido no outro.

Se dois eventos são independentes, a
probabilidade de que eles se realizem
simultaneamente é igual ao produto das
probabilidade de realização dos dois eventos.


Assim, sendo p
1
a probabilidade de
realização do primeiro evento e p
2
a
probabilidade de realização do segundo evento,
a probabilidade de que tais eventos se realizem
simultaneamente é dada por:




Exemplo:

Lançamos dois dados. A probabilidade
de obtermos 1 no primeiro dados é p
1
=
6
1

A probabilidade de obtermos 5 no
segundo dado é p
2
=
6
1

Logo, a probabilidade de obtermos,
simultaneamente , 1 no primeiro e 5 no
segundo é
36
1
6
1
x
6
1
p = =

Eventos Mutuamente Exclusivos

Dizemos que dois ou mais eventos são
mutuamente exclusivos quando a realização de
um exclui a realização do(s) outro(s).
Assim, no lançamento de uma moeda, o
evento “tirar cara”e o evento “tirar coroa”são
mutuamente exclusivos, já que, ao se realizar
um deles, o outro não se realiza.
Se dois eventos são mutuamente
exclusivos, a probabilidade de que um ou outro
se realize é igual à soma das probabilidades de
que cada um deles se realize.
p + q = 1 q = 1 - p

p = p
1
x p
2

Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 43



Exemplo:
Lançamos um dado. A probabilidade
de se tirar o 3 ou o 5 é

3
1
6
2
6
1
6
1
p = = + =
pois como vimos, os dois eventos são
mutuamente exclusivos.

Exercícios:

1) No lançamento de dois dados, calcule a
probabilidade de se obter soma igual a 5.

2) Determine a probabilidade de cada
evento:
a) Um número par aparece no lançamento
de um dado.
b) Uma só coroa aparece no lançamento
de três moedas.

3) Dois dados são lançados
simultaneamente. Determine a
probabilidade de:
a) A soma ser menor que 4.
b) A soma ser 9.
c) O primeiro resultado ser maior que o
segundo.
d) A soma ser menor ou igual a 5.

4) Um inteiro entre 3 e 11 será escolhido ao
acaso.
a) Qual é a probabilidade de que este
número seja ímpar?
b) Qual é a probabilidade de que este
número seja ímpar e divisível por 3?

5) No lançamento de dois dados, qual é a
probabilidade de se obter um par de
pontos iguais?

6) Um casal planeja ter três filhos.
Determine a probabilidade de nascerem:
a) Três homens.
b) Dois homens e uma mulher.

7) Uma moeda é lançada três vezes. Calcule
a probabilidade de obtermos:
a) três caras.
b) Duas caras e uma coroa
c) Uma cara somente.
d) Nenhuma cara.
e) Pelo menos uma cara.
f) No máximo uma cara.

8) Um dado é lançado duas vezes. Calcule a
probabilidade de:
a) sair um 6 no primeiro lançamento.
b) Sair um 6 no segundo lançamento.
c) Não sair 6 em nenhum lançamento.
d) Sair um 6 pelo menos.

9) Uma urna contém 50 bolas idênticas.
Sendo as bolas numeradas de 1 a 50,
determine a probabilidade de, em uma
extração ao acaso:
a) obtermos a bola de número 27.
b) Obtermos uma bola de número par.
c) Obtermos uma bola de número maior
que 20.
d) Obtermos uma bola de número menor
ou igual a 20.

10) Um par de dados é atirado. Encontre a
probabilidade de que a soma seja 10 ou
maior que 10 se:
a) um 5 aparece no primeiro dado.
b) um 5 aparece pelo menos em um dado.

11) Lança-se um par de dados. Aparecendo
dois números diferentes, encontre a
probabilidade de que:
a) a soma seja 6.
b) O 1 apareça.
c) A soma seja 4 ou menor que 4.

12) Um lote é formado por 10 peças boas, 4
com defeitos e 2 com defeitos graves. Uma
peça é escolhida ao acaso. Calcule a
probabilidade de que:
a) ela não tenha defeitos graves.
b) Ela não tenha defeitos
c) Ela seja boa ou tenha defeitos graves.

13) Uma urna A contém: 3 bolas brancas, 4
pretas, 2 verdes; uma urna B contém: 5
bolas brancas, 2 pretas, 1 verde; uma urna
C contém:2 bolas brancas, 3 pretas, 4
verdes. Uma bola é retirada de cada urna.
Qual é a probabilidade de as três bolas
retiradas da primeira, Segunda e terceira
p = p
1
+

p
2

Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 44
urnas serem, respectivamente, branca,
preta e verde?

14) No lançamento de um dado, qual a
probabilidade de se obter um número não-
inferior a 5?

15) Dois dados são lançados conjuntamente.
Determine a probabilidade de a soma ser
10 ou maior que 10.

16) Uma moeda é lançada duas vezes. Calcule
a probabilidade de:
a) Não ocorrer cara nenhuma vez.
b) Obter-se cara na primeira ou na
Segunda jogada.

17) Em um lote de 12 peças, 4 são
defeituosas. Sendo retiradas
aleatoriamente e sem reposição 2 peças,
calcule:
a) A probabilidade de ambas serem
defeituosa.
b) A probabilidade de ambas não serem
defeituosas.
c) A probabilidade de ao menos uma ser
defeituosa.

18) No lançamento de um dado, qual é a
probabilidade de sair o número 6 ou um
número ímpar?

19) Uma loja dispõe de 12 geladeiras do
mesmo tipo, das quais 4 apresentam
defeitos.
a) Se um freguês vai comprar uma
geladeira, qual a probabilidade de levar
uma defeituosa?
b) Se um freguês vai comprar duas
geladeiras, qual a probabilidade de levar
duas defeituosas?
c) Se um freguês vai comprar duas
geladeiras, qual a probabilidade de levar
pelo menos uma defeituosa?

20) Um lote é formado por 10 peças boas, 4
com defeitos e duas com defeitos graves.
Retiram-se duas peças ao acaso. Calcule a
probabilidade de que:
a) ambas sejam perfeitas.
b) Pelo menos uma seja perfeita.
c) Nenhuma tenha defeitos graves.
d) Nenhuma seja perfeita.

21) Você acabou de achar a raspadinha no
pacote de Doritos. Com base na figura
abaixo calcule a probabilidade de achar a
carinha.

a)









22) Qual a probabilidade de um apostador
acertar na sena do jogo mega sena, com
uma única aposta de 6 dezenas? Sabe-se
que sorteiam 6 dezenas em 60.

23) Qual a probabilidade de um apostador
acertar na sena do jogo super sena, com 6
apostas de 6 dezenas? Sabe-se que sorteiam
6 dezenas em 48.


DISTRIBUIÇÃO DE PROBABILIDADE


Consideremos a distribuição de
freqüência relativa ao número de acidentes
diários em um estacionamento:

Nº de Acidentes Freqüência
0 22
1 5
2 2
3 1

Σ = 30

Em um dia, a probabilidade de:

• não ocorrer acidentes é:
73 0
30
22
p , = =

• ocorrer um acidente é:
PERDEU
PERDEU
PERDEU
PERDEU
PERDEU
INÍCIO
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 45

17 0
30
5
p , = =

• ocorrerem dois acidentes é:

07 0
30
2
p , = =

• ocorrerem três acidentes é:

03 0
30
1
p , = =

Podemos, então, escrever:

Nº de acidentes Probabilidade
0
30
22
= 0,73
1
30
5
= 0,17
2
30
2
= 0,07
3
30
1
= 0,03

Σ = 1,00

Essa tabela é denominada
distribuição de probabilidade.

Exemplo:

Determine a distribuição de
probabilidade para o lançamento simultâneo
de duas moedas e a probabilidade de
obtermos número de caras.

Ponto Amostral Nº de Caras Probabilidade
(Ca, Ca) 2
4
1
2
1
2
1
= ⋅
(Ca, Ko) 1
4
1
2
1
2
1
= ⋅
(Ko,Ca) 1
4
1
2
1
2
1
= ⋅
(Ko,Ko) 0
4
1
2
1
2
1
= ⋅

Ca Ko
Ca Ca Ko Ca Ko Ko

Nº de Caras Probabilidade ( P(x) )
2
4
1
= 0,25
1
4
2
= 0,5
0
4
1
= 0,25

4
4
Σ = 1

Ao lançarmos um dado, sendo a
variável aleatória x definida por “pontos de um
dado”. Faça uma tabela de distribuição de
probabilidade para cada um dos resultados do
dado. Assim, ao lançarmos um dado a variável
aleatória x, definida por “pontos de um
dado”pode tomar os valores 1, 2, 3, 4, ,5, 6.
Como cada um desses valores está associado
uma só probabilidade de realização e ΣP(x
i
) =
1, fica definida então uma função de
probabilidade da qual resulta a distribuição de
probabilidade:

x P(x)
1
6
1

2
6
1

3
6
1

4
6
1

5
6
1

6
6
1


Σ = 1

A função da probabilidade é
representada por:



A função P(x=x
i
), determina a
distribuição de probabilidade da variável
aleatória x.

Exercícios:

1) Efetue a distribuição de probabilidade do
lançamento de 2 dados e a probabilidade
para a soma dos resultados

f(x) = P(x=x
i
)
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 46
2) Construir o gráfico de pares para o
lançamento de 3 moedas ( x
i
= nº de
coroas)
a) Qual a probabilidade de saírem 2
coroas?
b) Qual a probabilidade de saírem 2 ou
mais coroas?

DISTRIBUIÇÃO BINOMIAL

Termo Geral

1) O experimento deve ser repetido nas
mesmas condições, num número finito de
vezes (n) .

2) As provas repetidas devem ser
independentes, ou seja, o resultado de uma
não deve afetar os resultados das sucessivas.

3) Em cada prova deve aparecer um dos dois
possíveis resultados: sucesso e insucesso.

4) No decorrer do experimento a
probabilidade p (sucesso) e a probabilidade q
(insucesso) somados tem que ser igual a 1
(q=1- p)

Suponhamos, que realizemos a mesma
prova n vezes sucessivas e independentes. A
probabilidade de que um evento se realize k
vezes nas provas é dada pela função:







na qual:
P(X = k) é a probabilidade de que o
evento se realize k vezes em n provas;
p é a probabilidade de que o evento se
realize em uma só prova – sucesso;
q é a probabilidade de que o evento
não se realize no decurso dessa prova –
insucesso;

| || |
| || |
¹ ¹¹ ¹
| || |


\ \\ \
| || |
k
n
é o coeficiente binomial de n
sobre k, igual a
)! ( !
!
k n k
n
− −− −

n é o número de vezes que repete a
prova;
k número de vezes que repete o evento.

Exemplo:

1)Uma moeda é lançada 5 vezes seguidas e
independentes. Calcule a probabilidade de
serem obtidas 3 caras nessas 5 provas.

Temos: n = 5 e k = 3

P(X=3) =
|
|
¹
|

\
|
3
5
p
3
q
5-3
=
|
|
¹
|

\
|
3
5
p
3
q
2

Se a probabilidade de obtermos “cara”numa só
prova (sucesso) é p=
2
1
e a probabilidade de
não obtermos “cara”numa só prova (insucesso)
é q=1 -
2
1
=
2
1
, então:

16
5
4
1
x
8
1
x
1 x 2 x 1 x 2 x 3
1 x 2 x 3 x 4 x 5
4
1
x
8
1
x
2 3
5
2
1
2
1
3
5
3 X P
2 3
= =
= =
|
¹
|

\
|
|
¹
|

\
|
|
|
¹
|

\
|
= =
! !
!
) (


Logo:
P(X=3) =
16
5


2) Dois times de futebol, A e B, jogam entre si
6 vezes. Encontre a probabilidade de o time
A ganhar 4 jogos.

n = 6, k = 4, p =
3
1
, q = 1 -
3
1
=
3
2


243
20
9
4
x
81
1
x 15
3
2
3
1
4
6
4 X P
2
4
= =
|
|
¹
|

\
|
|
¹
|

\
|
|
|
¹
|

\
|
= = ) (
Logo:
P(X = 4) =
243
20
= 0,08
Exercícios:

1) Um atirados acerta o alvo 3 vezes em uma
bateria de 5 tiros. Se ele participar de 7
baterias, qual a probabilidade dele acertar o
alvo?
k n k
q p
k
n
k X P X f

|
|
¹
|

\
|
= = = ) ( ) (
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 47

2) Jogando um dado 4 vezes, qual a
probabilidade de sair o número 5
exatamente 3 vezes?

3) Uma prova consta de 6 questões com 4
opções cada uma, com uma única
alternativa correta. Qual a probabilidade de
acertar 2 das 6 questões?

4) Uma urna contém 3 bolas azuis e 2
brancas. Retira-se uma bola ao acaso,
observando-se sua cor e recoloca-se a bola
na urna. Se esse experimento for realizado
5 vezes sucessivas, qual é a probabilidade
de se obterem exatamente 3 bolas azuis?

5) Por meio de estudos genéticos, um casal
descobre que a probabilidade de que eles
venham a ter um filho de olhos azuis é
igual a
4
1
. Se o casal pretende ter 6
filhos, qual é a probabilidade de que
exatamente 2 tenham olhos azuis?

6) Jogando-se um dado três vezes, determine
a probabilidade de se obterem um múltiplo
de 3 duas vezes.

7) dois times de futebol, A e B, jogam entre si
6 vezes. Encontre a probabilidade de o
time A ganhar dois ou três jogos.

8) A probabilidade de um atirados acertar o
alvo é
3
2
. Se ele atirar 5 vezes, qual a
probabilidade de acertar exatamente 2
tiros?

9) Seis parafusos são escolhidos ao acaso da
produção de certa máquina, que apresenta
10% de peças defeituosas. Qual a
probabilidade de serem defeituosos dois
deles?

10) Jogando uma moeda 3 vezes, determine a
probabilidade de obter:
a) coroa nas 3 vezes;
b) coroa 2 vezes;

11) Determine a probabilidade de ocorrerem 3
números 4 em 5 lances de um dado.

12) Calcule a probabilidade de obter
exatamente 3 coroas e 2 caras em 5 lances
de uma moeda.

13) Em um campeonato de tênis, o jogados A
tem 0,4 de probabilidade de ganhar uma
partida, o jogador B tem 0,3 e o jogador C
tem 0,3. Sabendo que o torneio consta de 3
partidas, determine a probabilidade de:

a) B ganhar as 3 partidas;
b) A ganhar as 3 partidas;
c) A ganhar 2 partidas;
d) C ganhar 2 partidas.

14) (Cesgranrio-RJ) Três moedas são lançadas
simultaneamente. A probabilidade de obter
2 caras e 1 coroa é de:
a)
8
1
b)
4
1
c)
16
5
d)
8
3
e)
2
1


15) A probabilidade de um atirados acertar um
alvo em um único tiro é 0,2. Dando 4 tiros
calcular a probabilidade de :

a) acertar o alvo duas vezes;
b) não acertar o alvo.

16) Em cirurgias de miopia, sabe-se que 10%
não obtêm sucesso. Qual é a probabilidade
de que, em 4 cirurgias, 3 obtenham
sucesso?

17) Um casal quer ter 5 filhos. Qual é a
probabilidade de que:

a) todos sejam homens?
b) Tenham 2 meninas?

18) Qual é a maior probabilidade:
A: de sair 50% de caras num lançamento de 8
moedas, ou
B: de sair 50% de caras num lançamneto de 12
moedas?

DISTRIBUIÇÃO NORMAL
CURVA NORMAL

Em nosso dia a dia podemos observar
que alguns fatos têm probabilidade de ocorrer
com maior freqüência que outros.
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 48
Uma pessoa muito alta, acima de
2,10m, por exemplo, andando na rua,
desperta a nossa curiosidade, evidentemente
porque não é tão comum assim alguém com
tanta altura. Entretanto, as pessoas adultas,
na faixa de 1,60m a 1,80m, podem
ultrapassar-nos às milhares pelas ruas, sem
que nos fixemos em alguma delas pela sua
estatura.
Logo, a altura das pessoas, assim
como as suas idades ou a média bimestral
dos alunos de uma escola, entre outras
distribuições encontradas na natureza, são
exemplos de distribuição normal, onde cada
evento possui freqüência diferente dentro do
universo, variáveis de acordo com a forma
gráfica:









Propriedades de uma Distribuição Normal
1º) A variável aleatória X pode assumir todo
e qualquer valor real.

2º) A representação gráfica da distribuição
normal é uma curva em forma de sino,
simétrica em torno da média (x ), que recebe
o nome de curva normal ou de Gauss.

3º) A área total limitada pela curva e pelo
eixo das abscissas é igual a 1, já que essa área
corresponde à probabilidade de a variável
aleatória X assumir qualquer valor real.

4º) A curva normal é assintótica em relação
ao eixo das abscissas, isto é, aproxima-se
indefinidamente do eixo das abscissas sem,
contudo, alcança-lo.

5º) Como a curva é simétrica em torno de x, a
probabilidade de ocorrer valor maior do que a
média é igual à probabilidade de ocorrer valor
menor do que a média, isto é, ambas as
probabilidades são iguais a 0,5. Escrevemos:
5 0 x X P x X P , ) ( ) ( = < = >

Quando temos em mãos uma variável
aleatória com distribuição normal, nosso
principal interesse é obter a probabilidade de
essa variável aleatória assumir um valor em um
determinado intervalo.

Exemplo:

Seja X a variável aleatória que
representa os diâmetros dos parafusos
produzidos por certa máquina. Vamos supor
que essa variável tenha distribuição normal
com média x =2cm e desvio padrão s=0,04cm.
Pode haver interesse em conhecer a
probabilidade de um parafuso ter um diâmetro
com valor entre 2 e 2,05cm.
É fácil notar que essa probabilidade é
indicada por:
P( 2 < X < 2,05 )
que corresponde à área hachurada da figura:








Para o cálculo direto dessa
probabilidade, podemos dizer que se X é uma
variável aleatória com distribuição normal de
média x e desvio padrão s, então existe uma
variável z que tem distribuição normal
reduzida, isto é, tem distribuição normal de
média 0 e desvio padrão 1, dada por:


s
x x
Z

=
Queremos calcular P(2 < X < 2,05).
Para obter essa probabilidade, precisamos, em
primeiro lugar, calcular o valor de z que
corresponde a x
1
= 2,05 e x
2
= 2.

Z =
s
x x −

04 0
2 2
Z
,

= Z= 0
s
x x
Z

=
04 0
2 05 2
Z
,
, −
=
04 0
05 0
Z
,
,
= Z = 1,25
então:
P( 2 < X < 2,05 ) = P( 0 < Z < 1,25 )

Freqüência
Eventos
2
2,05
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 49
Exercícios:

1) Uma variável x tem distribuição normal
com média 200u e desvio padrão de 40u.
Determine aos valores de Z para os
seguintes valores de x

a) (180 < X < 220)
b) (X ≥ 205)
c) (193 < X < 194)
d) ( X ≤ 200)
e) ( X < 210)

2) Utilizando a tabela de Distribuição Normal
determine as probabilidades:

a) P(-1,25 < Z < 0)
b) P(-0,5 < Z < 1,48)
c) P(0,8 < Z < 1,23)
d) P(Z > 0,6)
e) P(Z < 0,92)
3) Os salários dos operários industriais são
distribuídos normalmente, em torno da
média de R$1.000,00, com desvio padrão
de R$800,00. Calcule a probabilidade de
um operário ter um salário situado entre
R$800,00 e R$1.400,00.

4) Sendo Z uma variável com distribuição
normal reduzida, calcule:

a) P(0 < Z < 1,44)
b) b) P(-0,85 < Z < 0)
c) P(-1,48 < Z < 2,05)
d) P(0,72 < Z < 1,89)
e) P(Z > -2,03)
f) f) P(Z > 1,08)
g) P(Z < -0,66)
h) h) P(Z < 0,60)

5) Um teste padronizado de escolaridade tem
distribuição normal com média 100 e
desvio padrão 10. Determine a
probabilidade de um indivíduo submetido
ao teste ter nota:

a) maior que 120;
b) maior que 80;
c) entre 85 e 115;
d) maior que 100.

6) Os pesos de 600 estudantes são
normalmente distribuídos com média 65,3
Kg e desvio padrão 5,5 Kg. Determine o
número de estudantes que pesam:

a) entre 60 e 70 Kg;
b) mais que 63,2 Kg;
c) menos que 68 Kg.

7) A duração de um certo componente
eletrônico tem média de 850 dias e desvio
padrão de 40 dias. Sabendo que a duração é
normalmente distribuída, calcule a
probabilidade de esse componente durar:

a) entre 700 e 1000 dias;
b) mais de 800 dias;
c) menos de 750 dias.

8) Ao anotar a velocidade de uma série de
motoristas que passavam por determinado
ponto da estrada, a polícia chegou à
conclusão de que a velocidade média
naquele ponto era de 65 km/h, com um
desvio padrão de 9 km/h. Verificou-se
também que a distribuição das velocidades
podia ser considerada uma normal. Assim
sendo, pede-se:

a) Determinar a probabilidade de que o
próximo carro a passar pelo referido ponto
da estrada tenha velocidade maior que 80
km/h.
b) Determinar a probabilidade de que o
próximo carro a passar pelo mesmo ponto
tenha velocidade entre 70 e 75 km/h.
c) Calcular a porcentagem dos carros que,
num determinado dia, serão multados ou
advertidos, sabendo-se que serão multados
os carros com velocidades superiores a 85
km/h e serão advertidos os carros com
velocidades entre 75 km/h e 85 km/h.

9) A altura média dos rapazes que se inscrevem
para o serviço militar é 1,67 m, com desvio
padrão de 15 cm. Sabendo-se que o Exército
somente aceita para o serviço militar
rapazes com altura entre 1,55 m e 1,92 m,
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 50
qual a porcentagem de rapazes que não
servirão o Exército?


CORRELAÇÃO E REGRESSÃO

Até agora analisamos os cálculos
estatísticos associados a uma única variável;
como o peso das pessoas, o diâmetro das
esferas ou o consumo de energia elétrica.
Sabemos, entretanto, que muitas variáveis
mantêm dependências entre si, no sentido de
que o crescimento de uma delas também pode
causar o crescimento em outra. Vejamos
alguns casos:
• O preço dos aluguéis dos imóveis e a
sua área.
• Os índices pluviométricos e a
fertilidade dos solos.
• A temperatura ambiente e o consumo
de cerveja.
Há, sem dúvida, um número muito
grande de pares de variável dependentes entre
si, sendo o nosso trabalho, no momento,
encontrar uma maneira de dimensionar essa
interdependência, principalmente quando não
conhecemos os fatores que interferem em uma
ou em outra. Ao grau de dependência entre
duas variáveis denominamos correlação, e,
deste modo, podemos esperar que certas
variáveis, como por exemplo, “quantidade de
tinta”e “área da parede”, tenham uma alta
correlação, enquanto “área da parede”e “idade
do pintor”, por outro lado, apresentam quase
nenhuma correlação.
Assim, quando consideramos variáveis
como peso e altura de um grupo de pessoas,
uso do cigarro e incidência do câncer,
vocabulário e compreensão da leitura,
procuramos verificar se existe alguma relação
entre as variáveis de cada um dos pares e qual
o grau dessa relação. Para isso é necessário o
conhecimento de novas medidas.
Sendo a relação entre as variáveis de
natureza quantitativa, a correlação é o
instrumento adequado para descobrir e medir
essa relação.
Uma vez caracterizada a relação,
procuramos descreve-la através de uma função
matemática. A regressão é o instrumento
adequado para a determinação dos parâmetros
dessa função.

CORRELAÇÃO

Relação Funcional e Relação Estatística

Como sabemos, o perímetro e o lado de
um quadrado estão relacionados. A relação que
os liga é perfeitamente definida e pode ser
expressa por meio de uma sentença
matemática:
2p = 4l
onde 2p é o perímetro e l é o lado.
Atribuindo-se, então, um valor qualquer
a l, é possível determinar exatamente o valor de
2p.
Consideremos, agora, a relação que
existe entre o peso e a altura de um grupo de
pessoas. É evidente que esta relação não é do
mesmo tipo da anterior; ela é bem menos
precisa. Assim, pode acontecer que a estaturas
diferentes correspondam pesos iguais ou que a
estaturas iguais correspondam pesos diferentes.
Porém, em média, quanto maior a estatura,
maior o peso.








Quando duas variáveis estão ligadas por
uma relação estatística, dizemos que existe
correlação entre elas.

Diagrama de Dispersão

Após dispormos de uma série de
valores de duas variáveis que estamos querendo
verificar se entre elas há ou não um certo grau
de dependência, o primeiro passo será marca-
las num gráfico cartesiano, cada uma das séries
num dos eixos, construindo, assim, o que se
conhece por diagrama de dispersão. A
observação do diagrama de dispersão das
variáveis será o primeiro passo para avaliarmos
a correlação. Suponhamos, por exemplo, o
gráfico de dispersão das variáveis mostradas na
tabela abaixo:

X Y X Y
As relações do tipo
perímetro–lado são conhecidas
como relações funcionais e as do
tipo peso-estatura, como relações
estatísticas.
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 51
25 12 36 9
26 11 37 7
27 13 38 7
28 12 39 6
29 11 40 6
30 8 41 4
31 10 42 5
32 9 43 5
33 7 44 5
34 8 45 5
35 8

Imaginemos que os valores da variável
X sejam as idades das pessoas de determinada
classe e os valores de Y, o tempo médio de
duração do banho diário de todas as pessoas
entrevistadas em cada idade. A marcação dos
pares ordenados (X,Y) no plano cartesiano
levará, por fim, ao diagrama de dispersão
mostrado abaixo:
0
2
4
6
8
10
12
14
24 26 28 30 32 34 36 38 40 42 44 46 48
Idade
T
e
m
p
o
A configuração mostrada no gráfico
nos faz supor que existe uma certa correlação
entre duas variáveis, ou seja, com a passagem
do tempo, as pessoas parecem demorar-se
menos debaixo do chuveiro. Devemos,
entretanto, tomar o cuidado na análise de
correlação, uma vez que as variáveis
correlacionadas não necessariamente estão
sujeitas a uma relação de causa e efeito. No
nosso exemplo, não podemos afirmar com
certeza que as pessoas se banham mais
rapidamente apenas porque são mais idosas, já
que o motivo da rapidez pode ser outro que
não a idade, como por exemplo o fato de as
pessoas tornarem-se menos vaidosas ou mais
ocupadas conforme o tempo vai passando.
A correlação, portanto, apontará em
muitos casos unicamente a existência de
variações semelhantes em duas variáveis, sem
que, entretanto, uma tenha muita coisa a ver
com a outra.
A observação pura e simples dos
diagramas de dispersão pode nos fornecer uma
série de informações:




Exercícios

1) Consideremos uma amostra aleatória,
formada por dez dos 98 alunos de uma
classe da faculdade A e pelas notas obtidas
por eles em Matemática e Estatística.

Notas
y
x
Correlação linear positiva
Aumenta x, aumenta y
y
x
Correlação linear negativa
Aumenta x, diminui y
x
y
Correlação não-linear
Distribuição dos pontos
em torno de uma curva
y
x
Correlação nula
Aumenta x, varia y
ao acaso
Não há correlação
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 52
Nº Matemática
(x
i
)
Estatística
(y
i
)
01 5.0 6.0
08 8.0 9.0
24 7.0 8.0
38 10.0 10.0
44 6.0 5.0
58 7.0 7.0
59 9.0 8.0
72 3.0 4.0
80 8.0 6.0
92 2.0 2.0
Construa o diagrama de dispersão.

Correlação Linear

Observando o exercício anterior,
podemos imaginar que, quanto mais fina for a
elipse, mais ela se aproximará de uma reta.
Dizemos, então, que a correlação de forma
elíptica tem como “imagem” uma reta, sendo,
por isso, denominada correlação linear.
É possível verificar que a cada
correlação está associada como “imagem”
uma relação funcional. Por esse motivo, as
relações funcionais são chamadas relações
perfeitas.
Como a correlação em estudo tem
como “imagem” uma reta ascendente, ela é
chamada correlação linear positiva.
Assim, uma correlação é:
a) linear positiva se os pontos do diagrama
têm como “imagem” uma reta ascendente;
b) linear negativa se os pontos têm como
“imagem” uma reta descendente;
c) não-linear se os pontos têm como
“imagem” uma curva.
Se os pontos apresentam-se dispersos,
não oferecendo uma “imagem” definida,
concluímos que não há relação alguma entre
as variáveis em estudo.



Coeficiente de Correlação Linear

O instrumento empregado para a
medida da correlação linear é o coeficiente de
correlação.
Este coeficiente deve indicar o grau de
intensidade da correlação entre duas variáveis
e, ainda, o sentido dessa correlação (positivo ou
negativo).
Faremos uso do coeficiente de
correlação de Pearson, que é dado por:


( )( )
( ) ( )



=
∑ ∑ ∑ ∑
∑ ∑ ∑
2
i
2
i
2
i
2
i
i i i i
y y n x x n
y x y x n
r

onde n é o número de observações.

Os valores limites de r são –1 e +1. isto
é, o valor de r pertence ao intervalo
[-1,+1].

Assim:

a) se a correlação entre duas variáveis é
perfeita e positiva, então r = +1`;
b) se a correlação é perfeita e negativa, então
r = -1;
c) se não há correlação entre as variáveis,
então r = 0.

Logicamente:

a) se r = +1, há uma correlação perfeita e
positiva entre as variáveis;
b) se r = -1, há uma correlação perfeita e
negativa entre as variáveis;
c) se r = 0, ou não há correlação entre as
variáveis, ou a relação que porventura
exista não é linear.

OBS: Para podermos tirar algumas conclusões
significativas sobre o comportamento
simultâneo das variáveis analisadas, é
necessário que:

1 r 6 0 ≤ ≤ ,

Se 6 0 r 3 0 , , < ≤ , há uma correlação
relativamente fraca entre as variáveis.

Se 3 0 r 0 , < < , a correlação é muito
fraca e, praticamente, nada podemos concluir
sobre a relação entre as variáveis em estudo.


Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 53
Vamos então calcular o coeficiente de
correlação do exercício anterior. O modo mais
rápido para obtermos r é abrir, na tabela,
colunas correspondentes aos valores de x
i
y
i
,
x
i
2
e y
i
2
.

Notas
Nº Matem.
(x
i
)
Estat.
(y
i
)
x
i
y
i
x
i
2
y
i
2

01 5.0 6.0 30 25 36
08 8.0 9.0 72 64 81
24 7.0 8.0 56 49 64
38 10.0 10.0 100 100 100
44 6.0 5.0 30 36 25
58 7.0 7.0 49 49 49
59 9.0 8.0 72 81 64
72 3.0 4.0 12 9 16
80 8.0 6.0 48 64 36
92 2.0 2.0 4 4 4
Σx
i
=65 Σy
i
=65 Σx
i
y
i
=473 Σx
i
2
=481 Σy
i
2
=475

( )( )
( ) ( )



=
∑ ∑ ∑ ∑
∑ ∑ ∑
2
i
2
i
2
i
2
i
i i i i
y y n x x n
y x y x n
r

( )( )
( ) ( ) [ ] ( ) ( ) [ ]
2 2
65 475 10 65 481 10
65 65 473 10
r
− −

=
. .
. .


91 0 r
525 585
505
r ,
.
= =

Resultado que indica uma correlação linear
positiva altamente significativa entre as duas
variáveis.

Exercícios:

1) Calcule o coeficiente de correlação para os
valores das variáveis x
i
e y
i
.

x
i
4 6 8 10 12
y
i
12 10 8 12 14

2) determine o coeficiente de correlação linear
para os dados dos conjuntos abaixo,
construindo também o diagrama de
dispersão.
a)
x 2 3 9 8 6 10
y 1,6 1,2 1,0 1,2 1,4 1,0

b)
x 0 1 2 3 4 5 6
y 3 18 21 40 34 61 65

3) Numa indústria é feito um acompanhamento
sistemático do percentual de elementos
defeituosos produzidos a cada intervalo de
meia hora. Após um mês de produção, os
valores médios de percentuais de defeitos a
cada horário foram marcados na tabela:

Horas % Horas %
7:00 0,12 10:00 0,13
7:30 0,09 10:30 0,18
8:00 0,14 11:00 0,15
8:30 0,19 11:30 0,19
9:00 0,14 12:00 0,20
9:30 0,16
Verifique a existência de correlação
linear entre o horário e o percentual de defeitos.

4) Calcule o coeficiente de correlação linear do
conjunto de pontos apresentados no gráfico a
seguir:

0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
0 1 2 3 4 5 6 7 8 9 10
x
y
A
B
C
D E
F
G
H
I J
K


REGRESSÃO

Sempre que desejamos estudar determinada
variável em função de outra, fazemos uma
análise de regressão.
Podemos dizer que a análise de
regressão tem por objetivo descrever, através
de um modelo matemático, a relação entre duas
variáveis, partindo de n observações das
mesmas.
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 54
A variável sobre a qual desejamos
fazer uma estimativa recebe o nome de
variável dependente e a outra recebe o nome
de variável independente.
Assim, supondo X a variável
independente e Y a dependente, vamos
procurar determinar o ajustamento de uma reta
à relação entre essas variáveis, ou seja, vamos
obter uma função definida por:



onde a e b são os parâmetros.
A correlação retilínea permiti o
ajustamento de uma reta, imagem da função
definida por Y = aX + b
Vamos, então, calcular os valores dos
parâmetros a e b com a ajuda das fórmulas:





e



onde:
n é o número de observações;
x é a média dos valores x
i

n
x
x
i ∑
= ( )
y é a média dos valores y
i
(
n
y
y
i ∑
= )

OBS: Como estamos fazendo uso de uma
amostra para obtermos os valores dos
parâmetros, o resultado, é uma estimativa da
verdadeira equação de regressão. Sendo assim,
escrevemos:
Y
ˆ
= aX + b
onde Y
ˆ
é o Y estimado.
Exemplo:

Nº Matem.
(x
i
)
Estat.
(y
i
)
x
i
y
i
x
i
2

01 5.0 6.0 30 25
08 8.0 9.0 72 64
24 7.0 8.0 56 49
38 10.0 10.0 100 100
44 6.0 5.0 30 36
58 7.0 7.0 49 49
59 9.0 8.0 72 81
72 3.0 4.0 12 9
80 8.0 6.0 48 64
92 2.0 2.0 4 4
Σx
i
=65 Σy
i
=65 Σx
i
y
i
=473 Σx
i
2
=481

n = 10

( )
2
i
2
i
i i i i
x x n
y x y x n
a
∑ ∑
∑ ∑ ∑


=
( )
2
65 481 x 10
65 x 65 473 x 10
a


=
8632 0
585
505
225 4 810 4
225 4 730 4
a ,
. .
. .
= =


=

como:
5 6
10
65
y e 5 6
10
65
x , , = = = =

b = 6,5 – 0,8632 x 6,5 = 6,5 – 5,6108 = 0,8892

a = 0,86 e b = 0,89

Logo:
Y
ˆ
= 0,86X + 0,89

Para traçarmos a reta no gráfico, basta
determinar dois de seus pontos:

X = 0 Y
ˆ
= 0,89
X = 5 Y
ˆ
= 0,86 x 5 + 0,89 = 5,19

Assim temos:

Y = 0,86X + 0,89
0
1
2
3
4
5
6
7
8
9
10
0 2 4 6 8 10
x
y
5
0,89
5,19


Y = aX + b
( )
2
i
2
i
i i i i
x x n
y x y x n
a
∑ ∑
∑ ∑ ∑


=
x a y b − =
Ana Lúcia Guimarães Carvalho
ESTATÍSTICA 55
Exercícios:

1) A partir da tabela:

x
i
1 2 3 4 5 6
y
i
70 50 40 30 20 10

a) Calcule o coeficiente de correlação
b) Determine a reta ajustada
c) Estime o valor Y para X = 0

2) Certa empresa, estudando a variação da
demanda de seu produto em relação à
variação de preço de venda, obteve a tabela:

Preço
(x
i
)
Demanda
(y
i
)
Preço
(x
i
)
Demanda
(y
i
)
38 350 63 246
42 325 70 238
50 297 80 223
56 270 95 215
59 256 110 208

a) Determine o coeficiente de correlação
b) Estabeleça a equação da reta ajustada
c) Estime Y para X=60 e X=120

3) Pretendendo-se estudar a relação entre as
variáveis”consumo de energia elétrica”(x
i
) e
“volume de produção nas empresas
industriais”(y
i
), fez-se uma amostragem que
inclui vinte empresas, computando-se os
seguintes valores:

Σx
i
= 11,34 , Σy
i
= 20,72 , Σx
i
2
= 12,16 ,

Σy
i
2
= 84,96 , Σx
i
y
i
= 22,13

a) calcule o coeficiente de correlação
b) equação de regressão
c) estime o consumo de energia elétrica
para um volume de produção de 3.


4) A tabela abaixo apresenta valores que
mostram como o comprimento de uma barra
de aço varia conforme a temperatura:

Temperatura
(º C)
10 15 20 25 30
Comprimento
(mm)
1.003 1.005 1.010 1.011 1.014

Determine:

a) o coeficiente de correlação
b) a reta ajustada
c) o valor estimado do comprimento da
barra para a temperatura de 18ºC
d) o valor estimado do comprimento da
barra para a temperatura de 35ºC.

5) Considere os resultados de dois testes, X e
Y, obtidos por um grupo de alunos da escola
A:

x
i
y
i
x
i
y
i
11 13 28 17
14 14 30 24
19 18 31 22
19 15 34 24
22 22 37 25


Determine:
a) calcule o coeficiente de correlação;
b) a equação de regressão;
c) estime x para y = 4.

6) Considere os resultados de dois testes e
calcule o coeficiente de correlação , a
equação de regressão e construa o gráfico.

X Y X Y
2 1 4 4
2 2 5 3
3 2 6 4
3 3 6 5
3 4 6 3
4 2

You're Reading a Free Preview

Descarregar
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->