Você está na página 1de 55

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA BÁSICA resultado final, que influências cabem a cada


uma delas.
A Estatística é a parte da Fases do Método Estatístico
Matemática Aplicada que trata dos
métodos científicos para coleta, Podemos distinguir no método estatístico
organização, resumo, apresentação e as seguintes fases:
análise de dados.
1. Planejamento
Podemos dividi-la em duas: Estatística
descritiva, que apenas descreve e analisa um Consiste em determinar quais são os dados
conjunto de dados, sem tirar conclusões; e a serem levantados e como estes serão
Estatística indutiva ou Inferência Estatística, levantados, fazendo uma análise de material e
que trata das inferências e conclusões, isto é, custos necessários durante a pesquisa.
a partir da análise de dados são tiradas
conclusões. 2. Coleta de dados

MÉTODO CIENTÍFICO Após cuidadoso planejamento, damos


início à coleta de dados.
Método científico é um conjunto de A coleta pode ser direta e indireta.
meios dispostos convenientemente para se A coleta é direta quando os dados são
chegar a um fim que se deseja. coletados diretamente na fonte. A coleta direta
de dados pode ser classificada relativamente ao
Dos métodos científicos, vamos destacar o fator tempo em;
método experimental e o estatístico. a. contínua (registro) – quando feita
continuamente, tal como a de
Método Experimental nascimentos e óbitos e a de freqüência
dos alunos às aulas;
O Método experimental consiste em b. periódica - quando feita em intervalos
manter constante todas as causas (fatores), constantes de tempo, como os censos (de
menos uma, e variar esta causa de modo que o 10 em 10 anos) e as avaliações mensais
pesquisador possa descobrir seus efeitos, caso dos alunos;
existam. É o método preferido no estudo da c. ocasional – quando feita
Física, da Química etc. extemporaneamente, a fim de atender a
uma conjuntura ou a uma emergência,
Método Estatístico como no caso de epidemias que assolam
ou dizimam rebanhos inteiros.
Muitas vezes temos necessidade de
descobrir fatos em um campo em que o A coleta pode ser indireta quando os
método experimental não se aplica (nas dados são levantados em órgãos que já tenham
ciências sociais), já que os vários fatores que efetuado a pesquisa de campo. Como exemplo,
afetam o fenômeno em estudo não podem podemos citar a pesquisa sobre a mortalidade
permanecer constantes enquanto fazemos infantil, que é feita através de dados colhidos
variar a causa que, naquele momento, nos por uma coleta direta.
interessa.
Nesses casos, lançamos mão do método 3. Crítica dos dados
estatístico.
O método estatístico, diante da Obtidos os dados, eles devem ser
impossibilidade de manter as causas cuidadosamente criticados, à procura de
constantes, admite todas essas causas possíveis falhas e imperfeições, a fim de não
presentes variando-as, registrando essas incorrermos em erros grosseiros ou de certo
variações e procurando determinar, no

ESTATÍSTICA 1
Ana Lúcia Guimarães Carvalho

vulto, que possam influir sensivelmente nos - para o fenômeno “número de filhos”há um
resultados. número de resultados possíveis expresso
através dos números naturais: 0, 1, 2, 3,
4. Apuração dos dados ...,n;
- para o fenômeno “estatura”temos uma
É a soma e o processamento dos dados situação diferente, pois os resultados
obtidos e a disposição mediante critérios de podem tomar um número infinito de
classificação. valores numéricos dentro de um
determinado intervalo.
5. Exposição ou apresentação dos dados
Por mais diversa que seja a finalidade que Variável é, convencionalmente, o conjunto
se tenha em vista, os dados devem ser de resultados possíveis de um fenômeno.
apresentados sob forma adequada (tabelas ou
gráficos), tornando mais fácil o exame Os exemplos nos dizem que uma variável
daquilo que está sendo objeto de tratamento pode ser:
estatístico.
a. qualitativa – quando seus valores são
6. Análise dos resultados expressos por atributos: sexo (masculino-
feminino), cor da pele (branca, preta,
É o objetivo último da Estatística que amarela, vermelha, parda) etc.;
consiste em tirar conclusões sobre o todo b. quantitativa – quando seus valores são
(população) a partir de informações expressos em números (salários dos
fornecidas por parte representativa do todo operários, idade dos alunos de uma escola
(amostra).Assim, fazemos uma análise dos etc.). Uma variável quantitativa que pode
resultados obtidos e tiramos desses resultados assumir, teoricamente, qualquer valor
conclusões e previsões. entre dois limites recebe o nome de
variável contínua (exemplos: peso dos
7. Conclusão alunos de uma escola) ; uma variável que
só pode assumir valores pertencentes a um
Significado matemático da pesquisa, conjunto enumerável recebe o nome de
podendo apresentar comentários e críticas aos variável discreta ( exemplos: número de
resultados. alunos de uma escola).
De modo geral, as medições dão origem a
Exercícios: variáveis contínuas e as contagens ou
enumerações, a variáveis discretas.
1) Defina Estatística e exemplifique a sua
utilização. Exercícios:

2) Defina método científico. 1) Classifique as variáveis em qualitativas ou


quantitativas (contínuas ou descontínuas):
3) Cite e explique detalhadamente as fases do
método estatístico. a) Universo: alunos de uma escola.
Variável: cor dos cabelos –
POPULAÇÃO E AMOSTRA b) Universo: casais residentes em uma cidade.
Variável: número de filhos –
Variáveis c) Universo: as jogadas de um dado.
Variável: o ponto obtido em cada jogada –
A cada fenômeno corresponde um número d)Universo: peças produzidas por certa
de resultados possíveis. Assim, por exemplo: máquina.
- para o fenômeno “sexo”são dois os Variável: número de peças produzidas por
resultados possíveis: sexo masculino e hora
sexo feminino;

ESTATÍSTICA 2
Ana Lúcia Guimarães Carvalho

e) Universo: peças produzidas por certa fenômeno que desejamos pesquisar. É preciso,
máquina pois, que a amostra ou as amostras que vão ser
Variável: diâmetro externo – usadas sejam obtidas por processos adequados.

2) Diga quais das variáveis abaixo são Amostragem


discretas e quais são contínuas:
Consiste em uma técnica especial para
a) População: alunos de uma cidade. recolher amostras, que garante, tanto quanto
Variável: cor dos olhos. possível, o acaso na escolha.
b) P.: estação meteorológica de uma cidade. Dessa forma, cada elemento da população
V.: precipitação pluviométrica, durante um passa a ter a mesma chance de ser escolhido, o
ano. que garante à amostra o caráter de
c) P.: Bolsa de Valores de São Paulo. representatividade, e isto é muito importante,
V.: número de ações negociadas. pois nossas conclusões relativas à população
d) P.: pregos produzidos por uma máquina. vão estar baseadas nos resultados obtidos nas
V.: comprimento. amostras dessa população.
e) P.: casais residentes em uma cidade. Principais técnicas de amostragem:
V.: sexo dos filhos.
f) P.: bibliotecas da cidade de São Paulo. 1- Amostragem casual ou aleatória simples
V.: número de volumes.
Este tipo de amostragem é equivalente a
3) Como se separa as variáveis em discretas e um sorteio lotérico.
contínuas? Dê pelo menos, três exemplos Na prática, a amostragem casual ou
de cada tipo de variáveis. aleatória simples pode ser realizada
numerando-se a população de 1 a n e
sorteando-se, a seguir, por meio de um
População dispositivo aleatório qualquer, k números dessa
seqüência, os quais corresponderão aos
Ao conjunto de entes portadores de, pelo elementos pertencentes à amostra.
menos, uma característica comum Exemplo:
denominamos população estatística ou Vamos obter uma amostra representativa
universo estatístico. para a pesquisa da estatura de noventa alunos
Assim, os estudantes, por exemplo, de uma escola:
constituem uma população, pois apresentam a. Numeramos os alunos de 01 a 90.
pelo menos uma característica comum: são os b. Escrevemos os números, de 01 a 90, em
que estudam. pedaços iguais de um mesmo papel,
colocando-os dentro de uma caixa.
Amostra Agitamos sempre a caixa para misturar
bem os pedaços de papel e retiramos,
Na maioria das vezes, por impossibilidade um a um, nove números que formarão a
ou inviabilidade econômica ou temporal, amostra. Neste caso, 10% da
limitamos as observações referentes a uma população.
determinada pesquisa a apenas uma parte da Quando o número de elementos da amostra
população. A essa parte proveniente da é grande, esse tipo de sorteio torna-se muito
população em estudo denominamos amostra. trabalhoso. A fim de facilita-lo, foi elaborada
Uma amostra é um subconjunto finito de uma tabela – Tabela de Números Aleatórios -
uma população. , construída de modo que os dez algarismos (0
Para as inferências serem corretas, é a 9) são distribuídos ao acaso nas linhas e
necessário garantir que a amostra seja colunas (Anexo I)
representativa da população, isto é, a amostra Para obtermos os elementos da amostra
deve possuir as mesmas características usando a tabela, sorteamos um algarismo
básicas da população, no que diz respeito ao qualquer da mesma, a partir do qual iremos

ESTATÍSTICA 3
Ana Lúcia Guimarães Carvalho

considerar números de dois, três ou mais 55 a 90, meninas. Usando a tabela de números
algarismos, conforme nossa necessidade. Os aleatórios retiramos os elementos da
números assim obtidos irão indicar os população.
elementos da amostra.
A leitura da tabela pode ser feita 3 – Amostragem sistemática
horizontalmente (da direita para a esquerda
ou vice-versa), verticalmente ( de cima para Quando os elementos da população já se
baixo ou vice-versa), diagonalmente (no acham ordenados, não há necessidade de
sentido ascendente ou descendente) ou construir o sistema de referência. São
formando desenhos de uma letra qualquer. A exemplos os prédios de uma rua, as linhas de
opção, porém, deve ser feita antes de iniciado produção etc. Nestes casos, a seleção dos
o processo. elementos que constituirão a amostra pode ser
feita por um sistema imposto pelo
2 – Amostragem proporcional estratificada pesquisador. A esse tipo de amostragem
denominamos sistemática.
Muitas vezes a população se divide em Exemplo:
subpopulações – estratos. No caso de uma linha de produção,
Como é provável que a variável em estudo podemos, a cada dez itens produzidos, retirar
apresente, de estratos em estratos, um um para pertencer a uma amostra da
comportamento heterogêneo e, dentro de população diária. Neste caso, estaríamos
cada estrato, um comportamento homogêneo, fixando o tamanho da amostra em 10% da
convém que o sorteio dos elementos da população.
amostra leve em consideração tais estratos.
É exatamente isso que fazemos quando Exercícios:
empregamos a amostragem proporcional
estratificada, que, além de considerar a 1) Descreva as técnicas de amostragens.
existência dos estratos, obtém os elementos Quando se utiliza cada uma delas?
da amostra proporcional ao número de
elementos dos mesmos.
Exemplo:
Supondo, no exemplo anterior, que, dos 2) O que é população estatística?
noventa alunos, 54 sejam meninos e 36 sejam
meninas, vamos obter a amostra proporcional
estratificada.
São, portanto, dois estratos (sexo 3) O que é amostra?
masculino e sexo feminino) e queremos uma
amostra de 10% da população. Logo, temos:

SEXO POPUL. 10% AMOSTRA 4) O que é amostragem?


10 × 54
M 54 = 5, 4 5
100

F 36 10 × 36 4 5) O diretor de uma escola, na qual estão


= 3,6 matriculados 280 meninos e 320 meninas,
100
desejoso de conhecer as condições de vida
extra-escolar de seus alunos e não
TOTAL 90 9 dispondo de tempo para entrevistar todas
10 × 90
= 9 ,0 as famílias, resolveu fazer um
100 levantamento, por amostragem, em 10%
dessa clientela. Obtenha, para esse diretor,
Numeramos os alunos de 01 a 90, sendo os elementos componentes da amostra.
que de 01 a 54 correspondem meninos e de

ESTATÍSTICA 4
Ana Lúcia Guimarães Carvalho

Tabela é um quadro que resume um


6) Uma cidade X apresenta o seguinte conjunto de observações.
quadro relativo às suas escolas de 1º
grau: Uma tabela compõe-se de:
a. corpo – conjunto de linhas e colunas
ESCOLAS Nº DE ESTUDANTES que contêm informações sobre a
MASCULINO FEMININO variável em estudo;
A 80 95
b. cabeçalho – parte superior da tabela
B 102 120
C 110 92 que especifica o conteúdo das colunas;
D 134 228 c. coluna indicadora – parte da tabela
E 150 130 que especifica o conteúdo das linhas;
F 300 290 d. linhas – retas imaginárias que facilitam
Total 876 955 a leitura, no sentido horizontal, de
dados que se inscrevem nos seus
Obtenha uma amostra proporcional cruzamentos com as colunas;
estratificada de 120 estudantes. e. casa ou célula – espaço destinado a um
só número;
7) Em uma escola existem 250 alunos, sendo f. título – conjunto de informações, as
35 na 1ª série, 32 na 2ª, 30 na 3ª, 28 na 4ª, mais completas possíveis, localizado no
35 na 5ª, 32 na 6ª, 31 na 7ª e 27 na 8ª. topo da tabela;
Obtenha uma amostra de 40 alunos e g. rodapé – são os elementos
preencha o quadro seguinte. complementares da tabela, tais como
fonte, as notas e as chamadas,
Série População Cálculo Amostra
Proporcional
colocados, de preferência, no fecho da
1ª tabela.

Exemplo:
3ª Título
4ª Cabeçalho PRODUÇÃO DE CAFÉ
5ª BRASIL – 1996-2000 Cabeçalho
Coluna ANOS PRODUÇÃO Coluna

Indicadora (1.000 t) Numérica

8ª 1996 2.535 Casa ou Célula
Total 250 40 1997 2.666
Corpo 1998 2.122
Linhas
1999 3.750
SÉRIES ESTATÍSTICAS 2000 2.007
Um dos objetivos da Estatística é Rodapé FONTE: Dados Hipotéticos
sintetizar os valores que uma ou mais
variáveis podem assumir, para que tenhamos Séries Estatísticas
uma visão global da variação dessa ou dessas
variáveis. E isto ela consegue, inicialmente, Denominamos série estatística toda tabela
apresentando esses valores em tabelas e que apresenta a distribuição de um conjunto de
gráficos, que irão nos fornecer rápidas e dados estatísticos em função da época, do local
seguras informações a respeito das variáveis ou da série.
em estudo, permitindo-nos determinações Daí podemos concluir que numa série
administrativas e pedagógicas mais coerentes estatística observamos a existência de três
e científicas. elementos ou fatores: o tempo, o espaço e a
espécie.
Tabela

ESTATÍSTICA 5
Ana Lúcia Guimarães Carvalho

Conforme varie um dos elementos da REBANHOS BRASILEIROS


série, podemos classifica-la em histórica, 2000
geográfica e específica. ESPÉCIE QUANTIDADE
(1.000 cabeças)
Bovinos 139.599
Séries históricas Eqüinos 5.855
Suínos 32.121
Descrevem os valores da variável, em Ovinos 20.085
determinado local, descriminados segundo Caprinos 11.313
intervalos de tempo variáveis. Coelhos 909
Fonte: Dados hipotéticos
Exemplo:
PRODUÇÃO DE FERTILIZANTES Séries Conjugadas – Tabela de Dupla
FOSFATADOS – BRASIL Entrada
1995 – 1999
ANOS QUANTIDADE Muitas vezes temos necessidade de
(t) apresentar, em uma única tabela, a variação de
1995 3.570.115 valores de mais de uma variável, isto é, fazer
1996 4.504.201 uma conjugação de duas ou mais séries.
1997 5.448.835
1998 4.373.226 Conjugando duas séries em uma única
1999 4.024.813 tabela, obtemos uma tabela de dupla entrada.
Fonte: Dados Hipotéticos Em uma tabela desse tipo ficam criadas duas
ordens de classificação: uma horizontal (linha)
Séries Geográficas e uma vertical (coluna).

Descrevem os valores da variável, em Exemplo:


determinado instante, discriminados segundo TELEFONES INSTALADOS – 1997-99
regiões. REGIÃO 1997 1998 1999
Norte 373.312 403.712 457.741
Exemplo:
Nordeste 1.440.531 1.567.006 1.700.467
PRODUÇÃO DE OVOS DE Sudeste 8.435.308 8.892.409 8.673.660
GALINHA NO BRASIL – 2000 Sul 2.106.145 2.192.762 2.283.581
REGIÃO QUANTIDADE
(1.000 dúzias) Centro-Oeste 803.013 849.401 944.075
Norte 66.092
Nordeste 356.810
Sudeste 937.463 Total 13.158.309 13.905.290 14.059.524
Sul 485.098
Fonte: Dados Hipotéticos
Centro-Oeste 118.468
Fonte: Dados hipotéticos
A conjugação, no exemplo dado, foi série
geográfico-histórica.
Séries Específicas
Exercícios
Descrevem os valores da variável, em 1) Classifique as séries
determinado tempo e local, discriminados a) PRODUÇÃO BRASILEIRA DE
segundo especificações ou categorias. CARVÃO MINERAL BRUTO 1998-00
ANO QUANTIDADE
PRODUZIDA
(1.000 t)
Exemplo:
1998 22.700
1999 18.115
2000 20.984
Fonte: Dados Hipotéticos

ESTATÍSTICA 6
Ana Lúcia Guimarães Carvalho

b) AVICULTURA BRASILEIRA - 1999 porcentagem de famílias de baixa renda


ESPÉCIE NÚMERO com crianças menores de 6 anos e às taxas
(1.000 cabeças) de analfabetismo das diferentes regiões
Galinhas 511.834 brasileiras e do Brasil como um todo.
Patos, marrecos e gansos 5.888
Perus 3.823 Regiões Mortalidade Famílias de Taxa de
do infantil* baixa renda analfabetismo
Fonte: Dados Hipotéticos Brasil com em maiores
crianças de 15 anos
menores de (em %)
6 anos (em
c) CRIANÇAS NÃO-VACINADAS %)
CONTRA A PÓLIO - 1999 Norte 35,6 34,5 12,7
REGIÕES QUANTIDADE Nordeste 59,0 54,9 29,4
Nordeste 512.900 Sul 22,5 22,4 8,3
Sudeste 299.585 Sudeste 25,2 18,9 8,6
Norte 148.818 Centro- 25,4 25,5 12,4
Centro-Oeste 124.791 Oeste
Sul 105.371 Brasil 36,7 31,8 14,7
Total 1.191.465 Fonte: Folha de S. Paulo, 11/3/99
Dados fictícios * A mortalidade infantil indica o número de crianças que
morrem antes de completar um ano de idade para cada grupo
de 1.000 crianças que nasceram vivas.
d)
AQUECIMENTO DE UM MOTOR
Suponha que um grupo de alunos recebeu a
DE AVIÃO DE MARCA X
MINUTOS TEMPERATURA tarefa de pesquisar fatores que interferem na
(º C) manutenção da saúde ou no desenvolvimento
0 20 de doenças. O primeiro grupo deveria colher
1 27 dados que apoiasses a idéia de que, se
2 34 combatendo agentes biológicos e químicos,
3 41
4 49 garante-se a saúde. Já o segundo grupo deveria
5 56 coletar informações que reforçassem a idéia de
6 63 que a saúde de um indivíduo está diretamente
Dados Fictícios relacionada à sua condição socioeconômica.
Os dados da tabela podem ser utilizados
apropriadamente para:
e) PRODUÇÃO DE LAMINADOS a) apoiar apenas a argumentação do primeiro
NÃO-PLANOS - BRASIL - 1998-2000 grupo.
TIPOS QUANTIDADE (1.000 t) b) apoiar apenas a argumentação do segundo
1998 1999 2000 grupo.
Barras 1.414 1.272 1.139
c) refutar apenas a posição a ser defendida
Vergalhões 2.203 2.140 2.209
Perfilados 526 538 425 pelo segundo grupo.
Tubos 390 344 330 d) apoiar a argumentação dos dois grupos.
Dados Fictícios e) refutar as posições a serem defendidas
pelos dois grupos.
f) PESSOAL DOCENTE DO ESTADO 3)(Enem)Lâmpadas incandescentes são
DE SÃO PAULO - 1999 normalmente projetadas para trabalhar com
REDES 1º GRAU 2º GRAU a tensão da rede elétrica em que serão
Estadual 171.910 38.281 ligadas. Em 1997, contudo, lâmpadas
Municipal 18.429 1.304 projetadas para funcionar com 127 V
Particular 31.514 19.902
foram retiradas do mercado e, em seu
Total 221.853 59.487
lugar, colocaram-se lâmpadas concebidas
Dados hipotéticos
para uma tensão de 120 V. Segundo dados
recentes, essa substituição representou uma
2)(Enem)A tabela abaixo apresenta dados
mudança significativa no consumo de
referentes à mortalidade infantil, à

ESTATÍSTICA 7
Ana Lúcia Guimarães Carvalho

energia elétrica para cerca de 80 milhões secundária, assim como de traços


de brasileiros que residem nas regiões em desnecessários que possam levar o
que a tensão da rede é de 127 V. observador a uma análise morosa ou
A tabela abaixo apresenta algumas com erros.
características de duas lâmpadas de 60 W, b) Clareza – o gráfico deve possibilitar
projetadas respectivamente para 127 V uma correta interpretação dos valores
(antiga) e 120 V (nova), quando ambas se representativos do fenômeno em
encontram ligadas numa rede de 127 V. estudo.
c) Veracidade – o gráfico deve expressar
Lâmpada Tensão Potência Lumino Vida a verdade sobre o fenômeno em estudo.
(projeto da rede medida sidade útil
original) elétrica (watt) medida média
(lúmens) (horas)
Os principais tipos de gráficos são os
60 W – 127 V 127 V 60 750 1.000 diagramas, os cartogramas e os
60 W – 120 V 127 V 65 920 452 pictogramas.

DIAGRAMAS
Acender uma lâmpada de 60 W e 120 V
em um local onde a tensão na tomada é de
Os diagramas são gráficos geométricos de,
127 V, comparativamente a uma lâmpada de
no máximo, duas dimensões; para sua
60 W e 127 V no mesmo local, tem como
construção, em geral, fazemos uso do sistema
resultado:
cartesiano.
a) mesma potência, maior intensidade de luz e
Dentre os principais diagramas,
maior durabilidade.
destacamos: Gráfico em linha ou em curva;
b) mesma potência, maior intensidade de luz e
Gráfico em coluna ou em barras; Gráfico
menor durabilidade.
em colunas ou em barras múltiplas; Gráfico
c) maior potência, maior intensidade deluz e
em setores.
maior durabilidade.
d) maior potência, maior intensidade de luz e
Gráfico em linha ou em curva
menor durabilidade.
e) menor potência, menor intensidade de luz e
Os dados, geralmente de uma série (tabela),
menor durabilidade.
são colocados num sistema cartesiano
ortogonal. Graficamente, temos pontos ligados
por segmentos de reta.
GRÁFICOS ESTATÍSTICOS
Exemplos:
O gráfico estatístico é uma forma de
apresentação dos dados estatísticos, cujo
a)
objetivo é o de produzir, no investigador ou
VENDA DE TRATORES DE UMA
no público em geral, uma impressão mais
FÁBRICA - 2000
rápida e viva do fenômeno em estudo, já que
Mês Unidades vendidas
os gráficos falam mais rápido à compreensão
que as séries. Janeiro 20
Para tornarmos possível uma Fevereiro 12
representação gráfica, estabelecemos uma Março 16
correspondência entre os termos da série e
Abril 24
determinada figura geométrica, de tal modo
que cada elemento da série seja representado Maio 8
por uma figura proporcional. Junho 18
A representação gráfica de um fenômeno Dados fictícios
deve obedecer a certos requisitos
fundamentais, para ser realmente útil:
a) Simplicidade – o gráfico deve ser
destituído de detalhes de importância

ESTATÍSTICA 8
Ana Lúcia Guimarães Carvalho

24 b)
20
PRONTO SOCORRO – CASOS
Dias da semana Atendimento
16
vendas

Segunda 12
12
8 Terça 20
4 Quarta 18
0 Quinta 24
J F M A M J
Sexta 16
mês
Sábado 8
b) DESEMPENHO DOS CANDIDATOS
1º SEMESTRE - 2001 Dados fictícios
Desempenho (%) c)
DISCOS VENDIDOS
Candidatos
(em milhões)
Mês A B C Anos Vendas
Janeiro 12 30 40 1992 76,6
Fevereiro 16 25 36 1993 44,8
Março 20 20 40 1994 44,3
Abril 24 18 32 1995 34,5
Maio 30 20 35 1996 44
Dados fictícios 1997 60
Dados hipotéticos
45
40 d) COMÉRCIO EXTERIOR
Desempenho (%)

35
30
C BRASIL – 1989-98
25
A Anos Quantidade (1.000 t)
20 Exportação Importação
B
15
10 1989 98.010 75.328
5
1990 109.100 71.855
0
J F M A M 1991 123.994 64.066
Mês
1992 119.990 60.718
Exercícios
1993 178.790 55.056

Construa o gráfico de linhas para as tabelas a 1994 141.737 53.988


seguir: 1995 146.351 48.870
a) VENDA DE AUTOMÓVEIS 1996 133.832 60.605
1º SEMESTRE 2001
Mês Unidades vendidas 1997 142.382 61.975

Janeiro 12 1998 169.396 58.085

Fevereiro 20 Fonte: Dados hipotéticos


Março 18
Abril 24
Gráfico em colunas ou em barras
Maio 16
Junho 8 É a representação de uma série por
meio de retângulos, dispostos verticalmente
Dados hipotéticos
(em colunas) ou horizontalmente (em barras).

ESTATÍSTICA 9
Ana Lúcia Guimarães Carvalho

Quando em colunas, os retângulos têm PRODUÇÃO DE ALHO


a mesma base e as alturas são proporcionais BRASIL – 2000
aos respectivos dados. Estados Quantidade
Quando em barras, os retângulos têm a (t)
mesma altura e os comprimentos são
Santa Catarina 13.973
proporcionais aos respectivos dados.
Assim estamos assegurando a Minas Gerais 13.389
proporcionalidade entre as áreas dos Rio Grande do Sul 6.892
retângulos e os dados estatísticos. Goiás 6.130
São Paulo 4.179
Exemplos: Fonte fictícia

Produção de Alho
a) Gráfico em colunas Brasil – 2000

CONSTRUÇÃO DE AERONAVES Santa Catarina


BRASIL - 1994-99
ANOS UNIDADES Minas Gerais

1994 184 Rio Grande do Sul


1995 171
Goiás
1996 167
São Paulo
1997 203
1998 199 0 2 4 6 8 10 12 14
toneladas
1999 197
Fonte: Dados Hipotético c) Gráfico em colunas ou em barras
múltiplas

Este tipo de gráfico é geralmente empregado


quando queremos representar,
Construção de Aeronaves simultaneamente, dois ou mais fenômenos
Brasil – 1994-99 estudados com o propósito de comparação.
250
Exemplo:
200
PÚBLICO NO BRASIL QUE
Unidades

150
FREQÜENTA CINEMA - 1994-2000
100 Ano Filmes nacionais Filmes

50 % estrangeiros %
1994 16 84
0
1994 95 96 97 98 99 1995 18 82
Anos
1996 21 79
1997 25 75
1998 30 70
1999 29 71
2000 31 69

b) Gráfico em barras Fonte hipotética

ESTATÍSTICA 10
Ana Lúcia Guimarães Carvalho

a)
Público no Brasil que Freqüenta Cinema
PRODUÇÃO DE OVOS DE GALINHA
BRASIL - 1999
100 Filmes nacionais
Filmes estrangeiros REGIÃO QUANTIDADE
90
80 (1.000 dúzias)
70 Norte 66.092
Percentual

60
50 Nordeste 356.810
40 Sudeste 937.463
30
20 Sul 485.098
10
Centro-Oeste 118.468
0
94 95 96 97 98 99 00 Fonte: Hipotética
Ano
Fonte hipotética
b)
Exercícios MORADORES DO BAIRRO A, SEGUNDO
O HÁBITO DE ASSISTIR A NOVELAS
1) Represente as tabelas usando o gráfico em HÁBITO PERCENTUAL
colunas: Sim 82%
Não 18%
a)
Total 100%
CHEGADA DE VISITANTES Fonte: fictícia
BRASIL - 1997-2000
ANOS NÚMERO
(milhares)
1997 1.450 3) Represente as tabelas por meio de um
gráfico de colunas múltiplas.
1998 1.550
1999 1.700 a)
2000 1.900 NATALIDADE SEGUNDO
AS REGIÕES DO PAÍS
Fonte: hipotética
b) (em %)
ENTREGA DE GASOLINA PARA 1940 1960 1980
CONSUMO - BRASIL – 1997-00 Norte 54,4 57,4 43,6
ANOS QUANTIDADE
Nordeste 53,5 52,6 41,5
(1.000 m3)
Sudeste 43,7 42,5 28,9
1997 9.700 Sul 39,2 41,7 29,4
1998 11.100 Centro-Oeste 46,8 47,0 35,9
1999 9.727
Fonte: jornal Folha de S. Paulo, 21/7/88
2000 9.347
Dados hipotéticos

2) Usando o gráfico em barras, represente as Gráfico em Setores


tabelas:
Este gráfico é construído com base em
um círculo, e é empregado sempre que

ESTATÍSTICA 11
Ana Lúcia Guimarães Carvalho

desejamos ressaltar a participação do dado no Exercícios:


total.
O total é representado pelo círculo, 1) Represente as tabelas por meio de
que fica dividido em tantos setores quantas gráficos em setores.
são as partes. a)
Os setores são tais que suas áreas são QUEM DOMINA O SETOR
respectivamente proporcionais aos dados da FARMACÊUTICO
série. % de participação Número de
Obtemos cada setor por meio de uma no mercado companhias
regra de três simples e direta, lembrando que Americana 22
o total da série corresponde a 360º. Italiana 4
Inglesa 6
Exemplo: Francesa 5
Alemã 10
REBANHOS BRASILEIROS Austríaca/Holandesa 2
1988 Suíça 6
ESPÉCIE QUANTIDADE
Subtotal 280
(milhões de cabeças) Origem nacional 55
Bovinos 140 Total 335
Suínos 32 Fonte: Jornal Folha de S, Paulo, 23/7/88
Ovinos 20
c)
Caprinos 11 A OCUPAÇÃO DE CADA UM
Total 203
Fonte: IBGE

Temos:
203 __ 360º x1= 248,2 x1 = 248º
140 __ x1
Executivos,
x2 = 56,7 x2 = 57º Fazendeiros e
profissionais
liberais e
empresários outros
x3 = 35,4 x3 = 35º Total no
Operários
Congresso 37% 62% 1%
x4 = 19,5 x4 = 20º
PMDB 39% 60% 0,3%
Com esses dados (valores em graus),
PFL 37% 62% 0,0%
marcamos num círculo de raio arbitrário, com
um transferidor, os arcos correspondentes, PDS 50% 50% 0,0%
obtendo o gráfico: PDT 19% 76% 4%
PT 0% 80% 19%
REBANHOS BRASILEIROS – 1988
Fonte: Revista Veja, jun/87
c)
ÁREA TERRESTRE BRASIL
Bovino REGIÕES RELATIVA
Suíno (%)
Norte 45,25
Ovino Nordeste 18,28
Caprino Sudeste 10,85
Sul 6,76
Centro-Oeste 18,86
Fonte:
IBGE Total 100,00
Fonte: IBGE

ESTATÍSTICA 12
Ana Lúcia Guimarães Carvalho

Cartograma
DENSIDADE POPULACIONAL
O cartograma é a representação sobre PROJETADA DA REGIÃO SUL DO
uma carta geográfica. BRASIL - 1990

Este gráfico é empregado quando o


objetivo é o de figurar os dados estatísticos
diretamente relacionados com áreas
geográficas ou políticas.
Distinguimos duas aplicações:

a) Representar dados absolutos


(população) – neste caso, lançamos
mão, em geral, dos pontos, em
número proporcional aos dados.
b) Representar dados relativos
(densidade) – neste caso, lançamos
mão, em geral, de hachuras.

Exemplo: Menos de 33,0 hab/Km2

POPULAÇÃO PROJETADA DA REGIÃO Menos de 46,0 hab/Km2


SUL DO BRASIL - 1990
ESTADO POPULAÇÃO ÁREA DENSIDADE Menos de 47,0 hab/Km2
(hab.) (Km2)
Paraná 9.137.700 199.324 45,8
Santa 4.461.400 95.318 46,8
Catarina
Rio 9.163.200 280.674 32,6
Grande do Pictograma
Sul
Fonte: IBGE O pictograma constitui um dos
processos que melhor fala ao público, pela sua
POPULAÇÃO PROJETADA DA REGIÃO forma ao mesmo tempo atraente e sugestiva. A
SUL DO BRASIL - 1990 representação gráfica consta de figuras.

Exemplos:

AUMENTA CONSUMO DE GÁS


(Consumo mensal de gás de nafta na região
metropolitana de São Paulo em milhões me m3)

30,15
29,03 MAI./
28,71 ABR./
28,00 MAR./
27,39 FEV./
JAN./88

• 400.000 habitantes

Fonte: Jornal Folha de S. Paulo, jul./88

ESTATÍSTICA 13
Ana Lúcia Guimarães Carvalho

CRESCE O NÚMERO DE d) No período 1985-1996, a taxa de


PASSAGEIROS NOS ÔNIBUS desemprego esteve entre 8% e 16%.
URBANOS DE CAMPINAS (SP) e) A taxa de desemprego foi crescente no
(em milhões) 166,2 período compreendido entre 1988 e
162,1 1997 1991.
158,8 1996
1995
152,4 MÉDIAS ANUAIS DA TAXA DE
1994
DESEMPREGO TOTAL
140,1 GRANDE SÃO PAULO
1993
1985-1996
16%
14%
12%
10%
8%
Fonte: Jornal Folha de São Paulo, jul./98 6%
4%
2%
0%
APURAÇÃO DOS VOTOS PARA 85 86 87 88 89 90 91 92 93 94 95 96
PRESIDENTE
Até 22h34, em % Fonte: SEP, Convênio SEADE-DIEESE

2)(Enem) Uma pesquisa de opinião foi


realizada para avaliar os níveis de audiência de
alguns canais de televisão, entre 20h e 21h,
54,0
24,2 durante uma determinada noite. Os resultados
6,7
5,8 obtidos estão representados no gráfico de
5,6 2,9 barras a seguir:

FHC Lula Enéas Quércia Amim Brizola 100


(PSDB) (PT) (Prona) (PMDB) (PPR) (PDT)
80
Nº de residencia

60

Fonte: jornal Folha de S. Paulo, 5 out. 1994 40

20

Exercícios 0
TvA TvB TvC TvD Nenhum
canal
1)(Enem) Um estudo sobre o problema do
desemprego na Grande São Paulo, no I. O número de residências atingidas nessa
período 1985-1996, realizado pelo SEADE- pesquisa foi, aproximadamente , de:
DIEESE, apresentou o seguinte gráfico a) 100 c) 150 e) 220
sobre taxa de desemprego. b) 135 d) 200

Pela análise do gráfico, é correto afirmar que, II. A percentagem de entrevistados que
no período considerado: declararam estar assistindo à TvB é
a) a maior taxa de desemprego foi de aproximadamente igual a:
14%. a) 15% c) 22% e) 30%
b) A taxa de desemprego no ano de 1995 b) 20% d) 27%
foi a menor do período.
c) A partir de 1992, a taxa de
desemprego foi decrescente.

ESTATÍSTICA 14
Ana Lúcia Guimarães Carvalho

3)(Univali) O gráfico mostra as vendas de GRÁFICO II


televisores em uma loja:
2.200

Nº total de linhas telefônicas


60 2.150
50
Unidades vendidas

2.100
40

30 2.050

20 2.000
Jan. Abr. Ago. Dez.
10

0
Jan. Fev. Mar. Abr. Maio Jun.
Mês Analisando os gráficos, pode-se concluir que:
a) o gráfico II representa um crescimento
Pode-se afirmar que:
real maior do que o do gráfico I.
a) as vendas aumentaram mês a mês.
b) o gráfico I apresenta o crescimento real.
b) foram vendidos 100 televisores até
Sendo o II incorreto.
junho.
c) o gráfico II apresenta o crescimento
c) as vendas do mês de maio foram
real, sendo o gráfico I incorreto.
inferiores à soma das vendas de
d) a aparente diferença de crescimento nos
janeiro e fevereiro.
dois gráficos decorre da escolha das
d) foram vendidos 90 televisores até
diferentes escalas.
abril.
e) os dois gráficos são incomparáveis,
e) Se cada televisor é vendido por
pois usam escalas diferentes.
R$240,00, em maio a loja faturou,
com as vendas desse produto,
5) Analisando o gráfico responda:
R$7.200,00.
meses

4)(Enem) Para convencer a população local JAN FEV MAR ABR MAI JUN
0
da ineficiência da Companhia Telefônica 10
Vilatel na expansão da oferta de linhas, um 20 Produto A
lim me( adnev

30
político publicou no jornal local o gráfico I, 40
50
abaixo representado. A companhia Vilatel 60 Produto B
70
respondeu publicando dias depois o gráfico II, 80
onde pretende justificar um grande aumento 90
na oferta de linhas. O fato é que, no período
considerado, foram instaladas, efetivamente,
200 novas linhas telefônicas. a) Quantas unidades do produto A foram
vendidas em janeiro? E em fevereiro?
Gráfico I b) Em que mês o produto B atingiu a venda de
70.000 unidades?
2.200
c) Em que mês os dois produtos tiveram o
Nº total de linhas telefônicas

2.180
2.160 mesmo número de unidades vendidas?
2.140 d) Em que meses o produto B foi mais vendido
2.120
2.100 que o produto A?
2.080
2.060
2.040 6) O gráfico nos mostra o número de chamadas
2.020 telefônicas ocorridas numa determinada
2.000
cidade de 1995 a 1999. Construa uma
Jan. Abr. Ago. Dez.
tabela que represente esse gráfico.

ESTATÍSTICA 15
Ana Lúcia Guimarães Carvalho

5000

milhões de dólares
450 4500
número de chamadas

400 4000

350 3500

300 3000
250 2500
200 2000 Importação
150 1500
Exportação
100 1000
50 500
0 0
1995 1996 1997 1998 1999 1995 1996 1997 1998 1999
anos anos

7) O gráfico a seguir fornece a evolução do


preço médio de um videocassete brasileiro, de 9) O gráfico abaixo nos mostra a participação
1994 a 1999. Construa a tabela referente ao em 47 vôos semanais para o exterior de
gráfico e responda: algumas empresas brasileiras (dados de
outubro de 1991). Construa a tabela
1200
referente ao gráfico apresentado.
preços (US$)

1000
800 9%
600
400
200 23% Varig
0
1994 1995 1996 1997 1998 1999 Transbrasil
anos
Vasp
Fonte: revista Veja
68%

Fonte: revista Isto É


a) Que nome se dá a esse tipo de gráfico?

b) Qual era o preço médio do TÉCNICA DE SOMATÓRIO


videocassete brasileiro em 1987?
Para indicarmos a soma dos x i (x índice
c) Qual a variação do preço médio do i) valores de uma variável x, isto é, a soma de
videocassete brasileiro entre 1986 e x1 + x2 + x3 + ... + xn, utilizamos o símbolo
1991? grego sigma (Σ), denominado, em Matemática,
SOMATÓRIO.
8) O gráfico nos mostra o movimento de Assim, a soma x1 + x2 + x3 + ... + xn
n
importações e das exportações de um país,
de 1995 a 1999. Faça uma tabela que pode ser representado por ∑x
i=1
i (somatório de
represente esse gráfico.
xi, onde x varia de 1 a n).

TÉCNICAS DE SOMATÓRIO são as


técnicas que auxiliam na soma dos x i valores
de uma variável x.

VARIÁVEL é o conjunto de valores


possíveis que representam um fenômeno.

ESTATÍSTICA 16
Ana Lúcia Guimarães Carvalho

Ex.: Sendo o conjunto x = {1, 3, 5, 6, 8, 9}


Ex.: x = {0, 1, 2, 3, ..., 10} determine:
x = variável 6
i = índice ou ordem que o elemento ∑3x i = 3x2 + 3x3 + 3x4 + 3x5 + 3x6 = 3·3 +
ocupa na seqüência i=2
x1 = 0 x3 = 2 3·5 + 3·6 + 3·8 + 3·9 = 93
x2 = 1 x4 = 3 , e assim por diante.
Aplicando a propriedade temos,
SEQÜÊNCIA é uma função cujo 6 6

domínio é o conjunto de números positivos ∑3x i = 3· ∑x i = 3(x2 + x3 + x4 + x5 + x6) =


que indicam a posição. i =2 i =2
3(3 + 5 + 6 + 8 + 9) = 3·31 = 93
Ex.: X = {x1, x2, x3, ... , x n} ⇒ {1, 2,
3, .. , n} é o conjunto das posições

d) ∑∑x
i j
ij = x11 + x12 + ... + xij
PROPRIEDADES:

n
Seja por exemplo a tabela

a) ∑x = x + x + x + ... + x
i=1
i 1 2 3 n i J
Níveis Níveis fator 2
fator 1 1 2 3
Ex.: Sendo o conjunto X = {1, 3, 5, 6, 8, 9}
1 X11 X12 X13 Σx1j
faça:
2 X21 X22 X23 Σx2j
6 Σxi1 Σxi2 Σxi3 Σxij

• ∑x = x + x + x + x + x + x = 1 + 3
i=1
i 1 2 3 4 5 6
P
+ 5 + 6 + 8 + 9 = 32 N
1 2 3
5
1 28 35 46 109
• ∑x = x
i=3
i 3 + x4 + x5 = 5 + 6 + 8 =19 2 36 48 62 146
64 83 108 255
n
xij ⇒ i → linha
b) ∑k
i =1
k +4
= 1 k4k+
+24...
4 k = n·k, onde k é
+3
nvezes
j → coluna

uma constante real. como fica a notação de somatório:


7 2

Ex.: Determine ∑ 8=8+8+8+8+8+8


i =1
da 1ª coluna → x11 + x21 = ∑x i1 = 28 + 36 =
i =1
+ 8 = 7·8 = 56 64
3
n
da 1ª linha → x11 + x12 + x13 = ∑x = 28 +

1j
c) kx i = kx1 + kx2 + kx3 + kx4 + ...+ kxn = j=1
i =1 35 + 46 = 109
n

k· ∑x
i=1
i , onde k é uma constante real.

ESTATÍSTICA 17
Ana Lúcia Guimarães Carvalho

4 6
Ex. Seja a matriz M =   determine EXERCÍCIOS
8 9
2
1) Desenvolva os seguintes somatórios:
∑∑x ij = x21 + x22 = 8 + 9 = 17 7 7

i=2 j=1
a)
i =1
xi c) ∑x
i= 3
i
n

e) ∑x yi=1
i i = x1·y1 + x2·y2 + ... + xn·yn
b) ∑y
3

i d)
10

∑y i
i =1 i =4
Ex.: Sejam os conjuntos X={0,1,2,3,4,5,6} e
Y = {5,6,7,8,9}, determine: 2) Sendo X = {2, 5, 6, 7} calcule:
4 2
5

∑x y = 2·7 + 3·8 + 4·9 = 14 + 24 + 36 =


i i
a) ∑x
i =1
i b) ∑x
i=1
i

i=3 3 4
74
c) ∑ (x
i =1
i + 1) d) ∑(x
i =2
i + 3)2
n

f) ∑(x +y ) = (x + y )+(x + y )+...+(x + y )


i i 1 1 2 2 n n
i=1 3) Sendo X = {1, 2, 3, 6}, calcule:
n n 4 4

= ∑x + ∑y
i=1
i
i =1
i a) ∑10⋅ x
i=1
i b) ∑(2 +10⋅ x )
i =1
i

Ex.: Sejam os conjuntos X = {0,1,2,3, 4,5,6} 4) Calcule os seguintes somatórios, sendo


e Y = {5,6,7,8,9}, determine: Y = {0, 4, 3, 7}
5 5 3 4 4
5

∑(x + y ) = ∑x + ∑
i
yi = 2 + 3 + 4 + 5 +
i i a) ∑i =1
yi b) ∑i =1
8 c) ∑4y i
i=2 i=2 i=2 i=1

6 + 7 + 8 + 9 = 44
3 3
n d) ∑y ⋅10 i e) ∑(5+12y ) i
g) ∑(x +a) = (x + a) + (x + a) + (x + a)
i=1
i
t
1
t
2
t
3
t i=1
3
i=1
4
+ ... + (xn + a)t , onde a é uma constante real f) ∑(3 − y )
i =1
i g) ∑(4y + 3y −10)
i=1
i i

Ex.: Seja X = {2, 3, 4, 5, 6}, determine: 4


4 h) ∑(3− y + 2y ) i i
∑i=1
( x i + 1) 2 2
= ( 2 + 1) + (3 + 1) + (4 + 1) 2 2 i=1

5) Sendo X = {3, 7, 2, 1} e Y = {0, 3, 1, 2},


+ (5 + 1)2 = 32 + 42 + 52 + 62 = 9 + 16 + 25 +
calcule:
36 = 86
4 4

a) ∑(x + y )
i=1
i i b) ∑(x − y )
i=1
i i

2 4

c) ∑i=1
(2 + x i ) 2 d) ∑(x
i=1
i + yi ) 2

ESTATÍSTICA 18
Ana Lúcia Guimarães Carvalho

4 4 166 160 161 150 162 160

e) ∑x y
i =1
i i f) ∑(x
i=1
i + 1) 165
168
167
163
164
156
160
173
162
160
161
155
164 168 155 152 163 160
155 155 169 151 170 164
4
4 4 154 161 156 172 153 157
f) ∑x + ∑ y
i=1
i
i =1
i g) ∑(x +2+y )
i=1
i i 156 158 158 161

Rol
4 4 4
6) Sendo ∑x i =10 , ∑y =20 e ∑ x
i
2
i =30, Estatura de 40 alunos do Colégio A
i =1 i =1 i =1 150 151 152 153 154 155
calcule: 155 155 155 156 156 156
4 4 157 158 158 160 160 160
a) ∑(x
i=1
i + yi ) b) ∑(x + 3)
i=1
i
2
160
162
160
162
161 161
163 163
161
164
161
164
4 164 165 166 167 168 168
c) ∑(4x
i=1
i + yi ) 169 170 172 173

No exemplo dado, a variável em


 2 − 6 3 − 3 questão, estatura, será observada e estudada
  muito mais facilmente quando dispusermos
7) Sendo M =  1 2 4 5  , determine:
 − 3 5 2 − 1 valores ordenados em uma coluna e
  colocarmos, ao lado de cada valor, o número
3 4 de vezes que aparece repetido.]
a) ∑x i2 b) ∑xj=1
3j Denominamos freqüência o número de
alunos que fica relacionado a um determinado
i =1
3 3 3 4 valor da variável. Obtemos, assim, uma tabela
c) ∑∑x
i = 1 j= 2
ij d) ∑∑ x
i =1 j=1
ij
que recebe o nome de distribuição de
freqüência:

Tabela I

ESTATURA DE 40 ALUNOS DO COLÉGIO


DISTRIBUIÇÃO DE FREQÜÊNCIA
A

ESTAT. FREQ. ESTAT. FREQ.


Freqüência – repetição de determinado
(cm) (cm)
dado.
150 1 163 2
151 1 164 3
Tabela Primitiva – tabela cujos 152 1 165 1
elementos não foram numericamente 153 1 166 1
organizados 154 1 167 1
155 4 168 2
Rol – tabela obtida após a ordenação 156 3 169 1
dos dados . 157 1 170 1
158 2 172 1
Exemplo: 160 5 173 1
161 4
Tabela primitiva 162 2 TOTAL 40

Estatura de 40 alunos do Colégio A

ESTATÍSTICA 19
Ana Lúcia Guimarães Carvalho

O processo dado exige muito espaço, total descrição, até porque a Estatística tem por
mesmo quando o número de valores da finalidade analisar o conjunto de valores,
variável (n) é de tamanho razoável. A desinteressando-se por casos isolados.
solução mais aceitável, pela própria natureza
da variável contínua, é o agrupamento dos Exercício:
valores em vários intervalos.
Deste modo, estaremos agrupando os 1) Observe a tabela seguinte.
valores da variável em intervalos, sendo que,
em estatística, preferimos chamar os Algumas informações sociais sobre os 30
intervalos de classes. funcionários da Indústria Santo Afonso.
Chamando de freqüência de uma
classe o número de valores da variável Nº Estado Nº de Grau de Salário
pertencentes à classe, os dados da tabela Civil depen instrução (x mínimo)
anterior podem ser dispostos em uma tabela dentes
denominada distribuição de freqüência com 1 casado 2 1º grau 3
intervalos de classe. 2 casado 2 1º grau 3
solteiro 0 2º grau 6
Tabela II 4 divorc. 2 2º grau 6
5 casado 2 superior 15
ESTATURA DE 40 ALUNOS DO 6 solteiro 0 1º grau 3
COLÉGIO A 7 casado 2 2º grau 6
ESTATURAS FREQÜÊNCIA 8 casado 3 1º grau 3
(cm) 9 solteiro 0 1º grau 3
150├ 154 4 10 casado 2 1º grau 3
154 ├ 158 9 11 divorc. 3 1º grau 3
158 ├ 162 11 12 casado 2 1º grau 3
162 ├ 166 8
13 casado 2 1º grau 3
166 ├ 170 5
14 casado 2 2º grau 15
170 ├ 174 3
15 solteiro 0 1º grau 4
Total 40
16 solteiro 0 2º grau 8
17 solteiro 1 1º grau 4
OBS: Os intervalos de classe devem 18 casado 2 1º grau 4
ser escritos, de acordo com a Resolução 19 casado 2 2º grau 8
886/66 do IBGE, em termos de desta 20 divorc. 2 1º grau 4
quantidade até menos aquela, empregando, 21 solteiro 1 superior 15
para isso o símbolo ├ (inclusão de li e 22 casado 3 1º grau 4
exclusão de L i). 23 casado 2 2º grau 8
24 solteiro 0 1º grau 4
Ao agruparmos os valores da variável 25 casado 2 2º grau 8
em classes, ganhamos em simplicidade mas 26 solteiro 1 1º grau 4
perdemos em pormenores. Assim, na tabela I, 27 solteiro 0 2º grau 8
podemos verificar, facilmente, que quatro 28 casado 2 1º grau 4
alunos têm 161 cm de altura e que não existe
29 solteiro 0 2º grau 8
nenhum aluno com 171 cm de altura. Já na
30 solteiro 0 1º grau 4
tabela II não podemos ver se algum aluno tem
Fonte: dados hipotéticos
a estatura de 159 cm. No entanto, sabemos,
com segurança, que onze alunos têm estatura
Elabore uma tabela de freqüência (absoluta e
compreendida entre 158 e 162 cm.
relativa) considerando como variável:
O que se pretende com a construção
dessa nova tabela é realçar o que há de
a) o estado civil.
essencial nos dados e, também, tornar
possível o uso de técnicas analíticas para sua b) o número de dependentes.
ESTATÍSTICA 20
Ana Lúcia Guimarães Carvalho

c) O grau de instrução. Ela é obtida pela diferença entre os


limites superior e inferior dessa classe e
d) O salário.
indicada por hi. Assim:

hi = L i - l i
2) As notas de Estatística de uma turma de 50
alunos estão anotadas na tabela a seguir.
Faça uma tabela de freqüência (absoluta e
4 – Amplitude total da distribuição
relativa) para essas notas.
Amplitude total da distribuição
NOTAS DE ESTATÍSTICA
( AT ) é a diferença da última classe (
limite superior máximo) e o limite
4 6 8 5 8 5 7
inferior da primeira classe ( limite
4 10 6 7 5 6 4
inferior mínimo).
6 7 10 10 5 10 5
7 5 8 7 4 5 6
7 6 7 9 9 6 5 AT = L (máx.) – l(mín.)
9 6 5 9 8 10 8
5 6 7 5 6 8 5
4
5 – Amplitude amostral
ELEMENTOS DE UMA DISTRIBUIÇÃO
DE FREQÜÊNCIA Amplitude amostral ( AA ) é a
diferença entre o valor máximo e o valor
1 – Classe mínimo da amostra.

Classes de freqüência ou,


simplesmente, classes são intervalos de AA = x(max.) – x(min.)
variação da variável.

As classes são representadas


6 – Ponto médio de uma classe
simbolicamente por i, sendo i = 1,2,3, ... ,K
(onde K é o número total de classes da
distribuição). Ponto médio de uma classe ( xi )
é, como o próprio nome indica, o ponto
2 – Limites de classe que divide o intervalo de classe em duas
partes iguais.
Determinamos limites de
classe os extremos de cada classe. Para obtermos o ponto médio de uma
classe, calculamos a semi-soma dos limites da
O menor número é o limite inferior
classe ( média aritmética):
da classe ( li ) e o maior número, o limite
superior da classe ( L i ) .
li + L i
xi =
3 – Amplitude de um intervalo de classe 2

Amplitude de um intervalo 7 – Freqüência simples ou absoluta


de classe ou, simplesmente, intervalo
de classe é a medida do intervalo que Freqüência simples ou freqüência
define a classe. absoluta ou, simplesmente freqüência de
uma classe ou de um valor individual é o
número de observações correspondentes a
essa classe ou a esse valor.
ESTATÍSTICA 21
Ana Lúcia Guimarães Carvalho

A freqüência simples é simbolizada i Notas xi fi


por fi ( lemos: f índice i ou freqüência da 1 0├2
classe i ). 2 2├4
A soma de todas as freqüências é 3 4├6
representada pelo símbolo de somatório: 4 6├8
5 8 ├10
k
∑f =
∑ fi
i

i =1
b) Agora, responda:

1) Qual a amplitude amostral?


NÚMERO DE CLASSES
2) Qual a amplitude da distribuição?
INTERVALO DE CLASSE
3) Qual o número de classes da
Para a determinação do número de distribuição?
classes de uma distribuição podemos lançar 4) Qual o limite inferior da quarta classe?
mão da regra de Sturger, que nos dá o 5) Qual o limite superior da classe de
ordem 2?
número de classes em função do número de
valores da variável: 6) Qual a amplitude do segundo intervalo
de classe?
i ≅ 1 + 3,3 . log n
c) Complete:
onde:
i é o número de classe; 1) h3 = _____ 2) l1 = _____ 3) x2 = ___
n é o número total de dados.
4) n = _____ 5) L 3 = ____ 6) f5 = ____
Decidido o número de classes que
deve ter a distribuição, resta-nos resolver o TIPOS DE FREQÜÊNCIA
problema da determinação da amplitude do
intervalo de classe, o que conseguimos Freqüências simples ou
dividindo a amplitude total pelo número de absolutas (fi) são os valores que
classes: realmente representam o número de
dados de cada classe.
AT
h ≅
i
A soma das freqüências simples é igual
Quando o resultado não é exato, ao número total dos dados:
devemos arredonda-lo para mais.
∑f i =n
Exercício:

1) As notas obtidas por 50 alunos de uma


Freqüência relativa (fri) são
classe foram:
1 2 3 4 5 6 6 7 7 8 os valores das razões entre as
2 3 3 4 5 6 6 7 8 8 freqüências simples e a freqüência
2 3 4 4 5 6 6 7 8 9 total
2 3 4 5 5 6 6 7 8 9
2 3 4 5 5 6 7 7 8 9
fi
a) Complete a distribuição de freqüência : fri =
∑f i

ESTATÍSTICA 22
Ana Lúcia Guimarães Carvalho

O propósito das freqüências relativas é i xi fi


o de permitir a análise ou facilitar as 1 2 4
comparações. 2 3 7
3 4 5
Freqüência acumulada (Fi) é o 4 5 2
somatório de todas as classes anteriores 5 6 1
da referida classe. 6 7 1
∑ = 20
Fk = f1 + f2 + ... + fk
Exercícios:

Freqüência acumulada 1) Considerando as notas de um teste de


relativa (Fri) de uma classe é a inteligência aplicado a 100 alunos:
freqüência acumulada da classe,
dividida pela freqüência total da 64 78 66 82 74 103 78 86 103 87
distribuição. 73 95 82 89 73 92 85 80 81 90
78 86 78 85 98 75 73 90 86 101
86 84 86 76 76 83 86 84 85 103
76 80 92 73 87 70 85 79 93 102
Fi
Fri = 82 90 83 81 85 72 81 96 81 85
∑f i 68
71
96
73
86
63
70
74
72 74
98 78
84
78
99 81 89
83 96 105
95 94 88 62 91 83 98 93 83 76
94 75 67 95 708 98 71 92 72 73
DISTRIBUIÇÃO DE FREQÜÊNCIA SEM
INTERVALO DE CLASSE Forme uma distribuição de freqüência.
Determine:
Quando se trata de variável discreta a) ∑ fi b) fri c) Fi d) Fr i
de variação relativamente pequena, cada valor
pode ser tomado como um intervalo de classe 2) A distribuição abaixo indica o número de
e, nesse caso, a distribuição é chamada acidentes ocorridos com 70 motoristas de
distribuição sem intervalo de classe, uma empresa de ônibus:
tomando a seguinte forma:
Nº acidentes 0 1 2 3 4 5 6 7
xi fi Nº motoristas 20 10 16 9 6 5 3 1
x1 f1
x2 f2 Determine:
: : a) o número de motoristas que não sofreram
xn fn nenhum acidente:
∑ fi = n b) o número de motoristas que sofreram pelo
menos 4 acidentes;
c) o número de motoristas que sofreram
menos de 3 acidentes;
Exemplo: d) o número de motoristas que sofreram no
mínimo 3 e no máximo 2 acidentes;
e) a percentagem dos motoristas que sofreram
no máximo 2 acidentes.
Seja X a variável “número de cômodos das
casas ocupadas por vinte famílias 3) Sejam as alturas (em centímetros) de 25
alunos de uma determinada classe:
entrevistadas”:

ESTATÍSTICA 23
Ana Lúcia Guimarães Carvalho

150 159 157 151 152 m) a percentagem dos lotes cuja área é de
500m2, no mínimo, mas inferior a 1.000m2;
156 153 163 159 175 n) a classe do 72º lote;
o) até que classe estão incluídos 60% dos lotes.
162 162 164 158 159
5) Baseando que um amostra apresentou os
164 168 166 160 162 resultados abaixo, clacule a amplitude do
intervalo de classe ( h ) e o número total de
a) Calcule a amplitude do rol. classes ( i ).
b) Calcule a amplitude para cada intervalo de
classe. a) n=50 AA=150
c) Ache a distribuição de freqüência com
intervalos de classe, a freqüência relativa, a b) n=70 AA=10
freqüência acumulada e a freqüência
acumulada relativa. 6) Complete os dados que faltam na
distribuição de freqüência:
4) A tabela abaixo apresenta uma distribuição
de freqüência das áreas de 400 lotes: a)
I Xi fi fri fi
ÁREAS Nº DE
(m2) LOTES 1 0 1 0.05
300 ├ 400 14 2 1 0.15 4
3 2 4
400 ├ 500 46 4 3 0.25 13
500 ├ 600 58 5 4 3
6 5 18
600 ├ 700 76 7 6 19
700 ├ 800 68 8 7
800 ├ 900 62 ∑ = 20 ∑ = 1.00
900 ├ 1000 48
1000 ├ 1100 22 b)
i Classes xi fi Fi fri
1100 ├ 1200 6 1 0├2 1 4 0,04
2 2├4 8
Com referência a essa tabela, determine: 3 4├6 5 30 0,18
a) a amplitude total; 4 7 27 0,27
b) o limite superior da quinta classe; 5 15 72
c) o limite inferior da oitava classe; 6 10 ├ 12 83
d) o ponto médio da sétima classe; 7 13 10 93 0,10
e) a amplitude do intervalo da segunda classe; 8 14 ├ 16 0,07
f) a freqüência da quarta classe;
g) a freqüência relativa da sexta classe;
∑= ∑=
h) a freqüência acumulada da quinta classe;
i) o número de lotes cuja área não atinge 700
m2; REPRESENTAÇÃO GRÁFICA DE UMA
j) o número de lotes cuja área atinge e DISTRIBUIÇÃO
ultrapassa 800 m2;
Uma distribuição de freqüência pode
k) a percentagem dos lotes cuja área não
ser representada graficamente pelo
atinge 600 m2;
histograma, pelo polígono de freqüência e
l) a percentagem dos lotes cuja área seja
pelo polígono de freqüência acumulada
maior ou igual a 900 m2;
(ogiva de Galton).
ESTATÍSTICA 24
Ana Lúcia Guimarães Carvalho

Construímos qualquer um dos gráficos O histograma goza de uma propriedade


mencionados utilizando o primeiro quadrante da qual faremos considerável uso: a área de
do sistema de eixos coordenados cartesianos um histograma é proporcional à soma das
ortogonais. Na linha horizontal (eixo das freqüências.
abscissas) colocamos os valores da variável e
na linha vertical ( eixo das ordenadas), as POLÍGONO DE FREQÜÊNCIA
freqüências.
O polígono de freqüência é um
HISTOGRAMA
gráfico em linha, sendo as freqüências
marcadas sobre perpendiculares ao eixo
O histograma é formado por um horizontal, levantadas pelos pontos
conjunto de retângulos justapostos, cujas médios dos intervalos de classe.
bases se localizam sobre o eixo
horizontal, de tal modo que seus pontos Para realmente obtermos um polígono
médios coincidam com os pontos médios (linha fechada), devemos completar a figura,
dos intervalos de classe. ligando os extremos da linha obtida aos pontos
médios da classe anterior à primeira e da
As larguras dos retângulos são iguais posterior à última, da distribuição.
às amplitudes dos intervalos de classe.
As alturas dos retângulos devem ser Exemplo:
proporcionais às freqüências das classes, ESTATURA DE 40 ALUNOS DO COLÉGIO
sendo a amplitude dos intervalos iguais. Isso A
nos permite tomar as alturas numericamente i ESTATURAS fi
iguais às freqüências. (cm)
1 150├ 154 4
Exemplo: À distribuição da tabela 2 154 ├ 158 9
corresponde o seguinte histograma: 3 158 ├ 162 11
4 162 ├ 166 8
ESTATURA DE 40 ALUNOS DO 5 166 ├ 170 5
COLÉGIO A 6 170 ├ 174 3
i ESTATURAS
(cm)
fi Total ∑ f i = 40
1 150├ 154 4
2 154 ├ 158 9
3 158 ├ 162 11 12

4 162 ├ 166 8 10
frequência

5 166 ├ 170 5 8

6 170 ├ 174 3 6

Total ∑ f i = 40 4
2
0
148 152 156 160 164 168 172 176
12 Estatura
10
frequência

8
6 No caso de termos uma variável
4 essencialmente positiva, cuja distribuição se
2 inicie no valor zero, devemos considerar um
0 intervalo anterior localizado no semi-eixo
150 154 158 162 166 170 174 negativo. Porém consideraremos apenas a parte
classes positiva do segmento que liga o ponto médio

ESTATÍSTICA 25
Ana Lúcia Guimarães Carvalho

desse intervalo com a freqüência do intervalo Exemplo:


0├ ... .
i xi fi Fi
POLÍGONO DE FREQÜÊNCIA 1 2 4 4
ACUMULADA 2 3 7 11
3 4 5 16
O polígono de freqüência 4 5 2 18
acumulada é traçado marcando-se as 5 6 1 19
freqüências acumuladas sobre 6 7 1 20
perpendiculares ao eixo horizontal,
levantadas nos pontos correspondentes aos
∑ = 20
limites superiores dos intervalos de classe.

8
Exemplo:

Freqüência
6
ESTATURA DE 40 ALUNOS DO
COLÉGIO A 4
i ESTATURAS fi
2
(cm)
1 150├ 154 4 0
2 154 ├ 158 9 1 2 3 4 5 6 7
3 158 ├ 162 11
4 162 ├ 166 8 Também podemos representar a
5 166 ├ 170 5 distribuição pelo gráfico da freqüência
6 170 ├ 174 3 acumulada, o qual se apresentará com pontos
Total ∑ f i = 40 de descontinuidade nos valores observados da
variável:

40

30
Freqüencia

20 Exercícios:

10 1) Dada a distribuição abaixo, construa para os


dados apresentados:
0
150 154 158 162 166 170 174
Estatura Áreas nº de
(m2) lotes
GRÁFICO DE UMA DISTRIBUIÇÃO DE 300 ├ 400 14
FREQÜÊNCIA SEM INTERVALO DE 400 ├ 500 46
CLASSE 500 ├ 600 58
600 ├ 700 76
Uma distribuição de freqüência sem 700 ├ 800 68
intervalo de classe é representada 800 ├ 900 62
graficamente por um diagrama onde cada 900 ├ 1000 48
valor da variável é representado por um 1000 ├ 1100 22
segmento de reta vertical e de comprimento 1100 ├ 1200 6
proporcional à respectiva freqüência.

ESTATÍSTICA 26
Ana Lúcia Guimarães Carvalho

a) O histograma; c) O polígono de freqüência.


b) o polígono de freqüência; d) O polígono de freqüência acumulada
c) o polígono de freqüência acumulada. correspondente.

2) Dada a distribuição abaixo, construa para 5) Um grau de nebulosidade, registrado em


os dados apresentados: décimos, ocorre de acordo com a distribuição
abaixo:
i Classes fi
Nebulo 0 ├ 0,5├ ,5├ 2,5├ 3,5├ 4,5├ 5,5 ├ 6,5├ 7,5├ 8,5├ 9,5├ 10
1 4├8 2 sidade
2 8 ├ 12 5 fi 320 125 75 65 45 45 55 65 90 145 676
3 12 ├ 16 9
4 16 ├ 20 6 Pede-se:
5 20 ├ 24 2
a) A freqüência acumulada.
6 24 ├ 28 1
b) O histograma.
Σ = 25 c) O polígono de freqüência.
d) O polígono de freqüência acumulada.
a) O histograma.
b) O polígono de freqüência. 6) Dado o histograma abaixo, construa:
c) O polígono de freqüência acumulada
12

3) Conhecidas as notas de 50 alunos: 10


frequência

8
68 85 33 52 66 77 84 65 74 57
6
71 35 81 50 35 64 74 47 54 68
80 61 41 91 55 73 59 53 77 45 4

41 55 78 48 69 85 67 39 60 76 2
94 88 66 66 73 42 65 94 88 89 0
8 10 12 14 16 18 20 22
classes
pede-se:
a) Uma tabela de freqüência para os dados
a) A distribuição de freqüência começando
apresentados.
por 30 e adotando-se o intervalo de classe
b) O polígono de freqüência.
de amplitude igual a 10.
c) O polígono de freqüência acumulada.
b) A freqüência acumulada.
c) O histograma.
d) O polígono de freqüência. 7) Dado o polígono de freqüência abaixo,
f) O polígono de freqüência acumulada. construa:

4) A tabela abaixo apresenta os coeficientes


de liquidez obtidos da análise de balanço 16
em 50 indústrias 14
frequência

12
10
3,9 7,4 10,0 11,8 2,3 4,5 10,5 8,4 15,6
8
18,8 2,9 2,3 0,4 5,0 9,0 5,5 9,2 12,4
4,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8 6
7,1 3,2 2,7 16,2 2,7 9,5 13,1 3,8 6,3 4
4,8 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 2
7,5 8,7 4,4 7,9 16,0
0
10 14 18 22 26 30 34 36
pede-se: X

a) Formar com esses dados uma distribuição a)Uma tabela de freqüência para os
com intervalos de classe igual a 3, tais que dados apresentados.
os limites inferiores sejam múltiplos de 3. b) O histograma.
b) Confeccionar o histograma. c) O polígono de freqüência acumulada.

ESTATÍSTICA 27
Ana Lúcia Guimarães Carvalho

8) Examinando o histograma abaixo, que MEDIDAS DE POSIÇÃO


corresponde às notas relativas à aplicação
de um teste de inteligência a um grupo de As medidas de posição mais
alunos, responda: importantes são as medidas de tendência
central, que recebem tal denominação pelo
a) Qual é o intervalo de classe que tem fato de os dados observados tenderem, em
maior freqüência? geral, a se agrupar em torno dos valores
b) Qual a amplitude total da distribuição? centrais. Dentre as medidas de tendência
c) Qual o número total de alunos? central, destacamos a média aritmética, a
d) Qual é a freqüência do intervalo de mediana e a moda.
classe 110 ├ 120?
e) Quais os dois intervalos de classe que _

têm a mesma freqüência? MÉDIA ARITMÉTICA ( X )


f) Quais são os dois intervalos de classe
tais que a freqüência de um é o dobro Média aritmética é o quociente da
da freqüência do outro? divisão da soma dos valores da variável
g) Quantos alunos receberam notas de pelo número deles.
teste entre 90 (inclusive) e 110?
h) Quantos alunos receberam notas não-
inferiores a 100?

x= ∑ i
_ x
30 n
sendo:
25
frequência

20
x a média aritmética;
x i os valores da variável;
15
n o número de valores.
10
Dados não-agrupados
5
Quando desejamos conhecer a média
0
40 60 80 100 120 140 160 dos dados não-agrupados, determinamos a
classes média aritmética simples.
9) O gráfico mostra a distribuição de uma Exemplo:
amostra de garrafas de refrigerantes e seus Sabendo-se que a produção leiteira
respectivos volumes em mililitros: diária da vaca A, durante uma semana, foi de
10, 14, 13, 15, 16, 18 e 12 litros, temos, para
500
produção média da semana:

400 _
10 + 14 + 13 + 15 + 16 + 18 + 12 98
(nº de garrafas

x= = 14
Freqüência

=
300 7 7
Logo:
200 _

100
x =14 litros
0
280 300 320
Volume (ml)
Dados agrupados
a) Quantas garrafas compõem essa amostra?
b) Qual a freqüência relativa da classe “300 Sem intervalo de classe
ml”?

ESTATÍSTICA 28
Ana Lúcia Guimarães Carvalho

Neste caso, como as freqüências são


números indicadores de cada valor da i ESTATURAS fi xi xifi
variável, elas funcionam como fatores de (cm)
ponderação, o que nos leva a calcular a média 1 150 ├ 154 4 152 608
aritmética ponderada, dada pela fórmula: 2 154├ 158 9 156 1.404
3 158├ 162 11 160 1.760
4 162├ 166 8 164 1.312
_
x=
∑x f i i
5 166├ 170 5 168 840
6 170├ 174 3 172 516
∑f i
∑ = 40 ∑ = 6.440
Exemplo: _
x=
∑x f
i i
=
6.440 _
= 161 ⇒ x = 161 cm
Considere a distribuição relativa a 34 ∑f i 40
famílias de quatro filhos, tomando para
variável o número de filhos do sexo Exercícios:
masculino:
1) As idades dos jogadores de um time de
Nº DE FILHOS fi xif i basquetebol são 18, 23, 19, 20 e 21 anos.
Qual é a média de idade desses jogadores?
0 2 0
1 6 6
2) Entre sessenta números, vinte são iguais a
2 10 20
5, dez são iguais a 6, quinze são iguais a 8,
3 12 36
dez são iguais a 12, e cinco são iguais a 1.
4 4 16
Determine a média aritmética desses
∑ = 34 ∑ = 78 números.

Temos, então: 3) Quatro funcionários A, B, C e D de uma


_
x= ∑x f i i
⇒x=
_
78 _
= 2,29 ⇒ x = 2,3
empresa têm respectivamente 8, 6, 10 e 16
anos de trabalho nessa empresa. O
∑f i 34 funcionário A recebeu um prêmio de R$
500,00 por ano de casa; B recebeu um
isto é: prêmio de R$ 600,00 por ano de casa; e C e
_
D receberam, cada um, R$ 800,00 de
x = 2,3 meninos prêmio por ano de casa. Qual foi o prêmio
médio recebido por ano de casa por esses
Com intervalo de classe funcionários?

Neste caso, convencionamos que 4) As classes A, B e C da segunda série do


todos os valores incluídos em um ensino médio tiveram respectivamente as
determinado intervalo de classe coincidem seguintes médias na prova de matemática:
com o seu ponto médio, e determinamos a 6,5; 6,0 e 7,0. Sabendo que a classe A é
média aritmética ponderada por meio da formada por 28 alunos, B é formada por 25
fórmula: alunos e C, por 22 alunos, calcule a nota
média de todos os 75 alunos.
_
x= ∑x f i i

∑f i
5) A tabela mostra a distribuição de freqüência
da carga, em toneladas, dos caminhões que
passaram por uma estrada num certo
Onde xi é o ponto médio da classe. período.
Calcule a carga média desses caminhões.
Exemplo:
Consideremos a distribuição:
ESTATÍSTICA 29
Ana Lúcia Guimarães Carvalho

Carga Número de Uma vez agrupados os dados, é


(em toneladas) caminhões possível determinar imediatamente a moda:
[ 9,5;14,5 [ 18 basta fixar o valor da variável de maior
freqüência.
[ 14,5;19,5 [ 33
[ 19,5;25,5 ] 9 Exemplo:

Dada a distribuição
A MODA ( Mo )
Nº DE FILHOS fi
0 2
Denominamos moda o valor
1 6
que ocorre com maior freqüência em
2 10
uma série de valores.
3 12
4 4
Dados não-agrupados ∑ = 34
Quando lidamos com valores não-
A freqüência máxima ( 12 ) corresponde o
agrupados, a moda é facilmente reconhecida:
valor 3 da variável. Logo:
basta, de acordo com a definição, procurar o
Mo = 3
valor que mais se repete.
Com intervalo de classe
Exemplo:
A classe que apresenta a maior
A série de dados:
freqüência é denominada classe modal. Pela
definição, podemos afirmar que a moda, neste
7, 8, 9, 10, 10, 10, 11, 12, 13, 15
caso, é o valor dominante que está
compreendido entre os limites da classe modal.
tem moda igual a 10.
O método mais simples para o cálculo
da moda consiste em tomar o ponto médio da
Podemos, entretanto, encontrar séries
classe modal.
nas quais não exista valor modal, isto é, nas
Damos a esse valor a denominação de
quais nenhum valor apareça mais vezes que
moda bruta.
outros. É o caso da série:
Temos, então:
3, 5, 8, 10, 12, 13
l+L
que não apresenta moda ( amodal ). Mo =
2
Em outros casos, ao contrário, pode
haver dois ou mais valores de concentração.
onde:
Dizemos, então, que a série tem dois ou mais
valores modais. Na série:
l é o limite inferior da classe modal;
L é o limite superior da classe modal.
2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9

temos duas modas: 4 e 7 ( bimodal ).


Exemplo:
Dados agrupados
Para a distribuição:
Sem intervalo de classe
i Estaturas fi

ESTATÍSTICA 30
Ana Lúcia Guimarães Carvalho

(cm) da série. Convencionou-se utilizar o ponto


1 150 ├ 154 4 médio.
2 154 ├ 158 9 Assim, a série de valores:
3 158 ├ 162 11
4 162 ├ 166 8 2, 6, 7, 10, 12, 13, 18, 21
5 166 ├ 170 5
6 170 ├ 174 3 tem para mediana a média aritmética entre 10 e
12
∑ = 40 Logo:
10 = 12 22
l+L Md = = = 11
Mo = 2 2
2 donde:
158 = 162 320 Md = 11
Mo = = = 160
2 2
Logo: Dados agrupados

Mo = 160 cm Se os dados agrupam em uma


distribuição de freqüência, o cálculo da
A MEDIANA ( Md ) mediana se processa de modo muito
semelhante àquele dos dados não-agrupados,
A mediana é definida como o implicando, porém, a determinação prévia das
número que se encontra no centro de um freqüências acumuladas. Ainda aqui, temos
série de números, estando estes dispostos que determinar um valor tal que divida a
segundo uma ordem.. É o valor situado de distribuição em dois grupos que contenham o
tal forma no conjunto que o separa em dois mesmo número de elementos.
subconjuntos de mesmo número de Para o caso de uma distribuição, porém,
elementos. a ordem, a partir de qualquer um dos extremos,
é dada por:
Dados não-agrupados

Dada uma série de valores: Pos =


∑f i

2
5, 13, 10, 2, 18, 15, 6, 16, 9, Sem intervalo de classe
o primeiro passo é o da ordenação ( crescente Neste caso, basta identificar a
ou decrescente ) dos valores: freqüência acumulada imediatamente superior
à metade da soma das freqüências. A mediana
2, 5, 6, 9, 10, 13, 15, 16, 18 será aquele valor da variável que corresponde a
tal freqüência acumulada.
em seguida, tomamos aquele valor central que
apresenta o mesmo número de elementos à Exemplo:
direita e à esquerda. Em nosso exemplo, esse
valor é o 10, já que, nessa série, há quatro Dada a distribuição de freqüência:
elementos acima dele e quatro abaixo. Nº DE fi Fi
Temos, então: MENINOS
Md = 10 0 2 2
1 6 8
Se, porém, a série dada tiver um 2 10 18
número par de termos, a mediana será, por 3 12 30
definição, qualquer dos números 4 4 34
compreendidos entre os dois valores centrais
∑ = 34
ESTATÍSTICA 31
Ana Lúcia Guimarães Carvalho

Sendo: Neste caso, o problema consiste em


∑f 34
i
= 17
=
determinar o ponto do intervalo em que está
compreendida a mediana.
2 2
Para tanto, temos inicialmente que
a menor freqüência acumulada que supera
determinar a classe na qual se acha a mediana
esse valor é 18, que corresponde ao valor 2 da
– classe mediana. Tal classe será,
variável, sendo este o valor mediano. Logo:
evidentemente, aquela correspondente à
freqüência acumulada imediatamente superior
Md = 2 meninos
a
∑ fi .
No caso de existir uma freqüência 2
acumulada (F i), tal que:
Seguimos os seguintes passos:

Fi =
∑f,
i
1º) Determinamos as freqüências acumuladas.
2
a mediana será dada por: 2º) Calculamos
∑ fi
2
3º) Marcamos a classe correspondente à
x i + x i +1 freqüência acumulada imediatamente superior
Md =
2
à
∑ f i - classe mediana – e, em seguida,
2
isto é, a mediana será a média aritmética entre empregamos a fórmula:
o valor da variável correspondente a essa
freqüência acumulada e o seguinte. ∑ fi 
 − F(ant ) h
Exemplo:  2 
Md = l +
f
Dada a distribuição de freqüência:
na qual:
xi fi Fi l é o limite inferior da classe mediana;
12 1 1 F(ant) é a freqüência acumulada da
14 2 3 classe anterior à classe mediana;
15 1 4 f é a freqüência simples da classe
16 2 6 mediana;
17 1 7 h é a amplitude do intervalo da classe
20 1 8 mediana.
∑= 8 Exemplo:
Temos:
Dada a distribuição de freqüência:
Pos =
∑f i 8
= =4
2 2 i Estaturas fi Fi
Logo: (cm)
15 + 16 31 1 150 ├ 154 4 4
Md = = = 15,5
2 2 2 154 ├ 158 9 13
3 158 ├ 162 11 24 Classe
Donde: mediana
Md = 15,5 4 162 ├ 166 8 32
5 166 ├ 170 5 37
6 170 ├ 174 3 40
Com intervalo de classe ∑ = 40

ESTATÍSTICA 32
Ana Lúcia Guimarães Carvalho

Temos: xi 3 4 5 6 7 8
∑f 40
i
= 20
=
fi 4 8 11 10 8 3
2 2
Logo, a classe mediana é a de ordem 3. Então: calcule:
a) a média;
l = 158, F(ant) = 13, f = 11 e h = 4 b) a mediana;
c) a moda.
substituindo na fórmula:

Md = 158 +
(20 − 13) 4 =158 + 28 5) Quando trabalhamos com variáveis
11 11 contínuas e em grande número, pode ser
Md = 158 + 2,54 = 160,54 interessante classificá-las em intervalos
iguais, a fim de reduzir o tempo das
isto é: operações. Nestes casos, para os cálculos
Md = 160,5 cm das medidas de posição costumamos
considerar todos os valores de cada
Exercícios intervalo iguais ao ponto médio do
intervalo. Assim, se no intervalo de 10 a 15
1) Considerando os conjuntos de dados: tivermos 18 valores, consideraremos que
todos os 18 são iguais a 12,5, que é o valor
a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 médio entre 10 e 15. Esta medida não
b) 51,6; 48,7; 50,3; 49,5; 48,9 costuma acarretar erro considerável.
Com base no que afirmamos acima,
c) 20, 9, 7, 2, 12, 7, 20, 15, 7 determine a média, a mediana e a moda das
d) 15, 18, 20, 13, 10, 16, 14 seguintes distribuições de freqüências:

calcule: INTERVALO FREQÜÊNCIA


2├8 4
I - a média; 8 ├ 14 6
II - a mediana; 8
14 ├ 20
III - a moda.
20 ├ 26 6
2) Os salários-hora de cinco funcionários de
uma companhia são:
INTERVALO FREQÜÊNCIA
R$ 75,00; R$ 90,00; R$ 83,00;R$ 142,00 e 1├2 1
R$ 88,00. 2├3 4
3├4 6
Determine: 4├5 3
a) a média dos salários-hora; 5├6 1
b) o salário-hora mediano;
c) o salário modal.
6) Numa pesquisa feita dentre os alunos de
3) As notas de um candidato, em seis provas uma escola para saber da existência de
de um concurso, foram: 8,4; 9,1; 7,2; 6,8; irmãos mais novos, obtiveram-se os dados
8,7 e 7,2. Determine: mostrados na tabela abaixo:

a) a nota média; Calcule:


b) a nota mediana;
c) a nota modal a) o número médio de irmãos mais novos;
b) o número mediano de irmãos mais novos;
4) Considerando as distribuições: c) a moda de irmãos mais novos.

ESTATÍSTICA 33
Ana Lúcia Guimarães Carvalho

nº de irmãos Freqüência b) É possível afirmar que a nota média,


mais novos nessa questão, foi ≤ 2? Justifique sua
6 4 resposta.
5 6 c) Qual é a moda do conjunto das notas de
4 10 todos os alunos?
3 12 d) Qual é a mediana do conjunto das notas
2 22 de todos os alunos?
1 31
0 18

7) Determine a média, a mediana e a moda 1 (20% )


das seguintes distribuições de freqüências: 2 (32% )
0 (10% )
INTERVALO FREQÜÊNCIA
1,60 ├ 1,65 4 5 (10% )
1,65 ├ 1,70 7 3 (16% )

1,70 ├ 1,75 9 4 (12% )

1,75 ├ 1,80 12
1,80 ├ 1,85 6
10) (Vunesp) Suponhamos que nos
1,85 ├ 1,90 2 vestibulares desse ano uma universidade
tivesse tido, para os seus diversos cursos,
8) (UFRJ) O gráfico mostra a distribuição de uma média de 3,60 candidatos por vaga
uma prova de matemática. oferecida. Se para os vestibulares do ano
que vem o número de vagas for aumentado
10 de 20% e o número de candidatos aumentar
em 10%, qual a média de candidatos por
vaga que essa universidade terá no próximo
Número de alunos

8
ano?
6

4
a) 3,24 b) 3,30 c) 3,36 d) 3,40 e) 3,46

2
MEDIDAS DE DISPERSÃO OU DE
0
1 2 3 4 5 6 7 8 9 10
VARIABILIDADE
Notas
A média aritmética, a mediana e a
a) Quantos alunos fizeram a prova? moda, são valores que podem servir de
b) Determine a média aritmética das comparação para dar a posição de qualquer
notas dessa prova. elemento do conjunto.
Entretanto, quando se trata de
9) (Unicamp-SP) O gráfico, em forma de interpretar dados estatísticos, mesmo aqueles já
pizza, representa as notas obtidas em uma convenientemente simplificados, é necessário
questão pelos 32.000 candidatos presentes ter-se uma idéia retrospectiva de como se
à primeira fase de uma prova de vestibular. apresentavam esses mesmos dados nas tabelas.
Ele mostra, por exemplo, que 32% desses Assim, não é o bastante dar uma das
candidatos tiveram nota 2 nessa questão. medidas de posição para caracterizar
perfeitamente um conjunto de valores, pois,
Pergunta-se: mesmo sabendo, por exemplo, que a
temperatura média de duas cidades é a mesma,
a) Quantos candidatos tiveram nota 3? e igual a 24º C, ainda assim somos levados a

ESTATÍSTICA 34
Ana Lúcia Guimarães Carvalho

pensar a respeito do lima dessas cidades. Em Portanto, para qualificar os valores de


uma delas poderá a temperatura variar entre uma variável, ressaltando a maior ou menor
limites de muito calor e de muito frio e haver, dispersão ou variabilidade entre esses valores e
ainda, uma temperatura média de 24º C. A a sua medida de posição, a Estatística recorre às
outra poderá ter uma variação pequena de medidas de dispersão ou de variabilidade.
temperatura e possuir, portanto, no que se Dessas medidas, estudaremos a
refere à temperatura, um clima mais amplitude total, a variância, o desvio padrão
favorável. e o coeficiente de variação.
As medidas de posição, ainda que
considerada como um número que tem a AMPLITUDE TOTAL
faculdade de representar uma série de valores,
não pode, por si mesma, destacar o grau de A amplitude total é a diferença
homogeneidade ou heterogeneidade que entre o maior e o menor valor
existe entre os valores que compões o observado.
conjunto.
Consideremos os seguintes conjuntos
de valores das variáveis x, y e z: Dados não-agrupados

X: 70, 70, 70, 70, 70


Y: 68, 69, 70, 71, 72 AT = x(max.) – x(min.)
Z: 5, 15, 50, 120, 160.

Calculando a média aritmética de cada Para os valores:


um desses conjuntos, obtemos: 40, 45, 48, 52, 54, 62 e 70
_ temos:
x = 70 AT = 70 – 40 = 30
_ Logo:
y = 70 AT = 30
_
z = 70
Quando dizemos que a amplitude total
Vemos, então, que os três conjuntos dos valores é 30, estamos afirmando alguma
apresentam a mesma média aritmética: 70. coisa do grau de sua concentração. É evidente
Entretanto, é fácil notar que o que, quanto maior a amplitude total, maior é a
conjunto X é mais homogêneo que os dispersão ou variabilidade dos valores da
conjuntos Y e Z, já que todos os valores são variável.
iguais à média. Considerando os conjuntos X, Y e Z
O conjunto Y, por sua vez, é mais citados anteriormente, temos:
homogêneo que o conjunto Z, pois há menor
diversificação entre cada um de seus valores e AT x = 70 – 70 = 0 (dispersão nula)
a média representativa.
AT y = 72 – 68 = 4
Chamando de dispersão ou
variabilidade a maior ou menor
AT z = 160 – 5 = 155
diversificação dos valores de uma variável
em torno de um valor de tendência central
Dados agrupados
tomado como ponto de comparação,
podemos dizer que o conjunto X apresenta
Sem intervalo de classe
dispersÃo ou variabilidade nula e que o
conjunto Y apresenta uma dispersão ou
variabilidade menor que o conjunto Z . AT = x(max.) – x(min.)

Considerando a tabela:

ESTATÍSTICA 35
Ana Lúcia Guimarães Carvalho

1) Calcule a amplitude total dos conjuntos de


xi 0 1 2 3 4 dados:
fi 2 6 12 7 3 a) 1, 3, 5, 9
b) 20, 14, 15, 19, 21, 22, 20
Temos: b) -10, -6, 2, 3, 7, 9, 10
AT = 4 – 0 = 4 c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
Logo:
AT = 4 2)Calcule a amplitude total das distribuições:
a)
Com intervalo de classe
xi 2 3 4 5 6 7 8
Neste caso a amplitude total é a
diferença entre o limite superior da última fi 1 3 5 8 5 4 2
classe e o limite inferior da primeira classe: b)
CLASSES 1,5├1,6├1,7├1,8├1,9├2,0├ 2,1├ 2,2
AT = L(max.) – l(mín.)
fi 4 8 12 15 12 8 4

Considerando a distribuição:
VARIÂNCIA
i Estaturas fi
Uma outra medida que indica o
(cm)
afastamento dos elementos de uma amostra,
1 150 ├ 154 4 em relação à média aritmética, é a variância,
2 154 ├ 158 9
que se representa por σ2. define-se essa medida
3 158 ├162 11
como a média aritmética entre os quadrados
4 162 ├ 166 8
dos desvios dos elementos da amostra, isto é:
5 166 ├ 170 5
6 170 ├ 174 3 2
 −
∑ = 40 ∑  i 
 x − x
 
σ2 =
temos: ∑fi
AT = 174 – 150 = 24
Logo:
AT = 24 cm Ou, lembrando que ∑ fi = n
A amplitude total tem o inconveniente 2
de só levar em conta os dois valores extremos  −

da série, descuidando de valores ∑  i 


 x − x
 
intermediários, o que quase sempre invalida a σ2 =
n
idoneidade do resultado. Ela é apenas uma
indicação aproximada da dispersão ou
variabilidade.
DESVIO PADRÃO
Faz-se uso da amplitude total quando
se quer determinar a amplitude da temperatura Na interpretação da variância podem
em um dia ou no ano, no controle da surgir algumas dificuldades em relação à
qualidade ou como uma medida de cálculo unidade de medida dos elementos da amostra.
rápido, e quando a compreensão popular é Por exemplo, se os elementos da amostra
mais importante que a exatidão e a representam capacidades em litros ( l ), a
estabilidade. variância representará um resultado em l2;
como essa unidade não tem significado físico,
Exercícios: não é conveniente utilizar a variância nesse

ESTATÍSTICA 36
Ana Lúcia Guimarães Carvalho

caso. Por causa de dificuldades como essa, foi


criado o desvio padrão, representado por σ, e
definido como a raiz quadrada da variância.

2 Exemplo:
σ=
∑ x 2i  ∑ xi
−


n  n  xi fi fix i fix i2
 
0 2 0 0
1 6 6 6
Dados não-agrupados 2 12 24 48
3 7 21 63
Tomemos, como exemplo, o conjunto 4 3 12 48
de valores da variável x:
∑ = 30 ∑ = 63 ∑ = 165
40, 45, 48, 52, 54, 62, 70
Logo:
2
O modo mais prático para se obter o
desvio padrão é formar uma tabela com duas σ=
∑ f i x 2i  ∑ fi x i 
− 
n  n 
colunas: Uma para xi e outra para xi2. Assim:  
2
165  63 
xi X i2 σ= −  = 5,5 − 4,41 =
40 1.600 30  30 
45 2.025 1,09 = 1,044
48 2.304
52 2.704 Então:
54 2.916
σ = 1,04
62 3.844
70 4.900
Com intervalos de classe
∑ = 371 ∑ = 20.293
Começamos por abrir as colunas para x i que é o
Como n = 7, temos: ponto médio do intervalo de classe.
2

σ=
∑ x 2i  ∑ xi
−

 Exemplo:
n  n 
 
i Estaturas fi xi fixi fixi2
(cm)
2
20.293  371  2 1 150├154 4 152 608 92.416
σ= −  = 2.899 − 53 =
7  7  2 154├158 9 156 1.404 219.024
= 2.899 − 2.809 = 90 = 9,486 3 158├162 11 160 1.760 281.600
4 162├166 8 164 1.312 215.168
Logo:
5 166├170 5 168 840 141.120
σ = 9,49
6 170├174 3 172 516 88.752
Dados agrupados ∑ = 40 ∑ = 6.440 ∑ = 1.038.080
Sem intervalo de classe

Como, neste caso, temos a presença de Logo:


freqüências, devemos leva-las em
consideração, resultando a fórmula:
2

σ=
ESTATÍSTICA
∑ f i x 2i  ∑ fi x i 
−  37
n  n 
 
Ana Lúcia Guimarães Carvalho

Logo, nesse grupo de indivíduos, os


2 pesos apresentam maior grau de dispersão que
1.038.080  6.440 
σ= −  = 25.952 − 25.921 = as estaturas.
40  40 
Exercícios
= 31 = 5,567
Então: 1)Sabendo que um conjunto de dados apresenta
para média aritmética e para desvio padrão,
σ = 5,57 cm respectivamente, 18,3 e 14,7, calcule o
coeficiente de variação.

COEFICIENTE DE VARIAÇÃO 2) Em um exame final de Matemática, o grau


médio de um grupo de 150 alunos foi 7,8 e o
O desvio padrão por si só não nos diz
desvio padrão, 0,80. Em Estatística,
muita coisa. Assim, um desvio padrão de duas
entretanto, o grau médio final foi 7,3 e o
unidades pode ser considerado pequeno para
desvio padrão de 0,76. Em que disciplina foi
uma série de valores cujo valor médio é 200;
maior a dispersão?
no entanto, se a média for igual a 20, o mesmo
não pode ser dito. Além disso, o fato de o
3) Medidas as estaturas de 1.017 indivíduos,
desvio padrão ser expresso na mesma unidade
dos dados limita o seu emprego quando obtivemos x =162,2 cm e s=8,01 cm. O peso
desejamos comparar duas ou mais séries de médio desses mesmos indivíduos é 52 Kg,
valores, relativamente à sua dispersão ou com um desvio padrão de 2,3 Kg. Esses
variabilidade, quando expressas em unidades indivíduos apresentam maior variabilidade
diferentes. em estatura ou peso?
Para contornar essas dificuldades e
limitações, podemos caracterizar a dispersão 4) Um grupo de cem estudantes tem uma
ou variabilidade dos dados em termos estatura média de 163,8 cm, com um
relativos a seu valor médio, medida essa coeficiente de variação de 3,3%. Qual o
denominada coeficiente de variação (CV): desvio padrão desse grupo?

5) Uma distribuição apresenta as seguintes


σ
CV = x 100 estatísticas: s=1,5 e CV=2,9%. Determine a
_
x média da distribuição.

Exemplo: 6) Mostre que os conjuntos 2, 4, 6, 8, 10 e 3, 5,


7, 9, 11 têm o mesmo desvio padrão.
Tomemos os resultados das medidas Verifique, também, se há alguma relação
das estaturas e dos pesos de um mesmo grupo entre as médias.
de indivíduos:
7) Num exame de História, duas classes
obtiveram as seguintes médias e desvios:
− σ
x classe A: x = 5,4 s= 2,6
Estaturas 175 cm 5,0 cm classe B: x = 5,4 s= 3,1
Pesos 68 Kg 2,0 Kg Se for sorteado um aluno em cada classe, em
qual delas é mais provável que a nota desse
Temos: aluno esteja entre 3,0 e 7,0? Por quê?
5
CVE = x100 = 0,0285 x 100 = 2,85% 8) (Fuvest-SP) Dois atiradores X e Y
175
2 obtiveram numa série de vinte tiros, num
CVP= x 100 = 0,0294 x 100 = 2,94% alvo de forma indicada na figura, os
68
seguintes resultados:

ESTATÍSTICA 38
Ana Lúcia Guimarães Carvalho

10)(Fuvest-SP, modificado) A distribuição dos


salários de uma empresa é dada na seguinte
tabela:
Salário em R$ Número de
funcionários
10 20 30 50 500,00 10
1.000,00 5
1.500,00 1
2.000,00 10
5.000,00 4
10.500,00 1
Total 31
Atirador Resultado
50 30 20 10 0 a) Qual é a média e qual é a mediana dos
X 4 6 5 4 1 salários dessa empresa?
Y 6 3 5 3 3 b) Suponha que sejam contratados dois
novos funcionários com salários de
Calcule e compare os desvios padrões R$2.000,00 cada. A variância da nova
de cada uma das séries de tiros e decida qual é distribuição de salários ficará menor,
o atirador com desempenho mais regular. igual ou maior do que a anterior?

9) Para preencher uma vaga de gerente de 11) O gráfico abaixo mostra a istribuição de
produção, o departamento de recursos freqüência das notas obtidas pelos alunos da
humanos de uma empresa realizou um segunda série do ensino médio numa prova
teste com vários candidatos, selecionando de educação física.
os dois melhores: Leonor e Felipe. A
tabela mostra os desempenhos dos dois
candidatos nas provas a que se 21
submeteram:
Número de alunos

18
15
Candidato 12
Felipe Leonor 9
Assunto 6
Conhecimentos 8,5 9,5 3
de informática 0
1 2 3 4 5 6 7 8 9 10
Língua 9,5 9,0 Nota
Portuguesa
Determinar:
Língua Inglesa 8,0 8,5
a) a nota média desses alunos;
b) a mediana dessa distribuição;
Matemática 7,0 8,0 c) a moda dessa distribuição.
Conhecimentos 7,0 5,0
de Economia PROBABILIDADE
Média = Média = 8,0
8,0 Em condições normais podemos prever
a que temperatura o leite ferve. Esse tipo de
Os dois candidatos obtiveram a
experimento, cujo resultado é previsível, recebe
mesma média. Como proceder,
o nome de determinístico. Mas, ao lançar um
cientificamente, para determinar qual dos
dado uma ou mais vezes, não podemos saber
dois teve o melhor desempenho nessa
com antecedência o número que se vai obter;
avaliação?
sabemos apenas que os possíveis resultados são
1, 2, 3, 4, 5 ou 6. Esse tipo de experimento,
ESTATÍSTICA 39
Ana Lúcia Guimarães Carvalho

cujo resultado não pode ser previsto, é EVENTOS


chamado aleatório.
Como exemplos de experimentos Chamamos de evento qualquer
aleatórios temos: subconjunto do espaço amostral S de um
• o sorteio de uma loteria de números; experimento aleatório.
• a escolha de um número de 1 a 50; Assim, qualquer que seja E, se E ⊂ S (E
• o sorteio do primeiro prêmio da loteria está contido em S), então E é um evento de S.
federal; Se E=S, E é chamado evento certo;
• o lançamento de uma moeda. Se E ⊂ S e E é um conjunto unitário, E é

Na teoria das probabilidades, estudamos chamado evento elementar;


os experimentos aleatórios equiprováveis, ou Se E = ∅, E é chamado evento
seja, aqueles em que qualquer resultado pode
ocorrer com a mesma chance. É o caso do impossível.
lançamento de uma moeda: a possibilidade de Exemplo:
ocorrer cara ou coroa é a mesma. No lançamento de um dado, onde
S={1,2,3,4,5,6},
Experimentos ou fenômenos
aleatórios são aqueles que, mesmo • obter um número par na face superior
repetidos várias vezes sob condições A = {2,4,6} A ⊂ S; logo, A é um
semelhantes, apresentam resultados evento de S.
imprevisíveis.
• obter um número menor ou igual a 6 na
face superior
B = {1,2,3,4,5,6} B ⊂ S; logo, B é
ESPAÇO AMOSTRAL
um evento certo de S (B = S).
A cada experimento correspondem, em
geral, vários resultados possíveis. Assim, ao • obter o número 4 na face superior
lançarmos uma moeda, há dois resultados C = {4} C ⊂ S; logo, C é um evento
possíveis: ocorrer cara ou ocorrer coroa. Já ao elementar de S.
lançarmos um dado há seis resultados
possíveis: 1, 2, 3, 4, 5, ou 6. • obter um número maior que 6 na face
Ao conjunto desses resultados superior
possíveis damos o nome de espaço amostral D= ∅ logo, D é um evento
ou conjunto universo, representado por S. impossível de S
O número de elemento desse conjunto
é indicado por n(S). Exercícios
Os dois experimentos citados
anteriormente têm os seguintes espaços 1) Determine o espaço amostral do experimento
amostrais: aleatório “lançamento simultâneo de duas
moedas”.
• lançamento de uma moeda S = { Ca, Ko}
• lançamento de um dado S={1,2, 3, 4, 5, 6} 2) considerando o experimento aleatório
• lançamento de duas moedas “nascimento de três filhos de um casal”,
S = {(Ca,Ko); (Ca,Ca); (Ko,Ca); (Ko,Ko)} determine o espaço amostral e o subconjunto
que representa o evento nascimento de
Cada um dos elementos de S que exatamente dois meninos em três filhos do
corresponde a um resultado recebe o nome de casal.
ponto amostral.
3) No lançamento de um dado, determine o
evento para obter:
a) um número maior que 4.

ESTATÍSTICA 40
Ana Lúcia Guimarães Carvalho

b) Um número primo
S = {1,2,3,4,5,6} E = {2,4,6}
4) Considerando o experimento “sorteio de n(S) = 6 n(E) = 3
um número de 1 a 20”, determine o evento 3 1
para obter um número: P( B ) = =
6 2
a) múltipla de 3.
b) múltiplo de 5. c) obter um número menor ou igual a 6 na face
c) Primo superior

5) No lançamento simultâneo de dois dados S = {1,2,3,4,5,6} E = {1,2,3,4,5,6}


diferentes, determine os seguintes eventos: n(S) = 6 n(E) = 6
a) números iguais nos dois dados; 6
b) números cuja soma seja 2; P (C ) = = 1
6
c) números cuja soma seja 7;
d) números cuja soma seja 13.
d) obter um número maior que 6 na face
superior
Probabilidade
S = {1,2,3,4,5,6} E=∅
Dado um experimento aleatório, sendo
n(S) = 6 n(E) = 0
S o seu espaço amostral, vamos admitir que
todos os elementos de S tenham a mesma 0
P( D ) = = 0
chance de acontecer, ou seja, que S é um 6
conjunto equiprovável.
Chamamos de probabilidade de um Propriedades
evento A (A ⊂ S) o número real P(A), tal que:
1ª) Se E = ∅, então n(E) = 0 e, portanto,
P(E)=0 ( probabilidade do evento
n( A )
P( A ) = impossível).
n (S )
onde: 2ª) Se E = S, então n(E) = n(S) e P(E) = 1
n(A) é o número de elementos de A (probabilidade do evento certo).
n(S) é o número de elementos de S
3ª) Se E ⊂ S, então 0 ≤ n(E) ≤ n(S)
Exemplos: 0 ≤ P(E) ≤ 1

1) Lançamento de uma moeda e o evento 4ª) Se A é conjunto unitário, então n(E) = 1


obter cara. 1
(evento elementar E qualquer) P( E ) =
n
S = {Ca, Ko} E = {Ca}
n(S) = 2 n(E) = 1 Exercícios:
n( A ) 1
logo: P( A ) = = = 50%
n (S ) 2 1) Na escolha de um número de 1 a 30, qual a
probabilidade de que seja sorteado um
2) Lançamento de um dado, calcular: múltiplo de 5?

a) obter um número primo 2) Qual a probabilidade de, no lançamneto


simultâneo de dois dados diferentes, obter
S = {1,2,3,4,5,6} E = {2,3,5} soma igual a 7?
n(S) = 6 n(E) = 3
3 1 3) Qual a probabilidade de sair o ás de ouro
P( A ) = = quando retiramos uma carta de um baralho
6 2 de 52 cartas?
b) obter um número par na face superior
ESTATÍSTICA 41
Ana Lúcia Guimarães Carvalho

Dizemos que dois eventos são


4) Qual a probabilidade de sair um rei quando independentes quando a realização ou a não
retiramos uma carta de um baralho de52 realização de um dos eventos não afeta a
cartas? probabilidade do outro e vice-versa.

5) Uma urna contém 10 bolas brancas, 8 Exemplo:


vermelhas e 6 pretas, todas iguais e
indistinguíveis ao tato. Retirando-se uma Quando lançamos dois dados, o
bola ao acaso, qual a probabilidade de ela resultado obtido em um deles independe do
não ser preta? resultado obtido no outro.

6) a probabilidade de você ganhar uma Se dois eventos são independentes, a


bicicleta numa rifa de 100 números da qual probabilidade de que eles se realizem
você comprou quatro números é: simultaneamente é igual ao produto das
probabilidade de realização dos dois eventos.
2 1 1
a) b) c)
5 10 25
1 1 Assim, sendo p1 a probabilidade de
d) e) realização do primeiro evento e p2 a
30 50
probabilidade de realização do segundo evento,
a probabilidade de que tais eventos se realizem
Eventos Complementares
simultaneamente é dada por:
Sabemos que um evento pode ocorrer
ou não. Sendo p a probabilidade de que ele p = p1 x p2
ocorra (sucesso) e q a probabilidade de que
ele não ocorra (insucesso), para um evento
Exemplo:
existe sempre a relação:
Lançamos dois dados. A probabilidade
p+q=1 q=1-p
1
de obtermos 1 no primeiro dados é p1 =
6
A probabilidade de obtermos 5 no
Assim, se a probabilidade de se
1
1 segundo dado é p2 =
realizar um evento é p = , a probabilidade de 6
5
Logo, a probabilidade de obtermos,
que ele não ocorra é:
simultaneamente , 1 no primeiro e 5 no
1 4
1 1 1
q=1–p q=1– = segundo é p = x =
5 5 6 6 36

Exemplo: Eventos Mutuamente Exclusivos

Sabemos que a probabilidade de tirar 4 Dizemos que dois ou mais eventos são
1 mutuamente exclusivos quando a realização de
no lançamento de um dado é p = . Logo, a um exclui a realização do(s) outro(s).
6
probabilidade de não tirar o 4 no lançamento Assim, no lançamento de uma moeda, o
de um dado é evento “tirar cara”e o evento “tirar coroa”são
mutuamente exclusivos, já que, ao se realizar
1 5 um deles, o outro não se realiza.
q=1- = Se dois eventos são mutuamente
6 6
Eventos Independentes exclusivos, a probabilidade de que um ou outro
se realize é igual à soma das probabilidades de
que cada um deles se realize.

ESTATÍSTICA 42
Ana Lúcia Guimarães Carvalho

c) Uma cara somente.


p = p1 + p2
d) Nenhuma cara.
e) Pelo menos uma cara.
Exemplo: f) No máximo uma cara.
Lançamos um dado. A probabilidade
de se tirar o 3 ou o 5 é 8) Um dado é lançado duas vezes. Calcule a
1 1 2 1 probabilidade de:
p= + = = a) sair um 6 no primeiro lançamento.
6 6 6 3
pois como vimos, os dois eventos são b) Sair um 6 no segundo lançamento.
mutuamente exclusivos. c) Não sair 6 em nenhum lançamento.
d) Sair um 6 pelo menos.
Exercícios:
9) Uma urna contém 50 bolas idênticas.
1) No lançamento de dois dados, calcule a Sendo as bolas numeradas de 1 a 50,
probabilidade de se obter soma igual a 5. determine a probabilidade de, em uma
extração ao acaso:
2) Determine a probabilidade de cada a) obtermos a bola de número 27.
evento: b) Obtermos uma bola de número par.
a) Um número par aparece no lançamento c) Obtermos uma bola de número maior
de um dado. que 20.
b) Uma só coroa aparece no lançamento d) Obtermos uma bola de número menor
de três moedas. ou igual a 20.

3) Dois dados são lançados 10) Um par de dados é atirado. Encontre a


simultaneamente. Determine a probabilidade de que a soma seja 10 ou
probabilidade de: maior que 10 se:
a) A soma ser menor que 4. a) um 5 aparece no primeiro dado.
b) A soma ser 9. b) um 5 aparece pelo menos em um dado.
c) O primeiro resultado ser maior que o
segundo. 11) Lança-se um par de dados. Aparecendo
d) A soma ser menor ou igual a 5. dois números diferentes, encontre a
probabilidade de que:
4) Um inteiro entre 3 e 11 será escolhido ao a) a soma seja 6.
acaso. b) O 1 apareça.
a) Qual é a probabilidade de que este c) A soma seja 4 ou menor que 4.
número seja ímpar?
b) Qual é a probabilidade de que este 12) Um lote é formado por 10 peças boas, 4
número seja ímpar e divisível por 3? com defeitos e 2 com defeitos graves. Uma
peça é escolhida ao acaso. Calcule a
5) No lançamento de dois dados, qual é a probabilidade de que:
probabilidade de se obter um par de a) ela não tenha defeitos graves.
pontos iguais? b) Ela não tenha defeitos
c) Ela seja boa ou tenha defeitos graves.
6) Um casal planeja ter três filhos.
Determine a probabilidade de nascerem: 13) Uma urna A contém: 3 bolas brancas, 4
a) Três homens. pretas, 2 verdes; uma urna B contém: 5
b) Dois homens e uma mulher. bolas brancas, 2 pretas, 1 verde; uma urna
C contém:2 bolas brancas, 3 pretas, 4
7) Uma moeda é lançada três vezes. Calcule verdes. Uma bola é retirada de cada urna.
a probabilidade de obtermos: Qual é a probabilidade de as três bolas
a) três caras. retiradas da primeira, Segunda e terceira
b) Duas caras e uma coroa

ESTATÍSTICA 43
Ana Lúcia Guimarães Carvalho

urnas serem, respectivamente, branca, d) Nenhuma seja perfeita.


preta e verde?
21) Você acabou de achar a raspadinha no
14) No lançamento de um dado, qual a pacote de Doritos. Com base na figura
probabilidade de se obter um número não- abaixo calcule a probabilidade de achar a
inferior a 5? carinha.

15) Dois dados são lançados conjuntamente. a) PERDEU


Determine a probabilidade de a soma ser
PERDEU
10 ou maior que 10.
PERDEU
16) Uma moeda é lançada duas vezes. Calcule PERDEU
a probabilidade de:
a) Não ocorrer cara nenhuma vez. PERDEU INÍCIO

b) Obter-se cara na primeira ou na


Segunda jogada.

17) Em um lote de 12 peças, 4 são 22) Qual a probabilidade de um apostador


defeituosas. Sendo retiradas acertar na sena do jogo mega sena, com
aleatoriamente e sem reposição 2 peças, uma única aposta de 6 dezenas? Sabe-se
calcule: que sorteiam 6 dezenas em 60.
a) A probabilidade de ambas serem
defeituosa. 23) Qual a probabilidade de um apostador
b) A probabilidade de ambas não serem acertar na sena do jogo super sena, com 6
defeituosas. apostas de 6 dezenas? Sabe-se que sorteiam
c) A probabilidade de ao menos uma ser 6 dezenas em 48.
defeituosa.

18) No lançamento de um dado, qual é a DISTRIBUIÇÃO DE PROBABILIDADE


probabilidade de sair o número 6 ou um
número ímpar?
Consideremos a distribuição de
19) Uma loja dispõe de 12 geladeiras do freqüência relativa ao número de acidentes
mesmo tipo, das quais 4 apresentam diários em um estacionamento:
defeitos.
a) Se um freguês vai comprar uma Nº de Acidentes Freqüência
geladeira, qual a probabilidade de levar
0 22
uma defeituosa?
b) Se um freguês vai comprar duas 1 5
geladeiras, qual a probabilidade de levar
duas defeituosas? 2 2
c) Se um freguês vai comprar duas 3 1
geladeiras, qual a probabilidade de levar
pelo menos uma defeituosa? Σ = 30

20) Um lote é formado por 10 peças boas, 4 Em um dia, a probabilidade de:


com defeitos e duas com defeitos graves.
Retiram-se duas peças ao acaso. Calcule a • não ocorrer acidentes é:
probabilidade de que: 22
a) ambas sejam perfeitas. p = = 0,73
b) Pelo menos uma seja perfeita. 30
c) Nenhuma tenha defeitos graves.
• ocorrer um acidente é:
ESTATÍSTICA 44
Ana Lúcia Guimarães Carvalho

2 1 = 0,25
5 4
p = = 0,17 1 2 = 0,5
30 4
0 1 = 0,25
• ocorrerem dois acidentes é: 4
4 Σ=1
2 4
p= = 0,07
30
Ao lançarmos um dado, sendo a
variável aleatória x definida por “pontos de um
• ocorrerem três acidentes é: dado”. Faça uma tabela de distribuição de
probabilidade para cada um dos resultados do
1 dado. Assim, ao lançarmos um dado a variável
p= = 0,03
30 aleatória x, definida por “pontos de um
dado”pode tomar os valores 1, 2, 3, 4, ,5, 6.
Podemos, então, escrever: Como cada um desses valores está associado
uma só probabilidade de realização e Σ P(xi) =
Nº de acidentes Probabilidade 1, fica definida então uma função de
0 22 probabilidade da qual resulta a distribuição de
= 0,73 probabilidade:
30
1 5 = 0,17
30 x P(x)
2 2 = 0,07
30 1 1
3 1 6
= 0,03
30 2 1
Σ = 1,00 6
3 1
6
Essa tabela é denominada 4 1
distribuição de probabilidade. 6
5 1
6
Exemplo: 6 1
6
Determine a distribuição de Σ=1
probabilidade para o lançamento simultâneo
de duas moedas e a probabilidade de A função da probabilidade é
obtermos número de caras. representada por:

Ponto Amostral Nº de Caras Probabilidade f(x) = P(x=xi)


(Ca, Ca) 2 1 ⋅ 1 = 1
2 2 4 A função P(x=xi), determina a
(Ca, Ko) 1 1 ⋅ 1 = 1 distribuição de probabilidade da variável
2 2 4 aleatória x.
(Ko,Ca) 1 1 ⋅ 1 = 1
2 2 4 Exercícios:
(Ko,Ko) 0 1 ⋅ 1 = 1
2 2 4
1) Efetue a distribuição de probabilidade do
Ca Ko lançamento de 2 dados e a probabilidade
Ca Ca Ko Ca Ko Ko para a soma dos resultados

Nº de Caras Probabilidade ( P(x) )

ESTATÍSTICA 45
Ana Lúcia Guimarães Carvalho

2) Construir o gráfico de pares para o n é o número de vezes que repete a


lançamento de 3 moedas ( x i = nº de prova;
coroas) k número de vezes que repete o evento.
a) Qual a probabilidade de saírem 2
coroas? Exemplo:
b) Qual a probabilidade de saírem 2 ou
mais coroas? 1)Uma moeda é lançada 5 vezes seguidas e
independentes. Calcule a probabilidade de
DISTRIBUIÇÃO BINOMIAL serem obtidas 3 caras nessas 5 provas.

Termo Geral Temos: n = 5 e k = 3

1) O experimento deve ser repetido nas 5  5 


mesmas condições, num número finito de P(X=3) =   p3q5-3 =   p3q2
vezes (n) . 3  3 
Se a probabilidade de obtermos “cara”numa só
2) As provas repetidas devem ser 1
prova (sucesso) é p= e a probabilidade de
independentes, ou seja, o resultado de uma 2
não deve afetar os resultados das sucessivas. não obtermos “cara”numa só prova (insucesso)
1 1
é q=1 - = , então:
3) Em cada prova deve aparecer um dos dois 2 2
possíveis resultados: sucesso e insucesso.
3 2
 5  1   1  5! 1 1
4) No decorrer do experimento a P( X = 3) =       = x x =
probabilidade p (sucesso) e a probabilidade q  3   2   2  3!2! 8 4
(insucesso) somados tem que ser igual a 1 5x 4 x3x 2 x1 1 1 5
(q=1- p) = x x =
3x 2 x1x 2 x1 8 4 16
Suponhamos, que realizemos a mesma Logo:
prova n vezes sucessivas e independentes. A 5
probabilidade de que um evento se realize k P(X=3) =
vezes nas provas é dada pela função: 16

2) Dois times de futebol, A e B, jogam entre si


6 vezes. Encontre a probabilidade de o time
n A ganhar 4 jogos.
f ( X ) = P( X = k ) =   p k q n − k
k
1 1 2
n = 6, k = 4, p = ,q=1- =
3 3 3
na qual:
2
P(X = k) é a probabilidade de que o 6 1 
4
2 1 4 20
evento se realize k vezes em n provas; P( X = 4) =       = 15 x x =
p é a probabilidade de que o evento se 4 3  3 81 9 243
realize em uma só prova – sucesso; Logo:
q é a probabilidade de que o evento 20
P(X = 4) = = 0,08
não se realize no decurso dessa prova – 243
insucesso; Exercícios:
n
  é o coeficiente binomial de n 1) Um atirados acerta o alvo 3 vezes em uma
k bateria de 5 tiros. Se ele participar de 7
n! baterias, qual a probabilidade dele acertar o
sobre k, igual a
k! (n − k )! alvo?

ESTATÍSTICA 46
Ana Lúcia Guimarães Carvalho

12) Calcule a probabilidade de obter


2) Jogando um dado 4 vezes, qual a exatamente 3 coroas e 2 caras em 5 lances
probabilidade de sair o número 5 de uma moeda.
exatamente 3 vezes?
13) Em um campeonato de tênis, o jogados A
3) Uma prova consta de 6 questões com 4 tem 0,4 de probabilidade de ganhar uma
opções cada uma, com uma única partida, o jogador B tem 0,3 e o jogador C
alternativa correta. Qual a probabilidade de tem 0,3. Sabendo que o torneio consta de 3
acertar 2 das 6 questões? partidas, determine a probabilidade de:

4) Uma urna contém 3 bolas azuis e 2 a) B ganhar as 3 partidas;


brancas. Retira-se uma bola ao acaso, b) A ganhar as 3 partidas;
observando-se sua cor e recoloca-se a bola c) A ganhar 2 partidas;
na urna. Se esse experimento for realizado d) C ganhar 2 partidas.
5 vezes sucessivas, qual é a probabilidade
de se obterem exatamente 3 bolas azuis? 14) (Cesgranrio-RJ) Três moedas são lançadas
simultaneamente. A probabilidade de obter
5) Por meio de estudos genéticos, um casal 2 caras e 1 coroa é de:
descobre que a probabilidade de que eles 1 1 5 3 1
venham a ter um filho de olhos azuis é a) b) c) d) e)
8 4 16 8 2
igual a 1 . Se o casal pretende ter 6
4
15) A probabilidade de um atirados acertar um
filhos, qual é a probabilidade de que
alvo em um único tiro é 0,2. Dando 4 tiros
exatamente 2 tenham olhos azuis?
calcular a probabilidade de :
6) Jogando-se um dado três vezes, determine
a) acertar o alvo duas vezes;
a probabilidade de se obterem um múltiplo
b) não acertar o alvo.
de 3 duas vezes.
16) Em cirurgias de miopia, sabe-se que 10%
7) dois times de futebol, A e B, jogam entre si
não obtêm sucesso. Qual é a probabilidade
6 vezes. Encontre a probabilidade de o
de que, em 4 cirurgias, 3 obtenham
time A ganhar dois ou três jogos.
sucesso?
8) A probabilidade de um atirados acertar o
17) Um casal quer ter 5 filhos. Qual é a
alvo é 2 . Se ele atirar 5 vezes, qual a probabilidade de que:
3
probabilidade de acertar exatamente 2
tiros? a) todos sejam homens?
b) Tenham 2 meninas?
9) Seis parafusos são escolhidos ao acaso da
produção de certa máquina, que apresenta 18) Qual é a maior probabilidade:
10% de peças defeituosas. Qual a A: de sair 50% de caras num lançamento de 8
probabilidade de serem defeituosos dois moedas, ou
deles? B: de sair 50% de caras num lançamneto de 12
moedas?
10) Jogando uma moeda 3 vezes, determine a
probabilidade de obter: DISTRIBUIÇÃO NORMAL
a) coroa nas 3 vezes; CURVA NORMAL
b) coroa 2 vezes;
Em nosso dia a dia podemos observar
11) Determine a probabilidade de ocorrerem 3 que alguns fatos têm probabilidade de ocorrer
números 4 em 5 lances de um dado. com maior freqüência que outros.

ESTATÍSTICA 47
Ana Lúcia Guimarães Carvalho

Uma pessoa muito alta, acima de


2,10m, por exemplo, andando na rua, Quando temos em mãos uma variável
desperta a nossa curiosidade, evidentemente aleatória com distribuição normal, nosso
porque não é tão comum assim alguém com principal interesse é obter a probabilidade de
tanta altura. Entretanto, as pessoas adultas, essa variável aleatória assumir um valor em um
na faixa de 1,60m a 1,80m, podem determinado intervalo.
ultrapassar-nos às milhares pelas ruas, sem
que nos fixemos em alguma delas pela sua Exemplo:
estatura.
Logo, a altura das pessoas, assim Seja X a variável aleatória que
como as suas idades ou a média bimestral representa os diâmetros dos parafusos
dos alunos de uma escola, entre outras produzidos por certa máquina. Vamos supor
distribuições encontradas na natureza, são que essa variável tenha distribuição normal
exemplos de distribuição normal, onde cada com média x =2cm e desvio padrão s=0,04cm.
evento possui freqüência diferente dentro do Pode haver interesse em conhecer a
universo, variáveis de acordo com a forma probabilidade de um parafuso ter um diâmetro
gráfica: com valor entre 2 e 2,05cm.
Freqüência É fácil notar que essa probabilidade é
indicada por:
P( 2 < X < 2,05 )
que corresponde à área hachurada da figura:

Eventos

Propriedades de uma Distribuição Normal


2 2,05
1º) A variável aleatória X pode assumir todo
e qualquer valor real. Para o cálculo direto dessa
probabilidade, podemos dizer que se X é uma
2º) A representação gráfica da distribuição variável aleatória com distribuição normal de
normal é uma curva em forma de sino, média x e desvio padrão s, então existe uma
simétrica em torno da média ( x ), que recebe variável z que tem distribuição normal
o nome de curva normal ou de Gauss. reduzida, isto é, tem distribuição normal de
média 0 e desvio padrão 1, dada por:
3º) A área total limitada pela curva e pelo
eixo das abscissas é igual a 1, já que essa área x−x
corresponde à probabilidade de a variável Z=
s
aleatória X assumir qualquer valor real. Queremos calcular P(2 < X < 2,05).
Para obter essa probabilidade, precisamos, em
4º) A curva normal é assintótica em relação primeiro lugar, calcular o valor de z que
ao eixo das abscissas, isto é, aproxima-se corresponde a x1 = 2,05 e x2 = 2.
indefinidamente do eixo das abscissas sem,
contudo, alcança-lo.
x −x 2−2
Z= Z= Z= 0
5º) Como a curva é simétrica em torno de x, a s 0,04
probabilidade de ocorrer valor maior do que a x−x 2,05 − 2 0,05
Z= Z= Z= Z = 1,25
média é igual à probabilidade de ocorrer valor s 0,04 0,04
menor do que a média, isto é, ambas as então:
probabilidades são iguais a 0,5. Escrevemos: P( 2 < X < 2,05 ) = P( 0 < Z < 1,25 )
P( X > x ) = P( X < x ) = 0,5

ESTATÍSTICA 48
Ana Lúcia Guimarães Carvalho

Exercícios: b) maior que 80;


c) entre 85 e 115;
1) Uma variável x tem distribuição normal d) maior que 100.
com média 200u e desvio padrão de 40u.
Determine aos valores de Z para os 6) Os pesos de 600 estudantes são
seguintes valores de x normalmente distribuídos com média 65,3
Kg e desvio padrão 5,5 Kg. Determine o
a) (180 < X < 220) número de estudantes que pesam:
b) (X ≥ 205)
a) entre 60 e 70 Kg;
c) (193 < X < 194) b) mais que 63,2 Kg;
c) menos que 68 Kg.
d) ( X ≤ 200)
e) ( X < 210) 7) A duração de um certo componente
eletrônico tem média de 850 dias e desvio
padrão de 40 dias. Sabendo que a duração é
2) Utilizando a tabela de Distribuição Normal
normalmente distribuída, calcule a
determine as probabilidades:
probabilidade de esse componente durar:
a) P(-1,25 < Z < 0)
a) entre 700 e 1000 dias;
b) P(-0,5 < Z < 1,48) b) mais de 800 dias;
c) menos de 750 dias.
c) P(0,8 < Z < 1,23)
d) P(Z > 0,6) 8) Ao anotar a velocidade de uma série de
motoristas que passavam por determinado
e) P(Z < 0,92)
ponto da estrada, a polícia chegou à
3) Os salários dos operários industriais são conclusão de que a velocidade média
distribuídos normalmente, em torno da naquele ponto era de 65 km/h, com um
média de R$1.000,00, com desvio padrão desvio padrão de 9 km/h. Verificou-se
de R$800,00. Calcule a probabilidade de também que a distribuição das velocidades
um operário ter um salário situado entre podia ser considerada uma normal. Assim
R$800,00 e R$1.400,00. sendo, pede-se:

4) Sendo Z uma variável com distribuição a) Determinar a probabilidade de que o


normal reduzida, calcule: próximo carro a passar pelo referido ponto
da estrada tenha velocidade maior que 80
a) P(0 < Z < 1,44) km/h.
b) b) P(-0,85 < Z < 0) b) Determinar a probabilidade de que o
c) P(-1,48 < Z < 2,05) próximo carro a passar pelo mesmo ponto
d) P(0,72 < Z < 1,89) tenha velocidade entre 70 e 75 km/h.
e) P(Z > -2,03) c) Calcular a porcentagem dos carros que,
f) f) P(Z > 1,08) num determinado dia, serão multados ou
g) P(Z < -0,66) advertidos, sabendo-se que serão multados
h) h) P(Z < 0,60) os carros com velocidades superiores a 85
km/h e serão advertidos os carros com
5) Um teste padronizado de escolaridade tem velocidades entre 75 km/h e 85 km/h.
distribuição normal com média 100 e
desvio padrão 10. Determine a 9) A altura média dos rapazes que se inscrevem
probabilidade de um indivíduo submetido para o serviço militar é 1,67 m, com desvio
ao teste ter nota: padrão de 15 cm. Sabendo-se que o Exército
somente aceita para o serviço militar
a) maior que 120; rapazes com altura entre 1,55 m e 1,92 m,

ESTATÍSTICA 49
Ana Lúcia Guimarães Carvalho

qual a porcentagem de rapazes que não


servirão o Exército? CORRELAÇÃO

Relação Funcional e Relação Estatística


CORRELAÇÃO E REGRESSÃO
Como sabemos, o perímetro e o lado de
Até agora analisamos os cálculos um quadrado estão relacionados. A relação que
estatísticos associados a uma única variável; os liga é perfeitamente definida e pode ser
como o peso das pessoas, o diâmetro das expressa por meio de uma sentença
esferas ou o consumo de energia elétrica. matemática:
Sabemos, entretanto, que muitas variáveis 2p = 4l
mantêm dependências entre si, no sentido de onde 2p é o perímetro e l é o lado.
que o crescimento de uma delas também pode Atribuindo-se, então, um valor qualquer
causar o crescimento em outra. Vejamos a l, é possível determinar exatamente o valor de
alguns casos: 2p.
• O preço dos aluguéis dos imóveis e a Consideremos, agora, a relação que
sua área. existe entre o peso e a altura de um grupo de
• Os índices pluviométricos e a pessoas. É evidente que esta relação não é do
fertilidade dos solos. mesmo tipo da anterior; ela é bem menos
• A temperatura ambiente e o consumo precisa. Assim, pode acontecer que a estaturas
de cerveja. diferentes correspondam pesos iguais ou que a
Há, sem dúvida, um número muito estaturas iguais correspondam pesos diferentes.
grande de pares de variável dependentes entre Porém, em média, quanto maior a estatura,
si, sendo o nosso trabalho, no momento, maior o peso.
encontrar uma maneira de dimensionar essa
interdependência, principalmente quando não
conhecemos os fatores que interferem em uma As relações do tipo
perímetro–lado são conhecidas
ou em outra. Ao grau de dependência entre
duas variáveis denominamos correlação, e, como relações funcionais e as do
deste modo, podemos esperar que certas tipo peso-estatura, como relações
variáveis, como por exemplo, “quantidade de estatísticas.
tinta”e “área da parede”, tenham uma alta
correlação, enquanto “área da parede”e “idade Quando duas variáveis estão ligadas por
do pintor”, por outro lado, apresentam quase uma relação estatística, dizemos que existe
nenhuma correlação. correlação entre elas.
Assim, quando consideramos variáveis
como peso e altura de um grupo de pessoas, Diagrama de Dispersão
uso do cigarro e incidência do câncer,
vocabulário e compreensão da leitura, Após dispormos de uma série de
procuramos verificar se existe alguma relação valores de duas variáveis que estamos querendo
entre as variáveis de cada um dos pares e qual verificar se entre elas há ou não um certo grau
o grau dessa relação. Para isso é necessário o de dependência, o primeiro passo será marca-
conhecimento de novas medidas. las num gráfico cartesiano, cada uma das séries
Sendo a relação entre as variáveis de num dos eixos, construindo, assim, o que se
natureza quantitativa, a correlação é o conhece por diagrama de dispersão. A
instrumento adequado para descobrir e medir observação do diagrama de dispersão das
essa relação. variáveis será o primeiro passo para avaliarmos
Uma vez caracterizada a relação, a correlação. Suponhamos, por exemplo, o
procuramos descreve-la através de uma função gráfico de dispersão das variáveis mostradas na
matemática. A regressão é o instrumento tabela abaixo:
adequado para a determinação dos parâmetros
dessa função. X Y X Y

ESTATÍSTICA 50
Ana Lúcia Guimarães Carvalho

25 12 36 9 A observação pura e simples dos


26 11 37 7 diagramas de dispersão pode nos fornecer uma
27 13 38 7 série de informações:
28 12 39 6
y
29 11 40 6
30 8 41 4
31 10 42 5
Correlação linear positiva
32 9 43 5
Aumenta x, aumenta y
33 7 44 5
34 8 45 5
35 8 x

Imaginemos que os valores da variável


X sejam as idades das pessoas de determinada
y
classe e os valores de Y, o tempo médio de
duração do banho diário de todas as pessoas
entrevistadas em cada idade. A marcação dos Correlação linear negativa
pares ordenados (X,Y) no plano cartesiano Aumenta x, diminui y
levará, por fim, ao diagrama de dispersão
mostrado abaixo:
x
14
12
10
8 y
Tempo

6 Correlação não-linear
4 Distribuição dos pontos
2 em torno de uma curva
0
24 26 28 30 32 34 36 38 40 42 44 46 48
Idade

A configuração mostrada no gráfico x


nos faz supor que existe uma certa correlação
entre duas variáveis, ou seja, com a passagem
do tempo, as pessoas parecem demorar-se y
menos debaixo do chuveiro. Devemos, Correlação nula
entretanto, tomar o cuidado na análise de Aumenta x, varia y
correlação, uma vez que as variáveis ao acaso
correlacionadas não necessariamente estão Não há correlação
sujeitas a uma relação de causa e efeito. No
nosso exemplo, não podemos afirmar com x
certeza que as pessoas se banham mais
rapidamente apenas porque são mais idosas, já
que o motivo da rapidez pode ser outro que Exercícios
não a idade, como por exemplo o fato de as
pessoas tornarem-se menos vaidosas ou mais 1) Consideremos uma amostra aleatória,
ocupadas conforme o tempo vai passando. formada por dez dos 98 alunos de uma
A correlação, portanto, apontará em classe da faculdade A e pelas notas obtidas
muitos casos unicamente a existência de por eles em Matemática e Estatística.
variações semelhantes em duas variáveis, sem
que, entretanto, uma tenha muita coisa a ver Notas
com a outra.

ESTATÍSTICA 51
Ana Lúcia Guimarães Carvalho

Nº Matemática Estatística e, ainda, o sentido dessa correlação (positivo ou


(xi) (yi) negativo).
01 5.0 6.0 Faremos uso do coeficiente de
08 8.0 9.0 correlação de Pearson, que é dado por:
24 7.0 8.0
38 10.0 10.0
44 6.0 5.0 n∑ x iyi −
(∑ x i )(∑ y i )
r=
58 7.0 7.0
 n x 2 − ( x )2   n y 2 − ( y )2 
59 9.0 8.0  ∑ i ∑ i   ∑ i ∑ i 
72 3.0 4.0
80 8.0 6.0
onde n é o número de observações.
92 2.0 2.0
Construa o diagrama de dispersão. Os valores limites de r são –1 e +1. isto
é, o valor de r pertence ao intervalo
Correlação Linear [-1,+1].
Observando o exercício anterior, Assim:
podemos imaginar que, quanto mais fina for a
elipse, mais ela se aproximará de uma reta. a) se a correlação entre duas variáveis é
Dizemos, então, que a correlação de forma perfeita e positiva, então r = +1`;
elíptica tem como “imagem” uma reta, sendo, b) se a correlação é perfeita e negativa, então
por isso, denominada correlação linear. r = -1;
É possível verificar que a cada c) se não há correlação entre as variáveis,
correlação está associada como “imagem” então r = 0.
uma relação funcional. Por esse motivo, as
relações funcionais são chamadas relações Logicamente:
perfeitas.
Como a correlação em estudo tem a) se r = +1, há uma correlação perfeita e
como “imagem” uma reta ascendente, ela é positiva entre as variáveis;
chamada correlação linear positiva. b) se r = -1, há uma correlação perfeita e
Assim, uma correlação é: negativa entre as variáveis;
a) linear positiva se os pontos do diagrama c) se r = 0, ou não há correlação entre as
têm como “imagem” uma reta ascendente; variáveis, ou a relação que porventura
b) linear negativa se os pontos têm como exista não é linear.
“imagem” uma reta descendente;
c) não-linear se os pontos têm como OBS: Para podermos tirar algumas conclusões
“imagem” uma curva. significativas sobre o comportamento
Se os pontos apresentam-se dispersos, simultâneo das variáveis analisadas, é
não oferecendo uma “imagem” definida, necessário que:
concluímos que não há relação alguma entre
as variáveis em estudo.
0,6 ≤ r ≤ 1

Se 0,3 ≤ r < 0,6 , há uma correlação


Coeficiente de Correlação Linear relativamente fraca entre as variáveis.

O instrumento empregado para a Se 0 < r < 0,3 , a correlação é muito


medida da correlação linear é o coeficiente de
correlação. fraca e, praticamente, nada podemos concluir
Este coeficiente deve indicar o grau de sobre a relação entre as variáveis em estudo.
intensidade da correlação entre duas variáveis

ESTATÍSTICA 52
Ana Lúcia Guimarães Carvalho

Vamos então calcular o coeficiente de construindo também o diagrama de


correlação do exercício anterior. O modo mais dispersão.
rápido para obtermos r é abrir, na tabela, a)
colunas correspondentes aos valores de xiy i, x 2 3 9 8 6 10
xi2 e y i2. y 1,6 1,2 1,0 1,2 1,4 1,0

Notas b)
Nº Matem. Estat. xiyi xi2 yi2 x 0 1 2 3 4 5 6
(xi) (yi)
y 3 18 21 40 34 61 65
01 5.0 6.0 30 25 36 3) Numa indústria é feito um acompanhamento
08 8.0 9.0 72 64 81 sistemático do percentual de elementos
24 7.0 8.0 56 49 64 defeituosos produzidos a cada intervalo de
meia hora. Após um mês de produção, os
38 10.0 10.0 100 100 100
valores médios de percentuais de defeitos a
44 6.0 5.0 30 36 25 cada horário foram marcados na tabela:
58 7.0 7.0 49 49 49
59 9.0 8.0 72 81 64
Horas % Horas %
7:00 0,12 10:00 0,13
72 3.0 4.0 12 9 16
7:30 0,09 10:30 0,18
80 8.0 6.0 48 64 36 8:00 0,14 11:00 0,15
92 2.0 2.0 4 4 4 8:30 0,19 11:30 0,19
Σ xi=65 Σ yi=65 Σ xiyi=473 Σ xi2=481 Σ yi2=475 9:00 0,14 12:00 0,20
9:30 0,16
Verifique a existência de correlação
n ∑ x i y i − (∑ x i )(∑ y i ) linear entre o horário e o percentual de defeitos.
r=
 n x 2 − ( x )2   n y 2 − ( y )2 
 ∑ i ∑ i   ∑ i ∑ i  4) Calcule o coeficiente de correlação linear do
conjunto de pontos apresentados no gráfico a
seguir:
10.473 − (65)(
. 65 )
r=
[10.(481) − (65) ][10.(475) − (65) ]
2 2
y
4,5
4 H K
505 3,5
r= r = 0,91 3 G I J
585 . 525 2,5
2 B
C F
1,5
Resultado que indica uma correlação linear 1
positiva altamente significativa entre as duas 0,5
A D E

variáveis. 0
0 1 2 3 4 5 6 7 8 9 10
x
Exercícios:
REGRESSÃO
1) Calcule o coeficiente de correlação para os
valores das variáveis x i e y i.
Sempre que desejamos estudar determinada
variável em função de outra, fazemos uma
xi 4 6 8 10 12
análise de regressão.
yi 12 10 8 12 14
Podemos dizer que a análise de
regressão tem por objetivo descrever, através
2) determine o coeficiente de correlação linear
de um modelo matemático, a relação entre duas
para os dados dos conjuntos abaixo,
variáveis, partindo de n observações das
mesmas.
ESTATÍSTICA 53
Ana Lúcia Guimarães Carvalho

A variável sobre a qual desejamos 44 6.0 5.0 30 36


fazer uma estimativa recebe o nome de 58 7.0 7.0 49 49
variável dependente e a outra recebe o nome
59 9.0 8.0 72 81
de variável independente.
Assim, supondo X a variável 72 3.0 4.0 12 9
independente e Y a dependente, vamos 80 8.0 6.0 48 64
procurar determinar o ajustamento de uma reta 92 2.0 2.0 4 4
à relação entre essas variáveis, ou seja, vamos
obter uma função definida por: Σ xi=65 Σ yi=65 Σ xiyi=473 Σ xi2=481

Y = aX + b n = 10

onde a e b são os parâmetros. n∑ x i y i − ∑ x i ∑ y i


A correlação retilínea permiti o a= 2
ajustamento de uma reta, imagem da função n ∑ x 2i − (∑ x i )
definida por Y = aX + b 10 x 473 − 65 x 65
Vamos, então, calcular os valores dos a= 2
parâmetros a e b com a ajuda das fórmulas: 10 x 481 − (65)
4.730 − 4.225 505
a= = = 0,8632
n∑ x i y i − ∑ x i ∑ y i 4.810 − 4.225 585
a= 2
n ∑ x 2i − (∑ x i ) como:
65 65
e x= = 6,5 e y= = 6,5
10 10
b = y − ax
b = 6,5 – 0,8632 x 6,5 = 6,5 – 5,6108 = 0,8892
onde:
n é o número de observações; a = 0,86 e b = 0,89

x é a média dos valores x i ( x =


∑ xi ) Logo:
n Ŷ = 0,86X + 0,89
y é a média dos valores y i ( y =
∑ yi )
n Para traçarmos a reta no gráfico, basta
determinar dois de seus pontos:
OBS: Como estamos fazendo uso de uma
amostra para obtermos os valores dos X=0 Ŷ = 0,89
parâmetros, o resultado, é uma estimativa da X=5 Ŷ = 0,86 x 5 + 0,89 = 5,19
verdadeira equação de regressão. Sendo assim,
escrevemos: Assim temos:
Ŷ = aX + b
onde Ŷ é o Y estimado. y
Exemplo: 10 Y = 0,86X + 0,89
9
8
Nº Matem. Estat. xiyi xi2 7
6
(xi) (yi) 5,19
5
4
01 5.0 6.0 30 25 3
2
08 8.0 9.0 72 64 0,89
1
0
24 7.0 8.0 56 49 5
0 2 4 6 8 10
x
38 10.0 10.0 100 100

ESTATÍSTICA 54
Ana Lúcia Guimarães Carvalho

Exercícios:
Determine:
1) A partir da tabela:
a) o coeficiente de correlação
xi 1 2 3 4 5 6 b) a reta ajustada
yi 70 50 40 30 20 10 c) o valor estimado do comprimento da
barra para a temperatura de 18ºC
a) Calcule o coeficiente de correlação d) o valor estimado do comprimento da
b) Determine a reta ajustada barra para a temperatura de 35ºC.
c) Estime o valor Y para X = 0
5) Considere os resultados de dois testes, X e
2) Certa empresa, estudando a variação da Y, obtidos por um grupo de alunos da escola
demanda de seu produto em relação à A:
variação de preço de venda, obteve a tabela:
xi yi xi yi
Preço Demanda Preço Demanda 11 13 28 17
(xi) (yi) (xi) (yi) 14 14 30 24
38 350 63 246 19 18 31 22
42 325 70 238 19 15 34 24
50 297 80 223 22 22 37 25
56 270 95 215
59 256 110 208
Determine:
a) Determine o coeficiente de correlação
a) calcule o coeficiente de correlação;
b) Estabeleça a equação da reta ajustada
b) a equação de regressão;
c) Estime Y para X=60 e X=120
c) estime x para y = 4.
3) Pretendendo-se estudar a relação entre as
6) Considere os resultados de dois testes e
variáveis”consumo de energia elétrica”(xi) e
calcule o coeficiente de correlação , a
“volume de produção nas empresas
equação de regressão e construa o gráfico.
industriais”(y i), fez-se uma amostragem que
inclui vinte empresas, computando-se os
X Y X Y
seguintes valores:
2 1 4 4
2 2 5 3
Σxi = 11,34 , Σyi = 20,72 , Σxi2 = 12,16 ,
3 2 6 4
3 3 6 5
Σyi2 = 84,96 , Σxiy i = 22,13
3 4 6 3
4 2
a) calcule o coeficiente de correlação
b) equação de regressão
c) estime o consumo de energia elétrica
para um volume de produção de 3.

4) A tabela abaixo apresenta valores que


mostram como o comprimento de uma barra
de aço varia conforme a temperatura:

Temperatura 10 15 20 25 30
(º C)
Comprimento 1.003 1.005 1.010 1.011 1.014
(mm)

ESTATÍSTICA 55