Você está na página 1de 105

FEVEREIRO/2016

Sumário
Panorama Histórico ...................................................................................................................... 4
O que é Estatística ........................................................................................................................ 4
Utilização da Estatística ................................................................................................................ 6
A Estatística nas Empresas ........................................................................................................... 6
População e Amostra ................................................................................................................... 7
Amostragem ................................................................................................................................. 7
Amostragem Casual ou Aleatória simples ................................................................................. 8
Amostragem Proporcional Estratificada ................................................................................... 8
Amostragem Sistemática .......................................................................................................... 8
Exercícios ................................................................................................................................... 8
Estatística Descritiva..................................................................................................................... 9

Variáveis........................................................................................................................................ 9

Distribuição de Frequência ........................................................................................................... 9

Distribuição de Frequência com Intervalos de Classe ................................................................. 10

Elementos de uma Distribuição de Frequência ........................................................................... 11

Classe ......................................................................................................................................... 11
Limites de Classe ....................................................................................................................... 11
Amplitude Total da Distribuição................................................................................................ 11
Ponto Médio de uma Classe ...................................................................................................... 11
Números de Classes - Intervalos de Classe .................................................................................. 12

Resolva .......................................................................................................................................... 13

Distribuição de Frequência sem Intervalos de Classe ................................................................. 14

Exercícios ...................................................................................................................................... 14

Gráficos e Diagramas .................................................................................................................... 16

Gráfico Estatístico...................................................................................................................... 16
Gráfico em Linha ou em Curva .................................................................................................. 16
Gráfico Pictográfico ................................................................................................................... 17
Diagrama de Ramo e Folhas ...................................................................................................... 18
Gráfico em Colunas ou em Barras ............................................................................................. 19
Gráfico em Colunas ou em Barras Múltiplas ............................................................................. 20
Funções e Gráficos ........................................................................................................................ 21

1
Histograma - Variável Discreta..................................................................................................... 24

Polígono de Frequências .............................................................................................................. 24

Histograma - Variável Contínua ................................................................................................... 25

Exercícios ...................................................................................................................................... 26

Medidas de Tendência Central..................................................................................................... 27

Média Aritmética....................................................................................................................... 27
Dados não-agrupados ........................................................................................................... 27
Dados agrupados................................................................................................................... 28
Resolva ...................................................................................................................................... 28
A Mediana ................................................................................................................................. 30
Dados não-agrupados ........................................................................................................... 30
Dados agrupados................................................................................................................... 31
Resolva ...................................................................................................................................... 32
A Moda ...................................................................................................................................... 34
Dados não-agrupados ........................................................................................................... 34
Dados agrupados................................................................................................................... 34
Resolva ...................................................................................................................................... 35
As Expressões Gráficas da Moda ............................................................................................... 35
Emprego da Moda ..................................................................................................................... 35
Posição Relativa da Média, Mediana e Moda ........................................................................... 36
As Separatrizes ............................................................................................................................. 36

Os Quartis .................................................................................................................................. 36
Resolva .................................................................................................................................. 37
Os Percentis ............................................................................................................................... 38
Resolva .................................................................................................................................. 38
Exercícios ................................................................................................................................... 39
Medidas de Dispersão .................................................................................................................. 40

Dispersão ou Variabilidade........................................................................................................ 40
Amplitude Total ............................................................................................................................ 41

Dados não-agrupados ............................................................................................................... 41


Dados agrupados ....................................................................................................................... 41
Variância e Desvio Padrão ............................................................................................................ 42

Introdução ................................................................................................................................. 42
Dados não-agrupados ............................................................................................................... 43

2
Resolva .................................................................................................................................. 43
Dados agrupados ....................................................................................................................... 44
Resolva .................................................................................................................................. 44
Coeficiente de Variação ............................................................................................................ 46
Exercícios ................................................................................................................................... 46
Probabilidade................................................................................................................................ 48

Introdução ................................................................................................................................. 48
Experimento Aleatório .............................................................................................................. 54
Espaço Amostral ........................................................................................................................ 54
Eventos ...................................................................................................................................... 54
Probabilidade ............................................................................................................................ 54
Eventos Complementares ......................................................................................................... 55
Eventos Independentes............................................................................................................. 55
Eventos Mutuamente Exclusivos .............................................................................................. 55
Exercícios ................................................................................................................................... 55
Distribuição Binomial e Normal ................................................................................................... 57

Variável Aleatória ...................................................................................................................... 57


Distribuição de Probabilidade ................................................................................................... 57
Distribuição Binomial ................................................................................................................ 60
Exercícios ................................................................................................................................... 61
Distribuição Normal e Curva Nor ma ........................................................................................... 62

Exercícios ................................................................................................................................... 67
Listas de Exercícios ....................................................................................................................... 70

Correlação e Regressão ................................................................................................................ 74

Resolva ...................................................................................................................................... 80
Exercícios ................................................................................................................................... 80
Excel 2010 ..................................................................................................................................... 83

Apêndice ....................................................................................................................................... 91

Bibliografia .................................................................................................................................... 92

3
Panorama Histórico

Todas as ciências tem suas raízes na história do homem, na sua busca do conhecer e
conhecer-se.
A Matemática considerada "a ciência que une à clareza do raciocínio a síntese da
linguagem", originou-se do convívio social, das trocas, da contagem, com caráter prático,
utilitário e empírico.
A Estatística, ramo da Matemática Aplicada teve origem semelhante.
Desde a Antiguidade vários povos já registravam o número de habitantes, de
nascimentos, de óbitos, faziam estimativas das riquezas individuais e sociais, distribuíam
equitativamente terras ao povo, cobravam impostos e realizavam inquéritos quantitativos
por processos que hoje chamaríamos de "estatísticas".
O termo Estatística provém da palavra Estado e foi utilizado originalmente para
denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas decisões,
neste sentido foi utilizado em épocas remotas para determinar o valor dos impostos
cobrados dos cidadãos, para determinar a estratégia de uma nova batalha em guerras que se
caracterizavam por uma sucessão de batalhas. (Era fundamental aos comandantes saber de
quantos homens, cavalos e armas etc., dispunham após a última batalha).
Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou
bélicas. A partir do século XVI começaram a surgir as primeiras análises sistemáticas de
fatos sociais, como batizados, funerais, originando as primeiras tábuas e tabelas e os
primeiros números relativos.
No século XVIII o estudo de tais fatos foi adquirindo, aos poucos uma conotação
verdadeiramente científica. Godofredo Achenwall batizou a nova ciência (ou método) com
o nome de Estatística, determinando seus objetivos e suas relações com as ciências.
As tabelas tomaram-se mais completas, surgiram as representações gráficas e o
cálculo das probabilidades, e a Estatística deixou de ser simples catalogação de dados
numéricos coletivos, para se tornar o estudo de como chegar a conclusões sobre o todo
(população), partindo da observação de partes desse todo (amostras).
Ela não alcançou ainda um estado definitivo. Continua a progredir na razão direta
do desejo de investigação dos fenómenos coletivos.
Atualmente os estudos estatísticos têm avançado rapidamente e, com seus processos
e métodos, têm servido como auxiliar na tomada de decisões, contribuído para a
organização dos negócios e recursos do mundo moderno.

O QUE É ESTATÍSTICA?
O governo informa que a renda média de uma família de cinco pessoas aumentou
3% de um ano para cá.
Um professor comunica à classe que a nota média na avaliação de matemática foi
7,0.

4
O meteorologista informa que a probabilidade de chover amanhã é de 30%.
Uma indústria de cosméticos, através de uma pesquisa constatou a probabilidade de
vendas de 90% de sua produção mensal.
As vésperas de uma eleição a televisão anuncia o provável vencedor de uma
eleição, em que inclui uma estimativa da diferença percentual do 2o candidato.
Aqui estão algumas formas do uso da Estatística.

A Estatística é uma parte da Matemática Aplicada que fornece métodos para a


coleta, organização, descrição, análise e interpretação de dados e para a
utilização dos mesmos nas tomadas de decisões.

Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da


organização e descrição dos dados (estatística do Ministério da Saúde, estatística dos
acidentes de tráfego, etc.) desconhecendo que o aspecto essencial da Estatística é o de
proporcionar métodos inferenciais, que permitam conclusões que transcendam os
dados obtidos inicialmente.
Portanto, análise e a interpretação dos dados estatísticos tornam possível o
diagnóstico de uma empresa (por exemplo, de uma escola), o conhecimento de seus
problemas (condições de funcionamento, produtividade), a formulação de soluções
apropriadas e um planejamento objetivo de ação.
Quando algumas pessoas ouvem a palavra "estatística", imaginam logo taxas de
acidentes, índices de nascimentos e mortalidade, litros por quilómetros, etc. Esta parte da
Estatística, que utiliza números para descrever fatos, é chamada, de forma bastante
apropriada, estatística descritiva. Compreende a organização, o resumo e, em geral, a
simplificação de informações que podem ser muito complexas.
A probabilidade é outro ramo da Estatística, e é útil para analisar situações que
envolvem o acaso. Jogos de dados e de cartas, ou o lançamento de uma moeda para o ar,
enquadram-se na categoria do acaso. A decisão de um fabricante de desodorante de
empreender uma grande campanha de propaganda visando a aumentar sua participação no
mercado, a decisão de parar de imunizar pessoas com mais de vinte anos contra
determinada doença, a decisão de arriscar-se a atravessar uma rua no meio do quarteirão;
todas utilizam a probabilidade de uma forma consciente ou inconsciente.

Por que estudar Estatística?


- O raciocínio estatístico é largamente utilizado em empresas públicas ou
privadas, assim é provável que, no futuro, um empregador venha a contratar ou
promover o leitor por causa de seu conhecimento de estatística.
- Os administradores necessitam do conhecimento da estatística para bem tomar
suas decisões e para evitar serem iludidos por certas apresentações viciosas.
- A maioria das revistas profissionais e outras contém referências frequentes a
estudos estatísticos.
- Disciplinas e cursos subsequentes utilizam a análise estatística.
- Análises de varias pesquisas, tanto nas empresas, como na área académica em
pesquisas científicas na produção do conhecimento.
- Muitas informações advindas da mídia em geral, tanto quanto muitas
experiências cotidianas, exigem para a sua interpretação e compreensão de
conhecimentos estatísticos.

5
UTILIZAÇÃO DA ESTATÍSTICA

No mundo atual as aplicações da Estatística se desenvolveram de tal forma que


praticamente todos os campos de estudo se beneficiam da utilização de métodos
estatísticos. Temos alguns exemplos da utilização da Estatística:
* As empresas fornecem melhores produtos a custos menores através de técnicas de
controle de qualidade.
* Controlam-se doenças com auxílio de análises que antecipam epidemias.
* Com a finalidade de reduzir as taxas de casos fatais, os legisladores tem melhores
e mais seguras justificativas para leis como as que regem inspeções de veiculos, utilização
de cintos de segurança, assim como dirigir em estado de embriagues.
* Estimativas estatísticas a respeito da modificação do tamanho de determinadas
populações, protegem espécies ameaçadas de extinção.

A ESTATÍSTICA NAS EMPRESAS

A direção de uma empresa, de qualquer área, incluindo as estatais e governamentais,


exige de seu administrador a importante tarefa de tomar decisões, e o conhecimento e o
uso da Estatística facilitarão seu tríplice trabalho de organizar, dirigir e controlar a empresa.
Por meio de sondagem, de coleta de dados e de recenseamento de opiniões,
podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e
financeiros disponíveis, as expectativas da comunidade sobre a empresa, e estabelecer suas
metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio ou
longo prazo.
A estatística ajudará em tal trabalho, como também na seleçâo e organização da
estratégia a ser adotada no empreendimento e, ainda, na escolha das técnicas de verificação
e avaliação da quantidade e da qualidade do produto e mesmo dos possíveis lucros e/ou
perdas.
Tudo isso que se pensou, que se planejou, precisa ficar registrado, documentado
para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e do material
e, ainda para um controle eficiente do trabalho
O esquema do planejamento é o plano, que pode ser resumido, com auxílio da
Estatística em tabelas e gráficos, que facilitarão a compreensão visual dos cálculos
matemático-estatísticos que lhes deram origem.
O ser humano de hoje, em suas múltiplas atividades, lança mão de processos e
técnicas estatísticas, e só estudando-os evitaremos o erro das generalizações apressadas a
respeito de tabelas e gráficos, apresentados em jornais, revistas, televisão e internet,
frequentemente cometidos quando se conhece apenas "por cima" um pouco de Estatística.
O estudo da Estatística pode tornar o (a) aluno (a) mais reflexivo e crítico em sua análise de
informações, possibilitando interagir de uma forma plena e consciente na sociedade em que
vive, colaborando para um mundo mais humanizado.

6
População e amostra

Ao conjunto de entes portddores de, peto menos, uma característica comum denominamos
população estatística ou universo estatístico.

Assim, os estudantes, por exemplo, constituem uma população, pois apresentam pelo -
menos uma característica comum: são os que estudam.
Como em qualquer estudo estatístico, temos em mente pesquisar uma ou mais carac¬
terísticas dos elementos de alguma população, esta característica deve perfeitamente
estar

definida. E isto se dá quando, considerado um elemento qualquer, podemos afirmar, sem


ambiguidade, se esse elemento pertence ou não à população. E necessário, pois, existir um
critério de constituição da população, válido para qualquer pessoa, no tempo ou no espaço.
Por isso, quando pretendemos fazer uma pesquisa entre os alunos das escolas de l2
grau, precisamos definir quais são os alunos que formam o universo: os que atualmente
ocupam as carteiras das escolas, ou devemos incluir também os que já passaram pela es¬
cola? É claro que a solução do problema vai depender de cada caso em particular.
Na maioria das vezes, por impossibilidade ou inviabilidade económica ou temporal,
limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da
população. A essa parte proveniente da população em estudo denominamos amostra.

Uma amostra ÿ:> um subconjunto finito dé uma população.

Como vimos nó capítulo anterior, a Estatística Indutiva tem por objetivo tirar con¬
clusões sobre as populações, com base em resultados verificados em amostras retiradas
dessa população.
Mas, para as inferências serem corretas, é necessário garantir que a amostra seja re¬
presentativa da população, isto é, a amostra deve possuir as mesmas características básicas
da população, no que diz respeito ao fenómeno que desejamos pesquisar. É preciso, pois,
que a amostra ou as amostras que vão ser usadas sejam obtidas por processos adequados.
Há casos, como o de pesquisas sociais, económicas e de opinião, em qíie os proble¬
mas de amostragem são de extrema complexidade. Mas existem também casos em que
os problemas de amostragem são bem mais fáceis. Como exemplo, podemos citar a reti¬
rada de amostras para controle de qualidade dos produtos ou materiais de determinada
indústria. •

Amostragem
Existe uma técnica especial — amostragem — para recolher amostras, que garante,
tanto quanto possível, o acaso na e'Scolha.
Dessa forma, cada elemento da população passa a ter a mesma chance de ser esco¬
lhido, o que garante à amostra o caráter de representatividade, e isto é muito importante,
pois, como vimòs, nossas conclusões relativas à população vão estar baseadas nos resulta¬
dos obtidos nas amostras dessa população.
Daremos, a seguir, três das principais técnicas de amostragem.

7
Amostragem casual ou aleatória simples
Este tipo de amostragem é equivalente a um sorteio lotérico.
Na prática, a amostragem casual ou aleatória simples pode ser realizada nu-
merando-se a população de 1a n e sorteando-se, a seguir, por meio de um dispositivo

aleatório qualquer, k números dessa sequência, os quais corresponderão aos elementos


pertencentes à amostra.

Amostragem proporcional estratificada


Muitas vezes a população se divide em subpopulações-— estratos.

Como é provável que a variável em estudo apresente, de estrato em estrato, um


comportamento heterogéneo e, dentro de cada estrato, um comportamento homogéneo,
convém que o sorteio dos elementos da amostra leve em consideração tais estratos.
/

E exatamente isso que fazemos quando empregamos a amostragem proporcional


estratificada, que, além de considerar a existência dos estratos, obtém os elementos da
amostra proporcional ao número de elementos dos mesmos.

Amostragem sistemática
Quando elementos da população já se acham ordenados, não há necessidade de
os
construir o sistema de referência. São exemplos os prontuários médicos de um hospital,
os prédios de uma rua, as Unhas de produção etc. Nestes casos, a seleção dos elementos
que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador.A esse
tipo de amostragem denominamos sistemática.
Assim, no caso de uma Unha de produção, podemos, a cada dez itens produzidos, re¬
tirar um para pértencer a uma amostra da produção diária. Neste caso, estaríamos fixando
o tamanho da amostra em 10% da população.

Exercícios
3 diretor de uma escola, na qual estão ma¬ N° DE ESTUDANTES
ESCOLAS
triculados 280 meninos e 320 meninas, de¬ MASCULINO FEMININO
sejoso de conhecer as condições de vida A 80 95

extraescolar de seus alunos e não dispondo B 102 120

de tempo para entrevistar todas as famílias, C 110 92


D 134 728
resolveu fazer um levantamento, por amos¬
fc 150 130
tragem, em 10% dessa clientela. Obtenha,
! F 3C0 290
para esse diretor, os elementos componen¬
Tolal 876 | 955
tes da amostra.

2. Uma cidade X apresenta o seguinte quadro Obtenha uma amostra proporcional estrati¬
relativo às suas escolas de 1a grau: ficada de 120 estudantes.

Uma população encontra-se dividida em Mostre como seria possível retirar uma
4
três estratos, com tamanhos, respectiva¬ amostra de 32 elementos de uma população
mente, n, = 40, n2 = 100 e n3 = 60. Saben¬ ordenada formada por 2.432 elementos.
do que, ao ser realizada uma amostragem Na ordenação geral, qual dos elementos
estratificada proporcional, nove elementos abaixo seria escolhido para pertencer à
da amostra foram retirados do 3a estrato, amostra, sabendo-se que o elemento de or¬
determine o número total de elementos da dem 1.420 a ela pertence?
amostra. 1.648a, 290a, 725a, 2.025a, 1.120a.

8
ESTATÍSTICA DESCRITIVA
Conceitos de alguns termos:
* População: como sendo o conjunto de todos os itens (pessoas, coisas, objetos)
que interessam ao estudo de um fenómeno coletivo segundo alguma característica.
* Amostra: qualquer subconjunto não vazio de uma população.
* Censo: é uma avaliação direta de um parâmetro, utilizando-se todos os
componentes da população.
* Um parâmetro: é uma medida numérica que descreve a característica de toda
uma população.
* Uma estatística: é uma medida numérica que descreve a característica de uma
amostra.
Exemplo:
Em uma pesquisa de intenção de votos com 1200 pessoas escolhidas ao acaso, 282
(ou 23,5%) votaram no Candidato A.
Como a porcentagem de 23,5% se baseia em uma amostra, e não em toda a
população, trata-se de uma estatística (e não de um parâmetro).

VARIÁVEIS
A cada fenómeno corresponde um número de resultados possíveis.
Variável é, convencionalmente o conjunto de resultados possíveis de um
fenómeno.
As variáveis podem ser:
* Qualitativa - quando seus valores são expressos por atributos, sexo (masculino —
feminino), cor da pele (branca, preta, amarela, vermelha, parda), etc.
* Quantitativa - quando seus valores são expressos em números (salários dos
operários, idade dos alunos de uma escola, etc.)
Podemos ainda descrever as variáveis quantitativas entre os tipos discretos e
contínuos:
* Variáveis quantitativas discretas: cujos possíveis valores formam um conjunto
finito ou enumerável de números que resultam frequentemente de uma contagem, como por
exemplo número de filhos.
* Variáveis quantitativas contínuas: cujos possíveis valores formam um intervalo
de números reais e que resultam de uma mensuração como por exemplo estatura ou a massa
de um indivíduo.

DISTRIBUIÇÃO DE FREQUÊNCIA

Frequência é o número de vezes que ocorre determinado fenómeno.

Distribuição de Frequência: é a tabela em que se resumem grandes quantidades de


dados, determinado o número de vezes que cada dado ocorre (frequência absoluta) e a
porcentagem com que aparece (frequência relativa).

9
Isso proporciona uma forma de visualizar um conjunto de números sem precisar
levar em conta os números individuais, e pode ter grande utilidade quando precisamos lidar
com grande quantidade de dados. Uma distribuição de frequência pode ser apresentada sob
forma gráfica ou tabular.
Dados brutos: é uma sequência de valores numéricos não organizados, obtidos
diretamente da observação de um fenómeno coletivo.

Rol: são dados organizados numericamente, em ordem crescente ou decrescente.


Rol é uma sequência ordenada dos dados brutos.
Tipos de frequências
Frequências simples ou absolutas (f) são os valores que realmente representam o número
de dados de cada classe.

Frequências relativas (fr.) são os valores das razões entre as frequências simples e a fre¬
quência total:

"ÿ'à
!'a
W&, ~
'* " 1
: * *
.
1
ÿ
>
• •" . .
Frequência acumulada (F.) é o total das frequências de todos os valores inferiores ao limite
superior do intervalo de uma dada classe:
Fk =f!+f2+-+fk
ou
Fk = £f (i = 1,2 k)

classe, divi¬
Frequência acumulada relativa (Fr.) de uma classe é a frequência acumulada da
dida pela frequência total da distribuição:
F,=X
• 2',

DISTRIBUIÇÃO DE FREQUÊNCIA COM


INTERVALOS DE CLASSE

Exemplo:
A tabela abaixo fornece a estatura de 40 alunos de uma 8a série A de um colégio, de
acordo com a distribuição de frequência com intervalo de classe:
ESTATURAS DE 40 ALUNOS
DO COLÉGIO A
ESTATURAS
FREQUÊNCIA
(cm)

150 h 154 4
154 h 158 9
158 h 162 11
162 i- 166 8
166 f— 170 5
170 i- 174 3

Total 40

10
ELEMENTOS DE UMA DISTRIBUIÇÃO
Classe DE FREQUÊNCIA

Classes de frequência ou, simplesmente, classes são intervalos de


variação da variável.

A's classes são representadas simbolicamente por i, sendo i = 1, 2, 3, .... k


(onde k é o número total de classes da distribuição).
Assim, em nosso exemplo, o intervalo 154 h 158 define a segunda classe
(i = 2). Como a distribuição é formada de seis classes, podemos afirmar que
k = 6.
Limites de classe

Denominamos limites de classe os extremos de cada classe.

O menor número é o limite inferior da classe (?,) e o maior número, o


limite superior da classe (L).

Amplitude de um intervalo de classe ou, simplesmente, intervalo


lasse é a medida do intervalo que define a classe.

£la é obtida pela diferença entre os limites superior e inferior dessa clasf>*-
iftdicada por- hj. Assim:
h,i= L-t

Amplitude total da distribuição

Amplitude total da distribuição (AT).é a diferença entre o limite


erior da última classe (limite superior máximo) e o limite inferior
primeira classe (limite inferior mínimo):
AT = L(máx.) - ( (min.)

AT

Ponto médio de uma classe

Ponto médio de uma classe (x,) é, como o próprio nome indica, o


ponto que divide ointervalo de classe em duas partes iguais.

Para obtermos o ponto médio de uma classe, calculamos a semi-soma


dos
limites da classe (média aritmética):

í. + L
X. =-!-L
2

NOTA:
•O ponto médio de uma classe é o valor que a representa.

11
NhínAgggç dp (Lflsseb, - -Lm re c v fl l.q£ dp Ciassg

A primeira preocupação que temos, na construção de uma distribuição de


frequência, é a determinação do número de classes e, consequentemente, da
amplitude e dos limites dos intervalos de classe.
Para a determinação do número de classes de uma distribuição podemos
lançar mão da regra de Sturges, que nos dá o número de classes em função
do número de valores da variável:

i = 1 + 3,3 . log n
onde:

i é o número de classe;
n é o número total de dados.

Essa regra nos permite obter a seguinte tabela:

TABELA
n i
3 h5 3
6 M 11 4
12 h 22 5
23 h 46 6
47 h 90 7
91 h 181 8
182 h 362 9

Além da regra de Sturges, existem outras fórmulas empíricas que preten¬


dem resolver o problema da determinação do número de classes que deve ter a
distribuição*. Entretanto, a verdade é que essas fórmulas não nos levam a uma
decisão final; esta vai depender, na realidade, de um julgamento pessoal, que
deve estar ligado à natureza dos dados, da unidade usada para expressá-los e.
ainda, do objetivo que se tem em vista, procurando, sempre que possível, evitar
classe com frequência nula ou com frequência relativa** muito exagerada etc.
Decidido o número de classes que deve ter a distribuição, resta-nos re¬
solver o problema da determinação da amplitude do intervalo de classe, o que
conseguimos divivindo a amplitude total pelo número de classes:

h == —
i

Quando o resultado não é exato, devemos arredondá-lo para mais.


Outro problema que surge é a escolha dos limites dos intervalos, os quais
deverão ser tais que forneçam, na medida do possível, para pontos médios,
números que facilitem os cálculos — números naturais.

12
Considerando a Tabela, podemos montar a seguinte tabela com as fre¬
quências estudadas:

TABELA
ESTATURAS
i (cm) f, x, fr.i F, Fb
1 150 i— 154 4 152 0,100 4 0,100
2 154 i— 158 9 156 0,225 13 0,325
3 158 i— 162 11 160 0,275 24 0,600
4 162 t— 166 8 164 0,200 32 0,800
5 166 t— 170 5 168 0,125 37 0,925
6 170 h- 174 3 172 0,075 40 1,000
X = 40 X = 1,000

O conhecimento dos vários tipos dc frequência ajuda-nos a responder a


muitas questões com relativa facilidade, como as seguintes:
a. Quantos alunos têm estatura entre 154 cm, inclusive, e 158 cm?
Esses são os valores da variável que formam a segunda classe. Como
f, = 9, a resposta é: 9 alunos.
b. Qual a percentagem de alunos cujas estaturas são inferiores a 154 cm?
Esses valores são os que formam a primeira classe. Como fr, = 0,100,
obtemos a resposta multiplicando a frequência relativa por 100:
0,100 X 100 = 10

Logo, a percentagem, de alunos é 10%. ....


c. Quantos alunos têm estatura abaixo de 162 cm?
E evidente que as estaturas consideradas são aquelas que formam as
classes dc ordem 1, 2 e 3. Assim, o número de alunos é dado por:
3

f, + W3-,Ç, fi = F3=24
Portanto, 24 alunos têm estatura abaixo de 162 cm.

d. Quantos alunos têm estatura não-inferior a 158 cm? O número de alu¬


nos é dado por:
Ou então:
X f.13
= f, + f,4 + f 5 + f6 = 11 + 8 + 5 + 3 = 27
i- 3 6
X f. - F, = n - F, = 40 - 13 = 27
RESOLVA
1 As notas obtidas por 50 alunos de uma classe foram:
1234566778
2334566788
2344566789
2345566789
2345567789
a. Complete a distribuição de frequência abaixo:

/ NOTAS f,
7 01-2 7 7
2 21-4
3 4b6
4 61-8
5 8 b 70

Z f, = 50

b. Agora, responda:
1. Qual a amplitude amostrai?
2. Qual a amplitude da distribuição?
3. Qual o número de classes da distribuição?
4. Qual o limite inferior da quarta classe?
5. Qual o limite superior da classe de ordem 2?
6 Qual a amolitude do segundo intervalo de classe?

13
DISTRIBUIÇÃO DE FREQUÊNCIA SEM
INTERVALOS DE CLASSE
Quando se variável discreta de variação relativamente pequena,
trata de
cada valor pode ser tomado como um intervalo de classe (intervalo degenera¬
do) e, nesse caso, a distribuição é chamada distribuição sem intervalos de
classe, tomando a seguinte forma:

TABELA
x, f.

x. f,
X,

Xn fn
If.
1 =
n

Seja x a variável "número de cómodos das casas ocupadas por vinte fa¬
mílias entrevistadas":

TABELA
i x, f,
1 2 4
2 3 7
3 4 5
4 5 2
5 6 1
6 7 1
I= 20

TABELA com os vários tipos de frequência, temos:


i x, f, fh F.1

1 2 4 0,20 4 0,20
2 3 7 0,35 11 0,55
3 4 5 0,25 16 0,80
4 5 2 0,10 18 0,90
5 6 1 0,05 19 0,95
6 7 1 0,05 20 1,00
I= 20 I= 1,00

Se a Variável toma numerosos valores distintos, é comum tratá-la como uma variá-
vel contínua Ibrmantlo intervalos de classe de amplitude diferente de um.
Esse tratamento(arbitrário) abrevia o trabalho, mas acarreta alguma perda de pre-
cisão.
SXEHGÍGIOS
1 Um dado foi jogado 20 vezes, sendo obtidos os seguintes pontos:
1. 5. 6. 5. 2. 2. 2. 4, 6. 5,
2. 3, 3. 1, 6, 6. 5. 5. 4, 2 v
Elabore um quadro com distribuição de frequências absolutas, frequências absolutas acumuladas,
frequências relativas e frequências relativas acumuladas.
Observando o tabela do exercício 1, responda:
a) Quantas vezes o número 2 foi obtido no dado?
b) Quantas vezes o número obtido no dado foi menor que 5?
c) Qual o índice em % em que o número 6 foi obtido no dado?
d) Qual o índice em % em que números maiores que 4 foram obtidos no dado?

2 A tabela abaixo mostra a média dos 25 alunos da 1 série do curso colegial de um determinado
3

colégio,- em Física, no primeiro bimestre de um determinado ano.


Ns do 01 02 03 04 05 06 07 03 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
aluno
Médias 4,0 7,0 5,0 5,0 5.0 4,0 9,0 4,0 5.0 6,0 6,0 7,0 6,0 6,0 5,0 A.O 4.0 3,0 7.0 6.0 6.0 8,0 5,0 5,0 8,0
Tomando como extremos a menor e a maior nota:
a) Elabore um quadro de frequências absolutas, de freqúências absolutas acumuladas, de
frequências relativas e de freqúências relativas acumuladas,

14
b) Quantos alunos obtiveram média 6.0 ?
c) Quantos alunos obtiveram média menor que 6,0 ?
d) Quantos alunos obtiveram média superior a 6,0 ?
e) Qual o índice em % de reprovação em Física neste bimestre ?
0 Qual o índice em % de alunos que obtiveram média maior que 7.0 ?
g) Qual o índice em % de alunos que obtiveram médio maior ou igual a 5.0 e menor que 7,0 ?

3 A tabela abaixo apresenta as vendas diárias de um determinado aparelho


elétrico, durante um mês, por uma firma comercial:
14 12 11 13 14 13
12 14 13 14 11 12
12 14 10 13 15 11
15 13 16 17 14 14
4 Forme uma distribuição de frequência sem intervalos de classe.
Dada a distribuição de frequência:
X| 3_ 4 5_ 6 _ 7_ 8_
f. 2 5 12 10 8 3

determine:
a. If,;
b. as frequências relativas;
c. as frequências acumuladas;
d. as frequências relativas acumuladas.
5 Complete a tabela abaixo:

i CLASSES f.
• F, Fr,
1 0h8 4 ....
2 8 H 16 10 ....
3 16 H 24 14 ....
4 24 H 32 9 .... ....
5 32 H 40 3 ....
X = 40 I= 1,00

6 Considerando as notas de um teste de inteligência aplicado a 100 alunos:


64 78 66 82 74 103 78 86 103 87
73 95 82 89 73 92 85 80 81 90
78 86 78 101 85 98 75 73 90 86
86 84 86 76 76 83 103 86 84 85
76 80 92 102 73 87 70 85 79 93
82 90 83 81 85 72 81 96 81 85
68 96 86 70 72 74 84 99 81 89
71 73 63 105 74 98 78 78 83 96
95 94 88 62 91 83 98 93 83 76
94 75 67 95 108 98 71 92 72 73

Forme uma distribuição de frequência.

7 A tabela abaixo apresenta uma distribuição de frequência das áreas de 400


lotes:
ÁREAS
(m2) 300 h 400 i- 500 h 600 h 700 H 800 i- 900 h 1.000 h 1.100 t- 1.200

NB DE 14 46 58 76 68 62 48 22 6
LOTES
Com referência a essa tabela, determine:
a. a amplitude total;
b. o limite superior da quinta classe;
c. o limite inferior da oitava classe;
d. o ponto médio da sétima classe;
e. a amplitude do intervalo da segunda classe;
f. a frequência da quarta classe;
g. a frequência relativa da sexta classe;
h. a frequência acumulada da quinta classe;
i. o numero de lotes cuja área não atinge 700 m2;
j. o número de lotes cuja área atinge e ultrapassa 800 m2;
I. a percentagem dos lotes cuja área não atinge 600 m2;
m. a percentagem dos lotes cuja área seja maior ou igual a 900 m2;
n. a percentagem dos lotes cuja área é de 500 m2, no mínimo, mas inferior
a 1.000 m2;
o. a classe do 72s lote;
p. até que classe estão incluídos 60% dos lotes.

15
Gráfica estatístico
objeiivo é o
O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo
viva do
de produzir, no investigador ou no público em geral, uma impressão mais rápida e
fenómeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries.

Gráfico em linha ou em curva


Este tipo de gráfico se utiliza da linha poligonal para representar a série estatística.
O gráfico em linha constitui uma aplicação do processo de
representação das fun¬
ções num sistema de coordenadas cartesianas.

Para tornar bem clara a explanação, consideremos a seguinte série:

PRODUÇÃO BRASILEIRA
DE ÓLEO DE DENDÊ
1987-92
QUANTIDADE
ANOS
(1.0001)
1967 39.3
1988 39.1
1969 53,9
PRODUÇÃO BRASILEIRA
1990 65,1 mil
DE ÓLEO DE DENDÊ
toneladas
1991 69.1 1987-92
7u
>
1992 595
60 /
FONTE: Agropalma.
50 J
40 f
/
Vamos tomar os anos como abscissas e as quantidades como ordenadas. 30
Assim, um ano dado (x) e a respectiva quantidade (y) formam um par ordenado (x, 20
y), que pode ser representado num sistema cartesiano. 10
Determinados, graficamente, todos os pontos da série, usando as coordenadas, li¬ 0 •
1987 88
gamos todos esses pontos, dois a dois, por segmentos de reta, o que irá nos dar uma 89 90 91 92,
FONTF; Aaropalma.
poligonal, que é o gráfico em linha ou em curva correspondente à série em estudo
FIGURA 4.1

NOTAS:
• No exemplo dado, o zero foi indicado no eixo vertical, mas, por razões óbvias, não foi in¬
dicado no eixo horizontal. Observe que o zero, de modo geral, deverá ser indicado sem
pre que possível, especialmente no eixo vertical. Se, por alguma razão, for impossível tat
Indicação e se essa omissão puder levar o observador a conclusões erróneas, é prudente
chamar a atenção para a omissão por um dos meios indicados nas Figuras 4.2, 4.3 e 4.4:
RS Ri RS
100
r A
100
99 ~n <00
99
98 98 —
1 98
97 97 ÿ

96

0 [~T —
r i
i
L-
1986 67
.
88 89 .90
96

0
l H
\1
19fi& 8? 88 89 90 1986 87 88 89 90
FIGURA 4.2 FIGURA 4.3 FIGURA 4.4

16
Exemplo: Gráfico Pictográfico
Para
Gráfico a série:
Pictórico
POPULAÇÃO DO BRASIL
1960-90
ANOS HABn-ANtES
(milhares)
m
1960 70.070,4
1970 93.139.0
1980 1 18 562.5
1990 1S5.822.4
FONTE: IBGE.

temos a seguinte representação pictórica:

POPULAÇÃO DO BRASIL
1960-90

Cada símbolo representa 20.000.000 de habitantes.

FONTE: IBGE.

Na verdade, o gráfico referente à Figura 4.14 é essencialmente um gráfico em barras


porém, as figuras o tornam mais atrativo, o que, provavelmente, despertará a atenção dc
leitor para o seu exame.
Na confecção de gráficos pictóricos temos de utilizar muita criatividade, procurandc
obter uma otimização na união da arte com a técnica. Eis alguns exemplos:

17
Diagrama de Ramo e Folhas

Em vim diagrama de ramo-e-foihas, cada número é separado em um ramo (por


exemplo, as entradas dos dígitos na extremidade esquerda) e uma folha (por exemplo,
o dígito mais à direita). Você deve ter tantas folhas quanto entradas no conjunto de j
dados original. Um diagrama de ramo-e-folhas é similar a um histograma, mas tem a
vantagem de que o gráfico ainda contém os valores originais dós dados. Outra van¬
tagem de um diagrama de ramo-e-folhas é que ele fornece uma maneira rápida de se
classificar dados.

Exemplo I
Construindo um diagrama ramo-e-folhas
A seguir, temos os números de mensagens de texto enviadas no mês passado por ;
usuários de telefonia celular em um andar de um dormitório universitário.

155 159 144 129 105 145 126 116 130 114 122 112 112 142 126
118 118 108 122 121 109 140 126 119 113 117 118 109 109 119
139 139 122 78 133 126 123 145 121 134 124 119 132 133 124
129 112 126 148 147
-
*

Solução
Em razão de as entradas de dados irem de um número baixo (78) para um número
alto (159), Você deve usar valores de ramo de 7 a 15. Para construir o diagrama, liste
esses ramos à esquerda de uma linha vertical. Para cada entrada de dados, liste uma
folha à direita de seu ramo. Por exemplo, a entrada 155 tem um ramo de 15 e
uma folha de 5. O diagrama ramo-e-folhas será desordenado. Para obter o diagrama
ramo-e-folhas, reescreva o diagrama com folhas em ordem crescente da esquerda
para a direita. É importante incluir uma chave para o gráfico para identificar os va¬
lores dos dados.
Número de mensagens Número de mensagens Importante
de texto enviadas de texto enviadas
7 8 Chave: 15 15= Você pode usar os diagramas
7 8- Chave: 15 1 5=155
de ramo-e-folhas para iden¬
-8 . 8' tificar valores de dados inco-
9 9 muns chamados de valores
10 58999 10 58999 discrepantes. No Exemplo 1,
o valor de dados 78 é um valor
11 6422889378992 11 2223467888999 discrepante. Você aprenderá
12 962621626314496 12 112223446666699 mais sobre isso na Seção 2.3!
13 0993423 13 0233499
14 4520587 14 0245578
15 59 15 59
Diagrama ramo-e-folhas desordenado Diagrama ramo-e-folhas ordenado

18
Gráfico em colunas ou em barras
É *a representação de uma série por meio de retângulos, dispostos verticalmente
(em colunas) ou horizontalmente (em barras).
Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais
aos respectivos dados.
Quando em barras, os retângulos têm a mesma altura e os comprimentos são propor¬
cionais aos respectivos dados.
Assim estamos assegurando a proporcionalidade entre as áreas dos retângulos e os
*" . r

dados estatísticos. •
Exemplos:

a. Gráfico em colunás
PRODUÇÃO BRASILEIRA
DE CARVÃO MINERAL BRUTO
1989-92
QUANTIDADE
ANOS PRODU2IDA
(1.000 1)

1989 18.196

mil PRODUÇÃO BRASILEIRA DE


toneladas CARVÃO MINERAL BRUTO
FONTE: Ministério da Agricultura. 1QHQ-Q7
20.000

15.000

10.000

5.000 "

1989 1990 1991 1992


.FONTE: Ministério da Agricultura.
FIGURA 4.7
b. Gráfico em barras
EXPORTAÇÕES BRASILEIRAS
MARÇO— 1995
' * ESTADOS
" VALOR
(USS milhões)
São Paulo 1.344
Minas Gerais 542

EXPORTAÇÕES BRASILEIRAS
MARÇO 1995—
São Paulo

Minas Gerais

Rio Grande do Sul

Espírito Santo

Paraná

Santa Catarina
I-
I
500 _ 1.000 1.500
milhões dólares
FONTE: SECEX.
FIGURA 4.8 19
Gráfico em colunas ou em barras múltiplas
Este tipo de gráfico é geralmente empregado quando queremos representar, simulta¬
neamente, dois ou mais fenómenos estudados com o propósito de comparação.
Exemplo:
BALANÇA COMERCIAL DO BRASIL
1989ÿ93

VALOR ÍUSS Í.GOÍI.OOO)


ESPECIFICAÇÕES
19B9 1990 199T 1992 1993
Exportação IFOB1 M.383 3T.Ã14 31.620 3S.793 18.783
.1itipuftjçao IH2&J 5 1 fyi i 20.554 25.711

FONTE: Ministério da Fazenda.

BALANÇA COMERCIAL
US$ milhão RPASII _iqsQ-qa

40orm

wrinn

20.0(10

100(10

1989 1990 1991 1992 1993


FONTE: Ministério da Fazenda. B exportação ÿ importação
FIGURA 4 9

O total é representado pelo círculo, que fica dividido em tantos setoreS quantas são
as partes.
Os setores são tais que suas áreas são respectivamente proporcionais aos dados da
série.
Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que
o total da série corresponde a 360°.
Exemplo:
Dada a série:
REBANHO SUfNO DO
SUDESTE DO BRASIL
1992
QUANTIDADE
ESTADOS
(mil cabeias)

3.363.7 6.138,5 — 360° => x, = 197,2 => x, = 197°


3.363,7 — x.
x2 = — ,_ '=>
25,2 .._ 25c
"2
x3 = 18,0 => x3 = 18°
FONTE: IBGE. x„ = 119,3 =9 x = 120°
Com esses dados (valores em graus), marcamos num círculo de raio arbitrário, com
temos:
um transferidor, os arcos correspondentes, obtendo o gráfico:

REBANHO SUlNO DO
SUDESTE DO BRASIL
1QQ9

| | Minas Gerais
lllll Espírito Santo
| | Rio de Janeiro
São Paulo

FONTE: 3GE 20
FIGURA 4 1(1
SOLUÇÃO
Primeiro método

do período considerado

Segundo método
(c) Calcule e interprete7(100).
SOLUÇÃO
(a) f{x) = 1000 + 25*.

destes dados.

1998
L
-
1025 1050

--
Funções e gráficos
A despesa geral de uma companhia é R$ 1.000,00 por dia e o custo de
(o) Escreva a função que representa o custo total da produção
(b) Use o EXCEL para gerar um tabela que calcula o custo
40, 45 e 50 unidades por dia.

1075

(c) 7(100) - 1000 + 25(100) - 1000 2500 = 3500. 0

A Tabela 1-4 mostra o diagnóstico de


+

Tabela 1-4 Número de diagnósticos de


Ano
Milhões

O primeiro gráfico é do tipo séries temporais e


-
1997
0,88
1998
0,90
1999
1,01
1100

custo de

2000
1,10
de %

(b) Os números 5 10,..., 50 são inseridos em B1:K1 e a expressão


arrastando ate K2, obtemos a seguinte saída:

x 5 10 15 20 25
1125

novos casos de diabetess ae

2001
1,20
unidades por dia.

de 11 yy

é mostrado na Fipnr» l-5 r(c» a 1C0 mosÿra


betes para cada ano a partir de 1997 até 9005 Flÿ
ÿ mr»
° -
qUC numer0 de novos «sos
30
"<150

997 a 2U05-

o
produção de cada item é de R$ 25,00.

total da produção de 5, 10,'>>>>,


15 20 25 30 35

=1000+25*B1 é inserida em B2 e clicando e

35
1175

7005 Eaça um gráfico a

i-ciauS)

2002
1,25
1 2003
1,28

os novos casos de d
aumentou a cada ano den
'
UB tua Detes
'

1200

partir

2004
1,36
40

2005
1,41
45
1225
50
1250
produção de x = 100 unidades por dia é 3500.

21
Terceiro método
O terceiro gráfico apresenta um gráfico denominado de gráfico tipo pizza. .
Esse gráfico mostra a porcentagem de novos casos de dia-betes de 1997 até
2005.

Mílões
a 1997 a 1993 w 1999 a 2000 ÿ 2001 « 2002 2003 2004 2005

3 Faça um gráfico a partir dos dados da Tabela 1.2 usando os seguintes gráficos:

Tabela 1-2 Produção de trigo e milho de 2002 a 2006.

Ano Alqueires de trigo Alqueires de milho

2002 205 80

2003 •
215 105

2004 190 110

2005 205 115

2006 .225 120

a. Faça um gráfico de linhas a partir destes dados usando o EXCEL.


b. Faça um gráfico de colimas agrupadas com efeito visual 3D a partir destes
dados usando o EXCEL.
c. Faça um gráfico com colunas empilhadas com efeito visual 3D a partir destes
dados usando o EXCEL.

22
SOLUÇÃO

a. Gráfico de linhas.

Alqueires de trigo

b. Gráfico de colunas agrupadas com efeito visual 3D.

• Alqueires de trigo

• Alqueires de rníltio

23
No entanto, a maioria deles são simplesmente gráficos de apresenta¬
ção, que o interessado com pequeno esforço poderá facilmente compreender.
Nosso interesse estará completamente voltado para os gráficos de
análise da série estatística que são: Histograma, Polígono de frequência e a
curva polida de frequência.
Estas representações gráficas assumem aspectos diferenciados para
variável discreta e variável contínua.

HISTOGRAMA - VARIÁVEL DISCRETA

É um conjunto de hastes, representadas em um sistema de coordena¬


das cartesianas que tem por base os valores distintos da série (x() e por altura,
valores proporcionais as frequências simples correspondentes destes elemen¬
tos ($.
Exemplo: Se considerarmos a série:

*; f,
2 1
3 4
5 8
6 6
7 2

então o histograma assume a forma:

Polígono de frequências
Quando unimos, por segmento de reta, as extremidades das barras, obtemos uma
representação gráfica chamada polígono de frequências.
Observe o exemplo dado:
Idade N9 de alunos
(x,) (F.)
12 -
14
15
4
12 7\
16 8 8-
\
17 1
! \
\- •

\
14 15 i<;

0 gráfico do polígono de frequências absolutas pode ser feito, também, com


frequências absolutas acumuladas.

24
II- Distribuição de Freqüência e seus Gráficos

1) Akhiok é uma pequena vila pesqueira na ilha de Kodiak, Alasca. O censo a seguir
representa os dados etários declarados de toda a população dos 77 habitantes de Akhiok,

28, 6, 17, 48, 63, 47, 27, 21, 3, 7, 12, 39, 50, 54, 33, 45, 15, 24, 1, 7, 36, 53, 46, 27, 5, 10,
32, 50, 52, 11, 42, 22, 3, 17, 34, 56, 25, 2, 30, 10, 33, 1, 49, 13, 16, 8, 31, 21, 6, 9, 2, 11, 32,
25, 0, 55, 23, 41, 29, 4, 51, 1, 6, 31, 5, 5, 11, 4, 10, 26, 12, 6, 16, 8, 2, 4, 28.

a) Construa uma distribuição de freqüência usando as idades dos habitantes de Akhiok


(dados acima). Use seis classes.

b) Usando a distribuição de freqüência obtida no exercício anterior, determine o ponto


médio das classes e as freqüências relativas e cumulativas para cada classe.

c) Utilizando a distribuição de freqüência obtida nos dois exercícios anteriores construa um


histograma de freqüência, polígono de freqüência e um gráfico de freqüência cumulativa.

d) Use um diagrama de ramos e folhas para organizar o conjunto de dados da população de


Akhiok.

e) Use o plote de pontos para organizar o conjunto de dados da população de Akhiok.

2) Uma pesquisa sobre a idade, em anos, de uma classe de calouros de uma faculdade,
revelou os seguintes dados.
18, 17, 18, 20, 21, 19, 20, 18, 17, 19
20, 18, 19, 18, 19, 21, 18, 19, 18, 18
19, 19, 21, 20, 17, 19, 19, 18, 18, 19
18, 21, 18, 19, 19, 20, 19, 18, 19, 20
18, 19, 19, 18, 20, 20, 18, 19, 18, 18

Construa a distribuição de frequência conveniente para esses dados e represente os dados em


um gráfico de linhas.

3) Os dados abaixo representam os rendimentos de uma ação da bolsa de


valores nos últimos 50 meses. Construa a distribuição de frequência conveniente para
esses dados e esboce o histograma da frequência dessa distribuição.

2,50 – 2,00 – 1,50 – 1,00 – 2,80 – 3,00 –


4,50 – 5,00 – 5,20 – 4,40 – 1,20 – 4,30 –
4,00 – 4,15 – 4,25 – 2,33 – 2,15 – 1,36 –
3,20 – 5,32 – 4,15 – 1,25 – 2,59 – 2,16 –
4,12 – 5,23 – 1,24 – 1,00 – 1,62 – 2,00 –
2,56 – 4,16 – 4,26 – 4,36 – 5,89 – 4,30 –
5,66 – 3,33 – 3,40 – 2,69 – 4,22 – 4,89 –
5,69 – 5,98 – 5,00 – 2,70 – 4,11 – 4,25 –
4,75 – 1,88 ---------------------------------
3) (ESAF/TTN) De acordo com a distribuição de frequência transcrita a seguir, pode-se
afirmar que:

a) 8% das observações têm peso no intervalo de classe 8 ---- 10.


b) 65% das observações têm peso não inferior a 4 kg e inferior a 10 kg.
c) Mais de 65% das observações têm peso maior ou igual a 4 kg.
d) Menos de 20 observações têm peso igual ou superior a 4 kg.
e) A soma dos pontos médios dos intervalos de classe é inferior ao tamanho da população.

4) Considere a distribuição de frequência abaixo, referente a salários pagos a


funcionários de uma empresa, e assinale a alternativa correta.

a) A frequência relativa da segunda classe é 0,25.


b) Os dados acima são insuficientes para a construção de um polígono de frequência.
c) Os dados acima são insuficientes para a construção de um gráfico de frequência relativa
acumulada.
d) A frequência relativa acumulada crescente do segundo intervalo de classe é 0,25.
Resposta de alguns exercícios

3. c
4. d
HISTOGRAMA - VARIÁVEL CONTÍNUA

É um conjunto de retângulos justapostos, representados em um siste¬


ma de coordenadas cartesianas, cujas bases são os intervalos de classe e
cujas alturas são valores proporcionais às frequências simples corresponden¬
tes.
Exemplo: Se considerarmos a série:

Classe Int. cl. f,


1 0 I-2 3
2 2 I-4 6
3 4 I 6 8
4 6 I-8 5
5 8 I-10 2

então o histograma assume a forma:

8 10 Int. cl.

ÿ Observe que não colocamos o zero no eixo horizontal na origem


do sistema por uma questão de clareza da representação gráfica.
Deixamos, intencionalmente, um espaço igual a um intervalo de classe
no início e no final da representação gráfica.
Se considerarmos este espaçamento inicial e final como sendo classes
fictícias com frequência zero e unirmos os pontos médios das bases supe¬
riores destes retângulos, obtemos uma nova figura chamada polígono de
frequência.

fi

0 2 4 6 8 10 Int. cl.

h Observe que a área do polígono de frequência é a mesma área do


histograma.
ÿ Quando estamos lidando com um censo, o histograma representa
diretamente a distribuição de frequência da população, mas quando estamos
lidando com uma amostra, a histograma representa apenas a distribuição de
frequência da amostra e não da população.

25
No entanto, se imaginarmos o número n de elementos da amostra
aumentando progressivamente, o número de classes iria aumentando pro¬
gressivamente e a amplitude do intervalo de classe iria diminuindo, o que
transformaria o polígono de frequência praticamente em uma figura polida,
chamada curva polida de frequência.
Esta figura nos dará uma noção da distribuição de frequência da popu¬
lação.
fi
8

2
1

__
0 2 4 6 8 10 Int. cl.

Exercícios

i- Construa um histograma para a distribuição de frequência:

*j <±
1 2
2 3
3 5
4 4
5 3
6 1

2- Construa um histograma para a série representativa da idade de 50 alunos do


primeiro ano de uma Faculdade:
tdade (anos) Número de alunos
*< '/
17 3
18 18
19 17
20 8
21 4

2- Construa um histograma para a série representativa do número de acidentes por


dia observados em determinado cruzamento, durante 40 dias:
Número de Número de dias
acidentes por dia
*/
0 30
1 5
2 3
3 1
4 1

Construa um histograma para a série representativa de uma amostra dos salários


de 25 funcionários seiecionados em uma empresa.

Classe Salários uss Número de funcionários


f,
ÿ

1 1.000.00 I- — 1.200,00 2
2 1 .200,00 I--— 1.400,00 6
3 1.400,00 I -— 1.600,00 10
4 1.600,00 I -— 1.800,00 5
5 1.800,00 I -— 2.000,00 2

5. Construa o polígono de frequência para a distribuição do problema anterior.

26
6 Conhecidas as notas de 50 alunos:
68 85 33 52 65 77 84 65 74 57
71 35 81 50 35 64 74 47 54 68
80 61 41 91 55 73 59 53 77 45
41 55 78 48 69 85 67 39 60 76
94 98 66 66 73 42 65 94 88 89

determine:
o intervalo de
a. a distribuição de frequência começando por 30 e adotando
classe de amplitude igual a 10;
b. as frequências acumuladas;
c. as frequências relativas;
d. o histograma e o polígono de frequência.

7 A tabela abaixo apresenta os coeficientes de liquidez obtidos da análise de


balanço em 50 indústrias:
3,9 7,4 10,0 11,8 2,3 4,5 10,5 8,4 15,6 7,6
18 8 2,9 2,3 0,4 5,0 9,0 5,5 9,2 12,4 8,7
45 4 4 10,6 5,6 8,5 2,4 17,8 .11,6 0,8 4,4
7,1 3,2 2,7 16,2 2,7 9,5 13,1 3,8 6,3 7,9
4,8 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 16,0

a. Forme com esses dados uma. distribuição com intervalos de classe


iguais
a 3, tais que os limites inferiores sejam múltiplos de 3.
b. Confeccione o histograma e o polígono de frequência correspondentes.

MEDIDAS de tendência central

As medidas dc tendência central são usadas para indicar um valor que tende a tipificar, ou a
representar melhor, um conjunto de números. As três medidas mais usadas são a média, a
mediana c a moda.

MÉDIA ARITMÉTICA ( x )
A media aritmética é a ideia que ocorre à maioria das pessoas quando se fala em "média". E
como ela possui certas propriedades matemáticas convenientes, é a mais importante das três
medulas que estudaremos. Calcula-se a média aritmética determiriando-se a soma dos valores do
conjunto c dividindo-se esta soma pelo número de valores no conjunto.

Dados não-agrupados
Quando desejamos conhecer a média dos dados não-agrupados, determi¬
namos a média aritmética simples.
Exemplo:

Se um estudante fez quatro provas e obteve as notas 83, 94, 95 e 86, sua nota média é

83 + 94 + 95 + 86 „
~
4
A media de uma amostra* é representada pelo símbolo x (leia-se "x barra"), e seu cálculo pode
expressar-se em notação sigma como segue.

ou mais simplesmente como

O processo de cálculo da média aritmética é o mesmo, quer se trate


de um conjunto de
Jlufcs que traduzam representações amostrais, quer se trate de todos os valores de uma
população.
obstante, utiliza-se o símbolo ju para a média de uma população, e N para o número de
"ens da população:

H=
I*
N

27
A média tem certas propriedades interessantes e úteis, que explicam por que é ela a medida
de tendência central mais usada:
1. A média de um conjunto de números pode sempre ser calculada.
2. Para um dado conjunto de números, a média é única.
3. A média c sensível a (ou afetada por) todos os valores do conjunto. Assim, se um valor se
modifica, a média também se modifica.
4. Somando-se uma constante a cada valor do conjunto, a média ficará aumentada do valor dessa
constante. Assim, somando-se 4,5 a cada valor de um conjunto, a média ficará aumentada de
4,5. Analogamente, subtraindo-se de cada valor do conjunto uma constante, ou multiplicando-se
ou dividindo-se por ela cada valor do conjunto, a média fica reduzida dessa constante, ou
multiplicada ou dividida por ela.
5. A soma dos desvios dos números de um conjunto a contar da média é zero:

I(.v, - 3c) = 0
Tem-se uma representação física da média imaginando uma viga com pesos iguais colocadc
Por exemplo, a média dos números 2, 4 e 6 é 4: nos pontos correspondentes aos valores de um conjunto. A média dos números 2, 4 e 6 pode s<
ilustrada conforme a Figura
2+4+6 „
x=
-ÿr— = 4

Subtraindo 4 de cada um dos números, obtemos

__BESS#}—_ ; ÿ

:1

• . ;• .-
it Ukzpf. H-:é 'ÿ

Dados agrupados

Sem intervalos de classe

Consideremos a distribuição relativa a 34 famílias de quatro filhos, to¬


mando para variável o número de filhos do sexo masculino:

TABELA
N° DE
Meninos f, •
-
0 2
1 6
2 10
3 12
4 4

1=34

Neste caso, como as frequências são números indicadores da intensidade


de cada valor da variável, elas funcionam como fatores de ponderação, o que
nos leva a calcular a inédia aritmética ponderada, dada pela fórmula:

z*,f.
If,

O modo mais prático de obtenção da média ponderada é abrir, na tabela, Ternos, então:
uma coluna correspondente aos produtos x.f:
E x.f = 78 e E f. = 34

TABELA
f1 x.f, Loeo:
xi
0 2 0
1 6 6 X-Zâ-
x = — = 2,29 =» x = 2,3
2 10 20 If, 34
3 12 36
4 4 16 isto e:
I= 34 E = 78
x = 2,3 meninos

28
RESOLVA

1 Complete o esquema para o cálculo da média aritmética da distribuição:

1 2 3 4 5 6
f 8 1

remos:
Como:
X. f, x.f. X x/ = ....
1 X f =
1 2 2
e
•?
£ 4
3 6 X x,7
4 8 x/;
5 3
6 7 temos:

X = .... X = .... x =- 3,4

Com intervalos de classe

Neste caso, convencionamos que todos os valores incluídos em um de¬


terminado intervalo de classe coincidem com o seu ponto médio, e deter¬
minamos a média aritmética ponderada por meio da fórmula:

Z x.f.
x = i i

I f

onde x. é o ponto médio da classe.


Consideremos a distribuição:

TABELA
ESTATURAS
i (cm) f,
1 150 t- 154 4
2 154 i- 158 9
3 158 •— 162 11
4 162 i- 166 8
5 166 >- 170 5
6 170 174 ÿ- 3

W II O

Pela mesma razão do caso anterior/vamos, inicialmente, abrir uma colu¬


na para os pontos médios e outra para os produtos-x.f.:

TABELA
ESTATURAS
i fi X. xf1 1
(cm) i

1 150 i- 154 4 152 608


2 154 i- 158 9 156 1.404
3 158 i- 162 11 160 1.760
4 162 i- 166 8 164 1.312
5 166 i- 170 5 168 840
6 170 p- 174 3 172 516
M II ÿp* o I= 6.440

Como, neste caso:

X x.f.
X x.f. = 6.440, X f. = 40 e x I I

X f. '

temos:

•. O
S= 6ÿ=16l x = 161 etn
29
RESOLVA

1 Complete o esquema para o cálculo da média aritmética da distribuição de


frequência:
CUSTO
(RS) 450 h 550 I- 650 h 750 h 850 h 950 t- 1.050 h 1.150
8 10 11 16 13 5 1

Temos:
í X
1 */, Logo:
7 500 . 8 4.000
2 10
3 77
4 16
donde:
5 13
6 5 x = R$ 755
7 7. 7 00 1
I= .... X= ....
A MEDIAM (Md)
. .

A mediana é outra medida de posição definida como o número que


se encontra no centro de uma série de números, estando estes dispostos
segundo uma ordem. Em outras palavras, a mediana de um conjunto de
valores, ordenados segundo uma ordem de grandeza, é o valor situado de
tal forma no conjunto que o separa em dois subconjuntos de mesmo nú¬
mero de elementos.-

Dados não-agrupados
Dada uma série de valores, como, por exemplo:
5, 13, 10, 2, 18, 15, 6, 16, 9,

de acordo com a definição de mediana, o primeiro passo a ser dado é o da


ordenação (crescente ou decrescente) dos valores:
2, 5, 6, 9, 10, 13, 15, 16, 18

Em seguida, tomamos aquele valor central que apresenta o mesmo nú¬


mero de elementos à direita e à esquerda. Em nosso exemplo, esse valor é o
10, já que, nessa série, há quatro elementos acima dele e quatro abaixo.
Temos, então:
Md = 10
Se, porém, a série dada tiver um número par de termos, a mediana será,
por definição, qualquer dos números compreendidos entre os dois valores cen¬
trais da série. Convencionou-se utilizar o ponto médio.
Assim, a série de valores:
2, 6, 7, 10, 12, 13, 18, 21
tem para mediana a média aritmética entre 10 e 12.
Logo:
... 10+12 22
Md = -= - = 11
2 2

donde:
Md = 11

Verificamos que, estando ordenados os valores de uma série e sendo n o


número de elementos da série, o valor mediano será:

—o termo de ordem -2-ÿ— , se n for ímpar;

— a média aritmética dos lermos de ordem — e— + 1, se n for par.


2 2
30
NOTAS: • A mediana, como vimos, depende da posição e não dos valores dos elementos na
série ordenada. Essa é uma das diferenças marcantes entre a mediana e a media
(que se deixa influenciar, e muito, pelos valores extremos). Esta propriedade da
mediana pode ser constatada através dos exemplos a seguir:

5, 7, 10, 13, 15 => x = 10 e Md = 10


5, 7, 10, 13, 65 => x = 20 e Md = 10

isto c, a média do segundo conjunto de valores é maior do que a do primeiro, por


influência dos valores extremos, ao passo que a mediana permanece a mesma.
• A mediana é designada, muitas vezes, por valor mediano.

Dados agrupados

Sc os dados se agrupam em uma distribuição de frequência, o cálculo da


mediana se processa de modo muito semelhante àquele dos dados não-agrupa-
dos, implicando, porém, a determinação prévia das frequências acumuladas.
Ainda aqui, temos que determinar um valor tal que divida a distribuição em
dois grupos que contenham o mesmo número de elementos.

Para o caso de uma distribuição, porém, a ordem, a partir de qualquer


um dos extremos, é dada por:

I f,
2

Sem intervalos de classe

Neste caso, é o bastante identificar a frequência acumulada imediatamen-


lesuperior à metade da soma das frequências. A mediana será aquele valor da
variável que corresponde a tal frequência acumulada.
Tomemos a distribuição relativa à Tabela , completando-a com a colu¬
na correspondente à frequência acumulada:

TABELA
N® DE
f.1 F,
MENINOS
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
I= 34

Sendo:

a menor frequência acumulada que supera esse valor é 18, que corresponde ao
valor 2 da variável, sendo este o valor mediano. Logo:
Md = 2 meninos

Exemplo:

TABELA Temos:
*. f. F,
12 1
l

1
—2 = 4 = F3 3

14 2 3 Logo:
15 1 4
16 2 6 15 + 16 31
Md = 15,5
17 1 7 2
20 1 8 donde:
M II 00 Md = 15,5

31
RESOLVA

1 Complete o esquema para o cálculo da mediana das distribuições:


a. x, 2 4 6 8 10
f, 3 7 12 8 4

Temos:
Como:
*, f, F,
2 3 .... LL
2
4 7 10
6 12 vem:
8 8 30
10 4 .... Md = ....
Z = ....
b. X, 0 1 2 3 4 5
f. 2 5 9 7 6 CO

Temos:
Como:
X) F, Z f;
0 2 2 2
vem:
9

4 .... isto é:

L= ....

Com intervalos de classe

Neste caso, o problema consiste em determinar o ponto do intervalo em


que está compreendida a mediana.
Para tanto, temos inicialmente que determinar a classe na qual se acha a
mediana — classe mediana. Tal classe será, evidentemente, aquela correspon-
I f1
dente à frequência acumulada imediatamente superior a .
Feito isto, um problema de interpolação* resolve a questão, admitindo-
se, agora, que os valores se distribuam uniformemente em todo o intervalo de
classe.
Assim, considerando a distribuição da Tabela ' , acrescida das frequên¬
cias acumuladas:

TABELA
ESTATURAS
i f. F1
(cm) 1

1 150 h 154 4 4
2 154 i- 158 9 13
3 158 t- 162 11 24 <-
4 162 h- 166 8 32
5 166 h 170 5 37
6 170 h- 174 3 40
I= 40

lemos:

=20
2 2

Como há 24 valores incluídos nas três primeiras classes da distribuição e


como pretendemos determinar o valor que ocupa o 20a lugar, a partir do início
da série, vemos que este deve estar localizado na terceira classe (i = 3), su¬
pondo que as frequências dessas classes estejam uniformemente distribuídas. 32
Na prática, executamos os seguintes passos:

l9) Determinamos as frequências acumuladas.


2°, Calculamos ALL.
2
39) Marcamos a classe correspondente à frequência acumulada imedia¬
tamente superior à ALL — classe mediana — e, em seguida, empre¬
gamos a fórmula:

til - F(ant) h*
-k 2 .
;•
Md = r»
na qual:
t* é o limite inferior da classe mediana;
F (ant) é a frequência acumulada da classe anterior à classe mediana;
f* é a frequência simples da classe mediana;
h* é a amplitude do intervalo da classe mediana.

Tomando como exemplo a distribuição anterior, temos:

AL = i!= ao
2 2

Logo, a classe mediana é a de ordem 3. Então:

i* = 158, F(ant) = 13, f* = 11 e h# = 4

Substituindo esses valores na fórmula, obtemos:

(2° ~ 13)4
Md = 158 +
11
= 158 + —
11
= 158 + 2,54 = 160,54,

isto e: Md = 160,5 cm

RESOLVA
1 Complete o esquema para o cálculo da mediana da distribuição de freqúên--
cia:
CUSTOS
(RS) 450 l- 550 t- 650 i- 750 h 850 t- 950 1.050 h 1.150
f, 8 10 11 16 13 5

lemos:

2
*
J
CUSTOS
IRS)

450 h 550
550 h 650
650 b 750
750 h 850
8

....
F,
8
18
Z f,

Logo:
2
....
2

!* = ...., F(ant) = ...f* = .... e h*

-
850 h 950
950 h 1.050 Md = .... + ÿ ""

_ .... +
7 1.050 h 1. 150
2" = .... isto é:

Md = RS 769

NOTA:
ir.
No caso de existir uma frequência acumulada exatamente igual a -1- , a media
2
na será o limite superior da classe correspondente.

33
Exemplo:

TABELA
i CLASSES f, F,
1' 0 i- 10 1
'
* 1
2 10 h 20 3 4
3 20 i- 30 9 13 <- Temos:
4 30 h 40 7 20
5 40 h 50 4 24 lA = ii
2
= 13
6 50 H 60 2 26 2

I= 26 Logo:
Md - L* ==> Md — 30

A MODA (Mo)

Denominamos moda o valor que ocorre com maior frequência em


uma série de valores.

Desse modo, o salário modal dos empregados de uma indústria é o salá¬


rio mais comum, isto é, o salário recebido pelo maior número de empregados
dessa indústria.

Dados não-agrupados

Quando lidamos com valores não-agrupados, a moda é facilmente reco¬


nhecida: basta, de acordo com a definição, procurar o valor que mais se repete.
A série de dados:
7, 8, 9, 10, 10, 10, 11, 12, 13, 15
tem moda igual a 10.
Podemos, entretanto, encontrar séries nas quais não exista valor modal,
isto é, nas quais nenhum valor apareça mais vezes que outros. É o caso da
série:
3, 5, 8, 10, 12, 13,
que não apresenta moda (amodal).
Em outros casos, ao contrário, pode haver dois ou mais valores de con¬
centração. Dizemos, então, que a série tem dois ou mais valores modais. Na
série:
2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9
temos duas modas: 4 e 7 (bimodal).

Dados agrupados
Sem intervalos de classe

Um vez agrupados os dados, é possível determinar imediatamente a moda:


basta fixar o valor da variável de maior frequência.
Na distribuição da Tabela 6.1, à frequência máxima (12) corresponde o
valor 3 da variável. Logo:
Mo = 3

Com intervalos de classe

A classe que apresenta a maior frequência é denominada classe modal.


Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante
que está compreendido entre os limites da classe modal.
O método mais simples para o cálculo da moda consiste em tomar o ponto
médio da classe modal.
Damos a esse valor a denominação de moda bruta.
Temos, então:

_ 2
onde:
F* é o limite inferior da classe modal;
L* é o limite superior da classe modal.
34
Ill, para a distribuição:
TABELA 6.6
lemos que a classe modal é i = 3, C* = 158 e L* = 162.
ESTATURAS
i (cm)
Como:

1 —
150 i 154 4 Mo = - í* + L*
2 154 t- 158 9
3 —
158 i 162 11 <- vem:
4 162 i- 166 8
+158 162 320
5 166 i- 170 5 Mo = - = -= 160
6 170 i- 174 3
Loco:
r = 40
Mo = 160 cm

KESOLVA

1 Complete o esquema para o cálculo da moda da distribuição de frequência:

CUSTOS A classe modal é a de ordem...


i
(RS)
f,
Logo:
1 450 h 550 8 f* = ... e L* = ...
2 550 l- 650 10
Temos, pois:
3 650 H 750 11
4 750 t- 850 16 +
Mo = ""
=
5 850 t- 950 13 2 2
6 950 h 1.050 5 isto é:
7 1.050 t- 1.150 1
i
Mo = R$ 800
M li O) -P*

As expressões gráficas da moda

Na curva de frequência, a moda é o valor que corresponde, no eixo das


abscissas, ao ponto de ordenada máxima. Assim, podemos ter:

Mo CURVA NAO-MODAL CURVA AMODAL CURVA ANTIMODAL


CURVA MODAL

Mo, Mo2
CURVA BIMODAL
CURVA TRIMODAL

Emprego da moda
A moda é utilizada:
a. quando desejamos obter uma medida rápida e aproximada de
posição;
I). quando a medida de posição deve
ser o valor mais típico da distribui¬
ção.

35
POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA
Quando unia distribuição é simétrica, as três medidas coincidem. Porém,
a assimetria torna-as diferentes e essa diferença é tanto maior quanto maior é
a assimetria. Assim, em uma distribuição em forma de sino. temos:
x = Md = Mo, no caso da curva simétrica;
Mo < Md < x. 110 caso da curva assimétrica positiva:
x < Md < Mo, no caso da curva assimétrica negativa.

MODA

MEDIANA
x = Md = Mo
MEDIA

Mo < Md < x x < Md < Mo

AS SEPARATRIZES

Como vimos, a mediana caracteriza uma série cie valores devido à sua
posição central. No entanto, ela apresenta uma outra característica, tão impor¬
tante quanto a primeira: ela"separa a série em dois grupos que apresentam
o mesmo número de valores.

Assim, além das medidas de posição que estudamos, há outras que, con¬
sideradas individualmente, não são medidas de tendência central, mas es¬
tão ligadas à mediana relativamente à sua segunda característica, já que se
baseiam em sua posição na série. Essas medidas — os quartis, os percentis e
os decis —são, juntamente com a mediana, conhecidas pelo nome genérico
de separatrizes.

Os quartis

Denominamos quartis os valores de uma série que a dividem em


quatro partes iguais.

Há, portanto, três quartis:

a. O primeiro quartil (Q() — valor situado de ta! modo na série que uma
quarta parte (25%) dos dados é menor que ele e as três quartas partes
restantes (75%) são maiores.
b. O segundo quartil (Q,) —
evidentemente, coincide com a mediana
(Q, = Md).
c. O terceiro quartil (Q,) — valor situado de tal modo que as três quar¬
tas partes (75%) dos termos são menores que ele e uma quarta parte
(25%) é maior. Assim, temos:

Quando os dados são agrupados, para determinar os quartis usamos a If, p(arit) h*
mesma técnica do cálculo da mediana, bastando substituir, na fórmula da me-
..
ihana,
I

f.'ÿ
por:
Q, =

kl f,
3X f
- F(ant)
Q, = t*
sendo k o número de ordem do quartil.
36
Exemplo:

Primeiro quartil

Temos:

JLi. = JA

Q, = 154 +

Q,
= 154

= 156,7 cm
= 10

(10 - 4) 4

24
9

= 154 + 2,66 =

Temos:
ESTATURAS

156.66

Primeiro quartil

Q
= 1

* = ....,
5 f,
4

F(ant) =
(cm)

150 t- 154
154 h 158
158 i- 162
162 t— 166
166 t— 170
O

(....

.... + .... x ....

Q, = R$ 630
T

.

i

450

7
2
3
4
5
6
7

4
t-

f*

- ....) ....
TABELA

10

CUSTOS
f,

(RS)
4
9
11
8
5
3
II

31 f,

450 h 550
550 h 650
650 h 750
750 h 850
850 h 950
950 h 1.050
1.050 h 1.150

h*
o

CL = 162 +
3

= 162 +

CL = 165 cm

1 Complete os esquemas para o cálculo do primeiro e do terceiro quartis da


distribuição de frequência:

CUSTOS
(RS)

k=3
F,
4
13 <- (Q,)
24
32
37
40

Terceiro quartil

Temos:

24

= 162 + 3 = 165
40

Q3 = .... +

Q, = RS 873
<- (Q3)

(30 - 24) 4

550 H 650 t- 750 t- 850 t- 950


11 16 13

f1

8
10
11
16
13

II
5
1

Terceiro quartil

.....

.... +
= 30

ÍO
RESOLVA

31 f,
4
h-

F(ant) =

(....
1.050 t- 1.150

F,
8
1

18 <- (Q )
29
45
58 <- (Q )
63
64

3X

...., f*
4

- ....) ....

.... x ....

'x r
....

= .....
4

h"

37
II - Medidas de Tendência Central

Nos exercícios 1-9, faça o seguinte:

(a) Determine a média, a mediana e a moda dos dados, se possível. Se não for possível, explique
por que a medida de tendência central não pôde ser determinada.
(b) Qual é a medida de tendência central que melhor representa os dados? Explique seu
raciocínio.

1. O tempo em segundos que uma amostra de sete carros esportivos leva para ir de zero a 60
milhas por hora.

4,0 4,8 4,8 4,8 4,8 5,1 8,6

2. O nível de colesterol em uma amostra fornecida por dez funcionários de determinada


empresa.

154 216 171 188 229 203 184 173 181 147

3. As respostas em uma amostra de 1001 pessoas a quem se perguntou se a sua próxima


compra de carro seria uma marca nacional ou estrangeira.

Nacional: 704 Estrangeira: 253 Não Sabe: 44

4.Veículos utilitários esportivos O número máximo de assentos em uma amostra de veículos


utilitários esportivos (Fonte: Consumer Reports)

5.Educação Custo da educação por estudante (em milhares de dólares) em uma amostra de dez
universidades. (Fonte: U.S. News World Report)

6.NBA Os pontos que cada time da NBA marcou por jogo durante uma temporada recente.
(Fonte: NBA)

7.Apagões A duração (em minutos) de cada apagão em uma residência nos últimos dez anos.
8. Qualidade do ar As respostas de uma amostra de 1.040 pessoas que disseram se a qualidade
do ar em sua comunidade era melhor ou pior do que há dez anos.

Melhor: 346 Pior: 450 Igual: 244

9.Crimes As respostas de uma amostra de 1.019 pessoas que disseram como se sentiam quando
pensavam sobre o crime.

Despreocupada: 34 Alerta: 672 Nervosa: 125 Amedrontada: 188

10.Aviões O número de aviões que 11 linhas aéreas mantêm em operação.


(Fonte: Airline Transport Association)

11) As notas e seu percentuais de avaliação final para um estudante de um curso de


estatística são mostrados a seguir. Qual será a nota média do estudante?

Nota Porcentagem da avaliação final (pesos)

Trabalho de Casa 85 15%


Teste rápido 80 10%
Teste rápido 92 10%
Teste rápido 76 10%
Projeto 100 15%
Exame oral 90 15%
Exame final 93 25%

12) Um estudante é avaliado conceitualmente da seguinte maneira: um A corresponde a 4


pontos, um B a três pontos, um C a dois pontos e um D um ponto. Qual será a média do
estudante que tenha a seguinte avaliação?

B em dois cursos de 3 créditos D em um curso de 2 créditos

A em um curso de 4 créditos C em um curso de 3 créditos

13) A tabela abaixo representa a distribuição continua das idades dos alunos de uma
turma de estatística.
Determine a média da idade dos alunos.

14) (CESPE/TCU) Considere a distribuição de frequência dos tempos de auditoria:

Determine:
a. O intervalo de classe modal .
b. O tempo médio de auditoria.

15) Uma pequena estamparia comprou uma nova máquina para efetuar cortes automáticos de
peças de tecido com comprimentos padronizados. Porém, devido às diferentes características
dos tecidos empregados, a máquina não faz um corte exato da medida “pedida”, provocando
uma variação no tamanho das peças cortadas. A tabela abaixo ilustra a frequência absoluta de
cortes, ao longo de um dia, que a máquina fez quando esteve ajustada para produzir peças entre
140 cm e 160 cm. Calcular um valor para a média aritmética desse conjunto de dados.

Resposta de alguns exercícios:


1. a) Média: 5,35 Mediana: 4,8 Moda: 4,8
b) Mediana, uma vez que existe um dado estranho na amostra (8,57 segundos)

2. a) Média: 170,63 Mediana: 169,3 Moda: não existe


b) Média, não há dados estranhos na amostra.

3. a) Média: não é possível Mediana: não é possível Moda: Nacional (704)


b) Moda.

11. 89,3
12. 2,8
13. 20,11
15. Pode-se usar o meio de cada intervalo, e multiplicá-lo pela frequência respectiva. Ao final,
divide-se pela soma das frequências
Temos:
Os percentis

Denominamos percentis os noventa e nove valores que.separam uma


série em 100 partes iguais.-

Indicamos:

porém, a fórmula

;endo k o
P,, P2>
É evidente que:

1
2
3
4
5
6
i

7
!

P32'

P5„= Md, P25 = 0, e. P75 = Qj..

CUSTOS
IRS)

450 h- 550
550 h- 650
650 h- 750
750 1- 850
850 i- 950
950 /- 1.050
1.050 h- 1. 150
ÿ99

_5_L será substituída por:


o

número de ordem do pcrcentil.

Assim, para o 27s percentil, temos:

Kxemplo:
k = 27 =» P = {*

"
27£ f
100
•'

O cálculo de um pcrcentil segue a mesma técnica do cálculo da

kl f,
100

f*

Considerando a Tabela 6. II, temos, para o oitavo percentil:

Logo:

donde:
k = 8 =>

P8 =

Ps =

CUSTOS
(RS)
150 +
100

153,2 cm
-
3,2
ÿ

4
8X40
100

0> 4
.3,2

= 150 +

II
f,
8
10
11
16
13
5
1
mediana,

F(ant)

-HJL

1 Complete o esquema para o cálculo do vigésimo percentil da distribuição:

to
4
= 150 + 3,2 = 153,2

F,
8
18 <-
29
45
58
63
64
RESOLVA

450 t- 550 I- 650 I- 750 I- 850 I- 950 t- 1.050 t- 1.150

8 10 11 16 13

<Pj

isto e:
1* =

P,„ =
...
k = 20 => 201 f' = 20 x
100

....

P20 = RS 598
100
F(ant) =
(.... -

.... X ....
.
....)
f*
....
-ÿ _
h* =
ÿ•••

100
...

38
EXERCÍCIOS
1 Considerando os conjuntos de dados:
a. 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 c. 51,6; 48,7; 50,3; 49,5; 48,9
b. 20, 9, 7, 2, 12, 7, 20, 15, 7 d. 15, 18, 20, 13, 10, 16, 14
calcule:
I. a média; II. a mediana; III. a moda.

2 Os salários-hora de cinco funcionários de uma companhia são:


RS 75, RS 90, RS 83, RS 142 e RS 88.
Determine:
a. a média dos salários-hora;
b. o salário-hora mediano.

3 As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1;


7,2; 6,8; 8,7 e 7.2.
Determine:
a. a nota média;
b. a nota mediana;
c. a nota modal.

4 Considerando a distribuição abaixo:

X.
1
3 4 5 6 7 8
f.1 4 8 11 10 8 3
calcule:
a. a média;
b. a mediana;
c. a moda.

5 Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distri


buição:
NOTAS 2 3 4 5 6 7 8 9 10
N2 DE
1 3 6 10 13 8 5 3 1
ALUNOS
calcule:
a. a nota média;
b. a nota mediana;
c. a nota modal.

6 Determine a média aritmética de:


a. VALORES 50 60 80 90
QUANTIDADES 8 5 4 3

XI 50 58 66
f1 20 50 30

7 Determine os desvios em relação à média dos seguintes dados: 6, 8, 5, 12,


11, 7, 4, 15.
Qual a soma dos desvios?

8 Calcule a média aritmética das distribuições de frequência abaixo:

a. b.
ESTATURAS
NOTAS (cm) f,
0h2 5 150 h 158 5
2H4 8 158 1- 166 12
4 I- 6 14 166 h 174 18
6 t- 8 10 174 l- 182 27
8 I- 10 7 182 H 190 8
I= 44 I! r- O
39
c. d.
SALÁRIOS PESOS
f, f1
(RS) (kg)

500 h 700 18 145 l- 151 10


700 t- 900 31 151 h 157 9
900 t- 1.100 15 157 H 163 8
1.100 h 1.300 3 163 I- 169 6
1.300 h 1.500 1 169 h 175 3
1.500 1- 1.700 1 175 (- 181 3
1.700 h 1.900 1 181 l- 187 1

E = 70 W II O

9 Calcule a mediana de cada uma das distribuições do exercício 8.

10 Calcule a moda de cada uma das distribuições do exercício 8.

11 Calcule o primeiro e o terceiro quartis das distribuições do exercício 8.

12 Calcule o 109, o 1s, o 23s, o 15® e o 90a percentis da distribuição b do exer¬


cício 8.

13 Uma curva simétrica se caracteriza pelo seguinte atributo:


a. É assimétrica à esquerda.
b. A moda é maior que a mediana e a média.
c. A moda, a mediana e a média são iguais.
d. O desvio padrão é maior que a mediana e a moda.
e. Os decis são equivalentes à média.

14 Quatro antigos trabalham num supermercado por tempo parcial com os seguintes salários
horários:
Bill: $2,20 Tom: $2,50
Ed: $2,40 Don: $2,10
a: Determine o salário horário médio dentre os quatro.
b. Se Bill trabalha 20 horas, Ed 10 horas, Tom 20 horas e Don 15 horas numa semana, de¬
termine seus salários totais e seus salários horários médios.
c. Sc cada um trabalha 40 horas numa semana, determine o salário horário médio, e o
salário total.

Medidas de Dispersão
1 DISPERSÃO OU VARIABILIDADE
Vimos anteriormente que um conjunto de valores pode ser conveniente¬
mente sintetizado, por meio de procedimentos matemáticos, em poucos valores
representativos —
média aritmética, mediana e moda. Tais valores podem ser¬
vir de comparação para dar a posição de qualquer elemento do conjunto.
No entanto, quando se trata de interpretar dados estatísticos, mesmo aque¬
les já convenientemente simplificados, é necessário ter-se uma ideia retrospec¬
tiva de como se apresentavam esses mesmos dados nas tabelas.
Assim, não é o bastante dar uma das medidas de posição para caracterÿ
zar perfeitamente um conjunto de valores, pois, mesmo sabendo, por exem¬
plo, que a temperatura média de duas cidades é a mesma, e igual a 24°C, ain¬
da assim somos levados a pensar a respeito do clima dessas cidades. Em uma
delas poderá a temperatura variar entre limites de muito calor e de muito frio
e haver, ainda, uma temperatura média de 24° C. A outra poderá ter uma va¬
riação pequena de temperatura e possuir, portanto, no que se refere à tempera¬
tura, um clima mais favorável.
Vemos, então, que a média — ainda que considerada como um número
que tem a faculdade de representar uma série de valores —
não pode, yor si
mesma, destacar o grau de homogeneidade ou heterogeneidade que existe en¬
tre os valores que compõem o conjunto.
Consideremos os seguintes conjuntos de valores das variáveis x, y e z:
X: 70, 70, 70, 70, 70.
Y: 68, 69, 70, 71, 72.
Z: 5, 15, 50, 120, 160.
Calculando a média aritmética de cada um desses conjuntos, obtemos:
E X; 2 '350
x = -: => x = = 70
n 5
_ I y, _ 350
y = —— => y = -
= 70
Vemos, então, que os três conjuntos apresentam a mesma média arilmc-
z =ÿ z = ?50 = 70 70.

40
Entretanto, é fácil notar que o conjunto X é mais homogéneo que os
conjuntos Y e Z, já que todos os valores são iguais à média.
O conjunto Y, por sua vez, é mais homogéneo que o conjunto Z, pois há
menor diversificação entre cada um de seus valores e a média representativa.
Chamando de dispersão ou variabilidade a maior ou menor diversifica¬
ção dos valores de uma variável em torno de um valor de tendência central
tomado como ponto de comparação, podemos dizer que o conjunto X apresen¬
ta dispersão ou variabilidade nula e que o conjunto Y apresenta uma dis¬
persão ou variabilidade menor que o conjunto Z.
Portanto, para qualificar os valores de uma dada variável, ressaltando a
maior ou menor dispersão ou variabilidade entre esses valores e a sua medida
de posição, a Estatística recorre às medidas de dispersão ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, a variância, o desvio
padrão e o coeficiente de variação.

3 AMPLITUDE TOTAL

2.1. Dados não-agrupados

A amplitude total é a diferença entre o maior e o menor valor ob¬


servado
AT = x(máx.) - x(mín.)

Exemplo:
Para os valores:
40, 45, 48, 52, 54, 62 e 70

temos:
AT = 70 - 40 = 30

Logo:
AT = 30

Quando dizemos que a amplitude total dos valores é 30, estamos afirman¬
do alguma coisa do grau de sua concentração. E evidente que, quanto maior a
amplitude total, maior a dispersão ou variabilidade dos valores da variável.
Relativamente aos três conjuntos de valores mencionados no início deste
capítulo, lemos:

ATx= 70 - 70 = 0, (dispersão nula)


ATy 72 - 68 = 4
=
AT = 160 - 5 = 155

,2. Dados agrupados


2.2.2. Com intervalos de classe
.2.1. Sem intervalos de classe
Neste caso, a amplitude total é a diferença entre o limite superior da úl¬
Neste caso, ainda temos: tima classe e o limite inferior da primeira classe:
AT = x(máx.) - x(mín.) AT = L(máx.) - {(min.)

Exemplo: Exemplo:
Considerando a tabela abaixo: Considerando a distribuição abaixo:
TABELA 7.1
TABELA 7.2
X. 0 1 2 3 4 ESTATURAS
i f1
(cm)
f 1
2 6 12 7 3
1 150 i— 154 4 temos:
.nos: 2 154 i— 158 9
3 158 162 11
AT = 4 -0 =4 4 162 >- 166 00 < II

5 166 i- 170 5
Lotto: 6 170 k 174 3 Logo:

AT = 4 * = 4°
41
3 VARIÂNCIA
DESVIO PADRÃO

3.1. Introdução
Como vimos, a amplitude total é instável, por se deixar influenciar pelos
valores extremos, que são, na sua maioria, devidos ao acaso.
A variância e o desvio padrão são medidas que fogem a essa falha, pois
levam em consideração a totalidade dos valores da variável em estudo, o que
fax delas índices de variabilidade bastante estáveis e, por isso mesmo, os mais
geralmente empregados.
A variância baseia-se nos desvios em torno da média aritmética, porém
determinando a média aritmética dos quadrados dos desvios*. Assim, re¬
presentando a variância por s2, temos:

S2
_ S (x, - x)*
Ou, lembrando qiie Z n:
Lembremos que X d s 2 (x - x) = ().

NOTA:
• Quando nosso interesse não se restringe à descrição dos dados mas, partindo da
amostra, visamos tirar inferências válidas para a respectativa população, convém
-
efeluar uma modificação, que consiste em usar o divisor n 1 em lugar de n.
Podemos, ainda, com o intuito de conservar a definição, calcular a variância usan¬

do o divisor n e, em seguida, multiplicar o resultado por — ÍL- .


n 1 —
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um
número em unidade quadrada em relação à variável em questão, o que,, sob o
ponto de vista prático, é um inconveniente.
Por isso mesmo, imagino.u-se uma nova medida que tem utilidade e in-
terpretação práticas, denominada desvio padrão, definida como a raiz qua¬
drada da variância e representada por s:
s
Assim:
(X. - X)2
©
NOTA:
* Tantoja .desviopadrão como a variância são usados como medidas de .dispersão
ou variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha
em vista.
A variância é uma medida que tem pouca utilidade como estatística descritiva,
porém c extremamente importante na inferência estatística c em combinações de
amostras.

Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais
fácil a sua compreensão, ela não é uma boa fórmula para fins de computação,
pois, em geral, a média aritmética (x) é um número fracionário, o que torna
pouco prático o cálculo das quantidades (xÉ - x)2.
Podemos simplificar os cálculos fazendo uso da igualdade:
E (X. - -12 1 & Xl'J
f
xP = I)í-
/
- !—T

n
Assim, substituindo Z (x. - x)2 por seu equivalente em (T), obtemos:

-
que pode ser escrita do seguinte modo:
(I X,P

»/¥- ri)'
Não apenas este método é usualmente mais prático, como também mais
preciso. Quando a média não é exata e tem de ser arredondada, cada desvio.
1
fica afetado ligeiramente do erro, devido a esse arredondamento. O mesmo

42
acontece com os quadrados, podendo os resultados do cálculo ser menos exa-
do que quando a fórmula (2) é usada.
tos
O desvio padrão goza de algumas propriedades, dentre as quais destaca¬
mos:

Is) Somando-se (ou subtraindo-se) uma constante a (de) todos os va¬


lores de uma variável, o desvio padrão não se altera:
y. = x, ± c => sy = sK

2a) Multiplicando-se todos os valores de uma variável por uma cons¬


tante (diferente de zero), o desvio padrão fica multiplicado por
essa constante:
y'l = c X x. => s =
V
cxs
' *

Essas propriedades nos permitem introduzir, no cálculo do desvio padrão,


simplificações úteis, como veremos mais adiante.
Para o cálculo do desvio padrão, consideremos os seguintes casos:

3.2. Dados não-agrupados


Tomemos, como exemplo, o conjunto de valores da variável x:
40, 45, 48, 52, 54, 62, 70

O modo mais prático para se obter o desvio padrão é formar uma tabela
com duas colunas: uma para x.t e outra para xr. Assim:
TABELA 7.3
X, xj
40 1.600
45 2.025
48 2.304
52 2.704
54 2.916
62 3.844
70 4.900
I= 371 Z = 20.293

Como n = 7, temos:

s =y20 7293- - 1 J = >/ 2.899 - 532 =

= 72.899 - 2.809 = /ÕÕ = 9,486


Logo:
s = 9 49
RESOLVA
1 Complete o esquema para o cálculo do
desvio padrão, dados os valores da
variável:
8, 10, 11, 15, 16, 18
Temos:

x, X2
8 64

n = .... V
_ l= ....
Logo:

s=M.-(z7. J' "

= =
isto é: s = 3,56
43
3. Dados agrupados
"1.1. Sem intervalos de classe

Como, neste caso, lemos a presença de


isideração, resultando a fórmula:

s JUaL-lEXtf
V \ n
. .

n
. ...
freqiicncias, devemos levá-las em

RESOLVA
Logo:
• •

Consideremos, como exemplo, a distribuição da Tabela


O modo mais prático para se obter o desvio padrão é abrir/na tabela dada,
uma coluna para os produtos f.x. e outra para f.x;1, lembrando que para obter
fx: basta multiplicar cada f.x. pelo seu respectivo

s =
X.1

0
1
2
3
4
ÿ

'165
30
M U

j
2
6
12
7
3
xr Assim:

f.

CO o

=
TABELA

J5,5 - 4,41
f.x.
1

0
6
24
21
12
II
1

CO CO

=
fxzi
i

0
6
48
63
48

Z = 165

7l,09
Dai:
= 1,044
s = 1,04

Complete o esquema para o cálculo do desvio padrão da distribuição:

Temos:

f.x, 'X
7
2 Logo:
3
4
5 =y/7Z. - .... - vC7 = ....,
6
isto é:
X = .... X = .... x =
s = 1,24
3.3.2. Com intervalos de classe

Tomemos como exemplo a distribuição da Tabela .


Começamos por abrir as colunas para x. (ponto médio), para f x e para
I x:. Assim:

TABELA
ESTATURAS
'
1 150 f—
(cm)

154
f.
1

4 152
X.

608
fx21
1

92.416
2 154 h- 158 9 156 1.404 219.024
3 158 i- 162 11 160 1.760 281.600
4 162 h 166 8 164 1.312 215.168
5 166 h 170 5 168 840 141.120
6 170 i- 174 3 172 516 88.752
X = 40 X = 6.440 X = 1.038.080

Logo:

1.038.080 6.440
s = = V 25.952 - 25.921 = /Tl = 5,567
40 40

Daí:
44
II - Medidas de Variação

1) Obtenha a amplitude total, a média, a variância e o desvio padrão do conjunto de dados a


seguir.

a) 11 10 8 4 6 7 11 6 11 7

b) 15 8 12 5 19 14 8 6 13

2) Amostras de salários anuais, em milhares de dólares, dos funcionários públicos


municipais de Los Angeles e Long Beach estão relacionados a seguir.

Los Angeles: 20,2 26,1 20,9 35,9 23,0 28,2 31,6 18,3
Long Beach: 20,9 18,2 20,8 21,1 26,5 26,9 24,2 25,1

a) Obtenha a amplitude total, a média, a variância e o desvio padrão de cada um dos


conjuntos de dados
b) Compare as duas cidades (média salarial e desvio padrão).

3) Amostras de salários anuais, em milhares de dólares, para professores das escolas


públicas e privadas estão relacionados a seguir.

Professores da rede Pública: 38,6 38,1 38,7 36,8 34,8 35,9 39,9 36,2
Professores da rede Privada: 21,8 18,4 20,3 17,6 19,7 18,3 19,4 20,8

a) Obtenha a amplitude total, a média, a variância e o desvio padrão de cada um dos


conjuntos de dados
b) Compare as duas redes de ensino (média salarial e desvio padrão).

4) Akhiok é uma pequena vila pesqueira na ilha de Kodiak, Alasca. O censo a seguir
representa os dados etários declarados de toda a população dos 77 habitantes de Akhiok,

28, 6, 17, 48, 63, 47, 27, 21, 3, 7, 12, 39, 50, 54, 33, 45, 15, 24, 1, 7, 36, 53, 46, 27, 5, 10,
32, 50, 52, 11, 42, 22, 3, 17, 34, 56, 25, 2, 30, 10, 33, 1, 49, 13, 16, 8, 31, 21, 6, 9, 2, 11, 32,
25, 0, 55, 23, 41, 29, 4, 51, 1, 6, 31, 5, 5, 11, 4, 10, 26, 12, 6, 16, 8, 2, 4, 28.

Usando a tabela de distribuição de frequência obtida na lista anterior determine a média e o


desvio padrão do conjunto de dados. Utilize as seguintes fórmulas:

x
x f e s
(x  x)  f
n n 1

5) Contou-se o número de erros de impressão das 3 primeiras páginas de um jornal durante


50 dias, e um software específico registrou esses dados na forma de diagrama ramo-e-folhas.
a) O valor 13 ocorreu apenas uma vez. A chance de que ele ocorra novamente é alta ou
baixa? Justifique sua resposta.
b) Faça a mesma análise para o dado 22.
c) Suponha que o dado 22 ocorreu em certo dia em que houve muitos problemas no processo
de impressão desse jornal. Exclua esse dado do conjunto todo, e recalcule a média
aritmética.
d) Determine a nova média sem o dado 22, supondo que você não conhece os dados, mas
apenas a média de 10,4.

6) Sem calcular, qual é o conjunto com o maior desvio padrão amostral? Qual tem o menor
desvio padrão amostral? Explique seu raciocínio.

7) O valor médio de terras e construções por acre de uma amostra de fazendas é de US$
1.000, com desvio padrão de US$ 200. O conjunto de dados tem uma distribuição em forma
de sino. Estime a porcentagem de fazendas cujos valores das terras e construções por acre
estão entre US$ 800 e US$ 1.200.

8) Usando a estatística amostral do exercício anterior, faça o seguinte. (Suponha que o


número de fazendas na amostra é de 75.)
(a) Use a Regra Empírica para estimar o número de fazendas cujo valor das terras e
construções por acre está entre US$ 800 e US$ 1.200.
(b) Se outras 25 fazendas fossem amostradas, em quantas delas você esperaria encontrar os
valores das terras e construções entre US$ 800 e US$ 1.200 por acre?

,
9) Os resultados de uma amostra aleatória do número de bichos de estimação por família em
uma região estão no histograma a seguir. Estime a média e o desvio padrão amostrais no
conjunto de dados.
10) No gráfico de blocos a seguir, vemos a quantidade de cafeína em uma amostra de
porções de café com cinco onças cada. Faça urna distribuição de freqüência para os dados.
Use então a tabela para estimar a média e o desvio padrão amostrais do conjunto de dados.
(Adaptado do Complete Food and Nutrition Guide da American Dietetic Association)

11) A distribuição estimada (em milhões) da população dos Estados Unidos por idade para o
ano 2006 está disposta no gráfico circular a seguir. Faça uma distribuição de freqüência para
os dados. Use então a tabela para estimar a média e o desvio padrão amostrais do conjunto
de dados. Use 70 corno ponto médio para "65 anos ou mais" (Fonte: US Censos Bares-tu)
Resposta de alguns exercícios

1. a)Amplitude total = 7; Média =8,1; Variância = 5,69; Desvio padrão =2,39


b)Amplitude total = 14; Média =11,11; Variância = 21,61; Desvio padrão =4,65

2. a)17,6; 37,35; 6,11;


8,7; 8,71; 2,95
b) Os salários anuais em Los Angeles são mais variáveis que os de Long Beach.

5. (a) O valor Z para esse dado é 0.679218, ou seja, está no primeiro intervalo da regra
empírica, o qual concentra a maior parte dos dados. Logo, não é difícil a ocorrência do
dado 13 novamente.
(b) O dado 22 é discrepante (valor Z = 3.030357), ou seja, é uma ocorrência anormal. Isso
nos leva a concluir que é bastante provável que as condições desse dia (o dia em que
ocorreram 22 erros) não eram as mesmas que a maioria dos outros dias (funcionários
podem ter faltado, máquinas podem ter quebrado, o prazo para a execução do serviço foi
pequeno etc).
(c) 10,16 erros
(d) 10,16 erros (monte uma equação do 1º grau)

6) a) O maior desvio padrão amostral é (ii). O conjunto de dados (ii) tem entradas que estão
mais distantes da média.
Menor desvio padrão é (iii). Tem o maior número de entradas próximos da média.

7) 68%

8) (a) 51 (b) 17

9) 24

10) Média =2,075; DP= 1,328


4. Processo breve
Baseados na mudança da variável x por outra y, tal que:

Vi - x; - x„

ÿelasmesmas razões expostas para o eálculo da média, podemos ohlei uni.

icesso breve de eáleulo, com a aplicaçao da seguinte lóimula.

Fases para o cálculo do desvio padrão pelo processo breve:


Is) Abrimos uma coluna para os valores x. (ponto médio),
/

2S) Escolhemos ura dos pontos médios (de preferência o de maior fre¬
1
quência) para valor de x0. "
,1,
'

3S) Abrimos uma coluna para os valores de y. e escrevemos zero na li¬


nha correspondente à classe onde se encontra o valor de x0; a sequên¬
cia -1, -2, -3, logo acima de zero, e a sequência 1, 2, 3, ..., logo
abaixo.
4a) Abrimos uma coluna para os valores do produto fy., conservando os
sinais + ou -, e, em seguida, somamos algebricamente esses produ¬
tos.
5a) Abrimos uma coluna para os valores do produto fy.2, obtidos multi¬
plicando cada fy pelo seu respectivo y., e, em seguida, somamos
esses produtos.
6a) Aplicamos. a fórmula.,: ?, • , - -v.

Assim, para a distribuição da Tabela temos, completando com as


dunas para x., y., fy, e Fy,2:

TABELA
ESTATURAS V2
f i»i
i
(cm)
f. *, V. f.Vi
1 150 i- 154 4 152 -2 -8 16
2 154i- 158 9 156 -1 -9 9
3 158 h 162 11 160 0 0 0
4 162 h 166 8 164 1 8 8
5 166 h 170 5 168 2 10 20
6 170 i- 174 3 172 3 9 27
I

h=4 I= 40 M II O I= 80

Loao:

s = 4 (80
40
— r = 4 y/2 - 0,0625 = 4 Vl,9375 = 4
40 J
1,3919 = 5,5676

Daí: s = 5,57 cm

...
RESOLVA
1 Complete o esquema para o cálculo do desvio padrão
da distribuição, pelo
processo breve:

CLASSES 30 1- 50 l- 70 r- 90 t- 110 t- 130


f, 2 8 12 10 5
.os:

fy, (yf Logo:


7 40
2
3
4
/z-tf .... v.... - l..)2 = .... v/.... - .... = .... vC: =

5
h= .... I= L= isto é:

s = 21,88
45
4 COEFICIENTE DE VARIAÇÃO
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio
padrão de duas unidades pode ser considerado pequeno para uma série de va¬
lores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo
não pode ser dito. Alem disso, o fato de o desvio padrão ser expresso na mes¬
ma unidade dos dados nmita o seu emprego quando desejamos comparar duas
ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quan¬
do expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a
dispersão ou variabilidade dos dados em termos relativos a seu valor médio,
medida essa denominada coeficiente de variação (CV);

CV =-ÿ-x 100
x

Kxeniplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um
mesmo grupo tie indivíduos:

X s
ESTATURAS 175 cm 5,0 cm
PESOS 68 kg 2,0 kg

Temos:

CV,E = —
175
X 100 = 0,0285 X 100 = 2,85%

CVp = — X 100 = 0,0294 X 100 = 2,94%


68

Logo. nesse grupo de indivíduos, os pesos apresentam maior grau de dis¬


persão que as estaturas.

EXERCÍCIOS

1 Calcule a amplitude total dos conjuntos de dados:


a. 1, 3, 5, 9 c. 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
b. 20, 14, 15, 19, 21, 22, 20 d. -10, -6, 2, 3, 7, 9, 10

2 Calcule a amplitude total das distribuições:


a.
8

f. 1

b.
CLASSES 1,5 l- 1,6 w 1,7 H 1,8 h 1,9 h 2,0 h 2,1 i- 2,2

f. 4 8 12 15 12 8 4

3 Calcule os desvios padrões dos conjuntos de dados do exercício 1.

4 Calcule os desvios padrões das distribuições do exercício 2.

5 Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamen¬


te:

N° DE CARAS 0 1 2 3 4 5
FREQUÊNCIAS 4 14 34 29 16 3

calcule o desvio padrão.

46
6 Calcule o desvio padrão da distribuição:

CLASSES 2 6 t— 10 h 14 r- 18 i- 22
f, 5 12 21 15 7

7 Calcule os desvios padrões das distribuições do exercício 8, cap. 6, p. 107.

8 Sabendo que um conjunto de dados apresenta para média aritmética e para


desvio padrão, respectivamente, 18,3 e 1,47, calcule o coeficiente de varia¬
ção.

9 Em um exame final de Matemática, o grau médio de um grupo de 150 alu¬


nos foi 7,8 e o desvio padrão, 0,80. Em Estatística, entretanto, o grau mé¬
dio final foi 7,3 e o desvio padrão, 0,76. Em que disciplina foi maior a dis¬
persão?

10 Medidas as estaturas de 1.017 indivíduos, obtivemos x = 162,2 cm e


s = 8,01 cm. O peso médio desses mesmos indivíduos é 52 kg, com um
desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade
em estatura ou em peso?

11 Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio


padrão igual a 5,97 cm. Outro grupo de 125 moças tem uma estatura mé¬
dia de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente
de variação de cada um dos grupos? Qual o grupo mais homogéneo?

12 Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com
um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo?

13 Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%.


Determine a média da distribuição.

Outras Medidas

As medidas discutidas até aqui se aplicam principalmente a dados quantitativos, com exceção da
moda, que também é útil para o trabalho com dados nominais, como veremos em breve. Outra
medida usada com dados nominais é a proporção, que é a fração, ou percentagem de itens de
determinado grupo ou classe. A proporção se calcula mediante a fórmula
x
proporção =—

onde x é o número de itens que apresentam determinada característica, e n o número total de


observações. ,:
Por exemplo, se num grupo de 40 pessoas 10 têm casa própria dizemos que a proporção dos
que a têm é de 10/40 = 0,25, ou 25%. j Converta em proporção cada um dos seguintes dados:
a. 5 crianças em 25
b. 7 pacientes em 9
EXERCÍCIOS q. 3 vermelhos, 4 azuis e 5 verdes em 12 dados
2. Calcule cada uma das seguintes proporções usando a tabela da Figura

.;
'
y .'.a-: '.. vru.
*
:.\ Í'if
* . Õ Tempo em Junho. : U •'ÿ'y.S :i?
v"u.'"VS- 7" ,*}- ' ' 1 "I •*. .'«•*. -* «• " 1 •' i- *!•. -» ÿ

D S T Q Q
V.
1 r

2 3 A M:4
ijõ"'
fMI?: O & .
<0>
i ÿ

ôô
i

•:
I m-
5 D 7 8 V 10 11
a4 <0 ô4 o ôô
ir; i
'X £ 12 CO iA
17 lo lo 17 18 WT#fí
oo-
ÿ\
à

O
«Jk CO 20
ô4
91
.4
•í— 22
o
to# (O
CD
24 25 {-.ÿÿli",-

.ÿX.-ygi&V.:)
26 27 28 29 30 m
-...> -s; '$ ji •'
•' < »» y FSi

I?MA/\1f«vAÿA PornialiYinnfí» . WiiWo/Ia

O te moo em
47
iunho.
Probabilidade
1 INTRODUÇÃO

As origens da matemática da probabilidade remontam ao século XVI. As aplicações iniciais


referiam-se quase todas a jogos de azar. Os jogadores ricos aplicavam o conhecimento da teoria
das probabilidades para planejar estratégias de apostas. Mesmo hoje ainda há muitas aplicações
que envolvem jogos de azar, tais como os diversos tipos de loteria, os cassinos de jogos, as corridas
de cavalos e os esportes organizados. Todavia, a utilização das probabilidades ultrapassou de
muito o âmbito desses jogos. Hoje os governos, as empresas, as organizações profissionais incor¬
poram a teoria das probabilidades em seus processos diários de deliberações.
Independente de qual seja a aplicação em particular, a utilização das probabilidades indica
que existe um elemento de acaso, ou de incerteza, quanto à ocorrência ou não de um evento
futuro. Assim é que, em muitos casos, pode ser virtualmente impossível afirmar por antecipação o
que ocorrerá; mas é possível dizer o que pode ocorrer. Por exemplo, se jogarmos uma moeda para
o ar, de modo geral não podemos afirmar se vai dar cara, ou coroa. Além disso, mediante deter¬
minada combinação de julgamento, experiência e dados históricos, em geral é possível dizer quão
provável é a ocorrência de determinado evento futuro.
Há numerosos exemplos de tais situações no campo dos negócios e do governo. A previsão
da procura de um produto novo, o cálculo dos custos de produção, a previsão de malogro de
safras, a compra de apólices de seguro, a contratação de um novo empregado, o preparo de
um orçamento, a avaliação da reação de governos estrangeiros a uma mudança em nossa política de
defesa, a avaliação do impacto de uma redução de impostos sobre a inflação — tudo isso contém
algum elemento de acaso.
As probabilidades são úteis porque auxiliam a desenvolver estratégias. Assim é que alguns
motoristas parecem demonstrar uma tendência para correr a grande velocidade se acham que
há pouco risco de ser apanhados; os investidores sentem-se mais inclinados a aplicar seu dinheiro se
as chances de lucro são boas; e o leitor certamente carregará capa ou guarda-chuva se houver
grande probabilidade de chover. Analogamente, uma empresa pode sentir-se inclinada a negociar
seriamente com um sindicato quando há forte ameaça de greve; mais inclinada a investir em
novo equipamento se há boa chance de recuperar o dinheiro; ou a contratar um novo funcionário
que pareça promissor, etc.
0 ponto central em todas essas situações é a possibilidade de quantificar quão provável é
determinado evento. Este capítulo apresenta definições e regras para a obtenção de probabilidades.

48
49
Exemplo 4

Usando a regra da adição para encontrar probabilidades

Um banco de sangue cataloga os tipos de sangue, incluindo fator Rh positivo ou negativo, dado
por doadores durante os últimos cinco dias. O número de doadores que doou cada tipo
sanguíneo é mostrado na tabela a seguir. Um doador é selecionado aleatoriamente.

1. Encontre a probabilidade que o doador tenha sangue tipo O ou tipo A.


2. Encontre a probabilidade que o doador tenha sangue tipo B ou que o Rh seja negativo.

Tipo Sanguíneo

O A B AB Total

Positivo 156 139 37 12 344

Fator Rh Negativo 28 25 8 4 65

Total 184 164 45 16 409

Solução

1. Como o doador não pode ter o tipo O e o tipo A, esses eventos são mutuamente
exclusivos. Então, com base na regra de adição, a probabilidade que o doador
escolhido aleatoriamente tenho o tipo O ou tipo A é:

P(tipo O ou tipo A)= P(tipo O) + P (tipo A)


184 164
= +
409 409
348
=
409
≈ 0,851.
2. Em razão de o doador poder ter tipo B e seu Rh ser negativo, esses eventos não
são mutuamente exclusivos. Então, com base na regra da adição, a
probabilidade de que um doador escolhido aleatoriamente tenha sangue tipo B
ou que seu Rh seja negativo é:
P(tipo B ou Rh-)= P(tipo B) + P (Rh-)- P(tipo B e Rh-)
45 65 8
= + −
409 409 409
102
=
409
≈ 0,249.
50
51
52
53
54
55
56
57
TABELA 2
NÚMERO DE FREQUÊNCIAS
ACIDENTES
0 22
1 5
2 2
3 1
I= 30

Em um dia, a probabilidade de:

— não ocorrer acidente é:


22
p =— = 0,73
30

— ocorrer um acidente é: Podemos, então, escrever:

p= JL= o,17 TABELA 2.1


30
NÚMERO DE
PROBABILIDADES
ACIDENTES
— ocorrerem dois acidentes é:
Ó 0,73
1 0,17
p = —
30
= 0,07 2 0,07
3 0,03
I= 1,00
— ocorrerem três acidentes é:
Essa tabela é denominada distribuição de probabilidade.
p «v— = 0,03
30

Seja X uma variável aleatória -'-que' pode assumir os valores :x,, XjP
x3, xn. A cada valor x. correspondem pontos do espaço amostrai/As¬
sociamos, então, a cada valor x/a probabilidade p. de ocorrência de tais
pontos no espaço amostrai//: / • ÿ

' .
Assim, temos: ; •: •:/.•- '.,••/ f»
£4 I---'-
Os valores x|( x2, xn
e seus correspondentes p,, p2, pn defi¬
nem uma distribuição de probabilidade.

Assim, voltando à Tabela 1 , temos:

TABELA 1.1
PONTO
X P(X)
AMOSTRAL
(Ca, Ca) 2 1/2 X 1/2 = 1/4
(Ca, Co) 1 1/2 X 1/2 = 1/4 1
+
(Co,
(Co,
Ca)
Co)
1
0
1/2 X 1/2 = 1/4 J
1/2 X 1/2 = 1/4
" " '
Logo, podemos escrever:

TABELA 1.2 Ao definir a distribuição de probabilidade, estabelecemos uma correspon¬


NÚMERO DE PIX)
dência unívoca entre os valores da variável aleatória X e os valores da variá¬
CARAS (X) vel P. Esta correspondência define uma função; os valores x. (i = 1,2, ..., n)
2 1/4 formam o domínio da função e os valores pi (i = 1,2, 3, ..., n), o seu con¬
1 2/4 junto imagem.
0 1/4
Essa função, assim definida, é denominada função probabilidade e re¬
Z= 1 presentada por:

f(x) = P(X = x,)

A função P(X = x.) determina a distribuição de probabilidade da varia-


vel aleatória X.
58
Assim, ao lançarmos um dado, a variável aleatória X, definida por "pon¬
tos de um dado", pode tomar os valores 1, 2, 3, ..., 6.
Como a cada um destes valores está associada uma e uma só probabili¬
dade de realização e X P(x.) = 1, fica definida uma função de probabilidade,
da qual resulta a seguinte distribuição de probabilidade:

TABELA 3
X P(X>

1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
X = 1

3 DISTRIBUIÇÃO BINOMIAL
Vamos, neste item, considerar experimentos que satisfaçam as seguintes
condições:
a. O experimento deve ser repetido, nas mesmas condições, um número
finito de vezes (n).
b. As provas repetidas devem ser independentes, isto é, o resultado de
uma não deve afetar os resultados das sucessivas.
c. Em cada prova deve aparecer um dos dois possíveis resultados: suces¬
so e insucesso.
d. No decorrer do experimento, a probabilidade p do sucesso e a proba¬
bilidade q (q = 1 - p) do insucesso manter-seTão constantes.
Resolveremos problemas do tipo: determinar a probabilidade de se obte¬
rem k sucessos em n tentativas.
O experimento "obtenção de caras em cinco lançamentos sucessivos e
independentes de uma moeda" satisfaz essas condições.
Sabemos que, quando da realização de um experimento qualquer em uma
única tentativa, se a probabilidade de realização de um evento (sucesso) é p, a
probabilidade de não-realizaçâo desse mesmo evento (insucesso) é 1 - p = q.
Suponhamos, agora, que realizemos a mesma prova n vezes sucessivas e
independentes. A probabilidade de que um evento se realize k vezes nas pro¬
vas é dada pela função:

f(X) = P(X p k) ,=
jpkq""k

na qual:
P(X = k) é a probabilidade de que o evento se
realize k vezes em n provas;
p é a probabilidade de que o evento se realize em
uma só prova
q e a probabilidade de que o evento não se realize no

sucesso;
decurso dessa prova —
insucesso;
"k 1) é o coeficiente binomial de n sobre k, igual a _ "!
k!(n - k)! * "
Essa função, denominada lei binomial, define a
distribuição binomial.
NOTA:
• O nome binomial vem do fato de
mento do binómio de Newton.
f " )' pk
k
q-k ser o termo geral do desenvolvi¬

59
60
EXERCÍCIOS RESOLVIDOS

1 Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a probabi¬


lidade de serem obtidas 3 caras nessas 5 provas.


Temos:
n=5 e k =3
Pela lei binomial, podemos escrever:
P(X = 3) =
(5)
p3qs-3= (5J
pW

Se a probabilidade de obtermos "cara" numa só prova (sucesso) é p = y


e a probabilidade de não obtermos "cara" numa só prova (insucesso) é
q= 1 =y
- então:

5X4X3X2X1 5
3X2X1X2X1 8 4 16
Logo:

P(X = 3) = —
16

2 Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilida¬


de de o time A ganhar 4 jogos.
Temos:

n = 6, k = 4, p = —1 e q - 1 - —1 = —2
Então:

"•-"-('Mt!-'**-**?- 243
20

Logo:

P(X = 4) = —
243

EXERCÍCIOS
1 Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de
uma moeda.
2 Jogando-se um dado três vezes, determine a probabilidade de se obter um
múltiplo de 3 duas vezes.
3 Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilida¬
de de o time A:
a. ganhar dois ou três jogos;
b. ganhar pelo menos um jogo.
2

4 A probabilidade de um atirador acertar o alvo é . Se ele atirar 5 vezes, qual a
probabilidade de acertar exatamente 2 tiros?
5 Seis parafusos são escolhidos ao acaso da produção de certa máquina, que
apresenta 10% de peças defeituosas. Qual a probabilidade de serem defei¬
tuosos dois deles?

4 DISTRIBUIÇÃO NORMAL
CURVA NORMAL
Entre as distribuições teóricas de variável aleatória contínua, uma das
mais empregadas é a distribuição normal.
Muitas das variáveis analisadas na pesquisa socioeconómica correspon¬
dem à distribuição normal ou dela se aproximam.
O aspecto gráfico de uma distribuição normal é o da Fi

x 61
62
63
64
65
66
EXERCÍCIOS
Sendo Z uma variável com distribuição normal reduzida, calcule:
a P(0 < Z < 1,44) e. P(Z > -2,03)
b. P(-0,85 < Z < 0) f. P(Z > 1,08)
c. P(— 1,48 < Z < 2,05) g. P(Z < -0,66)
d. P(0,72 < Z < 1,89) h. P(Z < 0,60)

com média
2 Um teste padronizado de escolaridade tem distribuição normal
100 e desvio padrão 10. Determine a probabilidade de um indivíduo subme¬
tido ao teste ter nota:
a. maior que 120;
b. maior que 80;
c. entre 85 e 115;
d. maior que 100.
média 65,3 kg
3 Os pesos de 600 estudantes são normalmente distribuídos com
e desvio padrão 5,5 kg. Determine o número de estudantes que pesam:

a. entre 60 e 70 kg;
b. mais que 63,2 kg;
c. menos que 68 kg.
850 dias e des¬
4 A duração de um certo componente eletrônico tem média de
que a duração é normalmente distribuída,
vio padrão de 40 dias. Sabendo
calcule a probabilidade de esse componente durar:
a. entre 700 e 1.000 dias; ,
b. mais de 800 dias;
c. menos de 750 dias.

RESPOSTAS

3. b)6 c) 12 d) 7
2. a) 5 vezes b) 11 vezes o) 20% 1)16% 0)52%.
c)20% d) 45%

5- a. 40 c. 2; 7; 19; 29; 37; 40


b. 0,05; 0,125; 0,3; 0,25; 0,2; 0,075 d. 0,05; 0,175; 0,475; 0,725; 0,925; 1,000

8- a. 900c. 1.000 e. 100 g. 0,155 i. 194 I. 29,5% n. 78% p. i = 5


b. 800 d. 950 f. 76 h. 262 j. 138 m. 19% o. i = 3

b.

COEFICIENTE
LIQUIDEZ
14 -
0,0 h 3,0 ÿ
3,0 l- 6,0
12 -
14
6,0 K 9,0 11 ,01
9,0 I- 12,0 8 8 -
12,0 H 15,0 3 6-
15,0 h 18,0 4
18,0 1- 21,0 1
I= 50
3,0 6.0 9,0 12,0 15,0 18,0 21,0 Coof. liq.

MEDIDAS DE POSIÇÃO

1. a. x = 5,1; Md = 5; Mo = 5 c. x = 49,8; Md = 49,5; $ Mo


b. x = 11; Md = 9; Mo = 7 d. x = 15,1; Md = 15; t Mo
2. a. R$ 96 b. R$ 88
3. a. 7,9 b. 7,8 c. 7,2
4. a. 5,4 b. 5 c. 5
5. a. 5,9 b. 6 c. 6
6. a. 64,5 b. 58,8
7. -2,5; -0,5; -3,5; 3,5; 2,5; -1,5; -4,5; 6,5
8. a. 5,3 b. 172,4 cm c. RS 843 d. 159,4 kg
9. a. 5,3 . . b..174 cm c. R$:810 d. 157,8 kg

67
10. a. 5 b. 178 cm c. R$ 800 d. 148 kg
11. a. 3,5 e 7,2 b. 166,2 cm e 179,2 cm c. RS 694 e R$ 947 d. 151 kg e 166 kg
12. P,0 = 159,3 cm P, = 151,1 cm PJ3 = 165,4 cm P,6 = 161,7 cm
Pm = 183 cm

13. c

14- a. $2,30 b. (1) 149,5 (2) 2,30 c. (1) $2,30 (2)$ 368

F 65 MEDIDAS DE DISPERSÃO OU DE
VARIABILIDADE

1. a. 8 b. 8 c. 9,2 d. 20

2. a. 6 b. 0,7

3. a. 2,96 b. 2,81 c. 3,016 d. 7,04

4. a. 1,51 b. 0,159
5. 1,13

6. 4,45

7. a. 2,43 b. 8,8 cm c. R$ 229 d. 9,93 kg

8. 8,03%

9. Estatística

10. estatura

11. 3,72% e 3,71%, respectivamente; o segundo grupo

12. 5,41

13. 51,7

1- a. 5/25 ou 0,20 b. 7/9 = 0,78 c. 3/12 ou 0,25, 4/12 ou 0,33, 5/12 ou 0,42
2 a. 15/10 ou 0,5 b. 3/30 ou 0,10 c. 0/4 ou 0 d. 2/22 ou 0,091 e. 0

FloL. PROBABILIDADE

1. a. —
2
b. —
13
c. —41 "D |
CO
00
i

5 d. _5_
2. a.—
12
b.A-
9
c.
12
— 18

-j
3. a. —41 b. J.
2
4. -L
13
19
5. a. —
11
b. —
33
c.
r33

6.JL
3
7. a.—
221
b. —
663

o 1
b. i-
T 8

9. a.— b.i- c. —38 d. —8 e. f.±


2
8 8
25
10. a.— b.-l c. —
36
d. —
36
6 6

11. a.— b.i C.


3
-T- d. 2-
50 2 5 5
19
12
a'T
1
b.±
11
c. —
33

13-
a"4 b; —
12

14. a.—
8
b.i 8
c.
3

4

68
75. a.| b. -1 97
d.±
120 8
16. a.—
7
b. —
DISTRIBUIÇÕES BINOMIAL E
NORMAL

400 665 4 5. 9,8415%


1.-L
16
2. —9 3. a.
729 729 243

c. 0,9104 e. 0,9788 g. 0,2546


1. a. 0,4251
b. 0,3023 d. 0,2064 f. 0,1401 h. 0,7258

2. a. 0,0228 b. 0,9772 c. 0,8664 d. 0,5


3. a. 0,6338 b. 0,6480 c. 0,6879
4. a. 0,9998 b. 0,8944 c. 0,0062

ANEXO I

ÁREA SUBTENDIDA PELA


CURVA NORMAL REDUZIDA DE 0 A Z
o z

z 0 1 •2 3 4 ÿ5' 6 7 8 9

AO' 0,0000 0,0040 0,0080. 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 , 0398 0438 0478 0517 0557 0596 0636 0675 0714 0754
o,?: 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141
0,3 ' 1179 1217 1255 1293 1331 1368 1406 1443 1480 1517
•0,4> 1554 1591 1628 1664 1700 1736 1772 1808 1844 1879

;0,,54 1915 1950 191 j 2019 2054 2088 2123 2157 2190 2224
'0,6 2258 2291 2324 2357 2389 2422 2454 2486 2518 2549
0,7 2580 2612 2642 2673 2704 2734 2764 2794 2823 2852
0,8, 2881 2910 2939 2967 2996 3023 3051 3078 3106 3133
P-9. 3159 3186 3212 3238 3264 3289 3315 3340 3365 3389
V'
1,0!. 3413 3438 3461 3485 3508 3531 3554
1-3
• •; 3577 3599 3621
i,i-; 3643 3665 3686 3708 3729 3749 3770 3790 3810 3830
1,2 3849 3869 3888 3907 3925 3944 3962 3980 3997 4015
1,3 4032 4049 4066 4082 4099 4115 4131 4147 4162 4177
1,4 4192 4207 4222 4236 4251 4265 4279 4292 4306 4319
1,6' 4332 4345 4357 4370 4382 4394 4406 4418 4429 4441
1-6 4452 4463 4474 4484 4495 4505 4515 4525 4535 4545
1,7 4554 4564 4573 4582 4591 4599 4608 4616 4625 4633
1,8 4641 4649 4656 4664 4671 4678 4686 4693 4699 4706
1,9 4713 4719 4726 4732 4738 4744 4750 4756 4761 4767
4772 4778 4783 4788 4793 4798 4803 4808
v'v*
2,1 4821 4826 4830 4834 4838 4842 4846 4850
4312 4817
4854 4857
2,2 ' 4861 4864 4868 4871 4875 4878 4881 4884 4887 4890
2,3 4893 4896 4898 4901 4904 4906 4909 4911 4913 4916
2,4? 4918 4920 4922 4925 4927 4929 4931 4932 4934 4935
.2,53 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952
,2,6- 4953 4955 4956 4957 4959 4960 4961 4962 4963 4961
2,7f 4965 4966 4967 4968 4969 4970 4971 4972 4973 4974
4974 .975 4976 4977 4977 4978 4979 4979 4980 4981
4981 4982 4982 4983 4984 4984 4985 4985 4986 4986
!3,0> 4987 4987 4987 4988 4988 4989 4989 4989 4990 4990
4990 4991 4991 4991 4992 4992 4992 4992 4993 4993
4993 4993 4994 4994 4994 4994 4994 4995 4995 4995
3,3? 4995 4995 4995 4996 4996 4996 4996 4996 4996 4997
3,4? 4997 4997 4997 4997 4997 4997 4997 4997 4997 4998
3,5? 4998 4998 4998 4998 4998 4998 4998 4998 4998 4958
M
3,7_
4998
4999
4998
4999
4999
4999
4999
4999
4999
4999
4999
4999
4999
4999
4999
4999
4999
4999
4999
4999
3,8 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999
3.9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0.5000 0,5000

69
Lista de Exercicícios
Probabilidade

Distribuição de Probabilidade Binomial

Qual é a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52


cartas?-
) 1
Em lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça. calcule
a) a de essa peça ser defeituosa.
2) b) a probabilidade
probabilidade de essa peça não ser defeituosa.
3) No lançamento de dois dados, calcule a probabilidade de'
a) obter soma igual a 5.
b) soma igual a 7.
c) a soma ser 10 ou maior que 1 0

responde a um teste de múltipla escolha que consiste em cinco questões. Cada


questão tem quatro respostas possíveis, da quais apenas uma é correia. Para completar
o
teste, você chuta aleatoriamente a resposta de cada questão. Obtenha a probabilidade
de que
corretas.
estejam corretas;
a) exatamente três respostas
b) pelo menos
c) menos trêsrespostas
que três estejam corretas;
respostasestejam

5) Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a probabilidade de


serem obtidas 3 caras nessas 5 provas.

6) Um teste consiste em 10 questões do tipo múltipla escolha, cada uma com 5 respostas
possíveis. Para alguém que responda aleatoriamente (por palpite) todas as questões,
determine a probabilidade de passar, se o percentual mínimo para aprovação é 60%. A
probabilidade é suficientemente elevada para -justificar o risco de tentar passar por palpite
em lugar de estudar?

7) Uma companhia aérea adota a política de vender 15 passagens para um


dispõem de apenas 1 4 assentos. (A experiência passada que apenas 85% reservam
lugar efetivamente
C
embarque).
comparecem ao Determine a probabilidade de não haver
assentos suficientes no caso da companhia vender 15 passagens.

8) Em um estudo de reconhecimento de marca. 95% dos consumidores reconhecem Coke


(com base em dados da Total Research Corporation). Um pesquisador relata que em 15
consumidores selecionados aleatoriamente apenas 10 reconhecem o nome Coke. Determine
a probabilidade de um número tão baixo; isto é. determine a probabilidade de obter no
máximo 10 consumidores que reconhecem o nome Cokc dentre 15 consumidores
selecionados aleatoriamente. Com base neste resultado, você acha que o resultado
representado pelo pesquisador possa ser consequência de mero acaso'?

70
onsidere binomial com n = 10 e p = 0,10. Calcule:
a) f(0)
b) f(2)
c) P(x < 2)
d) P(x > 1)
e) B{x)
f) Var(x)e(J
9)

.Uma pesquisa de opinião perguntou aos entrevistados: "Ao realizar viagens internacionais, você se
aventura sozinho para conhecer a cultura local ou se 'fixa ao seu próprio grupo e itinerário turístico?". A
pesquisa revelou que 23'% se prendem ao grupo turístico.
a) Em uma amostra de seis viajantes internacionais, qual a probabilidade de 2 se prenderem ao seu próprio
grupo turístico?
b) Em uma amostra de seis viajantes internacionais, qual a probabilidade de 2 ou menos se prenderem ao
seu próprio grupo turístico?
c)
10) Em uma amostra de seis viajantes internacionais, qual a probabilidade de nenhum se prender ao seu
próprio grupo turístico?
d) Para uma amostra de 1 00 pessoas calcule a esperança e o desvio padrão.

Quando uma máquina nova funciona adequadamente, 3% dos itens produzidos apresentam
somente
defeitos. Suponha escolhermos aleatoriamente duas peças produzidas na máquina e estarmos interessados
no número de peças defeituosas encontradas.
a) Descreva as condições sob as quais essa situação é um experimento binomial.
b) desenhe um diagrama em árvore, ilustrando esse problema como experimento de dois ensaios.
c) calcule as probabilidades de: não encontrarmos defeitos, encontrarmos exatamente um defeito, dois
defeitos.
d) para um lote de 250 peças calcule esperança e o desvio padrão.

Quarenta por cento das pessoas que viajam a negócios partam telefone celular ou laptop. Em relação a
uma amostra de 15 pessoas que viajam a negócios, faça os seguintes cálculos.
a) Calcule a probabilidade de 3 portarem laptpot ou um celular.
b) Calcule a probabilidade de 12 não portarem laptpot ou um celular
c) Calcule a probabilidade de pelo menos 3 portarem laptpot ou um celular
d) calcule a espanca e o desvio padrão para esse grupo.

Acred ita-se que 20% dos moradores das proximidades de uma grande indústria siderúrgica tem alergia
aos poluentes lançados ao ar. Admitindo que este percentual de alérgicos é real (eorreto). calcule a
probabilidade de que pelo menos 4 moradores tenham alergia entre 13 selecionados ao acaso.

71
Exercícios — Distribuição Normal
1) Faça z ama variável com distribuição noimal padronizada e encontre (use a
tabela):
a) P(0< z <1,44) =
b) P(-0,85< z < 0 ) =
c) P( -1,48 <z <2,05 ) =
d)P(0,72<z< 1,89 >
e) P( z <1,08 ) =
-
flPí z > -0.66 ) =
2) Os prazos de substituição dé aparelhos de TV têm distribuição normal com média
de 8,2 anos e desvio padrão de 1.1 ano. Determine a probabilidade de um aparelho
de TV selecionado aleatoriamente acusar um tempo de substituição inferior a 7 anos.
3) Uma aplicação clássica da distribuição normal é inspirada em uma carta, em que
uma esposa alegava ter dado à luz 308 dias após uma rápida visita de seu marido que
estava servindo na Marinha. Os prazos da gravidez têm distribuição normal com
média de 268 dias e desvio padrão de 15 dias. Com base nessa informação,
deifcxnnno a probabilidade dc uma gravidez durar 308 dias ou mais. Que e que o
resultado sugere?
4) Os prazos de duração da gravidez têm distribuição normal com média de 268 dias
e desvio padrão de 15 dias. Definido como prematura uma criança nascida com ao
menos três semanas de antecipação, qual a percentagem das crianças nascidas
prematuramente? (Essa informação é importante para os administradores de
hospitais, que devem providenciar para ter à mão o equipamento necessário para
atender às necessidades especiais dos prematuros.)
5) De acordo com a Opinion Research Corporation, os homens gastam em média
11,4 minutos no chuveiro. Suponha que esses tempos tenham distribuição normal
com desvio padrão de 1,8 minutos. Escolhido um homem aleatoriamente, determine
a probabilidade de ele gastar menos que 10 minutos no chuveiro.

6) Qs escores de QI têm distribuição normal com média 100 e desvio padrão 15. A
Mensa é uma organização para pessoas com QI elevado, e a admissão exige um QI
superior a 131,5.
a) Escolhida aleatoriamente uma pessoa, determine a probabilidade de ela satisfazer
aquela exigência da Mensa.
b) Em uma região típica de 75.000 habitantes, quantos serão candidatos à Mensa?
7) Os níveis de colesterol sérico em homens entre 18 e 24 anos de idade têm distribuição
normal com média de 178,1 e desvio padrão dé 40,7. Todas as unidades são em mg/100 ml.
Escolhido aleatoriamente um homem entre 18 e 24 anos de idade, determine a
Drobabilidade de seu nível de colesterol sérico estar entre 200 e 250.

72
8) A duração de um certo componente eletrònico tem média 850 dias e desvio
padrão 45 dias. Calcular a probabilidade desse componente durar:
a) entre 700 e 1.000 dias: :

b) mais que 800 dias:


c) menos que 750 dias;
d) exatamente 1.000 dias;
e) qual deve ser o número de dias necessários para que tenhamos de repor no
máximo 5% dos componentes? •,

9) Um teste de conhecimentos gerais foi aplicado a 50 funcionários de uma fábrica. Os


resultados obtidos seguem uma distribuição aproximadamente normal, com média 67 e
desvio-pâdrão 9. Responda ás questões, esquematizando as soluções gráficas:
a) Qual a proporção de casos situados acixria dò grau 70? [R: 0,3707]
b) Qual a percentagem de casos situados abaixo do escore 55? [R: 9,176%]
c) Quantos casos estão entre 63 e 68 pontos? [ R: 60,80%]
d) Qual a nota que o indivíduo deve tirar para se qualificar entre os 5% superiores?
[R: 81,85]
e) Qual a nota correspondente ao P20 ? [R: 59,44]

10) Supondo qus a estatura de recém-nascidos do sexo masculino c uma variável


com distribuição aproximadamente normal cuja media é p = 50om c désvio-padrão
a = 2,5 cm, pergunta-se:
a) Qual a probabilidade de um recém-nascido do sexo masculino ter estatura superior a
53 cm? [R; 0,1151]
b) Qual a proporção de recém-nascidos com estatura entre 48 e 52 cm? [R: 0,5763]
11) Os pesos de 600 estudantes são normalmente distribuídos com média 65,3 kg e
desvio-padrão 5,5kg. Encontre o número de alunos que pesam :
a) entre 60 e 70 kg [R: 380]
b) mais que 63,2 kg. [R: 389]
12) Em uma distribuição normal, 28% dos elementos são superiores a 39 e 12%
inferiores a 19. Encontrar a média e o desvio-padrão da distribuição.
[R: p= 32,41 eo= 11,36]

Respostas(aproximadas):
Ia) 0,4251 lb) 0,3023 lc) 0,9104 ld) 0.2064 le) 0,8599 lf) 0.7454

2) 13,79% 3) 0,39% 4) 8,08% 5) 22,06% 6a) 1,78% 6b) 1340

7)25.62% 8a) 98,55% 8b) 86,65% 8c) 1.32% 8dH% 8e).v=776

73
CORRELAÇÃO E
REGRESSÃO

. Introdução
Nos capítulos anteriores, nossa preocupação era descrever a distribuição de valores
de uma única variável. Com esse objetivo, aprendemos a calcular medidas de tendência
central e variabilidade.
Quando, porém, consideramos observações de duas ou mais variáveis, surge um novo
problema: as relações que podem existir entre as variáveis estudadas. Nesse caso, as me¬
didas estudadas não são eficientes.
Assim, quando consideramos variáveis como peso e altura de um grupo de pessoas,
uso do cigarro e incidência do câncer, vocabulário e compreensão da leitura, dominância
e submissão, procuramos verificar se existe alguma relação entre as variáveis de cada um
dos pares e qual o grau dessa relação. Para isso, é necessário o conhecimento de novas
medidas.
Sendo a relação entre as variáveis de natureza quantitativa, a correlação é o instru¬
mento adequado para descobrir e medir essa relação.
Uma vez caracterizada a relação, procuramos descrevê-la através de uma função ma¬
temática. A regressão é o instrumento adequado para a determinação dos parâmetros
dessa função.
NOTAS

MATEMÁTICA (x,) ESTATÍSTICA (y,)
01 5,0 6,0

08 8,0 9,0

24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0

TABELA 11.1

Representando, em um sistema coordenado cartesiano ortogonal, os pares ordenados


(x.,y ), obtemos uma nuvem de pontos que denominamos diagrama de dispersão. Esse
diagrama nos fornece uma ideia grosseira, porém útil, da correlação existente.

10 -

—r~
10
74
Exemplo 4

Encontrando o coeficiente de correlação

Calcule o coeficiente de correlação para os dados dos gastos com propaganda e vendas da
empresa informados no Exemplo 1. O que podemos concluir?

Solução

Use a tabela para ajudar a calcular o coeficiente.

Gastos com Vendas da


propaganda(1.000s empresa 𝑥𝑦 𝑥2 𝑦2
de $),x (1.000s de $),y
2,4 225
1,6 184
2,0 220
2,6 240
1,4 180
1,6 184
2,0 186
2,2 215
∑x=15,8 ∑y=1.634 ∑xy= ∑𝑥 2 = ∑𝑦 2 =

Com essas somas e 𝑛 = 8, o coeficiente de correlação é:


𝑛 ∑ 𝑥𝑦 − (∑ 𝑥) (∑ 𝑦)
𝑟=
√𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 √𝑛 ∑ 𝑦 2 − (∑ 𝑦)2

8(3.289,8) − (15,8)(1.634)
=
√8(32,44) − 15,82 √8(337,558) − 1.6342

501,2
= ≈ 0,9129.
√9,88√30,508
O resultado 𝑟 ≈ 0,913 sugere uma correlação linear positiva forte.

Interpretação

Conforme aumenta o gasto com propaganda, as vendas da empresa também aumentam.


11.2.3 Correlação linear
Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal.
Podemos imaginar que, quanto mais fina for a elipse, mais ela se aproximará de uma
reta. Dizemos, então, que a correlação de forma elíptica tem como imagem uma reta,
sendo, por isso, denominada correlação linear.
É possível verificar que a cada correlação está associada como imagem uma relação
funcional. Por esse motivo, as relações funcionais são chamadas relações perfeitas.

reta
imagem

10 -

Como a correlação em estudo tem como "imagem" uma reta ascendente, ela é cha¬
da correlação linear positiva.
Assim, uma correlação é:

a. linear positiva se os pontos do diagrama têm como "imagem" uma reta ascen¬
dente;
b. linear negativa se os pontos têm como "imagem" uma reta descendente;
c. não linear se os pontos têm como "imagem" uma curva.

Se os pontos apresentam-se dispersos, não oferecendo uma "imagem" definida, con-


uímos que não há relação alguma entre as variáveis em estudo.
Temos, então:

correlação linear positiva correlação linear negativa

correlação não linear não há correlação

75
Coeficiente de correlação linear
O instrumento empregado para a medida da correlação linear é o coeficiente d
correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre dua
variáveis e, ainda, o sentido dessa correlação (positivo ou negativo).
Faremos uso do coeficiente de correlação de Pearson, que é dado por:

r =
~
n Xx. y. - (Xx.) (Xv.)
£*?-(!«.)'] ["lyMXví]

onde n é o número de observações.


Os valores limites de r são —1 e +1, isto é, o valor de r pertence ao intervalo [—1, +1],

Assim:
a. se a correlação entre duas variáveis é perfeita e positiva, então r = +1;
b. se a correlação é perfeita e negativa, então r = —1;
c. se não há correlação entre as variáveis, então r = 0.

Logicamente:
a. se r = +1, há uma correlação perfeita e positiva entre as variáveis;
b. se r = — 1 , há uma correlação perfeita e negativa entre as variáveis;
c. se r = 0, ou não há correlação entre as variáveis, ou a relação que porventura
exista não é linear.

NOTAS:
• Para que uma relação.possa ser descrita por meio do coeficiente de correlação de
Pearson é imprescindível que eia se aproxime de uma função linear. Uma maneira prá¬
tica de verificarmos a linearidade da relação é a inspeção do diagrama de dispersão: se
a elipse apresenta saliências ou reentrâncias muito acentuadas, provavelmente trata-se
de correlação curvilínea.
• Para podermos tirar algumas conclusões significativas sobre o comportamento simultâ¬
neo das variáveis analisadas, é necessário que:
0,6 < | r | <1.
Se 0,3 < | r | <0,6, há uma correlação relativamente fraca entre as variáveis.
Se 0 < [ r | <0,3, a correlação é muito fraca e, praticamente, nada podemos concluir sobre
a relação entre as variáveis em estudo.

Vamos, então, calcular o coeficiente de correlação relativo à Tabela 11.1. O modo


mais prático para obtermos r é abrir, na tabela, colunas correspondentes aos valores de
x.y., x2 e y2. Assim:

76
MATEMÁTICA (x,) ESTATÍSTICA (yt) x,y, X2i y?
5 6 30 25 36
8 9 72 64 81
7 8 56 49 64
10 10 100 100 100
n= 10 6 5 30 36 25
7 7 49 49 49
9 8 72 81 64
3 4 12 9 16
8 6 48 64 36
2 2 4 4 4

1= 65 £ = 65 £ = 473 £ = 481 £ = 475


TABELA 11.2
Logo:
10x473-65x65 4.730 - 4.225
V(10 x 481-652) (10 X 475 - 652) 7'(4-810 — 4.225) (4.750 - 4.225)
505 505
= 0,911
7585x525 554,18

Dai:
r = 0,91,
resultado que indica uma correlação linear positiva altamente significativa entre as duas
variáveis.

Resolva

.
1 Complete o esquema de cálculo do coeficiente de correlação para os valores das variáveis x. e y

X1 4 6 8 10 12
y, 12 10 8 12 14

Temos:

x, y, x,y, y?
n=5 4 12 48 16 144

.... __
12 14 168 144 196

£ = .... £ = .... £ = .... £ = .... £ = ....

Logo:

r=
.... x .... - .... x ....
7(~ x •••• - •••• x ••••) (•••• X •••• - x -•) 7u -••••) (••••-••••)
' "

"V3n-7Z
donde r = 0,42.
A correlação linear entre as variáveis X e Y é positiva, porém fraca.

77
Regressão
Ajustamento da reta
Sempre que desejamos estudar determinada variável em função de outra1, fazemos
uma análise de regressão.
Podemos dizer que a análise de regressão tem por objetivo descrever, através de
um modelo matemático, a relação entre duas variáveis, partindo de n observações das
mesmas.
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável
dependente e a outra recebe o nome de variável independente.
Assim, supondo X a variável independente e Y a dependente, vamos procurar de¬
terminar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos obter
uma função definida por:
Y = aX + b,
onde a e b são os parâmetros.
Sejam duas variáveis X e Y, entre as quais exista uma correlação acentuada, embora
não perfeita, como, por exemplo, as que formam a Tabela 11.2.

Daí, temos:
5 8 7 10 6 7 9 3 8 2
y, 6 9 8 10 5 7 8 4 6 2

TABELA 11.3
cujo diagrama de dispersão é dado por:
y

10

5-

5 10 x

Podemos concluir, pela forma do diagrama, que se trata de uma correlação retilínea,
de modo a permitir o ajustamento de uma reta, imagem da função definida por:
Y = aX +b
Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das fórmulas:

onde:
a= n é o número de observações;

x é a média dos valores x Si


n
v
/

b = y - ax
y é a média dos valores y y= ST

78
NOTA:
• Como estamos fazendo uso de uma amostra para obtermos os valores dos parâmetros,
o resultado, na realidade, é uma estimativa da verdadeira equação de regressão. Sendo
assim, escrevemos:
Y = aX + b,
onde Y é o Y estimado.

Formemos, então, a tabela de valores:


x, Y x,y. x?
n = 10 5 6 30 25
8 '
9 72 64
7 8 56 49
10 10 100 100
6 5 30 36
7 7 49 49
9 8 72 81
3 4 12 9
8 6 48 64
2 2 4 4

£ = 65 £ = 65 £ = 473 £ = 481
TABELA 11.4
Temos, assim:
10 x 473 - 65 x 65 4.730 - 4.225 505
a = -= -= -= 0,8632 —
10 x 481 — (65) 4.810-4.225 585

Como:
- _x = —
65 _ 65
= 6,5 e y = — = 6,5,
10 10
vem:

donde:
b - 6,5 - 0,8632 X 6,5 = 6,5 - 5,6108 = 0,8892,

a = 0,86 e b = 0,89

Logo:
Y= 0,86X + 0,89
Para traçarmos a reta no gráfico, basta determinar dois de seus pontos:
X = 0 =>Y= 0,89
X = 5 =>Y= 0,86 X 5 + 0,89 = 5,19

Assim, temos:
Y = 0,86X + 0,89

5,19 -

8 10
79
.Interpolação e extrapolação
Voltando à Tabela 11.1, vemos que 4,0 não figura entre as notas de Matemática.
Entretanto, podemos estimar a nota correspondente em Estatística fazendo X = 4,0 na
equação:
Y= 0,86X + 0,89
Assim:
X = 4,0 =>Y= 0,86 X 4,0 + 0,89 4,33
O mesmo acontece com a nota 1,0. Repetindo o procedimento, temos:
-
X = 1,0 =>Y= 0,86 x 1,0 + 0,89 = 1,75
Como 4 e [2, 10], dizemos que foi feita uma interpolação; e como 1 g [2,10],
dizemos que foi feita uma extrapolação.

v -tf-
Resolva

1. Complete o esquema para o ajustamento de uma reta aos dados:

Y 2 4 6 8 10 12 14

7 30 25 22 18 15 11 10

Temos:
xy, Logo:
Vi X?
30 60
a =
.... x .... - .... x ....
.... x .... - (,...)2
b = .... - (....) = .... + .... = ....

donde:
n=7
a = .... eb = ....,
isto é:
14 10 140 196
Y = -1,7X + 32,3
1= .... 1= .... £ = ....

Exercícios
I

.
1 Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos. Com o peso real
e a média dos pesos aparentes, dados pelo grupo, obteve-se a tabela:

PESO REAL 18 30 42 62 73 97 120


PESO APARENTE 10 23 33 60 91 98 159

Calcule o índice de correlação.

2. Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos da escola A:

X. 11 14 19 19 22 28 30 31 34 37
y, 13 14 18 15 22 17 24 22 24 25
80
a. Verifique, pelo diagrama, se existe correlação retilínea.
b. Em caso afirmativo, calcule o coeficiente de correlação.
c. Escreva, em poucas linhas, as conclusões a que chegou sobre a relação entre essas variáveis.

3. A tabela abaixo apresenta a produção de uma indústria:

ANOS 1980 1981 1982 1983 1984 1985 1986 1987 1988

QUANTIDADES
34 36 36 38 41 42 43 44 46
(t)

Calcule:
a. o coeficiente de correlação;
Sugestão: Para simplificar os cálculos, use para o tempo uma variável auxiliar, por exemplo:
x|'=x,-1984.
b. a reta ajustada;
c. a produção estimada para 1989.

NOTA:
• Lembre-se de que foi usada uma variável auxiliar.

4. A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço
varia conforme a temperatura:

TEMPERATURA 10 15 20 25 30
PC)
COMPRIMENTO 1.003 1.005 1.010 1.011 1.014
(mm)

Determine:
a. o coeficiente de correlação;
b. a reta ajustada a essa correlação;
c. o valor estimado do comprimento da barra para a temperatura de 18°C;
d. o valor estimado do comprimento da barra para a temperatura de 35°C.

5. A variação do valor da UPC, relativamente a alguns meses de 1995, deu origem à tabela:

MESES mai. jun. Jul. ago. set. out. nov.


VALORES R$ 10,32 10,32 11,34 11,34 11,34 12,22 12,22

a. Calcule o grau de correlação.


b. Estabeleça a equação de regressão de Y sobre X.

c. Estime o valor da UPC para o mês de dezembro.


Sugestão: Substitua os meses, respectivamente, por 1, 2, ..., 7.

6. A partir da tabela:

x, 1 2 3 4 5 6
y, 70 50 40 30 20 10
a. calcule o coeficiente de correlação;
b. determine a reta ajustada;
c. estime o valor de Y para X = 0.

81
7. Certa empresa, estudando a variação da demanda de seu produto em relação à variação de
preço de venda, obteve a tabela:

PREÇO (x,) 38 42 50 56 59 63 70 80 95 no
DEMANDA (y,) 350 325 297 270 256 246 238 223 215 208

a. Determine o coeficiente de correlação.


b. Estabeleça a equação da reta ajustada.
c. Estime Y para X = 60 e X = 120.

8. Pretendendo-se estudar a relação entre as variáveis "consumo de energia elétrica" (x) e "volu¬
me de produção nas empresas industriais" (y ), fez-se uma amostragem que inclui vinte empre¬
sas, computando-se os seguintes valores:

5> = 11,34, XY= 20,72, £xf= 12,16, 84,96 e ÿxy. = 22,13


Determine:
a. o cálculo do coeficiente de correlação;
b. a equação de regressão de Y para X;
c. a equação de regressão-de X para Y.

CORRELAÇÃO E REGRESSÃO
EXERCÍCIOS
1. 0,98
2. b. 0,89
3. a. 0,99 c. 47,5
9
b. = 1,5X + 40
4. a. 0,98 c. 1.007,5 mm
b. Y= 0,56X - 2,6 d. 1 .017 mm
5. a. 0,94 c.R$ 12,66
b.Y = 0,34X + 9,94
6. a. -0,99 c. Y = 76,6
b.Y = -11,4X + 76,6
7. a. -0,90 C. 274,6 e 162,4
b.Y = -1,87X + 386,8
8. a. 0,54 c. X = 0,16Y + 0,40
b. Y= 1.81X + 0,01

82
EXCEL 2010

f J

— —- - * - —
» X

Microsoft*

Excel.20io
Home and Business
Starting...

aAOffice
t 2Í3Õ5 Aí rrghrti raw t - Cante)
*

83
MS EXCEL 2010

0 Excel é uma das melhores planilhas existentes no mercado. As planilhas eletrônicas


são programas que se assemelham a uma folha de trabalho, na qual podemos colocar
dados ou valores em forma de tabela e aproveitar a grande capacidade de cálculo e
armazenamento do computador para conseguir efetuar trabalhos que, normalmente,
seriam resolvidos com uma calculadora, lápis e papel. A tela do computador se
transforma numa folha onde podemos observar uma série de linhas (números) e
colunas (letras). A cada encontro de uma linha com uma coluna temos uma célula
onde podemos armazenar um texto, um valor, funções ou fórmula para os cálculos. O
Excel oferece, inicialmente, em uma única pasta de trabalho 3 planilhas, mas é claro
que você poderá inserir mais planilhas conforma sua necessidade.

r*iJL. >L-MW1 Lriil =r _m ;P

IQm ÿ«#>>ÿ- m > 'ÿ


- 'nu* r~ Inili -Q - # n
7Í- 1' 'Ml »áiwil>l"l 'jF jr1
ÿK
J ÿ
W a
iJiuifil.irm.iu. -4 % jçg ÿíHH' !.r -r,m

u ÿ

~ê* JH
I 1 0 f 1 7 Hl- | j ff 1" , I N r
TH
1 1 I

11

11

fWI *wj itet Ej _ l!

- 2- 2 Lt - ÿ

Operadores e Funções

A função é um método utilizado para tornar mais fácil e rápido a montagem de


fórmulas que envolvem cálculos mais complexos e vários valores. Existem funções para
os cálculos matemáticos, financeiros e estatísticos. Por exemplo na função : =SOMA
(A1:A10) seria o mesmo que (A1+A2+A3+A4+A5+A6+A7+A8+A9+A10), só que com a
função o processo passa a ser mais fácil. Ainda conforme o exemplo pode-se observar
que é necessário sempre iniciar um cálculo com sinal de igual (=) e usa-se nos cálculos
a referência de células (Al) e não somente valores. A quantidade de argumentos
empregados em uma função depende do tipo de função a ser utilizada. Os argumentos
podem ser números, textos, valores lógicos, referências, etc...

84
Operadores

Operadores são símbolos matemáticos que permitem fazer cálculos e comparações entre
as células. Os operadores são:

1.Sinais de operações 2.Sinais para condição


Sinal Função Sinal Função
+ Somar > Maior que
_ >_ Subtrair < Menor que
* Multiplicar <> Diferente

/ Dividir >= Maior e igual a

[ %> Porcentagem <= Menor e igual a


Igualdade && Concatenar

Gráficos

A utilização de um gráfico em uma planilha além de deixá-la com uma aparência


melhor também facilita na hora de mostrar resultados. As opções de gráficos, esta no
grupo Gráficos na ABA Inserir do Excel.

ril 4» 3" 4b :'v ÿ


Colunas Linhas Pizza Barras Área Dispersão Outros
»
~ Gráficos'
Gráficos f»

Para criar um gráfico é importante decidir quais dados serão avaliados para o gráfico.
Vamos utilizar a planilha que apresenta Custo Total de Produção x Número de Unidades
Produzidas para criarmos um gráfico de colunas.
fl*i :
A ft < 0 f C N 1 l t t M
** 0 ÿ
1
'
Nynwo d" unidades par dta_ 5 10 15 20 25 30 35 iO 45 50 100
Custo Tçtal d« Produÿio 1125 1250 13/5 1500 1625 1750 1675 2000 2125 2250 3500

7
I
11
W

39
30
l;

85
Ao clicar na aba INSERIR do Excel, irá abrir o grupo de Gráficos, então você poderá
selecionar um tipo de gráfico disponível, no exemplo cliquei no estilo de gráfico de linhas
2D.

jOOí 4 éi ki-
Linhas

Linha 2D
*
Pizza Banas Área Disper

L -

1
1
• *
ÿ

li
w ,•» p
1a/
" Linha 3D

Todos os Tipos de Gráfico..

Em seguida, para inserirmos os dados que serão plotados do gráfico de linhas, devemos
selecionar a opção Selecionar Dados.

Arquivo Pagina Inicial Inserir Layout da Pagina Fórmulas Dados


Alterar Tipo Salvar como
de Gráfico Modelo
Tipo Dados
Selecionar
Dados
[/sZ ®| -—
Layout de Gráfico

Após termos clicado em Selecionar Dados, na Entradas de Legenda (Série), devemos clicar
no botão Adicionar para podermos entrar com os dados que constituem a variável
dependente " eixo Y".

Selecionar Fonte de Dados

Intervalo de dados do gráfico:

fíótutos do B*o Horizontai (Categorias)

Cekias Ocultas e Varras L«c

86
Na edição da série das variáveis dependentes, no campo Nome da Série digitar: Custo
Total de Produção. No campo Valores da Série, clicar no ícone de uma seta, conforme
a figura abaixo:

Fditar Série
Nome da série:
: Custo Total de Produção| Seteoone um Intervalo
Valores da sène:
_
-
1 -{!> j
«r
Si-.
Cancelar

Em seguida, voc.ê deve selecionar a faixa de células que compõe a variável


dependente, que neste caso é da célula B3 até L3 e apertar a tecla ENTER. Por fim, dar
um clic no botão OK.

Selecionar Fonte de Dados

Intervalo de dados do gpafico: -"E-xcrriuo l'i SBSít: SKSS

'*'! Alternar entre pnha/Gokjnj


Entradas de legenda (Serie) Róhios do Bxo Horizontal (Çalegonas)
ÿédaonar JEditor X Remover

Custo Total de Produção 1 A

2
3
4
S v

CêUas Ocultas e Vazias OH Cancelar

Devemos então clicar nó botão Editar do Rótulo do Eixo Horizontal (Categorias) para
inserirmos as células que possuem os valores das variáveis independentes.

87
Selecionar Fonte de Dactcs

Intervalo de dados do gráfico: ='Erercbo 11S8S3:9Í53 Sb

Alternar ente Unha/Colura

Entradas de Legenda (géne) ttatifcs dBtfilEÿHonzontal (Çategocsas)


Jjí* Editar X Remove
Adoonar
Custo Total de Produção - —"diHl
1

Cá&ias Ocultas e Vajias OK Cancelar

Neste exemplo, devemos inserir a faixa de células de B2 até L2, apertar a tecla ENTER
e clicar no Botão OK.

A caixa deve estar preenchida conforme figura abaixo.

Sefecionar Fonte de Dados

Intervalo de dados do gráfico: M


O nterveb de dados é muito complexo para sei exòido. Se for sefedonaòo um novo nter vaio, efe subsNjirá todas as
séries no paetel Senes.

EnUams dclcçcnda ÍSéne) Rótulos do Buo Kmiontol (Categorias)


Adicionar .../Editar X Remover _/ Editar
Custo Total de Produção S A


IS
20
2S V

CéUas Ocultos e Varas Cancelar

88
Custo Total de Produção
2500

2000 4—

1500
•Custo Total de
1000 Produção

500

5 . 10 15 20 25 30 35 40 45 50

Para mover o gráfico para qualquer parte de sua planilha basta clicar em uma área em
branco do gráfico e manter o mouse pressionado e arrastar para outra parte. Na parte
superior do Excel é mostrada a ABA Design (Acima dela Ferramentas de Gráfico).
HffiH) Etce*
BS9
ã
Alterar Tipo Salvar como
m Q
Alternar Selecionar
de Gráfico Modelo Linha/Co luna Dados
Tipo • Dados

Ainda em Layout do Gráfico podemos modificar a distribuição dos elementos do Gráfico,

aJ iS«
Alterar Tipo Salvar como Selecionar
Alternar
de Gráfico Modelo Linha/Coluna Dados
_ Tino _ j|
rv»rt»r|. lavntrt d# Gráfiro
-N-

1 psÿfcl \~y\ I- j i

i:tex]
1 - 1

ilrV] :: 1 Ss/..:r:
I I

':Ma' k-Vy/
i:p" :ÿa
0

89
4

9
i
1
2
3

5
G
7
8

10
11
12
13
14
15
i
1
2
3
4
5
G
7
8
9
10
11
12
13
14
15

i—
I
|
|
I
I
i
I
j—
I
I
I
i
I
I
--
--
i
I
|
i
I
|
!
i—
I
I
|
|
I
|
|

fir
fi

Xi
Xi

fí.xi
fi.xi

Fi
Fi

fri
fri

Fri
Fri

Xi! fí.xi*

81
90
ApÊNdiCE

Tabela 1Números aleatórios


59 58 48 36 47 92 85 05 08 65 47 49 10 41 05 10 75 59 75 99 17 28 97 99 75
53 26 21 50 21 37 93 85 52 86 86 22 75 34 37 69 85 25 03 78 50 26 18 25 10
07 02 16 58 67 05 32 93 87 84 31 30 62 78 60 59 90 24 22 07 74 43 43 56 91
92 87 67 56 36 58 58 16 88 16 17 83 52 09 99 86 17 20 95 93 01 46 77 18 11
90 57 05 58 96 84 33 68 15 87 28 18 08 76 so¬ 94 60 94 48 76 92 93 49 13 91

24 26 56 02 33 33 21 75 54 04 96 28 85 78 il 54 01 92 86 36 65 19 45 97 79
20 09 49 50 27 33 86 85 59 39 02 25 60 56 26 01 11 24 44 15 58 00 54 54 09
22 74 50 39 12 83 91 03 38 78 85 56 78 41 44 26 04 12 13 50 38 15 61 02 51
10 45 36 09 86 07 68 31 98 41 98 17 56 93 84 16 01 48 99 36 44 61 71 69 67
09 82 11 18 29 96 19 12 47 26 26 01 14 78 55 33 11 13 56 95 68 66 57 90 33

04 63 02 45 50 61 91 02 14 07 57 36 29 12 74 89 47 84 89 69 13 85 22 66 83
55 93 05 63 30 40 05 51 03 31 68 15 33 85 87 94 80 24 96 62 31 38 95 35 38
66 15 07 64 38 16 44 52 26 42 34 65 99 71 63 87 22 04 62 15 76 94 00 00 77
96 31 72 41 94 47 03 44 73 77 96 17 02 97 50 26 67 60 63 57 66 81 92 03 20
07 10 58 83 63 35 47 34 05 38 92 26 05 33 40 91 23 43 68 72 29 74 60 67 01

04 47 64 02 49 10 52 21 00 80 40 56 68 97 32 43 46 70 65 08 96 52 25 29 44
56 24 53 31 96 65 42 53 27 78 23 30 61 34 18 56 59 23 69 27 83 66 60 03 12
98 15 27 91 71 24 15 28 61 91 83 49 05 82 54 53 59 30 25 19 36 31 31 56 58
36 96 23 77 26 79 74 28 12 16 08 88 07 28 71 45 43 40 07 66 11 26 38 51 87
66 01 53 03 67 92 27 27 17 54 31 23 30 42 83 85 78 21 68 34 86 33 77 84 40

48 07 09 48 65 92 33 41 97 63 48 97 19 86 81 10 85 42 84 49 03 82 01 82 88
95 44 86 84 32 09 03 56 46 96 64 51 33 75 10 29 00 99 23 82 92 31 77 08 17
91 73 15 42 46 72 21 07 34 11 92 70 89 58 54 11 30 93 38 29 00 53 93 14 09
08 35 79 86 83 06 89 37 82 12 81 14 08 82 04 91 88 04 86 36 18 10 09 78 99
37 20 97 09 96 86 34 77 09 31 04 38 18 79 61 68 66 47 40 35 40 16 50 22 54

79 14 72 97 40 90 98 64 42 25 72 95 89 98 59 03 73 02 95 47 34 85 74 60 90
58 55 07 49 26 08 02 70 20 14 57 17 20 89 16 07 86 05 38 61 69 48 78 18 62
77 93 74 07 34 23 49 25 23 87 43 93 35 93 02 80 94 57 16 22 73 67 28 75 37
91 82 56 78 91 47 22 60 09 32 67 02 21 71 61 12 83 08 40 00 52 23 47 46 58
53 66 43 91 44 19 05 53 26 31 89 52 31 98 20 03 70 03 61 07 52 79 97 75 92

91 03 23 35 58 48 22 68 98 07 12 20 88 41 89 19 00 56 88 74 96 71 20 52 46
70 35 43 62 20 81 20 95 72 99 80 91 40 17 51 26 71 79 23 17 01 25 48 07 82
93 85 01 86 56 78 48 74 55 63 62 09 64 35 47 08 70 04 66 86 08 91 83 42 94
75 40 86 33 31 96 06 26 53 07 41 58 96 29 23 17 71 66 60 72 07 18 47 73 75
37 15 68 73 37 31 76 55 39 13 49 61 13 83 90 53 47 54 53 52 80 30 40 35 21

35 88 34 83 04 71 67 75 40 83 99 97 96 83 32 16 04 27 99 31 49 80 34 34 95
73 06 78 79 97 28 86 29 45 91 76 44 64 99 81 33 95 06 94 26 85 78 57 43 12
94 70 05 36 32 38 44 59 60 01 13 74 03 30 33 24 79 77 71 87 41 57 07 96 68
09 65 41 62 93 63 28 60 59 28 29 08 69 81 67 60 57 53 64 28 12 24 35 23 49
12 39 50 50 09 22 70 54 75 38 78 56 79 26 62 79 37 83 33 92 33 30 61 41 90
Nota: Os espaços entre os números são apenas para facilitar a leitura, mas os números podem ser
lidos com a quantidade de algarismos que se queira.

91
BIBLIOGRAFIA

CRESPO, Antônio Arnot; FÁCIL, Estatıstica. Ediçao, Editora Saraiva, 1998. 16.
FARBER, L.; LARSON, R. Estatística aplicada. 2004.
TRIOLA, Mario F. et al. Introdução à estatística. Rio de Janeiro: Ltc, 2005.

92