Você está na página 1de 113

U NIVERSIDADE DE C AXIAS DO S UL

P ROFESSORA : C NTIA P AESE G IACOMELLO

Probabilidade e Estatstica
ndice

1 Introduo _____________________________________________________1
1.1 Amostragem ________________________________________________________ 2
1.2 Tipos de variveis ____________________________________________________ 4
2 Sries estatsticas _______________________________________________5
3 Grficos _______________________________________________________6
4 Distribuies de freqncias ______________________________________12
4.1 Construo de distribuio de freqncia para dados contnuos ______________ 12
4.2 Grficos das distribuies de freqncia _________________________________ 13
4.3 Construo de distribuio de freqncia para dados discretos ______________ 15
4.4 Construo de uma distribuio de freqncia acumulada___________________ 17
4.5 Distribuies de freqncia para dados nominais e por postos _______________ 18
4.6 Grficos para distribuies de freqncia ________________________________ 19
5 Medidas de tendncia central _____________________________________20
5.1 Mdia _____________________________________________________________ 20
5.2 Mediana ___________________________________________________________ 23
5.3 Moda _____________________________________________________________ 25
5.4 Relao entre as medidas de tendncia central ___________________________ 26
6 Medidas de variabilidade ________________________________________28
6.1 Amplitude _________________________________________________________ 28
6.2 Varincia __________________________________________________________ 29
6.3 Desvio padro ______________________________________________________ 29
6.4 Coeficiente de variao ______________________________________________ 30
7 Medidas de assimetria e curtose __________________________________31
8 Introduo probabilidade_______________________________________33
8.1 Experimento aleatrio _______________________________________________ 33
8.2 Espao amostral ____________________________________________________ 34
8.3 Eventos ___________________________________________________________ 34
8.4 A probabilidade de um evento _________________________________________ 34
8.5 Clculo das probabilidades ____________________________________________ 37
9 Distribuies de probabilidade ____________________________________43
10 Teoria elementar da amostragem ________________________________56
10.1 Amostragem com e sem reposio ____________________________________ 56
10.2 Distribuies amostrais _____________________________________________ 56

Prof. Cntia Paese Giacomello 2


11 Estimao ___________________________________________________62
12 Testes de hipteses ___________________________________________68
12.1 Teste de hipteses para mdias ______________________________________ 70
12.2 Testes de duas amostras para mdias _________________________________ 72
12.3 Teste para propores _____________________________________________ 72
12.4 Teste do qui-quadrado (k amostras para propores) ____________________ 73
13 Anlise de varincia (ANOVA - Analysis of Variance) _________________79
13.1 Formulrio para soluo ____________________________________________ 83
13.2 Exemplo de soluo no Excel ________________________________________ 85
14 Regresso e correlao ________________________________________90
Regresso ______________________________________________________________ 91
14.1 Aplicaes da regresso ____________________________________________ 91
14.2 Classificao das regresses_________________________________________ 91
14.3 Modelo linear _____________________________________________________ 91
Correlao ______________________________________________________________ 94
14.4 Objetivo da correlao _____________________________________________ 94
14.5 O coeficiente r de Pearson (correlao)________________________________ 94
14.6 Coeficiente de determinao ________________________________________ 94
14.7 Exemplo de soluo no Excel ________________________________________ 96
14.8 Outros modelos __________________________________________________ 100
15 Tabelas ____________________________________________________106

Prof. Cntia Paese Giacomello 3


1 I ntroduo

Estuda-se estatstica para aplicar seus conceitos como auxlio nas tomadas de deciso
diante de incertezas, justificando cientificamente as decises.
Os princpios estatsticos so utilizados em uma grande variedade de situaes no
governo, nos negcios e na indstria, bem como no mbito das cincias sociais, biolgicas
e fsicas.
Estatstica a cincia ou mtodo cientfico que estuda os fenmenos multicausais,
coletivos ou de massa e procura inferir as leis que os mesmos obedecem.
Mtodo estatstico um processo para se obter, apresentar e analisar caractersticas ou
valores numricos para uma melhor tomada de deciso em situaes de incerteza. Os
passos da metodologia estatstica so os seguintes:
Definio cuidadosa do problema
Formulao de um plano para coleta das unidades de observao
Coleta, resumo e apresentao das unidades de observao ou de seus valores
numricos
Anlise dos resultados
Divulgao de relatrio com as concluses, de tal modo que estas sejam facilmente
entendidas por quem as for usar na tomada de decises.

Em geral, aceita a diviso da estatstica em dois grandes grupos: estatstica descritiva e


indutiva.
Descritiva: corresponde aos procedimentos relacionados com a coleta, elaborao,
tabulao, anlise, interpretao e apresentao dos dados. Isto , inclui as tcnicas que
dizem respeito sintetizao e descrio de dados numricos. Tais mtodos podem ser
grficos e envolvem a utilizao de recursos computacionais. O objetivo da estatstica
descritiva tornar as coisas mais fceis de entender, relatar e discutir.
Indutiva (ou inferencial): parte de uma ou mais amostras (subconjuntos da populao) e
conclui sobre a populao. Utiliza tcnicas como a teoria das probabilidades, inferncia
estatstica, amostragem.

Com maior freqncia utilizamos o estudo da amostra do que da populao, no s por


serem menos dispendiosas e consumirem menos tempo no processamento dos dados, mas
tambm porque muitas vezes no dispomos de todos os elementos da populao.

Prof. Cntia Paese Giacomello 1


Definies:
Populao: coleo completa de todos os elementos (valores, pessoas, medidas,...) a
serem estudados.
Amostra: subcoleo de elementos extrados da populao.
Censo: coleo de dados relativos a todos os elementos de uma populao.
Amostragem: coleo de dados relativos a elementos de uma amostra.

Exemplo:
Populao Amostra

Parmetro: medida numrica que descreve uma caracterstica de uma populao


Estatstica: medida numrica que descreve uma caracterstica de uma amostra

1.1 Amostragem
O objetivo da amostragem permitir fazer inferncias sobre uma populao aps inspeo
de apenas parte dela. Fatores como custo, tempo, ensaios destrutivos e populaes
infinitas tornam a amostragem prefervel a um estudo completo (censo).
Os principais tipos de amostragem utilizados so os probabilsticos, onde todos os
indivduos da populao tm a mesma chance de serem selecionados. Os planos de
amostragem probabilstica so delineados de tal modo que se conhece todas as
combinaes amostrais possveis e suas probabilidades, podendo-se ento determinar o
erro amostral.
Os mtodos mais comuns de amostragem probabilstica so:
Amostragem aleatria simples: os elementos de uma populao so escolhidos de
tal forma que todos tenham a mesma chance de serem escolhidos. Pode-se utilizar
uma tabela de nmeros aleatrios ou um programa de gerao de nmeros
aleatrios.
Amostragem estratificada: subdivide-se a populao em, no mnimo, dois estratos
(subpopulaes) que compartilham a mesma caracterstica e em seguida escolhe-se
uma amostra de cada. Exemplo: homens e mulheres.
Amostragem sistemtica: escolhe-se um ponto de partida e ento,
sistematicamente, selecionam-se os outros. Por exemplo: o 3, 403, 803,
1203,... indivduos

Prof. Cntia Paese Giacomello 2


Amostragem por conglomerados: divide-se a populao em conglomerados (reas),
em seguida sorteiam-se algumas reas e analisam-se todos os elementos dos
conglomerados escolhidos. Por exemplo: bairros.

Fonte: Triola, Mrio. 1999, 11.

Amostragens no probabilsticas so utilizadas quando a populao em estudo muito


pequena ou de difcil obteno. Neste caso a anlise de uma amostra poderia causar
distores. Uma pessoa familiarizada com a populao pode indicar melhor as unidades
amostrais. Este tipo de amostragem no permite avaliar o erro amostral. EX: doena rara.

Prof. Cntia Paese Giacomello 3


1.2 Tipos de variveis
Alguns conjuntos de dados consistem em nmeros, enquanto outros so no numricos.
Utiliza-se a nomenclatura de dados (ou variveis) qualitativos e quantitativos.

Variveis

Quantitativas Qualitativas

Discretas Contnuas

Exerccios:
Identifique cada nmero como discreto ou contnuo
1. Cada cigarro Camel tem 16,13 mg de alcatro
2. O altmetro de um avio da American Airlines indica uma altitude de 21.359 ps
3. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas so assinante de um
servio de informao on-line.
4. O tempo total gasto anualmente por um motorista de txi de Nova York ao dar
passagem a pedestres de 2367 segundos.

Apresente dois exemplos de dados discretos ou contnuos de sua empresa / pesquisa.

Prof. Cntia Paese Giacomello 4


2 Sries estatstic as
Consiste no agrupamento dos dados estatsticos em tabelas.
Em qualquer srie estatstica so observados trs elementos fundamentais:
O fato, isto , o que est sendo observado
O espao geogrfico
A poca
Estes elementos criam classificaes para as sries: especficas, temporais ou geogrficas.

Sries temporais (ou histricas)


Os dados esto reunidos de acordo com o tempo, que varia. Os outros dois fatores - local
e fato - permanecem inalterados.

Sries geogrficas
Os dados esto reunidos de acordo com o local, que varia. Os outros dois fatores - fato e
data - permanecem inalterados.

Prof. Cntia Paese Giacomello 5


Sries especficas
Os dados esto reunidos de acordo com o evento, que varia. Os outros dois fatores - local
e data - permanecem inalterados.

As sries podem ainda apresentar-se sob a forma mista, resultante da combinao dos
fatores.

3 Grficos
Os grficos consistem em uma forma de apresentao dos dados, usualmente utilizada
pois facilita a interpretao dos resultados.
So elementos complementares de um grfico:
Ttulo geral, poca e local
Escalas e respectivas unidades de medida
Indicao das convenes adotadas (legenda)
Fonte de informao dos dados

Prof. Cntia Paese Giacomello 6


Principais tipos de grficos: (Fonte: Site da Microsoft www.microsoft.com.br)

Colunas
Um grfico de colunas mostra as alteraes
de dados em um perodo de tempo ou
ilustra comparaes entre itens. As
categorias so organizadas na horizontal e
os valores so distribudos na vertical, para
enfatizar as variaes ao longo do tempo.

Grficos de colunas empilhadas mostram o relacionamento de itens individuais com o todo


. O grfico de colunas em perspectiva 3D Vendas por local
compara pontos de dados ao longo dos dois
eixos.
Nesse grfico 3D, voc pode comparar o
desempenho das vendas de quatro
trimestres na Europa com o desempenho de
outras duas divises.

Barras
Um grfico de barras ilustra comparaes
entre itens individuais. As categorias so
organizadas na vertical e os valores na
horizontal para enfocar valores de
comparao.

Vendas por produto

Grficos de barras empilhadas mostram o


relacionamento de itens individuais com o
todo.

Prof. Cntia Paese Giacomello 7


Linha
Um grfico de linhas mostra Valor de venda do produto X
tendncias nos dados em
intervalos iguais.
A unio dos pontos faz sentido
pois a varivel contnua.
Meses usualmente so
tratados como variveis
contnuas

Pizza
Um grfico de pizza mostra o tamanho
proporcional de itens que constituem uma srie
de dados para a soma dos itens. Ele sempre
mostra somente uma nica srie de dados, sendo
til quando voc deseja dar nfase a um
elemento importante.
Totaliza a informao (100%). Cada faixa do
grfico proporcional informao.

Para facilitar a visualizao de fatias pequenas, voc pode


agrup-las em um nico item do grfico de pizza e
subdividir esse item em um grfico de pizza ou de barras
menor, ao lado do grfico principal.

Diagrama de Disperso (Disperso XY)


Um grfico xy (disperso) mostra a Relao entre tempo e temperatura
relao existente entre os valores
numricos em vrias sries de dados ou
plota dois grupos de nmeros como uma
srie de coordenadas xy. Esse grfico
mostra intervalos irregulares ou clusters
de dados e usado geralmente para
dados cientficos.

Prof. Cntia Paese Giacomello 8


Histograma
um grfico de colunas, porm utilizado
para apresentar distribuies de Distribuio da quantidade produzida

freqncias. 0.30
0.25

% das rvores
0.20
Apresenta as classes ao longo do eixo 0.15
horizontal e as freqncias (absolutas ou 0.10
0.05
relativas) ao longo do eixo vertical. As 0.00
3a8 8 a 13 13 a 18 18 a 23 23 a 28 28 a 33
fronteiras das barras coincidem com os Safras (alq.)
pontos extremos dos intervalos de classe.

rea
Um grfico de rea enfatiza a
dimenso das mudanas ao longo do
tempo. Exibindo a soma dos valores
plotados, o grfico de rea mostra
tambm o relacionamento das partes
com um todo.
Nesse exemplo, o grfico de rea
enfatiza o aumento das vendas em
Washington e ilustra a contribuio
de cada estado para o total das
vendas.

Superfcie
Um grfico de superfcie til quando
voc deseja localizar combinaes
vantajosas entre dois conjuntos de dados.
Como em um mapa topogrfico, as cores e
os padres indicam reas que esto no
mesmo intervalo de valores.
Esse grfico mostra as vrias combinaes
de temperatura e tempo que resultam na
mesma medida de resistncia trao.

Prof. Cntia Paese Giacomello 9


Radar
Um grfico de radar compara os
valores agregados de vrias sries de
dados.

Nesse grfico, a srie de dados que


cobre a maior parte da rea, Marca A,
representa a marca com o maior
contedo de vitamina.

Aes
O grfico de alta-baixa-fechamento usado muitas vezes para ilustrar preos de aes.
Esse grfico tambm pode ser usado com dados cientficos para, por exemplo, indicar
mudanas de temperatura. Voc deve organizar seus dados na ordem correta para criar
esse e outros grficos de aes.

Um grfico de aes que mede o volume tem dois eixos de valores: um para as colunas,
que medem o volume, e outro para os preos das aes. Voc pode incluir volume em um
grfico de alta-baixa-fechamento ou de abertura-alta-baixa-fechamento.

Prof. Cntia Paese Giacomello 10


Bolhas
Um grfico de bolhas um tipo de grfico xy (disperso). O tamanho do marcador de
dados indica o valor de uma terceira varivel.
Para organizar seus dados, coloque os valores de x em uma linha ou coluna e insira os
valores de y e os tamanhos das bolhas correspondentes nas linhas ou colunas adjacentes.

O grfico nesse exemplo mostra que a Empresa A tem a maioria dos produtos e a maior
fatia do mercado, mas no necessariamente as melhores vendas.

Cone, cilindro e pirmide


Os marcadores de dados em forma de cone, cilindro e pirmide podem dar um efeito
especial aos grficos de colunas e de barras 3D.

Rosca
Como um grfico de pizza, o grfico de
rosca mostra o relacionamento das partes
com o todo, mas pode conter mais de uma
srie de dados. Cada anel do grfico de
rosca representa uma srie de dados.

Prof. Cntia Paese Giacomello 11


4 Distribuies de freqncias
Distribuio de freqncia uma tabela resumida na qual os dados so organizados em
grupos de classe ou categorias convenientemente estabelecidas e numericamente
ordenadas.
As distribuies de freqncias so series hetergrafas, isto , sries na qual o fenmeno
ou fato apresenta graduaes ou subdivises. Embora fixo, o fenmeno varia de
intensidade.
Nas distribuies de freqncia, os dados so agrupados segundo um critrio de
magnitude, em classe ou pontos, permanecendo constante o fato, local e tempo, de tal
forma que se possa determinar a percentagem ou nmero, de cada classe. um tipo de
apresentao que condensa uma coleo de dados conforme as freqncias ou repeties
de seus valores.

A construo da distribuio de freqncia depende do tipo de dado com os quais se est


lidando: contnuos ou discretos.

4.1 Construo de distribuio de freqncia para dados contnuos


Os principais estgios so:
1. Estabelecer a quantidade de classes ou intervalos de grupamento dos dados. O
nmero de classes deve variar entre 5 e 15. Aconselha-se utilizar n onde n o
nmero de observaes.
2. Determinar a amplitude das classes. Aconselha-se fazer amplitude / n o de classes.
(OBS: amplitude = maior valor menor valor)
3. Enquadrar os dados nas classes, mediante contagem e apresentar os resultados em
uma tabela ou grfico

Exemplo:
Os dados a seguir representam o tempo (em minutos) que 45 operadores de mquina
demoraram para fazer o setup de uma mquina.
6,5 4,0 7,1 8,3 5,4 7,6 9,0 15,7 16,7
6,4 5,0 8,5 5,7 7,7 7,2 12,4 7,1 5,5
9,7 4,4 7,0 6,3 8,3 6,9 5,7 7,6 7,9
7,9 6,0 8,2 10,4 9,9 3,9 9,8 8,2 5,6
7,9 6,4 7,4 7,0 13,0 8,7 6,4 6,7 7,4

1 Nmero de classes  45 valores  45 =6,7 7 classes


2 Amplitude das classes  16,7 3,9 = 12,8 (Maior valor = 16,7; Menor valor =
3,9). Logo, tem-se a amplitude das classes 12,8 / 7 = 1,83 2

Prof. Cntia Paese Giacomello 12


3 Escrever as classes e contar os valores

Tempo Nmero de % de
(minutos) operadores operadores
3 | 5 equivale a 3 < x 5
3 | 5 4 8,9% Ou seja, so contados no
intervalo todos os valores
5 | 7 15 33,3%
superiores a 3 e inferiores ou
7 | 9 18 40,0% iguais a 5.
9 | 11 4 8,9%
11 | 13 2 4,4%
13 | 15 0 0,0%
15 | 17 2 4,4%

Total 45 100%

A freqncia absoluta (f i ) corresponde ao nmero de operadores


A freqncia relativa (f ri ) corresponde ao percentual de operadores

4.2 Grficos das distribuies de freqncia


Histograma de freqncias

Anlise dos tempos para fazer o setup da mquina

20 18
18
15
Nmero de operadores

16
14
12
10
8
6 4 4
4 2 2
2 0
0
3 | 5 5 | 7 7 | 9 9 | 11 11 | 13 13 | 15 15 | 17
Tempo (minutos)

Uma alternativa ao histograma de freqncias o polgono de freqncias, construdo


mediante a conexo dos pontos mdios dos intervalos do histograma, com linhas retas.

Prof. Cntia Paese Giacomello 13


Anlise dos tempos para fazer o setup da mquina

20
18 18
Nmero de operadores 16
15
14
12
10
8
6
4 4 4
2 2 2
0 0
3 | 5 5 | 7 7 | 9 9 | 11 11 | 13 13 | 15 15 | 17
Tempo (minutos)

OBS: uma vez que a rea do polgono deve ser 100%, deve-se ligar o primeiro e o ltimo
pontos mdios com o eixo horizontal, de modo a cercar a rea da distribuio observada.

Exerccios:
1. A tabela de dados representa o peso de 30 sacos de arroz da marca A selecionados
aleatoriamente em um supermercado. Construa a distribuio de freqncias e
apresente em um grfico. (para facilitar os dados j esto ordenados)
922 930 936 950 954 954 958 965 968 974

977 979 987 989 1001 1006 1008 1010 1013 1017

1018 1034 1034 1035 1042 1044 1044 1048 1070 1116

2. Construa a distribuio de freqncia e o polgono de freqncias.


6,2 9,0 12,2 14,7 7,9 9,8 8,0 13,3 13,3 8,9

8,8 8,3 11,8 11,8 14,7 8,5 7,7 11,4 11,2 10,6

Prof. Cntia Paese Giacomello 14


4.3 Construo de distribuio de freqncia para dados discretos
Na construo de uma distribuio de freqncia utilizando dados contnuos, perde-se
certa quantidade de informao porque os valores individuais perdem sua identidade
quando so agrupados em classes. Isso pode ou no ocorrer com dados discretos,
dependendo da natureza dos dados e os objetivos do analista.

Consideremos os seguintes dados relativos ao nmero de acidentes dirios em um grande


estacionamento, durante o perodo de 50 dias.
1 6 3 6 2 4 5 3 7 9

5 4 5 3 4 5 6 0 8 4

4 1 9 5 7 5 5 4 5 8

4 5 3 2 6 7 4 3 1 4

0 0 5 4 2 6 6 2 8 7

Note que os dados esto entre 0 e 9.


Podemos construir uma distribuio de freqncia sem perda dos valores originais,
utilizando os prprios valores.

Freqncia % dos
Classe
dias dias
0 3 0,06
12
1 3 0,06
10
2 4 0,08
Nmero de dias

8
3 5 0,10
6
4 10 0,20
4
5 10 0,20
2
6 6 0,12
0
7 4 0,08 0 1 2 3 4 5 6 7 8 9

8 3 0,06
9 2 0,04
50 1,00

No houve perda de informao, ou seja, poderamos construir a tabela original a partir da


distribuio de freqncias.

Prof. Cntia Paese Giacomello 15


Por outro lado, poderamos usar como classes 0-1, 2-3, 4-5, 6-7 e 8-9.

Freqncia % dos
Classe dias dias
25
0-1 6 0,12
20

Nmero de dias
2-3 9 0,18 15

4-5 20 0,40 10

5
6-7 10 0,20
0
8-9 5 0,10 0-1 2-3 4-5 6-7 8-9

50 1,00

De modo geral prefere-se uma distribuio de freqncia sem perda de informao


quando:
Os dados so constitudos de valores inteiros.
H menos de, digamos, 16 classes.
H suficientes observaes para originar uma distribuio significativa

Por outro lado, prefere-se uma distribuio de freqncia com perda da informao
quando:
Esto em jogo inteiros e no inteiros
S existem inteiros, porm em nmero muito alto para permitir uma distribuio
til.
A perda da informao de importncia secundria (por exemplo, o
arredondamento do peso de um caminho ou da renda anual para a unidade mais
prxima)

Prof. Cntia Paese Giacomello 16


4.4 Construo de uma distribuio de freqncia acumulada
Uma distribuio de freqncia acumulada tem por objetivo indicar o nmero ou
percentual de itens menores do que, ou iguais a , determinado valor.
No caso dos acidentes podemos construir distribuies acumuladas para a distribuio com
e sem perda da informao.

Sem perda da informao

Freqncias
Classe N dias % dias
acumuladas
0 3 0,06 0,06
1 3 0,06 0,12
2 4 0,08 0,20
3 5 0,10 0,30
4 10 0,20 0,50
5 10 0,20 0,70
6 6 0,12 0,82
7 4 0,08 0,90
8 3 0,06 0,96
9 2 0,04 1,00
50 1,00

Com perda da informao

Freqncias
Classe N dias % dias
acumuladas

0-1 6 0,12 0,12

2-3 9 0,18 0,30

4-5 20 0,40 0,70

6-7 10 0,20 0,90

8-9 5 0,10 1,00

50 1,00

Podemos, pela primeira tabela, concluir que 90% dos dados correspondem a valores
menores ou iguais a 7. ou seja, Em 90% dos dias o nmero de acidentes no excede 7.

Prof. Cntia Paese Giacomello 17


1.0 1.0

0.8 0.8

0.6 0.6

0.4 0.4

0.2 0.2

0.0 0.0
0 1 2 3 4 5 6 7 8 9 0-1 2-3 4-5 6-7 8-9

Os polgonos de freqncias acumuladas so tambm chamados de ogivas.

1,0
0,8
% dos dias

0,6
0,4
0,2
0,0
0 1 2 3 4 5 6 7 8 9

N. acidentes

4.5 Distribuies de freqncia para dados nominais e por postos


As distribuies de freqncias para dados nominais se assemelham s distribuies de
freqncia normais, porm apresentam as categorias em lugar das classes.
Por exemplo:

Vendas Vendas
absolutas relativas

Limo 600 0,375


Laranja 400 0,250
Melo 300 0,188
Melancia 200 0,125
Abacaxi 100 0,063

Total 1600 1,000

Usa-se o grfico de barras ou colunas para representar dados nominais.

Prof. Cntia Paese Giacomello 18


4.6 Grficos para distribuies de freqncia
A distribuio de freqncia muitas vezes utilizada para determinar o formato da
distribuio. A distribuio dos dados pode ser simtrica ou no.

Distribuies discretas

Assimtrica direita Simtrica Assimtrica esquerda

Exerccio:
Construa a distribuio de freqncia e desenhe o histograma dos dados a seguir. Qual
o formato da distribuio?
20,7 18,7 26,2 21,7 18,8 20,6 20,7 20,2
18,5 21,3 19,3 18,3 25,1 18,8 24,3 28,4
23,3 25,3 20,4 18,3 24,0 21,2 19,4 20,6
18,9 26,6 22,4 18,9 22,6 21,4 27,0 23,6
28,3 20,3 21,7 18,2 20,3 19,2 24,7 18,4

Prof. Cntia Paese Giacomello 19


5 Medidas de ten dncia central
As medidas de tendncia central so usadas para indicar um valor que tende a representar
melhor um conjunto de nmeros. As trs medidas mais usadas so a mdia, a mediana e a
moda.

5.1 Mdia

5.1.1 Mdia aritmtica

A mdia aritmtica o resultado da diviso da soma de todos os valores da amostra pela


quantidade total de valores.

x
i =1
i
x
x= ou simplesmente x =
n n

n
OBS: x l-se X barra e significa mdia. x
i =1
i l-se somatrio de x i , i variando de 1 a n.

x
i =1
i = x1 + x 2 + ... + x n

Se um estudante faz quatro provas, obtendo as notas 70, 60, 80 e 75, sua mdia : 71,25.

Algumas propriedades da mdia


A mdia de um conjunto de dados pode ser sempre calculada.
Para um dado conjunto de nmeros, a mdia nica.
A mdia sensvel a (ou afetada por) todos os valores do conjunto, assim, se um
nmero se modifica, a mdia tambm se modifica.
Somando-se uma constante a cada valor do conjunto, a mdia ficar aumentada do
valor constante. Analogamente, extraindo-se um valor constante de cada valor do
conjunto, a mdia tambm ficar diminuda desse valor.
A soma dos desvios dos nmeros de um conjunto a contar da mdia zero.

Prof. Cntia Paese Giacomello 20


5.1.2 Mdia ponderada

A frmula anterior para calcular a mdia aritmtica supe que cada observao tenha a
mesma importncia. A mdia ponderada considera que as informaes no tem a mesma
importncia, ou seja, devem ser levados em conta o peso das informaes.

w xi =1
i i
Mdia ponderada = n

w
i =1
i

Onde w i o peso da observao de ordem i.

Consideremos que um professor informe a classe de que haver dois exames parciais,
valendo cada um 30% da nota e um exame final valendo 40%. Um aluno obtm
desempenho 70 na primeira avaliao, 65 na segunda e 80 no exame final.
n

wx
i =1
i i
70x 0,30 + 65x 0,30 + 80x 0,40
Mdia ponderada = n
= = 72,50
1,00
w
i =1
i

5.1.3 Mdia geomtrica

A mdia geomtrica utilizada quando se deseja fazer a mdia de taxas de juro, por
exemplo. Neste caso, multiplicam-se os n termos e em seguida extra-se a raiz de ordem
n.
A mdia geomtrica o resultado da raiz de ordem n do produto de todos os valores da
amostra.

n
Mdia geomtrica = n
x i =1
i

n
OBS: x
i =1
i = x1x 2 x 3...x n l-se produtrio de x i , i variando de 1 a n.

5.1.4 Mdia harmnica

A mdia harmnica de um conjunto de n nmeros a recproca da mdia aritmtica dos


recprocos dos nmeros.

Prof. Cntia Paese Giacomello 21


1 n
Mdia harmnica = n
=
1 1 1

n i 1 xi
x

5.1.5 Relao entre as mdias aritmtica, geomtrica e harmnica

A mdia geomtrica de um conjunto de nmeros positivos menor ou igual sua mdia


aritmtica, mas maior ou igual sua mdia harmnica.
Em smbolos: HGx
O sinal de igualdade vale somente quando todos os nmeros forem iguais.
Exemplo: o conjunto 2,4 e 8 tem mdia aritmtica 4,67, mdia geomtrica 4 e mdia
harmnica 3,43.

5.1.6 Clculo da mdia para uma distribuio de freqncia

A mdia de uma distribuio de freqncia calculada com base valor e na freqncia de


cada classe.

x =
fx i i

Onde f i a freqncia da classe i.


Para dados com perda da informao, utiliza-se em lugar de x i o ponto mdio do intervalo.

Exemplo:
Ponto mdio
Classe N dias (f i ) f i xi
(x i )

0-1 0,5 6 3,0

2-3 2,5 9 22,5


x=
fx i i
=
223
= 4,46
4-5 4,5 20 90,0 n 50
6-7 6,5 10 65,0

8-9 8,5 5 42,5

n = 50 223

Prof. Cntia Paese Giacomello 22


Classe (x i ) N dias (f i ) f i xi
0 3 0
1 3 3
2 4 8
3 5 15
4 10 40 x =
fx i i
=
222
= 4,44
5 10 50 n 50
6 6 36
7 4 28
8 3 24
9 2 18
50 222

Se fizssemos a mdia a partir da tabela original obteramos o valor de 4,44.

5.2 Mediana
A principal caracterstica da mediana dividir o conjunto de nmeros em dois grupos
iguais: a metade ter valores inferiores ou iguais mediana e a metade ter valores
superiores ou iguais mediana.
Para calcular a mediana inicia-se ordenando os valores em ordem crescente. Em seguida
conta-se at a metade deles. Em geral a mediana ocupa a posio (n+1)/2.
Para nmero mpar de valores a mediana o valor do meio. Para amostras com nmero
par de unidades, a mediana a mdia dos dois valores centrais.

Exemplos:
Amostra Nmero de elementos Dados ordenados Mediana

2 3 34 25 14 5 9 elementos  mpar 1 2 23 3 4 45 5 3

2 4 31 73 89 24 10 elementos  par 1 2 23 34 47 89 3,5

3 4 23 15 32

6 7 32 52 36 21

Prof. Cntia Paese Giacomello 23


Uma medida semelhante mediana o quartil. Os quartis dividem o conjunto ordenado de
dados em quatro grupos iguais. 25% dos valores so inferiores ao primeiro quarti (Q 1 ),
25% esto entre Q 1 e a mediana, 25% esto entre a mediana e o terceiro quartil (Q 3 ).
OBS: o segundo quartil corresponde mediana (Q 2 =mediana).

LI Q1 Q 2 =mediana Q3 LS

LI = Limite inferior LS=Limite superior

5.2.1 Clculo da mediana para uma distribuio de freqncia

Da mesma forma que para dados apresentados em srie, a mediana o ponto que divide
as informaes ao meio.

A mediana pode ser obtida por interpolao, e dada pela frmula.

n
( f )1
Mediana = L1 + 2 c
f mediana


onde: L 1 = limite inferior da classe mediana, isso , da classe que contm a mediana
n = nmero de itens dos dados (freqncia total)
( f) 1 =soma de todas as freqncias das classes anteriores mediana
f mediana = freqncia da classe mediana
c = amplitude do intervalo da classe mediana

Exemplo:
No caso dos acidentes, temos 50 observaes, logo a mediana deve estar localizada na
posio (50+1)/2 = 25,5, ou seja, a classe que contm a mediana a classe 4-5.
O limite inferior da classe mediana 4. Antes da classe mediana (( f) 1 ) haviam passado
15 dados. A classe mediana contm 20 observaes e a amplitude da classe mediana 1.
Ento

50
15
Mediana = 4 + 2 x1 = 4 + 0,5 = 4,5
20

Prof. Cntia Paese Giacomello 24


5.3 Moda
A moda o valor que aparece com maior freqncia na amostra. Um conjunto de dados
pode no apresentar moda, apresentar uma moda, duas modas (bimodal), trs modas
(trimodal) ou mais modas (polimodal).

Exemplo:
A moda do conjunto 2 3 4 3 2 3 5 1 2 3, pois o trs o valor que mais vezes aparece.

5.3.1 Clculo da moda para uma distribuio de freqncia

Quando no h perda da informao, a moda idntica ao valor da classe modal, que a


classe com maior freqncia.
Quando h perda da informao, a moda representa o(s) valor(es) de X
correspondente(m) ao(s) ponto(s) de ordenada(s) mxima(s) da curva e pode ser
calculada pela frmula:

1
Moda = L 1 + c
1 + 2
onde: L 1 =limite inferior da classe modal (isto , a classe que contm a moda)
1 =excesso da freqncia modal sobre a da classe imediatamente anterior

2 = excesso da freqncia modal sobre a da classe imediatamente posterior

c = amplitude da classe modal

Exemplo:
No caso dos acidentes....
Classe N dias (f i )
0-1 6 Classe modal

2-3 9
4-5 20
6-7 10
8-9 5
n = 50

11
Moda = 4 + 1 = 4 + 0 ,52 = 4 ,52
11 + 10

Prof. Cntia Paese Giacomello 25


A distribuio pode ter mais de uma moda, sendo bimodal ou de modas mltiplas. OBS: as
duas modas no precisam, necessariamente, ter a mesma freqncia. Isso acontece
quando h um deslocamento da distribuio.

Moda Classe modal Classes modais Classes modais

5.4 Relao entre as medidas de tendncia central


Para as curvas de freqncia unimodal moderadamente inclinadas (assimtricas) vigora a
relao emprica
Mdia Moda = 3 (Mdia Mediana)

Moda
Moda
Mediana Moda
Mediana
Mdia Mediana
Mdia
Mdia

Exerccios:
1. Para os seguintes conjuntos de dados, determine os valores da mdia aritmtica,
mdia geomtrica, mdia harmnica, mediana e moda.
a) 12 15 16 15 12 15 15 5 7 14

b) 2 6 3 6 3 3 4

c) 2 8 3 10 2 1 6 9 4 3

d) 38 38 70 92 22 17

Prof. Cntia Paese Giacomello 26


2. Determine Q 1 , Q 2 e Q 3 nos conjuntos de dados que seguem:
a) 15 15 4 7 16 16 4 11 7

8 19 7 6 12 17 16 9 20

16 14 3 12 4 9 8 3 16

b) 4 12 4 7 4 9 11 12 5 8 9 4

3. Qual seria o efeito sobre a mdia de um conjunto de dados se se adicionasse 10:


a) a um dos nmeros? b) a cada um dos nmeros?

4. Joo possui 5 imveis localizados nesta cidade. Ele deseja saber qual o valor
mdio, por metro quadrado, das suas propriedades. Sabendo que imveis no centro
valem R$ 450,00/m 2 e imveis em bairros valem R$ 300,00/m 2 , calcule o valor
mdio por m 2 do seu capital.
Apartamento de 80 m 2 no centro
Pavilho de 450 m 2 no bairro
Casa de 280 m 2 no centro
Apartamento de 120 m 2 no bairro
Casa de 320 m 2 no bairro

Prof. Cntia Paese Giacomello 27


6 Medidas de vari abilidade
As medidas de variabilidade ou disperso indicam se os valores esto relativamente
prximos ou no uns dos outros.
Na anlise de um conjunto de dados necessrio que sejam observados tanto as
informaes relativas localizao (medidas de tendncia central) quanto as informaes
de disperso (medidas de variabilidade).
Exemplo:

Pequena variabilidade

Grande variabilidade

Exemplo:
Duas mquinas esto sendo comparadas. A seguir est descrita a produo de cada uma
durante 5 dias.

Produo Mdia

Mq 1 10 10 10 10 10 10
Mq 2 5 18 8 3 16 10

Voc acha que a programao da produo para as duas mquinas pode ser a mesma
durante 1 semana? Por qu?

Consideraremos quatro medidas de disperso: amplitude, varincia, desvio padro e


coeficiente de variao. Todas elas, exceto a amplitude, tm na mdia o ponto de
referncia. Em cada caso, o valor zero indica ausncia de variao; a disperso aumenta
proporo que aumenta o valor da medida (intervalo, varincia, etc.).

6.1 Amplitude
Tambm conhecida como intervalo.
A amplitude de um grupo de dados , de modo geral, mais simples de calcular e de
entender. Consiste na diferena entre o maior e o menor valor, ou seja, entre os valores
extremos.

Amplitude = X max - X mn

Prof. Cntia Paese Giacomello 28


A maior limitao da amplitude o fato de s levar em conta os valores extremos de um
conjunto, nada informado sobre os outros valores.

Exemplo:
1. Calcule a amplitude dos seguintes conjuntos de dados. Voc acha que a disperso
dos conjuntos igual?
a) 15 15 12 14 16 16 4 15

b) 5 4 5 4 6 5 16 4

6.2 Varincia
Calcula-se a varincia de uma amostra elevando-se as diferenas de cada um dos valores
em relao mdia, somando-se estas diferenas e dividindo-se por n-1.

s 2
=
(x i x)2
x
n 1

Quando se deseja a varincia populacional, deve-se substituir n-1 por n na frmula.


Usualmente iremos utilizar a varincia amostral.

Exemplo:
Clculo da varincia do conjunto de dados 2,4,6,8, e 10.

xi x xi x ( xi x )2

2 6 -4 16

4 6 -2 4

6 6 0 0 s 2
=
(x i x)2
=
40
= 10
x
n 1 5 1
8 6 2 4

10 6 4 16

Somas 0 40

6.3 Desvio padro


O desvio padro simplesmente a raiz quadrada da varincia. Assim se a varincia 81, o
desvio padro ser 9.

Prof. Cntia Paese Giacomello 29



(
xi
2
)
x
2

n
(x
i
i x)2
sx = =
n 1 n 1

Como anteriormente, a substituio de n-1 por n produz as frmulas para a populao.


A unidade na qual o desvio padro expresso a mesma dos dados originais, ou seja, se
os dados so em Reais, o desvio padro tambm vai ser em reais (e a varincia em
reais 2 ).

Exemplo:
Clculo do desvio padro do conjunto de dados 20, 5, 10, 15 e 25.
Usando a frmula normal:

xi x xi x ( xi x )2

20 15 5 25

5 15 -10 100
sx =
(x i x)2
=
250
= 62,5 = 7,91
10 15 -5 25 n 1 5 1
15 15 0 0

25 15 10 100

Somas 0 250

Usando a frmula simplificada:

x i = 20 + 5 + 10 + 15 + 25 = 75

x 2
i = 202 + 52 + 102 + 152 + 252 = 1375


i
x( )
2

x 2
i
n 1375 75
2
= 5 = 250
sx = = 7,91
n 1 5 1 5 1

6.4 Coeficiente de variao


O coeficiente de variao uma medida de variao til para comparar conjuntos de
dados diferentes. Ele usualmente expresso em percentual.

O coeficiente de variao dado pelo quociente entre o desvio padro e a mdia dos
dados.

Prof. Cntia Paese Giacomello 30


Desvio padro S x
CV = =
Mdia X

Exemplo:
Entre os conjuntos de dados a seguir apresentados, qual apresenta maior variabilidade?
Conjunto A Conjunto B
12 3
25 4
16 5
23 2
Desvio Padro A 6,06
Soluo: CVA = = = 0,3187
MdiaA 19
Desvio Padro B 1,29
CVB = = = 0,3688
MdiaB 3,5
Ento o conjunto que possui maior variabilidade o conjunto B.

Exerccios:
1. O desvio padro pode ser zero? Explique. Pode ser negativo? Explique.

2. Calcule a mdia e o desvio padro para as vendas dirias.


R$ 8100 R$ 9000 R$ 4580 R$ 5600 R$ 7680 R$ 4800 R$ 10640

3. Consideremos os seguintes dados correspondentes a preos de propostas.


26,5 27,5 25,5 26,0 27,0 23,4 25,1 26,2 26,8
Calcule a amplitude, a varincia, o desvio padro, a mdia, moda, mediana e os
quartis

7 Medidas de a ssi metria e curtose


As medidas de assimetria e curtose indicam qual o formato da distribuio dos dados em
relao distribuio normal (descrita adiante).
Assimetria o grau de desvio, ou afastamento da simetria, de uma distribuio. Ela
retorna a distoro de uma distribuio. O valor enviesado caracteriza o grau de assimetria
de uma distribuio em torno de sua mdia. Um valor positivo indica uma distribuio com
uma ponta assimtrica que se estende em direo a valores mais positivos. Um valor

Prof. Cntia Paese Giacomello 31


negativo indica uma distribuio com uma ponta assimtrica que se estende em direo a
valores mais negativos. No excel a funo correspondente distoro .
3
n xi x
Assimetria =
(n 1)(n 2)

s

Assimtrica positiva Simtrica Assimtrica negativa


a>0 a=0 a<0

A curtose o grau de achatamento de uma distribuio e caracteriza uma distribuio em


cume ou plana se comparada distribuio normal (chamada mesocrtica). A curtose
positiva indica uma distribuio relativamente em cume (chamada leptocrtica). A curtose
negativa indica uma distribuio relativamente plana (chamada platicrtica). A funo
correspondente no excel chama-se CURT, e calcula a curtose de um conjunto de dados de,
no mximo, 30 valores.

n(n + 1) x i x
4
3(n 1) 2
Curtose =
(n 1)(n 2)(n 3)
s (n 2)(n 3)

Leptocrtica Mesocrtica Platicrtica

c>0 c=0 c<0

Prof. Cntia Paese Giacomello 32


8 I nt r odu o p robabilid ad e

As origens da probabilidade remontam ao sculo XVI. As aplicaes iniciais referiam-se


quase todas a jogos de azar. Os jogadores aplicavam o conhecimento da teoria das
probabilidades para planejar estratgias de apostas.
Atualmente a utilizao das probabilidades ultrapassou de muito o mbito desses jogos.
Hoje os governos, as empresas, as organizaes profissionais incorporam a teoria das
probabilidades em seus processos dirios de deliberaes.
Independentemente de qual seja a aplicao em particular, a utilizao das probabilidades
indica que existe um elemento de acaso, ou de incerteza, quanto ocorrncia ou no de
um evento futuro. Assim que, em muitos casos, pode ser virtualmente impossvel afirmar
por antecipao o que ocorrer, mas possvel dizer o que pode ocorrer.
H numerosos exemplos de tais situaes no campo dos negcios e do governo. A previso
da procura de um novo produto, o clculo dos custos da produo, a previso das safras,
a compra de aplices de seguros, a avaliao da reduo de impostos sobre a inflao. As
probabilidades so teis pois ajudam a desenvolver estratgias.
O ponto central em todas as situaes a possibilidade de quantificar quo provvel
determinado evento.
As probabilidades so utilizadas para exprimir a chance de ocorrncia de determinado
evento. O estudo das probabilidades importante pois elas so a base para o estudo
estatstico.

8.1 Experimento aleatrio


Experimentos aleatrios so aqueles que, mesmo repetidos vrias vezes sob condies
semelhantes, apresentam resultados imprevisveis.
Caractersticas dos experimentos aleatrios:
1. Podem ser repetidos indefinidamente sob as mesmas condies.

2. No se pode adiantar um resultado particular, mas pode-se descrever todos os


resultados possveis
3. Se repetidos muitas vezes apresentaro uma regularidade em termos de
freqncia de resultados.
Exemplos : lanamento de uma moeda, lanamento de um dado, aposta na loteria, ....

Ao descrever um experimento aleatrio deve-se especificar no somente que operao ou


procedimento deva ser realizado, mas tambm o que dever ser observado. (Note a diferena
entre o 2 o e o 3 o )

Joga-se um dado e observa-se o nmero obtido na face superior.


Joga-se uma moeda 4 vezes e o observa-se o nmero de caras obtido.

Prof. Cntia Paese Giacomello 33


Joga-se uma moeda 4 vezes e observa-se a seqncia de caras e coroas.
Um lote de 10 peas contm 3 defeituosas. As peas so retiradas uma a uma
(sem reposio) at que a ltima defeituosa seja encontrada. Conta-se o
nmero de peas retiradas.
Uma lmpada nova ligada e observa-se o tempo gasto at queimar.
Lana-se uma moeda at que ocorra uma cara e conta-se ento o nmero de
lanamentos necessrios.
Lanam-se dois dados e anota-se o total de pontos obtidos.
Lanam-se dois dados e anota-se o par obtido.

8.2 Espao amostral


O espao amostral (S) de um experimento aleatrio o conjunto de todos os possveis
resultados do experimento.
n(S) o nmero de elementos do conjunto S, ou o nmero de resultados possveis.

Exemplo : um experimento o lanamento de uma moeda. Os possveis resultados so


cara ou coroa, ento, S={cara, coroa}.
Em dois lanamentos de uma moeda, sendo interessante observar a ordem dos resultados,
os possveis resultados so: 1) cara e cara, 2) cara e coroa, 3) coroa e cara e 4) coroa e
coroa. O espao amostral S={(Ca,Ca), (Ca,Co), (Co,Ca) e (Co,Co)}. n(S)=4

8.3 Eventos
Chama-se de evento qualquer subconjunto do espao amostral S de um experimento
aleatrio, ou seja, qualquer resultado do espao amostral.
n(A) o nmero de resultados associados ao evento A.

Exemplo : no lanamento de uma moeda S={cara, coroa}. Um evento de interesse A pode


ser obter cara no lanamento de uma moeda e n(A)=1.
No lanamento de um dado, o evento de interesse (A) pode ser obter face par e n(A)=3.

8.4 A probabilidade de um evento


Seja A um evento. A probabilidade deste evento ocorrer dada por P(A), que um
nmero entre 0 e 1. Quanto mais prxima a probabilidade estiver de 1, maior ser sua
chance de ocorrncia. A um evento impossvel atribui-se probabilidade 0, enquanto que
um evento certo tem probabilidade 1.
H trs maneiras diferentes de calcular ou estimar probabilidades: o mtodo clssico,
quanto o espao amostral tem resultados igualmente provveis. O mtodo emprico, que

Prof. Cntia Paese Giacomello 34


se baseia na freqncia relativa de ocorrncia de um evento num grande nmero de
provas repetidas e o mtodo subjetivo, que utiliza estimativas pessoais de probabilidade,
baseadas num certo grau de crena. Em geral vamos utilizar o mtodo clssico de clculo
de probabilidades.

Quando os resultados so equiprovveis, a probabilidade de cada resultado funo do


nmero de resultados possveis:
nmero de resultados associados ao evento A
P( A ) =
nmero total de resultados possveis

Exemplo:
Experimento: lanar um dado e observar a face superior
Espao amostral: S={1,2,3,4,5,6} n(S)=6
Evento A: face par n(A)=3
P(A)= 3/6 = = 0,5 ou 50%

OBS: existe uma pequena diferena entre probabilidade e chance de um evento. A probabilidade
relaciona o nmero de resultados de A com o nmero de resultados total, enquanto que chance
compara o nmero de resultados de A com o nmero de resultados de outro evento (B ou C).

Em uma urna com 5 bolas brancas, 3 vermelhas e 2 azuis,

A probabilidade de selecionar uma bola branca P(branca)=5/10=0,5 ou 50%

E a chance de selecionar uma bola branca 5:5, que semelhante a 1:1, o que significa que existe a
mesma chance de retirar uma bola branca ou uma bola de outra cor.

Exerccios:
1. Escreva o espao amostral no lanamento de um dado. Ache a probabilidade
associada a cada evento.

2. Extrai-se uma carta de um baralho de 52 cartas. Determine a probabilidade de:


a) um valete
b) uma carta vermelha
c) um dez de paus
d) uma figura
e) uma carta de ouros
f) um nove vermelho

Prof. Cntia Paese Giacomello 35


3. Complete a tabela com os valores calculados da probabilidade dos eventos
ocorrerem

Experimento Evento P(Evento)


Lanar uma moeda uma vez Cara

Lanar um dado uma vez Face 3

Extrair uma carta de um baralho com


6 vermelho
52 cartas
Extrair uma carta de um baralho de 52
Valete de ouros
cartas

4. Encontre n(S), n(A) e P(A) no lanamento de dois dados


Experimento: Lanar dois dados e observar a seqncia dos resultados
S={(1,1), (1,2), (1,3),.....,(6,4),(6,5),(6,6)}
N(S)=36

a. A: apaream faces iguais

b. A: a segunda face o dobro da primeira

c. A: apaream somente nmeros mpares

d. A: apaream faces iguais ou a segunda face o quadrado da primeira

e. A: a soma das faces igual a 7

5. H 50 bolas numa urna: 20 azuis, 15 vermelhas, 10 pretas e 5 verdes. Misturam-se


as bolas. Determine a probabilidade da bola escolhida ser:
a) Verde
b) Azul
c) Verde ou azul
d) No-vermelha
e) Vermelha ou verde
f) Amarela
g) No-amarela

Prof. Cntia Paese Giacomello 36


6. Um motorista tem uma marca num de seus pneus, e 20% do pneu visvel. Ao
parar, qual a probabilidade da marca ficar na parte visvel?

7. Um motor tem 6 velas, e uma est defeituosa, devendo ser substituda. Duas esto
em posio de difcil acesso, o que torna difcil a substituio.
a) Qual a probabilidade de a vela defeituosa estar em posio difcil?
b) Qual a de no estar em posio difcil?

8. Os dados compilados pela gerncia de um supermercado indicam que 915 dentre


1500 clientes compradores de domingo gastam mais de R$ 40,00 em suas compras.
Estime a probabilidade de um comprador em qualquer domingo gastar mais de R$
40,00.

9. Uma pesquisa de trfego levada a efeito das 5 s 6 horas da manh num trecho de
uma rodovia federal revelou que, de 200 carros que pararam para uma verificao
rotineira de segurana, 25 tinham pneus em ms condies. Estime a probabilidade
de um carro que pare naquele trecho ter seus pneus em boas condies

8.5 Clculo das probabilidades


Muitas aplicaes da estatstica exigem a determinao da probabilidade de combinaes
dos eventos. H duas caractersticas de combinaes. Pode ser necessrio determinar a
probabilidade de ambos os eventos acontecerem P(A e B) ou a probabilidade de um deles,
A ou B, ou seja, P(A ou B).

Em um prdio com 2 elevadores, poderamos perguntar: Qual a probabilidade de ambos


elevadores estarem em servio? Ou ento, Qual a probabilidade de um ou outro elevador
estar em servio?

Ambos implica P(A e B)


Um ou outro implica P(A ou B)

Prof. Cntia Paese Giacomello 37


Regra da adio:
A regra da adio leva em conta a ocorrncia do evento A ou do evento B ou de ambos os
eventos e denotada por P(AB).

A B

P(A ou B) = P(A) + P(B) P(A e B)

Quando os eventos so mutuamente excludentes (no tem elementos em comum), ento a


probabilidade de ambos nula e o termo P(A e B) ser zero.

Se A e B so mutuamente excludentes  P(A ou B) = P(A) + P(B)

OBS: Para apresentar os eventos utilizam-se os Diagramas de Venn [apresentados por John Venn
(1834-1923)], que representam os espaos amostrais e os eventos como crculos, quadrados, ou outra
figura geomtrica conveniente.

Exerccios:
1. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso.
Qual a probabilidade do nmero ser par ou maior que 4?

2. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso.
Qual a probabilidade do nmero ser um nmero primo ou maior que 8?

Prof. Cntia Paese Giacomello 38


Regra da multiplicao
Considerando-se dois eventos A e B de um mesmo espao amostral, a probabilidade de A e
B ocorrerem P(AB) dada por:

A B

A probabilidade de A e B igual probabilidade de A, dado B, vezes


a probabilidade de B.
P(A e B) = P(A|B) P(B)

Onde P(A|B) a probabilidade de A ocorrer dado que B tenha ocorrido.

Quando a probabilidade de B ocorrer no depender de A ter ocorrido, dizemos que A e B


so independentes, e P(B| A)=P(B)

Se A e B so independentes  P(A e B)=P(A)P(B)

Exemplo 1: Deve-se inspecionar uma grande caixa de peas. Os registros indicam que 2%
das caixas acusam contedo inferior ao estipulado. Escolhidas duas caixas aleatoriamente,
qual a probabilidade de ambas acusarem contedo inferior, admitindo-se que a remessa
inspecionada semelhante as anteriores (isto , 2% de deficientes)?
P(ambas deficientes)=P(deficiente)P(deficiente)
=0,02 x 0,02
=0,0004 ou seja, 0,04% de probabilidade das caixas serem defeituosas.

Exemplo 2: Suponha que 20 canetas esto expostas numa papelaria. Seis so vermelhas e
14 azuis. Do conjunto de 20, iremos escolher 2 canetas aleatoriamente. Qual a
probabilidade de que as duas canetas selecionadas sejam vermelhas?
Neste caso os eventos no so independentes, pois a cor da primeira caneta
selecionada vai determinar a probabilidade da segunda caneta ser vermelha.
Seja A=a segunda caneta selecionada vermelha
B=a primeira caneta selecionada vermelha

5 6 30
Desejamos P(A e B) = P(A|B) P(B) = = = 0,0789
19 20 380

Prof. Cntia Paese Giacomello 39


Regras de probabilidade
P(A ou B), Para eventos no mutuamente excludentes:
P(A ou B ou ambos) = P(A) + P(B) P(A e B)
para eventos mutuamente excludentes:
P(A ou B) = P(A) + P(B)
P(A e B), para eventos independentes:
P(A e B) = P(A) . P(B)
Para eventos dependentes
P(A e B) = P(B).P(A/B) ou P(A).P(B/A)

Outra forma de apresentar os eventos atravs de tabelas de contingncia (tabelas com


cruzamento de classificaes).
Por exemplo:
Vermelha Preta Totais
s 2 2 4
No s 24 24 48
Totais 26 26 52

Exerccios

1. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, sem
reposio, determine a probabilidade de retirar a primeira azul e a segunda
vermelha.

2. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, com
reposio, determine a probabilidade de retirar a primeira azul e a segunda
vermelha.

3. Em um lote de 12 peas, quatro so defeituosas. Retira-se uma pea e inspeciona-


se. Qual a probabilidade:
a. Da pea ser defeituosa
b. Dela no ser defeituosa

Prof. Cntia Paese Giacomello 40


4. Uma loja dispe de pneus novos e recapados. Entre 100 pneus, sabe-se que 30 so
recapados.
a. Se um cliente levar um pneu, qual a probabilidade de que ele seja recapado?

b. Se um cliente levar dois pneus, qual a probabilidade de que ambos sejam


recapados?

c. Se um cliente levar 4 pneus, qual a probabilidade de que todos sejam


recapados?

5. Um dado lanado 3 vezes. Calcule a probabilidade de que se obtenha face 6 nos 3


lanamentos.

6. Uma urna contm 50 bolas numeradas de 1 a 50. Sero selecionadas 5 bolas, sem
reposio. Qual a probabilidade de que uma pessoa que tenha feito um jogo
anotando os 5 nmero acerte todos?

Prof. Cntia Paese Giacomello 41


7. Nos ltimos anos, as empresas de cartes de crdito intensificaram esforos no
sentido de abrir mais contas para alunos de faculdade. Suponha que uma amostra
de 200 alunos em sua faculdade apresentou as seguintes informaes em termos
de o aluno possuir carto de crdito bancrio e/ou carto de crdito de viagem e
entretenimento:

CC de viagem e entretenimento
Totais
Sim No

Sim 60 60 120
CC bancrio
No 15 65 80

Totais 75 125 200

a. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o


aluno possua um carto de crdito bancrio?

b. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o


aluno no possua um carto de crdito bancrio?

c. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o


aluno possua um carto de crdito bancrio e um carto de viagem e
entretenimento?

d. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o


aluno no possua um carto de crdito bancrio nem carto de viagem e
entretenimento?

e. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o


aluno possua um carto de crdito bancrio ou possua um carto de viagem
e entretenimento?

f. Suponha que um aluno possui um carto de crdito bancrio. Qual a


probabilidade de que ele possua um carto de viagem e entretenimento?

g. Suponha que o aluno no possui um carto de viagem e entretenimento.


Qual a probabilidade de que ele ou ela possua um carto de crdito
bancrio?

h. Os dois eventos, possuir um carto de crdito bancrio e possuir um carto


de viagem e entretenimento, so estatisticamente independentes? Explique.

Prof. Cntia Paese Giacomello 42


9 Distribuies de probabilidade

O histograma usado para apresentar dados amostrais (Amostra=conjunto de


observaes extradas de uma populao)
Por exemplo, 50 valores de satisfao dos clientes so interpretados como uma amostra
da satisfao de todos os clientes.
O uso de mtodos estatsticos permite que se analise essa amostra e se tire alguma
concluso sobre a satisfao dos clientes.
Uma distribuio de probabilidade um modelo matemtico que relaciona um certo valor
da varivel em estudo com a sua probabilidade de ocorrncia.

H dois tipos de distribuio de probabilidade


1. Distribuies Contnuas: Quando a varivel que est sendo medida expressa
em uma escala contnua, como por exemplo, o peso de peas produzidas, dimetro, etc.
2. Distribuies Discretas: Quando a varivel que est sendo medida s pode
assumir certos valores, como por exemplo os valores inteiros 0, 1, 2, etc.

No caso de distribuies discretas, a probabilidade que a varivel X assuma um valor


especfico x o dada por: P {X = x o } = P(x o )

No caso de variveis contnuas, as probabilidades so especificadas em termos de


b
{ }
intervalos: P a x b = a f ( x ) dx

Relembrando: uma varivel aleatria uma funo com valores numricos, cujos
valores so determinados por fatores de chance.
Uma varivel aleatria considerada discreta se toma valores que podem ser
contados.
Uma varivel aleatria considerada contnua quando pode tomar qualquer valor
em determinado intervalo.

Prof. Cntia Paese Giacomello 43


Os grficos a seguir apresentam exemplos de distribuies de probabilidades discreta e
contnua.

Exemplo:
Distribuio de probabilidade para a varivel aleatria nmero de caras em duas jogadas
de uma moeda.

Nmero de Nmero de
Prob. do Prob. do
Resultado caras caras
resultado resultado
Valor da V.A. Valor da V.A
Cara Cara 2 x = 0
Cara Coroa 1 x =
1 + =
Coroa Cara 1 x =
Coroa Coroa 0 x = 2

Soma = 1 Soma = 1

O valor esperado, ou esperana matemtica, de uma varivel aleatria E(x), que consiste
no valor esperado para ela, ou seja, o valor mdio da varivel.
n
E( x ) = px
i =1
i i se X v.a. discreta

ou

E( X) = x. f(x) dx

se X v.a. contnua

E a varincia de X dada por Var( X ) = E( X 2 ) [E( X )]2 .

O desvio padro Var ( X)

Prof. Cntia Paese Giacomello 44


Neste exemplo, o valor esperado 0 . + 1 . + 2 . = 1.
E a varincia Var(X)=E(X 2 )-[E(X)] 2 = E(X 2 ) - 1= (0 2 . + 1 2 . + 2 2 .) 1 =1,5-1=0,5 E
o desvio padro = 0,71

Exemplo: um investidor julga que tem 0,4 de probabilidade de ganhar $ 25.000 e 0,6 de
perder $ 15.000. Seu ganho esperado de:
E(X) = 0,4 (25.000) + 0,6 (-15.000) = $ 1.000.
E a varincia Var(X)=E(X 2 )-[E(X)] 2
= E(X 2 ) 1.000 2
=(0,4.25.000 2 + 0,6.(-15.000) 2 )-1.000 2
=(0,4 x 625.000.000 + 0,6 x 225.000.000)-1.000 2
= 250.000.000+ 135.000.000 1.000 2
= 385.000.000 1.000.000
= 384.000.000
Desvio padro = $ 19.595,92

Exerccios:
1. O nmero de chamadas telefnicas recebidas por uma mesa e suas respectivas
probabilidades para um intervalo de 3 minutos so:

Nmero de chamadas 0 1 2 3 4 5 Total

Freqncia relativa 0,60 0,20 0,10 0,04 0,03 0,03 1,00

Em mdia, quantas chamadas podem ser esperadas num intervalo de trs minutos?

2. Um bilhete de loteria tem 0,00001 de chance de dar um prmio de $ 100.000,


0,00002 de chance de dar um prmio de $ 50.000 e 0,004 de chance de um prmio
de $ 25. Qual seria o preo justo de venda do bilhete?

3. Uma confeitaria estabeleceu um registro de vendas para certo tipo de bolo.


Determine o nmero esperado de bolos encomendados.

N bolos/dia 0 1 2 3 4 5 6 7 8 9 Total

Freqncia relativa 0,02 0,07 0,09 0,12 0,20 0,20 0,18 0,10 0,01 0,01 1,00

Prof. Cntia Paese Giacomello 45


9.1.1 Distribuies discretas mais importantes

As principais distribuies discretas so a Distribuio de Bernoulli, Distribuio


Binomial e Distribuio Poisson.

Distribuio de Bernoulli
A distribuio de Bernoulli consiste em uma distribuio adequada varivel aleatria de
Bernoulli, que por sua vez uma v.a. que assume apenas os valores 0 e 1, com funo de
probabilidade tal que:
P(0) = P(X=0) = 1- p
P(1) = P(X=1) = p

Ento, E(X)= p e Var(X)= p (1- p )

Distribuio Binomial
Seja um processo composto de uma seqncia de observaes independentes, onde o
resultado de cada observao pode ser um sucesso ou uma falha.
Se a probabilidade de sucesso constante e igual a p, a distribuio do nmero de
sucessos seguir o modelo Binomial.
A distribuio Binomial usada com freqncia no controle de qualidade. o modelo
apropriado quando a amostragem feita sobre uma populao infinita ou muito grande.

A distribuio binomial possui quatro propriedades essenciais:


1. As observaes possveis podem ser obtidas atravs de dois diferentes
mtodos de amostragem. Cada observao pode ser considerada como se
tivesse sido selecionada a partir de uma populao infinita sem reposio ou
a partir de uma populao finita com reposio.
2. Cada observao pode ser classificada em uma de duas categorias
mutuamente excludentes e coletivamente exaustivas, usualmente chamadas
sucesso ou falha.
3. A probabilidade de uma observao ser classificada como sucesso ( p )
constante de observao para observao. Assim sendo, a probabilidade de
fracasso 1-p tambm constante.
4. O resultado (isto , sucesso ou fracasso) de qualquer observao
independe do resultado de qualquer outra observao.

Em aplicaes de controle da qualidade, x em geral representa o nmero de defeituosos


observados em uma amostra de n itens.

Prof. Cntia Paese Giacomello 46


n n n!
P ( x ) = p x (1 p ) n x e =
x x x ! ( n x )!

n
onde representa o nmero de combinaes de n objetos tomados x de cada vez
x
P(X) = probabilidade de X sucessos uma vez que n e p so conhecidos
n = tamanho da amostra
p = probabilidade de sucesso  1-p = probabilidade de falha
X = nmero de sucessos na amostra (X=0, 1, 2, ..., n)
A mdia de uma varivel aleatria com distribuio binomial = np e a varincia
x
dada por 2 = np(1-p) onde p proporo de sucessos na amostra p =
n

Exemplo:
Um processo industrial opera com mdia de 1% de defeituosos. Baseado em amostras de
100 unidades, calcule as probabilidades de uma amostra apresentar 0 , 1 , 2 , 3 e 4
defeituosos. Plote a distribuio de probabilidade correspondente.
Como a varivel aleatria pode apresentar apenas duas possibilidades, ser boa ou
defeituosa, a distribuio que melhor se ajusta a distribuio binomial, com
parmetros p=0,01 e n=100.
Ento, a probabilidade de uma amostra de tamanho n = 100 apresentar 0
defeituosos

n 100
P( x ) = p x (1 p)n x  P(x=0) = P(0) = 0 ,010 (1 0 ,01)100 0 = 0,366
x 0

100 1
P(x=1) = P(1) = 0,01 (1 0,01)1001 = 0,370
1
100
P(x=2) = P(2) = 0,012 (1 0,01)100 2 = 0,185
2
100
P(x=3) = P(3) = 0,01 (1 0,01)
3 100 3
= 0,061
3
100
P(x=4) = P(4) = 0,014 (1 0,01)100 4 = 0,015
4

Prof. Cntia Paese Giacomello 47


0,4

0,3

P(x)
0,2

0,1

0
x=0 x=1 x=2 x=3 x=4

Exerccios:
1. Um processo opera segundo uma chance de falha de 2%. Coletando amostras de 25
unidades, qual a probabilidade de uma amostra selecionada apresentar 2
defeituosos ou menos.

2. Imagine que para o processo anterior, fossem coletadas amostras de 50 unidades e


o critrio para parar o processo e procurar causas especiais fosse X=1 ou mais.
Calcule a percentagem de vezes que o processo seria interrompido logo aps a
amostragem.

Distribuio de Poisson

A aplicao tpica da distribuio de Poisson no controle da qualidade como um modelo


para o nmero de defeitos (no-conformidades) que ocorre por unidade de produto (por
m 2 , por volume ou por tempo)
Diz-se que existe um processo de Poisson se pudermos observar eventos discretos numa
rea de oportunidade um intervalo contnuo (de tempo, de comprimento, de rea, ...) de
maneira tal que, se encurtarmos a rea de oportunidade ou intervalo suficientemente:
1. A probabilidade de se observar exatamente um sucesso no intervalo
estvel

Prof. Cntia Paese Giacomello 48


2. A probabilidade de se observar mais de um sucesso no intervalo zero
3. A ocorrncia de um sucesso em qualquer intervalo estatisticamente
independente da ocorrncia em qualquer outro intervalo

A distribuio de Poisson tem um parmetro (lambda) que a mdia ou o nmero


esperado de sucessos por unidade. A varincia desta distribuio 2 = . O nmero de
sucessos X da varivel aleatria de Poisson varia de 0 a .

A expresso matemtica para a distribuio de Poisson para se obterem X sucessos, dado


que sucessos so esperados :

e x
P( x ) = onde x=0,1,2,....
x!
onde P(X) = probabilidade de X sucessos, dado o conhecimento de
= nmero esperado de sucessos

e = constante matemtica (aproximadamente 2,71828)


X = nmero de sucessos por unidade

Exemplo:
Suponha que o nmero de defeitos no cordo de solda de uma carroceria siga uma
distribuio de Poisson com = 2.
Ento a probabilidade de uma carroceria apresentar mais de 3 defeitos ser:
P(X> 3) = 1 P(x 3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)]

e x e 2 2 0
Onde P( x ) =  P(0) = = 0,135
x! 0!
e 2 21
P(x=1) = P(1) = = 0,271
1!
P(x=2) = P(2) = 0,271 P(x=3) = P(3) = 0,180

Logo,
P(X> 3) = 1 P(x 3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)]
= 1 [0,135+0,271+0,271+0,180]
= 1 [0,857]
=0,143  14%
A probabilidade de uma carroceria apresentar mais de trs defeitos 14%.

Exemplo 2:

Prof. Cntia Paese Giacomello 49


Se chegam em mdia 2 carros por minuto em um posto de gasolina, qual a probabilidade
de que cheguem exatamente 5 carros em dois minutos?
Neste caso o tempo diferente do tempo correspondente ao . Ento deve-se transformar
o para que ele corresponda ao tempo de 2 minutos. Chegam em mdia 2 carros por
minuto  chegam em mdia 4 carros em 2 minutos
=4

e x e 4 45
P( x ) =  P (5) = = 0,1563 = 15,63%
x! 5!

Exerccios:
1. O setor financeiro de uma loja de departamentos est tentando controlar o nmero
de erros cometidos na emisso das notas fiscais. Suponha que esses erros sigam o
modelo de Poisson com mdia = 0,03. Qual a probabilidade de uma nota
selecionada ao acaso conter 1 ou mais erros?

2. Em uma indstria automotiva, defeitos superficiais de pintura ocorrem a uma taxa


de 0,15 defeitos/unidade. Encontre a probabilidade que uma unidade escolhida ao
acaso apresente 1 ou mais defeitos superficiais.

3. Em uma empresa industrial ocorrem, em mdia, 3 acidentes por ms. Qual a


probabilidade de que em um determinado ms, ocorra apenas um acidente?

4. Dez por cento das ferramentas produzidas por um certo processo de fabricao
revelaram-se defeituosas. Determinar a probabilidade de, em uma amostra de 10
ferramentas escolhidas ao acaso, exatamente duas serem defeituosas mediante o
emprego da distribuio de Poisson.

5. Se a probabilidade de um indivduo sofrer uma reao nociva, resultante da injeo


de um determinado soro 0,001, qual a probabilidade de, entre 2000 indivduos,
a) exatamente 3 sofrerem aquela reao? b) Mais de 2 sofrerem a reao?

Prof. Cntia Paese Giacomello 50


9.1.2 Distribuies contnuas

A distribuio mais importante e mais utilizada na prtica a Distribuio Normal.


Outros modelos importantes de distribuies contnuas so: Uniforme, Exponencial, Gama,
Qui-Quadrado, t de Student e F de Snedecor.

Distribuio Normal
A Distribuio Normal essencialmente importante na estatstica por trs razes
principais:
1. Inmeros fenmenos contnuos parecem segu-la ou podem ser aproximados por
meio dela
2. Podemos utiliz-la para aproximar vrias distribuies de probabilidade discretas
3. Ela oferece a base para a inferncia estatstica clssica, devido sua afinidade
com o teorema do limite central

Os parmetros da distribuio Normal so a mdia e o desvio padro. Trata-se de uma


distribuio simtrica, unimodal, em forma de sino.

A funo de probabilidade da distribuio normal dada por:


2
1 x

1 2
f ( x) = exp
2

onde: e = constante matemtica (aproximada por 2,71828)


= constante matemtica (aproximada por 3,14159)

= mdia aritmtica da populao

= desvio padro da populao

X = qualquer valor da varivel aleatria contnua onde - < X <

Prof. Cntia Paese Giacomello 51


99,73%

95,44%

68,26%

-1 +1

-2 +2

-3 +3

Para simplificar a notao de uma v.a.c. com distribuio normal, com mdia e varincia
2
utiliza-se:

X~ N( , 2 )
A distribuio Normal acumulada obtida calculando a probabilidade de X ser menor que
um dado valor a :
a
P( x a) = F(a) = f (x)dx

 Funo densidade acumulada

Essa integral no pode ser resolvida em forma fechada, mas a soluo est apresentada
em tabelas onde se entra com a varivel reduzida ou varivel padronizada Z e
encontra-se F(Z) ou vice-versa.
a
P( x a) = P Z = F(Z )

Valor tabelado (Procurar na tabela da distribuio Normal padronizada)

Prof. Cntia Paese Giacomello 52


Exemplo:
O peso de um produto uma caracterstica muito importante. Sabe-se que o peso segue
um modelo normal com mdia 1000 gramas e desvio padro 40 gramas. Se a especificao
tcnica estabelece que o peso deve ser maior que 950 gramas, qual a probabilidade de
que um pacote selecionado aleatoriamente satisfaa a especificao?
OBS: este esquema equivale

950 1000
P(x>950) = P Z > = P(Z > 1,25) = 0,3944 + 0,5000 = 0,8944
40

Tabelado
X=950 =1000 Z=-1,25 =0
=40 =1

A probabilidade de que um pacote selecionado aleatoriamente satisfaa a especificao


de 89%.

Exemplo 2: Sabe-se que X representa medies feitas em um processo que segue o


modelo Normal com mdia 100 e desvio padro 10. Se forem feitas 4000 medies,
quantas estaro entre 95 e 112?

95 100 112 100


P(95<x<112)= P <Z<
10 10
= P(-0,5<Z<1,2)
=100
=0,1915+0,3849 Valores tabelados
=10
=0,5764  Aproximadamente 58% estaro entre 95 e 112.

Se forem feitas 4000 medies, aproximadamente 2305 estaro entre 95 e 112. (4000 x
57,64%)

Prof. Cntia Paese Giacomello 53


Exerccios:
1. A resistncia trao do papel usado em sacolas de supermercado uma
caracterstica de qualidade importante. Sabe-se que essa resistncia segue um
modelo Normal com mdia 40 psi e desvio padro 2 psi. Se a especificao
estabelece que a resistncia deve ser maior que 35 psi, qual a probabilidade que
uma sacola produzida com este material satisfaa a especificao?

2. O dimetro do eixo principal de um disco rgido segue a distribuio Normal com


mdia 25,08mm e desvio padro 0,05mm. Se as especificaes para esse eixo so
25,00 0,15mm (isto , varia de 24,85 a 25,15mm), determine o percentual de
unidades produzidas em conformidades com as especificaes.

3. A resistncia trao de isoladores cermicos apresenta distribuio Normal com


mdia 95 Kg e desvio padro 4 Kg. Se so produzidas 10.000 unidades desses
isoladores, quantos apresentaro resistncia inferior a 85 Kg? E quantos
apresentaro resistncia superior a 90 Kg?

4. A sada de uma bateria segue o modelo Normal com mdia 12,15 V e desvio padro
0,2 V. Encontre o percentual que ir falhar em atender s especificaes 12 V
0,5 V.

Prof. Cntia Paese Giacomello 54


5. A vida til de lavadora de pratos automticas de 1,5 anos, com desvio padro 0,3
anos. Se os defeitos se distribuem normalmente, qual a probabilidade de uma
lavadora necessitar conserto antes de expirar o perodo de 1 ano de garantia?

6. O tempo necessrio, em uma oficina, para o conserto de transmisso para certo


carro normalmente distribudo com mdia 45 min e desvio padro 8 min. O
mecnico planeja comear o conserto do carro 10 min aps o cliente deix-lo na
oficina, comunicando que o carro estar pronto em 1 h. Qual a probabilidade de
que o cliente tenha que esperar caso o mecnico esteja enganado e o cliente fique
esperando?

7. Sabe-se que o contedo de uma lata de cerveja 350 ml e que tem distribuio
aproximadamente normal com mdia 350 ml e desvio padro 10 ml.
a. Que % de latas tem menos que 345 ml de contedo?
b. Que % de latas tem mais que 360 ml de contedo?

8. Uma fbrica de pneus fez um teste para medir o desgaste de pneus e verificou que
ele seguia o comportamento de uma curva normal com mdia 48.000 km e desvio
padro de 2.000 km. Calcule a probabilidade de um pneu escolhido ao acaso:
a. Dure mais que 47.000 km?
b. Dure entre 45.000 e 51.000 km?
c. At que quilometragem duram 90% dos pneus?

9. Descreva um exemplo de aplicao da distribuio normal na sua profisso. Qual


seria a mdia dos dados e o desvio padro?

Prof. Cntia Paese Giacomello 55


1 0 T e o r i a e l e m e n t a r d a a m o s t r a g em

A teoria da amostragem o estudo das relaes existentes entre uma populao e as


amostras dela extradas. muito utilizada para a estimao das grandezas desconhecidas
da populao ( parmetros ) atravs de conhecimento das grandezas correspondentes nas
amostras ( estatsticas amostrais ).
A teoria da amostragem tambm til para determinar se as diferenas observadas entre
duas amostras so devidas a uma variao casual ou so verdadeiramente significativas.
Por exemplo: queremos testar se os tempos de processamento da matria prima de dois
sistemas de produo so diferentes ou no. A resposta a esta questo implica o uso de
testes de hiptese, que ser visto mais adiante.
Denomina-se inferncia estatstica a inferncia de parmetros (da populao) com base
nos resultados obtidos na amostra.
Para que as concluses sejam vlidas, necessrio que a amostra selecionada seja
representativa da populao. Para isso podem ser utilizados os mtodos de amostragem
probabilsticos apresentados no captulo 1: aleatria, sistemtica, estratificada ou por
conglomerados. O mtodo mais utilizado o por amostragem aleatria.

10.1 Amostragem com e sem reposio


Quando selecionamos uma amostra devemos analisar se esta amostragem com ou sem
reposio. Na amostragem com reposio o mesmo elemento pode ser escolhido mais de
uma vez. Na amostragem sem reposio cada elemento s pode ser selecionado uma nica
vez.
Exemplo: uma urna contm dez bolas, numeradas de 0 a 9. Retira-se a primeira bola,
anota-se o nmero, 3 por exemplo, e no se recoloca a bola na urna. Os outros nmeros
que podem ser sorteados so 0, 1, 2, 4, 5, 6, 7, 8 e 9. Este sistema o sistema sem
reposio. Entretanto, se tivssemos recolocado a bola 3 na urna, ento todos os nmeros
poderiam ser selecionados na segunda extrao, inclusive o 3. Este sistema chamado
sistema com reposio.
Em geral, quando uma amostragem sem reposio, dizemos que a populao finita.
Quando uma amostragem com reposio, ento dizemos que a populao infinita, pois
a populao nunca ser exaurida. Para fins prticos a amostragem de uma populao finita
muito grande pode ser considerada infinita.

10.2 Distribuies amostrais


Consideremos todas as amostras possveis de tamanho n que podem ser retiradas de uma
populao dada (com ou sem reposio). Para cada amostra podemos calcular uma
grandeza estatstica, por exemplo, a mdia. Deste modo obtemos a distribuio amostral
da mdia. Da mesma forma podemos calcular a distribuio amostral do desvio padro, da
varincia, das propores, ...

Prof. Cntia Paese Giacomello 56


Distribuio amostral das mdias
Uma distribuio amostral de mdias uma distribuio de probabilidade que indica quo
provveis so diversas mdias amostrais. A distribuio funo da mdia, do desvio
padro da populao e do tamanho da amostra. Para cada combinao da mdia, desvio
padro e tamanho da amostra haver uma nica distribuio amostral de mdias.

Sejam:
x = mdia da populao =
x = mdia da distribuio amostral
x = desvio padro da populao =
x = desvio padro da distribuio amostral
N = tamanho da populao
n = tamanho da amostra

Admita-se que todas as amostras possveis de tamanho n sejam retiradas de uma


populao finita de tamanho N>n. Ento:

Nn
Populao Finita: x = e x =
n N 1

Se a populao for infinita, ou se amostragem for tomada com reposio, os resultados


sero:

x =
Populao Infinita: e x =
n

A frmula do desvio padro nos diz que a quantidade de disperso na distribuio amostral
depende de dois fatores:
- a disperso da populao
- o tamanho da amostra (utilizando raiz quadrada)
Por exemplo, em qualquer populao, o aumento do tamanho das amostras extradas
resultar em menor variabilidade entre as possveis mdias amostrais. E se o mesmo
tamanho de amostra usado com diferentes populaes, as populaes com maior
quantidade de disperso x tendero a gerar maior quantidade de variabilidade entre as
mdias de amostras extradas delas.

Para amostras grandes n>30 a distribuio amostral das mdias aproximadamente


normal, com mdia x e desvio padro x, independente da populao, desde que a
varincia e a mdia da populao sejam finitas e o tamanho da populao seja, no
mnimo, o dobro da amostra. Este resultado para populao infinita um caso especial do
Prof. Cntia Paese Giacomello 57
teorema do limite central da teoria avanada de probabilidade, que mostra que a preciso
da aproximao melhora quando n cresce. Isto indicado, algumas vezes, dizendo-se que
a populao assintoticamente normal. No caso da populao ser normalmente
distribuda, a distribuio amostral das mdias tambm o ser, mesmo para pequenos
valores de n (n<30).

Teorema do limite central


1. Se a populao sob amostragem tem distribuio normal, a
distribuio das mdias amostrais tambm ser normal para
todos os tamanhos de amostra.
2. Se a populao bsica no normal, a distribuio de mdias
amostrais ser aproximadamente normal para grandes
amostras.

Exemplos:
Calcule o desvio padro da distribuio amostral de mdias onde o desvio padro da
distribuio populacional 2 e o tamanho da amostra 40.
x 2
x = = = 0,3162
n 40

Determine a mdia das distribuies de mdias amostrais, sendo que a mdia populacional
678.
x = x = 678

A mdia de uma distribuio amostral de mdias 50 e seu desvio padro 10 (desvio


padro da distribuio amostral das mdias). Suponha normal a distribuio amostral.

Que percentagem das mdias amostrais estar entre 45 e 55?


O procedimento anlogo ao visto no captulo referente distribuio normal,
entretanto deve-se utilizar o valor de x = 50 e x =10.

Ento P(45< x <55)=0,3830

Um fabricante de baterias alega que seu artigo de primeira categoria tem uma vida
esperada (mdia) de 50 meses. Sabe-se que o desvio padro correspondente de 4
meses. Que percentagem de amostras de 36 observaes acusar vida mdia no intervalo
de 1 ms em torno de 50 meses, admitindo ser de 50 meses a verdadeira vida mdia das
baterias?
Sabemos que, como n>30, a distribuio das mdias amostrais ser
aproximadamente normal com mdia igual mdia populacional e desvio padro
igual ao desvio padro populacional dividido pela raiz quadrada do tamanho da

Prof. Cntia Paese Giacomello 58


amostra. Alm disso vamos pressupor populao infinita, pois a produo de baterias
no termina (teoricamente!)

???

49 50 51
Meses
x

A soluo envolve a determinao do nmero de desvios padres que 49 e 51 distam


da mdia (amostral).
Determinemos primeiro o desvio padro da distribuio amostral:
x 4
x = = = 0,67 para n=36
n 36
Ento devemos trabalhar com x N(50;0,67)
xx 49 50
P(49< x <51)  z =  = 1,5
x 0,67
51 50
 = +1,5
0,67
P(49< x <51)=P(-1,5<z<1,5) = 0,4332+0,4332=0,8664
Ento o percentual de amostras que apresentar problemas entre 49 e 51 meses
de 87%.

Prof. Cntia Paese Giacomello 59


Distribuio amostral das propores
Sendo a probabilidade de ocorrncia de um evento p (sucesso) e a probabilidade de no
ocorrncia 1-p (fracasso).
Consideram-se todas as amostras possveis de tamanho n de uma populao infinita e,
para cada amostra, determina-se a proporo de sucessos. Assim obtm-se a distribuio
amostral das propores.
A mdia da distribuio amostral sempre igual proporo p = p onde

p = proporo populacional

p = mdia da distribuio amostral das propores

Quando a populao muito grande ou infinita, o desvio padro da distribuio amostral


se calcula

p(1 p)
p =
n
e pode-se fazer uma aproximao para a distribuio normal quando n>30.

Exemplos:
Determine a mdia da distribuio de propores amostrais, quando a proporo na
populao 72,3%
p =p=72,3%

Determine o desvio padro da distribuio amostral de propores para n=100 e uma


proporo populacional de 60%

p(1 p) 0,6(1 0,6)


p = = = 0,049
n 100

Verificou-se que 2% das ferramentas produzidas por uma certa mquina so defeituosas.
Qual a probabilidade de que, em uma remessa de 400 dessas ferramentas, 3% ou mais
revelarem-se defeituosas?

p(1 p) 0,02 * 0,98


p =p=0,02 ep = = = 0,007
n 400
Como n>30 pode-se utilizar a distribuio normal, ento
0,03 0,02
P(p>0,03)=P( z > ) = P(z > 1,43) = 0,07636 = 7,636%
0,007

Prof. Cntia Paese Giacomello 60


Exerccios:
1. Determine a mdia da distribuio das propores amostrais quando a proporo na
populao ....
a. 30%
b. 99%
c. 54%

2. Calcule o desvio padro da distribuio amostral de mdias para cada um dos


seguintes casos:
a. x =6, n=6
b. x =6, n=20
c. x =6, n=40
d. x =6, n=100

3. Certas vlvulas fabricadas por uma companhia tm vida mdia de 800 horas e
desvio padro de 60 horas. Determinar a probabilidade de uma amostra aleatria
de 16 vlvulas, retiradas do grupo, ter vida mdia a) entre 700 e 810 horas;
b)inferior a 785 horas; c) superior a 820 horas; d) entre 770 e 830 horas.

4. Um fabricante faz a remessa de 1000 lotes de 100 lmpadas eltricas cada um. Se
5% das lmpadas so normalmente defeituosas, em quantos lotes pode-se esperar
que existam; a) menos de 90 lmpadas boas; b) 98 ou mais lmpadas boas

Prof. Cntia Paese Giacomello 61


11 Estimao

A estimao o processo que consiste em utilizar dados amostrais para estimar


parmetros populacionais.
As estatsticas amostrais so utilizadas como estimadores de parmetros populacionais.
Assim, uma mdia amostral usada como estimativa da mdia populacional, a proporo
de defeituosos de uma caixa utilizada para estimar a proporo de defeituosos na
produo toda, etc.
Tais estimativas chamam-se estimativas pontuais, porque originam apenas uma nica
estimativa do parmetro. Em virtude da variabilidade amostral, usual incluir uma
estimativa intervalar para acompanhar a estimativa pontual. Esta nova estimativa
proporciona um intervalo, ou mbito, de possveis valores do parmetro populacional.

Estimativa pontual: estimativa nica de um parmetro populacional


Estimativa intervalar: intervalo de valores possveis, o qual se admite que esteja
contendo o parmetro.

Um intervalo de confiana d um intervalo de valores, centrado na estatstica amostral, no


qual julgamos, com um risco conhecido de erro, estar o parmetro da populao.

Exemplos:
Parmetro Tipo de estimativa
populacional Pontual Intervalar

Mdia Um carro de motor 1.0 anda, em Um carro de motor 1.0 anda, em


mdia, 14 km com um litro de mdia, entre 12 e 16 km com 1
combustvel litro de combustvel

Proporo A proporo de peas defeituosas A proporo de peas defeituosas


de 2% est entre 1,5 % e 2,5 %

Desvio padro O desvio padro da temperatura O desvio padro da temperatura


numa piscina no aquecida da numa piscina no aquecida est
ordem de 2 o C entre 1 o C e 3 o C

Os intervalos de confiana podem ser unilaterais (por exemplo, a proporo de defeitos


maior de 3%) ou bilaterais (a proporo de defeitos est entre 2% e 4%).

Prof. Cntia Paese Giacomello 62


A capacidade de estimar parmetros populacionais por meio de dados amostrais est
ligada diretamente ao conhecimento da distribuio amostral da estatstica que est sendo
usada como estimador.
Os intervalos de confiana para os parmetros so construdos de forma que se considera
uma variao em torno do valor amostral e, assim, pode-se escrever que o parmetro
situa-se entre dois limites:
Valor do parmetro = estimativa pontual erro de amostragem
O erro de amostragem depende da distribuio amostral do parmetro, do nvel de
confiana adotado e do tamanho da amostra.
A tabela a seguir apresentada resume as informaes necessrias para intervalos de
confiana.

Populao
Infinita Finita

Estimativa de mdias
Pontual x x
Intervalar x conhecido x x Nn
xz xz
n n N 1
x desconhecido sx sx Nn
xt xt
n n N 1
Estimativa das propores
Pontual x x
p = p =
n n
Intervalar p(1 p) p(1 p) N n
pz pz
n n N 1

Onde:
z representa o valor tabelado da distribuio Normal, com nvel de confiana .
t representa o valor tabelado da distribuio t de Student, com nvel de confiana e GL
graus de liberdade1
N o tamanho da populao
n o tamanho da amostra

1
O valor da distribuio t de Student depende do nmero de graus de liberdade
Prof. Cntia Paese Giacomello 63
Exemplo:
Intervalo de confiana para a mdia quando se conhece a varincia de populao x
Seja uma amostra de tamanho 36 de uma populao infinita, sabe-se que x =3 e x =24,2

Confiana Z
Frmula Clculo E Intervalo
desejada (tabelado)
x 3
90% 1,65 xz 24,2 1,65 24,2 0,825 23,375 a 25,025
n 36
x 3
95% 1,96 xz 24,2 1,96 24,2 0,980 23,220 a 25,180
n 36
x 3
99% 2,58 xz 24,2 2,58 24,2 1,290 23,110 a 25,690
n 36

Tamanho da amostra
Uma das perguntas mais freqentes em estatstica : Qual o tamanho da amostra que
devemos tomar?
O tamanho da amostra depender do grau de confiana desejado (z), da quantidade de
disperso entre os valores individuais ( x ), e de certa quantidade especfica de erro
tolervel (e).
O tamanho da amostra que voc afinal selecionar depender de
seu oramento, da importncia econmica das decises e da
variabilidade na populao. Desses trs problemas, dois so de
ordem gerencial, cabendo a voc a deciso; apenas o terceiro
(variabilidade) est fora do seu controle .(Brenda Landy, citada no
livro Pesquisa de Marketing Naresh Malhotra. - 2001)

A frmula do erro pode ser resolvida em relao a n. Assim, para o caso de estimao de
mdias, tem-se:
2
x x
e=z  n=z  n = z x
n e e

E, para estimao de propores


2
p(1 p) p(1 p) z 2p(1 - p)
e=z  e = z
2


 n=
n n e2

Prof. Cntia Paese Giacomello 64


Que tamanho de amostra ser necessrio para produzir um intervalo de 90% de confiana
para a verdadeira mdia da populao, com erro de 1,0 em qualquer dos sentidos, se o
desvio padro da populao 10?
Sabemos que x =10 e e=1 e queremos um intervalo 90% de confiana para a
mdia, o que implica utilizar um valor de z=1,65.
2 2
10
n = z x  n = 1,65 = 272,25  tamanho da amostra 273.
e 1

As companhias de seguro esto ficando preocupadas com o fato de que o nmero


crescente de telefones celulares resulte em maior nmero de colises de carros. Esto, por
isso, pensando em cobrar prmios mais elevados para os motoristas que utilizam celulares.
Desejamos estimar, com uma margem de erro de trs pontos percentuais, a percentagem
de motoristas que falam ao celular enquanto dirigem. Supondo que se pretende um nvel
de confiana de 95% nos resultados, quantos motoristas devem ser investigados?
Suponha que no tenhamos nenhuma informao sobre p.

z 2p(1 - p) 1,96 2 0,5(1 - 0,5)


n=  n= = 1067,11  tamanho da amostra 1068.
e2 0,032

Exerccios:

1. Os dados a seguir representam a temperatura coletada aleatoriamente em 15


cidades do estado. Determine o intervalo de confiana 90% para a temperatura
mdia. No dispomos da varincia populacional, mas sabemos que a populao
infinita. Dispomos apenas das seguintes informaes.

23 40 30 21 34

20 38 26 23 38

33 32 24 21 24

2. Uma amostra aleatria de 40 contas no comerciais na filial de um banco acusou


saldo mdio dirio de R$ 140 com desvio padro de R$ 30.
a. Construa um intervalo de 90% de confiana para a verdadeira mdia
b. Construa um intervalo de 95% de confiana para a verdadeira mdia
c. Construa um intervalo de 99% de confiana para a verdadeira mdia

Prof. Cntia Paese Giacomello 65


3. Uma firma emprega diversos vendedores. Numa amostra aleatria de 15 notas de
despesa numa semana de dezembro, um auditor constatou uma despesa mdia de
R$ 220, com desvio padro de R$ 20.
a. Qual a estimativa pontual da despesa mdia?
b. Construa um intervalo de 99% de confiana para a quantia de despesa
mdia por vendedor.
c. Admitindo-se 200 vendedores, qual seria a estimativa pontual mdia para o
total de despesas?
d. Construa um intervalo de 99% de confiana para a quantia de despesa total.

4. Uma amostra aleatria de 40 homens trabalhando num grande projeto de


construo revelou que 6 no usavam capacetes protetores.
a. Construa um intervalo de 95% de confiana para a verdadeira proporo dos
que no esto utilizando capacetes neste projeto.
b. Se h 1000 operrios no projeto, converta o percentual em nmero de
capacetes necessrios para que todos estejam seguros.

5. Uma amostra aleatria de 1000 fregueses da parte da manh de um supermercado


revelou que apenas 10 no incluem leite em suas compras.
a. Qual seria a estimativa pontual da percentagem dos que compram leite?
b. Construa um intervalo de 90% de confiana para a verdadeira proporo dos
que compram leite.

6. Qual o tamanho de amostra necessrio para estimar o tempo mdio de que um


vendedor de uma loja de mveis gasta com cada cliente, admitindo erro de 1
minuto, para mais ou para menos, para obter um nvel de confiana de 99%.
Suponha x=12 minutos.

Prof. Cntia Paese Giacomello 66


7. Determine o nmero de observaes necessrio para estimar o tempo mdio de
servio de atendimento a chamadas de um bombeiro hidrulico, se o erro mximo
deve ser de 0,6 hora para um nvel de confiana de 95%, sabendo que o tempo de
atendimento tem um desvio padro de 1 hora. Suponha normalidade na populao.

8. Um engenheiro deseja estimar a quantidade de acar existente nos alimentos


produzidos pela empresa. Ele coletou uma amostra de 18 unidades do alimento e
verificou mdia 24 gr de acar, com desvio padro de 5 gr. Construa o intervalo
de confiana de 90% para a quantidade de acar presente nos alimentos.

9. Numa pesquisa com funcionrios de uma empresa questionou-se a satisfao com a


poltica desenvolvida pela diretoria. De 300 funcionrios, 36 estavam insatisfeitos.
Construa uma estimativa para a proporo de funcionrios insatisfeitos, com 95%
de confiana.

10. O IBOPE est interessado em estimar a proporo de residncias que assistem ao


programa do Fausto. Qual o nmero mnimo de residncias que se deve analisar
para ter 95% de confiana e margem de erro mxima de 0,03 para a estimativa?

Prof. Cntia Paese Giacomello 67


12 Testes de h ipteses
Os testes de hipteses so tambm conhecidos como testes de significncia.
A finalidade dos testes de hipteses avaliar afirmaes sobre os valores de parmetros
populacionais.
Os testes de hipteses e a estimao so dois ramos principais da inferncia estatstica.
Enquanto o objetivo da estimao estimar algum parmetro populacional, o objetivo dos
testes de hipteses decidir se determinada afirmao sobre um parmetro populacional
verdadeira. Por exemplo, podemos querer determinar se so verdadeiras as afirmaes:
- o tempo mdio de realizao do teste 80 minutos
- trs por cento da populao (de determinado item) defeituosa
- os percentuais de no conformes dos dois processos so iguais

Utilizam-se duas hipteses, sendo chamadas de hiptese nula (H 0 ) e hiptese alternativa


(H 1 )

A hiptese nula H 0 uma afirmao que diz que o parmetro


populacional tal como especificado (isto , a afirmao
verdadeira)
A hiptese alternativa H 1 uma afirmao que oferece uma
alternativa alegao (isto , o parmetro maior (ou menor)
que o valor alegado)

Exemplo: O estudo de uma amostra de tamanho 55 peas indicou que o dimetro mdio
de 27,5 mm. Ento:
H 0 : o dimetro mdio da populao (de peas) 27,5 mm
H 1 : o dimetro mdio da populao (de peas) diferente de 27,5 mm

Os testes de hiptese utilizam a significncia adotada pelo pesquisador. A significncia a


probabilidade de uma hiptese nula ser rejeitada, quando verdadeira. Que coincide com o
erro tipo I.

Ao testar uma hiptese, h dois tipos de erros que podemos cometer:


= P {rejeitar H 0 / H 0 verdadeira} = erro do tipo I

= P {aceitar H 0 / H 0 falsa} = erro do tipo II

O procedimento usual fixar o valor de e verificar o valor de . O risco uma funo


do tamanho da amostra, e controlado indiretamente. Quanto maior o tamanho da
amostra, menor ser o risco .

Prof. Cntia Paese Giacomello 68


Se H 0

Verdadeira Falsa

Aceitar H 0 Deciso correta Erro tipo II ( )


Ao
Rejeitar H 0 Erro tipo I ( ) Deciso correta

Basicamente os testes de hiptese envolvem as seguintes etapas:


1. Estabelecer as hipteses nula e alternativa;
2. Identificar a distribuio amostral adequada;
3. Escolher um nvel de significncia (e assim os valores crticos);
4. Calcular a estatstica do teste e compar-la com os valores crticos;
5. Rejeitar a hiptese de nulidade se a estatstica do teste excede o(s) valor (es)
crtico(s); caso contrrio, aceit-la.

Os testes de hiptese podem ser unilaterais ou bilaterais. Nos testes unilaterais a hiptese
alternativa H 1 do tipo >33 ou <33, por exemplo. Nos testes bilaterais a hiptese
alternativa do tipo 33. A hiptese nula permanece igual nos dois casos. A rea de
rejeio dividida quando o teste bilateral.

H 1 : <33 H 1 : 33 H 1 : >33

/2 /2

Rejeitar H 0 Rejeitar Rejeitar Rejeitar H 0


H0 H0

Exerccios
1. Para cada um dos seguintes casos, trace uma curva normal, indicando a rea de
rejeio na figura.
a) H 0 : =10, H 1 : 10, =0,02
b) H 0 : =120, H 1 : 120, =0,05
c) H 0 : =2000, H 1 : 2000, =0,01
d) H 0 : =2000, H 1 : >2000, =0,01
e) H 0 : =2000, H 1 : < 2000, =0,01

Prof. Cntia Paese Giacomello 69


2. Um fornecedor de mancais comprometeu-se a enviar para uma firma lotes que no
contenham mais de 2% de defeituosos. O comprador extrai amostras ao receber a
remessa, para verificar a qualidade. Indique H0 e H1.

3. Um engenheiro acredita que o tempo para produo de um motor de 5 horas. Ele


analisa uma amostra para verificar se est certo ou no. Escreva H0 e H1

12.1 Teste de hipteses para mdias

x conhecido

Quando se conhece o desvio padro da populao, a distribuio amostral adequada a


distribuio normal. Se a populao normal, a distribuio amostral ser normal para
todos os tamanhos de amostra. Se a populao no normal, ou se sua forma
desconhecida, pode-se usar um teste de uma amostra s para tamanhos de amostras
superiores a 30 observaes. Assim, pequenas amostras de populao no normais no
podem ser tratadas por este processo.

Suponha que X uma varivel aleatria com mdia desconhecida e varincia 2 x


conhecida. E queremos testar a hiptese de que a mdia igual a um certo valor
especificado 0 . O teste de hiptese pode ser formulado como segue:
H 0 : = 0
H 1 : 0
Para testar a hiptese, toma-se uma amostra aleatria de n observaes e calcula-se a
estatstica

x o
z teste =
x E H 0 rejeitada se |Z teste | > Z /2 (obtido em uma tabela da

n
distribuio normal).

Prof. Cntia Paese Giacomello 70


Exemplo:
Uma mquina de usinagem deveria produzir entalhes com 0,85 mm de profundidade. O
engenheiro desconfia que os entalhes que esto sendo produzidos so diferentes que o
especificado.

Uma amostra de 8 valores foi coletada e indicou X = 0,847 . Sabendo que o desvio padro
=0,010, teste a hiptese do engenheiro usando um nvel de significncia =0,05.
H o : = 0,850
H1 : 0,850

0,847 0,850
Z teste = = 0,85
0,010 / 8
Como Z teste = 0,85 > Z 0 ,025 = 1,96 H 0 no pode ser rejeitada.

Concluso: no podemos afirmar que os entalhes sejam diferentes que o especificado, ao


nvel de significncia de 0,05.

x desconhecido

Quando no se conhece o desvio padro da populao, deve-se estim-lo a partir dos


dados amostrais usando o desvio padro amostral. Quando isso ocorre (na maioria das
situaes reais x desconhecido), a distribuio t a distribuio amostral adequada.
Suponha que X uma varivel aleatria Normal com mdia e varincia 2
desconhecidas. Para testar a hiptese de que a mdia igual a um valor especificado o ,
formulamos:
Ho : = 0
H1 : o

Esse problema idntico quele da seo anterior, exceto que agora a varincia
desconhecida.

Como X no conhecido, usa-se a distribuio de Student para construir a estatstica do


teste:

x o
t teste =
sx
n

E a hiptese nula H 0 rejeitada se |t teste |>t /2 , onde t /2, n-1 um valor limite da
distribuio de Student tal que a probabilidade de se obter valores externos a t /2 .

Prof. Cntia Paese Giacomello 71


12.2 Testes de duas amostras para mdias
Os testes de duas amostras so usados para decidir se as mdias de duas populaes so
iguais. Exigem-se amostras independentes, ou seja, uma de cada populao. Eles so
freqentemente utilizados para comparar dois mtodos de ensino, duas cidades, duas
marcas, duas fbricas, ....
OBS: dados provenientes de antes-depois so dependentes, no podendo, portanto, serem
tratados por este mtodo.

x conhecido

Quando h duas populaes com mdias desconhecidas, digamos a e b e desvios


padres conhecidos, a e b , o teste para verificar a hiptese que as mdias sejam iguais
o seguinte:
Ho : 1 = 2
H1 : 1 2

X1 X 2
Z teste =
12 22
+
n1 n2

E rejeita-se H 0 se |Z teste | > Z /2

x desconhecido

Similarmente, quando , a e b , no so conhecidos, o teste para verificar a hiptese que


as mdias sejam iguais :

X1 X 2
t teste =
S 2x1 S 2x 2
+
n1 n2

E rejeita-se H 0 se |t teste | > t /2, n1+n2-2

12.3 Teste para propores


Este tipo de teste apropriado quando os dados sob anlise consistem de contagem ou
freqncias de itens em duas ou mais classes. A finalidade de tal teste avaliar
afirmaes sobre a proporo (ou percentagem) de uma populao. O teste se baseia na
premissa de que uma proporo amostral ser igual verdadeira proporo populacional,
a menos da variabilidade amostral. O teste foca na diferena entre o nmero esperado de
ocorrncias (supondo-se verdadeira uma afirmao) e o nmero efetivamente observado.
A diferena ento comparada com a variabilidade prescrita por uma distribuio amostral
baseada na hiptese de que H 0 realmente verdadeira.

Prof. Cntia Paese Giacomello 72


Quando a finalidade da amostragem julgar a validade de uma alegao acerca de uma
proporo populacional, apropriado o teste para propores.Onde:
H0: p = p0
H1: p p0

O valor da estatstica de teste dado por


x p
z teste = n 0

p0 (1 p0 ) / n

e deve ser comparada com o valor crtico de Z (retirado de uma tabela da distribuio
normal)

Exemplo:
Um fabricante afirma que uma remessa de pregos contm menos de 1% de defeituosos.
Uma amostra aleatria de 200 pregos acusa 4 defeituosos. Teste a afirmao ao nvel
0,01.
H 0 : p = 1%
H 1 : p > 1%  pois desejamos evitar a aceitao de uma remessa com mais de
1% de defeituosos, mas nada h contra aceitar o fato da remessa apresentar
qualidade superior acordada.

x p 4 0,01
z teste = n 0
= z teste = 200 = 1,42
p0 (1 p0 ) / n 0,01(1 0,01) / 200

Na tabela da distribuio normal, z 0,01 =2,33


Aceita-se H 0 , e pode-se dizer que a quantidade de pregos defeituosos 1% ou
menos, ao nvel de significncia 0,01.

12.4 Teste do qui-quadrado (k amostras para propores)


A finalidade de um teste de k amostras avaliar se as propores de k amostras
independentes provenham de populaes que contenham a mesma proporo de
determinado item. Conseqentemente, tem-se:
H 0 : As propores populacionais so todas iguais
H 1 : As propores populacionais no so iguais
Ou seja, estamos testando se as duas variveis so ou no associadas, por exemplo, se
queremos testar se a proporo de mulheres e de homens que trabalham no horrio

Prof. Cntia Paese Giacomello 73


noturno em uma fbrica so iguais, automaticamente estaremos testando se sexo e turno
de trabalho so variveis associadas.

Este teste baseia-se na distribuio qui-quadrado, onde o valor calculado deve ser
comparado com o valor tabelado. A deciso de aceitar ou rejeitar H 0 depender da
comparao deste valor com o valor tabelado da distribuio qui-quadrado.

Por exemplo, tem-se a distribuio de peas produzidas por turno e se essas peas so
boas ou apresentam algum tipo de defeito. No turno da manh foram produzidas 967
peas, onde 183 apresentaram algum tipo de defeito.

Turno de produo
Total
Manh Tarde Noite

Peas com algum defeito 183 30 11 224


Peas boas 784 264 308 1356

Total 967 294 319 1580

O teste baseia-se na pressuposio que, se as duas variveis fossem independentes, ento


o valor esperado de cada clula poderia ser encontrado fazendo-se:

(total _ linha) x (total _ coluna)


Frequncia _ Esperada =
total _ geral
Neste caso, a tabela com as freqncias esperadas seria:

Tabela de freqncias esperadas

Turno de produo
Total
Manh Tarde Noite

Peas com algum defeito 137,1 41,7 45,2 224


Peas boas 829,9 252,3 273,8 1356

Total 967 294 319 1580

224 x 967
Freq _ esperada = = 137,1
1580

Prof. Cntia Paese Giacomello 74


O teste de independncia qui-quadrado obtido utilizando-se a estatstica

(O E) 2
2 = E
Se o valor obtido for maior que o valor crtico obtido na tabela 2 ento diz-se que as
variveis NO so independentes. Se o valor encontrado for menor, ento diz-se que as
variveis so independentes.
O valor dos GRAUS DE LIBERDADE obtido atravs do clculo:
graus de liberdade = (colunas-1)(linhas-1)
No exemplo apresentado:

2 (183 137,1) 2 (30 41,7) 2 (308 273,8) 2


= + + ... + = 51,88
137,1 41,7 273,8
e o valor crtico encontrado na tabela para (2-1)x(3-1)=2 graus de liberdade e nvel de
significncia 0,05 5,991.

Tem-se valor calculado > valor tabelado ento diz-se que as variveis NO so
independentes. OU SEJA, a proporo de peas boas produzidas depende do turno de
trabalho. A proporo de peas boas no turno da manh 81%, na tarde 90% e na noite
97%.

Exerccios:
1. Um fornecedor apresenta uma caixa, e afirma que o peso mdio desta caixa de
368 gramas. De experincias anteriores sabe-se que o desvio padro da populao
vale 15 g e que os valores se comportam segundo a distribuio Normal. Para
verificar se a afirmao verdadeira, verifica-se uma amostra de 25 caixas, pesa-se
e calcula-se o peso mdio da amostra, achando 372,5 g. Qual a concluso a
respeito da afirmao do fornecedor, ao nvel de significncia 0,01?

2. Uma agncia de empregos alega que os candidatos diretoria por ela colocados
nos ltimos seis meses tm salrios de R$ 9000, em mdia. Uma agncia
governamental extraiu uma amostra aleatria daquele grupo, encontrando salrios
mdios de R$ 8000, com desvio padro de R$ 1000, com base em 50 empregados.
Teste a afirmao da agncia, contra a alternativa, de que o salrio mdio
inferior a R$ 9000, ao nvel de significncia 0,05.

Prof. Cntia Paese Giacomello 75


3. O gerente de marketing de uma fbrica de automveis est interessado em
determinar a proporo de novos proprietrios de carros compactos que teriam
adquirido um air-bag inflvel para o lado do passageiro se o mesmo estivesse
disponvel a um custo adicional de $ 300,00. Por informaes anteriores, o gerente
acredita que a proporo 30%. Suponha que feito um levantamento com 200
novos proprietrios de carros compactos e 79 indiquem que teriam comprado os
air-bags inflveis. No nvel de significncia de 0,05, h evidencias de que a
proporo da populao diferente de 0,3?

4. Suponha que o diretor de produo de uma fbrica de tecidos precise determinar se


uma nova mquina est produzindo um tipo de tecido de acordo com as
especificaes do fabricante. As especificaes indicam que o tecido devia ter uma
resistncia de rompimento superior a 70 libras (1 libra = 433,59 gramas) e um
desvio padro de 3,5 libras. Uma amostra de 36 peas revela uma mdia aritmtica
da amostra igual a 69,7 libras. H evidncias de que a mquina no est atendendo
s especificaes, em termos da mdia da resistncia de rompimento? (utilize um
nvel de significncia de 0,05)

5. Uma rede de postos de gasolina afirma que, em seus estabelecimentos no se


vende gasolina adulterada. Sabe-se que, de acordo com os padres de qualidade, a
gasolina no pode conter mais de 240 ml de lcool por litro. O rgo de fiscalizao
colheu 25 medies do produto nos postos dessa rede, obtendo a partir delas uma
mdia de 240,75 ml de lcool/litro. Admitindo-se que a quantidade de lcool
presente na gasolina tem uma distribuio normal com desvio-padro de 2,5
ml/litro. Ao nvel de significncia 5%, pode-se afirmar que a gasolina adulterada?

Prof. Cntia Paese Giacomello 76


6. Um psiclogo de indstrias deseja estudar os efeitos da motivao nas vendas, em
determinada empresa. Foi selecionada uma amostra aleatria de 24 indivduos, 12
de cada grupo. Os dados a seguir representam o volume de vendas (em milhares
de reais) alcanado durante o primeiro ms de emprego. H evidncias de que o
volume mdio de vendas seja diferente entre os grupos? (utilize nvel de
significncia 0,05)
Por hora Comisso
256 207 224 285
212 219 261 225
239 228 254 237
216 225 228 232
222 241 273 277
236 230 234 245

7. No caso judicial EUA versus Cidade de Chicago, foram postas em dvida as prticas
honestas de emprego. Um grupo minoritrio (A) e um grupo majoritrio (B) fizeram
o exame para capito do corpo de bombeiros, com os seguintes resultados:
Aprovados Reprovados
Grupo A 10 14
Grupo B 417 145
Com os resultados acima, e com nvel de significncia de 5%, teste a afirmao de
que o sucesso no teste independente do grupo.

8. Solicitou-se a quatro amostras de 30 funcionrios de uma grande empresa que


opinassem sobre a nova direo da empresa. Ao nvel de significncia 0,01, o que
se pode concluir?
Estagirios Treinees Tcnicos Gerentes
Aprovam 5 4 20 27
Desaprovam 25 26 10 3

Prof. Cntia Paese Giacomello 77


9. Um estudo de usurios e no usurios do cinto de segurana resultou nos dados
amostrais aleatrios resumidos na tabela a seguir. Teste a afirmao de que a
quantidade de fumo independente do uso do cinto de segurana. Uma teoria
plausvel que as pessoas que fumam mais esto menos preocupadas com a sua
sade e segurana, sendo assim, menos propensas a usar cintos. Com nvel de
significncia 0,01, os dados amostrais apiam esta teoria?
Nmero de cigarros fumados por dia
0 1-14 15-34 35 ou +
Usam cinto de segurana 175 20 42 6
No usam cinto de segurana 149 17 41 9

10. A tabela abaixo apresenta dados relativos ao time vencedor em diferentes esportes.
Com o nvel de 0,05 de significncia, teste a afirmao de que as vitrias
casa/visitante so independentes do esporte.
Basquete Beisebol Hockey Futebol
O time da casa ganha 127 53 50 57
O time visitante ganha 71 47 43 42

Prof. Cntia Paese Giacomello 78


13 Anlis e de vari ncia (ANOVA - Analys is of Var ianc e)

H situaes onde se deseja comparar vrias mdias, cada uma oriunda de um grupo
diferente. Esses grupos, tambm chamados tratamentos, poderiam ser 5 mquinas de
corte, ou 4 presses de operao, ou 4 layouts , 5 planos econmicos do governo, taxas
de cmbio em 3 diferentes pases, resultados da implantao de um novo sistema em duas
filiais, etc.

Exemplo:
Para verificar se existe diferena significativa entre os salrios mdios dos economistas da
Regio Sul, o sindicato da classe resolveu analisar os dados de algumas amostras. Assim
foram selecionados aleatoriamente 5 economistas de cada estado.

Econ.1 Econ.2 Econ.3 Econ.4 Econ.5

Rio Grande do Sul 370 420 280 340 410


Santa Catarina 280 350 430 290 405
Paran 325 400 295 350 380

Exemplo:
Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram

Mtodo A 5 0 3 5 4 5 8 2
Mtodo B 4 5 4 7 5 10 3 10
Mtodo C 3 5 0 3 3 9 4 9

Prof. Cntia Paese Giacomello 79


Nesses casos, os dados foram tabelados conforme aparecem a seguir:

Tratamento Observaes
1 Y11 , Y12 ... Y1n1
2 Y21 , Y22 ... Y2n2
: :
: :
: :
k Yk1 , Yk2 ... Yknk

Os resultados poderiam ser representados por um modelo aditivo:

Yij = + i + ij ; i = 1,....., k
j = 1, ..., ni

Onde Y ij a observao j medida no tratamento i;

a mdia geral de todas as observaes;


i o efeito do tratamento i;
ij o erro aleatrio. (OBS: Para fins de testes de hiptese, supomos que o
erro aleatrio ij segue um modelo normal com mdia 0 e varincia 2
aproximadamente igual para todos os tratamentos)

Nosso objetivo ser testar a hiptese referente ao efeito dos tratamentos e estimar esses
efeitos, ou seja, verificar se existe diferena significativa entre os resultados apresentados
por cada grupo.

Existem dois tipos de problemas a serem abordados:


Modelo a nveis fixos: quando o efeito de cada tratamento fixo, como no caso em que
os tratamentos so 4 presses de operaes, ou 4 layouts fixados pelo engenheiro;
Modelo a nveis aleatrios: quando o efeito de cada tratamento aleatrio, como no
caso em que os tratamentos so k lotes de produo, ou k operadores escolhidos
aleatoriamente.

Prof. Cntia Paese Giacomello 80


No modelo a nveis fixos, os efeitos dos tratamentos so definidos como desvios da mdia
geral, tais que:

H 0 : 1 = 2 = ..... = k
H 1 : i j para alguns i, j

Na H o (hiptese nula) supe-se que todas as mdias sejam iguais, ou seja, os


economistas tm o mesmo salrio nos trs estados (e as diferenas entre os seus salrios
so devidas ao acaso) ou os trs mtodos de ensino so equivalentes.
A H 1 (hiptese alternativa) indica que pelo menos uma das mdias difere, ou seja,
existem pelo menos dois estados com salrios diferentes entre si ou pelo menos dois
mtodos de ensino diferem.

O procedimento utilizado para comparar simultaneamente todos os grupos chamado de


Anlise de Varincia, que ser visto a seguir.

A anlise de varincia uma tcnica que pode ser


usada para determinar se as mdias de duas ou mais
populaes so iguais. O teste se baseia numa
amostra extrada de cada populao.

A Anlise de Varincia uma tcnica para investigar quanto de variabilidade em um


conjunto de observaes (dados) pode ser descrito por diferentes causas.

Os clculos associados Anlise de Varincia so apresentados em uma tabela, chamada


de Tabela de Anlise de Varincia ou Tabela ANOVA

Fonte de variao SQ GDL MQ Teste F

Entre grupos SQG k-1 MQG MQG/MQR


Dentro de grupos SQR N-k MQR

Total SQT N-1

onde k o nmero de nveis do fator.


N a quantidade total de observaes

Prof. Cntia Paese Giacomello 81


A Anlise de Varincia se baseia na decomposio da variabilidade total. Mais
especificamente, os desvios das observaes individuais em relao mdia global podem
ser escritos como:

(Yij Y.. ) = (Y i. ) (
Y.. + Yij Y i . ) (1)
onde:

(Y i. Y .. ) o desvio da mdia do tratamento i em relao mdia global;

(Yij Y i. )
o desvio da observao individual em relao mdia do tratamento
correspondente;

Elevando ao quadrado ambos os termos da equao (1) e efetuando o somatrio, resulta:


2 2 2
(Yij Y .. ) = ni (Y i. Y.. ) + (Yij Yi. )
i, j i ij
(2)
Na equao (2), identificamos as seguintes somas quadradas:
SQT = SQG + SQR
onde:
SQT  a soma dos quadrados totais, decomposta em:
SQG  soma dos quadrados dos grupos (tratamentos), associada exclusivamente a um
efeito dos grupos;
SQR  soma dos quadrados dos resduos, devida exclusivamente ao erro aleatrio, medida
dentro dos grupos.
As divises das somas de quadrados (SQ) pelos graus de liberdade fornecem as mdias
quadradas (MQ), que so as estimativas de variabilidade de cada parcela.

Os graus de liberdade so obtidos atravs do nmero de nveis do fator e da quantidade


de repeties para cada nvel, ou seja, se o fator tem 5 nveis, ter 4 graus de liberdade
(k-1). Os graus de liberdade totais so obtidos atravs do total de observaes menos 1
(N-1) e os graus de liberdade dentro dos grupos ser a diferena entre eles (N-1)-(k-1) =
(N-k).

Para testar a hiptese referente ao efeito dos grupos, usamos a distribuio F :

MQG
F=
MQR

Prof. Cntia Paese Giacomello 82


O valor resultante do teste F deve ser comparado com uma tabela de valores F, que indica
o valor mximo da estatstica no caso de H o ser verdadeira, a um determinado nvel de
confiana.
Como o valor tabelado de F contnuo e depende da combinao dos graus de liberdade
do numerador e do denominador, usual apresentar seus valores apenas para os nveis de
confiana 0,05 e 0,01. Os graus de liberdade para a determinao do valor F so os
mesmos apresentados na tabela da ANOVA.
Os valores constantes na tabela F so valores crticos: apresentam a linha divisria entre a
variao aleatria e a no aleatria. Ao fazer a anlise de varincia, utilizam-se as duas
estimativas amostrais da varincia para calcular uma razo F. Compara-se ento o nmero
resultante com o nmero tabelado. Se o valor calculado maior que o valor tabelado,
rejeita-se a hiptese nula. Se o valor calculado menor que o valor tabelado, a hiptese
nula no pode ser rejeitada.

Distribuio F

Concluir pelo Concluir pelo


acaso no-acaso
Aceitar Ho Rejeitar Ho

Nvel de significncia = rea da cauda

Valor tabelado

13.1 Formulrio para soluo


Para o clculo das Somas Quadradas recomendado o uso do seguinte formulrio:

TC = ( T .. )2 N
SQT = ( Yij2 ) TC
SQG = ( Ti 2. ni ) TC
SQR = ( Yij2 ) ( Ti .2 ni ) = SQT SQG

onde
TC o termo de correo
T.. a soma de todas as observaes
Ti. a soma das observaes no grupo i

Prof. Cntia Paese Giacomello 83


Resolvendo o exemplo dos mtodos de ensino atravs deste formulrio obtm-se:
Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram

Mtodo A 5 0 3 5 4 5 8 2
Mtodo B 4 5 4 7 5 10 3 10
Mtodo C 3 5 0 3 3 9 4 9

k = 3 (trs nveis do fator, mtodo A, B e C)


N = 24 (oito alunos por mtodo)
T.. = 5 + 0 + 3 + ... + 4 + 9 = 116 (somar todas as observaes)
T A. = 5 + 0 + 3 + 5 + 4 + 5 + 8 + 2 = 32 (somar as observaes do mtodo A)
T B. = 48 (somar as observaes do mtodo B)
T C. = 36 (somar as observaes do mtodo C)

TC = 116 2 / 24 = 560,67
SQT = (5 2 + 0 2 + 3 2 + ... + 4 2 + 9 2 ) 560,67 = 738 560,67 = 177,33
322 482 362
SQG = + + 560,67 = 578,00 - 560,67 = 17,33
8 8 8

SQR = SQT SQG = 177,33 17,33 = 160,00

Ento a tabela da ANOVA ficaria:

Fonte de variao SQ GDL MQ Teste F

Entre grupos 17,33 2 8,67 1,14


Dentro de grupos 160,00 21 7,62

Total 177,33 23

O valor de F tabelado com 2 e 21 graus de liberdade no numerador e denominador,


respectivamente, e nvel de significncia de 0,05 F 0,05 3,49. Como F calculado < F
tabelado, conclumos que no h evidncias de que os mtodos de ensino alterem a
aprendizagem das crianas, ou seja, os mtodos de ensino devem ser equivalentes.

Prof. Cntia Paese Giacomello 84


Utilizando o Excel
Clique em Ferramentas e depois em Anlise de Dados. (OBS: Se no seu
computador no aparecer Anlise de Dados porque este suplemento no est
ativado. V em Ferramentas, depois Suplementos. Disponibilize Anlise de
Dados e Anlise de Dados VBA.)

Selecione ANOVA Fator nico.


Preencha com as informaes que forem necessrias.

13.2 Exemplo de soluo no Excel


Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram

Mtodo A 5 0 3 5 4 5 8 2
Mtodo B 4 5 4 7 5 10 3 10
Mtodo C 3 5 0 3 3 9 4 9

Os dados devem agrupados em linhas ou colunas.

ou

No menu Ferramentas e Anlise de Dados, aps selecionar ANOVA fator nico.


Prof. Cntia Paese Giacomello 85
Na janela da ANOVA informar as questes que forem solicitadas.

Os resultados estaro localizados na planilha chamada resultados.

Anova: fator nico


RESUMO
Grupo Contagem Soma Mdia Varincia
Mtodo A 8 32 4,0 5,714
Mtodo B 8 48 6,0 7,429
Mtodo C 8 36 4,5 9,714
Tabelado

Calculado
ANOVA
Fonte da variao SQ gl MQ F valor-P F crtico
Entre grupos 17,33 2 8,67 1,14 0,340 3,47
Dentro dos grupos 160,00 21 7,62

Total 177,33 23

Prof. Cntia Paese Giacomello 86


Exerccios:
1. Suponha que o valor crtico de F na anlise de varincia seja 1,99 ao nvel de 0,05.
Com base na figura: a) Como voc interpretaria uma estatstica de teste maior que
1,99? b) Como voc interpretaria uma estatstica de teste menor que 1,99?

Distribuio F

0,05
0

1,99

2. Duas turmas de pilotos de corrida de automveis esto sendo treinadas para uma
grande corrida no domingo. Cada turma faz cinco provas de troca dos quatro pneus
num carro. As turmas so equivalentes ou uma delas superior, ao nvel de
significncia 0,05? Complete a tabela da ANOVA e conclua a respeito.

Fonte de variao SQ GDL MQ Teste F

Entre grupos
Dentro de grupos 0,12

Total 0,22

3. Realiza-se um experimento para determinar-se as produes de cinco variedades de


trigo: A, B, C, D e E. So atribudos quatro lotes de terra para cada variedade e as
produes, em toneladas, esto apresentadas na tabela. Supondo-se que os lotes
possuem fertilidades semelhantes e que as variedades so atribudas aos lotes
aleatoriamente, determinar se existe diferena entre as produes ao nvel de
significncia 0,01.

A 20 12 15 19
B 17 14 12 15
C 23 16 18 14
D 15 17 20 12
E 21 14 17 18

Prof. Cntia Paese Giacomello 87


4. Uma empresa deseja testar quatro tipos diferentes de pneus: K, L, M e N. Suas
duraes, determinadas pelas bandas de rodagem, esto na tabela (em milhares de
quilmetros), onde cada tipo foi testado, aleatoriamente, em seis automveis
semelhantes. Determinar de existe diferena significante entre os pneus ao nvel de
significncia 0,05.

K 33 38 36 40 31 35
L 32 40 42 38 30 34
M 31 31 37 35 33 30
N 29 34 32 30 33 31

5. Um professor deseja testar trs mtodos diferentes de ensino I, II e III. Para isso so
escolhidos aleatoriamente trs grupos de cinco estudantes, e cada grupo instrudo
por um mtodo diferente. dada a mesma prova a todos os estudantes e os graus
obtidos constam na tabela. Determinar se existe diferena entre os mtodos de ensino
ao nvel de significncia 0,01.

I 75 62 71 58 73
II 81 85 68 92 90
III 73 79 60 75 81

6. A tabela apresenta os dados sobre a ferrugem acumulada sobre o ferro, que foi tratado
quimicamente com os produtos A, B ou C. Determinar se existe diferena significativa
nos tratamentos ao nvel de 0,05.

A 3 5 4 4
B 4 2 3 3
C 6 4 5 5

7. Um experimento mede os quocientes de inteligncia (QI) de estudantes do sexo


masculino de estaturas alta, mdia e baixa, cujos resultados aparecem na tabela.
Determinar se existe qualquer diferena nas contagens do QI em relao s diferentes
alturas ao nvel de significncia de 0,01.

Alta 110 105 118 90


Mdia 95 103 119 104
Baixa 108 112 104 93

Prof. Cntia Paese Giacomello 88


8. A fim de produzir um tipo superior de rao para galinhas, adicionou-se rao
tradicional quatro quantidades diferentes de um mesmo produto qumico. Cada
quantidade de rao dada a 8 pintos e o peso das aves aps 3 meses anotado.
Concluir se houve diferena entre as quantidades do produto qumico ao nvel de
significncia 0,05.

20 mg 46 46 46 45 45 45 46 46
30 mg 48 48 47 47 47 47 47 48
40 mg 49 49 50 50 49 50 50 49
50 mg 52 53 52 52 52 52 53 53

9. Uma empresa deseja estudar trs tipos de enxerto para ver se todos apresentam o
mesmo crescimento anual. O que se pode concluir a respeito? (use nvel de
significncia 0,05)

Enxerto 1 Enxerto 2 Enxerto 3


14,4 10,8 11,1
14,8 12,2 9,5
12,7 11,2 10,8
12,2 12,8 12,7
10,9 13,0 10,9

10. Os dados abaixo do a vida observada dos pneus de quatro caminhes distribuidores
de sorvete, conforme a posio. Supondo comparveis os caminhes e os motoristas,
poderemos afirmar que a durao mdia independente da posio do pneu no
veculo? (use nvel de significncia 0,01). Disponha os clculos numa tabela ANOVA.
Qual a importncia da comparabilidade dos motoristas e veculos?

Dianteiro direito 17 19 20 24
Dianteiro esquerdo 25 27 18 22
Traseiro direito 22 21 19 26
Traseiro esquerdo 26 24 30 28

Prof. Cntia Paese Giacomello 89


14 Regresso e co rrelao

A anlise de regresso e de correlao compreende a anlise de dados amostrais para


saber se e como duas ou mais variveis esto relacionadas uma com a outra em uma
populao.

A anlise de correlao fornece o nmero A anlise de regresso apresenta como


(coeficiente) que resume o grau de resultado uma equao matemtica que
relacionamento entre duas variveis. descreve um determinado relacionamento.

Os valores para a anlise de regresso e correlao provm de observaes e, para um


problema com duas variveis, cada observao d origem a dois valores, uma para cada
varivel. Uma das variveis ser a dependente e a outra independente.

Exemplos:
Notas 2 o Notas
Famlia Renda Gastos Peso Altura Aluno
grau faculdade

1 R$ 1550 R$ 1350 56 179 A 80 85

2 R$ 2000 R$ 1970 67 176 B 75 70

3 R$ 1000 R$ 550 89 180 C 95 95

... 58 170 D 60 65

n R$ 770 R$ 690 45 130 E 70 80

Uma maneira de apresentar os resultados atravs do diagrama de disperso.

Relao linear Relao linear X e y positivamente X e y negativamente X e y no


positiva perfeita negativa perfeita correlacionados correlacionados correlacionados

Prof. Cntia Paese Giacomello 90


Regresso

14.1 Aplicaes da regresso


1. Estimar valores de uma varivel com base em valores conhecidos de outra varivel.
(Situaes em que as duas variveis medem aproximadamente a mesma situao, mas
uma delas relativamente dispendiosa ou difcil de lidar, enquanto a outra no.)
2. Explicar valores de uma varivel em termos da outra, isto , pode-se suspeitar de
uma relao de causa e efeito.
3. Predizer valores de uma varivel.

OBS: A anlise da regresso apenas indica qual relacionamento matemtico pode existir, se
existir algum. Ou seja, nem a regresso, nem a correlao podem mostrar que uma varivel
tenda a causar certos valores de outra varivel, no garantido que exista relao de causa e
efeito.

... a correlao entre beber um copo de vinho por dia e a menor chance de infarto do
miocrdio um bom exemplo. Estudos recentes mostram que ela no se deve ao vinho e
ao lcool, mas sim ao betacaroteno, corante contido na uva. Para infelicidade de
muitos, tomar suco de uva d o mesmo resultado que beber vinho tinto. Jornal do
Brasil, 08/01/1999

14.2 Classificao das regresses


Quanto ao nmero de variveis: Simples (uma varivel independente explica bem o
fenmeno) ou Mltipla (mais de uma varivel independente so necessrias para explicar
bem o fenmeno)
Quanto qualidade da relao: Linear (os fenmenos podem ser bem explicados por
equaes de primeiro grau) ou No lineares (os fenmenos no podem ser bem explicados
por equaes de primeiro grau, exigindo funes de ordem superior).

14.3 Modelo linear

14.3.1 A equao da linha reta

Forma da equao linear: y = a + bx


Duas caractersticas importantes so:
A ordenada da reta (valor de em y) determinado ponto (quando x=0)  a
A inclinao da reta (coeficiente angular)  b
O mtodo mais usado para ajustar uma linha reta a um conjunto de pontos conhecido
como mtodo dos mnimos quadrados .

Prof. Cntia Paese Giacomello 91


n( xy ) ( x )( y ) y b x
b= a=
n( x 2 ) ( x ) 2 n

14.3.2 Erro padro da estimativa linear

Uma vez que as estimativas a e b so funes de variveis aleatrias (x e y so variveis


aleatrias) necessrio verificar a preciso das estimativas, conhecendo o erro padro das
estimativas.

SE =
y 2
( a y + b xy )
n2

14.3.3 Intervalo de confiana para a estimativa

Para criar intervalos de confiana com base nos estimadores utiliza-se a equao:

yint ervalo = y t S E

Onde: y obtido da equao.


t o valor da distribuio t de Student para n-2 graus de liberdade e nvel de
confiana determinado (tabelado)
e S E o erro padro da estimativa
Exemplo:
Seja y o consumo pessoal mdio e x o PIB do Brasil em anos consecutivos. Encontre o
Intervalo de confiana 90% para a estimativa quando o PIB for 10,0.

x y x2 xy
7,0 10,1 49,00 70,70
7,3 10,6 53,29 77,38
7,8 11,3 60,84 88,14
8,6 12,4 73,96 106,64
8,1 11,9 65,61 96,39
8,3 11,9 68,89 98,77
8,2 11,5 67,24 94,30
8,6 12,1 73,96 104,06
9,0 13,1 81,00 117,90
9,6 14,1 92,16 135,36
9,1 14,6 82,81 132,86
x = 91,6 y = 133,6 x 2 = 768,76 xy = 1122,50

Prof. Cntia Paese Giacomello 92


ideal que sempre se inicie o estudo de regresso com o grfico de disperso dos valores.

Consumo pessoal em funo do PIB

Consum o pessoal
14,0

12,0

10,0

8,0
6,5 7,5 8,5 9,5 10,5
PIB

E o clculo de a e b fica:
b= 11 (1122,5) - (91,6) (133,6)
= 1,668 133,6 - (1,668) 91,6
11 (768,76) - (91,6)2 e a= = 1,744
11

y = 1,744 + 1,668 x , ou Consumo = 1,744 + 1,668 PIB ou seja, para cada unidade
acrescida do PIB, o consumo pessoal aumentar 1,668 unidades.

E o intervalo de confiana para y quando x=10 ser:

1641,28 (( 1,744 )( 133 ,6 ) + 1,668( 1122 ,50 ))


SE = = 0 ,4653
11 2
Valor de t tabelado

y = 1,744 + 1,668( 10 ) = 14 ,936


yint ervalo = 14,936 1,833 (0,4653)

yint ervalo = 14,936 0,853

Ou seja, quando o PIB estiver em 10,0 o Consumo Pessoal poder variar na faixa entre
14,083 e 15,789, com 90% de confiana.

Prof. Cntia Paese Giacomello 93


Correlao

14.4 Objetivo da correlao


O objetivo da correlao determinar a fora do relacionamento entre duas observaes
emparelhadas, porque indica at que ponto os valores de uma varivel esto relacionados
com os valores da outra varivel.
O resultado da anlise de correlao chamado de coeficiente de correlao um valor
que quantifica o grau de correlao.
O mtodo mais comum de anlise de correlao envolve observaes em valores
numricos. Neste caso utiliza-se o coeficiente r de Pearson.

14.5 O coeficiente r de Pearson (correlao)


O coeficiente r de Pearson mede o grau de associao linear em duas variveis. Ele
possui duas propriedades importantes:
Seu sinal. Positivo indica correlao linear positiva, ou seja, medida que uma varivel
cresce, a outra cresce tambm. Sinal negativo indica correlao linear negativa, ou
seja, medida que uma varivel cresce, a outra decresce.
Sua grandeza indica quo prximos da reta esto os pontos individuais caso fosse
ajustada uma reta de regresso. O valor do coeficiente pode variar de 1 a 1.

-1 0 1
Correlao Inexistncia Correlao
negativa de positiva
forte correlao forte

O clculo do valor do coeficiente r de Pearson pode ser obtido atravs da equao:

xy n
( x )( y )
r=
x y
( x ) 2
( y) 2

2 2
n n

14.6 Coeficiente de determinao


O coeficiente de determinao ou de explicao (r 2 ) indica quantos por cento a variao
explicada pela regresso representa da variao total.
r 2 = r.r e 0 r2 1

Prof. Cntia Paese Giacomello 94


Exemplo:
Prosseguindo o exemplo anterior, sendo y o consumo pessoal mdio e x o PIB do Brasil em
anos consecutivos.

x y x2 y2 xy
7,0 10,1 49,00 102,01 70,70
7,3 10,6 53,29 112,36 77,38
7,8 11,3 60,84 127,69 88,14
8,6 12,4 73,96 153,76 106,64
8,1 11,9 65,61 141,61 96,39
8,3 11,9 68,89 141,61 98,77
8,2 11,5 67,24 132,25 94,30
8,6 12,1 73,96 146,41 104,06
9,0 13,1 81,00 171,61 117,90
9,6 14,1 92,16 198,81 135,36
9,1 14,6 82,81 213,16 132,86
x = 91,6 y = 133,6 x 2 = 768,76 y 2 = 1641,28 xy = 1122,50

O clculo do coeficiente de correlao dado por:


( 91,6 )( 133,6 )
1122 ,5
r= 11 = 0,9446
( 91,6 )
2
( 133,6 ) 2
768 ,76 1641,28
11 11
Ou seja, existe uma correlao forte positiva entre os valores do PIB e do consumo
pessoal.
O valor do coeficiente de determinao : r 2 = 0,9446 x 0,9446 = 0,8923, o que significa
que 89% da variao total explicada por este modelo.

Utilizando o Excel
Maneira 1: A equao da forma y = a + b x para os valores dos pares (x,y) e
os coeficientes da reta so calculados utilizando o mtodo dos mnimos
quadrados.Aps colocar os valores em duas colunas (valores de x e valores de
y) v ao Assistente de Funo e escolha as funes INCLINAO para
determinar o valor de b e INTERCEPO para calcular o valor de a. Os
passos seguintes devem ser feitos seguindo as indicaes do programa. Para o
clculo da correlao utiliza-se no Assistente de Funo o CORREL. Em
Matriz1 devem ser colocadas as clulas referentes varivel x em Matriz2 as
clulas referentes varivel y.
Maneira 2: Selecionar Ferramentas e Anlise de dados e ento
Regresso. Informar o que for solicitado.

Prof. Cntia Paese Giacomello 95


14.7 Exemplo de soluo no Excel
A velocidade mxima de automveis de frmula 1 com motores de mesma potncia
funo, entre outras variveis, do peso do veculo, no intervalo entre 700 e 800 Kg. Assim,
verificou-se qual a velocidade mxima atingida em uma reta de 1.200 m. Os resultados
foram:

Peso(Kg) 750 755 777 782 793

Veloc.Mx.(Km/h) 380 354 348 330 320

a) Construa o grfico dos dados


b) Qual a velocidade esperada para um veculo de 760 Kg?

GRFICO DOS DADOS (Diagrama de disperso)

Relao entre velocidade e peso dos veculos de F1

390
y = -1,181x + 1257,173
370 2
Velocidade

R = 0,865
350

330

310
740 750 760 770 780 790 800
Peso

RESUMO DOS RESULTADOS

Estatstica de regresso R
R mltiplo 0,930
R-Quadrado 0,865
Se
R-quadrado ajustado 0,820
Erro padro 9,851
Observaes 5

Prof. Cntia Paese Giacomello 96


Se F de significao < 0,05, ento o
modelo linear ajustado aos dados
vlido. Se F > 0,05 o modelo no se
ajusta adequadamente aos dados.

ANOVA (teste de significncia para o modelo linear ajustado)

gl SQ MQ F F de significao

Regresso 1 1864,051 1864,051 19,207 0,022


Resduo 3 291,149 97,050
Total 4 2155,200

Testes para a e b
Valores de a e b Se valor-P < 0,05, ento a estimativa
vlida, caso contrrio significativamente
nula

Coefici- Erro 95% 95% Inferior Superior


Stat t valor-P
entes padro inferiores superiores 95,0% 95,0%
Interseo 1257,173 207,862 6,048 0,009 595,662 1918,685 595,662 1918,685

Peso(Kg) -1,181 0,269 -4,383 0,022 -2,038 -0,323 -2,038 -0,323

A equao linear de relacionamento dos dados Velocidade =1257,173 1,181 Peso


Ento, a velocidade estimada para um veculo com 760 kg Velocidade=1257,173
1,181(760) = 359,61 km /hora

Prof. Cntia Paese Giacomello 97


Exerccios
1. Determinar o coeficiente de correlao dos dados a seguir:

X 1 2 3 6 9
Y 4 7 7 9 15
Se os dados forem correlacionados, estimar a reta de regresso:

2. A tabela a seguir apresenta os valores dos investimentos administrados on-line a partir


de 1998. Verifique se existe correlao entre os anos (x) e os investimentos (y), caso
exista correlao, apresente o intervalo de confiana de 95% para o valor dos
investimentos no ano de 2002 e 2003.

Ano Investimento
1998 374
1999 555
2000 908
2001 1010

3. Os grficos e a tabela indicam o nmero de anos de escolaridade das chefes de famlia


(x) e a participao feminina na renda familiar (y) em alguns anos

Nmero
Participao na renda
de anos de
(%)
estudo
1976 4,7 8,4
1990 5,7 16
1993 6,3 19
1996 6,6 21

a) Caso exista associao, quantos anos de estudo sero necessrios para que a
participao da mulher na renda familiar chegue a 50% ?
b) E qual ser a participao da mulher na renda familiar quando ela tiver 12 anos de
estudo?
c) Voc poderia estimar o ano em que a mulher ir participar com 50% da renda?

Prof. Cntia Paese Giacomello 98


4. Aps uma regulagem eletrnica um veculo apresenta um rendimento ideal no que
tange o consumo de combustvel. Contudo, com o passar do tempo esse rendimento
vai se degradando. Os dados a seguir representam o rendimento medido ms a ms
aps a regulagem. Ajuste um modelo linear a estes dados. Calcule o coeficiente de
correlao. Interprete os resultados.

x: Meses aps a regulagem 1 2 3 4 5 6


y: Rendimento 10,7 10,9 10,8 9,3 9,5 10,4

x: Meses aps a regulagem 7 8 9 10 11 12


y: Rendimento 9,0 9,3 7,6 7,6 7,9 7,7

5. O gerente de uma indstria localizada em um pas tropical suspeita que h uma


correlao entre a temperatura do dia e a produtividade. Dados coletados
aleatoriamente ao longo de um perodo de seis meses revelaram o seguinte.

Temperatura 21,2 20,3 22,7 22,0 22,3 23,5 24,8 24,2 25,5 25,2 25,5 25,8
Produtividade 142 148 131 132 145 138 144 136 141 124 133 128

Temperatura 27,5 26,3 28,2 28,6 29,0 29,7 30,7 30,3 30,2 31,4 32,5 32,7
Produtividade 132 137 124 117 122 131 124 111 119 129 123 116

Plote um grfico de disperso e visualize a natureza da correlao entre temperatura e


produtividade. Depois estime a equao da reta de regresso e calcule o valor do
coeficiente de correlao. Interprete os resultados.
Estime a produtividade quando a temperatura estiver em 35 graus. Construa um
Intervalo de Confiana de 90% para esta produtividade.

6. Suponha que os valores obtidos para o desempenho de alunos em uma determinada


disciplina e as rendas familiares sejam os que seguem.
Aluno X Y
(renda) (desempenho)
1 750 5
2 690 8
3 400 4
4 900 9
5 200 2
6 1000 10
7 300 3
8 600 6
9 1200 10
Os dados so correlacionados? Justifique sua resposta. Se forem, estime a reta de
regresso.

Prof. Cntia Paese Giacomello 99


7. A revista Exame Melhores e Maiores apresentou as maiores empresas do comrcio, por
vendas no ano anterior. Entre as que pertencem ao setor de comrcio varejista esto
destacadas as 11 maiores. Atravs da anlise da tabela e do grfico, o que voc pode
concluir?

Nmero de Vendas
Empresa
funcionrios (Milhes US$)
Carrefour 37.004 4.582,4
Po de Acar 39.642 3.976,4
Casas Bahia 11.508 1642,2
Sendas 16.990 1391,7
Ponto Frio 5.395 1223,6
Sonae 22.638 1083,9
Bompreo 13.225 1062,7
L. Americanas 12.485 900,6
McDonalds No informou 726,7
AgipLiquigs 3.804 693,1
Pernambucanas 10.787 619,1
Fonte: Revista Exame

V e nd as no an o d e 1999 das 11 m aior e s e m pr e s as d o


Br as il do s e tor de co m r cio var e jis ta
5.000
4.500
4.000
y = -42 ,4 62 + 0 ,10 15 x

3.500 R 2 = 0 ,80 1
M ilh e s US$

3.000
2.500
2.000
1.500
1.000
500
-
- 5.000 10.000 15.000 20.000 25.000 30.000 35.000 40.000
Nm e r o d e fu ncion r ios

14.8 Outros modelos


Muitas vezes a forma funcional entre as variveis x e y no linear. Alguns modelos,
mesmo no sendo lineares, so facilmente linearizveis. Este procedimento busca facilitar
o clculo dos coeficientes da equao.
No entanto, o uso de softwares estatsticos, calculadoras e planilhas eletrnicas auxilia na
obteno dos coeficientes.
O valor de r 2 serve como uma forma de comparao entre os modelos. O modelo que
apresentar maior valor de r 2 o que apresenta melhor ajuste dos dados.
Prof. Cntia Paese Giacomello 100
14.8.1 Funo exponencial - y = ab x

a>0 0<b<1 a>0 b>1 a<0 0<b<1 a<0 b>1

Utilizando as propriedades dos logaritmos pode-se chegar a Y = A + Bx onde


Y = log y , A = log a e B = log b
Pelo mtodo dos mnimos quadrados obtm-se A e B e depois convertem-se os valores
para a e b .

a = 10 A e b = 10 B

Exemplo
Uma empresa fabricante de brinquedos registrou suas vendas nos ltimos 10 anos,
obtendo os valores apresentados a seguir.

Ano (x) Vendas (y) Vendas do brinquedo, por ano


1 450
10.000
2 500
8.000
3 600
Ve n d as

4 800 6.000
5 1.200 4.000
6 1.700 2.000
7 2.100 0
8 4.000
0 1 2 3 4 5 6 7 8 9 10 11
9 5.000 An o
10 7.000

O diagrama de disperso dos dados indica que a relao no linear.

Prof. Cntia Paese Giacomello 101


Para ajustar uma funo exponencial, inicia-se com o clculo dos somatrios de Y, x, Y 2 ,
x 2 e xY, onde Y = ln (y)

x y Y=ln(y) x2 xY Y2
1 450 6,11 1 6,11 37,32
2 500 6,21 4 12,43 38,62
3 600 6,40 9 19,19 40,92
4 800 6,68 16 26,74 44,68
5 1.200 7,09 25 35,45 50,27
6 1.700 7,44 36 44,63 55,33
7 2.100 7,65 49 53,55 58,52
8 4.000 8,29 64 66,35 68,79
9 5.000 8,52 81 76,65 72,54
10 7.000 8,85 100 88,54 78,39
Total: 55 23.350 73,25 385,00 429,64 545,39

Ento,
10( 429 ,64 ) ( 55 )( 73 ,25 )
B= = 0,3245
10( 385 ) ( 55 ) 2
73,25 0 ,325( 55 )
A= = 5 ,5399
10
b = exp( B ) = exp( 0 ,3245 ) = 1,3903 e a = exp( A ) = exp( 5 ,5399 ) = 254 ,42

Logo, a equao final ser


Vendas =(254,42)(1,3903) ano

Observe como os valores estimados pela equao esto prximos dos valores reais,
observados na srie de dados.

8.000
7.000
V endas
6.000
obs ervadas
5.000
4.000
V endas
3.000
estim adas pela
2.000
equa o
1.000
0
1 2 3 4 5 6 7 8 9 10

Prof. Cntia Paese Giacomello 102


14.8.2 Funo geomtrica ou de potncia - y = ax b

a>0 b mpar a>0 b par a<0 b mpar a<0 b par

Utilizando as propriedades dos logaritmos pode-se chegar a Y = A + bX onde


Y = log y , A = log a e X = log x
Pelo mtodo dos mnimos quadrados obtm-se A e b e depois convertem-se os valores
para a .

a = 10 A

Exemplo
Os dados a seguir apresentam a produo de veculos automotivos (y) ao longo do tempo
(x). Para estes dados ajuste um modelo de potncia

ano 59 60 61 62 63 64 65
produo 96,1 133,0 145,6 191,2 174,2 183,7 185,2

ano 66 67 68 69 70 71 72
produo 224,6 225,4 278,5 349,5 416,0 516,0 609,0

O diagrama de disperso dos dados sugere que um modelo potencial indicado.

P roduo automobilstica anual


700,0
600,0
Milhares de unidade

500,0
400,0
300,0
200,0
100,0
0,0
55 60 65 70 75
An o

Prof. Cntia Paese Giacomello 103


Clculo dos parmetros:

Ano Produo Y=ln(y) X=ln(x) Y2 X2 XY


59 96,1 4,565 4,078 20,843 16,626 18,616
60 133,0 4,890 4,094 23,916 16,764 20,023
61 145,6 4,981 4,111 24,809 16,899 20,476
62 191,2 5,253 4,127 27,597 17,033 21,681
63 174,2 5,160 4,143 26,628 17,166 21,379
64 183,7 5,213 4,159 27,179 17,296 21,682
65 185,2 5,221 4,174 27,263 17,426 21,796
66 224,6 5,414 4,190 29,315 17,553 22,684
67 225,4 5,418 4,205 29,353 17,679 22,781
68 278,5 5,629 4,220 31,690 17,804 23,753
69 349,5 5,857 4,234 34,299 17,928 24,797
70 416,0 6,031 4,248 36,369 18,050 25,621
71 516,0 6,246 4,263 39,014 18,170 26,625
72 609,0 6,412 4,277 41,111 18,290 27,421
Totais: 76,292 58,522 419,386 244,684 319,335

Assim,
14( 319 ,335 ) ( 58 ,522 )( 76 ,292 )
b= = 7,970
14( 244 ,684 ) ( 58 ,522 ) 2
76 ,292 7 ,970( 58 ,522 )
A= = 27 ,868
14
a = exp( A ) = exp( 27 ,868 ) = 7 ,889 E 13

Y=A+bX  Y=-27,868+7,970X onde Y e X so, respectivamente, ln(x) e ln(y)

7,970
Ou ento, y=7,889E-13 x

Logo, a equao final ser


7,970
Produo de automveis = 7,889E-13 (ano)

O grfico comparativo entre os valores observados para a produo e os estimados atravs


da curva Produo de automveis = 7,889E-13 (ano) 7,970 :

Prof. Cntia Paese Giacomello 104


700,0

600,0
Produo real
500,0
Produo estimada
400,0
pela equao
300,0

200,0

100,0

0,0
59 60 61 62 63 64 65 66 67 68 69 70 71 72

Exerccios
1. Aos dados a seguir ajuste um modelo exponencial e um polinomial. Estime a
quantidade de vendas para o ano de 2003, supondo que o comportamento dos dados
seja mantido. DICA: utilize os nmeros de 1 a 11 para os anos e calcule o valor de y quando x
for 14.

Ano 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Vendas 15 16 17 18 25 28 32 42 55 76 93

2. Se voc tivesse uma srie de dados como expressa no diagrama de disperso a seguir,
que modelo de regresso voc utilizaria? O que voc poderia dizer a respeito dos
valores dos parmetros?

3. Uma companhia de energia eltrica estimou o consumo mdio de energia das famlias
(kwh) de acordo com a renda (R$). Ajuste os seguintes modelos: y=ax b , y=ab x e
y=a+bx.

Renda 197 286 243 218 241 200 215 198 129 157 296 302

Consumo 1234 1432 1678 1300 1467 1245 1214 1200 770 890 2020 2100

Prof. Cntia Paese Giacomello 105


15 Tabelas

Prof. Cntia Paese Giacomello 106

Você também pode gostar