PROFESSORA: CÍNTIA PAESE GIACOMELLO

Introdução
1.1

Amostragem ________________________________________________________ 2

1.2

Séries estatísticas

Gráficos
Distribuições de frequências
4.1

4.2

4.3

4.4

4.5

4.6

Medidas de tendência central

5.1

Mdia _____________________________________________________________ 20

5.2

Mediana ___________________________________________________________ 23

5.3

Moda _____________________________________________________________ 25

5.4

Relação entre as medidas de tendência central

6.1

Amplitude _________________________________________________________ 28

6.2

Varincia __________________________________________________________ 29

6.3

6.4

8.1

8.2

Espao amostral

8.3

Eventos ___________________________________________________________ 34

8.4

8.5

9 Distribuições de probabilidade

10 Teoria elementar da amostragem
10.1

10.2

11
12

Estimação
Testes de hipóteses

12.1

12.2

12.3

12.4

13

13.1

13.2

14

Regresso e correlação

Regresso ______________________________________________________________ 91
14.1

14.2

14.3

## Modelo linear _____________________________________________________ 91

Correlao ______________________________________________________________ 94
14.4

14.5

14.6

14.7

14.8

## Outros modelos __________________________________________________ 100

15

Tabelas

1 I ntroduo
Estuda-se estatstica para aplicar seus conceitos como auxlio nas tomadas de deciso
diante de incertezas, justificando cientificamente as decises.
Os princpios estatsticos so utilizados em uma grande variedade de situaes no
governo, nos negcios e na indstria, bem como no mbito das cincias sociais, biolgicas
e fsicas.
Estatstica a cincia ou mtodo cientfico que estuda os fenmenos multicausais,
coletivos ou de massa e procura inferir as leis que os mesmos obedecem.
Mtodo estatstico um processo para se obter, apresentar e analisar caractersticas ou
valores numricos para uma melhor tomada de deciso em situaes de incerteza. Os
passos da metodologia estatstica so os seguintes:

## Coleta, resumo e apresentao das unidades de observao ou de seus valores

numricos

Divulgao de relatrio com as concluses, de tal modo que estas sejam facilmente
entendidas por quem as for usar na tomada de decises.

## Em geral, aceita a diviso da estatstica em dois grandes grupos: estatstica descritiva e

indutiva.
Descritiva: corresponde aos procedimentos relacionados com a coleta, elaborao,
tabulao, anlise, interpretao e apresentao dos dados. Isto , inclui as tcnicas que
dizem respeito sintetizao e descrio de dados numricos. Tais mtodos podem ser
grficos e envolvem a utilizao de recursos computacionais. O objetivo da estatstica
descritiva tornar as coisas mais fceis de entender, relatar e discutir.
Indutiva (ou inferencial): parte de uma ou mais amostras (subconjuntos da populao) e
conclui sobre a populao. Utiliza tcnicas como a teoria das probabilidades, inferncia
estatstica, amostragem.

## Com maior freqncia utilizamos o estudo da amostra do que da populao, no s por

serem menos dispendiosas e consumirem menos tempo no processamento dos dados, mas
tambm porque muitas vezes no dispomos de todos os elementos da populao.

Definies:
Populao: coleo completa de todos os elementos (valores, pessoas, medidas,...) a
Amostra: subcoleo de elementos extrados da populao.
Censo: coleo de dados relativos a todos os elementos de uma populao.
Amostragem: coleo de dados relativos a elementos de uma amostra.

Exemplo:
Populao

Amostra

## Parmetro: medida numrica que descreve uma caracterstica de uma populao

Estatstica: medida numrica que descreve uma caracterstica de uma amostra

1.1 Amostragem
O objetivo da amostragem permitir fazer inferncias sobre uma populao aps inspeo
de apenas parte dela. Fatores como custo, tempo, ensaios destrutivos e populaes
infinitas tornam a amostragem prefervel a um estudo completo (censo).
Os principais tipos de amostragem utilizados so os probabilsticos, onde todos os
indivduos da populao tm a mesma chance de serem selecionados. Os planos de
amostragem probabilstica so delineados de tal modo que se conhece todas as
combinaes amostrais possveis e suas probabilidades, podendo-se ento determinar o
erro amostral.
Os mtodos mais comuns de amostragem probabilstica so:

## Amostragem aleatria simples: os elementos de uma populao so escolhidos de

tal forma que todos tenham a mesma chance de serem escolhidos. Pode-se utilizar
uma tabela de nmeros aleatrios ou um programa de gerao de nmeros
aleatrios.

## Amostragem estratificada: subdivide-se a populao em, no mnimo, dois estratos

(subpopulaes) que compartilham a mesma caracterstica e em seguida escolhe-se
uma amostra de cada. Exemplo: homens e mulheres.

## Amostragem sistemtica: escolhe-se um ponto de partida e ento,

sistematicamente, selecionam-se os outros. Por exemplo: o 3, 403, 803,
1203,... indivduos

em seguida sorteiam-se algumas reas e analisam-se todos os elementos dos

## Amostragens no probabilsticas so utilizadas quando a populao em estudo muito

pequena ou de difcil obteno. Neste caso a anlise de uma amostra poderia causar
distores. Uma pessoa familiarizada com a populao pode indicar melhor as unidades
amostrais. Este tipo de amostragem no permite avaliar o erro amostral. EX: doena rara.

1.2

Tipos de variveis

## Alguns conjuntos de dados consistem em nmeros, enquanto outros so no numricos.

Utiliza-se a nomenclatura de dados (ou variveis) qualitativos e quantitativos.

Variveis

Quantitativas

Discretas

Qualitativas

Contnuas

Exerccios:
Identifique cada nmero como discreto ou contnuo
1. Cada cigarro Camel tem 16,13 mg de alcatro
2. O altmetro de um avio da American Airlines indica uma altitude de 21.359 ps
3. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas so assinante de um
servio de informao on-line.
4. O tempo total gasto anualmente por um motorista de txi de Nova York ao dar
passagem a pedestres de 2367 segundos.

2 Sries estatstic as
Consiste no agrupamento dos dados estatsticos em tabelas.
Em qualquer srie estatstica so observados trs elementos fundamentais:

## O fato, isto , o que est sendo observado

O espao geogrfico

A poca

## Sries temporais (ou histricas)

Os dados esto reunidos de acordo com o tempo, que varia. Os outros dois fatores - local

Sries geogrficas
Os dados esto reunidos de acordo com o local, que varia. Os outros dois fatores - fato e

Sries especficas
Os dados esto reunidos de acordo com o evento, que varia. Os outros dois fatores - local

As sries podem ainda apresentar-se sob a forma mista, resultante da combinao dos
fatores.

3 Grficos
Os grficos consistem em uma forma de apresentao dos dados, usualmente utilizada
pois facilita a interpretao dos resultados.
So elementos complementares de um grfico:

## Principais tipos de grficos: (Fonte: Site da Microsoft www.microsoft.com.br)

Colunas
Um grfico de colunas mostra as alteraes
de dados em um perodo de tempo ou
ilustra comparaes entre itens. As
categorias so organizadas na horizontal e
os valores so distribudos na vertical, para
enfatizar as variaes ao longo do tempo.
Grficos de colunas empilhadas mostram o relacionamento de itens individuais com o todo
. O grfico de colunas em perspectiva 3D
compara pontos de dados ao longo dos dois
eixos.

## Nesse grfico 3D, voc pode comparar o

desempenho das vendas de quatro
trimestres na Europa com o desempenho de
outras duas divises.

Barras
Um grfico de barras ilustra comparaes
entre itens individuais. As categorias so
organizadas na vertical e os valores na
horizontal para enfocar valores de
comparao.

## Grficos de barras empilhadas mostram o

relacionamento de itens individuais com o
todo.

Linha
Valor de venda do produto X

## Um grfico de linhas mostra

intervalos iguais.
A unio dos pontos faz sentido
pois a varivel contnua.
Meses usualmente so
contnuas

Pizza
Um grfico de pizza mostra o tamanho
proporcional de itens que constituem uma srie
de dados para a soma dos itens. Ele sempre
mostra somente uma nica srie de dados, sendo
til quando voc deseja dar nfase a um
elemento importante.
Totaliza a informao (100%). Cada faixa do
grfico proporcional informao.

## Para facilitar a visualizao de fatias pequenas, voc pode

agrup-las em um nico item do grfico de pizza e
subdividir esse item em um grfico de pizza ou de barras
menor, ao lado do grfico principal.

## Diagrama de Disperso (Disperso XY)

Um grfico xy (disperso) mostra a
relao existente entre os valores
numricos em vrias sries de dados ou
plota dois grupos de nmeros como uma
srie de coordenadas xy. Esse grfico
mostra intervalos irregulares ou clusters

Histograma

## Apresenta as classes ao longo do eixo

horizontal e as freqncias (absolutas ou
relativas) ao longo do eixo vertical. As
fronteiras das barras coincidem com os
pontos extremos dos intervalos de classe.

% das rvores

## um grfico de colunas, porm utilizado

para apresentar distribuies de
freqncias.

0.30
0.25
0.20
0.15
0.10
0.05
0.00

3a8

8 a 13 13 a 18 18 a 23 23 a 28 28 a 33

Safras (alq.)

rea
Um grfico de rea enfatiza a
dimenso das mudanas ao longo do
tempo. Exibindo a soma dos valores
plotados, o grfico de rea mostra
tambm o relacionamento das partes
com um todo.
Nesse exemplo, o grfico de rea
enfatiza o aumento das vendas em
Washington e ilustra a contribuio
vendas.

Superfcie
Um grfico de superfcie til quando
voc deseja localizar combinaes
vantajosas entre dois conjuntos de dados.
Como em um mapa topogrfico, as cores e
os padres indicam reas que esto no
mesmo intervalo de valores.
Esse grfico mostra as vrias combinaes
de temperatura e tempo que resultam na
mesma medida de resistncia trao.

Um grfico de radar compara os
valores agregados de vrias sries de

## Nesse grfico, a srie de dados que

cobre a maior parte da rea, Marca A,
representa a marca com o maior
contedo de vitamina.

Aes
O grfico de alta-baixa-fechamento usado muitas vezes para ilustrar preos de aes.
Esse grfico tambm pode ser usado com dados cientficos para, por exemplo, indicar
mudanas de temperatura. Voc deve organizar seus dados na ordem correta para criar
esse e outros grficos de aes.

Um grfico de aes que mede o volume tem dois eixos de valores: um para as colunas,
que medem o volume, e outro para os preos das aes. Voc pode incluir volume em um
grfico de alta-baixa-fechamento ou de abertura-alta-baixa-fechamento.

10

Bolhas
Um grfico de bolhas um tipo de grfico xy (disperso). O tamanho do marcador de
dados indica o valor de uma terceira varivel.
Para organizar seus dados, coloque os valores de x em uma linha ou coluna e insira os
valores de y e os tamanhos das bolhas correspondentes nas linhas ou colunas adjacentes.

O grfico nesse exemplo mostra que a Empresa A tem a maioria dos produtos e a maior
fatia do mercado, mas no necessariamente as melhores vendas.

## Cone, cilindro e pirmide

Os marcadores de dados em forma de cone, cilindro e pirmide podem dar um efeito
especial aos grficos de colunas e de barras 3D.

Rosca
Como um grfico de pizza, o grfico de
rosca mostra o relacionamento das partes
com o todo, mas pode conter mais de uma
rosca representa uma srie de dados.

11

4 Distribuies de freqncias
Distribuio de freqncia uma tabela resumida na qual os dados so organizados em
grupos de classe ou categorias convenientemente estabelecidas e numericamente
As distribuies de freqncias so series hetergrafas, isto , sries na qual o fenmeno
ou fato apresenta graduaes ou subdivises. Embora fixo, o fenmeno varia de
Nas distribuies de freqncia, os dados so agrupados segundo um critrio de
magnitude, em classe ou pontos, permanecendo constante o fato, local e tempo, de tal
forma que se possa determinar a percentagem ou nmero, de cada classe. um tipo de
apresentao que condensa uma coleo de dados conforme as freqncias ou repeties
de seus valores.

## A construo da distribuio de freqncia depende do tipo de dado com os quais se est

lidando: contnuos ou discretos.

## 4.1 Construo de distribuio de freqncia para dados contnuos

Os principais estgios so:
1. Estabelecer a quantidade de classes ou intervalos de grupamento dos dados. O
nmero de classes deve variar entre 5 e 15. Aconselha-se utilizar
nmero de observaes.

n onde n o

## 2. Determinar a amplitude das classes. Aconselha-se fazer amplitude / n o de classes.

(OBS: amplitude = maior valor menor valor)
uma tabela ou grfico

Exemplo:
Os dados a seguir representam o tempo (em minutos) que 45 operadores de mquina
demoraram para fazer o setup de uma mquina.

6,5
6,4
9,7
7,9
7,9

4,0
5,0
4,4
6,0
6,4

7,1
8,5
7,0
8,2
7,4

8,3
5,7
6,3
10,4
7,0

## 1 Nmero de classes  45 valores 

5,4
7,7
8,3
9,9
13,0

7,6
7,2
6,9
3,9
8,7

9,0
12,4
5,7
9,8
6,4

15,7
7,1
7,6
8,2
6,7

16,7
5,5
7,9
5,6
7,4

45 =6,7 7 classes

2 Amplitude das classes  16,7 3,9 = 12,8 (Maior valor = 16,7; Menor valor =
3,9). Logo, tem-se a amplitude das classes 12,8 / 7 = 1,83 2

12

## 3 Escrever as classes e contar os valores

Tempo
(minutos)

Nmero de

% de

3 | 5

8,9%

5 | 7

15

33,3%

7 | 9

18

40,0%

9 | 11

8,9%

11 | 13

4,4%

13 | 15

0,0%

15 | 17

4,4%

Total

45

100%

3 | 5 equivale a 3 < x 5
intervalo todos os valores
superiores a 3 e inferiores ou
iguais a 5.

## A freqncia absoluta (f i ) corresponde ao nmero de operadores

A freqncia relativa (f ri ) corresponde ao percentual de operadores

## 4.2 Grficos das distribuies de freqncia

Histograma de freqncias

20
18
16
14
12
10
8
6

18
15

4
2
0

2
0

3 | 5

5 | 7

7 | 9

9 | 11

11 | 13

13 | 15

15 | 17

Tempo (minutos)

## Uma alternativa ao histograma de freqncias o polgono de freqncias, construdo

mediante a conexo dos pontos mdios dos intervalos do histograma, com linhas retas.

13

## Anlise dos tempos para fazer o setup da mquina

20
18

18

16
14
12

15

10
8
6
4

2
0

3 | 5

5 | 7

7 | 9

2
0
9 | 11 11 | 13 13 | 15 15 | 17

Tempo (minutos)

OBS: uma vez que a rea do polgono deve ser 100%, deve-se ligar o primeiro e o ltimo
pontos mdios com o eixo horizontal, de modo a cercar a rea da distribuio observada.

Exerccios:
1. A tabela de dados representa o peso de 30 sacos de arroz da marca A selecionados
aleatoriamente em um supermercado. Construa a distribuio de freqncias e
922

930

936

950

954

954

958

965

968

974

977

979

987

## 989 1001 1006 1008 1010 1013 1017

1018 1034 1034 1035 1042 1044 1044 1048 1070 1116

6,2

9,0

12,2

14,7

7,9

9,8

8,0

13,3

13,3

8,9

8,8

8,3

11,8

11,8

14,7

8,5

7,7

11,4

11,2

10,6

14

## 4.3 Construo de distribuio de freqncia para dados discretos

Na construo de uma distribuio de freqncia utilizando dados contnuos, perde-se
quando so agrupados em classes. Isso pode ou no ocorrer com dados discretos,
dependendo da natureza dos dados e os objetivos do analista.

## Consideremos os seguintes dados relativos ao nmero de acidentes dirios em um grande

estacionamento, durante o perodo de 50 dias.
1

## Note que os dados esto entre 0 e 9.

Podemos construir uma distribuio de freqncia sem perda dos valores originais,
utilizando os prprios valores.

Freqncia
dias

% dos
dias

0,06

0,06

12

0,08

10

0,10

10

0,20

10

0,20

0,12

0,08

0,06

0,04

50

1,00

Nmero de dias

Classe

8
6
4
2
0
0

## No houve perda de informao, ou seja, poderamos construir a tabela original a partir da

distribuio de freqncias.

15

Por outro lado, poderamos usar como classes 0-1, 2-3, 4-5, 6-7 e 8-9.
Freqncia
dias

% dos
dias

0-1

0,12

2-3

0,18

4-5

20

0,40

6-7

10

0,20

8-9

0,10

50

1,00

25
Nmero de dias

Classe

20
15
10
5
0
0-1

2-3

4-5

6-7

8-9

quando:

## H suficientes observaes para originar uma distribuio significativa

Por outro lado, prefere-se uma distribuio de freqncia com perda da informao
quando:

## Esto em jogo inteiros e no inteiros

S existem inteiros, porm em nmero muito alto para permitir uma distribuio
til.

## A perda da informao de importncia secundria (por exemplo, o

arredondamento do peso de um caminho ou da renda anual para a unidade mais
prxima)

16

## 4.4 Construo de uma distribuio de freqncia acumulada

Uma distribuio de freqncia acumulada tem por objetivo indicar o nmero ou
percentual de itens menores do que, ou iguais a , determinado valor.
No caso dos acidentes podemos construir distribuies acumuladas para a distribuio com
e sem perda da informao.

Freqncias

Classe

N dias

% dias

0,06

0,06

0,06

0,12

0,08

0,20

0,10

0,30

10

0,20

0,50

10

0,20

0,70

0,12

0,82

0,08

0,90

0,06

0,96

0,04

1,00

50

1,00

Classe

N dias

% dias

0-1

0,12

0,12

2-3

0,18

0,30

4-5

20

0,40

0,70

6-7

10

0,20

0,90

8-9

0,10

1,00

50

1,00

## Com perda da informao

Freqncias

Podemos, pela primeira tabela, concluir que 90% dos dados correspondem a valores
menores ou iguais a 7. ou seja, Em 90% dos dias o nmero de acidentes no excede 7.

17

1.0

1.0

0.8

0.8

0.6

0.6

0.4

0.4

0.2

0.2

0.0

0.0
0

0-1

2-3

4-5

6-7

8-9

% dos dias

1,0
0,8
0,6
0,4
0,2
0,0
0

N. acidentes

## 4.5 Distribuies de freqncia para dados nominais e por postos

As distribuies de freqncias para dados nominais se assemelham s distribuies de
freqncia normais, porm apresentam as categorias em lugar das classes.
Por exemplo:
Vendas
absolutas

Vendas
relativas

Limo

600

0,375

Laranja

400

0,250

Melo

300

0,188

Melancia

200

0,125

Abacaxi

100

0,063

Total

1600

1,000

18

## 4.6 Grficos para distribuies de freqncia

A distribuio de freqncia muitas vezes utilizada para determinar o formato da
distribuio. A distribuio dos dados pode ser simtrica ou no.

Distribuies discretas

Assimtrica direita

Simtrica

Assimtrica esquerda

Exerccio:
Construa a distribuio de freqncia e desenhe o histograma dos dados a seguir. Qual
o formato da distribuio?
20,7
18,5
23,3
18,9
28,3

18,7
21,3
25,3
26,6
20,3

26,2
19,3
20,4
22,4
21,7

21,7
18,3
18,3
18,9
18,2

18,8
25,1
24,0
22,6
20,3

20,6
18,8
21,2
21,4
19,2

20,7
24,3
19,4
27,0
24,7

20,2
28,4
20,6
23,6
18,4

19

## 5 Medidas de ten dncia central

As medidas de tendncia central so usadas para indicar um valor que tende a representar
melhor um conjunto de nmeros. As trs medidas mais usadas so a mdia, a mediana e a
moda.

5.1 Mdia
5.1.1 Mdia aritmtica
A mdia aritmtica o resultado da diviso da soma de todos os valores da amostra pela

x
x=

i =1

ou simplesmente x =

x
n

## l-se somatrio de x i , i variando de 1 a n.

i =1
n

= x1 + x 2 + ... + x n

i =1

Se um estudante faz quatro provas, obtendo as notas 70, 60, 80 e 75, sua mdia : 71,25.

## A mdia sensvel a (ou afetada por) todos os valores do conjunto, assim, se um

nmero se modifica, a mdia tambm se modifica.

## Somando-se uma constante a cada valor do conjunto, a mdia ficar aumentada do

valor constante. Analogamente, extraindo-se um valor constante de cada valor do
conjunto, a mdia tambm ficar diminuda desse valor.

20

A frmula anterior para calcular a mdia aritmtica supe que cada observao tenha a
mesma importncia. A mdia ponderada considera que as informaes no tem a mesma
importncia, ou seja, devem ser levados em conta o peso das informaes.
n

w x
i

i =1
n

i =1

## Onde w i o peso da observao de ordem i.

Consideremos que um professor informe a classe de que haver dois exames parciais,
valendo cada um 30% da nota e um exame final valendo 40%. Um aluno obtm
desempenho 70 na primeira avaliao, 65 na segunda e 80 no exame final.
n

wx
i

i =1
n

= 72,50
1,00

i =1

## 5.1.3 Mdia geomtrica

A mdia geomtrica utilizada quando se deseja fazer a mdia de taxas de juro, por
exemplo. Neste caso, multiplicam-se os n termos e em seguida extra-se a raiz de ordem
n.
A mdia geomtrica o resultado da raiz de ordem n do produto de todos os valores da
amostra.
n

Mdia geomtrica =

i =1

OBS:

= x1x 2 x 3...x n

i =1

## 5.1.4 Mdia harmnica

A mdia harmnica de um conjunto de n nmeros a recproca da mdia aritmtica dos
recprocos dos nmeros.

21

Mdia harmnica =

1
n

1
1

n i 1 xi

n
1

## 5.1.5 Relao entre as mdias aritmtica, geomtrica e harmnica

A mdia geomtrica de um conjunto de nmeros positivos menor ou igual sua mdia
aritmtica, mas maior ou igual sua mdia harmnica.

HGx

Em smbolos:

## O sinal de igualdade vale somente quando todos os nmeros forem iguais.

Exemplo: o conjunto 2,4 e 8 tem mdia aritmtica 4,67, mdia geomtrica 4 e mdia
harmnica 3,43.

## 5.1.6 Clculo da mdia para uma distribuio de freqncia

A mdia de uma distribuio de freqncia calculada com base valor e na freqncia de

x =

fx
i

## Onde f i a freqncia da classe i.

Para dados com perda da informao, utiliza-se em lugar de x i o ponto mdio do intervalo.

Exemplo:
Classe

Ponto mdio
(x i )

N dias (f i )

f i xi

0-1

0,5

3,0

2-3

2,5

22,5

4-5

4,5

20

90,0

6-7

6,5

10

65,0

8-9

8,5

42,5

n = 50

223

x=

fx
i

223
= 4,46
50

22

Classe (x i )

N dias (f i )

f i xi

15

10

40

10

50

36

28

24

18

50

222

x =

fx
i

222
= 4,44
50

## Se fizssemos a mdia a partir da tabela original obteramos o valor de 4,44.

5.2 Mediana
A principal caracterstica da mediana dividir o conjunto de nmeros em dois grupos
iguais: a metade ter valores inferiores ou iguais mediana e a metade ter valores
superiores ou iguais mediana.
Para calcular a mediana inicia-se ordenando os valores em ordem crescente. Em seguida
conta-se at a metade deles. Em geral a mediana ocupa a posio (n+1)/2.
Para nmero mpar de valores a mediana o valor do meio. Para amostras com nmero
par de unidades, a mediana a mdia dos dois valores centrais.

Exemplos:
Amostra

Nmero de elementos

Mediana

2 3 34 25 14 5

9 elementos  mpar

1 2 23 3 4 45 5

2 4 31 73 89 24

10 elementos  par

1 2 23 34 47 89

3,5

3 4 23 15 32
6 7 32 52 36 21

23

## Uma medida semelhante mediana o quartil. Os quartis dividem o conjunto ordenado de

dados em quatro grupos iguais. 25% dos valores so inferiores ao primeiro quarti (Q 1 ),
25% esto entre Q 1 e a mediana, 25% esto entre a mediana e o terceiro quartil (Q 3 ).
OBS: o segundo quartil corresponde mediana (Q 2 =mediana).

LI

Q1

Q 2 =mediana

Q3

LI = Limite inferior

LS
LS=Limite superior

## 5.2.1 Clculo da mediana para uma distribuio de freqncia

Da mesma forma que para dados apresentados em srie, a mediana o ponto que divide
as informaes ao meio.

## A mediana pode ser obtida por interpolao, e dada pela frmula.

( f )1
c
Mediana = L1 + 2
f mediana

onde: L 1 = limite inferior da classe mediana, isso , da classe que contm a mediana
n = nmero de itens dos dados (freqncia total)
( f) 1 =soma de todas as freqncias das classes anteriores mediana
f mediana = freqncia da classe mediana
c = amplitude do intervalo da classe mediana

Exemplo:
No caso dos acidentes, temos 50 observaes, logo a mediana deve estar localizada na
posio (50+1)/2 = 25,5, ou seja, a classe que contm a mediana a classe 4-5.
O limite inferior da classe mediana 4. Antes da classe mediana (( f) 1 ) haviam passado
15 dados. A classe mediana contm 20 observaes e a amplitude da classe mediana 1.
Ento

50

15

x1 = 4 + 0,5 = 4,5
Mediana = 4 + 2
20

24

5.3 Moda
A moda o valor que aparece com maior freqncia na amostra. Um conjunto de dados
pode no apresentar moda, apresentar uma moda, duas modas (bimodal), trs modas
(trimodal) ou mais modas (polimodal).

Exemplo:
A moda do conjunto 2 3 4 3 2 3 5 1 2 3, pois o trs o valor que mais vezes aparece.

## 5.3.1 Clculo da moda para uma distribuio de freqncia

Quando no h perda da informao, a moda idntica ao valor da classe modal, que a
classe com maior freqncia.
Quando h perda da informao, a moda representa o(s) valor(es) de X
correspondente(m) ao(s) ponto(s) de ordenada(s) mxima(s) da curva e pode ser

1
Moda = L 1 +
1 + 2

onde: L 1 =limite inferior da classe modal (isto , a classe que contm a moda)
1 =excesso da freqncia modal sobre a da classe imediatamente anterior
2 = excesso da freqncia modal sobre a da classe imediatamente posterior

## c = amplitude da classe modal

Exemplo:
No caso dos acidentes....
Classe

N dias (f i )

0-1

2-3

4-5

20

6-7

10

8-9

Classe modal

n = 50

11
Moda = 4 +
1 = 4 + 0 ,52 = 4 ,52
11 + 10

25

A distribuio pode ter mais de uma moda, sendo bimodal ou de modas mltiplas. OBS: as
duas modas no precisam, necessariamente, ter a mesma freqncia. Isso acontece
quando h um deslocamento da distribuio.

Moda

Classe modal

Classes modais

Classes modais

## 5.4 Relao entre as medidas de tendncia central

relao emprica
Mdia Moda = 3 (Mdia Mediana)

Moda

Moda
Mediana

Moda

Mediana

Mediana

Mdia

Mdia

Mdia

Exerccios:
1. Para os seguintes conjuntos de dados, determine os valores da mdia aritmtica,
mdia geomtrica, mdia harmnica, mediana e moda.
a)

12

15

16

15

12

15

15

b)

c)

10

d)

38

38

70

92

22

17

14

26

a)

15

15

16

16

11

19

12

17

16

20

16

14

12

16

b)

12

11

12

## 3. Qual seria o efeito sobre a mdia de um conjunto de dados se se adicionasse 10:

a) a um dos nmeros?

## b) a cada um dos nmeros?

4. Joo possui 5 imveis localizados nesta cidade. Ele deseja saber qual o valor
valem R\$ 450,00/m 2 e imveis em bairros valem R\$ 300,00/m 2 , calcule o valor
mdio por m 2 do seu capital.
Apartamento de 80 m 2 no centro
Pavilho de 450 m 2 no bairro
Casa de 280 m 2 no centro
Apartamento de 120 m 2 no bairro
Casa de 320 m 2 no bairro

27

## 6 Medidas de vari abilidade

As medidas de variabilidade ou disperso indicam se os valores esto relativamente
prximos ou no uns dos outros.
Na anlise de um conjunto de dados necessrio que sejam observados tanto as
informaes relativas localizao (medidas de tendncia central) quanto as informaes

Exemplo:

Exemplo:
Duas mquinas esto sendo comparadas. A seguir est descrita a produo de cada uma
durante 5 dias.
Mdia

Produo
Mq 1

10

10

10

10

10

10

Mq 2

18

16

10

Voc acha que a programao da produo para as duas mquinas pode ser a mesma
durante 1 semana? Por qu?

## Consideraremos quatro medidas de disperso: amplitude, varincia, desvio padro e

coeficiente de variao. Todas elas, exceto a amplitude, tm na mdia o ponto de
referncia. Em cada caso, o valor zero indica ausncia de variao; a disperso aumenta
proporo que aumenta o valor da medida (intervalo, varincia, etc.).

6.1 Amplitude
Tambm conhecida como intervalo.
A amplitude de um grupo de dados , de modo geral, mais simples de calcular e de
entender. Consiste na diferena entre o maior e o menor valor, ou seja, entre os valores
extremos.

Amplitude = X max - X

mn

28

## A maior limitao da amplitude o fato de s levar em conta os valores extremos de um

Exemplo:
1. Calcule a amplitude dos seguintes conjuntos de dados. Voc acha que a disperso
dos conjuntos igual?
a)

15

15

12

14

16

16

15

b)

16

6.2 Varincia
Calcula-se a varincia de uma amostra elevando-se as diferenas de cada um dos valores
em relao mdia, somando-se estas diferenas e dividindo-se por n-1.

2
x

(x
=

x)2

n 1

## Quando se deseja a varincia populacional, deve-se substituir n-1 por n na frmula.

Usualmente iremos utilizar a varincia amostral.

Exemplo:
Clculo da varincia do conjunto de dados 2,4,6,8, e 10.

( xi

x )2

xi

xi x

-4

16

-2

10

16

40

Somas

2
x

(x
=

x)2

n 1

40
= 10
5 1

29

(x

sx =

x)2

n 1

xi

n 1
2
i

## Como anteriormente, a substituio de n-1 por n produz as frmulas para a populao.

os dados so em Reais, o desvio padro tambm vai ser em reais (e a varincia em
reais 2 ).

Exemplo:
Clculo do desvio padro do conjunto de dados 20, 5, 10, 15 e 25.
Usando a frmula normal:
( xi

x )2

xi

xi x

20

15

25

15

-10

100

10

15

-5

25

15

15

25

15

10

100

250

Somas

sx =

(x

x)2

n 1

250
=
5 1

62,5 = 7,91

x
x

i
2
i

= 20 + 5 + 10 + 15 + 25 = 75
= 202 + 52 + 102 + 152 + 252 = 1375

sx =

x
x

n 1
2
i

n
=

1375 75
5 1

5 =

250
= 7,91
5 1

## 6.4 Coeficiente de variao

O coeficiente de variao uma medida de variao til para comparar conjuntos de
dados diferentes. Ele usualmente expresso em percentual.

O coeficiente de variao dado pelo quociente entre o desvio padro e a mdia dos
30

CV =

=
Mdia
X

Exemplo:
Conjunto A
Conjunto B
12
3
25
4
16
5
23
2
Soluo:

CVA =

=
= 0,3187
MdiaA
19

CVB =

=
= 0,3688
MdiaB
3,5

## Ento o conjunto que possui maior variabilidade o conjunto B.

Exerccios:
1. O desvio padro pode ser zero? Explique. Pode ser negativo? Explique.

R\$ 8100

R\$ 9000

R\$ 4580

R\$ 5600

R\$ 7680

R\$ 4800

R\$ 10640

26,5

27,5

25,5

26,0

27,0

23,4

25,1

26,2

26,8

quartis

## 7 Medidas de a ssi metria e curtose

As medidas de assimetria e curtose indicam qual o formato da distribuio dos dados em
Assimetria o grau de desvio, ou afastamento da simetria, de uma distribuio. Ela
retorna a distoro de uma distribuio. O valor enviesado caracteriza o grau de assimetria
de uma distribuio em torno de sua mdia. Um valor positivo indica uma distribuio com
uma ponta assimtrica que se estende em direo a valores mais positivos. Um valor

31

negativo indica uma distribuio com uma ponta assimtrica que se estende em direo a
valores mais negativos. No excel a funo correspondente distoro .

n
xi x

Assimetria =

(n 1)(n 2)
s

Assimtrica positiva

Simtrica

Assimtrica negativa

a>0

a=0

a<0

## A curtose o grau de achatamento de uma distribuio e caracteriza uma distribuio em

positiva indica uma distribuio relativamente em cume (chamada leptocrtica). A curtose
negativa indica uma distribuio relativamente plana (chamada platicrtica). A funo
correspondente no excel chama-se CURT, e calcula a curtose de um conjunto de dados de,
no mximo, 30 valores.
4

n(n + 1)
3(n 1) 2
x i x

Curtose =
s (n 2)(n 3)
(n 1)(n 2)(n 3)

Leptocrtica

Mesocrtica

Platicrtica

c>0

c=0

c<0

## Prof. Cntia Paese Giacomello

8 I nt r odu o p robabilid ad e
As origens da probabilidade remontam ao sculo XVI. As aplicaes iniciais referiam-se
quase todas a jogos de azar. Os jogadores aplicavam o conhecimento da teoria das
probabilidades para planejar estratgias de apostas.
Atualmente a utilizao das probabilidades ultrapassou de muito o mbito desses jogos.
Hoje os governos, as empresas, as organizaes profissionais incorporam a teoria das
probabilidades em seus processos dirios de deliberaes.
Independentemente de qual seja a aplicao em particular, a utilizao das probabilidades
indica que existe um elemento de acaso, ou de incerteza, quanto ocorrncia ou no de
um evento futuro. Assim que, em muitos casos, pode ser virtualmente impossvel afirmar
por antecipao o que ocorrer, mas possvel dizer o que pode ocorrer.
H numerosos exemplos de tais situaes no campo dos negcios e do governo. A previso
da procura de um novo produto, o clculo dos custos da produo, a previso das safras,
a compra de aplices de seguros, a avaliao da reduo de impostos sobre a inflao. As
probabilidades so teis pois ajudam a desenvolver estratgias.
O ponto central em todas as situaes a possibilidade de quantificar quo provvel
evento. O estudo das probabilidades importante pois elas so a base para o estudo
estatstico.

## 8.1 Experimento aleatrio

Experimentos aleatrios so aqueles que, mesmo repetidos vrias vezes sob condies
Caractersticas dos experimentos aleatrios:
1. Podem ser repetidos indefinidamente sob as mesmas condies.
2. No se pode adiantar um resultado particular, mas pode-se descrever todos os

3. Se

## Ao descrever um experimento aleatrio deve-se especificar no somente que operao ou

procedimento deva ser realizado, mas tambm o que dever ser observado. (Note a diferena
entre o 2 o e o 3 o )

33

## Um lote de 10 peas contm 3 defeituosas. As peas so retiradas uma a uma

(sem reposio) at que a ltima defeituosa seja encontrada. Conta-se o

## Uma lmpada nova ligada e observa-se o tempo gasto at queimar.

Lana-se uma moeda at que ocorra uma cara e conta-se ento o nmero de
lanamentos necessrios.

## 8.2 Espao amostral

O espao amostral (S) de um experimento aleatrio o conjunto de todos os possveis
n(S) o nmero de elementos do conjunto S, ou o nmero de resultados possveis.

## Exemplo : um experimento o lanamento de uma moeda. Os possveis resultados so

cara ou coroa, ento, S={cara, coroa}.
Em dois lanamentos de uma moeda, sendo interessante observar a ordem dos resultados,
os possveis resultados so: 1) cara e cara, 2) cara e coroa, 3) coroa e cara e 4) coroa e
coroa. O espao amostral S={(Ca,Ca), (Ca,Co), (Co,Ca) e (Co,Co)}. n(S)=4

8.3 Eventos
Chama-se de evento qualquer subconjunto do espao amostral S de um experimento
aleatrio, ou seja, qualquer resultado do espao amostral.

## Exemplo : no lanamento de uma moeda S={cara, coroa}. Um evento de interesse A pode

ser obter cara no lanamento de uma moeda e n(A)=1.
No lanamento de um dado, o evento de interesse (A) pode ser obter face par e n(A)=3.

## 8.4 A probabilidade de um evento

Seja A um evento. A probabilidade deste evento ocorrer dada por P(A), que um
nmero entre 0 e 1. Quanto mais prxima a probabilidade estiver de 1, maior ser sua
chance de ocorrncia. A um evento impossvel atribui-se probabilidade 0, enquanto que
um evento certo tem probabilidade 1.
H trs maneiras diferentes de calcular ou estimar probabilidades: o mtodo clssico,
quanto o espao amostral tem resultados igualmente provveis. O mtodo emprico, que
34

## se baseia na freqncia relativa de ocorrncia de um evento num grande nmero de

provas repetidas e o mtodo subjetivo, que utiliza estimativas pessoais de probabilidade,
baseadas num certo grau de crena. Em geral vamos utilizar o mtodo clssico de clculo

P( A ) =

Exemplo:
Experimento: lanar um dado e observar a face superior
Espao amostral: S={1,2,3,4,5,6}

n(S)=6

n(A)=3

## P(A)= 3/6 = = 0,5 ou 50%

OBS: existe uma pequena diferena entre probabilidade e chance de um evento. A probabilidade
relaciona o nmero de resultados de A com o nmero de resultados total, enquanto que chance
compara o nmero de resultados de A com o nmero de resultados de outro evento (B ou C).
Em uma urna com 5 bolas brancas, 3 vermelhas e 2 azuis,
A probabilidade de selecionar uma bola branca P(branca)=5/10=0,5 ou 50%
E a chance de selecionar uma bola branca 5:5, que semelhante a 1:1, o que significa que existe a
mesma chance de retirar uma bola branca ou uma bola de outra cor.

Exerccios:
1. Escreva o espao amostral no lanamento de um dado. Ache a probabilidade

## 2. Extrai-se uma carta de um baralho de 52 cartas. Determine a probabilidade de:

a) um valete
b) uma carta vermelha
c) um dez de paus
d) uma figura
e) uma carta de ouros
f) um nove vermelho

35

ocorrerem
Experimento

Evento

Cara

## Lanar um dado uma vez

Extrair uma carta de um baralho com
52 cartas
Extrair uma carta de um baralho de 52
cartas

P(Evento)

Face 3
6 vermelho
Valete de ouros

## 4. Encontre n(S), n(A) e P(A) no lanamento de dois dados

S={(1,1), (1,2), (1,3),.....,(6,4),(6,5),(6,6)}
N(S)=36

## 5. H 50 bolas numa urna: 20 azuis, 15 vermelhas, 10 pretas e 5 verdes. Misturam-se

as bolas. Determine a probabilidade da bola escolhida ser:
a) Verde
b) Azul
c) Verde ou azul
d) No-vermelha
e) Vermelha ou verde
f) Amarela
g) No-amarela

36

6. Um motorista tem uma marca num de seus pneus, e 20% do pneu visvel. Ao
parar, qual a probabilidade da marca ficar na parte visvel?

7. Um motor tem 6 velas, e uma est defeituosa, devendo ser substituda. Duas esto
em posio de difcil acesso, o que torna difcil a substituio.
a) Qual a probabilidade de a vela defeituosa estar em posio difcil?
b) Qual a de no estar em posio difcil?

1500 clientes compradores de domingo gastam mais de R\$ 40,00 em suas compras.
Estime a probabilidade de um comprador em qualquer domingo gastar mais de R\$
40,00.

9. Uma pesquisa de trfego levada a efeito das 5 s 6 horas da manh num trecho de
uma rodovia federal revelou que, de 200 carros que pararam para uma verificao
rotineira de segurana, 25 tinham pneus em ms condies. Estime a probabilidade
de um carro que pare naquele trecho ter seus pneus em boas condies

Muitas aplicaes da estatstica exigem a determinao da probabilidade de combinaes
dos eventos. H duas caractersticas de combinaes. Pode ser necessrio determinar a
probabilidade de ambos os eventos acontecerem P(A e B) ou a probabilidade de um deles,
A ou B, ou seja, P(A ou B).

estar em servio?

## Ambos implica P(A e B)

Um ou outro implica P(A ou B)

37

A regra da adio leva em conta a ocorrncia do evento A ou do evento B ou de ambos os

## P(A ou B) = P(A) + P(B) P(A e B)

Quando os eventos so mutuamente excludentes (no tem elementos em comum), ento a
probabilidade de ambos nula e o termo P(A e B) ser zero.
Se A e B so mutuamente excludentes  P(A ou B) = P(A) + P(B)

OBS: Para apresentar os eventos utilizam-se os Diagramas de Venn [apresentados por John Venn
(1834-1923)], que representam os espaos amostrais e os eventos como crculos, quadrados, ou outra
figura geomtrica conveniente.

Exerccios:
1. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso.
Qual a probabilidade do nmero ser par ou maior que 4?

2. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso.
Qual a probabilidade do nmero ser um nmero primo ou maior que 8?

38

Regra da multiplicao
Considerando-se dois eventos A e B de um mesmo espao amostral, a probabilidade de A e

P(A e B) = P(A|B) P(B)
Onde P(A|B) a probabilidade de A ocorrer dado que B tenha ocorrido.

## Quando a probabilidade de B ocorrer no depender de A ter ocorrido, dizemos que A e B

so independentes, e P(B| A)=P(B)
Se A e B so independentes  P(A e B)=P(A)P(B)

Exemplo 1: Deve-se inspecionar uma grande caixa de peas. Os registros indicam que 2%
das caixas acusam contedo inferior ao estipulado. Escolhidas duas caixas aleatoriamente,
qual a probabilidade de ambas acusarem contedo inferior, admitindo-se que a remessa
inspecionada semelhante as anteriores (isto , 2% de deficientes)?
P(ambas deficientes)=P(deficiente)P(deficiente)
=0,02 x 0,02
=0,0004 ou seja, 0,04% de probabilidade das caixas serem defeituosas.

Exemplo 2: Suponha que 20 canetas esto expostas numa papelaria. Seis so vermelhas e
14 azuis. Do conjunto de 20, iremos escolher 2 canetas aleatoriamente. Qual a
Neste caso os eventos no so independentes, pois a cor da primeira caneta
Seja

5 6 30
=
= 0,0789
19 20 380

## Prof. Cntia Paese Giacomello

39

P(A ou B), Para eventos no mutuamente excludentes:
P(A ou B ou ambos) = P(A) + P(B) P(A e B)
para eventos mutuamente excludentes:
P(A ou B) = P(A) + P(B)
para eventos independentes:

P(A e B),

## P(A e B) = P(A) . P(B)

Para eventos dependentes
P(A e B) = P(B).P(A/B) ou P(A).P(B/A)

## Outra forma de apresentar os eventos atravs de tabelas de contingncia (tabelas com

cruzamento de classificaes).
Por exemplo:
Vermelha

Preta

Totais

No s

24

24

48

Totais

26

26

52

Exerccios
1. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, sem
reposio, determine a probabilidade de retirar a primeira azul e a segunda
vermelha.

2. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, com
reposio, determine a probabilidade de retirar a primeira azul e a segunda
vermelha.

3. Em um lote de 12 peas, quatro so defeituosas. Retira-se uma pea e inspecionase. Qual a probabilidade:
a. Da pea ser defeituosa
b. Dela no ser defeituosa

40

4. Uma loja dispe de pneus novos e recapados. Entre 100 pneus, sabe-se que 30 so
a. Se um cliente levar um pneu, qual a probabilidade de que ele seja recapado?
b. Se um cliente levar dois pneus, qual a probabilidade de que ambos sejam

## 5. Um dado lanado 3 vezes. Calcule a probabilidade de que se obtenha face 6 nos 3

lanamentos.

6. Uma urna contm 50 bolas numeradas de 1 a 50. Sero selecionadas 5 bolas, sem
reposio. Qual a probabilidade de que uma pessoa que tenha feito um jogo
anotando os 5 nmero acerte todos?

41

## 7. Nos ltimos anos, as empresas de cartes de crdito intensificaram esforos no

sentido de abrir mais contas para alunos de faculdade. Suponha que uma amostra
de 200 alunos em sua faculdade apresentou as seguintes informaes em termos
de o aluno possuir carto de crdito bancrio e/ou carto de crdito de viagem e
entretenimento:
CC de viagem e entretenimento

CC bancrio

Totais

Sim

No

Sim

60

60

120

No

15

65

80

Totais

75

125

200

## a. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o

aluno possua um carto de crdito bancrio?

## b. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o

aluno no possua um carto de crdito bancrio?

## c. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o

aluno possua um carto de crdito bancrio e um carto de viagem e
entretenimento?

## d. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o

aluno no possua um carto de crdito bancrio nem carto de viagem e
entretenimento?

## e. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o

aluno possua um carto de crdito bancrio ou possua um carto de viagem
e entretenimento?

f.

## Suponha que um aluno possui um carto de crdito bancrio. Qual a

probabilidade de que ele possua um carto de viagem e entretenimento?

## g. Suponha que o aluno no possui um carto de viagem e entretenimento.

Qual a probabilidade de que ele ou ela possua um carto de crdito
bancrio?

## h. Os dois eventos, possuir um carto de crdito bancrio e possuir um carto

de viagem e entretenimento, so estatisticamente independentes? Explique.

42

amostrais

(Amostra=conjunto

de

Por exemplo, 50 valores de satisfao dos clientes so interpretados como uma amostra
da satisfao de todos os clientes.
O uso de mtodos estatsticos permite que se analise essa amostra e se tire alguma
concluso sobre a satisfao dos clientes.
Uma distribuio de probabilidade um modelo matemtico que relaciona um certo valor
da varivel em estudo com a sua probabilidade de ocorrncia.

## H dois tipos de distribuio de probabilidade

1. Distribuies Contnuas: Quando a varivel que est sendo medida expressa
em uma escala contnua, como por exemplo, o peso de peas produzidas, dimetro, etc.
2. Distribuies Discretas: Quando a varivel que est sendo medida s pode
assumir certos valores, como por exemplo os valores inteiros 0, 1, 2, etc.

## No caso de distribuies discretas, a probabilidade que a varivel

P {X = x o } = P(x o )

assuma um valor

## No caso de variveis contnuas, as probabilidades so especificadas em termos de

b
intervalos: P a x b = a f ( x ) dx

Relembrando: uma varivel aleatria uma funo com valores numricos, cujos
valores so determinados por fatores de chance.
Uma varivel aleatria considerada discreta se toma valores que podem ser
Uma varivel aleatria considerada contnua quando pode tomar qualquer valor

43

## Os grficos a seguir apresentam exemplos de distribuies de probabilidades discreta e

contnua.

Exemplo:
Distribuio de probabilidade para a varivel aleatria nmero de caras em duas jogadas
de uma moeda.

Nmero de
caras
Valor da V.A.

Prob. do

Nmero de
caras
Valor da V.A

Prob. do

Cara

x =

Cara Coroa

x =
1

+ =

Coroa Cara

x =

Coroa Coroa

x =

Cara

Soma = 1

Soma = 1

O valor esperado, ou esperana matemtica, de uma varivel aleatria E(x), que consiste
no valor esperado para ela, ou seja, o valor mdio da varivel.
n

E( x ) =

px
i

se X v.a. discreta

i =1

ou

E( X) =

x. f(x) dx

se X v.a. contnua

Var ( X)
44

## Neste exemplo, o valor esperado 0 . + 1 . + 2 . = 1.

E a varincia Var(X)=E(X 2 )-[E(X)] 2 = E(X 2 ) - 1= (0 2 . + 1 2 . + 2 2 .) 1 =1,5-1=0,5 E

Exemplo: um investidor julga que tem 0,4 de probabilidade de ganhar \$ 25.000 e 0,6 de
perder \$ 15.000. Seu ganho esperado de:
E(X) = 0,4 (25.000) + 0,6 (-15.000) = \$ 1.000.
E a varincia Var(X)=E(X 2 )-[E(X)] 2
= E(X 2 ) 1.000 2
=(0,4.25.000 2 + 0,6.(-15.000) 2 )-1.000 2
=(0,4 x 625.000.000 + 0,6 x 225.000.000)-1.000 2
= 250.000.000+ 135.000.000 1.000 2
= 385.000.000 1.000.000
= 384.000.000

Exerccios:
1. O nmero de chamadas telefnicas recebidas por uma mesa e suas respectivas
probabilidades para um intervalo de 3 minutos so:

Total

Freqncia relativa

0,60

0,20

0,10

0,04

0,03

0,03

1,00

Em mdia, quantas chamadas podem ser esperadas num intervalo de trs minutos?

## 2. Um bilhete de loteria tem 0,00001 de chance de dar um prmio de \$ 100.000,

0,00002 de chance de dar um prmio de \$ 50.000 e 0,004 de chance de um prmio
de \$ 25. Qual seria o preo justo de venda do bilhete?

## 3. Uma confeitaria estabeleceu um registro de vendas para certo tipo de bolo.

N bolos/dia

Total

Freqncia relativa

0,02

0,07

0,09

0,12

0,20

0,20

0,18

0,10

0,01

0,01

1,00

45

## 9.1.1 Distribuies discretas mais importantes

As principais distribuies discretas so a Distribuio de Bernoulli, Distribuio
Binomial e Distribuio Poisson.

Distribuio de Bernoulli
A distribuio de Bernoulli consiste em uma distribuio adequada varivel aleatria de
Bernoulli, que por sua vez uma v.a. que assume apenas os valores 0 e 1, com funo de
P(0) = P(X=0) = 1- p
P(1) = P(X=1) = p

## Ento, E(X)= p e Var(X)= p (1- p )

Distribuio Binomial
Seja um processo composto de uma seqncia de observaes independentes, onde o
Se a probabilidade de sucesso constante e igual a p, a distribuio do nmero de
sucessos seguir o modelo Binomial.
A distribuio Binomial usada com freqncia no controle de qualidade. o modelo
apropriado quando a amostragem feita sobre uma populao infinita ou muito grande.

## A distribuio binomial possui quatro propriedades essenciais:

1. As observaes possveis podem ser obtidas atravs de dois diferentes
tivesse sido selecionada a partir de uma populao infinita sem reposio ou
a partir de uma populao finita com reposio.
mutuamente excludentes e coletivamente exaustivas, usualmente chamadas
sucesso ou falha.
3. A probabilidade de uma observao ser classificada como sucesso ( p )
constante de observao para observao. Assim sendo, a probabilidade de
fracasso 1-p tambm constante.
4. O resultado (isto , sucesso ou fracasso) de qualquer observao
independe do resultado de qualquer outra observao.

## Em aplicaes de controle da qualidade, x em geral representa o nmero de defeituosos

observados em uma amostra de n itens.
46

n
P ( x ) = p x (1 p ) n x
x
onde

n
n!
=
x ! ( n x )!
x

n
representa o nmero de combinaes de n objetos tomados x de cada vez
x
P(X) = probabilidade de X sucessos uma vez que n e p so conhecidos
n = tamanho da amostra

## X = nmero de sucessos na amostra (X=0, 1, 2, ..., n)

A mdia de uma varivel aleatria com distribuio binomial

= np

## dada por 2 = np(1-p) onde p proporo de sucessos na amostra p =

e a varincia

x
n

Exemplo:
Um processo industrial opera com mdia de 1% de defeituosos. Baseado em amostras de
100 unidades, calcule as probabilidades de uma amostra apresentar 0 , 1 , 2 , 3 e 4
defeituosos. Plote a distribuio de probabilidade correspondente.
Como a varivel aleatria pode apresentar apenas duas possibilidades, ser boa ou
defeituosa, a distribuio que melhor se ajusta a distribuio binomial, com
parmetros p=0,01 e n=100.
Ento, a probabilidade de uma amostra de tamanho n = 100 apresentar 0
defeituosos

n
100
0 ,010 (1 0 ,01)100 0 = 0,366
P( x ) = p x (1 p)n x  P(x=0) = P(0) =
x
0
P(x=1) = P(1) =

100 1
0,01 (1 0,01)1001 = 0,370
1
100

P(x=2) = P(2) =
2
100

0,01 (1 0,01)
P(x=3) = P(3) =
3
3

100 3

= 0,061

100

P(x=4) = P(4) =
4

## Prof. Cntia Paese Giacomello

0,4

P(x)

0,3
0,2
0,1
0
x=0

x=1

x=2

x=3

x=4

Exerccios:
1. Um processo opera segundo uma chance de falha de 2%. Coletando amostras de 25
defeituosos ou menos.

## 2. Imagine que para o processo anterior, fossem coletadas amostras de 50 unidades e

o critrio para parar o processo e procurar causas especiais fosse X=1 ou mais.
Calcule a percentagem de vezes que o processo seria interrompido logo aps a
amostragem.

Distribuio de Poisson

## A aplicao tpica da distribuio de Poisson no controle da qualidade como um modelo

para o nmero de defeitos (no-conformidades) que ocorre por unidade de produto (por
m 2 , por volume ou por tempo)
Diz-se que existe um processo de Poisson se pudermos observar eventos discretos numa
rea de oportunidade um intervalo contnuo (de tempo, de comprimento, de rea, ...) de
maneira tal que, se encurtarmos a rea de oportunidade ou intervalo suficientemente:
1. A probabilidade de se observar exatamente um sucesso no intervalo
estvel
Prof. Cntia Paese Giacomello

## 2. A probabilidade de se observar mais de um sucesso no intervalo zero

3. A ocorrncia de um sucesso em qualquer intervalo estatisticamente
independente da ocorrncia em qualquer outro intervalo

## A distribuio de Poisson tem um parmetro (lambda) que a mdia ou o nmero

esperado de sucessos por unidade. A varincia desta distribuio 2 = . O nmero de
sucessos X da varivel aleatria de Poisson varia de 0 a .

## A expresso matemtica para a distribuio de Poisson para se obterem X sucessos, dado

P( x ) =
onde

e x
onde x=0,1,2,....
x!

## e = constante matemtica (aproximadamente 2,71828)

X = nmero de sucessos por unidade

Exemplo:
Suponha que o nmero de defeitos no cordo de solda de uma carroceria siga uma
distribuio de Poisson com = 2.
Ento a probabilidade de uma carroceria apresentar mais de 3 defeitos ser:
P(X> 3) = 1 P(x 3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)]
Onde P( x ) =

e x
x!

P(0) =

e 2 2 0
= 0,135
0!

e 2 21
P(x=1) = P(1) =
= 0,271
1!
P(x=2) = P(2) = 0,271

Logo,
P(X> 3)

## = 1 P(x 3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)]

= 1 [0,135+0,271+0,271+0,180]
= 1 [0,857]
=0,143  14%

## A probabilidade de uma carroceria apresentar mais de trs defeitos 14%.

Exemplo 2:
Prof. Cntia Paese Giacomello

## Se chegam em mdia 2 carros por minuto em um posto de gasolina, qual a probabilidade

de que cheguem exatamente 5 carros em dois minutos?
Neste caso o tempo diferente do tempo correspondente ao . Ento deve-se transformar
o para que ele corresponda ao tempo de 2 minutos. Chegam em mdia 2 carros por
minuto  chegam em mdia 4 carros em 2 minutos
=4

e x
P( x ) =
x!

e 4 45
P (5) =
= 0,1563 = 15,63%
5!

Exerccios:
1. O setor financeiro de uma loja de departamentos est tentando controlar o nmero
de erros cometidos na emisso das notas fiscais. Suponha que esses erros sigam o
modelo de Poisson com mdia = 0,03. Qual a probabilidade de uma nota
selecionada ao acaso conter 1 ou mais erros?

## 2. Em uma indstria automotiva, defeitos superficiais de pintura ocorrem a uma taxa

acaso apresente 1 ou mais defeitos superficiais.

## 3. Em uma empresa industrial ocorrem, em mdia, 3 acidentes por ms. Qual a

4. Dez por cento das ferramentas produzidas por um certo processo de fabricao
revelaram-se defeituosas. Determinar a probabilidade de, em uma amostra de 10
ferramentas escolhidas ao acaso, exatamente duas serem defeituosas mediante o
emprego da distribuio de Poisson.

## 5. Se a probabilidade de um indivduo sofrer uma reao nociva, resultante da injeo

de um determinado soro 0,001, qual a probabilidade de, entre 2000 indivduos,
a) exatamente 3 sofrerem aquela reao? b) Mais de 2 sofrerem a reao?

50

## 9.1.2 Distribuies contnuas

A distribuio mais importante e mais utilizada na prtica a Distribuio Normal.
Outros modelos importantes de distribuies contnuas so: Uniforme, Exponencial, Gama,

Distribuio Normal
A Distribuio Normal essencialmente importante na estatstica por trs razes
principais:
1. Inmeros fenmenos contnuos parecem segu-la ou podem ser aproximados por
meio dela
2. Podemos utiliz-la para aproximar vrias distribuies de probabilidade discretas
3. Ela oferece a base para a inferncia estatstica clssica, devido sua afinidade
com o teorema do limite central

## Os parmetros da distribuio Normal so a mdia e o desvio padro. Trata-se de uma

distribuio simtrica, unimodal, em forma de sino.

f ( x) =

onde:

exp

1 x

## e = constante matemtica (aproximada por 2,71828)

= constante matemtica (aproximada por 3,14159)
= mdia aritmtica da populao

## Prof. Cntia Paese Giacomello

99,73%
95,44%
68,26%

-1 +1
-2

+2

-3

+3

Para simplificar a notao de uma v.a.c. com distribuio normal, com mdia e varincia
2
utiliza-se:
X~ N( , 2 )
A distribuio Normal acumulada obtida calculando a probabilidade de X ser menor que
a

P( x a) = F(a) =

f (x)dx

Essa integral no pode ser resolvida em forma fechada, mas a soluo est apresentada
em tabelas onde se entra com a varivel reduzida ou varivel padronizada Z e
encontra-se F(Z) ou vice-versa.

P( x a) = P Z
= F(Z )

## Prof. Cntia Paese Giacomello

Exemplo:
O peso de um produto uma caracterstica muito importante. Sabe-se que o peso segue
um modelo normal com mdia 1000 gramas e desvio padro 40 gramas. Se a especificao
tcnica estabelece que o peso deve ser maior que 950 gramas, qual a probabilidade de
que um pacote selecionado aleatoriamente satisfaa a especificao?
OBS: este esquema equivale

P(x>950) = P Z >

950 1000
= P(Z > 1,25) = 0,3944 + 0,5000 = 0,8944
40

X=950 =1000
=40

Z=-1,25 =0
=1

de 89%.

## Exemplo 2: Sabe-se que X representa medies feitas em um processo que segue o

modelo Normal com mdia 100 e desvio padro 10. Se forem feitas 4000 medies,
quantas estaro entre 95 e 112?

112 100
95 100
<Z<

10
10

P(95<x<112)= P
= P(-0,5<Z<1,2)
=0,1915+0,3849

=100
=10

## =0,5764  Aproximadamente 58% estaro entre 95 e 112.

Se forem feitas 4000 medies, aproximadamente 2305 estaro entre 95 e 112. (4000 x
57,64%)

53

Exerccios:
1. A resistncia trao do papel usado em sacolas de supermercado uma
caracterstica de qualidade importante. Sabe-se que essa resistncia segue um
modelo Normal com mdia 40 psi e desvio padro 2 psi. Se a especificao
estabelece que a resistncia deve ser maior que 35 psi, qual a probabilidade que
uma sacola produzida com este material satisfaa a especificao?

## 2. O dimetro do eixo principal de um disco rgido segue a distribuio Normal com

mdia 25,08mm e desvio padro 0,05mm. Se as especificaes para esse eixo so
25,00 0,15mm (isto , varia de 24,85 a 25,15mm), determine o percentual de

## 3. A resistncia trao de isoladores cermicos apresenta distribuio Normal com

mdia 95 Kg e desvio padro 4 Kg. Se so produzidas 10.000 unidades desses
isoladores, quantos apresentaro resistncia inferior a 85 Kg?
E quantos
apresentaro resistncia superior a 90 Kg?

4. A sada de uma bateria segue o modelo Normal com mdia 12,15 V e desvio padro
0,2 V.
0,5 V.

## Prof. Cntia Paese Giacomello

5. A vida til de lavadora de pratos automticas de 1,5 anos, com desvio padro 0,3
anos. Se os defeitos se distribuem normalmente, qual a probabilidade de uma
lavadora necessitar conserto antes de expirar o perodo de 1 ano de garantia?

## 6. O tempo necessrio, em uma oficina, para o conserto de transmisso para certo

carro normalmente distribudo com mdia 45 min e desvio padro 8 min. O
mecnico planeja comear o conserto do carro 10 min aps o cliente deix-lo na
oficina, comunicando que o carro estar pronto em 1 h. Qual a probabilidade de
que o cliente tenha que esperar caso o mecnico esteja enganado e o cliente fique
esperando?

7. Sabe-se que o contedo de uma lata de cerveja 350 ml e que tem distribuio
a. Que % de latas tem menos que 345 ml de contedo?
b. Que % de latas tem mais que 360 ml de contedo?

8. Uma fbrica de pneus fez um teste para medir o desgaste de pneus e verificou que
ele seguia o comportamento de uma curva normal com mdia 48.000 km e desvio
padro de 2.000 km. Calcule a probabilidade de um pneu escolhido ao acaso:
a. Dure mais que 47.000 km?
b. Dure entre 45.000 e 51.000 km?
c. At que quilometragem duram 90% dos pneus?

## Prof. Cntia Paese Giacomello

55

1 0 T e o r i a e l e m e n t a r d a a m o s t r a g em
A teoria da amostragem o estudo das relaes existentes entre uma populao e as
da populao ( parmetros ) atravs de conhecimento das grandezas correspondentes nas
amostras ( estatsticas amostrais ).
A teoria da amostragem tambm til para determinar se as diferenas observadas entre
duas amostras so devidas a uma variao casual ou so verdadeiramente significativas.
Por exemplo: queremos testar se os tempos de processamento da matria prima de dois
sistemas de produo so diferentes ou no. A resposta a esta questo implica o uso de
testes de hiptese, que ser visto mais adiante.
Denomina-se inferncia estatstica a inferncia de parmetros (da populao) com base
Para que as concluses sejam vlidas, necessrio que a amostra selecionada seja
representativa da populao. Para isso podem ser utilizados os mtodos de amostragem

## 10.1 Amostragem com e sem reposio

Quando selecionamos uma amostra devemos analisar se esta amostragem com ou sem
reposio. Na amostragem com reposio o mesmo elemento pode ser escolhido mais de
uma vez. Na amostragem sem reposio cada elemento s pode ser selecionado uma nica
vez.
Exemplo: uma urna contm dez bolas, numeradas de 0 a 9. Retira-se a primeira bola,
anota-se o nmero, 3 por exemplo, e no se recoloca a bola na urna. Os outros nmeros
que podem ser sorteados so 0, 1, 2, 4, 5, 6, 7, 8 e 9. Este sistema o sistema sem
reposio. Entretanto, se tivssemos recolocado a bola 3 na urna, ento todos os nmeros
poderiam ser selecionados na segunda extrao, inclusive o 3. Este sistema chamado
sistema com reposio.
Em geral, quando uma amostragem sem reposio, dizemos que a populao finita.
Quando uma amostragem com reposio, ento dizemos que a populao infinita, pois
a populao nunca ser exaurida. Para fins prticos a amostragem de uma populao finita
muito grande pode ser considerada infinita.

## 10.2 Distribuies amostrais

Consideremos todas as amostras possveis de tamanho n que podem ser retiradas de uma
populao dada (com ou sem reposio). Para cada amostra podemos calcular uma
grandeza estatstica, por exemplo, a mdia. Deste modo obtemos a distribuio amostral
da mdia. Da mesma forma podemos calcular a distribuio amostral do desvio padro, da
varincia, das propores, ...
56

## Distribuio amostral das mdias

Uma distribuio amostral de mdias uma distribuio de probabilidade que indica quo
provveis so diversas mdias amostrais. A distribuio funo da mdia, do desvio
padro da populao e do tamanho da amostra. Para cada combinao da mdia, desvio
padro e tamanho da amostra haver uma nica distribuio amostral de mdias.

Sejam:

x = mdia da populao =

## x = mdia da distribuio amostral

x = desvio padro da populao =

## x = desvio padro da distribuio amostral

N = tamanho da populao
n = tamanho da amostra

## Admita-se que todas as amostras possveis de tamanho n sejam retiradas de uma

populao finita de tamanho N>n. Ento:
Populao Finita:

x =

x =

Nn
N 1

## Se a populao for infinita, ou se amostragem for tomada com reposio, os resultados

sero:
Populao Infinita:

x =

x =

A frmula do desvio padro nos diz que a quantidade de disperso na distribuio amostral
depende de dois fatores:
-

a disperso da populao

## Por exemplo, em qualquer populao, o aumento do tamanho das amostras extradas

resultar em menor variabilidade entre as possveis mdias amostrais. E se o mesmo
tamanho de amostra usado com diferentes populaes, as populaes com maior

normal, com mdia

x,

## varincia e a mdia da populao sejam finitas e o tamanho da populao seja, no

mnimo, o dobro da amostra. Este resultado para populao infinita um caso especial do
57

teorema do limite central da teoria avanada de probabilidade, que mostra que a preciso
da aproximao melhora quando n cresce. Isto indicado, algumas vezes, dizendo-se que
a populao assintoticamente normal. No caso da populao ser normalmente
distribuda, a distribuio amostral das mdias tambm o ser, mesmo para pequenos
valores de n (n<30).
Teorema do limite central
1. Se a populao sob amostragem tem distribuio normal, a
distribuio das mdias amostrais tambm ser normal para
todos os tamanhos de amostra.
2. Se a populao bsica no normal, a distribuio de mdias
amostrais ser aproximadamente normal para grandes
amostras.

Exemplos:
Calcule o desvio padro da distribuio amostral de mdias onde o desvio padro da
distribuio populacional 2 e o tamanho da amostra 40.

x =

x
n

= 0,3162

40

Determine a mdia das distribuies de mdias amostrais, sendo que a mdia populacional
678.

x = x = 678

## A mdia de uma distribuio amostral de mdias 50 e seu desvio padro 10 (desvio

padro da distribuio amostral das mdias). Suponha normal a distribuio amostral.
Que percentagem das mdias amostrais estar entre 45 e 55?
O procedimento anlogo ao visto no captulo referente distribuio normal,
entretanto deve-se utilizar o valor de x = 50 e x =10.
Ento P(45< x <55)=0,3830

Um fabricante de baterias alega que seu artigo de primeira categoria tem uma vida
esperada (mdia) de 50 meses. Sabe-se que o desvio padro correspondente de 4
meses. Que percentagem de amostras de 36 observaes acusar vida mdia no intervalo
de 1 ms em torno de 50 meses, admitindo ser de 50 meses a verdadeira vida mdia das
baterias?
Sabemos que, como n>30, a distribuio das mdias amostrais ser
58

amostra. Alm disso vamos pressupor populao infinita, pois a produo de baterias
no termina (teoricamente!)

???

49

50
Meses

51

## A soluo envolve a determinao do nmero de desvios padres que 49 e 51 distam

da mdia (amostral).
Determinemos primeiro o desvio padro da distribuio amostral:

x =

x
n

4
36

## Ento devemos trabalhar com x N(50;0,67)

P(49< x <51)  z =

xx

49 50
= 1,5
0,67


51 50
= +1,5
0,67

## P(49< x <51)=P(-1,5<z<1,5) = 0,4332+0,4332=0,8664

Ento o percentual de amostras que apresentar problemas entre 49 e 51 meses
de 87%.

59

## Distribuio amostral das propores

Sendo a probabilidade de ocorrncia de um evento p (sucesso) e a probabilidade de no
ocorrncia 1-p (fracasso).
Consideram-se todas as amostras possveis de tamanho n de uma populao infinita e,
para cada amostra, determina-se a proporo de sucessos. Assim obtm-se a distribuio
amostral das propores.
A mdia da distribuio amostral sempre igual proporo p = p onde

p = proporo populacional

se calcula

p(1 p)
n

p =

## e pode-se fazer uma aproximao para a distribuio normal quando n>30.

Exemplos:
Determine a mdia da distribuio de propores amostrais, quando a proporo na
populao 72,3%

p =p=72,3%

## Determine o desvio padro da distribuio amostral de propores para n=100 e uma

proporo populacional de 60%

p =

p(1 p)
=
n

0,6(1 0,6)
= 0,049
100

Verificou-se que 2% das ferramentas produzidas por uma certa mquina so defeituosas.
Qual a probabilidade de que, em uma remessa de 400 dessas ferramentas, 3% ou mais
revelarem-se defeituosas?

p =p=0,02

ep =

p(1 p)
=
n

0,02 * 0,98
= 0,007
400

P(p>0,03)=P( z >

0,03 0,02
) = P(z > 1,43) = 0,07636 = 7,636%
0,007

60

Exerccios:
1. Determine a mdia da distribuio das propores amostrais quando a proporo na
populao ....
a. 30%
b. 99%
c. 54%

## 2. Calcule o desvio padro da distribuio amostral de mdias para cada um dos

seguintes casos:
a. x =6, n=6
b. x =6, n=20
c. x =6, n=40
d. x =6, n=100

3. Certas vlvulas fabricadas por uma companhia tm vida mdia de 800 horas e
desvio padro de 60 horas. Determinar a probabilidade de uma amostra aleatria
de 16 vlvulas, retiradas do grupo, ter vida mdia a) entre 700 e 810 horas;
b)inferior a 785 horas; c) superior a 820 horas; d) entre 770 e 830 horas.

4. Um fabricante faz a remessa de 1000 lotes de 100 lmpadas eltricas cada um. Se
5% das lmpadas so normalmente defeituosas, em quantos lotes pode-se esperar
que existam; a) menos de 90 lmpadas boas; b) 98 ou mais lmpadas boas

## Prof. Cntia Paese Giacomello

11 Estimao
A estimao o processo que consiste em utilizar dados amostrais para estimar
parmetros populacionais.
Assim, uma mdia amostral usada como estimativa da mdia populacional, a proporo
de defeituosos de uma caixa utilizada para estimar a proporo de defeituosos na
produo toda, etc.
Tais estimativas chamam-se estimativas pontuais, porque originam apenas uma nica
estimativa do parmetro. Em virtude da variabilidade amostral, usual incluir uma
estimativa intervalar para acompanhar a estimativa pontual. Esta nova estimativa
proporciona um intervalo, ou mbito, de possveis valores do parmetro populacional.

## Estimativa pontual: estimativa nica de um parmetro populacional

Estimativa intervalar: intervalo de valores possveis, o qual se admite que esteja
contendo o parmetro.

## Um intervalo de confiana d um intervalo de valores, centrado na estatstica amostral, no

qual julgamos, com um risco conhecido de erro, estar o parmetro da populao.

Exemplos:
Parmetro
populacional

Tipo de estimativa
Pontual

Intervalar

Mdia

## Um carro de motor 1.0 anda, em

mdia, 14 km com um litro de
combustvel

## Um carro de motor 1.0 anda, em

mdia, entre 12 e 16 km com 1
litro de combustvel

Proporo

de 2%

## A proporo de peas defeituosas

est entre 1,5 % e 2,5 %

## O desvio padro da temperatura

numa piscina no aquecida da
ordem de 2 o C

## O desvio padro da temperatura

numa piscina no aquecida est
entre 1 o C e 3 o C

## Os intervalos de confiana podem ser unilaterais (por exemplo, a proporo de defeitos

maior de 3%) ou bilaterais (a proporo de defeitos est entre 2% e 4%).

62

## A capacidade de estimar parmetros populacionais por meio de dados amostrais est

ligada diretamente ao conhecimento da distribuio amostral da estatstica que est sendo
Os intervalos de confiana para os parmetros so construdos de forma que se considera
uma variao em torno do valor amostral e, assim, pode-se escrever que o parmetro
situa-se entre dois limites:

## Valor do parmetro = estimativa pontual erro de amostragem

O erro de amostragem depende da distribuio amostral do parmetro, do nvel de
A tabela a seguir apresentada resume as informaes necessrias para intervalos de
confiana.

Populao
Infinita

Finita

Estimativa de mdias
Pontual
Intervalar x conhecido

x desconhecido

xz

xt

x
n
sx
n

xz

xt

sx

Nn
N 1
Nn
N 1

## Estimativa das propores

Pontual

Intervalar

p =

pz

x
n

p(1 p)
n

p =

pz

x
n

p(1 p) N n
n
N 1

Onde:
z representa o valor tabelado da distribuio Normal, com nvel de confiana .
t representa o valor tabelado da distribuio t de Student, com nvel de confiana e GL
N o tamanho da populao
n o tamanho da amostra

63

Exemplo:
Intervalo de confiana para a mdia quando se conhece a varincia de populao x
Seja uma amostra de tamanho 36 de uma populao infinita, sabe-se que x =3 e x =24,2

Confiana

Z

90%

1,65

xz

95%

1,96

xz

99%

2,58

xz

Frmula

Clculo

24,2 1,65

24,2 1,96

24,2 2,58

3
36
3
36
3
36

Intervalo

24,2 0,825

23,375 a 25,025

24,2 0,980

23,220 a 25,180

24,2 1,290

23,110 a 25,690

Tamanho da amostra
Uma das perguntas mais freqentes em estatstica : Qual o tamanho da amostra que
devemos tomar?
O tamanho da amostra depender do grau de confiana desejado (z), da quantidade de
disperso entre os valores individuais ( x ), e de certa quantidade especfica de erro
tolervel (e).
O tamanho da amostra que voc afinal selecionar depender de
seu oramento, da importncia econmica das decises e da
variabilidade na populao. Desses trs problemas, dois so de
ordem gerencial, cabendo a voc a deciso; apenas o terceiro
livro Pesquisa de Marketing Naresh Malhotra. - 2001)

A frmula do erro pode ser resolvida em relao a n. Assim, para o caso de estimao de
mdias, tem-se:

e=z

x
n

n=z

n = z x
e

p(1 p)
e=z
n

p(1 p)

e = z

n=

z 2p(1 - p)
e2

64

Que tamanho de amostra ser necessrio para produzir um intervalo de 90% de confiana
para a verdadeira mdia da populao, com erro de 1,0 em qualquer dos sentidos, se o
Sabemos que x =10 e e=1 e queremos um intervalo 90% de confiana para a
mdia, o que implica utilizar um valor de z=1,65.

n = z x
e

10

1

## As companhias de seguro esto ficando preocupadas com o fato de que o nmero

crescente de telefones celulares resulte em maior nmero de colises de carros. Esto, por
isso, pensando em cobrar prmios mais elevados para os motoristas que utilizam celulares.
Desejamos estimar, com uma margem de erro de trs pontos percentuais, a percentagem
de motoristas que falam ao celular enquanto dirigem. Supondo que se pretende um nvel
Suponha que no tenhamos nenhuma informao sobre p.

n=

z 2p(1 - p)

e2

n=

## 1,96 2 0,5(1 - 0,5)

= 1067,11  tamanho da amostra 1068.
0,032

Exerccios:
1. Os dados a seguir representam a temperatura coletada aleatoriamente em 15
cidades do estado. Determine o intervalo de confiana 90% para a temperatura
mdia. No dispomos da varincia populacional, mas sabemos que a populao
infinita. Dispomos apenas das seguintes informaes.

23

40

30

21

34

20

38

26

23

38

33

32

24

21

24

## 2. Uma amostra aleatria de 40 contas no comerciais na filial de um banco acusou

saldo mdio dirio de R\$ 140 com desvio padro de R\$ 30.
a. Construa um intervalo de 90% de confiana para a verdadeira mdia
b. Construa um intervalo de 95% de confiana para a verdadeira mdia
c. Construa um intervalo de 99% de confiana para a verdadeira mdia

65

## 3. Uma firma emprega diversos vendedores. Numa amostra aleatria de 15 notas de

despesa numa semana de dezembro, um auditor constatou uma despesa mdia de
R\$ 220, com desvio padro de R\$ 20.
a. Qual a estimativa pontual da despesa mdia?
b. Construa um intervalo de 99% de confiana para a quantia de despesa
mdia por vendedor.
c. Admitindo-se 200 vendedores, qual seria a estimativa pontual mdia para o
total de despesas?
d. Construa um intervalo de 99% de confiana para a quantia de despesa total.

## 4. Uma amostra aleatria de 40 homens trabalhando num grande projeto de

construo revelou que 6 no usavam capacetes protetores.
a. Construa um intervalo de 95% de confiana para a verdadeira proporo dos
que no esto utilizando capacetes neste projeto.
b. Se h 1000 operrios no projeto, converta o percentual em nmero de
capacetes necessrios para que todos estejam seguros.

## 5. Uma amostra aleatria de 1000 fregueses da parte da manh de um supermercado

revelou que apenas 10 no incluem leite em suas compras.
a. Qual seria a estimativa pontual da percentagem dos que compram leite?
b. Construa um intervalo de 90% de confiana para a verdadeira proporo dos
que compram leite.

## 6. Qual o tamanho de amostra necessrio para estimar o tempo mdio de que um

vendedor de uma loja de mveis gasta com cada cliente, admitindo erro de 1
minuto, para mais ou para menos, para obter um nvel de confiana de 99%.
Suponha x=12 minutos.

66

## 7. Determine o nmero de observaes necessrio para estimar o tempo mdio de

servio de atendimento a chamadas de um bombeiro hidrulico, se o erro mximo
deve ser de 0,6 hora para um nvel de confiana de 95%, sabendo que o tempo de
atendimento tem um desvio padro de 1 hora. Suponha normalidade na populao.

## 8. Um engenheiro deseja estimar a quantidade de acar existente nos alimentos

produzidos pela empresa. Ele coletou uma amostra de 18 unidades do alimento e
verificou mdia 24 gr de acar, com desvio padro de 5 gr. Construa o intervalo
de confiana de 90% para a quantidade de acar presente nos alimentos.

## 9. Numa pesquisa com funcionrios de uma empresa questionou-se a satisfao com a

poltica desenvolvida pela diretoria. De 300 funcionrios, 36 estavam insatisfeitos.
Construa uma estimativa para a proporo de funcionrios insatisfeitos, com 95%
de confiana.

## 10. O IBOPE est interessado em estimar a proporo de residncias que assistem ao

programa do Fausto. Qual o nmero mnimo de residncias que se deve analisar
para ter 95% de confiana e margem de erro mxima de 0,03 para a estimativa?

67

12 Testes de h ipteses
Os testes de hipteses so tambm conhecidos como testes de significncia.
A finalidade dos testes de hipteses avaliar afirmaes sobre os valores de parmetros
populacionais.
Os testes de hipteses e a estimao so dois ramos principais da inferncia estatstica.
Enquanto o objetivo da estimao estimar algum parmetro populacional, o objetivo dos
testes de hipteses decidir se determinada afirmao sobre um parmetro populacional
-

(H 1 )

## A hiptese nula H 0 uma afirmao que diz que o parmetro

populacional tal como especificado (isto , a afirmao
A hiptese alternativa H 1 uma afirmao que oferece uma
alternativa alegao (isto , o parmetro maior (ou menor)

Exemplo: O estudo de uma amostra de tamanho 55 peas indicou que o dimetro mdio
de 27,5 mm. Ento:
H 0 : o dimetro mdio da populao (de peas) 27,5 mm
H 1 : o dimetro mdio da populao (de peas) diferente de 27,5 mm

erro tipo I.

## Ao testar uma hiptese, h dois tipos de erros que podemos cometer:

= P {rejeitar H 0 / H 0 verdadeira} = erro do tipo I
= P {aceitar H 0 / H 0 falsa} = erro do tipo II

## O procedimento usual fixar o valor de e verificar o valor de . O risco uma funo

do tamanho da amostra, e controlado indiretamente. Quanto maior o tamanho da
amostra, menor ser o risco .
68

Se H 0

Ao

Falsa

Aceitar H 0

Deciso correta

Erro tipo II ( )

Rejeitar H 0

Erro tipo I ( )

Deciso correta

## Basicamente os testes de hiptese envolvem as seguintes etapas:

1. Estabelecer as hipteses nula e alternativa;
3. Escolher um nvel de significncia (e assim os valores crticos);
4. Calcular a estatstica do teste e compar-la com os valores crticos;
5. Rejeitar a hiptese de nulidade se a estatstica do teste excede o(s) valor (es)
crtico(s); caso contrrio, aceit-la.

Os testes de hiptese podem ser unilaterais ou bilaterais. Nos testes unilaterais a hiptese
alternativa H 1 do tipo >33 ou <33, por exemplo. Nos testes bilaterais a hiptese
alternativa do tipo 33. A hiptese nula permanece igual nos dois casos. A rea de
rejeio dividida quando o teste bilateral.

H 1 : <33

H 1 : 33
/2

Rejeitar H 0

Rejeitar
H0

/2
Rejeitar
H0

H 1 : >33

Rejeitar H 0

Exerccios
1. Para cada um dos seguintes casos, trace uma curva normal, indicando a rea de
rejeio na figura.
a) H 0 : =10, H 1 : 10, =0,02
b) H 0 : =120, H 1 : 120, =0,05
c) H 0 : =2000, H 1 : 2000, =0,01
d) H 0 : =2000, H 1 : >2000, =0,01
e) H 0 : =2000, H 1 : < 2000, =0,01

69

## 2. Um fornecedor de mancais comprometeu-se a enviar para uma firma lotes que no

contenham mais de 2% de defeituosos. O comprador extrai amostras ao receber a
remessa, para verificar a qualidade. Indique H0 e H1.

## 3. Um engenheiro acredita que o tempo para produo de um motor de 5 horas. Ele

analisa uma amostra para verificar se est certo ou no. Escreva H0 e H1

## 12.1 Teste de hipteses para mdias

x conhecido
distribuio normal. Se a populao normal, a distribuio amostral ser normal para
todos os tamanhos de amostra. Se a populao no normal, ou se sua forma
desconhecida, pode-se usar um teste de uma amostra s para tamanhos de amostras
superiores a 30 observaes. Assim, pequenas amostras de populao no normais no
podem ser tratadas por este processo.

## Suponha que X uma varivel aleatria com mdia desconhecida e varincia 2 x

conhecida. E queremos testar a hiptese de que a mdia igual a um certo valor
especificado 0 . O teste de hiptese pode ser formulado como segue:
H 0 : = 0
H 1 : 0
Para testar a hiptese, toma-se uma amostra aleatria de n observaes e calcula-se a
estatstica

z teste =

x o

## (obtido em uma tabela da

n
distribuio normal).

70

Exemplo:
Uma mquina de usinagem deveria produzir entalhes com 0,85 mm de profundidade. O
engenheiro desconfia que os entalhes que esto sendo produzidos so diferentes que o
Uma amostra de 8 valores foi coletada e indicou X = 0,847 . Sabendo que o desvio padro
=0,010, teste a hiptese do engenheiro usando um nvel de significncia =0,05.

H o : = 0,850
H1 : 0,850

Z teste =

0,847 0,850
0,010 / 8

= 0,85

## Como Z teste = 0,85 > Z 0 ,025 = 1,96 H 0 no pode ser rejeitada.

Concluso: no podemos afirmar que os entalhes sejam diferentes que o especificado, ao
nvel de significncia de 0,05.

x desconhecido
Quando no se conhece o desvio padro da populao, deve-se estim-lo a partir dos
dados amostrais usando o desvio padro amostral. Quando isso ocorre (na maioria das
Suponha que X uma varivel aleatria Normal com mdia e varincia 2
desconhecidas. Para testar a hiptese de que a mdia igual a um valor especificado o ,
formulamos:

Ho : = 0
H1 : o
Esse problema idntico quele da seo anterior, exceto que agora a varincia
desconhecida.

## Como X no conhecido, usa-se a distribuio de Student para construir a estatstica do

teste:

t teste =

x o
sx
n

E a hiptese nula H 0 rejeitada se |t teste |>t /2 , onde t /2, n-1 um valor limite da
distribuio de Student tal que a probabilidade de se obter valores externos a t /2 .

71

## 12.2 Testes de duas amostras para mdias

Os testes de duas amostras so usados para decidir se as mdias de duas populaes so
iguais. Exigem-se amostras independentes, ou seja, uma de cada populao. Eles so
marcas, duas fbricas, ....
OBS: dados provenientes de antes-depois so dependentes, no podendo, portanto, serem

x conhecido
Quando h duas populaes com mdias desconhecidas, digamos a e b e desvios
padres conhecidos, a e b , o teste para verificar a hiptese que as mdias sejam iguais
o seguinte:

Ho : 1 = 2
H1 : 1 2
Z teste =

X1 X 2

12
n1

22
n2

## E rejeita-se H 0 se |Z teste | > Z /2

x desconhecido
Similarmente, quando , a e b , no so conhecidos, o teste para verificar a hiptese que
as mdias sejam iguais :

t teste =

X1 X 2
S 2x1 S 2x 2
+
n1
n2

n1+n2-2

## 12.3 Teste para propores

Este tipo de teste apropriado quando os dados sob anlise consistem de contagem ou
freqncias de itens em duas ou mais classes. A finalidade de tal teste avaliar
afirmaes sobre a proporo (ou percentagem) de uma populao. O teste se baseia na
premissa de que uma proporo amostral ser igual verdadeira proporo populacional,
a menos da variabilidade amostral. O teste foca na diferena entre o nmero esperado de
A diferena ento comparada com a variabilidade prescrita por uma distribuio amostral

72

## Quando a finalidade da amostragem julgar a validade de uma alegao acerca de uma

proporo populacional, apropriado o teste para propores.Onde:
H0: p = p0
H1: p p0

## O valor da estatstica de teste dado por

z teste =

x p
0
n
p0 (1 p0 ) / n

e deve ser comparada com o valor crtico de Z (retirado de uma tabela da distribuio
normal)

Exemplo:
Um fabricante afirma que uma remessa de pregos contm menos de 1% de defeituosos.
Uma amostra aleatria de 200 pregos acusa 4 defeituosos. Teste a afirmao ao nvel
0,01.
H 0 : p = 1%
H 1 : p > 1%  pois desejamos evitar a aceitao de uma remessa com mais de
1% de defeituosos, mas nada h contra aceitar o fato da remessa apresentar

z teste =

x p
0
n
= z teste =
p0 (1 p0 ) / n

0,01
200
= 1,42
0,01(1 0,01) / 200

## Na tabela da distribuio normal, z 0,01 =2,33

Aceita-se H 0 , e pode-se dizer que a quantidade de pregos defeituosos 1% ou
menos, ao nvel de significncia 0,01.

A finalidade de um teste de k amostras avaliar se as propores de k amostras
independentes provenham de populaes que contenham a mesma proporo de
H 0 : As propores populacionais so todas iguais
H 1 : As propores populacionais no so iguais
Ou seja, estamos testando se as duas variveis so ou no associadas, por exemplo, se
queremos testar se a proporo de mulheres e de homens que trabalham no horrio
73

## noturno em uma fbrica so iguais, automaticamente estaremos testando se sexo e turno

comparado com o valor tabelado. A deciso de aceitar ou rejeitar H 0 depender da

Por exemplo, tem-se a distribuio de peas produzidas por turno e se essas peas so
boas ou apresentam algum tipo de defeito. No turno da manh foram produzidas 967
peas, onde 183 apresentaram algum tipo de defeito.

Turno de produo
Total
Manh

Tarde

Noite

183

30

11

224

Peas boas

784

264

308

1356

Total

967

294

319

1580

total _ geral

Turno de produo
Total
Manh

Tarde

Noite

137,1

41,7

45,2

224

Peas boas

829,9

252,3

273,8

1356

967

294

319

1580

Total

224 x 967
= 137,1
1580

74

2 =

(O E) 2
E

Se o valor obtido for maior que o valor crtico obtido na tabela 2 ento diz-se que as
variveis NO so independentes. Se o valor encontrado for menor, ento diz-se que as
variveis so independentes.
O valor dos GRAUS DE LIBERDADE obtido atravs do clculo:

(308 273,8) 2
=
+
+ ... +
= 51,88
137,1
41,7
273,8
2

## e o valor crtico encontrado na tabela para (2-1)x(3-1)=2 graus de liberdade e nvel de

significncia 0,05 5,991.

Tem-se valor calculado > valor tabelado ento diz-se que as variveis NO so
independentes. OU SEJA, a proporo de peas boas produzidas depende do turno de
trabalho. A proporo de peas boas no turno da manh 81%, na tarde 90% e na noite
97%.

Exerccios:
1. Um fornecedor apresenta uma caixa, e afirma que o peso mdio desta caixa de
368 gramas. De experincias anteriores sabe-se que o desvio padro da populao
vale 15 g e que os valores se comportam segundo a distribuio Normal. Para
verificar se a afirmao verdadeira, verifica-se uma amostra de 25 caixas, pesa-se
e calcula-se o peso mdio da amostra, achando 372,5 g. Qual a concluso a
respeito da afirmao do fornecedor, ao nvel de significncia 0,01?

2. Uma agncia de empregos alega que os candidatos diretoria por ela colocados
nos ltimos seis meses tm salrios de R\$ 9000, em mdia. Uma agncia
governamental extraiu uma amostra aleatria daquele grupo, encontrando salrios
mdios de R\$ 8000, com desvio padro de R\$ 1000, com base em 50 empregados.
Teste a afirmao da agncia, contra a alternativa, de que o salrio mdio
inferior a R\$ 9000, ao nvel de significncia 0,05.

75

## 3. O gerente de marketing de uma fbrica de automveis est interessado em

determinar a proporo de novos proprietrios de carros compactos que teriam
adquirido um air-bag inflvel para o lado do passageiro se o mesmo estivesse
disponvel a um custo adicional de \$ 300,00. Por informaes anteriores, o gerente
acredita que a proporo 30%. Suponha que feito um levantamento com 200
novos proprietrios de carros compactos e 79 indiquem que teriam comprado os
air-bags inflveis. No nvel de significncia de 0,05, h evidencias de que a
proporo da populao diferente de 0,3?

## 4. Suponha que o diretor de produo de uma fbrica de tecidos precise determinar se

uma nova mquina est produzindo um tipo de tecido de acordo com as
especificaes do fabricante. As especificaes indicam que o tecido devia ter uma
resistncia de rompimento superior a 70 libras (1 libra = 433,59 gramas) e um
desvio padro de 3,5 libras. Uma amostra de 36 peas revela uma mdia aritmtica
da amostra igual a 69,7 libras. H evidncias de que a mquina no est atendendo
s especificaes, em termos da mdia da resistncia de rompimento? (utilize um
nvel de significncia de 0,05)

## 5. Uma rede de postos de gasolina afirma que, em seus estabelecimentos no se

gasolina no pode conter mais de 240 ml de lcool por litro. O rgo de fiscalizao
colheu 25 medies do produto nos postos dessa rede, obtendo a partir delas uma
mdia de 240,75 ml de lcool/litro. Admitindo-se que a quantidade de lcool
presente na gasolina tem uma distribuio normal com desvio-padro de 2,5
ml/litro. Ao nvel de significncia 5%, pode-se afirmar que a gasolina adulterada?

76

## 6. Um psiclogo de indstrias deseja estudar os efeitos da motivao nas vendas, em

de cada grupo. Os dados a seguir representam o volume de vendas (em milhares
de reais) alcanado durante o primeiro ms de emprego. H evidncias de que o
volume mdio de vendas seja diferente entre os grupos? (utilize nvel de
significncia 0,05)
Por hora
256
212
239
216
222
236

Comisso
207
219
228
225
241
230

224
261
254
228
273
234

285
225
237
232
277
245

7. No caso judicial EUA versus Cidade de Chicago, foram postas em dvida as prticas
honestas de emprego. Um grupo minoritrio (A) e um grupo majoritrio (B) fizeram
o exame para capito do corpo de bombeiros, com os seguintes resultados:
Grupo A
Grupo B

10
417

14
145

## Com os resultados acima, e com nvel de significncia de 5%, teste a afirmao de

que o sucesso no teste independente do grupo.

## 8. Solicitou-se a quatro amostras de 30 funcionrios de uma grande empresa que

opinassem sobre a nova direo da empresa. Ao nvel de significncia 0,01, o que
se pode concluir?
Aprovam
Desaprovam

Estagirios
5
25

Treinees
4
26

Tcnicos
20
10

Gerentes
27
3

77

## 9. Um estudo de usurios e no usurios do cinto de segurana resultou nos dados

amostrais aleatrios resumidos na tabela a seguir. Teste a afirmao de que a
quantidade de fumo independente do uso do cinto de segurana. Uma teoria
plausvel que as pessoas que fumam mais esto menos preocupadas com a sua
sade e segurana, sendo assim, menos propensas a usar cintos. Com nvel de
significncia 0,01, os dados amostrais apiam esta teoria?

## Usam cinto de segurana

No usam cinto de segurana

## Nmero de cigarros fumados por dia

0
1-14
15-34
35 ou +
175
20
42
6
149
17
41
9

10. A tabela abaixo apresenta dados relativos ao time vencedor em diferentes esportes.
Com o nvel de 0,05 de significncia, teste a afirmao de que as vitrias
casa/visitante so independentes do esporte.
O time da casa ganha
O time visitante ganha

Basquete
127
71

Beisebol
53
47

Hockey
50
43

Futebol
57
42

78

## Analys is of Var ianc e)

H situaes onde se deseja comparar vrias mdias, cada uma oriunda de um grupo
diferente. Esses grupos, tambm chamados tratamentos, poderiam ser 5 mquinas de
corte, ou 4 presses de operao, ou 4 layouts , 5 planos econmicos do governo, taxas
de cmbio em 3 diferentes pases, resultados da implantao de um novo sistema em duas
filiais, etc.

Exemplo:
Para verificar se existe diferena significativa entre os salrios mdios dos economistas da
Regio Sul, o sindicato da classe resolveu analisar os dados de algumas amostras. Assim

Econ.1

Econ.2

Econ.3

Econ.4

Econ.5

## Rio Grande do Sul

370

420

280

340

410

Santa Catarina

280

350

430

290

405

Paran

325

400

295

350

380

Exemplo:
Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram

Mtodo A
Mtodo B
Mtodo C

5
4

0
5

3
4

5
7

4
5

10

10

79

Tratamento
1
2
:
:
:
k

Observaes
Y11 , Y12 ... Y1n1
Y21 , Y22 ... Y2n2
:
:
:
Yk1 , Yk2 ... Yknk

Yij = + i + ij ;

i = 1,....., k
j = 1, ..., ni

Onde Y ij

## a mdia geral de todas as observaes;

o efeito do tratamento i;

ij
o erro aleatrio. (OBS: Para fins de testes de hiptese, supomos que o
erro aleatrio ij segue um modelo normal com mdia 0 e varincia 2
aproximadamente igual para todos os tratamentos)

Nosso objetivo ser testar a hiptese referente ao efeito dos tratamentos e estimar esses
efeitos, ou seja, verificar se existe diferena significativa entre os resultados apresentados

## Existem dois tipos de problemas a serem abordados:

Modelo a nveis fixos: quando o efeito de cada tratamento fixo, como no caso em que
os tratamentos so 4 presses de operaes, ou 4 layouts fixados pelo engenheiro;
Modelo a nveis aleatrios: quando o efeito de cada tratamento aleatrio, como no
caso em que os tratamentos so k lotes de produo, ou k operadores escolhidos
aleatoriamente.

80

No modelo a nveis fixos, os efeitos dos tratamentos so definidos como desvios da mdia
geral, tais que:

H 0 : 1 = 2 = ..... = k
H 1 : i j
Na

para alguns i, j

## H o (hiptese nula) supe-se que todas as mdias sejam iguais, ou seja, os

economistas tm o mesmo salrio nos trs estados (e as diferenas entre os seus salrios
so devidas ao acaso) ou os trs mtodos de ensino so equivalentes.
A

H 1 (hiptese alternativa) indica que pelo menos uma das mdias difere, ou seja,

existem pelo menos dois estados com salrios diferentes entre si ou pelo menos dois
mtodos de ensino diferem.

## O procedimento utilizado para comparar simultaneamente todos os grupos chamado de

Anlise de Varincia, que ser visto a seguir.

## A anlise de varincia uma tcnica que pode ser

usada para determinar se as mdias de duas ou mais
populaes so iguais. O teste se baseia numa

## A Anlise de Varincia uma tcnica para investigar quanto de variabilidade em um

conjunto de observaes (dados) pode ser descrito por diferentes causas.

de Tabela de Anlise de Varincia ou Tabela ANOVA

Fonte de variao

onde

SQ

GDL

MQ

Teste F

Entre grupos

SQG

k-1

MQG

MQG/MQR

Dentro de grupos

SQR

N-k

MQR

Total

SQT

N-1

## k o nmero de nveis do fator.

N a quantidade total de observaes

81

## A Anlise de Varincia se baseia na decomposio da variabilidade total. Mais

especificamente, os desvios das observaes individuais em relao mdia global podem
ser escritos como:

(Yij Y.. ) = (Y i.

) (

Y.. + Yij Y i .

(1)

onde:

(Yij Y i. )

correspondente;

## (Yij Y .. ) = ni (Y i. Y.. ) + (Yij Yi. )

i, j

ij

2
(2)

SQT = SQG + SQR
onde:
efeito dos grupos;
SQR  soma dos quadrados dos resduos, devida exclusivamente ao erro aleatrio, medida
dentro dos grupos.

## Os graus de liberdade so obtidos atravs do nmero de nveis do fator e da quantidade

de repeties para cada nvel, ou seja, se o fator tem 5 nveis, ter 4 graus de liberdade
(k-1). Os graus de liberdade totais so obtidos atravs do total de observaes menos 1
(N-1) e os graus de liberdade dentro dos grupos ser a diferena entre eles (N-1)-(k-1) =
(N-k).

F=

## Prof. Cntia Paese Giacomello

MQG
MQR

82

O valor resultante do teste F deve ser comparado com uma tabela de valores F, que indica
o valor mximo da estatstica no caso de H o ser verdadeira, a um determinado nvel de
confiana.
Como o valor tabelado de F contnuo e depende da combinao dos graus de liberdade
do numerador e do denominador, usual apresentar seus valores apenas para os nveis de
confiana 0,05 e 0,01. Os graus de liberdade para a determinao do valor F so os
mesmos apresentados na tabela da ANOVA.
Os valores constantes na tabela F so valores crticos: apresentam a linha divisria entre a
variao aleatria e a no aleatria. Ao fazer a anlise de varincia, utilizam-se as duas
estimativas amostrais da varincia para calcular uma razo F. Compara-se ento o nmero
rejeita-se a hiptese nula. Se o valor calculado menor que o valor tabelado, a hiptese

Distribuio F
Concluir pelo
acaso
Aceitar Ho

Concluir pelo
no-acaso
Rejeitar Ho

0

## 13.1 Formulrio para soluo

TC = ( T .. )2 N

SQT = ( Yij2 ) TC

SQG = ( Ti 2. ni ) TC
SQR = ( Yij2 ) ( Ti .2 ni ) = SQT SQG
onde
TC o termo de correo
T.. a soma de todas as observaes
Ti.

83

## Resolvendo o exemplo dos mtodos de ensino atravs deste formulrio obtm-se:

Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram

Mtodo A

Mtodo B

Mtodo C

0
5

3
4

5
7

4
5

10

10

## k = 3 (trs nveis do fator, mtodo A, B e C)

N = 24 (oito alunos por mtodo)
T.. = 5 + 0 + 3 + ... + 4 + 9 = 116

## T A. = 5 + 0 + 3 + 5 + 4 + 5 + 8 + 2 = 32 (somar as observaes do mtodo A)

T B. = 48 (somar as observaes do mtodo B)
T C. = 36 (somar as observaes do mtodo C)

TC = 116 2 / 24 = 560,67
SQT = (5 2 + 0 2 + 3 2 + ... + 4 2 + 9 2 ) 560,67 = 738 560,67 = 177,33

## 322 482 362

560,67 = 578,00 - 560,67 = 17,33
SQG =
+
+
8
8
8
SQR = SQT SQG = 177,33 17,33 = 160,00

## Ento a tabela da ANOVA ficaria:

Fonte de variao

SQ

GDL

MQ

Teste F

Entre grupos

17,33

8,67

1,14

Dentro de grupos

160,00

21

7,62

Total

177,33

23

respectivamente, e nvel de significncia de 0,05 F 0,05 3,49. Como F calculado < F
tabelado, conclumos que no h evidncias de que os mtodos de ensino alterem a
aprendizagem das crianas, ou seja, os mtodos de ensino devem ser equivalentes.

84

Utilizando o Excel
Clique em Ferramentas e depois em Anlise de Dados. (OBS: Se no seu
ativado. V em Ferramentas, depois Suplementos. Disponibilize Anlise de

## Selecione ANOVA Fator nico.

Preencha com as informaes que forem necessrias.

## 13.2 Exemplo de soluo no Excel

Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram

Mtodo A
Mtodo B
Mtodo C

5
4

0
5

3
4

5
7

4
5

10

10

ou

## No menu Ferramentas e Anlise de Dados, aps selecionar ANOVA fator nico.

85

## Anova: fator nico

RESUMO
Grupo
Mtodo A
Mtodo B
Mtodo C

Contagem Soma
8
32
8
48
8
36

Varincia
5,714
7,429
9,714

ANOVA
Fonte da variao
Entre grupos
Dentro dos grupos

SQ
17,33
160,00

gl
2
21

Total

177,33

23

Mdia
4,0
6,0
4,5

MQ
8,67
7,62

F
1,14

valor-P
0,340

F crtico
3,47

86

Exerccios:
1. Suponha que o valor crtico de F na anlise de varincia seja 1,99 ao nvel de 0,05.
Com base na figura: a) Como voc interpretaria uma estatstica de teste maior que
1,99? b) Como voc interpretaria uma estatstica de teste menor que 1,99?

Distribuio F

0,05
0
1,99

2. Duas turmas de pilotos de corrida de automveis esto sendo treinadas para uma
grande corrida no domingo. Cada turma faz cinco provas de troca dos quatro pneus
num carro. As turmas so equivalentes ou uma delas superior, ao nvel de
significncia 0,05? Complete a tabela da ANOVA e conclua a respeito.

Fonte de variao

SQ

GDL

MQ

Teste F

Entre grupos
Dentro de grupos

0,12

Total

0,22

## 3. Realiza-se um experimento para determinar-se as produes de cinco variedades de

trigo: A, B, C, D e E. So atribudos quatro lotes de terra para cada variedade e as
aleatoriamente, determinar se existe diferena entre as produes ao nvel de
significncia 0,01.

A
B
C
D
E
Prof. Cntia Paese Giacomello

20
17
23
15
21

12
14
16
17
14

15
12
18
20
17

19
15
14
12
18
87

## 4. Uma empresa deseja testar quatro tipos diferentes de pneus: K, L, M e N. Suas

duraes, determinadas pelas bandas de rodagem, esto na tabela (em milhares de
semelhantes. Determinar de existe diferena significante entre os pneus ao nvel de
significncia 0,05.

K
L
M
N

33
32
31
29

38
40
31
34

36
42
37
32

40
38
35
30

31
30
33
33

35
34
30
31

5. Um professor deseja testar trs mtodos diferentes de ensino I, II e III. Para isso so
escolhidos aleatoriamente trs grupos de cinco estudantes, e cada grupo instrudo
por um mtodo diferente. dada a mesma prova a todos os estudantes e os graus
obtidos constam na tabela. Determinar se existe diferena entre os mtodos de ensino
ao nvel de significncia 0,01.

I
II
III

75
81
73

62
85
79

71
68
60

58
92
75

73
90
81

quimicamente com os produtos A, B ou C. Determinar se existe diferena significativa
nos tratamentos ao nvel de 0,05.

A
B
C

3
4
6

5
2
4

4
3
5

4
3
5

## 7. Um experimento mede os quocientes de inteligncia (QI) de estudantes do sexo

masculino de estaturas alta, mdia e baixa, cujos resultados aparecem na tabela.
Determinar se existe qualquer diferena nas contagens do QI em relao s diferentes
alturas ao nvel de significncia de 0,01.

Alta
Mdia
Baixa

110
95
108

105
103
112

118
119
104

90
104
93

88

## 8. A fim de produzir um tipo superior de rao para galinhas, adicionou-se rao

Concluir se houve diferena entre as quantidades do produto qumico ao nvel de
significncia 0,05.

20
30
40
50

9.

mg
mg
mg
mg

46
48
49
52

46
48
49
53

46
47
50
52

45
47
50
52

45
47
49
52

45
47
50
52

46
47
50
53

46
48
49
53

Uma empresa deseja estudar trs tipos de enxerto para ver se todos apresentam o
mesmo crescimento anual. O que se pode concluir a respeito? (use nvel de
significncia 0,05)

Enxerto 1
14,4
14,8
12,7
12,2
10,9

Enxerto 2
10,8
12,2
11,2
12,8
13,0

Enxerto 3
11,1
9,5
10,8
12,7
10,9

10. Os dados abaixo do a vida observada dos pneus de quatro caminhes distribuidores
de sorvete, conforme a posio. Supondo comparveis os caminhes e os motoristas,
poderemos afirmar que a durao mdia independente da posio do pneu no
veculo? (use nvel de significncia 0,01). Disponha os clculos numa tabela ANOVA.
Qual a importncia da comparabilidade dos motoristas e veculos?

Dianteiro direito
Dianteiro esquerdo
Traseiro direito
Traseiro esquerdo

17
25
22
26

19
27
21
24

20
18
19
30

24
22
26
28

89

14 Regresso e co rrelao
A anlise de regresso e de correlao compreende a anlise de dados amostrais para
saber se e como duas ou mais variveis esto relacionadas uma com a outra em uma
populao.

## Os valores para a anlise de regresso e correlao provm de observaes e, para um

problema com duas variveis, cada observao d origem a dois valores, uma para cada
varivel. Uma das variveis ser a dependente e a outra independente.

Exemplos:
Famlia

Renda

Gastos

Peso

Altura

Aluno

Notas 2 o
grau

Notas

R\$ 1550

R\$ 1350

56

179

80

85

R\$ 2000

R\$ 1970

67

176

75

70

R\$ 1000

R\$ 550

89

180

95

95

58

170

60

65

45

130

70

80

...
n

R\$ 770

R\$ 690

## Uma maneira de apresentar os resultados atravs do diagrama de disperso.

Relao linear
positiva perfeita

Relao linear
negativa perfeita

X e y positivamente

X e y negativamente

X e y no

90

Regresso
14.1 Aplicaes da regresso
1. Estimar valores de uma varivel com base em valores conhecidos de outra varivel.
(Situaes em que as duas variveis medem aproximadamente a mesma situao, mas
uma delas relativamente dispendiosa ou difcil de lidar, enquanto a outra no.)
2. Explicar valores de uma varivel em termos da outra, isto , pode-se suspeitar
uma relao de causa e efeito.

de

## 3. Predizer valores de uma varivel.

OBS: A anlise da regresso apenas indica qual relacionamento matemtico pode existir, se
existir algum. Ou seja, nem a regresso, nem a correlao podem mostrar que uma varivel
tenda a causar certos valores de outra varivel, no garantido que exista relao de causa e
efeito.
... a correlao entre beber um copo de vinho por dia e a menor chance de infarto do
miocrdio um bom exemplo. Estudos recentes mostram que ela no se deve ao vinho e
ao lcool, mas sim ao betacaroteno, corante contido na uva. Para infelicidade de
muitos, tomar suco de uva d o mesmo resultado que beber vinho tinto. Jornal do
Brasil, 08/01/1999

## 14.2 Classificao das regresses

Quanto ao nmero de variveis: Simples (uma varivel independente explica bem o
fenmeno) ou Mltipla (mais de uma varivel independente so necessrias para explicar
bem o fenmeno)
Quanto qualidade da relao: Linear (os fenmenos podem ser bem explicados por
equaes de primeiro grau) ou No lineares (os fenmenos no podem ser bem explicados
por equaes de primeiro grau, exigindo funes de ordem superior).

14.3.1

y = a + bx

## A inclinao da reta (coeficiente angular) 

O mtodo mais usado para ajustar uma linha reta a um conjunto de pontos conhecido

91

b=

14.3.2

n( xy ) ( x )( y )

a=

n( x 2 ) ( x ) 2

y b x
n

## b so funes de variveis aleatrias (x e y so variveis

aleatrias) necessrio verificar a preciso das estimativas, conhecendo o erro padro das
estimativas.

SE =

14.3.3

( a y + b xy )
n2

## Intervalo de confiana para a estimativa

Para criar intervalos de confiana com base nos estimadores utiliza-se a equao:

yint ervalo = y t S E
y obtido da equao.

Onde:

e

## S E o erro padro da estimativa

Exemplo:
Seja y o consumo pessoal mdio e x o PIB do Brasil em anos consecutivos. Encontre o
Intervalo de confiana 90% para a estimativa quando o PIB for 10,0.

x
7,0
7,3
7,8
8,6
8,1
8,3
8,2
8,6
9,0
9,6
9,1

y
10,1
10,6
11,3
12,4
11,9
11,9
11,5
12,1
13,1
14,1
14,6

x2
49,00
53,29
60,84
73,96
65,61
68,89
67,24
73,96
81,00
92,16
82,81

xy
70,70
77,38
88,14
106,64
96,39
98,77
94,30
104,06
117,90
135,36
132,86

x = 91,6

y = 133,6

x 2 = 768,76

xy = 1122,50

92

ideal que sempre se inicie o estudo de regresso com o grfico de disperso dos valores.

Consum o pessoal

14,0
12,0
10,0
8,0
6,5

E o clculo de

b=

7,5

PIB

8,5

9,5

10,5

a e b fica:

## 11 (1122,5) - (91,6) (133,6)

11 (768,76) - (91,6)2

y = 1,744 + 1,668 x ,

= 1,668

ou

a=

= 1,744
11

SE =

= 0 ,4653
11 2

## y = 1,744 + 1,668( 10 ) = 14 ,936

yint ervalo = 14,936 1,833 (0,4653)

## yint ervalo = 14,936 0,853

Ou seja, quando o PIB estiver em 10,0 o Consumo Pessoal poder variar na faixa entre
14,083 e 15,789, com 90% de confiana.

93

Correlao
14.4 Objetivo da correlao
O objetivo da correlao determinar a fora do relacionamento entre duas observaes
emparelhadas, porque indica at que ponto os valores de uma varivel esto relacionados
com os valores da outra varivel.
O resultado da anlise de correlao chamado de coeficiente de correlao um valor
que quantifica o grau de correlao.
O mtodo mais comum de anlise de correlao envolve observaes em valores
numricos. Neste caso utiliza-se o coeficiente r de Pearson.

## 14.5 O coeficiente r de Pearson (correlao)

O coeficiente r de Pearson mede o grau de associao linear em duas variveis. Ele

Seu sinal. Positivo indica correlao linear positiva, ou seja, medida que uma varivel
cresce, a outra cresce tambm. Sinal negativo indica correlao linear negativa, ou
seja, medida que uma varivel cresce, a outra decresce.

Sua grandeza indica quo prximos da reta esto os pontos individuais caso fosse
ajustada uma reta de regresso. O valor do coeficiente pode variar de 1 a 1.

-1

Correlao
negativa
forte

Inexistncia
de
correlao

Correlao
positiva
forte

r=

( x )( y )
xy n

( x )
( y)
x
y

n
n
2

## 14.6 Coeficiente de determinao

O coeficiente de determinao ou de explicao (r 2 ) indica quantos por cento a variao
explicada pela regresso representa da variao total.
r 2 = r.r

0 r2 1

94

Exemplo:
Prosseguindo o exemplo anterior, sendo y o consumo pessoal mdio e x o PIB do Brasil em
anos consecutivos.

x
7,0
7,3
7,8
8,6
8,1
8,3
8,2
8,6
9,0
9,6
9,1

y
10,1
10,6
11,3
12,4
11,9
11,9
11,5
12,1
13,1
14,1
14,6

x2
49,00
53,29
60,84
73,96
65,61
68,89
67,24
73,96
81,00
92,16
82,81

y2
102,01
112,36
127,69
153,76
141,61
141,61
132,25
146,41
171,61
198,81
213,16

xy
70,70
77,38
88,14
106,64
96,39
98,77
94,30
104,06
117,90
135,36
132,86

x = 91,6

y = 133,6

x 2 = 768,76

y 2 = 1641,28

xy = 1122,50

## O clculo do coeficiente de correlao dado por:

( 91,6 )( 133,6 )
11
r=
2

( 91,6 )
( 133,6 ) 2
768 ,76
1641,28
11
11

1122 ,5

= 0,9446

Ou seja, existe uma correlao forte positiva entre os valores do PIB e do consumo
pessoal.
O valor do coeficiente de determinao : r 2 = 0,9446 x 0,9446 = 0,8923, o que significa
que 89% da variao total explicada por este modelo.

Utilizando o Excel
Maneira 1: A equao da forma y = a + b x para os valores dos pares (x,y) e
os coeficientes da reta so calculados utilizando o mtodo dos mnimos
quadrados.Aps colocar os valores em duas colunas (valores de x e valores de
y) v ao Assistente de Funo e escolha as funes INCLINAO para
determinar o valor de b e INTERCEPO para calcular o valor de a. Os
passos seguintes devem ser feitos seguindo as indicaes do programa. Para o
clculo da correlao utiliza-se no Assistente de Funo o CORREL. Em
Matriz1 devem ser colocadas as clulas referentes varivel x em Matriz2 as
clulas referentes varivel y.
Maneira 2: Selecionar Ferramentas e Anlise de dados e ento
Regresso. Informar o que for solicitado.

95

## 14.7 Exemplo de soluo no Excel

A velocidade mxima de automveis de frmula 1 com motores de mesma potncia
funo, entre outras variveis, do peso do veculo, no intervalo entre 700 e 800 Kg. Assim,
verificou-se qual a velocidade mxima atingida em uma reta de 1.200 m. Os resultados
foram:

Peso(Kg)

750

755

777

782

793

Veloc.Mx.(Km/h)

380

354

348

330

320

## Relao entre velocidade e peso dos veculos de F1

390

y = -1,181x + 1257,173

370

R = 0,865

350
330
310
740

750

760

770
Peso

780

790

800

Estatstica de regresso
R mltiplo

0,930

0,865

0,820

9,851

Observaes

Se

96

## Se F de significao < 0,05, ento o

vlido. Se F > 0,05 o modelo no se

## ANOVA (teste de significncia para o modelo linear ajustado)

gl

SQ

MQ

F de significao

Regresso

1864,051

1864,051

19,207

0,022

Resduo

291,149

97,050

Total

2155,200

Testes para a e b
Se valor-P < 0,05, ento a estimativa
vlida, caso contrrio significativamente
nula

Valores de a e b

Coeficientes
Interseo 1257,173
Peso(Kg)

-1,181

Erro

Stat t

valor-P

95%
95%
inferiores superiores

Inferior
95,0%

Superior
95,0%

207,862

6,048

0,009

595,662

1918,685

595,662

1918,685

0,269

-4,383

0,022

-2,038

-0,323

-2,038

-0,323

## A equao linear de relacionamento dos dados Velocidade =1257,173 1,181 Peso

1,181(760) = 359,61 km /hora

97

Exerccios
1. Determinar o coeficiente de correlao dos dados a seguir:

X
Y

1
4

2
7

3
7

6
9

9
15

## 2. A tabela a seguir apresenta os valores dos investimentos administrados on-line a partir

de 1998. Verifique se existe correlao entre os anos (x) e os investimentos (y), caso
exista correlao, apresente o intervalo de confiana de 95% para o valor dos
investimentos no ano de 2002 e 2003.

Ano
1998
1999
2000
2001

Investimento
374
555
908
1010

## 3. Os grficos e a tabela indicam o nmero de anos de escolaridade das chefes de famlia

(x) e a participao feminina na renda familiar (y) em alguns anos

1976
1990
1993
1996

Nmero
de anos de
estudo
4,7
5,7
6,3
6,6

Participao na renda
(%)
8,4
16
19
21

a) Caso exista associao, quantos anos de estudo sero necessrios para que a
participao da mulher na renda familiar chegue a 50% ?
b) E qual ser a participao da mulher na renda familiar quando ela tiver 12 anos de
estudo?
c) Voc poderia estimar o ano em que a mulher ir participar com 50% da renda?

98

## 4. Aps uma regulagem eletrnica um veculo apresenta um rendimento ideal no que

tange o consumo de combustvel. Contudo, com o passar do tempo esse rendimento
vai se degradando. Os dados a seguir representam o rendimento medido ms a ms
aps a regulagem. Ajuste um modelo linear a estes dados. Calcule o coeficiente de

y: Rendimento

1
10,7

2
10,9

3
10,8

4
9,3

5
9,5

6
10,4

y: Rendimento

7
9,0

8
9,3

9
7,6

10
7,6

11
7,9

12
7,7

## 5. O gerente de uma indstria localizada em um pas tropical suspeita que h uma

aleatoriamente ao longo de um perodo de seis meses revelaram o seguinte.

Temperatura

21,2
142

20,3
148

22,7
131

22,0
132

22,3
145

23,5
138

24,8
144

24,2
136

25,5
141

25,2
124

25,5
133

25,8
128

Temperatura

27,5
132

26,3
137

28,2
124

28,6
117

29,0
122

29,7
131

30,7
124

30,3
111

30,2
119

31,4
129

32,5
123

32,7
116

## Plote um grfico de disperso e visualize a natureza da correlao entre temperatura e

produtividade. Depois estime a equao da reta de regresso e calcule o valor do
coeficiente de correlao. Interprete os resultados.
Estime a produtividade quando a temperatura estiver em 35 graus. Construa um
Intervalo de Confiana de 90% para esta produtividade.

## 6. Suponha que os valores obtidos para o desempenho de alunos em uma determinada

disciplina e as rendas familiares sejam os que seguem.
Aluno
1
2
3
4
5
6
7
8
9

X
(renda)
750
690
400
900
200
1000
300
600
1200

Y
(desempenho)
5
8
4
9
2
10
3
6
10

regresso.

99

## 7. A revista Exame Melhores e Maiores apresentou as maiores empresas do comrcio, por

vendas no ano anterior. Entre as que pertencem ao setor de comrcio varejista esto
destacadas as 11 maiores. Atravs da anlise da tabela e do grfico, o que voc pode
concluir?

Nmero de
funcionrios

Empresa
Carrefour
Po de Acar
Casas Bahia
Sendas
Ponto Frio
Sonae
Bompreo
L. Americanas
McDonalds
AgipLiquigs
Pernambucanas

37.004
39.642
11.508
16.990
5.395
22.638
13.225
12.485
No informou
3.804
10.787

Vendas
(Milhes US\$)
4.582,4
3.976,4
1642,2
1391,7
1223,6
1083,9
1062,7
900,6
726,7
693,1
619,1

## V e nd as no an o d e 1999 das 11 m aior e s e m pr e s as d o

Br as il do s e tor de co m r cio var e jis ta
5.000
4.500

y = -42 ,4 62 + 0 ,10 15 x

M ilh e s US\$

4.000

R 2 = 0 ,80 1

3.500
3.000
2.500
2.000
1.500
1.000
500
-

5.000

10.000

15.000

20.000

25.000

30.000

35.000

40.000

Nm e r o d e fu ncion r ios

## 14.8 Outros modelos

Muitas vezes a forma funcional entre as variveis x e y no linear. Alguns modelos,
mesmo no sendo lineares, so facilmente linearizveis. Este procedimento busca facilitar
o clculo dos coeficientes da equao.
No entanto, o uso de softwares estatsticos, calculadoras e planilhas eletrnicas auxilia na
obteno dos coeficientes.
O valor de r 2 serve como uma forma de comparao entre os modelos. O modelo que
apresentar maior valor de r 2 o que apresenta melhor ajuste dos dados.
100

14.8.1

Funo exponencial

a>0

Utilizando

as

y = ab x

0<b<1

a>0

b>1

a<0

0<b<1

dos

logaritmos

pode-se

a<0

chegar

b>1

Y = A + Bx

onde

## Y = log y , A = log a e B = log b

Pelo mtodo dos mnimos quadrados obtm-se A e B e depois convertem-se os valores
para a e b .

a = 10 A e b = 10 B
Exemplo
Uma empresa fabricante de brinquedos registrou suas vendas nos ltimos 10 anos,
obtendo os valores apresentados a seguir.

Vendas (y)
450
500
600
800
1.200
1.700
2.100
4.000
5.000
7.000

10.000
8.000
Ve n d as

Ano (x)
1
2
3
4
5
6
7
8
9
10

6.000
4.000
2.000
0
0

5 6
An o

10 11

## Prof. Cntia Paese Giacomello

101

Para ajustar uma funo exponencial, inicia-se com o clculo dos somatrios de Y, x, Y 2 ,
x 2 e xY, onde Y = ln (y)

x
1
2
3
4
5
6
7
8
9
10
Total: 55

y
450
500
600
800
1.200
1.700
2.100
4.000
5.000
7.000
23.350

x2
1
4
9
16
25
36
49
64
81
100
385,00

Y=ln(y)
6,11
6,21
6,40
6,68
7,09
7,44
7,65
8,29
8,52
8,85
73,25

xY
6,11
12,43
19,19
26,74
35,45
44,63
53,55
66,35
76,65
88,54
429,64

Y2
37,32
38,62
40,92
44,68
50,27
55,33
58,52
68,79
72,54
78,39
545,39

Ento,

B=

## 10( 429 ,64 ) ( 55 )( 73 ,25 )

= 0,3245
10( 385 ) ( 55 ) 2

A=

73,25 0 ,325( 55 )
= 5 ,5399
10

## Logo, a equao final ser

Vendas =(254,42)(1,3903) ano

Observe como os valores estimados pela equao esto prximos dos valores reais,
8.000
7.000

V endas

6.000
5.000
4.000
3.000

V endas
equa o

2.000
1.000
0
1

9 10

102

14.8.2

a>0

Utilizando

as

b mpar

a>0

b par

a<0

dos

logaritmos

pode-se

y = ax b

b mpar

chegar

a<0

b par

Y = A + bX

onde

para a .

## b e depois convertem-se os valores

a = 10 A
Exemplo
Os dados a seguir apresentam a produo de veculos automotivos (y) ao longo do tempo
(x). Para estes dados ajuste um modelo de potncia

ano
produo

59
96,1

60
133,0

61
145,6

62
191,2

63
174,2

64
183,7

65
185,2

ano
produo

66
224,6

67
225,4

68
278,5

69
349,5

70
416,0

71
516,0

72
609,0

700,0
600,0
500,0
400,0
300,0
200,0
100,0
0,0
55

60

65
An o

70

75

103

Ano
59
60
61
62
63
64
65
66
67
68
69
70
71
72

Produo
96,1
133,0
145,6
191,2
174,2
183,7
185,2
224,6
225,4
278,5
349,5
416,0
516,0
609,0
Totais:

Y=ln(y)
4,565
4,890
4,981
5,253
5,160
5,213
5,221
5,414
5,418
5,629
5,857
6,031
6,246
6,412
76,292

X=ln(x)
4,078
4,094
4,111
4,127
4,143
4,159
4,174
4,190
4,205
4,220
4,234
4,248
4,263
4,277
58,522

Y2
20,843
23,916
24,809
27,597
26,628
27,179
27,263
29,315
29,353
31,690
34,299
36,369
39,014
41,111
419,386

X2
16,626
16,764
16,899
17,033
17,166
17,296
17,426
17,553
17,679
17,804
17,928
18,050
18,170
18,290
244,684

XY
18,616
20,023
20,476
21,681
21,379
21,682
21,796
22,684
22,781
23,753
24,797
25,621
26,625
27,421
319,335

Assim,

b=

## 14( 319 ,335 ) ( 58 ,522 )( 76 ,292 )

= 7,970
14( 244 ,684 ) ( 58 ,522 ) 2

A=

= 27 ,868
14

Y=A+bX 

Ou ento,

y=7,889E-13 x

7,970

## Logo, a equao final ser

Produo de automveis = 7,889E-13 (ano)

7,970

## O grfico comparativo entre os valores observados para a produo e os estimados atravs

da curva Produo de automveis = 7,889E-13 (ano) 7,970 :

104

700,0
600,0

Produo real

500,0
pela equao

400,0
300,0
200,0
100,0
0,0
59

60

61

62

63

64

65

66

67

68

69

70

71

72

Exerccios
1.

## Aos dados a seguir ajuste um modelo exponencial e um polinomial. Estime a

quantidade de vendas para o ano de 2003, supondo que o comportamento dos dados
seja mantido. DICA: utilize os nmeros de 1 a 11 para os anos e calcule o valor de y quando x
for 14.

Ano
Vendas

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

15

16

17

18

25

28

32

42

55

76

93

2. Se voc tivesse uma srie de dados como expressa no diagrama de disperso a seguir,
que modelo de regresso voc utilizaria? O que voc poderia dizer a respeito dos
valores dos parmetros?

3. Uma companhia de energia eltrica estimou o consumo mdio de energia das famlias
(kwh) de acordo com a renda (R\$). Ajuste os seguintes modelos: y=ax b , y=ab x e
y=a+bx.
Renda

197

286

243

218

241

200

215

198

129

157

296

302

Consumo

1234

1432

1678

1300

1467

1245

1214

1200

770

890

2020

2100

105

15 Tabelas

106