Você está na página 1de 113

U NIVERSIDADE

DE

C AXIAS

DO

S UL

P ROFESSORA : C NTIA P AESE G IACOMELLO

Probabilidade e Estatstica

ndice

2
3
4

7
8

Introduo _____________________________________________________1
1.1

Amostragem ________________________________________________________ 2

1.2

Tipos de variveis ____________________________________________________ 4

Sries estatsticas _______________________________________________5


Grficos _______________________________________________________6
Distribuies de freqncias ______________________________________12
4.1

Construo de distribuio de freqncia para dados contnuos ______________ 12

4.2

Grficos das distribuies de freqncia _________________________________ 13

4.3

Construo de distribuio de freqncia para dados discretos ______________ 15

4.4

Construo de uma distribuio de freqncia acumulada___________________ 17

4.5

Distribuies de freqncia para dados nominais e por postos _______________ 18

4.6

Grficos para distribuies de freqncia ________________________________ 19

Medidas de tendncia central _____________________________________20


5.1

Mdia _____________________________________________________________ 20

5.2

Mediana ___________________________________________________________ 23

5.3

Moda _____________________________________________________________ 25

5.4

Relao entre as medidas de tendncia central ___________________________ 26

Medidas de variabilidade ________________________________________28


6.1

Amplitude _________________________________________________________ 28

6.2

Varincia __________________________________________________________ 29

6.3

Desvio padro ______________________________________________________ 29

6.4

Coeficiente de variao ______________________________________________ 30

Medidas de assimetria e curtose __________________________________31


Introduo probabilidade_______________________________________33
8.1

Experimento aleatrio _______________________________________________ 33

8.2

Espao amostral ____________________________________________________ 34

8.3

Eventos ___________________________________________________________ 34

8.4

A probabilidade de um evento _________________________________________ 34

8.5

Clculo das probabilidades ____________________________________________ 37

9 Distribuies de probabilidade ____________________________________43


10 Teoria elementar da amostragem ________________________________56
10.1

Amostragem com e sem reposio ____________________________________ 56

10.2

Distribuies amostrais _____________________________________________ 56

Prof. Cntia Paese Giacomello

11
12

Estimao ___________________________________________________62
Testes de hipteses ___________________________________________68

12.1

Teste de hipteses para mdias ______________________________________ 70

12.2

Testes de duas amostras para mdias _________________________________ 72

12.3

Teste para propores _____________________________________________ 72

12.4

Teste do qui-quadrado (k amostras para propores) ____________________ 73

13

Anlise de varincia (ANOVA - Analysis of Variance) _________________79

13.1

Formulrio para soluo ____________________________________________ 83

13.2

Exemplo de soluo no Excel ________________________________________ 85

14

Regresso e correlao ________________________________________90

Regresso ______________________________________________________________ 91
14.1

Aplicaes da regresso ____________________________________________ 91

14.2

Classificao das regresses_________________________________________ 91

14.3

Modelo linear _____________________________________________________ 91

Correlao ______________________________________________________________ 94
14.4

Objetivo da correlao _____________________________________________ 94

14.5

O coeficiente r de Pearson (correlao)________________________________ 94

14.6

Coeficiente de determinao ________________________________________ 94

14.7

Exemplo de soluo no Excel ________________________________________ 96

14.8

Outros modelos __________________________________________________ 100

15

Tabelas ____________________________________________________106

Prof. Cntia Paese Giacomello

1 I ntroduo
Estuda-se estatstica para aplicar seus conceitos como auxlio nas tomadas de deciso
diante de incertezas, justificando cientificamente as decises.
Os princpios estatsticos so utilizados em uma grande variedade de situaes no
governo, nos negcios e na indstria, bem como no mbito das cincias sociais, biolgicas
e fsicas.
Estatstica a cincia ou mtodo cientfico que estuda os fenmenos multicausais,
coletivos ou de massa e procura inferir as leis que os mesmos obedecem.
Mtodo estatstico um processo para se obter, apresentar e analisar caractersticas ou
valores numricos para uma melhor tomada de deciso em situaes de incerteza. Os
passos da metodologia estatstica so os seguintes:

Definio cuidadosa do problema

Formulao de um plano para coleta das unidades de observao

Coleta, resumo e apresentao das unidades de observao ou de seus valores


numricos

Anlise dos resultados

Divulgao de relatrio com as concluses, de tal modo que estas sejam facilmente
entendidas por quem as for usar na tomada de decises.

Em geral, aceita a diviso da estatstica em dois grandes grupos: estatstica descritiva e


indutiva.
Descritiva: corresponde aos procedimentos relacionados com a coleta, elaborao,
tabulao, anlise, interpretao e apresentao dos dados. Isto , inclui as tcnicas que
dizem respeito sintetizao e descrio de dados numricos. Tais mtodos podem ser
grficos e envolvem a utilizao de recursos computacionais. O objetivo da estatstica
descritiva tornar as coisas mais fceis de entender, relatar e discutir.
Indutiva (ou inferencial): parte de uma ou mais amostras (subconjuntos da populao) e
conclui sobre a populao. Utiliza tcnicas como a teoria das probabilidades, inferncia
estatstica, amostragem.

Com maior freqncia utilizamos o estudo da amostra do que da populao, no s por


serem menos dispendiosas e consumirem menos tempo no processamento dos dados, mas
tambm porque muitas vezes no dispomos de todos os elementos da populao.

Prof. Cntia Paese Giacomello

Definies:
Populao: coleo completa de todos os elementos (valores, pessoas, medidas,...) a
serem estudados.
Amostra: subcoleo de elementos extrados da populao.
Censo: coleo de dados relativos a todos os elementos de uma populao.
Amostragem: coleo de dados relativos a elementos de uma amostra.

Exemplo:
Populao

Amostra

Parmetro: medida numrica que descreve uma caracterstica de uma populao


Estatstica: medida numrica que descreve uma caracterstica de uma amostra

1.1 Amostragem
O objetivo da amostragem permitir fazer inferncias sobre uma populao aps inspeo
de apenas parte dela. Fatores como custo, tempo, ensaios destrutivos e populaes
infinitas tornam a amostragem prefervel a um estudo completo (censo).
Os principais tipos de amostragem utilizados so os probabilsticos, onde todos os
indivduos da populao tm a mesma chance de serem selecionados. Os planos de
amostragem probabilstica so delineados de tal modo que se conhece todas as
combinaes amostrais possveis e suas probabilidades, podendo-se ento determinar o
erro amostral.
Os mtodos mais comuns de amostragem probabilstica so:

Amostragem aleatria simples: os elementos de uma populao so escolhidos de


tal forma que todos tenham a mesma chance de serem escolhidos. Pode-se utilizar
uma tabela de nmeros aleatrios ou um programa de gerao de nmeros
aleatrios.

Amostragem estratificada: subdivide-se a populao em, no mnimo, dois estratos


(subpopulaes) que compartilham a mesma caracterstica e em seguida escolhe-se
uma amostra de cada. Exemplo: homens e mulheres.

Amostragem sistemtica: escolhe-se um ponto de partida e ento,


sistematicamente, selecionam-se os outros. Por exemplo: o 3, 403, 803,
1203,... indivduos

Prof. Cntia Paese Giacomello

Amostragem por conglomerados: divide-se a populao em conglomerados (reas),


em seguida sorteiam-se algumas reas e analisam-se todos os elementos dos
conglomerados escolhidos. Por exemplo: bairros.

Fonte: Triola, Mrio. 1999, 11.

Amostragens no probabilsticas so utilizadas quando a populao em estudo muito


pequena ou de difcil obteno. Neste caso a anlise de uma amostra poderia causar
distores. Uma pessoa familiarizada com a populao pode indicar melhor as unidades
amostrais. Este tipo de amostragem no permite avaliar o erro amostral. EX: doena rara.

Prof. Cntia Paese Giacomello

1.2

Tipos de variveis

Alguns conjuntos de dados consistem em nmeros, enquanto outros so no numricos.


Utiliza-se a nomenclatura de dados (ou variveis) qualitativos e quantitativos.

Variveis

Quantitativas

Discretas

Qualitativas

Contnuas

Exerccios:
Identifique cada nmero como discreto ou contnuo
1. Cada cigarro Camel tem 16,13 mg de alcatro
2. O altmetro de um avio da American Airlines indica uma altitude de 21.359 ps
3. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas so assinante de um
servio de informao on-line.
4. O tempo total gasto anualmente por um motorista de txi de Nova York ao dar
passagem a pedestres de 2367 segundos.

Apresente dois exemplos de dados discretos ou contnuos de sua empresa / pesquisa.

Prof. Cntia Paese Giacomello

2 Sries estatstic as
Consiste no agrupamento dos dados estatsticos em tabelas.
Em qualquer srie estatstica so observados trs elementos fundamentais:

O fato, isto , o que est sendo observado

O espao geogrfico

A poca

Estes elementos criam classificaes para as sries: especficas, temporais ou geogrficas.

Sries temporais (ou histricas)


Os dados esto reunidos de acordo com o tempo, que varia. Os outros dois fatores - local
e fato - permanecem inalterados.

Sries geogrficas
Os dados esto reunidos de acordo com o local, que varia. Os outros dois fatores - fato e
data - permanecem inalterados.

Prof. Cntia Paese Giacomello

Sries especficas
Os dados esto reunidos de acordo com o evento, que varia. Os outros dois fatores - local
e data - permanecem inalterados.

As sries podem ainda apresentar-se sob a forma mista, resultante da combinao dos
fatores.

3 Grficos
Os grficos consistem em uma forma de apresentao dos dados, usualmente utilizada
pois facilita a interpretao dos resultados.
So elementos complementares de um grfico:

Ttulo geral, poca e local

Escalas e respectivas unidades de medida

Indicao das convenes adotadas (legenda)

Fonte de informao dos dados

Prof. Cntia Paese Giacomello

Principais tipos de grficos: (Fonte: Site da Microsoft www.microsoft.com.br)

Colunas
Um grfico de colunas mostra as alteraes
de dados em um perodo de tempo ou
ilustra comparaes entre itens. As
categorias so organizadas na horizontal e
os valores so distribudos na vertical, para
enfatizar as variaes ao longo do tempo.
Grficos de colunas empilhadas mostram o relacionamento de itens individuais com o todo
. O grfico de colunas em perspectiva 3D
compara pontos de dados ao longo dos dois
eixos.

Vendas por local

Nesse grfico 3D, voc pode comparar o


desempenho das vendas de quatro
trimestres na Europa com o desempenho de
outras duas divises.

Barras
Um grfico de barras ilustra comparaes
entre itens individuais. As categorias so
organizadas na vertical e os valores na
horizontal para enfocar valores de
comparao.

Vendas por produto

Grficos de barras empilhadas mostram o


relacionamento de itens individuais com o
todo.

Prof. Cntia Paese Giacomello

Linha
Valor de venda do produto X

Um grfico de linhas mostra


tendncias nos dados em
intervalos iguais.
A unio dos pontos faz sentido
pois a varivel contnua.
Meses usualmente so
tratados como variveis
contnuas

Pizza
Um grfico de pizza mostra o tamanho
proporcional de itens que constituem uma srie
de dados para a soma dos itens. Ele sempre
mostra somente uma nica srie de dados, sendo
til quando voc deseja dar nfase a um
elemento importante.
Totaliza a informao (100%). Cada faixa do
grfico proporcional informao.

Para facilitar a visualizao de fatias pequenas, voc pode


agrup-las em um nico item do grfico de pizza e
subdividir esse item em um grfico de pizza ou de barras
menor, ao lado do grfico principal.

Diagrama de Disperso (Disperso XY)


Um grfico xy (disperso) mostra a
relao existente entre os valores
numricos em vrias sries de dados ou
plota dois grupos de nmeros como uma
srie de coordenadas xy. Esse grfico
mostra intervalos irregulares ou clusters
de dados e usado geralmente para
dados cientficos.

Prof. Cntia Paese Giacomello

Relao entre tempo e temperatura

Histograma

Apresenta as classes ao longo do eixo


horizontal e as freqncias (absolutas ou
relativas) ao longo do eixo vertical. As
fronteiras das barras coincidem com os
pontos extremos dos intervalos de classe.

Distribuio da quantidade produzida


% das rvores

um grfico de colunas, porm utilizado


para apresentar distribuies de
freqncias.

0.30
0.25
0.20
0.15
0.10
0.05
0.00

3a8

8 a 13 13 a 18 18 a 23 23 a 28 28 a 33

Safras (alq.)

rea
Um grfico de rea enfatiza a
dimenso das mudanas ao longo do
tempo. Exibindo a soma dos valores
plotados, o grfico de rea mostra
tambm o relacionamento das partes
com um todo.
Nesse exemplo, o grfico de rea
enfatiza o aumento das vendas em
Washington e ilustra a contribuio
de cada estado para o total das
vendas.

Superfcie
Um grfico de superfcie til quando
voc deseja localizar combinaes
vantajosas entre dois conjuntos de dados.
Como em um mapa topogrfico, as cores e
os padres indicam reas que esto no
mesmo intervalo de valores.
Esse grfico mostra as vrias combinaes
de temperatura e tempo que resultam na
mesma medida de resistncia trao.

Prof. Cntia Paese Giacomello

Radar
Um grfico de radar compara os
valores agregados de vrias sries de
dados.

Nesse grfico, a srie de dados que


cobre a maior parte da rea, Marca A,
representa a marca com o maior
contedo de vitamina.

Aes
O grfico de alta-baixa-fechamento usado muitas vezes para ilustrar preos de aes.
Esse grfico tambm pode ser usado com dados cientficos para, por exemplo, indicar
mudanas de temperatura. Voc deve organizar seus dados na ordem correta para criar
esse e outros grficos de aes.

Um grfico de aes que mede o volume tem dois eixos de valores: um para as colunas,
que medem o volume, e outro para os preos das aes. Voc pode incluir volume em um
grfico de alta-baixa-fechamento ou de abertura-alta-baixa-fechamento.

Prof. Cntia Paese Giacomello

10

Bolhas
Um grfico de bolhas um tipo de grfico xy (disperso). O tamanho do marcador de
dados indica o valor de uma terceira varivel.
Para organizar seus dados, coloque os valores de x em uma linha ou coluna e insira os
valores de y e os tamanhos das bolhas correspondentes nas linhas ou colunas adjacentes.

O grfico nesse exemplo mostra que a Empresa A tem a maioria dos produtos e a maior
fatia do mercado, mas no necessariamente as melhores vendas.

Cone, cilindro e pirmide


Os marcadores de dados em forma de cone, cilindro e pirmide podem dar um efeito
especial aos grficos de colunas e de barras 3D.

Rosca
Como um grfico de pizza, o grfico de
rosca mostra o relacionamento das partes
com o todo, mas pode conter mais de uma
srie de dados. Cada anel do grfico de
rosca representa uma srie de dados.

Prof. Cntia Paese Giacomello

11

4 Distribuies de freqncias
Distribuio de freqncia uma tabela resumida na qual os dados so organizados em
grupos de classe ou categorias convenientemente estabelecidas e numericamente
ordenadas.
As distribuies de freqncias so series hetergrafas, isto , sries na qual o fenmeno
ou fato apresenta graduaes ou subdivises. Embora fixo, o fenmeno varia de
intensidade.
Nas distribuies de freqncia, os dados so agrupados segundo um critrio de
magnitude, em classe ou pontos, permanecendo constante o fato, local e tempo, de tal
forma que se possa determinar a percentagem ou nmero, de cada classe. um tipo de
apresentao que condensa uma coleo de dados conforme as freqncias ou repeties
de seus valores.

A construo da distribuio de freqncia depende do tipo de dado com os quais se est


lidando: contnuos ou discretos.

4.1 Construo de distribuio de freqncia para dados contnuos


Os principais estgios so:
1. Estabelecer a quantidade de classes ou intervalos de grupamento dos dados. O
nmero de classes deve variar entre 5 e 15. Aconselha-se utilizar
nmero de observaes.

n onde n o

2. Determinar a amplitude das classes. Aconselha-se fazer amplitude / n o de classes.


(OBS: amplitude = maior valor menor valor)
3. Enquadrar os dados nas classes, mediante contagem e apresentar os resultados em
uma tabela ou grfico

Exemplo:
Os dados a seguir representam o tempo (em minutos) que 45 operadores de mquina
demoraram para fazer o setup de uma mquina.

6,5
6,4
9,7
7,9
7,9

4,0
5,0
4,4
6,0
6,4

7,1
8,5
7,0
8,2
7,4

8,3
5,7
6,3
10,4
7,0

1 Nmero de classes  45 valores 

5,4
7,7
8,3
9,9
13,0

7,6
7,2
6,9
3,9
8,7

9,0
12,4
5,7
9,8
6,4

15,7
7,1
7,6
8,2
6,7

16,7
5,5
7,9
5,6
7,4

45 =6,7 7 classes

2 Amplitude das classes  16,7 3,9 = 12,8 (Maior valor = 16,7; Menor valor =
3,9). Logo, tem-se a amplitude das classes 12,8 / 7 = 1,83 2

Prof. Cntia Paese Giacomello

12

3 Escrever as classes e contar os valores

Tempo
(minutos)

Nmero de
operadores

% de
operadores

3 | 5

8,9%

5 | 7

15

33,3%

7 | 9

18

40,0%

9 | 11

8,9%

11 | 13

4,4%

13 | 15

0,0%

15 | 17

4,4%

Total

45

100%

3 | 5 equivale a 3 < x 5
Ou seja, so contados no
intervalo todos os valores
superiores a 3 e inferiores ou
iguais a 5.

A freqncia absoluta (f i ) corresponde ao nmero de operadores


A freqncia relativa (f ri ) corresponde ao percentual de operadores

4.2 Grficos das distribuies de freqncia


Histograma de freqncias

Nmero de operadores

Anlise dos tempos para fazer o setup da mquina


20
18
16
14
12
10
8
6

18
15

4
2
0

2
0

3 | 5

5 | 7

7 | 9

9 | 11

11 | 13

13 | 15

15 | 17

Tempo (minutos)

Uma alternativa ao histograma de freqncias o polgono de freqncias, construdo


mediante a conexo dos pontos mdios dos intervalos do histograma, com linhas retas.

Prof. Cntia Paese Giacomello

13

Anlise dos tempos para fazer o setup da mquina

Nmero de operadores

20
18

18

16
14
12

15

10
8
6
4

2
0

3 | 5

5 | 7

7 | 9

2
0
9 | 11 11 | 13 13 | 15 15 | 17

Tempo (minutos)

OBS: uma vez que a rea do polgono deve ser 100%, deve-se ligar o primeiro e o ltimo
pontos mdios com o eixo horizontal, de modo a cercar a rea da distribuio observada.

Exerccios:
1. A tabela de dados representa o peso de 30 sacos de arroz da marca A selecionados
aleatoriamente em um supermercado. Construa a distribuio de freqncias e
apresente em um grfico. (para facilitar os dados j esto ordenados)
922

930

936

950

954

954

958

965

968

974

977

979

987

989 1001 1006 1008 1010 1013 1017

1018 1034 1034 1035 1042 1044 1044 1048 1070 1116

2. Construa a distribuio de freqncia e o polgono de freqncias.


6,2

9,0

12,2

14,7

7,9

9,8

8,0

13,3

13,3

8,9

8,8

8,3

11,8

11,8

14,7

8,5

7,7

11,4

11,2

10,6

Prof. Cntia Paese Giacomello

14

4.3 Construo de distribuio de freqncia para dados discretos


Na construo de uma distribuio de freqncia utilizando dados contnuos, perde-se
certa quantidade de informao porque os valores individuais perdem sua identidade
quando so agrupados em classes. Isso pode ou no ocorrer com dados discretos,
dependendo da natureza dos dados e os objetivos do analista.

Consideremos os seguintes dados relativos ao nmero de acidentes dirios em um grande


estacionamento, durante o perodo de 50 dias.
1

Note que os dados esto entre 0 e 9.


Podemos construir uma distribuio de freqncia sem perda dos valores originais,
utilizando os prprios valores.

Freqncia
dias

% dos
dias

0,06

0,06

12

0,08

10

0,10

10

0,20

10

0,20

0,12

0,08

0,06

0,04

50

1,00

Nmero de dias

Classe

8
6
4
2
0
0

No houve perda de informao, ou seja, poderamos construir a tabela original a partir da


distribuio de freqncias.

Prof. Cntia Paese Giacomello

15

Por outro lado, poderamos usar como classes 0-1, 2-3, 4-5, 6-7 e 8-9.
Freqncia
dias

% dos
dias

0-1

0,12

2-3

0,18

4-5

20

0,40

6-7

10

0,20

8-9

0,10

50

1,00

25
Nmero de dias

Classe

20
15
10
5
0
0-1

2-3

4-5

6-7

8-9

De modo geral prefere-se uma distribuio de freqncia sem perda de informao


quando:

Os dados so constitudos de valores inteiros.

H menos de, digamos, 16 classes.

H suficientes observaes para originar uma distribuio significativa

Por outro lado, prefere-se uma distribuio de freqncia com perda da informao
quando:

Esto em jogo inteiros e no inteiros

S existem inteiros, porm em nmero muito alto para permitir uma distribuio
til.

A perda da informao de importncia secundria (por exemplo, o


arredondamento do peso de um caminho ou da renda anual para a unidade mais
prxima)

Prof. Cntia Paese Giacomello

16

4.4 Construo de uma distribuio de freqncia acumulada


Uma distribuio de freqncia acumulada tem por objetivo indicar o nmero ou
percentual de itens menores do que, ou iguais a , determinado valor.
No caso dos acidentes podemos construir distribuies acumuladas para a distribuio com
e sem perda da informao.

Sem perda da informao


Freqncias

Classe

N dias

% dias

0,06

0,06

0,06

0,12

0,08

0,20

0,10

0,30

10

0,20

0,50

10

0,20

0,70

0,12

0,82

0,08

0,90

0,06

0,96

0,04

1,00

50

1,00

Classe

N dias

% dias

0-1

0,12

0,12

2-3

0,18

0,30

4-5

20

0,40

0,70

6-7

10

0,20

0,90

8-9

0,10

1,00

50

1,00

acumuladas

Com perda da informao


Freqncias
acumuladas

Podemos, pela primeira tabela, concluir que 90% dos dados correspondem a valores
menores ou iguais a 7. ou seja, Em 90% dos dias o nmero de acidentes no excede 7.

Prof. Cntia Paese Giacomello

17

1.0

1.0

0.8

0.8

0.6

0.6

0.4

0.4

0.2

0.2

0.0

0.0
0

0-1

2-3

4-5

6-7

8-9

% dos dias

Os polgonos de freqncias acumuladas so tambm chamados de ogivas.

1,0
0,8
0,6
0,4
0,2
0,0
0

N. acidentes

4.5 Distribuies de freqncia para dados nominais e por postos


As distribuies de freqncias para dados nominais se assemelham s distribuies de
freqncia normais, porm apresentam as categorias em lugar das classes.
Por exemplo:
Vendas
absolutas

Vendas
relativas

Limo

600

0,375

Laranja

400

0,250

Melo

300

0,188

Melancia

200

0,125

Abacaxi

100

0,063

Total

1600

1,000

Usa-se o grfico de barras ou colunas para representar dados nominais.

Prof. Cntia Paese Giacomello

18

4.6 Grficos para distribuies de freqncia


A distribuio de freqncia muitas vezes utilizada para determinar o formato da
distribuio. A distribuio dos dados pode ser simtrica ou no.

Distribuies discretas

Assimtrica direita

Simtrica

Assimtrica esquerda

Exerccio:
Construa a distribuio de freqncia e desenhe o histograma dos dados a seguir. Qual
o formato da distribuio?
20,7
18,5
23,3
18,9
28,3

18,7
21,3
25,3
26,6
20,3

Prof. Cntia Paese Giacomello

26,2
19,3
20,4
22,4
21,7

21,7
18,3
18,3
18,9
18,2

18,8
25,1
24,0
22,6
20,3

20,6
18,8
21,2
21,4
19,2

20,7
24,3
19,4
27,0
24,7

20,2
28,4
20,6
23,6
18,4

19

5 Medidas de ten dncia central


As medidas de tendncia central so usadas para indicar um valor que tende a representar
melhor um conjunto de nmeros. As trs medidas mais usadas so a mdia, a mediana e a
moda.

5.1 Mdia
5.1.1 Mdia aritmtica
A mdia aritmtica o resultado da diviso da soma de todos os valores da amostra pela
quantidade total de valores.

x
x=

i =1

ou simplesmente x =

x
n

OBS: x l-se X barra e significa mdia.

l-se somatrio de x i , i variando de 1 a n.

i =1
n

= x1 + x 2 + ... + x n

i =1

Se um estudante faz quatro provas, obtendo as notas 70, 60, 80 e 75, sua mdia : 71,25.

Algumas propriedades da mdia

A mdia de um conjunto de dados pode ser sempre calculada.

Para um dado conjunto de nmeros, a mdia nica.

A mdia sensvel a (ou afetada por) todos os valores do conjunto, assim, se um


nmero se modifica, a mdia tambm se modifica.

Somando-se uma constante a cada valor do conjunto, a mdia ficar aumentada do


valor constante. Analogamente, extraindo-se um valor constante de cada valor do
conjunto, a mdia tambm ficar diminuda desse valor.

A soma dos desvios dos nmeros de um conjunto a contar da mdia zero.

Prof. Cntia Paese Giacomello

20

5.1.2 Mdia ponderada


A frmula anterior para calcular a mdia aritmtica supe que cada observao tenha a
mesma importncia. A mdia ponderada considera que as informaes no tem a mesma
importncia, ou seja, devem ser levados em conta o peso das informaes.
n

w x
i

i =1
n

Mdia ponderada =

i =1

Onde w i o peso da observao de ordem i.

Consideremos que um professor informe a classe de que haver dois exames parciais,
valendo cada um 30% da nota e um exame final valendo 40%. Um aluno obtm
desempenho 70 na primeira avaliao, 65 na segunda e 80 no exame final.
n

wx
i

Mdia ponderada =

i =1
n

70x 0,30 + 65x 0,30 + 80x 0,40


= 72,50
1,00

i =1

5.1.3 Mdia geomtrica


A mdia geomtrica utilizada quando se deseja fazer a mdia de taxas de juro, por
exemplo. Neste caso, multiplicam-se os n termos e em seguida extra-se a raiz de ordem
n.
A mdia geomtrica o resultado da raiz de ordem n do produto de todos os valores da
amostra.
n

Mdia geomtrica =

i =1

OBS:

= x1x 2 x 3...x n

l-se produtrio de x i , i variando de 1 a n.

i =1

5.1.4 Mdia harmnica


A mdia harmnica de um conjunto de n nmeros a recproca da mdia aritmtica dos
recprocos dos nmeros.

Prof. Cntia Paese Giacomello

21

Mdia harmnica =

1
n

1
1

n i 1 xi

n
1

5.1.5 Relao entre as mdias aritmtica, geomtrica e harmnica


A mdia geomtrica de um conjunto de nmeros positivos menor ou igual sua mdia
aritmtica, mas maior ou igual sua mdia harmnica.

HGx

Em smbolos:

O sinal de igualdade vale somente quando todos os nmeros forem iguais.


Exemplo: o conjunto 2,4 e 8 tem mdia aritmtica 4,67, mdia geomtrica 4 e mdia
harmnica 3,43.

5.1.6 Clculo da mdia para uma distribuio de freqncia


A mdia de uma distribuio de freqncia calculada com base valor e na freqncia de
cada classe.

x =

fx
i

Onde f i a freqncia da classe i.


Para dados com perda da informao, utiliza-se em lugar de x i o ponto mdio do intervalo.

Exemplo:
Classe

Ponto mdio
(x i )

N dias (f i )

f i xi

0-1

0,5

3,0

2-3

2,5

22,5

4-5

4,5

20

90,0

6-7

6,5

10

65,0

8-9

8,5

42,5

n = 50

223

Prof. Cntia Paese Giacomello

x=

fx
i

223
= 4,46
50

22

Classe (x i )

N dias (f i )

f i xi

15

10

40

10

50

36

28

24

18

50

222

x =

fx
i

222
= 4,44
50

Se fizssemos a mdia a partir da tabela original obteramos o valor de 4,44.

5.2 Mediana
A principal caracterstica da mediana dividir o conjunto de nmeros em dois grupos
iguais: a metade ter valores inferiores ou iguais mediana e a metade ter valores
superiores ou iguais mediana.
Para calcular a mediana inicia-se ordenando os valores em ordem crescente. Em seguida
conta-se at a metade deles. Em geral a mediana ocupa a posio (n+1)/2.
Para nmero mpar de valores a mediana o valor do meio. Para amostras com nmero
par de unidades, a mediana a mdia dos dois valores centrais.

Exemplos:
Amostra

Nmero de elementos

Dados ordenados

Mediana

2 3 34 25 14 5

9 elementos  mpar

1 2 23 3 4 45 5

2 4 31 73 89 24

10 elementos  par

1 2 23 34 47 89

3,5

3 4 23 15 32
6 7 32 52 36 21

Prof. Cntia Paese Giacomello

23

Uma medida semelhante mediana o quartil. Os quartis dividem o conjunto ordenado de


dados em quatro grupos iguais. 25% dos valores so inferiores ao primeiro quarti (Q 1 ),
25% esto entre Q 1 e a mediana, 25% esto entre a mediana e o terceiro quartil (Q 3 ).
OBS: o segundo quartil corresponde mediana (Q 2 =mediana).

LI

Q1

Q 2 =mediana

Q3

LI = Limite inferior

LS
LS=Limite superior

5.2.1 Clculo da mediana para uma distribuio de freqncia


Da mesma forma que para dados apresentados em srie, a mediana o ponto que divide
as informaes ao meio.

A mediana pode ser obtida por interpolao, e dada pela frmula.

( f )1
c
Mediana = L1 + 2
f mediana

onde: L 1 = limite inferior da classe mediana, isso , da classe que contm a mediana
n = nmero de itens dos dados (freqncia total)
( f) 1 =soma de todas as freqncias das classes anteriores mediana
f mediana = freqncia da classe mediana
c = amplitude do intervalo da classe mediana

Exemplo:
No caso dos acidentes, temos 50 observaes, logo a mediana deve estar localizada na
posio (50+1)/2 = 25,5, ou seja, a classe que contm a mediana a classe 4-5.
O limite inferior da classe mediana 4. Antes da classe mediana (( f) 1 ) haviam passado
15 dados. A classe mediana contm 20 observaes e a amplitude da classe mediana 1.
Ento

50

15

x1 = 4 + 0,5 = 4,5
Mediana = 4 + 2
20

Prof. Cntia Paese Giacomello

24

5.3 Moda
A moda o valor que aparece com maior freqncia na amostra. Um conjunto de dados
pode no apresentar moda, apresentar uma moda, duas modas (bimodal), trs modas
(trimodal) ou mais modas (polimodal).

Exemplo:
A moda do conjunto 2 3 4 3 2 3 5 1 2 3, pois o trs o valor que mais vezes aparece.

5.3.1 Clculo da moda para uma distribuio de freqncia


Quando no h perda da informao, a moda idntica ao valor da classe modal, que a
classe com maior freqncia.
Quando h perda da informao, a moda representa o(s) valor(es) de X
correspondente(m) ao(s) ponto(s) de ordenada(s) mxima(s) da curva e pode ser
calculada pela frmula:

1
Moda = L 1 +
1 + 2

onde: L 1 =limite inferior da classe modal (isto , a classe que contm a moda)
1 =excesso da freqncia modal sobre a da classe imediatamente anterior
2 = excesso da freqncia modal sobre a da classe imediatamente posterior

c = amplitude da classe modal

Exemplo:
No caso dos acidentes....
Classe

N dias (f i )

0-1

2-3

4-5

20

6-7

10

8-9

Classe modal

n = 50

11
Moda = 4 +
1 = 4 + 0 ,52 = 4 ,52
11 + 10

Prof. Cntia Paese Giacomello

25

A distribuio pode ter mais de uma moda, sendo bimodal ou de modas mltiplas. OBS: as
duas modas no precisam, necessariamente, ter a mesma freqncia. Isso acontece
quando h um deslocamento da distribuio.

Moda

Classe modal

Classes modais

Classes modais

5.4 Relao entre as medidas de tendncia central


Para as curvas de freqncia unimodal moderadamente inclinadas (assimtricas) vigora a
relao emprica
Mdia Moda = 3 (Mdia Mediana)

Moda

Moda
Mediana

Moda

Mediana

Mediana

Mdia

Mdia

Mdia

Exerccios:
1. Para os seguintes conjuntos de dados, determine os valores da mdia aritmtica,
mdia geomtrica, mdia harmnica, mediana e moda.
a)

12

15

16

15

12

15

15

b)

c)

10

d)

38

38

70

92

22

17

Prof. Cntia Paese Giacomello

14

26

2. Determine Q 1 , Q 2 e Q 3 nos conjuntos de dados que seguem:


a)

15

15

16

16

11

19

12

17

16

20

16

14

12

16

b)

12

11

12

3. Qual seria o efeito sobre a mdia de um conjunto de dados se se adicionasse 10:


a) a um dos nmeros?

b) a cada um dos nmeros?

4. Joo possui 5 imveis localizados nesta cidade. Ele deseja saber qual o valor
mdio, por metro quadrado, das suas propriedades. Sabendo que imveis no centro
valem R$ 450,00/m 2 e imveis em bairros valem R$ 300,00/m 2 , calcule o valor
mdio por m 2 do seu capital.
Apartamento de 80 m 2 no centro
Pavilho de 450 m 2 no bairro
Casa de 280 m 2 no centro
Apartamento de 120 m 2 no bairro
Casa de 320 m 2 no bairro

Prof. Cntia Paese Giacomello

27

6 Medidas de vari abilidade


As medidas de variabilidade ou disperso indicam se os valores esto relativamente
prximos ou no uns dos outros.
Na anlise de um conjunto de dados necessrio que sejam observados tanto as
informaes relativas localizao (medidas de tendncia central) quanto as informaes
de disperso (medidas de variabilidade).

Exemplo:

Pequena variabilidade

Grande variabilidade

Exemplo:
Duas mquinas esto sendo comparadas. A seguir est descrita a produo de cada uma
durante 5 dias.
Mdia

Produo
Mq 1

10

10

10

10

10

10

Mq 2

18

16

10

Voc acha que a programao da produo para as duas mquinas pode ser a mesma
durante 1 semana? Por qu?

Consideraremos quatro medidas de disperso: amplitude, varincia, desvio padro e


coeficiente de variao. Todas elas, exceto a amplitude, tm na mdia o ponto de
referncia. Em cada caso, o valor zero indica ausncia de variao; a disperso aumenta
proporo que aumenta o valor da medida (intervalo, varincia, etc.).

6.1 Amplitude
Tambm conhecida como intervalo.
A amplitude de um grupo de dados , de modo geral, mais simples de calcular e de
entender. Consiste na diferena entre o maior e o menor valor, ou seja, entre os valores
extremos.

Amplitude = X max - X

Prof. Cntia Paese Giacomello

mn

28

A maior limitao da amplitude o fato de s levar em conta os valores extremos de um


conjunto, nada informado sobre os outros valores.

Exemplo:
1. Calcule a amplitude dos seguintes conjuntos de dados. Voc acha que a disperso
dos conjuntos igual?
a)

15

15

12

14

16

16

15

b)

16

6.2 Varincia
Calcula-se a varincia de uma amostra elevando-se as diferenas de cada um dos valores
em relao mdia, somando-se estas diferenas e dividindo-se por n-1.

2
x

(x
=

x)2

n 1

Quando se deseja a varincia populacional, deve-se substituir n-1 por n na frmula.


Usualmente iremos utilizar a varincia amostral.

Exemplo:
Clculo da varincia do conjunto de dados 2,4,6,8, e 10.

( xi

x )2

xi

xi x

-4

16

-2

10

16

40

Somas

2
x

(x
=

x)2

n 1

40
= 10
5 1

6.3 Desvio padro


O desvio padro simplesmente a raiz quadrada da varincia. Assim se a varincia 81, o
desvio padro ser 9.
Prof. Cntia Paese Giacomello

29

(x

sx =

x)2

n 1

xi

n 1
2
i

Como anteriormente, a substituio de n-1 por n produz as frmulas para a populao.


A unidade na qual o desvio padro expresso a mesma dos dados originais, ou seja, se
os dados so em Reais, o desvio padro tambm vai ser em reais (e a varincia em
reais 2 ).

Exemplo:
Clculo do desvio padro do conjunto de dados 20, 5, 10, 15 e 25.
Usando a frmula normal:
( xi

x )2

xi

xi x

20

15

25

15

-10

100

10

15

-5

25

15

15

25

15

10

100

250

Somas

sx =

(x

x)2

n 1

250
=
5 1

62,5 = 7,91

Usando a frmula simplificada:

x
x

i
2
i

= 20 + 5 + 10 + 15 + 25 = 75
= 202 + 52 + 102 + 152 + 252 = 1375

sx =

x
x

n 1
2
i

n
=

1375 75
5 1

5 =

250
= 7,91
5 1

6.4 Coeficiente de variao


O coeficiente de variao uma medida de variao til para comparar conjuntos de
dados diferentes. Ele usualmente expresso em percentual.

O coeficiente de variao dado pelo quociente entre o desvio padro e a mdia dos
dados.
Prof. Cntia Paese Giacomello

30

CV =

Desvio padro S x
=
Mdia
X

Exemplo:
Entre os conjuntos de dados a seguir apresentados, qual apresenta maior variabilidade?
Conjunto A
Conjunto B
12
3
25
4
16
5
23
2
Soluo:

CVA =

Desvio Padro A 6,06


=
= 0,3187
MdiaA
19

CVB =

Desvio Padro B 1,29


=
= 0,3688
MdiaB
3,5

Ento o conjunto que possui maior variabilidade o conjunto B.

Exerccios:
1. O desvio padro pode ser zero? Explique. Pode ser negativo? Explique.

2. Calcule a mdia e o desvio padro para as vendas dirias.


R$ 8100

R$ 9000

R$ 4580

R$ 5600

R$ 7680

R$ 4800

R$ 10640

3. Consideremos os seguintes dados correspondentes a preos de propostas.


26,5

27,5

25,5

26,0

27,0

23,4

25,1

26,2

26,8

Calcule a amplitude, a varincia, o desvio padro, a mdia, moda, mediana e os


quartis

7 Medidas de a ssi metria e curtose


As medidas de assimetria e curtose indicam qual o formato da distribuio dos dados em
relao distribuio normal (descrita adiante).
Assimetria o grau de desvio, ou afastamento da simetria, de uma distribuio. Ela
retorna a distoro de uma distribuio. O valor enviesado caracteriza o grau de assimetria
de uma distribuio em torno de sua mdia. Um valor positivo indica uma distribuio com
uma ponta assimtrica que se estende em direo a valores mais positivos. Um valor

Prof. Cntia Paese Giacomello

31

negativo indica uma distribuio com uma ponta assimtrica que se estende em direo a
valores mais negativos. No excel a funo correspondente distoro .

n
xi x

Assimetria =

(n 1)(n 2)
s

Assimtrica positiva

Simtrica

Assimtrica negativa

a>0

a=0

a<0

A curtose o grau de achatamento de uma distribuio e caracteriza uma distribuio em


cume ou plana se comparada distribuio normal (chamada mesocrtica). A curtose
positiva indica uma distribuio relativamente em cume (chamada leptocrtica). A curtose
negativa indica uma distribuio relativamente plana (chamada platicrtica). A funo
correspondente no excel chama-se CURT, e calcula a curtose de um conjunto de dados de,
no mximo, 30 valores.
4

n(n + 1)
3(n 1) 2
x i x

Curtose =
s (n 2)(n 3)
(n 1)(n 2)(n 3)

Leptocrtica

Mesocrtica

Platicrtica

c>0

c=0

c<0

Prof. Cntia Paese Giacomello

32

8 I nt r odu o p robabilid ad e
As origens da probabilidade remontam ao sculo XVI. As aplicaes iniciais referiam-se
quase todas a jogos de azar. Os jogadores aplicavam o conhecimento da teoria das
probabilidades para planejar estratgias de apostas.
Atualmente a utilizao das probabilidades ultrapassou de muito o mbito desses jogos.
Hoje os governos, as empresas, as organizaes profissionais incorporam a teoria das
probabilidades em seus processos dirios de deliberaes.
Independentemente de qual seja a aplicao em particular, a utilizao das probabilidades
indica que existe um elemento de acaso, ou de incerteza, quanto ocorrncia ou no de
um evento futuro. Assim que, em muitos casos, pode ser virtualmente impossvel afirmar
por antecipao o que ocorrer, mas possvel dizer o que pode ocorrer.
H numerosos exemplos de tais situaes no campo dos negcios e do governo. A previso
da procura de um novo produto, o clculo dos custos da produo, a previso das safras,
a compra de aplices de seguros, a avaliao da reduo de impostos sobre a inflao. As
probabilidades so teis pois ajudam a desenvolver estratgias.
O ponto central em todas as situaes a possibilidade de quantificar quo provvel
determinado evento.
As probabilidades so utilizadas para exprimir a chance de ocorrncia de determinado
evento. O estudo das probabilidades importante pois elas so a base para o estudo
estatstico.

8.1 Experimento aleatrio


Experimentos aleatrios so aqueles que, mesmo repetidos vrias vezes sob condies
semelhantes, apresentam resultados imprevisveis.
Caractersticas dos experimentos aleatrios:
1. Podem ser repetidos indefinidamente sob as mesmas condies.
2. No se pode adiantar um resultado particular, mas pode-se descrever todos os

resultados possveis
3. Se

repetidos muitas vezes apresentaro uma regularidade em termos de


freqncia de resultados.

Exemplos : lanamento de uma moeda, lanamento de um dado, aposta na loteria, ....

Ao descrever um experimento aleatrio deve-se especificar no somente que operao ou


procedimento deva ser realizado, mas tambm o que dever ser observado. (Note a diferena
entre o 2 o e o 3 o )

Joga-se um dado e observa-se o nmero obtido na face superior.

Joga-se uma moeda 4 vezes e o observa-se o nmero de caras obtido.

Prof. Cntia Paese Giacomello

33

Joga-se uma moeda 4 vezes e observa-se a seqncia de caras e coroas.

Um lote de 10 peas contm 3 defeituosas. As peas so retiradas uma a uma


(sem reposio) at que a ltima defeituosa seja encontrada. Conta-se o
nmero de peas retiradas.

Uma lmpada nova ligada e observa-se o tempo gasto at queimar.

Lana-se uma moeda at que ocorra uma cara e conta-se ento o nmero de
lanamentos necessrios.

Lanam-se dois dados e anota-se o total de pontos obtidos.

Lanam-se dois dados e anota-se o par obtido.

8.2 Espao amostral


O espao amostral (S) de um experimento aleatrio o conjunto de todos os possveis
resultados do experimento.
n(S) o nmero de elementos do conjunto S, ou o nmero de resultados possveis.

Exemplo : um experimento o lanamento de uma moeda. Os possveis resultados so


cara ou coroa, ento, S={cara, coroa}.
Em dois lanamentos de uma moeda, sendo interessante observar a ordem dos resultados,
os possveis resultados so: 1) cara e cara, 2) cara e coroa, 3) coroa e cara e 4) coroa e
coroa. O espao amostral S={(Ca,Ca), (Ca,Co), (Co,Ca) e (Co,Co)}. n(S)=4

8.3 Eventos
Chama-se de evento qualquer subconjunto do espao amostral S de um experimento
aleatrio, ou seja, qualquer resultado do espao amostral.
n(A) o nmero de resultados associados ao evento A.

Exemplo : no lanamento de uma moeda S={cara, coroa}. Um evento de interesse A pode


ser obter cara no lanamento de uma moeda e n(A)=1.
No lanamento de um dado, o evento de interesse (A) pode ser obter face par e n(A)=3.

8.4 A probabilidade de um evento


Seja A um evento. A probabilidade deste evento ocorrer dada por P(A), que um
nmero entre 0 e 1. Quanto mais prxima a probabilidade estiver de 1, maior ser sua
chance de ocorrncia. A um evento impossvel atribui-se probabilidade 0, enquanto que
um evento certo tem probabilidade 1.
H trs maneiras diferentes de calcular ou estimar probabilidades: o mtodo clssico,
quanto o espao amostral tem resultados igualmente provveis. O mtodo emprico, que
Prof. Cntia Paese Giacomello

34

se baseia na freqncia relativa de ocorrncia de um evento num grande nmero de


provas repetidas e o mtodo subjetivo, que utiliza estimativas pessoais de probabilidade,
baseadas num certo grau de crena. Em geral vamos utilizar o mtodo clssico de clculo
de probabilidades.

Quando os resultados so equiprovveis, a probabilidade de cada resultado funo do


nmero de resultados possveis:

P( A ) =

nmero de resultados associados ao evento A


nmero total de resultados possveis

Exemplo:
Experimento: lanar um dado e observar a face superior
Espao amostral: S={1,2,3,4,5,6}

n(S)=6

Evento A: face par

n(A)=3

P(A)= 3/6 = = 0,5 ou 50%

OBS: existe uma pequena diferena entre probabilidade e chance de um evento. A probabilidade
relaciona o nmero de resultados de A com o nmero de resultados total, enquanto que chance
compara o nmero de resultados de A com o nmero de resultados de outro evento (B ou C).
Em uma urna com 5 bolas brancas, 3 vermelhas e 2 azuis,
A probabilidade de selecionar uma bola branca P(branca)=5/10=0,5 ou 50%
E a chance de selecionar uma bola branca 5:5, que semelhante a 1:1, o que significa que existe a
mesma chance de retirar uma bola branca ou uma bola de outra cor.

Exerccios:
1. Escreva o espao amostral no lanamento de um dado. Ache a probabilidade
associada a cada evento.

2. Extrai-se uma carta de um baralho de 52 cartas. Determine a probabilidade de:


a) um valete
b) uma carta vermelha
c) um dez de paus
d) uma figura
e) uma carta de ouros
f) um nove vermelho

Prof. Cntia Paese Giacomello

35

3. Complete a tabela com os valores calculados da probabilidade dos eventos


ocorrerem
Experimento

Evento

Lanar uma moeda uma vez

Cara

Lanar um dado uma vez


Extrair uma carta de um baralho com
52 cartas
Extrair uma carta de um baralho de 52
cartas

P(Evento)

Face 3
6 vermelho
Valete de ouros

4. Encontre n(S), n(A) e P(A) no lanamento de dois dados


Experimento: Lanar dois dados e observar a seqncia dos resultados
S={(1,1), (1,2), (1,3),.....,(6,4),(6,5),(6,6)}
N(S)=36

a. A: apaream faces iguais

b. A: a segunda face o dobro da primeira

c. A: apaream somente nmeros mpares

d. A: apaream faces iguais ou a segunda face o quadrado da primeira

e. A: a soma das faces igual a 7

5. H 50 bolas numa urna: 20 azuis, 15 vermelhas, 10 pretas e 5 verdes. Misturam-se


as bolas. Determine a probabilidade da bola escolhida ser:
a) Verde
b) Azul
c) Verde ou azul
d) No-vermelha
e) Vermelha ou verde
f) Amarela
g) No-amarela

Prof. Cntia Paese Giacomello

36

6. Um motorista tem uma marca num de seus pneus, e 20% do pneu visvel. Ao
parar, qual a probabilidade da marca ficar na parte visvel?

7. Um motor tem 6 velas, e uma est defeituosa, devendo ser substituda. Duas esto
em posio de difcil acesso, o que torna difcil a substituio.
a) Qual a probabilidade de a vela defeituosa estar em posio difcil?
b) Qual a de no estar em posio difcil?

8. Os dados compilados pela gerncia de um supermercado indicam que 915 dentre


1500 clientes compradores de domingo gastam mais de R$ 40,00 em suas compras.
Estime a probabilidade de um comprador em qualquer domingo gastar mais de R$
40,00.

9. Uma pesquisa de trfego levada a efeito das 5 s 6 horas da manh num trecho de
uma rodovia federal revelou que, de 200 carros que pararam para uma verificao
rotineira de segurana, 25 tinham pneus em ms condies. Estime a probabilidade
de um carro que pare naquele trecho ter seus pneus em boas condies

8.5 Clculo das probabilidades


Muitas aplicaes da estatstica exigem a determinao da probabilidade de combinaes
dos eventos. H duas caractersticas de combinaes. Pode ser necessrio determinar a
probabilidade de ambos os eventos acontecerem P(A e B) ou a probabilidade de um deles,
A ou B, ou seja, P(A ou B).

Em um prdio com 2 elevadores, poderamos perguntar: Qual a probabilidade de ambos


elevadores estarem em servio? Ou ento, Qual a probabilidade de um ou outro elevador
estar em servio?

Ambos implica P(A e B)


Um ou outro implica P(A ou B)

Prof. Cntia Paese Giacomello

37

Regra da adio:
A regra da adio leva em conta a ocorrncia do evento A ou do evento B ou de ambos os
eventos e denotada por P(AB).

P(A ou B) = P(A) + P(B) P(A e B)


Quando os eventos so mutuamente excludentes (no tem elementos em comum), ento a
probabilidade de ambos nula e o termo P(A e B) ser zero.
Se A e B so mutuamente excludentes  P(A ou B) = P(A) + P(B)

OBS: Para apresentar os eventos utilizam-se os Diagramas de Venn [apresentados por John Venn
(1834-1923)], que representam os espaos amostrais e os eventos como crculos, quadrados, ou outra
figura geomtrica conveniente.

Exerccios:
1. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso.
Qual a probabilidade do nmero ser par ou maior que 4?

2. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso.
Qual a probabilidade do nmero ser um nmero primo ou maior que 8?

Prof. Cntia Paese Giacomello

38

Regra da multiplicao
Considerando-se dois eventos A e B de um mesmo espao amostral, a probabilidade de A e
B ocorrerem P(AB) dada por:

A probabilidade de A e B igual probabilidade de A, dado B, vezes


a probabilidade de B.
P(A e B) = P(A|B) P(B)
Onde P(A|B) a probabilidade de A ocorrer dado que B tenha ocorrido.

Quando a probabilidade de B ocorrer no depender de A ter ocorrido, dizemos que A e B


so independentes, e P(B| A)=P(B)
Se A e B so independentes  P(A e B)=P(A)P(B)

Exemplo 1: Deve-se inspecionar uma grande caixa de peas. Os registros indicam que 2%
das caixas acusam contedo inferior ao estipulado. Escolhidas duas caixas aleatoriamente,
qual a probabilidade de ambas acusarem contedo inferior, admitindo-se que a remessa
inspecionada semelhante as anteriores (isto , 2% de deficientes)?
P(ambas deficientes)=P(deficiente)P(deficiente)
=0,02 x 0,02
=0,0004 ou seja, 0,04% de probabilidade das caixas serem defeituosas.

Exemplo 2: Suponha que 20 canetas esto expostas numa papelaria. Seis so vermelhas e
14 azuis. Do conjunto de 20, iremos escolher 2 canetas aleatoriamente. Qual a
probabilidade de que as duas canetas selecionadas sejam vermelhas?
Neste caso os eventos no so independentes, pois a cor da primeira caneta
selecionada vai determinar a probabilidade da segunda caneta ser vermelha.
Seja

A=a segunda caneta selecionada vermelha


B=a primeira caneta selecionada vermelha

5 6 30
=
= 0,0789
19 20 380

Desejamos P(A e B) = P(A|B) P(B) =

Prof. Cntia Paese Giacomello

39

Regras de probabilidade
P(A ou B), Para eventos no mutuamente excludentes:
P(A ou B ou ambos) = P(A) + P(B) P(A e B)
para eventos mutuamente excludentes:
P(A ou B) = P(A) + P(B)
para eventos independentes:

P(A e B),

P(A e B) = P(A) . P(B)


Para eventos dependentes
P(A e B) = P(B).P(A/B) ou P(A).P(B/A)

Outra forma de apresentar os eventos atravs de tabelas de contingncia (tabelas com


cruzamento de classificaes).
Por exemplo:
Vermelha

Preta

Totais

No s

24

24

48

Totais

26

26

52

Exerccios
1. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, sem
reposio, determine a probabilidade de retirar a primeira azul e a segunda
vermelha.

2. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, com
reposio, determine a probabilidade de retirar a primeira azul e a segunda
vermelha.

3. Em um lote de 12 peas, quatro so defeituosas. Retira-se uma pea e inspecionase. Qual a probabilidade:
a. Da pea ser defeituosa
b. Dela no ser defeituosa

Prof. Cntia Paese Giacomello

40

4. Uma loja dispe de pneus novos e recapados. Entre 100 pneus, sabe-se que 30 so
recapados.
a. Se um cliente levar um pneu, qual a probabilidade de que ele seja recapado?
b. Se um cliente levar dois pneus, qual a probabilidade de que ambos sejam
recapados?

c. Se um cliente levar 4 pneus, qual a probabilidade de que todos sejam


recapados?

5. Um dado lanado 3 vezes. Calcule a probabilidade de que se obtenha face 6 nos 3


lanamentos.

6. Uma urna contm 50 bolas numeradas de 1 a 50. Sero selecionadas 5 bolas, sem
reposio. Qual a probabilidade de que uma pessoa que tenha feito um jogo
anotando os 5 nmero acerte todos?

Prof. Cntia Paese Giacomello

41

7. Nos ltimos anos, as empresas de cartes de crdito intensificaram esforos no


sentido de abrir mais contas para alunos de faculdade. Suponha que uma amostra
de 200 alunos em sua faculdade apresentou as seguintes informaes em termos
de o aluno possuir carto de crdito bancrio e/ou carto de crdito de viagem e
entretenimento:
CC de viagem e entretenimento

CC bancrio

Totais

Sim

No

Sim

60

60

120

No

15

65

80

Totais

75

125

200

a. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o


aluno possua um carto de crdito bancrio?

b. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o


aluno no possua um carto de crdito bancrio?

c. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o


aluno possua um carto de crdito bancrio e um carto de viagem e
entretenimento?

d. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o


aluno no possua um carto de crdito bancrio nem carto de viagem e
entretenimento?

e. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o


aluno possua um carto de crdito bancrio ou possua um carto de viagem
e entretenimento?

f.

Suponha que um aluno possui um carto de crdito bancrio. Qual a


probabilidade de que ele possua um carto de viagem e entretenimento?

g. Suponha que o aluno no possui um carto de viagem e entretenimento.


Qual a probabilidade de que ele ou ela possua um carto de crdito
bancrio?

h. Os dois eventos, possuir um carto de crdito bancrio e possuir um carto


de viagem e entretenimento, so estatisticamente independentes? Explique.

Prof. Cntia Paese Giacomello

42

9 Distribuies de probabilidade
O histograma usado para apresentar
observaes extradas de uma populao)

dados

amostrais

(Amostra=conjunto

de

Por exemplo, 50 valores de satisfao dos clientes so interpretados como uma amostra
da satisfao de todos os clientes.
O uso de mtodos estatsticos permite que se analise essa amostra e se tire alguma
concluso sobre a satisfao dos clientes.
Uma distribuio de probabilidade um modelo matemtico que relaciona um certo valor
da varivel em estudo com a sua probabilidade de ocorrncia.

H dois tipos de distribuio de probabilidade


1. Distribuies Contnuas: Quando a varivel que est sendo medida expressa
em uma escala contnua, como por exemplo, o peso de peas produzidas, dimetro, etc.
2. Distribuies Discretas: Quando a varivel que est sendo medida s pode
assumir certos valores, como por exemplo os valores inteiros 0, 1, 2, etc.

No caso de distribuies discretas, a probabilidade que a varivel


especfico x o dada por:
P {X = x o } = P(x o )

assuma um valor

No caso de variveis contnuas, as probabilidades so especificadas em termos de


b
intervalos: P a x b = a f ( x ) dx

Relembrando: uma varivel aleatria uma funo com valores numricos, cujos
valores so determinados por fatores de chance.
Uma varivel aleatria considerada discreta se toma valores que podem ser
contados.
Uma varivel aleatria considerada contnua quando pode tomar qualquer valor
em determinado intervalo.

Prof. Cntia Paese Giacomello

43

Os grficos a seguir apresentam exemplos de distribuies de probabilidades discreta e


contnua.

Exemplo:
Distribuio de probabilidade para a varivel aleatria nmero de caras em duas jogadas
de uma moeda.

Nmero de
caras
Valor da V.A.

Prob. do
resultado

Nmero de
caras
Valor da V.A

Prob. do
resultado

Cara

x =

Cara Coroa

x =
1

+ =

Coroa Cara

x =

Coroa Coroa

x =

Resultado
Cara

Soma = 1

Soma = 1

O valor esperado, ou esperana matemtica, de uma varivel aleatria E(x), que consiste
no valor esperado para ela, ou seja, o valor mdio da varivel.
n

E( x ) =

px
i

se X v.a. discreta

i =1

ou

E( X) =

x. f(x) dx

se X v.a. contnua

E a varincia de X dada por Var( X ) = E( X 2 ) [E( X )]2 .


O desvio padro

Prof. Cntia Paese Giacomello

Var ( X)
44

Neste exemplo, o valor esperado 0 . + 1 . + 2 . = 1.


E a varincia Var(X)=E(X 2 )-[E(X)] 2 = E(X 2 ) - 1= (0 2 . + 1 2 . + 2 2 .) 1 =1,5-1=0,5 E
o desvio padro = 0,71

Exemplo: um investidor julga que tem 0,4 de probabilidade de ganhar $ 25.000 e 0,6 de
perder $ 15.000. Seu ganho esperado de:
E(X) = 0,4 (25.000) + 0,6 (-15.000) = $ 1.000.
E a varincia Var(X)=E(X 2 )-[E(X)] 2
= E(X 2 ) 1.000 2
=(0,4.25.000 2 + 0,6.(-15.000) 2 )-1.000 2
=(0,4 x 625.000.000 + 0,6 x 225.000.000)-1.000 2
= 250.000.000+ 135.000.000 1.000 2
= 385.000.000 1.000.000
= 384.000.000
Desvio padro = $ 19.595,92

Exerccios:
1. O nmero de chamadas telefnicas recebidas por uma mesa e suas respectivas
probabilidades para um intervalo de 3 minutos so:
Nmero de chamadas

Total

Freqncia relativa

0,60

0,20

0,10

0,04

0,03

0,03

1,00

Em mdia, quantas chamadas podem ser esperadas num intervalo de trs minutos?

2. Um bilhete de loteria tem 0,00001 de chance de dar um prmio de $ 100.000,


0,00002 de chance de dar um prmio de $ 50.000 e 0,004 de chance de um prmio
de $ 25. Qual seria o preo justo de venda do bilhete?

3. Uma confeitaria estabeleceu um registro de vendas para certo tipo de bolo.


Determine o nmero esperado de bolos encomendados.
N bolos/dia

Total

Freqncia relativa

0,02

0,07

0,09

0,12

0,20

0,20

0,18

0,10

0,01

0,01

1,00

Prof. Cntia Paese Giacomello

45

9.1.1 Distribuies discretas mais importantes


As principais distribuies discretas so a Distribuio de Bernoulli, Distribuio
Binomial e Distribuio Poisson.

Distribuio de Bernoulli
A distribuio de Bernoulli consiste em uma distribuio adequada varivel aleatria de
Bernoulli, que por sua vez uma v.a. que assume apenas os valores 0 e 1, com funo de
probabilidade tal que:
P(0) = P(X=0) = 1- p
P(1) = P(X=1) = p

Ento, E(X)= p e Var(X)= p (1- p )

Distribuio Binomial
Seja um processo composto de uma seqncia de observaes independentes, onde o
resultado de cada observao pode ser um sucesso ou uma falha.
Se a probabilidade de sucesso constante e igual a p, a distribuio do nmero de
sucessos seguir o modelo Binomial.
A distribuio Binomial usada com freqncia no controle de qualidade. o modelo
apropriado quando a amostragem feita sobre uma populao infinita ou muito grande.

A distribuio binomial possui quatro propriedades essenciais:


1. As observaes possveis podem ser obtidas atravs de dois diferentes
mtodos de amostragem. Cada observao pode ser considerada como se
tivesse sido selecionada a partir de uma populao infinita sem reposio ou
a partir de uma populao finita com reposio.
2. Cada observao pode ser classificada em uma de duas categorias
mutuamente excludentes e coletivamente exaustivas, usualmente chamadas
sucesso ou falha.
3. A probabilidade de uma observao ser classificada como sucesso ( p )
constante de observao para observao. Assim sendo, a probabilidade de
fracasso 1-p tambm constante.
4. O resultado (isto , sucesso ou fracasso) de qualquer observao
independe do resultado de qualquer outra observao.

Em aplicaes de controle da qualidade, x em geral representa o nmero de defeituosos


observados em uma amostra de n itens.
Prof. Cntia Paese Giacomello

46

n
P ( x ) = p x (1 p ) n x
x
onde

n
n!
=
x ! ( n x )!
x

n
representa o nmero de combinaes de n objetos tomados x de cada vez
x
P(X) = probabilidade de X sucessos uma vez que n e p so conhecidos
n = tamanho da amostra
p = probabilidade de sucesso

1-p = probabilidade de falha

X = nmero de sucessos na amostra (X=0, 1, 2, ..., n)


A mdia de uma varivel aleatria com distribuio binomial

= np

dada por 2 = np(1-p) onde p proporo de sucessos na amostra p =

e a varincia

x
n

Exemplo:
Um processo industrial opera com mdia de 1% de defeituosos. Baseado em amostras de
100 unidades, calcule as probabilidades de uma amostra apresentar 0 , 1 , 2 , 3 e 4
defeituosos. Plote a distribuio de probabilidade correspondente.
Como a varivel aleatria pode apresentar apenas duas possibilidades, ser boa ou
defeituosa, a distribuio que melhor se ajusta a distribuio binomial, com
parmetros p=0,01 e n=100.
Ento, a probabilidade de uma amostra de tamanho n = 100 apresentar 0
defeituosos

n
100
0 ,010 (1 0 ,01)100 0 = 0,366
P( x ) = p x (1 p)n x  P(x=0) = P(0) =
x
0
P(x=1) = P(1) =

100 1
0,01 (1 0,01)1001 = 0,370
1
100

0,012 (1 0,01)100 2 = 0,185


P(x=2) = P(2) =
2
100

0,01 (1 0,01)
P(x=3) = P(3) =
3
3

100 3

= 0,061

100

0,014 (1 0,01)100 4 = 0,015


P(x=4) = P(4) =
4

Prof. Cntia Paese Giacomello

47

0,4

P(x)

0,3
0,2
0,1
0
x=0

x=1

x=2

x=3

x=4

Exerccios:
1. Um processo opera segundo uma chance de falha de 2%. Coletando amostras de 25
unidades, qual a probabilidade de uma amostra selecionada apresentar 2
defeituosos ou menos.

2. Imagine que para o processo anterior, fossem coletadas amostras de 50 unidades e


o critrio para parar o processo e procurar causas especiais fosse X=1 ou mais.
Calcule a percentagem de vezes que o processo seria interrompido logo aps a
amostragem.

Distribuio de Poisson

A aplicao tpica da distribuio de Poisson no controle da qualidade como um modelo


para o nmero de defeitos (no-conformidades) que ocorre por unidade de produto (por
m 2 , por volume ou por tempo)
Diz-se que existe um processo de Poisson se pudermos observar eventos discretos numa
rea de oportunidade um intervalo contnuo (de tempo, de comprimento, de rea, ...) de
maneira tal que, se encurtarmos a rea de oportunidade ou intervalo suficientemente:
1. A probabilidade de se observar exatamente um sucesso no intervalo
estvel
Prof. Cntia Paese Giacomello

48

2. A probabilidade de se observar mais de um sucesso no intervalo zero


3. A ocorrncia de um sucesso em qualquer intervalo estatisticamente
independente da ocorrncia em qualquer outro intervalo

A distribuio de Poisson tem um parmetro (lambda) que a mdia ou o nmero


esperado de sucessos por unidade. A varincia desta distribuio 2 = . O nmero de
sucessos X da varivel aleatria de Poisson varia de 0 a .

A expresso matemtica para a distribuio de Poisson para se obterem X sucessos, dado


que sucessos so esperados :

P( x ) =
onde

e x
onde x=0,1,2,....
x!

P(X) = probabilidade de X sucessos, dado o conhecimento de


= nmero esperado de sucessos

e = constante matemtica (aproximadamente 2,71828)


X = nmero de sucessos por unidade

Exemplo:
Suponha que o nmero de defeitos no cordo de solda de uma carroceria siga uma
distribuio de Poisson com = 2.
Ento a probabilidade de uma carroceria apresentar mais de 3 defeitos ser:
P(X> 3) = 1 P(x 3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)]
Onde P( x ) =

e x
x!

P(0) =

e 2 2 0
= 0,135
0!

e 2 21
P(x=1) = P(1) =
= 0,271
1!
P(x=2) = P(2) = 0,271

P(x=3) = P(3) = 0,180

Logo,
P(X> 3)

= 1 P(x 3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)]


= 1 [0,135+0,271+0,271+0,180]
= 1 [0,857]
=0,143  14%

A probabilidade de uma carroceria apresentar mais de trs defeitos 14%.

Exemplo 2:
Prof. Cntia Paese Giacomello

49

Se chegam em mdia 2 carros por minuto em um posto de gasolina, qual a probabilidade


de que cheguem exatamente 5 carros em dois minutos?
Neste caso o tempo diferente do tempo correspondente ao . Ento deve-se transformar
o para que ele corresponda ao tempo de 2 minutos. Chegam em mdia 2 carros por
minuto  chegam em mdia 4 carros em 2 minutos
=4

e x
P( x ) =
x!

e 4 45
P (5) =
= 0,1563 = 15,63%
5!

Exerccios:
1. O setor financeiro de uma loja de departamentos est tentando controlar o nmero
de erros cometidos na emisso das notas fiscais. Suponha que esses erros sigam o
modelo de Poisson com mdia = 0,03. Qual a probabilidade de uma nota
selecionada ao acaso conter 1 ou mais erros?

2. Em uma indstria automotiva, defeitos superficiais de pintura ocorrem a uma taxa


de 0,15 defeitos/unidade. Encontre a probabilidade que uma unidade escolhida ao
acaso apresente 1 ou mais defeitos superficiais.

3. Em uma empresa industrial ocorrem, em mdia, 3 acidentes por ms. Qual a


probabilidade de que em um determinado ms, ocorra apenas um acidente?

4. Dez por cento das ferramentas produzidas por um certo processo de fabricao
revelaram-se defeituosas. Determinar a probabilidade de, em uma amostra de 10
ferramentas escolhidas ao acaso, exatamente duas serem defeituosas mediante o
emprego da distribuio de Poisson.

5. Se a probabilidade de um indivduo sofrer uma reao nociva, resultante da injeo


de um determinado soro 0,001, qual a probabilidade de, entre 2000 indivduos,
a) exatamente 3 sofrerem aquela reao? b) Mais de 2 sofrerem a reao?

Prof. Cntia Paese Giacomello

50

9.1.2 Distribuies contnuas


A distribuio mais importante e mais utilizada na prtica a Distribuio Normal.
Outros modelos importantes de distribuies contnuas so: Uniforme, Exponencial, Gama,
Qui-Quadrado, t de Student e F de Snedecor.

Distribuio Normal
A Distribuio Normal essencialmente importante na estatstica por trs razes
principais:
1. Inmeros fenmenos contnuos parecem segu-la ou podem ser aproximados por
meio dela
2. Podemos utiliz-la para aproximar vrias distribuies de probabilidade discretas
3. Ela oferece a base para a inferncia estatstica clssica, devido sua afinidade
com o teorema do limite central

Os parmetros da distribuio Normal so a mdia e o desvio padro. Trata-se de uma


distribuio simtrica, unimodal, em forma de sino.

A funo de probabilidade da distribuio normal dada por:

f ( x) =

onde:

exp

1 x

e = constante matemtica (aproximada por 2,71828)


= constante matemtica (aproximada por 3,14159)
= mdia aritmtica da populao
= desvio padro da populao

X = qualquer valor da varivel aleatria contnua onde - < X <

Prof. Cntia Paese Giacomello

51

99,73%
95,44%
68,26%

-1 +1
-2

+2

-3

+3

Para simplificar a notao de uma v.a.c. com distribuio normal, com mdia e varincia
2
utiliza-se:
X~ N( , 2 )
A distribuio Normal acumulada obtida calculando a probabilidade de X ser menor que
um dado valor a :
a

P( x a) = F(a) =

f (x)dx

 Funo densidade acumulada

Essa integral no pode ser resolvida em forma fechada, mas a soluo est apresentada
em tabelas onde se entra com a varivel reduzida ou varivel padronizada Z e
encontra-se F(Z) ou vice-versa.

P( x a) = P Z
= F(Z )

Valor tabelado (Procurar na tabela da distribuio Normal padronizada)

Prof. Cntia Paese Giacomello

52

Exemplo:
O peso de um produto uma caracterstica muito importante. Sabe-se que o peso segue
um modelo normal com mdia 1000 gramas e desvio padro 40 gramas. Se a especificao
tcnica estabelece que o peso deve ser maior que 950 gramas, qual a probabilidade de
que um pacote selecionado aleatoriamente satisfaa a especificao?
OBS: este esquema equivale

P(x>950) = P Z >

Tabelado

950 1000
= P(Z > 1,25) = 0,3944 + 0,5000 = 0,8944
40

X=950 =1000
=40

Z=-1,25 =0
=1

A probabilidade de que um pacote selecionado aleatoriamente satisfaa a especificao


de 89%.

Exemplo 2: Sabe-se que X representa medies feitas em um processo que segue o


modelo Normal com mdia 100 e desvio padro 10. Se forem feitas 4000 medies,
quantas estaro entre 95 e 112?

112 100
95 100
<Z<

10
10

P(95<x<112)= P
= P(-0,5<Z<1,2)
=0,1915+0,3849

Valores tabelados

=100
=10

=0,5764  Aproximadamente 58% estaro entre 95 e 112.

Se forem feitas 4000 medies, aproximadamente 2305 estaro entre 95 e 112. (4000 x
57,64%)

Prof. Cntia Paese Giacomello

53

Exerccios:
1. A resistncia trao do papel usado em sacolas de supermercado uma
caracterstica de qualidade importante. Sabe-se que essa resistncia segue um
modelo Normal com mdia 40 psi e desvio padro 2 psi. Se a especificao
estabelece que a resistncia deve ser maior que 35 psi, qual a probabilidade que
uma sacola produzida com este material satisfaa a especificao?

2. O dimetro do eixo principal de um disco rgido segue a distribuio Normal com


mdia 25,08mm e desvio padro 0,05mm. Se as especificaes para esse eixo so
25,00 0,15mm (isto , varia de 24,85 a 25,15mm), determine o percentual de
unidades produzidas em conformidades com as especificaes.

3. A resistncia trao de isoladores cermicos apresenta distribuio Normal com


mdia 95 Kg e desvio padro 4 Kg. Se so produzidas 10.000 unidades desses
isoladores, quantos apresentaro resistncia inferior a 85 Kg?
E quantos
apresentaro resistncia superior a 90 Kg?

4. A sada de uma bateria segue o modelo Normal com mdia 12,15 V e desvio padro
0,2 V.
0,5 V.

Encontre o percentual que ir falhar em atender s especificaes 12 V

Prof. Cntia Paese Giacomello

54

5. A vida til de lavadora de pratos automticas de 1,5 anos, com desvio padro 0,3
anos. Se os defeitos se distribuem normalmente, qual a probabilidade de uma
lavadora necessitar conserto antes de expirar o perodo de 1 ano de garantia?

6. O tempo necessrio, em uma oficina, para o conserto de transmisso para certo


carro normalmente distribudo com mdia 45 min e desvio padro 8 min. O
mecnico planeja comear o conserto do carro 10 min aps o cliente deix-lo na
oficina, comunicando que o carro estar pronto em 1 h. Qual a probabilidade de
que o cliente tenha que esperar caso o mecnico esteja enganado e o cliente fique
esperando?

7. Sabe-se que o contedo de uma lata de cerveja 350 ml e que tem distribuio
aproximadamente normal com mdia 350 ml e desvio padro 10 ml.
a. Que % de latas tem menos que 345 ml de contedo?
b. Que % de latas tem mais que 360 ml de contedo?

8. Uma fbrica de pneus fez um teste para medir o desgaste de pneus e verificou que
ele seguia o comportamento de uma curva normal com mdia 48.000 km e desvio
padro de 2.000 km. Calcule a probabilidade de um pneu escolhido ao acaso:
a. Dure mais que 47.000 km?
b. Dure entre 45.000 e 51.000 km?
c. At que quilometragem duram 90% dos pneus?

9. Descreva um exemplo de aplicao da distribuio normal na sua profisso. Qual


seria a mdia dos dados e o desvio padro?

Prof. Cntia Paese Giacomello

55

1 0 T e o r i a e l e m e n t a r d a a m o s t r a g em
A teoria da amostragem o estudo das relaes existentes entre uma populao e as
amostras dela extradas. muito utilizada para a estimao das grandezas desconhecidas
da populao ( parmetros ) atravs de conhecimento das grandezas correspondentes nas
amostras ( estatsticas amostrais ).
A teoria da amostragem tambm til para determinar se as diferenas observadas entre
duas amostras so devidas a uma variao casual ou so verdadeiramente significativas.
Por exemplo: queremos testar se os tempos de processamento da matria prima de dois
sistemas de produo so diferentes ou no. A resposta a esta questo implica o uso de
testes de hiptese, que ser visto mais adiante.
Denomina-se inferncia estatstica a inferncia de parmetros (da populao) com base
nos resultados obtidos na amostra.
Para que as concluses sejam vlidas, necessrio que a amostra selecionada seja
representativa da populao. Para isso podem ser utilizados os mtodos de amostragem
probabilsticos apresentados no captulo 1: aleatria, sistemtica, estratificada ou por
conglomerados. O mtodo mais utilizado o por amostragem aleatria.

10.1 Amostragem com e sem reposio


Quando selecionamos uma amostra devemos analisar se esta amostragem com ou sem
reposio. Na amostragem com reposio o mesmo elemento pode ser escolhido mais de
uma vez. Na amostragem sem reposio cada elemento s pode ser selecionado uma nica
vez.
Exemplo: uma urna contm dez bolas, numeradas de 0 a 9. Retira-se a primeira bola,
anota-se o nmero, 3 por exemplo, e no se recoloca a bola na urna. Os outros nmeros
que podem ser sorteados so 0, 1, 2, 4, 5, 6, 7, 8 e 9. Este sistema o sistema sem
reposio. Entretanto, se tivssemos recolocado a bola 3 na urna, ento todos os nmeros
poderiam ser selecionados na segunda extrao, inclusive o 3. Este sistema chamado
sistema com reposio.
Em geral, quando uma amostragem sem reposio, dizemos que a populao finita.
Quando uma amostragem com reposio, ento dizemos que a populao infinita, pois
a populao nunca ser exaurida. Para fins prticos a amostragem de uma populao finita
muito grande pode ser considerada infinita.

10.2 Distribuies amostrais


Consideremos todas as amostras possveis de tamanho n que podem ser retiradas de uma
populao dada (com ou sem reposio). Para cada amostra podemos calcular uma
grandeza estatstica, por exemplo, a mdia. Deste modo obtemos a distribuio amostral
da mdia. Da mesma forma podemos calcular a distribuio amostral do desvio padro, da
varincia, das propores, ...
Prof. Cntia Paese Giacomello

56

Distribuio amostral das mdias


Uma distribuio amostral de mdias uma distribuio de probabilidade que indica quo
provveis so diversas mdias amostrais. A distribuio funo da mdia, do desvio
padro da populao e do tamanho da amostra. Para cada combinao da mdia, desvio
padro e tamanho da amostra haver uma nica distribuio amostral de mdias.

Sejam:

x = mdia da populao =

x = mdia da distribuio amostral


x = desvio padro da populao =

x = desvio padro da distribuio amostral


N = tamanho da populao
n = tamanho da amostra

Admita-se que todas as amostras possveis de tamanho n sejam retiradas de uma


populao finita de tamanho N>n. Ento:
Populao Finita:

x =

x =

Nn
N 1

Se a populao for infinita, ou se amostragem for tomada com reposio, os resultados


sero:
Populao Infinita:

x =

x =

A frmula do desvio padro nos diz que a quantidade de disperso na distribuio amostral
depende de dois fatores:
-

a disperso da populao

o tamanho da amostra (utilizando raiz quadrada)

Por exemplo, em qualquer populao, o aumento do tamanho das amostras extradas


resultar em menor variabilidade entre as possveis mdias amostrais. E se o mesmo
tamanho de amostra usado com diferentes populaes, as populaes com maior
quantidade de disperso x tendero a gerar maior quantidade de variabilidade entre as
mdias de amostras extradas delas.

Para amostras grandes n>30 a distribuio amostral das mdias aproximadamente


normal, com mdia

e desvio padro

x,

independente da populao, desde que a

varincia e a mdia da populao sejam finitas e o tamanho da populao seja, no


mnimo, o dobro da amostra. Este resultado para populao infinita um caso especial do
Prof. Cntia Paese Giacomello

57

teorema do limite central da teoria avanada de probabilidade, que mostra que a preciso
da aproximao melhora quando n cresce. Isto indicado, algumas vezes, dizendo-se que
a populao assintoticamente normal. No caso da populao ser normalmente
distribuda, a distribuio amostral das mdias tambm o ser, mesmo para pequenos
valores de n (n<30).
Teorema do limite central
1. Se a populao sob amostragem tem distribuio normal, a
distribuio das mdias amostrais tambm ser normal para
todos os tamanhos de amostra.
2. Se a populao bsica no normal, a distribuio de mdias
amostrais ser aproximadamente normal para grandes
amostras.

Exemplos:
Calcule o desvio padro da distribuio amostral de mdias onde o desvio padro da
distribuio populacional 2 e o tamanho da amostra 40.

x =

x
n

= 0,3162

40

Determine a mdia das distribuies de mdias amostrais, sendo que a mdia populacional
678.

x = x = 678

A mdia de uma distribuio amostral de mdias 50 e seu desvio padro 10 (desvio


padro da distribuio amostral das mdias). Suponha normal a distribuio amostral.
Que percentagem das mdias amostrais estar entre 45 e 55?
O procedimento anlogo ao visto no captulo referente distribuio normal,
entretanto deve-se utilizar o valor de x = 50 e x =10.
Ento P(45< x <55)=0,3830

Um fabricante de baterias alega que seu artigo de primeira categoria tem uma vida
esperada (mdia) de 50 meses. Sabe-se que o desvio padro correspondente de 4
meses. Que percentagem de amostras de 36 observaes acusar vida mdia no intervalo
de 1 ms em torno de 50 meses, admitindo ser de 50 meses a verdadeira vida mdia das
baterias?
Sabemos que, como n>30, a distribuio das mdias amostrais ser
aproximadamente normal com mdia igual mdia populacional e desvio padro
igual ao desvio padro populacional dividido pela raiz quadrada do tamanho da
Prof. Cntia Paese Giacomello

58

amostra. Alm disso vamos pressupor populao infinita, pois a produo de baterias
no termina (teoricamente!)

???

49

50
Meses

51

A soluo envolve a determinao do nmero de desvios padres que 49 e 51 distam


da mdia (amostral).
Determinemos primeiro o desvio padro da distribuio amostral:

x =

x
n

4
36

= 0,67 para n=36

Ento devemos trabalhar com x N(50;0,67)


P(49< x <51)  z =

xx

49 50
= 1,5
0,67


51 50
= +1,5
0,67

P(49< x <51)=P(-1,5<z<1,5) = 0,4332+0,4332=0,8664


Ento o percentual de amostras que apresentar problemas entre 49 e 51 meses
de 87%.

Prof. Cntia Paese Giacomello

59

Distribuio amostral das propores


Sendo a probabilidade de ocorrncia de um evento p (sucesso) e a probabilidade de no
ocorrncia 1-p (fracasso).
Consideram-se todas as amostras possveis de tamanho n de uma populao infinita e,
para cada amostra, determina-se a proporo de sucessos. Assim obtm-se a distribuio
amostral das propores.
A mdia da distribuio amostral sempre igual proporo p = p onde

p = proporo populacional

= mdia da distribuio amostral das propores

Quando a populao muito grande ou infinita, o desvio padro da distribuio amostral


se calcula

p(1 p)
n

p =

e pode-se fazer uma aproximao para a distribuio normal quando n>30.

Exemplos:
Determine a mdia da distribuio de propores amostrais, quando a proporo na
populao 72,3%

p =p=72,3%

Determine o desvio padro da distribuio amostral de propores para n=100 e uma


proporo populacional de 60%

p =

p(1 p)
=
n

0,6(1 0,6)
= 0,049
100

Verificou-se que 2% das ferramentas produzidas por uma certa mquina so defeituosas.
Qual a probabilidade de que, em uma remessa de 400 dessas ferramentas, 3% ou mais
revelarem-se defeituosas?

p =p=0,02

ep =

p(1 p)
=
n

0,02 * 0,98
= 0,007
400

Como n>30 pode-se utilizar a distribuio normal, ento


P(p>0,03)=P( z >

Prof. Cntia Paese Giacomello

0,03 0,02
) = P(z > 1,43) = 0,07636 = 7,636%
0,007

60

Exerccios:
1. Determine a mdia da distribuio das propores amostrais quando a proporo na
populao ....
a. 30%
b. 99%
c. 54%

2. Calcule o desvio padro da distribuio amostral de mdias para cada um dos


seguintes casos:
a. x =6, n=6
b. x =6, n=20
c. x =6, n=40
d. x =6, n=100

3. Certas vlvulas fabricadas por uma companhia tm vida mdia de 800 horas e
desvio padro de 60 horas. Determinar a probabilidade de uma amostra aleatria
de 16 vlvulas, retiradas do grupo, ter vida mdia a) entre 700 e 810 horas;
b)inferior a 785 horas; c) superior a 820 horas; d) entre 770 e 830 horas.

4. Um fabricante faz a remessa de 1000 lotes de 100 lmpadas eltricas cada um. Se
5% das lmpadas so normalmente defeituosas, em quantos lotes pode-se esperar
que existam; a) menos de 90 lmpadas boas; b) 98 ou mais lmpadas boas

Prof. Cntia Paese Giacomello

61

11 Estimao
A estimao o processo que consiste em utilizar dados amostrais para estimar
parmetros populacionais.
As estatsticas amostrais so utilizadas como estimadores de parmetros populacionais.
Assim, uma mdia amostral usada como estimativa da mdia populacional, a proporo
de defeituosos de uma caixa utilizada para estimar a proporo de defeituosos na
produo toda, etc.
Tais estimativas chamam-se estimativas pontuais, porque originam apenas uma nica
estimativa do parmetro. Em virtude da variabilidade amostral, usual incluir uma
estimativa intervalar para acompanhar a estimativa pontual. Esta nova estimativa
proporciona um intervalo, ou mbito, de possveis valores do parmetro populacional.

Estimativa pontual: estimativa nica de um parmetro populacional


Estimativa intervalar: intervalo de valores possveis, o qual se admite que esteja
contendo o parmetro.

Um intervalo de confiana d um intervalo de valores, centrado na estatstica amostral, no


qual julgamos, com um risco conhecido de erro, estar o parmetro da populao.

Exemplos:
Parmetro
populacional

Tipo de estimativa
Pontual

Intervalar

Mdia

Um carro de motor 1.0 anda, em


mdia, 14 km com um litro de
combustvel

Um carro de motor 1.0 anda, em


mdia, entre 12 e 16 km com 1
litro de combustvel

Proporo

A proporo de peas defeituosas


de 2%

A proporo de peas defeituosas


est entre 1,5 % e 2,5 %

Desvio padro

O desvio padro da temperatura


numa piscina no aquecida da
ordem de 2 o C

O desvio padro da temperatura


numa piscina no aquecida est
entre 1 o C e 3 o C

Os intervalos de confiana podem ser unilaterais (por exemplo, a proporo de defeitos


maior de 3%) ou bilaterais (a proporo de defeitos est entre 2% e 4%).

Prof. Cntia Paese Giacomello

62

A capacidade de estimar parmetros populacionais por meio de dados amostrais est


ligada diretamente ao conhecimento da distribuio amostral da estatstica que est sendo
usada como estimador.
Os intervalos de confiana para os parmetros so construdos de forma que se considera
uma variao em torno do valor amostral e, assim, pode-se escrever que o parmetro
situa-se entre dois limites:

Valor do parmetro = estimativa pontual erro de amostragem


O erro de amostragem depende da distribuio amostral do parmetro, do nvel de
confiana adotado e do tamanho da amostra.
A tabela a seguir apresentada resume as informaes necessrias para intervalos de
confiana.

Populao
Infinita

Finita

Estimativa de mdias
Pontual
Intervalar x conhecido

x desconhecido

xz

xt

x
n
sx
n

xz

xt

sx

Nn
N 1
Nn
N 1

Estimativa das propores


Pontual

Intervalar

p =

pz

x
n

p(1 p)
n

p =

pz

x
n

p(1 p) N n
n
N 1

Onde:
z representa o valor tabelado da distribuio Normal, com nvel de confiana .
t representa o valor tabelado da distribuio t de Student, com nvel de confiana e GL
graus de liberdade1
N o tamanho da populao
n o tamanho da amostra

O valor da distribuio t de Student depende do nmero de graus de liberdade

Prof. Cntia Paese Giacomello

63

Exemplo:
Intervalo de confiana para a mdia quando se conhece a varincia de populao x
Seja uma amostra de tamanho 36 de uma populao infinita, sabe-se que x =3 e x =24,2

Confiana
desejada

Z
(tabelado)

90%

1,65

xz

95%

1,96

xz

99%

2,58

xz

Frmula

Clculo

24,2 1,65

24,2 1,96

24,2 2,58

3
36
3
36
3
36

Intervalo

24,2 0,825

23,375 a 25,025

24,2 0,980

23,220 a 25,180

24,2 1,290

23,110 a 25,690

Tamanho da amostra
Uma das perguntas mais freqentes em estatstica : Qual o tamanho da amostra que
devemos tomar?
O tamanho da amostra depender do grau de confiana desejado (z), da quantidade de
disperso entre os valores individuais ( x ), e de certa quantidade especfica de erro
tolervel (e).
O tamanho da amostra que voc afinal selecionar depender de
seu oramento, da importncia econmica das decises e da
variabilidade na populao. Desses trs problemas, dois so de
ordem gerencial, cabendo a voc a deciso; apenas o terceiro
(variabilidade) est fora do seu controle .(Brenda Landy, citada no
livro Pesquisa de Marketing Naresh Malhotra. - 2001)

A frmula do erro pode ser resolvida em relao a n. Assim, para o caso de estimao de
mdias, tem-se:

e=z

x
n

n=z


n = z x
e

E, para estimao de propores

p(1 p)
e=z
n

Prof. Cntia Paese Giacomello

p(1 p)

e = z

n=

z 2p(1 - p)
e2

64

Que tamanho de amostra ser necessrio para produzir um intervalo de 90% de confiana
para a verdadeira mdia da populao, com erro de 1,0 em qualquer dos sentidos, se o
desvio padro da populao 10?
Sabemos que x =10 e e=1 e queremos um intervalo 90% de confiana para a
mdia, o que implica utilizar um valor de z=1,65.


n = z x
e

10

n = 1,65 = 272,25  tamanho da amostra 273.


1

As companhias de seguro esto ficando preocupadas com o fato de que o nmero


crescente de telefones celulares resulte em maior nmero de colises de carros. Esto, por
isso, pensando em cobrar prmios mais elevados para os motoristas que utilizam celulares.
Desejamos estimar, com uma margem de erro de trs pontos percentuais, a percentagem
de motoristas que falam ao celular enquanto dirigem. Supondo que se pretende um nvel
de confiana de 95% nos resultados, quantos motoristas devem ser investigados?
Suponha que no tenhamos nenhuma informao sobre p.

n=

z 2p(1 - p)

e2

n=

1,96 2 0,5(1 - 0,5)


= 1067,11  tamanho da amostra 1068.
0,032

Exerccios:
1. Os dados a seguir representam a temperatura coletada aleatoriamente em 15
cidades do estado. Determine o intervalo de confiana 90% para a temperatura
mdia. No dispomos da varincia populacional, mas sabemos que a populao
infinita. Dispomos apenas das seguintes informaes.

23

40

30

21

34

20

38

26

23

38

33

32

24

21

24

2. Uma amostra aleatria de 40 contas no comerciais na filial de um banco acusou


saldo mdio dirio de R$ 140 com desvio padro de R$ 30.
a. Construa um intervalo de 90% de confiana para a verdadeira mdia
b. Construa um intervalo de 95% de confiana para a verdadeira mdia
c. Construa um intervalo de 99% de confiana para a verdadeira mdia

Prof. Cntia Paese Giacomello

65

3. Uma firma emprega diversos vendedores. Numa amostra aleatria de 15 notas de


despesa numa semana de dezembro, um auditor constatou uma despesa mdia de
R$ 220, com desvio padro de R$ 20.
a. Qual a estimativa pontual da despesa mdia?
b. Construa um intervalo de 99% de confiana para a quantia de despesa
mdia por vendedor.
c. Admitindo-se 200 vendedores, qual seria a estimativa pontual mdia para o
total de despesas?
d. Construa um intervalo de 99% de confiana para a quantia de despesa total.

4. Uma amostra aleatria de 40 homens trabalhando num grande projeto de


construo revelou que 6 no usavam capacetes protetores.
a. Construa um intervalo de 95% de confiana para a verdadeira proporo dos
que no esto utilizando capacetes neste projeto.
b. Se h 1000 operrios no projeto, converta o percentual em nmero de
capacetes necessrios para que todos estejam seguros.

5. Uma amostra aleatria de 1000 fregueses da parte da manh de um supermercado


revelou que apenas 10 no incluem leite em suas compras.
a. Qual seria a estimativa pontual da percentagem dos que compram leite?
b. Construa um intervalo de 90% de confiana para a verdadeira proporo dos
que compram leite.

6. Qual o tamanho de amostra necessrio para estimar o tempo mdio de que um


vendedor de uma loja de mveis gasta com cada cliente, admitindo erro de 1
minuto, para mais ou para menos, para obter um nvel de confiana de 99%.
Suponha x=12 minutos.

Prof. Cntia Paese Giacomello

66

7. Determine o nmero de observaes necessrio para estimar o tempo mdio de


servio de atendimento a chamadas de um bombeiro hidrulico, se o erro mximo
deve ser de 0,6 hora para um nvel de confiana de 95%, sabendo que o tempo de
atendimento tem um desvio padro de 1 hora. Suponha normalidade na populao.

8. Um engenheiro deseja estimar a quantidade de acar existente nos alimentos


produzidos pela empresa. Ele coletou uma amostra de 18 unidades do alimento e
verificou mdia 24 gr de acar, com desvio padro de 5 gr. Construa o intervalo
de confiana de 90% para a quantidade de acar presente nos alimentos.

9. Numa pesquisa com funcionrios de uma empresa questionou-se a satisfao com a


poltica desenvolvida pela diretoria. De 300 funcionrios, 36 estavam insatisfeitos.
Construa uma estimativa para a proporo de funcionrios insatisfeitos, com 95%
de confiana.

10. O IBOPE est interessado em estimar a proporo de residncias que assistem ao


programa do Fausto. Qual o nmero mnimo de residncias que se deve analisar
para ter 95% de confiana e margem de erro mxima de 0,03 para a estimativa?

Prof. Cntia Paese Giacomello

67

12 Testes de h ipteses
Os testes de hipteses so tambm conhecidos como testes de significncia.
A finalidade dos testes de hipteses avaliar afirmaes sobre os valores de parmetros
populacionais.
Os testes de hipteses e a estimao so dois ramos principais da inferncia estatstica.
Enquanto o objetivo da estimao estimar algum parmetro populacional, o objetivo dos
testes de hipteses decidir se determinada afirmao sobre um parmetro populacional
verdadeira. Por exemplo, podemos querer determinar se so verdadeiras as afirmaes:
-

o tempo mdio de realizao do teste 80 minutos

trs por cento da populao (de determinado item) defeituosa

os percentuais de no conformes dos dois processos so iguais

Utilizam-se duas hipteses, sendo chamadas de hiptese nula (H 0 ) e hiptese alternativa


(H 1 )

A hiptese nula H 0 uma afirmao que diz que o parmetro


populacional tal como especificado (isto , a afirmao
verdadeira)
A hiptese alternativa H 1 uma afirmao que oferece uma
alternativa alegao (isto , o parmetro maior (ou menor)
que o valor alegado)

Exemplo: O estudo de uma amostra de tamanho 55 peas indicou que o dimetro mdio
de 27,5 mm. Ento:
H 0 : o dimetro mdio da populao (de peas) 27,5 mm
H 1 : o dimetro mdio da populao (de peas) diferente de 27,5 mm

Os testes de hiptese utilizam a significncia adotada pelo pesquisador. A significncia a


probabilidade de uma hiptese nula ser rejeitada, quando verdadeira. Que coincide com o
erro tipo I.

Ao testar uma hiptese, h dois tipos de erros que podemos cometer:


= P {rejeitar H 0 / H 0 verdadeira} = erro do tipo I
= P {aceitar H 0 / H 0 falsa} = erro do tipo II

O procedimento usual fixar o valor de e verificar o valor de . O risco uma funo


do tamanho da amostra, e controlado indiretamente. Quanto maior o tamanho da
amostra, menor ser o risco .
Prof. Cntia Paese Giacomello

68

Se H 0

Ao

Verdadeira

Falsa

Aceitar H 0

Deciso correta

Erro tipo II ( )

Rejeitar H 0

Erro tipo I ( )

Deciso correta

Basicamente os testes de hiptese envolvem as seguintes etapas:


1. Estabelecer as hipteses nula e alternativa;
2. Identificar a distribuio amostral adequada;
3. Escolher um nvel de significncia (e assim os valores crticos);
4. Calcular a estatstica do teste e compar-la com os valores crticos;
5. Rejeitar a hiptese de nulidade se a estatstica do teste excede o(s) valor (es)
crtico(s); caso contrrio, aceit-la.

Os testes de hiptese podem ser unilaterais ou bilaterais. Nos testes unilaterais a hiptese
alternativa H 1 do tipo >33 ou <33, por exemplo. Nos testes bilaterais a hiptese
alternativa do tipo 33. A hiptese nula permanece igual nos dois casos. A rea de
rejeio dividida quando o teste bilateral.

H 1 : <33

H 1 : 33
/2

Rejeitar H 0

Rejeitar
H0

/2
Rejeitar
H0

H 1 : >33

Rejeitar H 0

Exerccios
1. Para cada um dos seguintes casos, trace uma curva normal, indicando a rea de
rejeio na figura.
a) H 0 : =10, H 1 : 10, =0,02
b) H 0 : =120, H 1 : 120, =0,05
c) H 0 : =2000, H 1 : 2000, =0,01
d) H 0 : =2000, H 1 : >2000, =0,01
e) H 0 : =2000, H 1 : < 2000, =0,01

Prof. Cntia Paese Giacomello

69

2. Um fornecedor de mancais comprometeu-se a enviar para uma firma lotes que no


contenham mais de 2% de defeituosos. O comprador extrai amostras ao receber a
remessa, para verificar a qualidade. Indique H0 e H1.

3. Um engenheiro acredita que o tempo para produo de um motor de 5 horas. Ele


analisa uma amostra para verificar se est certo ou no. Escreva H0 e H1

12.1 Teste de hipteses para mdias

x conhecido
Quando se conhece o desvio padro da populao, a distribuio amostral adequada a
distribuio normal. Se a populao normal, a distribuio amostral ser normal para
todos os tamanhos de amostra. Se a populao no normal, ou se sua forma
desconhecida, pode-se usar um teste de uma amostra s para tamanhos de amostras
superiores a 30 observaes. Assim, pequenas amostras de populao no normais no
podem ser tratadas por este processo.

Suponha que X uma varivel aleatria com mdia desconhecida e varincia 2 x


conhecida. E queremos testar a hiptese de que a mdia igual a um certo valor
especificado 0 . O teste de hiptese pode ser formulado como segue:
H 0 : = 0
H 1 : 0
Para testar a hiptese, toma-se uma amostra aleatria de n observaes e calcula-se a
estatstica

z teste =

x o

E H 0 rejeitada se |Z teste | > Z /2

(obtido em uma tabela da

n
distribuio normal).

Prof. Cntia Paese Giacomello

70

Exemplo:
Uma mquina de usinagem deveria produzir entalhes com 0,85 mm de profundidade. O
engenheiro desconfia que os entalhes que esto sendo produzidos so diferentes que o
especificado.
Uma amostra de 8 valores foi coletada e indicou X = 0,847 . Sabendo que o desvio padro
=0,010, teste a hiptese do engenheiro usando um nvel de significncia =0,05.

H o : = 0,850
H1 : 0,850

Z teste =

0,847 0,850
0,010 / 8

= 0,85

Como Z teste = 0,85 > Z 0 ,025 = 1,96 H 0 no pode ser rejeitada.


Concluso: no podemos afirmar que os entalhes sejam diferentes que o especificado, ao
nvel de significncia de 0,05.

x desconhecido
Quando no se conhece o desvio padro da populao, deve-se estim-lo a partir dos
dados amostrais usando o desvio padro amostral. Quando isso ocorre (na maioria das
situaes reais x desconhecido), a distribuio t a distribuio amostral adequada.
Suponha que X uma varivel aleatria Normal com mdia e varincia 2
desconhecidas. Para testar a hiptese de que a mdia igual a um valor especificado o ,
formulamos:

Ho : = 0
H1 : o
Esse problema idntico quele da seo anterior, exceto que agora a varincia
desconhecida.

Como X no conhecido, usa-se a distribuio de Student para construir a estatstica do


teste:

t teste =

x o
sx
n

E a hiptese nula H 0 rejeitada se |t teste |>t /2 , onde t /2, n-1 um valor limite da
distribuio de Student tal que a probabilidade de se obter valores externos a t /2 .

Prof. Cntia Paese Giacomello

71

12.2 Testes de duas amostras para mdias


Os testes de duas amostras so usados para decidir se as mdias de duas populaes so
iguais. Exigem-se amostras independentes, ou seja, uma de cada populao. Eles so
freqentemente utilizados para comparar dois mtodos de ensino, duas cidades, duas
marcas, duas fbricas, ....
OBS: dados provenientes de antes-depois so dependentes, no podendo, portanto, serem
tratados por este mtodo.

x conhecido
Quando h duas populaes com mdias desconhecidas, digamos a e b e desvios
padres conhecidos, a e b , o teste para verificar a hiptese que as mdias sejam iguais
o seguinte:

Ho : 1 = 2
H1 : 1 2
Z teste =

X1 X 2

12
n1

22
n2

E rejeita-se H 0 se |Z teste | > Z /2

x desconhecido
Similarmente, quando , a e b , no so conhecidos, o teste para verificar a hiptese que
as mdias sejam iguais :

t teste =

E rejeita-se H 0 se |t teste | > t /2,

X1 X 2
S 2x1 S 2x 2
+
n1
n2

n1+n2-2

12.3 Teste para propores


Este tipo de teste apropriado quando os dados sob anlise consistem de contagem ou
freqncias de itens em duas ou mais classes. A finalidade de tal teste avaliar
afirmaes sobre a proporo (ou percentagem) de uma populao. O teste se baseia na
premissa de que uma proporo amostral ser igual verdadeira proporo populacional,
a menos da variabilidade amostral. O teste foca na diferena entre o nmero esperado de
ocorrncias (supondo-se verdadeira uma afirmao) e o nmero efetivamente observado.
A diferena ento comparada com a variabilidade prescrita por uma distribuio amostral
baseada na hiptese de que H 0 realmente verdadeira.

Prof. Cntia Paese Giacomello

72

Quando a finalidade da amostragem julgar a validade de uma alegao acerca de uma


proporo populacional, apropriado o teste para propores.Onde:
H0: p = p0
H1: p p0

O valor da estatstica de teste dado por

z teste =

x p
0
n
p0 (1 p0 ) / n

e deve ser comparada com o valor crtico de Z (retirado de uma tabela da distribuio
normal)

Exemplo:
Um fabricante afirma que uma remessa de pregos contm menos de 1% de defeituosos.
Uma amostra aleatria de 200 pregos acusa 4 defeituosos. Teste a afirmao ao nvel
0,01.
H 0 : p = 1%
H 1 : p > 1%  pois desejamos evitar a aceitao de uma remessa com mais de
1% de defeituosos, mas nada h contra aceitar o fato da remessa apresentar
qualidade superior acordada.

z teste =

x p
0
n
= z teste =
p0 (1 p0 ) / n

0,01
200
= 1,42
0,01(1 0,01) / 200

Na tabela da distribuio normal, z 0,01 =2,33


Aceita-se H 0 , e pode-se dizer que a quantidade de pregos defeituosos 1% ou
menos, ao nvel de significncia 0,01.

12.4 Teste do qui-quadrado (k amostras para propores)


A finalidade de um teste de k amostras avaliar se as propores de k amostras
independentes provenham de populaes que contenham a mesma proporo de
determinado item. Conseqentemente, tem-se:
H 0 : As propores populacionais so todas iguais
H 1 : As propores populacionais no so iguais
Ou seja, estamos testando se as duas variveis so ou no associadas, por exemplo, se
queremos testar se a proporo de mulheres e de homens que trabalham no horrio
Prof. Cntia Paese Giacomello

73

noturno em uma fbrica so iguais, automaticamente estaremos testando se sexo e turno


de trabalho so variveis associadas.

Este teste baseia-se na distribuio qui-quadrado, onde o valor calculado deve ser
comparado com o valor tabelado. A deciso de aceitar ou rejeitar H 0 depender da
comparao deste valor com o valor tabelado da distribuio qui-quadrado.

Por exemplo, tem-se a distribuio de peas produzidas por turno e se essas peas so
boas ou apresentam algum tipo de defeito. No turno da manh foram produzidas 967
peas, onde 183 apresentaram algum tipo de defeito.

Turno de produo
Total
Manh

Tarde

Noite

Peas com algum defeito

183

30

11

224

Peas boas

784

264

308

1356

Total

967

294

319

1580

O teste baseia-se na pressuposio que, se as duas variveis fossem independentes, ento


o valor esperado de cada clula poderia ser encontrado fazendo-se:

Frequncia _ Esperada =

(total _ linha) x (total _ coluna)


total _ geral

Neste caso, a tabela com as freqncias esperadas seria:

Tabela de freqncias esperadas

Turno de produo
Total
Manh

Tarde

Noite

Peas com algum defeito

137,1

41,7

45,2

224

Peas boas

829,9

252,3

273,8

1356

967

294

319

1580

Total

Freq _ esperada =

224 x 967
= 137,1
1580

Prof. Cntia Paese Giacomello

74

O teste de independncia qui-quadrado obtido utilizando-se a estatstica

2 =

(O E) 2
E

Se o valor obtido for maior que o valor crtico obtido na tabela 2 ento diz-se que as
variveis NO so independentes. Se o valor encontrado for menor, ento diz-se que as
variveis so independentes.
O valor dos GRAUS DE LIBERDADE obtido atravs do clculo:
graus de liberdade = (colunas-1)(linhas-1)
No exemplo apresentado:

(183 137,1) 2 (30 41,7) 2


(308 273,8) 2
=
+
+ ... +
= 51,88
137,1
41,7
273,8
2

e o valor crtico encontrado na tabela para (2-1)x(3-1)=2 graus de liberdade e nvel de


significncia 0,05 5,991.

Tem-se valor calculado > valor tabelado ento diz-se que as variveis NO so
independentes. OU SEJA, a proporo de peas boas produzidas depende do turno de
trabalho. A proporo de peas boas no turno da manh 81%, na tarde 90% e na noite
97%.

Exerccios:
1. Um fornecedor apresenta uma caixa, e afirma que o peso mdio desta caixa de
368 gramas. De experincias anteriores sabe-se que o desvio padro da populao
vale 15 g e que os valores se comportam segundo a distribuio Normal. Para
verificar se a afirmao verdadeira, verifica-se uma amostra de 25 caixas, pesa-se
e calcula-se o peso mdio da amostra, achando 372,5 g. Qual a concluso a
respeito da afirmao do fornecedor, ao nvel de significncia 0,01?

2. Uma agncia de empregos alega que os candidatos diretoria por ela colocados
nos ltimos seis meses tm salrios de R$ 9000, em mdia. Uma agncia
governamental extraiu uma amostra aleatria daquele grupo, encontrando salrios
mdios de R$ 8000, com desvio padro de R$ 1000, com base em 50 empregados.
Teste a afirmao da agncia, contra a alternativa, de que o salrio mdio
inferior a R$ 9000, ao nvel de significncia 0,05.

Prof. Cntia Paese Giacomello

75

3. O gerente de marketing de uma fbrica de automveis est interessado em


determinar a proporo de novos proprietrios de carros compactos que teriam
adquirido um air-bag inflvel para o lado do passageiro se o mesmo estivesse
disponvel a um custo adicional de $ 300,00. Por informaes anteriores, o gerente
acredita que a proporo 30%. Suponha que feito um levantamento com 200
novos proprietrios de carros compactos e 79 indiquem que teriam comprado os
air-bags inflveis. No nvel de significncia de 0,05, h evidencias de que a
proporo da populao diferente de 0,3?

4. Suponha que o diretor de produo de uma fbrica de tecidos precise determinar se


uma nova mquina est produzindo um tipo de tecido de acordo com as
especificaes do fabricante. As especificaes indicam que o tecido devia ter uma
resistncia de rompimento superior a 70 libras (1 libra = 433,59 gramas) e um
desvio padro de 3,5 libras. Uma amostra de 36 peas revela uma mdia aritmtica
da amostra igual a 69,7 libras. H evidncias de que a mquina no est atendendo
s especificaes, em termos da mdia da resistncia de rompimento? (utilize um
nvel de significncia de 0,05)

5. Uma rede de postos de gasolina afirma que, em seus estabelecimentos no se


vende gasolina adulterada. Sabe-se que, de acordo com os padres de qualidade, a
gasolina no pode conter mais de 240 ml de lcool por litro. O rgo de fiscalizao
colheu 25 medies do produto nos postos dessa rede, obtendo a partir delas uma
mdia de 240,75 ml de lcool/litro. Admitindo-se que a quantidade de lcool
presente na gasolina tem uma distribuio normal com desvio-padro de 2,5
ml/litro. Ao nvel de significncia 5%, pode-se afirmar que a gasolina adulterada?

Prof. Cntia Paese Giacomello

76

6. Um psiclogo de indstrias deseja estudar os efeitos da motivao nas vendas, em


determinada empresa. Foi selecionada uma amostra aleatria de 24 indivduos, 12
de cada grupo. Os dados a seguir representam o volume de vendas (em milhares
de reais) alcanado durante o primeiro ms de emprego. H evidncias de que o
volume mdio de vendas seja diferente entre os grupos? (utilize nvel de
significncia 0,05)
Por hora
256
212
239
216
222
236

Comisso
207
219
228
225
241
230

224
261
254
228
273
234

285
225
237
232
277
245

7. No caso judicial EUA versus Cidade de Chicago, foram postas em dvida as prticas
honestas de emprego. Um grupo minoritrio (A) e um grupo majoritrio (B) fizeram
o exame para capito do corpo de bombeiros, com os seguintes resultados:
Grupo A
Grupo B

Aprovados
10
417

Reprovados
14
145

Com os resultados acima, e com nvel de significncia de 5%, teste a afirmao de


que o sucesso no teste independente do grupo.

8. Solicitou-se a quatro amostras de 30 funcionrios de uma grande empresa que


opinassem sobre a nova direo da empresa. Ao nvel de significncia 0,01, o que
se pode concluir?
Aprovam
Desaprovam

Prof. Cntia Paese Giacomello

Estagirios
5
25

Treinees
4
26

Tcnicos
20
10

Gerentes
27
3

77

9. Um estudo de usurios e no usurios do cinto de segurana resultou nos dados


amostrais aleatrios resumidos na tabela a seguir. Teste a afirmao de que a
quantidade de fumo independente do uso do cinto de segurana. Uma teoria
plausvel que as pessoas que fumam mais esto menos preocupadas com a sua
sade e segurana, sendo assim, menos propensas a usar cintos. Com nvel de
significncia 0,01, os dados amostrais apiam esta teoria?

Usam cinto de segurana


No usam cinto de segurana

Nmero de cigarros fumados por dia


0
1-14
15-34
35 ou +
175
20
42
6
149
17
41
9

10. A tabela abaixo apresenta dados relativos ao time vencedor em diferentes esportes.
Com o nvel de 0,05 de significncia, teste a afirmao de que as vitrias
casa/visitante so independentes do esporte.
O time da casa ganha
O time visitante ganha

Prof. Cntia Paese Giacomello

Basquete
127
71

Beisebol
53
47

Hockey
50
43

Futebol
57
42

78

13 Anlis e de vari ncia (ANOVA -

Analys is of Var ianc e)

H situaes onde se deseja comparar vrias mdias, cada uma oriunda de um grupo
diferente. Esses grupos, tambm chamados tratamentos, poderiam ser 5 mquinas de
corte, ou 4 presses de operao, ou 4 layouts , 5 planos econmicos do governo, taxas
de cmbio em 3 diferentes pases, resultados da implantao de um novo sistema em duas
filiais, etc.

Exemplo:
Para verificar se existe diferena significativa entre os salrios mdios dos economistas da
Regio Sul, o sindicato da classe resolveu analisar os dados de algumas amostras. Assim
foram selecionados aleatoriamente 5 economistas de cada estado.

Econ.1

Econ.2

Econ.3

Econ.4

Econ.5

Rio Grande do Sul

370

420

280

340

410

Santa Catarina

280

350

430

290

405

Paran

325

400

295

350

380

Exemplo:
Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram

Mtodo A
Mtodo B
Mtodo C

Prof. Cntia Paese Giacomello

5
4

0
5

3
4

5
7

4
5

10

10

79

Nesses casos, os dados foram tabelados conforme aparecem a seguir:

Tratamento
1
2
:
:
:
k

Observaes
Y11 , Y12 ... Y1n1
Y21 , Y22 ... Y2n2
:
:
:
Yk1 , Yk2 ... Yknk

Os resultados poderiam ser representados por um modelo aditivo:

Yij = + i + ij ;

i = 1,....., k
j = 1, ..., ni

Onde Y ij

a observao j medida no tratamento i;

a mdia geral de todas as observaes;

o efeito do tratamento i;

ij
o erro aleatrio. (OBS: Para fins de testes de hiptese, supomos que o
erro aleatrio ij segue um modelo normal com mdia 0 e varincia 2
aproximadamente igual para todos os tratamentos)

Nosso objetivo ser testar a hiptese referente ao efeito dos tratamentos e estimar esses
efeitos, ou seja, verificar se existe diferena significativa entre os resultados apresentados
por cada grupo.

Existem dois tipos de problemas a serem abordados:


Modelo a nveis fixos: quando o efeito de cada tratamento fixo, como no caso em que
os tratamentos so 4 presses de operaes, ou 4 layouts fixados pelo engenheiro;
Modelo a nveis aleatrios: quando o efeito de cada tratamento aleatrio, como no
caso em que os tratamentos so k lotes de produo, ou k operadores escolhidos
aleatoriamente.

Prof. Cntia Paese Giacomello

80

No modelo a nveis fixos, os efeitos dos tratamentos so definidos como desvios da mdia
geral, tais que:

H 0 : 1 = 2 = ..... = k
H 1 : i j
Na

para alguns i, j

H o (hiptese nula) supe-se que todas as mdias sejam iguais, ou seja, os

economistas tm o mesmo salrio nos trs estados (e as diferenas entre os seus salrios
so devidas ao acaso) ou os trs mtodos de ensino so equivalentes.
A

H 1 (hiptese alternativa) indica que pelo menos uma das mdias difere, ou seja,

existem pelo menos dois estados com salrios diferentes entre si ou pelo menos dois
mtodos de ensino diferem.

O procedimento utilizado para comparar simultaneamente todos os grupos chamado de


Anlise de Varincia, que ser visto a seguir.

A anlise de varincia uma tcnica que pode ser


usada para determinar se as mdias de duas ou mais
populaes so iguais. O teste se baseia numa
amostra extrada de cada populao.

A Anlise de Varincia uma tcnica para investigar quanto de variabilidade em um


conjunto de observaes (dados) pode ser descrito por diferentes causas.

Os clculos associados Anlise de Varincia so apresentados em uma tabela, chamada


de Tabela de Anlise de Varincia ou Tabela ANOVA

Fonte de variao

onde

SQ

GDL

MQ

Teste F

Entre grupos

SQG

k-1

MQG

MQG/MQR

Dentro de grupos

SQR

N-k

MQR

Total

SQT

N-1

k o nmero de nveis do fator.


N a quantidade total de observaes

Prof. Cntia Paese Giacomello

81

A Anlise de Varincia se baseia na decomposio da variabilidade total. Mais


especificamente, os desvios das observaes individuais em relao mdia global podem
ser escritos como:

(Yij Y.. ) = (Y i.

) (

Y.. + Yij Y i .

(1)

onde:

(Y i. Y .. ) o desvio da mdia do tratamento

i em relao mdia global;

(Yij Y i. )

o desvio da observao individual em relao mdia do tratamento


correspondente;

Elevando ao quadrado ambos os termos da equao (1) e efetuando o somatrio, resulta:

(Yij Y .. ) = ni (Y i. Y.. ) + (Yij Yi. )


i, j

ij

2
(2)

Na equao (2), identificamos as seguintes somas quadradas:


SQT = SQG + SQR
onde:
SQT  a soma dos quadrados totais, decomposta em:
SQG  soma dos quadrados dos grupos (tratamentos), associada exclusivamente a um
efeito dos grupos;
SQR  soma dos quadrados dos resduos, devida exclusivamente ao erro aleatrio, medida
dentro dos grupos.
As divises das somas de quadrados (SQ) pelos graus de liberdade fornecem as mdias
quadradas (MQ), que so as estimativas de variabilidade de cada parcela.

Os graus de liberdade so obtidos atravs do nmero de nveis do fator e da quantidade


de repeties para cada nvel, ou seja, se o fator tem 5 nveis, ter 4 graus de liberdade
(k-1). Os graus de liberdade totais so obtidos atravs do total de observaes menos 1
(N-1) e os graus de liberdade dentro dos grupos ser a diferena entre eles (N-1)-(k-1) =
(N-k).

Para testar a hiptese referente ao efeito dos grupos, usamos a distribuio F :

F=

Prof. Cntia Paese Giacomello

MQG
MQR

82

O valor resultante do teste F deve ser comparado com uma tabela de valores F, que indica
o valor mximo da estatstica no caso de H o ser verdadeira, a um determinado nvel de
confiana.
Como o valor tabelado de F contnuo e depende da combinao dos graus de liberdade
do numerador e do denominador, usual apresentar seus valores apenas para os nveis de
confiana 0,05 e 0,01. Os graus de liberdade para a determinao do valor F so os
mesmos apresentados na tabela da ANOVA.
Os valores constantes na tabela F so valores crticos: apresentam a linha divisria entre a
variao aleatria e a no aleatria. Ao fazer a anlise de varincia, utilizam-se as duas
estimativas amostrais da varincia para calcular uma razo F. Compara-se ento o nmero
resultante com o nmero tabelado. Se o valor calculado maior que o valor tabelado,
rejeita-se a hiptese nula. Se o valor calculado menor que o valor tabelado, a hiptese
nula no pode ser rejeitada.

Distribuio F
Concluir pelo
acaso
Aceitar Ho

Concluir pelo
no-acaso
Rejeitar Ho

Nvel de significncia = rea da cauda

0
Valor tabelado

13.1 Formulrio para soluo


Para o clculo das Somas Quadradas recomendado o uso do seguinte formulrio:

TC = ( T .. )2 N

SQT = ( Yij2 ) TC

SQG = ( Ti 2. ni ) TC
SQR = ( Yij2 ) ( Ti .2 ni ) = SQT SQG
onde
TC o termo de correo
T.. a soma de todas as observaes
Ti.

a soma das observaes no grupo i

Prof. Cntia Paese Giacomello

83

Resolvendo o exemplo dos mtodos de ensino atravs deste formulrio obtm-se:


Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram

Mtodo A

Mtodo B

Mtodo C

0
5

3
4

5
7

4
5

10

10

k = 3 (trs nveis do fator, mtodo A, B e C)


N = 24 (oito alunos por mtodo)
T.. = 5 + 0 + 3 + ... + 4 + 9 = 116

(somar todas as observaes)

T A. = 5 + 0 + 3 + 5 + 4 + 5 + 8 + 2 = 32 (somar as observaes do mtodo A)


T B. = 48 (somar as observaes do mtodo B)
T C. = 36 (somar as observaes do mtodo C)

TC = 116 2 / 24 = 560,67
SQT = (5 2 + 0 2 + 3 2 + ... + 4 2 + 9 2 ) 560,67 = 738 560,67 = 177,33

322 482 362


560,67 = 578,00 - 560,67 = 17,33
SQG =
+
+
8
8
8
SQR = SQT SQG = 177,33 17,33 = 160,00

Ento a tabela da ANOVA ficaria:

Fonte de variao

SQ

GDL

MQ

Teste F

Entre grupos

17,33

8,67

1,14

Dentro de grupos

160,00

21

7,62

Total

177,33

23

O valor de F tabelado com 2 e 21 graus de liberdade no numerador e denominador,


respectivamente, e nvel de significncia de 0,05 F 0,05 3,49. Como F calculado < F
tabelado, conclumos que no h evidncias de que os mtodos de ensino alterem a
aprendizagem das crianas, ou seja, os mtodos de ensino devem ser equivalentes.

Prof. Cntia Paese Giacomello

84

Utilizando o Excel
Clique em Ferramentas e depois em Anlise de Dados. (OBS: Se no seu
computador no aparecer Anlise de Dados porque este suplemento no est
ativado. V em Ferramentas, depois Suplementos. Disponibilize Anlise de
Dados e Anlise de Dados VBA.)

Selecione ANOVA Fator nico.


Preencha com as informaes que forem necessrias.

13.2 Exemplo de soluo no Excel


Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram

Mtodo A
Mtodo B
Mtodo C

5
4

0
5

3
4

5
7

4
5

10

10

Os dados devem agrupados em linhas ou colunas.

ou

No menu Ferramentas e Anlise de Dados, aps selecionar ANOVA fator nico.


Prof. Cntia Paese Giacomello

85

Na janela da ANOVA informar as questes que forem solicitadas.

Os resultados estaro localizados na planilha chamada resultados.

Anova: fator nico


RESUMO
Grupo
Mtodo A
Mtodo B
Mtodo C

Contagem Soma
8
32
8
48
8
36

Varincia
5,714
7,429
9,714

Tabelado

Calculado

ANOVA
Fonte da variao
Entre grupos
Dentro dos grupos

SQ
17,33
160,00

gl
2
21

Total

177,33

23

Prof. Cntia Paese Giacomello

Mdia
4,0
6,0
4,5

MQ
8,67
7,62

F
1,14

valor-P
0,340

F crtico
3,47

86

Exerccios:
1. Suponha que o valor crtico de F na anlise de varincia seja 1,99 ao nvel de 0,05.
Com base na figura: a) Como voc interpretaria uma estatstica de teste maior que
1,99? b) Como voc interpretaria uma estatstica de teste menor que 1,99?

Distribuio F

0,05
0
1,99

2. Duas turmas de pilotos de corrida de automveis esto sendo treinadas para uma
grande corrida no domingo. Cada turma faz cinco provas de troca dos quatro pneus
num carro. As turmas so equivalentes ou uma delas superior, ao nvel de
significncia 0,05? Complete a tabela da ANOVA e conclua a respeito.

Fonte de variao

SQ

GDL

MQ

Teste F

Entre grupos
Dentro de grupos

0,12

Total

0,22

3. Realiza-se um experimento para determinar-se as produes de cinco variedades de


trigo: A, B, C, D e E. So atribudos quatro lotes de terra para cada variedade e as
produes, em toneladas, esto apresentadas na tabela. Supondo-se que os lotes
possuem fertilidades semelhantes e que as variedades so atribudas aos lotes
aleatoriamente, determinar se existe diferena entre as produes ao nvel de
significncia 0,01.

A
B
C
D
E
Prof. Cntia Paese Giacomello

20
17
23
15
21

12
14
16
17
14

15
12
18
20
17

19
15
14
12
18
87

4. Uma empresa deseja testar quatro tipos diferentes de pneus: K, L, M e N. Suas


duraes, determinadas pelas bandas de rodagem, esto na tabela (em milhares de
quilmetros), onde cada tipo foi testado, aleatoriamente, em seis automveis
semelhantes. Determinar de existe diferena significante entre os pneus ao nvel de
significncia 0,05.

K
L
M
N

33
32
31
29

38
40
31
34

36
42
37
32

40
38
35
30

31
30
33
33

35
34
30
31

5. Um professor deseja testar trs mtodos diferentes de ensino I, II e III. Para isso so
escolhidos aleatoriamente trs grupos de cinco estudantes, e cada grupo instrudo
por um mtodo diferente. dada a mesma prova a todos os estudantes e os graus
obtidos constam na tabela. Determinar se existe diferena entre os mtodos de ensino
ao nvel de significncia 0,01.

I
II
III

75
81
73

62
85
79

71
68
60

58
92
75

73
90
81

6. A tabela apresenta os dados sobre a ferrugem acumulada sobre o ferro, que foi tratado
quimicamente com os produtos A, B ou C. Determinar se existe diferena significativa
nos tratamentos ao nvel de 0,05.

A
B
C

3
4
6

5
2
4

4
3
5

4
3
5

7. Um experimento mede os quocientes de inteligncia (QI) de estudantes do sexo


masculino de estaturas alta, mdia e baixa, cujos resultados aparecem na tabela.
Determinar se existe qualquer diferena nas contagens do QI em relao s diferentes
alturas ao nvel de significncia de 0,01.

Alta
Mdia
Baixa

Prof. Cntia Paese Giacomello

110
95
108

105
103
112

118
119
104

90
104
93

88

8. A fim de produzir um tipo superior de rao para galinhas, adicionou-se rao


tradicional quatro quantidades diferentes de um mesmo produto qumico. Cada
quantidade de rao dada a 8 pintos e o peso das aves aps 3 meses anotado.
Concluir se houve diferena entre as quantidades do produto qumico ao nvel de
significncia 0,05.

20
30
40
50

9.

mg
mg
mg
mg

46
48
49
52

46
48
49
53

46
47
50
52

45
47
50
52

45
47
49
52

45
47
50
52

46
47
50
53

46
48
49
53

Uma empresa deseja estudar trs tipos de enxerto para ver se todos apresentam o
mesmo crescimento anual. O que se pode concluir a respeito? (use nvel de
significncia 0,05)

Enxerto 1
14,4
14,8
12,7
12,2
10,9

Enxerto 2
10,8
12,2
11,2
12,8
13,0

Enxerto 3
11,1
9,5
10,8
12,7
10,9

10. Os dados abaixo do a vida observada dos pneus de quatro caminhes distribuidores
de sorvete, conforme a posio. Supondo comparveis os caminhes e os motoristas,
poderemos afirmar que a durao mdia independente da posio do pneu no
veculo? (use nvel de significncia 0,01). Disponha os clculos numa tabela ANOVA.
Qual a importncia da comparabilidade dos motoristas e veculos?

Dianteiro direito
Dianteiro esquerdo
Traseiro direito
Traseiro esquerdo

Prof. Cntia Paese Giacomello

17
25
22
26

19
27
21
24

20
18
19
30

24
22
26
28

89

14 Regresso e co rrelao
A anlise de regresso e de correlao compreende a anlise de dados amostrais para
saber se e como duas ou mais variveis esto relacionadas uma com a outra em uma
populao.

A anlise de correlao fornece o nmero

A anlise de regresso apresenta como

(coeficiente) que resume o grau de

resultado uma equao matemtica que

relacionamento entre duas variveis.

descreve um determinado relacionamento.

Os valores para a anlise de regresso e correlao provm de observaes e, para um


problema com duas variveis, cada observao d origem a dois valores, uma para cada
varivel. Uma das variveis ser a dependente e a outra independente.

Exemplos:
Famlia

Renda

Gastos

Peso

Altura

Aluno

Notas 2 o
grau

Notas
faculdade

R$ 1550

R$ 1350

56

179

80

85

R$ 2000

R$ 1970

67

176

75

70

R$ 1000

R$ 550

89

180

95

95

58

170

60

65

45

130

70

80

...
n

R$ 770

R$ 690

Uma maneira de apresentar os resultados atravs do diagrama de disperso.

Relao linear
positiva perfeita

Prof. Cntia Paese Giacomello

Relao linear
negativa perfeita

X e y positivamente
correlacionados

X e y negativamente
correlacionados

X e y no
correlacionados

90

Regresso
14.1 Aplicaes da regresso
1. Estimar valores de uma varivel com base em valores conhecidos de outra varivel.
(Situaes em que as duas variveis medem aproximadamente a mesma situao, mas
uma delas relativamente dispendiosa ou difcil de lidar, enquanto a outra no.)
2. Explicar valores de uma varivel em termos da outra, isto , pode-se suspeitar
uma relao de causa e efeito.

de

3. Predizer valores de uma varivel.

OBS: A anlise da regresso apenas indica qual relacionamento matemtico pode existir, se
existir algum. Ou seja, nem a regresso, nem a correlao podem mostrar que uma varivel
tenda a causar certos valores de outra varivel, no garantido que exista relao de causa e
efeito.
... a correlao entre beber um copo de vinho por dia e a menor chance de infarto do
miocrdio um bom exemplo. Estudos recentes mostram que ela no se deve ao vinho e
ao lcool, mas sim ao betacaroteno, corante contido na uva. Para infelicidade de
muitos, tomar suco de uva d o mesmo resultado que beber vinho tinto. Jornal do
Brasil, 08/01/1999

14.2 Classificao das regresses


Quanto ao nmero de variveis: Simples (uma varivel independente explica bem o
fenmeno) ou Mltipla (mais de uma varivel independente so necessrias para explicar
bem o fenmeno)
Quanto qualidade da relao: Linear (os fenmenos podem ser bem explicados por
equaes de primeiro grau) ou No lineares (os fenmenos no podem ser bem explicados
por equaes de primeiro grau, exigindo funes de ordem superior).

14.3 Modelo linear


14.3.1

A equao da linha reta

Forma da equao linear:

y = a + bx

Duas caractersticas importantes so:

A ordenada da reta (valor de em y) determinado ponto (quando x=0) 

A inclinao da reta (coeficiente angular) 

O mtodo mais usado para ajustar uma linha reta a um conjunto de pontos conhecido
como mtodo dos mnimos quadrados .

Prof. Cntia Paese Giacomello

91

b=

14.3.2

n( xy ) ( x )( y )

a=

n( x 2 ) ( x ) 2

y b x
n

Erro padro da estimativa linear

Uma vez que as estimativas

b so funes de variveis aleatrias (x e y so variveis

aleatrias) necessrio verificar a preciso das estimativas, conhecendo o erro padro das
estimativas.

SE =

14.3.3

( a y + b xy )
n2

Intervalo de confiana para a estimativa

Para criar intervalos de confiana com base nos estimadores utiliza-se a equao:

yint ervalo = y t S E
y obtido da equao.

Onde:

t o valor da distribuio t de Student para n-2 graus de liberdade e nvel de


confiana determinado (tabelado)
e

S E o erro padro da estimativa

Exemplo:
Seja y o consumo pessoal mdio e x o PIB do Brasil em anos consecutivos. Encontre o
Intervalo de confiana 90% para a estimativa quando o PIB for 10,0.

x
7,0
7,3
7,8
8,6
8,1
8,3
8,2
8,6
9,0
9,6
9,1

y
10,1
10,6
11,3
12,4
11,9
11,9
11,5
12,1
13,1
14,1
14,6

x2
49,00
53,29
60,84
73,96
65,61
68,89
67,24
73,96
81,00
92,16
82,81

xy
70,70
77,38
88,14
106,64
96,39
98,77
94,30
104,06
117,90
135,36
132,86

x = 91,6

y = 133,6

x 2 = 768,76

xy = 1122,50

Prof. Cntia Paese Giacomello

92

ideal que sempre se inicie o estudo de regresso com o grfico de disperso dos valores.

Consum o pessoal

Consumo pessoal em funo do PIB


14,0
12,0
10,0
8,0
6,5

E o clculo de

b=

7,5

PIB

8,5

9,5

10,5

a e b fica:

11 (1122,5) - (91,6) (133,6)


11 (768,76) - (91,6)2

y = 1,744 + 1,668 x ,

= 1,668

ou

a=

133,6 - (1,668) 91,6


= 1,744
11

Consumo = 1,744 + 1,668 PIB ou seja, para cada unidade

acrescida do PIB, o consumo pessoal aumentar 1,668 unidades.

E o intervalo de confiana para y quando x=10 ser:

SE =

1641,28 (( 1,744 )( 133 ,6 ) + 1,668( 1122 ,50 ))


= 0 ,4653
11 2
Valor de t tabelado

y = 1,744 + 1,668( 10 ) = 14 ,936


yint ervalo = 14,936 1,833 (0,4653)

yint ervalo = 14,936 0,853


Ou seja, quando o PIB estiver em 10,0 o Consumo Pessoal poder variar na faixa entre
14,083 e 15,789, com 90% de confiana.

Prof. Cntia Paese Giacomello

93

Correlao
14.4 Objetivo da correlao
O objetivo da correlao determinar a fora do relacionamento entre duas observaes
emparelhadas, porque indica at que ponto os valores de uma varivel esto relacionados
com os valores da outra varivel.
O resultado da anlise de correlao chamado de coeficiente de correlao um valor
que quantifica o grau de correlao.
O mtodo mais comum de anlise de correlao envolve observaes em valores
numricos. Neste caso utiliza-se o coeficiente r de Pearson.

14.5 O coeficiente r de Pearson (correlao)


O coeficiente r de Pearson mede o grau de associao linear em duas variveis. Ele
possui duas propriedades importantes:

Seu sinal. Positivo indica correlao linear positiva, ou seja, medida que uma varivel
cresce, a outra cresce tambm. Sinal negativo indica correlao linear negativa, ou
seja, medida que uma varivel cresce, a outra decresce.

Sua grandeza indica quo prximos da reta esto os pontos individuais caso fosse
ajustada uma reta de regresso. O valor do coeficiente pode variar de 1 a 1.

-1

Correlao
negativa
forte

Inexistncia
de
correlao

Correlao
positiva
forte

O clculo do valor do coeficiente r de Pearson pode ser obtido atravs da equao:

r=

( x )( y )
xy n

( x )
( y)
x
y

n
n
2

14.6 Coeficiente de determinao


O coeficiente de determinao ou de explicao (r 2 ) indica quantos por cento a variao
explicada pela regresso representa da variao total.
r 2 = r.r

Prof. Cntia Paese Giacomello

0 r2 1

94

Exemplo:
Prosseguindo o exemplo anterior, sendo y o consumo pessoal mdio e x o PIB do Brasil em
anos consecutivos.

x
7,0
7,3
7,8
8,6
8,1
8,3
8,2
8,6
9,0
9,6
9,1

y
10,1
10,6
11,3
12,4
11,9
11,9
11,5
12,1
13,1
14,1
14,6

x2
49,00
53,29
60,84
73,96
65,61
68,89
67,24
73,96
81,00
92,16
82,81

y2
102,01
112,36
127,69
153,76
141,61
141,61
132,25
146,41
171,61
198,81
213,16

xy
70,70
77,38
88,14
106,64
96,39
98,77
94,30
104,06
117,90
135,36
132,86

x = 91,6

y = 133,6

x 2 = 768,76

y 2 = 1641,28

xy = 1122,50

O clculo do coeficiente de correlao dado por:

( 91,6 )( 133,6 )
11
r=
2

( 91,6 )
( 133,6 ) 2
768 ,76
1641,28
11
11

1122 ,5

= 0,9446

Ou seja, existe uma correlao forte positiva entre os valores do PIB e do consumo
pessoal.
O valor do coeficiente de determinao : r 2 = 0,9446 x 0,9446 = 0,8923, o que significa
que 89% da variao total explicada por este modelo.

Utilizando o Excel
Maneira 1: A equao da forma y = a + b x para os valores dos pares (x,y) e
os coeficientes da reta so calculados utilizando o mtodo dos mnimos
quadrados.Aps colocar os valores em duas colunas (valores de x e valores de
y) v ao Assistente de Funo e escolha as funes INCLINAO para
determinar o valor de b e INTERCEPO para calcular o valor de a. Os
passos seguintes devem ser feitos seguindo as indicaes do programa. Para o
clculo da correlao utiliza-se no Assistente de Funo o CORREL. Em
Matriz1 devem ser colocadas as clulas referentes varivel x em Matriz2 as
clulas referentes varivel y.
Maneira 2: Selecionar Ferramentas e Anlise de dados e ento
Regresso. Informar o que for solicitado.

Prof. Cntia Paese Giacomello

95

14.7 Exemplo de soluo no Excel


A velocidade mxima de automveis de frmula 1 com motores de mesma potncia
funo, entre outras variveis, do peso do veculo, no intervalo entre 700 e 800 Kg. Assim,
verificou-se qual a velocidade mxima atingida em uma reta de 1.200 m. Os resultados
foram:

Peso(Kg)

750

755

777

782

793

Veloc.Mx.(Km/h)

380

354

348

330

320

a) Construa o grfico dos dados


b) Qual a velocidade esperada para um veculo de 760 Kg?

GRFICO DOS DADOS (Diagrama de disperso)

Relao entre velocidade e peso dos veculos de F1

Velocidade

390

y = -1,181x + 1257,173

370

R = 0,865

350
330
310
740

750

760

770
Peso

780

790

800

RESUMO DOS RESULTADOS

Estatstica de regresso
R mltiplo

0,930

R-Quadrado

0,865

R-quadrado ajustado

0,820

Erro padro

9,851

Observaes

Prof. Cntia Paese Giacomello

Se

96

Se F de significao < 0,05, ento o


modelo linear ajustado aos dados
vlido. Se F > 0,05 o modelo no se
ajusta adequadamente aos dados.

ANOVA (teste de significncia para o modelo linear ajustado)


gl

SQ

MQ

F de significao

Regresso

1864,051

1864,051

19,207

0,022

Resduo

291,149

97,050

Total

2155,200

Testes para a e b
Se valor-P < 0,05, ento a estimativa
vlida, caso contrrio significativamente
nula

Valores de a e b

Coeficientes
Interseo 1257,173
Peso(Kg)

-1,181

Erro
padro

Stat t

valor-P

95%
95%
inferiores superiores

Inferior
95,0%

Superior
95,0%

207,862

6,048

0,009

595,662

1918,685

595,662

1918,685

0,269

-4,383

0,022

-2,038

-0,323

-2,038

-0,323

A equao linear de relacionamento dos dados Velocidade =1257,173 1,181 Peso


Ento, a velocidade estimada para um veculo com 760 kg Velocidade=1257,173
1,181(760) = 359,61 km /hora

Prof. Cntia Paese Giacomello

97

Exerccios
1. Determinar o coeficiente de correlao dos dados a seguir:

X
Y

1
4

2
7

3
7

6
9

9
15

Se os dados forem correlacionados, estimar a reta de regresso:

2. A tabela a seguir apresenta os valores dos investimentos administrados on-line a partir


de 1998. Verifique se existe correlao entre os anos (x) e os investimentos (y), caso
exista correlao, apresente o intervalo de confiana de 95% para o valor dos
investimentos no ano de 2002 e 2003.

Ano
1998
1999
2000
2001

Investimento
374
555
908
1010

3. Os grficos e a tabela indicam o nmero de anos de escolaridade das chefes de famlia


(x) e a participao feminina na renda familiar (y) em alguns anos

1976
1990
1993
1996

Nmero
de anos de
estudo
4,7
5,7
6,3
6,6

Participao na renda
(%)
8,4
16
19
21

a) Caso exista associao, quantos anos de estudo sero necessrios para que a
participao da mulher na renda familiar chegue a 50% ?
b) E qual ser a participao da mulher na renda familiar quando ela tiver 12 anos de
estudo?
c) Voc poderia estimar o ano em que a mulher ir participar com 50% da renda?

Prof. Cntia Paese Giacomello

98

4. Aps uma regulagem eletrnica um veculo apresenta um rendimento ideal no que


tange o consumo de combustvel. Contudo, com o passar do tempo esse rendimento
vai se degradando. Os dados a seguir representam o rendimento medido ms a ms
aps a regulagem. Ajuste um modelo linear a estes dados. Calcule o coeficiente de
correlao. Interprete os resultados.

x: Meses aps a regulagem


y: Rendimento

1
10,7

2
10,9

3
10,8

4
9,3

5
9,5

6
10,4

x: Meses aps a regulagem


y: Rendimento

7
9,0

8
9,3

9
7,6

10
7,6

11
7,9

12
7,7

5. O gerente de uma indstria localizada em um pas tropical suspeita que h uma


correlao entre a temperatura do dia e a produtividade. Dados coletados
aleatoriamente ao longo de um perodo de seis meses revelaram o seguinte.

Temperatura
Produtividade

21,2
142

20,3
148

22,7
131

22,0
132

22,3
145

23,5
138

24,8
144

24,2
136

25,5
141

25,2
124

25,5
133

25,8
128

Temperatura
Produtividade

27,5
132

26,3
137

28,2
124

28,6
117

29,0
122

29,7
131

30,7
124

30,3
111

30,2
119

31,4
129

32,5
123

32,7
116

Plote um grfico de disperso e visualize a natureza da correlao entre temperatura e


produtividade. Depois estime a equao da reta de regresso e calcule o valor do
coeficiente de correlao. Interprete os resultados.
Estime a produtividade quando a temperatura estiver em 35 graus. Construa um
Intervalo de Confiana de 90% para esta produtividade.

6. Suponha que os valores obtidos para o desempenho de alunos em uma determinada


disciplina e as rendas familiares sejam os que seguem.
Aluno
1
2
3
4
5
6
7
8
9

X
(renda)
750
690
400
900
200
1000
300
600
1200

Y
(desempenho)
5
8
4
9
2
10
3
6
10

Os dados so correlacionados? Justifique sua resposta. Se forem, estime a reta de


regresso.

Prof. Cntia Paese Giacomello

99

7. A revista Exame Melhores e Maiores apresentou as maiores empresas do comrcio, por


vendas no ano anterior. Entre as que pertencem ao setor de comrcio varejista esto
destacadas as 11 maiores. Atravs da anlise da tabela e do grfico, o que voc pode
concluir?

Nmero de
funcionrios

Empresa
Carrefour
Po de Acar
Casas Bahia
Sendas
Ponto Frio
Sonae
Bompreo
L. Americanas
McDonalds
AgipLiquigs
Pernambucanas

37.004
39.642
11.508
16.990
5.395
22.638
13.225
12.485
No informou
3.804
10.787

Vendas
(Milhes US$)
4.582,4
3.976,4
1642,2
1391,7
1223,6
1083,9
1062,7
900,6
726,7
693,1
619,1

Fonte: Revista Exame

V e nd as no an o d e 1999 das 11 m aior e s e m pr e s as d o


Br as il do s e tor de co m r cio var e jis ta
5.000
4.500

y = -42 ,4 62 + 0 ,10 15 x

M ilh e s US$

4.000

R 2 = 0 ,80 1

3.500
3.000
2.500
2.000
1.500
1.000
500
-

5.000

10.000

15.000

20.000

25.000

30.000

35.000

40.000

Nm e r o d e fu ncion r ios

14.8 Outros modelos


Muitas vezes a forma funcional entre as variveis x e y no linear. Alguns modelos,
mesmo no sendo lineares, so facilmente linearizveis. Este procedimento busca facilitar
o clculo dos coeficientes da equao.
No entanto, o uso de softwares estatsticos, calculadoras e planilhas eletrnicas auxilia na
obteno dos coeficientes.
O valor de r 2 serve como uma forma de comparao entre os modelos. O modelo que
apresentar maior valor de r 2 o que apresenta melhor ajuste dos dados.
Prof. Cntia Paese Giacomello

100

14.8.1

Funo exponencial

a>0

Utilizando

as

y = ab x

0<b<1

a>0

b>1

a<0

0<b<1

propriedades

dos

logaritmos

pode-se

a<0

chegar

b>1

Y = A + Bx

onde

Y = log y , A = log a e B = log b


Pelo mtodo dos mnimos quadrados obtm-se A e B e depois convertem-se os valores
para a e b .

a = 10 A e b = 10 B
Exemplo
Uma empresa fabricante de brinquedos registrou suas vendas nos ltimos 10 anos,
obtendo os valores apresentados a seguir.

Vendas (y)
450
500
600
800
1.200
1.700
2.100
4.000
5.000
7.000

Vendas do brinquedo, por ano

10.000
8.000
Ve n d as

Ano (x)
1
2
3
4
5
6
7
8
9
10

6.000
4.000
2.000
0
0

5 6
An o

10 11

O diagrama de disperso dos dados indica que a relao no linear.

Prof. Cntia Paese Giacomello

101

Para ajustar uma funo exponencial, inicia-se com o clculo dos somatrios de Y, x, Y 2 ,
x 2 e xY, onde Y = ln (y)

x
1
2
3
4
5
6
7
8
9
10
Total: 55

y
450
500
600
800
1.200
1.700
2.100
4.000
5.000
7.000
23.350

x2
1
4
9
16
25
36
49
64
81
100
385,00

Y=ln(y)
6,11
6,21
6,40
6,68
7,09
7,44
7,65
8,29
8,52
8,85
73,25

xY
6,11
12,43
19,19
26,74
35,45
44,63
53,55
66,35
76,65
88,54
429,64

Y2
37,32
38,62
40,92
44,68
50,27
55,33
58,52
68,79
72,54
78,39
545,39

Ento,

B=

10( 429 ,64 ) ( 55 )( 73 ,25 )


= 0,3245
10( 385 ) ( 55 ) 2

A=

73,25 0 ,325( 55 )
= 5 ,5399
10

b = exp( B ) = exp( 0 ,3245 ) = 1,3903 e a = exp( A ) = exp( 5 ,5399 ) = 254 ,42

Logo, a equao final ser


Vendas =(254,42)(1,3903) ano

Observe como os valores estimados pela equao esto prximos dos valores reais,
observados na srie de dados.
8.000
7.000

V endas
obs ervadas

6.000
5.000
4.000
3.000

V endas
estim adas pela
equa o

2.000
1.000
0
1

Prof. Cntia Paese Giacomello

9 10

102

14.8.2

Funo geomtrica ou de potncia

a>0

Utilizando

as

b mpar

a>0

b par

a<0

propriedades

dos

logaritmos

pode-se

y = ax b

b mpar

chegar

a<0

b par

Y = A + bX

onde

Y = log y , A = log a e X = log x


Pelo mtodo dos mnimos quadrados obtm-se A e
para a .

b e depois convertem-se os valores

a = 10 A
Exemplo
Os dados a seguir apresentam a produo de veculos automotivos (y) ao longo do tempo
(x). Para estes dados ajuste um modelo de potncia

ano
produo

59
96,1

60
133,0

61
145,6

62
191,2

63
174,2

64
183,7

65
185,2

ano
produo

66
224,6

67
225,4

68
278,5

69
349,5

70
416,0

71
516,0

72
609,0

O diagrama de disperso dos dados sugere que um modelo potencial indicado.

P roduo automobilstica anual


Milhares de unidade

700,0
600,0
500,0
400,0
300,0
200,0
100,0
0,0
55

Prof. Cntia Paese Giacomello

60

65
An o

70

75

103

Clculo dos parmetros:

Ano
59
60
61
62
63
64
65
66
67
68
69
70
71
72

Produo
96,1
133,0
145,6
191,2
174,2
183,7
185,2
224,6
225,4
278,5
349,5
416,0
516,0
609,0
Totais:

Y=ln(y)
4,565
4,890
4,981
5,253
5,160
5,213
5,221
5,414
5,418
5,629
5,857
6,031
6,246
6,412
76,292

X=ln(x)
4,078
4,094
4,111
4,127
4,143
4,159
4,174
4,190
4,205
4,220
4,234
4,248
4,263
4,277
58,522

Y2
20,843
23,916
24,809
27,597
26,628
27,179
27,263
29,315
29,353
31,690
34,299
36,369
39,014
41,111
419,386

X2
16,626
16,764
16,899
17,033
17,166
17,296
17,426
17,553
17,679
17,804
17,928
18,050
18,170
18,290
244,684

XY
18,616
20,023
20,476
21,681
21,379
21,682
21,796
22,684
22,781
23,753
24,797
25,621
26,625
27,421
319,335

Assim,

b=

14( 319 ,335 ) ( 58 ,522 )( 76 ,292 )


= 7,970
14( 244 ,684 ) ( 58 ,522 ) 2

A=

76 ,292 7 ,970( 58 ,522 )


= 27 ,868
14

a = exp( A ) = exp( 27 ,868 ) = 7 ,889 E 13

Y=A+bX 

Ou ento,

Y=-27,868+7,970X onde Y e X so, respectivamente, ln(x) e ln(y)

y=7,889E-13 x

7,970

Logo, a equao final ser


Produo de automveis = 7,889E-13 (ano)

7,970

O grfico comparativo entre os valores observados para a produo e os estimados atravs


da curva Produo de automveis = 7,889E-13 (ano) 7,970 :

Prof. Cntia Paese Giacomello

104

700,0
600,0

Produo real

500,0
Produo estimada
pela equao

400,0
300,0
200,0
100,0
0,0
59

60

61

62

63

64

65

66

67

68

69

70

71

72

Exerccios
1.

Aos dados a seguir ajuste um modelo exponencial e um polinomial. Estime a


quantidade de vendas para o ano de 2003, supondo que o comportamento dos dados
seja mantido. DICA: utilize os nmeros de 1 a 11 para os anos e calcule o valor de y quando x
for 14.

Ano
Vendas

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

15

16

17

18

25

28

32

42

55

76

93

2. Se voc tivesse uma srie de dados como expressa no diagrama de disperso a seguir,
que modelo de regresso voc utilizaria? O que voc poderia dizer a respeito dos
valores dos parmetros?

3. Uma companhia de energia eltrica estimou o consumo mdio de energia das famlias
(kwh) de acordo com a renda (R$). Ajuste os seguintes modelos: y=ax b , y=ab x e
y=a+bx.
Renda

197

286

243

218

241

200

215

198

129

157

296

302

Consumo

1234

1432

1678

1300

1467

1245

1214

1200

770

890

2020

2100

Prof. Cntia Paese Giacomello

105

15 Tabelas

Prof. Cntia Paese Giacomello

106