Você está na página 1de 151

UNIVERSIDADE FEDERAL DE VIÇOSA

CAMPUS DE RIO PARANAÍBA

APOSTILA DA DISCIPLINA
CRP 192 – INICIAÇÃO À ESTATÍSTICA

Profº. Carlos Eduardo Magalhães dos Santos

Rio Paranaíba, MG

2011/I
UNIVERSIDADE FEDERAL DE VIÇOSA
Campus de Rio Paranaíba
CRP 192 – Iniciação à Estatística – 2011/I – Turma 4

Prof. Carlos Eduardo Magalhães dos Santos


1. CONTEÚDO

Capítulo 1 – Introdução a Estatística


Capítulo 2 – Estatística descritiva
Capítulo 3 - Amostragem
Capítulo 4 – Teoria da probabilidade
Capítulo 5 – Variáveis aleatórias discretas e contínuas
Capítulo 6 – Esperança matemática, variância e covariância
Capítulo 7 – Distribuições de variáveis aleatórias discretas e contínuas
Capítulo 8 – Testes de significância: qui-quadrado, Z, F e t
Capítulo 9 – Correlações e Regressão linear simples

2. AVALIAÇÕES

Prova Data Horário Local


1 07/04 (Qui) 08:00 BBT 001
2 26/05 (Qui) 08:00 BBT 001
3 04/07 (Seg) 10:00 BBT 001
4 10/07 (Seg) 10:00 BBT 001

O sistema de avaliação constará de:

Avaliações Peso
Prova 1 30%
Prova 2 30%
Prova 3 30%
Avaliação (Assiduidade, participação e sabatinas espontâneas) 10%

Serão ministradas sabatinas sobre o conteúdo explicado, com valor a ser definido
pelo professor, a perda da mesma acarretará em perca da pontuação, mesmo havendo
justificativa.
Será aplicada uma quarta prova escrita com peso de 30%, que abordará todo o
assunto do semestre, para o estudante que perder pelo menos umas das três provas por
qualquer motivo ou deseje melhor a nota final. O cálculo do rendimento acadêmico será
realizado tomando-se os três maiores valores das provas realizadas mais o valor da
avaliação do aluno.
Levar tabelas dos testes de hipóteses e calculadora para as provas, pois são de uso
individual.
As listas de exercícios sugeridos deverão ser entregues, impreterivelmente, no dia
da realização da prova daquele conteúdo.
No momento das provas não será permitida qualquer comunicação entre os alunos e
utilização de meios ilícitos (cola), provocando cancelamento da prova do(s) aluno(s)
interceptado(s).
O professor marcará um único período de revisão para cada uma das provas que
deverá ser respeitado, dando que não serão abertas exceções para revisões de provas fora
do período estabelecido. O período de revisão de prova será divulgado no quadro de avisos
do Campus.
A data da prova final será marcada pelo Registro Escolar.
3. BIBLIOGRAFIA

BANZATTO, D. A.; KRONKA, S. N. Experimentação agrícola. FUNESP, Jaboticabal, 1989.


249 p.
GOMES, F. P. Curso de estatística experimental. 12ª edição, Livraria Nobel S.A., São
Paulo, 1987. 467 p.
MONTGOMERY, D. C. e RUNGER, G. C. Estatística aplicada e probabilidade para
engenheiros. 2ª edição, LCT Editora, Rio de Janeiro, 2003. 463 p.
RIBEIRO JÚNIOR, J. I. Análises estatísticas no Excel – guia prático. Editora UFV,
Viçosa, 2004. 249 p.
VIEIRA, S.; HOFFMANN, R. Estatística experimental. Editora Atlas, São Paulo, 1989, 179
p.

4. PLANEJAMENTO

Aula Dia Assunto


01 10/03 Apresentação da disciplina
02 14/03 Conceitos introdutórios
03 17/03 Estatística descritiva
04 21/03 Apresentação gráfica e tabular
05 24/03 Medidas de posição e dispersão
06 28/03 Aplicações da estatística descritiva
07 31/03 Amostragem: conceitos
08 04/04 Resolução de exercícios
09 07/04 Prova 1
10 11/04 Teoria e Conceitos de probabilidade
11 14/04 Teoremas para cálculo de probabilidades
12 18/04 Teorema de Bayes
13 21/04 Feriado (Tiradentes)
14 25/04 Variáveis aleatórias: conceitos
15 28/04 Variáveis aleatórias contínuas
16 02/05 Variáveis aleatórias discretas
17 05/05 Funções de variáveis aleatórias
18 09/05 Função probabilidade e densidade
19 12/05 Esperança matemática, variância e covariância
20 16/05 Propriedades e aplicações
21 19/05 Distribuições de variáveis aleatórias discretas
22 23/05 Resolução de exercícios
23 26/05 Prova 2
24 30/05 Distribuição binomial e Poisson
25 02/06 Distribuição de variáveis aleatórias contínuas
26 06/06 Aplicações da distribuição normal
27 09/06 Testes de significância
28 13/06 Teste Z e t
29 16/06 Teste F e Qui-quadrado
30 20/06 Correlações
31 23/06 Feriado (Corpus Christi)
32 26/06 Regressão linear simples
33 30/06 Resolução de exercícios
34 04/07 Prova 3
35 07/07 Resolução de exercícios
36 10/07 Prova 4
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

1.0 - INTRODUÇÃO À ESTATÍSTICA

Estatística é uma área da ciência ligada com a extração de informação de


dados numéricos e a sua utilização na tomada de decisões (estabelecimento de
inferências) sobre uma população da qual os dados foram obtidos. Corresponde ao
campo da ciência que trata da coleção, apresentação, análise e uso de dados
numéricos para a tomada de decisões e solução de problemas.
Ao iniciarmos o estudo da estatística nos deparamos com dúvidas de assuntos
de ordem prática e que estão intimamente ligados à teoria. Um das perguntas mais
freqüentes é: que tipo de análise pode ser feita para os dados que se dispõe? A dúvida
muitas vezes surge depois que os dados já estão disponíveis. Na verdade a pergunta
inicial deveria ser: qual o tipo de dado preciso levantar na pesquisa?
Podemos definir população como sendo o conjunto de elementos que têm, em
comum, determinada característica. As populações podem ser finitas ou infinitas. Além
disso existem populações que, embora finitas, são consideradas infinitas para
qualquer finalidade prática.
Entende-se por amostra qualquer conjunto de elementos retirado da população,
desde que esse conjunto seja não-vazio e tenha menor número de elementos do que a
população.
Por exemplo, na predição da fração de agricultores que preferem a marca de
tratores “Fortão” nós assumimos que aqueles que forem entrevistados constituem uma
amostra representativa da população de todos os agricultores (que apesar de
numericamente ser uma população finita, pode ser considerada infinita para efeitos
práticos).
Como outro exemplo considere o problema de determinar a efetividade de
proteção contra a ferrugem de um certo tipo de tinta. Para simplificar suponhamos que
20 máquinas que trabalham nas mesmas condições foram pintadas e após um certo
período de tempo verificou-se que 16 delas conservam-se intactas (ainda protegidas).
Quer-se saber se essa tinta protege realmente as máquinas. Nesse caso a amostra
consiste de 20 máquinas. Qual seria a população.
O que seria, então, de interesse primário? A amostra ou a população?
Nos exemplos citados acima nós estamos primordialmente interessados na
população. Na maioria dos casos seria impossível obtermos todos os dados de
interesse da população. Portanto, a amostra pode ser de interesse imediato, mas

___________________________________________________________________________________
1
Capítulo 1 – Introdução à Estatística
_____________________________________________________________________
estamos primordialmente interessados em descrever a população da qual a amostra
foi extraída.
Como coletar os dados? Em toda a população ou em amostra? Realizar
amostragem probabilística ou não probabilística? Dados secundários ou dados
primários? Que tipo de análise? Estatística descritiva? Inferência estatística? Como
apresentar? Graficamente? Tabela? Que tipo de gráfico? Quais interpretações a partir
das análises feitas?
Para efeitos práticos e de estudo divide-se a estatística em três partes:
estatística descritiva; probabilidade; inferência estatística. Podemos adiantar que o
número de metodologias de análises que podem ser feitas é enorme e entra no que
chamamos de auxílio à tomada de decisões.

Por que estudar estatística?


Qualquer um, tanto na carreira profissional quanto na vida diária através do
contato com jornais, televisão, e outros meios de divulgação de informações se
deparam com informações na forma de dados numéricos.
Possíveis razões para o estudo da Estatística:
• Atualização
Para facilitar o entendimento de artigos em revistas especializadas, que
utilizam muito a estatística para a apresentação e interpretação dos
resultados.
• Desenvolvimento de trabalhos
É de fundamental importância para o auxílio no desenvolvimento de
trabalhos científicos e posteriores conclusões.

Já que engenheiros e demais cientistas frequentemente se vêem obtendo e


analisando dados, o conhecimento de estatística é especialmente importante nesses
campos da ciência. Poderíamos dizer que o conhecimento de estatística e
probabilidade pode ser uma ferramenta poderosa para ajudar esses profissionais na
idealização de novos produtos e sistemas, melhorando idéias já existentes e
idealizando, desenvolvendo e melhorando processos de produção.

___________________________________________________________________________________
2
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

1.1– Somatório

Muitos dos processos estatísticos exigem o cálculo da soma. Para simplificar a


representação da operação de adição nas expressões algébricas, utiliza-se a notação

∑ , letra grega sigma maiúsculo.


As principais representações são:
n
1) ∑X
i=1
i = X1 + X 2 + ... + Xn , soma simples

n
Lê-se ∑X
i =1
i como: somatório de X índice i, com i variando de 1 até n, onde:

n, é a ordem da última parcela ou limite superior (LS) do somatório;


i = 1, é a ordem da primeira parcela da soma ou limite inferior do somatório (L I );
i, é o índice que está indexado os valores da variável X (outras letras como j, l, k
podem ser utilizadas).
n
2) ∑X
i=1
2
i = X12 + X 22 + ... + X n2 , soma de quadrados (SQ)

2
 n 
(
3)  ∑ X i  = X1 + X 2 + ... + X n , quadrado da soma
2
)
 i =1 
n
4) ∑X Y = X Y + X
i=1
i i 1 1 2 Y2 + ... + X n Yn , soma de produtos (SP)

n m
5) ∑ Xi ∑ Yj = (X1 + X2 + ... + Xn )x(Y1 + Y2 + ... + Ym ) , produto das somas.
i=1 j=1

Exemplo:

Considera as variáveis X e Y que representam, respectivamente, as notas de


duas disciplinas, para um grupo de 6 alunos.
X = {90,95,97,98,100,60}

Y = {60,70,80,60,90,75}
Calcule:
2
6 6
 6 
a) ∑X i = 540 b) ∑ X = 49738
2
i c)  ∑ Xi  = 291600
i=1 i=1  i=1 

___________________________________________________________________________________
3
Capítulo 1 – Introdução à Estatística
_____________________________________________________________________
6
 6  6 
d) ∑ X i Yi = 39190 e)  ∑ X i  ∑ Yi  = 234900
i=1  i=1  i=1 
1.1.1 Número de termos (parcelas) do somatório (NT)

O número de termos ou parcelas de um somatório (NT) pode ser obtido por:


NT = (LS – LI) + 1
Se o somatório está sujeito a r restrições basta fazer:
NT = (LS – LI) + 1 – r

Exemplos: Obter o número de termos para os seguintes somatórios:

8 15
a) ∑ Xi ,NT = (8 − 3) + 1 = 6
i=3
b)
k =1
∑ Y ,NT = (15 − 1) + 1− 2 = 13
k

k ≠ 9,11

9 8
c) ∑∑ Z kl , NT = [(9 − 1) + 1]x[(8 − 5 ) + 1] = 36
k =1 l=5

Obs:

Z15 + Z16 + Z17 + Z18 + 


+ Z + Z + Z + + 
9 8
 
∑∑ Z kl , NT =  25 26

+ ... +
27 28
 9x4 = 36 termos
k =1 l=5  
+ Z 95 + Z 96 + Z 97 + Z 98 

1.1.2 – Propriedades de somatório

As propriedades facilitam o desenvolvimento das expressões algébricas com a


notação do somatório. O objetivo é desenvolver as expressões até chegar às somas
simples e/ou somas de quadrados.

P.1. Somatório de uma constante k


O somatório de uma constante é igual ao produto do número de termos pela
constante.
n

∑ k = k + k + ... + k = nk
i=1

___________________________________________________________________________________
4
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Exemplos:
10 12
a) ∑ 5 = [(10 − 1) + 1](5 ) = 10(5 ) = 50 b) ∑ Yj = [(12 − 3 ) + 1]Yj = 10Yj
i=1 i=3

P.2. Somatório do produto de uma constante por uma variável


O somatório do produto de uma constante por uma variável é igual ao produto
da constante pelo somatório da variável.

n n

∑ kX i = kX1 + kX 2 + ... + kX n = k (X1 + X 2 + ... + Xn ) = k ∑ Xi


i=1 i=1

Exemplos:

n
Xi 1 n 1
a)∑ = ∑ X i , k =
i=1 2 2 i=1 2
n m n m

∑ ∑ X Y = ∑ X ∑ Y , pois X é uma constante para o somatório em relação a j.


i=1 j=1
i j
i=1
i
j=1
j

3 2 3 2
Verifique para X = {2,4,6} e Y = {3,5} , que ∑ ∑ X iYj = ∑ Xi ∑ Yj = 96
i=1 j=1 i=1 j=1

P.3. Somatório de uma soma ou subtração de variáveis


O somatório de uma soma ou subtração de variáveis é igual á soma ou
subtração dos somatórios dessas variáveis.

Sem perda de generalidade, para três variáveis X, Y, e W, tem-se:


n n n n

∑ (X
i =1
i + Yi − Wi ) =∑ X i + ∑ Yi − ∑ Wi
i =1 i =1 i =1

___________________________________________________________________________________
5
Capítulo 1 – Introdução à Estatística
_____________________________________________________________________
1.1.3 – Somatório duplo

Considere a Tabela a seguir:

1 2 ... j ... s
s
1 X 11 X 12 ... X 1j ... X 1s ∑X
j=1
1j

s
2 X 21 X 22 ... X 2j ... X 2s ∑X
j=1
2j

... ... ... ... ... ... ... ...


s
I X i1 X i2 ... X ij ... X is ∑X
j=1
ij

... ... ... ... ... ... ... ...


s
R X r1 X r2 ... X rj ... X rs ∑X
j=1
n

r r r r

∑X
i =1
i1 ∑X
i =1
i2 ... ∑X
i =1
ij ... ∑X
i =1
is G

G = total geral

X ij → i = 1, 2, ..., r (índice de linha)


j = 1, 2, ...., r (índice de coluna).

r r r r
G = ∑ Xi1 + ∑ X i2 + ... + ∑ X ij + ... + ∑ X is
i=1 i=1 i=1 i=1

= ∑ (X i1 + X i2 + ... + X ij + ... + X is )
r

i=1
r s r,s s r s,r

∑∑ X ij = ∑X ij = X.. , ou ainda G = ∑∑ Xij = ∑X ij = X..


i=1 j=1 i=1, j=1 j=1 i=1 j=1,i=1

s
Total da i-ésima linha: ∑X
j=1
ij = Xi .
r
Total da j-ésima coluna: ∑X
i=1
ij = X.j

1.1.4 – Exercícios propostos

1) Considerando os seguintes valores:

X1 = 2 X2 = 6 X3 = 7 X4 = 9
Y1 = 1 Y2 = 4 Y3 = 5 Y 4 = 11

Calcular:

___________________________________________________________________________________
6
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
3 4
a) ∑ (Yi − 2) b) ∑ (X i − 4Yi )
2

i=1 i=1

d) ∑∑ 3(X i − Yj )
3 4 4 3
c) ∑∑ (Xi + 2)
i=1 j=2 i= 2 j= 2

R: a) 14; b) - 60; c) 63 e d) 51

2) Efetuar

3
 1 6 2
i−3
a) ∑  i2 +  b) (opcional )∑∑ (i + j). 
i= −1  j i=3 j=0  i 

R: a) 5(3 + 1/j); b) 429/20

3) Calcule X 1 e X 3 , dado que:

6 6 6 6

∑X
i=1
i = 42 ∑X
i=1
2
i = 364 ∑X
i=1
i = 34 ∑X
i=1
2
i = 324
i≠1,3 i≠1,3

1.2 – Produtório

O símbolo produtório é utilizado para facilitar a representação dos produtos.


Utiliza-se a notação ∏ , letra grega pi maiúsculo.

n
Representação: ∏X
i =1
i = X1 . X 2 ..... X n

Fatos:

n
1) b 1 . b 2 . ... . b n = ∏b
i =1
i

n
2) b. b. b. ... b = ∏b = b
i =1
n

n fatores
n n
3) ∏ cX i = cX i . cX 2 . ... .cX n = c n . X1 . X 2 . ... . X n = c n ∏ X i
i =1 i =1
n
 n  n 
4) ∏X Y i i = X1Y1 . X 2 Y2 . ... . X n Yn = (X1 . X 2 . ... .X n )(Y1 . Y2 . ... .Yn ) =  ∏ X i  ∏ Yi 
i =1  i =1  i =1 
n
5) ∏ i = 1.2.3. ... .n = n!
i =1
n n
6) log ∏ X i = log(X1 . X 2 . ... .X n ) = log X1 + log X 2 + ... + log X n = ∑ log X i
i =1 i =1

___________________________________________________________________________________
7
Capítulo 1 – Introdução à Estatística
_____________________________________________________________________
1.2.1 – Exemplo:
Sabendo-se que:

X1 = 2 X2 = 3 X3 = 5
Y1 = 3 Y2 = 5 Y3 = 7

Calcular:
3
a) ∏x
i =1
i = X1 . X 2 . X 3 = 2 .3.5 = 30
3
b) ∏Y
i =1
i = Y1 . Y2 . Y3 = 3.5. 7 = 105
3 3
c) ∏ 3. X i = 33 ∏ X i = 27(30) = 810
i =1 i =1
3
 3  3 
d) ∏ X i Yi =  ∏ i  ∏ Yi  = (30 )(105) = 3150
 X
i =1  i =1  i =1 

1.2.2 - Exercícios propostos

1) Seja uma variável X, assumindo os seguintes valores:

X = {5, 2, 3, 0, 1, 2, 6, 9, 4, 8} n = 10

Calcule:

2
 10 
 ∑ Xi 
X i −  i=1 
10

10 10
 10 
2 ∑
a) ∑ X i ∑X c)  ∑ X i 
10
b) 2
d) i=1
10 − 1
i
i =1 i =1  i=1 

10 10

∑ (X i − 4) ∑X
2
10 10 i

∑ (X i − 4) ∑ (X i − 4) i =1 i =1
2
e) f) g) h)
i =1 i =1 10 − 1 10

5 5
2) Sabendo-se que ∑ X i = −6 e ∑ X i2 = 12 , calcule:
i =1 i =1
5 5 5
a) ∑ (4X i + 5) b) ∑ X i (X i − 2 ) c) ∑ (X i − 3)
2

i =1 i =1 i =1

3) Utilizando os dados da Tabela abaixo, calcule:

j 1 2 3 4
i
1 8 7 5 9
2 4 0 10 2

___________________________________________________________________________________
8
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
2 4 2 4 4
a) ∑ X i1
i =1
b) ∑X j=1
1j c) (opcional) ∑∑ X
i =1 j=1
ij d) ∑ X 2 j
j=1
j≠ 3
3 4 4 4
1
e) ∑ X 2 j f) ∑ g) ∏ 6X1 j h) ∏ X 2 j
j= 2 j=1 X2j j=1 j=1
j≠ 2 j≠ 3 j≠ 2

4) Desenvolver:
3
 1
a)∑  i2 + 
5
b)∑∑
4
(i 2
− j2 j ) 5 
c)∑ (i + 8 )
2 5
d)∏ (i + 8 )
i= −1  j j=1 i=2 i+ j  i=1  i=1
j≠ 4

3 3
5) Se ∑X i=1
i = 12 ∑X i=1
2
i = 56 e Y 1 = 3, Y 2 = 5, Y 3 = 6, calcule:

( )
3 3 3 3
a)∑ 9 b)∑ 12 Xi c)∑ Xi2 − 2 d)∑ (Xi ⋅ Yi )
i=1 i=1 i=1 i=1

6) Se X1 = 2 , X 2 = 4 , X 3 = 6 e Y1 = 3 , Y2 = 5 , Y31 = 6 , calcule:

3 3
a)∑ (X i ⋅ Yi ) b)∑ (X i − 2) ⋅ (Yi − 5 )
i=1 i=1

7) Calcule X 9 e X 21 , sabendo que:


50 50 50 50

∑ Xi = 200
i=1
∑ Xi2 = 1206
i=1
∑ Xi = 190
i=1
∑X
i=1
2
i = 1154
i≠ 9 e 21 i≠9 e 21

8) Dados:
i Yi Xi
1 3 3
2 8 4
3 2 8
4 5 7
5 6 6

Calcule:

___________________________________________________________________________________
9
Capítulo 1 – Introdução à Estatística
_____________________________________________________________________
5 5 5 4 5
a)∑ X i b)∑ 4X i c)∑ (Xi + 6 ) d)∑ (2X i − 3 ) e)∑ Xi Yi
i=1 i=1 i=3 i= 2 i=1
i≠ 2

5
f)∑ (X i + Yi )
i=1

___________________________________________________________________________________
10
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

2.0 – ESTATÍSTICA DESCRITIVA

Diversas áreas da investigação científica têm a necessidade da coleta de dados


de um fenômeno a ser estudado. Entretanto, esses dados possuem uma característica
comum a inúmeros conjuntos extraídos das mais diferentes áreas da investigação
científica que é a variabilidade. Assim, o cientista necessita de métodos que
possibilitem que os dados coletados sejam sumariados e analisados para que o
fenômeno sob estudo possa ser caracterizado ou que suas origens possam ser
conhecidas parcial ou integralmente.
Podemos dividir a Estatística em duas áreas: estatística indutiva (inferência
estatística) e estatística descritiva.

2.1 – Estatística indutiva (Inferência estatística)

Se uma amostra é representativa de uma população, conclusões importantes


sobre a população podem ser inferidas de sua análise.
A parte da estatística que trata das condições sob as quais essas inferências
são válidas chama-se estatística indutiva ou inferência estatística. Este assunto iremos
tratar apenas no final desse curso. Neste capítulo, estudaremos a outra área da
estatística, que é a Estatística Descritiva.

2.2 – Estatística Descritiva


É o ramo da estatística que lida com a organização, o resumo e a apresentação
dos dados, procurando somente descrever e avaliar um certo grupo, sem tirar
quaisquer conclusões ou inferências sobre um grupo maior.

A Estatística Descritiva pode ser resumida nas seguintes etapas:


• Definição do problema;
• Planejamento (idéia – experimento);
• Coleta dos dados (variável resposta);
Crítica dos dados
• Apresentação dos dados;
tabelas

___________________________________________________________________________________
11
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________

gráficos
• Descrição dos dados.

Em estatística descritiva teremos portanto dois métodos que podem ser usados
para a apresentação dos dados: métodos gráficos (envolvendo apresentação gráfica
e/ou tabular) e métodos numéricos (envolvendo apresentações de medidas de
posição e/ou dispersão).

2.3 – Tipos de dados


Os dados podem ser classificados como qualitativos e quantitativos. As
variáveis qualitativas podem ser classificadas ainda como nominais, para as quais não
existe nenhuma ordenação nas suas possíveis realizações, ou como ordinais, para as
quais os seus possíveis resultados podem ser ordenados por algum critério específico.
Exemplos: dados qualitativos nominais→ coloração; dados qualitativos o rdinais →
altura (alta, média e baixa).
As variáveis quantitativas, ao contrário das qualitativas que apresentam as
qualidades (ou atributos) de um elemento pesquisado, representam as possíveis
realizações como números, resultantes de uma contagem ou mensuração. Essas
variáveis podem ser divididas em dois tipos: (a) variáveis quantitativas discretas, cujas
possíveis realizações formam um conjunto finito ou enumerável de números, o qual é
resultante, geralmente, de contagem. Pode se exemplificar esse tipo de variável pelo
salário dos trabalhadores em uma determinada empresa (1, 2, 3, 4, ..., K salários
mínimos); (b) variáveis quantitativas contínuas, cujos possíveis valores formam um
intervalo de números reais resultantes em geral de mensurações. Como exemplos de
dados quantitativos contínuos temos: peso de animais, altura de plantas, entre outros.

2.4 – População e amostra

População: do ponto de vista estatístico, o conjunto de todos os elementos


sobre os quais desejamos desenvolver determinado estudo, constitui uma população.
Os elementos podem ser seres humanos, árvores, domicílios, animais, áreas e
objetos. Quando consideramos apenas uma parte deles, ou seja, um subconjunto da
população, temos uma amostra.

___________________________________________________________________________________
12
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

As medidas calculadas na amostra (estimativas) passam a ser as informações


disponíveis para os valores populacionais desconhecidos (parâmetros). Quando
trabalhamos com todos os dados de uma população, procedemos a um censo, é,
quando trabalhamos com parte da população procedemos a uma amostragem.

População Amostra

2.5 – Coleta, organização e apresentação dos dados

Numa fase inicial dos levantamentos amostrais é necessário formular o


problema e aventar sobre o objeto de estudo ou expectativas sobre os possíveis
resultados. Ainda nesta fase inicial, o investigador deve definir a população de estudo,
parte identificável e acessível da população objeto, os objetivos e as variáveis
observadas. Numa segunda etapa é realizado o planejamento, elaborando o plano de
amostragem ou determinando o caminho a ser percorrido para atingir os objetivos
propostos. O plano de amostragem compreende a definição do tamanho e do desenho
da amostra, e ainda, a escolha de procedimentos para a obtenção de estimativas.
Finalmente, os dados são coletados, conferidos e processados. Análises estatísticas
são, então, realizadas nessa fase e os resultados interpretados retornando-se ao plano
das hipóteses e das expectativas, a fim de que os objetivos sejam efetivamente
cumpridos e que sejam obtidas as respostas para as questões em estudo.
Uma população pode ser finita ou infinita. Exemplos de população finita: Alunos
de um determinado curso no CRP, os produtos do Supermercado Rainha, nº de livros
na biblioteca nacional, dentre outros. Exemplos de população infinita: produção futura
de uma máquina, extrações com reposição de bolas de uma urna, dentre outros.
Do ponto de vista prático a população é infinita se a remoção de um item ou de
um pequeno nº de itens não terá influencia discernível nas probabilidades relativas.
Para fins de amostragens, certas populações, embora finita podem ser
consideradas infinitas. Isto ocorre sempre que a amostra constitui-se de no máximo
5% dos elementos de uma população. Assim, por exemplo, se tomarmos uma amostra

___________________________________________________________________________________
13
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________

de 100 habitantes de uma cidade com 70000 habitantes (5% de 70000 = 3500
habitantes, portanto 100 < 5%), está população embora finita, é considerada como se
fosse infinita.

2.6 - Apresentação gráfica e tabular

Os gráficos constituem uma das formas mais eficientes de apresentação de


dados. Um gráfico é, essencialmente, uma figura constituída à partir de uma tabela,
pois é quase sempre possível locar um dado tabulado num gráfico.
Enquanto as tabelas fornecem uma idéia mais precisa e possibilitam uma
inspeção mais rigorosa aos dados, os gráficos são mais indicados em situações que
objetivam dar uma visão mais rápida e fácil a respeito das variáveis às quais se
referem os dados.
Embora a confecção de gráficos dependa muito da habilidade individual,
algumas regras gerais são importantes. O leitor deve ficar atento e procurar saber
sobre tais regras antes de se envolver na confecção de gráficos.

Exemplo: Dados brutos obtidos numa amostra de 14 plantas da geração F2 do


cruzamento de uma planta de ervilha com sementes amarelas e lisas (AL) com outra
de sementes verdes e rugosas (VR).
AL AL VL AL AR VL VR AL VL AL AL AR AR AL

Para melhorar a apresentação é possível ordenar os dados em uma sequência


crescente ou descrescente, ou agrupá-los quanto as suas categorias ou atributos.

Exemplo: Dados elaborados obtidos numa amostra de 14 plantas da geração F2 do


cruzamento de uma planta de ervilha com sementes amarelas e lisas (AL) com outra
de sementes verdes e rugosas (VR).
AL AL AL AL AL AL AL AR AR AR VL VL VL VR

A evidente necessidade de resumir os dados, sem perda de muita informação


contida neles, eles poderiam ser resumidos agrupando suas categorias e
apresentando-os em tabelas ou gráficos.

___________________________________________________________________________________
14
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

Exemplo: Classes fenotípicas e suas respectivas freqüências obtidas numa amostra de


14 plantas da geração F2 do cruzamento de uma planta de ervilha com sementes
amarelas e lisas (AL) com outra de sementes verdes e rugosas (VR).
Classe fenotípica Frequências (F i )
AL 7
AR 3
VL 3
VR 1

a b

Gráfico de setores (a) e gráfico de colunas (b) mostrando formas alternativas para
representar as classes fenotípicas da segregação F2 do cruzamento.

Existem vários tipos de gráficos que podem ser utilizados com o objetivo de
descrever um conjunto de dados resumidamente. Alguns deles serão aqui
exemplificados. Vejamos, primeiro, uma forma tabular de apresentação de dados e, a
seguir, veremos 3 tipos de apresentação gráfica.

• Distribuição de frequência
Organização tabular dos dados em classes de ocorrência, ou não, segundo
suas respectivas frequências absolutas. Em alguns casos há também o interesse de
se apresentar os dados em frequências relativas ou acumuladas. Para dados
quantitativos não é possível efetuar o mesmo tipo de tratamento que para os dados
qualitativos nominais, sendo estes representados então em classe de intervalos.
A apresentação dos dados em tabelas obedecem a certas normas e
recomendações. Essas normas são úteis para que as tabelas sejam feitas de modo
que simplicidade, clareza e veracidade perdurem. Diferentes revistas costumam usar
pequenas variações na confecção de suas tabelas. Uma observação importante é que
as tabelas devem ter significado próprio, ou seja, devem ser entendidas mesmo
quando não se lê o texto em que estão apresentadas. O mesmo é válido para as
tabelas de distribuição de frequências.

___________________________________________________________________________________
15
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________

Exemplo:
Foram anotados os pontos finais dos alunos de CRP 192, referentes ao
segundo semestre de 2009. Foi feita a contagem e depois a organização dos dados na
seguinte tabela:
Conceitos (Notas) Número de alunos Porcentagem
A (90 a 100) 14 7,07
B (75 a 89) 32 16,16
C (60 a 74) 50 25,25
R (<60) 63 31,82
L (Reprovação por falta) 39 19,70
198 100,00
FONTE: Professores de CRP 192 – Iniciação à Estatística.

O grande problema é definir o número de classes ideais. A primeira pergunta é


qual o número de classes, um critério empírico é utilizar entre 5 e 20 classes em
função do conhecimento do investigador.

• Diagrama de pontos (dot diagram)


Este tipo de diagrama é muito útil para apresentar um pequeno conjunto de
dados (até cerca de 20 observações). Assim podemos ver, de uma maneira rápida e
fácil, a tendência central dos dados, além da sua distribuição ou variabilidade.

Exemplo:
Considere o seguinte resultado de um experimento no qual o engenheiro testa
adição de uma substância em cimento de construção para determinar seu efeito na
força da tensão de aderência (em determinada unidade/cm2):

Para esse conjunto de dados o diagrama de pontos seria:

___________________________________________________________________________________
16
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

Observe que os dados estão centrados num valor próximo de 16,8 e que os
valores da tensão de aderência caem no intervalo de cerca de 16,3 até 17,2 ud/cm2.
Este tipo de diagrama pode também ser usado para se comparar dois ou mais
conjuntos de dados. Por exemplo suponha ter sido verificado a tensão de aderência
em cimentos não modificados. Os resultados são apresentados abaixo.

Faça você mesmo o diagrama de pontos para os dois conjuntos de dados, ou


seja, colocando ambos os conjuntos de dados no mesmo diagrama. Observe que o
diagrama revela imediatamente que o cimento modificado parece ter uma menor força
de tensão de aderência, mas que a variabilidade das medidas dentro de ambos os
conjuntos de dados parece ser a mesma.
Testes estatísticos para verificar essas duas afirmativas podem ser realizados
com esses dados apresentados, e serão discutidos no momento oportuno.
Quando o número de observações é pequeno, geralmente se torna difícil
identificar algum padrão específico de variação. No entanto este tipo de diagrama
pode ser útil em mostrar alguma característica incomum no conjunto de dados.

• Diagrama de ramos e folhas (stem-and-leaf diagram)


Quando o número de observações é relativamente grande, este diagrama pode
ser de boa utilidade.

Exemplo: Barulho é medido em decibéis, representado por dB. Um decibel


corresponde ao nível do som mais fraco que pode ser ouvido em um local silencioso
por alguém com boa audição. Um sussurro corresponde a cerca de 30 dB; a voz
humana em conversação normal corresponde a cerca de 70dB; um rádio em volume
alto cerca de 100 dB; Desconforto para os ouvidos geralmente ocorre a cerca de 120
dB. Os dados abaixo correspondem aos níveis de barulho medidos em 36 horários
diferentes em um determinado local.

o gráfico de ramos e folhas para o conjunto acima é:

___________________________________________________________________________________
17
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________

Ramo Folha

O inconveniente desta representação é quando aos dados com várias casas


decimais.

• Histograma
Para alguns conjuntos de dados o número de valores distintos da variável em
estudo é muito grande para serem considerados os tipos de apresentação gráfica
apresentados acima. Em tais casos seria útil dividir os valores em grupos, ou intervalos
de classe, e então plotar o número de valores dos dados correspondentes a cada
intervalo de classe. Existem várias fórmulas para se estabelecer o número de classes,
porém qualquer número de classes poderia ser utilizado, baseando-se nas seguintes
observações:
(a) não escolher muito poucas classes, para evitar perda de informação sobre os
dados;
(b) não escolher muitas classes, o que poderia fazer com que as frequências
referentes a cada classe fossem tão pequenas a ponto de atrapalhar o discernimento
de algum padrão de distribuição para a variável em estudo.
O que se faz na prática é tentar variados números de classes e verificar, com a
ajuda de um computador, o número ideal para os dados em questão. Além disso,
comumente usamos intervalos de classe de iguais amplitudes.

Exemplo: (envolvendo distribuição de frequência e histograma, com algumas


variações)
Suponhamos que uma empresa deseja avaliar a distribuição dos salários pagos
por hora a seus funcionários. O estatístico da empresa possui os seguintes dados:

___________________________________________________________________________________
18
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

Temos ai o que chamamos dados brutos.


Dados como estes poderiam ser agrupados em classes. Uma maneira de
escolher o número de classes poderia ser usarmos um valor próximo à raiz quadrada
do número de observações. Poderíamos usar, então, 5 classes. Tomando-se a
diferença entre o maior e o menor valor do conjunto de dados, e dividindo pelo número
de classes escolhido teríamos: (15,8 – 8,3)/5 = 1,5. Esse seria o valor para amplitude
da classe, ou intervalo da classe. A seguinte tabela pode ser construída (com intervalo
fechado à esquerda):
Classes freqüências
8,3 – 9,8 5
9,8 – 11,3 7
11,3 – 12,8 9
12,8 – 14,3 6
14,3 – 15,8 3
30

Agora podemos ter uma idéia da distribuição dos salários. Apenas com essas
informações poderíamos concluir que a classe de salários predominante na empresa é
a terceira, ou seja, com salários de 11,3 a 12,8 salários mínimos.
Se quiséssemos obter maiores informações sobre os dados, poderíamos
montar uma nova tabela, incluindo outros tipos de frequência, como: frequência
acumulada (f a ), frequência relativa (f r ), e frequência acumulada relativa (f ar ).
Classes fi f ai f ri f ari
8,3 – 9,8 5 5 0,17 0,17
9,8 – 11,3 7 12 0,23 0,40
11,3 – 12,8 9 21 0,30 0,70
12,8 – 14,3 6 27 0,20 0,90
14,3 – 15,8 3 30 0,10 1,00
30 1,00

Discussão: exemplos
 na terceira coluna, a frequência acumulada 21 indica que, nessa
empresa, 21 funcionários recebem salários/hora abaixo de 12,8 unidades;
 podemos constatar, também, uma certa predominância de salários mais
baixos. Realmente cerca de 70% da distribuição de salários concentra-se até o
salário de 12,8 unidades;

___________________________________________________________________________________
19
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________

 os maiores salários serve a apenas 10% dos funcionários da empresa;


 40% dos funcionários (12 funcionários) recebem até 11,3 unidades, sendo 23%
(ou seja, 7 funcionários) recebendo entre 9,8 e 11,3 unidades.
Essas informações preliminares, bem como outras, seriam impossíveis de
serem obtidas se a população de funcionários fosse muito maior e os dados
correspondentes não estivessem tabelados.
O histograma pode ser feito a partir das frequências simples de cada classe ou
a partir das frequências relativas. Bastaria informar corretamente o que seria usado no
eixo vertical.

Algumas vezes há o interesse em plotar as frequências acumuladas, ou


frequências acumuladas relativas. Nesse caso teríamos a chamada Ogiva, ou ogiva
percentual, respectivamente (veja abaixo).

2.7 - Medidas de posição e de dispersão


Nesse tópico serão apresentadas algumas estatísticas úteis para resumir, de
modo bastante conciso, as informações contidas em um conjunto dos dados.
Estatística, nesse contexto, significa alguma quantidade numérica cujo valor é
determinado pelos dados.

2.7.1 - Medidas de Posição ou tendência central

___________________________________________________________________________________
20
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

Serão apresentadas algumas estatísticas usadas para descrever o centro de um


conjunto de dados.

 Média Aritmética
É a medida de posição mais comum, intensa e extensivamente utilizada.
Suponha termos um conjunto de n valores numéricos x 1 , x 2 , …, x n . A média aritmética
desses valores será dada por:
n

∑x i
É a soma das observações dividida pelo número de observações.
x= i=1
n
exemplo:

Considere o seguinte conjunto de dados:


284, 280, 277, 282, 279, 285, 281, 283, 278, 277
encontre a média desses valores?

solução: uma solução é a seguinte, ao invés de adicionar esses valores diretamente,


fica mais fácil se subtrairmos 280 de cada um para obter os novos valores y i = x i –
280:
4, 0, -3, 2, -1, 5, 1, 3, -2, -3.
A média dos valores transformados será:

y=6 = 0,6
10

Desse modo,
x = y + 280 = 286

Algumas vezes queremos determinar a média de um conjunto de dados


organizados em uma tabela de distribuição de frequências onde os k valores distintos
de X (x 1 , x 2 , …, x k ) ocorrem nas respectivas frequências f 1 , f 2 , …, f k . Nesse caso a
média aritmética será dada por:
k

∑fx i i k
x= i=1
, onde n = ∑ f i
n i=1

Escrevendo a fórmula anterior como

___________________________________________________________________________________
21
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________

fi f f
x= x1 + i x 2 +  + i x k
n n n
pode ser observado que a média amostral corresponde à média ponderada dos
valores distintos de X na amostra, onde o peso dado a cada valor x i nesse caso
corresponde à proporção dos n valores iguais a x i , com i = 1 a k.

exemplo: a seguinte distribuição de frequência dá as idades de jovens em


determinado local de ocorrência do vestibular para os cursos do UFV/CRP.
Idade Frequência
15 2
16 5
17 11
18 9
19 14
20 13

Encontre a média aritmética da idade dos indivíduos acima.


solução:
x = (2 x 15 + 5 x 16 + 11 x 17 + 9 x18 + 14 x19 + 13 x20)/54 = 18,24

OBS.: se a tabela for organizada em classes de valores da variável, para o cálculo da


média devemos substituir cada classe pelo seu ponto médio (média aritmética do limite
superior e inferior da classe em questão) e calcular a média conforme discutido acima.

Propriedades

i) A soma dos desvios em relação à média é igual a zero para qualquer amostra.

∑ (X − X) = 0
n

i
i=1

ii) A soma ou subtração de uma constante (k) aos dados altera a média de tal
forma que a nova média fica adicionada ou subtraída pela constante.
n

∑X i
Yi = Xi ± k e X= i=1
n
então

___________________________________________________________________________________
22
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
n n n

∑ (X i ± k ) ∑ X i ∑ k nk
Y= i=1
= i=1
± i=1
= X± = X±k
n n n n
iii) A multiplicação dos dados ou divisão por uma constante (k) aos dados altera a
média de tal forma que a nova média fica multiplicada ou dividida pela
constante.
n

∑X i
Yi = k ⋅ Xi , com k ∈ ℜ e X= i=1
,
n
então
n n n

∑ Yi ∑ (k ⋅ Xi ) ∑X i
Y= i=1
= i=1
=k i=1
=k⋅X
n n n

iv) A média é influenciada por valores extremos. A média tenderá a ser grande, se
existirem alguns poucos valores que são maiores que a maioria das
mensurações realizadas, ou a ser pequena, se existirem na amostra alguns
poucos valores menores que a maioria das mensurações.

 Mediana amostral

Outra estatística usada para indicar o centro de um conjunto de dados é a


mediana amostral, que pode ser definida, em um conjunto de dados ordenados como
o valor central, ou seja, o valor para o qual há tantas mensurações que o superem
quanto são superados por ele, cujos n valores são dispostos em ordem crescente.
Se n for ímpar, a mediana será o valor que ocupa a posição (n + 1)/2; se n for
par, a mediana será a média aritmética dos valores ocupando as posições n/2 e n/2
+1.
Exemplo: encontre a mediana para os dados apresentados acima.
solução: já que temos 54 observações, segue que a mediana amostral será a
média dos valores ocupando as posições 27 e 28, quando essas 54 observações são
organizadas em ordem crescente. Portanto a mediana será o valor 18,5.

OBS.: a escolha entre média e mediana depende do tipo de informação o pesquisador


tenta obter dos dados. A média é afetada por valores extremos ocorrendo na

___________________________________________________________________________________
23
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________

distribuição, enquanto a mediana faz uso de apenas um ou dois valores centrais, não
sendo, portanto, afetada por valores extremos.

Propriedades

i) A soma ou subtração de uma constante (k) aos dados altera a mediana de tal
forma que a nova mediana fica adicionada ou subtraída pela constante.
Sejam Yi = Xi ± k

então mdY = mdX ± k

ii) A multiplicação dos dados ou divisão por uma constante (k) aos dados altera a
mediana de tal forma que a nova mediana fica multiplicada ou dividida pela
constante.
Sejam Yi = k ⋅ Xi , com k ∈ ℜ

então mdY = k ⋅ mdX

iii) A mediana não é influenciada por valores extremos. Desta forma, é considerada
uma estimativa menos informativa que a média. No entanto, a mediana pode,
em algumas ocasiões, ser mais vantajosa que a média pelo fato de não ser
afetada pelos extremos. Assim, se as distribuições são assimétricas, a mediana
pode ser uma melhor medida de tendência central.

 Moda amostral
Outra estatística que tem sido usada para indicar a tendência central de um
conjunto de observações é a moda amostral. Ela é definida como o valor que ocorre
com maior frequência. Podemos ter séries unimodais, bimodais ou multimodais,
dependendo do número de valores modais ocorrendo na amostra.
Exemplo: encontre a moda para o mesmo exemplo acima.
solução: a moda será o valor 19, pois esse valor ocorre com maior frequência
na distribuição. Essa é uma distribuição unimodal.

___________________________________________________________________________________
24
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

Propriedades

i) A soma ou subtração de uma constante (k) aos dados altera a moda de tal
forma que a nova moda fica adicionada ou subtraída pela constante.
Sejam Yi = Xi ± k

então moY = moX ± k

ii) A multiplicação dos dados ou divisão por uma constante (k) aos dados altera a
moda de tal forma que a nova moda fica multiplicada ou dividida pela constante.
Sejam Yi = k ⋅ Xi , com k ∈ ℜ

então moY = k ⋅ moX

2.7.2 - Medidas de Dispersão ou Variabilidade

Essas medidas são úteis para complementar as informações fornecidas pelas


medidas de posição. Descrevem a variabilidade ocorrendo no conjunto de dados
sendo analisados.

Exemplo: Produtividade de 3 variedades de milho em t/ha. O conjunto A é relativo a


um híbrido simples, o B, a um híbrido triplo e o C, a uma variedade de polinização
aberta.
A B C
4,27 3,44 1,27
4,60 3,76 3,30
4,72 4,55 3,50
4,95 4,86 5,25
4,99 5,30 5,44
5,17 5,42 5,51
5,21 5,81 5,72
5,42 5,89 6,04
5,63 5,94 6,39
6,00 5,99 8,54
x A = 5,096 x B = 5,096 x C = 5,096

___________________________________________________________________________________
25
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________

Os 3 tipos apresentam a mesma média. É fácil para o leitor perceber, com uma
inspeção mais criteriosa, que os conjuntos diferem razoavelmente um do outro.
Se os conjuntos numéricos fossem representados apenas pelas respectivas
médias, elas seriam consideradas iguais.

 Variância amostral

Para contornar o problema de a soma dos desvios, em relação à média


aritmética, ser sempre igual a zero é usar a soma de quadrados de desvios. Essa
propriedade relaciona-se a um dos principais métodos usados na estatística,
conhecido como método dos quadrados mínimos.

( )
n
SQ = ∑ X − X
2

i=1

A variância é definida dividindo-se a soma de quadrados de desvios pelo


tamanho da amostra. Ela pode ser considerada como um valor médio dos desvios ao
quadrado, portanto, sendo conhecida, também, por quadrado médio. O símbolo usado
para sua representação, consagrado na literatura estatística, é a letra grega minúscula
sigma, tomada ao quadrado ( σ 2 ).

σ =
2 SQ n Xi − X
=∑
( )
2

n i=1 n
Entretanto esta fórmula apresentada anteriormente possui associada a ela um
erro que denominamos viés. A soma de quadrados será dividida por n – 1 ao invés de
usar o n. A quantidade n – 1, usada como divisor é conhecida como graus de
liberdade.
2
 n 
 ∑ Xi 
∑ (X − X) Xi2 −  i=1 
n n


2
i
SQ n
σˆ 2 = s 2 = = i=1
= i=1
n −1 n −1 n −1

Se a cada valor de X i tivermos associado sua freqüência de ocorrência, então:

___________________________________________________________________________________
26
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
2
 k 
 ∑ f i Xi 
f X2 −  i =1 
k

∑ i i k
i =1
∑f i
σˆ = s =
2 2
k
i =1

∑f
i =1
i −1

A variância é extremamente útil como medida de variabilidade, sendo igual a


zero quando todas as mensurações são iguais entre si e crescendo à medida que se
aumentam as diferenças (dispersão) entre os elementos do conjunto mensurado.
Desta forma, não há variância negativa.

Exemplo: encontre a variância amostral para os dois conjuntos de dados abaixo:


A: 3, 4, 6, 7, 10 B: -20, 5, 15, 24
solução:
5 5
30
∑ A i = 30 ,
i =1
∑A
i =1
2
i = 210 e A =
5
=6

2
 n 
 ∑ Ai 
n
 i =1  (30 )
2

∑ i A 2

n
210 −
5 = 210 − 180 = 30 = 7,5
σˆ 2A = s2A = i =1 =
n −1 5 −1 4 4

4 4
24
∑ Bi = 24 ,
i =1
∑B
i =1
2
i = 1226 e B =
4
=6

2
 n 
 ∑ Bi 
n
Bi −  i = 1  (24 )2
∑ 2

n
1226 −
4 = 1226 − 144 = 1082 = 360,667
σˆ B2 = sB2 = i =1 =
n −1 4 −1 3 3

Portanto, apesar dos dois conjuntos terem a mesma média, há maior


variabilidade nos valores do conjunto B do que nos do conjunto A.

A variância tem a propriedade de não se alterar quando os dados são


adicionados ou subtraídos de uma constante, mas, quando esses dados são
multiplicados ou divididos por essa constante, a variância do novo conjunto é igual à

___________________________________________________________________________________
27
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________

variância do novo conjunto é igual à variância do conjunto, original multiplicada ou


dividida pela constante ao quadrado.

Exemplo: Dado o conjunto de dados abaixo, calcule a nova variância após a


multiplicação dos dados por uma constante igual a 2.
X0 = {6; 8;12;14; 20}

solução:
5 5
60
∑ Xi = 60 ,
i =1
∑X
i =1
2
i = 840 e X0 =
5
= 12

2
 n 
 ∑ Xi 
n
X i −  i =1  (60 )2
∑ 2

n
840 −
5 = 840 − 720 = 120 = 30
σˆ 2X 0 = s2X 0 = i =1 =
n −1 5 −1 4 4
Multiplicando o conjunto por 2:
X1 = {12;16; 24; 28; 40}
5 5
120
∑X
i =1
i = 120 , ∑X
i =1
2
i = 3360 e X1 =
5
= 24

2
 n 
 ∑ Xi 
n
 i =1  (120 )2
∑ i X 2

n
3360 −
5 = 3360 − 2880 = 480 = 120 , ou
σˆ 2X1 = s2X1 = i =1 =
n −1 5 −1 4 4
σˆ 2X1 = s2X1 = k 2 ⋅ σˆ 2X 0 = 22 ⋅ 30 = 120

 Desvio padrão

É definido tomando-se a raiz quadrada da variância. É representado por sigma


chapéu (σ̂ ) ou pela letra minúscula s.
2
 n 
 ∑ Xi 
X i −  i =1 
n

∑ 2

n
σˆ = s = i =1
n −1

___________________________________________________________________________________
28
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

Para dados agrupados, o desvio padrão é estimado por:


2
 k 
 ∑ fi Xi 
f X2 −  i =1 
k

∑ i i k
i =1
∑f i
σ̂ = s = k
i =1

∑f −1
i =1
i

O desvio padrão não é afetado pela soma ou subtração de uma constante (k)
aos dados. No entanto, ele se altera quando os dados são multiplicados ou divididos
por uma constante. Nesse caso, o novo desvio padrão será igual ao desvio padrão
original multiplicado ou dividido pela constante.
Quando o desvio padrão é pequeno, próximo de zero, existirá uma grande
concentração dos dados em torno da média. Por outro lado, se o desvio padrão for
grande os valores não se concentrarão com tal intensidade em torno da média.

 Amplitude total

A amplitude total é a diferença entre o maior e o menor valor da série. Tem a


vantagem de ser rápido e fácil de ser calculada, porém fornece um número índice
grosseiro da variabilidade de uma distribuição, por levar em conta apenas 2 valores de
um conjunto.

A = X k – X 1 , onde:
X k = último valor da série de dados ordenados;
X 1 = primeiro valor da série de dados ordenados.

 Erro-padrão da média

Ao retira-se várias amostras da população estas apresentam um desvio padrão


em relação a média populacional. O erro-padrão da média mede a precisão da média.
É uma medida da dispersão das médias amostrais em torno da média da população.
Sua fórmula é dada por:

s = s(x ) = σˆ
n

___________________________________________________________________________________
29
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________

 Coeficiente de Variação

O coeficiente de variação é uma medida de dispersão relativa. É uma medida útil


para comparação, em termos relativos, do grau de concentração, em torno da média,
de séries distintas. Por ser um número adimensional permite a comparação de séries
de variáveis com unidades diferentes. Sua fórmula é dada por:

σˆ
C.V.(%) = ⋅ 100
X

OBS.: se existem duas amostras distintas A e B, e se desejamos saber qual delas é a


mais homogênea, ou seja, de menor variabilidade, basta fazermos o seguinte:
calculamos as médias e os desvios padrões de A e B, e:

• Se X A = XB , então o próprio desvio padrão informará qual é a mais homogênea.

• Se X A ≠ XB , então a mais homogênea será a que tiver menor C.V.

OBS.: valores muito altos de C.V. indicam pequena representatividade da média.


Exemplo:Supor duas amostras:
A = {1, 3, 5} B = {53, 55, 57}
Qual das duas é a mais homogênea?
solução:
C.V. A = 2/3(100) = 66,7%
C.V. B = 2/55(100) = 3,6%

 Portanto a amostra B é a mais homogênea.

2.8 - Exercícios Propostos

1) Considerando os dados amostrais abaixo, calcular: média aritmética, variância,


desvio padrão, erro padrão da média e coeficiente de variação
Dados: 2, 3, 5, 1, 2, 1, 4, 3, 3, 4, 3.

R.: 2,81; 1,56; 1,24; 0,37; 44,12%


___________________________________________________________________________________
30
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

2) Em certa região a temperatura média é 20 ºC e a precipitação média é 700 mm. O


desvio padrão para temperatura é 3 ºC, enquanto que a variância para a precipitação é
1225 mm2. Qual dos dois fenômenos apresenta maior variabilidade? Justifique?

R.: a temperatura apresenta maior variabilidade relativa. Você justifica…

3) Um artigo retirado da revista Technometrics (Vol. 19, 1977, p. 425) apresenta os


seguintes dados sobre a taxa de octanagem de várias misturas de gasolina:

88,5 87,7 83,4 86,7 87,5 91,5 88,6 100,3 96,5 93,3 94,7
91,1 91,0 94,2 87,8 89,9 88,3 87,6 84,3 86,7 84,3 86,7
88,2 90,8 88,3 98,8 94,2 92,7 93,2 91,0 90,1 93,4 88,5
90,1 89,2 88,3 85,3 87,9 88,6 90,9 89,0 96,1 93,3 91,8
92,3 90,4 90,1 93,0 88,7 89,9 89,8 89,6 87,4 88,4 88,9
91,2 89,3 94,4 92,7 91,8 91,6 90,4 91,1 92,6 89,8 90,6
91,1 90,4 89,3 89,7 90,3 91,6 90,5 93,7 92,7 92,2 92,2
91,2 91,0 92,2 90,0 90,7

(a) Construa o diagrama de folhas-e-ramos para esses dados?


(b) Construa a distribuição de frequência e o histograma. Use 8 intervalos de classe?
(c) Construa a distribuição de frequência e o histograma, agora com 16 intervalos de
classe?
(d) Compare a forma dos dois histogramas em b e c. Ambos os histogramas mostram
informações similares?

4) O seguinte conjunto de dados representa as “vidas” de 40 baterias de carro da


mesma marca e mesmas características com aproximação até décimos do ano. As
baterias tinham garantia para 3 anos.

2,2 4,1 3,5 4,5 3,2 3,7 3,0 2,6 3,4 1,6 3,1
3,3 3,8 3,1 4,7 3,7 2,5 4,3 3,4 3,6 2,9 3,3
3,9 3,1 3,3 3,1 3,7 4,4 3,2 4,1 1,9 3,4 4,7
3,8 3,2 2,6 3,9 3,0 4,2 3,5

(a) Construa a distribuição de frequência e o histograma;


(b) Faça o gráfico da distribuição de frequências relativas acumuladas.

___________________________________________________________________________________
31
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________

(c) Calcule a média aritmética dos dados originais


(d) Usando a distribuição de frequência conforme obtido em (a) calcule a média
novamente. Para tal, considere os pontos médios de cada classe (média entre os dois
limites de cada classe) para serem os valores da variável no cálculo da média.
(e) Obtenha a variância para os dados originais conforme feito para a média em (c).
(f) Obtenha a variância a partir da distribuição de frequência conforme feito para a
média no ítem d.
obs.: use 7 intervalos de classe. Amplitude da classe igual a 0,5. E o início do intervalo
mais baixo em 1,5.

5) Calcule a média, mediana, e amplitude total dos valores dispostos no seguinte


diagrama de ramos e folhas.

6 05589
7 244578
8 233578
9 001445
10 0278
11 0245
12 245

___________________________________________________________________________________
32
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

3.0 - AMOSTRAGEM

3.1 – Introdução

A realização de pesquisas é calcada em questões relativas às tomadas de


observações da realidade, ou seja, obter uma amostra da realidade. Os levantamentos
por amostragem têm a finalidade de reproduzir a realidade estudada. Estes se aplicam
ao conjunto real composto de elementos, denominado de população de estudo.
População: do ponto de vista estatístico, o conjunto de todos os elementos sobre os
quais desejamos desenvolver determinado estudo, constitui uma população. Os
elementos podem ser seres humanos, árvores, domicílios, animais, áreas e objetos.
Quando consideramos apenas uma parte deles, ou seja, um subconjunto da
população, temos uma amostra. As medidas calculadas na amostra (estimativas)
passam a ser as informações disponíveis para os valores populacionais
desconhecidos (parâmetros). Quando trabalhamos com todos os dados de uma
população, procedemos a um censo, é, quando trabalhamos com parte da população
procedemos a uma amostragem.

População Amostra

Numa fase inicial dos levantamentos amostrais é necessário formular o


problema e aventar sobre o objeto de estudo ou expectativas sobre os possíveis
resultados. Ainda nesta fase inicial, o investigador deve definir a população de estudo,
parte identificável e acessível da população objeto, os objetivos e as variáveis
observadas. Numa segunda etapa é realizado o planejamento, elaborando o plano de
amostragem ou determinando o caminho a ser percorrido para atingir os objetivos
propostos. O plano de amostragem compreende a definição do tamanho e do desenho
da amostra, e ainda, a escolha de procedimentos para a obtenção de estimativas.
Finalmente, os dados são coletados, conferidos e processados. Análises estatísticas
são, então, realizadas nessa fase e os resultados interpretados retornando-se ao plano
________________________________________________________________________________
33
Capítulo 3 - Amostragem
_____________________________________________________________________

das hipóteses e das expectativas, a fim de que os objetivos sejam efetivamente


cumpridos e que sejam obtidas as respostas para as questões em estudo.
Uma população pode ser finita ou infinita. Exemplos de população finita: Alunos
de um determinado curso no CRP, os produtos do Supermercado Rainha, nº de livros
na biblioteca nacional, dentre outros. Exemplos de população infinita: produção futura
de uma máquina, extrações com reposição de bolas de uma urna, dentre outros.
Do ponto de vista prático a população é infinita se a remoção de um item ou de
um pequeno nº de itens não terá influencia discernível nas probabilidades relativas.
Para fins de amostragens, certas populações, embora finita podem ser
consideradas infinitas. Isto ocorre sempre que a amostra constitui-se de no máximo
5% dos elementos de uma população. Assim, por exemplo, se tomarmos uma amostra
de 100 habitantes de uma cidade com 70000 habitantes (5% de 70000 = 3500
habitantes, portanto 100 < 5%), está população embora finita, é considerada como se
fosse infinita.
Assim, definimos a amostragem como a parte da estatística que estuda as
populações através de amostras representativas. A dimensão de uma amostra é
variável conforme o grau de precisão que se deseja no estudo, é, principalmente, com
a homogeneidade dos elementos na população. Desta forma, em um laboratório é
possível fazer um diagnóstico com base em uma gota de sangue, apenas, em virtude
do grau de homogeneidade deste material. Por outro lado, para se ter uma estimativa
da renda per capita de uma cidade é necessário coletar dados de diversos indivíduos.

3.2 – Questionário

A construção de um questionário é uma etapa longa, que deve ser executada com
muita cautela e planejamento. Para tanto, alguns procedimentos devem ser levados
em consideração.

a) Definir as características a serem avaliadas

A decisão de escolha das características depende de vários aspectos, mas o


mais importante é verificar se os resultados das mesmas levam aos objetivos da
pesquisa e se são viáveis de serem aplicadas. Portanto, o questionário deve ser
completo, no sentido de abranger somente perguntas sobre as características
________________________________________________________________________________
34
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

necessárias para atingir aos objetivos da pesquisa, pois quanto maior o questionário,
menor tende a ser a qualidade e a confiabilidade das respostas. Exemplo: Pesquisa
sobre a saúde do indivíduo, não necessita perguntá-lo sobre qual o sabor de sorvete
favorito.

b) Estabelecer a forma de mensuração das características

Para as variáveis quantitativas, devem estar bem definidas as unidades de


medidas (meses, m, kg, etc), que devem acompanhar as respostas. Para as variáveis
qualitativas, deve haver uma lista completa de alternativas, mesmo que seja
necessário incluir categorias como outros, não tem opinião, etc, com o objetivo de
evitar alguma resposta estranha. Se uma variável puder ser adequadamente medida
sob forma quantitativa, deve-se usar este tipo de mensuração, porque as medidas
quantitativas são, em geral, mais informativas do que as qualitativas. Por exemplo,
dizer que um funcionário trabalha há 30 anos na empresa é mais informativo do que
dizer que ele trabalha há muito tempo na empresa. Porém, em alguns casos, quando
se tenta mensurar uma característica atribuindo-lhe uma escala de 1 a 5, pode haver
alguma distorção, pois uma nota 3 para um indivíduo pode não significar exatamente o
mesmo para outro, já que a escala pode ser entendida de forma diferenciada entre os
indivíduos entrevistados. Neste caso, poderiam ser criadas cinco respostas
categorizadas, sendo 1 = péssimo, 2 = ruim, 3 = regular, 4 = bom e 5 = ótimo. Caso
uma característica seja de difícil medição ou que os indivíduos, por algum motivo,
tenham receio de responder, uma opção seria avaliar a mesma indiretamente, através
de várias outras que medem esta característica, conforme alguma teoria sobre o
assunto.

c) Elaborar uma ou mais perguntas para cada característica

Ao efetuar uma ou mais perguntas, terá para cada pergunta, uma e apenas uma
resposta, sendo que cada pergunta será uma variável. A característica grau de
satisfação com o trabalho pode ser avaliada com base em várias perguntas, como por
exemplo, satisfação com o salário, segurança no emprego, autonomia de trabalho, etc.

________________________________________________________________________________
35
Capítulo 3 - Amostragem
_____________________________________________________________________

d) Verificar se a pergunta está suficientemente clara

As perguntas devem ser formuladas numa linguagem que seja compreensível


para todos os indivíduos e, além disso, não devem deixar dúvidas de interpretação.

e) Verificar se a forma da pergunta não está induzindo alguma resposta ou se a


resposta da pergunta é óbvia

Dependendo da forma como se realiza a pergunta, a resposta poderá ser


sempre a mesma. Isto pode ocorrer quando os tipos de respostas não são capazes de
detectar as diferenças entre os indivíduos entrevistados.

f) Verificar se o questionário está bom

É importante realizar um teste, aplicando o questionário em alguns indivíduos


com características similares aos da população em estudo. Neste teste, pode-se
detectar falhas que passaram despercebidas na elaboração do questionário, como por
exemplo, duplicidade de alguma pergunta, respostas que não haviam sido previstas,
variabilidade não adequada de respostas em alguma pergunta e outras. O teste
também serve para estimar o tempo de aplicação do questionário.

3.3 – Amostragem probabilística e não-probabilística

Dentre os vários processos existentes para a obtenção de amostras, a


amostragem probabilística caracteriza-se por garantir, a priori, que todo elemento
pertencente ao universo de estudo possua probabilidade, conhecida e diferente de
zero, de pertencer à amostra sorteada. A identificação, direta ou indireta, dos
elementos e o uso de sorteio fundamentam as propriedades matemáticas desse tipo
de processo. Se por qualquer razão, alguns elementos da população não puderem
pertencer à amostra sorteada, a amostragem é dita não-probabilística. Alguns tipos de
amostragem não-probabilísticos podem ser empregados quando a população de
estudo não é totalmente acessível, quando a amostragem é realizada a esmo, ou seja,
sem sorteio, e quando a população é formada de material contínuo (líquido ou gás),
em que o uso de sorteio não é possível.
________________________________________________________________________________
36
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

3.4 - Vantagens dos métodos de amostragem

As principais vantagens da amostragem em relação ao censo são: custo, pois


em decorrência do menor número de dados coletados, a amostragem é mais
econômica em relação ao censo; maior rapidez, os dados podem ser coletados e
tabulados mais rapidamente na amostragem, possibilitando a obtenção dos resultados
ou informações em um espaço de tempo menor; maior facilidade de execução, para
determinada pesquisas há necessidade de utilização de uma equipe bem treinada e
equipamentos especializados para obtenção dos dados. Neste caso, o censo se torna
inexeqüível em se tratando de grandes populações; maior precisão, a amostragem
envolve menor número de observações é consequentemente, menor nº de coletores
de dados, possibilitando trabalhar com uma equipe de melhor nível e bem treinada.
A amostragem pode ainda revelar maior uniformidade nos métodos de coleta de
dados, contribuindo para maior precisão dos resultados.
Testes destrutivos – os testes podem apresentar caráter destrutivo, ou seja, os
itens examinados são destruídos no próprio ato do experimento. Itens como lâmpadas,
munição e dispositivo de segurança frequentemente são destruídos como parte do
processo. Então o censo nos proporcionaria um panorama preciso de uma população
que não mais existe.
No entanto, a certas situações em que é mais vantajoso examinar todos os itens
de uma população (ou seja fazendo um censo). Entre essas situações temos:
1 – A população pode ser tão pequena que o custo e o tempo de um censo
sejam pouco maiores que para uma amostragem.
2 – Se o tamanho da amostra é grande em relação a população, o esforço
adicional requerido por um censo pode ser pequeno. Por exemplo, se há grande
variabilidade entre os itens de uma população, uma amostra deverá ser
suficientemente grande para ser representativa. Se a população não é muito maior do
que a amostra, o censo pode ser preferível.
3 – Se exigem precisão completa, então o censo é o único método aceitável.
Em face da variabilidade amostral, nunca podemos ter certeza de quais sejam os
verdadeiros parâmetros da população.

________________________________________________________________________________
37
Capítulo 3 - Amostragem
_____________________________________________________________________

3.5 - Planejamento de um levantamento por amostragem

O sucesso de um levantamento por amostragem está na dependência direta do


seu planejamento, pois em função de detalhes de ordem prática chega-se ao ponto de
que, problemas complexos em alguns casos tornarem-se simples e até mesmo
inexistentes em outros casos. No planejamento de qualquer levantamento, deve-se
considerar os seguintes tópicos:

Objetivos – finalidade do levantamento, e a diretriz para a sua perfeita


execução.

População – de onde serão extraídas as amostras com as informações a


respeito da população que se procuram determinar e sempre que possível devem ser
coincidentes.

Dados a serem coletados: Observar-se todos os dados levantados são


essenciais para a pesquisa em questão. É importante lembrar que um questionário
deve ter no máximo 30 perguntas, para não prejudicar a qualidade das respostas.

3.6 – Tipos de Amostragem

 Amostragem simples ao acaso (ASA)

É uma amostragem probabilística, onde todos os elementos da população tem a


mesma probabilidade de pertencerem a amostra ou de serem escolhidos. Para a
composição de uma amostra de n elementos dentre os N elementos da população,
procedemos ao sorteio até que se complete o tamanho da amostra. Geralmente o
sorteio é procedido sem reposição dos elementos já sorteados.
Em uma população constituída de N, o número possível de amostras de
tamanho n que podem ser retiradas, é dada por:

CNn = ( ) = n! (NN!− n)!


N
n

________________________________________________________________________________
38
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

Nesse tipo de amostragem cada uma dessas combinações tem chance de


1 n de ser retirada. Na prática, cada elemento é amostrado por um processo
CN
aleatório que confere igual chance de ser sorteado a cada elemento da população.
Sorteia-se um elemento e repete-se o processo para se selecionar o próximo
elemento, dando sempre chances iguais para todos aqueles remanescentes na
população. Repete-se tantas vezes esse procedimento até que a amostra de n
elementos seja composta.

Ex: Seja uma população constituída dos elementos A, B, C, D e E. Neste caso N = 5, o


número de amostras possíveis com as 3 primeiras letras, é dado por:
5! 5 . 4 .3 . 2.1
C 35 = = = 10
3! (5 − 3 )! (3 . 2.1)(2.1) ABC BCD CDE
ABD BCE CDA
ABE BDE CDB
ACE

Quando fazemos uma amostragem, geralmente estamos interessados em:


a) estimar o valor médio da população;
b) estimar o seu valor total;
c) estimar a porcentagem ou proporção de ocorrência ou incidência de um
determinado fator;
d) estimar a variância dos dados;
e) construir intervalos de confiança para o valor médio e para o valor total da
população.

Neste sistema de amostragem estabelecemos 2 importantes fatores:

1º - n fração de amostragem = probabilidade de cada elemento da população


N
participar da amostra.

2º - N fator de expansão ou de crescimento.


n

A partir do momento em que os elementos amostrados da população são


removidos para as sucessivas retiradas subseqüentes, esse método é denominado de

________________________________________________________________________________
39
Capítulo 3 - Amostragem
_____________________________________________________________________

amostragem simples ao acaso sem reposição. Se por outro lado os elementos


populacionais são repostos após uma retirada, a amostragem é dita com reposição e é
perfeitamente possível de ser feita. À primeira vista, e intuitivamente, pode-se deduzir
que não é muito vantajoso que um mesmo elemento apareça duas, três ou mais vezes
na amostra. Se a população é muito grande os tipos de amostragem, com ou sem
reposição, não apresentam grandes diferenças. Isso porque a chance de um elemento
ser sorteado duas ou mais vezes para a amostra é muito pequena.
O processo de sorteio de uma amostra aleatória simples pode ser feito por meio
de tabelas de números aleatórios, sorteio por funções de geradores de números
aleatórios em programas de computadores, por uso de bolas enumeradas em urnas ou
papéis enumerados em algum tipo de recipiente.

 Amostragem aleatória estratificada (AAE)

O sistema de obtenção de amostras em que a população de N elementos é


previamente dividida em grupos mutuamente exclusivos, denominados de estratos, e
dentro dos quais são sorteadas amostras casuais simples de tamanho n h , chama-se
amostragem aleatória estratificada, ou simplesmente amostragem estratificada. As
subpopulações ou estratos são subdivididos previamente em grupos de tamanhos N 1 ,
L
N 2 , N 3 , ..., N L unidades, mutuamente exclusivos, de tal sorte que N = ∑ Nh . Após os
h=1

estratos terem sido identificados, uma amostra casual simples é retirada de cada
L
estrato, cujos tamanhos são n 1 , n 2 , n 3 , ..., n L , considerando n = ∑ nh .
h=1

Uma das principais razões para se usar a estratificação fundamenta-se na


premissa de que esse processo leva a um ganho de precisão na estimação de
parâmetros da população. Isso realmente ocorre, pois é possível subdividir uma
população heterogênea em subpopulações internamente homogêneas. Desta forma,
um estrato é considerado homogêneo internamente se, de elemento para elemento, há
apenas uma pequena variação. Por essa razão, uma estimativa precisa para um
parâmetro de um estrato populacional pode ser obtida com apenas uma pequena
amostra desse estrato. Essas estimativas dos diferentes estratos são combinadas para
a obtenção de uma estimativa de um determinado parâmetro da população como um
todo.
________________________________________________________________________________
40
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

Exemplo: Será admitida uma amostra aleatória estratificada (n = 25) sorteada de uma
população (N = 194) composta por cinco diferentes fornecedores (estratos) de aços
utilizados na fabricação de molas, sendo a variável medida, a dureza (HB) de molas de
aços produzidas por uma indústria de autopeças (tabela 1).

Tabela 1. Medidas de dureza de molas estratificadas por fornecedor


Estrato Nh nh Amostra Xh s2
h
1 60 5 1,6 1,0 3,7 2,4 1,8 – 2,10 1,05
2 49 6 8,9 7,3 8,2 4,5 5,9 7,6 7,07 2,59
3 35 6 12,2 17,8 15,0 11,4 14,0 14,6 14,17 5,13
4 30 4 35,3 29,7 27,0 22,0 – – 28,50 30,73
5 20 4 82,0 62,0 75,0 54,0 – – 68,25 158,92
194 25 16,43

Neste exemplo, fica claro que a estratificação permitiu o reconhecimento de uma


importante característica do problema vivenciado pela indústria e o direcionamento do
estudo das medidas corretivas que deverão ser adotados para a sua solução. Na
etapa de identificação do problema, foi definido o seguinte problema: aumento do
número de molas devolvidas por apresentarem dureza fora das especificações. Além
das diferenças de médias, percebe-se também a grande diferença de variabilidade
entre os estratos.
A estimativa da média da população é obtida por:
60 ⋅ 2,10 + 49 ⋅ 7,07 + 35 ⋅ 14,17 + 30 ⋅ 28,50 + 20 ⋅ 68,25
Xest = = 16,43
194

 Amostragem aleatória sistemática (AAS)

A amostragem sistemática é um tipo de amostragem em que o plano de


amostragem é obtido por um critério pelo qual intervalos regulares de mesmo tamanho
entre unidades da amostra são tomados até se compor uma amostra de tamanho n e
toda a extensão da localização física da população alvo. Para implementar esse
sorteio os N elementos populacionais são tomados a cada k = N/n elementos. O
primeiro elemento deve ser sorteado entre os k primeiros. Se, por exemplo, uma
população de N = 10000 elementos é considerada e deseja-se extrair uma amostra de
tamanho n = 500, então k será de 10000/500 = 20. Assim, se o elemento 11 for o
________________________________________________________________________________
41
Capítulo 3 - Amostragem
_____________________________________________________________________

primeiro a ser sorteado entre os 20 primeiros, a amostra fica determinada da seguinte


forma: 11, 31, 51, e assim por diante. A seleção da primeira unidade define a amostra
toda.
Esse tipo de amostragem é fácil de ser executada e provavelmente é mais
precisa que a amostra casual simples. A razão disso, segundo Cochran (1977), é a
subdivisão da população em k estratos e a obtenção de um elemento por estrato. A
diferença dessa amostragem para a amostragem estratificada original é que o
elemento sorteado está na mesma posição relativa dos estratos. Por outro lado, devido
a esse tipo de amostragem cobrir de forma mais regular a população em toda sua
extensão que a amostragem estratificada aleatória, essa é considerada mais precisa.

 Amostragem por conglomerado (AAC)

Quando os elementos da população são reunidos em grupos que são sorteados


para compor a amostra, o processo é denominado de amostragem por conglomerado.
A razão de se usar um tipo de amostragem como esse é principalmente motivada por
critérios de ordem prática. Dentre esses critérios destaca-se a ausência de uma
listagem de todos os elementos populacionais.
Em geral, o sorteio é feito em estágios sucessivos. Assim, por exemplo, se for
considerado o sorteio de uma amostra de 500 propriedades rurais em um dos Estados
da federação, poder-se-ia considerar o sorteio de 50 municípios e 10 propriedades
cada, ou de sorteio de 25 municípios e 20 propriedades em cada, e assim por diante.
A economia nesse tipo de amostragem é evidente, pois é método dispensa a listagem
de referência ou cadastro de toda a população. Somente os conglomerados sorteados
são identificados e listados. Dessa forma, apenas um número reduzido de elementos
populacionais deve ser listado.
Outro aspecto é o custo para locação e acesso aos elementos populacionais
para a produção na realização do estudo proposto. O custo total da pesquisa é
reduzido, uma vez que ao se sortear um município, várias de suas propriedades são
amostradas, o que não ocorre com o procedimento adotado em uma amostragem
aleatória simples.

3.7 – Exercício

________________________________________________________________________________
42
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

3.7.1 - Considerar uma população de 35 árvores de uma determinada espécie,


pertencentes a um parque ecológico, cujos elementos possuem os seguintes
comprimentos em cm para o diâmetro à altura do peito (DAP).
Árvore DAP Árvore DAP Árvore DAP Árvore DAP Árvore DAP
1 25 8 25 15 20 22 24 29 22
2 20 9 30 16 19 23 24 30 27
3 35 10 38 17 25 24 22 31 25
4 21 11 24 18 23 25 28 32 23
5 22 12 20 19 20 26 26 33 28
6 22 13 20 20 24 27 23 34 27
7 24 14 25 21 28 28 25 35 22

Com o objetivo de estimar o comprimento médio como você extrairia uma


amostra simples ao acaso, de tamanho n = 10, dessa população? Dar todos os
detalhes, estimar a média e confrontar os resultados com o valor do parâmetro
populacional. Quantas amostras de tamanho 10 são possíveis de serem sorteadas
nessa população?

________________________________________________________________________________
43
Capítulo 4 – Probabilidade
_____________________________________________________________________

4.0 – PROBABILIDADE

4.1 – Introdução

O conhecimento de probabilidade constrói a base que nos permite entender


como a inferência estatística e as técnicas de auxílio de decisão são desenvolvidas,
porque elas funcionam, e como as conclusões obtidas a partir desses procedimentos
podem ser apresentadas e interpretadas corretamente. Para o perfeito entendimento de
probabilidade, alguns conceitos são importantes.

4.2 - Conceitos

4.2.1 - Experimentos probabilísticos ou aleatórios

Um experimento que pode resultar em diferentes resultados, mesmo que seja


repetido sempre da mesma maneira várias vezes, é chamado experimento
aleatório. Vale observar que “experimento” se refere a um ensaio científico
destinado à certificação de um fenômeno.

Características de um experimento aleatório:


a) Cada experimento poderá ser repetido indefinidamente sob condições
essencialmente inalteradas.
b) Muito embora não se possa afirmar que resultado particular ocorrerá, é sempre
possível descrever o conjunto de todos os possíveis resultados de um
experimento.
c) Quando o experimento for realizado repetidamente os resultados individuais
parecem ocorrer de forma acidental. Contudo, se o experimento for repetido um
grande número de vezes, uma certa regularidade surgirá. Isto é, será observada
uma estabilização na frequência dos distintos resultados do experimento. É esta
regularidade que torna possível construir um modelo matemático preciso, com o
qual se analisará o experimento.

Exemplos:
(i) E 1 : Ensaiar uma lâmpada quanto a duração da vida até queimar;
(ii) E 2 : Escolher, ao acaso, um ponto de um círculo de raio unitário;
(iii) E 3 : Registrar as vazões num certo rio, no mesmo mês, dia e hora em
anos sucessivos;
(iv) E 4 : Jogar um dado ao ar e observar a sua face superior; e
(v) E 5 : Seleção de três itens ao acaso de uma linha de fabricação. Cada item
é inspecionado e classificado com defeituoso ou não defeituoso.

___________________________________________________________________________________
44
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
4.2.2. Espaço amostral

O conjunto de todos os possíveis resultados de um experimento aleatório é


chamado espaço amostral do experimento. Sua representação é dada pela letra S.

Exemplo: Aos experimentos aleatórios exemplificados anteriormente estão


associados os seguintes espaços amostrais, respectivamente:

(i) S 1 = {t | t ≥ 0}, onde t é o tempo


(ii) S 2 = {(x,y); x2 + y2 ≤ 1}
(iii) S 3 = {q | 0 ≤ q ≤ q max } , onde q é a vazão
(iv) S 4 = {1, 2, 3, 4, 5, 6}
(v) S 5 = {DDD, DDN, DND, DNN, NDD, NDN, NND, NNN} sendo D =
defeituoso e N= não defeituoso.

4.2.3 - Eventos

Um evento é um subconjunto do espaço amostral de um experimento aleatório.


Temos, então, que o próprio S (evento certo) e o conjunto vazio Ø (evento impossível),
constituem eventos. Qualquer resultado individual pode ser tomado como um evento.

Exemplos: se tomarmos o espaço amostral S 4 apresentado acima poderíamos ter


como eventos: A = {sair número par} = {2,4,6}; ou B = {sair número maior que 4} =
{5,6}, etc.

OBS.: Novos eventos podem ser originados da combinação de eventos existentes.


A união de dois eventos é o evento que consiste de todos os resultados que estão
contidos em qualquer um dos dois eventos originais. Simbolicamente usamos E 1 U E 2 .
A interseção de dois eventos é o evento que consiste de todos os resultados que
estão contidos em ambos os eventos originais (ou seja, estão em comum).
Simbolicamente usamos E 1 ∩ E 2 .
O complemento de um evento em um espaço amostral corresponde ao conjunto
de resultados que não fazem parte do evento original. Simbolicamente usamos
E ou Ec para representar o complemento do evento E.

4.2.4 - Eventos Mutuamente Exclusivos

Dois eventos são ditos mutuamente exclusivos quando a ocorrência de um impede


a ocorrência do outro, ou seja, se eles não puderem ocorrer simultaneamente, isto é, A
∩ B = Ø. Equivalem aos conjuntos disjuntos na teoria dos conjuntos.

Exemplo: Considere o espaço amostral S 4 definido anteriormente. Considere também


os eventos associados a S 4 : A = {1}; B = {5, 6}; C = {número par}. Temos, então, que:
A e B são mutuamente exclusivos pois A ∩ B = Ø.
A e C são mutuamente exclusivos pois A ∩ C = Ø.
___________________________________________________________________________________
45
Capítulo 4 – Probabilidade
_____________________________________________________________________
B e C não são mutuamente exclusivos pois B ∩ C = {6}.

4.3 - Noções Fundamentais de Probabilidade - Conceitos

Independentemente do experimento aleatório em questão, uma vez definidos


alguns eventos de interesse, importante se faz atribuir valores de probabilidade a tais
eventos. Vejamos alguns conceitos úteis.

Conceito 1 - Seja E um experimento aleatório. Seja S um espaço amostral associado


ao experimento E. Podemos entender a probabilidade como sendo em número real
associado a um evento A qualquer, que satisfaz as seguintes propriedades:
(1) 0 ≤ P(A)
(2) P(S) = 1
(3) Se A e B são eventos mutuamente exclusivos, então P(A U B) = P(A) + P(B)
Generalizando para o caso de um número finito de eventos mutuamente exclusivos,
tem-se:

n
P(A1 ∪ A 2 ∪ A 3 ∪  ∪ A n ) = P(A1 ) + P(A 2 ) + P(A 3 ) +  + P(A n ) = ∑ P(A i )
i =1

Todas essas propriedades parecem concordar com nosso conceito intuitivo de


probabilidade, e essas poucas propriedades são suficientes para permitir toda a
estrutura matemática a ser desenvolvida. Deve-se notar que as propriedades (ou
axiomas, conforme citado em algumas referências) acima não fornecem uma maneira
objetiva de se atribuir valores à probabilidade de um evento.
Este seria o conceito subjetivo, moderno ou axiomático de probabilidade.
Enfim, este conceito não fornece formas e sim condições para o cálculo de
probabilidades, ou seja, qualquer processo de cálculo de probabilidade é válido desde
que satisfaça os axiomas.

Conceito 2 - Uma regra mais prática que nos fornece uma maneira mais objetiva para
a atribuição numérica da probabilidade de um evento é dado pelo chamado conceito
clássico ou probabilidade a priori. Este conceito está ligado aos jogos de azar, que
deram origem à teoria de probabilidade nos idos do século XVI.
Entretanto, o método clássico para a obtenção de probabilidades se aplica a
situações em que temos espaços amostrais finitos equiprováveis e enumeráveis.

Definição: Espaço amostral finito equiprovável: Seja S um espaço amostral formado


por um número finito de elementos. Se cada ponto a i de S tem a mesma probabilidade
de ocorrer, então a espaço amostral chama-se equiprovável ou uniforme. Em
particular, se S contém n pontos amostrais então a probabilidade de cada ponto será
1/n.
S = {a 1 , a 2 , …, a n }
P(a i ) = Probabilidade de a i

___________________________________________________________________________________
46
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
n
P(ai ) ≥ 0, i = 1, 2,,n e ∑ P(ai ) = 1
i =1

Desse modo, a probabilidade do evento A, associado a um espaço amostral


finito equiprovável, é dada por:
NCF
P(A ) =
NCP
sendo: NCF = Número de casos favoráveis ao evento A
NCP = número de casos possíveis pelos quais E pode ocorrer

Exemplos:
i) Seja E o experimento relativo ao lançamento de um dado honesto. Seja A
o evento ocorrência da face 6. Portanto, S = { 1, 2, 3, 4, 5, 6} e P(A) = 1/6

ii) Considerando ainda o mesmo experimento, seja B o evento ocorrência


de uma face par. Logo, B = {2, 4, 6}; então: P(B) = 3/6 = ½

iii) Seja o espaço amostral referente ao número de caras obtidas em dois lances
de uma moeda. Seja A o evento ocorrência de uma cara. Então, S = {0, 1, 2} e A = {1}.
Aqui (Exemplo iii) o conceito clássico não pode ser imediatamente aplicado,
pois os pontos de S não são equiprováveis, ou seja, P(A) ≠ 1/3.
Observando o espaço amostral original: S' = {cc, ck, kc, kk}, sendo c = cara e k
= coroa, vê-se que A = {ck, kc} e, portanto, P(A) = 2/4 = 1/2.
Poderíamos empregar corretamente o espaço S da seguinte maneira: os
resultados 0 e 2 são igualmente prováveis, enquanto o resultado 1 é duas vezes mais
provável que qualquer um dos outros.

Conceito 3 - Por outro lado, a maneira teórica mais objetiva de se atribuírem


probabilidades seria em casos onde o experimento pode ser repetido indefinidas
vezes. A probabilidade seria o limite para o qual tenderia a proporção de vezes em que
o evento ocorre, à medida que se aumenta o número de repetições do experimento,
sob as mesmas condições. Ou seja, seria através da frequência relativa do evento
considerado. Este seria o terceiro conceito de probabilidade: frequência relativa ou
probabilidade a posteriori ou probabilidade empírica.
Esta definição tem por base o princípio estatístico da estabilidade, ou seja, à
medida que o número de repetições do experimento aumenta, a frequência relativa se
aproxima da probabilidade P(A).
Exemplo: Em 660 lançamentos de uma moeda foram observadas 310 caras. Qual a
probabilidade de, num lançamento dessa moeda obter-se coroa?
Como foram obtidas 310 caras, ocorreram 350 coroas, logo: f = 350/660 =
0,5303.

Mas não é absolutamente essencial realizar um experimento para obter dados


amostrais. Em muitos casos dispomos de informação histórica precisa, que pode ser
usada da mesma maneira. Por exemplo, se quisermos a estimativa da probabilidade
de certo jogador acertar um pênalti, não precisamos montar um experimento, caso já
___________________________________________________________________________________
47
Capítulo 4 – Probabilidade
_____________________________________________________________________
tenhamos os resultados anotados de vários treinamentos. Ou seja, não precisamos
mandar ele bater vários pênaltis e contar os acertos.

Exemplo: Em Sobral, no Ceará, observaram-se seis anos de seca no período 1901-66


(66 anos).
Qual é a probabilidade do próximo ano ser seco?
Aqui, a estimativa f da probabilidade p será: f = 6/66 = 1/11.

Importante: Ao adotarmos o método empírico, é importante atentarmos para os


seguintes aspectos:
a) A probabilidade assim determinada é apenas uma estimativa do
verdadeiro valor.
b) Quanto maior a amostra, mais confiável é a estimativa da probabilidade
(desde que os princípios teóricos de amostragem sejam considerados).
c) A probabilidade só é válida para um conjunto de condições idênticas
àquelas sob as quais se originaram os dados.

Exemplo: Se jogarmos um dado “honesto” 90 vezes e obtivermos o resultado do


quadro a seguir, teremos, na freqüência relativa, a probabilidade "a posteriori" e na
freqüência esperada relativa, a probabilidade "a priori". Quando o número de
tentativas aumenta consideravelmente, as duas se aproximam.

Resultado hipotético do lançamento de um dado 90 vezes consecutivas


Face nº Freqüência Freqüência relativa Freqüência Freqüência
observada esperada esperada relativa
1 12 12/90 = 0,133 15 1/6 = 0,167
2 17 17/90 = 0,189 15 1/6 = 0,167
3 15 15/90 = 0,167 15 1/6 = 0,167
4 18 18/90 = 0,200 15 1/6 = 0,167
5 10 10/90 = 0,111 15 1/6 = 0,167
6 18 18/90 = 0,200 15 1/6 = 0,167
∑ 90 1,000

Probabilidade Geométrica

Suponhamos que um segmento l seja parte de um outro segmento L e que se


tenha escolhido ao acaso um ponto de L. Se admitirmos que a probabilidade de este
ponto pertencer a l é proporcional ao comprimento de l e não depende do lugar que l
ocupa em L, então a probabilidade de que o ponto selecionado esteja em l será:
l

___________________________________________________________________________________
48
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
comprimento de l
P=
comprimento de L

Exemplo: Sejam AB um segmento de reta e E um evento que se caracteriza pela


escolha, ao acaso, de um ponto do segmento AB, que pertença também ao segmento
menor ab, contido em AB. Se os comprimentos de AB e ab são, respectivamente, 5 e
2 unidades, qual é a probabilidade da ocorrência de E?
Solução:
P (E ) =
comprimento de ab 2
=
comprimento de AB 5

Analogamente, suponhamos que uma figura plana g seja parte de uma outra
figura plana G e que se tenha escolhido ao acaso um ponto de G.

Se admitirmos que a probabilidade de este ponto pertencer a g é proporcional à


área de g e não depende do lugar que g ocupa em G, então a probabilidade de que o
ponto selecionado esteja em g será:
área de g
P=
área de G

Exemplo: Seja um experimento referente à escolha de um ponto ao acaso de um


círculo de raio r centrado na origem. Tem-se então:

S = {(x, y): x2 + y2 ≤ r2}

ou seja, os pares de valores (x, y) que satisfazem a condição x2 + y2 ≤ r2, são os


pontos amostrais que compõe S.

Supondo um círculo de raio igual a 2 e os eventos A = {(x, y): x2 + y2 ≤ 2} e B =


{(x, y): x2 + y2 ≤ ½}, pede-se calcular P(A) e P(B).

Solução:

P ( A) =
área do círculo de raio 2 π 2
= =
( )
1
2

área do círculo de 2 π (2 )2
2

área do círculo de raio 1 π  1 2 


P ( A) = 2 =   =1
área do círculo de 2 π (2) 2
8

___________________________________________________________________________________
49
Capítulo 4 – Probabilidade
_____________________________________________________________________
4.4 - Espaço Amostral Finito
Seja S um espaço amostral finito:
S = {a 1 , a 2 , ..., a n }

Um espaço de probabilidade finito é obtido associando-se a cada ponto a i ∈ S,


um número real p i , chamado de probabilidade de ai, satisfazendo às seguintes
condições:
(i) p i ≥ 0, para i = 1, 2, ..., n
n
(ii) p 1 + p 2 +... + p n = ∑p = 1
i =1
i

A probabilidade de qualquer evento A, que denotaremos por P(A), é dada pela


soma das probabilidades dos pontos de A.

4.5 - Principais Teoremas para o Cálculo de Probabilidades

O cálculo de probabilidades, além dos axiomas apresentados na página 46, se


baseia em cinco teoremas auxiliares. Os diagramas de Venn são úteis na
compreensão, tanto dos teoremas, quanto dos processos de demonstração.

I) Se ∅ for o conjunto vazio, então P(∅) = 0


Prova:
A=A∪∅
P(A) = P(A ∪ ∅) = P(A) + P(∅) (propriedade 2)
logo, P(∅) = P(A) - P(A) = 0 ∴ P(∅) = 0

Fato: A recíproca deste teorema não é verdadeira, isto é, P(A) = 0 não implica que A
seja um conjunto vazio.

II) Se A é o complemento de A, então P( A ) = 1 - P(A)


S A

A A
P(S) = 1

Prova:
S = A ∪ A ⇒ 1 = P(A) + P( A ) (propriedades 2 e 3)
logo, P( A ) = 1 - P(A).

III) Se A e B são ditos eventos quaisquer e B é o complemento de B, então P(A ∩ B )


= P(A) – P(A ∩ B).
S
A B

A∩ B A∩B
___________________________________________________________________________________
50
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

Prova:
A = (A ∩ B ) + (A ∩ B)
P(A) = P(A ∩ B ) + P(A ∩ B), pois (A ∩ B ) e (A ∩ B) são mutuamente exclusivos, logo:
P(A ∩ B ) = P(A) - P(A ∩ B)

Fato: Do mesmo modo P( A ∩ B) = P(B) – P(A ∩ B)

IV) Se A e B forem dois eventos quaisquer, então P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
(Teorema da Soma das probabilidades)
S
A B

A∩ B A∩B

Prova:
A idéia desta demonstração é decompor A∪B e B em dois eventos mutuamente
exclusivos.
Logo, podemos escrever:
A∪B = A ∪ (B ∩ A ) ......(1)
B = (A ∩ B) ∪ (B ∩ A) .....(2) consequentemente,
P(A ∪ B) = P(A) + P(B ∩ A) .....(1)
P(B) = P(A ∩ B) + P(B ∩ A) .....(2)

Subtraíndo-se a primeira igualdade da segunda, tem-se:


P(A ∪ B) - P(B) = P(A) - P(A ∩ B) e, então:
P(A ∪ B) = P(A) + P(B) - P(A ∩ B)

FATO: Para três eventos quaisquer A, B e C, temos que:


P(A ∪ B ∪ C) = P(A) + P(B) + P(C) - P(A ∩ B) - P(A ∩ C) - P(B ∩ C) + P(A ∩ B ∩ C)

V) Se A ⊂ B, então P(A) ≤ P(B), ⊂ = contido


S
B A

Prova:
B = A ∪ (B ∩ A )
P(B) = P[A ∪ (B ∩ A )]
P(B) = P(A) + P(B ∩ A )
logo P(B) é ≥ P(A) pois P(B ∩ A ) é ≥ 0 pelo axioma enunciado em 4.

___________________________________________________________________________________
51
Capítulo 4 – Probabilidade
_____________________________________________________________________
4.6 - Probabilidade Condicional

A noção de probabilidade condicional é uma ferramenta básica da teoria das


probabilidades. Sejam A e B dois eventos associados ao experimento E. A
probabilidade do evento B condicionada à ocorrência do evento A, ou seja, a
probabilidade condicional de B dado A, é dada por:
P(A ∩ B )
P(B/A ) = ,para P(A ) > 0
P (A )
P(A ∩ B )
Analogamente: P(A/B ) = , para P(B ) > 0
P(B )
Pode-se verificar que P(B/A) satisfaz aos vários postulados de probabilidade.
Isto é:
i) 0 ≤ P(B/ A) ≤ 1
ii) P(S/A) = 1
iii) P[ (B1 ∪ B2 ) / A ] = P(B1/A) + P(B2 /A) - P[ (B1 ∩ B2 ) / A ]
ou P(B 1 /A) + P(B 2 /A) se B 1 ∩ B 2 = ∅
obs: Se A e B são eventos mutuamente exclusivos, então: P(B/A) = P(A/B) = 0

Exemplo: Os dados abaixo se referem a 200 alunos matriculados em determinado


curso de Matemática, de acordo com o sexo e a disciplina:
Masculino Feminino Total
Matemática Pura 60 50 110
Estatística 80 10 90
Total 140 60 200

Qual seria a probabilidade de uma pessoa aleatoriamente escolhida:


a) Estar matriculada em matemática pura?
b) Estar matriculada em matemática pura, dado ser homem?
c) Ser homem?
d) Ser homem dado que esta matriculado em estatística?
e) Estar matriculada em matemática pura, sabendo-se que é mulher ?

Solução:
sejam os eventos: A = {aluno faz matemática pura}
E = {aluno faz estatística}

M = {aluno é do sexo masculino}


F = {aluno é do sexo feminino}
NCF 110
a) P(A) = =
NCP 200
P(A ∩ M)
60
b) P(A/M) = = 200 = 60 ⋅ 200 = 60
P(M) 140 200 140 140
200

___________________________________________________________________________________
52
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
140
c) P(M) =
200
80
P(M ∩ E) 200 = 80
d) P(M/E) = =
P(E) 90 90
200
50
P(M ∩ F) 50
e) P(M/F) = = 200 =
P(F) 60 60
200

Podemos verificar que podemos calcular a probabilidade condicional [P(B/A)] de


dois eventos A e B quaisquer de duas maneiras:
i) Empregando a definição, onde P(A ∩ B) e P(A) são calculados em relação ao
espaço amostral original S;
ii) Diretamente, pela consideração da probabilidade de B em relação ao espaço
amostral reduzido determinado pela ocorrência do evento A.

4.7 - Teorema do Produto das Probabilidades

Vimos que a probabilidade condicional de A na hipótese H (ou dado H) é


P(A ∩ H)
P(A/H) = (1)
P(H)
A fórmula (1) é frequentemente usada na forma

P(A ∩ H) = P(A/H) * P(H) (2)

Esse resultado é conhecido pelo nome de teorema do produto.


A generalização desse resultado para três eventos A, B, C, é obtida por:

P(A ∩ B ∩ C) P(A ∩ B ∩ C)
P[C/ (A ∩ B )] = =
P (A ∩ B ) P(A ) ⋅ P(B/A )
então:

P(A ∩ B ∩ C) = P[C/(A ∩ B)] . P(B/A) . P(A)

As generalizações para quatro ou mais eventos saem diretamente pelo mesmo


processo.

4.8 - Independência Estocástica (ou Probabilística)

Dois eventos A e B, pertencentes a um mesmo espaço amostral (S), são


independentes se as seguintes condições são válidas:

P(A/B) = P(A) e P(B/A) = P(B), então:

___________________________________________________________________________________
53
Capítulo 4 – Probabilidade
_____________________________________________________________________
.
P(A∩B) = P(A) P(B)

4.9 - Partição do Espaço Amostral e o Teorema de BAYES

4.9.1 - Teorema da Probabilidade Total

Inicialmente, enunciaremos um teorema útil que relaciona a probabilidade de


um evento com probabilidades condicionais, o qual é chamado Teorema da
Probabilidade Total.
Sejam B 1 , B 2 , ..., B n eventos mutuamente exclusivos e exaustivos.

Definição: {B 1 , B 2 , ..., B n } é um conjunto de eventos mutuamente exclusivos e


exaustivos se quaisquer dois eventos B i e B j não podem ocorrer ao mesmo tempo e
um deles deve ocorrer. Simbolicamente, B i ∩ B j = ∅, para i ≠ j, e B 1 ∪ B 2 ∪ ... ∪ B n = S.

B 1 , B 2 , ..., B n são eventos que formam uma partição do espaço amostral S.


Então, para um evento arbitrário A, tem-se:

n
P(A) = P(A/B 1 ) ⋅ P(B 1 ) + P(A/B 2 ) ⋅ P(B 2 ) + ... + P(A/B n ) ⋅ P(B n ) = ∑ P(A/Bi ) ⋅ P(Bi )
i =1

Prova:
Seja o diagrama de Venn a seguir:

É claro que podemos escrever A como a união de eventos mutuamente


exclusivos, isto é:

A = (A ∩ B 1 ) ∪ (A ∩ B 2 ) ∪ ... ∪ P(A ∩ B n )
Logo:
P(A) = P(A ∩ B 1 ) + P(A ∩ B 2 ) + ... + P(A ∩ B n )

Mediante aplicação da probabilidade condicional, onde:


P(A ∩ Bi )
P(A/Bi ) = ⇒ P(A ∩ Bi ) = P(A/Bi ) ⋅ P(Bi )
P(Bi )
teremos
P(A) = P(A/B1 ) ⋅ P(B1 ) + P(A/B2 ) ⋅ P(B2 ) +  + P(A/Bn ) ⋅ P(Bn )

n
∴ P(A) = ∑ P(A/Bi ) ⋅ P(Bi )
i =1

obs: Esta relação é útil quando desejamos calcular P(A) e esta é difícil de ser
___________________________________________________________________________________
54
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
calculada diretamente, e sabemos da(s) ocorrência(s) do(s) B i . O fato é que é mais
fácil calcular os termos que compõem o somatório do que a própria P(A).

4.9.2 - Teorema de Bayes

Com base na definição de probabilidade condicional e na partição do espaço


amostral considerada anteriormente, pode-se estabelecer um resultado bastante útil,
geralmente conhecido como Teorema de Bayes, o qual apresentaremos agora:
Sejam A e B dois eventos arbitrários com P(A) > 0 e P(B) > 0. Então:
P(B ∩ A) P(A/B) ⋅ P(B)
P(B/A) = =
P(A) P(A)

Combinando este resultado com o teorema da probabilidade total, temos, como


consequência,
P(A/B j ) ⋅ P(B j )
P(B j /A) = n
∑ P(A/Bi ) ⋅ P(Bi )
i =1

Para a aplicação do teorema, as probabilidades P(B j ) devem ser conhecidas e


convenientemente consideradas, e os B i representam um conjunto de eventos
mutuamente exclusivos e exaustivos.
Sua utilidade consiste em permitir-nos calcular a probabilidade a posteriori
[P(B/A)] em termos das informações a priori P(B) e P(A).

Exemplo: Em uma escola, as turmas A, B e C têm 40, 50 e 10 % do total de alunos de


determinada série, respectivamente. Dos alunos de cada turma, 3, 5 e 2 %,
respectivamente, serão reprovados. Escolhido ao acaso um aluno dessa série, pede-
se:
a) Qual a probabilidade de o aluno ser reprovado?
b) Seleciona-se ao acaso um aluno dessa escola. Sabendo-se que o aluno será
reprovado, qual a probabilidade de que ele seja da turma B?

Solução:
Sejam os eventos: A = {aluno da turma A}
B = {aluno da turma B}
C = {aluno da turma C}
R = {aluno reprovado}

Método 1:
P(A) = 0,40 P(B) = 0,50 P(C) = 0,10
P(R/A) = 0,03 P(R/B) = 0,05 P(R/C) = 0,02
a) R = {(R ∩ A) ∪ (R ∩ B) ∪ (R ∩ C)}
P(R) = P(R ∩ A) + P(R ∩ B) + P(R ∩ C)
P(R) = P(A) . P(R/A) + P(B) . P(R/B) + P(C) . P(R/C)
P(R) = 0,40 . 0,03 + 0,50 . 0,05 + 0,10 . 0,02
___________________________________________________________________________________
55
Capítulo 4 – Probabilidade
_____________________________________________________________________

P(R) = 0,012 + 0,025 + 0,002 = 0,039

P(B ∩ R) P(B) ⋅ P(R/B) 0,50 ⋅ 0,05 0,025 25


b) P(B/R) = = = = = = 0,641
P(R) P(R) 0,039 0,039 39

Método 2:

R R
A 0,012 0,388 0,40
B 0,025 0,475 0,50
C 0,002 0,098 0,10
0,039 0,961 1,00

a) P(R) = 0,039
0,025
b) P(B/R) = = 0,641
0,039

Método 3: (Diagrama em árvore)


R 0,03
A 0,40
R 0,97
R 0,05
B 0,50
R 0,95
R 0,02
C 0,10
R 0,98

a) P(R) = P(A ∩ R) + P(B ∩ R) + P(C ∩ R) = 0,40 . 0,03 + 0,50 . 0,05 + 0,10 . 0,02 =
0,039

P(B ∩ R) 0,50 ⋅ 0,05


b) P(B/R) = = = 0,641
P(R) 0,039

4.10 - Exercícios propostos

1. Numa prova há 7 questões do tipo verdadeiro-falso ( V ou F ). Calcule a


probabilidade de acertarmos todas as 7 questões se:
a) Escolhermos aleatoriamente as 7 respostas. (R: 1/128)
b) Escolhermos aleatoriamente as respostas, mas, sabendo que ha mais respostas V
do F. (R: 1/64)

2. Num exame de múltipla escolha há 3 alternativas para cada questão e apenas uma
___________________________________________________________________________________
56
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
delas é correta. Portanto, para cada questão, um aluno tem probabilidade 1/3 de
escolher a resposta correta se ele esta assinalando aleatoriamente e 1 se sabe a
resposta. Um estudante sabe 30% das respostas do exame. Se ele assinalou
corretamente uma das questões, qual é a probabilidade de que ele tenha a assinalado
ao acaso? (R: 7/16)

3. Certa firma utiliza um teste para classificar os funcionários em categorias; ao final


eles são classificados em: 25% bons (B); 50% médios (M) e 25% fracos (F). Um novo
teste é proposto, de tal forma a classificar os funcionários como aprovado (A) ou
reprovado (R). Com base em informações do antigo teste, foram obtidas as seguintes
probabilidades com o novo teste.
CATEGORIAS % de APROVADOS
B 80
M 50
F 20

Deseja-se saber qual a probabilidade de um funcionário aprovado no novo


teste, ser classificado como fraco pelo antigo teste ? (R: 0,10)

4. Considere a escolha aleatória de um número entre os 10 primeiros números inteiros


positivos (a partir de 1), e os eventos:
A = {1, 2, 3, 4, 5}; B = {4, 5, 6, 7} e C = {5, 9}. Pede-se: Os eventos são Mutuamente
Independentes? Mostre porquê. (R: Não)

5. Uma urna contém 5 bolas vermelhas e 3 brancas. Uma bola é selecionada,


aleatoriamente, dessa urna e não é reposta. Em seguida, duas bolas de cor diferente
da bola extraída anteriormente (branca ou vermelha) são colocadas na urna. Se uma
segunda bola é extraída aleatoriamente, qual é a probabilidade de:
a) A segunda bola ser vermelha? (R: 41/72)
b) A segunda bola ser da mesma cor da primeira? (R: 13/36)

Lista de Exercícios: Probabilidade

1) Considerando o espaço amostral de um experimento constituído do lançamento de


dois dados perfeitamente simétricos, pede-se:
a) Qual a probabilidade de que o primeiro dado mostre a face 2 e o segundo a face 3?
(R: 1/36)
b) Qual a probabilidade de que ambos os dados mostrem a mesma face? (R: 1/6)
c) Qual a probabilidade de que o segundo dado mostre um número par? (R: ½)

2) Uma moeda perfeita é lançada 3 vezes e observado o número de caras. Qual é a


probabilidade de ocorrer?
a) Pelo menos uma cara? (R: 7/8)
b) Só cara ou só coroa? (R: ¼)
c) Exatamente uma cara? (R: 3/8)

___________________________________________________________________________________
57
Capítulo 4 – Probabilidade
_____________________________________________________________________

3) Dos 10 alunos de uma classe, 3 têm olhos azuis. Se duas delas são escolhidas
aleatoriamente, qual é a probabilidade de:
a) Ambas terem olhos azuis? (R: 1/15)
b) Nenhuma ter olhos azuis? (R: 7/15)
c) Pelo menos uma ter olhos azuis? (R: 8/15)

4) Em um certo colégio, 25% dos estudantes foram reprovados em matemática, 15%


em química e 10% em matemática e química ao mesmo tempo. Um estudante é
selecionado aleatoriamente.
Pede-se:
a) Se ele foi reprovado em química, qual é a probabilidade de ter sido reprovado em
matemática? (R: 2/3)
b) Se ele foi reprovado em matemática, qual a probabilidade de ter sido reprovado em
química? (R: 2/5)
c) Qual é a probabilidade de ter sido reprovado em matemática ou química? (R: 0,30)

5) Um dado é viciado de tal forma que a probabilidade de sair um certo número é


proporcional ao seu valor. Pede-se:
a) Qual é a probabilidade de sair o 3, sabendo-se que o ponto que saiu é ímpar? (R:
1/3)
b) Qual é a probabilidade de sair um número par, sabendo-se que saiu um número
maior que 3? (R: 2/3)

6) Sejam A, B e C três eventos de um mesmo espaço amostral S . Sabendo-se que:


1 1 1
P(A) = P(B) = P(A) = P(A ∩ B) =
3 4 8
1 1
P(A ∩ C) = P(B ∩ C) = P(A ∩ B ∩ C) =
9 20
Calcular as probabilidades:
a) De ocorrer pelo menos um dos eventos A, B ou C? (R: 223/360)
b) De que não se realize nenhum dos eventos A, B ou C? (R: 137/360)
c) De que o evento A se realize, sabendo-se que já ocorreu B ou C? (R: 67/170)

7) Sendo S = {1, 2, 3, 4} um Espaço amostral Equiprovável e os eventos A = {1, 2}, B =


{1, 3} e C = {1, 4}. Verifique se os eventos A, B e C são mutuamente independentes.
(R: Não são independentes)

8) Dois homens H 1 e H 2 e três mulheres M 1 , M 2 e M 3 estão num torneio de xadrez. Os


do mesmo sexo tem igual probabilidade de vencer, mas cada mulher tem duas vezes
mais probabilidade de vencer o torneio do que qualquer um dos homens. Pede-se:
a) Qual é a probabilidade de que uma mulher vença o torneio? (R: ¾)
b) Se H 1 e M 1 são casados, qual é a probabilidade de que um deles vença o torneio?
(R: 3/8)

___________________________________________________________________________________
58
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

9) Um homem possui duas moedas, uma comum e a outra cunhada com duas caras.
Ele apanhou uma moeda aleatoriamente e a lançou, se ocorreu a face cara, qual é a
probabilidade de que a moeda lançada tenha sido a de duas caras? (R: 2/3)

10) Jogam-se dois dados. Se as duas faces mostram números diferentes, qual é a
probabilidade de que uma das faces seja o 4? (R: 1/3)

11) Considere dois tipos de caixas de bombons, B e C. O tipo B contém 65% de


bombons doces e 35% de bombons amargos, enquanto no tipo C essas percentagens
de sabor são inversas. Além disso, 45% de todas as caixas de bombons são do tipo B,
e as restantes do tipo C. Escolhe-se, aleatoriamente, uma caixa e um bombom dessa
caixa; se for constatado que ele é do tipo doce, qual é a probabilidade de ter vindo de
uma caixa do tipo C? (R: ≅ 0.3969)

12) Definir e dar exemplos de:


a) Eventos Mutuamente Exclusivos?
b) Eventos Independentes?

13) Numa placa de petri 20%, 40%, 25% e 15% do total das colônias bacterianas são
dos tipos A, B, C e D, respectivamente. Sabe-se que 3%, 5%. 6% e 20% de cada
colônia, respectivamente, são patogênicas.
a) Se for retirada uma amostra aleatória de uma única colônia bacteriana, qual é a
probabilidade de que esta amostra contenha somente bactérias patogênicas? (R:
0,071)
b) Se for constatado que a amostra do item a possui somente bactérias patogênicas,
qual é a probabilidade de que as bactérias sejam do tipo D? (R: ≅ 0.4225)

14) Quatro equipes A, B, C e D participam de um torneio que premiará uma única


equipe campeã. Quanto às probabilidades de cada equipe vencer o torneio, as
equipes C e D são equiprováveis, a equipe A é duas vezes mais provável do que B, e
B duas vezes mais do que as equipes C e D. Pede-se: Qual é a probabilidade de que
as equipes C ou D sejam campeãs? (R: 0,25)

15) Uma caixa contém 8 peças, das quais 3 são defeituosas e uma caixa B contém 5
peças, das quais 2 são defeituosas. Uma peça é retirada aleatoriamente de cada
caixa:
a) Qual a probabilidade p de que ambas as peças não sejam defeituosas? (R: 3/8)
b) Qual a probabilidade p de que uma peça seja defeituosa e a outra não? (R: 19/40)
c) Se uma peça é defeituosa e a outra não, qual é a probabilidade p de que a peça
defeituosa venha da caixa A? (R: 9/19)

16) A e B são eventos mutuamente exclusivos. Determine quais das relações abaixo

___________________________________________________________________________________
59
Capítulo 4 – Probabilidade
_____________________________________________________________________
são verdadeiras e quais são falsas. JUSTIFIQUE.
a) P(A/B) = P(A)
b) P(A ∪ B/C) = P(A/C) + P(B/C)
c) P(A) = 0, P(B) = 0, ou ambas
P(B/A) P(A/B)
d) =
P(A) P(B)
e) P(A ∩ B) = P(A) . P(B)

Repita o problema supondo A e B independentes.

___________________________________________________________________________________
60
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

5.0 – VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

5.1 – Conceito de variável aleatória

É toda e qualquer variável associada a uma probabilidade, isto é, seus valores


estão relacionados a um experimento aleatórios. Uma função cujo valor é um número
real determinado por cada elemento em um espaço amostral é chamado uma variável
aleatória (v.a.)
Isso equivale a descrever os resultados de um experimento aleatório por meio de
números ao invés de palavras, o que é uma grande vantagem, pois possibilita melhor
tratamento matemático, inclusive através de parâmetros que veremos a seguir.

obs.: Utilizaremos letras maiúsculas (X, Y, Z, etc.) para representar a v.a. e a


correspondente letra minúscula (x, y, z, etc.) para um dos seus valores.

obs.: cada possível valor x de X representa um evento que é um subconjunto do espaço


amostral.

Exemplo: Duas peças são retiradas sucessivamente, sem reposição, de uma caixa que
contém quatro peças boas (B) e 3 defeituosas (D). Para esse experimento teríamos o
seguinte espaço amostral
S = {BB, BD, DB, DD}.
Se considerarmos a v.a. Y = número de peças boas retiradas teríamos:
S* = {0, 1, 2}.
Fazendo uma correspondência entre S e S* teríamos:
Evento Simples Y=y
BB 2
BD 1
DB 1
DD 0

Outro exemplo:
Considere o lançamento de duas moedas e seja X = no de caras obtidas, c = cara e k =
coroa

S = {cc, ck, kc, kk}


X = {0, 1, 2}, Isto é, X(kk) = 0, X(ck) = X(kc) = 1 e X(cc) = 2.

Se um espaço amostral contém um numero finito de pontos como no exemplo


anterior, ou uma sequência infinita enumerável de pontos amostrais, ele é chamado
espaço amostral discreto. A v.a. definida sobre esse espaço é chamada variável
aleatória discreta (v.a.d.).

Por outro lado, se um espaço amostral contém pontos amostrais que formam

___________________________________________________________________________________
61
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
uma continuidade como todas as possíveis alturas de pessoas, pesos de animais,
tempos de vida de um componente mecânico ou eletrônico, temperaturas, etc. Então ele
é chamado espaço amostral contínuo. A variável definida sobre esse espaço é
chamada variável aleatória contínua (v.a.c.).

obs.: na maior parte dos problemas práticos as v.a.c. representam dados medidos e as
v.a.d. representam dados contados, tais como o número de defeituosos em uma
amostra de n peças ou o número de acidentes em determinada rodovia.

exemplo:
- nº de acidentes ocorridos em uma semana;
- nº de defeitos por peça produzida por um fabricante;
- nº de vitórias obtidas por um atleta;
- nº de filhos do sexo masculino por casal.

obs.: No caso das v.a.c. somente terão interesse as probabilidades de que a v.a.
assuma valores em dados intervalos. As probabilidades de interesse poderão ser
determinadas com o conhecimento da distribuição de probabilidade da v.a.

5.2 - Distribuição de probabilidade

De acordo com o tipo de variável aleatória, ou seja se v.a.d. ou v.a.c., teremos:

a) X é uma v.a.d.

Nesse caso precisamos saber os valores da v.a.d. X e de sua função de


probabilidade. Chama-se função de probabilidade (f.p.) da variável aleatória discreta
X, a função

P(X = x i ) = P(x i ) = pi

que a cada valor de X (ou seja, a cada x i ) associa sua probabilidade de ocorrência.

obs.: essa função muitas vezes está reduzida a um valor numérico e, em outros casos,
pode ser representada por uma fórmula.

A função P(x i ) será uma função de probabilidade se satisfizer às seguintes


condições:

i) P(x i ) ≥ 0, para todo x i


ii) ∑ P(x i ) = 1
i

À coleção de pares [x i , P(x i )], i = 1, 2, ..., n, denominaremos distribuição de


probabilidade da v.a.d. X, que pode ser representada por meio de tabelas e gráficos.
___________________________________________________________________________________
62
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

Exemplo: Seja E: lançamento de um dado viciado de tal forma que a probabilidade é


proporcional ao valor obtido no lançamento.
Considere: S = {1, 2, 3, 4, 5, 6}
Vamos supor que estamos interessado na avaliação da variável aleatória X, onde
X = {nº de pontos obtidos num lançamento}, ou X = {resultado num lançamento}

Assim os possíveis valores que a variável aleatória X pode assumir são:

X = {1, 2, 3, 4, 5, 6}, com as respectivas probabilidades:


p + 2p + 3p + 4p + 5p + 6p = 1 → 21p = 1 → p = 1/21

Para o nosso exemplo temos que a distribuição de probabilidades da v.a. X será:

i) Gráfico

ii) Tabela
xi 1 2 3 4 5 6
P(x i ) 1/21 2/21 3/21 4/21 5/21 6/21

Observe que as duas condições apresentadas acima são satisfeitas.

As tabelas e gráficos são utilizados para mostrar como a probabilidade total


atribuída a um espaço amostral é distribuída pelos diversos resultados daquele espaço.

Nesse exemplo, a função de probabilidade poderia também ser representada


como:

 xi
 , para x i = 1, 2, 3, 4, 5, 6
P(x i ) =  21
0, para outros valores de x i

Este exemplo trata-se de uma variável aleatória X = {nº de pontos obtidos}, que
não é uniformemente distribuída.

___________________________________________________________________________________
63
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
Problema proposto: Uma urna contém 4 bolas azuis e 6 brancas. Duas bolas são
retiradas sucessivamente I) com reposição e II) sem reposição. Determinar, em cada
caso, a distribuição de probabilidade e a função de probabilidade do nº de bolas brancas
retiradas.

b) X é uma v.a.c.

No caso de v.a.c. somente terão interesse as probabilidades de que a v.a.


assuma valores em dados intervalos. Tais probabilidades poderão ser determinadas
com o conhecimento da função densidade de probabilidade da v.a..
Chama-se função densidade de probabilidade (f.d.p.) da variável aleatória
discreta X, a função f(x) que atenda às seguintes condições:

i) f(x) ≥ 0, para a < x < b


b
ii) ∫ f(x)dx = 1,
a

onde a e b podem ser, respectivamente, -∞ e ∞.


A f.d.p. assim definida determina a distribuição de probabilidades da v.a.c. X. Sua
representação é dada em forma gráfica.

obs.:

d
1) Para c < d , P(c < X < d) = ∫ f(x)dx
c

x0

2) Para um valor fixo de X, por exemplo, X = x 0 , temos que P(X = x 0 ) = ∫ f(x)dx = 0 ;


x0

sendo assim, as probabilidades abaixo são todas iguais, se X for uma v.a.c.:

P(c ≤ X ≤ d) = P(c ≤ X < d) = P(c < X ≤ d) = P(c < X < d)

3) A função densidade de probabilidade f(x), não representa probabilidade. Somente


quando a função for integrada entre dois limites, ela produzirá uma probabilidade, que
será a área sob a curva da função entre os valores considerados.

Exemplo: Uma v.a.c. X possui a seguinte função:

k, para 0 ≤ x < 1



f(x) = k(2 − x), para 1 ≤ x < 2
0, para outros valores de x

Pede-se:
___________________________________________________________________________________
64
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
a) A constante k para que f(x) seja uma f.d.p.
b) Gráfico da f(x).
c) P(1/2 ≤ X ≤ 1); d) P(X = 1); e) P(1/2 ≤ X ≤ 3/2); f) P(X > 2)

Respostas: a) 2/3 ; c) 1/3; d) 0; e) 7/12; f) 0.

Problemas propostos:

1. Seja uma v.a.c. X definida pela seguinte f.d.p.:

0, para x < 0



f(x) = kx, para 0 ≤ x ≤ 2
0, para x > 2

a) Determinar o valor de k?
b) Traçar o gráfico da f.d.p.?
c) Calcular P(X ≤ 1).

Respostas: a) 1/2; c) 1/4

2. Uma v.a.c. X tem a seguinte f.d.p.

0, para x < 0


kx, para 0 ≤ x ≤ 5

f(x) = 
k(10 − x), para 5 ≤ x ≤ 10
0, para x > 10

a) Determinar o valor de k?
b) Traçar o gráfico da f.d.p.?
c) Calcular P(X ≥ 3)

Respostas: a) 1/25; b) 41/50

Existem muitos problemas nos quais é de interesse conhecer a probabilidade que


a v.a. X assumisse valores menores que um particular valor x. Nesse caso precisamos
definir a função de distribuição acumulada de X.

5.3 - Função de distribuição acumulada

Dada a variável aleatória X, chamaremos de função de distribuição acumulada


ou, simplesmente, função de distribuição F(x) a função F(x) = P(X ≤ x).
Observe que o domínio de F é todo o conjunto real.

obs.:

___________________________________________________________________________________
65
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
a) 0 ≤ F(x) ≤ 1 para todo x.
b) Se x 1 ≤ x 2 , então F(x 1 ) ≤ F(x 2 ), isto é, F(x) é não-decrescente.

a) F(x) para X v.a.d.

Para X uma v.a.d. temos que:

F(x) = P(X ≤ x) = ∑ P(t)


t≤x

Exemplo: Seja X uma v.a.d. com a seguinte distribuição de probabilidade

xi 0 1 2 3 4 Total
P(x i ) 1/16 4/16 6/16 4/16 1/16 1,00
F(x)

Pede-se:

a) Traçar o gráfico da distribuição de probabilidade de X?


b) Obter a função de distribuição acumulada e traçar seu gráfico?

b) F(x) para X v.a.c.

Para X uma v.a.c. temos que:

X
F(x) = P(X ≤ x) = P( −∞ < X < x) = ∫ f(t)dt
−∞

Temos ainda que,

d
P(c < X ≤ d) = F(d) - F(c) = ∫ f(x)dx
c

d F(x)
Vê-se também que f(x) = em todos os pontos de continuidade de f(x), isto
dx
é, a derivada da função de distribuição é a função densidade de probabilidade.

Exemplos:

1. Seja X uma v.a.c. com a seguinte f.d.p.:

 1 x, para 0 ≤ x ≤ 2
f(x) =  2
0, caso contrário

___________________________________________________________________________________
66
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

Pede-se:
a) Traçar o gráfico da f.d.p.?
b) Obter F(x) e traçar seu gráfico?
c) Calcular P(X≤1)?
d) Calcular P(1 ≤ X ≤ 3/2)
e) Qual o valor de X abaixo do qual existem 50% dos dados?

Respostas: c) 1/4; d) 5/16; e) 2

2. Seja X uma v.a.c. com função dada por:

ax, se 0 ≤ x < 1
a, se 1 ≤ x < 2

f(x) = 
- ax + 3a, se 2 ≤ x ≤ 3
0, caso contrário

Pede-se:
a) Determine a constante a para que f(x) seja uma f.d.p.?
b) Traçar o gráfico da f.d.p.?
c) Obter F(x) e traçar seu gráfico?
 3
d) P 0 < X < ?
 2
e) Qual valor de X abaixo do qual existem 50% dos dados?

Resposta: a) 1/2; d) 1/2; e) 1,5.

5.4 - Distribuições empíricas

Geralmente quando temos um experimento envolvendo uma v.a.c. a verdadeira


função densidade (f(x)) nos é desconhecida. Para que adotemos uma f(x) razoável uma
boa análise sobre todas as informações disponíveis se faz necessária. Essa análise
pode ser feita com o uso de distribuições de frequências relativas, em forma de tabelas
ou gráficos, conforme descrito no capitulo 2. Distribuições assim obtidas permitem
supor acerca da “verdadeira” distribuição de probabilidades associada àquela variável
aleatória. Supondo-se então uma determinada distribuição de probabilidades à v.a. em
questão, outras análises mais avançadas podem ser realizadas (como os testes de
hipóteses para se testar tais suposições). Exemplos desse tipo serão citados
oportunamente.

___________________________________________________________________________________
67
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________

5.5 - Distribuições de probabilidades conjuntas

Vimos, anteriormente o caso de distribuições de probabilidades para o caso de


uma única variável aleatória. Há casos, contudo, nos quais estamos interessados no
estudo de duas ou mais variáveis aleatórias simultaneamente. Por exemplo, alguém
poderia estar interessado na dureza (D) e na tensão de ruptura (T) de uma liga de cobre
fornecendo assim o resultado (d,t).
Se X e Y são duas v.a., a distribuição de probabilidade para a sua ocorrência
simultânea pode ser representada por f(x,y) para o caso em que (X,Y) é uma v.a.
bidimensional contínua, e p(x,y) para o caso em que (X,Y) é uma v.a. bidimensional
discreta.

Definição

Sejam E um experimento e S um espaço amostral associado a E. Sejam X = X(s)


e Y = Y(s), duas funções, cada uma associando um número real a cada resultado s ∈ S.
Denominaremos (X,Y) uma variável aleatória bidimensional.
Em determinadas situações, X e Y não estão necessariamente ligadas a um
mesmo experimento, mas existe uma razão bastante definida para considerar X e Y
conjuntamente. Para o nosso estudo vamos considerar que X e Y são ambas discretas
ou contínuas.
Do mesmo modo que no caso unidimensional (X,Y) deve ter associada, a cada
valor que pode assumir, uma probabilidade de sua ocorrência. Assim precisamos definir
a distribuição de probabilidade da v.a. bidimensional (X,Y).

5.6 - Distribuição conjunta de duas variáveis aleatórias, distribuições marginais e


condicionais

a) (X, Y) é v.a.d. bidimensional

(X,Y) será uma v.a.d. bidimensional se os valores possíveis de X e Y forem finitos


ou infinitos enumeráveis. Isto é, se os valores possíveis de (X,Y) podem ser
representados por (x i , y j ) i = 1, 2,..., r e j = 1, 2,..., s.

a.1) Função de probabilidade conjunta de X e Y

Chama-se de função de probabilidade conjunta da v.a.d. bidimensional (X, Y) a


função:
P(X = x i ; Y = y j ) = P(x i ; y j ) = p ij

que a cada valor de (x i ; y j ) associa sua probabilidade de ocorrência.


Para que P(x i ; y j ) seja uma função de probabilidade conjunta é necessário que
satisfaça às seguintes condições:

___________________________________________________________________________________
68
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
a) P(x i , y j ) ≥ 0, para todo par (x i , y j )
b) ∑∑ P(x i, y j ) = 1
i j

Distribuição de probabilidade conjunta

É o conjunto {(x i ; y j ), P(x i ; y j )} para i = 1, 2,..., r e j = 1, 2,..., s

a.2) Distribuições marginais

Dada uma distribuição conjunta de duas variáveis aleatórias X e Y, podemos


determinar a distribuição de X sem considerar Y e a de Y sem considerar X. São as
chamadas distribuições marginais.
A distribuição marginal é constituída pelos valores da variável aleatória e suas
respectivas probabilidades marginais, que serão apresentadas na forma gráfica ou
tabular conforme visto para v.a. unidimensionais. A probabilidade marginal para cada
valor é obtida da seguinte forma:

∑ P(x , y )
s
 para X: P(X = x i ) = P(x i ) = i j
j =1

∑ P(x , y )
r
 para Y: P (Y = y j ) = P(y j ) = i j
i =1

a.3) Distribuições condicionais

Seja x i um valor de X, tal que P(X = x i ) = P(x i ) > 0


A probabilidade

P(X = x i, Y = y j )
P(Y = y j /X = x i ) =
P( X = x i )

é denominada probabilidade condicional de Y = y j , dado que X = x i .

Assim, para x i fixado, os pares [ y j , P(Y = y j /X = x i )] definem a distribuição


condicional de Y, dado que X = x i .

Analogamente para o X:

P(X = xi, Y = y j )
P(X = xi /Y = y j ) =
P(Y = y j )

___________________________________________________________________________________
69
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
b) (X, Y) é v.a.c. bidimensional

A variável (X, Y) será uma v.a.c. bidimensional se (X, Y) puder assumir todos os
valores em algum conjunto não enumerável.

b.1) Função densidade de probabilidade conjunta

Seja (X, Y) uma v.a.c. bidimensional. Dizemos que f(x, y) é uma função
densidade de probabilidade conjunta de X e Y, se satisfizer às seguintes condições:

a) f (x, y ) ≥ 0, para todo (x, y )


∞ ∞
b) ∫ ∫ f (x, y )dx dy = 1
−∞ −∞

f(x, y) = 0 para (x, y) ∉ aos intervalos de x e y.

Temos ainda que:

∞ ∞
P(a ≤ X ≤ b, c ≤ Y ≤ d) = ∫ ∫ f (x, y )dx dy
−∞ −∞

b.2) distribuições marginais

As f.d.p. marginais de X e Y são dadas por:

∞ ∞
g(x ) = ∫ f (x, y ) dy e h(y ) = ∫ f (x, y ) dx respectivamente.
−∞ −∞

Temos ainda que:

b d
P(a ≤ X ≤ b ) = ∫ g(x ) dx e P(c ≤ X ≤ d) = ∫ h(y )dy
a c

b.3) Distribuições condicionais

Sejam X e Y v.a.c. com f.d.p. conjunta f(x, y) e f.d.p. marginais dadas por g(x) e
h(y).
A f.d.p. condicional de X, dado que Y = y é definida por:

f (x, y )
f (x/y ) = , h(y ) > 0
h(y)

Analogamente, a f.d.p. condicional de Y, dado que X = x é definida por:

___________________________________________________________________________________
70
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
f (x, y )
f (y/x ) = , g(x ) > 0
g(x)

As f.d.p. condicionais acima, satisfazem a todas as condições impostas para uma


f.d.p. unidimensional.
Deste modo para y fixado, teremos:
a) f(x/y) ≥ 0
f (x, y ) h(y )
∞ ∞ ∞
1
b) ∫ f (x/y )dx = ∫ dx = ∫ f (x/y )dx = =1
−∞ −∞
h(y ) h(y ) − ∞ h(y )

5.7 - Variáveis aleatórias independentes

a) (X, Y) é uma v.a.d. bidimensional.

Definição 1 - Seja (X, Y) v.a.d. bidimensional. Dizemos que X e Y são


independentes se, e somente se, para todo par de valores (x i , y j ) de X e Y, tem-se:

P(X = x i , Y = y j ) = P(X = x i ) . P(Y = y j )

Basta que esta condição não se verifique para um par (x i , y j ) para que X e Y não
sejam independentes. Neste caso diremos que X e Y são dependentes.

Definição 2 - Seja (X, Y) uma v.a.d. bidimensional. Neste caso X e Y serão


independentes se, e somente se,
P(X = x i /Y = y j ) = P(X = x i ), para todo i e j.

ou equivalente se e somente se
P(Y = y j /X = x i ) = P(Y = y j ), para todo i e j.

b) (X, Y) é uma v.a.c. bidimensional.

Definição 1 - Seja (X, Y) v.a.c. bidimensional. Diremos que X e Y são


independentes se, e somente se:
f(x, y) = g(x) . h(y), para todo x e todo y

Definição 2 - Seja (X, Y) uma v.a.c. bidimensional. Neste caso X e Y serão


independentes se, e somente se:
f(x/y) = g(x). Nesse caso, é evidente que f(y/x) = h(y).

OBS.: Todas as definições concernentes a duas v.a. podem ser generalizadas para o
caso de n v.a.

Exemplos:
1. Dada a distribuição de probabilidade conjunta de (X, Y) na Tabela abaixo:

___________________________________________________________________________________
71
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
X Y 0 1 2
0 0,10 0,20 0,20
1 0,04 0,08 0,08
2 0,06 0,12 0,12

Pede-se:
a) Distribuição marginal de X e Y, distribuição de (X + Y) e de XY?
b) X e Y são independentes?
c) As distribuições condicionais de X dado que Y = 0 e Y dado que X = 1?
d) P(X ≥ 1,Y ≤ 1)?
e) P(X ≤ 1/Y = 0)?
f) Construir a distribuição conjunta a partir das distribuições marginais de X e de Y?

Resposta: d) 0,30; e) 0,70

2. Sejam X e Y v.a.c. com f.d.p. conjunta dada por:


k (2x + y ), 2 ≤ x ≤ 6, 0 ≤ y ≤ 5
f (x, y ) = 
0, para outros valores de x e y
Pede-se:
a) O valor de k?
b) P(X ≤ 3, 2 ≤ Y ≤ 4)?
c) P(Y < 2)?
d) P(X > 4)?
e) X e Y são v.a. independentes? Justifique?
f) f(x/y)?
g) f(x/Y = 1)?

Resposta: a) 1/210; b) 16/210; c) 72/210; d) 125/210; e) Não

Problemas propostos:
1) A função de probabilidade conjunta da v.a. X e Y é dada por:
x y 10 − x − y
10!  1   25   10 
p(x, y ) =      
x! y! (10 − x − y )  36   36   36 
para x = 0,1,2, …, 10 e y = 0,1,2, …, 10
0 ≤ x + y ≤ 10

Calcule:
a) P(X≤ 2, Y≤ 2)?
b) P(X + Y = 4)?

Resposta: a) ≅ 0,00157; b) ≅ 0,0262

___________________________________________________________________________________
72
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
5.8 - Conceitos e Propriedades de esperança matemática e variância de variáveis
aleatórias

a) Esperança matemática (média ou valor esperado de uma v. a.)

Neste item vamos aprender a quantificar o parâmetro média de uma população.


A esperança matemática de uma população é também denominada uma medida da
tendência central.
Parâmetro é uma medida utilizada para descrever uma característica de uma
população e caracteriza a distribuição de probabilidade de uma variável aleatória.
Sob o ponto de vista científico, a esperança matemática corresponde ao que se
espera que aconteça em média.

a.1) Caso em que X é uma v.a.d.

Seja X uma v.a.d. com a seguinte distribuição de probabilidade:


xi x1 x2 … xn Total
P(x i ) P(x 1 ) P(x 2 ) … P(x n ) 1

Define-se a esperança matemática de X por:


E(X ) = μx = μ = x1 ⋅ P(x1 ) + x 2 ⋅ P(x 2 ) +  + x n ⋅ P(x n )

n
E(X ) = ∑ x i ⋅ P(x i )
i =1

Exemplo: Um fabricante produz peças tais que 10% delas são defeituosas e 90% não
são defeituosas. Se uma peça defeituosa for produzida, o fabricante perde R$ 1,00;
enquanto uma peça não defeituosa lhe dá um lucro de R$ 5,00. Seja a variável aleatória
X = {lucro líquido por peça}. Calcular a média do lucro líquido por peça.

Resposta: Ε(Χ) = 4,40

a.2) Caso em que X é uma v.a.c.

A esperança matemática de uma v.a.c. X é definida por:



E( X ) = ∫ x f (x ) dx
−∞

Exemplo: Uma v.a.c. X apresenta a seguinte f.d.p.:


0, para x < 0
x

f (x ) =  , para 0 ≤ x ≤ 2
2
0, para x > 0
Calcular E(X)? (R: 4/3)

___________________________________________________________________________________
73
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________

a.3) Propriedades da esperança matemática

As propriedades a seguir apesar de estarem apenas demonstradas para quando


X é uma v.a.c., valem também para quando X é uma v.a.d..
P 1 ) Se X é uma v.a. com P(X = k) = 1, então E(X) = k, sendo k uma constante (ou numa
linguagem mais simples mas menos rigorosa, pode-se dizer que a média de uma
constante é a própria constante).
∞ ∞
Prova: E(X ) = ∫ k f (x ) dx = k ∫ f (x ) dx = k → E(X ) = k
−∞ −∞

P 2 ) A esperança matemática do produto de uma constante por uma variável é igual ao


produto da constante pela esperança matemática da variável, ou seja, multiplicando se
uma variável aleatória por uma constante, sua média fica multiplicada por essa
constante.

∞ ∞
Prova: E(X ) = ∫ k x f (x ) dx = k ∫ x f (x ) dx = k E(X )
−∞ −∞

P 3 ) A esperança matemática do produto de duas variáveis aleatórias independentes é


igual ao produto das esperanças matemáticas das variáveis, ou seja, a média do
produto de duas variáveis aleatórias independentes é o produto das médias.

∞ ∞
Prova: E(XY ) = ∫ ∫ x y f (x, y ) dx dy
−∞ −∞

Se X e Y são v.a. independentes, a f.d.p. conjunta pode ser fatorada no produto


das f.d.p. marginais de X e Y. Assim:

∞ ∞ ∞ ∞
E(XY ) = ∫ ∫ x y g(x ) h(y ) dx dy = ∫ x g(x ) dx ∫ y h(y ) dy
−∞ −∞ −∞ −∞

E(XY) = E(X).E(Y)

obs: E(XY) = E(X).E(Y) não implica que X e Y sejam variáveis aleatórias independentes.

P 4 ) A esperança matemática da soma ou da subtração de duas v.a. quaisquer é igual a


soma ou a subtração das esperanças matemáticas das duas v.a., ou seja, a média da
soma ou da subtração de duas v.a. é igual a soma ou subtração das médias.

Prova:
∞ ∞ ∞ ∞ ∞ ∞
E( X ± Y ) = ∫ ∫ (x ± y ) f (x, y ) dx dy = ∫ ∫ x f (x, y ) dx dy ± ∫ ∫ y f (x, y ) dx dy
−∞ −∞ −∞ −∞ −∞ −∞

___________________________________________________________________________________
74
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

∞ ∞
E( X ± Y ) = ∫ x g(x ) dx ± ∫ y h(y ) dy = E(X) ± E(Y )
−∞ −∞

P 5 ) A esperança matemática da soma ou subtração de uma v.a. com uma constante é


igual a soma ou subtração da esperança matemática com a constante, ou seja,
somando-se ou subtraindo-se uma constante a uma v.a., a sua média fica somada ou
subtraída da mesma constante.
Prova:
∞ ∞ ∞
E( X ± k ) = ∫ (x ± k )f (x )dx = ∫ x f (x ) dx + ∫ k f (x ) dx = E(X) ± k
−∞ −∞ −∞

P 6 ) A média de uma v.a. centrada é zero, ou seja, a média dos desvios dos valores da
v.a. em relação a sua média é zero.

Obs: Dizemos que a v.a. está centrada quando todos os valores são expressos como
desvios em relação à respectiva média, (X – μ x ).

Assim: E[X − μx ] = E(X ) − E[μx ] = μx − μx = 0

b) Variância

É a medida que quantifica a dispersão dos valores em torno da média. A


variância de uma v.a. X é definida por:
V (X ) = σ 2x = E[X − E(X )] = E[X − μx ]
2 2

b.1.) Para X v.a.d.: V (X ) = ∑ (x i − μx ) ⋅ P(x i )


2


b.2.) Para X v.a.c.: V (X ) = ∫ (x − μ ) P(x )
2
x i
−∞

Uma fórmula mais prática para calcular a variância é:

V(X) = E(X2) − [E(X)]2,


pois,
V (X ) = E[X − E(X )]
2

{
= X2 − 2XE(X ) + [E(X )]
2
}
( )
= E X2 − 2E(X )E(X ) + E(X ) [ 2
]
= E(X ) − [E(X )]
2 2

em que:

___________________________________________________________________________________
75
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
( )
- para X v.a.d.: E X2 = ∑ x i2P(x i )
i


( )
- para X v.a.c.: E X2 = ∫ x 2 f (x ) dx
-∞

b.3.) Propriedades da variância:

Valem tanto para X v.a.d. quanto para X v.a.c.

P 1 ) A variância de uma constante é igual a zero.

Prova: V(k) = E[K− E(K)]2 = E(k − k)2 = 0

P 2 ) Somando-se ou subtraindo-se uma constante à uma v.a., sua variância não se


altera.

Prova:
V (X ± k ) = E[(X ± k ) − E(X ± k )]
2

= E[(X ) − E(X ) ± (k − k )]
2

= E[X − E(X )] = V (X )
2

V (X ± k ) = V (X )

P 3 ) Multiplicando-se uma v.a. por uma constante, sua variância fica multiplicada pelo
quadrado da constante.

Prova:
V (kX ) = E[kX − E(kX )]
2

= E[kX − kE(X )]
2

= k 2E[X − E(X )]
2

V (kX ) = k 2 V (X )

P 4 ) A variância da soma de duas v.a. independentes é igual a soma das variâncias das
duas variáveis.

Prova:
V (X + Y ) = E[X + Y ] − [E(X + Y )]
2 2

( )
= E X2 + 2XY + Y 2 − [E(X ) + E(Y )]
2

= E(X ) + 2E(XY ) + E(Y ) − {[E(X )] + 2E(X )E(Y ) + [E(Y )] }


2 2 2 2

= E(X ) + 2E(XY ) + E(Y ) − [E(X )] − 2E(X )E(Y ) − [E(Y )]


2 2 2 2

___________________________________________________________________________________
76
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Se X e Y são independentes; E(XY) = E(X).E(Y), assim
{( ) [
V ( X + Y ) = E X 2 − E( X )
2
]}+ {E(Y ) − [E(Y ) ]}
2 2

V(X + Y) = V(X) + V(Y)

Do mesmo modo:
V(X - Y) = V(X) + V(Y)

OBS.1: Desvio padrão da variável X é a raiz quadrada positiva da variância de X.


σ x = V (X )

OBS.2: Sejam X e Y duas v.a.. A covariância entre X e Y, denotada por Cov(X,Y) é


definida por:

Cov(X,Y) = E{[X – E(X)][Y – E(Y)]}, ou, de forma alternativa,


Cov(X,Y) = E(X,Y) – E(X)E(Y)
E(X, Y ) = ∑ x i y iP(x i, y i )
i

A covariância nos dá uma idéia da relação de dependência entre duas ou mais


v.a.
Proposições úteis:
a) Cov(X,Y) = Cov(Y,X)
b) Se V(X) = 0 ou V(Y) = 0 então a Cov(X,Y) = 0
c) Cov(X,k) = Cov(k,Y) = 0
d) Cov(aX,bY) = abCov(X,Y), sendo a e b constantes
e) Cov(X + Z,Y) = Cov(X,Y) + Cov(Z,Y)

Resultado útil: Se X e Y são duas variáveis quaisquer


V(aX ± bY) = a2V(X) + b2V(Y) ± 2abCov(X,Y)

Exercícios propostos:

1. Sabendo-se que Y = 3X-5 e que E(X) = 2 e V(X) = 1, calcule:

a)E(Y); b)V(Y); c)E(X+3Y); d)E(X2 + Y2 ); e)V(3X+2Y);

Resp.: 1; 9; 5; 15; 81

2. Uma urna contém 5 bolas brancas e 7 bolas pretas. Três bolas são retiradas
simultaneamente dessa urna. Se ganharmos R$ 200,00 por bola branca retirada e
perdermos R$ 100,00 por bola preta retirada, qual seria o nosso lucro esperado? Resp.:
75

3. Uma moeda honesta é lançada sucessivamente até sair cara ou até serem feitos 3

___________________________________________________________________________________
77
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
lançamentos. Obtenha a distribuição de X = número de lançamentos, e calcule sua
média e variância. Resp.: E(X)=1,75; Moda=1; V(X)=11/16

4. Uma máquina de apostar tem 2 discos independentes. Cada disco tem 10 figuras: 4
maçãs, 3 bananas, 2 pêras e 1 laranja. Paga-se 80 para acionar a máquina. Se
aparecerem 2 maçãs ganha-se 40; 2 bananas 80; 2 pêras 140 e 2 laranjas 180. Qual é
o resultado esperado após inúmeras jogadas? Resp.: E(X) = − 59

5. Um determinado artigo é vendido em caixas a preço de 8 U.M. por caixa. Sabe-se


que 20% dos artigos vendidos apresentam algum defeito de fabricação. Um comprador
faz a seguinte proposta: Pede para poder amostrar, ao acaso, 10 artigos por caixa e
pagará por caixa 10 U.M. se nenhum dos artigos amostrados for defeituoso; 5 U.M. se
um ou dois artigos forem defeituosos e 4 U.M. se três ou mais forem defeituosos. O que
é melhor para o vendedor; manter o seu preço de 8 U.M. por caixa ou aceitar a proposta
do comprador? Mostre por quê.
Considere X = número de artigos defeituosos, com a seguinte distribuição de
probabilidade: (sugestão: utilize a variável Y = valor pago por caixa)
xi 0 1 2 ≥3 Total
P(x i ) 0,1074 0,2684 0,3019 0,3223 1,00

Resp.: O vendedor deve manter o seu preço [E(Y) ≅ 5,21]

6. (X, Y) é uma variável aleatória bidimensional discreta com a seguinte distribuição


conjunta:
X Y -3 2 4 P(x i )
1 0,10 0,20 0,20 0,5
3 0,30 0,10 0,10 0,5
P(y j ) 0,4 0,3 0,3 1

Pede-se calcular:
a) E(X), V(X) e σ x
b) E(Y), V(Y) e σ y
c) E(X + Y)
d) X e Y são independentes?

Resp.: a) 2; 1 e 1 b) 0,6; 9,24 e 3,04 c) 2,6 d) não são

7. Seja X uma v.a.c. com a seguinte f.d.p.:


2
 3 , x ∈ [0,1]

2
f (x ) =  (2 − x ), x ∈ [1,2]
3
0, caso contrário


___________________________________________________________________________________
78
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Calcule:
a) A esperança matemática de (X-1)2
b) O desvio padrão de X

Resp.: a) 0,278 b) 0,478

8. Mostre que E{[X – E(X)][Y – E(Y)]}= E(X,Y) – E(X)E(Y)

Lista de Exercícios
1. Uma v.a.c. X possui f.d.p. dada por:
( )
6 x − x 2 , 0 ≤ x ≤ 1
f (x ) = 
0, para outros valores de x

Calcular :
a) P[E(X) − 2σ ≤ X ≤ E(X) + 2σ], dado E(X2) = 3/10? (R: ≅ 0,9855)
b) F(x), a Função de distribuição acumulada? (R: 0 se x < 0; x2(3 -2x) se 0 ≤ x ≤ 1; 1 se
x ≥ 1)

2. Suponha que X e Y tenham a seguinte distribuição conjunta:


Y X -1 1 2
-2 0,10 0,10 0
0 0,10 0,20 0,30
3 0,10 0,10 0

Sabendo-se que V(X) = 1,41 e E(Y) = 0,2 ; pede-se:


a) X e Y são v. a. independentes? Mostre. (R: Não)
1 
b) E X − 3Y 2 + 8  (R: 0,55)
2 
1 
c) V  X − 3Y 2 + 8  (R: 119,57)
2 

3. Dada a função densidade de probabilidade abaixo:


1
 2 , se 0 ≤ x ≤ 1

 1
f (x ) = − (x − 3 ), se 1 ≤ x ≤ 3
 4
0, para outros valores de x

Calcule :
a) V(12X - 8), dado E(X2) = 127/6 (R: 2879)

___________________________________________________________________________________
79
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
b) A função de distribuição acumulada (R: 0 se x < 0; x/2 se 0 ≤ x < 1; − 1/8 (x2 − 6x +
1) se 1 ≤ x < 3; 1 se x ≥ 3)
c) P(-0,5 < X < 1,5) (R:15/32)

4. Uma v. a. c. X possui a seguinte f. d. p.:



0, se x < −1 ou x ≥ 3
4

(
1
)
f (x ) =  1 − x 2 , se − 1 ≤ x < 0
2
1
 2 , se 0 ≤ x < 3
4

Determinar:
a) F(x), a função de distribuição acumulada? (R: 0 se x < − 1; 1/6(−x3 + 3x + 2) se −1 ≤
x < 0; 1/6(2 + 3x) se 0 ≤ x < 4/3; 1 se x ≥ 4/3)
b) P(−0,5 ≤ x ≤ 0,5) (R: 23/48)

5. Dada a distribuição conjunta abaixo, parcialmente indicada:


Y X -3 -2 -1
-2 1/15 1/15 ? 7/30
0 8/30 ? 2/15 ?
1 ? 1/30 ? 7/30
P(X) 6/15 7/30 ?

Pede-se:
a) Verifique se X e Y são v. a. independentes? (R: não)
 X3 2Y 
b) E − − 10  (R: -3723/450)
 2 5 
c)V(8 −15X) (R: 689/4)

6.Cite as propriedades de:


a) Esperança Matemática.
b) Variância.

7. Conceitue:
a) Variável aleatória discreta
b) Variável aleatória contínua

8.Uma v. a. c. é dada por:


kx 2 , se 2 ≤ x < 5

f (x ) = k (8 − x ), se 5 ≤ x < 8
0, para outros valores de x

___________________________________________________________________________________
80
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

Determinar:
a) O valor da constante k para que f(x) seja uma f. d. p.? (R: 2/87)
8 27 
b) P ≤ X ≤  (R: 149/261)
2 2 

9. Suponha que X e Y tenham a seguinte distribuição conjunta:


Y X 1 2 4 5 P(Y)
2 0,2 0,1 0,1 0,2
3 0,1 0,1 0,1 0,1
P(X)

Pede-se:
 1 
a) E − X  ? (R: -1)
 3 
b)V(5X− 3Y)? (R: 72,16)
c) X e Y são v. a. independentes? Mostre por que? (R: não)

10. Sabendo-se que X e Y são variáveis aleatórias independentes e que E(X) = 5, V(X)
= 2, E(Y) = 8 e V(Y) = 3, calcule:

a) E(X - Y + 3)? (R: 0)


b) E[(X - Y)2]? (R: 14)
 1 
c) V  X − Y  ? (R: 7/3)
 3 
d)V(3Y + 2)? (R: 27)

11. Seja (X, Y) uma variável aleatória bidimensional discreta, com a seguinte função
de probabilidade:
 2x i + y j
, para x i = 0, 1, 2 e y j = 0, 1, 2, 3
P(x i, y j ) =  42

0, caso contrário

Pede-se:
a) Dar a tabela da distribuição de probabilidade conjunta?
b) Dar a tabela da distribuição marginal de X e também a de Y?
c) E(X − 2Y + 4)? (R: 70/42)

12. Dada a seguinte função:


k (2 - x ), se 0 ≤ x < 1

f (x ) = k, se 1 ≤ x ≤ 2
0, para outros valores de x

Determinar:

___________________________________________________________________________________
81
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
a) O valor de K para que f(x) seja uma f.d.p.? (R: 2/5)
b) E(X3)? (R: 81/50)
 3
c) P X ≥  ? (R: 0,2)
 2
d) P(X = 1)? (R: 0)

13. Sejam X e Y v. a. c. com função densidade de probabilidade conjunta dada por:


k (2x + y ), se 2 ≤ x ≤ 6 e 0 ≤ y ≤ 5
f (x, y ) = 
0, caso contrário

Pede-se:
a) O valor de K para que f (x, y) seja uma f. d. p.? (R: 1/210)
b) P(Y ≤ 2)? (R: 72/210)
c) P(X > 3 / 0 ≤ Y ≤ 2)? (R: 60/72)
d) X e Y são v. a. independentes? Mostre? (R: não)

___________________________________________________________________________________
82
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

6.0 – DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS DISCRETAS E CONTÍNUAS

6.1– Introdução

Algumas variáveis aleatórias adaptam-se muito bem a uma séria de problemas


práticos e aparecem com bastante freqüência. Assim, um estudo pormenorizado das
mesmas facilita a construção dos correspondentes modelos de probabilidades, bem
como a determinação dos seus principais parâmetros. Desta forma, para um dado
problema, tentamos verificar se ele satisfaz as condições de algum modelo conhecido,
facilitando a determinação dos parâmetros.

6.2 – Distribuições de variáveis aleatórias discretas

Será feita uma discussão sobre algumas distribuições de probabilidades


discretas. Tais distribuições partem da pressuposição de certas hipóteses bem
definidas. Como diversas situações reais muitas vezes se aproximam dessas hipóteses,
esses modelos são úteis no estudo de tais situações, daí a sua importância. Um cuidado
muito grande deve ser tomado ao se escolher uma distribuição de probabilidade que
descreve corretamente as observações geradas por um experimento.

6.2.1 – Uniforme

É a mais simples de todas as distribuições discretas de probabilidade. É aquela


na qual a v.a. assume todos os seus valores com a mesma probabilidade. Uma tal
distribuição é chamada distribuição uniforme.
A distribuição discreta uniforme é dada por:
P(x,k) = 1/k = P(X = x)
onde x é um dos possíveis valores da v.a. X.
Utilizamos aqui P(x,k) ao invés de p(x) para indicar que a distribuição uniforme
depende do parâmetro k.
Este é o caso mais simples de v.a. discreta, onde cada possível valor ocorre com
a mesma probabilidade.
___________________________________________________________________________________

83
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________

Definição: A variável aleatória discreta X, assumindo os valores x 1 , x 2 , …, x n , tem


distribuição uniforme, se e só se,
1
P(X = x i ) = P(x i ) = p = n, para todo i = 1, 2, ..., n.
n

i) Gráfico

ii) Tabela
xi x1 x2 x3 x4 ... xn
P(x i ) 1/n 1/n 1/n 1/n ... 1/n

Exemplos:
1) Seja E: lançamento de um dado não-viciado.
O espaço amostral é: S = {1, 2, 3, 4, 5, 6)
Cada ponto de S tem probabilidade do ocorrer igual a 1/6.

Tabela:
xi 1 2 3 4 5 6
P(x i ) 1/6 1/6 1/6 1/6 1/6 1/6

6.2.2 – Bernoulli

Seja um experimento no qual só pode ocorrer sucesso ou fracasso.


Associaremos uma v.a. X aos possíveis resultados, da seguinte forma:

x = 1, se ocorrer um sucesso
X= 1
x 2 = 0, se ocorrer um fracasso
___________________________________________________________________________________

84
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Diremos que a variável aleatória assim definida tem distribuição de Bernoulli. Se p
é a probabilidade de ocorrer sucesso, logicamente a probabilidade de ocorrer um
fracasso é 1 – p = q. Logo, a função de probabilidade de X com distribuição de Bernoulli
é dado por:
P(X = x) = p x ⋅ q1−x , se x = 0 ou 1, caso contrário = 0
 A média da v.a.d. X é: Ε(x ) = p
 A variância da v.a.d. X é: V (x ) = p ⋅ q

Aplicação – Em ensaios em que os resultados podem ser classificados como sucesso


ou fracasso, ou seja, respostas do tipo sim ou não, típico de ensaios biológicos. Ex:
Resistência de plantas a doenças se for resistente o resultado é sim, se não for será
não.

6.2.3 - Binomial (uma extensão da distribuição de Bernoulli)

Suponha um experimento cujos resultados podem ser classificados em


“sucessos” e “fracassos”. Se fizermos X = 1 quando obtivermos um sucesso e X = 0
quando um fracasso, então a função de probabilidade de X será dada por: P(X = 1) = p
e P(X = 0) = 1-p (sendo p a probabilidade de “sucesso”). Nesse caso, dizemos que a
v.a. X tem distribuição de Bernoulli.
A distribuição Binomial advém da distribuição de Bernoulli quando repetimos um
ensaio (algumas vezes referido como “provas”) de Bernoulli n vezes.
Em resumo, teríamos o seguinte:
a) São realizados n ensaios independentes e do mesmo tipo;
b) Cada ensaio admite dois resultados: “sucesso” ou “fracasso”;
c) A probabilidade de sucesso em cada prova é p (valor constante) e, por
conseguinte, a probabilidade de fracasso será q = 1 – p, também constante.

IMPORTANTE: O modelo binomial exige que as provas sejam independentes e com p


constante.

Ao associarmos uma v.a. X igual ao número de sucessos nessas n provas


(ensaios), X poderá assumir os valores 0, 1, 2, …, n.
___________________________________________________________________________________

85
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
A distribuição de probabilidades de uma v.a. que tem distribuição binomial é dada
por:
C x ⋅ p x ⋅ qn − x x = 0, 1, 2,,n; 0 ≤ q = 1 − p ≤ 1
P(x;n,p ) =  n
0, caso contrário
Se X~B(n; p) então E(X) = np, e V(X) = npq.

Exemplos:

1. Se 20% dos parafusos produzidos por uma máquina são defeituosos, determinar a
probabilidade de, entre 4 parafusos escolhidos ao acaso, no máximo 2 deles serem
defeituosos. (R: 0,9728)

2. Um fabricante de certas peças de automóveis garante que uma caixa de suas peças
conterá no máximo 2 itens defeituosos. Se a caixa contém 20 peças e a experiência tem
demonstrado que esse processo de fabricação produz 2 por cento de itens defeituosos,
qual a probabilidade de que uma caixa de suas peças não vá satisfazer a garantia? (R:
0,0071)

3. Sabe-se que os discos produzidos por certa companhia serão defeituosos com
probabilidade de 1% independentemente de outros discos. A companhia vende os
discos em pacotes de 10 unidades e oferece uma garantia (de retorno em dinheiro) de
que no máximo 1 de cada 10 discos é defeituoso.
a) Qual é a proporção de pacotes retornados? R.: ≅ 0,5%
b) Se alguém compra 3 pacotes, qual é a probabilidade de exatamente um deles
ser retornado? R.: 0,015

4. Entre 2.000 famílias com 4 crianças cada uma, quantas se esperaria que tivessem:
a) Pelo menos um menino? (R: 1875)
b) Exatamente dois meninos? (R: 750).

___________________________________________________________________________________

86
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
obs.:
a) quando o número de ensaios n for grande (n ≥ 50 e np < 5) pode-se usar a
aproximação pela distribuição de Poisson (a ser apresentada posteriormente) com
média μ = λ = np;

b) de forma similar podemos usar a aproximação pela distribuição normal (a ser


apresentada posteriormente) com μ = np e σ 2 = npq, no caso em que np e nq são
maiores que 5;

c) a distribuição Hypergeométrica (a ser apresentada posteriormente) se reduz à


distribuição Binomial se N, o número de elementos na
população Hipergeométrica, tende ao infinito ou é grande comparado com n, o tamanho
da amostra. Nesse caso, a ocorrência de reposição ou não torna-se indistinguível.

6.2.4 - Multinomial

Essa distribuição é uma extensão da distribuição Binomial. O experimento


binomial se transforma em um experimento multinomial se em cada tentativa (prova ou
ensaio) tivermos mais de dois possíveis resultados de interesse. Como exemplo
considere o caso de termos 3 possíveis resultados: classificação de um produto em
defeituoso, aceitável e recuperável; ou de acidentes de trânsito em leves, graves ou
fatais.
Se numa dada tentativa podem ocorrer k resultados, A 1 , A 2 , …, A k , com
probabilidades p 1 , p 2 , …, p k , então a distribuição de probabilidades das v.a.d. X 1 , X 2 , …,
X k número de ocorrências para A 1 , A 2 , …, A k em n tentativas independentes é:

n!
P(x1, x 2 ,, x n ;p1,p2 ,,pk ; n) = p1x1 ⋅ p2x 2 ⋅  ⋅ pkx k
x1! x 2! x k !
k k
onde ∑x i =1
i =n e ∑p
i =1
i =1

___________________________________________________________________________________

87
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
Exemplo: Uma peça é considerada “boa” (tipo 1) se uma de suas dimensões L está
entre l 1 e l 2 ; “recuperável” (tipo 2) se L > l 2 e “perdida” (tipo 3) se L < l 1 . Numa caixa
temos 5 peças do tipo 1, 4 do tipo 2 e 3 do tipo 3. Retira-se, aleatoriamente, uma peça
dessa caixa e mede-se sua dimensão com o auxílio de um aparelho de precisão, após o
que devolve-se a peça dentro da caixa. Seis operações dessa natureza são realizadas.
Qual é a probabilidade de entre as seis peças observadas obtermos o seguinte
resultado: 3 peças do tipo 1, 2 do tipo 2, e 1 do tipo 3?

solução:
p1 = 5/12; p2 = 4/12; p3 = 3/12

3 2 1
6!  5   4   3  625
P(x1, x 2 , x 3 ) =   ⋅  ⋅  = = 0,1206
3!2!1!  12   12   12  5184

obs.:
a) quando k = 2 temos a distribuição binomial
b) E(X i ) = np i ; V(X i ) = np i q i

6.2.5 – Poisson (‘Lei dos fenômenos raros’)

Em muitos casos conhecemos o número de sucessos, porém o número de


fracassos ou o número total de provas seria difícil de ser determinado, ou muitas vezes,
não faria nenhum sentido prático. Por exemplo, o número de descargas elétricas num
dia de chuva normal. Podemos, num determinado espaço de tempo determinar o
número de descargas elétricas ocorridas, porém, o número de descargas elétricas que
deixaram de ocorrer não poderá ser determinado. Da mesma forma, o número de trincas
por unidade de área numa peça de concreto. Podemos determinar quantas trincas
ocorreram, porém não saberemos contar quantas trincas não ocorreram.
Este tipo de distribuição é útil para descrever as probabilidades do n de
ocorrências num campo ou intervalo contínuo (em geral tempo ou espaço). Eis alguns
exemplos de variáveis que podem ter como modelo a distribuição de Poisson:

___________________________________________________________________________________

88
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
- nº de defeitos por cm2
- nº de acidentes por dia
- nº anual de suicídios
- nº de chamadas erradas por hora, num circuito telefônico, etc.
Note-se que a unidade de medida (tempo, área, etc) é contínua mas a variável
aleatória (nº de ocorrências) é discreta.
A distribuição de Poisson é utilizada quando o nº de observações de um
experimento aleatório é muito grande (ex: N ≥ 50) e a probabilidade de sucesso é muito
pequena (ex: p≤ 0,1) e o termo Np permanece constante. Daí ser conhecida,
classicamente, como a lei dos fenômenos raros.
A distribuição de Poisson fica completamente caracterizada por um único
parâmetro, a média do processo, pois na distribuição de Poisson a média é igual a
variância, ou seja, E(X) = V(X) = λ (ou algumas vezes representado por µ , ou m).
Sabendo-se que uma v.a. tem resultados distribuídos segundo Poisson e
conhecendo o nº médio de ocorrências por unidade de medida, podemos determinar a
probabilidade de qualquer dos resultados possíveis nos intervalos para os quais
desejamos.
A distribuição de Poisson é uma forma limite da distribuição binomial, quando N
tende a infinito e p tende a zero.

i) Função de probabilidade:

e − λ λx
P( X = x ) = , em que:
x!
X = v.a.d. representando o número de sucessos;
x = um particular valor de X;
e = base do logarítmo neperiano (e ≅ 2,718)
λ = média da distribuição no intervalo de tempo ou medida considerado. Média esta
sempre positiva.

E(X) = V(X) = λ = Np

___________________________________________________________________________________

89
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
Exemplos:
1. Num livro de 800 páginas há 800 erros de impressão.
a) Qual a probabilidade de que uma página contenha pelo menos 3 erros de impressão?
(R: ≅ 0,0803).

b) Estime o número provável de páginas por livro que não contêm erros de impressão.
(R: ≅ 294)

2. Numa indústria, há uma média de 3 acidentes por mês.


a) Qual a probabilidade de ocorrerem 2 acidentes no próximo mês? (R: ≅ 22,4%).
b) Qual a probabilidade de ocorrerem 10 acidentes nos próximos 6 meses? (R: ≅ 0,015)

6.2.6 - Geométrica

O nome distribuição geométrica ocorre porque os termos de sua função de


probabilidade, para cada valor da variável aleatória, seguem um série geométrica. Numa
sequência de provas de Bernoulli independentes, o número de “falhas” antes do
acontecimento do primeiro “sucesso” tem um distribuição Geométrica com parâmetro p.
Ao invés de ser formulada como P(x; p) = pqx, x = 0, 1, 2, …, onde X é o número
de “falhas” antes de um “sucesso” , a distribuição Geométrica pode ser expressa
como P(x; p) = pqx-1, x = 1, 2, … , quando, nesse caso, X será o número de realizações
até o primeiro “sucesso” (inclusive).

E( X ) = 1 e σ 2 = q 2
p p

Exemplos:
1) Suponha-se que o custo de realização de um experimento seja R$ 1000. Se o
experimento falhar, ocorrerá um custo adicional de R$ 300 em virtude de serem
necessárias algumas alterações antes que a próxima tentativa seja executada. Se a
probabilidade de sucesso em uma tentativa qualquer for 0,2 (se as provas forem
independentes), e se os experimentos continuarem até que o primeiro resultado frutuoso
seja alcançado, qual será o custo esperado do procedimento completo? R.: R$ 6200.

___________________________________________________________________________________

90
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

2) Em determinada localidade, a probabilidade da ocorrência de uma tormenta em


algum dia durante o verão (nos meses de dezembro a janeiro) é igual a 0,1. Admitindo
independência de um dia para outro, qual é a probabilidade da ocorrência da primeira
tormenta da estação de verão no dia 3 de janeiro? R.:0,003.

3) Se a probabilidade de que um certo ensaio de reação “positiva” for igual a 0,4, qual
será a probabilidade de que menos de 5 reações “negativas” ocorram antes da primeira
positiva? R.: 0,92

obs.:
a) Suponha que exista uma longa sequência de “falhas” numa série de provas de
Bernoulli independentes com p=0,5. Contrário ao pensamento intuitivo de alguns
jogadores, isto não tem efeito algum nos resultados futuros. Essa propriedade é
chamada de falta de memória da distribuição.
b) As frequências dessa distribuição sempre diminuem numa progressão geométrica à
medida que o valor de X aumenta.

c) Essa distribuição é frequentemente usada em modelos meteorológicos de ciclos do


tempo.

6.2.7 - Binomial negativa

Essa distribuição de probabilidade é uma generalização da geométrica, ou seja, a


geométrica é um caso particular da binomial negativa. É também conhecida como
distribuição de Pascal. Se ensaios de Bernoulli independentes (p constante) são
repetidos X vezes até um número fixo de “sucessos” (digamos r) tenha ocorrido, X terá
distribuição Binomial Negativa. Essa distribuição pode ser considerada como a soma de
v.a. X 1 + X 2 + … + X r cada uma com a mesma distribuição Geométrica.
Consideremos um experimento no qual as propriedades são as mesmas que
aquelas enumeradas para o experimento binomial, com exceção de que as tentativas
serão repetidas até que um número fixo de sucessos venha a ocorrer. Portanto em vez
de achar a probabilidade de x sucessos em n tentativas, onde n é fixo, estamos
___________________________________________________________________________________

91
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
interessados na probabilidade de que o k-ésimo sucesso ocorra na x-ésima tentativa.
Esse tipo de experimento é chamado experimento binomial negativo. O número de
tentativas X para produzir k sucessos em um experimento binomial negativo é chamado
uma v.a.d. binomial negativa.
Sua função de probabilidade é:

Ckx--11 ⋅ pk ⋅ qx −k x = k,k + 1, k + 2,; 0 ≤ q = 1 − p ≤ 1


P(x;k,p ) = 
0, caso contrário

k (1 − p ) k (1 − p )
E( X ) = e σ2 =
p p2

Exemplos:
1) No arremesso de uma moeda honesta, qual seria a probabilidade de ocorrer a
segunda “cara” no quarto arremesso? R.: 0,1875

2) A probabilidade de que um experimento seja bem sucedido é 0,8. Se o experimento


for repetido até que quatro resultados bem sucedidos tenham ocorrido, qual será o
número esperado de repetições necessárias? R.: 5.

obs.:
a) Essa distribuição encontra aplicação em estudos de acidentes, como uma substituta
para a distribuição de Poisson quando requerimentos de independência não são
satisfeitos.

b) Também usada para descrever gastos e demanda de consumidores por produtos


adquiridos com certa frequência.

c) Comparando as distribuições Binomial e Binomial Negativa temos: em ambos os


casos estamos tratando com provas repetidas de Bernoulli. A distribuição Binomial
surge quando lidamos com números fixados (digamos n) dessas provas e estaremos
interessados no número de sucessos que venha a ocorrer. A distribuição Binomial

___________________________________________________________________________________

92
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Negativa é encontrada quando nós pré-fixamos o número de sucessos a ser obtido e
então registramos o número de provas de Bernoulli necessárias.

6.2.8 - Hipergeométrica

Em geral podemos estar interessados na probabilidade de selecionar x sucessos


de k elementos rotulados como sucessos e n-x falhas de N-k elementos rotulados como
falhas ou defeitos quando uma amostra aleatória de tamanho n é retirada de uma
população de N elementos. Esse é chamado um experimento hipergeométrico.
Propriedades:
a) uma amostra aleatória de tamanho n é tirada de uma população de tamanho N sem
reposição;

b) k dos N elementos podem ser classificados como sucessos e N-k são classificados
como fracasso (ou falhas).

O número x de sucessos em um experimento hipergeométrico é chamada v.a.


hipergeométrica.
A distribuição de probabilidade de uma v.a. hipergeométrica X, número de
sucessos em uma v.a. de tamanho n selecionada de N elementos sem reposição entre
os quais k são rotulados sucessos e N-k rotulados como fracasso, é:

P(X = x ) = h(x;N,n,k ) =
( )( ) , onde x = 0, 1, 2, ..., n
k N−k
n− x
()
x
N
n

N−n
E(X ) = np e σ 2 = npq  em que p = k N
 N − 1 
Exemplos:
1) Uma firma comprou várias caixas contendo cada caixa 15 lâmpadas. A mesma
decidiu fazer uma inspeção por amostragem sem reposição analisando 5 lâmpadas de
cada caixa e aceitando a caixa caso se encontre duas ou menos defeituosas. Calcule a
probabilidade de se aceitar uma caixa sabendo que a qualidade do produto é definida
por 20% de defeituosos. R.: ≅ 0,978.

___________________________________________________________________________________

93
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
2) Pequenos motores elétricos são expedidos em lotes de 50 unidades. Antes que uma
remessa seja aprovada, um inspetor escolhe 5 desses motores e os inspeciona. Se
nenhum dos motores inspecionados for defeituoso, o lote é aprovado. Se um ou mais
forem verificados defeituosos, todos os motores da remessa são inspecionados.
Suponha que existam, de fato, três motores defeituosos no lote. Qual é a probabilidade
de que a inspeção de todos os motores desse lote seja necessária? R.: 0,28.

obs.:
a) uma extensão da distribuição hipergeométrica: se N elementos podem ser repartidos
em k grupos A 1 , A 2 , …, A k com a 1 , a 2 , …, ak elementos respectivamente, então a
distribuição de probabilidade das v.a.d. X 1 , X 2 , …, X k representando o número de
elementos selecionados de A 1 , A 2 , …, A k em uma amostra aleatória de tamanho n
(retirada sem reposição de elementos) é:

p(x1, x 2 ,, x k ;a1,a2 ,,ak ,N,n) =


( )( )( )
a1
x1
a2
x2
ak
xk

() N
n

k k
com ∑ xi = n
i =1
e ∑a
i =1
i =N

b) uma característica importante dessa distribuição é que ela se refere a amostragem de


uma população sem reposição do elemento selecionado;

c) essa distribuição pode ser aproximada pela Binomial com parâmetros n e p, onde p é
calculado por k/N, se k/N ≤ 0,1;

d) já que a distribuição binomial pode ser aproximada pelas distribuições de Poisson e


Normal, também existe a correspondente aproximação pela Poisson e Normal para a
distribuição Hipergeométrica, quando n é grande, ≥ 50, e k/N é pequeno, < 0,1, no caso
da Poisson; e quando n é grande e k/N não é pequeno, ≈ 0,5, no caso da Normal.

e) Admita-se que X tenha distribuição Hipergeométrica. Se fizermos p = k/N, q = 1- p.


Assim, E(X) = np; V(X) = npq[(N-n)/N-1)].
___________________________________________________________________________________

94
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

f) Aplicações em controle de qualidade industrial

g) Aplicações na estimação do tamanho de populações de animais a partir de dados de


“captura-recaptura”.

6.3 - Distribuições de variáveis aleatórias contínuas

6.3.1 - Uniforme

Também conhecida como distribuição Retangular. Uma v.a. X é dita


uniformemente distribuida no intervalo [a, b] se sua fdp for dada por
f(x) = 1/(b-a) se x ∈ [a, b], e f(x) = 0 se x ∉ [a, b].

Exemplos:
1) Trens urbanos chegam a uma estação em intervalos de 15 minutos começando às 7
da manhã. Se o horário de chegada de um passageiro nessa estação está
uniformemente distribuída entre 7 e 7:30, encontre a probabilidade que ele espere:
a) menos que 5 minutos por um trem? R.: 1/3
b) pelo menos 12 minutos por um trem? R.: 1/5

2) Prove que, se X é uniformemente distribuída em [a, b], então E(X)=(a+b)/2 e


V(X)=[(b-a)2]/12.

3) Uma máquina de encher copos de de refrigerante sempre despeja nos copos uma
quantidade de bebida entre 270 e 300 ml. Assumindo que X = volume de refrigerante
seja uma v.a. uniformemente distribuida, determinar:
a) A probabilidade de que em um copo sejam despejados mais de 290 ml de
refrigerante?
b) A probabilidade de ocorrer um copo com menos de 275 ml de refrigerante?
c) O volume esperado em um copo qualquer?
d) A variância do volume esperado em um copo qualquer?

___________________________________________________________________________________

95
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
obs.:
a) Um valor de uma distribuição uniforme (0, 1) é chamado um “número aleatório”. Tem
inúmeras aplicações em simulações e montagem de experimentos.

6.3.2 - Normal

É uma das mais importantes distribuições de probabilidades, sendo aplicada em


inúmeros fenômenos e constantemente utilizada para o desenvolvimento teórico da
inferência estatística. É também conhecida como distribuição de Gauss, Laplace ou
Laplace-Gauss.
Seja X uma v.a.c.. Dizemos que X tem distribuição normal se possuir a seguinte
f.d.p.:
1 ( x − μ )2
1 −
f (x ) = e 2 σ2
, para − ∞ < μ < ∞, − ∞ < x < ∞ e σ > 0
σ 2π

Notação: X∼N(μ; σ2): X tem distribuição normal com média μ e variância σ2.

i) Representação gráfica:

μ ± σ → 68,27%, μ ± 2 σ → 95,45% μ ± 3σ. → 99,73%

É um gráfico em forma de sino. O seu posicionamento em relação ao eixo das


μ e σ
ordenadas e seu achatamento vai ser determinado pelos parâmetros 2
,
respectivamente.

___________________________________________________________________________________

96
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
A função de distribuição acumulada é dada por:
x x 1 ( x − μ )2
1 −
F(x ) = P(X ≤ x ) = ∫ f (x )dx = ∫ e 2 σ2
dx
−∞ − ∞ σ 2π

ii ) Propriedades:
P 1 ) f(x) possui um ponto de máximo para x = μ.
P 2 ) f(x) tem dois pontos de inflexão cujas abscissas valem μ + σ e μ – σ.
P 3 ) f(x) é simétrica em relação a x = μ. E ainda, μ = Mo = Md.
P 4 ) f(x) tende a zero quando x tende para ± ∞ (assintótica em relação ao eixo x).

iii) Cálculo de probabilidades:

Para o cálculo da probabilidade da v.a.c. assumir um valor em determinado


intervalo, surgem dois problemas:
• 1º) Integração de f(x), pois para o seu cálculo é necessário o
desenvolvimento em séries.
• 2º) Elaboração de tabelas se torna inviável, pois a f.d.p. depende de dois
parâmetros, o que acarretaria a necessidade do estabelecimento de todas
as possíveis combinações de valores desses parâmetros.

Estes problemas são resolvidos pela padronização dos valores, obtendo-se assim
a distribuição normal padronizada ou reduzida.

6.3.2.1 - Variável Normal Padronizada (Z)

É obtida por meio de uma transformação linear da variável normal X, obtendo-se


assim uma escala relativa de valores na qual a média é tomada como ponto de
referência e o desvio padrão como medida de afastamento da média:

X −μ
Z=
σ
onde:
z = valor da variável normal padronizada Z
___________________________________________________________________________________

97
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
x = valor de X
μ = média de X
σ = desvio padrão de X

Média e Variância da Variável Normal Padronizada

i) Média:

 X −μ 1
 = [E(X − μ)] = [E(X ) − E(μ)] = (μ − μ) = 0
1 1
E(Z ) = E
 σ  σ σ σ

E(Z) = 0

ii) Variância:
 X −μ 1
V (Z ) = V 
1
(
1 2
)
 = 2 [V (X − μ)] = 2 [V (X ) + V (μ)] = 2 σ + 0 = 1
 σ  σ σ σ

V(Z) = 1
X −μ
Conclusão: Se X ~ N (μ, σ2), e Z = , então Z ∼N (0,1), para quaisquer valores de μ
σ
e σ2. Portanto, será possível tabelar as probabilidades, P(X ≤ x) = P(Z ≤ z), em função
dos valores de Z.
A f.d.p. da variável Z é dada por:
1
1 − 2 z2
ϕ (z ) = e , para −∞ < z < ∞

Tabela da Distribuição Normal Padrão

Há vários tipos de tabelas que nos fornecem as probabilidades sob a curva


normal. A tabela que vamos utilizar é aquela que fornece a probabilidade da variável Z
assumir um valor entre zero e um particular z 0 , ou seja:

___________________________________________________________________________________

98
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

z0 z 1
1 0 − 2 z2
P(0 ≤ Z ≤ z0 ) = ∫ ϕ (z )dz =
2π ∫0
e dz
0

é a área rachurada sob a curva normal [ ϕ (z)].

Exemplos:
1) Calcule:
a) P(Z < 1,82)?
b) P (Z ≤ -2,03)?
c) P (-2,55 ≤ Z ≤ 1,20)?
d) P (Z ≥ 1,93)?

R: a) 0,9656 b) 0,0212 c) 0,8795 d) 0,0268

2) Se X∼N (100, 25), calcule:


a) P (X > 110)?
b) P (95 ≤ X ≤ 105)?
c) Encontre x tal que P (X ≤ x) = 0,3446

R: a) 0,0228 b) 0,6826 c) 98

Obs.: Teorema da Combinação Linear

A combinação linear de variáveis normais independentes é também uma variável


normal. Assim se X e Y são variáveis normais independentes, então W = aX + bY + c é

___________________________________________________________________________________

99
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
também uma variável normal com média μW = aμX + bμY + c e variância

σ 2W = a2σ 2X + b2σ 2Y , onde a, b e c são constantes.


Em particular, devemos notar que a soma ou subtração de duas ou mais variáveis
aleatórias normais, também é uma variável normal.

Exercícios

1. Um pesquisador decidiu que, para facilitar a classificação das aves em experimentos


de nutrição, deve-se dividir as poedeiras, no início da postura, em três grupos de peso
equiprováveis, a saber: poedeiras pesadas, poedeiras médias e poedeiras leves.
Encontre os pesos correspondentes à cada classe, sabendo-se que o peso médio das
aves nessa idade é 1,5 kg, com desvio padrão de 0,170 kg (supor distribuição normal).

(R: Leves: peso < 1,43 kg; médias: 1,43 ≤ peso ≤ 1,57 kg; pesadas: peso > 1,57 kg)

2. O diâmetro de um cabo elétrico é normalmente distribuído com média 0,8 mm e


variância 0,0004 mm2. Dentre uma amostra de 1000 cabos, quantos esperamos que
tenha diâmetro:
a) maior ou igual a 0,81 mm? (R: 308,5)
b) entre 0,73 e 0,86 mm? (R: 998,7)
c) menor que 0,78 mm? (R: 158,7)

3. Em uma distribuição normal 28% dos elementos são superiores a 34 e 12% dos
elementos são inferiores a 19. Encontrar a média e a variância da distribuição.
(R: μ ≅ 29,03 e σ2 ≅ 73,4)

4. X é uma v.a.c. tal que X∼N (12, 25). Qual a probabilidade de uma observação ao
acaso ser menor do que -2,5? (R: 0,0019).

___________________________________________________________________________________

100
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Outras distribuições de variáveis aleatórias contínuas

6.3.3 - Exponencial

A v.a.c. X terá distribuição exponencial se sua f.d.p., para algum parâmetro λ > 0,
for dada por:
λe − λx para x ≥ 0
f (x ) = 
0 caso contrário

Essa distribuição desempenha importante papel na descrição de uma grande


classe de fenômenos, particularmente nos assuntos da teoria de confiabilidade. Tem
como principal característica a propriedade de não possuir memória. Isso significa que o
tempo de vida futuro (t) de algum objeto tem a mesma distribuição, independente do
tempo de vida passada (s) desse objeto, ou seja, para quaisquer s, t > 0, P(X > s + t | X
> s) = P(X > t).

Exemplos:
1) Mostre que F(x) = P(X ≤ x) = 1 – e-xλ, para x > 0

2) A vida média de um satélite é 4 anos, seguindo o modelo exponencial. Seja T a


variável definindo o tempo de vida do satélite. Calcule:
a) P(T > 4). R.: 0,3678
b) P(5 ≤ T ≤ 6). R.: 0,0634
c) Se 4 desses satélites forem lançados no mesmo instante, qual é a probabilidade que
após 5 anos todos estejam funcionando? R.: 0,00674
d) Se 4 desses satélites forem lançados no mesmo instante, qual é a probabilidade que
após 5 anos exatamente dois estejam funcionando? R.: 0,2507

obs.:
a) Apresenta inúmeras aplicações nas áreas da teoria da confiabilidade.
b) E(X) = 1/λ e V(X) = 1/λ2.

___________________________________________________________________________________

101
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
6.3.4 - Lognormal

Essa distribuição ocorre na prática sempre que se encontrar uma v.a. tal que seu
logarítmo tenha uma distribuição normal. Em outras palavras, se uma v.a. X tem
distribuição Normal e se os valores de uma v.a. Y estão relacionados a X pela equação
y = ex, Y terá distribuição Lognormal.

Exemplo:
1) Encontrou-se, num certo processo de “trituração de pedras” que os diâmetros, D, das
pedras quebradas seguem aproximadamente uma lei lognormal com média 1,5 cm e
desvio padrão 0,3 cm. Qual a porcentagem das pedras:
a) que excede 2 cm? (R.: ≈ 6,2%)
b) menor do que 1 cm? (R.: ≈ 2,6 %)

obs.:
a) Exemplos de aplicação: doses críticas em aplicações de drogas; duração de
consultas médicas; distribuição de tamanhos de unidades econômicas.

6.3.5 - Gamma

A v.a. é dita ter uma distribuição Gamma com parâmetros α( , β), α > 0, β > 0, se
sua f.d.p. é dada por:
 βα α -1 −βx
 x e para x ≥ 0
f (x ) = Γ (α )
0
 caso contrário
onde

Γ (α ) = ∫ e − x x α −1dx , é chamada de função gamma.
0

Resultados importantes são:


a) Γ(n) = (n – 1) Γ(n – 1) = ... = (n – 1)!
b) Γ(1/2) = π

___________________________________________________________________________________

102
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Exemplo: O tempo de vida de uma bateria tem distribuição exponencial com taxaβ. Se
um aparelho eletrônico requer uma bateria para funcionar, então o tempo total de
funcionamento que podemos obter de um total de n baterias é uma v.a. gamma com
parâmetros (n, β). Como proceder para obter a probabilidade do aparelho funcionar por
um tempo maior que t?

obs.:
a) Uma relação pode ser feita entre as distribuições Gama e Poisson. Na de Poisson
estamos interessados no número de ocorrências de algum evento durante um período
de tempo fixado. A Distribuição Gama, por outro lado, surge quando indagamos a
distribuição do tempo necessário para obter um número especificado de ocorrências do
evento.

b) Fornece uma representação útil de muitos fenômenos físicos. Fornece um melhor


ajuste à distribuição Exponencial na modelagem de tempo de vida de peças. Tem
também aplicação em processos meteorológicos, teoria de riscos de seguros e teoria
econômica.

c) quando α = 1 a distribui
ção gamma se reduz à distribuição exponencial com média
1/β.

d) essa distribuição surge quando indagamos a distribuição do tempo necessário para


obter um número especificado de ocorrências do evento.

6.3.6 - Weibull

Essa distribuição provê mais flexibilidade quando a distribuição exponencial


parece ser adequada, especialmente quando condições de estrita casualização não são
satisfeitas. Ela descreve dados de teste de tempo de duração (vida) e fadiga. Portanto
essa distribuição é frequentemente usada para representar a distribuição da força de
quebra de materiais em testes de controle de qualidade e confiabilidade.

___________________________________________________________________________________

103
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
obs.:
a) A distribuição de Weibull representa um modelo adequado para uma lei de falhas,
sempre que o sistema for composto de vários componentes e a falha seja
essencialmente devida à “mais grave” imperfeição ou irregularidade dentre um grande
número de imperfeições do sistema;
b) Empregando uma distribuição de Weibull, poderemos obter tanto uma taxa de falhas
crescente como uma decrescente, pela simples escolha apropriada do parâmetro.

6.3.7 - Beta

O gráfico representativo dessa distribuição revela muitas das suas propriedades à


medida que os parâmetros variam.

obs.:
a) Essa distribuição é amplamente utilizada para ajustar distribuições teóricas cujas
amplitudes de variação são conhecidas. O ajuste é realizado após equacionar o primeiro
e segundo momentos (esperança e variância, respectivamente) das curvas teórica e
ajustada.

6.3.8 - χ2 (Qui-quadrado)

A distribuição de Qui-quadrado possui numerosas aplicações importantes em


inferência estatística. Essa distribuição aparece naturalmente na teoria associada com a
distribuição da soma dos quadrados de variáveis normais-padrão independentes. Dada
a sua importância, tal distribuição está tabulada para diferentes valores do parâmetro v.

Exemplo: aplicação em testes de hipóteses e como aproximação para distribuições de


algumas funções de variáveis aleatórias

obs.:
a) Essa distribuição é usada primariamente como uma aproximação para a estatística χ2
(a ser vista oportunamente) sendo esta muito importante para vários testes de
significância.
___________________________________________________________________________________

104
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

6.3.9 - F

Essa distribuição tem importância na teoria estatística principalmente pela sua


aplicação na distribuição de razões de variâncias. Sua aplicação mais comum é,
portanto, em testes associados com a análise de variância (ANOVA, a ser discutido em
Estatística Experimental), quando a homogeneidade de um conjunto de médias é
testado. No nosso curso utilizaremos essa distribuição para testar a igualdade de
variâncias advindas de duas populações normais.

Exemplo: aplicação em testes de hipóteses.

___________________________________________________________________________________

105
Capítulo 7 – Testes de Significância
_____________________________________________________________________

7.0 – TESTES DE SIGNIFICÂNCIA

7.1– Introdução

Testes de significância (também conhecidos como Testes de Hipóteses)


correspondem a uma regra decisória que nos permite rejeitar ou não rejeitar uma
hipótese estatística com base nos resultados de uma amostra.

Obs.: essas hipóteses são, em geral, sobre parâmetros populacionais e a realização do


teste se baseia na distribuição amostral dos respectivos estimadores.

7.2 - Hipótese Estatística

É uma suposição quanto ao valor de um parâmetro populacional, ou uma


afirmação quanto à natureza da população. As hipóteses estatísticas devem ser
formuladas de modo a minimizar os erros de decisão.

7.2.1 - Hipótese de Nulidade e Hipótese Alternativa

- Hipótese de Nulidade (H 0 ) - É a hipótese a ser testada. É formulada com o


propósito de ser rejeitada e os testes são construídos sobre a pressuposição de H 0 ser
verdadeira. O teste de hipóteses consiste em verificar se a amostra observada difere
significativamente do resultado esperado sobre H 0 .

- Hipótese Alternativa (H a ) -É uma hipótese que contraria H 0 . É formulada com


base no conhecimento prévio do problema, informações de pesquisa, etc.

Exemplo:
H 0 : μ = 6.000 horas (durabilidade de lâmpadas)
H a : μ > 6000; ou H a : μ < 6000; ou H a : μ ≠ 6000

hipóteses unilaterais hipótese bilateral


___________________________________________________________________________________

106
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Após a realização do teste concluímos por uma das hipóteses dadas acima.

7.2.2 - Regiões críticas

RRH0 RRH0
RAH0 RAH0

Teste unilateral à direita μ < X Teste unilateral à esquerda μ > X

RRH0 RRH0
RAH0

Teste bilateral μ ≠ X

7.2.3 - Erros de decisão

Qualquer decisão tomada implica na possibilidade de cometer basicamente dois


tipos de erros: Erro tipo I e Erro tipo II.

Erro tipo I – É o erro caracterizado pelo fato de rejeitarmos o H 0 quando esta é


verdadeira. Designaremos por α a probabilidade de se cometer o erro tipo I (nível de
significância do teste).

Erro tipo II – É o erro caracterizado pelo fato de aceitarmos H 0 quando esta é


falsa. Designaremos por β a probabilidade de se cometer o erro tipo II.

Poder do teste – é a probabilidade de rejeitar H 0 quando esta é falsa.


Poder = 1 – β.

___________________________________________________________________________________
Prof. Carlos Eduardo Magalhães dos Santos

107
Capítulo 7 – Testes de Significância
_____________________________________________________________________
O quadro abaixo facilita o entendimento.
Realidade
Decisão H 0 é verdadeira H 0 é falsa
Rejeitar H 0 α 1-β
Aceitar H 0 1-α β

então:
α = P(rej.H 0 /H 0 é verdadeira)
β = P(aceitar H 0 /H 0 é falsa)

7.3 - Procedimentos para a realização de um Teste de Hipótese (Passos)

1º - Enunciar as hipóteses H 0 e H a ;
2º - Fixar o nível de significância α e identificar a estatística do teste;
3º - Determinar a região crítica (faixa de valores que nos levam à rejeição da hipótese
H 0 ) e a região de aceitação em função do nível α pelas tabelas estatísticas apropriadas;
4º - Baseado na amostra, calcular o valor da estatística do teste;
5º - Concluir: Se estatística do teste ∈ região crítica ⇒ rej. H 0 caso contrário não rejeita
H0.

7.4 - Testes de Hipóteses

7.4.1 - Teste z
Teste z (veremos apenas o teste para uma média populacional)

Obs: assume-se que a variável em estudo tenha distribuição normal com variância
populacional conhecida.

7.4.1.1 - Teste z para 1 média

A estatística do teste é baseada na média amostral X . Pode ser demonstrado


μ e
que a média amostral tem distribuição aproximadamente normal com média

variância σ
2
, onde n é o tamanho da amostra.
n

___________________________________________________________________________________

108
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Testamos as hipóteses: H 0 : μ = μ 0 versus Ha: uma alternativa conveniente.

X −μ
A estatística do teste z para 1 média é: zcalc =
σ
n

De acordo com o nível de significância e a hipótese alternativa definidas obtemos


o valor tabelado de z na tabela apropriada.

A regra de decisão será:


• Se zcalc ≥ z tab ⇒ rejeitamos H 0 ;

• caso contrário não rejeitamos H 0 .

Exercícios:
1) Uma máquina automática de encher pacotes de café enche-os segundo uma
distribuição normal, com média μ e variância 400 g 2. O valor de μ pode ser fixado num
mostrador situado numa posição um pouco inacessível dessa máquina. A máquina foi
regulada para μ = 500 g. Desejamos, de meia em meia hora, colher uma amostra de 16
pacotes e verificar se a produção está sob controle, isto é, se μ = 500 g ou não. Se uma
dessas amostra apresentasse uma média x = 492 g, você pararia ou não a produção
para verificar se o mostrador está na posição correta? Usar α = 1%.

2) Uma companhia de cigarros anuncia que o índice médio de nicotina dos cigarros que
fabrica apresenta-se abaixo de 23 mg por cigarro. Um laboratório realiza 6 análises
desse índice, obtendo: 27, 24, 21, 25, 26, 22. Sabe-se que o índice de nicotina se
distribui normalmente, com variância igual a 4,86 mg2. Pode-se considerar a afirmativa
do fabricante verdadeira, ao nível de 10% de probabilidade?

7.4.2 - Teste t

Obs: assume-se que a variável em estudo tenha distribuição normal com variância
populacional desconhecida.

___________________________________________________________________________________
Prof. Carlos Eduardo Magalhães dos Santos

109
Capítulo 7 – Testes de Significância
_____________________________________________________________________
7.4.2.1 - Teste t para 1 média
Testamos as hipóteses: H 0 : μ = μ 0 versus Ha: uma alternativa conveniente.

X −μ
A estatística do teste t para 1 média é: t calc = , onde:
σˆ
n
σ̂ ou s = desvio padrão amostral.

De acordo com o nível de significância e a hipótese alternativa definidas obtemos


o valor tabelado de t α (n – 1) na tabela apropriada.

CUIDADO
Teste bilateral entrar com α
Tabela bilateral
Teste unilateral entrar com 2α

Teste unilateral entrar com α


Tabela unilateral
Teste bilateral entrar com α/2

A regra de decisão será:


• Se t calc ≥ t tab ⇒ rejeitamos H 0 ;

• caso contrário não rejeitamos H 0 .

Exemplo: Determinada firma desejava comprar cabos tendo recebido do fabricante a


informação de que a tensão média de ruptura é 8000 kgf. Para analisar se a afirmação
do fabricante é verdadeira, efetuou-se um teste de hipótese unilateral. Se um ensaio
com 6 cabos forneceu uma tensão média de ruptura de 7750 kgf, com desvio padrão de
145 kgf, a qual conclusão chegar, usando um nível de significância de 5%?

7.4.2.2 - Teste t para duas médias (2 amostras independentes)

Muitos problemas aparecem quando deseja testar hipóteses sobre médias de


diferentes populações. Por exemplo, um pesquisador pode estar investigando um novo

___________________________________________________________________________________

110
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
tipo de máquina, comparando a produção média de períodos em que foi usada a
máquina antiga e a nova.
Quando as variâncias das populações são substituídas pelas variâncias
amostrais, isto é, σ̂ 2 ou s2 em lugar σ 2 , o teste z passa ateste t, onde em função das
variâncias das populações serem ou não iguais entre si.

Obs: Pressupõe-se normalidade dos dados.

Sejam X e Y normalmente distribuídos com variâncias desconhecidas.


Desejamos testar:
H 0 : μ X = μ Y contra
μX > μY ou

Ha : μX < μY ou
μ ≠ μ
 X Y

Exemplo: dois métodos de execução de determinada tarefa. X e Y seriam os tempos


gastos com cada método.

Outra pressuposição (apenas para efeito de nosso curso de CRP 192) seria a
homogeneidade das variâncias populacionais σ 2X e σ 2Y (desconhecidas).

Portanto assumimos: σ 2X = σ 2Y = σ 2 , isso quer dizer que σˆ 2X e σˆ 2Y são estimativas de


um mesmo valor σ2.
Portanto podemos combinar σˆ 2X e σˆ 2Y a fim de obter um melhor estimador para σ2.

Então: σˆ 2 =
SQD X + SQD Y (n − 1)σˆ 2X + (nY − 1)σˆ 2Y
= X
(nX − 1) + (nY − 1) nX + nY − 2

Utilizamos para o teste, a variável aleatória:


X−Y
t=
 1 1
σˆ 2  + 
 nX nY 

que tem distribuição t de Student com n X + n Y − 2 graus de liberdade.


___________________________________________________________________________________
Prof. Carlos Eduardo Magalhães dos Santos

111
Capítulo 7 – Testes de Significância
_____________________________________________________________________

Decisão:
Se t calc ≥ t tab ⇒rejeita H 0

Exercício: Suponhamos que duas técnicas de memorização X e Y deverão ser


comparadas medindo-se a eficiência pelo tempo exigido para decorar certo tipo de
material. O mesmo material foi apresentado a n X = 18 e n Y = 13 pessoas que o
decoraram usando as técnicas X e Y respectivamente. Verificar se há diferença
significativa entre as duas técnicas de memorização, adotandoα = 5%. Os resultados
foram:
X = 20 min Y = 17 min

σˆ 2X = 12 min 2 σˆ 2Y = 15 min 2

n X = 18 nY = 13

Os dois últimos testes a serem apresentados a seguir (Teste χ2 e Teste F) são


usados para testar hipóteses referentes a um parâmetro populacional ou mesmo à
comparação de dois parâmetros.

7.4.3 - Teste de Qui-quadrado (χ2 )

O teste de Qui-quadrado faz parte dos chamados “testes não-paramétricos”, ou


seja, que não dependem dos parâmetros populacionais, nem de suas respectivas
estimativas.
O teste de Qui-quadrado pode ser usado principalmente como:
i) Teste de aderência
ii) Teste de independência
iii) Teste de homogeneidade

Veremos, a princípio, apenas o teste de aderência, sendo os demais testes


filosoficamente (e até mesmo “mecanicamente”) similares, mas aplicáveis quando
queremos estudar a relação entre duas ou mais variáveis de classificação. Se o tempo

___________________________________________________________________________________

112
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
permitir será apresentado também pelo menos mais um dos outros testes de qui-
quadrado.

7.4.3.1 - Teste de Aderência

Existe apenas uma variável e o que se testa é o padrão hipotético de frequências


ou a distribuição da variável.

A estatística do teste é dada por: χ 2 = ∑


(Oi − Ei )2 , onde
Ei
O i = frequência observada da categoria (evento) i;
E i = frequência esperada da categoria (evento) i.

Obs: A expressão acima nos dá um valor sempre positivo e tanto menor quanto maior
for o acordo entre as frequências observadas e as frequências esperadas, calculadas
com base em H 0 .

Obs: A hipótese H 0 afirmará não haver discrepâncias entre as frequências observadas e


as frequências esperadas, ou H 0 será colocada em termos de distribuição de
probabilidade que vamos por à prova.

O valor de χ 2 calc é comparado com o χ 2tabelado .

Se χ 2 calc ≥ χ 2tabelado ⇒ rejeita-se H 0 .

Obs: Para obter o χ 2tabelado precisamos conhecer o nível de significância (α) do teste e o
número de graus de liberdade v, onde v = k – 1 – r, onde k é o número de categorias em
que foi dividida a amostra; e r é o número de parâmetros estimados para o cálculo das
Ei.

Exemplo: Em 100 lances de uma moeda, observaram-se 65 coroas e 35 caras. Testar a


hipótese da moeda ser honesta, adotando-se α = 5%.

___________________________________________________________________________________
Prof. Carlos Eduardo Magalhães dos Santos

113
Capítulo 7 – Testes de Significância
_____________________________________________________________________
7.4.4 - Teste F

O teste F é um teste de hipóteses utilizado para verificar se as variâncias de duas


populações com distribuição normal são diferentes.

Exemplo: Na aplicação de dois métodos A e B, obteve-se os resultados abaixo. Testar


a hipótese de igualdade das variâncias ao nível de 5% de probabilidade.
Método σ̂ 2 n
A 40 11
B 16 19

7.5 - Lista de exercícios

1) Sabe-se que o consumo mensal per capita de um determinado produto tem


distribuição normal, com desvio padrão 2 kg. A diretoria de uma firma que fabrica esse
produto resolveu que retiraria o produto da linha de produção se a média de consumo
per capita fosse menor que 8 kg. Caso contrário, continuaria a fabricá-lo. Foi realizada
uma pesquisa de mercado, tomando-se uma amostra de 25 indivíduos, e verificou-se
que a soma dos valores coletados foi de 180 kg.
a) Utilizando um nível de significância de 5%, e com base na amostra colhida determine
a decisão a ser tomada pela diretoria? (R: Rejeita-se H 0 )
b) Utilizando um nível de significância de 1 %, a decisão seria a mesma? (Justifique a
sua resposta) (R: Não se rejeita-se H 0 )

2) Estamos desconfiados de que a média das receitas municipais per capita das cidades
pequenas (0 - 20.000 habitantes) é maior do que a das receitas do estado, que é de
1229 unidades monetárias. Para comprovar ou não esta hipótese, sorteamos dez
cidades pequenas, e obtivemos os seguintes resultados: 1230; 582; 576; 2093; 2621;
1045; 1439; 717; 1838; 1359. A que conclusão chegar a um nível de 5% de
probabilidade? (R: Não se rejeita-se H 0 )

___________________________________________________________________________________

114
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
3) Uma fábrica de embalagens para produtos químicos está estudando dois processos
para combater a corrosão de suas latas especiais. Para verificar o efeito dos
tratamentos, foram usadas amostras cujos resultados estão no quadro abaixo. Qual
seria a conclusão sobre os dois tratamentos, ao nível de 5% de significância?
Método Amostra Média Desvio padrão
A 15 48 10
B 12 52 15
(R: Não se rejeita-se H 0 )

4) Suponhamos que um pesquisador, desejando colocar à prova a hipótese de que a


idade da mãe tem certa influência sobre o nascimento de criança prematura, verificou
que, dentre 90 casos de prematuridade, 40 envolviam mães com idade inferior a 18
anos; 15 envolviam mães de 18 a 35 anos e 35 mães com idade acima de 35 anos. Isto
leva o pesquisador a manter sua hipótese? Use nível de significância de 0,01. (R:
Rejeita-se H 0 )

5) No decurso de um ano, determinada firma teve 50 acidentes. Um dos aspectos de


uma investigação levada a efeito pelo engenheiro de segurança diz respeito ao dia de
ocorrência do acidente. Pelos dados que seguem abaixo, pode-se dizer que o dia da
semana tenha alguma influência? Teste a hipótese nula, de que os dias são igualmente
prováveis, ao nível de 10% de probabilidade. (R: Rejeita-se H 0 )
Dia Segunda Terça Quarta Quinta Sexta
Nº de acidentes 15 6 4 9 16

6) A associação dos proprietários de indústrias metalúrgicas está muito preocupada com


o tempo perdido com acidentes de trabalho, cuja média, nos últimos tempos, tem sido
da ordem de 60 horas/homem por ano e desvio padrão de 20 horas/homem. Tentou-se
um programa de prevenção de acidentes, após o mesmo, tomou-se uma amostra de 9
indústrias e mediu-se o número médio de horas/homem perdidas por acidente, que foi
50 horas. Você diria, ao nível de 5%, que há evidência de melhoria? (R: Não se rejeita-
se H 0 )

7) Uma firma de produtos farmacêuticos afirma que o tempo médio para certo remédio
fazer efeito é de 24 minutos. Numa amostra de 19 casos, o tempo médio foi de 25
___________________________________________________________________________________
Prof. Carlos Eduardo Magalhães dos Santos

115
Capítulo 7 – Testes de Significância
_____________________________________________________________________
minutos, com desvio padrão de 2 minutos. Teste a alegação, contra a alternativa de que
o tempo médio é superior a 24 minutos, a um nível de significância de 1%. (R: Não se
rejeita-se H 0 )

8) Num estudo comparativo do tempo médio de adaptação, uma amostra aleatória, de


50 homens e 50 mulheres de um grande complexo industrial, produziu os seguintes
resultados:
Estatísticas Homens Mulheres
Médias 3,2 anos 3,7 anos
Desvios padrões 0,8 anos 0,9 anos

Que conclusões você poderia tirar para a população de homens e mulheres desta
indústria, ao nível de 5% de significância? (R: Rejeita-se H 0 )

9) Uma das maneiras de medir o grau de satisfação dos empregados de uma mesma
categoria quanto à política salarial é através do desvio padrão de seus salários. A
fábrica A diz ser mais coerente na política salarial do que a fábrica B. Para verificar essa
afirmação, sorteou-se uma amostra de 10 funcionários não especializados de A, e 15 de
B, obtendo-se os desvios padrões s A = 1,0 SM e s B = 1,6 SM. Qual seria a sua
conclusão, ao nível de 1%? (R: Não se rejeita-se H 0 )

___________________________________________________________________________________

116
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

8.0 – INTERVALOS DE CONFIANÇA

8.1– Introdução

É uma maneira de calcularmos uma estimativa de um parâmetro desconhecido.


Muitas vezes também funciona como um teste de hipóteses. A idéia é construir um
intervalo de confiança para o parâmetro com uma probabilidade de 1 - α (nível de
confiança) de que o intervalo contenha o verdadeiro parâmetro.

Obs: α é o nível de significância, isto é, o erro que estaremos cometendo ao afirmar-

mos que, por exemplo, 95% das vezes o intervalo θˆ 1 < θ < θˆ 2 contém θ. Nesse caso, o
erro seria de 5%.
Se considerarmos o intervalo l ≤ θ ≤ L , onde l é o limite inferior do intervalo, L é o
limite superior do intervalo, e θ é o parâmetro desconhecido, então o comprimento L – l
do intervalo de confiança observado é uma medida importante da qualidade da
informação obtida da amostra. A metade do intervalo, ou seja, θ – l ou L - θ, é chamado
de precisão do estimador.
Assim, quanto maior o intervalo de confiança, mais confiante nós estaremos de
que realmente o intervalo calculado contenha o verdadeiro valor de θ. Por outro lado,
quanto maior o intervalo, menos informação teremos sobre o verdadeiro valorθ.de
Numa situação ideal, obtemos um intervalo relativamente curto com alta confiança.
Nesse capítulo veremos apenas a “expressão” final para se obter um intervalo de
confiança. No entanto, pode-se demonstrar, facilmente, que intervalos de confiança são
obtidos com base na teoria discutida no capítulo sobre testes de hipóteses.

A estimação de parâmetros pode ser feita de duas maneiras:


i) Estimação por ponto → quando a partir da amostra procuramos obter um único
valor de certo parâmetro populacional. Ex: X é uma estatística que produz uma
estimativa por ponto do parâmetro populacional μ .

___________________________________________________________________________________

117
Capítulo 8 – Intervalos de confiança
_____________________________________________________________________
ii) Estimação por intervalo → quando a partir da amostra procuramos construir um

intervalo θˆ 1 < θ < θˆ 2 com certa probabilidade de que este intervalo contenha o
verdadeiro parâmetro populacional θ.

8.2 - Intervalos de confiança para média e variância.

8.2.1 - Intervalo de confiança para a média, quando a variância é conhecida.

Se X é a média de uma amostra aleatória de tamanho n de uma população com


variância conhecida σ2, o I.C. 100 (1 - α)% da média é dado por:
α α
X − zα ≤ μ ≤ X + zα
2 n 2 n
onde z α é obtido da distribuição normal reduzida.
2

Sabemos que μ não é uma variável aleatória, mas sim um parâmetro, desta forma
a expressão acima deve ser interpretada do seguinte modo: “Construídos todos os
intervalos de forma especificada acima, um menos α deles conterão o parâmetro μ ”.

Exemplo: Um artigo no “Journal of Heat Transfer” (1974) apresenta os dados abaixo


referentes à condutividade térmica (em Btu/hr.ft.ºF) de uma amostra de 10 peças
metálicas (ferro).
41,60 41,48 42,34 41,95 41,86 42,18 41,72 42,26 41,81 42,04
Obtenha o I.C. (95%) da média da condutividade térmica nessas peças metálicas.
Solução:
média = 41,924
desvio-padrão populacional (fornecido) = 0,30
z α = z0,05 = z0,025 = 1,96
2 2

Assim
I.C. (95%): 41,738 < μ ≤ 42,110

Conclusão: Este intervalo é bem pequeno. Se repetirmos este experimento um nº muito


grande de vezes, 95% dos intervalos assim construídos conterão μ no seu interior.

___________________________________________________________________________________

118
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Obs.1: pelo fato de μ se um par
âmetro e não uma v.a., o intervalo acima deve ser
interpretado da seguinte maneira: 95% dos intervalos assim construídos conterão a
verdadeira média.

Obs.2: A fórmula apresentada acima apresenta bons resultados para amostras oriundas
da população normal, ou para amostras com n ≥ 30 de população não normal. O nível
de confiança (1 – α) não será exato para amostras pequenas de população não normais.

Obs.3: Desde que o comprimento do I.C. mede a precisão da estimação, podemos


observar que a precisão é inversamente relacionada com o nível de confiança. O
desejável seria obter um I.C. que fosse curto o suficiente para o propósito de tomada de
decisão, e que também tivesse uma confiança adequada. Uma maneira de conseguir
isso seria pela escolha do tamanho da amostra n para ser grande o suficiente para dar
um I.C. de um determinado comprimento com uma confiança definida.

8.2.2 - Intervalo de confiança para média, quando a variância populacional é


desconhecida

Se X e α̂ são, respectivamente, a média e o desvio padrão de uma amostra


aleatória de uma população com distribuição normal e variância σ2 desconhecida, então
o I.C. de 100 (1- α)% da média é dado por:
αˆ αˆ
X − tα ≤ μ ≤ X + tα ,
2 n 2 n
onde t α é obtido da distribuição t de Student.
2

Exemplo: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de uma


população normal. Construir o intervalo de confiança, de 95%, para μ.

Solução:
X = 7,8
2
 
 ∑ Xi 
 i  (87 )
2

∑ iX 2

n
793 −
10 ≅ 4,0 ⇒ σˆ = σˆ 2 ⇒ σˆ ≅ 2,0
σˆ 2 = i =
n −1 10 − 1
___________________________________________________________________________________

119
Capítulo 8 – Intervalos de confiança
_____________________________________________________________________
2 2
∴I.C.(95%) : 8,7 − 2,262 ≤ μ ≤ 8,7 + 2,262 = 7,27 ≤ μ ≤ 10,13
10 10
Conclusão: Se repetirmos este experimento um nº muito grande de vezes em 95% dos
intervalos assim construídos conterão μ no seu interior.

Exercício: Considere os 20 dados abaixo correspondentes ao tempo de resistência ao


fogo (em segundos) de determinada vestimenta após tratamento com uma tintura
especial:
9,85 9,93 9,75 9,77 9,67 9,87 9,67 9,94 9,85 9,75
9,83 9,92 9,74 9,99 9,88 9,95 9,95 9,93 9,92 9,89

Assuma que o tempo de resistência ao fogo segue uma distribuição normal. Obter o I.C.
(95%) do tempo médio de resistência ao fogo.

R.: 9,8073 ≤ μ ≤ 9,8977. Dizemos estar 95% confiantes de que a média do tempo de
resistência ao fogo está entre 9,8073 e 9,8977 segundos.

8.2.3 - Intervalo de confiança para a variância de uma população normal

Seja X uma população normal com distribuição normal com média μ e variância

σ2. Sabe-se que (n − 1)σ


ˆ2
≈ χ (2n −1) , onde n é o tamanho da amostra e σ̂ 2 é a variância
σ 2

amostral. Então:

I.C.(1 − α ) :
(n − 1)σˆ 2 ≤ σ 2 ≤ (n − 1)σˆ 2
χ maior
2
χ menor
2

onde χ maior
2
e χ menor
2
são obtidos na tabela de χ 2 , com n – 1 graus de liberdade e nível de

significância de acordo com a figura abaixo:

Gráfico:

___________________________________________________________________________________

120
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Exemplo: Considerando a mesma amostra do exemplo anterior, calcule o I.C. para σ2
ao nível de 90% de confiança (ou seja, α =10%).

Solução:
Temos: n = 10, σ̂ 2 = 4, g.l. = v = 9; α = 10%.

Gráfico:

8.3 - Intervalo de confiança para a proporção

Obs: O método apresentado abaixo é apropriado quando n for maior que 30.

f (1 − f ) f (1 − f )
I.C.(1 − α ) será : f − Z α ≤ p ≤ f + Zα
2 n 2 n

onde f é a estimativa da proporção p.

Exemplo: Entre 500 pessoas inquiridas a respeito de suas preferências eleitorais, 260
mostraram-se favoráveis ao candidato B. Calcular o intervalo de confiança ao nível de
90% para a porcentagem (ou proporção) dos eleitores favoráveis a B.

8.4 - Determinação do tamanho da amostra

Uma questão que aparece frequentemente no planejamento de experimentos é


qual deve ser o tamanho da amostra para se ter determinada precisão na estimação da
média populacional. Aumentos no tamanho da amostra melhoram a precisão da
estimativa e diminui o comprimento do intervalo de confiança.

___________________________________________________________________________________

121
Capítulo 8 – Intervalos de confiança
_____________________________________________________________________
8.4.1 - Baseado no I.C. para a média, quando σ2 é conhecida
α
A precisão do I.C. é z α . Isto significa que em usar X para estimar μ , o erro
2 n
α
E = [ X - μ ] é menor ou igual a z α com confiança 100 (1 – α). Isso poderia ser
2 n
mostrado graficamente. Se o tamanho da amostra pode ser controlado, podemos
escolher n de modo que nós estaremos 100 (1 – α)% confiantes de que o erro na
estimação do μ será menor do que um erro específico E . Assim, o tamanho amostral
apropriado será aquele de n tal que
2
α  zα ⋅ σ 
zα = E, ou seja, n =  2 
2 n  E 
 
Obs.1: Se n não for inteiro, este deve ser aproximado para cima para garantir que o
nível de confiança não fique menor que 100(1 – α)%.
Obs.2: Observe que 2E é o comprimento do I.C. de interesse.

Exemplo: Considerando os dados do exercício anterior, suponha que queremos que o


erro na estimação da condutividade média naquela peça metálica seja menor do que
0,10 Btu/hr.ft.ºF, com 95% de confiança.
Solução:
Já que σ = 0,30 e z 0,025 = 1,96
2
 1,96 ⋅ 0,30 
n=  = 34,57 ≈ 35
 0,10 

Observemos a relação geral entre tamanho da amostra, comprimento desejado


do I.C. (2E), nível de confiança 100(1 – α)% e desvio padrão σ:
• Se 2E diminui, o tamanho amostral n aumenta, para σ e n ível de confiança constantes;
• Se σ aumenta, n aumenta, para 2E fixo e 100(1 – α)% fixo.
• Se o nível de confiança aumenta, n aumenta, para 2E fixo e σ fixo.

___________________________________________________________________________________

122
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
8.4.2 - Baseado no I.C. para a média, quando não conhecemos a σ2

Quando não conhecemos a variância σ 2, a determinação do tamanho amostral n


necessário para fornecer o I.C. com o comprimento de interesse não é fácil, já que o
comprimento do I.C. depende de σ e do valor de n . Além disso n entra no I.C. de duas

maneiras: 1 e tα ,n −1
.
n 2

Dessa forma, a obtenção de n ocorre por meio de tentativas e erros, usando uma
estimativa de σ baseada, talvez, em experiência passada.
Outra possibilidade seria tomar uma amostra preliminar (amostra piloto) de n
observações para estimarσ. Então, usando o desvio padrão amostral s como uma
aproximação para σ usamos a equação
2
 zα ⋅ σ 
n= 2 
 E 
 
para calcular o valor requerido de n para fornecer a acurácia e o nível de confiança
desejados.

8.5 - Exercícios Propostos

1) Em uma fábrica, colhida uma amostra de 30 peças para avaliação, obtiveram-se as


seguintes informações sobre o diâmetro das peças: X = 13,13 e σˆ 2 = 2,05 . Construir
um intervalo de confiança para a média sendo α = 5%? (R.: 12,60 ≤ μ ≤ 13,66)

( )
2) Sendo X uma população tal que X ~ N μ, σ 2 em que μ e σ2 são desconhecidos. Uma

amostra de tamanho 15 forneceu os valores ∑x i = 8,7 e ∑x 2


i = 27,3 . Determinar um

intervalo de confiança de 95% para σ2. (R.: 0,85 ≤ σ2 ≤ 3,95).

3) Uma centena de componentes foi ensaiada e 93 deles funcionaram mais de 500


horas. Determinar um intervalo de confiança de 95% para a proporção. (R.: 0,88 ≤ p ≤
0,98).

___________________________________________________________________________________

123
Capítulo 8 – Intervalos de confiança
_____________________________________________________________________
4) A força de compressão de concreto está sendo testada por um engenheiro civil. Ele
testa 12 amostras e obtém os seguintes dados:

2216 2237 2249 2204 2225 2301


2281 2263 2318 2255 2275 2295

Assumindo-se distribuição normal pede-se:


a) Construa o I.C. (95%) para a força média?
b) Construa o I.C. (99%) para a força média?
c) Ao nível de 5% de significância verificar se a verdadeira média da força de
compressão difere de 2280. Realizar o teste t para uma média?
d) Repetir o item c, porém usando α = 1%?
e) Repetir o item c, porém verificando se a verdadeira força média difere de 2300?
f) Compare as conclusões obtidas usando-se I.C. e teste de hipótese?

5)Tintas para marcação em asfalto de rodovias são oferecidas em duas cores, branca e
amarela. O tempo de secagem dessas tintas é de muito interesse, e especificamente,
suspeita-se que a tinta amarela seca mais rápido do que a branca. Amostras foram
obtidas para a medição dos tempos de secagem (em minutos), em condições reais das
duas tintas:
Tinta branca 120 132 123 122 140 110 120 107
Tinta amarela 126 124 116 125 109 130 125 117 129 120

Assumindo distribuição normal pede-se:


a) Obtenha o I.C. (95%) para o tempo médio de secagem de cada tipo de tinta?
b) Realize um teste de hipótese para responder às questões apresentadas no enunciado
do problema? Use α = 5%.
c) Obtenha o I.C. (95%) para a variância do tempo de secagem de cada tipo de tinta?
d) Realize um teste F para verificar se ambas às tintas apresentam a mesma
variabilidade no tempo de secagem. Use α = 5%.

___________________________________________________________________________________

124
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________

9.0 – CORRELAÇÕES E REGRESÃO LINEAR

9.1– Introdução

A relação entre variáveis mensuradas nos estudos de determinados fenômenos é


uma importante informação a ser obtida na investigação científica de muitas áreas. Sem
conhecer como uma variável varia com a ocorrência de mudanças nos valores das
outras, é praticamente impossível fazer previsões ou controlar uma das variáveis pela
manipulação da outra.
Nesse capítulo veremos duas maneiras distintas de verificar a relação entre duas
variáveis, pela correlação e a regressão linear.

9.2 - Correlação

Serve para estudar o comportamento conjunto de duas variáveis quantitativas


distintas. Ou, em outras palavras, mede o grau de associação entre duas variáveis
aleatórias X e Y.
OBS.: não há, nesse caso, preocupação em apresentar alguma forma funcional entre as
variáveis, se houver.

Exemplos: (apresentados em aula)

Para o estudo do comportamento conjunto de duas variáveis poderiam ser usados:

9.2.1 - Diagrama de dispersão

Representação gráfica do conjunto de dados. Nada mais é do que a


representação dos pares de valores num sistema cartesiano. Veja exemplos
apresentados em aula.
Dependendo do gráfico obtido, três situações marcantes poderiam acontecer:

___________________________________________________________________________________

125
Capítulo 9 – Correlações e Regressão Linear
_____________________________________________________________________
a) Se, quando uma das variáveis “cresce”, a outra, em média, também “cresce”,
dizemos que entre as duas variáveis existe correlação positiva, tanto mais forte quanto
mais perto de uma reta imaginária os pontos estiverem;

b) Se, quando uma das variáveis “cresce”, a outra, em média, também


“decresce”, dizemos que entre as duas variáveis existe correlação negativa, tanto mais
forte quanto mais perto de uma reta imaginária os pontos estiverem;

c) Se os pontos estiverem dispersos, sem definição de direção, dizemos que a


correlação é muito baixa, ou mesmo nula. As variáveis nesse caso são ditas não
correlacionadas.

9.2.2 - Coeficiente de correlação

É um valor numérico, uma medida, para o grau de associação entre duas


variáveis.
Se for observada uma associação entre as variáveis quantitativas (a partir de um
diagrama de dispersão, por exemplo), é muito útil quantificar essa associabilidade.
Existem muitos tipos de associação possíveis, e aqui iremos apresentar o tipo de
relação mais simples, que é o linear. Iremos julgar o quanto a nuvem de pontos do
diagrama de dispersão se aproxima de uma reta.

Sejam duas amostras relativas às variáveis X e Y, dadas a seguir:


Xi X1 X2 … Xn
Yi Y1 Y2 … Yn
O coeficiente de correlação entre os valores de X e Y é dado por:
SPD XY
CÔV (X, Y ) n −1 SPD XY
rXY = = = ,
Vˆ (X ) ⋅ Vˆ (Y ) SQD X SQD Y

SQD X ⋅ SQD Y
n −1 n −1
-1 ≤ r XY ≤ 1
em que:

___________________________________________________________________________________

126
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
 n  n 
 ∑ Xi  ∑ Yi 
SPD XY = ∑ Xi Yi −  i =1  i =1 
n

i =1 n
2 2
 n   n 
 ∑ Xi   ∑ Yi 
SQD X = ∑ Xi −  i =1  SQD Y = ∑ Yi −  i =1 
n n
2 2

i =1 n i =1 n

Exemplo:
Amostra A 4 8 3 9 7 5
Amostra B 1 5 2 14 3 11

 n  n 
n


∑ A i  ∑ Bi 
 i=1  = 252 − (36 )(36 ) = 36
SPD AB = ∑ A iBi − i=1

i=1 n 6
2
 n 
 ∑ Ai 
SQD A = ∑ A i2 −  i =1  = 244 −
n
(36 )2 = 28
i =1 n 6
2
 n 
 ∑ Bi 
n
SQDB = ∑ Bi −
2  i =1  = 356 −
(36 )
2
= 140
i =1 n 6
SPD AB 36
rXY = = = 0,575
SQD A ⋅ SQDB (28 )(140 )

9.3 - Regressão linear

A análise de regressão consiste na realização de uma análise estatística com o


objetivo de verificar a existência de uma relação funcional entre uma variável
dependente com uma ou mais variáveis independentes. Em outras palavras consiste na
obtenção de uma equação que tenta explicar a variação da variável dependente pela
variação do(s) nível(is) da(s) variável(is) independente(s).
Para tentar estabelecer uma equação que representa o fenômeno em estudo
pode-se fazer um gráfico, chamado de diagrama de dispersão, para verificar como se

___________________________________________________________________________________

127
Capítulo 9 – Correlações e Regressão Linear
_____________________________________________________________________
comportam os valores da variável dependente (Y) em função da variação da variável
independente (X).
O comportamento de Y em relação a X pode se apresentar de diversas maneiras:
linear, quadrático, cúbico, exponencial, logarítmico, dentre outros. Para se estabelecer o
modelo para explicar o fenômeno, deve-se verificar qual tipo de curva e equação de um
modelo matemático que mais se aproxime dos pontos representados no diagrama de
dispersão.
Contudo, pode-se verificar que os pontos do diagrama de dispersão, não vão se
ajustar perfeitamente à curva do modelo matemático proposto. Haverá na maior parte
dos pontos, uma distância entre os pontos do diagrama e a curva do modelo
matemático. Isto acontece, devido ao fato do fenômeno que está em estudo, não ser um
fenômeno matemático e sim um fenômeno que está sujeito a influências que acontecem
ao acaso. Assim, o objetivo da regressão é obter um modelo matemático que melhor se
ajuste aos valores observados de Y em função da variação dos níveis da variável X.
No entanto o modelo escolhido deve ser coerente com o que acontece na prática.
Para isto, deve-se levar em conta as seguintes considerações no momento de se
escolher o modelo:
a) o modelo selecionado deve ser condizente tanto no grau como no aspecto da
curva, para representar em termos práticos, o fenômeno em estudo;
b) o modelo deve conter apenas as variáveis que são relevantes para explicar o
fenômeno;
Como foi dito anteriormente, os pontos do diagrama de dispersão ficam um pouco
distantes da curva do modelo matemático escolhido. Um dos métodos que se pode
utilizar para obter a relação funcional, se baseia na obtenção de uma equação estimada
de tal forma que as distâncias entre os pontos do diagrama e os pontos da curva do
modelo matemático, no todo, sejam as menores possíveis. Este método é denominado
de Método dos Mínimos Quadrados (MMQ). Em resumo por este método a soma de
quadrados das distâncias entre os pontos do diagrama e os respectivos pontos na curva
da equação estimada é minimizada, obtendo-se, desta forma, uma relação funcional
entre X e Y, para o modelo escolhido, com um mínimo de erro possível.

___________________________________________________________________________________

128
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
9.3.1 - Modelo linear de 1º grau (REGRESSÃO LINEAR SIMPLES)

O modelo estatístico para esta situação seria:


Yi = β0 + β1Xi + ei
em que:
Y i = valor observado para a variável dependente Y no i-ésimo nível da variável
independente X.
β 0 = constante de regressão. Representa o intercepto da reta com o eixo dos Y.
β 1 = coeficiente de regressão. Representa a variação de Y em função da variação de
uma unidade da variável X.
X i = i-ésimo nível da variável independente X (i = 1, 2,..., n)
e i = é o erro que está associado à distância entre o valor observado Yi e o
correspondente ponto na curva, do modelo proposto, para o mesmo nível i de X.

Para se obter a equação estimada, vamos utilizar o MMQ (Método dos Mínimos
Quadrados), visando a minimização dos erros. Assim, tem-se que:
ei = Yi − β0 + β1Xi

elevando ambos os membros da equação ao quadrado,


ei2 = [Yi − β0 + β1Xi ]
2

aplicando o somatório,
n n

∑ ei2 = ∑ [Yi − β0 + β1Xi ]


2
(1)
i =1 i =1

Por meio da obtenção de estimadores de β 0 e β 1 , que minimizem o valor obtido


na expressão anterior (1), é possível alcançar a minimização da soma de quadrados dos
erros.
Para se encontrar o mínimo para uma equação, deve-se derivá-la em relação à
“variável” de interesse e igualá-la a zero. A sua derivada segunda deverá, obviamente,
ser positiva, o que no caso sempre ocorrerá, por se tratar de uma soma de quadrados.
Derivando então a expressão (1) em relação a β 0 e β 1 , e igualando-as a zero,
poderemos obter duas equações que, juntas, vão compor o chamado sistemas de
equações normais. A solução desse sistema fornecerá:

___________________________________________________________________________________

129
Capítulo 9 – Correlações e Regressão Linear
_____________________________________________________________________
 n  n 
n


∑ X i  ∑ Yi 
 i=1 
∑ Xi Yi − i=1

n SPD XY
βˆ 1 = i=1 2
= e βˆ 0 = Y − βˆ 1X
 n
 SQD
 ∑ Xi 
X

Xi2 −  i=1 
n

∑i=1 n
Uma vez obtidas estas estimativas, podemos escrever a equação estimada:
ˆ = βˆ + βˆ X
Yi 0 1 i

Exemplos:

1) Para verificar se existe relação linear de primeiro grau entre umidade relativa (UR) do
ar de secagem de sementes e a germinação das mesmas, um pesquisador realizou um
experimento com 4 valores diferentes para a %UR do ar, obtendo-se os seguintes dados
(dados hipotéticos)
% UR 20 30 40 50
% Germinação 94 96 95 97

a) Obter as estimativas do β 0 e do β 1 considerando o modelo proposto?


b) Qual seria a equação ajustada?
c) Qual seria a % de germinação esperada quando UR = 45 %?

OBS.: veremos, mais tarde, como verificar a significância da regressão.

R.: a) β̂0 = 92,7; β̂1 = 0,08 b) 95,5 %

2) Foi realizado uma análise de regressão para investigar a existência de relação linear
simples entre a temperatura superficial de uma estrada (X) medida em graus F e a
deformação da pavimentação (Y) medida segundo uma técnica especial. Baseado nas
seguintes informações pede-se:
n = 20; ∑ y = 12,75; ∑ y
i
2
i = 8,86; ∑ x = 1478; ∑ x
i
2
i =143215,8; e ∑ x y = 1083,67
i i

a) Calcule as estimativas dos parâmetros da regressão. Apresente a equação ajustada


num gráfico?

___________________________________________________________________________________

130
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
b) Use a equação para estimar qual deformação haveria na pavimentação quando a
temperatura superficial fosse de 85 ºF?
c) Qual seria a mudança esperada na deformação da pavimentação para uma mudança
de 1 ºF na temperatura superficial?
d) Suponha que a temperatura seja medida em graus C ao invés de graus F. Qual seria
a nova equação ajustada resultante? Lembre-se: C = 5(F – 32)/9.
e) Qual seria a mudança esperada na deformação da pavimentação para uma mudança
de 1 ºC na temperatura superficial?

9.4 - Teste de hipótese na regressão linear simples

Após ajustar uma equação de regressão devemos verificar sua adequabilidade,


por meio de testes de hipóteses para os parâmetros do modelo e/ou a construção de
intervalos de confiança. Para tal intento precisamos da pressuposição adicional de que
os erros tenham distribuição normal.
Em outras palavras, a equação estimada obtida, apenas estabelece uma relação
funcional, entre a variável dependente e a variável independente, para representar o
fenômeno em estudo. Portanto a simples obtenção da equação estimada não responde
ao pesquisador se a variação da variável independente influencia significativamente na
variação da variável dependente.
Para se responder a esta pergunta, é necessário realizar um teste estatístico para
as estimativas dos coeficientes da equação de regressão estimada. Um teste que pode
ser realizado para verificar tal fato é o teste F da análise de variância. Portanto, é
necessário realizar uma análise de variância dos dados observados, em função do
modelo proposto.
A análise de variância é uma forma de dividir a variância total em componentes
devidos à regressão linear e ao resíduo (erro). Essa partição é obtida para atender ao
objetivo de verificar se a parte da variação total explicada pelo modelo é
significativamente diferente de zero. Esse teste, todavia, para o modelo de regressão
linear simples, é equivalente ao teste da igualdade do coeficiente de regressão a zero.
No caso especifico da análise de variância, as variâncias são denominadas
especialmente por quadrados médios (QM). A estatística F da análise de variância é
usada para testar se o modelo linear ajusta-se ou não aos dados.
___________________________________________________________________________________

131
Capítulo 9 – Correlações e Regressão Linear
_____________________________________________________________________
As hipóteses: H 0 : β 1 = 0 versus H a : β 1 ≠ 0; estão relacionadas com a significância
da regressão. Não rejeitar H 0 é equivalente a concluir que não há relação linear entre X
e Y. Por outro lado, se H 0 : β1 = 0 for rejeitado indicaria que X é importante para explicar
a variabilidade em Y.
De maneira alternativa poderíamos testar a significância da regressão pelo
método da Análise de Variância (ANOVA). Assim a seguinte identidade pode ser
verificada:

∑ (Y − Y ) = ∑ (Yˆ − Y ) + ∑ (Y − Yˆ )
2 2 2
i i i

ou, em outra palavras,


SQTotal = SQRegressão + SQResíduo,
onde
SQTotal = variação total em Y = SQDY

SQRegressão = variação em Y explicada pela regressão ajustada = β̂1 SPD XY , de modo


que

SQResíduo = SQRes = variação não explicada pela regressão = SQD Y - β̂1 SPD XY .
Baseado nessa identidade o seguinte quadro pode ser montado:
F.V. GL SQ QM F
QMReg = QMReg
Regressão p SQReg
SQReg QMRes
Resíduo, ou Independente da p-n- SQRes
SQRes
Regressão 1 p − n −1
Total n-1 SQTotal

( Y)
SQTotal = ∑ Y − ∑ 2 i
2

SQReg = βˆ 0 ∑ Yi + βˆ 1 ∑ Yi Xi −
(∑ Yi )
2

i
n n

A estatística F obtida no quadro acima serve para testar a significância da


regressão, ou seja, testar H 0 : β 1 = 0 versus H a : β 1 ≠ 0.
- regra de decisão: Se F calc ≥ F(α, 1, n-2) ⇒ rejeita H 0

OBS.: Se regressão linear simples, e para H 0 : β 1 = 0 temos que (t calc )2 = F calc .

___________________________________________________________________________________

132
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Exemplo: (Exemplo anterior) Para verificar se existe relação linear de primeiro grau
entre umidade relativa (UR) do ar de secagem de sementes e a germinação das
mesmas, um pesquisador realizou um experimento com 4 valores diferentes para a
%UR do ar, obtendo-se os seguintes dados (dados hipotéticos)
% UR 20 30 40 50
% Germinação 94 96 95 97
a) Obter o quadro da ANOVA para checar a significância da regressão, ou seja, se
existe efeito da UR do ar de secagem na % de germinação? Se necessário use α = 5%.

9.5 - Coeficiente de determinação

O coeficiente de determinação, também conhecido como R2, ou simplesmente r2


para o caso de regressão linear simples, fornece uma informação auxiliar ao resultado
da análise de variância da regressão, como uma maneira de se verificar se o modelo
proposto é adequado ou não para descrever o fenômeno.
O R2 é obtido por:
SQReg
R2 =
SQTotal
O valor de R2 varia no intervalo de 0 a 1. Valores próximos de 1 indicam que o
modelo proposto é adequado para descrever o fenômeno.
O R2 indica a proporção (ou porcentagem) da variação de Y que é “explicada”
pela regressão, ou quanto da variação na variável dependente Y está sendo “explicada”
pela variável independente X.

9.6 - Lista de exercícios

1) Para estudar a relação entre Y (número total de horas necessárias à montagem da


parte de uma estrutura) e X (número total de operações de furar e rebitar), registraram-
se os dados da tabela abaixo.
Estudo A B C D E F G H I
X 236 80 127 445 180 343 305 488 170
Y 5,1 1,7 3,3 6,0 2,9 5,9 7,0 9,4 4,8

___________________________________________________________________________________

133
Capítulo 9 – Correlações e Regressão Linear
_____________________________________________________________________
Para facilitar seus cálculos considere as seguintes informações:

∑ y = 46,1; ∑ y
i
2
i = 279,41; ∑ x = 2374; ∑ x
i
2
i = 786368; e ∑ x y = 14512,6
i i

Pede-se:
a) Obter a equação de regressão ajustada para o modelo Y i = β 0 + β 1 x i + ε i ?
b) Interpretar as estimativas obtidas dos parâmetros da regressão?
c) A análise de variância (ANOVA) da regressão? [Apresente a hipótese a ser testada
pela ANOVA e realize o teste apropriado (use α = 5%) para testar essa hip ótese].
d) Calcular o coeficiente de determinação para o modelo ajustado. Faça a interpretação
apropriada para esse resultado? (R.: 79,9%)

2) Para o exemplo 2 dado no início sobre regressão linear simples (aquele da


temperatura superficial de uma estrada (X) medida em graus F e a deformação da
pavimentação (Y), verifique se realmente existe uma relação linear significativa (useα =
5%) entre X e Y, e reavalie as conclusões obtidas para os itens daquele exercício.

3) Adaptado dos dados existentes em algumas calculadoras de bolso. Um engenheiro


está interessado em avaliar o efeito da temperatura sobre o comprimento de certa peça
metálica. Para isso obteve cinco corpos de prova de mesmo comprimento inicial (certa
unidade de medida) e os submeteu a 5 temperaturas (ºC) diferentes. Os dados estão
apresentados abaixo.
Temperatura 10 15 20 25 30
Comprimento 1003 1005 1010 1011 1014

Pede-se: (use α = 5% se necessário)


a) Obter o diagrama de dispersão dos dados;
b) Ajustar a equação de regressão baseado no modelo de uma regressão linear simples
e traçar a reta no diagrama obtido em a;
c) Interpretar as estimativas dos parâmetros obtidas;
d) Checar a significância da regressão por meio da ANOVA;
e) Qual seria o comprimento esperado da peça quando a temperatura for igual a 40ºC?
f) (Calibração) Qual deve ser a temperatura a ser usada para que o comprimento da
barra atinja 1009 unidades de medida?
___________________________________________________________________________________

134
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________

CRP 192 – INICIAÇÃO À ESTATÍSTICA

Anexo 1 – Formulário e Tabelas

Observações:
- As tabelas que aqui constam, foram adaptadas do livro: Curso de Estatística Experimental (14ª ed) de Frederico Pimentel
Gomes, 2000.
- Este material será usado em provas e, portanto não deverá conter informações adicionais.

Professor: Carlos Eduardo Magalhães dos Santos

Nome:___________________________________________________________________ Matrícula:________________

1
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________

Formulário

2
 n 
∑ Xi 
X i2 −  i =1 
n n

∑X ∑ σ (n1 − 1)s12 + (n 2 − 1)s 22 > s2


σ (X ) =
i
n
X = i =1
σ 2 = i =1 σ= σ 2
s 2
= F=
n −1 n1 + n 2 − 2 < s2
c
n n
2
 n 
 ∑ di 
di −  i=1 
n n

(m̂ − m̂ 2 ) − (m1 − m2 ) ∑d ∑ 2
m̂ − mo m̂D − mD
()
i
n
t= t= 1 t= m̂D = i=1
sD2 = i=1 ∆ = q 1 V̂ Ĉ
s 1 1  sD2 n n −1 2
n s c2  + 
 n1 n 2  n

() () ai2 a2
i i
QM Re síduo QMresíduo
Di = z i 1 V̂ Ĉ V̂ Ĉ = S c2 ∑ = QM Re s∑ i ∆=q Di = z i
2 i=1 ri i=1 ri K K

2
 k 
 ∑ Xi 
(I − 1)Ftab V̂ (Ĉ)
2
SQ = ∑ i −  i=1k 
k
CV (%) = 100
Ĉ X QM Re síduo Ti
S= t= m̂i =
V̂ Ĉ() i=1 ri
∑ r1
m̂ ri
i=1

2
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________
G *
=
[QM Re s(a ) + (J − 1)QM Re s(b )]
2
QM Re s(a ) + (J − 1)QM Re s(b )
m̂ = n QM Re sComb =
N [QM Re s(a)]2 + [(J − 1)QM Re s(b)]2 J
g.l. Re s(a ) g.l. Re s(b )

n n n

n n ∑ Y = nβˆ
i o + βˆ 1 ∑ Xi + βˆ 2 ∑ Xi2
∑ Yi = nβˆ o + βˆ 1 ∑ Xi
i=1 i=1 i=1
n n n n
i=1
n n
i=1
n ∑ Yi Xi = βˆ o ∑ Xi + βˆ 1 ∑ Xi2 + βˆ 2 ∑ Xi3
∑ Yi Xi = βˆ o ∑ Xi + βˆ 1 ∑ Xi2
i=1 i=1 i=1 i=1
n n n n
i=1 i=1 i=1
∑ Yi Xi2 = βˆ o ∑ Xi2 + βˆ 1 ∑ Xi3 + βˆ 2 ∑ Xi4
i=1 i=1 i=1 i=1

2
 n 
 ∑ Yi 
SQTotal = ∑ Yi −  i=1 
n
SQ Re gressão SQ Re gressão
2
R2 = R2 =
i=1 n SQTotal SQTratamen tos

2 2
 n   n 
 ∑ Yi   ∑ Yi 
SQ Re gressão = βˆ o ∑ Yi + βˆ 1 ∑ Yi Xi −  i=1  SQ Re gressão = βˆ o ∑ Yi +βˆ ∑ Yi Xi + βˆ 2 ∑ Yi Xi −  i=1 
n n n n n
2

i=1 i=1 n i=1 1 i=1 i=1 n

3
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________
Tabela 1 – Área de uma distribuição normal padrão

4
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________
Tabela 2 – Valores de t em níveis de 10% a 0,1% de probabilidade (Tabela Bilateral)

5
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________
Tabela 3 – Valores de χ 2 em níveis de 0,5% a 99,5% de probabilidade

6
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________
Tabela 4 – Limites unilaterais de F ao nível de 1% de probabilidade, para o caso de F > 1

7
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________
Tabela 5 – Limites unilaterais de F ao nível de 5% de probabilidade, para o caso de F > 1

8
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________
Tabela 6 – Valores da amplitude total estudentizada (q), para uso no teste de Tukey, ao nível de 1% de probabilidade

9
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________

10
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________
Tabela 7 – Valores da amplitude total estudentizada (q), para uso no teste de Tukey, ao nível de 5% de probabilidade

11
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________

12
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________
Tabela 8 – Valores da amplitude total estudentizada (z), para uso no teste de Duncan, ao nível de 1% de probabilidade

13
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________

Tabela 9 – Valores da amplitude total estudentizada (z), para uso no teste de Duncan, ao nível de 5% de probabilidade

14

Você também pode gostar