Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATÍSTICA
Departamento de Engenharia
Mecânica – EESC-USP
São Carlos, Julho de 2012.
Sumário
1 INTRODUÇÃO ...................................................................................................................................................... 1
3 GRÁFICOS .......................................................................................................................................................... 33
4 PROBABILIDADES .............................................................................................................................................. 43
ii
iii
iv
Capítulo 1
Introdução
Objetivos do Capítulo
Por esta definição pode-se ver que a estatística descritiva se preocupa em organizar e
apresentar dados de uma forma clara e efetiva. Para isso ela utiliza gráficos, tabelas e valores
calculados a partir dos dados (médias, mediana, desvio padrão, etc.).
Em alguns casos os dados podem ser obtidos a partir de toda a população em estudo
ou, se a população é muito grande, os dados podem ser referentes a uma amostra retirada da
população. Os conceitos de população e amostra (ou amostragem) são fundamentais em
estatística. As definições abaixo e a figura 1.1 consideram estes dois conceitos.
Definição 1.3 - Uma população é a coleção completa e total dos elementos (pessoas,
medidas, escores, itens, e outros) a serem considerados em um estudo estatístico.
População
Amostra
Definição 1.5 - Estatística indutiva consiste de métodos para tirar conclusões sobre uma
população baseadas em informações obtidas a partir de uma amostra da população.
Suponha que estamos querendo conhecer a altura média de todas as mulheres com
idade entre 16 anos e 30 anos vivendo atualmente no Brasil. A nossa população de interesse
está muito bem definida. Claramente, não vamos obter uma resposta precisa a esta questão
porque é economicamente inviável determinar a altura de todos os membros de uma
população tão grande. Entretanto, podemos retirar uma amostra de duas mil mulheres desta
população, medir a altura de cada uma delas e usar os métodos da estatística indutiva para
obter informações sobre a altura média de toda a população em estudo.
1) Defina estatística
5) Descreva três situações ou problemas para as quais a estatística indutiva poderia ser
aplicada.
6) Identifique em cada caso abaixo se estamos tratando com uma população ou com uma
amostra.
a) Todos os estudantes universitários paulistas.
b) Os moradores de Brasília.
c) Cinqüenta pessoas escolhidas entre os sócios de um clube.
d) Vinte pacientes de AIDS escolhidos para participar em um teste de uma nova droga.
e) Os estudantes do curso de estatística de uma certa universidade.
f) Cem jogadores profissionais de futebol do estado de São Paulo.
7) Um jornal americano realizou uma pesquisa com 800 pessoas divorciadas perguntando se
elas desejavam se casar novamente. Foi encontrado que 58% dos entrevistados não
desejavam um novo casamento. Os 800 entrevistados constituem uma população ou uma
amostra? Se a resposta for uma amostra qual é a população?
8) Defina uma amostra contendo quatro elementos retirados de cada uma das populações
abaixo.
a) A população formada por todas as universidades brasileiras.
b) A população de todos os times de futebol do estado de São Paulo.
c) A população de todos os jornais diários do Brasil.
Capítulo 2
Estatística Descritiva
Objetivos do Capítulo
2.1 – Dados
As pessoas são classificadas de acordo com seu tipo sangüíneo em quatro grupos A, B,
AB e O.
a) Que tipo de dado é definido quando lhe dizem seu tipo de sangue?
b) Geneticistas e antropologistas registram o numero de pessoas de cada tipo de sangue.
Que tipo de dado eles estão coletando?
Solução:
a) Seu tipo de sangue é um dado qualitativo. Ele coloca você em uma das quatro
categorias não numéricas – A, B, AB ou O.
b) Registrar o número de indivíduos em cada uma das quatro categorias define o tipo de
dado que denominamos dado de freqüência.
Solução:
a) A informação de que o aluno X recebeu nota A é um dado ordinal, pois as notas A, B,
C, D e E classificam o desempenho do estudante.
b) A informação sobre o número de estudantes com notas A, B, C, D e E define o tipo de
dado denominado dado de freqüência uma vez que ela nos diz o número de
indivíduos pertencentes a cada um das cinco categorias de notas.
Solução:
a) As alturas das quedas d’água são dados métricos, determinados através de medições.
b) A distribuição das 40 quedas mais altas em três categorias de alturas resulta no tipo de
dado denominado dados de freqüência.
A tabela 2.1, mostrada na próxima página, nos dá um resumo dos diversos tipos de dados
discutidos nesta seção.
Dados
Tipo Descrição Exemplo
Somente categorias. Os dados não Os quatro principais times de
Qualitativo podem ser arranjados segundo uma futebol do Rio de Janeiro:
ordem ou esquema. Flamengo, Vasco,
Fluminense, Botafogo
As categorias são ordenadas Os dez primeiros lugares numa
Ordinal segundo um esquema ou conceito. maratona
Dado obtido através de medições. Altura dos alunos da disciplina
Métrico É possível comparar um dado com Probabilidade e Estatística.
outro.
O número de itens por categoria é Número de estudantes masculinos e
Freqüência fornecido. femininos da disciplina
Probabilidade e Estatística.
1) Em cada uma dos casos abaixo, determine o tipo de dados mais apropriado.
a) Um carro é descrito como subcompacto, compacto, médio ou grande.
b) Peso de peças em uma amostra.
c) As cores de uma amostra de carros envolvidos em colisões com vítimas.
d) Códigos de endereçamento postal (CEP).
e) Número de famílias atualmente vivendo em cada uma das cinco regiões do país
(Norte, Nordeste, Sul, Sudeste e Centro-Oeste).
4) A tabela abaixo fornece dados de área e população referentes aos seis continentes no ano
de 1988.
5) As exportações Brasileiras, nos anos de 1993 e 1996, por região de destino, podem ser
vistas no quadro abaixo.
a) Qual tipo de dado é definido pelos valores das exportações em cada ano?
b) A afirmação “a Europa é o maior importador e o Nafta é o segundo maior importador
de produtos brasileiros” define qual tipo de dado?
c) Qual tipo de dado nós obtemos do fato de que a França faz parte da União Européia?
MÉDIA
Definição 2.3 – A média de um conjunto de dados é definida como sendo a soma dos
dados dividida pelo número de elementos do conjunto:
Considere o conjunto de dados mostrado na tabela abaixo. Suponha que esses valores
correspondam à ajuda de custo de alunos estagiários pagas por empresas da área de
engenharia. Determinar a média de salários para cada empresa.
A 200 200 200 840 200 200 300 200 300 350 700 350 950
B 200 200 840 350 300 300 200 200 950 200
Nota: Os zeros correspondentes aos centavos foram omitidos para facilitar a leitura.
Solução:
De acordo com a definição 2.3, a média de um conjunto de dados é obtida somando-se
todos os valores e dividindo essa soma pelo número de valores. Chamando MA a média da
empresa A e MB a média da empresa B, podemos escrever:
R$4990,00 R$3740,00
MA = = R$383,85 MB = = R$374,00
13 10
10
MEDIANA
Solução:
O número de dados para a empresa A é 13, ou seja, um número ímpar.
Conseqüentemente, a mediana deste conjunto de dados será o sétimo valor quando
ordenarmos os valores segundo uma ordem crescente dos mesmos, como mostrado abaixo.
200 200 200 200 200 200 300 300 350 350 700 840 950
Mediana = 300
Assim, a mediana dos salários da empresa A é R$300,00.
O número de dados para a empresa B é 10, ou seja, um número par. Por isso, de
acordo com a definição 2.4, a mediana será dada pela média dos dois valores centrais da lista
ordenada dos dados. Esta lista é dada a seguir.
200 200 200 200 200 300 300 350 840 950
11
MODA
A última medida de tendência central que será aqui discutida é a moda. Basicamente,
a moda é o dado ou valor que ocorre com mais freqüência, ou seja, que ocorre mais vezes em
um conjunto de dados. A definição da moda é feita como se segue:
Pela definição 2.5, um conjunto de dados pode não ter uma moda, ter uma única moda,
ter duas modas ou mais que duas. Quando existir uma única moda, o conjunto de dados é dito
unimodal. Se existirem duas modas ele é dito bimodal, e assim por diante.
Solução:
A tabela 2.3 mostra a distribuição de freqüências para os salários da empresa A. Para
cada valor são contadas as ocorrências, resultando nos valores da coluna 2 da tabela.
Pode ser visto que o valor ocorrendo com mais freqüência é o valor 200, que ocorre 6
vezes. Dessa forma, concluímos que a moda dos 13 salários da empresa A é R$200,00.
12
Em ambos os conjuntos de dados, a média é maior que a mediana. Isto ocorre porque a
média é fortemente afetada por poucos altos salários em cada conjunto de dados. Em geral, a
média é sensitiva a valores muito altos ou muito baixos, enquanto que a mediana não é
influenciada por valores extremos.
a) Um estudante faz quatro provas em uma disciplina de cálculo. Suas notas são 88, 75, 95 e
100. Que medida de tendência central é mais adequada de se usar?
Sexo Freqüência
Masculino 4239
Feminino 864
13
Solução:
a) A média é provavelmente a medida mais razoável de se usar uma vez que ela leva em
conta todas as quatro notas obtidas e indica o desempenho global do aluno. Neste caso, a
média a ser reportada é igual a 89,5.
b) Neste caso a medida de tendência central mais apropriada é a mediana. Isto porque a
mediana representa o valor central e ela não é afetada por valores muito altos de uns
poucos apartamentos que poderiam estar entre os apartamentos oferecidos para venda.
Assim a mediana proporciona uma melhor indicação do valor “típico” de venda do que a
média ou a moda.
c) A única medida apropriada para estes dados é a moda, que neste caso é “masculino”.
Cada dado desse conjunto ou é masculino ou é feminino. Não existe maneira de se
calcular a média ou a mediana para tal tipo de dado. Em geral a moda é a única medida de
tendência central que pode ser usada para dados qualitativos.
Determine a média, mediana e a moda para cada conjunto de dados nos exercícios 2 a 4.
2) A Fundação Nacional para a Ciência dos EUA coleta dados sobre a idade dos estudantes
que obtiveram o título de doutor em ciências e engenharia. Os resultados são publicados
no Survey of Earned Doctorates. Uma amostra relativa ao ano de 1991 é composta dos
seguintes valores, dados em anos:
37 28 36 33
37 43 41 28
24 44 27 24
3) Um fabricante de sabão líquido produz uma garrafa com um conteúdo de 310 ml. Uma
amostragem de 16 garrafas produziu os seguintes resultados:
14
S = 25 + 23 + 12 + 9 + 32 + 38 + 15 = 154
S = x1 + x2 + x3 + x4 + x5 + x6 + x7 = 25 + 23 + 12 + 9 + 32 + 38 + 15 = 154
Com o símbolo de somatório podemos escrever essa soma de uma maneira muito mais
resumida. Nós podemos usar Σx para indicar o total resultante da soma dos valores de x e a
expressão acima se torna:
7
Total = ∑ xi = x1 + x 2 + x3 + x 4 + x5 + x6 + x7
i =1
Ou simplesmente,
7
Total = ∑ xi
i =1
O resultado é
7
∑x
i =1
i = 25 + 23 + 12 + 9 + 32 + 38 + 15 = 154
Média da amostra X=
∑x
n
Número de elementos da amostra
15
a) Calcule Σx.
b) Qual o valor de n?
c) Determine a média x .
Solução:
a) Σx = 9,8 + 10,2 + 9,8 + 9,4 + 9,7 + 9,7 + 10,1 + 10,1 + 9,8 + 9,6 + 9,1 + 9,7 = 117
b) n = 12
c) x = (117) / 12 = 9,75
Entretanto, dois conjuntos de dados podem ter a mesma média, a mesma mediana ou a
mesma moda e ainda serem bem diferentes em outros aspectos. Por exemplo, considere as
alturas dos cinco jogadores de dois times de basquete, como mostrado na figura 2.1. As duas
equipes tem a mesma média que é igual a 191 cm e a mesma mediana que é igual a 193 cm.
As modas dos dois conjuntos de alturas também são iguais (193 cm). Entretanto, é óbvio que
os dois conjuntos de dados são diferentes. Em particular, existe muito mais variação nas
alturas dos jogadores da equipe II do que nas alturas dos jogadores da equipe I. Para descrever
esta diferença quantitativamente, nós usamos uma medida de dispersão que indica quanto de
variação existe entre os dados de um conjunto.
AMPLITUDE
16
17
Exemplo 2.9 – Ilustra o cálculo dos desvios das medidas com relação à média
As alturas dos cinco jogadores da equipe I são: 184, 186, 193, 193 e 199 cm.
Determine os desvios desses valores com relação à média.
Solução:
A altura média dos jogadores da equipe I é:
−
∑ x = 184 + 186 + 193 + 193 + 199 = 191cm
x= n 5
18
Para obter o desvio de cada valor com relação à média, nós simplesmente calculamos a
diferença entre o valor e a média; isto é, nós computamos x – x. Por exemplo, o desvio com
relação à média da altura de 184 cm é 184 – 191 = -7. Os desvios com relação à média dos
cinco valores de altura estão dados na segunda coluna da tabela 2.6 e estão mostrados
graficamente na figura 2.3.
x x-x
184 -7
186 -5
193 2
193 2
199 8
-7 8
-5 2
x
184 186 191 193 199
O segundo passo para computar o desvio padrão de uma amostra consiste em obter a
medida do desvio total com relação à média, para todos os valores do conjunto de dados.
Observe que a soma dos desvios com relação a media ( x – x ), é sempre igual a zero e, por
isso, não adianta somá-los para obter um desvio total.
19
Calcule a soma dos quadrados dos desvios para as alturas dos jogadores da equipe I.
Solução:
A tabela 2.7 foi obtida da tabela 2.6, adicionando-se a esta a coluna ( x – x )2 .
O terceiro passo para calcular o desvio padrão de uma amostra é tomar a média dos
quadrados dos desvios. Isto é feito dividindo-se a soma dos quadrados dos desvios por n-1. O
valor resultante é denominado variância da amostra e é indicado por s2. Em símbolos:
s 2
=
∑ ( x − x) 2
n −1
Solução:
Do exemplo 2.10, a soma dos quadrados dos desvios foi calculada como sendo igual a
146 cm2. Como n = 5 a variância da amostra das alturas será igual a
_
s 2
=
∑ ( x − x) 2
=
146
= 36,5cm 2
n −1 5 −1
Nota: Se em vez de dividirmos por n-1, nós dividíssemos por n, então a variância da amostra
seria a média dos quadrados dos desvios. Embora a divisão por n possa parecer mais natural,
nós dividimos por n-1 pela seguinte razão: Um dos principais usos da variância de uma
amostra é para estimar a variância da população (como veremos mais adiante). A divisão por
20
n tende a subestimar a variância da população enquanto que a divisão por n-1 tende a
produzir valores da variância da população mais corretos.
É importante entender que a variância de uma amostra é dada em unidades que são o
quadrado das unidades originais. Isto ocorre por elevarmos ao quadrado os desvios com
relação à média. Por exemplo, a variância da amostra das alturas de cinco jogadores da equipe
I é 36,5 cm2. Uma vez que é desejável ter medidas descritivas nas mesmas unidades que os
dados do conjunto, o passo final para calcular o desvio padrão de uma amostra é tomar a raiz
quadrada da variância da amostra. Em outras palavras, o desvio padrão de uma amostra, s, é
s=
∑ ( x − x) 2
n −1
Solução:
Do exemplo 2.11, a variância da amostra foi calculada em 36,5 cm2. Assim, o desvio
padrão será:
s=
∑ ( x − x) 2 = 36,5 = 6,04cm
n −1
s=
∑ ( x − x) 2
n −1
Os passos necessários para calcular o desvio padrão de uma amostra foram detalhados
nos exemplos 2.8 - 2.11. Podemos resumir esses passos da seguinte maneira:
21
As alturas de cinco jogadores da equipe II são 171, 183, 193,193 e 215. Calcule o
desvio padrão desta amostra.
Solução:
Aplicando o procedimento descrito acima, devemos inicialmente calcular a média das
cinco medidas.
−
x=
∑ x = 171 + 183 + 193 + 193 + 215 = 191 cm
n 5
Agora, nós construímos uma tabela para calcular a soma dos quadrados dos desvios.
x x-x ( x – x )2
171 -20 400
183 -8 64
193 2 4
193 2 4
215 24 576
_ 2
∑ (x - x ) = 0 _
∑ x - x = 1048
Σ( x – x )2 = 1048 cm2.
s=
∑ ( x − x) 2
=
1048
= 16,18cm
n −1 5 −1
No exemplo 2.11 nós encontramos que o desvio padrão das alturas de cinco jogadores
da equipe I é s = 6,04 cm. No exemplo 2.12 encontramos que o desvio padrão das alturas de
cinco jogadores da equipe II é s = 16,18 cm. Conseqüentemente, vemos que a equipe II, que
tem uma variação maior nas alturas dos jogadores do que a equipe I, também tem um desvio
padrão maior. Isto mostra que quanto maior for a variação entre os dados de um conjunto de
valores, maior será o desvio padrão do conjunto de dados.
22
n(∑ x 2 ) − (∑ x )
2
s=
n(n − 1)
No exemplo 2.12 computamos o desvio padrão das alturas dos jogadores da equipe II
e encontramos o valor 16,18 cm. Calcule novamente o desvio padrão das alturas utilizando a
fórmula simplificada.
Solução:
Para aplicar a fórmula simplificada, precisamos das somas ∑x e ∑x2 . Podemos
determinar esses valores com o auxílio da tabela abaixo.
x x2
171 29241
183 33489
193 37249
193 37249
215 46225
∑ x = 955 ∑ x = 183453
2
Neste exemplo temos n = 5 e, da última linha da tabela acima, vemos que ∑x = 955 e
∑x = 183453. Assim, pela fórmula simplificada obtemos:
2
n(∑ x 2 ) − (∑ x )
2
5(183453) − (955) 2
s= = = 16,18cm
n(n − 1) 5(5 − 1)
Como podemos ver, os resultados obtidos pelas duas fórmulas são iguais, como era de
se esperar. Pequenas diferenças nas casas decimais podem ser esperadas e são devidas a erros
de arredondamento.
23
3) A Fundação Nacional para a Ciência dos EUA coleta dados sobre a idade dos estudantes
que obtiveram o título de doutor em ciências e engenharia. Os resultados são publicados
no Survey of Earned Doctorates. Uma amostra relativa ao ano de 1991 é composta dos
seguintes valores, em anos:
37 28 36 33
37 43 41 28
24 44 27 24
4) Um fabricante de sabão líquido produz uma garrafa com um conteúdo de 310 ml. Uma
amostragem de 16 garrafas produziu os seguintes resultados, em ml:
24
c) Embora os dois conjuntos de dados tenham a mesma média e mesma mediana, eles
são bastante diferentes em outro aspecto. No que ou como eles são deferentes?
d) Qual conjunto de dados parece ter menor variação?
e) Calcule s para cada conjunto de dados.
f) Suas respostas em parte (d) e (e) são consistentes? Porque?
Marca A Marca B
10,5 11,3
9,1 7,0
10,0 9,7
10,3 9,6
9,4 10,5
9,6 11,8
9,7 8,7
25
Os dados da tabela 2.8 representam as médias finais obtidas por alunos cursando uma
disciplina de Probabilidade e Estatística de uma faculdade.
Observando o conjunto de dados acima pode-se perceber que pouca informação pode
ser obtida. É difícil ter uma visão clara de como a turma se comportou nessa disciplina.
Agrupando-se os dados em classes podemos tornar este conjunto de dados mais fácil de ser
interpretado.
O primeiro passo é decidir quantas classes iremos adotar. Como o menor valor é (3,6)
e o maior valor é (9,9), podemos adotar as classes 3,0 – 3,9; 4,0 – 4,9; 5,0 – 5,9; ... ; 9,0 – 9,9.
Essas classes podem ser vistas na primeira coluna da tabela 2.9.
Agora, basta dar uma olhada na tabela 2.9 para obtermos várias informações úteis. Por
exemplo, podemos ver que a nota mais comum está na classe 6,0 – 6,9. Comparando-se as
tabelas 2.8 e 2.9 vemos que a última nos dá muito mais informações.
26
25 ≤ N ≤ 400 → k= N
16 ≤ N ≤ 572 → k = 1 + 3,3 log N
20 ≤ N ≤ 36 → k = −1 + 2 ln N
27
Em outras palavras, 25% das notas estão entre 6,0 e 6,9, inclusive. A porcentagem de
uma classe, expressa como um número decimal, é chamada freqüência relativa da classe. A
classe 6,0 – 6,9 tem freqüência relativa igual a 0,25. Uma tabela listando todas as classes e
suas respectivas freqüências relativas é chamada distribuição de freqüência relativa. A
tabela 2.10 abaixo mostra a distribuição de freqüência relativa para os dados correspondentes
às notas dos alunos. Note que a soma das freqüências relativas é igual a 1.
Terminologia
Existem diversos termos associados com agrupamento de dados. Considere, por
exemplo, a classe 6,0 – 6,9. O menor valor 6,0 é denominado limite inferior da classe e o
maior valor 6,9 é denominado limite superior da classe. O valor médio da classe 6,0 – 6,9 é
denominado ponto médio da classe ou simplesmente ponto médio e é determinado por (6,0
+ 6,9)/2 = 6,45. Finalmente, a diferença entre o limite inferior de uma classe e o limite
inferior da classe seguinte é denominada amplitude da classe. A amplitude das classes é o
quociente entre a amplitude total e o número de classes.
28
Solução:
Como a amplitude de cada classe foi definida como sendo igual a 5 e, a primeira classe
deve iniciar em 195, então teremos as classes 195 – 199, 200 –204, etc.. A tabela 2.13 mostra
cada classe e sua freqüência.
A tabela de dados agrupados pode ser facilmente obtida a partir da tabela 2.13.
Para ilustrar os cálculos típicos efetuados para a determinação dos valores da terceira e
quarta colunas, considere a classe 205 – 209. A freqüência relativa e o ponto médio são
29
0 3 0 0 3 0
2 2 0 1 2 1
0 0 1 2 4 0
4 2 1 0 1 0
0 2 0 1 3 2
Solução:
a) Como cada classe será representada por um único valor, então as classes serão 0, 1, 2, 3 e
4. A tabela 2.16 mostra as freqüências e freqüências relativas para este exemplo.
b) Da tabela podemos ver que para a classe “3”, por exemplo, teremos:
Assim, para a classe “3”, o limite superior, o limite inferior e o ponto médio ou ponto
de classe são todos iguais ao valor da classe, isto é, 3. Resultado similar ocorre para as
outras classes.
c) Finalmente, para construir a tabela de dados agrupados devemos adicionar uma quarta
coluna com os pontos de classe. Como eles são iguais aos valores das classes, esta quarta
coluna será idêntica à primeira coluna da tabela 2.16. Podemos então dizer que a tabela
2.16 serve como tabela de dados agrupados.
30
A-B conteria valores maiores ou iguais a A porém menores que B. A classe B-C conteria
valores maiores ou iguais a B e menores que C, e assim por diante. O exemplo a seguir
detalha este caso.
Considere os dados da tabela 2.17 que ilustra o peso de 20 pessoas do sexo masculino
com idades entre 18 e 24 anos.
Observe que em cada classe nós incluímos o limite inferior e excluímos o limite
superior. Assim, um dado com valor igual a 70 seria incluído na classe 70 – 75.
31
Capítulo 3
Gráficos
Objetivos do Capítulo
33
Gráficos são usados para apresentar dados e transmitir idéias de uma forma clara e
simples. Um gráfico é um método visual que pode nos ajudar a esclarecer idéias e mostrar
aspectos que possam estar escondidos em um monte de dados. Um dos tipos mais simples de
gráficos é o gráfico de barra. A tabela 3.1 mostra a porcentagem de eleitores, que votaram na
eleição presidencial americana, em 1980, segundo várias faixas de idade.
80
Porcentagem
60
40
20
0
18 – 20 21 - 24 25 –34 35 – 44 45 – 64 > 64
Faixas de idade
Porcentagem
1. O eixo horizontal (eixo x) contém categorias tais como faixas de idade, anos, meses,
masculino, feminino, branco, preto e assim por diante.
2. Alguma medida quantitativa associada com uma dada categoria é representada pela
altura da barra.
3. As larguras de todas as barras são iguais.
34
Nos anos 70, o índice de mortalidade infantil nos EUA era como mostrado abaixo na
tabela 3.2. Construa um gráfico de barras para estes dados.
Tabela 3.2 – Mortalidade infantil nos Estados Unidos (idade < 1 ano)
Ano Índice (mortes/1000)
Brancos Negros
1970 17,8 30,9
1971 17,1 28,5
1972 16,4 27,7
1973 15,8 26,2
1974 14,8 24,9
1975 14,2 24,2
1976 13,3 23,5
1977 12,3 21,7
1978 12,0 21,1
1979 11,4 19,8
Fonte: U.S. Department of Health and Human Services, Vital Statistics
of the United States (1979).
Solução:
O gráfico de barras é mostrado na figura 3.2. Ele permite observar que o índice de
mortalidade infantil dos negros diminuiu ao longo da década de 70, porém sempre se manteve
acima do índice de mortalidade dos brancos.
35,0
Mortes por 1000
30,0
25,0
20,0
15,0
10,0
5,0
0,0
70
71
72
73
74
75
76
77
78
79
19
19
19
19
19
19
19
19
19
19
Ano
Brancos Negros
35
O gráfico de pizza ou gráfico de círculo pode ser usado para mostrar a participação
de cada item com relação ao todo. A participação de cada item é dada como uma porcentagem
do todo. Para construir um gráfico de pizza, pense em um círculo como estando dividido em
360 partes iguais, formando ângulos centrais de 1 grau. Com isso, podemos facilmente dividir
o círculo, em pedaços de tamanho apropriado, multiplicando a porcentagem que representa
uma dada categoria por 360. Em outras palavras, 360 multiplicado por x% produz o número
de graus do ângulo central que define a porção do círculo (setor circular) a ser assinalada a
uma dada categoria.
Considere a tabela 3.3 que detalha os custos para sustentar um filho até os 17 anos.
Construa um gráfico de Pizza com os dados fornecidos.
Solução:
O gráfico é mostrado na figura 3.3.
Figura 3.3 – Gráfico de círculo (pizza) dos custos de criação até os 17 anos.
36
Visualmente fica fácil observar que moradia, transporte e alimentação são os itens de
maior peso no valor total gasto. O cálculo do número de graus do setor circular que irá
representar a porcentagem correspondente à alimentação (22,8%) é dado por:
Solução:
O gráfico é mostrado na figura 3.4. A linha mais espessa corresponde aos valores da
segunda coluna (Brancos).
35
30
Mortes por 1000
25
20 Brancos
15 Negros
10
5
0
70
72
74
76
78
19
19
19
19
19
Ano
Novamente, o gráfico permite concluir que houve uma clara diminuição dos índices de
mortalidade ao longo da década de 70.
37
3.4 – Histogramas
Uma representação gráfica de uma distribuição de freqüência pode ser obtida através
da construção de um histograma. Um histograma é uma forma especial de gráfico de barra
no qual os intervalos das classes são representados pelas larguras das barras e as freqüências
dos dados que caem nas classes são representadas pela área das barras.
Para construir um histograma, primeiro desenhe uma linha horizontal que irá
representar o eixo das medições (dados) e marque os limites das classes adjacentes neste eixo.
Em seguida, acima de cada classe, desenhe um retângulo cuja área seja proporcional à
freqüência daquele intervalo. Assim se o intervalo i contém o dobro de observações do
intervalo j, então o retângulo acima do intervalo i deve ter uma área que seja o dobro da área
do retângulo acima do intervalo j. A tabela 2.13 do capítulo dois é uma tabela de freqüências
para os níveis de colesterol de vinte pacientes jovens. Para facilitar, esta tabela é aqui repetida
e identificada como tabela 3.4. O histograma para os dados dessa tabela pode ser visto na
figura 3.5.
5
Freqüência
Nível de Colesterol
Figura 3.5 – Histograma para os dados da tabela 3.4.
38
Assuma que um conjunto de dados contenha n elementos x1, x2, ..., xn, onde cada dado
consiste de pelo menos dois dígitos. Uma maneira simples de obter uma informação visual
dos dados é fazer uma disposição dos mesmos em uma forma denominada ramo e folhas. Para
isso divida cada dado xi em duas componentes: um ramo, constituído por um ou mais dígitos
iniciais do dado e, uma folha, constituída dos dígitos restantes. Em geral, para um conjunto de
dados típico, o número de troncos é pequeno, algo entre 6 e 20 é usualmente adequado.
Uma vez que os troncos tenham sido definidos, eles devem ser colocados segundo
uma ordem crescente de valores na forma de uma coluna do lado esquerdo da página. Ao lado
de cada tronco todas as folhas correspondentes aos valores dos dados são dispostas à direita
do tronco na ordem em que os dados aparecem no conjunto. O exemplo a seguir ilustra este
tipo de disposição de dados.
Solução:
Como o menor valor presente entre os dados é 7,5 e o maior valor é 16,6, podemos
fazer uma escolha dos troncos como sendo 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, dando um total
de 10 troncos. A disposição fica como mostrada abaixo.
39
6 ,7
7 ,5
8 ,5; ,9; ,8
9 ,7; ,3; ,2
10 ,0; ,4; ,8; ,7; ,9
11 ,1; ,5; ,2; ,6
12 ,4; ,0; ,3
13 ,2; ,8; ,3
14 ,2; ,5
15 ,8
16 ,6
17
18 ,2
Pela disposição fica fácil observar que a maior parte das taxas de consumo se
encontram entre 8 e 13 km/l e que os valores se distribuem com uma forma de sino em torno
dos valores 10 e 11, isto é, pode-se observar que o valor médio é algo entre 10 e 11 km/l.
Este exemplo mostra que esta disposição dos dados nos auxilia a extrair alguns
aspectos importantes do conjunto de dados sob análise. A vantagem sobre um histograma é
que não perdemos informações sobre os valores.
Este tipo de diagrama é bastante simples e consiste em marcar a posição de cada dado
em um eixo horizontal com uma escala adequada para representar todos os valores do
conjunto de dados. O exemplo abaixo ilustra este tipo de diagrama.
Solução:
O diagrama está mostrado na figura 3.6. Os valores repetidos são colocados alinhados
em uma coluna acima do eixo.
40
Figura 3.6 – Diagrama de pontos para os tempos de duração das quedas de energia.
No diagrama nota-se que a maioria dos pontos estão situados entre 1 e 2 horas. O valor
excessivamente alto de 10 h aparece isolado no gráfico, mostrando que algo excepcional deve
ter ocorrido.
2) Um levantamento dos salários dos empregados de uma empresa resultou nos seguintes
valores em reais (a parte decimal foi omitida):
41
Capítulo 4
Probabilidades
Objetivos do Capítulo
43
Uma pessoa possui quatro camisas e três calças. De quantas maneiras diferentes ele
pode se vestir escolhendo uma camisa e uma calça por vez?
Solução:
Para solucionar esse problema usaremos primeiramente uma ferramenta denominada
diagrama em árvore, que permite obter uma listagem direta de todas as possibilidades. A
figura 4.1 ilustra o diagrama em árvore para este exemplo. Podemos notar que neste caso
temos apenas dois níveis, sendo que no primeiro nível temos quatro ramos, correspondendo às
quatro possibilidades de escolha de uma camisa e, para cada ramo do primeiro nível temos
três ramos no segundo nível, correspondendo às três possibilidades de escolha de uma calça.
O total de maneiras de uma pessoa se vestir pode ser obtido contando-se o número de ramos
no fim da árvore. Podemos ver que existem 12 maneiras diferentes de uma pessoa se vestir.
3 + 3 + 3 + 3 = 4 x 3 = 12
Assim podemos ver que o número total de possibilidades pode ser obtido
multiplicando-se o número de possibilidades de se escolher uma camisa pelo número de
possibilidades de se escolher uma calça.
44
2 1 21
2 22
3 23
3 1 31
2 32
3 33
1 41
4
2 42
3 43
m1 x m2 x m3 x...x mn
Solução:
a) Aplicando o princípio multiplicativo podemos ver que teremos n = 7. O total de
possibilidades é dado por:
26 x 26 x 26 x 10 x 10 x 10 x 10 = 175.760.000
45
b) Se uma letra ou um dígito não puder ser repetido, então o número de possibilidades
será dado por:
26 x 25 x 24 x 10 x 9 x 8 x 7 = 78.624.000
4.1.2 – Fatorial
n!+(n + 1)!
n!
Solução:
a) 4! = 4 x 3 x 2 x 1 = 24
5! = 5 x 4 x 3 x 2 x 1 = 120
7! = 7 x 6 x 5 x 4 x 3 x 2 x 1 = 720
Observe que os agrupamentos de uma mesma coluna diferem na ordem dos elementos
e os agrupamentos de uma mesma linha diferem em pelo menos um elemento, isto é, diferem
na natureza de seus elementos. No total conseguimos formar 24 agrupamentos.
Na maioria dos problemas, entretanto, não é viável listar todos os agrupamentos para
depois determinar quantos são eles. A fórmula para calcular a quantidade de agrupamentos,
contendo p elementos cada um, que podemos formar dispondo-se de um total de n elementos
é dada por:
n!
An , p =
(n − p )!
4! 4!
A4,3 = = = 24
(4 − 3)! 1!
Pn = n!
Pn = 3! = 6
47
n!
C n, p =
p!(n − p )!
4! 4!
C 4,3 = = =4
3!(4 − 3)! 3!
1) Para recrutar novos membros, um clube do livro faz uma oferta especial. Um novo
membro concorda em comprar um livro pelo preço normal e, então, recebe de graça
quatro livros à sua escolha de uma coleção de 69 livros. Quantas possibilidades de
escolha de quatro livros têm um novo membro?
48
Definição 4.2 - Experimento (ou Fenômeno) aleatório – É todo experimento cujo resultado
é impossível de se prever. Por exemplo, lançamento de uma moeda, lançamento de um dado,
sorteio de uma loteria, etc..
19 24 24 24 23 20 22 21 18 20
19 19 21 19 19 23 36 22 20 35
22 23 19 26 22 17 19 20 20 21
19 21 20 20 21 19 24 21 22 21
Uma tabela de dados agrupados pode ser construída para esses dados.
49
Suponha que um dos estudantes seja selecionado ao acaso, significando que cada
estudante tenha a mesma chance de ser escolhido que qualquer outro. Qual é a probabilidade
de que o estudante selecionado tenha 20 anos de idade?
Solução:
Podemos ver na tabela de dados agrupados que sete dos quarenta estudantes possuem
20 anos de idade. Assim, as chances são de 7 em 40 de se selecionar um estudante com 20
anos de idade.
Em outras palavras podemos dizer que o evento “selecionar estudante com 20 anos”
possui 7 elementos e o espaço amostral é constituído de 40 elementos.
50
Solução:
Da tabela acima podemos ver que existem 22 (3+1+8+10) estudantes com notas
inferiores a 7. Isto é, o evento A = “escolher um estudante com nota menor que 7” possui
22 elementos. Portanto, f = 22 e a probabilidade é
f 22
P ( A) = = = 0,55
N 40
Em termos de porcentagem, isto significa que 55% dos estudantes da classe tiraram
nota menor que 7. Observe também que o valor calculado de 0,55 nada mais é que a soma
das freqüências relativas 0,075 + 0,025 + 0,200 + 0,250.
Assim, por exemplo, o fato de que 12,4% da população dos EUA é negra também
significa que a probabilidade é de 0,124 de que uma pessoa residente nos EUA, selecionada
aleatoriamente, seja negra.
1) 0 ≤ P(A) ≤ 1
2) P(Evento Impossível) = 0
3) P(Evento Certo) = 1
4) P(A) + P( A) = 1
Solução:
a) Como não há estudantes com 25 anos de idade, este evento é impossível de ocorrer e a
probabilidade será igual a zero, ou seja,
f 0
P ( A) = = =0
N 40
51
b) Uma vez que todos os estudantes têm idades menores que 50 anos, concluímos que este é
um evento certo e a probabilidade dele ocorrer é 1, ou seja,
f 40
P ( A) = = =1
N 40
7
P(A) = 1 − P( A) = 1 − = 1 − 0,175 = 0,825
40
1) Lançando-se um dado honesto de seis faces, qual a probabilidade de sair um valor maior
que 4 na face voltada para cima?
2) Lançando-se dois dados honestos, qual a probabilidade da soma dos valores ser igual a 7?
5) As ausências ou faltas ao trabalho de uma firma, durante o ano passado, estão resumidas
na tabela abaixo. Se um empregado é selecionado ao acaso, determine a probabilidade
dele ter perdido
a) três dias de trabalho.
b) entre um e cinco dias de trabalho, inclusive.
c) oito dias de trabalho.
d) no máximo oito dias de trabalho.
52
A B
Solução:
O espaço amostral S desse experimento e os eventos A e B são dados por:
S = {1, 2, 3, 4, 5 , 6}
A = {1,2}
B = {4, 5, 6}
53
n( A) 2
P ( A) = = = 0,33
N 6
n( B ) 3
P( B) = = = 0,5
N 6
2+3 2 3
P(AouB) = = + = 0,33 + 0,5 = 0,83
6 6 6
Ou seja, os valores 0,33 e 0,5 são, respectivamente, P(A) e P(B). Consequentemente, neste
caso nós temos
P(A ou B) = P(A) + P(B)
Esta fórmula é a regra especial da adição e ela vale desde que os dois eventos sejam
mutuamente exclusivos.
Uma urna contém quatro bolas brancas, três azuis e cinco pretas. Retirando-se uma
bola ao acaso da urna, qual a probabilidade de sair uma bola branca ou uma bola azul?
54
Solução:
O evento “sair bola branca ou sair bola azul” pode ser considerado como o evento
união do evento A = ”sair bola branca” com o evento B = “sair bola azul”. Os eventos A e B
são eventos mutuamente exclusivos e a aplicação da regra especial da adição resulta em
Solução:
a) O evento de que uma fazenda selecionada tenha menos de 50 hectares pode ser expresso
por (AouB). Uma vez que os eventos A e B são mutuamente exclusivos (porque?),
podemos aplicar a regra especial da adição obtendo-se
b) O evento de que uma fazenda selecionada tenha entre 100 e 499 hectares, pode ser
expresso por um evento união (D ou E ou F). Uma vez que os eventos D, E e F são
mutuamente exclusivos, obtemos
= 0,414
55
Solução:
O evento “sair número par” pode ser representado por A = {2,4,6} e o evento “sair
número menor que 4”pode ser representado por B = {1,2,3}. Pode-se ver que A e B não são
mutuamente exclusivos pois A∩B = {2}. Aplicando-se a regra geral obtemos
2) Suponha que você possua 20 bilhetes de um total de 500 bilhetes vendidos de uma rifa.
Sorteando-se um bilhete aleatoriamente calcule a probabilidade de você ganhar o
prêmio.
3) Suponha que A e B sejam dois eventos tais que P(A) = 1/4 , P(B) = 1/3 e P(A∪B) = 1/2.
a) Os eventos A e B são mutuamente exclusivos?
b) Determine P(A∩B).
56
Posição na Carreira
Professor Professor Professor Instrutor Total
Titular Associado Assistente
R1 R2 R3 R4
< 30 2 3 57 6 68
A1
30 – 39 52 170 163 17 402
A2
Idade
Da mesma maneira,
E assim por diante. Note que os eventos de A1 a A5 são mutuamente exclusivos assim
como os eventos de R1 a R4 .
57
O evento (A1 e R2) é representado pela célula na primeira linha e segunda coluna da
tabela anterior. Na verdade existem 20 eventos conjuntos deste tipo, um para cada célula da
tabela,
Posição na Carreira
Professor Professor Professor Instrutor P(Ai)
Titular Associado Assistente
R1 R2 R3 R4
< 30 0,002 0,003 0,049 0,005 0,058
A1
30 – 39 0,045 0,146 0,140 0,015 0,345
A2
Idade
58
Observe que os valores da tabela dentro das linhas mais grossas representam as
probabilidades conjuntas dos eventos A’s e R’s. Observe também que os rótulos “Total”
que estavam na última linha e na última coluna foram substituídos por P(Rj) e P(Ai),
respectivamente. Isto porque a última linha da tabela acima nos dá as probabilidades dos
eventos R1 a R4 e a ultima coluna nos dá as probabilidades dos eventos A1 a A5. Essas
probabilidades são chamadas probabilidades marginais porque elas estão posicionadas na
“margem” da tabela de distribuição conjunta.
Finalmente devemos notar que a soma das probabilidades conjuntas em uma linha ou
coluna é igual à probabilidade marginal daquela linha ou coluna (qualquer discrepância é
devida a erros de arredondamento). Por exemplo, considere a linha 2 da tabela acima. A soma
das probabilidades conjuntas é igual a
P(A2 e R1) + P(A2 e R2) + P(A2 e R3) + P(A2 e R4) = 0,045 + 0,146 + 0,140 + 0,015
= 0,346
A resposta é muito simples. Se sabemos que saiu um número par, não existem mais
seis resultados possíveis, existem apenas três que são 2, 4 e 6. Assim a probabilidade de
ocorrer o número quatro (evento A) não é mais 1/6 = 0,167. Agora o resultado é
59
Notação
A notação usada para indicar a probabilidade condicional é P(A | B). Lê-se “probabilidade de
ocorrer o evento A sabendo-se que já ocorreu o evento B”. O símbolo “|” é lido “sabendo-se
que”, ou “dado que”. Resumindo os dois casos acima podemos escrever:
Posição na Carreira
Professor Professor Professor Instrutor Total
Titular Associad Assistent
R1 o R2 e R3 R4
< 30 2 3 57 6 68
A1
30 – 39 52 170 163 17 402
A2
Idade
60
Solução:
a) A probabilidade de que o professor selecionado esteja na casa dos 50, é P(A4). Da tabela
acima, para N =1164 e f = 253 a probabilidade será dada por
c) P(A4) = 0,217 indica que 21,7% dos professores da universidade estão na casa dos 50.
P(A4 | R3) = 0,113 indica que 11,3% dos professores assistentes estão na casa dos 50.
Analisando o exemplo dado, fica claro que para calcular uma probabilidade
condicional, primeiro encontramos quantos elementos pertencem aos dois eventos,
simultaneamente, e dividimos pelo número de elementos do evento que já ocorreu. Isto sugere
a seguinte fórmula:
n( A ∩ B ) P ( A ∩ B )
P( A| B) = =
n( B ) P( B)
1) Suponha que uma carta seja retirada de um baralho com 52 cartas. Considere
2) Considere a tabela abaixo que fornece o número de dias de trabalho perdidos em um ano
em uma determinada empresa.
61
P(B | A) = (P(A∩B))/P(A)
Que é uma fórmula que permite calcular probabilidades conjuntas em termos de probabilidade
marginal e probabilidade condicional. Isto define o que denominamos regra da multiplicação.
O enunciado para esta fórmula é dado a seguir.
62
Sexo Freqüência
Masculino 17
Feminino 23
40
Suponha que dois estudantes são selecionados ao acaso desta classe. Assuma que o
primeiro estudante selecionado não retorne à classe antes que o segundo estudante seja
selecionado. Qual é a probabilidade de que o primeiro estudante selecionado seja do sexo
masculino e o segundo seja do sexo feminino?
Solução:
Podemos escrever os seguintes eventos:
Porém, da tabela dada podemos ver que 17 dos 40 estudantes são do sexo masculino,
logo
Supondo que o primeiro estudante selecionado seja do sexo masculino, e que ele não
retorne à sala, a probabilidade de que o segundo estudante seja do sexo feminino é dada por
63
Evento Probabilidade
F2 F1 e F2 0,324
F1 22/39
17/39
M2 F1 e M2 0,251
23/40
17/40 0,251
F2 M1 e F2
23/39
M1 16/39
M2 M1 e M2 0,174
Independência
P(B | A) = P(B)
64
Solução:
A probabilidade incondicional do evento B é dada por
P(B | A) = 4/12=0,333
Como P(B) ≠ P(B | A), o evento B não é independente de A. É interessante observar que
esta falta de independência vem do fato de que a porcentagem dos reis entre as figuras (33%)
não é a mesma que a porcentagem dos reis entre todas as cartas (7,7%).
65
Uma roleta contém 38 números dos quais 18 são vermelhos, 18 são pretos, e dois são
verdes. Quando a roleta é girada e a bola é solta, é igualmente provável que a bola caia em
qualquer uma das cavidades relativas aos 38 números. Em duas jogadas da roleta, qual é a
probabilidade de que
a) a bola caia no vermelho as duas vezes?
b) a bola caia no verde na primeira vez e no preto na segunda vez?
Solução:
Primeiro de tudo nós notamos que é razoável assumir que os resultados das jogadas
sucessivas da roleta são independentes (porquê?).
a) para esta primeira pergunta, considere os eventos
Existe uma chance de 22,5% de que a bola caia duas vezes no vermelho.
Existe uma chance de 2,5% de a bola caia a primeira vez no verde e a segunda vez no
preto.
66
1) Cartões numerados 1,2,3, ..., 10 são colocados em uma caixa. Os cartões são misturados e
uma pessoa, sem visão dos cartões, seleciona dois cartões sucessivos, sem reposição do
primeiro.
a) Qual é a probabilidade de que o primeiro cartão seja o de número 6?
b) Sabendo que o primeiro cartão é o 6, qual é a probabilidade de que o segundo cartão
seja o de número 9?
c) Qual é a probabilidade de selecionar primeiro um 6 e depois um 9?
d) Qual é a probabilidade de que ambos os cartões selecionados tenham números acima
de 5?
Sexo Freqüência
Masculino 27
Feminino 23
50
Suponha que dois estudantes sejam selecionados, ao acaso, sem reposição. Qual é a
probabilidade de que:
a) o primeiro selecionado seja do sexo feminino e o segundo seja do sexo masculino?
b) ambos os estudantes sejam do sexo feminino?
c) desenhe um diagrama em árvore para este problema.
d) qual é a probabilidade de ambos os estudantes sejam do mesmo sexo?
3) Considere a tabela de contingência abaixo que relaciona dados segundo dois fatores, sexo
e circunstâncias de acidentes. As freqüências são dadas em milhões.
a) Determine P(C1)
b) Determine P(C1 | S2)
c) Os eventos C1 e S2 são independentes? Porque?
d) O evento de que uma pessoa acidentada seja do sexo masculino é independente do
evento de que uma pessoa acidentada que sofreu o acidente em casa? Justifique sua
resposta.
67
Capítulo 5
Objetivos do Capítulo
69
Uma variável aleatória, que será indicada por x, é uma variável que pode assumir
valores numéricos quando um experimento é realizado. O valor particular que a variável
aleatória assume é dependente do acaso, sendo impossível prever sua ocorrência antes do
experimento ser realizado. O exemplo a seguir ilustra o conceito.
A tabela mostra, por exemplo, que 2865 famílias dentre 6487 famílias possuem 2
carros, ou seja, 44,2% das famílias possuem dois carros. Uma vez que o “número de carros
possuídos” varia de família para família, ele é chamado de variável. Suponha agora que uma
família seja selecionada ao acaso. Então, o número de carros possuídos pela família
selecionada é chamado variável aleatória porque seu valor depende do acaso, isto é, depende
da família selecionada. A figura 5.1 abaixo mostra que o conceito de variável aleatória pode
ser visto como uma função cujo domínio é o espaço amostral S do experimento e o
contradomínio é o conjunto dos números inteiros I. O conjunto imagem é o conjunto dos
valores que a variável pode assumir quando da realização do experimento.
Domínio = Espaço amostral S = Conjunto das
famílias da cidade Contradomínio = I
F1 Conjunto Imagem
0
F2 1
2
F3 3
4 5
...
F6487
70
Observe que a variável aleatória “número de carros possuídos por família” só pode
assumir valores inteiros, ou seja, valores discretos iguais a 0, 1, 2, 3, 4 ou 5. Este tipo de
variável é dito variável aleatória discreta.
Definição 5.1 – Variável aleatória – Uma variável aleatória é uma quantidade numérica
cujo valor depende do acaso.
Definição 5.3 – Variável aleatória discreta - Uma variável aleatória discreta é uma variável
aleatória cujos possíveis valores formam um conjunto discreto de dados.
Se o experimento for realizado e resultar no par (3,5) então o valor de x será 3+5 = 8,
o valor de y será 3-5 = -2 e o valor de z será 5 que é o máximo entre 3 e 5.
Como exercício, escreva os valores que cada uma das variáveis pode assumir, ou seja,
defina o conjunto dos possíveis valores de x, y e z.
71
Suponha que de uma maneira aleatória, uma localização (latitude e longitude) seja
selecionada dentro do território dos Estados Unidos e, seja uma variável aleatória definida por
x = a altura (ou altitude) acima do nível do mar deste local.
Por exemplo, se o local selecionado fosse dado por (39° 50’ Norte, 98° 35’ Oeste),
então poderíamos ter x (39° 50’ Norte, 98° 35’ Oeste) = 524,48 m. O maior valor possível de
x é de 4348,2 m (Monte Whitney) e o menor valor possível é -84,6 m (Vale da Morte). O
conjunto dos valores possíveis de x seria representado pelo intervalo [-84,6 ; 4348,2]. O que
indica que existe um número infinito de valores dentro deste intervalo.
Variáveis aleatórias que podem assumir valores em um intervalo de números reais são
ditas variáveis aleatórias contínuas. Este tipo de variável será estudado mais adiante.
5.2 – Notação
Usualmente denominamos uma variável aleatória por letras tais como x, y, z, etc..
Voltando ao exemplo 5.1, a variável aleatória era definida como “número de carros possuídos
por uma família”. Assumindo que x seja a variável, podemos representar o evento de a família
selecionada ter dois carros por {x = 2}, que se lê “x é igual a dois”.
A probabilidade de que a família selecionada tenha dois carros pode ser então indicada
simbolicamente por P(x = 2), que pode ser lido como “probabilidade de que x seja igual a
dois”. Quando não há dúvida sobre qual variável aleatória estamos lidando, podemos
simplesmente escrever P(2) em vez de P(x = 2).
f 2865
P( x = 2) = = = 0,442
N 6487
72
∑ P(x) = 1
Suponha que um estudante de uma dessas séries seja selecionado ao acaso. E seja y a
série do estudante selecionado. Então y é uma variável aleatória cujos valores possíveis são 0,
1, 2, 3, ... , 8.
73
Solução:
a) O evento “o estudante selecionado é da quinta série” pode ser representado por {y=5}.
f 3131
P ( y = 5) = = = 0,117
N 26732
Em termos de porcentagem, isto significa que 11,7% dos estudantes do primeiro grau
estão na quinta série.
f 3184
P (7 ) = = = 0,119
N 26732
74
Quando uma moeda homogênea é lançada três vezes, existem oito resultados
igualmente possíveis que são:
Ca Ca Ca Ca Co Ca Co Ca Ca Co Co Ca
Ca Ca Co Ca Co Co Co Ca Co Co Co Co
a) Use a notação de variável aleatória para representar o evento “exatamente duas caras
são obtidas”.
b) Determine P(x = 2) e expresse o resultado em termos de porcentagem.
c) Determine a distribuição de probabilidades da variável aleatória x.
d) Use a notação de variável aleatória para representar o evento “no máximo duas caras
são obtidas”.
e) Determine P(x ≤ 2).
Solução:
a) {x=2}
b) P(x=2) é dada por
f 3
P ( x = 2) = = = 0,375
N 8
Isto é porque existem três maneiras de se obter duas caras de um total de oito
possibilidades.
75
d) O evento “no máximo duas caras são obtidas” pode ser representado por {x ≤ 2}, leia-se
“x é menor ou igual a 2”.
Uma vez que os três eventos da direita são mutuamente exclusivos, nós podemos usar
a regra especial da adição e os valores da tabela 5.6 para calcular P(x ≤ 2).
1) Quando dois dados são lançados, existem 36 resultados igualmente possíveis. Estes
resultados estão dados na tabela 5.2, na página 68. Representemos por y a soma dos
dados.
a) Quais são os possíveis valores da variável aleatória y?
b) Use a notação de variável aleatória para representar o evento “a soma dos dados é
sete”.
c) Determine P(y=7).
d) Determine P(11).
e) Determine a distribuição de probabilidades de y. Deixe os valores das probabilidades
na forma de frações.
76
A tabela indica, por exemplo, que a probabilidade de que exatamente cinco caixas
estejam ocupados com clientes é 0,26; ou seja, 26% do tempo exatamente cinco caixas
estão ocupados com clientes. Use a notação de variável aleatória para representar os
seguintes eventos:
a) Exatamente quatro caixas estão ocupados.
b) Pelo menos dois caixas estão ocupados.
c) Menos de cinco caixas estão ocupados.
d) Pelo menos dois, porém menos que cinco caixas estão ocupados.
3) Suponha que z seja uma variável aleatória e que P(z > 1,96) = 0,025. Determine P(z≤1,96).
(Dica: Use o conceito de evento complementar)
4) Suponha que t seja uma variável aleatória e que P(t > 2,02) = 0,05 e que P(t < -2,02) =
0,05. Determine P(-2,02 ≤ t ≤ 2,02).
5) Assuma que x seja uma variável aleatória e que P( x > c) = α, onde c e α são números e
0≤α≤1. Determine P(x ≤ c) em termos de α.
x 0 1 2 3 4 5
f(x) 0,05 0,20 0,30 0,25 0,15 0,05
a) Se a oficina tem capacidade de atender dois clientes por dia, qual é a probabilidade de
que um ou mais clientes não sejam atendidos em um dado dia?
b) Qual é a probabilidade de que a capacidade da oficina não seja completamente
utilizada em um dado dia?
c) De quanto devemos aumentar a capacidade de modo que a probabilidade de não
atender um cliente não seja maior que 0,10?
77
As fórmulas para cálculo da média e do desvio padrão, vistas no capítulo 2, devem ser
aplicadas apenas quando se tem um conjunto de dados não agrupados. Entretanto, nós
encontramos freqüentemente dados agrupados na forma de uma tabela de distribuição de
freqüências. Neste caso, precisamos aplicar fórmulas diferentes para o cálculo da média e do
desvio padrão.
Para mostrar o cálculo da média para dados agrupados usaremos os dados usados no
exemplo 2.4 do capítulo 2.
200 200 840 350 300 300 200 200 950 200
Solução:
A tabela de freqüências pode ser escrita como:
No exemplo 2.4, o cálculo da média foi feito somando-se os dados da tabela 5.6 e
dividindo o total pelo número de salários(dados), ou seja:
Soma dos salários = 200 + 200 + 840 + 350 + 300 + 300 + 200 + 200 + 950 + 200
= 200 + 200 + 200 + 200 + 200 + 300 + 300 + 350 + 840 + 950
5 2 1 1 1
78
Podemos observar que a soma dos salários é obtida adicionando-se os produtos dos
salários pelas respectivas freqüências. Isto pode ser feito mais eficientemente adicionando-se
uma coluna à tabela de freqüência (veja tabela abaixo).
−
x=
Soma dos Salários
=
∑ xf =
3740
= 374
Número de Salários ∑f 10
−
x=
∑ xf
n
79
2
−
∑ x− x × f
s=
n −1
s=
(
n ∑ x 2 f − (∑ xf ) ) 2
n(n − 1)
s=
( )
n ∑ x 2 f − (∑ xf )
2
=
10 × (2.110.600 ) − (3740 )
2
= 281,24
n(n − 1) 10 × (9 )
80
µ=
∑ xf f
= ∑ x = ∑ xP(x)
n N
Definição 5.5 – Média de uma variável aleatória discreta - A média de uma variável
aleatória discreta, x, é definida por:
µx = ∑ xP(x)
A fórmula para o cálculo do desvio padrão σx , pode ser deduzida de uma forma
similar à da média. Uma vez que as freqüências relativas e probabilidades são iguais, a
fórmula para σ é:
∑ (x − µ ) ×f
2
∑ (x − µ ) ∑ (x − µ )
f
σ= =
2
× =
2
P( x)
N N
Podemos mostrar também que a fórmula acima pode ser escrita de uma outra forma
para simplificar o cálculo do desvio padrão. Esta fórmula simplificada é dada por
σ= ∑x 2
P( x) − µ 2
Definição 5.6 – Desvio padrão de uma variável aleatória - O desvio padrão de uma
variável aleatória x, é definido por:
σx = ∑ (x − µ ) P( x) = ∑x P ( x) − µ x2
2 2
x
81
Exemplo 5.8 – Ilustra o cálculo da média e do desvio padrão de uma variável aleatória
Solução:
Para o cálculo da média basta acrescentar mais uma coluna à tabela acima.
µx = ∑ x . P(x) = 2,65
Para o cálculo do desvio padrão precisamos acrescentar mais duas colunas à tabela de
distribuição de probabilidade dada.
82
83
84
Esta definição indica que em um experimento binomial, nós temos um número fixo de
repetições independentes onde cada resultado tem somente duas classificações. O termo
independente significa que o resultado de uma repetição ou realização do experimento não
afetará as probabilidades dos resultados em repetições subsequentes.
Notação
85
Sabe-se que uma droga é 80% efetiva na cura de uma certa doença. Suponha que
quatro pacientes com a doença sejam submetidos a um tratamento com a droga e que os
resultados curado e não curado sejam registrados.
a) Formule o experimento como um experimento binomial com quatro repetições.
b) Determine os possíveis resultados das quatro repetições.
c) Determine a probabilidade de cada resultado da parte (b).
Solução:
Por exemplo, sssf representa o resultado de que os primeiros três pacientes são curados
e o último não é.
c) Como pode ser visto da tabela acima, existem 16 possíveis resultados e a probabilidade de
ocorrência de cada um pode ser calculada aplicando-se a regra especial da multiplicação,
uma vez que as repetições são independentes. A probabilidade de sucesso é 0,8 e,
portanto, a probabilidade de falha é 0,2. Isto significa que
A regra especial garante que, por exemplo, a probabilidade de ocorrer o resultado sssf
é:
P(sssf) = P(s) . P(s) . P(s) . P(f) = 0,8 . 0,8 . 0,8 . 0,2 = 0,1024
P(fsfs) = P(f) . P(s) . P(f) . P(s) = 0,2 . 0,8 . 0,2 . 0,8 = 0,0256
Observe que resultados com o mesmo número de sucessos têm a mesma probabilidade
de ocorrer.
86
87
2) De acordo com o Instituto de Saúde Mental dos EUA, 20% dos adultos americanos
sofrem de pelo menos um problema psiquiátrico. Suponha que quatro adultos
americanos sejam selecionados para estudos sobre problemas psiquiátricos. Se
assumirmos que um sucesso, s, corresponda a um adulto tendo um problema
psiquiátrico, responda às questões abaixo.
a) Qual é a probabilidade de sucesso p?
b) Construa uma tabela similar à tabela 5.15, para as quatro tentativas.
c) Construa um diagrama em árvore para este problema, similar ao da figura 5.1.
d) Liste os resultados com exatamente três sucessos.
e) Determine a probabilidade de cada resultado da parte (d). Porque estas
probabilidades são todas iguais?
3) Um estudo de uma companhia telefônica em uma certa cidade mostrou que a duração
média de uma chamada telefônica residencial é de 3,8 minutos e que a probabilidade de
uma chamada telefônica, selecionada de maneira aleatória, com duração superior a 3,8
minutos é de 0,25. Para uma dada chamada telefônica, assuma que consideramos um
sucesso, s, se a chamada telefônica durar no máximo 3,8 minutos.
a) Qual é a probabilidade de sucesso p?
b) Construa uma tabela similar à tabela 5.15, para os resultados possíveis sucesso-
falha de três chamadas telefônicas aleatoriamente selecionadas. Calcule as
probabilidades com três casas decimais.
c) Construa um diagrama em árvore para este problema, similar ao da figura 5.1.
d) Liste os resultados nos quais exatamente duas das três chamadas duram no
máximo 3,8 minutos.
e) Determine a probabilidade de cada resultado da parte (d). Porque estas
probabilidades são todas iguais?
88
Sabe-se que uma droga é 80% efetiva na cura de uma doença. Suponha que quatro
pacientes com a doença sejam submetidos a um tratamento com a droga. Determine a
probabilidade de que:
a) exatamente dois pacientes sejam curados.
Solução:
Lembrando que um sucesso significa que a droga foi efetiva, ou seja, que o paciente
foi curado e se queremos calcular a probabilidade de obtermos dois sucessos, o resultado ssff
é um dos resultados que satisfaz o que é pedido. A probabilidade de ocorrer este resultado é
dada pela regra especial da multiplicação
P(ssff) = P(s) . P(s) . P(f) . P(f) = 0,8 . 0,8 . 0,2 . 0,2 = 0,0256
P(ssff) = p . p . q . q
Entretanto, este não é o único resultado aceitável. A tabela 5.15, aqui repetida como
tabela 5.16 mostra que outros resultados são possíveis.
89
Este fato importante não será demonstrado. Porém, podemos verificar sua consistência
com os resultados do exemplo anterior.
90
Na parte (a) do exemplo, encontramos seis resultados possíveis nos quais exatamente
dois dos quatro pacientes são curados: ssff, sfsf, sffs, fssf, fsfs e ffss. Em outras palavras, o
evento de exatamente dois sucessos (x=2) em quatro repetições (n=4) consiste de seis
resultados.
Usando o fato importante 5.2, podemos determinar este valor sem a necessidade de
listar todos eles.
n 4 4! 4.3.2!
x
= = = =6
2 2!.(4 − 2)! 2!.2!
probabilidade probabilidade
de cura de não-cura
O valor é obtido pela multiplicação das três probabilidades de sucesso de 0,8 e uma
probabilidade de falha de 0,2. Por outro lado, o fato importante 5.2 permite calcular o número
de resultados com exatamente três curas que é
4 4!
3 = =4
3!1!
4
P(x=3) = 3 (0.8)3 (0,2)1 = 4 . 0,1024 = 0,4096
91
n
P(x) = x px(1-p)n-x
Hipóteses
1. n idênticas repetições são realizadas.
2. Existem dois possíveis resultados ( sucesso ou falha ) para cada repetição.
3. As repetições são independentes.
4. A probabilidade de sucesso, p, permanece a mesma em cada repetição.
n
P( x ) = p x (1 − p )
n− x
x
Um estudo de uma companhia telefônica em uma cidade mostrou que a duração média
de uma chamada telefônica residencial é de 3,8 minutos e que a probabilidade de uma
chamada telefônica, selecionada de maneira aleatória, com duração superior a 3,8 minutos é
de 0,25. Qual é a probabilidade de que entre três chamadas, aleatoriamente selecionadas,
92
Solução:
Seja x o número de chamadas, dentre as três selecionadas, que duram mais que 3,8
minutos. Para encontrar as probabilidades pedidas, aplicaremos o procedimento anterior
sugerido.
3
P(x) = x (0,25)x(0,75)3-x
a) A probabilidade de exatamente duas durarem mais que 3,8 minutos é obtida fazendo-se
x=2.
3
P(2) = 2 (0,25)2(0,75)1 = 0,141
b) A probabilidade de nenhuma das três chamadas durar mais que 3,8 minutos é obtida
fazendo-se x=0.
3
P(0) = 0 (0,25)0(0,75)3 = 0,422
Existe 42,2% de chance de que nenhuma das três chamadas selecionadas durem mais
que 3,8 minutos.
93
1) Um vendedor de carros novos sabe de experiência passada que, na média, ele faz uma
venda para cerca de 20% de seus clientes. Qual é a probabilidade de que em cinco
clientes aleatoriamente selecionados, ele fará uma venda
a) para exatamente três clientes?
b) Para no máximo um cliente?
c) Para no mínimo um cliente?
d) Determine a distribuição de probabilidade para o número de vendas em cinco clientes
aleatoriamente selecionados.
94
Na seção 5.5, aprendemos como obter a média e o desvio padrão de uma variável
discreta. A definição 5.5, na página 78, nos dá a fórmula para calcular a média de uma
variável aleatória discreta. O cálculo do desvio padrão é feito com o auxílio da fórmula dada
na definição 5.6. Estas fórmulas se aplicam para qualquer variável aleatória discreta e, em
particular, para uma variável aleatória binomial. Considere o exemplo 5.12.
Exemplo 5.12 – Ilustra o cálculo da média e desvio padrão de uma variável aleatória
binomial
O U.S. National Center for Health Statistics relata que 60% de todas as operações de
olhos são feitas em mulheres. Suponha que três pacientes operados dos olhos sejam
selecionados aleatoriamente. Façamos x representar o número de pacientes femininos dentre
os três pacientes selecionados. Com isso, x é uma variável aleatória binomial com
parâmetros n = 3 e p = 0,6.
a) determine a média da variável aleatória x.
b) encontre o desvio padrão da variável aleatória x.
Solução:
Para determinar a média e o desvio padrão de x, nós necessitamos primeiro determinar
a sua distribuição de probabilidades. Uma vez que x tem uma distribuição binomial com
parâmetros p = 0,6 e n = 3, probabilidades para x podem ser calculadas usando a fórmula 5.2
da página 84.
3
P(x) = x
(0,6)x(0,4)n-x
µx = Σx.P(x) = 1,8
95
Observe que o mesmo valor 1,8 determinado para a média da variável aleatória x,
poderia ser encontrado com o seguinte raciocínio. Se 60% de todos os pacientes de cirurgia
ocular são do sexo feminino, então dos três pacientes considerados podemos esperar que 60%
deles sejam do sexo feminino. Entretanto, 60% de 3 é igual a 1,8. Este tipo de raciocínio
sempre funciona quando se trata de variável aleatória binomial, o que sugere a seguinte
fórmula:
µx = np
A fórmula para o desvio padrão pode também ser facilmente demonstrada porém nos
limitaremos apenas a apresentá-la abaixo.
σx = np(1 − p )
O U.S. National Center for Health Statistics relata que 60% de todas as operações de
olhos são feitas em mulheres. Suponha que três pacientes operados dos olhos sejam
selecionados aleatoriamente. Façamos x representar o número de pacientes femininos dentre
os três pacientes selecionados. Com isso, x é uma variável aleatória binomial com parâmetros
n = 3 e p = 0,6.
c) determine a média da variável aleatória x.
d) encontre o desvio padrão da variável aleatória x.
96
Solução:
Primeiramente observemos que a variável aleatória binomial x possui como
parâmetros os valores n=3 e p=0,6.
µx = np = 3 . 0,6 = 1,8
µx = Σx.P(x) e σx = ∑ x 2 P( x) − µ x2
b) Determine a média e o desvio padrão aplicando as fórmulas especiais
µx = np e σx = np(1 − p )
2) Um vendedor de carros novos sabe de experiência passada que, na média, ele faz uma
venda para cerca de 20% de seus clientes. Seja x a variável que indica o número de
vendas efetuadas dentre cinco clientes aleatoriamente selecionados.
a) Determine a média e o desvio padrão aplicando as fórmulas gerais
µx = Σx.P(x) e σx = ∑ x 2 P( x) − µ x2
b) Determine a média e o desvio padrão aplicando as fórmulas especiais
µx = np e σx = np(1 − p )
97
PROBABILIDADES BINOMIAIS
p
n x .01 .05 .10 .20 .30 .40 .50 .60 .70 .80 .90 .95 .99 x
2 0 980 902 810 640 490 360 250 160 090 040 010 002 0+ 0
1 020 095 180 320 420 480 500 480 420 320 180 095 020 1
2 0+ 002 010 040 090 160 250 360 490 640 810 902 980 2
3 0 970 857 729 512 343 216 125 064 027 008 001 0+ 0+ 0
1 029 135 243 384 441 432 375 288 189 096 027 007 0+ 1
2 0+ 007 027 096 189 288 375 432 441 384 243 135 029 2
3 0+ 0+ 001 008 027 064 125 216 343 512 729 857 970 3
4 0 961 815 656 410 240 130 062 026 008 002 0+ 0+ 0+ 0
1 039 171 292 410 412 346 250 154 076 026 004 0+ 0+ 1
2 001 014 049 154 265 346 375 346 265 154 049 014 001 2
3 0+ 0+ 004 026 076 154 250 346 412 410 292 171 039 3
4 0+ 0+ 0+ 002 008 026 062 130 240 410 656 815 961 4
5 0 951 774 590 328 168 078 031 010 002 0+ 0+ 0+ 0+ 0
1 048 204 328 410 360 259 156 077 028 006 0+ 0+ 0+ 1
2 001 021 073 205 309 346 312 230 132 051 008 001 0+ 2
3 0+ 001 008 051 132 230 312 346 309 205 073 021 001 3
4 0+ 0+ 0+ 006 028 077 156 259 360 410 328 204 048 4
5 0+ 0+ 0+ 0+ 002 010 031 078 168 328 590 774 951 5
6 0 941 735 531 262 118 047 016 004 001 0+ 0+ 0+ 0+ 0
1 057 232 354 393 303 187 094 037 010 002 0+ 0+ 0+ 1
2 001 031 098 246 324 311 234 138 060 015 001 0+ 0+ 2
3 0+ 002 015 082 185 276 312 276 185 082 015 002 0+ 3
4 0+ 0+ 001 015 060 138 234 311 324 246 098 031 001 4
5 0+ 0+ 0+ 002 010 037 094 187 303 393 354 232 057 5
6 0+ 0+ 0+ 0+ 001 004 016 047 118 262 531 735 941 6
7 0 932 698 478 210 082 028 008 002 0+ 0+ 0+ 0+ 0+ 0
1 066 257 372 376 247 131 055 017 004 0+ 0+ 0+ 0+ 1
2 002 041 124 275 318 261 164 077 025 004 0+ 0+ 0+ 2
3 0+ 004 023 115 227 290 273 194 097 029 003 0+ 0+ 3
4 0+ 0+ 003 029 097 194 273 290 227 115 023 004 0+ 4
5 0+ 0+ 0+ 004 025 077 164 261 318 275 124 041 002 5
6 0+ 0+ 0+ 0+ 004 017 055 131 247 367 372 257 066 6
7 0+ 0+ 0+ 0+ 0+ 002 008 028 082 210 478 698 932 7
8 0 923 663 430 168 058 017 004 001 0+ 0+ 0+ 0+ 0+ 0
1 075 279 383 336 198 090 031 008 001 0+ 0+ 0+ 0+ 1
2 003 051 149 294 296 209 109 041 010 001 0+ 0+ 0+ 2
3 0+ 005 033 147 254 279 219 124 047 009 0+ 0+ 0+ 3
4 0+ 0+ 005 046 136 232 273 232 136 046 005 0+ 0+ 4
5 0+ 0+ 0+ 009 047 124 219 279 254 147 033 005 0+ 5
6 0+ 0+ 0+ 001 010 041 109 209 296 294 149 051 003 6
7 0+ 0+ 0+ 0+ 001 008 031 090 198 336 383 279 075 7
8 0+ 0+ 0+ 0+ 0+ 001 004 017 058 168 430 663 923 8
98
PROBABILIDADES BINOMIAIS
p
n x .01 .05 .10 .20 .30 .40 .50 .60 .70 .80 .90 .95 .99 x
9 0 914 630 387 134 040 010 002 0+ 0+ 0+ 0+ 0+ 0+ 0
1 083 299 387 302 156 060 018 004 0+ 0+ 0+ 0+ 0+ 1
2 003 063 172 302 267 161 070 021 004 0+ 0+ 0+ 0+ 2
3 0+ 008 045 176 267 251 164 074 021 003 0+ 0+ 0+ 3
4 0+ 001 007 066 172 251 246 167 074 017 001 0+ 0+ 4
5 0+ 0+ 001 017 074 167 246 251 172 066 007 001 0+ 5
6 0+ 0+ 0+ 003 021 074 164 251 267 176 045 008 0+ 6
7 0+ 0+ 0+ 0+ 004 021 070 161 267 302 172 063 003 7
8 0+ 0+ 0+ 0+ 0+ 004 018 060 156 302 387 299 083 8
9 0+ 0+ 0+ 0+ 0+ 0+ 002 010 040 134 387 630 914 9
10 0 904 599 349 107 028 006 001 0+ 0+ 0+ 0+ 0+ 0+ 0
1 091 315 387 268 121 040 010 002 0+ 0+ 0+ 0+ 0+ 1
2 004 075 194 302 233 121 044 011 001 0+ 0+ 0+ 0+ 2
3 0+ 010 057 201 267 215 117 042 009 001 0+ 0+ 0+ 3
4 0+ 001 011 088 200 251 205 111 037 006 0+ 0+ 0+ 4
5 0+ 0+ 001 026 103 201 246 201 103 026 001 0+ 0+ 5
6 0+ 0+ 0+ 006 037 111 205 251 200 088 011 001 0+ 6
7 0+ 0+ 0+ 001 009 042 117 215 267 201 057 010 0+ 7
8 0+ 0+ 0+ 0+ 001 011 044 121 233 302 194 075 004 8
9 0+ 0+ 0+ 0+ 0+ 002 010 040 121 268 387 315 091 9
10 0+ 0+ 0+ 0+ 0+ 0+ 001 006 028 107 349 599 904 10
11 0 895 569 314 086 020 004 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
1 099 329 384 236 093 027 005 001 0+ 0+ 0+ 0+ 0+ 1
2 005 087 213 295 200 089 027 005 001 0+ 0+ 0+ 0+ 2
3 0+ 014 071 221 257 177 081 023 004 0+ 0+ 0+ 0+ 3
4 0+ 001 016 111 220 236 161 070 017 002 0+ 0+ 0+ 4
5 0+ 0+ 002 039 132 221 226 147 057 010 0+ 0+ 0+ 5
6 0+ 0+ 0+ 010 057 147 226 221 132 039 002 0+ 0+ 6
7 0+ 0+ 0+ 002 017 070 161 236 220 111 016 001 0+ 7
8 0+ 0+ 0+ 0+ 004 023 081 177 257 221 071 014 0+ 8
9 0+ 0+ 0+ 0+ 001 005 027 089 200 295 213 087 005 9
10 0+ 0+ 0+ 0+ 0+ 001 005 027 093 236 384 329 099 10
11 0+ 0+ 0+ 0+ 0+ 0+ 0+ 004 020 086 314 569 895 11
12 0 886 540 282 069 014 002 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
1 107 341 377 206 071 017 003 0+ 0+ 0+ 0+ 0+ 0+ 1
2 006 099 230 283 168 064 016 002 0+ 0+ 0+ 0+ 0+ 2
3 0+ 017 085 236 240 142 054 012 001 0+ 0+ 0+ 0+ 3
4 0+ 002 021 133 231 213 121 042 008 001 0+ 0+ 0+ 4
5 0+ 0+ 004 053 158 227 193 101 029 003 0+ 0+ 0+ 5
6 0+ 0+ 0+ 016 079 177 226 177 079 016 0+ 0+ 0+ 6
7 0+ 0+ 0+ 003 029 101 193 227 158 053 004 0+ 0+ 7
8 0+ 0+ 0+ 001 008 042 121 213 231 133 021 002 0+ 8
9 0+ 0+ 0+ 0+ 001 012 054 142 240 236 085 017 0+ 9
10 0+ 0+ 0+ 0+ 0+ 002 016 064 168 283 230 099 006 10
11 0+ 0+ 0+ 0+ 0+ 0+ 003 017 071 206 377 341 107 11
12 0+ 0+ 0+ 0+ 0+ 0+ 0+ 002 014 069 282 540 886 12
99
PROBABILIDADES BINOMIAIS
p
n x .01 .05 .10 .20 .30 .40 .50 .60 .70 .80 .90 .95 .99 x
13 0 878 513 254 055 010 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
1 115 351 367 179 054 011 002 0+ 0+ 0+ 0+ 0+ 0+ 1
2 007 111 245 268 139 045 010 001 0+ 0+ 0+ 0+ 0+ 2
3 0+ 021 100 246 218 111 035 006 001 0+ 0+ 0+ 0+ 3
4 0+ 003 028 154 234 184 087 024 003 0+ 0+ 0+ 0+ 4
5 0+ 0+ 006 069 180 221 157 066 014 001 0+ 0+ 0+ 5
6 0+ 0+ 001 023 103 197 209 131 044 006 0+ 0+ 0+ 6
7 0+ 0+ 0+ 006 044 131 209 197 103 023 001 0+ 0+ 7
8 0+ 0+ 0+ 001 014 066 157 221 180 069 006 0+ 0+ 8
9 0+ 0+ 0+ 0+ 003 024 087 184 234 154 028 003 0+ 9
10 0+ 0+ 0+ 0+ 001 006 035 111 218 246 100 021 0+ 10
11 0+ 0+ 0+ 0+ 0+ 001 010 045 139 268 245 111 007 11
12 0+ 0+ 0+ 0+ 0+ 0+ 002 011 054 179 367 351 115 12
13 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 010 055 254 513 878 13
14 0 869 488 229 044 007 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
1 123 359 356 154 041 007 001 0+ 0+ 0+ 0+ 0+ 0+ 1
2 008 123 257 250 113 032 006 001 0+ 0+ 0+ 0+ 0+ 2
3 0+ 026 114 250 194 085 022 003 0+ 0+ 0+ 0+ 0+ 3
4 0+ 004 035 172 229 155 061 014 001 0+ 0+ 0+ 0+ 4
5 0+ 0+ 008 086 196 207 122 041 007 0+ 0+ 0+ 0+ 5
6 0+ 0+ 001 032 126 207 183 092 023 002 0+ 0+ 0+ 6
7 0+ 0+ 0+ 009 062 157 209 157 062 009 0+ 0+ 0+ 7
8 0+ 0+ 0+ 002 023 092 183 207 126 032 001 0+ 0+ 8
9 0+ 0+ 0+ 0+ 007 041 122 207 196 086 008 0+ 0+ 9
10 0+ 0+ 0+ 0+ 001 014 061 155 229 172 035 004 0+ 10
11 0+ 0+ 0+ 0+ 0+ 003 022 085 194 250 114 026 0+ 11
12 0+ 0+ 0+ 0+ 0+ 001 006 032 113 250 257 123 008 12
13 0+ 0+ 0+ 0+ 0+ 0+ 001 007 041 154 356 359 123 13
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 007 044 229 488 869 14
15 0 860 463 206 035 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
1 130 366 343 132 031 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 1
2 009 135 267 231 092 022 003 0+ 0+ 0+ 0+ 0+ 0+ 2
3 0+ 031 129 250 170 063 014 002 0+ 0+ 0+ 0+ 0+ 3
4 0+ 005 043 188 219 127 042 007 001 0+ 0+ 0+ 0+ 4
5 0+ 001 010 103 206 186 092 024 003 0+ 0+ 0+ 0+ 5
6 0+ 0+ 002 043 147 207 153 061 012 001 0+ 0+ 0+ 6
7 0+ 0+ 0+ 014 081 177 196 118 035 003 0+ 0+ 0+ 7
8 0+ 0+ 0+ 003 035 118 196 177 081 014 0+ 0+ 0+ 8
9 0+ 0+ 0+ 001 012 061 153 207 147 043 002 0+ 0+ 9
10 0+ 0+ 0+ 0+ 003 024 092 186 206 103 010 001 0+ 10
11 0+ 0+ 0+ 0+ 001 007 042 127 219 188 043 005 0+ 11
12 0+ 0+ 0+ 0+ 0+ 002 014 063 170 250 129 031 0+ 12
13 0+ 0+ 0+ 0+ 0+ 0+ 003 022 092 231 267 135 009 13
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 031 132 343 366 130 14
15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 035 206 463 860 15
Notas:
1) Todos os valores da tabela são menores que 1. A vírgula foi suprimida para facilitar a leitura.
2) 0+ significa que se trata de um valor pequeno, porém não nulo.
100
Capítulo 6
Objetivos do Capítulo
101
Como vimos no início do capítulo anterior, existem dois tipos principais de variáveis
aleatórias, discreta e contínua. Uma variável aleatória discreta é uma variável aleatória cujos
possíveis valores formam um conjunto discreto de dados, usualmente um conjunto de números
inteiros. Freqüentemente, uma variável aleatória discreta se relaciona com uma contagem de
alguma coisa, como por exemplo, o número de pessoas em uma família ou o número de carros
possuídos por uma família. Por outro lado, uma variável aleatória contínua é uma variável
aleatória cujos possíveis valores formam um conjunto contínuo de dados. Usualmente um
intervalo de números reais. Tipicamente, uma variável aleatória contínua envolve uma medição
de alguma coisa, como por exemplo, o peso de uma criança recém-nascida. A seguinte definição
caracteriza o conceito de variável aleatória contínua.
102
seja a proporção do lago cuja profundidade (arredondada ao inteiro mais próximo) é k, então a
soma das áreas de todos os retângulos é 1. Um possível histograma aparece na figura 6.1a.
P (a ≤ x ≤ b) = ∫ f ( x)dx
a
Isto é, a probabilidade de que x assuma um valor no intervalo [a , b] é a área sob o
gráfico de f(x).
Para que uma função f(x) seja uma função distribuição de probabilidade, ela deve
satisfazer duas condições:
103
F(x)
Área total =1
Área entre a e b
x
a b
Notas:
1) Especificação de um Modelo de Probabilidade - Um modelo de probabilidade para uma
função aleatória contínua é especificado dando a forma matemática da função distribuição de
probabilidades. Se dispusermos de uma amostra com um número grande de observações,
podemos ajustar uma curva (com sua equação matemática) passando pelos pontos superiores
dos retângulos que compõem o histograma de freqüências relativas. Ou ainda, na ausência de
um grande volume de dados podemos assumir um modelo razoável baseado em uma fonte
similar de dados, ou seja, em uma situação similar àquela em questão.
2) Características de uma distribuição contínua - Uma curva, definindo uma função distribuição
de probabilidades, pode ter uma grande variedade de formas. Algumas delas são mostradas
nos esquemas abaixo.
104
1/(B-A) , A≤x≤B
f(x; A, B) =
0, caso contrário
Suponha que uma pessoa tome um ônibus para ir ao trabalho e que a cada 5 minutos um
ônibus passe pelo ponto. Assumindo que a pessoa deixe a casa de uma maneira aleatória, ela não
chega sempre no ponto no mesmo horário. Assim, o tempo de espera para o próximo ônibus é
uma variável contínua com valores no intervalo [0 ; 5].
a) Verificar se a função dada abaixo pode ser uma função distribuição de probabilidade para a
variável x.
1/5 , 0≤x≤5
f(x) =
0, caso contrário
Solução:
a) De acordo com o fato importante 6.1, f(x) deve ser positiva ou nula para qualquer valor da
variável x. De fato, f(x) = 1/5 para todo x pertencente ao intervalo [0 ; 5] e é igual a zero para
qualquer outro valor de x. Portanto, f(x) satisfaz a primeira condição. A segunda condição
exige que a área sob o gráfico de f(x) seja igual a 1. Podemos verificar isto calculando a
integral de f(x) e verificar se obtemos 1.
+∞ 51 1 5
∫ f ( x)dx = ∫ 5 dx = 5 x =1
−∞ 0 0
De fato, a segunda condição também está satisfeita e a função f(x) é uma função
distribuição de probabilidade. Outra maneira de verificar a segunda condição é observar o
gráfico de f(x) abaixo, e verificar que a área sob a curva é dada pelo produto 5 . (1/5) que é igual
a 1.
105
f(x)
1/5
x
0 5
3 3 3
P(1 ≤ x ≤ 3) = ∫ f ( x)dx = ∫ 1 dx = 1 x = 2
1 15 5 1 5
que é o mesmo valor dado pelo cálculo da integral da função entre os pontos 1 e 3.
f(x)
Área = P(1≤ x ≤ 3)
1/5
x
0 1 3 5
106
Se x é uma variável aleatória contínua, então para qualquer número c, P(x=c) = 0. Além
disso, para quaisquer dois números a e b , com a < b,
1) Qual das funções abaixo poderia ser uma função distribuição de probabilidades para uma
variável aleatória contínua? Justifique cada caso.
0 1 2 0 1 2 0 1 2
f(x) f(x)
1 .5
0 1 2 0 1 2 3 4
(d) (e)
107
Uma variável aleatória contínua x tem uma distribuição normal com parâmetros µ e σ,
com -∝ < µ < ∝, e 0 < σ, se a função distribuição de probabilidade de x for dada por
− ( x−µ ) 2
1
f ( x; µ , σ ) = e 2σ -∝ < x < ∝,
2
σ 2π
É óbvio que f(x; µ, σ) ≥ 0 para qualquer número x, mas técnicas de cálculo integral
devem ser usadas para mostrar que
+∞
∫ f (x; µ , σ )dx = 1
−∞
108
Quando uma variável aleatória x tem uma distribuição normal de probabilidade com
parâmetros µ e σ, para calcularmos a probabilidade de x estar entre dois valores a e b, isto é para
calcularmos o valor de P(a ≤ x ≤ b), nós precisamos calcular
− ( x−µ ) 2
b
1
∫ e 2σ dx
2
a σ 2π
Nenhuma das técnicas comuns de integração pode ser usada para avaliar a expressão
acima. Por outro lado, para µ=0 e σ=1, a expressão acima já foi extensamente avaliada e
tabulada para certos valores de a e b. Usando esta tabela, podemos computar probabilidades
também para outros valores de µ e σ.
109
1 −2z
2
A figura 6.7 ilustra uma distribuição normal padrão. A área total sob a curva é igual a 1.
Os números decimais que aparecem entre dois valores consecutivos de z indicam o valor da área
sob a curva compreendida entre estes dois valores. Por exemplo, o valor da área sob a curva
entre os pontos z=0 e z=1 é 0,3413. Podemos observar que, aproximadamente 68% da área está
compreendida entre +1 e -1, aproximadamente 95% da área está entre +2 e –2 e 99,7% está entre
+3 e –3. Este é um fato importante que será mais tarde novamente discutido.
Por causa da importância das áreas sob a curva normal padrão, tabelas dessas áreas foram
construídas. A tabela 6.1 da página seguinte é uma dessas tabelas. Os valores no corpo da tabela,
com quatro casas decimais, representam a área sob a curva entre 0 e um valor especificado de z.
O exemplo 6.3 mostra como usar a tabela 6.1.
Solução:
Primeiro encontramos na coluna esquerda o valor z = 1,8. Depois nos deslocamos nessa
linha até encontrarmos o valor 0,03 na linha superior. O número no corpo da tabela, que é
0,4664, é a área sob a curva normal entre z = 0 e z = 1,83, conforme mostra a figura 6.8.
Z=1,83
Solução:
Primeiramente encontramos a área entre z = 0 e z = 1,45. Como no exemplo anterior,
percorremos a coluna z até encontrarmos o valor 1,4 e, em seguida, percorremos essa linha até
estarmos na coluna correspondente ao valor 0,05 da primeira linha. Neste ponto determinamos o
valor 0,4265 que é a área entre z = 0 e z = 1,45. Por simetria da curva, 0,4265 é também a área
entre z = -1,45 e z = 0. Veja figura 6.9.
111
112
Z = 1,45 Z = -1,45
Solução:
Uma vez que a área total sob a curva é 1 (propriedade 1) e a curva é simétrica com
relação a 0(Propriedade 3), segue que a área sob a curva normal à direita de z = 0 é 0,5. Da
tabela 6.1 vemos que a área entre z = 0 e z = 1,25 é igual a 0,3944. Uma vez que a área total à
direita de z = 0 é 0,5 então a área à direita de z = 1,25 vale
113
Exemplo 6.6 – Ilustra como encontrar a área entre dois valores positivos de z
Solução:
Pela tabela 6.1, a área entre z = 0 e z = 0,46 é 0,1772 e a área entre z = 0 e z = 1,75 é
0,4599(ver figura 6.11). Dessa forma, a área entre z = 0,46 e z = 1,75 é igual à diferença entre as
duas áreas anteriores, isto é
Solução:
Primeiro determinamos a área entre z = 0 e z = 1,96. Da tabela 6.1, a área é igual a
0,4750(ver figura 6.12). Uma vez que a área à esquerda de z = 0 vale 0,5(porque?) nós
concluímos que a área à esquerda de z = 1,96 vale
114
Exemplo 6.8 – Ilustra como determinar o valor de z para uma dada área
Determine o valor de z para o qual a área sob a curva normal padrão, à direita daquele
valor, seja igual a 0,025(veja figura 6.13)
Solução:
Para achar o valor de z, primeiro determinamos a área entre z = 0 e o z procurado,
lembrando que a área à direita de z = 0 vale 0,5. Por esse caminho encontramos que essa área é
dada por 0,500 – 0,025 = 0,475, como mostrado na figura 6.14.
115
Agora, basta usarmos a tabela 6.1 para obtermos o valor de z correspondente à área de
0,475. Pesquisando os valores internos da tabela, encontramos que o valor requerido de z é 1,96,
como mostra a figura 6.15.
Adotaremos a notação z0,025 para indicar o valor de z com área de 0,025 à sua direita, sob
a curva normal padrão. Assim, pelo exemplo anterior, podemos escrever z0,025 = 1,96. Esta
notação é melhor definida como segue.
Definição 6.6
O símbolo zα será usado para indicar o valor de z com área α à sua direita, sob a curva
normal padrão, como mostrado na figura 6.16.
116
Solução:
a) O valor da área entre z = 0 e z0,10 é 0,5 – 0,10 = 0,40. Pela tabela, o valor mais próximo
desta área é definido pelo valor z = 1,28. Logo, z0,10 = 1,28.
b) De forma análoga, o valor da área entre z = 0 e z0,05 é 0,5 – 0,05 = 0,45 e, pela tabela 6.1, z
deve valer 1,645(interpolação entre 1,64 e 1,65). Assim, z0,05 = 1,645.
117
5) Use a tabela 6.1 para encontrar as áreas indicadas sob a curva padrão normal abaixo.
118
Na seção anterior aprendemos como encontrar áreas sob a curva normal padrão. Com este
conhecimento podemos obter áreas sob qualquer curva normal, como será visto nesta seção.
Embora não seja necessário desenhar uma curva normal exata, é bastante útil ser capaz de
esboçá-la rapidamente. Usando a propriedade P3 e a propriedade P4 torna-se fácil fazer um
esboço de uma curva normal. O exemplo seguinte ilustra o procedimento.
Solução:
Pela propriedade P3, a curva normal com parâmetros µ = 5 e σ = 2 é simétrica com
relação à média µ = 5. Ainda, pela propriedade P4, a maior parte da área se encontra entre
µ - 3σ = 5 – 3.2 = -1 e µ + 3σ = 5 + 3.2 = 11
A curva normal pode ser esboçada centrada em µ = 5 e se aproximando do eixo x nos pontos –1
e 11, como mostra a figura abaixo.
119
Já aprendemos como determinar a área sob a curva normal padrão. O próximo passo é
aprender como encontrar a área sob uma curva normal qualquer. A idéia básica é relacionar uma
dada curva normal com a curva normal padrão.
Exemplo 6.11 – Ilustra como encontrar a área sob uma curva normal
Solução:
a) Primeiro devemos esboçar a curva normal com parâmetros µ = 5 e σ = 2 e sombrear a área à
direita de 7. Isto pode ser visto na figura 6.18.
Pode ser matematicamente demonstrado que a área sob a curva normal com parâmetros
µ= 5 e σ = 2 que fica à direita de x = 7 é igual à área sob a curva normal padrão que fica à direita
de
x−µ 7−5
z= = =1
σ 2
Esta última área está mostrada na figura 6.19 abaixo. Em outras palavras, as áreas
sombreadas nas figuras 6.18 e 6.19 são iguais. Pela tabela 6.1, a área sombreada na figura 6.19
vale 0,5000 – 0,3413 = 0,1587. Dessa forma, a área da figura 6.18 vale também 0,1587, ou seja,
a área sob a curva normal com parâmetros µ = 5 e σ = 2 que fica à direita de 7 é igual a 0,1587.
120
b) agora queremos determinar a área sob a curva normal com parâmetros µ = 5 e σ = 2 que fica
entre 3 e 8(veja figura 6.20)
Figura 6.20 - Curva normal com parâmetros µ = 5 e σ = 2, com área entre 3 e 8 sombreada.
Nós obtemos a área desejada da seguinte maneira: a área sob a curva normal com
parâmetros µ = 5 e σ = 2, que fica entre 3 e 8 é igual à área sob a curva normal padrão que fica
entre
x−µ 3−5
z= = = −1
σ 2
e
x−µ 8−5
z= = = 1,5
σ 2
Esta última área é mostrada na figura 6.21.
121
Figura 6.21 – Curva normal padrão com área entre –1 e 1,5 sombreada.
Pela tabela 6.1, a área sombreada na figura 6.21 é igual a 0,3413 + 0,4332 = 0,7745.
Consequentemente, a área sob a curva normal com parâmetros µ = 5 e σ = 2 que fica entre 3 e 8
é também igual a 0,7745.
O exemplo anterior permite sumarizar o fato fundamental que nos permite determinar
áreas sob qualquer curva normal, através do uso da tabela 6.1, que nos dá os valores das áreas
sob a curva normal padrão.
A área sob a curva normal com parâmetros µ e σ que fica entre x = a e x = b é igual à
área sob a curva normal padrão que fica entre
a−µ b−µ
z= e z=
σ σ
Veja a figura 6.22. A área sob a curva normal com parâmetros µ e σ que fica à direita
(ou esquerda) de um dado valor x é encontrada de uma maneira similar, ou seja, primeiro
determinando o valor de z equivalente e então usando a tabela 6.1 para encontrar a área sob a
curva normal padrão que fica à direita (ou esquerda) do valor de z.
122
Procedimento 6.1 – Determinando áreas sob uma curva normal com parâmetros µ e σ
Determine a área sob a curva normal com parâmetros µ=100 e σ = 16 que se encontra à
direita de 120.
Solução:
123
120 − 100
x = 120 → z = = 1,25 0.3944
16
124
3) Determine a área sob a curva normal com parâmetros µ= 1 e σ = 2,5 que fica
a) à direita de 0
b) à esquerda de –1,5
c) entre –2 e 2
125
Muitas populações têm distribuições que podem ser representadas por curvas normais.
Isto significa que porcentagens para estas populações são iguais, aproximadamente, à áreas sob
uma curva normal adequada. O exemplo seguinte irá tornar esta idéia mais clara.
Uma universidade tem um total de 3264 estudantes do sexo feminino. Dados mostram
que a altura média da população destas estudantes é 64,4 polegadas, com desvio padrão de 2,4
polegadas, isto é, µ = 64,4 in e σ = 2,4 in.
Um histograma das freqüências relativas das alturas das estudantes é mostrado na figura
6.24.
126
Freqüência relativa
Altura
Figura 6.24 – Histograma de freqüências relativas das alturas.
Note que o histograma da figura 6.24 tem a forma de um sino. Por causa disso, nós
podemos aproximar porcentagens(freqüências relativas, probabilidades) para a população das
alturas pelas áreas sob a curva normal adequada. Naturalmente, a curva normal apropriada é
aquela com parâmetros µ = 64,4 e σ = 2,4.
Observe agora que a área sob a curva normal entre 67 e 68 é aproximadamente igual à
área do retângulo, o que significa que o valor da área sob a curva normal é próximo do valor
0,0735 relativo à porcentagem das estudantes com altura entre 67 e 68 in. Consequentemente,
nós podemos aproximar a porcentagem das estudantes com alturas entre 67 e 68 in pela área
sob a curva normal entre 67 e 68.
127
Freqüência relativa
Altura
É interessante efetuar o cálculo da área sob a curva normal com parâmetros µ=64,4 e
σ=2,4 para verificarmos a aproximação com o valor real de 0,0735. Este cálculo é mostrado a
seguir com o auxílio da figura 6.26.
128
Observemos que o valor 0,0733 é uma excelente aproximação do valor exato 0,0735. O
ponto importante aqui é que para certas populações, as porcentagens são aproximadamente
iguais a áreas sob uma curva normal adequada. Nem todas as populações tem esta propriedade
mas, se a população tiver, então nós dizemos que ela é normalmente distribuída.
Solução: Uma vez que os pesos dos cérebros são normalmente distribuídos, as porcentagens são
iguais às áreas sob uma curva normal adequada. Esta curva normal tem, naturalmente,
parâmetros µ=1,4 e σ=0,11.
a) Para determinar a porcentagem de pessoas do sexo masculino possuindo cérebros pesando
entre 1,50 e 1,70 basta determinar a área sob a curva normal com parâmetros µ=1,4 e
σ=0,11. A figura 6.27 mostra a curva normal e a área a ser determinada.
129
O cálculo mostra que apenas 17,82% dos suecos do sexo masculino tem peso do cérebro
entre 1,50 e 1,70 Kg.
b) Para obter a porcentagem pedida basta achar a área sob a curva normal mostrada na figura
6.28. Neste caso, o cálculo abaixo mostra que 3,44% dos suecos do sexo masculino tem peso
do cérebro menor que 1,20 Kg.
130
Solução:
Seja x o conteúdo de uma lata aleatoriamente selecionada. De acordo com os dados
acima, x é uma variável aleatória com média µx = 356 ml e desvio padrão σx = 1,63 ml. Desta
forma, as probabilidades para x são iguais às áreas sob a curva normal com parâmetros µx = 356
e σx = 1,63.
131
Assim, P(x < 354) = 0,1093. Existe uma chance de aproximadamente 11% de que uma
lata selecionada aleatoriamente conterá menos que o conteúdo anunciado de 354 ml.
2) O tempo requerido para uma orquestra sinfônica tocar a Nona Sinfonia de Beethoven tem
uma distribuição normal com média de 64,3 min e um desvio padrão de 1,15 min. Na
próxima vez em que for tocada, qual é a probabilidade de que a duração esteja entre 62.5 e
67.7 minutos?
132
Capítulo 7
Objetivos do Capítulo
Este capítulo inicia o estudo de estatística inferencial. Aqui examinaremos métodos para
estimar a média de uma população. Como a estimativa está sujeita a um erro, necessitamos
fornecer informações sobre a acuracidade da estimativa. Isto nos leva ao conceito de
intervalos de confiança, que é o tópico principal deste capítulo. Após o término deste
capítulo, você deverá ser capaz de:
133
7.1 Populações
Como já visto no capítulo 2, uma população inclui todas as possíveis observações que
possam ser feitas sobre uma característica específica, tal como altura de estudantes de uma
universidade ou pressão sanguínea de trabalhadores da construção civil do estado de São Paulo e
assim por diante. No mundo real da pesquisa, uma população é usualmente constituída por um
grupo que é muito grande para permitir uma observação ou medida direta em cada indivíduo.
No exemplo acima dos trabalhadores da construção civil, é obvio que não temos
condições de conhecer a pressão sanguínea exata de cada trabalhador por causa do elevado
número de pessoas trabalhando nesta área. O melhor que nós podemos fazer é estimar a pressão
média sanguínea dos trabalhadores.
Felizmente, existem métodos estatísticos que nos permite fazer afirmações limitadas
porem úteis, sobre uma população a partir de dados derivados de uma porção relativamente
pequena da população em estudo. Esta pequena porção é denominada amostra.
Para que uma amostra possa produzir informações confiáveis sobre uma população da
qual ela é retirada, ela deve representar uma espécie de seção transversal daquela população. Isto
é, a amostra deve ser representativa daquela população.
Suponha, por exemplo, que nós estivéssemos interessados em conhecer a renda média de
pais de alunos cursando o segundo grau. Assuma que os dados coletados fossem relativos a uma
amostra de 500 alunos cursando escolas públicas. Obviamente, esta amostra não é representativa
da população em estudo, pois sabemos que alunos da rede privada de ensino provêm de famílias
com maior poder aquisitivo. Dessa forma, a média calculada com a amostra de 500 alunos não
seria confiável e, neste caso, a amostra é dita tendenciosa.
Logicamente, nós nunca estaremos seguros de que uma amostra retirada de uma
população seja realmente representativa daquela população. Para estar seguro disso, seria
necessário que nós conhecêssemos a natureza exata da população, o que significa que nós não
teríamos um problema para lidar. Na prática, podemos aumentar a probabilidade de obtermos
uma amostra não tendenciosa pela forma que nós a selecionamos.
Embora haja diversos procedimentos para se obter amostras não tendenciosas, para os
nossos propósitos neste estudo introdutório de estatística, consideraremos somente o
procedimento denominado amostragem aleatória simples, ou simplesmente, amostragem
aleatória.
134
Para ilustrar a definição, tomemos um simples exemplo. Suponha que nós desejamos
obter uma amostra aleatória de 10 pessoas de um grupo de 100 pessoas. Se nós colocarmos o
nome de cada pessoa em um pedaço de papel, colocarmos todos os papéis em uma urna e,
depois, solicitarmos a uma pessoa, com os olhos vendados, que ela retire 10 pedaços de papel da
urna, então teremos obtido uma amostra aleatória. Note que cada pessoa teve igual chance de ser
escolhida.
Valores tais como médias, variâncias e desvios padrões que sejam derivados de amostras
são denominados estatísticas da amostra. Valores da população são, por outro lado,
denominados parâmetros. Dessa forma, em inferência estatística nós retiramos amostras da
população, computamos as estatísticas da amostra e, então, as usamos para estimar os parâmetros
desconhecidos da população.
Suponha que sejam retiradas aleatoriamente (de uma dada população) todas as possíveis
amostras, cada uma de tamanho n. Se calcularmos a média de cada amostra e, depois
calcularmos a média das médias das amostras, esta será igual à média da população µ. Realmente
nós não necessitamos retirar todas as possíveis amostras para verificar que a média das médias
das amostras se aproxima da média µ da população de onde as amostras foram retiradas. A
tabela 7.1 mostra os resultados de uma simulação por computador onde somente 1000 amostras
(cada uma com n=30) foram retiradas de uma população. Podemos observar que a média da
população de onde as amostras foram retiradas é 67,48 e a média das 1000 médias das amostras
se aproxima fortemente de µ, embora 1000 amostras ainda estejam longe de se aproximar de
“todas as amostras possíveis”.
135
Tabela 7.1 – Resultados de seleção aleatória de 1000 amostras retiradas de uma população.
Valores da população
Média → µ= 67,48
Variância → σ2 = 59,77
Desvio padrão → σ = 7,73
Amostra
Número de amostras → t = 1000
Tamanho de cada amostra → n = 30
Média → x = 67,38
Variância da população
∑ (x − µ )
2
σ 2
=
n
A figura 7.1 mostra a distribuição de uma população com média µ e desvio padrão σ.
Suponha agora que selecionemos, aleatoriamente, todas as possíveis amostras (todas do mesmo
tamanho) desta população. Vamos ainda supor que, para cada amostra, seja calculada a média da
amostra. A distribuição das médias de todas as possíveis amostras é denominada distribuição da
amostragem. Assumindo que o tamanho da amostra seja ≥ 30, e analisando os valores obtidos
para as médias concluiríamos que as médias das amostras seriam normalmente distribuídas,
como mostrado na figura 7.1. Antes de prosseguirmos com a distribuição de amostragens, nós
necessitamos entender um importante conceito conhecido como Teorema do Limite Central
(TLC), que pode ser enunciado como:
136
Figura 7.1 – Uma população normalmente distribuída (acima) e a distribuição das médias das
amostras retiradas da população (abaixo).
Note que se os dados da população não forem normalmente distribuídos, então o teorema
do limite central é verdadeiro somente quando n é grande, isto é, quando n ≥ 30. A figura 7.2
ilustra este fato. Em (a), tem-se uma população normalmente distribuída e mesmo para pequenos
tamanhos de amostra a distribuição das médias também é normal. Nos casos (b) e (c) tem-se
duas populações com distribuições não normais. Nestes dois casos, para amostras pequenas, a
distribuição das médias não é normal (veja n=2). Porém, à medida que o tamanho da amostra
cresce, a distribuição das médias se aproxima de uma distribuição normal (veja n=10 e n=30).
Lembre-se, entretanto, que n ≥ 30 não é uma regra rígida. O teorema não deixa de ser
válido se n for 29, 28, etc., contanto que n não se torne muito pequeno. Uma demonstração do
teorema foge do escopo deste curso introdutório de estatística.
137
Erro da amostragem
Na seção anterior vimos que a média de todas as médias das amostras possíveis de serem
retiradas da população será igual a µ. Assim, segue-se que a média da população e a média da
distribuição das médias das amostras retiradas daquela população são iguais – isto é µ. Por isso,
o símbolo µ pode se referir à média da população ou à média da distribuição baseada em todas as
amostras retiradas daquela população.
Nós sabemos, entretanto, que não é suficiente descrever uma distribuição em termos da
média somente. Nós também necessitamos conhecer (ou ser capaz de estimar) o grau de
dispersão das médias das amostras em torno de µ. Em outras palavras, se desejamos trabalhar
com a distribuição das médias das amostras, nós devemos nos preocupar com ambos, a média e o
desvio padrão da distribuição.
138
Se retirássemos todas as possíveis amostras de uma dada população com média µ, então
cada vez que nós retirássemos uma amostra, seria duvidoso que a média da amostra x fosse
igual a µ. Uma dada amostra teria uma média que provavelmente se desviaria de µ de um certo
valor, por puro acaso. Algumas médias se desviariam mais, enquanto que outras se desviariam
menos. Este possível desvio de uma dada média de uma amostra do valor real µ é
freqüentemente denominado erro da amostragem. Isto não significa que um engano foi
cometido. É simplesmente um fato da estatística que, por acaso apenas, nós podemos retirar uma
amostra cuja média difere, em uma certa extensão, da média real µ.
Conseqüentemente nós podemos esperar que todas as possíveis médias das amostras
retiradas da população sejam distribuídas com uma certa variância denominada variância das
médias e indicada por :
σ2 _
x
σ2
σ = 2
_
x n
onde o numerador, é a variância da população da qual as amostras foram hipoteticamente
retiradas, e n é o tamanho da amostra.
Efeitos de n e de σ2
139
A figura 7.3 mostra como a forma da distribuição das médias difere daquela da
população. A figura 7.3a representa a população com uma certa média µ e uma variância σ2 =
120. A figura 7.3b mostra a forma de uma distribuição de amostragem baseada em todas as
possíveis amostras de tamanho n = 30, retiradas da população. A distribuição da amostragem é
muito mais fechada do que a da população porque a variação das médias das amostras em torno
de µ é menor que aquela da população. O valor da variância das médias pode ser calculado pela
fórmula dada.
σ2 120
σ =2
_ = =4
x n 30
Mais uma vez, é aparente pela fórmula que a variância da distribuição da amostragem
diminui à medida que o tamanho da amostra aumenta (assumindo que σ2 permanece constante).
A figura 7.4 abaixo ilustra este fato.
σ
σ =
_
x n
Uma vez que o desvio padrão de uma distribuição de amostragens de médias descreve a
extensão com que a média de uma dada amostra pode se desviar de µ, ele é mais comumente
chamado erro padrão da média.
Definição 7.2
A fórmula acima do erro padrão das médias assume que nós conhecemos o valor do
desvio padrão da população (σ). Na maioria das situações, entretanto, nós não conhecemos σ e
necessitamos substituir σ por s, usando s como uma estimativa (ou estimador) de σ. Neste caso,
devemos deixar claro que estamos usando uma estimativa de σ e não o valor de σ. Para isso,
basta reescrevermos a fórmula de cálculo do desvio padrão como sendo:
s
s_ =
x n
Note que esta fórmula para o desvio padrão é a mesma, exceto que nós estamos indicando
que não conhecemos o valor real de σ e estamos usando uma estimativa s de uma amostra
retirada da população.
1) Suponha que retiremos uma amostra n=36 de uma população. A amostra produz uma
variância de s2 = 49. Calcule uma estimativa do desvio padrão real da distribuição da
amostragem.
3) Uma amostra contendo n=30 elementos é retirada de uma população e outra com n=200 é
retirada da mesma população. Assumindo que os desvios padrões das amostras sejam
similares em valores, como se espera que a forma das duas distribuições de amostragens
difira entre si?
141
Como discutido no item anterior, não é razoável esperar que a média de uma amostra seja
exatamente igual à média da população µ; algum erro deve ser esperado, Assim, além de
calcularmos uma estimativa de µ, nós necessitamos fornecer informações que indiquem a
precisão da estimativa. Isto pode ser feito definindo um intervalo de confiança para µ. Usando a
média da amostra coletada podemos construir um intervalo de números e afirmar com que
confiança a média da população µ estará dentro deste intervalo. Este conceito pode ser resumido
como mostrado abaixo.
σ
µ =µ
_ e σ =
_
x x n
Isto implica que a variável z, definida como
_
x− µ
z=
σ n
tem uma distribuição normal, resultado da normalização da variável x. Já havíamos visto que
uma área de 0,95 sob a curva normal padrão corresponde à área entre os valores z = -1,96 e z =
1,96 e nos permite escrever a expressão abaixo.
_
x−µ
P − 1,96 ≤ ≤ 1,96 = 0,95
σ n
σ _
σ
− 1,96 ⋅ ≤ x − µ ≤ 1,96 ⋅ (após multiplicar os 3 membros por σ n)
n n
_
σ _
σ _
− x − 1,96 ⋅ ≤ − µ ≤ − x + 1,96 ⋅ (após subtrair x de cada termo)
n n
_
σ _
σ
x − 1,96 ⋅ ≤ µ ≤ x + 1,96 ⋅ (após multiplicar tudo por − 1)
n n
_ σ _
σ
P x − 1,96 ⋅ ≤ µ ≤ x + 1,96 ⋅ = 0,95
n n
A expressão entre parênteses pode ser interpretada como definindo um intervalo aleatório
com limites:
_
limite inferior = x − 1,96 σ n e
_
limite superior = x + 1,96 σ n
Usando a notação de intervalos, esse intervalo aleatório poderia ser indicado como
_ _
x − 1,96 σ n , x + 1,96σ n
σ
2 ⋅ 1,96 ⋅
n
mostrando que somente a localização do intervalo é aleatória. O intervalo acima indica que a
existe uma probabilidade de 0,95 de que o intervalo aleatório assim calculado inclua o
verdadeiro valor da média µ.
143
Suponha que uma amostra aleatória de 40 novas casas populares resulte na tabela de
preços abaixo. Determine um intervalo de confiança com nível de confiança de 95,44% para o
preço médio µ de todas as novas casas populares. Assuma que o desvio padrão da população dos
preços seja igual a σ= R$7.200,00 Reais. (Nota: Este valor do desvio padrão pode ser conhecido de estudos
anteriores. O caso mais usual onde o desvio padrão é desconhecido será considerado mais adiante neste capítulo)
Solução:
Podemos estimar a média da população, isto é, o preço médio µ, através da média dos 40
preços coletados na amostra. Assim, o valor médio da amostra será dado por
_
x=
∑ x = 972,2 = 24,31
n 40
Portanto, baseado nos dados da amostra, estimamos que o preço médio de todas as casas
novas é, aproximadamente, R$24.310,00. Se o desvio padrão dos preços de casas novas foi
fornecido como sendo igual a σ=R$7.200,00, então o desvio padrão da distribuição das amostras
de tamanho n=40 pode ser calculado por
σ 7200
σ =
_ = = 1140
x n 40
Figura 7.5 – Correspondência entre a distribuição normal das médias das amostras e a curva
normal padrão.
144
Queremos determinar os valores de x1 e x2 que definem uma área sob a curva normal
igual a 0,9544. Para tanto, identificamos na curva padrão à direita, os valores z1 e z2 de modo
que a área seja a mesma, como ilustrado na figura. Como o valor da área entre 0 e z2 é igual a
0,4722 (0,9544/2), pela tabela 6.1, do capítulo 6, o valor de z2 é 2. E, portanto, o valor de z1 é –2.
O cálculo de x1 e x2 pode ser feito como mostrado abaixo.
_
x1 − x _
z1 = ⇒ x1 = x + z1 ⋅ σ _ = 24310 + (− 2 ) ⋅ 1140 = 22030
σ _ x
x
_
x2 − x _
z2 = ⇒ x2 = x + z 2 ⋅ σ _ = 24310 + (2 ) ⋅ 1140 = 26590
σ _ x
x
_
σ 7200
_
σ 7200
x− 2 ⋅ = 26580 − 2 ⋅ = 24300 x+ 2 ⋅ = 26580 + 2 ⋅ = 28860
n 40 n 40
Isto significa que se para cada amostra fosse possível determinarmos um correspondente
intervalo de confiança com nível de confiança de 95,44%, da totalidade desses intervalos
poderíamos afirmar que 95,44% desses intervalos conteriam a média µ da população.
Passo 1 – Para um nível de confiança de 1-α, use a tabela 6.1 para encontrar zα/2.
Passo 2 – O intervalo de confiança para µ é de
_ _
s s
x − z α/2 ⋅ a x + z α/2 ⋅
n n
onde zα/2 é determinado no passo 1, e x e s são computados dos dados da amostra obtida.
145
Nota: No passo 2 do procedimento 7.1 nós usamos o desvio padrão da amostra, s, na fórmula do
intervalo de confiança. Teoricamente, deveríamos usar o desvio padrão da população σ.
Entretanto, raramente se conhece σ e assim temos de usar s no lugar de σ. Isto é aceitável porque
para amostras grandes (n ≥ 30), o desvio padrão da amostra s nos dá uma boa aproximação do
desvio padrão da população σ.
Solução:
Uma vez que o tamanho da amostra é 50, portanto maior que 30, podemos aplicar o
procedimento 7.1 para obter o intervalo de confiança.
Passo 1 – Para um nível de confiança 1-α, use a tabela 6.1 para obter zα/2.
_
s _
s
x − z α/2 ⋅ a x + z α/2 ⋅
n n
Para calcular x e s com os dados da tabela 7.3, aplicamos as fórmulas usuais:
_
x=
∑ x = 1819 = 36,38
n 50
146
s=
( )
n ∑ x 2 − (∑ x )
2
=
50(72179 ) − (1819 )
2
= 11,07
n(n − 1) 50(50 − 1)
11,07 11,07
36,38 − 1,645 ⋅ a 36,38 + 1,645 ⋅
50 50
Podemos ter uma confiança de 90% de que a média das idades, µ, de todos os
trabalhadores civis é um valor entre 33,8 e 39,0.
11,07 11,07
36,38 − 1,96 ⋅ a 36,38 + 1,96 ⋅
50 50
ou seja, de 33,3 a 39,4 anos. Para uma visão mais clara do que ocorre quando aumentamos o
nível de confiança, desenhamos os dois intervalos na figura 7.6.
33,8 39,0
33,3 39,4
Figura 7.6 – Intervalos de confiança de 90% e 95% para µ usando os dados da tabela 7.3.
147
Isto pode ser facilmente entendido através da figura 7.7. Esta figura se refere ao exemplo
7.2 e corresponde ao intervalo de confiança da média µ para um nível de confiança de 90%.
σ
zα / 2 ⋅
n
2,58 2,58
_
σ _
σ
x − zα / 2 ⋅ x + zα / 2 ⋅
n n
148
σ
E = zα / 2 ⋅
n
σ z ⋅σ
2
E = zα / 2 ⋅ ⇒ n = α /2
n E
Exemplo 7.3 –Ilustra a determinação do tamanho da amostra
Solução:
a) Para determinar o tamanho da amostra vamos empregar a fórmula acima. O máximo erro foi
especificado como E = 0,50. Como o nível de confiança desejado é de 0,95 concluímos que
α=0,05 e zα/2 = z0,025 = 1,96(tabela 6.1). Finalmente, como o valor de σ não foi dado,
usaremos uma estimativa de σ calculada com base na amostra selecionada. Este valor
calculado no exemplo 7.2 foi de s = 11,07. Com estes dados, o tamanho da amostra pode ser
calculado.
2 2
z ⋅s 1,96 ⋅ 11,07
n = α /2 = = 1883
E 0,5
149
36,52 a 37,52
2) Uma pesquisa deve ser conduzida no sentido de determinar a idade média de pessoas com
diabetes. Para isso, tomou-se uma amostra de 35 pessoas portadoras da doença e obteve-se a
tabela abaixo.
a) Determine um intervalo de confiança, com nível de confiança de 95%, para a média µ, da
população de idades de pessoas com diabetes.
b) Repita o item (a) para um nível de confiança de 99%.
c) Interprete os resultados obtidos em (a) e (b) em palavras. Qual intervalo de confiança é
maior?
48 41 57 83 41 55 59
61 38 48 79 75 77 7
54 23 47 56 79 68 61
64 45 53 82 68 38 70
10 60 83 76 21 65 47
z ⋅σ
2
n = α /2
E
se σ é desconhecido.
4) Assuma que em uma pesquisa foi determinado um intervalo de confiança de 90% para a
média µ, da população sob estudo. O intervalo resultante vai de 617,3 a 668,7.
a) Determine o máximo erro E da estimativa da média.
b) Explique o significado de E com relação à estimativa de µ.
c) Determine o tamanho necessário da amostra para ter o mesmo erro máximo da estimativa
como na parte (a) , mas com um nível de confiança de 95%.(Assuma que σ=247).
150
σ
µ =µ
_ e σ = _
x x n
_
x− µ
z=
σ
n
tem aproximadamente uma distribuição normal padrão, quando o tamanho da amostra é grande.
Entretanto, pode ocorrer que retirar uma amostra grande de uma população seja
inadequado, ou mesmo impossível. Por exemplo, testes de colisão com carros normalmente
resultam em perda do carro e, por isso, é mais adequado utilizar pequenas amostras. Existem
diversos métodos para obtermos um intervalo de confiança com base em pequenas amostras.
Veremos a seguir um desses métodos que pode ser aplicado quando a população em estudo for
normalmente distribuída. O método utiliza a distribuição t de Student proposta por W. S. Gosset
em 1908.
Distribuição t de Student
_
x− µ
s
n
Gosset mostrou que esta variável aleatória possui uma distribuição de probabilidades que
é muito próxima de uma curva normal para grandes valores de n (n ≥ 30 ) e que se afasta da
curva normal à medida que n se torna pequeno. Em outras palavras, existe uma curva t para cada
tamanho de amostra. Se o tamanho da amostra for n então a curva correspondente será
identificada como uma curva t com (n-1) graus de liberdade. Por simplicidade definiremos
graus de liberdade simplesmente como o número que identifica a curva t ou distribuição t
apropriada.
151
variáveis com distribuição t são iguais às áreas sob a curva t adequada. Os fatos discutidos até
aqui podem ser resumidos no quadro abaixo.
Assuma que uma amostra aleatória com n elementos X1, X2, ..., Xn seja retirada de
uma população normalmente distribuída com média µ resultando em uma média e um desvio
padrão dados por:
2
−
−
∑X ∑ X i − x
x= s2 =
i
e
n n −1
_
x− µ
Então, a distribuição da variável aleatória t=
s
n
é denominada distribuição t de Student com n-1 graus de liberdade. Assim, as probabilidades
para essa variável são iguais às áreas sob a curva t com GL = n-1.
F (0)
A distribuição t é dada por F (t ) = n
t2 2
1 +
n −1
onde F(0) é uma constante que depende de n, de modo que a área sob a curva seja igual a 1. A
figura 7.8 mostra duas curvas t e uma curva normal. Observemos que a curva com GL = 6 é mais
próxima da curva normal que a curva t com GL = 1. Para valores de n próximos de 30 a curva t
e a curva normal padrão praticamente coincidem.
152
A tabela 7.4 fornece os valores de t para cinco valores de áreas, definidas sob a curva, à
direita do valor t. Essas áreas são as mais comumente usadas em estatística para a determinação
de intervalos de confiança e, por isso, não há necessidade de apresentarmos tabelas completas
para cada grau de liberdade.
Exemplo 7.4 – Ilustra como encontrar o valor de t para uma dada área
Solução:
Determinar t0,05 significa determinar o valor de t de modo que a área à direita de t seja
igual a 0,05. Na tabela 7.4 procuramos na primeira coluna o valor 13 , uma vez que queremos
trabalhar com uma curva com 13 graus de liberdade. Agora, percorrendo a linha correspondente
ao valor 13, vamos até a coluna t0,05 onde encontramos o valor 1,771. A interpretação gráfica é
dada na figura 7.9.
153
_
x− µ
t=
s
n
tem uma distribuição t com n-1 graus de liberdade e que probabilidades para essa variável
aleatória podem ser determinadas com base nas áreas sob a curva t com GL = n-1. A
probabilidade de que t esteja entre dois valores -tα/2 e tα/2 é dada por
154
−
x− µ
P − tα / 2 < < tα / 2 = 1 − α
s
n
Com uma pequena manipulação algébrica, a expressão acima pode ser reescrita como
− s − s
P x − tα / 2 ⋅ < µ < x + tα / 2 ⋅ = 1−α
n n
Esta última expressão mostra que o intervalo com extremos
− s − s
x − tα / 2 ⋅ e x + tα / 2 ⋅
n n
será o intervalo de confiança para a média com nível de confiança (1-α). Para facilitar e
sistematizar o cálculo, colocamos o procedimento 7.2 abaixo.
Passo 1 – Para um nível de confiança de 1-α, use a tabela 7.4 para encontrar tα/2 com
GL=n-1, onde n é o tamanho da amostra.
Passo 2 – O intervalo de confiança para µ é de
_ _
s s
x − tα/2 ⋅ a x + tα/2 ⋅
n n
onde tα/2 é determinado no passo 1, e x e s são computados dos dados da amostra obtida.
Um estudo sobre cães domésticos mostra que os períodos de gestação são normalmente
distribuídos. Para estimar o período médio de gestação, 15 cadelas foram selecionadas
aleatoriamente e seus períodos observados. Os resultados estão na tabela dada abaixo.
155
Solução:
−
x=
∑ x = 910,3 = 60,69
n 15
e
s=
( )
n ∑ x 2 − (∑ x )
2
= 0,81 = 0,90
n(n − 1)
Passo 1 – Para um nível de confiança de 1-α, use a tabela 7.4 para encontrar tα/2 com
GL=n-1, onde n é o tamanho da amostra.
Para um nível de confiança de 0,95 temos um valor de α igual a 0,05 e, portanto α/2 =
0,025. Da tabela 7.4, com GL = 15-1 =14, obtemos t0,025 = 2,145.
0,90 0,90
60,69 − 2,145 ⋅ a 60,69 + 2,145 ⋅
15 15
ou
60,19 a 61,18
156
1) Uma marca de computadores de mão funciona com quatro pilhas AAA de 1,5V. Para
estimar a vida média das baterias, 50 computadores são testados. A vida média das
baterias para os 50 computadores foi determinada como sendo igual a 60,1 horas.
Assuma que o desvio padrão seja de 4,3 horas.
a) Obtenha um intervalo com 99% de confiança para a vida média das baterias, µ,
para esta marca de computador.
b) Interprete seu resultado da parte (a) em palavras.
2) Em uma fábrica de automóveis, 38 pessoas foram treinadas por duas semanas e então
testadas para verificar quanto tempo levavam para realizar uma particular operação de
montagem. A média e o desvio padrão dos tempos que eles levaram para realizar a tarefa
foram 68 e 12 segundos, respectivamente. Calcule um intervalo de confiança, com 95%
de nível de confiança, para a verdadeira média dos tempos para trabalhadores com duas
semanas de treinamento.
4) Para uma curva t com GL = 18, obtenha os seguintes valores de t e ilustre seus resultados
graficamente.
a) O valor de t com área 0,025 à sua direita.
b) t0,05.
c) O valor de t com área 0,10 à sua esquerda
d) Os dois valores de t que dividem a área sob a curva em uma área central de 0,99 e
duas áreas laterais de 0,05.
5) Uma nova liga foi desenvolvida para ser utilizada em veículos espaciais. Testes de
resistência foram feitos em 15 corpos de prova e a média e o desvio padrão das medidas
resultaram em 39,3 e 2,6, respectivamente.
a) Determine um intervalo com 95% de confiança para a resistência média à tração
da liga.
b) A média está incluída neste intervalo?
157
Capítulo 8
Objetivos do Capítulo
No capítulo anterior foi visto como estimar a média de uma população e como determinar um
intervalo de confiança para um valor do nível de confidência. Neste capítulo será visto como
essa média pode ser usada para se tirar conclusões sobre valores. Ao término deste capítulo,
você deverá ser capaz de:
159
O teste de hipótese pode ser empregado para se tomar decisões sobre o valor de um parâmetro de
uma população tal como a média ou uma proporção da população. Por exemplo, pode-se ter uma
situação onde um grupo de consumidores deseja saber se a vida de uma determinada marca de
lâmpada corresponde ao valor de 700 horas anunciado pelo fabricante ou se a idade média, µ,
dos estudantes que entraram em uma universidade pública diminuiu com relação ao valor µo de
10 anos atrás.
Um dos métodos usados para se tomar tais decisões é o método denominado teste de
hipótese. Uma hipótese é simplesmente uma afirmação de que alguma coisa é verdadeira. Por
exemplo, a afirmação “o conteúdo líquido de todas as latas de cerveja da marca Cristal sendo
envasilhadas difere do volume anunciado de 350 ml” é uma hipótese.
Hipótese nula: É a hipótese a ser testada. Usamos a notação Ho para indicar a hipótese nula.
Hipótese alternativa: É a hipótese a ser considerada como uma alternativa à hipótese nula.
Usamos a notação Ha para indicar a hipótese alternativa.
Por exemplo, no caso das latas de cerveja, a hipótese nula poderia ser “o conteúdo médio
de todas as latas de cerveja envasilhadas é igual ao conteúdo anunciado de 350 ml” e a hipótese
alternativa poderia ser “o conteúdo médio de todas as latas de cerveja envasilhadas difere do
conteúdo anunciado de 350 ml”. Isto seria indicado por:
Ho: µ = µo
A hipótese alternativa, por outro lado, deve refletir o propósito do teste de hipótese em
questão. Existem três possibilidades para a escolha da hipótese alternativa.
160
Uma vez definidas as duas hipóteses, a questão agora é: Como podemos decidir qual das
duas hipóteses é a verdadeira, isto é, como decidir se devemos rejeitar ou não a hipótese nula em
favor da hipótese alternativa?
Uma companhia produz saquinhos de batata de 454 gramas. Para verificar se a máquina de
empacotar está trabalhando corretamente o controle de qualidade tomou uma amostra aleatória
de 50 saquinhos. Os pesos líquidos, em gramas, dos 50 saquinhos de batata obtidos são
mostrados na tabela abaixo.
161
Solução:
Ho: µ = 454 g
Ha: µ ≠ 454 g
_
x=
∑ x = 22.261 = 451,2 g
n 50
c) Neste item precisamos obter um critério preciso para decidir se rejeitamos ou não a hipótese
nula, em favor da hipótese alternativa. Podemos aplicar o Teorema do Limite Central que nos diz
que se a amostra é grande (n ≥ 30) então a variável aleatória x é aproximadamente normal com
média e desvio padrão dados por:
µ =µ σ
_ σ = _
x x n
0,9544
x
µ - 2σx µ µ +2σx
-2 0 2
Figura 8.1 – Distribuição normal das médias das amostras
Com base neste fato, podemos dizer, por exemplo, que a probabilidade da média x estar
em um intervalo de dois desvios padrões da média da população µ é de 0,9544, ou ainda, que a
probabilidade da média da amostra estar fora deste intervalo é de apenas 0,0456 (1-0,9544),
como mostrado na figura 8.1. Podemos usar este fato como um critério para decidir se devemos
ou não rejeitar a hipótese nula. Especificamente, se a média da amostra retirada da população
estiver dentro do intervalo então podemos atribuir a diferença encontrada a um erro de
amostragem e, assim, aceitar a hipótese nula. Por outro lado, se a média da amostra estiver
distante mais de dois desvios padrões da média da população de 454g, então podemos concluir
que a hipótese nula é verdadeira e um evento extremamente improvável ocorreu durante a coleta
da amostra ou que a hipótese nula é falsa (o que é muito mais razoável) e que a hipótese
alternativa é verdadeira.
Se a média x, dos 50 sacos de batata coletados estiver mais de dois desvios padrões distante
da média da população (454g), então rejeite a hipótese nula, µ = 454g, e conclua que a
hipótese alternativa, µ ≠ 454g, é verdadeira. Caso contrário, não rejeite a hipótese nula.
Na figura 8.2, isto é mostrado graficamente através das regiões de rejeição e não rejeição.
163
0,0228 0,0228
0,9544
x
454 - 2σx 454 454 +2σx
-2 0 2 z
A probabilidade de rejeitar Ho é de apenas 0,0456, como pode ser visto na figura acima. Esta
probabilidade é denominada nível de significância do teste de hipótese.
d) Finalmente, aplicando o critério da parte (c) aos dados coletados da amostra, podemos colocar
nossa conclusão. Assumiremos que o desvio padrão da população seja conhecido e igual a σ =
7,9 gramas. Para aplicar o critério da parte (c) necessitamos determinar quantos desvios padrões
a média da amostra se desvia da média da população. Isto é feito determinando-se o valor da
variável aleatória padrão
_ _
x − 454 x − 454
z= =
σ _ σ n
x
Sabendo que σ = 7,9 gramas, n = 50 e, da parte (b), que a média da amostra é 451,2 gramas
podemos calcular o valor de z.
_
x − 454 451,2 − 454
z= = = −2,51
σ 7,9
n 50
Uma vez que a média dos 50 saquinhos de batata se encontra a mais de 2 desvios padrões
da média de 454 gramas, decidimos rejeitar a hipótese nula e concluir que a hipótese alternativa,
µ ≠ 454 gramas, é verdadeira. Em outras palavras, os dados proporcionam evidência suficiente
para concluir que a máquina de empacotamento não está trabalhando corretamente.
164
Erros tipo I e II
Como pode ser visto do exemplo, uma vez formuladas as hipóteses Ho e Ha, o nosso
objetivo é analisar os dados da amostra para escolher se rejeitamos Ho ou se retemos Ho. A
rejeição de Ho implica em confirmar Ha e a não rejeição de Ho significa que não há evidência de
que Ha seja verdadeira. Porém, o ponto mais importante é que a decisão de rejeitar Ho deve ser
baseada em uma forte evidência senão, a hipótese Ha não poderá ser considerada verdadeira além
de uma certa dúvida. Qualquer que seja a decisão, é sempre possível que ela seja incorreta
devido ao fato de se usar informações obtidas através de uma amostra da população.
Em testes de hipóteses existem quatro possíveis resultados, sendo que dois deles levam a
decisões incorretas, como pode ser visto na tabela abaixo.
Como pode ser visto da tabela, uma decisão incorreta ocorre se rejeitamos uma hipótese
nula verdadeira ou se não rejeitamos uma hipótese nula falsa. A primeira decisão incorreta é
denominada Erro tipo I e a segunda, Erro tipo II.
165
Assumindo um teste de hipótese unilateral à esquerda, fica fácil mostrar que escolhido
um valor pequeno para α, será improvável que a hipótese nula será rejeitada quando ela de fato
for verdadeira. Na figura 8.3, a probabilidade α é definida pela área hachurada sob a curva
normal com µ = 270. Por outro lado, a probabilidade β de se cometer um Erro tipo II não é
normalmente conhecida e depende do valor de µ que ocorrer quando Ha for verdadeira. Essa
probabilidade é mostrada na figura 8.3 pela área hachurada sob a curva normal com µ = 262
(assumido), considerando que Ha seja verdadeira, ou seja, µ < 270.
x
c µ = 270
x
µ = 262 c
Figura 8.3 – As probabilidades de erro α e β.
Também da figura 8.3 pode-se observar que não existe uma escolha do ponto c (fronteira
das regiões de rejeição e de não rejeição) que minimize ambas as probabilidades de erro. Se c é
deslocado para a esquerda, α fica menor mas β torna-se maior e o oposto ocorre se c é deslocado
para a direita. Em vista desse dilema, e assumindo que uma rejeição errada de Ho seja um erro
mais sério, nós usualmente fixamos α com um valor baixo, como por exemplo α = 0,10 ou α =
0,05 ou, ainda, α = 0,01.
166
8.3 Teste de hipótese para média de uma população com base em grandes amostras
Procedimento 8.1- Teste de hipóteses para uma média de uma população com
hipótese nula Ho: µ = µo
α/2 α/2 α α
z z z
- zα/2 0 zα/2 - zα 0 0 zα
Bilateral Unilateral à esquerda Unilateral à direita
167
Nota: No passo 4 do procedimento nós usamos o desvio padrão da amostra, s, em vez do desvio
padrão da população σ, porque nós raramente conhecemos σ e o desvio padrão s é uma boa
estimativa de σ quando se trabalha com grandes amostras. Nos raros casos onde σ é conhecido,
ele deve ser usado no lugar de s para o cálculo de z no passo 4 do procedimento.
Uma empresa de coleta de informações verificou que em 1986, o preço médio, no varejo, de
todos os livros de capa dura de História era de U$ 28,44 dólares. Os preços de varejo de 40 livros
de História deste ano, aleatoriamente escolhidos, são dados na tabela 8.4 como valores inteiros
em dólares. Os dados fornecidos proporcionam evidência suficiente para concluir que o preço
deste ano de todos os livros de História de capa dura aumentou com relação à média de U$ 28,44
de 1986? Realize o teste apropriado com nível de significância de 1%.
35 37 33 26 50 32 30 39
32 33 48 27 20 24 33 31
39 25 28 31 36 32 26 41
33 25 35 32 41 36 45 27
18 28 32 36 22 34 26 21
Solução:
Uma vez que o tamanho da amostra é grande (n ≥ 30), podemos aplicar o procedimento 8.1.
Para α = 0,01, o valor crítico será z0,01. Da tabela 8.3 (ou tabela 6.1) obtemos z0,01 = 2,33.
Portanto, o valor crítico é 2,33, conforme mostrado na figura 8.4.
168
Área de 0,01
z
0 2,33
_
x− µ o
z=
s n
_
x− µ o 31,75 − 28,44
z= = = 2,85
s n 7,53 40
Este valor de z está marcado na figura 8.4 com uma bolinha preta próxima do valor 2,33.
Passo 5 – Se o valor da estatística de teste cair na região de rejeição, então rejeite Ho;
caso contrário, não rejeite Ho.
O valor da estatística de teste encontrado é de 2,85. Como pode ser visto na figura 8.4,
esse valor cai na região de rejeição e, assim, nós devemos rejeitar Ho.
Os dados proporcionam evidência suficiente para concluir que o preço médio de todos os
livros de história aumentou com relação ao preço médio de 1986.
169
_
x− µ
t=
s n
tem uma distribuição t com n-1 graus de liberdade. Em outras palavras, as probabilidades para
aquela variável aleatória são iguais às áreas sob a curva t com GL = n-1. Conseqüentemente,
quando a população sendo amostrada é normalmente distribuída, nós podemos realizar um teste
de hipóteses com a hipótese nula Ho: µ = µo, empregando a variável aleatória acima como nossa
estatística de teste e usando a tabela da distribuição t para obter o valor crítico (ou os valores
críticos).
Procedimento 8.2- Teste de hipóteses para uma média de uma população com
hipótese nula Ho: µ = µo
α/2 α/2 α α
t t t
- tα/2 0 tα/2 - tα 0 0 tα
Bilateral Unilateral à esquerda Unilateral à direita
170
Assuma que a média de gasto com energia elétrica de todas as famílias de uma certa
região seja de R$ 1123,00 em um determinado ano. Neste mesmo ano, coletando-se uma amostra
aleatória de 15 famílias de classe média alta obteve-se os valores mostrados na tabela abaixo,
arredondados para o inteiro mais próximo. Com um nível de significância de 5%, os dados
indicam que famílias da classe média alta gastam, em média, em energia mais do que a média da
região de R$ 1123,00? (Assuma que a distribuição de gasto com energia das famílias da classe
média alta seja normalmente distribuída).
Solução:
O valor crítico para um teste unilateral à direita é tα, com GL = n-1. Neste caso, n = 15 e
GL = 15-1 = 14, com α = 0,05. Da tabela 7.4 (capítulo 7, pag. 151) obtemos t0,05 = 1,761. Veja
figura 8.5.
Curva t com
GL = 14
0,05
t
0 1,761
_
x− µ o
t=
s n
Sabemos que µo = 1123 e n = 15. Além disso, a média e o desvio padrão dos dados
constantes na tabela acima são 1344,27 e 231, respectivamente. Conseqüentemente, o valor da
estatística de teste é:
_
x− µ o 1344,27 − 1123
t= = = 3,710
s n 231 15
Passo 5 – Se o valor da estatística de teste cair na região de rejeição, então rejeite Ho;
caso contrário não rejeite Ho.
O valor encontrado é igual a 3,710 e este valor cai dentro da região de rejeição. Assim,
nós rejeitamos Ho.
Os dados proporcionam evidência suficiente para concluir que famílias da classe média
alta gastaram mais do que a média das famílias da região.
172
1) Um fabricante de tintas afirma que o tempo médio de secagem de sua nova tinta látex é
de duas horas. Para testar esta afirmação, foram obtidos os tempos de secagem para 20
latas aleatoriamente selecionadas. A média da amostra e o desvio padrão são 123,1 min e
10,0 min, respectivamente. Assumindo que os tempos de secagem sejam normalmente
distribuídos, os dados apresentados proporcionam evidência suficiente para concluir que
o tempo médio de secagem é na verdade maior do que o tempo anunciado de 120 min?
Use α = 0,05.
a) Os dados indicam que a vida média das baterias recebidas é menor do que os 36
meses anunciados? Realize o teste com 1% de nível de significância. (Nota: Σx =
303,3 e Σx2 = 9343,85).
b) Qual condição você tem que assumir sobre as vidas das baterias para realizar o teste
de hipóteses que você realizou na parte a?
173
Nesta seção examinamos métodos usados para fazer inferência estatística sobre as médias
de duas populações trabalhando com amostras grandes e independentes. Entendemos que duas
amostras são independentes se a amostra retirada de uma população não interfere na amostra
retirada da outra população.
População 1 População 2
µ1 µ2
σ1 σ2
n1 Amostra 1 Amostra 2 n2
x1 x2
s1 Calcule média 1 Calcule média 2 s2
1. Nosso problema é que nós temos duas populações com médias µ1 e µ2 e desejamos saber
se existe diferença entre elas. A hipótese nula é
2. Observando a figura 8.6, note que retiramos uma amostra de cada uma das populações e
_ _
calculamos as médias. A diferença observada x1 − x 2 é, agora, a estatística de teste (em
vez de x da seção anterior).
174
2 2 σ 12 σ 22
σ _ _ = σ _ + σ _ = +
x1 x2
x1 − x2
1
n n 2
6. Como os valores das variâncias das duas populações são raramente conhecidos, podemos
usar as variâncias das amostras como estimadores ou estimativas das variâncias das
populações para calcular uma estimativa do desvio padrão. Para isso, basta substituir σ
por s na fórmula anterior.
s12 s 22
s_ _ = +
x1 − x2
n1 n2
_ _
7. A localização da estatística da amostra x1 − x 2 , relativa à média da distribuição, pode ser
encontrada calculando-se o valor de z.
_ _
x1 − x 2 − 0
z=
s_ _
x1 − x2
175
8. Se a estatística de teste cair na região de rejeição então rejeite Ho; caso contrário, não
rejeite Ho.
Solução:
Passo 1 – Definir as hipóteses nula e alternativa.
Seja µ1 a média salarial dos professores da rede pública e µ2 a média salarial dos
professores da rede privada. As hipóteses nula e alternativa podem ser escritas como
z
0
-1,96 1,96
176
_ _
x1 − x 2 − 0
37335,20 − 39558,97
z= = = −0,64
s_ _ 3481,92
x1 − x2
Passo 5 – Pela figura observamos que o valor –0,64 não cai dentro da região de rejeição. Assim,
nós não rejeitamos a hipótese nula Ho.
177
Tratamento 1 Tratamento 2
Média 109 128
Desvio padrão 46,2 53,4
Com base nos dados acima é possível concluir que o tratamento 2 tem uma resposta
maior que o tratamento 1? Adote um nível de significância de 5%.
178
Capítulo 9
Objetivos do Capítulo
Este capítulo fornece métodos para comparar as médias de mais de duas populações.
Serão estudados dois métodos denominados Análise de variância para 1 fator e
Análise de variância para 2 fatores. Esses métodos utilizam uma distribuição chamada
distribuição F que será vista em primeiro lugar. Após o término deste capítulo, você
deverá ser capaz de:
179
9.1) Distribuição F
Usando as curvas F
As áreas sob as curvas F podem ser encontradas em tabelas. Normalmente elas são usadas
para um valor igual a 0,01 ou 0,05 o que nos conduz à notação F0,01 e F0,05 para indicar os
valores de F que definem uma área de 0,01 ou 0,05 à sua direita, respectivamente. A tabela 9.1
fornece os valores para F0,01. No topo da tabela estão especificados os graus de liberdade para o
numerador e na coluna à esquerda, os graus de liberdade para o denominador. A tabela 9.2 é
similar à tabela 9.1, fornecendo os valores para F0,05.
180
1 2 3 4 5 6 7 8 9
181
8 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86
9 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31
10 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91
11 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60
12 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36
13 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17
14 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00
15 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87
16 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75
17 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65
18 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57
19 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49
20 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42
21 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36
22 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31
23 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26
24 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21
25 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17
26 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13
27 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10
28 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06
29 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03
30 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01
40 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80
60 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60
120 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38
2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00
182
183
9 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71
10 2.98 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54
11 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40
12 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30
13 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.21
14 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13
15 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07
16 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01
17 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96
18 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92
19 2.38 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88
20 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84
21 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81
22 2.30 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78
23 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76
24 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73
25 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71
26 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69
27 2.20 2.13 2.06 1.97 1.93 1.93 1.88 1.79 1.73 1.67
28 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65
29 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64
30 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62
40 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51
60 1.99 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39
120 1.91 1.83 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1.25
1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00
184
Solução
Determinar F0,05 significa encontrar o valor de F de modo que a área à sua direita seja
igual a 0,05, como mostrado na figura 9.2.
Para obter o valor de F pedido podemos usar a tabela 9.2. Neste exemplo, o número de
graus de liberdade para o numerador é 4 e para o denominador é 12. Assim, procuramos pela
intersecção da coluna contendo o valor 4 com a linha contendo o valor 12 e encontramos o valor
3,26, que é o valor pedido, ou seja, F0,05 = 3,26.
185
Estudando agora a tabela 9.4, já vemos uma situação mais comum onde uma variação
aleatória é encontrada dentro dos grupos.Vemos também que existe uma variação entre as
médias dos três grupos. Em virtude da variação dentro dos grupos, não é mais possível tirar
conclusões sobre o efeito dos diferentes tratamentos a que os grupos foram submetidos.
O ponto importante é que qualquer variação observada entre as médias dos grupos
consiste de (1) uma componente que é devido à variação dentro do grupo e (2) uma componente
que é devido a um possível efeito do tratamento.
Tabela 9.3 – Dados relativos a três tratamentos sem variação dentro dos grupos.
Tratamentos
1 2 3
6 9 13
6 9 13
6 9 13
6 9 13
6 9 13
_ _ _
x1 = 6 x1 = 9 x1 = 13
Se a variabilidade total entre os grupos consiste dessas duas componentes então nós
devemos, de alguma maneira, separar, avaliar e comparar essas duas componentes. Neste
processo, se nós encontrarmos que a variação entre os grupos não é maior que a variação
aleatória (ou erro) dentro dos grupos, então a conclusão será que os diferentes tratamentos não
186
Tabela 9.4 – Dados relativos a três tratamentos com variação dentro dos grupos.
Tratamentos
1 2 3
6 3 5
4 8 6
7 4 4
3 5 6
5 9 3
_ _ _
x1 = 5 x1 = 5,8 x1 = 4,8
Cálculo da variabilidade
k n
_
2
( x ) 2
_
1 k n
e x.. = xij , onde
nk j =1 i =1
(9.2)
_
x.. = média de todas as medidas
k = número de grupos
n = número de medidas (ou dados) por grupo
nT = n k = número total de medidas ou observações
i = 1, 2, ..., n e j = 1, 2, ..., k
k n
xij
2
1 k n
2
_ _
SQG = n x j − x.. = xij −
k
j =1 i =1
(9.3)
j =1 n j =1 i =1 n T
_
onde x j é a média do grupo j ( j = 1, 2, .., k)
Obs: se o número de medidas ou observações não for o mesmo para todos os grupos, isto é, se
tivermos n1 medidas no grupo 1, n2 medidas no grupo 2 e assim por diante, até nk medidas no
grupo k, então SQG será calculado de acordo com a expressão
187
2
nj k nj
xij xij
i =1
− j =1 i =1
k
SQG = (9.4)
j =1 nj nT
( x ) ( x ) 1
2
2
2
( x ) ( x ) 2 2
SQG = + + + −
k
(9.5)
n1 n2 nk nT
onde
2
k
_n
SQE = xij − x j (9.6)
j =1 i =1
_
onde x j é a média das observações do j-ésimo grupo ou amostra.
Se as médias das k populações forem iguais então toda a variabilidade medida pela
expressão (9.1) é devida ao acaso. Porém, se forem diferentes então parte da variabilidade é
proveniente da variabilidade natural dentro do grupo e parte devido à aplicação dos diferentes
tratamentos. Podemos demonstrar que a variabilidade total é igual à soma das variabilidades
dentro dos grupos e entre os grupos, ou seja,
2 2 2
k n
_
k
_ _ k n
_
ij
j =1 i =1
x − x ..
= n j .. xij − x j
j =1
x − x
+
j =1 i =1
(9.7)
Cada uma das somas de quadrados tem um grau de liberdade associado a ela, conforme
mostrado na tabela 9.5.
188
Dividindo cada uma das somas de quadrados SQT, SQG e SQE pelos respectivos graus
de liberdade, obtemos os quadrados médios, que são então dados por:
SQG
Quadrado médio entre grupos = QMG =
k −1
SQE
Quadrado médio dos erros = QME =
nT − k
QMG
F=
QME
como a estatística de teste. Grandes valores de F indicam que QMG é grande relativo a QME e
assim, que a hipótese de médias de populações iguais deve ser rejeitada. O procedimento de
análise de variância será explicado com base no exemplo a seguir.
189
Com um nível de significância de 5%, existe alguma diferença nas médias dos três
tratamentos?
Solução
1) Queremos saber se há alguma diferença entre as médias das populações representadas por
cada um dos três grupos. Assim a hipótese nula é
Ho: A = B = C
( x ) 2
1390 2
SQT = x − 2
= 109312 − = 1973,11
n T 18
( x ) ( x ) ( x ) ( x )
2 2 2 2
SQG = + + −
A B C
nA nB nC nT
SQG =
(463)2 + (407)2 + (520)2 − 107338,89 = 1064,11
6 6 6
5) Graus de liberdade
GLT = nT – 1 = 18 – 1 = 17
GLG = k – 1 = 3 – 1 = 2
GLE = GLT – GLG = 17 – 2 = 15
6) Cálculo da estatística
SQE 909
QME = = = 60 ,60
GLE 15
190
QMG 532,06
F2,15 = = = 8,78
QME 60,60
Um resumo dos valores obtidos até agora pode ser mostrado na tabela 9.6.
Fonte GL SQ MQ F[2,15]
Total 17 1973,11
Da tabela 9.2, no cruzamento da coluna 2 com linha 15 obtemos o valor F 0,05 igual a 3,68,
para um nível de confiança de 5%. Como o valor de F obtido no passo anterior foi de
8,78, portanto maior que 3,68, concluímos que podemos rejeitar Ho. Isto significa que
temos evidências de que existe pelo menos uma diferença estatisticamente significativa
entre os três pares do grupo de médias.
A tabela mostrada no exemplo acima pode ser generalizada como mostrado na tabela 9.7.
191
( x ) 2
SQT = x − 2
n T
( x ) ( x )
1
2
2
2
( x ) ( x ) 2 2
SQG = + + + −
k
n1 n2 nk nT
Passo 6 – Se o valor da estatística F cair na região de rejeição, rejeite Ho; caso contrário não
rejeite Ho.
192
Os tempos requeridos por três trabalhadores para realizar uma tarefa em uma linha de montagem
foram cronometrados em cinco ocasiões aleatoriamente escolhidas. Os tempos são dados na
tabela abaixo, aproximados para o inteiro mais próximo.
Solução
Passo 1 – Hipóteses
Ho: 1 = 2 = 3
Ha: Ao menos uma diferença existe entre as médias das populações
( x ) 2
SQT = x − 2
= 1339 – (141)2/ 15 = 1339 – 1325,4 = 13,6
n T
( x ) ( x )
1
2
2
2
( x ) ( x )
2 2
n1 n2 nk nT
193
Passo 6 – O valor da estatística (1,55) é menor que o valor crítico (3,74) e, portanto, não
devemos rejeitar Ho.
Passo 7 – Os dados obtidos não fornecem evidências para concluir que o tempo médio gasto
pelos funcionários, para desempenhar a tarefa de montagem, sejam diferentes.
1) Um criador de porcos deseja testar três diferentes dietas desenvolvidas para maximizar o
ganho de peso. O criador seleciona aleatoriamente 12 porcos e os divide em três grupos,
também de maneira aleatória. A cada um dos grupos é aplicado um dos programas de dieta.
O ganho de peso para cada porco, em Kg, após um período de seis semanas é dado pela
tabela abaixo.
Com um nível de significância de 5% podemos afirmar que existe uma diferença na média
dos pesos das três dietas aplicadas?
b)
3) O gerente geral de uma grande cadeia de lojas de conveniência deseja testar os efeitos de três
estratégias de propaganda. As estratégias são:
Estratégia 1 : nenhuma propaganda
Estratégia 2: distribuir panfletos na vizinhança da loja
Estratégia 3: distribuir panfletos e anunciar em jornais
Foram escolhidas aleatoriamente 18 lojas divididas em 3 grupos. Cada grupo usou uma das
três estratégias. A tabela abaixo apresenta valores arrecadados com vendas em um período de
194
195
onde xij é o valor da i-ésima observação do j-ésimo tratamento, é a média global, j representa
o efeito do tratamento j e ij é o erro aleatório associado aos xij.
Para o teste de hipóteses, assumimos que os erros ij sejam variáveis aleatórias
independentes e normalmente distribuídas, com média zero e variância 2. A variância 2 é
considerada constante para todos os tratamentos ou níveis do fator em estudo. Como estamos
trabalhando com um único fator, o modelo apresentado acima é denominado modelo de análise
de variância para um fator. Se assumirmos que as observações são feitas de uma forma
completamente aleatória então o planejamento experimental é dito experimento completamente
aleatorizado com um único fator.
O modelo (9.8) pode ainda ser classificado em modelo de efeitos fixos ou modelo de
efeitos aleatórios. O modelo de efeitos fixos ocorre quando fixamos a priori os níveis do fator
estudado. Por exemplo, se queremos analisar o efeito de três técnicas de aprendizado somente,
então os níveis do fator estarão automaticamente fixados. No modelo de efeitos fixos são
testadas hipóteses sobre as médias dos diversos níveis ou tratamentos e as conclusões são válidas
apenas para os níveis escolhidos para análise.
Porém, se dispomos de mais de três técnicas e escolhemos de forma aleatória apenas três
entre as diversas técnicas disponíveis, isto é, se escolhemos uma amostra aleatória da população
de técnicas (níveis do fator) então estaremos tratando com o modelo de efeitos aleatórios. Neste
caso, as conclusões obtidas serão estendidas a todos os níveis do fator e não apenas àqueles
níveis selecionados.
O modelo (9.8) assume que os erros ij sejam variáveis aleatórias independentes e
normalmente distribuídas, com média zero e variância 2. Podemos verificar se essas hipóteses
estão satisfeitas através da análise dos resíduos, que são definidos por
_
eij = xij − x j (9.9)
196
Um certo fabricante tem interesse na resistência à tração de uma fibra sintética usada na
fabricação de tecidos para camisas masculinas. Ele suspeita que a resistência é afetada pela
porcentagem de algodão contida na fibra. Cinco níveis de porcentagem de algodão são de
interesse, 15 %, 20 %, 25%, 30% e 35%. Para cada nível, devem ser feitas 5 observações,
perfazendo um total de 25 observações. Um procedimento ANOVA com um único fator deve ser
adotado para testar se a resistência é realmente afetada pela quantidade de algodão presente na
fibra.
Solução
20 6 7 8 9 10
25 11 12 13 14 15
30 16 17 18 19 20
35 21 22 23 24 25
Podemos agora selecionar um número, aleatoriamente, entre 1 e 25. Suponha que este
número seja 8. Então o experimento é realizado, para as condições da observação de número 8
(20% de algodão), obtendo-se em primeiro lugar o valor para esta observação. Repetindo esta
escolha aleatória de números entre 1 e 25 definimos a ordem em que observações serão
coletadas. Isto nos leva à tabela abaixo.
197
As 25 observações são feitas nesta seqüência e os dados obtidos são mostrados na tabela
seguinte.
2 7 17 18 25 10
3 15 12 18 22 11
4 11 18 19 19 15
5 9 18 19 23 11
Totais 49 77 88 108 54 376
Total 24 636,96
6
5
Frequência
4
3
2
1
0
-3 -2 -1 0 1 2 3 4 5 6
Resíduos
198
Infelizmente, com amostras pequenas pode ocorrer uma flutuação considerável de modo
que uma fuga moderada da normalidade não necessariamente implica em uma violação séria e
pode requer uma análise mais profunda. Isto claramente está ocorrendo na figura acima.
O gráfico pode ser visto na figura 9.4 abaixo. Os resíduos representados pelos pontos do
gráfico não formam um padrão específico. Eles apresentam um espalhamento aleatório em torno
da média. Não há razão para suspeitar de qualquer violação de independência.
Três analgésicos devem ser testados com o objetivo de determinar diferenças entre eles.
Poderíamos delinear o experimento como um experimento completamente aleatorizado. Para isto
teríamos que escolher aleatoriamente, digamos 18 pacientes, e dividi-los em três grupos de seis
pessoas cada. Em seguida, os elementos de cada grupo tomariam o analgésico especificado para
aquele grupo e teríamos as dezoito observações desejadas.
199
6
5
4
3
Resí duos ei j
2
1
0
-1 0 5 10 15 20 25 30
-2
-3
-4
-5
Ordem
O perigo com tal procedimento está na possível diferença de metabolismo das pessoas
escolhidas para participar do experimento. Uma variabilidade muito grande dentro dos grupos
poderia mascarar os efeitos dos analgésicos, isto é, a variabilidade entre os tratamentos poderia
não ser detectada e assim concluirmos que os dados não apresentam suficiente evidências de que
as médias sejam diferentes (a hipótese Ho não seria rejeitada quando deveria ser).
Deseja-se comparar três analgésicos com relação ao tempo requerido para aliviar uma dor
de cabeça. Um delineamento baseado em blocos aleatorizados deve ser usado. Para isso, seis
pessoas foram selecionadas com cada pessoa tomando os três comprimidos em diferentes
ocasiões. Os tempos para os medicamentos surtirem efeito são dados na tabela 9.13 abaixo. Ao
nível de 5% de significância, os dados obtidos permitem concluir que existe uma diferença entre
as médias dos tempos até o alívio da dor de cabeça?
Solução
200
2 14 23 13 50
3 21 19 23 63
4 20 29 24 73
5 12 19 13 44
6 13 20 20 53
Tj 98 132 118 348
c) Valor crítico F
Número de tratamentos → k = 3
Número de blocos → m = 6
Número total de observações → n = km = 18
O número de graus de liberdade é dado por GL = (k-1, n-k-m+1) = (2, 10) e o valor
crítico, dado pela tabela, é F0,05 = 4,10.
( x )2
(348)
2
SQT = x 2
− = 7118 − = 7118 − 6728 = 390
n 18
A soma dos quadrados dos tratamentos ou grupos SQG representa a variação entre as
médias dos tempos até o alívio da dor para os tratamentos (analgésicos) e é dada por:
1 k 2 ( x ) (348)
2
2
SQG = T j −
m j =1 n
1 2
= 98 + 132 + 118 −
6
2 2
18
(
= 6825,333 − 6728 = 97,333 )
A soma dos quadrados dos blocos SQB representa a variação entre as médias dos tempos
até o alívio da dor para os blocos (pessoas) e é dada por:
201
( x )
2
1 m
SQB = Bi2 −
k i =1
1
(
= 65 2 + 50 2 + 632 + 732 + 44 2 + 532 −
3
348 2
18
= 194,667 )
n
Finalmente, a soma dos quadrados dos erros SQE é dada pela diferença
Ela representa a variação entre os tempos de alívio dentro das amostras para os
tratamentos com a variação devido aos blocos removida.
A tabela ANOVA pode agora ser construída. Para isso basta calcular os quadrados
médios QMG, QMB e QME.
390
Total 17
O valor crítico de F0,05 com GL = (2,10) é igual a 4,10. Desta forma, o valor da estatística
F cai na região de rejeição (4,97 > 4,10) e podemos concluir que os dados fornecem evidência
suficiente para rejeitar a hipótese nula e que existe diferenças entre as médias nos tempos de
alívio para os três analgésicos.
Através do exemplo foi possível observarmos que existem quatro somas dos quadrados como
mostrado na figura 9.5. A variabilidade total dos dados é dividida em uma componente
representando a variabilidade entre as médias das amostras para os tratamentos, uma componente
representando a variabilidade entre as médias das amostras para os blocos e uma componente
representando a variabilidade dentro das amostras para os tratamentos com a variabilidade
devida aos blocos removida.
202
Os valores das somas dos quadrados, dos graus de liberdade associados a cada um e os
respectivos quadrados médios são dispostos na tabela ANOVA de modo similar ao do
experimento completamente aleatorizado, como mostrado abaixo.
203
( x )2
( x ) 2
SQT = x 2
−
n
1
(
SQG = T12 + T22 + ... + Tk2 −
m n
)
( x ) 2
1
(
SQB = B12 + B22 + ... + Bm2 −
k
)
n
SQE = SQT – SQG –SQB , onde, x = soma dos valores de todas as observações
Passo 6 – Se o valor da estatística F cair na região de rejeição, rejeite Ho; caso contrário não
rejeite Ho.
204
Fonte GL SQ QM F
Blocos 55,060
Erro 8
Total 14 127,733
2) Quatro marcas de gasolina devem ser testadas para se comparar o consumo. Para o teste seis
carros foram selecionadas. Cada carro percorreu uma distância de 480 Km, em rota
especificada, com cada uma das quatro marcas de gasolina. O consumo resultante, dado em
Km/l, é mostrado na tabela abaixo. Ao nível de 1% de significância, os dados obtidos
implicam que existe uma diferença no consumo médio entre as quatro marcas de gasolina?
Marca da Gasolina
A B C D
1 8 7 7 8
2 7 6 5 7
3 9 9 8 10
Carro
4 12 12 10 13
5 12 11 10 11
6 7 6 5 6
3) Discuta dois casos (não relatados neste texto) onde seria indicado usar um delineamento
baseado em blocos aleatorizados.
205
Na seção anterior nós introduzimos o delineamento com blocos aleatorizados como sendo
uma maneira de reduzir o erro residual em um experimento através da remoção da variabilidade
devido a fatores estranhos. Existem diversos outros tipos de delineamento que utilizam o
princípio dos bloqueios. Por exemplo, suponha que um pesquisador esteja estudando o efeito de
cinco diferentes formulações de uma mistura explosiva, usada na fabricação de dinamite, na
força de explosão. Cada formulação é obtida de um lote de matéria prima que é suficiente apenas
para cinco formulações serem testadas. Além disso, as formulações são preparadas por diferentes
operadores e pode haver diferenças substanciais nas habilidades e experiências dos operadores.
Dessa forma, dois fatores estranhos podem contribuir para uma maior variabilidade do erro
residual; lotes de matéria prima e operadores.
O delineamento adequado para este caso consiste em testar cada formulação exatamente
uma vez em cada lote de matéria prima de maneira que cada operador prepare uma única
formulação por lote. Assim, para cada lote, as cinco formulações serão preparadas pelos cinco
operadores, cada um deles preparando uma determinada formulação. O delineamento resultante,
mostrado na tabela 9.16, é denominado Quadrado Latino. Observemos que o delineamento é um
arranjo quadrado e que as cinco formulações (tratamentos) são identificadas pelas letras latinas
A, B, C, D e E, daí o nome Quadrado latino.
i = 1, 2, ... , p
j = 1, 2, ... , p
k = 1, 2, ... , p
xijk = observação na i-ésima linha e k-ésima coluna para o j-ésimo tratamento,
= média global,
i = é o efeito da i-ésima linha,
k = é o efeito da k-ésima coluna,
ijk = erro aleatório.
206
A análise de variância consiste em partir a soma dos quadrados total das p2 observações
em componentes para as linhas, colunas, tratamentos e erros, como se segue.
( x ) 2
SQT = x 2
−
n
( x ) 2
1
(
SQlinhas = L12 + L22 + ... + L2p −
p n
)
( x ) 2
1
(
SQcolunas = C12 + C 22 + ... + C p2 −
p n
)
( x ) 2
SQtratamentos
1
(
= T12 + T22 + ... + T p2 −
p n
)
Os termos L1, L2, ... , Lp correspondem aos totais das linhas e C1, C2, ... , Cp aos totais das
colunas.
Os termos T1, T2, ... , Tp correspondem, no exemplo dado, às diversas formulações sob
teste, isto é, às formulações A, B, C, D e E.
Dividindo-se cada soma de quadrados acima pelo seu número de graus de liberdade
obtém-se os quadrados médios. A estatística de teste é, novamente, o quociente de QMG por
QME, ou seja:
F = QMG/QME
Podemos observar que a análise é uma simples extensão do delineamento para blocos
aleatorizados. O exemplo anterior das formulações de dinamite será usado para mostrar como os
cálculos podem ser facilitados mediante uma simples codificação.
207
Solução
Os passos a serem seguidos são exatamente os mesmos mostrados nos procedimentos 9.1
e 9.2. Entretanto, para facilitar os cálculos vamos subtrair 25 de cada valor da tabela obtendo a
tabela abaixo. Podemos mostrar que as somas dos quadrados não se alteram quando subtraímos
um mesmo valor de cada uma das observações.
Lotes de Operadores Li
matéria prima 1 2 3 4 5
1 A = -1 B = -5 C = -6 D = -1 E = -1 -14
2 B = -8 C = -1 D=5 E=2 A = 11 9
3 C = -7 D = 13 E=1 A=2 B = -4 5
4 D=1 E=6 A=1 B = -2 C = -3 3
5 E = -3 A=5 B = -5 C=4 D=6 7
Cj -18 18 -4 5 9 x = 10
Passo 1 – Hipóteses
Ho: 1 = 2 = 3 = 4 = 5
Ha: pelo menos uma diferença existe
208
( x ) 2
10 2
SQT = x 2
− = 680 − = 676,00
n 25
( x ) 1 2
1 2
p
(
SQlinhas = L1 + L2 + ... + L p −
2 2
n 5
)
= (−14) + 9 + 5 + 3 + 7 −
2 2 2 2 2
(
10 2
25
= 68,00 )
( x ) 1 2
1
(
SQcolunas = C12 + C 22 + ... + C p2 −
p n
) (
= (−18) 2 + 18 2 + (−4) 2 + 5 2 + 9 2 − 4 = 150,00
5
)
( x) 1 2 2
SQtratamentos
1
(
= T12 + T22 + ... + T p2 −
p n
) (
= 18 + (−24) 2 + (−13) 2 + 24 2 + 5 2 − 4 = 330,00
5
)
Fonte GL SQ QM F
Total 25 676,00
209
Passo 6 – Como O valor crítico é de 5,41, verificamos que o valor calculado da estatística cai na
região de rejeição, portanto devemos rejeitar a hipótese nula Ho.
Passo 7 – Os dados obtidos mostram evidências suficientes para concluirmos que existem
diferenças entre as diversas formulações.
Ordem de Operador
montagem 1 2 3 4
1 C = 10 D = 14 A=7 B=8
2 B=7 C = 18 D = 11 A=8
3 A=5 B = 10 C = 11 D=9
4 D = 10 A = 10 B = 12 C = 14
210