Você está na página 1de 210

Probabilidade e Estatística

Prof.ª Ana Luisa Fantini Schmitt

2013
Copyright © UNIASSELVI 2013

Elaboração:
Prof.ª Ana Luisa Fantini Schmitt

Revisão, Diagramação e Produção:


Centro Universitário Leonardo da Vinci – UNIASSELVI

Ficha catalográfica elaborada na fonte pela Biblioteca Dante Alighieri


UNIASSELVI – Indaial.

519

S355p Schmitt, Ana Luisa Fantini

Probabilidade e estatística / Ana Luisa Fantini Schmitt. Indaial :


Uniasselvi, 2013.

200 p. : il

ISBN 978-85-7830- 676-2

Estatística.
I. Centro Universitário Leonardo da Vinci.

Impresso por:
Apresentação
Olá, acadêmico, bem-vindo à disciplina de Probabilidade e Estatística!

Nesta disciplina, você estudará duas importantes vertentes da


matemática, a teoria das probabilidades e a inferência estatística.

Na teoria das probabilidades, você estudará as experiências aleatórias,


ou seja, situações em que é possível apresentar o resultado antecipadamente.
Você terá a oportunidade de perfazer o caminho desde as principais técnicas
de contagem até os principais conceitos da teoria das probabilidades.

Na inferência estatística, você estudará os processos de estimação e os


testes de hipóteses, finalizando com as inferências estatísticas que auxiliam na
tomada de decisão. Você terá a oportunidade de, matematicamente, analisar
situações e identificar soluções, baseado em erros predeterminados e em
consulta a tabelas que facilitam o processo de resolução dos testes de hipóteses.

Dedique-se ao estudo desta disciplina e entenda que estes conceitos


são essenciais na formação do futuro professor de Matemática.

Para facilitar o seu estudo, o Caderno de Estudos de Probabilidade e


Estatística foi dividido em três unidades: na Unidade 1, você fará o estudo
da Análise Combinatória e Probabilidades; na Unidade 2, você conhecerá as
Variáveis Aleatórias e as Distribuições Discretas e Contínuas de Probabilidade
e, na Unidade 3, você compreenderá a Estimação e a Inferência Estatística.

Espero que este caderno o conduza aos conhecimentos da


probabilidade e da estatística, auxiliando-o na tomada de decisões e nas
reflexões sobre o estudo.

Prof.ª Ana Luisa Fantini Schmitt

III
NOTA

Você já me conhece das outras disciplinas? Não? É calouro? Enfim, tanto para
você que está chegando agora à UNIASSELVI quanto para você que já é veterano, há
novidades em nosso material.

Na Educação a Distância, o livro impresso, entregue a todos os acadêmicos desde 2005, é


o material base da disciplina. A partir de 2017, nossos livros estão de visual novo, com um
formato mais prático, que cabe na bolsa e facilita a leitura.

O conteúdo continua na íntegra, mas a estrutura interna foi aperfeiçoada com nova
diagramação no texto, aproveitando ao máximo o espaço da página, o que também
contribui para diminuir a extração de árvores para produção de folhas de papel, por exemplo.

Assim, a UNIASSELVI, preocupando-se com o impacto de nossas ações sobre o ambiente,


apresenta também este livro no formato digital. Assim, você, acadêmico, tem a possibilidade
de estudá-lo com versatilidade nas telas do celular, tablet ou computador.
 
Eu mesmo, UNI, ganhei um novo layout, você me verá frequentemente e surgirei para
apresentar dicas de vídeos e outras fontes de conhecimento que complementam o assunto
em questão.

Todos esses ajustes foram pensados a partir de relatos que recebemos nas pesquisas
institucionais sobre os materiais impressos, para que você, nossa maior prioridade, possa
continuar seus estudos com um material de qualidade.

Aproveito o momento para convidá-lo para um bate-papo sobre o Exame Nacional de


Desempenho de Estudantes – ENADE.
 
Bons estudos!

IV
V
VI
Sumário
UNIDADE 1 – COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES......................... 1

TÓPICO 1 – COMBINATÓRIA............................................................................................................... 3
1 INTRODUÇÃO........................................................................................................................................ 3
2 PRINCÍPIO FUNDAMENTAL DA CONTAGEM............................................................................ 4
3 FATORIAL................................................................................................................................................. 7
4 PERMUTAÇÃO...................................................................................................................................... 10
4.1 QUANTIDADE DE PERMUTAÇÕES........................................................................................... 11
4.1.1 Permutações com elementos diferentes................................................................................ 11
4.1.2 Permutações com elementos repetidos................................................................................. 14
5 COMBINAÇÕES E ARRANJOS......................................................................................................... 15
5.1 COMBINAÇÕES............................................................................................................................... 15
5.2 ARRANJOS........................................................................................................................................ 16
5.3 QUANTIDADE DE ARRANJOS.................................................................................................... 17
5.4 QUANTIDADE DE COMBINAÇÕES........................................................................................... 19
6 BINÔMIO DE NEWTON..................................................................................................................... 20
6.1 O BINÔMIO DE NEWTON (X + A)n.............................................................................................. 20
6.2 TRIÂNGULO DE PASCAL............................................................................................................. 21
6.3 DESENVOLVIMENTO DO BINÔMIO DE NEWTON (x + a)n.................................................. 23
6.4 FÓRMULA DO TERMO GERAL................................................................................................... 24
RESUMO DO TÓPICO 1........................................................................................................................ 28
AUTOATIVIDADE.................................................................................................................................. 30

TÓPICO 2 – PROBABILIDADE............................................................................................................. 33
1 INTRODUÇÃO...................................................................................................................................... 33
2 ESPAÇO AMOSTRAL.......................................................................................................................... 34
3 EVENTO.................................................................................................................................................. 35
4 PROBABILIDADE................................................................................................................................. 36
5 PROBABILIDADE DA UNIÃO DE EVENTOS.............................................................................. 38
6 PROBABILIDADE CONDICIONADA............................................................................................. 42
7 TEOREMA DA MULTIPLICAÇÃO................................................................................................... 44
RESUMO DO TÓPICO 2........................................................................................................................ 48
AUTOATIVIDADE.................................................................................................................................. 49

TÓPICO 3 – TEOREMA DE BAYES...................................................................................................... 51


1 INTRODUÇÃO...................................................................................................................................... 51
2 TEOREMA DE BAYES.......................................................................................................................... 52
3 EXEMPLOS DE APLICAÇÕES DO TEOREMA DE BAYES......................................................... 53
LEITURA COMPLEMENTAR................................................................................................................ 58
RESUMO DO TÓPICO 3........................................................................................................................ 60
AUTOATIVIDADE.................................................................................................................................. 61

VII
TÓPICO 4 – COMBINATÓRIA E PROBABILIDADE NO ENSINO............................................. 63
1 INTRODUÇÃO...................................................................................................................................... 63
2 ALGUNS EXEMPLOS DE ATIVIDADES JÁ REALIZADAS DE COMBINATÓRIA............. 65
2.1 ATIVIDADE 1: OS SINAIS DE TRÂNSITO E AS CORES........................................................... 65
2.2 ATIVIDADE 2: SALADA DE FRUTAS.......................................................................................... 70
2.3 CONSIDERAÇÕES DOS ESTUDANTES SOBRE AS ATIVIDADES........................................ 74
RESUMO DO TÓPICO 4........................................................................................................................ 75
AUTOATIVIDADE.................................................................................................................................. 76

UNIDADE 2 – VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE......... 77

TÓPICO 1 – VARIÁVEIS ALEATÓRIAS............................................................................................. 79


1 INTRODUÇÃO...................................................................................................................................... 79
2 VARIÁVEIS ALEATÓRIAS................................................................................................................. 79
2.1 DISCRETAS....................................................................................................................................... 80
2.2 CONTÍNUAS..................................................................................................................................... 81
3 FUNÇÃO PARA DISTRIBUIÇÃO DE PROBABILIDADE........................................................... 81
3.1 ACUMULADA.................................................................................................................................. 84
3.2 CONTÍNUA....................................................................................................................................... 86
4 ESPERANÇA.......................................................................................................................................... 87
5 VARIÂNCIA........................................................................................................................................... 88
6 DESVIO PADRÃO................................................................................................................................ 88
7 EXEMPLOS DA ASSOCIAÇAO ENTRE VARIÂNCIA E DESVIO PADRÃO......................... 89
RESUMO DO TÓPICO 1........................................................................................................................ 91
AUTOATIVIDADE.................................................................................................................................. 92

TÓPICO 2 – DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS DISCRETAS............. 95


1 INTRODUÇÃO...................................................................................................................................... 95
2 DISTRIBUIÇÕES DE BERNOULLI E BINOMIAL........................................................................ 95
3 DISTRIBUIÇAO DE POISSON.......................................................................................................... 99
LEITURA COMPLEMENTAR.............................................................................................................. 102
RESUMO DO TÓPICO 2...................................................................................................................... 111
AUTOATIVIDADE................................................................................................................................ 112

TÓPICO 3 – DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS CONTÍNUAS........ 115


1 INTRODUÇÃO.................................................................................................................................... 115
2 NORMAL.............................................................................................................................................. 115
2.1 TABELA Z........................................................................................................................................ 117
2.2 ALGUNS EXEMPLOS.................................................................................................................... 122
3 OUTROS TIPOS DE DISTRIBUIÇÃO............................................................................................ 125
3.1 DISTRIBUIÇÃO QUI-QUADRADO............................................................................................ 125
3.1.1 Qui-quadrado com (n – 1) graus de liberdade.................................................................. 126
3.2 DISTRIBUIÇÃO T–STUDENT...................................................................................................... 128
3.3 DISTRIBUIÇÃO F........................................................................................................................... 130
RESUMO DO TÓPICO 3...................................................................................................................... 132
AUTOATIVIDADE................................................................................................................................ 133

UNIDADE 3 – INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES...... 135

TÓPICO 1 – PROCESSO DE ESTIMAÇÃO...................................................................................... 137


1 INTRODUÇÃO.................................................................................................................................... 137
2 MÉDIA................................................................................................................................................... 138

VIII
3 VARIÂNCIA......................................................................................................................................... 139
3.1 DESVIO PADRÃO.......................................................................................................................... 140
4 PROPORÇÃO....................................................................................................................................... 141
RESUMO DO TÓPICO 1...................................................................................................................... 142
AUTOATIVIDADE................................................................................................................................ 143

TÓPICO 2 – TESTES DE HIPÓTESES PARA MÉDIA,VARIÂNCIA E PROPORÇÃO........... 145


1 INTRODUÇÃO.................................................................................................................................... 145
2 HIPÓTESES.......................................................................................................................................... 145
3 ERROS DO TIPO I E II....................................................................................................................... 146
3.1 ERRO DO TIPO I (α)...................................................................................................................... 147
3.2 ERRO DO TIPO II (β)..................................................................................................................... 147
4 EXEMPLOS DE TESTES DE HIPÓTESES...................................................................................... 148
4.1 TESTE DE HIPÓTESES PARA A MÉDIA QUANDO O σ (DESVIO PADRÃO DA .
POPULAÇÃO) É CONHECIDO.................................................................................................. 150
4.1.1 Teste de hipóteses para a média quando o σ (desvio padrão da população) é
desconhecido.......................................................................................................................... 153
4.2 TESTE DE HIPÓTESES PARA A VARIÂNCIA POPULACIONAL σ2................................... 154
4.3 TESTE DE HIPÓTESES PARA A PROPORÇÃO POPULACIONAL p.................................. 156
RESUMO DO TÓPICO 2...................................................................................................................... 158
AUTOATIVIDADE................................................................................................................................ 159

TÓPICO 3 – TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU


DE DEPENDÊNCIA........................................................................................................ 161
1 INTRODUÇÃO.................................................................................................................................... 161
2 TESTE T DE STUDENT PARA COMPARAÇÃO DE MÉDIAS.................................................. 161
2.1 PARA DADOS PAREADOS.......................................................................................................... 162
2.2 PARA DADOS NÃO PAREADOS............................................................................................... 164
3 TESTE DE INDEPENDÊNCIA.......................................................................................................... 170
LEITURA COMPLEMENTAR.............................................................................................................. 174
RESUMO DO TÓPICO 3...................................................................................................................... 188
AUTOATIVIDADE................................................................................................................................ 189

REFERÊNCIAS........................................................................................................................................ 191

APÊNDICES............................................................................................................................................. 193

IX
X
UNIDADE 1

COMBINATÓRIA, PROBABILIDADE E
TEOREMA DE BAYES

OBJETIVOS DE APRENDIZAGEM
A partir desta unidade, você será capaz de:

• compreender os conceitos e definições de combinatória e probabilidade;

• entender a aplicação do Teorema de Bayes;

• considerar possíveis aplicações de combinatória e probabilidade no ensino.

PLANO DE ESTUDOS
Esta primeira unidade está dividida em quatro tópicos. No final de cada
tópico, você encontrará atividades que possibilitarão a apropriação de
conhecimentos na área.

TÓPICO 1 – COMBINATÓRIA

TÓPICO 2 – PROBABILIDADE

TÓPICO 3 – TEOREMA DE BAYES

TÓPICO 4 – COMBINATÓRIA E PROBABILIDADE NO ENSINO

1
2
UNIDADE 1
TÓPICO 1

COMBINATÓRIA

1 INTRODUÇÃO
A combinatória é a parte da Matemática em que são estudadas as
técnicas de contagens de agrupamentos que podem ser feitos com elementos de
um dado conjunto.

UNI

Por convenção, neste caderno, será utilizada apenas a palavra combinatória


para tratar dos conceitos, definições e ideias da Análise Combinatória.

Basicamente são dois tipos de agrupamentos que podem ser formados:


o primeiro tipo leva em consideração a ordem dos elementos dentro do
agrupamento, já o segundo tipo não leva em consideração a ordem dos elementos.

Por exemplo, se você quiser contar quantas placas de automóveis podem


ser feitas, constituídas por três letras seguidas de quatro números, deverá sempre
levar em conta a ordem das letras e dos números.

Placa 1 Placa 2
ALS 1987 e SLA 9178 são placas diferentes.

Mas, se você quiser contar quantas quinas são possíveis de serem sorteadas
na loteria, veja que a ordem dos números que compõem o bilhete não importa.

Por exemplo:

Jogo 1 Jogo 2
47, 13, 22, 23, 07 e 22, 47, 13, 07, 23 são jogos iguais.

3
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Os dois exemplos citados servem também para mostrar que é importante


existir uma técnica de contagem indireta, em que você não precise escrever um
por um os elementos de um agrupamento e depois contá-los. Além disso, fazer
uma contagem “manual” pode levar a um erro por omissão ou por repetição de
algum elemento ou agrupamento.

Os conceitos, definições e ideias de combinatória que você estudará nesta


primeira parte da Unidade 1 são aplicados em diversos campos de atividade.
Mais adiante você verá que são aplicáveis na Teoria das Probabilidades e no
desenvolvimento do Binômio de Newton.

Você estudará neste primeiro tópico conceitos, definições e ideias do


Princípio Fundamental da Contagem, do Fatorial, da Permutação, do Arranjo e
da Combinação. Para iniciar, a seguir, conheça um pouco mais sobre o Princípio
Fundamental da Contagem.

2 PRINCÍPIO FUNDAMENTAL DA CONTAGEM


Talvez você se reconheça na condição de ter que ir a uma cidade qualquer
e, como caminho possível, ter que passar por algumas cidades e ter que escolher
passar em algumas estradas. Dependendo de sua região, quem sabe até faça isto
para chegar ao seu polo presencial de estudo, não é mesmo? Imagine então a
seguinte situação:

Exemplo 1

Você trabalha no município de Indaial (IND) e precisava passar pelo


município de Blumenau para chegar ao município de Gaspar (GSP), local em
que reside. Para chegar a Blumenau (BLU) há duas opções de estradas (BR-470 e
Estrada Velha) e para ir de Blumenau a Gaspar existem três opções de estradas
(BR-470, Rua Itajaí e Estrada Gaspar Alto).

BR-470 Rua Itajaí


INDAIAL BR-470 GASPAR

BLUMENAU
Estrada Velha Estrada Gaspar Alto

Sendo assim, para ir de Indaial a Gaspar você pode optar por um entre
seis caminhos. Veja o esquema a seguir:

4
TÓPICO 1 | COMBINATÓRIA

BR-470 BR-470
IND BLU GSP

BR-470 Rua Itajaí


IND BLU GSP

BR-470 Estrada Gaspar Alto


IND BLU GSP

Estrada Velha BR-470


IND BLU GSP

Estrada Velha Rua Itajaí


IND BLU GSP

Estrada Velha Estrada Gaspar Alto


IND BLU GSP

Você também pode representar estes caminhos num esquema como o


seguinte, que pode ser chamado de árvore de possibilidades:

IND Veja aqui a representação das


duas estradas que ligam Indaial
a Blumenau.

BLU BLU
Veja aqui a representação
das três estradas que ligam
Blumenau a Gaspar.
GSP GSP GSP GSP
GSP GSP

5
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Com base nos esquemas anteriores, você pode perceber que a ida de Indaial
a Gaspar se dá em duas etapas: a primeira, de Indaial a Blumenau, pode ser realizada
de duas maneiras, e para cada uma delas a segunda etapa, de Blumenau a Gaspar,
pode ser realizada de três maneiras. Sendo assim, a realização das duas etapas pode
ser feita de 2 · 3 modos, que correspondem a seis caminhos de Indaial a Gaspar.

Baseado no exemplo descrito, você pode compreender facilmente a


definição do Princípio Fundamental da Contagem:

Princípio Fundamental da Contagem: se uma ação é composta de duas


etapas sucessivas, sendo que a primeira pode ser feita de m modos e, para cada
um destes, a segunda pode ser feita de n modos, então o número de modos de
realizar a ação é m·n. Este princípio pode ser generalizado para ações compostas
por mais de duas etapas.

Para ressaltar este princípio veja mais um exemplo comum no seu


cotidiano.

Exemplo 2

Imagine-se tendo que escolher o que vestir diariamente para ir trabalhar,


por exemplo. De quantas maneiras diferentes você pode se vestir se houver no
seu guarda-roupa exatamente sete blusas, quatro calças e dois pares de sapatos?

Esta situação de escolher um conjunto calça-blusa-sapato pode ser


interpretada como uma ação composta por três ações sucessivas, ou seja, primeiro
escolher a calça, depois a blusa e, por fim, o sapato. A primeira pode ser realizada
de sete modos diferentes, e, para cada um destes, a segunda pode ser realizada de
quatro modos e, para cada um destes, a terceira pode ser realizada de dois modos.

Então, pelo princípio fundamental da contagem há 7·4·2 modos de realizar


a ação, ou seja, há 56 opções diferentes de se vestir com o que você tem no guarda-
roupa, sem repetir nenhuma vez o conjunto.

AUTOATIVIDADE

Para exercitar, você pode montar a árvore de possibilidades para o


exemplo anterior.
Outra sugestão é acrescentar mais um tipo de roupa para montar o
conjunto. Que tal pensar se você tivesse que escolher também entre três casacos?
Será que suas opções aumentariam?

6
TÓPICO 1 | COMBINATÓRIA

Ei, que tal você exercitar um pouco mais o que aprendeu até aqui? Veja a seguir
a questão de múltipla escolha que estava no EXAME NACIONAL DE CURSOS 1998
(questão 20) – atual ENADE – do curso de Licenciatura em Matemática.

Os clientes de um banco devem escolher uma senha, formada por 4 algarismos de


0 a 9, de tal forma que não haja algarismos repetidos em posições consecutivas (assim, a
senha “0120” é válida, mas “2114” não é). O número de senhas válidas é:

Como resolver a questão para obter este resultado?

Você pode utilizar a ideia do Princípio Fundamental da Contagem


organizando as opções da seguinte maneira:

• Primeiro dígito: 10 opções, pois você pode utilizar qualquer número de 0 a 9.

• Segundo dígito: 9 opções, pois você já utilizou um número na primeira casa,


restam os outros nove.

• Terceiro dígito: 9 opções, você pode voltar a utilizar o primeiro número, mas
não poderá utilizar o número da segunda casa, o que implica nove opções.

• Quarto dígito: 9 opções, nesta casa, você também tem nove opções, pois pode
utilizar todos os números com exceção do que utilizou na terceira casa.

Agora, basta multiplicar as opções para cada dígito:

10 · 9 · 9 · 9

O que resultará em 8.100 opções diferentes de senha.

3 FATORIAL
Indica-se por 6! (leia seis fatorial) o produto dos seis primeiros números
naturais positivos.

6! = 6 · 5 · 4 · 3 · 2 · 1 logo 6! = 720

Veja outros exemplos:

3! = 3 · 2 · 1 = 6
8! = 8 · 7 · 6 · 5 · 4 · 3 · 2 · 1 = 40.320

Fatorial: dado um número natural qualquer n, sendo n >1 define-se: n! =


n · (n-1) · (n-2) · ... · 3 · 2 · 1.

7
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Nos casos especiais n = 1 e n = 0 define-se 1! = 1 e 0! = 1.

Por serem estas igualdades convenientes para as fórmulas que você


estudará adiante, note que:

0! = 1
1! = 1
2! = 2 · 1 = 2
3! = 3 · 2 · 1 = 6
4! = 4 · 3 · 2 · 1 = 24

Veja também que, com números maiores, você pode substituir as


multiplicações de algumas sequências pelos próprios fatoriais que estas representam:

5! = 5 · 4 · 3 · 2 · 1 = 5 · 4! = 5 · 24 = 120
6! = 6 · 5 · 4 · 3 · 2 · 1 = 6 · 5! = 6 · 120 = 720
7! = 7 · 6! = 7 · 720 = 5.040
8! = 8 · 7! = 8 · 5040 = 40.320

E, com a prática, ficará fácil utilizar esta ideia nas situações que exijam o
uso do fatorial:

7! = 7 · 6!
7! = 7 · 6 · 5!
7! = 7 · 6 · 5 · 4!

UNI

Ao desenvolver um fatorial, colocando os fatores em ordem decrescente, você


pode parar onde for conveniente, indicando os últimos fatores também como notação de
fatorial. Lembre-se disto, será bastante útil no estudo de Permutação, Arranjo e Combinação!

Para exercitar, vamos simplificar e calcular os fatoriais a seguir:

Exemplo 1: 9!
7!
Lembre-se de que você pode simplificar a fração desenvolvendo o fatorial
maior até chegar ao menor! Neste caso existe o 9! em cima e o 7! embaixo. A
melhor solução é desenvolver o 9! de cima até que possa simplificá-lo com o 7! de
baixo, restando a multiplicação do nove pelo oito em cima:

9 · 8 · 7!
= 9 · 8 = 72
7!
8
TÓPICO 1 | COMBINATÓRIA

(n –2)!
Exemplo 2:
n!
Já neste caso existe uma forma algébrica de fatorial, em que há o (n-2)!
em cima e o n! embaixo. Assim como no exemplo numérico, neste caso a melhor
solução é desenvolver o n! de baixo até que se possa simplificá-lo com o (n-2)! de
cima, restando a multiplicação do n pelo (n-1) embaixo:

(n–2)! (n 2)! 1
= =
n! n · (n–1) · (n–2)! n · (n 1)

(n+3)!
Exemplo 3:
n!
Este é outro exemplo de uma forma algébrica de fatorial, em que há o (n+3)!
em cima e o n! embaixo. Da mesma maneira, como no exemplo anterior, neste caso,
a melhor solução é desenvolver o (n+3)! de cima até que se possa simplificá-lo com
o n! de baixo, restando a multiplicação do (n+3) · (n+2) · (n+1) em cima:

(n+3)! (n+3) · (n+2) · (n+1) · n! (n+3) · (n+2) · (n+1)


= = =(n+3) · (n+2) · (n+1)
n! n! 1

Exemplo 4: (n–2!= (n+1)!


20
Este último exemplo apresenta uma equação com fatorial. Por causa da
existência dos fatoriais na equação devemos ter n natural e n ≥ 1.

O primeiro passo é resolver a equação normalmente, sem pensar nos


fatoriais:

(n+1)!
(n–2)!= , realizando a multiplicação em ‘X’ e tornando a dividir,
20
temos a mesma equação escrita de outra maneira: (n+1)! 20
(n–1)!

Do mesmo modo, como nos exemplos anteriores, a melhor solução é


desenvolver o (n+1)! de cima até que se possa simplificá-lo com o (n-1)! de baixo,
restando a multiplicação do (n+1) · (n) em cima:

(n+1) · (n) · (n–1)!


=20
(n · 1)!

Neste momento a equação está resumida a: (n+1)·(n) = 20. Resolvendo a


multiplicação algébrica obtém-se: n2 + n – 20 = 0.

Aplicando a fórmula de Bhaskara chega-se às raízes n1 = -5 e n2 = 4. Como


não se pode aceitar n menores ou iguais a 1, o resultado da equação é apenas 4.

9
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

UNI

A fórmula de Bhaskara é utilizada para resolver equações de segundo grau. Sem


rigor matemático, sua definição é dada por -b±√b2 - 4·a·c em que a (a deve ser diferente
x=
2·a
de zero) é o valor que acompanha x2, b é o valor que acompanha x e c é o valor que aparece
sozinho na equação.

4 PERMUTAÇÃO
Com as letras x, y e z você pode formar as seguintes sucessões: (x, y, z); (x,
z, y); (y, z, x); (y, x, z); (z, x, y); (z, y, z). Cada uma dessas seis sucessões é chamada
uma permutação das três letras.

Permutação: denomina-se permutação de n elementos dados a toda


sucessão de n termos formada com os n elementos dados.

Duas permutações dos mesmos objetos são diferentes se a ordem dos


objetos numa delas é diferente da ordem em que os objetos estão colocados na
outra, conforme o exemplo inicial. As permutações são representadas usando
parênteses e separando os termos por vírgula ou ponto e vírgula (como sucessões).

É por meio de permutações que são feitos os anagramas das palavras.


Se você quiser formar os anagramas do seu nome, basta permutar as letras da
palavra até que se esgotem as possibilidades, independente se a palavra formada
tenha ou não significado. Veja os exemplos a seguir.

Exemplo 1: LEO

Os anagramas para o nome LEO são: LEO, LOE, ELO, EOL, OLE, OEL.

Exemplo 2: ANA

Os anagramas para o nome ANA são: ANA, AAN, NAA, NAA, ANA, AAN.

Perceba que neste exemplo há repetição de uma das letras, o A, por isso optou-
se por diferenciar cada um, sendo o primeiro em itálico e o segundo sublinhado.

10
TÓPICO 1 | COMBINATÓRIA

UNI

Mais adiante, você verá um exemplo em que se leva em conta a repetição da


letra A, ocasionando apenas três anagramas (ANA, AAN e NAA).

Exemplo 3: NEAD

Os anagramas para a palavra NEAD são: NEAD, NEDA, NADE, NAED,


NDAE, NDEA, ENDA, ENAD, EDAN, EDNA, EAND, EADN, ADNE, ADEN,
AEDN, AEND, ANDE, ANED, DENA, DEAN, DAEN, DANE, DNEA, DNAE.

Perceba também que ao aumentar a palavra de que se deseja formar os


anagramas, mais trabalhoso fica fazer isso sem uma regra ou fórmula. Imagine
fazer, da mesma maneira como nos exemplos, os anagramas da palavra
MATEMÁTICA, seria trabalhoso e demorado!

4.1 QUANTIDADE DE PERMUTAÇÕES


Nas aplicações, geralmente, você está interessado na quantidade de
permutações que podem ser feitas com determinados elementos. Para determinar
o número de permutações, não é necessário que você faça uma por uma e depois
conte, afinal, às vezes isto é inviável!

A seguir, você vai identificar a diferença entre permutações com elementos


diferentes e permutações com elementos repetidos.

4.1.1 Permutações com elementos diferentes


Para iniciar, pense em quantas permutações podem ser formadas com as
vogais a, e, i, o e u. Você poderia resolver fazendo o mesmo procedimento dos
anagramas, mas daria certo trabalho.

Pense que para formar uma destas permutações você deve fazer uma ação
que é composta de cinco etapas sucessivas:

( __ , __ , __ , __ , __ ) cada espaço separado por vírgula representa uma etapa.


1ª 2ª 3ª 4ª 5ª

1ª etapa: você deve escolher a 1ª vogal da permutação. Ela pode ser a ou e


ou i ou o ou u, sendo assim, há cinco possibilidades para esta etapa.
11
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

2ª etapa: você deve escolher a 2ª vogal. Para cada possibilidade da 1ª


etapa, há quatro possibilidades na 2ª etapa, pois uma das vogais já foi utilizada.
Por exemplo, se você escolheu na 1ª etapa a vogal i, então a 2ª letra poderá ser a
ou e ou o ou u.

3ª etapa: você faz a escolha da 3ª vogal. Agora, para cada par de


possibilidades da etapa anterior, há três possibilidades na 3ª etapa, pois duas das
vogais já foram utilizadas. Por exemplo, se você escolheu nas outras etapas as
vogais i e a, então a 3ª letra poderá ser e ou o ou u.

4ª etapa: você deve escolher a 4ª vogal. Aqui haverá duas possibilidades,


pois três das vogais já foram utilizadas. Por exemplo, se você escolheu
anteriormente as vogais i e a e u, então a 4ª letra poderá ser e ou o.

5ª etapa: você deve escolher a 5ª e última vogal. Nesta última etapa haverá
apenas uma possibilidade, pois as outras quatro vogais já foram utilizadas. Por
exemplo, se você escolheu anteriormente as vogais i e a e u e e, então a 4ª letra
somente poderá ser o.

Neste caso, a permutação do exemplo anterior pode ser identificada pela


quantidade de possibilidades em cada etapa:

Permutação ( ___ , ___ , ___ , ___ , ___ )


Possibilidades 5 · 4 · 3 · 2 · 1 = 5! = 120

UNI

Visualizando o esquema anterior, você deve lembrar-se do Princípio


Fundamental da Contagem e também do Fatorial, certo? Por isso foi indicada a importância
das duas definições nos itens anteriores, afinal são essenciais em Análise Combinatória!

Pelo Princípio Fundamental da Contagem, concluímos que podemos formar


5 · 4 · 3 · 2 · 1 permutações diferentes, isto é, existem 120 permutações diferentes das
cinco vogais a, e, i, o e u (ou de quaisquer outros cinco elementos ou objetos).

O número de permutações de cinco elementos diferentes é indicado por P5.


Sendo assim:

P5 = 5! = 120

12
TÓPICO 1 | COMBINATÓRIA

Se você quiser generalizar o exemplo acima para qualquer número de


permutações de n elementos distintos, tem-se:

Pn = n!

Agora fica fácil responder a quantidade de anagramas possíveis da
palavra MATEMÁTICA. Basta contar o número de letras da palavra, neste caso
dez letras, e resolver a permutação de dez elementos, representada por P10.

P10 = 10! = 3.628.800

Outra situação deste tipo de permutação com elementos diferentes pode


ser visto no exemplo a seguir:

Exemplo 1: Com os algarismos 2, 4, 5, 6 e 7 quantos números ímpares de


4 algarismos distintos podemos escrever?

Primeiro lembre-se de que para formar um número ímpar você deve


levar em consideração que o algarismo da unidade, ou seja, o último da direita
deve ser ímpar. Neste exemplo, o número a ser formado deve obrigatoriamente
terminar em 5 ou 7.

veja que para o algarismo


Permutação ( ___, ___, ___, ___ , ___ ) das unidades há apenas duas
Possibilidades 4 · 3 · 2 · 1 · 2 possibilidades.

Para cada uma destas possibilidades, os outros cinco algarismos que


restarem poderão ser permutados nas outras cinco casas. Como são algarismos
distintos, a quantidade de números ímpares que você poderá formar é:

2 · P4 = 2 · 4! = 2 · 24 = 48

UNI

Eis aqui uma dica. Para você resolver exercícios como este é sempre necessário
fazer o esquema que representa a situação e suas possibilidades, prestando atenção às
restrições, como a do exemplo anterior em que o número deveria ser ímpar.

13
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

4.1.2 Permutações com elementos repetidos


Há casos de permutações em que se considera a repetição dos elementos.
Os anagramas para o nome ANA são um exemplo.

Se você levar em consideração a repetição da letra A, haverá apenas três


permutações:

ANA, AAN e NAA

Mas, se, como no exemplo 2 da seção 4 (PERMUTAÇÃO), você considerar


cada A do nome ANA como uma letra distinta (A e A), haverá seis permutações:

ANA, AAN, NAA, NAA, ANA, AAN

Perceba que neste exemplo há repetição de uma das letras, o A, por isso optou-
se por diferenciar cada um, sendo o primeiro em itálico e o segundo sublinhado.

Você já sabia que o número de permutações de três elementos diferentes


é P3 = 3! = 6. Mas, se você tiver entre os três elementos dois que repetem, este
número fica dividido por 2!. Isto ocorre porque 2! é o número de permutações dos
dois elementos se eles forem considerados distintos. Sendo assim, o número de
permutações de três elementos sendo dois deles repetidos é dado por P32:

6
P23 = 3! = = 3
2! 2

Outro exemplo de permutação com elementos repetidos é o cálculo de


anagramas da palavra UNIASSELVI. Veja que as letras S e I se repetem duas
vezes cada uma na palavra. Se não fosse levada em consideração a repetição
destas letras, e houvesse S e S e I e I, por exemplo, você teria uma permutação de
10 letras, ou seja, P10 = 10! = 3 628 800.

Considerando a repetição das letras S e I na palavra UNIASSELVI, tem-se:

P2,2 10! = 10·9·8·7·6·5·4·3·2! = 907200


10 =
2!·2! 2·1·2!

Analisando o exemplo dos anagramas da palavra UNIASSELVI, levando


em consideração se é com e sem repetição, tem-se uma diferença de 3.628.800
permutações no primeiro caso e 907.200 no segundo.

Generalizando estas situações, quando há n elementos dos quais n1 são


repetidos de um tipo, n2 são repetidos de outro tipo, n3 são repetidos de outro tipo,
e assim por diante, o número de permutações que podemos formar é dado por:

14
TÓPICO 1 | COMBINATÓRIA

Pn
n1, n2, n3, ... nk n!
= (n + n2 + n3 + ... nk = n)
n1!n2!n3!...nk! 1

UNI

É importante sempre estar atento(a) ao enunciado de um problema para


detectar qual tipo de cálculo é necessário para obter o resultado correto. No caso das
permutações, analise a situação para saber se deve ou não levar em consideração a repetição
dos elementos.

5 COMBINAÇÕES E ARRANJOS
Combinações e arranjos também são parte do estudo de Combinatória.
Neste caderno, optou-se por apresentá-los no mesmo momento, apontando
peculiaridades, diferenças e semelhanças entre os dois tipos de cálculo.

5.1 COMBINAÇÕES
Suponha que no local em que você trabalha, numa escola por exemplo, o
diretor resolveu sortear entre os professores mais assíduos do semestre dois prêmios
iguais, dois notebooks. Imagine então que os quatro professores (Jairo, Cristiane,
Débora e Emília) foram os mais assíduos do semestre e que o diretor deve decidir
quais dois receberão os notebooks. As duplas de ganhadores podem ser:

Jairo e Cristiane ou Jairo e Débora ou Jairo e Emília ou


Cristiane e Débora ou Cristiane e Emília ou Débora e Emília.

Cada uma destas possibilidades é um agrupamento dos quatro professores


tomados dois a dois. Em cada um destes agrupamentos, a ordem em que forem
citados não importa, pois se o diretor der os notebooks ao Jairo e à Cristiane é o
mesmo que se der os prêmios à Cristiane e ao Jairo.

Ou seja, quando você agrupar elementos de modo que em cada
agrupamento não importe a ordem dos elementos, estes agrupamentos são
chamados de combinações. Matematicamente, as combinações são conjuntos
em que os elementos são escolhidos entre os elementos dados.

Combinação: denominam-se combinações de n elementos distintos


tomados k a k os conjuntos formados de k elementos distintos escolhidos entre
os n elementos dados.

15
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

No exemplo dado, considerando os elementos Jairo, Cristiane, Débora e


Emília, você pode escrever as combinações destes elementos tomados dois a dois:

{Jairo e Cristiane}, {Jairo e Débora}, {Jairo e Emília},


{Cristiane e Débora}, {Cristiane e Emília}, {Débora e Emília}.

Veja que duas combinações são diferentes apenas quando têm elementos
diferentes. As combinações são representadas utilizando chaves e os elementos
são separados por vírgula ou ponto e vírgula, assim como conjuntos.

5.2 ARRANJOS
Considere a mesma situação anterior, porém imagine que o diretor tenha
dois prêmios diferentes para dar para os professores mais assíduos do semestre,
um tablet e um netbook e que o primeiro professor sorteado receba o tablet e o
segundo professor sorteado receba o netbook.

Se os professores sorteados fossem Jairo e Cristiane, nessa ordem, Jairo


receberia o tablet e Cristiane, o netbook. Mas, se os sorteados fossem Cristiane e
Jairo, nesta ordem, Cristiane receberia o tablet e Jairo, o netbook.

Esta é uma situação em que os agrupamentos Jairo e Cristiane e Cristiane e


Jairo são considerados agrupamentos diferentes. Portanto, ao citar o agrupamento,
importa a ordem em que os elementos estão.

Ou seja, quando você agrupar elementos de modo que em cada agrupamento


importa a ordem dos elementos, estes agrupamentos são denominados arranjos.
Em linguagem matemática, os arranjos são sucessões cujos termos são escolhidos
entre os elementos dados.

Arranjo: denominam-se combinações de n elementos distintos


tomados k a k as sucessões formadas de k termos distintos escolhidos entre os
n elementos dados.

No exemplo dado, considerando os elementos Jairo, Cristiane, Débora e


Emília, você pode escrever os arranjos destes elementos tomados dois a dois:

(Jairo e Cristiane), (Jairo e Débora), (Jairo e Emília),


(Cristiane e Débora), (Cristiane e Emília), (Cristiane e Jairo),
(Débora e Jairo), (Débora e Cristiane), (Débora e Emília),
(Emília e Cristiane), (Emília e Débora), (Emília e Jairo).

Veja que dois arranjos são diferentes se tiverem elementos diferentes, ou


se tiverem os mesmos elementos, porém em ordens diferentes. Os arranjos são
representados colocando os elementos entre parênteses, como sucessões.

16
TÓPICO 1 | COMBINATÓRIA

AUTOATIVIDADE

Você percebeu a diferença quando a ordem dos elementos importa e


quando ela não importa? Essa é a principal diferença entre arranjos e combinações.
Faça um rápido exercício, considere os números 3, 5 e 7. Agora forme as
combinações e os arranjos possíveis com estes elementos, tomados dois a dois.
Se você ainda ficou com dúvidas, revise o conteúdo até aqui para, em
seguida, prosseguir.

5.3 QUANTIDADE DE ARRANJOS


O número de arranjos de n elementos tomados k a k pode ser representado
pelo símbolo An,k (ou pelo símbolo Ank ).

Para determinar a quantidade de arranjos imagine que você precisa


formar um deles, ou seja, formar uma sucessão de k termos escolhidos entre os n
elementos dados:

( 1° , 2° , 3° , ..., k° )

O 1º termo pode ser qualquer um dos n elementos dados; há então n


possibilidades para ele.

Para cada uma destas possibilidades, o 2º termo do arranjo poderá ser


qualquer um dos (n – 1) elementos restantes, excluído aquele já escolhido. Há,
portanto, (n – 1) possibilidades para o 2º termo.

Para cada par de elementos já escolhidos, o 3º termo poderá ser qualquer


um dos (n – 2) elementos restantes. Há então (n – 2) possibilidades para o 3º
termo. E assim por diante.

Arranjo: ( 1° , 2° , 3° , ..., k° )
↓ ↓ ↓ ↓
Possibilidades: n n–1 n–2 n–(k–1)

Pelo Princípio Fundamental da Contagem, você pode concluir que a


quantidade de arranjos que podem ser formados é:

Aa, k = n · (n – 1) · (n – 2) · ... · (n – (k – 1))


produto de k fatores

Exemplo 1: Quantos são os arranjos de 6 elementos (n), tomados 3 a 3 (k)?

A6,3 = 6 · 5 · 4 = 120
produto de 3 fatores
17
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Exemplo 2: Quantos são os arranjos de 10 elementos (n), tomados 4 a 4 (k)?

A10,4 = 10 · 9 · 8 · 7 = 5.040
produto de 4 fatores

Observe que, em A10,4 = 10 · 9 · 8 · 7, multiplicando e dividindo o segundo


membro por 6!:

A10,4 = 10.9.8.7.6!
6!

Então,

A10,4 = A10,4 = 10!


(10 – 4)!

Em An,k = n (n – 1) · n (n – 2) ... (n – (k – 1)), multiplicando e dividindo o


segundo membro por (n – k)!, tem-se:

A10,4 = n(n-1).n(n-2)...(n-(k-1)).(n-k)!
(n-k)!

Logo,

An,k = n!
(n-k)!

em que n é o número de elementos e k o número de maneiras de arranjo dos


elementos (k a k).

Exemplo 3: Dez diretores de uma empresa são candidatos aos cargos de


presidente e vice-presidente. Quantos são os possíveis resultados da eleição?

Temos n = 10 e k = 2, aplicando-se a fórmula de arranjo:

A10,2 = 10! = 10! = 10.9.8! = 90


(10-2)! 8! 8!

18
TÓPICO 1 | COMBINATÓRIA

5.4 QUANTIDADE DE COMBINAÇÕES


O número de combinações de n elementos tomados k a k pode ser
representado pelo símbolo Cn,k (ou pelo símbolo Cnk).

Você deve lembrar que para determinar esta quantidade de combinações


com k elementos

a1, a2, a3, ..., ak

devem-se obter k! permutações:

(a1, a2, a3, ... , ak), (a1, a2, a3, ... , ak), (a1, a2, a3, ... , ak) etc.

Sendo assim, a partir de uma combinação você pode obter k! arranjos dos
n elementos tomados k a k. Então o número de combinações é igual ao número de
arranjos dividido por k!:

An,k
Cn,k =
K!

Logo,

Cn,k = n!
k!(n–k)!

em que n é o número de elementos e k o número de maneiras de combinação


dos elementos (k a k).

Exemplo 1: Quantas são as combinações de 6 elementos (n) tomados 2 a 2 (k)?

Cn,k = 6! = 6! = 6.5.4! = 15
2!(6–2)! 2!4! 2.1.4!

Exemplo 2: Numa sessão em que estão presentes 18 deputados, 4 serão


escolhidos para uma comissão que vai estudar um projeto do governo. De quantos
modos diferentes poderá ser formada a comissão?

Dos 18 deputados, você deve escolher 4 para formar a comissão.


Imagine que uma comissão possível seja formada pelos deputados A, B, C e D.
Veja que a ordem em que estão os deputados não importa, uma vez que se você
se referir à comissão como C, D, A e B estará se referindo à mesma comissão.
Isto significa que cada possível comissão corresponde a uma combinação dos
18 deputados (n) tomados 4 a 4 (k).

19
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Então o número de modos de formar a comissão é:

C18,4 = 18! = 18! = 18.17.16.15.14! = 15


4!(18–4)! 4!14! 4.3.2.1.14!

AUTOATIVIDADE

Antes de passar para o próximo tópico, olhe só a questão que estava no ENADE
2005 (questão 12) do curso de Licenciatura em Matemática.

Um restaurante do tipo self-service oferece 3 opções de entrada, 5 de prato principal e 4


de sobremesa. Um cliente desse restaurante deseja compor sua refeição com exatamente
1 entrada, 2 pratos principais e 2 sobremesas. De quantas maneiras diferentes esse
cliente poderá compor a sua refeição?

Tente você resolver esta situação! A dica é montar o esquema de possibilidades


de acordo com a quantidade de entradas, pratos principais e sobremesas que o
cliente vai comer. Saiba que a resposta é 180.

6 BINÔMIO DE NEWTON
Todo o estudo de Combinatória que você realizou até o momento servirá
para que você obtenha o desenvolvimento do Binômio de Newton, identificado
como (x + a)n, onde x ϵ R, a ϵ R e n ϵ N. Você também estudará propriedades
sobre os coeficientes desse desenvolvimento, o número de combinações de n
elementos tomados k a k, 0 ≤ k ≤ n.

6.1 O BINÔMIO DE NEWTON (X + A)n


Como você viu anteriormente, o número de combinações de n elementos
tomados k a k é também indicado por Cn,k ou n .
k

Assim, se tem:

n!
Cn,k = onde n ϵ N, k ϵ N e 0 ≤ k ≤ n
k!(n–k)!

6! 6! 6.5.4!
Exemplo 1: C6,2 = = = = 15
2!(6–2)! 2!(4)! 2.1.4!

9 9! 9.8.7.6!
Exemplo 2: C9,6 = = = = 84
6!(9–6)! 6!(3)! 6!.3.2.1

20
TÓPICO 1 | COMBINATÓRIA

ATENCAO

Há alguns casos particulares para k = 0, k = 1 e k = n. Veja a seguir:

n! = 1
a) Para k = 0 tem-se Cn,0 = 1 ou seja, sendo assim, Cn,0 = 1, para qualquer n ϵ N.
0!(n)!
n! n.(n–1)!
b) Para k = 1 tem-se Cn,1 = n ou seja, = = n sendo assim, Cn,1 = n,
1!(n–1)! 1(n–1)!
para qualquer n ϵ N*.

n! n!
c) Para k = n tem-se Cn,n = n ou seja, = = 1 sendo assim, Cn,n = 1, para
n!(n–n)! n!(0)!
qualquer n ϵ N.

Veja alguns exemplos:

C7,0 = 1 (pelo caso a)


C7,1 = 7 (pelo caso b)
C7,7 = 1 (pelo caso c)
C0,0 = 1 (pelo caso c)

6.2 TRIÂNGULO DE PASCAL


n
Os números k podem ser organizados em linhas e colunas, em formato
de triângulo, de uma maneira que em cada linha fiquem os de mesmo ‘numerador’
n e em cada coluna fiquem os de mesmo ‘denominador’ k. Esta disposição dos
números é o Triângulo de Pascal.

UNI

Lembre-se novamente de que podem ser utilizadas as duas formas de


identificação para combinação Cn,k ou n .
k

21
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

0
0
1 1
0 1
2 2 2
0 1 2
3 3 3 3
0 1 2 3
4 4 4 4 4
0 1 2 3 4
5 5 5 5 5 5
0 1 2 3 4 5
6 6 6 6 6 6 6
0 1 2 3 4 5 6
7 7 7 7 7 7 7 7
0 1 2 3 4 5 6 7
8 8 8 8 8 8 8 8 8
0 1 2 3 4 5 6 7 8

Substituindo pelo valor de cada combinação, o triângulo pode ser


visualizado assim:

1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1
1 8 28 56 70 56 28 8 1

Observe algumas particularidades do Triângulo de Pascal:

a) Cada linha inicia e termina em 1.


b) Ao somar dois elementos consecutivos de uma linha, você obtém o elemento
situado abaixo do segundo elemento somado. Por exemplo, observe as linhas
5 e 6 do Triângulo:

1 4 + 6 4 1
1 5 10 10 5 1

22
TÓPICO 1 | COMBINATÓRIA

Observe outras linhas e encontre esta particularidade do Triângulo de


Pascal.

6.3 DESENVOLVIMENTO DO BINÔMIO DE NEWTON (x + a)n


Observe o desenvolvimento de (x + a)n para alguns valores de n (n ϵ N):

Para n = 0, (x + a)0 = 1
Para n = 1, (x + a)1 = 1x + 1a
Para n = 2, (x + a)2 = 1x2 + 2xa + 1a2
Para n = 3, (x + a)3 = 1x3 + 3x2a + 3xa2 + 1a3

Veja que os coeficientes formam o Triângulo de Pascal e que em cada linha


os expoentes de x decrescem e os de a crescem.

AUTOATIVIDADE

Exercite agora mesmo. Desenvolva (x + a)n para n = 4 e para n = 5.

Isto sugere que em (x + a)n os coeficientes são os da linha de numerador n


do Triân­gulo de Pascal:

n n n ... n
0 1 2 n
(x + a)n = xn + n xn-1a + n xn-2a2 + ... + an
1 2

Observação:

Por serem os coeficientes do desenvolvimento do Binômio de Newton (x


+ a)n, os números n são denominados coeficientes binominais.
k
Para exercitar o desenvolvimento do Binômio de Newton, que tal
desenvolver (x + 2)4? Para isso, tome os coeficientes da linha de "numerador" 4 do
Triângulo de Pascal:

1 4 6 4 1

Obtém-se então, pelo desenvolvimento do Binômio de Newton, veja que


enquanto as potências de x decrescem, os de 2 aumentam.

23
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

(x + 2)4 = 1 · x4 · 20 + 4 · x3 · 21 + 6 · x2 · 22 + 4 · x1 · 23 + 1 · x0 · 24
(x + 2)4 = x4 + 8x3 + 24x2 + 32x + 16

Já para desenvolver (x - 2)4 aplica-se o mesmo método, porém lembre-se


de que x - 2 = x + (- 2), logo:

(x - 2)4 = 1 · x4 · (-2)0 + 4 · x3 · (- 2)1 + 6 · x2 · (- 2)2 + 4 · x1 · (- 2)3 + 1 · x0 · (- 2)4


(x - 2)4 = x4 - 8x3 + 24x2 - 32x + 16

Sendo assim, você sempre deverá olhar para a linha do “numerador” do


Triângulo de Pascal que corresponde ao n do Binômio de Newton (x + a)n, pois
serão os coeficientes do desenvolvimento do Binômio de Newton.

Em seguida, multiplicando pelos coeficientes, encontrados a partir do


Triângulo de Pascal, deverão se dispor os dois termos (x e a), lembrando que a
potência do primeiro termo decresce, enquanto a do segundo termo cresce.

Observe novamente o desenvolvimento de (x + 2)4.

Tem-se n = 4, então na linha 4 do Triângulo de Pascal, os coeficientes são:

1 4 6 4 1

Então o desenvolvimento de (x + 2)4 fica assim:

(x + 2)4 = 1 · x4 · 20 + 4 · x3 · 21 + 6 · x2 · 22 + 4 · x1 · 23 + 1 · x0 · 24

O que resulta em:

(x + 2)4 = x4 + 8x3 + 24x2 + 32x + 16

6.4 FÓRMULA DO TERMO GERAL


Quando desenvolvemos (x + a)n segundo potências decrescentes de x,
obtemos um polinômio cujos termos são:

Primeiro termo: xn que é igual a n xn–0a0


0
Segundo termo: n xn–1a1
1
Terceiro termo: n xn–2a2
2
n n–3 3
Quarto termo: x a
n
n n–n n
Último termo: an que é igual a x a
n

24
TÓPICO 1 | COMBINATÓRIA

A fórmula para obter um termo qualquer T do desenvolvimento de (x + a)n é:

Tk+1 = n xn–kak onde k ϵ N e 0 ≤ k ≤ n


n

Observe que:

a) para k = 0, T é o primeiro termo;


para k = 1, T é o segundo termo;
para k = 2, T é o terceiro termo;
para k = 3, T é o quarto termo.

Conclua com isso que para k = n, T é o termo de ordem (n + 1), que é o


último termo.

b) No desenvolvimento de (x + a)n há n + 1 termos.

c) Em cada termo o expoente de x somado ao expoente de a é igual a n.

Exemplo 1: No desenvolvimento de (x + 3)8, há 9 termos, pois n = 8.


Lembre-se de que o número de termos é sempre n + 1, ou seja, 9. Sendo assim, o
Termo Geral é dado por:

8 8–k k
T= x 3
k

Lembre que n é igual a 8 e que o expoente de x somado ao expoente de 3,


que é k, deve resultar em 8.

Que tal, para exercitar, obter o sexto termo? Para obter o sexto termo (n =
6), considere k = 5, pois k = n – 1.

Sexto termo ⇒ k = 5 ⇒ T = 8 x8–535 = 8! x3 · 243 = 13608x3


5 5!3!

E se fosse necessário obter o quarto termo? Vamos lá, pratique e desenvolva!

Relembrando! Parta do princípio de que no desenvolvimento de (x + 3)8


há 9 termos e que o termo geral é dado por:

T = 8 x8–k3k
k

25
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Como você quer saber o quarto termo (n = 4):

8 8–3 3
Quarto termo ⇒ k = 3 ⇒ T = x 3 = 8! x5 · 27 = 1512x5
3 3! 5!

Sendo assim, o quarto termo de (x + 3)8 é 1512x5.

A partir do exemplo 1 (x + 3)8 você calculou o quarto termo e o sexto


termo. Mas, e se fosse necessário desenvolvê-lo aplicando o que você estudou
sobre desenvolvimento do Binômio de Newton?

1° passo: Relembre o Binômio de Newton (x + a)n e o assemelhe com o


exemplo (x + 3)8, assim você tem a = 3 e n = 8.

2° passo: A partir do Triângulo de Pascal, encontre a linha de numerador


n, ou seja, a linha de numerador 8.

1 8 28 56 70 56 28 8 1

3° passo: Pelo desenvolvimento do Binômio de Newton, lembre que enquanto


as potências de x (primeiro termo) decrescem, as de 3 (segundo termo) aumentam.

(x + 3)8 = 1.x8.30 + 8.x7.31 + 28.x6.32 + 56.x5.33 + 70.x4.34 + 56.x3.35 + 28.x2.36 +


8.x1.37 +1.x0.38

(x + 3)8 = x8 + 24x7 + 252x6 + 1512x5 + 5670x4 + 13608 x3 + 20412 x2 + 17496x + 6561

Viu como é simples? Basta seguir os passos indicados para desenvolver


o Binômio de Newton. Aliás, com o desenvolvimento do Binômio de Newton a
partir do exemplo 1, você pode constatar e conferir que os valores para o quarto e
o sexto termo estavam corretos, de acordo com a resolução apresentada.

AUTOATIVIDADE

Agora, acadêmico(a), é com você!


Faça o mesmo procedimento do exemplo 1, só que utilize (x - 5)6. A sugestão
é que você encontre o terceiro e o quinto termos e desenvolva utilizando o
Binômio de Newton. Lembre-se dos passos a serem seguidos! E outra, lembre-
se de que (x - 5)6 é o mesmo que (x + (- 5))6.

26
TÓPICO 1 | COMBINATÓRIA

DICAS

Encerramos o Tópico 1 da Unidade 1. Para que você possa aprofundar seus


estudos, consulte os livros listados a seguir que estão à disposição na biblioteca do seu polo.
MELLO, Margarida P.; SANTOS, José Plinio O. dos; MURARI, Idani T. C. Introdução à análise
combinatória. Rio de Janeiro: Ciência Moderna, 2008.
MEYER, Paul L. Probabilidade: aplicações à estatística. Rio de Janeiro: LCT, 2000.

27
RESUMO DO TÓPICO 1
Neste tópico, você estudou:

• Princípio Fundamental da Contagem: se uma ação é composta de duas etapas


sucessivas, sendo que a primeira pode ser feita de m modos e, para cada um
destes, a segunda pode ser feita de n modos, então o número de modos de
realizar a ação é m·n. Este princípio pode ser generalizado para ações compostas
de mais de duas etapas.

• Fatorial: dado um número natural qualquer n, sendo n >1 define-se: n! = n · (n-


1) · (n-2) · ... · 3 · 2 · 1. Nos casos especiais n = 1 e n = 0 define-se 1! = 1 e 0! = 1.

• Permutação: denomina-se permutação de n elementos dados a toda sucessão


de n termos formada com os n elementos dados.
Pnn1, n2 , n3, ... nk = n! (n + n2 + n3 + ... + nk = n) quando há n elementos dos
n1! n2! n3!...nk! 1
quais n1 são repetidos de um tipo, n2 são repetidos de outro tipo, n3 são repetidos
de outro tipo e assim por diante.

• Combinação: denominam-se combinações de n elementos distintos tomados


k a k os conjuntos formados de k elementos distintos escolhidos entre os n
elementos dados.
n!
Cn,k = em que n é o número de elementos e k o número de maneiras de
k! (n–k)!
combinação dos elementos (k a k).
Lembre-se de que podem ser utilizadas as duas formas de identificação para
combinação Cn,k ou n .
k

• Arranjo: denominam-se combinações de n elementos distintos tomados k a k as


sucessões formadas de k termos distintos escolhidos entre os n elementos dados.
An,k = n! em que n é o número de elementos e k o número de maneiras de
(n–k)!
arranjo dos elementos (k a k).

• Binômio de Newton: no desenvolvimento de (x + a)n os coeficientes formam o


Triângulo de Pascal.
Em (x + a)n os coeficientes são os da linha de numerador n do Triân­gulo de Pascal:

n n n ... n
0 1 2 n
(x + a)n = (x + a)n = xna + n xn–1a + n xn–2a + ... + an.
1 1

28
Sempre verifique a linha do “numerador” do Triângulo de Pascal que
corresponde ao n do Binômio de Newton (x + a)n, pois serão os coeficientes do
desenvolvimento do Binômio de Newton.

Em seguida, multiplique pelos coeficientes, encontrados a partir do Triângulo


de Pascal, os dois termos (x e a), lembrando que a potência do primeiro termo
decresce, enquanto a do segundo termo cresce.

• Termo geral: a fórmula para obter um termo qualquer T do desenvolvimento


de (x + a)n é:
Tk+1 = n xn–kak onde k ϵ N e 0 ≤ k ≤ n.
k

29
AUTOATIVIDADE

Agora, acadêmico, é a sua vez de exercitar o que aprendeu até aqui! Lembre-
se de que você tem à disposição no “Material de Apoio” do Ambiente Virtual de
Aprendizagem os gabaritos das autoatividades. Consulte-os sempre que necessário.

Conte também com a Tutoria Interna do curso de Matemática, que está


disponível por meio do 0800, contato e atendimento on-line. Bons estudos!

1 Uma fábrica de bicicletas produz três modelos diferentes e para cada um


deles os clientes podem escolher entre cinco cores e dois tipos de assentos.
Além disso, opcionalmente, pode ser acrescentado o espelho retrovisor ou o
assento traseiro ou ambos. Quantos exemplares diferentes de bicicletas você
pode escolher nesta fábrica?

2 Quantos anagramas da palavra MATEMÁTICA apresentam as vogais juntas,


na ordem alfabética? E as vogais juntas, em qualquer ordem?

3 Com os algarismos ímpares, quantos números de quatro algarismos distintos,


maiores que 5 319, você pode escrever?

4 Um químico possui 10 tipos de substâncias. De quantos modos possíveis


pode associar 6 destas substâncias se, entre as 10, duas somente não podem
ser juntadas porque produzem mistura explosiva?

5 Na figura a seguir há 9 pontos, entre os quais não há 3 colineares, exceto os 4


que marcamos numa mesma reta. Quantos triângulos existem com vértices
nestes pontos?

H F

B C

A D

6 De uma novela participam 8 atores e 12 atrizes. Para uma cena que será filmada
na Europa, apenas 6 participantes deverão viajar, sendo 3 atores e 3 atrizes. De
quantos modos podem ser escolhidos os participantes desta cena?

7 Numa urna há 12 etiquetas numeradas, 6 com números positivos e 6 com


números negativos. De quantos modos podemos escolher 4 etiquetas
diferentes tais que o produto dos números nelas marcados seja positivo?

30
8 Na loteria são sorteados 6 números entre os naturais 0, 1, 2, 3, ..., 60. Quantos
são os resultados possíveis para o sorteio? Quantos são os resultados
possíveis formados por três números pares e três ímpares? Quantos são os
resultados possíveis com pelo menos quatro números pares?

9 Sobre uma mesa estão 4 copos de suco de laranja, 3 de caju e 2 de manga. De


quantos modos diferentes pode-se distribuí-los entre 9 crianças, dando um
copo de suco para cada uma?

10 De quantos modos podemos formar uma sucessão de três números naturais


(a, b, c), não necessariamente distintos, cuja soma é igual a 10?

11 0 gráfico da função y = ax + b no plano cartesiano é uma reta. Se a e b são


números inteiros, 1 ≤ a ≤ 9 e 1 ≤ b ≤ 9, quantas retas podem-se traçar?

12 Num restaurante, o cardápio oferece escolha entre cinco sopas, três pratos
principais, quatro sobremesas e seis bebidas. Uma refeição consiste
obrigatoriamente num prato principal e numa bebida, podendo ser
acrescidos, opcionalmente, de uma sopa, ou de uma sobremesa, ou de
ambas. Quantos tipos de refeições, todas diferentes entre si, podem-se fazer?

13 Uma fábrica de automóveis produz três modelos de carros. Para cada um, os
clientes podem escolher entre sete cores diferentes; três tipos de estofamento,
que podem vir, seja em cinza, seja em vermelho; dois modelos distintos de
pneus; e entre vidros brancos, ou vidros verdes. Ademais, opcionalmente
em um pacote, é possível adquirir os seguintes acessórios: um porta-copos;
uma de duas marcas de rádio ou um modelo de CD player; um aquecedor de
bancos; e um câmbio automático. Quantos exemplares de carros distintos
entre si a fábrica chega a produzir?

14 Deseja-se dispor em fila cinco estudantes para uma apresentação na escola:


Jairo, Débora, Emília, Cristiane e Rafael. Calcule o número das distintas
maneiras que elas podem ser dispostas de modo que Cristiane e Rafael
fiquem sempre vizinhos.

15 Considere os números obtidos do número 12 345 efetuando-se todas as


permutações de seus algarismos. Colocando esses números em ordem
crescente, qual o lugar ocupado pelo número 43 521?
16 Calcule quantos números múltiplos de três, de quatro algarismos distintos,
podem ser formados com 2, 3, 4, 6 e 9.

17 Uma pessoa faz uma relação de nomes de onze pessoas amigas. Calcule
de quantas maneiras ela poderá convidar cinco destas pessoas para jantar
sabendo-se que na relação há um único casal inseparável.

31
18 Num zoológico há dez animais, dos quais devem ser selecionados cinco
para ocupar determinada jaula. Se entre eles há dois que devem permanecer
sempre juntos, encontre o total de maneiras distintas de escolher os cinco
que vão ocupar tal jaula.

19 Tomam-se 6 pontos sobre uma reta e 8 pontos sobre uma paralela a esta
reta. Quantos triângulos existem com vértices nesse conjunto de 14 pontos?

20 A diretoria de uma empresa multinacional é constituída por 7 diretores


brasileiros e 4 japoneses. Quantas comissões de 3 brasileiros e 3 japoneses
podem ser formadas?

21 Uma urna contém 10 bolas brancas e 6 pretas. De quantos modos é possível


tirar 7 bolas das quais pelo menos 4 bolas sejam pretas?

22 Numa reunião de 20 professores, exatamente 6 lecionam Matemática. Qual


o número de comissões de 4 professores que podem ser formadas de modo
que exista no máximo um professor de Matemática na comissão?

23 Num exame, um professor dispõe de 12 questões que serão entregues


a três alunos, cada um recebendo quatro questões. Quantas situações
diferentes teremos?

24 Qual é o valor do termo médio do desenvolvimento de (2x + 1)8?

25 Determine o coeficiente de x3 do desenvolvimento de (4x – 5)5.

26 Determine o termo geral do desenvolvimento de (3x + 5)7.

27 Encontre o coeficiente de x5 no desenvolvimento de (1 - x)8.

28 Desenvolva (x + 6)5 a partir do Binômio de Newton.

29 Determine o quarto e o sétimo termos de (6 - x)8.

32
UNIDADE 1
TÓPICO 2

PROBABILIDADE

1 INTRODUÇÃO
É comum fazer previsões sobre certos acontecimentos, sobretudo quando
já se sabe algo anterior a determinado acontecimento. Um jogo de futebol
disputado entre os times A e B é um exemplo. Você pode se basear no número
de vitórias de A e prever que, por ter ganhado mais vezes e ter obtido melhores
resultados do que B, A será vencedor.

No entanto, existem fenômenos cujo resultado você não poderá prever,


mesmo que ele se repita inúmeras vezes e nas mesmas condições. Um bom
exemplo é o lançamento de um dado. Se você jogar um dado honesto (não
viciado), jamais poderá saber qual será o próximo resultado antes de lançá-lo.

São resultados como estes, imprevisíveis, que são chamados de aleatórios.


Para Fonseca e Martins (1996), os fenômenos aleatórios levam a diferentes
resultados: mesmo que se faça o experimento em condições normais e iguais,
não há como prever o resultado. Não há como prever, mas há como palpitar.
Justamente para que este palpite possa ser levado em consideração e seja coerente,
os matemáticos criaram a Teoria das Probabilidades.

A probabilidade quantifica a chance de alguma resposta para determinado


fenômeno. Essa quantificação será dada em forma de um número entre 0 e 1, em
que o 0 representa a resposta impossível, no fenômeno realizado, e o 1, a certeza
absoluta de que sairá a resposta, na próxima jogada. Um simples exemplo se dá
no lançamento de uma moeda. A probabilidade de sair cara é de 0,5, pois metade
das opções da moeda (cara ou coroa) representa a resposta esperada e nenhum
lado tem vantagem sobre o outro.

Quando se estuda a probabilidade, há dois conceitos importantes a


serem entendidos, o espaço amostral e o evento, pois eles subsidiarão os cálculos
iniciais. De certa maneira, a probabilidade é baseada no cálculo da razão entre
esses dois conceitos.

33
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

2 ESPAÇO AMOSTRAL
O espaço amostral nada mais é do que o conjunto de todas as soluções
possíveis dentro de um experimento qualquer, chamado S. O número de soluções
possíveis dentro do espaço amostral é chamado n(S). Compreenda esta definição
a partir de alguns exemplos:

Exemplo 1:

Ao lançar um dado de seis faces as soluções possíveis são 1, 2, 3, 4, 5 e 6.


Sendo assim, determine S e n(S).

S = {1,2,3,4,5,6}, todas as faces possíveis de um dado.


n(S) = 6, pois S possui 6 elementos.

Exemplo 2:

Levando em consideração as vogais do alfabeto, determine S e n(S).

S = {a,e,i,o,u}, ou seja, um conjunto com todas as vogais.


n(S) = 5 porque S possui 5 elementos.

Exemplo 3:

Considerando os naipes de um baralho, determine S e n(S).

S = {espadas, copas, ouros, paus}.


n(S) = 4.

UNI

Nos exemplos apresentados até aqui fica fácil determinar o espaço amostral,
porém há casos em que o espaço amostral tem uma quantidade de elementos muito grande.
Em casos como estes será necessário que você utilize as técnicas de contagem estudadas no
Tópico 1, afinal, para o cálculo de probabilidade, o que interessa é a quantidade de elementos.

Exemplo 4:

Se você lançar um dado de seis faces duas vezes, qual será o S e o n(S)?
Lembre-se do Princípio Fundamental da Contagem, pois você tem duas
etapas com seis maneiras cada uma. Assim, para cada número que sair no primeiro
lançamento há seis opções de números para o segundo lançamento!

34
TÓPICO 2 | PROBABILIDADE

S = {(1,1), (1,2),...,(2,3),...,(3,4),...,(4,5),...(5,6),...,(6,6)}
n(S) = 36.

Exemplo 5:

E se você quiser saber o S e o n(S) que resultam do jogo de seis dezenas


feito na mega-sena?

Lembre-se de que você quer saber quantas combinações simples de 6


elementos pode formar com os 60 números. Sendo assim, para determinar o n(S),
basta aplicar a fórmula da combinação:

60!
C60,6 = = 50036860, ou seja, o n(S) é 50.063.860.
6!54!

O S seria o conjunto com todas as 50.063.860 possibilidades de jogos!

UNI

Para os cálculos de probabilidades o n(S) é utilizado, portanto, não se preocupe


com o tamanho do espaço amostral, pois, em casos como os do exemplo 5, você não
precisaria listar as 50.063.860 combinações para determinar o S.

3 EVENTO
O evento é um subconjunto do espaço amostral, ou seja, uma parte de
S. O evento pode ser considerado também o conjunto das respostas esperadas,
podendo ser representado por uma letra maiúscula (A, B,…, Z). Neste caso, o n(A,
B,…, Z) identifica o número de respostas esperadas. Compreenda esta definição
também com base em alguns exemplos:

Exemplo 1:

Suponha que você lançou um dado e quer saber a probabilidade de sair


um número menor ou igual a três.

As soluções são sair o 1 ou o 2 ou o 3 no lançamento do dado. Então o evento


pode ser chamado de A = {1,2,3}. Assim, n(A) = 3, pois há 3 elementos no conjunto A.

Exemplo 2:

E se você sortear, ao acaso, entre as 21 consoantes do alfabeto, alguma


que está na palavra PROBABILIDADE? Veja que na palavra PROBABILIDADE

35
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

existem as consoantes p, r, b, l e d. Então, o evento B será sortear, entre as


consoantes existentes, as consoantes (p, r, b, l, d), logo, B = { p, r, b, l, d } e n(B) = 5.

Exemplo 3:

Você deve obter um número ímpar, entre os números de 2 dígitos distintos,


que se podem formar com os dez algarismos de 0 a 9.

Para um número ser ímpar, o dígito da unidade deve terminar em 1,


3, 5, 7 ou 9.

Para calcular pode-se primeiro escolher o dígito da unidade (5 modos) e


depois escolher o dígito da dezena (5 modos). Assim, se o evento fosse identificado
como D, n(D) seria 5 · 5 = 25, ou seja, os números ímpares formados. Da mesma
forma, D seria o conjunto dos 25 números ímpares formados.

4 PROBABILIDADE
A probabilidade é uma função que associa um número real, entre 0 e 1, à
chance de ocorrência de um evento qualquer A, dentro de um espaço amostral S.
A probabilidade de ocorrer o evento A é identificada como P(A) e calculada por

n(A)
P(A) =
n(S)

onde:
A = conjunto evento
S = conjunto espaço amostral
n(A) = número de elementos do conjunto A
n(S) = número de elementos do conjunto S
P(A) = probabilidade de ocorrer A.

Existem algumas propriedades relacionadas à probabilidade de A,


listadas a seguir:

(i) 0 ≤ P(A) ≤ 1

Se A é subconjunto de S, pode-se afirmar que n(A) ≤ n(S), o que implica


que P(A) é um número entre 0 e 1.

ii) P(S) = 1

n(S)
Se P(S) = então P(S) = 1.
n(S)

iii) Se A = 0 então P(A) = 0


n(A) 0
Se A = 0, tem-se n(A) = 0, com isso P(A) = = =0
n(S) n(S)
36
TÓPICO 2 | PROBABILIDADE

iv) P(A) + P(A) = 1, onde A é o conjunto “não A”, chamado de


complementar de A.

Veja que, se S é o universo, então os subconjuntos A obecederão à


propriedade: n(A) + n(A) = n(S).
n(A) n(A) n(A) + n(A) n(S)
Então: P(A) + P(A) = + = = =1
n(S) n(S) n(S) n(S)

Compreenda detalhadamente por meio dos exemplos a seguir:

Exemplo 1:

Determine a probabilidade de sortear, ao acaso, uma carta de copas de um


baralho comum.

Solução:

A = sair carta de copas


A = {copas}
S = todos os possíveis naipes de um baralho
S= {copas, espadas, ouros, paus}
n(A) = 1
n(S) = 4

P(A) = n(A) = 1 = 0,25


n(S) 4

NOTA

Um baralho comum tem 52 cartas, divididas em 4 naipes (espadas, copas, ouros


e paus) e cada naipe possui 13 cartas (2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K, A).

37
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Exemplo 2:

Qual é a probabilidade de a face que cair voltada para cima ser um número
menor ou igual a três, no lançamento de um dado de seis faces?

Solução:

B = sair, no dado, as faces 1 ou 2 ou 3 = {1,2,3}


S = as faces de um dado = {1,2,3,4,5,6}
n(B) = 3
n(S) = 6

P(B) = n(B) = 3 = 1 = 0,5


n(S) 6 2

Exemplo 3:

Qual é a probabilidade, ao sortear uma letra do alfabeto, de esta ser uma


vogal a ou i?

Solução:

C = sortearmos uma vogal = {a, i }


S = o alfabeto completo = {a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z}
n(C) = 2
n(S) = 26

P(C) = n(C) = 2 = 1 = 0,0769


n(S) 26 13

5 PROBABILIDADE DA UNIÃO DE EVENTOS


A união de eventos pode ser caracterizada de duas maneiras, pois existem
eventos mutuamente exclusivos e eventos não mutuamente exclusivos. Observe
o esquema a seguir que representa esta diferença:

A B A B
A∩B

Não mutuamente exclusivo Mutuamente exclusivo


A∩B ≠ Ø A∩B ≠ Ø

38
TÓPICO 2 | PROBABILIDADE

Para identificar se o evento é mutuamente exclusivo ou não mutuamente


exclusivo, basta identificar a intersecção entre os eventos. A diferença é que a
intersecção pode existir ou não. Resumindo, eventos mutuamente exclusivos
têm intersecção existente, já os não mutuamente exclusivos não têm intersecção
existente, sendo representada pelo conjunto vazio. Segundo Machado (1986),
quando A e B são eventos mutuamente exclusivos, A∩B = conjunto vazio, a
ocorrência de um deles não implica a não ocorrência do outro.

Exemplo 1: Evento mutuamente exclusivo

Considerando um baralho completo (52 cartas), vejamos a probabilidade


de sair uma dama ou um rei.

Eventos:
A = sair dama.
n(A) = 4
B = sair rei.
n(B) = 4
A∩B = conjunto vazio, pois não há carta que é, ao mesmo tempo, dama e rei.

Exemplo 2: Evento não mutuamente exclusivo

Considerando um baralho completo (52 cartas), vejamos a probabilidade


de sair uma carta de paus ou uma dama.

Eventos:
A = sair qualquer carta de paus.
n(A) = 13
B = sair qualquer dama.
n(B) = 4
A∩B = damas de paus
n(A∩B) = 1, pois existe uma dama de paus no baralho comum.

Agora, pense o que acontece na união entre os eventos A e B nos dois


exemplos anteriores. Primeiramente, analisaremos o caso do exemplo 1, no qual
a intersecção entre A e B é vazia.

Unindo os eventos A e B (damas ou reis), qual é o total de cartas diferentes?


A resposta é 8 cartas, 4 damas e 4 reis. Então, você pode pensar que o número de
elementos da união desses dois conjuntos é a soma do número de elementos de
cada conjunto: n (A U B) = n (A) + n (B).

Assim, pela demonstração, a probabilidade de sair uma dama ou um rei,


ao retirar-se uma carta de um baralho normal, será:
n(A∪B) n(A) n(B)
P(A∪B) = = + = P(A) + P(B)
n(S) n(S) n(S)
Ou seja, P(A U B) = P(A) + P(B).
39
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Analisando o exemplo 2, perceba que o conceito acima tem que ser


ajustado, porque, unindo os eventos A e B (paus e dama), dá um total de 16 cartas,
mas, se fizer n(A) + n(B), dará 17.

Parece que está errado? Mas não está! Está correto! Veja bem, como a
intersecção no caso acima é vazia, omitiu-se sua interferência no cálculo. Porém,
no exemplo 2, como a intersecção existe, acaba interferindo.

Em relação aos conjuntos não mutuamente exclusivos temos n (A U B) =


n (A) + n (B) – n (A U B).

Pela demonstração a seguir, a probabilidade entre conjuntos não


mutuamente exclusivos é:

n(A∪B) n(A) + n(B) – n(A∩B) n(A) n(B) n(A∩B)


P(A∪B) = = = + – = P(A∪B) =
n(S) n(S) n(S) n(S) n(S)
P(A) + P(A) + P(B) – P(A∪B)

Resumindo, a probabilidade da união entre dois eventos A e B será:

P(A U B) = P(A) + P(B) quando A e B são mutuamente exclusivos.

P(A U B) = P(A) + P(B) – P(A ∩ B) quando A e B são não mutuamente


exclusivos.

Exemplo 3:

Numa urna, há 10 bolas verdes, 8 azuis e 4 brancas. Qual é a probabilidade


de uma bola azul ou branca ser retirada, ao acaso?

Solução:

A = sair bola azul.


n(A) = 10, pois há 10 bolas desta cor na urna.
B = sair bola branca.
n(B) = 4, pois há 4 bolas desta cor na urna.
S = todas as bolas da urna.
n(S) = 22, pois há 10 verdes, 8 azuis e 4 brancas.
A∩B = bola branca e azul ao mesmo tempo.
n(A∩B) = 0, pois não há bola assim na urna.

Como a intersecção é vazia, os eventos são mutuamente exclusivos. Então,


a probabilidade de sair bola azul ou branca é dada pela união dos eventos A e B.

P(A∪B) = P(A) + P(B) = 10 + 4 = 14 = 7 = 0,6364


22 22 22 22

40
TÓPICO 2 | PROBABILIDADE

Exemplo 4:

Numa empresa há 150 funcionários. Foi ofertada a possibilidade da


prática de esportes uma vez por semana nas quadras da empresa. Entre as várias
opções de esportes que cada funcionário pôde escolher, 80 escolheram futebol
e 25 escolheram basquete. Sabe-se que 10 desses funcionários praticam os dois
esportes. Qual a probabilidade de sortear, ao acaso, um funcionário dessa empresa
que pratica basquete ou futebol?

Solução:

A = pratica futebol · n(A) = 80.


B = pratica basquete · n(B) = 25.
A ∩ B = pratica basquete e futebol · n(A ∩ B) = 10.
S = todos os funcionários da empresa.
n(S) = 150.

Como a intersecção não é vazia, temos um caso de eventos não mutuamente


exclusivos. Com isso, a probabilidade da união dos eventos A com B será:

80 25 10 95
P(A) + P(B) – P(A∩B) = + – = = 0,6334
150 150 150 150

UNI

Se na pergunta do exercício de probabilidade aparecer a conjunção OU


entre os eventos, como nos exemplos anteriores, você deverá calcular a união entre os
eventos envolvidos.

41
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

6 PROBABILIDADE CONDICIONADA
Mas, e se você quiser calcular a probabilidade de ocorrerem eventos
seguidos? Por exemplo, se você jogar mais de uma vez um dado? Como você
vai calcular a probabilidade? Nesses tipos de problemas, em que os eventos são
repetidos algumas vezes, podem existir casos com reposição ou casos sem reposição.
Acompanhe esta diferença e o cálculo para estes casos nos exemplos a seguir.

Exemplo 1:

Considere um lote de 200 peças, no qual 190 são perfeitas e 10 têm defeitos.
Qual a probabilidade de retirar, ao acaso, duas peças com defeito desse lote?

A = retirar a primeira peça com defeito


B = retirar a segunda peça com defeito

Com reposição:

Você tira a primeira peça, devolve-a ao lote novamente antes de tirar a


segunda peça. Observe que P(A) = n(A) = 10 = 0,05 e a peça tirada é reposta no
lote P(B) = n(B) = 10 = 0,05 n(S) 200
n(S) 200

Sem reposição:

A primeira peça retirada do lote não participa do sorteio para a retirada da


segunda peça. Sendo assim, P(A) não muda, ou seja, P(A) = 0,05. Mas, como a peça
retirada não é reposta, restam 9 peças defeituosas de um total de 199 peças, então:
n(B) 9
P(B) = = ≅ 0,045.
n(S) 199

De um baralho de 52 cartas, foram retiradas, aleatoriamente e sem


reposição, duas cartas. Sabendo que a primeira carta retirada é de espadas, qual é
a probabilidade de a segunda carta ser uma dama vermelha?

Neste caso, a segunda probabilidade (B) é influenciada pela ocorrência da


primeira (A), o que caracteriza uma probabilidade condicionada, chamada P(B/A)
(lê-se: probabilidade de B se ocorreu o evento A).

Para calcular P(B/A), basta saber que você está calculando P(B) em relação
ao espaço amostral A, e não ao espaço amostral S.

Suponha que ocorreu o evento A, ou seja, já foi feita a primeira etapa


do processo (foi retirada uma carta de espadas). Como você vai calcular a
probabilidade de ocorrer B, sendo que já ocorreu A, ou seja, P(B/A)?

42
TÓPICO 2 | PROBABILIDADE

Basta imaginar que o espaço amostral é o conjunto A e que a única maneira


de ocorrer elementos de B no conjunto A é na intersecção dos dois. Então:

n(A∩B)
n(A∩B) n(S) n(A∩B)
P(B/A) = = =
n(A) n(A) n(A)
n(S)
n(A∩B)
Ou seja: P(B/A) =
n(A)
1
Analisando a situação do exemplo tem-se que P(B/A) =
13

Para chegar ao resultado, usando a fórmula P(B/A) = n(A∩B) , tem-se:


n(A)

B: sair dama vermelha (na segunda retirada).


A: sair carta de espadas (na primeira carta).
n(S) = 52
n(A) = 13
P(A) = 13/52
n(A∩B) = 1
P(A∩B) = 1/52

1
P(B/A) = 52 = 1
13 13
52

Exemplo:

Em um grupo de 40 estudantes do Ensino Médio existem as seguintes


características:

SEXO
IDADE TOTAL
M F
Menos de 15 anos 15 12 27
Mais de 15 anos 5 8 13
TOTAL 20 20 40

Qual é a probabilidade de sortear, ao acaso, entre os estudantes, um


menino, sabendo que ele tem mais de 15 anos?

Solução: 5
Olhando o quadro, sabemos que a probabilidade é P(B) = 20 , onde B é o
evento de ser menino e, nesse caso, o espaço amostral desconsidera as meninas,
pois se afirma que o sorteado é menino!

43
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Também deve ser feito o cálculo de P(B/A), onde A é o evento de ser


menino e B o evento de ter mais de 15 anos:

5
P(A∩B) 40 5
P(B/A) = = =
P(A) 20 20
40

Veja que das duas maneiras o resultado é o mesmo.

7 TEOREMA DA MULTIPLICAÇÃO
O Teorema da Multiplicação permite calcular a probabilidade de
ocorrência simultânea de dois eventos a partir das probabilidades condicionais.

A partir da fórmula P(B/A) do cálculo da probabilidade condicionada,


tem-se:

P(A ∩ B) = P(A) · P(B/A) ou P(A ∩ B) = P(B) · P(A/B)

Levando em consideração o exemplo 1 (das peças), do item anterior,


considere um lote de 200 peças, no qual 190 são perfeitas e 10 têm defeitos.

Qual é a probabilidade de serem retiradas, ao acaso, duas peças com


defeito desse lote? A probabilidade de retirada, sem reposição, de duas peças
com defeito é dada por:

A = retirar a primeira peça com defeito.


B = retirar a segunda peça com defeito

10 1 9
P(A) = = e P(B/A) =
200 20 199
1 . 9 9
P(A∩B) = P(A).P(B/A) = = ≅ 0,0023
20 199 3980

9
Calcular P(B/A) = 199 é fácil, pois como a primeira peça retirada tinha
defeito, ficaram ainda 9 peças com defeito e 190 peças perfeitas.

No caso particular, em que os eventos são independentes (com reposição),


e o evento anterior não afeta a probabilidade do evento posterior (caso a, do
item 5), temos que

P(B/A) = P(B), então, P(A ∩ B) = P(A) · P(B).

Para Lipschutz (1993) um evento B é dito independente de um evento A,


se a probabilidade de B ocorrer não é influenciada pelo fato de A ter ocorrido ou
não. Assim, a probabilidade de retirar, com reposição, duas peças com defeito é:
44
TÓPICO 2 | PROBABILIDADE

10 1 10 1
P(A) = = e P(B/A) = P(B) = =
200 20 200 20
1 1
Assim, P(A∩B) = P(A).(P(B) = . = 0,0025
20 20

Nos exemplos a seguir, você poderá identificar outros casos com e sem
reposição.

ATENCAO

Fique atento(a) ao uso do e e do ou para detectar se é ou não um caso de


intersecção.

Exemplo 1:

Qual é a probabilidade de, em duas retiradas com reposição, saírem duas


cartas de copas de um baralho normal?

Solução:

Calcule a probabilidade de sair copas na primeira carta e copas na segunda


carta. Lembre que o e representa um caso de intersecção!

A = sair a primeira carta de copas.


n(A) = 13, pois há 13 cartas deste naipe no baralho.
B = sair a segunda carta de copas.
n(B) = 13, pois há 13 cartas deste naipe no baralho.

Como o problema é com reposição, o primeiro evento A não influencia o


evento secundário B, ou seja, eles são independentes. Veja:

13 13 1
P(A∩B) = P(A).P(B) = . = = 0,0625
52 52 16

45
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Exemplo 2:

Qual é a probabilidade de, em duas retiradas sem reposição, saírem duas


cartas de copas de um baralho normal?

Solução:

Mesmo que agora o segundo evento B seja influenciado pelo primeiro


evento A, pois não há a reposição da primeira carta de copas, o objetivo é calcular
a probabilidade de sair copas na primeira carta e sair copas na segunda carta. Veja
que novamente há um caso de intersecção de eventos!

A = sair a primeira carta de copas.


n(A) = 13, pois há 13 cartas deste naipe no baralho.
B = sair a segunda carta de copas.
n(B) = 12 e
n(S) = 51, pois o evento é sem reposição, e o evento A influencia no evento
B e no espaço amostral S.

13 12 156
P(A∩B) = P(A).P(B) = . = = 0,0588
52 51 2652

Exemplo 3:

Uma urna contém 2 bolas pretas e 3 bolas brancas. Qual é a probabilidade


de retirar duas bolas, ao acaso e sem reposição, e sair uma bola branca e uma preta?

Solução:

Nesse caso, fique atento(a) à ordem em que as bolas estão saindo, pois
pode-se obter a bola branca na primeira retirada e a bola preta na segunda retirada
ou ao contrário. São dois casos, veja:

1° caso:
A = sair bola branca na primeira retirada.
B = sair bola preta na segunda retirada.

P(A∩B) = P(A).P(B/A) = 3 . 2 = 6 = 0,3


5 4 20

2º caso:
B = sair bola preta na primeira retirada.
A = sair bola branca na segunda retirada.

P(B∩A) = P(B).P(A/B) = 2 . 3 = 6 = 0,3


4 5 20

46
TÓPICO 2 | PROBABILIDADE

Juntando os dois casos, devido à conjunção alternativa ou, temos:

P[(A ∩ B) U (B ∩ A)] = 0,3 + 0,3 = 0,6

NOTA

É possível chegar à resposta 0,6 multiplicando o primeiro caso por 2. Esse


número representa a quantidade de combinações possíveis de A e B.

47
RESUMO DO TÓPICO 2
Neste tópico, você estudou:

• Espaço Amostral (chamado S) é o conjunto de todas as soluções possíveis


relativas a um experimento qualquer.

• Evento é uma parte do Espaço Amostral.

• A probabilidade de ocorrer um evento A é identificada como:


n(A) número de resultados associados ao evento A
P(A) = =
n(S) número de resultados possíveis

• A probabilidade da união entre dois eventos A e B será:


P(A ∪ B) = P(A) + P(B), se A e B são mutuamente exclusivos
P(A ∪ B) = P(A) + P(B) - P(A ∩ B), se A e B são não mutuamente exclusivos

• A probabilidade de ocorrer o evento B, dado que ocorreu o evento A, é:


P(A∩B)
P(A/B) =
P(A)

• A probabilidade de ocorrer o evento A e B é:


P(A ∩ B) = P(A). P(B/A), se A e B são eventos dependentes
P(A ∩ B) = P(A). P(B) se A e B são eventos independentes

48
AUTOATIVIDADE

Agora, acadêmico, é a sua vez de exercitar o que aprendeu até aqui.


Lembre-se de que você tem à disposição no “Material de Apoio” do Ambiente
Virtual de Aprendizagem os gabaritos das autoatividades. Consulte-os
sempre que necessário.

Conte também com a Tutoria Interna do curso de Matemática, que está


disponível por meio do 0800, contato e atendimento on-line. Bons estudos!

1 Se você tiver em mãos um baralho comum de 52 cartas, determine a


probabilidade de, ao retirar aleatoriamente uma carta do baralho, você pegar:
a) Uma carta vermelha.
b) Um rei.
c) Um 6 de espadas.
d) Um 10 vermelho ou um 4 preto.
e) Uma figura (J, Q ou K).

2 Suponha que você lançou um dado equilibrado apenas uma vez. Determine
então a probabilidade de a face de cima conter:
a) Um 3.
b) Um número par.
c) Um número ímpar.
d) Um número menor que 6.

3 Agora, suponha que você lançou um dado equilibrado duas vezes e


observou a face que caiu voltada para cima. Determine:
a) Os elementos do espaço amostral.
b) Os elementos do evento B: sair soma 7 em suas faces.
c) Os elementos do evento C: sair o mesmo número em ambas as faces.
d) Os elementos do evento D: sair soma menor que 10 em suas faces.
e) Os elementos do evento E: sair soma maior que 12 em suas faces.

4 No famoso jogo de loteria, a mega-sena, são sorteadas 6 dezenas. Você pode


montar seu jogo escolhendo algumas entre as 60 dezenas. Suponha que
você escolheu 10 dezenas, qual é a probabilidade de você acertar:
a) 4 dezenas?
b) 5 dezenas?
c) 6 dezenas?

5 Você jogou dois dados perfeitos e pretende analisar a soma das faces
voltadas para cima. Qual é a probabilidade de essa soma ser 6?

6 Num sorteio de um número natural de 1 a 150, qual é a probabilidade de


sair um número múltiplo de 10 ou de 15?

49
7 No lançamento simultâneo de um dado honesto e uma moeda honesta,
qual é a probabilidade de se obter um 5 ou uma cara?

8 Uma urna contém 9 bolas verdes numeradas de 1 a 9 e 6 bolas azuis numeradas


de 10 a 15. Se você, ao acaso, retirar uma das bolas, qual será a probabilidade:
a) De sair uma bola verde?
b) De sair uma bola com número ímpar?
c) De sair uma bola azul com número par?

9 Uma máquina produziu 200 peças, das quais 25 estavam com defeito. Ao
retirar, aleatoriamente, 4 peças, com reposição, qual é a probabilidade de que:
a) Todas sejam perfeitas?
b) Todas tenham defeito?
c) Pelo menos uma seja perfeita?
d) Pelo menos uma tenha defeito?

10 Numa sala de aula com 28 estudantes, 15 são meninos e 12 são morenos,


dos quais 7 são meninas. Escolhendo um estudante ao acaso, qual é a
probabilidade de ele ser moreno ou menina?
2
11 A probabilidade de que o filho de um casal nasça com olhos verdes é 3 . Se
o casal tiver três filhos, qual é a probabilidade de todos terem olhos verdes?
E de nenhum ter olhos verdes? E de pelo menos um ter olhos verdes?

12 Um grupo de 83 estudantes apresenta, de acordo com o sexo e a altura, a


seguinte situação:

Menos de 1,40 m De 1,40 m a 1,60 m Mais de 1,60 m

Meninos 15 12 8

Meninas 11 24 13

Escolhendo uma pessoa desse grupo ao acaso, determine:


a) A probabilidade de ser um menino.
b) A probabilidade de ser uma menina com menos de 1,40 m.
c) A probabilidade de ser um menino, se o escolhido tiver de 1,40 m a 1,60 m.
d) A probabilidade de ser uma menina, se o escolhido tiver no máximo 1,60 m.

13 Uma prova é composta por 15 questões e cada uma possui 4 alternativas,


das quais apenas uma é correta. Para alguém que esteja respondendo
aleatoriamente uma alternativa em cada questão, qual é a probabilidade de:
a) Acertar as 15 questões?
b) Errar as 15 questões?
c) Acertar 2 das questões?
3

50
UNIDADE 1
TÓPICO 3

TEOREMA DE BAYES

1 INTRODUÇÃO
Como você estudou no tópico anterior, a probabilidade está presente
em diversas situações do seu cotidiano e há diferenciadas maneiras de calcular
e prever como os eventos ocorrerão. Uma das opções de cálculo mais usadas
pelos estatísticos nas previsões ainda hoje é a que foi desenvolvida no século
XVIII por Thomas Bayes (1702-1761). A ideia de Thomas Bayes para o cálculo de
probabilidades ficou conhecida como Teorema de Bayes.

Com este teorema, Bayes inseriu certa subjetividade na previsão de um


evento, ou seja, para ele a opinião de quem manuseia os números está presente de
modo significativo nos cálculos. Essa opinião é baseada nas informações que você
tem sobre as condições de ocorrer o evento, e certamente vão influenciar a previsão.

Por exemplo, numa disputa de cara ou coroa, você certamente concorda


que a chance de ganhar é de 50%. Mas se a moeda for jogada três vezes, segundo
Bayes, a previsão deve ser ajustada a cada jogada. Imagine que nas duas primeiras
jogadas deu ‘cara’, então a chance para a terceira jogada não será mais de 50%.

Outro exemplo comum do que propôs Bayes é o possível resultado de


um jogo de futebol. Se você quer prever a chance de um time A vencer um time
B, deve levar em conta as informações que se têm sobre resultados das partidas
anteriores, como, por exemplo, quantas vezes A venceu B e vice-versa, além de
levar em consideração as opiniões de especialistas sobre o jogo, sobre os times,
sobre o campeonato e sobre os jogadores.

Usar o cálculo da probabilidade é justamente fazer palpites sobre


determinados eventos, se vão ocorrer ou não. Apesar de estar baseado rigidamente
na lógica e na razão, o Teorema de Bayes passou por várias controvérsias à
medida que os estudos sobre probabilidade e estatística evoluíam. Ainda hoje
Bayes é criticado por incluir a subjetividade no ajuste dos cálculos. Sob o ponto
de vista dos matemáticos conservadores e focados na objetividade, basear-se no
“achismo” e na intuição não é correto.

51
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Atualmente o Teorema de Bayes pode ser aplicado em quase todas as


áreas do conhecimento, nas pesquisas científicas ou no cotidiano das pessoas.
Autoridades de saúde pública não podem deixar de usar os cálculos probabilísticos
na previsão de alcance de uma epidemia. As economias mundiais não vivem
mais sem a previsão de inflação, desemprego ou da alta ou baixa da cotação das
moedas. Apesar de sempre terem sido criticados, Thomas Bayes e suas ideias
continuam desafiando a intuição e o “achismo” nas apostas e palpites diários.

2 TEOREMA DE BAYES
Com base no que você estudou até aqui, lembre-se de que a probabilidade
condicional permite obter a probabilidade de ocorrer um evento A, dado que
ocorreu o evento B anterior a A. Porém, você também pode querer saber o
contrário, ou seja, a probabilidade de um evento anterior A ter ocorrido, sabendo
que um evento posterior B ocorreu.

Sendo assim, o Teorema de Bayes relaciona a probabilidade de ocorrer um


evento posterior à probabilidade de um evento anterior ter ocorrido.

Seja um espaço amostral S subdividido em vários eventos A1, A2, A3,...,


Ak que satisfazem as propriedades:

a) Ai ∩ Aj = ∅, para i ≠ j em que todos os eventos Ai são mutuamente exclusivos.


k
b) UAi = S em que a união de todos os eventos Ai é igual ao espaço amostral.
i=1

c) P(Ai) > 0, para todo i em que a probabilidade de qualquer evento Ai é maior


que zero.

Além disso, B é um evento qualquer de S.

Observe um caso particular de k = 4 e depois entenda a generalização


da ideia.

A2 S
A1
A3
B
A4

52
TÓPICO 3 | TEOREMA DE BAYES

Observe que a probabilidade de ocorrer o evento B, representado na figura


pela área elíptica mais escura, é:

P(B) = P(B ∩ A1) + P(B ∩ A2) + P(B ∩ A3) + P(B ∩ A4) (a)

Essa igualdade é válida porque todos os Ai são mutuamente exclusivos


dois a dois. Observe, ainda, que a probabilidade de ocorrer o evento B, dado que
ocorreu, por exemplo, o evento A1 é P(B/A ) = P(B∩A1) ou que a probabilidade de
1
P(A1)
ocorrer B e A1 é P(B ∩ A1) = P(A1) · P(B/A1).
Portanto, a probabilidade de ocorrer B e Ai será:

P(B ∩ A1) = P(A1) · P(B/A1) (b)

Substituindo (b) em (a), temos:

P(B) = P(A1) · P(B/A1) + P(A2) · P(B/A2) + P(A3) · P(B/A3) + P(A4) · P(B/A4)

Para saber a probabilidade de ocorrer, por exemplo, A1, dado que


ocorreu B, é:

P(A1∩B) P(A1) P(B/A)


P(A1/B) = =
P(B) P(A1)P(B/A1)+P(A2)P(B/A2)+P(A3)P(B/A3)+P(A4)P(B/A4)

Generalizando para k € N, sendo k ≥ 1, tem-se a fórmula do Teorema de Bayes:

P(Ai∩B) P(Ai) P(B/A)


P(Ai/B) = =
P(B) P(A1).P(B/A1)+P(A2).P(B/A2)+...+P(Ak).P(B/Ak)

O Teorema de Bayes também revela o Teorema da Probabilidade Total, no


denominador, e representa a probabilidade de ocorrer o evento B.

3 EXEMPLOS DE APLICAÇÕES DO TEOREMA DE BAYES


Exemplo 1:

Imagine que você está diante de duas urnas. Uma urna (U1) contém 4 bolas
amarelas e 3 pretas. Uma segunda urna (U2) contém 6 bolas amarelas e 2 pretas.
Escolhe-se uma urna ao acaso e dela se retira uma bola ao acaso, verificando que
ela é amarela. Qual é a probabilidade de ela ter vindo da urna U1?

Resolução:
Lembrando que existem duas urnas, considere A o evento: sair bola amarela.

53
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

- A probabilidade de escolher uma das urnas é 1/2.


P(U1) = P(U2) = 1/2.

- A probabilidade de sair bola amarela, dado que se escolheu a U1, é 4/7. P(A/
U1) = 4/7

- A probabilidade de sair bola amarela, dado que se escolheu a U2, é 6/8.


P(A/U2) = 6/8 = 3/4

Você quer saber a probabilidade de a bola ter vindo da U1, dado que saiu
uma bola amarela, ou seja, P(U1/A) = ?

Aplique o Teorema de Bayes:

1. 4
P(U1∩A) P(U1).P(A/U1) 2 7
P(U1/A)= = =P(U1/A)= =
P(A) P(U1).P(A/U1)+P(U2).P(A/U2) 1.4 1 . 3
+
2 7 2 4
4 4
14 = 14 = 448 ≅ 0,4324
4 3 74 1036
+
14 8 112

Como a probabilidade de escolher as urnas é igual, a probabilidade de a


bola sorteada ter saído da U2 é maior que a probabilidade de ela ter saído da U1,
pois a P(A/U2) é maior que a P(A/U1).

Exemplo 2:

Considerando os mesmos números do exemplo 1, qual é a probabilidade


de a bola escolhida ser amarela?

Resolução:

A = sair bola amarela.

Você deverá calcular a probabilidade de ocorrer A, mas lembre-se de que


A é um conjunto dividido em duas partições do espaço amostral. Há uma parte
das bolas brancas em U1 e outra parte em U2. Assim:

P(A)=P(U1∩A)+P(U2∩A)=P(U1).P(A/U1)+P(U2).P(A/U2)= 1 . 4 + 1 . 3 = 4 . 3 = 74 ≅ 0,6607
2 7 2 4 14 8 112

Veja que o que se fez foi apenas aplicar o Teorema da Probabilidade Total.
A resposta é igual ao denominador do Teorema de Bayes, do exemplo 1, confira.

54
TÓPICO 3 | TEOREMA DE BAYES

Exemplo 3:

Uma empresa possui 4 máquinas que fazem os mesmos tipos de peças


(X, Y, Z) e que se distinguem pela nacionalidade. A probabilidade das peças
defeituosas de cada máquina é apresentada no seguinte quadro:

Probabilidade de peças defeituosas


Nacionalidade
da Máquina
X Y Z

Americana 0,15 0,21 0,10

Brasileira 0,10 0,20 0,15

Chinesa 0,12 0,18 0,20

Dinamarquesa 0,15 0,11 0,15

Escolhendo uma máquina, ao acaso, e retirando aleatoriamente uma peça,


verificou-se que é uma peça do tipo Y com defeito. Qual é a probabilidade de essa
peça ter sido produzida pela máquina brasileira?

Resolução:

Admitindo que cada máquina tem a mesma chance de ser escolhida, tem-
se que: P(A) = P(B) = P(C) = P(D) = 1/4 = 0,25.

A 3ª coluna do quadro anterior indica a probabilidade de a peça Y


com defeito ser produzida por uma dada máquina. Então, as probabilidades
condicionais da peça Y defeituosa de cada máquina são:

P(Y/A) = 0,21 P(Y/B) = 0,20 P(Y/C) = 0,18 P(Y/D) = 0,11.

Assim, a probabilidade de a peça Y ter sido produzida pela máquina


brasileira, dado que a peça é defeituosa, é:

P(B).P(Y/B)
P(B/Y)=
P(A).P(Y/A)+P(B).P(Y/B)+P(C).P(Y/C)+P(D).P(Y/D)

0,25.0,20
P(B/Y)= =0,2857
0,25.0,21+0,25.0,20+0,25.0,18+0,25.0,11

Assim, pode-se calcular, da mesma maneira, a probabilidade de a peça


Y ter sido produzida em qualquer outra máquina, dado que a peça é defeituosa.

55
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

0,25.0,21 0,0525
P(A/Y)= = =0,30
0,25.0,21+0,25.0,20+0,25.0,18+0,25.0,11 0,175

0,25.0,18 0,045
P(C/Y)= = =0,2571
0,25.0,21+0,25.0,20+0,25.0,18+0,25.0,11 0,175

0,25.0,18 0,0275
P(D/Y)= = =0,1571
0,25.0,21+0,25.0,20+0,25.0,18+0,25.0,11 0,175

NOTA

O denominador (0,175), que é o mesmo em todos os casos, representa a


probabilidade de escolher, ao acaso, uma peça Y com defeito. Observe que a soma das
probabilidades das quatro máquinas é 1.

Analisando as quatro probabilidades calculadas anteriormente, veja que


a peça Y com defeito tem mais chance (30%) de ter sido produzida pela máquina
americana do que qualquer uma das outras.

Esse fato também poderia ter sido percebido analisando o quadro de


probabilidade de peças defeituosas, uma vez que a probabilidade de escolher as
máquinas é igual e a probabilidade de a máquina americana produzir uma peça
Y defeituosa P(Y/A) é maior do que a das outras máquinas.

Agora se, ao invés de a empresa ter comprado a máquina chinesa, tivesse


optado por mais uma dinamarquesa, será que a peça Y com defeito teria mais chance
de ter sido produzida pela máquina americana? Verifique isso no seguinte exemplo.

Exemplo 4:

Considerando a mesma situação do exemplo 3, mas com duas máquinas


dinamarquesas, qual máquina tem mais chance de ter produzido a peça Y com
defeito?

Probabilidade de peças defeituosas


Nacionalidade
da Máquina
X Y Z

Americana 0,15 0,21 0,10

Brasileira 0,10 0,20 0,15

Dinamarquesa 0,15 0,11 0,15

56
TÓPICO 3 | TEOREMA DE BAYES

Resolução:

Veja que aumentou a chance de a máquina escolhida ser a dinamarquesa:

P(A) = 1
4
P(B) = 1
4
P(D) = 1
2

As probabilidades condicionais continuam as mesmas:

P(Y/A) = 0,21 P(Y/B)= 0,20 P(Y/D) = 0,11.

Calculando a probabilidade de a peça Y ter sido produzida por cada uma


das máquinas, dado que a peça é defeituosa:

0,25.0,21 0,0525
P(A/Y)= = ≅0,3334
0,25.0,21+0,25.0,20+0,25.0,18+0,5.0,11 0,1575

0,25.0,18 0,045
P(B/Y)= = ≅0,3175
0,25.0,21+0,25.0,20+0,25.0,18+0,5.0,11 0,1575

0,25.0,18 0,055
P(D/Y)= = ≅0,3492
0,25.0,21+0,25.0,20+0,25.0,18+0,5.0,11 0,1575

Apesar de a máquina americana ter maior probabilidade de produzir


uma peça Y defeituosa, a peça Y com defeito tem mais chance (34,92%) de ter
sido produzida pela máquina dinamarquesa.

Isso não quer dizer que o fato de haver mais máquinas do tipo dinamarquesa
sempre contribuirá para que isso aconteça, pois, se a probabilidade de a máquina
dinamarquesa produzir uma peça Y defeituosa P(Y/D) fosse de 0,10, a peça Y com
defeito teria mais chance de ter sido produzida pela máquina americana.

Leia agora um fragmento do artigo publicado na revista CIÊNCIA


HOJE, de Sérgio Danilo Pena, do Departamento de Bioquímica e Imunologia, da
Universidade Federal de Minas Gerais.

57
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

LEITURA COMPLEMENTAR

THOMAS BAYES: O ‘CARA’!

Sérgio Danilo Pena

[...]

Milagres: ocorrem ou não?

A possibilidade da ocorrência de milagres e a crença neles têm


historicamente sido objeto de análise científica e filosófica. O local clássico da
discussão moderna e contemporânea sobre milagres é o décimo capítulo (‘Dos
milagres’) de um livro de 1748, Investigação acerca do entendimento humano,
do filósofo e historiador escocês David Hume (1711-1776). Nesse capítulo, ele
diz: “Não há testemunho suficiente para fundamentar um milagre, a menos que
o testemunho seja tal que a sua falsidade seria ainda mais miraculosa que o fato
que se pretende estabelecer.”

Esse raciocínio – na minha modesta opinião – é perfeitamente correto


do ponto de vista bayesiano. O que Hume diz é que a probabilidade a priori
de que um milagre tenha acontecido é tão pequena que só uma probabilidade
condicional enorme pode tornar o milagre crível. Outros autores, como o
filósofo norte-americano John Earman, não concordam com essa interpretação,
e certamente pessoas religiosas também vão discordar, pois com base em sua fé
elas ajustarão subjetivamente a probabilidade a priori para níveis bem maiores
que os imaginados por alguém não religioso.

Em 2005, o periódico Public Library of Sciences (PLoS) – Medicine –


publicou um artigo do epidemiologista grego John Ioannidis, intitulado ‘Por
que a maioria dos resultados científicos publicados são falsos’ (http://medicine.
plosjournals.org/perlserv/?request=get-document&doi=10.1371/journal.
pmed.0020124), que causou sensação no meio médico. Um dos argumentos do
artigo é, de certa forma, análogo ao dos milagres citado acima. Vejamos: é prática
rotineira, embora mal justificada, usar em testes estatísticos de estudos científicos
um nível de significância (limite para a chance de os resultados obtidos terem
ocorrido ao acaso) de 5%. Mas em geral não é levada em conta a probabilidade a
priori de o achado ser verdadeiro. Muitas vezes essa probabilidade inicial é tão
pequena que um nível de significância de 5% não é nem de longe suficiente para a
sua reversão. Imaginemos, em um exercício mental, a hipótese fantasiosa de que
a vitamina C constitui uma cura para o câncer.

Para testar isso, estudamos um grupo de 200 indivíduos com câncer,


distribuídos aleatoriamente em dois grupos de 100. Um grupo é tratado por três
meses com vitamina C, de modo duplo-cego (paciente e pesquisador não sabem
se o que é dado ao primeiro contém mesmo a vitamina, o que é controlado à

58
TÓPICO 3 | TEOREMA DE BAYES

parte). O outro grupo é tratado com um placebo (substância sem qualquer efeito).
Ao final, descobre-se que o câncer não progrediu em 65 dos pacientes que de fato
tomaram a vitamina C, e que o mesmo aconteceu a 50 dos que não tomaram a
vitamina. Um teste estatístico confirma que essa diferença é significativa ao nível
de 5% (porque a chance de que seja fruto do acaso é menor que 5%). Com base
nisso, é possível escrever um artigo científico defendendo a hipótese de que a
vitamina C tem ação contra o câncer.

Esse procedimento está correto? Obviamente, não. O problema, nesse caso,


é que não foi levado em conta o consenso, existente na literatura médica e baseado
em inúmeros experimentos semelhantes, de que a vitamina C não cura o câncer.
Assim, a probabilidade a priori de que um estudo isolado revele uma verdade
oculta e revire os cânones da medicina é infinitesimalmente pequena. A não ser
que a evidência experimental seja fabulosamente forte, é melhor ficar calado.

[...]
FONTE: PENA, Sérgio Danilo. Revista Ciência Hoje, Rio de Janeiro, v. 38, n. 228, p. 22-29, 2006.
Disponível em: <http://www.ime.usp.br/~abe/lista/pdfqEjLYxHl2w.pdf>. Acesso em: 18 dez. 2011.

59
RESUMO DO TÓPICO 3
Neste tópico, você estudou:

• O Teorema de Bayes: a probabilidade de ocorrer um anterior evento Ai, dado


que ocorreu um evento posterior B, é:

P(Ai).P(B/Ai)
P(A/B)=
P(A1).P(BA1)+P(A2).P(B/A2)+...+P(Ak).P(B/Ak)

• O Teorema da Probabilidade Total (denominador do Teorema de Bayes): a


probabilidade de ocorrer o evento B é:

P(A1).P(B/A1)+P(A2).P(B/A2)+...+P(Ak).P(Ak)

60
AUTOATIVIDADE

Agora, acadêmico, é a sua vez de exercitar o que aprendeu até aqui.


Lembre-se de que você tem à disposição no “Material de Apoio” do Ambiente
Virtual de Aprendizagem os gabaritos das autoatividades. Consulte-os sempre
que necessário.

Conte também com a Tutoria Interna do curso de Matemática, que está


disponível por meio do 0800, contato e atendimento on-line. Bons estudos!

1 Uma caixa em forma de urna contém 5 bolas azuis e 3 rosa. E uma segunda
caixa contém 3 bolas azuis e 2 rosa. Se uma bola branca é sorteada ao acaso,
qual é a probabilidade de ela ter vindo da primeira caixa?

2 Três empresas de brinquedos, A, B e C, produziram, respectivamente,


40%, 50% e 10% do total de brinquedos de uma escola. A porcentagem de
brinquedos defeituosos da fábrica A é 3%, da fábrica B é 5% e da fábrica C
é 2%. Uma criança recebeu, ao acaso, um brinquedo defeituoso. Qual é a
probabilidade de que essa peça tenha vindo da fábrica B? Qual das empresas
tem mais chance de ter fabricado a peça defeituosa?

3 Considerando os dados da questão anterior, determine qual é a probabilidade


de uma criança receber um brinquedo defeituoso.

4 Uma urna contém 9 bolas: 3 pretas, 1 branca e 5 vermelhas. Uma segunda urna
contém 9 bolas: 4 bolas pretas, 3 brancas e 2 vermelhas. E uma terceira urna
contém 8 bolas: 2 pretas, 3 brancas e 3 vermelhas. Escolheu-se uma urna, ao
acaso, e dela se extraiu uma bola, ao acaso. Verificando-se que a bola sorteada
é branca, qual é a probabilidade de a bola ter saído da terceira urna?

5 O proprietário de uma facção estima que uma roupa feita por um funcionário
experiente tem 90% de chance de não apresentar defeito e que uma roupa
feita por um funcionário novato tem 50% de chance de não apresentar
defeito. Se uma roupa selecionada ao acaso apresentar defeito, determine
a probabilidade de ela ter sido feita por um funcionário novato, sabendo-se
que 2/3 das roupas são feitas por funcionários experientes.

6 Segundo um professor de probabilidade, a chance de um aluno se dar bem


numa prova é de 80% se estudou e 50% se não estudou. Se um determinado
aluno não estuda para 15% das provas que realiza, qual será a probabilidade
de esse aluno se dar bem na prova?

7 Considerando os dados da questão anterior, qual é a probabilidade de o


aluno ter estudado, dado que ele se deu bem na prova?

61
62
UNIDADE 1
TÓPICO 4

COMBINATÓRIA E PROBABILIDADE NO ENSINO

1 INTRODUÇÃO
Atualmente, a Combinatória é um ramo da Matemática que permite resolver
problemas em que é necessário contar e organizar os objetos de um conjunto.
Durante algum tempo, foi apenas uma ferramenta para efetuar alguns cálculos e era
identificada como uma simples “contagem”. Conforme afirma Berge (1971, p. 10),
“[...] a preocupação mais antiga da combinatória eram os problemas de contagem”.

O ensino de Combinatória, que inclui o estudo dos arranjos, das


permutações e das combinações, inicia, geralmente, apenas no Ensino Médio.
Basta você se lembrar de suas aulas de matemática no Ensino Médio para saber que
estes conteúdos acabam sendo difíceis para muitos estudantes. Mecanicamente,
eles tentam descobrir se o problema exige a fórmula do arranjo, da permutação
ou da combinação para que se chegue a uma solução.

Este conteúdo, ao ser trabalhado em forma de situações-problema, acaba


gerando dificuldades e dúvidas em relação à interpretação de seus enunciados,
pois exige flexibilidade de pensamento, ou seja, para resolvê-los é necessário
parar, concentrar, discutir e pensar.

Outra ação frequente dos estudantes é traçar as possibilidades de resolução


escrevendo listas de possibilidades, sem organização alguma, o que acaba
confundindo-os na contagem final das possibilidades. Até porque, em muitos
casos, o conjunto é excessivamente grande para se fazer essa contagem manual dos
elementos, e é justamente por isso que são necessários outros processos de contagem.

De acordo com os Parâmetros Curriculares Nacionais (PCN) para o Ensino


Médio, a Combinatória é vista da seguinte maneira:

As habilidades de descrever e analisar um grande número de dados,


realizar inferências e fazer predições com base numa amostra de
população, aplicar as ideias de probabilidade e combinatória a fenômenos
naturais e do cotidiano são aplicações da Matemática em questões do
mundo real que tiveram um crescimento muito grande e se tornaram
bastante complexas. Técnicas e raciocínios estatísticos e probabilísticos
são, sem dúvida, tanto das Ciências da Natureza quanto das Ciências
Humanas. Isso mostra como será importante uma cuidadosa abordagem
dos conteúdos de contagem, estatística e probabilidade no Ensino Médio,
ampliando a interface entre o aprendizado da Matemática e das demais
ciências e áreas. (BRASIL, 2000, p. 44-45).

63
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Os PCN do Ensino Fundamental, por sua vez, apresentam um diferencial no


estudo dos números, operações, espaço, formas, grandezas e medidas. O que eles
propõem é a utilização de conteúdos que permitam tratar as informações que os
alunos recebem todos os dias, levando-os a aprender a lidar com dados estatísticos,
tabelas, gráficos e a utilizar ideias relativas à probabilidade e à combinatória.

Nos PCN os conteúdos de estatística, probabilidade e combinatória estão


presentes no bloco de estudos intitulado Tratamento da Informação. Segundo o
documento, fazem parte deste bloco:

[...] noções de estatística, de probabilidade e de combinatória.


Evidentemente, o que se pretende não é o desenvolvimento de um
trabalho baseado na definição de termos ou de fórmulas envolvendo
tais assuntos [...] Relativamente à combinatória, o objetivo é levar o
aluno a lidar com situações-problema que envolvam combinações,
arranjos, permutações e, especialmente, o princípio multiplicativo da
contagem. (BRASIL, 1997, p. 40).

NOTA

O princípio multiplicativo da contagem também pode ser chamado de princípio


fundamental da contagem.

Com isso, você pode concluir que os documentos oficiais que regem o
ensino evidenciam a importância do ensino e da aprendizagem da Combinatória
e da Probabilidade, desde as séries iniciais, aprofundando-os a cada nível de
ensino. O contato do estudante, sobretudo com a Combinatória, desde as séries
iniciais servirá para que ele se familiarize com os problemas. Com isso, o estudante
aprenderá a descrever e contar as possibilidades utilizando uma representação de
sua escolha, sem se prender às regras inicialmente. Desta maneira, este estudante
adquirirá uma forma ordenada para a resolução de problemas de Combinatória,
o que certamente acarretará uma formalização no Ensino Médio.

Uma possibilidade para introduzir a noção de Combinatória já no Ensino


Fundamental, tanto nas Séries Iniciais quanto nas Finais, é a utilização de situações
que envolvam o Princípio Fundamental da Contagem. Com isso, o estudante,
por meio de raciocínios inicialmente simples, poderá posteriormente explorar
problemas complexos com mais facilidade, sobretudo no Ensino Médio. Na seção
seguinte você verá e entenderá como situações simples podem ser trabalhadas
facilmente em sala de aula no Ensino Fundamental.

64
TÓPICO 4 | COMBINATÓRIA E PROBABILIDADE NO ENSINO

2 ALGUNS EXEMPLOS DE ATIVIDADES JÁ REALIZADAS DE


COMBINATÓRIA
A seguir, você verá algumas atividades de Combinatória já realizadas em
sala de aula. É interessante identificar a resolução no relato dos estudantes, sobretudo
para compreender o raciocínio que eles seguem para chegar à solução mais adequada.

Parte dos exemplos e até mesmo alguns trabalhos de estudantes, listados


a seguir, foram retirados do artigo intitulado Atividades Experimentais de Análise
Combinatória no Ensino Médio em uma Escola Estadual, da autoria de Vazquez e
Malagutti, publicado em 2009. Os autores fizeram uma pesquisa com estudantes do
Ensino Médio e coletaram a resolução das atividades propostas de Combinatória.

O objetivo desta pesquisa foi identificar o raciocínio empregado pelos


estudantes ao resolverem as situações e, com isso, comprovar que a inserção de
problemas que envolvam o Princípio Fundamental da Contagem já no Ensino
Fundamental faz diferença na aprendizagem de Combinatória no Ensino Médio.

UNI

Acadêmico! Analise com atenção a resolução dos estudantes a partir das


imagens que constarão a seguir. É interessante identificar os erros cometidos, além de verificar
as distintas maneiras de resolução para a mesma atividade. Como futuro(a) professor(a), é
uma oportunidade de exercitar também a maneira como você avalia.

2.1 ATIVIDADE 1: OS SINAIS DE TRÂNSITO E AS CORES


Descrição da atividade:

A primeira atividade teve como objetivo explorar o semáforo como


uma estratégia para ensinar elementos básicos de Análise Combinatória, nesse
caso os arranjos simples e os arranjos com repetição.

OS SINAIS DE TRÂNSITO E AS CORES

Um semáforo é um aparelho de sinalização urbana, rodoviária ou


ferroviária que orienta o tráfego por meio de luzes. A escolha da sequência
de cores: vermelho no topo, amarelo no meio e verde embaixo é uma forma
de não confundir o motorista e segue convenções internacionais. Sabemos que
vermelho significa “PARE”, amarelo, “AGUARDE” e verde, “SIGA”.

65
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Essa atividade tem por objetivo construir outros tipos de semáforos que
não se preocupam com as facilidades visuais dos motoristas. Vamos considerar
que a ordem em que as cores aparecem é importante, ou seja, os sinais abaixo
são diferentes:

1) Quantos e quais são os diferentes sinais de trânsito que podemos construir


com três cores, respeitando a ordem e sem repeti-las?
2) Agora responda, quantos semáforos poderíamos formar se pudéssemos
repetir as cores? Você conseguiria construí-los?

Desenvolvimento da atividade:

A maioria dos alunos apresentou a resolução dos itens 1) e 2) através


da representação de todas as possibilidades, montando esquemas gráficos ou
simbólicos.

Destacamos algumas discussões (falas) dos alunos ao iniciar as


atividades.

Item 1)
Aluno A: “3 x 3 = 9, são três cores trocando de lugar ...”
Aluno B: “A cor verde já ficou em último, no meio e no começo... vou fazer o
mesmo com as outras... Ah! Acho que são 3!”
Aluno C: “3 + 3 = 6. São 6!”
Aluno D: “3 x 3, é 9, não é professora? Três cores e três espaços.”

Item 2)
Aluno E: “Apaguei tudo... Me perdi, não dá para fazer de qualquer jeito. Tem
que montar uma regra...”
Aluno F: “Não tem fórmula para resolver isso? Matemática sempre tem fórmula...”.

Vejamos, agora, algumas soluções dos grupos de alunos:

66
TÓPICO 4 | COMBINATÓRIA E PROBABILIDADE NO ENSINO

À medida que estavam resolvendo as atividades, os estudantes foram


incentivados a encontrar a “quantidade” de diferentes sinais de trânsito que
poderiam construir. Percebemos que o “princípio multiplicativo” não está presente
para a maioria dos alunos e acreditamos que isso aconteça pelo fato de que não
tiveram contato com problemas semelhantes durante o Ensino Fundamental.

Percebemos, também, que alguns deles fizeram tentativas de apresentar


o cálculo já que sabiam o resultado. É interessante mostrarmos como um dos
grupos representou seu resultado, porém seus integrantes não conseguiram
explicar o raciocínio quando foram questionados:

Alguns resultados de outros grupos que claramente entenderam e


utilizaram o princípio multiplicativo estão apresentados a seguir.

67
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Ainda na atividade 1, colocamos uma 3ª questão com o intuito de fazê-


los perceber a necessidade de calcular a quantidade de diferentes placas que
podem ser confeccionadas com todas as letras do alfabeto e todos os algarismos
do nosso sistema de numeração, pois representá-las como fizeram nas questões
anteriores seria muito trabalhoso.

3) Vamos então pensar... quantas diferentes placas de carro podem ser


confeccionadas (considerando uma sequência de 3 letras e 4 números)? Se
todo brasileiro possuísse um carro, as placas seriam suficientes?

68
TÓPICO 4 | COMBINATÓRIA E PROBABILIDADE NO ENSINO

Algumas respostas obtidas foram:

• 3 x 26 + 4 x 10 = 118 placas (é pouco!!!)


• (3 x 26) x (4 x 10) = 3.120 placas
• (26 + 26 + 26) x 10000 = 780.000 placas
• 78 x 9999 = 779.922 placas

Cabe relatar que a maioria dos alunos não sabia a população atual do
Brasil, muitos diziam que “eram milhões”, mas não sabiam precisar.
FONTE: Vazquez e Malagutti (2009, p. 5-8)

69
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

2.2 ATIVIDADE 2: SALADA DE FRUTAS


Descrição da atividade:

Na atividade 2 exploramos as combinações simples e as combinações


com repetições. O objetivo dessa atividade é verificar se os alunos conseguem
perceber as diferenças em relação à atividade anterior, ou seja, que a troca
dos elementos de um conjunto não gera uma nova configuração e quais os
mecanismos de resolução que serão apresentados.

SALADA DE FRUTAS

Essa atividade consiste em pensarmos nas diferentes formas de


fazermos uma deliciosa salada de frutas utilizando maçãs, peras e laranjas.

1) De quantas maneiras diferentes você pode fazer uma salada de frutas


utilizando duas dessas frutas? Mostre as possibilidades!
2) E se fossem três? Ou seja, se você utilizasse todas as frutas disponíveis! De
quantas maneiras diferentes você poderia montar essa salada?

Desenvolvimento da atividade:

Muitos alunos chegaram à resposta correta e sua representação, porém


perguntas como: “são 6 possibilidades?”, “misturar maçã e pera é o mesmo
que pera e maçã?”, também foram frequentes. Em momentos como esses, em
que tais perguntas eram feitas, muitas vezes os pesquisadores não precisaram
intervir, pois acontecia um diálogo entre os próprios grupos:

Grupo A: “Não importa a ordem que as frutas são adicionadas, é a mesma salada!”
Grupo B: “Se cada fruta junta com as outras duas dá 6, aí divide por 2, então é 3!”
Grupo C: “Mesmo trocando a ordem (das frutas) todas são iguais!”

Algumas respostas:

70
TÓPICO 4 | COMBINATÓRIA E PROBABILIDADE NO ENSINO

Observamos que alguns alunos perceberam a necessidade de dividir


por 2 e, quando questionados sobre o motivo dessa divisão, responderam que
o total de maneiras diferentes é a metade das possibilidades já que, ao trocar a
ordem de duas das frutas, teriam a mesma salada.

Em continuidade à atividade 2, propusemos a seguinte questão:

3) E se tivéssemos 5 frutas? De quantas maneiras poderíamos montar uma


salada com 3 delas? E com 4? E com todas?

Vejamos algumas respostas:

• Alguns grupos continuaram fazendo esquemas de resolução e montando


todas as possibilidades:

71
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

Uma das justificativas desse tipo de resolução é que eles não sabiam
por qual número dividir já que agora tinham 3 frutas. Com duas frutas ficou
claro para todos que a divisão por 2 eliminava todas as repetições. Mas, e com 3
frutas? Muitos responderam que deveriam dividir por “três”. Nesse momento,
os pesquisadores tiveram que interferir em vários grupos na tentativa de levá-
los a calcular todas as permutações possíveis com 3 elementos.

• Resolução de um grupo após o entendimento de que são 6 possíveis


permutações de 3 frutas diferentes:

• Outras resoluções de grupos que conseguiram chegar ao resultado da


atividade através de suas próprias conclusões:

72
TÓPICO 4 | COMBINATÓRIA E PROBABILIDADE NO ENSINO

A última questão dessa atividade 2 tinha como objetivo mostrar que


alguns problemas de Análise Combinatória, nesse caso uma combinação com
repetição, precisam de muita atenção para serem resolvidos. Mesmo que eles
utilizassem os conhecimentos adquiridos nas questões anteriores, não seria
possível com um só cálculo determinar a resposta desse problema.

4) Agora, imagine a seguinte situação: Um feirante possui, em sua banca,


maçãs, peras e laranjas em grande quantidade. Desejando atender melhor
a sua clientela, o feirante resolveu empacotar todas as suas frutas, de modo
que cada pacote contivesse exatamente 5 frutas. Quantos diferentes tipos de
pacotes poderá o feirante oferecer à sua clientela?

De forma geral, os alunos perceberam que esse problema era diferente


dos outros que eles haviam resolvido. Após algum tempo, muitos alunos
conseguiram encontrar a solução e muitos ficaram desanimados, principalmente
pelo fato de nem sequer imaginarem a resposta.
FONTE: Vazquez e Malagutti (2009, p. 9-13)

73
UNIDADE 1 | COMBINATÓRIA, PROBABILIDADE E TEOREMA DE BAYES

2.3 CONSIDERAÇÕES DOS ESTUDANTES SOBRE AS


ATIVIDADES
Discutimos a necessidade de explorar os problemas de combinatória
levando em conta alguns aspectos que podem ajudar na sua resolução:

• ler o problema a ser resolvido com bastante atenção;

• detalhes como “os elementos são distintos” ou “os elementos podem se


repetir” fazem a diferença;

• verificar se o problema fica mais simples ou se é necessário dividi-lo em casos;

• isolar as possibilidades mais “problemáticas” ou que oferecem mais


dificuldades, resolvendo-as por ordem de dificuldade;

• para resolver o problema, usar diagramas, setas, esquemas, casos particulares;

• criar sua própria maneira de atacar os problemas de contagem;

• saber usar o Princípio Fundamental da Contagem com bastante atenção!


FONTE: Adaptado de: Vazquez e Malagutti (2009, p. 13)

74
RESUMO DO TÓPICO 4
Neste tópico, você estudou:

• O ensino de Combinatória deve ser inserido desde o Ensino Fundamental nas


aulas de Matemática.

• Os documentos que norteiam o Ensino Fundamental (PCN) e o Ensino Médio


(PCNEM) apresentam e destacam a importância do ensino de Combinatória e
Probabilidade.

• Comprovadamente, a partir de atividades realizadas, os estudantes de Ensino


Médio têm certa dificuldade na resolução de situações que envolvem conceitos
simples, como o Princípio Fundamental da Contagem.

75
AUTOATIVIDADE

Neste tópico, as autoatividades estão relacionadas ao ensino de


Combinatória e Probabilidade. Imagine-se como futuro professor, visando a
uma aprendizagem significativa dos seus estudantes e fique à vontade para
entrar em contato com a Tutoria Interna de Matemática para conversar e
esclarecer possíveis dúvidas sobre o assunto!

1 Os documentos que regem a Educação Básica são os PCN e os PCNEM.


De que maneira eles tratam e evidenciam o ensino de Combinatória e
Probabilidade? Comente.

2 A partir das duas atividades relatadas e exemplificadas neste Tópico 4, cite


e explique duas possibilidades de atividades que possam ser aplicadas no
Ensino Fundamental e que contribuam para que o estudante chegue ao
Ensino Médio melhor preparado para aprender os conteúdos referentes à
Combinatória.

3 No Tópico 1, você estudou a diferença entre Arranjo e Combinação, o


que geralmente confunde os estudantes no Ensino Médio. Que estratégia
(macete, atividade, relação, jogo etc.) você, como professor futuramente,
utilizaria em sala para que os estudantes não tivessem dúvidas ao resolver
um problema que implicasse o uso de uma das duas fórmulas?

76
UNIDADE 2

VARIÁVEIS ALEATÓRIAS E
DISTRIBUIÇÕES DE PROBABILIDADE

OBJETIVOS DE APRENDIZAGEM
Nessa unidade vamos:

• entender as diferenças entre as variáveis aleatórias contínuas e discretas;

• compreender os conceitos e as definições de variáveis aleatórias;

• utilizar os conceitos e as definições de variáveis aleatórias nas distribuições


de probabilidade.

PLANO DE ESTUDOS
Esta unidade está dividida em três tópicos. No final de cada tópico, você
encontrará atividades que possibilitarão a apropriação de conhecimentos
na área.

TÓPICO 1 – VARIÁVEIS ALEATÓRIAS

TÓPICO 2 – DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS


DISCRETAS

TÓPICO 3 – DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS


CONTÍNUAS

77
78
UNIDADE 2
TÓPICO 1

VARIÁVEIS ALEATÓRIAS

1 INTRODUÇÃO
Neste primeiro tópico, você estudará as variáveis aleatórias. Estas
variáveis podem ser caracterizadas informalmente como imprevisíveis e, de
certa maneira, até inesperadas. Porém, mesmo apresentando características de
imprevisibilidade, na estatística as variáveis aleatórias são comumente utilizadas
e apresentam resultados bastante confiáveis.

Mas, afinal, o que é uma variável aleatória?

Uma variável é dita aleatória quando o seu valor é obtido por meio de
observações ou experimentos, considerando que a cada valor esteja associada
certa probabilidade. Denota-se uma variável aleatória por uma letra maiúscula e
os valores assumidos por ela por uma letra minúscula.

Nos próximos tópicos, você visualizará estas variáveis em exemplos e


aplicações e diferenciará as contínuas e as discretas.

2 VARIÁVEIS ALEATÓRIAS
Uma variável aleatória satisfaz a função X: S → R, que associa a cada
elemento s do espaço amostral S um valor x ∈ R. Sendo assim, lembre-se do
estudo de funções e compreenda que uma variável aleatória X é uma função, em
que S é domínio e R é o contradomínio.

Você já leu no início do tópico que as variáveis aleatórias podem ser


discretas ou contínuas, mas qual é a diferença entre elas?

Uma variável é discreta quando assume valores em pontos isolados


ao longo de uma escala (número finito ou infinito enumerável de valores). Um
exemplo disto é a quantidade de colegas da sua turma ou mesmo de moradores
do seu prédio ou rua.

79
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Uma variável é contínua quando assume qualquer valor ao longo de


um intervalo (número infinito não enumerável de valores). Exemplos disto são o
tempo, a temperatura, o peso, entre outros.

Até aqui você viu exemplos e conseguiu diferenciar a partir deles as


variáveis discretas e contínuas. Que tal, agora, partir para o estudo das definições
de variáveis aleatórias discretas e contínuas?

2.1 DISCRETAS
Uma variável X é considerada aleatória discreta se os valores possíveis xi
∈ X formam um conjunto enumerável de pontos na reta.

Exemplo:

Seja S o espaço amostral dos resultados possíveis de um lançamento


de um dado 3 vezes seguidas. Considere p = número par e i = número ímpar,
lembrando que X(Si) = xi

S = {(p, p, p); (p, p, i); (p, i, p); (p, i, i); (i, i, i); (i, p, i); (i, i, p); (i, p, p)}

Considere que o primeiro elemento deste conjunto é S1 e o último é S8, afinal


há oito possibilidades diferentes de se obter resultados no lançamento dos três dados.

Agora faça X: quantidade de números pares, então X: S → R é discreta


porque X(Si) = xi = {0, 1, 2, 3}, pois podem sair desde zero (nenhum) número par
até três números pares.

Calculando caso por caso, ficaria assim:

X(S1) = 3 (pois há três possibilidades de números pares).


X(S2) = 2 (pois há duas possibilidades de números pares).
X(S3) = 2 (pois há duas possibilidades de números pares).
X(S4) = 1 (pois há uma possibilidade de número par).
X(S5) = 0 (pois não há possibilidade de número par).
X(S6) = 1 (pois há uma possibilidade de número par).
X(S7) = 1 (pois há uma possibilidade de número par).
X(S8) = 2 (pois há duas possibilidades de números pares).

Ou seja, uma variável aleatória é discreta quando assume valores que


podem ser contados. Simples, não é mesmo?

Outros exemplos de situações em que as variáveis aleatórias discretas se


fazem presentes são: o número de peças defeituosas em um dia de produção, o
número de internações hospitalares por semana, o número de acidentes por mês,
o número de coroas no lançamento de duas moedas, o número de aprovações na
disciplina, entre tantas outras aplicáveis no cotidiano.
80
TÓPICO 1 | VARIÁVEIS ALEATÓRIAS

2.2 CONTÍNUAS
Uma variável aleatória é considerada contínua se os valores possíveis de
xi ∈ X formam um determinado intervalo real não enumerável.

Exemplo:

No seu cotidiano, certamente, você utiliza pilhas em equipamentos como


câmeras fotográficas ou controles remotos. Suponha que você precisa observar
o tempo de vida útil de uma pilha produzida por uma determinada empresa.
Então a função X: S → R será definida como o tempo de vida útil de uma pilha
escolhida ao acaso. Nesse caso X: S → R é contínua, pois X assume qualquer valor
real positivo, porém não tão preciso como seria o ideal. Quer um exemplo disto?
Imagine que a medição da vida útil desta pilha foi de 2.499,99 horas, porém
poderia ser registrada como 2.500 horas, pelo arredondamento.

Outra situação comum de aplicação deste conceito é quando você escuta no


noticiário o valor arrecadado de impostos da sua cidade ou estado, dado em milhões,
por exemplo, 10,5 milhões de reais. Mas é provável que este número seja algo como
10.535.456,34 reais. Ah, é claro, se este valor fosse 10.488.625,45 reais, você também
escutaria do apresentador do noticiário os mesmos 10,5 milhões de reais.

Assim, uma variável aleatória é contínua quando assume valores de um


determinado intervalo.

Outros exemplos de variáveis aleatórias contínuas são: pesos de


estudantes, alturas de árvores, temperaturas de uma região, idades dos amigos,
litros de gasolina por abastecimento, entre tantos outros.

3 FUNÇÃO PARA DISTRIBUIÇÃO DE PROBABILIDADE


Uma distribuição de probabilidade é uma função que associa a cada
elemento xi de uma variável aleatória X a probabilidade de xi acontecer p(xi),
representada por P(X = xi), tal que:

a) 0n ≤ P(X = xi) ≤ 1
b) Σ p(x=xi) = 1
i=1

A distribuição de probabilidade de uma variável aleatória X é dada pelos


pares ordenados (xi, p(xi)) e é normalmente apresentada por uma tabela, quadro
ou gráfico.

Por exemplo, pense no lançamento simultâneo de dois dados de seis faces.


Podem-se obter diferentes resultados, e isso você já viu em outros exemplos.
Questionamentos como qual a probabilidade de dar soma menor que 5 ou qual
a probabilidade de a soma entre os dois dados ficar entre 5 e 9 podem gerar
confusões na hora de calcular.

81
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

A distribuição de probabilidade auxilia você justamente nestes casos, pois


relaciona a cada elemento xi ∈ X uma probabilidade p(xi).

Veja o espaço amostral S:

S = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6),
(3,1), (3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3),
(5,4), (5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}

Defina X como sendo a soma entre os dois dados:


X = {1+1 = 2, 1+2 = 3,..., 6+6 = 12}.

Agora, considerando que cada caso de S acima tem probabilidade igual


de acontecer de 1/36, tem-se a seguinte distribuição de probabilidade:

X 2 3 4 5 6 7 8 9 10 11 12

P
1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
(X=xi)

Ou por meio de um gráfico:

P(X ≤ Xi)
6/36

1/36
X
2 3 4 5 6 7 8 9 10 11 12

Com isso, fica fácil responder às questões:

a) Qual é a probabilidade de sair soma menor que 6?

P (X<5) = P(X=2) + P(X=3) + P(X=4) + P(X=5) = 1/36 + 2/36 + 3/36 + 4/36 = 10/36 = 5/18

b) E soma entre 7 e 10?

P (7< X <10) = P(X=8) + P(X=9) = 5/36 + 4/36 = 9/36 = 1/4

82
TÓPICO 1 | VARIÁVEIS ALEATÓRIAS

Exemplo 1:

Uma urna contém 4 bolas brancas e 2 bolas pretas. Duas bolas são
retiradas ao acaso e sem reposição. Considere X a variável aleatória número de
bolas brancas e determine a distribuição de probabilidades da variável X.

Solução:

Primeiro determine os valores que a variável aleatória X pode assumir,


assim, ao retirar duas bolas da urna você pode obter:

- nenhuma bola branca, e assim X assume valor 0;


- uma bola branca, e assim X assume valor 1;
- duas bolas brancas, e assim X assume valor 2.

Calcule a probabilidade de cada elemento da variável aleatória X = {0, 1, 2}.


Para isso, se for necessário, volte ao que estudou de probabilidade na Unidade 1.

Relembrando:

Sair nenhuma bola branca é o mesmo que sair duas bolas pretas, assim:
P(X=0) = 2/6 · 1/5 = 2/30

Sair apenas uma bola branca, então a outra deve ser preta, assim:
P(X=1) = 4/6 · 2/5 · 2 = 16/30

Sair duas bolas brancas, assim:


P(X=2) = 4/6 · 3/5 = 12/30

Apresentando a distribuição de probabilidade por meio de um quadro,


tem-se:

X 0 1 2
P(X=xi) 2/30 16/30 12/30

Ou por meio de um gráfico:

P(X=xi)

16/30
12/30

2/30
X
0 1 2

83
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Exemplo 2:

Num estudo sobre a quantidade de integrantes por família, realizado


numa sala com 30 crianças, verificou-se que:

X (nᵒ de integrantes) 2 3 4 5

Quantidade de famílias 1 15 10 4

Considerando a variável aleatória X o número de integrantes por família,


construa uma distribuição de probabilidades para essa variável.

Solução:

Calcule a probabilidade de cada elemento da variável aleatória X = {2, 3, 4,


5} com base nas frequências (quantidade de famílias).

P(X=2) = 1/30
P(X=3) = 15/30
P(X=4) = 10/30
P(X=5) = 4/30

Apresentando a distribuição de probabilidade por meio de um quadro,


temos:

X 2 3 4 5

P(X=xi) 1/30 15/30 10/30 4/30

3.1 ACUMULADA
A função para distribuição de probabilidade é muito parecida com a
função anterior, porém, ao invés de mostrar P(X = x), ela indicará P (X ≤ x).

No caso do lançamento simultâneo de dois dados será:

X 2 3 4 5 6 7 8 9 10 11 12

P (X≤x) 1/36 2/36 6/36 10/36 15/36 21/36 26/36 30/36 33/36 35/36 36/36

84
TÓPICO 1 | VARIÁVEIS ALEATÓRIAS

Por meio de um gráfico ficará assim representada:

P(X≤xi)
1
30/36

15/36

X
2 3 4 5 6 7 8 9 10 11 12

Analisando o gráfico, verifica-se que a P(X ≤ xi), por exemplo, a P(X ≤ 6) =


15/36 ≅ 41,67% ou P(X ≤ 9) = 30/36 ≅ 83,33%

Exemplo 1:

Considerando o quadro de distribuição de probabilidade do exemplo


b (número de integrantes por família), obtenha o quadro de distribuição de
probabilidade acumulada.

X 2 3 4 5

P(X=xi) 1/30 15/30 10/30 4/30

Solução:

A distribuição de probabilidade acumulada apresenta a P(X ≤ xi), então:

P(X ≤ 2) = P(X=2) = 1/30


P(X ≤ 3) = P(X=2) + P(X=3) = 1/30 + 15/30 = 16/30
P(X ≤ 4) = P(X=2) + P(X=3) + P(X=4) = 1/30 + 15/30 + 10/30 = 26/30
P(X ≤ 5) = P(X=2) + P(X=3) + P(X=4) + P(X=5) = 1/30 + 15/30 + 10/30 + 4/30 = 30/30

Apresentando esses elementos num quadro temos:

X 2 3 4 5

P(X≤xi) 1/30 16/30 26/30 30/30

85
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Ou seja, ao sortear aleatoriamente uma criança dessa sala, a probabilidade


de ela morar com no máximo 4 pessoas é P(X ≤ 4) = 26/30 ≅ 86,67%.

3.2 CONTÍNUA
Assim como nos casos anteriores, esta função é usada para representar a
probabilidade de uma distribuição, porém, neste caso, é para distribuições contínuas.

Seja f(x) uma função densidade, então valem as seguintes condições:


b
a) P (f ϵ [a,b]) = ∫ f(x)dx
a

Em que a probabilidade de a variável aleatória X estar entre a e b é igual a


b b
∫a f(x)dx, ou seja: P (a < X < b) = ∫a f(x)dx.
+∞
b) ∫-∞f(x)dx

Em que a área sob a curva f(x) é 1.

c) P (f = a) = 0

Em que a probabilidade da variável aleatória X assumir um ponto é zero.

UNI

Mais adiante, você estudará na disciplina de Cálculo Diferencial e Integral que a


integral ∫ f(x)dx determina a área sob a curva f(x) entre x = a e x = b.

Ainda da condição c, conclui-se que as seguintes probabilidades são


iguais:

P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b).

UNI

Não esqueça que este item apresenta as variáveis aleatórias contínuas!

86
TÓPICO 1 | VARIÁVEIS ALEATÓRIAS

Resumindo, a função densidade associa certa variável aleatória contínua


X à probabilidade de essa variável pertencer ao intervalo [a, b].

Ainda no Tópico 3 da Unidade 2, você estudará alguns modelos de função


densidade.

4 ESPERANÇA
Considere a variável aleatória X, assumindo os valores x1, x2, x3,…,xn,
nomeia-se de valor médio ou valor esperado ou esperança matemática de X o valor:

E(X) = x1 ·P(X = x1) + x2 ·P(X = x2) + ... + xn ·P(X = xn)

Veja que a esperança matemática é a média. Utiliza-se a notação E(X) para


representar a esperança matemática da variável aleatória X. E utiliza-se o símbolo
μ (mi) para a média. A partir disso, tem-se que E(X) = μ.

Exemplo 1:

Qual é a esperança matemática referente à soma de dois dados?

Solução:

Nesse caso a variável aleatória X é a soma de dois dados, com a distribuição


de probabilidade já conhecida, então:

E(X) = 2·(1/36) + 3·(2/36) + ... + 11·(2/36) + 12·(1/36) = 252/36 = 7

Assim, se você jogar dois dados muitas vezes e anotar o resultado da soma
entre eles em cada jogada, a média deste experimento será 7.

Exemplo 2:

Um jogador estima que tem 20% de chance de ganhar R$ 30.000,00 e 80% de


chance de perder R$ 10.000,00 numa aposta. Qual é o ganho esperado desse jogador?

Solução:

Considerando a variável aleatória X o valor ganho na aposta (recebido ou


perdido), tem-se a seguinte distribuição de probabilidade:

X 30.000 -10.000
P(X=xi) 0,2 0,8

87
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

E(X) = 30.000 · 0,2 + (-10.000) · 0,8 = - 2.000

Note que R$ 10.000,00 tem o sinal negativo, pois está associado a uma perda.

5 VARIÂNCIA
Considerando que a variável aleatória X assumiu os valores x1, x2, x3,…,xn,
a variância de X será dada por:

n
Var(X) = Σ
i=1
(xi – E(X))2 · P(X = xi)
Ou, Var(X) = E(X)2 – [E(X)]2

O símbolo utilizado para a Var(X) é σ2 (sigma ao quadrado), que representa


a variância da variável aleatória X.

A variância é uma medida que representa a variação, em relação à média,


dos elementos de uma variável aleatória.

UNI

Entenda que quanto maior o valor da variância, mais distantes da média estão
os elementos da variável aleatória.

6 DESVIO PADRÃO
O desvio padrão, representado por DP(X), é a raiz quadrada da variância.

σ = DP(X) =√Var(X) = √σ2

O desvio padrão representa uma medida de variabilidade “mais próxima”


dos elementos da variável aleatória X. Quanto menor essa medida, “mais
próximos” da média estão os elementos da variável aleatória.

88
TÓPICO 1 | VARIÁVEIS ALEATÓRIAS

7 EXEMPLOS DA ASSOCIAÇAO ENTRE VARIÂNCIA E DESVIO


PADRÃO
Acompanhe, a seguir, alguns exemplos que facilitarão sua compreensão
sobre a variância e o desvio padrão.

Exemplo 1:

A partir do exemplo dos dados considere a função de distribuição de


probabilidades:

X 2 3 4 5 6 7 8 9 10 11 12

P (X=x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

A variância será:

Var(X) = (2 – 7)2 · 1/36 + (3 – 7)2 · 2/36 +...+ (12 – 7)2 · 1/36 = 210/36 ≈ 5,83

Mas, lembre-se que Var(X) = E(X)2 – [E(X)]2 então:

E(X)2 = 22 · (1/36) + 32 · (2/36) + ... + 112 · (2/36) + 122 · (1/36) = 1974/36


E(X) = 2 · (1/36) + 3 · (2/36) + ... + 11 · (2/36) + 12 · (1/36) = 252/36 = 7

Ou seja,
Var(X) = E(X)2 – [E(X)]2, então temos:
Var(X) = 1974/36 – (252/36)2 ≈ 5,83

Para determinar o desvio padrão, basta calcular a raiz quadrada da


variância 5,83, assim: σ = DP(X) = √5,83 ≈ 2,41

89
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Exemplo 2:

Um jogador estima que tem 20% de chance de ganhar R$ 30.000,00 e 80%


de chance de perder R$ 10.000,00 numa aposta. Qual é o desvio padrão dessa
distribuição?

Solução:

Já sabemos que E(X) = -2.000, então:

VAR(X) = (30.000 – (-2.000))2 . 0,2 + (-10.000 – (-2.000))2 . 0,8 = 256.000.000


PD(X) = √256.000.000 = 16.000.000

Veja que o desvio padrão apresenta um valor mais próximo da


distribuição do que a variância, dai a sua importância na interpretação da
variabilidade da distribuição.

90
RESUMO DO TÓPICO 1
Neste tópico, você estudou:

• Variável aleatória é uma função que associa a cada elemento do espaço amostral
um número real.

• Uma variável aleatória é discreta quando assume valores que podem ser
contados.

• Uma variável aleatória é contínua quando assume valores de um determinado


intervalo.

• Uma distribuição de probabilidade é uma função que associa a cada elemento


de uma variável aleatória a probabilidade de ele ocorrer.

• Dada a variável aleatória X, assumindo os valores x1, x2, x3,…,xn, chamamos de


valor médio ou valor esperado ou esperança matemática de X o valor: E(X) = x1
·P(X = x1) + x2 ·P(X = x2) + ... + xn ·P(X = xn)

• Dada a variável aleatória X,


n
assumindo os valores x1, x2, x3,…,xn, a variância de
X será dada por: Var(X) = ∑ (xi – E(X))2 · P(X = xi) ou Var(X) = E(X)2 – [E(X)]2
i=1

• O desvio padrão, representado por DP(X), nada mais é que a raiz quadrada da
variância σ = DP(X) = √Var(X) = √σ2

91
AUTOATIVIDADE

Agora, acadêmico, é a sua vez de exercitar o que aprendeu até aqui!


Lembre-se de que você tem à disposição no Material de Apoio do Ambiente
Virtual de Aprendizagem os gabaritos das autoatividades. Consulte-os sempre
que necessário.

Conte também com a Tutoria Interna do Curso de Matemática, que está


disponível por meio do 0800 e contato e atendimento on-line. Bons estudos!

1 O quadro a seguir apresenta o número de acidentes com vítimas fatais


durante o feriado de carnaval nas rodovias do estado.

Nᵒ de vítimas fatais 0 1 2 3 4

Quantidade de acidentes 29 15 10 5 1

Considerando a variável aleatória X o número de vítimas fatais em cada


acidente (durante o feriadão de carnaval nas rodovias do estado), construa
uma distribuição de probabilidades para essa variável em forma de quadro e
determine: E(X), Var(X) e DP(X).

2 A partir dos dados da questão anterior construa a distribuição de


probabilidade acumulada de X e determine a probabilidade de um
automóvel que se envolveu em um acidente nesse feriadão ter, no máximo,
2 vítimas fatais.

3 Considerando o lançamento de 1 dado, determine os elementos que as


variáveis aleatórias a seguir podem assumir:
X: pontos da face voltada para cima;
Y: pontos pares da face voltada para cima;
Z: pontos ímpares da face voltada para cima.

4 Construa a distribuição de probabilidade das variáveis X, Y e Z do exercício


anterior.

5 Num certo jogo de dados, ganha-se toda vez que saem os números 1 ou 2.
Considerando a variável aleatória X o número de vezes que se ganha, quais
são os valores que X pode assumir em 5 jogadas?

6 Em uma sala de aula há 12 mulheres e 8 homens. Sorteiam-se ao acaso 3 alunos.


Sendo a variável aleatória X o número de mulheres sorteadas, determine:

92
a) os valores que X pode assumir;
b) a distribuição de probabilidade de X;
c) a distribuição de probabilidade acumulada de X;
d) P(X ≤ 2), P(X ≤ 3).

7 Dada uma variável aleatória X com distribuição de probabilidade dada a


seguir, obtenha E(X), Var(x) e DP(X).

X -3 0 1 3

P(X=xi) 0,2 0,1 0,4 0,3

8 Uma empresa de aluguel de carros registrou os seguintes números de carros


alugados por mês e suas respectivas probabilidades, conforme quadro a seguir:

X 55 66 84 39

P(X=xi) 0,38 0,29 0,20 0,13

Considerando a variável aleatória X o número de carros alugados por


mês, determine E(X), Var(X) e DP(X).

9 O tempo para uma criança realizar uma determinada tarefa em horas foi
modelado por uma variável aleatória X com a seguinte distribuição de
probabilidade:

X 0,35h 0,40h 0,45h 0,50h

P(X=xi) 0,38 0,29 0,20 0,13

Qual é o tempo esperado para uma criança realizar essa tarefa?

10 Uma urna contém 5 bolas brancas e 3 bolas pretas. Três bolas são retiradas ao
acaso e sem reposição. Faça X a variável aleatória número de bolas pretas e
determine a distribuição de probabilidades da variável X.

93
94
UNIDADE 2 TÓPICO 2

DISTRIBUIÇÕES DE PROBABILIDADE PARA


VARIÁVEIS DISCRETAS

1 INTRODUÇÃO
Até aqui você estudou noções sobre as distribuições de probabilidade,
porém é deste tópico em diante que você estudará o conceito e a definição
matemática de distribuições de probabilidade.

Você já viu que uma distribuição de probabilidade pode ser discreta


ou contínua. A partir de agora você verá que é comum o uso de funções que
se ajustem à distribuição de probabilidade. São algumas destas funções, as mais
usuais no cálculo de probabilidades, que você estudará nessa unidade.

2 DISTRIBUIÇÕES DE BERNOULLI E BINOMIAL


A distribuição de Bernoulli é usada somente nos casos em que a pergunta
apenas admite duas respostas, sim ou não. Veja as perguntas a seguir:

• Os cabelos de uma pessoa são castanhos?


• Você faz faculdade de Matemática?
• Saiu coroa no lançamento de uma moeda?
• Eu não nasci no ano de 1987?

Veja que, nas perguntas anteriores, as respostas possíveis são apenas duas
e excludentes entre si. Ou seja, a resposta será sim ou será não.

Você sempre chamará a afirmativa da pergunta de sucesso e representará


a probabilidade de essa resposta acontecer por p.

A negativa da pergunta você sempre chamará de fracasso e sua


probabilidade será 1 – p, pois será a complementação do sucesso.

O sucesso no caso da última pergunta “Eu não nasci no ano de 1987?”


é não ter nascido no ano de 1987, enquanto o fracasso é ter nascido. Neste caso
teríamos um fracasso, pois a autora deste caderno realmente nasceu em 1987.

95
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Voltando à distribuição de Bernoulli, é importante defini-la como uma


distribuição discreta de espaço amostral {0, 1}, com probabilidades P(0) = 1 - p =
q e P(1) = p. Sua função é:

P(X = x) = px · qx-1

Veja que nesta definição o 0 representa a negativa da pergunta e P(0) a


probabilidade do fracasso, enquanto o 1 é a afirmativa e P(1) é a probabilidade
de sucesso.

Nesta distribuição tem-se:

E(X) = p
Var(X) = p(1 – p) = pq

Exemplo 1:

Uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola dessa urna.
Seja X o número de bolas verdes. Calcule E(X), Var(X) e determine a função P(X=x).

Solução:

X= { 0 → q = 30/50 = 3/5
1 → q = 20/50 = 2/5
.·. P(X = x) = (2/5)x·(3/5)1-x

Assim:

E(x) = p = 2/5
Var(X) = pq = 2/5·3/5 = 6/25

A distribuição binomial é uma generalização da distribuição de Bernoulli,


ou seja, é utilizada nos casos de distribuição de Bernoulli repetida n vezes.

A probabilidade de uma distribuição binomial é dada por:

P(X=x) = Cn,x px qn-x

Onde:
n é o número de vezes que o experimento ocorre
x é o número de vezes que queremos que o sucesso ocorra, com x ϵ {0, 1, 2, ... ,n}
p é a probabilidade do sucesso (tem que ser constante em todos os experimentos)
q é a probabilidade do fracasso. q = 1 – p
Cn,x = n!/x!·(n-x)!

96
TÓPICO 2 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS DISCRETAS

UNI

Lembre-se de que Cn,x é a forma de representar a combinação, estudada na


Unidade 1.

Nesta distribuição tem-se:

E(X) = np
Var(X) = npq

Exemplo 1:

Vamos supor uma pesquisa que, após entrevistar membros de uma


associação de empresários, concluiu que 20% dos seus membros tinham comprado
ações diretamente através de uma oferta pela internet. Em uma amostra de 10
membros destes associados, verifique:

i) Qual é a probabilidade de que exatamente três membros tenham comprado


tais ações?
ii) Qual é a probabilidade de que, pelo menos, um membro tenha comprado tais
ações?
iii) Qual é a probabilidade de que, no máximo, 9 membros tenham comprado tais
ações?
iv) Qual é o número esperado de membros que compraram tais ações?

Soluções:

Sendo a variável aleatória X o número de membros que compraram ações,


deve-se considerar X = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10} e:

n = 10 (número de membros associados)


p = 0,2 (20% compraram ações)
q = 0,8 (1 – p = 1 – 0,2 = 0,8)

x = 3 (três membros tenham comprado ações)

P (X=3) = C10,3 · 0,23 · 0,810-3 =


P (X=3) = 120 · 0,008 · 0,2097152 ≈ 0,201

ii) O evento “pelo menos um tenha comprado ações” significa que X pode ser
1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10, exceto 0. Usando o princípio da probabilidade
complementar, é necessário calcular P(X = 0) e subtrair esse valor de 1.

97
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

P (X=0) = C10,0 · 0,20 · 0,810-0 =


P (X=0) = 1 · 1 · 0,810 ≈ 0,107

Então:

P (X≥1) = 1 - P (X=0) =
P (X≥1) = 1 - 0,107 ≈ 0,893

iii) O evento “no máximo 9 tenham comprado ações” significa que X pode ser
0, 1, 2, 3, 4, 5, 6, 7, 8 ou 9, exceto 10. Usando o princípio da probabilidade
complementar, precisa-se calcular P(X = 10) e subtrair esse valor de 1.

P (X=10) = C10,10 · 0,210 · 0,810-10 =


P (X=10) = 1 · 0,210 · 1 = 0,0000001024

Então:

P (X≤9) = 1 - P (X=10) =
P (X≤9) = 1 - 0,0000001024 ≈ 0,9999998976

iv) Considere a esperança E(X) = np, ou seja, E(X) = 10· 0,2 = 2

Exemplo 2:

Uma moeda é lançada 9 vezes. Calcule a probabilidade de ocorrer:

i) 4 coroas;
ii) no máximo 3 coroas;
iii) no mínimo 2 coroas.

Soluções:

Sendo a variável aleatória X o número de ocorrências de coroas, tem-se


que X = {0,1, 2, 3, 4, 5, 6, 7, 8, 9} e:
n = 9 (número de lançamentos)
p = 1/2 (probabilidade de obter coroa)
q = 1/2 (1 – p = 1 – 1/2 = 1/2)

i) Ocorrer 4 coroas, ou seja, x = 4.

P (X = 4) = C9,4 · (1/2)4 · (1/2)9-4 =


P (X = 4) = 126 · 1/16 · 1/32 = 126/512 ≈ 0,246

ii) Ocorrer no máximo três coroas significa que X pode ser 0, 1, 2 ou 3.

P (X = 0) = C9,0 · (1/2)0 · (1/2)9-0 =


P (X = 0) = 1 · 1 · 1/512 = 1/512

98
TÓPICO 2 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS DISCRETAS

P (X = 1) = C9,1 · (1/2)1 · (1/2)9-1 =


P (X = 1) = 9 · 1/2 · 1/256 = 9/512

P (X = 2) = C9,2 · (1/2)2 · (1/2)9-2 =


P (X = 2) = 36 · 1/4 · 1/128 = 36/512

P (X = 3) = C9,3 · (1/2)3 · (1/2)9-3 =


P (X = 3) = 84 · 1/8 · 1/64 = 84/512

Assim, somam-se as probabilidades:

P(X≤3) = P(X=0) + P(X=1) + P(X=2) + P(X=3)


P(X≤3) = 1/512 + 9/512 + 36/512 + 84/512 = 130/512 ≈ 0,254

iii) Ocorrer no mínimo duas coroas significa que X pode ser 2, 3, 4, 5, 6, 7, 8 ou


9, exceto 0 ou 1. Usando o princípio da probabilidade complementar, calcule
P(X = 0) + P(X = 1) e subtraia esse valor de 1.

Do item anterior temos que P(X = 0) + P(X = 1) = 1/512 + 9/512 = 10/512, então:

P(X≥2) = 1 - [P(X=0) + P(X=1)


P(X≥2) = 1 - 10/512 ≈ 0,98

Conheça também, na sequência, a distribuição de Poisson.

3 DISTRIBUIÇAO DE POISSON
Se X for a ocorrência de algum evento aleatório em um intervalo de tempo
ou espaço(ou algum volume de matéria), a probabilidade de ocorrência de X é:

P(X=x) = (e-μ · μx)/x!



onde:

μ é a média de ocorrência de x num determinado intervalo de tempo


e é o número de Euler (e = 2,71828182846...)
x é o número de vezes que queremos que o sucesso ocorra, por exemplo, x ϵ
{0, 1, 2, ...}

Esta distribuição descreve eventos raros com enorme número de tentativas,


como: a picada de um mosquito infectado com malária ou número de chamadas
telefônicas recebidas num determinado período, por exemplo.

99
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Em casos assim, você tem como determinar o número de sucessos (número


de picadas ou chamadas), porém não conseguirá determinar o número total de
fracassos ou total de elementos (sucessos + fracasso).

Assim, tem-se nesta distribuição: Var(X) = E(X) = μ = np.

Exemplo 1:

Certo estudo psiquiátrico demonstrou que a distribuição mensal de


suicídios entre adolescentes de determinada comunidade, entre 1977 e 1987,
obedecia a uma distribuição de Poisson com média μ = 2,75.

Qual é a probabilidade estimada de que num certo mês sorteado do ano


ocorram 3 suicídios de adolescentes?

Solução:

Sendo a variável aleatória X o número de suicídios por mês, temos:


μ = 2,75 (média mensal de suicídios)
x = 3 (número de suicídios por mês)

P(X=3) = (e—2,75 · 2,753)/3!


P(X=3) ≈ 0,22

Observe que a média μ e o período de que se pretende calcular a


probabilidade estão no mesmo intervalo de tempo (mensal). Quando forem
diferentes, ajuste-os de forma conveniente. Veja o próximo exemplo:

Exemplo 2:

O serviço de tutoria de certa universidade recebe, em média, 20 chamadas


por hora. Qual é a probabilidade de não receber nenhuma chamada em 30 minutos?

Solução:

Seja a variável aleatória X o número de chamadas recebidas por 30


minutos. Veja que temos uma média por hora, mas precisamos da média para 30
minutos, pois queremos saber a probabilidade no intervalo de 30 minutos. Se em
uma hora a média é 20 chamadas, é lógico que, em 30 minutos, a média é de 10
chamadas. Assim:

μ = 10 (média de chamadas em 30 minutos)


x = 0 (número de ligações em 30 minutos)

P(X=0) = (e-10 · 100)/0!


P(X=0) = e-10 ≈ 0,0000454

100
TÓPICO 2 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS DISCRETAS

Para obter a média em outro intervalo de tempo (ou medida), basta


fazer μ = np.

Exemplo 3:

O serviço de tutoria de certa universidade recebe em média 20 chamadas


por hora. Qual é a probabilidade de receber 54 chamadas em 3,5 horas de serviço?

Solução:

Seja a variável aleatória X o número de chamadas recebidas por 3,5 horas.


Cálculo da média para 3,5 horas:

A probabilidade de receber chamadas é: p = 20/h, então a média de


chamadas em 3,5 horas (n = 3,5h) é: μ = np = 3,5h . 20/h = 70 chamadas.

Assim:

μ = 70 (média de chamadas em 3,5 horas)


x = 54 (número de ligações em 3,5 horas)

P(X=54) = (e-70 · 704)/54!


P(X=54) ≈ 0,0074

Existem problemas de distribuição binomial que podem ser aproximados


por uma distribuição de Poisson. Nesses problemas, existe um grande número
de elementos e uma probabilidade p de ocorrência do sucesso bastante pequena.

Uma aproximação é considerada boa se p ≤ 0,1 e μ = np ≤ 5.

Acompanhe o próximo exemplo:

Exemplo 4:

A probabilidade de uma máquina de balões produzir um balão com


defeito é de 0,5%. Qual é a probabilidade de, numa amostra de 1.000 balões, 3
apresentarem defeito?

Solução:

Você deve se perguntar: qual é a média de balões defeituosos?


Considerando que a variável aleatória X número de peças defeituosas segue uma
distribuição de Poisson, temos que μ = np = 1000 . 0,005 = 5.

Assim a probabilidade de termos 3 balões com defeito é:


P(X=3) = (e-5 · 53)/3!
P(X=3) ≈ 0,1404

101
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

LEITURA COMPLEMENTAR

O NASCIMENTO DA ESTATÍSTICA E SUA RELAÇÃO COM O


SURGIMENTO DA TEORIA DE PROBABILIDADE

Cláudia Borim da Silva (PUC-SP)


Cileda de Queiroz e Silva Coutinho (PUC-SP)

A Estatística é definida por Costa Neto (1977) como a ciência que se preocupa
com a organização, descrição, análise e interpretação de dados experimentais e por
este motivo tem aplicação em quase todas as atividades humanas.

Integrada no campo das ciências exatas, a Estatística geralmente faz parte


dos departamentos de Matemática das universidades e tem uma estreita relação
com esta disciplina. Segundo Nelder (1986), seria impossível o desenvolvimento
da parte teórica da estatística sem o corpo de teoria e notação matemática.

Mas essa relação entre a Estatística e a Matemática não apresenta consenso


na literatura. Há quem considere a Estatística como um ramo da Matemática.
Outros consideram-na uma ciência independente, mas que usa a Matemática
como ferramenta. Essa discussão pode ser observada no trabalho de Senn (1998).

Para compreender um pouco dessa discussão atual, o objetivo deste trabalho


é resgatar na história o surgimento da Estatística e da Teoria de Probabilidade,
tentando relacioná-las e situá-las no desenvolvimento da própria Matemática.

A palavra “estatística” tem proveniência no latim statisticum, que significa


relativo ao Estado (DROESBEKE; TASSI, 1990; DUTARTE; PIEDNOIR, 2001;
JOZEAU, 2001). Porém não existe, na literatura, um consenso sobre quem ou qual
civilização utilizou primeiramente o termo “estatística” tal como o usamos nos
dias atuais, ou seja, para designar uma área do saber ou um conjunto de medidas-
resumo de um conjunto de dados.

Kendall (1978) argumenta que o primeiro uso da palavra “estatística”


deu-se num trabalho do historiador italiano Girolamo Ghilini, em 1589, que
versava sobre uma descrição política. Por outro lado, Porter (1986) afirma que a
palavra “estatística” foi primeiramente usada como um substantivo por Gottfried
Achenwall, em 1749.

Dada a controvérsia sobre o surgimento do termo “estatística”, o que se


pode afirmar é que a utilização de ideias de caráter estatístico teve seu início
na Antiguidade, com a necessidade de os Estados conhecerem os dados de sua
população, território e outros atributos do poder.

102
TÓPICO 2 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS DISCRETAS

Embora Kendall (1978) argumente que os trabalhos realizados até o


século XVII apenas tinham como objetivo a obtenção de uma descrição política
dos Estados e que o aparecimento de informação numérica dava-se por acidente
ou por conveniência, é interessante conhecer um pouco desta história.

O primeiro registro de recenseamento refere-se à civilização da Suméria


(de 5000 a 2000 a.C.), para o qual foram elaboradas em tábuas de argila listas
dos homens e seus bens. Segundo Droesbeke e Tassi (1990), o poder egípcio,
representado pelo faraó Amasis II (por volta de 2700 a 2500 a.C.), institucionalizou
os recenseamentos com objetivo tributário, e neles todo indivíduo era obrigado a
declarar sua fonte e atividade de renda, sob pena de morte a quem não o fizesse.

Na China, muitos recenseamentos foram realizados. Segundo Ferreira et


al. (2002), o primeiro recenseamento foi feito em 2238 a.C., pelo imperador Yu
(ou Yao), com o objetivo de conhecer com exatidão o número de habitantes para
dividir o território, cobrar impostos e recrutar homens para o serviço militar.

Na Índia Antiga foi feito um tratado de recenseamento denominado Tratado


de Arthasástra, ou seja, tratado de ciência (sástra) e do progresso (artha). Foi redigido
por Kautilya, ministro do rei Candragupta (313-289 a.C.), cujo objetivo era aumentar
incessantemente o seu reino. “Tudo o que for feito terá de ser conhecido: do efetivo da
população até o número de elefantes, passando pelas matérias-primas, os produtos
fabricados, os preços e os salários” (FERREIRA et al., 2002, p. 11).

Esses autores também relatam que, em Roma, os recenseamentos foram


realizados de 750 a.C. até 476 d.C., e neles os cidadãos romanos eram obrigados
a declarar suas fortunas, seus nomes, os de seus pais, a idade, o nome de suas
esposas assim como o de seus filhos, a tribo em que residiam e o número
de escravos, sob pena de ficarem sem seus bens ou seus direitos de cidadão
(FERREIRA et al., 2002, p. 12).

A partir do século XIII a Estatística começa a caminhar para os moldes da


ciência que conhecemos hoje. Na França, por volta de 1300, as famílias e/ou lares
foram utilizados como elemento essencial para estimar a sua população.

Depois desse século, segundo Jozeau (2001), existiam três correntes


estatísticas separadas geograficamente: a Estatística Descritiva alemã, a Aritmética
Política inglesa e os jogos e probabilidades, na França.

Segundo Jozeau (2001), Hermann Conring (1606-81) criou o termo


Stati para definir a Estatística Descritiva alemã, cujo objetivo era descrever a
diversidade territorial nacional.

103
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Uma das inovações dos estudos realizados por essa escola foi a publicação
de tabelas cruzadas (hoje conhecidas como tabelas de contingência ou tabelas de
dupla entrada) para apresentar os dados dos recenseamentos realizados no território
alemão. Nessas tabelas eram listados os nomes das famílias e o respectivo número de
homens, o número de mulheres, o número de filhos e empregados da família.1

Segundo Ferreira et al. (2002), essa escola preocupava-se em descrever


os estados políticos, e, portanto, as informações numéricas que apareciam nos
registros ocorriam somente por acaso ou por conveniência.

O trabalho com esse tipo de informação aparece com a escola de Aritmética


Política, na Inglaterra. Segundo Jozeau (2001), essa escola difundiu-se por toda a
Europa.

A Aritmética Política, segundo Droesbeke e Tassi (1990), preocupava-se


com a quantificação e a pesquisa de constantes de comportamento, permitindo
estimações e previsões tais como o número de filhos por mulher, o tempo entre
dois nascimentos de uma mesma mulher, o número de habitantes por família, a
proporção de falecimentos etc.

Perero (1994) explica que a Estatística deu um grande salto qualitativo


por volta do século XVII. Por um lado, a utilização de dados estatísticos começa
em instituições financeiras e companhias de seguro. Por outro lado, nasce na
Inglaterra o conceito de Aritmética Política e começa-se a “matematizar” outras
disciplinas, que eram, até então, puramente descritivas, como a demografia, a
economia e as ciências sociais.

Os fundadores da Aritmética Política foram John Graunt (1620-74) e


William Petty (1623-87), mas o termo “Aritmética Política” foi dado por Petty
e definido por Charles Davenant (1656-1714) como a arte de raciocinar com
números sobre os problemas do governo (JOZEAU, 2001).

John Graunt utilizou os dados publicados nos boletins sobre mortalidade,


que foram realizados após 1519 em Londres, para estabelecer e verificar certas
questões controversas como as causas de mortalidade, o tamanho exato da
população de Londres, a relação entre o número de homens e de mulheres.
Segundo Ferreira et al. (2002), Graunt fez uma análise exaustiva do número de
pessoas que morriam de várias doenças e estimou o número de nascimentos
de homens e de mulheres, mostrando, por exemplo, que nasciam mais homens
que mulheres e que, a cada 100 pessoas nascidas, 36 morriam aos 6 anos e que
7 sobreviviam até os 70 anos. Segundo Lightner (1991), Graunt foi a primeira
pessoa a lidar com inferência estatística na análise de dados de massa.

Graunt publicou sua obra Natural and political observation made upon
the bills of mortality em 1662, e isso chamou a atenção do rei da Inglaterra (Carlos
II), que propôs a Graunt ser sócio fundador da Royal Society.

104
TÓPICO 2 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS DISCRETAS

Willian Petty, que também era membro da Royal Society, trabalhou


durante três anos com John Graunt. Ele estimou a população de Londres da
seguinte maneira: o número de residências era 105.000 e, considerando que a
média de membros da família era de seis pessoas e que 10% das residências
abrigavam duas famílias, ele concluiu que havia 695.000 habitantes em Londres
(DROESBEKE; TASSI, 1990, p. 42).

Essa técnica utilizada por Petty foi denominada “de extrapolação” ou “de
multiplicação” e teve um enorme sucesso. Jean Joseph d’Expilly (1719-93) utilizou
esta técnica com outro estimador, usando o fator “5” para residências urbanas e
“4,5” para residências rurais.

Segundo Jozeau (2001), Graunt utilizou a mesma técnica e inovou,


extrapolando os dados de Londres (calculados por Petty) para a Inglaterra.

Depois do trabalho de Graunt, o trabalho seguinte de grande importância


foi o de Edmund Halley (1656-1742), que era matemático de Oxford, e em suas
memórias de 1693 publicou Degrees of mortality of mankind, em que fez um
estudo cuidadoso das anuidades (LIGHTNER, 1991).

Kendall (1978) argumenta que a Aritmética Política é o verdadeiro


antepassado da Estatística como é entendida hoje. Segundo Droesbeke e Tassi
(1990), as técnicas desenvolvidas na Aritmética Política passaram a ser utilizadas
em detrimento dos recenseamentos e favoreceram o aparecimento de enquetes
parciais, que tiveram como justificativa o cálculo de probabilidades.

A probabilidade começou como ciência empírica. Vários dos problemas


propostos nessa área do saber foram pensados por matemáticos, filósofos,
naturalistas, advogados, respondendo a uma necessidade social: o estudo de
jogos de azar.

Girolamo Cardano (Jérôme Cardan) (1501-76), professor de matemática


e medicina, jogou diariamente por mais de 40 anos. Desde cedo em sua vida, ele
determinou que, se não jogasse apostando algum dinheiro, nenhuma compensação
seria obtida por um tempo perdido em jogos, tempo este que poderia utilizar
inteiramente na busca de aprendizagem (LIGHTNER, 1991).

Como não queria gastar seu tempo em atividades não promissoras, ele
analisou seriamente as probabilidades de tirar um ás de um baralho de cartas e
de obter a soma “7” no lançamento de dois dados. Então, ele relatou os resultados
dessas investigações, bem como suas experiências em um manual de jogos
chamado Liber de Ludo Aleae, publicado em 1539.

105
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Perero (1994) explica que Cardano é considerado o pai da Teoria de


Probabilidade, pois nessa obra analisou os jogos de azar de forma sistemática.
Em um capítulo intitulado “On the cast of one die”, ele relatou: “Eu posso tirar
1, 3 ou 5, bem como posso tirar 2, 4 e 6. As apostas são feitas de acordo com esta
igualdade, se o dado é honesto e, em caso contrário, elas são feitas muito maiores
ou menores em proporção para a saída da verdadeira igualdade” (BURTON,
1985 citado em LIGHTNER, 1991).

Nesse relato, é possível notar a transição do empirismo para o conceito


probabilístico teórico de um dado honesto, que, segundo Lightner (1991), marca
a fundação do campo da matemática que se denomina “probabilidade”, mas que,
para aquela época, poderia ser “jogo” demais para os matemáticos e matemáticos
demais para os jogadores.

Embora exista esse trabalho de Cardano, para alguns historiadores a Teoria


de Probabilidade começou efetivamente com a correspondência entre Pascal e
Fermat, do fato de que uma das cartas evoca efetivamente o termo “Geometria do
Acaso” para referir-se ao cálculo de probabilidades.

Segundo Perero (1994), em 1650, Antoine de Gombaud, o Chevalier de


Méré, um experiente jogador francês, tinha como problema entender por que 11
ocorria com mais frequência do que 12 no lançamento de 3 dados e solicitou a
Pascal que o ajudasse a solucionar – Pascal explicou que ele estava errado. Em
seguida, Méré solicitou a Pascal resolver o problema dos pontos.2

Buscando solucionar esse problema, Pascal comunicou-o a Fermat, dando


início à série de cartas que são reputadas como origem desta teoria. Nessas
cartas, pode-se encontrar o problema corretamente resolvido por ambos, mas de
maneiras diferentes. Nota-se que eles lidavam com os fundamentos da teoria da
probabilidade matemática, um evento que Eves chama de “um grande momento
em matemática” e que é considerado por alguns historiadores o início da Teoria
de Probabilidade (LIGHTNER, 1991).

Em 1657, Christian Huygens (1629-95) escreveu o primeiro tratado formal


de probabilidade, De Ratiociniis in Ludo Aleae, baseado nas correspondências
entre Fermat e Pascal.

Somente em 1713 tem-se notícia de outra publicação fundamental para


o desenvolvimento dessa teoria, quando Ars Conjectandi, de Jakob Bernoulli
(1654-1705), foi publicado postumamente, e dá início ao enfoque frequentista do
conceito de probabilidade.

Segundo Ferreira et al. (2002), a ligação das probabilidades com os


conhecimentos estatísticos veio dar uma nova dimensão à Estatística, considerando-
se o início da inferência estatística.

106
TÓPICO 2 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS DISCRETAS

Lightner (1991) explica que, depois dos estudos pioneiros de Graunt e


Halley, foi Abraham De Moivre (1667-1754) quem prosseguiu o tipo de estudo
que era feito na Aritmética Política.

De Moivre emigrou para a Inglaterra, onde conheceu Newton e Halley, e


publicou Doctrine of chances em 1718 sobre a Teoria do Acaso, em que expunha,
entre outros assuntos, a probabilidade de tirar bolas de cores diferentes de uma
urna (FERREIRA et al., 2002).

Esse trabalho de De Moivre teve um importante papel no desenvolvimento


da matemática atuarial e sua relação com seguros de vida, e mais tarde ele
preparou um material no qual descreveu a curva normal de probabilidade
(LIGHTNER ,1991, p. 627).

Segundo Lightner (1991), a partir de De Moivre, probabilidade e estatística


entraram num período de transição, em que os conceitos foram examinados,
aplicados a velhos e novos problemas além daqueles de jogos e tabelas de
mortalidade, que registraram o começo da probabilidade e da estatística,
respectivamente.

Jakob Bernoulli (1654-1705) desenvolveu o que hoje chamamos de


distribuição de Bernoulli, que consiste em dizer que um experimento aleatório
tem duas possibilidades de resultado: sucesso e fracasso (configuração de urna
de Bernoulli), que fora a base da distribuição binomial (FERREIRA et al., 2002).
Outros membros da família Bernoulli também se destacam nesta área. Por
exemplo, Daniel (1700-82) investigou o Paradoxo de Petersburg3, que consiste na
solução de um problema de jogo.

Bernoulli também mostrou como o Cálculo Integral (que tinha surgido 60 anos
antes) poderia ser aplicado à probabilidade. Leonhard Euler (1707-83) sistematizou e
organizou muitos problemas probabilísticos, e Joseph Lagrange (1736-1813) também
avançou na Teoria de Probabilidade aplicando o cálculo diferencial.

Pierre Simon Laplace (1749-1827) publicou em 1812 sua obra intitulada


Teoria analítica das probabilidades, em que definiu, em um de seus princípios, a
probabilidade pela qual o número de vezes em que um determinado acontecimento
pode ocorrer, dividido pelo número total dos casos, considerando-se a hipótese
de equiprobabilidade (FERREIRA et al., 2002).

Segundo Lightner (1991), embora o interesse de Laplace fosse o estudo da


astronomia (ele publicou Celestial Mechanics em 1799), ele também usou a Teoria de
Probabilidade para obter uma medida estatística de confiabilidade de resultados
numéricos derivados de dados e para determinar a probabilidade de certo fenômeno
astronômico ser devido a causas definidas em vez de ao puro acaso.3

107
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Em 1812, Laplace publicou Théorie analytique des probabilités, em que organizou


tudo o que era conhecido sobre a teoria estatística e probabilística em uma primeira
tentativa de axiomatização. Segundo Lightner (1991), Laplace é frequentemente
considerado o pai da teoria moderna de probabilidade porque ele entendeu, talvez
melhor que todos de seu tempo, a significância da probabilidade para o mundo.
Usando a Teoria de Probabilidade, um número de matemáticos derivou vários
tipos de distribuições matemáticas que descreveriam várias populações, incluindo a
distribuição de Bernoulli e de Poisson, o ajustamento da distribuição normal descrita
por Karl Friedrich Gauss (1777-1855), que devotou especial atenção à curva normal,
sua equação e suas aplicações (LIGHTNER, 1991, p. 629).

O começo da análise estatística de dados de censo foi feita em 1829 por


Lambert Adolphe Jacques Quetelet (1796-1874), na Bélgica.

Francis Galton (1822-1911) descobriu a lei da regressão e o coeficiente


de correlação em 1877. Começando em 1894, Karl Pearson (1857-1936) aplicou
a probabilidade à biologia e criou a área de estudo denominada Biometrics
(LIGHTNER, 1991).

Mas, durante o século XIX, descobriu-se que um grande número de


fenômenos naturais nas ciências biológicas e na física seguia a distribuição
normal dos erros aleatórios, e começa uma união dessas duas correntes
(BENNETT, 2003, p. 122).

No entanto, é apenas no final do século XIX que o desenvolvimento da


matemática permite um avanço efetivo na Teoria de Probabilidade. O trabalho de
Borel e de Lebesgue permite a Kolmogorov, em 1933, publicar uma obra contendo
a axiomatização da Teoria de Probabilidade.

Pelos apontamentos históricos pode-se considerar que o início da estatística


deu-se na Antiguidade com os recenseamentos e somente na Aritmética Política
teve um avanço no tipo de trabalho que era realizado. Esse período aconteceu do
século VI antes de Cristo até o século XVII após Cristo, o que soma 23 séculos.

Quanto à Teoria de Probabilidade, embora existam registros de jogos


de azar na Antiguidade, o desenvolvimento das ideias que formam a base da
Teoria de Probabilidade ocorreu com Cardano, no século XVI depois de Cristo
(COUTINHO, 1994).

Um ponto em comum no surgimento das ideias da estatística e da


probabilidade é que ambas surgiram a partir de problemas empíricos, embora
existam registros de mais matemáticos envolvidos com os problemas de jogos de
azar do que com problemas de recenseamentos. Mas os caminhos dessas duas
áreas permaneceram separados até o surgimento da Aritmética Política (século
XVII). Foi com a obra de De Moivre que se tem registro da união dos trabalhos
realizados pela estatística e pela probabilidade, o que dá início à área da Estatística
denominada Inferência.

108
TÓPICO 2 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS DISCRETAS

Portanto, a partir do século XVII a relação entre a Estatística e a Probabilidade


torna-se indissociável, contribuindo para o desenvolvimento de estudos em
diversas áreas do conhecimento, como a biologia, a psicologia, entre outras.

REFERÊNCIAS

BENNETT, D. J. Aleatoriedade. Trad. de W. Barcellos. São Paulo: Martins Fontes,


2003.

COSTA NETO, P. Estatística. São Paulo: Edgar Blucher, 1977.

COUTINHO, C. de Q. e S. Introdução ao conceito de probabilidade por uma


visão frequentista: estudo epistemológico e didático. Dissertação (Mestrado em
Matemática) - Pontifícia Universidade Católica, São Paulo, 1994.

DROESBEKE, J. J.; TASSI, P. Histoire de la statistique. Paris: Presses Universitaires


de France, 1990.

DUTARTE, P.; PIEDNOIR, J.-L. Grande et petite histoire de la statistique. In:


DUTARTE, P.; PIEDNOIR, J.-L. Enseigner la statistique au lycée: des enjeux aux
méthodes. Villetaneuse: Université de Paris 13/IREM, 2001.

FERREIRA, M. J.; TAVARES, I.; TURKMAN, M. A. Notas sobre a história da


estatística. Portugal: Instituto Nacional de Estatística, 2002. Disponível em: <http://
alea.ine.pt/html/statofic/html/dossier/doc/dossier6.pdf>. Acesso em: 15 dez. 2003.

JOZEAU, M.-F. Histoire des statistiques et des probabilités: un survol. In:


L’Institut de Recherche sur l’Enseignement des Mathematiques (IREM) (Org.).
Des statistiques à la pensée statistique. Montpellier: IREM, 2001.

KENDALL, M. G. Where shall the history of statistics begin? In: PEARSON, E.


S.; KENDALL, M. Studies in the history of statistics and probability. Londres:
Charles Griffin, 1978.

LIGHTNER, J. E. A brief look at the history of probability and statistics.


Mathematics Teacher, v. 84, n. 8, 1991.
NELDER, J. Statistics, science and technology. J. R. Statist.Soc. A, v. 149, Part 2,
1986.

PERERO, M. História e histórias de matemáticas. México: Grupo Editorial Ibero-


Americano, 1994.

PORTER, T. M. The rise of statistical thinking, 1820-1900. Nova York: Princeton


University Press, 1986.

SENN, S. Mathematics: governess or handmaid en? The Statistician, v. 47, n. 2,


1998.

109
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Notas

1 Um exemplo dessas tabelas pode ser visto em Jozeau (2001, p. 57).

2 Lightner (1991) explica o que era o problema dos pontos: suponha que um
jogador, por exemplo, o Chevalier de Méré, e um de seus amigos estivessem
num jogo de dados do século XVII. Cada jogador aposta 30 pistolas (antiga
moeda espanhola) que seu número escolhido sairá três vezes num dado antes
que o número do outro jogador saia três vezes. Depois de o jogo ter começado, o
número de Méré, 5, tinha saído duas vezes enquanto o número de seu oponente,
3, tinha saído somente uma vez. Nesse momento, Méré recebe uma mensagem
urgente e o jogo deve parar. Como os jogadores deveriam dividir as 60 pistolas
na mesa? O amigo de Méré afirma que, considerando que a chance de ele obter
duas jogadas sortudas é metade da chance de Méré obter uma jogada sortuda,
ele deveria receber 20 pistolas e Méré deveria receber 40. De Méré argumenta
que, na próxima jogada, o pior que poderia acontecer para ele seria perder
sua vantagem, ocorrendo um empate, e então as pistolas seriam divididas
igualmente. Entretanto, se saísse 5 na próxima jogada, ele seria o vencedor e
receberia as 60 pistolas. De Méré afirma que, mesmo antes da jogada, ele deve
receber 30 pistolas e mais 15 que é a metade da certeza; portanto, ele deveria
receber 45 e seu oponente 15. E ele estava certo. Pascal e Fermat decidiram
esse resultado em suas famosas correspondências. Eles também consideraram
outros problemas relacionados ao problema dos pontos, tal como a divisão do
dinheiro apostado quando os dois jogadores são desigualmente habilidosos ou
quando mais do que dois jogadores estão apostando.

3 Um jogador lança uma moeda e um segundo jogador concorda em pagar uma


quantidade em dinheiro se aparecer cara no 1º lançamento, o dobro do dinheiro
se aparecer cara no 2º lançamento, 4 vezes a quantia inicial se aparecer cara no
3º lançamento, 8 vezes se sair cara no 4º lançamento, e assim sucessivamente. O
paradoxo nasceu sobre quanto deveria ser pago, antes do jogo, para ser honesto
com ambos os jogadores. Uma grande diferença surgiu entre o senso comum e
o raciocínio matemático (LIGHTNER, 1991, p. 628).
FONTE: SILVA, Cláudia Borim; COUTINHO, Cileda de Queiroz e Silva. O nascimento da estatística e
sua relação com o surgimento da teoria de probabilidade. Revista Integração, São Paulo, ano 11, n.
41, p. 191-196, 2005. Disponível em: <ftp://ftp.usjt.br/pub/revint/191_41.pdf>. Acesso em: 24 jan. 2013.

110
RESUMO DO TÓPICO 2
Neste tópico, você estudou:

• A distribuição de Bernoulli é a distribuição discreta de espaço amostral {0, 1},


com probabilidades P(0) = 1 - p = q e P(1) = p. Sua função de distribuição de
probabilidade é: P(X=x) = px·qx-1

• A distribuição binomial é uma distribuição usada quando se tem um caso de


distribuição de Bernoulli repetida n vezes.

• A probabilidade de uma distribuição binomial é dada por:


P(X=x) = Cn,x px qn-x

• A distribuição de Poisson descreve a ocorrência de algum evento aleatório em


um intervalo de tempo ou espaço (ou algum volume de matéria) e sua função
de distribuição de probabilidade é: P(X=x) = (e-μ · μx)/x!

111
AUTOATIVIDADE

Agora, acadêmico, é a sua vez de exercitar o que aprendeu até aqui!


Lembre-se de que você tem à disposição no Material de Apoio do Ambiente
Virtual de Aprendizagem os gabaritos das autoatividades. Consulte-os
sempre que necessário.

Conte também com a Tutoria Interna do Curso de Matemática, que está


disponível por meio do 0800, contato e atendimento on-line. Bons estudos!

1 Uma escola recebe, em média, 20 alunos novos por ano. Qual é a probabilidade
de que, em um ano selecionado aleatoriamente, a escola não receba nenhum
aluno novo?

2 Considere que a probabilidade de nascimento de menino ou menina é a


mesma, determine a probabilidade de que, em 5 nascimentos:
a) apenas dois sejam meninos;
b) pelo menos dois sejam meninos.

3 Uma fábrica de balões apresenta 5% da sua produção com defeito. Numa


amostra de 100 balões, escolhidos ao acaso, qual é a probabilidade de:
a) 5 serem defeituosos;
b) no máximo 3 serem defeituosos.

4 Uma pesquisa médica verificou a eficiência de uma determinada droga para


95% da população. Se um médico receita essa droga para 3 pacientes, qual é
a probabilidade de a droga não ser eficiente para nenhum deles?

5 Um teste com 10 questões de múltipla escolha, com 4 alternativas cada


uma e com apenas uma alternativa correta, aprova o aluno que acertar, no
mínimo, 7 questões. Qual é a probabilidade de aprovação de um aluno que
não estudou?

6 Em uma rodovia há uma média de 5 acidentes por dia. Qual é a probabilidade


de que, em um dia selecionado aleatoriamente,
a) ocorra nenhum acidente?
b) ocorram no máximo dois acidentes?

7 Um telefone recebe chamadas a uma taxa de 0,8 por hora. Qual é a


probabilidade de, em 4 horas, receber:
a) exatamente 5 chamadas?
b) no máximo 3 chamadas?
c) pelo menos 4 chamadas?

112
8 Em uma gráfica verificou-se que, a cada 200 páginas impressas, ocorrem 50
erros tipográficos. Ao selecionar 10 páginas ao acaso de um livro, qual é a
probabilidade de nenhuma conter erros? E no máximo duas terem erros?

113
114
UNIDADE 2 TÓPICO 3

DISTRIBUIÇÕES DE PROBABILIDADE
PARA VARIÁVEIS CONTÍNUAS

1 INTRODUÇÃO
Até aqui você estudou distribuições discretas de probabilidades para
variáveis finitas e numeráveis. Mas, quando se deparar com populações infinitas
ou amostras imensas, as distribuições discretas são ineficazes, pois seus cálculos
demorariam demais.

Justamente por isso se construiu a ideia de continuidade, pois não se tem


mais um conjunto enumerável de dados e sim uma infinidade não enumerável deles.

Mesmo parecendo mais difíceis, as distribuições contínuas, na maioria das


vezes, são de simples aplicação. Já a matemática que é aplicada nestes tipos de
distribuição é um pouco mais elaborada do que a que sustenta a distribuição discreta.

Na Unidade 3, você estudará outras aplicações que usam essas


distribuições.

2 NORMAL
A partir de agora você passará a estudar variáveis aleatórias contínuas.
Das distribuições contínuas, a distribuição normal é, de longe, a mais comum,
pois é a que ocorre com mais frequência na natureza.

A distribuição normal é definida pelos parâmetros μ e σ (média e desvio


padrão populacionais) e a sua função densidade de probabilidade é definida por:

115
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

√α
Microsoft Equation
(x–μ) 2
3.0
1 2σ2
f(x;μ,σ) =
σ√2π

A curva normal tem sempre o aspecto de sino. Veja a seguir:

f(X)

1
σ√2π

μ–σ μ μ+σ X

Quando existir μ = 0 e σ = 1, chama-se a distribuição de normal padrão e


sua função densidade de probabilidade se reduz a:

x2
1 2
f(x;μ,σ)=
√2π

É possível transformar qualquer distribuição normal para uma


distribuição normal padrão. E com base na normal padrão existe a tabela Z
de valores (Apêndice A) que contém todas as soluções de que você precisará,
portanto, não terá que usar as funções anteriores para determinar os resultados
das probabilidades.

O que se faz é transformar uma normal qualquer para uma normal padrão
e, a partir daí, chegar à probabilidade procurada por meio da tabela Z.

Se uma variável aleatória X tem distribuição normal de média μ e variância


σ (X ~ N(μ,σ2)), pode-se transformá-la numa variável aleatória Z de distribuição
2

normal padrão de média 0 e variância 1 (Z ~ N(0, 1)), através da fórmula:

116
TÓPICO 3 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS CONTÍNUAS

z = (x – μ)/σ

O esquema a seguir representa como proceder para transformar uma


normal qualquer em uma normal padrão, acompanhe com atenção.

Se X ~ N(μ ; σ2), X–μ


definimos Z
σ

f(x) X ~ N(μ ; σ2)

f(z)
Z ~ N(0 ; 1) a μ b x

a–μ 0 b–μ z
σ σ

Propriedades da distribuição normal padrão:

(i) E(X) = 0 (média ou valor esperado);


(ii) Var(X) = 1 (e, portanto, DP(X) = 1);
(iii) f (x) → 0 quando x → ±∞;
(iv) x = 0 é ponto de máximo de f (x);
(v) -1 e 1 são pontos de inflexão de f (x);
(vi) a curva normal padrão é simétrica em torno da média 0.

2.1 TABELA Z
Existem vários tipos de tabelas que apresentam as probabilidades sob a
curva normal padrão. A que será utilizada apresenta a probabilidade de a variável
aleatória Z ser menor que z. (Apêndice A).

117
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

P(Z < z)

0 z

Como a área sob a curva de densidade é 1, a probabilidade de a variável


aleatória Z ser maior que z é obtida fazendo:

1 – P(Z < z), se z > 0

P(Z > z)

0 z

ou P(Z < z), se z < 0.

P(Z > z)

z 0

Como essa curva é simétrica em relação à média 0, a P(Z < 0) = 0,5 (ou P(Z
> 0) = 0,5). Assim se você quiser saber a probabilidade de a variável aleatória Z
estar entre 0 e z, basta fazer:

P(Z < z) – 0,5, se z > 0

P(0 < Z < z)

0 z

118
TÓPICO 3 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS CONTÍNUAS

ou 0,5 – P(Z < z), se z < 0.

P(0 < Z < z)

z 0

Para saber a probabilidade de Z estar entre z1 e z2, com z2 < z1, precisa-se
fazer: P(Z < z2 ) – P(Z <z2)

P(z1 < Z < z2)

z1 0 z2

Exemplo 1:

Utilize a tabela Z (Apêndice A) para calcular P(Z > 1,65):

Solução:

Em z = 1,65 deve-se procurar 1,6 na 1ª coluna e 0,05 na 1ª linha, o


cruzamento dessas duas coordenadas é a P(Z < 1,65) = 0,9505. Como você precisa
encontrar P(Z > 1,65), deverá fazer 1 - P(Z < 1,65), então:

P(Z > 1,65) = 1 – 0,9505 = 0,0495.

Exemplo 2:

Utilize a tabela Z (Apêndice A) para calcular P(Z < -1,3)

Solução:

Como a curva é simétrica em relação à média 0, a P(Z < -1,3) é igual a P(Z
> 1,3). Assim, P(Z < -1,3) = P(Z > 1,3) = 1 – P(Z < 1,3). Procurando z = 1,3 na tabela
Z (1,3 parte inteira e a decimal, e 0,00 parte centesimal), tem-se que P(Z < 1,3) =
0,9032, então:

P(Z < -1,3) = P(Z > 1,3) = 1 – P(Z < 1,3) = 1 – 0,9032 = 0,0968.

119
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Acompanhe alguns outros exemplos:

Na tabela Z o número padronizado z é formado por três dígitos: a (parte


inteira), b (parte decimal) e c (parte centesimal), z = a,bc.

A parte inteira e a decimal (a,b) aparecem na primeira coluna da tabela Z,


e a parte centesimal você procura na primeira linha da tabela Z.

Exemplo 3:

P(0 < Z < 2,36) = P(Z < 2,36) – 0,5.

Procurando z = 2,36 na tabela Z (2,3 parte inteira e a decimal, e 0,06 parte


centesimal), temos que P(Z < 2,36) = 0,9909, então:

P(0 < Z < 2,36) = 0,9909 – 0,5 = 0,4909.

Exemplo 4:

P(-2,1 < Z < 0) = 0,5 – P(Z < -2,1).

Devido à simetria da curva a P(Z < -2,1) = P(Z > 2,1) = 1 – P(Z < 2,1).
Procurando z = 2,1 (2,1 parte inteira e a decimal, e 0,00 parte centesimal), tem-se que
P( Z < 2,1) = 0,9821. Assim a P(Z < -2,1) = 1 – P(Z < 2,1) = 1 – 0,9821 = 0,0179, então:

P(-2,1 < Z < 0) = 0,5 – P(Z < -2,1) = 0,5 – 0,0179 = 0,4821.

Exemplo 5:

P(-1,32 < Z < 0,92) = P(Z < 0,92) – P(Z < -1,32).

Procurando z = 0,92 na tabela Z (0,9 parte inteira e a decimal, e 0,02 parte


centesimal), tem-se P(Z < 0,92) = 0,8212. P(Z < -1,32) = P(Z > 1,32) = 1 – P(Z < 1,32),
para z = 1,32 a P(Z < 1,32) = 0,9066. Assim P(Z < -1,32) = 1 – 0,9066 = 0,0934, então:

P(-1,32 < Z < 0,92) = P(Z < 0,92) – P(Z < -1,32) = 0,8212 – 0,0934 = 0,7278.

Nos testes de hipóteses, é comum querer saber que valor de z produz uma
determinada área sob a curva normal padrão, de –z até z.

Por exemplo, para que valor de z tem-se uma área sob a curva normal
padrão de 0,90, de –z até z?

A figura a seguir ilustra essa pergunta.

120
TÓPICO 3 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS CONTÍNUAS

0,90
0,05 0,05
-z z

Como a curva normal padrão é simétrica e a área total sob a curva é 1, a


área branca sob a curva vale 0,05. Assim, pode-se mudar a pergunta para: qual
valor de z deixa uma área menor que 0,95?

0,95

Basta localizar 0,95 no corpo da tabela Z (Apêndice A) para encontrar o


valor de z.

APÊNDICE A

Tabela Z (Normal Padrão)

P(Z<z)
z 0,00 0,01 ... 0,04 0,05 ... 0,09
...
1,6 0,9495 0,9505

Observando a tabela, o valor 0,95 está entre 0,9495 e 0,9505, então, pode-se
dizer que z está entre 1,64 e 1,65. Calculando a média entre esses dois valores, z
= 1,645.

Veja que o que foi feito é comum nos testes de hipóteses do tipo bilateral
(ou bicaudal). Quando o teste for unilateral (ou unicaudal), é preciso obter o valor
de z que determina uma área sob a cauda da curva normal padrão.

Por exemplo, para o valor de z positivo temos uma área de 0,05 sob a
cauda da curva normal padrão? A figura a seguir ilustra essa pergunta.

121
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

0,05
z

Como a área branca sob a curva vale 0,95 e a tabela Z nos dá a P(Z < z),
basta entrar com o valor 0,95, como feito no caso anterior. Assim z = 1,645.

Se fosse necessário obter z negativo, a área estaria do lado esquerdo da


curva e o procedimento para obter z seria o mesmo, já que a curva é simétrica em
relação à média. Assim z valeria -1,645.

AUTOATIVIDADE

Que tal exercitar um pouco? Utilize a tabela Z (Apêndice A) para calcular as


probabilidades:
a) P(0,2 < Z < 1,35)
b) P(Z > - 3,5)
c) P(-1,96 < Z < 1,96)
d) Para que valor de z a área sob a curva normal padrão vale 0,95, de –z até z?

2.2 ALGUNS EXEMPLOS


Agora que você já sabe como usar a tabela Z, acompanhe a resolução de
alguns exemplos de distribuição normal.

a) A altura de uma população têm média 1,70 m e desvio padrão de 0,2m. Um


pesquisador, ao tomar uma pessoa desta população, pretende determinar qual
é a probabilidade de:

i) encontrar alguém com altura superior a 1,80 m;


ii) encontrar alguém com altura entre 1,4 m e 1,65 m;
iii) encontrar alguém com altura inferior a 1,60 m.

Solução:

Note que μ = 1,70 e σ = 0,2, ou seja, tem-se um caso normal, mas ainda
não se tem uma normal padrão, ou seja, não se pode usar a tabela Z. É preciso
transformar essa normal em padrão usando:

122
TÓPICO 3 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS CONTÍNUAS

z = (x – μ)/σ

i) Você quer calcular a probabilidade de encontrar alguém acima de 1,80 m, ou


seja, P(X > 1,80).

Transformando x = 1,80 em z padrão, tem-se que:

z = (x – μ)/σ
z = (1,80 – 1,70)/0,2 = 0,5

O problema agora consiste em encontrar P(Z > 0,5). Como P(Z > 0,5) = 1 –
P(Z < 0,5), tem-se que P(Z > 0,5) = 1 – 0,6915 = 0,3085. Portanto, a P(X > 1,80) = P(Z
> 0,5) = 0,3085.

O valor 0,6915 representa a probabilidade de encontrar alguém com


menos de 1,80 m de altura.

ii) Você deve encontrar P(1,4 < X < 1,65), para isso transforme os valores x1 = 1,4 m
e x2 = 1,65 m em z1 e z2 respectivamente. Tem-se então:

z = (x – μ)/σ
z1 = (1,4 – 1,7)/0,2 = -1,5
z2 = (1,65 – 1,7)/0,2 = -0,25

Agora o problema consiste em encontrar P(-1,5 < Z < -0,25) usando a tabela Z.

Como:
P(-1,5 < Z < -0,25) = P(Z < -0,25) – P(Z < -1,5) e
P(Z < -1,5) = P (Z > 1,5) = 1 – P(Z < 1,5) = 1 – 0,9332 = 0,0668
P(Z < -0,25) = P (Z > 0,25) = 1 – P(Z < 0,25) = 1 – 0,5987 = 0,4013,

Tem-se:
P(-1,5 < Z < -0,25) = 0,4013 – 0,0668 = 0,3345.

Portanto, a P(1,4 < X < 1,65) = P(-1,5 < Z < -0,25) = 0,33448.

UNI

Como você está lidando com número de pessoas, o arredondamento será


para cima.

123
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

iii) Você quer saber a P(X < 1,60). Transformando o valor x = 1,60 em z padrão,
obtém-se z2 = (1,6 – 1,7)/0,2 = -0,5

Agora o problema consiste em encontrar a P(Z < -0,5) na tabela Z.


Como a P(Z < -0,5) = P(Z > 0,5) e P(Z > 0,5) = 1 – P(Z < 0,5), tem-se que:
P(Z < -0,5) = 1 – 0,6915 = 0,3085.

Portanto, a P(X < 1,60) = P(Z < -0,5) = 0,3085.

Em algumas situações onde há um grande número de elementos n, pode-


se usar a distribuição normal como uma boa aproximação de uma distribuição
binomial, uma vez que o cálculo de probabilidades com o modelo binomial se
torna trabalhoso.

Por exemplo, um estudo do Sindicato dos Professores indica que cerca


de 40% dos professores têm problemas de estresse, oriundos das más condições
de trabalho. Numa escola com 100 professores, qual é a probabilidade de pelo
menos 30 terem estresse?

Solução:

Considere a variável aleatória X o número de professores com estresse,


então X = {0, 1, 2, 3, ..., 99, 100}.

i) Considerando o modelo binomial P(X=x) = Cn,x pxqn-x

n = 100 (total de professores)


p = 0,4 (probabilidade de estresse)
q = 0,6 (1 -0,4 = 0,6)

Pense que você quer saber a probabilidade de pelo menos 30 terem


estresse, então X pode ser 30, 31, 32, 33,..., 99 ou 100. Portanto, deve-se calcular a
probabilidade de cada um desses valores e depois somá-las.

P(X ≥ 30) = P(X = 30) + P(X = 31) + P(X = 32) + ... + P(X = 99) + P(X = 100)

Mesmo que você utilizasse o princípio da probabilidade complementar, o


cálculo seria trabalhoso, pois teria que calcular a probabilidade para os primeiros
30 valores que X (de 0 a 29) e depois subtrair esse resultado de 1.

Resta então recorrer à distribuição normal. Para isso, precisa-se de dois


parâmetros, média μ e o desvio padrão σ. Como a variável aleatória X, nesse caso,
segue uma distribuição normal de p = 0,4 e n = 100.

Lembre que você viu no Tópico 2 dessa unidade que:

124
TÓPICO 3 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS CONTÍNUAS

E(X) = np = 100 . 0,4 = 40, então μ = 40, e


Var(X) = npq = 100 . 0,4 . 0,6 = 24, então σ = √24 ≈ 4,9

ii) Modelo normal padrão z = (x – μ)/σ:


μ = 40
σ = 4,9

Para obter a probabilidade P(X ≥ 30), é necessário transformar x = 30 em


z padrão:
z = (30 – 40)/4,9 ≈ -2,04

Agora o problema consiste em calcular a P(Z ≥ -2,04) na tabela Z.


P(Z ≥ -2,04) = P(Z ≤ 2,04) = 0,9793.

Portanto, a P(X ≥ 30) = P(Z ≥ -2,04)= 0,9793.

Barbetta (1999) considera uma aproximação razoável da distribuição


binomial para a normal se: np ≥ 5 e nq ≥ 5. Outros autores, mais rigorosos,
consideram essa aproximação boa quando np ≥ 15 e nq ≥ 15.

3 OUTROS TIPOS DE DISTRIBUIÇÃO


Na Unidade 3, você estudará os testes de hipóteses. Há alguns tipos
de distribuição de probabilidade que são comumente utilizadas na realização
destes tipos de testes. A seguir, você conhecerá as principais características das
distribuições qui-quadrado, T de student e F.

Ademais, na Unidade 3, você aprofundará o estudo dos testes de hipóteses


com a utilização destas distribuições de probabilidade.

3.1 DISTRIBUIÇÃO QUI-QUADRADO


Em uma distribuição normal, pode-se verificar que à razão (n–1)s2 segue
segue uma distribuição denominada qui-quadrado, x2 = (n–1)s
2
. σ2
σ2
Nos testes de independência, o qui-quadrado é obtido somando-se a
diferença ao quadrado entre as frequências observadas e as esperadas, dividido
pelas frequências esperadas.

(O–E)2
x2 = ∑
E

125
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Onde:
O = observado e
E = esperado

Se o qui-quadrado for igual a zero, então não existe associação entre as


variáveis. O qui-quadrado não mede força de associação e não é suficiente para
estabelecer relação de causa e efeito.

3.1.1 Qui-quadrado com (n – 1) graus de liberdade


A distribuição qui-quadrado pode ser aproximada por um modelo qui-
quadrado de parâmetro n – 1, denominado graus de liberdade da distribuição
(gl). Essa distribuição é representada por X2 (n-1).

Existe uma família de distribuições qui-quadrado, dependendo do


número de graus de liberdade.

gl = 2

gl = 5

gl = 7

Obtêm-se os graus de liberdade de acordo com o tipo de teste que se


pretende aplicar. Será visto na Unidade 3 o teste de independência (ou associação)
qui-quadrado e, para este, tem-se que: gl = (r – 1)∙(s – 1), onde r é o número de
linhas e s o número de colunas da tabela.

A distribuição qui-quadrado é assimétrica e se torna “menos” assimétrica


à medida que os graus de liberdade aumentam. Para grandes amostras, a
distribuição qui-quadrado tende para uma distribuição normal.

Os valores da distribuição são sempre não negativos (maiores ou iguais


a zero).

126
TÓPICO 3 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS CONTÍNUAS

Devido à complexidade de sua função densidade, as probabilidades


serão obtidas da tabela de distribuição qui-quadrado (Apêndice B). A tabela de
distribuição qui-quadrado apresenta os valores X2 de acordo com os graus de
liberdade (gl) e o nível de significância.

Os graus de liberdade se encontram na primeira coluna e os níveis de


confiança na primeira linha da tabela.

O cruzamento da coluna com a linha apresenta o valor X2 tabelado (X2tab).

No Tópico 1 da Unidade 3, você entenderá melhor o que significa esse


nível de significância. Por enquanto, considere como sendo uma probabilidade
de ocorrência de um valor amostral, representado pela letra grega α (alfa).

Por exemplo, se você está trabalhando com uma distribuição qui-


quadrado com 15 graus de liberdade, qual é o valor de X2tab, cuja probabilidade
de ocorrência de um valor X2 maior ou igual a X2tab é 5% (α = 0,05)?

APÊNDICE B

Distribuição Qui-Quadrado
gl 0,990 0,950 ... 0,05 ... 0,005
...
15 24,9958
...

Analisando na tabela qui-quadrado, tem-se que X2 tab = 24,9958. O que


significa que em uma distribuição com gl = 15 há uma probabilidade de 0,05 de
ocorrer um valor X2 maior ou igual a 24,9958.

Agora, se você quiser saber entre quais valores de X2 tab (X2 A e X2 B) tem-se
90% de uma distribuição com gl = 15, deve considerar um nível de significância α
= 0,1, sendo α/2 = 0,05 para cada cauda da distribuição qui-quadrado.

127
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Veja a seguir:

α/2 0,05 α/2 = 0,05


1 – α = 0,90

x2a = ? x2b = ?

O valor de X2 B já é conhecido, X2 B = 24,9958 (é o mesmo procedimento


do exemplo anterior). Como a tabela da distribuição qui-quadrado (Apêndice
B) considera as áreas na cauda à direita, para encontrar o valor de X2 A deve-se
entrar com o nível de significância de 1 – 0,05 = 0,95, portanto X2 A = 7,2609.

Assim, numa distribuição com gl = 15, há uma probabilidade de 0,90 de


ocorrer um valor X2 entre 7,2609 e 24,9958.

AUTOATIVIDADE

Para exercitar, encontre o valor de X2 tab para uma distribuição com:


a) gl = 1 e α = 5%
b) gl = 10 e α = 10%
c) gl = 15 e α = 2,5%

3.2 DISTRIBUIÇÃO T–STUDENT


Suponha que Z seja uma distribuição normal padrão e que V tenha uma
distribuição X2 (qui-quadrada) com n – 1 graus de liberdade.

Então: t = Z
V
√ n–1

128
TÓPICO 3 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS CONTÍNUAS

A distribuição t é uma distribuição similar à normal só que com caudas


mais largas, o que gera uma probabilidade maior para valores afastados da média.
Ela também é simétrica e campaniforme.

Distribuição Normal

Distribuição t de Student

O único parâmetro utilizado para definir a distribuição t é o grau de


liberdade (gl = n – 1). Quanto maior o grau de liberdade, mais próximo a uma
normal estará a distribuição t.

gl = ∞
gl = 6

gl = 3

Para os testes estatísticos que utilizam a distribuição t-Student, o grau de


liberdade é simplesmente: gl = n – 1.

Os valores da distribuição t podem ser obtidos da tabela de distribuição


t-Student (Apêndice C). A tabela de distribuição t-Student apresenta os valores t
de acordo com os graus de liberdade (gl) e o nível de significância.

Os graus de liberdade se encontram na primeira coluna e os níveis de


confiança na primeira linha da tabela. O cruzamento da coluna com a linha
apresenta o valor t tabelado (ttab).

Assim, ao trabalhar com uma amostra de 15 elementos e obter o valor t


tabelado (ttab) com um nível de significância de 5%, temos que: gl = 16 – 1 = 15 e α
= 5% = 0,05. Cruzando esses valores na tabela t-Student, ttab = 1,7531.

129
UNIDADE 2 | VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

APÊNDICE C

Distribuição t-Student
gl 0,4 0,25 ... 0,05 ... 0,001
...
15 1,7531
...

AUTOATIVIDADE

Para exercitar, encontre o valor de ttab para uma distribuição com:


a) gl = 1 e a = 5%
b) gl = 10 e a = 10%
c) gl = 15 e a = 2,5%

3.3 DISTRIBUIÇÃO F
Essa distribuição é usada para verificar se as variâncias de duas populações
distintas são estatisticamente idênticas.

Considere duas populações com distribuição normal com médias μ1, μ2 e


variâncias σ11 e σ22.

Retire uma amostra aleatória de tamanho n1 da primeira população,


tendo uma variância S21, e outra amostra aleatória de tamanho n2 da segunda
população com variância S22.

A estatística (S21/σ21)/ (S22/σ22) indica a relação entre as razões das variâncias


amostral e da população.

Supondo que as variâncias amostrais sejam oriundas de amostras aleatórias


independentes e com as mesmas variâncias populacionais, então: F = S21/ S22.

A distribuição teórica que modela essa razão denomina-se distribuição F.


Os valores da distribuição F são sempre não negativos (maiores ou iguais
a zero) e serão obtidos da tabela de distribuição F (Apêndice D).

Esses valores dependem de dois graus de liberdade: gl1 = n1 – 1 (do


numerador) e gl2 = n2 – 1 (do denominador). Assim, para cada par de graus de
liberdade há uma curva de distribuição F.

130
TÓPICO 3 | DISTRIBUIÇÕES DE PROBABILIDADE PARA VARIÁVEIS CONTÍNUAS

gl1 = 2, gl2 = 10

gl1 = 5, gl2 = 15

gl1 = 30, gl2 = 50

A tabela de distribuição F apresenta o valor Ftab que delimita a região sob


a curva na cauda direita, com graus de liberdade gl1 e gl2. Assim, para cada nível
de significância há uma tabela de distribuição F. No Apêndice D, apresentamos
três tabelas, com α = 1%, α = 2,5% e α = 5%.

Os graus de liberdade gl1 se encontram na primeira linha e os gl2 na


primeira coluna. O cruzamento da linha com a coluna apresenta o valor F tabelado
(Ftab) do nível de significância adotado.

Suponha duas amostras independentes n1 = 14 e n2 = 11, então gl1 = 14 – 1 =


13 e gl2 = 11 – 1 = 10. O valor Ftab que delimita a região sob curva na cauda direita
com um nível de significância de 1% é Ftab = 4,6496.

Isso significa que em uma distribuição com gl1 = 13 e gl2 = 10 há uma


probabilidade de 1% de ocorrer valores de F maiores ou iguais a 4,6496.

AUTOATIVIDADE

Pratique e encontre o valor de Ftab para uma distribuição com:


a) gl1 = 1, gl2 = 7 e α = 1%
b) gl1 = 5, gl2 = 25 e α = 2,5%
c) gl1 = 9, gl2 = 40 e α = 5%

131
RESUMO DO TÓPICO 3
Neste tópico você viu que:

• Se uma variável aleatória X tem distribuição normal de média μ e variância


σ2, podemos transformá-la numa variável aleatória Z de distribuição normal
padrão de média 0 e variância 1, através da fórmula: z = (x – μ)/σ.

• A curva normal padrão é simétrica em relação à média 0 e a área sob essa


curva é 1.

• A tabela normal padrão (Apêndice A) apresenta a probabilidade de a variável


aleatória Z ser menor que z.

• Os valores da distribuição qui-quadrado podem ser obtidos pela tabela do


Apêndice B e esses valores dependem dos graus de liberdade e do nível de
significância.

• Os valores da distribuição t-Student podem ser obtidos pela tabela do Apêndice


C e esses valores dependem dos graus de liberdade e do nível de significância.

• Os valores da distribuição F podem ser obtidos pela tabela do Apêndice D


e esses valores dependem de dois graus de liberdade (gl1 e gl2) e do nível de
significância.

132
AUTOATIVIDADE

Agora, acadêmico, é a sua vez de exercitar o que aprendeu até aqui!


Lembre-se de que você tem à disposição, no Material de Apoio do Ambiente
Virtual de Aprendizagem, os gabaritos das autoatividades. Consulte-os
sempre que necessário.

Conte também com a Tutoria Interna do Curso de Matemática, que está


disponível por meio do 0800, contato e atendimento on-line. Bons estudos!

1 A probabilidade de uma empresa produzir uma peça defeituosa é de


10%. Ao selecionar aleatoriamente uma amostra de 400 peças, qual é a
probabilidade de que, no máximo, 30 tenham defeito?

2 Em uma empresa de perfumes, o volume do conteúdo dos frascos segue


uma distribuição normal de média 70 ml e desvio padrão 2,5 ml. Ao
selecionarmos um frasco ao acaso, qual é a probabilidade de:
a) ter mais de 70 ml?
b) ter menos de 70 ml?
c) ter entre 65 e 75 ml?

3 Os salários mensais dos metalúrgicos são distribuídos normalmente em


torno de uma média de R$ 500,00 e desvio padrão de R$ 90,00. Determine a
probabilidade de um operário ter salário mensal:
a) maior que R$ 600,00;
b) menor que R$ 600,00;
c) entre R$ 400,00 e R$ 600,00.

4 Usando as informações do exercício 4, determine quantos funcionários de


uma metalúrgica com 100 funcionários ganham entre R$ 400,00 e R$ 600,00.

5 Suponha que os pesos dos estudantes de uma escola de Ensino Médio


seguem uma distribuição normal com média de 55 kg e desvio padrão
4,3 kg. Selecionando um estudante ao acaso, qual é a probabilidade de ele
pesar:
a) menos de 45 kg?
b) entre 45 kg e 60 kg?
c) mais de 60 kg?

133
134
UNIDADE 3

INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO


E TESTES DE HIPÓTESES

OBJETIVOS DE APRENDIZAGEM
A partir desta unidade você será capaz de:

• estimar os principais parâmetros populacionais;

• realizar testes de hipótese para a média, variância, proporção;

• realizar testes de hipóteses para comparar médias;

• aplicar teste de independência para verificar se duas variáveis possuem


grau de dependência.

PLANO DE ESTUDOS
A Unidade 3 está dividida em 3 tópicos. No final de cada um deles você
poderá exercitar o conteúdo fazendo as autoatividades.

TÓPICO 1 – PROCESSO DE ESTIMAÇÃO

TÓPICO 2 – TESTES DE HIPÓTESES PARA MÉDIA, VARIÂNCIA E


PROPORÇÃO

TÓPICO 3 – TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS


E GRAU DE DEPENDÊNCIA

135
136
UNIDADE 3
TÓPICO 1

PROCESSO DE ESTIMAÇÃO

1 INTRODUÇÃO
Você se lembra da disciplina de Estatística? Mais uma vez, neste caderno
buscaremos elementos da estatística para subsidiar nosso estudo. Para iniciar
esta Unidade 3 é importante que você conheça (ou relembre) alguns processos
de estimação. Com base neste primeiro tópico, você poderá entender com mais
facilidade os tópicos seguintes, que apresentam os testes de hipóteses paramétricos.
Nesses testes verifica-se se uma população possui ou não determinado parâmetro.
Para que você entenda, parâmetro é um valor geralmente desconhecido e que
está associado a uma característica da população, como: média, variância, desvio
padrão e proporção.

Testes como estes são necessários porque em alguns casos não é possível
reunir todos os dados de uma população para aferir o parâmetro desejado. Assim,
os testes de hipóteses se baseiam na amostra, ou seja, em uma parte da população.

Para obter um resultado confiável em qualquer teste estatístico, o


pesquisador deve se preocupar com a coleta de dados da amostra. Claro, se você
cometer um “vício” na coleta da amostra, certamente tornará o resultado do teste
tendencioso. Para evitar essa possível influência externa, existem metodologias
de amostragem abordadas detalhadamente no Caderno de Estudos de Estatística.

Sendo assim, serão apresentadas neste tópico as estimativas dos


parâmetros populacionais para realizar os testes estatísticos. Veja a seguir como
calcular cada uma dessas estimativas, iniciando pela média.

137
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

2 MÉDIA
A média você já conhece, é o parâmetro populacional mais utilizado para
representar os valores de uma variável aleatória. Também conhecida como média
aritmética, é definida como a razão da soma dos valores da variável aleatória pela
quantidade de valores. Matematicamente, o estimador da média populacional
n
fica definido como: ∑x1 , onde: x é a média amostral; xi são os valores da
x– i=1
n
variável; n quantidade de valores.

Quando n for igual ao tamanho da população, temos a média populacional


µ (lê-se: mi). Como isso nem sempre acontece, dizemos que x é um estimador de µ.

Exemplo 1:

Com o objetivo de verificar quantos pares de calçados, em média, são


vendidos por mês, o proprietário de uma loja coletou as vendas de três tipos de
sapatos, dos seis últimos meses de sua loja:

Mês
1 2 3 4 5 6 Total
Tipo de calçado
Infantil 21 15 14 31 18 22 121
Feminino 52 36 27 59 31 61 266
Masculino 12 5 8 17 3 19 64
Total 85 56 49 107 52 102 451

Com base nesses dados, estime a média de vendas mensais de calçados


nessa loja.

Solução:

Considerando a variável aleatória X, o número de vendas mensais, temos:


X = {85, 56, 49, 107, 52, 102}, n = 6 e:

n
∑xi
x= i=1
= 85 + 56 + 49 + 107 + 52 +102 = 451 = 75,1667
n 6 6

138
TÓPICO 1 | PROCESSO DE ESTIMAÇÃO

UNI

Você deve se lembrar das regras de arredondamento da Estatística, os resultados


das estimativas serão dados com 4 dígitos após a vírgula.

3 VARIÂNCIA
A variância também é uma medida bastante utilizada na inferência
estatística, e representa a variação, em relação à média, dos elementos de uma
variável aleatória. Matematicamente, o estimador da variância populacional fica
definido como:
n
∑(xi–x)2
s2 =
i=1
, onde: s2 é a variância populacional; xi são os valores da
n–1
variável; x é a média amostral; n quantidade de valores.

UNI

A utilização do denominador (n – 1) ao invés de n no estimador da variância


serve para obter uma estimação não tendenciosa. A demonstração matemática desse
“artifício” pode ser encontrada em Magalhães e Lima (2010, p. 215-216).

Se no lugar do divisor n – 1 fosse utilizado o tamanho da população,


teríamos a variância populacional σ2 (sigma ao quadrado). Como nem sempre
temos o tamanho da população, dizemos que s2 é um estimador de σ2.

Exemplo 1:

Considerando o exemplo “vendas de calçados”, estime a variância


populacional das vendas mensais de calçados.

Solução:

Já se sabe que: x = 75,1667 e n = 6.

Assim:

139
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

(85–75,1667)2 + (56–75,16)2 + ... + (52–75,1667)2 + (102–75,1667)2


s2 =
6–1
96,6938+367,3624+684,6962+1.013,3590+536,6960+720,0260
s2 =
5
3.418,8334
s =
2
= 683,7667
5

3.1 DESVIO PADRÃO


O desvio padrão você também já conhece. Ele representa uma medida
de variabilidade mais próxima dos elementos da variável aleatória, e é definido
como a raiz quadrada da variância. Matematicamente, o estimador do desvio
padrão populacional é:

s=√s2

onde: s é o desvio padrão e s2 é a variância.

Se você tirar a raiz quadrada da variância populacional, terá o desvio


padrão populacional σ (lê-se: sigma). Como nem sempre se tem a variância
populacional, diz-se que s é um estimador de σ.

Exemplo 1:

Considerando ainda o exemplo das vendas de calçados, estime o desvio


padrão das vendas mensais de calçados.

Solução:

Basta você extrair a raiz quadrada da estimativa s2 = 683,7667.

Assim:

s=√683,7667=26,1489

140
TÓPICO 1 | PROCESSO DE ESTIMAÇÃO

4 PROPORÇÃO
O estimador da proporção populacional p^ (p chapéu) de uma variável
^ n(A) ,
aleatória com uma determinada característica A, é dado pela fórmula: p=
n
onde n(A) é o número de elementos da variável aleatória, de tamanho n, com a
característica de interesse A.

Se n fosse igual ao tamanho da população, você teria a proporção


^ é um estimador de p.
populacional p. Como isso quase não acontece, diz-se que p

Exemplo 1:

Considerando ainda o Exemplo 1 (vendas de calçados), estime a proporção


de calçados infantis vendidos nos últimos 6 meses.

Solução:

Considerando que A seja as vendas de calçados infantis, temos que n(A) =


121. Como foram vendidos 451 pares de calçados nesse últimos 6 meses, n = 451.

Assim:

(÷11)

^ n(A) = 121(÷111)
p= =
11 ou 0,2683 ou 26,83%.
n 451 41

141
RESUMO DO TÓPICO 1

Caro acadêmico! Verifique no quadro a seguir os estimadores populacionais


trabalhados nesse tópico.

Parâmetros Símbolos (parâmetros Estimadores


populacionais populacionais) populacionais
n
∑ xi
Média µ
x = i=1n

n
∑ (xi–x)2
Variância σ²
s2 = i=1
n–1

Desvio padrão σ s=√s2

Proporção p ^ n(A)
p= n

142
AUTOATIVIDADE

Agora, acadêmico, é a sua vez de exercitar o que aprendeu até aqui!


Lembre-se de que você tem à disposição no Material de Apoio do Ambiente
Virtual de Aprendizagem os gabaritos das Autoatividades. Consulte-os
sempre que necessário.

Conte também com a Tutoria Interna do Curso de Matemática, que está


disponível por meio do 0800, contato e atendimento on-line. Bons estudos!

1 O quadro e os valores apresentados a seguir são fictícios e representam o


resultado de uma grande pesquisa sobre população praticante de exercício
físico no Brasil e nas regiões brasileiras. Os dados estão divididos quanto ao
sexo, área/sexo e área.

População fumante

Regiões Sexo Área/sexo


Brasileiras
Urbana Rural
Total Homens Mulheres
Total Homens Mulheres Total Homens Mulheres

Brasil 44.840.402 35.099.710 9.740.692 35.281.715 26.753.198 8.528.517 9.558.687 8.346.512 1.212.175

Região Norte 3.514.898 2.822.616 692.282 2.325.379 1.776.650 548.729 1.189.519 1.045.966 143.553

Região
12.763.114 10.129.040 2.634.074 8.375.218 6.311.667 2.063.551 4.387.896 3.817.373 570.523
Nordeste

Região
18.840.494 14.532.028 4.308.466 16.772.754 12.724.072 4.048.682 2.067.740 1.807.956 259.784
Sudeste

Região Sul 6.644.573 5.211.064 1.433.509 5.209.693 3.958.647 1.251.046 1.434.880 1.252.417 182.463

Região
3.077.323 2.404.962 672.361 2.598.671 1.982.162 616.509 478.652 422.800 55.852
Centro-Oeste

Com base nos dados do quadro, determine:


a) a média de mulheres que praticam exercícios físicos nas regiões brasileiras;
b) a média de homens que praticam exercícios físicos nas áreas urbana e rural
das regiões brasileiras;
c) a variância e o desvio padrão dos que praticam exercícios físicos nas regiões
brasileiras;
d) a variância e o desvio padrão dos que praticam exercícios físicos nas áreas
urbana e rural das regiões brasileiras;
e) qual região tem a maior proporção de mulheres que praticam exercícios
físicos (em relação ao total de que praticam exercícios físicos de cada região)?;
f) qual área tem a maior proporção de homens que praticam exercícios físicos
(em relação ao total de que praticam exercícios físicos de cada área)?.

143
144
UNIDADE 3
TÓPICO 2

TESTES DE HIPÓTESES PARA MÉDIA,


VARIÂNCIA E PROPORÇÃO

1 INTRODUÇÃO
Para que servem testes de hipóteses? Servem para verificar se a diferença
entre um parâmetro populacional e uma estimativa é atribuída à aleatoriedade
da amostra ou a diferença é tão grande a ponto de haver desconfiança na
integridade da amostra.

A partir de agora, por trabalhar com amostras, você deverá se acostumar
com as expressões: certeza estatística, igualdade estatística, diferença significativa,
diferença não significativa, entre outras.

Essas expressões fogem um pouco do senso comum, pois na vida cotidiana


é muito simples verificar se algo é ou não igual a outro, porém quando se trata de
estatística nada é igual e nada é diferente antes de se aplicar testes de hipóteses.
Veja neste tópico e no tópico seguinte um pouco mais sobre estes testes.

2 HIPÓTESES
Para realizar um teste de hipóteses você deve formular duas hipóteses a
respeito da afirmação, denominadas de H0 e H1.

Importante! Saiba que a hipótese H0 será chamada de hipótese nula,
ou seja, é a hipótese que “anula” o teste. Enquanto a hipótese H1 ou hipótese
alternativa é a que o teste quer provar. Veja o exemplo 1 e o exemplo 2 a seguir:

Exemplo 1:

Numa pesquisa para comparar a eficácia de engorda entre duas rações


para bovinos, têm-se as seguintes hipóteses:

Considerando que podemos comparar a eficácia de engorda dos


bovinos por meio das médias de engorda das duas rações (ração 1 e 2), temos
que µ1 e µ2 são as médias populacionais de engorda dos bovinos tratados pelas
rações 1 e 2, respectivamente.

145
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

Assim:
H0: µ1 = µ2 (média de engorda da ração 1 é igual à média de engorda da
ração 2)
H1: µ1 ≠ µ2 (média de engorda da ração 1 é diferente da média de
engorda da ração 2)

• Lembre-se: H0 = hipótese nula, ou seja, a hipótese que “anula” o teste. H1 =


hipótese alternativa, a que o teste quer provar.

Exemplo 2:

Numa pesquisa de qualidade, o INMETRO gostaria de verificar se


a duração das lâmpadas de uma determinada marca é menor que o valor X
anunciado na embalagem.

Nesse caso:
H0: µ = X (média de duração das lâmpadas é igual ao valor anunciado X)
H1: µ < X (média de duração das lâmpadas é menor que o valor anunciado X)

Exemplo 3:

Numa pesquisa para verificar se a média de idade de uma população é


diferente de 20, temos as seguintes hipóteses:
H0: µ = 20 (média populacional é igual a 20 anos)
H1: µ ≠ 20 (média populacional é diferente de 20 anos)

Lembre sempre, quando você efetua um teste de hipótese, sempre obterá


a resposta tendo como referência H0, ou seja, se após o teste você verificar que a
hipótese certa é a hipótese nula pode aceitar H0, mas, se verificar que a hipótese
certa é a hipótese alternativa, deve rejeitar H0, ao invés de citar H1.

3 ERROS DO TIPO I E II
Por mais cuidado que se tenha ao coletar os dados de uma pesquisa,
a estimação dos dados jamais estará livre de erros. E ao realizar um teste de
hipóteses existem dois tipos de erros que podem ser cometidos:

Erro do tipo I (Α)


Erro do tipo II (Β)

A seguir, você entenderá melhor o que cada um representa.

146
TÓPICO 2 | TESTES DE HIPÓTESES PARA MÉDIA, VARIÂNCIA E PROPORÇÃO

3.1 ERRO DO TIPO I (α)


O erro do tipo I (α) significa rejeitar H0 que, na verdade, deveria ter
sido aceita. Ou seja, no exemplo 1 acima, deveria ter sido dito que as médias
são diferentes para aceitar H0. Porém, como são iguais, deve-se rejeitar H0, o que
ocasiona o erro do tipo I (α).

É importante que essa probabilidade de cometer o erro do tipo I seja


pequena, pois assim a chance de rejeitar uma hipótese verdadeira também será
pequena. A essa probabilidade dá-se o nome de nível de significância do teste
que é representado pela letra grega α (alfa).

O valor 1 – α representa a probabilidade de aceitar uma hipótese verdadeira


quando ela é verdadeira e a esse valor damos o nome de nível de confiança.

UNI

O nível de significância do teste α será definido no início do teste.

3.2 ERRO DO TIPO II (β)


O erro do tipo II (β) significa aceitar H0 que, na verdade, você deveria
ter rejeitado. No caso do exemplo 1 acima, deveria ter sido dito que as médias
são iguais para rejeitar H0. Porém, como são diferentes, deve-se aceitar H0, o que
ocasiona o erro do tipo II (β).

Assim, deseja-se que a probabilidade de cometer o erro do tipo II também


seja pequena para que a chance de aceitar uma hipótese falsa seja pequena. Essa
probabilidade é representada pela letra grega β (beta).

Para Guerra e Donaire (1991) a diferença 1 – β representa a probabilidade


de rejeitar uma hipótese falsa quando ela é falsa, e o valor 1 – β é chamado de
poder do teste.

O quadro a seguir resume esses dois erros, veja:

H0 verdadeira H0 falsa
Rejeitar H0 Erro do tipo I (α) Decisão correta (1 – β)
Decisão
Aceitar H0 Decisão correta (1 – α) Erro do tipo II (β)

147
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

UNI

Lembre! O erro do tipo I ocorre quando se rejeita H0 e o erro do tipo II ocorre


quando se aceita H0.

Apesar de, na maioria das vezes, o pesquisador só se preocupar com o erro


do tipo I, é o erro do tipo II que dá o verdadeiro poder de a pesquisa apresentar
o resultado esperado.

O estudo sobre os erros I e II gera debates maravilhosos. Como um está


relacionado ao outro, a diminuição de um leva ao aumento do outro, o pesquisador
experiente tem que achar um equilíbrio entre os erros. Contudo, na nossa atual
condição, você pode desconsiderar o erro II para as pesquisas iniciais.

4 EXEMPLOS DE TESTES DE HIPÓTESES


Este item é destinado às resoluções de alguns casos de testes de hipóteses,
os conceitos que serão utilizados serão explicados passo a passo. Serão utilizadas
a distribuição normal, a distribuição t, a distribuição F e a distribuição qui-
quadrado divididas em quatro exemplos em ordem crescente de dificuldade.

UNI

É importante que você leia os exemplos na ordem, pois eles explicam todos os
detalhes. Entretanto, o que foi explicado no primeiro exemplo não será repetido no segundo.

Os testes de hipóteses podem ser de três tipos diferentes, e o que muda é


a hipótese alternativa (H1). Veja a seguir:

a) teste bicaudal ou bilateral


H0: µ = 245
H1: µ ≠ 245

148
TÓPICO 2 | TESTES DE HIPÓTESES PARA MÉDIA, VARIÂNCIA E PROPORÇÃO

Regiões de rejeição de H0

Rejeição Rejeição
Região de
aceitação H0

Xc μ=X Xc

b) teste unicaudal à direita ou unilateral à direita


H0: µ = 72
H1: µ > 72

Região de rejeição de H0
Região de
aceitação H0

μ=x Xc

c) teste unicaudal à esquerda ou unilateral à esquerda


H0: µ = 900
H1: µ < 900

Região de rejeição de H0
Região de
aceitação H0

Xc μ=x

A área das regiões amarelas sob as caudas da curva normal correspondem


à probabilidade de cometer o erro do tipo I (α). Essas regiões são limitadas pelo
valor crítico Xc que divide a área sob a curva normal em duas regiões: região de
aceitação de H0 e região de rejeição de H0.

149
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

UNI

No caso do teste bicaudal, o valor α fica dividido para as duas regiões amarelas
com área α/2 .

Acadêmico(a), não se preocupe com como e quando usar cada um dos


tipos anteriores, bem como a compreensão do que significa e como definir a(s)
área(s) de rejeição de H0 e a área de aceitação de H0 nos testes de hipóteses.
Isso será explicado nas resoluções dos próximos exemplos para desvio padrão
conhecido e desvio padrão desconhecido, acompanhe!

4.1 TESTE DE HIPÓTESES PARA A MÉDIA


QUANDO O σ (DESVIO PADRÃO DA POPULAÇÃO) É
CONHECIDO
Exemplo:

O INMETRO fará uma inspeção numa fábrica de tijolos que afirma que
o tamanho dos seus tijolos segue uma distribuição normal com µ = 20 cm e σ = 2
cm. Para a verificação o inspetor recolheu uma amostra com 10 unidades e obteve
as seguintes medidas: 18, 23, 20, 21, 22, 23, 22, 21, 21, 20. O INMETRO admite um
erro estatístico de 5% (nível de significância 5%), ou seja, nível de confiança 95%,
em outras palavras α = 0,05.

Solução:
10
∑ xi
Fazendo a estimativa da média do tamanho dos tijolos x, temos: x= i=1
= 211 =21,1 cm
10 10

Um pesquisador que não entende de estatística falaria que a média dos


tijolos é maior que o valor informado pela empresa, contudo nós sabemos que
estamos lidando com uma amostra e temos que tomar cuidado nas conclusões, por
isso o teste de hipóteses é essencial.

É esse teste que indicará se a diferença entre a média populacional (µ
= 20 cm) informada pela empresa e a estimativa x= 21,8 cm, obtida através da
amostra recolhida pelo pesquisador, é significante ou apenas casual devido à
aleatoriedade da amostra.

Como o objetivo do INMETRO é inspecionar se a média do tamanho dos
tijolos é diferente de 20 cm, devemos confrontar as seguintes hipóteses:

150
TÓPICO 2 | TESTES DE HIPÓTESES PARA MÉDIA, VARIÂNCIA E PROPORÇÃO

H0: µ = 20 cm
H1: µ ≠ 20 cm

Você está diante de um exemplo em que o desvio padrão populacional
(σ) é conhecido, na vida real dificilmente encontraremos tal situação, porém,
didaticamente esse exemplo é fundamental para você entender os próximos.

A distribuição da média amostral x, convenientemente padronizada, se


comporta segundo um modelo normal com µ = 0 e σ2 = 1. Essa padronização é
feita por meio da fórmula: z= x–μ .
σ/√n

UNI

O Teorema Central do Limite garante que essa padronização, para n grande,


segue um modelo normal, com média 0 e variância 1. Para mais detalhes desse teorema
consulte Magalhães e Lima (2010).

Agora, para resolver o teste, calcule o valor z padronizado e o compare


com os valores críticos tabelados ztab. O valor ztab é obtido entrando na tabela Z
(Apêndice A) com o valor 1 – α/2 = 1 – 0,025 = 0,975, assim ztab = 1,96.

Calculando z:

x–μ 21,1–20 1,1


z= = = =1,74
σ/√n 2/√10 0,632

O valor 21,1 cm na curva normal é equivalente ao 1,74 na curva normal


padrão, veja o esquema:

Curva normal informada


Curva normal padrão
pela empresa
µ=0eσ=1
µ = 20 e σ = 2
Regiões de rejeição de H0

α α
2 =0,025 2 =0,025
Região de
aceitação H0
1 – α = 0,95
20 21,1 x -1,96 0 1,96 z
1,74

151
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

Se a média amostral padronizada estiver na área de rejeição, ou seja, no


exemplo for maior que o valor crítico 1,96 ou menor que o valor crítico -1,96, não
se rejeita H0, do contrário, se aceita.

Obteve-se 1,74 como média amostral (já padronizada), então, você tem
que -1,96 < 1,74 < 1,96, o que indica que 1,74 está na região de aceitação de H0.

Você pode concluir então que as médias amostrais e populacionais são iguais
a um nível de significância de 5% (ou dizemos: a um nível de confiança de 95%).

Em outras palavras, a diferença obtida através da amostra não é significativa,


então não se pode afirmar que as especificações da empresa estão incorretas. Existe
5% de chance de você estar errado nessa conclusão (nível de significância).

Caso o INMETRO desejasse inspecionar se a média do tamanho dos tijolos


é menor que 20 cm ou maior que 20 cm, você estaria diante de um teste unilateral.
Com isso seria necessário adequar a hipótese alternativa para cada tipo de teste,
H1: µ < 20 cm (unilateral à esquerda) e H1: µ > 20 cm (unilateral à direita).

Como a média amostral é maior que a média populacional, não é preciso


testar a hipótese H1: µ < 20 cm, pois o valor z (padronizado) ficará sempre na
região de aceitação de H0, considerando α pequeno.

Assim, teste apenas a hipótese H1: µ >20 cm!



Unilateral à direita

Solução:
H0: µ = 20 cm
H1: µ > 20 cm

A padronização da estimativa da média populacional permanece a mesma


x–μ 21,1–20 1,1
z= = = =1,74
σ/√n 2/√10 0,632 . O que muda é o valor crítico (ztab), pois o nível de
significância corresponde somente à área sob a cauda direita.

Veja o esquema a seguir:

Regiões de rejeição de H0
Região de
aceitação H0
1 – α = 0,95
0 1,74
1,645

152
TÓPICO 2 | TESTES DE HIPÓTESES PARA MÉDIA, VARIÂNCIA E PROPORÇÃO

Observe que o fato de o teste ser unilateral aumenta a área sob a cauda
direita da curva diminuindo o valor crítico (ztab). Nesse caso, rejeita-se H0 a um
nível de significância de 5% porque o valor z padronizado está na região de
rejeição de H0 (1,645 < 1,74). Assim, a média populacional é maior que 20 cm a um
nível de confiança de 95%.

4.1.1 Teste de hipóteses para a média quando o σ


(desvio padrão da população) é desconhecido
Exemplo:

Suponha que você precisa testar a hipótese que a média da estatura da


população de brasileiros adultos de sexo masculino seja 1,72 m contra a hipótese
de que é diferente, a um nível de significância de 5%.

Na amostra feita são obtidas as seguintes alturas:

1,65 1,80 1,70 1,68 1,77 2,15 1,88 1,60 1,70 1,80
1,84 1,68 1,65 1,50 1,74 1,72 1,66 1,68 1,65 1,71
1,73 1,70 1,70 1,78 1,67

Solução:

Observe que não há o desvio padrão populacional, e na maioria dos
problemas práticos não haverá mesmo! Porém, na resolução, o que muda apenas
é a tabela a ser utilizada.

A amostra dá as seguintes estimativas:


n = 25, x = 1,7256 e s = 0,1179 (número de elementos, média e desvio padrão).

Há agora as seguintes hipóteses:

H0: µ = 1,72m
H1: µ ≠ 1,72m

Como a variância populacional é desconhecida, a padronização da estimativa


da média amostral deve ser feita com a estimativa da variância populacional s2, o
que torna a função densidade dessa padronização diferente da normal.

Essa nova densidade é denominada t-Student, que foi estudada na Unidade 2.
x–μ
Assim, você poderá calcular essa padronização através da fórmula: tcalc = .
s/√n

153
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

Para resolver o teste é preciso comparar o valor do t calculado (tcalc) com o


valor crítico t tabelado (ttab). O valor ttab é encontrado na tabela t (Apêndice C) na
intersecção da linha 24 (“n – 1”) com a coluna 2,5% ( a/2). Com isso tem-se ttab = 2,064.

Obtendo o valor tcalc:

x–μ 1,7256–1,72
tcalc = = =0,237
s/√n 0,1179/√25

Regiões de rejeição de H0

α α
2 =0,025 2 =0,025
Região de
aceitação H0
1 – α = 0,95
-2,064 0,237 2,064

Conclusão: aceita-se H0.

A média populacional não é diferente a 1,72 cm a um nível de significância


de 5%. Você pode afirmar isso, pois o valor 0,237 está entre os valores críticos, ou
seja, está na região de aceitação de H0.

4.2 TESTE DE HIPÓTESES PARA A VARIÂNCIA


POPULACIONAL σ2
Exemplo:

Deseja-se testar a hipótese que a variância das médias dos alunos EAD da
disciplina de Estatística seja 5,3 contra a hipótese de que é diferente, a um nível
de significância de 10%.

Para realizar o teste foi coletada uma amostra com as seguintes notas:

5,9 6,5 8,0 9,6 4,0 3,4 8,0 6,0 6,5 8,4
4,0 8,5 9,3 8,5 8,2 6,0 5,1 3,5 6,0 5,2
6,2 7,0 5,5 7,0 7,9 6,4 4,6 4,0 7,0 7,0

154
TÓPICO 2 | TESTES DE HIPÓTESES PARA MÉDIA, VARIÂNCIA E PROPORÇÃO

A amostra nos dá as seguintes estimativas: n = 30, x = 6,44 e s2 = 2,97


(número de elementos, média e desvio padrão).

Temos agora as seguintes hipóteses:

H0: σ2 = 5,3
H1: σ2 ≠ 5,3

Como visto na Unidade 2, em uma distribuição normalmente distribuída,


a razão (n-1)ssegue uma distribuição qui-quadrado. Assim, o cálculo usado para
2

σ 2
(n-1)s2
o teste de hipóteses para a variância populacional é: χ2calc = .
σ2

Para resolver o teste é necessário comparar os valores de χ2tab (χ2A e χ2B,


pois o teste é bicaudal) com o valor crítico χ calc. O valor χ A é encontrado na tabela
2 2

qui-quadrado (Apêndice B) na intersecção da linha 29 (n – 1) com a coluna 0,05


(a/2),χ2A = 42,5569, e o valor χ B na intersecção da linha 29 com a coluna 0,95 (1-
2

α/2), χ B = 17,7084.
2

(n-1)s2 (30–1)·2,97
Obtendo o valor χ calc : χ calc =
2 2
= = 16,25
σ2 5,3

Regiões de Rejeição de H0

α/2=0,05
α/2=0,05
Região de
aceitação de H0
1 – α = 0,90

17,7084 42,5569

16,25

Conclusão: Rejeita-se H0.

A variância populacional é diferente a 5,3 a um nível de significância de


10%. Você pode afirmar isso, pois o valor 16,25 é menor que o valor crítico 17,7084,
ou seja, está na região de rejeição de H0.

155
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

4.3 TESTE DE HIPÓTESES PARA A PROPORÇÃO


POPULACIONAL p
Exemplo:

O diretor de um colégio disse que existe uma taxa de 15% de reprovação


entre seus estudantes. Para verificar se a taxa de reprovação é diferente, com α =
2%, selecionou-se aleatoriamente uma amostra de 300 estudantes e verificou-se
que 36 reprovaram.

Solução:

O diretor afirma que a proporção de reprovados p = 15% = 0,15. Da amostra


selecionada, estimamos uma proporção p= ^ 36 =0,12 .
300

Temos então as seguintes hipóteses:


H0: p = 0,15
H1: p ≠ 0,15

Considerando que a distribuição da proporção amostral p^ pode ser


aproximada por um modelo normal, resolve-se o problema comparando o valor
de z padronizado com os valores críticos tabelados (ztab).
^
p–p
O valor z padronizado para proporção é obtido pela fórmula: z = p(1–p) .
√ n
^
p–p 0,12–0,15 -0,03
Calculando z: z = = = =-1,455
p(1–p) 0,15·(0,15) √ 0,000425
√ n √ 300

Regiões de rejeição de H0

α α
2 =0,025 2 =0,025
Região de
aceitação H0
1 – α = 0,95
-2,33 -1,455 0 2,33

156
TÓPICO 2 | TESTES DE HIPÓTESES PARA MÉDIA, VARIÂNCIA E PROPORÇÃO

UNI

O valor ztab = 2,33 é obtido entrando na tabela Z (Apêndice A) com o valor 1 –


α/2 = 1 – 0,01 = 0,99.

Conclusão: aceita-se H0.

A proporção populacional não é diferente de 15% a um nível de


significância de 2%. Afirmamos isso porque o valor padronizado -1,45 está entre
-2,33 e 2,33 (-2,33 < -1,455 < 2,33), ou seja, está na região de aceitação de H0.

157
RESUMO DO TÓPICO 2

Neste tópico, você viu que:

• Para realizar um teste de hipóteses precisamos:


1�: estabelecer as hipóteses H0 e H1;
2�: com base na H1 e no nível de significância (α) estabelecer as regiões de
aceitação e rejeição de H0 e o valor crítico;
3�: calcular o valor da variável do teste;
4�: aceitar ou rejeitar H0 pela comparação do valor calculado no 3º passo com a
região de aceitação ou rejeição.

• Nos testes de hipótese para a média, quando o desvio padrão populacional é


conhecido, a estimativa amostral da média é padronizada pela fórmula:
x–μ .
z=
σ/√n

• Nos testes de hipótese para a média, quando o desvio padrão populacional é


desconhecido, a estimativa amostral da média é padronizada pela fórmula:
tcalc = x–μ .
s/√n

• Nos testes de hipótese para a variância populacional, o cálculo usado é


χ2calc = (n–1)s .
2

σ2

• Nos testes de hipótese para a proporção populacional, a estimativa amostral da


^
proporção é padronizada pela fórmula: z = p–p .
p(1–p)
√ n

158
AUTOATIVIDADE

Agora, acadêmico, é a sua vez de exercitar o que aprendeu até aqui!


Lembre-se de que você tem à disposição no Material de Apoio do Ambiente
Virtual de Aprendizagem os gabaritos das autoatividades. Consulte-os
sempre que necessário.

Conte também com a Tutoria Interna do Curso de Matemática, que está


disponível por meio do 0800, contato e atendimento on-line. Bons estudos!

1 Determine as hipóteses H0 e H1, nos seguintes casos (testes):


a) uma pesquisa pretende verificar se a média de uma população é diferente
de 20;
b) o professor de probabilidade e estatística deseja averiguar se a variância das
notas de seus alunos é igual a 4,8 contra a hipótese de que é maior;
c) uma pesquisa deseja verificar se a proporção de fumantes entre as mulheres
é menor que 30%.

2 Com base nas hipóteses formuladas em cada item do exercício anterior,


diga se o teste é bilateral, unilateral à esquerda ou unilateral à direita.

3 Uma amostra de 25 elementos apresentou média de 123. Sabe-se que a variância


populacional é igual a 81. Ao nível de significância de 5%, teste a hipótese que a
média populacional é igual a 120 (µ = 120) contra a hipótese que:
a) µ > 120
b) µ ≠ 120

4 Uma fábrica de baterias para notebook afirma que suas baterias têm um
tempo médio de duração de 4 horas. Para verificar tal fato, uma loja que
trabalha com essa fábrica selecionou aleatoriamente 10 baterias e verificou
os seguintes tempos de duração de cada bateria: 3,9 h; 4,1 h; 3,8 h; 4,3 h; 3,5
h; 3,7 h; 3,5 h; 4,2 h; 3,7 h; 4 h. Utilizando α = 5%, podemos concluir que o
tempo médio de duração das baterias desse fabricante é menor que 4 horas?

5 Para verificar se há excesso no processo de enchimento de caixas de 1 kg de


cereal, o controle de qualidade da empresa verificou que uma amostra de
30 caixas de cereal tem peso médio de 1,3 kg com desvio padrão 0,65 kg. Em
nível de significância de 1%, o que se pode concluir?

6 Se o fabricante de cereais, da questão anterior, deseja verificar se há


deficiência e excesso no enchimento das caixas, o que você conclui utilizando
o mesmo nível de significância?

159
7 Numa amostra de 25 elementos de uma população normal obteve-se
variância de 16. Em nível de significância de 10%, teste a hipótese que a
variância populacional é 20 (σ2 = 20) contra a hipótese que:
a) σ2 ≠ 20
b) σ2 > 20

8 Uma fábrica de parafusos afirma que o desvio padrão do diâmetro de seus


parafusos é de 0,1 mm. O controle de qualidade toma uma amostra aleatória
de 51 parafusos e constata um desvio padrão de 0,15 mm. Utilizando um
nível de significância de 1%, podemos dizer que o desvio padrão dos
parafusos é superior a 0,1 mm?

9 Para verificar se certa moeda é honesta, foi lançada a moeda 100 vezes ao ar
e anotado o resultado da face voltada para cima. Se nesse experimento foram
obtidas 60 coroas, podemos dizer que a moeda não é honesta? (use α = 5%).

10 Uma empresa de cigarros afirmou que a proporção de mulheres fumantes


em 1990 é de 40%. Para verificar se houve um aumento na proporção de
mulheres fumantes, tomou-se uma amostra de 400 mulheres e verificou-se
que 260 fumam. Em nível de significância de 5%, o que podemos concluir?

160
UNIDADE 3
TÓPICO 3

TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E


GRAU DE DEPENDÊNCIA

1 INTRODUÇÃO
Muitas vezes, o pesquisador está interessado em comparar duas
populações com relação à sua média. Para isso, é estimada a média amostral (x) e
aplicado o teste t-Student (t de Student) para comparação das médias.

O teste t-Student sofre modificações de acordo com a natureza das


amostras utilizadas. Portanto, você entenderá neste tópico como aplicar o teste
t-Student para comparação de duas médias.

Neste tópico, você poderá ver também que a aplicação do teste qui-
quadrado serve para verificar se duas variáveis têm algum grau de dependência.

2 TESTE T DE STUDENT PARA COMPARAÇÃO DE MÉDIAS


Quando se comparam duas médias populacionais, deve-se estar atento à
natureza das amostras coletadas, pois é um indicativo do tipo de teste t-Student
a ser utilizado.

Se as amostras foram coletadas da mesma população, só que em momentos


distintos, dizemos que os dados coletados são dados pareados. Por exemplo, as
notas obtidas por um grupo de estudantes antes e depois de estudarem.

Se as amostras foram coletadas de populações distintas, dizemos que os


dados coletados são dados não pareados. Por exemplo, as notas obtidas por um
grupo de estudantes que estudou e outro grupo de estudantes que não estudou.

A aplicação do teste t-Student para dados pareados e não pareados será


explicada durante a resolução dos próximos exemplos, para dados pareados e
não pareados, acompanhe!

161
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

2.1 PARA DADOS PAREADOS


Exemplo:

Dez cobaias foram submetidas a tratamento com um novo tipo de ração.


Os pesos em gramas, antes e após o tratamento, são dados a seguir (supõe-se que
provenham de distribuições normais). A 1% de significância, pode-se dizer que
houve um aumento nos pesos das cobaias?

Cobaia 1 2 3 4 5 6 7 8 9 10
Antes 655 698 678 610 570 748 699 587 639 671
Depois 660 710 684 617 567 743 710 590 646 685

UNI

Falar em dados pareados significa dizer que os dados da pesquisa vieram da


mesma amostra, só que são tomados antes e após uma dada intervenção. Por exemplo: peso
antes e depois do tratamento com a nova ração.

Solução:

Observe que é um caso de dados pareados, ou seja, os resultados são dos


mesmos indivíduos em momentos diferentes, e pode-se criar uma variável nova
que facilitará os cálculos deste teste.

Crie então a variável di que será a diferença entre o antes e o depois de


cada indivíduo i e calcule a média e o desvio padrão de di­.

162
TÓPICO 3 | TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU DE DEPENDÊNCIA

Veja:

Cobaia (i) Xantes Xdepois di (Xdepois-Xantes)


1 655 660 5
2 698 710 12
3 678 684 6
4 610 617 7
5 570 567 -3
6 748 743 -5
7 699 710 11
8 587 590 3
9 639 646 7
10 671 685 14
Média 5,7
Desvio padrão 6,13

UNI

Calcule os estimadores (x e s) do quadro anterior. Se você está encontrando


dificuldades no cálculo dos estimadores, volte ao Tópico 1 dessa unidade.

163
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

Caso o tratamento não altere o peso das cobaias, o valor esperado para
a média das diferenças será zero. Se o tratamento altera os pesos, então o valor
esperado das diferenças é diferente de zero. Como a média das diferenças é maior
que zero, existem as seguintes hipóteses:

H0: xd = 0 (os pesos das cobaias são iguais mesmo após tratamento)
H1: xd > 0 (os pesos após o tratamento são maiores ou a nova ração engorda)

Você pode usar os dados dos dis para chegar ao tcalc, fazendo assim:
tcalc = d = 5,7 =2,94.
(sd/√n) (6,13/√10)

Falta achar o valor crítico, chamado de ttab, pois é coletado na tabela t


(Apêndice C).

Para usar a tabela precisa-se saber do grau de liberdade (n – 1 = 10 – 1 = 9)


e o nível de significância (α = 1% = 0,01). Com esses dados obtém-se ttab = 2,8214.

Região de rejeição de H0
Região de
aceitação H0 α = 0,01
1 – α = 0,99
0 2,94
2,8214

Conclusão:

No valor crítico 2,8214 começa a região de rejeição de H0, o que indica


que qualquer valor maior que ele estará na região de rejeição. tcalc = 2,94, logo
ele se encontra na região de rejeição e por isso podemos concluir que as cobaias
engordaram, pois rejeitamos H0, os pesos medidos depois são, em média, maiores
que os medidos antes, a um nível de significância de 1%.

2.2 PARA DADOS NÃO PAREADOS


Nos casos dos testes para comparação de médias em dados não pareados,
leve em consideração as variâncias populacionais. São três casos particulares, veja:

1�- quando as variâncias populacionais são conhecidas


(neste caso use o teste Z da distribuição normal padrão);

2�- quando as variâncias populacionais são desconhecidas e iguais;

3�- quando as variâncias populacionais são desconhecidas e diferentes.

164
TÓPICO 3 | TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU DE DEPENDÊNCIA

Como normalmente você não terá as variâncias populacionais, você


estudará aqui apenas exemplos do 2º ou do 3º caso. Porém, você pode perguntar:
como saberei, estatisticamente falando, se as variâncias são iguais?

Resposta à pergunta: usando um teste de hipóteses auxiliar, conhecido


como teste de hipótese para a igualdade de duas variâncias. O exemplo a seguir
apresentará este tipo de teste, acompanhe.

Exemplo:

Deseja-se verificar se as variâncias de 2 máquinas de encher perfumes


são iguais. Extraem-se duas amostras, uma de cada máquina (suponha que os
volumes das amostras seguem uma distribuição normal):

Máquina A: 15 elementos, média = 61 ml, variância = 0,3 ml


Máquina B: 20 elementos, média = 60 ml, variância = 0,11 ml

Qual é a sua conclusão a 5% de significância?

Solução:

Como o objetivo é verificar se as variâncias são iguais ou não, têm-se as


seguintes hipóteses (por enquanto):

H0: σ2A = σ2B


H1: σ2A ≠ σ2B

Você viu na Unidade 2 que em uma distribuição normalmente distribuída


a razão das variâncias segue uma distribuição F. Por comodidade, sempre
considere a maior variância no numerador e a menor variância no denominador.

Dessa forma, simplifica-se o teste para o caso unilateral à direita com nível
de significância α/2 e hipóteses:

H0: σA2 =1 (significa que as variâncias populacionais são iguais)


2

σB
σ 2
H1: A2 >1 (significa que as variâncias populacionais são diferentes)
σB
Assim, para resolver o teste, compare o valor Ftab (Apêndice F) com o valor
2
crítico Fcal. Para obter o valor crítico faça: Fcal = Smaior= maior variância.
2 menor variância
Smenor

165
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

Então, Fcal = 0,3


=2,7273
0,11

Para obter o valor Ftab, deve-se considerar gl1 = 15 – 1 = 14 (grau de liberdade


do numerador), gl2 = 20 – 1 = 19 (grau de liberdade do denominador) e α = 2,5%.

Assim, Ftab = 2,6469.

Região de rejeição de H0
Região α = 2,5%
de
aceitação
de H0
2,7273
2,6469

Portanto, você pode rejeitar a hipótese de que as variâncias populacionais


desconhecidas são iguais com uma chance de erro de 0,05 (α =5%).

Após identificar se as variâncias desconhecidas são iguais ou não, você


aplica o teste t-Student para cada caso, conforme os exemplos a seguir.

1º CASO: variâncias populacionais são desconhecidas e diferentes

Exemplo:

Para verificar se a eficiência da rede particular de ensino é diferente da


rede pública de ensino da cidade X, foram tomadas duas amostras (assumidas
normalmente distribuídas) uma de cada rede:

Amostra 1: Rede particular – 30 alunos, média = 8,6, variância = 5,1


Amostra 2: Rede pública – 30 alunos, média = 6,4, variância = 3,3

Qual conclusão devemos tomar em um nível de significância de 5%?

166
TÓPICO 3 | TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU DE DEPENDÊNCIA

UNI

Como as médias não foram obtidas da mesma rede de ensino, você está diante
de um caso de dados não pareados.

Solução:

Primeiramente verifique se as variâncias populacionais desconhecidas


são realmente iguais. Como você já estudou isso, essa verificação é por sua conta,
combinado? Para continuar o exemplo assuma que elas são iguais.

O primeiro passo é estabelecer as hipóteses:

H0: µ1 = µ2 (médias iguais ⇒ eficiências iguais)


H1: µ1 ≠ µ2 (médias diferentes ⇒ eficiências diferentes)

Supondo (sabendo) que as variâncias populacionais desconhecidas
são iguais, deve-se estimá-la pela média ponderada das variâncias amostrais,
conforme a seguinte fórmula:

(n1–1)·s21+(n2–1)·s22
s2=
n1+n2–2

Assim, tem-se a seguinte variância ponderada: S2 = (30–1)·5,1+(30–1)·3,3


30+30–2
147,9+95,7
= =4,2
58
x1–x2
Agora basta calcular o valor crítico tcalc pela fórmula: tcalc= e
compará-lo com o valor ttab. 1 + 1 ·s2
n
√ 1 n2

Calculo de tcalc:

x1–x2 8,6–6,4 2,2 2,2


tcalc = = = = =4,1588
1 + 1 ·s2 1 + 1 ·4,2 2 ·4,2 0,529
√ 1 n2
n √ 30 30 √ 30

167
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

Para obter o valor crítico ttab, entre na tabela t-Student (Apêndice C) com
α = 0,025 (0,05/2) e como as variâncias foram consideradas iguais os graus de
liberdade são obtidos fazendo: nA + nB – 2.

Assim, gl = 58 (30 + 30 – 2), e o ttab fica em torno de 2.

UNI

Na tabela do Apêndice C não aparece o valor de ttab para gl = 58, mas tem-se o
valor de ttab para gl = 60, o que nos permite dizer que ttab ≅ 2 para gl = 58 e α = 0,025.

Regiões de rejeição
de H0
α α
= 0,025 = 0,025
2 2
Região de
aceitação H0
1 – α = 0,95
-2 2 4,1588

Conclusão:

Como tcalc = 4,1588 é maior que ttab, rejeita-se H0, pois o valor calculado está
na região de rejeição, a um nível de confiança de 95%.

Pode-se dizer ainda assim: conclui-se com 95% de confiança (ou uma
chance de erro de 5%) que há diferença entre as médias dos alunos da rede pública
e privada de ensino.

2º CASO: variâncias populacionais são desconhecidas e diferentes

Exemplo:

Deseja-se saber se 2 máquinas de encher frascos de perfumes estão fornecendo


o mesmo volume médio em ml. Extraem-se duas amostras, uma de cada máquina
(suponha que os volumes das amostras seguem uma distribuição normal):

Máquina A: 15 elementos, média = 61 ml, variância = 0,3 ml2


Máquina B: 20 elementos, média = 60 ml, variância = 0,11 ml2

Qual é a sua conclusão a 5% de significância?


168
TÓPICO 3 | TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU DE DEPENDÊNCIA

UNI

É fácil identificar que as médias de cada máquina não foram obtidas dos mesmos
indivíduos (pesos), por isso é que você está num caso de dados não pareados.

Solução:

Você já viu no primeiro exemplo desse tópico, que as variâncias


populacionais desconhecidas são diferentes. Então, veja as hipóteses:

H0: µ1 = µ2 (médias iguais ⇒ volumes iguais)


H1: µ1 ≠ µ2 (médias diferentes ⇒ volumes diferentes)

Para o caso em que as variâncias populacionais desconhecidas são

diferentes, estima-se a variância através da fórmula: s2 = S21 S22


+
√ n 1 n2

Assim, obtém-se a seguinte variância: s2 = 0,3 0,11 =√0,0255 = 0,1597.


+
√ 15 20
x –x
Agora basta calcular o valor crítico tcalc, pela fórmula: tcalc= 1s2 2 e compará-lo
com o valor ttab.
x1–x2 61–60
Cálculo de tcalc: tcalc = = =6,2617.
s2 0,1597

Como as variâncias populacionais são desconhecidas e diferentes a


variável t terá os graus de liberdade calculados pela fórmula a seguir:

(v1+v2)2
s2 s2
gl= v21 v22 -2, onde: v1 = 1 e v2 = 2 .
n1 n2
+
n1+1 n2+1

169
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

Cálculo de gl:

v1 = 0,3 =0,02 e v2 = 0,11 =0,0055


15 20

(0,02+0,0055)2 0,00065025
0,00065025
gl= (0,02)2 (0,0055)2 -2= 0,0004 0,00003025 -2= -2=24,5934-2≅22,59≅23
+ + 0,00002644
15+1 20+1 16 21

Com isso a variável t-Student terá 23 graus de liberdade, e para obter o


valor ttab você consulta na tabela t (Apêndice C) o α = 0,025 (0,05/2) e gl = 23, assim
ttab = 2,0687.

Regiões de rejeição
de H0

α α
=0,025 =0,025
2 2
Região de
aceitação H0
1 – α = 0,95
-2,0687 2,0687 6,2617

Conclusão:

Como tcalc = 6,2617 é maior que o ttab = 2,0687, rejeita-se H0, pois o valor
calculado está na região de rejeição, a um nível de confiança de 95%.

Você ainda pode dizer: conclui-se com 95% de confiança (ou uma chance de
erro de 5%) que há diferença entre os volumes médios dos frascos fornecidos pelas
duas máquinas. Seria recomendável descobrir qual das duas está com problemas
para efetuar as correções necessárias.

3 TESTE DE INDEPENDÊNCIA
Este teste é baseado na distribuição qui-quadrado e serve para verificar
se duas variáveis têm algum grau de associação ou dependência. Assim como os
demais testes, você os estudará a partir de alguns exemplos.

170
TÓPICO 3 | TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU DE DEPENDÊNCIA

UNI

Saiba que o qui-quadrado não é um teste para medir a “força” da dependência,


ele só diz se há ou não dependência entre as variáveis.

Com o objetivo de investigar se há dependência entre o time de futebol que


torce e o estado em que mora o torcedor, foram entrevistados, aleatoriamente, 765
torcedores de um país. As respostas obtidas estão na tabela de dados observados
a seguir. Em nível de significância de 5%, o que se pode concluir?

TABELA DE DADOS OBSERVADOS (O)


Bairro
Rio de Janeiro São Paulo Santa Catarina Total
Time
Flamengo 100 60 90 250
Corinthians 140 85 160 385
Figueirense 20 40 70 130
Total 260 185 320 765

Solução:

H0: A preferência pelo time do coração independe do bairro


H1: A preferência pelo time do coração depende do bairro

A partir da tabela de dados observados deve ser criada uma tabela teórica
contendo os dados esperados.

Cada elemento ei,j dessa nova tabela é obtida dividindo o produto entre o
total da linha i e o total da coluna j pelo total geral, ou seja:

total da linha i x total da coluna j


ei,j= .
total geral

171
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

TABELA DE DADOS ESPERADOS (E)


Bairro
Rio de Janeiro São Paulo Santa Catarina
Time
Flamengo 84,9673 60,4575 104,5752
Corinthians 130,8497 93,1046 161,0458
Figueirense 44,1830 31,4379 54,3791

UNI

Veja o cálculo de alguns elementos da tabela de dados esperados:

e1,1 = 260·250 =84,97; e1,2= 185·250 =60,46;...


765 760
e2,1 = 260·385 =130,85;...
765
e3,1 = 260·130 =44,18;...
765

A diferença entre os valores esperados e observados é medida pela


fórmula:
χ2calc ∑∑ (Oij–Eij) , onde r é o número de linhas e s o número de colunas.
r s 2

i=1i=1
Eij

Assim os valores χ2calc se comportam como um modelo de distribuição


qui-quadrado com (r – 1) x (s – 1) graus de liberdade.

Para facilitar o cálculo de χ2calc, veja o quadro a seguir, onde estão


confrontados os valores observados (O) com os esperados (E).

172
TÓPICO 3 | TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU DE DEPENDÊNCIA

(O–E)2
Valores Observados – O Valores Esperados – E (O – E) (O – E)²
E
100 84,9673 15,0327 225,9815 2,6596
Rio de Janeiro

140 130,8497 9,1503 83,7285 0,6399

20 44,1830 -24,1830 584,8178 13,2363

60 60,4575 -0,4575 0,2093 0,0035


São Paulo

85 93,1046 -8,1046 65,6841 0,7055


40 31,4379 8,5621 73,3094 2,3319

90 104,5752 -14,5752 212,4354 2,0314


Santa Catarina

160 161,0458 -1,0458 1,0936 0,0068

70 54,3791 15,6209 244,0130 4,4873

Qui-Quadrado = χ²calc 26,1022

Basta agora achar o valor crítico χ²tab para confrontarmos com o χ²calc, se o
calculado for maior que o tabelado rejeita-se H0, caso contrário, se aceita.

Para achar o tabelado precisa-se do nível de significância 0,05 e do grau de


liberdade que é (r – 1) x (s – 1) = (3 – 1) x (3 – 1) = 4. Olhando na tabela χ² (Apêndice
B) temos que χ²tab = 9,4877.

Região de Rejeição de H0

Região de α = 0,05
aceitação de H0
1 – α = 0,95

9,4877 26,1022

Conclusão:

Rejeita-se H0 em um nível de significância de 5%, assim se pode dizer que


há algum tipo de dependência entre o time do coração e o bairro em que mora o
torcedor. Pode-se afirmar isso, pois 26,1022 > 9,4877.

173
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

LEITURA COMPLEMENTAR

Esta leitura complementar tem como objetivo integrar o estudo de


Distribuição de Probabilidades realizado neste tópico. Se quiser saber mais ou
entender melhor, a título de curiosidade, após a leitura, entre em contato com a
Tutoria Interna de Matemática.

AS DISTRIBUIÇÕES DE PROBABILIDADE T, F e QUI-QUADRADO:


TEORIA E PRÁTICA COM O USO DA PLANILHA

Lori Viali – PUCRS e UFRGS1 – viali@pucrs.br


Hélio Radke Bittencourt – PUCRS – heliorb@pucrs.br

INTRODUÇÃO

De acordo com Bayer et al. (2005), conteúdos de Probabilidade geralmente


são lecionados em disciplinas de Estatística no Ensino Superior. Bittencourt e Viali
(2006) ressaltam que, salvo eventuais exceções, os únicos cursos de graduação
brasileiros que têm disciplinas dedicadas apenas à Probabilidade são os de
Bacharelado em Estatística. Portanto, devido às restrições impostas pela carga
horária e amplo conteúdo programático, os conteúdos probabilísticos ou são
omitidos ou trabalhados de forma inadequada.

O nível de profundidade a ser trabalhado em conteúdos de Probabilidade


depende do curso para o qual a disciplina é destinada e da carga horária
dispensada. De uma forma geral as distribuições Binomial e Normal constam do
programa de quase todas as disciplinas de Probabilidade e Estatística oferecidas.
Entretanto as distribuições t de Student, F de Snedecor e qui-quadrado, necessárias
principalmente na área de exatas, são geralmente suprimidas do conteúdo de
Probabilidade e inseridas diretamente na parte Inferencial. A despeito do papel
preponderante que os modelos probabilísticos t, F e χ2 desempenham na inferência
estatística é raro encontrar algum texto didático de Probabilidade que apresente
esses modelos. Invariavelmente essas distribuições são apresentadas inseridas em
conteúdos de amostragem, estimação ou mesmo no teste de hipóteses em livros
de Estatística. Geralmente livros textos de Estatística abordam Probabilidade,
mas esses modelos dificilmente serão aí encontrados. Essa abordagem tem a
vantagem de evitar a necessidade de apresentar o algoritmo dessas funções, isto
é, suas fórmulas. Por outro lado dificulta a compreensão e reforça a confusão entre
estatística e probabilidade, ou seja, entre a realidade e o modelo dessa realidade.

1 Professor titular do Departamento de Estatística, Faculdade de Matemática da PUCRS.


Professor adjunto do Departamento de Estatística, Instituto de Matemática da UFRGS.

174
TÓPICO 3 | TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU DE DEPENDÊNCIA

1 A ESTATÍSTICA E A PROBABILIDADE NO ENSINO SUPERIOR

Nos últimos anos ocorreram reformas curriculares que tinham como um


dos principais objetivos a redução do tempo para conclusão em um grande número
de cursos de graduação. Cury (2001) comenta as novas diretrizes curriculares dos
cursos de Engenharia e apresenta opções metodológicas para que tal diminuição
não represente perda de qualidade. Nas disciplinas de Cálculo, por exemplo,
antes de tais reformas, parte dos alunos da área das Ciências Exatas tinha contato
com conteúdos mais aprofundados. Funções, limites, derivadas, integrais e
séries, entre outros, eram distribuídos em duas, três ou até quatro disciplinas que
contemplavam de oito a 16 créditos.

As disciplinas de Estatística também sofreram alterações com os novos


currículos. Nos cursos de Engenharia as mudanças foram pequenas, pois, na
maioria dos casos, elas já estavam reduzidas a uma única disciplina de quatro
créditos. Em outras áreas, no entanto, o corte foi mais dramático de forma que
hoje é difícil encontrar um curso de qualquer área que contemple mais de uma
disciplina de Estatística. Saliente-se que, quando se está falando de um curso de
Estatística, a Probabilidade está incluída. Mesmo antes das reformas curriculares
era raro existirem disciplinas separadas para Estatística e Probabilidade.
Assim, via de regra, uma disciplina denominada de Estatística engloba, além
de Estatística, a Probabilidade e algumas vezes alguns conteúdos de Análise
Combinatória. Por este motivo não é de surpreender que grande parte dos alunos
não saiba a diferença entre Estatística e Probabilidade, pois mesmo professores
da área fazem confusão entre as duas disciplinas e os textos didáticos geralmente
reforçam essa visão confusa entre as duas áreas.

Portanto, devido às limitações de tempo e de conhecimento de Cálculo,


alguns tópicos de Probabilidade estão sendo suprimidos dos programas. Nos
tópicos subsequentes mostraremos como é possível apresentar conteúdos que
envolvem cálculo não elementar fazendo uso de planilha eletrônica.

2 PROBABILIDADE E ESTATÍSTICA: ASPECTOS HISTÓRICOS

A partir do início do século passado a Estatística teve o seu grande


desenvolvimento graças às contribuições da Probabilidade. Sabe-se que a
Estatística Inferencial depende pesadamente da Probabilidade. Mas essa
harmonia e simbiose entre as duas áreas não significa que ambas são idênticas. A
Probabilidade continua a existir e a se desenvolver a despeito de suas aplicações
à Estatística. O mesmo ocorre com a Matemática que, independente de suas
inúmeras aplicações, continua a crescer e a progredir por si só.

A Estatística pode ser caracterizada como a análise e a interpretação de


dados, tratando-se de uma disciplina aplicada. A Probabilidade, por sua vez, é um
ramo da Matemática que trata da incerteza, isto é, procura modelar fenômenos
não determinísticos. A origem de ambas é diferente, assim como cada uma trilhou
o seu próprio caminho até o final do século 19 ou, talvez um pouco antes, quando

175
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

ocorreu o encontro e a partir daí desenvolveu-se a Inferência e as coisas não foram


mais as mesmas. A Probabilidade continuou a evoluir independentemente, mas o
vigor dessa união foi muito mais prolífico para a Estatística.

Hoje praticamente todos os campos do conhecimento possuem aplicações


específicas da Estatística, sendo que alguns ganharam denominação própria
como a Econometria, a Bioestatística ou Biometria, a Psicometria, a Sociometria, a
Quimiometria, a Geoestatística, a Astroestatística, a Demografia e a Epidemiologia.
Outros ainda emprestam o nome como a Estatística Ambiental, Industrial,
Financeira, Climatológica, Computacional, Matemática, Espacial, Oficial e a
Agrícola. Existem ainda áreas que aparentemente nada têm a ver, mas que em geral
são incluídas dentro desse grande termo guarda-chuva “Estatística”. A Simulação
ou Método Monte Carlo, a Teoria da Decisão, dos Jogos e da Informação, os Ensaios
Clínicos, os Números Índices, o Projeto de Experimentos, a Atuária, a Amostragem e
o Controle Estatístico do Processo. É praticamente impossível dizer se é a Estatística
ou a Probabilidade quem mais contribui a cada uma dessas áreas.

Tanto a Estatística quanto a Probabilidade têm-se mostrado férteis para a


criação de novas áreas de conhecimento. O entendimento de cada uma dessas áreas
depende do conhecimento de suas raízes. Como foi mencionado, o que ocorreu
da junção da Estatística com a Probabilidade foi uma fonte de novas aplicações
sem, no entanto, eliminar cada uma das duas áreas individualmente. Assim, a
Probabilidade continua como um dinâmico ramo da Matemática, bastante jovem,
quando comparada com a Aritmética, a Álgebra ou o Cálculo. A Probabilidade só
foi axiomatizada em 1933 com a obra de Komogorov2, “Fundamentos da Teoria
da Probabilidade”. Talvez seja o desenvolvimento recente o responsável por parte
da confusão encontrada.

A Probabilidade pode e deve ser estudada e compreendida isoladamente,


isto é, sem a Estatística. Os Parâmetros Curriculares Nacionais (PCN+) da
Educação Básica percebem e destacam essa diferença quando colocam (p. 126):
“[...] a Estatística e a Probabilidade devem ser vistas, então, como um conjunto
de ideias e procedimentos que permitem aplicar a Matemática em questões do
mundo real, mais especialmente aquelas provenientes de outras áreas”. No
Ensino Superior a realidade é diferente. A quase totalidade dos livros textos de
Estatística apresentam um capítulo ou mais de probabilidade. Nesses capítulos
geralmente são tratados conceitos básicos, modelos probabilísticos discretos e
contínuos. Entre os modelos contínuos a curva normal é quase sempre o único
apresentado. Os livros mais detalhados vão um pouco além apresentando também
os modelos uniforme e exponencial. Geralmente a uniforme e a exponencial não
são mais mencionadas após, pois, a menos que o texto apresente teoria das filas
ou simulação, eles terão poucas aplicações na Estatística. Já o modelo normal é
imprescindível para o desenvolvimento da Amostragem, Estimação por intervalo
e Testes de Hipóteses. No entanto, para desenvolver esses tópicos será necessário
também o uso da distribuição t de Student, qui-quadrado (χ2) e eventualmente a
distribuição F de Snedecor.

2 Andrey Nikolaevich Kolmogorov (1903 - 1987). Matemático Russo.

176
TÓPICO 3 | TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU DE DEPENDÊNCIA

A distribuição t foi desenvolvida por William Sealey Gosset (1876-1937)


em um artigo publicado na revista Biometrics, em março de 1908, enquanto
trabalhava como químico da cervejaria Guinness de Dublin, Irlanda. Como a
empresa não permitia publicações com o nome real de funcionários, ele utilizou
o pseudônimo de “Student”. Ele precisava de um modelo que pudesse ser
utilizado com pequenas amostras e percebeu que, se elas fossem retiradas de uma
população unimodal e simétrica, as mesmas poderiam ser caracterizadas pelo seu
tamanho amostral.

Se uma população (variável) X de média x e variabilidade (desvio padrão)


s for padronizada por meio da transformação Z = (x – x)/s, então a variável Z
terá uma média “zero” e desvio padrão unitário. Essa mudança de fato coloca
a variável centrada em torno da origem e reduz a variabilidade a um. Ela, no
entanto, não altera a forma da variável, isto é, se a variável tiver certa assimetria e
determinada curtose (achatamento), a mudança manterá esses valores. Assim se
X for normal ela continuará tendo um comportamento normal. Gosset já conhecia
isso; o que ele de fato precisava descobrir era qual o comportamento da variável
Z = (x – x)/s quando o valor de X fosse desconhecido e estimado por meio de
uma amostra. Também já era conhecido na época que para grandes amostras a
variável Z continuava praticamente normal padrão, isto é, com média igual a zero
e variabilidade igual a um (LEHMANN, 1999).

O problema de Gosset era saber qual seria o comportamento dessa


variável quando as amostras fossem pequenas. O que ele percebeu é que esse
resultado mantinha a simetria em torno de zero, mas não a variabilidade, ou seja,
que a variabilidade dependia agora do tamanho da amostra utilizada, quanto
menor mais variáveis eram os resultados. Assim o modelo t de Student pode ser
caracterizado por um único parâmetro, o tamanho amostral.

O modelo t, nem sempre, está associado com pequenas amostras. Apesar


de ter-se originado dessa forma, desenvolveu-se e ganhou vida própria. Em geral
ele é especificado com um parâmetro genérico gl que é denominado de “graus
de liberdade” e quando necessário estabelecer a relação com valores amostrais
coloca-se gl = n - 1, isto é, o parâmetro do modelo probabilístico t é igual ao
número de elementos amostrais subtraído de uma unidade.

A distribuição χ2 ou qui-quadrado foi desenvolvida inicialmente, de


acordo com Upton e Cook (2002), pelo físico alemão Ernst Carl Abbe (1840-1905)
em 1863 e de forma independente pelo engenheiro geodesista alemão Friedrich
Robert Helmert (1843-1917) em 1875. O modelo foi batizado e popularizado pelo
estatístico britânico Karl Pearson (1857-1936) em 1900, ano no qual ele desenvolveu
uma das mais populares aplicações do modelo: o teste de aderência.

A distribuição qui-quadrado também é definida por um único parâmetro


gl que está relacionado ao tamanho amostral (gl = n – 1). Outra maneira de
caracterizá-la é como a soma dos quadrados de gl normais padrão independentes.
Além de todas as aplicações dos testes de aderência e independência, William
Gemmell Cochran (1909-1980) mostrou que ela é igual, a menos de uma constante,
a distribuição da variância amostral.

177
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

O modelo F de Snedecor foi inicialmente desenvolvido por Ronald Aylmer


Fisher (1890-1962) em 1922 e, por isso, ele é também conhecido por distribuição
de Fisher-Snedecor. Em 1934 foi tabelado por George Waddell Snedecor (1881-
1974) que também introduziu a letra F para representá-lo, homenageando dessa
forma o seu real criador (DAVID, 2003). O modelo F é fundamental para as áreas
de Planejamento de Experimentos, Análise de Variância e de Regressão.

Pode-se observar que a origem dos três modelos é diversa, mas que, de
fato, apresentam algumas características comuns. Os três modelos apresentam
aplicações na Estatística Inferencial e, se juntarmos a elas o modelo normal,
teremos talvez o quarteto de modelos que desempenha o principal papel num
variado leque de técnicas estatísticas tanto paramétricas quanto não paramétricas.
As características mais notórias que esses três modelos apresentam são a
dependência da função gama e de não serem integráveis analiticamente.

Propõe-se, então, a utilização da planilha para que o aluno seja capaz de


trabalhar de uma forma dinâmica e interativa com os três modelos, construindo
por si próprio as tabelas e as representações gráficas que são onipresentes de uma
forma estática nos textos de Estatística.

3 A FUNÇÃO GAMA E AS DISTRIBUIÇÕES T, F E χ²

A função gama é considerada uma extensão do fatorial para o domínio dos


números complexos, com exceção dos números inteiros negativos. Essa função é
geralmente vista em cursos avançados de cálculo, sendo definida por:

Gama (x) = Γ(x) = ∫ ∞ tx-1e -tdt


0

Ela apresenta algumas propriedades peculiares, como, por exemplo:

Γ(x+1) = x!
Γ(x+1) = x Γ(x)
Γ(1/2) =√π

Graficamente a função Gama tem um comportamento estranho,


especialmente para os números negativos devido aos pontos de descontinuidade.
A Figura 1 mostra o gráfico da função Gama apenas para os números positivos
que são de maior interesse.

178
TÓPICO 3 | TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU DE DEPENDÊNCIA

FIGURA 1 – GRÁFICO DA FUNÇÃO GAMA NO DOMÍNIO DOS


NÚMEROS REAIS POSITIVOS
20
Γ(x)
18
16

14
12
10
8
6

4
2 x
0
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0

Matematicamente a distribuição t de Student tem como único parâmetro o


valor de k – graus de liberdade – utilizando a função Gama tanto no seu numerador
como no denominador, conforme segue:

v+1
Γ
2
tv(x) = v+1 x=1,2,3,... xϵℜ
v x2 2
√πv Γ 2 1 + v

Para qualquer valor inteiro e positivo de x a distribuição t assume uma


forma muito parecida com a curva normal-padrão (Z) sendo que a aproximação
será tanto melhor quanto maior for o valor de x. A Figura 2 apresenta a forma da
distribuição de Student para alguns valores de x.

A distribuição qui-quadrado está definida apenas para valores não


negativos de x e, assim como a t, depende dos graus de liberdade k conforme segue:
v -1 -x

x (x) = x e
2 2
2
v v v
x = 1,2,3,... x ϵ [0; ∞]
22 Γ 2

179
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

Já a distribuição F de Snedecor depende de dois parâmetros denominados


também de graus de liberdade. O primeiro (m) é o grau de liberdade do
numerador e o segundo (n) do denominador. Na estatística ela é caracterizada
como o quociente de duas variâncias e, portanto, de duas distribuições qui-
quadrado. Cada parâmetro, da mesma forma que nos modelos anteriores, é
associado ao tamanho amostral menos um. Uma das possíveis representações da
função densidade de probabilidade da F, em termos da função Gama, é dada por:

m n m -1
m+n
2 2 2
Γ 2 m n x
Fm,n = m n m+n m, n = 1,2,3, ... x ϵ [0; ∞]
Γ 2 Γ 2 (mx+n) 2

Como pode ser observado, os três modelos possuem funções densidade


de probabilidade de difícil manuseio para quase a totalidade dos alunos de
graduação. Assim a planilha pode ser um ótimo recurso para que esses modelos
possam ser visualizados e trabalhados de uma forma bem mais simples.

4 A PLANILHA COMO RECURSO PARA O MANUEIO DOS MODELOS

A manipulação desses modelos pela planilha bem como a construção de


tabelas podem ser realizadas por alunos oriundos de diferentes cursos. Obviamente,
quanto maior formação matemática e computacional o aluno tiver, mais detalhes
dos algoritmos podem ser tratados. De qualquer forma todos têm algo a ganhar
com a abordagem computacional em relação à leitura pura e simples das tabelas
de um livro. Em geral os números, apresentados nas tabelas, serão para a grande
maioria dos alunos um completo mistério. Eles não sabem e provavelmente nunca
entenderão o significado dos valores lidos e, portanto, a interpretação correta de
qualquer resultado que dependa desses valores estará comprometida.

Se o aluno for oriundo das Ciências Exatas, então cálculos de probabilidade


podem ser realizados por meio de integrais. Se o aluno for das Ciências Sociais,
Humanas ou Biomédicas pode ser feita uma associação entre os valores da
tabela e as áreas sob as curvas (distribuições). Dessa forma os alunos teriam
mais condições de entender conceitos como nível de significância ou o motivo da
rejeição de uma hipótese.

A planilha mais difundida e utilizada, a MS Excel, não apresenta


diretamente os algoritmos para a geração dos modelos aqui tratados. Modelos
como a normal e a exponencial apresentam funções prontas tanto para o cálculo
dos valores da função densidade de probabilidade f(x) quanto do cálculo dos
valores da função de distribuição acumulada F(x) = P(X ≤ x). A função densidade
de probabilidade permite a representação gráfica do modelo e a função de
distribuição acumulada o cálculo direto das integrais (áreas) e, portanto, a
construção das tabelas.

180
TÓPICO 3 | TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU DE DEPENDÊNCIA

Com os modelos t, χ2 e F o usuário não teve a mesma sorte, pois a empresa


colocou apenas opções para o cálculo das áreas. Deve-se tomar cuidado nesses
casos, pois existe uma falta de padronização de comandos nas funções do Excel.
Os valores fornecidos para estas três distribuições não é a F(x), isto é, não é a
área à esquerda de x, como ocorre com a curva normal e a exponencial. Para a
distribuição t, a planilha fornece a soma das áreas das caudas, isto é, P(|T| >
t). Assim deve-se tomar o cuidado de dividir o resultado por dois para ter-se
uma área unilateral, isto é, a F(t). Um outro resultado que pode causar problemas
para o usuário iniciante é o fato de a planilha não apresentar a integral ou área
para valores negativos da variável t. Não há nenhum motivo aparente por que
esse caso foi apresentado dessa forma. Uma especulação é de que o programador
seguiu o formato das tabelas e, se ficar atento a outras situações, pode-se quase ter
certeza disso. Os retornos para o modelo χ2 também não seguiram o exponencial
e o normal, aqui a planilha fornece a área à direita, isto é, 1 – F(x) ao invés da
esperada F(x). O usuário, principalmente o iniciante, precisa tomar um cuidado
maior, pois isso não fica claro nos procedimentos da função e nem a “ajuda” do
recurso esclarece esse ponto. Para a distribuição F a planilha reserva a mesma
opção da qui-quadrado fornecendo a área à direita. Aqui é reforçada a suspeita
de que o programador do software tenha seguido as opções das tabelas dos livros
textos para implementar essas opções já que o mais fácil e mais didático teria sido
simplesmente apresentar a F(x) em todos os casos.

Mesmo com a falta de padronização das funções probabilísticas do Excel,


o cálculo das áreas pode ser feito com algum cuidado. A representação gráfica
desses modelos, entretanto, não pode ser feita de forma simples e direta, mas,
apesar da relativa dificuldade, é possível construí-las.

Para se determinar os gráficos é necessário considerar cada modelo


individualmente. O modelo χ2 pode ser determinado como um caso particular da
distribuição Gama (não confundir com a função Gama) que é calculada facilmente
pela planilha. Para se entender melhor do que se está falando vai-se esclarecer
como os modelos probabilísticos foram implementados em alguns casos na
planilha. A Figura 2 ilustra a situação para o caso da distribuição Normal.

181
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

FIGURA 2 – CÁLCULOS DOS VALORES F(X) E F(X) PARA O MODELO NORMAL

Na Figura 2 pode-se observar que existem quatro argumentos. Na


primeira linha rotulada de “x” são passados os valores da variável que se quer
obter a f(x) ou a F(x). Na segunda e terceira linha são apresentados os parâmetros
da função, no caso do modelo normal, esses parâmetros são a média e o desvio
padrão. A quarta e última é uma variável lógica que admite apenas dois valores:
“verdadeiro (1)” e “falso (0)”. Se quisermos calcular o valor da imagem da função
no ponto x, então o parâmetro cumulativo (quarta linha) deve ser colocado como
“falso” ou “zero”. Se, por outro lado, o desejado for a área, isto é, F(x) então o
parâmetro “cumulativo” deve ser colocado como “verdadeiro” ou “um”. Tudo
seria didaticamente perfeito se essa metodologia fosse mantida para todas as
funções. Como o ideal não existe, o que se observa é que para os três modelos
sendo discutidos aqui a planilha não apresenta a quarta linha, isto é, estas funções
não têm o parâmetro “cumulativo”. Para esses três casos só foi colocada a opção
do cálculo da área. A Figura 3 mostra uma aplicação usando o modelo Normal.

FIGURA 3 – CONSTRUÇÃO DA FDP E DA FD DO MODELO NORMAL

182
TÓPICO 3 | TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU DE DEPENDÊNCIA

A Figura 4 mostra a janela de cálculo para o modelo χ2, ilustrando a falta do


argumento “cumulativo”. Assim nesse caso não é possível o uso dessa função para o
cálculo da f(x) e, portanto, para a determinação da forma do modelo. Felizmente para
esse caso a janela da distribuição Gama é semelhante a da normal, isto é, fornece o
parâmetro cumulativo e como consequência a possibilidade do cálculo de f(x).

FIGURA 4 – JANELA DA PLANILHA ILUSTRANDO O CÁLCULO DE VALORES DA x2

A Figura 5 ilustra a situação. Assim para determinar as formas gráficas


do qui-quadrado, pode-se utilizar a distribuição fazendo o parâmetro gl = 2 e o
parâmetro gl = n - 2, onde x é o parâmetro desejado para o modelo χ2.

FIGURA 5 – ILUSTRAÇÃO DO CÁLCULO DE VALORES DA DISTRIBUIÇÃO GAMA

183
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

Para construir o gráfico da distribuição t de Student a única alternativa é


a utilização da função LNGAMA(x) disponível no Excel na categoria das funções
estatísticas. Aqui convém distinguir entre a função Gama e a distribuição de
probabilidade Gama. Elas não são a mesma coisa e a relação que apresentam é
que a função densidade Gama, tal qual os três modelos mencionados, depende
da função Gama. A função LNGAMA(x) retorna o logaritmo da função gama no
ponto x, ou seja, resolve a difícil integral apresentada anteriormente. Infelizmente a
planilha não dispõe diretamente da função gama, mas fornece uma função que nos
permite obtê-la. Assim se quisermos somente o valor de f(x), será necessário tomar
o antilogaritmo, isto é, calcular EXP(LNGAMA(x)). A Figura 6 mostra a construção
do modelo t de Student de forma semelhante a utilizada na Figura 3, só que agora
utilizando diretamente um algoritmo fornecido pelo usuário e não pela planilha.

Deve-se admitir que essa não é uma opção trivial e simples de ser
implementada, mas as alternativas podem ser piores. Uma opção seria
simplesmente não se mencionar o assunto e continuar fazendo o que é feito,
mostrando um texto com a ilustração do modelo, recurso esse que parece não
vem dando resultados animadores. Uma segunda opção seria tentar utilizar um
software específico e com mais recursos como o Maple, Derive, Mathematica,
MathLab, SPSS, Statistica, Minitab etc. Aqui se vai esbarrar no problema já
mencionado anteriormente do pouco tempo para muito conteúdo, pois qualquer
um desses pacotes exigirá muito mais tempo e esforço do que uma planilha para
que um usuário iniciante consiga alguns resultados úteis ou satisfatórios. Além
disso poucos ou talvez nenhum desses softwares farão parte do futuro profissional
do aluno uma vez que são raras as empresas que os utilizam.

FIGURA 6 – CONSTRUÇÃO DE MODELOS DA T DE STUDENT

184
TÓPICO 3 | TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU DE DEPENDÊNCIA

Para o modelo F de Snedecor, deve ser seguido um caminho semelhante


ao da determinação do modelo t. A Figura 7 ilustra o cálculo dos valores da
distribuição acumulada F. Pela figura pode-se perceber que não existe uma
alternativa para a obtenção de valores da fdp (função densidade de probabilidade),
pois aqui, a exemplo dos demais casos, o parâmetro “CUMULATIVO” não foi
oferecido. Assim a planilha oferece diretamente apenas o cálculo das áreas sob o
modelo, nesse caso, a exemplo da função qui-quadrado a área à direita.

Como a planilha não fornece opções de cálculo direto para os valores


da função densidade do modelo F é, então, necessária a utilização direta da
fórmula já apresentada para esse modelo. Convém reconhecer que mesmo com
o uso da planilha esse não é um caminho de todo modo simples. No entanto,
acredita-se que os efeitos colaterais advindos como a maior familiaridade com
o recurso e a habilidade de digitar e manusear algoritmos mais sofisticados
sejam compensatórios. O conhecimento um pouco mais aprofundado do recurso
será uma vantagem competitiva do aluno quando ele se tornar profissional e,
dependendo da área, essa habilidade poderá ser decisiva na conquista de uma
posição melhor no mercado de trabalho.

FIGURA 7 – ILUSTRAÇÃO DO CÁLCULO DE VALORES DA DISTRIBUIÇÃO F

185
UNIDADE 3 | INFERÊNCIA ESTATÍSTICA: ESTIMAÇÃO E TESTES DE HIPÓTESES

5 CONCLUSÃO

A restrição de carga horária no ensino de Estatística e Probabilidade é uma


realidade que precisa ser enfrentada. A utilização de recursos computacionais,
além de tornar o ensino mais dinâmico e mais afinado com a realidade, permite
que conteúdos que seriam tratados jornalisticamente ou descartados sejam
abordados de uma forma consistente e com maior profundidade, uma vez que
podem ser praticamente vivenciados e não apenas notificados.

Boyle, já em 1998, colocava que: “Na Universidade o Excel tornou-se um


componente compulsório de muitas matérias e cursos. Isso é particularmente
verdadeiro nas faculdades e escolas de administração e negócios, comércio e
economia.” O mesmo autor complementa: “Como resultado dessa tendência,
alguns professores de estatística se sentem obrigados, ou são fortemente
encorajados, a seguir essa tendência e utilizar a planilha para ensinar estatística
abandonando pacotes como o SPSS e o Minitab.”

Logo em seguida esclarece o motivo dessa situação: “O poder e a


versatilidade da planilha, sua relevância e seu uso disseminado na educação e
nos locais de trabalho não podem ser ignorados.”

Também confirma a avaliação feita pelos autores, de que a planilha tem


muitas vantagens, mas também apresenta deficiências como recurso instrucional
colocando que:

Entretanto a utilização das planilhas comercialmente disponíveis para o


ensino de estatística apresenta significativas deficiências. Em particular
uma planilha comercial não foi feita para lecionar estatística, nem para
pesquisa estatística e certo esforço e tempo pode ser necessário para se
gerar saídas estatísticas úteis (BOYLE, 1998, p. 2).

Certamente a situação evoluiu sensivelmente de 1998 para 2007, mas


isso não significa que tudo foi resolvido. A planilha não é certamente o recurso
perfeito, mas será que ele existe? Concorda-se com Boyle em algumas críticas, mas
não se acredita que seja mais necessário muito esforço e tempo para se produzir
saídas estatísticas satisfatórias. Por mais tempo e esforço que a planilha exija,
certamente qualquer outro pacote exigirá mais. Bittencourt e Viali (2006) colocam
que com planilha eletrônica o aluno é agente ativo do aprendizado e que, nesta
proposta, pode-se verificar que a participação dele vai bem além do que a simples
leitura de tabelas t, F e χ2.

186
TÓPICO 3 | TESTES DE HIPÓTESES PARA COMPARAÇÃO DE MÉDIAS E GRAU DE DEPENDÊNCIA

REFERÊNCIAS

BAYER, A.; ECHEVESTE, S.; BITTENCOURT, H. R.; ROCHA, J. Preparação


do formando em matemática-licenciatura plena para lecionar estatística no
ensino fundamental e médio. In: ENCONTRO NACIONAL DE PESQUISA EM
EDUCAÇÃO EM CIÊNCIAS, 5., 2005, Bauru. Anais... Bauru: [s.n.], 2005.

BITTENCOURT, H. R.; VIALI, L. Contribuições para o ensino da distribuição normal


ou curva de Gauss em cursos de graduação. In: SIMPÓSIO INTERNACIONAL
DE PESQUISA EM EDUCAÇÃO MATEMÁTICA, 3., 2006, Águas de Lindoia, SP.
Anais... Curitiba: UFPR Editora, 2006. p. 1-16.

BOYLE, Robin George. PACE2000 - Stand alone software package and add-in
for microsoft excel designed for teaching statistics at introductory-intermediate
level. ICOTS 5, Singapore, p. 811-17, 1998.

BRASIL. Secretaria de Educação Média e Tecnológica. PCN + Ensino Médio:


orientações educacionais complementares aos parâmetros curriculares nacionais.
linguagens, códigos e suas tecnologias. Brasília: Ministério da Educação/Secretaria
de Educação Média e Tecnológica, 2002.

CURY, Helena. Diretrizes curriculares para os cursos de engenharia e disciplinas


matemáticas: opções metodológicas. Revista de Ensino de Engenharia, v. 20, n.
2, p. 1-7, 2001.

DAVID, Herbert A. The history of statistics in the classroom. JOINT STATISTICAL


MEETING. San Francisco, California. August, 2003.

LEHMANN, E. L. Student and small-sample theory. Statistical Science, v. 14, n.


4, p. 418-426, 1999.

UPTON, Graham; COOK, Ian. A dictionary of statistics. Oxford (NY): Oxford


University Press, 2002.

VIALI , Lori; BITTENCOURT, Hélio Radke. As distribuições de probabilidade t,


f e qui-quadrado: teoria e prática com o uso da planilha. In: Anais do IX ENEM.
Salvador: Sbem, 2008. Disponível em: <http://www.sbem.com.br/files/ix_enem/
Html/comunicacaoCientifica.html>. Acesso em: 18 dez. 2011.

FONTE: Disponível em: <http://www.sbem.com.br/files/ix_enem/Html/comunicacao-


Cientifica.html>. Acesso em: 24 jan. 2013.

187
RESUMO DO TÓPICO 3

Neste tópico, você viu que:

• Dados pareados vêm da mesma amostra, só que são tomados antes e após uma
dada intervenção.

• Dados não pareados vêm de amostras diferentes.

• Para realizar um teste t-Student para comparação de médias precisamos:


1º: estabelecer as hipóteses H0 e H1;
2º: com base na H1 e no nível de significância (α) estabelecer as regiões de
aceitação e rejeição de H0 e o valor crítico;
3º: calcular o valor da variável do teste;
4º: aceitar ou rejeitar H0 pela comparação do valor calculado no 3º passo com a
região de aceitação ou rejeição.

Quando o teste for para comparação de médias em dados pareados, o valor


da variável do teste (3º passo) é calculado pela fórmula: tcalc = d .
(sd / √n)

Quando o teste for para comparação de médias em dados não pareados


com variâncias populacionais desconhecidas e iguais, o valor da variável do teste
(3º passo) é dado pela fórmula:
tcalc = x1–x2 .
1+1 2
·s
√ n1 n2
Quando o teste for para comparação de médias em dados não pareados
com variâncias populacionais desconhecidas e diferentes, o valor da variável do
teste (3º passo) é dado pela fórmula: tcalc= x1–x2 .
s2

Para verificar a igualdade de duas variâncias populacionais desconhecidas


calculamos o valor da variável do teste pela fórmula: Fcal = s2maior = menor
maior variância
variância
.
s menor
2

• O teste de independência serve para verificar se duas variáveis têm algum grau
de dependência.

• Os passos para realizar o teste de independência são os mesmos dos outros testes,
e a fórmula usada para calcular o valor da variável do teste é:
χ 2calc = r s (Oij – Eij)2 .
∑∑
i=1j=1 Eij

188
AUTOATIVIDADE

Agora, acadêmico, é a sua vez de exercitar o que aprendeu até aqui!


Lembre-se de que você tem à disposição no Material de Apoio do Ambiente
Virtual de Aprendizagem os gabaritos das autoatividades. Consulte-os
sempre que necessário.

Conte também com a Tutoria Interna do Curso de Matemática, que está


disponível por meio do 0800, contato e atendimento on-line. Bons estudos!

1 Uma fábrica de sapatos infantis deseja verificar se o investimento feito em


propagandas resultou em um aumento no número de sapatos vendidos
na região Sul do Brasil. O quadro a seguir apresenta o número de sapatos
vendidos, em um mês qualquer, antes e depois a propaganda.

Depois da
Antes da propaganda
propaganda
Paraná 10,3 mil 13 mil
Santa Catarina 12 mil 11,5 mil
Rio Grande do Sul 9,7 mil 10,2 mil

A 5% de significância, podemos concluir que o investimento em


propagandas contribuiu para o aumento do número de sapatos vendidos?

2 Após um programa de capacitação, foram verificadas as diferenças


na produtividade diária de 8 funcionários: +4, -1, 0, +2, -1, +3, 0, 1. Em
nível de significância de 10% e supondo que as diferenças seguem uma
distribuição normal, podemos dizer que o programa de capacitação
aumentou a produtividade dos funcionários? E a 5% de significância, o
que podemos concluir?

3 Deseja-se saber se 2 máquinas de empacotar erva-mate estão fornecendo


o mesmo peso médio em kg. Para isso extraem-se ao acaso duas amostras,
uma de cada máquina:

Máquina A: 15 amostras, média = 0,51 kg, variância = 0,0020 kg2


Máquina B: 20 amostras, média = 0,48 kg, variância = 0,0135 kg2

Supondo que os pesos amostrais seguem uma distribuição normal,


qual é a sua conclusão a 5% de significância?

4 Com a finalidade de verificar se há diferença entre as vendas de grandes


marcas de cervejas, o dono de uma rede de supermercados registrou o
número de caixas vendidas de 3 marcas concorrentes durante um mês em 5
supermercados de sua rede.

189
Supermercado Marca A Marca B Marca C

1 304 297 348

2 236 482 554

3 134 315 195

4 351 176 410

5 110 273 347

Comparando-as duas a duas, verifique se há diferença significativa


entre essas marcas. Use α = 10%.

5 Para verificar a eficácia de duas rações na engorda de tilápias, realizou-se um


experimento com 20 tilápias, todas com mesmo tempo de vida. As tilápias
foram divididas aleatoriamente em dois grupos: no primeiro grupo, com 8
tilápias, usou-se a ração A; no segundo grupo, as 12 tilápias foram tratadas com
a ração B. No final de um mês encontraram-se as seguintes médias de peso:

Ração A: média = 1,26 kg; variância = 0,0053 kg2


Ração B: média = 1,31 kg; variância = 0,0013 kg2

A 5% de significância, podemos concluir que as rações produzem


efeitos diferentes?

6 Um empresa de ônibus está testando a durabilidade de duas marcas de


pneus. Para isso, testou 8 pneus de cada marca e constatou: para a marca G
uma durabilidade média de 34.100 km e variância 122.650 km2; para a marca
P uma durabilidade média de 32.500 km e variância 100.850 km2. Ao nível de
significância de 1% teste a hipótese de que a durabilidade média dos pneus da
marca G é maior que da marca P (para gl1 = gl2 = 7 e α = 0,005 use Ftab = 8,8854).

7 Em um estudo para verificar se existe relação entre o consumo de cigarro e


a ocorrência de enfisema pulmonar, um hospital selecionou 125 pacientes
ao acaso. De acordo com o quadro de resultados a seguir, podemos concluir
que as ocorrências de enfisema pulmonar e o consumo de cigarros são
independentes? (Use α = 5%.)

Enfisema
Sim Não
Fumantes
Sim 39 29
Não 23 34

190
REFERÊNCIAS
BARBETTA, P. A. Estatística aplicada às ciências sociais. 3. ed. Florianópolis:
Ed. da UFSC, 1999.

BERGE, C. Principles of combinatorics. New York: Academic Press, 1971. v. 72.

BRASIL. Parâmetros Curriculares Nacionais - Ensino Médio (Parte III). Brasília:


MEC, 2000. Disponível em: <http://portal.mec.gov.br/seb/arquivos/pdf/ciencian.
pdf>. Acesso em: 24 mar. 2012.

______. Parâmetros Curriculares Nacionais - Ensino Fundamental


(Matemática). Brasília: MEC, 1997. Disponível em: <http://portal.mec.gov.br/seb/
arquivos/pdf/livro03.pdf>. Acesso em: 24 mar. 2012.

DASSIE, Bruno Alves et al. Curso de análise combinatória e probabilidade:


aprendendo com a resolução de problemas. Rio de Janeiro: Ciência Moderna, 2009.

FONSECA, Jairo S. da; MARTINS, Gilberto de A. Curso de estatística. 6. ed. São


Paulo: Atlas,1996.

GUERRA, M. J.; DONAIRE, D. Estatística intuitiva. 5. ed. São Paulo: LTC, 1991.

HAZZAN, Samuel. Fundamentos de matemática elementar: combinatória,


probabilidade. 7. ed. São Paulo: Atual, 2004.

IEZZI, Gelson; DOLCE, Osvaldo; DEGENSZAJN, David; PÉRIGO, Roberto;


ALMEIDA, Nilze de. Matemática ciência e aplicações. São Paulo: Atual, 2001. v. 2.

LIPSCHUTZ, Seymour. Probabilidade. São Paulo: Markron Books, 1993.

MACHADO, Antonio dos Santos. Matemática, temas e metas. São Paulo: Atual,
1986. v. 3.

MAGALHÃES, Marcos Nascimento; LIMA, Antônio Carlos Pedroso de. Noções


de probabilidade e estatística. 7. ed. São Paulo: Edusp, 2010.

MELLO, Margarida P.; SANTOS, José Plinio O. dos; MURARI, Idani T. C.


Introdução à análise combinatória. 4. ed. Rio de Janeiro: Ciência Moderna, 2007.

MEYER, Paul L. Probabilidade: aplicações à estatística. Rio de Janeiro: LCT,


2000.

MORETTIN, Luiz Gonzaga. Estatística básica: probabilidade e inferência. São


Paulo: Pearson, 2010.
191
MYERS, Raymond H.; WALPOLE, Ronald E. Probabilidade e estatística. São
Paulo: Pearson Education, 2009.

SPIEGEL, Murray R. Probabilidade e estatística. São Paulo: Bookmann, 2004.

VAZQUEZ, Cristiane Maria Roque; MALAGUTTI, Pedro Luiz A. Atividades


experimentais de análise combinatória no ensino médio em uma escola
estadual. In: ENCONTRO DA REDE DE PROFESSORES, PESQUISADORES
E LICENCIANDOS DE FÍSICA E DE MATEMÁTICA, 2., 2009, São Carlos.
Anais... São Carlos: UFSCAR, 2009. Disponível em: <http://www.enrede.ufscar.
br/participantes_arquivos/E5_Vazquez_TA.pdf>. Acesso em: 24 mar. 2012.

192
APÊNDICES
APÊNDICE A
Tabela Z (Normal Padrão)
P(Z<z)

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999

193
APÊNDICE B
Distribuição Qui-Quadrado
P(x2(n–1) ≥ x2tab)=α

gl 0,990 0,950 0,900 0,500 0,100 0,050 0,025 0,010 0,005


1 0,0002 0,0039 0,0158 0,4549 2,7055 3,8415 5,0239 6,6349 7,8794
2 0,0201 0,1026 0,2107 1,3863 4,6052 5,9915 7,3778 9,2103 10,5966
3 0,1148 0,3518 0,5844 2,3660 6,2514 7,8147 9,3484 11,3449 12,8382
4 0,2971 0,7107 1,0636 3,3567 7,7794 9,4877 11,1433 13,2767 14,8603
5 0,5543 1,1455 1,6103 4,3515 9,2364 11,0705 12,8325 15,0863 16,7496
6 0,8721 1,6354 2,2041 5,3481 10,6446 12,5916 14,4494 16,8119 18,5476
7 1,2390 2,1673 2,8331 6,3458 12,0170 14,0671 16,0128 18,4753 20,2777
8 1,6465 2,7326 3,4895 7,3441 13,3616 15,5073 17,5345 20,0902 21,9550
9 2,0879 3,3251 4,1682 8,3428 14,6837 16,9190 19,0228 21,6660 23,5894
10 2,5582 3,9403 4,8652 9,3418 15,9872 18,3070 20,4832 23,2093 25,1882
11 3,0535 4,5748 5,5778 10,3410 17,2750 19,6751 21,9200 24,7250 26,7568
12 3,5706 5,2260 6,3038 11,3403 18,5493 21,0261 23,3367 26,2170 28,2995
13 4,1069 5,8919 7,0415 12,3398 19,8119 22,3620 24,7356 27,6882 29,8195
14 4,6604 6,5706 7,7895 13,3393 21,0641 23,6848 26,1189 29,1412 31,3193
15 5,2293 7,2609 8,5468 14,3389 22,3071 24,9958 27,4884 30,5779 32,8013
16 5,8122 7,9616 9,3122 15,3385 23,5418 26,2962 28,8454 31,9999 34,2672
17 6,4078 8,6718 10,0852 16,3382 24,7690 27,5871 30,1910 33,4087 35,7185
18 7,0149 9,3905 10,8649 17,3379 25,9894 28,8693 31,5264 34,8053 37,1565
19 7,6327 10,1170 11,6509 18,3377 27,2036 30,1435 32,8523 36,1909 38,5823
20 8,2604 10,8508 12,4426 19,3374 28,4120 31,4104 34,1696 37,5662 39,9968
21 8,8972 11,5913 13,2396 20,3372 29,6151 32,6706 35,4789 38,9322 41,4011
22 9,5425 12,3380 14,0415 21,3370 30,8133 33,9244 36,7807 40,2894 42,7957
23 10,1957 13,0905 14,8480 22,3369 32,0069 35,1725 38,0756 41,6384 44,1813
24 10,8564 13,8484 15,6587 23,3367 33,1962 36,4150 39,3641 42,9798 45,5585
25 11,5240 14,6114 16,4734 24,3366 34,3816 37,6525 40,6465 44,3141 46,9279
26 12,1981 15,3792 17,2919 25,3365 35,5632 38,8851 41,9232 45,6417 48,2899
27 12,8785 16,1514 18,1139 26,3363 36,7412 40,1133 43,1945 46,9629 49,6449
28 13,5647 16,9279 18,9392 27,3362 37,9159 41,3371 44,4608 48,2782 50,9934
29 14,2565 17,7084 19,7677 28,3361 39,0875 42,5570 45,7223 49,5879 52,3356
30 14,9535 18,4927 20,5992 29,3360 40,2560 43,7730 46,9792 50,8922 53,6720
31 15,6555 19,2806 21,4336 30,3359 41,4217 44,9853 48,2319 52,1914 55,0027
32 16,3622 20,0719 22,2706 31,3359 42,5847 46,1943 49,4804 53,4858 56,3281
33 17,0735 20,8665 23,1102 32,3358 43,7452 47,3999 50,7251 54,7755 57,6484
34 17,7891 21,6643 23,9523 33,3357 44,9032 48,6024 51,9660 56,0609 58,9639
35 18,5089 22,4650 24,7967 34,3356 46,0588 49,8018 53,2033 57,3421 60,2748
36 19,2327 23,2686 25,6433 35,3356 47,2122 50,9985 54,4373 58,6192 61,5812
37 19,9602 24,0749 26,4921 36,3355 48,3634 52,1923 55,6680 59,8925 62,8833
38 20,6914 24,8839 27,3430 37,3355 49,5126 53,3835 56,8955 61,1621 64,1814
39 21,4262 25,6954 28,1958 38,3354 50,6598 54,5722 58,1201 62,4281 65,4756
40 22,1643 26,5093 29,0505 39,3353 51,8051 55,7585 59,3417 63,6907 66,7660
41 22,9056 27,3256 29,9071 40,3353 52,9485 56,9424 60,5606 64,9501 68,0527
42 23,6501 28,1440 30,7654 41,3352 54,0902 58,1240 61,7768 66,2062 69,3360
43 24,3976 28,9647 31,6255 42,3352 55,2302 59,3035 62,9904 67,4593 70,6159
44 25,1480 29,7875 32,4871 43,3352 56,3685 60,4809 64,2015 68,7095 71,8926
45 25,9013 30,6123 33,3504 44,3351 57,5053 61,6562 65,4102 69,9568 73,1661
50 29,7067 34,7643 37,6886 49,3349 63,1671 67,5048 71,4202 76,1539 79,4900

194
APÊNDICE C
Distribuição t-Student
P(t(n-1) ≥ ttab) = α

gl 0,25 0,10 0,05 0,025 0,01 0,005


1 1,0000 3,0777 6,3137 12,7062 31,8210 63,6559
2 0,8165 1,8856 2,9200 4,3027 6,9645 9,9250
3 0,7649 1,6377 2,3534 3,1824 4,5407 5,8408
4 0,7407 1,5332 2,1318 2,7765 3,7469 4,6041
5 0,7267 1,4759 2,0150 2,5706 3,3649 4,0321
6 0,7176 1,4398 1,9432 2,4469 3,1427 3,7074
7 0,7111 1,4149 1,8946 2,3646 2,9979 3,4995
8 0,7064 1,3968 1,8595 2,3060 2,8965 3,3554
9 0,7027 1,3830 1,8331 2,2622 2,8214 3,2498
10 0,6998 1,3722 1,8125 2,2281 2,7638 3,1693
11 0,6974 1,3634 1,7959 2,2010 2,7181 3,1058
12 0,6955 1,3562 1,7823 2,1788 2,6810 3,0545
13 0,6938 1,3502 1,7709 2,1604 2,6503 3,0123
14 0,6924 1,3450 1,7613 2,1448 2,6245 2,9768
15 0,6912 1,3406 1,7531 2,1315 2,6025 2,9467
16 0,6901 1,3368 1,7459 2,1199 2,5835 2,9208
17 0,6892 1,3334 1,7396 2,1098 2,5669 2,8982
18 0,6884 1,3304 1,7341 2,1009 2,5524 2,8784
19 0,6876 1,3277 1,7291 2,0930 2,5395 2,8609
20 0,6870 1,3253 1,7247 2,0860 2,5280 2,8453
21 0,6864 1,3232 1,7207 2,0796 2,5176 2,8314
22 0,6858 1,3212 1,7171 2,0739 2,5083 2,8188
23 0,6853 1,3195 1,7139 2,0687 2,4999 2,8073
24 0,6848 1,3178 1,7109 2,0639 2,4922 2,7970
25 0,6844 1,3163 1,7081 2,0595 2,4851 2,7874
26 0,6840 1,3150 1,7056 2,0555 2,4786 2,7787
27 0,6837 1,3137 1,7033 2,0518 2,4727 2,7707
28 0,6834 1,3125 1,7011 2,0484 2,4671 2,7633
29 0,6830 1,3114 1,6991 2,0452 2,4620 2,7564
30 0,6828 1,3104 1,6973 2,0423 2,4573 2,7500
40 0,6807 1,3031 1,6839 2,0211 2,4233 2,7045
50 0,6794 1,2987 1,6759 2,0086 2,4033 2,6778
60 0,6786 1,2958 1,6706 2,0003 2,3901 2,6603
120 0,6765 1,2886 1,6576 1,9799 2,3578 2,6174
∞ 0,6745 1,2816 1,6449 1,9600 2,3264 2,5758

195
gl1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 25 30 40 120 ∞
gl2
1 4052,18 4999,34 5403,53 5624,26 5763,96 5858,95 5928,33 5980,95 6022,40 6055,93 6083,40 6106,68 6125,77 6143,00 6156,97 6208,66 6239,86 6260,35 6286,43 6339,51 6365,59
2 98,5019 99,0003 99,1640 99,2513 99,3023 99,3314 99,3568 99,3750 99,3896 99,3969 99,4078 99,4187 99,4223 99,4260 99,4332 99,4478 99,4587 99,4660 99,4769 99,4914 99,4987
3 34,1161 30,8164 29,4567 28,7100 28,2371 27,9106 27,6714 27,4895 27,3449 27,2285 27,1320 27,0520 26,9829 26,9238 26,8719 26,6900 26,5791 26,5045 26,4108 26,2207 26,1252
4 21,1976 17,9998 16,6942 15,9771 15,5219 15,2068 14,9757 14,7988 14,6592 14,5460 14,4523 14,3737 14,3064 14,2486 14,1981 14,0194 13,9107 13,8375 13,7452 13,5583 13,4633
5 16,2581 13,2741 12,0599 11,3919 10,9671 10,6722 10,4556 10,2893 10,1577 10,0511 9,9626 9,8883 9,8248 9,7700 9,7223 9,5527 9,4492 9,3794 9,2912 9,1118 9,0204
6 13,7452 10,9249 9,7796 9,1484 8,7459 8,4660 8,2600 8,1017 7,9760 7,8742 7,7896 7,7183 7,6575 7,6050 7,5590 7,3958 7,2960 7,2286 7,1432 6,9690 6,8800
7 12,2463 9,5465 8,4513 7,8467 7,4604 7,1914 6,9929 6,8401 6,7188 6,6201 6,5381 6,4691 6,4100 6,3590 6,3144 6,1555 6,0579 5,9920 5,9084 5,7373 5,6496
8 11,2586 8,6491 7,5910 7,0061 6,6318 6,3707 6,1776 6,0288 5,9106 5,8143 5,7343 5,6667 5,6089 5,5588 5,5152 5,3591 5,2631 5,1981 5,1156 4,9461 4,8588
9 10,5615 8,0215 6,9920 6,4221 6,0569 5,8018 5,6128 5,4671 5,3511 5,2565 5,1779 5,1115 5,0545 5,0052 4,9621 4,8080 4,7130 4,6486 4,5667 4,3977 4,3106
10 10,0442 7,5595 6,5523 5,9944 5,6364 5,3858 5,2001 5,0567 4,9424 4,8491 4,7716 4,7058 4,6496 4,6008 4,5582 4,4054 4,3111 4,2469 4,1653 3,9965 3,9090
11 9,6461 7,2057 6,2167 5,6683 5,3160 5,0692 4,8860 4,7445 4,6315 4,5393 4,4624 4,3974 4,3416 4,2933 4,2509 4,0990 4,0051 3,9411 3,8596 3,6904 3,6025
12 9,3303 6,9266 5,9525 5,4119 5,0644 4,8205 4,6395 4,4994 4,3875 4,2961 4,2198 4,1553 4,0998 4,0517 4,0096 3,8584 3,7647 3,7008 3,6192 3,4494 3,3608
13 9,0738 6,7009 5,7394 5,2053 4,8616 4,6203 4,4410 4,3021 4,1911 4,1003 4,0245 3,9603 3,9052 3,8573 3,8154 3,6646 3,5710 3,5070 3,4253 3,2547 3,1654

196
14 8,8617 6,5149 5,5639 5,0354 4,6950 4,4558 4,2779 4,1400 4,0297 3,9394 3,8640 3,8002 3,7452 3,6976 3,6557 3,5052 3,4116 3,3476 3,2657 3,0942 3,0040
Distribuição F

15 8,6832 6,3588 5,4170 4,8932 4,5556 4,3183 4,1416 4,0044 3,8948 3,8049 3,7299 3,6662 3,6115 3,5639 3,5222 3,3719 3,2782 3,2141 3,1319 2,9594 2,8684
APÊNDICE D

16 8,5309 6,2263 5,2922 4,7726 4,4374 4,2016 4,0259 3,8896 3,7804 3,6909 3,6162 3,5527 3,4981 3,4506 3,4090 3,2587 3,1650 3,1007 3,0182 2,8447 2,7528
P(Fgl1; gl2 ≥ Ftab) = 0,01

17 8,3998 6,1121 5,1850 4,6689 4,3360 4,1015 3,9267 3,7909 3,6823 3,5931 3,5185 3,4552 3,4007 3,3533 3,3117 3,1615 3,0676 3,0032 2,9204 2,7458 2,6530
18 8,2855 6,0129 5,0919 4,5790 4,2479 4,0146 3,8406 3,7054 3,5971 3,5081 3,4338 3,3706 3,3162 3,2689 3,2273 3,0771 2,9831 2,9185 2,8354 2,6597 2,5660
19 8,1850 5,9259 5,0103 4,5002 4,1708 3,9386 3,7653 3,6305 3,5225 3,4338 3,3596 3,2965 3,2422 3,1949 3,1533 3,0031 2,9089 2,8442 2,7608 2,5839 2,4893
20 8,0960 5,8490 4,9382 4,4307 4,1027 3,8714 3,6987 3,5644 3,4567 3,3682 3,2941 3,2311 3,1769 3,1296 3,0880 2,9377 2,8434 2,7785 2,6947 2,5168 2,4212
25 7,7698 5,5680 4,6755 4,1774 3,8550 3,6272 3,4568 3,3239 3,2172 3,1294 3,0558 2,9931 2,9389 2,8917 2,8502 2,6993 2,6041 2,5383 2,4530 2,2696 2,1694
30 7,5624 5,3903 4,5097 4,0179 3,6990 3,4735 3,3045 3,1726 3,0665 2,9791 2,9057 2,8431 2,7890 2,7418 2,7002 2,5487 2,4526 2,3860 2,2992 2,1108 2,0062
40 7,3142 5,1785 4,3126 3,8283 3,5138 3,2910 3,1238 2,9930 2,8876 2,8005 2,7273 2,6648 2,6107 2,5634 2,5216 2,3689 2,2714 2,2034 2,1142 1,9172 1,8047
60 7,0771 4,9774 4,1259 3,6491 3,3389 3,1187 2,9530 2,8233 2,7185 2,6318 2,5587 2,4961 2,4419 2,3943 2,3523 2,1978 2,0984 2,0285 1,9360 1,7263 1,6006
120 6,8509 4,7865 3,9491 3,4795 3,1735 2,9559 2,7918 2,6629 2,5586 2,4721 2,3990 2,3363 2,2818 2,2339 2,1915 2,0346 1,9325 1,8600 1,7628 1,5330 1,3805
∞ 6,6349 4,6052 3,7816 3,3192 3,0172 2,8020 2,6393 2,5113 2,4073 2,3209 2,2477 2,1847 2,1299 2,0815 2,0385 1,8783 1,7726 1,6964 1,5923 1,3246 1,0000
gl1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 25 30 40 120 ∞
gl2
1 647,789 799,500 864,163 899,583 921,848 937,111 948,217 956,656 963,285 968,627 973,025 976,708 979,837 982,528 984,867 993,103 998,081 1001,41 1005,60 1014,02 1018,26
2 38,5063 39,0000 39,1655 39,2484 39,2982 39,3315 39,3552 39,3730 39,3869 39,3980 39,4071 39,4146 39,4210 39,4265 39,4313 39,4479 39,4579 39,4646 39,4729 39,4896 39,4979
3 17,4434 16,0441 15,4392 15,1010 14,8848 14,7347 14,6244 14,5399 14,4731 14,4189 14,3742 14,3366 14,3045 14,2768 14,2527 14,1674 14,1155 14,0805 14,0365 13,9473 13,9021
4 12,2179 10,6491 9,9792 9,6045 9,3645 9,1973 9,0741 8,9796 8,9047 8,8439 8,7935 8,7512 8,7150 8,6838 8,6565 8,5599 8,5010 8,4613 8,4111 8,3092 8,2573
5 10,0070 8,4336 7,7636 7,3879 7,1464 6,9777 6,8531 6,7572 6,6811 6,6192 6,5678 6,5245 6,4876 6,4556 6,4277 6,3286 6,2679 6,2269 6,1750 6,0693 6,0153
6 8,8131 7,2599 6,5988 6,2272 5,9876 5,8198 5,6955 5,5996 5,5234 5,4613 5,4098 5,3662 5,3290 5,2968 5,2687 5,1684 5,1069 5,0652 5,0125 4,9044 4,8491
7 8,0727 6,5415 5,8898 5,5226 5,2852 5,1186 4,9949 4,8993 4,8232 4,7611 4,7095 4,6658 4,6285 4,5961 4,5678 4,4667 4,4045 4,3624 4,3089 4,1989 4,1423
8 7,5709 6,0595 5,4160 5,0526 4,8173 4,6517 4,5286 4,4333 4,3572 4,2951 4,2434 4,1997 4,1622 4,1297 4,1012 3,9995 3,9367 3,8940 3,8398 3,7279 3,6702
9 7,2093 5,7147 5,0781 4,7181 4,4844 4,3197 4,1970 4,1020 4,0260 3,9639 3,9121 3,8682 3,8306 3,7980 3,7694 3,6669 3,6035 3,5604 3,5055 3,3918 3,3329
10 6,9367 5,4564 4,8256 4,4683 4,2361 4,0721 3,9498 3,8549 3,7790 3,7168 3,6649 3,6209 3,5832 3,5504 3,5217 3,4185 3,3546 3,3110 3,2554 3,1399 3,0798
11 6,7241 5,2559 4,6300 4,2751 4,0440 3,8807 3,7586 3,6638 3,5879 3,5257 3,4737 3,4296 3,3917 3,3588 3,3299 3,2261 3,1616 3,1176 3,0613 2,9441 2,8828

197
12 6,5538 5,0959 4,4742 4,1212 3,8911 3,7283 3,6065 3,5118 3,4358 3,3736 3,3215 3,2773 3,2393 3,2062 3,1772 3,0728 3,0077 2,9633 2,9063 2,7874 2,7249
13 6,4143 4,9653 4,3472 3,9959 3,7667 3,6043 3,4827 3,3880 3,3120 3,2497 3,1975 3,1532 3,1150 3,0819 3,0527 2,9477 2,8821 2,8372 2,7797 2,6590 2,5955
14 6,2979 4,8567 4,2417 3,8919 3,6634 3,5014 3,3799 3,2853 3,2093 3,1469 3,0946 3,0502 3,0119 2,9786 2,9493 2,8437 2,7777 2,7324 2,6742 2,5519 2,4872
15 6,1995 4,7650 4,1528 3,8043 3,5764 3,4147 3,2934 3,1987 3,1227 3,0602 3,0078 2,9633 2,9249 2,8915 2,8621 2,7559 2,6894 2,6437 2,5850 2,4611 2,3953
APÊNDICE E
Distribuição F

16 6,1151 4,6867 4,0768 3,7294 3,5021 3,3406 3,2194 3,1248 3,0488 2,9862 2,9337 2,8890 2,8506 2,8170 2,7875 2,6808 2,6138 2,5678 2,5085 2,3831 2,3163
P(Fgl1; gl2 ≥ Ftab) = 0,025

17 6,0420 4,6189 4,0112 3,6648 3,4379 3,2767 3,1556 3,0610 2,9849 2,9222 2,8696 2,8249 2,7863 2,7526 2,7230 2,6158 2,5484 2,5020 2,4422 2,3153 2,2474
18 5,9781 4,5597 3,9539 3,6083 3,3820 3,2209 3,0999 3,0053 2,9291 2,8664 2,8137 2,7689 2,7302 2,6964 2,6667 2,5590 2,4912 2,4445 2,3842 2,2558 2,1869
19 5,9216 4,5075 3,9034 3,5587 3,3327 3,1718 3,0509 2,9563 2,8801 2,8172 2,7645 2,7196 2,6808 2,6469 2,6171 2,5089 2,4408 2,3937 2,3329 2,2032 2,1333
20 5,8715 4,4613 3,8587 3,5147 3,2891 3,1283 3,0074 2,9128 2,8365 2,7737 2,7209 2,6758 2,6369 2,6030 2,5731 2,4645 2,3959 2,3486 2,2873 2,1562 2,0853
25 5,6864 4,2909 3,6943 3,3530 3,1287 2,9685 2,8478 2,7531 2,6766 2,6135 2,5603 2,5149 2,4756 2,4413 2,4110 2,3005 2,2303 2,1816 2,1183 1,9811 1,9055
30 5,5675 4,1821 3,5894 3,2499 3,0265 2,8667 2,7460 2,6513 2,5746 2,5112 2,4577 2,4120 2,3724 2,3378 2,3072 2,1952 2,1237 2,0739 2,0089 1,8664 1,7867
40 5,4239 4,0510 3,4633 3,1261 2,9037 2,7444 2,6238 2,5289 2,4519 2,3882 2,3343 2,2882 2,2481 2,2130 2,1819 2,0677 1,9943 1,9429 1,8752 1,7242 1,6371
60 5,2856 3,9253 3,3425 3,0077 2,7863 2,6274 2,5068 2,4117 2,3344 2,2702 2,2159 2,1692 2,1286 2,0929 2,0613 1,9445 1,8687 1,8152 1,7440 1,5810 1,4821
120 5,1523 3,8046 3,2269 2,8943 2,6740 2,5154 2,3948 2,2994 2,2217 2,1570 2,1021 2,0548 2,0136 1,9773 1,9450 1,8249 1,7462 1,6899 1,6141 1,4327 1,3104
∞ 5,0239 3,6889 3,1161 2,7858 2,5665 2,4082 2,2875 2,1918 2,1136 2,0483 1,9927 1,9447 1,9027 1,8656 1,8326 1,7085 1,6259 1,5660 1,4835 1,2684 1,0000
gl1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 25 30 40 120 ∞
gl2
1 161,446 199,499 215,707 224,583 230,160 233,988 236,767 238,884 240,543 241,882 242,981 243,905 244,690 245,363 245,949 248,016 249,260 250,096 251,144 253,254 254,317
2 18,5128 19,0000 19,1642 19,2467 19,2963 19,3295 19,3531 19,3709 19,3847 19,3959 19,4050 19,4125 19,4188 19,4243 19,4291 19,4457 19,4557 19,4625 19,4707 19,4873 19,4957
3 10,1280 9,5521 9,2766 9,1172 9,0134 8,9407 8,8867 8,8452 8,8123 8,7855 8,7633 8,7447 8,7286 8,7149 8,7028 8,6602 8,6341 8,6166 8,5944 8,5494 8,5265
4 7,7086 6,9443 6,5914 6,3882 6,2561 6,1631 6,0942 6,0410 5,9988 5,9644 5,9358 5,9117 5,8911 5,8733 5,8578 5,8025 5,7687 5,7459 5,7170 5,6581 5,6281
5 6,6079 5,7861 5,4094 5,1922 5,0503 4,9503 4,8759 4,8183 4,7725 4,7351 4,7040 4,6777 4,6552 4,6358 4,6188 4,5581 4,5209 4,4957 4,4638 4,3985 4,3650
6 5,9874 5,1432 4,7571 4,5337 4,3874 4,2839 4,2067 4,1468 4,0990 4,0600 4,0274 3,9999 3,9764 3,9559 3,9381 3,8742 3,8348 3,8082 3,7743 3,7047 3,6689
7 5,5915 4,7374 4,3468 4,1203 3,9715 3,8660 3,7871 3,7257 3,6767 3,6365 3,6030 3,5747 3,5503 3,5292 3,5107 3,4445 3,4036 3,3758 3,3404 3,2674 3,2298
8 5,3176 4,4590 4,0662 3,8379 3,6875 3,5806 3,5005 3,4381 3,3881 3,3472 3,3129 3,2839 3,2590 3,2374 3,2184 3,1503 3,1081 3,0794 3,0428 2,9669 2,9276
9 5,1174 4,2565 3,8625 3,6331 3,4817 3,3738 3,2927 3,2296 3,1789 3,1373 3,1025 3,0729 3,0475 3,0255 3,0061 2,9365 2,8932 2,8637 2,8259 2,7475 2,7067
10 4,9646 4,1028 3,7083 3,4780 3,3258 3,2172 3,1355 3,0717 3,0204 2,9782 2,9430 2,9130 2,8872 2,8647 2,8450 2,7740 2,7298 2,6996 2,6609 2,5801 2,5379
11 4,8443 3,9823 3,5874 3,3567 3,2039 3,0946 3,0123 2,9480 2,8962 2,8536 2,8179 2,7876 2,7614 2,7386 2,7186 2,6464 2,6014 2,5705 2,5309 2,4480 2,4045
12 4,7472 3,8853 3,4903 3,2592 3,1059 2,9961 2,9134 2,8486 2,7964 2,7534 2,7173 2,6866 2,6602 2,6371 2,6169 2,5436 2,4977 2,4663 2,4259 2,3410 2,2962
13 4,6672 3,8056 3,4105 3,1791 3,0254 2,9153 2,8321 2,7669 2,7144 2,6710 2,6346 2,6037 2,5769 2,5536 2,5331 2,4589 2,4123 2,3803 2,3392 2,2524 2,2064

198
14 4,6001 3,7389 3,3439 3,1122 2,9582 2,8477 2,7642 2,6987 2,6458 2,6022 2,5655 2,5342 2,5073 2,4837 2,4630 2,3879 2,3407 2,3082 2,2663 2,1778 2,1307
15 4,5431 3,6823 3,2874 3,0556 2,9013 2,7905 2,7066 2,6408 2,5876 2,5437 2,5068 2,4753 2,4481 2,4244 2,4034 2,3275 2,2797 2,2468 2,2043 2,1141 2,0658
APÊNDICE F
Distribuição F

16 4,4940 3,6337 3,2389 3,0069 2,8524 2,7413 2,6572 2,5911 2,5377 2,4935 2,4564 2,4247 2,3973 2,3733 2,3522 2,2756 2,2272 2,1938 2,1507 2,0589 2,0096
P(Fgl1; gl2 ≥ Ftab) = 0,05

17 4,4513 3,5915 3,1968 2,9647 2,8100 2,6987 2,6143 2,5480 2,4943 2,4499 2,4126 2,3807 2,3531 2,3290 2,3077 2,2304 2,1815 2,1477 2,1040 2,0107 1,9604
18 4,4139 3,5546 3,1599 2,9277 2,7729 2,6613 2,5767 2,5102 2,4563 2,4117 2,3742 2,3421 2,3143 2,2900 2,2686 2,1906 2,1413 2,1071 2,0629 1,9681 1,9168
19 4,3808 3,5219 3,1274 2,8951 2,7401 2,6283 2,5435 2,4768 2,4227 2,3779 2,3402 2,3080 2,2800 2,2556 2,2341 2,1555 2,1057 2,0712 2,0264 1,9302 1,8780
20 4,3513 3,4928 3,0984 2,8661 2,7109 2,5990 2,5140 2,4471 2,3928 2,3479 2,3100 2,2776 2,2495 2,2250 2,2033 2,1242 2,0739 2,0391 1,9938 1,8963 1,8432
25 4,2417 3,3852 2,9912 2,7587 2,6030 2,4904 2,4047 2,3371 2,2821 2,2365 2,1979 2,1649 2,1362 2,1111 2,0889 2,0075 1,9554 1,9192 1,8718 1,7684 1,7110
30 4,1709 3,3158 2,9223 2,6896 2,5336 2,4205 2,3343 2,2662 2,2107 2,1646 2,1256 2,0921 2,0630 2,0374 2,0148 1,9317 1,8782 1,8409 1,7918 1,6835 1,6223
40 4,0847 3,2317 2,8387 2,6060 2,4495 2,3359 2,2490 2,1802 2,1240 2,0773 2,0376 2,0035 1,9738 1,9476 1,9245 1,8389 1,7835 1,7444 1,6928 1,5766 1,5089
60 4,0012 3,1504 2,7581 2,5252 2,3683 2,2541 2,1665 2,0970 2,0401 1,9926 1,9522 1,9174 1,8870 1,8602 1,8364 1,7480 1,6902 1,6491 1,5943 1,4673 1,3893
120 3,9201 3,0718 2,6802 2,4472 2,2899 2,1750 2,0868 2,0164 1,9588 1,9105 1,8693 1,8337 1,8026 1,7750 1,7505 1,6587 1,5980 1,5543 1,4952 1,3519 1,2539
∞ 3,8414 2,9957 2,6049 2,3719 2,2141 2,0986 2,0096 1,9384 1,8799 1,8307 1,7886 1,7522 1,7202 1,6918 1,6664 1,5705 1,5061 1,4591 1,3940 1,2214 1,0000
ANOTAÇÕES

____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________

199
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
200

Você também pode gostar