Você está na página 1de 209

ESTATÍSTICA

TEORIA E APLICAÇÕES

90

80

70

60

50

40

30

20

10

PROF. DR. WALTER PAULETTE


PREFÁCIO
OBJETIVOS GERAIS

A estatística desempenha papel importante em quase todas as fases da pesquisa de


trabalhos acadêmicos.

O objetivo da Estatística, Teoria e Aplicações, é apresentar uma introdução à estatística


para alunos do curso de Administração, Ciências contábeis e Economia, que estejam cursando
pela primeira vez a disciplina. Foi planejado para ser utilizado com livro texto de um curso
regular de estatística.

Como estratégia de ensino e aprendizagem usamos a metodologia de ensino


aprendizagem via resolução de problemas, a qual foi considerada parte integrante da disciplina.
Inserimos numerosos exemplos, espalhados por todos os capítulos e exercícios de aplicação.

CONTEUDO DOS CAPÍTULOS

Capítulo 1: Estatística descritiva

Esse capítulo trata da análise da distribuição de frequência nas variáveis discreta e


contínua. Estuda as medidas de tendência central, de dispersão e gráficos, levando o estudante a
compreender e manusear cálculos estatísticos.

Capítulo 2,3 e 4: Análise combinatória, probabilidade e teorema de Bayes

Aqui são apresentadas as noções de Combinatória, probabilidades e o teorema de Bayes,


com suas aplicações.

Capítulo 5: Distribuição Binomial e de Poisson

Estudamos neste capítulo as distribuições de probabilidade discretas, Bernoulli,


Binomial e Poisson.

Capítulo 6: Distribuição normal ou de Gauss

Neste capítulo apresentamos o modelo fundamental na teoria das probabilidades e na


inferência estatística que é a distribuição normal ou Gaussiana.

Capítulo 7: Variável aleatória

Estudamos aqui as distribuições de probabilidade definidas por expressões matemáticas


na variável discreta e contínua. Estão novamente presentes as noções de média ou esperança e
variância.

Capítulo 8: Estimação por intervalos

São tratadas aqui as estimativas de intervalos de confiança para a média populacional,


conhecendo ou não o desvio padrão populacional.
Capítulo 9: Testes de significância ou testes de hipótese

Neste capítulo discutimos quando se faz uma determinada afirmação sobre um


parâmetro da população e desejamos saber os resultados experimentais provenientes de uma
amostra contrária ou não a tal afirmação.

Capítulo 10: Ajustamento de curvas: Regressão linear e correlação

Estudamos como a variação de uma grandeza acarreta a variação da outra.

Comentários e sugestões.

Apesar dos nossos melhores esforços é inevitável que surjam erros no texto. Assim, são
bem-vindas as comunicações de correções e sugestões.

Os leitores podem encaminhar as críticas e sugestões para walterpaulette@uol.com.br

ESTATÍSTICA TEORIA E APLICAÇÕES


SOBRE O AUTOR

Walter Paulette, licenciado e bacharel em matemática pela Pontifícia Universidade de São


Paulo, (PUC-SP), mestre em matemática pela PUC-SP e doutorado pela UNESP de Rio Claro.
Professor titular pela ESAGS, Escola Superior de Administração e Gestão de Santo André e
Fatec São Paulo.

BIBLIOGRAFIA

1) BUSSAB, W. de O.; MORETTIN, P. A. Estatística Básica, 5a. ed. São Paulo:


Saraiva, 2004.

2) LEVIN, J. e FOX, J.A. Estatística para Ciências Humanas. 9ª. Edição. São Paulo
Pearson-Prentice Hall.

3) LEVINE, D. M., BERENSON, M. L. STEPHAN, D. Estatística: Teoria e


Aplicações. 3ª. ed. Rio de Janeiro: LTC.2005

4) ANDERSON, D.R.;SWEENEY,D.J.;WILLIANS, T. A. Estatística Aplicada à


Economia e Administração. 2ª ed. São Paulo: Pioneira Thomson Learning.2002

5) KAZMIER, Leonard. Estatística Aplicada à Economia e Administração. São Paulo:


McGraw Hill.1982.

6) MARTINS, G.A. Estatística Geral e Aplicada. 2a. Ed. São Paulo: Editora Atlas.
2002.
CAPÍTULO 1
ESTATÍSTICA DESCRITIVA

1. Dados históricos
Podemos considerar a Estatística como a ciência que se preocupa com a organização, descrição, análise
e interpretação dos dados experimentais.
Essa conceituação é absolutamente geral e engloba o conceito usual do que seja a Estatística. Esse
conceito usual e popular relaciona a Estatística com tabelas e gráficos nos quais os dados experimentalmente
obtidos são representados. Exemplos: Estatística do movimento da Bolsa de Valores; estatística da loteria
esportiva; estatística da Saúde Púbica: Crescimento do número de infectados pela gripe suína, acidentes de
transito com vítimas nas estradas Estaduais; estatística do crescimento da população nos estados; estatística
do movimento bancário; cheques devolvidos; cheques sem fundo; tabelas do campeonato de futebol; pesquisa
eleitoral, etc.

Essa noção refere-se apenas à parte de organização e descrição dos dados observados. Há ainda um
campo de atuação da ciência Estatística que é a análise e interpretação desses dados.

Desde a antiguidade observa-se a utilização da Estatística para descrever em números as condições


econômicas, na agricultura, na indústria e no comércio. Assim, se lê no livro sagrado de Confúcio (551 a.C. a
479 a.C.) (CHOUKING).
No quarto livro de Moisés, chamado NÚMEROS, Moisés faz o recenseamento de todas as tribos de
Israel, no deserto de Sinai, isso ocorreu após dois anos da saída do Egito (Cap. 1, vs. 1 a 46).
O imperador romano César Augusto ordenou o recenseamento em todo império romano no ano de
nascimento de Jesus. Portanto, podemos dizer que na antiguidade a Estatística preocupava-se com Registro dos
dados, é uma Estatística Administrativa, pois ela se interessava em contar o número de homens aptos para a
guerra e de produtos agropecuários.
A palavra estatística é derivada da palavra latina “STATUS”, com o significado de Estado, Governo,
atribuindo o significado “Ciência das coisas que pertencem ao Estado”.

Como disciplina autônoma ela aparece no século XVII na Alemanha, tendo como objeto a descrição das
coisas notáveis do estado. Para essa autonomia muito contribuiu o alemão Herman Conring (1606-1681)
introduzindo a estatística com disciplina na Universidade de Helmstadt. Na Inglaterra surgem os chamados
Aritméticos políticos, denominação atribuída a William Petty, aos que tinham interesse especial pelas tabelas de
mortalidades em virtude de suas aplicações nos seguros de vida.

Na França desenvolve-se a partir do século XVII, o cálculo de probabilidades como disciplina científica.
Sua origem atribui-se a questões postas a Blaise Pascal (1623-1662) por Cavaleiro de Nére, para alguns autores
1
jogador inveterado, para outros um filósofo e homem de letras. Mas a maior contribuição aparece nas cartas
entre Pascal e Pierre Fermat (1601-1665) em que ambos chegam a uma solução correta do problema dos jogos
de azar.

Foi Jacques Bernoulli (1654-1705) que aperfeiçoou a teoria das probabilidades escrevendo a sua grande
obra “Ars Conjectandi”, publicada oito anos após sua morte. Pode-se dizer que foi devido as contribuições de
Bernoulli que o cálculo de probabilidades adquiriu o estatus de ciência.

São fundamentais as contribuições de Pierre Laplace (1749-1827) com as publicações da “Teoria


Analítica da Probabilidade” e a definição clássica da probabilidade (Quociente entre o número de casos
favoráveis e o número de casos possíveis). Gauss (1777-1855) apresentou em 1809 a “Theoria Combinationis
Observatorium Erroribus Minimis Obnoxia” que mostra uma teoria sobre a análise de observações, que pode ser
aplicável a qualquer ramo da ciência.

Podemos citar outros grandes estatísticos como: Francis Galton (1822-1911) da escola de estatística
inglesa que criou a teoria da regressão linear. Karl Pearson (1857-1936) físico matemático dedicou-se a teoria
da correlação. Ronald Aylmer Fisher, suas contribuições para a moderna estatística são as mais importantes de
todas, sendo a figura de maior destaque de todos os tempos, desenvolveu e estruturou de forma rigorosa a
Teoria da Inferência Estatística. William S. Gosset, com pseudônimo de “Student”, devido ao fato de trabalhar
para uma fábrica de cerveja , desenvolveu em 1908 a Teoria da Amostragem

Assim, podemos dizer que a estatística atual passou a ter um caráter mais científico, deixou de ser uma
simples técnica de coleta de dados e de apresentação de dados, para se tornar um ramo de conhecimento
humano que procura tirar conclusões a partir de fatos numéricos de observação.

São muitas as definições de Estatística, citamos aqui algumas:

 A Estatística é a parte da Matemática Aplicada que se preocupa em obter conclusões a partir de


dados observados”. (Rui Aguiar da Silva Leme).
 A Estatística é o estudo numérico dos fatos sociais”. (Levasser)
 Conjunto de processos que tem por objetivo a observação, a classificação formal e a análise dos
fenômenos coletivos ou de massa e, por fim, a indução das leis a que tais fenômenos obedecem
globalmente”. (Milton da Silva Rodrigues)
 É um ramo da Matemática Aplicada e pode ser considerada como a Matemática Aplicada a
dados observados” (R. A. Fisher)
 A Estatística é a coleta, apresentação, análise e interpretação de dados numéricos”. (Croxton e
Cowden)

2
Assim, podemos concluir que a Estatística é ciência, quando estuda populações e é método, quando
serve de instrumento a uma outra ciência.

Existem três ramos da estatística:

 A estatística descritiva;
 O cálculo das probabilidades e
 Inferência estatística.
É importante enfatizar que a estatística descritiva começou antes do aparecimento do cálculo das
probabilidades, sendo seu estudo concebível sem os conceitos probabilísticos. As probabilidades são
ferramentas para a inferência estatística. A inferência estatística é interpretada de duas maneiras:
 ou fazendo uma estimação a respeito de uma característica da população cujo o valor se desconhece;
 ou realizando um teste sobre essa característica, da qual se afirma ter um determinado valor.
São três áreas de interesses para a estatística:

a) descrição e resumo de dados,

b) teoria da probabilidade e

c) análise e interpretação de dados.

Essas três áreas da estatística não são separadas ou distintas, ao contrário, elas tendem a se entrelaçar.

2. Ramos da Estatística

2.1. Estatística descritiva


A palavra estatística lembra sempre: taxas mensais de acidentes, índices de mortalidade infantil por
estados, consumo de combustível por quilômetro rodado, etc. Essa parte da estatística que utiliza números para
descrever fatos é chamada estatística descritiva.
Estatística descritiva é o ramo da estatística que envolve a organização, o resumo e a representação dos
dados.

2.2. Probabilidade

O conhecimento das probabilidades associadas a uma situação fornece a base para o desenvolvimento
das técnicas de tomada de decisão, explica o funcionamento dessas técnicas e indica de que modo as conclusões
podem ser apresentadas e interpretadas corretamente.

2.3. Inferência estatística

Consiste em métodos que generalizam para a população, aquilo que se observa na amostra.
A palavra inferência é utilizada em Estatística com dois significados:
 conclusões tiradas a partir de valores ou de evidências;
 processo utilizado para se chegar a essas conclusões.

3
3. População – Amostra

Se a estatística se preocupa com registro de fatos, então a população tem o significado de conjunto dos
habitantes de uma determinada região. Modernamente população é qualquer coleção de objetos, seres ou entes
que apresentam pelo menos uma característica em comum.

Exemplo 1:
 Vazão do rio Tietê de 1950 a 2015;
 Acidentes da Via Dutra de 2000 a 2015;
 Inflação brasileira de 1995 a 2015;
 Notas de Matemática dos alunos do Ensino médio.
 Medidas das alturas dos alunos de uma faculdade.

A população pode ter um número finito de elementos ou ter um número ilimitado, isto é, população
infinita.
Quando se estuda uma população com um número muito grande de elementos, somos obrigados a
examinar uma parte, a amostra.
Entendemos por amostra, parte da população retirada segundo uma regra conveniente, probabilística ou
aleatória. A amostra é sempre finita.
Uma pesquisa que estuda todos os membros de uma população denomina-se censo e quando se toma
uma parcela da população denomina-se pesquisa por amostragem.
A seguir mostramos um exemplo de fenômeno aleatório. A figura que segue mostra esferas de mesmo
diâmetro, caindo de um reservatório superior e passando por uma série de obstáculos, que em cada obstáculo a
probabilidade da esfera se desviar para a esquerda ou para a direita é 1/2. As esferas são colhidas em
reservatório abaixo e observa-se que elas se acumulam na parte central e tornam-se mais raras nas
extremidades.
O gráfico observado tem a forma de um sino, com a boca voltada para baixo. A essa distribuição
denominamos de Distribuição Normal ou de Gauss. (Figura 1)

Figura 1
4
Exemplos de retirada de amostras de uma população por meio da tabela de números aleatórios.
Exemplo 2:
Um candidato a prefeito de uma Capital contrata uma empresa de pesquisa de dados para avaliar sua
posição entre os candidatos, a quinze dias das eleições. Sabemos que a população da Capital é formada por
milhões de eleitores e como o órgão de pesquisa trabalha com tempo e recursos econômicos limitados, ele não
estuda individualmente todos os eleitores do município e sim uma amostra, que deve ser retirada
convenientemente da população e que apresente as mesmas informações da população. Assim, se o candidato A
é o preferido por 40% dos eleitores da amostra, isso equivale a ser também o preferido por 40% da população.
Para essa pesquisa, os eleitores são consultados aleatoriamente por meio de sorteios de bairros, ruas, casas e
classes sociais A, B, C, D e E. Para retirar uma amostra de uma população aleatoriamente, usamos a tábua de
números Aleatórios ou Randômicos, a expressão números Randômicos provém da palavra inglesa random que
significa “casual, aleatório”. A tabela 1 é parte de uma tabela de números aleatórios.

Tabela 1 TABELA DE NÚMEROS ALEATÓRIOS

575 862 053 359 191 045 078 892 944 508 844 129

063 558 334 157 151 189 770 246 377 362 560 634

666 181 029 348 396 735 984 632 383 737 532 259

387 297 267 470 545 549 719 531 099 784 959 438

716 262 928 273 326 161 742 884 879 184 627 953

931 443 459 268 505 364 789 838 178 892 645 618

087 370 911 952 595 863 589 024 276 605 317 913

285 852 975 574 503 355 339 907 655 998 807 058

283 133 568 029 147 973 759 205 690 763 953 361

919 386 487 101 360 500 001 045 364 436 862 234

374 415 513 773 874 046 443 549 905 554 962 432

903 090 386 175 422 490 435 185 447 429 756 170

813 435 050 845 473 381 242 597 581 435 931 122

845 507 797 223 001 740 233 067 235 969 218 915

5
102 184 165 787 207 250 416 874 144 175 850 230

092 829 185 336 538 837 596 690 702 096 328 284

737 467 011 721 389 114 950 528 794 431 632 741

076 069 066 346 180 043 526 035 712 099 962 866

292 571 795 223 885 774 366 679 414 386 928 425

052 614 848 560 449 017 870 690 721 335 499 249

Exemplo 3:

O professor de Educação Física do Ensino Médio faz uma pesquisa para estudar as alturas de seus
alunos do sexo masculino, envolvendo 999 alunos e deseja retirar uma amostra de 100 alunos seguindo a tabela
de números aleatórios.
Para construirmos essa amostra, podemos numerar os 999 alunos, atribuindo a cada aluno um número de
três dígitos como os da sequência: 001, 002, 003, ... , 998 e 999. Para a escolha dos 100 elementos dentre os
999 alunos, podemos iniciar a consulta à tabela dos números aleatórios a partir de qualquer número da tabela
randômica, por exemplo: tomamos três a três os números a partir do número 884 que está na quinta linha e na
oitava coluna, e em seguida tomamos a medida da altura dos alunos cujos números são: 879; 184; 627; 953;
931; 443;..., até o encontrarmos o centésimo aluno. Assim, retiramos de uma população de 999 elementos uma
amostra de 100 elementos, de maneira aleatória, por meio da tabela de números randômicos. Se a população é
maior ou menor que 999 elementos, desenvolvemos um novo processo para a retirada da amostra.

Exemplo 4:
Retirar da população da tabela 2 uma amostra de 100 elementos, por meio de amostragem simples ao
acaso, consultando a tabela 1 de números aleatórios. Por exemplo, inicie a retirada dos números começando
pelo número aleatório da tabela, localizado na sexta linha, primeira coluna, número (931) em seguida 443 e
sempre três a três.

Tabela 2

8,8 15,6 15,3 12,7 5,9 3,3 3,5 7,2 16,7 14,7

7,7 13,4 15,5 14,5 7,0 10,8 11,8 2,7 3,8 9,0

11,6 9,5 8,6 7,0 7,5 10,9 7,2 9,5 8,4 12,9

14,9 4,1 13,1 10,6 17,0 4,2 3,8 10,6 4,5 11,8

6,4 8,4 7,3 13,1 16,5 5,5 15,3 13,7 9,7 11,5

11,2 9,6 8,8 11,7 3,1 6,5 1,9 6,9 10,2 8,3

6
16,0 7,5 8,6 9,0 6,9 12,4 6,4 11,9 3,5 5,1

16,6 6,1 8,7 3,9 11,2 8,5 9,4 5,7 12,4 11,6

9,2 10,9 8,4 3,8 7,6 2,2 10,0 2,7 6,9 8,5

12,9 8,1 9,4 7,8 17,0 12,1 9,4 4,7 9,0 11,2

13,8 16,4 14,3 5,9 9,8 9,8 7,7 8,7 6,8 10,7

9,1 5,1 16,7 6,2 14,4 14,0 9,8 10,5 9,3 7,8

12,3 13,2 6,5 4,1 11,8 5,3 14,4 10,9 14,2 7,2

10,0 14,1 8,6 7,9 6,8 14,7 12,2 10,0 2,0 3,5

5,5 13,1 15,1 5,1 10,6 8,3 6,3 12,2 15,1 5,5

14,0 7,6 16,6 2,6 8,4 5,7 9,9 9,9 9,0 13,7

16,6 6,3 3,2 10,8 5,8 3,7 14,0 11,3 16,8 9,7

8,7 6,4 8,1 10,7 8,3 10,2 11,7 7,9 11,8 10,5

11,2 5,9 5,2 15,7 10,2 2,2 10,7 9,0 4,7 10,3

2,8 11,4 11,1 3,0 7,9 12,0 6,9 12,2 14,0 9,8

Resolução:
Os números aleatórios na tabela 1 foram colocados de três em três algarismos para facilitar nossa
visualização. No exemplo 3 a tabela 2 é formada por 200 números. Devemos transformar essa tabela 2 em 1000
números para corresponder aos elementos da tabela de números randômicos. Para isso adotamos que cada
número dado na tabela 2 seja considerado como 5 números iguais. Por exemplo, o primeiro número da tabela é
8,8 deve ser considerado como 8,8 – 8,8 – 8,8 – 8,8 – 8,8. Dessa forma passaremos a ter 1000 números. A
tabela a seguir indica esses números.
Tabela 3

De 01-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50

0 8,8 15,6 15,3 12,7 5,9 3,3 3,5 7,2 16,7 14,7

50 7,7 13,4 15,5 14,5 7,0 10,8 11,8 2,7 3,8 9,0

100 11,6 9,5 8,6 7,0 7,5 10,9 7,2 9,5 8,4 12,9

150 14,9 4,1 13,1 10,6 17,0 4,2 3,8 10,6 4,5 11,8

200 6,4 8,4 7,3 13,1 16,5 5,5 15,3 13,7 9,7 11,5

250 11,2 9,6 8,8 11,7 3,1 6,5 1,9 6,9 10,2 8,3

7
300 16,0 7,5 8,6 9,0 6,9 12,4 6,4 11,9 3,5 5,1

350 16,6 6,1 8,7 3,9 11,2 8,5 9,4 5,7 12,4 11,6

400 9,2 10,9 8,4 3,8 7,6 2,2 10,0 2,7 6,9 8,5

450 12,9 8,1 9,4 7,8 17,0 12,1 9,4 4,7 9,0 11,2

500 13,8 16,4 14,3 5,9 9,8 9,8 7,7 8,7 6,8 10,7

550 9,1 5,1 16,7 6,2 14,4 14,0 9,8 10,5 9,3 7,8

600 12,3 13,2 6,5 4,1 11,8 5,3 14,4 10,9 14,2 7,2

650 10,0 14,1 8,6 7,9 6,8 14,7 12,2 10,0 2,0 3,5

700 5,5 13,1 15,1 5,1 10,6 8,3 6,3 12,2 15,1 5,5

750 14,0 7,6 16,6 2,6 8,4 5,7 9,9 9,9 9,0 13,7

800 16,6 6,3 3,2 10,8 5,8 3,7 14,0 11,3 16,8 9,7

850 8,7 6,4 8,1 10,7 8,3 10,2 11,7 7,9 11,8 10,5

900 11,2 5,9 5,2 15,7 10,2 2,2 10,7 9,0 4,7 10,3

950 2,8 11,4 11,1 3,0 7,9 12,0 6,9 12,2 14,0 9,8

Portanto, os 100 números que seguem foram retirados aleatoriamente e são os dados brutos.

10,7 6,9 8,1 8,8 13,8 8,7 9,9 11,3 4,2 11,8
14,2 4,1 2,7 9,0 5,2 2,8 6,8 8,1 10,5 5,9
6,5 12,3 9,0 5,2 1,9 8,7 7,9 14,4 13,8 16,6
11,9 5,9 10,0 9,8 6,3 13,4 1,9 7,2 6,2 3,3
12,9 7,9 7,6 6,4 10,0 16,6 2,8 8,6 15,7 5,7
4,7 11,6 6,1 11,2 8,8 16,7 8,7 2,7 3,2 15,3
11,9 8,4 14,3 8,3 14,7 9,0 10,7 11,2 9,1 11,1
10,0 11,2 2,7 11,9 17,0 7,6 4,7 17,0 3,8 8,5
2,2 7,6 10,6 3,2 10,0 14,7 16,8 17,0 9,4 9,7
7,8 9,8 10,0 10,7 7,5 16,8 5,1 13,7 16,5 8,4
Tabela 4

8
4. Tipos de Variáveis
Em Estatística variável é uma atribuição de um número a cada característica da unidade de observação,
ou seja, é uma função matemática definida na população ou ainda, uma variável corresponde a uma
característica de um item ou de um individuo.
As variáveis são classificadas como qualitativas e quantitativas.
4.1. Variável qualitativa
Quando uma característica ou variável é não numérica, denomina-se variável qualitativa ou atributo.
Exemplo 5: São variáveis qualitativas: sexo, religião, naturalidade, cor dos olhos e faixa etária.

4.2. Variável quantitativa

Quando uma característica ou uma variável é numérica, denomina-se variável quantitativa.


As variáveis quantitativas se classificam em dois grupos:

4.2.1. Variáveis discretas

a) As variáveis quantitativas discretas são aquelas cujos possíveis valores formam um conjunto finito
ou enumerável de números que resultam frequentemente de contagem.
Exemplo 6:

a) Quantidade de alunos de uma disciplina.


b) Quantidade de apartamentos de um prédio.
c) O número de crianças em uma família.
4.2.2. Variáveis contínuas
As variáveis cujos valores pertencem a um intervalo de números reais e que resultam frequentemente
de medidas, são denominadas variáveis quantitativas contínuas.

Exemplo 7:
a) Tempo de duração das provas de matemática.
b) Tempo duração de baterias de carros.
c) As alturas dos alunos de uma classe da disciplina de Estatística.

Nas Variáveis contínuas quando feitas por medidas, por exemplo, as alturas dos alunos, e dependendo
da unidade de medida podemos obter 1,65 m, ou 165,2cm ou 1652,7mm conforme a precisão da medida.

4.3. Níveis de mensuração e escalas de mensuração

São quatro os níveis de mensuração: Nominal, ordinal, intervalar e de razão.

9
1) Escala nominal de mensuração envolve simplesmente o ato de nomear ou rotular, não esta explícito nenhum
tipo de classificação.
Exemplo 8:
a) Possui computador: sim ___ não____.
b) Sexo: masculino ____ feminino ____.
c) Religião: católica ____ crente _____.
d) Estado civil: casado ____ solteiro___.

2) Escala ordinal de mensuração ocorre quando se procura ordenar seus elementos ou classificar.
Exemplo 9:
a) Classificação sócio econômica: Classe baixa, classe média e classe alta.
b) Satisfação de um produto: Insatisfeito, satisfeito e muito satisfeito.
c) Classificação docente: Assistente e titular.

3) Escala intervalar consiste numa escala ordenada a qual podemos afirmar se uma medida é igual ou diferente,
maior e quanto maior que outra, mas não tem origem.
Exemplo 10:
a) Temperatura de um indivíduo: [36C°, 40C°].
b) Temperatura da cidade de São Paulo: [12C° a 30C°].

4) Escala de razão é uma escala ordenada que envolve medidas nessa escala. Se for medida em cm tem-se o 0
(zero) como origem e a unidade 1 cm. Tem origem fixa.
Exemplo 11:
a) Altura dos alunos em cm.
b) Peso dos alunos em Kg.
c) Idade em anos.
d) Salários dos funcionários da faculdade.

5. Distribuições de frequência na variável discreta

5.1. Dados brutos

Dados brutos são aqueles que ainda não foram numericamente organizados. Um exemplo é o conjunto
das alturas de 100 estudantes do sexo masculino, tirado de uma lista alfabética do registro de alunos de uma
Faculdade.

5.2. Rol

Um rol é um arranjo numérico bruto em ordem crescente ou decrescente de grandeza. A diferença entre
o maior e o menor número do rol chama-se amplitude total dos dados. Por exemplo, se a maior altura dos 100
estudantes do sexo masculino é 188 cm e a menor 152 cm, a amplitude total será de R = 36 cm.
10
5.3. Distribuição de frequência

Uma vez coletados os dados é comum ordená-los, dando origem ao rol. A tabulação desses dados junto
com as frequências correspondentes obtém-se a chamada distribuição de frequências.
Exemplo 12:
A tabela que segue é um exemplo de distribuição de frequência discreta e apresenta as idades de alunos da
disciplina de estatística e suas frequências.

xi fi
18 8
xi : Idade dos alunos que cursam a disciplina
19 10
de estatística
20 7
21 5
fi : número de alunos com a respectiva idade
22 4
5.4. Frequência absoluta
Frequência absoluta de uma variável xi é o numero total de dados que se repete em xi e representamos
por f i .

5.5. Frequência relativa


Frequência relativa é a razão entre cada frequência absoluta f i e o total n das frequências absolutas.
fi
fr  com i  1,2,3,..., n .
n

5.6. Frequência acumulada


Colocando-se os valores em ordem crescente da variável xi , obtém-se a frequência acumulada
adicionando-se as frequências absolutas dos valores anteriores.
Tomando os valores do quadro anterior, podemos escrever:

xi fi fr fac

18 8 8/34=0,235 8
19 10 10/34=0,294 18
20 7 7/34=0,205 25
21 5 5/34=0,147 30
22 4 4/34=0,117 34

Total 34 1

11
5.7. Gráfico de frequências

Gráficos são representações de dados para melhor visualização dos resultados.

Colocando os valores dos dados no eixo horizontal e as frequências no eixo vertical.

Tipos de gráficos:
a) Gráfico de barras ou colunas

3 Série 1

2 Série 2
Série 3
1

0
Categoria 1 Categoria 2 Categoria 3 Categoria 4

b) Gráfico de setores (pizza)


Servem para representar séries categóricas ou nominais, utiliza-se um círculo feito em fatias que
representam as categorias usando a porcentagem de cada categoria que será transformada em graus.
Exemplo 13:
Gastos mensais de uma família formada pelos e dois filhos que estudam em colégio pago.

GASTOS
Gastos
Educação 19% 68º
Alimentação 30% 108º
Educação Transportes 20% 72º
Moradia 15% 54º
Alimentação
Gerais 16% 58º
Transportes
Moradia
Gerais

12
Seguem os gráficos correspondentes ao exemplo 12.
Mostram os valores dos dados xi no eixo horizontal e as frequências no eixo vertical
c) Gráfico da frequência absoluta d) Gráfico da frequência acumulada

f 35 f
10 i ac
9 30
8 25
7
6 20
5 15
4
3 10
2 5
1 xi xi
0 18 19 20 21 22
0 18 19 20 21 22

Exemplo 14:
Uma clínica dentária relacionou os tempos de atendimento em minutos, de seus clientes e apresentou a
tabela de atendimento do mês de maio.

10 12 13 10 11 12 11 13
11 10 11 12 12 11 12 10
14 12 14 12 13 10 13 11
13 11 12 14 12 13 12 14

a) Construir a tabela da distribuição de frequência.


b) Mostre as frequências acumuladas.
c) Mostre as frequências relativas.
Resolução: Chamamos de xi os valores dos tempos de atendimento e por f i as suas frequências e seguem as
frequências relativas e acumuladas.

xi fi fr fac

10 5 0,16 5
11 7 0,22 12
12 10 0,31 22
13 6 0,19 28
14 4 0,12 32
Total 32 1

Exemplo 15:
A pesquisa que segue foi feita pelo Instituto Gallup com mulheres com mais de 15 anos de idade em 147
países e que responderam à pergunta:
Como as mulheres avaliam suas vidas. Construir um gráfico de pizza para essa tabela.

13
Sofrendo 13%
Prosperando 24%
Batalhando para sobreviver 63%

Solução: Devemos encontrar para as porcentagens indicadas os valores em graus e representar no círculo.
Assim:
13%  x0
13
100%  3600 , logo x0  360   46,8  470
100
24%  x0
24
100%  3600 , logo x0  360   86,4  860
100
63%  x0
63
100%  3600 , logo x0  360   226,8  2270
100
Como as mulheres avaliam suas vidas

13%

63%
24%

6. Medidas de tendência central ou de posição

A média é um valor típico ou representativo de um conjunto de dados, sendo a medida de posição mais
importante de uma variável. Como esses valores típicos tendem a se localizar em um ponto central de um
conjunto de dados ordenados segundo suas grandezas, as medidas também são denominadas medidas da
tendência central.

Vários tipos de médias podem ser definidas: a média, a média geométrica e a média harmônica, sendo a
mais comum a média aritmética ou, abreviadamente média. Cada uma delas apresenta vantagens e
desvantagens, dependendo dos dados e dos fins desejados.

14
6.1. Média Aritmética

Situação-problema:

Um professor de matemática aplicou sua prova bimestral a 20 alunos e no momento da entrega das
provas pelos alunos, as corrigia, não comunicando as notas para que não houvesse tumulto. Durante a
correção foi anotando ao lado as notas e na saída da sala disse a todos que a média obtida pela classe era 6.
Levou para casa as provas e as perdeu.
a) Como deve o professor atribuir as notas de cada aluno?
b) O professor recuperou as notas que foram dadas:

6 5 6 4 6 5 7 6 6 7
7 6 5 7 8 4 6 5 8 6

Com as notas recuperadas determine a média aritmética.


Resposta:
a) Se o professor perdeu as provas, mas conhece a média, deve atribuir a média 6 para todos os
alunos, pois, podemos observar que a soma de todas as notas da tabela é igual a soma de 20 notas de valor 6.
Assim, substituímos todas as notas dos alunos pelo valor 6.

6+5+6+4+6+...+8+6 = 6+6+6+6+6+...+6+6 ou ainda


120
120  20  6  6 
20
b) Para definir média devemos ter o conceito de somatório.
Escrevemos uma soma da seguinte maneira ( A letra indica somatório ).
n
 xi  x1  x2  x3  ......  xn
i =1

Exemplo 16:
Sendo x1  1, x2  3, x3  7, x4  5, x5  10
5 5
Calcular a)  xi b)  xi2
i=1 i =1
Solução:
5
a)  xi  1  3  7  5  10  26
i=1
5
b)  xi2  12  32  7 2  52  102  1  9  49  25  100  184
i =1

Exercícios de aplicação 01:


1) Verifique se as igualdades são verdadeiras.
3
a) ( k 2  7 ) = 42
k o

15
4 i
b)  = 29/6
i 2 i  1

2
c) ( j 2  j  1 ) = 6
j 1

2) Sejam os valores de xi e f i dados pela tabela

xi 1 2 3 4 5 6 7 Determinar:

7
fi 2 3 5 7 4 3 1 7
a)  xi
i = 1
b) f
i =1
i

A resolução é mais simples se montarmos a tabela na forma indicada e na última linha colocamos a
soma das colunas.
xi fi
1 2
2 3
3 5
4 7
5 4
6 3
7 1

Definição de média aritmética

Média Aritmética, ou média de um conjunto de n números x1, x2 ,...., xn é representada por x (leia-se “x
n

 x  ...  x 
x
barra”) e é definida por: x x 1 2
 n i 1
i

n n

Exemplo 17:
Sejam as notas obtidas por um aluno de matemática
x1  4, x2  6 , x3  5, x4  9 , determinar a média x .
A média é dada por
4

x i
x1  x2  x3  x4 4  6  5  9 24
x  i = 1
   6
n n 4 4
Quando xi apresentar elementos repetidos, a média aritmética dos valores de x é dada por:

16
n

x f i i
x  i 1
ou por comodidade, deixaremos de colocar os índices do somatório e
n
escrevemos: x 
x f i i

n
Voltando ao item b) da situação problema, montamos a tabela de notas dos alunos

xi fi xi fi
4 2 8
5 4 20
6 8 48
7 4 28
8 2 16
 20 120

x   i i = 120  6 . Portanto, a média aritmética é 6.


xf
n 20

6.2. Média Aritmética Ponderada

Se os números ocorrem f1, f2, f3, ..., fn vezes, respectivamente, isto é, ocorrem para cada número uma
frequência f1, f2, f3, .......fn , a média aritmética será definida por:

x i i
xf
n
Exemplo 18:
Se o exame final de um curso tem peso 3 e as 2 provas mensais peso 1, um estudante que obteve 70 e 90
pontos nas provas e 85 no exame final, então a média é dada por:

x
1.70  1.90  3.85  83 pontos.
11 3

Exercícios de aplicação 02:

Calcular a média aritmética simples ou ponderada.

1) Notas na disciplina de Economia.


3; 5; 7; 6; 4; 2; 5; 2; 4; 5; 7; 6; 4; 6; 2; 3; 7 e 5.

2) Notas na disciplina de estatística.


1; 2; 3; 4; 5; 6; 7 e 8.

17
3) Medidas de diâmetros de parafusos.
1,2; 1,4; 1,4; 1,4; 1,6; 1,6; 1,6; 1,6; 1,6; 1,8; 1,8; 1,8; 1,8; 2 e 2.

4) As notas de 9 alunos de estatística são:4,5; 4,8; 5,7; 7,1; 7,5; 7,9; 8,3; 9,5; 9,7. Sabe-se Pedro é o 10º
aluno e a média da turma incluindo a nota de Pedro é 7,2. Determinar a sua nota.

6.3. Mediana - Md(X)


A mediana é outra medida de posição central de uma variável. Dados um conjunto de números
ordenados em ordem crescente a mediana é o valor central.

Exemplo 19:
O conjunto dos números 3,4,4,5,6,8,8,8,10 tem mediana Md(X) = 6, pois, ocupa a 5ª posição.
n 1
Se o número de observações é ímpar, então para localizar a mediana é só aplicar a fórmula ,
2
n 1
portanto, Md(X) é o elemento que ocupa a posição .
2
Se o número de observações é par, então existem dois elementos centrais: Md1(X) é o elemento que
n n
ocupa a posição e Md2(X) é o elemento que ocupa a posição  1. Uma vez obtidos esses valores, a
2 2
Md1  Md2
mediana é definida como a média aritmética Md (X)= .
2

Exemplo 20:
No conjunto dos números 5,5,7,9,11,12,15,18 determinar a mediana. Como n é par procuramos os
n 8 n 8
elementos que ocupam a posição   4º ,logo Md1(X)=9 e 1  1  5º e Md2(X)=11. Assim, a
2 2 2 2
mediana é definida por:
9  11
Md(X) =  10
2
6.4. Moda - Mo(X)
A moda é outra medida de posição central, sendo o valor que ocorre com maior frequência na
distribuição. Se dois valores tem maior frequência então a distribuição é bimodal. No exemplo 20 acima 5
representa a moda.

6.5. Separatrizes
Separatriz de um conjunto de dados ordenados em ordem crescente ou (decrescente) é o elemento da
série dos dados que divide em partes.

As principais separatrizes são: A mediana, os quartis, os decis e os percentis.

18
Os quartis, decis e percentis são as separatrizes que dividem a série respectivamente em quatro, dez e
cem partes iguais.
A mediana é uma separatriz que divide a série em duas partes iguais.

Os quartis dividem a série em quatro partes iguais e são representados por: q1 , q2 e q3 , sendo
denominados, respectivamente, primeiro, segundo e terceiro quartil, sendo o valor q2 = Md(X).
Os decis são os valores que dividem a série de dados em dez partes iguais e são representados por
d1 , d2 ,..., d9 .
Percentis. Da mesma forma como estudamos mediana, quartis e decis, os valores que dividem a série
em 100 partes iguais denominam-se percentis e são representados por p1 , p2 ,..., p99 .

Notação:
Quando escrevemos p(Qi ) indicamos a posição do quartil qi .
Quando escrevemos p(Di ) indicamos a posição do centil d i .
Quando escrevemos p( Pi ) indicamos a posição do percentil pi .

Exemplo 21:
Determinar os quartis para a amostra A: 6, 8, 4, 3, 9, 8, 5, 4, 7, 5, 8, 2, 7, 8 e 4.

Solução: Colocando os valores da amostra em ordem crescente, tem-se:

2 3 4 4 4 5 5 6 7 7 8 8 8 8 9
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º 12º 13º 14º 15º

O número de elementos n é ímpar, logo:

Primeiro quartil é o elemento que ocupa a posição:


15  1
p(Q1 )  .1= 4º elemento, portanto, q1  4 .
4
Segundo quartil é o elemento que ocupa a posição:
15  1
p(Q2 )  .2 = 8º elemento, portanto, q2  6  Md ( X ) .
4
Terceiro quartil é o elemento que ocupa a posição:
15  1
p(Q3 )  .3 = 12º elemento, portanto, q3  8 .
4
Decis. Para determinarmos o decil quando n é ímpar devemos utilizar o seguinte procedimento.
O i-ésimo decil ocupa a posição:

(n  1) (n  1)
p(Di ) = . i , assim o 7º decil ocupa a posição p(D7 ) = .7
10 10

Exemplo 22:
A tabela que segue apresenta uma amostra de 36 elementos com suas frequências. Determinar:
a) Mediana. b) Quartis. c) 4ºDecil.

19
Da tabela escrevemos Mediana: como n =36 (par) temos dois valores centrais
xi fi fac 18º sendo Md1 ( X )  9,05 e 19º como Md2 ( X )  9,05 , logo, a
5,01 4 4 mediana é Md ( X )  9,05 .
36
7,03 7 11 Quartil: p(Q1 )  .1  9º e 10º elementos, logo q1  7,03
9,05 11 22 4
36
11,07 8 30 p(Q2 )  .2  18º e 19º elementos, logo, q2  9,05
4
13,09 6 36 36
p(Q3 )  .3  27º e 28ºelementos, logo, q3  11,07
 36 4
36
Decil: p(D4 )  .4  14,4  14º e 15º elementos, logo, d4  9,05
10

Observação1: De maneira análoga são obtidas as soluções para os percentis.

7. Box Plot ou diagrama de caixa

O gráfico denominado Box plot é obtido por meio dos quartis. Obtidos os quartis
q1 , q2 e q3 , determinamos a amplitude interquartílica, definida por: Iq  q3  q1 , isto é, a distância entre o maior
e o menor quartil. O quartil q2 ou mediana fica representado no interior da caixa.

O extremo inferior da cauda é denominado limite inferior e é determinado por LI  q1 1,5Iq e o limite
superior LS  q3  1,5 Iq . Os valores que se situam fora dos limites da distribuição são denominados outliers.
Utilizando os dados do exemplo 20 temos: q1  7,03 , q2  9,05 e q3  11,07 . Nesse caso o intervalo
interquartílico é dado por Iq  q3  q1  11,07  7,03  4,04 e tem como limites:
LI  q1 1,5Iq =7,03-1,5.(4,04)=0,97.
LS  q3  1,5 Iq  11,07+1,5.(4,04)=17,13.

O gráfico Box plot é dado por:


q1  7,03 q2  9,05 q3  11,07

LI=0,97 L S=17,13

20
8. Medidas de tendência lateral ou de dispersão

Quando propusemos substituir todas as notas perdidas pelo professor pela nota (média) x  6 , os alunos
cujas notas eram superiores à média 6 reclamaram, porém, os de notas inferiores não. Na ótica do professor
atribuir nota 6 a todos os alunos não mostra a performam-se da turma, pois todos recebem a mesma nota, mas
ao atribuir as notas verdadeiras se observa a variabilidade da turma.
Estudemos a variabilidade para as amostras que seguem:
Amostra A: 2,3,4,8,9,10, tem seis elementos e média x  6

Amostra B: 5,5,6,6,7,7, tem seis elementos e média x  6 .


Adotando a média como o valor mais representativo da distribuição, observamos que os valores da amostra
A estão mais dispersos em relação à média, enquanto a amostra B os valores estão mais próximos da média. As
medidas que avaliam dispersão são denominadas de desvios.

8.1 Desvio médio: dm(X)

Definimos desvio com o resultado da diferença entre o valor de cada observação e o valor da média.
Observação 2:
1) A soma dos desvios calculados em relação à media é sempre igual a zero, isto é,
(x  x)  0
i

2) Como a soma é sempre nula tomamos cada parcela da soma em módulo e definimos desvio médio da
amostra em relação à média por:

dm( X )   i
| x  x | fi
n

8.2 Variância ou desvio quadrático médio da amostra

Outra maneira para calcular o desvio é elevar ao quadrado cada uma de suas parcelas, pois, teremos
também soma diferente de zero, dessa maneira definimos desvio quadrático médio ou variância por:

S 2
( X )  V ar( X ) 
( x  x )
i
2
fi
n
8.3 Desvio padrão da amostra

Sendo a variância uma medida de dimensão igual ao quadrado da dimensão dos dados, isso pode causar
problemas de interpretação, portanto, costuma-se usar o desvio padrão que é definido como raiz quadrada da
variância. Utilizamos dois tipos de desvios padrões:

a) Desvio padrão da amostra: S ( X )  V ar( X ) 


(x  x )
i
2
fi
n

b) Desvio padrão da amostra: dp(X)= V ar( X ) 


(x  x )
i
2
fi
(Essa definição é a mais usada)
n 1

21
Observação 3: Para valores de n grandes é indiferente o uso de uma ou outra fórmula.

Exemplo 23:
Dar as medidas de tendência central e as de dispersão para as amostras A e B. Resolução: Montando
primeiramente a distribuição para os valores da tabela A, segue:

xi fi xi fi | xi  x | | xi  x | fi (xi  x )2 fi

2 1 2 4 4 16
3 1 3 3 3 9
4 1 4 2 2 4
8 1 8 2 2 4
9 1 9 3 3 9
10 1 10 4 4 16

 6 36 18 58

Com o uso das fórmulas dadas calculamos os valores desejados:

a) Média: x 
x f i i

36
6
n 6

b) Desvio médio: dm( X ) 


18 | x  x | f
3 i i

n 6
c) Desvio quadrático médio ou variância da amostra:

V ar( X ) 
( x  x ) i
2
fi

58
 11,6
n 1 5
d) Desvio padrão da amostra:

dp(X)= V ar( X ) 
(x  x ) i
2
fi
 11,6  3,40587
n 1
Para a amostra B, tem-se:

xi fi xi fi | xi  x | | xi  x | fi | xi  x |2 fi
5 2 10 1 2 2
6 2 12 0 0 0
7 2 14 1 2 2

 6 36 4 4

22
Como fizemos para a amostra A, calculamos com o uso das fórmulas os valores:

a) Média.

x   i i   6 , logo, se vê que a média das duas amostras são iguais.


x f 36
n 6
b) Desvio médio

dm( X )   i
| x  x | fi 4
  0,7 , valor bem menor que da amostra A igual a 3.
n 6
c) Desvio quadrático médio ou variância da amostra

S 2
( X )  Var( X ) 
( x  x )
i
2
fi

4
 0,8
n 1 5
d) Desvio padrão da amostra

S ( X )  Var ( X ) 
(x  x )
i
2
fi
 0,8  0,894 .
n 1
Conclusão:
Comparando as duas amostras vê-se que os valores obtidos pelo desvio padrão são: da amostra A, (
S ( X )  3,40587 ) e da amostra B, ( S ( X )  0,894 ). Assim concluímos que a amostra A tem maior dispersão
que a amostra B, isto é, os valores da amostra B estão mais próximos da média.

9. Coeficiente de Variação de Pearson

O coeficiente de Variação de Pearson mede a dispersão em relação à média e é dado


dp( X ) desvio padrão
por: CV ( X )  =
x média
A maior utilidade do coeficiente de variação é permitir a comparação da variabilidade de diferentes
distribuições. Se o valor obtido for menor que 20%, dizemos que a distribuição pode ser considerada
homogênea.

Se CV ( X )  15% tem-se baixa dispersão.

Se 15%  CV ( X )  30% tem-se média dispersão.

Se CV ( X )  30% tem-se elevada dispersão.


Exemplo 24:
Utilizando os dados do exemplo anterior, determinar o coeficiente de Variação de Pearson:
dp( X ) 3,40587
Para a amostra A, segue CV ( X )  =  0,5676  56%
x 6

23
dp( X ) 0,894
Para a amostra B, segue CV ( X )  =  0,149  15% . Analisando os valores obtidos vê-se
x 6
que a amostra B é mais homogênea que A.

Exemplos usando a distribuição de frequência na Variável Discreta

Exemplo 25:
Com o uso da tabela que segue, determinar as medidas de tendência central e as de dispersão.
a) Média
b) Moda
c) Mediana
d) Desvio Médio
e) Variância
f) Desvio Padrão
g) Gráfico de frequência absoluta
h) Coeficiente de variação

5,01 5,01 5,01 5,01 7,03


7,03 7,03 7,03 7,03 7,03
7,03 9,05 9,05 9,05 9,05
9,05 9,05 9,05 9,05 9,05
9,05 9,05 11,07 11,07 11,07
11,07 11,07 11,07 11,07 11,07
13,09 13,09 13,09 13,09 13,09
13,09

Com os valores dados construímos a distribuição de frequência colocando os valores em ordem crescente
e calculamos as medidas com uso da tabela que segue.

xi fi xi fi fac | xi  x | | xi  x | fi (xi  x )2 fi
5,01 4 20,04 4 4,32 17,28 74,6842
7,03 7 49,21 11 2,30 16,11 37,0622
9,05 11 99,55 22 0,28 3,09 0,8686
11,07 8 88,56 30 1,74 13,91 24,1930
13,09 6 78,54 36 3,76 22,55 84,7805
 36 335,90 72,94 221,5885

Usando os valores determinados na tabela temos:

24
a) Média. (Tomamos a média com uma casa decimal a mais que xi )

x i i 
x f 335,9
 9,331
n 36
b) Moda
O elemento de maior frequência na tabela é a moda: Mo( X )  9,05
n
 180..........Md1  9,05
c) Mediana se n é par, então 2 portanto, Md ( X )  9,05
n
 1  19 .....Md2  9,05
0
2
d)Desvio médio

dm( X )   i
| x  x | fi 72,94
  2,03
n 36
e) Desvio quadrático médio ou variância

V ar( X ) 
( x  x )
i
2
fi

221,5885
 6,3311
n 1 35
f) Desvio padrão

S ( X )  V ar( X ) 
(x  x ) i
2
fi
 6,3311  2,516168
n 1
Se a distribuição de frequência tem a forma de um sino ela é simétrica, então aproximadamente 68% das
medições estão contidas no intervalo ] x  S ( X ), x  S ( X )[ .

g) Gráfico da frequência absoluta

11 fi
10
9
8
7
6
5
4
3
2
1 xi
0 5,01 7,03 9,05 11,07 13,09

h) Coeficiente de variação

dp( X ) 2,516168
CV ( X )  = =0,2696568  27% (não é homogênea, e tem média dispersão )
x 9,331

25
Exercícios Aplicativos 03:

Exercício 1:
A tabela a seguir apresenta as notas de matemática da primeira prova bimestral, determinar
a) as medidas de tendência central e as de dispersão.
b) gráfico da frequência absoluta e da acumulada.

6 7,5 8 8,5 6,5 7,5 8 7,5 9,5 6


7 7 7 9 7 9,5 7 6 7 7
8 8,5 7,5 5,5 7,5 7 5,5 7 7 8
6,5 7,5 9 6,5 8,5 7,5 6,5 9,5 8,5 8

xi fi fac xi fi | xi  x | | xi  x | fi ( xi  x )2 fi

1) Média: x
x i fi

n
2) Moda: Mo( X )  Mediana: Md ( X ) 

3) Desvio Médio: dm( X ) 


| x  x | f
i i

4) Desvio quadrático Médio ou variância:

S 2 ( X )   ( xi  x ) fi 
2

n 1
26
5) Desvio Padrão:

dp(X) = S ( X )  Var ( X )  (x


i  x )2 fi
n 1

6) Coeficiente de variação.

7) Construir o gráfico da frequência e representar a média e o desvio padrão.

9) Construir o gráfico da frequência acumulada.

27
Exercício 2: Foram coletados os seguintes dados de uma pesquisa, determinar as medidas de tendência
central, as de dispersão, box plot e o gráfico da frequência absoluta.

1,2 – 1,8 – 2,0 – 1,4 – 1,6 – 1,8 – 1,4 – 1,8 – 2,0 – 1,6 –1,6 – 1,2 – 1,6 – 1,8 –1,4 –
1,6 – 1,8 – 1,4 – 2,0 – 1,4 – 1,8 – 1,6 – 1,2 – 1,6 – 2.0 –1,4 – 1,6 – 1,6 –1,4

xi fi fac xi fi | xi  x | | xi  x | fi ( xi  x )2 fi

1) Média: x
x i fi

n
2)Moda: Mo( X ) 

3) Mediana: Md ( X ) 

4)Desvio Médio: dm( X ) 


| x  x | f
i i

5)Desvio quadrático Médio ou variância:

S2 (X )  
( xi  x )2 fi

n 1

6)Desvio Padrão:

28
dp(X) = S ( X )  Var ( X )  (x i  x )2 fi
n 1

7) Coeficiente de variação

8) Box plot

9) Construir o gráfico da frequência absoluta e representar a média e o desvio padrão.

Exercício 3: Idem. Dada a tabela, determinar as medidas de tendência central e as de dispersão.

22,3 23,0 22,3 21,0 22,3 22,4


23,2 23,0 20,1 23,5 23,0 23,5
21,0 23,2 22,3 23,2 22,3 23,0
22,3 22,4 21,0 22,3 23,5 23,0
22,4 22,3 23,0 23,0 22,4 21,0

29
xi fi fac xi fi | xi  x | | xi  x | fi (xi  x )2 fi


1) Média: x
x i fi

n

2)Moda: Mo( X ) 

3) Mediana: Md ( X ) 

4)Desvio Médio: dm( X ) 


| x  x | f
i i

5)Desvio quadrático Médio ou variância:

V ar( X ) 
( x  x )
i
2
fi
n 1
6)Desvio Padrão:

dp(X) = S ( X )  Var ( X )  (x i  x )2 fi


n 1

7) Coeficiente de variação

8) Box plot

30
9) Construir o gráfico da frequência absoluta e representar a média e o desvio padrão

10. Distribuições de frequência na variável contínua


A variável contínua é na maioria das vezes obtida por meio de medidas, e os dados têm frequência
absoluta praticamente unitária (os dados são quase todos distintos) e neste caso, a tabela de distribuição se
torna longa, trabalhosa e pouco eficiente, desta maneira se usa a distribuição na variável contínua.
Exemplo 26:
O professor de Educação Física do Colégio Estadual João Felipe, coletou as idades de seus alunos e as
apresentou por meio da tabela.

15,6 7,8 13,8 5,1 12,4 9,5 12,2 10,3 13,8 5,5

7,7 6,5 6,4 10,0 2,2 9,3 6,4 10,0 8,5 13,1

11,8 12,7 15,5 2,7 6,4 6,8 5,1 11,2 16,6 3,6

8,3 12,4 6,4 7,2 10,5 4,7 14,0 17,0 6,8 15,1

12,2 13,2 4,7 8,4 14,1 10,8 17,0 14,0 13,1 10,7

9,8 6,2 7,7 9,0 17,0 12,2 9,0 12,1 9,8 6,2

8,7 6,5 13,7 11,8 7,7 15,5 5,7 5,1 10,2 7,7

5,9 3,9 3,3 12,2 8,4 9,3 16,6 3,7 9,4 12,2

14,0 6,9 10,8 8,5 6,4 8,6 10,0 10,0 10,9 9,3

17,0 10,9 12,7 14,0 15,6 11,2 15,6 12,4 6,4 9,4

Essa tabela nos diz que seus elementos são quase todos distintos, portanto, trata-se de uma variável
contínua. Neste caso trabalharemos com dados agrupados e seguiremos os seguintes passos para o estudo dessa
distribuição.

10.1. Amplitude da amostra. A amplitude da amostra é dada pela diferença entre as observações de maior

valor numérico e a de menor valor, neste caso R  xmax  xmin = 17,0-2,2=14,8.


31
10.2. Número de classes

Queremos dividir R = 14,8 em classes, todas com mesma amplitude. Não existe regra única para
escolher o número destas classes, é recomendável que se n é o número de

elementos da amostra, então o número de classes K é dado por:

a) Critério da raiz: K  [ n] , sendo K o maior número inteiro menor ou igual a n ou

b) Critério de Sturge: K  1 3,322log n , sendo K o maior número inteiro menor que 1 3,322log n . Por

simplicidade adotaremos o critério da raiz, logo K  [ n] = [ 100]  10

10.3. Amplitude de cada classe

R 14,8
A amplitude de cada classe é dada por: r   1, 48 . Os limites das classes devem ser
K 10
escolhidos de modo que cada um dos valores pertença somente a uma classe, se o valor coincidir com o extremo
da classe, ele deve ser contado como elemento da classe posterior, com exceção da última classe. Definindo xi
como ponto médio da classe, isto é, a soma do limite superior da classe com o limite inferior da classe dividindo
por 2 e fazendo a contagem dos elementos (idades dos alunos) em cada classe, segue a tabela.

xi fi xi fi fac | xi  x | | xi  x | fi (x  x )
i
2
fi
classes

2,20 |— 3,68 2,94 4 11,76 4 6,882 27,528 189,447696

3,68 |— 5,16 4,42 7 30,94 11 5,402 37,814 204,271228

5,16 |— 6,64 5,90 13 76,70 24 3,922 50,986 199,967092

6,64 |— 8,12 7,38 9 66,42 33 2,442 21,978 53,670276

8,12 |— 9,60 8,86 15 132,90 48 0,962 14,430 13,881660

9,60 |— 11,08 10,34 14 144,76 62 0,518 7,252 3,756536

11,08 |— 12,56 11,82 13 153,66 75 1,998 25,974 51,896052

12,56 |— 14,04 13,30 12 159,60 87 3,478 41,736 145,157808

14,04 |— 15,52 14,78 4 59,12 91 4,958 19,832 98,327056

15,52 |—| 17,00 16,26 9 146,34 100 6,438 57,942 373,030596

 100 982,20 305,47 1333,4060

Completada a tabela podemos calcular

32
a) Média (Adotamos a média com uma casa decimal a mais que xi )

x i i 
x f 982,2
 9,822
n 100

c) Moda: Classe modal é a classe de maior frequência 8,12 |— 9,60.

Utilizamos para a determinação da moda a fórmula de Czuber, a qual é obtida por semelhança de
triângulos.

fi r Fórmula de Czuber: Mo( X )


15 A C
2 Os triângulos AOB e COD são semelhantes, então
14 0
D H AB Mo  lMo 1
1 H AB
 ou   
h CD H  h AB  CD r 1  2
9 B H: altura do triângulo AOB.
h: altura do triângulo COD.
lMo : limite inferior da classe modal.
Mo classes
6,64 8,12 9,6 11,08 r : amplitude da classe modal.
1 : diferença da frequência superior e da inferior da
classe que antecede a classe modal.
2 : diferença da frequência superior e inferior da
classe posterior da classe modal.

Substituindo os valores em
Mo  lmo 1 Mo  8,12 6
 , segue  e o valor da moda é
r 1  2 1,48 6 1
Mo( X ) = 8,12 +1,2685 = 9,3885

c) Mediana

O cálculo da mediana para a variável contínua difere do modelo de variável discreta, neste caso a
mediana esta localizada na classe mediana, porém, o valor do elemento da série não é identificável. Sabemos
que a mediana é o valor que ocupa a posição central de uma distribuição ordenada. Se o número de elementos
n 1
for ímpar, então a mediana é o elemento que ocupa a posição . Voltando ao exemplo verificamos que o
2
número de elementos é par, logo

33
 n 100
 2  2  50º
se n é par, então a mediana ocupa a posição  n
  1  100  1  51º e, devemos encontrar o elemento que
 2 2

ocupa (50,5)0 . Tomamos para isso a classe mediana e os elementos da frequência acumulada anterior e
posterior do elemento (50,5)0 . Usando semelhança de triângulos podemos escrever:

Os triângulos ABC e ADE são


fac AC BC
D semelhantes, então  ,
62 AE DE
substituindo, segue:
Md  9,6 50,5  48

B 11,08  9,6 62  48
50,5 Md  9,6 2,5

1, 48 14
48 A C E
Md  9,6  (1,48  2,5) :14 
classes Md ( X )  9,8642857
9,6 Md 11,08

d) 1º quartil
A determinação do 1º quartil se faz analogamente à mediana, determinamos primeiramente a posição p(Q1 )
e como o número de elementos é par segue:
 n 100
f
ac  4 .1  4  25º
D  , assim, devemos
33  n .1  1  100  1  26º
 4 4

B determinar 25,5 e a classe do 1º quartil é


25,5 [6,64;8,12]. De maneira semelhante a
construção da mediana, segue
A C E
24 q1  6,64 25,5  24 q  6,64
  1 
classes 8,12  6,64 33  24 1.48
6,64 q 8,12 1,5
1   0,1666 , então o 1º quartil é
9
q1  6,886568

Observação 4: Analogamente encontramos o 2º e 3º quartil.


e) Desvio médio

dm( X )   i
| x  x | fi 305, 472
  3,05472
n 100
34
f) Desvio quadrático médio ou variância

S(X)= V ar( X ) 
( x  x ) i
2
fi

1333,4059
 13,468746
n 1 99

g) Desvio padrão

dp(X)= S ( X )  V ar( X ) 
(x  x ) i
2
fi
 13,46874717  3,669979179
n 1

h) Gráficos. O gráfico da frequência é denominado histograma, é um gráfico no qual as classes são marcadas
no eixo horizontal e as frequências no eixo vertical representando as alturas por meio de barras. As barras são
desenhadas de forma adjacentes uma em relação a outra. Ligando os pontos médio das classes tem-se o
polígono de frequência.

fi 

















classe
0 2,20 3,68 5,16 6,64 8,12 9,60 11,08 12,56 14,04 15,52
 17,00 xi
mo
 Histograma
 com
 Moda, Média, e Mediana

9.4 Formatos de histogramas

1) Simétrico
Um histograma simétrico tem o gráfico idêntico em ambos os lados do ponto central onde se localizam a
moda a média e a mediana.

f ( xi )


xi
média=moda=mediana

35
2) Assimétrico
Um histograma assimétrico quando seu formato não é simétrico.
a) Assimétrico à direita.
Quando possui uma cauda mais longa à direita e neste caso as medidas de tendência central estão localizadas na
ordem: moda, mediana e média.

f ( xi )

moda mediana média xi


b) Assimétrico à esquerda.
Quando possui uma cauda mais longa à esquerda e neste caso as medidas de tendência central estão localizadas na
ordem: média, mediana e moda.


f ( xi )

xi
média mediana moda

x i
Exercícios aplicativos 04:

Exercício 1:
A experiência com trabalhadores de uma indústria indica que o tempo requerido em minutos para que
um operário aleatoriamente selecionado realize uma tarefa, esta indicado na tabela. Montar a tabela e
determinar o que se pede:
31 29 20 31 22 22 32 41 21 29 30 25 35 40 31
32 21 36 38 39 32 21 36 38 39 28 36 23 36 31
27 41 29 22 41 25 40 37 24 27 34 37 28 28 31
36 20 30 22 35 24 25 23 33 34 32 27 28 34 30

1) Amplitude da Amostra: R = xmax - xmin =

2) Número de Classes: K =[ n ] =

36
3) Amplitude da Classe: r = R/K =

classes xi fi fac xi fi | xi  x | | xi  x | fi (xi  x )2 fi


4)Média: x
x i fi

n
5)Moda: Mo( X ) 

6) Mediana: Md ( X ) 

7)Desvio Médio: dm( X ) 


| x  x | f
i i

8) Variância : S (X ) 
2 ( x  x ) i
2
fi

n 1

9) Desvio Padrão:

37
dp(X)= S ( X )  Var( X ) 
(x  x )
i
2
fi
n 1

10) Coeficiente de variação:

11) Construir o Histograma e o polígono da frequência e representar a média e o desvio padrão.

Exercício 2: Foram coletados os dados de uma pesquisa e obteve-se a distribuição na variável contínua.
Determinar as medidas de tendência central e as de dispersão.

classes xi fi fac xi fi | xi  x | | xi  x | fi ( xi  x )2 fi
2,1 |—— 3,1 3
3,1 |—— 4,1 7
4,1 |—— 5,1 10
5,1 |—— 6,1 6
6,1 |—— 7,1 3

1) Média: x
x i fi

n
2) Moda: Mo( X ) 

38
3) Mediana: Md ( X ) 

4) 3º quartil

5) Desvio Médio:

dm( X )   i
| x  x | fi
n

6)Variância :

S 2
(X ) 
(x  x ) f 
i
2
i

n 1
7)Desvio Padrão:

dp(X)= S ( X )  Var( X ) 
(x  x )
i
2
fi
n 1

8) Coeficiente de variação:

9) Construir o Histograma, o polígono de frequência e representar a média e o desvio padrão.

39
Exercícios aplicativos 05:

1. A tabela a seguir apresenta as notas xi e as frequências f i obtidas pelos alunos na prova de geografia. A
partir destes dados podemos dizer que

xi fi xi fi
5 2
6 4
7 8
8 4
9 2

(A) A moda corresponde a nota 8.


(B) A mediana corresponde a nota 8.
(C) A média é 7.
(D) A quantidade de alunos da amostra é 5.
(E) nda.
2. Seja a amostra X: 4,5,5,3,3,5,7,6,6,7,8,8, então sua mediana é dada por

(A) 5
(B) 6
(C) 5,5
(D) 6,5
(E) nda
3. A tabela a seguir é uma distribuição na variável contínua e apresenta as classes e suas respectivas
frequências. Nestas condições podemos dizer que a mediana é

classes fi
0 |—— 2 3
2 |—— 4 7
4 |—— 6 10
6 |—— 8 6
8 |—— 10 3

(A) 1 (B) 2 (C) 3 (D) 4 (E) 5


40
4. Sejam as seguintes informações das amostras;
Amostra A tem média 6 e desvio padrão 1 e a amostra B tem média 6,5 e desvio padrão 0,5. Então
podemos afirmar que

(A) A amostra A tem menor dispersão que a amostra B


(B) A amostra A tem maior dispersão que a amostra B
(C) As duas amostras têm a mesma dispersão
(D) Não da para comparar as duas amostras quanto a dispersão
(E) nda
5. Após a análise dos dados de uma amostra, segue a representação gráfica da distribuição na forma de Box
plot, sendo q1, q2 e q3 os seus quartis. Então a distribuição é

(A) Simétrica à direita (B) Simétrica à esquerda


(C) Assimétrica positiva (D) Assimétrica negativa
(E) nda
6. A tabela a seguir apresenta o número de acidentes por dia ( xi ) em uma rodovia, durante os primeiros 23
dias do mês de janeiro de 2015.

xi fi
0 9
1 7
2 5
3 2

A partir destes dados afirmamos que


(A) o primeiro quartil é de 1 acidente por dia.
(B) a moda é de 9 acidentes por dia.
(C) a mediana é de 2 acidentes por dia.
(D) a média é de 1 acidente por dia.
(E) o terceiro quartil é de 3 acidentes por dia.

41
7. A tabela a seguir representa uma distribuição na variável discreta e seus quartis q1, q2 e q3 são
respectivamente
xi fi
2 5
5 1
8 7
10 2
12 4

(A) 5, 8 e 10 (B) 1, 7 e 13 (C) 2, 8 e 10 (D) 2, 8 e 12 (E) 2, 5 e 12


8. Após a análise dos dados de uma amostra que tem distribuição na variável discreta, obtiveram-se os
seguintes valores para os quartis: q1  3, q2  8 e q3 10 . Nestas condições a distribuição é

(A) Simétrica.
(B) Assimétrica à esquerda.
(C) Assimétrica positiva
(D) Assimétrica à direita
(E) Não é Simétrica e nem Assimétrica
9. A tabela a seguir é uma distribuição na variável contínua e apresenta as classes e suas respectivas
frequências. Nestas condições dizemos que a mediana é

classes fi
2,1 |—— 4,1 5
4,1 |—— 6,1 9
6,1 |—— 8,1 14
8,1 |—— 10,1 9
10,1|—— 12,1 4

(A) 6,1
(B) 7,1
(C) 7,3
(D) 8,1
(E) 10,1
42
10. Se uma distribuição na variável contínua é perfeitamente simétrica (em forma de sino) em relação a
média, então o intervalo [ x   , x   ] contém aproximadamente

(A) 95% dos elementos da distribuição. (B) 75% dos elementos da distribuição.
(C) 68% dos elementos da distribuição. (D) 34% dos elementos da distribuição.
(E) 14% dos elementos da distribuição
11. Se uma variável X tem x  10 e S ( X )  2 e uma variável Y tem y  10 e S(Y )  5 então

(A) X tem maior dispersão que Y.


(B) Y tem maior dispersão que X.
(C) as duas variáveis têm a mesma dispersão.
(D) não é possível comparar as duas variáveis.
(E) X tem dispersão infinita.
12. Quando queremos verificar a questão de uma prova que apresentou maior número de erros, utilizamos:

(A) A mediana.
(B) O desvio padrão.
(C) A moda.
(D) A média geométrica.
(E) A variância.
13. O coeficiente de variação é uma medida que expressa a razão entre:
(A) o desvio padrão e a variância.
(B) o desvio padrão e a mediana.
(C) o desvio padrão e a moda.
(D) o desvio padrão e o terceiro quartil.
(E) o desvio padrão e a média.

43
14. A tabela a seguir apresenta as notas xi e as frequências f i obtidas pelos alunos na prova de matemática.
A partir destes dados podemos dizer que
xi fi
1 6
3 3
5 5
7 10
9 7

(A) A moda corresponde a nota 9.


(B) A mediana corresponde a nota 5.
(C) A média é 5,6.
(D) A quantidade de alunos da amostra é 10.
(E) A soma de todas as frequências é 30.

Exercícios aplicativos 06:

1. A tabela a seguir é uma distribuição na variável contínua e apresenta as classes e suas respectivas
frequências. Nestas condições, podemos dizer que a média será:

Classes 150 a 200 200 a 250 250 a 300 300 a 350 350 a 400 400 a 450 450 a 500
fi 5 16 21 28 19 8 3

(A) 352 (B) 353 (C) 315 (D) 314 (E) 313

44
2. A tabela a seguir apresenta as notas atribuídas aos ginastas de uma modalidade esportiva.
xi fi
4,0 6
4,2 5
4,4 9
4,6 6
4,8 4

A partir destes dados afirmamos que


(A) o primeiro quartil é de 3,9. (B) a moda é de 9.
(C) a mediana é de 4,5. (D) a média é 4,38. (E) o terceiro quartil é 4,7.

3. Os dados que seguem representam o índice de precipitação pluviométrica em uma cidade no ano de
2014.

Meses Janeiro Fevereiro Março Abril

Índices (mm) 68,5 35,1 332,2 92,8

Assim, podemos dizer que os dados estão mais apropriados para o nível de medidas na variável
(A) nominal. (B) ordinal. (C) intervalar. (D) de razão. (E) irracional.
4. A experiência com trabalhadores de uma indústria indica o tempo em minutos requerido para que um
operário realize uma tarefa. Segue tabela da distribuição na variável contínua dessa experiência.

classes fi
23 |— 26 6

26 |— 29 7

29 |— 32 11

32 |— 35 8

Nestas condições a moda obtida pela fórmula de Czuber é


(A) 29,85 (B) 30,02 (C) 30,71 (D) 31,24 (E) 31,65
45
5. Os alunos do terceiro ano do Ensino Médio do Colégio ABC apresentaram os seguintes resultados das
avaliações em:
Geografia: Média 5,0 e desvio padrão 1,6.
Matemática: Média 6,4 e desvio padrão 1,5.
Nessas condições podemos afirmar que
(A) As notas de Geografia e Matemática apresentam baixa dispersão.
(B) Só as notas de Matemática apresentam baixa dispersão.
(C) As notas de Geografia apresentam alta dispersão.
(D) As notas de Geografia apresentam menor dispersão que as de matemática.
(E) Não é possível avaliar as notas usando o conceito de coeficiente de dispersão.
6. A tabela a seguir apresenta as notas xi e as frequências f i obtidas pelos alunos na prova de matemática. A
partir destes dados podemos dizer que

xi fi
2,5 3
5,0 7
6,5 10
8,0 6
10,0 5

(A) A moda é10 (B) A mediana é 5 (C) A média é 6,63 (D) A quantidade de alunos da amostra é 30 (E) A
soma de todas as frequências é 29.
7. A tabela a seguir é uma distribuição na variável contínua e apresenta os dados de uma loja de presentes ao
final da semana, contendo o número de clientes e seus gastos em presentes. Nestas condições podemos
dizer que a moda segundo Czuber é

classes fi
0 |—— 50 7
50 |—— 100 8
100 |—— 150 10
150 |—— 200 6
200 |—— 250 4

(A) 116,6. (B)126,6. (C) 15,6. (D) 117,6. (E) 118,6.

46
8. A tabela a seguir apresenta as idades dos alunos do primeiro ano de Administração. Nessas condições o 3º
quartil é
classes fi
17|—— 19 4
19|—— 21 12
21|—— 23 16
23|—— 25 8
25|—— 27 3

(A) 23,20. (B) 23,25. (C) 23,45. (D) 23,55. (E) 23,65.

9. A turma A de estatística I formada de 25 alunos tiveram média 7 na prova P1e a turma B formada por 30
alunos tiveram média 6. Então a média combinada dos 55 alunos nas duas provas foi

(A) 6,25. (B) 6,35 (C) 6,45 (D) 6,55. (E) 6,65

10. Analise as afirmativas referentes a uma série na variável discreta ímpar de dados:
I. A Moda sempre é um dos dados da série.
II. A Média sempre é um dos dados da série.
III. A Mediana sempre é um dos dados da série.
Podemos afirmar que:

(A) Somente a afirmativa II está correta.


(B) Nenhuma afirmativa está correta.
(C) Todas as afirmativas estão corretas.
(D) Somente a afirmativa III está correta.
(E) Somente a afirmativa I está correta

47
11. Em recente pesquisa perguntou-se ao corpo discente qual o tempo semanal (em horas) destinado ao
estudo extraclasse da disciplina Estatística I. As respostas forneceram um tempo médio de 5,5 horas e uma
mediana de 6 horas.
Podemos considerar que essa distribuição dos tempos é do tipo:

(A) Simétrica negativa.


(B) Assimétrica negativa.
(C) Assimétrica positiva.
(D) Desviada à direita.
(E) Simétrica.
12. Melhorar a infraestrutura é essencial para ter competividade e incentivar outros investimentos e permitir o
crescimento do PIB. A tabela a seguir mostra a taxa de crescimento da infraestrutura no setor de geração de
eletricidade (% a.a.).

Anos fi
1931 |—— 1950 4,5
1951 |—— 1963 9,8
1964 |—— 1980 9,8
1981 |—— 1993 4,1
1994 |—— 2002 3,8

Nestas condições, o ano em que ocorreu a taxa média de crescimento da infraestrutura no setor de geração de
energia foi
(A) 1968. (B) 1972. (C) 1974. (D) 1976. (E) 1978.

48
CAPÍTULO 2
ANÁLISE COMBINATÓRIA

A análise combinatória é um ramo da matemática, que tem por fim estudar as propriedades dos
agrupamentos que podemos formar, segundo certas leis, com os elementos de um conjunto finito.

1. Conceitos
Seja A  a,b, c, d. Aos subconjuntos de três elementos, denominaremos de agrupamentos
simples de classe 3 e escrevemos como: abc; abd; acd e bcd . Aos conjuntos abb; aab; acc ,
denominamos de agrupamentos repetidos de classe 3. Aos subconjuntos com dois elementos,
agrupamentos simples de classe 2 e escrevemos:
ab; ac; ad;bc;bd e cd .

Exemplo 1:
 
Seja A 1,2,3,4 , quantos números distintos (sem repetição) de classe 3 podemos formar
com esses algarismos?
Solução:
Escrevemos os agrupamentos de classe 3 distintos e observamos que mudando a ordem dos
algarismos de cada agrupamento,ocorrem novos números distintos. Assim com 4 algarismos podemos
formar 6  4  24 números distintos de 3 dígitos.

123 134 124 234


132 143 142 243
   
213 314 214 324
(6)   6 341 (6)  (6) 
231   241 342
312 413 412 423
   
321 431  421 432

Observação 1:
Os números acima são formados de três dígitos sendo que na primeira casa aparecem os quatro
dígitos e como não há repetição dos dígitos, na segunda casa aparecem três dígitos distintos e
finalmente na última casa dois dígitos. Portanto podemos escrever 4  3 2  24 .

Exemplo 2:
Numa sala há 3 rapazes e 4 moças. Quantos casais rapaz-moça podem formar?

Solução:
Chamando os rapazes de r1, r2 , r3 e as moças de m1, m2 , m3 , m4 , é fácil ver que para o
rapaz r1 podemos formar 4 casais e mais 4 casais para o rapaz r2 e outros 4 para o rapaz r3 . Portanto
o número de casais é dado por:
4+4+4=3.4=12.

49
2. Princípio Fundamental de Contagem.

Os exemplos dados ilustram o Princípio Fundamental de Contagem.

Se um acontecimento é composto de duas etapas sucessivas, independentes uma da outra, e:


Se na 1ª etapa ocorrer de m modos,
Se na 2ª etapa ocorrer de n modos, então,
o número de possibilidades de ocorrência do acontecimento é o produto de m.n.

Exemplo 3:
Quatro ciclistas participam de uma corrida. Quantos resultados existem para o 1º, 2º e 3º lugares?
Solução:
Cada resultado é formado por uma terna do tipo (a,b,c), sendo que a representa o ciclista que
chegou em primeiro lugar, b representa o ciclista que chegou em segundo lugar e c o ciclista que chegou
em terceiro lugar, então o número total dos resultados possíveis é dado pelo princípio fundamental de
contagem 4.3.2=24.

São dois os principais tipos de agrupamentos: Arranjos e combinações.

3. Arranjos

Dado um conjunto A de n elementos, dele retiramos agrupamentos de classe p distintos com


1  p  n . Chama-se arranjos de n elementos tomados p a p, ao número de agrupamentos ordenados de
classe p.

3.1 Notação: An, p

Exemplo 4:
Seja A  1,2,3 . Quantos arranjos desses 3 dígitos dois a dois podemos obter?
Solução:
Os arranjos são: 12, 21, 13, 31, 23 e 32, isto é A3,2  3.2  6 .

3.2. Cálculo do número de Arranjos.

Para a dedução da fórmula dos Arranjos usamos o Princípio Fundamental de Contagem.


Seja o conjunto A  a1, a2 , a3 ,..., an  com n elementos.
i) Os arranjos de n elementos tomados um a um de A, são: (a1 ),(a2 ),(a3 ),...(an ) e, portanto An,1  n
ii) Os arranjos de n elementos tomados dois a dois de A, são:
a1a2 , a1a3 , a1a4 ,..., a1an , a2a1, a2a3 ,..., a2an ,..., an1an , portanto An,2  n.(n 1) .
iii) Arranjos de n elementos tomados três a três são obtidos analogamente por:
An,3  n.(n 1)(n  2) .

Generalizando:

50
An,1  n .......................... para classe p  1
An,2  n.(n 1) ............... para classe p  2
An,3  n.(n 1)(n  2) ..... para classe p  3 e, portanto
.....................
An, p  n(n 1)(n  2)...(n  ( p 1))  n (n 1)(n  2)...(n  p  1) , para classe p

Exemplo 5:
Calcular os arranjos
a) A5,3 =5.4.3=60
b) A6,2 =6.5=30
Exemplo 6:
Determinar o valor de x  2 de modo que Ax,2  56
Ax,2  (x)(x 1)  56 , logo x  8

Exemplo 7:
Seja A  1,2,3,4,5 . Quantos números pares de 3 dígitos podemos escrever?
Solução:
São pares os números terminados por 2 e 4, portanto o dígito das unidades só pode ser 2 ou 4.
Fixando em primeiro lugar o dígito 2 na casa das unidades, as duas primeiras casas podem ser ocupadas
por quaisquer dos arranjos com os dígitos restantes, isto é, A4,2 =4.3=12 e o mesmo ocorre para o dígito 4
na casa das unidades. Portanto, 2 A4,2 =24

4. Fatorial
A fim de simplificar os cálculos definimos fatorial de n, sendo n número natural.
Chama-se fatorial de n e se indica por n! o número natural definido por
n!  n(n 1)(n  2)...3.2.1 para n  2.
1!= 1
0!= 1

Exemplo 8: Calcular os fatorias indicados.


3!=3.2.1=6
4!=4.3.2.1=24
6!=6.5.4.3.2.1=720

5. Fórmula dos Arranjos usando fatorial


Exemplo 9:
7.6.5.4.3.2.1 7!
Escrever A7,3 na forma de fatorial. A5,2  7.6.5  
4.3.2.1 3!
n!
Generalizando: An , p 
(n  p)!

51
Exemplo 10:
Escrever em termos de fatorial.
5! 5! 5.4.3!
a) A5,2 =    5.4  20
(5  2)! 3! 3!
5! 5!
b) A5,0   1
(5  0)! 5!

6. Permutações

Definimos permutações de n elementos por: Pn  An,n  n!  n.(n 1)(n  2)...3.2.1


Exemplo 11:
Calcular P5 .
P5  A5,5  5!  5.4.3.2.1  120
Exercícios de aplicação 7:

1. Um automóvel modelo 2016 é oferecido pelo fabricante em 5 cores diferentes, podendo o


comprador optar entre os motores 1.0 e 1.8. Sabendo-se que os automóveis são fabricados nas versões
“Standart”, “Luxo” e “Super-Luxo”. De quantas maneiras são as alternativas para o comprador?

2. Há 5 linhas de ônibus ligando a cidade Santo André a cidade São Bernardo e 4 linhas ligando a
cidade São Bernardo a cidade São Caetano. Não há nenhuma linha de ônibus ligando a cidade Santo
André à cidade São Caetano. Uma pessoa quer fazer uma viagem de ida e volta entre as cidades Santo
André e São Caetano de modo que na volta não utilize nenhuma linha de ônibus utilizado na ida. De
quantos modos diferentes pode essa pessoa fazer a viagem?

3. Das 9 pessoas presentes a uma reunião devem ser eleitos um presidente, um secretário e um
tesoureiro. Quantas escolhas são possíveis?

52
4. Dados os dígitos 1, 2, 3, 4, 5, 8, formamos números com 5 algarismos distintos.
a) Quantos não contêm o digito 4?

b) Quantos não começam pelo número 4?

5. Com os algarismos 2, 3, 5, 6, 9, vamos formar números de algarismos distintos. Deste modo


podemos formar quantos números
a) de 3 algarismos?

b) de 4 algarismos começados por 6?

c) de 4 algarismos começados por 6 e terminados por 5?

d) ímpares de 4 algarismos?

e) de 5 algarismos em que o 6 e o 3 aparecem juntos, nessa ordem?

53
6. Formados e dispostos em ordem crescente todos os números que se obtém permutando os
algarismos 1, 2, 3, 4, 5, 6, em que lugar estará o número 564213?

7. Numa corrida de automóveis, participaram 10 carros. Sabe-se que 3 deles pertencem à fábrica “A”
e os outros à fábricas diferentes. Quantas disposições de chegada podem ter (todos terminam a prova),
sabendo-se que um representante de “A” vence e os outros dois de “A” chegam a colocações seguidas?

8. Cada linha telefônica nova é formada por 8 dígitos, divididos em dois grupos: um formado pelos
primeiros quatro algarismos que distingue os centros telefônicos e outro com 4 algarismos que
distingue as linhas de um mesmo centro. Suponha que os algarismos de cada grupo são todos
distintos. Quantas linhas telefônicas começando com o algarismo “2” poderiam ser lançadas?

9. Com 7 cores queremos pintar uma bandeira de 5 listas, cada listra com uma cor. De quantas formas
isso pode ser feito?

54
n!
10. Calcular n sabendo-se que  30
(n  2)!

7. Combinações

Em muitas situações interessará apenas retirar subconjuntos de um determinado conjunto e,


determinar o número desses conjuntos.

Seja A um conjunto de n elementos, isto é, A  a1, a2 , a3 ,..., an  . Chamamos de combinações de


n elementos tomados p a p, ao número de subconjuntos de A formados de p elementos.
Notação: Cn, p ou np 
Exemplo 12:
Seja A  a, b, c, d, quantos subconjuntos de 3 elementos podemos formar?

São eles: a, b, c,a, b, d,a, c, d,b, c, d, então  34   4


7.1 Cálculo do número de combinações

No exemplo 12 encontramos o número de combinações de 4 elementos tomados 3 a 3, isto é,



C4,3  34  4 . Façamos para cada uma das combinações todas as permutações possíveis, assim:

abc abd acd bcd


acb  adb  adc bdc
   
bac bad cad cbd
(6  3!)  (6  3!)   6  3!  (6  3!)  , dessa maneira, encontramos
bca bda cda cdb
cab  dab  dac  dcb
   
cba  dba  dca dbc

arranjos de 4 elementos tomados 3 a 3 ( A4,3  4 6  4 3! 24 ) e não combinações. Logo para


obtermos as combinações devemos dividir por 6=3! assim:

55
   4 = 246  24
A4,3 A
C4,3  4
3   C4,3  4,3 e generalizando para n elementos tomados p a p,
3! 3! 3!
segue:
An, p n!
Cn, p  
p! (n  p)! p!

7.2 Triângulo de Pascal

Os números binomiais podem ser dispostos ordenadamente na forma de um triângulo, com seus
resultados. Observe que a soma de dois números da linha de cima reproduz o elemento da linha de baixo

 0
0  1
 1
0   1
1 1 1
 2
0   
2
1
2
2 1 2 1
 3
0    
3
1
3
2
3
3 1 3 3 1
 4
0     
4
1
4
2
4
3
4
4 1 4 6 41

Exemplo 13:
A prova de geografia consta de 10 questões e a professora pede que os alunos escolham 6
questões. Quantos são os modelos de provas?
Solução:
Notemos que a ordem em que o aluno escolher as 6 questões não importa, portanto tem-se
combinações de 10 questões 6 a 6, isto é

10  10! 10.9.8.7.6! 10.9.8.7


 6  (10  6)!6!  4!6!  4.3.2.1  210
 

56
Exemplo 14:
Sobre uma circunferência marcam-se 7 pontos, 2 a 2 distintos. Quantos triângulos podem formar
com vértice nos pontos marcados?
Solução:
Notemos que um triângulo fica determinado, escolhendo-se três pontos não importando a ordem.
Portanto trata-se de um problema de combinações, isto é C7,3     (7 7!3)!3!  35
7
3

Exercícios de aplicação 8:
1. Considerando-se: 5 vereadores, 3 deputados e 2 senadores, quantas comissões de 4 elementos
podemos formar de modo que em cada comissão tenha
a) 3 vereadores? b) 2 vereadores,1deputado e um senador?

c) algum vereador? d) no máximo 1 deputado?

e) no mínimo 1 deputado? f) 3 vereadores ou 2 deputados?

g) 1 senador ou 3 vereadores?

2. Qual o número de subconjuntos com 2 ou 4 ou 5 elementos que tem um conjunto de 7 elementos.

57
3. Considerando-se 12 pontos distintos no espaço, dos quais 4 são coplanares, quantos planos são
definidos pelos 12 pontos?

4. Uma urna tem 6 bolas brancas, 4 pretas e 3 vermelhas. De quantas maneiras podemos extrair 5
bolas, sem reposição, sucessivamente, de modo que sejam
a) 3 brancas? b) nenhuma preta?

c) pelo menos 2 brancas? d) no máximo 3 pretas?

e) 2 vermelhas ou 3 pretas? f) 3 brancas ou 3 pretas?

5. Uma pessoa tem 11 amigos. De quantas maneiras ela pode convidar 5 deles para jantar, se:
a) Felipe e Carol são casados e não comparecerão separadas?

58
b) 2 deles não se falam e, portanto, não comparecerão juntos?

6. Considerando um baralho de 52 cartas, quantos jogos de 4 cartas podemos formar de modo que
em cada jogo tenha

a) exatamente 3 cartas de ouro?

b) no máximo um valete?

59
CAPÍTULO 3
PROBABILIDADE
1. Conceitos

1.1 Experimento determinístico

Um experimento se diz determinístico quando repetido em mesmas condições conduz a


resultados idênticos.

Exemplo 1:
De uma urna que contém 6 bolas branca, tira-se uma bola e verifica-se sua cor, sempre ocorrerá
bola branca.

1.2 Experimento aleatório

Um experimento se diz aleatório quando repetido em mesmas condições conduz a resultados


diferentes.
Exemplo 2:
No lançamento de um dado é impossível prever exatamente qual a face que estará voltada para
cima.
A teoria das probabilidades desenvolve modelos que podem ser utilizados no estudo de
fenômenos aleatórios.

2. Espaço amostral

Situação-problema:
Uma urna contém cinco bolas brancas e uma preta. Extraindo-se uma bola, qual é a cor mais
provável?
Casos possíveis são: S={B,B,B,B,B,P}. Portanto as brancas têm mais chances que a preta. Neste
caso usaremos a fórmula introduzida pelo Italiano Cardano (1501-1576), dada pelo quociente do número
de casos favoráveis pelo número de casos possíveis. Assim a probabilidade da extração da bola branca
5 1
p(B)  e da bola preta é p(P)  .
6 6
Chama-se espaço amostral ao conjunto de todos os resultados possíveis de ocorrer e indicaremos
pela letra S.
Na situação-problema o espaço amostral é dado por S={B,B,B,B,B,P}.

3. Evento de um espaço amostral

Chama-se evento a qualquer subconjunto do espaço amostral.


Exemplo 3:
Dar o espaço amostral para o lançamento de duas moedas, observando as faces voltadas para
cima.

60
Chamando de C a face cara e de R a face coroa, podemos escrever seu espaço amostral:
S  CC, CR, RC, RRe definimos os eventos:
A: ocorre duas caras, A  CC e B: ocorre faces iguais, B  CC, RR
Exemplo 4:
No lançamento de um dado dar o espaço amostral e os elementos do evento número par.
Solução: O espaço amostral é dado por todos os acontecimentos possíveis, isto é:
S  1,2,3,4,5,6 .
Seu evento número par é dado por P  2,4,6

3.1 União de eventos de um espaço amostral

Dados dois eventos A e B de um espaço amostral S, chama-se união de A e B ao evento formado


pelos resultados de A ou B e indicamos por A  B .

3.2 Intersecção de eventos de um espaço amostral

Dados dois eventos A e B de um espaço amostral S, chama-se intersecção de A e B ao evento


formado pelos resultados de A e B e indicamos por A  B .

3.3 Evento complementar

Chama-se evento complementar do evento A aquele formado pelos resultados que não são de A e
indicamos por A ou ainda A  x  S | x  A .
Exemplo 5:
No lançamento de um dado, determinar
a) Seu espaço amostral;
b) A: elementos do evento número par;
c) B: elementos do evento número ímpar;
d) C: elementos do evento número primo;
e) D: elementos do evento número par ou primo;
f) E: elementos do evento número par e primo e
g) F: elementos do evento complementar do número par.

Solução:
a) Seu espaço amostral é dado por todos os acontecimentos possíveis, S  1,2,3,4,5,6 .
b) Seu evento número par é dado por A  2,4,6 .
c) Seu evento número ímpar é dado por B  1,3,5.
d) Seu evento número primo é dado por C  2,3,5 .
e) Seu evento número par ou primo é dado por D  A C  2,3,4,5,6 .
f) Seu evento número par e primo é dado por E  A C  2
g) Seu evento complementar do número par é F  A  B  1,3,5

61
4. Conceito de probabilidade

Em um experimento aleatório e para um determinado evento, há sempre um grau de incerteza


quanto a sua ocorrência, ou não. Procuraremos fazer afirmações com respeito às chances de cada evento,
isto é, seus possíveis resultados.

Seja o espaço amostral finito S  a1, a2 , a3 ,..., an  . A cada evento elementar atribuímos um
número real que corresponde à chance de ser o resultado do experimento. Assim,
O evento a1 com chance p(a1 )
O evento a2 com chance p(a2 )
O evento a3 com chance p(a3 )
...............................................
O evento an com chance p(an ) , com p(ai ) satisfazendo as condições:
a) Cada p(ai ) é um número real maior ou igual a zero, porém menor ou igual a 1.
b) A soma p(a1 ) + p(a2 ) + p(a3 ) +...+ p(an ) =1.
Dessa maneira, denominamos de probabilidade p(ai ) do evento ai .
Exemplo 6:
No lançamento de um dado e observando a face superior, temos o espaço amostral
S  1,2,3,4,5,6 e cada uma das seis faces tem a mesma probabilidade, isto é,
1
a) p(1)  p(2)  p(3)  p(4)  p(5)  p(6)  0
6
b) p(1)  p(2)  p(3)  p(4)  p(5)  p(6)  1

Observação 1: Se o evento for o espaço S, então p(S )  1 e denomina-se probabilidade do evento certo.
2) Se o evento for o subconjunto vazio de S, então p( )  0 .
3) Se A é um evento qualquer de S, então 0  p( A)  1

4.1 Probabilidade no espaço amostral equiprovável

Um espaço se diz equiprovável quando os seus eventos elementares ocorrem com probabilidades
1
iguais. Neste caso a probabilidade de cada evento elementar de S é dada por: p( A)  , sendo n(S )
n(S )
número de elementos do espaço amostral.
Sendo A um evento de S com n( A) elementos, então a probabilidade de A é dada por:

n( A) nº deelementos de A
p( A)   , ou ainda
n(S ) nº de elementos de S

n( A) nº de casos favoráveis a A
p( A)  
n(S ) nº de casos possíveis de S

62
Exemplo 7:
No lançamento de duas moedas, qual a probabilidade de obtermos duas coroas?
Solução:
Espaço amostral: n(S)  (c, c),(c, r),(r, c),(r, r) , sendo c: caras e r: coroa.
n( A) 1
Evento A  (r, r) , logo, p( A)  
n(S ) 4
Exemplo 8:
Tira-se ao acaso uma carta de um baralho de 52 cartas. Qual a probabilidade de que seja a) carta
de ás? b) figura? c) carta de ouro? d) carta vermelha?
Solução: O espaço amostral: n(S)  52 cartas
a) Se A: carta de ás, então p( A)  n( A)  4  1
n(S ) 52 13
b) Se F: carta figura, então p(F )  n(F )  12  3
n(S ) 52 13
c) Se O: carta de ouro, então p(O)  n(O)  13  1
n(S ) 52 4
d) Se V: carta vermelha, então p(V )  n(V )  26  1
n(S ) 52 2

4.2 Definição de Probabilidade

Seja p uma função definida no conjunto das partes de S, (S ) e imagem no conjunto dos reais
[0,1], isto é, p :(S ) [0,1] , satisfazendo as propriedades:

a) p(S )  1(probabilidade do evento certo)


b) p( Ai  Aj )  p( Ai )  p( Aj ) se Ai  Aj  ,para i  j , então p é uma função de probabilidade
relativa ao evento A.
O par  S, p denomina-se espaço de probabilidade.
4.3 Teoremas

Teorema 1:
Se A e B são eventos quaisquer de S, então p( A  B)  p( A)  p(B)  p( A  B) .
Demonstração: Escrevendo A  B e B como dois eventos mutuamente excludentes e usando a
propriedade b, segue:
A
B

A  B  A  (B  A)  p( A  B)  p[ A  (B  A)]  p( A)  p(B  A) (I)

63
B  ( A  B)  (B  A)  p(B)  p( A  B)  p(B  A) (II), subtraindo (I) de (II), segue

p( A  B)  p(B)  p( A)  p( A  B) , logo p( A  B)  p( A)  p(B)  p( A  B) .

Teorema 2:
Se A e A são eventos de S, então p( A)  1 p( A)
Demonstração: Sabemos que S  A  A e usando a propriedade b, segue:

p(S )  p( A)  P( A) , mas p(S )  1e assim p(S)  p( A)  P( A)  1 e, portanto,

p( A)  1 p( A)

Teorema 3:
Se  é um evento de S, então p( )  0
Demonstração: Para qualquer evento A, podemos escrever A   A e usando a propriedade b, segue:
p( A )  p( A)  p()  p( A) , logo, p( )  0

Teorema 4:
Se A, B e C são eventos quaisquer de S, então
p( A  B C)  p( A)  p(B)  p(C)  p( A  B)  p( A C)  p(B C)  p( A  B C)

Demonstração: A demonstração consiste em escrever A  B  C na forma ( A  B)  C e aplicar o


teorema 1.

Exemplo 9:

Se p( A)  0,7 e p(B)  0,2 , determinar p( A  B) nos casos


a) p( A  B)  0,1
b) A e B mutuamente exclusivos.

Solução:
a) Sabemos pelo teorema 1 que p( A  B)  p( A)  p(B)  p( A  B) e substituindo

p( A  B) =0,7+0,2-0,1=0,8

b) Se A e B mutuamente exclusivos, então p( A  B)  0 , logo

p( A  B) =0,7+0,2=0,9

Exemplo 10:
Jogando-se um dado, qual a probabilidade de se obter o número 4 ou um número par?
Solução:
Sejam os eventos:

64
A: sair número 4, logo n( A)  1
B: sair número par, logo n(B)  3 , e n( A  B)  1. Pelo teorema 1, segue
1 3 1 3 1
p( A  B)  p( A)  p(B)  p( A  B) e substituindo p( A  B) =    
6 6 6 6 2

Exemplo 11:
Uma urna contém 20 etiquetas numeradas de 1 a 20. Qual a probabilidade de retirarmos um
número que seja primo ou quadrado perfeito?
Solução:
Sejam os eventos:
A: sair número primo, logo A  2,3,5,7,11,13,17,19 e n( A)  8
B: sair número quadrado perfeito, logo B  1,4,9,16 e n(B)  4 , e n( A  B)  0. Pelo teorema
8 4 12 3
1, segue p( A  B)  p( A)  p(B)  p( A  B) e substituindo p( A  B) =  0   .
20 20 20 5
Exemplo 12:
Em uma urna existem 5 bolas brancas e 3 pretas. Retirando-se 2 bolas ao acaso, qual a
probabilidade de que
a) A: ambas sejam pretas?
b) B: seja uma de cada cor?
c) C: a primeira seja branca e a segunda seja preta?
n(P, P) (32 ) 3
Solução: a) p( A)   8 
n(S ) (2 ) 28
(5 ).(3 ) 5.3 15
b) p(B)  1 8 1  
(2 ) 28 28
c) Para responder a essa pergunta colocamos novo conceito.

5. Probabilidade Condicional

Situação-problema: Extrai-se ao acaso uma carta de um baralho ordinário de 52 cartas. Determinar a


probabilidade de a carta ser um rei de ouro sabendo-se que a carta retirada é vermelha.
Solução:
Do fato de sabermos que ocorreu o evento carta vermelha, tem-se um novo espaço amostral
1
formado pelas cartas vermelhas, isto é, n(S )  26 e, portanto, p( R / V ) 
.Esta probabilidade que
26
usamos nessa situação-problema denomina-se probabilidade condicional. A notação p(R / V ) lê-se
probabilidade de sair rei de ouro dado que já saiu carta vermelha.
Definição:
Dados dois eventos A e B de um espaço amostral S. Denominamos probabilidade condicional do
evento B dado que o evento A tenha ocorrido, e indicamos por p(B / A) , a probabilidade de B dado que
A ocorreu a
p( A  B)
p(B / A)  , com p( A)  0
p( A)

65
Observação 2: Aceitamos sem demonstração que:
p( A  B)
i) Se B ocorreu p( A / B)  , com p(B)  0
p(B)
p( A  A)
ii) p( A / A)  1
p( A)
iii) p(S / A)  1
iv) p(B C / A)  p(B / A)  p(C / A) se B C  

Exemplo 13:
Dois dados são lançados e os valores da face superior são registrados como pares ( x, y). Seja S
seu espaço amostral e consideremos os eventos assim definidos:
A  (x, y) | x  y  10 e B  (x, y) | x  y . Pede-se
a) p( A / B) b) p  B / A
Solução:
Se dois dados são lançados, então n(S)  6.6  36 e os elementos de A e B são:
A  (x, y) | x  y  10 = (5,5),(6,4),(4,6) e n( A)  3 segue: p( A)  3/ 36  1/12
(2,1),(3,1),(3,2),(4,1),(4,2),(4,3),(5,1),(5,2),
B  (x, y) | x  y =   e n(B)  15 e segue:
(5,3),(5,4),(6,1),(6,2),(6,3),(6,4),(6,5) 
p(B)  15/ 36  5/12
A  B  (6,4) e n( A  B)  1, e segue p( A  B)  1/36 . Usando a fórmula tem-se:
p( A  B) 1/ 36 1
a) p( A / B)   
p(B) 5/12 15
p( A  B) 1/ 36
b) p(B / A)    12/ 36  1/ 3
p( A) 1/12

6. Probabilidade do produto

A probabilidade de ocorrer simultaneamente dois eventos A e B do mesmo espaço S, é igual ao


produto da probabilidade pela probabilidade condicional do outro dado o primeiro.
p( A  B)  p( A). p(B / A) ou p( A  B)  p(B). p( A / B)

Exemplo 14:
Extrai-se ao acaso duas cartas de um baralho ordinário de 52 cartas. Determinar a probabilidade
de aparecer 2 reis?
Solução:
Seja A  rei na primeira cartae B  rei na segunda carta , assim,
p( A)  4/ 52 e p(B / A)  3/ 51, pela fórmula da probabilidade do produto, segue:
4 3 1 1 1
p( A  B)  p( A). p(B / A) = .  . 
52 51 13 17 221

66
Voltando ao exemplo 12, respondemos a pergunta c) a primeira seja branca e a segunda seja
5 3 15
preta nessa ordem? Então, segue p(B  P)  .  .
8 7 56
Exemplo 15:
Em uma sala existem 10 alunos, sendo 6 rapazes e 4 garotas.

a) Retirando-se 1 aluno aleatoriamente , qual a probabilidade de


a1) Ser rapaz?
6
p( R)   0,6
10
a2) Ser garota?
4
p(G)   0,4
10

b) Retirando-se 2 alunos aleatoriamente , qual a probabilidade de


b1) serem rapazes?
65 1
p(R  R)    0,333
10 9 3
b2) serem na ordem 1 rapaz e uma garota?
6 4 4
p(R  G)    0.2667
10 9 15
b3) serem 1 rapaz e uma garota?
6 4 8
p(R  G)  2   0.5333
10 9 15

c) Retirando-se 3 alunos aleatoriamente , qual a probabilidade de


b1) serem rapazes?

6 54 1
p(R  R  R)    0,1667
10 9 8 6

b2) serem na ordem rapaz , garota e rapaz?

6 45 1
p(R  G  R)    0,1667
10 9 8 6

b3) serem 2 rapazes e uma garota?

6 54 1
p(R  R  G)  3.   0,5
10 9 8 2

67
6.1. Eventos independentes

Dois eventos são independentes se a ocorrência de um deles não afeta a probabilidade de


ocorrência do outro e podemos escrever:

A e B são eventos independentes se, e somente se p( A  B)  p( A). p(B) .

Observação 3:

Esta definição é equivalente dizer que p( A / B)  p( A) e p(B / A)  p(B)

Exemplo 16:
Lança-se um dado e uma moeda. Qual a probabilidade de se obter cara na moeda e o número 6
no dado?
Solução:
Seja o evento A: sair cara, então n( A)  1 e B: sair a face 6, então n(B)  1 . Sendo A e B
eventos independentes, segue:
1 1 1
p( A  B)  p( A). p(B) = . 
2 6 12

Exemplo 17:
No lançamento de três moedas, qual a probabilidade de se obter cara nas três moedas?
Solução:
1
Seja o evento A: sair cara em uma moeda é igual a p( A)  . Sendo os eventos independentes
2
segue:
1 1 1 1
p( A  A  A)  . . 
2 2 2 8

Exemplo 18:
Sejam as urnas U1 com 2 bolas brancas e 4 vermelhas e U2 com 3 bolas brancas e 4 vermelhas.
Retirando-se ao acaso uma bola de cada urna, qual a probabilidade de se obter uma branca e uma
vermelha?
Solução:
Devemos retirar B / U1 e V / U2 e depois V / U1 e B/U2 e usando a probabilidade do produto
segue:
2 4 4 3 20 10
p(B V )  P(V  B)  .  .  
6 7 6 7 42 21

68
Exercícios de aplicação 9:

1. Extrai-se ao acaso uma carta de um baralho ordinário de 52 cartas. Determinar a probabilidade de a


carta ser
a) um ás.

b) um valete de copas.

c) três de paus ou seis de ouro.

d) uma carta de copas.

e) de qualquer naipe exceto copas.

f) um dez ou uma carta de espadas.

g) nem quatro nem carta de paus.

2. Extrai-se ao acaso uma bola de uma caixa que contém 6 bolas vermelhas, 4 brancas e 5 azuis.
Determine a probabilidade de a bola ser:

a) vermelha.

b) branca.

c) azul.

d) não vermelha.

e) vermelha ou branca.

69
3. Joga-se um dado honesto duas vezes. Determinar a probabilidade de se obter 4, 5, ou 6 na primeira
jogada e 1, 2, 3, ou 4 na segunda jogada?

4. Extraem-se aleatoriamente 2 cartas de um baralho comum de 52 cartas. Determine a probabilidade


de serem ambas ases se a primeira carta
a) é reposta .

b) não é reposta.

5. Uma caixa que contém 6 bolas vermelhas, 4 brancas e 5 azuis. Extraem-se três bolas sucessivas e
aleatoriamente, determine a probabilidade de as mesmas serem extraídas na ordem vermelha-
branca-azul
a) havendo reposição.

b) não havendo reposição.

6. Uma caixa contém 8 bolas vermelhas, 3 brancas e 9 azuis. Extraindo-se ao acaso 3 bolas, sem
reposição, determine a probabilidade de
a) todas serem vermelhas.

b) todas serem brancas.

c) 2 serem vermelhas e uma azul.

d) ao menos uma ser branca.

e) ser uma de cada cor.

f) as bolas serem extraídas na ordem vermelha-branca-azul.

70
7. Uma estante contém 6 livros de matemática e 4 de física. Determine a probabilidade de 3 livros de
matemática em particular estarem juntos.

8. Jogando-se 3 dados, calcular a probabilidade de que a soma dos pontos obtidos seja superior a 14?

Exercícios de aplicação 10:

1. Uma caixa contém 25 bolas numeradas de 1 a 25. Extraindo-se uma bola ao acaso, qual a
probabilidade de que o número seja
a) par.

b) ímpar.

c) par e menor que 10.

d) primo e maior que 3.

e) múltiplo de 3 e 5.

2. Uma urna contém 7 bolas gravados com as letras A,A,A,C,C,R,R. Extraindo-se as bolas uma por
uma calcular a probabilidade de obter-se a palavra CARCARA.

71
3. Uma gaveta contém 50 parafusos e 150 porcas. Metade dos parafusos e metade das porcas
está enferrujada. Se uma dessas peças for escolhida ao acaso, qual será a probabilidade de que
esteja enferrujada ou seja um parafuso?

4. Uma caixa contém 5 bolas brancas e 3 bolas pretas. Duas bolas são retiradas simultaneamente ao
acaso e substituídas por 3 bolas azuis. Em seguida 2 bolas são retiradas ao acaso da caixa. Calcular a
probabilidade de que essas 2 últimas bolas sejam da mesma cor.

5. O número de uma placa de um carro é par. Qual a probabilidade de o algarismo das unidades ser 0?

6. Numa urna são depositadas n etiquetas numeradas de 1 a n. Três etiquetas são sorteadas (sem
reposição). Qual a probabilidade de que os números sorteados sejam consecutivos?

72
7. Num grupo de 60 pessoas, 10 são torcedores do São Paulo, 5 são do Palmeiras e as demais são do
Corinthians. Escolhido ao acaso um elemento do grupo, qual a probabilidade dele ser torcedor do São
Paulo ou do Palmeiras?

8. Um prédio de 3 andares, com dois apartamentos por andar, têm apenas 3 apartamentos ocupados.
Qual a probabilidade de que cada um dos 3 andares tenha exatamente um apartamento ocupado?

9. Uma urna contém 1 bola branca 3 bolas pretas. Extrai-se 3 bolas consecutivas e aleatoriamente,
sem identificar a cor de cada uma. Qual a probabilidade da bola que ficou na urna ser branca?

10. 10. Uma urna contém 4 fichas brancas e 5 pretas. Extraindo-se sucessivamente duas fichas, qual a
probabilidade da
a) a) 1ª ser branca sabendo-se que a 2ª é branca?

b) b)1ª ser branca sabendo-se que a 2ª é preta ?

11.11. A probabilidade de um marido e sua esposa estarem vivos daqui a 20 anos são respectivamente 0,6
e 0,8. Qual a probabilidade de que daqui a 20 anos
a) a a) ambos estarem vivos?

b) n b) nenhum estar vivo?

c) pelo menos um estar vivo?

73
12. Uma caixa contém 9 fichas numeradas de 1 a 9. Extraem-se 3 fichas sucessivamente. Determinar
a probabilidade de saírem
a) nessa ordem ímpar-par-ímpar?

b) dois ímpares e um par?

13. Sejam dois eventos associados a um experimento. Seja p(A)=0,4, p(A  B)=0,7. Se p(B)=k, então
o valor de k para que A e B sejam
a) mutuamente exclusivos.

b) independentes.

14. Escolhendo-se, aleatoriamente, uma carta de um baralho de 52 cartas, pede-se:


a) A probabilidade de ser uma carta de ouro?

b) A probabilidade de ser uma figura?

15. Num lote de 12 peças, 4 defeituosas. 2 peças são retiradas, aleatoriamente. Calcule
a) a probabilidade de ambas serem defeituosas.

b) a probabilidade de ambas não serem defeituosas.

c) a probabilidade de ao menos uma ser defeituosa.

74
16. Um lote é formado por 10 artigos bons, 4 com defeitos e 2 com defeitos graves. Retiram-se 2
artigos, aleatoriamente. Qual a probabilidade de que
a) ambos sejam perfeitos.

b) ele não tenha defeitos graves.

c) nenhum tenha defeito grave.

d) nenhum seja perfeito.

Exercícios de aplicação 11:

1. No lançamento de um dado observe a face voltada para cima. Definimos: A ocorre número par; B
ocorre número primo e S espaço amostral. Dessa maneira seus elementos são
(A) S= 0,1,2,3,4,5,6, ; A= 0,2,4,6, e B= 1,3,5
(B) S= 0,1,2,3,4,5,6, ; A= 0,2,4,6, e B= 3,5
(C) S= 1,2,3,4,5,6, ; A= 2,4,6, e B= 1,3,5
(D) S= 1,2,3,4,5,6, ; A= 2,4,6, e B= 2,3,5
(E) nda
2. No lançamento de dois dados observe as faces voltadas para cima. Definimos o evento A como a
soma das faces iguais a 7. A probabilidade de ocorrer A é

(A) 0,166
(B) 0,333
(C) 0,5
(D) 0,194
(E) nda.
3. Uma estante contém 4 livros de matemática e 5 de estatística. Retirando-se ao acaso 3 livros sem
reposição, então a probabilidade de saírem 2 de matemática e 1 de estatística é

(A) 0,06 (B) 0,12 (C) 0,24 (D) 0,36 (E) 0,26

75
4. Em um grupo de 60 torcedores, 15 são Palmeirenses, 20 flamenguistas e 25 corintianos. Se um
torcedor é escolhido ao acaso para assistir um jogo na tribuna de honra, então a probabilidade de ser
corintiano ou flamenguista é

(A) 0,15
(B) 0,25
(C) 0,50
(D) 0,75
(E) 0,85
5. Uma urna tem 2 bolas brancas e 3 pretas. Retirando-se duas bolas, sem reposição, a probabilidade
de sair uma de cada cor é

(A) 0,2
(B) 0,4
(C) 0,6
(D) 0,8
(E) nda
6. Na sala do Curso de Estatística tem 20 rapazes e 10 garotas. Metade dos rapazes e metade das
garotas tem olhos castanhos. A probabilidade de um aluno ser escolhido ao acaso ser rapaz ou ter
olhos castanhos é

(A) 0,833
(B) 0,666
(C) 0,333
(D) 0,5
(E) nda
7. Um caixa possui 20 peças das quais 12 são defeituosas e 8 perfeitas e são inspecionadas uma após a
outra. Se forem extraídas ao acaso 2 peças, qual a probabilidade de uma ser perfeita e a outra
defeituosa nessa ordem, com reposição?

8. Um caixa possui 20 peças das quais 12 são defeituosas e 8 perfeitas e são inspecionadas uma após a
outra. Se forem extraídas ao acaso 2 peças, então a probabilidade de uma ser perfeita e a outra
defeituosa nessa ordem, sem reposição é

(A) 0,492
(B) 0,505
(C) 0,542
(D) 0,252
(E) nda

76
Exercícios de aplicação 12:
1.Uma bolsa tem 4 cédulas de R$ 50,00 e 2 cédulas de R$ 10,00. Retirando-se duas cédulas a
probabilidade de sair soma R$ 60,00 é

(A) 0,533 (B) 0,466 (C) 0,366 (D) 0,266 E) nda


2. O setor de RH de uma empresa tem 4 gerentes, 3 subgerentes e 3 auxiliares de administração. Se
dois funcionários são escolhidos ao acaso para serem promovidos, então a probabilidade de ser um
gerente e um subgerente é

(A) 0,30 (B) 0,13 (C) 0,27 (D) 0,70 (E) 0,85
3. Em uma sala existem 3 alunos do curso de administração e 2 do curso de direito. Retirando-se dois
alunos ao acaso, a probabilidade do primeiro ser de administração e o segundo de direito é

(A) 0,1 (B) 0,2 (C) 0,3 (D) 0,4 (E) 0,5
2 4 7
4. As probabilidades de três jogadores marcarem um pênalti são respectivamente: , e . Se
3 5 10
cada um “cobrar” uma única vez, a probabilidade de todos errarem é:

(A)100% (B) 20% (C) 12% (D) 0,5% (E) 28%


5. Jogam-se 2 dados e verifica-se os pontos da face superior. Então a probabilidade do produto dessas
faces ser um número entre 12 e 15 (inclusive) é

(A) 0,17. (B) 0,19. (C) 0,21. (D) 0,23. (E) 0,25.

77
6. Um grupo de pessoas são leitoras de três jornais; A,B e C e estão classificados na tabela que segue.
Escolhida uma pessoa ao acaso e sabendo-se que lê o jornal C, então a probabilidade se ser mulher é
A B C
Homens 25 35 40
mulheres 20 18 12

(A) 0,15. (B) 0,17. (C) 0,19. (D) 0,21. (E) 0,23
7. Seja um baralho de 52 cartas. Selecionadas aleatoriamente 3 cartas desse baralho, então a
probabilidade das duas primeiras serem damas e a terceira ser rei é

(A) 0,000362. (B) 0,000462. (C) 0,000562. (D) 0,000662. (E) 0,000762.

Exercícios de aplicação 13:

1. Uma empresa possui os seguintes departamentos: A (4 operários), B (6 operários) e C (10


operários). Na segunda-feira, 2 operários faltaram. Qual a probabilidade de que os dois sejam de um
mesmo departamento?

2. Sejam A e B dois eventos tais que p(A)=0,4 e p(A  B)=0,7 e p(B)=p. Para qual valor de p, A e B
são independentes?

78
3. Um operador observa 3 máquinas M1, M2 e M3. A probabilidade, em uma hora, de que ele tenha
que intervir na máquina M1, é 13%; em M2 é 34% e em M3 é 53%. A probabilidade de ter que intervir
em duas maquinas ao mesmo tempo é 5% e, nas três, é nula. Qual a probabilidade, em uma hora, ele
intervir em M1 ou M3?

4. No lançamento de dois dados observe a face voltada para cima. Definimos o evento A como a
soma das faces iguais a 7. Qual a probabilidade de ocorrer A?

5. Numa sala de aula existe moças e rapazes que torcem para 3 times segundo a tabela abaixo

moças rapazes
São Paulo 11 26
Palmeiras 8 4
Corinthians 1 0

a) Se for moça, qual a probabilidade de ser palmeirense?

b) Se for rapaz, qual a probabilidade de ser corintiano?

c) Se for são-paulino, qual a probabilidade de ser rapaz?

d) Se for corintiano, qual a probabilidade de ser moça?

1 1
6. Seja um espaço amostral. Se p(a1 )  1 , p(a2 )  , p(a3 )  . Se p é uma função de
3 4 4
probabilidade definida no espaço S , então o valor de p(a4 ) é

(A) 0 (B) 1/3 (C) -1/6 (D)1/6 (E) 5/6

79
7. Se metade dos alunos da disciplina de Estatística possui automóvel, um terço possui bicicleta e
um quarto possui ambos, então a probabilidade de se encontrar um aluno dessa sala e que possua
meio de transporte próprio é

(A) 7/12 (B) 4/12 (C) 3/12 (D) 2/12 (E) 1/12
8. Se A e B são eventos de S e p( A)  3/8, p(B)  5/8 e p( A  B)  3/ 4, então p( A/ B)
é igual a

(A) 1/2 (B) 1/3 (C) 2/3 (D) 2/5 (E) 2/6
9. Em uma sala de Estatística existem 10 garotas e 20 rapazes. Se uma comissão de 3 alunos é
formada, então a probabilidade da comissão ter exatamente 2 rapazes é

(A) 0,47 (B) 0,44 (C) 0,37 (D) 0,34 (E) 0,16
10. Dos alunos do segundo semestre do Curso de Estatística 12% foram reprovados em Matemática
e 15% em Estatística e 10% em ambas as disciplinas. Um aluno dessa turma é selecionado
aleatoriamente. Se ele foi reprovado em Estatística , então a probabilidade de ter sido reprovado em
Matemática é

(A) 12/17 (B) 15/17 (C) 10/17 (D) 2/3 (E)1/3

80
11. Se uma carta é retirada de um baralho de 52 cartas bem misturadas, então a probabilidade de sair
um rei preto, dado que a carta retirada foi uma figura é

(A) 2/5 (B) 1/5 (C) 1/6 (D) 1/3 (E) 2/3
12. Dez fichas numeradas de 1 a 10 são colocadas em uma caixa. Se duas fichas são extraídas
sucessivamente sem reposição, então a probabilidade da soma ser 10 é

(A) 0,1777 (B) 0,1111 (C) 0,0888 (D) 0,0666 (E) 0,0555
13. Considere as igualdades abaixo:
I. p( A  B)  p( A  B )
II. p( A  B)  p( A  B )
III. p( A  B)  1  p( A  B)

Podemos afirmar que:


(A) As igualdades II e III são verdadeiras.
(B) As igualdades I e II são verdadeiras.
(C) Apenas a igualdade I é verdadeira.
(D) Apenas a igualdade III é verdadeira.
(E) Apenas a igualdade II é verdadeira.

81
CAPÍTULO 4
PROBABILIDADE DE BAYES
1. Partição de um espaço amostral

Os eventos B1, B2 , B3 ,..., Bk , formam uma partição do espaço amostral S, se:


a) p(Bi )  0,para i 1,2,3,..., k
b) Bi  Bj  , para i  j
k
c) Bi  S
i 1

Exemplo 1:
No lançamento de um dado tem-se o espaço amostral S  1,2,3,4,5,6 e definimos os eventos
B1  1, B2  2,3,4 e B3  5,6. Os eventos B1, B2 e B3 formam uma partição de S, pois, valem as três
condições: a), b) e c).

Teorema 1: Se os eventos B1, B2 , B3 ,..., Bk , formam uma partição do espaço amostral S e A  S , então
k
p( A)   p( A / Bi ). p(Bi )
i 1
Demonstração: A figura ilustra uma partição de S com A  S . Assim podemos escrever:

B3 B4
B1 A
B2 Bk

A  ( A  B1)  ( A  B2 ) ...  ( A  Bk ) , como A é a união de conjuntos disjuntos, usamos a definição de


probabilidade:
p( A)  p( A  B1)  p( A  B2 )  ...  p( A  Bk ) (I) e para cada termo das parcelas usamos a
probabilidade do produto, assim

p( A  B1)  p( A / B1). p(B1)


p( A  B2 )  p( A / B2 ). p(B2 )
p( A  B3 )  p( A / B3 ). p(B3 )
.............................................
p( A  Bk )  p( A / Bk ). p(Bk ) . Substituindo em (I) segue:

82
p( A)  p( A / B1). p(B1) + p( A / B2 ). p(B2 ) + p( A / B3 ). p(B3 ) +...+ p( A / Bk ). p(Bk ) e colocando em forma
k
somatório tem-se: p( A)   p( A / Bi ). p(Bi ) .
i 1
Exemplo 2:
Na cidade de Catu existem três lojas que revendem televisores. A loja A revende 25%, a loja
B, 35% e a C, 40% dos televisores. Um cliente deseja comprar um televisor de LCD com 42
polegadas, em virtude do bom atendimento e da localização dessas lojas, a probabilidade de
comprar na loja A é 10%, na loja B é 12% e na loja C é 18%. Qual a probabilidade de ter adquirido
um televisor de 42 polegadas?
Solução: Seja L: televisor de LCD com 42 polegadas
A B C

Do enunciado podemos escrever:


p( A)  0,25; p(L / A)  0,1
p(B)  0,35; p(L / B)  0,12 e, portanto: p(L)  0,25x0,1+0,35x0,12+0,4x0,18=0,139
p(C)  0,4; p(L / C)  0,18
2. Teorema de Bayes
Se os eventos B1, B2 , B3 ,..., Bk , formam uma partição do espaço amostral S e seja A  S , então

p( A / Bj ) p(Bj )
p(Bj / A)  k

 p( A / B ) p(B )
i 1
i i

Da definição de probabilidade condicional, podemos escrever:

p( A  Bj ) p( A / Bj ) p( Bj )
p(Bj / A)   k
p( A)
 p( A / Bi ) p(Bi )
i 1

Exemplo 3:
Adotando o mesmo enunciado do exemplo 1, podemos fazer a seguinte pergunta: Um televisor
de LCD com 42 polegadas foi adquirido, qual a probabilidade de tem sido comprado na loja C?

p(L / C) p(C) 0,4x0,18 0,072


Solução: Devemos determinar p(C / L)  = =  0,518
p(L) 0,139 0,139

83
Exemplo 4:
Sejam as urnas e as bolas. Uma urna é escolhida ao acaso e uma bola é retirada. Se a bola
retirada for branca, qual probabilidade de ter vindo da urna U2 ?

Vermelhas Brancas
U1 3 5
U2 2 1
U3 2 3

Solução: Indiquemos por B bola branca

U1 U2 U3

5 B 1 3
3 2 2
Como são três urnas, suas probabilidades são iguais a 1/3:
p(U1)  1/3; P(B / U1)  5/8
p(U2 )  1/3; P(B / U2 )  1/3 , logo podemos escrever:
p(U3 )  1/3; P(B / U3 )  3/5
1/ 3x1/ 3 1/ 3 40
p(U2 / B)     0,2139
1/ 3x5/8 1/ 3x1/ 3 1/ 3x3/ 5 5/8 1/ 3  3/ 5 187

Exemplo 5:
Em um viveiro têm-se três gaiolas com as seguintes aves:
canários sabiás tico-ticos
Fêmeas 3 4 1
Machos 3 2 5

Uma ave fugiu da gaiola e verificou-se que é fêmea, qual a probabilidade de ser sabiá ?
Solução: Indiquemos por F ser fêmea, então

C S T

p(C)  1/ 3; P(F / C)  3/ 6
p(S )  1/ 3; P(F / S)  4/ 6 , escrevemos:
p(T )  1/3; P(F / T )  1/ 6

84
1/ 3.4/ 6 4
p(S / F )    0,5
1/ 3.3/ 6 1/ 3.4/ 6 1/ 3.1/ 6 8
Exercícios de aplicação 14:

1. Na sala do Curso de Estatística 30% dos rapazes e 10% das garotas têm mais que 1,65 m de
altura. Sabe-se que 60% dos alunos são rapazes. Se um aluno é selecionado aleatoriamente e tem mais
que 1,65 m de altura, qual a probabilidade dele ser garota?

2. Uma urna A tem 3 moedas de ouro e 2 de prata e uma urna B tem 4 moedas de ouro e 3 moedas
de prata. Uma moeda é selecionada ao acaso e verifica-se que é de ouro. Qual a probabilidade de ter
vindo da urna B?

3. Na sala do 1° semestre da Disciplina de Estatística 20% dos rapazes e 12% das garotas estão
estudando Matemática. Um estudante é escolhido ao acaso e observa-se que é estudante de
Matemática. Qual a probabilidade do estudante ser rapaz sabendo-se que 60% do corpo discente é
formado por rapazes?

85
4. Em uma assembléia estão reunidos os alunos dos 3 primeiros semestres e tem as seguintes
proporcionalidades 20% ,30% e 50% dos alunos respectivamente. Sabe-se que 10%, 5% e 2%
respectivamente por série são portadores da gripe suína.Se um aluno dessa assembléia selecionado
aleatoriamente é portador da gripe suína, então a probabilidade de ser aluno do 2º semestre é

(A) 0,11. (B) 0,22. (C) 0,33. (D) 0,44. (E) 0,55.
5. No terreiro de um sítio existem os seguintes animais:

Aves Suínos Ovinos


Fêmeas 3 2 3
Machos 4 3 5

Um animal fugiu do terreiro e verificou-se que é fêmea, qual a probabilidade de ser


uma ave?

86
6. Em um colégio 6% dos homens e 3% das mulheres têm descendência japonesa. Por outro lado 60%
dos estudantes são mulheres. Se um estudante é selecionado ao acaso e tem descendência japonesa,
qual a probabilidade de ser homem?

7. Em uma cidade obteve-se os seguintes dados: apenas uma em cada 100 pessoas adultas tem nível
superior. Das pessoas que têm nível superior, 80% têm emprego público, enquanto apenas 30% das que
não têm nível superior têm emprego público. Uma pessoa da população é selecionada ao acaso e
verifica-se que tem emprego público. A probabilidade de que essa pessoa venha a ter nível superior é:

(A) 26,0%.
(B) 56,6%.
(C) 12,6%.
(D) 0,6%.
(E) 2,6%.

87
CAPÍTULO 5

DISTRIBUIÇÃO BINOMIAL E DISTRIBUIÇÃO DE POISSON


Veremos neste capítulo as distribuições na variável discreta: Distribuição Binomial e
Distribuição de Poisson.

1. Probabilidade de Bernoulli
Seja um experimento aleatório com apenas uma única tentativa. Nessa tentativa podemos ter
sucesso, se ocorrer o que se quer ou fracasso caso contrário.
Seja p a probabilidade de sucesso e q a probabilidade do fracasso, de tal maneira que
p  q  1. Se X é uma variável aleatória que assume só dois valores X={0,1}, nesse caso o valor 0
(zero) corresponde ao fracasso q e o valor 1 corresponde ao sucesso p. Assim podemos escrever:
p( X  0)  q e p( X  1)  p
2. Distribuição binomial
Situação-problema: Uma urna contém 20 bolas brancas e 10 bolas pretas. Retirando-se 5 bolas,
qual a probabilidade de saírem 3 brancas e 2 pretas?
a) Sem reposição.
b) Com reposição.
Solução:
20 2
a) Sem reposição. Se adotarmos como sucesso sair uma bola branca, então p   , e o fracasso
30 3
10 1
será sair bola preta, então q   . Como são 5 as bolas a serem retiradas, devemos reservar 3
30 3

lugares para as brancas, isto é,  5


3 e usando a probabilidade do produto tem-se:

p(3B  2P)  3   3020  1929  1828  1027  269


5

b) Com reposição. As informações são as mesmas e como as bolas são devolvidas temos:

  3020  3020  3020  1030  1030  10. 3020   1030  10. 32   13 
3 2 3 2
5
p(3B  2P)  3

Observação1: A probabilidade descrita acima se denomina Probabilidade Binomial. Mostremos que


3 2
 2 1
a expressão 10.    é um termo do binômio de Newton. Se o número de bolas brancas (r)
 3   3
assumir os valores de {0,1,2,3,4,5}, então podemos escrever o desenvolvimento do binômio de
5 0 5 1 4 2 3
 1 2 5  2 1 5  2 1 5  2  1

3 3
 3   3

Newton:     0      1      2     
 3   3  3   3


88
5 r
 5 2   1 
5 r
 1  ou ainda  1  2  
3 2 5 0 5


5
3
 2
 3
 
1
 3   ... 
 

5
5
 2
 3
 
 3
 
3 3
 
     
r 0  r   3   3 
e, um de seus

termos é a probabilidade
3 2 3 2
 20   10   2 1
p(3B  2P)  10.     10.    , que corresponde ao quarto termo do
 30   30   3   3
5 r
 5 2   1 
5 r
1 2 5
desenvolvimento do binômio de Newton            daí o nome de
3 3 r 0  r   3   3 
probabilidade Binomial.
Observação 2: Se r assumir todos os valores {0,1,2,3,4,5}, a soma de todas as probabilidades é igual
a 1, isto é,
5 r
 5 2   1 
5 r
1 2 5
p(r  0)  p(r  1)  ...  p(r  5)  1=           
3 3 r 0  r   3   3 

Fórmula geral da probabilidade Binomial.


Generalizando devemos responder a pergunta:
Qual é a probabilidade de obtermos r sucessos em n provas? Se nestas n provas obtermos r
sucessos, e em consequência teremos n-r fracassos. Suponhamos que nas n provas tenham uma
ordem pré-determinada, por exemplo, as r primeiras provas sejam sucessos e as demais fracasso,
então,
SSS...S FFF...F  ppp... pqqq...q  pr qnr ( o mesmo ocorreu para as bolas brancas no
r vezes n r vezes r vezes nr vezes
exemplo). Como queremos r sucessos entre n provas independentes, encontramos a fórmula geral:

p(r)   p q
n
r
r nr

Exemplo 1:
Uma moeda é lançada 8 vezes. Qual a probabilidade de ocorrer
a) 5 caras?
 n8

5 3
 1   1  56. 1 =0,21875
Escrevemos  p  1/ 2 , logo p(r  5)  8
5  2  2 
   
 q  1/ 2 256

b) pelo menos 1 cara ?

89
0 8
1 1
p(r  1)  p(r  1)  p(r  2)  ...  p(r  8)  1 p(r  0) = 1 
8
0  2   2   0,996
   

c) no máximo 2 caras ?

1 7
p(r  2)  p(r  0)  p(r  1)  p(r  2)   80   1   1  +  18   1   1  + 8  1   1  = 0,1445
2 6

 2   2  2   2 
0 8

2    
2  2      

Exemplo 2:
Se 5% dos cavalos de uma fazenda estão doentes, achar a probabilidade que numa amostra de 4
cavalos escolhidas ao acaso, tenhamos

a) nenhum doente (todos sadios)?


 n4

 p  5%  0,05 , logo p(r  0)   0   0,05  0,95  0,8145
4 0 4

q  95%  0,95

b) pelo menos 1 doente ?

p(r  1)  p(r  1)  p(r  2)  ...  p(r  4)  1 p(r  0) =


1    0,05 0,95
4
0
0 4
 1  0,8145 =0,1855

Exercícios de aplicação 15:

1. A probabilidade de um atirador acertar o alvo é 1/3. Se ele atirar 6 vezes, qual a probabilidade de
acertar

a) 2 tiros ?

b) errar todos os tiros?

90
2. Um carro de corrida tem probabilidade 1/3 de vencer qualquer corrida de um torneio. Se o torneio
consiste de 5 provas, qual a probabilidade de o carro vencer

a) exatamente 3 provas ?

b) no mínimo 80% das provas?

c) nenhuma prova?

3. Na Empresa ABC 2/3 das secretarias falam fluentemente a língua inglesa. Escolhendo 5 secretárias
ao acaso, qual a probabilidade de que
a) duas falem fluentemente a língua inglesa?

b) pelo menos 20% fale fluentemente a língua inglesa?

c) no máximo 3 falem fluentemente a língua inglesa?

4. Uma urna contém 4 bolas pretas, 3 vermelhas e 2 amarelas. Desta urna 3 bolas são retiradas
sucessivamente com reposição. Qual a probabilidade de obtermos
a) pelo menos uma vermelha?

b) exatamente uma preta?

91
5. Uma urna contém 4 bolas brancas, 3 pretas e 1 vermelha. Desta urna 3 bolas são retiradas
sucessivamente, com reposição. Qual a probabilidade de obtermos
a) no máximo 2 vermelhas?

b) alguma bola branca?

6. A probabilidade de um aluno ser aprovado no vestibular para o curso de estatística é 1/3. Em um


grupo de 6 candidatos. Qual a probabilidade de serem aprovados

a) 2 candidatos ?

b) no máximo 4 candidatos ?

Exercícios de aplicação 16:

1. A probabilidade de um aluno do Curso de Estatística errar na determinação das raízes de uma


equação do segundo grau é de 0,4. Em um grupo de 6 equações, qual probabilidade de errar 2
questões?

2. A agência de um banco WPG tem por norma renovar cerca de 60% dos empréstimos de crédito
pessoal quando do vencimento. Pedem renovação 3 correntistas, qual a probabilidade de que os três
pedidos sejam indeferidos?

92
3. Um foguete tem probabilidade 0,2 de acertar o alvo. Se ele dispara 7 tiros, qual a probabilidade de
a certar no mínimo 2 vezes?

4. A probabilidade de um aluno que ingresse no curso de Estatística e chegue a se formar sem nenhuma
dependência é 0,3. Em um grupo de 8 ingressantes desse curso, a probabilidade de se formar tendo no
máximo uma dependência é

(A) 0,288. (B) 0,277. (C) 0,266. (D) 0,255. (E) 0,244.
5. Se em uma prova com 6 questões e cinco alternativas um aluno só esteja adivinhando, então a
probabilidade de acertar apenas 1 questão é

(A) 0,393. (B) 0,262. (C) 0,301. (D) 0,421. (E) 0,501.
6. O Departamento de Trânsito de certa cidade constatou que os endereços de 20% dos proprietários de
veículos estão incorretos. Se 8 proprietários forem sorteados aleatoriamente, qual é a probabilidade de
que exatamente a metade dos endereços esteja correta?

A)39,5% B) 4,6% C) 47,3% D) 95,5% E) 64,6%

93
7. Em uma cidade, 40% dos táxis têm motor 1.0. Considerando-se uma amostra de 10 veículos da
cidade, qual é a probabilidade de que 20% dos táxis sejam de cilindrada diferente?

A) 0,44 B) 0,54 C) 0,14 D) 0,34 E) 0,01

8. Uma prova é constituída de 20 questões, cada uma delas com 5 alternativas de resposta, das quais
apenas uma é correta. Se um aluno responder às questões ao acaso, a probabilidade de que ele consiga
acertar exatamente 10 questões é:

A)0,4% B) 0,2% C) 0,3% (D) 0,5% E) 0,1%

3. Distribuição de Poisson ou distribuição dos eventos raros


No modelo probabilístico a distribuição de Poisson é utilizada em um grande número de
problemas, principalmente quando a probabilidade de ocorrer um evento é muito pequena e o
número de casos é muito grande. Essas situações se identificam com a distribuição binomial.
Podemos fazer uma aproximação da binomial pela distribuição de Poisson da seguinte maneira.
Seja n   (n>30) e p  0 p  0,1 , definimos a média por:

  np <10 e a variância por Var(X)=npq.

Mostremos que lim p(r)  lim r


n n
 p q
n r nr

e   r
r!
Partindo da binomial e tomando o limite no final das operações segue:

p(r)   p q
n
r
r nr
=
n!
(n  r )!r !
p r q n r =
n(n 1)(n  2)...(n  r 1)(n  r )! r
r !(n  r)!
p (1 p)nr 

n(n  1)(n  2)...(n  r  1)(n  r )! np r n(n 1)(n  2)...(n  r 1)  r np


 ( ) (1  p)nr  (1 )nr 
r !(n  r)! n r! nr
n
nr
n n 1 n  2 n  r  1  r   
... . .1  =
n n n n r!  n 

94
r
r 1  r     
n
1 2
= 1.(1  )(1  )...(1  ) . 1 .1 
n n n r !  n   n
r
r      r e 
n

. 1 . 1 
r !  n   n 
Tomando o limite a expressão se reduz a lim . Portanto
n r!
tende a e  tende a 1

e  r
a probabilidade de Poisson é dada por: p(r) 
r!

Exemplo 3:
A probabilidade de um indivíduo acusar reação negativa à injeção de um determinado soro é de
0,001. Determinar a probabilidade de que em 2000 indivíduos,
a) exatamente 3 acusem reação negativa?
 n  2000 e  r e2 23
    np  2000  0,001  2 , segue: p(r  3)    0,1804
 p  0,001 r! 3!
b) no máximo 2 acusem reação negativa?
e2 20 e2 21 e2 22
p(r  2)  p(r  0)  p(r  1)  p(r  2)     5e2  0,6766
0! 1! 2!
Exemplo 4:
Na revisão tipográfica de um livro achou-se em média 1,5 erros por página. Das 600 páginas do
livro, estimar quantas não precisam ser modificadas por não apresentarem erros?
Solução:
Nesse caso o valor da média é dado   1,5 e não apresentar erro significa r=0, pela fórmula
segue:
e  r e1,51,50
p(r  0)    e1,5  0,2231
r! 0!
Como são 600 páginas, tem-se 600 x 0,2231=133,8  134 páginas.

Exemplo 5:
No tear da marca Luiza a fabricação de peças de determinado tecido aparecem defeitos ao
acaso, sendo um a cada 250 metros. Supondo-se que a distribuição para os defeitos seja a de Poisson,
qual a probabilidade de que na produção de 1000 m
a) não haja defeito?
 n  1000 e  r e4 40
    np  1000x
1
 4 , segue: p(r  0)    0,018316
 p  1/ 250 250 r! 0!

95
b) aconteça pelo menos 3 defeitos ?

p(r  3)  p(r  3)  p(r  4)  p(r  5)  ...  p(r  1000)  1 p(r  2)

e4 40 e4 41 e4 42


1[   ]  113e4  0,761896
0! 1! 2!
c) se a produção diária desse tear é de 375 m, num período de 80 dias de trabalho, em quantos dias
podemos esperar produção sem defeito?

Dizer que a produção é sem defeito é ter produção com zero defeito, logo
 n  375 1
    np  375x  1,5 , segue:
 p  1/ 250 250
e  r e1,51,50
p(r  0)    e1,5  0,2231 e, portanto, 80x0,2231=17,84  18 dias
r! 0!

Exercícios de aplicação 17:

1. Certa máquina produz 0,02% de engrenagens com defeito. Na fabricação de 1000 engrenagens,
qual a probabilidade de

a) exatamente 2 terem defeitos ?

b) no máximo 3 terem defeitos ?

96
2. A produção diária de pregos de uma fábrica apresenta 0,005% de defeitos por kg. Em uma partida
de 20 000 kg de pregos, qual a probabilidade de
a) haver no mínimo 3 kg com defeitos?

b) em uma produção de 30 dias se espera que haja quantos dias de 1 kg com defeito?

3. A probabilidade de se fabricar uma calculadora eletrônica com defeito é 0,002. Em um lote de


4000 calculadoras, qual a probabilidade de
a) no mínimo 2 terem defeitos?

b) exatamente 4 terem defeitos?

c) no máximo 2 tenham defeitos?

97
4. Uma empresa transportadora é contratada para o transporte de sacas de café. A probabilidade de
uma saca se romper é 0,00002. Qual a probabilidade de no transporte de 150 000 sacas

a) no mínimo 3 sacas se romperem?

b) no máximo 2 sacas se romperem?

5. Uma fábrica de automóveis verificou que ao testar seus carros na pista de provas, há em média um
estouro de pneu a cada 300 km. Supondo-se que a distribuição para os estouros dos pneus seja a de
Poisson, qual a probabilidade de que
a) em um teste de 900 km haja no máximo um pneu estourado?

b) em um teste de 450 km não haja nenhum estouro de pneu?

98
6. Um dado é formado com chapas de plástico de 10x10 cm. Em média aparecem 50 defeitos a cada
metro quadrado de plástico, segundo a distribuição de Poisson. Qual a probabilidade de
a) uma determinada face apresentar exatamente 2 defeitos?

b) o dado apresentar no mínimo 2 defeitos?

7) Uma cafeteira apresenta algum defeito em média 3 defeitos por mês. Qual a probabilidade que
durante o próximo mês essa máquina venha apresentar
a) exatamente dois defeitos?

b) no máximo um defeito?

8. Em média o banco BWP tem 3 contas abertas por dia. Determinar a probabilidade de que em um
determinado dia o número de novas contas abertas venha a ser
a) exatamente 2.

b) no máximo 2.

99
CAPÍTULO 6

DISTRIBUIÇÃO NORMAL OU DE GAUSS


1. Conceitos: A distribuição normal é a mais importante distribuição de probabilidade, não apenas na
teoria de estatística, como também nas suas aplicações a problemas industriais.
É a distribuição contínua e simétrica cujo gráfico tem a forma de um sino com a boca voltada
para baixo, sendo também conhecida como distribuição de Gauss ou de Laplace ou dos erros de
observação.
Diz-se que uma variável contínua x é normalmente distribuída quando assume todos os valores
de  a  , com frequência determinada pela seguinte lei matemática:
1 x 2
1  ( )
f ( x)  e2 
 2 sendo: e = 2,718281828459

 : desvio padrão da população


 : média da população
f(x)

 

|   | |   |
0 x

Observação 1: A distribuição normal envolve apenas dois parâmetros estatísticos, a média  e o


desvio padrão  .

Observação 2: A média  é o valor de x para o qual a f(x) é máxima, enquanto o desvio padrão 
é a distância ( em abscissas ) entre o ponto de ordenada máxima e o ponto em que a curva muda de
concavidade ( Ponto de inflexão).

Observação 3: A área total sob a curva f ( x) é igual a unidade e em virtude da simetria da curva a área
da esquerda é igual a área da direita em relação a média.

Observação 4: A curva é assintótica em relação ao eixo do x.

Observação 5: Como a distribuição é simétrica em relação à média  , então a média  coincide com
a moda e a mediana.

100
Observação 6: Demonstraremos agora que a área sob a curva tem 1 ua ( uma unidade de área) e é dada
por:
  1 x  2
1  (
 f (x)dx  
)
e 2  dx  1
   2
x
Façamos primeiramente a mudança de variável z  , denominada variável normal reduzida

1
ou padronizada, e seu diferencial é dado pela expressão dz  dx , assim tem-se a nova expressão:


1 
1 2
x 1
e
z
I 2 dz. O mesmo ocorre para a mudança de variável v  e dv  dx , assim
2 
 
 1
1  v2
I
2 
e 2 dv. Efetuando o produto das duas integrais, segue:

1   12 z2  v2 1    2( z2 v2 )
1 1
I   e dz.  e dv  2   e
2 2 dzdv .
2 

Obtivemos agora uma integral em duas variáveis z e v e o artifício para sua solução é o uso de
uma nova mudança de variável denominada coordenadas polares. Assim escrevemos:
z  rsen e v  r cos e nesse caso para o elemento dzdv tem-se rdrd . Quanto à variação do ângulo
 e r escrevemos que z e v variam no intervalo ]  , [ , enquanto r varia [0, [ e  varia [0,2 ] .
Assim, podemos escrever o expoente como:
1 2 2 1
2
 z  v    r 2 cos2   r 2 sen2    r 2 e a integral passa a ser
2
1
2

2  r2
1
I   d  re
2 2 dr. Integrando primeiramente na variável r segue:
2 0 0
 r2 r2

 re
0
2 dr  e 2 |0  [e  e0 ]  e0  1 . Assim a integral

1 2 1 1 2
I2 
2 0 1.d   |02 
2 2
(2  0) 
2
 1. Portanto, I 2  1  I  1,

isto é, a área sob a curva de f ( x) no intervalo ]  , [ , tem 1 unidade de área.

Como a área sob a curva é igual a 1, podemos associar área com probabilidade, pois, a soma de
todas as probabilidades também é 1, logo probabilidade passa a ser vista como área. Assim escrevemos
x2

a probabilidade de p( x1  x  x2 )   f ( x)dx.
x1

101
f(x)

x
x1 x2

Se quisermos calcular a probabilidade indicada na figura devemos fazer:


x2 1 x 2
x2
1  (

)
p( x1  x  x2 )   f ( x)dx  e 2  dx e usando a mesma mudança de variável
x1 x1  2
x
z denominada variável normal reduzida ou padronizada, tem-se a expressão :

z2 1
1  z2
p( x1  x  x2 )  p( z1  z  z2 
2 e
z1
2 dz. Neste caso recaímos novamente na

demonstração anterior, o que dificulta demais a solução do problema. Ao invés de resolvermos os


problemas com o uso de integrais, contornamos essa dificuldade da seguinte maneira.

Mostremos em primeiro lugar que a nova função f ( z) normal padronizada tem média z  0 e
desvio padrão  z  1. Lembrando que na distribuição normal f ( x), a média  coincide com a moda e a
mediana, isto é, devemos encontrar o valor de z que fornece o ponto de máximo da função.

O ponto de máximo é determinado impondo que a primeira derivada da função


1
1  z2
f ( z)  e 2 , seja zero, derivando segue:
 2
1
1  z2 1
f ' ( z)  e 2 ( .2z)  0 , dessa maneira o valor de z que anula a derivada é z  0, então
 2 2
esse valor indica o máximo da função e portanto a média é z  0.
Mostremos agora que o desvio padrão  z  1.

O desvio padrão é definido com a medida | x   | , sendo x o valor do ponto de inflexão e este se
obtém igualando a segunda derivada a zero. Partindo da primeira derivada
1 1 1
1  z2 1  z2 1  z2
f ' ( z)  e 2 (z) , encontramos f " (z)  e 2 (z) (-z)+ e 2 (1) 
 2  2  2

102
1
1  z2
e 2 [ z 2 1]  0 . E essa expressão é igual a zero se z 2 1  0 , logo z  1 e, portanto,
 2
o desvio padrão na variável  z  1.
Conclusão: O que acabamos de ver é que para quaisquer valores da variável x a mudança de
x
variável z  acarreta que a nova variável z terá sempre média z  0 e seu desvio  z  1. A

distribuição normal com média z  0 e seu desvio  z  1 denomina-se distribuição normal
padronizada.
Nessa variável o gráfico esta centrado na origem do sistema. Assim deixamos de calcular as
probabilidades (áreas) com o uso de integrais e utilizamos a tabela de áreas. A tabela que segue (página
110) fornece sempre a área do valor zero até o valor z0 , isto é, p(0  z  z0 )

Uso da tabela

Exemplo 1:
Calcular as probabilidades indicadas com o uso da tabela.

a) p(0  z  1,0) .

Procuramos o número 1,0 na primeira coluna e na segunda coluna tem-se a probabilidade


desejada, assim: p(0  z  1,0) =0,34134.

b) p(0  z  1,6) .

Procuramos o número 1,6 na primeira coluna e na segunda coluna tem-se a probabilidade


desejada, assim: p(0  z  1,6) =0,44520.

c) p(0  z  2,35) .

Procuramos o número 2,3 na primeira coluna e na sexta coluna tem-se o 5 centésimos e


probabilidade desejada, assim: p(0  z  2,35)  0,49061.

d) p(1,25  z  1,25) .

Como a distribuição é simétrica em relação à média   0, as probabilidades


p(0  z  1,25) = p(1,25  z  0) e, portanto, tem-se 2 p(0  z  1,25) =2x0,39435=0,78870.

e) p(1,0  z  2,0)
Neste caso escrevemos p(1,0  z  2,0) = p(0  z  2,0) - p(0  z  1,0) =0,47725-0,34134 =
0,13591.

103
f) p( z  1,38).
Sendo a distribuição simétrica e a área igual a 1, então a área a direita de zero é igual à área à
esquerda de zero e igual a 0,5. Nessas condições podemos escrever
p(z  1,38)  0,5  p(0  z  1,38) =0,5- 0,41621 = 0,08379.

Exemplo 2:

a) Calcular a probabilidade contida dentro dos limites de uma unidade de desvio padrão.

p(1,0  z  1,0) = p(1  z  0) + p(0  z  1,0) =0,34134+0,34134=2x0,34134=0,68268.

b) Calcular a probabilidade contida dentro dos limites de duas unidades de desvio padrão.

p(2,0  z  2,0) = p(2,0  z  0) + p(0  z  2,0)  0,47725+0,47725=0,9545=95,45%.

c) Calcular a probabilidade contida dentro dos limites de três unidades de desvio padrão.

p(3,0  z  3,0) = p(3,0  z  0) + p(0  z  3,0)  0,49865+0,49865=0,9973=99,73%.

d) Calcular a probabilidade p( z  5,38).

Uma vez que o valor não esta na tabela, isso indica que a área acima de 5,38 é nula e portanto:

p( z  5,38)  0

Exemplo 3:
Sabe-se que a p(0  z  z0 )  48,3%. Determinar o valor de z0 .
Nesse caso devemos olhar a tabela de dentro para fora, isto é, procuramos na tabela o valor 0,483 e o
correspondente z0 , assim
2

2,1 0,48300 Portanto z0 =2,12.

104
2.Tabela da distribuição normal padronizada

f(z)

Tabela - Distribuição Normal Padronizada


p( 0 < Z < Z 0 )

0 z0 z

Z0 0 1 2 3 4 5 6 7 8 9
0,0 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,02392 0,02790 0,03188 0,03586
0,1 0,03983 0,04380 0,04776 0,05172 0,05567 0,05962 0,06356 0,06749 0,07142 0,07535
0,2 0,07926 0,08317 0,08706 0,09095 0,09483 0,09871 0,10257 0,10642 0,11026 0,11409
0,3 0,11791 0,12172 0,12552 0,12930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173
0,4 0,15542 0,15910 0,16276 0,16640 0,17003 0,17364 0,17724 0,18082 0,18439 0,18793
0,5 0,19146 0,19497 0,19847 0,20194 0,20540 0,20884 0,21226 0,21566 0,21904 0,22240
0,6 0,22575 0,22907 0,23237 0,23565 0,23891 0,24215 0,24537 0,24857 0,25175 0,25490
0,7 0,25804 0,26115 0,26424 0,26730 0,27035 0,27337 0,27637 0,27935 0,28230 0,28524
0,8 0,28814 0,29103 0,29389 0,29673 0,29955 0,30234 0,30511 0,30785 0,31057 0,31327
0,9 0,31594 0,31859 0,32121 0,32381 0,32639 0,32894 0,33147 0,33398 0,33646 0,33891
1,0 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,36214
1,1 0,36433 0,36650 0,36864 0,37076 0,37286 0,37493 0,37698 0,37900 0,38100 0,38298
1,2 0,38493 0,38686 0,38877 0,39065 0,39251 0,39435 0,39617 0,39796 0,39973 0,40147
1,3 0,40320 0,40490 0,40658 0,40824 0,40988 0,41149 0,41309 0,41466 0,41621 0,41774
1,4 0,41924 0,42073 0,42220 0,42364 0,42507 0,42647 0,42785 0,42922 0,43056 0,43189
1,5 0,43319 0,43448 0,43574 0,43699 0,43822 0,43943 0,44062 0,44179 0,44295 0,44408
1,6 0,44520 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,45254 0,45352 0,45449
1,7 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327
1,8 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062
1,9 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670
2,0 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169
2,1 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574
2,2 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899
2,3 0,48928 0,48956 0,48983 0,49010 0,49036 0,49061 0,49086 0,49111 0,49134 0,49158
2,4 0,49180 0,49202 0,49224 0,49245 0,49266 0,49286 0,49305 0,49324 0,49343 0,49361
2,5 0,49379 0,49396 0,49413 0,49430 0,49446 0,49461 0,49477 0,49492 0,49506 0,49520
2,6 0,49534 0,49547 0,49560 0,49573 0,49585 0,49598 0,49609 0,49621 0,49632 0,49643
2,7 0,49653 0,49664 0,49674 0,49683 0,49693 0,49702 0,49711 0,49720 0,49728 0,49736
2,8 0,49744 0,49752 0,49760 0,49767 0,49774 0,49781 0,49788 0,49795 0,49801 0,49807
2,9 0,49813 0,49819 0,49825 0,49831 0,49836 0,49841 0,49846 0,49851 0,49856 0,49861
3,0 0,49865 0,49869 0,49874 0,49878 0,49882 0,49886 0,49889 0,49893 0,49896 0,49900
3,1 0,49903 0,49906 0,49910 0,49913 0,49916 0,49918 0,49921 0,49924 0,49926 0,49929
3,2 0,49931 0,49934 0,49936 0,49938 0,49940 0,49942 0,49944 0,49946 0,49948 0,49950
3,3 0,49952 0,49953 0,49955 0,49957 0,49958 0,49960 0,49961 0,49962 0,49964 0,49965
3,4 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976
3,5 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49981 0,49982 0,49983 0,49983
3,6 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989
3,7 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49992
3,8 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995
3,9 0,49995 0,49995 0,49996 0,49996 0,49996 0,49996 0,49996 0,49996 0,49997 0,49997
4,0 0,49997 0,49997 0,49997 0,49997 0,49997 0,49997 0,49998 0,49998 0,49998 0,49998
4,1 0,49998 0,49998 0,49998 0,49998 0,49998 0,49998 0,49998 0,49998 0,49999 0,49999
4,2 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999
4,3 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999
4,4 0,49999 0,49999 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000
4,5 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000

105
Exercícios de aplicação 18:

1. As notas da prova de matemática da turma do 1º ano são distribuídas normalmente em torno da


média 3,0 e desvio padrão 0,4. Qual a probabilidade de um aluno dessa classe tenha sua nota
a) entre 3,0 e 3,2.

b) entre 2,8 e 3,2.

c) acima de 3,2.

d) abaixo de 2,6.

106
2. Uma fábrica de pneumáticos faz um teste para medir o desgaste de seus pneus e verificou-se que
ela obedece a uma distribuição normal de média 70 000 km e desvio padrão 4 000 km. Calcule a
probabilidade de um pneu escolhido ao acaso, dure

a) mais que 66000 km.

b) entre 66 000 km e 75 600 km.

c) fora do intervalo 62 000 km e 78 000 km.

d) mais que 45 500 km.

107
3. A duração de vida de certo tipo de lâmpada obedece a uma distribuição normal de média 1000
horas e desvio padrão 100 horas. Qual a probabilidade que uma lâmpada escolhida ao acaso dure

a) mais que 1200 horas

b) menos que 800 horas

c) entre 750 horas e 1150 horas

4. As notas de uma prova se distribuem normalmente com média 4,1 e desvio padrão 1,5. Sabe-se
que 10% são os alunos mais adiantados recebem classificação A e 25% são os mais atrasados e
recebem classificação C de reprovados. Qual a nota mínima para
a) ser aprovado com A.

108
b) ser reprovado com C.

5. O número de pedidos para a compra de certo produto que uma companhia recebe por semana se
distribui normalmente com média 125 e desvio padrão 30. Se em uma semana o estoque disponível é
de 149 unidades,

a) qual a probabilidade de que todos os


pedidos sejam atendidos?

b) qual deve ser o estoque para que


se tivesse 98% se probabilidade de
que todos os pedidos sejam atendidos?

109
6. As alturas dos alunos do curso de matemática se distribuem normalmente com média 1,72 m e
desvio padrão 0,25 m. Escolhido um aluno ao acaso dessa turma, qual a probabilidade de sua altura
a) estar entre 1,30 m e 1,96 m.

b) estar fora do intervalo 1,35 m e


1,85 m.

7. A fábrica de calçados Luíza verificou por meio de pesquisa de mercado, que na população
formada pelos futuros consumidores de calçados masculinos, esses se distribuem em torno da
média 40 e desvio padrão 1,2. Estimar para uma população de 10.000 pares, quantos pares de
cada número deverão ser produzidos.
Observação: O calçado de número 39 deve servir para pessoas cujos pés estão compreendidos entre
38,5 e 39,5.

110
Exercícios de aplicação 19:
1. Um cantor famoso mantém um clube de fãs com secretárias que respondem suas correspondências.
O número de cartas por semana obedece a uma distribuição normal de média 3500 cartas e desvio
padrão 200 cartas. Qual a porcentagem semanal em que recebe
a) mais que 3800 cartas?

b) menos de 3300 cartas?

c) entre 3300 a 3900 cartas?

d) entre 3700 e 3900 cartas?

111
e) entre 3000 e 3300 cartas?

2. No aeroporto de Congonhas ocorrem em média 320 decolagens por dia com desvio padrão 40
decolagens. Em um dia qualquer, qual a probabilidade de
a) ocorrerem mais que 340 decolagens?

b) entre 280 e 340 decolagens?

3. Os defeitos de balanceamentos de rodas de alumínio se distribuem segundo uma distribuição


normal de média X = 58 g e desvio padrão  X = 10 g. Se uma roda é escolhida ao acaso,
determinar a probabilidade de que ela
a) tenha mais que 70 gramas.

b) tenha entre 40 e 60 gramas.

112
4. As notas de aproveitamento dos alunos na disciplina matemática se distribuem normalmente com
média 6,3 e desvio padrão 1.6. Escolhida uma nota ao acaso
a) qual a probabilidade de que ela esteja
fora do intervalo 3,2 e 5,2 ?

b) O professor deseja reprovar 15% dos


alunos, qual a nota mínima para ser
aprovado?

5. O volume do conteúdo líquido nas garrafas de vinho tem distribuição normal com média de 750 ml
e variância de 25 ml 2 . O processo de controle de qualidade rejeita garrafas com volume inferior a
740ml. O número de garrafas que deverão ser rejeitas em um lote de 20.000 garrafas deverá ser

(A)9.545. (B) 455. (C) 1.000. (D)327. (E) 6.892.

113
6. O preço de cartuchos coloridos para impressora em uma cidade pode ser considerado uma variável
aleatória distribuída normalmente com valor médio de R$ 75,00 e desvio padrão de R$ 15,00.
Aproximadamente, em quantas lojas, dentre as 200 pesquisadas, o preço do cartucho estaria entre
R$ 77,00 e R$ 85,00?

A) 30 lojas. B) 15 lojas. C) 39 lojas. D) 25 lojas. E)20 lojas.


7. Uma fábrica de pneus apresenta um novo tipo de pneu radial no mercado, e está disposta a fornecer
uma garantia de quilometragem para o produto. Testes revelam que a vida útil desses pneus tem
distribuição normal com média de 58.400 quilômetros e desvio padrão de 8.000 quilômetros. Com base
nesses dados, a quilometragem que deverá constar na garantia, caso a fábrica deseje trocar no máximo
5% da produção, será de

A) 42.720 km B) 38.540 km C) 55.480 km D) 35.340 km E) 45.200 km


8. Felipe participou de três concursos públicos, tendo obtido, respectivamente, as notas 90, 60 e 152. Os
resultados dos concursos apresentaram as seguintes pontuações:

I. Concurso I: média = 85 e desvio padrão = 7


II. Concurso II: média = 45 e desvio padrão = 9
III. Concurso III: média =120 e desvio padrão = 25

Em que concurso o candidato obteve a pontuação com melhor desempenho?

114
A) No concurso II.
B) No concurso I.
C)No concurso III.
D) Obteve o mesmo desempenho em I e II.
E) Obteve o mesmo desempenho em I e III.
9) Uma pesquisa feita com os rapazes do primeiro ano da disciplina de estatística, revelaram ser uma
distribuição normal com os seguintes dados:
a) Quanto à altura: a média X  172c m e  X  4cm.
b) Quanto à peso: a média Y  80kg e Y  3kg .
Sabe-se que o aluno Enrico dessa turma tem altura 170 cm e peso 82 kg.
a) Qual das variáveis tem maior dispersão?

b) Em qual dos itens Enrico apresenta maior normalidade?

115
CAPÍTULO 7

VARIÁVEL ALEATÓRIA

A probabilidade teve início com os jogos de azar (século XVII) com Cavaleiro de Nere, Fermat
e Pascal, porém, coube a Bernoulli (1713) lançar as bases da probabilidade e a seguir Laplace fez
grandes contribuições.

1. Conceito de variável aleatória


Podemos estudar, por exemplo, algumas características dos alunos do Curso de estatística.

Classe de alunos variável aleatória


aspectos
alturas ( )
pesos ( )
idades ( )
procedências ( )
sexo (0,1)

Seja S: espaço amostral e ai um elemento de S

ai X (ai )

Espaço amostral discreto X (S ) :conjunto imagem

Nestas condições podemos associar a cada ai  S um único valor X (ai )  .


A essa função X denominamos variável aleatória. A variável aleatória X representa um valor
numérico associado a cada resultado de um experimento de probabilidade. A palavra aleatória indica
que os valores são determinados pelo acaso.
Estudaremos dois tipos de variáveis aleatórias.

1.1 Variável aleatória discreta

Se X é uma variável aleatória definida em S com valores possíveis de X finito ou enumerável,


dizemos que X é variável aleatória discreta. Em outras palavras uma variável aleatória discreta é aquela
que assume valores contáveis.
Exemplos:
1. O número de casas de um condomínio.
2. O número de clientes atendido em determinado dia da semana.
3. O número de carros vendidos em uma concessionária durante uma semana de ofertas.

116
1.2 Variável aleatória contínua

Se X é uma variável aleatória definida em S com valores no intervalo de números reais. Nessas
condições, X denomina-se variável aleatória contínua.
Exemplos:
1. O peso de pães.
2. O tempo gasto por um aluno que vem para a faculdade.
3. O preço de apartamentos vendidos em um bairro.

Estudaremos primeiramente a variável aleatória discreta.

Exemplo 1:
Seja o espaço amostral S obtido pelo lançamento de dois dados. Neste caso S é definido
por: S  (1,1),(1,2),...,(6,6) e tem 36 elementos.
Definimos a variável aleatória X por:
X: associa a cada ponto ai  (a, b)  S a sua soma a  b , nesse caso o conjunto imagem é dado
por: X (S)  2,3,4,5,6,7,8,9,10,11,12

Exemplo 2:
Seja uma urna com 2 bolas brancas e 3 vermelhas. Retirando-se 2 bolas sem reposição dessa urna.
Definimos a variável X : número de bolas vermelhas.
O esquema abaixo mostra as possibilidades de retirada das duas bolas.
.
X
BB 0
BV 1
VB 1
VV 2

Logo X (S)  0,1,2,

2. Função probabilidade
Sejam X a variável aleatória discreta e seus possíveis valores x1, x2 , x3 ,..., xn . Se a cada valor
xi associamos um número p( xi )  p(x  xi ), probabilidade de xi , tal que:

a) p( xi )  0, para todos xi e
n
b)  p(x )  1, a essa função
i 1
i
p( xi ) denominamos função de probabilidade da variável aleatória
discreta X. Do exemplo 2, podemos escrever:

117
Resultados possíveis xi Probabilidade p( xi ) X
BB 2/ 5.1/ 4  1/10 0
BV 2/ 5.3/ 4  3/10 1
VB 3/ 5.2/ 4  3/10 1
VV 3/ 5.2/ 4  3/10 2

A distribuição de probabilidade na variável discreta X : número de bolas vermelhas é


p( xi )
xi 0 1 2
0,6
p( xi ) 1/10 6/10 3/10
0,3
0,1
0 1 2 xi

Exemplo 3:
No lançamento de duas moedas dar a distribuição de probabilidade da variável número de caras C
e número de coroas K e sua representação gráfica.

Solução: A tabela indica as possibilidades e suas probabilidades.

Resultados possíveis Probabilidade X


KK 1/4 0
CK 1/4 1
KC 1/4 1
CC 1/4 2

A distribuição de probabilidade na variável discreta X : número de caras é dada por:

xi 0 1 2
p( xi ) 1/4 2/4 1/4

Exemplo 4:
Dar a distribuição de probabilidade da variável X do exemplo 1 e dê sua representação gráfica.

Solução: A tabela indica os resultados possíveis e suas probabilidades.

xi 2 3 4 5 6 7 8 9 10 11 12
p(xi ) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

118
A representação gráfica é dada por.

p(xi )
6/36

5/36

4/36

3/36

2/36

1/36

xi
0 2 3 4 5 6 7 8 9 10 11 12

3. Função de distribuição acumulada.

Seja X uma variável aleatória discreta. Denomina-se função de distribuição acumulada de um


ponto x, como a soma das probabilidades dos valores xi menores ou iguais a x, isto é:
F ( x)   p( xi )
xi  x

Exemplo 5:
Utilizando o exemplo 4:

xi 2 3 4 5 6 7 8 9 10 11 12
p(xi ) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

Calcule F(x) , sendo x=2, x=5, x=13 , x=3,5 e x=15.


Resolução
F (2)   p( xi )  1/36
xi 2

F (5)   p( xi )  10/36
xi 5

F (13)   p(x )  1
xi 13
i

F (3,5)   p( x )  3/ 36
xi 3,5
i

F (15)   p(x )  1
xi 15
i

119
Exemplo 6:
No lançamento de três moedas definimos X: número de caras. Assim
a) O espaço amostral S é dado por:

S  ccc, cck , ckc, kcc, ckk , kck , kkc, kkk

b) A distribuição de probabilidade da variável número de caras é.

xi 0 1 2 3
p( xi ) 1/8 3/8 3/8 1/8

c) A probabilidade de ocorrerem no máximo 2 caras.

Da tabela podemos escrever: p(x  2)  1/8  3/8  3/8  7/8 .

d) A Função de distribuição acumulada, e sua representação gráfica é dada por. Lembrando


que F ( x)   p( xi ) .A solução é dada por:
xi  x

 0, se x  0
 1 / 8, se 0  x  1 F(x)
 1
7/8
F ( x)   4 / 8, se 1  x  2
7 / 8, se 2  x  3 4/8

 1, se x  3 1/8 x
0 1 2 3

Exercícios de aplicação 20:


1. Seja X variável aleatória discreta definida por:

1/ 5, se x  1
f ( x)  
4 / 5, se x  0,
então a Função de distribuição acumulada é dada por:
 0, se x  0

F ( x)  4 / 5, se 0  x  1
 1, se x  1

Dê o gráfico de f (x) eF(x) .

120
2. Seja X a variável aleatória discreta que assume os valores 0,1 e 2, tendo as probabilidades 1/3, 1/6 e
1/2 respectivamente. Determinar:
a)A função distribuição acumulada F ( x) .

b) O gráfico de F ( x).

3. No lançamento de um dado define-se variável aleatória X: número de pontos obtidos. Definir a


função distribuição acumulada e dar seu gráfico.

121
4. Valor esperado ou Esperança de uma variável aleatória discreta ou média

Sejam X a variável aleatória discreta e seus possíveis valores x1, x2 , x3 ,..., xn , e P : p( x1 ),


p( x2 ), p( x3 ), ... , p( xn ), suas respectivas probabilidades, então denomina-se valor esperado ou
esperança matemática de X e se indica por E(X) a soma dos produtos dos valores da variável X pelas
respectivas probabilidades.
n
E( X )   xi p( xi )  x
i 1
Observação 1: E(X) é também denominada Média ou valor médio.

Exemplo 7:
No lançamento de duas moedas, determinar a
(a) distribuição de probabilidade da variável número de caras e
(b) esperança.

Solução: a) A tabela indica as possibilidades.

Resultados possíveis Probabilidade X


CC 1/4 2
CK 1/4 1
KC 1/4 1
KK 1/4 0

A distribuição de probabilidade na variável discreta X , número de caras é:

xi 0 1 2
p( xi ) 1/4 2/4 1/4

n
(b) E( X )   xi p(xi )  x = 0.1/ 4 1.1/ 2  2.1/ 4  1(Média)
i 1

Exemplo 8:
Um par de dados é lançado e definimos a variável X como:

X: variável aleatória que associa a cada ponto (a, b)  S o maior desses valores, isto é,
X (a,b)  maxa,b. Determinar E(X).
Solução:
Neste caso S é dado por S  (1,1),(1,2),...,(6,6) e tem 36 elementos.
p(x1  1)  p((1,1)  1/36
p(x2  2)  p((1,2),(2,1),(2,2)  3/36

122
p(x3  3)  p((1,3),(3,1),(3,2),(2,3),(3,3)  5/36
..........
p(x6  6)  p((1,6),(2,6),(3,6),...,(6,6) 11/36

X x1 x2 x3 x4 x5 x6
xi 1 2 3 4 5 6
p( xi ) 1/36 3/36 5/36 7/36 9/36 11/6

Usando a fórmula segue:


n
E( X )   xi p( xi )  x =1.1/36+2.3/36+3.5/36+4.7/36+5.9/36+6.11/3= 161/36 = 4,47
i 1

Exemplo 9:
Calcule a esperança para as distribuições de probabilidade discretas indicadas nas tabelas.
a)

X x1 x2 x3 x4 x5
xi -2 -1 0 1 2
p( xi ) 1/5 1/5 1/5 1/5 1/5

n
Solução: E( X )   xi p( xi )  -2.1/5 - 1.1/5 + 1.1/5 + 2.1/5 = 0
i 1

b)

x2 x1 x2 x3
xi 4 1 0
p( xi ) 2/5 2/5 1/5

Solução: E(X2) = 4.2/5+1.2/5+0.1/5 = 10/5 = 2= E( X )2 2

Logo, podemos observar que E( X )  2  [E( X )]2  0


2

c)

2x x1 x2 x3 x4 x5
xi -4 -2 0 2 4
p( xi ) 1/5 1/5 1/5 1/5 1/5

Solução: E(2X) = -4.1/5-2.1/5+0.1/5+2.1/5+4.1/5= 0

123
Exemplo 10:
Qual a esperança matemática em um jogo que paga ao jogador R$ 6,00 se obtém cara e R$ 8,00 se
obtém coroa?

X x1 x2 E( X )  6. (1/2)+8. (1/2) = R$ 7,00


xi 6 8
p( xi ) 1/2 1/2

5.Teoremas:

Teorema 1: Esperança de uma constante é a própria constante.


Devemos mostrar que E(k )  k .

A variável é dada por X: k, k, k, k,..., k ( n valores k), logo a esperança matemática é dada por:

n
E(k )   xi p( xi )  k p(k)  k p(k)  k p(k)  ...+ k p(k) 
i 1

= k  p(k)  p(k)  ...  p(k)  k  pi (k )  k , sendo p(k )  1/ n


n

i 1
Teorema 2: Multiplicando cada valor de uma variável aleatória por uma constante a esperança ficará
multiplicada pela constante.

Devemos mostrar que E(kX )  k E( X ) .


A variável é dada por X: kx1, kx2 , kx3 , ..., kxn , logo a esperança matemática é dada por:
n
E(kX )   xi p( xi )  k x1 p(kx1)  k x2 p(kx2 )  ...+ k xn p(kxn ) .
i 1

Pondo k em evidência e lembrando que p(kxn )  p(xn ) , segue:


n
E(kX )  k x1 p(x1 )  k x2 p(x2 )  ...+ k xn p(xn ) = k  xi p( xi )  kE( X )
i 1
Exemplo 11: Calcular a esperança da variável X e de 4X usando a tabela que segue:

X 4X
2 8
3 12
4 16
 9 36

124
23 4 8  12  16
Portanto: E( X )   3 e E(4 X )   12 =4.3
3 3

Teorema 3: A esperança da soma de duas variáveis aleatórias é igual a soma das esperanças.

Devemos mostrar que E( X  Y )  E( X )  E(Y )

Da definição de Esperança podemos escrever:


n n n n
E( X  Y )   ( xi  y j ) p( xi , y j )  xi p( xi )   y j p( y j )  E( X )  E(Y )
i 1 j 1 i 1 j 1

Exemplo 12: Sejam as variáveis aleatórias discretas:

X : 2, 3, 4  E( X )  3
Y : 6, 9, 12  E(Y )  9  E( X )  E(Y )  12

36
X  Y : 8,12, 16  E( X  Y )   12 , Portanto, E( X  Y )  E( X )  E(Y )
3

Teorema 4: E(aX  bY )  aE( X )  bE(Y )

Da definição de Esperança e pelo teorema 2 podemos escrever:


n n n n
E(aX  bY )   (axi  by j ) p( xi , y j ) axi p(xi )  by j p( y j )  aE( X )  bE(Y )
i 1 j 1 i 1 j 1

Exemplo 13:
Em um dia que chove um vendedor de guarda-chuvas ganha R$ 300,00, mas, se não chove perde
R$ 15,00. Supondo que a probabilidade de chover num determinado dia é de 30%, determinar E( X ).
Solução:

E( X )  300  0,3 15  0,7  79,50

6. Variância
Sejam X a variável aleatória discreta e seus possíveis valores x1, x2 , x3 ,..., xn .
Denomina-se variância de uma variável aleatória X e indica-se por

n
Var(X) =  2 ( X )  [ xi  E( X )]2. p( xi )
i 1

Outra maneira de definir variância é dada por: Var(X) =  2 ( X ) = E( X 2 )  [E( X )]2

125
n
De fato: Podemos escrever Var(X) =  2 ( X )  [ xi  E( X )]2. p( xi ) =
i 1

E[ X  E( X )] desenvolvendo o quadrado, segue:


2

E[ X 2  2X .E( X )  [E( X )]2 ]  E( X 2 )  2E( X ).E( X )  [E( X )]2  E( X 2 )  [E( X )]2

7. Desvio padrão

A raiz quadrada da variância denomina-se desvio padrão:  ( X )  Var ( X )

Exemplo 14:
Um jogo consiste no lançamento de um dado. Se sair um número par, a pessoa ganha uma quantia
equivalente ao triplo do ponto tirado, se sair um número ímpar a pessoa paga o quádruplo do ponto obtido.
Determinar:
a) Esperança.
b) Variância.
c) Desvio padrão.
Montando a tabela da distribuição, segue:

Evento xi p(xi ) xi p(xi ) xi  E( X ) [xi  E( X )]2 [xi  E( X )]2 p(xi )


1 -4 1/6 -4/6 -4 16 16. 1/6
2 6 1/6 6/6 6 36 36. 1/6
3 -12 1/6 -12/6 -12 144 144. 1/6
4 12 1/6 12/6 12 144 144. 1/6
5 -20 1/6 -20/6 -20 400 400. 1/6
6 18 1/6 18/6 18 324 324. 1/6
 0 177,333

n
a) E( X )   xi p( xi )  x = 0
i 1
n
b)  ( X )  [ xi  E( X )]2. p( xi ) =177,333
2

i 1

c)  ( X )  Var ( X ) =13,31

Teoremas:

Teorema 1: A variância de uma constante é nula.


Var(k )  0
Da definição de variância podemos escrever:
Var(k)  E[k  E(k)]2  E[k  k]  0

126
Teorema 2: Var(kX )  k 2Var( X )
Var(kX )  E[kX  E(kX )]2  E[kX  kE( X )]2  k 2 E[ X  E( X )]2  k 2Var( X )

Teorema 3: Se X e Y são variáveis independentes, então Var( X  Y )  Var( X )  Var(Y )


ou  ( X  Y )   ( X )   (Y ) e seu desvio padrão é  ( X  Y )   2 ( X )   2 (Y )
2 2 2

Teorema 4: Se X e Y são variáveis dependentes, então


Var( X  Y )  Var( X )  Var(Y )  2Cov( X ,Y )

Demonstração:
Sabemos que Var(X) =  2 ( X ) = E( X 2 )  [E( X )]2 , e podemos escrever,
Var( X  Y )  E[( X  Y )2 ]  [E( X  Y )]2 
E[ X 2  2XY  Y 2 ]  [E( X )  E(Y )]2 
= E( X 2 )  2E( XY )  E(Y 2 )  [E( X )]2  2E( X ).E(Y )  [E(Y )]2 , simplificando os termos
semelhantes segue:
Var( X  Y )  (E( X 2 )  [E( X )]2 )+( E(Y 2 )  [E(Y )]2 )+ 2[E( XY )  E( X )(E(Y )] ,

portanto, Var( X  Y )  Var( X )  Var(Y )  2Cov( X ,Y )

Teorema 5: Se X e Y são variáveis dependentes, então

Var(aX  bY )  a2Var( X )  b2Var(Y )  2abCov( X ,Y )


8. Covariância
A covariância é uma medida da força da relação entre duas variáveis aleatórias discretas X e Y e
representamos por Cov(X,Y).
O valor que mede o grau de dependência entre as duas variáveis aleatórias denominamos
covariância.
Se X e Y são duas variáveis aleatórias discretas a covariância é definida por:
(I ) Cov( X ,Y )  E[( X  E( X ))(Y  E(Y ))] , ou seja, o valor médio do produto dos
desvios de X e Y em relação às suas respectivas médias.
Outra maneira de escrever sua fórmula é dada desenvolvendo o produto, assim:

(I ) Cov( X ,Y )  E[( X  E( X ))(Y  E(Y ))] = E[ XY  XE(Y )  YE( X )  E( X )E(Y )]

E( XY )  E( X )E(Y )  E(Y )E( X )  E( X )E(Y )  E( XY )  E( X )E(Y )


Cov( X ,Y )  E( XY )  E( X )E(Y )

Observação 2: Se a covariância é positiva, isso indica que grandes valores de uma variável X estão
associados a grandes valores da variável Y.

127
Observação 3: Se a covariância é negativa, isso indica que grandes valores de uma variável X estão
associados a pequenos valores da variável Y.

Exemplo 15:
Sejam Var( X )  5, Var(Y )  6 e cov( X , Y )  4, determinar Var(2X  3Y )

Solução: Usando o teorema 5, podemos escrever:

Var(2X  3Y ) = 22 Var( X )  32 Var(Y )  2.2.3cov( X , Y )  4.5+9.6+2.2.3.4=20+54+48=122.

Exemplo 16:
Uma indústria produz sabão em pó e os empacota em caixas por meio de uma máquina que é
regulada para pesar em média 200 g e desvio padrão 4 g. Se a embalagem (caixa) tem peso médio
constante de 24 g e desvio padrão de 1 g, então nestas condições, qual a média e o desvio padrão do peso
bruto da caixa de sabão em pó?

Solução: Sejam X : peso do material sabão em pó, logo


( X )  200g,  ( X )  4g e  2 16g2
Y: peso da embalagem, logo
(Y )  24g,  (Y ) 1g e  2 (Y ) 1g 2
Z: peso bruto da caixa, logo Z  X Y
E( X  Y )  E( X )  E(Y ) = 200+24=224g
 2 (Z)   2 ( X  Y )   2 ( X )   2 (Y ) =16  1  17g 2 e tem desvio padrão
 (Z )  17  4,123g .
Exemplo 17:
Uma indústria produz rodas de magnésio de aro 17, cujo peso unitário (X) tem distribuição
normal de média 10kg e desvio padrão 200g. As rodas são embaladas em uma caixa de papelão com 4
unidades e sabe-se ainda que a caixa vazia (Y) tem distribuição normal de média 2kg e desvio padrão
100g. Calcular a probabilidade do peso total (T) da caixa ser superior a 42,5kg.

Resolução: Do enunciado podemos escrever que a variável T é definida por:


T  Y  X1  X 2  X3  X 4 
 (T )  (Y )  4( X )  42kg  42000 g
T  2
  (T )   (Y )  4 ( X )  100  4  200  170000g
2 2 2 2

x Portanto,
  (T )  42000 g

42000 42500   170000  412 g
Com o uso da variável padronizada z, segue:
x   42500  42000
z   1,21
 412

128
p(x  42500)  p(z  1,21)  0,5  p(0  z  1,21)  0,5  0,38686  11,314%

Então a probabilidade de ser maior que 42,5 kg é de 11,314%

Exemplo 18:
O professor de Matemática da turma A aplicou uma prova teste com cinco questões do tipo
verdadeiro e falso. A distribuição das notas e as respetivas probabilidades calculadas pelo professor
estão indicadas na tabela que segue. Determinar
a) A esperança e o desvio padrão da variável X.
b) O professor redefiniu as notas por meio da nova variável Y=5+3X. Determinar a esperança e o
desvio padrão da variável Y.

x 5 6 7 8 9 10
p(x) 0,10 0,12 0,25 0,28 0,15 0,10

Resolução: Para obtermos a solução completamos a tabela e utilizamos as fórmulas adequadas.

n
a) E( X )   xi p( xi )  7,56
i 1
x p(x) x p(x) x2 p( x)
 ( X )  [xi  E( X )]2. p(xi ) = E( X 2 )  (E( X ))2 
n
2
5 0,10 0,50 2,50
i 1
6 0,12 0,72 4,32
7 0,25 1,75 12,25 59,14-(7,56)2 =1,9864 e  ( X )  1,9864 1, 409  1, 41
8 0,28 2,24 17,92
b) Sabemos que E(kX  b)  k E( X )  b , logo
9 0,15 1,35 12,15
10 0,10 1,00 10,00
podemos escrever:
 7,56 59,14

E(Y )  E(3X  5)  3E( X )  5  3.7,56  5  27,68 e

Var(kX  c)  k 2Var( X )  Var(5  3X )  32Var( X )  9.(1,9864)  17,8776 e o desvio padrão é


dado por:  (Y )  17,8776  4, 23

129
Exercícios de aplicação 21:

1. Seja X uma variável aleatória com E(X)=10 e Var(X)=100 e sejam Z e Y variáveis aleatórias definidas
por Z  2x e Y  2x  6. Calcular

a) E(Z)

b) Var (Z )

c) Var (Y )

2.Seja X uma variável aleatória com E(X)=30 e  2 x  49 e sejam Z e Y variáveis aleatórias definidas
X  E( X )
por Z  e Y  X  E( X ). Calcular
x
a) E (Y )

b) Var (Y )

c) E ( Z )

d ) Var (Z )

130
3.Uma indústria produz camisas cujos pesos unitários (X) tem distribuição normal com média 50 g e
desvio padrão 3g. Essas camisas são colocadas em caixas com três unidades. A caixa vazia também tem
distribuição normal (Y) com média 40 g e desvio padrão 2 g. Calcular a probabilidade do peso total (T)
ser superior a 180 gramas.

4. Sejam X, Y e Z são três variáveis aleatórias, sabendo-se que: E(X)=4, E(Y)=8 e


1
E(Z)= -5. Determinar a esperança matemática da variável T  2 X  Y  Z  6
2

5. Um medicamento tem probabilidade 0,4 de cura. Se 10 pessoas são submetidas a esse tratamento, e
nas mesmas condições, determinar
Observação 4: A distribuição neste caso é a binomial e tem E( X )  np e Var( X )  npq .

a) E(X).

b) Var(X).

c) a probabilidade de que pelo menos 1 seja curado.

131
6. Em finais de semana o número de mortes por afogamento nas praias de Santos é de 1 morte para
cada 60 000 banhistas. Em um fim de semana com 180 000 banhistas, determinar,
Observação 5: A distribuição neste caso é Poisson e tem E( X )  np e Var( X )  np

a) E(X)

b) Var(X)

c) a probabilidade de ocorrer 4 afogamentos.

7. Quando da primeira correção dos erros que aparecem nas páginas de um livro aleatoriamente
selecionado tem-se a tabela da distribuição de probabilidade da variável X

x 0 1 2 3 4
p(x) 0,80 0,11 0,06 0,02 0,01

Determinar
a) E(X)

b) Var(X)

132
9. Função de distribuição na variável contínua

9.1. Variável aleatória contínua.


Seja X uma variável aleatória. Se seu contradomínio for um intervalo de números reais, então
diremos que X é uma variável aleatória contínua.

9.2. Função densidade de probabilidade

Seja X uma variável aleatória continua definida em S e com valores no intervalo dos números
reais. Uma função f denomina-se função densidade de probabilidade e se indica abreviadamente por fdp,
se f satisfaz as condições:
a) f ( x)  0, para todo x  S

b)  f ( x)dx  1


f(x)

Observação 6: São válidas as expressões:


b
a) p(a  x  b) = p(a  x  b)  p(a  x  b)  p(a  x  b)   f ( x)dx
a
b
b) E( X )   xf ( x)dx
a


 [x  E( X )]
2
c) Var(X)= f ( x)dx

Exemplo 17:
1/10(2 x  3) se 0  x  2
Verifique se f ( x)   é uma fdp e calcule a E(X).
 0 se x  0 ou x  2
Solução: Devemos verificar que:

a) f ( x)  0 vale para todo real .


 2
1 2
b)

 f ( x)dx 1/10 (2x  3)dx 
0 10
( x  3x) |02  1/10(4+6) = 1
b 2
2 x 3 3x 2 2
c) E( X )   xf ( x)dx =1/10 x(2 x  3)dx  1/10[  ]|  1,133
a 0 3 2 0

133
Observação 7: Neste caso a função distribuição de probabilidade é dada por:

 0, se x  0

F ( x)   1/10( x2  3x) se 0  x  2
 1 se x  2

10. Distribuição Uniforme

Uma variável aleatória X tem Distribuição Uniforme no intervalo [a,b], se sua função
densidade de probabilidade é tal que
 1
 se a  x  b
f ( x)   b  a
 0, caso contrario
Exemplo 18:
A produção de camisas de uma costureira varia de 15 a 60 camisas. A experiência mostra que
essa variação é uniforme. Qual a probabilidade de que uma costureira produza de 35 a 50 camisas?

1/45 p(35  x  50)  15/ 45  0,333


x
15 60

Exemplo 19:
Seja a função densidade de probabilidade da variável X dada por:

 1
 se 2  x  6
f ( x)   4
0, se x  2 ou x  6
Verifique se é uma fdp e determine a função distribuição de probabilidade.

Solução: A função distribuição de probabilidade é dada por,

x
1 1 1
F ( x)   dt  t |2x  (x  2) e escrevemos
2 4 4 4 F(x)
 0, se x  2
 1
F ( x)  1/ 4( x  2), se 2  x  6
 1, se x  6
 6
2

134
11. Distribuição Exponencial

Seja a função densidade de probabilidade da variável X dada por:

  e x , se x  0,   0
f ( x)  
0, para qualquer outro valor de x
a) A função distribuição de probabilidade é dada por
x x
F ( x)  p( X  x)   f ( x)dx  (et dt 1  e x , x  0 e
0 0
F(x)  0, para qualquer outro valor de x  0.

b) Esperança

  
E(X)   xf ( x)dx  ( xe x dx   xe x |
0  e
 x
dx 
0 0 0

e x 1 1 1
|0  lim(xe x ) |t0  lim e x |t0  lim  tet   0  lim  et   
1
xe x |0 
 t  t   t  t  
  
c) Variância

Var( X )  E( X 2 )   E( X )
2

 
2
Calculando primeiramente E( X )   x f ( x)dx   x2 e x dx 
2 2
, segue
0 0 2

2 1 1
Var( X )  E( X 2 )   E( X ) =  
2
.
 2
 2
2

Exemplo 20:
Verifique se f (x)  2e2 x é função densidade de probabilidade para x  0 .

a) A função exponencial f (x)  2e2 x é sempre positiva.

  x
1
b) 

f ( x)dx  (2e2t dt  lim
0
x 
2e2t dt  lim(
x
e2 x  1) = 1 
0 e
 1, isto mostra que

f (x)  2e2 x é uma fdp.

135
Exercícios de aplicação 22:

 0, se x  0
 k , se 0  x  1

1. Seja X uma v. a. contínua com fdp dada pela lei f ( x)  
k (2  x), se1  x  2
 0, se x  2
Determinar

a) k para que seja uma fdp.

b) p( x  1,5)

c) E(X)

d) E( X 2 )

e) Var(X)

2. Seja X uma variável contínua com função distribuição acumulada definida por:

 0 se x  0
F ( x)   x
1  e se x  0
Determinar a função densidade de probabilidade fdp

136
3.Seja X a variável aleatória contínua com função densidade de probabilidade fdp f ( x) dada por:
 2x , se 0  x  1
f ( x)  
0, quaisquer outros valores de x

a) Determinar F ( x) .

b) Gráfico.

137
4.Seja X a variável aleatória contínua com fdp dada por f ( x)

 ax2 se 1000  x  2000


f ( x)  
0, para quaisquer outros valores
Sabe-se que X representa a duração da vida (em horas) de lâmpadas fluorescentes compactas de 25 w.
Determinar

a) O valor de a para que f (x) seja fdp.

b) Determinar E(X)

c) Determinar Var(X)

5. O diâmetro X dos eixos das rodas de motos é uma variável aleatória contínua com fdp dada por:
3
 (2x  x ), se 0  x  1
2
f ( x)   2

 0, se x  0 ou x  1
Calcular a probabilidade de

a) p(0  x  0,5)

b) p( x  2)

138
c) Definir F(x)

6. O departamento de estoque da empresa ABS informa que a fdp de que todo estoque disponível para
que seja atendido por semana, de pedidos, é

f (x)  1/ 2(3x2  3), se 0  x  1 e 0 caso contrário.


a) Verifique se f ( x) é uma fdp.

b) Determinar a probabilidade de que no máximo 60% dos pedidos sejam atendidos.

c) Determinar a probabilidade de que pelo menos 50% dos pedidos sejam atendidos.

7. O departamento de vendas mantém em estoque 2000 geladeiras e informa que a fdp de que todo
3
estoque disponível seja atendido por semana é f ( x)  x2 , se 0  x  2 , e 0, caso contrário.
8
a) Verifique se f ( x) é uma fdp.

b) Determinar o número máximo x0 de geladeiras para que sejam atendidos 70% dos pedidos.

c) Determinar o número máximo x0 de unidades para que sejam atendidos pelo menos 60% dos pedidos.

139
d) Dar a lei F(x) e seu gráfico.

8. Seja X uma variável aleatória contínua com valores no intervalo [0,5] e com fdp dada pela
lei f ( x)  0,08x .
a) Verificar se é uma fdp.

b) Qual a probabilidade de

i) p(0  x  2) 

ii) p(1  x  4) 

iii) p( x  3) 

iv) p( x  3) 

k / x2 , se x  100
9.Seja X uma variável aleatória contínua e tem fdp dada pela lei f ( x)   .
 0, se x  100
a) Determinar o valor de k para que seja uma fdp.

b) Calcular p( x  120)

140
10. Seja X uma variável aleatória contínua com valores no intervalo [1,3] e tem fdp dada pela lei.
 x  1, se 1  x  2

f ( x)   x  3, se 2  x  3 a) Dar o gráfico de f(x).
 0, caso contrário.

b) Verificar se f ( x) é fdp.

c) Determinar E(X)

d) d) Determinar  ( X )

e)

Exercícios de aplicação 23:

1.A demanda de macarrão num supermercado em centenas de quilogramas por dia é uma variável
 2 / 3x, se 0  x  1
 x
aleatória contínua com fdp dada pela lei f ( x)    1, se 1  x  3
 3
 0, caso contrário.

141
a) Verificar se f ( x) é fdp.

b) Qual a probabilidade de se vender mais que 150kg num dia escolhida ao acaso?

c) Em trinta dias, quanto o gerente do supermercado espera vender?

d) Quantos quilogramas se esperam vender num dia escolhido ao acaso para atender 95% dos pedidos?

2. Seja X uma variável continua com função distribuição acumulada definida por:

 0, se x  0

F ( x)   x / 2, se 0  x  2
 1, se x  2

Determinar:
a) A função densidade de probabilidade fdp.

142
b) p( x  1,5).

c) p(x  2,4).

3. A duração em milhares de horas de um componente eletrônico é uma v.a. X, com fdp dada por:
0,1e0,1x , se x  0
f ( x)  
 0 , se x  0

a) Dar o gráfico de f ( x)

b) Qual a probabilidade de que um componente escolhido ao acaso dure

b1) menos que 4 000 horas.

b2) dure entre 5 000 e 10 000 horas.

143
b3) dure mais que 15 000 horas.

12. Distribuição conjunta de variáveis aleatórias

Nos problemas utilizados até agora o experimento era registrado por um único elemento.
Todavia, há casos que necessitamos representar por dois elementos.
Exemplo: altura e peso.
Definimos assim duas variáveis aleatórias: X e Y.
Seja S um espaço aleatório associado a um experimento aleatório e duas variáveis
X  X (S)  x1 , x2 , x3 ,..., xn  e Y  Y (S)  y1, y2 , y3 ,..., yn 

X (S )
S

Y (S)

Denominamos (X,Y) uma variável aleatória bidimensional e definimos probabilidade conjunta


por:

h : S  S  X (S )  Y (S )
x , y 
i j p( X  xi ;Y  y j )  h( xi , y j )
Satisfazendo:
1) p(xi , y j )  0
n n
2)  p( x , y )  1 (Discreta)
i 1 j 1
i j
ou  f ( x, y)dxdy  1

(contínua)

144
Exemplo 21:
Uma urna contém 3 bolas numeradas de 1 a 3.Retirando-se 2 bolas sem reposição, definimos os
eventos:
X: número da primeira bola e
Y: número da segunda bola.

Assim podemos escrever: p(xi , y j )  p(xi ). p( y j / xi )


1 1
p(1,2)  p(1). p(2 /1)  .  1/ 6
3 2
1 1
p(2,1)  p(2). p(1/ 2)  .  1/ 6 e a Distribuição Conjunta é dada por:
3 2

X 1 1 2 2 3 3
Y 2 3 1 3 1 2
Prob. 1/6 1/6 1/6 1/6 1/6 1/6

Exemplo 22: Distribuição conjunta.


Outra forma para representar distribuição conjunta é a tabela de dupla entrada.
11 1
Assim, p(2,3)  p(2). p(3/ 2)  .  .
32 6
X Y 1 2 3 p(xi )
1 0 1/6 1/6 1/3
2 1/6 0 1/6 1/3
3 1/6 1/6 0 1/3
p( y j ) 1/3 1/3 1/3 1
Definimos probabilidades marginais por:
n
Probabilidades marginais de X : p( x  xi )   p( x  xi , y  y j )
j 1

p(x  1)  p( x  1, y  2)  p( x  1, y  3)  1/3
p(x  2)  p(x  2, y 1)  p(x  2, y  3) 1/3
p(x  3)  p(x  3, y  1)  p(x  3, y  2)  1/3
n
Probabilidades marginais de Y: p( y  y j )   p( x  xi , y  y j )
j 1

p( y  1)  p(x  2, y  1)  p(x  3, y  1)  1/ 3
p( y  2)  p(x 1, y  2)  p(x  3, y  2) 1/3
p( y  3)  p(x  1, y  3)  p(x  2, y  3)  1/3

145
Exemplo 23:
Usando o mesmo exemplo e nele definimos duas novas variáveis:

i) X + Y e ii) X.Y , assim temos a distribuição:

(X,Y) X+Y X.Y Prob.


(1,2) 3 2 1/6
(1,3) 4 3 1/6
(2,1) 3 2 1/6
(2,3) 5 6 1/6
(3,1) 4 3 1/6
(3,2) 5 6 1/6

Construindo as distribuições para X+Y e X.Y, seguem

X+Y 3 4 5
Prob. 1/3 1/3 1/3

X.Y 2 3 6
Prob. 1/3 1/3 1/3

Verifique que

a) E(X)= 2

b) E(Y)=2

c) E(X+Y)=4

d) E(X.Y)= 11/3

Exemplo 24:
Usando o mesmo exemplo e nele façamos a reposição da bola retirada. Determinar:
a) E(X). b) E(Y). c) E(X.Y).
Solução:
Escrevendo a distribuição conjunta e representando na tabela de dupla entrada, segue.

X Y 1 2 3 p(xi )
1 1/9 1/9 1/9 1/3
2 1/9 1/9 1/9 1/3
3 1/9 1/9 1/9 1/3
p( y j ) 1/3 1/3 1/3 1

146
O cálculo da primeira linha é dado por:
1 1 11 1 1 1
p( x  1, y  1)  p( x  1, y  2)  p  x  1, y  3  .   .  . Analogamente para as
3 3 33 3 3 3
outras linhas.

Observação 7: As distribuições marginais são iguais, porém, a distribuição conjunta é diferente.


Determinando
1 1 1
a) E(X)= 1.  2.  3.  2
3 3 3
1 1 1
b) E(Y)= 1.  2.  3.  2 .
3 3 3
Para o cálculo de E(X.Y) construímos a tabela
X.Y 1 2 3 4 6 9
Prob. 1/9 2/9 2/9 1/9 2/9 1/9
1 2 2 1 2 1
c) E(X.Y)= 1.  2.  3.  4.  6.  9.  4
9 9 9 9 9 9

d) Verifique que E(X.Y)= 4= E(X). E(Y) (independentes com reposição)

Exemplo 25:
Seja a distribuição conjunta de probabilidades na variável (X,Y).

X Y 0 1 2 3
0 1/8 2/8 1/8 0
1 0 1/8 2/8 1/8

Determinar: a) E(X) e E(Y) b)Var(X) e Var(Y) c)  ( X ) e  (Y ) d) E(2X+3Y)

Solução: Completando a tabela da distribuição de probabilidades, segue:

X Y 0 1 2 3 p( x) x. p( x) x2. p( x)
0 1/8 2/8 1/8 0 4/8 0 0
1 0 1/8 2/8 1/8 4/8 4/8 4/8
p( y) 1/8 3/8 3/8 1/8 1 E(X)=4/8 2
E( X )=4/8
y. p( y) 0 3/8 6/8 3/8 E(Y)=12/8
0 3/8 12/8 9/8 2
y2. p( y) E( Y )=24/8

Usando os dados da tabela segue:


a) E(X) =0,5

E(Y)=1,5

147
2
4  4 1
b)Var(X)= E( X 2 )  [E( X )]2   
8  8  4
2
24  12  3
Var(Y)= E(Y 2 )  [E(Y )]2     0,75
8  8  4
c)  ( X )  1/ 4  0,5

 (Y )  0,75 =0,87

d) E(2X+3Y)= 2E( X )  3E(Y )  2.(0,5)+3.(1,5)=5,5

3 1
e) Cov(X,Y)= E( XY )  E( X ).E(Y )  1   = 0,25, sendo a distribuição de XY.
4 4
X.Y 0 1 2 3
p(XY) 4/8 1/8 2/8 1/8

Exercícios de aplicação 24:

1. No lançamento de 1 dado definimos as variáveis aleatórias:


X: a face voltada para cima,
Y: a face voltada para baixo. Determinar

a) E(X)

b) E(Y)

c) E(XY)

d) Cov(X,Y)

148
2. Seja a distribuição conjunta das variáveis aleatórias X e Y dada por:

X Y 1 2 3 p(xi )
4 0,2 0,3 0,1
5 0,2 0,05 0,15
p( yi )

Determinar

a) p(x=4)

b) p(y=2)

3. A fábrica de autopeças de Ana Carolina trabalha em dois turnos. A empresa preocupada com as faltas
de seus operários resolveu analisar o número de faltas em cada turno. Seja
X: número de faltas no turno diurno e Y: número de faltas no turno noturno. Essa avaliação foi feita
durante 4 meses e obteve-se a seguinte distribuição de probabilidades.

X Y 0 1 2 3 p(xi )
0 0,05 0,05 0,10 0
1 0,05 0,10 0,25 0,10
2 0 0,15 0,10 0,05
p( yi )

Determinar:

a) Probabilidades marginais de X.

b) Probabilidades marginais de Y.

149
c) E(X)

d)E(Y)

150
CAPÍTULO 8.
ESTIMAÇÃO POR INTERVALOS

1. Conceitos
O comportamento de um pesquisador é obter uma amostra que seja representativa da
população na qual ele tem interesse. No entanto podemos sempre esperar alguma diferença entre
uma amostra aleatória ou não e a população da qual ela foi extraída. A média da amostra x nem
sempre coincide com a média da população  . O mesmo podemos dizer com respeito ao desvio
padrão S da amostra e o desvio padrão  da população. Apesar dos melhores esforços do
pesquisador sempre ocorre um erro, conhecido por erro amostral.
2. Média aritmética e desvio padrão de x
A estimativa de parâmetros populacionais por intervalos leva em conta uma estimativa
pontual à qual se adiciona um erro de estimação para mais e para menos, criando assim uma
amplitude com limite inferior e superior para o parâmetro populacional estimado.
Suponhamos que se deseja estudar o comportamento das alturas dos alunos do sexo
masculino de todas as turmas dos Cursos de Engenharia e de todas as Faculdades do Estado de São
Paulo. Obter as alturas de todos os alunos é inviável não só pelo elevado custo, mas, também pelo
trabalho exaustivo para se coletar todos esses dados. Devemos, pois, determinar uma amostra que
seja representativa dessa população.
Suponhamos uma variável X normalmente distribuída e se a distribuição é normal, seus
parâmetros são a média populacional 𝜇 e o desvio padrão populacional 𝜎.
Se coletarmos i amostras (i = 1, 2, 3,..., n) aleatoriamente de X tendo cada amostra n
elementos e sendo as amostras 𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 , obtidas aleatoriamente e independentes, então
podemos esperar que nessa longa série a média xi ( média das médias) tenderá para a média
populacional 𝜇 principalmente quando n for grande.
Sabemos ainda que a média amostral é dada por:

1
𝑋̅ = 𝑛 (𝑋1 + 𝑋2 + 𝑋3 + ⋯ + 𝑋𝑛 ) e como a média 𝑋̅ é uma variável aleatória, ela tem sua
esperança e variância dadas por:

1 1 𝑛𝜇
𝐸(𝑋̅) = (𝐸(𝑋1 ) + 𝐸(𝑋2 ) + 𝐸(𝑋3 ) + ⋯ + 𝐸(𝑋𝑛 ))= (𝜇 + 𝜇 + 𝜇 + ⋯ + 𝜇) = = 𝜇
𝑛 𝑛 𝑛

1 1
Var(𝑋̅) = 𝑛2 𝑉𝑎𝑟(𝑋1 + 𝑋2 + 𝑋3 + ⋯ + 𝑋𝑛 )=𝑛2 [𝑉𝑎𝑟(𝑋1 ) + 𝑉𝑎𝑟(𝑋2 ) + 𝑉𝑎𝑟(𝑋3 ) + ⋯ +
1 𝑛𝜎 2 𝜎2 
𝑉𝑎𝑟(𝑋𝑛 )]= 2
(𝜎 2 +𝜎 2 + 𝜎 2 + ⋯ + 𝜎 2 ) = = e tem desvio padrão  ( X )   x .
𝑛 𝑛2 𝑛 n
Exemplo 1:
Tomemos como exemplo uma população de 5 alunos da disciplina de estatística que foram
submetidos a uma prova de 5 questões. Segue a distribuição dos acertos dos alunos A,B,C,D e E,
sendo xi  1,2,3,4,5 a quantidade de questões certas. Determinemos a média populacional  e
desvio padrão  da população.
Resolução: Para obtermos esses valores montamos a tabela.

151
alunos xi fi xi fi | xi  x | | xi  x | fi (xi  x )2 fi
A 2 1 2 1 1 1
B 3 1 3 0 0 0
C 1 1 1 2 2 4
D 5 1 5 2 2 4
E 4 1 4 1 1 1

 15 10

Logo a Média é x 
x f i i

15
3 e
n 5
 (X )  
( x  x ) f 10 2

Variância
2
  2 e seu Desvio Padrão  
i i
2  1,4142
5 n
Selecionemos agora todas as amostra possíveis de 2 acertos com repetição, isto é, 52 =25
duplas e determinemos a média populacional  e desvio padrão  , para todas as amostras.
Resolução: Para obtermos esses valores montamos a tabela.
Amostra 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Acertos 1,1 1,2 1,3 1,4 1,5 2,1 2,2 2,3 2,4 2,5 3,1 3,2 3,3 3,4
Média xi 1 1,5 2 2,5 3 1,5 2 2,5 3 3,5 2 2,5 3 3,5

Amostra 15 16 17 18 19 20 21 22 23 24 25
Acertos 3,5 4,1 4,2 4,3 4,4 4,5 5,1 5,2 5,3 5,4 5,5
Média xi 4 2,5 3 3,5 4 4,5 3 3,5 4 4,5 5

Construindo a distribuição das médias de todas as amostras segue

xi fi xi fi | xi  x | | xi  x | fi | xi  x | fi
1,0 1 1 2,0 2,0 4,0
1,5 2 3 1,5 3,0 4,5
2,0 3 6 1,0 3,0 3,0
2,5 4 10 0,5 2,0 1,0
3,0 5 15 0 0 0
3,5 4 14 0,5 2,0 1,0
4,0 3 12 1,0 3,0 3,0
4,5 2 9 1,5 3,0 4,5
5,0 1 5 2,0 2,0 4,0

 75 25

152
75
Logo a média das amostras é xi  x   3, que coincide com a média da população e o
25
25
desvio padrão x   1.
25
Observação 1:
A distribuição amostral da média tende para uma distribuição normal.
Observação 2:
A média da distribuição amostral das médias é igual a média da população.
Observação 3:
O desvio padrão da distribuição amostral das médias é menor que o desvio padrão da população.
Observação 4:
Se uma distribuição é normal, então a distribuição amostral da média é também normal.
Observação 5:
Raramente um pesquisador coleta de uma população uma quantidade grande de amostras como
fizemos no exemplo 1, como isso não ocorre, podemos calcular o desvio padrão da distribuição
amostral das médias dividindo o desvio padrão da população pela raiz quadrada do tamanho da
  2
amostra, assim  ( X )  , para o exemplo 1,podemos escrever  ( X )   x  1
n n 2
Observação 6:
A média aritmética x é denominada de estimador da média da população  . Se x =  , então
dizemos que estatística da amostra é um estimador sem viés. Neste caso a média aritmética da
amostra x é tal que x .
Observação 7:

A fórmula  ( X )   x  para o desvio padrão de x permanece verdadeira somente quando a
n
amostragem é feita por reposição de uma população finita ou com ou sem reposição para uma
população infinita. O tamanho da amostra é pequena em comparação ao tamanho da população se
n
considerar a relação  0,05. Sendo n o tamanho da amostra e N o tamanho da população. Caso
N
 N n N n
isso não ocorra utilizamos a fórmula  x  , sendo denominado fator de
n N 1 N 1
correção da população finita.

Observação 8:
A igualdade  x   só ocorre se n=1 e quando n >1teremos  x   . Portanto o desvio padrão da
distribuição de amostragem da media x decresce conforme cresce o tamanho da amostra.

Exemplo 2:
Sejam a média da população  =100 e o desvio padrão   20 e seja o tamanho das amostras
iguais a 25 elementos. Determinar o desvio padrão da distribuição amostral das médias.

153
 20 20
Sabemos que  ( X )   x =   4.
n 25 5

Denominamos de erro padrão da média amostral a:  ( X )   x .
n
3.Teorema Central do limite
Na medida em que aumenta o tamanho n da amostra, a distribuição amostral da média de uma
amostra aleatória extraída de qualquer população, tende para uma distribuição normal com média 

e desvio padrão  x  .
n
Exemplo 3:
Uma variável aleatória X tem distribuição normal com média 50 e desvio padrão 12. Calcular
a probabilidade de que uma amostra de 64 elementos selecionados aleatoriamente tenha média maior
que 53?
Resolução:
 12 12
Sabemos que a distribuição amostral da média tem x  x  50 e  x     1,5 .
n 64 8
x  x 53  50 3
Usando a variável normal padronizada segue: z     2 ,logo
x 1,5 1,5
p(x  53)  p(z  2)  0,5  p(0  z  2)  0,5  0,47725  0,02275  2,275%.
Exemplo 4:
A empresa WPR tem 2 000 empregados e o valor médio por horas trabalhadas é R$30,00 e
tem desvio padrão R$5,00. Se x representa a média aritmética do valor hora do serviço trabalhado.
Determinar a média aritmética da distribuição amostral da média e seu desvio padrão para amostras
de a) 49 e b) 144 elementos.
Resolução:
a) Sabemos que a distribuição amostral da média tem x  x  30,00 e como
n 49  5 5
  0,025  0,05. o desvio é dado por:  x     0,71
N 2000 n 49 7
b) A distribuição amostral da média é a mesma x  x  30,00 e como
n 144
  0,072  0,05 , então devemos usar:
N 2000

 N n 5 2000  144 1856


x  =  0,4167   0,00898
n N 1 144 2000  1 1999

4. Média aritmética e desvio padrão da proporção p̂

A probabilidade de sucesso em experimento binomial representa a proporção da amostra ou a


proporção da população que apresenta uma determinada característica.

154
X
Proporção da população é calculada por: p  ,sendo
N
 X : número total de elementos da população que possui a característica

 N : úmero total de elementos da população
x
Proporção da amostra é calculada por: pˆ  ,sendo
n
x : número total de elementos da amostra que possui a característica

 n : úmero total de elementos da amostra

Exemplo 5:
Em uma pesquisa com estudantes de uma universidade verificou-se que o total de alunos
matriculados é 6 000, dos quais 3 800 são proprietários de automóveis. Em uma amostra de 200
alunos dessa universidade verificou-se que 120 são proprietários de automóveis. Encontre a
proporção dos alunos na população e na amostra que são proprietários de automóveis.
X 3800
Solução: Proporção da população é calculada por: p    0,633 .
N 6000
x 120
Proporção da amostra é calculada por: pˆ    0,6.
n 200
A média aritmética da proporção da amostra, p̂ , e é representada por  p̂ ,é igual à
proporção da população, p, isto é pˆ  p.
Observação 9:
A proporção da amostra, p̂ ,é denominada de estimador da proporção da população, p.
O desvio padrão da proporção da amostra, p̂ , e é representada por  p̂ , e dado pela
pq
lei:  p̂  .
n
Sendo que p corresponde à proporção da população e q=1-p, e n tamanho da amostra.
Exemplo 6:
Determinar a média e o desvio padrão da proporção da amostra no exemplo 5.
A média aritmética da proporção da amostra é dada por:  pˆ  p  0,633 e

pq 0,633  0,367
O desvio padrão da proporção da amostra, p̂ , é dado por:  pˆ    0,00145
n 200
5. Intervalos de Confiança

É o processo de estimar um parâmetro desconhecido, construindo um intervalo de confiança


com uma probabilidade (1−∝) (nível de confiança ) que contenha o verdadeiro parâmetro. O nível
de confiança pode ser obtido até 99%.

155
Conhecendo-se uma amostra de uma população, é sempre possível obtermos a média da

amostra, por meio da fórmula x 


x f i i
, porém, como dissemos no início é inviável obter a
n
média  da população não só pelo elevado custo, mas, também pelo trabalho exaustivo para se
coletar todos esses dados. Para isso, determinamos um intervalo para o valor de  , com
probabilidade de ( 1   ) de certeza que a média  da população se encontre nesse intervalo.
Devemos construir um intervalo de confiança da forma:

  x  (um erro de amostragem) .Qual deve ser a amplitude de tolerância para este erro?
O estudo de estimação intervalar para as médias populacionais é condicionado por duas
situações:
1º caso: Quando o desvio padrão ou a variância populacional é conhecido.

2º caso: Quando não se conhece o desvio padrão ou variância populacional.

Antes de iniciarmos estas considerações convém visualizarmos o significado dos intervalos


de confiança para a média populacional  .
Gráfico do Intervalo de Confiança, sendo µ o parâmetro populacional; (1 – α) é o nível de
certeza da estimativa ou probabilidade do intervalo conter o parâmetro populacional.

Fig.1

5.1 Aplicação das tabelas Z e t.


A utilização das tabelas que representam a probabilidade depende do tamanho da amostra e
do conhecimento da variância populacional, o que por sua vez condiciona a estatística de teste.

No quadro abaixo resumimos a utilização das duas tabelas:

Variância Populacional σ2 Amostra n Estatística de teste


n> 30
elementos X 
Se o valor de σ é conhecido Z

Use o estimador σ n≤ 30 n
elementos

156
X 
n> 30 Z
Se o valor de σ é elementos
s
desconhecido n
Use o estimador S como X 
n≤30 t
aproximação de σ s
elementos
n

5.2 Formulando a Estimação Intervalar

A estimação intervalar tem como ponto de partida uma estimação pontual do parâmetro a ser
estimado.
Observação 9:
 Se X é uma variável normal de média  e desvio padrão  , então a distribuição
x
normal padronizada é obtida por meio da mudança de variável z  .


 Se X é uma variável normal de média  e desvio padrão , então a distribuição
n
normal padronizada tem mudança de variável Z  X  

( )
n
Na prática, se quer garantir com certo grau de certeza (1 – α) que a abscissa padronizada Z do
parâmetro estimado esteja dentro do intervalo desejado, que vai de −𝑍𝛼/2 a 𝑍𝛼/2 .
Desta forma poderemos escrever uma expressão que traduza esta abordagem do cálculo da
probabilidade e que esta variável padronizada Z caia no intervalo, −𝑍𝛼/2 a 𝑍𝛼/2 , então
p[Z 2  Z  Z 2 ]  (1)
A variável padronizada Z, que representa o afastamento da estimativa pontual x para o
parâmetro µ em quantidades de desvios padrão, pode ser escrita como:
X  X 
Z daí escrevemos que, p[Z 2   Z 2 ]  (1   )
 ( x) 
( )
n n
Devido ao fato que desejamos estimar o parâmetro populacional µ vamos modificar a

expressão acima a fim de isolar µ. Multiplicando a desigualdade por
n
     
p  Z 2 
 n 

  X     Z 2    (1   ) ,
n 
 
p(Z 2  X    Z 2 ) (subtraindo X , segue)
n n
 
p( X  Z 2     X  Z 2 )  (multiplicando por (-1)
n n

157
 
p( X  Z 2    X  Z 2 )  1   , ou ainda
n n
      
p  X   Z 2      X   Z 2    (1   ) (I)
  n  n 
Desta forma a média µ da população poderá ser estimada com o nível de certeza e a
probabilidade desejada.

6. Intervalo de confiança para a média  da população, com a média da amostra x e o desvio


padrão  conhecido.

Exemplo 7: Quando o desvio padrão populacional é conhecido.

Se as alturas dos alunos do sexo masculino da disciplina de estatística dessa Faculdade têm
distribuição normal e que numa amostra de 100 alunos foi encontrada a média x  175 cm e desvio
padrão S =15 cm, determinar o intervalo de confiança para a média  ao nível 90%.
Solução:
Do enunciado podemos escrever: n  100 ; x  175 ; S  15 ;   10%
Observação 10: Neste caso podemos substituir  por S pois, a amostra tem mais de 30 elementos.
Na tabela da distribuição normal encontramos Z 2 = 1,65

45% 45%

1,65 1,65
Fig. 2

Substituindo esse valor na expressão ( I ), segue


15 15
p(175  .1,65    175  .1,65) =
100 100
p(175  2,475    175  2,475)  90%
p(172,525    177,475)  90%

Podemos afirmar com 90% de confiança que a altura média dos alunos é um valor que está no
intervalo entre 172,525cm e 177,475cm.

158
Exemplo 8:
Seja X a duração de vida de uma nova bateria de celular. Foram testadas 100 baterias
fornecendo uma duração de vida média de x  500h e desvio padrão  =5 h e que se deseja obter
um intervalo de confiança ao nível de 95% para a média  .
Solução:
Do enunciado podemos escrever: n  100 ; x  500 ;   5 ;   5%
Na tabela da distribuição normal encontramos Z 2 = 1,96

0,475 0,475

-1,96 1,96
Fig. 3
1,96
Substituindo esse valor na expressão ( I ), segue
5 5
p(500  .1,96    500  .1,96) = p(499,02    500,98)  95%
100 100
Podemos afirmar com 95% de confiança que a duração de vida média é um valor que está no
intervalo entre 499,02 h e 500,98 h.

Exemplo 9:
De uma população normal com variância  2 igual a 36 e média x  16, foi retirada uma
amostra de 40 elementos. Pede-se determinar um Intervalo de Confiança para a média populacional
 com um nível de confiança de 95%.
Solução:

Do enunciado obtém-se o desvio padrão amostral  x 


2 36
  0,9486e consultando-
n 40
se a tabela Z para uma área de 0,475 teremos na tabela (página 106) da distribuição normal
Z 2  Z0,475  1,96

0,475 0,475

1,96 1,96
Fig. 4

Substituindo esse valor na expressão ( I ), segue

159
p 16  (1,96 0,9486)    16  (1,96 0,9486)  95%
e, portanto, podemos escrever que p 14,14    17,85  95%
Podemos afirmar com 95% de confiança que a média da população está entre 14,14 e 17,85,
ou corremos o risco de 5% que a verdadeira média possa estar abaixo de 14,14 ou acima de 17,85.

7. Intervalo de confiança para a média  da população, com a média da amostra x e o desvio


padrão  desconhecido.

1º caso: Estudaremos em primeiro lugar amostras com mais de 30 elementos.


Para estimarmos o parâmetro  (média populacional) de uma população da qual não se
conhece o desvio padrão, portanto não se conhece a variância, justifica-se a substituição pura do
desvio padrão da população σ pelo da amostra S quando a amostra tiver mais de 30 elementos e
assim, utiliza-se a tabela Z normal.
Exemplo 10:
Seja uma população normal de parâmetros desconhecidos, da qual tiramos uma amostra de
tamanho 60 com média x  46,15 e desvio-padrão s  23,31.Estimar o IC (Intervalo de confiança)
para a média  da população com um nível de certeza de 93%.
Solução: O desvio padrão da média amostral é dado por:
s2 (23,31) 2 23,31
sx     3,0
n 60 60
Determinando a posição de Z 2 . Sendo que 1   corresponde à área de 93% (probabilidade
do intervalo conter o parâmetro procurado) e que, (1   ) 2  46,5% área embaixo da curva normal
segue, portanto que Z46,5  1,82. Fig.5

0,465 0,465

1,82 1,82
Substituindo na fórmula:
(II)    
p X  Z 2  sx    X  Z 2  sx   (1  ) , tem-se
p  46,15  1,823    46,15  1,823  0,93.
Portanto o Intervalo de Confiança para a média  da População com um nível e confiança
de 93% é p  40,69    51,61  0,93.

Em notação matemática escrevemos: IC(;93%)   40,69;51,61 , ou seja, o Intervalo de


Confiança ao nível de 93% para a Média  da População é 40,69;51,61.

160
Exemplo 11:
As notas de matemática dos alunos do primeiro semestre estão indicadas na tabela

6 7,5 8 8,5 6,5 7,5 8 7,5 9,5 6


7 7 7 9 7 9,5 7 6 7 7
8 8,5 7,5 5,5 7,5 7 5,5 7 7 8
6,5 7,5 9 6,5 8,5 7,5 6,5 9,5 8,5 8

Determinar o intervalo de confiança para a média  ao nível de 95%.


Solução: Devemos determinar x e S. Usamos para isso a tabela.

xi fi fac xi fi | xi  x | | xi  x | fi ( xi  x )2 fi
5,5 2 2 11 1,95 3,90 7,605
6,0 3 5 18 1,45 4,35 6,3075
6,5 4 9 26 0,95 3,80 3,6100
7,0 10 19 70 0,45 4,50 2,0250
7,5 7 26 52,5 0,05 0,35 0,0175
8,0 5 31 40 0,55 2,75 1,5125
8,5 4 35 34 1,05 4,20 4,4100
9,0 2 37 18 1,55 3,10 4,8050
9,5 3 40 28,5 2,05 6,15 12,6075

 298 42,9000

x i i 
x f 298
Média:  7,45
n 40

Desvio Padrão: SX   x  x  . f
i
2
i

42,9
 1,0488 1,05
n 1 39

Para o nível de 95%, tem-se: (1   ) 2  47,5% e Z47,5  1,96

0,475 0,475

1,96 1,96
Fig. 6

161
Substituindo em (II) segue:
  1,05   1,05  
p  7, 45  1,96      7, 45  1,96     0,95.
  40   40  
p 7,45  0,32539    7,45  0,32539  p 7,12461    7,77539  0,95.
Podemos afirmar com 95% de confiança que a média das notas de matemática é um
valor que está no intervalo entre 7,12461 a 7,77539.

Exemplo 12:
O gerente do magazine WP deseja estimar com 95% de probabilidade (confiança) qual tenha
sido a média dos saldos de caixa do ano anterior no fechamento diário das operações. Colhe amostras
de 50 saldos (uma para cada dia de cada semana do ano anterior). O gerente seguiu as seguintes
etapas:
Agrupou as observações em classes por tratar-se de uma amostra grande, superior a 30
observações.
As observações de saldos de caixa foram as seguintes ( em R$ x 100 )
Saldos de Caixa dados brutos.
2,3 1,7 1,9 1,6 2,8 3,1 4,0 5,3
1,0 0,9 0,8 0,7 0,4 0,95 1,32 1,64
1,27 2,52 2,1 3,4 3,8 2,15 0,85 4,6
1,29 2,13 2,47 2,58 1,95 2,4 0,74 3,82
2,0 1,24 4,3 2,16 1,47 5,0 0,45 2,61
2,1 2,75 3,81 1,83 7,8 4,7 3,12 3,0
Determinou-se o número de classes necessárias e sua amplitude para agrupar os dados
utilizando-se o método da Raiz.
Xmáx  X min 5,3  0,4
K  n  48  7 e a amplitude será então h    0,7
k 7
Desta maneira obteve-se a tabela com seus respectivos dados.

Classes xi fi (xi  fi ) | xi  x | | xi  x | fi ( xi  x )2 fi
0,4|—1,1 0,75 9 6,75 1,54 13,86 21,3444
1,1|— 1,8 1,45 8 11,6 0,84 6,72 5,6448
1,8|— 2,5 2,15 14 30,1 0,14 1,96 0,2744
2,5|— 3,2 2,85 5 14,25 0,56 2,80 1,5680
3,2 |— 3,9 3,55 6 21,3 1,26 7,56 9,5256
3,9 |— 4,6 4,25 2 8,5 1,96 3,92 7,6832
4,6 |—| 5,3 4,95 4 19,8 2,66 10,64 28,3024
 48 112,3 74,3428

162
A média da amostra é x 
(x  f )  2,29
i i
e o desvio padrão
n

 x  x 
2
. fi
74,3428
S i

 1, 257681
n 1 48  1
Temos os seguintes estimadores:  2  2,5% ou   5% e x  2,29
(1,257)2
s  1,257 e portanto, sx   0,181432
48
Z 2  Z0,475  1,96 , consultando-se a tabela Z. Logo


p X  (Z 2  sx )    X  (Z 2  sx )  95% 
p  2,29  1,96  0,18143    2,29  1,96  0,18143  0,95
p 1,9344    2,6453  0,95
Pode-se dizer que a média  da população dos saldos de caixa do ano anterior estará
contida entre os valores 1,9344 e 2,6453 com uma grau de confiabilidade de 95%, ou corre-se o risco
de erro de 5% que a média populacional seja um valor abaixo de 1,9344 ou acima de 2,6453 ( R$ x
100).
Outra pergunta de interesse poderia ser: Qual o erro de estimação ao nível de 5%”?
O erro amostral é dado pela diferença entre a média da amostra e a média da população :
x 
  x  , mas como Z  , então Z  sx  x   , e portanto o erro amostral pode ser
sx
definido por   Z  sx .
Assim, no exemplo anterior o erro ao nível de 5% será:   1,96  0,18143  0,3556 , ou
R$ 356,00.
2º caso: Se a amostra tem menos de 30 elementos

8. Intervalos de Confiança para a média populacional a partir de pequenas amostras.

Se a amostra for pequena (menor que 30 observações) a priori não se pode utilizar o desvio
padrão da amostra como sendo o da população, pois se demonstra matematicamente que o desvio
padrão da amostra é um estimador “viesado” do desvio padrão populacional e, portanto não é válido
para tal finalidade. Lembre-se que a substituição pura e simples de 𝝈 por S, somente se justifica
para grandes amostras.
Entretanto serão raros os casos onde se queiram inferir resultados populacionais a partir de
amostras que tenham menos de 30 elementos, mas caso isto aconteça poderemos utilizar a tabela t-
Student.
O criador da distribuição t-Student foi W.S. Gossett, empregado de uma cervejaria Guinness
irlandesa no princípio do século XX. A empresa não gostava que seus empregados publicassem
trabalhos em seu próprio nome, de modo que Gossett adotou o pseudônimo de Student em seus
trabalhos.

163
1º caso: Intervalo de Confiança para Média  da população com variância conhecida.
O procedimento é análogo ao adotado para a determinação dos intervalos de confiança para
médias populacionais a partir de grandes amostras.
A diferença ocorre apenas na distribuição amostral da média das pequenas amostras que possui
distribuição t  Z . Esta distribuição com tn1 ; 2 tem (n – 1) graus de liberdade e  2 de
 n21
n 1
significância. Estes valores de probabilidade se encontram já calculados na tabela t de Student que
apresentamos parcialmente a seguir.
Uso da tabela (página 170):
Exemplo13:
A tabela t de Student é bicaudal.
1) Se o nível de confiança é 95%, procura-se na tabela, 1)   5% e se o número de
elementos é n=22, toma-se n-1=21 graus de liberdade, assim o valor de tn1; 2 = t21;0,025  2,080 .

2) Se   5% , n  10 n 1  9, então tn1; 2 = t9;2,5  2,262


3) Se   5% , n  10 n 1  9, então tn1; 2 = t9;2,5%  1,833
4) Se   2% , n  10  n 1  9, então tn1; 2 = t9;1%  2,821.
5) Se   2% , n  20 n 1  19, então tn1; 2 = t19;1%  2,539.
6) Se   10% , n  25 n 1  24, então tn1; 2 = t24;5%  1,711.

164
9.Tabela da distribuição de Student
f(t)

Tabela - Distribuição de Student Bicaudal


p(-t c < t < t c )= 1-p

-tc 0 tc t

p 90% 80% 70% 60% 50% 40% 30% 20% 10% 5% 4% 3% 2% 1%


ѵ
1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 15,895 21,205 31,821 63,657
2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 4,849 5,643 6,965 9,925
3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 3,482 3,896 4,541 5,841
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 2,999 3,298 3,747 4,604
5 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 2,757 3,003 3,365 4,032
6 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 2,612 2,829 3,143 3,707
7 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,517 2,715 2,998 3,499
8 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,449 2,634 2,896 3,355
9 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,398 2,574 2,821 3,250
10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,359 2,527 2,764 3,169
11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,328 2,491 2,718 3,106
12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,303 2,461 2,681 3,055
13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,282 2,436 2,650 3,012
14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,264 2,415 2,624 2,977
15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,249 2,397 2,602 2,947
16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,235 2,382 2,583 2,921
17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,224 2,368 2,567 2,898
18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,214 2,356 2,552 2,878
19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,205 2,346 2,539 2,861
20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,197 2,336 2,528 2,845
21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,189 2,328 2,518 2,831
22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,183 2,320 2,508 2,819
23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,177 2,313 2,500 2,807
24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,172 2,307 2,492 2,797
25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,167 2,301 2,485 2,787
26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,162 2,296 2,479 2,779
27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,158 2,291 2,473 2,771
28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,154 2,286 2,467 2,763
29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,150 2,282 2,462 2,756
30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,147 2,278 2,457 2,750
35 0,127 0,255 0,388 0,529 0,682 0,852 1,052 1,306 1,690 2,030 2,133 2,262 2,438 2,724
40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,123 2,250 2,423 2,704
50 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,109 2,234 2,403 2,678
60 0,126 0,254 0,387 0,527 0,679 0,848 1,045 1,296 1,671 2,000 2,099 2,223 2,390 2,660
120 0,126 0,254 0,386 0,526 0,677 0,845 1,041 1,289 1,658 1,980 2,076 2,196 2,358 2,617
∞ 0,126 0,253 0,385 0,524 0,674 0,842 1,036 1,282 1,645 1,960 2,054 2,170 2,326 2,576

165
Ressalta-se que quando n>30 e tende ao infinito, a probabilidade na distribuição t se iguala
àquela da distribuição Z. De fato se consultarmos as duas tabelas poderemos verificar que para o
mesmo grau de significância, por exemplo, 5% teremos um valor de afastamentos em número de
desvios padrão muito parecidos ou seja (1,646 para t e 1,64 para Z).
Assim, justifica-se a aplicação da tabela t quando a amostra tem número igual ou menor que
30 elementos. Note-se ainda que no caso da tabela t a consulta é feita para tn1; 2 , então, por
exemplo, se n = 10 teremos n – 1 = 9 graus de liberdade e sendo 1   =95% o grau de significância
alfa de 5% deverá ser, neste caso, dividido por dois (lembre-se que a menor das probabilidades
apresentadas no título de cada coluna é a área em uma cauda; a probabilidade maior é a área em
ambas as caudas).
A consulta à tabela tn1; 2  t9;0,025  2,262 .
Portanto, o intervalo de confiança para a média 𝜇 pode ser construído com boa aproximação
adotando-se S como estimativa para 𝜎 na expressão X  Z 2 X . Quanto menor é a amostra, mais
necessária se torna a introdução de uma correção, a qual consiste em usar a variável t –Student, ao
invés da variável Z normal padronizada.
X  X   X   
Chamando de tn1  , de modo que tn1  .  .  Z 2 . é expressão
s s   s s
n n n
da variável t –Student .
Assim o intervalo de confiança para médias populacionais a partir de pequenas
amostras fica representado por:
  s   s 
p  x   tn1      x   tn1    (1   )
  n   n 
Exemplo 14:
Uma das preocupações de um analista financeiro deve ser a de poder comparar uma empresa,
ao seu setor de atividade econômica, já que é sabido que a análise vertical e horizontal não consegue
produzir a comparação com o meio externo à empresa. Suponhamos uma amostra de tamanho n = 20
de empresas de um mesmo setor de atividade econômica.
Amostra dos índices de LG das 20 empresas.

Liquidez Geral
1,84 0,99 0,94 0,59
4,33 2,8 0,06 0,25
1,87 2,38 1,03 1,8
1,81 0,17 0,78 2,18
1,48 0,87 0,78 7,75

Pede-se, calcular um Intervalo de Confiança para a média da população com 95% de certeza.
Calculados os elementos da Estatística Descritiva da amostra necessários para a estimação da
média populacional, obteve-se: x  1,735 e s  1,7440741.

166
A média e o desvio padrão são elementos únicos que caracterizam a distribuição de
probabilidades da amostra. Desta forma parte-se desta característica da amostra, para se estimar o
parâmetro populacional. O desvio padrão amostral é
s 1,744074178
sx    0,389986
n 20
Consultando-se a tabela t-Student temos, tn1; 2  t19;0,025  2,093
Substituindo-se os elementos encontrados na expressão abaixo o intervalo de confiança será:
  s   s 
p  x   tn1      x   tn1    (1   )
  n  n 

p1,735  2,093 0,389986    1,735  2,093 0,389986  95%


p1,735  0,81624    1,735  0,81624  95%
p0,91876    2,55124  95%
Pode-se notar que o erro de estimação  é consideravelmente alto, 81,62% o que reforça a
idéia que conclusões ou decisões tomadas a partir de inferências com pequenas amostras devem ser
interpretadas com muita cautela.

Exemplo 15:
Uma empresa fabrica motores elétricos movidos a energia solar utilizados para bombeamento
de água em áreas agrícolas e colheu uma amostra de 25 motores e após vários testes, verificou que a
vida média das células fotoelétricas é de 1327 horas e desvio padrão de 182 horas. Pede-se
determinar um IC com 95% de certeza para a vida útil populacional das células de energia.
Solução:
Como a amostra tem n<30 utiliza-se a tabela t.
s 182
sx    36,40 e tn1; 2  t24;0,025  2,064
n 25
  s   s 
Desta forma o intervalo de confiança será: p  x   tn1      x   tn1    (1   )
  n  n 
p1327  2,064  36,40    1327  2,064  36,40  95%
p1327  75,12    1327  75,12  95%
ou seja , p1251,87    1402,12  95%
A vida útil média da população das células de energia estará entre 1251,87 e 1402,12 horas
com 95% de certeza ou corre-se o risco de 5% de que a verdadeira média populacional esteja fora
desse intervalo.

167
Exercícios de Aplicação 25:
1) Uma empresa fabricante de filtros de água colheu uma amostra de 50 produtos e detectou que a
sua vida média era de 630 horas com desvio padrão de 46 horas. Pede-se determinar um IC para a
vida média populacional dos misturadores ao nível de 95%.

2) Um administrador financeiro quer estimar com 95% de certeza um IC para a média de horas de
serviço dos funcionários no ano em curso. Para isto colheu uma amostra aleatória das horas
trabalhadas de 48 funcionários tendo tabulado os resultados:

Pede-se:
39 27 35 24 28 29 35 24 a) agrupar as variáveis por classe (método da
19 17 24 15 28 31 33 19 raiz).
b) calcular a média e o desvio padrão amostral.
38 24 26 28 29 35 24 27 c) construir um IC ao nível de 95% para a
35 36 32 31 30 29 28 27 média de horas na população.
26 25 24 26 24 23 21 34 d) qual o erro amostral da estimativa?
35 36 36 34 38 37 30 31

i) Amplitude da Amostra: R = xmax-xmin =

ii) Número de Classes: K =[ n ] =

168
iii) Amplitude da Classe: r = R/K =

classes xi fi fac xi fi | xi  x | | xi  x | (xi  x )2 fi


fi

169
3) Num processo de ordenha, uma amostra da quantidade de leite de 15 animais revelou média de
30 litros com desvio padrão de 4,3 litros. Pede-se estimar um IC com 95% de certeza para a média
de produção populacional da fazenda.

4) Uma fábrica de bombons de chocolate quer estimar o peso médio populacional de seus produtos
que são fabricados de forma artesanal. Para isto colhe uma amostra de 10 caixas o obtém peso
médio de 436 gramas com desvio padrão de 58 gramas. Pede-se estimar um IC ao nível de certeza
de 95%.

170
5) Uma grande rede de hotéis quer estimar o tempo médio para limpeza dos 246 quartos que possui
em uma de suas unidades. Para isto colhe uma amostra do tempo gasto com a arrumação e limpeza
de 48 quartos e obtém 43 minutos com desvio-padrão de 12 minutos. Pede-se estimar ao nível de
95% de certeza;
1) a média de tempo gasto para a limpeza dos quartos;
2) se o valor médio de mão de obra é R$ 12,00 por hora, estimar o custo total diário mínimo e
máximo despedidos.

171
CAPÍTULO 9

TESTES DE SIGNIFICÂNCIA OU TESTES DE HIPÓTESES

1. Introdução

Os testes de Significância são chamados comumente de testes de Hipóteses. Para sermos


exatos, os testes de significância testam a Hipótese inicial Ho, enquanto os testes de Hipóteses testam
a Hipótese Alternativa H1. Na prática ambos são chamados de testes de Hipóteses.
Os testes de Hipóteses podem ser divididos em dois grupos: os testes paramétricos, assim
chamados por se referirem às hipóteses sobre os parâmetros populacionais e aqueles chamados não
paramétricos, pois na verdade se referem exclusivamente à forma da distribuição, ou em outras
palavras, dada uma distribuição de frequências, determina-se a que tipo de distribuição de
probabilidades esta “adere” melhor.
Nos problemas de Estimação, estimamos os parâmetros populacionais dentro de Intervalos de
Confiança. Agora nos testes de Hipóteses admitir-se-á que exista uma Hipótese inicial Ho, a respeito
do parâmetro populacional que deverá ser testado e assim, manter-se a hipótese inicialmente tida
como válida ou rejeitá-la em favor de uma Hipótese alternativa H1.

Exemplo 1:
No lançamento de uma moeda desejamos saber se a moeda utilizada é ou não uma moeda
equilibrada.
Não é possível afirmar que a moeda é honesta ou equilibrada apenas olhando-a e, não há
qualquer razão para afirmar que ocorrerá mais cara do que coroa ou vice-versa. Lançando apenas
uma vez também não podemos tirar conclusão se é ou não equilibrada e lançando a moeda muitas
vezes dispomos de mais informações.
A formulação de hipóteses ou de conjecturas acerca das populações é denominada hipóteses
estatísticas, podendo ser ou não verdadeiras.
A hipótese a ser testada é frequentemente denominada de hipótese nula.
Observações:
1) A hipótese nula Ho representa aquilo que se acredita no momento que se deseja provar.
2) A hipótese nula Ho sempre se refere a um valor especificado para o parâmetro da
população (média  ) e não para uma estatística amostral ( média x ).
3) A hipótese nula Ho sempre contém um sinal de igualdade com relação ao valor
especificado exato da população.
4) A hipótese alternativa H1 nunca contém o sinal de igualdade com relação ao valor
especificado para a população.
5) A rejeição da hipótese nula Ho indica que você tem comprovação estatística de que a
hipótese alternativa esta correta.
6) Um procedimento quando levado a uma decisão acerca de uma hipótese particular é
denominado de teste de uma Hipótese.
7) Testar a hipótese envolve considerar uma amostra aleatória, computar uma estatística teste
a partir de dados amostrais e, então tomar uma decisão a respeito da hipótese nula Ho.
No exemplo colocamos nossa hipótese nula como:

H0: A probabilidade de sair cara é p=1/2. E como Hipótese alternativa.


H1: Hipótese nula é falsa. No caso a moeda não é equilibrada.

172
Formulada a hipótese H0: A probabilidade de sair cara é p=1/2, e se lançarmos 20 vezes a
moeda e ocorrerem 17 vezes cara, ficamos inclinados a rejeitar a hipótese que a moeda é honesta. Se
jogarmos a moeda n vezes e se o número de caras esta próximo de n/2, aceitamos H0, a hipótese de
que a moeda é honesta.
Os testes de Hipóteses assim como os de estimação, baseiam-se em estimadores amostrais
para validar as generalizações feitas para as populações.

2. Conceituação.

Frequentemente os pesquisadores utilizam desta ferramenta estatística para testarem a


veracidade ou não de afirmações feitas sem o devido suporte técnico.
Por exemplo, um administrador financeiro pode ter a impressão que um de seus desembolsos
pela compra de matéria prima está mais alto que a média do ano anterior.
Outro caso simples poderia ser o aumento do custo do dinheiro para empréstimos para um
setor produtivo em relação a outro setor, ou seja, a média dos juros cobrados numa indústria em
comparação aos cobrados para outra indústria. Ainda, a rejeição de lotes de peças por comparação
entre as médias dos diâmetros das peças em dois lotes.
Por meio dos Testes de Hipóteses, testa-se uma hipótese existente Ho inicialmente tida como
verdadeira e daí, a partir de uma amostra válida colhida dentro da população de teste, tentar-se-á
provar se a hipótese inicial é verdadeira para a população ou abandonar-se-á, substituindo-a pela
hipótese alternativa H1. Em outras palavras, o teste ocorre a princípio a partir da comparação de um
tipo de evento ou variável de cada amostra selecionada e, portanto trata-se de hipóteses sobre
observações que possam ser controladas e comprovadas.
As hipóteses sobre fatos controláveis por sua vez devem ser traduzidas em hipóteses válidas
em estatística as quais dizem respeito a parâmetros populacionais.
O objetivo do teste pode ser resumido por meio de um exemplo genérico onde a partir da
dúvida se duas determinadas amostras tem ou não uma média presumida. Neste caso colhe-se uma
amostra verificando-se nesta a média e o desvio padrão amostral. Da teoria de Estimação devemos
recordar que a média amostral é um bom estimador da média populacional enquanto que o desvio
padrão só o é se a amostra tiver mais do que 30 observações.
Como observado anteriormente, vale lembrar que, a média e o desvio padrão, são a impressão
digital de uma distribuição de frequências. Assim, podemos abordar um caso genérico onde foram
calculados a média e o desvio padrão de duas amostras de índices financeiros extraídos da mesma
população e se quer ter certeza da verdadeira média populacional. Estaremos, portanto, recorrendo a
Teoria de Probabilidades para resolver esta dúvida.
Exemplo 2:
Sejam duas amostras cuja distribuição de frequências esta indicada abaixo com as respectivas
médias. O teste de Hipótese é assim indicado:
Ho : a verdadeira média é 0
H1 : a verdadeira média é maior que 0 por exemplo 1

0 1

173
Note-se que uma variável em estudo cuja média esteja entre os valores 0 e 1 , a princípio pela
análise gráfica, pode pertencer ao grupo da esquerda ou ao grupo da direita.
Portanto se Ho for verdadeira, poderemos dizer que a variável pertence à população
representada pelo gráfico da esquerda, caso contrário prevalece a outra hipótese de que a variável
pertença à população representada pela população da direita, portanto será verdadeira H1 .

3. Erros do tipo I e II

Erro tipo I: Um erro do tipo I ocorre caso você rejeite a hipótese nula, H0, quando ela é verdadeira
e não deveria ser rejeitada. A probabilidade de ocorrência de um erro do tipo I é representada por 𝛼.

Erro tipo II: Um erro do tipo II ocorre caso você não rejeite a hipótese nula, H0, quando ela é falsa
e deveria ser rejeitada. A probabilidade de ocorrência de um erro do tipo II é representada por 𝛽.

1- 1- b

b 

São quatro o número de decisões para o teste de hipótese

Situação real
Ho : é verdadeira Ho: é falsa
Decisão Não rejeitar Ho Decisão correta Erro do tipo II
Rejeitar Ho Erro do tipo I Decisão correta

4. Nível de significância ()


A probabilidade de cometer um erro do tipo I, representado por 𝜶, é identificada com Nível
de significância () do teste estatístico. Também denominada de probabilidade de rejeitar-se H0,
sendo esta escolhida pelo observador analista.
O complemento da probabilidade de um erro do tipo I, (1- 𝜶), é conhecido como coeficiente
de confiança. Sua representação gráfica é dada por:

1-

174
5. Poder de um Teste

A probabilidade de cometer um erro do tipo II é representada por 𝛽. O poder de um teste é


também chamado de probabilidade (1– β) e representa-se graficamente:

1- 1- b

b 

Quanto menor for o nível de significância α (alfa) maior será o de β (Beta) e assim menor
será a área (1 – β) o que diminui o poder do teste.
Ao contrário, quanto maior for o nível de significância (alfa) menor será o de (Beta) e
consequentemente maior será a área (1 – β) que se denomina poder do teste. Isto significa que se
aumentarmos o grau de significância aumentando Alfa (de 1% para 5% ou até mesmo para 10%) e se
com isto H0 não for rejeitada, isto é, se ainda assim a hipótese H0 estiver contida na área (1 – α) e
não na área de rejeição, teremos a certeza de que a variável em estudo pertence ao grupo de H0 e não
pertence ao grupo de H1 o que aumenta o poder do teste.

6. Valor Crítico de um teste

Supondo H0 como verdadeira, o pesquisador deverá fixar a probabilidade de rejeitá-la. Como


visto, a esta probabilidade chamamos de nível de significância. Nas diversas situações de pesquisas
costuma-se utilizar os níveis 0,1%,1%, 5% e 10% , sendo que a maioria dos programas adota por
padrão o nível 5% nada impedindo que o observador utilize outro. Explicaremos mais adiante como
a determinação do poder de um teste pode influenciar esta decisão.

À probabilidade de rejeitar a Hipótese inicial H0, associa-se um valor crítico xc relacionado à


distribuição de frequências estudada. Este valor crítico é definido pelo nível de significância adotado
e pela consequente consulta à tabela da função de densidade respectiva que podem ser Z normal de
Escore Reduzido como nos nossos exemplos, ou t-Student e caso se queiram testar, médias ou
desvios padrão de amostras grandes ou pequenas respectivamente.

7. Valor de comparação Zteste

O valor de comparação Zteste representa o afastamento que uma amostra representada por sua
média x se afasta da verdadeira média populacional 0 . Do TCL (teorema central do limite) sabe-se
que o desvio padrão amostral é “n” vezes menor que o populacional e representa-se  .
n

175
x - 0
Daí a fórmula do valor de comparação será representada como: Zteste 

n
Quando Zteste for maior que o valor crítico xc (se o teste for à direita) ou menor que o valor
crítico xc (se o teste for à esquerda), então Zteste estará na área de rejeição da hipótese inicial H0
dada pelo nível de significância  e, portanto devemos rejeitá-la. O mesmo acontece para o teste
bilateral. Quando um teste for significante (rejeição de H0 ) ao nível 5%, isto não quer dizer
necessariamente que deva ser significante aos níveis de 1% e/ou 0,1%.

7.1 Direção do teste

Para se executar um teste de hipótese é necessário termos pelo menos a média da amostra e a
média da população e também o desvio padrão da amostra ou da população.
Se a amostra revelar uma média maior que a média populacional 0 afirmada (de maneira
categórica) então se pode suspeitar que aquela amostra pudesse ter sido retirada de uma população
com média maior do que aquela afirmada. Desta forma o teste será unilateral à DIREITA e suas
hipóteses serão escritas como:
H0 : a verdadeira média é 0
H1 : a verdadeira média é maior que 0
Se a amostra revelar uma média menor que a média populacional 0 afirmada (de maneira
categórica) então se pode suspeitar que aquela amostra pudesse ter sido retirada de uma população
com média menor do que aquela afirmada. Desta forma o teste será Unilateral à ESQUERDA e suas
hipóteses serão escritas como:
H0 : a verdadeira média é 0
H1: a verdadeira média é menor que 0
Quando não houver uma afirmação categórica a respeito da verdadeira média populacional
contra a qual se quer comparar uma amostra então devemos “abrir” o teste BILATERALMENTE.
Desta forma suas hipóteses serão escritas como:
H0 : a verdadeira média é 0
H1 : a verdadeira média é  de 0

8. Valor Crítico para testes Unilaterais.

Suponha então a probabilidade de rejeição de 5% o valor crítico de corte denominado xc será


dado por: Z  Z50%-5%  Z0,45  1,64 , dependendo se o teste unilateral for à direita (positivo) ou à
esquerda (negativo).

Ho Ho
+ 1,64

  5%

176
9. Valor Crítico para testes Bilaterais

Supondo o mesmo nível de significância de 5%, o valor crítico de corte denominado xc será
dado por: Z1-α 2 = Z95% 2 = Z0,475 = ± 1,96 , para cada lado da curva de densidade de probabilidade.

95%
H0

- 1,96 + 1,96

  2,5%   2,5%

10. Erros de decisão

Nas diversas hipóteses que podem ser formuladas, erros são sempre possíveis de acontecer,
ou por estabelecimento errôneo de uma hipótese ou por má interpretação de resultados.
Admita-se que existam quatro possibilidades, duas corretas e duas incorretas:
 Aceitar Ho quando esta for verdadeira (correta) representa-se por 1 -  .
 Rejeitar Ho quando esta for falsa (correta) representa-se por 1 - b .
 Aceitar Ho quando esta for falsa (erro Tipo II) representa-se por b .
 Rejeitar Ho quando esta for verdadeira (erro Tipo I) representa-se por  .
A aceitação de Ho leva automaticamente à rejeição da hipótese alternativa H1 e vice-versa, a
aceitação de H1 leva a rejeição de Ho.
Define-se, portanto, Região Crítica como sendo um intervalo de valores que a variável
testada pode assumir e que leve à rejeição da hipótese inicialmente testada Ho. Pode-se determinar a
área de rejeição como normalmente apresentado nos programas estatísticos como sendo o nível de
significância 10%, 5%, 1% ou outro.

11. Utilização das tabelas de distribuição de probabilidades


Ilustra-se esquematicamente a utilização do modelo teórico nos testes de hipóteses para
estimação da média populacional quando esta tiver comportamento normal ou próximo da
normalidade.
Estatística de
Variância Populacional σ2 Amostra n
teste
n > 30
x -
Se o valor de σ é conhecido elementos Z

Use o estimador σ n ≤ 30 n
elementos

177
x -
n > 30 Z
Se o valor de σ é s
elementos
desconhecido n
Use o estimador s como x -
n ≤ 30 t
aproximação de σ s
elementos
n
Em casos onde a amostra não for suficientemente grande e ao mesmo tempo a população não
possuir comportamento normal, aconselha-se a aumentar o tamanho da amostra no mínimo para mais
de 30 elementos.

11.1. Testes Unilaterais à Esquerda para Média Populacional com  x (desvio padrão
populacional) conhecido.
Ilustraremos esta teoria por meio de exemplos para grandes e pequenas amostras para que o
leitor possa compreender sua aplicação prática e verificar que a aplicação destas metodologias
depende do conhecimento prévio da variância populacional e do tamanho da amostra.

Exemplo 3: (grandes amostras n > 30).


Uma empresa metalúrgica fabricante de peças automotivas afirma que seus anéis, para pistões
de motores a combustão interna, quando instalados, tem diâmetro médio de 13 cm (Ho, média = 13
cm) com desvio padrão de 0,17cm. Numa amostra de 138 anéis de pistão constatou-se que o
diâmetro médio era de 12,97cm. Verificar se a afirmação do fabricante é verdadeira ao nível de
significância 5%.
Solução:
Devemos supor que o teste é unilateral à esquerda, pois a Hipótese inicial Ho afirma que os
anéis de pistão tem 13cm enquanto que a verificação desse diâmetro na amostra apontou para um
valor menor ou seja 12,97cm que deverá ser tomado como sendo a Hipótese alternativa H1.

Hipótese inicial a ser testada Ho, média populacional 0  13 cm


Hipótese alternativa H1, média populacional 0  13 cm

Estatística de
Variância Populacional σ2 Amostra n
teste
Se o valor de σ é x -
desconhecido mas n > 30, use n > 30 Z
s
o estimador s como elementos
n
aproximação de σ
Valor crítico Z5%  Z0,45  -1,64

H0

H1 -1,64

178
 0  13
   0,17
 x - 0 12,97 -13
Cálculo do Valor de Teste: sendo  ,então Zteste    -2,07
 n  138 s 0,17
 x  12,97 n 138
Como o valor crítico de teste é menor que –1,64, conclui-se que está dentro da área de
rejeição da Hipótese inicial Ho. Portanto a Hipótese inicial deverá ser rejeitada, ou seja, não se pode
afirmar que os anéis de pistão, uma vez instalados, atendam as especificações demandadas pela
fábrica de motores.

Exemplo 4: (pequenas amostras n < 30).

Suponha que num experimento análogo ao anterior, a população tivesse revelado a mesma
média de diâmetro de 13 cm e desvio padrão populacional igual a 0,177. Numa amostra de 15 anéis
de pistão constatou-se que o diâmetro médio era de 12,93cm. Verificar se a afirmação do fabricante é
verdadeira ao nível de significância 5%.

Solução:
Já que a amostra tem menos que 30 elementos, mas conhecemos o desvio padrão
populacional podemos utilizar a tabela Z. Verificar se a afirmação do fabricante é verdadeira ao nível
de significância 5%.

Hipótese inicial a ser testada Ho, média populacional 0  13 cm


Hipótese alternativa H1, média populacional 0  13 cm

Estatística de
Variância Populacional σ2 Amostra n
teste
x -
Se o valor de σ é conhecido Z
n ≤ 30 elementos 
Use o estimador σ
n
Valor crítico Z5%  Z0,45  -1,64

H0
H1
-1,64

5%

179
 0  13
  0,177
 x -  12,93 -13
Cálculo do Valor de Teste: sendo  ,então Zteste    -1,53
 n  15  0,177
 x  12,93 n 15

Como o valor crítico de teste é maior que –1,64, conclui-se que está na área de aceitação da
Hipótese inicial Ho. Portanto a Hipótese inicial deverá ser aceita, ou seja, podemos afirmar que os
anéis de pistão, uma vez instalados atendem as especificações demandadas pela fábrica de motores.

Se por acaso o valor da média verificada na amostra fosse maior que a média populacional, os
testes que executamos anteriormente seriam unilaterais à direita. Todo o restante do procedimento
ficaria inalterado incluindo o nível de significância e os valores críticos de teste, que neste caso
seriam positivos.

11.2. Testes Unilaterais à Direita para Média Populacional com  x (desvio padrão
populacional) desconhecido.

Para exemplificarmos os testes de significância à direita assumiremos que o desvio padrão


populacional seja desconhecido. Obviamente, como dissemos anteriormente, não é o lado do teste o
condicionante do método, mas o conhecimento ou não do parâmetro populacional σ.

Exemplo 5: (grandes amostras n > 30).

Uma empresa de tintas quer testar se a reclamação de alguns clientes quanto à secagem
prematura de um de seus produtos é devido à variabilidade de um componente químico adicionado
ao produto durante o processo de mistura. O químico responsável afirma que são misturados a cada
500 litros de tinta, 23 Kg do produto necessário, segundo especificação aprovada. Uma amostragem
aleatória simples de 40 processos de mistura revelou que a média do componente adicionado foi de
23,04 Kg com desvio padrão de 0,16 Kg. Verificar se a afirmação do fabricante é verdadeira ao nível
de significância 5%.

Solução: Devemos conduzir um teste unilateral à direita, pois a amostra revelou um valor médio
23,04 Kg. superior ao especificado para o processo 23 Kg.

Hipótese inicial a ser testada Ho, média populacional 0  23 cm


Hipótese alternativa H1, média populacional 0  23 cm

Estatística de
Variância Populacional σ2 Amostra n
teste
Se o valor de σ é x -
desconhecido, mas n > 30 n > 30 Z
s
use o estimador s como elementos
n
aproximação de σ
Valor crítico Z5%  Z045  1,64

180
+1,64

 0  23
   0,16
 x -  23,03 - 23
Cálculo do Valor de Teste: sendo  ,então Zteste    1,5811
 n  40 s 0,16
 x  23,04 n 40
Como o valor crítico de teste é menor que +1,64 conclui-se que ele está dentro da área de
aceitação da Hipótese inicial Ho. Portanto a Hipótese inicial não deve deverá ser rejeitada, ou seja,
podemos afirmar que a secagem prematura não se deve à variabilidade da quantidade misturada, mas
a outros fatores.

Exemplo 6: (pequenas amostras)

Uma empresa farmacêutica quer estimar a possibilidade de ter que destruir um lote de
medicamentos devido a excesso de um dos componentes que tem originado reclamações de náuseas
por parte dos pacientes que o utilizam de forma continuada. A especificação padrão para o
medicamento proposto pela OMS impõe que a média do componente por comprimido seja 4,3 mg.
Para tal verificação a empresa colhe uma amostra de 25 comprimidos e obtém média de 4,39 mg e
desvio padrão de 0,23 mg. Verificar se a empresa terá de destruir o lote devido à afirmação dos
clientes, ao nível de significância 5%.
Solução:
Mais uma vez existe uma afirmação categórica a respeito do valor da média populacional, daí
o teste é unilateral. Devido ao fato que a amostra revela média 4,39 maior que o proposto pela OMS
4,3 o teste é à direita. Por não se conhecer o desvio padrão populacional σ, podemos considerar o
desvio padrão amostral s e utilizar a tabela t-Student .

Hipótese inicial a ser testada Ho, média populacional 0  4,3 mg


Hipótese alternativa H1, média populacional 0  4,3 mg

Estatística de
Variância Populacional σ2 Amostra n
teste
Se o valor de σ é x -
desconhecido e n ≤ 30 n ≤ 30 t
s
Use o estimador s como elementos
aproximação de σ n

Valor crítico tn-1;  1,711

181
H0
H1

 0  4,3
S  0, 23
 x - 0 4,39 - 4,3
Cálculo do Valor de Teste: sendo  ,então tteste    1,956
 n  25 s 0,23
 x  4,39 n 25
Consultando-se a tabela t-Student para (n –1) = 25 – 1 = 24 graus de liberdade e 0,05 de
significância temos que o valor de t crítico = + 1,711

Como o valor t teste = + 1,956 é maior que o valor de t crítico 1,711, conclui-se que está dentro
da área de rejeição da Hipótese inicial Ho. Portanto, podemos afirmar que a empresa deverá aceitar a
reclamação dos clientes e destruir o lote de medicamentos, pois tudo se comporta como se a
verdadeira média do componente químico do remédio seja maior que a especificação técnica de
segurança.

12. Sensibilidade dos Testes de Hipóteses

Exemplo 7:
Suponha que no exemplo anterior a amostra tivesse revelado um peso médio de 4,37 ao invés
de 4,39, mantendo-se inalterado o desvio padrão e o nível de significância de 5%.

x - 0 4,37 - 4,3
Cálculo do Valor de Teste: tteste    1,521
s 0,23
n 25

Este valor t teste = +1,521 estaria na área de ACEITAÇÃO da Hipótese inicial, pois seria
menor que o valor crítico +1,711.
A pequena diferença entre as médias dos dois testes 4,39 e 4,37 (0,02 mg) mesmo mantendo-
se a constatação do desvio padrão amostral, fez com que o teste que inicialmente sugeriria a
destruição do lote, no segundo teste sugere que não seja destruído. Este fato revela que os testes de
significância devem ser conduzidos com muita parcimônia pelo analista.
As medições técnicas nestes casos devem ser conduzidas com muita precisão, pois em se
tratando de peças, lotes de remédios, produtos químicos utilizados em processos industriais de
precisão, ou qualquer outro tipo de medição que exija precisão na terceira ou quarta casa decimal,
produtos ou processos, poderiam ser rejeitados gerando prejuízos para as partes envolvidas.

182
13.Testes Bilaterais para Média Populacional com  x (desvio padrão populacional) conhecido.

Este tipo de teste é considerado mais fraco que os anteriores, e deve ser aplicado quando não
for possível aplicar os anteriores.
Há muitos casos em que há interesse em identificar um desvio do valor real do parâmetro
para menos ou para mais, em relação ao valor testado.
Uma situação típica de aplicação dos testes bilaterais é quando da população pudermos
extrair apenas a informação sobre a variância, ou a afirmação a ser testada sobre a média
populacional não tiver nenhum embasamento de cálculo. Em outras palavras, se aplica este tipo de
teste quando não há como afirmar categoricamente o valor do parâmetro populacional a ser
testado. Outras situações de aplicação são aquelas em que haja discrepância acentuada da média
obtida em amostragens sucessivas.
Por exemplo, suponha que em duas amostragens ocorram médias muito discrepantes: uma
média maior e outra menor que a afirmada pela Hipótese inicial. Esta seria uma situação onde seria
conveniente aplicar-se o teste bilateral e rejeitar a Hipótese inicial quando o valor de teste tomado de
forma modular for maior qualquer um dos valores críticos bilaterais.

Exemplo 8:

Uma empresa de alimentos sabe que o desvio padrão populacional na adição de certa
vitamina a um tipo de suco é 45 unidades p/litro. Uma amostra aleatória de 100 litros forneceu uma
média de 127,3 unidades/litro. Será que a partir destas informações podemos afirmar que a média de
adição de vitamina é aproximadamente igual a 138 unidades/litro se considerarmos o nível de
significância de 5%?
Note o leitor que, por não termos certeza se a média é maior ou menor que 138 unidades/litro,
devemos supor que ela é “diferente” de 138 unidades/litro. Portanto o teste é do tipo bilateral.

Hipótese inicial a ser testada Ho: média populacional 0  138unidades por litro

Hipótese alternativa H1: média populacional 0  138unidades por litro

Estatística de
Variância Populacional σ2 Amostra n
teste
x -
Se o valor de σ é conhecido n > 30 Z

Use o estimador σ elementos
n
Valor crítico Z1- 2  Z95% 2  Z0,475  1,96

H0
- 1,96 + 1,96

H1
  2,5%   2,5%

183
 0  138
   45
 127,3 -138 x -
Cálculo do Valor de Teste: sendo ,então Zteste 
 -2,37 

n  100  45

 x  127,3 n 100
Como o valor crítico de teste – 2,37 é menor que –1,96 conclui-se que ele está dentro da área
de rejeição da Hipótese inicial Ho. Portanto, a Hipótese inicial deverá ser rejeitada, ou seja, não se
pode afirmar que a média é 138 unidades/litro, mas podemos afirmar que a média é menor que esse
valor, portanto, bem menor que as especificações do padrão de qualidade das empresas e dos órgãos
públicos responsáveis.

Exemplo 9:
Uma amostra de 100 lâmpadas compactas fluorescente tem vida média 1570 horas e desvio
padrão 120 horas. Se  é a média da população, testar a hipótese:
H0: 0 = 1600 horas
H1: 0  1600 horas, com nível de significância de a) 5% b) 1%.
Solução:
a) O teste é bilateral e tem-se a regra de decisão:
i) Aceitar H0 se z estiver no intervalo [-1,96, 1,96].
ii) Rejeitar H0 se z estiver fora do intervalo [-1,96, 1,96].

H0
- 1,96 + 1,96

H1
  2,5%   2,5%

- ZC ZC

 120
Para 5%,tem-se ZC  1,96 e x    1600 e  x    12 , logo
n 100

x - 1570 - 1600
z   -2,50 , esse valor cai fora do intervalo [-1,96, 1,96].
x 12
Portanto, rejeitamos H0 ao nível de 5%.

b) Para o nível de 1% ou 0,01 tem-se o intervalo [-2,58; 2,58], isto é, ZC  2,58 com o uso da
distribuição normal padronizada.
x -  1570 - 1600
Como z    -2,50 e pertence ao intervalo [-2,58; 2,58], aceita-se H0 ao
x 12
nível de 1%.

184
Exemplo 10:
Um laboratório manipula uma tomada para a cura de uma mancha alérgica na pele e afirma
que a pomada é eficaz em 90% dos tratamentos durante o uso de uma semana. Para a verificação foi
tomada uma amostra de 300 pacientes com essa mancha alérgica e a pomada curou 250 pacientes.
Determinar se a afirmação do laboratório é legítima ao nível de 90%.
Solução:

O teste é unilateral à esquerda e tem-se a regra de decisão:


i) H0 : p  0,9 a pretensão é correta.
ii) H1 : p  0,9 a pretensão é falsa.

90%
10%

-1,29

Determinando o ponto z0 tal que p(z0  z)  90% ou p(0  z  z0 )  0,4000 .

Usando a tabela da normal padronizada tem-se z0  -1,29.

Do enunciado vê-se que a distribuição usada é a binomial e, portanto:


   n. p  300.0,9  270
 250 - 270
 , logo zx   -3,85.
  npq  300  0,9  0,1  5,196
 5,196

Portanto -3,85 é menor que -1,29 e de acordo com a regra de decisão conclui-se que a
pretensão não é legítima e rejeita-se H0.
Para esse problema podemos formular a seguinte pergunta:
Entre os 300 pacientes testados, quantos deveriam ser curados para que a pretensão seja
legítima do laboratório?
xp - 270
Devemos ter z0  -1,29   xp  270 - (1,29  5,196)  263,29  263. Portanto,
5,196
a pomada deveria curar no mínimo 263 pacientes entre os 300 tratados.

185
Exercícios de aplicação 26:

1. Um fornecedor de anéis de pistão para motores a combustão interna, afirma que sua produção é
entregue conforme o projeto especificado pela montadora de veículos com diâmetro de 85 mm e
desvio padrão de 0,95 mm. O analista de produção da montadora recebeu a remessa de peças e
colheu uma amostra de 35 unidades a qual apresentou média de 84,6 mm. Pede-se verificar se as
peças estão sendo entregues conforme a especificação de projeto testando a afirmação do
fabricante ao nível de significância de 5%.

2. Uma empresa fabricante de bombas de sucção para poços artesianos, afirma que o tempo médio de
utilização de seu equipamento antes da perfuração do diafragma é de 6000 horas. Uma amostra de
20 equipamentos foi levantada e revelou média de 5500 horas e desvio padrão de 1500 horas antes
da perfuração. Pede-se testar a afirmação do fabricante desse equipamento ao nível de 5%.

186
3. Um fabricante de ração animal afirma que tratando filhotes de suínos nos primeiros 30 dias de vida
com a ração BXY os mesmos apresentariam ao final desse período um peso médio de 5,1 Kg. Um
fazendeiro suinocultor afirma que uma amostra de 17 de seus animais que foram alimentados com
essa ração nos primeiros 30 dias de vida e apresentou média de 4,7 Kg com desvio padrão 0,96
Kg. Pede-se testar a afirmação do fabricante ao nível de significância de 5%.

4. A distribuição de resultados dos dividendos de uma carteira de ativos financeiros foi colhida
aleatoriamente em 40 pregões apresentou média de R$ 34.950,00 e desvio padrão de R$
3.900,00. Os supervisores de negócios realizados verificaram em seus registros que essa carteira
sempre teve rendimentos médios por volta de
R$ 33.250,00. O gerente dessa corretora insiste em afirmar que a amostra foi mal colhida e que
essa carteira historicamente costuma apresentar média de rendimentos muito acima desse valor.
Baseado nessa amostra pede-se para que você atue como analista e calcule os elementos
necessários ao nível de 5% de significância.

187
5. Um fabricante afirma que sua máquina fabrica peças para utilização em motores a Diesel de
aplicação agrícola, cujo diâmetro se distribui normalmente com valor 14 mm e desvio padrão 0,15
mm. Uma amostra de 30 peças é levantada e apresentou diâmetro médio de 14,05 mm. Pede testar
a afirmação do fabricante ao nível de significância de 5%.

6. O responsável de um laboratório de análises clínicas afirma que o tempo médio de crescimento de


certa bactéria até atingir a quantidade desejada para a fabricação de certa vacina é de 30 minutos e
desvio padrão de 2 minutos. Se uma amostra de 40 culturas dessa bactéria revelou tempo médio de
29,5 minutos, pode-se dizer que o processo está dentro dos padrões exigidos pelo laboratório?
Pede-se testar ao nível de 5% a afirmação do laboratório.

188
7. Um laboratório fabrica um remédio para dores de cabeça e afirma ser eficaz para a cura de 90%
dos casos e durante um período de uma semana. Em uma amostra de 200 pacientes que possuíam
essas dores o remédio curou 160 pacientes. Determinar se a informação dada pelo laboratório é
legítima ao nível de 90%.

8. Um jogador para verificar se uma moeda é honesta adotou a seguinte decisão:


Ho: se o número de caras em amostra de 100 lances estiver entre 40 e 60 inclusive.
H1: caso contrário (fora do intervalo).
Pergunta-devemos aceitar ou rejeitar H0 ?

189
CAPÍTULO 10

AJUSTAMENTO DE CURVAS: REGRESSÃO LINEAR E CORRELAÇÃO

1. Introdução
São muitas as pesquisas que investigam as relações entre duas grandezas. Assim, sempre
indagamos como a variação de uma grandeza acarreta variação em outra.
Nas tabelas abaixo, podemos investigar:
a) O aumento da área agricultável de soja no Estado do Paraná acarreta aumento da
produção de grãos?
Área 2,0 1.8 2,0 2,1 2,3 2,5 2,8 2,8
Produção 3,6 3,4 5,3 5,5 6,0 6,6 7,1 7,7
área: milhões de hectares e produção: milhões de toneladas
Fonte: Armário Brasileiro de Agribusiness

b) O saldo da caderneta de poupança aumentou no período de março a setembro? (Bilhões


de reais).

meses março abril maio junho julho agosto setembro

valores 116,6 116,6 112,5 113,4 113,8 114,1 114,7

c) Diminuindo a taxa de analfabetismo diminui a taxa de mortalidade infantil?


Região Taxa de mortalidade infantil Taxa de analfabetismo
Sul 22,5 8,3
Sudeste 25,2 8,6
Centro Oeste 25,4 12,4
Norte 35,6 12,7
Nordeste 59,0 29,4
- Fonte: Ministério da Saúde - IBGE

Para respondermos às perguntas formuladas em a, b e c, devemos conhecer os fenômenos que


envolvem o problema e não somente os dados fornecidos. Assim é possível obter alguma previsão
dentro de certas margens de erro.
O modelo matemático que procura descrever a relação entre duas variáveis, em que se
relacionam os n pares de pontos dados por uma reta tão próxima quanto possível do conjunto de
pontos dados, denomina-se Regressão Linear.

190
y y

x x

Os gráficos acima denominam-se diagramas de dispersão.


O método usado denomina-se método dos mínimos quadrados e tem como resultado uma
equação que descreve o relacionamento entre duas variáveis.
Observando o diagrama de dispersão é possível visualizar uma curva que se aproxima dos
dados, a essa curva denominamos de ajustamento.

2. Regressão linear
A regressão linear feita pelo método dos mínimos quadrados é aquela em que a soma
quadrática da diferença entre os y dados pela tabela e os y obtidos pela reta seja mínima.
Sejam os pontos  X1 ,Y1  ,  X2 ,Y2  ,...,  Xn ,Yn  , sendo Xi a variável independente e Yi a

variável dependente. Desejamos obter a reta y = a x + b com o uso do método dos mínimos
quadrados.

y
( Xn , Yn )
y=ax+b
( X2 ,Y2 )

( X3 ,Y3 )
( X1 , Y1 ) x

Para isso determinamos uma reta do tipo y = a x + b, em que a e b são dados pelo método
dos mínimos quadrados proposto por Carl Friedrich Gauss (1777 – 1855), tais que
n n

(Yi  Yˆi )2   D2i seja mínimo. Sendo


i 1 i 1
Di  Yi  Yˆi , desvio ou erro ou resíduo, desvio de cada

Yi e o valor corresponde da reta y = a x + b. Sendo


Yi o valor observado da variável dependente para o i-ésima observação e

Yˆi o valor estimado da variável dependente para o i-ésima observação

191
Determinemos
n n
min ( D2i )  min(Di2  D22  ...Dnn )  min (Yi  Yˆi )2 =
i 1 i 1

n n
min [(Yi  (aXi  b)]2 0, denominamos f (a, b)  (Yi  aXi  b)2 função de duas
i 1 i 1

variáveis. Neste caso devemos impor a condição para obter o mínimo e esta é dada
f f
por: 0e  0 , sendo as derivadas parciais da f em relação a a e b. Assim
a b
f n n n n
 2(Yi  aXi  b)(xi ) 0  b xi  a xi2  xi yi  0 , segue
a i 1 i 1 i 1 i 1

n n

y
i 1
i  bn  a xi (I)
i 1

f n n n n
 2(Yi  b  aX i ) 0  b1  a xi  yi  0 , segue
b i 1 i 1 i 1 i 1
n n n

x y i i  b xi  a xi2 (II)
i 1 i 1 i 1

Resolvendo o sistema formado por (I) e (II) e por comodidade, deixamos de colocar os
índices dos somatórios.

 xy  a x  b x (II)
 2

 Dividindo (II) por (I) segue:



  y  a  x 2
 bn (I)

 y  a  x  b  b  y  ax substituindo em (II) obtemos


n n
xy  ax  ( y  ax)x , desenvolvendo e colocando a em evidência obtemos:
2

n xy   x y
a e b  y  ax. Para se ter as condições de mínimo, devemos impor ainda:
n x    x 
2 2

2 f n
 
a2 i 1
2  2n

2 f n
2 f 2 f 2 f 2 f
  i
b2 i 1
2 x 2
 . 
a2 b2 ab
 0 e
a2
 2n  0 . Essas condições satisfazem as soluções do

2 f n
  2 xi
ab i 1

192
n xy   x y
sistema: a= e b = y  a x sendo n é o número de observações e
n x 2   x2

x
x e y
y médias aritméticas. Portanto, a reta y = a x + b nessas condições
n n
denomina-se reta dos mínimos quadrados ou reta regressão linear.

Exemplo 1: Problema dos pesos dos pais e de seus respectivos filhos

Uma clínica médica pesquisou o relacionamento dos pesos dos pais e dos filhos, os dois do sexo
masculino, todos com idades superiores a 20 anos, e obteve a seguinte tabela:

Peso dos pais (kg) x 80 84 86 90 92 96 100 102

Peso dos filhos(kg) y 82 86 88 86 90 100 98 104

Determinar a reta Regressão Linear para esse problema.


Solução: Adotamos os seguintes passos para resolver este problema:
i) Montar uma tabela com as colunas indicadas por x, y, x.y e x2 .
ii) Indicar a soma destas colunas na última linha da tabela.
iii) Determinar a média.
iv) Achar a e b, usando as fórmulas dadas.
v) Construir o gráfico dos pontos dados e representar a reta y = ax + b.
Como sugerido em i e ii, construímos a tabela:

x y x.y x2
80 82 6560 6400
84 86 7224 7056
86 88 7568 7396
90 86 770 8100
92 90 8280 8464
96 100 9600 9216
100 98 9800 10000
102 104 10608 10404
 x  730  y  734  xy  67380  x 2  67036
Com os valores obtidos na tabela podemos calcular o item iii.

x
x 
730
 91,25  91,3 y
y 
734
 91,75  91,8
n 8 n 8

193
Os valores devem ser arredondados para um dígito significativo a mais do que os dados
originais.
Voltando à tabela, temos

 xy  67380e  x 2  67036
iv) Com estes dados obtidos, podemos determinar a e b usando as fórmulas.

n xy   x y 8(67380)- 730.734 539040- 535820 3220


a=     0 ,9504  1,0
n x2   x2 8(67036)- (730)2 536288 532900 3388
b=y  ax  91,8 - 1,0(91,3)  91,8 - 91,3  0,5. Portanto a reta regressão linear é dada por y = x
+ 0,5

v) Construindo o gráfico e representando a reta y = x+0,5, temos:

y
106 y=x+0,5
104
102 B
100
98
96
94
92
90
88
86
84 A
82
80

80 82 84 86 88 90 92 94 96 98 100 102 104 106 x

Para esboçarmos o gráfico da reta y = x + 0,5, tomemos dois valores de x, para x = 84,
segue y = 84 + 0,5 = 84,5 e para x = 102, segue y = 102 + 0,5 = 102,5. Portanto a reta passa pelos
pontos A(84; 84,5) e B(102; 102,5)

A reta y = x + 0,5 é aquela em que a soma dos quadrados da diferença entre os pontos dados
(y) e os valores yr (obtidos) da reta é mínima.

Exemplo 2: Problema dos custos de televisores


A tabela a seguir indica as quantidades de televisores da marca ABC produzidas
mensalmente e os respectivos custos totais de produção.

194
Quantidade produzida x 100 120 130 140 150 160

Custo total (R$) y 2000 2300 2700 2900 2800 3000

Pede-se
a) A reta que melhor se ajusta a esses dados.
b) O valor mais provável dos custos fixos.
c) O valor do custo estimado para 180 televisores.
d) A representação dos pontos e da reta regressão linear.
Resolução: Construindo a tabela

x y xy x2
100 2000 200000 10000

120 2300 276000 14400

130 2700 351000 16900

140 2900 406000 19600

150 2800 420000 22500

160 3000 480000 25600

800 15700 2133000 109000

 x  800  y  15700  x y  2133000  x 2 109000

 x 800  y 15700
x = = 133,3 e y   2616,7 .Assim:
n 6 n 6
n xy   x y 6  2133000- 800 15700 238000
a= = = = 17
n x2   x2 6  109000- 8002 14000
Logo a = 17 e b é dado por
b  y  ax  2616,7 17 133,3  2616,7  2266,1  350,6

a) Portanto a equação da reta que melhor se ajusta a esses dados é


y = ax + b = 17x + 350,6

195
y

3000

2800

2600

2400

2200

2000

100 110 120 130 140 150 160 x

b) Custo fixo é obtido para x = 0 em y = 17x + 350,6 é dado por:


y = 17(0) + 350,6 = 350,6 logo y (fixo) = R$ 350,60
c) O custo estimado para x = 180 televisores é dado por
y = 17(180) + 350,6 = 3060 + 350,6 = R$ 3410,60
d) Para representarmos a reta no gráfico, tomamos dois pontos: x =100 e portanto, y = 2050,6
e como segundo ponto x =180 e y = 3410,6.

Exemplo 3: Problema dos custos de bolas de futebol de salão


A tabela abaixo indica a quantidade de bolas de futebol de salão produzidas mensalmente e
os respectivos custos totais de produção.

Quantidade (x) 10 11 12 13 14 15

Custos(y) em R$ 100 112 119 130 139 142

Pede-se:
a) A reta que melhor se ajusta a esses dados.
b) O valor mais provável do custo fixo.
c) O custo para a quantidade de 16 bolas.
d) Esboçar o gráfico.

196
Resolução: Construímos a tabela abaixo para avaliar a e b

x y xy x2
10 100 1000 100

11 112 1232 121

12 119 1428 144

13 130 1690 169

14 139 1946 196

15 142 2130 225

 75 742 9426 955

 x 75  y  742  x y  9426  x 2  955

  12,5 e y   
 x 75 y 743
n=6 x  123,67  123,7 , assim
n 6 n 6

n xy   x y 6  9426 - 75  742
a= = = 8,63  8,6
n x 2   x2 6  955 - 752

b  y  ax  123,7  8,6 12,5  16,2 , logo y = 8,6x + 16,2


a) Assim a reta que melhor se ajusta a esses pontos dados é y = 8,6x +16,2
b) O valor mais provável do custo fixo é dado por x = 0; logo o valor é:
Cf = 8,6.(0) + 16,2 = R$ 16,20

c) O custo para 16 bolas produzidas é dada por:C = 8,6.(16)+16,2 = 153,8. Assim, o custo
para 16 bolas é R$153,80.

y
150 B
d) Para a construção do gráfico da reta
y=8,6x+16,2
140
y=8,6x+16,2 é só tomarmos dois valores:
130
para x=10, tem-se
120 y=(8,6)(10)+16,2=102,2 e
110 para x=15, tem-se
A y=(8,6)(15)+16,2=145,2
100

10 11 12 13 14 15 16 x

197
3. Correlação
Correlação é o grau de relação entre as duas variáveis. A correlação tem por objetivo medir e
avaliar o grau de relação existente entre duas variáveis aleatórias.

3.1. Coeficiente de correlação linear (Karl Pearson (1857 – 1936)

O Coeficiente de correlação linear indica o grau de intensidade da correlação entre as duas


variáveis e, ainda, o sentido dessa correlação ( positivo ou negativo).

Se todos os valores das variáveis obedecem a uma equação, dizemos que elas estão
relacionadas. Se ocorrerem duas variáveis, dizemos correlação ou regressão simples, Se ocorrerem
mais que duas variáveis, dizemos correlação ou regressão múltipla. Enquanto a correlação mede a
força ou grau de relacionamento entre duas variáveis, a regressão linear dá a equação que descreve o
relacionamento.

Neste estudo usaremos o coeficiente de correlação de Pearson que é dado por:

n xy  ( x)( y)
r
[n x2  ( x)2 ][n y 2  ( y)2 ]
Os valores de r estão no intervalo [ -1, +1]

Se Coeficiente de correlação linear é tal que 0  r  1 , então a correlação se diz positiva.

Se Coeficiente de correlação linear é tal que 1  r  0 , então a correlação se diz negativa.

Se Coeficiente de correlação linear é tal que r  1 , então a correlação se diz perfeita positiva.

Se Coeficiente de correlação linear é tal que r  1 , então a correlação se diz perfeita negativa.

Exemplo 4: A seguir segue dados de 10 famílias de uma determinada região, sendo a renda dada em
R$100,00.

Famílias Renda Poupança Nº de filhos


1 10 5 8
2 12 6 7
3 15 7 6
4 30 15 2
5 50 20 2
6 80 40 1
7 40 20 2
8 30 15 5
9 20 10 6
10 10 5 5

Calcular o coeficiente de correlação linear entre Renda familiar e a Poupança

198
Renda(y) Poupança(x)
x2 y2 xy
10 5 25 100 50
12 6 36 144 72
15 7 49 225 105
30 15 225 900 450
50 20 400 2500 1000
80 40 1600 6400 3200
40 20 400 1600 800
30 15 225 900 450
20 10 100 400 200
10 5 25 100 50
 297 143 3085 13269 6377

O coeficiente de correlação linear é dado por:

n xy  ( x)( y)
r =
[n x2  ( x)2 ][n y 2  ( y)2 ]

10(6377)  (143)(297 63770  42471


r =  0,99
[10  3085  143 ][10 13269    297  ]
2 2
(10401)(44481)

Conclusão: O valor r = 0,99 indica que a correlação é positiva, existe uma forte correlação entre a
renda a poupança.

199
Exercícios de aplicação 27:

1. A seguir segue dados da renda e número de filhos de 10 famílias de uma determinada região.

Nº filhos (x) 8 7 6 4 3 3 2 3 2 1

Renda (y) 10 12 15 20 20 30 40 50 60 70

Determinar

a) A equação da reta que melhor se ajusta aos dados.

b) Calcular o coeficiente de correlação linear entre e o número de filhos e a renda (R$ 100,00).

200
2. Os dados a seguir apresentam o número de horas diárias, extraclasse, de estudo de matemática, dos
alunos do Colégio Pedro Henrique e as respectivas notas obtidas na primeira prova semestral de 15
alunos.

Horas estudo 0 1 2 2 3 3 3 4 5 6 6 7 8 8 8
Notas obtidas 3 4,5 5 5,5 6 6,2 6,3 6,7 7 8 8,2 8,5 9 9 9,5

a) Calcular a equação da reta que melhor se ajusta aos dados.

b) Qual a nota que se espera para quem estuda 9 horas diárias?

c) Calcular o coeficiente de correlação linear entre as horas de estudo e a respectivas notas.

201
3. Os dados a seguir apresentam o tempo em anos de trabalho e os salários mensais em R$ 1 00,00,
de 10 operários.
Tempos em anos 10 12 14 16 16 20 20 22 22 22
Salários 12 15 17 19 20 22 27 25 28 30

a) Calcular a equação da reta que melhor se ajusta aos dados.

b) Qual o salário que se espera para quem trabalhou 23 anos?

c) Calcular o coeficiente de correlação linear entre os anos de trabalho e os respectivos salários.

202
Respostas dos exercícios de aplicação 1:
1) a)sim b)sim c) sim 2) a)28 b) 25
Respostas dos exercícios de aplicação 2:
1) x  4,6 2) x  4,5 3) x  1,64 4) 7,0
Respostas dos exercícios de aplicação 3:
Exercício 1: 1) x  7,45 2) Mo( X )  7,0 Md ( X )  7,5 3) dm( X )  0,8275
4) var( X )  1,1 5) S( X )  var( X )  1,048808 6) CV(X)=14,07%
Exercício 2: 1) x  1,61 2) Mo( X )  1,6 3) Md ( X )  1,6 4) dm( X )  0,1893
5) var( X )  0,0565137 6) S( X )  var( X )  0,241934081 7) CV(x)=15,02%
Exercício 3: 1) x  22,44 2) Mo( X )  22,3 3) Md ( X )  22,4 4) dm( X )  0,62533
5) var( X )  0,73213793 6) S( X )  var( X )  0,8556505 7) CV(X)=3,813%
Respostas dos exercícios de aplicação 4:
Exercício 1: 4) x  30,75 5) Mo( X )  30,71428 6) Md ( X )  31,045 7) dm( X )  5,08333
8) var( X )  36,699915 9) S( X )  var( X )  6,0579825 10) CV(X)=19,7%
Exercício 2: 1) x  4,57 2) Mo( X )  4,528571 3) Md ( X )  4,6 4) dm( X )  0,871379
5) var( X )  1,274693103 6)  ( X )  var( X )  1,149007335 7) CV(X)=25,14%
Respostas dos exercícios de aplicação 5:
1)C 2)C 3)E 4)B 5)C 6)D 7)C 8)B 9)B 10)C 11)B 12)C 13)E 14)C
Respostas dos exercícios de aplicação 6:
1)E 2)D 3)D 4)C 5)B 6)C 7)A 8)B 9)C 10)D 11)B 12) 1968
Respostas dos exercícios de aplicação 7:
1) 30 2)240 3) 504 4) a)120 b) 600 5)a) 60 b) 24 c) 6 d) 72 e) 24 6) 597º
7) 241920 8) 5 540 160 9) 2520 10) 6
Respostas dos exercícios de aplicação 8:
1) a)50 b) 60 c) 205 d) 140 e) 175 f)113 g) 142 2) 77 3) 217 4) a) 420 b) 126
c) 1056 d) 1278 e)492 f) 564 5) a) 210 b) 378 6)a)11154 b)263764
Respostas dos exercícios de aplicação 9:
1)a) 1/13 b) 1/52 c) 1/26 d) ¼ e) 3/4 f) 4/13 g) 9/13 2) a) 2/5 b) 4/15 c) 1/3 d) 3/5 e )2/3
3) 1/3 4) a)1/169 b) 1/221 5) a) 8/225 b) 4/91 6) a) 14/285 b) 1/1140 c) 21/95 d) 23/57
e) 18/95 f) 3/95 7) 1/15 8) 0,0926
Respostas dos exercícios de aplicação 10:
1)a) 12/25 b) 13/25 c) 4/25 d) 7/25 e)1/25 2) 1/210 3) 5/8 4 ) 79/1008 5) 1/5 6) 1
n(n  1)
7) 0,25 8) 2/5 9) 1/4 10)a) 3/8 b) 4/8 11)a)0,48 b)0,08 c)0,92 12)a)10/63 b) 10/21 13)a) 0,3 b)0,5
14) a) 0,25 b)3/13 15) a)1/11 b)14/33 c)19/33 16) a)3/8 b)0,7583 c)0,7583 d)1/8
Respostas dos exercícios de aplicação 11:
1) D 2) A 3) D 4) D 5) C 6)A 7) 0,24 8) D
Respostas dos exercícios de aplicação 12:
1) A 2) C 3) C 4) C 5) A 6)E 7) A
Respostas dos exercícios de aplicação 13:
1)0,347 2)0,5 3)0,61 4)0,166 5)a) 2/5 b)0 c)26/37 d) 1 6)D 7)A
8) D 9) A 10) D 11)C 12)A 13)A
Respostas exercícios de aplicação 14:
1) 0,1818 2) 0,4878 3) 0,7142 4) C 5) 35,6% 6) 0,5714 7) E

199
Respostas exercícios de aplicação 15:
1) a) 0,3292 b) 0,0878 2) a)0,1646 b)0,0452 c) 0,1317 3) a) 0,1646 b)0,9959 c)0,539
4) a) 0,703 b) 0,4115 5) a) 0,998 b) 0,875 6) a)0,3282 b)0,982
Respostas exercícios de aplicação 16:
1) 0,31104 2) (0,064) 3) 0,42328 4) D 5)A 6) B 7) E 8) B
Respostas exercícios de aplicação 17:
1) a) 0,027 b) 0,1812 2) a)0,0803 b) 11 dias 3) a) 0,9969 b) 0,0572 c) 0,013754
4) a) 0,576 b) 0,4231 5)a) (0,1991 ) b) (0,22313) 6)a) 0,0758 b)0,8008 7) a)0,224 b)0,1992
8) a)0,224 b) 0,423
Respostas dos exercícios de aplicação 18:
1) a) 0,1914 b) 0,38202 c) 0,3085 d) 0,1558 2) a)0,84134 b)0,78058 c) 0,9545 d)0,10565
3) a) 0,0227 b) 0,2275 c) 0,92698 4)a) 6,02 b) 3,09 5) a) 0,78814 b) 187 6) a)0,7849 b) 0,3709

Calçados 36 37 38 39 40 41 42 43 44 45
Quantidade 17 170 869 2316 3255 2316 869 170 17 1
Respostas dos exercícios de aplicação 19:
1) a) 0,0668 b) 0,1586 c) 0,8189 d)13,59% e)0,15245 2) a)0,30854 b)0,5328 3) a)0,115 b)0,543
4) a)0,78109 b)4,636 5)B 6) C 7)A 8) B 9) a)a altura tem menor dispersão. b) a altura apresenta
maior normalidade.
Respostas dos exercícios de aplicação 20:
1)
f(x) F(x)

1
4/5

1/5 4/5
x
0
x
0 1
2)
 0, se x  0 F(x)
1 / 3, se 0  x  1
 1
F ( x)  
1 / 2, se 1  x  2 1/2

 1, se x  2 1/3
x
0 1 2

Exercícios de aplicação 21:


1) a) 400 b) 400 2) a) 0 b) 64 c)0 d)1 3) 96,41% 4) a) p b) p.q
5) a) 4 pessoas b)2,4 c) 0,9939 6) a)5 b) 5 c) 0,1754
Exercícios de aplicação 22:
 0, se x  0
1) a)2/3 b) 1/12 c)7/9, d) 5/6, e) 37/162 2) f ( x)    x
e se x  0

200
 0, se x  0

3) F ( x)   x2 , se 0  x  1 4) a) 2000 b) 1386 c) 79004
 1, se x  1

 0, se x  0

 3 2 x3
5) a)5/16 b) 0 c) F ( x)   ( x  ), se 0  x  1 6) a) sim b) 0,792 c) 0,3125
2 3
 1, se x  1
0, se x  0
 1
7) a) sim b) 1770 c) 1470 d) F ( x)   x , se 0  x  2
3

8
1, se x  2
8) a) sim b) i)0,16; ii)0,6; iii)0,36 iv) 0 9) a) sim b) 5/6) 10) b)sim c)2 d) 5,85

Respostas dos exercícios de aplicação 23:

1) a)sim b) 0,375 c) 4000kg d) 245 kg

 0, se x  0

2) a) f ( x)  1/ 2 se 0  x  2 b) 0,75 c) 1
 0 se x  2

3. a)
f(x)
0,1

0 x

b1) 0,33 b2) 0,24 b3) 0,2231


Respostas dos exercícios de aplicação 24:

1)a)3,5 b) 3,5 c) 9,33 d) -2,92 2. a)0,6 b) 0,35

3. Montando a distribuição

X Y 0 1 2 3 p(x)
0 0,05 0,05 0,10 0 0,20
1 0,05 0,10 0,25 0,10 0,50
2 0 0,15 0,10 0,05 0,30
p(y) 0,10 0,30 0,45 0,15
201
a) p( x  0)  0,20 ; p( x  1)  0,50 ; p( x  2)  0,30
b) p( y  0)  0,10 ; p( y  1)  0,30 ; p( y  2)  0,45 ; p( y  3)  0,15
c)E(X)=1,1 d)E(Y)=1,65

Respostas dos exercícios de aplicação 25:


1) P617,24    642,75  0,95 .A vida útil média da população dos misturadores estará entre 617,24 e
642,75 com 95% de certeza ou corre-se o risco de 5% de que a verdadeira média populacional esteja fora desse
intervalo.
2) IC { 29,088 ≤ μ ≤ 30,112 }=95%; erro padrão 0,512.
3) IC { 27,6185 ≤ μ ≤ 32,3814 } = 95%; erro padrão 2,38148.
4) IC { 394,5122 ≤ μ ≤ 477,4878 } = 95%; erro padrão 41,4878 gramas.
5) IC { 39,605 ≤ μ ≤ 46,3948 } = 95%; erro-padrão 3,3948 minutos; 2) dispêndio mínimo para arrumação dos
246 quartos a R$12,00 por hora R$ 1.948,32 e máximo R$ 2.282,88.

Respostas dos exercícios de aplicação 26:


1) Zi = - 2,4909 e rejeita-se Ho. 2) tteste = - 1,49 aceita-se Ho. 3) tteste = -1,717 aceito Ho.
4) Zteste = +2,76 e dessa forma rejeita-se Ho. 5) zteste  + 1,825 e rejeita-se Ho.
6) Zteste = - 1,58 e aceita-se Ho e pode-se afirmar que o processo está sob controle.
7) Zteste = -4,71 e rejeita-se Ho e a pretensão não é legitima.
8) Aceita-se Ho para o intervalo [40,60] com probabilidade 96,42.
9) Aceita-se Ho se o número de caras estiver no intervalo [25,39].

Respostas dos exercícios de aplicação 27:


1) y = -7,6x+62,34 b) r =- 0,83
2) a) y = 0,676 x + 3,76 b) 9,845 c) r = 0,87
3) a) y = 1,23 x - 0,3 b) R$ 2 800,00 c) r = 0,96

202

Você também pode gostar