Você está na página 1de 315

Introdução à Estatística

Ensino à Distância

Universidade Pedagógica

Rua Comandante Augusto Cardoso nº 135


Direitos do autor

Este módulo não pode ser reproduzido para fins comerciais. Caso haja necessidade de reprodução
deverá ser mantida a referência à Universidade Pedagógica e aos seus autores.

Universidade Pedagógica

Rua Comandante Augusto Cardoso, nº 135


Telefone: 21-320860/2
Telefone: 21 - 306720

Fax: +258 21-322113


Agradecimentos

À COMMONWEALTH of LEARNING (COL) COL pela disponibilização do Template usado na


produção dos Módulos.

Ao Instituto Nacional de Educação a Distância (INED) pela orientação e apoio prestados.

Ao Magnífico Reitor, Directores de Faculdade e Chefes de Departamento pelo apoio prestado em


todo o processo.
Ficha Técnica

Autores: Celso Albino

Desenho Instrucional: Lourenço Mavaieie

Revisão Linguística: Orlanda Ngomane

Maquetização: Anilda Ibrahimo Khan

Edição: Anilda Ibrahimo Khan


Introdução à Estatística Ensino à Distância i

Índice
Visão geral 1
Bem-vindo ao Módulo de Introdução à Estatística........................................................... 1
Objectivos do Módulo....................................................................................................... 1
Quem deve estudar este Módulo? ..................................................................................... 1
Como está estruturado este Módulo?................................................................................ 2
Ícones de actividade.......................................................................................................... 2
Acerca dos ícones........................................................................................... 3
Habilidades de estudo ....................................................................................................... 4
Precisa de apoio?............................................................................................................... 5
Tarefas (avaliação e auto-avaliação)................................................................................. 5
Avaliação .......................................................................................................................... 6

Unidade 1 7
Estatística Descritiva......................................................................................................... 7
Introdução................................................................................................................ 7

Lição 1 9
Estatística: Conceitos Básicos........................................................................................... 9
Introdução................................................................................................................ 9
Sumário ........................................................................................................................... 15
Exercícios........................................................................................................................ 16
Feedback ......................................................................................................................... 19

Lição nº 2 21
Tabelas e gráficos ........................................................................................................... 21
Introdução.............................................................................................................. 21
Sumário ........................................................................................................................... 30
Exercícios........................................................................................................................ 30
Feedback ......................................................................................................................... 35

Lição nº 3 37
Medidas de tendência central.......................................................................................... 37
Introdução.............................................................................................................. 37
Sumário ........................................................................................................................... 45
Exercícios........................................................................................................................ 45
Feedback ......................................................................................................................... 46

Lição nº 4 49
Quartis e percentis. Diagrama de extremos e quartis...................................................... 49
Introdução.............................................................................................................. 49
ii Índice

Sumário ........................................................................................................................... 55
Exercícios........................................................................................................................ 56
Feedback ......................................................................................................................... 57

Lição nº 5 58
Medidas de Dispersão ..................................................................................................... 58
Introdução.............................................................................................................. 58
Sumário ........................................................................................................................... 64
Exercícios........................................................................................................................ 64
Feedback ......................................................................................................................... 66

Lição nº 6 71
Coeficiente de correlação................................................................................................ 71
Introdução.............................................................................................................. 71
Sumário ........................................................................................................................... 77
Exercícios........................................................................................................................ 78
Feedback ......................................................................................................................... 79

Lição nº 7 83
Regressão linear simples................................................................................................. 83
Introdução.............................................................................................................. 83
Sumário ........................................................................................................................... 86
Exercícios........................................................................................................................ 86
Feedback ......................................................................................................................... 88

Unidade 2 91
Noções de probabilidade................................................................................................. 91
Introdução.............................................................................................................. 91

Lição nº 1 93
Conceito de probabilidade .............................................................................................. 93
Introdução.............................................................................................................. 93
Sumário ........................................................................................................................... 99
Exercícios...................................................................................................................... 100
Exercícios...................................................................................................................... 103

Lição nº 2 107
Arranjos e combinações................................................................................................ 107
Introdução............................................................................................................ 107
Introdução à Estatística Ensino à Distância iii

Sumário ......................................................................................................................... 117


Exercícios...................................................................................................................... 117
Feedback ....................................................................................................................... 119

Lição nº 3 122
Reunião de acontecimentos........................................................................................... 122
Introdução............................................................................................................ 122
Feedback ....................................................................................................................... 124
Feedback ....................................................................................................................... 126
Sumário ......................................................................................................................... 127
Exercícios...................................................................................................................... 127
Feedback ....................................................................................................................... 130

Lição 4 135
Probabilidade condicional. Acontecimentos independentes......................................... 135
Introdução............................................................................................................ 135
Sumário ......................................................................................................................... 140
Exercícios...................................................................................................................... 141
Feedback ....................................................................................................................... 142

Lição nº 5 145
Probabilidade total e fórmula de Bayes ........................................................................ 145
Introdução............................................................................................................ 145
Feedback ....................................................................................................................... 146
Sumário ......................................................................................................................... 150
Exercícios...................................................................................................................... 150
Feedback ....................................................................................................................... 152

Unidade 3 158
Distribuição normal ...................................................................................................... 158
Introdução............................................................................................................ 158

Lição nº 1 159
Distribuição normal. Uso da tabela de distribuição normal.......................................... 159
Introdução............................................................................................................ 159
Sumário ......................................................................................................................... 165
Exercícios...................................................................................................................... 166
Feedback ....................................................................................................................... 166

Lição nº 2 169
Resolução de problemas envolvendo a distribuição normal......................................... 169
Introdução............................................................................................................ 169
iv Índice

Feedback ....................................................................................................................... 170


Feedback ....................................................................................................................... 172
Sumário ......................................................................................................................... 173
Exercícios...................................................................................................................... 173

Média 175
Feedback ....................................................................................................................... 176

Unidade 4 181
Amostragem, distribuições amostrais e estimação por intervalos. ............................... 181
Introdução............................................................................................................ 181

Lição nº 1 183
Distribuição amostral e intervalos de confiança para a média da população ............... 183
Introdução............................................................................................................ 183
Sumário ......................................................................................................................... 189
Exercícios...................................................................................................................... 189
Feedback ....................................................................................................................... 190

Lição nº 2 194
Teorema do limite central ............................................................................................. 194
Introdução............................................................................................................ 194
Sumário ......................................................................................................................... 197
Exercícios...................................................................................................................... 198
Feedback ....................................................................................................................... 199

Lição nº 3 201
Determinação do tamanho da amostra.......................................................................... 201
Introdução............................................................................................................ 201
Sumário ......................................................................................................................... 202
Exercícios...................................................................................................................... 203
Feedback ....................................................................................................................... 203

Lição nº 4 205
Intervalos de confiança com a distribuição t de Student............................................... 205
Introdução............................................................................................................ 205
Sumário ......................................................................................................................... 211
Exercícios...................................................................................................................... 211
Feedback ....................................................................................................................... 212

Lição nº 5 215
Intervalo de confiança para proporções ........................................................................ 215
Introdução............................................................................................................ 215
Introdução à Estatística Ensino à Distância v

Sumário ......................................................................................................................... 219


Exercícios...................................................................................................................... 219
Feedback ....................................................................................................................... 220

Unidade 5 223
Testes de Hipóteses....................................................................................................... 223
Introdução............................................................................................................ 223

Lição nº 1 225
Testes de hipótese para a média e proporção da população.......................................... 225
Introdução............................................................................................................ 225
Sumário ......................................................................................................................... 237
Exercícios...................................................................................................................... 238
Feedback ....................................................................................................................... 240

Lição nº 2 247
Teste de hipótese para diferença de médias. O caso de amostras independentes. ........ 247
Introdução............................................................................................................ 247
Sumário ......................................................................................................................... 251
Exercícios...................................................................................................................... 251
Feedback ....................................................................................................................... 254

Lição nº 3 263
Teste de hipótese para diferença de médias. Caso de amostras emparelhadas. ............ 263
Introdução............................................................................................................ 263
Sumário ......................................................................................................................... 268
Exercícios...................................................................................................................... 268
Feedback ....................................................................................................................... 270

Unidade 6 274
O teste de independência do Qui-quadrado.................................................................. 274
Introdução............................................................................................................ 274

Lição nº 1 275
Teste de independência do Qui-quadrado. ................................................................... 275
Introdução............................................................................................................ 275
vi Índice

Feedback ....................................................................................................................... 280


Sumário ......................................................................................................................... 282
Exercícios...................................................................................................................... 282
Feedback ....................................................................................................................... 284

Anexos 290
Técnicas de Amostragem.............................................................................................. 290

Tabela da Distribuição Normal Padrão 295

P(Z<z) (área à esquerda do valor de Z indicado) 295


Bibliografia ................................................................................................................... 303
Introdução à Estatística Ensino à Distância 1

Visão geral
Bem-Vindo ao Módulo de
Introdução à Estatística
O módulo de Introdução à Estatística apresenta uma visão geral dos
conteúdos de estatística. Na unidade 1, estatística descritiva, vamos
discutir os conceitos chave da disciplina, que serão frequentemente
tratados ao longo do Manual. Discutiremos igualmente como fazer
sumários de dados. A tabela de frequência, os gráficos e o cálculo de
medidas estatísticas são tratados neste capítulo. Nas unidades 2, 3 e 4
iremos abordar alguns conceitos de probabilidade como alicerces da
inferência estatística tratada nas unidades 5 e 6.
Espero que você nos acompanhe ao longo de todo o módulo.

Objectivos do Módulo
Ao terminar o estudo do módulo de Introdução à Estatística você será
capaz de:

ƒ Recolher, organizar, sumarizar e interpretar dados referentes a


diversas variáveis através de tabelas de distribuição de
frequências, representação gráfica e medidas estatísticas.
ƒ Reconhecer e interpretar curvas de distribuição normal, student
e qui-quadrado;
Objectivos ƒ Inferir sobre aspectos relacionados com variáveis, utilizando
intervalos de confidência;
ƒ Desenvolver capacidades de trabalhar em equipas realizando
pesquisas de opinião que envolvam a definição da amostra, a
elaboração de questionário, o processamento, a análise de dados e a
elaboração de relatórios sobre os resultados.

Quem deve estudar este Módulo?


Este Módulo destina-se à formação de professores em exercício que
possuem a 12a classe ou equivalente e inscritos no Curso à Distância,
fornecido pela Universidade Pedagógica.
2 Visão geral

Como está estruturado este


Módulo?
Todos os módulos dos cursos produzidos pela Universidade Pedagógica
encontram-se estruturados da seguinte maneira:

Páginas introdutórias
ƒ Um índice completo.
ƒ Uma visão geral detalhada do curso / módulo, resumindo os
aspectos-chave que você precisa conhecer para completar o estudo.
Recomendamos vivamente que leia esta secção com atenção antes de
começar o seu estudo.

Conteúdo do curso / módulo


O curso está estruturado em unidades. Cada unidade incluirá uma
introdução, objectivos, conteúdo, incluindo actividades de
aprendizagem, um sumário e uma ou mais actividades para auto-
avaliação.

Outros recursos
Se você está interessado em aprender mais, preste atenção a lista de
recursos adicionais para e explore-os. Estes recursos podem incluir livros,
artigos ou sites na Internet.

Tarefas de avaliação e/ou Auto-avaliação


As tarefas de avaliação para este módulo encontram-se no final de cada
unidade. Sempre que necessário, dão-se folhas individuais para
desenvolver as tarefas, assim como instruções para as completar. Estes
elementos encontram-se no final do modulo.

Comentários e sugestões
Esta é a sua oportunidade para nos dar sugestões e fazer comentários
sobre a estrutura e o conteúdo do módulo. Os seus comentários serão
úteis para nos ajudar a avaliar e melhorar este módulo.

Ícones de actividade
Ao longo deste manual irá encontrar uma série de ícones nas margens das
folhas. Estes ícones servem para identificar diferentes partes do processo
de aprendizagem. Podem indicar uma parcela específica de texto, uma
nova actividade ou tarefa, uma mudança de actividade, etc.
Introdução à Estatística Ensino à Distância 3

Acerca dos ícones


Os ícones usados neste manual são símbolos africanos, conhecidos por
adrinka. Estes símbolos têm origem no povo Ashante de África
Ocidental, datam do século 17 e ainda se usam hoje em dia.
Os ícones incluídos neste manual são... (ícones a ser enviados - para
efeitos de testagem deste modelo, reproduziram-se os ícones adrinka, mas
foi-lhes dada uma sombra amarela para os distinguir dos originais).
Pode ver o conjunto completo de ícones deste manual já a seguir, cada
um com uma descrição do seu significado e da forma como nós
interpretámos esse significado para representar as várias actividades ao
longo deste módulo.

Comprometimento/ Resistência, “Qualidade do “Aprender através


perseverança perseverança trabalho” da experiência”
(excelência/
autenticidade)

Avaliação /
Actividade Auto-avaliação Teste Exemplo /
Estudo de caso

Paz/harmonia Unidade/relações Vigilância / “Eu mudo ou


humanas preocupação transformo a minha
vida”
Debate Actividade de
grupo Tome Nota! Objectivos

[Ajuda-me] deixa- “Pronto a enfrentar “Nó da sabedoria” Apoio /


me ajudar-te” as vicissitudes da encorajamento
vida”

(fortitude /
Leitura preparação) Terminologia Dica
Reflexão
4 Visão geral

Habilidades de estudo

Caro estudante!

Para frequentar com sucesso este módulo recomendamo-lo a programar


sessões de estudo diárias que podem variar de 1 hora 30 minutos a 2
horas de tempo.

Não o aconselhamos a estudar mais do que duas horas porque o


entusiasmo em querer completar o estudo pode frustrar-lhe. Realize com
calma as tarefas propostas.

É mais frutífero que estude continuamente durante curto tempo do que


estudos semanais de longa duração.

Estude as suas lições de preferência nas primeiras horas da manhã.

Procure um lugar tranquilo, na sua casa, numa sala de uma escola perto
da sua casa, ou outro lugar que disponha de espaço e iluminação
apropriados.

Tente estudar uma lição por dia! Adquira já um caderno de exercícios e


uma calculadora científica, materiais indispensáveis para o
acompanhamento do módulo.

Todas as actividades propostas ao longo do manual incluindo as de auto


avaliação deverão ser resolvidas no caderno de exercícios.

Por fim, tente resolver todos os exemplos outra vez como forma de
acompanhar adequadamente as lições. Passe para os exercícios quando
tiver a certeza que entendeu o conteúdo e os procedimentos para a sua
resolução.

Programe devidamente o seu tempo para que o estudo seja uma


experiência gratificante e excitante.

Desejamos-lhe muitos sucessos!


Introdução à Estatística Ensino à Distância 5

Precisa de apoio?
Dúvidas e problemas são comuns ao longo de qualquer estudo. Em caso
de dúvida numa matéria tente consultar os manuais sugeridos no fim da
lição e disponíveis nos centros de ensino a distância (EAD) mais
próximos. Se tiver dúvidas na resolução de algum exercício, procure
estudar os exemplos semelhantes apresentados no manual. Se a dúvida
persistir, consulte a orientação que aperece no fim dos exercícios. Se a
dúvida persistir, veja a resolução do exercício.

Sempre que julgar pertinente, pode consultar o tutor que está à sua
disposição no centro de EAD mais próximo.

Não se esqueça de consultar também colegas da escola que tenham feito a


cadeira de Introdução à Estatística, vizinhos e até estudantes de
universidades que vivam na sua zona e tenham ou estejam a fazer
cadeiras relacionadas com estatística.

Tarefas (avaliação e auto-


avaliação)
Ao longo deste módulo irá encontrar várias tarefas que acompanham o
seu estudo. Tente sempre solucioná-las. Consulte a resolução para
confrontar o seu método e a solução apresentada. Consulte manuais
disponíveis e referenciados no fim de cada lição para obter mais
informações acerca do conteúdo que esteja a estudar. Se usar livros de
outros autores ou parte deles na elaboração de algum trabalho deverá citá-
los e indicar estes livros na bibliografia. Não se esqueça que usar um
conteúdo, livro ou parte do livro em algum trabalho, sem referenciá-lo é
plágio e pode ser penalizado por isso. As citações e referências são uma
forma de reconhecimento e respeito pelo pensamento de outros. Estamos
cientes de que o estimado estudante não gostaria de ver uma ideia sua ser
usada sem que fosse referenciado, não é?
6 Visão geral

Avaliação
A avaliação visa não só informar-nos sobre o seu desempenho nas lições,
mas também estimular-lhe a rever alguns aspectos e a seguir em frente.

Durante o estudo deste módulo o estudante deverá realizar 2 testes


correspondentes aos seguintes conteúdos.

Teste I: Unidades 1, 2 e 3

Teste II: Unidades 4, 5 e 6.

O estudante deverá dirigir-se ao centro de EAD e apresentar a sua


intenção de ser submetido a um teste sempre que tenha concluído com
êxito as unidades acima referidas.

No fim do estudo do módulo, o estudante será submetido ao exame final


que em caso de ser bem sucedido, lhe confere a aprovação neste módulo.

O exame será realizado nos centros de EAD mediante solicitação do


estudante.
Introdução à Estatística Ensino à Distância 7

Unidade 1
Estatística Descritiva
Introdução
Geralmente quando se faz um estudo ou se recolhe uma informação ela
aparece duma maneira desorganizada e portanto sem nenhum significado.
Para atribuir significado a esta informação é necessário organizá-la e
resumi-la. Este é o grande propósito desta Unidade. Construir tabelas,
gráficos e calcular medidas estatísticas como a média, mediana e outras.

Esta unidade comporta 7 lições. O seu estudo deverá durar cerca de 17


horas e meia. O caderno de notas e a calculadora deverão acompanhar
todo o estudo.

Tempo de estudo da
Unidade: 17:30 Horas

Está pronto?
Vamos começar apresentando os objectivos desta unidade.
Ao completar esta unidade, você deverá ser capaz de:

ƒ Distinguir as duas partes da Estatística: estatística descritiva e


indutiva;
ƒ Identificar população, amostra, unidade estatística e variável num
Objectivos problema dado;
ƒ Determinar medidas estatísticas;
ƒ Construir tabelas de frequência e gráficos para representar conjuntos
de dados
ƒ Caracterizar a relação entre variáveis através do coeficiente de
correlação.
ƒ Fazer estimativas recorrendo ao modelo de regressão linear simples.
8 Unidade 1

Plano de estudo da unidade

Nº da Tema Tempo de Tempo de


lição estudo resolução da auto-
avaliação

1 Conceitos básicos 1 hora 1 hora

2 Tabelas e gráficos 1 hora 2 horas

3 Medidas de tendência 1 hora 1,5 hora


central

4 Quartis e percentis 1 hora 1 hora

5 Medidas de dispersão 1 hora 2 horas

6 Medidas de associação 1 hora 2 horas


entre duas variáves:
covariância e
coeficiente de
correlação

7 Regressão linear 1 hora 1 hora


simples
Introdução à Estatística Ensino à Distância 9

Lição nº 1
Estatística: Conceitos Básicos
Introdução
Expressões como não se vai à machamba sem enxada ou não se vai à
guerra sem arma são bastante comuns nas conversas do dia a dia. Elas
procuram chamar atenção para algo muito básico para certa acção mas
que foi esquecido. Nesta lição, apresentam-se os conceitos básicos da
estatística, conceitos esses que lhe acompanharão até ao fim deste
módulo, e sem a compreensão dos quais o estimado estudante poderá
considerar-se até certo ponto, “um agricultor sem enxada”.

Esta lição deverá ser estudada em aproximadamente 2 horas, sendo 1 para


a parte da auto-avaliação.

Tempo de estudo da
lição: 01:00 Hora

Ao completar a lição nº 1 sobre conceitos básicos de Estatística, você será


capaz de:

ƒ Distinguir estatística descritiva de inferência estatística;

ƒ Distinguir população de amostra;


Objectivos
ƒ Identificar a população, a amostra, a unidade estatística e a variável
em estudo numa situação (problema) dada;

ƒ Distinguir os tipos de variáveis;

ƒ Dado um problema, identificar a variável em estudo e classificá-la.


10 Lição nº 1

Estatística, Estatística Descritiva e Inferência Estatística, População e


Amostra, Amostra Representativa, Variável, Variável Quantitativa e
Terminologia
Qualitativa, Variável Nominal e Ordinal, Variável Contínua e Discreta.

O que pensa sobre o que poderá ser a estatística? Pense e leia


cuidadosamente o texto que se segue para confirmar as suas
hipóteses.

Estatística

Etimologicamente, a palavra estatística vem do latim STATUS, que


significa ESTADO, uma vez que na antiguidade, tal como hoje, o Estado
fazia levantamentos para obter informações sobre a população disponível
para pagar impostos, a idade dos jovens para irem para a guerra, etc. Hoje
a Estatística serve não só ao Estado, mas a todas as áreas. O político pode
recorrer à estatística para avaliar a possibilidade de vencer a eleição que
se avizinha. O economista usa informação sobre a procura e a oferta de
produtos, taxas de desemprego e outras, para calcular ou prever a
inflação. Na saúde, dados sobre o estado de saúde de cidadãos são
continuamente recolhidos e analisados e a partir deles são evitados
alastramentos de epidemias. No campo da técnica vários componentes
(por exemplo lâmpadas, transístores) são fabricados e testados para
determinar o seu tempo de vida e definir planos de garantia aos
consumidores.

Procure discutir com um ou dois colegas do curso, a aplicação da


Debate estatística na Física. Encontrem no mínimo 5 exemplos.

A estatística é uma ciência ou método que se ocupa da recolha,


organização e análise de dados.
Introdução à Estatística Ensino à Distância 11

Distinguem-se as seguintes fases do método estatístico:

1. Identificação do problema e da população correspondente;

2. Recolha de dados.

3. Análise de dados e apresentação de resultados.

Estatística Descritiva e Inferência Estatística

A maioria das informações estatísticas nos jornais, relatórios e outras

A Estatística descritiva é a
publicações consiste de dados reunidos e apresentados de forma clara

parte responsável pela para que o leitor possa entender. Tais sumários, que podem ser tabelas,
sumarização de dados gráficos ou medidas estatísticas são conhecidos como estatísticas
descritivas.

Hora de Hora de
Nome Chegada Nome Chegad
a

Armindo 7:00 Isildo 8:30

Belmira 8:30 Janete 8:30

Célia 9:00 Laura 8:00

Carlos 8:00 Lucas 8:00

Dionísio 7:30 Mateus 7:30

Domingos 7:30 Mário 8:30

Elsa 8:30 Paula 7:00

Elisabeth 8:30 Rita 9:00

Flórido 7:30 Rui 8:30

Herinques 7:00 Zeca 8:00

Tabela 1. Hora de entrada dos funcionários da agência.


12 Lição nº 1

Considere os dados sobre a hora de chegada dos funcionários de uma


agência de viagens apresentados na tabela 1. Facilmente pode-se tecer
algumas considerações sobre a hora de chegada dos funcionários da
agência recorrendo ao gráfico apresentado na figura 1. Pode-se ver, por
exemplo que a hora de chegada dos funcionários varia entre 7 a 9 horas,
sendo 8:30 a hora em que uma boa parte dos funcionários chega ao
trabalho. É este o papel da estatística descritiva: fazer sumários de dados.

8
Número de funcionários

0
7:00 7:30 8:00 8:30 9:00
Hora de chegada

Fig 1- Gráfico de barras da hora de chegada dos funcionários da agência de viagens.

Em estatística, chama-se população ao conjunto de elementos


População
(indivíduos) com alguma característica comum e com interesse para o
estudo.

É população, o conjunto dos eleitores no nosso país, as contas bancárias


de um banco, os carros que circulam numa determinada cidade, o gado
bovino existente na província de Gaza, os multímetros que o laboratório
Exemplo 1
de física possui, etc.
Introdução à Estatística Ensino à Distância 13

Para conhecer de forma completa uma população é necessário analisar


todos os seus elementos, isto é, realizar um censo. Exceptuando casos em
que a população tem dimensão modesta e é acessível, raramente é
possível analisar todos os elementos da população por não se dispor de
orçamento, de tempo, e até algumas vezes por a observação ser
destrutiva. Neste caso o estudo das características da população é feito
Amostra é um subconjunto
ou uma parte da sobre um subconjunto da população que se chama Amostra. Os
população.
resultados da amostra são depois usados para fazer estimativas sobre as
características da população. Este processo é chamado de inferência
estatística.

A inferência estatística, ou estatística indutiva trata de técnicas que


Inferência estatística ou permitem tirar conclusões ou tomar decisões sobre uma população a
estatística indutiva partir de evidências apresentadas pelos dados numéricos relativos à
população, ou a uma amostra dela extraída.

O sucesso do estudo baseado na amostra depende grandemente da


escolha desta. Uma amostra mal escolhida pode conduzir a conclusões
erradas. De um modo geral, na escolha de uma amostra deve-se ter em
conta os seguintes aspectos:

− Imparcialidade: Todos os elementos da população têm a mesma


oportunidade de fazer parte da amostra;

− Representatividade: A amostra deve conter qualitativamente


todas as características que a população possui.

− Tamanho: Deve ser suficientemente larga de modo que as


características da amostra se aproximem das características da
população.

Em muitos estudos estatísticos usam-se amostras aleatórias.

Variável

Num estudo, parte-se de um conjunto a que se denomina população. Cada


elemento desse conjunto (unidade estatística) tem provavelmente muitas
características. Dependendo do objectivo do estudo, centra-se numa ou
em mais características deste. A essas características chamam-se
variáveis do estudo.
14 Lição nº 1

Por exemplo no conjunto dos alunos de uma turma podem-se observar


muitas variáveis como: altura, cor dos olhos, última nota a matemática,
distância de casa à escola, nível social do aluno, número de irmãos, sexo,
Exemplo 2
etc.

As variáveis observadas podem ser qualitativas (atributos ou nomes) ou


quantitativas (que indicam quantidade de alguma coisa). Por exemplo,
das variáveis acima, são qualitativas; o sexo, a cor dos olhos, e o nível
social do aluno. São quantitativas, a altura, a idade, a última nota a
Matemática, a distância casa-escola e o número de irmãos.

As variáveis qualitativas podem estar numa escala nominal (se não é


possível ordenar as diversas modalidades) ou ordinal (se há uma
possibilidade de ordenamento das diversas modalidades que a variável
toma). Das variáveis consideradas no exemplo 2, são qualitativas
nominais, o sexo e a cor dos olhos. O social é um exemplo de uma
variável qualitativa ordinal.

Dependendo dos valores que as variáveis quantitativas tomam, estas


classificam-se em contínuas (quando podem assumir qualquer valor
dentro de um intervalo considerado) ou discretas (quando só assumem
alguns valores dentro de um intervalo considerado). A idade e o número
de irmãos são exemplos de variáveis discretas enquanto a distância casa -
escola é uma variável contínua.

É hora de descontrair-se um pouco mudando de actividade. Pense agora


num conjunto de variáveis relacionadas com o seu dia a dia e resolva a
tarefa seguinte.

Indique duas variáveis que sejam:


a) Quantitativas
b) Qualitativas
Reflexão
c) Discretas
d) Contínuas
e) Nominais
f) Ordinais
Introdução à Estatística Ensino à Distância 15

Veja a seguir o sumário das partes mais relevantes da lição!

Sumário
A estatística é uma ciência ou método que trata da recolha, organização e
análise de dados. Ela divide-se em duas partes: Estatística descritiva e
indutiva.

A estatística descritiva faz o resumo de dados, enquanto a indutiva


procura caracterizar a população a partir de resultados da amostra.

População, em estatística, designa um conjunto de indivíduos com pelo


menos uma característica comum. Amostra é um subconjunto da
população.

Fig 2- Diferença entre estatística descritiva e inferência estatística


16 Lição nº 1

Variável

Qualitativa Quantitativa

Nominal Ordinal Discreta contínua

Fig 3- Esquema dos tipos de variável

Preparado para a prática!

Se não, repita os aspectos que acha que não foram suficientemente


apreendidos. Pode usar os livros que se apresentam no final da lição para
a revisão.

Agora apresentamos-lhe uma sequência de exercícios para consolidar a


sua aprendizagem. Resolva-os cuidadosamente, voltando para os
conceitos e exemplos apresentados sempre que achar necessário. Por
favor, não consulte agora a resolução dos mesmos. O tempo necessário é
de aproximadamente 2 horas. Não se esqueça do seu caderno de
exercícios.

Exercícios
1. Diferencie os seguintes conceitos:

a) Estatística descritiva de inferência estatística.


Auto-avaliação nº 1
b) População de amostra.

2. Pretende-se fazer um estudo sobre o número de membros do


agregado familiar, numa cidade. Para isso, efectuou-se um
inquérito ao qual responderam 50 famílias.
Introdução à Estatística Ensino à Distância 17

Os resultados foram:

3 2 5 3 4 6 5 3 2 8 6 2 4 5 1 7 4 3 2 3 3 4 6 76 8 8 9 7 9
6 3 4 5 2 7 9 3 5 7 2 5 3 7 5 8 4 4 3 3.

Tempo de realização: Em relação ao referido estudo, faça corresponder por meio de setas cada
Uma Hora.
elemento do grupo A com um só elemento do grupo B.

GRUPO A GRUPO B

a 50 famílias de Tete

b Famílias de tete

c População moçambicana
População
Agragado familiar da cidade de
d
Amostra Tete

Unidade Estatística e Citadino de Tete

Variável. Tipo de variável Membros do agregado familiar,


f
qualitativa
g Citadinos de Tete

Número de membros do agregado


h
familiar, quantitativa discreta

i 50 famílias seleccionadas
Número de membros do agregado
j
familiar, quantitativa contínua

3. Um levantamento arguiu 2013 estudantes: “Você acha que as


experiências laboratoriais ajudam a entender facilmente as leis da
física?” As categorias das respostas foram sim, não e indeciso.

a) Qual foi o tamanho da amostra para essa pesquisa?

b) Os dados colectados eram qualitativos ou quantitativos?

c) Para um resumo dos dados para esta questão, faria mais


sentido usar as médias ou as percentagens?
18 Lição nº 1

d) Dos que responderam, 28% disseram não. Quantos


estudantes forneceram esta resposta?

4. Considere a sequência do seguinte estudo:

1. Define-se uma amostra dos elementos de uma população.

2. Descrevem-se as variáveis para o estudo.

3. Toma-se nota, para cada variável, do valor


correspondente a cada elemento da amostra.

4. Utilizam-se diversos métodos científicos e analisam-se os


dados, obtendo-se diversas estatísticas.

5. Com os dados obtidos na amostra prevê-se o


comportamento da população com a ajuda do cálculo das
probabilidades.

Qual dos passos referidos está dentro da Inferência Estatística?

5. Uma amostra de notas de cindo estudantes mostrou os seguintes


resultados: 72, 65, 82, 90, 76. Qual das seguintes declarações é
correcta e qual poderia ser classificada como muito generalizada?

a) A nota média para a amostra dos cinco estudantes é 77.

b) A nota média pata todos os estudantes que fizeram o


exame é 77.

c) Uma estimativa da nota média para todos os estudantes


que fizeram o exame é 77.

d) Mais da metade dos estudantes que fizeram este exame


obterão pontos entre 70 e 85.

6. Classifique cada uma das seguintes variáveis em qualitativa


nominal, qualitativa ordinal, quantitativa discreta e quantitativa
contínua:

(a) Velocidade de um automóvel, (b) Marca de automóvel, (c)


classe social, (d) distância casa-escola, (e) número de vezes que
se repete uma experiência, (f) línguas faladas por estudantes
duma turma de física, (g) altura atingida por um projéctil, (h)
número de casos de sida diagnosticados diariamente.
Introdução à Estatística Ensino à Distância 19

Que tal, alguma dúvida! Faça uma leitura da parte teórica e dos exemplos
mais uma vez. Tente resolver e compare com a resolução.

Feedback

Resolução das Actividades de Avaliação 1

1. Aspectos a realçar:

a) A Estatística descritiva sumariza dados, enquanto a


inferência tenta validar as conclusões da amostra para a
população.

b) População é o conjunto de indivíduos com pelo menos


uma característica em comum enquanto a amostra é uma
parte da população.
2. População - famílias da cidade de Tete.
Amostra - 50 famílias da cidade de Tete.
Unidade Estatística - agregado familiar da cidade de Tete
Variável: Tipo de variável - número de membros do agregado
familiar, quantitativa discreta.
3. a) 2013.
b) Qualitativos.
c) Percentagens.
28
d) 28% de 2013 = × 2013 = 564 Indivíduos.
100

4. Passo nº 5.

5. Correcta: a)

Muito generalizada: c)
20 Lição nº 1

6.

Qualitativa nominal b); f)

Qualitativa ordinal c)

Quantitativa discreta e); h)

Quantitativa contínua a); d); g)

Esperamos que tenha resolvido com sucesso esta actividade. Para leitura
adicional do assunto desta lição, consulte os seguintes manuais:

− ANDERSON, D. R. Estatística aplicada è Administração e


economia. São Paulo: Thomson leaning. 2003

Leitura − LEVIN, Jack at al. Estatística para ciências Humanas. São Paulo: 9ª
edição, Editora Pearson. 2004
Introdução à Estatística Ensino à Distância 21

Lição nº 2
Tabelas e gráficos
Introdução
Mais uma lição ou menos uma lição?! As duas coisas. Bem-vindo mais
uma vez. Espero que esteja bem disposto a aprender mais esta lição.
Vamos a isso!

Jornais e revistas recorrem frequentemente a tabelas e gráficos para


apresentar diversos tipos de informação. São formas de sumarização
simples e com muito potencial. Um gráfico ou uma tabela bem construída
podem poupar-nos muitas linhas ou até mesmo páginas de explicação.
Nesta lição apresentamos as tabelas e gráficos mais usados no âmbito da
estatística descritiva.

Esta lição deverá ser estudada em aproximadamente 1 horas.

Tempo de estudo da lição:


01:00 Hora

Ao completar esta lição, você será capaz de:

ƒ Construir e interpretar tabelas de frequência, gráfico de barras, gráfico


circular, histograma e polígono de frequência.

Objectivos ƒ Diferenciar os vários tipos de frequências e de gráficos.


22 Lição nº 2

Frequência, frequência absoluta e relativa, frequência absoluta acumulada


e relativa acumulada, gráfico de barras, gráfico circular, histograma,
polígono de frequência.
Terminologia

Depois de uma lição muito teórica, mas bastante importante para a


compreensão de todo o módulo, estamos a entrar pouco a pouco para os
cálculos. Prepare o seu caderno de notas, a sua régua e a sua calculadora
para mais um percurso no seu módulo de estatística. Não se esqueça que
Estamos Juntos! Esta lição deverá ser estudada em aproximadamente 3
horas, sendo 2 para a parte da auto-avaliação.

Tabela de frequência

Já foi referido anteriormente que a estatística descritiva recorre à tabelas


para fazer sumários de dados. Um tipo de tabela comum é a chamada de
tabela de distribuição de frequências ou simplesmente tabela de
frequência. Ilustra-se, por meio de um exemplo, como construir uma
tabela de frequência de dados simples (não agrupados em classes).

Os seguintes dados representam a idade dos alunos duma turma da 12ª


classe:

19, 19, 19, 18, 17, 20, 20, 19, 21, 19, 17, 18, 20, 18, 18, 23, 21, 18, 19,
20.

Pouco ou nada se pode dizer em relação a idade dos alunos da turma com

Frequência absoluta
os dados dispostos desta maneira. Coloque os dados numa tabela em que
consideramos por um lado o valor observado ( xi ) e por outro, o número

de vezes que cada valor aparece repetido, também designado por


frequência absoluta:
Introdução à Estatística Ensino à Distância 23

xi fi

17 2

18 5

19 6

20 4

21 2

23 1

Total 20

Tabela 2: Frequência absoluta da idade dos alunos

A frequência absoluta só toma um significado mais efectivo se considerar


Frequência relativa
o número total das observações (tamanho da amostra). Para entender
facilmente esta questão, suponha que um colega lhe informe durante uma
conversa que numa certa turma cinco alunos reprovaram num
determinado exame. Parece-lhe por enquanto uma situação normal. Mas
ele depois acrescenta: a turma era de 6 alunos apenas! A informação toma
outro significado e é mais completa. Por essa razão é útil acrescentar a
frequência relativa.

xi fi f r (%)

17 2 2
20
= 0,1 × 100 = 10%

18 5 25

19 6 30

20 4 20

21 2 10

23 1 5

Total 20 100

Tabela 3: Tabela de frequência absolutarelativa da idade dos


alunos
24 Lição nº 2

fi
fr = (1.1)
n

fr Frequência relativa

fi Frequência absoluta

n Tamanho da amostra

Para além das frequências absoluta e relativa, pode-se apresentar as


frequências absolutas acumuladas ( Fi ) e relativas acumuladas ( Fr ) que

são as frequências considerando valores menores ou iguais ao observado:

xi fi f r (%) Fi Fr (%)

17 2 2
20
= 0,1 × 100 = 10% 2 2
20
= 0,10 × 100 = 10%

18 5 25 2 + 5 =7 7
20
= 0,35 × 100 = 35%

19 6 30 13 65

20 4 20 17 85

21 2 10 19 95

23 1 5 20 100

Total 20 100 - -

Tabela 4: tabela de frequências da idade dos alunos.

Atenção à construção do gráfico de barras.

Gráfico de barras

O gráfico de barras constrói-se colocando no eixo horizontal (eixo das


abcissas) os valores observados e no eixo vertical (eixo das ordenadas) a
frequência absoluta ou relativa correspondente. Note que quanto maior
for a frequência de uma observação, maior será também a altura da barra
correspondente.
Introdução à Estatística Ensino à Distância 25

Gráfico de barras
7
6

Freq. absoluta
5
4
3
2
1
0
17 18 19 20 21 23
Idade

Figura 4: Gráfico de barras

Gráfico circular

O gráfico circular seguinte mostra a percepção de um grupo de empresas


moçambicanas, em relação ao comportamento das taxas de juros no II
trimestre de 2006. Indique as categorias que foram indicadas como mais e
Actividade 1
menos prováveis respectivamente. Justifique a sua resposta.

Redução Sem mudança Subida Subida acentuada

Tempo de realização:
30 minutos.

Fig 5: Percepção (em percentagem) em relação às taxas de juro no II trimestre de 2006,


segundo dados da pesquisa sobre o índice de ambiente de negócios em Moçambique,
realizada pela KPMG nos meses de Maio e Junho de 2006.

Como construir um gráfico circular usando os dados da tabela 2?


26 Lição nº 2

Sabes qual é o ângulo que uma circunferência representa e qual a medida


desse ângulo? O que tem a fazer é determinar que parte do círculo

Dica representa cada uma das frequências de idade.

Para o caso de 17 anos a frequência é 2.

Usando a regra três simples segue:

20 (total) ― 360º (total)

2 ― x

2 × 360 o
Donde se conclui que x = = 36 o
20

Com ajuda dum compasso, trace uma circunferência de raio à sua escolha
(Por exemplo 5 cm). Una em seguida o centro da circunferência à curva,
obtendo deste modo o raio. Partindo deste raio meça 36º, com a ajuda de
um transferidor. Separe esta porção por meio de um raio. Esta é a parte do
gráfico que representa os alunos com 17 anos. De maneira semelhante,
determine a medida da parte correspondente aos alunos com 18anos, e,
represente-a no círculo, de tal forma que as duas porções sejam
adjacentes. Continue desta forma até completar o gráfico.

17 anos 18 anos 19 anos 20 anos 21 anos 23 anos

23 anos 17 anos
21 anos

18 anos
20 anos

19 anos

Fig 6: Gráfico circular da idade dos alunos.

Histograma e polígono de frequência

Em certos casos, quando se dispõe de um conjunto de dados com muitas


variações (geralmente variáveis contínuas) é vantajoso fazer-se a
Introdução à Estatística Ensino à Distância 27

sumarização recorrendo ao agrupamento dos mesmos em classes de igual


amplitude

Considere os preços de venda de 90 casas praticados por uma agência


imobiliária nos últimos 6 meses. Os dados constam na tabela seguinte:

Preços (em milhares de dólares) Nº de casas

0 – 25 11

25 – 50 15

50 – 75 38

75– 100 14

100 – 125 8

125 – 150 3

150 – 175 1

Tabela 5: Preços de venda de casas praticados por uma agência imobiliária nos últimos 6
meses.

Nota: Convenciona-se que, por exemplo, o intervalo 0 – 25 = [0; 25[

Em casos em que não aparecem previamente as classes, o primeiro passo


na construção da tabela de frequência com dados agrupados em intervalos
de classes é a determinação do número de classes. Há várias regras que
ajudam a determinar o número de classes (k). Uma regra (que no caso de
as classes terem igual amplitude, conduz a resultados satisfatórios) é,

considerar 5 classes, para n ≤ 25 e k ≈ n para k > 25.

Esta regra tem carácter meramente indicativo, devendo ser tomadas em


conta as vantagens de ordem prática que advêm da definição de classes.
28 Lição nº 2

Histograma

O histograma considera, por um lado, os valores observados em classes e


por outro, as frequências absolutas ou relativas de cada classe. A
particularidade deste reside no facto de as barras serem adjacentes, ao
contrário do gráfico de barras.

fi

40

35

30

25

20

15

10

xi
0 25 50 75 100 125 150 175

Fig 7: Histograma dos preços da agência imobiliária.

Usando no eixo das abcissas as classes e no eixo das ordenadas as


frequências acumuladas, obtemos a ogiva.

Polígono de frequência

Acompanhe a actividade seguinte, que lhe ajudará a construir um


polígono de frequência. Não desanime, a lição está quase no fim!
Introdução à Estatística Ensino à Distância 29

Assinale no histograma acima, os pontos médios das barras. Veja o


exemplo abaixo.

Actividade 2

0 25

Considere mais duas classes adicionais uma de − 25 − 0 e outra

175 − 200 , ambas com frequência zero, e assinale nestas também o seu
Tempo de realização : ponto médio.
10 minutos.
Una os pontos médios das barras. O polígono obtido chama-se polígono
de frequências.

Observe uma simulação do resultado final que obterá:


fi

Dica
40

35

30

25

20

15

10

xi
0 25 50 75 100 125 150 175
30 Lição nº 2

Sumário
As tabelas e os gráficos são formas de resumir dados. A tabela mais
comummente usada é a tabela de frequência. Além da tabela de
frequência, pode-se construir gráficos de barras, circular, histogramas,
polígono de frequência e ogiva. Um gráfico pode substituir 1000
palavras!

Seguem-se os exercícios para consolidar a lição. Resolva-os com atenção.


Use os manuais de apoio e a resolução. Caso tenha algum, problema volte
a rever a lição.

Exercícios
1. Um inquérito realizado para um supermercado classificou os seus
clientes segundo a frequência com que o visitam e segundo a

Auto-avaliação nº 2 frequência com que compram produtos de limpeza.

FREQUÊNCIA DE COMPRA DE PRODUTOS DE


LIMPEZA

Sempre Algumas Vezes Nunca


FREQUÊNCIA
DE VISITA
Frequente 12 48 19

Não
7 6 8
Frequente

Tabela 6: Frequência de visita e de compra dos clientes dum supermercado

a) Quantos indivíduos visitam frequentemente o


supermercado?
b) Quantos indivíduos visitam frequentemente o
supermercado e compram produtos de limpeza?
Introdução à Estatística Ensino à Distância 31

c) Qual é a percentagem de indivíduos que não visitam o


supermercado frequentemente e compram produtos de
limpeza?
d) Qual é a percentagem dos que compram sempre produtos
de limpeza, no conjunto dos que visitam frequentemente
o supermercado?

2. O gráfico abaixo mostra a distribuição das massas disponíveis no


Tempo de realização laboratório de Física.
02:00 horas.
fr
35
32
30

25 22
20
20
15 14
10
10

5 2
0
1g 2g 5g 10g 20g 50g
massas

Fig 8: Gráfico de barras da distribuição das massas existentes no laboratório de física.

Com base no gráfico acima, assinale com V (verdadeiro) e F (falso) às


afirmações seguintes:

a) A maior parte das massas que existem no laboratório tem


5g.

b) As massas disponíveis variam de 2 a 32g.

c) A massa que existe com maior frequência é a de 5g.

d) 50% das massas são de pelo menos 5g.

e) No máximo 25% das massas existentes são de 5g.

f) No total existem 100 unidades de massas no laboratório.

g) Se existem 4 unidades de 2g, então pode-se concluir que


há no total 20 unidades no laboratório.
32 Lição nº 2

3. Observe o gráfico que mostra as 5 empresas com maior volume


de negócios no sector de alimentos em 2005, segundo a KPMG.

%de volume de negócios das 5 melhores empresas no ramo de


alimentação e bebidas

7% 1%

22% 44%

26%

Cervejas de Moçambique, SARL Companhia Industrial da Matola, SARL


Coca-Cola Sabco (Moçambique), SARL Águas de Moçambique, SARL
S.E.Ginwala & Filhos, Lda

Fig 9: Gráfico circular das 5 empresas com maior volume de negócios.

Em relação ao gráfico indique:

a) A empresa com maior volume de negócios.

b) A empresa com menor volume de negócios.

c) A percentagem correspondente às duas empresas com


maiores volumes de negócios.

d) O volume de negócios das Águas de Moçambique,


sabendo que as cinco empresas totalizaram o valor de
5964674000 Meticais.

4. Considere as distribuições do tipo de combustível


doméstico usado em 2 cidades, em 1988:

Número de Residências
Tipo de Combustível
Cidade A Cidade B

Gás 67450 31800

Electricidade 23800 3450

Outros 6450 3850

Tabela 7: Uso de combustível doméstico em duas cidade


Introdução à Estatística Ensino à Distância 33

a) Justifique a proposição: "De forma relativa, a


cidade B usa mais gás que a cidade A".

b) Qual dos dois tipos de gráfico é adequado para comparar


o consumo de combustível nas duas cidades?
Justifique a sua resposta.

i) Gráfico de barras

ii) Gráfico circular.

5. As classificações obtidas, no 1º semestre deste ano pelos 150


alunos do 2º ano de uma escola, na disciplina de Física
distribuem-se da seguinte forma:

Classificações: 7 8 9 10 11 12 13 14 15 16 17

No de alunos: 5 11 14 9 20 30 18 9 12 8 4

a) Indique a população e a variável estatística em estudo.

b) Calcule a frequência relativa da classificação 8.

6. A tabela abaixo resume a tendência de voto dos 100 membros


associados, na eleição do presidente do clube.

Categorias Nº de respostas

Candidato A 5

Candidato B 20

Candidato C 30

Candidato D 25

Indeciso 10

Votos em branco 10

Tabela 8: Tendência de voto dos membros dum clube


34 Lição nº 2

a. Classifique a variável em estudo. Justifique.

b. Construa um gráfico circular para a distribuição das respostas


dos sócios.

c. Construa um gráfico circular a partir da frequência relativa


considerando apenas as respostas dos quatro candidatos (total
- 80).

d. Qual dos dois gráficos na sua opinião mostra-se útil para


sustentar a hipótese de que o candidato C tem maiore
possibilidades de vencer a eleição?

7. Realizou-se uma experiência com cabos fabricados para


determinar a carga máxima por eles suportada, e obtiveram-se os
seguintes resultados:

4,3 6,8 9,2 7,2 8,7 8,6 6,6 5,2 8,1 8,7

7,4 4,6 4,2 7,6 6,8 7,7 8,4 7,5 8,6 6,0

7,7 8,1 7,0 8,2 8,3 8,8 6,7 8,1 9,4 7,7

6,3 7,7 9,1 7,8 7,9 7,9 9,4 8,2 6,7 8,2

a) Construa uma tabela de frequência absoluta, agrupando


os dados em seis classes. (sugestão: Determine a
amplitude total (A) subtraindo o valor mínimo
observado ( X min ) do máximo ( X máx ) , em seguida

determine a amplitude de classe (a), dividindo a


amplitude total pelo número de classes propostas).

b) Represente graficamente os dados (histograma e


polígonos de frequências), tomando por base a tabela
construída na alínea a).
Introdução à Estatística Ensino à Distância 35

Feedback

Resolução dos exercícios de auto-avaliação


1. a) 12 + 48 + 19 = 79 .
b) 12 + 48 = 60
60
c) × 100% = 60%
12 + 48 + 19 + 7 + 6 + 8
12 12
d) × 100% = × 100% = 15,2%
12 + 48 + 19 79

2. a) F
b) F
c) V
d) V
e) F
f) F
g) V

3. a) Cervejas de Moçambique.
b) S.E. Ginwala & Filhos, Lda.
c) 26% + 44% = 70% .
7
d) 7% de 5964674000 = × 5964674000
100
= 417527180 Meticais.

4. a) Verdadeira, pois em relação ao gás a frequência relativa


para a cidade A é menor
67450
× 100% = 69,0% que a
67450 + 23800 + 6450
frequência relativa da cidade B que é de
31800
= 81,3%.
31800 + 3450 + 3850

b)O gráfico circular é mais adequado uma vez que a porção·


ocupada por cada um dos combustíveis é relativa ao
total· do consumo em cada cidade.
36 Lição nº 2

5. a)População: Alunos do segundo ano de uma escola.


Variável em estudo: classificações dos alunos do 2º ano·
na disciplina de Física.
11
b) × 100% = 7,3%
150

6. a) Qualitativa nominal (Tendência de voto).


7. a) A = X máx − X min = 9,4 − 4,2 = 5,2

Classes fi

4,2–5,2 3

5,2–6,2 2

6,2–7,2 7

7,2–8,2 14

8,2–9,2 11

9,2–10,2 3

5,2
a= = 0,87 → 1 (Usa-se o valor 1 por questões práticas).
6

Note por exemplo que 5,2 pertence à classe 5,2–6,2 e não à


anterior.

Alguma dúvida ainda: Consulte a lista de manuais que se segue:

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003.

Leitura − GUIMARÃES E CABRAL. Estatística. Amadora. Mc graw Hill,


1997.

− TRIOLA, Mário F. Introdução à Estatística.Rio de Janeiro. Livros


técnicos e científicos. 7ª edição, 1999
Introdução à Estatística Ensino à Distância 37

Lição nº 3
Medidas de tendência central
Introdução
Nas duas lições anteriores discutimos os conceitos básicos da Estatística e
a construção de tabelas e gráficos. Nestas próximas vamos discutir a
determinação de medidas estatísticas como outra forma de sumarizar
dados. Esteja atento aos aspectos mais importantes.

Uma maneira conveniente de descrever um grupo como um todo é achar


um número único que represente o que é médio, ou típico daquele
conjunto de dados. Esse valor é chamado medida de tendência central,
porque em geral, ele está localizado mais para o meio ou centro de uma
distribuição, onde a maior parte dos valores tende a concentrar-se.
Aborda-se em seguida as três medidas de tendência central mais usadas:
média aritmética, mediana e moda.

Esta lição deverá ser estudada em aproximadamente 2 horas.

Tempo de estudo da lição:


02:00 Hora

Ao completar esta lição, você será capaz de:

ƒ Determinar a média, mediana e moda.

Objectivos
38 Lição nº 3

Média, mediana e moda, ponto central da classe.

Terminologia

Média aritmética ( x )
Para a aprendizagem deste tópico, siga o exemplo seguinte:

Suponha que durante a quadra festiva (última semana do ano e primeira


semana do novo ano), uma loja de prendas tenha registado os seguintes
valores (em mil meticais) na venda dos seus produtos:
Exemplo 3
9,5 8 7 10,5 8 5 8,5 10 8 11 9 6

Qual é neste caso o valor médio (média aritmética) das vendas da loja no
referido período?

9,5 + 8 + 7 + 10,5 + 8 + 5 + 8,5 + 10 + 8 + 11 + 9 + 6


x= = 8,375
12

mil meticais.

Como facilmente pode concluir, a média aritmética determina-se


somando todos os valores observados e dividindo esta soma pelo número
total de observações:

x=
∑x i
ou x=
∑x f i i
,
n n

uma vez que, por exemplo, no caso da observação 8, 8 + 8 + 8 = 8 × 3 ,


onde 3 é a sua frequência absoluta.

Quando os dados se apresentam agrupados em classes de igual amplitude,


a determinação da média aritmética passa primeiro pela determinação de
Introdução à Estatística Ensino à Distância 39

um valor que possa a caracterizar cada uma das classes - O ponto médio
da classe ( xi ).

A seguinte actividade, que deverá ser feita em 10 minutos, ajuda--lhe na


determinação da média aritmética para dados agrupados.

Complete a seguinte tabela:

Densidade do solo ( g / cm 3 ) fi Ponto médio da xi f i


classe ( xi )
Actividade nº 3
1,00 - 1,10 5 1,05

1,10 - 1,20 7

1,20 - 1,30 8

1,30 - 1,40 4

Tempo de realização: 1,40 - 1,50 2


20 minutos.
Total 26 -

Tabela 9: Densidade do solo de 30 amostras.

Determine a média dividindo o total de xi f i por 26.

O ponto médio representa o valor no meio do intervalo da classe.


Também pode ser obtido fazendo a média dos dois limites, isto é,

Dica 1;00 + 1,10


= 1,05 .
2

A média é obtida dividindo por n a soma do produto xi f i .

Mediana ( ~
x)

Quando os dados são dispostos por ordem de tamanho, torna-se possível


localizar a mediana, o ponto central da distribuição. Por isso, a mediana
é encarada como uma medida de tendência central que separa o conjunto
40 Lição nº 3

de dados em duas partes aproximadamente iguais, com aproximadamente


50% dos dados.

Retomando o problema discutido na introdução da média, e dispondo os


dados em ordem crescente segue:

5 6 7 8 8 8 8,5 9 9,5 10 10,5 11

No centro da distribuição dos dados das vendas aparecem dois valores.


Portanto a mediana será a média desses dois valores:

~ 8 + 8,5
x= = 8,25
2

5 6 7 8 8 8 8,25 8,5 9 9,5 10 10,5 11

50% dos dados Mediana 50% dos dados

Observe que neste caso, em que temos 12 observações a mediana resulta


da soma dos dados nas posições 6 e 7.
Introdução à Estatística Ensino à Distância 41

Preencha a seguinte tabela, sobre a posição dos valores a somar para


determinar a mediana, no caso em que temos um número par de
observações: (Não leve mais de 10 minutos).
Actividade nº 4
Tamanho da Posição dos dados a somar
amostra (n) para obter a mediana

12 6º e 7º

10 ___ e ___

16 ___ e ___
Tempo de realização :
20 minutos. 20 ___ e ___

100 ___ e ___

112 ___ e ___

5012 ___ e ___

n ___ e ___

Tabela10: Determinação da posição dos valores a somar para determinação da mediana.


Caso n-par.

Procure valores hipotéticos para os primeiros 4 casos. Coloque os valores


em ordem crescente e verifique a posição daqueles que estão no centro.

Dica Procure uma regularidade e prove se essa regra pode ser usada para esses
casos. Por último, aplique a regra para os outros casos em que o tamanho
da amostra é maior.
42 Lição nº 3

Conclui-se portanto, para casos em que n é par que a mediana é obtida


colocando os dados em ordem crescente e achando a média dos dados
n n
centrais; cujas posições são e +1
2 2

O que acontece na determinação da mediana, quando o tamanho da


amostra é impar? Faça a actividade 7 para descobrir. Não leve mais do
que 10 minutos para a sua realização.

Determine a mediana do seguinte conjunto de dados (não se esqueça de


ordena-los primeiro):
14 12 7 9 12 10 15 9 11
Actividade nº 5 − Qual é o valor da mediana neste caso?
− Complete a seguinte tabela:

Tamanho da Posição dos dados a somar


amostra (n) para obter a mediana

11 6º

Tempo de realização : 15 ___


20 minutos.
31 ___

77 ___

101 ___

509 ___

10103 ___

n ___

Tabela 11: Determinação da posição dos valores a somar para determinação da mediana.
Caso n-impar.
Introdução à Estatística Ensino à Distância 43

Procure dados hipotéticos para os primeiros 3 casos. Observe a posição


do valor central. Procure uma regra que possa ser válida para estes casos.

Dica Verifique-a. Use essa regra para os restantes casos.

Concorda com a seguinte conclusão!

No caso em que n é impar a mediana é o valor central depois de ordenar


n
os dados. Neste caso a posição da mediana é +1
2

Moda

A moda é o valor mais frequente, mais típico ou mais comum numa


distribuição. Por exemplo ao afirmarmos que há mais pessoas do sexo
feminino em Moçambique do que as do sexo masculino, referimo-nos ao
género feminino como moda.

Determine a moda para o problema apresentado no início desta lição.

Actividade nº 6

Tempo de realização:
05 minutos.
44 Lição nº 3

A moda é o valor mais frequente.

Dica

A moda corresponde ao valor com maior frequência e não à frequência


deste valor. Casos há em que não há moda ou há mais que um valor da
moda.

Das medidas de localização discutidas anteriormente, a média é a medida


mais utilizada, embora, em certos casos, a utilização da mediana ou da
moda seja preferível.

• A média é muito sensível a valores extremos, isto é, valores


excessivamente maiores ou menores provocam variações
consideráveis ao serem incluídos ou excluídos do conjunto de
dados. Outro aspecto é que o cálculo da média em dados
nominais ou ordinais fornece-nos um resultado desprovido de
sentido, em que em geral não indica nenhuma tendência central.
É o caso por exemplo da média de uma distribuição de províncias
de um país ou da cor dos olhos.

• A mediana só pode ser obtida para dados quantitativos ou


ordinais, mas não para dados nominais. Não se pode por
exemplo, calcular a mediana do país de origem ou da filiação
religiosa.

• A moda revela a sua importância perante estudo de variáveis


nominais, já que tanto a média como a mediana não se podem
aplicar, mas esta pode ser aplicada a qualquer conjunto de dados
pois exige apenas uma contagem de frequências.
Introdução à Estatística Ensino à Distância 45

Sumário
A média aritmética é a medida mais usada na sumarização de dados. Ela

é determinada pela expressão x =


∑x i
. Para dados agrupados em
n
classes, xi não representa o valor observado, mas o ponto central da

classe. A mediana mostra-se mais robusta pois não é afectada por valores
extremos. A moda é a única medida de tendência central que pode ser
determinada quando se está perante dados nominais.

Exercícios

1. Seguidamente apresentam-se algumas estimativas para a


velocidade da luz, determinadas por Michelson em 1882

Auto-avaliação nº 3 (Statistics and Data Analysis, Siegel):

299,96 299,88 299,90 299,94 299,88

299,96 299,85 299,94 299,80 299,84

Determine as três medidas de tendência central.

2. A uma amostra de 8 estudantes vivendo em residências


universitárias pediu-se que classificasse, numa escala de 1 (um) a
Tempo de realização:
01:30 Horas. 7 (excelente) a qualidade das refeições servidas na residência.
Foram obtidos os seguintes resultados: 2, 4, 2, 3, 5, 4, 3, 2.

a) Encontre a classificação média dada pela amostra.

b) Calcule a mediana.

3. Num teste de automobilismo de distância e de consumo de


gasolina, 13 automóveis foram testados por 300 quilómetros em
estrada, nas mesmas condições de direcção na cidade e no campo.
Foram registados os seguintes dados para o desempenho em
milhas por galão.
46 Lição nº 3

Cidade: 16,2 16,7 15,9 14,4 13,2 15,3 16,8 16,0 16,1

15,3 15,2 15,3 16,2

Campo: 19,4 20,6 18,3 18,6 19,2 17,4 17,2 18,6 19,0

21,1 19,4 18,5 18,7

Use a média, mediana e a moda para comparar o desempenho na


condução na cidade e no campo.

4. A tabela abaixo apresenta as notas dos 35 estudantes de uma


determinada turma a Estatística:

NOTAS 0-5 5 - 10 10 - 15 15 - 20

N° DE ESTUDANTES 4 8 18 5

Tabele 12: Notas a estatística de 35 estudantes duma turma.

Determine a nota média.

5. Os 40 docentes de uma faculdade publicam em média 0,5 artigos


por ano, enquanto os 10 docentes de outra faculdade publicam,
em média, 3 artigos por ano. Quantos artigos publicam em média
os 50 docentes?

Feedback

Resolução dos exercícios de Auto-avaliação nº 3

1. x=
∑x i
=
2998,95
= 299,895
n 10

Moda: 299,96; 299,88 e 299,94.

~ 299,88 + 299,90
x= = 299,89
2
Introdução à Estatística Ensino à Distância 47

2. a) x=
∑x i
=
25
= 3,125
n 8

~ 3+3
b) x= =3
2

3.

Cidade Campo

Média 15,58 18,92

Mediana 15,9 18,7

Moda 15,3 18,6 e 19,4

Os resultados levam-nos a concluir que no campo foi possível


percorrer maiores distâncias que na cidade.

´4.

Notas fi xi xi f i

0–5 4 2,5 10

5–10 8 7,5 60

10–15 18 12,5 225

15–20 5 17,5 87,5

Total 35 - 412,5

412,5
x= = 11,8
35

0,5 × 40 + 3 × 10
5. x= =1
50
48 Lição nº 3

Leitura recomendada em relação a esta lição:

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003.

− GUIMARÃES E CABRAL. Estatística. Amadora. Mc graw Hill,


Leitura
1997.

− HOGG e TANIS. Probability and Statical Inference. New Jersey.


Prantice Hall, 2001

− LEVIN, Jack e FOX, James Alan. Estatística para ciências


humanas.São Paulo. Pearson Prentice Hall, 9 ª edição, 2004
Introdução à Estatística Ensino à Distância 49

Lição nº 4
Quartis e percentis. Diagrama de
extremos e quartis
Introdução
Anualmente, muitos cidadãos afluem à Universidade Pedagógica para
realizar exames de admissão aos cursos por ela fornecidos. Para o ano de
2007 por exemplo, concorreram para o curso de licenciatura em ensino de
Física na Delegação de Maputo, 459 candidatos para 50 vagas
50
disponíveis. Observe que estas vagas correspondem a × 100 ≈ 11% .
459
E é aí onde “entram” os percentis: para determinar até que nota
correspondem os melhores 11%, isto é, qual é o valor do percentil 89.

Esta lição deverá ser estudada em aproximadamente 2 horas.

Tempo de estudo da lição:


02:00 Hora

Ao completar esta lição, você será capaz de:

ƒ Determinar e interpretar os quartis e percentis.

ƒ Construir e interpretar o diagrama de extremos e quartis.


Objectivos ƒ
50 Lição nº 4

Quartil e percentil. Primeiro e terceiro quartis. Diagrama de extremos e


quartis.

Terminologia

Percentis

Sabe-se que a mediana divide um conjunto de dados em


aproximadamente 50-50%. Um percentil fornece a informação sobre
como os valores estão distribuídos ao longo do intervalo, do menor para o
maior. Os percentis dividem o conjunto de dados em 100 partes
aproximadamente iguais.

Consideremos os dados da tabela 2.4, que mostra as notas obtidas por 210
candidatos a um emprego. Suponha que a empresa irá admitir os
melhores 30% dos participantes no teste. Qual é a nota mínima a
Leitura
considerar?

Notas 8 9 10 11 12 13 14 16 17

Frequência 13 20 50 31 22 30 14 18 12

Tabela 14: Distribuição de frequência das notas dos candidatos a emprego.

Encontrar a nota mínima obtida pelos melhores 30% dos candidatos


equivale a retirar os primeiros 70%, ou seja, localizar o percentil 70. Nos
percentis, o conjunto de dados é dividido em 100 partes iguais. Sendo
assim, pode-se localizar qualquer percentil usando as frequências
relativas acumuladas:
Introdução à Estatística Ensino à Distância 51

xi 8 9 10 11 12 13 14 16 17

fi 13 20 50 31 22 30 14 18 12

Fr (%) 6,2 15,7 39,5 54,3 64,8 79,0 85,7 94,3 100,0

Tabela 15: Frequência absoluta e relativa acumulada das notas dos candidatos a emprego.

Como 70% só são atingidos depois do valor 12 que corresponde a uma


percentagem acumulada de 64,8%, o percentil 70% corresponde neste
caso ao valor 13, isto é P70 = 13 . É claro que em termos práticos a

empresa não poderá contratar todos os candidatos com a nota 13 visto que
eles perfazem 100% − 64,8% = 35,2% , valor maior que o desejado.

Uma alternativa ao procedimento apresentado anteriormente é o recurso à


posição. Sabe que neste caso o total das observações (210) corresponde a
100%. Pretende-se saber a quantas observações corresponderia 70%.
Usando a regra de três simples segue:

100% ––––––– 210

70% ––––––––– x

70 × 210
o que resulta em x = = 147 (posição 147, pois corresponde
100
aos primeiros 147 casos)

Duma forma geral, se i representa a posição do percentil desejado, p o


percentil desejado e n tamanho da amostra, temos que

pn
i= , com p = 1, 2, 3,..., 99.
100
52 Lição nº 4

Note que no cálculo da posição do percentil, dois casos podem ocorrer: O


resultado pode ser número natural ou decimal. Se o resultado é um
número natural, o percentil será a média do dado com esta posição e
seguinte. Se o resultado é decimal o percentil será o dado da posição
imediatamente seguinte.

70 × 210
Assim a posição do P70 é i = = 147. Sendo natural P70 será
100
dado pela média do 147°e 148°.

13 + 13
P70 = = 13.
2

Isto significa que a nota mínima a considerar é 13.

Ainda considerando os dados da tabela, calculemos o percentil 91.


91 × 210
i= = 191,1 . Sendo decimal, o percentil será dado pelo valor da
100
posição seguinte, neste caso 192°. P91 = 16 .

Quartis

Como o nome sugere, os quartis dividem a distribuição ou o conjunto de


dados em 4 partes aproximadamente iguais, contendo cada uma cerca de
1
ou aproximadamente 25% dos dados. Note que:
4

O primeiro quartil ( Q1 ) é igual ao percentil 25 ( P25 );

Q2 = P50 = Me; Q3 = P75 . Sendo assim, o procedimento para o cálculo


dos percentis será usado no cálculo dos quartis.

Por exemplo, calculando o Q1 com os dados da tabela 9, teremos:

25 × 210
i= = 52,5 → 53o Q1 = 10
100
Introdução à Estatística Ensino à Distância 53

Diagrama de extremos e quartis (box-plot)

Um diagrama que ilustra muito bem a distribuição dos dados é o


diagrama de extremos e quartis. São medidas importantes para a sua
construção: mediana, Q1 e Q3.

Acompanhe o exemplo seguinte que mostra a construção de um diagrama


de extremos e quartis com base nos dados referentes ao número de
passageiros transportados pelo autocarro em cada um dos percursos
Leitura
efectuados durante um dia:

30 78 38 44 65 52 28 34 46 50 61 84 44

Ordenando os dados, segue-se:

28 30 34 38 44 44 46 50 52 61 65 78 84.

13 + 1
i= = 7 → Me = 46
A posição da mediana para n impar é 2

A posição do primeiro e terceiro Quartil é dada por


13 3 × 13
i= = 3,25 → 4 e i = =→ 9,75 → 10 respectivamente.
4 4
Então Q1 = 38 e Q3 = 61
54 Lição nº 4

90

80

70

60

50

40

30

20
N. de passageiros

Figura 10: Diagrama de extremos e quartis.

Principalmente na inferência estatística, o diagrama de extremos e quartis


é usado na identificação de “valores estranhos”. São valores
excessivamente menores ou maiores que influenciam grandemente a
média. Neste caso, ao invés do valor mínimo e máximo, usa-se como
limites a amplitude interquartil multiplicada por 1,5; como ilustra a figura
1.8.

95
90
85 Valor máximo
80
75
70
65
3º Quartil
60
55 25% dos
dados
50
Mediana
45 25% dos
40 dados
1º Quartil
35
30 Valor mínimo

25
20

Figura 11: Diagrama de extremos e quartis para a identificação de valores estranhos.


Introdução à Estatística Ensino à Distância 55

AIQ × 1,5

Q 1

25% dos Dados

Me

25% dos Dados

Q 3

AIQ × 1,5

Figura 12: Esquema da construção dum diagrama de extremos e quartis, identificando


valores estranhos.

Sumário
Quartis e percentis são medidas usadas para localizar valores numa certa
distribuição. Os percentis pressupõem a divisão dos dados em 100 partes,
enquanto que os quartis, uma divisão do conjunto de dados em 4 partes.

De salientar ainda que:

Mediana = Segundo Quartil = Percentil 50

Primeiro Quartil = Percentil 25

Terceiro Quartil = Percentil 75


56 Lição nº 4

Exercícios

Um relatório avalia modelos de carros com base no número de


reclamações de seguro preenchidas após os acidentes. Os índices

Auto-avaliação nº 4 avaliados próximos de 100 são considerados médios. Avaliações menores


são melhores, indicando um modelo de carro mais seguro. A seguir são
mostradas avaliações para 20 carros de tamanho médio e 20 carros
pequenos:

Carros médios: 81 91 93 127 68 81


Tempo de realização: 60 51 58 75 100 103 119 82
01:00 Hora. 128 76 68 81 91 82

Carros pequenos: 73 100 127 100 124 103


119 108 109 113 108 118 103 120
102 122 96 133 80 140

a) Mostre os boxplots para os carros de tamanho médio e


pequeno.

b) Faça um relatório sobre o que os números indicam acerca


da segurança dos carros médios em comparação com os
pequenos.
Introdução à Estatística Ensino à Distância 57

Feedback
Resolução da auto-avaliação 4

a)

Pequenos
Médios

60 70 80 90 100 110 120 130 140 150

b) Os números indicam que os carros médios são mais seguros em


comparação com os pequenos uma vez que apresentam 75% das
avaliações menores que 100.

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003.

Leitura − GUIMARÃES E CABRAL. Estatística. Amadora. Mc graw Hill,


1997.

− HOGG e TANIS. Probability and Statical Inference. New Jersey.


Prantice Hall, 2001
58 Lição nº 5

Lição nº 5
Medidas de Dispersão
Introdução
Suponha que a quantidade de sangue (em litros) disponível em dois
hospitais distritais, numa dada semana, distribui-se como se segue:

Dias de semana Hospital A Hospital B

Segunda-feira 45 46

Terça-feira 70 48

Quarta-feira 80 54

Quinta-feira 26 50

Sexta-feira 32 49

Sábado 63 48

Domingo 34 55

Tabela 16: Disponibilidade de sangue em dois hospitais distritais.

Suponha ainda que pretende levar um doente para uma intervenção


cirúrgica que necessite de transfusão de sangue. Que hospital pode
preferir? Justifique.

Á partida é de preferir o hospital com média maior pois significa isso que
este dispõe de maior quantidade de sangue diário em termos globais do
que aquele. Como se pode observar, a quantidade média de sangue
semanal para os dois hospitais é a mesma:

350 350
Hospital A x= = 50 l Hospital B y= = 50 l
7 7
Introdução à Estatística Ensino à Distância 59

Uma vez que a quantidade média de sangue disponível semanalmente é a


mesma, há que recorrer a outras ferramentas para escolher de entre os
dois aquele que mais lhe assegure confiança em termos de
disponibilidade de sangue.

Procure explicar porque é que o hospital B se mostra para a situação


descrita em vantagem em relação ao hospital A.

Vê-se, pois, que não bastam as medidas de tendência central para analisar
uma distribuição. Há que ter em conta a dispersão ou a variabilidade dos
dados.

Nesta lição discutem-se as medidas de variabilidade comummente


usadas.

Esta lição deverá ser estudada em aproximadamente 1 hora.

Tempo de estudo da lição:


01:00 Hora

Ao completar esta lição, você será capaz de:

ƒ Diferenciar as medidas de dispersão das medidas de tendência central.

ƒ Determinar a amplitude total, a amplitude interquartil, o desvio médio,


Objectivos a variância, o desvio padrão e o coeficiente de variação.
ƒ

ƒ Medidas de variação (dispersão), amplitude total, amplitude


interquartil, desvio médio, variância, desvio padrão e coeficiente de
variação.
Terminologia
60 Lição nº 5

Foram retiradas amostras de carvão duma mina e analisada a percentagem


de carbono que continham. Os resultados, em percentagem, foram os
seguintes:
Exemplo 4

81 80 79 79 80 80 77 81 77 80 81 80 77 81 83

80 84 80 82 79 80 83 79 82 75 81 79 82 77 81

Caracterize a dispersão deste conjunto de dados.

Uma das medidas mais simples de dispersão é a amplitude total. A


Amplitude total (A)
amplitude total é a diferença dos valores máximo e mínimo observados:

A = 84 − 75 = 9

A = x máx − x min

Como se pode ver, a amplitude total depende apenas dos valores


Amplirude interquartil
(AIQ)
extremos. A amplitude interquartil supera a dependência dos valores
extremos. É definida como a diferença entre o terceiro e o primeiro
Quartil.

Para o caso em discussão: Q1 = 79 , Q3 = 81 e consequentemente

AIQ = 81 − 79 = 2

AIQ = Q3 − Q1

O desvio médio usa todos os dados. Para a sua determinação é necessário


Desvio médio (DM)
calcular primeiro o que se chama desvio: a diferença entre cada valor
observado e o valor médio.

2400
x= = 80
30
Introdução à Estatística Ensino à Distância 61

xi fi xi f i xi − x
75 1 75 -5
77 4 308 -3
79 5 395 -1
80 8 640 0
81 6 486 1
82 3 246 2
83 2 166 3
84 1 84 4
Total 30 2400 -
Tabela 17: Determinação dos desvios para as amostras de carvão.

Nos próximos 5 minutos no máximo, faça a actividade seguinte. Ela


ajudá-lo-á a mostrar que a soma dos desvios em relação à média é zero.

Some os valores dos desvios considerando as frequências, isto é,


(−5) × 1 + (−3) × 4 + ...
Surpreendido com o resultado? Tente explica-lo!
Actividade 7

Tempo de realização:
05 minutos.

A soma dos desvios em relação à média é nula.

Dica
62 Lição nº 5

Há duas maneiras de fazer com que a soma dos desvios não seja nula.
Sabe quais são?

Uma via é determinar o módulo dos desvios, obtendo-se desta maneira o


desvio médio. A outra é elevar os desvios ao quadrado, obtendo-se a
variância.

xi f i xi − x xi − x xi − x f i
xi fi
75 1 75 -5 5 5
77 4 308 -3 3 12
79 5 395 -1 1 5
80 8 640 0 0 0
81 6 486 1 1 6
82 3 246 2 2 6
83 2 166 3 3 6
84 1 84 4 4 4
Total 30 2400 - - 44
Tabela 18: Determinação do desvio médio para as amostras de carvão.

44
DM = = 1,47
30

DM =
∑x i − x fi
n

Como referi anteriormente para o cálculo da variância há que elevar os


Variância ( σ )
2
desvios ao quadrado

xi f i xi − x ( xi − x ) 2 ( xi − x ) 2
xi fi
75 1 75 -5 25 25
77 4 308 -3 9 36
79 5 395 -1 1 5
80 8 640 0 0 0
81 6 486 1 1 6
82 3 246 2 4 12
83 2 166 3 9 18
84 1 84 4 16 16
Total 30 2400 - - 118
Tabela19: Determinação da variância para as amostras de carvão
Introdução à Estatística Ensino à Distância 63

118
σ2 = = 3,93
30

σ2 =
∑ (x i − x)2 fi
n

Note-se que as unidades associadas com a variância frequentemente


causam confusão. Como os valores que estão sendo somados no cálculo
são elevados ao quadrado, as unidades associadas são também elevadas
ao quadrado. Por exemplo, para o nosso caso, a variância é 3,93 % 2 , o
que torna difícil um entendimento e uma interpretação intuitivos do valor
numérico da variância. Recomenda-se que se pense na variância como
medida útil para se comparar a quantidade da variabilidade de duas ou
mais variáveis. Em tal comparação de variáveis, aquela com variância
maior tem maior variabilidade.

O desvio padrão é a raiz quadrada da variância. Note que é expressa nas


(Desvio padrão ( σ ) mesmas unidades da variável., o que facilita a sua interpretação.

σ = 3,93 = 1,98

σ= σ = 2 ∑ (x i − x)2 fi
n

Em algumas situações podemos estar interessados em medir o tamanho


Coeficiente de variação
(CV)
do desvio padrão em relação à média. Essa medida é chamada de
coeficiente de variação.

1,98
CV = × 100% = 2,5%
80

σ
CV = × 100 %
x

Esta medida tem uma grande utilidade quando se pretende comparar a


dispersão entre distribuições de variáveis que se expressam em unidades
64 Lição nº 5

diferentes, ou de variáveis expressas nas mesmas unidades mas com


médias diferentes. A dispersão será mais acentuada na distribuição que
apresentar maior coeficiente de variação.

Sumário
As medidas de dispersão são usadas para comparar a variabilidade entre
dois ou mais conjuntos de dados. O conjunto que apresenta menor valor
da dispersão significa que neste os valores estão mais concentrados (ou
menos dispersos) em relação àquele. As mais usadas são:

Variância: σ 2 =
∑ (x i − x)2 fi
n

Desvio padrão: σ = σ 2
=
∑ (x i − x)2 fi
,e
n

σ
Coeficiente de variação: CV = × 100 %
x

Exercícios
1. Considere as quatro populações seguintes:

(i) 1, 2, 3, 4, 5, 6, 7, 8;
Auto-avaliação nº 5 (ii) 1, 1, 1, 1, 8, 8, 8, 8;
(iii) 1, 1, 4, 4, 5, 5, 8, 8;
(iv) -6, -3, 0, 3, 6, 9, 12, 15.

Nos quatro casos a média é a mesma (4,5). Sem fazer cálculos, ordene
as populações de acordo com as magnitudes das suas variâncias, da
menor para a maior. Confirme o seu ordenamento, calculando as
Tempo de realização: variâncias.
02:00 Horas.
Introdução à Estatística Ensino à Distância 65

2. Na companhia A a média dos salários é 10000 unidades e o 750


percentil é 5000. Responda justificando as questões seguintes:

a) Se você se apresentasse como candidato a essa firma e se


o seu salário fosse escolhido ao acaso entre todos os
possíveis salários, o que seria mais provável: ganhar
mais ou menos que 5000 unidades?
b) Suponha que na companhia B a média dos salários é
7000 unidades e a variância é praticamente zero, e lá o
seu salário também seria escolhido ao acaso. Em que
companhia você se apresentaria para procurar emprego?

3. Os 40 estudantes de uma determinada turma obtiveram, numa


escala de 1 a 5, a seguinte classificação a um dos seus professores:

CLASSIFICAÇÃO 1 2 3 4 5

N° DE ESTUDANTES 1 7 15 10 7

Tabela 21: Classificação dada ao professor por um grupo de alunos.

a) Calcule a classificação média;

b) Calcule a variância e o desvio padrão;

4. Para os seguintes dados relativos à notas (0 a 10) dos alunos de


um curso de Física, use o coeficiente de variação para comparar a
dispersão nas três turmas.

Turma A 3 4 4 5 6 7 8 8 9

Turma B 3 4 4 4 5 5 5 6 -

Turma C 3 4 4 5 5 5 5 6 -

Tabela 22: Notas dos estudantes de três turmas de física.


66 Lição nº 5

Feedback
Resolução de exercícios da auto-avaliação:

1.a) Ordenamento: I, II, III, IV.

Confirmação pelo cálculo das variâncias:

I
xi xi − x ( xi − x ) 2
1 -3,5 12,25
2 -2,5 6,25
3 -1,5 2,25
4 -0,5 0,25
5 0,5 0,25
6 1,5 2,25
7 2,5 6,25
8 3,5 12,25
36 - 42

σ2 =
∑ (x i − x)2
=
42
= 5,25
n 8

II
xi xi − x ( xi − x ) 2
1 -3,5 12,25
1 -3,5 12,25
4 -0,5 0,25
4 -0,5 0,25
5 0,5 0,25
5 0,5 0,25
8 3,5 12,25
8 3,5 12,25
36 - 50

σ 2
=
∑ (x i − x)2
=
50
= 6,25
n 8
Introdução à Estatística Ensino à Distância 67

III
xi xi − x ( xi − x ) 2
1 -3,5 12,25
1 -3,5 12,25
1 -3,5 12,25
1 -3,5 12,25
8 3,5 12,25
8 3,5 12,25
8 3,5 12,25
8 3,5 12,25
36 - 98

σ2 =
∑ (x i − x)2
=
98
= 12,25
n 8

IV
xi xi − x ( xi − x ) 2
-6 -10,5 110,25
-3 -7,5 56,25
0 -4,5 20,25
3 -1,5 2,25
6 1,5 2,25
9 4,5 20,25
12 7,5 56,25
15 10,5 110,25
36 - 378

σ 2
=
∑ (x i − x)2
=
378
= 47,25
n 8

2.a) É provável que ganhe menos de 5 000 uma vez que 75% dos
salários são iguais ou inferiores a esse valor.

2b) Tendo em conta o salário a auferir crei que me apresentaria na


companhia B, porque como a variância é praticamente nula, os salários
estão próximos.
68 Lição nº 5

3.

xi fi xi f i xi − x ( xi − x ) 2 ( xi − x ) 2 f i
1 1 1 -2,375 5,640625 5,640625
2 7 14 -1,375 1,890625 13,23438
3 15 45 -0,375 0,140625 2,109375
4 10 40 0,625 0,390625 3,90625
5 7 35 1,625 2,640625 18,48438
Total 40 135 - - 43,375

3a) x=
∑x i fi
=
135
= 3,375
n 40

3b) σ2 =
∑ (x i − x)2
=
43,375
≈ 1,08
n 40

σ = σ 2 = 1,08 ≈ 1,04

4.
Turma A
xi xi − x ( xi − x ) 2
3 -3 9
4 -2 4
4 -2 4
5 -1 1
6 0 0
7 1 1
8 2 4
8 2 4
9 3 9
54 - 36

x=
∑x i fi
=
54
=6
n 9

σ=
∑ (x i − x)2
=
36
=2
n 9
σ 2
CV = × 100% = × 100% ≈ 33,3
x 6
Introdução à Estatística Ensino à Distância 69

Turma B
xi xi − x ( xi − x ) 2
3 -1,5 2,25
4 -0,5 0,25
4 -0,5 0,25
4 -0,5 0,25
5 0,5 0,25
5 0,5 0,25
5 0,5 0,25
6 1,5 2,25
36 6

x=
∑x i
=
36
= 4,5
n 8

σ=
∑ (x i − x)2
=
6
≈ 0,87
n 8
σ 0,87
CV = × 100% = × 100% ≈ 19,3
x 4,5

Turma C
xi xi − x ( xi − x ) 2
3 -1,625 2,640625
4 -0,625 0,390625
4 -0,625 0,390625
5 0,375 0,140625
5 0,375 0,140625
5 0,375 0,140625
5 0,375 0,140625
6 1,375 1,890625
37 5,875

x=
∑x i fi
=
37
=,625
n 8

σ=
∑ (x 5,875
i − x)2
≈ 0,86 =
n 8
σ 0,86
CV = × 100% = × 100% ≈ 18,6
x 4,625

A turma C apresenta um menor valor de coeficiente de variação, o que


significa que têm menor dispersão.
70 Lição nº 5

Leia ainda:

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003.

Leitura − GUIMARÃES E CABRAL. Estatística. Amadora. Mc graw Hill,


1997.

− HOGG e TANIS. Probability and Statical Inference. New Jersey.


Prantice Hall, 2001
Introdução à Estatística Ensino à Distância 71

Lição nº 6
Coeficiente de correlação
Introdução
Até aqui usamos medidas descritivas para sintetizar dados para uma
variável de cada vez. Frequentemente, para tomar uma decisão precisa e
analisar o comportamento de duas ou mais variáveis simultaneamente é
usado o coeficiente de correlação. Por exemplo, na determinação
experimental da lei de Ohm, num laboratório, os estudantes realizaram
várias experiências para estudar esta lei. Variando a diferença de
potencial, eles fazem a leitura do valor da intensidade I.

O foco nesta lição é verificar a existência de alguma relação entre duas


vaiáveis e medir a sua intensidade através do coeficiente de correlação.

Esta lição deverá ser estudada em aproximadamente 1 hora.

Tempo de estudo da lição:


01:00 Hora

Ao completar esta lição, você será capaz de:

ƒ Distinguir o tipo de relação (se existir) entre duas variáveis;


ƒ Construir e interpretar o diagrama de dispersão;
ƒ Determinar e interpretar a covariância e o coeficiente de correlação.
Objectivos
72 Lição nº 6

Relação positiva e negativa, diagrama de dispersão, covariância,


coeficiente de correlação (de Person)

Terminologia

Considere que o gerente de uma loja está interessado em analisar a


relação entre o número de anúncios mostrados durante o fim de semana
na televisão local e as vendas na loja durante a semana seguinte. Para isso
Exemplo 5
ele recolhe os seguintes dados:

Número de 2 5 1 3 4 1 5 3 4 2
anúncios

Volume de 50 57 41 54 54 38 63 48 59 46
vendas(US$1
00)
Tabela 23: Volume de vendas em função do número de anúncios feitos.

Vamos estudar, tomando como exemplo este caso, a relação entre as duas
variáveis: Número de anúncios ( xi ) e volume de vendas ( y i ) .

Um dos primeiros passos que pode ser dado na análise da relação entre
Diagrama de Dispersão
duas variáveis é a construção do diagrama de dispersão. O diagrama de
dispersão é um gráfico de pontos. Constrói-se fazendo corresponder
através de pontos o número de anúncios ( xi ) ao valor correspondente do

volume de vendas ( y i ).
Introdução à Estatística Ensino à Distância 73

Complete o diagrama de dispersão seguinte, marcando pontos em falta de


acordo com a tabela. Não leve mais que 5 minutos para esta actividade.

Actividade 9

Tempo de realização:
10 minutos.

Figura 12: Diagrama de dispersão para a relação número de anúncios e volume de vendas.

Para obter o diagrama de dispersão una por meio de pontos os valores de


x e y.

Dica

O diagrama de dispersão permite ver se existe alguma relação entre as


variáveis, identificando a equação que a descreve adequadamente.

A relação entre as variáveis pode ser positiva (a um aumento dos valores


de uma variável corresponde também um aumento nos valores da outra
variável) ou negativa (um aumento dos valores de uma variável
corresponde a uma diminuição dos valores da outra).
74 Lição nº 6

Com base no diagrama acima, que tipo de relação existe entre o número
de anúncios e o volume de vendas?

Actividade nº 10

Tempo de realização:
02 minutos.

A relação pode ser positiva ou negativa, dependendo da tendência dos


pontos que pode ser crescente ou decrescente.

Dica

Como o gráfico mostra uma tendência crescente, a relação entre as duas


variáveis é positiva. Para confirmar este facto calculemos a covariância,
medida descritiva de associação linear entre as variáveis.
Introdução à Estatística Ensino à Distância 75

Complete a tabela seguinte, auxiliar para o cálculo da covariância para o


caso apresentado acima. O tempo reservado é de 20 minutos.

Actividade nº 11

xi yi xi − x yi − y ( xi − x )( yi − y )

2 50

5 57

1 41
Tempo de realização :
20 munitos. 3 54

4 54

1 38

5 63

3 48

4 59

2 46

Total

Tabela 24: Tabela auxiliar para o cálculo da covariância.

Divida a soma (total) de ( xi − x )( yi − y ) por n (n = 10) para obter a

covariância.
Dica

sxy =
∑ ( x − x )( y
i i − y)
Covariância ( s xy ) n
76 Lição nº 6

O valor positivo da covariância indica que existe uma relação positiva


entre as variáveis. No entanto o seu valor numérico depende das unidades
de medida de x e y. Por exemplo, suponhamos que estamos interessados
na relação entre a altura x e o peso y para os indivíduos. Obviamente, a
intensidade da relação deverá ser a mesma medindo a altura em
centímetros ou em metros. Quando a altura é medida em centímetros,
teremos valores numéricos maiores para ( xi − x ) do que em metros.

Assim, para a altura medida em centímetros, teremos um valor maior para


Coeficiente de correlação
o numerador ∑ (x i − x )( yi − y ) e portanto uma maior covariância,
quando de facto não há diferença na relação. Uma medida de relação
entre variáveis que evita essa dificuldade é o coeficiente de correlação.

Continue o preenchendo da tabela seguinte para a determinação do


coeficiente de correlação:

Actividade nº 12

xi − x yi − y ( xi − x )( yi − y ) ( xi − x )2 ( yi − y )2

-1 -1 1

2 6 12

-2 -10 20
Tempo de realização: 0 3 0
30 minutos.
1 3 3

-2 -13 26

2 12 24

0 -3 0

1 8 8

-1 -5 5

- - 99

Tabela 25: Tabela auxiliar para a determinação do coeficiente de correlação


Introdução à Estatística Ensino à Distância 77

Determine o desvio padrão de x e y.

Determine o coeficiente de correlação dividindo a covariância pelo


Dica produto dos desvios padrão de x e y.

rx , y =
s xy
=
∑ ( x − x )( y − y )
i i

sx s y ∑ (x − x ) ∑ (y − y )
i
2
i
2

O coeficiente de correlação varia entre -1 a 1. Valores próximos dos


extremos indicam uma associação forte entre as variáveis. Alguns autores
convencionam que:

0 < rxy < 0,2 ou -0,2 < rxy < 0 Associação muito baixa;

0,2 ≤ rxy < 0,4 ou -0,4 < rxy ≤ -0,2 Associação baixa;

0,4 ≤ rxy < 0,7 ou -0,7 < rxy ≤ -0,4 Associação moderada;

0,7 ≤ rxy < 0,9 ou -0,9 < rxy ≤ -0,7 Associação forte;

0,9 ≤ rxy <1 ou -0,9 ≤ rxy <1 Associação muito forte.

Sumário
Um dos primeiros passos na análise da relação entre duas variáveis é a
construção do diagrama de dispersão. Este pode indicar uma relação
linear, quadrática, logarítmica, exponencial etc, dependendo da
disposição dos pontos.

Uma relação pode ser positiva ou negativa. Numa relação positiva, o


aumento dos valores de uma variável, correspondea uma tendência de
aumento dos valores da outra. Quando a relação é negativa, ao aumento
78 Lição nº 6

dos valores de uma, corresponde uma tendência decrescente dos valores


da outra.

O coeficiente de correlação é uma medida descritiva que avalia o tipo e a


intensidade (magnitude) de uma relação. A expressão matemática para a

sua determinação é: rx , y =
s xy
=
∑ ( x − x )( y − y )
i i
.
sx s y ∑ (x − x ) ∑ (y − y )
i
2
i
2

Exercícios

1. Que tipo de correlação (positiva/negativa) espera encontrar


entre:

Auto-avaliação nº 6 a) Nota a Física e Nota a Matemática.

b) Nota a estatística e altura do estudante.

c) Nível económico da mulher e taxa de divórcios.

d) Nível de consumo e salário.

e) Altura e peso.
Tempo de realização : f) Preço do produto e nível de consumo do mesmo.
02:00Horas.
2. Cinco observações tomadas para duas variáveis são apresentadas
a seguir:

xi 4 6 11 3 16

yi 50 50 40 60 30

Tabela 26: Dados de duas variáveis.

a) Desenvolva um diagrama de dispersão com x no eixo


horizontal.
b) O que é que o diagrama indica sobre a relação entre as
duas variáveis?
c) Calcule e interprete a covariância da amostra.
d) Calcule e interprete o coeficiente de correlação da
amostra
Introdução à Estatística Ensino à Distância 79

3. Mediu-se a altura de uma amostra de 5 meninos (em polegadas)


na idade de 4 anos e novamente na idade de 18 anos. Os
resultados obtidos são apresentados a seguir:

Altura na Idade de 4 anos 40 43 40 40 42

Altura na Idade de 6 anos 68 74 70 68 70

Tabela 27: Altura de uma amostra de meninos aos 4 e 6 anos.

Determine o coeficiente de correlação entre as duas categorias de alturas.

4. Um comerciante de temperos está curioso sobre a grande


variação nas vendas de loja para loja e acha que o volume das vendas está
associado ao espaço nas prateleiras dedicados a sua linha do produto em
cada ponto de venda. Dez lojas foram seleccionadas ao acaso em todo
país e duas variáveis foram medidas: (x) total de espaço em frente
(comprimento x altura em cm 2 ) dedicados a sua linha de produtos e (y)
total das vendas dos produtos em meticais no último mês.

x 340 230 405 325 280 195 265 300 350 310
y 71 65 83 74 67 56 57 78 84 65
Tabela 28: Espaço ocupado por uma linha de produtos em função das vendas.

Construa um diagrama de dispersão e determine o coeficiente de


correlação.

Feedback
Resolução dos exercícios de auto-avaliação

1.

a) Relação positiva. (Em geral estudantes com boas notas a


matemática, tem tido boas notas também a física).
80 Lição nº 6

b) Não existe nenhuma relação. (Há pessoas altas com


notas altas, mas também há pessoas altas com notas baixas. O
mesmo acontece com pessoas com estatura média ou·
baixa).

c) Relação positiva (Em geral quanto mais


economicamente estável estiverem as mulheres maior será a
tendência para a separação)

d) Relação Positiva (quanto maior for o salário, maior será


o nível de consumo)

e) Relação Positiva (Geralmente, a maior altura


corresponde um peso maior. Note que a parte do corpo que
contribui grandemente para o peso são os ossos e portanto os
altos têm ossos longos)

f) Relação negativa (Geralmente, quando o preço aumenta


o nível de consumo diminui).

2.b) O diagrama de dispersão mostra uma relação negativa.

xi yi xi − x yi − y ( xi − x )( yi − y ) ( xi − x )2 ( yi − y )2

4 50 -4 4 -16 16 16
6 50 -2 4 -8 4 16
11 40 3 -6 -18 9 36
3 60 -5 14 -70 25 196
16 30 8 -16 -128 64 256
40 230 - - -240 118 520

c)

s xy =
∑ (x i − x )( y i − y )
=
− 240
= −48
n 5
A covariância confirma a existência duma relação negativa entre as duas
variáveis.
Introdução à Estatística Ensino à Distância 81

d)

rx , y =
∑ ( x − x )( y − y )
i i
=
− 240
≈ −0,97
∑ (x − x ) ∑ (y − y )
i
2
i
2
118 × 520

O coeficiente de correlação indica que existe uma relação negativa e


muito forte entre as duas variáveis.

3.

xi yi xi − x yi − y ( xi − x )( yi − y ) ( xi − x )2 ( yi − y )2

40 68 -1 -2 2 1 4

43 74 2 4 8 4 16

40 70 -1 0 0 1 0

40 68 -1 -2 2 1 4

42 70 1 0 0 1 0

205 350 - - 12 8 24

rx , y =
∑ ( x − x )( y − y )
i i
=
12
≈ 0,87
∑ (x − x ) ∑ (y − y )
i
2
i
2
8 × 24

4.

xi yi xi − x yi − y ( xi − x )( yi − y ) ( xi − x )2 ( yi − y )2

340 71 40 1 40 1600 1
230 65 -70 -5 350 4900 25
405 83 105 13 1365 11025 169
325 74 25 4 100 625 16
280 67 -20 -3 60 400 9
195 56 -105 -14 1470 11025 196
265 57 -35 -13 455 1225 169
300 78 0 8 0 0 64
350 84 50 14 700 2500 196
310 65 10 -5 -50 100 25
3000 700 - - 4490 33400 870
82 Lição nº 6

rx , y =
∑ ( x − x )( y − y )
i i
=
4490
≈ 0,83
∑ (x − x ) ∑ (y − y )
i
2
i
2
33400 × 870

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003.

Leitura − GUIMARÃES E CABRAL. Estatística. Amadora. Mc graw Hill,


1997.

− HOGG e TANIS. Probability and Statical Inference. New Jersey.


Prantice Hall, 2001
Introdução à Estatística Ensino à Distância 83

Lição nº 7
Regressão linear simples
Introdução
A pergunta que agora se pode colocar em relação à questão do número de
comerciais e o volume de vendas é a seguinte: De que maneira poderão
comportar-se as vendas, se durante o final de semana passar 6 vezes o
anúncio? Há, neste caso, que encontrar uma relação que possa estimar o
volume de vendas com base no número de comerciais mostrados no final
de semana. Esta técnica chama-se análise da regressão.

Esta lição deverá ser estudada em aproximadamente 1 hora.

Tempo de estudo da lição:


01:00 Hora

Ao completar esta lição, você será capaz de:

ƒ Determinar a equação de regressão linear simples

ƒ Estimar o valor da variável dependente com base no modelo de


Objectivos regressão linear simples

ƒ Interpretar os coeficientes da equação de regressão linear simples

ƒ Determinar e interpretar o coeficiente de determinação.

Equação da regressão linear simples, método dos mínimos quadrados,


taxa de variação, coeficiente de determinação

Terminologia
84 Lição nº 7

Como o diagrama de dispersão em relação aos dados da tabela 23 mostra,


Regressão linear simples uma relação aproximadamente linear entre as variáveis, pode-se estimar
numa recta para prever o comportamento de vendas (y) quando o número
de anúncios (x) varia.

A equação da recta é dada por y = ax + b . O modelo de regressão linear

simples expressa-se como y = ax + b + e . Onde “e” é a variável residual


que descreve os efeitos de y não explicados por x.

Como se pode notar, entre os pontos do diagrama podem ser traçadas


várias rectas. A recta traçada pelo método dos mínimos quadrados é
aquela cujas distâncias entre a recta estimada e os valores observados são
mínimos; mais exactamente, fornece valores de a e b que minimizam a
soma dos quadrados dos desvios entre os valores observados e os
estimados da variável dependente, isto é, procura a e b tal que minimizam

∑(y
2
a soma i − yˆ ) ; onde ŷ é o valor estimado.

Usando este método, os valores de a e b são:

a=
s xy
=
∑ ( x − x )( y − y ) .
i 1
b = y − ax
s 2
x ∑ (x − x)
i
2

Usando as fórmulas acima, determine os coeficientes a e b e componha a


equação de regressão, substituindo os valores encontrados na equação
y = ax + b . Use os resultados da tabela 25.da lição anterior, 20 minutos
Actividade nº 13
são suficientes para esta actividade.

Tempo de realização :
20 minutos.
Introdução à Estatística Ensino à Distância 85

Para 6 comerciais; y = 36,15 + 4,95 × 6 = 65,85

A questão agora é: Qual é a eficácia com que essa equação aproxima os


Dica dados? Essa medida é o coeficiente de determinação:

R 2 = rxy2

Para o caso dos dados da tabela 23:

R 2 = 0,932 = 0,8649

O que significa que apenas 86 % da variação das vendas é explicada pela


variação do número de anúncios. Os restantes 14% podem ser explicados
por outras variáveis ligadas às vendas, como por exemplo a renda.

Hipóteses do modelo de regressão linear

A utilização do modelo de regressão linear simples carece da verificação


das seguintes hipóteses:

1. Linearidade do fenómeno em estudo;

2. Para cada valor fixo da variável independente, a variável


dependente tem uma distribuição normal com média b + ax e

variância constante σ 2 ;

3. As observações de y são independentes umas das outras;

4. Os resíduos têm distribuição normal, com média zero e variância


constante σ 2 ;

5. As variâncias aleatórias residuais referentes a duas observações


diferentes não estão correlacionadas, sendo portanto
independentes entre si. Deste modo a sua covariância é zero.
86 Lição nº 7

Sumário
Quando o diagrama de dispersão sugere uma relação linear entre duas
variáveis, torna-se possível construir um modelo de regressão linear para
estimar os valores da variável dependente para um dado valor da variável
independente. Pode-se também discutir modelos que não sejam os da
regressão linear simples, caso por exemplo do modelo quadrático,
exponencial, etc.

O coeficiente de determinação fala do poder explicativo do modelo, isto


é, até que ponto a variação da variável dependente é explicada pela
variação da variável independente. Hoje em dia discute-se muito a
regressão múltipla, em que se constrói um modelo linear, com mais de
uma variável independente.

Exercícios
1. De acordo com algumas teorias, o consumo de quantidades
moderadas de vinho tinto reduziria o perigo de ataques cardíacos.

Auto-avaliação nº 7 Num estudo em que se envolveu 19 países desenvolvidos, em


1989, obteve-se a seguinte equação de regressão: y = 260,56 –
22,969x. y – Taxa de mortalidade por ataque cardíaco; é o
número de habitantes mortos por 100000 habitantes; x – número
de litros de vinho consumidos por habitante.

a) Trace a recta de regressão (recta da equação linear dada).

Tempo de realização : b) Estime a taxa de mortalidade por ataque cardíaco num


01:00 hora. país em que se consome em média 5 litros.

c) Se o consumo sobe 1 litro o que acontece com a taxa de


mortalidade?
Introdução à Estatística Ensino à Distância 87

2. Uma companhia estabeleceu diferentes preços para 8 regiões


diferentes; A tabela abaixo mostra o número de aparelhos
vendidos em unidades e o preço correspondente em centenas de
dólares.

Vendas 420 380 350 400 450 380 450 420

Preço 5,5 6,0 6,5 6,0 5,0 6,5 4,5 5,0

Tabela 29: Vendas em função do preço praticado de aparelhos em oito regiões.

a) Estime a equação de regressão linear das vendas pelo

preço. (Vendas - x, Preço - y)

b) Qual o efeito que se espera nas vendas quando o preço


sobe 100,0?

3. Os dados que se seguem indicam a relação existente entre x, que


representa a densidade específica duma amostra de madeira, e y,
que representa a pressão máxima que a referida amostra pode
suportar.

xi yi
0,41 1850
0,46 2620
0,44 2340
0,47 2690
0,42 2160
0,39 1760
0,41 2500
0,44 2750
0,43 2730
0,44 3120
Tabela 30: Dados duma amostra de madeira

a) Trace o gráfico referente aos dados.


b) Estime os coeficientes de regressão.
c) Preveja a pressão que uma amostra de madeira suporta
quando a sua densidade específica é de 0.43.
88 Lição nº 7

Feedback

Resolução da Auto-avaliação
1.a)

b) y = 260,56 − 22,969 x : y = 260,56 – 22,969x


y = 260,56 − 22,969 × 5
y = 260,56 − 114,845
y = 145,715

c) Se o consumo sobe um litro, a taxa de natalidade baixa 22,969.

2.

xi yi xi − x yi − y ( xi − x )( yi − y ) ( xi − x )2 ( yi − y )2

5,5 420 -0,125 13,75 -1,71875 0,015625 189,0625


6 380 0,375 -26,25 -9,84375 0,140625 689,0625
6,5 350 0,875 -56,25 -49,2188 0,765625 3164,063
6 400 0,375 -6,25 -2,34375 0,140625 39,0625
5 450 -0,625 43,75 -27,3438 0,390625 1914,063
6,5 380 0,875 -26,25 -22,9688 0,765625 689,0625
4,5 450 -1,125 43,75 -49,2188 1,265625 1914,063
5 420 -0,625 13,75 -8,59375 0,390625 189,0625
45 3250 - - -171,25 3,875 8787,5
Introdução à Estatística Ensino à Distância 89

a)

a=
∑ ( x − x )( y − y ) = − 171,25 ≈ −44,2
i 1

∑ (x − x) i
2
3,875

b = y − ax = 406,25 − (−44,2) × 5,625 = 406,25 + 248,625 = 654,875

y = −44,2 x + 654,875

b) Repare que o preço está em centenas e 100 corresponde a uma

centena (1) Logo quando o preço sobe 100. as vendas baixam em

5,5 aparelhos.

3.

xi yi xi − x yi − y ( xi − x )( yi − y ) ( xi − x )2 ( yi − y )2
0,41 1850
x i y i

-0,021 -602 12,642 0,000441 362404


0,46 2620 0,029 168 4,872 0,000841 28224
0,44 2340 0,009 -112 -1,008 8,1E-05 12544
0,47 2690 0,039 238 9,282 0,001521 56644
0,42 2160 -0,011 -292 3,212 0,000121 85264
0,39 1760 -0,041 -692 28,372 0,001681 478864
0,41 2500 -0,021 48 -1,008 0,000441 2304
0,44 2750 0,009 298 2,682 8,1E-05 88804
0,43 2730 -0,001 278 -0,278 0,000001 77284
0,44 3120 0,009 668 6,012 8,1E-05 446224
4,31 24520 - - 64,78 0,00529 1638560

b)

a=
∑ ( x − x )( y − y ) = 64,78 ≈ 12245,7
i 1

∑ (x − x) i
2
0,00529

b = y − ax = 2452 − 12245,7 × 0,431 = 2452 − 5277,9 = 2825,9

c)
y = 12245,7 x − 2825,9
y = 12245,7 × 0,43 − 2825,9 = 5265,651 − 2825,9 = 2439,751
90 Lição nº 7

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo: Thomson Leaning; 2003.

Leitura − GUIMARÃES E CABRAL. Estatística. Amadora:. Mc graw Hill,


1997.

− HOGG e TANIS. Probability and Statical Inference. New Jersey:


Prantice Hall, 2001
Introdução à Estatística Ensino à Distância 91

Unidade 2
Noções de probabilidade
Introdução
A humanidade tem lidado com incertezas desde épocas mais remotas e
esforços para as reduzir têm sido feitos na tentativa de obter vantagens
em disputas, por exemplo, e evitar perdas advindas de factores
‘‘imprevisíveis’’. Há milhares de anos que os jogos de azar têm sido parte
da nossa civilização. Pinturas em tumbas egípcias feitas em 3500 a.n.e.
mostram pessoas jogando uma forma primitiva de dados feitos de um
osso de calcanhar de nome astrágalos. Estas práticas juntamente com o
crescimento da área de seguros, estimularam o desenvolvimento da teoria
de probabilidades, um campo indispensável a muitas áreas do saber.

Esta unidade comporta 5 lições. O seu estudo deverá durar cerca de 10


horas. O caderno de notas e a calculadora deverão acompanhar todo o
estudo.

Tempo de estudo da
Unidade: 10:00 Horas

Ao completar esta unidade, você será capaz de:

ƒ Diferenciar modelos determinísticos de fenómenos aleatórios;

ƒ Definir o conceito de probabilidade;


Objectivos ƒ Construir modelos de probabilidade para situações simples em que se
admite equilíbrio (acontecimentos igualmente prováveis).

ƒ Determinar probabilidades a partir de modelos construídos.

ƒ Usar a análise combinatória na determinação de probabilidades;

ƒ Determinar a probabilidade para intersecção e união de


92 Unidade 2

acontecimentos;

ƒ Identificar acontecimentos dependentes/independentes usando


probabilidades;

ƒ Determinar a probabilidade à posteriori usando o teorema de Bayes.

Probabilidade - definição clássica, axiomática e frequencista. Arranjos e


combinações. Probabilidade da reunião e intersecção de acontecimentos.
Probabilidade condicionada. Probabilidade total e teorema de Bayes.
Terminologia

Plano de estudo da Unidade

Nº da lição Tema Tempo de Tempo de


estudo resolução da
autoavaliação

1 Conceito de 1 Hora 1 Hora


probabilidade

2 Arranjos e 1 Hora 1 Hora


combinações

3 Reunião de 1 Hora 1,5 Hora


acontecimentos

4 Probabilidade 1 Hora 1 Hora


condicional.
Acontecimentos
independentes

5 Probabilidade 1 Hora 1,5 Hora


total e fórmula
de Bayes
Introdução à Estatística Ensino à Distância 93

Lição nº 1
Conceito de probabilidade

Boas vindas à lição nº 1, primeira lição do estudo de probabilidades!

Já começa a pensar na probabilidade de entender este conteúdo?!

Esperamos que seja de 100%. Lembre-se que as suas sessões não devem
ser demasiadamente longas. Crie espaço suficiente para o seu estudo,
interrompa para beber um copo de água ou um chá. Lembre-se que a cada
lição que passa além de mais conhecimentos adquiridos é menos uma
lição rumo ao fim do módulo e do curso. O certificado espera-lhe e…
“boa viagem”.

Introdução
Muitos de nós agimos com base na chance da ocorrência de eventos.
Alguns de nós viajamos em aviões reconhecendo que embora haja a
chance de uma colisão com outro aparelho, essa chance é colidir com o
outro? A teoria de probabilidade tenta responder esta e outras questões
cuja ocorrência se associe à fenómenos aleatórios.

Esta lição deverá ser estudada em aproximadamente 1 hora.

Tempo de estudo da lição:


01:00 Hora
94 Lição nº 1

Ao completar esta lição, você será capaz de:

ƒ Determinar o espaço de resultados em experiências aleatórias;

ƒ Definir o conceito de probabilidade, aplicando correctamente a


Objectivos definição clássica ou de Laplace;

ƒ Usar correctamente a terminologia de probabilidades;

ƒ Aplicar o conceito de probabilidade na resolução de problemas e na


explicação da ocorrência de alguns fenómenos.

Experiência determinista e aleatória, espaço amostral, probabilidade.


Definição clássica, axiomática e frequência de probabilidade.

Terminologia

Fenómenos ou experiências aleatórias versus experiências


deterministas.
Uma experiência é um processo,
ou conjunto de circunstâncias, São fenómenos ou experiências sujeitas a factores casuais e que
capazes de produzir resultados
observáveis
conduzem a resultados incertos. Pode-se repetir um grande número de
vezes em condições semelhantes ou mesmo iguais, e por cada vez que se
realiza, nunca se tem conhecimentos suficientes para prever com
exactidão os resultados futuros.

São exemplos de uma experiência aleatória:

− O lançamento de uma moeda, e registo da face voltada para cima;

− O peso de uma criança ao nascer;

− O tempo em minutos até a próxima chuva, etc.

Em oposição a fenómenos aleatórios, existem as experiências ou


acontecimentos determinísticos. Pode-se conhecer com exactidão o
A palavra aleatório deriva resultado da experiência. São exemplos de experiências determinísticas:
da palavra latina álea que
significa sorte, risco ou As horas, depois de passarem 5 minutos da hora actual;
acaso
Introdução à Estatística Ensino à Distância 95

O número da página que segue depois da página que está a ler agora;

O valor que vai pagar ao adquirir 2 Kg de açúcar, sabendo que cada kg


está a 20 meticais.

Procure encontrar junto com o seu grupo de estudo do seu distrito ou


província 3 acontecimentos aleatórios e 3 acontecimentos determinísticos.
Repare que pode encontrar experiências em jogos de futebol, no tempo,
Actividade de grupo 1
nas experiências de física, etc.

Definição clássica de probabilidade (definição de Laplace).

Considere que já está perante uma turma em aula de Física da 8ª Classe,


constituída por 50 alunos dos quais 30 são rapazes. Suponha que pretende
escolher um aluno para fazer a correcção do trabalho de casa no quadro.
Actividade nº 14
Suponha também que esta escolha será feita ao acaso, isto é, sem olhar
para a assiduidade, pontualidade, participação, classe social, altura, idade,
etc., o que é mais provável, escolher um rapaz ou rapariga? Tente
Justificar o seu ponto de vista.

Tempo de realização:
01:00 Hora.

A probabilidade de um acontecimento é o quociente


entre o número de casos favoráveis ao
acontecimento e o número de casos possíveis.
Dica
O Conceito de
probabilidade resulta
da necessidade de se
atribuir um valor aos Número de casos favoráveis
acontecimentos de P ( A) =
cada vez que a Número de casos possíveis
experiência aleatória
se realiza.
96 Lição nº 1

Considere a experiência aleatória que consiste em lançar um dado não


viciado numerado de 1 a 6 ao ar e registar o número da face voltada para
cima ao cair. Qual é a probabilidade de
Exemplo 6
a) Sair o número 5?
b) Sair número par.
c) Sair um número maior que 4

Ao lançar-se um dado o resultado para o número da face voltada para


cima pode ser 1, 2, 3, 4, 5 ou 6.

A este conjunto de todos os resultados possíveis de ocorrer chama-se


espaço amostral e representa-se por S ou Ω .

Para o presente caso S = {1, 2, 3, 4, 5, 6} . Então:

1
a) P (5) = ≈ 0,17 ; pois das seis possibilidades apenas
6
uma é que satisfaz a condição de sair o número 5.
Ao conjunto de resultados
também se pode chamar 3
espaço amostral, espaço b) P ( par ) = = 0,5 ; pois do conjunto dos números, 3
de resultados ou universo 6
amostral
deles são pares.

2
c) P ( X > 4) = ≈ 0,33 ; pois 2 números são maiores que
6
4.

Definição frequencista
Observa que o espaço de
resultados pode ser
discreto ou contínuo. O
caso descrito Esse conceito deriva da compreensão comum de que a probabilidade de
anteriormente (do
lançamento do dado) um resultado particular de um processo significa a frequência relativa
representa um espaço
discreto enquanto o
com que o resultado ocorre quando o processo é repetido um certo
tempo que uma estudante número de vezes.
leva a estudar um certo
tema deste livro é Os primeiros proponentes dessa abordagem “frequencista” sugeriram a
contínuo.
probabilidade de um resultado específico de um processo como uma
frequência relativa desse resultado “ao final de muitas realizações” do
processo.
Introdução à Estatística Ensino à Distância 97

Por exemplo, a probabilidade de obter uma cara quando uma moeda é


1
lançada é considerada porque a frequência relativa da obtenção de
2
1
John Venn licenciou-se na cara seria aproximadamente quando a moeda é lançada um grande
Universidade de Cambridge em 2
1857; 2 anos mais tarde foi número de vezes.
ordenado padre. Em 1862 voltou Venn foi o primeiro a definir a probabilidade de um acontecimento como
para a Universidade de
Cambridge como um leitor em o valor limite da sua frequência relativa quando o número de realizações
Ciências Morais, estudando
técnicas lógicas e a teoria da cresce indefinidamente.
probabilidade. Desenvolveu a
lógica matemática de Boole e é Uma versão mais elaborada da teoria do limite da frequência foi
conhecido pela forma como
apresentada por Von Mises, que definiu a probabilidade de um evento A
representa em diagrama, uniões e
intersecções. nA
resultante de um processo como o limite da frequência do evento
n
quando o número n de repetições do processo tende para o infinito, onde
n A é o número de ocorrências do evento A, quando o evento é repetido n
vezes. Esse limite é o primeiro axioma da teoria proposta por Von Mises.
Embora essa definição seja aparentemente atractiva, ela falha em
decorrência da inexistência, em geral, do referido limite no sentido
matemático.

As definições de Venn e de Von Mises basearam-se em observações


empíricas referentes à estabilidade de frequências relativas em longas
séries de observações aleatórias efectuadas sob condições uniformes, ou
seja, na regularidade estatística, que constitui a base empírica da teoria
estatística.

Com o seu grupo de estudo determine a probabilidade de sair cara no


lançamento de uma moeda de 10 Meticais, usando o conceito de
frequência relativa, quando a moeda é lançada:
Actividade de grupo 2
a) 10 vezes;
b) 20 vezes
c) 30 vezes
d) 55 vezes.
e) 100 vezes.
Compare o seu resultado com o dos outros elementos do grupo.
Conseguem tirar alguma conclusão?
98 Lição nº 1

Assim, por exemplo, pode-se observar que a variação da frequência


nA
relativa do evento “cara” numa sequência de lançamentos de uma
n
moeda varia de modo acentuado para valores pequenos de n, mas a
amplitude das flutuações gradualmente torna-se menor à medida que n
cresce, tendendo a estabilizar-se em torno de algum valor ideal definido,
1
muito próximo de .
2

Definição axiomática

No curso do desenvolvimento das diferentes interpretações de


probabilidade, foram sugeridas diversas definições de

Notável matemático
probabilidade. Paralelamente, foram idealizados métodos
soviético. Dedicou-se à alternativos para relacionar a construção da matemática da
lógica, teoria de
probabilidades, topologia, probabilidade àquelas definições. Esses procedimentos de cálculo
entre outros campos de
matemática. Morreu em alternativo tomam diferentes visões em termos de significado da
Outubro de 1987
sua noção fundamental, mas, em geral, eles têm uma estrutura
lógica comum.
Kolmogorov propôs uma abordagem axiomática em que a
probabilidade é definida como uma função de conjuntos que
satisfaz as propriedades da frequência relativa e estende o conceito
de probabilidade a situações mais gerais.

Eis os axiomas de probabilidade:

Axioma 1: 0 ≤ P( A) ≤ 1 .

Axioma 2: P ( S ) = 1 .

Axioma 3: Se A e B são eventos mutuamente exclusivos então


P( A ∪ B) = P( A) + P( B) .

Os cientistas também erram!

Os grandes matemáticos e cientistas também cometem erros.


Introdução à Estatística Ensino à Distância 99

Em 1754 foi colocado a D’Alembert o seguinte problema: “Se lançarmos

Escritor, filósofo e matemático, é uma moeda ao ar duas vezes seguidas, qual a probabilidade de obtermos
autor de Discours préliminaire pelo menos uma vez cara?”
de l'Encyclopedie, Elogios
acadêmicos e Tratado de D’Alembert respondeu que a probabilidade era 2 para 3 e justificou
dinâmica.
dizendo que havia três possibilidades: duas coroas, duas caras e uma cara
Suas pesquisas em física
relacionaram-se à mecânica e uma coroa e só uma das possibilidades era desfavorável.
racional; princípio fundamental da
dinâmica; problema dos três D’Alembert contou mal os casos possíveis e os favoráveis da experiência
corpos; cordas vibrantes e
hidrodinâmica. em questão. Qual a resposta que D’Alemebert deveria ter dado?
Em matemática estudou as
equações com derivadas
parciais; equações diferenciais
ordinárias; definiu a noção de
Para ajudar a contar os casos possíveis, observa o diagrama de árvore.
limite; inventou um critério de
convergência das séries;
demonstrou o teorema
fundamental da álgebra que
afirma ter toda equação algébrica,
pelo menos, uma raiz real ou
imaginária (teorema de
D’Alembert-Gauss).

Os resultados possíveis são 4 e os favoráveis 3.

{(Cara, Cara);(Cara, Coroa);(Coroa, Cara);(Coroa, Coroa)}

A resposta ao problema colocado a D’Alembert é 3 em 4 e não 2 em 3


como ele respondeu.

Sumário
A probabilidade mede a ocorrência de acontecimentos chamados
aleatórios. São acontecimentos que, repetidos em condições semelhantes,
não possibilitam prever o resultado a ocorrer com exactidão, mesmo
sabendo o conjunto de resultados possíveis. Embora não aplicável a todas
as situações, a definição clássica parece a que mais expressão encontra
nos exercícios e exemplos ao longo do manual. Ela define a
probabilidade como o quociente entre o número de casos favoráveis e
possíveis ao acontecimento. Para a aplicação desta definição exige-se
que os casos sejam igualmente prováveis, termo que envolve ainda o
conceito de probabilidade.
100 Lição nº 1

Exercícios
1 Temos 5 cartões iguais numerados de 3 a 7. Tiramos um cartão à
sorte. Qual é a probabilidade de sair:

Auto-avaliação nº 8 a) 6 b) Um número par c) Um número maior que 5

2. Suponha que um gerente de um grande complexo de


apartamentos forneça as seguintes estimativas de probabilidades
subjectiva sobre o número de vagas que haverá no próximo mês:
Tempo de realização:
01:00 hora. Vagas Probabilidade

0 0,05

1 0,15

2 0,35

3 0,25

4 0,10

5 0,10

Tabela 31: Estimativas de probabilidades subjectivas sobre o número de vagas


disponíveis no mês seguinte.

Liste os pontos amostrais e forneça a probabilidade de cada um dos


eventos:

a) Sem vagas.
b) Pelo menos quatro vagas.
c) Duas vagas ou menos.

3. Considere o seguinte jogo: temos dois sacos contendo bolas


iguais, mas com cores diferentes: umas são azuis, outras são
brancas. Ganha-se um prémio se ao tirar uma bola de um dos
sacos, ela for azul. Em cada um dos casos, qual dos sacos
escolheria?
Introdução à Estatística Ensino à Distância 101

a) Saco A: 3 azuis e 1 branca


Saco B : 1 azul e 3 brancas

b) Saco A: 4 azuis e 8 branca


Saco B : 1 azul e 2 brancas
c) Saco A: 2 azuis e 4 branca
Saco B : 4 azul e 7 brancas

4. Considere a experiência de arremesso de um par de dados.


Suponha que estamos interessados na soma dos valores da face
que é mostrada nos dados.

a) Liste o espaço amostral.


b) Qual é a probabilidade de se obter um total de 7?
c) Qual é a probabilidade de se obter um total de 9 ou mais?

5. Uma empresa que fabrica creme dental está a estudar cinco


projectos diferentes de embalagens. Supondo que um projecto é
tão provável de ser seleccionado pelo consumidor quanto outro
qualquer, que probabilidade de selecção você atribuiria a cada um
dos projectos de embalagem?

Numa experiência real, solicitou-se a 100 consumidores que


escolhessem o projecto preferido e obtiveram-se os dados que se
seguem. Os dados parecem confirmar a crença de que um
projecto é tão provável quanto um outro. Explique.

N° de vezes que foi o


Projecto
preferido

1 5

2 15

3 30

4 40

5 10

Tabela 32: Tabela de frequência do projecto preferido por uma amostra de 100
consumidores.
102 Lição nº 1

6. Um levantamento envolvendo 50 estudantes da Faculdade de


Ciências Naturais e Matemática sobre o número de actividades
extracurriculares resultou nos dados a seguir.

a) Seja A o evento em que um estudante participa de pelo


menos uma actividade. Ache P(A).

b) Seja B o evento em que um estudante participa de 3


actividades ou mais. Ache P(B).

c) Qual é a probabilidade de que o estudante participe em


exactamente 2 actividades?

Número de
Frequência
Actividades

0 8

1 20

2 12

3 6

4 3

5 1

Tabela 33: Frequência do número de actividades extracurriculares para um grupo de 50


estudantes de Faculdade.

Conhecimentos de definição clássica de probabilidade serão necessários


para resolver com sucesso estes exercícios. Tente observar e compor o
espaço amostral (conjunto de resultados possíveis) usando tabelas,
esquemas ou o diagrama de árvore. Se não entendeu um certo conteúdo,
persista, acompanhado o exemplo apresentado ou lendo este assunto nos
livros alistados no fim da resolução da auto-avaliação.
Introdução à Estatística Ensino à Distância 103

Exercícios
Resolução da auto-avaliação
1.
1
a) A probabilidade é de = 20% visto que em cinco cartões
5
apenas um têm o número 6.

2
b) A probabilidade é de = 40% , visto que dos 5 cartões dois têm
5
número par (4 e 6).

2
c) A probabilidade é de = 40% , No conjunto dos 5 cartões dois
5
tem números maiores que 5 (6 e 7)

2.
a) Sem vagas corresponde ao acontecimento Vagas = 0. sendo
assim, o ponto amostral é {0} e a probabilidade é P(0) = 0,05 , conforme
a tabela.
b) Pelo menos quatro vagas correspondem a quatro vagas ou mais.
Os pontos amostrais são {4,5} e a probabilidade é
P(4) + P (5) = 0,10+,010 = 0,20

c) Duas vagas ou menos correspondem aos pontos amostrais


{0,1,2} cuja probabilidade é
P (0) + P(1) + P(2) = 0,05 + 0,15 + 0,35 = 0,55

3.
a) Neste caso, o saco a escolher seria o A, uma vez que a
3
probabilidade de sair uma bola azul deste saco é enquanto do outro
4
1
saco é .
4

b) Neste caso, pode-se escolher qualquer um dos sacos, uma vez


4 1
que a probabilidade é sempre de aproximadamente 33%. = .
12 3
104 Lição nº 1

c) Neste caso, escolheria o saco B pois há maior probabilidade de


4 2 4
nele sair uma bola azul comparativamente ao saco A. > = .
11 6 12

a) Como cada um dos dados tem 6 faces, em cada um dos resultados

podemos ter cada um dos números que aparece numa das faces

{1,2,3,4,5,6}. Combinando os resultados dos dois dados teríamos:

Dado 2
1 2 3 4 5 6
1 1,1 1,2 1,3 1,4 1,5 1,6
2 2,1 2,2 2,3 2,4 2,5 2,6
Dado 1

3 3,1 3,2 3,3 3,4 3,5 3,6


4 4,1 4,2 4,3 4,4 4,5 4,6
5 5,1 5,2 5,3 5,4 5,5 5,6
6 6,1 6,2 6,3 6,4 6,5 6,6

A partir da tabela pode-se observar que os resultados possíveis ou espaço


amostral para a soma dos números mostrados nas faces são:
{2,3,4,5,6,7,8,9,10,11,12} ; não considerando, claro, a frequência de cada
uma das somas.

b) Um total de sete é obtido nos seguintes casos:


{(1,6); (2,5); (3,4); (4,3); (5,2); (6,1)} o que totaliza 6 casos favoráveis.

6
Logo a probabilidade é ≈ 0,17 = 17% .
36

c) Um total de nove ou mais obtêm-se nos seguintes casos:


{(3,6); (4,5); (4,6); (5,4); (5,5); (5,6); (6,3); (6,4); (6,5); (6,6)}
10
totalizando 10. A probabilidade é neste caso ≈ 0,28 = 28%
36
Introdução à Estatística Ensino à Distância 105

5.

Uma vez que cada projecto é tão provável quanto outro e tendo em conta
que a soma de todas probabilidades para este o espaço amostral é 1 ou
1
100%, a probabilidade de selecção para projecto é de = 20%
5

Os dados não confirmam a igualdade de preferência uma vez que a


5
preferência para o projecto 1 é de = 5% muito diferente da
100
40
preferência para o projecto 4, que é de = 40%.
100

6.

a) Se o estudante participa de pelo menos uma actividade significa


que ele participa de uma actividade ou mais. Os resultados favoráveis são
1,2,3,4,5.
20 + 12 + 6 + 3 + 1
P( A) = P(1) + P(2) + P(3) + P(4) + P(5) = = 42 = 84%
5050

Repare que o resultado é facilmente obtido se se tiver em conta que o


único acontecimento que não faz parte do pedido (pelo menos uma
actividade) é número de actividades igual a zero. Todo o espaço amostral
(o estudante participa de 0,1,2,3,4 ou 5 actividades extracurriculares) tem
8 42
probabilidade 1. Então P ( A) = 1 − P(0) = 1 − = = 84%.
50 50

b) Três actividades ou mais correspondem a {3,4,5} cuja

6 + 3 + 1 10
probabilidade é P ( B ) = = = 20% .
50 50
106 Lição nº 1

c) A frequência ou número de estudantes que participam de duas


12
actividades extracurriculares é 12. P (2) = = 24% .
50

Para enriquecer os seus conhecimentos sobre o conceito de probabilidade,


leia por favor os seguintes livros:

− NEVES, Maria Augusta at al; Matemática aplicada às ciências


sociais. Porto: Porto editora, 2005.

Leitura − CORREIRA, Adelaide Et al. Cálculo da probabilidade. Bobadela:


Editora Instituto Piaget, 2002.
Introdução à Estatística Ensino à Distância 107

Lição nº 2
Arranjos e combinações
Introdução
Em muitas situações que envolvem o cálculo de probabilidades torna-se
desnecessário indicar todos os elementos do conjunto, mas é importante
saber quantos são. A determinação ou contagem sistemática dos
elementos do conjunto é estudada na análise combinatória. Nesta lição o
estudante vai familiarizar-se com essas técnicas, como forma de facilitar
a determinação de probabilidades.

Esta lição deverá ser estudada em aproximadamente 1 hora.

Tempo de estudo da lição:


01:00 Hora

Ao completar esta lição, você será capaz de:

ƒ Reconhecer e aplicar o princípio fundamental de contagem.

ƒ Determinar factorial de um número natural.


Objectivos
ƒ Usar arranjos e combinações na resolução de problemas de contagem.

ƒ Distinguir arranjos e combinações.

Factorial, arranjos com e sem reposição, permutações, combinações.

Terminologia
108 Lição nº 2

Princípio fundamental de contagem.

Considere o seguinte problema:

O João vive na cidade A e vai visitar o seu avô na cidade C, passando


pela cidade B.

As cidades A e B estão ligadas pelas estradas 1, 2 e 3.

As cidades B e C estão ligadas pelas estradas 4 e 5.

Quantos percursos diferentes pode seguir o João?

Representemos os percursos que o João pode seguir num diagrama de


árvore:

Como pode notar, o João tem no total 6 possibilidades: 3 para sair de A à


B vezes duas para sair de B á C. A resposta poderá ter sido encontrada

fazendo 3 × 2 = 6
Introdução à Estatística Ensino à Distância 109

Vamos discutir um outro caso, o da ementa:

Observe a baixo, a ementa de um restaurante:

Quantas refeições diferentes é possível fazer neste restaurante, incluindo


uma entrada, um prato e uma sobremesa?
Exemplo 7

Entrada
Sopa
Salada

Prato
Camarão grelhado
Filetes de Peixe
Costelas de porco
Frango a zambeziana

Sobremesa
Fruta da época
Pudim
Tarte de noz

Usando o pensamento explorado no exemplo anterior pode-se concluir


que há duas possibilidades para escolher as entradas, quatro para o prato
principal e três para a sobremesa. No total há 2 × 4 × 3 = 24 pratos
diferentes.
110 Lição nº 2

Nos dois casos anteriores usou-se o princípio fundamental de contagem:

Se um certo acontecimento pode ocorrer de n maneiras diferentes e se,


após este um segundo pode ocorrer de m maneiras diferentes e, após este
um terceiro corre de k maneiras diferentes…, e se estes acontecimentos
são independentes, então o número de modos diferentes em que os
acontecimentos podem ocorrer na ordem indicada é n × m × k ...

Durante 20 minutos, use o princípio de contagem para resolver a seguinte


actividade.

1. Um indivíduo possui 3 fatos, duas camisas e 3 gravatas. De quantas


maneiras diferentes pode escolher um fato, uma camisa e uma gravata?

Actividade 15 2. Suponha que uma criança é capaz de desenhar dois tipos de caras, 3
tipos de chapéus e quatro tipos de corpos. Quantos bonecos com chapéus
pode ela desenhar?

3. Um salão tem 3 portas. De quantas maneiras diferentes uma pessoa


pode entrar e sair deste salão? E se a pessoa não quiser usar a mesma
porta?

Tempo de realização :
20 minutos

Nos exercícios 1 e 2 use o princípio de contagem tendo em conta que se


dispõe de 3 acontecimentos elementares.

Dica No exercício 3 não está explícito o número de acontecimentos


elementares. Observe que há portas e a pessoa pode entrar e sair usando
as 3. Já no segundo caso a pessoa tem 3 possibilidades de entrada mas
apenas duas de saída uma vez que não vai sair pela porta por onde entrou.
Introdução à Estatística Ensino à Distância 111

Noção de factorial

Factorial de um número natural n (maior que 1) ou n factorial, designado


n! , representa o produto dos n primeiros números naturais.

Determine:

a) 4!= 4 × 3 × 2 × 1 = 24
Exemplo 8 b) 6!= 6 × 5 × 4 × 3 × 2 × 1 = 720

c) n!= n × (n − 1) × (n − 2) × ... × 2 × 1

Por definição:

0! = 1

1! = 1

Repare que
6!= 6 × 5!= 6 × 5 × 4!= 6 × 5 × 4 × 3!= 6 × 5 × 4 × 3 × 2!= 6 × 5 × 4 × 3 × 2 × 1

Arranjo

Considere o seguinte problema:

Com os algarismos 2, 5, 7, 8, quantos números de 2 algarismos diferentes

Exemplo 8 é possível formar?

Observe que o objectivo é formar com os 4 elementos agrupamentos 2 a 2


de tal forma que não tenhamos em nenhum dos casos dois algarismos
repetidos. Começando pelo 2, 5, 7 e 8 é possível formar os seguintes
números:
112 Lição nº 2

Começando com 2 Começando com 5 Começando com 7 Começando com 8

25 52 72 82

27 57 75 85

28 57 78 87

O que totaliza 12 números.

Agora uma outra questão: De quantas maneiras diferentes podem sentar-


se 5 pessoas num banco com 3 lugares?

Exemplo 9

Poderíamos resolver este problema com o raciocínio do problema


anterior, isto é supondo que temos no banco os lugares L1; L2 ; L3 e as

pessoas de P1 a P5 . O primeiro lugar pode ser ocupado por qualquer um

dos 5. Já o segundo lugar, pode ser ocupado por qualquer um dos 4


restantes já que um deles ocupou antes o primeiro e assim sucessivamente

Algumas estratégias para a Começando por P1 , seguindo-se P2


resolução de problemas de
contagem:
Faça um esquema, um diagrama,... P1P2 P3
Procure um padrão.
:Escreva uma sequência P1P2 P4
Resolva um problema simples mas
mais simples. P1P2 P5 ...
Use raciocínios directos e
indirectos.
Pense numa solução e verifique
essa solução. Tente continuar até encontrar todos os agrupamentos possíveis.
Resolva o problema começando do
fim para o princípio. Quando os agrupamentos envolvidos são muitos, o método de apresentar
Use casos particulares.
todos os agrupamentos para seguidamente contá-los torna-se bastante
Faça uma simulação com
calculadora moroso, além de não ser fácil. O esquema abaixo pode ser usado com
sucesso para encontrar o número destes agrupamentos:
Introdução à Estatística Ensino à Distância 113

Repare que a primeira posição pode ser ocupada por 5 elementos; a


segunda por 4 e a última por 3. Então o número de agrupamentos
diferentes é 5 × 4 × 3 = 60 . A isto se chama arranjos sem repetição de 5

elementos 3 a 3, e representa-se por A35 = 5 × 4 × 3

O primeiro caso também podia ter sido resolvido da mesma maneira, isto
é, A24 = 4 × 3 = 12 .

Determine:
a) A37

Actividade 16 b) A25

c) A45
d) A33

Tempo de realização :
10 minutos

Observe que terá que usar produtos de factores consecutivos começando


pelo número que está em cima e buscando factores em ordem decrescente

Dica de acordo com o número que se encontra em baixo. Para o caso da alínea
a), comece pelo factor sete e busque três factores em ordem decrescente.
A37 = 7 × 6 × 5 = 210

5!
Repare que A25 = 5 × 4 =
(5 − 2)!

De uma maneira geral

n!
Apn = .
(n − p )!

Quando o número de elementos totais coincide com o número de


agrupamentos, como acontece na alínea d) do exercício acima, o arranjo
recebe o nome de permutação e representa-se assim: Pn
114 Lição nº 2

Observe que

Pn = n!

Se no problema de formar números de 2 algarismos com os algarismos 2,


5, 7, 8 se abrir a possibilidade de que cada algarismo se pode repetir,
outras soluções para este problema seriam os números 22, 55, 77 e 88.
Portanto pode-se formar 16 números. Trata-se agora de arranjos com
reposição de 4 elementos 2 a 2 e representa-se por A24 = 42 . Duma

maneira geral Apn = n p .

1. Determine:

a) A39 6
Actividade 17 b) A711

c) A520

d) A35

e) A27

Tempo de realização :
15 minutos 2. Determine n sabendo que:

a) A2n = 5

b) A2n +1 = 3× A2n

n!
Use as definições A pn = e A = n p . Explore também a sua
(n − p )!

Dica máquina de cálculo e use-a para determinar factorial de um número e


arranjos sem repetição. No exercício 2 as soluções negativas deverão ser
descartadas uma vez que n só é definido para n ≥ 0 . Precisará recordar-
se de como encontrar as raízes de uma equação do segundo grau

− b ± b 2 − 4ac
ax 2 + bx + c = 0 que é x1, 2 = .
2a
Introdução à Estatística Ensino à Distância 115

Combinações

Suponha que se dispõe de um grupo de 3 representantes de turmas e se


pretende formar uma comissão de 2 elementos para discutir com a
direcção do curso sobre a redução das mensalidades. De quantas maneiras
diferentes pode-se formar a comissão?

Sejam A, B e C os representantes.

Consideremos todos agrupamentos possíveis destes 3 elementos 2 a 2:

AB AC

BA BC

CA CB

Haverá alguma diferença entre as comissões AB e BA?

6
Claro que não! Então o número de comissões diferentes é = 3 . A isto
2
6
se chama combinação de 3 elementos 2 a 2. Escreve-se C23 = =3
2

E se o problema fosse formar uma comissão de 3 elementos a partir de 5


pessoas?

Sabemos dos arranjos que o número de todos agrupamentos de 4


elementos 3 a 3 é A34 = 4 × 3 × 2 = 24 . A questão agora é que há

comissões iguais embora os elementos estejam dispostos em maneiras


diferentes. Como tirar estas comissões?

Repare nos agrupamentos possíveis:

ABC BAC CAB DAB

ABD BAD CAD DAC

ACB BCD CBA DBA


116 Lição nº 2

ACD BCA CBD DBC

ADB BDA CDA DCA

ADC BDC CDB DCB

Tratando-se de pessoas, a comissão formada por ABC é a mesma com


ACB, BAC, BCA, CAB e CBA.

Procure outras comissões iguais e retira-as. Agora conta o número de


comissões efectivamente diferentes. O resultado é 4.

24 A4
C34 = = 4 , ou seja C34 = 3
6 3!

Observe os exemplos:

A35
a) C35 = = 10 .
Exemplo 10 3!
A610 10! 10 × 9 × 8 × 7
b) C610 = = = = 210 .
6! 6!4! 24
Apn n!
c) C pn = =
p! p!(n − p )!

Determine usando o resultado do exemplo c) acima ou a sua calculadora


(caso esta tenha a função de combinações).

Actividade 18 a) C 27

b) C310

c) C515

Tempo de realização :
d) C88
15 minutos
Introdução à Estatística Ensino à Distância 117

Sumário
As técnicas da análise combinatória permitem contar sistematicamente os
elementos de um dado conjunto. Nos arranjos, a ordem em que os
elementos estão dispostos é importante, sendo portanto sequências. Nas
combinações a ordem de disposição dos elementos não interessa. As
combinações são conjuntos.

n!
Arranjo simples de n por p: Apn =
(n − p )!

Permutação de n elementos: Pn = n!

Arranjo com repetição de n elementos por p: Apn = n p

Apn n!
Combinações simples de n elementos por p: C pn = =
p! p!(n − p )!

Exercícios
1. De quantas maneiras diferentes podem ser colocados, numa
prateleira cinco livros diferentes?

Auto-avaliação nº 9 2. Pretende-se formar uma comissão de 8 membros a partir de um


grupo de 30. De quantas maneiras isso é possível?

3. Após uma reunião, todos os presentes trocaram cumprimentos.


Verificou-se que foram trocados 45 apertos de mão. Quantas
pessoas estavam presentes na reunião?

4. Cinco estradas conduzem ao cimo de uma montanha. De quantas


Tempo de realização: maneiras distintas pode um turista subir e descer a montanha?
01:00 Hora.
Qual será a resposta se o turista não quiser passar duas vezes pelo
mesmo caminho?
118 Lição nº 2

5. Uma agência de adopção tem 10 famílias de acolhimento e seis


crianças para adopção. Se uma família pode adoptar no máximo
uma criança, de quantas maneiras diferentes podem as crianças
ser adoptadas?

6. Uma família de cinco pessoas senta-se em cinco cadeiras,


dispostas em fila, para assistir aos programas de televisão.

a) De quantas maneiras se podem sentar as cinco pessoas.

b) E se duas delas, previamente escolhidas, ficassem


sempre juntas.

7. Cinco carros chegam a um parque de estacionamento que se


encontra vazio e tem oito lugares numerados. De quantos modos
distintos podem os automóveis estacionar?

8. Um programador tem que escrever seis programas informáticos e


ele escreve um de cada vez. De quantas maneiras diferentes pode
organizar o seu trabalho?

9. Um inspector visita diariamente 6 oficiais diferentes. Para evitar


que os funcionários saibam quando ele os irá inspeccionar, o
inspector varia a ordenação de suas visitas. De quantas maneiras
diferentes pode isso ser feito?

10. Quantas saladas diferentes podem fazer-se dispondo de cinco


espécies de verduras?

Procure entender o problema e esquematizá-lo. Procure visualizar os


conjuntos sempre que possível. Não se esqueça que nos arranjos a ordem

Dica da disposição dos elementos é importante, quando nas combinações não.


Introdução à Estatística Ensino à Distância 119

Feedback

Resolução da Auto-avaliação

1. Todos os cinco livros devem estar na prateleira, alterando-se


apenas o seu posicionamento. Sejam A, B, C, D e E os livros. Repare que
o posicionamento ABCDE difere do BACDE. Trata-se portanto de
permutação de 5. P5 = 5! = 120 .

2. Suponha que os 30 membros do grupo sejam os indivíduos 1 2, 3,


…30. Observe que a comissão {1, 2, 3, 4, 5,6, 7, 8} é a mesma que a
comissão {2, 1, 3, 4,8, 5, 6, 7}. Trata-se, neste caso de combinações, pois
a ordem da disposição dos elementos não é importante. A solução é
C830 = 5852925 .

3. Observe que se A cumprimenta B, B também cumprimenta A, de


tal forma que a ordem não têm importância (AB=BA). Trata-se de
combinações e o objectivo é encontrar o número total de elementos
sabendo-se que as pessoas cumprimentam-se dois a dois. O problema
resume-se em resolver a equação C 2n = 45 . Desenvolvendo, usando a
definição de combinações segue:

n!
= 45 . Desenvolvendo o numerador com a definição de
2!(n − 2)!
n(n − 1)(n − 2)!
factorial até encontrar o factor n-2 segue: = 45 .
2(n − 2)!

n(n − 1)
Simplificando o factor (n-2) fica: = 45 . E resolvendo equação
2
resultante: n 2 − n = 90 ⇔ n 2 − n − 90 = 0 ⇔ ( n − 10)(n + 9) = 0 , uma
vez que o produto das raízes é – 90 e a soma – 1. As soluções da equação
são n1 = 10 ∨ n 2 = −9 . A solução para o problema é n = 10 uma vez
que não podemos ter -9 pessoas.
120 Lição nº 2

4. O turista dispõe de 5 possibilidades para a subida e cinco para a


descida. O número de possibilidades é 5 × 5 = 25 .

A solução pode também ser encontrada tendo em conta que o turista tem
estradas e pode subir e descer pela mesma estrada. Trata-se de
A25 = 5 2 = 25.

5. Trata-se de um problema de arranjo uma vez que dar a criança 1


à família A e dar a criança 2 à família B é diferente de dar a adopção a
criança 1 à família B e a 2 á família 1. A solução do problema é portanto
A610 = 151200

6.a) Com as 5 pessoas sentandas, o problema resume-se em encontrar


o número de permutações de cinco pessoas. P5 = 5! = 120.

6b) Se duas ficam sempre lado a lado há 4 possibilidades para que


isso ocorra tendo em conta os lugares disponíveis. Veja o diagrama
abaixo:

1
2 3 4

Além das 4 possibilidades há que considerar ainda que tanto as duas


pessoas que estão lado a lado, assim como as restantes três podem
permutar de 2! e de 3! modos. A solução final é 4 × 2!×3! = 48 modos
diferentes.

7. Observe que se o carro A está na pista 1 e B na pista 2 é diferente


de colocar o carro A na pista 2 e B na pista 1. Trata-se portanto de um
problema de arranjos. A solução é A58 = 6720 .
Introdução à Estatística Ensino à Distância 121

8. O programador tem a possibilidade de permutar a ordem dos


programas. Suponha que os programas a escrever são A, B, C, D, E e F.
ele pode escrever usando as sequências ABCDEF; ACBDEF; FABCDE;
… .O número total de possibilidades é P6 = 6! = 720 .

9. Este problema é semelhante com os problemas 1, 6a) e 7. O


inspector tem que permutar a ordem de visitas dos seus funcionários e
tem P6 = 6! = 720 possibilidades diferentes.

10. Observe que uma salada de alface e tomate não difere duma
salada de tomate e alface, isto é, a ordem de disposição das verduras não
é importante. Repare ainda que pode-se fazer saladas com uma, duas,
três, quatro ou cinco espécies de verduras. A solução é

C15 + C 25 + C 35 + C 45 + C 55 = 5 + 10 + 10 + 5 + 1 = 31

Leia os seguintes livros sobre este assunto:

− OLIVEIRA, Cristina. Introdução à Análise combinatória. Lisboa.


Escolar editora, 2004.

Leitura − NEVES, Maria Augusta at al; Matemática aplicada às ciências


sociais. Porto. Porto editora, 2005.
122 Lição nº 3

Lição nº 3
Reunião de acontecimentos
Introdução
Até agora estudou casos que envolvem a determinação de probabilidades
para acontecimentos simples. Nesta lição aprenderá como determinar
probabilidades para a reunião de dois e três acontecimentos.

Esta lição deverá ser estudada em aproximadamente 1 hora.

Tempo de estudo da lição:


01:00 Hora

Ao completar esta lição, você será capaz de:

ƒ Determinar a probabilidade de reunião de dois ou três acontecimentos.

ƒ Representar acontecimentos usando o diagrama de Venn.


Objectivos ƒ Resolver problemas de probabilidade usando o diagrama de Venn.

Probabilidade da Reunião de acontecimentos

Considere o seguinte problema:

O aproveitamento final de uma turma de 50 alunos nas disciplinas de


Português e Matemática foi:

Exemplo 11 • 20 alunos passaram a Matemática,


• 15 passaram a Português e
• 10 passaram a ambas disciplinas.

Escolhendo um aluno ao acaso, determine a probabilidade de:

a) Ter passado a Português;


b) Ter passado a Matemática;
c) Ter passado a ambas disciplinas;
d) Ter passado a pelo menos uma disciplina.
Introdução à Estatística Ensino à Distância 123

Observa a representação dos conjuntos no diagrama de Venn:

Seja P o acontecimento “Passar a Português” e M o acontecimento


U = 50 “passar a Matemática”.

M=20 P=15 Então:

10 10
5
# aprovados a português 15 3
a) P( P) = = =
# total de alunos 50 10
Restantes =25

# aprovados a Matemática 20 2
M=20 b) P(M ) = = =
# total de alunos 50 5

c)

# de aprovados a Português e Matemática 10 1


P( P ∩ M ) = = =
# total de alunos 50 5

d)

# de aprovados a Português ou Matemática 25 1


P( P ∪ M ) = = =
# total de alunos 50 2

1 3 2 1
Note que = + − , Isto é
2 10 5 5

Em geral, se A e B são dois acontecimentos,


P ( A ∪ B) = P( A) + P ( B ) − P ( A ∩ B )

Esta regra pode ser alargada para a reunião de três acontecimentos:

P ( A ∪ B ∪ C ) = P ( A) + P ( B ) + P (C ) − P ( A ∩ B ) − P ( A ∩ C ) −
P( B ∩ C ) + P( A ∩ B ∩ C ) .
124 Lição nº 3

Na análise de uma amostra de 100 empresas portuguesas de importação e


exportação chegou-se à conclusão de que os países de expressão
portuguesa são os principais clientes dos produtos portugueses. De facto,
Exemplo 12 das empresas analisadas,

• 40 exportam para Angola;


• 50 exportam para Moçambique;
• 25 exportam para ambos países.

Determine a probabilidade de uma das 100 empresas anteriores, escolhida


ao acaso, exportar:

a) Para pelo menos um dos países;


b) Para nenhum dos países;
c) Para Angola mas não para Moçambique;
d) Para somente um dos países.

Feedback

Resolução:
U = 100

M=40 P=50

Seja A “a empresa que exporta para Angola” e M “a empresa que


15 25
25
exporta para Moçambique”.

Restantes =35

M=20 a) P ( M ∪ A) = P( M ) + P( A) − P( M ∩ A)

50 40 25
+ − = 0,65 .
100 100 100

b) P ( M ∪ A) = 1 − 0,65 = 0,45 .
Introdução à Estatística Ensino à Distância 125

40 25
c) P( A ∩ M ) = − = 0,15.
100 100

d) P ( A ∩ M ) + P( M ∩ A ) = 0,15 + 0,25 = 0,40.

Acompanhe agora um exemplo envolvendo três conjuntos:

Os 80 alunos da 8ª Classe duma escola escreveram-se do seguinte modo


para a modalidade de desporto escolar:

Exemplo 13 • 30 estão inscritos no Basquetebol;

• 40 estão inscritos no Atletismo;

• 25 estão inscritos no Futebol;

• 10 estão inscritos no Futebol e Atletismo;

• 9 estão inscritos no Futebol e no Basquetebol;

• 8 estão inscritos no Atletismo e no Basquetebol;

• 5 estão inscritos nas três modalidades.

Escolhido um aluno ao acaso qual a probabilidade de:

a) Estar inscrito em pelo menos uma actividade.

b) Não estar inscrito em nenhuma das actividades.


126 Lição nº 3

Feedback

Resolução:

Apresentemos o diagrama de Venn

Como aparecem os
números no diagrama?
Comece por colocar a U=80
intersecção dos três
conjuntos (5),
representado a vermelho. A=40
B=30
Repare que a parte
vermelha faz parte das
intersecções de A e B, A e
27
F, B e F. Logo (10-5 =5), 3
(9-5=4) e (8-5=3). Por fim
18
os alunos que só se
escreveram a uma 5 5
modalidade são
4
encontrados subtraindo as
intersecções (30-3-5-
4=10), (40-3-5-5=27), (25-
4-5-5=11) 11
F=25

Restantes=7

Os alunos que se escreveram a pelo menos uma disciplina podem ser

obtidos somando todos valores no interior dos círculos:

P ( A ∪ B ∪ C ) = 18 + 3 + 27 + +5 + 5 + 11 = 73

Outra possibilidade seria usar directamente a fórmula de reunião

P( A ∪ B ∪ F ) = P( A) + P( B) + P( F ) − P( A ∩ B) − P( A ∩ F ) −
P( B ∩ F ) + P( A ∩ B ∩ F )

= 30 + 25 + 40 − 8 − 10 − 9 + 5 = 73 .
Introdução à Estatística Ensino à Distância 127

Os que não estão inscritos em nenhuma modalidade são os que estão fora
dos círculos, mas dentro do rectângulo. É o complementar da reunião de
A, B e F, isto é, os que pertencem ao universo (total de estudantes) mas
não pertencem à reunião.

P ( A ∪ B ∪ F ) = 80 − 73 = 7 .

Sumário
A representação dos dados do problema recorrendo ao diagrama de Venn
é um passo importante na resolução de problemas que envolvem a
reunião de probabilidades.

Se A e B são dois acontecimentos quaisquer, a probabilidade da reunião é


dada por P( A ∪ B) = P( A) + P( B) − P( A ∩ B) , onde P( A ∩ B) é a
probabilidade da intercepção dos dois acontecimentos. Para três
acontecimentos a fórmula de probabilidade é dada por
P( A ∪ B ∪ C ) = P( A) + P( B) + P(C ) − P( A ∩ B)

− P( A ∩ C ) − P( B ∩ C ) + P( A ∩ B ∩ C )

Exercícios
1. Sejam A e B dois acontecimentos. Conhecem-se as
probabilidades P(A) = 0,4, P(B) = 0,5 P ( A ∩ B ) = 0,2.
Auto-avaliação 10 Calcule em função destes valores, as probabilidades dos
seguintes acontecimentos:

a) Realiza-se um e um só dos acontecimentos A e B.

b) Realiza-se pelo menos um dos acontecimentos A e


B.
Tempo de realização :
01:30 minutos
c) Não se realiza nem A nem B.
128 Lição nº 3

d) Realiza-se quando muito um dos acontecimentos A


e B.

e) Realiza-se A e não B.

2. Um levantamento de benefícios para 254 executivos, mostrou que


155 executivos foram agraciados com telefones móveis, 152 com
títulos de membros de clubes e 110 tanto com títulos de membros
de clubes como com telefones móveis.

a) Seja M um evento de se ter um telefone móvel e C o


evento de se ter um título de membro de clube. Encontre
as seguintes probabilidades: P(M), P(C) e P(M∩C).

b) Use as probabilidades no item (a) para calcular a


probabilidade de que um executivo tenha pelo menos um
dos dois privilégios.

c) Qual é a probabilidade de um executivo não ter qualquer


destes privilégios?

3. Um levantamento de assinantes mostrou que 45,8% deles haviam


alugado um carro durante os últimos 12 meses por razões de
negócios, que 54% haviam alugado um carro nos últimos 12
meses por razões pessoais e que 30% haviam alugado um carro
nos últimos 12 meses tanto por razões pessoais como por razões
de negócios.

a) Qual é a probabilidade de que um assinante ter alugado


um carro durante os últimos 12 meses por razões
pessoais ou de negócios?

b) Qual é a probabilidade de que um assistente não ter


alugado um carro durante os últimos 12 meses nem por razões
pessoais nem por razões de negócio nem por razões pessoais?

4. Numa empresa, o patronato pretende seleccionar, entre oito


trabalhadores capacitados, um para dirigir um determinado projecto.
Entre estes trabalhadores, quatro são mulheres e quatro são homens;
destes, dois são irmãos. A selecção será feita aleatoriamente, de modo
que cada um dos oito tem as mesmas chances de ser escolhido. Sejam A o
Introdução à Estatística Ensino à Distância 129

evento “O trabalhador escolhido é um homem” e B o evento “O


trabalhador escolhido é um dos irmãos”.

a) Encontre p(A);

b) Encontre p(B);

c) Encontre p(A∩B);

d) Encontre p(A∪B).

5 Numa cidade são publicados 3 semanários: A, B e C. Sabe-se


que:

• 22% dos habitantes lêem A;


• 15% dos habitantes lêem B;
• 13% dos habitantes lêem C;
• 8% dos habitantes lêem A e B;
• 5% dos habitantes lêem A e C;
• 4% dos habitantes lêem B e C;
• 2% dos habitantes lêem os três.

Calcule a probabilidade de um habitante da cidade escolhido ao


acaso:

a) Ler pelo menos um semanário.


b) Ler um e só um semanário.
c) Não ler qualquer dos semanários.

Para os exercícios seguintes recomenda-se o recurso ao diagrama de


Venn. Sempre que possível, resolva sem recurso a fórmulas. O uso da

Dica notação da teoria de conjuntos para representar os pedidos não deve ser
encerrado com o imprescindível, devendo o estudante usar se se encontrar
em condições de o fazer.
130 Lição nº 3

Feedback

U = 1,0 Resolução da Auto-avaliação


A=0,4 B=0,5

0,2 0,2
0,3
1. Dados:

P( A) = 0,4 P( B) = 0,5 P( A ∩ B) = 0,2


Restantes =0,3

a) P ( A ∩ B ) + P( A ∩ B ) = 0,2 + 0,3 = 0,5 .


M=20

b) P( A ∪ B) = P( A) + P( B) − P( A ∩ B) = 0,4 + 0,5 − 0,2 = 0,7

c) P ( A ∪ B) = 1 − P ( A ∪ B) = 1 − 0,7 = 0,3

d) P ( A ∩ B) = 1 − P ( A ∩ B) = 1 − 0,2 = 0,8

e) P ( A − B ) = P( A ∩ B ) = P ( A) − P ( A ∩ B ) = 0,4 − 0,2 = 0,2

2. Dados:

# Total = 254 # M = 155 # C = 152 # ( M ∩ C ) = 110


U = 254

M=154 C=152
155 152
a) P(M ) = ≈ 0,61; P(C ) = ≈ 0,60;
44 110
254 254
42

110
P(M ∩ C ) = ≈ 0,43
Restantes =57 254

M=20
b) P( M ∪ C ) = P( M ) + P(C ) − P( M ∩ C )

155 + 152 − 110 197


= = ≈ 0,78
254 254

c) P ( M ∪ C ) = 1 − P ( M ∪ C ) = 1 − 0,78 = 0,22
Introdução à Estatística Ensino à Distância 131

3.Dados:

Seja A o acontecimento, ter alugado um carro por razões de negócios e B


ter alugado um carro por razões pessoais.

P( A) = 0,458; P( B) = 0,54 P( A ∩ B) = 0,30

Representemos os acontecimentos num diagrama de Venn.

P( A) = 0,458 P ( B ) = 0,54

P ( A ∩ B ) = 0,30
0,158 0,24

P( AUB) = 1 − (0,158 + 0,30 + 0,24) = 0,302

a) Pede-se a probabilidade da reunião de A e B. Esta probabilidade


pode ser obtida somando as partes que compõem a reunião de
P(A) e P(B) do diagrama de Venn. Recorde-se que pertencem a
reunião de P(A) e P(B) todos os elementos que pertençam a pelo
menos um dos conjuntos. Assim, a solução pode ser encontrada
somando a parte amarela do diagrama (elementos que pertencem
só a P(A)); a parte rosa (elementos que pertencem só a P(B)) e a
parte azul (elementos que pertencem a P(A) e P(B)
simultaneamente). P ( A ∪ B ) = 0,158 + 0,24 + 0,30 = 0,698 .

Outra possibilidade é recorrer à formula de reunião de


probabilidades: P( A ∪ B) = P( A) + P( B) − P( A ∪ B)

= 0,458 + 0,54 − 0,30 = 0,698


132 Lição nº 3

b) Os que não alugaram carro pelas duas razões encontram-se fora


dos dois conjuntos. Como todo espaço amostral corresponde a 1 e
os que pelo menos alugaram por uma das razões são 0,698, a

solução será P( AUB) = 1 − 0,698 = 0,302 .

4 Dados:

Total = 8, Homens = 4, mulheres = 4, irmãos = 2 homens.

A = Homem, B = irmão.

4
a) P ( A) = = 0,5 uma vez que há no total oito pessoas, sendo 4
8
homens.

2
b) P( B) = = 0,25 uma vez que dos 8 trabalhadores, apenas duas
8
pessoas são irmãos.

2
c) P( A ∩ B) = uma vez que há dois homens irmãos
8
( A ∩ B ) no conjunto das oito pessoas.

d) P ( A ∪ B) = P( A) + P ( B) − P ( A ∩ B )

= 0,5 + 0,25 − 0,25 = 0,5

5.

Representemos todos os dados no diagrama de Venn.

Coloque primeiro a parte da intercepção dos 3 conjuntos (0,02). Coloque


em seguida as probabilidades das intercepções de A e B; A e C; e B e C,
não se esquecendo que uma parte delas já está no diagrama (0,02). Por
isso terá por exemplo para a intercepção de A e B 0,06 e não 0,08 pois
0,06 + 0,02 = 0,08. Finalmente complete o diagrama colocando a
probabilidade dos que lêem apenas A, apenas B e apenas C. Por exemplo
Introdução à Estatística Ensino à Distância 133

a probabilidade dos que lêem apenas A é 0,11 uma vez que dos 0,22, 0,02
lêem os três, 0,03 apenas A e C, 0,06 lêem apenas A e B totalizando 0,11
e faltando apenas 0,11 (dos que lêem apenas A) para completar.

U =1

B = 0,15

A = 0,22
0,05
0,06

0,11
0,02
0,02
0,03

0,06

C = 0,13

a)

P( A ∪ B ∪ C ) = 0,11 + 0,06 + 0,02 + 0,03 + 0,05 + 0,02 + 0,06 = 0,35

ou usando a fórmula da reunião para três acontecimentos:

P( A ∪ B ∪ C ) = P( A) + P( B) + P(C ) − P( A ∩ B)

− P( A ∩ C ) − P( B ∩ C ) + P( A ∩ B ∩ C )

P ( A ∪ B ∪ C ) = 0,22 + 0,15 + 0,13 − 0,08 − 0,05 − 0,04 = 0,02 = 0,35

b) A probabilidade procurada é
P ( A ∩ B ∩ C ) + P ( A ∩ B ∩ C ) + P( A ∩ B ∩ C ) , onde cada uma das
parcelas representa sucessivamente os que só lêem A, B e C. Essa
probabilidade é conforme o diagrama 0,11 + 0,05 + 0,06 = 0,21
134 Lição nº 3

c) Os que não lêem qualquer um dos semanários estão


representados no diagrama no exterior dos círculos.

P ( A ∪ B ∪ C ) = 1 − P ( A ∪ B ∪ C ) = 01 − 0,35 = 0,65

Veja mais alguns exemplos exercícios nos livros seguintes:

− NEVES, Maria Augusta at al; Matemática aplicada às ciências


sociais. Porto. Porto editora, 2005.

Leitura − CORREIRA, Adelaide Et al. Cálculo da probabilidade. Bobadela.


Editora Instituto Piaget, 2002.

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003.
Introdução à Estatística Ensino à Distância 135

Lição 4
Probabilidade condicional.
Acontecimentos independentes
Introdução
Na lição anterior estudou o conceito de probabilidade da reunião de
acontecimentos. Nesta lição vai observar como a realização de um
acontecimento pode influenciar a realização do outro e usar o conceito de
probabilidade condicional para identificar acontecimentos independentes.

Esteja atento!

Veja na margem esquerda o tempo de estudo desta lição. Lembre-se que é


apenas um tempo médio. Poderá levar menos ou mais dependendo dos
seus pré-requisitos. Não tenha pressa de concluir a lição. Para entender
melhor volte a resolver os exemplos expostos. A máquina calculadora e o
caderno de exercícios devem acompanhar sempre-lhe. Sucesos!

Esta lição deverá ser estudada em aproximadamente 1 hora.

Tempo de estudo da lição:


01:00 Hora

Ao completar esta lição, você será capaz de:

ƒ Determinar a probabilidade condicional;

ƒ Identificar acontecimentos independentes;


Objectivos
ƒ Resolver problemas envolvendo probabilidade condicional.
136 Lição 4

Probabilidade condicional, acontecimentos independentes e dependentes

Terminologia

Probabilidade condicionada

Vamos introduzir este conceito recorrendo ao seguinte exemplo:

Suponha que 126 pessoas sejam submetidas a um teste para diagnosticar


uma certa doença. O teste dá positivo em 65 pessoas e destas 5 não
apresentam a doença. Dos indivíduos com teste negativo 6 estão doentes.
Exemplo 14
a) Qual é a probabilidade de um indivíduo estar doente?
b) Qual é a probabilidade de um indivíduo apresentar teste
positivo?
c) Qual é a probabilidade de um indivíduo ter resultado
positivo no teste e estar doente?
d) Acaba de ser testado um indivíduo e o resultado do teste
é positivo. Qual é a probabilidade de que ele esteja
doente?
Introdução à Estatística Ensino à Distância 137

Observa a tabela de dupla entrada abaixo:


Para o preenchimento da
tabela comece colocando
o total geral (126) e os
totais parciais fornecidos:
65. Logo o total negativo Estado
será (126-65=61). Como
dos 65 5 são não doentes Resultado do Doente (D) Não Doente Total
os doentes dentro dos que Teste (ND)
apresentam resultado
positivo são 65-5=60. Dos Positivo (+) 60 5 65
indivíduos negativos 6
apresentam a doença
Negativo (-) 6 55 61
ficando 61-5=55 que não
apresentam a doença.
Assim o total de doentes é Total 66 60 126
60+6=66 e o de não
doentes é 5+55=60. Tabela 34: Tabela de Resultado do teste em função do estado (doente ou não doente).
Observa que 66+60=126.

Da tabela conclui-se que:

66
a) P( D) = (66 doentes no total de 126 pessoas).
126

35
b) P (+ ) = (35 positivos no total de 126 pessoas).
126

60
c) P(+ ∩ D) = (60 positivos e doentes no total de 126
126
pessoas).

d) Note agora que a probabilidade procurada incide não em


todos os indivíduos, mas apenas naqueles cujo teste é
60
positivo. Logo a probabilidade procurada é , pois no
65
grupo dos indivíduos com teste positivo o número dos que
apresentam teste positivo é 60.

Esta probabilidade chama-se condicional, uma vez que não incide sobre
todo o conjunto de elementos mas apenas alguns que respondem à
condição “Teste Positivo”. Representa-se por P( D | + ) .

60
P( D \ +) =
65
138 Lição 4

Duma maneira geral se A e B são dois acontecimentos, a probabilidade


de A ocorrer dado que B ocorreu representa-se por P ( A \ B ) .

60
60 120 P(+ ∩ D)
Repare que = ou seja, P ( D \ + ) =
65 65 P(+)
126

Em geral se A e B são dois acontecimentos quaisquer


P( A ∩ B)
P( A \ B) = .
P( B)

Daqui resulta que P( A ∩ B) = P( B) × P( A \ B) = P( A) × P( B \ A)


Fórmula da intersecção de
acontecimentos (fórmula para a intersecção de acontecimentos).

Note ainda que no problema exposto anteriormente a probabilidade de


Acontecimentos
independentes 66
um indivíduo estar doente é P ( D) = . Com a informação de teste
126
60
positivo esta probabilidade aumenta para P ( D \ + ) = . Vê-se que os
65
acontecimentos “Estar doente” e “Apresentar teste positivo” não são
independentes.

Em geral diz-se que dois acontecimentos A e B são independentes se


P ( A) = P ( A \ B) , isto é, a probabilidade do acontecimento A não é
influenciada pela realização do acontecimento B.

Se os acontecimentos não
são independentes, dizem- Substituindo P( A) = P( A \ B) em P( A ∩ B) = P( B) × P( A \ B) tem-
se dependentes.
se a fórmula da intersecção para acontecimentos independentes:

P( A ∩ B) = P( A) × P( B)
Introdução à Estatística Ensino à Distância 139

Realize a seguinte actividade com uma turma da Escola onde lecciona:

Levantamento de dados sobre o sexo e idade dos alunos da turma

1. Escolha uma das turmas que lecciona.

Actividade 19 2. Faça um levantamento sobre a idade dos alunos desta turma em


função do sexo e preencha a seguinte tabela:

Idade

Sexo 18 anos Mais de18 Total


ou menos anos
Tempo de realização:
30 minutos Feminino

Masculino

Total

3. Determine as seguintes percentagens:

a) A percentagem de alunos de ambos os sexos.

b) A percentagem de alnos com 18 anos ou menos.

c) A percentagem dos estudantes do sexo masculino que tem 18


anos ou mais.

d) A percentagem condicional de um estudante ser do sexo


masculino dado que tem 18 anos ou menos.

Em 3c) pede-se a probabilidade da intersecção dos dois acontecimentos


enquanto que em 3d) o conceito de probabilidade condicional deve ser

Dica usado.
140 Lição 4

Acompanhe o seguinte exemplo:

Numa população, 55% dos indivíduos têm excesso de peso, 60% têm
tensão arterial elevada e 20% têm ambas as coisas. Esses dados permitem
concluir que a tensão arterial é independente do excesso de peso?
Exemplo 15

Seja P o acontecimento “o indivíduo tem excesso de peso” e T o


acontecimento “o indivíduo tem tensão arterial elevada”. P e T são
independentes se P (T ∩ P) = P(T ) × P ( P ) . Como

P(T ) × P( P) = 0,55 × 0,6 = 0,33 ≠ 0,2 . Logo os acontecimentos são


dependentes.

Sumário
Se A e B são dois acontecimentos quaisquer, define-se a probabilidade
P( A ∩ B) P( A ∩ B)
condicional como P ( A | B) = e P( B | A) = ,
P( B) P( A)
sendo P( B) ≠ 0 e P( A) ≠ 0 respectivamente.

Note que em geral P ( A | B ) ≠ P( B | A) .

A intersecção de dois acontecimentos A e B é definida como


P( A ∩ B) = P( A | B) × P( B) = P( B | A) × P( A)

Se os acontecimentos A e B forem independentes então


P ( A | B ) = P ( A) ou P ( B | A) = P ( B ) ou ainda

P ( A ∩ B ) = P( A) × P( B) .
Introdução à Estatística Ensino à Distância 141

Exercícios
1. A seguinte tabela mostra a distribuição dos tipos de sangue na
população em geral.

Auto-avaliação 11
A B AB O

Rh+ 34% 9% 4% 38%

Rh– 6% 2% 1% 6%

Tabela 35: distribuição dos tipos de sangue duma população.

a) Qual é a probabilidade de uma pessoa ter o sangue do

Tempo de realização : tipo O?


01:00 Hora. b) Qual é a probabilidade de uma pessoa ter Rh–?
c) Qual é a probabilidade de que em um casal ambos os
cônjuges tenham sangue do tipo AB.
d) Qual é a probabilidade de que em um casal ambos os
cônjuges sejam Rh-?
e) Qual é a probabilidade de uma pessoa ter Rh– dado que
ela tenha sangue do tipo O?
f) Qual é a probabilidade de uma pessoa ter sangue do tipo
B dado que ele ou ela seja Rh+?

2. Numa turma 20% dos alunos falam bem inglês, 40% falam bem
francês e 15% dominam as duas línguas.

Verifique se falar francês e falar inglês são acontecimentos


independentes.

3. Suponha que temos dois acontecimentos, A e B que são


mutuamente exclusivos. Suponha, além disso, que conhecemos
P(A) = 0,30 e P(B) = 0,40.

a) Qual é P(A∩B)?
b) Qual é P(A\B)?
c) Um estudante de estatística argumenta que os conceitos
de acontecimentos mutuamente exclusivos e de eventos
independentes são realmente os mesmos e que, se os
142 Lição 4

eventos são mutuamente exclusivos, eles precisam ser


independentes. Você concorda com essa declaração?
Neste problema, use a informação de probabilidade para
justificar sua resposta.

Dados os resultados desse problema, que conclusão geral você tira sobre
acontecimentos mutuamente exclusivos e eventos independentes?

O exercício 3 ajuda a esclarecer dois conceitos que têm causado muita


confusão no seio dos estudantes: acontecimentos independentes e

Dica mutuamente exclusivos. Dois acontecimentos dizem-se mutuamente


exclusivos se a sua intercepção é vazia, o que implica que a probabilidade
da intercepção destes acontecimentos é zero.

Feedback

Resolução da Auto-avaliação

1. Completemos primeiro a tabela comas probabilidades marginais


(totais parciais)

A B AB O Total

Rh+ 34% 9% 4% 38% 85%

Rh– 6% 2% 1% 6% 15%

Total 40% 11% 5% 44% 100%

a) A probabilidade de a pessoa ter sangue do tipo O é de 44%


(Observe o total parcial de O na última linha).
Introdução à Estatística Ensino à Distância 143

b) A probabilidade de a pessoa ter sangue Rh − é de 15

(Observe o total parcial se Rh − .

c) Note que um casal é constituído por 2 pessoas e a


probabilidade de cada um ter sangue AB é de 5%. Uma vez
que a probabilidade do homem ser do tipo AB não influencia
a da mulher vir a ser ou vice-versa, estamos perante
acontecimentos independentes, cuja probabilidade da
intersecção de dois acontecimentos A e B , isto é
P( A ∩ B) = P( A) × P( B) . Logo a probabilidade pretendida
é 0,05 × 0,05 = 0,0025.

d) Segundo o argumento apresentado na alínea anterior, a


probabilidade de num casal ambos cônjuges serem Rh − é
0,15 × 0,15 = 0,0225 .
e) Trata-se neste caso de probabilidade condicional

P ( Rh − ∩ O) 0,06
P ( Rh − | O) = = ≈ 0,14
P(O) 0,44

P( B ∩ Rh + ) 0,09
f) P ( B | Rh + ) = = ≈ 0,11
Rh + 0,85

2. Como são dados os acontecimentos A - falar inglês, e B - Falar


francês e P( A ∩ B) falar A e B, verifiquemos a independência

pela fórmula P ( A ∩ B ) = P( A) × P ( B ) Como

P ( A ∩ B) = 0,15 e P ( A) × P( B) = 0,2 × 0,4 = 0,08 ; conclui-


se que os acontecimentos não são independentes.

3.

a) Uma vez que A e B são mutuamente exclusivos, a sua


intercepção é vazia, portanto, P( A ∩ B) = 0
144 Lição 4

P( A ∩ B) 0
b) P( A | B) = = = 0.
P( B) 0,40

c) Não. Neste coso uma vez que os acontecimentos são


mutuamente exclusivos, temos que
P( A ∩ B) = 0 ≠ P( A) × P( B) = 0,3 × 0,4 = 0,12 .

d) Há diferença entre acontecimentos mutuamente exclusivos e


acontecimentos independentes.

Leia ainda os seguintes livros:

− NEVES, Maria Augusta at al; Matemática aplicada às ciências


sociais. Porto. Porto editora, 2005.

Leitura − CORREIRA, Adelaide Et al. Cálculo da probabilidade. Bobadela.


Editora Instituto Piaget, 2002.

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003.
Introdução à Estatística Ensino à Distância 145

Lição nº 5
Probabilidade total e fórmula de
Bayes
Introdução
Na lição anterior, com o conceito de probabilidade condicional, vimos
que a revisão de probabilidades quando uma nova informação é obtida é
um processo importante na análise de probabilidades. Frequentemente
começamos a análise com um cálculo de probabilidade inicial ou prévia.
A partir de fontes como amostras, relatórios ou experiências obtemos
informação adicional. Com essa informação actualizamos os valores
prévios de probabilidade calculados anteriormente determinando as
probabilidades posteriores. O teorema de Bayes fornece um meio para
fazer esses cálculos de probabilidades.

Preste atenção ao tempo de estudo desta lição, indicado ao lado.

Esta lição deverá ser estudada em aproximadamente 1 hora.

Tempo de estudo da lição:


01:00 Hora

Ao completar esta lição, você será capaz de:

ƒ Resolver problemas aplicando a fórmula de probabilidade total;

ƒ Determinar probabilidades posteriores usando a fórmula de Bayes.


Objectivos

Acompanhe atentamente o exemplo seguinte, que introduz a fórmula de


probabilidade total e a fórmula de Bayes:
146 Lição nº 5

Um estudante ao entrar numa universidade foi informado de que havia


30% de possibilidade de vir a receber uma bolsa de estudo. No caso de a
receber, a probabilidade de se licenciar é 85% enquanto no caso de não a
Exemplo 16
obter, a probabilidade de se licenciar é de apenas 45%.

a) Determine a probabilidade de que o estudante se licencie.

b) Se daqui a uns anos, encontrar o estudante já licenciado, qual


a probabilidade de que tenha recebido a bolsa de estudo?

Feedback
Resolução:

Seja P(L) a probabilidade de o estudante se licenciar e P(B) a


probabilidade de receber uma bolsa.

Pretende-se P ( L) e P ( B \ L) , que são respectivamente as


probabilidades de se licenciar e de receber a bolsa dado que se licenciou.

Representemos os dados disponíveis num diagrama de árvore:

B e L são as probabilidades
de não receber a bolsa e de
não se licenciar
respectivamente.

B
L
Figura 13: Diagrama de árvore para o problema exposto acima.
Introdução à Estatística Ensino à Distância 147

Repare que há duas saídas para o estudante se licenciar: Recebendo a


bolsa ou não recebendo a bolsa.

Então, pode-se escrever:

P ( L ) = P ( B ∩ L) + P ( B ∩ L)

Recorrendo à probabilidade condicional: P ( B ∩ L) = P ( B) × P( L \ B )

e P ( B ∩ L) = P ( B ) × P( L | B ) .

Substituindo: P ( L) = P ( B ∩ L) + P ( B ∩ L)

= P( B) × P( L \ B) + P ( B ) × P ( L | B )

= 0,3 × 0,85 + 0,7 × 0,45

= 0,57

A expressão P ( L) = P ( B) × P ( L \ B ) + P( B × P ( L \ B ) chama-se
fórmula de probabilidade total.

b) Facilmente determina-se
P( B ∩ L) P( B) × P( L \ B) 0,3 × 0,85
P( B \ L) = = = ≈ 0,45
P( L) P( L) 0,57
.

Repare que a expressão acima pode ser desenvolvida, substituindo o P(L)


pela fórmula de probabilidade total:

P(B∩L) P(B)×P(L \ B) P(B)×P(L \ B)


P(B \ L) = = =
P(L) P(L) P(B)×P(L \ B) + P(B) + P(B)×P(L \ B)

Esta expressão é conhecida como fórmula de Bayes.


148 Lição nº 5

Em geral se A e B são dois acontecimentos tais que o acontecimento B


resulta de dois acontecimentos mutuamente exclusivos A1 e A2 então:

P ( B ) = P ( A1 ) × P( B \ A1 ) + P ( A2 ) × P( B \ A2 ) Fórmula de
Probabilidade total para dois acontecimentos.

P ( A1 ∩ B)
E P ( A1 | B) = fórmula de
P ( A1 ) × P( B | A1 ) + P( A2 ) × P ( B | A2 )
Bayes para 2 acontecimentos.

Para n acontecimentos a fórmula de probabilidade total e o teorema de


Bayes fica:

P ( B ) = ∑ P ( Ai ) × P( B | Ai )
P( A1 ∩ B )
P ( A1 | B) =
∑ P( Ai ) × P( B | Ai )

O gerente de um restaurante classifica os seus clientes em três categorias:


Bem vestidos (50%), Moderadamente vestidos (40%) e Mal vestidos
(10%). 70% dos Bem vestidos, 50% dos Moderadamente vestidos e 30%
Exemplo 17
dos Mal vestidos pedem um vinho ao entrar no restaurante.

a) Qual é a probabilidade de que um cliente escolhido


aleatoriamente peça um vinho?

b) Se se pedir um vinho, qual é a probabilidade de que o


cliente que o pede esteja bem vestido?
Introdução à Estatística Ensino à Distância 149

Dados:
BEV=Bem vestidos, MAV
= Mal vestidos, MOV=
Moderamete vestidos. V
V=Vinho

V ∩ MAV V ∩ BEV

Mal Vestidos Bem Vestidos


Moderamente Vestidos

P( BEV ) = 0,5

P( MAV ) = 0,4

P ( MOV ) = 0,1

P(V | BEV ) = 0,7

P (V | MOV ) = 0,5

P(V | MAV ) = 0,3

P (V ) = ?
P ( BEV | V ) = ?

a)
P(V) = P(BEV) × P(V | BEV) + P(MOV) × P(V | MOV) + P(MAV) × P(V | MAV)

= 0,5 × 0,7 + 0,4 × 0,5 + 0,1 × 0,3

=0,58.

P ( BEV ) × P (V | BEV ) 0,5 × 0,7


b) P ( BEV ) | V ) = = ≈ 0,60.
P(V ) 0,58
150 Lição nº 5

Sumário
Para determinar probabilidades posteriores use a fórmula de Bayes,
P( A1 ∩ B )
P ( A1 | B) = , onde
∑ P( Ai ) × P( B | Ai )
∑ P( A ) × P( B | A ) = P( B) , com i = 1,2,3,..., n
i i

Exercícios

1. Numa determinada localidade 60% dos utilizadores da Internet


nos seus computadores pessoais fazem-no através da ligação à
empresa A, enquanto os restantes são clientes da empresa B. Após
Auto-avaliação 12
um estudo de opinião de mercado conclui-se que 70% dos
utilizadores estão satisfeitos com o serviço. Dos clientes da
empresa A, 80% afirmaram estar satisfeitos com o seu serviço.

a) Determine a percentagem de utilizadores que são clientes da


empresa A e que estão satisfeitos com o seu serviço.

Tempo de realização : b) Qual a percentagem de clientes da empresa B que estão satisfeitos


01:30 com o seu serviço?

c) Sabendo que o cliente está satisfeito, qual a probabilidade se ser


da empresa A?

2. O livro de riscos (1994) contém informações de probabilidade


sobre os riscos que as pessoas correm nas actividades do dia - a - dia. Por
exemplo, a probabilidade de que um homem que possui veículo
motorizado se acidente no período de um ano está relatada como duas
vezes maior que a probabilidade de uma mulher que tem um veículo
motorizado no período de um ano. As probabilidades indicadas são 0,113
para homens e 0,057 para as mulheres. Suponha que 55% dos motoristas
Introdução à Estatística Ensino à Distância 151

numa cidade sejam homens. No preenchimento de um questionário


histórico sobre o desempenho no volante, uma pessoa da cidade indicou
um envolvimento em acidente com veículo motorizado durante o último
ano. Qual é a probabilidade de essa pessoa ser mulher?

3. Na produção de um tipo de peça verifica-se que 3% resultam


defeituosas. Para reduzir ao mínimo a comercialização de peças
com defeito, foi instalado um controlo de qualidade que detecta
95% das peças efectivamente defeituosas, embora também
classifique como tal 4% das que o não são.

Calcule a percentagem de peças rejeitadas pelo controlo de


qualidade, e verifique que a maioria delas são de boa qualidade.

4. Numa determinada vila, 8% dos habitantes apresentam sintomas


de uma determinada doença. Os testes médicos a todos os
habitantes da vila resultaram positivos em 80% dos indivíduos
suspeitos (i.e. com sintomas) e negativos em 80% dos indivíduos
não suspeitos. Se para um indivíduo o teste é positivo, qual é a
probabilidade de que ele seja do grupo dos suspeitos?

5. No trajecto de um avião de guerra há duas estações de radar


inimigas equipadas com baterias antiaéreas, que são accionadas
só se o avião for detectado. O avião tem uma probabilidade de
0,25 de ser detectado pela primeira estação, e, sendo detectado,
tem três hipóteses em cinco de não ser abatido por essa estação.
Se o avião não for detectado pela primeira estação, ele se
aproxima da segunda nas mesmas condições que a primeira. Em
contrapartida, se a primeira estação o detecta sem o abater, ele é
de certeza detectado e abatido pela segunda estação.

a) Qual a probabilidade de o avião não ser abatido pela


primeira estação?

b) Qual a probabilidade de o avião não ser abatido?

c) Sabendo que o avião foi abatido, qual a probabilidade de


ter sido a primeira estação abatê-lo?
152 Lição nº 5

Procure apresentar um esquema para cada problema.

Dica

Feedback

Resolução da Auto-avaliação

1.

Sejam os acontecimentos A - O utilizador está ligado à empresa


A; B - O utilizador está ligado à empresa B; S - O cliente está
satisfeito com o serviço e S - O cliente não está satisfeito com o
serviço.

São dados:

P( A) = 0,6; P( B) = 1 − 0,6 = 0,4; P( S ) = 0,7; P( S | A) = 0,8

A
S
S

B
S
Introdução à Estatística Ensino à Distância 153

a) P( S ∩ A) = P( A) × P( S | A) = 0,6 × 0,8 = 0,48 ,

b) Pede - se P( B ∩ S ) .

Observe que P ( S ) = P( S ∩ A) + P( S ∩ B ) .

Logo, isolando o pedido segue P ( B ∩ S ) = P( S ) − P( S ∩ A)

Mas P( S ∩ A) = P( A) × P( S | A) segundo a definição da intercepção


de acontecimentos.

P ( B ∩ S ) = P ( S ) − P ( S ∩ A) substituindo

= 0,7 − 0,6 × 0,8 = 0,7 − 0,48 = 0,22

c) Pede-se P( A | S ) , que pode ser encontrado recorrendo à fórmula

P ( A ∩ S ) 0,48
de Bayes: P ( A | S ) = = ≈ 0,69 . Repare que
P( S ) 0,7
P ( A ∩ S ) = P( A) × P( S | A) = 0,6 × 0,8 = 0,48 já foi
determinado a alínea anterior.

2. Dados:

Sejam: A o acontecimento ‘a pessoa envolveu-se num acidente’;

H - ‘a pessoa é homem’

M - ‘a pessoa é mulher’

P ( A | H ) = 0,113, P( A | M ) = 0,05, P( H ) = 0,55 Logo

P ( M ) = 1 − 0,55 = 0,45 .

Pede-se a probabilidade condicional de a pessoa envolvida em acidente


ser mulher dado que envolveu-se num acidente. Essa probabilidade pode
ser obtida pela fórmula de Bayes:
P( M ) × P( A | M )
P ( M | A) =
P( M ) × P( A | M ) + P( H ) × P( A | H )

0,45 × 0,057 0,02565


= = ≈ 0,29 .
0,45 × 0,057 + 0,55 × 0,113 0,0878
154 Lição nº 5

3. Dados:

Sejam os acontecimentos “D” - peças defeituosas, “B” - peças


boas e “+” - peças rejeitadas pelo controle de qualidade (peças
consideradas pelo controle de qualidade como defeituosas).

Esquematicamente:

0,95
+
0,03
D

0,04
+
0,97
B

Pede-se P (+ ) que no diagrama corresponde à parte pintada, uma vez que


as peças consideradas de defeituosas pelo controle de qualidade provém
dos dois grupos: defeituosas e boas.

P (+ ) = 0,03×,95 + 0,97 × 0,04 = 0,0285 + 0,0388 = 0,0673 .

O resultado anterior pode ser obtido usando a fórmula de probabilidade


total:

P (+ ) = P( D) × P(+ | D) + P ( B ) × P (+ | B )

P(+) = 0,03×,95 + 0,97 × 0,04 = 0,0285 + 0,0388 = 0,0673

Para verificar que as peças boas (mas consideradas como defeituosas pelo
controle de qualidade) são a maioria basta comparar as contribuições das
duas partes nas peças rejeitadas que correspondem a uma percentagem de
0,0673. As peças boas contribuem em
0,97 × 0,04 = 0,0388 > 0,03 × 0,95 = 0,0285 que é a contribuição das
peças efectivamente defeituosas.
Introdução à Estatística Ensino à Distância 155

4.

Sejam “D” - habitantes com sintomas da doença, “ND”- habitantes em os


sintomas, “+” - habitantes com teste positivo e “-“ com teste negativo.

Esquematicamente:

0,80
+
0,08
D
− 0,20

+ 0,20
0,92
ND

0,80

Pede-se P ( D | +) que segundo a fórmula de Bayes é:

P( D) × P (+ | D)
P( D | +) = , Substituindo,
P( D) × P (+ | D) + P( ND) × P(+ | ND)

5.

Sejam D1 , D2 , D acontecimentos - o avião é detectado pela primeira


estação, o avião é detectado pela segunda estação e o avião é detectado e
A1 , A2 , A , os acontecimentos o avião é abatido pela primeira estação, o
avião é abatido pela segunda estação e o avião é abatido respectivamente.
156 Lição nº 5

Representemos a situação num diagrama de árvore:

0,6 1 1
A1 D2 A2
0,25
D1
0,4
A1 0,6
A2

0,75 0,25
D2 0,4
D1
A2
0,75
D2

a) Pretende-se a probabilidade de o avião ser abatido pela primeira


estação. Como mostra o diagrama seguinte, duas situações
correspondem a este acontecimento: O avião não é detectado pela
primeira estação e o avião é detectado por esta estação, mas não é
abatido. Estes acontecimentos estão destacados no diagrama
abaixo:

0,6 1 1
A1 D2 A2
0,25
D1
0,4
A1 0,6
A2

0,75 0,25
D2 0,4
D1
A2
0,75
D2

P ( A1 ) = P( D1 ) × P ( A1 | D1 ) = 0,75 + 0,25 × 0,6 = 0,75 + 0,15 = 0,90


Introdução à Estatística Ensino à Distância 157

b) O diagrama abaixo mostra a probabilidade pretendida:

0,6 1 1
A1 D2 A2
0,25
D1
0,4
A1 0,6
A2

0,75 0,25
D2 0,4
D1
A2
0,75
D2

O avião não é abatido em duas hipóteses: não ser detectado por ambas
estações e não ser detectado pela primeira mas ser detectado pela segunda
sem no entanto ser abatido por esta.

P ( A ) = 0,75 × 0,75 + 0,75 × 0,25 × 0,6 = 0,5625 + 0,1125 = 0,675

P ( A1 ∩ A) P( A1 )
c) P ( A1 | A) = =
P ( A) P( A)

0,25 × 0,4 0,1


= = ≈ 0,31
0,25 × 0,4 + 0,25 × 0,6 × 1 × 1 + 0,75 × 0,25 × 0,4 0,325

Leitura complementar

− NEVES, Maria Augusta at al; Matemática aplicada às ciências


sociais. Porto. Porto editora, 2005.

Leitura − CORREIRA, Adelaide Et al. Cálculo da probabilidade. Bobadela.


Editora Instituto Piaget, 2002.

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003.
158 Unidade 3

Unidade 3
Distribuição normal
Introdução
A distribuição normal é um dos modelos estatísticos mais importantes.
Esta importância prende-se ao facto de muitos acontecimentos na
natureza seguirem a distribuição normal ou se aproximarem a ela. Nesta
unidade vai aprender a determinar percentagens (probabilidades) usando
a distribuição normal e resolver problemas ligados a esta distribuição.

Esta unidade comporta 2 lições. O seu estudo deverá durar cerca de 04


horas e meia. O caderno de notas e a calculadora deverão acompanhar
todo o estudo.

Tempo de estudo da
Unidade: 04:30 Horas

Ao completar esta unidade, você será capaz de:

ƒ Determinar probabilidades usando a distribuição normal;

ƒ Resolver problemas envolvendo a distribuição normal.


Objectivos

Plano de estudo da unidade

Nº da lição Tema Tempo de Tempo de


estudo resolução da
autoavaliação

1 Distribuição 1 Hora 30 minutos


normal. Uso da
tabela

2 Resolução de 1 Hora 2 Horas


problemas
envolvendo a
distribuição
normal
Introdução à Estatística Ensino à Distância 159

Lição nº 1
Distribuição normal. Uso da tabela
de distribuição normal.
Introdução
Nesta lição vamos introduzir a distribuição normal, falando da curva da
distribuição, e do uso da tabela desta distribuição para determinar
probabilidades de variáveis que sejam normalmente distribuídas.

Esta lição deverá ser estudada em aproximadamente 1 hora.

Tempo de estudo da lição:


01:00 Hora

Ao completar esta lição, você será capaz de:

ƒ Conhecer a curva de distribuição normal:

ƒ Usar a tabela de distribuição normal padrão na determinação de


Objectivos probabilidades;
160 Lição nº 1

Distribuição normal de probabilidade

Considere a seguinte tabela que mostra a altura dos estudantes duma


turma do curso de contabilidade:

Tabela 5.1 Altura dos alunos do curso de contabilidade.

Altura (cm) 145-150 150-155 155-160 160-165 165-170 170-175 175-180

N° de alunos 3 5 11 14 12 4 1

Tabela 36: Tabela de frequência das alturas de alunos dum curso de contabilidade

Apresentemos o polígono de frequências relativas para esta situação:

30
25
% de alunos

20
15
10
5
0
142.5

147.5

152.5

157.5

162.5

167.5

172.5

177.5

182.5

Altura (cm)

Figura 14: Polígono de frequências da altura dos alunos do curso de contabilidade.

Observe que a área sob o polígono corresponde a 100%. Isto significa ser
possível com ajuda do gráfico encontrar a percentagem de estudantes
com uma altura inferior a 150 cm, bastando para tal conhecer a área sob o
polígono à esquerda de 150.
Introdução à Estatística Ensino à Distância 161

Um polígono com esta disposição representa aproximadamente um tipo


de distribuição muito especial e muito comum em fenómenos da
natureza: a distribuição normal.

A distribuição normal é simétrica em relação à média e os seus valores


centrais coincidem. ( x = Me = Mo ).Ver figura 3.2

x = Mo = Me
Figura 15: Curva de distribuição normal

Sempre que uma variável se comporte normalmente pode-se conhecer a


percentagem de indivíduos que assumem certos valores, desde que se
conheça a média e a variância (ou desvio padrão). A sua função é:

1 x−μ
1 − ( )2
f ( x) = e 2 σ
σ 2π

Para conhecermos a percentagem dos estudantes da turma de


Contabilidade com altura entre 150 a 160 cm, dado que a média é 162 e
desvio padrão 7; teríamos que calcular

160 1 x −162 2
1 − ( )

7 2π ∫
150
e 2 7
dx ;

que exige um bom domínio de cálculo integral.


162 Lição nº 1

Uma vez que a distribuição normal verifica-se em inúmeros fenómenos


aleatórios e nos mais variados campos do conhecimento, os seus valores
foram tabelados para ultrapassar este inconveniente.

Mas tanto a média assim como o desvio padrão podem assumir uma
infinidade de valores, o que implicaria uma infinidade de tabelas
contendo as diversas combinações dos dois parâmetros μ e σ . Como
consequência para o cálculo de probabilidades, em vez de se considerar a
variável original X, utiliza-se a variável Z, designada por variável
estandardizada, reduzida ou normal padrão. A variável Z resulta da
variável X mediante a transformação:

x −μ
z=
σ

Deste modo passamos de uma distribuição normal de média e desvio


padrão respectivamente μ e σ , para a distribuição normal padrão de
média 0 e desvio padrão 1. É a partir das tabelas de distribuição normal
padrão que se calculam as probabilidades para qualquer variável com
distribuição normal.

Uso da tabela da distribuição normal padrão no cálculo de


probabilidades

A tabela da distribuição normal padrão que consta nos apêndices A e B


ajudam a determinar probabilidades para variáveis distribuidas
normalmente.

Z
0
Figura 16: Área à esquerda da curva de distribuição normal
padrão. FZ ( z ) = P(Z ≤ z )
Introdução à Estatística Ensino à Distância 163

A tabela do apêndice A fornece a área à esquerda do valor de Z dado.

Para determinar P ( Z < 1,45) (área a esquerda de 1,45) use a parte


positiva da tabela normal padrão. Note que 1,45 = 1,4 + 0,05. A consulta
é feita na linha 1,4 e na coluna 0,05. A área encontra-se na intercepção da
linha e coluna, P ( Z < 1,45) = 0,9265 .

Já para consultar P ( Z ≥ 0,89) (área à direita de 0,89) use

1 − P ( Z < 0,89) , bastando para tal consultar a linha 0,8 e coluna 0,09.
P( Z ≥ 0,89) = 1 − 0,8133 = 0,1867.

Note que:

Nas variáveis contínuas como e


o caso, a probabilidade é
1) P(< 0,89) = P( Z ≤ 0,89)
assumida como área.
P (≤ 0,89) = P ( Z = 0,89)
+ P( Z < 0,89) uma vez que Outra possibilidade é determinar P ( Z ≤ −0,89) uma vez que a
em 0,89 não há área, distribuição normal é simétrica em relação origem.
probabilidade é zero, ficando a
parte de Z<0,89 P( Z ≥ 0,89) = P( Z ≤ −0,89) = 0,1867 .

Use tabela da distribuição normal para determinar:

a) P(Z ≤ 2)

Exemplo 18 b) P(Z ≥ 1,35)

c) P(–2 ≤ Z ≤ 1,43)

a)

2
164 Lição nº 1

Como P(Z ≤ 2) significa a área à esquerda de 2 a consulta é directa:


Consulta-se na linha 2,0 e coluna 0,00 da tabela de distribuição normal do
apêndice A. O valor encontrado no cruzamento da linha e coluna é a área
correspondente, isto é, P(Z ≤ 2) = 0,9772 = 97,72%.

b)

-1,35

P(Z ≥ 1,35) significa a área à direita de - 1,35. Consulte a parte simétrica


P( Z ≥ −1,35) = P( Z ≤ 1,35) = 0,9115 = 91,15% .Outra possibilidade é
P(Z ≥ 1,35) = 1 - P(Z < 1,35) = 1 - 0,0885 = 91,15%.

-2 1,43

c) P(-2 ≤ Z ≤ 1,43) significa a área entre - 2 e 1,43. Com ajuda da


tabela facilmente se determina a área à esquerda de 1,43 e - 2,
sendo a área pretendida a diferença entre tais áreas.

P(-2 ≤ Z ≤ 1,43) = P(Z ≤ 1,43) - P(Z ≤ -2)

= 0,9236 – 0,0228 = 90,08%.


Introdução à Estatística Ensino à Distância 165

Determine com o auxílio da tabela da distribuição normal:

a) U

Actividade 20 b) P( Z > 2,08)

c) P( Z ≤ 1,34)

d) P( Z ≥ −1,09)

e) P(2,07 < Z ≤ 3)

f) P(−0,03 < Z < 0,91)

Cada valor de Z deve ser decomposto em duas partes: uma parte


constituída pela parte inteira até a primeira casa decimal e a segunda

Dica parte, a segunda casa decimal. A primeira parte deve-se consultar na linha
e a outra na coluna. A tabela fornece-nos a parte à esquerda do valor de Z
dado. Os casos de Z ≥ a podem ser resolvidos consultando a área
simétrica Z ≤ − a .

Sumário
A determinação de probabilidades da distribuição normal faz-se mediante
a consulta na tabela. As tabelas constam nos apêndices A e B. A tabela do
apêndice A é vantajosa quando se deseja encontrar a área á esquerda de
um dado valor de Z, enquanto a do apêndice B dá mais facilidades
quando a área a determinar está na parte à esquerda.
166 Lição nº 1

Exercícios

Usando a tabela da distribuição normal determine:

a) P(Z ≤ 1,43)
Auto-avaliação 13
b) P(Z ≥ 1,15)

c) P( Z ≤ -1,24)

d) P( Z ≥ -1,64)

e) P(-2 ≤ Z ≤ -1)

f) P(1,31 ≤ Z ≤ 2,44)

g) P(0 ≤ Z ≤ 2)
Tempo de realização :
30 minutos. h) P(-2 ≤ Z ≤ 0)

i) P(-1,32 ≤ Z ≤ 1,74)

Feedback

a) A consulta neste caso é feita directamente na tabela. O valor


correspondente encontra-se na linha 1,4 e coluna 0,03
P( Z ≤ 1,43) = 0,9236 = 92,36% .

b) A tabela fornece a área à direita do valor de Z dado, no entanto o


exercício pede a parte complementar. P ( Z ≥ 1,15) = 1 − P ( Z ≤ 1,15)

= 1 − 0,8749 = 0,1251 = 12,51%

c) Neste caso a consulta também faz-se directamente na parte


negativa; consulte a linha -1,2 e coluna 0,04.
Introdução à Estatística Ensino à Distância 167

P( Z ≤ −1,24) = 0,1075 = 10,75% .

d) P( Z ≥ 1,64) = 1 − 0,0505 = 0,9495 = 94,95%

e) Representemos a área pretendida na curva normal:

− 2 −1

Note que a tabela fornece-nos a área à esquerda de qualquer valor de Z.


Para determinar a área entre -2 e -1, determina-se primeiro à esquerda de
-1 e depois subtrai-se a área à esquerda de -2, ficando a área pretendida.

P(−2 ≤ Z ≤ −1) = P( Z ≤ −1) − P( Z ≤ −1) = 0,1587 − 0,0228 = 0,1359


= 13,59%

f) A resolução deste caso é semelhante ao caso da alínea anterior:


Determinar a área à esquerda de 2,44 e subtrair a área à esquerda de 1,31.

P (1,31 ≤ Z ≤ 2,44) = P( Z ≤ 2,44) − P ( Z ≤ 1,31) = 0,9927 − 0,9049 = 0,0878


= 8,78%

g) P (0 ≤ Z ≤ 2) = P( Z ≤ 2) − P ( Z ≤ 0)

= 0,9772 − 0,5000 = 0,4772 = 47,72%

h) A distribuição normal é simétrica em relação ao ponto médio.


Sendo assim, a área entre 0 e 2 é igual á área entre -2 e 0.

P(−2 ≤ Z ≤ 0) = 47,72%

Ou P (−2 ≤ Z ≤ 0) = P ( Z ≤ 0) − P( Z ≤ −2)
168 Lição nº 1

= 0,5000 − 0,0228 = 0,4772 = 47,72%

i) Representemos a área pretendida na curva normal:

− 1,32 1,74

P(−1,32 ≤ Z ≤ 1,74) = P( Z ≤ 1,74) − P( Z ≤ −1,32)

= 0,9591 − 0,0934 = 0,8657 = 86,57%

Veja ainda exemplos de exercícios sobre a distribuição normal nos


manuais a seguir listados:

− NEVES, Maria Augusta at al; Matemática aplicada às ciências


sociais. Porto. Porto editora, 2005.

Leitura − CORREIRA, Adelaide Et al. Cálculo da probabilidade. Bobadela.


Editora Instituto Piaget, 2002.

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003

− LEVIN, Jack et al; Estatística para ciências Humanas. São


Paulo.Editora Pearson, 2004.
Introdução à Estatística Ensino à Distância 169

Lição nº 2
Resolução de problemas
envolvendo a distribuição normal
Introdução
Na natureza, variáveis como a altura, o peso, a temperatura do corpo do
homem saudável, a quantidade de hemoglobina no sangue, etc,
apresentam aproximadamente uma distribuição normal. Nesta lição vai
usar a distribuição normal para resolver problemas envolvendo esse tipo
de varáveis.

Esta lição deverá ser estudada em aproximadamente 1 hora.

Tempo de estudo da lição:


01:00 Hora

Ao completar esta lição, você será capaz de:

ƒ Resolver problemas usando a distribuição normal.

Objectivos

Resolução de problemas envolvendo a distribuição normal

As tabelas apresentadas nos apêndices A e B referem-se a distribuição


normal padrão. (média 0 e desvio padrão 1). Na prática as variáveis
apresentam valores variados para a média e desvio padrão. Para se poder
consultar a tabela há que passar estas distribuições para a forma normal
padrão mediante a expressão:
170 Lição nº 2

X −μ
z=
σ

Em que:

X é o valor da variável que se pretende transformar;

μ a média e;

σ o desvio padrão.

Uma variável aleatória está distribuída normalmente com uma média


μ = 50 e desvio padrão de σ = 5 .

Exemplo 19 a) Qual é a probabilidade de a variável aleatória assumir


valores entre 45 e 55?

b) Qual a probabilidade de a variável aleatória assumir um


valor menor que 60?

Feedback
Resolução:

X Z

45 55 -1 1

Figura 17: Diagramas ilustrando a passagem duma distribuição normal para uma
distribuição normal padrão.

a) Seja X a variável aleatória em questão, μ = 50 e σ = 5 .

Pretende-se P(45 ≤ X ≤ 55) .Passando para variáveis


padronizadas segue:
Introdução à Estatística Ensino à Distância 171

X1 − μ 45 − 50
Z1 = = = −1
σ 5
X2 − μ 55 − 50
Z2 = = =1
σ 5

P (45 ≤ X ≤ 55) = P (−1 ≤ Z ≤ 1) = 0,8413 − 0,1587 = 68,26%

60 − 50
b) P ( X < 60) = P( Z < ) = P ( Z < 2) = 97,72%
5

Transforme cada uma das variáveis normais seguintes, em variáveis


padronizadas:

Actividade 21 a) Variável X = 1,80, onde X representa a altura de estudantes


duma universidade com média 1,69 m e desvio padrão 0,4 m.

b) Variável X = 25, onde X representa a idade de indivíduos


duma cidade com média 37 anos e desvio padrão 5 anos.

c) Variável Y = 3011, onde Y representa o tempo de vida dum


componente com média 3956 horas e desvio padrão

X −μ
Use a expressão z = para passar o valor da variável para a forma
σ
normal padrão.
Dica
172 Lição nº 2

Acompanhe atentamente o exemplo seguinte:

O tempo necessário para se completar um exame final num curso de uma


faculdade particular é distribuído normalmente com média 80 minutos e
desvio padrão de 10 minutos.
Exemplo 20
a) Qual a probabilidade de se completar o exame em uma
hora ou menos?

b) Qual é a probabilidade de que um estudante completará o


exame em mais de 60 minutos porém em menos de 75
minutos?

c) Considere que a classe tenha 60 estudantes e que o


período do exame seja de 90 minutos. Quantos
estudantes você espera que serão incapazes de completar
o exame no tempo determinado?

Feedback
Resolução:

60 − 80
a) P ( X ≤ 60) = P( Z ≤ ) = P( Z ≤ −2) = 2,28%
10

60 − 80 75 − 80
b) P (60 < X < 75) = P( <Z< )=
10 10

= P( −2 < Z < −0,5) = 0,3085 − 0,0228 = 28,57%

90 − 80
c) P ( X > 90) = P ( Z > ) = P ( Z > 1)
10

= 1 − 0,8413 = 15,87%
Introdução à Estatística Ensino à Distância 173

Sumário
Na resolução de problemas envolvendo a distribuição normal há que
mediante a expressão

X −μ
z=
σ

Passar duma distribuição qualquer normal para a distribuição normal


padrão.

Exercícios

1. Dada uma distribuição normal com média 12 e desvio padrão 1,5,


calcule:

Auto-avaliação 14 a) P(x ≤ 10).

b) P(x ≥ 8).

c) P(10 ≤ x ≤ 13).

2. Dada uma distribuição normal com média 8 e variância 16,


calcule:

Tempo de realização : a) P(x ≤ 5).


02:00 Horas.
b) P(x ≥ 15).

3. A distribuição dos pesos dos soldados de um quartel segue uma


distribuição normal com μ = 64 e σ = 10 (em Kg). Determine a
percentagem de soldados que pesam:

a) Mais do que 64 Kg;

b) Entre 54 Kg e 74 Kg;

c) Menos que 54 Kg.


174 Lição nº 2

4. Determinada classe de operários industriais tem os seus salários


semanais em torno de uma média de 2000, 00 U.M., com desvio
padrão de 300, 00 U.M. (supor normalmente distribuídos).

Encontre a probabilidade de um operário desta classe ter salário


semanal situado entre 1.800,00.U.M. e 2500, 00 U.M.

5. Determinada máquina de empacotar arroz está regulada para um


peso unitário líquido de 5Kg, com desvio padrão de 200g.
Embalagens com peso líquido inferior ou superior ao regulado
(5 ± 0,2 Kg) são reembaladas até estarem dentro das
especificações. Calcule:

a) A percentagem de embalagens que é recusada pelo


controlo de qualidade.

b) Numa produção mensal de 32000 unidades, qual será o


n° de embalagens recusado pelo controlo de qualidade?

6. Recentemente efectuou-se um estudo das modificações


percentuais dos preços de alguns produtos de consumo imediato e
verificou-se que estes se distribuem normalmente com média de
46% e desvio padrão de 12%.

a) Qual é a proporção de artigos que tiveram os seus preços


aumentados em pelo menos 55%?

b) Admitindo-se que a pesquisa abrangeu 200 produtos,


quantos se esperaria que tivessem os seus preços
aumentados em pelo menos 62%?

3. Uma faculdade admite os seus alunos mediante a realização de


dois exames: teste A ou teste B. Os resultados dos alunos que
realizaram os testes têm uma distribuição normal; calculou-se a
média e o desvio padrão.
Introdução à Estatística Ensino à Distância 175

Teste A Teste B

Média 135 105

Desvio padrão 12 11

Tabela 37: Média e desvio padrão das notas de dois testes.

O Francisco realizou o teste A e obteve 150, enquanto o Miguel


realizou o teste B e obteve 130. Quem está em melhores
condições de entrar para a faculdade?

8. Numa escola é admitido o indivíduo que pertencer ao grupo dos


15% melhores no exame de admissão. Se a média do exame for
87 e o desvio padrão 8, qual será a situação de um indivíduo com
100 pontos?

9. Uma empresa monopolista no mercado de determinado produto,


tem produção constante de 90 toneladas por mês e tem
conhecimento de que a procura é uma variável aleatória
normalmente distribuída com média de 80 toneladas e desvio
padrão de 10 toneladas.

a) Qual a probabilidade (percentagem) de haver uma


procura menor que 50 toneladas?

b) Qual a probabilidade de haver procura excedentária


(procura maior que a oferta)?

c) Para satisfazer a eventual procura excedentária a empresa


tem possibilidade de importar no princípio do mês um
stock de segurança. Qual deve ser esse stock, S, por
forma a que a probabilidade de haver procura insatisfeita
baixe para 0,025?
176 Média

Feedback
Resolução da auto-avaliação :
1.

10 − 12
a) P ( X ≤ 10) = P ( Z ≤ ) ≈ P ( Z ≤ −1,33) = 9,18%
1,5

8 − 12
b) P ( X ≥ 8) = P( Z ≥ ) ≈ P (−2,67)
1,5

= 1 − 0,0038 = 99,62%

10 − 12 13 − 12
c) P (10 ≤ X ≤ 13) = P( ≤Z≤ )
1,5 1,5

≈ P (−1,33 ≤ Z ≤ 0,67) = 0,7486 − 0,0918 = 65,68%

2. Neste caso é dada a variância. Recordar que o desvio padrão é a


raiz quadrada da variância igual neste caso a 4.

5−8
a) P ( X ≤ 5) = P( Z ≤ ) = P ( Z ≤ −0,75) = 22,66%
4

15 − 8
b) P ( X ≥ 15) = P ( Z ≥ ) = P ( Z ≥ 1,75)
4

= 1 − 0,9599 = 0,0401 = 4,01%

3.

a) Pretende-se neste caso P ( X > 64) igual a P ( X ≥ 64) , uma vez


que a probabilidade é encarada como área e portanto
P( X = 64) = 0 , pois entre um ponto e ele mesmo não existe
área nenhuma. Esta probabilidade é 0,5 uma vez que a
distribuição é simétrica em relação à média, correspondente cada
uma das partes (esquerda e direita da média) a 0,5.

64 − 64
Ou P ( X > 64) = P( Z > ) = P( Z > 0) = 0,5 .
10
Introdução à Estatística Ensino à Distância 177

54 − 64 74 − 64
b) P (54 < X < 74) = P ( <Z< )
10 10

= P(−1 < Z < 1) = 0,8413 − 0,1587 = 0,6826 = 68,26%

c) P( X < 54) = P( Z < −1) = 0,1587 = 15,87%

4.

1800 − 2000 2500 − 2000


P(1800 < X < 2500) = P( <Z< )=
300 300
P(−0,67 < Z < 1,67) = 0,9525 − 0,2514 = 0,7011 = 70,11%

5.

a) As embalagens recusadas pelo controle de qualidade são as que


se encontram fora das especificações:

P( X < 5 − 0,2) + P( X > 5 + 0,2) = P( X < 4,8) + P( X > 5,02)

4,8 − 5 5,02 − 5
P(Z < ) + P(Z > ) = P ( Z < −1) + ( Z > 1)
0,2 0,2

= 2 × P ( Z < −1) uma vez que as áreas apresentadas acima são


simétricas (portanto iguais)

= 2 × 0,1587 = 0,3174 = 31,74% .

b) O número de embalagens recusado pelo controle de qualidade é


0,3174 × 32000 = 10157 .

6.

55 − 46
a) P ( X ≥ 55) = P( Z ≥ ) = P ( Z ≥ 0,75)
12
178 Média

1 − 0,7734 = 0,2266 = 22,66% .

b) Para encontrar o número de produtos, determine primeiro a


probabilidade de X ≥ 62

62 − 46
P ( X ≥ 62) = P( Z ≥ ) ≈ P ( Z ≥ 1,33)
12

1 − 0,9082 = 0,0918 = 9,18%

0,0918 × 200 = 19 produtos.

7. Determine e compare os valores de Z, sendo melhor o que tiver


maior valor de Z.

150 − 135
Francisco Z = 1,25
12

130 − 105
Miguel Z = ≈ 2,27
11

Os valores encontrados significam que o Francisco está a 1,25


desvios padrão, enquanto o Miguel encontra-se a 2,27 desvio
padrão. O Miguel está em melhores condições de entrar na
Faculdade.

4. Determine primeiro o limite em função de valores padronizados


de admissão. Procure um valor de z tal que P ( Z ≥ z ) = 0,15 .

Este valor coincide com o valor de z tal que P ( Z < 0,85) .


Procure este último devido a sua praticidade (Lembre-se que a
tabela fornece a área à esquerda de Z).

0,85
0,15

Z
Introdução à Estatística Ensino à Distância 179

Procure na tabela um valor igual ou próximo de 0,8500. Este valor é


0,7995 e corresponde a Z = 0,84 . Isto significa que todo o estudante
com uma nota no exame superior a 0,84 é admitido.

Veja agora qual é o valor padronizado do estudante em causa.

100 − 87
Z= = 1,625 > 0,84 , o que mostra que estudante admite.
8

9.

50 − 80
a) P ( X < 50) = P( Z < ) = P ( Z < −3) = 0,13%
10

90 − 80
b) P ( X > 90) = P ( Z > ) = P( Z > 1) = 1 − 0,8413
10

= 0,1587 = 15,87%

c) Observe a situação representada na curva da distribuição normal:

0,975

0,025

0,975

0,025

90 + S
180 Média

Procure na tabela o valor de Z que corresponde a uma percentagem de


0,975. O valor de Z encontrado é 1,96. Este valor corresponde a X + S em
termos de X.

X −μ 90 + S − 80
Z= ⇔ 1,96 = ⇔ 1,96 × 10 = 10 + S
σ 10

19,6 = 10 + S ⇔ S = 19,6 − 10 = 9,6

Complemente o seu estudo ou tire as suas dúvidas nos seguintes manuais

− NEVES, Maria Augusta at al; Matemática aplicada às ciências


sociais. Porto. Porto editora, 2005.

Leitura − CORREIRA, Adelaide Et al. Cálculo da probabilidade. Bobadela.


Editora Instituto Piaget, 2002.

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003

− LEVIN, Jack et al; Estatística para ciências Humanas. São


Paulo.Editora Pearson, 2004.
Introdução à Estatística Ensino à Distância 181

Unidade 4
Amostragem, distribuições
amostrais e estimação por
intervalos.
Introdução
O grande objectivo da inferência estatística é estimar parâmetros da
população a partir de medidas estatísticas extraídas de uma parte da
população chamada amostra. Esta unidade introduz-nos aos métodos de
inferência estatística dando realce às distribuições amostrais da média, às
proporções e à estimação por intervalos.

Esta unidade comporta 5 lições. O seu estudo deverá durar cerca de 20


horas. O caderno de notas e a calculadora deverão acompanhar todo o
estudo.

Tempo de estudo da
Unidade: 20:00 Horas
Ao completar esta unidade, você será capaz de:

ƒ Caracterizar a distribuição amostral de médias e proporções.

ƒ Usar intervalos de confiança para estimar a média e a proporção da


Objectivos população.

ƒ Determinar o tamanho da amostra a partir da margem de erro.

Amostragem, tipos de amostra, parâmetros e estatísticas, distribuição


amostral da média, distribuição amostral de proporção, margem de erro,
desvio padrão amostral, nível de significância, intervalo de confiança,
Terminologia
grau de confiança
182 Unidade 4

Plano de estudo da unidade

Nº da Lição Tema Tempo de Tempo de


estudo resolução da
auto avaliação

1 Distribuição 2 Horas 2 Horas


amostral e
intervalos de
confiança para a
média da
população

2 Teorema de 2 Horas 2 Horas


limite central

3 Determinação 2 Horas 2 Horas


do tamanho da
amostra a partir
da distribuição
amostral da
média

4 Intervalos de 2 Horas 2 Horas


confiança com a
distribuição t-
Student

5 Intervalos de 2 Horas 2 Horas


confiança para
proporções
Introdução à Estatística Ensino à Distância 183

Lição nº 1
Distribuição amostral e intervalos
de confiança para a média da
população
Introdução
Quais seriam as implicações em usar a média da amostra para estimar a
média da população? Este é um dos problemas fundamentais da
estatística que é discutido nesta lição.

Esta lição deverá ser estudada em aproximadamente 2 horas.

Tempo de estudo da lição:


02:00 Horas

Ao completar a lição, você será capaz de:

ƒ Determinar a distribuição amostral da média.

ƒ Determinar o erro padrão da média.


Objectivos ƒ Determinar o intervalo de confiança para a média da população.

Distribuição amostral da média, erro padrão, grau de confiança, nível de


significância.

Terminologia
184 Lição nº 1

A Necessidade da Amostragem nos Levantamentos

De modo geral, os levantamentos abrangem um universo de


elementos tão grandes que se torna impossível considerá-los na sua
totalidade. Por essa razão o mais frequente é trabalhar com uma
amostra, ou seja, com uma pequena parte dos elementos que
compõem o universo. Quando essa amostra é rigorosamente
seleccionada, os resultados obtidos nos levantamentos tendem a
aproximar-se daqueles que seriam obtidos caso fosse possível
pesquisar todos os elementos do universo. Com o auxílio de
procedimentos estatísticos, torna-se possível até mesmo calcular a
margem de segurança dos resultados obtidos. No apêndice E
apresentamos vários métodos usados na selecção das amostras. As
amostras aleatórias são as preferencialmente empregues em estudos
estatísticos.

Distribuição amostral da média

Suponha que o gerente de uma agência bancária dispõe de 10 000 contas


de seus clientes. Ele pretende determinar o saldo médio disponível para
as 10 000 contas. Assim, toma 500 contas escolhidas aleatoriamente e
encontra uma média de 3,28 milhões de Meticais.

 Ele pode afirmar que o saldo médio das 10 000 contas bancárias
é 3,28 milhões de meticais?
 Se ele seleccionar uma outra amostra de 500 contas bancárias,
sua média será necessariamente igual a 3,28 milhões de
meticais?

Para responder às questões acima considere os dados constantes na tabela


seguinte. Eles mostram as notas de um exame final de 20 estudantes e 3
amostras aleatórias extraídas desta população. (Levin & Fox, 2004).
Introdução à Estatística Ensino à Distância 185

População Amostra A Amostra Amostra C


B

70 80 93 86 85 96 40 72
90 56 52 67 40 99 86 96
78 57 89 49 48 56 56 49
99 72 30 96 94 52 67 56

μ= X1 = X2 = X3 =

Tabela 38: Médias da população e das amostras de notas de 20 estudantes.

Usando os seus conhecimentos adquiridos na unidade 1 determine a


média para cada um dos grupos da tabela anterior.

Actividade 22 Compare cada uma das médias da amostra com a média da população.

A média é dada por


∑x i
, onde n é o tamanho da amostra e xi cada um
n
Dica dos valores observados.

Determinando as médias da população e das amostras pode-se chegar


facilmente à seguinte conclusão:

) Uma média amostral ( X ) quase nunca é exactamente igual a


média populacional ( μ ). A diferença entre a média amostral e
populacional chama-se erro de amostragem. O erro amostral
sempre ocorre independentemente do plano amostral usado.

 Dada a presença do erro amostral como fazer generalização


duma amostra para a população?
186 Lição nº 1

Retome-mos o caso das notas de exame final:

X 1 = 75,75

μ = 71,55
X 1 = 68,25

X1 = 62,25

Figura 18: Média da população e das amostras para as notas de estudantes.

Observe que nenhuma das médias amostrais é igual á média da


população, mas a média das três médias amostrais, isto é,
75,75 + 68,25 + 62,25
= 69,85 (média das médias ou distribuição
3
amostral de médias) é mais próxima da média da população (71,55). Esta
é a estatística usada para estimar a média da população.

) Características da distribuição amostral de médias


1) O valor esperado da distribuição amostral de médias ( a média
das médias) é a média da população( μ ).
2) O desvio padrão de uma distribuição amostral de médias é
menor que o desvio padrão da população, mais concretamente
σ
σX =
n
Introdução à Estatística Ensino à Distância 187

Intervalos de confiança para a média da população

Com os intervalos de confiança pode-se determinar com certa precisão


(nível de confiança ou de significância) a média da população a partir da
média da amostra.

) Para uma distribuição normal o intervalo de confiança para a


média da população é dado por: X ± Z cσ X ; onde Z c é o valor

tabelado da distribuição normal conforme o nível de confiança


escolhido.

Determinemos um intervalo a 95 % de confiança para a verdadeira média


da população das notas do exame final, supondo estas distribuídas
normalmente com desvio padrão da população σ = 20,1:

μ = 71,55
X = 69,85

X = 69,85 .

σ 20,1
σX = = = 11,8 .
n 3

Z c = 1,96 como mostra o diagrama a baixo:


188 Lição nº 1

95%

-1,96 +1,96

O intervalo a 95% de confiança para a média das notas do exame é:

X ± Z cσ X ⇔ 69,85 ± 1,96 × 11,8 ⇔ 69,85 ± 23,1 ⇒

46,75 < μ < 92,95

Isto significa que há 95% de certeza de que a média das notas do exame
esteja entre 46,75 (69,85 - 23,1) e 92,95 (69,85 + 23,1). Note que admite-
se em 5% dos casos que a verdadeira média esteja fora do intervalo
proposto, isto é, admite-se um erro em 5% na estimativa da média das
notas do exame. Este valor é conhecido como nível de signficância.

Uma loja de vestuário está interessada em conhecer os gastos, em


vestuário, dos alunos do ensino secundário no início de cada ano lectivo.
Para uma amostra de 190 alunos a média e o desvio padrão de gastos
Exemplo 21
foram, respectivamente US$157 e US$38. Supondo que a distribuição da
população é normal, construa um IC de 99% para os gastos em vestuário
em toda a população.

σ
Passo 1 Determine o erro padrão da média.( σ X = )
n

σ 38
σX = = = 2,8
n 190

Passo 2 Consulte na tabela da distribuição normal o valor de Z c ,

de acordo com o nível de confiança desejado. Note que


esta percentagem deve estar centrada na média.

Z c = 2,58 para um Intervalo de confiança (IC) de 99%.


Introdução à Estatística Ensino à Distância 189

Passo 3 Determine a margem de erro ( margem de erro = Z cσ X )

Margem de erro = Z cσ X =2,58 × 2,8 = 7,2

Passo 4 Componha o intervalo subtraindo e somando da média


amostral a margem do erro ( X ± Z cσ X )

X ± Z cσ X = 157 ± 7,2 ⇒ 149,8 < μ < 164,2

Assim, a loja tem 95% de confiança de que o gasto médio em vestuário


dos alunos do ensino secundário no início do ano lectivo está entre US$
149,8 e US$ 164,2.

Sumário
Uma forma de estimar a média da população é construir um intervalo de
confiança, com um grau de confiança conhecido. O intervalo para a
média da população com distribuição normal e desvio padrão da
população conhecido é dado por. X ± Z cσ X .

Exercícios

1. Sabe-se que uma máquina produz blocos cujos pesos têm


distribuição normal com desvio padrão 0,12. Uma amostra

Auto-avaliação 15 aleatória de 160 blocos foi tomada, num determinado dia, tendo-
se constatado que possui média 4,07.

a) Encontre o intervalo de confidência (IC) de 95% para a


média de todos os blocos produzidos pela máquina;

Tempo de realização :
02:00 horas.
190 Lição nº 1

b) Sem fazer cálculos, diga se um IC de 99% para a média

de todos os blocos produzidos pela máquina terá


comprimento maior, igual ou inferior ao calculado em a);

c) Suponha que uma outra amostra de 2 000 blocos é


tomada. Sem fazer cálculos, diga se um IC de 95% para a
média populacional terá comprimento maior, igual ou
inferior ao calculado em a)

2. De uma distribuição Normal com σ2 = 1,96 obteve-se a seguinte


amostra: 25,2; 26,0, 26,4; 27,1; 28,2; 28,4. Determine o intervalo
de confiança para a média da população com coeficiente de
confiança 0,90.

3. Na secção de enchimento de latas de tinta de um litro, procede-se


a medições regulares para evitar grandes disparidades nos
conteúdos das latas. A quantidade de tinta (em litros) por lata
segue uma distribuição normal com desvio padrão igual a 0,06.
Numa amostra de 16 latas observou-se uma média de 0,95 litros.

a) Com base na informação da amostra, afirma-se que a


quantidade média de tinta numa lata se situa entre 0,911 e
0,989 litros. Comente e diga qual a confiança a depositar
nessa afirmação.

b) Como procederia se quisesse reduzir para metade a


amplitude do intervalo de confiança da alínea anterior?

Feedback
Resolução da Auto-avaliação

1.

a) O intervalo de confiança para a média da amostra é dado por


σ α
X ± Zα , onde α = 1 − 0,95 = 0,05 ; = 0,025 ;
2 n 2
Introdução à Estatística Ensino à Distância 191

Z α = 1,96 . Observe a ilustração do cálculo de Z α na curva


2 2

normal.

0,95

0,025 0,025

− 1,96 1,96

Para encontrar o valor de Z α = 1,96 , procure na tabela da


2

distribuição normal o valor de Z correspondente à percentagem


de 0,025. Este valor encontra-se na linha -1,9 e na coluna 0,06,
isso é, Z = -1,96. Logo Z α = 1,96 .
2

σ 0,12
X ± Zα = 4,07 ± 1,96 × = 4,07 ± 0,02
2 n 160

4,05 < μ < 4,09

b) Um intervalo de confiança a 99% terá um comprimento maior


uma vez que Z α para este é maior do que o de 95%.
2

c) Com uma amostra de 2000 blocos o intervalo de confiança terá


um comprimento menor (observe que a raiz quadrada do tamanho
da amostra é inversamente proporcional à amplitude do
intervalo).
192 Lição nº 1

2.
σ
O intervalo de confiança é dado por X ± Z α , com α = 0,1 ,
2 n
α
= 0,05 e Z α = 1,64 . (também pode usar o valor 1,65 uma vez que
2 2

estão igualmente próximos da percentagem de 0,05. O valor 1,645 é o


mais correcto e é obtido por interpolação).

A média é dada por

25,2 + 26 + 26,4 + 27,1 + 28,2 + 28,4


X = ≈ 26,88
6

O desvio padrão é a raiz quadrada da variância, 1,96 = 1,4

σ 1,4
Então: X ± Z α = 26,88 ± 1,64 × = 26,88 ± 0,94
2 n 6

25,94 < μ < 27,82 .

3.

a) O intervalo de confiança para a média da população é


0,911 < μ < 0,989

Pretende-se determinar a confiança a partir do intervalo de


confiança dado. Observe que a amplitude do intervalo de
confiança é dado por Limite superior – limite inferior

σ σ σ σ σ
= X + Zα − (X − Zα ) = X + Zα − X + Zα = 2Z α
2 n 2 n 2 n 2 n 2 n

A amplitude para este caso é A = 0,989 − 0,911 = 0,078

σ 0,06 0,06 0,078


Logo, 2 Z α = 0,078 ⇔ 2 × Z α = 0,078 ⇔ Z α =
2 n 2 16 2
4 2

0,039
0,015 × Z α = 0,039 ⇔ Z α = = 2,6 .
2 2
0,015
Introdução à Estatística Ensino à Distância 193

Consultando o valor da probabilidade correspondente ao valor de Z


encontrado encontra-se 0,9953. Mas está área corresponde toda a área á
esquerda de 2,6 e o intervalo de confiança é centrado na média. Fazendo
α
1 − 0,9953 = 0,0047 encontra-se o valor de . Logo α = 0,0094 , o
2
que corresponde a uma confiança de 1 − 0,094 = 0,9906 .

b) A melhor opção é aumentar o tamanho da amostra. Determine-


mos um valor de n que torne a amplitude metade do anterior.

A amplitude do intervalo anterior é 0,078 e metade deste é 0,039.

σ 0,06
Já vimos anteriormente que 2 Z α = A ⇔ 2 × 2,6 × = 0,039 ,
2 n n
elevando ao quadrado ambas igualdades segue:

0,06 2 5,2 2 × 0,06 2


5,2 2 × = 0,001521 ⇒ n = = 64 . Como observa o
n 0,001521
necessário seria quadruplicar o tamanho da amostra.

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003

Leitura − LEVIN, Jack et al; Estatística para ciências Humanas. São


Paulo.Editora Pearson, 2004.
194 Lição nº 2

Lição nº 2
Teorema do limite central
Introdução
O resultado apresentado na lição anterior apresenta um resultado apenas
para casos em que a população segue aproximadamente uma distribuição
normal. Esta lição apresenta uma solução que pode ser usada para casos
mas diversos, mesmo que a distribuição seja desconhecida.

Esta lição deverá ser estudada em aproximadamente 2 horas.

Tempo de estudo da lição:


02:00 Horas

Ao completar esta lição, você será capaz de:

ƒ Enunciar e aplicar o teorema do limite central na estimativa da média


populacional para grandes amostras.

Objectivos

Teorema do limite central

Até agora construímos intervalos de confiança para populações cuja


distribuição era supostamente conhecida. Na maior parte dos estudos não
se conhece nem a média e muito menos a distribuição que a variável
segue. Um grande suporte para inferir valores dessas variáveis é dado por
um dos importantes resultados teóricos da estatística: O teorema do
limite Central:
Introdução à Estatística Ensino à Distância 195

) Sejam X 1 , X 2 , ..., X n variáveis aleatórias independentes com

média e μ e variância σ 2 finitas. Então, quando n → ∞ , a variável

S n − nμ
aleatória , segue uma distribuição normal com média 0 e
σ n
variância 1 {N(0, 1)}; com S n = X 1 + X 2 + ... + X n .

Uma consequência deste teorema é dada a seguir:

) Ao seleccionar amostras simples de tamanho n a partir de uma


população, a distribuição amostral da média da amostra X pode ser
aproximada pela distribuição normal de probabilidade à medida que o
tamanho da amostra se torna maior. ( n ≥ 30 )

Aplicação do teorema do limite central

Seleccionou-se uma amostra de 35 pacientes, e constatou-se que o tempo


de reacção de uma injecção intravenosa é em média 2.1 minutos, com um
desvio padrão da população de 0.1 minutos. Construa um intervalo a 90%
de confiança para o tempo médio de reacção.

Observe que nada se diz sobre a distribuição de X, tempo de reacção de


um paciente a uma injecção intravenosa. Mas como n = 31 , o teorema
do limite central pode ser aplicado. Por consequência deste teorema a

X −μ
variável Z = segue aproximadamente uma distribuição normal
σX
com média 0 (zero) e variância 1. Um intervalo de confiança para a
média da população é dado por X ± Z cσ X . O valor correspondente a um

IC de 90% é Z c = 1,64
196 Lição nº 2

0,1
X ± Z cσ X = 2,1 ± 1,64 × = 2,1 ± 0,03 ⇒ 2,07 < μ < 2,13
31

O peso médio de uma determinada peça satisfazendo normas de qualidade


estabelecidas, deve ser de 300 kg. Uma amostra de 30 peças acusou os
seguintes valores (em kg):
Exemplo 22

250 265 267 269 271 275 277 281 283 284

287 289 291 293 293 298 301 303 306 307

307 309 311 315 319 322 324 328 335 339

Construa um intervalo de confiança, e argumente se esta amostra


satisfaz a especificação. Use α = 5%. ( α = nível de significância)

Como n = 30 , Pode-se usar o teorema do limite central para a


X −μ
distribuição do peso das peças: Z = tem distribuição normal com
s′X
média 0 e variância 1.

Passo 1 Determinar a média e o desvio padrão corrigido:

X =
∑x i
=
8899
= 296,6
n 30

s′ =
∑x 2
i − nx 2
=
2654071 − 30 × 296,62
= 22,7
n −1 29

Passo 2 Determinar uma estimativa para o erro padrão da média:

s′ 22,7
s′X = = = 0,76
n 30
Introdução à Estatística Ensino à Distância 197

Passo 3 Consultar na tabela de distribuição normal o valor de Z c ,

de acordo com o IC:

Para α = 0,05 ⇔ IC = 95% ⇒ Z c = 1,96

Passo 4 Determinar a margem de erro:

Margem de erro = Z c s′X = 1,96 × 0,76 = 1,49

Passo 5 Compor o intervalo de confiança:

X ± Z c s′X = 296,6 ± 1,49 ⇒ 295,11 < μ < 298,09

Uma vez que o intervalo não contém o valor de 300 kg, conclui-se com
95% de confiança que esta amostra não satisfaz às especificações.

Sumário
Quando a distribuição da população não é conhecida e a tamanho da
amostra for de 30 ou mais, a distribuição amostral da média segue
aproximadamente uma distribuição normal. O intervalo de confiança é
dado por X ± Z cσ X . No caso de não se conhecer o desvio padrão da

população, o desvio padrão (corrigido) da amostra pode ser usado.


198 Lição nº 2

Exercícios

1. Os serviços sociais de uma instituição de formação profissional


pretendem estimar o salário médio anual de antigos estudantes, 5

Auto-avaliação 16 anos após a graduação. Uma amostra aleatória de 250 estudantes


produziu uma média de US$ 42 000 e um desvio padrão
corrigido de US$ 4 000. Assumindo que a distribuição da
população é normal, construa um IC de 85% para a média
populacional.

2. Uma amostra de 400 alunos de um colégio produziu uma média


de alturas de 1,64 m com desvio padrão corrigido de 0,62 m.
Tempo de realização:
02:00 Horas Construa um IC de 90% para a altura média dos estudantes do
colégio.

3. Para determinar a média de idades de todos os seus clientes, um


estabelecimento comercial tomou uma amostra de 120
indivíduos, tendo encontrado média de 36 anos. Se o desvio
padrão. na população for de 12 anos, qual será o IC de 70% para
a média de idades na população?

4. Os valores para X, numa série de 31 aterragens, foram


compilados e são apresentados de seguida (valores em 103
metros):

31 31

∑x
i =1
i = 54,3; ∑x
i =1
2
i = 95,57

Determine um intervalo que contenha a média da população com


um grau de confiança de 99%. Acha que é possível efectuar uma
aterragem segura numa pista com menos de 1500 metros?
Justifique.
Introdução à Estatística Ensino à Distância 199

Feedback

Resolução da Auto-avaliação

1.

O intervalo de confiança para a média da população é dado por


s′ α
X ± Zα , com = 0,075 e Z α = 1,48 .
2 n 2 2

σ 4000
X ± Zα = 42000 ± 1,48 × = 42000 ± 374,4
2 n 250

41625,6 < μ < 42374,4

s′ 0,62
2. X ± Zα = 1,64 ± 1,64 × = 1,64 ± 0,05
2 n 400

1,59 < μ < 1,69

s′ 12
3. X ± Zα = 36 ± 1,04 × = 36 ± 1,14
2 n 120

⇔ 34,86 < μ < 37,14

4. Determine primeiro a média e o desvio padrão corrigido.

X =
∑x i
=
54,3
= 1,75
n 31

s′ =
∑x 2
i − nx 2
=
95,57 − 31 × 1,75 2
= 0,15
n −1 30
200 Lição nº 2

s′ 0,15
X ± Zα = 1,75 ± 2,57 × = 1,75 ± 0,07
2 n 31

⇔ 1,68 < μ < 1,82

Observe que o intervalo de confiança a 99% não contêm o valor


1,5 ( = 1,5 × 10 3 ). Isto que dizer que seria quase impossível
realizar uma aterragem segura com uma pista de 1500 metros.

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003

Leitura − LEVIN, Jack et al; Estatística para ciências Humanas. São


Paulo.Editora Pearson, 2004.
Introdução à Estatística Ensino à Distância 201

Lição nº 3
Determinação do tamanho da
amostra
Introdução
Uma pergunta comum quando se deseja fazer estudo estatístico é: que
tamanho da amostra devo recolher para este estudo? Este capítulo tenta
responder esta questão.

Esta lição deverá ser estudada em aproximadamente 2 horas.

Tempo de estudo da lição:


02:00 Horas

Ao completar esta lição, você será capaz de:

ƒ Determinar o tamanho da amostra conhecendo a margem de erro.

Objectivos

Determinando o tamanho da amostra para a média.

Nas duas lições anteriores vimos que um intervalo de confiança para a


σ
média da população era dado por X ± Z cσ X = X ± Z c onde
n
σ
Zc = E , sendo E margem de erro. Uma vez que o objectivo é
n
determinar n, elevemos ao quadrado ambos membros da igualdade acima:
202 Lição nº 3

Z c2σ 2 Z c2σ 2
= E , e, isolando o n segue: n =
2
. Esta expressão
n E2
possibilita a determinação do tamanho da amostra necessário para
satisfazer uma certa margem de erro. Note que o desvio padrão da
população deverá ser conhecido.

Que tamanho da amostra deveria ser seleccionada para fornecer um


intervalo de confiança de 95%, com uma margem de erro de 5? Considere
que o desvio padrão da população é 25.
Exemplo 23

Z c2σ 2
A expressão para determinar o tamanho da amostra é n =
E2

Z c = 1,96 uma vez que IC = 95%. Logo

Z c2σ 2 1,96 2 × 25 2
n= = = 97
E2 52

Sumário
Se uma desejada margem de erro E é escolhida antes da amostragem, os
procedimentos desta lição podem ser usados para determinar o tamanho
necessário da amostra para satisfazer as exigências da margem de erro.
Z c2σ 2
Use a expressão n = para determinar tal valor de n. Note que o
E2
desvio padrão da população deve ser conhecido.
Introdução à Estatística Ensino à Distância 203

Exercícios

1. Seja X o tempo, em minutos que certa tarefa leva a executar.


Admita-se que X tem distribuição normal e que a experiência

Auto-avaliação 17 permitiu determinar, com boa aproximação, que σ = 2 minutos

a) Observada uma amostra de dimensão 16, com média


x = 12,5 , construa um intervalo de confiança a 95%
para μ .

b) Desejando estimar-se μ através de um intervalo de


confiança, qual a dimensão da amostra de tempos que
Tempo de realização:
Duas Horas. deve observar-se para garantir que a amplitude do
intervalo obtido seja inferior a 0,5 minutos?

2. Acredita-se que os salários iniciais anuais para os graduados do


curso de Física tenham um desvio padrão de 500 MT. Considere
que se deseje estimar por um intervalo de confiança de 95%, o
salário médio inicial anual. De que tamanho deve ser uma
amostra se a margem de erro for de:

a) 125 MT

b) 100 MT

c) 50 MT

Feedback
Resolução de Auto-avaliação

1.

σ 2
a) X ± Zα = 12,5 ± 1,96 × = 12,5 ± 0,98
2 n 16

11,52 < μ < 13,48


204 Lição nº 3

b) Assumindo uma confiança de 95%,

Z c2σ 2 1,96 2 × 2 2
n= = = 6147 ou mais.
E2 0,05 2

2.

Z c2σ 2 1,96 2 × 500 2


a) n= = = 62
E2 125 2

Z c2σ 2 1,96 2 × 500 2


b) n= = = 97
E2 100 2

Z c2σ 2 1,96 2 × 500 2


c) n= = = 385
E2 125 2

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003

Leitura − LEVIN, Jack et al; Estatística para ciências Humanas. São


Paulo.Editora Pearson, 2004.
Introdução à Estatística Ensino à Distância 205

Lição nº 4
Intervalos de confiança com a
distribuição t de Student.
Introdução
No caso em que o tamanho da amostra é menor que 30 o teorema de
limite central não pode ser aplicado. A distribuição amostral de X
depende da distribuição da população. Se a distribuição da população é
normal e o desvio padrão da população é conhecido, o procedimento
apresentado nas lições 1 e 2 pode ser usado para desenvolver um
intervalo de confiança para μ . No caso em que a população é normal e o
desvio padrão da população não é conhecido, este pode ser estimado a
partir do desvio padrão da amostra. Neste caso, a distribuição amostral
segue a distribuição conhecida como t de Student. Se a hipótese de
distribuição normal para a população não é apropriada a única alternativa
é aumentar o tamanho da amostra para 30. Nesta lição é dada especial
atenção a casos em que n < 30 , desconhecendo o desvio padrão da
população.

Esta lição deverá ser estudada em aproximadamente 2 horas.

Tempo de estudo da lição:


02:00 Horas

Ao completar esta lição, você será capaz de:

ƒ Determinar intervalos de confiança para a média da população para


pequenas amostras ( n<30)

Objectivos ƒ Determinar o desvio padrão amostral.


206 Lição nº 4

Intervalos de confiança e a distribuição t de Student

Até agora tratou-se de intervalos de confiança em que o desvio padrão da


população era conhecido e portanto, possível determinar o erro padrão da
média. No entanto são raros os casos em que se conhece o desvio padrão
da população, devendo ser estimado pelo desvio padrão amostral
corrigido:

s′ =
∑ (x − x)
i
2

=
∑x
2
i − nx 2
n −1 n −1

Assim, o erro padrão da média é estimado a partir do desvio padrão


amostral:

s
. sX =
n

X −μ
A estatística T= segue não a distribuição normal mas a
sX
distribuição t de Student (em homenagem ao matemático que a descobriu
de nome William Sealy Gosset) com n − 1 graus de liberdade. Quanto
maior o tamanho da amostra, maior é o número de graus e liberdade e
mais próxima da distribuição normal está a distribuição t.

(figura)

Uso da tabela da distribuição t de Student no cálculo de


probabilidades.

À semelhança da distribuição normal padrão, a distribuição t é simétrica


com média Zero, sendo função do número de graus de liberdade.

A tabela da distribuição t de Student fornece-nos a área à direita do valor


T.
Introdução à Estatística Ensino à Distância 207

Área da Extremidade Superior


Graus de liberdade
0,10 0,05 0,025 0,01 0,005

1 3,078 6,314 12,706 31,821 63,657

2 1,886 2,920 4,303 6,965 9,925

3 1,638 2,353 3,182 4,541 5,841

4 1,533 2,132 2,776 3,747 4,604

Tabela 39: Extracto da tabela de distribuição t.

Usemos a tabela t para determinar:

a) P(T < 1,782) , para uma distribuição com 12 graus de


liberdade;

b) P(−1,310 < T < 1,310) para uma distribuição com 30


graus de liberdade;

c) O valor t correspondente à área da extremidade superior


de 0,05 com 18 graus de liberdade;

d) O valor t correspondente à área da extremidade inferior


de 0,10 com 22 graus de liberdade;
208 Lição nº 4

a)

1,782

A figura mostra a área pretendida. Procurando na linha 12 (graus de


liberdade) encontra-se o valor t = 1,782. Este valor está na coluna 0,05.
Como a tabela t fornece-nos a área a direita do valor de t dado, conclui-se
que a área à esquerda (T < 1,782) é 1 – 0,05 = 95%.

b) Consulta-se o valor 1,310 na linha 30. O valor encontra-se na


coluna 0,1, significando que a área à direita é de 10%. Por
simetria a área à esquerda de –1,310 é também de 10%. Então a
área entre –1,310 e 1,310 é 80%.

c) Consulta-se na linha 18 e coluna 0,05 o que corresponde ao valor


t = 1,734.

d) Veja a linha 22 e coluna 0,10. Mas como a área de 10% está à


esquerda o valor correspondente será simétrico ao encontrado,
isto é, t = –1,321.

Intervalos de confiança usando a distribuição t

Suponha que um pesquisador queira examinar o alcance da cooperação


entre crianças da creche. Para tal ele observa durante 30 minutos um
Introdução à Estatística Ensino à Distância 209

grupo de crianças brincando e regista o número de actos de cooperação


praticados por cada uma: 1, 5, 2, 3, 4, 1, 2, 2, 4, 3.

Qual seria o IC a 95% para o número médio de actos de cooperação


praticados pelas crianças?

Neste caso desconhece-se o desvio padrão podendo ser estimado pelo


desvio padrão amostral corrigido. Neste caso conforme referenciou-se

X −μ
antes a estatística T = segue a distribuição t de Student com
sX
n − 1 graus de liberdade. O intervalo de confiança para a média da
população neste caso é dado por X ± ts X .

O primeiro passo na determinação deste intervalo é o cálculo da média e


do desvio padrão corrigido para os dados amostrais.

X =
∑x i
=
27
= 2,7 .
n 10

s′ =
∑x 2
i − nx 2
=
89 − 10 × 2,7 2
= 1,3
n −1 9

Com o desvio padrão corrigido pode-se estimar facilmente o erro padrão.

s′ 1,3
sX = = = 0,4
n 10

O valor de t correspondente a 9 (10 – 1) graus de liberdade e a 95% de


confiança é tα = 2,262 . Logo a margem de erro será
2

ts X = 2,262 × 0,4 = 0,9 . O intervalo de confiança a 95% para a média

do número de actos de cooperação entre crianças é X ± ts X = 2,7 ± 0,9

⇒ 1,8 < μ < 3,6 .


210 Lição nº 4

No teste de um novo método de produção, 18 empregados foram


aleatoriamente seleccionados e solicitados a tentar o novo método. A taxe
média de produção da amostra para os 18 empregados foi de 80 peças por
Exemplo 24
hora e o desvio padrão corrigido foi de 10 peças por hora. Forneça
intervalo de confiança de 90% para a taxa média de produção da
população para o novo método, considerando que a população tenha
distribuição normal de probabilidade. (Anderson, D. R; Estatística
aplicada à Administração e economia; 2003.)

Passo 1 Tendo a média e o desvio padrão corrigido da amostra,


determine a estimativa para o erro padrão:

s′ 10
sX = = = 2,4
n 18

Passo 2 Consultar na tabela da distribuição t o valor t de acordo


com os graus de liberdade e nível de confiança:

n − 1 = 17 IC = 0,9 ⇒ tα = 1,740
2

Passo 3 Determinar a margem de erro:

t α s X = 1,740 × 2,4 = 4,2


2

Passo 4 Componha o intervalo subtraído e somando da média


amostral à margem do erro ( X ± t α s X ):
2

X ± t α s X = 80 ± 4,2 ⇒ 75,8 < μ < 84,2


2
Introdução à Estatística Ensino à Distância 211

Sumário
Para pequenas amostras de populações normais em que se desconhece o
valor do desvio padrão, o intervalo de confiança pode ser construído
usando a distribuição t. tal intervalo e dado por X ± t α s X
2

Exercícios

1. Um novo cereal para o pequeno-almoço está a ser testado


durante um mês nas lojas de uma rede de supermercados. As
Auto-avaliação 18 receitas de uma amostra aleatória de 16 lojas apresentam uma
média de 1200 u.m. e um desvio padrão de 180 u.m. Suponha
que as receitas são normalmente distribuídas.

Construa um intervalo a 99% de confiança para a média das vendas


deste novo cereal para o pequeno-almoço.

Se se pretender estimar a quantidade média de vendas com um erro de


Tempo de realização: 100 u.m. a 99% de confiança. Considerando o desvio padrão da
02:00 Horas população 200 u.m., qual o tamanho necessário para a amostra?

2. Considere uma população com distribuição normal de parâmetros


desconhecidos. Dessa população foi retirada uma amostra casual
de dimensão 25. Suponha que a amostra forneceu os seguintes
resultados:

∑ ∑
25 25 2
x = 75 ;
i =1 i
x = 321
i =1 i

Construa um intervalo de confiança a 95% para a média.


(Murteira a tal, Introdução à Estatística, 2002)

3. O número de horas que os americanos dormem a cada noite varia


consideravelmente entre 12% da população que dorme menos de
212 Lição nº 4

6 horas e 3% que dorme mais de 8 horas. A seguinte amostra de


25 relatórios individuais relata as horas de sono por noite:

6,9 7,8 7,3 6,8 7,6 7,6 7,0 6,6 6,5 7,1 6,5 5,5 7,1

7,2 6,0 6,2 7,6 6,9 5,8 7,2 5,3 6,7 6,0 8,6 7,7.

Assumindo que a população tenha uma distribuição normal,


desenvolva um intervalo de confiança de 95% para o número
médio de horas de sono para a população. (Anderson, D. R;
Estatística aplicada à Administração e economia; 2003.)

Feedback

Resolução da auto-avaliação

1.

s′ 180
a) X ± tα s X = X ± tα = 1200 ± 2,947 ×
2 2 n 16

= 1200 ± 132,6 ⇔ 1067,4 < μ < 1332,6

Z c2σ 2 2,57 2 × 200 2


b) n= = = 27
E2 100 2

2. Determine a média e o desvio padrão da amostra:

X =
∑x i
=
75
= 3.
n 25

s′ =
∑x 2
i − nx 2
=
321 − 25 × 3 2
=2
n −1 24

s′ 2
X ± tα = 3 ± 2,064 × = 3 ± 0,83
2 n 25

⇔ 2,17 < μ < 3,83


Introdução à Estatística Ensino à Distância 213

3. Determine a soma de xi e de xi2 .

xi xi2
5.3 28.09
5.5 30.25
5.8 33.64
6 36
6 36
6.2 38.44
6.5 42.25
6.5 42.25
6.6 43.56
6.7 44.89
6.8 46.24
6.9 47.61
6.9 47.61
7 49
7.1 50.41
7.1 50.41
7.2 51.84
7.2 51.84
7.3 53.29
7.6 57.76
7.6 57.76
7.6 57.76
7.7 59.29
7.8 60.84
8.6 73.96
171.5 1190.99

Determine em seguida a média e o desvio padrão

X =
∑x i
=
171,5
= 6,86 .
n 25

s′ =
∑x 2
i − nx 2
=
1190,99 − 25 × 6,86 2
≈ 3,14
n −1 24

s′ 3,14
X ± tα = 6,86 ± 2,064 × = 6,86 ± 1,30
2 n 25

⇔ 5,56 < μ < 8,16


214 Lição nº 4

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003

− LEVIN, Jack et al; Estatística para ciências Humanas. São


Leitura
Paulo.Editora Pearson, 2004.
Introdução à Estatística Ensino à Distância 215

Lição nº 5
Intervalo de confiança para
proporções
Introdução

Como notamos, normalmente estimamos a proporção de vezes que um


certo evento ocorre em uma determinada população, em vez do número
vezes. Por exemplo, normalmente, fazemos afirmações sobre a taxa de
seroprevalência do HIV-SIDA em Moçambique e não do número total de
infectados. Neta lição aborda-se a construção dum intervalo de confiança
para proporções.

Esta lição deverá ser estudada em aproximadamente 2 horas.

Tempo de estudo da lição:


02:00 Horas

Ao completar esta lição, você será capaz de:

ƒ Descrever a distribuição amostral da proporção

ƒ Determinar o desvio padrão da proporção amostral.


Objectivos
ƒ Determinar a margem do erro.

ƒ Construir um intervalo de confiança para a proporção amostral.


216 Lição nº 5

Intervalo de confiança para proporções

Retomemos o caso das infecções por HIV. Se a amostra é do tamanho n


e x é o número de pessoas infectadas na amostra, podemos estimar a
proporção da amostra p̂ por:

x
pˆ =
n

Pelo teorema do limite central, quando n é suficientemente grande, a


distribuição de proporções amostrais aproxima-se da distribuição normal
com as seguintes características:

1. A média da distribuição amostral de proporções é a


média da população p ;
2. O desvio padrão da distribuição da amostral de

pˆ qˆ
proporções (erro padrão) é igual a , ( q = 1 − p ).
n
Nos casos em que não temos p e q estes podem ser
estimados a partir de p̂ e q̂ .

pˆ − p
Então, a estatística Z = segue uma distribuição normal de média
sp

pq
o (zero) e desvio padrão 1, com s p = ;
n

Sendo assim, um intervalo de confiança para p é dado por pˆ ± Z α s p .


2

Suponha que um distrito deseja monitorar as atitudes dos pais em relação


à proposta de eliminação dos desportos após as aulas, como uma medida
para reduzir os custos. De 120 pais entrevistados, 74 apoiaram o plano de
suprimir o programa de desportos. Determine um intervalo a 95% de
confiança para a proporção de pais na população que apoia o plano de
supressão dos desportos. (Levin at al, Estatísticas para ciências humanas,
2004)
Introdução à Estatística Ensino à Distância 217

74 0,62 × 0,38
pˆ = = 0,62 ; s p = = 0,04 , Z c = 1,96
120 120

Com 95% de confiança o intervalo para a proporção é


0,62 ± 0,04 × 1,96 = 0,62 ± 0,08 .

0,54 < p < 0,7 .

O Instituto Nacional de Viação (INAV) pretende estimar a proporção p


de motoristas que usam regularmente o cinto de segurança na cidade de
Maputo.
Exemplo 25
a) Quantos veículos circulando devem ser vistoriados de
modo que a proporção p seja estimada com um erro de
0,04 e uma probabilidade de 0,90?

b) Determine o tamanho da amostra para o caso anterior,


supondo agora uma proporção p de pelo menos 90%.

c) Os polícias de trânsito inspeccionaram 1000 veículos em


diversas artérias da cidade, dos quais 79 motoristas não
estavam usando o cinto de segurança no momento da
vistoria. Encontre um intervalo de confiança para p com
coeficiente de confiança de 95%.

a) O valor correspondente a um IC de 90% na tabela da distribuição


normal é Z c = 1,64 . Sabe-se que o erro ( margem do erro) é dado por

pqZ α2
pq
E = Zα sp = Zα ⇒n= 2
.
2 2
n E2

Uma vez que o valor de p é desconhecido, vamos usar o valor 0,25, o


maior possível para pq :

0,25 × 1,642
n= = 421 .
0,042
218 Lição nº 5

0,9 × 0,10 × 1,642


b) Se p ≥ 0,90 ⇒ n = = 152 . Com o valor de p
0,04 2
conhecido de pelo menos 0,9, o valor de n diminui para 152.

c)

Passo 1 Determinar o valor de p̂ :

x 921
pˆ = = = 0,921
n 1000

Passo 2 Consulte o valor de Z na tabela da distribuição normal,


de acordo com o nível de confiança desejado:

Para um IC de 95%, Z c = 1,96

Passo 3 Determine o erro padrão amostral, estimando p por p̂ :

pq 0,921 × 0,079
sp = = = 0,009
n 1000

Passo 4 Determine a margem de erro:

E = Z α s p = 1,96 × 0,009 = 0,018 .


2

Passo 5 componha o intervalo de confiança, adicionando e


subtraído da proporção amostral a margem de erro:

pˆ ± Z α s p = 0,921 ± 0,018 ⇒ 0,903 < p < 0,939


2
Introdução à Estatística Ensino à Distância 219

Sumário
Um intervalo de confiança para proporção é dado por pˆ ± Z α s p em que
2

pq
sp = é o desvio padrão amostral. Nos casos em que p não é
n
conhecido estime-o a partir de p̂ . Desejado o tamanho da amostra para

pqZ α2
satisfazer uma certa margem de erro use n = 2

E2

Exercícios

1. O dono de uma ervanária produz um chá relativamente ao qual


afirma ser eficaz em mais de 90% dos casos para curar dores de

Auto-avaliação 19 cabeça. Num inquérito feito a 250 pessoas, 198 concordaram que
o chá cura de facto as dores de cabeça. Construa um intervalo de
confiança de 99% para a percentagem de potenciais
consumidores que concordam com o dono da ervanária.

2. Um bairro da província de Maputo está interessado em estimar a


proporção p de moradores contaminados por malária.

Tempo de realização: a) Por problemas técnicos, o especialista de saúde limitou-


02:00Horas. se a um tamanho de amostra de 200 moradores. Nessa
amostra observou-se que 15% dos indivíduos estavam
contaminados por Malária. Construa um intervalo de
confiança para p, com coeficiente de confiança igual a
0,99.

b) Determine o tamanho da amostra necessária para que o


erro cometido na estimação seja no máximo 0,02 com
probabilidade 0,99.
220 Lição nº 5

3. De uma amostra de 195 pequenas empresas de uma determinada


zona, 129 indicaram que a melhoria da qualidade é o factor mais
importante para se ter sucesso no mercado

a) Construa um IC de 99% para a proporção de todas


empresas da zona que partilham a mesma opinião.

b) Sem fazer cálculos diga se um IC de 90% tem


comprimento maior, igual ou menor que o calculado em
a).

4. O dono de uma fábrica pretende estimar a proporção de artigos


defeituosos produzidos por uma de suas máquinas. De uma
amostra de 300 artigos tomados, 45 eram defeituosos. Calcule um
IC de (i) 95% (ii) 99% para a proporção de artigos defeituosos
produzidos pela máquina.

5. Uma amostra aleatória de 100 eleitores de certo distrito


eleitoral dá 55% de votos como favoráveis a determinado
candidato.

Construa um intervalo de confiança a 99% para a proporção


global de eleitores favoráveis a esse candidato.

Feedback

Resolução da Auto-avaliação

1. O intervalo de confiança para proporções é dão por

pq 198
pˆ ± Z α , substituindo, pˆ = = 0,792 e usando este para
2
n 250
estimar p, (não se esqueça que q = 1 - p ) resulta:

pq 0,792 × 0,208
pˆ ± Z α = 0,792 ± 2,57 × = 0,792 ± 0,066
2
n 250

0,726 < p < 0,858 .


Introdução à Estatística Ensino à Distância 221

2.

pq 0,15 × 0,85
a) pˆ ± Z α = 0,15 ± 2,57 × = 0,15 ± 0,065
2
n 200

0,085 < p < 0,215 .

pqZ α2
0,15 × 0,85 × 2,57 2
b) n= 2
= = 2106 , use p̂ no lugar de
E2 0,02 2
p.

3.

pq 0,66 × 0,34
a) pˆ ± Z α = 0,66 ± 2,57 × = 0,66 ± 0,087
2
n 195

0,573 < p < 0,747

b) Terá um cumprimento menor, uma vez que o Z α será menor em


2

relação ao usado no caso de 0,99.

4.

pq 0,15 × 0,85
i) pˆ ± Z α = 0,15 ± 1,96 × = 0,15 ± 0,04
2
n 300

0,11 < p < 0,19

pq 0,15 × 0,85
i) pˆ ± Z α = 0,15 ± 2,57 × = 0,15 ± 0,05
2
n 300

0,10 < p < 0,20


222 Lição nº 5

pq 0,55 × 0,45
5. pˆ ± Z α = 0,55 ± 2,57 × = 0,55 ± 0,13
2
n 100

0,42 < p < 0,68

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003

Leitura − LEVIN, Jack et al; Estatística para ciências Humanas. São


Paulo.Editora Pearson, 2004.
Introdução à Estatística Ensino à Distância 223

Unidade 5
Testes de Hipóteses
Introdução

Quando questionados sobre a temperatura média de um adulto saudável,


quase todos respondem que é de 37°C. Um grupo de pesquisadores da
Universidade de Mayland, recolheu temperaturas de 106 indivíduos
saudáveis e acusaram uma média de x = 36,78 °C e desvio padrão

corrigido s′ = 0,315 °C. Um intervalo a 95% de confiança para a


temperatura média do corpo humano fornece-nos o intervalo
36,72°C < μ < 36,84°C . Eis o problema: Os limites do intervalo de
confiança não contém 37°C, valor geralmente aceite como temperatura
média do corpo humano. “Devemos rejeitar a suposição comum, de que a
temperatura média do corpo de adultos saudáveis é 37°C”? Neste capítulo
será estudado um processo-padrão para testar tais afirmações sobre uma
propriedade da população – as hipóteses. (Triola, introdução à Estatística,
1999).

Esta unidade comporta 3 lições. O seu estudo deverá durar cerca de 12


horas. O caderno de notas e a calculadora deverão acompanhar todo o
estudo.

Tempo de estudo da
Unidade: 12:00 Horas

Ao completar esta unidade você será capaz de:

ƒ Formular correctamente hipótese nula e alternativa;

ƒ Diferenciar teste unilateral de bilateral;


Objectivos
ƒ Usar o nível de significância para determinar a região crítica e de
224 Unidade 5

aceitação.

ƒ Usar a estatística do teste para decidir sobre a aceitação ou rejeição da


hipótese nula.

ƒ Testar hipóteses envolvendo média, proporções, diferença de médias e


diferença de proporções.

ƒ Reconhecer e determinar os tipos de erros envolvidos nos testes de


hipóteses.

ƒ Determinar o Valor P (P-value).

Hipótese nula e alternativa, tipos de erro, erro tipo I e II, Nível de


significância do teste, etapas do teste de hipóteses, Valor P, teste
envolvendo média, proporção, diferença de médias e diferença de
Terminologia
proporção.

Plano de estudo da unidade

Nº da lição Tema Tempo de Tempo d


estudo da lição resolução da
autoavalição

1 Teste de 2 Horas 2 Horas


hipótese para a
média e
proporção da
população

2 Teste de 2 Horas 2 Horas


hipótese para
diferença de
médias. O caso
de amostras
independentes

3 Teste de 2 Horas 2 Horas


hipóteses para
diferença de
médias. O caso
de amostras
emparelhadas.
Introdução à Estatística Ensino à Distância 225

Lição nº 1
Testes de hipótese para a média e
proporção da população
Introdução

Para testar hipóteses a que formula-las. Nesta lição vai aprender a


formular hipóteses estatísticas para posteriormente testa-las.

Esta lição deverá ser estudada em aproximadamente 2 horas.

Tempo de estudo da lição:


02:00 Horas

Ao completar esta lição, você será capaz de:

ƒ Formular hipóteses estatísticas

ƒ Diferenciar teste unilateral de bilateral


Objectivos
ƒ Testar hipóteses envolvendo média e proporção da população

Hipótese nula versus alternativa

Considere ainda o caso da temperatura descrito na introdução. Note que a


intenção dos pesquisadores ao desenvolver a pesquisa é de por à prova o
valor de 37°C. Neste caso interessa a eles mostrarem que a temperatura
média do corpo humano de um adulto saudável não é de 37°C. Em geral
uma hipótese de pesquisa (como esta) deve ser formulada como hipótese
alternativa. Para o exemplo da temperatura do corpo humano, as
hipóteses da pesquisa são:
226 Lição nº 1

H 0 (Hipótese nula): μ = 37°C .

Ha (Hipótese alternativa): μ ≠ 37°C .

O teste de hipótese é provado por contradição. Assim, a hipótese de


pesquisa é a hipótese alternativa. A conclusão de que a hipótese de
pesquisa é verdadeira pode ser feita se os dados da amostra indicam que a
hipótese nula é rejeitada.

Se os pesquisadores quisessem provar que a temperatura de um homem


adulto saudável é inferior a 37º C suas hipóteses de pesquisa seriam:

H 0 : μ ≥ 37°C .

H a : μ < 37°C .

Um director de escola observou que a quantia média gasta pelos alunos


envolvidos em jogos escolares nos fins-de-semana é de 250 Meticais ou
menos. O responsável pela área das finanças na escola notou que tais
Exemplo 26
gastos de fim-de-semana têm aumentado nos últimos meses. O responsável
usará uma amostra de gastos semanais dos alunos envolvidos em jogos
escolares para testar a afirmação do director.

1. Escolha das alternativas abaixo, a forma de hipóteses que deve ser


usada para testar a afirmação do responsável das finanças.

a) H 0 : μ ≥ 250 b) H 0 : μ ≤ 250 c)

H 0 : μ = 250

H a : μ < 250 H a : μ > 250

H a : μ ≠ 250

2. Que conclusão é apropriada quando H 0 não pode ser rejeitada?

3. Que conclusão é apropriada quando H 0 pode ser rejeitada?


Introdução à Estatística Ensino à Distância 227

Observe que neste caso a hipótese de pesquisa é aquela que o responsável


das finanças procura sustentar: aumento dos gastos. Ela deve portanto ser
a hipótese alternativa. Para este teste as hipóteses deveriam ser:

H 0 : μ ≤ 250

H a : μ > 250

No caso de não se rejeitar H 0 , a conclusão seria de que os gastos médios

com os alunos envolvidos em jogos escolares nos fins de semana são de


250 ou menos. Caso contrário (rejeitar H 0 ) a conclusão seria de que os

gastos médios são superiores a 250 Meticais.

Nível de significância do Teste e regra de rejeição

Para que se possa rejeitar ou não rejeitar a hipótese nula, estabelecesse


um nível de significância que denota-se por α . A partir do valor de
α estabelece-se as regiões de aceitação e rejeição. Se o valor da amostra
pertence à região de aceitação, aceita-se a hipótese nula, caso contrário
esta é rejeitada.

95%

2,5% 2,5%

36,72 Região de aceitação 36,84


R. de rejeição R. de rejeição

Encontrado o intervalo de confiança a regra a seguir é aceitar H 0 caso o

valor que está a ser testado esteja dentro do intervalo e rejeita-lo caso
contrário.
228 Lição nº 1

No caso das temperaturas um intervalo de confiança a 95% para a média


da população é 36,72°C < μ < 36,84°C . Neste caso como o valor 37°C
está na região de rejeição, a decisão dos investigadores será de rejeitar a
hipótese nula e, portanto, admitir que a temperatura média do corpo
humano não é de 37°C, no nível de significância de 5%.

Em termos dos valores de Z, as regiões de aceitação e rejeição seriam as


seguintes:

95%

2,5% 2,5%

-1,96 Região de aceitação 1,96


R. de rejeição R. de rejeição

Neste caso a decisão a tomar seria aceitar a hipótese nula se o valor do


Teste estiver dentro do intervalo e rejeita-lo caso contrário.

Nível de significância do Teste e regra de rejeição

Para que se possa rejeitar ou não rejeitar a hipótese nula, estabelecesse


um nível de significância que denota-se por α . A partir do valor de
α estabelece-se as regiões de aceitação e rejeição. Se o valor da amostra
pertence à região de aceitação, aceita-se a hipótese nula, caso contrário
esta é rejeitada.

95%

2,5% 2,5%

36,72 Região de aceitação 36,84


R. de rejeição R. de rejeição

No caso das temperaturas construiu-se um intervalo de confiança a 95%


para a média da população. Admite-se em 5% dos casos que a verdadeira
Introdução à Estatística Ensino à Distância 229

média esteja fora do intervalo considerado, isto é, admite-se um erro de


5%. Neste caso, o nível de significância é de 5% ou 0,05.

Como o valor 37°C está na região de rejeição, a decisão dos


investigadores será de rejeitar a hipótese nula e, portanto, admitir que a
temperatura média do corpo humano não é de 37°C.

Determinando o valor do Teste

Uma abordagem mais comum do teste de hipóteses consiste em


determinar o valor do teste e verificar se este está na região de aceitação
ou rejeição, dependendo do nível de significância considerado.

95%

2,5% 2,5%

-1,96 Região de aceitação 1,96


R. de rejeição R. de rejeição

Neste caso temos n = 106 e pelo teorema do limite central, a distribuição


amostral das temperaturas médias de pessoas adulta saudáveis é
aproximadamente normal, isto é ,

X −μ
Z= → N (0,1) .
sX

36,78 − 37
Substituindo segue: Z = = −7,19 , que pertence à região de
0,315
106
rejeição, o que nos leva a rejeitar a hipótese nula como no procedimento
anterior.
230 Lição nº 1

Tipos de Erro

De certo modo, um teste de hipóteses pode ser comparado a um


julgamento criminal por um júri. O indivíduo julgado é inocente ou
culpado, mas assume-se inocente por lei. Depois que a evidência
referente ao caso é apresentada, o júri decide se o réu é ou não culpado.
Se o réu for inocente e a decisão do júri declarar que ele não é culpado,
ou se o réu é culpado e condenado pelo crime cometido, então foi obtido
o veredicto correcto. Porém há casos em que o júri pode condenar um
inocente ou libertar um culpado! (Pagano & Gauvreau, Princípios de
Bioestatística, 2004)

Tal como qualquer sistema legal, o processo do teste de hipóteses não é


perfeito. Existem dois tipos de erros que podem ser cometidos: Rejeitar a
hipótese nula quando ela de facto devia ser mantida, ou aceitar a hipótese
nula quando de facto ele devia ser rejeitada. Estes erros são conhecidos
como erros do tipo I e do tipo II respectivamente.

Realidade

Hipótese nula Hipótese nula


Verdadeira falsa

Manter a
Decisão Correcta Erro tipo II
hipótese nula
Decisão
Rejeitar a
Erro tipo I Decisão correcta
hipótese nula

Tabela 40: Tipos de Erros no teste de hipóteses.

Embora não possamos eliminar a possibilidade de erros no teste de


hipóteses, podemos considerar a hipótese de suas ocorrências. As
probabilidades de se cometer os erros tipo I e II são designadas
respectivamente por α e β

Na prática, a pessoa que conduz o teste de hipóteses especifica a


probabilidade máxima permissível de se cometer o erro tipo I, chamado
nível de significância para o teste. Escolhas comuns para o nível de
significância são 0,05 e 0,01.
Introdução à Estatística Ensino à Distância 231

Valor p

Uma outra abordagem que pode ser usada para se decidir rejeitar ou não
H 0 está baseada numa probabilidade chamada valor p.

) Se assumirmos que a hipótese nula é verdadeira, o valor p é


a probabilidade de se obter um resultado de amostra que é
pelo menos tão improvável quanto aquele que é observado.

No exemplo da temperatura média do corpo humano de um adulto


saudável, o valor p associado à média da amostra de 36,78°C é a
probabilidade de se obter um valor para a média da amostra diferente de
36,78°C, dado que o valor assumido por hipótese para a média da
população é μ = 37 °C. Neste caso,

36,78 − 37
Z= = −7,19
0,315
106

e o valor p é área da distribuição normal correspondente às extremidades


à esquerda de − 7,19 e à direita de 7,19. O valor p é, em consequência 0
(zero).

O valor p pode ser usado para se tomar a decisão em um teste de


hipóteses notando-se que se o valor p é menor do que o nível de
significância α , há que rejeitar a hipótese nula. (Anderson, D. R;
Estatística aplicada à Administração e economia; 2003).
232 Lição nº 1

Etapas do teste de hipóteses

1. Determinar as hipóteses nula e alternativa;

2. Identificar a estatística de Teste a usar.

3. Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

4. Colectar dados amostrais e determinar o valor da estatística de


Teste.

5. Comparar o valor da estatística do Teste com o valor crítico


especificado na regra de rejeição e determinar se a hipótese nula
deve ser rejeitada ou não.

1. Historicamente, as chamadas telefónicas de longa distância de


uma determinada cidade têm duração de 15,2 minutos por
chamada. Em uma amostra de 35 chamadas, o tempo médio de
Exemplo 27
chamada foi de 14,3 minutos por chamada, com um desvio
padrão corrigido de 5 minutos Use essa informação para testar
alguma mudança na duração média de chamadas telefónicas de
longa distância. Use um nível de significância de 0,05 (Anderson,
D. R; Estatística aplicada à Administração e economia; 2003).

Passo 1 Determinar as hipóteses H 0 e H a :

H 0 : μ = 15,2 minutos

H a : μ ≠ 15,2 minutos

Passo 2 Identificar a estatística de Teste a usar:

Atendendo ao facto de que n ≥ 30 , a distribuição


normal de probabilidade pode ser usada de acordo com o
Introdução à Estatística Ensino à Distância 233

teorema do limite central. A Estatística do teste é

X −μ
portanto Z = → N (0, 1) .
s′X

Passo 3 Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

α = 0,05 ⇒ Z α = 1,96 . Trata-se pois de um este


2

bilateral.

A regra de decisão é portanto rejeitar a hipótese nula


sempre que o valor de Z esteja fora do intervalo] –1,96;
1,96 [

Passo 4 Colectar dados amostrais e determinar o valor da


estatística de Teste:

X − μ 14,3 − 15,2
Z= = = −1,06
s′X 5
35

Passo 5 Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como –1,06 ∈ ]–1,96; 1,96 [ não se deve rejeitar a


hipótese nula.

Então, a 95% de confiança é de concluir que não houve


mudanças na duração média de chamadas de longa
distância.
234 Lição nº 1

2. Uma amostra aleatória de 29 empregados de secretariado numa


grande organização foi submetida a um teste de dactilografia. Os
resultados obtidos foram uma média de 63 palavras por minuto e
Exemplo 28
um desvio padrão corrigido de 5 palavras por minuto.
Pressupondo que se está perante uma população normal e para
um nível de significância de 1 %, teste a hipótese nula de que as
secretárias não ultrapassam uma velocidade de dactilografia de
60 palavras por minuto.

Passo 1 Determinar as hipóteses H 0 e H a :

H 0 : μ ≤ 60 palavras por minuto

H a : μ > 60 palavras por minuto.

Passo 2 Identificar a estatística de Teste a usar:

Com uma amostra de n < 30 normalmente distribuída e


desconhecendo o desvio padrão da população, a

X −μ
estatística T = segue a distribuição t de Student
s′X
com n − 1 graus de liberdade.

Passo 3 Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

α = 0,01 e gl = 29 − 1 = 28 , t = 2,467 ; pois trata-se


de um teste unilateral à direita.

A regra de decisão é portanto rejeitar a hipótese nula


sempre que o valor de T seja superior a 2,467

Passo 4 Colectar dados amostrais e determinar o valor da


estatística de Teste:
Introdução à Estatística Ensino à Distância 235

X − μ 63 − 60
T = = = 3,231
s′X 5
29

Passo 5 Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

De facto, 3,231 > 2,467. A decisão é rejeitar a hipótese


nula ao nível de significância de 1%.

As secretárias têm uma velocidade de dactilografia


superior a 60 palavras por minuto.

3. Admita que a direcção comercial de uma determinada empresa


pretende lançar um novo serviço de telecomunicações. De acordo
com critérios empresariais, o serviço só deverá ser lançado no
Exemplo 29
mercado se houver mais de 80% de potenciais compradores.
Assim, para averiguar o eventual lançamento do serviço, a
empresa decidiu efectuar um inquérito a 400 grandes clientes,
tendo 340 sido favoráveis à aquisição do novo serviço.

a) Para um nível significância de 5%, poder-se-á concluir


que a empresa opta pelo lançamento do serviço?

b) Determine o valor p do teste e interprete-o.

a)

Passo 1 Determinar as hipóteses H 0 e H a :

H 0 : p ≤ 0,80 .

H a : P > 0,80 .

Passo 2 Identificar a estatística de Teste a usar:


236 Lição nº 1

pˆ − p
Z= segue a distribuição normal com média 0 e
sp
desvio padrão 1.

Passo 3 Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

α = 0,05 ⇒ Zα = 1,64 .

A regra de decisão é portanto rejeitar a hipótese nula


sempre que o valor de Z seja superior a 1,64.

Passo 4 Colectar dados amostrais e determinar o valor da


estatística de Teste:

pˆ − p 0,85 − 0,80
Z= = = 2,80
pˆ qˆ 0,85 × 0,15
n 400

Passo 5 Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

2,80 > 1,64. A decisão é rejeitar a hipótese nula ao nível


de significância de 5%.

A empresa pode optar pelo lançamento do serviço.

b)

p = P( Z > 2,80) = 1 − P( Z < 2,80) = 0,0026 .


Introdução à Estatística Ensino à Distância 237

Sumário
Um dos primeiros passos no teste de hipóteses é a determinação de H 0 e

H a . Embora na maior parte dos casos esta escolha não seja óbvia, o
importante é colocar sempre a hipótese da pesquisa como hipótese
alternativa.

O segundo passo é a identificação da estatística do teste.

X −μ
Use Z = (Esta estatística segue distribuição normal com média
σ
n
zero e desvio padrão 1) para casos em que n ≥ 30 , estimando σ (desvio
padrão da população) por s ′ (desvio padrão da amostra) nos casos em que
não se conhece.

Use o mesmo teste para casos em que a população segue distribuição


normal com desvio padrão conhecido independentemente do valor de n.

X −μ
Use T = (T segue distribuição t com n-1 graus de liberdade) nos
s′
n
casos em que a população segue distribuição normal e desconhece-se o
desvio padrão.

pˆ − p
Z= (Z segue distribuição normal com média 0 e desvio padrão
pˆ qˆ
n
1) para proporções;

Em seguida especifique o nível de significância e use-o para desenvolver

uma regra de rejeição para a hipótese nula. Se este não for dado, use
α = 0,05 ;

Determine o valor do Teste com base na informação da amostra;


238 Lição nº 1

Por fim compare o valor da estatística do Teste com o valor crítico


especificado na regra de rejeição e determine se a hipótese nula deve ser
rejeitada ou não.

Exercícios

1. Numa determinada empresa pensa-se importar um grande lote de


instrumentos de precisão, para os quais o fabricante garante um

Auto-avaliação 20 peso médio igual a 100 g. Sendo o peso uma característica


importante para a qualidade do produto, resolveu-se testar a
veracidade da afirmação do fabricante. Para tal, o departamento
técnico da empresa importadora obteve uma amostra de 15
instrumentos, através da qual se obtiveram os seguintes valores:

15 15

∑x
i =1
i = 1407 ∑ (x − x)
i =1
i
2
= 1674
Tempo de realização:
02:00 Horas.
Admitindo a normalidade dos pesos, qual a sua opinião, ao nível
de significância de 1%, relativamente à afirmação dos
fabricantes.

2. Os empregados de uma determinada empresa deveriam trabalhar,


em média, 8h diárias. De forma a investigar se os empregados
estão a trabalhar mais do que as horas previstas, o sindicato
registou o número de horas de trabalho de150 trabalhadores
(escolhidos ao acaso) num dia qualquer, tendo obtido os
seguintes resultados:

150 150

∑ xi = 1498
i =1
∑ (x − x)
i =1
i
2
= 600

a) Teste ao nível de significância de 5%, se a empresa


deverá ser punida por exigir que os seus empregados
trabalhem mais do que deviam.

b) Qual o tipo de erro se pode cometer relativamente à


decisão que tomou?
Introdução à Estatística Ensino à Distância 239

3. O administrador de um Hospital pretende estimar as contas em


aberto (ainda não cobradas), referentes a tratamentos e
internamentos. Admita que o montante de cada dívida segue uma
distribuição normal e que a experiência de anos anteriores
permite considerar um valor para o desvio padrão igual a 50
euros. Para levar a cabo o seu objectivo, o administrador
seleccionou aleatoriamente 25 dessas contas e avaliou o seu
valor, tendo obtido um total em dívida igual a 1850 euros.

a) Determine um intervalo de confiança a 95% para o


montante médio de cada conta não saldada.

b) Poderá afirmar estatisticamente, ao nível de 1%, que o


valor médio de cada conta não saldada é inferior a 100
euros? Que erro pode estar a cometer com a sua decisão?

4. Suponha que determinado canal de televisão deseja saber qual foi


a percentagem de pessoas que viram determinado programa. Para
tal, realizou uma sondagem tendo sido inquiridas 220 pessoas,
das quais 132 disseram ter visto o referido programa.

a) Determine um intervalo de confiança ao nível de 95%


para a percentagem de pessoas em toda a população que
viram esse programa.

b) Qual deveria ser o número de pessoas inquiridas para se


obter um intervalo de confiança de nível 95% com
metade da amplitude do anterior? (Admita que a
proporção das pessoas que viram o programa se
mantém.).

c) Poder-se-á afirmar, ao nível de 5%, que mais de metade


das pessoas viram o programa?

5 O candidato A afirma que 50% dos eleitores numa determinada


província irão votar nele nas próximas eleições. Decide-se
investigar uma amostra aleatória de 100 pessoas; se se
encontrarem na amostra 45 pessoas a favor de A, haverá motivos
para duvidar da afirmação do candidato?
240 Lição nº 1

Feedback

Resolução da Auto-avaliação
1.

Passo 1 Determinar as hipóteses H 0 e H a :

H 0 : μ = 100 g

H a : μ ≠ 100 g

Passo 2 Identificar a estatística de Teste a usar:

Com uma amostra de n < 30 normalmente distribuída e


desconhecendo o desvio padrão da população, a

X −μ
estatística T = segue a distribuição t de Student
s′X
com n − 1 graus de liberdade.

Passo 3 Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

α = 0,01 e gl = 15 − 1 = 14 , t α = 2,977 ; pois trata-se


2

de um teste bilateral.

A regra de decisão é portanto rejeitar a hipótese nula


sempre que o valor de T esteja fora do intervalo -2,977 e
2,977.

Passo 4 Colectar dados amostrais e determinar o valor da


estatística de Teste:

X =
∑x i
=
1407
= 93,8 .
n 15
Introdução à Estatística Ensino à Distância 241

s′ =
∑ (x i − x)2
=
1674
= 10,9
n −1 14

X − μ 93,8 − 100
T= = = −2,2
s′ 10,9
n 15

Passo 5 Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como -2,2 pertence ao intervalo -2,977 a 2,977, a


decisão é aceitar a hipótese nula ao nível de significância
de 1%.

O peso médio é realmente de 100g.

2.

Passo 1 Determinar as hipóteses H 0 e H a :

H 0 : μ ≤ 8 Horas.

H a : μ > 8 horas

Passo 2 Identificar a estatística de Teste a usar:

Atendendo ao facto de que n ≥ 30 , a distribuição


normal de probabilidade pode ser usada de acordo com o
teorema do limite central. A Estatística do teste é

X −μ
portanto Z = → N (0, 1) .
s′X

Passo 3 Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.
242 Lição nº 1

α = 0,05 ⇒ Z α = 1,64 . Trata-se de um teste unilateral


à direita.

A regra de decisão é portanto rejeitar a hipótese nula


sempre que o valor de Z seja maior que 1,64.

Passo 4 Colectar dados amostrais e determinar o valor da


estatística de Teste:

X =
∑x i
=
1498
= 10,0 .
n 150

s′ =
∑ (x i − x)2
=
600
= 2,46
n −1 99

X − μ 10,0 − 8
Z= = = 9,96
s′ 2,46
n 150

Passo 5 Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como 9,96 é de facto maior que 1,64, é de rejeitar a


hipótese nula ao nível de 5%.

Então, a 95% de confiança é de concluir que a empresa


deveria ser processada pois os trabalhadores t6em mais
que 8 horas de trabalho.

b) Relativamente à decisão que tomada comete-se o erro tipo I:


Rejeitar a hipótese nula, quando de facto ela é verdadeira.

3.

a) Repare que a população segue distribuição norma com desvio


padrão conhecido. Então a distribuição amostral segue uma
Introdução à Estatística Ensino à Distância 243

distribuição normal. Determinemos a média:

X =
∑x i
=
1850
= 74
n 25

σ 50
X ± Zα = 74 ± 1,96 × = 74 ± 19,6
2 n 25

54,4 < μ < 93,6

b)

Passo 1 Determinar as hipóteses H 0 e H a :

H 0 : μ ≥ 100 euros

H a : μ < 100 euros

Passo 2 Identificar a estatística de Teste a usar:

Atendendo que a distribuição é normal com desvio


padrão conhecido, pode-se usar a distribuição normal de
probabilidade. A Estatística do teste é portanto
X −μ
Z= → N (0, 1) .
σX

Passo 3 Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

α = 0,01 ⇒ Z α = −2,33 . Trata-se de um teste

unilateral à esquerda.

A regra de decisão é portanto rejeitar a hipótese nula


sempre que o valor de Z seja inferior que -2,33.

Passo 4 Colectar dados amostrais e determinar o valor da


estatística de Teste:
244 Lição nº 1

X =
∑x i
=
1850
= 74 .
n 25

X −μ 74 − 100
Z= = = −2,6
σ 50
n 25

Passo 5 Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como -2,6 é menor que -2,33 a decisão é rejeitar a


hipótese nula ao nível de 1%.

Então, a 99% de confiança é de concluir que a dívida


média não saldada é de facto menor que 100 euros.
Comete-se um erro tipo I.

4.

pq 0,6 × 0,4
a) pˆ ± Z α = 0,6 ± 1,96 × = 0,6 ± 0,06
2
n 220

0,54 < p < 0,66

b) Repare que a amplitude anterior é de 0,12 e a margem de erro de


0,06.

pqZ α2
0,6 × 0,4 × 1,96 2
n= 2
= = 257
E2 0,06 2

c) Pretende-se testar a hipótese nula

H 0 : p = 0,5 contra a hipótese alternativa

H a : P ≠ 0,5 .

A conclusão para este teste pode ser obtido olhando para o


intervalo de confiança construído na alínea A. Repare que 0,5
Introdução à Estatística Ensino à Distância 245

não faz parte do intervalo de confiança, o que nos obriga a


rejeitar a hipótese nula. Logo ao nível de 5%, não se pode afirmar
que metade das pessoas viram o programa.

Outra alternativa poderia ser obtida recorrendo ao Valor do teste.


Observe que estamos perante um teste bilateral com Z α = 1,96 ,
2

onde

pˆ − p
Z= segue a distribuição normal com média 0 e
pq
n
desvio padrão 1.

pˆ − p 0,6 − 0,5
Z= = = 2,97
pq 0,5 × 0,5
n 220

Este valor está fora do intervalo -1,96 a 1,96; o que nos


leva igualmente a rejeitar a hipótese nula.

Passo 1 Determinar as hipóteses H 0 e H a :

H 0 : p = 0,5 .

H a : P ≠ 0,5 .

Passo 2 Identificar a estatística de Teste a usar:

pˆ − p
Z= segue a distribuição normal com média 0 e
pq
n
desvio padrão 1.
246 Lição nº 1

Passo 3 Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

O nível de significância não é especificado. Use


α = 0,05 . Z α = 1,96
2

A regra de decisão é portanto rejeitar a hipótese nula


sempre que o valor de Z esteja fora do intervalo -1,96 e
1,96.

Passo 4 Colectar dados amostrais e determinar o valor da


estatística de Teste:

pˆ − p 0,45 − 0,5
Z= = = −1
pq 0,5 × 0,5
n 100

Passo 5 Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

-1 pertence ao intervalo especificado. A decisão é não


rejeitar a hipótese nula ao nível de 5%.

A Não há motivos para duvidar da afirmação do


candidato.

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003

Leitura − LEVIN, Jack et al; Estatística para ciências Humanas. São


Paulo.Editora Pearson, 2004.
Introdução à Estatística Ensino à Distância 247

Lição nº 2
Teste de hipótese para diferença
de médias. O caso de amostras
independentes.
Introdução
De certeza em algum momento já procurou resposta para a seguinte
questão: Será que as notas da milha turma à estatística são melhores que
as da outra turma? O que seria necessário fazer neste caso é comparar a a
nota media a turma. Este procedimento é discutido nesta lição.

Esta lição deverá ser estudada em aproximadamente 2 horas.

Tempo de estudo da lição:


02:00 Horas

Ao completar esta lição, você será capaz de:

ƒ Descrever a distribuição amostral da diferença de médias.

ƒ Usar a estatística da distribuição amostral da diferença de médias para


Objectivos testar hipóteses

Teste de hipóteses para diferença de médias

Amostras independentes

Suponha que pesquisador social esteja interessado em investigar a


descriminação salarial numa companhia industrial. Ele analisa uma
amostra de 30 mulheres e 40 homens, e encontra um salário médio de $
180,00 com um desvio padrão corrigido de $ 14,00 para as mulheres e
média $ 170,00 com desvio padrão corrigido de $ 10,00 para os homens.
248 Lição nº 2

Que conclusão deve tirar o pesquisador a um nível de significância de


5%?

Distribuição amostral da diferença de médias

Para grandes amostras ou para populações normais com variância


conhecida, a distribuição amostral da diferença de médias segue
aproximadamente uma distribuição normal com média Zero e variância 1,
isto é,

X1 − X 2 σ 12 σ 22
Z= → N (0,1); σX = + , Quando
σX 1−X2
1−X2
n1 n2

σ 1 e σ 2 são desconhecidos Podem ser estimados a partir de s1′ e s2′ .

Quando se desconhece a variância, mas se aceita que as duas amostras


provêm da mesma população ou seja que as variâncias são iguais
( σ 12 = σ 22 = σ 2 ) a estatística do teste segue a distribuição t de Student

com n1 + n2 − 2 graus de liberdade.

X1 − X 2 n1s12 + n2 s22
T = → t (n1 + n2 − 2); σ =
1 1 n1 + n2 − 2
σ +
n1 n2

Por não ser de grande utilidade prática não se aborda o caso em que as
variâncias dos dois grupos são desconhecidas e diferentes.

Testando a diferença de médias

As hipóteses de pesquisa para o caso descrito acima são:

H 0 : μ1 = μ 2

H a : μ1 ≠ μ2
Introdução à Estatística Ensino à Distância 249

Com um nível de significância de 5%, a decisão a tomar será de rejeitar


H 0 , sempre que o valor do teste esteja fora do intervalo − 1,96 a 1,96 .

Uma vez que n1 e n2 ≥ 30 , a distribuição amostral da diferença de


médias é aproximadamente normal. Determinemos o erro padrão:

s1′21 s2′2 142 102


σˆ X 1−X2
= + = + = 3,0
n1 n2 30 40

X1 − X 2 180 − 170
O valor do teste é Z = = = 3,3 , o que indica que a
σX 1−X2
3,0

um nível de 5% os homens e as mulheres auferem salários diferentes.

Um exame de leitura numa escola primária do primeiro grau revelou uma


média de 75 para as 25 meninas e uma média de 72 para 28 meninos. Os
desvios padrões foram respectivamente de 8 e 6. Teste ao nível de
Exemplo 30
significância de 1% de que as meninas são melhores em leitura do que os
homens Supor distribuição normal (Murray e tal, Probabilidade e
Estatística, 2004).

Passo 1 Determinar as hipóteses nula e alternativa;

H 0 : μ1 ≤ μ 2 , Onde μ1 é a média das meninas.

H1 : μ1 > μ 2 .

Passo 2 Identificar a estatística de Teste a usar.

Tratando-se de pequenas amostras em que se desconhece


a variância da população, sendo justo supor que as duas
amostras provêm da mesma população, a estatística a
usar será
250 Lição nº 2

X1 − X 2
T = → t (n1 + n2 − 2);
1 1
σ +
n1 n2

Passo 3 Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

Com um nível de significância de 0,01 e


25 + 28 − 2 = 51 graus de liberdade, a regra de decisão
é rejeitar a hipótese nula sempre que o valor do teste seja
maior que 2,390.

Passo 4. Colectar dados amostrais e determinar o valor da


estatística de Teste.

n1s12 + n2 s22 25 × 82 + 28 × 62
σ = = = 7,2
n1 + n2 − 2 25 + 28 − 2

X1 − X 2 75 − 72
T = = = 1,51
1 1 1 1
σ + 7,2 × +
n1 n2 25 28

Passo 5 Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como T< 2,390, não rejeitar H 0 . Logo as meninas não

apresentam média de leitura diferente dos meninos.


Introdução à Estatística Ensino à Distância 251

Sumário
Para testar a diferença de médias use

X1 − X 2 σ 12 σ 22
Z= → N (0,1); σX = + quando as
σX 1−X2
1−X2
n1 n2

populações são normais e se conhece os valores das variâncias ou

X1 − X 2 n1s12 + n2 s22
T = → t (n1 + n2 − 2); σ = quando a
1 1 n1 + n2 − 2
σ +
n1 n2
suposição de igualdade das variâncias pode ser assumida.

Exercícios
1. Os testes de aptidão para um curso numa Universidade
forneceram os resultados seguintes (por sexo):

Auto-avaliação 21

Tamanho da Média Desvio


amostra padrão

Homens 151 85,8 19,3

Mulheres 108 71,5 12,2

Tempo de realização: Tabela 41: Estatísticas de amostras de homens e mulheres duma Universidade.
02:00 Horas.
Teste a hipótese de que as duas populações tem médias iguais,
adoptando a hipótese alternativa de que os homens têm média
mais alta que as mulheres.
252 Lição nº 2

2. Uma repartição de finanças tem dois funcionários a receber


declarações de IRPS, o Sr. Vagaroso e o Sr. Caracol. Na semana
passada foi destacado um novo Director para esta repartição.
Este, para ter uma ideia do tipo de atendimento ao público
realizado pelos seus funcionários, resolveu consultar o livro de
reclamações, onde verificou que grande parte das queixas
apresentadas eram respeitantes ao atendimento demasiado
moroso do Sr. Vagaroso, especialmente quando comparado com
o tempo de atendimento do Sr. Caracol. Para testar a veracidade
destas afirmações, o director resolveu recolher uma amostra
sobre o tempo de atendimento, em minutos, despendido por cada
um destes funcionários com cada utente. Os resultados amostrais
obtidos foram os seguintes:

Funcionário Tamanho da Média Desvio


amostra padrão

Sr. Caracol 16 22 20

Sr. Vagaroso 21 29 12

Tabela 42: Estatísticas de dos funcionários de repartição de finanças.

Supondo que os tempos de atendimento de cada um dos funcionários


seguem uma distribuição normal, decida se o director deve ou não
concordar com as queixas dos utentes, ao nível de significância de 5%.

3. Para comparar a eficiência de dois métodos de ensino, uma turma


de 24 alunos foi dividida aleatoriamente em dois grupos, sendo
aplicado um método diferente a cada grupo. Os resultados no fim
do semestre, numa escala de 0 a 100, foram os seguintes:

Grupos Tamanho da Média Variância


amostra

I 13 74,5 82,6

II 11 71,8 112,6

Tabela 43: Estatísticas de dois grupos duma turma.


Introdução à Estatística Ensino à Distância 253

Assumindo que as populações são normais e com variâncias iguais e


desconhecidas, Teste a um nível de 5% a hipótese nula de que os dois
métodos tem o mesmo efeito no ensino.

4. O Ministério de Educação está estudando os tempos de entrega


do livro escolar de dois fornecedores. O Ministério está satisfeito
com o fornecedor A e está preparado para ficar com este
fornecedor se o tempo de entrega médio for o mesmo ou menor
do que o fornecedor B. No entanto, se a firma achar que o tempo
médio de entrega do fornecedor B é menor do que aquele do
fornecedor A, ele começará a fazer compras de material do
fornecedor B.

a) Quais são as hipóteses nula e alternativa para esta


situação?

b) Considere que amostras independentes mostram as


seguintes características de tempo de entrega para os dois
fornecedores:

Fornecedor A Fornecedor B

n1 = 50 n2 = 30

x1 = 14 dias x2 = 12,5 dias

s1 = 3 dias s2 = 2 dias

Com α = 0,05 qual é a sua conclusão para as hipóteses em (a)? Que


atitude você recomenda em termos de selecção de fornecedor?

5. Os salários anuais iniciais para os indivíduos que entram nas


profissões de administração e de economia foram apresentados
numa revista em 1995. Os salários iniciais para uma amostra de
12 administradores e 14 economistas são apresentados a seguir,
com dados em milhares de dólares.
254 Lição nº 2

Administradores Economistas

30,6 31,6

31,2 26,6

28,9 25,5

35,2 25,0

25,1 25,9

33,2 32,9

31,3 26,9

35,3 25,8

31,0 27,5

30,1 29,6

29,9 23,9

24,4 26,9

24,4 25,5

Usando α = 0,05 , teste qualquer diferença entre os salários anuais


iniciais médios das populações para as duas profissões. Qual é a sua
conclusão?

Feedback

Resolução da auto-avaliação:

1.

Passo 1. Determinar as hipóteses nula e alternativa;

H 0 : μ1 ≤ μ2 , Onde μ1 é a média dos homens.

H1 : μ1 > μ 2 .
Introdução à Estatística Ensino à Distância 255

Passo 2. Identificar a estatística de Teste a usar.

Uma vez que n1 e n2 ≥ 30 , a distribuição amostral da


diferença de médias é aproximadamente normal.

X1 − X 2
O valor do teste é Z = ,
σ X −X
1 2

s1′ 21 s 2′ 2
em que σˆ X = + .
1−X2
n1 n2

Passo 3. Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

Uma vez que não se especifica o nível de significância,


adopte 0,05. Trata-se de um teste unilateral com
Z α = 2,57 . A decisão será rejeitar H 0 , sempre que o
valor do teste seja superior a 2,57.

Passo 4. Colectar dados amostrais e determinar o valor da


estatística de Teste.

X1 − X 2 X1 − X 2 85,8 − 71,5
Z= = = = 7,3
σ X −X s1′
2
s′ 2
19,3 2 12,2 2
1 2
+ 2 +
n1 n 2 151 108

Passo 5. Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como T > 2,57, a decisão é rejeitar H 0 ao nível de 5%.

Logo os homens têm média mais alta que as mulheres.


256 Lição nº 2

2.

Passo 1. Determinar as hipóteses nula e alternativa;

H 0 : μ1 ≤ μ2 ,

H1 : μ1 > μ 2 .

Onde μ1 é o tempo médio de atendimento do senhor


vagaroso.

Passo 2. Identificar a estatística de Teste a usar.

Tratando-se de pequenas amostras em que se desconhece


a variância da população, sendo justo supor que as duas
amostras provêm da mesma população, a estatística a
usar será

X1 − X 2
T = → t (n1 + n2 − 2); com
1 1
σ +
n1 n2

n1 s12 + n2 s 22
σ= .
n1 + n2 − 2

Passo 3. Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

Com um nível de significância de 0,05 e graus de


liberdade igual a 21 + 16 − 2 = 35 , a regra de decisão é
rejeitar a hipótese nula sempre que o valor do teste seja
maior que 1,690.

Passo 4. Colectar dados amostrais e determinar o valor da


estatística de Teste.
Introdução à Estatística Ensino à Distância 257

n1 s12 + n2 s 22 21 × 20 2 + 16 × 12 2
σ= = = 17,49
n1 + n2 − 2 21 + 16 − 2

X1 − X 2 29 − 22
T= = = 1,21
1 1 1 1
σ + 17,49 × +
n1 n2 21 16

Passo 5. Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como T < 1,690, a decisão a tomar é não rejeitar H 0 ao

nível de 0,05. Logo o director não deve concordar com as


queixas dos utentes.

3.

Passo 1. Determinar as hipóteses nula e alternativa;

H 0 : μ1 = μ 2 ,

H 1 : μ1 ≠ μ 2 .

Onde μ1 é a média do grupo I.

Passo 2. Identificar a estatística de Teste a usar.

Tratando-se de pequenas amostras em que se desconhece


a variância da população, assumindo-se igualdade de
variâncias, a estatística a usar será

X1 − X 2
T = → t (n1 + n2 − 2); com
1 1
σ +
n1 n2

n1 s12 + n2 s 22
σ= .
n1 + n2 − 2
258 Lição nº 2

Passo 3. Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

Com um nível de significância de 0,05 e graus de


liberdade igual a 13 + 11 − 2 = 22 , a regra de decisão é
rejeitar a hipótese nula sempre que o valor do teste esteja
fora do intervalo -1,717 e 1,717.

Passo 4. Colectar dados amostrais e determinar o valor da


estatística de Teste.

n1 s12 + n2 s 22 13 × 82,6 + 11 × 112,6


σ= = = 10,25
n1 + n 2 − 2 12 + 11 − 2

X1 − X 2 74,5 − 71,8
T= = = 0,64 .
1 1 1 1
σ + 10,25 × +
n1 n 2 13 11

Passo 5. Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como 0,64 pertence ao intervalo -1,7177 e 1,717, a


decisão a tomar é não rejeitar H 0 ao nível de 0,05. è de

aceitar que os dois métodos tem o mesmo efeito no


ensino.

4.

a) Determinar as hipóteses nula e alternativa;

H 0 : μ1 ≤ μ 2

H1 : μ1 > μ 2 .

Onde μ1 são os tempos médios de entrega do fornecedor


A.
Introdução à Estatística Ensino à Distância 259

b) Partiremos do passo 2, uma vez que as hipóteses já estão


formuladas na alínea a).

Passo 2. Identificar a estatística de Teste a usar.

Uma vez que n1 e n2 ≥ 30 , a distribuição amostral da


diferença de médias é aproximadamente normal.

X1 − X 2
O valor do teste é Z = ,
σ X −X
1 2

s1′ 21 s 2′ 2
em que σˆ X = + .
1−X2
n1 n2

Passo 3. Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

Uma vez que não se especifica o nível de significância,


adopte 0,05. Trata-se de um teste unilateral com
Z α = 2,57 . A decisão será rejeitar H 0 , sempre que o
valor do teste seja superior a 2,57.

Passo 4. Colectar dados amostrais e determinar o valor da


estatística de Teste.

X1 − X 2 X1 − X 2 14 − 12,5
Z= = = = 2,68 .
σ X −X s1′ 2 s 2′ 2 32 2 2
1 2
+ +
n1 n2 50 30

Passo 5. Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como T > 2,57, a decisão é rejeitar H 0 ao nível de 5%.

O fornecedor B apresenta tempos menores.


260 Lição nº 2

5.

Passo 1. Determinar as hipóteses nula e alternativa;

H 0 : μ1 = μ 2 ,

H 1 : μ1 ≠ μ 2 .

Onde μ1 é a média dos administradores.

Passo 2. Identificar a estatística de Teste a usar.

Tratando-se de pequenas amostras em que se desconhece


a variância da população, assumindo-se igualdade de
variâncias, a estatística a usar será

X1 − X 2
T = → t (n1 + n2 − 2); com
1 1
σ +
n1 n2

n1 s12 + n2 s 22
σ= .
n1 + n2 − 2

Passo 3. Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

Com um nível de significância de 0,05 e graus de


liberdade igual a 12 + 14 − 2 = 24 , a regra de decisão é
rejeitar a hipótese nula sempre que o valor do teste esteja
fora do intervalo -1,711 e 1,711.
Introdução à Estatística Ensino à Distância 261

Passo 4. Colectar dados amostrais e determinar o valor da


estatística de Teste.

xi x12 xi x12
30,6 936,36 31,6 998,56
31,2 973,44 26,6 707,56
28,9 835,21 25,5 650,25
35,2 1239,04 25 625
25,1 630,01 25,9 670,81
33,2 1102,24 32,9 1082,41
31,3 979,69 26,9 723,61
35,3 1246,09 25,8 665,64
31 961 27,5 756,25
30,1 906,01 29,6 876,16
29,9 894,01 23,9 571,21
24,4 595,36 26,9 723,61
366,2 11298,46 24,4 595,36
25,5 650,25
378 10296,68

X1 =
∑x i
=
366,2
≈ 30,5 . X2 =
∑x i
=
378
= 27
n1 12 n2 14

s 2
=
∑x 2
i − n1 x12
=
11298,46 − 12 × 30,5 2
= 12,3
1
n1 − 1 11

s 2
=
∑x 2
i − n2 x 22
=
10296,68 − 14 × 27 2
= 7, 0
2
n2 − 1 13

n1 s12 + n 2 s 22 12 × 12,3 + 14 × 7,0


σ= = = 3,2
n1 + n 2 − 2 12 + 14 − 2

X1 − X 2 30,5 − 27
T= = = 2,78 .
1 1 1 1
σ + 3,2 × +
n1 n 2 12 14
262 Lição nº 2

Passo 5. Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como 2,78 não pertence ao intervalo -1,711 e 1,711, a


decisão a tomar é rejeitar H 0 ao nível de 0,05.

Há diferença nos salários iniciais para as duas profissões.

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003

Leitura − LEVIN, Jack et al; Estatística para ciências Humanas. São


Paulo.Editora Pearson, 2004.
Introdução à Estatística Ensino à Distância 263

Lição nº 3
Teste de hipótese para diferença
de médias. Caso de amostras
emparelhadas.
Introdução
Na lição anterior foi tratado o caso de comparação de médias para duas
amostras independentes. Esta lição apresenta o teste de hipóteses no caso
em que as amostras são emparelhadas. É o caso da comparação de médias
envolvendo e mesmo conjunto de dados em dois momentos diferentes
(antes e depois).

Esta lição deverá ser estudada em aproximadamente 2 horas.

Tempo de estudo da lição:


02:00 Horas

Ao completar esta lição, você será capaz de:

ƒ Testar hipótese envolvendo amostras emparelhadas.

ƒ Identificar a distribuição amostral para amostras emparelhadas.


Objectivos

Teste de hipótese pata diferença de médias.

Amostras Emparelhadas

Para duas observações emparelhadas, o primeiro passo consiste em


determinar a diferença d entre cada par de valores, e seguidamente o
teste é aplicado a uma única amostra de valores d .
264 Lição nº 3

Vamos usar este teste para analisar o impacto de um anúncio de televisão


sobre as compras de um grupo de indivíduos.

Suponha que uma firma de pesquisa de mercado usou uma amostra de


pessoas para avaliar o potencial de compra de um determinado produto
antes e depois que os indivíduos vissem um anúncio de televisão sobre o
produto. As avaliações de potencial de compra foram baseadas em uma
escala de 0 a 10, com os valores mais altos indicando um potencial de
compra mais alto. Use α = 0,05 e os seguintes dados para testar a
hipótese alternativa de que o ver o comercial melhora a avaliação média
do potencial de compra por parte dos indivíduos.

Avaliação de compra

Indivíduo Antes do anúncio Depois do anúncio

1 5 6

2 4 6

3 7 7

4 3 4

5 3 5

6 9 8

7 7 5

8 6 6

Tabela 44: Avaliação de compra de 8 indivíduos antes e depois de verem o comercial.

Vamos primeiro colocar as hipóteses de pesquisa:

H 0 : μ1 ≥ μ 2 ou d ≥ 0 ; Onde μ1 e μ 2 são respectivamente médias de


potencial de compra do determinado produto antes e depois do comercial.

H a : μ1 < μ 2 ou d < 0
Introdução à Estatística Ensino à Distância 265

Distribuição amostral da diferença

A estatística a usar neste caso é

d
T = ,
sd

que segue uma distribuição t de Student com n − 1 graus de liberdade;

onde: d =
∑d i
é a média das diferenças e
n

s
sd = é o erro padrão. O desvio padrão da diferença é dado por
n −1

s=
∑d i
2
− nd 2
n

Testando a diferença de médias

Para um nível de 0,05 e 8 − 1 = 7 graus de liberdade a decisão a tomar é


rejeitar a hipótese nula sempre que o valor do teste não exceda a − 1,895 .

Indivíduo Antes do anúncio Depois do anúncio d d2

1 5 6 -1 1

2 4 6 -2 4

3 7 7 0 0

4 3 4 -1 1

5 3 5 -2 4

6 9 8 1 1

7 7 5 2 4

8 6 6 0 0

Total - - -3 15

Tabela 45: Tabela auxiliar para o cálculo do teste.


266 Lição nº 3

3
d =− = −0,375
8

s=
∑d i
2
− nd 215 − 8 × (−0,375) 2
= = 1,32
n 8
s 1,32
sd = = = 0,50
n −1 8 −1

d − 0,375
T = = = −0,75
sd 0,50

Como − 0,75 > −1,895 a decisão a tomar é não rejeitar a hipótese nula,
o que mostra que não houve uma variação significativa na média do
potencial de compra depois do comercial.

Um investigador estudou o nível de actividade de 10 indivíduos antes e


depois do almoço:

Exemplo 31

Indivíduo A B C D E F G H I J

Antes do 52 45 55 50 55 47 50 46 56 53
almoço

Depois do 50 49 51 48 53 43 49 47 55 50
almoço

Tabela 46: Nível de actividade de indivíduos antes e depois do almoço.

Admitindo que a variável em estudo têm distribuição normal na


população, verifique se os dois níveis de actividade diferem
significativamente para α = 10% .

Passo 1. Determinar as hipóteses nula e alternativa:

H0 : d = 0

Ha : d ≠ 0
Introdução à Estatística Ensino à Distância 267

Passo 2. Identificar a estatística de Teste a usar:

d
T= , segue distribuição t de Student com n − 1 graus
sd
de liberdade.

Passo 3. Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

Com α = 0,1 e n − 1 = 9 , a decisão é rejeitar sempre


que o valor de T esteja fora do intervalo

− 1,383 a 1,383

Passo 4. Colectar dados amostrais e determinar o valor da


estatística de Teste:

d =
∑d i
=
14
= 1,4
n 10

s=
∑d i
2
− nd 2
=
72 − 10 × 1,42
= 2,29
n 10

s 2,29
sd = = = 0,76
n −1 10 − 1

d 1,4
T= = = 1,84
sd 0,76

Passo 5. Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não:

A decisão é rejeitar a hipótese nula, com um nível de


significância de 0,1, ou seja, há diferença nos níveis de
actividade.
268 Lição nº 3

Sumário
O teste a usar para hipóteses no caso de amostras emparelhadas é

d
T = ,
sd

que segue uma distribuição t de Student com n − 1 graus de liberdade;

onde: d =
∑d i
é a média das diferenças e
n

s
sd = é o erro padrão. O desvio padrão da diferença é dado por
n −1

s=
∑d i
2
− nd 2
n

Exercícios

1. Foi desenvolvido um programa de informação às mulheres sobre


violência sexual. Após um determinado tempo, analisou-se a

Auto-avaliação 22 efectividade do programa recolhendo uma amostra de 15


organizações que implementaram o programa. O quê pode se dizer
sobre a efectividade do programa com base nos dados
mencionados abaixo?

Tempo de realização :
02:00 Horas.
Introdução à Estatística Ensino à Distância 269

Nr. De queixas Nr. De queixas


antes da depois da
implimentação implimentação
Organização do programa do programa
A 33 34
B 25 27
C 18 7
D 45 20
E 19 5
F 10 2
G 10 0
H 15 2
I 15 12
J 14 10
K 8 2
L 2 8
M 2 0
N 0 0
O 1 0
Tabela 47: número de queixas antes e depois da implementação do programa.

2. Afim de diminuir o número de gravidezes precoces, uma


maternidade deu 2 testes, um antes (teste diagnóstico) e outro
depois (teste final) de um curso sobre problemas sexuais. Diga se
houve um desenvolvimento significativo nos conhecimentos
sobre problemas sexuais destas mulheres.

Estudantes A B C D E F G H I J K

Teste diagnóstico 08 10 15 06 09 15 07 05 18 17 13

Teste final 10 12 16 18 12 14 14 07 18 18 15

Tabela 48: Nível de conhecimento de problemas sexuais antes e depois do curso.

4. Certo distribuidor ao comercializar um novo aditivo assegura que


este faz reduzir consideravelmente o consumo de combustível. Uma
organização de automobilistas resolveu comprovar tal afirmação,
para o que seleccionou dez modelos diferentes de carros, que
percorreram determinado troço nas mesmas condições, primeiro sem
aditivo e depois com o aditivo. Os consumos em litros foram os
seguintes:
270 Lição nº 3

Sem aditivo 8,08 6,85 8,46 7,80 7,0 10,53 8,47 6,79 7,11 9,30
6

Com aditivo 7,71 6,72 8,42 7,76 6,7 10,34 8,42 6,21 6,83 9,29
0

Tabela49: Gastos de combustível de modelos de carros sem e com aditivo.

Que se deve concluir para α = 0,01 ?

Feedback
Resolução da Auto-Avaliação

1.
Passo 1. Determinar as hipóteses nula e alternativa:
H0 : d ≤ 0

Ha : d > 0

Passo 2. Identificar a estatística de Teste a usar:


d
T= , segue distribuição t de Student com n − 1 graus de
sd

liberdade; onde s d =
s
com s =
∑d i
2
− nd 2
n −1 n

Passo 3. Especificar o nível de significância do teste e


usa-lo para desenvolver uma regra de rejeição para a hipótese
nula.
Uma vez não especificado, adoptemos um α = 0,5 e
n − 1 = 15 − 1 = 14 , a decisão é rejeitar sempre que o
valor de T seja maior que 1,761.

Passo 4. Colectar dados amostrais e determinar o valor da


estatística de Teste:
Introdução à Estatística Ensino à Distância 271

Nº Nº
Quiexas queixas
Org. antes depois di d i2
A 33 34 -1 1
B 25 27 -2 4
C 18 7 11 121
D 45 20 25 625
E 19 5 14 196
F 10 2 8 64
G 10 0 10 100
H 15 2 13 169
I 15 12 3 9
J 14 10 4 16
K 8 2 6 36
L 2 8 -6 36
M 2 0 2 4
N 0 0 0 0
O 1 0 1 1
88 7744

d =
∑d i
=
88
≈ 6,29
n 14
d d 6,29
T= = = = 0,97
sd d − nd
i
2 2
7744 − 14 × 6,29 2
n(n − 1) 14 × 13

Passo 5. Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não:
Uma vez que 0,97 é menor que 1,761, a decisão é não
rejeitar a hipótese nula, com um nível de significância de
0,05, ou seja, o programa não foi efectivo.

2.
Passo 1. Determinar as hipóteses nula e alternativa:
H0 : d ≤ 0
Ha : d > 0

Passo 2. Identificar a estatística de Teste a usar:


272 Lição nº 3

d
T= , segue distribuição t de Student com n − 1 graus de
sd

liberdade; onde s d =
s
com s =
∑d i
2
− nd 2
n −1 n

Passo 3. Especificar o nível de significância do teste e


usa-lo para desenvolver uma regra de rejeição para a hipótese
nula.
Uma vez não especificado, adoptemos um α = 0,5 e
n − 1 = 11 − 1 = 10 , a decisão é rejeitar sempre que o
valor de T seja maior que 1,812.

Passo 4. Colectar dados amostrais e determinar o valor da


estatística de Teste:

d =
∑d i
=
− 31
≈ −2,82
n 11
d d − 2,82
T= = = = −2,56
sd d − nd
i
2 2
221 − 11 × (−2,82) 2
n(n − 1) 11 × 10

Passo 5. Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não:
Uma vez que -2,56 é menor que 1,812, a decisão é não
rejeitar a hipótese nula, com um nível de significância de
0,05, ou seja, o que mostra não houve um
desenvolvimento significativo nos conhecimentos.

3.
Passo 1. Determinar as hipóteses nula e alternativa:
H0 : d ≤ 0
Ha : d > 0

Passo 2. Identificar a estatística de Teste a usar:


Introdução à Estatística Ensino à Distância 273

d
T= , segue distribuição t de Student com n − 1 graus de
sd

liberdade; onde s d =
s
com s =
∑d i
2
− nd 2
n −1 n

Passo 3. Especificar o nível de significância do teste e


usa-lo para desenvolver uma regra de rejeição para a hipótese
nula.
Com α = 0,01 e n − 1 = 10 − 1 = 9 , a decisão é rejeitar
sempre que o valor de T seja maior que 2,821.

Passo 4. Colectar dados amostrais e determinar o valor da


estatística de Teste:

d =
∑d i
=
2,05
≈ −0,205
n 10
d d 0,205
T= = = = 3,44
sd d i2 − nd 2 0,7401 − 10 × (0,205) 2
n(n − 1) 10 × 9

Passo 5. Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não:
Uma vez que 3,44 é menor que 1,833, a decisão é rejeitar
a hipótese nula, com um nível de significância de 0,05,
ou seja, o aditivo reduz consideravelmente o consumo de
combustível.

ANDERSON, D. R; Estatística aplicada à Administração e economia;


São Paulo Thomson leaning; 2003

Leitura LEVIN, Jack et al; Estatística para ciências Humanas. São Paulo.Editora
Pearson, 2004.
274 Unidade 6

Unidade 6
O teste de independência do Qui-
quadrado
Introdução
Expressões como estas são frequentes no nosso dia a dia:

Meninos de famílias pobres são mais sucedidas na aprendizagem do que


de famílias médias ou ricas ou,

Há mais mulheres infectadas pelo HIV do que homens. Como testar tais
hipóteses?

Em geral, quando temos inferências sobre uma amostra da população,


classificada segundo duas ou mais variáveis qualitativas, pode usar o teste
Qui-quadrado.

Esta unidade comporta 1 lição. O seu estudo deverá durar cerca de 04


horas. O caderno de notas e a calculadora deverão acompanhar todo o
estudo.

Tempo de estudo da
Unidade: 04:00 Horas

Ao completar esta unidade você será capaz de:

ƒ Determinar o valor de Qui-quadrado usando a tabela.

ƒ Formular hipóteses em problemas envolvendo tabelas de contingência.


Objectivos
ƒ Testar hipóteses usando a distribuição Qui-quadrado.
Introdução à Estatística Ensino à Distância 275

Plano de estudo da Unidade

Esta unidade comporta apenas uma lição. O tempo de estudo da unidade


poderá ser de duas horas, sendo necessárias outras duas para
autoavaliação.

Lição nº 1
Teste de independência do Qui-
quadrado.
Introdução
Até agora a inferência estatística tem sido apresentada em relação a
problemas paramétricos. Nos problemas não paramétricos sucede em
geral que a forma de distribuição da população não é conhecida. Os
métodos não paramétricos introduzem procedimentos aplicáveis
independentemente da forma da distribuição.

O método que a seguir se apresenta é o método cuja principal


vocação é o tratamento de dados resultantes de contagens e que envolvem
muitas vezes escalas nominais ou ordinais. Este usa dados amostrais para
testar a independência de duas variáveis.

Ao completar esta lição, você será capaz de:

ƒ Formular hipótese que envolvem de independência do Qui-quadrado.

ƒ Testar hipóteses envolvendo que envolvem independência usando a


Objectivos distribuição Qui-quadrado.

ƒ Reconhecer as limitações do teste Qui-quadrado.


276 Lição nº 1

O teste de independência de Qui-Quadrado.

Suponha que uma pesquisa realizada na cidade de Maputo concluiu que


os alunos desfavorecidos eram mais sucedidos na escola que os
abastados. Suponha que uma amostra de alunos da 12ª tenha produzido os
Estudo de caso
seguintes resultados:

Resultado Final

Nível social Aprovado Reprovado

Alto 23 45

Baixo 97 75

Tabela 50: Resultado dos alunos da 12ª duma escola.

Será de admitir a relação entre estas duas variáveis: Nível social e


Resultado final?

O primeiro passo no teste de independência é completar a tabela com os


totais parciais das linhas e colunas como se mostra a seguir:

Resultado Final

Nível social Aprovado Reprovado Total

Alto 23 45 68

Baixo 97 75 172

Total 120 120 240

Tabela 51: Resultado dos alunos da 12ª com os totais parciais.

Assumindo que o resultado final é independente do nível social, então,


dos 68 alunos do nível alto, era de esperar que 34 ficassem aprovados e
outros 34 reprovados. Da mesma maneira teríamos para os 172 alunos do
nível baixo 86 aprovados e mesmo número de reprovados. Uma forma de
encontrar estas frequências esperadas é multiplicar os totais parciais da
linha e coluna e dividir pelo tamanho da amostra.
Introdução à Estatística Ensino à Distância 277

Para a frequência esperado da primeira linha e coluna tem-se:

68 × 120
34 = = e11 (frequência esperada da linha 1 e coluna 1)
240

Duma maneira geral a frequência esperada da linha i e coluna j é dada por

(Total da linha i )(Total da coluna j )


eij =
Tamanho da amostra

Resultado Final

Nível Social Aprovado Reprovado

Alto 23 (34) 45 (34)

Baixo 97 (86) 75 (86)

Tabela 52: Frequência observada e esperada dos dados sobre os resultados dos alunos da 12ª
classe.

(Observe que os números destacados a grosso representam as


frequências esperadas para cada caso)

Determinando o valor do Teste

O teste focaliza as diferenças entre as frequências observadas e as


frequências esperadas. Grandes diferenças entre essas frequências trazem
dúvidas quanto à suposição de independência. A questão é respondida
pelo teste do Qui-Quadrado. Este teste consiste na soma dos quocientes
do quadrado das diferenças entre as frequências observadas e esperadas,
pela frequência esperada de cada célula:

(23 − 34) 2 (45 − 34) 2 (97 − 86) 2 (75 − 86) 2


χ2 = + + + = 9,93
34 34 86 86
278 Lição nº 1

Em geral, o valor de χ 2 baseado nas frequências observada e esperada é


determinado pela expressão:

( f ij − eij ) 2
χ 2 = ∑∑ ,
i j eij

Onde:

f ij é a frequência observada e na linha i e coluna j

eij a frequência esperada na linha i e coluna j

Uso da tabela da distribuição Qui-quadrado ( χ 2 )

Para tirar alguma conclusão, o valor obtido deve ser comparado com o
valor do Qui-quadrado tabelado com (l − 1)(c − 1) graus de liberdade.

(Veja a tabela da distribuição χ 2 no apêndice D).

O exemplo seguinte mostra-lhe como se trabalha com a tabela da


distribuição χ 2 .

1. Para uma distribuição χ 2 com 17 graus de liberdade, determine


a área correspondente a cada uma das regiões:

Exemplo 32 a) À esquerda de 7,564

b) À direita de 27,59

c) Entre 6,408 e 27,59

2. Determine:

a) χ 02,95 (17)

b) χ 02, 025 (17)

Para exercício 1a) localize o valor 7,564 na linha de 17 graus de


liberdade. Este valor localiza-se na segunda coluna em que
P( X ≤ x) = 0,025 . Então P( X ≤ 7,564) = 0,025 .
Introdução à Estatística Ensino à Distância 279

Em 1b) o valor 27,59 (localizado na linha 17 graus de liberdade)


corresponde a P ( X ≤ x) = 0,950. A área pretendida é

P( X > 27,59) = 0,05

Em 1c) os valores 6,408 e 27,59 correspondem respectivamente a


P ( X ≤ 0,010) e P ( X ≤ 0,950) A área pretendida é

P(6,408 < X < 27,59) = 0,950 − 0,010 = 0,940.

No exercício 2 pede-se para determina o valor de χ 2 para 17 graus de


liberdade e nível de significância ( α ) igual a 0,950 e 0,025
respectivamente para as alíneas a e b. Consultando na linha 17 e coluna
χ 02,95 (r ) = 8,672 e χ 02,025 (r ) = 30,19 .

Voltando ao exercício em discussão:

Para este caso gl = 1 , isto é, (2 − 1)(2 − 1) = 1 tabela em causa têm duas


colunas e duas linhas); e o valor tabelado para um nível de significância
de 5% (Valor adoptado uma vez que não é dado o nível de significância)
é 3,841 < 9,93, que leva a rejeição da hipótese nula e a confirmação de
que existe uma relação entre o resultado final e o nível social.

Uma pesquisa de opinião sobre o desporto preferido forneceu os


seguintes dados para homens e mulheres:

Exemplo 33 Desporto Preferido

Sexo Andebol Basquetebol Futebol

Homens 19 15 24

Mulheres 16 18 16

Tabela 53: Preferência de homens e mulheres em relação ao desporto.

Use α = 0,05 e teste as mesmas preferências em desporto parta homens


e mulheres. Qual é a sua conclusão?
280 Lição nº 1

Feedback
Resolução:

Passo 1 Determinar as hipóteses H 0 e H a :

H 0 : O desporto preferido é independente do sexo.

H a : O desporto preferido não é independente do Sexo.

Passo 2 Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

α = 0,05 e gl = (2 − 1)(3 − 1) = 2 ⇒ χ α2 = 5,991 .


Observe que a tabela têm duas linhas e três colunas.

A regra de decisão é portanto rejeitar a hipótese nula


sempre que o valor de χ 2 seja maior que 5,991.

Passo 3 Colectar dados amostrais e determinar os totais parciais


(das linhas e colunas) e as frequências esperadas em cada
célula:

Desporto Preferido

Sexo Andebol Basquetebol Futebol Total

Homens 19 15 24 58

Mulheres 16 18 16 50

Total 35 33 40 108

Tabela 54: Tabela auxiliar para o cálculo do teste Qui-quadrado.


Introdução à Estatística Ensino à Distância 281

58 × 35 58 × 33 58 × 40
e11 = = 18,80 e12 = = 17,72 e13 = = 21,48
108 108 108
50 × 35 50 × 33 50 × 40
e21 = = 16,20 e22 = = 15,28 e23 = = 15,52
108 108 108

Passo 4 Determinar a estatística do teste:

( f ij − eij ) 2
Célula f ij eij f ij − eij ( f ij − eij ) 2
eij

1,1 19 18,8 0,20 0,0400 0,0021

1,2 15 17,72 -2,72 7,3984 0,4175

1,3 24 21,48 2,52 6,3504 0,2956

1,4 16 16,2 -0,20 0,0400 0,0025

1,5 18 15,28 2,72 7,3984 0,4842

1,6 16 15,52 0,48 0,2304 0,0148

Total 1,2168

Tabela 55: Tabela auxiliar para o cálculo do teste Qui-quadrado.

χ 2 ≈ 1,22

Passo 5 Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como 1,22 < 5,991 a decisão a tomar é não rejeitar a


hipótese nula para um nível de significância de 5%. A
conclusão a tirar com base nas dados amostrais é que as
variáveis Sexo e Desporto preferido são independentes.
282 Lição nº 1

Nota:

1) Para que o teste de Qui-quadrado seja aplicado, as frequências

esperadas em cada célula devem ter valores não inferiores a 5.

2) O teste de independência é sempre um teste unilateral com a

região de rejeição localizada na cauda superior (à direita) da

distribuição de Qui-quadrado.

Sumário
Uma aplicação da distribuição qui-quadrado é o uso de dados amostrais
para testar a independência de duas variáveis. A estatística do teste é
( f ij − eij ) 2
χ = ∑∑
2
.
i j eij

O teste é sempre unilateral e a região de rejeição localiza-se na cauda


superior da distribuição. A exigência para que este teste seja calculado é
que a frequência esperada em cada célula dever ser igual ou superior a 5.

Exercícios
1. Perguntamos a 50 fumantes e a 50 não fumantes se eles
acreditam que o fumo pode conduzir ao cancro do pulmão e

Auto-avaliação 23 outras doenças sérias. As respostas estão tabeladas da seguinte


maneira:

Acreditam Não Acreditam

Fumantes 11 39

Não Fumantes 28 22

Tempo de realização: Tabela 56: percepção de fumantes e não fumantes sobre a influência do fumo no cancro
do pulmão.
02:00 Horas.
Introdução à Estatística Ensino à Distância 283

2. Haverá alguma relação entre a preferência por certo tipo de filme


e o estado civil? Suponha que para responder a questão acima
tenha se seleccionado uma amostra de 400 pessoas e classificada
segundo o estado civil e a preferência por tipo de filme. Os
resultados foram:

Preferência

Estado civil Policial Comédia Romance

Solteiro 40 25 30

Casado 26 31 33

Divorciado 46 33 31

Viúvo 33 38 34

Tabela 57: Preferência por tipo de filme em função do estado civil.

Com base nos dados acima qual é a sua conclusão em relação à


questão colocada? Use α = 0,1.

3. Uma amostra de 200 alunos recém licenciados foi classificada


de acordo com 2 critérios:

i) Ao aluno foi ou não concedida uma bolsa de estudos;

ii) Classificação obtida no final da licenciatura.

Classificação

Bolsa Suficiente Bom Muito Bom

Atribuída 10 35 50

Não atribuída 75 20 10

Tabela 58: Classificação de alunos em função da concessão da bolsa e da classificação


final obtida.
284 Lição nº 1

Determine, para α = 0,01 se a classificação obtida pelos alunos

no final da licenciatura é independente do facto de lhes ter


sido, ou não, atribuída uma bolsa de estudos.

Feedback
Resolução:

1.
Passo 1 Determinar as hipóteses H 0 e H a :

H 0 : A resposta é independente de ser ou não fumante

H a : A resposta é dependente de ser ou não fumante.

Passo 2 Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

α = 0,05 e gl = (2 − 1)(2 − 1) = 1 ⇒ χ α2 = 3,841 .

A regra de decisão é portanto rejeitar a hipótese nula


sempre que o valor de χ 2 seja maior que 3,841.

Passo 3 Colectar dados amostrais e determinar os totais parciais


(das linhas e colunas) e as frequências esperadas em cada
célula:

Acreditam Não Acreditam Total

Fumantes 11 39 50

Não Fumantes 28 22 50

Total 39 61 100
Introdução à Estatística Ensino à Distância 285

50 × 39 50 × 61
e11 = = 19,5 e12 = = 30,5
100 100

50 × 39 50 × 61
e21 = = 19,5 e22 = = 30,5
100 100

Passo 4 Determinar a estatística do teste:

( f ij − eij ) 2
Célula f ij eij f ij − eij ( f ij − eij ) 2

eij

1,1 11 19,5 -8,5 72,25 3,70512821

1,2 39 30,5 8,5 72,25 2,36885246

2,1 28 19,5 8,5 72,25 3,70512821

2,2 22 30,5 -8,5 72,25 2,36885246

Total 12,1479613

χ 2 ≈ 12,15

Passo 5 Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como 12,15 > 3,841 a decisão a tomar é rejeitar a


hipótese nula para um nível de significância de 5%. A
conclusão a tirar com base nos dados amostrais é que há
dependência entre o tipo de resposta e o facto de ser ou
não fumador.
286 Lição nº 1

2.

Passo 1 Determinar as hipóteses H 0 e H a :

H 0 : Não há relação entre a preferência do filme e o


estado civil.

H a : O tipo de filme depende do estado civil.

Passo 2 Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

α = 0,01 e gl = (4 − 1)(3 − 1) = 8 ⇒ χ α2 = 15,507 .

A regra de decisão é portanto rejeitar a hipótese nula


sempre que o valor de χ 2 seja maior que 20,090.

Passo 3 Colectar dados amostrais e determinar os totais parciais


(das linhas e colunas) e as frequências esperadas em cada
célula:

Preferência
Total
Estado civil Policial Comédia Romance

Solteiro 40 25 30 95

Casado 26 31 33 90

Divorciado 46 33 31 110

Viúvo 33 38 34 105

Total 145 127 128 400

95 × 145 95 × 127
e11 = = 34,4375 e12 = = 30,1625
400 400
95 × 128 90 × 145
e13 = = 30,4 e21 = = 32,625
400 400
Introdução à Estatística Ensino à Distância 287

90 × 127 90 × 128
e22 = = 28,575 e23 = = 28,8
400 400
110 × 145 110 × 127
e31 = = 39,875 e32 = = 34,925
400 400
110 × 128 105 × 145
e13 = = 35,2 e41 = = 38,0625
400 400
105 × 127 105 × 128
e42 = = 33,3375 e43 = = 33,6
400 400

Passo 4 Determinar a estatística do teste:

( f ij − eij ) 2
Célula f ij eij f ij − eij ( f ij − eij ) 2
eij

1,1 40 34,4375 5,5625 30,94141 0,89848004

1,2 25 30,1625 -5,1625 26,65141 0,88359407

1,3 30 30,4 -0,4 0,16 0,00526316

2,1 26 32,625 -6,625 43,89063 1,34530651

2,2 31 28,575 2,425 5,880625 0,20579615

2,3 33 28,8 4,2 17,64 0,6125

3,1 46 39,875 6,125 37,51563 0,94083072

3,2 33 34,925 -1,925 3,705625 0,10610236

3,3 31 35,2 -4,2 17,64 0,50113636

4,1 33 38,0625 -5,0625 25,62891 0,67333744

4,2 38 33,3375 4,6625 21,73891 0,65208568

4,3 34 33,6 0,4 0,16 0,0047619

Total 6,8291944

χ 2 ≈ 6,83
288 Lição nº 1

Passo 5 Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como 6,83 < 20,090 a decisão a tomar é não rejeitar a


hipótese nula para um nível de significância de 1%. A
conclusão a tirar com base nos dados amostrais é não há
preferência do tipo de filme em função do estado civil.

3.

Passo 1 Determinar as hipóteses H 0 e H a :

H 0 : A classificação é independente da bolsa

H a : A classificação depende da bolsa.

Passo 2 Especificar o nível de significância do teste e usa-lo para


desenvolver uma regra de rejeição para a hipótese nula.

α = 0,01 e gl = (2 − 1)(3 − 1) = 2 ⇒ χ α2 = 9,210 .

A regra de decisão é portanto rejeitar a hipótese nula


sempre que o valor de χ 2 seja maior que 9,210.

Passo 3 Colectar dados amostrais e determinar os totais parciais


(das linhas e colunas) e as frequências esperadas em cada
célula:

Classificação
Total
Bolsa Suficiente Bom Muito Bom

Atribuída 10 35 50 95

Não atribuída 75 20 10 105


Introdução à Estatística Ensino à Distância 289

95 × 85 95 × 55
e11 = = 40,375 e12 = = 26,125
200 200
95 × 60 105 × 85
e13 = = 28,5 e21 = = 44,625
200 200
105 × 55 105 × 60
e22 = = 28,875 e32 = = 31,5
200 200

Passo 4 Determinar a estatística do teste:

( f ij − eij ) 2
Célula f ij eij f ij − eij ( f ij − eij ) 2

eij

1,1 10 40,375 -30,375 922,64063 22,8517802

1,2 35 26,125 8,875 78,765625 3,01495215

1,3 50 28,5 21,5 462,25 16,2192982

2,1 75 44,625 30,375 922,64063 20,6754202

2,2 20 28,875 -8,875 78,765625 2,72781385

2,3 10 31,5 -21,5 462,25 14,6746032

Total 80,1638678

χ 2 ≈ 80,16

Passo 5 Comparar o valor da estatística do Teste com o valor


crítico especificado na regra de rejeição e determinar se a
hipótese nula deve ser rejeitada ou não.

Como 80,16 > 9,210 a decisão a tomar é rejeitar a


hipótese nula para um nível de significância de 1%. A
conclusão a tirar com base nos dados amostrais é que há
dependência entre o resultado e a atribuição ou não da
bolsa de estudo.
290 Anexos

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003

Leitura − LEVIN, Jack et al; Estatística para ciências Humanas. São


Paulo.Editora Pearson, 2004.

Anexos
Técnicas de Amostragem

Amostragem probabilística

Uma amostragem probabilística é uma metodologia de amostragem pela


qual cada unidade (por exemplo ‘pessoa’, ‘agregado familiar’ ou
‘empresa/estabelecimento’) duma população-alvo definida, tem uma
possibilidade conhecida e não zero de ser seleccionada, ou seja, é o
procedimento em que todos os elementos da População têm uma
probabilidade conhecida e superior a zero de integrar a Amostra.

A chance - ou a probabilidade - de seleccionar uma unidade para inclusão


na pesquisa/inquérito deve ser matematicamente calculável.

A amostragem probabilística permite inferir os resultados à população,


isto é, as conclusões podem ser generalizadas para a população inteira
(universo), permitindo a apresentação dos resultados numa base científica
fundamentada
Introdução à Estatística Ensino à Distância 291

Amostragem não probabilística (não aleatória).

Não se conhece a probabilidade de um elemento da população ser


escolhido para participar da amostra.

Ao usar a amostragem não probabilística o pesquisador não sabe qual é a


probabilidade de que um elemento da população tem de pertencer à
amostra. Portanto, os resultados da amostra não podem ser
estatisticamente generalizados para a população, porque não se pode
estimar o erro amostral. Se as características da população acessível
forem semelhantes às da população alvo os resultados podem ser
equivalentes aos de uma amostragem probabilística, mas não podemos
garantir a sua confiabilidade.

Tipos de Amostragem Probabilística

A amostragem nos levantamentos pode assumir formas diversas,


em função do tipo de população, de sua extensão, das condições
materiais para realização da pesquisa etc. Os tipos mais utilizados
são:

Amostragem Aleatória Simples

Também conhecida por amostragem casual, randônica,


acidental etc, consiste basicamente em atribuir a cada
elemento do universo um número único para, depois,
seleccionar alguns desses elementos de maneira casual.
Este procedimento, embora seja o que mais se ajusta aos
princípios da teoria das probabilidades, nem sempre é o de
mais fácil aplicação, sobretudo porque se deseja que se
atribua a cada elemento da população um número único.
Além disso, despreza o conhecimento prévio da população
que por ventura o pesquisador pode ter.

Amostragem Sistemática

É uma variação da amostragem aleatória simples. Sua


aplicação requer que a população seja ordenada de modo tal
292 Anexos

que cada um de seus elementos possa ser unicamente


identificado pela posição. Apresentam condições para
satisfação desse requisito uma população identificada a
partir de uma lista que englobe todos os seus elementos,
uma fila de pessoas ou o conjunto de candidatos a um
concurso identificado pela ficha de inscrição.

Amostragem Estratificada

Caracteriza-se pela selecção de uma amostra de cada


subgrupo da população considerada. O fundamento para
delimitar os subgrupos ou estratos pode ser encontrado em
propriedades como sexo, idade ou classe social. Muitas
vezes essas propriedades são combinadas, o que exige uma
matriz de classificação. Por exemplo quando se compara
homens e mulheres com "maior de 18 anos" e menor de 18
anos" resultam quatros estratos: homem menor de 18 anos,
mulher menor de 18 anos, homem maior de 18 anos, mulher
maior de 18 anos. A amostragem estratificada pode ser
proporcional ou não-proporcional. No primeiro caso,
selecciona-se de cada grupo uma amostra aleatória que seja
proporcional à extensão de cada subgrupo determinada por
alguma propriedade tida como relevante.

Este tipo de amostragem tem como principal vantagem o


fato de assegurar representatividade em relação às
propriedades adoptadas como critérios para estratificação.
No caso da amostragem estratificada não-proporcional, a
extensão da amostra dos vários estratos não é proporcional
à extensão desses estratos em relação ao universo. Há
situações em que esse procedimento é o mais adequado,
particularmente naqueles em que se tem interesse na
comparação entre os vários estratos.
Introdução à Estatística Ensino à Distância 293

Amostragem por Conglomerados

É indicada em situações em que é bastante difícil a


identificação de seus elementos. É o caso, por exemplo, de
pesquisa cuja população seja constituída por todos os
habitantes de uma cidade. Em casos desse tipo é possível
proceder-se à selecção da amostra a partir de
"conglomerados"(quarteirões, organizações, edifícios,
fazendas, etc.)

Amostragem Por Cotas

Este tipo de amostragem é muito utilizado em pesquisas


eleitorais e de mercado, tendo como principal vantagem o
seu baixo custo. De modo geral é desenvolvida em três
fases: 1° - Classificação da população em função de
propriedades tidas como relevantes para o fenómeno a ser
estudado. 2° - Determinação da proporção da população a
ser colocada em cada classe com base na constituição
conhecida ou presumida da população. 3° - Fixação de cotas
para cada entrevistador encarregado de seleccionar
elementos da população a ser pesquisada de modo tal que a
amostra total seja composta em observância à proporção das
classes consideradas.

Tipos de Amostragem não probabilística

Amostragem acidental.

A amostragem acidental é constituída por elementos que vão


aparecendo, que são possíveis de se obter até completar o número
de elementos da amostra. Geralmente empregue em pesquisas de
opinião, em que os entrevistados são acidentalmente
entrevistados.

Amostragem por julgamento (intencional).


294 Anexos

O pesquisador deliberadamente escolhe alguns elementos para


fazer parte da amostra, com base no seu julgamento de aqueles
seriam representativos da população. Este tipo de amostragem é
bastante usado em estudos qualitativos. Obviamente o risco de
obter uma amostra viciada é grande, pois baseia-se totalmente
nas preferências do pesquisador, que pode se enganar
(involuntária ou "voluntariamente").

Amostragem por Quotas

Parece semelhante a uma amostragem estratificada proporcional,


da qual se diferencia por não empregar sorteio na selecção dos
elementos. A população é dividida em vários subgrupos, na
realidade é comum dividir em um grande número para compensar
a falta de aleatoriedade, e selecciona-se uma cota de cada
subgrupo, proporcional ao seu tamanho.
Introdução à Estatística Ensino à Distância 295

Tabela da Distribuição Normal Padrão

P(Z<z) (área à esquerda do valor de Z indicado)

z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359

0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753

0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141

0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517

0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224

0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549

0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852

0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133

0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389

1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621

1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830

1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015

1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177

1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319

1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441

1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545

1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633

1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706

1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767

2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817

2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
296 P(Z<z) (área à esquerda do valor de Z indicado)

2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890

2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916

2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936

2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952

2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964

2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974

2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981

2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986

3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990

3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993

3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995

3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997

3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998

3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998

3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999

3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999

3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999

3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

Continuação (Parte Negativa)

z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641

-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247

-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859

-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483

-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121

-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
Introdução à Estatística Ensino à Distância 297

-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451

-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148

-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867

-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611

-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379

-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170

-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985

-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823

-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681

-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559

-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455

-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367

-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294

-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233

-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183

-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143

-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110

-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084

-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064

-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048

-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036

-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026

-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019

-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014

-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010

-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007

-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
298 P(Z<z) (área à esquerda do valor de Z indicado)

-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003

-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002

-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002

-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001

-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001

-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001

-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
Introdução à Estatística Ensino à Distância 299

TABELA Distribuição t de Student


área
indicada

0 t
(valor tabulado)

Área na cauda superior

gl 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005

1 1,000 3,078 6,314 12,71 31,82 63,66 127,3 318,3 636,6

2 0,816 1,886 2,920 4,303 6,965 9,925 14,09 22,33 31,60

3 0,765 1,638 2,353 3,182 4,541 5,841 7,453 10,21 12,92

4 0,741 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,610

5 0,727 1,476 2,015 2,571 3,365 4,032 4,773 5,894 6,869

6 0,718 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,959

7 0,711 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408

8 0,706 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,041

9 0,703 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781

10 0,700 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587

11 0,697 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437

12 0,695 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,318

13 0,694 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,221

14 0,692 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,140

15 0,691 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073

16 0,690 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,015

17 0,689 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,965

18 0,688 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,922

19 0,688 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883

20 0,687 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,850

21 0,686 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,819

22 0,686 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792

23 0,685 1,319 1,714 2,069 2,500 2,807 3,104 3,485 3,768

24 0,685 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,745

25 0,684 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,725


300 P(Z<z) (área à esquerda do valor de Z indicado)

26 0,684 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707

27 0,684 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,689

28 0,683 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674

29 0,683 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,660

30 0,683 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,646

35 0,682 1,306 1,690 2,030 2,438 2,724 2,996 3,340 3,591

40 0,681 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551

45 0,680 1,301 1,679 2,014 2,412 2,690 2,952 3,281 3,520

50 0,679 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,496

z 0,674 1,282 1,645 1,960 2,326 2,576 2,807 3,090 3,291


Introdução à Estatística Ensino à Distância 301

Tabela da Distribuição Qui-quadrado

α
0,995 0,99 0,975 0,95 0,90 0,75 0,50 0,25 0,10 0,05 0,025 0,01 0,005 0,001
ϕ

1 0,0004 0,002 0,001 0,004 0,016 0,102 0,455 1,323 2,706 3,841 5,024 6,635 7,879 10,828

2 0,010 0,020 0,051 0,103 0,211 0,575 1,386 2,773 4,605 5,991 7,378 9,210 10,597 13,816

3 0,072 0,115 0,216 0,352 0,584 1,213 2,366 4,108 6,251 7,815 9,348 11,345 12,838 16,266

4 0,207 0,297 0,484 0,711 1,064 1,923 3,357 5,385 7,779 9,488 11,143 13,277 14,860 18,467

5 0,412 0,554 0,831 1,145 1,610 2,675 4,351 6,626 9,236 11,071 12,833 15,086 16,750 20,515

6 0,676 0,872 1,237 1,635 2,204 3,455 5,348 7,841 10,645 12,592 14,449 16,812 18,548 22,458

7 0,989 1,239 1,690 2,167 2,833 4,255 6,346 9,037 12,017 14,067 16,013 18,475 20,278 24,322

8 1,344 1,646 2,180 2,733 3,490 5,071 7,344 10,219 13,362 15,507 17,535 20,090 21,955 26,125

9 1,735 2,088 2,700 3,325 4,168 5,899 8,343 11,389 14,684 16,919 19,023 21,666 23,589 27,877

10 2,156 2,558 3,247 3,940 4,865 6,737 9,342 12,549 15,987 18,307 20,483 23,209 25,188 29,588

11 2,603 3,053 3,816 4,575 5,578 7,584 10,341 13,701 17,275 19,675 21,920 24,725 26,757 31,264

12 3,074 3,571 4,404 5,226 6,304 8,438 11,340 14,845 18,549 21,026 23,337 26,217 28,299 32,909

13 3,565 4,107 5,009 5,892 7,042 9,299 12,340 15,984 19,812 22,362 24,736 27,688 29,819 34,528

14 4,075 4,660 5,629 6,571 7,790 10,165 13,339 17,117 21,064 23,685 26,119 29,141 31,319 36,123

15 4,601 5,229 6,262 7,261 8,547 11,036 14,339 18,245 22,307 24,996 27,488 30,578 32,801 37,697

16 5,142 5,812 6,908 7,962 9,312 11,912 15,338 19,369 23,542 26,296 28,845 32,000 34,267 39,252

17 5,697 6,408 7,564 8,672 10,085 12,792 16,338 20,489 24,769 27,587 30,191 33,409 35,718 40,790

18 6,265 7,015 8,231 9,390 10,865 13,675 17,338 21,605 25,989 28,869 31,526 34,805 37,156 43,312

19 6,844 7,633 8,907 10,117 11,651 14,562 18,338 22,718 27,204 30,144 32,852 36,191 38,582 43,820

20 7,434 8,260 9,591 10,851 12,443 15,452 19,337 23,828 28,412 31,410 34,170 37,566 39,997 45,315

21 8,034 8,897 10,283 11,591 13,240 16,344 20,337 24,935 29,615 32,671 35,479 38,932 41,401 46,797

22 8,643 9,542 10,982 12,338 14,042 17,240 21,337 26,039 30,813 33,924 36,781 40,289 42,796 48,268

23 9,260 10,196 11,689 13,091 14,848 18,137 22,337 27,141 32,007 35,172 38,076 41,638 44,181 49,728

24 9,886 10,856 12,401 13,848 15,659 19,037 22,337 28,241 33,196 36,415 39,364 42,980 45,559 51,179

25 10,520 11,524 13,120 14,611 16,473 19,939 24,337 29,339 34,382 37,652 40,646 44,314 46,928 52,620
302 P(Z<z) (área à esquerda do valor de Z indicado)

26 11,160 12,198 13,844 15,379 17,292 20,843 25,336 30,434 35,563 38,885 41,923 45,642 48,290 54,052

27 11,808 12,879 14,573 16,151 18,114 21,749 26,336 31,528 36,741 40,113 43,194 46,963 49,645 55,476

28 12,461 13,565 15,308 16,928 18,939 22,657 27,336 32,620 37,916 41,337 44,461 48,278 50,993 56,892

29 13,121 14,257 16,047 17,708 19,768 23,567 28,336 33,711 39,087 42,557 45,722 49,588 52,336 58,302

30 13,787 14,954 16,791 18,493 20,599 24,478 29,336 34,800 40,256 43,773 46,979 50,892 53,672 59,703

31 14,458 15,655 17,539 19,281 21,434 25,390 30,336 35,887 41,422 44,985 48,232 52,191 55,003 61,098

32 15,134 16,362 18,291 20,072 22,271 26,304 31,336 36,973 42,585 46,194 49,480 53,486 56,328 62,487

33 15,815 17,074 19,047 20,867 23,110 27,219 32,336 38,058 43,745 47,400 50,725 54,776 57,648 63,870

34 16,501 17,789 19,806 21,664 23,952 28,136 33,336 39,141 44,903 48,602 51,966 56,061 58,964 65,247

35 17,192 18,509 20,569 22,465 24,797 29,054 34,336 40,223 46,059 49,802 53,203 57,342 60,275 66,619

36 17,887 19,233 21,336 23,269 25,643 29,973 35,336 41,304 47,212 50,998 54,437 58,619 61,581 67,985

37 18,586 19,960 22,106 24,075 26,492 30,893 36,336 42,383 48,363 52,192 55,668 59,892 62,883 69,346

38 19,289 20,691 22,878 24,884 27,343 31,815 37,335 43,462 49,513 53,384 56,896 61,162 64,181 70,701

39 19,996 21,426 23,654 25,695 28,196 32,737 38,335 44,539 50,660 54,572 58,120 62,428 65,476 72,055

40 20,707 22,164 24,433 26,509 29,051 33,660 39,335 45,616 51,805 55,758 59,342 63,691 66,766 73,402

41 21,421 22,906 25,215 27,326 29,907 34,585 40,335 46,692 52,949 56,942 60,561 64,950 68,053 74,745

42 22,138 23,650 25,999 28,144 30,765 35,510 41,335 47,766 54,090 58,124 61,777 66,206 69,336 76,084

43 22,859 24,398 26,785 28,965 31,625 36,436 42,335 48,840 55,230 59,304 62,990 67,459 70,616 77,419

44 23,584 25,148 27,575 29,787 32,487 37,363 43,335 49,913 56,369 60,481 64,201 68,710 71,893 78,750

45 24,311 25,901 28,366 30,612 33,350 38,291 44,335 50,985 57,505 61,656 65,410 69,957 73,166 80,077

50 27,991 29,707 32,357 34,764 37,689 42,942 49,335 56,334 63,167 67,505 71,420 76,154 79,490 86,661

60 35,534 37,485 40,482 43,188 46,459 52,294 59,335 66,981 74,397 79,082 83,298 88,379 91,952 99,607

70 43,275 45,442 48,758 51,739 55,329 61,698 69,335 77,577 85,527 90,531 95,023 100,425 104,215 112,317

80 51,172 53,540 57,153 60,391 64,278 71,145 79,335 88,130 96,578 101,879 106,629 112,329 116,321 124,839

90 59,196 61,754 65,647 69,126 73,291 80,625 89,335 98,650 107,565 113,145 118,136 124,116 128,299 137,208

100 67,328 70,065 74,222 77,929 82,358 90,133 99,335 109,141 118,498 124,342 129,561 135,807 140,169 149,449
Introdução à Estatística Ensino à Distância 303

Bibliografia

− ANDERSON, D. R; Estatística aplicada à Administração e


economia; São Paulo Thomson leaning; 2003

Leitura − CORREIRA, Adelaide Et al. Cálculo da probabilidade. Bobadela.


Editora Instituto Piaget, 2002.

− GUIMARÃES E CABRAL. Estatística. Amadora. Mc graw Hill,


1997.

− HOGG e TANIS. Probability and Statical Inference. New Jersey.


Prantice Hall, 2001

− LEVIN, Jack at al; Estatística para ciências Humanas, São Paulo 9ª


edição, Editora Pearson, , 2004.

− MEYER, Paul L. Probabilidade, Aplicações à Estatística. Rio de


Janeiro .Livros técnicos e científicos, 2ª edição., 1983.

− MURTEIRA, B, et al, Introdução à Estatística. Portugal. Mc Graw-


Hill, 2002

− NEVES, Maria Augusta at al; Matemática aplicada às ciências


sociais. Porto. Porto editora, 2005.

− OLIVEIRA, Cristina. Introdução à Análise combinatória. Lisboa.


Escolar editora, 2004.

− TRIOLA, Mário F. Introdução à Estatística.Rio de Janeiro. Livros


técnicos e científicos. 7ª edição, 1999.

− WACKERLY; Mendenhall III e SCHEAFFER. Mathematical


Statistics with Applications. Duxbury. Thomson Lerarning, Sixth
edition,, 2002.

Você também pode gostar