Guia Estatística Aplicada A Ciencias Sociais VFF

Universidade Politécnica
A POLITÉCNICA
Escola Superior Aberta
GUIA DE ESTUDO
ESTATÍSTICA APLICADA AS
CIENCIAS SOCIAIS
Curso de Ciências da Educação
(3º Semestre)
- Moçambique -
FICHA TÉCNICA
1
FICHA TÉCNICA
Maputo, Julho de 2010
© Série de Guias de Estudo para o Curso de Ciências da Educação

(Ensino a Distância).
Todos os direitos reservados à Universidade Politécnica
Título: Guia de Estudo de Estaística Aplicada a Ciências Sociais
Edição: 1ª
Organização e Edição
Escola Superior Aberta (ESA)
Elaboração
Sansão Pedro (Conteúdo)
Benedito Marime (revisão textual)
2
ÍNDICE
Apresentação do Manual……………………………………………………………………….1
Orientações Importantes……………………………………………………………………….2
Introdução……. ………………………………...……………………………………………….3
Objectivos da disciplina……………………………………………………………...…………4
Plano Temático………………………………………………………………………………….5
PARTE I – ESTATÍSTICA DESCRITIVA
UNIDADE TEMÁTICA I – ESTATÍSTICA DESCRITIVA…………………. …...…………. 6
LIÇÃO Nº 1 - CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA DESCRITIVA…. ……7
LIÇÃO N° 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS…... …...…………………………….20
LIÇÃO N° 3 - MEDIDAS DE TENDÊNCIA CENTRAL E DE POSIÇÃO…. ……. ……...30
LIÇÃO N° 4 - MEDIDAS DE DISPERSÃO…. ………...………….…………………….….40
PARTE II - INFERÊNCIA ESTATÍSTICA………………………………………. ……..…. 47
UNIDADE TEMÁTICA II - TEORIA ELEMENTAR DAS PROBABILIDADES…………..48

LIÇÃO N° 5 – PROBABILIDADES……...………………………………………………….. 50
LIÇÃO N° 6 - ANÁLISE COMBINATÓRIA.……………………………………………..…..57
LIÇÃO N° 7 - CONSIDERAÇÕES SOBRE LEIS, AXIOMAS E TEOREMAS…………..62
UNIDADE TEMÁTICA III - VARIÁVEIS ALEATÓRIAS…………….……………………..69
Lição Nº 8 - VARIÁVEIS ALEATÓRIAS DISCRETAS……………………………….…….70
LIÇÃO N° 9 - Características Numéricas das Variáveis Aleatórias Discretas…………..77
LIÇÃO N° 10 - VARIÁVEIS ALEATÓRIAS CONTÍNUAS ……………………..………….81

LIÇÃO N° 11 - CARACTERÍSTICAS NUMÉRICAS DAS VARIÁVEIS ALEATÓRIAS
CONTÍNUAS…………………………………………………………………………………...88
UNIDADE TEMÁTICA IV - DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS.…...……92
LIÇÃO N° 12 - DISTRIBUIÇÃO DE VARIÁVEIS ALEATÓRIAS DISCRETAS………….93
LIÇÃO N° 13 - DISTRIBUIÇAO DE VARIAVEIS ALEATORIAS CONTÍNUAS………..100
3
LIÇÃO N° 14 - Função de distribuição acumulada das probabilidades…….………….108
UNIDADE TEMÁTICA V - TEORIA ELEMENTAR DE AMOSTRAGEM….……...……116

LIÇÃO N° 15 - Introdução a Teoria Elementar de Amostragem……….……………….117
LIÇÃO N° 16 - Métodos de Amostragem………………………………….………………121
LIÇÃO N° 17 - Determinação do tamanho de uma amostra………………..…………..129
LIÇÃO N° 18 - Distribuições Amostrais………………………………………...………….135
UNIDADE TEMÁTICA VI - TEORIA ESTATÍSTICA DE ESTIMAÇÃO…….…………..141

LIÇÃO N° 19 - PARÂMETROS, ESTIMADORES E ESTIMATIVAS …………………..143
LIÇÃO N° 20 - ESTIMATIVAS DE PARÂMETROS……………………..……………….148
UNIDADE TEMÁTICA VII - TESTE DE HIPÓTESES….……………….……...………..157

LIÇÃO N° 21 - Introdução a Teste de Hipóteses………………………..………………..159
LIÇÃO N° 22 - Teste de Médias………………………………………………..…………..165
LIÇÃO N° 23 - Teste para Proporção………………………………………...……………178
LIÇÃO N° 24 - Teste para Variância……………………………………………………….184
LIÇÃO N° 25 - TESTES DE HIPÓTESE PARA DUAS AMOSTRAS…..………………186
TABELAS ESTATÍSTICAS………………………………………………………………….191
BIBLIOGRAFIA……………………………………………………………………………... 201
4
Apresentação do Manual
Prezado(a) estudante!
É com muito prazer que te apresentamos a presente obra científica – o Manual de

Estatística Aplicada a Ciências de Educação, apresentado na modalidade EAD
(Educação à Distância).
O presente manual, que tem por objectivo orientar os teus estudos individuais na área
de estatística, está organizado em 7 unidades (cujos temas se encontram no plano
temático adiante) agrupados em duas partes: uma de Estatística Descritiva e outra de
Inferência Estatística. Por sua vez, as unidades estão divididas em lições. Cada lição,
além de apresentar a parte teórica comporta uma parte prática, constituída por
exemplos agrupados em unidades, isto é, o exemplo 1.1 é o 1º exemplo da unidade 1.
A organização do manual por pontos, por exemplo, o ponto 1.1 traduz a 1ª lição dentro
da unidade 1, e, se for 1.1.1 indica o tópico 1 da lição 1 da unidade 1.
No início de cada unidade e lição apresentamos os respectivos que deves tê-los em

conta ao longo dos teus estudos. Ao longo das lições existem informações (resumos)
tão importantes que foram colocadas (os) em quadros pintados com palavras, que
chamam tua atenção, como: aprofundando, note que, repare que, etc. Esta(es)
informações (resumos) são indispensáveis para consolidares os conteúdos que vais
estudando.
Por fim, o manual é acompanhado por um caderno de exercícios, dividido em duas

partes: uma de exercícios resolvidos (os quais deves estudá-los com muita atenção
para a experiência te ajudar a resolver os não resolvidos) e a outra de exercícios não
resolvidos, os quais devem ser por ti resolvidos depois de perceberes o método de
resolução nas partes práticas de cada lição.
O oitavo objectivo desta disciplina diz respeito ao processamento e análise de dados

estatísticos utilizando alguns pacotes informáticos de estatística como o programa
Microsoft Excel e o SPSS. Para o prezado aluno adiquirir conhecimentos na utilização
desses pacotes lhe recomendamos a seguir as instruções descritas no livro do Allen
Webster (2006), para o caso de Excel, enquanto que, para o caso de SPSS lhe
recomendamos a usar o manual de utilização SPSS de Armando Mateus Ferreira, que
lhe será fornecido pela ESA.
O autor
5
Orientações Importantes
Este é um manual auto-instrutivo, pelo que:
Procure sempre relacionar a teoria com a prática, reflectindo sobre como os

conhecimentos teóricos são aplicados na resolução de exercícios tomados como
exemplos, e a partir dessa experiência resolver as questões apresentadas no
caderno de exercícios.
Procure sempre entender antes de mais a parte teórica de cada lição.
Faça planos para estudar e não se esqueça de fazer notas das partes que
achares importantes e com necessidade de revê-las para entendê-las.
Não deixe de fazer as leituras obrigatórias e complementares.
Os objectivos apresentados em cada unidade e lição são uma forma resumida

para orientar os teus estudos, por isso, não deves ignorá-los mas também podes
acrescentar acima destes outros pessoais.
Procure sempre, ao fim de cada unidade e lição, relacionar o que reteste com os
referidos objectivos para controlares a concretização dos mesmos.
6
Introdução
Quando se pretende tomar decisões ou efectuar estudos de natureza científica, torna-

se necessário, antes de mais, se efectuar uma busca de dados previamente
identificados. São estes dados que, acumulados de forma organizada, serão estudados
cuidadosamente para se extrair as informações relevantes a investigação, que se
pretende fazer. Para tal, o uso da estatística ou de métodos estatísticos é
indispensável.
A utilização da Estatística é cada vez mais importante em qualquer actividade

profissional, isto é, em todas áreas da actividade sócio económica da vida moderna.
Isto, se deve às múltiplas aplicações que o método estatístico proporciona aqueles que
dele necessitam. O reconhecimento desta utilização se tem traduzido na sua inclusão
em cursos do ensino superior, quer como curso autónomo, quer como tópico ou
disciplina integrada noutras disciplinas.
A disciplina de Estatística aplicada a ciências sociais no curso de licenciatura em

Ciências de Educação, pretende criar competências nos futuros profissionais nesta
área do conhecimento, no tratamento de dados estatísticos como resultado de estudos
e investigações conduzidas para responder a questões práticas e para ajudar na
tomada de decisões em pesquisas sociais e projectos sociais.
Abordaremos os tópicos mais importantes da Estatística Descritiva e Inferencial. A

matéria a ser ministrada é suficientemente ampla e esclarecedora para garantir que no
final desta disciplina tenhas o conhecimento suficiente para aplicação de estatística em
ciências sociais.
7
MANUAL DE ESTATÍSTICA APLICADA A
CIÊNCIAS SOCIAIS
Objectivos da Disciplina
Ao terminares esta cadeira, deves ser capaz de:

1. Dominar o conceito de Estatística e outras
terminologias usuais da cadeira;
2. Conhecer o objecto de estudo da Estatística
como também compreender as suas diferentes áreas de aplicação;
3. Conhecer os principais conceitos inerentes à
estatística descritiva e inferencial, e saber aplicar os seus princípios e
procedimentos;
4. Analisar e interpretar dados estatísticos através
de gráficos e tabelas;
5. Tratar dados estatísticos para efeitos de
generalização dos resultados, aplicando os conceitos e princípios da estatística
inferencial;
6. Formular e resolver problemas básicos de inferência estatística;
7. Conhecer os métodos mais importantes para estimação de parâmetros e

testes de hipóteses;
8. Processar e analisar dados estatísticos

utilizando alguns pacotes informáticos estatísticos como o programa Microsoft
Excel e o SPSS;
8
PLANO TEMÁTICO
N° da Horas por
Unidade Unidades Temáticas Unidade
1 Estatística Descritiva 15
2 Teoria Elementar das Probabilidades 10
3 Variáveis Aleatórias 10
4 Distribuições de Variáveis Aleatórias 10
5 Teoria Elementar de Amostragem 10
6 Teoria Estatística de Estimação 15
7 Teste de Hipóteses 15
9
PARTE I - ESTATÍSTICA DESCRITIVA
UNIDADE TEMÁTICA I
Objectivos da Unidade
No fim desta unidade, deves ser capaz de:
1. Identificar o objecto da Estatística Descritiva e justificar a sua importância no dia-

a-dia da sociedade moderna;
2. Conhecer os principais conceitos inerentes à estatística descritiva e saber

aplicar os seus princípios e procedimentos;
3. Analisar e Interpretar dados estatísticos com recurso a gráficos e tabelas;
4. Tratar dados estatísticos para efeitos de generalização dos resultados;
10
LIÇÃO N° 1
CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA DESCRITIVA
Objectivos da Lição
No fim desta lição, deves ser capaz de:
1. Entender o conceito de estatística, e identificar o objecto de estudo da estatística

descritiva;
2. Distinguir estatística descritiva da indutiva;
3. Conhecer e saber diferenciar o conceito de fenómeno estatístico do da
observação estatística;
4. Saber diferenciar o conceito de informação do conceito de dado;
5. Distinguir dado qualitativo de quantitativo;
6. Definir População e Amostra;
7. Diferenciar amostra de população;
8. Definir variável e distinguir variável qualitativa de quantitativa;
9. Conhecer as escalas usadas para medir atributos;
11
1.1.1 Breves Conceitos Fundamentais
a) Conceito de Estatística e sua divisão
Mas o que será que significa a

Estatística? O que realmente estuda?
Estatística
A Estatística é uma ciência ou ramo da Matemática Aplicada que fornece métodos para
a recolha, organização, descrição, análise e interpretação de dados, cujo fim é a
utilização dos mesmos na tomada de decisões.
A estatística geralmente é divida em duas partes: Descritiva e Inferencial (Indutiva).
Descritiva – é o ramo da estatística cujo objectivo (objecto da estatística descritiva)

é observar fenómenos de mesma natureza, colectar, organizar, classificar, analisar e
interpretar os dados. Também é responsável pelo cálculo de medidas (estatísticas),
que permitem, resumidamente, descrever o fenómeno em estudo.
Inferencial ou Indutiva – é o ramo ou parte da estatística que trata das condições de
generalização das conclusões tiradas, a partir de observações de uma parte das
unidades (amostra). A referida generalização das conclusões é feita de uma amostra
para a população em estudo.
Lembre-se…
A Estatística Descriva têm como objectivo observar fenómenos de mesma

natureza, colectar, organizar, classificar, analisar e interpretar os dados, como
também, calcular as medidas que permitem, resumidamente, descrever o
fenómeno em estudo.
12
b) Fenómeno Estatístico
É qualquer evento que se pode analisar aplicando técnicas estatísticas. Os fenómenos
estatísticos podem ser colectivos ou de massa, por exemplo, a evolução das
exportações em 30%, e individuais, que por sua vez classificam-se em típicos
(regulares) e atípicos (irregulares).
c) Observação Estatística
É um processo sistemático, cientificamente, argumentado de dados em massa que
possuem uma característica comum em relação ao objecto de estudo.
d) Dado
Em pesquisas, é comum ouvir:
“Vamos recolher 1º os dados.”
Mas afinal, o que é dado?
Para entendermos o conceito de dado vamos ver duas definições do termo:

Definição 1: Dado é a unidade básica (mínima) da informação, isto é, cada elemento
ou unidade estatística que constitui a população observada.
Exemplo 1.1: Matrícula de um carro envolvido num acidente.
Definição 2: Dado é o que se recolhe e se prepara para produzir certa informação.
Exemplo 1.2: Idades dos participantes de um inquérito.
Dado
Dado Qualitativo Dado Quantitativo
Aquele que identifica uma Aquele que identifica uma

qualidade, categoria quantidade, categoria ou
ou característica, ou seja, aquele característica, ou seja, aquele
que não se pode medir ou contar. que se pode medir ou contar.
Mas se pode classificar, Serve para medir ou contar as
assumindo várias categorias. categorias de um dado
qualitativo.
13
Exemplo 1.1:
p.ex. 1: O estado civil de um p.ex 1: O número de solteiros em 5

indivíduo, assume as categorias: bairros de Maputo: 3000; 4500;
solteiro(a), casado(a), viúvo(a) e 2300; 5600; 8790.
divorciado(a). p.ex 2: A massa de 5 sacos de
p.ex. 2: A cor do cabelo de um cebola no Mercado do Zimpeto: 10
indivíduo, assume as categorias: Kg; 12,5 Kg; 9Kg; 11Kg; 13Kg.
preto, castanho, loiro, amarelo, etc. p.ex 3: As temperaturas máximas
p.ex. 3: O sexo de um indivíduo, previstas para Maputo durante 5
assume as categorias: masculino e dias: 30, 25, 33, 28, 35.
feminino.
e) Informação
É o produto final do processamento de dados.
Exemplo 1.2: Notas de frequência de estudantes de uma determinada disciplina.
Dado, informação… mas qual é a diferença?...
Para responder a essa pergunta, basta ver os exemplos de cada conceito. Para
obtermos um dado não precisamos de processá-lo, como por exemplo, não precisamos
de processar a matrícula de um carro envolvido num acidente e as idades dos
participantes de um inquérito. Mas ao contrário da informação, para a sua obtenção,
precisamos de processá-la, isto é, processar um conjunto de dados, como por
exemplo, processar notas (dados) de 2 testes para obter as notas de frequência
(informação) de estudantes de uma cadeira.
14
Aprofundando…
No estudo de um problema, envolvendo métodos estatísticos, estes devem

ser escolhidos antes de se recolher a amostra, isto é, deve-se planear a
experiência que nos vai permitir recolher os dados, de modo que,
posteriormente, se possa extrair o máximo de informação relevante para o
problema em estudo, ou seja para a população de onde os dados provêm.
Exemplo 1.3: Imagine que pretendemos estudar o sucesso escolar dos

alunos da 10ª classe da Escola Secundária Francisco Manyanga na
disciplina de Matemática, será natural irmos consultar as pautas desses
alunos no final do ano. A partir daí poderá facilmente ser obtida a
percentagem de aprovações.
Se no entanto, pretendermos aprofundar um pouco mais este assunto,

nomeadamente, saber se o sucesso é igual para rapazes e raparigas, ou
nos diferentes agrupamentos disciplinares, dever-se-á recolher além da
informação respeitante ao aluno ter aprovado ou não, a informação sobre o
sexo e o agrupamento disciplinar. Uma vez os dados recolhidos, sob a
forma de uma amostra faz-se a redução e representação desses dados,
utilizando tabelas e diferentes tipos de gráficos.
Tabela 1.1
Agrup. disciplinar Nota Sexo
1 12 F
2 13 M
…. … …
f) Variável
É o símbolo que representa determinada característica de uma população ou de uma
amostra extraída dessa população. A notação utilizada para uma variável corresponde
às letras enquanto que valores constantes são geralmente representaados por
as primeiras letras do alfabeto: . A variável pode ser qualitativa ou quantitativa.
15
Aprofundando…
Quando as características de uma variável não podem ser medidas, ou seja, não
podem ser expressas através de números, diz-se que a variável é qualitativa. Se, pelo
contrário, as suas características são mensuráveis, então, trata-se de uma variável
quantitativa.
Uma vez que a variável quantitativa define uma característica que pode ser expressa
em números, ela pode também ser discreta ou contínua.
Chama-se de discreta, a qualquer variável cujo domínio é enumerável, isto é, quando
toma valores (numéricos) distintos (finitos). Por exemplo: X={x1,x2,…xn}. Quando a
variável assume qualquer valor dentro de um certo intervalo finito ou infinito. Ou dado
um intervalo [a, b] com , existe um valor x tal que e , i.é, ,
então, diz-se que ela é variável contínua.
===============================================
Variável
===============================================
g) População
Entende-se por População ou Universo, o conjunto de indivíduos, que podem ser
pessoas, animais, objectos ou resultados experimentais, com pelo menos uma
característica comum, que se pretende estudar. A população pode ser finita ou infinita,
consoante seja finito ou não o numero de elementos considerados na observação.
Exemplo 1.4: A população de ratos magros de uma determinada zona; A população de
bicicletas estragadas na Cidade de Chimoio. A população de moradores do Edifício “33
Andares” em Maputo, sobre a qual estamos interessados em estudar as seguintes
características populacionais: (1) Altura dos moradores; (2) Idades dos moradores.
Depois de medir a altura de cada morador e saber a idade, obtemos o seguinte um
conjunto de dados:
Saiba mais:
Quando é possível pesquisar toda a população, estamos perante um censo. 16
Ex: Censo Geral da População 2007.

Tabela 1.2: Altura e Idade dos moradores do “33 andares”.
Nome Altura (m) Idade (Anos)
Fátima Mediana 1.65 23
Ivone Média 1.73 45
Carlos Frequência 1.86 28
Cefas Variável 1.55 33
Pet Descritiva 1.9 26
Pianga Amostra 1.8 38
Rosa Aritmética 1.75 51
… … …
Exemplo 1.5: Se pretendemos saber o número de eleitores que podem votar nas
próximas eleições municipais de Maputo, a população em estudo é “Potenciais
eleitores na cidade de Maputo”.
Exemplo 1.6: Se pretendemos saber o número médio de aprovações em Estatística,
dos estudantes nas instituições do ensino superior em Moçambique após a
independência, a população em estudo será “Os aprovados a Estatística desde a
independência até à agora”.
Porquê, nem sempre é possível

estudar exaustivamente todos os
elementos da população?
As vezes, não é possível estudar todos os elementos da população, pelas seguintes

razões:
 Urgência no apuramento dos resultados – o tempo necessário para estudar
todos os elementos de uma população pode ser bastante elevado; Por exemplo:
“Estudo da tendência de voto numa data pré-eleitoral”.
17
 Dificuldades económicas – estudar a toda população pode ser muito
dispendioso; Por exemplo: Estudar os sintomas que apresenta cada doente de
TB;
 Dimensão infinita da população – Por exemplo: População constituída pelas
estrelas do Céu.
 Processo destrutivo - O estudo da população pode provocar a destruição da
mesma; Por exemplo: Pretendendo ter a certeza sobre qual o palito que não
acende, estudar a população dos fósforos de uma caixa.
 Precisa-se de maior precisão – nalguns casos é mais difícil estudar uma
população por esta não ser precisa;
 Problemas de acesso – pode não existir vias de acesso para chegar à
população;
 Instabilidade política – casos de guerra ou tumultos;
 Problemas demográficos – quando a população está mais geograficamente
dispersa, etc.
h) Amostra
Se não é possível ou para se evitar estudar toda a população ou todos os seus
elementos, seleccionam-se só alguns deles, para servirem de amostra da população
em estudo. Para melhor entender a origem da amostra, leia o cenário abaixo:
Num Restaurante dois amigos conversam
- Mas que matapa saborosa estou a comer!
- Não estarás a tirar conclusões precipitadas? Ainda só comeste um bocadinho!
- A amostra que comi já é suficiente...
- Talvez tenhas razão, já que não é necessário comer matapa de todas folhas da
mandioqueira para concluir que ela é boa.
Amostra - é um conjunto de observações ou dados extraídos a partir de um
subconjunto ou parte da população, que se estuda com o objectivo de tirar conclusões
sobre toda população em estudo.
Exemplo 1.7: Relativamente à população das alturas dos alunos da 8ª Classe
matriculados na Escola Secundária de Jécua, na província de Manica, consideremos a
18
seguinte amostra, constituída pelas alturas (em cm) de 20 alunos escolhidos ao acaso
ou aleatoriamente:
145, 163, 157, 152, 156, 149, 160, 157, 148, 147, 151, 152, 150, 148, 156, 160, 148,
157, 153, 162.
Aprofundando…
Usa-se população quando é impossível conhecer as características de
todos os elementos da população. Por isso, torna-se necessário extrair uma
amostra ou parte dessa população, sobre a qual serão estudadas as
características. Para extrair a amostra e assegurar a sua representatividade
relativamente à população de onde foi extraída, existem métodos
estatísticos que constituem o objecto de estudo da teoria de amostragem.
Atenção!!!
Quando a amostra não representa, correctamente, a população, diz-se viciada. E a sua
utilização pode dar origem a interpretações e conclusões erradas.
A escolha de métodos apropriados de extracção da amostra assegura a possibilidade de se
tirarem conclusões sobre a população a partir da informação extraída da amostra. Este
constitui o objecto de estudo da inferência estatística.
19
1.1.2 Características da informação estatística
A informação estatística é um instrumento ao serviço do desenvolvimento de uma

realidade. É um meio e não um fim, porque ela está ao serviço dos utilizadores de
dados estatísticos, que podem ser governantes, gestores, homens de negócios,
sociólogos, investigadores, etc.
Pela sua natureza, a informação estatística obedece as seguintes características:

qualidade, actualidade e utilidade.
Qualidade - os dados estatísticos devem traduzir uma realidade de forma simples e

clara. O controlo de qualidade dos dados é uma tarefa indispensável para sua
fiabilidade, isto é, a informação estatística deve ser completa pois não faz sentido
nenhum preparar e divulgar dados baseados em apuramentos parciais.
Actualidade – a informação deve estar disponível de forma atempada a pessoas que

precisam utilizá-la no momento necessário. Isto implica um esforço de actualidade na
obtenção dos dados, preparação e divulgação dos resultados.
Utilidade – a informação estatística serve de um meio para o desenvolvimento das

sociedades, é, praticamente, um instrumento de tomada de decisões. É por isso que
ela deve ser compreendida pelos utilizadores, o que significa que ela deve ser
acompanhada de todos os aspectos metodológicos mais relevantes: gráficos, tabelas,
notas explicativas, etc., para permitir que o seu verdadeiro conteúdo e significado
sejam percebidos.
O conjunto das etapas para se preparar uma informação estatística é desde a recolha,
produção e divulgação dos dados ou resultados e sua posterior utilização. Estas etapas
constituem o circuito da informação estatística. Os principais intervenientes no circuito
da informação estatística são os utilizadores, fornecedores e os produtores de dados
estatísticos.
Utilizadores – Os governantes, homens de negócios, economistas e técnicos em
geral, têm a tarefa de seleccionar e analisar a informação de que necessitam para os
seus trabalhos. Cabe aos utilizadores, criticar e colocar opiniões aos produtores e
fornecedores de forma a melhorar a informação estatística.
Fornecedores – prestam informações de base, facultando aos produtores, dados que
lhes são solicitados pelos utilizadores.
20
Produtores – são entidades especializadas, que têm por objectivo a obtenção e
preparação da informação necessária ao conhecimento da realidade nos seus vários
domínios.
1.1.3 Técnicas elementares do método estatístico

Constituem técnicas do método estatístico, os procedimentos utilizados na estatística
descritiva para a descrição de dados, passando pela organização de tabelas,
construção de gráficos e cálculo de medidas estatísticas, que podem ajudar na análise
e interpretação de dados sem recorrer muitas vezes a juízos probabilísticos, isto é, à
inferência estatística.
Entre muitas fases do método estatístico destacam-se 6 principais:
1. Definição do problema – definição dos objectivos;
2. Planeamento – definição dos procedimentos básicos;
3. Recolha de dados – fase operacional;
4. Apuramento dos dados – cálculos, tabelas e gráficos;
5. Apresentação – exposição dos resultados obtidos;
6. Análise e interpretação – discussão e indicação das conclusões;
Estas fases, dependendo do nível de abordagem do método, podem ser reduzidas ou
aumentadas e/ou tomar designações diferentes.
1.1.4 Caracteres e modalidades das variáveis estatísticas
A estatística estuda fenómenos, a que chamamos por caracteres ou atributos

estatísticos. Para descrever, uma população, é necessário que as unidades estatísticas
sejam classificadas em subconjuntos adequados de acordo com os caracteres ou
atributos mais relevantes. Por sua vez estes caracteres podem ser qualitativos ou
quantitativos.
Chama-se modalidade de um atributo, as diferentes variações ou valores que este
atributo pode assumir.
Um caractere é qualitativo, quando as modalidades não são numéricas ou não são
mensuráveis, mas podem ser apenas constatadas; e será quantitativo quando ele for
mensurável. De um modo geral, os atributos observados quando são qualitativos
21
revestem-se de várias modalidades, e quando são quantitativos apresentam uma
modalidade com diferentes intensidades ou valores. Os atributos de uma população
podem ainda ser classificaos como dicotómicos quando tomam apenas dois valores
possíveis. Por exemplo, o sexo a que um grupo de inquiridos pertence é uma
característica dicotómica uma vez que só pode ter os valores masculino e feminino. Do
mesmo modo também uma pergunta sobre se os inquiridos conhecem ou não
determinado produto constitui uma variável dicotómica.
Exemplo 1.8: Vejamos um exemplo onde se apresentam diferentes atributos
associados a um determinado universo.
Tabela 1.3: Caracteres associados aos seus universos:
Universo Caractere/atributo
População de pessoas Sexo, idade, local de nascimento, grau académico, estado

civil, local de trabalho, etc.
Economia de um país Produto interno bruto, consumo público e privado, situação

monetária, etc.
Actividades de uma Volume de produções, volume de venda, receitas, despesas,

empresa lucros, investimentos, etc.
1.1.5 Escalas usadas para medir os atributos
Conforme a natureza dos atributos, existem quatro escalas principais usadas para
medi-los:
1) Escalas Nominais – são aquelas que separam os atributos em categorias

diferentes, ou que não são ordenados em termos de hierarquia. Na utilização
destas escalas, é preciso que se obedeçam três condições:
a) a divisão deve ser coerente de acordo com um único critério.
b) a divisão deve ser completa.
c) as categorias que participam na divisão devem ser mutuamente exclusivas.
2) Escalas Ordinais – baseiam-se numa classificação hierárquica. Através desta
escala, os atributos são colocados em determinada ordem conforme um critério
escolhido.
3) Escalas de Intervalo – estas escalas para além de distinguirem categorias e
ordenação, colocam as categorias a distâncias iguais. Uma propriedade
22
importante dessas escalas, é a possibilidade de serem submetidas às quatro
operações aritméticas (adição, subtracção, multiplicação e divisão).
4) Escalas de Razão – são um caso especial das escalas ordinais, as quais são
também nominais hierárquicas. Assim a escala de razão é também uma escala
de intervalo dotada de zero absoluto.
1.1.6 Gráficos e sua aplicação na estatística
Um gráfico é qualquer representação geométrica de um fenómeno. É um desenho no

plano ou espaço descrevendo a relação entre conjuntos de números ou quantidades de
objectos por um conjunto de pontos, linhas, áreas, etc.
23
LIÇÃO N°2
DISTRIBUIÇÃO DE FREQUÊNCIAS
1. Criar tabelas com base na definição de variáveis;

2. Definir frequência relativa e absoluta;
3. Definir frequências acumuladas;
4. Distinguir uma frequência de outra;
5. Utilizar tabelas e gráficos para representar informação estatística;
6. Diferenciar gráficos;
7. Aplicar gráficos em situações concretas;
24
1.2.1 Introdução à lição n° 2
A análise estatística começa quando um conjunto de dados torna-se disponível de

acordo com a definição do problema da pesquisa. Um conjunto de dados, seja de uma
população ou de uma amostra, contém muitas vezes um número muito grande de
valores. Além disso, esses valores, na sua forma bruta, encontram-se muito
desorganizados. Eles variam de um valor para outro sem qualquer ordem ou padrão,
por isso, os dados precisam de ser organizados e apresentados de forma sistemática e
sequencial, por meio de uma tabela ou gráfico. Quando fazemos isso, as propriedades
dos dados tornam-se mais aparentes e tornamo-nos capazes de determinar os
métodos estatísticos mais apropriados para serem aplicados no seu estudo.
25
1.2.2 Breves conceitos básicos
Dados brutos – são os dados originais que ainda não foram numericamente
organizados.
Rol estatístico ou simplesmente rol – é uma lista em que os valores ou dados

numéricos são dispostos em uma determinada ordem, crescente ou decrescente.
Amplitude total ou “Range” – é a diferença entre o maior valor e o menor da série

estatística, ou a diferença entre os extremos do rol.
Exemplo 1.19: Os dados a seguir correspondem ao consumo de energia de uma

determinada família, ilustrando as três definições anteriores.
a) Dados brutos: 58 62 80 57 28 96 19 90 86 38 50 41 90 55
b) Rol: (ordem crescente) 19 28 38 41 50 55 57 58 62 80 86 90 90 96
c)
Assim para os valores do consumo de energia, a amplitude total é de 77Kw/h.
Distribuição de frequências - Quando os dados brutos são organizados,

frequentemente, costuma-se distribuí-los em classes ou categorias, e determina-se em
seguida o número de casos ou indivíduos pertencentes a uma das classes,
denominado frequência de classe. Uma apresentação tabular de dados por classes
com as suas respectivas frequências é conhecida por distribuição de frequências.
Sejam dadas as seguintes distribuições de frequências:
Tabela 1.4: Distribuição de frequências de 10 trabalhadores segundo o seu salário na

Petromoc.
I Salário Frequência
1 2.500,00 2
2 3.000,00 4
3 3.460,00 3
4 4.000,00 1
Total n=10
26
Tabela 1.5: Distribuição de frequências das notas de 50 estudantes.
I Classes Frequências
1 00 – 04 2
2 04 – 08 7
3 08 – 12 10
4 12 – 16 14
5 16 – 20 12
6 20 – 24 4
7 24 – 28 1
Total - 50
Há dois tipos de distribuição de frequências, um com valores não classificados ou não

agrupados (tabela 1.3) e outro com valores classificados ou agrupados em classe
(tabela 1.4)
Saiba mais…
As distribuições de frequências não agrupadas são utilizadas quando temos poucos
dados e o número das modalidades apresenta repetições. Se o número de dados
observados for grande é conveniente agrupar os dados em classes.
Frequências absolutas, relativas e acumuladas
a) Frequência absoluta (fi) – é o número de repetições de um valor individual

ou de uma classe de valores da variável.
b) Frequência relativa (fr) – é a proporção de observações de um valor
individual ou de valores pertencentes a uma categoria em relação ao número
total de observações.
onde
c) Frequência absoluta acumulada (Fi) – é a soma da frequência absoluta
duma ordem ou classe posterior com a frequência absoluta anterior, partindo de
cima para baixo.
Procedimento
Na 1ª classe o valor da F mantém igual ao da f da 1ª classe, mas a partir da 2ª classe, vai se
acrescentando o valor da f dessa classe à F anterior, e assim sucessivamente.
27
d) Frequência relativa acumulada (Fr) – é a soma da frequência relativa duma
ordem ou classe posterior com a frequência relativa anterior, partindo de cima
para baixo.
Procedimento
O procedimento é quase o mesmo, só mudamos de coluna passando a trabalhar com as colunas
das frequências relativas.
Exemplo 1.20: Calcular as frequências relativas, suas frequências acumuladas

inerentes a notas de 50 alunos na disciplina de Matemática
Tabela 1.6: Tabela de frequências:
I xi fi fr fr% Fi Fr Fr%
1 2 3 0,12 12 3 0,12 12
2 6 4 0,16 16 3+4=7 0,12+0,16=0,28 12+16=28
3 10 10 0,40 40 7+10=17 0,28+0,40=0,68 28+40=68
4 14 6 0,24 24 17+6=23 0,68+0,24=0,92 68+24=92
5 18 2 0,08 8 23+2=25 0,92+0,8=1,00 92+8=100
Total 1,00 100
28
1.2.3 Distribuição de frequências para dados agrupados
Até agora vimos como são calculadas as frequências (absolutas, relativas e

acumuladas) para variáveis quantitativas discretas. Nesse caso a tabulação dos
resultados é mais simples. Se tratarmos de variáveis quantitativas contínuas, os
valores observados devem ser apresentados em tabelas, agrupados em classes.
Para determinar essas classes não existe uma regra pré-estabelecida, sendo
necessário um pouco de tentativa e controlo de erro para a solução mais adequada.
Nalguns casos pode-se determinar intervalos arbitrários, segundo o interesse do
Analista, mas na maior parte dos casos usam-se certos pressupostos como veremos
abaixo:
Consideremos a tabela seguinte, que representa as alturas de 50 indivíduos medidas

em .
Alturas de 50 indivíduos medidas em cm
162-168-173-168-179-183-167-186-177-187-174-164-177-159-177-173-163-
180-196-171-184-179-190-181-166-181-182-176-169-172-162-175-192-178-
177-200-191-188-168-165-193-175-160-180-187-176-170-156-174-179
Desta forma, atendendo que o número de observações é grande, vamos fazer um

agrupamento das unidades estatísticas em classes. A escolha do número de classes
varia consoante a conveniência e o número de casos observados.
Antes de apresentar a tabela da distribuição de frequência consideremos os conceitos

seguintes:
Limite de classe – são os valores externos de cada classe.
Intervalo ou amplitude de classe – é a diferença entre os limites superiores ou

inferiores das duas classes consecutivas.
Ponto médio de classe é o valor que representa a classe para efeitos de cálculo
Para a elaboração de uma tabela de frequência com dados agrupados é necessário no

mínimo seguir algumas regras. Os procedimentos mais comuns têm os passos
seguintes:
29
Passo 1. Construir o rol.
Passo 2. Determinar a amplitude total.
Passo 3. Determinar ou escolher o número de classes k. Métodos para escolha do k:
Método 1. Escolher arbitrariamente k entre 5 a 20.
Método 2. Calcular K pela fórmula de Sturges: . Onde representa

o número total de elementos em estudo.
Método 3. .
Passo 4. Determinar o intervalo de classe .
Passo 5. Determinar os limites superiores e inferiores das classes.
Exemplo 1.21: A partir dos dados da tabela 1.6, construir a tabela de distribuição de
frequências absolutas e determinar os pontos médios de classe.
Resolução:
Usando as regras anteriores temos:
O rol: 156; 159; … 200.
1. Do rol obtido, obtemos o seguinte extremos: e

2. Amplitude total:
3. Agora vamos aplicar o método 2: e depois
aplicando o método 3: o mesmo k pode ser calculado assim:
.
4. E por último vamos calcular a amplitude de classe .
Entendendo…
Caro aluno, como pode notar, para construirmos as classes da tabela abaixo, por
exemplo para a 1ª classe, usamos primeiro o menor elemento (156) como limite
inferior da classe e adicionamos a ele a amplitude de classe e obtemos assim
o limite superior (162) dessa mesma classe (156 – 162) . Na segunda classe o limite
superior da classe anterior torna-se inferior e nele adicionamos a amplitude da
classe e obtemos o limite superior da segunda classe. Assim o processo continua
até a ultima classe.
30
Tabela 1.7: Distribuição de frequências das alturas de 50 indivíduos.
i Classes (xi, cm) fi xi
1 [156,0 – 162,3[ 5 159,15
2 [162,3 – 168,6[ 7 165,45
3 [168,6 – 174,9[ 9 171,75
4 [174,9 – 181,2[ 15 178,5
5 [181,2 – 187,5[ 6 184,35
6 [187,5 – 193,8[ 6 190,65
7 [193,8 – 200,1[ 2 196,96
Total - -
31
1.2.4 Representação gráfica
Para representar uma informação resumida numa tabela de distribuição de frequências

de dados não agrupados (variável discreta), basta apresentar um diagrama de barras
para as frequências absolutas ou relativas e uma ogiva para as acumuladas.
Para dados agrupados, as diferentes formas de representação de distribuição de

frequências para dados não agrupados também podem ser feitas, neste caso, os
pontos médios de classe representarão os pontos individuais.
Histograma - é mais uma forma apropriada para representar dados agrupados. O

histograma é um diagrama de áreas, formado por rectângulos, de modo que a área de
cada um desses rectângulos seja proporcional à frequência dessa classe.
Histograma da distribuição de frequencias
10
8
Frequencias absolutas - fi
Mean = 176,54
Std. Dev. = 10,16238
0 N = 50
150,00 160,00 170,00 180,00 190,00 200,00
Alturas média - Xi
32
Diagrama de barras
15
12
Frequencias absolutas - fi
0
159,15 165,45 171,75 178,05 184,35 190,65 196,95
Pontos médios de classe - Xi
33
LIÇÃO N°3
MEDIDAS DE TENDÊNCIA CENTRAL E DE POSIÇÃO
1. Descrever principais medidas de Tendência Central;

2. Descrever principais medidas de Posição;
3. Distinguir medidas de Tendência Central e Posição;
4. Determinar as principais medidas;
5. Aplicar diferentes medidas na resolução de problemas de estatística;
34
1.3.1 Medidas de Tendência Central
O tratamento e interpretação de medidas de tendência central, torna-se difícil para

quem pretende colocar uma informação como um todo, razão pela qual costuma-se
calcular algumas medidas que, resumidamente, traduzem as características
importantes das distribuições de frequências.
As medidas de tendência central têm o papel de indicar onde se encontra a maioria dos
dados. Existem três grupos de medidas que resumem um conjunto de dados
observados: medidas de tendência central, medidas de posição e medidas de
dispersão.
Os índices de centro de distribuição ou medidas de tendência central (medidas de

localização), assim designados em virtude de tendência que todos os dados
observados tem em torno desses valores centrais. Este grupo inclui as grandezas:
média, moda e mediana.
1.3.1.1 Breves conceitos básicos
A média é uma grandeza ou valor representativo de um conjunto de dados, que indica

como eles tendem a se localizar em torno do ponto central. A média aritmética é a mais
usada pelos estatísticos, esta podendo ser simples ou ponderada. A média aritmética
referente a dados de uma amostra é denotada por ( ) e quando referente a dados de
toda população é denotada por ( ).
Média artimética simples: esta é definida como a soma de todos os dados

observados dividida pelo número total das obsevações. , para amostra e
, para população.
Média artimética ponderada: esta define-se como soma de produtos dos valores da
variavel com as suas respectivas frequencias ou pesos, dividida pela soma das
frequencias ou pesos. , para amostra e , para populacao.
Moda (Mo) - é o valor da variável que ocorre com mais frequência (ou melhor, que se
repete mais vezes). Para casos em que o número das observações não é muito
elevado esta medida pode ser lida no rol.
De acordo com as frequências de cada valor observado, é possível ter mais de uma
moda (distribuição amodal): no caso de ter uma moda (distribuição unimodal), duas
(bimodal), três (trimodal), etc.
35
Quando temos dados agrupados em classe, a moda é calculada por aproximação,
começando por localizar a classe modal (classe com maior frequência absoluta), se
necessário deve-se conhecer a moda bruta. Formalmente usa-se a fórmula de
aproximação de Czuber para o cálculo da moda.
Onde:
limite inferior da classe modal
frequência da classe modal
frequência da classe anterior a classe modal
frequência da classe posterior a classe modal
intervalo de classe da classe modal
Mediana (Me) - é uma separactriz que divide a distribuição ou conjunto de dados em

duas partes iguais. A mediana é o valor que está na posição mediana ou central para
impar e é a média aritmética dos dois valores centrais para par.
Exemplo 1.22: Consideremos uma amostra de tamanho 10 composta de idades de 10

alunos do curso de Ciências de Educação:
18 23 19 18 20 21 22 18 32 23
Fazendo rol obtemos: 18 18 18 19 20 21 22 23 23 32
Como pode se notar, o número total de dados é par, logo, temos dois dados que se
encontram na posição central, que são 20 e 21, então a média será a média artimética
dos dois, .
Para dados agrupados em classe, a mediana é determinada por aproximação. A

determinação da classe mediana passa pelo cálculo das frequências acumuladas. Para
o efeito, dividimos o valor total das frequências absolutas por 2, e localizamos o
resultado na coluna das frequências absolutas acumuladas. E a essa classe, dá-se o
nome de classe mediana. Para o cálculo da mediana, usamos a fórmula seguinte:
36
Onde:
limite inferior da classe mediana
frequência da classe mediana
frequência acumulada da classe anterior a classe mediana
intervalo de classe da classe mediana
Exemplo 1.23: Consideremos a tabela 1.8 abaixo, e a partir dela vamos determinar a
média artimética, moda e média da distribuição dos dados.
I Classes fi xi xifi Fi
1 10 – 20 10 15 150 10
2 20 – 30 20 25 500 30
3 30 – 40 35 35 1225 65
4 40 – 50 40 45 1800 105
5 50 – 60 25 55 1375 130
6 60 – 70 15 65 975 145
7 70 – 80 5 75 375 150
Total - - 6400 -
1.3.1.2 Cálculos das medidas de tendência central
Cálculo da Média
Para o cálculo da média, vamos somar os elementos da 5ª coluna e dividí-los pela

soma dos elementos da 3ª coluna, isto é: .
Cálculo da Mediana
E para calcularmos a mediana, primeiro, precisamos conhecer a classe mediana (a

classe que se localiza a mediana). Para o efeito, calculamos e depois
procuramos situar o valor 75 na coluna das frequências absolutas acumuladas (a que
37
valor ele se aproxima de todos os valores que se encontram na coluna ), e por sinal,
localiza-se na classe , isto é, na . Então, a frequência absoluta acumulada
anterior a esta é . Deste modo: .
Cálculo da Moda
Para o cálculo da moda, vamos usar a fórmula anterior, e para o efeito, precisamos de
, que é a amplitude de classe. Olhando para 3ª coluna, coluna das frequências
absolutas, localizamos na linha o maior valor absoluto que é 40 (a maior
frequencia absoluta). Então, esta é a classe modal, logo, a frequência modal ,
a frequência anterior afrequencia modal será e a frequência posterior é .
O limite inferior da classe modal é dado por . Deste modo:
.
1.3.1.3 Posições relativas entre a média aritmética, a moda e a mediana
Para curvas de frequências unimodais com um grande número de observações

verificam-se as relações seguintes:
a) Distribuições simétricas:
b) Distribuições com assimetria positiva:
c) Distribuições com assimetria negativa:
Karl Pearson desenvolveu uma fórmula empírica da relação entre as três medidas de
localização, a média (ponto de equilíbrio), a moda (ponto de máxima frequência) e a
mediana (ponto do meio).
Nas figuras a seguir apresentam-se as posições relativas da média, mediana e moda,

para curvas assimétricas ou desviadas e curva simétrica ou normal.
Assimetria positiva curva simétrica - normal Assimetria negativa
38
1.3.1.4 A média e os valores extremos
A média apresenta um problema crítico ou mesmo bicudo; ela é fortemente

influenciada pelos valores extremos. Por esta razão, deve-se fazer uma análise
cautelosa dos dados.
Exemplo 1.24: Suponha que estamos interessados em estudar a distribuição da nota

média de 9 estudantes na disciplina de Matemática. Abaixo estão os resultados do
teste:
: Notas de um teste de Matemática de 9 alunos
: 1, 1, 1, 1, 2, 2, 3, 5, 20
A nota média desses 9 alunos é 4. Mas o que aconteceria se o aluno com nota igual a
20 valores fosse retirada da amostra? O valor da média decaria para 2 valores, o que
parece mais razoável olhando para a distribuição das notas da maioria dos alunos, pelo
que, se pode afirmar que a média 2 descreve melhor esse conjunto de dados.
Este exemplo, ilustra como a média é vulnerável ao efeito de valores extremos. Neste
caso, é recomendado utilizar a mediana, por ser um valor mais perto do centro da
distribuição, e não susceptível de influências.
Nota: Para além da média artimética, temos também a média harmónica e a

geometrica, que não foram tratados neste manual.
39
1.3.2 Medidas de Posição
Assim como as medidas de tendência central tem por objectivo fornecer indicadores do
local onde a maioria dos dados se concentra, por sua vez, as medidas de posição tem
por objetivo, indicar onde é o ponto de corte para uma certa posição. As medidas mais
usadas são os quartis e suas versões mais gerais, decís e percentis.
1.3.2.1 Breves conceitos básicos e respectivos métodos de cálculo
Quartís (Quantís)
Quartil: Como foi tratado atrás nas medidas de tendência central, a mediana divide um
conjunto de dados em duas partes iguais, os quartis dividem o conjunto de dados ou
distribuição de frequências em quatro partes iguais.
Para se determinar a posição quartil sem agrupar os dados é necessário colocá-los em

rol (ordem crescente ou descrescente), só após essa ordenação é que se pode
determinar os quartís.
- deixa 25% dos elementos, coincide com a mediana e deixa 50% dos elementos,
e deixa 75% dos elementos.
Exemplo 1.25: Consideremos os dados da amostra dada no exemplo 1.13 com o

seguinte rol: 18 18 18 19 20 21 22 23 23 32.
O tamanho desta amostra é 10, isto é, , o primeiro quartil

. Como os quartis indicam a posição do dado, então aproximando 2,5
para 3, encontramos que o dado que se encontra na posição 3 é 18.
, enquanto que . A fórmula

geral para o cálculo de quartis é , onde .
Para dados agrupados, pode-se calcular o quartil de ordem , usando a fórmula de

aproximação.
, onde
Onde:
é a ordem do quartil;
limite superior da classe onde existe o quartil;
40
Frequência acumulada ate a classe anterior a classe onde existe o quartil;
frequência absoluta da classe onde existe o quartil;
Decis - os decis são separatrizes que dividem o conjunto dos dados em 10 partes
iguais. Quando os dados não são agrupados, primeiro devemos colocá-los em forma
de rol como fizemos para o caso de quartis. A fórmula para o cálculo de decis é
, onde .
Para efeitos de cálculo de decis, quando os dados estão agrupados, a fórmula é

semelhante a de quartis.
, onde .
Percentis - são separatrizes que dividem a amostra em 100 partes iguais. Para dados
não agrupados, para calcular o percentil de ordem usamos a fórmula
onde . Enquanto que para dados agrupados usamos a fórmula abaixo.
, onde .
Exemplo 1.26: Registaram-se alturas de 100 estudantes do Curso de Ciências de

Educação, e foi obtida a tabela 1.9 seguinte de distribuição de frequências.
I Classes(xi, m) fi Fi
1 1,40 – 1,46 7 7
2 1,46 – 1,52 9 16
3 1,52 – 1.58 5 21
4 1,58 – 1,64 12 33
5 1,64 – 1,70 26 59
6 1,70 – 1,76 20 79
7 1,76 – 1,82 11 90
8 1,82 – 1,88 10 100
Total -
41
a) Determine os valores das separatrizes Me, Q1, D3 e P80 e comente os resultados.
Resolução:
Mediana
1º Passo: Como os dados estão agrupados em classes, para determinarmos a

mediana, primeiro temos que descobrir a classe mediana, e como a mediana divide a
distribuição das frequências teremos: .
2º Passo: Daqui procuramos localizar o valor 50 na coluna das frequências

acumuladas e situa-se na linha , então esta é a classe mediana, onde temos
e . E a frequência acumulada que se localiza na classe anterior a
classe mediana é . Então:
Mediana: .
Q1
1º Passo: Para determinarmos o primeiro quartil, temos antes de tudo que determinar a
classe onde se localiza o primeiro quartil e como este divide a distribuição das
frequências em 4 partes iguais teremos .
2º Passo: Daqui procuramos localizar o valor 25 na coluna das frequencias

acumuladas e situa-se na linha , onde temos que e . E a
frequencia acumulada que se localiza na classe anterior a classe quartil é .
Então: .
D3
1º Passo: Do mesmo modo, para determinarmos o 3° decíl temos de descobrir onde se

localiza, e para o efeito vamos calcular .

acumuladas: situa-se na linha , onde temos que e . E a frequencia
acumulada que se localiza na classe anterior a classe decíl 30 é . Entao
42
P80
1º Passo: Por último, vamos determinar o percentil 80, e para o efeito temos de
localizá-lo calculando: .

acumuladas, e situa-se na linha , onde temos que e . E a
frequência acumulada que se localiza na classe anterior a classe do percentil 80 é
. Entao .
Resposta:
Dos 100 estudantes, 50% destes tem uma estatura inferior a 1,68 m, 25% dos
estudantes possuem altura inferior a 1,60 m, 30% dos estudantes possuem altura
menor que 1,63 e só 20% dos 100 tem altura igual ou superior a 1,77 m.
43
LIÇÃO N°4
MEDIDAS DE DISPERSÃO
1. Entender o conceito de variabilidade dos fenómenos estatísticos;

2. Descrever as principais medidas de dispersão;
3. Aplicar diferentes medidas de dispersão em exemplos;
44
1.4.1 Introdução à lição n°4
Como se sabe, os fenómenos cuja análise intervêm o método estatístico bem como os
dados estatísticos a eles referentes, caracterizam-se tanto pela sua semelhança quanto
pela sua variabilidade. Assim, o cálculo de um promédio sobre um conjunto de dados
tem sentido, caso contrário, não teria sentido calcular a média de um conjunto de
dados onde não haja variação dos seus elementos.
Para medir o grau de variabilidade ou dispersão de um conjunto de valores são

calculadas outras medidas estatísticas denominadas medidas de dispersão.
As medidas de dispersão permitem observar as flutuações das observações face as

medidas de tendência central. Elas proporcionam um conhecimento mais completo do
fenómeno a ser analisado em termos de conjuntos absolutos bem como relativos,
estabelecendo comparações entre fenómeno de mesma natureza, e mostrando até
que ponto os valores se distribuem acima e abaixo da medida de tendência central.
De um modo geral, as medidas de dispersão podem ser absolutas e relativas. Os

índices mais relevantes deste grupo das características de distribuições de frequência
são a variância, o desvio padrão e o coeficiente de variação.
45
1.4.2 Breves conceitos básicos
Variância ou dispersão ( ) de um conjunto de números, é a média aritmética dos

quadrados dos desvios absolutos ( ) desses números em relação a sua média
aritmética.
Quando os dados observados estiverem agrupados em uma distribuição de

frequências, a fórmula da variância assume o seguinte aspecto: .
Exemplo 1.27: Calcular a variância das notas obtidas num teste realizado para 50
estudantes com os dados apresentados na tabela 1.10 abaixo .
1 8 7 56 -2,64 48,7872
2 9 8 72 -1,64 21,5168
3 10 9 90 -0,64 3,6864
4 11 10 110 0,36 1,2960
5 12 8 96 1,36 14,7968
6 13 4 52 2,36 22,2784
7 14 4 56 3,36 45,1584
Total - 532 157,5200
Agora, vamos calcular a média artimética: valores. Então, a
variância será: valores.
O Desvio Padrão ( ) é a medida de dispersão mais usada. O desvio padrão é a raiz

quadrada positiva da média aritmética dos quadrados dos desvios dos valores
observados em relação a grandeza média.
46
De igual modo para dados agrupados em classe usamos: .
Se quisermos calcular o desvio padrão do exemplo anterior, basta determinar a raiz

quadrada de 3,15, assim valores.
1.4.3 Determinação do desvio padrão para amostras
Quando se trabalha com uma amostra e não com uma população (caso mais frequente
na inferência estatística), ou quando o número das unidades observadas não é grande,
isto é, ( ), para se obter uma melhor estimativa, usa-se o desvio padrão corrigido:
.
Quando os dados observados tiverem sido classificados, agrupados ou tabelados com
frequências, o desvio padrão corrigido será: .
Exemplo 1.27: Calcular o desvio padrão e o seu valor corrigido nas alíneas seguintes:
Este exemplo, mostra que quanto mais aumentamos o número dos elementos na
amostra, a diferença entre os desvios torna-se cada vez menor.
Atenção…
Para determinados tipos de problemas, as medidas de variabilidade absolutas, tais

como, o desvio padrão e a variância, não são muito expressivas, neste caso, as
medidas de dispersão relativa proporcionam uma avaliação mais apropriada do
grau de dispersão da variável.
47
Exemplo 1.28: Calcular o desvio padrão e o seu valor corrigido nas seguintes alíneas:
a)
1 2 4 8 10.50
1 3 10 30 40.0
2 3 9 27 3.46
2 4 15 60 15.0
3 4 8 32 1.16
3 5 30 150 0.0
4 5 3 15 5.71
4 6 15 90 15.0
5 6 2 12 11.33
5 7 10 70 40.0
_ 26 94 32,16
_ 80 400 110,0
a) b)
Diferença = 0.02 (2%) Diferença = 0.02 (2%)
Este exemplo, mostra que quanto mais aumentamos o número dos elementos na
amostra, a diferença entre os desvios torna se vez menor.
Os coeficientes de variação são medidas de variação relativa que muitas vezes são
expressadas em percentagem. Eles resultam do quociente entre uma medida de
dispersão absoluta e um promédio.
Coeficientes de variação: quando a dispersão absoluta é igual ao desvio padrão e o

promédio e a média aritmética, a dispersão real é denominada coeficiente de variação
dearsom. Este é o coeficiente mais vulgar e mais utilizado, designando-se,
simplesmente, coeficiente de variação ou coeficiente de dispersão. O seu valor é
expressado, na maior parte das vezes, em percentagem.
48
Diz-se que a dispersão é pequena quando: o coeficiente for menor ou igual à 10%; a
média de dispersão for maior que 10% e menor ou igual à 20%. E diz-se que é grande
quando for maior que 20%.
Caro aluno!
Note que: Alguns autores consideram os intervalos: baixa dispersão se

média dispersão se e alta dispersão se
Exemplo 1.29: Vamos considerar a situação abaixo de uma turma cujos alunos
realizaram dois testes:
Teste Média Desvio-padrão Coeficiente de variação
1 12 2.4 0.2/
2 9 1.9 0.2/
Comparando os valores da tabela entre os testes, podemos concluir que, embora o

teste 1 aparenta ter maior dispersão absoluta, em geral a dispersão relativa dos
resultados é igual.
Em resumo, quando comparamos a dispersão, podem ocorrer três tipos de situações:
1. As observações vem expressas na mesma unidade de medida, e as médias são

iguais ou muito próximas. Portanto, é conveniente compará-las com os valores
de desvio padrão.
2. As observações vem expressas na mesma unidade de medida, e as médias são
significativamente diferentes. Portanto, é conveniente compará-las com as
medidas de dispersão relativa como o coeficiente de variação de pearson.
3. As observações vem expressas em unidades diferentes de medida. Portanto, é
totalmente conveniente, neste caso, compará-las com as medidas de dispersão
como o coeficiente de variação de pearson.
49
Leituras Obrigatórias
Na lição nº 4 os temas seguintes não foram tratados: Medidas de forma de
distribuição de frequências (momentos); Assimetria de uma distribuição e seus
coeficientes e Curtose… Pelo que nas referências bibliograficas abaixo, poderás
encontrar os temas acima citados.
Leia também o livro do Allen Webster, pag. 57-58, que é sobre distribuição Normal e
Distribuição Empírica. Este tema fala do uso do desvio padrão para verificar se dados
a serem estudados são normalmente distribuidos.
Leituras Complementares
A partir da leitura dos livros que lhe recomendamos abaixo, com textos que constituem
o que chamamos por leituras complementares, o nosso maior objectivo é, que o
estimado aluno conheça outras abordagens dos temas, por si estudados ao longo da
primeira unidade, para dar mais subsídios e enriquecer os teus conhecimentos nesta
área. Seja exigente consigo mesmo: evite ler os textos apenas para resolver os
exercícios. A leitura complementar enriquece e facilita o seu entendimento cabal sobre
o conteúdo estudado.
Texto 1
Reis, Elizabeth. Estatística Descritiva. Lisboa, 2005.
Parte 1: De p.15 à p.60;
Parte 2: De p.63 à p.131;
Texto 2
Webster, Allen L. Estatística Aplicada à Administração e Economia. São Paulo:
McGraw-Hill, 2006.
De p.3 à p.61
50
PARTE II - INFERÊNCIA ESTATÍSTICA
Lembre-se que:
A Inferência Estatística é uma forma de indução. A indução estabelece as regras e

formas de raciocínio válido que permitem passar do particular para o geral. O que há
de específico nesta forma de indução designada inferência estatística é o uso da teoria
de probabilidades no tratamento das incertezas, associadas à passagem do particular
para o geral.
51
UNIDADE TEMÁTICA II
TEORIA ELEMENTAR DAS PROBABILIDADES
Ao fim desta unidade, deves ser capaz de:
1. Definir probabilidade;
2. Descrever as abordagens clássica, frequencista e subjectiva da probabilidade;
3. Explicar os termos experimento, espaço amostral e evento;
4. Definir os termos probabilidade condicional e probabilidade conjunta;
5. Calcular probabilidades aplicando as regras de adição e multiplicação;
6. Determinar o número de possíveis permutações e combinações;
7. Aplicar a análise combinatória na resolução de problemas;
8. Calcular uma probabilidade usando o Teorema de Bayes;
52
Introdução
A Teoria de Probabilidades é um ramo da Matemática extremamente útil para o estudo

e investigação das regularidades dos chamados fenómenos de um mero acaso,
denominados aleatórios. O lançamento de uma moeda 10 vezes é um exemplo de um
experimento aleatório. A maioria dos experimentos está sujeito a Variação Aleatória. A
teoria das probabilidades é a aproximação matemática que busca quantificar em temos
de modelos o que ocorre com estes experimentos.
Em muitas experiências, há sempre uma incerteza no que se refere à ocorrência e grau

de resultado de um determinado fenómeno observado numa experiência. A fim de se
obter uma medida de certeza (chance) ou probabilidade, com que se pode esperar a
ocorrência e grau de resultado de um evento, atribui-se um número entre 0 e 1 ou um
intervalo entre 0 e 100%. Se se tem certeza que o evento sempre ocorrerá, diz se que
sua probabilidade de ocorrência é igual a 100% (ou 1), se não, então diz-se que a
probabilidade de ocorrência é igual a zero “0”.
A teoria das probabilidades constitui o pré-requisito essencial para poderes melhorar o

estudo da inferência estatística. Para entenderes melhor os conteúdos da inferência
estatística, que tal tratar dos seguintes conceitos básicos da teoria das probabilidades:
Experiência Aleatória, Espaço de Resultados, Espaço Probabilístico, Variável Aleatória,
Função de Probabilidades, Função de Densidade e Função de Distribuição.
53
LIÇÃO N°5
PROBABILIDADES
1. Entender o conceito de evento, experimento, espaço amostral e probabilidade;

2. Descrever os principais axiomas de probabilidades;
3. Conhecer a definição clássica do conceito de probabilidade e distinguir este do
conceito de probabilidade frequecista e subjectiva;
54
2.5.1 Breves Conceitos Básicos
a) Evento - é uma colecção de um ou mais resultados de um experimento
Exemplo: Saída de uma cara no mínimo =
b) Experimento - é uma experiência cujos resultados são imprevisíveis.
Exemplo: lançar uma moeda duas vezes, podendo ter como resultados possíveis
(espaço amostral): . Onde representa a saída de cara, e , a saída da
coroa.
Exemplo 2.1: Um jogador de futebol quando bate uma penalidade, os resultados

possíveis são “marcar” ou “não marcar”. Em cada tentativa não é possível prever o
resultado, embora ele seja determinado por causas perfeitamente bem definidas. Entre
as diversas causas se destacam: o poderio do remate, o tipo de guarda redes, a
simulação do marcador, etc. É de notar que isto resulta numa diversidade de
parâmetros que podemos controlar mas que levam-nos ao resultado imprevisível: se
vai ser golo ou não.
Nota: O exemplo descrito acima faz parte de diversas experiências que podem ser
feitas, tendo o imprevisível resultado dentro dos casos possíveis.
c) Experiência – é o conjunto de causas e processamentos que podem produzir

resultados observáveis. Se essa experiência está sujeita a várias situações e que os
resultados são um mero acaso, diz-se que ela é aleatória. Voltando ao exemplo atrás,
aparentemente pode parecer que nele existe alguma regularidade. Mas, se o número
de observações for elevado, alguma regularidade surge. O número de penaltes
marcados é aproximadamente cerca de 95% do que os falhados (defendidos, que
tocaram na barra ou que foram ao lado da baliza) com 5%.
Características das experiências aleatórias
Podemos afirmar que as experiências aleatórias caracterizam-se por:
Poderem repetir-se em grande número de vezes nas mesmas condições ou

em condições muito semelhantes;
Cada vez que a experiência é executada obtém-se um resultado, mas que
não é possível de ser previsto antes.
Os resultados dessas experiências individuais são irregulares, mas que
analisados na globalidade ao longo de muito tempo (muitas experiências),
parecem ter uma certa regularidade estatística quando tomados em conjunto.
55
Cumprindo-se os três pressupostos dizemos que estamos perante um experimento. Se
estás a trabalhar num computador e lhe dizem que dentro de dez minutos não haverá
energia eléctrica, já pode prever o resultado de que o computador irá desligar.
A teoria das probabilidades opera sobre os fenómenos aleatórios e na maior parte dos
casos sobre experimentos. Será que o jogador citado, no exemplo acima, ao chutar a
bola vai mesmo marcar? Neste caso recorremos à teoria das probabilidades, pois ela
tenta dar significado a experimentos tais que o resultado não pode ser completamente
pré-determinado. “Atente para o facto de que pré-determinado não significa pré-
definido”. Calcular a probabilidade é medir a incerteza ou associar um grau de
confiança aos resultados possíveis. Por exemplo, escolha uma carta qualquer num
baralho depois de ter sido bem baralhado, para garantir que todas as cartas tenham a
mesma possibilidade de serem seleccionadas. O que é mais provável sair, uma figura
ou sair um dois de espadas?
Vamos entender o evento como um acontecimento. As probabilidades associam às

possíveis combinações dos resultados, que chamamos de eventos, um valor entre 0 e
1. Quanto maior for o valor, maior é a certeza de sua possibilidade de ocorrência.
d) Probabilidade - é uma medida de possibilidade de ocorrência de um

determinado evento; Ela pode assumir qualquer valor entre 0 e 1.
Apesar da vasta aplicação dos princípios da probabilidade, geralmente há somente três

maneiras aceitáveis de aproximação para a probabilidade: a frequência relativa
(frequencista), a subjectva e a clássica.
A frequência relativa usa a informação passada que foi observada empiricamente. Ela
observa a frequência com que algum evento ocorreu no passado e estima a
probabilidade dele ocorrer novamente. A probabilidade de um evento com base
frequrncia relativa é dada por:
Frequência relativa:
Por exemplo, assuma que durante o último mês ocorreram 50 nascimentos no hospital
do seu bairro. Trinta e dois (32) bebês recém nascidos eram meninas. A frequência
relativa revela que a probabilidade de que um próximo nascimento (ou qualquer
nascimnto escolhido aleatoriamente) seja de uma menina é:
56
Em muitas ocasiões os dados anteriores não estão disponíveis e, portanto, não é
possível calcular a probabilidade a partir do desempenho anterior. A única alternativa é
estimar a probabilidade utilizando o seu melhor julgamento. Esta aproximação
subjectiva associa probabilidade aos eventos com base na avaliação da melhor
evidência. A aproximação subjectiva é usada quando queremos associar
probabilidades a um evento que nunca ocorreu. A probabilidade de que uma mulher
será eleita presidente da republica de Moçambique é um exemplo. Visto que não há
dados do passado, devemos avaliar nossas opiniões e crenças para obter uma
estimativa subjectiva.
Definição axiomática de probabilidade
Se for um evento qualquer e S for espaço de resultados (conjunto universal), então:
a)
b)
c) ,
Exemplo 2.2: Consideremos, agora, o lançamento de um dado. Um dado possui seis

faces numeradas de 1 a 6. Nesse lançamento pode sair uma face par assim como uma
face ímpar. Acontecimento é qualquer um dos subconjuntos do conjunto que contém
todos resultados possíveis da experiência aleatória.
Denotemos por , o conjunto que contém todos os resultados possíveis do experimento

aleatório, e a este conjunto, chamamos de espaço amostral. Então, S pode ser escrito
como: e alguns possíveis eventos podem ser:
- caso em que num lançamento saia uma face par.
- caso em que num lançamento saia uma face

maior ou igual a 5.
= {face maior ou igual a 7 } = = conjunto vazio.
Tomemos ainda o exemplo de lançamento de um dado. Um dado contém seis faces

numeradas de 1 a 6. Neste caso, o espaço de resultados é . Vejamos
as definições que se seguem:
Dois eventos (acontecimentos) quaisquer dizem-se mutuamente exclusivos se

possuem intersecção vazia, são incompatíveis, isto é, eles não podem ocorrer
simultaneamente.
57
Exemplo 2.3:
Como podemos ver a intersecção dos subconjuntos e é vazia, isto significa que no
lançamento de um dado não podemos ter a face par e impar ao mesmo tempo.
Os subconjuntos de S designam-se por acontecimentos; Os subconjuntos formados por

um único elemento chamam-se acontecimentos elementares.
Exemplos:
O acontecimento que não contém algum elemento de , chama-se de acontecimento

impossível.
Exemplo:
A reunião de dois acontecimentos e é um acontecimento que se pode realizar, se e

somente se, ou se realiza. O que significa que se realiza ou se realiza ou ainda
ambos se realizam. Abrevia-se por ou , e é formado pelos elementos que
vem de e os que vem de .
Nota: Quando um elemento coexiste nos dois conjuntos, deve ser escrito (participar)
uma única vez no conjunto solução da reunião.
Exemplo 2.4:
A intersecção dos acontecimentos e é um acontecimento realizável, se e somente

se, e se realizam ao mesmo tempo. Representa-se por ou , e é formado
por elementos que comummente existem em e em .
Exemplo 2.5:
58
Diz-se que é um acontecimento complementar de se é formado por todos
elementos do espaço amostral excepto os existentes em . Escreve-se .
Para o nosso exemplo o . Também pode-se designar de ou ao
complementar de .
Na lógica matemática, segundo as leis de Morgan, definem-se seguintes axiomas para

conjuntos:
Se é um conjunto qualquer, e ou definido como sendo complementar do

conjunto .
1.
2.
3.
Afinal como é que uma

probabilidade é expressa?
Uma probabilidade é expressa como um número decimal, tal como 0,70 ; 0,27 ; ou
0,50. Entretanto ela pode ser representada como uma percentagem tal como 70 %, 27
% ou 50 %.
Caro aluno!
Note que: Nunca se diz porcentos, p. ex: 2, 3, … porcentos, mas sim porcento.
O valor de uma probabilidade está localizado no intervalo de números reais que vai de
0 a 1, inclusive as extremidades deste intervalo.
Quando uma probabilidade é 0, o evento a ela associado é improvável de ocorrer, o

que se denomina por Evento Impossível.
Quando uma probabilidade é 1, o evento a ela associado é mais provável de ocorrer e

é denominado de Evento Exacto.
59
Definição clássica de Probabilidade: Dado um evento associado a um experimento
aleatório com espaço amostral , a probabilidade do evento A denotada por éo
quociente:
Voltemos para o caso do lançamento de dado, e atentemos somente para o

aparecimento da face par. O evento , terá como
probabilidade . Isto é, número de resultados favoráveis (ao evento )
dividido pelo número de resultados possíveis no conjunto .
60
LIÇÃO N°6
ANÁLISE COMBINATÓRIA
1. Entender o conceito de factorial de um número;

2. Descrever e saber aplicar os conceitos de Permutação, Arranjos e
Combinações;
3. Saber distinguir Arranjos das Combinações;
61
2.6.1 Factorial de um número
Seja n um número inteiro não negativo. Define-se factorial de n (indicado pelo símbolo
n! ) como sendo: e lê-se:
n factorial.
Casos Especiais
Exemplo 2.6:
a) Lê-se 6 factorial
b) Lê-se 4 factorial
c) Repare ainda que Lê-se 6 factorial igual a 6 vezes 5 vezes

4 factorial.
2.6.2 Princípio fundamental da contagem
Se uma tarefa pode ser realizada em etapas diferentes, e se a primeira etapa pode
ocorrer de maneiras diferentes, a segunda de maneiras diferentes, e assim
sucessivamente, então o número total T de maneiras de realização da tarefa é dado
por: .
Exemplo 2.7:
O INAV (Instituto Nacional de Viação) tem como norma mandar colocar placas de
matrícula nos veículos automóveis usando-se 3 letras do alfabeto (sendo a primeira
letra M) e 4 algarismos. Qual o número máximo de veículos que poderão ser
licenciados?
Resolução:
62
Usando o Princípio fundamental da contagem, podemos imaginar uma placa do tipo
MLN 10 15. Como o alfabeto possui 26 letras e o sistema numérico possui 10
algarismos (de 0 a 9), podemos concluir que: para a 1ª posição, temos 1 (uma)
alternativa que é a letra M, como pode haver repetição, para a 2ª, e 3ª também, estas
duas últimas terão 26 alternativas cada. Com relação aos algarismos, concluímos
facilmente que temos 10 alternativas para cada um dos 4 lugares. Podemos então
afirmar que o número total de veículos que podem ser licenciados será igual a:
que resulta em 6.760.000.
Atenção… Observe que quando o número de veículos ultrapassar o valor acima,
ainda que seja por 1, p.ex: 6.760.001 veículos, todos com matricula nacional, o
sistema de codificação para atribuição de matrículas terá de ser modificado, já que
não existiriam números de matrícula suficientes para todos os veículos.
2.6.3 Permutações simples
Permutações simples (de elementos distintos) - são agrupamentos formados por

todos os elementos tomados a e que diferem na ordem de sua colocação. Neste
caso o número total de permutações simples de elementos distintos é dado por ,e
lê-se, factorial.
Exemplo 2.8: Com os elementos de um conjunto qualquer, são possíveis as

seguintes permutações: .
Exemplo 2.9: De quantas maneiras 5 pessoas podem se sentar num banco

rectangular. .
2.6.4 Permutações com elementos repetidos
Se entre os n elementos de um agrupamento, existem elementos repetidos com uma

característica, elementos repetidos com outra característica e elementos repetidos
com outra característica e assim sucessivamente, o número total de permutações que
podemos formar é dado por:
Exemplo 2.10: Imagine que se as marcas de carros fossem obtidas da combinação de

um conjunto de letras de uma palavra pré-definida. Quantas marcas de viaturas
podemos ter a partir da palavra “correspondente”?
63
Solução: Temos 14 elementos, dos quais 4 estão repetidos. Observe que a letra “o”
aparece duas vezes, a letra “r” duas também, a letra “e” três vezes e a letra “n” duas
vezes. Na fórmula anterior, teremos: (nº de elementos)
Nº de repetições em cada letra: :
Portanto, aplicando a fórmula acima a resposta é
Resposta: Podemos ter 1816214400 marcas de carros diferentes.
2.6.5 Arranjos simples
Dado um conjunto com elementos, chama-se arranjo simples tomados a , a todo

agrupamento de k elementos diferentes dispostos numa certa ordem. Especial atenção
deve existir para evitar confusão, porque dois arranjos diferem entre si, pela ordem de
colocação dos elementos. Assim, no conjunto , teremos:
a) Arranjos de três elementos tomados dois a dois: .
b) Arranjos de três elementos tomados três a três: .
Arranjos simples são representados pela fórmula: . Lê-se: Arranjos de a
É fácil perceber que .
Exemplo 2.11: Um cartão multibanco possui um número de 16 dígitos. O segredo

(PIN) do cartão é marcado por uma sequência de 4 dígitos distintos. Se uma pessoa
tentar usar o cartão, quantas tentativas deverá fazer (no máximo) para conseguir
efectuar um levantamento, se a norma fosse que cada pessoa escolhe 4 dígitos para
usar como PIN, dentre as constantes como número do cartão?
Resolução:
As sequências serão do tipo . Para a primeira posição teremos 16 alternativas,

para a segunda 15, para a terceira 14 e para a última 13. Podemos aplicar a fórmula de
arranjos, mas pelo princípio fundamental de contagem, chegaremos ao mesmo
64
resultado: .
Resposta: A pessoa deverá efectuar 43 680 tentativas.
2.6.6 Combinações simples
Denominamos combinações simples de elementos distintos tomados a , aos

subconjuntos formados por elementos distintos escolhidos entre os elementos
dados. A diferença entre arranjos e combinações reside no facto de que nos arranjos a
ordem é importante enquanto que nas combinações a ordem não é importante.
Exemplo 2.12: Dado um conjunto podemos considerar:
a) Combinações dos 4 elementos tomados 2 a 2 as seguintes: .
b) Combinações dos quatro elementos tomados 3 a 3 as seguintes: .
c) Combinações dos 4 elementos tomados 4 a 4:
Analiticamente, as combinações são representadas por: , que se lê:
combinação de a . A fórmula de combinações é mais conhecida como sendo

número binomial e indicado por: e que será usado nas Distribuições
Teóricas Discretas de Probabilidade (Binomial e Hipergeométrica).
Resumo…
Numa permutação, todos os elementos do conjunto devem fazer parte. Num

arranjo, toma-se uma parte dos elementos do conjunto para formar
agrupamentos; Quando essa parte dos elementos é um todo (universo), o
arranjo se transforma em permutação. 65
Num arranjo, a ordem dos elementos interessa, sendo que se no primeiro

agrupamento um elemento estiver na primeira posição, e no segundo
LIÇÃO N°7
CONSIDERAÇÕES SOBRE LEIS, AXIOMAS E TEOREMAS
1. Conhecer as várias propriedades de probabilidades;

2. Distinguir acontecimentos dependentes de independentes;
3. Entender e saber aplicar a probabilidade condicional;
4. Entender e saber aplicar o conceito de probabilidade total e o teorema de bayes;
66
2.7.1 Considerações sobre leis, axiomas e teoremas:
Se A e B, são dois eventos quaisquer de S, teremos:
1.
2.
3.
4. , se , i.e, e são mutuamente exclusivos
5. , se , i.e, e não são
mutuamente exclusivos
6. e são independentes
7. ou e são
independentes
8. ocorre depois de ter ocorrido. Este caso, define
Probabilidade Condicional.
9.
10.
11.
Exemplo 2.13: Na zona do Bairro Canongole em Tete, existem duas padarias, uma
produzindo pães de forma, e outra, arrufadas. Nesta zona, que se dedica
essencialmente à venda de cabritos, 9,8% dos residentes compram sempre pão de
67
forma, 22,9% compram sempre arrufadas e 5,1% compram sempre ambos tipos de
pães. Determine a probabilidade de:
a) Uma pessoa comprar pelo menos um dos dois tipos de pães.

b) Uma pessoa comprar somente pão forma.
c) Uma pessoa não comprar nem pão forma nem arrufadas.
Resolução:
Designemos por o acontecimento comprar pão de forma e comprar arrufadas. A

probabilidade de uma pessoa comprar pelo menos um dos dois tipos de pães será
, visto
que A e B não são mutuamente exclusivos. A probabilidade de uma pessoa comprar
somente pão de forma é a probabilidade da pessoa comprar pão de forma e não
arrufadas, ou seja . A
probabilidade de uma pessoa não comprar nem pão de forma e nem arrufadas,
corresponde a não comprar pão de forma nem comprar arrufadas, logo
.
2.7.2 Definição para acontecimentos independentes
A regra especial de multiplicação requer que dois eventos sejam independentes.

Já tínhamos visto atrás, onde figuram diversas propriedades, para casos de dois
eventos. E definimos que, dois eventos e dizem-se independentes se a ocorrência
de um não tem efeito sobre a probabilidade de ocorrência do outro, isto é
.
Para três eventos independentes , a regra especial da multiplicação usada para

determinar a probabilidade de que todos os eventos ocorram é:
.
2.7.3 Probabilidade Condicional
Definição 1: A probabilidade condicional de um evento dado o evento é dada por

, o que equivale a
Definição 2: e dizem-se independentes se, e somente se,

, o que equivale a dizer e
.
68
Exemplo 2.14: Um grupo de pessoas é classificado de acordo com o seu gosto pela
bebida alcoólica, e a incidência na qualidade de violência que possa praticar. As
proporções das diversas categorias, aparecem na tabela seguinte:
Tabela 3.3 Proporções de gosto pela bebida e a incidência de violência
Bêbedo Moderado Não Bebe Total
Violento 0,10 0,08 0,02 0.20
Não Violento 0,15 0,45 0,20 0,80
Total 0,25 0,53 0,22 1,00
a) Qual é a probabilidade de uma pessoa escolhida ao acaso seja violenta?
b) Qual é a probabilidade de uma pessoa bêbeda ser violenta?
Resolução:
a) A resposta para a primeira questão é imediata. Basta ver a proporção de

violentos dentro da população que é de 0,20.
b) Para responder à segunda questão, há que tomar em atenção que o que se
pretende é a proporção de violentos dentre a população de bêbedos, i.e.,
. Por outras palavras quer-se calcular a probabilidade do acontecimento
“ser violento”, sabendo que ocorreu o acontecimento “ser bêbedo”.
Prezado aluno!
Repare que: este quociente resulta da divisão entre a probabilidade de uma

pessoa ser violenta se for bêbeda, e a probabilidade de uma pessoa ser bêbeda.
Chamemos por , o acontecimento “ser bêbedo”, e por , o acontecimento “ser
violento”. Podemos escrever simbolicamente que a probabilidade pretendida é
dada por: - fórmula da definição de probabilidade condicional.
2.7.3.1 Regra Geral da Multiplicação numa Probabilidade Condicional
A Regra Geral da Multiplicação é usada para encontrar a probabilidade conjunta de que

dois eventos ocorram. Ela estabelece que para dois eventos e , a probabilidade
69
conjunta de que os dois eventos ocorram é obtida pela multiplicação da probabilidade
de que o evento ocorra pela probabilidade condicional de , dado que ocorreu.
Pela notação simbólica temos que: . Alternativamente,
podemos também escrever: .
2.7.4 Probabilidade Total
Suponhamos que um acontecimento C pode ocorrer se também ocorrer um dos

acontecimentos que são mutuamente exclusivos , os quais formam um
conjunto. Suponhamos, ainda, que sejam conhecidas as probabilidades destes
acontecimentos e as probabilidades condicionais do
acontecimento C. Pretendemos calcular a probabilidade de que C ocorra.
Exemplo 2.15: A Administração de um fundo de investimentos em acções pretende

divulgar após o encerramento do pregão, a probabilidade de queda de um índice da
bolsa no dia seguinte, baseando-se nas informações disponíveis até aquele momento.
Suponha que a previsão inicial seja de 0,10. Após encerrado o pregão, nova
informação sugere uma alta do dólar em relação ao metical. A experiência passada
indica que quando houve queda da bolsa no dia seguinte, 20% das vezes foram
precedidas por esse tipo de notícias, enquanto nos dias em que a bolsa esteve em alta,
apenas em 5% das vezes houve esse tipo de notícia no dia anterior. Determine a
probabilidade de que a bolsa caia pelo simples facto de ter caído o dólar. Determine a
probabilidade de que haja alta do dólar.
Resolução:
. Se - é a alta do dólar, então:
Seja - Queda da bolsa. - probabilidade de queda da bolsa devido a

alta do dólar.
Portanto, a informação aumenta a probabilidade de alta do dólar em 6,5%.
2.7.4.1 Teorema da Probabilidade Total
A probabilidade de um acontecimento , que pode ocorrer apenas sob a condição de

que ocorra um dos acontecimentos que excluem mutuamente e que
formam oconjunto , é igual a soma do produto das probabilidades de cada um desses
70
acontecimentos, pela correspondente probabilidade condicional do acontecimento ,
isto é:
2.7.4.2 Teorema de Bayes
Suponhamos que um acontecimento pode ocorrer se também ocorrer um dos

acontecimentos que se excluem mutuamente e que formam um grupo
completo. Visto que não se sabe qual desses acontecimentos ocorrerá, eles são
considerados como hipóteses. A probabilidade de que ocorra, determina-se pelo
teorema de probabilidade total. Como iríamos determinar a probabilidade de que um
dos eventos que é partição de ocorra dado que ocorreu?
Exemplo 2.16: Os trabalhadores de uma fábrica são classificados segundo o nível de

instrução escolar. A experiência mostra que 30% dos indivíduos são de nível superior,
destes 80% são considerados conhecedores das tarefas que desempenham. Dos 70%
com nível inferior a superior, 50% são considerados conhecedores das tarefas que
desempenham.
Dados
a) Qual é a probabilidade de que um trabalhador da fábrica encontrado no refeitório

seja considerado conhecedor das tarefas que desempenha na fábrica?
Resolução
Resposta:
A probabilidade de que um trabalhador da fábrica encontrado no refeitório seja

considerado conhecedor das tarefas que desempenha na fábrica é de 0,59.
b) Qual é a probabilidade de que um trabalhador conhecedor da matéria tenha nível

superior?
Resolução
71
Resposta: A probabilidade de que um trabalhador conhecedor da matéria tenha nível
superior é de 0,4067797.
72
Texto 1
Reis, Elizabeth; Melo, Paulo; Andrade, Rosa e Calapez, Teresa. Estatística Aplicada.
Lisboa, 2001.
Cápitulo II: De p.29 à p.80;
Texto 2
McGraw-Hill, 2006.
Capítulo IV: De p.72 à p.90.
73
UNIDADE TEMÁTICA III
VARIÁVEIS ALEATÓRIAS
1. Distinguir conceito de variavel aleatória discreta da contínua;
2. Caracterizar a função ou lei de distribuição de probabilidades;
3. Entender o conceito de distribuição acumulada e suas propriedades;
4. Entender as propriedades da esperança matemática e da variância;
5. Caracterizar a função de distrbuição acumulada das variáveis contínuas;
6. Entender as propriedades da função de distribuição;
7. Entender o conceito de função de densidade de probabilidades e suas
propriedades;
8. Descrever as características das variáveis contínuas;
9. Saber calcular as características das variáveis contínuas;
74
Lição Nº 8
VARIÁVEIS ALEATÓRIAS DISCRETAS
1. Entender o conceito de variável aleatória discreta;

2. Caracterizar a função ou lei de distribuição de probabilidades;
3. Entender o conceito de distribuição acumulada e suas propriedades;
75
3.8.1 Conceito de Variável Aleatória
Seja , o eapaço amostral de um certo experimento. Como vimos na teoria das

probabilidades, os resultados de um experimento, isto é, os pontos amostrais de ,
não precisam de ser, necessariamente, números. Contudo, frequentemente, é
desejável associar um número específico a cada resultado de um experimento. Esta
associação, dá lugar a uma nova variável, que passamos a chamá-la por variável
aleatória.
Definição 1: Uma variável aleatória num espaço amostral S, é uma função de S no

conjunto R dos números reais tal que a imagem inversa de cada intervalo de seja um
evento de S (Lipschutz, 1993).
Observação: Se o espaço amostral não é enumerável, então, por motivos

teóricos, certas variáveis definidas em serão aleatórias. Entretanto, os espaços
amostrais considerados nesta abordagem serão finitos e enumeráveis.
Definição 2: Uma variável aleatória (V.A.) é um conjunto de valores numéricos que

são associados a eventos de um experimento. Em geral, as variáveis aleatórias são
designadas por letras maiúsculas, , etc. e podem ser discretas ou contínuas.
Exemplo 3.1:
1- Seja a V.A. , o número de sementes de milho que germinam em 100 plantios.

Possíveis valores para são 0;1;2;100 (discreta), pois nós contamos planta a planta,
pelo que, estamos em presença de uma Variável Aleatória Discreta (VAD)
2- Seja , a resposta para a questão, se é ou não Moçambicano. As respostas podem

ser: 'Sim', 'Não', 'Não Responde'. Repare que para este caso o não é uma V.A (por
não ser numérica). O 'Sim', 'Não', 'Não Responde' são resultados qualitativos. Se
tivéssemos que contar a quantidade de pessoas que responderem 'Sim', 'Não', 'Não
Responde', obteríamos variáveis discretas. Repare que este exemplo não leva a
variável contínua porque as respostas dadas não são medíveis no sistema básico
internacional de medidas.
4- Considere um experimento aleatório no qual uma moeda é lançada 3 vezes. Seja

o número de caras, o nº de caras e o nº de coroas. O espaço amostral para este
experimento será: .
76
Assim, os possíveis valores de (número de caras) serão: . Da
definição de uma variável aleatória , neste experimento, é uma variável aleatória
discreta. Seus valores são resultados de uma contagem.
Amigo aluno!
Repare que: variável aleatória é uma associação de pontos no espaço amostral

com pontos na recta dos números reais . Na realidade, uma variável
aleatória é definida através de uma função em que o domínio é o conjunto de
todos os resultados possíveis do experimento e a imagem é o conjunto de todos os
valores assumidos pela variável aleatória. Note que, a variável aleatória não é
resultado do experimento, mas sim um valor a ele associado.
3.8.2 Variáveis Aleatórias Discretas
Chama-se Variável Aleatória Discreta (VAD) a qualquer variável aleatória em que

varia de maneira descontínua no seu domínio enumerável.
Para facilitar a compreensão, consideram-se apenas varáveis descontínuas aquelas

que tomam unicamente valores inteiros ou nulos.
Exemplo 3.2: Um par de dados é lançado. Observemos o espaço finito equiprovável

constituído por 36 pares ordenados em números entre 1 a 6. Escreve os elementos da
variável aleatória no domínio que associa o maior numero em cada ponto do
espaço.
Resoluçao: o numero dos elementos no espaço amostral e obtido pelo produto

(teorema fundamental de contagem). E o espaço amostral será:
Variável associa o ponto ao ou o maior numero em cada ponto e

seu espaco amostral será dado por
Como varia num espaço finito, para várias experiências repetidas, a cada um dos
valores de que pode tomar a variável aleatória , corresponde a uma probabilidade
:
77
3.8.1 Função ou Lei de Distribuição das Probabilidades
Diz-se que está definida uma Lei de Distribuição das Probabilidades (ou Função
Redistribuição de Probabilidades - FRP) de uma variável aleatória se existe
correspondência entre todos os valores possíveis de e as suas respectivas
probabilidades , e é, usualmente, dada na forma de uma tabela.
…
…
Exemplo 3.3: Uma empresa comercializa garrafas de vinho verde de 1 litro. Supõe-se
que 40% dessas garrafas na realidade contém uma menor quantidade de líquido do
que o indicado no rótulo. Tendo comprado 6 dessas garrafas, qual é a probabilidade
de:
a. Duas delas conterem menos de um litro?
b. No máximo duas conterem menos de um litro?
c. Pelo menos duas conterem menos de um litro?
d. Todas conterem menos de um litro?
e. Todas conterem o volume indicado no rótulo?
f. Represente a lei das probabilidades numa tabela.
Resolução: Seja o número de garrafas que contém menos de um litro:

Tomando , o acontecimento sucesso “garrafas que tem
volume menor que um litro” e , o insucesso. As probabilidades podem ser
calculadas pela fórmula de Bernoulli:
a)
b)
c)
d)
e)
f) Para escrever a lei de distribuição de probabilidades é necessário conhecer as
probabilidades :
78
A lei pedida é:
0 1 2 3 4 5 6
0.0467 0.1866 0.3110 0.2765 0.1382 0.0369 0.0041
As probabilidades calculadas e contidas na lei de distribuição gozam de todas as

propriedades das distribuiçoes de frequências relativas, i.é, dada uma lei num espaço
finito ou infinito com as probabilidades , a soma de todas probabilidades
é igual à unidade:
A lei de distribuição de uma variável aleatória discreta pode ser representada

graficamente, marcando num referencial cartesiano, os pontos
, e reunindo-os em seguida, mediante segmentos de recta.
Estes pontos fornecem o chamado Polígono de Distribuição.
Exemplo 3.4: Construir o polígono de distribuição das probabilidades da variável

aleatória dada pela lei:
1 3 6 8
0.2 0.1 0.4 0.3
79
O comportamento de uma variável aleatória discreta numa lei de distribuição de
probilidades é definido pela sua função massa de probabilidade (f.m.p) que,
simplesmente, associa uma probalidade a cada valor que a variável possa
assumir. Deve-se notar que, três propriedades fundamentais das propabilidades são
também aqui válidas.
Propriedades 1:
Propriedades 2:
Propriedades 3:
Exemplo 3.5: Abaixo te é dado(a) a lei de distribuição de uma variável aleatória

discreta , então represente a sua função massa de probabilidades num diagrama de
barras.
3.8.2 Função de Distribuição Acumulada
Outra forma de apresentar a lei de distribuição de probabilidades de uma variável

aleatória discreta é através da sua função de distribuição acumulada de
probabilidades (f.d.a) ou função de partiçao das probabilidades:
80
Propriedades da função de distribuição acumulada
Propriedade 1: OS valores de estão no intervalo de 0 à 1:

Propriedade 2: A funcão é crescente em escadas, i.é:
Propriedade 3: Se o domínio de é o intervalo [a, b] então:

para
para
Exemplo 3.6: Dada a lei de distribuição de uma variável aleatória , escrever a sua
função de distribuição acumulada das probabilidades.
1 3 5 7
0.25 0.25 0.40 0.15
Resolução: A função procurada é obtida somando as probabilidades segundo a

definição e as propriedades acima indicadas.
81
LIÇÃO N° 9
Características Numéricas das Variáveis Aleatórias Discretas
1. Entender o conceito esperança matemática;

2. Entender as propriedades da esperança matemática e da variância;
82
3.9.3 Características Numéricas das Variáveis Aleatórias Discretas
Chama-se esperança matemática ou valor esperado de uma variável aleatória

discreta a soma dos produtos dos valores que a variável aleatória pode assumir
pelas probabilidades associadas a estes valores.
Se a variável aleatória, se caracteriza por uma serie finita de valores, então a

esperança matemática se determina pela fórmula:
Como
Então
Desta definição, pode-se notar que é a medida aritmética ponderada dos valores
da variável aleatória: para os pesos que correspondem as
frequências relativas.
Exemplo 3.7: Um jogador lança duas moedas honestas. Ele ganha 200 contos se
ocorrem duas caras e 100 contos se ocorre uma cara, por outro lado, ele perde 300
contos se não ocorrer nenhuma cara. Pede-se para:
a) Escrever a lei de distribuição das probabilidades desde jogo.
b) Determinar o valor esperado do jogo e dizer se ele é favorável ao jogador.
Resolução:
O espaço amostral deste jogo tem 4 possibilidades:
Sendo cara e coroa.
a) Do espaço S, as probabilidades de sair duas caras, uma cara e nenhuma cara
são:
A lei de distribuição das probabilidades procurada é
Número de caras
0 0,25
1 0,50
2 0,25
b) contos.
83
O valor esperado do jogo é de 25 contos e é favorável ao jogador.
Propriedades da esperança matemática
Propriedade 1: ; onde é constante

Propriedade 2: ; é constante e é uma v.a.d.
Propriedade 3: ; e são constantes e é uma v.a.d.
Propriedade 4: e e são v.a.d.
Propriedade 5: ; e Y são v.a.d.
Por exemplo, encontrar a esperança matemática de variável aleatória z que se

expressa através das variáveis e cujas médias são conhecidas: ;
e
Resolução:
Chama-se variância de uma variável aleatória , a esperança matemática do quadrado

do desvio desta variável em relação a sua esperança matemática.
ou melhor
O cálculo da variância pode ser realizado comodamente pela fórmula:
O valor da variância de uma variável aleatória , caracteriza o grau de dispersão desta

variável em relação a sua esperança matemática.
Denomina-se desvio padrão ou desvio médio quadrático de uma variável aleatória ,a

raiz quadrada da respectiva variância.
Exemplo 3.8: A variável aleatória , se caracteriza pela seguinte lei de distribuição das
probabilidades.
84
a) Determinar a esperança matemática, variância e desvio padrão.
Resolução:
Vamos colocar os valores numa tabela, e verificarmos o procedimento de cálculos
0 0,20 0,00 -1,32 0,348480 0,00
1 0,40 0,40 -0,32 0,040960 0,40
2 0,30 0,60 +,68 0,138720 1,20
3 0,08 0,24 +1,68 0,225792 0,72
4 0,02 0,08 +2,68 0,143648 0,32
1,00 1,32 - 0,897600 2,64
Esperança matemática:
Variância:
Desvio padrão:
Propriedades da variância
1. Variância de uma constante:

2. Variância de um produto entre uma constante e uma variável:
3. Variância da soma de uma constante e uma variável
4. Variância de uma soma entre duas variáveis aleatórias:
5. Variância de uma diferença entre duas variáveis aleatórias:
85
LIÇÃO N° 10
VARIÁVEIS ALEATÓRIAS CONTÍNUAS
1. Descrever variaveis contínuas;

2. Caracterizar a função de distrbuição acumulada;
3. Entender as propriedades da função de distribuição;
4. Entender o conceito de função de densidade de probabilidades e suas
propriedades;
86
3.10.1 Conceito de Variável Aleatória Contínua
Diz-se que uma variável aleatória é contínua, quando ela pode tomar qualquer valor
real pertencente a um intervalo dado de forma contínua, por exemplo, no intervalo
.
A título de exemplo, vejamos, o peso de um individuo retirado ao acaso de uma dada

população, que é uma variável aleatória contínua que só pode tomar valores positivos.
Seja , a variável aleatória que indica a temperatura máxima diária em Tete. Possíveis
valores são entre - , por exemplo, 36.1573 (contínua), pois resulta de uma
medição, pelo que, estamos na presença de uma Variável Aleatória Contínua (VAC).
3.10.2 Função de distribuição acumulada
É possível, em certos casos, determinar as probabilidades de observar um valor

compreendido num intervalo dado
Em geral, esta probabilidade tende para zero quando o acréscimo da variável tende
para zero , i.é, a probabilidade de uma variável aleatória contínua (v.a.c.) obter
exactamente um valor é nula. Daí que, podemos concluir que a noção de distribuição
de probabilidades deixa de ter sentido para uma variável contínua. Porém, a função de
distribuição conserva todo o seu significado.
Denomina-se função de distribuição acumulada (f.d.a) de uma variável aleatória

contínua a função que a cada faz corresponder a probabilidade de que
assuma um valor estritamente inferior a este .
Deve-se notar que para v.a.c, a função de distribuição ou de partição poderá ter
expressões em em alguns intervalos de seu domínio.
Propriedades da função de distribuição
87
Propriedade 1: Os valores de pertencem ao intervalo
Propriedade 2: A função de distribuição , é crescente: se
Corolário 2.1: A probabilidade de que uma v.a.c assuma um valor num intervalo
é igual ao acréscimo da função de distribuição de neste intervalo.
Corolário 2.2: A probabilidade de que uma v.a.c. assuma um valor é nula:

.
Propreidade 3: Se o domínio de uma variável estiver compreendido num intervalo

, então, a função de distribuição dessa variável satisfaz as relações:
para ou
para ou
Exemplo 3.9: Dada a função de distribuição da variável aleatória a saber:
Achar a probabilidade de que assuma um valor:
a) Inferior à 0.2 ;
b) Inferior à 3;
c) Igual ou superior a 3;
d) Igual ou superior a 5;
Resolução:
Tendo em conta as propriedades da função temos:
a) Para tem-se que , em particular , onde .

b) Como 3 está no intervalo ]2;4], então,
c) Os acontecimentos são complementares, o que significa:
tendo em conta que , então
88
d) Para acontecimentos complementares , e para ,
cumpre-se que , então obtemos:
3.10.3 Função Densidade de Probabilidade
O cálculo de probabilidades para uma variável contínua é observado para um intervalo

dado
Por outro lado, se a função de distribuição pode ser expressa sob forma analítica
e se for derivável, então:
O quociente entre a variação da função e a variação do argumento , quando

tende a função , chamada função densidade de probabilidades
ou simplesmente densidade de probabilidade
Denomina-se densidade de probabilidade de uma , a primeira derivada da

sua função de distribuição .
A função constitui uma forma idealizada da frequência unitária ou densidade de

frequência, uma vez que é definida a partir do quociente de função massa de
probabilidades relativa a um intervalo dado pelo comprimento desse intervalo.
A probabilidade é expressa através da função densidade de probabilidade da forma

seguinte.
Da fórmula anterior pode-se concluir que, se é conhecida a densidade de probabilidade

, a função de distribuição acumulada é encontrada pela fórmula:
89
A probabilidade aqui calculada, tomando como uma função contínua, representa
uma área limitada pelo gráfico da função pelo eixo e pelos limites inferior e
superior do intervalo dado. Vejamos as figuras:
f(x)
f(x)
a b
Propriedades da função densidade de probabilidades
Naturalmente, sendo proporcional a probabilidade, as três propriedades

fundamentais são mantidas.
Propriedade1: A função densidade de probabilidade é sempre positiva.
Propriedade2: A área total limitada pela função densidade de probabilidade e pelo eixo
é igual a unidade ou 100%.
Propriedade 3: A probabilidade de que uma variável aleatória contínua assuma um

valor no intervalo é dada pela fórmula de Newton – Leibniz.
De um modo geral, o conjunto dos valores admissíveis para uma v.a.c e a função
correspondente definem uma distribuição teórica contínua, que é uma forma idealizada
das distribuições observadas agrupadas e relativas a variáveis contínuas.
Rigorosamente, quando o número de classe aumenta, o polígono de distribuição de
90
frequências acumuladas aproxima-se a uma linha cuja equação é a função de
distribuição.
Exemplo 3.10: Seja uma variável aleatória contínua com a seguinte função
densidade de probabilidade:
a) Construa a sua função de distribuição das probabilidades.

b) Calcule a probabilidade de que x assuma um valor no intervalo
Resolução:
a) Pelas propriedades da função temos:
Para
Para
Para
Logo, a função de distribuição é:
Exemplo 3.11: Uma variável aleatória contínua tem a seguinte função densidade de
probabilidade:
a) Determine o valor de constante .

b) Encontre a função de partição para os intervalos indicados.
91
Resolução:
a) Da propriedade 2 da função densidade de probabilidades temos que:

então,
b) Vamos usar as propriedades da função :
Para
Para
Para
92
LIÇÃO N° 11
CARACTERÍSTICAS NUMÉRICAS DAS VARIÁVEIS ALEATÓRIAS

CONTÍNUAS
1. Descrever as características das variáveis contínuas;

2. Saber calcular as características das variáveis contínuas;
93
3.11 Características Numéricas das Variáveis Aleatórias Contínuas
Denomina-se esperança matemática de uma v.a.c. de domínio compreendido no eixo

o número:
Note que: o sinal do somatório dá lugar a um sinal de integração e a

probabilidade dá lugar ao elemento de probabilidade .
Se o domínio é um intervalo os limites de integraçao serão substituídos por
Se for uma função de argumento aleatório então:
Se o gráfico de for simétrico em relação a recta .
Todas as propriedades da consideradas para vaiáveis aleatórias discretas são

também válidas para variáveis aleatórias contínuas.
Denomina-se moda de uma variável aleatória contínua ao ponto , no qual a

densidade de probabilidade assume seu valor máximo.
Denomina-se mediana de uma variável aleatória contínua ao ponto , definido

pela condição,
na qual passando uma variável pela mediana, divide a figura compreendida sob o
gráfico de em duas partes iguais.
Denomina-se variância de uma variável aleatória contínua , que assume valores no

eixo para um intervalo dado , o número:
94
Todas as propriedades da variância mencionadas para as variáveis aleatórias discretas
são válidas para as variáveis aleatórias contínuas.
O desvio padrão de uma variável aleatória contínua é definido, no caso discreto, como
sendo:
Exemplo 3.12: Seja X uma variável aleatória contínua com função de densidade de
probabilidades seguinte:
Calcule as seguintes características numéricas: .
a) Esperança:
b) Variância:
c) Desvio padrão:
95
Texto 1
Lisboa, 2001.
Capítulo III: De p.89 à p.140;
96
UNIDADE TEMÁTICA IV
DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS
1. Descrever distribuições discretas;
2. Caracterizar as distribuições Binomial e de Poisson;
3. Descrever as distribuições contínuas;
4. Descrever e entender a distribuição uniforme;
5. Caracterizar as distribuições exponencial, normal e normal padrão;
6. Definir a função distribuição acumulada;
7. Resolver problemas de probabilidade usando distribuição normal
padronizada;
8. Descrever aproximações de distribuição binomial para de poisson e normal;
97
LIÇÃO N° 12
DISTRIBUIÇÃO DE VARIÁVEIS ALEATÓRIAS DISCRETAS
1. Descrever distribuições discretas;

2. Caracterizar as distribuições Binomial e de Poisson;
98
4.12 Introdução
Na unidade temática anterior estudamos o conceito de probabilidade. Nosso objectivo,

foi calcular a probabilidade de um evento. Nesta unidade continuaremos a tratar de
probabilidade examinando os conceitos de variáveis aleatórias e distribuição de
probabilidade. Variável aleatória é uma variável que resulta de um evento aleatório.
Suponha que jogamos uma moeda três vezes e contamos o número de caras obtidas.
Os possíveis resultados são 0, 1, 2 ou 3 caras.
A variável aleatória é o número de caras que ocorrem (representa o número de caras

que podem ocorrer), e os possíveis resultados são os valores da variável aleatória.
Uma distribuição de probabilidade é uma apresentação de todos os resultados
possíveis de um experimento com a probabilidade de cada um dos resultados. A partir
do estudo da unidade anterior podemos determinar que a probabilidade de: (a) obter
nenhuma cara após lançar três vezes uma moeda é 1/8; (a) obter apenas uma cara é
3/8; (3) obter duas caras é 3/8 e a de obter três caras é 1/8. A esta lista de resultados
possíveis de um experimento e também das probabilidades associadas a cada um dos
resultados dá-se o nome de Distribuição de Probabilidade.
Exemplo 4.1: Consideremos lançamentos sucessivos de um dado. Cada vez que o

dado é lançado, seis possíveis resultados podem ocorrer 1, 2, 3, 4, 5 ou 6. Isto significa
que a nossa variável aleatória pode tomar um dos seis resultados, em que todos
possuem a mesma probabilidade
4.12.1 Distribuições de Variáveis Aleatórias Discretas
Neste ponto, destinado à distribuições de VAD, vamos abordar dois tipos de

distribuição, nomeadamente: Distribuição Binomial e Distribuição de Poisson.
4.12.1.1 Distribuição Binomial
Trata-se de uma distribuição de probabilidades adequada aos experimentos que

apresentam apenas dois resultados (sucesso ou fracasso). Diz-se que uma variável
aleatória discreta , tem distribuição binominal ou obedece a lei da distribuição
binominal com parâmetros e , quando ela pode tomar valores discretos de
E os níveis de probabilidade podem ser calculados pela formula de Bernoulli:
;
99
Função - é a função de distribuição de probabilidades. A distribuição
Binominal é interpretada como sendo a distribuição do número de x sucesso “ ”, ou
fracasso , em uma série de provas independentes de um experimento
aleatório.
Para entendermos melhor o que é uma distribuição binomial, que tal, resolvermos juntos o
problema a seguir de uma família? Presta atenção à questão colocada e aos passos de resolução:
Exemplo 4.2: Uma família tem 3 crianças. Se a probabilidade de uma criança ser
menino for 0.5 , encontrar a probabilidade de existir exactamente 2 meninos na família.
Resolução: Dados: ; ;
Já que cada nascimento de uma criança é um acontecimento independente, e se este

se repetir 3 vezes, consideremos sucesso, o nascimento de um menino, e fracasso, o
nascimento de uma menina. Então,
Se considerarmos e como constantes, variarmos de 0 até e calcularmos as

respectivas probabilidades , obteremos uma lei de distribuição das probabilidades
do número de sucesso . Tabela 4.1:
Aqui está a tabela da lei de distribuição das probabilidades para a questão do exemplo 4.2
0 1 2 3 …
Não só é importante saber o que é uma distribuição binomial mas também é necessário
compreender como ela se comporta. Estamos para falar das suas propriedades.
Propriedades da Distribuição Binominal
1. Média ou Esperança Matemática:

2. Variância:
3. Desvio padrão:
Veja este exemplo (4.3): Um estudante tem 60% de probabilidade de obter positiva
sempre que realiza um teste. Se o estudante realizar 3 testes, calcule a probabilidade
de ele obter:
a) Exactamente duas positivas.
100
b) Pelo menos uma positiva.
c) No máximo duas positivas.
d) Escreva a lei de distribuição das probabilidades dos números de positivas que o
estudante possa obter.
e) Calcule a média e a variância da distribuição.
Resolução:
Dados:
a)
b)
=0,288+0,432+0,216=0,936
c) A lei de distribuição procurada é:
Tabela 4.2:
a) Média: Variância e
desavio padrão:
4.12.1.2 Distribuição de Poisson
Em muitos casos, conhece-se o número de sucessos, porém, se torna difícil, e as

vezes sem sentido, determinar o número de fracassos ou o número total das provas.
Por exemplo, podemos contar o número de automóveis que podem passar numa
esquina em um determinado intervalo de tempo, porém, não podemos determinar o
número de carros que deixaram de passar pela esquina. Situações como esta,
sugerem uma variável que depende do tempo , e quando , a probabilidade de
realização do evento tende a diminuir. Para encontrar a probabilidade de realização de
sucesso num intervalo de tempo, e se, simultaneamente, o número de provas for
grande e a probabilidade de realização de cada acontecimento for muito pequena,
devemos usar a distribuição de Poisson que substitui a distribuição Binominal.
101
é o número de sucesso do acontecimento em n
provas independentes. De salientar que x pode assumir valores inteiros: x
= 0, 1, 2,…
é o número médio de ocorrências com sucesso.
- é a base do logarítmo natural: “e” = 2.71828128.
Distribuição de Poisson é interpretada como o limite que tende para a Distribuição

Binominal com o parâmetro e , quando cresce e p decresce de tal forma que o
produto se mantêm constante.
Propriedades da Distribuição de Poisson
1. Média ou esperança matemática

2. Variância
3. Desvio padrão
Exemplo 4.4: A probabilidade de sair defeituoso um exemplar numa fábrica de livros é

0.001. Achar a probabilidade de que numa tiragem de 10000 livros, exactamente 5
destes saiam defeituosos.
Resolução:
Dados
Livros
Exemplo 4.5: Certo posto de bombeiros recebe em média 3 chamadas por 3 dia.
Calcular a probabilidade de:
a) Receber 4 chamadas num dia.
b) Receber 3 ou mais chamadas num dia.
c) Encontre o desvio padrão do número das chamadas que
o posto possa receber num dia.
Resolução:
Dados:
a)
102
b)
c)
A Distribuição de Poisson tem uma boa aproximação à distribuição Binominal para

pequeno, desde que seja também pequeno. Esta aproximação é ilustrada na tabela
abaixo, para
Tabela 4.3:
0 1 2 3 4 5
0.366 0.370 0.185 0.0610 0.0149 0.0029
0.366 0.368 0.184 0.0613 0.0153 0.0031
A importância da Distribuição de Poisson decorre pelo facto dela constituir uma boa
aproximação para processos de eventos aleatórios. Assim, ela serve de um modelo
bastante utilizado para a análise do número de chamadas telefónicas num terminal,
números de erros tipográficas na página de um livro, números de cheias observadas
em certo intervalo de tempo, número de acidentes industriais, número de chegadas em
modelos de filas de espera, etc.
103
Esta leitura é importante para que consiga aprender e entender os conceitos

Distribuição Hiper geometrica, Multinomial e enriquecer outros conceitos de
distribuições discretas
Texto 1
Webster, Allen L. Estatística Aplicada à Administracao e Economia. São Paulo:
McGraw-Hill, 2006.
Ler este livro capitulo 5 de pagina 109 a pagina 110.
Texto 2
Lisboa, 2001.
O capitulo IV: De pagina 161 a pagina 216;
104
LIÇÃO N° 13
DISTRIBUIÇAO DE VARIAVEIS ALEATORIAS CONTÍNUAS
1. Descrever as distribuições contínuas;Descrever e entender a distribuição

uniforme;
2. Caracterizar as distribuições exponencial, normal e normal padrão;
105
4.13 Distribuições de Variáveis Aleatórias Contínuas
Neste parágrafo, serão apresentados os principais modelos de distribuições de

variáveis aleatórias contínuas como, por exemplo, a distribuição uniforme, exponencial
e normal.
4.13.1 Distribuição Uniforme ou Rectangular
A distribuição uniforme é valida para situações nas quais as probabilidades de todos os

sucessos são iguais. E, diz-se que uma variável é, uniformemente, distribuída se a sua
função densidade de probabilidade permanecer constante num intervalo .
A sua função de distribuição acumulada é:
Os gráficos da função densidade de probabilidades e da função de distribuição

acumulada são ilustrados a seguir:
Função densidade de probabilidade Função de distribuição acumulada
1,0 a b
106
Figura 4.1: Função densidade de probabilidade é função de distribuição acumulada de
distribuição uniforme.
Probabilidade da distribuição
1) Média ou Esperança Matemática é:
2) Variância:
3) Desvio padrão:
Exemplo 4.6: Um ponto escolhido ao acaso no segmento de recta Qual será a

probabilidade de que o ponto escolhido esteja entre 1 e 3/2.
Resolução:
Seja , uma variável que representa um ponto no segmento A função densidade
da variável é dada por se , caso
contrário, , então, pode-se escrever:
Como 1 e 3/2 pertencem ao intervalo a probabilidade será:
Se a função de distribuição é conhecida, a probabilidade pode ser calculada passando

directamente pela função primitiva de
De onde
Exemplo 4.7: O intervalo do tempo de duração de pequenos anúncios publicitários é

estimado entre 5 e 12 minutos. Admitindo que a duração de cada anúncio é aleatória e
todos os anúncios distribuem-se uniformemente no intervalo indicado:
a) Indique a função de distribuição das probabilidades;
107
b) Escreva a função de distribuições acumuladas das
probabilidades;
c) Qual é a probabilidade de um anúncio ter uma duração
inferior a 8 minutos, e de ter entre 8 e 10 minutos.
d) Calcule a duração média dos anúncios.
Resolução:
a) Substituindo na fórmula geral de os valores de e

temos:
b) A função de distribuição correspondente é:
c)
d)
4.13.2 Distribuição Exponencial
A distribuição de probabilidade de intervalo de tempo , entre dois sucessos

consecutivos, de uma lei de Poisson e a Distribuição Exponencial. A sua função
densidade é dada por:
Partindo da função densidade de probabilidade pode-se obter a função de distribuição

acumulada
108
A probabilidade de que uma variável aleatória contínua , cuja função densidade de
probabilidade é dada pela distribuição exponencial, assuma um valor num intervalo
é igual a:
Os gráficos correspondentes à função densidade e a função de distribuição acumulada

são:
Função densidade de probabilidade Função de distribuição acumulada
F(x) F(x)
1.0 1.0
0.5
0.5
0.0 0.0
Variável x Variável x
Figura 4.2: Função densidade de probabilidade e função acumulada da distribuição

exponencial.
Probabilidade da distribuição exponencial

1. Média ou Esperança Matemática:
2. Variância:
Desvio padrão:
Exemplo 4.8: O tempo de espera em minutos numa paragem de autocarros, obedece
a distribuição exponencial com . Considere o tempo de espera como um processo
aleatório e responda às alíneas seguintes:
a) Obtenha a função de distribuição acumulada da variável
;
b) Determine a média e o desvio padrão;
c) Qual é a probabilidade de que assuma um valor entre
0.6 e 2 ?;
Resolução:
109
a)
b)
c)
4.13.3 Distribuição Normal
A distribuição normal é um dos mais importantes de uma distribuição contínua em

estatística. Pois, muitas variáveis quantitativas em ciências são comparadas com a
distribuição normal, por exemplo: altura de um indivíduo, peso, grau de coeficiente
inteligência, resultados de exames, etc. Esta distribuição é também conhecida como
distribuição de Gauss - Laplace ou Laplace - Gauss.
Uma variável aleatória contínua, diz-se que, é normalmente distribuída se a sua função
densidade de probabilidade é definida pela seguinte expressão:
Onde: média da distribuição desvio padrão da distribuição

2.71821828
valores de z
A figura 4.3 curva da distribuição
4.13.4 Distribuição Normal Padrão
110
Se a variável normal com média e variância , for expressa em unidade reduzidas
(escores reduzidos), através da variável , onde pode-se mostrar que é
também normal com média E(z) = 0 e variância (z)=1.
Logo, a função densidade de probabilidade será:
Cada valor da função corresponde ao cumprimento entre função densidade e o

eixo .
Por se tratar da média de cumprimento, os valores da função são sempre positivos, e

diz-se que é par, daí que
Como a média de z é 0, a variância é 1, as probabilidades (áreas) sob são

calculadas e tabeladas. Nos próximos exemplos, explicaremos o uso da tabela de
distribuição normal padrão.
Para se anotar as distribuições normais usa-se:
Lê-se: “a variável aleatória tem distribuição normal com média e

variância ”.
- Lê-se: “a variável aleatória tem distribuição normal com média 0 e

variância 1”, ou simplesmente, distribuição normal padrão.
Propriedades da distribuição normal
Propriedade 1. Média ou Esperança Matemática: (x)=

Propriedade 2. Variância:
propriedade 3. Desvio padrão:
Propriedade 4. é simétrico em relação à origem; o é simétrico em
relação à origem ,
111
Figura 4.4: Simetria da curva normal e a ordenada máxima da função
Propriedade 5. possui um máximo para possui um máximo para

neste caso, sua ordenada vale = 0.3989.
Propriedade 6. tende a zero quando tende para ou O mesmo acontece

para quando , isto é, ou são assímptotas de ou .
Propriedade 7. A área sob a curva normal entre e , corresponde

aproximadamente a 63.3%, a outra entre corresponde
aproximadamente a 95.4%, e a outra entre corresponde a
aproximadamente a 99.7 %, da área total, respectivamente.
112
LIÇÃO N° 14
Função de distribuição acumulada das probabilidades
1. Definir a função distribuição acumulada;

2. Resolver problemas de probabilidade usando distribuição normal
padronizada;
3. Descrever aproximações de distribuição binomial para de poisson e normal;
4. Descrever aproximação de distribuição de poisson para normal;
113
4.14 Função de distribuição acumulada das probabilidades
A função de distribuição acumulada da variável aleatória normalmente distribuída é

dada pela expressão:
Quando é expresso em unidades reduzidas, a função de distribuição acumulada será:
A função é usada para o cálculo de probabilidade através de tabelas que

oferecem as áreas (probabilidades) sob a curva normal padrão. A tabela que será
usada neste manual é a tabela de faixa central. A tabela de faixa central dá a área sob
a curva normal padrão entre e qualquer valor positivo de . A simetria em torno
de permite obter a área entre quaisquer valores positivos ou negativos. Assim,
consideram-se os casos:
Caso 1: A probabilidade de que uma variável aleatória normal , assuma um valor no

intervalo é dada pela fórmula de Newton – Leibniz:
.
Onde são valores em escores reduzidas.
Os valores da função de Laplace são tabelados:
Para , usa-se a aproximação Os valores de consultam-se na
tabela.
Exemplo 4.9: Calcular a probabilidade de que um valor esteja no intervalo
Resolução:
114
Caso 2: A probabilidade de que uma variável aleatória normal , assuma um valor no
intervalo sendo e valores não padronizados é dada pela fórmula.
P( )
onde:
Exemplo 4.10: O salário semanal dos operários industriais é distribuído normalmente

em torno de uma média de 180 cts com desvio padrão de 25 cts.
a) Encontre a probabilidade de um operário ter um salário semanal situado entre
150 cts e 178 cts.
b) Dentro de que desvios de ambos os lados da média cairão 96% dos salários.
Resolução:
Dados:
a) Vamos primeiro calcular os escores reduzidos e
b) P( ) então
Para uma distribuição simétrica: onde Da

tabela de distribuição normal padrão .
Usando a transformação temos:
O intervalo simétrico procurado é de 128.75
Caso 3: se o , isto é, estiver a esquerda do zero

e se
Exemplo 4.11: As alturas dos alunos de determinada escola são normalmente

distribuídas com média 1.60 m e desvio padrão 0.30 m. Encontre a probabilidade de
um aluno medir menos de 1.48 m.
115
Resolução:
Dados:
Comecemos por encontrar o valor correspondente de :
-3 -2 -1 -0,4 0 1 2 3
Caso 4:
Exemplo 4.12: Calcule a probabilidade de que assuma valor maior que -1.38.
Resolução:
P( )
-3 -2 -1 0 1 2 3
116
4.14.1 Aproximação entre Distribuições
4.14.1.1 Aproximação da Distribuição Binomial para a Distribuição de Poisson
A distribuição Binomial com parâmetros e , pode se aproximar a distribuição de

Poisson com parâmetros , se n é muito grande e se for muito
pequeno .
A aproximação é tanto maior quanto maior for o numero das observações
independentes n ou quando n e a probabilidade p
Exemplo 4.13: Um contentor contém 500 caixas de latas de sardinha. A probabilidade

de tirar num dos contentores uma caixa com latas fora do prazo é de 0.002. Calcular
probabilidade de tirar exactamente do contentor 2 caixas com latas fora do prazo.
a) Usando a distribuição Binominal.
b) Usando a distribuição de Poisson.
Resolução:
Dados:
a) , então:
b)
4.14.1.2 Aproximação da Distribuição Binominal Para a Distribuição Normal
Quando a probabilidade de ocorrência de um sucesso é igual a de fracasso na

distribuição Binominal, a distribuição dessa probabilidade pode ser aproximada à
distribuição Normal.
Uma vantagem prática desta aproximação é a redução de cálculos muito cansativos a
realizar no modelo Binominal.
Se e então pode se admitir aproximadamente que X N(np;npq).

Onde: e com .
Exemplo 4.14: Calcule a probabilidade de obter entre 4 e 7 caras em 12 lançamentos

de uma moeda: (a) Usando a Distribuição Binominal. (b) usando a Aproximação
Normal.
117
Resolução:
a) Consideremos sucesso o número de caras k obtidas no lançamento, então:
onde n : ;
.
Para o nosso caso:
b) Usando a aproximação normal temos:
; para
A média e a variância são: Logo:
. Então: .
Como estamos a aproximar a distribuição de uma variável discreta par à uma variável
contínua, é necessário corrigir os limites do intervalo de classe das probabilidades,
transformando-os para contínuos.
4.14.1.3 Aproximação da Distribuição de Poisson à Distribuição Normal
Para variáveis discretas com distribuição de Poisson, grande e a distribuição de

será aproximadamente normal com parâmetros: e ou .
Geralmente para obter uma melhor aproximação é necessário que seja maior que 20.
Exemplo 4.15: A desintegração radioactiva se realiza em quantidades que seguem a

distribuição de Poisson com média de 25 segundos por quantidade. Calcule a
probabilidade de que a quantidade desintegrada esteja no intervalo entre 23 e 27.
a) Usando a distribuição de Poisson.
b) Usando a aproximação normal.
Resolução:
, precisa-se que:
a) P( )
118
b) Usando aproximação normal: ,
. Os valores correspondentes de e
são e .
Substituindo os escores reduzidos na anterior temos:
O quadro seguinte apresenta restrições em relação aos parâmetros usados nas

distribuições que devem ser observadas, se usarmos as aproximações.
Tabela 4.4:
Distribuição Condições dos Aproximação
Parâmetros
ou
ou
119
A partir da leitura destes livros, que chamamos por leitura complementar, o nosso
maior objectivo é que você possa conhecer outros enfoques dados aos temas
estudados, ao longo desta unidade, que contribuirão para enriquecer e dar subsídios
para a sua formação nesta area.
Atenção, evite ler os textos apenas para responder aos exercícios. A leitura enriquece
e facilita o seu entendimento global do conteúdo desenvolvido.
Texto 1
Lisboa, 2001.
O capitulo IV: De pagina 161 a pagina 243;
Texto 2
McGraw-Hill, 2006.
Também podes ler este livro, capítulo V, de p.103 à p.129.
Nota: A leitura do livro do Allen Webster neste caso é obrigatória para puderes
aprofundar os teus conhecimentos sobre Distribuição Normal.
120
UNIDADE TEMÁTICA V
TEORIA ELEMENTAR DE AMOSTRAGEM
Ao fim desta unidade, o aluno deve ser capaz de:
1. Precisar o conceito de amostra aleatoria;
2. Caracterizar as várias formas de amostragem;
3. Determinar o tamanho da amstra;
4. Caracterizar distribuições amostrais;
121
LIÇÃO N° 15
Introdução a Teoria Elementar de Amostragem
1. Explicar o conceito de amostra aleatória;

2. Distinguir amostragem com reposição da sem reposição;
122
5.15 Introdução
De um modo geral, quando é impossivel obter informação de todos os elementos que

formam parte de uma população que se deseja estudar, porque o número dos
elementos a estudar é demasiado grande ou porque os custos são muito elevados, etc.
Estas e outras razões obrigam-nos muitas vezes a trabalhar com uma parte dos
elementos que compõem a população (amostra). Primeiro, vamos recordar os
conceitos de população, amostra e unidade estatística.
a) Universo ou População - é o conjunto de todos elementos que apresentam uma

determinada caracteristica em comum, a qual constitui o objecto de estudo.
b) Unidade Estatística - é cada elemento da população por estudar. É praticamente o

objecto onde são procurados todos os detalhes da variável ou fenómeno por estudar.
c) Amostra - é todo o conjunto não vazio e com menor número de elementos em

relação a população. Em relação ao tamanho da amostra são possíveis duas
situações: se , diz-se que a amostra é pequena, caso contrário, quando
diz-se que a amostra é grande.
Recordemos tambem o cenceito de amostra aleatória: dada uma população

caracterizada por uma variável aleatória , amostra aleatória é um conjunto
de variáveis aleatórias independentes e igualmente distribuidas, com a mesma
distribuição que a da variável aleatória .
Se todos os elementos de uma população fossem idênticos, não havia necessidade de

seleccionar uma amostra, bastaria estudar somente um deles para conhecer as
características de toda população.
d) Amostragem - é o processo de extrair amostras ou seleccionar da população os

elementos que devem pertencer a amostra.
Existem principalmente três tipos de problemas que interessam ao pesquisador

resolver, mediante o estudo de uma ou mais amostras:
1. O primeiro problema, consiste em estimar os parâmetros da população a partir

do conhecimento das estatísticas de uma amostra.
- São consideradas estatísticas ou medidas amostrais, todas as características
descritivas como a média ( ), desvio padrão ( ), coeficiente de correlação ( ),
proporção ( ), etc, calculadas a partir de uma amostra.
123
- São considerados parâmetros populacionais os valores característicos de uma
população: a média ( ), desvio padrão ( ), coeficiente de correlação ( ),
proporção ( ), etc.
2. O sengundo problema, consiste em determinar se a amostra de uma estatística

conhecida provém de uma população da qual os parâmetros também são
conhecidos. Neste problema, a resulução consiste em comparar os parâmetros
populacionais com as respectivas estatísticas.
3. O terceiro, último problema, consiste em procurar saber a partir de duas

estatísticas se as amostras correspondentes provém de uma mesma população.
A teoria de amostragem hoje em dia é utilizada em quase todas áreas de investigação

desde o tratamento dos fenómenos demográficos, dados na agricultura, na indústria e
comércio, medicina, psicologia até na educação e pesquisas de opinião realizadas
pelos meios de comunicação social, etc.
Porquê usamos amostras?
1. Porque existem populações infinitas;

2. Quando a população tao grande, que para fins praticos, podemos considera-la
infinita;
3. Economicamente, a amostra e menos dispendiosa e facil de controlar por ter
poucas unidades;
4. Porque o tempo e escasso, a informacao pode variar se transcorrer muito tempo
entre o primeiro e o ultimo elemento a ser inquirido;
5. Porque, por vezes, os elementos da amostra podem ser destruidos durante o
processo de amostragem ou podem provocar danos materias durante as
experiencias.
5.15.1 Etapas necessarias para a realização de um inquerito por amostragem
1. Definicao com clareza dos objectivos do inquerito;

2. Definicao da populacao a ser estudada e da unidade estatistica;
3. Definir as bases teoricas e praticas da sondagem (variaveis, tamanho, etc.);
4. Elaborar o questionario com instrucoes de notacao (simulacao da validacao dos
dados);
5. Escolha do periodo de referencia para a recolha das informacoes;
124
6. Escolha do metodo de amostragem conveniente;
7. Selecção da amostra;
8. Processamento e controle
9. Realizacao das inferencias e divulgacao dos resultados.
A validade das conclusoes tiradas numa amostra sobre uma populacao, depende do
facto da amostra ter sido bem escolhida e ter um tamanho representativo da
populacao. Portanto, para que a informacao obtida numa amostra seja
verdaderiamente valida e necessario que a correspondente amostra bem como no
metodo usado para a escolha dos elementos que devem pertencer a amostra.
Ainda em relacao a representatividade de uma amostra, sao considerados dois

principios:
1. Quanto maior for a fraccao de amostragem , maior sera a probabilidade de

obter uma amostra representative.
2. Se a populacao tem mais de 10.000 unidades estatisticas e a fraccao de
amostragem e de pelo menos 0.1 (10%), a amostra tem uma probabilidade
aceitável de ser representativa.
5.15.2 Métodos de Extração
Há, contudo, dois métodos gerais para obter (ou extrair) as realizações da amostra:
sem reposição e com reposição.
Nas extrações com reposição, as uidades seleccionadas aleatoriamente são
devolvidas à base de sondagem e ficam disponíveis para a escolha seguinte. Enquanto
que nas extrações sem reposição, as unidades uma vez escolhidas, nunca mais
podem voltar a ser seleccionadas.
125
LIÇÃO N° 16
Métodos de Amostragem
1. Caracterizar o conceito de amostra aleatória simples;

2. Distinguir os vários métodos de amostragem;
126
5.16 Metódos de Amostragem
Entre muitos metodos usados nas pesquisas, podem-se classificar dois tipos principais
de metodos de seleccao de elementos para a composicao da amostra: metodos
probabilisticos e metodos nao probabilisticos.
Os metodos probabilisticos ou aleatorios sao aquelas em que cada unidade estatistica

tem uma certa probabilidade conhecida de pertencer a amostra, e esta probabilidade e
diferente de zero. A amostragem aleatoria e a base da inferencia estatistica, pois este
metodo garante cientificamente a aplicacao das tecnicas estatisticas de inferencia.
5.16.1 Amostragem aleatoria simples
Este é o processo mais elementar e frequentemente utilizado. Aqui, a probabilidade de

cada elemento pertencer a amostra e a mesma para todos. Assim, se for o tamanho
da populacao, a probabilidade de cada elemento pertencer a amostra seleccionada
sem reposicao sera .
Para cumprir a aleatoriedade, e necessário:
1º - Possuir um lista completa dos elemento que formam a população, isto é, enumerar
os elementos de 1 ate .
2º - Em seguida realizar o sorteio, utilizando a tabela dos números aleatórios, que

consiste numa sequência de dígitos de 0 a 9 distribuídos aleatoriamente.
Exemplo 5.1: Dada uma população de 100 elementos , para seleccionarmos

uma amostra de 20 elementos , procedemos da seguinte maneira.
Resolução:
1. Enumerar os elementos assim .

2. Seleccionar 20 números aleatórios da tabela de números aleatórios escolhendo
um ponto de partida casualmente. Para o nosso exemplo, os 20 números
aleatórios foram extraídos da tabela A dos números aleatórios do livro do Allen
Webster (2006), só para três algarismos, onde começamos da posição 00000 e
percorremos a tabela por coluna.
070 089 097 055 039 050 082 007 048 015
127
008 053 021 020 017 075 083 041 028 051
Os elementos da lista cujos números coincidem com esta serie, serão seleccionados
para formar a mostra.
Como já podes observar, este processo, embora ofereça segurança, precisa de certo
domínio no uso das tabelas de números aleatórios. Um procedimento de uso corrente
baseia-se no sorteio de papelinhos que são baralhados num recipiente, o uso da roleta
de lotaria, roleta giratória com números fixos, etc.
Quer num, quer noutro caso, se o elemento seleccionado não for devolvido, a
amostragem é sem reposição.
5.16.2 Amostragem sistemática
Esta é uma variação da amostragem aleatória simples. Sua aplicação requer que a
população seja ordenada segundo um determinado critério, de tal modo que, cada
elemento seja identificado pela posição. O processo de extracção dos elementos
consiste em escolher, ao acaso, o primeiro elemento. Os restantes são obtidos
sistematicamente mediante uma progressão aritmética de razão k.
Procedimento
- Determinar : é o inteiro mais próximo.
- Sortear um numero entre 1 a . Os elementos da amostra são os correspondentes

aos números; .
Ou sorteia-se um dígito terminal, e em seguida, todos os números que terminam por

esse dígito serão incluídos na amostra ate completar o tamanho da amostra. Caso
contrário, escolhe-se uma outra terminação para completar amostra.
Exemplo 5.2: Num determinado prédio da cidade de Maputo existem 46 famílias. Certo
investigador escolheu aquele prédio para inquirir 15 famílias sobre a situação social
dessas famílias. Usando um processo de amostragem sistemática, determine os
números das flats que deverão ser inquiridas.
Resolução:
É a razão de progressão.
Os números a sortear são 1, 2, 3. Seja 2 o número escolhido:
128
5;
... ...
As flats que devem pertencer a amostra ou ser inquiridas tem os números seguintes:
5.16.3 Amostragem estratificada
É pratico e vantajoso, usar a amostragem aleatória simples sempre que a amostra a

seleccionar não for grande. Se a população for muito grande, por exemplo, mais de
10.000 unidades, 10% desta população é uma amostra de 1000 unidades, portanto
ainda é muito grande.
O problema é: como diminuir o tamanho da amostra sem alterar a sua

representatividade? A solução para este problema, consiste em dividir a população em
estratos, e depois seleccionar uma amostra aleatória em cada um dos estratos. A este
tipo de amostragem chama-se amostragem estratificada.
A amostragem estratificada caracteriza-se por dividir a população em grupos

homogéneos, denominados estratos, nos quais cada unidade estatística pertence a um
só estrato. Em seguida, usa-se o processo de amostragem aleatória em cada estrato.
As variáveis de estratificação mais comuns são encontradas nas modalidades como:
classe social, idade, sexo, profissão e qualquer outro atributo relevante da população.
Existem dois tipos de amostragem estratificada: amostragem estratificada proporcional

e amostragem estratificada de fracção óptima. A primeira situação consiste em
seleccionar no estrato, uma quantidade de unidade proporcional ao tamanho do estrato
na população. Na seguida, para além da proporção exigida na primeira situação, os
elementos extraídos devem guardar a proporcionalidade em relação a minimização da
variabilidade de cada estrato. Deve-se salientar que para o nosso caso,
consideraremos apenas amostragem estratificada proporcional.
Exemplo 5.3 Um estudo deve ser feito para se apurar o aproveitamento anual nas
escolas. Para isso, o Ministério da Educação tem uma população de 7000 alunos
129
distribuídos por 4 níveis de ensino: 3000 são do ensino primário, 2000 do ensino
secundário, 1500 do ensino médio e 500 são do ensino superior. A direcção dos
estudos estatísticos do Ministério estimou que amostra deve ter no mínimo 700 alunos
para se considerar representativa.
a) Determinar a taxa ou fracção de amostragem.
b) Determinar, usando amostragem estratificada proporcional, o número de alunos que

deverão ser extraídos em cada estrato de ensino.
Resolução
a)
b) Ensino Primário: alunos
Ensino Secundário: alunos
Ensino Médio: alunos
Ensino superior alunos
Cálculo do número de elementos a seleccionar em cada estrato de ensino.
Ensino primário:
Ensino secundário:
Ensino médio:
Ensino superior:
A soma de unidades na amostra
5.16.4 Amostragem por conglomerados ou clusters
A amostragem por conglomerados é uma variação da amostragem estratificada. Esta

amostragem é conveniente quando: a população não permite ou quando é
extremamente difícil identificar os seus elementos, ou quando a população está
geograficamente dispersa ou por outra razão qualquer. Podes identificar alguns
subgrupos da população, e estudar a característica desses grupos para depois inferí-la
na população.
130
Amostragem por conglomerados consiste em dividir a população em subgrupos, que se
excluem um a outro, exaustivos de acordo com as variáveis que caracterizam o
universo e com aproximadamente o mesmo número de elementos. Sorteia-se alguns
conglomerados, e em seguida, estuda-se todos os elementos dos conglomerados ou
clusters.
Este método é vantajoso quando é difícil construir uma base de sondagem, isto é, a
operação de preparação de listagem de todos os elementos da população seria muito
demorada e teria um custo elevado, quase que proibitivo. Como alternativa, basta
elaborar a lista dos conglomerados e seleccionar uma amostra destes, para obter a
característica de toda a população.
5.16.5 Amostragem multi-etapas
Amostragem multi-etapas é uma extensão de conceito de amostragem por

conglomerados. Esta amostragem é utilizada quando o tamanho dos conglomerados é
muito grande, que se torna dispendioso estudar todos os elementos que pertencem ao
conglomerado. Pois, os elementos nos conglomerados são homogéneos de tal forma
que se pode estudar alguns deles para se conhecer toda a característica do
conglomerado inteiro.
O procedimento da amostragem em duas ou mais etapas consiste em seleccionar, no

primeiro estágio, uma amostra casual simples de conglomerados e, no segundo
estágio, seleccionar uma amostra casual simples de unidades estatísticas em cada
conglomerado. O conjunto de todos os elementos obtidos nos conglomerados constitui
a amostra. Este processo pode multiplicar-se por mais de duas etapas.
5.16.6 Amostragem multi-fásica
Não deverão ser confundidos estes dois processos de amostragem: multi-etapas e

multi-fásica. No primeiro processo, as unidades amostrais variam de uma etapa para
outra, enquanto que, na amostragem multi-fásica define-se, sempre, a mesma unidade
amostral para todas as fases de extracção da amostra. Na primeira fase, recolhem-se
os dados sobre determinadas características dos inquiridos. Estas informações servem
de base para definir uma segunda amostra que responderá a um questionário com um
nível de profundidade mais elevado.
5.16.7 Amostragem Não-Probabilística ou Dirigida
Este método de amostragem é aquele em que a escolha dos elementos para pertencer
a amostra não depende de alguma probabilidade. Usando este tipo de método não é
possível generalizar os resultados das pesquisas para a população. Entretanto, pode
ajudar ao pesquisador a formular boas hipóteses em relação ao problema por
131
investigar, pois as amostras não probabilísticas ou empíricas não garantem a
representatividade da população.
5.16.7.1 Amostragem acidental
A amostra acidental é um subconjunto da população formada por elementos que

podem completar o número de elementos necessários para amostra, porém, sem
nenhuma segurança de que constituem uma amostra exaustiva de todos subconjuntos
possíveis do universo. Para outras literaturas, esta amostragem é chamada por
convencional ou acessibilidade. Geralmente, é utilizada nas pesquisas de opinião onde
os entrevistados são escolhidos acidentalmente. Por exemplo, os cidadãos
entrevistados numa avenida.
5.16.7.2 Amostragem intencional
Esta técnica consiste em usar um determinado critério, e escolher intencionalmente um

grupo de elementos que irão compor a amostra. Os elementos dos grupos da
população devem apresentar uma característica típica, daí se chamar, também, de
amostragem típica. O investigador selecciona os grupos da população, os quais
desejam saber suas características típicas. Por exemplo, numa pesquisa sobre efeitos
de um determinado produto cosmético, o pesquisador se dirige aos salões de beleza, e
entrevista as pessoas que ali se encontram.
5.16.7.3 Amostragem snowball
Este processo de amostragem é praticamente aconselhado quando se pretende

estimar características relevantemente raras nas populações totais. O método consiste
em escolher inicialmente os inquiridos, de modo aleatório, e escolher, numa segunda
fase, outros entrevistados através da informação obtida nos primeiros.
5.16.7.4 Amostragem sequencial
Outro tipo de amostragem dirigida que pode ser considerado, relativamente,

semelhante ao método muilti-fásico, é o da amostragem sequencial. Neste processo de
amostragem, a realização da fase seguinte, só é decidida depois de analisados os
resultados da fase anterior.
5.16.7.5 Amostragem por quotas
Este é um dos métodos de amostragem mais utilizado. Ele oferece um maior rigor do
que muitos métodos não-probabilísticos já considerados, por apresentar uma ideia
132
intuitiva da representatividade dos grupos da amostra. É usual nas campanhas
aleatórias, nos estudos de mercados, etc.
Uma pesquisa por este método abrange três fases:
1. Classificar a população em termos da propriedade ou modalidade que se parece

relevante para a característica por estudar.
2. Determinar as proporções das partições da população
segundo as características que a população apresenta.
3. Calcular as quotas ( ) a seleccionar no grupo para pertencer na amostra
Esta amostragem tem uma vantagem, pois não necessita uma base amostral mais
rigorosa, é fácil de aplicar, tem baixo custo e assegura uma representatividade dos
elementos de cada grupo populacional. Entretanto, tem certas desvantagens por
necessitar de uma informação exacta em cada passo, e a selecção da amostra em
cada grupo não é aleatória.
Exemplo 5.4: Seja uma população com unidades, dividida em três grupos
com =200; =300 e =500. Pretende-se extrair desta população uma amostra de
tamanho 350. Encontrar as quotas ou percentagens que devem ser tiradas em cada.
Resolução
De modo a facilitar a compreensão, vamos apresentar os resultados numa tabela.

Repare que, nesta tabela a proporção dos elementos no subconjunto populacional é
igual à proporção nos grupos cuja soma formará o número das unidades na amostra:
.
200 20% 20% 70

300 30% 30% 105
500 50% 50% 175
1000 100% 100% 350
133
LIÇÃO N° 17
Determinação do tamanho de uma amostra
1. Distinguir várias situações para determinação do tamanho de uma amostra;

2. Conhecer os factores que determinam o tamanho de uma amostra;
134
5.17 Determinação do Tamanho de uma Amostra
Na preparação do esquema de uma sondagem a ser utilizado durante uma

investigação, há que considerar a necessidade de determinar o tamanho da amostra
por compor pelos elementos da população. Para que a amostra apresente fidelidade
em relação às características do universo, i. e, tenha representatividade, não basta ter
uma parte dele. É necessário que a amostra tenha um número suficiente dos casos
escolhidos aleatoriamente. Portanto, o tamanho da amostra deve ser calculada
mediante determinadas proporções estabelecidas estatisticamente, não só para
recolher a informação necessária como também para garantir a possibilidade de fazer
inferência dos resultados e minimizar o tempo de recolha de dados, custo, etc.
5.17.1 Factores que determinam o tamanho de uma amostra
Os factores que determinam a extensão de uma amostra são: o tamanho do universo,

que pode ser finito ou infinito; o nível de confiança estabelecido; e o erro de estimação
pelos órgãos de controlo de qualidade da informação e proporção da característica
pesquisada no universo.
1. Tamanho do universo
O tamanho de uma amostra depende do tamanho da população, que pode ser finito ou
infinito. Consideram-se universos finitos, aqueles que não ultrapassam as 100.000
unidades estatísticas ( 100.000), e universos infinitos, os que ultrapassam 100.000
unidades ( 100.000). Esta distinção é importante para a determinação do tamanho,
pois usam-se fórmulas diferentes, porque no segundo caso sempre se recebe uma
amostra grande.
2. Nível de confiança estabelecido

De acordo com as estatísticas realizadas e da teoria de probabilidades, a distribuição
de qualquer informação, obtida por uma amostra extraída a partir de uma população
normalmente distribuída, ajusta-se à lei normal, apresentando valores centrais mais
elevados e valores extremos mais reduzidos.
135
Assim, o nível de confiança e a área da curva normal que se pretende abranger, por
exemplo, se desejarmos fazer inferências com 90% de segurança, é 90% da área total
da curva normal.
Existem vários procedimentos que são utilizados para o cálculo do tamanho de uma
amostra, nesta lição destacamos algumas situações ao nosso nível de abordagem da
teoria elementar de amostragem.
Caso 1. Se a variável escolhida na população for intervalar e a população considerada

for infinita, o tamanho da amostra pode ser determinado pela fórmula:
z
n [ /2
]2
E
O tamanho da amostra deve ser um número inteiro; quando o resultado não é inteiro,
como regra, deve-se arredondar para o próximo número. Com esta fórmula, pode-se
determinar o tamanho da amostra necessária para dar resultados precisos, com um
grau de confiança e uma margem de erro pré-determinados. A fórmula deve ser usada
quando conhecemos o valor da e queremos determinar o tamanho da amostra
necessário para estabelecer, um nível de confiança de , e o valor de a menor
que . A existência desta fórmula implica que o tamanho da amostra não depende do
tamanho da população.
Exemplo 5.5: Um consultor deseja calcular o salário médio para o primeiro ano de
trabalho de um bacharel recém-formado do Curso de Administração. Quantos valores
do salário devem ser obtidos, se o consultor deseja ter 95% de confiança em que a
média amostral esteja a menos de 3000,00 MT da verdadeira média populacional?
Suponha que sabemos através de um estudo anterior que, para estes salários,
Mt.
Queremos determinar , dado que , , . Aplicando a

fórmula:
Portanto, devemos obter uma amostra de, pelo menos, 180 salários do primeiro ano,
seleccionados aleatoriamente. Com tal amostra, teremos 95% de confiança em que a
média amostral X difere em menos de 3000,00 MT da média populacional .
136
Caso 2. Se a variavel escolhida for intervalar e a população finita, o tamanho da
amostra será calculado por:
Exemplo 5.6: Suponhamos que, no exemplo anterior, a população seja finita de 300
salários. Calcule o tamanho da amostra.
Caso 3. No caso de proporção populacional, considarando que a população seja

infinita, o cálculo do tamanho da amostra é feito de forma similar a que foi feita para a
média.
A partir da equação do erro, dada acima, estima-se em função de :
(z /2 )2 pˆ (1 pˆ )
n
E2
A proporção utilizada pode ser escolhida:
a partir de um estudo piloto, calcula-se a proporção amostral ;

usa-se p̂ =0.5, pois este é o valor que maximiza a variância de p ;
usa-se o julgamento de um especialista da área, que decide qual é o valor mais
provável de p ;
usa-se a proporção da amostra a partir de uma unidade similar.
Quando não for inteiro, arredonda-se. Lembre-se
Exemplo 5.7: A Entreposto deseja saber a proporção de clientes que fazem a revisão
mecânica nos mecânicos por si autorizados. O conselho directivo da empresa decide
que o estudo deve ter uma margem de erro de 3% (a percentagem de clientes que
consultam os mecânicos quando seus veículos apresentam problemas mecânicos ou
por causa de um outro serviço). Supondo que se pretende um nível de confiança de
95% nos resultados, quantos motoristas devem fazer parte da amostra?
a) Supondo que temos uma estimativa p̂ com base num estudo anterior, que mostrou
que 18% dos motoristas consultavam os mecânicos.
137
b) Supondo que não temos qualquer informação que possa sugerir um valor de p .
Solução:
a) p̂ ao nível de 95% de confiança, α = 0,05 e zα/2 =1,96.
A margem de erro é de três pontos percentuais (3%), logo E = 0.03 :
1,962 (0,18)(0,82)
n 630, 0224 631
0.032
Devemos entrevistar pelo menos 631 motoristas seleccionados aleatoriamente.
b) Similar a parte (a), utilizamos zα/2 = 1,96 e E = 0.03 , mas sem qualquer
conhecimento prévio de p, temos de utilizar o valor que maximiza a variância.
1,962 (0,5)2
n 1067,1111 1068
0.032
Para termos 95% de confiança de que a nossa amostra está a menos de três pontos
percentuais da verdadeira percentagem de todos os clientes, devemos fazer uma
selecção aleatória e entrevistar 1068 motoristas. Comparando este resultado com a
amostra de 631 obtido na alínea (a), podemos ver que, na ausência de um estudo
prévio, é necessária uma amostra maior para obtermos os mesmos resultados que
obteríamos se pudéssemos estimar o valor de p.
Caso 4. Se a variável escolhida for nominal ou ordinal e a população finita, o tamanho

da amostra será calculado por:
Exemplo 5.8: Suponhamos que, no exemplo anterior, a população de clientes que

fazem revisão com os mecânicos da Entreposto não passa de 10.000. Calcule o
tamanho da amostra.
Exemplo 5.9: Um investigador realiza um estudo sobre o comportamento político dos

eleitores de uma determinada província. De acordo com as informações em seu poder,
o comportamento varia muito de uma categoria profissional para outra. Portanto, ele
138
esta interessado em conhecer o comportamento desses grupos. Sabendo que a
província tem 10.000 eleitores, ao nível de confiança correspondente a 95,44% e um
erro de estimação de 4%, determinar o tamanho da amostra e os tamanhos das
amostras nos estratos. De acordo com a informação disponível, os eleitores distribuem-
se por categorias seguintes: Técnicos profissionais - 1000, Empregados
Administrativos - 2000, operários - 3000 e trabalhadores não qualificados - 4000.
Resolução:
a) Para calcularmos o tamanho da amostra, vamos considerar os seguintes dados:

; ; e como não foi referida a população da característica
pesquisada vamos usar ; .
O tamanho deve ser de 588 eleitores.
b) Agora vamos determinar os tamanhos dos estratos.
É a taxa da amostragem
1. Técnicos profissionais:
2. Empregados administrativos:
3. Operários:
4. Trabalhadores não qualificados:
139
LIÇÃO N° 18
Distribuições Amostrais
1. Explicar em que consiste e como se obtém a distribuição amostral de estatística;

2. Distinguir varias situações de distribuições amostrais;
3. Caracterizar as distribuições amostrais das médias, proporções, variâncias;
4. Caracterizar a distribuição amostral das médias quando a variância populacuinal
é desconhecida;
140
Uma das importâncias da inferência estatística é tirar conclusões de uma população a
partir dos resultados observados na amostra. Logo, cabe ao observador da amostra
usar relações mais adequadas entre os parâmetros populacionais e as estatísticas
amostrais. Estimador é qualquer variável aleatória dos elementos amostrais. O valor
numérico de um estimador é denominado estimativa.
Consideremos todas as amostras de tamanho que podem ser extraídas de
determinada população. Se para cada uma destas amostras for calculado o valor do
estimador, tem-se uma distribuição amostral desse estimador. Como o estimador é
uma variável aleatória, então, pode se encontrar sua média, variância, desvio padrão,
etc.
5.18.1 Distribuição amostral das médias
Se for extraída uma amostra de tamanho , a média da amostra sera . Se forem

extraídas amostras de tamanho , e para cada amostra for calculda a estimativa da
média amostral, forma-se uma população das médias amostrais e a distribuição
correspondente chama-se distribuição amostral das médias.
Teorema 1. A média da distribuição amostral das médias, denotada por é igual a

média populacional , isto é:
Teorema 2. Se a população é infinita ou se a amostragem é com repetição, então, a

variância da distribuição amostral das médias é dada por:
ou , onde é a variância da população.
Teorema 3. Se a população for finita, ou se a amostragem é sem reposição, então, a

variância da distribuição amostral das médias é dada por:
141
ou
Exemplo 5.10: Considere uma população constituída pela série das unidades
estatísticas:
a) Determine as estimativas dos parâmetros pontuais: a média, a variância e o
desvio padrão.
b) Considere todas as amostras possíveis de tamanho 2, que podem ser extraídas
da população com reposição e apresente a distribuição amostral das médias
amostrais.
c) Calcule a média e o desvio padrão da distribuição amostral das médias.
d) A partir das relações entre as estatísticas e os parâmentros populacionais,
calcule a média e desvio padrão da distribuição amostral.
e) Usando uma amostragem aleatória sem reposição, apresente a distribuição
amostral das médias.
f)
Resolução:
a) Dado que a série das unidades estatísticas é , então, .
E as estimativas pontuais tem os seguintes valores:
; ;
b) Como para amostra com reposição, cada elemento comina com ele e
com qualquer outro. Então temos amostras. As 25 amostras e as
respectivas médias amostrais estão apresentadas abaixo.
2;2 3;2 5;2 7;2 8;2 2.0 2.5 3.5 4.5 5.0
2;3 3;3 5;3 7;3 8;3
2.5 3.0 4.0 5.0 5.5
2;5 3;5 5;5 7;5 8;5
3.5 4.0 5.0 6.0 6.5
2;7 3;7 5;7 7;7 8;7
4.5 5.0 6.0 7.0 6.5
2;8 3;8 5;8 7;8 8;8
5.0 5.5 6.5 7.0 8.0
c)
142
d)
f) Para amostragem sem reposição as amostras se difirem por, pelo menos, um

elemento, então C(5,2)= 10 amostras
2;3 2.5
2;5 3;5 3.5 4.0
2;7 3;7 5;7 4.5 5.0 6.0
2,8 3;8 5;8 7;8 5.5 5.5 6.5 7.5
5.18.2 Distribuição amostral das proporções
Se é a proporção de ocorrência com sucesso de evento e seu insucesso, e

uma amostra de tamanho é extraída de , a amostra fornecera uma de
eventos ocorridos com sucesso. Para k amostras de tamanho n, receber-se-á uma
distribuição amostral das proporções desvio padrão que são dadas pelas
fórmulas:
a) Amostra com reposição:
b) b) Amostra sem reposição:
Exemplo 5.11. Num prévia campanha eleitoral, mostrou-se que um certo candidato
tinha 46% dos votos perante esta situação qual é a probabilidade de que numa secção
eleitoral constituída por 200 pessoas, seleccionadas ao acaso entre a população
votante, ele tenha a maioria dos votos.
Resolução:
143
A maioria dos votos terá a partir dos 101 eleitores entre os 200. Considerado uma
variável continua, vamos usar 100.5, isto é, a proporção de sucessos
.
Transformando para escores reduzidas, temos.
5.18.3 Distribuição amostral das variâncias
Seja a varinçia popuciopnal e (variância amostral), o estimar da variância

populacional, Se se desejar saber qual é a distribuição da variância amostral, pode-se
usar a relação:
onde tem distribuição do qui-quadrado com graus de liberdade ou seja:
Graficamente a relação entre a variância amostral e a variância populacional é dada

pela distribuição qui-quadrado.
5.18.3.1 Distribuição amostral das médias quando a variância populacional é

desconhecida
Como se pode deduzir, para uma população normal, a amostra extraída dela deverá
ser normal, consequentemente a sua distribuição amostral também o será, i.é:
Se então
Ou seja, a distribuição normal padronizada é dada por:
144
Como não se conhece o valor da variância , portanto o valor do desvio padrão
populacional , é substituído pela variável aleatória (desvio padrão amostral), e
procuramos a distribuição da estatística , e pode-se mostrar que tem uma
distribuição de Student com graus de liberdade, assim:
145
Texto 1
McGraw-Hill, 2006.
Também podes ler este livro, capítulo VI, de p.p.139 à p.p.158.
146
UNIDADE TEMÁTICA VI
TEORIA ESTATÍSTICA DE ESTIMAÇÃO
Constituem objectivo geral desta unidade: precisar o conceito de estimador; relacionar

os estimadores com as características populacionais; e apresentar propriedades gerais
de estimadores, incluindo a respectiva precisão.
Depois de concluíres o estudo desta unidade, deves ser capaz de:
1. Distinguir características populacionais dos estimadores;

2. Demonstrar o carácter aleatório de um estimador;
3. Definir um estimador centrado;
4. Explicar como se estima a precisão de um estimador;
5. Explicar o que é um estimador suficiente;
6. Explicar o conceito de intervalo de confiança;
7. Calcular intervalos de confiança para diferentes distribuições amostrais;
147
Introdução
Nas unidades temáticas anteriores foram tratados aspectos como organização e

análise de dados, teoria das probabilidades e suas distribuições bem como o processo
de extracção de amostras numa população de tamanho finito ou infinito.
Nesta unidade temática, vamos considerar o processo de obtenção de informações

sobre uma população a partir dos resultados observados na amostra. O problema aqui
considerado é um dos focos principais da inferência estatística.
Consideremos as seguintes situações:
Generalização sobre a temperatura da sopa no prato com base na primeira

colherada;
Estimação da esperança de vida de um par de sapatos com base na experiência
passada;
É exactamente isto que fazemos na inferência estatística, só que, o fazemos de

maneira mais científica. O que faz com que a aplicação da inferência estatística seja
científica é o facto de ela ter em conta a maneira de seleccionar a amostra e expressar
a generalização em termos específicos na base de probabilidades.
148
LIÇÃO N° 19
PARÂMETROS, ESTIMADORES E ESTIMATIVAS
1. Distinguir características populacionais dos estimadores;

2. Demonstrar o carácter aleatório de um estimador;
3. Definir um estimador centrado;
4. Explicar como se estima a precisão de um estimador;
5. Explicar o que é um estimador suficiente;
149
Introdução
Nesta lição, vamos rever o conceito de parâmetro, abordar o conceito de estimador,

estabelecer algumas das suas propriedades bem como estudar vários tipos de
estimação. Um estimador é uma espécie de “máquina” para gerar estimativas ou
aproximações dos valores populacionais desconhecidos ou inacessíveis à observação.
Por exemplo: que podemos dizer da competência de uma pessoa para resolver
situações de certo tipo ao longo da sua vida, com base na observação dos resultados
dos testes realizados na escola?
É essencial ter uma ideia da qualidade destes estimadores. A qualidade de um

estimador é um conceito multifacetado: tem vários aspectos que interessam
caracterizá-los. Abordam-se aqui alguns destes aspectos, e em particular, a precisão
do estimador, medido pela respectiva variância.
Exemplo 6.1: Ao invés de se dizer que os pares de sapatos duram cinco anos, dá-se
um intervalo de anos e estabelece-se.
Parâmetros
Parâmetros são as quantidades de nosso interesse numa população e são

desconhecidas na maioria das aplicações. Podem ser representadas por letras gregas,
tais como , e entre outras. A média ( ) e desvio padrão ( ) são os parâmetros
do nosso interesse.
6.19.1 Estimador e estimativa
Geralmente são representados por símbolos gregos com um acento circunflexo.
Estimativas pontuais são valores singulares que são usados para estimar qualquer
parâmetro populacional desconhecido. Dada uma população de tamanho ,
normalmente distribuída, se dela for extraída uma amostra aleatória de tamanho , é de
esperar que a amostra esteja também normalmente distribuída. Se não forem
conhecidos os valores dos parâmetros populacionais, nomeadamente, a média , a
variância e a proporção de sucessos , teremos de recorrer à teoria de estimação.
Como o estimador, por exemplo, é uma função das variáveis aleatórias, a sua função
de distribuição de probabilidade será na base de inferências sobre os parâmetros da
população. Para entendermos melhor, vejamos:
150
Considere uma amostra de tamanho , retirada de uma população e representada
por um conjunto de variáveis aleatórias ( X 1 , X 2 ,..... X n ). Os parâmetros média, variância
e proporção de certa população são representados simbolicamente por: , e ,
respectivamente. Os estimadores usuais, nomeadamente, média, variância e
proporção amostral, são calculados respectivamente, por , ˆ e ˆ , pelas fórmulas
seguintes:
n
x1 x2 ......xn xi
x
n i 1 n
n
1
ˆ2 ( xi x) 2
n i 1
número de itens com característica na amostra

pˆ
n
Cada um dos estimadores depende dos valores que estão na amostra aleatória. Este
tipo de estimação, ( X 1 , X 2 ,..... X n ), é chamado de estimação pontual.
Vários são os critérios utilizados por estatísticos e matemáticos para seleccionar

estimadores apropriados para calcular, com base em dados da amostra, os parâmetros
populacionais. Uma das características mais importantes de um estimador é que não
pode ser viciado (não tendencioso).
6.19.2 Propriedades dos estimadores
Um bom estimador de um parâmetro deve satisfazer as seguintes propriedades:
1. Centrado – um estimador é centrado ou não enviesado (não viciado) se o seu

valor é igual ao valor do parâmetro populacional. Por exemplo: .
Quando , o estimador diz-se viciado. O enviesamento é dado pela
diferença entre o valor do estimador e do parâmetro. E toma o nome de erro
amostral. Este enviesamento pode ser causado: pela escolha de mau estimador;
processo de amostragem não adequado; definição errada da população alvo;
etc.
2. Suficiente – quando se resume uma amostra através de uma unidade

estatística, há perda de informação. Com efeito, dispondo das observações,
pode calcular-se o valor de qualquer unidade estatística. O recíproco não é
151
verdadeiro: conhecendo o valor de uma estatística, não podemos em geral
reproduzir os dados em que o seu cálculo se baseou.
Por exemplo: Seja uma amostra aleatória. Se
é uma realização da amostra seja
. Então, .
Conhecendo a amostra , podemos calcular esta ou qualquer outra

estatística, sabendo que não nos permite voltar aos dados, isto é, há menos
informação em do que em .
3. Eficiência – de entre todos os estimadores centrados para um mesmo

parâmetro, é eficiente aquele que tiver menor variância, por exemplo:
a) Seja estimador tendencioso ou centrado, isto é: .
b) Se onde é qualquer outro estimador não tendencioso
de . Então é mais eficiente que .
4. Consistente – seja um estimador do parâmetro desconhecido . é um
estimador consistente de se quando , onde é tamanho da
amostra, isto é, deve ser consistente se e só se para cada o
.
Portanto, se seleccionar uma amostra de tamanho por A.A.S, demonstrar-se-á
que: e
Resumo
Parâmetro Estatística Centrado Consistente Eficiente

Média Sim Sim Sim
Média Mediana Sim Sim Não
Média Moda Sim Sim Não
Variância Não Sim Sim
De uma população com parâmetros e desconhecidos, se é extraída uma amostra
de tamanho , as estimativas eficientes correspondentes são as estatísticas amostrais:
Exemplo 6.2: Uma amostra de cinco (5) medidas de diâmetros de esferas foi registada
por um cientista com os valores: . Determinar as
152
estatísticas não tendenciosas e eficientes de: (a) média verdadeira e (b) variância
verdadeira.
Resolução:
a) Logo .
b) ;
2
Os estimadores x e p̂ têm boas propriedades e não são viciados. Entretanto, é
viciado, pelo que, não é adequado para estimação. Para eliminar esse vício, um
estimador é definido como:
n
1
S2 ( xi x )2
n 1i 1
S 2 é um estimador não viciado para estimar 2 . Esse estimador recebe o nome de

variância amostral e será sempre denotado por S 2 para se distinguir de outros
2
estimadores denotados genericamente por .
Exemplo 6.3: O número de faltas por ano de funcionários de determinada empresa foi
anotado para uma amostra de funcionários escolhidos por acaso. Deseja-se saber qual
é o número médio de faltas por funcionário em um ano. Os dados obtidos são: 2, 2, 3,
1, 4, 5, 3, 4, 5, 6, 5, 3, 4, 3, 4, 2, 4, 3, 5, 2, 1, 6, 2, 3 e 4. A estimativa da média
populacional é:
2 2 .......... 3 4
x 3, 44
25
Logo, o número médio de faltas por funcionário em cada ano é aproximadamente 4.
A estimativa da variância amostral é:
(2 3, 44)2 (2 3, 44) 2 ..... (4 3, 44) 2

S2 2, 006
24
153
LIÇÃO N° 20
ESTIMATIVAS DE PARÂMETROS
1. Explicar o conceito de intervalo de confiança;

2. Calcular intervalos de confiança para diferentes distribuições amostrais;
154
Introdução
Antes de introduzirmos o conceito de intervalo de confiança, vamos perceber o que é

Teorema Central do Limite:
Suponha que uma amostra aleatória simples de tamanho é seleccionada de uma

2
população de média e variância (nota que o modelo da variável aleatória não é
especificado). Representando tal amostra por variáveis aleatórias independentes
( X 1 , X 2 ,..... X n ), e representando a sua média por x , temos que:
x n
Z  N (0,1)
/ n
Em outras palavras, o teorema garante que para um grande, a distribuição da média

amostral, devidamente padronizada, comporta-se como um modelo Normal com média
0 e variância 1. Pelo teorema, temos que quanto maior for o tamanho da amostra,
melhor é a aproximação. Estudos de simulações mostram que, em muitos casos, os
valores de n próximos de 30 fornecem aproximações boas para situações práticas.
Uma aplicação importante está associada a distribuição da proporção amostral ( pˆ ) .

Lembra-se que, definimos a proporção amostral como sendo a fracção de indivíduos,
com uma dada característica, numa amostra de tamanho . Construindo para o
enésimo indivíduo uma variável aleatória Yi tal que:
Podemos, então, escrever a proporção amostral como:

n
Y1 Yn ...... Yn Yi
pˆ Y
n i 1 n
A proporção amostral é a média de variáveis aleatórias convenientemente definidas.

Assumindo que a proporção de indivíduos com uma determinada característica na
população é p, e que os indivíduos são seleccionados aleatoriamente, temos que
Y1........., Yn formam uma sequência de variáveis aleatórias do modelo Bernoulli. Assim, a
média e a variância do modelo Bernoulli são dadas por p e p(1 p) / n ,
respectivamente. A partir do Teorema Central do Limite, temos que:
155
pˆ p n
N (0,1)
p (1 p ) / n
Agora, vamos estudar a estimação intervalar, para diversos casos. Logo em seguida,
na unidade temática 7, iremos abordar os vários cenários de testes de hipóteses para
média e proporção.
6.20.1 Estimação por Intervalo
Os estimadores vistos até ao momento são pontuais, pois fornecem uma estimativa
numérica para o parâmetro de interesse. O método que a seguir vamos estudar é
denominado de estimação intervalar, e inclui a estimativa pontual e informações a
respeito da sua variabilidade.
Examinaremos, a seguir, os casos seguintes:

2
conhecida;
2
desconhecida e amostra grande;
2
desconhecida e amostra pequena.
2
1º Caso: conhecida
2
Quando a variância populacional é conhecida e a amostra de tamanho
examinada, vimos, anteriormente, que a média amostral tem uma distribuição normal
com a mesma média e variância . Para um valor fixado, tal que: ,
podemos obter um valor , tal que:
P( Z z /2 ) P( z /2 z z /2 ) a
Recorde-se que na unidade temática 4, consideramos que a distribuição normal é

simétrica; portanto, a área deve ser igualmente distribuída em torno de 0. Veja, na
figura, a seguir:
156
É o coeficiente de confiança, e é o valor de que fornece uma área de
na extremidade superior a distribuição normal padrão; assim, temos o intervalo
seguinte:
X
z /2 z /2 X z /2 X z /2
n n n
Assim, o intervalo de confiança para como o coeficiente de confiança são

dados por:
IC ( ,1 ) [X z /2 ;X z /2 ]
n n
6.20.1.1 Interpretação do intervalo de confiança
Se tivermos várias amostras do mesmo tamanho, e calcularmos para cada uma, os

intervalos de confiança e o coeficiente de confiança ) correspondentes,
esperamos que a proporção de intervalos que contenham o valor de μ seja igual a
.
Outro conceito importante é o de erro de estimação, o qual é fundamentado a partir do

intervalo de confiança, e é dado por:
E z /2
n
A fórmula de erro ou margem de erro, revela que há, efectivamente, três determinantes
do tamanho ou quantidade de erro: a confiança desejada, representada pelo valor de
; a dispersão da população ; o tamanho da amostra .
Os factores no numerador têm um efeito directo no erro, ou seja, quanto maior for o
coeficiente de confiança ou a dispersão da população, maior é o erro. O tamanho da
amostra apresenta o efeito inverso na margem de erro, portanto, quanto maior for a
amostra menor é o erro.
Calcula-se o valor de zα/2 usando a Tabela Normal Padronizada, que se encontra no fim
do manual.
157
Observe que se p (0 ≤ z ≤ 1,64) = 0,45 logo p (z>1,64) = 0.05 , pois p (- ≤ z ≤ ) = 1
e por simetria da distribuição p (z ≤0) = p (z ≥0)=0.5. A partir do valor de z0.05 = 1,64
constrói-se um intervalo de 90% de confiança (α= 0,1).
Veja, a seguir, alguns exemplos:
Exemplo 6.4:
Um consultor obtém uma amostra aleatória de tamanho 6 de um conjunto de

contas a pagar. Sabe-se que, o desvio padrão das contas a pagar é 57,00 Mt. A partir
da amostra, observou-se que a média amostral foi Mt. Construa um
intervalo de 95% para o valor médio de crédito que o consultor virá a pagar por cada
conta.
Pela Tabela de Distribuição Normal Padronizada, vê-se que z0.025 = 1,96, pois p (0
≤z≤1,96) = 0.475 , logo p (z ≥1,96) = 0.025. Assim, o intervalo de confiança para o valor
médio do valor que o consultor pagará com 95% de confiança é [ 222,07;277,93].
158
2
2º Caso: desconhecida e amostra grande
Na maioria das aplicações, a variância populacional (σ2) é desconhecida. Quando isso

acontece, o estimador não viciado S 2 , pode ser usado para estimar σ2. Nos casos em
que a amostra é grande, n ≥ 30, o teorema central do limite fornece uma boa
aproximação para a distribuição da média amostral. Assim, o intervalo de confiança de
(1-α) %, é representado da forma:
IC ( ,1 ) [X z /2 ;X z /2 ]
n n
Tal que, S S 2 . Portanto, a construção do intervalo de confiança é semelhante a que

foi feita no 1º caso: a única diferença é que no lugar de σ, usa-se o desvio padrão
amostral S .
Exemplo 6.5: Para ilustrar essa situação, consideremos o exemplo seguinte: um

estudo de amostragem feito pela EMOSE. Suponha que, como parte de uma revisão
anual das apólices de seguro de vida, a EMOSE selecciona uma amostra aleatória
simples de 36 apólices de seguro de vida. As correspondentes apólices de seguro de
vida são revistas em termos de garantia de cobertura. Para o estudo, um gerente
solicitou uma estimativa do intervalo de confiança de 90% da idade média para a
população dos proprietários da apólice de seguro de vida. A idade média da amostra é
x = 39 anos. O desvio padrão da amostra é S =7,77 . O valor de z0.025 é 1,645.
Portanto, o intervalo de 90% é dado por:
A margem de erro é 2,13 e a estimativa do intervalo de 90% da idade média da

população de proprietários de apólices de seguros é de 37,37 a 41,63.
2
3º Caso: desconhecida e amostra pequena
Se tivermos uma amostra pequena , e se quisermos construir um intervalo de

2
confiança, mas sem conhecer σ , podemos utilizar a distribuição t-Student, ou
simplesmente, distribuição t. Esta é utilizada para determinar valores críticos
representados por tα/2 . Na tabela da distribuição t pode observar que, nas linhas
aparece o número de graus de liberdade, que é dado por . Os graus de liberdade,
ou gl, correspondem ao número de valores que podem variar após sofrerem certas
restrições.
Algumas propriedades interessantes da distribuição t-Student
159
É diferente conforme o tamanho da amostra, ou seja, ela varia de acordo com os
graus de liberdade;
Apresenta a mesma forma geral simétrica (forma de sino) que a distribuição
normal, mas com maior variabilidade, o que é esperado em amostras pequenas,
logo, P(t ≥ 0) = 0.5 e P(t≤ 0) = 0.5;
O desvio padrão da distribuição t varia com o tamanho da amostra, mas é
superior a 1;
À medida que aumenta o tamanho da amostra, a distribuição t aproxima-se mais
e mais da distribuição normal padronizada.
Observe que na figura a seguir, a medida que se aumenta o número de graus de

liberdade, representado por “v ”, a distribuição t assemelha-se mais com a distribuição
normal padrão, também representada por N (0,1).
Podemos, agora, determinar os valores da margem de erro e construir intervalos de

confiança:
tal que , é o valor de t que fornece a área de α/2 na extremidade

superior da distribuição t com n-1 graus de liberdade.
E o intervalo de (1-α) % de confiança é dado por:
S S
X E X E X t /2, n 1 X t /2, n 1
n n
Ou o intervalo de confiança para μ, com coeficiente de confiança 1-α, pode ser

expresso por:
160
S S
IC ( ,1 ) [X t /2, n 1 ;X z /2, n 1 ]
n n
Exemplo 6.6: Voltando ao exemplo do número de faltas de funcionários, os valores

estimados de X e S2 foram respectivamente 3,44 e 2,006, sendo
S S2 2,006 1, 4163 . Um intervalo de 95% de confiança para o número médio de
faltas por funcionário será:
Primeiro, vamos calcular t0,0025,24 , uma vez que a amostra tem tamanho n = 25 . Pela
tabela da distribuição t, o valor crítico que deixa área de 2,5% acima da curva, com 24
graus de liberdade é t0,0025,24 = 2,064. Veja que a tabela anterior é uma parte da tabela
t. Assim o intervalo de 95% de confiança para a média é:
1, 4163
IC ( ,95%) [3, 44 2, 064 ] [3, 44 0.585] [2,855; 4, 025]
25
E a margem de erro é dada por 0,585.
161
Texto 1
McGraw-Hill, 2006.
Ler este livro capítulo VII de pagina 165 a pagina 185.
162
UNIDADE TEMÁTICA VII
TESTE DE HIPÓTESES
Depois de concluíres o estudo desta unidade, deves ser capaz de:
1. Explicar em que consiste um teste de hipóteses;

2. Explicar em que consistem os erros da primeira (tipo I) e segunda espécie (tipo
II);
3. Explicar em que consiste a regra de decisão de um teste;
4. Testar hipóteses simples;
5. Descrever e calcular o teste de hipóteses para média, proporção e variância;
163
Introdução
A Estatística Descritiva (análise de dados), face aos gráficos e números que resumem
os dados, permite emitir hipóteses acerca do comportamento das populações de onde
provêm esses dados.
A finalidade desta unidade temática é desenvolver regras (designadas testes de
hipóteses) que permitem, uma vez formulada determinada hipótese, decidir, correndo
um certo risco de errar, se essa hipótese é aceitável, face à informação contida nos
dados.
164
LIÇÃO N° 21
Introdução a Teste de Hipóteses
1. Explicar o conceito de teste de hipóteses;

2. Distinguir tipos de teste de hipóteses;
3. Descrever as várias estatísticas de teste;
4. Descrever as etapas de um teste de hipóteses;
165
7.21.1 Conceito de teste de hipóteses
Muitas vezes somos convidados a tomar decisões, mesmo em situações onde não é
possível obter informações sobre toda população. Estes casos acontecem ou porque
não se conhece o universo da população, ou porque os custos para o estudo seriam
muito elevados ou mesmo porque o processo de recolha de informação levaria muito
tempo. Motivos como estes levam-nos a estudar parte dessa população e depois
decidir sobre as características da população.
Nesta unidade, apresentamos algumas técnicas de inferência estatística, que nos

ajudarão na tomada de decisões estatísticas, mostrando como introduzir juízos na
análise de uma amostra bem como na generalização das características da mesma.
Através de intervalos de confiança, procura-se um intervalo onde se situa o parâmetro
populacional mesmo não conhecendo a sua estimativa, enquanto que a técnica de
inferência usando testes de hipóteses, começa com a formulação de uma suposição
(hipótese), sobre a estimativa do estimador populacional, e a partir dos dados
amostrais procura-se saber se a hipótese é verdadeira ou falsa.
Hipótese Estatística – é uma afirmação ou suposição sobre o valor de um parâmetro

populacional, ou sobre a natureza da distribuição de probabilidade de uma variável
populacional e que precisa ser testada para se tomar uma decisão estatística.
Exemplo 7.1 São exemplos de hipóteses estatísticas as afirmações:
a) A altura média da população moçambicana é 1,65 cm;

b) A variância populacional dos salários da Indústria Televisiva é 5000,00 Mt;
c) A proporção de alunas na Escola Secundária Josina Machel é 65%.
Observação: Os testes de hipóteses de uma maneira geral dividem-se em duas

partes, a saber:
a) Paramétricos (média, desvio padrão, variância, etc)

b) Não paramétricos (variáveis com nível de medição nominal, ordinal ou por
intervalo de classe)
7.21.2 Hipóteses Estatísticas
De uma maneira geral, para a realização de um teste estatístico, começa-se por emitir
a hipótese nula ( ), é a hipótese estatística a ser testada, e a hipótese que traduz uma
afirmação diferente da anterior, é chamada hipótese alternativa ( ) a hipótese nula
( ).
166
Existem testes de hipóteses para média, variância e para proporção de uma população.
Uma suposição que precisa ser feita é que os dados da população provêm de uma
distribuição normal onde a média ou proporção são desconhecidos e a variância pode
ser conhecida ou não. Vamos, agora, definir as componentes de um teste de hipóteses:
Hipótese Nula (denotada por ): é uma afirmação sobre o valor de um parâmetro

populacional (como a média, variância ou proporção). Ela deve conter a condição de
igualdade e escrever como ou . (Ao fazermos, efectivamente, o teste,

trabalhamos com a hipótese de que o parâmetro é igual a um valor especificado). Para
a média, temos as três formas possíveis para a hipótese nula:
algum valor;
algum valor;
algum valor.
Hipótese Alternativa (denotada por ): é uma afirmação que complementa (parte que
não está em ) a hipótese nula. Esta pode ser descrita em uma das três formas:
algum valor;
algum valor;
algum valor;
Para melhor compreendermos vejamos, inicialmente, três exemplos de aplicação.
Exemplo 7.1
Uma indústria farmacêutica deseja testar um novo medicamento no combate à dor de

cabeça. A ideia é verificar se o novo medicamento “Sem Dor”, é mais rápido para
actuação no organismo de uma pessoa do que os analgésicos comuns. Sabe-se que o
tempo de alívio de dor dos últimos é 15 minutos. Logo, a indústria deseja testar se o
medicamento “Sem Dor” age no organismo em menos de 15 minutos. Admite-se que o
tempo de alívio do medicamento no organismo segue uma distribuição normal.
A hipótese nula é 15 minutos;
A hipótese alternativa é 15 minutos;
167
Exemplo 7.2: O gerente de um hotel estabeleceu que a quantia média gasta por
hóspedes em um fim de semana é de 500,00 MT, ou menos. Um funcionário do sector
de contabilidade observou que as despesas totais dos hóspedes têm aumentado nos
últimos meses. O contabilista do hotel irá verificar se essa afirmação é verdadeira ou
não. Admite-se que o gasto dos hóspedes segue uma distribuição normal.
Hipótese nula é 500,00 MT;
Hipótese alternativa é 500,00 MT;
Exemplo 7.3: A TDM afirma que o consumo mensal de ligações a longa distância foi 3
horas e 35 minutos por residência no último ano. Deseja-se avaliar se o consumo por
residência deste ano é o mesmo. Admitimos que o consumo mensal de ligações a
longa distância segue uma distribuição normal.
Hipótese nula é 215 minutos (3 horas e 35 minutos);
Hipótese alternativa é 215 minutos;
Atenção…
Se está a fazer uma pesquisa e deseja usar um teste de hipótese para sustentar a sua
afirmação, esta deve ser formulada de maneira que se torne numa hipótese alternativa,
e não pode conter a condição de igualdade.
Ao testarmos as hipóteses, podemos tomar duas decisões: rejeitar ou aceitar .

Estas podem estar correctas ou incorrectas, mesmo quando se faz o teste correctamente.
Erro no teste de hipótese
Quando a decisão é incorrecta, dois tipos de erros podem acontecer:
Erro tipo I: quando rejeitamos a hipótese nula sendo ela verdadeira. E a

probabilidade deste tipo de erro é dado da seguinte forma:
P (Erro tipo I) = é conhecido por nível de significância.
168
No exemplo 7.1, seria errado dizer que o tempo de reacção do medicamento Sem Dor
é menor que 15 minutos, quando, na verdade, é igual ou superior a 15 minutos;
No exemplo 7.2, seria errado dizer que o consumo dos hóspedes é superior a 500,00
Mt, quando na verdade é igual ou inferior a 500,00 Mt.
No exemplo 7.3, seria errado dizer que o consumo mensal de ligações por residência é
diferente de 3 horas e 35 minutos, quando, na verdade, esse consumo é igual a 3
horas e 35 minutos.
A probabilidade de rejeitar , quando ela é verdadeira, é chamada de nível de

significância (denotada por α ) e geralmente é determinada antes de se realizar o teste.
Erro tipo II: quando não rejeitamos a hipótese nula , sendo ela falsa. E a
probabilidade deste tipo de erro é dado pela forma: P (Erro tipo II) =
No exemplo 7.1, seria errado dizer que o tempo de relacção do novo medicamento é
igual ou superior a 15 minutos, quando na verdade é inferior a 15 minutos;
No exemplo 7.2, seria errado dizer que o consumo dos hóspedes é igual ou inferior a
500,00 Mt, quando, na verdade, é superior a 500,00 Mt;
No exemplo 7.3, seria errado dizer que o consumo mensal de ligações por residência é
igual a 3 horas e 35 minutos, quando, na verdade, é diferente de 3 horas e 35 minutos.
A probabilidade de não rejeitar , quando ela é falsa, é representada pelo símbolo β.
Observação: No teste de hipóteses, devemos escolher a probabilidade do erro tipo I

( ), mas não seleccionamos a probabilidade do erro tipo II . O ideal seria se
, mas isso não é possível. Devemos controlar as probabilidades de erro α e
β. Pode-se mostrar, matematicamente, que, , e o tamanho da amostra estão
todos inter-relacionados, de forma que, escolhidos quaisquer dois deles, o terceiro está
automaticamente determinado. Na prática, o comum é determinar os valores de e ,
de modo que o valor de fique determinado.
Além das definições anteriores, existem outras componentes que precisam ser
definidas:
Estatística de Teste: é um valor baseado nos dados amostrais para tomar uma
decisão sobre a rejeição da hipótese nula. No caso de teste para média, ela é (a
decisão) formada pela média amostral e pelo desvio padrão. Veremos, mais adiante,
como se constrói a estatística de teste;
169
Região Crítica: é o conjunto de todos os valores da estatística de teste que levam à
rejeição da hipótese nula;
O Valor Crítico: é o valor, ou valores que separa(m) a região crítica dos valores da
estatística de teste que não levam à rejeição da hipótese nula. Os valores críticos
dependem da natureza da hipótese nula, da distribuição amostral, e do nível de
significância .
Estatísticas de Teste
A estatística de teste, é utilizada no teste de hipóteses, e é construída a partir do

Teorema Central do Limite. Para a média, é dada por:
X
z 0
, considerando que o valor de μ0 é o valor extremo dado pela hipótese nula.
n
Também, podemos definir a estatística de teste para a proporção:
pˆ p0
z , sendo que p0 é o valor extremo fornecido pela hipótese nula.
p0 (1 p0 )
n
E a estatística do teste para variância é: ;
Etapas de um teste estatístico
1) Definir as hipóteses ( );
2) Especificar o nível de significância;
170
3) Seleccionar a estatistica do teste;
4) Estabelecer o valor critico ou valores críticos;
5) Determinar o valor real (observado) da estatística do teste;
6) Tomar decisão, consequentemente a respectiva conclusão
LIÇÃO N° 22
Teste de Médias
1. Saber determinar a estatística do teste para médias;

2. Saber escolher a estatística correspondente para cada caso;
171
7.22.1 Teste de Médias
Tipos de Testes: Bilateral ou Unilateral
As caudas de uma distribuição são as regiões extremas delimitadas pelos valores

críticos. A partir de , dá para saber qual é o tipo de teste. A cauda corresponde à
região crítica que contém os valores que rejeitam a . A figura, a seguir, ilustra como
se verificam os tipos de testes. No exemplo 7.1, o teste é unilateral (esquerdo). No
exemplo 7.2, o teste é unilateral (direito). No exemplo 7.3, o teste é (bilateral). As
expressões unilateral e bilateral, em alguns livros, são denominadas unicaudal e
bicaudal.
Observação: Quando o teste é unilateral, as hipóteses são definidas como:
contra para o teste unilateral direito ou
contra
Contudo, alguns autores usam as mesmas hipóteses definidas de forma diferente:
contra para o teste unilateral direito ou
contra para o teste unilateral esquerdo
A diferença está no sinal de igualdade para a hipótese nula no teste unilateral, mas
essa diferença de notação não altera a construção do teste.
Exemplo 7.4
172
Uma organização de defesa do consumidor afirma que os consumidores dos postos de
gasolina da Petromoc estão a ser prejudicados em virtude da seguinte condição:
quando o marcador indica 1 litro, a quantidade média de combustível fornecida é
realmente inferior a 1 litro.
a) Expresse, de forma simbólica, a afirmação de que os postos da Petromoc estão a

prejudicar os consumidores.
R: A afirmação de que os consumidores estão a ser prejudicados é equivalente a

afirmar que a média é inferior a 1 litro, o que, em forma simbólica, expressa-se como
litro.
b) Identifique a hipótese nula .
R: A afirmação original litro não contém a igualdade, conforme exigido pela

hipótese nula. A afirmação original é a hipótese alternativa; e a hipótese nula é
.
c) Identifique a hipótese alternativa .
R: A hipótese alternativa é .
d) Identifique este teste como bilateral, unilateral direito ou unilateral esquerdo.
R: Este teste é unilateral esquerdo, porque a hipótese nula é rejeitada se a média

amostral é significativamente inferior a 1 (está à esquerda de 1). (Como uma dupla
verificação, note que a hipótese alternativa contém o sinal , que aponta para a
esquerda.)
e) Identifique o erro tipo I para este teste.
R: O erro tipo I (rejeição de uma hipótese nula verdadeira) consiste em rejeitar

quando a média populacional é realmente igual ou superior a 1. Trata-se de
um erro sério, porque os postos da Petromoc serão acusados de prejudicar os
consumidores quando, na realidade, não há tal prejuízo.
f) Identifique o erro tipo II para este teste.
R: O erro tipo II (não rejeitar a hipótese nula falsa) consiste em não rejeitar
litro, quando a média populacional é realmente inferior a 1. Isto é, concluímos que não
há evidência suficiente para comprovar o prejuízo, quando esse prejuízo está ocorrer.
173
g) Suponha que a conclusão seria rejeitar a hipótese nula. Enuncie a conclusão em
termos não-técnicos; Lembre-se que deve lidar com a afirmação original.
R: Concluir que há evidências suficientes para apoiar a afirmação de que a quantidade

média de combustível fornecida é inferior a 1 litro.
f) Suponha que a conclusão seja não rejeitar a hipótese nula. Enuncie a conclusão em
termos não-técnicos; Lembre-se que deve lidar com a afirmação original; certifique-se.
R: Concluir que não há evidência suficiente para apoiar a afirmação de que a

quantidade média de combustível fornecida é inferior a 1 litro. Para realizarmos os
testes, temos que levar em consideração o tipo de teste (bilateral ou unilateral), e se a
variância dos dados é conhecida ou não. Se esta for desconhecida, devemos observar
se a amostra é grande ( ) ou não. Isto é importante, porque a partir dessa análise
é que as estatísticas de teste e a região crítica são construídas.
Vamos estudar todos os três casos:

2
Caso 1: Teste unilateral para conhecida ou amostra grande ( )
Quando se realiza um teste bilateral ou unilateral, onde as hipóteses se descrevem

como: hipótese alternativa - (valor especificado por ) ou , no
caso dos testes unilaterais esquerdo e direito, respectivamente. A partir de uma
amostra dos dados, calcula-se a estatística X . No caso em que a variância é
conhecida, a estatística de teste será:
X 0
z
n
No caso em que a variância é desconhecida, mas a amostra é grande ( ) ,

utiliza-se o valor de dos dados como uma estimativa de σ . Portanto, a estatística de
teste será:
X 0
z
S n
Exemplo 7.5
O dono de um grande supermercado afirma que o gasto mensal de seu

estabelecimento com energia eléctrica é 40000 kW/h. O consultor contratado pelo
supermercado deseja avaliar se esta afirmação é verdadeira. Após 36 dados referentes
ao consumo dos meses anteriores terem sido colhidos, ele observa que: X =420000
kW/h e S = 3500 kW/h. O teste será realizado tendo em conta que a probabilidade do
174
erro tipo I é 0,05. Suponha que o consumo de energia do supermercado segue uma
distribuição normal.
Hipóteses:
Estatística de Teste:
X 0
Pelas observações, temos: z
S n
420000 40000
z 3, 43
3500 36
Decisão:
Como, decide-se rejeitar , a 5% de significância.
Conclusão:
Há evidências de que o consumo de energia desse supermercado não é 40000 kW/h.
Caso 2: Teste unilateral para σ2 desconhecida e amostra pequena (n < 30)
Nos casos vistos até ao momento, a amostra era grande e, portanto, era possível
utilizar o Teorema Central do Limite e usar a aproximação normal para a estatística de
teste. Contudo, não podemos utilizar esse teorema para amostras pequenas. Para
realizar testes com pequenas amostras, vamos seguir o mesmo raciocínio que foi
175
utilizado na estimação do intervalo. Ao invés de utilizar a aproximação normal, vamos
recorrer à distribuição de t - Student. A estatística de teste, neste caso, é:
X 0
t
S n
A região crítica é construída utilizando a distribuição t com n - 1 graus de liberdade. No

caso em que a hipótese é unilateral, temos:
Quando se observa o valor da estatística na região crítica, deve-se rejeitar . Caso

contrário, não se deve rejeitar . Podemos escrever:
para o teste unilateral esquerdo e

para o teste unilateral direito.
O valor crítico tα,n-1 é o valor de t da tabela t de Student , que fornece uma área de α na
extremidade superior da distribuição t, com n - 1 graus de liberdade.
Voltando ao exemplo 7.2, o contador do hotel irá avaliar se a média de gastos de

hóspedes no fim de semana é superior a 500,00 MT. Para isso, seleccionou
aleatoriamente gastos de 22 hóspedes que estiveram no hotel em fins de semana num
determinado mês. Os dados observados (em meticais) foram: 475, 612, 382, 520, 600,
580, 490, 615, 475, 530, 470, 700, 385, 580, 645, 430, 450, 555, 527, 410, 585, 620.
O teste será realizado considerando α = 0.01.
176
Hipóteses: (já foram mostradas)
meticais contra meticais.
Estatística de Teste:
Primeiramente, calculam-se os estimadores da média e desvio:
475 612........ 585 620

X 528,9
22
(475 528,9) 2 ...... (620 528,9) 2

S 88, 0
21
A estatística de teste será:
528,9 500
tobs 1,54
88 / 22
Região Crítica:
Pela tabela da distribuição t o valor crítico é t0,01;21= 2,518 .
A região crítica do teste é
Decisão:
Como , decide-se pela não rejeição de meticais.
Conclusão:
Portanto, a 1% de significância, não há evidências de que o gasto dos hóspedes seja

superior a 500,00 MT.
Caso 3: Teste bilateral para σ2 desconhecida e amostra pequena (n < 30)
Seguindo o mesmo raciocínio do Caso 2, o teste bilateral também segue a distribuição t

de Student. A estatística de teste será:
177
X 0
t
S n
A região crítica é construída utilizando a distribuição t com n -1 graus de liberdade. No

caso em que a hipótese é bilateral, temos:
Quando se observa o valor da estatística na região crítica, deve-se rejeitar , caso

contrário, não se deve rejeitar H0. Podemos escrever a região crítica no teste bilateral
. O valor crítico tα/2, n-1 é o valor de t
da tabela t de Student que fornece uma área α/2 na extremidade, superior a
distribuição t com n-1 graus de liberdade.
Exemplo 7.6: Um administrador da área de marketing deseja avaliar o preço de um

produto comestível no mercado. Para tal, ele selecciona aleatoriamente os registos do
produto em 16 lojas e obtêm o valor médio de X = 7,50 com um desvio padrão de S
=1,00.
Supõe-se que os salários da empresa sejam normalmente distribuídos. Queremos

testar a hipótese nula usando um nível de significância de 10%.
Observe que a hipótese alternativa, nesse caso, é . Como o desvio foi

estimado a partir dos dados e a amostra é pequena, então devemos utilizar a
estatística t:
7,50 8, 00
tobs 2
1, 00 16
Região Crítica:
178
Pela tabela da distribuição t, o valor crítico é t0,05, 16= 1,753. Este é o valor de t da tabela
t de Student, que fornece uma área de 0,05 na extremidade superior da distribuição t
com 15 graus de liberdade.
A região crítica do teste é:
Decisão:
Como decidimos rejeitar à 10% de significância. Portanto,

há evidências de que o valor do produto não é 8,00 Mt.
Valor p (nível descritivo)
Ao realizarmos um teste de hipóteses, partimos de um dado valor de α pré-fixado, para

construir a regra de decisão. A alternativa é deixar a cargo de quem vai utilizar as
conclusões do teste, a escolha do valor para a probabilidade , que não precisará de
ser fixada a priori (antes de realizar o teste). A ideia consiste em estimar a
probabilidade (usando a distribuição t ou a normal padronizada) de se obter estimativas
mais desfavoráveis ou extremas do que fornecidas pela amostra (pelas estatísticas tobs
ou zobs), quando a hipótese nula é verdadeira. Ou alternativamente é ter um valor p,
denotado por α*. Isto funciona em todos os casos vistos anteriormente. Valores
pequenos de α* evidenciam que a hipótese nula é falsa. Como a amostra é uma
ferramenta de inferência sobre a população, ela fornece uma estimativa que teria a
probabilidade muito pequena de acontecer, se fosse verdadeira.
O conceito do que é “pequeno” fica a cargo do responsável pelo teste, que decide qual
α usar para comparar com o valor obtido α*. Quando não é definido o valor de α para
se fazer a comparação, é recomendado usar o nível 0,05.
179
Caso unilateral:
Para amostras grandes ou variância conhecida, o valor p será verdadeira, que

significa usar o valor extremo de :
E no caso de amostras pequenas será verdadeira, que significa usar o valor

extremo de :
Observação
Alguns valores de nível descritivo não estão acessíveis nas tabelas das distribuições
normal padronizada de t. Quando não há um software disponível para fazer o cálculo,
mas somente as tabelas, é possível fazer uma aproximação para o valor p,
especificando entre que valores ele se situa. No Excel 2003, obtém-se o valor p na
função DIST.NORMP, para a distribuição normal padronizada e DISTT para a
distribuição t. Veja, na ajuda do Excel, que a função disponibiliza a distribuição
acumulada até o ponto zobs ou tobs.
Exemplos de ilustração
1º exemplo: Voltando ao exemplo do medicamento Sem Dor, a estatística de teste foi

zobs = -1,85.
O valor p é:
180
Isso significa que a probabilidade de dizer que o tempo de reacção do medicamento é
minutos quando na verdade é é 0,0322. O erro que estaria a ser
cometido seria pequeno. Por isso, é que se decide pela rejeição de
2º exemplo: Voltando ao exemplo 7.2, o valor p é dado por:

. Se o nível de significância adoptado fosse 0,05,
decidiríamos não rejeitar , e se fosse 0,1 decidir-se-ia rejeitar . A decisão final será
de acordo com a vontade de quem realiza o teste. Ele irá avaliar se o erro é grande e
ira decidir se rejeita a , ou se é tolerável, podendo rejeitar .
Ao calcularmos o nível descritivo (valor p), precisamos de considerar que parte da

região crítica está associada aos valores de zobs e tobs que estão muito distantes (para
mais ou para menos) daquele previsto pela hipótese nula. Dessa forma, o
procedimento usual é multiplicar por dois a probabilidade obtida em uma das caudas,
de modo a preservar a ideia de afastamento bilateral. Assim, ao testarmos
contra , a definição do valor p depende da relação entre X e , que é o
mesmo que avaliar se zobs e tobs são maiores do que zero:
Se para o caso da amostra grande ou variância conhecida, ou , para o

caso da amostra pequena e variância desconhecida:
, respectivamente.
Se para o caso da amostra grande ou variância conhecida, ou , para

o caso de amostra pequena e variância desconhecida:
, respectivamente.
Vejamos, por exemplo, como se encontra o valor p no caso em que e

são maiores do que zero.
181
3º exemplo: Voltando ao exemplo do consumo de energia num supermercado,
tínhamos as hipóteses kW/h contra kW/h. Se formos
tomar a decisão a partir do valor p, temos que:
, porque ;
Como, neste caso, o valor p é muito pequeno, e decidimos rejeitar a , levando à

mesma conclusão que no procedimento do teste de hipóteses.
Exemplo 7.7
Uma fábrica de chocolates suspeita que embalagens de 450 gramas de um certo tipo
de chocolate em barra, estão abaixo do peso. Para verificar tal afirmação, foram
seleccionadas aleatoriamente 80 barras em vários lotes de produção, obtendo-se uma
média de peso de 447 gramas. Se admitirmos que o peso das barras de chocolate
segue o modelo Normal, com um desvio padrão de 10 gramas, que conclusão pode ser
tirada através do nível descritivo?
(peso médio, conforme previsto na embalagem)
(peso médio, abaixo do previsto na embalagem)
O valor observado na amostra foi X = 447 e as suposições feitas sobre a normalidade

da variável peso implicam que X  N ( , 2 / n) , ou seja, X  N ( ,100 / 80) ,
padronizando, calculamos a estatística:
X 447 450
zobs 2, 68
/ n 10 80
Portanto, o valor p é de 0,37%, o que indica que a probabilidade de que sugere valores
da estimativa mais desfavoráveis à hipótese nula. Note que o valor do nível descritivo
relaciona-se directamente com o nível de significância. Neste exemplo, se tivéssemos
182
fixado o nível de significância em qualquer valor, igual ou superior a 0,37%, a
conclusão seria a rejeição de , ao passo que valores inferiores a 0,37% conduzir-
nos-iam à aceitação da hipótese nula.
183
LIÇÃO N° 23
Teste para Proporção
1. Saber determinar a estatística do teste para proporções;

184
7.23 Teste para proporção
Vamos, agora, ilustrar como podemos testar uma afirmação sobre uma proporção,
probabilidade ou percentagem. O raciocínio é semelhante ao que foi desenvolvido no
teste para a média. Só que neste caso, da proporção, as observações se originam de
um modelo Binomial, e de acordo com Webster (2007), a distribuição amostral das
proporções amostrais pode ser aproximada por uma distribuição normal. As hipóteses
no teste para proporção são:
E a estatística de teste é:
pˆ p0
z
p0 (1 p0 )
n
Tal que p̂ é a proporção observada na amostra e n é o número de observações da

amostra. Observe que o desvio utilizado no teste é p0 (1 p 0 ) fornecido pela
hipótese nula, ele não é estimado pelos dados. Por isso, a aproximação da estatística
de teste é feita pela distribuição normal padronizada. Assim, a região crítica será:
Quando se observa o valor da estatística z na região crítica, deve-se rejeitar . Caso

contrário, não se deve rejeitar . Podemos escrever:
para o teste unilateral esquerdo
185
para o teste unilateral direito
Quando se observa o valor da estatística z na região crítica, deve-se rejeitar . Caso

contrário, não se deve rejeitar . Podemos escrever a região crítica da forma:
Critério do valor p no teste de proporção:
Seguindo o mesmo raciocínio que foi ilustrado para o valor p para o teste da média,
temos:
Ao testarmos : contra , a definição do valor p depende da

relação entre p̂ e p0 , que é o mesmo que avaliar se zobs é maior ou menor do que
zero:
Se
Se
Exemplo 7.8: O Departamento de Recursos Humanos de uma grande empresa

multinacional, preocupado com a qualidade de vida dos seus funcionários, deseja
saber se a proporção de fumadores na sua empresa é superior a 30%. Para tal, o
administrador responsável pelo estudo seleccionou aleatoriamente 40 funcionários, e
verificou que 9 fumavam. Qual foi a conclusão do administrador a um nível de
significância de 5%?
186
A proporção de fumantes estimada é:
8
pˆ 0, 2
40
Região Crítica:
Como o teste é unilateral direito, a região crítica é dada por:
Estatística de teste:
0, 2 0,3
zobs 1,38
(0,3x0, 7)
40
Decisão:
Como 1,38 não pertence à região crítica, decide-se pela não rejeição de com 5% de
significância. Logo, há evidências de que a proporção de fumantes não é superior a
30%.
Critério de decisão pelo valor p
O valor p é , comparado com o nível 0,05,

decide-se não rejeitar de .
Exemplo 7.9
A Mcel deseja saber se a proporção de consumidores que utilizam seu serviço é de

50% da população da província de Maputo. Para isso, ela seleccionou aleatoriamente
187
100 consumidores, dos quais 48 informaram que utilizam seus serviços. Tire
conclusões a 5% de significância.
A proporção amostral observada é:
48
pˆ 0, 48
100
Hipóteses:
Estatística de teste:
0, 48 0,5
zobs 0, 40
(0,5 x0,5)
100
Região Crítica:
Como é , decidiu-se não rejeitar ; isso significa

que não há evidência suficiente para rejeitar a afirmação de que 50% dos
consumidores utilizam o serviço da empresa MCel.
Ao tomar a decisão usando o valor p, consideramos que o teste é bilateral e ,

então temos:
188
Como o valor p supera o nível de significância 0,05, não rejeitamos a hipótese nula e,
novamente, concluímos que não há evidência suficiente para rejeitar a afirmação de
que 50% dos consumidores que utilizam os serviços da Mcel sejam de Maputo.
7.23.1 Usar intervalos de confiança para tomada de decisões
O intervalo de confiança pode ser utilizado para tomada de decisões no caso de teste
de hipóteses bilateral. Sejam as hipóteses contra , a decisão
tomada será:
 Rejeita-se , se não pertence ao intervalo de confiança;

 Não se rejeita , se pertence ao intervalo de confiança.
O nível de confiança considerado no intervalo, em termos do teste de

hipóteses, será o nível de significância. A tomada de decisões, por meio do intervalo,
serve de teste de média com variância conhecida e desconhecida (amostra grande e
pequena), e para o teste de proporção.
Para o Exemplo 6.2, da unidade temática VI, em que a EMOSE deseja testar se a
idade média dos proprietários de apólices de seguro de vida é 40 anos, com 10% de
significância. O teste é ; contra .
O intervalo de 90% construído foi , como pertence ao intervalo,

não se deve rejeitar . Portanto, a 10% de significância, há evidências de que a idade
média dos proprietários de apólices de seguro de vida da EMOSE é 40 anos.
Para o Exemplo 6.3, da unidade temática VI, sobre o número de faltas de funcionários
por ano, deseja-se testar se o número médio de faltas é 2,5 , com 5% de significância.
O teste é ; contra
O intervalo de 95% de confiança para o número médio de faltas para cada funcionário,
por ano, construído foi ; como não pertence ao intervalo, deve-
se rejeitar . Portanto, a 5% de significância, há evidências de que o número médio de
faltas para cada funcionário, por ano, não é 2,5.
189
LIÇÃO N° 24
Teste para Variância
1. Saber determinar a estatística do teste para variância;

190
7.24 Teste para variancia
Se é a variância de uma amostra aleatória de tamanho , for retirada numa

populacao normalmente distribuída com media e variância conhecidos, então o valor da
estatística do teste é:
Exemplo 7.9: Para diminuir a emissão do monóxido de carbono, uma fabrica de

producao de carros, depois de 4 anos de experiencis estimou que a media e o desvio
padrão do monóxido emitido era 0,3 e 0,025% por unidade do volume de oxido de
carbono. No sexto ano de funcionamento dosa padrões, uma amostra de 20 carros foi
retirada e foram medidos os desvios padraos.
0,292; 0,287; 0,274; 0,331; 0,332; 0,325; 0,285; 0,353; 0,293; 0,310
0,328; 0,315; 0,300; 0,298; 0,229; 0,316; 0,314; 0,281; 0,262; 0,283
Teste ao nível de significância de 10%, se a variância actual execede 0,025%.
Rejeitar se
, ,
Decisão:
Não rejeitar .
Conclusão:
191
Ao nível de significância de 10% não há evidencias suficientes para apoiar a afirmacao
de que actual a variância excede 0,025.
LIÇÃO N° 25
TESTES DE HIPÓTESE PARA DUAS AMOSTRAS
1. Descrever as estatísticas do teste para duas amostras;

2. Realizar ou resolver problemas que envolvem comparação de duas variâncias;
192
7.25 Testes de hipotese para duas amostras
a) Diferencas de médias
 Quando as variâncias (populacionais) são conhecidas e diferentes a
estatística do teste é dada por :
 Quando as variâncias (populacionais) são conhecidas e iguais a estatística

do teste é dada por:
 Quando as variâncias não são conhecidas e os tamanhos da amostra

a estatística do teste é dada por:
 Quando as variancias (populacionais) são desconhecidas e iguais

e amostras são pequenas a estatística do teste será dada por:
onde
 Quando as variâncias (populacionais) são desconhecidas e

amostras pequenas, a estatística do teste será dada por:
Teste para comparação de duas variâncias
onde ,
Exemplo 7.10: Ao nível de significância de 1% teste afirmação de que as latas de

0,0109 de espessura tem carga axial media inferior a das latas de 0,011 de espessura.
Os dados amostrais encontram-se a seguir:
193
(Carga axial: peso máximo que seus lados podem suportar)
Carga axial de latas 175 267,1 22,1

de 0,0109
Carga axial de latas 175 281 27,8

de 0,0111
Como as variâncias são desconhecidas e as amostras são grandes, a estatística do

teste será:
Regra de decisão:
Rejeitar se o
, quando
Decisão
Rejeitar
Conclusão:
Ao nível de significância de 1% há evidências suficientes para apoiar a afirmação de

que as latas de 0,0109 tem carga axial média inferior que a das latas de carga axial
0,0111.
194
Exemplo 7.1: Ao nível de significância de 5%, o teste da afirmação de que a qualidade
média de Nicotina em cigarros do tipo King-Size com filtro é igual a quantidade média
de Nicotina presente em cigarros sem filtro.
Nicotina (mg)
King-Size com filtro King-Size sem filtro
Como e são desconhecidos e não sabemos se são iguais devemos efectuar o

teste preliminar de variâncias.
E a estatística do teste será onde
Regra de decisão: Rejeitar se
Decisao: Não rejeitar
Entao, como os tamanhos das amostras e são pequenos, usaremos
Regra de decisão: Rejeitar se o ou .
195
e
Decisão:
Rejeitar
Conclusão: Ao nível de significância 5% há evidencia suficientes que .
Nesta unidade não foram tratados temas tais como: Testes para duas populações e
Análise de Variância.
Texto 1
McGraw-Hill, 2006.
Ler este livro capítulo IX e X de pagina 222 a pagina 294.
Texto 2
McGraw-Hill, 2006.
Ler este livro capítulo VIII e IX de pagina 193 a pagina 215.
196
TABELAS ESTATÍSTICAS
Abaixo, estão apresentadas as tabelas estatísticas que irás necessitar durantes os teus
estudos nesta disciplina.
Maior parte delas foram extraídas do livro do Allen Webster (2006).
197
198
199
200
201
202
203
204
205
206
207
BIBLIOGRAFIA
1. Reis, Elizabeth; Melo, Paulo; Andrade, Rosa e Calapez, Teresa. Estatística

Aplicada. Lisboa, 2001.
2. Reis, Elizabeth. Estatística Descritiva. Lisboa, 2005.
3. Webster, Allen L. Estatística Aplicada à Administracao e Economia. São

Paulo: McGraw-Hill, 2006.
4. Mulenga, Alberto. Manual de Introdução à Estatística. Maputo, 2004
208
BASE DE EXERCÍCIOS
Exercício 1 (Estatística Descritiva, Unidade Temática I)
Trinta e seis estudantes foram submetidos a um exame de biologia, onde se tem a

seguinte distribuição das notas:
93, 97, 72, 84, 88, 90, 78, 80, 89, 94, 95, 77, 81, 75, 72,
91, 94, 81
76, 70, 76, 83, 97, 73, 83, 87, 91, 83, 92, 90, 92, 77, 86,
86, 74, 87,
a) Classifique a variável
b) Construir a tabela de Distribuição de frequências
c) Calcule as medidas de tendência central
d) Calcule as medidas de dispersão
e) Desenhe o gráfico de barras
f) Apresente o Histograma da distribuição
Resolução:
a) Variável
Tipo: Variável quantitativa contínua
n = 36
b)
Cálculo do número de classes
Cálculo da amplitude total
209
Cálculo da amplitude de intervalo de classes
Grau de precisão (GP) – é a diferença mínima entre números consecutivos. Sendo

estes naturais o grau de precisão é igual a unidade “1”
Rol
O limite inferior para a primeira classe é igual ao observado. Sendo que, para
achar os subsequentes adicionamos a ao anterior.
Os limites superiores são obtidos adicionando o , que é a diferença entre a

amplitude do intervalo de classe com o grau de precisão ao limite inferior de cada
intervalo de classe.
i Classes
1 70 – 73 70, 72, 72, 73

2 74 – 77 75, 76, 76, 77, 77, 74
3 78 – 81 78, 80, 81, 81
4 82 – 85 84, 83, 83, 83
5 86 – 89 88, 89, 87, 86, 86, 87
6 90 – 93 93, 90, 91, 92, 90, 92, 91
7 94 – 97 94, 95, 94, 97, 97
Como se vê há descontinuidade nos limites, daí o nome de limites aparentes, pelo que
é necessário transformá-los em limites reais, ou seja estabelecer a continuidade nos
limites. Bastando somente subtrair os limites inferiores pela metade do grau de
precisão, assim como adicioná-lo aos limites superiores.
I Classe
1 69,5 – 71,5 4 4 11 11 286 84,3 -12,80 655,36

73,5 0 0
210
2 73,5 – 75,5 6 1 17 28 453 84,3 -8,80 464,64
77,5 0 0 0
3 77,5 – 79,5 4 1 11 39 318 84,3 -4,80 92,16
81,5 0 4 0
4 81,5 – 83,5 4 1 11 50 334 84,3 -0,80 2,56
85,5 0 8 0
5 85,5 – 87,5 6 2 17 67 525 84,3 3,20 61,44
89,5 0 4 0
6 89,5 – 91,5 7 3 19 86 640,50 84,3 7,20 362,88
93,5 0 1 0
7 93,5 – 95,5 5 3 14 100 477,50 84,3 11,20 627,20
97,5 0 6 0
_ _ _ _ _ _ _ 2266,24
c) Cálculo de Medidas de Tendência Central
Média
Moda
O primeiro passo consiste em achar a frequência modal

, e o seu respectivo intervalo de classe é
Frequência anterior á frequência modal = 6

Frequência posterior á frequência modal = 5
Limite real inferior é igual a 89,5
Mediana
211
Nota: O resultado da nossa fracção coincide com o valor da frequência absoluta
acumulada que satisfaz a nossa inequação.
Seu respectivo intervalo de classe é e a respectiva frequência absoluta,
designada por frequência mediana é 4.
Frequência acumulada anterior á frequência que satisfaz a nossa inequação é

igual a 14.
d) Cálculo de medidas de Variação
Variância
Como n é maior que 30, a fórmula é:
Desvio Padrão
Como n é maior que 30, a fórmula é:
212
=
Coeficiente de Variação (Cv) =
e) Diagrama de Barras
Diagrama de barras
6
Frequencias absolutas
0
71,50 75,50 79,50 83,50 87,50 91,50 95,50
notas
Ponto médio de classe - Xi
f) Histograma da distribuição
213
Histograma
5
Frequencia absoluta
Mean = 84,2778
Std. Dev. = 7,90519
0 N = 36
70,00 75,00 80,00 85,00 90,00 95,00 100,00
Notas
Exercício 2 (Estatística Descritiva, Unidade Temática I)
Na tabela abaixo figuram os dados correspondentes ao consumo de electricidade de

uma amostra de oitenta usuários.
Consumo
em
4 26 8
10 80
30,00 80,00 97,50
a) Completa a tabela
b) Determine o consumo médio da electricidade.
c) Determine o consumo mais comum da electricidade.
d) Determine o consumo central da electricidade.
e) Calcule as medidas de dispersão.
Resolução:
a)
Consumo Total
em
214
4 6 14 26 14 8 6 2
4 10 24 50 64 72 78 80 -
5 12,50 30,00 62,50 80,00 90,00 97,50 2,50 100,00
15 35 55 75 95 115 135 155 -

60 210 770 1950 1330 920 810 310 6360
79,50 79,50 79,50 79,50 79,50 79,50 79,50 79,50 -
4160,2 1980,2 600,25 20,25 240,25 1260,2 3080,2 5700,2 -

5 5 5 5 5
16641, 11881, 8403,5 526,5 3363,5 10082, 18481, 11400, 80780,0

00 50 0 0 0 00 50 50 0
Solução:
A frequência acumulada no primeiro intervalo é igual a da frequência absoluta, pelo

que:
; ;
; ;
; ;
; ;
; ;
; ;
; ;
; .
215
b) Consumo médio da electricidade
c) Consumo mais Comum da electricidade
O primeiro passo consiste em achar a frequência modal

, e o seu respectivo intervalo de classe é
Frequência anterior á frequência modal = 14

Frequência posterior á frequência modal = 14
d) Consumo central da electricidade
1º Passo
é 50.
Seu respectivo intervalo de classe , e a respectiva frequência absoluta,
designada por frequência mediana ( ) é 26.
A frequência acumulada anterior à frequência que satisfaz a nossa inequação
é 24.
216
e) Cálculo de medidas de Variação
Variância
Como é maior que 30, a fórmula é: Como n é maior que 30, a fórmula é:
Desvio Padrão
Coeficiente de Variação (Cv) =
Exercício 3 (Unidade Temática II)
217
Em uma indústria há pessoas que ganham mais de 20 salários mínimos ( ), 20 que
ganham entre 10 e 20 e 70 que ganham menos de 10 . Três pessoas desta
indústria são seleccionadas. Determinar a probabilidade de que pelo menos uma ganhe
menos de 10 .
A: a pessoa ganha mais de 20

B: a pessoa ganha entre 10 e 20
C: a pessoa ganha menos de 10 e
A probabilidade pedida, de pelo menos uma ganhar menos de 10 , significa que

podem ser mais de uma, portanto:
Exercício 4(Unidade Temática II)
Num concurso de televisão, para conhecer qual é o prémio a que tem direito, o
vencedor tira simultaneamente três bolas de uma urna. A urna contém seis bolas que
não se distinguem ao tacto, tendo três o número , duas o número e uma o
número
O concorrente recebe em contos a soma dos números das bolas retiradas.
Verifique que a probabilidade de ocorrer o prémio de contos é de .
Resolução:
3 com o nº 0
6 Bolas 2 com o nº 500
1 com o nº 1000
Número de casos possíveis:
Número de casos favoráveis:

Tirar uma bola com o nº 1000 e duas bolas com o nº 0:
Tirar duas bolas com o nº 500 e uma bola com o nº 0:
218
A probabilidade de ocorrer o prémio de 1000 contos é de:
Num período de um mês, 100 pacientes sofrendo determinada doença foram

internados em um hospital. Informações sobre o método de tratamento aplicado em
cada paciente e o resultado final obtido estão no quadro abaixo.
Tratamento
A B Total
Resultado
Cura total 24 16 40
Cura parcial 24 16 40
Morte 12 8 20
Total 60 40 100
a) Sorteando aleatoriamente um desses pacientes, determinar a probabilidade de o

paciente escolhido:
ter sido submetido ao tratamento A;

ter sido totalmente curado ;
ter sido submetido ao tratamento A e ter sido parcialmente curado ;
ter sido submetido ao tratamento A ou ter sido parcialmente curado ;
b) Os eventos “morte ” e “tratamento A” são independentes? Justificar.
c) Sorteando dois dos pacientes, qual a probabilidade de que:
tenham recebido tratamentos diferentes?
pelo menos um deles tenha sido curado totalmente?
219
a)
b)
Como: ;
Temos:
Logo, os eventos “morte ” e “tratamento A” são independentes.
c) Seja tratamentos diferentes
Seja curado totalmente ( e a probabilidade de um paciente ter sido totalmente

curado é )
A probabilidade pedida é dada por:
Um dado equilibrado tem seis faces numeradas com 1, 2, 3, 4 ,5 e 6.

Lança-se o dado quatro vezes seguidas.
Qual é a probabilidade de obter nos quatro lançamentos:
220
1. Três vezes um número par?
2. Nenhum número par?
3. Pelo menos um número ímpar?
1
A probabilidade de se obter em cada lançamento um número par é:
(p)
Designando por p o acontecimento: “sair número ímpar”, vem:
P( )
O acontecimento em causa é a reunião dos acontecimentos:
A probabilidade de cada um destes:
Então a probabilidade pedida é:
2.
Pretende-se que saia número ímpar em todos os lançamentos.
A probabilidade pedida é:
3.
Aparecer pelo menos um número ímpar e o acontecimento contrário ao aparecimento
de quatro números pares.
Outro processo:
Recorrendo à análise Combinatória, pode usar-se a fórmula:
1.
(3)
2.
(4)
221
3.
(4)
Para certo exame, os candidatos devem preparar 100 temas dos quais três,
seleccionados ao acaso, sairão no exame.
Um candidato apresenta-se a exame tendo preparado apenas dos temas. Qual é a
probabilidade de que tenha estudado só dois temas que saíram?
três temas
Um candidato prepara apenas dos temas, ou seja, 25 dos temas.
O número de possibilidades de saírem 3 temas em 100 é dado por:
O número de possibilidades de saírem 2 dos 25 temas estudados é:
O número de possibilidades de sair 1 dos 75 temas não estudados é:
O número de casos favoráveis é dado por:
Então a probabilidade pedida é:
Exercício 8 (Unidade Temática VI)
Um estudo feito por um oficial de uma divisão de veículos blindados mostrou que numa
amostra aleatória de dias, a divisão possuía, em média, veículos em
condições operacionais. Sabendo que para tais dados, construa um intervalo
de 95% de confiança para o verdadeiro número médio diário de veículos que essa
divisão de veículos blindados possui em condições operacionais.
Resolução:
Como o tamanho da amostra é maior que 30, usamos a seguinte fórmula do intervalo
de confiança:
(grau de confiança)
222
O valor correspondente de é 1,96.
Substituindo na fórmula do intervalo de
confiança, obtemos os seguintes limites:
Onde os limites de confiança foram arredondados até a segunda casa decimal.
Resposta: Com de confiança pode-se dizer que o verdadeiro número médio diário
de veículos que essa divisão de veículos blindados possui em condições operacionais
a .
Durante a execução de determinada tarefa sob condições simuladas de

imponderabilidade, a média da taxa de batimentos cardíacos de 12 astronautas
aumentou em 27,33 batimentos por minuto, com desvio padrão de 4,28 batimentos por
minuto. Construa um intervalo de 99% de confiança para o verdadeiro aumento médio
da taxa de batimentos cardíacos dos astronautas no desempenho daquela tarefa.
Os limites de confiança de são dados por:
, ou
Onde e
Para . Então, os limites de confiança
de são:
e o intervalo de confiança
de é de a . Ou seja batimentos por minuto.
Com 99% pode-se estar confiante de que a verdadeira média está compreendida entre
e batimentos por minuto.
223
Uma amostra de 8 locais onde a pintura das estradas se mostrou deteriorada depois de
ter sido cruzada em média por 14,10 milhões de veículos com desvio padrão
milhões de veículos. Calcule um intervalo de de confiança para a média da
população considerada.
Tratando-se de pequena amostra, usaremos a estatística dada por:
Que é um valor de uma variável aleatória com a distribuição , ou seja, distribuição

de Student, ou distribuição de Student. Sabendo que essa variável irá assumir um
valor entre
e , por conseguinte temos:
Substituindo , , e para graus de

liberdade na fórmula do intervalo , obteremos:
Conclusão
Com este nível de 95%, pode-se estar confiante de que a verdadeira média está
compreendida entre a milhões de veículos.
Uma amostra de 10 medidas do diâmetro de uma esfera apresentou a média

e o desvio padrão . Determinar os intervalos de confiança de: (a)
; (b) para o diâmetro real.
Solução:
(a) Os limites de confiança de são dados por:
224
Para o coeficiente de confiança de A área total sombreada da figura é .
Portanto, a área sombreada da extremidade da direita é e o valor crítico
correspondente de é
Como , encontra-se Então, para e

os limites de confiança desejados de são:
Por conseguinte, pode-se estar confiante de que a média verdadeira está

compreendida entre e .
(b) Os limites de confiança de são dados por:
, onde e
Para . Então, os limites de confiança de são:
e o intervalo de confiança de
é de a .
Num estudo sobre a eficiência de um lubrificante de dobradiças, uma organização de

pesquisas quer investigar a variabilidade do número de ciclos, consistindo em abrir e
fechar uma porta, que leva para uma dobradiça começar a chiar. Usando
dobradiças e desvio padrão igual a , construa um intervalo de 95% de confiança
para .
Resolução:
225
Então substituindo:
para,
, na fórmula do intervalo de confiança de ,
obtemos
Conclusão: o intervalo de confiança para a verdadeira variância populacional é

, ou seja com 99% de confiança pode-se dizer que a verdadeira
variância populacional está entre 15.913 e 73.836 ciclos.
Estimativa do desvio padrão – Intervalo de Confiança para o desvio padrão

populacional
o que significa que extraindo as raízes quadradas do intervalo de confiança para a

variância: , obtemos ciclos.
A conclusão é a mesma tecida para o intervalo da variância.
Numa amostra aleatória de 2500 adultos entrevistados nacionalmente, somente 850

indicaram que os salários de certos membros do executivo deveriam ser aumentados.
Construa intervalos confiança para a verdadeira percentagem de adultos que
compartilham daquela opinião, adoptando:
a) 95% de confiança
b) 98% de confiança
a) Solução:
Intervalo de confiança para proporções
226
φ =
R: Para um erro de 5% pode-se dizer que o intervalo de confiança de que 34% dos
indivíduos compartilham da mesma opinião (“aumento de salário para certos membros
do executivo”) é de 32,1% a 35,9%.
b) Solução
φ =
R: E neste caso, com , pode-se dizer que o intervalo de confiança de que 34%
dos indivíduos compartilham da mesma opinião (“aumento de salário para certos
membros do executivo”) é de 31,8% a 36,2%.
Exercício 14 (Unidade Temática VII)
A altura média de 50 estudantes do sexo masculino, que tiveram participação superior

à média nas actividades atléticas escolares, era173,23 cm com desvio padrão de 6,35
cm, enquanto que os 5º que não mostraram nenhum interesse nessas actividades
apresentaram a média de 171,45 cm, com o desvio padrão de 7,11 cm. Testar a
hipótese dos estudantes do sexo masculino que participaram das actividades atléticas
serem mais altos do que os outros.
Solução:
227
Deve-se decidir entre as duas hipóteses:
, não há diferença entre as alturas médias.

, a altura média do 1º grupo é maior do que a do segundo.
Para a hipótese
e
Em que se consideram os desvios padrões das amostras como estimativas de e .
Para o nível de significância de 0,05, tem-se a seguinte regra de decisão:
1. Se o escore z observado for superior a 2,33, os resultados serão significativos

no nível de 0,05, e será rejeitada.
2. No caso contrário (nesse caso se for inferior), aceita-se
Então:
Com base num teste unilateral, no nível de significância de 0,05, onde , a área entre 0
e = 0,4500 e , foi necessário calcular a média
desses valores por ambos tem um desvio significativo do valor 0,4500.
Conclui-se ao nível de significância de 0,05 que não há diferença entre as alturas
médias dos dois grupos, pois o z observado é inferior.
A altura média de 50 estudantes do sexo masculino, que tiveram participação superior

à média nas actividades atléticas escolares, era173,23 cm com desvio padrão de 6,35
cm, enquanto que os 5º que não mostraram nenhum interesse nessas actividades
apresentaram a média de 171,45 cm, com o desvio padrão de 7,11 cm. De quanto
deveria ser aumentado o tamanho da amostra de cada um dos dois grupos para que a
diferença observada de 1,78 cm, entre as alturas médias, seja significativa no nível de
significância de 0,05? Os desvios permanecem os mesmos.
Solução:
Admita-se que o tamanho da amostra de cada grupo é N e que os desvios padrões dos
dois grupos permaneçam os mesmos. Então, para a hipótese , e
Para uma diferença observada 1,78 cm entre as alturas médias:
228
A diferença observada será significativa, no nível de 0,05, quando o z =1,645, ou seja,
no mínimo, de modo que de ser 78 no mínimo. Em consequência, a
amostra deve ser aumentada em cada grupo, de no mínimo.
Nota: Ao se dizer que a diferença entre as alturas é significativa, na regra de decisão

corresponde a dizer que deve-se rejeitar . Portanto para se rejeitar a hipótese nula
o escore z deve ser igual ou superior ao . Daqui também podíamos ter:
Outro método:
Dois grupos, A e B, são formados, cada um de 100 pessoas que padecem da mesma
enfermidade. É ministrado um soro ao grupo A, mas não ao B (denominado grupo de
controle); a todos os outros respeitos, os dois grupos são tratados de modo idêntico.
Determinou-se que 75 e 65 pessoas dos dois grupos A e B, respectivamente, curaram-
se da enfermidade. Testar a hipótese do soro auxiliar a cura da enfermidade, adoptado
o nível de significância de 0,01.
Solução:
Sejam e , respectivamente, as proporções populacionais (1) curadas mediante o

uso do soro, (2) sem o uso do soro. Deve-se decidir entre as duas hipóteses:
e as diferenças observadas são devidas ao acaso, isto é o soro não é
eficaz.
: e o soro é eficaz.
Para a hipótese :
e ,
Em que foi adoptada , para a estimativa de , a proporção média de curas nos dois
grupos da amostra, é dada por sendo .
229
Com base em um teste unilateral, no nível de significância 0,01, onde a área entre 0 e
por conseguinte
Para o nível de significância de 0,01, tem-se a seguinte regra de decisão:
1. Se o escore observado for superior a 2,33, os resultados serão significativos

2. No caso contrário (nesse caso se for inferior), aceita-se
Então,
Conclusão:
Como o escore é inferior, aceita-se , ou seja, as diferenças observadas são
devidas ao acaso.
Antigamente, uma certa máquina produzia arruelas que tinham a espessura de

Para se verificar se a máquina está trabalhando adequadamente, escolheu-se
uma amostra de 10 arruelas, cuja espessura média é e cujo o desvio padrão
é . Testar a hipótese da máquina estar trabalhando adequadamente,
adoptados os níveis de significância: (a) 0,05; (b) 0,01.
Solução:
Deseja-se decidir entre as hipóteses:
, e a máquina está trabalhando adequadamente.
e ela não o está, de modo que um teste bilateral é necessário
(a) Para a hipótese tem-se:
Para um teste bilateral, no nível de significância 0,05, adopta-se a seguinte regra de

decisão:
230
1. Aceitar quando t estiver compreendido no intervalo entre e , o
qual, para graus de liberdade, é o que vai de
2. No caso contrário, rejeitar .
Conclusão:
Como , rejeita-se no nível 0,05.
(b) Para um teste bilateral, no nível de significância 0,01, adopta-se a seguinte regra
de decisão:
1. Aceitar quando t estiver compreendido no intervalo entre e , o

qual, para graus de liberdade, é o que vai de
2. No caso contrário, rejeitar .
Conclusão:
Como , aceita-se no nível 0,01, ou seja, a máquina está trabalhando
adequadamente.
A tensão de ruptura dos cabos produzidos por um fabricante apresenta a média de

1800 kg e o Desvio de 100 kg. Mediante nova técnica no processo de fabricação,
proclamou-se que a tensão de ruptura pode ter aumentado. Para testar essa
declaração, ensaiou-se uma amostra de 50 cabos, tendo-se determinado que a tensão
média de ruptura de 1850 kg. Pode-se confirmar a declaração no nível de significância
de 0,01?
Solução:
kg e, nesse caso, não há realmente modificação da tensão de ruptura.

kg e, então, há modificação daquela tensão.
Deve-se neste caso, empregar um teste unilateral.

No nível de significância de 0,01, a área entre 0 e = 0,4900 e a regra de
decisão será:
1. Se o escore z observado for superior a 2,33, os resultados serão significativos
231
2. No caso contrário, aceita-se
Região
Crítica
Para a hipótese de que é verdadeira, determina-se:
O valor observado é superior a 2,33. Conclui-se, portanto, que os resultados são

altamente significativos e a declaração é confirmada.
A vida média de uma amostra de 100 lâmpadas fluorescentes produzidas por uma
companhia, foi calculada em 1570 horas, com o desvio padrão de 120 horas. Se éa
vida média de todas as lâmpadas produzidas pela companhia, testar a hipótese
horas, em face da hipótese alternativa horas, adoptando o nível de
significância de : (a) 0,05; (b) 0,01.
Solução:
horas. horas.
Deve-se empregar um teste bilateral neste caso, porque horas inclui tanto
os valores maiores como os menores do que 1600.
(a) Para um teste bilateral no nível de significância 0,05, há a seguinte regra de

decisão:
232
1. Rejeitar quando o z da média amostral estiver fora do intervalo:
2. Aceitar no caso contrário.

A estatística considerada é a média amostral . Sua distribuição amostral tem a média
e o desvio padrão , adoptando-se o desvio padrão da
amostra como uma estimativa para . Como cai fora do

intervalo -1,96 a 1,96, rejeita-se no nível de significância 0,05.
(b) Se o nível de significância é 0,01, o intervalo de -1,96 a 1,96 da regra de decisão

do item (a) é substituído pelo de -2,58 a 2,58. Então como o escore z de -2,50
cai dentro desse intervalo, aceita-se .
O fabricante de uma droga medicinal reivindicou que ela era 90% eficaz em curar uma
alergia, em um período de 8 horas. Em uma amostra de 200 pessoas que tinham
alergia, a droga curou 160 pessoas. Determinar se a pretensão do fabricante é legítima
ao nível significância de 1%.
Solução:
Seja p a probabilidade de obter-se a cura da alergia, mediante o uso da droga.
Então, deve-se decidir entre duas hipóteses:
a pretensão é correcta.
ela é falsa.
Região
Crítica
233
Sendo o nível se significância igual a 0,01, então a área entre 0 e = 0,4900 e
. Pelo que toma-se para regra de decisão:
1. A pretensão não será legítima quando z for inferior a -2,33 ( e nesse caso,
rejeita-se
2. No caso contrário, a pretensão será legítima e os resultados observados são
devidos ao acaso (e, então aceita-se ).
Se é verdadeira,
Posto isto, 160, em unidades reduzidas que é muito menor que -

2,33. Portanto de acordo com a regra de decisão, conclui-se que a pretensão não é
legítima e que os resultados da amostra são altamente significativos.
O valor observado também podia ser obtido través da seguinte fórmula:
Como se pode ver a diferença é tão insignificante que não se altera a conclusão
tomada.
234
235

Guia Estatística Aplicada A Ciencias Sociais VFF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Guia Estatística Aplicada A Ciencias Sociais VFF

Enviado por

Direitos autorais:

Formatos disponíveis

Universidade Politécnica

Maputo, Julho de 2010

© Série de Guias de Estudo para o Curso de Ciências da Educação

Todos os direitos reservados à Universidade Politécnica

Título: Guia de Estudo de Estaística Aplicada a Ciências Sociais

UNIDADE TEMÁTICA I – ESTATÍSTICA DESCRITIVA…………………. …...…………. 6

LIÇÃO Nº 1 - CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA DESCRITIVA…. ……7

LIÇÃO N° 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS…... …...…………………………….20

LIÇÃO N° 3 - MEDIDAS DE TENDÊNCIA CENTRAL E DE POSIÇÃO…. ……. ……...30

LIÇÃO N° 4 - MEDIDAS DE DISPERSÃO…. ………...………….…………………….….40

PARTE II - INFERÊNCIA ESTATÍSTICA………………………………………. ……..…. 47

UNIDADE TEMÁTICA II - TEORIA ELEMENTAR DAS PROBABILIDADES…………..48

LIÇÃO N° 7 - CONSIDERAÇÕES SOBRE LEIS, AXIOMAS E TEOREMAS…………..62

UNIDADE TEMÁTICA III - VARIÁVEIS ALEATÓRIAS…………….……………………..69

Lição Nº 8 - VARIÁVEIS ALEATÓRIAS DISCRETAS……………………………….…….70

LIÇÃO N° 9 - Características Numéricas das Variáveis Aleatórias Discretas…………..77

LIÇÃO N° 10 - VARIÁVEIS ALEATÓRIAS CONTÍNUAS ……………………..………….81

UNIDADE TEMÁTICA IV - DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS.…...……92

LIÇÃO N° 12 - DISTRIBUIÇÃO DE VARIÁVEIS ALEATÓRIAS DISCRETAS………….93

LIÇÃO N° 13 - DISTRIBUIÇAO DE VARIAVEIS ALEATORIAS CONTÍNUAS………..100

UNIDADE TEMÁTICA V - TEORIA ELEMENTAR DE AMOSTRAGEM….……...……116

LIÇÃO N° 16 - Métodos de Amostragem………………………………….………………121

LIÇÃO N° 17 - Determinação do tamanho de uma amostra………………..…………..129

LIÇÃO N° 18 - Distribuições Amostrais………………………………………...………….135

UNIDADE TEMÁTICA VI - TEORIA ESTATÍSTICA DE ESTIMAÇÃO…….…………..141

LIÇÃO N° 20 - ESTIMATIVAS DE PARÂMETROS……………………..……………….148

UNIDADE TEMÁTICA VII - TESTE DE HIPÓTESES….……………….……...………..157

LIÇÃO N° 22 - Teste de Médias………………………………………………..…………..165

LIÇÃO N° 23 - Teste para Proporção………………………………………...……………178

LIÇÃO N° 24 - Teste para Variância……………………………………………………….184

LIÇÃO N° 25 - TESTES DE HIPÓTESE PARA DUAS AMOSTRAS…..………………186

É com muito prazer que te apresentamos a presente obra científica – o Manual de

No início de cada unidade e lição apresentamos os respectivos que deves tê-los em

Por fim, o manual é acompanhado por um caderno de exercícios, dividido em duas

O oitavo objectivo desta disciplina diz respeito ao processamento e análise de dados

Este é um manual auto-instrutivo, pelo que:

Procure sempre relacionar a teoria com a prática, reflectindo sobre como os

Procure sempre entender antes de mais a parte teórica de cada lição.

Não deixe de fazer as leituras obrigatórias e complementares.

Os objectivos apresentados em cada unidade e lição são uma forma resumida

Quando se pretende tomar decisões ou efectuar estudos de natureza científica, torna-

A utilização da Estatística é cada vez mais importante em qualquer actividade

A disciplina de Estatística aplicada a ciências sociais no curso de licenciatura em

Abordaremos os tópicos mais importantes da Estatística Descritiva e Inferencial. A

Ao terminares esta cadeira, deves ser capaz de:

7. Conhecer os métodos mais importantes para estimação de parâmetros e

8. Processar e analisar dados estatísticos

2 Teoria Elementar das Probabilidades 10

4 Distribuições de Variáveis Aleatórias 10

5 Teoria Elementar de Amostragem 10

6 Teoria Estatística de Estimação 15

No fim desta unidade, deves ser capaz de:

1. Identificar o objecto da Estatística Descritiva e justificar a sua importância no dia-

2. Conhecer os principais conceitos inerentes à estatística descritiva e saber

3. Analisar e Interpretar dados estatísticos com recurso a gráficos e tabelas;

4. Tratar dados estatísticos para efeitos de generalização dos resultados;

CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA DESCRITIVA

No fim desta lição, deves ser capaz de:

1. Entender o conceito de estatística, e identificar o objecto de estudo da estatística

a) Conceito de Estatística e sua divisão

Mas o que será que significa a

Descritiva – é o ramo da estatística cujo objectivo (objecto da estatística descritiva)

A Estatística Descriva têm como objectivo observar fenómenos de mesma