Você está na página 1de 235

Universidade Politécnica

A POLITÉCNICA
Escola Superior Aberta

GUIA DE ESTUDO
ESTATÍSTICA APLICADA AS
CIENCIAS SOCIAIS
Curso de Ciências da Educação
(3º Semestre)

- Moçambique -
FICHA TÉCNICA
1
FICHA TÉCNICA

Maputo, Julho de 2010

© Série de Guias de Estudo para o Curso de Ciências da Educação


(Ensino a Distância).

Todos os direitos reservados à Universidade Politécnica

Título: Guia de Estudo de Estaística Aplicada a Ciências Sociais

Edição: 1ª

Organização e Edição
Escola Superior Aberta (ESA)

Elaboração
Sansão Pedro (Conteúdo)
Benedito Marime (revisão textual)

2
ÍNDICE

Apresentação do Manual……………………………………………………………………….1

Orientações Importantes……………………………………………………………………….2

Introdução……. ………………………………...……………………………………………….3

Objectivos da disciplina……………………………………………………………...…………4

Plano Temático………………………………………………………………………………….5
PARTE I – ESTATÍSTICA DESCRITIVA

UNIDADE TEMÁTICA I – ESTATÍSTICA DESCRITIVA…………………. …...…………. 6

LIÇÃO Nº 1 - CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA DESCRITIVA…. ……7

LIÇÃO N° 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS…... …...…………………………….20

LIÇÃO N° 3 - MEDIDAS DE TENDÊNCIA CENTRAL E DE POSIÇÃO…. ……. ……...30

LIÇÃO N° 4 - MEDIDAS DE DISPERSÃO…. ………...………….…………………….….40

PARTE II - INFERÊNCIA ESTATÍSTICA………………………………………. ……..…. 47

UNIDADE TEMÁTICA II - TEORIA ELEMENTAR DAS PROBABILIDADES…………..48


LIÇÃO N° 5 – PROBABILIDADES……...………………………………………………….. 50
LIÇÃO N° 6 - ANÁLISE COMBINATÓRIA.……………………………………………..…..57

LIÇÃO N° 7 - CONSIDERAÇÕES SOBRE LEIS, AXIOMAS E TEOREMAS…………..62

UNIDADE TEMÁTICA III - VARIÁVEIS ALEATÓRIAS…………….……………………..69

Lição Nº 8 - VARIÁVEIS ALEATÓRIAS DISCRETAS……………………………….…….70

LIÇÃO N° 9 - Características Numéricas das Variáveis Aleatórias Discretas…………..77

LIÇÃO N° 10 - VARIÁVEIS ALEATÓRIAS CONTÍNUAS ……………………..………….81


LIÇÃO N° 11 - CARACTERÍSTICAS NUMÉRICAS DAS VARIÁVEIS ALEATÓRIAS
CONTÍNUAS…………………………………………………………………………………...88

UNIDADE TEMÁTICA IV - DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS.…...……92

LIÇÃO N° 12 - DISTRIBUIÇÃO DE VARIÁVEIS ALEATÓRIAS DISCRETAS………….93

LIÇÃO N° 13 - DISTRIBUIÇAO DE VARIAVEIS ALEATORIAS CONTÍNUAS………..100

3
LIÇÃO N° 14 - Função de distribuição acumulada das probabilidades…….………….108

UNIDADE TEMÁTICA V - TEORIA ELEMENTAR DE AMOSTRAGEM….……...……116


LIÇÃO N° 15 - Introdução a Teoria Elementar de Amostragem……….……………….117

LIÇÃO N° 16 - Métodos de Amostragem………………………………….………………121

LIÇÃO N° 17 - Determinação do tamanho de uma amostra………………..…………..129

LIÇÃO N° 18 - Distribuições Amostrais………………………………………...………….135

UNIDADE TEMÁTICA VI - TEORIA ESTATÍSTICA DE ESTIMAÇÃO…….…………..141


LIÇÃO N° 19 - PARÂMETROS, ESTIMADORES E ESTIMATIVAS …………………..143

LIÇÃO N° 20 - ESTIMATIVAS DE PARÂMETROS……………………..……………….148

UNIDADE TEMÁTICA VII - TESTE DE HIPÓTESES….……………….……...………..157


LIÇÃO N° 21 - Introdução a Teste de Hipóteses………………………..………………..159

LIÇÃO N° 22 - Teste de Médias………………………………………………..…………..165

LIÇÃO N° 23 - Teste para Proporção………………………………………...……………178

LIÇÃO N° 24 - Teste para Variância……………………………………………………….184

LIÇÃO N° 25 - TESTES DE HIPÓTESE PARA DUAS AMOSTRAS…..………………186

TABELAS ESTATÍSTICAS………………………………………………………………….191
BIBLIOGRAFIA……………………………………………………………………………... 201

4
Apresentação do Manual

Prezado(a) estudante!

É com muito prazer que te apresentamos a presente obra científica – o Manual de


Estatística Aplicada a Ciências de Educação, apresentado na modalidade EAD
(Educação à Distância).

O presente manual, que tem por objectivo orientar os teus estudos individuais na área
de estatística, está organizado em 7 unidades (cujos temas se encontram no plano
temático adiante) agrupados em duas partes: uma de Estatística Descritiva e outra de
Inferência Estatística. Por sua vez, as unidades estão divididas em lições. Cada lição,
além de apresentar a parte teórica comporta uma parte prática, constituída por
exemplos agrupados em unidades, isto é, o exemplo 1.1 é o 1º exemplo da unidade 1.
A organização do manual por pontos, por exemplo, o ponto 1.1 traduz a 1ª lição dentro
da unidade 1, e, se for 1.1.1 indica o tópico 1 da lição 1 da unidade 1.

No início de cada unidade e lição apresentamos os respectivos que deves tê-los em


conta ao longo dos teus estudos. Ao longo das lições existem informações (resumos)
tão importantes que foram colocadas (os) em quadros pintados com palavras, que
chamam tua atenção, como: aprofundando, note que, repare que, etc. Esta(es)
informações (resumos) são indispensáveis para consolidares os conteúdos que vais
estudando.

Por fim, o manual é acompanhado por um caderno de exercícios, dividido em duas


partes: uma de exercícios resolvidos (os quais deves estudá-los com muita atenção
para a experiência te ajudar a resolver os não resolvidos) e a outra de exercícios não
resolvidos, os quais devem ser por ti resolvidos depois de perceberes o método de
resolução nas partes práticas de cada lição.

O oitavo objectivo desta disciplina diz respeito ao processamento e análise de dados


estatísticos utilizando alguns pacotes informáticos de estatística como o programa
Microsoft Excel e o SPSS. Para o prezado aluno adiquirir conhecimentos na utilização
desses pacotes lhe recomendamos a seguir as instruções descritas no livro do Allen
Webster (2006), para o caso de Excel, enquanto que, para o caso de SPSS lhe
recomendamos a usar o manual de utilização SPSS de Armando Mateus Ferreira, que
lhe será fornecido pela ESA.

O autor

5
Orientações Importantes

Este é um manual auto-instrutivo, pelo que:

Procure sempre relacionar a teoria com a prática, reflectindo sobre como os


conhecimentos teóricos são aplicados na resolução de exercícios tomados como
exemplos, e a partir dessa experiência resolver as questões apresentadas no
caderno de exercícios.

Procure sempre entender antes de mais a parte teórica de cada lição.

Faça planos para estudar e não se esqueça de fazer notas das partes que
achares importantes e com necessidade de revê-las para entendê-las.

Não deixe de fazer as leituras obrigatórias e complementares.

Os objectivos apresentados em cada unidade e lição são uma forma resumida


para orientar os teus estudos, por isso, não deves ignorá-los mas também podes
acrescentar acima destes outros pessoais.

Procure sempre, ao fim de cada unidade e lição, relacionar o que reteste com os
referidos objectivos para controlares a concretização dos mesmos.

6
Introdução

Quando se pretende tomar decisões ou efectuar estudos de natureza científica, torna-


se necessário, antes de mais, se efectuar uma busca de dados previamente
identificados. São estes dados que, acumulados de forma organizada, serão estudados
cuidadosamente para se extrair as informações relevantes a investigação, que se
pretende fazer. Para tal, o uso da estatística ou de métodos estatísticos é
indispensável.

A utilização da Estatística é cada vez mais importante em qualquer actividade


profissional, isto é, em todas áreas da actividade sócio económica da vida moderna.
Isto, se deve às múltiplas aplicações que o método estatístico proporciona aqueles que
dele necessitam. O reconhecimento desta utilização se tem traduzido na sua inclusão
em cursos do ensino superior, quer como curso autónomo, quer como tópico ou
disciplina integrada noutras disciplinas.

A disciplina de Estatística aplicada a ciências sociais no curso de licenciatura em


Ciências de Educação, pretende criar competências nos futuros profissionais nesta
área do conhecimento, no tratamento de dados estatísticos como resultado de estudos
e investigações conduzidas para responder a questões práticas e para ajudar na
tomada de decisões em pesquisas sociais e projectos sociais.

Abordaremos os tópicos mais importantes da Estatística Descritiva e Inferencial. A


matéria a ser ministrada é suficientemente ampla e esclarecedora para garantir que no
final desta disciplina tenhas o conhecimento suficiente para aplicação de estatística em
ciências sociais.

7
MANUAL DE ESTATÍSTICA APLICADA A

CIÊNCIAS SOCIAIS

Objectivos da Disciplina

Ao terminares esta cadeira, deves ser capaz de:


1. Dominar o conceito de Estatística e outras
terminologias usuais da cadeira;
2. Conhecer o objecto de estudo da Estatística
como também compreender as suas diferentes áreas de aplicação;
3. Conhecer os principais conceitos inerentes à
estatística descritiva e inferencial, e saber aplicar os seus princípios e
procedimentos;
4. Analisar e interpretar dados estatísticos através
de gráficos e tabelas;
5. Tratar dados estatísticos para efeitos de
generalização dos resultados, aplicando os conceitos e princípios da estatística
inferencial;
6. Formular e resolver problemas básicos de inferência estatística;

7. Conhecer os métodos mais importantes para estimação de parâmetros e


testes de hipóteses;

8. Processar e analisar dados estatísticos


utilizando alguns pacotes informáticos estatísticos como o programa Microsoft
Excel e o SPSS;

8
PLANO TEMÁTICO

N° da Horas por
Unidade Unidades Temáticas Unidade
1 Estatística Descritiva 15

2 Teoria Elementar das Probabilidades 10

3 Variáveis Aleatórias 10

4 Distribuições de Variáveis Aleatórias 10

5 Teoria Elementar de Amostragem 10

6 Teoria Estatística de Estimação 15

7 Teste de Hipóteses 15

9
PARTE I - ESTATÍSTICA DESCRITIVA

UNIDADE TEMÁTICA I

Objectivos da Unidade

No fim desta unidade, deves ser capaz de:

1. Identificar o objecto da Estatística Descritiva e justificar a sua importância no dia-


a-dia da sociedade moderna;

2. Conhecer os principais conceitos inerentes à estatística descritiva e saber


aplicar os seus princípios e procedimentos;

3. Analisar e Interpretar dados estatísticos com recurso a gráficos e tabelas;

4. Tratar dados estatísticos para efeitos de generalização dos resultados;

10
LIÇÃO N° 1

CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA DESCRITIVA

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Entender o conceito de estatística, e identificar o objecto de estudo da estatística


descritiva;
2. Distinguir estatística descritiva da indutiva;
3. Conhecer e saber diferenciar o conceito de fenómeno estatístico do da
observação estatística;
4. Saber diferenciar o conceito de informação do conceito de dado;
5. Distinguir dado qualitativo de quantitativo;
6. Definir População e Amostra;
7. Diferenciar amostra de população;
8. Definir variável e distinguir variável qualitativa de quantitativa;
9. Conhecer as escalas usadas para medir atributos;

11
1.1.1 Breves Conceitos Fundamentais

a) Conceito de Estatística e sua divisão

Mas o que será que significa a


Estatística? O que realmente estuda?

Estatística

A Estatística é uma ciência ou ramo da Matemática Aplicada que fornece métodos para
a recolha, organização, descrição, análise e interpretação de dados, cujo fim é a
utilização dos mesmos na tomada de decisões.
A estatística geralmente é divida em duas partes: Descritiva e Inferencial (Indutiva).

Descritiva – é o ramo da estatística cujo objectivo (objecto da estatística descritiva)


é observar fenómenos de mesma natureza, colectar, organizar, classificar, analisar e
interpretar os dados. Também é responsável pelo cálculo de medidas (estatísticas),
que permitem, resumidamente, descrever o fenómeno em estudo.
Inferencial ou Indutiva – é o ramo ou parte da estatística que trata das condições de
generalização das conclusões tiradas, a partir de observações de uma parte das
unidades (amostra). A referida generalização das conclusões é feita de uma amostra
para a população em estudo.

Lembre-se…

A Estatística Descriva têm como objectivo observar fenómenos de mesma


natureza, colectar, organizar, classificar, analisar e interpretar os dados, como
também, calcular as medidas que permitem, resumidamente, descrever o
fenómeno em estudo.

12
b) Fenómeno Estatístico
É qualquer evento que se pode analisar aplicando técnicas estatísticas. Os fenómenos
estatísticos podem ser colectivos ou de massa, por exemplo, a evolução das
exportações em 30%, e individuais, que por sua vez classificam-se em típicos
(regulares) e atípicos (irregulares).

c) Observação Estatística
É um processo sistemático, cientificamente, argumentado de dados em massa que
possuem uma característica comum em relação ao objecto de estudo.

d) Dado
Em pesquisas, é comum ouvir:
“Vamos recolher 1º os dados.”
Mas afinal, o que é dado?

Para entendermos o conceito de dado vamos ver duas definições do termo:


Definição 1: Dado é a unidade básica (mínima) da informação, isto é, cada elemento
ou unidade estatística que constitui a população observada.
Exemplo 1.1: Matrícula de um carro envolvido num acidente.
Definição 2: Dado é o que se recolhe e se prepara para produzir certa informação.
Exemplo 1.2: Idades dos participantes de um inquérito.

Dado
Dado Qualitativo Dado Quantitativo

Aquele que identifica uma Aquele que identifica uma


qualidade, categoria quantidade, categoria ou
ou característica, ou seja, aquele característica, ou seja, aquele
que não se pode medir ou contar. que se pode medir ou contar.
Mas se pode classificar, Serve para medir ou contar as
assumindo várias categorias. categorias de um dado
qualitativo.
13
Exemplo 1.1:

p.ex. 1: O estado civil de um p.ex 1: O número de solteiros em 5


indivíduo, assume as categorias: bairros de Maputo: 3000; 4500;
solteiro(a), casado(a), viúvo(a) e 2300; 5600; 8790.
divorciado(a). p.ex 2: A massa de 5 sacos de
p.ex. 2: A cor do cabelo de um cebola no Mercado do Zimpeto: 10
indivíduo, assume as categorias: Kg; 12,5 Kg; 9Kg; 11Kg; 13Kg.
preto, castanho, loiro, amarelo, etc. p.ex 3: As temperaturas máximas
p.ex. 3: O sexo de um indivíduo, previstas para Maputo durante 5
assume as categorias: masculino e dias: 30, 25, 33, 28, 35.
feminino.

e) Informação
É o produto final do processamento de dados.
Exemplo 1.2: Notas de frequência de estudantes de uma determinada disciplina.

Dado, informação… mas qual é a diferença?...

Para responder a essa pergunta, basta ver os exemplos de cada conceito. Para
obtermos um dado não precisamos de processá-lo, como por exemplo, não precisamos
de processar a matrícula de um carro envolvido num acidente e as idades dos
participantes de um inquérito. Mas ao contrário da informação, para a sua obtenção,
precisamos de processá-la, isto é, processar um conjunto de dados, como por
exemplo, processar notas (dados) de 2 testes para obter as notas de frequência
(informação) de estudantes de uma cadeira.

14
Aprofundando…

No estudo de um problema, envolvendo métodos estatísticos, estes devem


ser escolhidos antes de se recolher a amostra, isto é, deve-se planear a
experiência que nos vai permitir recolher os dados, de modo que,
posteriormente, se possa extrair o máximo de informação relevante para o
problema em estudo, ou seja para a população de onde os dados provêm.

Exemplo 1.3: Imagine que pretendemos estudar o sucesso escolar dos


alunos da 10ª classe da Escola Secundária Francisco Manyanga na
disciplina de Matemática, será natural irmos consultar as pautas desses
alunos no final do ano. A partir daí poderá facilmente ser obtida a
percentagem de aprovações.

Se no entanto, pretendermos aprofundar um pouco mais este assunto,


nomeadamente, saber se o sucesso é igual para rapazes e raparigas, ou
nos diferentes agrupamentos disciplinares, dever-se-á recolher além da
informação respeitante ao aluno ter aprovado ou não, a informação sobre o
sexo e o agrupamento disciplinar. Uma vez os dados recolhidos, sob a
forma de uma amostra faz-se a redução e representação desses dados,
utilizando tabelas e diferentes tipos de gráficos.

Tabela 1.1
Agrup. disciplinar Nota Sexo
1 12 F
2 13 M
…. … …

f) Variável
É o símbolo que representa determinada característica de uma população ou de uma
amostra extraída dessa população. A notação utilizada para uma variável corresponde
às letras enquanto que valores constantes são geralmente representaados por
as primeiras letras do alfabeto: . A variável pode ser qualitativa ou quantitativa.

15
Aprofundando…
Quando as características de uma variável não podem ser medidas, ou seja, não
podem ser expressas através de números, diz-se que a variável é qualitativa. Se, pelo
contrário, as suas características são mensuráveis, então, trata-se de uma variável
quantitativa.
Uma vez que a variável quantitativa define uma característica que pode ser expressa
em números, ela pode também ser discreta ou contínua.
Chama-se de discreta, a qualquer variável cujo domínio é enumerável, isto é, quando
toma valores (numéricos) distintos (finitos). Por exemplo: X={x1,x2,…xn}. Quando a
variável assume qualquer valor dentro de um certo intervalo finito ou infinito. Ou dado
um intervalo [a, b] com , existe um valor x tal que e , i.é, ,
então, diz-se que ela é variável contínua.
===============================================

Variável

===============================================

g) População
Entende-se por População ou Universo, o conjunto de indivíduos, que podem ser
pessoas, animais, objectos ou resultados experimentais, com pelo menos uma
característica comum, que se pretende estudar. A população pode ser finita ou infinita,
consoante seja finito ou não o numero de elementos considerados na observação.
Exemplo 1.4: A população de ratos magros de uma determinada zona; A população de
bicicletas estragadas na Cidade de Chimoio. A população de moradores do Edifício “33
Andares” em Maputo, sobre a qual estamos interessados em estudar as seguintes
características populacionais: (1) Altura dos moradores; (2) Idades dos moradores.
Depois de medir a altura de cada morador e saber a idade, obtemos o seguinte um
conjunto de dados:

Saiba mais:
Quando é possível pesquisar toda a população, estamos perante um censo. 16

Ex: Censo Geral da População 2007.


Tabela 1.2: Altura e Idade dos moradores do “33 andares”.
Nome Altura (m) Idade (Anos)
Fátima Mediana 1.65 23
Ivone Média 1.73 45
Carlos Frequência 1.86 28
Cefas Variável 1.55 33
Pet Descritiva 1.9 26
Pianga Amostra 1.8 38
Rosa Aritmética 1.75 51
… … …

Exemplo 1.5: Se pretendemos saber o número de eleitores que podem votar nas
próximas eleições municipais de Maputo, a população em estudo é “Potenciais
eleitores na cidade de Maputo”.
Exemplo 1.6: Se pretendemos saber o número médio de aprovações em Estatística,
dos estudantes nas instituições do ensino superior em Moçambique após a
independência, a população em estudo será “Os aprovados a Estatística desde a
independência até à agora”.

Porquê, nem sempre é possível


estudar exaustivamente todos os
elementos da população?

As vezes, não é possível estudar todos os elementos da população, pelas seguintes


razões:
 Urgência no apuramento dos resultados – o tempo necessário para estudar
todos os elementos de uma população pode ser bastante elevado; Por exemplo:
“Estudo da tendência de voto numa data pré-eleitoral”.

17
 Dificuldades económicas – estudar a toda população pode ser muito
dispendioso; Por exemplo: Estudar os sintomas que apresenta cada doente de
TB;
 Dimensão infinita da população – Por exemplo: População constituída pelas
estrelas do Céu.
 Processo destrutivo - O estudo da população pode provocar a destruição da
mesma; Por exemplo: Pretendendo ter a certeza sobre qual o palito que não
acende, estudar a população dos fósforos de uma caixa.
 Precisa-se de maior precisão – nalguns casos é mais difícil estudar uma
população por esta não ser precisa;
 Problemas de acesso – pode não existir vias de acesso para chegar à
população;
 Instabilidade política – casos de guerra ou tumultos;
 Problemas demográficos – quando a população está mais geograficamente
dispersa, etc.

h) Amostra
Se não é possível ou para se evitar estudar toda a população ou todos os seus
elementos, seleccionam-se só alguns deles, para servirem de amostra da população
em estudo. Para melhor entender a origem da amostra, leia o cenário abaixo:
Num Restaurante dois amigos conversam
- Mas que matapa saborosa estou a comer!
- Não estarás a tirar conclusões precipitadas? Ainda só comeste um bocadinho!
- A amostra que comi já é suficiente...
- Talvez tenhas razão, já que não é necessário comer matapa de todas folhas da
mandioqueira para concluir que ela é boa.
Amostra - é um conjunto de observações ou dados extraídos a partir de um
subconjunto ou parte da população, que se estuda com o objectivo de tirar conclusões
sobre toda população em estudo.
Exemplo 1.7: Relativamente à população das alturas dos alunos da 8ª Classe
matriculados na Escola Secundária de Jécua, na província de Manica, consideremos a

18
seguinte amostra, constituída pelas alturas (em cm) de 20 alunos escolhidos ao acaso
ou aleatoriamente:
145, 163, 157, 152, 156, 149, 160, 157, 148, 147, 151, 152, 150, 148, 156, 160, 148,
157, 153, 162.

Aprofundando…
Usa-se população quando é impossível conhecer as características de
todos os elementos da população. Por isso, torna-se necessário extrair uma
amostra ou parte dessa população, sobre a qual serão estudadas as
características. Para extrair a amostra e assegurar a sua representatividade
relativamente à população de onde foi extraída, existem métodos
estatísticos que constituem o objecto de estudo da teoria de amostragem.

Atenção!!!
Quando a amostra não representa, correctamente, a população, diz-se viciada. E a sua
utilização pode dar origem a interpretações e conclusões erradas.
A escolha de métodos apropriados de extracção da amostra assegura a possibilidade de se
tirarem conclusões sobre a população a partir da informação extraída da amostra. Este
constitui o objecto de estudo da inferência estatística.

19
1.1.2 Características da informação estatística

A informação estatística é um instrumento ao serviço do desenvolvimento de uma


realidade. É um meio e não um fim, porque ela está ao serviço dos utilizadores de
dados estatísticos, que podem ser governantes, gestores, homens de negócios,
sociólogos, investigadores, etc.

Pela sua natureza, a informação estatística obedece as seguintes características:


qualidade, actualidade e utilidade.

Qualidade - os dados estatísticos devem traduzir uma realidade de forma simples e


clara. O controlo de qualidade dos dados é uma tarefa indispensável para sua
fiabilidade, isto é, a informação estatística deve ser completa pois não faz sentido
nenhum preparar e divulgar dados baseados em apuramentos parciais.

Actualidade – a informação deve estar disponível de forma atempada a pessoas que


precisam utilizá-la no momento necessário. Isto implica um esforço de actualidade na
obtenção dos dados, preparação e divulgação dos resultados.

Utilidade – a informação estatística serve de um meio para o desenvolvimento das


sociedades, é, praticamente, um instrumento de tomada de decisões. É por isso que
ela deve ser compreendida pelos utilizadores, o que significa que ela deve ser
acompanhada de todos os aspectos metodológicos mais relevantes: gráficos, tabelas,
notas explicativas, etc., para permitir que o seu verdadeiro conteúdo e significado
sejam percebidos.

O conjunto das etapas para se preparar uma informação estatística é desde a recolha,
produção e divulgação dos dados ou resultados e sua posterior utilização. Estas etapas
constituem o circuito da informação estatística. Os principais intervenientes no circuito
da informação estatística são os utilizadores, fornecedores e os produtores de dados
estatísticos.
Utilizadores – Os governantes, homens de negócios, economistas e técnicos em
geral, têm a tarefa de seleccionar e analisar a informação de que necessitam para os
seus trabalhos. Cabe aos utilizadores, criticar e colocar opiniões aos produtores e
fornecedores de forma a melhorar a informação estatística.
Fornecedores – prestam informações de base, facultando aos produtores, dados que
lhes são solicitados pelos utilizadores.

20
Produtores – são entidades especializadas, que têm por objectivo a obtenção e
preparação da informação necessária ao conhecimento da realidade nos seus vários
domínios.

1.1.3 Técnicas elementares do método estatístico


Constituem técnicas do método estatístico, os procedimentos utilizados na estatística
descritiva para a descrição de dados, passando pela organização de tabelas,
construção de gráficos e cálculo de medidas estatísticas, que podem ajudar na análise
e interpretação de dados sem recorrer muitas vezes a juízos probabilísticos, isto é, à
inferência estatística.
Entre muitas fases do método estatístico destacam-se 6 principais:
1. Definição do problema – definição dos objectivos;
2. Planeamento – definição dos procedimentos básicos;
3. Recolha de dados – fase operacional;
4. Apuramento dos dados – cálculos, tabelas e gráficos;
5. Apresentação – exposição dos resultados obtidos;
6. Análise e interpretação – discussão e indicação das conclusões;
Estas fases, dependendo do nível de abordagem do método, podem ser reduzidas ou
aumentadas e/ou tomar designações diferentes.

1.1.4 Caracteres e modalidades das variáveis estatísticas

A estatística estuda fenómenos, a que chamamos por caracteres ou atributos


estatísticos. Para descrever, uma população, é necessário que as unidades estatísticas
sejam classificadas em subconjuntos adequados de acordo com os caracteres ou
atributos mais relevantes. Por sua vez estes caracteres podem ser qualitativos ou
quantitativos.
Chama-se modalidade de um atributo, as diferentes variações ou valores que este
atributo pode assumir.
Um caractere é qualitativo, quando as modalidades não são numéricas ou não são
mensuráveis, mas podem ser apenas constatadas; e será quantitativo quando ele for
mensurável. De um modo geral, os atributos observados quando são qualitativos

21
revestem-se de várias modalidades, e quando são quantitativos apresentam uma
modalidade com diferentes intensidades ou valores. Os atributos de uma população
podem ainda ser classificaos como dicotómicos quando tomam apenas dois valores
possíveis. Por exemplo, o sexo a que um grupo de inquiridos pertence é uma
característica dicotómica uma vez que só pode ter os valores masculino e feminino. Do
mesmo modo também uma pergunta sobre se os inquiridos conhecem ou não
determinado produto constitui uma variável dicotómica.
Exemplo 1.8: Vejamos um exemplo onde se apresentam diferentes atributos
associados a um determinado universo.

Tabela 1.3: Caracteres associados aos seus universos:

Universo Caractere/atributo

População de pessoas Sexo, idade, local de nascimento, grau académico, estado


civil, local de trabalho, etc.

Economia de um país Produto interno bruto, consumo público e privado, situação


monetária, etc.

Actividades de uma Volume de produções, volume de venda, receitas, despesas,


empresa lucros, investimentos, etc.

1.1.5 Escalas usadas para medir os atributos

Conforme a natureza dos atributos, existem quatro escalas principais usadas para
medi-los:

1) Escalas Nominais – são aquelas que separam os atributos em categorias


diferentes, ou que não são ordenados em termos de hierarquia. Na utilização
destas escalas, é preciso que se obedeçam três condições:
a) a divisão deve ser coerente de acordo com um único critério.
b) a divisão deve ser completa.
c) as categorias que participam na divisão devem ser mutuamente exclusivas.
2) Escalas Ordinais – baseiam-se numa classificação hierárquica. Através desta
escala, os atributos são colocados em determinada ordem conforme um critério
escolhido.
3) Escalas de Intervalo – estas escalas para além de distinguirem categorias e
ordenação, colocam as categorias a distâncias iguais. Uma propriedade

22
importante dessas escalas, é a possibilidade de serem submetidas às quatro
operações aritméticas (adição, subtracção, multiplicação e divisão).
4) Escalas de Razão – são um caso especial das escalas ordinais, as quais são
também nominais hierárquicas. Assim a escala de razão é também uma escala
de intervalo dotada de zero absoluto.

1.1.6 Gráficos e sua aplicação na estatística

Um gráfico é qualquer representação geométrica de um fenómeno. É um desenho no


plano ou espaço descrevendo a relação entre conjuntos de números ou quantidades de
objectos por um conjunto de pontos, linhas, áreas, etc.

23
LIÇÃO N°2

DISTRIBUIÇÃO DE FREQUÊNCIAS

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Criar tabelas com base na definição de variáveis;


2. Definir frequência relativa e absoluta;
3. Definir frequências acumuladas;
4. Distinguir uma frequência de outra;
5. Utilizar tabelas e gráficos para representar informação estatística;
6. Diferenciar gráficos;
7. Aplicar gráficos em situações concretas;

24
1.2.1 Introdução à lição n° 2

A análise estatística começa quando um conjunto de dados torna-se disponível de


acordo com a definição do problema da pesquisa. Um conjunto de dados, seja de uma
população ou de uma amostra, contém muitas vezes um número muito grande de
valores. Além disso, esses valores, na sua forma bruta, encontram-se muito
desorganizados. Eles variam de um valor para outro sem qualquer ordem ou padrão,
por isso, os dados precisam de ser organizados e apresentados de forma sistemática e
sequencial, por meio de uma tabela ou gráfico. Quando fazemos isso, as propriedades
dos dados tornam-se mais aparentes e tornamo-nos capazes de determinar os
métodos estatísticos mais apropriados para serem aplicados no seu estudo.

25
1.2.2 Breves conceitos básicos

Dados brutos – são os dados originais que ainda não foram numericamente
organizados.

Rol estatístico ou simplesmente rol – é uma lista em que os valores ou dados


numéricos são dispostos em uma determinada ordem, crescente ou decrescente.

Amplitude total ou “Range” – é a diferença entre o maior valor e o menor da série


estatística, ou a diferença entre os extremos do rol.

Exemplo 1.19: Os dados a seguir correspondem ao consumo de energia de uma


determinada família, ilustrando as três definições anteriores.

a) Dados brutos: 58 62 80 57 28 96 19 90 86 38 50 41 90 55
b) Rol: (ordem crescente) 19 28 38 41 50 55 57 58 62 80 86 90 90 96
c)

Assim para os valores do consumo de energia, a amplitude total é de 77Kw/h.

Distribuição de frequências - Quando os dados brutos são organizados,


frequentemente, costuma-se distribuí-los em classes ou categorias, e determina-se em
seguida o número de casos ou indivíduos pertencentes a uma das classes,
denominado frequência de classe. Uma apresentação tabular de dados por classes
com as suas respectivas frequências é conhecida por distribuição de frequências.
Sejam dadas as seguintes distribuições de frequências:

Tabela 1.4: Distribuição de frequências de 10 trabalhadores segundo o seu salário na


Petromoc.

I Salário Frequência

1 2.500,00 2

2 3.000,00 4

3 3.460,00 3

4 4.000,00 1

Total n=10

26
Tabela 1.5: Distribuição de frequências das notas de 50 estudantes.

I Classes Frequências

1 00 – 04 2

2 04 – 08 7

3 08 – 12 10

4 12 – 16 14

5 16 – 20 12

6 20 – 24 4

7 24 – 28 1

Total - 50

Há dois tipos de distribuição de frequências, um com valores não classificados ou não


agrupados (tabela 1.3) e outro com valores classificados ou agrupados em classe
(tabela 1.4)

Saiba mais…
As distribuições de frequências não agrupadas são utilizadas quando temos poucos
dados e o número das modalidades apresenta repetições. Se o número de dados
observados for grande é conveniente agrupar os dados em classes.

Frequências absolutas, relativas e acumuladas

a) Frequência absoluta (fi) – é o número de repetições de um valor individual


ou de uma classe de valores da variável.
b) Frequência relativa (fr) – é a proporção de observações de um valor
individual ou de valores pertencentes a uma categoria em relação ao número
total de observações.
onde
c) Frequência absoluta acumulada (Fi) – é a soma da frequência absoluta
duma ordem ou classe posterior com a frequência absoluta anterior, partindo de
cima para baixo.
Procedimento
Na 1ª classe o valor da F mantém igual ao da f da 1ª classe, mas a partir da 2ª classe, vai se
acrescentando o valor da f dessa classe à F anterior, e assim sucessivamente.

27
d) Frequência relativa acumulada (Fr) – é a soma da frequência relativa duma
ordem ou classe posterior com a frequência relativa anterior, partindo de cima
para baixo.
Procedimento
O procedimento é quase o mesmo, só mudamos de coluna passando a trabalhar com as colunas
das frequências relativas.

Exemplo 1.20: Calcular as frequências relativas, suas frequências acumuladas


inerentes a notas de 50 alunos na disciplina de Matemática

Tabela 1.6: Tabela de frequências:

I xi fi fr fr% Fi Fr Fr%

1 2 3 0,12 12 3 0,12 12

2 6 4 0,16 16 3+4=7 0,12+0,16=0,28 12+16=28

3 10 10 0,40 40 7+10=17 0,28+0,40=0,68 28+40=68

4 14 6 0,24 24 17+6=23 0,68+0,24=0,92 68+24=92

5 18 2 0,08 8 23+2=25 0,92+0,8=1,00 92+8=100

Total 1,00 100

28
1.2.3 Distribuição de frequências para dados agrupados

Até agora vimos como são calculadas as frequências (absolutas, relativas e


acumuladas) para variáveis quantitativas discretas. Nesse caso a tabulação dos
resultados é mais simples. Se tratarmos de variáveis quantitativas contínuas, os
valores observados devem ser apresentados em tabelas, agrupados em classes.

Para determinar essas classes não existe uma regra pré-estabelecida, sendo
necessário um pouco de tentativa e controlo de erro para a solução mais adequada.
Nalguns casos pode-se determinar intervalos arbitrários, segundo o interesse do
Analista, mas na maior parte dos casos usam-se certos pressupostos como veremos
abaixo:

Consideremos a tabela seguinte, que representa as alturas de 50 indivíduos medidas


em .

Alturas de 50 indivíduos medidas em cm

162-168-173-168-179-183-167-186-177-187-174-164-177-159-177-173-163-
180-196-171-184-179-190-181-166-181-182-176-169-172-162-175-192-178-
177-200-191-188-168-165-193-175-160-180-187-176-170-156-174-179

Desta forma, atendendo que o número de observações é grande, vamos fazer um


agrupamento das unidades estatísticas em classes. A escolha do número de classes
varia consoante a conveniência e o número de casos observados.

Antes de apresentar a tabela da distribuição de frequência consideremos os conceitos


seguintes:

Limite de classe – são os valores externos de cada classe.

Intervalo ou amplitude de classe – é a diferença entre os limites superiores ou


inferiores das duas classes consecutivas.

Ponto médio de classe é o valor que representa a classe para efeitos de cálculo

Para a elaboração de uma tabela de frequência com dados agrupados é necessário no


mínimo seguir algumas regras. Os procedimentos mais comuns têm os passos
seguintes:

29
Passo 1. Construir o rol.

Passo 2. Determinar a amplitude total.

Passo 3. Determinar ou escolher o número de classes k. Métodos para escolha do k:

Método 1. Escolher arbitrariamente k entre 5 a 20.

Método 2. Calcular K pela fórmula de Sturges: . Onde representa


o número total de elementos em estudo.

Método 3. .

Passo 4. Determinar o intervalo de classe .

Passo 5. Determinar os limites superiores e inferiores das classes.

Exemplo 1.21: A partir dos dados da tabela 1.6, construir a tabela de distribuição de
frequências absolutas e determinar os pontos médios de classe.

Resolução:

Usando as regras anteriores temos:

O rol: 156; 159; … 200.

1. Do rol obtido, obtemos o seguinte extremos: e


2. Amplitude total:
3. Agora vamos aplicar o método 2: e depois
aplicando o método 3: o mesmo k pode ser calculado assim:
.
4. E por último vamos calcular a amplitude de classe .

Entendendo…

Caro aluno, como pode notar, para construirmos as classes da tabela abaixo, por
exemplo para a 1ª classe, usamos primeiro o menor elemento (156) como limite
inferior da classe e adicionamos a ele a amplitude de classe e obtemos assim
o limite superior (162) dessa mesma classe (156 – 162) . Na segunda classe o limite
superior da classe anterior torna-se inferior e nele adicionamos a amplitude da
classe e obtemos o limite superior da segunda classe. Assim o processo continua
até a ultima classe.

30
Tabela 1.7: Distribuição de frequências das alturas de 50 indivíduos.

i Classes (xi, cm) fi xi

1 [156,0 – 162,3[ 5 159,15

2 [162,3 – 168,6[ 7 165,45

3 [168,6 – 174,9[ 9 171,75

4 [174,9 – 181,2[ 15 178,5

5 [181,2 – 187,5[ 6 184,35

6 [187,5 – 193,8[ 6 190,65

7 [193,8 – 200,1[ 2 196,96

Total - -

31
1.2.4 Representação gráfica

Para representar uma informação resumida numa tabela de distribuição de frequências


de dados não agrupados (variável discreta), basta apresentar um diagrama de barras
para as frequências absolutas ou relativas e uma ogiva para as acumuladas.

Para dados agrupados, as diferentes formas de representação de distribuição de


frequências para dados não agrupados também podem ser feitas, neste caso, os
pontos médios de classe representarão os pontos individuais.

Histograma - é mais uma forma apropriada para representar dados agrupados. O


histograma é um diagrama de áreas, formado por rectângulos, de modo que a área de
cada um desses rectângulos seja proporcional à frequência dessa classe.

Histograma da distribuição de frequencias

10

8
Frequencias absolutas - fi

Mean = 176,54
Std. Dev. = 10,16238
0 N = 50
150,00 160,00 170,00 180,00 190,00 200,00

Alturas média - Xi

32
Diagrama de barras

15

12
Frequencias absolutas - fi

0
159,15 165,45 171,75 178,05 184,35 190,65 196,95

Pontos médios de classe - Xi

33
LIÇÃO N°3

MEDIDAS DE TENDÊNCIA CENTRAL E DE POSIÇÃO

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Descrever principais medidas de Tendência Central;


2. Descrever principais medidas de Posição;
3. Distinguir medidas de Tendência Central e Posição;
4. Determinar as principais medidas;
5. Aplicar diferentes medidas na resolução de problemas de estatística;

34
1.3.1 Medidas de Tendência Central

O tratamento e interpretação de medidas de tendência central, torna-se difícil para


quem pretende colocar uma informação como um todo, razão pela qual costuma-se
calcular algumas medidas que, resumidamente, traduzem as características
importantes das distribuições de frequências.

As medidas de tendência central têm o papel de indicar onde se encontra a maioria dos
dados. Existem três grupos de medidas que resumem um conjunto de dados
observados: medidas de tendência central, medidas de posição e medidas de
dispersão.

Os índices de centro de distribuição ou medidas de tendência central (medidas de


localização), assim designados em virtude de tendência que todos os dados
observados tem em torno desses valores centrais. Este grupo inclui as grandezas:
média, moda e mediana.

1.3.1.1 Breves conceitos básicos

A média é uma grandeza ou valor representativo de um conjunto de dados, que indica


como eles tendem a se localizar em torno do ponto central. A média aritmética é a mais
usada pelos estatísticos, esta podendo ser simples ou ponderada. A média aritmética
referente a dados de uma amostra é denotada por ( ) e quando referente a dados de
toda população é denotada por ( ).

Média artimética simples: esta é definida como a soma de todos os dados


observados dividida pelo número total das obsevações. , para amostra e

, para população.

Média artimética ponderada: esta define-se como soma de produtos dos valores da
variavel com as suas respectivas frequencias ou pesos, dividida pela soma das
frequencias ou pesos. , para amostra e , para populacao.

Moda (Mo) - é o valor da variável que ocorre com mais frequência (ou melhor, que se
repete mais vezes). Para casos em que o número das observações não é muito
elevado esta medida pode ser lida no rol.

De acordo com as frequências de cada valor observado, é possível ter mais de uma
moda (distribuição amodal): no caso de ter uma moda (distribuição unimodal), duas
(bimodal), três (trimodal), etc.

35
Quando temos dados agrupados em classe, a moda é calculada por aproximação,
começando por localizar a classe modal (classe com maior frequência absoluta), se
necessário deve-se conhecer a moda bruta. Formalmente usa-se a fórmula de
aproximação de Czuber para o cálculo da moda.

Onde:

limite inferior da classe modal

frequência da classe modal

frequência da classe anterior a classe modal

frequência da classe posterior a classe modal

intervalo de classe da classe modal

Mediana (Me) - é uma separactriz que divide a distribuição ou conjunto de dados em


duas partes iguais. A mediana é o valor que está na posição mediana ou central para
impar e é a média aritmética dos dois valores centrais para par.

Exemplo 1.22: Consideremos uma amostra de tamanho 10 composta de idades de 10


alunos do curso de Ciências de Educação:

18 23 19 18 20 21 22 18 32 23

Fazendo rol obtemos: 18 18 18 19 20 21 22 23 23 32

Como pode se notar, o número total de dados é par, logo, temos dois dados que se
encontram na posição central, que são 20 e 21, então a média será a média artimética
dos dois, .

Para dados agrupados em classe, a mediana é determinada por aproximação. A


determinação da classe mediana passa pelo cálculo das frequências acumuladas. Para
o efeito, dividimos o valor total das frequências absolutas por 2, e localizamos o
resultado na coluna das frequências absolutas acumuladas. E a essa classe, dá-se o
nome de classe mediana. Para o cálculo da mediana, usamos a fórmula seguinte:

36
Onde:

limite inferior da classe mediana

frequência da classe mediana

frequência acumulada da classe anterior a classe mediana

intervalo de classe da classe mediana

Exemplo 1.23: Consideremos a tabela 1.8 abaixo, e a partir dela vamos determinar a
média artimética, moda e média da distribuição dos dados.

I Classes fi xi xifi Fi

1 10 – 20 10 15 150 10

2 20 – 30 20 25 500 30

3 30 – 40 35 35 1225 65

4 40 – 50 40 45 1800 105

5 50 – 60 25 55 1375 130

6 60 – 70 15 65 975 145

7 70 – 80 5 75 375 150

Total - - 6400 -

1.3.1.2 Cálculos das medidas de tendência central

Cálculo da Média

Para o cálculo da média, vamos somar os elementos da 5ª coluna e dividí-los pela


soma dos elementos da 3ª coluna, isto é: .

Cálculo da Mediana

E para calcularmos a mediana, primeiro, precisamos conhecer a classe mediana (a


classe que se localiza a mediana). Para o efeito, calculamos e depois
procuramos situar o valor 75 na coluna das frequências absolutas acumuladas (a que

37
valor ele se aproxima de todos os valores que se encontram na coluna ), e por sinal,
localiza-se na classe , isto é, na . Então, a frequência absoluta acumulada

anterior a esta é . Deste modo: .

Cálculo da Moda

Para o cálculo da moda, vamos usar a fórmula anterior, e para o efeito, precisamos de
, que é a amplitude de classe. Olhando para 3ª coluna, coluna das frequências
absolutas, localizamos na linha o maior valor absoluto que é 40 (a maior
frequencia absoluta). Então, esta é a classe modal, logo, a frequência modal ,
a frequência anterior afrequencia modal será e a frequência posterior é .
O limite inferior da classe modal é dado por . Deste modo:
.

1.3.1.3 Posições relativas entre a média aritmética, a moda e a mediana

Para curvas de frequências unimodais com um grande número de observações


verificam-se as relações seguintes:

a) Distribuições simétricas:
b) Distribuições com assimetria positiva:
c) Distribuições com assimetria negativa:

Karl Pearson desenvolveu uma fórmula empírica da relação entre as três medidas de
localização, a média (ponto de equilíbrio), a moda (ponto de máxima frequência) e a
mediana (ponto do meio).

Nas figuras a seguir apresentam-se as posições relativas da média, mediana e moda,


para curvas assimétricas ou desviadas e curva simétrica ou normal.

Assimetria positiva curva simétrica - normal Assimetria negativa

38
1.3.1.4 A média e os valores extremos

A média apresenta um problema crítico ou mesmo bicudo; ela é fortemente


influenciada pelos valores extremos. Por esta razão, deve-se fazer uma análise
cautelosa dos dados.

Exemplo 1.24: Suponha que estamos interessados em estudar a distribuição da nota


média de 9 estudantes na disciplina de Matemática. Abaixo estão os resultados do
teste:

: Notas de um teste de Matemática de 9 alunos

: 1, 1, 1, 1, 2, 2, 3, 5, 20

A nota média desses 9 alunos é 4. Mas o que aconteceria se o aluno com nota igual a
20 valores fosse retirada da amostra? O valor da média decaria para 2 valores, o que
parece mais razoável olhando para a distribuição das notas da maioria dos alunos, pelo
que, se pode afirmar que a média 2 descreve melhor esse conjunto de dados.

Este exemplo, ilustra como a média é vulnerável ao efeito de valores extremos. Neste
caso, é recomendado utilizar a mediana, por ser um valor mais perto do centro da
distribuição, e não susceptível de influências.

Nota: Para além da média artimética, temos também a média harmónica e a


geometrica, que não foram tratados neste manual.

39
1.3.2 Medidas de Posição

Assim como as medidas de tendência central tem por objectivo fornecer indicadores do
local onde a maioria dos dados se concentra, por sua vez, as medidas de posição tem
por objetivo, indicar onde é o ponto de corte para uma certa posição. As medidas mais
usadas são os quartis e suas versões mais gerais, decís e percentis.

1.3.2.1 Breves conceitos básicos e respectivos métodos de cálculo

Quartís (Quantís)

Quartil: Como foi tratado atrás nas medidas de tendência central, a mediana divide um
conjunto de dados em duas partes iguais, os quartis dividem o conjunto de dados ou
distribuição de frequências em quatro partes iguais.

Para se determinar a posição quartil sem agrupar os dados é necessário colocá-los em


rol (ordem crescente ou descrescente), só após essa ordenação é que se pode
determinar os quartís.

- deixa 25% dos elementos, coincide com a mediana e deixa 50% dos elementos,
e deixa 75% dos elementos.

Exemplo 1.25: Consideremos os dados da amostra dada no exemplo 1.13 com o


seguinte rol: 18 18 18 19 20 21 22 23 23 32.

O tamanho desta amostra é 10, isto é, , o primeiro quartil


. Como os quartis indicam a posição do dado, então aproximando 2,5
para 3, encontramos que o dado que se encontra na posição 3 é 18.

, enquanto que . A fórmula


geral para o cálculo de quartis é , onde .

Para dados agrupados, pode-se calcular o quartil de ordem , usando a fórmula de


aproximação.

, onde

Onde:

é a ordem do quartil;

limite superior da classe onde existe o quartil;

40
Frequência acumulada ate a classe anterior a classe onde existe o quartil;

frequência absoluta da classe onde existe o quartil;

Decis - os decis são separatrizes que dividem o conjunto dos dados em 10 partes
iguais. Quando os dados não são agrupados, primeiro devemos colocá-los em forma
de rol como fizemos para o caso de quartis. A fórmula para o cálculo de decis é
, onde .

Para efeitos de cálculo de decis, quando os dados estão agrupados, a fórmula é


semelhante a de quartis.

, onde .

Percentis - são separatrizes que dividem a amostra em 100 partes iguais. Para dados
não agrupados, para calcular o percentil de ordem usamos a fórmula
onde . Enquanto que para dados agrupados usamos a fórmula abaixo.

, onde .

Exemplo 1.26: Registaram-se alturas de 100 estudantes do Curso de Ciências de


Educação, e foi obtida a tabela 1.9 seguinte de distribuição de frequências.

I Classes(xi, m) fi Fi

1 1,40 – 1,46 7 7

2 1,46 – 1,52 9 16

3 1,52 – 1.58 5 21

4 1,58 – 1,64 12 33

5 1,64 – 1,70 26 59

6 1,70 – 1,76 20 79

7 1,76 – 1,82 11 90

8 1,82 – 1,88 10 100

Total -

41
a) Determine os valores das separatrizes Me, Q1, D3 e P80 e comente os resultados.

Resolução:

Mediana

1º Passo: Como os dados estão agrupados em classes, para determinarmos a


mediana, primeiro temos que descobrir a classe mediana, e como a mediana divide a
distribuição das frequências teremos: .

2º Passo: Daqui procuramos localizar o valor 50 na coluna das frequências


acumuladas e situa-se na linha , então esta é a classe mediana, onde temos
e . E a frequência acumulada que se localiza na classe anterior a
classe mediana é . Então:

Mediana: .

Q1

1º Passo: Para determinarmos o primeiro quartil, temos antes de tudo que determinar a
classe onde se localiza o primeiro quartil e como este divide a distribuição das
frequências em 4 partes iguais teremos .

2º Passo: Daqui procuramos localizar o valor 25 na coluna das frequencias


acumuladas e situa-se na linha , onde temos que e . E a
frequencia acumulada que se localiza na classe anterior a classe quartil é .

Então: .

D3

1º Passo: Do mesmo modo, para determinarmos o 3° decíl temos de descobrir onde se


localiza, e para o efeito vamos calcular .

2º Passo: Daqui procuramos localizar o valor 30 na coluna das frequências


acumuladas: situa-se na linha , onde temos que e . E a frequencia
acumulada que se localiza na classe anterior a classe decíl 30 é . Entao

42
P80

1º Passo: Por último, vamos determinar o percentil 80, e para o efeito temos de
localizá-lo calculando: .

2º Passo: Daqui procuramos localizar o valor 80 na coluna das frequências


acumuladas, e situa-se na linha , onde temos que e . E a
frequência acumulada que se localiza na classe anterior a classe do percentil 80 é

. Entao .

Resposta:

Dos 100 estudantes, 50% destes tem uma estatura inferior a 1,68 m, 25% dos
estudantes possuem altura inferior a 1,60 m, 30% dos estudantes possuem altura
menor que 1,63 e só 20% dos 100 tem altura igual ou superior a 1,77 m.

43
LIÇÃO N°4

MEDIDAS DE DISPERSÃO

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Entender o conceito de variabilidade dos fenómenos estatísticos;


2. Descrever as principais medidas de dispersão;
3. Aplicar diferentes medidas de dispersão em exemplos;

44
1.4.1 Introdução à lição n°4

Como se sabe, os fenómenos cuja análise intervêm o método estatístico bem como os
dados estatísticos a eles referentes, caracterizam-se tanto pela sua semelhança quanto
pela sua variabilidade. Assim, o cálculo de um promédio sobre um conjunto de dados
tem sentido, caso contrário, não teria sentido calcular a média de um conjunto de
dados onde não haja variação dos seus elementos.

Para medir o grau de variabilidade ou dispersão de um conjunto de valores são


calculadas outras medidas estatísticas denominadas medidas de dispersão.

As medidas de dispersão permitem observar as flutuações das observações face as


medidas de tendência central. Elas proporcionam um conhecimento mais completo do
fenómeno a ser analisado em termos de conjuntos absolutos bem como relativos,
estabelecendo comparações entre fenómeno de mesma natureza, e mostrando até
que ponto os valores se distribuem acima e abaixo da medida de tendência central.

De um modo geral, as medidas de dispersão podem ser absolutas e relativas. Os


índices mais relevantes deste grupo das características de distribuições de frequência
são a variância, o desvio padrão e o coeficiente de variação.

45
1.4.2 Breves conceitos básicos

Variância ou dispersão ( ) de um conjunto de números, é a média aritmética dos


quadrados dos desvios absolutos ( ) desses números em relação a sua média
aritmética.

Quando os dados observados estiverem agrupados em uma distribuição de


frequências, a fórmula da variância assume o seguinte aspecto: .

Exemplo 1.27: Calcular a variância das notas obtidas num teste realizado para 50
estudantes com os dados apresentados na tabela 1.10 abaixo .

1 8 7 56 -2,64 48,7872

2 9 8 72 -1,64 21,5168

3 10 9 90 -0,64 3,6864

4 11 10 110 0,36 1,2960

5 12 8 96 1,36 14,7968

6 13 4 52 2,36 22,2784

7 14 4 56 3,36 45,1584

Total - 532 157,5200

Agora, vamos calcular a média artimética: valores. Então, a

variância será: valores.

O Desvio Padrão ( ) é a medida de dispersão mais usada. O desvio padrão é a raiz


quadrada positiva da média aritmética dos quadrados dos desvios dos valores
observados em relação a grandeza média.

46
De igual modo para dados agrupados em classe usamos: .

Se quisermos calcular o desvio padrão do exemplo anterior, basta determinar a raiz


quadrada de 3,15, assim valores.

1.4.3 Determinação do desvio padrão para amostras

Quando se trabalha com uma amostra e não com uma população (caso mais frequente
na inferência estatística), ou quando o número das unidades observadas não é grande,
isto é, ( ), para se obter uma melhor estimativa, usa-se o desvio padrão corrigido:
.

Quando os dados observados tiverem sido classificados, agrupados ou tabelados com

frequências, o desvio padrão corrigido será: .

Exemplo 1.27: Calcular o desvio padrão e o seu valor corrigido nas alíneas seguintes:

Este exemplo, mostra que quanto mais aumentamos o número dos elementos na
amostra, a diferença entre os desvios torna-se cada vez menor.

Atenção…

Para determinados tipos de problemas, as medidas de variabilidade absolutas, tais


como, o desvio padrão e a variância, não são muito expressivas, neste caso, as
medidas de dispersão relativa proporcionam uma avaliação mais apropriada do
grau de dispersão da variável.

47
Exemplo 1.28: Calcular o desvio padrão e o seu valor corrigido nas seguintes alíneas:

a)

1 2 4 8 10.50
1 3 10 30 40.0
2 3 9 27 3.46
2 4 15 60 15.0
3 4 8 32 1.16
3 5 30 150 0.0
4 5 3 15 5.71
4 6 15 90 15.0
5 6 2 12 11.33
5 7 10 70 40.0
_ 26 94 32,16
_ 80 400 110,0

a) b)

Diferença = 0.02 (2%) Diferença = 0.02 (2%)

Este exemplo, mostra que quanto mais aumentamos o número dos elementos na
amostra, a diferença entre os desvios torna se vez menor.

Os coeficientes de variação são medidas de variação relativa que muitas vezes são
expressadas em percentagem. Eles resultam do quociente entre uma medida de
dispersão absoluta e um promédio.

Coeficientes de variação: quando a dispersão absoluta é igual ao desvio padrão e o


promédio e a média aritmética, a dispersão real é denominada coeficiente de variação
dearsom. Este é o coeficiente mais vulgar e mais utilizado, designando-se,
simplesmente, coeficiente de variação ou coeficiente de dispersão. O seu valor é
expressado, na maior parte das vezes, em percentagem.

48
Diz-se que a dispersão é pequena quando: o coeficiente for menor ou igual à 10%; a
média de dispersão for maior que 10% e menor ou igual à 20%. E diz-se que é grande
quando for maior que 20%.

Caro aluno!

Note que: Alguns autores consideram os intervalos: baixa dispersão se


média dispersão se e alta dispersão se

Exemplo 1.29: Vamos considerar a situação abaixo de uma turma cujos alunos
realizaram dois testes:

Teste Média Desvio-padrão Coeficiente de variação

1 12 2.4 0.2/

2 9 1.9 0.2/

Comparando os valores da tabela entre os testes, podemos concluir que, embora o


teste 1 aparenta ter maior dispersão absoluta, em geral a dispersão relativa dos
resultados é igual.

Em resumo, quando comparamos a dispersão, podem ocorrer três tipos de situações:

1. As observações vem expressas na mesma unidade de medida, e as médias são


iguais ou muito próximas. Portanto, é conveniente compará-las com os valores
de desvio padrão.
2. As observações vem expressas na mesma unidade de medida, e as médias são
significativamente diferentes. Portanto, é conveniente compará-las com as
medidas de dispersão relativa como o coeficiente de variação de pearson.
3. As observações vem expressas em unidades diferentes de medida. Portanto, é
totalmente conveniente, neste caso, compará-las com as medidas de dispersão
como o coeficiente de variação de pearson.

49
Leituras Obrigatórias
Na lição nº 4 os temas seguintes não foram tratados: Medidas de forma de
distribuição de frequências (momentos); Assimetria de uma distribuição e seus
coeficientes e Curtose… Pelo que nas referências bibliograficas abaixo, poderás
encontrar os temas acima citados.

Leia também o livro do Allen Webster, pag. 57-58, que é sobre distribuição Normal e
Distribuição Empírica. Este tema fala do uso do desvio padrão para verificar se dados
a serem estudados são normalmente distribuidos.

Leituras Complementares

A partir da leitura dos livros que lhe recomendamos abaixo, com textos que constituem
o que chamamos por leituras complementares, o nosso maior objectivo é, que o
estimado aluno conheça outras abordagens dos temas, por si estudados ao longo da
primeira unidade, para dar mais subsídios e enriquecer os teus conhecimentos nesta
área. Seja exigente consigo mesmo: evite ler os textos apenas para resolver os
exercícios. A leitura complementar enriquece e facilita o seu entendimento cabal sobre
o conteúdo estudado.

Texto 1
Reis, Elizabeth. Estatística Descritiva. Lisboa, 2005.
Parte 1: De p.15 à p.60;
Parte 2: De p.63 à p.131;

Texto 2
Webster, Allen L. Estatística Aplicada à Administração e Economia. São Paulo:
McGraw-Hill, 2006.
De p.3 à p.61

50
PARTE II - INFERÊNCIA ESTATÍSTICA

Lembre-se que:

A Inferência Estatística é uma forma de indução. A indução estabelece as regras e


formas de raciocínio válido que permitem passar do particular para o geral. O que há
de específico nesta forma de indução designada inferência estatística é o uso da teoria
de probabilidades no tratamento das incertezas, associadas à passagem do particular
para o geral.

51
UNIDADE TEMÁTICA II

TEORIA ELEMENTAR DAS PROBABILIDADES

Objectivos da Unidade
Ao fim desta unidade, deves ser capaz de:
1. Definir probabilidade;
2. Descrever as abordagens clássica, frequencista e subjectiva da probabilidade;
3. Explicar os termos experimento, espaço amostral e evento;
4. Definir os termos probabilidade condicional e probabilidade conjunta;
5. Calcular probabilidades aplicando as regras de adição e multiplicação;
6. Determinar o número de possíveis permutações e combinações;
7. Aplicar a análise combinatória na resolução de problemas;
8. Calcular uma probabilidade usando o Teorema de Bayes;

52
Introdução

A Teoria de Probabilidades é um ramo da Matemática extremamente útil para o estudo


e investigação das regularidades dos chamados fenómenos de um mero acaso,
denominados aleatórios. O lançamento de uma moeda 10 vezes é um exemplo de um
experimento aleatório. A maioria dos experimentos está sujeito a Variação Aleatória. A
teoria das probabilidades é a aproximação matemática que busca quantificar em temos
de modelos o que ocorre com estes experimentos.

Em muitas experiências, há sempre uma incerteza no que se refere à ocorrência e grau


de resultado de um determinado fenómeno observado numa experiência. A fim de se
obter uma medida de certeza (chance) ou probabilidade, com que se pode esperar a
ocorrência e grau de resultado de um evento, atribui-se um número entre 0 e 1 ou um
intervalo entre 0 e 100%. Se se tem certeza que o evento sempre ocorrerá, diz se que
sua probabilidade de ocorrência é igual a 100% (ou 1), se não, então diz-se que a
probabilidade de ocorrência é igual a zero “0”.

A teoria das probabilidades constitui o pré-requisito essencial para poderes melhorar o


estudo da inferência estatística. Para entenderes melhor os conteúdos da inferência
estatística, que tal tratar dos seguintes conceitos básicos da teoria das probabilidades:
Experiência Aleatória, Espaço de Resultados, Espaço Probabilístico, Variável Aleatória,
Função de Probabilidades, Função de Densidade e Função de Distribuição.

53
LIÇÃO N°5

PROBABILIDADES

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Entender o conceito de evento, experimento, espaço amostral e probabilidade;


2. Descrever os principais axiomas de probabilidades;
3. Conhecer a definição clássica do conceito de probabilidade e distinguir este do
conceito de probabilidade frequecista e subjectiva;

54
2.5.1 Breves Conceitos Básicos

a) Evento - é uma colecção de um ou mais resultados de um experimento

Exemplo: Saída de uma cara no mínimo =

b) Experimento - é uma experiência cujos resultados são imprevisíveis.

Exemplo: lançar uma moeda duas vezes, podendo ter como resultados possíveis
(espaço amostral): . Onde representa a saída de cara, e , a saída da
coroa.

Exemplo 2.1: Um jogador de futebol quando bate uma penalidade, os resultados


possíveis são “marcar” ou “não marcar”. Em cada tentativa não é possível prever o
resultado, embora ele seja determinado por causas perfeitamente bem definidas. Entre
as diversas causas se destacam: o poderio do remate, o tipo de guarda redes, a
simulação do marcador, etc. É de notar que isto resulta numa diversidade de
parâmetros que podemos controlar mas que levam-nos ao resultado imprevisível: se
vai ser golo ou não.

Nota: O exemplo descrito acima faz parte de diversas experiências que podem ser
feitas, tendo o imprevisível resultado dentro dos casos possíveis.

c) Experiência – é o conjunto de causas e processamentos que podem produzir


resultados observáveis. Se essa experiência está sujeita a várias situações e que os
resultados são um mero acaso, diz-se que ela é aleatória. Voltando ao exemplo atrás,
aparentemente pode parecer que nele existe alguma regularidade. Mas, se o número
de observações for elevado, alguma regularidade surge. O número de penaltes
marcados é aproximadamente cerca de 95% do que os falhados (defendidos, que
tocaram na barra ou que foram ao lado da baliza) com 5%.

Características das experiências aleatórias

Podemos afirmar que as experiências aleatórias caracterizam-se por:

Poderem repetir-se em grande número de vezes nas mesmas condições ou


em condições muito semelhantes;
Cada vez que a experiência é executada obtém-se um resultado, mas que
não é possível de ser previsto antes.
Os resultados dessas experiências individuais são irregulares, mas que
analisados na globalidade ao longo de muito tempo (muitas experiências),
parecem ter uma certa regularidade estatística quando tomados em conjunto.

55
Cumprindo-se os três pressupostos dizemos que estamos perante um experimento. Se
estás a trabalhar num computador e lhe dizem que dentro de dez minutos não haverá
energia eléctrica, já pode prever o resultado de que o computador irá desligar.

A teoria das probabilidades opera sobre os fenómenos aleatórios e na maior parte dos
casos sobre experimentos. Será que o jogador citado, no exemplo acima, ao chutar a
bola vai mesmo marcar? Neste caso recorremos à teoria das probabilidades, pois ela
tenta dar significado a experimentos tais que o resultado não pode ser completamente
pré-determinado. “Atente para o facto de que pré-determinado não significa pré-
definido”. Calcular a probabilidade é medir a incerteza ou associar um grau de
confiança aos resultados possíveis. Por exemplo, escolha uma carta qualquer num
baralho depois de ter sido bem baralhado, para garantir que todas as cartas tenham a
mesma possibilidade de serem seleccionadas. O que é mais provável sair, uma figura
ou sair um dois de espadas?

Vamos entender o evento como um acontecimento. As probabilidades associam às


possíveis combinações dos resultados, que chamamos de eventos, um valor entre 0 e
1. Quanto maior for o valor, maior é a certeza de sua possibilidade de ocorrência.

d) Probabilidade - é uma medida de possibilidade de ocorrência de um


determinado evento; Ela pode assumir qualquer valor entre 0 e 1.

Apesar da vasta aplicação dos princípios da probabilidade, geralmente há somente três


maneiras aceitáveis de aproximação para a probabilidade: a frequência relativa
(frequencista), a subjectva e a clássica.

A frequência relativa usa a informação passada que foi observada empiricamente. Ela
observa a frequência com que algum evento ocorreu no passado e estima a
probabilidade dele ocorrer novamente. A probabilidade de um evento com base
frequrncia relativa é dada por:

Frequência relativa:

Por exemplo, assuma que durante o último mês ocorreram 50 nascimentos no hospital
do seu bairro. Trinta e dois (32) bebês recém nascidos eram meninas. A frequência
relativa revela que a probabilidade de que um próximo nascimento (ou qualquer
nascimnto escolhido aleatoriamente) seja de uma menina é:

56
Em muitas ocasiões os dados anteriores não estão disponíveis e, portanto, não é
possível calcular a probabilidade a partir do desempenho anterior. A única alternativa é
estimar a probabilidade utilizando o seu melhor julgamento. Esta aproximação
subjectiva associa probabilidade aos eventos com base na avaliação da melhor
evidência. A aproximação subjectiva é usada quando queremos associar
probabilidades a um evento que nunca ocorreu. A probabilidade de que uma mulher
será eleita presidente da republica de Moçambique é um exemplo. Visto que não há
dados do passado, devemos avaliar nossas opiniões e crenças para obter uma
estimativa subjectiva.

Definição axiomática de probabilidade

Se for um evento qualquer e S for espaço de resultados (conjunto universal), então:

a)

b)

c) ,

Exemplo 2.2: Consideremos, agora, o lançamento de um dado. Um dado possui seis


faces numeradas de 1 a 6. Nesse lançamento pode sair uma face par assim como uma
face ímpar. Acontecimento é qualquer um dos subconjuntos do conjunto que contém
todos resultados possíveis da experiência aleatória.

Denotemos por , o conjunto que contém todos os resultados possíveis do experimento


aleatório, e a este conjunto, chamamos de espaço amostral. Então, S pode ser escrito
como: e alguns possíveis eventos podem ser:

- caso em que num lançamento saia uma face par.

- caso em que num lançamento saia uma face


maior ou igual a 5.

= {face maior ou igual a 7 } = = conjunto vazio.

Tomemos ainda o exemplo de lançamento de um dado. Um dado contém seis faces


numeradas de 1 a 6. Neste caso, o espaço de resultados é . Vejamos
as definições que se seguem:

Dois eventos (acontecimentos) quaisquer dizem-se mutuamente exclusivos se


possuem intersecção vazia, são incompatíveis, isto é, eles não podem ocorrer
simultaneamente.

57
Exemplo 2.3:

Como podemos ver a intersecção dos subconjuntos e é vazia, isto significa que no
lançamento de um dado não podemos ter a face par e impar ao mesmo tempo.

Os subconjuntos de S designam-se por acontecimentos; Os subconjuntos formados por


um único elemento chamam-se acontecimentos elementares.

Exemplos:

O acontecimento que não contém algum elemento de , chama-se de acontecimento


impossível.

Exemplo:

A reunião de dois acontecimentos e é um acontecimento que se pode realizar, se e


somente se, ou se realiza. O que significa que se realiza ou se realiza ou ainda
ambos se realizam. Abrevia-se por ou , e é formado pelos elementos que
vem de e os que vem de .

Nota: Quando um elemento coexiste nos dois conjuntos, deve ser escrito (participar)
uma única vez no conjunto solução da reunião.

Exemplo 2.4:

A intersecção dos acontecimentos e é um acontecimento realizável, se e somente


se, e se realizam ao mesmo tempo. Representa-se por ou , e é formado
por elementos que comummente existem em e em .

Exemplo 2.5:

58
Diz-se que é um acontecimento complementar de se é formado por todos
elementos do espaço amostral excepto os existentes em . Escreve-se .
Para o nosso exemplo o . Também pode-se designar de ou ao
complementar de .

Na lógica matemática, segundo as leis de Morgan, definem-se seguintes axiomas para


conjuntos:

Se é um conjunto qualquer, e ou definido como sendo complementar do


conjunto .

1.
2.
3.

Afinal como é que uma


probabilidade é expressa?

Uma probabilidade é expressa como um número decimal, tal como 0,70 ; 0,27 ; ou
0,50. Entretanto ela pode ser representada como uma percentagem tal como 70 %, 27
% ou 50 %.

Caro aluno!

Note que: Nunca se diz porcentos, p. ex: 2, 3, … porcentos, mas sim porcento.

O valor de uma probabilidade está localizado no intervalo de números reais que vai de
0 a 1, inclusive as extremidades deste intervalo.

Quando uma probabilidade é 0, o evento a ela associado é improvável de ocorrer, o


que se denomina por Evento Impossível.

Quando uma probabilidade é 1, o evento a ela associado é mais provável de ocorrer e


é denominado de Evento Exacto.

59
Definição clássica de Probabilidade: Dado um evento associado a um experimento
aleatório com espaço amostral , a probabilidade do evento A denotada por éo
quociente:

Voltemos para o caso do lançamento de dado, e atentemos somente para o


aparecimento da face par. O evento , terá como
probabilidade . Isto é, número de resultados favoráveis (ao evento )
dividido pelo número de resultados possíveis no conjunto .

60
LIÇÃO N°6

ANÁLISE COMBINATÓRIA

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Entender o conceito de factorial de um número;


2. Descrever e saber aplicar os conceitos de Permutação, Arranjos e
Combinações;
3. Saber distinguir Arranjos das Combinações;

61
2.6.1 Factorial de um número

Seja n um número inteiro não negativo. Define-se factorial de n (indicado pelo símbolo
n! ) como sendo: e lê-se:
n factorial.

Casos Especiais

Exemplo 2.6:

a) Lê-se 6 factorial

b) Lê-se 4 factorial

c) Repare ainda que Lê-se 6 factorial igual a 6 vezes 5 vezes


4 factorial.

2.6.2 Princípio fundamental da contagem

Se uma tarefa pode ser realizada em etapas diferentes, e se a primeira etapa pode
ocorrer de maneiras diferentes, a segunda de maneiras diferentes, e assim
sucessivamente, então o número total T de maneiras de realização da tarefa é dado
por: .

Exemplo 2.7:

O INAV (Instituto Nacional de Viação) tem como norma mandar colocar placas de
matrícula nos veículos automóveis usando-se 3 letras do alfabeto (sendo a primeira
letra M) e 4 algarismos. Qual o número máximo de veículos que poderão ser
licenciados?

Resolução:

62
Usando o Princípio fundamental da contagem, podemos imaginar uma placa do tipo
MLN 10 15. Como o alfabeto possui 26 letras e o sistema numérico possui 10
algarismos (de 0 a 9), podemos concluir que: para a 1ª posição, temos 1 (uma)
alternativa que é a letra M, como pode haver repetição, para a 2ª, e 3ª também, estas
duas últimas terão 26 alternativas cada. Com relação aos algarismos, concluímos
facilmente que temos 10 alternativas para cada um dos 4 lugares. Podemos então
afirmar que o número total de veículos que podem ser licenciados será igual a:
que resulta em 6.760.000.
Atenção… Observe que quando o número de veículos ultrapassar o valor acima,
ainda que seja por 1, p.ex: 6.760.001 veículos, todos com matricula nacional, o
sistema de codificação para atribuição de matrículas terá de ser modificado, já que
não existiriam números de matrícula suficientes para todos os veículos.

2.6.3 Permutações simples

Permutações simples (de elementos distintos) - são agrupamentos formados por


todos os elementos tomados a e que diferem na ordem de sua colocação. Neste
caso o número total de permutações simples de elementos distintos é dado por ,e
lê-se, factorial.

Exemplo 2.8: Com os elementos de um conjunto qualquer, são possíveis as


seguintes permutações: .

Exemplo 2.9: De quantas maneiras 5 pessoas podem se sentar num banco


rectangular. .

2.6.4 Permutações com elementos repetidos

Se entre os n elementos de um agrupamento, existem elementos repetidos com uma


característica, elementos repetidos com outra característica e elementos repetidos
com outra característica e assim sucessivamente, o número total de permutações que
podemos formar é dado por:

Exemplo 2.10: Imagine que se as marcas de carros fossem obtidas da combinação de


um conjunto de letras de uma palavra pré-definida. Quantas marcas de viaturas
podemos ter a partir da palavra “correspondente”?

63
Solução: Temos 14 elementos, dos quais 4 estão repetidos. Observe que a letra “o”
aparece duas vezes, a letra “r” duas também, a letra “e” três vezes e a letra “n” duas
vezes. Na fórmula anterior, teremos: (nº de elementos)

Nº de repetições em cada letra: :

Portanto, aplicando a fórmula acima a resposta é

Resposta: Podemos ter 1816214400 marcas de carros diferentes.

2.6.5 Arranjos simples

Dado um conjunto com elementos, chama-se arranjo simples tomados a , a todo


agrupamento de k elementos diferentes dispostos numa certa ordem. Especial atenção
deve existir para evitar confusão, porque dois arranjos diferem entre si, pela ordem de
colocação dos elementos. Assim, no conjunto , teremos:

a) Arranjos de três elementos tomados dois a dois: .

b) Arranjos de três elementos tomados três a três: .

Arranjos simples são representados pela fórmula: . Lê-se: Arranjos de a

É fácil perceber que .

Exemplo 2.11: Um cartão multibanco possui um número de 16 dígitos. O segredo


(PIN) do cartão é marcado por uma sequência de 4 dígitos distintos. Se uma pessoa
tentar usar o cartão, quantas tentativas deverá fazer (no máximo) para conseguir
efectuar um levantamento, se a norma fosse que cada pessoa escolhe 4 dígitos para
usar como PIN, dentre as constantes como número do cartão?

Resolução:

As sequências serão do tipo . Para a primeira posição teremos 16 alternativas,


para a segunda 15, para a terceira 14 e para a última 13. Podemos aplicar a fórmula de
arranjos, mas pelo princípio fundamental de contagem, chegaremos ao mesmo

64
resultado: .

Resposta: A pessoa deverá efectuar 43 680 tentativas.

2.6.6 Combinações simples

Denominamos combinações simples de elementos distintos tomados a , aos


subconjuntos formados por elementos distintos escolhidos entre os elementos
dados. A diferença entre arranjos e combinações reside no facto de que nos arranjos a
ordem é importante enquanto que nas combinações a ordem não é importante.

Exemplo 2.12: Dado um conjunto podemos considerar:

a) Combinações dos 4 elementos tomados 2 a 2 as seguintes: .

b) Combinações dos quatro elementos tomados 3 a 3 as seguintes: .

c) Combinações dos 4 elementos tomados 4 a 4:

Analiticamente, as combinações são representadas por: , que se lê:

combinação de a . A fórmula de combinações é mais conhecida como sendo


número binomial e indicado por: e que será usado nas Distribuições
Teóricas Discretas de Probabilidade (Binomial e Hipergeométrica).

Resumo…

Numa permutação, todos os elementos do conjunto devem fazer parte. Num


arranjo, toma-se uma parte dos elementos do conjunto para formar
agrupamentos; Quando essa parte dos elementos é um todo (universo), o
arranjo se transforma em permutação. 65

Num arranjo, a ordem dos elementos interessa, sendo que se no primeiro


agrupamento um elemento estiver na primeira posição, e no segundo
LIÇÃO N°7

CONSIDERAÇÕES SOBRE LEIS, AXIOMAS E TEOREMAS

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Conhecer as várias propriedades de probabilidades;


2. Distinguir acontecimentos dependentes de independentes;
3. Entender e saber aplicar a probabilidade condicional;
4. Entender e saber aplicar o conceito de probabilidade total e o teorema de bayes;

66
2.7.1 Considerações sobre leis, axiomas e teoremas:

Se A e B, são dois eventos quaisquer de S, teremos:

1.
2.
3.
4. , se , i.e, e são mutuamente exclusivos
5. , se , i.e, e não são
mutuamente exclusivos
6. e são independentes
7. ou e são
independentes
8. ocorre depois de ter ocorrido. Este caso, define
Probabilidade Condicional.
9.
10.
11.

Exemplo 2.13: Na zona do Bairro Canongole em Tete, existem duas padarias, uma
produzindo pães de forma, e outra, arrufadas. Nesta zona, que se dedica
essencialmente à venda de cabritos, 9,8% dos residentes compram sempre pão de

67
forma, 22,9% compram sempre arrufadas e 5,1% compram sempre ambos tipos de
pães. Determine a probabilidade de:

a) Uma pessoa comprar pelo menos um dos dois tipos de pães.


b) Uma pessoa comprar somente pão forma.
c) Uma pessoa não comprar nem pão forma nem arrufadas.

Resolução:

Designemos por o acontecimento comprar pão de forma e comprar arrufadas. A


probabilidade de uma pessoa comprar pelo menos um dos dois tipos de pães será
, visto
que A e B não são mutuamente exclusivos. A probabilidade de uma pessoa comprar
somente pão de forma é a probabilidade da pessoa comprar pão de forma e não
arrufadas, ou seja . A
probabilidade de uma pessoa não comprar nem pão de forma e nem arrufadas,
corresponde a não comprar pão de forma nem comprar arrufadas, logo
.

2.7.2 Definição para acontecimentos independentes

A regra especial de multiplicação requer que dois eventos sejam independentes.


Já tínhamos visto atrás, onde figuram diversas propriedades, para casos de dois
eventos. E definimos que, dois eventos e dizem-se independentes se a ocorrência
de um não tem efeito sobre a probabilidade de ocorrência do outro, isto é
.

Para três eventos independentes , a regra especial da multiplicação usada para


determinar a probabilidade de que todos os eventos ocorram é:
.

2.7.3 Probabilidade Condicional

Definição 1: A probabilidade condicional de um evento dado o evento é dada por


, o que equivale a

Definição 2: e dizem-se independentes se, e somente se,


, o que equivale a dizer e
.

68
Exemplo 2.14: Um grupo de pessoas é classificado de acordo com o seu gosto pela
bebida alcoólica, e a incidência na qualidade de violência que possa praticar. As
proporções das diversas categorias, aparecem na tabela seguinte:

Tabela 3.3 Proporções de gosto pela bebida e a incidência de violência

Bêbedo Moderado Não Bebe Total

Violento 0,10 0,08 0,02 0.20

Não Violento 0,15 0,45 0,20 0,80

Total 0,25 0,53 0,22 1,00

a) Qual é a probabilidade de uma pessoa escolhida ao acaso seja violenta?

b) Qual é a probabilidade de uma pessoa bêbeda ser violenta?

Resolução:

a) A resposta para a primeira questão é imediata. Basta ver a proporção de


violentos dentro da população que é de 0,20.
b) Para responder à segunda questão, há que tomar em atenção que o que se
pretende é a proporção de violentos dentre a população de bêbedos, i.e.,
. Por outras palavras quer-se calcular a probabilidade do acontecimento
“ser violento”, sabendo que ocorreu o acontecimento “ser bêbedo”.

Prezado aluno!

Repare que: este quociente resulta da divisão entre a probabilidade de uma


pessoa ser violenta se for bêbeda, e a probabilidade de uma pessoa ser bêbeda.
Chamemos por , o acontecimento “ser bêbedo”, e por , o acontecimento “ser
violento”. Podemos escrever simbolicamente que a probabilidade pretendida é
dada por: - fórmula da definição de probabilidade condicional.

2.7.3.1 Regra Geral da Multiplicação numa Probabilidade Condicional

A Regra Geral da Multiplicação é usada para encontrar a probabilidade conjunta de que


dois eventos ocorram. Ela estabelece que para dois eventos e , a probabilidade

69
conjunta de que os dois eventos ocorram é obtida pela multiplicação da probabilidade
de que o evento ocorra pela probabilidade condicional de , dado que ocorreu.
Pela notação simbólica temos que: . Alternativamente,
podemos também escrever: .

2.7.4 Probabilidade Total

Suponhamos que um acontecimento C pode ocorrer se também ocorrer um dos


acontecimentos que são mutuamente exclusivos , os quais formam um
conjunto. Suponhamos, ainda, que sejam conhecidas as probabilidades destes
acontecimentos e as probabilidades condicionais do
acontecimento C. Pretendemos calcular a probabilidade de que C ocorra.

Exemplo 2.15: A Administração de um fundo de investimentos em acções pretende


divulgar após o encerramento do pregão, a probabilidade de queda de um índice da
bolsa no dia seguinte, baseando-se nas informações disponíveis até aquele momento.
Suponha que a previsão inicial seja de 0,10. Após encerrado o pregão, nova
informação sugere uma alta do dólar em relação ao metical. A experiência passada
indica que quando houve queda da bolsa no dia seguinte, 20% das vezes foram
precedidas por esse tipo de notícias, enquanto nos dias em que a bolsa esteve em alta,
apenas em 5% das vezes houve esse tipo de notícia no dia anterior. Determine a
probabilidade de que a bolsa caia pelo simples facto de ter caído o dólar. Determine a
probabilidade de que haja alta do dólar.

Resolução:

. Se - é a alta do dólar, então:

Seja - Queda da bolsa. - probabilidade de queda da bolsa devido a


alta do dólar.

Portanto, a informação aumenta a probabilidade de alta do dólar em 6,5%.

2.7.4.1 Teorema da Probabilidade Total

A probabilidade de um acontecimento , que pode ocorrer apenas sob a condição de


que ocorra um dos acontecimentos que excluem mutuamente e que
formam oconjunto , é igual a soma do produto das probabilidades de cada um desses

70
acontecimentos, pela correspondente probabilidade condicional do acontecimento ,
isto é:

2.7.4.2 Teorema de Bayes

Suponhamos que um acontecimento pode ocorrer se também ocorrer um dos


acontecimentos que se excluem mutuamente e que formam um grupo
completo. Visto que não se sabe qual desses acontecimentos ocorrerá, eles são
considerados como hipóteses. A probabilidade de que ocorra, determina-se pelo
teorema de probabilidade total. Como iríamos determinar a probabilidade de que um
dos eventos que é partição de ocorra dado que ocorreu?

Exemplo 2.16: Os trabalhadores de uma fábrica são classificados segundo o nível de


instrução escolar. A experiência mostra que 30% dos indivíduos são de nível superior,
destes 80% são considerados conhecedores das tarefas que desempenham. Dos 70%
com nível inferior a superior, 50% são considerados conhecedores das tarefas que
desempenham.

Dados

a) Qual é a probabilidade de que um trabalhador da fábrica encontrado no refeitório


seja considerado conhecedor das tarefas que desempenha na fábrica?

Resolução

Resposta:

A probabilidade de que um trabalhador da fábrica encontrado no refeitório seja


considerado conhecedor das tarefas que desempenha na fábrica é de 0,59.

b) Qual é a probabilidade de que um trabalhador conhecedor da matéria tenha nível


superior?

Resolução

71
Resposta: A probabilidade de que um trabalhador conhecedor da matéria tenha nível
superior é de 0,4067797.

72
Leituras Complementares

A partir da leitura dos livros que lhe recomendamos abaixo, com textos que constituem
o que chamamos por leituras complementares, o nosso maior objectivo é, que o
estimado aluno conheça outras abordagens dos temas, por si estudados ao longo da
primeira unidade, para dar mais subsídios e enriquecer os teus conhecimentos nesta
área. Seja exigente consigo mesmo: evite ler os textos apenas para resolver os
exercícios. A leitura complementar enriquece e facilita o seu entendimento cabal sobre
o conteúdo estudado.

Texto 1
Reis, Elizabeth; Melo, Paulo; Andrade, Rosa e Calapez, Teresa. Estatística Aplicada.
Lisboa, 2001.
Cápitulo II: De p.29 à p.80;

Texto 2
Webster, Allen L. Estatística Aplicada à Administração e Economia. São Paulo:
McGraw-Hill, 2006.
Capítulo IV: De p.72 à p.90.

73
UNIDADE TEMÁTICA III

VARIÁVEIS ALEATÓRIAS

Objectivos da Unidade
No fim desta unidade, deves ser capaz de:
1. Distinguir conceito de variavel aleatória discreta da contínua;
2. Caracterizar a função ou lei de distribuição de probabilidades;
3. Entender o conceito de distribuição acumulada e suas propriedades;
4. Entender as propriedades da esperança matemática e da variância;
5. Caracterizar a função de distrbuição acumulada das variáveis contínuas;
6. Entender as propriedades da função de distribuição;
7. Entender o conceito de função de densidade de probabilidades e suas
propriedades;
8. Descrever as características das variáveis contínuas;
9. Saber calcular as características das variáveis contínuas;

74
Lição Nº 8

VARIÁVEIS ALEATÓRIAS DISCRETAS

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Entender o conceito de variável aleatória discreta;


2. Caracterizar a função ou lei de distribuição de probabilidades;
3. Entender o conceito de distribuição acumulada e suas propriedades;

75
3.8.1 Conceito de Variável Aleatória

Seja , o eapaço amostral de um certo experimento. Como vimos na teoria das


probabilidades, os resultados de um experimento, isto é, os pontos amostrais de ,
não precisam de ser, necessariamente, números. Contudo, frequentemente, é
desejável associar um número específico a cada resultado de um experimento. Esta
associação, dá lugar a uma nova variável, que passamos a chamá-la por variável
aleatória.

Definição 1: Uma variável aleatória num espaço amostral S, é uma função de S no


conjunto R dos números reais tal que a imagem inversa de cada intervalo de seja um
evento de S (Lipschutz, 1993).

Observação: Se o espaço amostral não é enumerável, então, por motivos


teóricos, certas variáveis definidas em serão aleatórias. Entretanto, os espaços
amostrais considerados nesta abordagem serão finitos e enumeráveis.

Definição 2: Uma variável aleatória (V.A.) é um conjunto de valores numéricos que


são associados a eventos de um experimento. Em geral, as variáveis aleatórias são
designadas por letras maiúsculas, , etc. e podem ser discretas ou contínuas.

Exemplo 3.1:

1- Seja a V.A. , o número de sementes de milho que germinam em 100 plantios.


Possíveis valores para são 0;1;2;100 (discreta), pois nós contamos planta a planta,
pelo que, estamos em presença de uma Variável Aleatória Discreta (VAD)

2- Seja , a resposta para a questão, se é ou não Moçambicano. As respostas podem


ser: 'Sim', 'Não', 'Não Responde'. Repare que para este caso o não é uma V.A (por
não ser numérica). O 'Sim', 'Não', 'Não Responde' são resultados qualitativos. Se
tivéssemos que contar a quantidade de pessoas que responderem 'Sim', 'Não', 'Não
Responde', obteríamos variáveis discretas. Repare que este exemplo não leva a
variável contínua porque as respostas dadas não são medíveis no sistema básico
internacional de medidas.

4- Considere um experimento aleatório no qual uma moeda é lançada 3 vezes. Seja


o número de caras, o nº de caras e o nº de coroas. O espaço amostral para este
experimento será: .

76
Assim, os possíveis valores de (número de caras) serão: . Da
definição de uma variável aleatória , neste experimento, é uma variável aleatória
discreta. Seus valores são resultados de uma contagem.

Amigo aluno!

Repare que: variável aleatória é uma associação de pontos no espaço amostral


com pontos na recta dos números reais . Na realidade, uma variável
aleatória é definida através de uma função em que o domínio é o conjunto de
todos os resultados possíveis do experimento e a imagem é o conjunto de todos os
valores assumidos pela variável aleatória. Note que, a variável aleatória não é
resultado do experimento, mas sim um valor a ele associado.

3.8.2 Variáveis Aleatórias Discretas

Chama-se Variável Aleatória Discreta (VAD) a qualquer variável aleatória em que


varia de maneira descontínua no seu domínio enumerável.

Para facilitar a compreensão, consideram-se apenas varáveis descontínuas aquelas


que tomam unicamente valores inteiros ou nulos.

Exemplo 3.2: Um par de dados é lançado. Observemos o espaço finito equiprovável


constituído por 36 pares ordenados em números entre 1 a 6. Escreve os elementos da
variável aleatória no domínio que associa o maior numero em cada ponto do
espaço.

Resoluçao: o numero dos elementos no espaço amostral e obtido pelo produto


(teorema fundamental de contagem). E o espaço amostral será:

Variável associa o ponto ao ou o maior numero em cada ponto e


seu espaco amostral será dado por

Como varia num espaço finito, para várias experiências repetidas, a cada um dos
valores de que pode tomar a variável aleatória , corresponde a uma probabilidade
:

77
3.8.1 Função ou Lei de Distribuição das Probabilidades

Diz-se que está definida uma Lei de Distribuição das Probabilidades (ou Função
Redistribuição de Probabilidades - FRP) de uma variável aleatória se existe
correspondência entre todos os valores possíveis de e as suas respectivas
probabilidades , e é, usualmente, dada na forma de uma tabela.


Exemplo 3.3: Uma empresa comercializa garrafas de vinho verde de 1 litro. Supõe-se
que 40% dessas garrafas na realidade contém uma menor quantidade de líquido do
que o indicado no rótulo. Tendo comprado 6 dessas garrafas, qual é a probabilidade
de:
a. Duas delas conterem menos de um litro?
b. No máximo duas conterem menos de um litro?
c. Pelo menos duas conterem menos de um litro?
d. Todas conterem menos de um litro?
e. Todas conterem o volume indicado no rótulo?
f. Represente a lei das probabilidades numa tabela.

Resolução: Seja o número de garrafas que contém menos de um litro:


Tomando , o acontecimento sucesso “garrafas que tem
volume menor que um litro” e , o insucesso. As probabilidades podem ser
calculadas pela fórmula de Bernoulli:

a)
b)
c)
d)
e)
f) Para escrever a lei de distribuição de probabilidades é necessário conhecer as
probabilidades :

78
A lei pedida é:

0 1 2 3 4 5 6
0.0467 0.1866 0.3110 0.2765 0.1382 0.0369 0.0041

As probabilidades calculadas e contidas na lei de distribuição gozam de todas as


propriedades das distribuiçoes de frequências relativas, i.é, dada uma lei num espaço
finito ou infinito com as probabilidades , a soma de todas probabilidades
é igual à unidade:

A lei de distribuição de uma variável aleatória discreta pode ser representada


graficamente, marcando num referencial cartesiano, os pontos
, e reunindo-os em seguida, mediante segmentos de recta.
Estes pontos fornecem o chamado Polígono de Distribuição.

Exemplo 3.4: Construir o polígono de distribuição das probabilidades da variável


aleatória dada pela lei:

1 3 6 8

0.2 0.1 0.4 0.3

79
O comportamento de uma variável aleatória discreta numa lei de distribuição de
probilidades é definido pela sua função massa de probabilidade (f.m.p) que,
simplesmente, associa uma probalidade a cada valor que a variável possa
assumir. Deve-se notar que, três propriedades fundamentais das propabilidades são
também aqui válidas.

Propriedades 1:
Propriedades 2:

Propriedades 3:

Exemplo 3.5: Abaixo te é dado(a) a lei de distribuição de uma variável aleatória


discreta , então represente a sua função massa de probabilidades num diagrama de
barras.

3.8.2 Função de Distribuição Acumulada

Outra forma de apresentar a lei de distribuição de probabilidades de uma variável


aleatória discreta é através da sua função de distribuição acumulada de
probabilidades (f.d.a) ou função de partiçao das probabilidades:

80
Propriedades da função de distribuição acumulada

Propriedade 1: OS valores de estão no intervalo de 0 à 1:


Propriedade 2: A funcão é crescente em escadas, i.é:

Propriedade 3: Se o domínio de é o intervalo [a, b] então:


para
para

Exemplo 3.6: Dada a lei de distribuição de uma variável aleatória , escrever a sua
função de distribuição acumulada das probabilidades.

1 3 5 7
0.25 0.25 0.40 0.15

Resolução: A função procurada é obtida somando as probabilidades segundo a


definição e as propriedades acima indicadas.

81
LIÇÃO N° 9

Características Numéricas das Variáveis Aleatórias Discretas

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Entender o conceito esperança matemática;


2. Entender as propriedades da esperança matemática e da variância;

82
3.9.3 Características Numéricas das Variáveis Aleatórias Discretas

Chama-se esperança matemática ou valor esperado de uma variável aleatória


discreta a soma dos produtos dos valores que a variável aleatória pode assumir
pelas probabilidades associadas a estes valores.

Se a variável aleatória, se caracteriza por uma serie finita de valores, então a


esperança matemática se determina pela fórmula:

Como
Então

Desta definição, pode-se notar que é a medida aritmética ponderada dos valores
da variável aleatória: para os pesos que correspondem as
frequências relativas.

Exemplo 3.7: Um jogador lança duas moedas honestas. Ele ganha 200 contos se
ocorrem duas caras e 100 contos se ocorre uma cara, por outro lado, ele perde 300
contos se não ocorrer nenhuma cara. Pede-se para:
a) Escrever a lei de distribuição das probabilidades desde jogo.
b) Determinar o valor esperado do jogo e dizer se ele é favorável ao jogador.

Resolução:
O espaço amostral deste jogo tem 4 possibilidades:
Sendo cara e coroa.
a) Do espaço S, as probabilidades de sair duas caras, uma cara e nenhuma cara
são:

A lei de distribuição das probabilidades procurada é

Número de caras
0 0,25
1 0,50
2 0,25

b) contos.

83
O valor esperado do jogo é de 25 contos e é favorável ao jogador.
Propriedades da esperança matemática

Propriedade 1: ; onde é constante


Propriedade 2: ; é constante e é uma v.a.d.
Propriedade 3: ; e são constantes e é uma v.a.d.
Propriedade 4: e e são v.a.d.
Propriedade 5: ; e Y são v.a.d.

Por exemplo, encontrar a esperança matemática de variável aleatória z que se


expressa através das variáveis e cujas médias são conhecidas: ;
e

Resolução:

Chama-se variância de uma variável aleatória , a esperança matemática do quadrado


do desvio desta variável em relação a sua esperança matemática.

ou melhor

O cálculo da variância pode ser realizado comodamente pela fórmula:

O valor da variância de uma variável aleatória , caracteriza o grau de dispersão desta


variável em relação a sua esperança matemática.

Denomina-se desvio padrão ou desvio médio quadrático de uma variável aleatória ,a


raiz quadrada da respectiva variância.

Exemplo 3.8: A variável aleatória , se caracteriza pela seguinte lei de distribuição das
probabilidades.

84
a) Determinar a esperança matemática, variância e desvio padrão.

Resolução:

Vamos colocar os valores numa tabela, e verificarmos o procedimento de cálculos

0 0,20 0,00 -1,32 0,348480 0,00

1 0,40 0,40 -0,32 0,040960 0,40

2 0,30 0,60 +,68 0,138720 1,20

3 0,08 0,24 +1,68 0,225792 0,72

4 0,02 0,08 +2,68 0,143648 0,32

1,00 1,32 - 0,897600 2,64

Esperança matemática:

Variância:

Desvio padrão:

Propriedades da variância

1. Variância de uma constante:


2. Variância de um produto entre uma constante e uma variável:
3. Variância da soma de uma constante e uma variável
4. Variância de uma soma entre duas variáveis aleatórias:

5. Variância de uma diferença entre duas variáveis aleatórias:

85
LIÇÃO N° 10

VARIÁVEIS ALEATÓRIAS CONTÍNUAS

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Descrever variaveis contínuas;


2. Caracterizar a função de distrbuição acumulada;
3. Entender as propriedades da função de distribuição;
4. Entender o conceito de função de densidade de probabilidades e suas
propriedades;

86
3.10.1 Conceito de Variável Aleatória Contínua

Diz-se que uma variável aleatória é contínua, quando ela pode tomar qualquer valor
real pertencente a um intervalo dado de forma contínua, por exemplo, no intervalo
.

A título de exemplo, vejamos, o peso de um individuo retirado ao acaso de uma dada


população, que é uma variável aleatória contínua que só pode tomar valores positivos.

Seja , a variável aleatória que indica a temperatura máxima diária em Tete. Possíveis
valores são entre - , por exemplo, 36.1573 (contínua), pois resulta de uma
medição, pelo que, estamos na presença de uma Variável Aleatória Contínua (VAC).

3.10.2 Função de distribuição acumulada

É possível, em certos casos, determinar as probabilidades de observar um valor


compreendido num intervalo dado

Em geral, esta probabilidade tende para zero quando o acréscimo da variável tende
para zero , i.é, a probabilidade de uma variável aleatória contínua (v.a.c.) obter
exactamente um valor é nula. Daí que, podemos concluir que a noção de distribuição
de probabilidades deixa de ter sentido para uma variável contínua. Porém, a função de
distribuição conserva todo o seu significado.

Denomina-se função de distribuição acumulada (f.d.a) de uma variável aleatória


contínua a função que a cada faz corresponder a probabilidade de que
assuma um valor estritamente inferior a este .

Deve-se notar que para v.a.c, a função de distribuição ou de partição poderá ter
expressões em em alguns intervalos de seu domínio.

Propriedades da função de distribuição

87
Propriedade 1: Os valores de pertencem ao intervalo

Propriedade 2: A função de distribuição , é crescente: se

Corolário 2.1: A probabilidade de que uma v.a.c assuma um valor num intervalo
é igual ao acréscimo da função de distribuição de neste intervalo.

Corolário 2.2: A probabilidade de que uma v.a.c. assuma um valor é nula:


.

Propreidade 3: Se o domínio de uma variável estiver compreendido num intervalo


, então, a função de distribuição dessa variável satisfaz as relações:

para ou

para ou

Exemplo 3.9: Dada a função de distribuição da variável aleatória a saber:

Achar a probabilidade de que assuma um valor:

a) Inferior à 0.2 ;
b) Inferior à 3;
c) Igual ou superior a 3;
d) Igual ou superior a 5;

Resolução:

Tendo em conta as propriedades da função temos:

a) Para tem-se que , em particular , onde .


b) Como 3 está no intervalo ]2;4], então,
c) Os acontecimentos são complementares, o que significa:

tendo em conta que , então

88
d) Para acontecimentos complementares , e para ,
cumpre-se que , então obtemos:

3.10.3 Função Densidade de Probabilidade

O cálculo de probabilidades para uma variável contínua é observado para um intervalo


dado

Por outro lado, se a função de distribuição pode ser expressa sob forma analítica
e se for derivável, então:

O quociente entre a variação da função e a variação do argumento , quando


tende a função , chamada função densidade de probabilidades
ou simplesmente densidade de probabilidade

Denomina-se densidade de probabilidade de uma , a primeira derivada da


sua função de distribuição .

A função constitui uma forma idealizada da frequência unitária ou densidade de


frequência, uma vez que é definida a partir do quociente de função massa de
probabilidades relativa a um intervalo dado pelo comprimento desse intervalo.

A probabilidade é expressa através da função densidade de probabilidade da forma


seguinte.

Da fórmula anterior pode-se concluir que, se é conhecida a densidade de probabilidade


, a função de distribuição acumulada é encontrada pela fórmula:

89
A probabilidade aqui calculada, tomando como uma função contínua, representa
uma área limitada pelo gráfico da função pelo eixo e pelos limites inferior e
superior do intervalo dado. Vejamos as figuras:

f(x)
f(x)

a b

Propriedades da função densidade de probabilidades

Naturalmente, sendo proporcional a probabilidade, as três propriedades


fundamentais são mantidas.

Propriedade1: A função densidade de probabilidade é sempre positiva.

Propriedade2: A área total limitada pela função densidade de probabilidade e pelo eixo
é igual a unidade ou 100%.

Propriedade 3: A probabilidade de que uma variável aleatória contínua assuma um


valor no intervalo é dada pela fórmula de Newton – Leibniz.

De um modo geral, o conjunto dos valores admissíveis para uma v.a.c e a função
correspondente definem uma distribuição teórica contínua, que é uma forma idealizada
das distribuições observadas agrupadas e relativas a variáveis contínuas.
Rigorosamente, quando o número de classe aumenta, o polígono de distribuição de

90
frequências acumuladas aproxima-se a uma linha cuja equação é a função de
distribuição.

Exemplo 3.10: Seja uma variável aleatória contínua com a seguinte função
densidade de probabilidade:

a) Construa a sua função de distribuição das probabilidades.


b) Calcule a probabilidade de que x assuma um valor no intervalo

Resolução:

a) Pelas propriedades da função temos:

Para

Para

Para

Logo, a função de distribuição é:

Exemplo 3.11: Uma variável aleatória contínua tem a seguinte função densidade de
probabilidade:

a) Determine o valor de constante .


b) Encontre a função de partição para os intervalos indicados.

91
Resolução:

a) Da propriedade 2 da função densidade de probabilidades temos que:


então,

b) Vamos usar as propriedades da função :

Para

Para

Para

92
LIÇÃO N° 11

CARACTERÍSTICAS NUMÉRICAS DAS VARIÁVEIS ALEATÓRIAS


CONTÍNUAS

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Descrever as características das variáveis contínuas;


2. Saber calcular as características das variáveis contínuas;

93
3.11 Características Numéricas das Variáveis Aleatórias Contínuas

Denomina-se esperança matemática de uma v.a.c. de domínio compreendido no eixo


o número:

Note que: o sinal do somatório dá lugar a um sinal de integração e a


probabilidade dá lugar ao elemento de probabilidade .

Se o domínio é um intervalo os limites de integraçao serão substituídos por

Se for uma função de argumento aleatório então:

Se o gráfico de for simétrico em relação a recta .

Todas as propriedades da consideradas para vaiáveis aleatórias discretas são


também válidas para variáveis aleatórias contínuas.

Denomina-se moda de uma variável aleatória contínua ao ponto , no qual a


densidade de probabilidade assume seu valor máximo.

Denomina-se mediana de uma variável aleatória contínua ao ponto , definido


pela condição,

na qual passando uma variável pela mediana, divide a figura compreendida sob o
gráfico de em duas partes iguais.

Denomina-se variância de uma variável aleatória contínua , que assume valores no


eixo para um intervalo dado , o número:

94
Todas as propriedades da variância mencionadas para as variáveis aleatórias discretas
são válidas para as variáveis aleatórias contínuas.

O desvio padrão de uma variável aleatória contínua é definido, no caso discreto, como
sendo:

Exemplo 3.12: Seja X uma variável aleatória contínua com função de densidade de
probabilidades seguinte:

Calcule as seguintes características numéricas: .

a) Esperança:

b) Variância:

c) Desvio padrão:

95
Leituras Complementares

A partir da leitura dos livros que lhe recomendamos abaixo, com textos que constituem
o que chamamos por leituras complementares, o nosso maior objectivo é, que o
estimado aluno conheça outras abordagens dos temas, por si estudados ao longo da
primeira unidade, para dar mais subsídios e enriquecer os teus conhecimentos nesta
área. Seja exigente consigo mesmo: evite ler os textos apenas para resolver os
exercícios. A leitura complementar enriquece e facilita o seu entendimento cabal sobre
o conteúdo estudado.

Texto 1
Reis, Elizabeth; Melo, Paulo; Andrade, Rosa e Calapez, Teresa. Estatística Aplicada.
Lisboa, 2001.
Capítulo III: De p.89 à p.140;

96
UNIDADE TEMÁTICA IV

DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS

Objectivos da Unidade
No fim desta unidade, deves ser capaz de:
1. Descrever distribuições discretas;
2. Caracterizar as distribuições Binomial e de Poisson;
3. Descrever as distribuições contínuas;
4. Descrever e entender a distribuição uniforme;
5. Caracterizar as distribuições exponencial, normal e normal padrão;
6. Definir a função distribuição acumulada;
7. Resolver problemas de probabilidade usando distribuição normal
padronizada;
8. Descrever aproximações de distribuição binomial para de poisson e normal;

97
LIÇÃO N° 12

DISTRIBUIÇÃO DE VARIÁVEIS ALEATÓRIAS DISCRETAS

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Descrever distribuições discretas;


2. Caracterizar as distribuições Binomial e de Poisson;

98
4.12 Introdução

Na unidade temática anterior estudamos o conceito de probabilidade. Nosso objectivo,


foi calcular a probabilidade de um evento. Nesta unidade continuaremos a tratar de
probabilidade examinando os conceitos de variáveis aleatórias e distribuição de
probabilidade. Variável aleatória é uma variável que resulta de um evento aleatório.
Suponha que jogamos uma moeda três vezes e contamos o número de caras obtidas.
Os possíveis resultados são 0, 1, 2 ou 3 caras.

A variável aleatória é o número de caras que ocorrem (representa o número de caras


que podem ocorrer), e os possíveis resultados são os valores da variável aleatória.
Uma distribuição de probabilidade é uma apresentação de todos os resultados
possíveis de um experimento com a probabilidade de cada um dos resultados. A partir
do estudo da unidade anterior podemos determinar que a probabilidade de: (a) obter
nenhuma cara após lançar três vezes uma moeda é 1/8; (a) obter apenas uma cara é
3/8; (3) obter duas caras é 3/8 e a de obter três caras é 1/8. A esta lista de resultados
possíveis de um experimento e também das probabilidades associadas a cada um dos
resultados dá-se o nome de Distribuição de Probabilidade.

Exemplo 4.1: Consideremos lançamentos sucessivos de um dado. Cada vez que o


dado é lançado, seis possíveis resultados podem ocorrer 1, 2, 3, 4, 5 ou 6. Isto significa
que a nossa variável aleatória pode tomar um dos seis resultados, em que todos
possuem a mesma probabilidade

4.12.1 Distribuições de Variáveis Aleatórias Discretas

Neste ponto, destinado à distribuições de VAD, vamos abordar dois tipos de


distribuição, nomeadamente: Distribuição Binomial e Distribuição de Poisson.

4.12.1.1 Distribuição Binomial

Trata-se de uma distribuição de probabilidades adequada aos experimentos que


apresentam apenas dois resultados (sucesso ou fracasso). Diz-se que uma variável
aleatória discreta , tem distribuição binominal ou obedece a lei da distribuição
binominal com parâmetros e , quando ela pode tomar valores discretos de
E os níveis de probabilidade podem ser calculados pela formula de Bernoulli:
;

99
Função - é a função de distribuição de probabilidades. A distribuição
Binominal é interpretada como sendo a distribuição do número de x sucesso “ ”, ou
fracasso , em uma série de provas independentes de um experimento
aleatório.
Para entendermos melhor o que é uma distribuição binomial, que tal, resolvermos juntos o
problema a seguir de uma família? Presta atenção à questão colocada e aos passos de resolução:

Exemplo 4.2: Uma família tem 3 crianças. Se a probabilidade de uma criança ser
menino for 0.5 , encontrar a probabilidade de existir exactamente 2 meninos na família.

Resolução: Dados: ; ;

Já que cada nascimento de uma criança é um acontecimento independente, e se este


se repetir 3 vezes, consideremos sucesso, o nascimento de um menino, e fracasso, o
nascimento de uma menina. Então,

Se considerarmos e como constantes, variarmos de 0 até e calcularmos as


respectivas probabilidades , obteremos uma lei de distribuição das probabilidades
do número de sucesso . Tabela 4.1:

Aqui está a tabela da lei de distribuição das probabilidades para a questão do exemplo 4.2

0 1 2 3 …

Não só é importante saber o que é uma distribuição binomial mas também é necessário
compreender como ela se comporta. Estamos para falar das suas propriedades.

Propriedades da Distribuição Binominal

1. Média ou Esperança Matemática:


2. Variância:

3. Desvio padrão:

Veja este exemplo (4.3): Um estudante tem 60% de probabilidade de obter positiva
sempre que realiza um teste. Se o estudante realizar 3 testes, calcule a probabilidade
de ele obter:

a) Exactamente duas positivas.

100
b) Pelo menos uma positiva.
c) No máximo duas positivas.
d) Escreva a lei de distribuição das probabilidades dos números de positivas que o
estudante possa obter.
e) Calcule a média e a variância da distribuição.

Resolução:

Dados:

a)

b)
=0,288+0,432+0,216=0,936

c) A lei de distribuição procurada é:

Tabela 4.2:

a) Média: Variância e
desavio padrão:

4.12.1.2 Distribuição de Poisson

Em muitos casos, conhece-se o número de sucessos, porém, se torna difícil, e as


vezes sem sentido, determinar o número de fracassos ou o número total das provas.
Por exemplo, podemos contar o número de automóveis que podem passar numa
esquina em um determinado intervalo de tempo, porém, não podemos determinar o
número de carros que deixaram de passar pela esquina. Situações como esta,
sugerem uma variável que depende do tempo , e quando , a probabilidade de
realização do evento tende a diminuir. Para encontrar a probabilidade de realização de
sucesso num intervalo de tempo, e se, simultaneamente, o número de provas for
grande e a probabilidade de realização de cada acontecimento for muito pequena,
devemos usar a distribuição de Poisson que substitui a distribuição Binominal.

101
é o número de sucesso do acontecimento em n
provas independentes. De salientar que x pode assumir valores inteiros: x
= 0, 1, 2,…
é o número médio de ocorrências com sucesso.
- é a base do logarítmo natural: “e” = 2.71828128.

Distribuição de Poisson é interpretada como o limite que tende para a Distribuição


Binominal com o parâmetro e , quando cresce e p decresce de tal forma que o
produto se mantêm constante.

Propriedades da Distribuição de Poisson

1. Média ou esperança matemática


2. Variância
3. Desvio padrão

Exemplo 4.4: A probabilidade de sair defeituoso um exemplar numa fábrica de livros é


0.001. Achar a probabilidade de que numa tiragem de 10000 livros, exactamente 5
destes saiam defeituosos.

Resolução:
Dados
Livros

Exemplo 4.5: Certo posto de bombeiros recebe em média 3 chamadas por 3 dia.
Calcular a probabilidade de:
a) Receber 4 chamadas num dia.
b) Receber 3 ou mais chamadas num dia.
c) Encontre o desvio padrão do número das chamadas que
o posto possa receber num dia.

Resolução:
Dados:
a)

102
b)

c)

A Distribuição de Poisson tem uma boa aproximação à distribuição Binominal para


pequeno, desde que seja também pequeno. Esta aproximação é ilustrada na tabela
abaixo, para

Tabela 4.3:
0 1 2 3 4 5
0.366 0.370 0.185 0.0610 0.0149 0.0029
0.366 0.368 0.184 0.0613 0.0153 0.0031

A importância da Distribuição de Poisson decorre pelo facto dela constituir uma boa
aproximação para processos de eventos aleatórios. Assim, ela serve de um modelo
bastante utilizado para a análise do número de chamadas telefónicas num terminal,
números de erros tipográficas na página de um livro, números de cheias observadas
em certo intervalo de tempo, número de acidentes industriais, número de chegadas em
modelos de filas de espera, etc.

103
Leituras Obrigatórias

Esta leitura é importante para que consiga aprender e entender os conceitos


Distribuição Hiper geometrica, Multinomial e enriquecer outros conceitos de
distribuições discretas

Texto 1
Webster, Allen L. Estatística Aplicada à Administracao e Economia. São Paulo:
McGraw-Hill, 2006.

Ler este livro capitulo 5 de pagina 109 a pagina 110.

Texto 2
Reis, Elizabeth; Melo, Paulo; Andrade, Rosa e Calapez, Teresa. Estatística Aplicada.
Lisboa, 2001.
O capitulo IV: De pagina 161 a pagina 216;

104
LIÇÃO N° 13

DISTRIBUIÇAO DE VARIAVEIS ALEATORIAS CONTÍNUAS

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Descrever as distribuições contínuas;Descrever e entender a distribuição


uniforme;
2. Caracterizar as distribuições exponencial, normal e normal padrão;

105
4.13 Distribuições de Variáveis Aleatórias Contínuas

Neste parágrafo, serão apresentados os principais modelos de distribuições de


variáveis aleatórias contínuas como, por exemplo, a distribuição uniforme, exponencial
e normal.

4.13.1 Distribuição Uniforme ou Rectangular

A distribuição uniforme é valida para situações nas quais as probabilidades de todos os


sucessos são iguais. E, diz-se que uma variável é, uniformemente, distribuída se a sua
função densidade de probabilidade permanecer constante num intervalo .

A sua função de distribuição acumulada é:

Os gráficos da função densidade de probabilidades e da função de distribuição


acumulada são ilustrados a seguir:

Função densidade de probabilidade Função de distribuição acumulada

1,0 a b

106
Figura 4.1: Função densidade de probabilidade é função de distribuição acumulada de
distribuição uniforme.
Probabilidade da distribuição

1) Média ou Esperança Matemática é:

2) Variância:
3) Desvio padrão:

Exemplo 4.6: Um ponto escolhido ao acaso no segmento de recta Qual será a


probabilidade de que o ponto escolhido esteja entre 1 e 3/2.

Resolução:
Seja , uma variável que representa um ponto no segmento A função densidade
da variável é dada por se , caso
contrário, , então, pode-se escrever:

Como 1 e 3/2 pertencem ao intervalo a probabilidade será:

Se a função de distribuição é conhecida, a probabilidade pode ser calculada passando


directamente pela função primitiva de

De onde

Exemplo 4.7: O intervalo do tempo de duração de pequenos anúncios publicitários é


estimado entre 5 e 12 minutos. Admitindo que a duração de cada anúncio é aleatória e
todos os anúncios distribuem-se uniformemente no intervalo indicado:
a) Indique a função de distribuição das probabilidades;

107
b) Escreva a função de distribuições acumuladas das
probabilidades;
c) Qual é a probabilidade de um anúncio ter uma duração
inferior a 8 minutos, e de ter entre 8 e 10 minutos.
d) Calcule a duração média dos anúncios.

Resolução:

a) Substituindo na fórmula geral de os valores de e


temos:

b) A função de distribuição correspondente é:

c)

d)

4.13.2 Distribuição Exponencial

A distribuição de probabilidade de intervalo de tempo , entre dois sucessos


consecutivos, de uma lei de Poisson e a Distribuição Exponencial. A sua função
densidade é dada por:

Partindo da função densidade de probabilidade pode-se obter a função de distribuição


acumulada

108
A probabilidade de que uma variável aleatória contínua , cuja função densidade de
probabilidade é dada pela distribuição exponencial, assuma um valor num intervalo
é igual a:

Os gráficos correspondentes à função densidade e a função de distribuição acumulada


são:

Função densidade de probabilidade Função de distribuição acumulada

F(x) F(x)
1.0 1.0

0.5
0.5

0.0 0.0
Variável x Variável x

Figura 4.2: Função densidade de probabilidade e função acumulada da distribuição


exponencial.

Probabilidade da distribuição exponencial


1. Média ou Esperança Matemática:
2. Variância:
Desvio padrão:
Exemplo 4.8: O tempo de espera em minutos numa paragem de autocarros, obedece
a distribuição exponencial com . Considere o tempo de espera como um processo
aleatório e responda às alíneas seguintes:
a) Obtenha a função de distribuição acumulada da variável
;
b) Determine a média e o desvio padrão;
c) Qual é a probabilidade de que assuma um valor entre
0.6 e 2 ?;

Resolução:

109
a)

b)
c)

4.13.3 Distribuição Normal

A distribuição normal é um dos mais importantes de uma distribuição contínua em


estatística. Pois, muitas variáveis quantitativas em ciências são comparadas com a
distribuição normal, por exemplo: altura de um indivíduo, peso, grau de coeficiente
inteligência, resultados de exames, etc. Esta distribuição é também conhecida como
distribuição de Gauss - Laplace ou Laplace - Gauss.

Uma variável aleatória contínua, diz-se que, é normalmente distribuída se a sua função
densidade de probabilidade é definida pela seguinte expressão:

Onde: média da distribuição desvio padrão da distribuição


2.71821828

valores de z

A figura 4.3 curva da distribuição

4.13.4 Distribuição Normal Padrão

110
Se a variável normal com média e variância , for expressa em unidade reduzidas
(escores reduzidos), através da variável , onde pode-se mostrar que é
também normal com média E(z) = 0 e variância (z)=1.

Logo, a função densidade de probabilidade será:

Cada valor da função corresponde ao cumprimento entre função densidade e o


eixo .

Por se tratar da média de cumprimento, os valores da função são sempre positivos, e


diz-se que é par, daí que

Como a média de z é 0, a variância é 1, as probabilidades (áreas) sob são


calculadas e tabeladas. Nos próximos exemplos, explicaremos o uso da tabela de
distribuição normal padrão.

Para se anotar as distribuições normais usa-se:

Lê-se: “a variável aleatória tem distribuição normal com média e


variância ”.

- Lê-se: “a variável aleatória tem distribuição normal com média 0 e


variância 1”, ou simplesmente, distribuição normal padrão.

Propriedades da distribuição normal

Propriedade 1. Média ou Esperança Matemática: (x)=


Propriedade 2. Variância:
propriedade 3. Desvio padrão:
Propriedade 4. é simétrico em relação à origem; o é simétrico em
relação à origem ,

111
Figura 4.4: Simetria da curva normal e a ordenada máxima da função

Propriedade 5. possui um máximo para possui um máximo para


neste caso, sua ordenada vale = 0.3989.

Propriedade 6. tende a zero quando tende para ou O mesmo acontece


para quando , isto é, ou são assímptotas de ou .

Propriedade 7. A área sob a curva normal entre e , corresponde


aproximadamente a 63.3%, a outra entre corresponde
aproximadamente a 95.4%, e a outra entre corresponde a
aproximadamente a 99.7 %, da área total, respectivamente.

112
LIÇÃO N° 14

Função de distribuição acumulada das probabilidades

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Definir a função distribuição acumulada;


2. Resolver problemas de probabilidade usando distribuição normal
padronizada;
3. Descrever aproximações de distribuição binomial para de poisson e normal;
4. Descrever aproximação de distribuição de poisson para normal;

113
4.14 Função de distribuição acumulada das probabilidades

A função de distribuição acumulada da variável aleatória normalmente distribuída é


dada pela expressão:

Quando é expresso em unidades reduzidas, a função de distribuição acumulada será:

A função é usada para o cálculo de probabilidade através de tabelas que


oferecem as áreas (probabilidades) sob a curva normal padrão. A tabela que será
usada neste manual é a tabela de faixa central. A tabela de faixa central dá a área sob
a curva normal padrão entre e qualquer valor positivo de . A simetria em torno
de permite obter a área entre quaisquer valores positivos ou negativos. Assim,
consideram-se os casos:

Caso 1: A probabilidade de que uma variável aleatória normal , assuma um valor no


intervalo é dada pela fórmula de Newton – Leibniz:
.
Onde são valores em escores reduzidas.
Os valores da função de Laplace são tabelados:
Para , usa-se a aproximação Os valores de consultam-se na
tabela.

Exemplo 4.9: Calcular a probabilidade de que um valor esteja no intervalo

Resolução:

114
Caso 2: A probabilidade de que uma variável aleatória normal , assuma um valor no
intervalo sendo e valores não padronizados é dada pela fórmula.
P( )
onde:

Exemplo 4.10: O salário semanal dos operários industriais é distribuído normalmente


em torno de uma média de 180 cts com desvio padrão de 25 cts.
a) Encontre a probabilidade de um operário ter um salário semanal situado entre
150 cts e 178 cts.
b) Dentro de que desvios de ambos os lados da média cairão 96% dos salários.

Resolução:
Dados:
a) Vamos primeiro calcular os escores reduzidos e

b) P( ) então

Para uma distribuição simétrica: onde Da


tabela de distribuição normal padrão .

Usando a transformação temos:

O intervalo simétrico procurado é de 128.75

Caso 3: se o , isto é, estiver a esquerda do zero


e se

Exemplo 4.11: As alturas dos alunos de determinada escola são normalmente


distribuídas com média 1.60 m e desvio padrão 0.30 m. Encontre a probabilidade de
um aluno medir menos de 1.48 m.

115
Resolução:
Dados:
Comecemos por encontrar o valor correspondente de :

-3 -2 -1 -0,4 0 1 2 3

Caso 4:

Exemplo 4.12: Calcule a probabilidade de que assuma valor maior que -1.38.

Resolução:
P( )

-3 -2 -1 0 1 2 3

116
4.14.1 Aproximação entre Distribuições

4.14.1.1 Aproximação da Distribuição Binomial para a Distribuição de Poisson

A distribuição Binomial com parâmetros e , pode se aproximar a distribuição de


Poisson com parâmetros , se n é muito grande e se for muito
pequeno .
A aproximação é tanto maior quanto maior for o numero das observações
independentes n ou quando n e a probabilidade p

Exemplo 4.13: Um contentor contém 500 caixas de latas de sardinha. A probabilidade


de tirar num dos contentores uma caixa com latas fora do prazo é de 0.002. Calcular
probabilidade de tirar exactamente do contentor 2 caixas com latas fora do prazo.
a) Usando a distribuição Binominal.
b) Usando a distribuição de Poisson.

Resolução:
Dados:
a) , então:

b)

4.14.1.2 Aproximação da Distribuição Binominal Para a Distribuição Normal

Quando a probabilidade de ocorrência de um sucesso é igual a de fracasso na


distribuição Binominal, a distribuição dessa probabilidade pode ser aproximada à
distribuição Normal.
Uma vantagem prática desta aproximação é a redução de cálculos muito cansativos a
realizar no modelo Binominal.

Se e então pode se admitir aproximadamente que X N(np;npq).


Onde: e com .

Exemplo 4.14: Calcule a probabilidade de obter entre 4 e 7 caras em 12 lançamentos


de uma moeda: (a) Usando a Distribuição Binominal. (b) usando a Aproximação
Normal.

117
Resolução:
a) Consideremos sucesso o número de caras k obtidas no lançamento, então:
onde n : ;
.

Para o nosso caso:

b) Usando a aproximação normal temos:

; para
A média e a variância são: Logo:
. Então: .

Como estamos a aproximar a distribuição de uma variável discreta par à uma variável
contínua, é necessário corrigir os limites do intervalo de classe das probabilidades,
transformando-os para contínuos.

4.14.1.3 Aproximação da Distribuição de Poisson à Distribuição Normal

Para variáveis discretas com distribuição de Poisson, grande e a distribuição de


será aproximadamente normal com parâmetros: e ou .
Geralmente para obter uma melhor aproximação é necessário que seja maior que 20.

Exemplo 4.15: A desintegração radioactiva se realiza em quantidades que seguem a


distribuição de Poisson com média de 25 segundos por quantidade. Calcule a
probabilidade de que a quantidade desintegrada esteja no intervalo entre 23 e 27.
a) Usando a distribuição de Poisson.
b) Usando a aproximação normal.

Resolução:
, precisa-se que:
a) P( )

118
b) Usando aproximação normal: ,
. Os valores correspondentes de e
são e .
Substituindo os escores reduzidos na anterior temos:

O quadro seguinte apresenta restrições em relação aos parâmetros usados nas


distribuições que devem ser observadas, se usarmos as aproximações.

Tabela 4.4:
Distribuição Condições dos Aproximação
Parâmetros

ou
ou

119
Leituras Complementares

A partir da leitura destes livros, que chamamos por leitura complementar, o nosso
maior objectivo é que você possa conhecer outros enfoques dados aos temas
estudados, ao longo desta unidade, que contribuirão para enriquecer e dar subsídios
para a sua formação nesta area.
Atenção, evite ler os textos apenas para responder aos exercícios. A leitura enriquece
e facilita o seu entendimento global do conteúdo desenvolvido.

Texto 1
Reis, Elizabeth; Melo, Paulo; Andrade, Rosa e Calapez, Teresa. Estatística Aplicada.
Lisboa, 2001.
O capitulo IV: De pagina 161 a pagina 243;

Texto 2
Webster, Allen L. Estatística Aplicada à Administração e Economia. São Paulo:
McGraw-Hill, 2006.

Também podes ler este livro, capítulo V, de p.103 à p.129.

Nota: A leitura do livro do Allen Webster neste caso é obrigatória para puderes
aprofundar os teus conhecimentos sobre Distribuição Normal.

120
UNIDADE TEMÁTICA V

TEORIA ELEMENTAR DE AMOSTRAGEM

Objectivos da Unidade
Ao fim desta unidade, o aluno deve ser capaz de:
1. Precisar o conceito de amostra aleatoria;
2. Caracterizar as várias formas de amostragem;
3. Determinar o tamanho da amstra;
4. Caracterizar distribuições amostrais;

121
LIÇÃO N° 15

Introdução a Teoria Elementar de Amostragem

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Explicar o conceito de amostra aleatória;


2. Distinguir amostragem com reposição da sem reposição;

122
5.15 Introdução

De um modo geral, quando é impossivel obter informação de todos os elementos que


formam parte de uma população que se deseja estudar, porque o número dos
elementos a estudar é demasiado grande ou porque os custos são muito elevados, etc.
Estas e outras razões obrigam-nos muitas vezes a trabalhar com uma parte dos
elementos que compõem a população (amostra). Primeiro, vamos recordar os
conceitos de população, amostra e unidade estatística.

a) Universo ou População - é o conjunto de todos elementos que apresentam uma


determinada caracteristica em comum, a qual constitui o objecto de estudo.

b) Unidade Estatística - é cada elemento da população por estudar. É praticamente o


objecto onde são procurados todos os detalhes da variável ou fenómeno por estudar.

c) Amostra - é todo o conjunto não vazio e com menor número de elementos em


relação a população. Em relação ao tamanho da amostra são possíveis duas
situações: se , diz-se que a amostra é pequena, caso contrário, quando
diz-se que a amostra é grande.

Recordemos tambem o cenceito de amostra aleatória: dada uma população


caracterizada por uma variável aleatória , amostra aleatória é um conjunto
de variáveis aleatórias independentes e igualmente distribuidas, com a mesma
distribuição que a da variável aleatória .

Se todos os elementos de uma população fossem idênticos, não havia necessidade de


seleccionar uma amostra, bastaria estudar somente um deles para conhecer as
características de toda população.

d) Amostragem - é o processo de extrair amostras ou seleccionar da população os


elementos que devem pertencer a amostra.

Existem principalmente três tipos de problemas que interessam ao pesquisador


resolver, mediante o estudo de uma ou mais amostras:

1. O primeiro problema, consiste em estimar os parâmetros da população a partir


do conhecimento das estatísticas de uma amostra.
- São consideradas estatísticas ou medidas amostrais, todas as características
descritivas como a média ( ), desvio padrão ( ), coeficiente de correlação ( ),
proporção ( ), etc, calculadas a partir de uma amostra.

123
- São considerados parâmetros populacionais os valores característicos de uma
população: a média ( ), desvio padrão ( ), coeficiente de correlação ( ),
proporção ( ), etc.

2. O sengundo problema, consiste em determinar se a amostra de uma estatística


conhecida provém de uma população da qual os parâmetros também são
conhecidos. Neste problema, a resulução consiste em comparar os parâmetros
populacionais com as respectivas estatísticas.

3. O terceiro, último problema, consiste em procurar saber a partir de duas


estatísticas se as amostras correspondentes provém de uma mesma população.

A teoria de amostragem hoje em dia é utilizada em quase todas áreas de investigação


desde o tratamento dos fenómenos demográficos, dados na agricultura, na indústria e
comércio, medicina, psicologia até na educação e pesquisas de opinião realizadas
pelos meios de comunicação social, etc.

Porquê usamos amostras?

1. Porque existem populações infinitas;


2. Quando a população tao grande, que para fins praticos, podemos considera-la
infinita;
3. Economicamente, a amostra e menos dispendiosa e facil de controlar por ter
poucas unidades;
4. Porque o tempo e escasso, a informacao pode variar se transcorrer muito tempo
entre o primeiro e o ultimo elemento a ser inquirido;
5. Porque, por vezes, os elementos da amostra podem ser destruidos durante o
processo de amostragem ou podem provocar danos materias durante as
experiencias.

5.15.1 Etapas necessarias para a realização de um inquerito por amostragem

1. Definicao com clareza dos objectivos do inquerito;


2. Definicao da populacao a ser estudada e da unidade estatistica;
3. Definir as bases teoricas e praticas da sondagem (variaveis, tamanho, etc.);
4. Elaborar o questionario com instrucoes de notacao (simulacao da validacao dos
dados);
5. Escolha do periodo de referencia para a recolha das informacoes;

124
6. Escolha do metodo de amostragem conveniente;
7. Selecção da amostra;
8. Processamento e controle
9. Realizacao das inferencias e divulgacao dos resultados.

A validade das conclusoes tiradas numa amostra sobre uma populacao, depende do
facto da amostra ter sido bem escolhida e ter um tamanho representativo da
populacao. Portanto, para que a informacao obtida numa amostra seja
verdaderiamente valida e necessario que a correspondente amostra bem como no
metodo usado para a escolha dos elementos que devem pertencer a amostra.

Ainda em relacao a representatividade de uma amostra, sao considerados dois


principios:

1. Quanto maior for a fraccao de amostragem , maior sera a probabilidade de


obter uma amostra representative.
2. Se a populacao tem mais de 10.000 unidades estatisticas e a fraccao de
amostragem e de pelo menos 0.1 (10%), a amostra tem uma probabilidade
aceitável de ser representativa.

5.15.2 Métodos de Extração

Há, contudo, dois métodos gerais para obter (ou extrair) as realizações da amostra:
sem reposição e com reposição.
Nas extrações com reposição, as uidades seleccionadas aleatoriamente são
devolvidas à base de sondagem e ficam disponíveis para a escolha seguinte. Enquanto
que nas extrações sem reposição, as unidades uma vez escolhidas, nunca mais
podem voltar a ser seleccionadas.

125
LIÇÃO N° 16

Métodos de Amostragem

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Caracterizar o conceito de amostra aleatória simples;


2. Distinguir os vários métodos de amostragem;

126
5.16 Metódos de Amostragem

Entre muitos metodos usados nas pesquisas, podem-se classificar dois tipos principais
de metodos de seleccao de elementos para a composicao da amostra: metodos
probabilisticos e metodos nao probabilisticos.

Os metodos probabilisticos ou aleatorios sao aquelas em que cada unidade estatistica


tem uma certa probabilidade conhecida de pertencer a amostra, e esta probabilidade e
diferente de zero. A amostragem aleatoria e a base da inferencia estatistica, pois este
metodo garante cientificamente a aplicacao das tecnicas estatisticas de inferencia.

5.16.1 Amostragem aleatoria simples

Este é o processo mais elementar e frequentemente utilizado. Aqui, a probabilidade de


cada elemento pertencer a amostra e a mesma para todos. Assim, se for o tamanho
da populacao, a probabilidade de cada elemento pertencer a amostra seleccionada
sem reposicao sera .

Para cumprir a aleatoriedade, e necessário:

1º - Possuir um lista completa dos elemento que formam a população, isto é, enumerar
os elementos de 1 ate .

2º - Em seguida realizar o sorteio, utilizando a tabela dos números aleatórios, que


consiste numa sequência de dígitos de 0 a 9 distribuídos aleatoriamente.

Exemplo 5.1: Dada uma população de 100 elementos , para seleccionarmos


uma amostra de 20 elementos , procedemos da seguinte maneira.

Resolução:

1. Enumerar os elementos assim .


2. Seleccionar 20 números aleatórios da tabela de números aleatórios escolhendo
um ponto de partida casualmente. Para o nosso exemplo, os 20 números
aleatórios foram extraídos da tabela A dos números aleatórios do livro do Allen
Webster (2006), só para três algarismos, onde começamos da posição 00000 e
percorremos a tabela por coluna.

070 089 097 055 039 050 082 007 048 015

127
008 053 021 020 017 075 083 041 028 051

Os elementos da lista cujos números coincidem com esta serie, serão seleccionados
para formar a mostra.

Como já podes observar, este processo, embora ofereça segurança, precisa de certo
domínio no uso das tabelas de números aleatórios. Um procedimento de uso corrente
baseia-se no sorteio de papelinhos que são baralhados num recipiente, o uso da roleta
de lotaria, roleta giratória com números fixos, etc.

Quer num, quer noutro caso, se o elemento seleccionado não for devolvido, a
amostragem é sem reposição.

5.16.2 Amostragem sistemática

Esta é uma variação da amostragem aleatória simples. Sua aplicação requer que a
população seja ordenada segundo um determinado critério, de tal modo que, cada
elemento seja identificado pela posição. O processo de extracção dos elementos
consiste em escolher, ao acaso, o primeiro elemento. Os restantes são obtidos
sistematicamente mediante uma progressão aritmética de razão k.

Procedimento

- Determinar : é o inteiro mais próximo.

- Sortear um numero entre 1 a . Os elementos da amostra são os correspondentes


aos números; .

Ou sorteia-se um dígito terminal, e em seguida, todos os números que terminam por


esse dígito serão incluídos na amostra ate completar o tamanho da amostra. Caso
contrário, escolhe-se uma outra terminação para completar amostra.

Exemplo 5.2: Num determinado prédio da cidade de Maputo existem 46 famílias. Certo
investigador escolheu aquele prédio para inquirir 15 famílias sobre a situação social
dessas famílias. Usando um processo de amostragem sistemática, determine os
números das flats que deverão ser inquiridas.

Resolução:

É a razão de progressão.
Os números a sortear são 1, 2, 3. Seja 2 o número escolhido:

128
5;

... ...

As flats que devem pertencer a amostra ou ser inquiridas tem os números seguintes:

5.16.3 Amostragem estratificada

É pratico e vantajoso, usar a amostragem aleatória simples sempre que a amostra a


seleccionar não for grande. Se a população for muito grande, por exemplo, mais de
10.000 unidades, 10% desta população é uma amostra de 1000 unidades, portanto
ainda é muito grande.

O problema é: como diminuir o tamanho da amostra sem alterar a sua


representatividade? A solução para este problema, consiste em dividir a população em
estratos, e depois seleccionar uma amostra aleatória em cada um dos estratos. A este
tipo de amostragem chama-se amostragem estratificada.

A amostragem estratificada caracteriza-se por dividir a população em grupos


homogéneos, denominados estratos, nos quais cada unidade estatística pertence a um
só estrato. Em seguida, usa-se o processo de amostragem aleatória em cada estrato.
As variáveis de estratificação mais comuns são encontradas nas modalidades como:
classe social, idade, sexo, profissão e qualquer outro atributo relevante da população.

Existem dois tipos de amostragem estratificada: amostragem estratificada proporcional


e amostragem estratificada de fracção óptima. A primeira situação consiste em
seleccionar no estrato, uma quantidade de unidade proporcional ao tamanho do estrato
na população. Na seguida, para além da proporção exigida na primeira situação, os
elementos extraídos devem guardar a proporcionalidade em relação a minimização da
variabilidade de cada estrato. Deve-se salientar que para o nosso caso,
consideraremos apenas amostragem estratificada proporcional.

Exemplo 5.3 Um estudo deve ser feito para se apurar o aproveitamento anual nas
escolas. Para isso, o Ministério da Educação tem uma população de 7000 alunos

129
distribuídos por 4 níveis de ensino: 3000 são do ensino primário, 2000 do ensino
secundário, 1500 do ensino médio e 500 são do ensino superior. A direcção dos
estudos estatísticos do Ministério estimou que amostra deve ter no mínimo 700 alunos
para se considerar representativa.

a) Determinar a taxa ou fracção de amostragem.

b) Determinar, usando amostragem estratificada proporcional, o número de alunos que


deverão ser extraídos em cada estrato de ensino.

Resolução

a)

b) Ensino Primário: alunos

Ensino Secundário: alunos

Ensino Médio: alunos

Ensino superior alunos

Cálculo do número de elementos a seleccionar em cada estrato de ensino.

Ensino primário:

Ensino secundário:

Ensino médio:

Ensino superior:

A soma de unidades na amostra

5.16.4 Amostragem por conglomerados ou clusters

A amostragem por conglomerados é uma variação da amostragem estratificada. Esta


amostragem é conveniente quando: a população não permite ou quando é
extremamente difícil identificar os seus elementos, ou quando a população está
geograficamente dispersa ou por outra razão qualquer. Podes identificar alguns
subgrupos da população, e estudar a característica desses grupos para depois inferí-la
na população.

130
Amostragem por conglomerados consiste em dividir a população em subgrupos, que se
excluem um a outro, exaustivos de acordo com as variáveis que caracterizam o
universo e com aproximadamente o mesmo número de elementos. Sorteia-se alguns
conglomerados, e em seguida, estuda-se todos os elementos dos conglomerados ou
clusters.

Este método é vantajoso quando é difícil construir uma base de sondagem, isto é, a
operação de preparação de listagem de todos os elementos da população seria muito
demorada e teria um custo elevado, quase que proibitivo. Como alternativa, basta
elaborar a lista dos conglomerados e seleccionar uma amostra destes, para obter a
característica de toda a população.

5.16.5 Amostragem multi-etapas

Amostragem multi-etapas é uma extensão de conceito de amostragem por


conglomerados. Esta amostragem é utilizada quando o tamanho dos conglomerados é
muito grande, que se torna dispendioso estudar todos os elementos que pertencem ao
conglomerado. Pois, os elementos nos conglomerados são homogéneos de tal forma
que se pode estudar alguns deles para se conhecer toda a característica do
conglomerado inteiro.

O procedimento da amostragem em duas ou mais etapas consiste em seleccionar, no


primeiro estágio, uma amostra casual simples de conglomerados e, no segundo
estágio, seleccionar uma amostra casual simples de unidades estatísticas em cada
conglomerado. O conjunto de todos os elementos obtidos nos conglomerados constitui
a amostra. Este processo pode multiplicar-se por mais de duas etapas.

5.16.6 Amostragem multi-fásica

Não deverão ser confundidos estes dois processos de amostragem: multi-etapas e


multi-fásica. No primeiro processo, as unidades amostrais variam de uma etapa para
outra, enquanto que, na amostragem multi-fásica define-se, sempre, a mesma unidade
amostral para todas as fases de extracção da amostra. Na primeira fase, recolhem-se
os dados sobre determinadas características dos inquiridos. Estas informações servem
de base para definir uma segunda amostra que responderá a um questionário com um
nível de profundidade mais elevado.

5.16.7 Amostragem Não-Probabilística ou Dirigida

Este método de amostragem é aquele em que a escolha dos elementos para pertencer
a amostra não depende de alguma probabilidade. Usando este tipo de método não é
possível generalizar os resultados das pesquisas para a população. Entretanto, pode
ajudar ao pesquisador a formular boas hipóteses em relação ao problema por

131
investigar, pois as amostras não probabilísticas ou empíricas não garantem a
representatividade da população.

5.16.7.1 Amostragem acidental

A amostra acidental é um subconjunto da população formada por elementos que


podem completar o número de elementos necessários para amostra, porém, sem
nenhuma segurança de que constituem uma amostra exaustiva de todos subconjuntos
possíveis do universo. Para outras literaturas, esta amostragem é chamada por
convencional ou acessibilidade. Geralmente, é utilizada nas pesquisas de opinião onde
os entrevistados são escolhidos acidentalmente. Por exemplo, os cidadãos
entrevistados numa avenida.

5.16.7.2 Amostragem intencional

Esta técnica consiste em usar um determinado critério, e escolher intencionalmente um


grupo de elementos que irão compor a amostra. Os elementos dos grupos da
população devem apresentar uma característica típica, daí se chamar, também, de
amostragem típica. O investigador selecciona os grupos da população, os quais
desejam saber suas características típicas. Por exemplo, numa pesquisa sobre efeitos
de um determinado produto cosmético, o pesquisador se dirige aos salões de beleza, e
entrevista as pessoas que ali se encontram.

5.16.7.3 Amostragem snowball

Este processo de amostragem é praticamente aconselhado quando se pretende


estimar características relevantemente raras nas populações totais. O método consiste
em escolher inicialmente os inquiridos, de modo aleatório, e escolher, numa segunda
fase, outros entrevistados através da informação obtida nos primeiros.

5.16.7.4 Amostragem sequencial

Outro tipo de amostragem dirigida que pode ser considerado, relativamente,


semelhante ao método muilti-fásico, é o da amostragem sequencial. Neste processo de
amostragem, a realização da fase seguinte, só é decidida depois de analisados os
resultados da fase anterior.

5.16.7.5 Amostragem por quotas

Este é um dos métodos de amostragem mais utilizado. Ele oferece um maior rigor do
que muitos métodos não-probabilísticos já considerados, por apresentar uma ideia

132
intuitiva da representatividade dos grupos da amostra. É usual nas campanhas
aleatórias, nos estudos de mercados, etc.

Uma pesquisa por este método abrange três fases:

1. Classificar a população em termos da propriedade ou modalidade que se parece


relevante para a característica por estudar.
2. Determinar as proporções das partições da população
segundo as características que a população apresenta.
3. Calcular as quotas ( ) a seleccionar no grupo para pertencer na amostra

Esta amostragem tem uma vantagem, pois não necessita uma base amostral mais
rigorosa, é fácil de aplicar, tem baixo custo e assegura uma representatividade dos
elementos de cada grupo populacional. Entretanto, tem certas desvantagens por
necessitar de uma informação exacta em cada passo, e a selecção da amostra em
cada grupo não é aleatória.

Exemplo 5.4: Seja uma população com unidades, dividida em três grupos
com =200; =300 e =500. Pretende-se extrair desta população uma amostra de
tamanho 350. Encontrar as quotas ou percentagens que devem ser tiradas em cada.

Resolução

De modo a facilitar a compreensão, vamos apresentar os resultados numa tabela.


Repare que, nesta tabela a proporção dos elementos no subconjunto populacional é
igual à proporção nos grupos cuja soma formará o número das unidades na amostra:
.

200 20% 20% 70


300 30% 30% 105
500 50% 50% 175
1000 100% 100% 350

133
LIÇÃO N° 17

Determinação do tamanho de uma amostra

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Distinguir várias situações para determinação do tamanho de uma amostra;


2. Conhecer os factores que determinam o tamanho de uma amostra;

134
5.17 Determinação do Tamanho de uma Amostra

Na preparação do esquema de uma sondagem a ser utilizado durante uma


investigação, há que considerar a necessidade de determinar o tamanho da amostra
por compor pelos elementos da população. Para que a amostra apresente fidelidade
em relação às características do universo, i. e, tenha representatividade, não basta ter
uma parte dele. É necessário que a amostra tenha um número suficiente dos casos
escolhidos aleatoriamente. Portanto, o tamanho da amostra deve ser calculada
mediante determinadas proporções estabelecidas estatisticamente, não só para
recolher a informação necessária como também para garantir a possibilidade de fazer
inferência dos resultados e minimizar o tempo de recolha de dados, custo, etc.

5.17.1 Factores que determinam o tamanho de uma amostra

Os factores que determinam a extensão de uma amostra são: o tamanho do universo,


que pode ser finito ou infinito; o nível de confiança estabelecido; e o erro de estimação
pelos órgãos de controlo de qualidade da informação e proporção da característica
pesquisada no universo.
1. Tamanho do universo
O tamanho de uma amostra depende do tamanho da população, que pode ser finito ou
infinito. Consideram-se universos finitos, aqueles que não ultrapassam as 100.000
unidades estatísticas ( 100.000), e universos infinitos, os que ultrapassam 100.000
unidades ( 100.000). Esta distinção é importante para a determinação do tamanho,
pois usam-se fórmulas diferentes, porque no segundo caso sempre se recebe uma
amostra grande.

2. Nível de confiança estabelecido


De acordo com as estatísticas realizadas e da teoria de probabilidades, a distribuição
de qualquer informação, obtida por uma amostra extraída a partir de uma população
normalmente distribuída, ajusta-se à lei normal, apresentando valores centrais mais
elevados e valores extremos mais reduzidos.

135
Assim, o nível de confiança e a área da curva normal que se pretende abranger, por
exemplo, se desejarmos fazer inferências com 90% de segurança, é 90% da área total
da curva normal.

Existem vários procedimentos que são utilizados para o cálculo do tamanho de uma
amostra, nesta lição destacamos algumas situações ao nosso nível de abordagem da
teoria elementar de amostragem.

Caso 1. Se a variável escolhida na população for intervalar e a população considerada


for infinita, o tamanho da amostra pode ser determinado pela fórmula:

z
n [ /2
]2
E

O tamanho da amostra deve ser um número inteiro; quando o resultado não é inteiro,
como regra, deve-se arredondar para o próximo número. Com esta fórmula, pode-se
determinar o tamanho da amostra necessária para dar resultados precisos, com um
grau de confiança e uma margem de erro pré-determinados. A fórmula deve ser usada
quando conhecemos o valor da e queremos determinar o tamanho da amostra
necessário para estabelecer, um nível de confiança de , e o valor de a menor
que . A existência desta fórmula implica que o tamanho da amostra não depende do
tamanho da população.

Exemplo 5.5: Um consultor deseja calcular o salário médio para o primeiro ano de
trabalho de um bacharel recém-formado do Curso de Administração. Quantos valores
do salário devem ser obtidos, se o consultor deseja ter 95% de confiança em que a
média amostral esteja a menos de 3000,00 MT da verdadeira média populacional?
Suponha que sabemos através de um estudo anterior que, para estes salários,
Mt.

Queremos determinar , dado que , , . Aplicando a


fórmula:

Portanto, devemos obter uma amostra de, pelo menos, 180 salários do primeiro ano,
seleccionados aleatoriamente. Com tal amostra, teremos 95% de confiança em que a
média amostral X difere em menos de 3000,00 MT da média populacional .

136
Caso 2. Se a variavel escolhida for intervalar e a população finita, o tamanho da
amostra será calculado por:

Exemplo 5.6: Suponhamos que, no exemplo anterior, a população seja finita de 300
salários. Calcule o tamanho da amostra.

Caso 3. No caso de proporção populacional, considarando que a população seja


infinita, o cálculo do tamanho da amostra é feito de forma similar a que foi feita para a
média.

A partir da equação do erro, dada acima, estima-se em função de :

(z /2 )2 pˆ (1 pˆ )
n
E2

A proporção utilizada pode ser escolhida:

a partir de um estudo piloto, calcula-se a proporção amostral ;


usa-se p̂ =0.5, pois este é o valor que maximiza a variância de p ;
usa-se o julgamento de um especialista da área, que decide qual é o valor mais
provável de p ;
usa-se a proporção da amostra a partir de uma unidade similar.

Quando não for inteiro, arredonda-se. Lembre-se

Exemplo 5.7: A Entreposto deseja saber a proporção de clientes que fazem a revisão
mecânica nos mecânicos por si autorizados. O conselho directivo da empresa decide
que o estudo deve ter uma margem de erro de 3% (a percentagem de clientes que
consultam os mecânicos quando seus veículos apresentam problemas mecânicos ou
por causa de um outro serviço). Supondo que se pretende um nível de confiança de
95% nos resultados, quantos motoristas devem fazer parte da amostra?

a) Supondo que temos uma estimativa p̂ com base num estudo anterior, que mostrou
que 18% dos motoristas consultavam os mecânicos.

137
b) Supondo que não temos qualquer informação que possa sugerir um valor de p .

Solução:

a) p̂ ao nível de 95% de confiança, α = 0,05 e zα/2 =1,96.

A margem de erro é de três pontos percentuais (3%), logo E = 0.03 :

1,962 (0,18)(0,82)
n 630, 0224 631
0.032

Devemos entrevistar pelo menos 631 motoristas seleccionados aleatoriamente.

b) Similar a parte (a), utilizamos zα/2 = 1,96 e E = 0.03 , mas sem qualquer
conhecimento prévio de p, temos de utilizar o valor que maximiza a variância.

1,962 (0,5)2
n 1067,1111 1068
0.032

Para termos 95% de confiança de que a nossa amostra está a menos de três pontos
percentuais da verdadeira percentagem de todos os clientes, devemos fazer uma
selecção aleatória e entrevistar 1068 motoristas. Comparando este resultado com a
amostra de 631 obtido na alínea (a), podemos ver que, na ausência de um estudo
prévio, é necessária uma amostra maior para obtermos os mesmos resultados que
obteríamos se pudéssemos estimar o valor de p.

Caso 4. Se a variável escolhida for nominal ou ordinal e a população finita, o tamanho


da amostra será calculado por:

Exemplo 5.8: Suponhamos que, no exemplo anterior, a população de clientes que


fazem revisão com os mecânicos da Entreposto não passa de 10.000. Calcule o
tamanho da amostra.

Exemplo 5.9: Um investigador realiza um estudo sobre o comportamento político dos


eleitores de uma determinada província. De acordo com as informações em seu poder,
o comportamento varia muito de uma categoria profissional para outra. Portanto, ele

138
esta interessado em conhecer o comportamento desses grupos. Sabendo que a
província tem 10.000 eleitores, ao nível de confiança correspondente a 95,44% e um
erro de estimação de 4%, determinar o tamanho da amostra e os tamanhos das
amostras nos estratos. De acordo com a informação disponível, os eleitores distribuem-
se por categorias seguintes: Técnicos profissionais - 1000, Empregados
Administrativos - 2000, operários - 3000 e trabalhadores não qualificados - 4000.

Resolução:

a) Para calcularmos o tamanho da amostra, vamos considerar os seguintes dados:


; ; e como não foi referida a população da característica
pesquisada vamos usar ; .

O tamanho deve ser de 588 eleitores.

b) Agora vamos determinar os tamanhos dos estratos.

É a taxa da amostragem

1. Técnicos profissionais:
2. Empregados administrativos:
3. Operários:
4. Trabalhadores não qualificados:

139
LIÇÃO N° 18

Distribuições Amostrais

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Explicar em que consiste e como se obtém a distribuição amostral de estatística;


2. Distinguir varias situações de distribuições amostrais;
3. Caracterizar as distribuições amostrais das médias, proporções, variâncias;
4. Caracterizar a distribuição amostral das médias quando a variância populacuinal
é desconhecida;

140
Uma das importâncias da inferência estatística é tirar conclusões de uma população a
partir dos resultados observados na amostra. Logo, cabe ao observador da amostra
usar relações mais adequadas entre os parâmetros populacionais e as estatísticas
amostrais. Estimador é qualquer variável aleatória dos elementos amostrais. O valor
numérico de um estimador é denominado estimativa.
Consideremos todas as amostras de tamanho que podem ser extraídas de
determinada população. Se para cada uma destas amostras for calculado o valor do
estimador, tem-se uma distribuição amostral desse estimador. Como o estimador é
uma variável aleatória, então, pode se encontrar sua média, variância, desvio padrão,
etc.

5.18.1 Distribuição amostral das médias

Se for extraída uma amostra de tamanho , a média da amostra sera . Se forem


extraídas amostras de tamanho , e para cada amostra for calculda a estimativa da
média amostral, forma-se uma população das médias amostrais e a distribuição
correspondente chama-se distribuição amostral das médias.

Teorema 1. A média da distribuição amostral das médias, denotada por é igual a


média populacional , isto é:

Teorema 2. Se a população é infinita ou se a amostragem é com repetição, então, a


variância da distribuição amostral das médias é dada por:
ou , onde é a variância da população.

Teorema 3. Se a população for finita, ou se a amostragem é sem reposição, então, a


variância da distribuição amostral das médias é dada por:

141
ou

Exemplo 5.10: Considere uma população constituída pela série das unidades
estatísticas:
a) Determine as estimativas dos parâmetros pontuais: a média, a variância e o
desvio padrão.
b) Considere todas as amostras possíveis de tamanho 2, que podem ser extraídas
da população com reposição e apresente a distribuição amostral das médias
amostrais.
c) Calcule a média e o desvio padrão da distribuição amostral das médias.
d) A partir das relações entre as estatísticas e os parâmentros populacionais,
calcule a média e desvio padrão da distribuição amostral.
e) Usando uma amostragem aleatória sem reposição, apresente a distribuição
amostral das médias.
f)

Resolução:
a) Dado que a série das unidades estatísticas é , então, .
E as estimativas pontuais tem os seguintes valores:
; ;
b) Como para amostra com reposição, cada elemento comina com ele e
com qualquer outro. Então temos amostras. As 25 amostras e as
respectivas médias amostrais estão apresentadas abaixo.

2;2 3;2 5;2 7;2 8;2 2.0 2.5 3.5 4.5 5.0
2;3 3;3 5;3 7;3 8;3
2.5 3.0 4.0 5.0 5.5
2;5 3;5 5;5 7;5 8;5
3.5 4.0 5.0 6.0 6.5
2;7 3;7 5;7 7;7 8;7
4.5 5.0 6.0 7.0 6.5
2;8 3;8 5;8 7;8 8;8
5.0 5.5 6.5 7.0 8.0

c)

142
d)

f) Para amostragem sem reposição as amostras se difirem por, pelo menos, um


elemento, então C(5,2)= 10 amostras

2;3 2.5

2;5 3;5 3.5 4.0

2;7 3;7 5;7 4.5 5.0 6.0

2,8 3;8 5;8 7;8 5.5 5.5 6.5 7.5

5.18.2 Distribuição amostral das proporções

Se é a proporção de ocorrência com sucesso de evento e seu insucesso, e


uma amostra de tamanho é extraída de , a amostra fornecera uma de
eventos ocorridos com sucesso. Para k amostras de tamanho n, receber-se-á uma
distribuição amostral das proporções desvio padrão que são dadas pelas
fórmulas:

a) Amostra com reposição:

b) b) Amostra sem reposição:

Exemplo 5.11. Num prévia campanha eleitoral, mostrou-se que um certo candidato
tinha 46% dos votos perante esta situação qual é a probabilidade de que numa secção
eleitoral constituída por 200 pessoas, seleccionadas ao acaso entre a população
votante, ele tenha a maioria dos votos.

Resolução:

143
A maioria dos votos terá a partir dos 101 eleitores entre os 200. Considerado uma
variável continua, vamos usar 100.5, isto é, a proporção de sucessos
.

Transformando para escores reduzidas, temos.

5.18.3 Distribuição amostral das variâncias

Seja a varinçia popuciopnal e (variância amostral), o estimar da variância


populacional, Se se desejar saber qual é a distribuição da variância amostral, pode-se
usar a relação:

onde tem distribuição do qui-quadrado com graus de liberdade ou seja:

Graficamente a relação entre a variância amostral e a variância populacional é dada


pela distribuição qui-quadrado.

5.18.3.1 Distribuição amostral das médias quando a variância populacional é


desconhecida

Como se pode deduzir, para uma população normal, a amostra extraída dela deverá
ser normal, consequentemente a sua distribuição amostral também o será, i.é:

Se então

Ou seja, a distribuição normal padronizada é dada por:

144
Como não se conhece o valor da variância , portanto o valor do desvio padrão
populacional , é substituído pela variável aleatória (desvio padrão amostral), e
procuramos a distribuição da estatística , e pode-se mostrar que tem uma
distribuição de Student com graus de liberdade, assim:

145
Leituras Complementares

A partir da leitura destes livros, que chamamos por leitura complementar, o nosso
maior objectivo é que você possa conhecer outros enfoques dados aos temas
estudados, ao longo desta unidade, que contribuirão para enriquecer e dar subsídios
para a sua formação nesta area.
Atenção, evite ler os textos apenas para responder aos exercícios. A leitura enriquece
e facilita o seu entendimento global do conteúdo desenvolvido.

Texto 1
Webster, Allen L. Estatística Aplicada à Administração e Economia. São Paulo:
McGraw-Hill, 2006.

Também podes ler este livro, capítulo VI, de p.p.139 à p.p.158.

146
UNIDADE TEMÁTICA VI

TEORIA ESTATÍSTICA DE ESTIMAÇÃO

Objectivos da Unidade

Constituem objectivo geral desta unidade: precisar o conceito de estimador; relacionar


os estimadores com as características populacionais; e apresentar propriedades gerais
de estimadores, incluindo a respectiva precisão.

Depois de concluíres o estudo desta unidade, deves ser capaz de:

1. Distinguir características populacionais dos estimadores;


2. Demonstrar o carácter aleatório de um estimador;
3. Definir um estimador centrado;
4. Explicar como se estima a precisão de um estimador;
5. Explicar o que é um estimador suficiente;
6. Explicar o conceito de intervalo de confiança;
7. Calcular intervalos de confiança para diferentes distribuições amostrais;

147
Introdução

Nas unidades temáticas anteriores foram tratados aspectos como organização e


análise de dados, teoria das probabilidades e suas distribuições bem como o processo
de extracção de amostras numa população de tamanho finito ou infinito.

Nesta unidade temática, vamos considerar o processo de obtenção de informações


sobre uma população a partir dos resultados observados na amostra. O problema aqui
considerado é um dos focos principais da inferência estatística.

Consideremos as seguintes situações:

Generalização sobre a temperatura da sopa no prato com base na primeira


colherada;
Estimação da esperança de vida de um par de sapatos com base na experiência
passada;

É exactamente isto que fazemos na inferência estatística, só que, o fazemos de


maneira mais científica. O que faz com que a aplicação da inferência estatística seja
científica é o facto de ela ter em conta a maneira de seleccionar a amostra e expressar
a generalização em termos específicos na base de probabilidades.

148
LIÇÃO N° 19

PARÂMETROS, ESTIMADORES E ESTIMATIVAS

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Distinguir características populacionais dos estimadores;


2. Demonstrar o carácter aleatório de um estimador;
3. Definir um estimador centrado;
4. Explicar como se estima a precisão de um estimador;
5. Explicar o que é um estimador suficiente;

149
Introdução

Nesta lição, vamos rever o conceito de parâmetro, abordar o conceito de estimador,


estabelecer algumas das suas propriedades bem como estudar vários tipos de
estimação. Um estimador é uma espécie de “máquina” para gerar estimativas ou
aproximações dos valores populacionais desconhecidos ou inacessíveis à observação.

Por exemplo: que podemos dizer da competência de uma pessoa para resolver
situações de certo tipo ao longo da sua vida, com base na observação dos resultados
dos testes realizados na escola?

É essencial ter uma ideia da qualidade destes estimadores. A qualidade de um


estimador é um conceito multifacetado: tem vários aspectos que interessam
caracterizá-los. Abordam-se aqui alguns destes aspectos, e em particular, a precisão
do estimador, medido pela respectiva variância.

Exemplo 6.1: Ao invés de se dizer que os pares de sapatos duram cinco anos, dá-se
um intervalo de anos e estabelece-se.

Parâmetros

Parâmetros são as quantidades de nosso interesse numa população e são


desconhecidas na maioria das aplicações. Podem ser representadas por letras gregas,
tais como , e entre outras. A média ( ) e desvio padrão ( ) são os parâmetros
do nosso interesse.

6.19.1 Estimador e estimativa

Geralmente são representados por símbolos gregos com um acento circunflexo.

Estimativas pontuais são valores singulares que são usados para estimar qualquer
parâmetro populacional desconhecido. Dada uma população de tamanho ,
normalmente distribuída, se dela for extraída uma amostra aleatória de tamanho , é de
esperar que a amostra esteja também normalmente distribuída. Se não forem
conhecidos os valores dos parâmetros populacionais, nomeadamente, a média , a
variância e a proporção de sucessos , teremos de recorrer à teoria de estimação.
Como o estimador, por exemplo, é uma função das variáveis aleatórias, a sua função
de distribuição de probabilidade será na base de inferências sobre os parâmetros da
população. Para entendermos melhor, vejamos:

150
Considere uma amostra de tamanho , retirada de uma população e representada
por um conjunto de variáveis aleatórias ( X 1 , X 2 ,..... X n ). Os parâmetros média, variância
e proporção de certa população são representados simbolicamente por: , e ,
respectivamente. Os estimadores usuais, nomeadamente, média, variância e
proporção amostral, são calculados respectivamente, por , ˆ e ˆ , pelas fórmulas
seguintes:
n
x1 x2 ......xn xi
x
n i 1 n

n
1
ˆ2 ( xi x) 2
n i 1

número de itens com característica na amostra



n

Cada um dos estimadores depende dos valores que estão na amostra aleatória. Este
tipo de estimação, ( X 1 , X 2 ,..... X n ), é chamado de estimação pontual.

Vários são os critérios utilizados por estatísticos e matemáticos para seleccionar


estimadores apropriados para calcular, com base em dados da amostra, os parâmetros
populacionais. Uma das características mais importantes de um estimador é que não
pode ser viciado (não tendencioso).

6.19.2 Propriedades dos estimadores

Um bom estimador de um parâmetro deve satisfazer as seguintes propriedades:

1. Centrado – um estimador é centrado ou não enviesado (não viciado) se o seu


valor é igual ao valor do parâmetro populacional. Por exemplo: .
Quando , o estimador diz-se viciado. O enviesamento é dado pela
diferença entre o valor do estimador e do parâmetro. E toma o nome de erro
amostral. Este enviesamento pode ser causado: pela escolha de mau estimador;
processo de amostragem não adequado; definição errada da população alvo;
etc.

2. Suficiente – quando se resume uma amostra através de uma unidade


estatística, há perda de informação. Com efeito, dispondo das observações,
pode calcular-se o valor de qualquer unidade estatística. O recíproco não é

151
verdadeiro: conhecendo o valor de uma estatística, não podemos em geral
reproduzir os dados em que o seu cálculo se baseou.
Por exemplo: Seja uma amostra aleatória. Se
é uma realização da amostra seja
. Então, .

Conhecendo a amostra , podemos calcular esta ou qualquer outra


estatística, sabendo que não nos permite voltar aos dados, isto é, há menos
informação em do que em .

3. Eficiência – de entre todos os estimadores centrados para um mesmo


parâmetro, é eficiente aquele que tiver menor variância, por exemplo:
a) Seja estimador tendencioso ou centrado, isto é: .
b) Se onde é qualquer outro estimador não tendencioso
de . Então é mais eficiente que .
4. Consistente – seja um estimador do parâmetro desconhecido . é um
estimador consistente de se quando , onde é tamanho da
amostra, isto é, deve ser consistente se e só se para cada o
.
Portanto, se seleccionar uma amostra de tamanho por A.A.S, demonstrar-se-á
que: e

Resumo

Parâmetro Estatística Centrado Consistente Eficiente


Média Sim Sim Sim
Média Mediana Sim Sim Não
Média Moda Sim Sim Não
Variância Não Sim Sim
De uma população com parâmetros e desconhecidos, se é extraída uma amostra
de tamanho , as estimativas eficientes correspondentes são as estatísticas amostrais:

Exemplo 6.2: Uma amostra de cinco (5) medidas de diâmetros de esferas foi registada
por um cientista com os valores: . Determinar as

152
estatísticas não tendenciosas e eficientes de: (a) média verdadeira e (b) variância
verdadeira.

Resolução:

a) Logo .

b) ;

2
Os estimadores x e p̂ têm boas propriedades e não são viciados. Entretanto, é
viciado, pelo que, não é adequado para estimação. Para eliminar esse vício, um
estimador é definido como:
n
1
S2 ( xi x )2
n 1i 1

S 2 é um estimador não viciado para estimar 2 . Esse estimador recebe o nome de


variância amostral e será sempre denotado por S 2 para se distinguir de outros
2
estimadores denotados genericamente por .

Exemplo 6.3: O número de faltas por ano de funcionários de determinada empresa foi
anotado para uma amostra de funcionários escolhidos por acaso. Deseja-se saber qual
é o número médio de faltas por funcionário em um ano. Os dados obtidos são: 2, 2, 3,
1, 4, 5, 3, 4, 5, 6, 5, 3, 4, 3, 4, 2, 4, 3, 5, 2, 1, 6, 2, 3 e 4. A estimativa da média
populacional é:

2 2 .......... 3 4
x 3, 44
25

Logo, o número médio de faltas por funcionário em cada ano é aproximadamente 4.

A estimativa da variância amostral é:

(2 3, 44)2 (2 3, 44) 2 ..... (4 3, 44) 2


S2 2, 006
24

153
LIÇÃO N° 20

ESTIMATIVAS DE PARÂMETROS

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Explicar o conceito de intervalo de confiança;


2. Calcular intervalos de confiança para diferentes distribuições amostrais;

154
Introdução

Antes de introduzirmos o conceito de intervalo de confiança, vamos perceber o que é


Teorema Central do Limite:

Suponha que uma amostra aleatória simples de tamanho é seleccionada de uma


2
população de média e variância (nota que o modelo da variável aleatória não é
especificado). Representando tal amostra por variáveis aleatórias independentes
( X 1 , X 2 ,..... X n ), e representando a sua média por x , temos que:

x n
Z  N (0,1)
/ n

Em outras palavras, o teorema garante que para um grande, a distribuição da média


amostral, devidamente padronizada, comporta-se como um modelo Normal com média
0 e variância 1. Pelo teorema, temos que quanto maior for o tamanho da amostra,
melhor é a aproximação. Estudos de simulações mostram que, em muitos casos, os
valores de n próximos de 30 fornecem aproximações boas para situações práticas.

Uma aplicação importante está associada a distribuição da proporção amostral ( pˆ ) .


Lembra-se que, definimos a proporção amostral como sendo a fracção de indivíduos,
com uma dada característica, numa amostra de tamanho . Construindo para o
enésimo indivíduo uma variável aleatória Yi tal que:

Podemos, então, escrever a proporção amostral como:


n
Y1 Yn ...... Yn Yi
pˆ Y
n i 1 n

A proporção amostral é a média de variáveis aleatórias convenientemente definidas.


Assumindo que a proporção de indivíduos com uma determinada característica na
população é p, e que os indivíduos são seleccionados aleatoriamente, temos que
Y1........., Yn formam uma sequência de variáveis aleatórias do modelo Bernoulli. Assim, a
média e a variância do modelo Bernoulli são dadas por p e p(1 p) / n ,
respectivamente. A partir do Teorema Central do Limite, temos que:

155
pˆ p n
N (0,1)
p (1 p ) / n

Agora, vamos estudar a estimação intervalar, para diversos casos. Logo em seguida,
na unidade temática 7, iremos abordar os vários cenários de testes de hipóteses para
média e proporção.

6.20.1 Estimação por Intervalo

Os estimadores vistos até ao momento são pontuais, pois fornecem uma estimativa
numérica para o parâmetro de interesse. O método que a seguir vamos estudar é
denominado de estimação intervalar, e inclui a estimativa pontual e informações a
respeito da sua variabilidade.

Examinaremos, a seguir, os casos seguintes:


2
conhecida;
2
desconhecida e amostra grande;
2
desconhecida e amostra pequena.
2
1º Caso: conhecida
2
Quando a variância populacional é conhecida e a amostra de tamanho
examinada, vimos, anteriormente, que a média amostral tem uma distribuição normal
com a mesma média e variância . Para um valor fixado, tal que: ,
podemos obter um valor , tal que:

P( Z z /2 ) P( z /2 z z /2 ) a

Recorde-se que na unidade temática 4, consideramos que a distribuição normal é


simétrica; portanto, a área deve ser igualmente distribuída em torno de 0. Veja, na
figura, a seguir:

156
É o coeficiente de confiança, e é o valor de que fornece uma área de
na extremidade superior a distribuição normal padrão; assim, temos o intervalo
seguinte:

X
z /2 z /2 X z /2 X z /2
n n n

Assim, o intervalo de confiança para como o coeficiente de confiança são


dados por:

IC ( ,1 ) [X z /2 ;X z /2 ]
n n

6.20.1.1 Interpretação do intervalo de confiança

Se tivermos várias amostras do mesmo tamanho, e calcularmos para cada uma, os


intervalos de confiança e o coeficiente de confiança ) correspondentes,
esperamos que a proporção de intervalos que contenham o valor de μ seja igual a
.

Outro conceito importante é o de erro de estimação, o qual é fundamentado a partir do


intervalo de confiança, e é dado por:

E z /2
n

A fórmula de erro ou margem de erro, revela que há, efectivamente, três determinantes
do tamanho ou quantidade de erro: a confiança desejada, representada pelo valor de
; a dispersão da população ; o tamanho da amostra .

Os factores no numerador têm um efeito directo no erro, ou seja, quanto maior for o
coeficiente de confiança ou a dispersão da população, maior é o erro. O tamanho da
amostra apresenta o efeito inverso na margem de erro, portanto, quanto maior for a
amostra menor é o erro.

Calcula-se o valor de zα/2 usando a Tabela Normal Padronizada, que se encontra no fim
do manual.

157
Observe que se p (0 ≤ z ≤ 1,64) = 0,45 logo p (z>1,64) = 0.05 , pois p (- ≤ z ≤ ) = 1
e por simetria da distribuição p (z ≤0) = p (z ≥0)=0.5. A partir do valor de z0.05 = 1,64
constrói-se um intervalo de 90% de confiança (α= 0,1).

Veja, a seguir, alguns exemplos:

Exemplo 6.4:

Um consultor obtém uma amostra aleatória de tamanho 6 de um conjunto de


contas a pagar. Sabe-se que, o desvio padrão das contas a pagar é 57,00 Mt. A partir
da amostra, observou-se que a média amostral foi Mt. Construa um
intervalo de 95% para o valor médio de crédito que o consultor virá a pagar por cada
conta.

Pela Tabela de Distribuição Normal Padronizada, vê-se que z0.025 = 1,96, pois p (0
≤z≤1,96) = 0.475 , logo p (z ≥1,96) = 0.025. Assim, o intervalo de confiança para o valor
médio do valor que o consultor pagará com 95% de confiança é [ 222,07;277,93].

158
2
2º Caso: desconhecida e amostra grande

Na maioria das aplicações, a variância populacional (σ2) é desconhecida. Quando isso


acontece, o estimador não viciado S 2 , pode ser usado para estimar σ2. Nos casos em
que a amostra é grande, n ≥ 30, o teorema central do limite fornece uma boa
aproximação para a distribuição da média amostral. Assim, o intervalo de confiança de
(1-α) %, é representado da forma:

IC ( ,1 ) [X z /2 ;X z /2 ]
n n

Tal que, S S 2 . Portanto, a construção do intervalo de confiança é semelhante a que


foi feita no 1º caso: a única diferença é que no lugar de σ, usa-se o desvio padrão
amostral S .

Exemplo 6.5: Para ilustrar essa situação, consideremos o exemplo seguinte: um


estudo de amostragem feito pela EMOSE. Suponha que, como parte de uma revisão
anual das apólices de seguro de vida, a EMOSE selecciona uma amostra aleatória
simples de 36 apólices de seguro de vida. As correspondentes apólices de seguro de
vida são revistas em termos de garantia de cobertura. Para o estudo, um gerente
solicitou uma estimativa do intervalo de confiança de 90% da idade média para a
população dos proprietários da apólice de seguro de vida. A idade média da amostra é
x = 39 anos. O desvio padrão da amostra é S =7,77 . O valor de z0.025 é 1,645.
Portanto, o intervalo de 90% é dado por:

A margem de erro é 2,13 e a estimativa do intervalo de 90% da idade média da


população de proprietários de apólices de seguros é de 37,37 a 41,63.
2
3º Caso: desconhecida e amostra pequena

Se tivermos uma amostra pequena , e se quisermos construir um intervalo de


2
confiança, mas sem conhecer σ , podemos utilizar a distribuição t-Student, ou
simplesmente, distribuição t. Esta é utilizada para determinar valores críticos
representados por tα/2 . Na tabela da distribuição t pode observar que, nas linhas
aparece o número de graus de liberdade, que é dado por . Os graus de liberdade,
ou gl, correspondem ao número de valores que podem variar após sofrerem certas
restrições.

Algumas propriedades interessantes da distribuição t-Student

159
É diferente conforme o tamanho da amostra, ou seja, ela varia de acordo com os
graus de liberdade;
Apresenta a mesma forma geral simétrica (forma de sino) que a distribuição
normal, mas com maior variabilidade, o que é esperado em amostras pequenas,
logo, P(t ≥ 0) = 0.5 e P(t≤ 0) = 0.5;
O desvio padrão da distribuição t varia com o tamanho da amostra, mas é
superior a 1;
À medida que aumenta o tamanho da amostra, a distribuição t aproxima-se mais
e mais da distribuição normal padronizada.

Observe que na figura a seguir, a medida que se aumenta o número de graus de


liberdade, representado por “v ”, a distribuição t assemelha-se mais com a distribuição
normal padrão, também representada por N (0,1).

Podemos, agora, determinar os valores da margem de erro e construir intervalos de


confiança:

tal que , é o valor de t que fornece a área de α/2 na extremidade


superior da distribuição t com n-1 graus de liberdade.

E o intervalo de (1-α) % de confiança é dado por:

S S
X E X E X t /2, n 1 X t /2, n 1
n n

Ou o intervalo de confiança para μ, com coeficiente de confiança 1-α, pode ser


expresso por:

160
S S
IC ( ,1 ) [X t /2, n 1 ;X z /2, n 1 ]
n n

Exemplo 6.6: Voltando ao exemplo do número de faltas de funcionários, os valores


estimados de X e S2 foram respectivamente 3,44 e 2,006, sendo
S S2 2,006 1, 4163 . Um intervalo de 95% de confiança para o número médio de
faltas por funcionário será:

Primeiro, vamos calcular t0,0025,24 , uma vez que a amostra tem tamanho n = 25 . Pela
tabela da distribuição t, o valor crítico que deixa área de 2,5% acima da curva, com 24
graus de liberdade é t0,0025,24 = 2,064. Veja que a tabela anterior é uma parte da tabela
t. Assim o intervalo de 95% de confiança para a média é:

1, 4163
IC ( ,95%) [3, 44 2, 064 ] [3, 44 0.585] [2,855; 4, 025]
25

E a margem de erro é dada por 0,585.

161
Leituras Complementares

A partir da leitura destes livros, que chamamos por leitura complementar, o nosso
maior objectivo é que você possa conhecer outros enfoques dados aos temas
estudados, ao longo desta unidade, que contribuirão para enriquecer e dar subsídios
para a sua formação nesta area.
Atenção, evite ler os textos apenas para responder aos exercícios. A leitura enriquece
e facilita o seu entendimento global do conteúdo desenvolvido.

Texto 1
Webster, Allen L. Estatística Aplicada à Administracao e Economia. São Paulo:
McGraw-Hill, 2006.

Ler este livro capítulo VII de pagina 165 a pagina 185.

162
UNIDADE TEMÁTICA VII

TESTE DE HIPÓTESES

Objectivos da Unidade

Depois de concluíres o estudo desta unidade, deves ser capaz de:

1. Explicar em que consiste um teste de hipóteses;


2. Explicar em que consistem os erros da primeira (tipo I) e segunda espécie (tipo
II);
3. Explicar em que consiste a regra de decisão de um teste;
4. Testar hipóteses simples;
5. Descrever e calcular o teste de hipóteses para média, proporção e variância;

163
Introdução

A Estatística Descritiva (análise de dados), face aos gráficos e números que resumem
os dados, permite emitir hipóteses acerca do comportamento das populações de onde
provêm esses dados.
A finalidade desta unidade temática é desenvolver regras (designadas testes de
hipóteses) que permitem, uma vez formulada determinada hipótese, decidir, correndo
um certo risco de errar, se essa hipótese é aceitável, face à informação contida nos
dados.

164
LIÇÃO N° 21

Introdução a Teste de Hipóteses

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Explicar o conceito de teste de hipóteses;


2. Distinguir tipos de teste de hipóteses;
3. Descrever as várias estatísticas de teste;
4. Descrever as etapas de um teste de hipóteses;

165
7.21.1 Conceito de teste de hipóteses

Muitas vezes somos convidados a tomar decisões, mesmo em situações onde não é
possível obter informações sobre toda população. Estes casos acontecem ou porque
não se conhece o universo da população, ou porque os custos para o estudo seriam
muito elevados ou mesmo porque o processo de recolha de informação levaria muito
tempo. Motivos como estes levam-nos a estudar parte dessa população e depois
decidir sobre as características da população.

Nesta unidade, apresentamos algumas técnicas de inferência estatística, que nos


ajudarão na tomada de decisões estatísticas, mostrando como introduzir juízos na
análise de uma amostra bem como na generalização das características da mesma.
Através de intervalos de confiança, procura-se um intervalo onde se situa o parâmetro
populacional mesmo não conhecendo a sua estimativa, enquanto que a técnica de
inferência usando testes de hipóteses, começa com a formulação de uma suposição
(hipótese), sobre a estimativa do estimador populacional, e a partir dos dados
amostrais procura-se saber se a hipótese é verdadeira ou falsa.

Hipótese Estatística – é uma afirmação ou suposição sobre o valor de um parâmetro


populacional, ou sobre a natureza da distribuição de probabilidade de uma variável
populacional e que precisa ser testada para se tomar uma decisão estatística.

Exemplo 7.1 São exemplos de hipóteses estatísticas as afirmações:

a) A altura média da população moçambicana é 1,65 cm;


b) A variância populacional dos salários da Indústria Televisiva é 5000,00 Mt;
c) A proporção de alunas na Escola Secundária Josina Machel é 65%.

Observação: Os testes de hipóteses de uma maneira geral dividem-se em duas


partes, a saber:

a) Paramétricos (média, desvio padrão, variância, etc)


b) Não paramétricos (variáveis com nível de medição nominal, ordinal ou por
intervalo de classe)

7.21.2 Hipóteses Estatísticas

De uma maneira geral, para a realização de um teste estatístico, começa-se por emitir
a hipótese nula ( ), é a hipótese estatística a ser testada, e a hipótese que traduz uma
afirmação diferente da anterior, é chamada hipótese alternativa ( ) a hipótese nula
( ).

166
Existem testes de hipóteses para média, variância e para proporção de uma população.
Uma suposição que precisa ser feita é que os dados da população provêm de uma
distribuição normal onde a média ou proporção são desconhecidos e a variância pode
ser conhecida ou não. Vamos, agora, definir as componentes de um teste de hipóteses:

Hipótese Nula (denotada por ): é uma afirmação sobre o valor de um parâmetro


populacional (como a média, variância ou proporção). Ela deve conter a condição de

igualdade e escrever como ou . (Ao fazermos, efectivamente, o teste,


trabalhamos com a hipótese de que o parâmetro é igual a um valor especificado). Para
a média, temos as três formas possíveis para a hipótese nula:

algum valor;

algum valor;

algum valor.

Hipótese Alternativa (denotada por ): é uma afirmação que complementa (parte que
não está em ) a hipótese nula. Esta pode ser descrita em uma das três formas:

algum valor;

algum valor;

algum valor;

Para melhor compreendermos vejamos, inicialmente, três exemplos de aplicação.

Exemplo 7.1

Uma indústria farmacêutica deseja testar um novo medicamento no combate à dor de


cabeça. A ideia é verificar se o novo medicamento “Sem Dor”, é mais rápido para
actuação no organismo de uma pessoa do que os analgésicos comuns. Sabe-se que o
tempo de alívio de dor dos últimos é 15 minutos. Logo, a indústria deseja testar se o
medicamento “Sem Dor” age no organismo em menos de 15 minutos. Admite-se que o
tempo de alívio do medicamento no organismo segue uma distribuição normal.

A hipótese nula é 15 minutos;

A hipótese alternativa é 15 minutos;

167
Exemplo 7.2: O gerente de um hotel estabeleceu que a quantia média gasta por
hóspedes em um fim de semana é de 500,00 MT, ou menos. Um funcionário do sector
de contabilidade observou que as despesas totais dos hóspedes têm aumentado nos
últimos meses. O contabilista do hotel irá verificar se essa afirmação é verdadeira ou
não. Admite-se que o gasto dos hóspedes segue uma distribuição normal.

Hipótese nula é 500,00 MT;

Hipótese alternativa é 500,00 MT;

Exemplo 7.3: A TDM afirma que o consumo mensal de ligações a longa distância foi 3
horas e 35 minutos por residência no último ano. Deseja-se avaliar se o consumo por
residência deste ano é o mesmo. Admitimos que o consumo mensal de ligações a
longa distância segue uma distribuição normal.

Hipótese nula é 215 minutos (3 horas e 35 minutos);

Hipótese alternativa é 215 minutos;

Atenção…

Se está a fazer uma pesquisa e deseja usar um teste de hipótese para sustentar a sua
afirmação, esta deve ser formulada de maneira que se torne numa hipótese alternativa,
e não pode conter a condição de igualdade.

Ao testarmos as hipóteses, podemos tomar duas decisões: rejeitar ou aceitar .


Estas podem estar correctas ou incorrectas, mesmo quando se faz o teste correctamente.

Erro no teste de hipótese

Quando a decisão é incorrecta, dois tipos de erros podem acontecer:

Erro tipo I: quando rejeitamos a hipótese nula sendo ela verdadeira. E a


probabilidade deste tipo de erro é dado da seguinte forma:

P (Erro tipo I) = é conhecido por nível de significância.

168
No exemplo 7.1, seria errado dizer que o tempo de reacção do medicamento Sem Dor
é menor que 15 minutos, quando, na verdade, é igual ou superior a 15 minutos;

No exemplo 7.2, seria errado dizer que o consumo dos hóspedes é superior a 500,00
Mt, quando na verdade é igual ou inferior a 500,00 Mt.

No exemplo 7.3, seria errado dizer que o consumo mensal de ligações por residência é
diferente de 3 horas e 35 minutos, quando, na verdade, esse consumo é igual a 3
horas e 35 minutos.

A probabilidade de rejeitar , quando ela é verdadeira, é chamada de nível de


significância (denotada por α ) e geralmente é determinada antes de se realizar o teste.

Erro tipo II: quando não rejeitamos a hipótese nula , sendo ela falsa. E a
probabilidade deste tipo de erro é dado pela forma: P (Erro tipo II) =

No exemplo 7.1, seria errado dizer que o tempo de relacção do novo medicamento é
igual ou superior a 15 minutos, quando na verdade é inferior a 15 minutos;

No exemplo 7.2, seria errado dizer que o consumo dos hóspedes é igual ou inferior a
500,00 Mt, quando, na verdade, é superior a 500,00 Mt;

No exemplo 7.3, seria errado dizer que o consumo mensal de ligações por residência é
igual a 3 horas e 35 minutos, quando, na verdade, é diferente de 3 horas e 35 minutos.

A probabilidade de não rejeitar , quando ela é falsa, é representada pelo símbolo β.

Observação: No teste de hipóteses, devemos escolher a probabilidade do erro tipo I


( ), mas não seleccionamos a probabilidade do erro tipo II . O ideal seria se
, mas isso não é possível. Devemos controlar as probabilidades de erro α e
β. Pode-se mostrar, matematicamente, que, , e o tamanho da amostra estão
todos inter-relacionados, de forma que, escolhidos quaisquer dois deles, o terceiro está
automaticamente determinado. Na prática, o comum é determinar os valores de e ,
de modo que o valor de fique determinado.

Além das definições anteriores, existem outras componentes que precisam ser
definidas:

Estatística de Teste: é um valor baseado nos dados amostrais para tomar uma
decisão sobre a rejeição da hipótese nula. No caso de teste para média, ela é (a
decisão) formada pela média amostral e pelo desvio padrão. Veremos, mais adiante,
como se constrói a estatística de teste;

169
Região Crítica: é o conjunto de todos os valores da estatística de teste que levam à
rejeição da hipótese nula;

O Valor Crítico: é o valor, ou valores que separa(m) a região crítica dos valores da
estatística de teste que não levam à rejeição da hipótese nula. Os valores críticos
dependem da natureza da hipótese nula, da distribuição amostral, e do nível de
significância .

Estatísticas de Teste

A estatística de teste, é utilizada no teste de hipóteses, e é construída a partir do


Teorema Central do Limite. Para a média, é dada por:

X
z 0
, considerando que o valor de μ0 é o valor extremo dado pela hipótese nula.
n

Também, podemos definir a estatística de teste para a proporção:

pˆ p0
z , sendo que p0 é o valor extremo fornecido pela hipótese nula.
p0 (1 p0 )
n

E a estatística do teste para variância é: ;

Etapas de um teste estatístico

1) Definir as hipóteses ( );
2) Especificar o nível de significância;

170
3) Seleccionar a estatistica do teste;
4) Estabelecer o valor critico ou valores críticos;
5) Determinar o valor real (observado) da estatística do teste;
6) Tomar decisão, consequentemente a respectiva conclusão

LIÇÃO N° 22

Teste de Médias

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Saber determinar a estatística do teste para médias;


2. Saber escolher a estatística correspondente para cada caso;

171
7.22.1 Teste de Médias

Tipos de Testes: Bilateral ou Unilateral

As caudas de uma distribuição são as regiões extremas delimitadas pelos valores


críticos. A partir de , dá para saber qual é o tipo de teste. A cauda corresponde à
região crítica que contém os valores que rejeitam a . A figura, a seguir, ilustra como
se verificam os tipos de testes. No exemplo 7.1, o teste é unilateral (esquerdo). No
exemplo 7.2, o teste é unilateral (direito). No exemplo 7.3, o teste é (bilateral). As
expressões unilateral e bilateral, em alguns livros, são denominadas unicaudal e
bicaudal.

Observação: Quando o teste é unilateral, as hipóteses são definidas como:

contra para o teste unilateral direito ou

contra

Contudo, alguns autores usam as mesmas hipóteses definidas de forma diferente:

contra para o teste unilateral direito ou

contra para o teste unilateral esquerdo

A diferença está no sinal de igualdade para a hipótese nula no teste unilateral, mas
essa diferença de notação não altera a construção do teste.

Exemplo 7.4

172
Uma organização de defesa do consumidor afirma que os consumidores dos postos de
gasolina da Petromoc estão a ser prejudicados em virtude da seguinte condição:
quando o marcador indica 1 litro, a quantidade média de combustível fornecida é
realmente inferior a 1 litro.

a) Expresse, de forma simbólica, a afirmação de que os postos da Petromoc estão a


prejudicar os consumidores.

R: A afirmação de que os consumidores estão a ser prejudicados é equivalente a


afirmar que a média é inferior a 1 litro, o que, em forma simbólica, expressa-se como
litro.

b) Identifique a hipótese nula .

R: A afirmação original litro não contém a igualdade, conforme exigido pela


hipótese nula. A afirmação original é a hipótese alternativa; e a hipótese nula é
.

c) Identifique a hipótese alternativa .

R: A hipótese alternativa é .

d) Identifique este teste como bilateral, unilateral direito ou unilateral esquerdo.

R: Este teste é unilateral esquerdo, porque a hipótese nula é rejeitada se a média


amostral é significativamente inferior a 1 (está à esquerda de 1). (Como uma dupla

verificação, note que a hipótese alternativa contém o sinal , que aponta para a
esquerda.)

e) Identifique o erro tipo I para este teste.

R: O erro tipo I (rejeição de uma hipótese nula verdadeira) consiste em rejeitar


quando a média populacional é realmente igual ou superior a 1. Trata-se de
um erro sério, porque os postos da Petromoc serão acusados de prejudicar os
consumidores quando, na realidade, não há tal prejuízo.

f) Identifique o erro tipo II para este teste.

R: O erro tipo II (não rejeitar a hipótese nula falsa) consiste em não rejeitar
litro, quando a média populacional é realmente inferior a 1. Isto é, concluímos que não
há evidência suficiente para comprovar o prejuízo, quando esse prejuízo está ocorrer.

173
g) Suponha que a conclusão seria rejeitar a hipótese nula. Enuncie a conclusão em
termos não-técnicos; Lembre-se que deve lidar com a afirmação original.

R: Concluir que há evidências suficientes para apoiar a afirmação de que a quantidade


média de combustível fornecida é inferior a 1 litro.

f) Suponha que a conclusão seja não rejeitar a hipótese nula. Enuncie a conclusão em
termos não-técnicos; Lembre-se que deve lidar com a afirmação original; certifique-se.

R: Concluir que não há evidência suficiente para apoiar a afirmação de que a


quantidade média de combustível fornecida é inferior a 1 litro. Para realizarmos os
testes, temos que levar em consideração o tipo de teste (bilateral ou unilateral), e se a
variância dos dados é conhecida ou não. Se esta for desconhecida, devemos observar
se a amostra é grande ( ) ou não. Isto é importante, porque a partir dessa análise
é que as estatísticas de teste e a região crítica são construídas.

Vamos estudar todos os três casos:


2
Caso 1: Teste unilateral para conhecida ou amostra grande ( )

Quando se realiza um teste bilateral ou unilateral, onde as hipóteses se descrevem


como: hipótese alternativa - (valor especificado por ) ou , no
caso dos testes unilaterais esquerdo e direito, respectivamente. A partir de uma
amostra dos dados, calcula-se a estatística X . No caso em que a variância é
conhecida, a estatística de teste será:

X 0
z
n

No caso em que a variância é desconhecida, mas a amostra é grande ( ) ,


utiliza-se o valor de dos dados como uma estimativa de σ . Portanto, a estatística de
teste será:

X 0
z
S n

Exemplo 7.5

O dono de um grande supermercado afirma que o gasto mensal de seu


estabelecimento com energia eléctrica é 40000 kW/h. O consultor contratado pelo
supermercado deseja avaliar se esta afirmação é verdadeira. Após 36 dados referentes
ao consumo dos meses anteriores terem sido colhidos, ele observa que: X =420000
kW/h e S = 3500 kW/h. O teste será realizado tendo em conta que a probabilidade do

174
erro tipo I é 0,05. Suponha que o consumo de energia do supermercado segue uma
distribuição normal.

Hipóteses:

Estatística de Teste:

X 0
Pelas observações, temos: z
S n

420000 40000
z 3, 43
3500 36

Decisão:

Como, decide-se rejeitar , a 5% de significância.

Conclusão:

Há evidências de que o consumo de energia desse supermercado não é 40000 kW/h.

Caso 2: Teste unilateral para σ2 desconhecida e amostra pequena (n < 30)

Nos casos vistos até ao momento, a amostra era grande e, portanto, era possível
utilizar o Teorema Central do Limite e usar a aproximação normal para a estatística de
teste. Contudo, não podemos utilizar esse teorema para amostras pequenas. Para
realizar testes com pequenas amostras, vamos seguir o mesmo raciocínio que foi

175
utilizado na estimação do intervalo. Ao invés de utilizar a aproximação normal, vamos
recorrer à distribuição de t - Student. A estatística de teste, neste caso, é:

X 0
t
S n

A região crítica é construída utilizando a distribuição t com n - 1 graus de liberdade. No


caso em que a hipótese é unilateral, temos:

Quando se observa o valor da estatística na região crítica, deve-se rejeitar . Caso


contrário, não se deve rejeitar . Podemos escrever:

para o teste unilateral esquerdo e


para o teste unilateral direito.

O valor crítico tα,n-1 é o valor de t da tabela t de Student , que fornece uma área de α na
extremidade superior da distribuição t, com n - 1 graus de liberdade.

Voltando ao exemplo 7.2, o contador do hotel irá avaliar se a média de gastos de


hóspedes no fim de semana é superior a 500,00 MT. Para isso, seleccionou
aleatoriamente gastos de 22 hóspedes que estiveram no hotel em fins de semana num
determinado mês. Os dados observados (em meticais) foram: 475, 612, 382, 520, 600,
580, 490, 615, 475, 530, 470, 700, 385, 580, 645, 430, 450, 555, 527, 410, 585, 620.

O teste será realizado considerando α = 0.01.

176
Hipóteses: (já foram mostradas)

meticais contra meticais.

Estatística de Teste:

Primeiramente, calculam-se os estimadores da média e desvio:

475 612........ 585 620


X 528,9
22

(475 528,9) 2 ...... (620 528,9) 2


S 88, 0
21

A estatística de teste será:

528,9 500
tobs 1,54
88 / 22

Região Crítica:

Pela tabela da distribuição t o valor crítico é t0,01;21= 2,518 .

A região crítica do teste é

Decisão:

Como , decide-se pela não rejeição de meticais.

Conclusão:

Portanto, a 1% de significância, não há evidências de que o gasto dos hóspedes seja


superior a 500,00 MT.

Caso 3: Teste bilateral para σ2 desconhecida e amostra pequena (n < 30)

Seguindo o mesmo raciocínio do Caso 2, o teste bilateral também segue a distribuição t


de Student. A estatística de teste será:

177
X 0
t
S n

A região crítica é construída utilizando a distribuição t com n -1 graus de liberdade. No


caso em que a hipótese é bilateral, temos:

Quando se observa o valor da estatística na região crítica, deve-se rejeitar , caso


contrário, não se deve rejeitar H0. Podemos escrever a região crítica no teste bilateral
. O valor crítico tα/2, n-1 é o valor de t
da tabela t de Student que fornece uma área α/2 na extremidade, superior a
distribuição t com n-1 graus de liberdade.

Exemplo 7.6: Um administrador da área de marketing deseja avaliar o preço de um


produto comestível no mercado. Para tal, ele selecciona aleatoriamente os registos do
produto em 16 lojas e obtêm o valor médio de X = 7,50 com um desvio padrão de S
=1,00.

Supõe-se que os salários da empresa sejam normalmente distribuídos. Queremos


testar a hipótese nula usando um nível de significância de 10%.

Observe que a hipótese alternativa, nesse caso, é . Como o desvio foi


estimado a partir dos dados e a amostra é pequena, então devemos utilizar a
estatística t:

7,50 8, 00
tobs 2
1, 00 16

Região Crítica:

178
Pela tabela da distribuição t, o valor crítico é t0,05, 16= 1,753. Este é o valor de t da tabela
t de Student, que fornece uma área de 0,05 na extremidade superior da distribuição t
com 15 graus de liberdade.

A região crítica do teste é:

Decisão:

Como decidimos rejeitar à 10% de significância. Portanto,


há evidências de que o valor do produto não é 8,00 Mt.

Valor p (nível descritivo)

Ao realizarmos um teste de hipóteses, partimos de um dado valor de α pré-fixado, para


construir a regra de decisão. A alternativa é deixar a cargo de quem vai utilizar as
conclusões do teste, a escolha do valor para a probabilidade , que não precisará de
ser fixada a priori (antes de realizar o teste). A ideia consiste em estimar a
probabilidade (usando a distribuição t ou a normal padronizada) de se obter estimativas
mais desfavoráveis ou extremas do que fornecidas pela amostra (pelas estatísticas tobs
ou zobs), quando a hipótese nula é verdadeira. Ou alternativamente é ter um valor p,
denotado por α*. Isto funciona em todos os casos vistos anteriormente. Valores
pequenos de α* evidenciam que a hipótese nula é falsa. Como a amostra é uma
ferramenta de inferência sobre a população, ela fornece uma estimativa que teria a
probabilidade muito pequena de acontecer, se fosse verdadeira.

O conceito do que é “pequeno” fica a cargo do responsável pelo teste, que decide qual
α usar para comparar com o valor obtido α*. Quando não é definido o valor de α para
se fazer a comparação, é recomendado usar o nível 0,05.

179
Caso unilateral:

Para amostras grandes ou variância conhecida, o valor p será verdadeira, que


significa usar o valor extremo de :

E no caso de amostras pequenas será verdadeira, que significa usar o valor


extremo de :

Observação

Alguns valores de nível descritivo não estão acessíveis nas tabelas das distribuições
normal padronizada de t. Quando não há um software disponível para fazer o cálculo,
mas somente as tabelas, é possível fazer uma aproximação para o valor p,
especificando entre que valores ele se situa. No Excel 2003, obtém-se o valor p na
função DIST.NORMP, para a distribuição normal padronizada e DISTT para a
distribuição t. Veja, na ajuda do Excel, que a função disponibiliza a distribuição
acumulada até o ponto zobs ou tobs.

Exemplos de ilustração

1º exemplo: Voltando ao exemplo do medicamento Sem Dor, a estatística de teste foi


zobs = -1,85.

O valor p é:

180
Isso significa que a probabilidade de dizer que o tempo de reacção do medicamento é
minutos quando na verdade é é 0,0322. O erro que estaria a ser
cometido seria pequeno. Por isso, é que se decide pela rejeição de

2º exemplo: Voltando ao exemplo 7.2, o valor p é dado por:


. Se o nível de significância adoptado fosse 0,05,
decidiríamos não rejeitar , e se fosse 0,1 decidir-se-ia rejeitar . A decisão final será
de acordo com a vontade de quem realiza o teste. Ele irá avaliar se o erro é grande e
ira decidir se rejeita a , ou se é tolerável, podendo rejeitar .

Ao calcularmos o nível descritivo (valor p), precisamos de considerar que parte da


região crítica está associada aos valores de zobs e tobs que estão muito distantes (para
mais ou para menos) daquele previsto pela hipótese nula. Dessa forma, o
procedimento usual é multiplicar por dois a probabilidade obtida em uma das caudas,
de modo a preservar a ideia de afastamento bilateral. Assim, ao testarmos
contra , a definição do valor p depende da relação entre X e , que é o
mesmo que avaliar se zobs e tobs são maiores do que zero:

Se para o caso da amostra grande ou variância conhecida, ou , para o


caso da amostra pequena e variância desconhecida:

, respectivamente.

Se para o caso da amostra grande ou variância conhecida, ou , para


o caso de amostra pequena e variância desconhecida:

, respectivamente.

Vejamos, por exemplo, como se encontra o valor p no caso em que e


são maiores do que zero.
181
3º exemplo: Voltando ao exemplo do consumo de energia num supermercado,
tínhamos as hipóteses kW/h contra kW/h. Se formos
tomar a decisão a partir do valor p, temos que:

, porque ;

Como, neste caso, o valor p é muito pequeno, e decidimos rejeitar a , levando à


mesma conclusão que no procedimento do teste de hipóteses.

Exemplo 7.7

Uma fábrica de chocolates suspeita que embalagens de 450 gramas de um certo tipo
de chocolate em barra, estão abaixo do peso. Para verificar tal afirmação, foram
seleccionadas aleatoriamente 80 barras em vários lotes de produção, obtendo-se uma
média de peso de 447 gramas. Se admitirmos que o peso das barras de chocolate
segue o modelo Normal, com um desvio padrão de 10 gramas, que conclusão pode ser
tirada através do nível descritivo?

(peso médio, conforme previsto na embalagem)

(peso médio, abaixo do previsto na embalagem)

O valor observado na amostra foi X = 447 e as suposições feitas sobre a normalidade


da variável peso implicam que X  N ( , 2 / n) , ou seja, X  N ( ,100 / 80) ,
padronizando, calculamos a estatística:

X 447 450
zobs 2, 68
/ n 10 80

Portanto, o valor p é de 0,37%, o que indica que a probabilidade de que sugere valores
da estimativa mais desfavoráveis à hipótese nula. Note que o valor do nível descritivo
relaciona-se directamente com o nível de significância. Neste exemplo, se tivéssemos

182
fixado o nível de significância em qualquer valor, igual ou superior a 0,37%, a
conclusão seria a rejeição de , ao passo que valores inferiores a 0,37% conduzir-
nos-iam à aceitação da hipótese nula.

183
LIÇÃO N° 23

Teste para Proporção

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Saber determinar a estatística do teste para proporções;


2. Saber escolher a estatística correspondente para cada caso;

184
7.23 Teste para proporção

Vamos, agora, ilustrar como podemos testar uma afirmação sobre uma proporção,
probabilidade ou percentagem. O raciocínio é semelhante ao que foi desenvolvido no
teste para a média. Só que neste caso, da proporção, as observações se originam de
um modelo Binomial, e de acordo com Webster (2007), a distribuição amostral das
proporções amostrais pode ser aproximada por uma distribuição normal. As hipóteses
no teste para proporção são:

E a estatística de teste é:

pˆ p0
z
p0 (1 p0 )
n

Tal que p̂ é a proporção observada na amostra e n é o número de observações da


amostra. Observe que o desvio utilizado no teste é p0 (1 p 0 ) fornecido pela
hipótese nula, ele não é estimado pelos dados. Por isso, a aproximação da estatística
de teste é feita pela distribuição normal padronizada. Assim, a região crítica será:

Quando se observa o valor da estatística z na região crítica, deve-se rejeitar . Caso


contrário, não se deve rejeitar . Podemos escrever:

para o teste unilateral esquerdo

185
para o teste unilateral direito

Quando se observa o valor da estatística z na região crítica, deve-se rejeitar . Caso


contrário, não se deve rejeitar . Podemos escrever a região crítica da forma:

Critério do valor p no teste de proporção:

Seguindo o mesmo raciocínio que foi ilustrado para o valor p para o teste da média,
temos:

Ao testarmos : contra , a definição do valor p depende da


relação entre p̂ e p0 , que é o mesmo que avaliar se zobs é maior ou menor do que
zero:

Se

Se

Exemplo 7.8: O Departamento de Recursos Humanos de uma grande empresa


multinacional, preocupado com a qualidade de vida dos seus funcionários, deseja
saber se a proporção de fumadores na sua empresa é superior a 30%. Para tal, o
administrador responsável pelo estudo seleccionou aleatoriamente 40 funcionários, e
verificou que 9 fumavam. Qual foi a conclusão do administrador a um nível de
significância de 5%?

186
A proporção de fumantes estimada é:

8
pˆ 0, 2
40

Região Crítica:

Como o teste é unilateral direito, a região crítica é dada por:

Estatística de teste:

0, 2 0,3
zobs 1,38
(0,3x0, 7)
40

Decisão:

Como 1,38 não pertence à região crítica, decide-se pela não rejeição de com 5% de
significância. Logo, há evidências de que a proporção de fumantes não é superior a
30%.

Critério de decisão pelo valor p

O valor p é , comparado com o nível 0,05,


decide-se não rejeitar de .

Exemplo 7.9

A Mcel deseja saber se a proporção de consumidores que utilizam seu serviço é de


50% da população da província de Maputo. Para isso, ela seleccionou aleatoriamente

187
100 consumidores, dos quais 48 informaram que utilizam seus serviços. Tire
conclusões a 5% de significância.

A proporção amostral observada é:

48
pˆ 0, 48
100

Hipóteses:

Estatística de teste:

0, 48 0,5
zobs 0, 40
(0,5 x0,5)
100

Região Crítica:

Como é , decidiu-se não rejeitar ; isso significa


que não há evidência suficiente para rejeitar a afirmação de que 50% dos
consumidores utilizam o serviço da empresa MCel.

Ao tomar a decisão usando o valor p, consideramos que o teste é bilateral e ,


então temos:

188
Como o valor p supera o nível de significância 0,05, não rejeitamos a hipótese nula e,
novamente, concluímos que não há evidência suficiente para rejeitar a afirmação de
que 50% dos consumidores que utilizam os serviços da Mcel sejam de Maputo.

7.23.1 Usar intervalos de confiança para tomada de decisões

O intervalo de confiança pode ser utilizado para tomada de decisões no caso de teste
de hipóteses bilateral. Sejam as hipóteses contra , a decisão
tomada será:

 Rejeita-se , se não pertence ao intervalo de confiança;


 Não se rejeita , se pertence ao intervalo de confiança.

O nível de confiança considerado no intervalo, em termos do teste de


hipóteses, será o nível de significância. A tomada de decisões, por meio do intervalo,
serve de teste de média com variância conhecida e desconhecida (amostra grande e
pequena), e para o teste de proporção.

Para o Exemplo 6.2, da unidade temática VI, em que a EMOSE deseja testar se a
idade média dos proprietários de apólices de seguro de vida é 40 anos, com 10% de
significância. O teste é ; contra .

O intervalo de 90% construído foi , como pertence ao intervalo,


não se deve rejeitar . Portanto, a 10% de significância, há evidências de que a idade
média dos proprietários de apólices de seguro de vida da EMOSE é 40 anos.

Para o Exemplo 6.3, da unidade temática VI, sobre o número de faltas de funcionários
por ano, deseja-se testar se o número médio de faltas é 2,5 , com 5% de significância.
O teste é ; contra

O intervalo de 95% de confiança para o número médio de faltas para cada funcionário,
por ano, construído foi ; como não pertence ao intervalo, deve-
se rejeitar . Portanto, a 5% de significância, há evidências de que o número médio de
faltas para cada funcionário, por ano, não é 2,5.

189
LIÇÃO N° 24

Teste para Variância

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Saber determinar a estatística do teste para variância;


2. Saber escolher a estatística correspondente para cada caso;

190
7.24 Teste para variancia

Se é a variância de uma amostra aleatória de tamanho , for retirada numa


populacao normalmente distribuída com media e variância conhecidos, então o valor da
estatística do teste é:

Exemplo 7.9: Para diminuir a emissão do monóxido de carbono, uma fabrica de


producao de carros, depois de 4 anos de experiencis estimou que a media e o desvio
padrão do monóxido emitido era 0,3 e 0,025% por unidade do volume de oxido de
carbono. No sexto ano de funcionamento dosa padrões, uma amostra de 20 carros foi
retirada e foram medidos os desvios padraos.

0,292; 0,287; 0,274; 0,331; 0,332; 0,325; 0,285; 0,353; 0,293; 0,310

0,328; 0,315; 0,300; 0,298; 0,229; 0,316; 0,314; 0,281; 0,262; 0,283

Teste ao nível de significância de 10%, se a variância actual execede 0,025%.

Rejeitar se

, ,

Decisão:

Não rejeitar .

Conclusão:

191
Ao nível de significância de 10% não há evidencias suficientes para apoiar a afirmacao
de que actual a variância excede 0,025.

LIÇÃO N° 25

TESTES DE HIPÓTESE PARA DUAS AMOSTRAS

Objectivos da Lição

No fim desta lição, deves ser capaz de:

1. Descrever as estatísticas do teste para duas amostras;


2. Realizar ou resolver problemas que envolvem comparação de duas variâncias;

192
7.25 Testes de hipotese para duas amostras

a) Diferencas de médias
 Quando as variâncias (populacionais) são conhecidas e diferentes a
estatística do teste é dada por :

 Quando as variâncias (populacionais) são conhecidas e iguais a estatística


do teste é dada por:

 Quando as variâncias não são conhecidas e os tamanhos da amostra


a estatística do teste é dada por:

 Quando as variancias (populacionais) são desconhecidas e iguais


e amostras são pequenas a estatística do teste será dada por:
onde

 Quando as variâncias (populacionais) são desconhecidas e


amostras pequenas, a estatística do teste será dada por:

Teste para comparação de duas variâncias

onde ,

Exemplo 7.10: Ao nível de significância de 1% teste afirmação de que as latas de


0,0109 de espessura tem carga axial media inferior a das latas de 0,011 de espessura.
Os dados amostrais encontram-se a seguir:

193
(Carga axial: peso máximo que seus lados podem suportar)

Carga axial de latas 175 267,1 22,1


de 0,0109

Carga axial de latas 175 281 27,8


de 0,0111

Como as variâncias são desconhecidas e as amostras são grandes, a estatística do


teste será:

Regra de decisão:

Rejeitar se o

, quando

Decisão

Rejeitar

Conclusão:

Ao nível de significância de 1% há evidências suficientes para apoiar a afirmação de


que as latas de 0,0109 tem carga axial média inferior que a das latas de carga axial
0,0111.

194
Exemplo 7.1: Ao nível de significância de 5%, o teste da afirmação de que a qualidade
média de Nicotina em cigarros do tipo King-Size com filtro é igual a quantidade média
de Nicotina presente em cigarros sem filtro.

Nicotina (mg)

King-Size com filtro King-Size sem filtro

Como e são desconhecidos e não sabemos se são iguais devemos efectuar o


teste preliminar de variâncias.

E a estatística do teste será onde

Regra de decisão: Rejeitar se

Decisao: Não rejeitar

Entao, como os tamanhos das amostras e são pequenos, usaremos

Regra de decisão: Rejeitar se o ou .

195
e

Decisão:

Rejeitar

Conclusão: Ao nível de significância 5% há evidencia suficientes que .

Leituras Obrigatórias

Nesta unidade não foram tratados temas tais como: Testes para duas populações e
Análise de Variância.

Texto 1
Webster, Allen L. Estatística Aplicada à Administracao e Economia. São Paulo:
McGraw-Hill, 2006.

Ler este livro capítulo IX e X de pagina 222 a pagina 294.

Leituras Complementares

A partir da leitura destes livros, que chamamos por leitura complementar, o nosso
maior objectivo é que você possa conhecer outros enfoques dados aos temas
estudados, ao longo desta unidade, que contribuirão para enriquecer e dar subsídios
para a sua formação nesta area.
Atenção, evite ler os textos apenas para responder aos exercícios. A leitura enriquece
e facilita o seu entendimento global do conteúdo desenvolvido.

Texto 2
Webster, Allen L. Estatística Aplicada à Administracao e Economia. São Paulo:
McGraw-Hill, 2006.

Ler este livro capítulo VIII e IX de pagina 193 a pagina 215.

196
TABELAS ESTATÍSTICAS

Abaixo, estão apresentadas as tabelas estatísticas que irás necessitar durantes os teus
estudos nesta disciplina.

Maior parte delas foram extraídas do livro do Allen Webster (2006).

197
198
199
200
201
202
203
204
205
206
207
BIBLIOGRAFIA

1. Reis, Elizabeth; Melo, Paulo; Andrade, Rosa e Calapez, Teresa. Estatística


Aplicada. Lisboa, 2001.

2. Reis, Elizabeth. Estatística Descritiva. Lisboa, 2005.

3. Webster, Allen L. Estatística Aplicada à Administracao e Economia. São


Paulo: McGraw-Hill, 2006.

4. Mulenga, Alberto. Manual de Introdução à Estatística. Maputo, 2004

208
BASE DE EXERCÍCIOS

Exercício 1 (Estatística Descritiva, Unidade Temática I)

Trinta e seis estudantes foram submetidos a um exame de biologia, onde se tem a


seguinte distribuição das notas:

93, 97, 72, 84, 88, 90, 78, 80, 89, 94, 95, 77, 81, 75, 72,
91, 94, 81

76, 70, 76, 83, 97, 73, 83, 87, 91, 83, 92, 90, 92, 77, 86,
86, 74, 87,

a) Classifique a variável
b) Construir a tabela de Distribuição de frequências
c) Calcule as medidas de tendência central
d) Calcule as medidas de dispersão
e) Desenhe o gráfico de barras
f) Apresente o Histograma da distribuição

Resolução:

a) Variável
Tipo: Variável quantitativa contínua
n = 36
b)

Cálculo do número de classes

Cálculo da amplitude total

209
Cálculo da amplitude de intervalo de classes

Grau de precisão (GP) – é a diferença mínima entre números consecutivos. Sendo


estes naturais o grau de precisão é igual a unidade “1”

Rol

O limite inferior para a primeira classe é igual ao observado. Sendo que, para
achar os subsequentes adicionamos a ao anterior.

Os limites superiores são obtidos adicionando o , que é a diferença entre a


amplitude do intervalo de classe com o grau de precisão ao limite inferior de cada
intervalo de classe.

i Classes

1 70 – 73 70, 72, 72, 73


2 74 – 77 75, 76, 76, 77, 77, 74
3 78 – 81 78, 80, 81, 81
4 82 – 85 84, 83, 83, 83
5 86 – 89 88, 89, 87, 86, 86, 87
6 90 – 93 93, 90, 91, 92, 90, 92, 91
7 94 – 97 94, 95, 94, 97, 97

Como se vê há descontinuidade nos limites, daí o nome de limites aparentes, pelo que
é necessário transformá-los em limites reais, ou seja estabelecer a continuidade nos
limites. Bastando somente subtrair os limites inferiores pela metade do grau de
precisão, assim como adicioná-lo aos limites superiores.

I Classe

1 69,5 – 71,5 4 4 11 11 286 84,3 -12,80 655,36


73,5 0 0

210
2 73,5 – 75,5 6 1 17 28 453 84,3 -8,80 464,64
77,5 0 0 0
3 77,5 – 79,5 4 1 11 39 318 84,3 -4,80 92,16
81,5 0 4 0
4 81,5 – 83,5 4 1 11 50 334 84,3 -0,80 2,56
85,5 0 8 0
5 85,5 – 87,5 6 2 17 67 525 84,3 3,20 61,44
89,5 0 4 0
6 89,5 – 91,5 7 3 19 86 640,50 84,3 7,20 362,88
93,5 0 1 0
7 93,5 – 95,5 5 3 14 100 477,50 84,3 11,20 627,20
97,5 0 6 0
_ _ _ _ _ _ _ 2266,24

c) Cálculo de Medidas de Tendência Central

Média

Moda

O primeiro passo consiste em achar a frequência modal


, e o seu respectivo intervalo de classe é

Frequência anterior á frequência modal = 6


Frequência posterior á frequência modal = 5
Limite real inferior é igual a 89,5

Mediana

211
Nota: O resultado da nossa fracção coincide com o valor da frequência absoluta
acumulada que satisfaz a nossa inequação.
Seu respectivo intervalo de classe é e a respectiva frequência absoluta,
designada por frequência mediana é 4.
Limite real inferior é igual a 81,5

Frequência acumulada anterior á frequência que satisfaz a nossa inequação é


igual a 14.

d) Cálculo de medidas de Variação

Variância

Como n é maior que 30, a fórmula é:

Desvio Padrão

Como n é maior que 30, a fórmula é:

212
=

Coeficiente de Variação (Cv) =

e) Diagrama de Barras

Diagrama de barras

6
Frequencias absolutas

0
71,50 75,50 79,50 83,50 87,50 91,50 95,50

notas
Ponto médio de classe - Xi

f) Histograma da distribuição

213
Histograma

5
Frequencia absoluta

Mean = 84,2778
Std. Dev. = 7,90519
0 N = 36
70,00 75,00 80,00 85,00 90,00 95,00 100,00

Notas

Exercício 2 (Estatística Descritiva, Unidade Temática I)

Na tabela abaixo figuram os dados correspondentes ao consumo de electricidade de


uma amostra de oitenta usuários.
Consumo
em
4 26 8
10 80
30,00 80,00 97,50

a) Completa a tabela
b) Determine o consumo médio da electricidade.
c) Determine o consumo mais comum da electricidade.
d) Determine o consumo central da electricidade.
e) Calcule as medidas de dispersão.

Resolução:
a)
Consumo Total
em

214
4 6 14 26 14 8 6 2

4 10 24 50 64 72 78 80 -

5 12,50 30,00 62,50 80,00 90,00 97,50 2,50 100,00

15 35 55 75 95 115 135 155 -


60 210 770 1950 1330 920 810 310 6360

79,50 79,50 79,50 79,50 79,50 79,50 79,50 79,50 -

4160,2 1980,2 600,25 20,25 240,25 1260,2 3080,2 5700,2 -


5 5 5 5 5

16641, 11881, 8403,5 526,5 3363,5 10082, 18481, 11400, 80780,0


00 50 0 0 0 00 50 50 0

Solução:

A frequência acumulada no primeiro intervalo é igual a da frequência absoluta, pelo


que:
; ;

; ;

; ;

; ;

; ;

; ;

; ;

; .

215
b) Consumo médio da electricidade

c) Consumo mais Comum da electricidade

O primeiro passo consiste em achar a frequência modal


, e o seu respectivo intervalo de classe é

Frequência anterior á frequência modal = 14


Frequência posterior á frequência modal = 14
Limite real inferior é igual a 70,5

d) Consumo central da electricidade

1º Passo
é 50.
Seu respectivo intervalo de classe , e a respectiva frequência absoluta,
designada por frequência mediana ( ) é 26.
A frequência acumulada anterior à frequência que satisfaz a nossa inequação
é 24.

216
e) Cálculo de medidas de Variação

Variância

Como é maior que 30, a fórmula é: Como n é maior que 30, a fórmula é:

Desvio Padrão

Coeficiente de Variação (Cv) =

Exercício 3 (Unidade Temática II)

217
Em uma indústria há pessoas que ganham mais de 20 salários mínimos ( ), 20 que
ganham entre 10 e 20 e 70 que ganham menos de 10 . Três pessoas desta
indústria são seleccionadas. Determinar a probabilidade de que pelo menos uma ganhe
menos de 10 .

A: a pessoa ganha mais de 20


B: a pessoa ganha entre 10 e 20
C: a pessoa ganha menos de 10 e

A probabilidade pedida, de pelo menos uma ganhar menos de 10 , significa que


podem ser mais de uma, portanto:

Exercício 4(Unidade Temática II)

Num concurso de televisão, para conhecer qual é o prémio a que tem direito, o
vencedor tira simultaneamente três bolas de uma urna. A urna contém seis bolas que
não se distinguem ao tacto, tendo três o número , duas o número e uma o
número
O concorrente recebe em contos a soma dos números das bolas retiradas.
Verifique que a probabilidade de ocorrer o prémio de contos é de .

Resolução:

3 com o nº 0

6 Bolas 2 com o nº 500

1 com o nº 1000

Número de casos possíveis:

Número de casos favoráveis:


Tirar uma bola com o nº 1000 e duas bolas com o nº 0:
Tirar duas bolas com o nº 500 e uma bola com o nº 0:

218
A probabilidade de ocorrer o prémio de 1000 contos é de:

Exercício 5 (Unidade Temática II)

Num período de um mês, 100 pacientes sofrendo determinada doença foram


internados em um hospital. Informações sobre o método de tratamento aplicado em
cada paciente e o resultado final obtido estão no quadro abaixo.

Tratamento

A B Total

Resultado

Cura total 24 16 40

Cura parcial 24 16 40

Morte 12 8 20

Total 60 40 100

a) Sorteando aleatoriamente um desses pacientes, determinar a probabilidade de o


paciente escolhido:

ter sido submetido ao tratamento A;


ter sido totalmente curado ;
ter sido submetido ao tratamento A e ter sido parcialmente curado ;
ter sido submetido ao tratamento A ou ter sido parcialmente curado ;
b) Os eventos “morte ” e “tratamento A” são independentes? Justificar.
c) Sorteando dois dos pacientes, qual a probabilidade de que:
tenham recebido tratamentos diferentes?
pelo menos um deles tenha sido curado totalmente?

219
a)

b)

Como: ;

Temos:

Logo, os eventos “morte ” e “tratamento A” são independentes.

c) Seja tratamentos diferentes

Seja curado totalmente ( e a probabilidade de um paciente ter sido totalmente


curado é )

A probabilidade pedida é dada por:

Exercício 6 (Unidade Temática II)

Um dado equilibrado tem seis faces numeradas com 1, 2, 3, 4 ,5 e 6.


Lança-se o dado quatro vezes seguidas.
Qual é a probabilidade de obter nos quatro lançamentos:

220
1. Três vezes um número par?
2. Nenhum número par?
3. Pelo menos um número ímpar?

1
A probabilidade de se obter em cada lançamento um número par é:

(p)
Designando por p o acontecimento: “sair número ímpar”, vem:
P( )

O acontecimento em causa é a reunião dos acontecimentos:

A probabilidade de cada um destes:

Então a probabilidade pedida é:

2.
Pretende-se que saia número ímpar em todos os lançamentos.
A probabilidade pedida é:

3.
Aparecer pelo menos um número ímpar e o acontecimento contrário ao aparecimento
de quatro números pares.

Outro processo:
Recorrendo à análise Combinatória, pode usar-se a fórmula:

1.
(3)

2.
(4)

221
3.
(4)

Exercício 7 (Unidade Temática II)

Para certo exame, os candidatos devem preparar 100 temas dos quais três,
seleccionados ao acaso, sairão no exame.
Um candidato apresenta-se a exame tendo preparado apenas dos temas. Qual é a
probabilidade de que tenha estudado só dois temas que saíram?

três temas
Um candidato prepara apenas dos temas, ou seja, 25 dos temas.
O número de possibilidades de saírem 3 temas em 100 é dado por:
O número de possibilidades de saírem 2 dos 25 temas estudados é:
O número de possibilidades de sair 1 dos 75 temas não estudados é:
O número de casos favoráveis é dado por:
Então a probabilidade pedida é:

Exercício 8 (Unidade Temática VI)

Um estudo feito por um oficial de uma divisão de veículos blindados mostrou que numa
amostra aleatória de dias, a divisão possuía, em média, veículos em
condições operacionais. Sabendo que para tais dados, construa um intervalo
de 95% de confiança para o verdadeiro número médio diário de veículos que essa
divisão de veículos blindados possui em condições operacionais.

Resolução:

Como o tamanho da amostra é maior que 30, usamos a seguinte fórmula do intervalo
de confiança:

(grau de confiança)

222
O valor correspondente de é 1,96.
Substituindo na fórmula do intervalo de
confiança, obtemos os seguintes limites:

Onde os limites de confiança foram arredondados até a segunda casa decimal.

Resposta: Com de confiança pode-se dizer que o verdadeiro número médio diário
de veículos que essa divisão de veículos blindados possui em condições operacionais
a .

Exercício 9 (Unidade Temática VI)

Durante a execução de determinada tarefa sob condições simuladas de


imponderabilidade, a média da taxa de batimentos cardíacos de 12 astronautas
aumentou em 27,33 batimentos por minuto, com desvio padrão de 4,28 batimentos por
minuto. Construa um intervalo de 99% de confiança para o verdadeiro aumento médio
da taxa de batimentos cardíacos dos astronautas no desempenho daquela tarefa.

Os limites de confiança de são dados por:

, ou

Onde e
Para . Então, os limites de confiança
de são:
e o intervalo de confiança
de é de a . Ou seja batimentos por minuto.

Com 99% pode-se estar confiante de que a verdadeira média está compreendida entre
e batimentos por minuto.

Exercício 10 (Unidade Temática VI)

223
Uma amostra de 8 locais onde a pintura das estradas se mostrou deteriorada depois de
ter sido cruzada em média por 14,10 milhões de veículos com desvio padrão
milhões de veículos. Calcule um intervalo de de confiança para a média da
população considerada.

Tratando-se de pequena amostra, usaremos a estatística dada por:

Que é um valor de uma variável aleatória com a distribuição , ou seja, distribuição


de Student, ou distribuição de Student. Sabendo que essa variável irá assumir um
valor entre
e , por conseguinte temos:

Substituindo , , e para graus de


liberdade na fórmula do intervalo , obteremos:

Conclusão
Com este nível de 95%, pode-se estar confiante de que a verdadeira média está
compreendida entre a milhões de veículos.

Exercício 11 (Unidade Temática VI)

Uma amostra de 10 medidas do diâmetro de uma esfera apresentou a média


e o desvio padrão . Determinar os intervalos de confiança de: (a)
; (b) para o diâmetro real.

Solução:

(a) Os limites de confiança de são dados por:

224
Para o coeficiente de confiança de A área total sombreada da figura é .
Portanto, a área sombreada da extremidade da direita é e o valor crítico
correspondente de é

Como , encontra-se Então, para e


os limites de confiança desejados de são:

Por conseguinte, pode-se estar confiante de que a média verdadeira está


compreendida entre e .

(b) Os limites de confiança de são dados por:

, onde e
Para . Então, os limites de confiança de são:
e o intervalo de confiança de
é de a .

Exercício 12 (Unidade Temática VI)

Num estudo sobre a eficiência de um lubrificante de dobradiças, uma organização de


pesquisas quer investigar a variabilidade do número de ciclos, consistindo em abrir e
fechar uma porta, que leva para uma dobradiça começar a chiar. Usando
dobradiças e desvio padrão igual a , construa um intervalo de 95% de confiança
para .

Resolução:

225
Então substituindo:
para,
, na fórmula do intervalo de confiança de ,
obtemos

Conclusão: o intervalo de confiança para a verdadeira variância populacional é


, ou seja com 99% de confiança pode-se dizer que a verdadeira
variância populacional está entre 15.913 e 73.836 ciclos.

Estimativa do desvio padrão – Intervalo de Confiança para o desvio padrão


populacional

o que significa que extraindo as raízes quadradas do intervalo de confiança para a


variância: , obtemos ciclos.

A conclusão é a mesma tecida para o intervalo da variância.

Exercício 13 (Unidade Temática VI)

Numa amostra aleatória de 2500 adultos entrevistados nacionalmente, somente 850


indicaram que os salários de certos membros do executivo deveriam ser aumentados.
Construa intervalos confiança para a verdadeira percentagem de adultos que
compartilham daquela opinião, adoptando:
a) 95% de confiança
b) 98% de confiança

a) Solução:

Intervalo de confiança para proporções

226
φ =

R: Para um erro de 5% pode-se dizer que o intervalo de confiança de que 34% dos
indivíduos compartilham da mesma opinião (“aumento de salário para certos membros
do executivo”) é de 32,1% a 35,9%.

b) Solução
φ =

R: E neste caso, com , pode-se dizer que o intervalo de confiança de que 34%
dos indivíduos compartilham da mesma opinião (“aumento de salário para certos
membros do executivo”) é de 31,8% a 36,2%.

Exercício 14 (Unidade Temática VII)

A altura média de 50 estudantes do sexo masculino, que tiveram participação superior


à média nas actividades atléticas escolares, era173,23 cm com desvio padrão de 6,35
cm, enquanto que os 5º que não mostraram nenhum interesse nessas actividades
apresentaram a média de 171,45 cm, com o desvio padrão de 7,11 cm. Testar a
hipótese dos estudantes do sexo masculino que participaram das actividades atléticas
serem mais altos do que os outros.

Solução:

227
Deve-se decidir entre as duas hipóteses:

, não há diferença entre as alturas médias.


, a altura média do 1º grupo é maior do que a do segundo.

Para a hipótese

e
Em que se consideram os desvios padrões das amostras como estimativas de e .
Para o nível de significância de 0,05, tem-se a seguinte regra de decisão:

1. Se o escore z observado for superior a 2,33, os resultados serão significativos


no nível de 0,05, e será rejeitada.
2. No caso contrário (nesse caso se for inferior), aceita-se

Então:

Com base num teste unilateral, no nível de significância de 0,05, onde , a área entre 0
e = 0,4500 e , foi necessário calcular a média
desses valores por ambos tem um desvio significativo do valor 0,4500.
Conclui-se ao nível de significância de 0,05 que não há diferença entre as alturas
médias dos dois grupos, pois o z observado é inferior.

Exercício 15 (Unidade Temática VII)

A altura média de 50 estudantes do sexo masculino, que tiveram participação superior


à média nas actividades atléticas escolares, era173,23 cm com desvio padrão de 6,35
cm, enquanto que os 5º que não mostraram nenhum interesse nessas actividades
apresentaram a média de 171,45 cm, com o desvio padrão de 7,11 cm. De quanto
deveria ser aumentado o tamanho da amostra de cada um dos dois grupos para que a
diferença observada de 1,78 cm, entre as alturas médias, seja significativa no nível de
significância de 0,05? Os desvios permanecem os mesmos.

Solução:

Admita-se que o tamanho da amostra de cada grupo é N e que os desvios padrões dos
dois grupos permaneçam os mesmos. Então, para a hipótese , e

Para uma diferença observada 1,78 cm entre as alturas médias:

228
A diferença observada será significativa, no nível de 0,05, quando o z =1,645, ou seja,
no mínimo, de modo que de ser 78 no mínimo. Em consequência, a
amostra deve ser aumentada em cada grupo, de no mínimo.

Nota: Ao se dizer que a diferença entre as alturas é significativa, na regra de decisão


corresponde a dizer que deve-se rejeitar . Portanto para se rejeitar a hipótese nula
o escore z deve ser igual ou superior ao . Daqui também podíamos ter:

Outro método:

Exercício 16 (Unidade Temática VII)

Dois grupos, A e B, são formados, cada um de 100 pessoas que padecem da mesma
enfermidade. É ministrado um soro ao grupo A, mas não ao B (denominado grupo de
controle); a todos os outros respeitos, os dois grupos são tratados de modo idêntico.
Determinou-se que 75 e 65 pessoas dos dois grupos A e B, respectivamente, curaram-
se da enfermidade. Testar a hipótese do soro auxiliar a cura da enfermidade, adoptado
o nível de significância de 0,01.

Solução:

Sejam e , respectivamente, as proporções populacionais (1) curadas mediante o


uso do soro, (2) sem o uso do soro. Deve-se decidir entre as duas hipóteses:
e as diferenças observadas são devidas ao acaso, isto é o soro não é
eficaz.
: e o soro é eficaz.

Para a hipótese :

e ,
Em que foi adoptada , para a estimativa de , a proporção média de curas nos dois
grupos da amostra, é dada por sendo .

229
Com base em um teste unilateral, no nível de significância 0,01, onde a área entre 0 e
por conseguinte

Para o nível de significância de 0,01, tem-se a seguinte regra de decisão:

1. Se o escore observado for superior a 2,33, os resultados serão significativos


no nível de 0,01, e será rejeitada.
2. No caso contrário (nesse caso se for inferior), aceita-se

Então,

Conclusão:
Como o escore é inferior, aceita-se , ou seja, as diferenças observadas são
devidas ao acaso.

Exercício 17 (Unidade Temática VII)

Antigamente, uma certa máquina produzia arruelas que tinham a espessura de


Para se verificar se a máquina está trabalhando adequadamente, escolheu-se
uma amostra de 10 arruelas, cuja espessura média é e cujo o desvio padrão
é . Testar a hipótese da máquina estar trabalhando adequadamente,
adoptados os níveis de significância: (a) 0,05; (b) 0,01.

Solução:
Deseja-se decidir entre as hipóteses:
, e a máquina está trabalhando adequadamente.
e ela não o está, de modo que um teste bilateral é necessário

(a) Para a hipótese tem-se:

Para um teste bilateral, no nível de significância 0,05, adopta-se a seguinte regra de


decisão:

230
1. Aceitar quando t estiver compreendido no intervalo entre e , o
qual, para graus de liberdade, é o que vai de
2. No caso contrário, rejeitar .

Conclusão:
Como , rejeita-se no nível 0,05.

(b) Para um teste bilateral, no nível de significância 0,01, adopta-se a seguinte regra
de decisão:

1. Aceitar quando t estiver compreendido no intervalo entre e , o


qual, para graus de liberdade, é o que vai de
2. No caso contrário, rejeitar .

Conclusão:
Como , aceita-se no nível 0,01, ou seja, a máquina está trabalhando
adequadamente.

Exercício 18 (Unidade Temática VII)

A tensão de ruptura dos cabos produzidos por um fabricante apresenta a média de


1800 kg e o Desvio de 100 kg. Mediante nova técnica no processo de fabricação,
proclamou-se que a tensão de ruptura pode ter aumentado. Para testar essa
declaração, ensaiou-se uma amostra de 50 cabos, tendo-se determinado que a tensão
média de ruptura de 1850 kg. Pode-se confirmar a declaração no nível de significância
de 0,01?

Solução:

Deve-se decidir entre as duas hipóteses:

kg e, nesse caso, não há realmente modificação da tensão de ruptura.


kg e, então, há modificação daquela tensão.

Deve-se neste caso, empregar um teste unilateral.


No nível de significância de 0,01, a área entre 0 e = 0,4900 e a regra de
decisão será:
1. Se o escore z observado for superior a 2,33, os resultados serão significativos
no nível de 0,01, e será rejeitada.

231
2. No caso contrário, aceita-se

Região
Crítica

Para a hipótese de que é verdadeira, determina-se:

O valor observado é superior a 2,33. Conclui-se, portanto, que os resultados são


altamente significativos e a declaração é confirmada.

Exercício 19 (Unidade Temática VII)

A vida média de uma amostra de 100 lâmpadas fluorescentes produzidas por uma
companhia, foi calculada em 1570 horas, com o desvio padrão de 120 horas. Se éa
vida média de todas as lâmpadas produzidas pela companhia, testar a hipótese
horas, em face da hipótese alternativa horas, adoptando o nível de
significância de : (a) 0,05; (b) 0,01.

Solução:
Deve-se decidir entre as duas hipóteses:
horas. horas.

Deve-se empregar um teste bilateral neste caso, porque horas inclui tanto
os valores maiores como os menores do que 1600.

(a) Para um teste bilateral no nível de significância 0,05, há a seguinte regra de


decisão:

232
1. Rejeitar quando o z da média amostral estiver fora do intervalo:

2. Aceitar no caso contrário.


A estatística considerada é a média amostral . Sua distribuição amostral tem a média
e o desvio padrão , adoptando-se o desvio padrão da

amostra como uma estimativa para . Como cai fora do


intervalo -1,96 a 1,96, rejeita-se no nível de significância 0,05.

(b) Se o nível de significância é 0,01, o intervalo de -1,96 a 1,96 da regra de decisão


do item (a) é substituído pelo de -2,58 a 2,58. Então como o escore z de -2,50
cai dentro desse intervalo, aceita-se .

Exercício 20 (Unidade Temática VII)

O fabricante de uma droga medicinal reivindicou que ela era 90% eficaz em curar uma
alergia, em um período de 8 horas. Em uma amostra de 200 pessoas que tinham
alergia, a droga curou 160 pessoas. Determinar se a pretensão do fabricante é legítima
ao nível significância de 1%.

Solução:
Seja p a probabilidade de obter-se a cura da alergia, mediante o uso da droga.
Então, deve-se decidir entre duas hipóteses:

a pretensão é correcta.
ela é falsa.

Região
Crítica

233
Sendo o nível se significância igual a 0,01, então a área entre 0 e = 0,4900 e
. Pelo que toma-se para regra de decisão:

1. A pretensão não será legítima quando z for inferior a -2,33 ( e nesse caso,
rejeita-se
2. No caso contrário, a pretensão será legítima e os resultados observados são
devidos ao acaso (e, então aceita-se ).

Se é verdadeira,

Posto isto, 160, em unidades reduzidas que é muito menor que -


2,33. Portanto de acordo com a regra de decisão, conclui-se que a pretensão não é
legítima e que os resultados da amostra são altamente significativos.

O valor observado também podia ser obtido través da seguinte fórmula:

Como se pode ver a diferença é tão insignificante que não se altera a conclusão
tomada.

234
235

Você também pode gostar