Escolar Documentos
Profissional Documentos
Cultura Documentos
A POLITÉCNICA
Escola Superior Aberta
GUIA DE ESTUDO
ESTATÍSTICA APLICADA AS
CIENCIAS SOCIAIS
Curso de Ciências da Educação
(3º Semestre)
- Moçambique -
FICHA TÉCNICA
1
FICHA TÉCNICA
Edição: 1ª
Organização e Edição
Escola Superior Aberta (ESA)
Elaboração
Sansão Pedro (Conteúdo)
Benedito Marime (revisão textual)
2
ÍNDICE
Apresentação do Manual……………………………………………………………………….1
Orientações Importantes……………………………………………………………………….2
Introdução……. ………………………………...……………………………………………….3
Objectivos da disciplina……………………………………………………………...…………4
Plano Temático………………………………………………………………………………….5
PARTE I – ESTATÍSTICA DESCRITIVA
3
LIÇÃO N° 14 - Função de distribuição acumulada das probabilidades…….………….108
TABELAS ESTATÍSTICAS………………………………………………………………….191
BIBLIOGRAFIA……………………………………………………………………………... 201
4
Apresentação do Manual
Prezado(a) estudante!
O presente manual, que tem por objectivo orientar os teus estudos individuais na área
de estatística, está organizado em 7 unidades (cujos temas se encontram no plano
temático adiante) agrupados em duas partes: uma de Estatística Descritiva e outra de
Inferência Estatística. Por sua vez, as unidades estão divididas em lições. Cada lição,
além de apresentar a parte teórica comporta uma parte prática, constituída por
exemplos agrupados em unidades, isto é, o exemplo 1.1 é o 1º exemplo da unidade 1.
A organização do manual por pontos, por exemplo, o ponto 1.1 traduz a 1ª lição dentro
da unidade 1, e, se for 1.1.1 indica o tópico 1 da lição 1 da unidade 1.
O autor
5
Orientações Importantes
Faça planos para estudar e não se esqueça de fazer notas das partes que
achares importantes e com necessidade de revê-las para entendê-las.
Procure sempre, ao fim de cada unidade e lição, relacionar o que reteste com os
referidos objectivos para controlares a concretização dos mesmos.
6
Introdução
7
MANUAL DE ESTATÍSTICA APLICADA A
CIÊNCIAS SOCIAIS
Objectivos da Disciplina
8
PLANO TEMÁTICO
N° da Horas por
Unidade Unidades Temáticas Unidade
1 Estatística Descritiva 15
3 Variáveis Aleatórias 10
7 Teste de Hipóteses 15
9
PARTE I - ESTATÍSTICA DESCRITIVA
UNIDADE TEMÁTICA I
Objectivos da Unidade
10
LIÇÃO N° 1
Objectivos da Lição
11
1.1.1 Breves Conceitos Fundamentais
Estatística
A Estatística é uma ciência ou ramo da Matemática Aplicada que fornece métodos para
a recolha, organização, descrição, análise e interpretação de dados, cujo fim é a
utilização dos mesmos na tomada de decisões.
A estatística geralmente é divida em duas partes: Descritiva e Inferencial (Indutiva).
Lembre-se…
12
b) Fenómeno Estatístico
É qualquer evento que se pode analisar aplicando técnicas estatísticas. Os fenómenos
estatísticos podem ser colectivos ou de massa, por exemplo, a evolução das
exportações em 30%, e individuais, que por sua vez classificam-se em típicos
(regulares) e atípicos (irregulares).
c) Observação Estatística
É um processo sistemático, cientificamente, argumentado de dados em massa que
possuem uma característica comum em relação ao objecto de estudo.
d) Dado
Em pesquisas, é comum ouvir:
“Vamos recolher 1º os dados.”
Mas afinal, o que é dado?
Dado
Dado Qualitativo Dado Quantitativo
e) Informação
É o produto final do processamento de dados.
Exemplo 1.2: Notas de frequência de estudantes de uma determinada disciplina.
Para responder a essa pergunta, basta ver os exemplos de cada conceito. Para
obtermos um dado não precisamos de processá-lo, como por exemplo, não precisamos
de processar a matrícula de um carro envolvido num acidente e as idades dos
participantes de um inquérito. Mas ao contrário da informação, para a sua obtenção,
precisamos de processá-la, isto é, processar um conjunto de dados, como por
exemplo, processar notas (dados) de 2 testes para obter as notas de frequência
(informação) de estudantes de uma cadeira.
14
Aprofundando…
Tabela 1.1
Agrup. disciplinar Nota Sexo
1 12 F
2 13 M
…. … …
f) Variável
É o símbolo que representa determinada característica de uma população ou de uma
amostra extraída dessa população. A notação utilizada para uma variável corresponde
às letras enquanto que valores constantes são geralmente representaados por
as primeiras letras do alfabeto: . A variável pode ser qualitativa ou quantitativa.
15
Aprofundando…
Quando as características de uma variável não podem ser medidas, ou seja, não
podem ser expressas através de números, diz-se que a variável é qualitativa. Se, pelo
contrário, as suas características são mensuráveis, então, trata-se de uma variável
quantitativa.
Uma vez que a variável quantitativa define uma característica que pode ser expressa
em números, ela pode também ser discreta ou contínua.
Chama-se de discreta, a qualquer variável cujo domínio é enumerável, isto é, quando
toma valores (numéricos) distintos (finitos). Por exemplo: X={x1,x2,…xn}. Quando a
variável assume qualquer valor dentro de um certo intervalo finito ou infinito. Ou dado
um intervalo [a, b] com , existe um valor x tal que e , i.é, ,
então, diz-se que ela é variável contínua.
===============================================
Variável
===============================================
g) População
Entende-se por População ou Universo, o conjunto de indivíduos, que podem ser
pessoas, animais, objectos ou resultados experimentais, com pelo menos uma
característica comum, que se pretende estudar. A população pode ser finita ou infinita,
consoante seja finito ou não o numero de elementos considerados na observação.
Exemplo 1.4: A população de ratos magros de uma determinada zona; A população de
bicicletas estragadas na Cidade de Chimoio. A população de moradores do Edifício “33
Andares” em Maputo, sobre a qual estamos interessados em estudar as seguintes
características populacionais: (1) Altura dos moradores; (2) Idades dos moradores.
Depois de medir a altura de cada morador e saber a idade, obtemos o seguinte um
conjunto de dados:
Saiba mais:
Quando é possível pesquisar toda a população, estamos perante um censo. 16
Exemplo 1.5: Se pretendemos saber o número de eleitores que podem votar nas
próximas eleições municipais de Maputo, a população em estudo é “Potenciais
eleitores na cidade de Maputo”.
Exemplo 1.6: Se pretendemos saber o número médio de aprovações em Estatística,
dos estudantes nas instituições do ensino superior em Moçambique após a
independência, a população em estudo será “Os aprovados a Estatística desde a
independência até à agora”.
17
Dificuldades económicas – estudar a toda população pode ser muito
dispendioso; Por exemplo: Estudar os sintomas que apresenta cada doente de
TB;
Dimensão infinita da população – Por exemplo: População constituída pelas
estrelas do Céu.
Processo destrutivo - O estudo da população pode provocar a destruição da
mesma; Por exemplo: Pretendendo ter a certeza sobre qual o palito que não
acende, estudar a população dos fósforos de uma caixa.
Precisa-se de maior precisão – nalguns casos é mais difícil estudar uma
população por esta não ser precisa;
Problemas de acesso – pode não existir vias de acesso para chegar à
população;
Instabilidade política – casos de guerra ou tumultos;
Problemas demográficos – quando a população está mais geograficamente
dispersa, etc.
h) Amostra
Se não é possível ou para se evitar estudar toda a população ou todos os seus
elementos, seleccionam-se só alguns deles, para servirem de amostra da população
em estudo. Para melhor entender a origem da amostra, leia o cenário abaixo:
Num Restaurante dois amigos conversam
- Mas que matapa saborosa estou a comer!
- Não estarás a tirar conclusões precipitadas? Ainda só comeste um bocadinho!
- A amostra que comi já é suficiente...
- Talvez tenhas razão, já que não é necessário comer matapa de todas folhas da
mandioqueira para concluir que ela é boa.
Amostra - é um conjunto de observações ou dados extraídos a partir de um
subconjunto ou parte da população, que se estuda com o objectivo de tirar conclusões
sobre toda população em estudo.
Exemplo 1.7: Relativamente à população das alturas dos alunos da 8ª Classe
matriculados na Escola Secundária de Jécua, na província de Manica, consideremos a
18
seguinte amostra, constituída pelas alturas (em cm) de 20 alunos escolhidos ao acaso
ou aleatoriamente:
145, 163, 157, 152, 156, 149, 160, 157, 148, 147, 151, 152, 150, 148, 156, 160, 148,
157, 153, 162.
Aprofundando…
Usa-se população quando é impossível conhecer as características de
todos os elementos da população. Por isso, torna-se necessário extrair uma
amostra ou parte dessa população, sobre a qual serão estudadas as
características. Para extrair a amostra e assegurar a sua representatividade
relativamente à população de onde foi extraída, existem métodos
estatísticos que constituem o objecto de estudo da teoria de amostragem.
Atenção!!!
Quando a amostra não representa, correctamente, a população, diz-se viciada. E a sua
utilização pode dar origem a interpretações e conclusões erradas.
A escolha de métodos apropriados de extracção da amostra assegura a possibilidade de se
tirarem conclusões sobre a população a partir da informação extraída da amostra. Este
constitui o objecto de estudo da inferência estatística.
19
1.1.2 Características da informação estatística
O conjunto das etapas para se preparar uma informação estatística é desde a recolha,
produção e divulgação dos dados ou resultados e sua posterior utilização. Estas etapas
constituem o circuito da informação estatística. Os principais intervenientes no circuito
da informação estatística são os utilizadores, fornecedores e os produtores de dados
estatísticos.
Utilizadores – Os governantes, homens de negócios, economistas e técnicos em
geral, têm a tarefa de seleccionar e analisar a informação de que necessitam para os
seus trabalhos. Cabe aos utilizadores, criticar e colocar opiniões aos produtores e
fornecedores de forma a melhorar a informação estatística.
Fornecedores – prestam informações de base, facultando aos produtores, dados que
lhes são solicitados pelos utilizadores.
20
Produtores – são entidades especializadas, que têm por objectivo a obtenção e
preparação da informação necessária ao conhecimento da realidade nos seus vários
domínios.
21
revestem-se de várias modalidades, e quando são quantitativos apresentam uma
modalidade com diferentes intensidades ou valores. Os atributos de uma população
podem ainda ser classificaos como dicotómicos quando tomam apenas dois valores
possíveis. Por exemplo, o sexo a que um grupo de inquiridos pertence é uma
característica dicotómica uma vez que só pode ter os valores masculino e feminino. Do
mesmo modo também uma pergunta sobre se os inquiridos conhecem ou não
determinado produto constitui uma variável dicotómica.
Exemplo 1.8: Vejamos um exemplo onde se apresentam diferentes atributos
associados a um determinado universo.
Universo Caractere/atributo
Conforme a natureza dos atributos, existem quatro escalas principais usadas para
medi-los:
22
importante dessas escalas, é a possibilidade de serem submetidas às quatro
operações aritméticas (adição, subtracção, multiplicação e divisão).
4) Escalas de Razão – são um caso especial das escalas ordinais, as quais são
também nominais hierárquicas. Assim a escala de razão é também uma escala
de intervalo dotada de zero absoluto.
23
LIÇÃO N°2
DISTRIBUIÇÃO DE FREQUÊNCIAS
Objectivos da Lição
24
1.2.1 Introdução à lição n° 2
25
1.2.2 Breves conceitos básicos
Dados brutos – são os dados originais que ainda não foram numericamente
organizados.
a) Dados brutos: 58 62 80 57 28 96 19 90 86 38 50 41 90 55
b) Rol: (ordem crescente) 19 28 38 41 50 55 57 58 62 80 86 90 90 96
c)
I Salário Frequência
1 2.500,00 2
2 3.000,00 4
3 3.460,00 3
4 4.000,00 1
Total n=10
26
Tabela 1.5: Distribuição de frequências das notas de 50 estudantes.
I Classes Frequências
1 00 – 04 2
2 04 – 08 7
3 08 – 12 10
4 12 – 16 14
5 16 – 20 12
6 20 – 24 4
7 24 – 28 1
Total - 50
Saiba mais…
As distribuições de frequências não agrupadas são utilizadas quando temos poucos
dados e o número das modalidades apresenta repetições. Se o número de dados
observados for grande é conveniente agrupar os dados em classes.
27
d) Frequência relativa acumulada (Fr) – é a soma da frequência relativa duma
ordem ou classe posterior com a frequência relativa anterior, partindo de cima
para baixo.
Procedimento
O procedimento é quase o mesmo, só mudamos de coluna passando a trabalhar com as colunas
das frequências relativas.
I xi fi fr fr% Fi Fr Fr%
1 2 3 0,12 12 3 0,12 12
28
1.2.3 Distribuição de frequências para dados agrupados
Para determinar essas classes não existe uma regra pré-estabelecida, sendo
necessário um pouco de tentativa e controlo de erro para a solução mais adequada.
Nalguns casos pode-se determinar intervalos arbitrários, segundo o interesse do
Analista, mas na maior parte dos casos usam-se certos pressupostos como veremos
abaixo:
162-168-173-168-179-183-167-186-177-187-174-164-177-159-177-173-163-
180-196-171-184-179-190-181-166-181-182-176-169-172-162-175-192-178-
177-200-191-188-168-165-193-175-160-180-187-176-170-156-174-179
Ponto médio de classe é o valor que representa a classe para efeitos de cálculo
29
Passo 1. Construir o rol.
Método 3. .
Exemplo 1.21: A partir dos dados da tabela 1.6, construir a tabela de distribuição de
frequências absolutas e determinar os pontos médios de classe.
Resolução:
Entendendo…
Caro aluno, como pode notar, para construirmos as classes da tabela abaixo, por
exemplo para a 1ª classe, usamos primeiro o menor elemento (156) como limite
inferior da classe e adicionamos a ele a amplitude de classe e obtemos assim
o limite superior (162) dessa mesma classe (156 – 162) . Na segunda classe o limite
superior da classe anterior torna-se inferior e nele adicionamos a amplitude da
classe e obtemos o limite superior da segunda classe. Assim o processo continua
até a ultima classe.
30
Tabela 1.7: Distribuição de frequências das alturas de 50 indivíduos.
Total - -
31
1.2.4 Representação gráfica
10
8
Frequencias absolutas - fi
Mean = 176,54
Std. Dev. = 10,16238
0 N = 50
150,00 160,00 170,00 180,00 190,00 200,00
Alturas média - Xi
32
Diagrama de barras
15
12
Frequencias absolutas - fi
0
159,15 165,45 171,75 178,05 184,35 190,65 196,95
33
LIÇÃO N°3
Objectivos da Lição
34
1.3.1 Medidas de Tendência Central
As medidas de tendência central têm o papel de indicar onde se encontra a maioria dos
dados. Existem três grupos de medidas que resumem um conjunto de dados
observados: medidas de tendência central, medidas de posição e medidas de
dispersão.
, para população.
Média artimética ponderada: esta define-se como soma de produtos dos valores da
variavel com as suas respectivas frequencias ou pesos, dividida pela soma das
frequencias ou pesos. , para amostra e , para populacao.
Moda (Mo) - é o valor da variável que ocorre com mais frequência (ou melhor, que se
repete mais vezes). Para casos em que o número das observações não é muito
elevado esta medida pode ser lida no rol.
De acordo com as frequências de cada valor observado, é possível ter mais de uma
moda (distribuição amodal): no caso de ter uma moda (distribuição unimodal), duas
(bimodal), três (trimodal), etc.
35
Quando temos dados agrupados em classe, a moda é calculada por aproximação,
começando por localizar a classe modal (classe com maior frequência absoluta), se
necessário deve-se conhecer a moda bruta. Formalmente usa-se a fórmula de
aproximação de Czuber para o cálculo da moda.
Onde:
18 23 19 18 20 21 22 18 32 23
Como pode se notar, o número total de dados é par, logo, temos dois dados que se
encontram na posição central, que são 20 e 21, então a média será a média artimética
dos dois, .
36
Onde:
Exemplo 1.23: Consideremos a tabela 1.8 abaixo, e a partir dela vamos determinar a
média artimética, moda e média da distribuição dos dados.
I Classes fi xi xifi Fi
1 10 – 20 10 15 150 10
2 20 – 30 20 25 500 30
3 30 – 40 35 35 1225 65
4 40 – 50 40 45 1800 105
5 50 – 60 25 55 1375 130
6 60 – 70 15 65 975 145
7 70 – 80 5 75 375 150
Total - - 6400 -
Cálculo da Média
Cálculo da Mediana
37
valor ele se aproxima de todos os valores que se encontram na coluna ), e por sinal,
localiza-se na classe , isto é, na . Então, a frequência absoluta acumulada
Cálculo da Moda
Para o cálculo da moda, vamos usar a fórmula anterior, e para o efeito, precisamos de
, que é a amplitude de classe. Olhando para 3ª coluna, coluna das frequências
absolutas, localizamos na linha o maior valor absoluto que é 40 (a maior
frequencia absoluta). Então, esta é a classe modal, logo, a frequência modal ,
a frequência anterior afrequencia modal será e a frequência posterior é .
O limite inferior da classe modal é dado por . Deste modo:
.
a) Distribuições simétricas:
b) Distribuições com assimetria positiva:
c) Distribuições com assimetria negativa:
Karl Pearson desenvolveu uma fórmula empírica da relação entre as três medidas de
localização, a média (ponto de equilíbrio), a moda (ponto de máxima frequência) e a
mediana (ponto do meio).
38
1.3.1.4 A média e os valores extremos
: 1, 1, 1, 1, 2, 2, 3, 5, 20
A nota média desses 9 alunos é 4. Mas o que aconteceria se o aluno com nota igual a
20 valores fosse retirada da amostra? O valor da média decaria para 2 valores, o que
parece mais razoável olhando para a distribuição das notas da maioria dos alunos, pelo
que, se pode afirmar que a média 2 descreve melhor esse conjunto de dados.
Este exemplo, ilustra como a média é vulnerável ao efeito de valores extremos. Neste
caso, é recomendado utilizar a mediana, por ser um valor mais perto do centro da
distribuição, e não susceptível de influências.
39
1.3.2 Medidas de Posição
Assim como as medidas de tendência central tem por objectivo fornecer indicadores do
local onde a maioria dos dados se concentra, por sua vez, as medidas de posição tem
por objetivo, indicar onde é o ponto de corte para uma certa posição. As medidas mais
usadas são os quartis e suas versões mais gerais, decís e percentis.
Quartís (Quantís)
Quartil: Como foi tratado atrás nas medidas de tendência central, a mediana divide um
conjunto de dados em duas partes iguais, os quartis dividem o conjunto de dados ou
distribuição de frequências em quatro partes iguais.
- deixa 25% dos elementos, coincide com a mediana e deixa 50% dos elementos,
e deixa 75% dos elementos.
, onde
Onde:
é a ordem do quartil;
40
Frequência acumulada ate a classe anterior a classe onde existe o quartil;
Decis - os decis são separatrizes que dividem o conjunto dos dados em 10 partes
iguais. Quando os dados não são agrupados, primeiro devemos colocá-los em forma
de rol como fizemos para o caso de quartis. A fórmula para o cálculo de decis é
, onde .
, onde .
Percentis - são separatrizes que dividem a amostra em 100 partes iguais. Para dados
não agrupados, para calcular o percentil de ordem usamos a fórmula
onde . Enquanto que para dados agrupados usamos a fórmula abaixo.
, onde .
I Classes(xi, m) fi Fi
1 1,40 – 1,46 7 7
2 1,46 – 1,52 9 16
3 1,52 – 1.58 5 21
4 1,58 – 1,64 12 33
5 1,64 – 1,70 26 59
6 1,70 – 1,76 20 79
7 1,76 – 1,82 11 90
Total -
41
a) Determine os valores das separatrizes Me, Q1, D3 e P80 e comente os resultados.
Resolução:
Mediana
Mediana: .
Q1
1º Passo: Para determinarmos o primeiro quartil, temos antes de tudo que determinar a
classe onde se localiza o primeiro quartil e como este divide a distribuição das
frequências em 4 partes iguais teremos .
Então: .
D3
42
P80
1º Passo: Por último, vamos determinar o percentil 80, e para o efeito temos de
localizá-lo calculando: .
. Entao .
Resposta:
Dos 100 estudantes, 50% destes tem uma estatura inferior a 1,68 m, 25% dos
estudantes possuem altura inferior a 1,60 m, 30% dos estudantes possuem altura
menor que 1,63 e só 20% dos 100 tem altura igual ou superior a 1,77 m.
43
LIÇÃO N°4
MEDIDAS DE DISPERSÃO
Objectivos da Lição
44
1.4.1 Introdução à lição n°4
Como se sabe, os fenómenos cuja análise intervêm o método estatístico bem como os
dados estatísticos a eles referentes, caracterizam-se tanto pela sua semelhança quanto
pela sua variabilidade. Assim, o cálculo de um promédio sobre um conjunto de dados
tem sentido, caso contrário, não teria sentido calcular a média de um conjunto de
dados onde não haja variação dos seus elementos.
45
1.4.2 Breves conceitos básicos
Exemplo 1.27: Calcular a variância das notas obtidas num teste realizado para 50
estudantes com os dados apresentados na tabela 1.10 abaixo .
1 8 7 56 -2,64 48,7872
2 9 8 72 -1,64 21,5168
3 10 9 90 -0,64 3,6864
5 12 8 96 1,36 14,7968
6 13 4 52 2,36 22,2784
7 14 4 56 3,36 45,1584
46
De igual modo para dados agrupados em classe usamos: .
Quando se trabalha com uma amostra e não com uma população (caso mais frequente
na inferência estatística), ou quando o número das unidades observadas não é grande,
isto é, ( ), para se obter uma melhor estimativa, usa-se o desvio padrão corrigido:
.
Exemplo 1.27: Calcular o desvio padrão e o seu valor corrigido nas alíneas seguintes:
Este exemplo, mostra que quanto mais aumentamos o número dos elementos na
amostra, a diferença entre os desvios torna-se cada vez menor.
Atenção…
47
Exemplo 1.28: Calcular o desvio padrão e o seu valor corrigido nas seguintes alíneas:
a)
1 2 4 8 10.50
1 3 10 30 40.0
2 3 9 27 3.46
2 4 15 60 15.0
3 4 8 32 1.16
3 5 30 150 0.0
4 5 3 15 5.71
4 6 15 90 15.0
5 6 2 12 11.33
5 7 10 70 40.0
_ 26 94 32,16
_ 80 400 110,0
a) b)
Este exemplo, mostra que quanto mais aumentamos o número dos elementos na
amostra, a diferença entre os desvios torna se vez menor.
Os coeficientes de variação são medidas de variação relativa que muitas vezes são
expressadas em percentagem. Eles resultam do quociente entre uma medida de
dispersão absoluta e um promédio.
48
Diz-se que a dispersão é pequena quando: o coeficiente for menor ou igual à 10%; a
média de dispersão for maior que 10% e menor ou igual à 20%. E diz-se que é grande
quando for maior que 20%.
Caro aluno!
Exemplo 1.29: Vamos considerar a situação abaixo de uma turma cujos alunos
realizaram dois testes:
1 12 2.4 0.2/
2 9 1.9 0.2/
49
Leituras Obrigatórias
Na lição nº 4 os temas seguintes não foram tratados: Medidas de forma de
distribuição de frequências (momentos); Assimetria de uma distribuição e seus
coeficientes e Curtose… Pelo que nas referências bibliograficas abaixo, poderás
encontrar os temas acima citados.
Leia também o livro do Allen Webster, pag. 57-58, que é sobre distribuição Normal e
Distribuição Empírica. Este tema fala do uso do desvio padrão para verificar se dados
a serem estudados são normalmente distribuidos.
Leituras Complementares
A partir da leitura dos livros que lhe recomendamos abaixo, com textos que constituem
o que chamamos por leituras complementares, o nosso maior objectivo é, que o
estimado aluno conheça outras abordagens dos temas, por si estudados ao longo da
primeira unidade, para dar mais subsídios e enriquecer os teus conhecimentos nesta
área. Seja exigente consigo mesmo: evite ler os textos apenas para resolver os
exercícios. A leitura complementar enriquece e facilita o seu entendimento cabal sobre
o conteúdo estudado.
Texto 1
Reis, Elizabeth. Estatística Descritiva. Lisboa, 2005.
Parte 1: De p.15 à p.60;
Parte 2: De p.63 à p.131;
Texto 2
Webster, Allen L. Estatística Aplicada à Administração e Economia. São Paulo:
McGraw-Hill, 2006.
De p.3 à p.61
50
PARTE II - INFERÊNCIA ESTATÍSTICA
Lembre-se que:
51
UNIDADE TEMÁTICA II
Objectivos da Unidade
Ao fim desta unidade, deves ser capaz de:
1. Definir probabilidade;
2. Descrever as abordagens clássica, frequencista e subjectiva da probabilidade;
3. Explicar os termos experimento, espaço amostral e evento;
4. Definir os termos probabilidade condicional e probabilidade conjunta;
5. Calcular probabilidades aplicando as regras de adição e multiplicação;
6. Determinar o número de possíveis permutações e combinações;
7. Aplicar a análise combinatória na resolução de problemas;
8. Calcular uma probabilidade usando o Teorema de Bayes;
52
Introdução
53
LIÇÃO N°5
PROBABILIDADES
Objectivos da Lição
54
2.5.1 Breves Conceitos Básicos
Exemplo: lançar uma moeda duas vezes, podendo ter como resultados possíveis
(espaço amostral): . Onde representa a saída de cara, e , a saída da
coroa.
Nota: O exemplo descrito acima faz parte de diversas experiências que podem ser
feitas, tendo o imprevisível resultado dentro dos casos possíveis.
55
Cumprindo-se os três pressupostos dizemos que estamos perante um experimento. Se
estás a trabalhar num computador e lhe dizem que dentro de dez minutos não haverá
energia eléctrica, já pode prever o resultado de que o computador irá desligar.
A teoria das probabilidades opera sobre os fenómenos aleatórios e na maior parte dos
casos sobre experimentos. Será que o jogador citado, no exemplo acima, ao chutar a
bola vai mesmo marcar? Neste caso recorremos à teoria das probabilidades, pois ela
tenta dar significado a experimentos tais que o resultado não pode ser completamente
pré-determinado. “Atente para o facto de que pré-determinado não significa pré-
definido”. Calcular a probabilidade é medir a incerteza ou associar um grau de
confiança aos resultados possíveis. Por exemplo, escolha uma carta qualquer num
baralho depois de ter sido bem baralhado, para garantir que todas as cartas tenham a
mesma possibilidade de serem seleccionadas. O que é mais provável sair, uma figura
ou sair um dois de espadas?
A frequência relativa usa a informação passada que foi observada empiricamente. Ela
observa a frequência com que algum evento ocorreu no passado e estima a
probabilidade dele ocorrer novamente. A probabilidade de um evento com base
frequrncia relativa é dada por:
Frequência relativa:
Por exemplo, assuma que durante o último mês ocorreram 50 nascimentos no hospital
do seu bairro. Trinta e dois (32) bebês recém nascidos eram meninas. A frequência
relativa revela que a probabilidade de que um próximo nascimento (ou qualquer
nascimnto escolhido aleatoriamente) seja de uma menina é:
56
Em muitas ocasiões os dados anteriores não estão disponíveis e, portanto, não é
possível calcular a probabilidade a partir do desempenho anterior. A única alternativa é
estimar a probabilidade utilizando o seu melhor julgamento. Esta aproximação
subjectiva associa probabilidade aos eventos com base na avaliação da melhor
evidência. A aproximação subjectiva é usada quando queremos associar
probabilidades a um evento que nunca ocorreu. A probabilidade de que uma mulher
será eleita presidente da republica de Moçambique é um exemplo. Visto que não há
dados do passado, devemos avaliar nossas opiniões e crenças para obter uma
estimativa subjectiva.
a)
b)
c) ,
57
Exemplo 2.3:
Como podemos ver a intersecção dos subconjuntos e é vazia, isto significa que no
lançamento de um dado não podemos ter a face par e impar ao mesmo tempo.
Exemplos:
Exemplo:
Nota: Quando um elemento coexiste nos dois conjuntos, deve ser escrito (participar)
uma única vez no conjunto solução da reunião.
Exemplo 2.4:
Exemplo 2.5:
58
Diz-se que é um acontecimento complementar de se é formado por todos
elementos do espaço amostral excepto os existentes em . Escreve-se .
Para o nosso exemplo o . Também pode-se designar de ou ao
complementar de .
1.
2.
3.
Uma probabilidade é expressa como um número decimal, tal como 0,70 ; 0,27 ; ou
0,50. Entretanto ela pode ser representada como uma percentagem tal como 70 %, 27
% ou 50 %.
Caro aluno!
Note que: Nunca se diz porcentos, p. ex: 2, 3, … porcentos, mas sim porcento.
O valor de uma probabilidade está localizado no intervalo de números reais que vai de
0 a 1, inclusive as extremidades deste intervalo.
59
Definição clássica de Probabilidade: Dado um evento associado a um experimento
aleatório com espaço amostral , a probabilidade do evento A denotada por éo
quociente:
60
LIÇÃO N°6
ANÁLISE COMBINATÓRIA
Objectivos da Lição
61
2.6.1 Factorial de um número
Seja n um número inteiro não negativo. Define-se factorial de n (indicado pelo símbolo
n! ) como sendo: e lê-se:
n factorial.
Casos Especiais
Exemplo 2.6:
a) Lê-se 6 factorial
b) Lê-se 4 factorial
Se uma tarefa pode ser realizada em etapas diferentes, e se a primeira etapa pode
ocorrer de maneiras diferentes, a segunda de maneiras diferentes, e assim
sucessivamente, então o número total T de maneiras de realização da tarefa é dado
por: .
Exemplo 2.7:
O INAV (Instituto Nacional de Viação) tem como norma mandar colocar placas de
matrícula nos veículos automóveis usando-se 3 letras do alfabeto (sendo a primeira
letra M) e 4 algarismos. Qual o número máximo de veículos que poderão ser
licenciados?
Resolução:
62
Usando o Princípio fundamental da contagem, podemos imaginar uma placa do tipo
MLN 10 15. Como o alfabeto possui 26 letras e o sistema numérico possui 10
algarismos (de 0 a 9), podemos concluir que: para a 1ª posição, temos 1 (uma)
alternativa que é a letra M, como pode haver repetição, para a 2ª, e 3ª também, estas
duas últimas terão 26 alternativas cada. Com relação aos algarismos, concluímos
facilmente que temos 10 alternativas para cada um dos 4 lugares. Podemos então
afirmar que o número total de veículos que podem ser licenciados será igual a:
que resulta em 6.760.000.
Atenção… Observe que quando o número de veículos ultrapassar o valor acima,
ainda que seja por 1, p.ex: 6.760.001 veículos, todos com matricula nacional, o
sistema de codificação para atribuição de matrículas terá de ser modificado, já que
não existiriam números de matrícula suficientes para todos os veículos.
63
Solução: Temos 14 elementos, dos quais 4 estão repetidos. Observe que a letra “o”
aparece duas vezes, a letra “r” duas também, a letra “e” três vezes e a letra “n” duas
vezes. Na fórmula anterior, teremos: (nº de elementos)
Resolução:
64
resultado: .
Resumo…
Objectivos da Lição
66
2.7.1 Considerações sobre leis, axiomas e teoremas:
1.
2.
3.
4. , se , i.e, e são mutuamente exclusivos
5. , se , i.e, e não são
mutuamente exclusivos
6. e são independentes
7. ou e são
independentes
8. ocorre depois de ter ocorrido. Este caso, define
Probabilidade Condicional.
9.
10.
11.
Exemplo 2.13: Na zona do Bairro Canongole em Tete, existem duas padarias, uma
produzindo pães de forma, e outra, arrufadas. Nesta zona, que se dedica
essencialmente à venda de cabritos, 9,8% dos residentes compram sempre pão de
67
forma, 22,9% compram sempre arrufadas e 5,1% compram sempre ambos tipos de
pães. Determine a probabilidade de:
Resolução:
68
Exemplo 2.14: Um grupo de pessoas é classificado de acordo com o seu gosto pela
bebida alcoólica, e a incidência na qualidade de violência que possa praticar. As
proporções das diversas categorias, aparecem na tabela seguinte:
Resolução:
Prezado aluno!
69
conjunta de que os dois eventos ocorram é obtida pela multiplicação da probabilidade
de que o evento ocorra pela probabilidade condicional de , dado que ocorreu.
Pela notação simbólica temos que: . Alternativamente,
podemos também escrever: .
Resolução:
70
acontecimentos, pela correspondente probabilidade condicional do acontecimento ,
isto é:
Dados
Resolução
Resposta:
Resolução
71
Resposta: A probabilidade de que um trabalhador conhecedor da matéria tenha nível
superior é de 0,4067797.
72
Leituras Complementares
A partir da leitura dos livros que lhe recomendamos abaixo, com textos que constituem
o que chamamos por leituras complementares, o nosso maior objectivo é, que o
estimado aluno conheça outras abordagens dos temas, por si estudados ao longo da
primeira unidade, para dar mais subsídios e enriquecer os teus conhecimentos nesta
área. Seja exigente consigo mesmo: evite ler os textos apenas para resolver os
exercícios. A leitura complementar enriquece e facilita o seu entendimento cabal sobre
o conteúdo estudado.
Texto 1
Reis, Elizabeth; Melo, Paulo; Andrade, Rosa e Calapez, Teresa. Estatística Aplicada.
Lisboa, 2001.
Cápitulo II: De p.29 à p.80;
Texto 2
Webster, Allen L. Estatística Aplicada à Administração e Economia. São Paulo:
McGraw-Hill, 2006.
Capítulo IV: De p.72 à p.90.
73
UNIDADE TEMÁTICA III
VARIÁVEIS ALEATÓRIAS
Objectivos da Unidade
No fim desta unidade, deves ser capaz de:
1. Distinguir conceito de variavel aleatória discreta da contínua;
2. Caracterizar a função ou lei de distribuição de probabilidades;
3. Entender o conceito de distribuição acumulada e suas propriedades;
4. Entender as propriedades da esperança matemática e da variância;
5. Caracterizar a função de distrbuição acumulada das variáveis contínuas;
6. Entender as propriedades da função de distribuição;
7. Entender o conceito de função de densidade de probabilidades e suas
propriedades;
8. Descrever as características das variáveis contínuas;
9. Saber calcular as características das variáveis contínuas;
74
Lição Nº 8
Objectivos da Lição
75
3.8.1 Conceito de Variável Aleatória
Exemplo 3.1:
76
Assim, os possíveis valores de (número de caras) serão: . Da
definição de uma variável aleatória , neste experimento, é uma variável aleatória
discreta. Seus valores são resultados de uma contagem.
Amigo aluno!
Como varia num espaço finito, para várias experiências repetidas, a cada um dos
valores de que pode tomar a variável aleatória , corresponde a uma probabilidade
:
77
3.8.1 Função ou Lei de Distribuição das Probabilidades
Diz-se que está definida uma Lei de Distribuição das Probabilidades (ou Função
Redistribuição de Probabilidades - FRP) de uma variável aleatória se existe
correspondência entre todos os valores possíveis de e as suas respectivas
probabilidades , e é, usualmente, dada na forma de uma tabela.
…
…
Exemplo 3.3: Uma empresa comercializa garrafas de vinho verde de 1 litro. Supõe-se
que 40% dessas garrafas na realidade contém uma menor quantidade de líquido do
que o indicado no rótulo. Tendo comprado 6 dessas garrafas, qual é a probabilidade
de:
a. Duas delas conterem menos de um litro?
b. No máximo duas conterem menos de um litro?
c. Pelo menos duas conterem menos de um litro?
d. Todas conterem menos de um litro?
e. Todas conterem o volume indicado no rótulo?
f. Represente a lei das probabilidades numa tabela.
a)
b)
c)
d)
e)
f) Para escrever a lei de distribuição de probabilidades é necessário conhecer as
probabilidades :
78
A lei pedida é:
0 1 2 3 4 5 6
0.0467 0.1866 0.3110 0.2765 0.1382 0.0369 0.0041
1 3 6 8
79
O comportamento de uma variável aleatória discreta numa lei de distribuição de
probilidades é definido pela sua função massa de probabilidade (f.m.p) que,
simplesmente, associa uma probalidade a cada valor que a variável possa
assumir. Deve-se notar que, três propriedades fundamentais das propabilidades são
também aqui válidas.
Propriedades 1:
Propriedades 2:
Propriedades 3:
80
Propriedades da função de distribuição acumulada
Exemplo 3.6: Dada a lei de distribuição de uma variável aleatória , escrever a sua
função de distribuição acumulada das probabilidades.
1 3 5 7
0.25 0.25 0.40 0.15
81
LIÇÃO N° 9
Objectivos da Lição
82
3.9.3 Características Numéricas das Variáveis Aleatórias Discretas
Como
Então
Desta definição, pode-se notar que é a medida aritmética ponderada dos valores
da variável aleatória: para os pesos que correspondem as
frequências relativas.
Exemplo 3.7: Um jogador lança duas moedas honestas. Ele ganha 200 contos se
ocorrem duas caras e 100 contos se ocorre uma cara, por outro lado, ele perde 300
contos se não ocorrer nenhuma cara. Pede-se para:
a) Escrever a lei de distribuição das probabilidades desde jogo.
b) Determinar o valor esperado do jogo e dizer se ele é favorável ao jogador.
Resolução:
O espaço amostral deste jogo tem 4 possibilidades:
Sendo cara e coroa.
a) Do espaço S, as probabilidades de sair duas caras, uma cara e nenhuma cara
são:
Número de caras
0 0,25
1 0,50
2 0,25
b) contos.
83
O valor esperado do jogo é de 25 contos e é favorável ao jogador.
Propriedades da esperança matemática
Resolução:
ou melhor
Exemplo 3.8: A variável aleatória , se caracteriza pela seguinte lei de distribuição das
probabilidades.
84
a) Determinar a esperança matemática, variância e desvio padrão.
Resolução:
Esperança matemática:
Variância:
Desvio padrão:
Propriedades da variância
85
LIÇÃO N° 10
Objectivos da Lição
86
3.10.1 Conceito de Variável Aleatória Contínua
Diz-se que uma variável aleatória é contínua, quando ela pode tomar qualquer valor
real pertencente a um intervalo dado de forma contínua, por exemplo, no intervalo
.
Seja , a variável aleatória que indica a temperatura máxima diária em Tete. Possíveis
valores são entre - , por exemplo, 36.1573 (contínua), pois resulta de uma
medição, pelo que, estamos na presença de uma Variável Aleatória Contínua (VAC).
Em geral, esta probabilidade tende para zero quando o acréscimo da variável tende
para zero , i.é, a probabilidade de uma variável aleatória contínua (v.a.c.) obter
exactamente um valor é nula. Daí que, podemos concluir que a noção de distribuição
de probabilidades deixa de ter sentido para uma variável contínua. Porém, a função de
distribuição conserva todo o seu significado.
Deve-se notar que para v.a.c, a função de distribuição ou de partição poderá ter
expressões em em alguns intervalos de seu domínio.
87
Propriedade 1: Os valores de pertencem ao intervalo
Corolário 2.1: A probabilidade de que uma v.a.c assuma um valor num intervalo
é igual ao acréscimo da função de distribuição de neste intervalo.
para ou
para ou
a) Inferior à 0.2 ;
b) Inferior à 3;
c) Igual ou superior a 3;
d) Igual ou superior a 5;
Resolução:
88
d) Para acontecimentos complementares , e para ,
cumpre-se que , então obtemos:
Por outro lado, se a função de distribuição pode ser expressa sob forma analítica
e se for derivável, então:
89
A probabilidade aqui calculada, tomando como uma função contínua, representa
uma área limitada pelo gráfico da função pelo eixo e pelos limites inferior e
superior do intervalo dado. Vejamos as figuras:
f(x)
f(x)
a b
Propriedade2: A área total limitada pela função densidade de probabilidade e pelo eixo
é igual a unidade ou 100%.
De um modo geral, o conjunto dos valores admissíveis para uma v.a.c e a função
correspondente definem uma distribuição teórica contínua, que é uma forma idealizada
das distribuições observadas agrupadas e relativas a variáveis contínuas.
Rigorosamente, quando o número de classe aumenta, o polígono de distribuição de
90
frequências acumuladas aproxima-se a uma linha cuja equação é a função de
distribuição.
Exemplo 3.10: Seja uma variável aleatória contínua com a seguinte função
densidade de probabilidade:
Resolução:
Para
Para
Para
Exemplo 3.11: Uma variável aleatória contínua tem a seguinte função densidade de
probabilidade:
91
Resolução:
Para
Para
Para
92
LIÇÃO N° 11
Objectivos da Lição
93
3.11 Características Numéricas das Variáveis Aleatórias Contínuas
na qual passando uma variável pela mediana, divide a figura compreendida sob o
gráfico de em duas partes iguais.
94
Todas as propriedades da variância mencionadas para as variáveis aleatórias discretas
são válidas para as variáveis aleatórias contínuas.
O desvio padrão de uma variável aleatória contínua é definido, no caso discreto, como
sendo:
Exemplo 3.12: Seja X uma variável aleatória contínua com função de densidade de
probabilidades seguinte:
a) Esperança:
b) Variância:
c) Desvio padrão:
95
Leituras Complementares
A partir da leitura dos livros que lhe recomendamos abaixo, com textos que constituem
o que chamamos por leituras complementares, o nosso maior objectivo é, que o
estimado aluno conheça outras abordagens dos temas, por si estudados ao longo da
primeira unidade, para dar mais subsídios e enriquecer os teus conhecimentos nesta
área. Seja exigente consigo mesmo: evite ler os textos apenas para resolver os
exercícios. A leitura complementar enriquece e facilita o seu entendimento cabal sobre
o conteúdo estudado.
Texto 1
Reis, Elizabeth; Melo, Paulo; Andrade, Rosa e Calapez, Teresa. Estatística Aplicada.
Lisboa, 2001.
Capítulo III: De p.89 à p.140;
96
UNIDADE TEMÁTICA IV
Objectivos da Unidade
No fim desta unidade, deves ser capaz de:
1. Descrever distribuições discretas;
2. Caracterizar as distribuições Binomial e de Poisson;
3. Descrever as distribuições contínuas;
4. Descrever e entender a distribuição uniforme;
5. Caracterizar as distribuições exponencial, normal e normal padrão;
6. Definir a função distribuição acumulada;
7. Resolver problemas de probabilidade usando distribuição normal
padronizada;
8. Descrever aproximações de distribuição binomial para de poisson e normal;
97
LIÇÃO N° 12
Objectivos da Lição
98
4.12 Introdução
99
Função - é a função de distribuição de probabilidades. A distribuição
Binominal é interpretada como sendo a distribuição do número de x sucesso “ ”, ou
fracasso , em uma série de provas independentes de um experimento
aleatório.
Para entendermos melhor o que é uma distribuição binomial, que tal, resolvermos juntos o
problema a seguir de uma família? Presta atenção à questão colocada e aos passos de resolução:
Exemplo 4.2: Uma família tem 3 crianças. Se a probabilidade de uma criança ser
menino for 0.5 , encontrar a probabilidade de existir exactamente 2 meninos na família.
Resolução: Dados: ; ;
Aqui está a tabela da lei de distribuição das probabilidades para a questão do exemplo 4.2
0 1 2 3 …
Não só é importante saber o que é uma distribuição binomial mas também é necessário
compreender como ela se comporta. Estamos para falar das suas propriedades.
3. Desvio padrão:
Veja este exemplo (4.3): Um estudante tem 60% de probabilidade de obter positiva
sempre que realiza um teste. Se o estudante realizar 3 testes, calcule a probabilidade
de ele obter:
100
b) Pelo menos uma positiva.
c) No máximo duas positivas.
d) Escreva a lei de distribuição das probabilidades dos números de positivas que o
estudante possa obter.
e) Calcule a média e a variância da distribuição.
Resolução:
Dados:
a)
b)
=0,288+0,432+0,216=0,936
Tabela 4.2:
a) Média: Variância e
desavio padrão:
101
é o número de sucesso do acontecimento em n
provas independentes. De salientar que x pode assumir valores inteiros: x
= 0, 1, 2,…
é o número médio de ocorrências com sucesso.
- é a base do logarítmo natural: “e” = 2.71828128.
Resolução:
Dados
Livros
Exemplo 4.5: Certo posto de bombeiros recebe em média 3 chamadas por 3 dia.
Calcular a probabilidade de:
a) Receber 4 chamadas num dia.
b) Receber 3 ou mais chamadas num dia.
c) Encontre o desvio padrão do número das chamadas que
o posto possa receber num dia.
Resolução:
Dados:
a)
102
b)
c)
Tabela 4.3:
0 1 2 3 4 5
0.366 0.370 0.185 0.0610 0.0149 0.0029
0.366 0.368 0.184 0.0613 0.0153 0.0031
A importância da Distribuição de Poisson decorre pelo facto dela constituir uma boa
aproximação para processos de eventos aleatórios. Assim, ela serve de um modelo
bastante utilizado para a análise do número de chamadas telefónicas num terminal,
números de erros tipográficas na página de um livro, números de cheias observadas
em certo intervalo de tempo, número de acidentes industriais, número de chegadas em
modelos de filas de espera, etc.
103
Leituras Obrigatórias
Texto 1
Webster, Allen L. Estatística Aplicada à Administracao e Economia. São Paulo:
McGraw-Hill, 2006.
Texto 2
Reis, Elizabeth; Melo, Paulo; Andrade, Rosa e Calapez, Teresa. Estatística Aplicada.
Lisboa, 2001.
O capitulo IV: De pagina 161 a pagina 216;
104
LIÇÃO N° 13
Objectivos da Lição
105
4.13 Distribuições de Variáveis Aleatórias Contínuas
1,0 a b
106
Figura 4.1: Função densidade de probabilidade é função de distribuição acumulada de
distribuição uniforme.
Probabilidade da distribuição
2) Variância:
3) Desvio padrão:
Resolução:
Seja , uma variável que representa um ponto no segmento A função densidade
da variável é dada por se , caso
contrário, , então, pode-se escrever:
De onde
107
b) Escreva a função de distribuições acumuladas das
probabilidades;
c) Qual é a probabilidade de um anúncio ter uma duração
inferior a 8 minutos, e de ter entre 8 e 10 minutos.
d) Calcule a duração média dos anúncios.
Resolução:
c)
d)
108
A probabilidade de que uma variável aleatória contínua , cuja função densidade de
probabilidade é dada pela distribuição exponencial, assuma um valor num intervalo
é igual a:
F(x) F(x)
1.0 1.0
0.5
0.5
0.0 0.0
Variável x Variável x
Resolução:
109
a)
b)
c)
Uma variável aleatória contínua, diz-se que, é normalmente distribuída se a sua função
densidade de probabilidade é definida pela seguinte expressão:
valores de z
110
Se a variável normal com média e variância , for expressa em unidade reduzidas
(escores reduzidos), através da variável , onde pode-se mostrar que é
também normal com média E(z) = 0 e variância (z)=1.
111
Figura 4.4: Simetria da curva normal e a ordenada máxima da função
112
LIÇÃO N° 14
Objectivos da Lição
113
4.14 Função de distribuição acumulada das probabilidades
Resolução:
114
Caso 2: A probabilidade de que uma variável aleatória normal , assuma um valor no
intervalo sendo e valores não padronizados é dada pela fórmula.
P( )
onde:
Resolução:
Dados:
a) Vamos primeiro calcular os escores reduzidos e
b) P( ) então
115
Resolução:
Dados:
Comecemos por encontrar o valor correspondente de :
-3 -2 -1 -0,4 0 1 2 3
Caso 4:
Exemplo 4.12: Calcule a probabilidade de que assuma valor maior que -1.38.
Resolução:
P( )
-3 -2 -1 0 1 2 3
116
4.14.1 Aproximação entre Distribuições
Resolução:
Dados:
a) , então:
b)
117
Resolução:
a) Consideremos sucesso o número de caras k obtidas no lançamento, então:
onde n : ;
.
; para
A média e a variância são: Logo:
. Então: .
Como estamos a aproximar a distribuição de uma variável discreta par à uma variável
contínua, é necessário corrigir os limites do intervalo de classe das probabilidades,
transformando-os para contínuos.
Resolução:
, precisa-se que:
a) P( )
118
b) Usando aproximação normal: ,
. Os valores correspondentes de e
são e .
Substituindo os escores reduzidos na anterior temos:
Tabela 4.4:
Distribuição Condições dos Aproximação
Parâmetros
ou
ou
119
Leituras Complementares
A partir da leitura destes livros, que chamamos por leitura complementar, o nosso
maior objectivo é que você possa conhecer outros enfoques dados aos temas
estudados, ao longo desta unidade, que contribuirão para enriquecer e dar subsídios
para a sua formação nesta area.
Atenção, evite ler os textos apenas para responder aos exercícios. A leitura enriquece
e facilita o seu entendimento global do conteúdo desenvolvido.
Texto 1
Reis, Elizabeth; Melo, Paulo; Andrade, Rosa e Calapez, Teresa. Estatística Aplicada.
Lisboa, 2001.
O capitulo IV: De pagina 161 a pagina 243;
Texto 2
Webster, Allen L. Estatística Aplicada à Administração e Economia. São Paulo:
McGraw-Hill, 2006.
Nota: A leitura do livro do Allen Webster neste caso é obrigatória para puderes
aprofundar os teus conhecimentos sobre Distribuição Normal.
120
UNIDADE TEMÁTICA V
Objectivos da Unidade
Ao fim desta unidade, o aluno deve ser capaz de:
1. Precisar o conceito de amostra aleatoria;
2. Caracterizar as várias formas de amostragem;
3. Determinar o tamanho da amstra;
4. Caracterizar distribuições amostrais;
121
LIÇÃO N° 15
Objectivos da Lição
122
5.15 Introdução
123
- São considerados parâmetros populacionais os valores característicos de uma
população: a média ( ), desvio padrão ( ), coeficiente de correlação ( ),
proporção ( ), etc.
124
6. Escolha do metodo de amostragem conveniente;
7. Selecção da amostra;
8. Processamento e controle
9. Realizacao das inferencias e divulgacao dos resultados.
A validade das conclusoes tiradas numa amostra sobre uma populacao, depende do
facto da amostra ter sido bem escolhida e ter um tamanho representativo da
populacao. Portanto, para que a informacao obtida numa amostra seja
verdaderiamente valida e necessario que a correspondente amostra bem como no
metodo usado para a escolha dos elementos que devem pertencer a amostra.
Há, contudo, dois métodos gerais para obter (ou extrair) as realizações da amostra:
sem reposição e com reposição.
Nas extrações com reposição, as uidades seleccionadas aleatoriamente são
devolvidas à base de sondagem e ficam disponíveis para a escolha seguinte. Enquanto
que nas extrações sem reposição, as unidades uma vez escolhidas, nunca mais
podem voltar a ser seleccionadas.
125
LIÇÃO N° 16
Métodos de Amostragem
Objectivos da Lição
126
5.16 Metódos de Amostragem
Entre muitos metodos usados nas pesquisas, podem-se classificar dois tipos principais
de metodos de seleccao de elementos para a composicao da amostra: metodos
probabilisticos e metodos nao probabilisticos.
1º - Possuir um lista completa dos elemento que formam a população, isto é, enumerar
os elementos de 1 ate .
Resolução:
070 089 097 055 039 050 082 007 048 015
127
008 053 021 020 017 075 083 041 028 051
Os elementos da lista cujos números coincidem com esta serie, serão seleccionados
para formar a mostra.
Como já podes observar, este processo, embora ofereça segurança, precisa de certo
domínio no uso das tabelas de números aleatórios. Um procedimento de uso corrente
baseia-se no sorteio de papelinhos que são baralhados num recipiente, o uso da roleta
de lotaria, roleta giratória com números fixos, etc.
Quer num, quer noutro caso, se o elemento seleccionado não for devolvido, a
amostragem é sem reposição.
Esta é uma variação da amostragem aleatória simples. Sua aplicação requer que a
população seja ordenada segundo um determinado critério, de tal modo que, cada
elemento seja identificado pela posição. O processo de extracção dos elementos
consiste em escolher, ao acaso, o primeiro elemento. Os restantes são obtidos
sistematicamente mediante uma progressão aritmética de razão k.
Procedimento
Exemplo 5.2: Num determinado prédio da cidade de Maputo existem 46 famílias. Certo
investigador escolheu aquele prédio para inquirir 15 famílias sobre a situação social
dessas famílias. Usando um processo de amostragem sistemática, determine os
números das flats que deverão ser inquiridas.
Resolução:
É a razão de progressão.
Os números a sortear são 1, 2, 3. Seja 2 o número escolhido:
128
5;
... ...
As flats que devem pertencer a amostra ou ser inquiridas tem os números seguintes:
Exemplo 5.3 Um estudo deve ser feito para se apurar o aproveitamento anual nas
escolas. Para isso, o Ministério da Educação tem uma população de 7000 alunos
129
distribuídos por 4 níveis de ensino: 3000 são do ensino primário, 2000 do ensino
secundário, 1500 do ensino médio e 500 são do ensino superior. A direcção dos
estudos estatísticos do Ministério estimou que amostra deve ter no mínimo 700 alunos
para se considerar representativa.
Resolução
a)
Ensino primário:
Ensino secundário:
Ensino médio:
Ensino superior:
130
Amostragem por conglomerados consiste em dividir a população em subgrupos, que se
excluem um a outro, exaustivos de acordo com as variáveis que caracterizam o
universo e com aproximadamente o mesmo número de elementos. Sorteia-se alguns
conglomerados, e em seguida, estuda-se todos os elementos dos conglomerados ou
clusters.
Este método é vantajoso quando é difícil construir uma base de sondagem, isto é, a
operação de preparação de listagem de todos os elementos da população seria muito
demorada e teria um custo elevado, quase que proibitivo. Como alternativa, basta
elaborar a lista dos conglomerados e seleccionar uma amostra destes, para obter a
característica de toda a população.
Este método de amostragem é aquele em que a escolha dos elementos para pertencer
a amostra não depende de alguma probabilidade. Usando este tipo de método não é
possível generalizar os resultados das pesquisas para a população. Entretanto, pode
ajudar ao pesquisador a formular boas hipóteses em relação ao problema por
131
investigar, pois as amostras não probabilísticas ou empíricas não garantem a
representatividade da população.
Este é um dos métodos de amostragem mais utilizado. Ele oferece um maior rigor do
que muitos métodos não-probabilísticos já considerados, por apresentar uma ideia
132
intuitiva da representatividade dos grupos da amostra. É usual nas campanhas
aleatórias, nos estudos de mercados, etc.
Esta amostragem tem uma vantagem, pois não necessita uma base amostral mais
rigorosa, é fácil de aplicar, tem baixo custo e assegura uma representatividade dos
elementos de cada grupo populacional. Entretanto, tem certas desvantagens por
necessitar de uma informação exacta em cada passo, e a selecção da amostra em
cada grupo não é aleatória.
Exemplo 5.4: Seja uma população com unidades, dividida em três grupos
com =200; =300 e =500. Pretende-se extrair desta população uma amostra de
tamanho 350. Encontrar as quotas ou percentagens que devem ser tiradas em cada.
Resolução
133
LIÇÃO N° 17
Objectivos da Lição
134
5.17 Determinação do Tamanho de uma Amostra
135
Assim, o nível de confiança e a área da curva normal que se pretende abranger, por
exemplo, se desejarmos fazer inferências com 90% de segurança, é 90% da área total
da curva normal.
Existem vários procedimentos que são utilizados para o cálculo do tamanho de uma
amostra, nesta lição destacamos algumas situações ao nosso nível de abordagem da
teoria elementar de amostragem.
z
n [ /2
]2
E
O tamanho da amostra deve ser um número inteiro; quando o resultado não é inteiro,
como regra, deve-se arredondar para o próximo número. Com esta fórmula, pode-se
determinar o tamanho da amostra necessária para dar resultados precisos, com um
grau de confiança e uma margem de erro pré-determinados. A fórmula deve ser usada
quando conhecemos o valor da e queremos determinar o tamanho da amostra
necessário para estabelecer, um nível de confiança de , e o valor de a menor
que . A existência desta fórmula implica que o tamanho da amostra não depende do
tamanho da população.
Exemplo 5.5: Um consultor deseja calcular o salário médio para o primeiro ano de
trabalho de um bacharel recém-formado do Curso de Administração. Quantos valores
do salário devem ser obtidos, se o consultor deseja ter 95% de confiança em que a
média amostral esteja a menos de 3000,00 MT da verdadeira média populacional?
Suponha que sabemos através de um estudo anterior que, para estes salários,
Mt.
Portanto, devemos obter uma amostra de, pelo menos, 180 salários do primeiro ano,
seleccionados aleatoriamente. Com tal amostra, teremos 95% de confiança em que a
média amostral X difere em menos de 3000,00 MT da média populacional .
136
Caso 2. Se a variavel escolhida for intervalar e a população finita, o tamanho da
amostra será calculado por:
Exemplo 5.6: Suponhamos que, no exemplo anterior, a população seja finita de 300
salários. Calcule o tamanho da amostra.
(z /2 )2 pˆ (1 pˆ )
n
E2
Exemplo 5.7: A Entreposto deseja saber a proporção de clientes que fazem a revisão
mecânica nos mecânicos por si autorizados. O conselho directivo da empresa decide
que o estudo deve ter uma margem de erro de 3% (a percentagem de clientes que
consultam os mecânicos quando seus veículos apresentam problemas mecânicos ou
por causa de um outro serviço). Supondo que se pretende um nível de confiança de
95% nos resultados, quantos motoristas devem fazer parte da amostra?
a) Supondo que temos uma estimativa p̂ com base num estudo anterior, que mostrou
que 18% dos motoristas consultavam os mecânicos.
137
b) Supondo que não temos qualquer informação que possa sugerir um valor de p .
Solução:
1,962 (0,18)(0,82)
n 630, 0224 631
0.032
b) Similar a parte (a), utilizamos zα/2 = 1,96 e E = 0.03 , mas sem qualquer
conhecimento prévio de p, temos de utilizar o valor que maximiza a variância.
1,962 (0,5)2
n 1067,1111 1068
0.032
Para termos 95% de confiança de que a nossa amostra está a menos de três pontos
percentuais da verdadeira percentagem de todos os clientes, devemos fazer uma
selecção aleatória e entrevistar 1068 motoristas. Comparando este resultado com a
amostra de 631 obtido na alínea (a), podemos ver que, na ausência de um estudo
prévio, é necessária uma amostra maior para obtermos os mesmos resultados que
obteríamos se pudéssemos estimar o valor de p.
138
esta interessado em conhecer o comportamento desses grupos. Sabendo que a
província tem 10.000 eleitores, ao nível de confiança correspondente a 95,44% e um
erro de estimação de 4%, determinar o tamanho da amostra e os tamanhos das
amostras nos estratos. De acordo com a informação disponível, os eleitores distribuem-
se por categorias seguintes: Técnicos profissionais - 1000, Empregados
Administrativos - 2000, operários - 3000 e trabalhadores não qualificados - 4000.
Resolução:
É a taxa da amostragem
1. Técnicos profissionais:
2. Empregados administrativos:
3. Operários:
4. Trabalhadores não qualificados:
139
LIÇÃO N° 18
Distribuições Amostrais
Objectivos da Lição
140
Uma das importâncias da inferência estatística é tirar conclusões de uma população a
partir dos resultados observados na amostra. Logo, cabe ao observador da amostra
usar relações mais adequadas entre os parâmetros populacionais e as estatísticas
amostrais. Estimador é qualquer variável aleatória dos elementos amostrais. O valor
numérico de um estimador é denominado estimativa.
Consideremos todas as amostras de tamanho que podem ser extraídas de
determinada população. Se para cada uma destas amostras for calculado o valor do
estimador, tem-se uma distribuição amostral desse estimador. Como o estimador é
uma variável aleatória, então, pode se encontrar sua média, variância, desvio padrão,
etc.
141
ou
Exemplo 5.10: Considere uma população constituída pela série das unidades
estatísticas:
a) Determine as estimativas dos parâmetros pontuais: a média, a variância e o
desvio padrão.
b) Considere todas as amostras possíveis de tamanho 2, que podem ser extraídas
da população com reposição e apresente a distribuição amostral das médias
amostrais.
c) Calcule a média e o desvio padrão da distribuição amostral das médias.
d) A partir das relações entre as estatísticas e os parâmentros populacionais,
calcule a média e desvio padrão da distribuição amostral.
e) Usando uma amostragem aleatória sem reposição, apresente a distribuição
amostral das médias.
f)
Resolução:
a) Dado que a série das unidades estatísticas é , então, .
E as estimativas pontuais tem os seguintes valores:
; ;
b) Como para amostra com reposição, cada elemento comina com ele e
com qualquer outro. Então temos amostras. As 25 amostras e as
respectivas médias amostrais estão apresentadas abaixo.
2;2 3;2 5;2 7;2 8;2 2.0 2.5 3.5 4.5 5.0
2;3 3;3 5;3 7;3 8;3
2.5 3.0 4.0 5.0 5.5
2;5 3;5 5;5 7;5 8;5
3.5 4.0 5.0 6.0 6.5
2;7 3;7 5;7 7;7 8;7
4.5 5.0 6.0 7.0 6.5
2;8 3;8 5;8 7;8 8;8
5.0 5.5 6.5 7.0 8.0
c)
142
d)
2;3 2.5
Exemplo 5.11. Num prévia campanha eleitoral, mostrou-se que um certo candidato
tinha 46% dos votos perante esta situação qual é a probabilidade de que numa secção
eleitoral constituída por 200 pessoas, seleccionadas ao acaso entre a população
votante, ele tenha a maioria dos votos.
Resolução:
143
A maioria dos votos terá a partir dos 101 eleitores entre os 200. Considerado uma
variável continua, vamos usar 100.5, isto é, a proporção de sucessos
.
Como se pode deduzir, para uma população normal, a amostra extraída dela deverá
ser normal, consequentemente a sua distribuição amostral também o será, i.é:
Se então
144
Como não se conhece o valor da variância , portanto o valor do desvio padrão
populacional , é substituído pela variável aleatória (desvio padrão amostral), e
procuramos a distribuição da estatística , e pode-se mostrar que tem uma
distribuição de Student com graus de liberdade, assim:
145
Leituras Complementares
A partir da leitura destes livros, que chamamos por leitura complementar, o nosso
maior objectivo é que você possa conhecer outros enfoques dados aos temas
estudados, ao longo desta unidade, que contribuirão para enriquecer e dar subsídios
para a sua formação nesta area.
Atenção, evite ler os textos apenas para responder aos exercícios. A leitura enriquece
e facilita o seu entendimento global do conteúdo desenvolvido.
Texto 1
Webster, Allen L. Estatística Aplicada à Administração e Economia. São Paulo:
McGraw-Hill, 2006.
146
UNIDADE TEMÁTICA VI
Objectivos da Unidade
147
Introdução
148
LIÇÃO N° 19
Objectivos da Lição
149
Introdução
Por exemplo: que podemos dizer da competência de uma pessoa para resolver
situações de certo tipo ao longo da sua vida, com base na observação dos resultados
dos testes realizados na escola?
Exemplo 6.1: Ao invés de se dizer que os pares de sapatos duram cinco anos, dá-se
um intervalo de anos e estabelece-se.
Parâmetros
Estimativas pontuais são valores singulares que são usados para estimar qualquer
parâmetro populacional desconhecido. Dada uma população de tamanho ,
normalmente distribuída, se dela for extraída uma amostra aleatória de tamanho , é de
esperar que a amostra esteja também normalmente distribuída. Se não forem
conhecidos os valores dos parâmetros populacionais, nomeadamente, a média , a
variância e a proporção de sucessos , teremos de recorrer à teoria de estimação.
Como o estimador, por exemplo, é uma função das variáveis aleatórias, a sua função
de distribuição de probabilidade será na base de inferências sobre os parâmetros da
população. Para entendermos melhor, vejamos:
150
Considere uma amostra de tamanho , retirada de uma população e representada
por um conjunto de variáveis aleatórias ( X 1 , X 2 ,..... X n ). Os parâmetros média, variância
e proporção de certa população são representados simbolicamente por: , e ,
respectivamente. Os estimadores usuais, nomeadamente, média, variância e
proporção amostral, são calculados respectivamente, por , ˆ e ˆ , pelas fórmulas
seguintes:
n
x1 x2 ......xn xi
x
n i 1 n
n
1
ˆ2 ( xi x) 2
n i 1
Cada um dos estimadores depende dos valores que estão na amostra aleatória. Este
tipo de estimação, ( X 1 , X 2 ,..... X n ), é chamado de estimação pontual.
151
verdadeiro: conhecendo o valor de uma estatística, não podemos em geral
reproduzir os dados em que o seu cálculo se baseou.
Por exemplo: Seja uma amostra aleatória. Se
é uma realização da amostra seja
. Então, .
Resumo
Exemplo 6.2: Uma amostra de cinco (5) medidas de diâmetros de esferas foi registada
por um cientista com os valores: . Determinar as
152
estatísticas não tendenciosas e eficientes de: (a) média verdadeira e (b) variância
verdadeira.
Resolução:
a) Logo .
b) ;
2
Os estimadores x e p̂ têm boas propriedades e não são viciados. Entretanto, é
viciado, pelo que, não é adequado para estimação. Para eliminar esse vício, um
estimador é definido como:
n
1
S2 ( xi x )2
n 1i 1
Exemplo 6.3: O número de faltas por ano de funcionários de determinada empresa foi
anotado para uma amostra de funcionários escolhidos por acaso. Deseja-se saber qual
é o número médio de faltas por funcionário em um ano. Os dados obtidos são: 2, 2, 3,
1, 4, 5, 3, 4, 5, 6, 5, 3, 4, 3, 4, 2, 4, 3, 5, 2, 1, 6, 2, 3 e 4. A estimativa da média
populacional é:
2 2 .......... 3 4
x 3, 44
25
153
LIÇÃO N° 20
ESTIMATIVAS DE PARÂMETROS
Objectivos da Lição
154
Introdução
x n
Z N (0,1)
/ n
155
pˆ p n
N (0,1)
p (1 p ) / n
Agora, vamos estudar a estimação intervalar, para diversos casos. Logo em seguida,
na unidade temática 7, iremos abordar os vários cenários de testes de hipóteses para
média e proporção.
Os estimadores vistos até ao momento são pontuais, pois fornecem uma estimativa
numérica para o parâmetro de interesse. O método que a seguir vamos estudar é
denominado de estimação intervalar, e inclui a estimativa pontual e informações a
respeito da sua variabilidade.
P( Z z /2 ) P( z /2 z z /2 ) a
156
É o coeficiente de confiança, e é o valor de que fornece uma área de
na extremidade superior a distribuição normal padrão; assim, temos o intervalo
seguinte:
X
z /2 z /2 X z /2 X z /2
n n n
IC ( ,1 ) [X z /2 ;X z /2 ]
n n
E z /2
n
A fórmula de erro ou margem de erro, revela que há, efectivamente, três determinantes
do tamanho ou quantidade de erro: a confiança desejada, representada pelo valor de
; a dispersão da população ; o tamanho da amostra .
Os factores no numerador têm um efeito directo no erro, ou seja, quanto maior for o
coeficiente de confiança ou a dispersão da população, maior é o erro. O tamanho da
amostra apresenta o efeito inverso na margem de erro, portanto, quanto maior for a
amostra menor é o erro.
Calcula-se o valor de zα/2 usando a Tabela Normal Padronizada, que se encontra no fim
do manual.
157
Observe que se p (0 ≤ z ≤ 1,64) = 0,45 logo p (z>1,64) = 0.05 , pois p (- ≤ z ≤ ) = 1
e por simetria da distribuição p (z ≤0) = p (z ≥0)=0.5. A partir do valor de z0.05 = 1,64
constrói-se um intervalo de 90% de confiança (α= 0,1).
Exemplo 6.4:
Pela Tabela de Distribuição Normal Padronizada, vê-se que z0.025 = 1,96, pois p (0
≤z≤1,96) = 0.475 , logo p (z ≥1,96) = 0.025. Assim, o intervalo de confiança para o valor
médio do valor que o consultor pagará com 95% de confiança é [ 222,07;277,93].
158
2
2º Caso: desconhecida e amostra grande
IC ( ,1 ) [X z /2 ;X z /2 ]
n n
159
É diferente conforme o tamanho da amostra, ou seja, ela varia de acordo com os
graus de liberdade;
Apresenta a mesma forma geral simétrica (forma de sino) que a distribuição
normal, mas com maior variabilidade, o que é esperado em amostras pequenas,
logo, P(t ≥ 0) = 0.5 e P(t≤ 0) = 0.5;
O desvio padrão da distribuição t varia com o tamanho da amostra, mas é
superior a 1;
À medida que aumenta o tamanho da amostra, a distribuição t aproxima-se mais
e mais da distribuição normal padronizada.
S S
X E X E X t /2, n 1 X t /2, n 1
n n
160
S S
IC ( ,1 ) [X t /2, n 1 ;X z /2, n 1 ]
n n
Primeiro, vamos calcular t0,0025,24 , uma vez que a amostra tem tamanho n = 25 . Pela
tabela da distribuição t, o valor crítico que deixa área de 2,5% acima da curva, com 24
graus de liberdade é t0,0025,24 = 2,064. Veja que a tabela anterior é uma parte da tabela
t. Assim o intervalo de 95% de confiança para a média é:
1, 4163
IC ( ,95%) [3, 44 2, 064 ] [3, 44 0.585] [2,855; 4, 025]
25
161
Leituras Complementares
A partir da leitura destes livros, que chamamos por leitura complementar, o nosso
maior objectivo é que você possa conhecer outros enfoques dados aos temas
estudados, ao longo desta unidade, que contribuirão para enriquecer e dar subsídios
para a sua formação nesta area.
Atenção, evite ler os textos apenas para responder aos exercícios. A leitura enriquece
e facilita o seu entendimento global do conteúdo desenvolvido.
Texto 1
Webster, Allen L. Estatística Aplicada à Administracao e Economia. São Paulo:
McGraw-Hill, 2006.
162
UNIDADE TEMÁTICA VII
TESTE DE HIPÓTESES
Objectivos da Unidade
163
Introdução
A Estatística Descritiva (análise de dados), face aos gráficos e números que resumem
os dados, permite emitir hipóteses acerca do comportamento das populações de onde
provêm esses dados.
A finalidade desta unidade temática é desenvolver regras (designadas testes de
hipóteses) que permitem, uma vez formulada determinada hipótese, decidir, correndo
um certo risco de errar, se essa hipótese é aceitável, face à informação contida nos
dados.
164
LIÇÃO N° 21
Objectivos da Lição
165
7.21.1 Conceito de teste de hipóteses
Muitas vezes somos convidados a tomar decisões, mesmo em situações onde não é
possível obter informações sobre toda população. Estes casos acontecem ou porque
não se conhece o universo da população, ou porque os custos para o estudo seriam
muito elevados ou mesmo porque o processo de recolha de informação levaria muito
tempo. Motivos como estes levam-nos a estudar parte dessa população e depois
decidir sobre as características da população.
De uma maneira geral, para a realização de um teste estatístico, começa-se por emitir
a hipótese nula ( ), é a hipótese estatística a ser testada, e a hipótese que traduz uma
afirmação diferente da anterior, é chamada hipótese alternativa ( ) a hipótese nula
( ).
166
Existem testes de hipóteses para média, variância e para proporção de uma população.
Uma suposição que precisa ser feita é que os dados da população provêm de uma
distribuição normal onde a média ou proporção são desconhecidos e a variância pode
ser conhecida ou não. Vamos, agora, definir as componentes de um teste de hipóteses:
algum valor;
algum valor;
algum valor.
Hipótese Alternativa (denotada por ): é uma afirmação que complementa (parte que
não está em ) a hipótese nula. Esta pode ser descrita em uma das três formas:
algum valor;
algum valor;
algum valor;
Exemplo 7.1
167
Exemplo 7.2: O gerente de um hotel estabeleceu que a quantia média gasta por
hóspedes em um fim de semana é de 500,00 MT, ou menos. Um funcionário do sector
de contabilidade observou que as despesas totais dos hóspedes têm aumentado nos
últimos meses. O contabilista do hotel irá verificar se essa afirmação é verdadeira ou
não. Admite-se que o gasto dos hóspedes segue uma distribuição normal.
Exemplo 7.3: A TDM afirma que o consumo mensal de ligações a longa distância foi 3
horas e 35 minutos por residência no último ano. Deseja-se avaliar se o consumo por
residência deste ano é o mesmo. Admitimos que o consumo mensal de ligações a
longa distância segue uma distribuição normal.
Atenção…
Se está a fazer uma pesquisa e deseja usar um teste de hipótese para sustentar a sua
afirmação, esta deve ser formulada de maneira que se torne numa hipótese alternativa,
e não pode conter a condição de igualdade.
168
No exemplo 7.1, seria errado dizer que o tempo de reacção do medicamento Sem Dor
é menor que 15 minutos, quando, na verdade, é igual ou superior a 15 minutos;
No exemplo 7.2, seria errado dizer que o consumo dos hóspedes é superior a 500,00
Mt, quando na verdade é igual ou inferior a 500,00 Mt.
No exemplo 7.3, seria errado dizer que o consumo mensal de ligações por residência é
diferente de 3 horas e 35 minutos, quando, na verdade, esse consumo é igual a 3
horas e 35 minutos.
Erro tipo II: quando não rejeitamos a hipótese nula , sendo ela falsa. E a
probabilidade deste tipo de erro é dado pela forma: P (Erro tipo II) =
No exemplo 7.1, seria errado dizer que o tempo de relacção do novo medicamento é
igual ou superior a 15 minutos, quando na verdade é inferior a 15 minutos;
No exemplo 7.2, seria errado dizer que o consumo dos hóspedes é igual ou inferior a
500,00 Mt, quando, na verdade, é superior a 500,00 Mt;
No exemplo 7.3, seria errado dizer que o consumo mensal de ligações por residência é
igual a 3 horas e 35 minutos, quando, na verdade, é diferente de 3 horas e 35 minutos.
Além das definições anteriores, existem outras componentes que precisam ser
definidas:
Estatística de Teste: é um valor baseado nos dados amostrais para tomar uma
decisão sobre a rejeição da hipótese nula. No caso de teste para média, ela é (a
decisão) formada pela média amostral e pelo desvio padrão. Veremos, mais adiante,
como se constrói a estatística de teste;
169
Região Crítica: é o conjunto de todos os valores da estatística de teste que levam à
rejeição da hipótese nula;
O Valor Crítico: é o valor, ou valores que separa(m) a região crítica dos valores da
estatística de teste que não levam à rejeição da hipótese nula. Os valores críticos
dependem da natureza da hipótese nula, da distribuição amostral, e do nível de
significância .
Estatísticas de Teste
X
z 0
, considerando que o valor de μ0 é o valor extremo dado pela hipótese nula.
n
pˆ p0
z , sendo que p0 é o valor extremo fornecido pela hipótese nula.
p0 (1 p0 )
n
1) Definir as hipóteses ( );
2) Especificar o nível de significância;
170
3) Seleccionar a estatistica do teste;
4) Estabelecer o valor critico ou valores críticos;
5) Determinar o valor real (observado) da estatística do teste;
6) Tomar decisão, consequentemente a respectiva conclusão
LIÇÃO N° 22
Teste de Médias
Objectivos da Lição
171
7.22.1 Teste de Médias
contra
A diferença está no sinal de igualdade para a hipótese nula no teste unilateral, mas
essa diferença de notação não altera a construção do teste.
Exemplo 7.4
172
Uma organização de defesa do consumidor afirma que os consumidores dos postos de
gasolina da Petromoc estão a ser prejudicados em virtude da seguinte condição:
quando o marcador indica 1 litro, a quantidade média de combustível fornecida é
realmente inferior a 1 litro.
R: A hipótese alternativa é .
verificação, note que a hipótese alternativa contém o sinal , que aponta para a
esquerda.)
R: O erro tipo II (não rejeitar a hipótese nula falsa) consiste em não rejeitar
litro, quando a média populacional é realmente inferior a 1. Isto é, concluímos que não
há evidência suficiente para comprovar o prejuízo, quando esse prejuízo está ocorrer.
173
g) Suponha que a conclusão seria rejeitar a hipótese nula. Enuncie a conclusão em
termos não-técnicos; Lembre-se que deve lidar com a afirmação original.
f) Suponha que a conclusão seja não rejeitar a hipótese nula. Enuncie a conclusão em
termos não-técnicos; Lembre-se que deve lidar com a afirmação original; certifique-se.
X 0
z
n
X 0
z
S n
Exemplo 7.5
174
erro tipo I é 0,05. Suponha que o consumo de energia do supermercado segue uma
distribuição normal.
Hipóteses:
Estatística de Teste:
X 0
Pelas observações, temos: z
S n
420000 40000
z 3, 43
3500 36
Decisão:
Conclusão:
Nos casos vistos até ao momento, a amostra era grande e, portanto, era possível
utilizar o Teorema Central do Limite e usar a aproximação normal para a estatística de
teste. Contudo, não podemos utilizar esse teorema para amostras pequenas. Para
realizar testes com pequenas amostras, vamos seguir o mesmo raciocínio que foi
175
utilizado na estimação do intervalo. Ao invés de utilizar a aproximação normal, vamos
recorrer à distribuição de t - Student. A estatística de teste, neste caso, é:
X 0
t
S n
O valor crítico tα,n-1 é o valor de t da tabela t de Student , que fornece uma área de α na
extremidade superior da distribuição t, com n - 1 graus de liberdade.
176
Hipóteses: (já foram mostradas)
Estatística de Teste:
528,9 500
tobs 1,54
88 / 22
Região Crítica:
Decisão:
Conclusão:
177
X 0
t
S n
7,50 8, 00
tobs 2
1, 00 16
Região Crítica:
178
Pela tabela da distribuição t, o valor crítico é t0,05, 16= 1,753. Este é o valor de t da tabela
t de Student, que fornece uma área de 0,05 na extremidade superior da distribuição t
com 15 graus de liberdade.
Decisão:
O conceito do que é “pequeno” fica a cargo do responsável pelo teste, que decide qual
α usar para comparar com o valor obtido α*. Quando não é definido o valor de α para
se fazer a comparação, é recomendado usar o nível 0,05.
179
Caso unilateral:
Observação
Alguns valores de nível descritivo não estão acessíveis nas tabelas das distribuições
normal padronizada de t. Quando não há um software disponível para fazer o cálculo,
mas somente as tabelas, é possível fazer uma aproximação para o valor p,
especificando entre que valores ele se situa. No Excel 2003, obtém-se o valor p na
função DIST.NORMP, para a distribuição normal padronizada e DISTT para a
distribuição t. Veja, na ajuda do Excel, que a função disponibiliza a distribuição
acumulada até o ponto zobs ou tobs.
Exemplos de ilustração
O valor p é:
180
Isso significa que a probabilidade de dizer que o tempo de reacção do medicamento é
minutos quando na verdade é é 0,0322. O erro que estaria a ser
cometido seria pequeno. Por isso, é que se decide pela rejeição de
, respectivamente.
, respectivamente.
, porque ;
Exemplo 7.7
Uma fábrica de chocolates suspeita que embalagens de 450 gramas de um certo tipo
de chocolate em barra, estão abaixo do peso. Para verificar tal afirmação, foram
seleccionadas aleatoriamente 80 barras em vários lotes de produção, obtendo-se uma
média de peso de 447 gramas. Se admitirmos que o peso das barras de chocolate
segue o modelo Normal, com um desvio padrão de 10 gramas, que conclusão pode ser
tirada através do nível descritivo?
X 447 450
zobs 2, 68
/ n 10 80
Portanto, o valor p é de 0,37%, o que indica que a probabilidade de que sugere valores
da estimativa mais desfavoráveis à hipótese nula. Note que o valor do nível descritivo
relaciona-se directamente com o nível de significância. Neste exemplo, se tivéssemos
182
fixado o nível de significância em qualquer valor, igual ou superior a 0,37%, a
conclusão seria a rejeição de , ao passo que valores inferiores a 0,37% conduzir-
nos-iam à aceitação da hipótese nula.
183
LIÇÃO N° 23
Objectivos da Lição
184
7.23 Teste para proporção
Vamos, agora, ilustrar como podemos testar uma afirmação sobre uma proporção,
probabilidade ou percentagem. O raciocínio é semelhante ao que foi desenvolvido no
teste para a média. Só que neste caso, da proporção, as observações se originam de
um modelo Binomial, e de acordo com Webster (2007), a distribuição amostral das
proporções amostrais pode ser aproximada por uma distribuição normal. As hipóteses
no teste para proporção são:
E a estatística de teste é:
pˆ p0
z
p0 (1 p0 )
n
185
para o teste unilateral direito
Seguindo o mesmo raciocínio que foi ilustrado para o valor p para o teste da média,
temos:
Se
Se
186
A proporção de fumantes estimada é:
8
pˆ 0, 2
40
Região Crítica:
Estatística de teste:
0, 2 0,3
zobs 1,38
(0,3x0, 7)
40
Decisão:
Como 1,38 não pertence à região crítica, decide-se pela não rejeição de com 5% de
significância. Logo, há evidências de que a proporção de fumantes não é superior a
30%.
Exemplo 7.9
187
100 consumidores, dos quais 48 informaram que utilizam seus serviços. Tire
conclusões a 5% de significância.
48
pˆ 0, 48
100
Hipóteses:
Estatística de teste:
0, 48 0,5
zobs 0, 40
(0,5 x0,5)
100
Região Crítica:
188
Como o valor p supera o nível de significância 0,05, não rejeitamos a hipótese nula e,
novamente, concluímos que não há evidência suficiente para rejeitar a afirmação de
que 50% dos consumidores que utilizam os serviços da Mcel sejam de Maputo.
O intervalo de confiança pode ser utilizado para tomada de decisões no caso de teste
de hipóteses bilateral. Sejam as hipóteses contra , a decisão
tomada será:
Para o Exemplo 6.2, da unidade temática VI, em que a EMOSE deseja testar se a
idade média dos proprietários de apólices de seguro de vida é 40 anos, com 10% de
significância. O teste é ; contra .
Para o Exemplo 6.3, da unidade temática VI, sobre o número de faltas de funcionários
por ano, deseja-se testar se o número médio de faltas é 2,5 , com 5% de significância.
O teste é ; contra
O intervalo de 95% de confiança para o número médio de faltas para cada funcionário,
por ano, construído foi ; como não pertence ao intervalo, deve-
se rejeitar . Portanto, a 5% de significância, há evidências de que o número médio de
faltas para cada funcionário, por ano, não é 2,5.
189
LIÇÃO N° 24
Objectivos da Lição
190
7.24 Teste para variancia
0,292; 0,287; 0,274; 0,331; 0,332; 0,325; 0,285; 0,353; 0,293; 0,310
0,328; 0,315; 0,300; 0,298; 0,229; 0,316; 0,314; 0,281; 0,262; 0,283
Rejeitar se
, ,
Decisão:
Não rejeitar .
Conclusão:
191
Ao nível de significância de 10% não há evidencias suficientes para apoiar a afirmacao
de que actual a variância excede 0,025.
LIÇÃO N° 25
Objectivos da Lição
192
7.25 Testes de hipotese para duas amostras
a) Diferencas de médias
Quando as variâncias (populacionais) são conhecidas e diferentes a
estatística do teste é dada por :
onde ,
193
(Carga axial: peso máximo que seus lados podem suportar)
Regra de decisão:
Rejeitar se o
, quando
Decisão
Rejeitar
Conclusão:
194
Exemplo 7.1: Ao nível de significância de 5%, o teste da afirmação de que a qualidade
média de Nicotina em cigarros do tipo King-Size com filtro é igual a quantidade média
de Nicotina presente em cigarros sem filtro.
Nicotina (mg)
195
e
Decisão:
Rejeitar
Leituras Obrigatórias
Nesta unidade não foram tratados temas tais como: Testes para duas populações e
Análise de Variância.
Texto 1
Webster, Allen L. Estatística Aplicada à Administracao e Economia. São Paulo:
McGraw-Hill, 2006.
Leituras Complementares
A partir da leitura destes livros, que chamamos por leitura complementar, o nosso
maior objectivo é que você possa conhecer outros enfoques dados aos temas
estudados, ao longo desta unidade, que contribuirão para enriquecer e dar subsídios
para a sua formação nesta area.
Atenção, evite ler os textos apenas para responder aos exercícios. A leitura enriquece
e facilita o seu entendimento global do conteúdo desenvolvido.
Texto 2
Webster, Allen L. Estatística Aplicada à Administracao e Economia. São Paulo:
McGraw-Hill, 2006.
196
TABELAS ESTATÍSTICAS
Abaixo, estão apresentadas as tabelas estatísticas que irás necessitar durantes os teus
estudos nesta disciplina.
197
198
199
200
201
202
203
204
205
206
207
BIBLIOGRAFIA
208
BASE DE EXERCÍCIOS
93, 97, 72, 84, 88, 90, 78, 80, 89, 94, 95, 77, 81, 75, 72,
91, 94, 81
76, 70, 76, 83, 97, 73, 83, 87, 91, 83, 92, 90, 92, 77, 86,
86, 74, 87,
a) Classifique a variável
b) Construir a tabela de Distribuição de frequências
c) Calcule as medidas de tendência central
d) Calcule as medidas de dispersão
e) Desenhe o gráfico de barras
f) Apresente o Histograma da distribuição
Resolução:
a) Variável
Tipo: Variável quantitativa contínua
n = 36
b)
209
Cálculo da amplitude de intervalo de classes
Rol
O limite inferior para a primeira classe é igual ao observado. Sendo que, para
achar os subsequentes adicionamos a ao anterior.
i Classes
Como se vê há descontinuidade nos limites, daí o nome de limites aparentes, pelo que
é necessário transformá-los em limites reais, ou seja estabelecer a continuidade nos
limites. Bastando somente subtrair os limites inferiores pela metade do grau de
precisão, assim como adicioná-lo aos limites superiores.
I Classe
210
2 73,5 – 75,5 6 1 17 28 453 84,3 -8,80 464,64
77,5 0 0 0
3 77,5 – 79,5 4 1 11 39 318 84,3 -4,80 92,16
81,5 0 4 0
4 81,5 – 83,5 4 1 11 50 334 84,3 -0,80 2,56
85,5 0 8 0
5 85,5 – 87,5 6 2 17 67 525 84,3 3,20 61,44
89,5 0 4 0
6 89,5 – 91,5 7 3 19 86 640,50 84,3 7,20 362,88
93,5 0 1 0
7 93,5 – 95,5 5 3 14 100 477,50 84,3 11,20 627,20
97,5 0 6 0
_ _ _ _ _ _ _ 2266,24
Média
Moda
Mediana
211
Nota: O resultado da nossa fracção coincide com o valor da frequência absoluta
acumulada que satisfaz a nossa inequação.
Seu respectivo intervalo de classe é e a respectiva frequência absoluta,
designada por frequência mediana é 4.
Limite real inferior é igual a 81,5
Variância
Desvio Padrão
212
=
e) Diagrama de Barras
Diagrama de barras
6
Frequencias absolutas
0
71,50 75,50 79,50 83,50 87,50 91,50 95,50
notas
Ponto médio de classe - Xi
f) Histograma da distribuição
213
Histograma
5
Frequencia absoluta
Mean = 84,2778
Std. Dev. = 7,90519
0 N = 36
70,00 75,00 80,00 85,00 90,00 95,00 100,00
Notas
a) Completa a tabela
b) Determine o consumo médio da electricidade.
c) Determine o consumo mais comum da electricidade.
d) Determine o consumo central da electricidade.
e) Calcule as medidas de dispersão.
Resolução:
a)
Consumo Total
em
214
4 6 14 26 14 8 6 2
4 10 24 50 64 72 78 80 -
Solução:
; ;
; ;
; ;
; ;
; ;
; ;
; .
215
b) Consumo médio da electricidade
1º Passo
é 50.
Seu respectivo intervalo de classe , e a respectiva frequência absoluta,
designada por frequência mediana ( ) é 26.
A frequência acumulada anterior à frequência que satisfaz a nossa inequação
é 24.
216
e) Cálculo de medidas de Variação
Variância
Como é maior que 30, a fórmula é: Como n é maior que 30, a fórmula é:
Desvio Padrão
217
Em uma indústria há pessoas que ganham mais de 20 salários mínimos ( ), 20 que
ganham entre 10 e 20 e 70 que ganham menos de 10 . Três pessoas desta
indústria são seleccionadas. Determinar a probabilidade de que pelo menos uma ganhe
menos de 10 .
Num concurso de televisão, para conhecer qual é o prémio a que tem direito, o
vencedor tira simultaneamente três bolas de uma urna. A urna contém seis bolas que
não se distinguem ao tacto, tendo três o número , duas o número e uma o
número
O concorrente recebe em contos a soma dos números das bolas retiradas.
Verifique que a probabilidade de ocorrer o prémio de contos é de .
Resolução:
3 com o nº 0
1 com o nº 1000
218
A probabilidade de ocorrer o prémio de 1000 contos é de:
Tratamento
A B Total
Resultado
Cura total 24 16 40
Cura parcial 24 16 40
Morte 12 8 20
Total 60 40 100
219
a)
b)
Como: ;
Temos:
220
1. Três vezes um número par?
2. Nenhum número par?
3. Pelo menos um número ímpar?
1
A probabilidade de se obter em cada lançamento um número par é:
(p)
Designando por p o acontecimento: “sair número ímpar”, vem:
P( )
2.
Pretende-se que saia número ímpar em todos os lançamentos.
A probabilidade pedida é:
3.
Aparecer pelo menos um número ímpar e o acontecimento contrário ao aparecimento
de quatro números pares.
Outro processo:
Recorrendo à análise Combinatória, pode usar-se a fórmula:
1.
(3)
2.
(4)
221
3.
(4)
Para certo exame, os candidatos devem preparar 100 temas dos quais três,
seleccionados ao acaso, sairão no exame.
Um candidato apresenta-se a exame tendo preparado apenas dos temas. Qual é a
probabilidade de que tenha estudado só dois temas que saíram?
três temas
Um candidato prepara apenas dos temas, ou seja, 25 dos temas.
O número de possibilidades de saírem 3 temas em 100 é dado por:
O número de possibilidades de saírem 2 dos 25 temas estudados é:
O número de possibilidades de sair 1 dos 75 temas não estudados é:
O número de casos favoráveis é dado por:
Então a probabilidade pedida é:
Um estudo feito por um oficial de uma divisão de veículos blindados mostrou que numa
amostra aleatória de dias, a divisão possuía, em média, veículos em
condições operacionais. Sabendo que para tais dados, construa um intervalo
de 95% de confiança para o verdadeiro número médio diário de veículos que essa
divisão de veículos blindados possui em condições operacionais.
Resolução:
Como o tamanho da amostra é maior que 30, usamos a seguinte fórmula do intervalo
de confiança:
(grau de confiança)
222
O valor correspondente de é 1,96.
Substituindo na fórmula do intervalo de
confiança, obtemos os seguintes limites:
Resposta: Com de confiança pode-se dizer que o verdadeiro número médio diário
de veículos que essa divisão de veículos blindados possui em condições operacionais
a .
, ou
Onde e
Para . Então, os limites de confiança
de são:
e o intervalo de confiança
de é de a . Ou seja batimentos por minuto.
Com 99% pode-se estar confiante de que a verdadeira média está compreendida entre
e batimentos por minuto.
223
Uma amostra de 8 locais onde a pintura das estradas se mostrou deteriorada depois de
ter sido cruzada em média por 14,10 milhões de veículos com desvio padrão
milhões de veículos. Calcule um intervalo de de confiança para a média da
população considerada.
Conclusão
Com este nível de 95%, pode-se estar confiante de que a verdadeira média está
compreendida entre a milhões de veículos.
Solução:
224
Para o coeficiente de confiança de A área total sombreada da figura é .
Portanto, a área sombreada da extremidade da direita é e o valor crítico
correspondente de é
, onde e
Para . Então, os limites de confiança de são:
e o intervalo de confiança de
é de a .
Resolução:
225
Então substituindo:
para,
, na fórmula do intervalo de confiança de ,
obtemos
a) Solução:
226
φ =
R: Para um erro de 5% pode-se dizer que o intervalo de confiança de que 34% dos
indivíduos compartilham da mesma opinião (“aumento de salário para certos membros
do executivo”) é de 32,1% a 35,9%.
b) Solução
φ =
R: E neste caso, com , pode-se dizer que o intervalo de confiança de que 34%
dos indivíduos compartilham da mesma opinião (“aumento de salário para certos
membros do executivo”) é de 31,8% a 36,2%.
Solução:
227
Deve-se decidir entre as duas hipóteses:
Para a hipótese
e
Em que se consideram os desvios padrões das amostras como estimativas de e .
Para o nível de significância de 0,05, tem-se a seguinte regra de decisão:
Então:
Com base num teste unilateral, no nível de significância de 0,05, onde , a área entre 0
e = 0,4500 e , foi necessário calcular a média
desses valores por ambos tem um desvio significativo do valor 0,4500.
Conclui-se ao nível de significância de 0,05 que não há diferença entre as alturas
médias dos dois grupos, pois o z observado é inferior.
Solução:
Admita-se que o tamanho da amostra de cada grupo é N e que os desvios padrões dos
dois grupos permaneçam os mesmos. Então, para a hipótese , e
228
A diferença observada será significativa, no nível de 0,05, quando o z =1,645, ou seja,
no mínimo, de modo que de ser 78 no mínimo. Em consequência, a
amostra deve ser aumentada em cada grupo, de no mínimo.
Outro método:
Dois grupos, A e B, são formados, cada um de 100 pessoas que padecem da mesma
enfermidade. É ministrado um soro ao grupo A, mas não ao B (denominado grupo de
controle); a todos os outros respeitos, os dois grupos são tratados de modo idêntico.
Determinou-se que 75 e 65 pessoas dos dois grupos A e B, respectivamente, curaram-
se da enfermidade. Testar a hipótese do soro auxiliar a cura da enfermidade, adoptado
o nível de significância de 0,01.
Solução:
Para a hipótese :
e ,
Em que foi adoptada , para a estimativa de , a proporção média de curas nos dois
grupos da amostra, é dada por sendo .
229
Com base em um teste unilateral, no nível de significância 0,01, onde a área entre 0 e
por conseguinte
Então,
Conclusão:
Como o escore é inferior, aceita-se , ou seja, as diferenças observadas são
devidas ao acaso.
Solução:
Deseja-se decidir entre as hipóteses:
, e a máquina está trabalhando adequadamente.
e ela não o está, de modo que um teste bilateral é necessário
230
1. Aceitar quando t estiver compreendido no intervalo entre e , o
qual, para graus de liberdade, é o que vai de
2. No caso contrário, rejeitar .
Conclusão:
Como , rejeita-se no nível 0,05.
(b) Para um teste bilateral, no nível de significância 0,01, adopta-se a seguinte regra
de decisão:
Conclusão:
Como , aceita-se no nível 0,01, ou seja, a máquina está trabalhando
adequadamente.
Solução:
231
2. No caso contrário, aceita-se
Região
Crítica
A vida média de uma amostra de 100 lâmpadas fluorescentes produzidas por uma
companhia, foi calculada em 1570 horas, com o desvio padrão de 120 horas. Se éa
vida média de todas as lâmpadas produzidas pela companhia, testar a hipótese
horas, em face da hipótese alternativa horas, adoptando o nível de
significância de : (a) 0,05; (b) 0,01.
Solução:
Deve-se decidir entre as duas hipóteses:
horas. horas.
Deve-se empregar um teste bilateral neste caso, porque horas inclui tanto
os valores maiores como os menores do que 1600.
232
1. Rejeitar quando o z da média amostral estiver fora do intervalo:
O fabricante de uma droga medicinal reivindicou que ela era 90% eficaz em curar uma
alergia, em um período de 8 horas. Em uma amostra de 200 pessoas que tinham
alergia, a droga curou 160 pessoas. Determinar se a pretensão do fabricante é legítima
ao nível significância de 1%.
Solução:
Seja p a probabilidade de obter-se a cura da alergia, mediante o uso da droga.
Então, deve-se decidir entre duas hipóteses:
a pretensão é correcta.
ela é falsa.
Região
Crítica
233
Sendo o nível se significância igual a 0,01, então a área entre 0 e = 0,4900 e
. Pelo que toma-se para regra de decisão:
1. A pretensão não será legítima quando z for inferior a -2,33 ( e nesse caso,
rejeita-se
2. No caso contrário, a pretensão será legítima e os resultados observados são
devidos ao acaso (e, então aceita-se ).
Se é verdadeira,
Como se pode ver a diferença é tão insignificante que não se altera a conclusão
tomada.
234
235