Você está na página 1de 154

UNIVERSIDADE

EDUARDO MONDLANE
Faculdade de Educação

Módulo Estatística Aplicada a Educação

Elaborado por:
Xavier Muianga

1
Introdução .................................................................................................................... 4 
Objectivos do Módulo ................................................................................................. 5 
Recomendações para o estudo .................................................................................... 6 
Unidade Didáctica 1: ................................................................................................... 7 
Conceitos básicos de estatística .................................................................................. 7 
1.1 Introdução .............................................................................................................. 7 
Objectivos da Unidade 1 ............................................................................................. 8 
Fontes de Informações e Recursos de Aprendizagem .............................................. 9 
1.2 O que é Estatística? ............................................................................................... 9 
1.3 Estatística Descritiva vs Estatística Inferencial ................................................ 10 
1.4 População e Amostra........................................................................................... 12 
1.5 Variáveis e suas classificações ............................................................................ 13 
Tarefas ........................................................................................................................ 15 
Auto-Avaliação .......................................................................................................... 16 
Chave de Correção .................................................................................................... 18 
Unidade Didáctica 2: ................................................................................................. 19 
2.1 Introdução ............................................................................................................ 19 
Objectivos da Unidade 2 ........................................................................................... 20 
Fontes de Informações e Recursos de Aprendizagem ............................................ 21 
2.2 O que é Amostragem? ......................................................................................... 21 
2.3 Dimensionamento da amostra ............................................................................ 25 
Tarefas ........................................................................................................................ 30 
Auto-Avaliação .......................................................................................................... 33 
Chave de Correção .................................................................................................... 34 
Unidade Didáctica 3: ................................................................................................. 42 
Objectivos da Unidade 3 ........................................................................................... 43 
Fontes de Informações e Recursos de Aprendizagem ............................................ 44 
Tarefas ........................................................................................................................ 50 
Auto-Avaliação .......................................................................................................... 54 
Chave de Correção .................................................................................................... 57 
Unidade Didáctica 4: ................................................................................................. 63 
Objectivos da Unidade 4 ........................................................................................... 64 
Fontes de Informações e Recursos de Aprendizagem ............................................ 65 
4.2 Experimento aleatório ......................................................................................... 65 
4.3 Espaço amostral ................................................................................................... 66 
4.4 Eventos ................................................................................................................. 66 
4.4.1 Operações Com Eventos .................................................................................. 67 
4.4.2 Eventos Mutuamente Excludentes E Coletivamente Exaustivos ................. 68 
4.5 Probabilidade ....................................................................................................... 68 
4.5.1 Eventos Complementares ................................................................................ 71 
4.5.2 Eventos Independentes..................................................................................... 71 
4.5.3 Eventos Mutuamente Exclusivos .................................................................... 72 
Tarefas ........................................................................................................................ 73 
Auto-Avaliação .......................................................................................................... 75 
Chave de Correção .................................................................................................... 79 
Unidade Didáctica 5: ................................................................................................. 87 

2
5.1 Introdução ............................................................................................................ 87 
Objectivos da Unidade 5 ........................................................................................... 88 
Fontes de Informações e Recursos de Aprendizagem ............................................ 89 
5.2 Variáveis aleatórias discretas e contínuas ......................................................... 89 
5.2.1 Variáveis aleatórias discretas. ......................................................................... 89 
5.3 Distribuição de probabilidade. ........................................................................... 90 
5.4 Função de densidade de probabilidade. ............................................................ 91 
5.5 Esperança matemática, variância e desvio padrão: propriedades. ................ 91 
5.7 Distribuições de variáveis aleatórias discretas. ................................................ 91 
5.7.1 Distribuição Uniforme. .................................................................................... 92 
5.7.2 Distribuição de Bernoulli. ................................................................................ 92 
5.7.3 Distribuição Binomial. ..................................................................................... 93 
Tarefas ........................................................................................................................ 97 
Auto-Avaliação .......................................................................................................... 99 
Chave de Correção .................................................................................................. 101 
Unidade Didáctica 6: ............................................................................................... 109 
Objectivos da Unidade 6 ......................................................................................... 110 
Fontes de Informações e Recursos de Aprendizagem .......................................... 111 
6.2 Estimadores ........................................................................................................ 111 
6.3 Intervalo de confiança para a média m de uma população normal ............. 114 
6.4 Intervalo de confiança para a proporção p de uma população binomial.... 115 
Tarefas ...................................................................................................................... 117 
Auto-Avaliação ........................................................................................................ 120 
Chave de Correção .................................................................................................. 124 
Unidade Didáctica 7: ............................................................................................... 131 
Objectivos da Unidade 7 ......................................................................................... 132 
Fontes de Informações e Recursos de Aprendizagem .......................................... 133 
7.2 Testes de hipóteses ............................................................................................. 133 
Tarefas ...................................................................................................................... 139 
Auto-Avaliação ........................................................................................................ 142 
Chave de Correção .................................................................................................. 145 

3
Introdução

Bem-vindo ao módulo sobre Estatística Aplicada a


Educação

Caro estudante nos dias de hoje, a Estatística ocupa um espaço de relevo nas sociedades
modernas, sendo indispensáveis para o desenvolvimento de qualquer área, seja ela económica,
social, e até educacional. A Estatística nos dias de hoje é uma ferramenta indispensável para
qualquer profissional que necessita analisar informações em suas tomadas de decisões diárias,
seja no seu trabalho ou na sua vida pessoal. Pode-se até pensar que suas técnicas nasceram neste
mundo contemporâneo em que se valoriza cada vez mais a rapidez e a agilidade das informações,
de um mundo onde o avanço tecnológico (através da criação de computadores que processam
uma imensa quantidade de dados em um "piscar de olhos") é constante. Porém a utilização da
estatística como suporte para a tomada de decisões não é de hoje, desde o mundo antigo existem
indícios de sua utilização.

O presente módulo visa facultar os estudantes com ferramentas teórico-práticas que os permitam
realizar análises estatísticas de situações educacionais, uma vez que, a posterior, estes
necessitarão aplicar os conhecimentos adquiridos sobre os métodos de colecta e interpretação de
dados para solucionar problemas - projectos de pesquisa. Neste contexto, uma variedade de
técnicas de análise serão introduzidas e exploradas, nomeadamente análise exploratória de dados,
estatística inferencial, correlação, t-testes, análise de variância, regressão linear, entre outros, com
o objectivo de tornar os estudantes do OGED exímio utilizador de conhecimentos estátisticos, sua
aplicacação geral e específica na área de organização e gestão da educação.

4
Objectivos do Módulo

Objectivos

Quando terminar o estudo do módulo Estatística Aplicada a Educação , o formando será


capaz de:
 Conhecer os conceitos básicos de estatística comumente usados área da educação;

 Conhecer as noções de probabilidade e distribuição de probabilidades, amostragem e


estimação de parámetros;

 Descrever e interpretar fenómenos educacionais a partir da leitura de dados relativos a


esses fenómenos;

 Conhecer os processos de colecta de dados; construir tabelas e gráficos que facilitem a


descrição e compreensão dos fenómenos;

 Construir intervalos de confiança para os parámetros média e proporção; e,

 Demonstrar uma compreensão das hipóteses estatísticas por detrás dos procedimentos
estatísticos.

5
Recomendações para o estudo
O módulo sobre Estatística Aplicada a Educação é um módulo que alia a teoria a prática, por isso,
durante o processo de aprendizagem, você será convidado a dedicar algum tempo para a
consolidação das teorias e prática apreendidas.

Durante o estudo deste módulo, por causa das matérias tratadas, é preciso que você, para além da
bibliografia fornecida, procure outras fontes tais como o material existente na Inernet, de forma a
consolidadar melhor os conhecimentos que vai construir ao longo do tempo em que o módulo vai
decorrer.

No final do estudo de cada unidade, procure resolver ou responder os exercícios colocados, que
servem para a consolidação das matérias do módulo. Não passe para a unidade seguinte sem ter a
certeza de que domina a anterior, e procure sempre que possível consolidar a matéria anterior, através
da resolução de exercícios recomendados em cada unidade.Assim, seja bem-vindo ao módulo e juntos
com os colegas e o tutor, temos a certeza que conseguiremos entender e dominar as matérias aqui
tratadas.

6
Unidade Didáctica 1:

Conceitos básicos de estatística

1.1 Introdução

A estatística tem aplicações nos mais importantes ramos da ciência e torna-se a cada dia uma
importante ferramenta de apoio à tomada de decisão. O objetivo deste capítulo é introduzir
importantes conceitos em estatística, trabalhando a intuição do leitor para que este raciocine em cima
de problemas cujas soluções requerem o uso de técnicas estatísticas.

Para iniciar toda a discussão, primeiramente é necessário conhecer melhor o conceito de estatística. As
pessoas comumente escutam falar de estatísticas na mídia. Diariamente são divulgadas informações
tais como: índice de inflação, taxa de mortalidade, índice de desenvolvimento humano, proporção de
eleitores, dentre outras.

O primeiro cuidado que devemos tomar é distinguir as estatísticas (valores numéricos que resumem
informações) da Estatística que ganhou status de ciência. Nesta introdução, esta distinção será feita da
seguinte forma, a Estatística, enquanto ciência, terá sempre a primeira letra maiúscula.

7
Objectivos da unidade 1
Objectivos da Unidade 1

Ao completar esta unidade,você será capaz de:

 Definir os vários conceitos básicos da estatística;


 Diferenciar estatística descritiva da estatística inferecial;
 Identificar os diferentes tipos de variáveis;
 Classificar os diferentes tipos de;
 Dar exemplo dos diferentes tipos de variáveis.

8
Fontes de Informação e Recursos de Aprendizagem
Fontes de Informações e Recursos de Aprendizagem

Para consolidar os seus conhecimentos sobre as matérias desta unidade veja:


Costa Neto, P. L. de O. (1977) . Estatística. São Paulo: Edgard Blücher.

Hoei, P. G. (1981). Estatistica elementar. 1ª ed., São Paulo: Editora Atlas.

Fonseca, J. S. At al. (1996). Estatística Aplicada. 6ª. Ed.São Paulo: Atlas.

Moretin, L. (1994). Estatística Básica.São Paulo: Makrom Brooks.

Spiegeli, M.R. Probabilidade e Estatística. São Paulo: MacGraw-Hill.

http://www.portalaction.com.br/content/13-exposi%C3%A7%C3%A3o-dos-dados

1.2 O que é Estatística?


O dicionário Aurélio, define Estatística como sendo “parte da matemática em que se investigam os
processos de obtenção, organização e análise de dados sobre uma população ou sobre uma coleção de
seres quaisquer, e os métodos de tirar conclusões e fazer ilações ou predições com base nesses dados”.
Esta definição é mais abrangente e procura mostrar vários campos de ação. Entretanto, a definição
para Estatística que mais resumida e se aproxima da abordagem que será feita durante este curso é
dada abaixo:

Definição: A Estatística é um conjunto de métodos e técnicas que auxiliam a tomada de decisão sob a
presença de incerteza.

A incerteza está relacionada com o que acontece em várias áreas do conhecimento, como por
exemplo: na física, nas ciências sociais, no comportamento humano, na economia e em ciências
naturais. A incerteza é consequência da variabilidade de um fenômeno e dificulta a tomada de
decisões exactas. O tamanho de uma peça de automóvel a ser produzida é uma quantidade incerta,

9
assim como o número de alunos que se vão se matricular em uma determinada disciplina no próximo
período letivo do num determinado curso de graduação. A forma adequada de lidar com a incerteza é
feita por meio do uso de idéias e métodos desenvolvidos na Estatística. Estes métodos básicamente
extraem informações de dados coletados e utilizam o cálculo de probabilidades para delimitar as
decisões com uma certa precisão.

1.3 Estatística Descritiva vs Estatística Inferencial


A Estatística é conhecida, por muitas pessoas, como uma ferramenta meramente descritiva, ou seja,
descreve dados por meio de percentagens, taxas, proporções, gráficos e tabelas. Apesar da Estatística
cumprir, também, este papel de resumir as informações, seu potencial de uso é muito mais amplo.
Para entender o uso da Estatística como ferramenta de apoio à tomada de decisões, temos que
entender o conceito de Estatística Inferencial e sua diferença para a Estatística Descritiva. Abaixo são
apresentadas as funções destas duas abordagens.

A Estatística Descritiva (ou Dedutiva) tem como objetivo resumir as principais características em
um conjunto de dados fazendo uso de tabelas, gráficos e resumos numéricos. Ela descrever os dados e
pode ser comparado ao ato de tirar uma fotografia da realidade. Caso a câmera fotográfica utilizada
não seja adequada, ou esteja sem foco, o resultado, no caso a foto, pode sair distorcido. Portanto,
quem faz uso da estatística deve ter extremo cuidado em escolher os métodos e técnicas corretas para
resumir os dados.

Tabela 1.1: Técnicas de Estatística Descritiva

Ao dispor de uma lista volumosa de


dados, as tabelas de frequência servem
Tableas de para agrupar informações de modo que
frenquência estas possam ser analisadas. As tabelas
podem ser de frequência simples ou de
frequência em intervalos de classe
O objetivo da representação gráfica é
dirigir a atenção do analista para alguns
aspectos2 de um conjunto de dados.

”Um gráfico vale mais que mil palavras”.


Gráficos
Alguns exemplos de gráficos: diagrama de
barras, diagrama em setores, histograma,
box-plot, ramo-e-folhas, diagrama de
dispersão e gráfico sequencial.
Através de medidas ou resumos numéricos
podemos levantar importantes
informações sobre o conjunto de dados
Resumos númericos
tais como: a tendência central,
variabilidade, simetria, valores extremos,
valores discrepantes, etc...

As competências de um analista quantitativo durante a realização de uma análise descritiva podem ser
comparadas às de um detetive que procura evidências que o leve a formular hipóteses com base nas
suas ações.

10
A Estatística Inferencial ( ou Indutiva) tem como objectivo utilizar informações incompletas para
tomar decisões e tirar conclusões satisfatórias. O alicerce das técnicas de estatística inferencial está no
cálculo de probabilidades. As duas técnicas de estatística inferencial são: estimação e teste de
hipóteses.

Tabela 1.2: Técnicas de Estatística Inferencial

A estimação consiste em utilizar um conjunto


de dados incompletos, ao qual iremos chamar
de amostra, e com ele obter estimativas de
Estimação
quantidades de interesse. Estas estimativas
podem ser pontuais (representadas por um
único valor) ou intervalares.
O fundamento do teste estatístico de hipóteses
é levantar suposições(hipóteses) acerca de uma
Teste de
quantidade não conhecida e, também utilizar
hipóteses
dados incompletos para criar uma regra que
permita escolher a hipótese mais adequada.

Um exemplo clássico do uso da Estatística Inferencial ao qual estamos acostumados é apresentado a


seguir.

Exemplo 1: Um instituto de pesquisa deseja estimar a proporção de eleitores do partido de situação no


primeiro turno das eleições presidenciais. Ao coletar uma amostra de 1200 eleitores, a proporção foi
estimada em 54%.

No Exemplo 1, a quantidade a ser estimada é a proporção de eleitores que votarão no partido de


situação nas eleições para presidente. Somente a realização das eleições revelará o verdadeiro valor
desta quantidade. Entretanto, estimá-la, com base em uma amostra, auxilia a tomada de decisões tais
como a alteração de uma estratégia de campanha política.

Uma outra aplicação da estatística inferencial aparece no Exemplo 2 onde duas hipóteses são
colocadas em questão. Será que uma nova droga, a ser lançada, aumenta a produção de um hormônio
?

Exemplo 2: Um laboratório deseja verificar se uma nova droga aumenta a produção de testosterona
em homens com idade acima de 35 anos. Ao aplicá-la em um grupo de 40 indivíduos, constatou-se
que após um período de tempo a droga aumentou significativamente a quantidade do referido
hormônio.

Exemplo 3: Em uma fábrica de parafusos, a peça é considerada dentro da especificação caso seu
comprimento esteja no intervalo entre 4,8cm e 5,2cm. Os técnicos do Controle Estatístico de
Qualidade selecionam diariamente 100 parafusos fabricados e calculam o comprimento médio. Já
existe conhecimento prévio sobre a variabilidade nos tamanhos dos parafusos fabricados, caso o
comprimento médio esteja abaixo de 4,99 cm ou acima de 5,01 cm, o processo será interrompido.

No Exemplo 3, espera-se que o comprimento médio de um conjunto de parafusos amostrados esteja


dentro de um intervalo. Caso isto não ocorra, o processo de produção sofre uma interrupção. Neste
caso, a Estatística Inferencial é utilizada para criar uma regra de decisão com base na observação dos
comprimentos de um subconjunto de 100 peças.

11
1.4 População e Amostra
O uso da estatística inferencial oferece suporte à tomada de decisão com base em apenas uma parte
das informações que interessam no problema estudado. A partir de agora, vamos utilizar os conceitos
de população e amostra para representar, respectivamente, o conjunto total e o conjunto parcial
(incompleto) destas informações.

População é a conjunto de todas as unidades que possuem pelo menos uma característica em comum
que desejamos medir. Estas unidades podem ser pessoas, domicílios, bancos, universidades, etc. Em
muitas ocasiões o termo Universo é utilizado no lugar de População. Repare que na definição de
população não há nada que estabeleça que esta deve ser formada por uma grande quantidade de
unidades, mas sim, por todas as que estamos interessados em investigar.

Amostra é um conjunto menor de unidades retiradas da população, ou seja, um subconjunto da


população. O desejável é que amostra represente bem a população pois, a partir dela a Estatística
inferencial tira conclusões sobre como deve ser a população. Entretanto, nem sempre é fácil garantir
esta representatividade por uma série de fatores. O ideal é que a amostra seja casual (aleatória) para
garantir que as unidades tenham igual chance de serem selecionadas e evitar possíveis vícios nas
inferências que serão feitas, mas em muitas situações não é possível encontrar uma amostra casual.

A caracterização da população está vinculada ao problema a ser estudado. Se um vendedor deseja


fazer um levantamento dos potenciais clientes para o seu produto, a população será formada por todos
os indivíduos com possibilidade de consumir aquele produto. Se este produto for, por exemplo, um
iate, a população deve ser constituída apenas por indivíduos que possuem renda suficiente para
comprá-lo.

Para tornar clara a definição das unidades que fazem parte da população em um levantamento de
dados é importante identificar 3 (três) elementos: a) uma característica em comum; b) a localização
temporal; e c) a localização geográfica.

Exemplo 4: Suponhamos que por um levantamento amostral desejamos estudar a taxa de


negligência/descuido dos clientes de um banco na cidade de Nampula.

titular da conta do banco a ser


Característica
investigado
clientes com cadastro em março
Tempo
de 2009
Região agências da cidade de Nampula

Exemplo 5: A direcção distrital de saúde de Manjacaze tem interesse em previnir a desnutrição em


crianças que é considerada uma dos problemas de saúde em crianças com menos de 5 anos.

crianças que fazem controle de peso


Característica
nos centros de saúde de Manjacaze
Tempo crianças que fazeram controle de

12
peso em 2010
centros de saúde do distrito de
Região
Manjacaze

Sem uma clara definição dos 3 elementos, conforme fora feito nos exemplos acima, torna-se difícil
proceder a coleta de dados. Quando um estudo estatístico é feito levantando-se informações de todas
as unidades da população este chama-se Censo. Há casos em que o levantamento censitário é inviável,
como por exemplo em testes destrutivos. Ao estudar apenas parte da população para inferir sobre o
todo, o levantamento é dito ser por amostragem.

Um elemento importante para a retirada de uma amostra é a existência de um cadastro com a relação
de todas as unidades que compõe a população. Quando este cadastro não existe, não poderemos
selecionar diretamente as unidades e uma possibilidade é selecionar um grupo de unidades.

1.5 Variáveis e suas classificações


Em um levantamento de dados, censitário ou amostral, investiga-se em cada unidade de interesse uma
ou mais características que supostamente variam de uma unidade para outra. Estas características são
chamadas de variáveis.

As variáveis podem ser classificadas em quantitativa ou qualitativa.

As variáveis quantitativas são aquelas que indicam quantidades e permite a realização operações
aritméticas; soma, subtração, divisão, multiplicação.

As variáveis quanlitativas são aquelas que indicam atributo como cor de pele, zona de moradia ou
classe social.

A classificação da variável vai ser determinante para o tipo de análise estatística a ser realizada. Sobre
uma variável qualitativa, não podemos calcular resumos numéricos tais como a média aritmética e
desvio-padrão. Por outro lado, o diagrama em setores (ou gráfico de circular), não é adequado para
representar as frequências das temperatura observadas durante um ano, pois serão muitos valores
diferentes e a consequente formação de muitas fatias.

As variáveis quantitativas possuem uma sub-classificação, elas podem ser discretas ou contínuas.

As Variáveis Quantitativas Discretas são aquelas que ocorrem quando os possíveis valores da
variável podem ser enumerados. Esta situação é típica de dados oriundos de contagens, como por
exemplo numero de filhos em familias residentes num certo quarteirão, o número diário de assaltos
em um quarteirão que pode assumir valores no conjunto {0, 1, 2, 3,…}.

As Variáveis Quantitativas Contínuas são aquelas que ocorrem nos casos em que a variável pode
assumir valores em um intervalo contínuo, por consequência os possíveis valores são infinitos e não-
enumeráveis. A variável idade, ou a altura dos estudantes da UEM, o peso das crianças que nasceram
na matrenidade de um posto de saúde em 2012, por exemplo, é uma variável contínua pois se for
medida com bastante precisão pode gerar como resultado 25,1023... centímetros de altura e, quanto
maior for a precisão, dificilmente dois indivíduos apresentarão alturas iguais.

Apresentamos a seguir alguns exemplos de variáveis quantitativas.

13
Variáveis quantitativas.

Discretas: número de filhos, número de plantas, quantidade de peças.

Contínuas: índice de preços, salário, peso, altura.

Toda variável que não é quantitativa, será classificada como qualitativa. E possuem uma sub-
classificação, elas podem ser categóricas(classes ou níveis) ou nominais.

As Variáveis Qualitativas Ordinais são aquelas que são expressas em classes, níveis (ou categorias).
Ou são aquelas que tomam níveis e estes sejam ordenáveis, isto é, obedecem a uma certa ordem
crescente ou decrescente.

É importante ressaltar que esta ordenação nos níveis (categorias) da variável é natural tal como ocorre
com a variável classe social. Nesta situação, Classe X > Classe Y > Classe Z > Classe W. Como já foi
comentado, o tipo de variável determina o tipo de análise e, para variáveis qualitativas ordinais, um
resumo numérico, uma técnica gráfica ou até uma tabela de frequência deve incorporar a idéia de
ordenação.

As variáveis qualitativas Nomimais são aquelas que não tomam níveis e nem são ordenáveis, isto é,
são apenas nomes (atributos).

Apresentamos a seguir alguns exemplos de variáveis quantitativas.

Variáveis qualitativas (atributos)

Ordinais: classe social, cargo na empresa, classificação de um filme.

Nominais: sexo, bairro, cor de pele, canal de TV preferido.

Além das classificações acima, vamos destacar uma outra situação em que a característica de interesse
é investigada ao longo do tempo (espaço) constituindo o que chamamos de uma série temporal.

14
TAREFAS
Tarefas

1. O que é Estatística?

2. Diga o que é estatística descritiva?

3. Diga o que é estatística indutiva ou inferência estatística?

4. Classifique as variáveis:

a) Estado Civil;

b) Região de Procedência;

c) Número de filhos dos empregados casados;

d) Idade dos estudantes de uma turma da 8ª classe;

e) Temperatura diária da cidade de Maputo;

f) Número de respostas certas de alunos num teste com dez itens;

g) Salários de professores de uma escola primária.

h) categorias professionais de todos os trabalhadores de uma escola

15
Auto-Avaliação

Auto-Avaliação

1. População ou universo é:

a) Um conjunto de pessoas;
b) Um conjunto de elementos quaisquer
c) Um conjunto de pessoas com uma característica comum;
d) Um conjunto de elementos com pelo menos uma característica em comum;
e) Um conjunto de indivíduo de um mesmo município, estado ou país.

2. Uma parte da população retirada para analisá-la denomina-se:

a) Universo;
b) Parte;
c) Pedaço;
d) Dados Brutos;
e) Amostra.

3. A parte da estatística que se preocupa somente com a descrição de determinadas características de


um grupo, sem tirar conclusões sobre um grupo maior denomina-se:

a) Estatística de População;
b) Estatística de Amostra;
c) Estatística Inferencial
d) Estatística Descritiva;
e) Estatística Grupal.

4. Ao longo das nossas aulas vimos que as Variáveis Aleatórias classificam-se em Discretas e
Continuas. Dê doies exemplo de cada uma delas.

5. Ao longo das nossas aulas vimos que as Variáveis Aleatórias classificam-se em Categóricas e
Nominais. Dê doies exemplo de cada uma delas.

6. Classifique as seguintes variáveis em: (QN) Qualitativa nominal, (QO) Qualitativa ordinal
(QC)Quantitativa contínua, (QD)Quantitativa discreta

a) ( ) Cor dos olhos


b) ( ) Número de filhos de um casal
c) ( ) Peso de um indivíduo
d) ( ) Altura de um indivíduo
e) ( ) Número de alunos de uma escola
f) ( ) Tipo sangüíneo
g) ( ) Posicionamento das empresas no mercado

16
h) ( ) Fator RH
i) ( ) Sexo
j) ( ) Comprimento de um segmento de reta
k) ( ) Área de um círculo
l) ( ) Raça
m) ( ) Quantidade de livros de uma biblioteca
n) ( ) Escolaridade dos funcionários de uma empresa
o) ( ) Religião
p) ( ) Salário dos empregados de uma empresa
q) ( ) Comprimento dos parafusos produzidos em uma fábrica
r) ( ) Estado civil
s) ( ) O nível sócio-econômico dos residentes em um bairro de Ipatinga
t) ( ) Tempo de vida de uma lâmpada
u) ( ) Profissão
v) ( ) Número de ações negociadas diariamente na bolsa de valores
w) ( ) Volume de água contida numa piscina
x) ( ) A classificação dos alunos no último vestibular

17
Chave de Correção
Chave de Correção

1. O que é Estatística?
R: A Estatística é um conjunto de métodos e técnicas que auxiliam a tomada de decisão sob a
presença de incerteza

2. Diga o que é estatística descritiva?


R: tem como objetivo resumir as principais características em um conjunto de dados fazendo uso
de tabelas, gráficos e resumos numéricos.

3. Diga o que é estatística indutiva ou inferência estatística?


R: tem como objectivo utilizar informações incompletas para tomar decisões e tirar conclusões
satisfatórias.

4. Classifique as variáveis:

b) Estado Civil;
R: variável qualitativa Nominal

b) Região de Procedência;
R: variável qualitativa Nominal

c) Número de filhos dos empregados casados;


R: variável quantitativa discreta

d) idade dos estudantes de uma turma da 8ª classe;


R: variável quantitativa contínua

e) Temperatura diária da cidade de Maputo;


R: variável quantitativa contínua

f) Número de respostas certas de alunos num teste com dez itens;


R: variável quantitativa discreta

g) Salários de professores de uma escola primária.


R: variável quantitativa contínua

h) categorias professionais de todos os trabalhadores de uma escola


R: variável qualitativa ordinal

18
Unidade Didáctica 2:

Técnicas de amostragem

2.1 Introdução

Por mais que o estudo de todos os elementos da população possibilite um preciso conhecimento das
variáveis que estão sendo pesquisadas, nem sempre é possível obter as informações de todos os
elementos da população. Limitações de tempo, custo e vantagens do uso de técnicas de inferência
justifica o uso de amostragens. Por essa razão, o mais frequente é trabalhar com uma amostra, ou seja,
com uma pequena parte dos elementos que compõe o universo. Torna-se claro que a
representatividade da amostra dependerá do seu tamanho e da forma como é coletada visando obter
uma amostra significativa, e que de fato represente toda a população.

Esta unidade vai se debruçar sobre algumas técnicas usadas na escolha das amostras, de tal modo que
elas sejam representativas, ou seja, guardar semelhanças com a população.

19
Objectivos da unidade 2

Objectivos da Unidade 2

Ao completar esta unidade,você será capaz de:

 Identificar as várias técnicas de amostragem;

 Interpretar as várias técnicas de amostragem;

 Diferenciar as várias técnicas de amostragem;

 Analizar e aplicar as diferentes as várias técnicas de amostragem; e

 Calcular as amostras aplicando as várias técnicas de amostragem

 Interpretar os resultados dos cálculos amostrais.

20
Fontes de Informação e Recursos de
Aprendizagem

Fontes de Informações e Recursos de Aprendizagem

Para consolidar os seus conhecimentos sobre as matérias desta unidade veja:


Costa Neto, P. L. de O. (1977) . Estatística. São Paulo: Edgard Blücher.

Hoei, P. G. (1981). Estatistica elementar. 1ª ed., São Paulo: Editora Atlas.

Fonseca, J. S. At al. (1996). Estatística Aplicada. 6ª. Ed.São Paulo: Atlas.

Moretin, L. (1994). Estatística Básica.São Paulo: Makrom Brooks.

Spiegeli, M.R. Probabilidade e Estatística. São Paulo: MacGraw-Hill.

http://www.portalaction.com.br/content/13-exposi%C3%A7%C3%A3o-dos-dados

2.2 O que é Amostragem?


Amostragem ou, de uma forma menos abreviada, estudo por amostragem, é o estudo de um pequeno
grupo de elementos retirado de uma população (estatística) que se pretende conhecer.

Trata-se de uma técnica de pesquisa na qual um sistema preestabelecido de amostras é considerado


idôneo para representar o universo pesquisado, com margem de erro aceitável.

Existem vários métodos de amostragem, e elas podem ser classificadas em Amostragens não-
probabilística/não-aleatória e Amostragens probabilística/aleatória.

Amostragens não-probabilística/não-aleatória - São utilizadas quando o sorteio não é possível, mas


se faz um esforço para garantir a representatividade. Dentro destas temos a amostragem por
conveniência (ou por acessibildade), amostragem intencional e amostragem por cotas.

a) Por conveniência: Exemplo: Pesquisa onde se fazem perguntas a pessoas próximas ao


pesquisador. Em casos em que se pode considerar que as pessoas que estão passando, naquele
momento, ao lado do pesquisador estão ali por puro acaso.

21
b) Intencional: Exemplo: Escolha de cada indivíduo. O pesquisador determina exatamente que
será observado, mas se esforça garantir a representatividade de sua escolha.

c) Amostragem por cotas: Apresenta maior rigor dentre as amostragens não probabilisticas.

Etapas: classificar a população; determinar a proporção da população para cada classe; e , fixar cotas
em observância a proporção das classes consideradas.

É utilizada quando não existe um cadastro da população que possibilite a realizacao do sorteio
necessário a amostragem aleatória mas, ao mesmo tempo, existe informaçãosuficiente sobre o perfil
populacional .

Para a Amostragem probabilística existe a amostragem simples (ou ocasional), amostragem


sistemática, amostragem estratificada e amostragem por conglomerados.

Vejamos o quadro resumo das amostragens:

a) Amostragem simples ou ocasional

É o processo mais elementar e frequentemente utilizado. Todos os elementos da população têm igual
probabilidade de serem escolhidos. Para uma população finita o processo deve ser sem reposição.
Todos os elementos da população devem ser numerados. Para realizar o sorteio dos elementos
devemos usar a Tabela de Números Aleatórios.

b) Amostragem Sistemática

Trata-se de uma variação da amostragem aleatória simples, conveniente quando a população está
naturalmente ordenada, como fichas em uma Pasta, lista telefônica, etc.

Sendo N o tamanho da população e n o tamanho da amostra desejado, define-se a quantidade :

Sendo K chamado intervalo de amostragem.

Faz-se um sorteio entre os números 1, 2, 3, ..., k, e se obtém o valor i, onde será o meu primeiro
elemento, os demais elementos poderão ser calculados pelo termo geral de uma progressão aritmética
a seguir:

a i n 1 . K

A amostra sistemática é frequentemente utilizada em pesquisas que obrigam que a seleção seja feita
durante a etapa de coleta de dados, por pessoas que não estão familiarizadas com tabelas de números
aleatórios ou com uso de software.

Exemplo de amostragem simples e sistemática.

22
Suponha que uma empresa de telefonia fixa deseja saber o grau de satisfação de seus usuários com
serviços prestados. O número de assinantes é da ordem de 50.000 e nós desejamos selecionar uma
amostra aleatória de 1.000 assinantes com o intuito de obter a avaliação sobre os serviços.

No caso a amostragem simples.


Primeiramente devemos ter os assinantes numerados sequencialmente de 1 a 50.000 e somente após
disso seriam selecionados os 1.000 assinantes. A seleção seria feita com o uso de uma tabela de
números aleatórios ou de software que gere estes números.

No caso da amostragem sistemática

N = 50.000
n = 1.000
N
K
n
.
Isso implica que K 50
.

Portanto devemos selecionar 1 assinante entre os primeiros 50.

Fazendo-se um sorteio entre 1, 2, ..., 50, digamos que foi sorteado o número 10.

Aplicando na fórmula do termo geral de uma progressão aritmética,


obtemos:
a i n 1 .K

A1= 10+(1 - 1).50=10

A2= 10+(2 - 1).50=60

A3= 10+(3 - 1).50=110

E assim sucessivamente, logo temos então os números 10, 60, 110, ... até 1.000 elementos

c) Amostragem estratificada

É um processo de amostragem usado quando nos deparamos com populações heterogêneas, no qual
pode-se distinguir subpopulações mais ou menos homogêneas, denominados estratos.

Após a determinação dos estratos, seleciona-se uma amostra aleatória


de cada uma subpopulação (estrato).

As diversas subamostras retiradas das subpopulações devem ser proporcionais aos respectivos
números de elementos dos estratos e guardarem a proporcionalidade em relação a variabilidade de
cada estrato, obtendo-se uma estratificação óptima.

Exemplo: Vamos obter uma amostra estratificada de 10% da população para a pesquisa da estatura de
90 alunos de uma escola sendo que destes 54 sejam meninos e 36 sejam meninas.

23
São, portanto dois estratos (gênero feminino e gênero masculino) e queremos uma amostra de 10% da
população.

Numeramos os alunos de 1 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90, meninas.

Tomando na tabela de números aleatórios a primeira e a segunda coluna da esquerda, de cima para
baixo, obtemos os seguintes números:

57 28 92 90 80 22 56 79 53 18 53 03 27 05 40

Temos então:

28 22 53 18 03 – para os meninos;

57 90 80 56 – para as meninas;

24
A amostragem pode ser com ou sem reposição dos elementos.

Consideremos N o número de elementos de uma população, e seja n o número de elementos de uma


amostra, então:

Se o processo de retirada dos elementos for com reposição o número


de amostras possíveis será:

Número de amostras = Nn

Se o processo de retirada dos elementos for sem reposição o número de amostras possíveis será:

Número de amostras:

!
! !

2.3 Dimensionamento da amostra


Procedimentos:

1°) Analise o questionário, ou roteiro da entrevista e escolha uma variável que julgue mais importante
para o estudo. Se possível, escolha mais do que uma variável.

2°) Verifique o nível de mensuração da variável: se nominal, ordinal ou intervalar.

3°) Considere o tamanho da população: finita ou infinita.

4°) Se a variável escolhida for intervalar e a população considerada infinita, você poderá determinar o
tamanho da amostra pela fórmula:

onde: Z é a abscissa da distribuição normal padrão, fixado um nível de (1 - α)% de confiança para
construção do intervalo de confiança para a média.

Se o nível for de 90%, Z = 1,645.

Se o nível for de 95,5%, Z = 2.

Se o nível for de 95%, Z = 1,96.

Se o nível for de 99%, Z = 2,57.

25
Geralmente, utiliza-se Z = 2 , isto é, admite-se (1 - α)% = 95,5%.

σ é o desvio padrão da população, expressão na unidade variável. Você poderá avaliá-lo de, pelo
menos, uma das três maneiras:

- Especificações técnicas;

- Resgatar o valor de estudos semelhantes;

- Fazer conjecturas sobre possíveis valores.

Obs.: Se o desvio padrão não for conhecido devemos utilizar um valor preliminar obtido por
processos como por exemplo, fazer uma aproximação atrevês da seguinte fórmula:


4

ou realizar um estudo piloto, iniciando o processo de amostragem. Com base na primeira coleção de
pelo menos 31 valores amostrais selecionados aleatoriamente, calcular o desvio-padrão amostral e
utilizá-lo em lugar do desvio padrão populacional. Este valor pode ser refinado com a obtenção de
mais dados amostrais.

Sendo d o erro amostral, expresso na unidade da variável. O erro amostral é a máxima diferença que o
investigador admite suportar entre µ e X, isto é: |µ - X| < d , onde µ é a verdadeira média
populacional, que ele não conhece, e X será a média amostral a ser calculada a partir da amostra.

5°) Se a variável escolhida for intervalar e a população finita, tem-se:

. .
1 .

onde:

Z = abscissa da distribuição normal padrão (veja comentaria do item 4°);

σ = desvio padrão da população (veja comentaria do item 4°);

N = tamanho da população;

d = erro amostral (veja comentaria do item 4°).

6°) Se a variável escolhida for nominal ou ordinal, e a população considerada infinita, você poderá
determinar o tamanho da amostra pela fórmula:

. ̂.

onde:
Z = abscissa da distribuição normal padrão (veja comentaria do item 4°);

26
̂
̂ = estimativa da verdadeira proporção de um dos níveis da variável escolhida. Por exemplo, se a
variável escolhida for porte da empresa, ̂ poderá ser a estimativa da verdadeira proporção de grandes
empresas do setor que está sendo estudado.

Será expresso em decimais. Assim, se ̂ = 30%, teremos: ̂ = 0,30 .

E: 1 ̂

Obs.: Se ̂ forem desconhecidos, substituímos ̂ por 0,5, obtendo a seguinte estimativa:

. 0,25

Onde :

d = erro amostral, expresso em decimais. O erro amostral neste caso será amáxima diferença que o
investigador admite suportar entre p e ̂ , isto é: p - ̂ < d , em que p é a verdadeira proporção, que ele
não conhece, e ̂ será a proporção (frequência relativa) do evento a ser calculado a partir da amostra.

7°) Se a variável escolhida for nominal ou ordinal e a população finita,


tem-se que:

Onde:
Z = abscissa da distribuição normal padrão (veja comentaria do item 4°);

pˆ = estimativa da proporção (veja comentaria do item 6°);

qˆ = 1- pˆ (veja comentaria do item 6°);

d = erro amostral (veja comentaria do item 6°);

N = tamanho da amostra.

Estas fórmulas são básicas para qualquer tipo de composição da amostra; todavia, existem fórmulas
específicas segundo o critério de composição da amostra.

Se o investigador escolhe mais de uma variável, deve optar pelo maior “n” obtido.

Exemplos:

27
a) Suponha que a variável escolhida em estudo seja o peso de certa peça e que a população seja
infinita. Pelas especificações do produto, o desvio padrão é de 10kg. Logo, admitindo um nível de
confiança de 95,5% e m erro amostral de 1,5kg, temos:

Ou seja: com uma amostra aleatória simples de 178 peças, há um erro máximo de 1,5kg para construir
um intervalo de confiança para o peso médio, com nível de confiança de 95,5%.

b) Admitimos os mesmos dados do exemplo anterior e uma população finita de 600 peças.

Logo:

c) Suponha que a variável escolhida em um estudo seja a proporção de eleitores favoráveis ao


candidato X e que o investigador tenha elementos para suspeitar que essa porcentagem seja de
30%. Admitir a população infinita, um nível de confiança de 99% e um erro amostral de 2% (ou
seja, que a diferença entre a verdadeira proporção de eleitores do candidato X e a estimativa a ser
calculada na amostra seja no máximo de 2%).

Assim.

Ou seja, consultando, aleatoriamente, 3.468 eleitores, poderemos fazer inferência da verdadeira


proporção de eleitores do candidato X, com erro máximo de 2%.

d) Admitir os mesmo dados do exemplo anterior e que a população de eleitores seja finita de 20.0000
eleitores.

Logo:

Obs.: Como determinar o valor de Z?

28
Se Z - 90% então

A segurir, ir na tabela da distribuição normal e ver em qual linha e coluna está o valor 0,450,
localizado vemos que o valor na linha é 1,6 e na coluna é 0,04, o que corresponde a 1,6+0,04=1,64.

Se Z - 98% então

A seguir ir na tabela da distribuição normal e ver em qual linha e coluna está o valor 0,490, localizado
vemos que o valor na linha é 2,3 e na coluna é 0,03, o que corresponde a 2,3+0,03=2,33

29
TAREFAS
Tarefas

Depois da leitura da bibliografia recomendada, resolva os seguintes Exercícios:

1. Um estatístico deseja estimar a renda média para o primeiro ano de trabalho de um professor.
Quantos valores de renda devem ser tomados, se o estatístico deseja ter 95% de confiança em que
a média amostral esteja a menos de 500,00 Mt da verdadeira média populacional? Suponha que
saibamos, por um estudo prévio, que para tais rendas, σ = 6250,00 Mt.

2. Baseado nos dados do exercícios 1, utilize uma margem de erro maior, como 1.000,00 Mt e
determine qual seria o tamanho da amostra necessária nesta situação.

3. Uma pesquisa é planeada para determinar as despesas médicas anuais das famílias dos
empregados de uma grande eescola. A direcção da escola deseja ter 95% de confiança de que a
média da amostra está no máximo com uma margem de erro de ± 50,00 Mt da média real das
despesas médicas familiares. Um estudo-piloto indica que o desvio-padrão pode ser calculado
como sendo igual a 400,00 Mt.
a) Qual o tamanho de amostra necessário?
b) Se a direcção da escola deseja estar certa em uma margem de erro de ± 25, Mt que tamanho de
amostra será necessário?

4. O teste de QI padrão é planeado de modo que a média seja 100 e o desvio padrão para adultos
normais seja 15. Ache o tamanho da amostra necessária para estimar o QI médio dos instrutores
de estatística. Queremos ter 99% de confiança em que nossa média amostral esteja a menos de 1,5
pontos de QI da verdadeira média. A média para esta população é obviamente superior a 100, e o
desvio padrão é provavelmente inferior a 15, porque se trata de um grupo com menor variação do
que um grupo selecionado aleatoriamente da população geral; portanto, se tomamos σ =15,
estaremos sendo conservadores, por utilizarmos um valor que dará um tamanho de amostra no
mínimo tão grande quanto necessário.
Suponha σ =15 e determine o tamanho da amostra necessário.

5. Uma assistente social deseja saber o tamanho da amostra (n) necessário para determinar a
proporção da população atendida por uma Unidade de Saúde, que pertence ao município de
Matola. Não foi feito um levantamento prévio da proporção amostral e, portanto, seu valor é
desconhecido. Ela quer ter 90% de confiança que sua amostr e o erro máximo de estimativa (d)
seja de ± 5% (ou 0,05). Quantas pessoas necessitam ser entrevistadas?

30
6. Baseado nos dados do exercício 5, utilize uma margem de erro maior, como ± 0,20 (20%) e
determine qual seria o tamanho da amostra necessário quando o nível de confiança é 90% e
quando é 95%.

7. Dada a seguinte população: (rendas em 1.000,00 Mt)

a) Calcular o tamanho da amostra para estimar a média, sendo d = 2.000,00 Mt, σ = 7.000,00 Mt e
(1 - α )% = 95,5%.
b) Retirar uma amostra aleatória simples, considerando o tamanho amostral obtidono item anterior.
c) Calcular sua média amostral.
d) Calcular o desvio padrão amostral.
e) Calcular a média da população e verifique se |µ - |≤d.

8. Sendo pˆ = qˆ = 0,5 , população infinita, d = 0,05 e (1 - α)% = 95,5%, determinar o tamanho


amostral.

9. Sendo pˆ = qˆ = 0,5 , população de 200.000, d = 0,05 e (1- α a )% = 95,5%, determinar o tamanho


amostral. Comparar com o resultados obtido no exercício 8.

10. Qual é o tamanho da amostra que o Departamento de Trânsito da cidade de Maputo deve tomar para
estimar a porcentagem de semáforos defeituosos, se o objetivo é ter 95,5% de confiança em não
errar mais de 3%.

11. Estudos anteriores mostram que o desvio padrão da altura dos homens que estudam na Facudade de
educação é de 10cm. Querendo estimar a atura média de todos os homens dessa Facudade, com
tolerância de 3cm e probabilidade de 0,955, quantas observações deverão ser utilizadas?

31
12. Qual é o tamanho necessário da amostragem que um alfaiate deve usar se deseja estimar o tempo
médio que os fregueses levam ao trocador? Ele acha que o desvio padrão é de 3 minutos, com base
em amostras anteriores, e deseja estimar a média a menos de 1 minuto, usando um nível d 95,5%.

13. Na cidade de Maputo, há 10.000 árvores. Qual deve ser o tamanho da amostra que o Departamento
de Jardins precisa tomar para estimar a porcentagem de plantas que merecem podas, se o objetivo é
ter 99% de confiança de não errar mais de 3%?

14. Segundo dados de uma pesquisa anterior, 40% dos alunos de certa escola são camponeses. Admita
um erro de 2,5%, (1 - α)% = 95,5%, para dimensionar tamanho de amostra de camponeses. Sabe-se
que a escola tem 5.000 alunos matriculados.

15. Um engenheiro encarregado do controle de qualidade deseja estimar a fração de artigos


defeituosos de um grande lote de lâmpadas. Com base em sua experiência, ele sabe que a fração
efetiva de lâmpadas defeituosas deve estar próxima de 0,2. Que tamanho deve ter uma amostra, se
ele desejar estimar a verdadeira fração de lâmpadas defeituosas com tolerância de 0,01, usando
um nível de confiança de 98%.

32
Auto-Avaliação

Auto-Avaliação

1. Numa pesquisa para uma eleição presidencial, qual deve ser o tamanho de uma amostra aleatória
simples, se se deseja garantir um erro amostral não superior a 2% ?

2. Numa empresa com 1000 funcionários, deseja-se estimar a percentagem dos favoráveis a certo
treinamento. Qual deve ser o tamanho da amostra aleatória simples que garanta um erro amostral
não superior a 5%?

3. Uma operadora telefônica pretende saber a opinião de seus assinantes comerciais sobre seus
serviços na cidade de Vargem Alegre. Supondo que há 25037 assinantes comerciais, e a amostra
precisa ter no mínimo 800 elementos. Mostre como seria organizada uma amostragem sistemática
para selecionar os respondentes.

4. Imagine que você tem 500 cadastros arquivados em sua escola e você quer uma amostra de 2%
desses cadastros. Como você obteria uma amostra sistemática?

33
Chave de Correção
Chave de Correção

1. Um estatístico deseja estimar a renda média para o primeiro ano de trabalho de um professor.
Quantos valores de renda devem ser tomados, se o estatístico deseja ter 95% de confiança em que
a média amostral esteja a menos de 500,00 Mtda verdadeira média populacional? Suponha que
saibamos, por um estudo prévio, que para tais rendas, σ = 6250,00 Mt

Queremos determinar o tamanho n da amostra, dado que a = 0,05 (95% de confiança). Desejamos que
a média amostral seja a menos de 500 Mt da média populacional, de forma que d = 500 . Supondo σ =
6250,00 Mt , aplicamos a equação abaixo, obtemos:

Devemos, portanto, obter uma amostra de ao menos 601 rendas de primeiro ano, selecionadas
aleatoriamente, da faculdade de educação que tenham feito um curso professorado. Com tal amostra
teremos 95% de confiança em que a média amostral difira em menos de 500,00 Mt da verdadeira
média populacional.

2. Baseado nos dados do exercícios 1, utilize uma margem de erro maior, como 1.000,00 Mt e
determine qual seria o tamanho da amostra necessária nesta situação.

Dados do problema:

α = 0,05 (95% de confiança) Z = 1,96


d = 1000 .
σs = 6250,00 , aplicando a equação abaixo, obtemos:

Devemos, portanto, obter uma amostra de ao menos 151 rendas de primeiro ano, selecionadas
aleatoriamente, de professores da faculdade que tenham feito um curso de professorado. Com tal
amostra teremos 95% de confiança em que a média amostral difira em menos de 1.000,00 Mt da
verdadeira média populacional.

3. Uma pesquisa é planejada para determinar as despesas médicas anuais das famílias dos
empregados de uma grande empresa. A gerência da empresa deseja ter 95% de confiança de que

34
a média da amostra está no máximo com uma margem de erro de ± 50 Mt da média real das
despesas médicas familiares. Um estudo-piloto indica que o desvio-padrão pode ser calculado
como sendo igual a 400 Mt.

a) Qual o tamanho de amostra necessário?

Dados do problema:
α = 0,05 (95% de confiança) Z = 1,96
d = 50 .
σ = 400 , aplicando a equação abaixo, obtemos:

Devemos, portanto, obter uma amostra de ao menos 246 despesas médicas, selecionadas
aleatoriamente, de famílias dos empregados. Com tal amostra teremos 95% de confiança em que a
média amostral difira em menos de 50 Mt da verdadeira média populacional.

b) Se a gerência deseja estar certa em uma margem de erro de ± 25 Mt, que tamanho de amostra
será necessário?
c)
Dado do problema:

α = 0,05 (95% de confiança) Z = 1,96


d = 25 .
σ = 400 , aplicando a equação abaixo, obtemos:

Devemos, portanto, obter uma amostra de ao menos 984 despesas médicas, selecionadas
aleatoriamente, de famílias dos empregados. Com tal amostra teremos 95% de confiança em que a
média amostral difira em menos de 25 Mt da verdadeira média populacional.

4. O teste de QI padrão é planejado de modo que a média seja 100 e o desvio padrão para adultos
normais seja 15. Ache o tamanho da amostra necessária para estimar o QI médio dos instrutores
de estatística. Queremos ter 99% de confiança em que nossa média amostral esteja a menos de
1,5 pontos de QI da verdadeira média. A média para esta população é obviamente superior a 100,
e o desviopadrão é provavelmente inferior a 15, porque se trata de um grupo com menor variação
do que um grupo selecionado aleatoriamente da população geral; portanto, se tomamos σ =15,
estaremos sendo conservadores, por utilizarmos um valor que dará um tamanho de amostra no
mínimo tão grande quanto necessário. Suponha σ =15 e determine o tamanho da amostra
necessário.

Dado do problema:
α = 0,01 (99% de confiança) Z = 2,57

35
d = 1,5 .
σ = 15 , aplicando a equação abaixo, obtemos:

Devemos, portanto, obter uma amostra de ao menos 661 instrutores de estatística, selecionadas
aleatoriamente. Com tal amostra teremos 99% de confiança em que a média amostral difira em
menos de 1,5 da verdadeira média populacional.

5. Uma assistente social deseja saber o tamanho da amostra (n) necessário para determinar a
proporção da população atendida por uma Unidade de Saúde, que pertence ao município da
Matola. Não foi feito um levantamento prévio da proporção amostral e, portanto, seu valor é
desconhecido. Ela quer ter 90% de confiança que sua o erro máximo de estimativa (d) seja de ±
5% (ou 0,05). Quantas pessoas necessitam ser entrevistadas?

Dados do problema:
α = 0,1 (90% de confiança) Z = 1,645
d = 5% = 0,05 , aplicando a equação abaixo, obtemos:

Devemos, portanto, obter uma amostra de 271 pessoas para determinar a proporção da população
atendida na Unidade de Saúde, que se origina do município da Matola.

6. Baseado nos dados do exercício 5, utilize uma margem de erro maior, como ± 0,20 (20%) e
determine qual seria o tamanho da amostra necessário quando o nível de confiança é 90% e
quando é 95%.

Dados do problema para 90% de nível de confiança:


α = 0,1 (90% de confiança) Z = 1,645
d = 20% = 0,20 , aplicando a equação abaixo, obtemos:

Devemos, portanto, obter uma amostra de 17 pessoas para determinar a proporção da população
atendida na Unidade de Saúde, que se origina do município da Matola.

Dados do problema para 90% de nível de confiança:


α = 0,05 (95% de confiança) Z = 1,96

36
d = 20% = 0,20 , aplicando a equação abaixo, obtemos:

Devemos, portanto, obter uma amostra de 25 pessoas para determinar a proporção da população
atendida na Unidade de Saúde, que se origina do município da Matola.

7. Dada a seguinte população: (rendas em 1.000,00 Mt)

a) Calcular o tamanho da amostra para estimar a média, sendo d = 2.000,00 Mt, σ = 7.000,00 Mt e
(1 – α)% = 95,5%.

Dados do problema:
(1 – α)% = 95,5%, Z = 2
d = 2.000,00 Mt
σ = 7.000,00 Mt aplicando a equação abaixo, obtemos:

b) Retirar uma amostra aleatória simples, considerando o tamanho amostral obtido no item anterior.

37
Utilizando uma tabela de números aleatórios obtemos os seguintes números para uma seleção de
34 números:

57, 28, 92, 90, 80, 22, 56, 73, 53, 18, 53, 03, 27, 05, 40, 54, 71, 61, 82, 89, 00 62, 94, 44, 97, 39,
60, 03, 41, 77, 28, 74, 00, 05, 62, 72, 80, 59, 38, 91, 01, 24, 44, 99, 92, 08, 58.

Selecionamos os primeiro 34 números:

29, 34, 15, 26, 04, 16 18, 13, 10, 05, 13, 17, 18, 07, 14, 11, 21 36, 32, 17, 05, 12, 21, 30, 14, 17,
22, 15, 20, 26, 25, 30, 17, 09.

c) Calcular sua média amostral.

d) Calcular o desvio padrão amostral.

e) Calcular a média da população e verifique se

8. Sendo pˆ = qˆ = 0,5 , população infinita, d = 0,05 e (1-a )% = 95,5%, determinar o tamanho


amostral.

Dados do problema:
(1 - α)% = 95,5% e Z = 2
pˆ = qˆ = 0,5
d = 0,05 , aplicando a equação abaixo, obtemos:

38
9. Sendo pˆ = qˆ = 0,5 , população de 200.000, d = 0,05 e (1 - α)% = 95,5%, determinar o tamanho
amostral. Comparar com o resultados obtido no exercício 8.

Dados do problema:

(1 - α)% = 95,5% e Z = 2
N = 200.000
pˆ = qˆ = 0,5
d = 0,05 , aplicando a equação abaixo, obtemos:

Comparando os resultados, verifica-se que o cálculo do tamanho amostral para uma população de
200.000 dá, aproximadamente, o mesmo resultado, se considerarmos a população infinita.

10. Qual é o tamanho da amostra que o Departamento de Trânsito da cidade de Maputo deve tomar
para estimar a porcentagem de semáforos defeituosos, se o objetivo é ter 95,5 % de confiança em
não errar mais de 3 %.

Dados do problema:

(1 - α)% = 95,5 % e Z = 2
pˆ = qˆ = 0,5
d = 3% = 0,03 , aplicando a equação abaixo, obtemos:

11. Estudos anteriores mostram que o desvio padrão da altura dos homens que estudam na Faculdade
de Educação é de 10 cm. Querendo estimar a atura média de todos os homens dessa Faculdade,
com tolerância de 3cm e probabilidade de 0,955, quantas observações deverão ser utilizadas?

39
Dados do problema:
(1 - α)% = 95,5% e Z = 2
σ =10 cm
d = 3, aplicando a equação abaixo, obtemos:

12. Qual é o tamanho necessário da amostragem que um alfaiate deve usar se deseja estimar o tempo
médio que os fregueses levam ao trocador? Ele acha que o desvio padrão é de 3 minutos, com
base em amostras anteriores, e deseja estimar a média a menos de 1 minuto, usando um nível de
95,5%.

Dados do problema:
(1 - α)% = 95,5% e Z = 2
σ = 3cm
d = 1 , aplicando a equação abaixo, obtemos:

13. Na cidade de Maputo, há 10.000 árvores. Qual deve ser o tamanho da amostra que o
Departamento de Jardins precisa tomar para estimar a porcentagem de plantas que merecem
podas, se o objetivo é ter 99% de confiança de não errar mais de 3%?

Dados do problema:
N =10.000
(1 - α)% = 99% e Z = 2,57
pˆ = qˆ = 0,50
d = 3% = 0,03 , aplicando a equação abaixo, obtemos:

14. Segundo dados de uma pesquisa anterior, 40% dos alunos de certa escola são são camponeses.
Admita um erro de 2,5%, (1-a )% = 95,5%, para dimensionar tamanho de amostra de são
camponeses. Sabe-se que a escola tem 5.000 alunos matriculados.

Dados do problema:
N = 5.000

40
(1 - α)% = 95,5% e Z = 2
pˆ = 40% = 0,40
qˆ = (1- 0,4) = 0,60
d = 2,5% = 0,025 , aplicando a equação abaixo, obtemos:

15. 15) Um engenheiro encarregado do controle de qualidade deseja estimar a fração de artigos
defeituosos de um grande lote de lâmpadas. Com base em sua experiência, ele sabe que a fração
efetiva de lâmpadas defeituosas deve estar próxima de 0,2. Que tamanho deve ter uma amostra,
se ele desejar estimar a verdadeira fração de lâmpadas defeituosas com tolerância de 0,01, usando
um nível de confiança de 98%.

Dados do problema:
(1 - α)% = 98% e Z = 2,33
pˆ = 0,2
qˆ = (1- 0,2) = 0,8
d = 0,01, aplicando a equação abaixo, obtemos:

41
Unidade Didáctica 3:

Métodos estatísticos de colecta e análise


de dados

3.1 Introdução

Os objetivos desta aula visam apresentar a você o processo de coleta, e análise de dados, os quais são
extremamente importantes tanto nas pesquisas de campo quanto nas pesquisas experimentais. Ao final
desta aula, você deverá esta apto a desenvolver métodos de observação da realidade, métodos de
experimentação, de coleta de dados, bem como a manipulação estatística de dados com sua exposição
a partir de gráficos e tabelas. Desta forma, você deverá saber como avaliar e interpretar criticamente
dados estatísticos e numéricos..

Esta unidade vai se debruçar sobre alguns do métodos estatísticos básicos de colecta e análise de
dados usados na Estatistica.

42
Objectivos da unidade 3

Objectivos da Unidade 3

Ao completar esta unidade,você será capaz de:

 Identificar os vários métodos de colecta de dados;

 Interpretar os vários métodos de colecta de dados;

 Diferenciar os vários métodos de colecta de dados;

 Aplicar os diferentes métodos de colecta de dados; e

 Interpretar a importância da aplicação dos métodos de colecta de dados.

43
Fontes de Informação e Recursos de
Aprendizagem

Fontes de Informações e Recursos de Aprendizagem

Para consolidar os seus conhecimentos sobre as matérias desta unidade veja:


Costa Neto, P. L. de O. (1977) . Estatística. São Paulo: Edgard Blücher.

Hoei, P. G. (1981). Estatistica elementar. 1ª ed., São Paulo: Editora Atlas.

Fonseca, J. S. At al. (1996). Estatística Aplicada. 6ª. Ed.São Paulo: Atlas.

Moretin, L. (1994). Estatística Básica.São Paulo: Makrom Brooks.

Spiegeli, M.R. Probabilidade e Estatística. São Paulo: MacGraw-Hill.

http://www.portalaction.com.br/content/13-exposi%C3%A7%C3%A3o-dos-dados

3.2 Colecta de dados


A qualidade da solução está diretamente relacionada com a qualidade dos dados obtidos. Podemos
evitar que alguns problemas ocorram observando fatos como:

 Não se deve coletar dados sem que antes se tenha definido claramente o problema ou situação
a ser enfrentada, bem como os objetivos com relação aos mesmos;
 Os sistemas de medição (instrumento, operadores, método, meio) que serão utilizados devem
ser avaliados e ter capacidade de medição suficiente;
 Os cálculos e leituras devem ser feitos com muita atenção para evitar distorções;
 Devem ser utlizados métodos adequados para coleta de dados de acordo com o problema
estudado.

Uma amostra é uma parcela de uma população que pode conter informações sobre esta população.
Outra definição importante (para a escolha da técnica estatística e das interpretações dos resultados) é
a classificação dos dados.

44
3.3 Planeando a coleta de dados
Para estudarmos adequadamente uma população através de uma amostra, devemos planejar a coleta de
dados. Com este objetivo, formulamos algumas perguntas:

 Com que frequência ocorrem os problemas?


 Quais são as causas potenciais do problema?

Um bom planejamento para coleta de dados deve considerar as seguintes perguntas:

 Qual a pergunta a ser respondida?


 Como comunicar a resposta obtida?
 Qual ferramenta de análise pretendemos usar e como utilizar os resultados?
 Qual tipo de dado é necessário para utilizar as ferramentas desejadas e responder a pergunta?
 Como coletar esses dados com o mínimo de esforço e erro?
 Onde acessar estes dados?
 Quem pode nos fornecer os dados?
 Qual o período em que os dados serão coletados?

Tendo as respostas para estas perguntas, devemos:

45
 Construir uma metodologia para nos certificar de que todas as informações estão definidas;
 Coletar os dados de forma consistente e honesta;
 Certificar-se de que existe tempo suficiente para a coleta de dados;
 Definir quais informações adicionais serão necessárias para estudos futuros, referências ou
reconhecimento.

3.4 - Exposição dos dados


Antes da exposição dos dados coletados é necessário que se faça um trabalho de revisão e correção
nos dados coletados na tentativa de eliminar possíveis enganos na elaboração do relatório.
Inicialmente, os dados podem ser classificados como "qualitativos" ou "quantitativos". Através desta
classificação, vamos definir algumas técnicas para resumir o conjunto de dados.

3.4.1 Dados qualitativos


Os dados qualitativos representam uma característica da qualidade (ou atributo) associado ao item
pesquisado. Por exemplo, podemos classificar um produto em: bom, razoável ou ruim. Os dados
qualitativos podem ser divididos em dois tipos:

 Dado qualitativo nominal - Para o qual não existe nenhuma ordenação nas
possíveis realizações;
 Dado qualitativo ordinal - Para o qual existe uma ordem em seus resultados.

Exemplo 1.3.1: Uma indústria de calculadoras eletrônicas, preocupada com vários defeitos que um de
seus produtos vem apresentando, fez um levantamento e constatou os seguintes problemas:

 A: Defeito na cobertura plástica;


 B: Defeito no teclado;
 C: Defeito na fonte de energia;
 D: Soldas soltas;
 E: Defeito na placa da unidade de processamento;
 F: Defeito no visor;
 G: Outros.

Este é um típico exemplo de dados qualitativos nominais. Nesta situação, para cada item inspecionado,
existe uma variável T que representa o tipo de defeito encontrado. Portanto, essa variável T pode assumir
os valores: T = A, T = B, ... ,T = G. Logo, por exemplo, para uma calculadora com defeito na cobertura
plástica, temos que T = A. A seguir, temos uma Tabela com os valores observados.

Tipo de Problemas (T) Frequência


A 10
B 20
C 55
D 80

46
E 25
F 3
G 7

Neste exemplo, todos os defeitos apresentam o mesmo nível de severidade e portanto, não apresentamos
uma ordem entre os atributos (defeitos). Neste caso, temos um exemplo de dados qualitativos nominal.

Exemplo 1.3.2: Em um concurso público foram contabilizados os números de pessoas inscritas segundo
os níveis de escolaridade: fundamental completo, médio completo, superior completo e pós-graduação
completa. Segue abaixo a Tabela com os valores observados.

Nível de escolaridade Inscritos


Fundamental completo 451
Médio completo 627
Superior completo 292
Pós-graduação completa 95

Neste exemplo, temos um ordem natural entre os atributos (nível de escolaridade) e consequentemente,
temos um exemplo de dados qualitativos ordinais.

Dados quantitativos

Neste caso, a característica observada assume valores numéricos que podem ser classificados em
"discretos" ou "contínuos".

3.4.2 Dados quantitativos discretos


Os dados quantitativos discretos assumem valores dentro de um conjunto com os números especifiados.
Por exemplo, o número de produtos produzidos por uma máquina em um determinado período de tempo
pode ser 0,1,2,3,4,... Neste caso, os dados observados formam um conjunto finito (ou enumerável) de
números. Geralmente, quando contamos defeitos, temos dados quantitativos discretos.

Exemplo 1.3.3: Em um hospital, foram contabilizados o número de pessoas com diabetes em 20 grupos
de 1000 pessoas cada. Neste caso, obtemos os seguintes dados: 10, 12, 9, 11, 10, 8, 9, 10, 7, 10, 8, 9, 9, 10,
10, 11, 9, 11, 10, 10. Um possível resumo dos dados é desenvolvido na Tabela a seguir

Pessoas com Apuração dos Nº de


diabetes grupos grupos
7 / 1
8 // 2
9 ///// 5
10 //////// 8
11 /// 3

47
12 / 1

Portanto, a variável "número de pessoas com diabetes" assume valores discretos, isto é, inteiros: ...,7,8,9,...

3.4.3 Dados quantitativos contínuos


Os dados quantitativos contínuos assumem valores em um intervalo contínuo de números. Em geral, este
tipo de dado é proveniente de medições de uma característica da qualidade de uma peça ou produto. Os
possíveis valores incluem "todos" os números do intervalo de variação da característica medida. Por
exemplo, ao medirmos os diâmetros dos eixos de determinados motores com uma célula eletrônica,
obtemos dados quantitativos contínuos.

Exemplo 1.3.4: Numa fábrica de motores elétricos, o gerente de produção precisa avaliar o problema de
ruído excessivo do motor. Uma das possíveis causas está associada com variações no diâmetro do eixo.
Assim, o gerente de produção mediu o diâmetro do eixo de 200 motores e o resultado está apresentado na
Tabela a seguir. Os valores estão em milésimos de milímetros.

Diâmetro do eixo de 200 motores


4,8 4,2 5,1 5,2 4,8 4,7 4,9 4,5 4,9 4,5 4,9 5,1 4,8
4,9 4,8 5,0 5,3 4,9 5,5 5,2 5,1 4,6 4,9 4,8 5,1 4,6
4,3 4,9 4,7 5,2 4,8 4,4 5,6 5,0 5,0 5,0 4,8 5,2 4,5
5,1 4,9 4,8 4,8 5,0 4,8 5,1 5,4 4,2 5,1 4,9 4,6 5,4
4,9 4,3 4,6 4,7 4,7 5,3 4,4 4,7 4,8 5,2 4,5 5,1 4,6
5,7 4,9 5,2 4,8 4,9 4,9 4,4 4,7 4,8 5,1 5,4 5,0 4,4
5,1 4,9 4,9 5,1 5,2 4,7 4,8 4,6 5,2 5,5 5,2 4,2 4,9
4,9 4,8 4,2 5,2 5,1 4,7 5,5 4,7 4,7 4,4 4,8 4,2 5,2
5,0 5,2 4,2 4,9 5,1 4,6 5,4 4,6 4,8 5,2 5,1 4,7 5,2
4,8 5,1 4,6 4,8 5,2 4,5 4,9 4,5 5,4 4,5 4,9 4,6 4,7
4,8 4,2 5,1 5,2 4,8 4,7 4,9 4,7 4,9 4,5 4,7 5,2 5,5
4,9 5,1 4,8 4,9 4,8 5,0 5,3 4,9 5,5 5,2 5,2 4,7 4,8
5,1 4,6 4,9 4,3 4,9 4,7 5,2 4,8 4,4 5,6 4,9 4,9 4,9
5,0 5,0 5,0 5,1 4,9 4,8 4,8 5,0 4,8 5,1 5,1 4,8 5,1
5,4 4,2 5,1 4,9 4,3 4,6 4,7 4,8 5,3 4,4 4,9 4,4 4,7
5,8 4,9 5,2 4,8 4,9

Podemos fazer a apuração considerando intervalos de medidas, como apresentado na Tabela a seguir

Diâmetro do eixo de 200 motores (com apuração)


Diâmetro Apuração Nº de motores apurados
[4,2;4,4) //////////// 12
[4,4;4,6) ////////.../ 16

48
[4,6;4,8) /////////.../// 31
[4,8;5,0) //////////...////// 66
[5,0;5,2) //////////...///// 35
[5,2;5,4) //////////...// 25
[5,4;5,6) //////////// 11
[5,6;5,8) //// 4

Ao estabelecermos intervalos de classes, estamos admitindo que o eixo pode assumir qualquer valor entre
o limite inferior (inclusive) e o limite superior (exclusive).

Exemplo 1.4.1: Considere os dados a baixo e Construa o gráfico de barras correspondente.

Nº de
Nível escolaridade inscritos
Fundamental 451
Médio 627
Superior 292
Pós-graduação 95

Então, o gráfico de barras correspondente seria um gráfico onde os retângulos correspondentes a cada
nível de instrução teria a altura correspondente ao número de inscritos com o respectivo grau de
escolaridade. Podemos resolver este problema utilizando o software Action. O resultado é o seguinte

49
TAREFAS
Tarefas

1. Calcule os pontos médios , as frequências acumuladas, as frequências relativas, as


frequências relativas acumuladas e as frequências acumuladas decrescente.
Intervalo de Classe F
0 |-------- 1 7
1 |-------- 2 8
2 |-------- 3 5
3 |-------- 4 0
4 |-------- 5 9
5 |-------- 6 23
6 |-------- 7 12
7 |-------- 8 0
8 |-------- 9 12
9 |-------- 10 5

2. Para o exercício anterior calcule:

a) Média Aritmética

b) Mediana

c) Moda

3. Calcule na planilha o ponto médio , a freqüência acumulada, a freqüência relativa, a


frequência relativa acumulada e a frequência acumulada decrescente.
N° Acidentes N° Motoristas
0 25
1 20
2 21
3 15
4 13
5 12
6 10
7 9
8 7
9 6
10 2

50
5. Para o execício anterior calcule:

a) Média Aritmética

b) Mediana

c) Moda

6. Os graus finais de matemática de 80 estudantes duma certa universidade estão


apresentados na tabela abaixo.

68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77

7. Com referência a tabela abaixo, determinar:

Graus Nº de Estudantes Fa
[53-59[ 2
[59-65[ 12
[65-71[ 10
[71-77[ 23
[77-83[ 14
[83-89[ 10
[89-95[ 5
[95-101[ 4
Total 80

a) O maior grau;

b) O menor grau;
c) A amplitude total;

d) Os graus dos cinco estudantes mais adiantados;

51
e) Os graus dos cinco estudantes mais atrasados;

f) O grau do estudante classificado em 10o lugar;

g) Quantos estudantes receberam grau igual ou superior a 75;

h) Quantos estudantes receberam grau abaixo de 85:

i) Qual a percentagem de estudantes que receberam graus entre 65 e 85, inclusive e

j) Quais os graus que não apareceram.

8. A tabela que se segue mostra a distribuição de frequências dos salários, em meticais, de


65 trabalhadores duma determinada empresa. Com referência a essa tabela, determinar:

Salários (MZM) No de trabalhadores Fa fr% Fr%


5.000,00 – 5.999,00 8
6.000,00 – 6.999,00 10
7.000,00 – 7.999,00 16
8.000,00 – 8.999,00 14
9.000,00 – 9.999,00 10
10.000,00 - 10.999,00 5
11.000,00 - 11.999,00 2

a) O limite inferior da sexta - classe;

b) O limite superior da quarta classe;

c) O ponto médio da terceira classe;

d) Os limites reais da quinta classe;

e) A amplitude do quinto intervalo de classe;

f) A frequência da terceira classe;

g) A frequência relativa da terceira classe;

h) O intervalo de classe que tem a maior frequência;

i) A percentagem de trabalhadores que ganham menos de 8.000,00Mts;

j) A percentagem de trabalhadores que ganham menos de 10.000,00Mts e pelo menos


6.000,00Mts;

52
9. Os inquéritos realizados em 20 residências de diversas universidades de um determinado
país revelaram os seguintes valores para o número de estudantes de um determinado curso
por residência:

Determine as frequências absoluta, relativa, acumulada absoluta e acumulada relativa;

Estudantes Residências fr% Fa Fr% ci ci.fi


0 – 10 2
10 – 20 4
20 – 30 9
30 – 40 5
Total 20

10. Determine a média e o desvio padrão.

53
Auto-Avaliação

Auto-Avaliação

1. As taxas de juros recebidas por 10 ações durante um certo período foram (medidas em
porcentagens) 2,59; 2,64; 2,60; 2,62; 2,57; 2,61; 2,50; 2,63; 2,64. Calcule a média, a mediana, o
desvio padrão, a variância, valor mínimo, valor máximo, os quartis Q1 e Q3, assimetria e curtose.

2. Para facilitar um projeto de ampliação da rede de esgoto de uma certa região de uma cidade, as
autoridades tomaram uma amostra de tamanho 50 dos 270 quarteirões que compõem a região e
foram encontrados os seguintes números de casas por quarteirão:

a) Construa uma tabela de frequências;

b) Determine as medidas de posição e as medidas de dispersão;

3. Numa pesquisa realizada com 100 famílias, levantaram-se as seguintes informações:

a) Qual a mediana do número de filhos?

b) E a moda?

c) Que problemas enfrentaríamos no cálculo da média de filhos?

4. Considere as informações contidas na tabela abaixo acerca dos salários de 20 funcionários de um


hospital. Faça uma distribuição de frequências e o gráfico histograma correspondente.

54
5. Foram contabilizados o número de pessoas que foram atendidas em um dia em diversas áreas de
um hospital. Os resultados obtidos podem ser encontrados na tabela abaixo. Construa um gráfico
de barras correspondente.

6. Um hospital tem o interesse em determinar a altura média dos pacientes de uma determinada área
e relacioná-la com a incidência de determinada anomalia ortopédica. Foram selecionados 80
pacientes e as alturas (em m) podem ser encontradas na tabela abaixo. Construa a tabela de
distribuição de frequências por intervalos de classes e o histograma correspondente.

55
7. Em um hospital foram coletados os salários (em salários mínimos) de 36 funcionários. Os
resultados estão dispostos na tabela abaixo. Construa a distribuição de frequências em intervalos
de amplitude 2 e o histograma correspondente.

56
Chave de Correção
Chave de Correção

1. Calcule os pontos médios , as frequências acumuladas, as frequências relativas, as


frequências relativas acumuladas e as frequências acumuladas decrescente.
Intervalo de Classe F
0 |-------- 1 7
1 |-------- 2 8
2 |-------- 3 5
3 |-------- 4 0
4 |-------- 5 9
5 |-------- 6 23
6 |-------- 7 12
7 |-------- 8 0
8 |-------- 9 12
9 |-------- 10 5

Xi fi fr % Fa Fr % ci ci.fi
[0-1[ 7 8,6 7 8,6 0,5 3,5
[1-2[ 8 9,8 15 18,4 1,5 12
[2-3[ 5 6,2 20 24,6 2,5 12,5
[3-4[ 0 - 20 24,6 3,5 0
[4-5[ 9 11,1 29 35,7 4,5 40,5
[5-6[ 23 28,4 52 64,1 5,5 126,5
[6-7[ 12 14,8 64 78,9 6,5 78
[7-8[ 0 - 64 78,9 7,5 0
[8-9[ 12 14,8 76 93,7 8,5 102
[9-10[ 5 6,2 81 100 9,5 47,5
Total 81 100 81 100 422,5

Frequências acumuladas decrescentes

Xi fi fr % Fa Fr %
[9-10[ 5 6,2 5 6,2
[8-9[ 12 14,8 17 21
[7-8[ 0 - 17 21
[6-7[ 12 14,8 29 35,8
[5-6[ 23 28,4 52 64,2

57
[4-5[ 9 11,1 61 75,3
[3-4[ 0 - 61 75,3
[2-3[ 5 6,2 66 81,5
[1-2[ 8 9,8 74 91,3
[0-1[ 7 8,6 81 100
Total 81 100 81 100

2. Para o exercício anterior calcule:


a) Média Aritmética

Xi. fi 422,5
5,21
n 81
R: A média Aritmética é de 5,21

b) Mediana
,
5 1 5,5

R: A Mediana é de 5,5

c) Moda
Mo = 5,66
fmo fant. mo
limo Ai .
2 . .
23 9 14
5 1 . 5 1 . 5,66
2 23 9 12 46 21
R: A Moda é igual a 5,66

3. Calcule na planilha o ponto médio , a freqüência acumulada, a freqüência relativa, a


frequência relativa acumulada e a frequência acumulada decrescente.
N° Acidentes N° Motoristas
0 25
1 20
2 21
3 15
4 13
5 12
6 10
7 9
8 7
9 6
10 2

Nº Nº fr% Fa Fr% xi.fi


Acidentes Motoristas

58
0 25 18 25 18 0
1 20 14 45 32 20
2 21 15 66 47 42
3 15 11 81 58 45
4 13 9 94 67 52
5 12 9 106 76 60
6 10 7 116 83 60
7 9 6 125 89 63
8 7 5 132 94 56
9 6 4 138 98 54
10 2 2 140 100 20
Totatl 140 100 472

Ponto médio na planilha = 10-0 /2 = 5

4. Para o execício anterior calcule:


a) Média Aritmética
∑ fi . Xi 479
3.37
n 140
R: A Média Aritmética é igual a 3,37

b) Mediana
N 140 N 2 140 2
70 71
2 2 2 2
3 3 6
Me 3
2 2
R: A Mediana é igual a 3

c) Moda
Mo = 0

5. Os graus finais de matemática de 80 estudantes duma certa universidade estão


apresentados na tabela abaixo.

68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71

59
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77

K =7

a = = 6,28 ≈ 6

A = 97-53 = 44

K ≈1+ 3,22 logn


K ≈1+ 3,22 log 80
K ≈ 7,127 ≈ 7

6. Com referência a tabela abaixo, determinar:

Graus Nº de Estudantes Fa
[53-59[ 2 2
[59-65[ 12 14
[65-71[ 10 24
[71-77[ 23 47
[77-83[ 14 61
[83-89[ 10 71
[89-95[ 5 76
[95-101[ 4 80
Total 80 80

a) O maior grau; 97
b) O menor grau; 53
c) A amplitude total;R=xmax. –xmin.= 97-53 = 44
d) Os graus dos cinco estudantes mais adiantados; 94,95,95,96,97
e) Os graus dos cinco estudantes mais atrasados;53,57,59,60,60
f) O grau do estudante classificado em 10o lugar;88
g) Quantos estudantes receberam grau igual ou superior a 75; 44
h) Quantos estudantes receberam grau abaixo de 85: 63
i) Qual a percentagem de estudantes que receberam graus entre 65 e 85, inclusive e = 65%
j) Quais os graus que não apareceram. = 54,55,56, 58,64,70,91,92.

60
7. A tabela que se segue mostra a distribuição de frequências dos salários, em meticais, de
65 trabalhadores duma determinada empresa. Com referência a essa tabela, determinar:

a) O limite inferior da sexta - classe; 10.000,00 MZM


b) O limite superior da quarta classe; 8.999,00 MZM
c) O ponto médio da terceira classe; 7.499,50 MZM
d) Os limites reais da quinta classe;9.000,00 a 9.998,00 MZM
e) A amplitude do quinto intervalo de classe; 1.999,00 Mts
f) A frequência da terceira classe; 16
g) A frequência relativa da terceira classe; 24,61
h) O intervalo de classe que tem a maior frequência; 7.000,00 – 7.999,00 Mts
i) A percentagem de trabalhadores que ganham menos de 8.000,00Mts; 52,29%
j) A percentagem de trabalhadores que ganham menos de 10.000,00Mts e pelo menos
6.000,00Mts; 76,90%

Salários (MZM) No de trabalhadores Fa fr% Fr%


5.000,00 – 5.999,00 8 8 12,3 12,3
6.000,00 – 6.999,00 10 18 15,38 27,68
7.000,00 – 7.999,00 16 34 24,61 52,29
8.000,00 – 8.999,00 14 48 21,53 73,82
9.000,00 – 9.999,00 10 58 15,38 89,2
10.000,00 - 10.999,00 5 63 7,69 96,89
11.000,00 - 11.999,00 2 65 3,07 100

8. Os inquéritos realizados em 20 residências de diversas universidades de um determinado


país revelaram os seguintes valores para o número de estudantes de um determinado curso
por residência:

Determine as frequências absoluta, relativa, acumulada absoluta e acumulada relativa;

Estudantes Residências fr% Fa Fr% ci ci.fi


0 – 10 2 10 2 10 5 10
10 – 20 4 20 6 30 15 60
20 – 30 9 45 15 75 25 225
30 – 40 5 25 20 100 35 175
Total 20 100 470

9. Determine a média e o desvio padrão.

.
Média: ̅ ∑ 23,5

61
Calculando o desvio padrão tem-se:
∑ ∙

̅ 23,5 635 545,2 89,8
√ √89,8 9,48

62
Unidade Didáctica 4:

Estatística Inferencial

4.1 Introdução
Embora o cálculo das probabilidades pertença ao campo da Matemática, sua inclusão aqui se justifica
pelo fato da maioria dos fenômenos de que trata a Estatística ser de natureza aleatória ou
probabilística. Consequentemente, o conhecimento dos aspectos fundamentais do cálculo de
probabilidades é uma necessidade essencial para o estudo da Estatística Inferencial.

Procuramos resumir aqui os conhecimentos que julgamos necessários para termos um ponto de apoio
em nossos primeiros passos no caminho da Estatística Inferencial. Esses passos serão apresentados no
capítulo seguinte, que trata da conceituação de variável aleatória e das principais distribuições de
probabilidades de variáveis discretas e contínuas.

63
Objectivos da unidade 4

Objectivos da Unidade 4

Ao completar esta unidade,você será capaz de:

 Definir os vários conceitos básicos da probabilidade ;


 Diferenciar espaço amostral ou conjunto universo;
 Identificar os diferentes tipos de conceitos de probabilidades
 Identificar os diferentes tipos de problemas referentes a cada tipos de probabilidades;
 Calcular os diferentes tipos de probabilidades;
 Dar exemplo da aplicação dos diferentes tipos de probabilidades.

64
Fontes de Informação e Recursos de
Aprendizagem

Fontes de Informações e Recursos de Aprendizagem

Para consolidar os seus conhecimentos sobre as matérias desta unidade veja:


Costa Neto, P. L. de O. (1977) . Estatística. São Paulo: Edgard Blücher.

Hoei, P. G. (1981). Estatistica elementar. 1ª ed., São Paulo: Editora Atlas.

Fonseca, J. S. At al. (1996). Estatística Aplicada. 6ª. Ed.São Paulo: Atlas.

Moretin, L. (1994). Estatística Básica.São Paulo: Makrom Brooks.

Spiegeli, M.R. Probabilidade e Estatística. São Paulo: MacGraw-Hill.

http://www.portalaction.com.br/content/1-introdu%C3%A7%C3%A3o-%C3%A0-probabilidade

4.2 Experimento aleatório


Todo o processo de realizar observações e obter dados é denominado experimento

Experimentos Determinísticos: São aqueles cujos resultados podem ser determinados antes de sua
realização.

Por exemplo: quanto tempo levará um carro para percorrer um trajeto de 200 km numa velocidade média
de 100 km/h? Não é necessário executar o experimento para determinar a resposta: 2 horas.

Experimentos Estocásticos ou Aleatórios:São aqueles que , em quase todas as observações, em maior ou


menor grau, vislumbramos o acaso. Assim, da afirmação “é provável que a minha equipe ganhe a partida
de hoje” pode resultar:

a. que, apesar do favoritismo, ele perca;

b. que, como pensamos, ele ganhe;

65
c. que empate.

Como vimos, o resultado final depende do acaso. Fenômenos como esses são chamados fenômenos
aleatórios e os experimentos associados a eles de experimentos aleatórios.

Experimentos aleatórios são aqueles que, mesmo repetidos várias vezes sob condições semelhantes,
apresentam resultados imprevisíveis.

4.3 Espaço amostral


A cada experimento aleatório correspondem, em geral, vários resultados possíveis. Assim, ao lançarmos
uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa. Já ao lançarmos um dado há seis
resultados possíveis: 1, 2, 3, 4, 5, 6.

Ao conjunto formado por todos os possíveis e diferentes resultados de um experimento aleatório dá-se o
nome de espaço amostral ou conjunto universo, representado por S.

Os dois experimentos citados anteriormente têm os seguintes espaços amostrais:

- lançamento de uma moeda: S = {Ca; Co};

- lançamento de um dado: S = {1, 2, 3, 4, 5, 6}.

Outros dois exemplos são:

- dois lançamentos sucessivos de uma moeda: S = {(Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co) };

- lançamento simultâneo de dois dados: S = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), ...., (6,6)}

Cada um dos elementos de S que correspondem a um resultado recebe o nome ponto amostral. Assim:

Para o segundo exemplo 2 ∈ S ⇒ 2 é um ponto amostral de S;

Para o primeiro exemplo {Ca; Co}∈ S ⇒ {Ca; Co} é um ponto amostral de S.

4.4 Eventos
Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento aleatório.

Assim, qualquer que seja E, se E ⊂ S (E está contido em S), então E é um evento de S.

Se E = S, E é chamado de evento certo

66
Se E ⊂ S e E é um conjunto unitário, E é chamado evento elementar.

Se E = ∅, E é chamado evento impossível.

No lançamento de um dado, onde S = {1, 2, 3, 4, 5, 6}., temos:

A = { 2, 4, 6} ⊂ S; logo, A é um evento de S

B = {1, 2, 3, 4, 5, 6}⊂ S; logo, B é um evento certo de S (B = S)

C = {4}⊂ S; logo, C é um evento elementar de S

D = ∅ ⊂ S; logo, D é um evento impossível de S.

Um evento é sempre definido por uma sentença. Assim, os eventos acima podem ser definidos pelas
sentenças:

“Obter um número par na face superior”.

“Obter um número menor ou igual a 6 na face superior”.

“Obter o número 4 na face superior”.

“Obter um número maior que 6 na face superior”.

4.4.1 Operações Com Eventos


O complemento de um evento A é o subconjunto à formado pelos elementos do espaço amostral não
incluídos no evento A. Por exemplo, o complemento do evento A = {CaCo, CoCa} é o evento Ã= {CaCa,
CoCo}.

Dois ou mais eventos de um mesmo espaço amostral podem ser agrupados em operações de união e
interseção, assim definidas:

 A operação União (∪) dos eventos A e B gera um novo evento formado pelos elementos comuns
e não comuns dos dois conjuntos, A e B.

 A operação Interseção dos eventos A e B gera um novo evento formados apenas pelos elementos
comuns aos dois conjuntos, A e B.

Vejamos algumas consequências das operações com eventos:

67
 A união de um evento A e seu complemento à é o próprio espaço amostral S; isto é, A ∪ à = S.

 A interseção de um evento A e seu complemento à é o conjunto vazio, isto é, A ∩ à = ∅.

4.4.2 Eventos Mutuamente Excludentes E Coletivamente


Exaustivos
Os resultados possíveis do lançamento de uma moeda são apenas dois, os eventos elementares Ca e Co.
Pela própria característica do experimento, se o resultado de um lançamento for cara este resultado não
poderá ser também e ao mesmo tempo coroa, pois são eventos mutuamente excludentes. A união de
eventos elementares forma o espaço amostral, pois são eventos coletivamente exaustivos. Portanto,
verifica-se que os eventos A e B pertencentes ao mesmo espaço amostral S:

 São mutuamente excludentes se sua interseção for vazia: A ∩ B = ∅, pois os dois eventos não têm
nenhum elemento em comum. Ex: Os eventos Ca e Co resultantes do lançamento de uma moeda.

 São coletivamente exaustivos se a união dos eventos formarem o espaço amostral: A ∪ B = S,


onde cada evento pode ter elementos repetidos no outro evento. Ex: O espaço amostral da nota
final de Tópicos de Matemática Aplicada está formado por quatro eventos elementares: conceito
A, conceito B, conceito C e conceito D. Os quatro conceitos são eventos mutuamente excludentes
e juntamente são eventos coletivamente exaustivos, pois quando agrupados formam o espaço
amostral de todos os conceitos.

4.5 Probabilidade
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os elementos de
S tenham a mesma chance de acontecer, ou seja, que S é um conjunto equiprovável.

Chamamos de probabilidade de um evento A (A ⊂ S) o número real P(A), tal que:

Onde:

n(A) é o número de elementos de A;

n(S) é o número de elementos de S.

68
EXEMPLOS

a. Considerando o lançamento de uma moeda e o evento A “obter cara”, temos:

S = {Ca,Co} ⇒ n(S) = 2

A = {Ca} ⇒ n(A) = 1

Logo:
1
2

O resultado acima nos permite afirmar que, ao lançarmos uma moeda equilibrada, temos 50% de chance
de que apareça cara na face superior.

b. Considerando o lançamento de um dado, vamos calcular:

- a probabilidade do evento A “obter um número par na face superior”.

Temos:

S = {1, 2, 3, 4, 5, 6} ⇒ n(S) = 6

A = {2, 4, 6}⇒ n(A) = 3

Logo:
3 1

6 2

- a probabilidade do evento B “obter um número menor ou igual a 6 na face superior”.

Temos:

S = {1, 2, 3, 4, 5, } ⇒ n(S) = 6

B = {1, 2, 3, 4, 5, 6} ⇒ n(B) = 6

Logo:
6
1
6

69
- a probabilidade do evento C “obter o número 4 na face superior”.

Temos:

S = {1, 2, 3, 4, 5, 6} ⇒ n(S) = 6

C = { 4 }⇒ n(C) = 1

Logo:
1

6

- a probabilidade do evento D “obter um número maior que 6 na face superior”.

Temos:

S = {1, 2, 3, 4, 5, 6} ⇒ n(S) = 6

B = ∅ ⇒ n(D) = 0

Logo:
0
0
6

Algumas Propriedades:

a. a probabilidade do evento certo é igual a 1:

P S 1

b. a probabilidade do evento impossível é igual a zero:

∅ 0

c. a probabilidade de um evento E qualquer (E ⊂ S) é um número real P(E), tal que:

0 ≤ P(E) ≤ 1

d. a probabilidade de um evento elementar E qualquer é, lembrando que n(E) = 1:

70
1

4.5.1 Eventos Complementares


Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra (sucesso) e q a
probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação:

p+q=1⇒q=1–p

Assim, se a probabilidade de se realizar um evento é a probabilidade de que ele não ocorra é:

1 4
1 1 ⇒ q
5 5

Sabemos que a probabilidade de tirar o 4 no lançamento de um dado é . Logo, a probabilidade de


não tirar o 4 no lançamento de um dado é:
1 5
1 1 ⇒ q
6 6

4.5.2 Eventos Independentes


Dizemos que dois eventos são independentes quando a realização ou a não‐realização de um dos eventos
não afeta a probabilidade da realização do outro e vice-versa.

Por exemplo, quando lançamos dois dados, o resultado obtido em um deles é independe do resultado
obtido no outro.

Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é igual ao
produto das probabilidades de realização de cada um dos eventos.

Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de realização do


segundo evento, a probabilidade de que tais eventos se realizem simultaneamente é dada por:

Lançando dois dados honestos simultaneamente, qual a probabilidade de obtermos 1 no primeiro dado e 5
no segundo dado?

71
Solução

Lançamos dois dados. A probabilidade de obtermos 1 no primeiro dado é: p .

A probabilidade de obtermos 5 no segundo dado é: p .

Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro e 5 no segundo é:

⇒p

4.5.3 Eventos Mutuamente Exclusivos


Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a
realização do(s) outro(s).

Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são mutuamente
exclusivos, já que, ao se realizar um deles, o outro não se realiza.

Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma
das probabilidades de que cada um deles se realize:

EXEMPLO

Lançamos um dado. Qual a probabilidade de se tirar o 3 ou o 5?

Solução:

Como os dois eventos são mutuamente exclusivos, temos:

p ep , então p p =

72
TAREFAS
Tarefas

1. Determinar o espaço amostral relativo aos experimentos abaixo:

2. Dados os algarismos 1, 2, 3, 4, 5, 6 e 7, construímos todos os números que podem ser


representados usando dois deles (sem repetir). Escolhendo ao acaso (aleatoriamente) um dos
números formados, qual a probabilidade de o número sorteado ser:

a) par:

b) múltiplo de 5?

3. Em um lote de 12 peças, 4 são defeituosos. Sendo retirada uma peça, calcule:

a) a probabilidade dessa peça ser defeituosa

b) a probabilidade dessa peça não ser defeituosa

4. Joga-se um dado honesto. O número que ocorreu (isto é, da face voltada para cima) é o coeficiente
b da equação x2 + bx - 1 = 0.

Determine:

a) a probabilidade de essa equação ter raízes reais;

b) a probabilidade de essa equação ter raízes reais, sabendo-se que ocorreu um número ímpar.

5. No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5

6. Um baralho tem 12 cartas, das quais 4 são ases. Retiram‐se 3 cartas ao acaso. Qual a
probabilidade de haver pelo menos um ás entre as cartas retiradas?

7. Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho de 52


cartas?

8. Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas?

9. De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma
carta do segundo. Qual a probabilidade da carta do primeiro baralho ser um rei e a do segundo ser
o 5 de paus?

10. Uma urna A contém: 3 bolas brancas, 4 bolas pretas, 2 verdes; uma urna B contém: 5 bolas
brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é

73
retirada de cada urna. Qual é a probabilidade das três bolas retiradas da primeira, segunda e
terceira urnas serem, respectivamente, branca, preta e verde?
11. Considere o experimento que consiste no lançamento de um dado perfeito (todas as seis faces têm
probabilidades iguais). Com relação a esse experimento, considere os seguintes eventos:

a) I e II são eventos independentes?

b) II e III são eventos independentes?

c) Considerando o item a, calcule a probabilidade de um resultado par e maior do que 4.

d) Considerando o item b, calcule a probabilidade de um resultado maior do que 4 e múltiplo de


3.

12. Um juiz de futebol possui três cartões no bolso. Um é todo amarelo, outro é todo vermelho e o
terceiro é vermelho de um lado e amarelo do outro. Num determinado lance, o juiz retira, ao
acaso, um cartão do bolso e mostra a um jogador. A probabilidade de a face que o juiz vê ser
vermelha e de a outra face, mostrada ao jogador, ser amarela é: a. 1/2 b. 2/5 c. 1/5 d. 2/3
e. 1/6

13. Os bilhetes de uma rifa são numerados de 1 a 100. A probabilidade de o bilhete sorteado ser maior
que 40 ou número par é: a. 60% b. 70% c. 80% d. 90% e. 50%

14. Num único lance de um par de dados honestos, a probabilidade de saírem as somas “múltiplo de
4” ou “primo” é: a. 1/3 b. 1/4 c. 1/5 d. 2/3 e. 2/5

15. Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos uma carta de um
baralho de 52 cartas?

16. No lançamento de um dado, qual a probabilidade de se obter um número não inferior a 5?

17. Ao lançar um dado muitas vezes, uma pessoa percebeu que a face 6 saía com o dobro de
frequência da face 1, e que as outras faces saíam com a frequência esperada em um dado não
viciado. Qual a frequência da face 1?

18. Dois dados são lançados conjuntamente. Determine a probabilidade da soma ser 10 ou maior que
10.

74
Auto-Avaliação
Auto-Avaliação

1. Considerando o experimento: lançar uma moeda comum e anotar o resultado, lançando em seguida um
dado comume anotando o resultado como um par (moeda, dado), descrever:

a) o espaço amostral S;

b) o evento E1 = {sair cara na moeda};

c) o evento E2 = {sair par no dado};

d) o evento E3 = {sair cara na moeda e par no dado};

e) o evento E4 = {sair cara na moeda ou par no dado}.

2. Fazendo duas retiradas consecutivas (com reposição) de bolas de uma urna que contém duas bolas
brancas, três bolas verdes e quatro bolas amarelas, qual será o espaço amostral?

3. Retirando, de uma só vez, duas bolas de uma urna que contém duas bolas brancas, três bolas verdes e
quatro bolas amarelas, qual será o espaço amostral?

4. Considerando o experimento: fazer dois lançamentos consecutivos de um dado comum e honesto e


anotar a face que ficará voltada para cima em cada lançamento, determinar:

a) o espaço amostral S;

b) o evento A = {a soma dos resultados é 5};

c) o evento B = {os resultados são iguais};

d) o evento C ={o produto dos resultados é ímpar}.

5. Considerando o experimento: fazer um lançamento de dois dados comuns, honestos e indistinguíveis e


anotar as faces que ficarão voltadas para cima, determinar:

a) o espaço amostral S;

b) o evento A ={a soma dos resultados é 5};

75
c) o evento B ={os resultados são iguais};

d. o evento C ={o produto dos resultados é ímpar}.

Determine a probabilidade de cada evento:

a) Um número par aparece no lançamento de um dado.

b) Uma figura aparece ao se extrair uma carta de um baralho de 52 cartas.

c) Uma carta de ouros aparece ao se extrair uma carta de um baralho de 52 cartas.

d) Uma só coroa aparece no lançamento de três moedas.

2. Um número inteiro é escolhido aleatoriamente dentre os números 1, 2, 3, ..., 49, 50. Determine a
probabilidade de:

a) o número ser divisível por 5. c. o número ser divisível por 6 ou por 8;

b) o número terminar em 3; d. o número ser divisível por 4 e por 6.

3. Dois dados são lançados simultaneamente. Determine a probabilidade de:

a) a soma ser menor que 4;

b) a soma ser 9;

c) o primeiro resultado ser maior que o segundo;

d) a soma ser menor ou igual a 5.

4. Uma moeda é lançada duas vezes. Calcule a probabilidade de:

a) não ocorrer cara nenhuma vez;

b) obter-se cara na primeira ou na segunda jogada.

5. Um inteiro entre 3 e 11 será escolhido ao acaso.

a) qual a probabilidade de que esse número seja ímpar?

b) qual a probabilidade de este número seja ímpar e divisível por 3?

6. Uma carta é retirada ao acaso de um baralho de 52 cartas. Qual a probabilidade de que a carta retirada
seja uma dama ou uma carta de copas?

76
7. No lançamento de dois dados, qual a probabilidade de se obter um par de pontos iguais?

8. Em um lote de 12 peças, 4 são defeituosas. Sendo retiradas aleatoriamente 2 peças, calcule:

a) a probabilidade de ambas serem defeituosas;

b) a probabilidade de ambas não serem defeituosas;

c) a probabilidade de ao menos uma ser defeituosa.

9. No lançamento de um dado, qual é a probabilidade de sair o número 6 ou um número ímpar?

10. Duas cartas são retiradas ao acaso de um baralho de 52 cartas. Calcule a probabilidade de se obterem:

a) dois valetes;

b) um valete e uma dama.

11. Um casal planeja ter três filhos. Determine a probabilidade de nascerem:

a) três homens;

b) dois homens e uma mulher.

12. Uma moeda é lançada três vezes. Calcule a probabilidade de obtermos:

a) três caras;

b) duas caras e uma coroa;

c) uma cara somente;

d) nenhuma cara;

e) pelo menos uma cara;

f) no máximo uma cara.

13. Um dado é lançado duas vezes. Calcule a probabilidade de:

a) sair um 6 no primeiro lançamento;

b) sair um 6 no segundo lançamento;

c) não sair 6 em nenhum lançamento;

77
d) sair um 6 pelo menos.

78
Chave de Correção
Chave de Correção

19. Determinar o espaço amostral relativo aos experimentos abaixo:

a) Três lançamentos consecutivos de uma moeda comum.


Solução
Sendo ca = cara e co = coroa, temos:

S = { (ca, ca, ca); (ca, ca, co); (ca, co, ca); (ca, co, co); (co, ca, ca); (co, ca, co); (co, co, ca); (co, co, co)}

b) Duas retiradas consecutivas e sem reposição de bolas de uma urna que contém 3 bolas brancas, 2
bolas azuis e 4 bolas vermelhas.

Solução

Ω = {(b, b), (b, a), (b, v), (a, b), (a, a), (a, v), (v, b), (v, a), (v, v)}

20. Dados os algarismos 1, 2, 3, 4, 5, 6 e 7, construímos todos os números que podem ser


representados usando dois deles (sem repetir). Escolhendo ao acaso (aleatoriamente) um dos
números formados, qual a probabilidade de o número sorteado ser:

c) par:

Solução
Temos 7 possibilidades de escolha do primeiro algarismo dos números e seis escolhas do segundo
algarismo (os números não podem ter algarismos repetidos). Assim, temos 7 . 6 = 42 caso possíveis.

Para o número ser par deverá terminar (unidade) em 2, 4 ou 6. Devemos ter 3 possibilidades (2, 4, 6)
associadas a 6 possibilidades (não podem ter algarismos repetidos). Assim, temos 3 . 6 = 18 casos
favoráveis. Logo a probabilidade será:

18 3
42 7

d) múltiplo de 5?

Solução
Casos possíveis = 42
Casos favoráveis = 1 x 6 = 6

6 1
ú 5
42 7

79
21. Em um lote de 12 peças, 4 são defeituosos. Sendo retirada uma peça, calcule:

c) a probabilidade dessa peça ser defeituosa

Solução

4 1
ça defeituosa
12 3

d) a probabilidade dessa peça não ser defeituosa

Solução
8 2
ça não se defeituosa
12 3
Ou
Sendo este evento e o anterior complementares, temos :

ça não se defeituosa 1 ça defeituosa

1 3 1 2
ça não se defeituosa 1
3 3 3

22. Joga-se um dado honesto. O número que ocorreu (isto é, da face voltada para cima) é o coeficiente
b da equação x2 + bx - 1 = 0.

Determine:

c) a probabilidade de essa equação ter raízes reais;

Solução
Para que esta equação x2 + bx + 1, com b ∈ {1, 2, 3, 4, 5, 6}, tenha raízes reais, o discriminante
(Δ) dessa equação deve ser não-negativo. Como Δ = b2 – 4, então os valores possíveis de b são 2,
3, 4, 5 e 6, ou seja, existem 5 possibilidades para b.

Portanto a probabilidade de que isso aconteça é

equação ter raízes reais 2 3 4 5 6

1 1 1 1 1 5
equação ter raízes reais
6 6 6 6 6 6

d) a probabilidade de essa equação ter raízes reais, sabendo-se que ocorreu um número ímpar.

Solução
Sabendo que ocorreu um número ímpar (ou seja, 3 ou 5), temos do item (a) que a probabilidade
pedida é

equação ter raízes reais 3 5

80
1 1 2
equação ter raízes reais 1/3
6 6 6

23. No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5

Solução
S = O evento é formado pelos elementos A={(1, 4), (2, 3), (3, 2) e (4, 1)}. Como o número de
elementos de S é 36, temos:
4 1
P a soma é igual a 5
36 9

24. Um baralho tem 12 cartas, das quais 4 são ases. Retiram‐se 3 cartas ao acaso. Qual a
probabilidade de haver pelo menos um ás entre as cartas retiradas?

Solução
Num baralho padrão temos 52 cartas, como mostrado:
♥ 2 3 4 5 6 7 8 9 10 J Q K A
♦ 2 3 4 5 6 7 8 9 10 J Q K A
♣ 2 3 4 5 6 7 8 9 10 J Q K A
♠ 2 3 4 5 6 7 8 9 10 J Q K A
12 cartas, das quais 4 são ases.
Espaço amostral = U ; n(U) = 12 . 11. 10 = 1.320

Evento A = sair pelo menos um ás; Evento Acomplementar (Ã) = não sair ás.

n(Acomplementar) = (não às ) x (não às ) x (não às ) =8 . 7 . 6 = 336

336 14
Acomplementar
1.320 55
14
A 1 Ã 1
55

55 14 41
A
55 55

25. Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho de 52
cartas?

Solução

Num baralho comum há 52 cartas, sendo 13 de cada naipe.

As cartas são: A (ás), 2, 3, 4, 5, 6, 7, 8, 9, 10, J (valete), Q (dama) e K(rei).

13 copas: ♥ 2 3 4 5 6 7 8 9 10 J Q K A
13 ouros: ♦ 2 3 4 5 6 7 8 9 10 J Q K A

81
13 naipe de paus: ♣ 2 3 4 5 6 7 8 9 10 J Q K A
13 espadas: ♠ 2 3 4 5 6 7 8 9 10 J Q K A

Como só há um ás de ouros, o número de elementos do evento é 1; logo:



1
Sair o ás de ouros
52

26. Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas?

Solução

Como há 4 reis, o número de elementos do evento é 4; logo:

4 1
de sair um rei
52 13
27. De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma
carta do segundo. Qual a probabilidade da carta do primeiro baralho ser um rei e a do segundo ser
o 5 de paus?

Solução

evento A ={ carta do primeiro baralho ser um rei };

o evento B ={ do segundo ser o 5 de paus }.



P A =1/13 e P B

Como esses dois acontecimentos são independentes e simultâneos a probabilidade de os dois


acontecer ao mesmo o tempo produto das suas probabilidades

P=1/13.1/52=1/676

28. Uma urna A contém: 3 bolas brancas, 4 bolas pretas, 2 verdes; uma urna B contém: 5 bolas
brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é
retirada de cada urna. Qual é a probabilidade das três bolas retiradas da primeira, segunda e
terceira urnas serem, respectivamente, branca, preta e verde?

Solução

A={ branca }; B={preta}; e C={verde }

P A P B eP C

Como os três eventos são independentes e simultâneos, vem:

82
1 1 4 1
P ABC
3 4 9 27
29. Considere o experimento que consiste no lançamento de um dado perfeito (todas as seis faces têm
probabilidades iguais). Com relação a esse experimento, considere os seguintes eventos:

e) I e II são eventos independentes?

Solução

Ω = espaço amostral ⇒ Ω = {1, 2, 3, 4, 5, 6}

Evento I = {2, 4, 6} evento II = {5, 6} evento III = {3, 6}

I ∩ II = {6}; II ∩ III = {6}

Temos as probabilidades:

p I =1/2 ; p II ; p III ; p I ∩ II ; p II ∩ III ;

Resposta a)

Como P(I∩II) = P(I). P(II), os eventos I e II são independentes entre si.

f) II e III são eventos independentes?

Solução

Como P(II∩III) ≠ P(II) . P(III), os eventos II e III não são independentes entre

g) Considerando o item a, calcule a probabilidade de um resultado par e maior do que 4.

Solução

P(I∩II) = P(I). P(II) => p I ∩ II ;

h) Considerando o item b, calcule a probabilidade de um resultado maior do que 4 e múltiplo de


3.

Solução

P(II∩III) = P(II). P(III/II) => p II ∩ III ;

83
30. Um juiz de futebol possui três cartões no bolso. Um é todo amarelo, outro é todo vermelho e o
terceiro é vermelho de um lado e amarelo do outro. Num determinado lance, o juiz retira, ao
acaso, um cartão do bolso e mostra a um jogador. A probabilidade de a face que o juiz vê ser
vermelha e de a outra face, mostrada ao jogador, ser amarela é: a. 1/2 b. 2/5 c. 1/5 d. 2/3
e. 1/6

Solução

Sejam: A = evento cartão com as duas cores e


B = evento face vermelha para o juiz, tendo ocorrido o cartão de 2 cores.

P(A∩B) = P(A). P(B/A)

P(A) = 1/3 e P(B/A)=1/2, (Probabilidade condicional – ocorre B, se ocorrer A)

Então, P(A∩B) = P(A). P(B/A) => P A ∩ B

Resposta: Alternativa e. 1/6

31. Os bilhetes de uma rifa são numerados de 1 a 100. A probabilidade de o bilhete sorteado ser maior
que 40 ou número par é: a. 60% b. 70% c. 80% d. 90% e. 50%

Solução

n(U) = 100

A = (maior que 40) ⇒ n(A) = 60 e B = (ser par) ⇒ n(B) = 50

P A e B

N(A ∩B) = 30 ...... existem 60 números maiores que 40 e a metade deles, 30, são pares ⇒

=> P A ∩ B

P A∪B P A ∩ 80%

Resposta: Alternativa c. 80%

32. Num único lance de um par de dados honestos, a probabilidade de saírem as somas “múltiplo de
4” ou “primo” é: a. 1/3 b. 1/4 c. 1/5 d. 2/3 e. 2/5

Solução

Evento A = (soma ser múltiplo de 4) evento B = (soma ser primo)

Soma ser múltiplo de 4 soma ser primo

84
P A ; B P A∩B 0

P(A∪B) = P(A) + P(B) ⇒ P(A∪B) = P A B P A∪B

33. Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos uma carta de um
baralho de 52 cartas?

Solução

evento A ={ carta copas };

o evento B ={ Carta ouro }.

P A =1/4 e P B =1/4

Como os eventos são mutuamente exclusivos, vem:

P A∪B 1/2

34. No lançamento de um dado, qual a probabilidade de se obter um número não inferior a 5?

Solução

A probabilidade de se ter um número não inferior a 5 é a probabilidade de se obter 5 ou 6.
Assim se:

evento A ={ sair n. 5};

o evento B ={ Sair n. 6}.

P A e P B

P A∪B 1/3

85
35. Ao lançar um dado muitas vezes, uma pessoa percebeu que a face 6 saía com o dobro de
frequência da face 1, e que as outras faces saíam com a frequência esperada em um dado não
viciado. Qual a frequência da face 1?

Solução

P(1) = x P(6) = 2x P(2) = P(3) = P(4) = P(5) = 1/6

P(1) + P(2) + P(3) + P(4) + P(5) + P(6) = 1 ⇒ x 2x 1

2
3x x 1/9
6
 P(1) = 1/9

36. Dois dados são lançados conjuntamente. Determine a probabilidade da soma ser 10 ou maior que
10.

Solução

O espaco amostral S é constituído por 36 elementos

A soma deverá ser, então, 10, 11 ou 12.

Para que a soma seja 10, a probabilidade é:

A={ (4, 6), (5, 5), (6, 4)}, => n(A) =3; => P A

Para que a soma seja 11, a probabilidade é:

B={ (5, 6), (6, 5)}, => n(B) =2; => P B

Para que a soma seja 12, a probabilidade é:

C={ (&, 6)}, => n(C) =!; => P A

Com esses três eventos são mutuamente exclusivos, temos:

P(soma ser 10 ou maior que 10) = P(A) + P(B) + P(C)=>

P soma ser 10 ou maior que 10 1/6


86
Unidade Didáctica 5:

Variáveis aleatórias discretas e


contínuas

5.1 Introdução

A estatística descritiva pode ser considerada como um conjunto de técnicas analíticas utilizado para
resumir o conjunto dos dados recolhidos numa dada investigação, que são organizados, geralmente,
através de números, tabelas e gráficos. Pretende proporcionar relatórios que apresentem informações
sobre a tendência central e a dispersão dos dados. Para tal, deve-se evidenciar: valor mínimo, valor
máximo, soma dos valores, contagens, média, moda, mediana, variância e desvio padrão.

Inferência estatística é o processo pelo qual é possível tirar conclusões acerca da população usando
informação de uma amostra, constituindo questão central, saber como usar os dados da amostra para
obter conclusões acerca da população. “ A estatística inferencial permite a generalização, a uma
população, de informações obtidas a partir de uma amostra representativa e a tomada de decisão”

87
Objectivos da unidade 5

Objectivos da Unidade 5

Ao completar esta unidade,você será capaz de:

 Definir os vários conceitos básicos sobre as variáveis aleatórias discretas e contínuas;


 Diferenciar variáveis aleatórias discretas e contínuas;
 Identificar os diferentes tipos de conceitos sobre variáveis aleatórias discretas e contínuas;
 Calcular as diferentes estatisticas sobre as variáveis aleatórias discretas e contínuas ;
 Dar exemplo da aplicação dos diferentes tipos de conceitos e estatísticas sobre as variáveis
aleatórias discretas e contínuas.

88
Fontes de Informação e Recursos de
Aprendizagem

Fontes de Informações e Recursos de Aprendizagem

Para consolidar os seus conhecimentos sobre as matérias desta unidade veja:


Costa Neto, P. L. de O. (1977) . Estatística. São Paulo: Edgard Blücher.

Hoei, P. G. (1981). Estatistica elementar. 1ª ed., São Paulo: Editora Atlas.

Fonseca, J. S. At al. (1996). Estatística Aplicada. 6ª. Ed.São Paulo: Atlas.

Moretin, L. (1994). Estatística Básica.São Paulo: Makrom Brooks.

Spiegeli, M.R. Probabilidade e Estatística. São Paulo: MacGraw-Hill.

http://www.ebah.com.br/content/ABAAAf55QAB/variaveis-aleatorias-discretas-continuas

http://www.professores.uff.br/patricia/images/stories/arquivos/2_vadiscreta.pdf

5.2 Variáveis aleatórias discretas e contínuas


A seguir, apresentamos as medidas básicas de uma análise descritiva dos dados: as medidas de
posição, de dispersão e algumas outras estatísticas descritivas.

5.2.1 Variáveis aleatórias discretas.


Muitos experimentos aleatórios produzem resultados não - numéricos. Antes de analisá-los, é conveniente
transformar seus resultados em números, o que é feito através da variável aleatória, que é uma regra de
associação de um valor numérico a cada ponto do espaço amostral.

Portanto, variáveis aleatórias são variáveis numéricas às quais iremos associar modelos probabilísticos.
Veremos que uma variável aleatória tem um numero para cada resultado de um experimento e que uma
distribuição de probabilidades associa uma probabilidade a cada resultado numérico de um experimento.

89
Exemplos:

E: lançamento de duas moedas;

X: número de caras obtidas nas duas moedas;

S={(c,c),(c,r),(r,c),(r,r)}

X=0, corresponde ao evento (r,r) com probabilidade 1/4;

X=1, corresponde ao evento (r,c), (x,r) com probabilidade 2/4;

X=2 , corresponde ao evento (c,c) com probabilidade 1/4;

Empregamos a termo variável aleatória para descrever o valor que corresponde ao resultado de
determinado experimento. As variáveis aleatórias também podem ser discretas ou continuas e temos as
seguintes definições:

Variáveis aleatórias discretas – Admite um número finito de valores ou tem uma quantidade enumerável
de valores.

Variáveis aleatórias contínuas – Pode tomar um número infinito de valores, e esses valores podem ser
associados a mensurações em uma escala contínua.

5.3 Distribuição de probabilidade.


Uma vez definida a variável aleatória, existe interesse no cálculo dos valores das probabilidades
correspondentes. O conjunto das variáveis e das probabilidades correspondentes é denominado
distribuição de probabilidades, isto é:

X, p X , i 1, 2, … . . , n

90
5.4 Função de densidade de probabilidade.
É a função que associa a cada valor assumido pela variável aleatória a probabilidade do evento
correspondente, isto é:

5.5 Esperança matemática, variância e desvio padrão:


propriedades.
Seja E um experimento e S o espaço associado ao experimento. Uma função X, que associe a cada
elemento s pertence S um número real X(s), é denominado variável aleatória.

Existem características numéricas que são muito importantes em uma distribuição de probabilidades de
uma variável aleatória discreta. São os parâmetros das distribuições, a saber:

Esperança matemática (ou simplesmente média) – E (x) – é um número real, é também uma média
aritmética;

Variância – VAR (x) – é a medida que dá o grau de dispersão (ou de concentração) de probabilidade em
torno da média. O fato de conhecermos a média de uma distribuição de probabilidades já nos ajuda
bastante, porém, precisamos de uma medida que nos dê o grau de dispersão de probabilidade em torno
dessa média.

5.7 Distribuições de variáveis aleatórias discretas.


Será feita uma discussão sobre algumas distribuições de probabilidades discretas. Tais distribuições
partem da pressuposição de certas hipóteses bem definidas. Como diversas situações reais muitas vezes se
aproximam dessas hipóteses, esses modelos são úteis no estudo de tais situações, daí a sua importância.

Um cuidado muito grande deve ser tomado ao se escolher uma distribuição de probabilidade que descreve
corretamente as observações geradas por um experimento. Primeiramente analisaremos as distribuições
discretas de probabilidades mais importantes e que descrevem as variáveis aleatórias comumente
encontradas na prática. Por último analisaremos algumas distribuições de v.a. contínuas de importância
similar.

91
5.7.1 Distribuição Uniforme.
É a mais simples de todas as distribuições discretas de probabilidade. É aquela na qual a v.a. assume todos
os seus valores com a mesma probabilidade. Tal distribuição é chamada distribuição uniforme. A
distribuição discreta uniforme é dada por:

P(x,k) = 1/k = P(X = x)

onde x é um dos possíveis valores da v.a. X. Utilizamos aqui P(x,k) ao invés de p(x) para indicar que a
distribuição uniforme depende do parâmetro k. Este é o caso mais simples de v.a. discreta, onde cada
possível valor ocorre com a mesma probabilidade.

Definição: A variável aleatória discreta X, assumindo os valores x1,x2, ..., xn , tem distribuição uniforme ,
se e somente se,

, para todo i = 1, 2,..., n.

5.7.2 Distribuição de Bernoulli.


Seja um exemplo aleatório E realizado repetidas vezes, sempre nas mesmas condições, de tal forma que o
resultado pode ser um Sucesso (s) (se acontecer o evento que nos interessa) ou um Fracasso (f) (se o
evento não se realizar). Seja X a variável aleatória: Sucesso ou Fracasso

Essas condições caracterizam um conjunto de Provas de Bernoulli ou um experimento de Bernoulli, e sua


função probabilidade é dada por:

Média:

Variância:

92
5.7.3 Distribuição Binomial.
Uma variável aleatória tem distribuição binomial quando o experimento ao qual está relacionada apresenta
apenas dois resultados (sucesso ou fracasso). Este modelo fundamenta-se nas seguintes hipóteses:

n provas independentes e do mesmo tipo são realizadas;

cada prova admite dois resultados – Sucesso ou Fracasso;

a probabilidade de sucesso em cada prova é p e de fracasso 1-p = p ;

Define-se a Variável X que conta o número de sucessos nas n realizações do experimento. (X pode
assumir os valores 0, 1, 2, 3,..., n.).

Fazendo sucesso corresponder a 1 fracasso, a 0, temos:

Para X = 0, uma sequência de n zeros: 00000...000.

Para X = 1, uma seqüência do tipo: 1000...0; 01000...0; 001000...0; será n seqüência, cada uma com um
único sucesso e n sequência, cada uma com um único sucesso e n-1 fracassos:

Para X = x, tem-se x sucessos e (n-x) fracassos, correspondendo às seqüências com x algarismos 1 e n-x
zeros. Cada sequência terá probabilidade e como há sequências distintas, tem-se:

Média:

93
Variância:

6.4 Distribuição de Poisson.

Consideremos a probabilidade de ocorrência de sucessos em um determinado intervalo. A probabilidade


da ocorrência de um sucesso no intervalo é proporcional ao intervalo. A probabilidade de mais de um
sucesso nesse intervalo é bastante pequena em relação à probabilidade de um sucesso. Seja X o número de
sucessos no intervalo; temos,então:

A distribuição de Poisson é muito usada na distribuição do número de:

• Carros que passam por um cruzamento por minuto, durante certa hora do dia;

• Erros tipográficos por página, em um material impresso;

• Defeitos por unidade (m³, m², m, etc.) por peça fabricada;

• Problemas de filas de espera em geral, e outros.

Média:

Variância:

OBS: Muitas vezes, no uso da binomial, acontece que n é muito grande e p é muito

pequeno. Podemos, então, fazer uma aproximação de binomial pela distribuição de

Poisson, da seguinte forma:

94
6.5 Distribuição Geométrica.

Consideremos tentativas sucessivas e independentes de uma mesmo experimento aleatório. Cada tentativa
admite sucesso com probabilidade p e fracasso com probabilidade q; p + q = 1.

Seja X: número de tentativas necessárias ao aparecimento do primeiro sucesso. Logo, X assumem os


valores:

X = 1, que corresponde ao sucesso (S) e P (X = 1) = p;

X = 2, que corresponde ao fracasso (F) na 1ª tentativa e sucesso na segunda, (FS) e

P (X = 2) = P (F ∩ S) = q·p;

X = 3, que corresponde a (FFS) e P (X = 3) = P (F ∩ F ∩ S) = q · q · p = ;

X = 4, que corresponde a (FFFS) e P (X = 4) =

E assim sucessivamente.

X = x, que corresponde a FF ... FS = x, com função de probabilidade:

A variável X tem então distribuição geométrica.

Média:

Variância:

6.6 Distribuição Hipergeométrica.

Consideremos uma população com N elementos, dos quais r tem uma determinada característica (a
retirada de um desses elementos corresponde ao sucesso). Retiramos dessa população, sem reposição, uma
amostra de tamanho n.

Seja X: número de sucessos na amostra (saída do elemento com a característica).

95
Para sabermos a função de probabilidade, consideramos que podemos tirar amostras sem reposição.
Os sucessos na amostra podem ocorrer com maneiras e fracassos de modos. Logo:

, .

A variável X assim definida tem distribuição hipergeométrica.

Média.

E (X) = np

Variância.

Var (X) = Np (1 – p) , onde .

96
TAREFAS
Tarefas

5. Os comprimentos das peças produzidas por determinada máquina têm distribuição normal com
uma média de 172 mm e desvio padrão de 5 mm. Calcule a probabilidade de uma amostra
aleatória simples de 16 peças ter comprimento médio
(a) entre 169 mm e 175 mm;
(b) maior que 178 mm;
(c) menor que 165 mm.

6. Uma amostra de tamanho n = 18 é extraída de uma população normal com média 15 e desvio
padrão 2,5. Calcule a probabilidade de que a média amostral
(a) esteja entre 14,5 e 16,0;
(b) seja maior que 16,1.

7. Qual deverá ser o tamanho de uma amostra aleatória simples a ser retirada de uma população
N(150; 132) para que Pr(|X μ| < 6, 5) = 0, 95?

8. Definimos a variável e = X −μ como sendo o erro amostral da média, onde X é a média de uma
amostra de tamanho n de uma população com média μ e desvio padrão σ.
(a) Determine E(e) e V ar(e).
(b) Se a população é normal com σ = 20, que proporção das amostras de tamanho 100 terá erro
amostral absoluto maior do que 2 unidades?
(c) Neste caso, qual deve ser o valor de δ para que Pr(| e | > δ)=0, 01?
(d) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos sejam
inferiores a 1 unidade?

9. O fabricante de uma lâmpada especial afirma que o seu produto tem vida média de 1600 horas,
com desvio padrão de 250 horas. O dono de uma empresa compra 100 lâmpadas desse
fabricante. Qual é a probabilidade de que a vida média dessas lâmpadas ultrapasse 1650 horas?

10. A máquina de empacotar um determinado produto o faz segundo uma distribuição normal, com
média μ e desvio padrão 10 g.
(a) Em quanto deve ser regulado o peso médio μ para que apenas 10% dos pacotes tenham
menos do que 500 g?
(b) Com a máquina assim regulada, qual a probabilidade de que o peso total de 4 pacotes
escolhidos ao acaso seja inferior a 2 kg?

11. Uma moeda é lançada 50 vezes, com o objetivo de se verificar sua honestidade. Se ocorrem 36
caras nos 50 lançamentos, o que podemos concluir?

12. A divisão de inspeção do Departamento de Pesos e Medidas de uma determinada cidade está
interessada em calcular a real quantidade de refrigerante que é colocada em garrafas de 2 litros,
no setor de engarrafamento de uma grande empresa de refrigerantes. O gerente do setor de
engarrafamento informou à divisão de inspeção que o desvio padrão para garrafas de 2 litros é
de 0,05 litro. Uma amostra aleatória de 100 garrafas de 2 litros, obtida deste setor de

97
engarrafamento, indica uma média de 1,985 litro. Qual é a probabilidade de se obter uma média
amostral de 1,985 ou menos, caso a afirmativa do gerente esteja certa? O que se pode concluir?

98
Auto-Avaliação
Auto-Avaliação

7. Seja X a variável aleatória que representa a pressão sanguínea. Suponhamos que a variável tem
distribuição normal de média µ e desvio padrão σ=8. Suponha que se toma uma amostra de 100
indivíduos cuja média é X =123. Determine um intervalo com 90% de confiança para a média.

8. Seja X a variável que representa a taxa normal de glicose no sangue. Suponhamos que essa
distribuição é normal com desvio padrão σ=6 mg/100ml de sangue. Determine o intervalo de
confiança com 95% de confiança para µ, sabendo que numa amostra aleatória de 25 indivíduos se
encontrou uma média X = 5 mg/100ml.

9. Foi determinada a taxa de glicose em 8 ratos, tendo sido encontrados os seguintes valores: 100;
87,5; 110; 99,5; 92,5; 94; 100; 100. Calcule, com base nestes dados, o intervalo de 95% de
confiança para a média da população.

10. Seja X a variável que representa a taxa de colesterol no plasma sanguíneo. A média desta variável
é µ e o desvio padrão é σ=20 mg/100ml de plasma. Qual o intervalo de confiança para o
parâmetro 100 desconhecido µ, quando foi recolhida uma amostra de 25 indivíduos para os quais
a média encontrada foi de 198 mg/100ml.

(a) Com um grau de confiança de 95%


(b) Com um grau de confiança de 99%

11. Seja X uma variável aleatória que representa a taxa normal de colesterol, supondo que com base
numa amostra de 25 indivíduos um investigador obteve a média X = 198 mg/100ml e o desvio
padrão s = 30 mg/100ml. a) Determine um intervalo de confiança a 90% para µ. b) Suponha agora
que eram 50 indivíduos. Quais os limites do intervalo de confiança?

12. Suponha a seguinte amostra proveniente de uma população com variância s2 = 64: 1, 20, 18, 19,
19, 15, 31, 12. Determine os intervalos de confiança de 95% e de 99% para µ

13. Uma amostra de 100 votantes escolhidos aleatoriamente de um distrito indicaram que 55% eram a
favor de um determinado candidato. Encontrar intervalos de confiança a 95% e 99% para a
proporção de todos os votantes nesse candidato.

14. Com base no problema anterior, qual o tamanho que a amostra deveria ter para se ter 95% e 99%
de confiança que o candidato seria eleito?

99
15. Em 40 lançamentos de uma moeda foram obtidas 24 caras. Encontrar um intervalo de confiança a
95% e a 99% para a proporção de caras que seriam encontradas num lançamento um número
infinito de vezes da moeda.

16. Um empacotador de sacos de 50 Kg de sal seleccionou uma amostra de 30 sacos cheios nas
últimas 24 horas. Cada saco é cuidadosamente cheio, tendo sido encontradas as seguintes
estatísticas: X = 50,22 Kg s2 = 0,24 Kg2 s = 0,49 Kg.

(a) Construa um intervalo de confiança a 99% para σ2 .


(b) Encontre um intervalo de confiança a 99% para σ.

100
Chave de Correção
Chave de Correção

1. Os comprimentos das peças produzidas por determinada máquina têm distribuição normal com
uma média de 172 mm e desvio padrão de 5 mm. Calcule a probabilidade de uma amostra
aleatória simples de 16 peças ter comprimento médio
(a) entre 169 mm e 175 mm;
(b) maior que 178 mm;
(c) menor que 165 mm.

Solução

2. Uma amostra de tamanho n = 18 é extraída de uma população normal com média 15 e desvio
padrão 2,5. Calcule a probabilidade de que a média amostral

101
(a) esteja entre 14,5 e 16,0;
(b) seja maior que 16,1.

Solução

3. Qual deverá ser o tamanho de uma amostra aleatória simples a ser retirada de uma população
N(150; 132) para que Pr(|X μ| < 6, 5) = 0, 95?

Solução

102
4. Definimos a variável e = X −μ como sendo o erro amostral da média, onde X é a média de uma
amostra de tamanho n de uma população com média μ e desvio padrão σ.
(a) Determine E(e) e V ar(e).
(b) Se a população é normal com σ = 20, que proporção das amostras de tamanho 100 terá erro
amostral absoluto maior do que 2 unidades?
(c) Neste caso, qual deve ser o valor de δ para que Pr(| e | > δ)=0, 01?
(d) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos sejam
inferiores a 1 unidade?

Solução

103
Solução

Solução

104
5. O fabricante de uma lâmpada especial afirma que o seu produto tem vida média de 1600 horas,
com desvio padrão de 250 horas. O dono de uma empresa compra 100 lâmpadas desse fabricante.
Qual é a probabilidade de que a vida média dessas lâmpadas ultrapasse 1650 horas?

Solução

6. A máquina de empacotar um determinado produto o faz segundo uma distribuição normal, com
média μ e desvio padrão 10 g.

105
(a) Em quanto deve ser regulado o peso médio μ para que apenas 10% dos pacotes tenham menos
do que 500 g?
(b) Com a máquina assim regulada, qual a probabilidade de que o peso total de 4 pacotes
escolhidos ao acaso seja inferior a 2 kg?

Solução R:(a)

Então, na densidade normal padrão, à esquerda da abscissa temos que ter uma área
(probabilidade) de 0,10. Logo, essa abscissa tem que ser negativa. Usando a simetria da densidade
normal temos as seguintes equivalências:

106
Solução (b)
Sejam X1,X2, X3, X4 os pesos dos 4 pacotes da amostra. Queremos que ∑ X 2000g, isso é
equivalente a X 500. Logo,

Com a máquina regulada para 512,8g, há uma probabilidade de 0,00523 de que uma amostra de 4
pacotes apresente peso médio inferior a 500g. Note que com um pacote apenas, essa probabilidade
é de 10%. Por isso, as inspeções de controle de qualidade são sempre feitas com base em amostras
de tamanho n > 1.

7. Uma moeda é lançada 50 vezes, com o objetivo de se verificar sua honestidade. Se ocorrem 36
caras nos 50 lançamentos, o que podemos concluir?

Solução

Neste caso, a população pode ser representada por uma variável de Bernoulli X com parâmetro p,
isto é, X assume o valor 1 com probabilidade p na ocorrência de cara e assume o valor 0 com
probabilidade 1 − p na ocorrência de coroa. Para uma variável Bernoulli, temos que E(X) = p e V
ar(X) = p(1 − p). Como são feitos 50 lançamentos, o tamanho da amostra é 50 (n grande!) e, pelo

107
teorema limite central, X é aproximadamente normal com média E(X) = p e variância Var(X)

= . Suponhamos que a moeda seja honesta, isto é, que p = 1/2. Nestas condições, qual é a
probabilidade de obtermos 36 caras em 50 lançamentos? Com a hipótese de honestidade da
moeda, o teorema limite central nos diz que

8. A divisão de inspeção do Departamento de Pesos e Medidas de uma determinada cidade está


interessada em calcular a real quantidade de refrigerante que é colocada em garrafas de 2 litros, no
setor de engarrafamento de uma grande empresa de refrigerantes. O gerente do setor de
engarrafamento informou à divisão de inspeção que o desvio padrão para garrafas de 2 litros é de
0,05 litro. Uma amostra aleatória de 100 garrafas de 2 litros, obtida deste setor de engarrafamento,
indica uma média de 1,985 litro. Qual é a probabilidade de se obter uma média amostral de 1,985
ou menos, caso a afirmativa do gerente esteja certa? O que se pode concluir?

108
Unidade Didáctica 6:

Estimação de parámetros

6.1 Introdução
A inferência estatística pode ser dividida em duas grandes áreas: estimação de parâmetros e testes de
hipóteses. Como exemplo de um problema de estimação de parâmetros, suponha que um engenheiro
de estruturas esteja analisando a resistência à tensão de um componente usado em um chassi de
automóvel. Uma vez que a variabilidade da resistência à tração está naturalmente presente entre os
componentes individuais, devido as diferenças nas bateladas da matéria-prima nos processos de
fabricação e nos procedimentos de medidas (por exemplo), o engenheiro está interessado na estimação
da resistência média à tração dos componentes. Na prática o engenheiro usará dados da amostra para
calcular um número que é, de algum modo, um valor razoável (ou tentativa) da média verdadeira. Este
número é chamado de estimativa..

109
Objectivos da unidade 6

Objectivos da Unidade 6

Ao completar esta unidade,você será capaz de:

 Definir os vários conceitos básicos sobre estimação deparâmetros;


 Diferenciar estatística descritiva da estatística inferecial;
 Identificar os diferentes tipos de conceitos e problemas sobre estimação deparâmetros;
 Classificar os diferentes tipos de problemas refereentes a cada um dos parâmetros Estatisticos
a das áreas;
 Dar exemplo da aplicação dos diferentes tipos de conceitos sobre estimação deparâmetros.

110
Fontes de Informação e Recursos de
Aprendizagem

Fontes de Informações e Recursos de Aprendizagem

Para consolidar os seus conhecimentos sobre as matérias desta unidade veja:


Costa Neto, P. L. de O. (1977) . Estatística. São Paulo: Edgard Blücher.

Hoei, P. G. (1981). Estatistica elementar. 1ª ed., São Paulo: Editora Atlas.

Fonseca, J. S. At al. (1996). Estatística Aplicada. 6ª. Ed.São Paulo: Atlas.

Moretin, L. (1994). Estatística Básica.São Paulo: Makrom Brooks.

Spiegeli, M.R. Probabilidade e Estatística. São Paulo: MacGraw-Hill.

http://www.portalaction.com.br/content/23-outras-estat%C3%ADsticas-descritivas

http://www.portalaction.com.br/content/13-exposi%C3%A7%C3%A3o-dos-dados

6.2 Estimadores
Como já comentamos, a inferência estatística tem por objetivo extrair informações sobre uma população a
partir de dados amostrais. Neste contexto, uma das etapas principais da obtenção dessas informações é a
estimação dos parâmetros. Considere o seguinte exemplo.

Para introduzir esta unidade vamos usar um exemplo:

Considere o problema sobre determinar, em uma população, a proporção de pessoas acima de 40 anos que
sofrem de artrite. Vamos imaginar que, de uma amostra de 200 pessoas acima de 40 anos, foi verificado
que 12 pessoas têm artrite.

111
Desta forma, uma estimativa natural para a proporção seria de 12/200 = 6%. É claro que, neste caso,
estamos supondo que a amostra representa a população e claro que, caso retirássemos outra amostra da
população, possivelmente obteríamos uma estimativa diferente da anterior.

Considerando o caso geral em que temos uma amostra de n elementos, podemos definir a
seguinte variável aleatória:

e seja p a probabilidade da pessoa possuir artrite na população, ou seja, o parâmetro de interesse do


estudo. Neste caso, temos que

tem distribuição binomial com parâmetros n e e representa o total de indivíduos na amostra que
possuem artrite. Desta forma, um possível estimador para a proporção é dado por

Desta forma, se , temos que é uma estimativa para a proporção . Se considerarmos a


amostra extraída acima, temos que a estimativa é dada por .

Já vimos na unidade anterior que tem distribuição aproximadamente


normal com média e variância , isto é,

Desta forma, podemos concluir que, em média, o estimador é "igual" (está bastante próximo) de e
então, dizemos que o é um estimador não viciado (ou não viesado) de . Além disso, para amostras
grandes, a diferença entre o valor real e o estimador tende a ser pequena, já que, quando
, e, neste caso, dizemos que é um estimador consistente de p.

112
A seguir, verificaremos algumas propriedades das estatísticas utilizadas na inferência e métodos para
calcular estimadores, entre eles os métodos de momentos, de mínimos quadrados e de máxima
verossimilhança. Em seguida, estudaremos propriedades interessantes de estimadores.

Conhecendo-se uma amostra em concreto, é possível estimar os valores dos seus parâmetros
caracterizadores através de métodos probabilísticos. Por exemplo, suponhamos que numa fábrica
produtora de açúcar se pretende averiguar se o peso dos pacotes produzidos está, em média, dentro das
normas de qualidade exigíveis. Na impossibilidade de medição do peso de todos os pacotes, pela
morosidade e dispêndio de recursos que tal implicaria, a estatística permite que, a partir da observação de
uma única amostra, seja possível inferir entre que valores varia o peso médio com um grau de confiança
ou probabilidade elevado. Assim, ao recolher um determinado número de pacotes da produção total
aleatoriamente, é possível calcular o peso médio de acordo com as técnicas de estatística descritiva
apreendidas atrás. Claro que nada nos garante que esse valor coincide com o valor do parâmetro da
população em estudo. De facto, é até provável que não coincida e, mais, se recolhermos outro conjunto
idêntico de pacotes, o valor seja diferente. Isto é, para cada amostra de dimensão n recolhida, a estimativa
do parâmetro assumiria valores distintos. Então, como retirar conclusões? Como garantir algum nível de
rigor?

O método a estudar nesta secção – a estimação por intervalos – permite, a partir da recolha de uma única
amostra, aferir entre que valores seria de esperar que variasse o parâmetro de interesse se nos
empenhássemos a recolher um número infinito de amostras. Isto é, por exemplo, caso o valor amostral
fosse de 1,02 kg, este método poderia, por exemplo, permitir afirmar que seria altamente provável que o
peso dos pacotes produzidos estivesse a variar entre 0,92 kg e 1,12 kg. E esse resultado tem um
determinado nível de confiança associado: por exemplo, se dissermos que o nível de confiança ou certeza
implicado é de 95%, tal significa que, se nos fosse possível observar um número infinito de amostras, o
intervalo de valores apresentado corresponderia aos resultados obtidos em 95% delas (os valores mais
usualmente utilizados são 90%, 95% ou 99% de confiança). Caberia depois à empresa julgar se esses
seriam ou não valores aceitáveis e proceder aos eventuais reajustes necessários.

A partir do conceito de intervalo de confiança para um parâmetro, é fácil concluir que a sua especificação
implica conhecer:

 o estimador do parâmetro em causa


 a sua distribuição de probabilidade
 uma estimativa particular daquele parâmetro

113
Como parâmetros de interesse e para efeitos de exemplificação, vão considerar-se duas tipologias de
intervalo: o intervalo de confiança para a média de uma população normal e o intervalo de confiança para
a proporção de uma população binomial. Para efeitos de simplificação, vão considerar-se apenas exemplos
relativos a amostras de grande dimensão (na prática, n 100)

6.3 Intervalo de confiança para a média m de uma população


normal
Seja X (média amostral) o estimador da média da população. Porque a distribuição é Normal, a
distribuição deste estimador será:
σ
X ∩ N μ:
√n

Uma vez que apenas se encontra tabelada a distribuição N(0,1), torna-se necessário calcular a variável
reduzida correspondente:

X μ
Z σ ∩ N 0; 1
√n

Esta variável permitirá deduzir a fórmula geral do intervalo de confiança para a média m de uma
população normal:
σ σ
X c ;X c
√n √n

Isto é, em torno do valor do estimador, é definido um intervalo de variação onde é possível afirmar que o
parâmetro a estimar está contido com um grau de confiança δ . Esse intervalo de variação depende:

 da dimensão da amostra (n): quanto maior a dimensão da amostra, menor a amplitude do


intervalo. Este resultado explica-se facilmente: no limite, se fosse possível observar todo o
universo de dados (n=∞), o valor amostral calculado corresponderia ao valor da população.

 do desvio - padrão da população ( ): quanto maior o desvio - padrão, maior a amplitude do


intervalo. Como se sabe, o desvio - padrão é uma medida que caracteriza a dispersão da
distribuição. Quanto maior o seu valor, maior a variabilidade apresentada pelos dados, sendo
natural que a margem de variação de prever em torno do valor amostral recolhido seja também,
naturalmente, maior.

114
 do valor crítico (c): quanto maior o valor c, maior a amplitude do intervalo. O valor crítico reflecte
o nível de confiança adoptado. Naturalmente, para que aumente a confiança de que o valor do
parâmetro a estimar está contido no intervalo, a sua amplitude deve aumentar também (no limite,
se o intervalo se alongasse de -∞ a +∞ a confiança seria total ou 100%). É possível encontrar o
valor c na tabela da normal (pois esta é a lei do estimador), da seguinte forma:

P(- c Z c) =

já que assim é possível definir a fórmula geral do intervalo, resolvendo a inequação em ordem ao
parâmetro, μ :

X μ σ σ
P c σ c δ P X c μ X c δ
√n √n
√n

Se o desvio - padrão da população fôr desconhecido, utiliza-se este intervalo considerando-se como
estimativa de s o desvio - padrão corrigido da amostra,

∑ ´ ´
ou seja, S´ , tal que X c ;X c
√ √

6.4 Intervalo de confiança para a proporção p de uma


população binomial
Seja p (proporção amostral ou frequência observada na amostra) o estimador da proporção p de uma
população binomial. Sendo a amostra de grande dimensão, a distribuição deste estimador será:

p 1 p
p ∩ N p;
n

Uma vez que apenas se encontra tabelada a distribuição N(0,1), torna-se necessário calcular a variável
reduzida correspondente:

p p
Z ∩ N 0; 1
p 1 p

n

Esta variável permitirá deduzir a fórmula geral do intervalo de confiança para a proporção p de uma
população binomial:

115
p 1 p p 1 p
p c ; p c
n n

(como estimativa de p (1- p) foi utilizado p 1 p

Como é óbvio, pretende-se que o resultado possua o máximo de confiança possível. No entanto, se uma
maior confiança é pretendida na estimação, esta conduz a possibilidades de erro maiores, dado que um
elevado nível de confiança conduz a um intervalo maior e, como tal, a precisão da estimação diminui.

Exemplo:

Consideremos 3 afirmações de alunos que aguardam a saída das pautas de um exame de Estatística:

Afirm. 1: “Tenho a sensação que as pautas serão afixadas durante a manhã”

Afirm. 2: “Tenho quase a certeza que as pautas serão afixadas entre as 10h e as 11h

Afirm. 3: “Tenho a certeza absoluta que as pautas ou são afixadas às 10h30 ou já não são afixadas hoje”

Estas 3 afirmações permitem constatar facilmente que se se pretende maior confiança na estatística, se tem
que permitir que a possibilidade de erro aumente. Por outro lado, se se permitir que o erro diminua, os
extremos do intervalo aumentam, embora o resultado perca alguma precisão. No entanto, há que ter em
atenção que, se um intervalo de confiança tem uma amplitude demasiado grande, a estimativa não tem
utilidade. Cabe ao investigador gerir este “trade-off”.

Isto leva a uma questão importante: o dimensionamento de amostras. Até aqui, sempre se assumiu que as
dimensões são conhecidas à partida, sem referir como se determinam. No entanto, a resolução deste
problema tem um enorme interesse prático, já que (i) recolher e tratar uma amostra demasiado grande para
os resultados que se pretendem obter constitui um evidente desperdício de recursos e (ii) recolher uma
amostra cuja dimensão é insuficiente para retirar conclusões constitui um erro.

A dimensão das amostras aumentará se se pretender garantir maior precisão ao intervalo e/ou maior grau
de confiança.

No capítulo dedicado a aplicações estatísticas, será possível ver como é possível utilizar o conceito de
intervalo de confiança ao controlo estatístico de processos de qualidade.

116
TAREFAS
Tarefas

1. Suponha-se que se tem uma população normal com média m desconhecida e desvio - padrão 3, N
( , 9) e uma amostra de 121 observações. Deduza um intervalo de confiança para a m com 95%
de confiança.

2. Numa cidade pretende-se saber qual a proporção da população favorável a certa modificação de
trânsito. Faz-se um inquérito a 100 pessoas, e 70 declaram-se favoráveis. Determine um intervalo
de confiança a 95% para a proporção de habitantes dessa cidade favoráveis à modificação de
trânsito.

3. Uma máquina fabrica cabos cuja resistência à ruptura (em kg/cm2) é uma variável com
distribuição Normal de média 100 e desvio - padrão 30. Pretendese testar uma nova máquina que,
segundo indicações do fabricante, produz cabos com resistência média superior. Para isso,
observam-se 100 cabos fabricados pela nova máquina, que apresentam uma resistência média de
110 kg/cm2. Admita que o novo processo não altera o desvio padrão da resistência à ruptura dos
cabos.

a) Determine um intervalo de confiança a 95% para a resistência média à ruptura dos cabos
produzidos pela nova máquina.

b) Suponha que pretendíamos obter um intervalo de confiança com a mesma amplitude do


anterior, mas com nível de confiança de 99%. Quantos cabos deveriam ser observados?

4. Uma amostra de 20 cigarros é analisada para determinar o conteúdo de nicotina, observando-se


um valor médio de 1,2 mg. Sabendo que o desvio - padrão do conteúdo de nicotina de um cigarro
é 0,2 mg, diga, com 99% de confiança, entre que valores se situa o teor médio de nicotina de um
cigarro.

5. Admita-se que a altura dos alunos de uma escola segue distribuição Normal com variância
conhecida e igual a 0,051. Admita-se ainda que foi recolhida uma amostra aleatória com dimensão

117
n=25 alunos e calculada a respectiva média amostral, tendo-se obtido o valor de 1,70m. Defina
um intervalo que, com probabilidade 95%, contenha o valor esperado da altura μ.
6. Numa fábrica, procura conhecer-se a incidência de defeituosos na produção de uma máquina. Para
tanto, colhe-se uma amostra de dimensão suficientemente grande (1600 artigos), onde 10% dos
artigos são defeituosos. Determine o intervalo de confiança para a referida proporção com 90% de
confiança.

7. O director fabril de uma empresa industrial que emprega 4000 operários emitiu um novo conjunto
de normas internas de segurança. Passada uma semana, seleccionou aleatoriamente 300 operários
e verificou que apenas 75 deles conheciam suficientemente bem as normas em causa. Construa
um intervalo de confiança a 95% para a proporção de operários que conheciam adequadamente o
conjunto das normas uma semana após a sua emissão.

8. A Direcção de Marketing de uma empresa pretende conhecer a notoriedade da marca de


determinado produto. Nesse sentido, efectuou um inquérito junto de 1200 pessoas escolhidas
aleatoriamente, verificando que 960 a conheciam.

a) Estime a proporção de pessoas conhecedoras da marca através de um intervalo de confiança a


90%.

b) Se se pretender que a amplitude do intervalo de confiança da alínea anterior não seja superior a
0,034, qual deve ser a dimensão mínima da amostra?

c) Sabendo que o intervalo de confiança determinado pela Direcção de Marketing foi [0,767; 0,833],
calcule o nível de confiança utilizado.

9. O gabinete de projectos de uma empresa de material de construção civil pretende estimar a tensão
de ruptura do material usado num determinado tipo de tubos. Com base num vasto conjunto de
ensaios realizados no passado, estima-se que o desvio - padrão da tensão de ruptura do material
em causa é de 70 psi. Deseja-se definir um intervalo de confiança a 99% para o valor esperado da

118
tensão de ruptura, pretendendo-se que a sua amplitude não exceda 60 psi. Qual o número de
ensaios necessário para definir tal intervalo?

10. A empresa SCB controla regularmente a resistência à ruptura dos cabos por si produzidos.
Recentemente, foram analisadas as tensões de ruptura de 10 cabos SCB-33R, seleccionados
aleatoriamente a partir de um lote de grandes dimensões, tendo sido obtida uma média de 4537
kg/cm2. Existe uma norma de 112 kg/cm2 em relação à variância, que é respeitada. O director
comercial pretende saber qual o intervalo de confiança, a 95%, para o valor esperado da tensão de
ruptura dos cabos do lote em causa. Defina esse intervalo.

11. Uma amostra de 50 capacetes de protecção, usados por trabalhadores de uma empresa de
construção civil, foram seleccionados aleatoriamente e sujeitos a um teste de impacto, e em 18
foram observados alguns danos. Construa um intervalo de confiança, a 95%, para a verdadeira
proporção p de capacetes que sofre danos com este teste. Interprete o resultado obtido.

12. Qual deve ser o número de habitantes da cidade do Porto a seleccionar aleatoriamente para estudar
a proporção de portuenses que usam óculos, de modo a garantir que um intervalo de confiança a
95% para essa proporção tenha uma amplitude não superior a 8 pontos percentuais?

119
Auto-Avaliação
Auto-Avaliação

1. Uma população tem uma média de 200 e um desvio padrão de 50. Amostras aleatórias simples de
tamanho 100 serão tomadas e calculada as suas média ̅ i .

a) Qual é o valor esperado para a média entre os ̅ i ?

b) Qual é o desvio-padrão desta média?

2. Nas condições do exercício 1–,

a) Qual é a probabilidade de que a média de uma amostra esteja dentro de ± 5 da média da


população?

b) Qual é a probabilidade de que a média de uma amostra estar dentro de ± 10 da média da


população?

3. Assuma que o desvio-padrão da população seja σ = 25. Calcule o erro-padrão das médias (σ ̅ i ),
para tamanhos de amostra de 50, 100, 150, e 200.

4. Suponha que uma amostra aleatória simples de tamanho 50 seja selecionada de uma população
com σ = 10. Encontre o valor do erro-padrão das médias em cada um dos seguintes casos (se
apropriado, use o fator de correção da população finita).

a) o tamanho da população é de N = 50.000.

b) o tamanho da população é N = 5.000

c) o tamanho da população é N = 500

5. Uma população tem uma média de 400 e um desvio-padrão de 50. A distribuição de probabilidade
da população é desconhecida. Um pesquisador usará amostras aleatórias simples de 10, 20, 30 e
40 itens para coletar dados sobre a população. Com qual dessas alternativas de tamanho de

120
amostra seremos capazes de usar a distribuição normal de probabilidade para descrever a
distribuição amostral de ̅ ? Explique.

6. Uma população tem uma média de 100 e um desvio-padrão de 16. Qual é a probabilidade de uma
média da amostra estar dentro de ± 2 da média da população para cada um dos seguintes tamanhos
de amostra?

a) n = 20.

b) n = 50.

c) n = 100.

d) n = 200.

7. Uma amostra aleatória simples de tamanho 100 é selecionada de uma população com p = 0,4.

a) Qual o valor esperado de p ?

b) Qual o desvio-padrão p ?

8. Numa população, 40,0% apresentam certa propriedade. Uma amostra aleatória simples de
tamanho 200 será tomada e calculada a respectiva proporção p .

a) Qual é a probabilidade de que a proporção da amostra esteja dentro de ± 0,03 da proporção da


população?

b) Qual é a probabilidade de que a proporção da amostra esteja dentro de ± 0,05 da proporção da


população?

9. Assuma que a proporção da população seja 0,55. Calcule o erro-padrão da proporção para
tamanhos de amostras de 100, 200, 500 e 1000.

10. A proporção de uma população é 0,30. Qual é a probabilidade de que a proporção da amostra
esteja dentro de ± 0,04 da proporção da população para cada um dos seguintes tamanhos de
amostra:

121
a) n = 10

b) n = 100

c) n = 500

d) n = 1000

e) Qual é a vantagem de um tamanho de amostra maior?

11. O tempo médio de viagem para o trabalho para os habitantes de Joinville é de 31,5 minutos com
desvio padrão de 12 minutos. Uma amostra de 25 residentes de Joinville é selecionada.
a) Qual é a probabilidade de que a média da amostra esteja dentro de ± 1 minuto para a média da
população?

b) Qual é a probabilidade de que a média da amostra esteja dentro de ± 3 minutos para a média da
população?

12. O Depto. de Estatística sobre o Trabalho relatou que a média salarial horária para indivíduos em
cargos executivos, administrativos e gerenciais é de 24,07 Mt com desvio-padrão de 5,00 Mt. Uma
amostra de 120 indivíduos dos cargos executivos, administrativos e gerenciais será selecionada.
a) Qual é a probabilidade de que a média da amostra esteja dentro de ± 50 centavos da média da
população?

b) Qual é a probabilidade de que a média da amostra esteja dentro de ± R$ 1,00 da média da população?

13. De acordo com um jornal, o número médio de dias por ano que as pessoas que viajam a negócios
estão na estrada é de 115. O desvio-padrão é de 60 dias por ano. Considere que uma amostra de 50
viajantes seja selecionada da população.

a) Qual é o valor do erro-padrão da média?

b) Qual é a probabilidade de que a média da amostra seja mais de 120 dias por ano?

c) Qual é a probabilidade de que a média da amostra seja mais de 135 dias por ano?

122
d) Qual é a probabilidade de que a média da amostra esteja dentro de ± 5 dias da média da população?

e) Como a probabilidade mudaria no item (d) se o tamanho da amostra fosse aumentado para 100?

14. Qual é o fator mais importante para as pessoas que viajam a negócios quando estão hospedados
em um hotel? De acordo com o mesmo jornal da questão anterior, 74,0% desses viajantes
declaram que ter um quarto para fumante é o fator mais importante. Considere uma amostra de
200 viajantes será seleciona.

a) Qual é a probabilidade de que a proporção da amostra esteja dentro de ± 0,04 da proporção da


população?

b) Qual é a probabilidade de que a proporção da amostra esteja dentro de ± 0,02 da proporção da


população?

c) Reavalie as questões a) e b) se a amostra tivesse apenas 28 viajantes

15. Uma campanha de produção não é aceitável para embarque a clientes se uma amostra de 1000
itens contém 5,0% ou mais de itens defeituosos. Se uma campanha de produção tem uma
proporção de defeitos da população de p = 7,0%, qual é a probabilidade de que seja aceita ? E se a
exigência fosse numa amostra de apenas 25 itens?

16. A proporção de clientes de uma seguradora de automóveis que receberam pelo menos uma multa
nos últimos 5 anos é de 0,15. A probabilidade de que a proporção da amostra esteja dentro de ±
0,03 da proporção da população é de 0,6965. Qual o tamanho da amostra?

123
Chave de Correção
Chave de Correção

1. Suponha-se que se tem uma população normal com média m desconhecida e desvio - padrão 3, N
( , 9) e uma amostra de 121 observações. Deduza um intervalo de confiança para a m com 95%
de confiança.

Solução
Para os dados deste exercício, vem:
N= 121
3
c: P(-c Z c) = 95% D(c) = 95% c = 1,96
e logo

X c ;X c = X 1,96 ;X 1,96 = X 1,96 ;X 1,96
√ √ √ √

=X 0,535; X 0,535

O intervalo [X - 0,535; X + 0,535] contém o verdadeiro valor do parâmetro com probabilidade ou


confiança de 95%. Conhecida uma estimativa particular daquele parâmetro, torna-se possível calcular
entre que valores seria de esperar que, com 95% de confiança, variasse .

2. Numa cidade pretende-se saber qual a proporção da população favorável a certa modificação de
trânsito. Faz-se um inquérito a 100 pessoas, e 70 declaram-se favoráveis. Determine um intervalo
de confiança a 95% para a proporção de habitantes dessa cidade favoráveis à modificação de
trânsito.

Solução

n=100

70
p 0,7
100
c: P(-c Z c) = 95% D(c) = 95% c = 1,96

124
e logo

p c ; p c =


, , , ,
0,7 1,96 ; 0,7 1,96 =


, . , , .
0,7 1,96 ; 0,7 1,96 =

= [0,6102;0,7898]
O intervalo [0,6102;0,7898] contém o verdadeiro valor do parâmetro p com probabilidade ou confiança de
95%. Ou seja, a proporção de habitantes favoráveis à modificação de trânsito está situada entre 61,02% e
78,98%, com probabilidade de 95%.

3. Uma máquina fabrica cabos cuja resistência à ruptura (em kg/cm2) é uma variável com
distribuição Normal de média 100 e desvio - padrão 30. Pretendese testar uma nova máquina que,
segundo indicações do fabricante, produz cabos com resistência média superior. Para isso,
observam-se 100 cabos fabricados pela nova máquina, que apresentam uma resistência média de
110 kg/cm2. Admita que o novo processo não altera o desvio padrão da resistência à ruptura dos
cabos.

a) Determine um intervalo de confiança a 95% para a resistência média à ruptura dos cabos
produzidos pela nova máquina.

Solução

X segue N(100; 302)

n=100; X =110; σ = 30; = 95%

c: P(-c Z c) = 95% D(c) = 95% c = 1,96, e logo

30 30
X c ;X c = 110 1,96 ; 110 1,96 = 110 1,96 ; 110 1,96
√ √ 100 100

= [104,12;115,88]

Estima-se, com 95% de confiança, que a resistência média à ruptura dos cabos produzidos pela nova
máquina se situa entre 104,12 kg/cm2 e 115,88 kg/cm2.

125
b) Suponha que pretendíamos obter um intervalo de confiança com a mesma amplitude do
anterior, mas com nível de confiança de 99%. Quantos cabos deveriam ser observados?

Solução
Amplitude = 115,88 – 104,12 = 11,76

Amplitude = Lim.Sup. - Lim.Inf. = (X c X c 2c 2. 1,96. 11,76


√ √ √ √

Sendo
X =110; σ = 30 ; 99%
c: P(-c Z c) = 99% D(c) = 99% c = 2,576, e logo
vem que
n 173 cabos.
4. Uma amostra de 20 cigarros é analisada para determinar o conteúdo de nicotina, observando-se
um valor médio de 1,2 mg. Sabendo que o desvio - padrão do conteúdo de nicotina de um cigarro
é 0,2 mg, diga, com 99% de confiança, entre que valores se situa o teor médio de nicotina de um
cigarro.

Solução
X segue N ; 0,22
n 20 ; X 1,2; σ 0,2 ; 99%
c: P(-c Z c) = 99% D(c) = 99% c = 2,576, e logo

, ,
X c ;X c 1,2 2,576 ; 1,2 2,576 X 1,96 ;X 1,96 1,085; 1,315
√ √ √ √

Estima‐se, com 99% de confiança, que o teor médio de nicotina de um cigarro se situa entre 1,085
mg e 1,315 mg.

5. Admita-se que a altura dos alunos de uma escola segue distribuição Normal com variância
conhecida e igual a 0,051. Admita-se ainda que foi recolhida uma amostra aleatória com dimensão
n=25 alunos e calculada a respectiva média amostral, tendo-se obtido o valor de 1,70m. Defina
um intervalo que, com probabilidade 95%, contenha o valor esperado da altura .

Solução
X segue N ; 0,051
n 25 ; X 1,70; σ 0,051 ; 95%
c: P(-c Z c) = 95% D(c) = 95% c = 1,96, e logo
√ , √ ,
X c ;X c 1,70 1,96 ;X 1,96 1,611;1,788
√ √ √ √

126
Estima‐se, com 95% de confiança, altura dos alunos situa‐se entre 1,611 m e 1,788 m.

6. Numa fábrica, procura conhecer-se a incidência de defeituosos na produção de uma máquina. Para
tanto, colhe-se uma amostra de dimensão suficientemente grande (1600 artigos), onde 10% dos
artigos são defeituosos. Determine o intervalo de confiança para a referida proporção com 90% de
confiança.

Solução
n 1600
p 10%
c: P(-c Z c) = 90% D(c) = 90% c = 1,645, e logo
e logo
, , , ,
p c ; p c 0,1 1,645 ; 0,1 1,645

[0,0876;0,1123]
Estima‐se, com 90% de confiança, que a proporção de artigos defeituosos na produção se situa entre
8,76% e 11,23%.

7. O director fabril de uma empresa industrial que emprega 4000 operários emitiu um novo conjunto
de normas internas de segurança. Passada uma semana, seleccionou aleatoriamente 300 operários
e verificou que apenas 75 deles conheciam suficientemente bem as normas em causa. Construa
um intervalo de confiança a 95% para a proporção de operários que conheciam adequadamente o
conjunto das normas uma semana após a sua emissão.

Solução

n 300

p 0,25

c: P(-c Z c) = 95% D(c) = 95% c = 1,96, e logo


, , , ,
p c ; p c 0,25 1,96 ; 0,25 1,96 =

0,201;0,299

Estima-se, com 95% de confiança, que a proporção de operários que conheciam adequadamente o
conjunto das normas se situa entre 20,1% e 29,9%.

127
8. A Direcção de Marketing de uma empresa pretende conhecer a notoriedade da marca de
determinado produto. Nesse sentido, efectuou um inquérito junto de 1200 pessoas escolhidas
aleatoriamente, verificando que 960 a conheciam.

a) Estime a proporção de pessoas conhecedoras da marca através de um intervalo de confiança a


90%.

Solução

n 1200

p 0,8

c: P(-c Z c) = 90% D(c) = 90% c = 1,645, e logo



, , , ,
p c ; p c 0,8 1,645 ; 0,8 1,645 =

[0,781;0,819]

Estima-se, com 90% de confiança, que a proporção de indivíduos conhecedores da marca se situa entre
78,1% e 81,9%.

b) Se se pretender que a amplitude do intervalo de confiança da alínea anterior não seja superior a
0,034, qual deve ser a dimensão mínima da amostra?

Solução

Amp.=Lim.Sup.-Lim.Inf. = (p c p c 2c

0,8 1 0,8
2. 1,645 0,034 1499

c) Sabendo que o intervalo de confiança determinado pela Direcção de Marketing foi [0,767; 0,833],
calcule o nível de confiança utilizado.

Solução

128
p 1 p
p c 0,833

, ,
Logo 0,8 c c 2,86

E D(2,86) na tabela N(0,1) vem igual a 99,6%, a que corresponde o nível de confiança utilizado
9. O gabinete de projectos de uma empresa de material de construção civil pretende estimar a tensão
de ruptura do material usado num determinado tipo de tubos.

Com base num vasto conjunto de ensaios realizados no passado, estima-se que o desvio - padrão da tensão
de ruptura do material em causa é de 70 psi. Deseja-se definir um intervalo de confiança a 99% para o
valor esperado da tensão de ruptura, pretendendo-se que a sua amplitude não exceda 60 psi. Qual o
número de ensaios necessário para definir tal intervalo?

Solução
n ? ; σ 70 ; 99%
c: P(-c Z c) = 99% D(c) = 99% c = 2,576, e logo
amplitude 2c Logo 2c 60 2 . 2,576 60 n 36
√ √ √

10. A empresa SCB controla regularmente a resistência à ruptura dos cabos por si produzidos.
Recentemente, foram analisadas as tensões de ruptura de 10 cabos SCB-33R, seleccionados
aleatoriamente a partir de um lote de grandes dimensões, tendo sido obtida uma média de 4537
kg/cm2. Existe uma norma de 112 kg/cm2 em relação à variância, que é respeitada. O director
comercial pretende saber qual o intervalo de confiança, a 95%, para o valor esperado da tensão de
ruptura dos cabos do lote em causa. Defina esse intervalo.

Solução
X segue N ; 112
n 10 ; X 4537; 10,58 ; 95%
c: P(-c Z c) = 95% D(c) = 95% c = 1,96, e logo
, ,
X c ;X c 4537 1,96 ; 4537 1,96 4530,5; 4543,5
√ √ √ √

Estima‐se, com 95% de confiança, que o tensão média de ruptura dos cabos se situa entre 4530,5
kg/cm2 e 4543,5 kg/cm2.

11. Uma amostra de 50 capacetes de protecção, usados por trabalhadores de uma empresa de
construção civil, foram seleccionados aleatoriamente e sujeitos a um teste de impacto, e em 18
foram observados alguns danos. Construa um intervalo de confiança, a 95%, para a verdadeira
proporção p de capacetes que sofre danos com este teste. Interprete o resultado obtido.

129
Solução

n 50

0,36

c: P(-c Z c) = 95% D(c) = 95% c = 1,96, e logo


, , , ,
p c ; p c 0,36 1,96 ; 0,36 1,96 =

[0,22695;0,49305]

12. Qual deve ser o número de habitantes da cidade do Porto a seleccionar aleatoriamente para estudar
a proporção de portuenses que usam óculos, de modo a garantir que um intervalo de confiança a
95% para essa proporção tenha uma amplitude não superior a 8 pontos percentuais?

Solução
n=?
c: P(-c Z c) = 95% D(c) = 95% c = 1,96, e logo

amplitude p c p c 2. c 0,08

Considerando que a proporção amostral é a que maximiza a amplitude pior dos casos , isto é, que a
proporção amostral é 50% p 1 p ' 1 ‐ 2 pˆ 0 , vem que:
, . ,
2 . c 0,08 2.1,96 0,08 600

130
Unidade Didáctica 7:

Testes de hipóteses

7.1 Introdução
A inferência estatística pode ser dividida em duas grandes áreas: estimação de parâmetros e testes de
hipóteses. Todos os dias temos de tomar decisões respeitantes a determinadas populações, com base
em amostras das mesmas (decisões estatísticas). Nesta tomada de decisões, é útil formular hipóteses
sobre as populações, hipóteses essas que podem ou não ser verdadeiras. A essas hipóteses chamamos
hipóteses estatísticas, as quais geralmente se baseiam em afirmações sobre as distribuições de
probabilidade das populações ou sobre alguns dos seus parâmetros. Uma hipótese pode então ser
definida como uma conjectura acerca de uma ou mais populações. Trata-se de uma técnica para se
fazer inferência estatística. Ou seja, a partir de um teste de hipóteses, realizado com os dados
amostrais, pode-se inferir sobre a população. No caso das inferências através do Intervalo de
Confiança, busca-se “cercar” o parâmetro populacional desconhecido. Aqui formula-se uma hipótese
quanto ao valor do parâmetro, e pelos elementos amostrais faz-se um teste que indicará a aceitação ou
rejeição da hipótese formulada.

131
Objectivos da unidade 7

Objectivos da Unidade 7

Ao completar esta unidade,você será capaz de:

 Definir os vários conceitos básicos sobre testes de hipóteses;


 Diferenciar estatística descritiva de testes de hipóteses;
 Identificar os diferentes tipos de conceitos e problemas sobre testes de hipóteses;
 Classificar os diferentes tipos de problemas refereentes sobre testes de hipóteses ;
 Dar exemplo da aplicação dos diferentes tipos de conceitos sobre testes de hipóteses.

132
Fontes de Informação e Recursos de
Aprendizagem

Fontes de Informações e Recursos de Aprendizagem

Para consolidar os seus conhecimentos sobre as matérias desta unidade veja:


Costa Neto, P. L. de O. (1977) . Estatística. São Paulo: Edgard Blücher.

Hoei, P. G. (1981). Estatistica elementar. 1ª ed., São Paulo: Editora Atlas.

Fonseca, J. S. At al. (1996). Estatística Aplicada. 6ª. Ed.São Paulo: Atlas.

Moretin, L. (1994). Estatística Básica.São Paulo: Makrom Brooks.

Spiegeli, M.R. Probabilidade e Estatística. São Paulo: MacGraw-Hill.

http://www.portalaction.com.br/content/23-outras-estat%C3%ADsticas-descritivas

http://www.portalaction.com.br/content/13-exposi%C3%A7%C3%A3o-dos-dados

7.2 Testes de hipóteses


Os testes de hipóteses podem considerar-se uma segunda vertente da inferência estatística, tendo por
objectivo verificar, a partir de dados observados numa amostra, a validade de certas hipóteses relativas à
população. O resultado do teste corresponde inevitavelmente a uma das duas respostas possíveis para cada
questão: afirmativa ou negativa. Em ambos os casos corre-se o risco de errar. Uma das características do
teste de hipóteses é, justamente, a de permitir controlar ou minimizar tal risco.

Nos testes de hipóteses, e ao contrário dos intervalos de confiança, em vez de procurar uma estimativa ou
um intervalo para um parâmetro, admite-se ou avança-se um valor hipotético para o mesmo, utilizando
depois a informação da amostra para confirmar ou rejeitar esse mesmo valor. A hipótese a testar
denomina-se, pois, de H0 ou de hipótese nula. O objectivo é verificar se os factos observados a

133
contradizem, levando a optar pela hipótese alternativa H1. Isto é, a estratégia básica seguida no método de
teste de hipóteses consiste em tentar suportar a validade H1 de uma vez provada a inverosimilhança de H0.
Exemplo:
Registos efectuados durante vários anos permitiram estabelecer que o nível de chuvas numa determinada
região, em milímetros por ano, segue uma lei normal N(600;100). Certos cientistas afirmavam poder fazer
aumentar o nível médio das chuvas em 50 mm. O seu processo foi posto à prova e anotaram-se os
valores referentes a 9 anos: 510; 614; 780; 512; 501; 534; 603; 788; 650.

Que se pode concluir? Adopte um nível de significância de 5%.


Resolução:
Duas hipóteses se colocavam: ou o processo proposto pelos cientistas não produzia qualquer efeito, ou
este aumentava de facto o nível médio das chuvas em 50 mm. Estas hipóteses podem formalizar-se do
modo seguinte:

H 0: =600 mm

H 1: =650 mm

Este é um problema clássico de teste de hipóteses, em que está em causa aceitar ou rejeitar a hipótese nula,
em função dos resultados de uma amostra. Ao utilizar uma amostra de uma população, estamos a lidar
com leis de probabilidades, logo não é possível de saber se a hipótese nula é verdadeira ou falsa, mas
apenas medir as probabilidades envolvidas na tomada de decisão.

Podem-se definir 2 formas de especificar Ho e H1:

(i) hipótese simples contra hipótese simples

Ho : = 0

H1 : = 1

(ii) hipótese simples contra hipótese composta

Ho : = 0

H1 : 0 ou : 0 ou : 0

Estes testes designam-se respectivamente de teste unilateral à direita, teste unilateral à esquerda e teste
bilateral.

Sendo os testes de hipóteses, portanto, um processo de inferência estatística onde se procuram tomar
decisões sobre a população com base numa amostra, é natural que envolvam alguma margem de erro e
que ocorram em situação de incerteza. Estes erros não podem ser completamente evitados mas, no
entanto, pode-se manter pequena a probabilidade de os cometer. Compete ao investigador decidir qual a
dose de risco de se enganar em que está disposto a incorrer. Vamos supor uma probabilidade de erro de,
por exemplo, 5%. Nesse caso, e avançada a hipótese nula Ho, o investigador só estaria disposto a rejeitá-la
se o resultado obtido na amostra fizesse parte de um conjunto de resultados improváveis que teriam
apenas, por exemplo, 5 chances em 100 de se produzir. Este tipo de formulação é conhecida como postura

134
conservadora. Ou seja, estamos mais propensos a achar que o novo processo não tem qualquer efeito sobre
o nível das chuvas (isto é, que tudo se mantém igual) do que investir no novo processo (mudar),
arriscando apenas quando houver evidências da amostra muito fortes a favor do novo. Para que esta
decisão possa ser tomada de uma forma controlada, é conveniente pois que, à partida, se fixe o valor a
partir do qual se considera improvável a validade da hipótese nula. Tal fixação corresponde à fixação da
regra de decisão do teste.

A formalização desta regra passa pela especificação de uma região de região de rejeição. A essa região,
isto é, ao conjunto de valores “improváveis” que conduzem à rejeição da hipótese nula dá-se o nome de
Região Crítica. Ao limite superior de risco, que na maior parte dos casos é de 10%, 5% ou 1%, dá-se o
nome de Nível de Significância do teste, sendo este que permite definir a condição de rejeição de Ho.

O Nível de Significância designa-se de e corresponde, então, à probabilidade de o resultado amostral


levar à rejeição de Ho, supondo Ho verdadeira, isto é, à probabilidade de se estar a cometer aquilo
a que se convenciona chamar de erro de 1ª espécie.

Como veremos no exemplo, existem também erros de 2ª espécie, cuja probabilidade se designa pela letra
. Em resumo:

Quadro de decisão em condição de incerteza

Hipótese nula Ho
Decisão Hipótese Ho ser verdadeira: Hipótese Ho ser falsa
Aceitar Ho Decisão correcta (1- ) Erro de tipo II
Beta ( )
Rejeitar Ho Erro de tipo I Decisão correcta (1- )
Alfa ( )

Como decidir?

Visto que se trata de testar o valor de a variável de decisão será X . Considerando Ho verdadeira vem que

100
X ∩ N 600:
√9

Em princípio, grandes valores de X são improváveis, pelo que se opta pela seguinte regra de decisão:

Se X fôr demasiado grande, isto é, superior a um valor crítico c que tem apenas 5 chances em 100 de ser
ultrapassado, opta-se por H1 com probabilidade 5% de se estar a cometer um erro. Se tal não acontecer,
conserva-se Ho, por falta de provas suficientes para não o fazer.

Logo sendo

P(Rejeitar Ho / Ho) = = 5%, vem que

600
0,05 ≪ ≫ 0,05
600 100
√ √9
≪ ≫c 600 1,645. = 654,83(3)

135
A regra de decisão é, então, a seguinte:

 - rejeitar H0 em favor de H1, se o valor amostral fôr superior a 654,83(3)

 - conservar H0 em detrimento de H1 se fôr inferior a 654,83(3)

A Região Crítica deste teste, isto é, o conjunto de acontecimentos que levam à rejeição de H0 corresponde
a todos os valores de X > 654,83(3).

Os dados recolhidos indicavam X = 610,2 mm, pelo que a decisão é conservar H0 , isto é, considerar que o
processo científico não produz efeitos.

No entanto, os erros incorridos não se ficam apenas pelos de 1ª espécie. Existem também erros de 2ª
espécie. Isto é, à partida parte-se do princípio que H0 é verdadeira e só se rejeitará essa hipótese se
ocorrerem acontecimentos pouco prováveis.

No entanto, é possível alternativamente partir do princípio que é H1 que é verdadeira, ou seja, considerar
que o processo científico é realmente eficaz no aumento do nível médio das chuvas, mas que,
infelizmente, o número de valores observado não permite observar resultados ou esses resultados foram
insuficientes.

Supondo então que H1 é verdadeira ( =650 mm), então vem que:

100
X ∩ N 650:
√9

136
A probabilidade de rejeitar H1 erradamente, isto é, de se cometer um erro de 2ª
espécie, vem então igual a:

P(Rejeitar H1 / H1)=

654,83 3 654,83 3 650


650 100
√ √9

0; 1 0,14 55,57 %

É através das probabilidades e que se procura o melhor teste de hipóteses, sendo o teste ideal o que
minimiza simultaneamente ambos os valores. No entanto, e como e se referem a realidades opostas e
variam em sentido contrário, tal não é possível. O que na maior parte dos casos se faz é fixar o (para
amostras de dimensão n) e tentar minimizar .

Região de rejeição e de aceitação da hipótese nula

137
Chama-se potência de um teste à probabilidade de rejeitar H0 quando esta é falsa. Esta é uma decisão
certa, não implica erro, e é complementar do erro de 2ª espécie. Logo, quanto menor o erro de 2ª espécie,
maior será o valor da potência do teste e, logo, maior a sua qualidade (diz-se que o teste é mais potente) .
Quando H1 é uma hipótese composta (>, < ou ), a potência do teste é variável, dependendo do valor do
parâmetro que não é fixo. Nesse caso falase em função potência do teste = 1 - ( 1)

Resumindo: passos para construção de um teste de hipóteses:

Passo No 1: Formular as hipóteses nula e alternativa

Passo No 2: Decidir qual estatística (estimador) será usada para julgar a Ho e a variável de decisão

Passo No 3: Definir a forma da Região Crítica, em função da hipótese H1

Passo Nº 4: Fixar o nível de significância

Passo Nº 5: Construir a Região Crítica em função do nível de significância

Passo Nº 6: Cálculo (eventual) da potência do teste

Passo Nº 7: Calcular a estatística da amostra

Passo No 8: Tomar a decisão: rejeição ou não de Ho

138
TAREFAS
Tarefas

1. Suponha que o director de qualidade pretende averiguar se o peso dos pacotes de arroz produzidos
corresponde ao valor assinalado na embalagem. Seja X a variável que representa o peso de um
pacote de arroz. Suponha que X ∩N( ;0,012 ) e que se conhece a seguinte amostra:
1,02; 0,98; 0,97; 1,01; 0,97; 1,02; 0,99; 0,98 1,00.
Será que, para um nível de significância de 5% se pode dizer que o peso médio corresponde ao
peso de 1 kg assinalado na embalagem?

2. Numa cidade, pretende-se saber se metade da população é favorável à construção de um centro


comercial. Faz-se um inquérito a 200 pessoas, e 45% declaram-se favoráveis. Estes valores
contradizem a hipótese?

3. O peso dos pacotes de farinha de 1 kg, produzidos por uma fábrica, é uma variável normalmente
distribuída, com desvio padrão 0,01. Da produção de determinado dia é retirada uma amostra de
49 pacotes, com peso médio de 0,998 Kg.
Pode-se afirmar, a um nível de significância de 1%, que o peso médio dos pacotes de farinha
nesse dia não está de acordo com o peso indicado?

4. Numa região onde existem entre os maiores de 18 anos 50% de fumadores, é lançada uma intensa
campanha anti-tabaco. Ao fim de três meses, realiza-se um mini-inquérito junto de 100 cidadãos
com mais de 18 anos, registando-se 45 fumadores.

a) Com 1% de significância, pode concluir-se que a campanha surtiu efeito?

b) Em caso negativo, qual seria a dimensão da amostra a partir da qual aquela percentagem
permitiria afirmar que a cmapnha atingiu o fim em vista?

5. Um fabricante afirma que o tempo médio de vida de um certo tipo de bateria é de 240 horas, com
desvio-padrão de 20 horas. Uma amostra de 18 baterias forneceu os seguintes valores:
237 242 232
242 248 230
244 243 254
262 234 220
225 236 232

139
218 228 240
Supondo que o tempo de vida das baterias se distribui normalmente, poder-se-á concluir, a 5% de
significância, que as especificações não estão a ser cumpridas?

6. Uma empresa de cerâmica tem, em dada secção, fornos controlados por termóstatos para manter a
temperatura no interior dos fornos a 600 graus centígrados. A experiência tem demonstrado que a
variância dos valores da temperatura no interior desses fornos é de 360.
A empresa fornecedora dos fornos comercializa agora um novo tipo de controlador, que é
anunciado como garantindo que as temperaturas se mantêm dentro do limite desejado. Foram
registadas 5 medidas de temperatura de fornos regulados para 600o, utilizando novos
controladores:
620o 595o 585o 602o 608o
Para 5% de significância, poder-se-á concluir que a temperatura não se afasta significativamente
do valor desejado?

7. O peso dos ovos de chocolate produzidos numa fábrica segue distribuição normal com variância
90,25.
a) O fabricante diz que o peso médio é de 160g. Foi recolhida uma amostra de 100 ovos, cujo
peso médio foi de 158, 437g. Teste, a um nível de significância de 1%, se a afirmação do
fabricante pode ser considerada verdadeira, ou se, pelo contrário, o verdadeiro peso dos ovos será
menor.

b) Qual o nível de significância a partir do qual a conclusão seria diferente?



8. Um jornal semanário afirma ter atingido, numa região, a percentagem, até então nunca atingida
por qualquer semanário, de 60% de leitores que regularmente compram um jornal desse
tipo. Efetuando um inquérito junto de 600 leitores, 55% declararam adquirir, por hábito, o
semanário em causa.
Adoptando um nível de significância de 1%, pronuncie-se quanto à projecção que o semanário
reclama.

9. Um molde de injecção tem produzido peças de um determinado material isolante térmico com
uma resistência à compressão com valor esperado de 5,18 kg/cm2 e variância 0,0625 (kg/cm2)2.
As últimas 12 peças produzidas nesse molde foram recolhidas e ensaiadas, tendo-se obtido para a
resistência média à compressão o valor de 4,95 kg/cm2.

a) Poder-se-á afirmar, a um nível de significância de 5%, que as peças produzidas recentemente


são menos resistentes do que o habitual?

b) Qual a potência do teste efectuado anteriormente, admitindo que o valor esperado da


resistência à compressão das peças produzidas recentemente é de 4,90 kg/cm2?

140
10. Um jornal desportivo noticiou que o número de espectadores de um programa desportivo que é
apresentado na televisão aos domingos à noite está igualmente dividido entre homens e
mulheres. De uma amostra aleatória de 400 pessoas que vêem regularmente o referido programa,
concluiu-se que 240 são homens.

Pode-se concluir, para um nível de significância de 10%, que a notícia é falsa?

141
Auto-Avaliação
Auto-Avaliação

1. A resistência à tração do aço inoxidável produzido numa certa usina permanecia estável, com uma
resistência média de 72 kg/mm2 e um desvio-padrão de 2,0 2 kg/mm2 com distribuição normal.
Recentemente a máquina foi ajustada. A fim de determinar o efeito do ajuste, 10 amostras foram testadas.
Os testes apresentaram resistência média de 75 kg/mm2 . Considere que o desvio-padrão não mudou. Com
base nesses dados responda:

a) Com um nível de significância de 5% é possível afirmar que o valor médio não mudou? (Passos: defina
as hipóteses, faça o teste, tome a decisão).

R: Rejeita-se Ho, ou seja, não é possível afirmar.

b) Calcule o erro do tipo II para μ=75 kg/mm2 e para μ=80 kg/mm2.

2. A DeBug Company vende um repelente de insetos que alega ser eficiente pelo prazo de 400 horas no
mínimo. Uma análise de nove itens escolhidos aleatoriamente acusou uma média de eficiência de 380
horas.

a) Teste a afirmação da empresa, contra a alternativa que a duração é inferior a 400 horas, ao nível de
significância de 1%, se o desvio-padrão amostral é de 60 horas (considere distribuição normal). (Passos:
defina as hipóteses, faça o teste, tome a decisão).

R: Não rejeita-se Ho, ou seja, não é inferior a 400 horas.

b) Calcule o erro do tipo II para μ=350 horas.

3. Um comprador, ao receber de um fornecedor um grande lote de peças, decidiu inspecionar 200 delas.
Decidiu, também, que o lote será rejeitado se ficar convencido, ao nível de 5% de significância, de que a
proporção de peças defeituosas no lote é superior a 4%. Qual será sua decisão (aceitar ou rejeitar o lote) se
na amostra foram encontradas onze peças defeituosas?(Passos: defina as hipóteses, faça o teste, tome a
decisão).

R: Não rejeita-se Ho, ou seja, a decisão será aceitar o lote.

142
4. Uma companhia de seguros iniciará uma campanha extensa de propaganda para vender apólices de
seguro de vida, se verificar que a quantia média segurada por família é inferior a 10.000,00 Mt. Tomou-se
uma amostra aleatória de 50 famílias que acusou um seguro médio de 9.600,00 Mt com desvio padrão de
1.000,00 Mt. Com base na evidência amostral, a campanha deve ser iniciada ou não (nível de 1% de
significância)? Quais as hipóteses necessárias? (Passos: defina as hipóteses, faça o teste, tome a decisão).

5. Uma amostra de 27 elementos forneceu s2 =2,12. Deseja-se saber se é possível afirmar, ao nível de 5%
de significância que a variância da população é inferior a 5? Quais as hipóteses necessárias? (Passos:
defina as hipóteses, faça o teste, tome a decisão).

R: Rejeita-se Ho, ou seja, é possível afirmar.

6. Sejam μ1 e μ2 as vidas médias de duas marcas concorrentes de pneus radiais de tamanho P205/65R15.
Teste H0: μ1 - μ2 = 0 versus Ha: μ1 - μ2 0, no nível de significância de 0,05, usando os seguintes dados:
= 45, x = 42.500, s1 = 2200, n=45, y=40.400 e s2 =1900.

7. Testes de resistência à tensão foram realizados em dois graus diferentes de haste de arame, resultando
nos dados a seguir:

Grau Tamanho da Amostra Média amostral DP amostral


(kg/mm2 )

SI 1064 m = 129 = 107,6 s1 = 1,3

SI 1078 n = 129 = 123,6 s2 = 2,0

a) Os dados fornecem evidências convenientes para concluir que a resistência média real do grau 1078
excede a do grau 1064 por mais de 10 kg/mm2 ? Teste as hipóteses apropriadas, usando a abordagem do
valor P.

b) Calcule a diferença entre as resistências médias reais dos dois graus, de forma que forneça informações
sobre precisão e confiabilidade.

8. Um fabricante de inseticida descobriu, em uma pesquisa, que muitos consumidores da categoria


achavam que o cheiro do seu produto era suave demais, o enfraquecia o seu apelo publicitário de produto
fortíssimo contra os insetos. Após alguns sniff tests, foi selecionado um novo aroma para o produto.
Faltava testar o novo aroma no produto em uso pela consumidora. O fabricante solicitou à empresa de
pesquisa que fizesse um teste de produto in home em que uma amostra de 180 consumidores usaria
durante uma semana o produto com o cheiro atual, enquanto uma outra amostra, também de 180
consumidores com o mesmo perfil, usaria o produto com o novo cheiro. Definiu como padrão de ação:
mudar o aroma de sua marca se, e somente se, o novo produto for superior ao atual.

143
Suponha que o fabricante tenha escolhido o nível de significância 0,05. A avaliação em escala de 7 pontos
resultou nos seguintes parâmetros.

Aroma atual Aroma novo

Média 5,94 6,27

Desvio Padrão 2,22 2,39

a) Defina as hipóteses
b) Faça o teste
c) Qual é a decisão do fabricante?
d) Qual seria a decisão se tivesse determinado o nível de significância de 0,10?
e) Qual nível de significância você teria escolhido (ANTES DE FAZER A PESQUISA)? Por quê?

144
Chave de Correção
Chave de Correção

1. Suponha que o director de qualidade pretende averiguar se o peso dos pacotes de arroz
produzidos corresponde ao valor assinalado na embalagem. Seja X a variável que representa o
peso de um pacote de arroz. Suponha que X ∩N( ;0,012 ) e que se conhece a seguinte
amostra:
1,02; 0,98; 0,97; 1,01; 0,97; 1,02; 0,99; 0,98 1,00.
Será que, para um nível de significância de 5% se pode dizer que o peso médio corresponde ao
peso de 1 kg assinalado na embalagem?

Solução
Passo 1
Formular as hipóteses:
Ho : =1
H1 : <1
Passo 2
A estatística a ser utilizada será a média amostral
Passo 3
A região crítica é formada por todos os valores menores ou iguais a c
Passo 4
Assumir um nível de significância de 5%
Passo 5
Para =5%, determinar a região de rejeição e aceitação. Logo, sendo

P(Rejeitar Ho / Ho) = = 5%, vem que


1
0,05 ≪ ≫ 0,05
1 0,01
√ √9

,
≪ ≫c 1 1,645. = 0,9945

Logo, RC = ]- ∞;0,9945]

145
Passo 6
Calcular a estatística X= ∑ X = 0,9933

Passo 7
Tomar a decisão
Como o valor da amostra foi 0,9933 e é menor que o valor crítico 0,9945, rejeita-se Ho
Ou seja, considera-se que o arroz contido em cada pacote era inferior ao indicado. No entanto, há
o risco de se mandar parar a produção para revisão do equipamento sem necessidade. Reduzindo a
probabilidade de isso ocorrer de 5% para 1%, vem:

A única mudança será no Valor Crítico, que de 0,9945 para 0,9922. Neste caso, aceitaremos Ho,
ou seja, consideraremos que não há qualquer anomalia na produção.

2. Numa cidade, pretende-se saber se metade da população é favorável à construção de um


centro comercial. Faz-se um inquérito a 200 pessoas, e 45% declaram-se favoráveis. Estes
valores contradizem a hipótese?

Solução
Passo 1
Formular as hipóteses:
Ho: p = 0,5
H1: p < 0,5

Passo 2
A estatística a ser utilizada será a proporção amostral, onde o cuidado deve ser
trabalhar com grandes amostras.

Passo 3

146
A região crítica é formada por todos os valores menores ou iguais a c

Passo 4
Assumir um nível de significância de 5%

Passo 5
Para =5%, determinar a região de rejeição e aceitação. Logo, sendo

P(Rejeitar Ho / Ho) = = 5%, vem que

,
P(p 0,05 ≪ ≫ P )=0,05 ≪ ≫
, , ,

, ,
≪ ≫ 1,645 . 0,442

Logo, RC = ]- ∞;0,442]

Passo 6
p = 0,45

Passo 7
Como o valor amostral 0,45 é maior que o valor crítico 0,442, não se rejeita Ho

Ou seja, apesar de apenas 45% dos habitantes se terem manifestado a favor da construção do
centro comercial, essa margem não é suficiente para decidir deixar de o construir.

3. O peso dos pacotes de farinha de 1 kg, produzidos por uma fábrica, é uma variável
normalmente distribuída, com desvio padrão 0,01. Da produção de determinado dia é retirada
uma amostra de 49 pacotes, com peso médio de 0,998 Kg.
Pode-se afirmar, a um nível de significância de 1%, que o peso médio dos pacotes de farinha
nesse dia não está de acordo com o peso indicado?

147
Solução
X segue N(m; 0,012)
n = 49
X= 0,998
α = 1%
H0 : μ = 1
H1 : μ < 1

P(Rejeitar Ho/Ho verdadeira) = = 1%

1
0,01 ≪ ≫ 0,01
1 0,01
√ √49

1
≪ ≫ 2.326 ≪ ≫ 0,997
0,01
√49
Como X = 0,998 > c = 0,997, não pertence à região crítica, logo não se rejeita Ho a um nível de
significância de 1% (não se pode afirmar que o peso médio não esteja de acordo com o indicado).

4. Numa região onde existem entre os maiores de 18 anos 50% de fumadores, é lançada uma
intensa campanha anti-tabaco. Ao fim de três meses, realiza-se um mini-inquérito junto de
100 cidadãos com mais de 18 anos, registando-se 45 fumadores.

c) Com 1% de significância, pode concluir-se que a campanha surtiu efeito?

Solução
n = 100
p = 0,45
a = 1%

H0: p = 0,5 (a campanha não surtiu efeito)


H1: p < 0,5 (a campanha surtiu efeito)
P(Rejeitar Ho/Ho verdadeira) = = 1%

,
P X 0,01 ≪ ≫ P )=0,01 ≪ ≫
, , ,

148
0,5
≪ ≫ 2.326 ≪ ≫ 0,384
0,5 . 0,5
100

Como p = 0,45 > c = 0,384, não pertence à região crítica, logo não se rejeita Ho a um nível de
significância de 1% (a campanha não surtiu efeito).

d) Em caso negativo, qual seria a dimensão da amostra a partir da qual aquela percentagem
permitiria afirmar que a cmapnha atingiu o fim em vista?

Solução
, , ,
P X 0,01 ≪ ≫ P )=0,01 ≪ ≫
, , ,

0,45 0,5
≪ ≫ 2.326 ≪ ≫ 541
0,5 . 0,5

5. Um fabricante afirma que o tempo médio de vida de um certo tipo de bateria é de 240 horas,
com desvio-padrão de 20 horas. Uma amostra de 18 baterias forneceu os seguintes valores:
237 242 232
242 248 230
244 243 254
262 234 220
225 236 232
218 228 240
Supondo que o tempo de vida das baterias se distribui normalmente, poder-se-á concluir, a 5% de
significância, que as especificações não estão a ser cumpridas?
Solução

X segue N( ; 202)
n = 18
X= ∑ X = 237,05

= 5%
H0 : = 240
H1: < 240

149
P(Rejeitar Ho/Ho verdadeira) = = 1%
240
0,05 ≪ ≫ 0,05
240 20
√ √18

240
≪ ≫
20
1,645 ≪ ≫ 232,25
√18
Como X = 237,05 > c = 232,25, não pertence à região crítica, logo não se rejeita Ho a um nível de
significância de 1% (não se pode afirmar que as especificações não estão a ser cumpridas).

6. Uma empresa de cerâmica tem, em dada secção, fornos controlados por termóstatos para
manter a temperatura no interior dos fornos a 600 graus centígrados. A experiência tem
demonstrado que a variância dos valores da temperatura no interior desses fornos é de 360.
A empresa fornecedora dos fornos comercializa agora um novo tipo de controlador, que é
anunciado como garantindo que as temperaturas se mantêm dentro do limite desejado. Foram
registadas 5 medidas de temperatura de fornos regulados para 600o, utilizando novos
controladores:
620o 595o 585o 602o 608o
Para 5% de significância, poder-se-á concluir que a temperatura não se afasta significativamente
do valor desejado?
Solução
X segue N(μ;360)
n=5
X = ∑ Xi = 602

α 5%
H0: μ = 600
H1: μ > 600
P(Rejeitar Ho/Ho verdadeira) = α= 5%

P(X c/μ 600 ) 0,05≪ ≫ P 0,05


√ √

600
≪ ≫
360
1,645 ≪ ≫ 613,96
√5

Como X= 602 < c = 613,96, não pertence à região crítica, logo não se rejeita Ho a um nível de
significância de 1% (a temperatura não se afasta significativamente do valor desejado).

150
7. O peso dos ovos de chocolate produzidos numa fábrica segue distribuição normal com
variância 90,25.
a) O fabricante diz que o peso médio é de 160g. Foi recolhida uma amostra de 100 ovos, cujo
peso médio foi de 158, 437g. Teste, a um nível de significância de 1%, se a afirmação do
fabricante pode ser considerada verdadeira, ou se, pelo contrário, o verdadeiro peso dos ovos será
menor.
Solução
a) X segue N(μ; 90,25)
n = 100
X = 158,437
α = 1%
H0: μ = 160
H1: μ < 160
P(Rejeitar Ho/Ho verdadeira) = α = 1%

P(X c/μ 160 ) = 0,01≪ ≫ P √ ,


0,01
√ √

1
≪ ≫ 2,326 ≪ ≫ 157,79
9,5
√100
Como X= 158,437 > c = 157,79, não pertence à região crítica, logo não se rejeita Ho a um nível de
significância de 1% (a afirmação do fabricante pode ser considerada verdadeira).

b) Qual o nível de significância a partir do qual a conclusão seria diferente?


Solução
,
P(X 158,437/μ 160 ) = ≪ ≫ P √ ,
α
√ √

≪ ≫F 1,645 ≪ ≫ 5%


8. Um jornal semanário afirma ter atingido, numa região, a percentagem, até então nunca
atingida por qualquer semanário, de 60% de leitores que regularmente compram um jornal
desse tipo. Efetuando um inquérito junto de 600 leitores, 55% declararam adquirir, por hábito,
o semanário em causa.
Adoptando um nível de significância de 1%, pronuncie-se quanto à projecção que o semanário
reclama.
Solução
n = 600

151
p = 0,55
α=1%
H0: p = 0,6
H1: p < 0,6
P(Rejeitar Ho/Ho verdadeira) = α = 1%
,
P X 0,01 ≪ ≫ P )=0,01 ≪ ≫
, , ,

0,6
≪ ≫ 2.326 ≪ ≫ 0,5535
0,6 . 0,4
600

Como p = 0,55 < c = 0,5535, pertence à região crítica, logo rejeita-se Ho a um nível de
significância de 1% (o semanário não atingiu a projecção que reclama).

9. Um molde de injecção tem produzido peças de um determinado material isolante térmico com
uma resistência à compressão com valor esperado de 5,18 kg/cm2 e variância 0,0625
(kg/cm2)2. As últimas 12 peças produzidas nesse molde foram recolhidas e ensaiadas, tendo-
se obtido para a resistência média à compressão o valor de 4,95 kg/cm2.

b) Poder-se-á afirmar, a um nível de significância de 5%, que as peças produzidas recentemente


são menos resistentes do que o habitual?

Solução

X segue N(μ; 0,0625)


n = 12
x = 4,95
α = 5%
H0: μ = 5,18
H1: μ < 5,18
P(Rejeitar Ho/Ho verdadeira) = α = 5%

,
P X 0,05 ≪ ≫ P √ ,
)=0,05 ≪ ≫
,
√ √

0,6
≪ ≫ 1.645 ≪ ≫ 5,061
0,0625
12
Como x = 5,18 > c = 5,061, não pertence à região crítica, logo não se rejeita Ho a um nível de
significância de 1% (as peças produzidas recentemente não são menos resistentes do que o habitual).

152
b) Qual a potência do teste efectuado anteriormente, admitindo que o valor esperado da
resistência à compressão das peças produzidas recentemente é de 4,90 kg/cm2?

Solução
Potência = 1-β
β = (Conservar Ho/H1 verdadeira)
, , ,
P X 0,05 ≪ ≫ P √ ,
)=0,05 ≪ ≫
,
√ √

5,061 4,9
≪ ≫ 1 – 0,01 1 0,5040 49,6%
0,0625
12

10. Um jornal desportivo noticiou que o número de espectadores de um programa desportivo que
é apresentado na televisão aos domingos à noite está igualmente dividido entre homens e
mulheres. De uma amostra aleatória de 400 pessoas que vêem regularmente o referido
programa, concluiu-se que 240 são homens.

Pode-se concluir, para um nível de significância de 10%, que a notícia é falsa?

Solução
n = 400
p = 0,6
α = 10 %
H0: p = 0,5
H1: p > 0,5
P(Rejeitar Ho/Ho verdadeira) = α = 10%

,
P X 0,1 ≪ ≫ P )=0,9 ≪ ≫
, , ,

0,5
≪ ≫ 1,282 ≪ ≫ 0,53205
0,5 . 0,5
400

153
154

Você também pode gostar