Você está na página 1de 138

Estaística Educacional

Ensino Básico

Ensino à Distância

Universidade Pedagógica
Rua Comandante Augusto Cardoso nº135
1
Page
Direitos de autor (copyright)
Este módulo não pode ser reproduzido para fins comerciais. Caso
haja necessidade de reproduçãodeverá ser mantida a referência à
Universidade Pedagógica e aos seus Autores

Universidade Pedagógica
Rua Comandante Augusto Cardoso, nº 135
Telefone: 21-320860/2
Telefone: 21 – 306720
Fax: +258 21-322113
1
Page
Agradecimentos
À COMMONWEALTH of LEARNING (COL) pela
disponibilização do Template usado na produção
dos Módulos.
Ao Instituto Nacional de Educação a Distância (INED) pela
orientação e apoio prestados.
Ao Magnífico Reitor, Directores de Faculdade e Chefes de
Departamento pelo apoio prestado em
todo o processo.
Gostaria de agradecer a colaboração dos seguintes indivíduos e
instituições na elaboração deste manual:

2
Page
Ficha Técnica

Autor: Macie, Jonatane Matias & Manhique, Célia Mateus

Desenho instrucional:

Revisão Linguística:

Maquetização:
Ilustração:

Contacto: 846185571

3
Page
Índice

Visão geral 8
Bem-vindo ao Módulo de Estatística ............................................................................. 8
Objectivos do curso ........................................................................................................... 8
Quem deveria estudar este módulo.................................................................................... 9
Como está estruturado este módulo................................................................................... 9
Ícones de actividade ........................................................................................................ 10
Habilidades de estudo ...................................................................................................... 12
Precisa de apoio? ............................................................................................................. 12
Tarefas (avaliação e auto-avaliação) ............................................................................... 12
Avaliação ......................................................................................................................... 13

Unidade 1 14
Estatística descritiva ........................................................................................................ 14
Introdução ............................................................................................................ 14

4 Page
1.1 Introdução à Estatistica ............................................................................................. 15
1.1.1Objecto da estatística ............................................................................................... 15
1.1.2 Um pouco de História............................................................................................. 17
1.1.3 Importância da Estatística....................................................................................... 18
O estudo ........................................................................................................................... 19
1.1.4 Termos e conceitos básicos de estatística ..................................................... 20
1.1.5 Razões para a utilização de uma amostra ................................................ 21
1.1.6 Cuidados a ter na formação de uma Amostra ......................................... 21
Exercícios para auto avaliação ........................................................................................ 22
1.1.7 Amostragem ................................................................................................. 24
1.1.8 Tipos de amostragem ................................................................................. 24
1.1.9 Estatística descritiva e Estatística Indutiva ............................................. 26
1.1.10 Caracteres ou variáveis estatísticas .............................................................. 29

Sumário 30
Exercícios de auto avaliação ........................................................................................... 31

Soluções 35
1.2 Distribuição de Frequências e Gráficos..................................................................... 36
Introdução ........................................................................................................................ 36
1.2.1 Tabela de Frequências ............................................................................................ 37
1.2.2 Gráficos de Distribuição de Frequências................................................................ 41

Sumário 44
1.3 Medidas de localizaçao............................................................................................. 45
Introdução ........................................................................................................................ 45
1.3.1 Média Aritmética ( X )............................................................................................ 46
1.3.2 MEDIANA (Me) .................................................................................................... 48
1.3.3 MODA, NORMA OU MODO (MO) ...................................................................... 50
1.3.4 CONSIDERACÕES GERAIS SOBRE A MÉDIA, A
MODA E A MEDIANA.................................................................................................. 53

Licao No 8 56
1.3.5 Medidas separatrizes ( quartis, decis e Percentis) ................................................. 56

Sumário 61

Exercicios de Auto-avaliação 62
1.4 Medidas de Dispersao ............................................................................................... 66
Introdução ........................................................................................................................ 66

Licao No 9 66
1.4.1 Amplitude Total (At) .............................................................................................. 66
1.4.2 Desvio- Médio (Dm) .............................................................................................. 67
1.4.3 Variância................................................................................................................ 68
1.4.4 Desvio- Padrão ...................................................................................................... 68
1.4.6 Relações Empíricas Entre as Medidas de Dispersão .............................................. 71
1.5 DISTRIBUIÇÕES BIDIMENSIONAIS .................................................................. 73
Introdução ............................................................................................................ 73
5 Page
Terminologia 74

Neste capítulo, você deverá prestar muita atenção aos seguintes


conceitos: 74

 Diagrama de dispersão 74

 Covariância 74

 Coeficiente de correlação linear; 74

 Coeficiente de determinação 74

 Recta de regressão linear. 74

Licao No 10 74
1.5.2 COVARIÂNCIA .................................................................................................... 76
1.5.3 COEFICIENTE DE CORRELAÇÃO LINEAR DE
PEARSON ....................................................................................................................... 77
1.5.4 REGRESSÃO LINEAR SIMPLES........................................................................ 78

Sumário 79

Exercicios 80

Exercicios de auto avaliaçao 81

Unidade 2 85
Teoria Elementar de Probabilidades e Distribuições....................................................... 85
Introdução ............................................................................................................ 85
6 Page
Licao No 1 86
2.1 Teoria Elementar de Probabilidades.......................................................................... 86
2.1.1 Origem das Probabilidades ..................................................................................... 86
2.1.2.Termos e Conceitos Probabilisticos ....................................................................... 86
2.1.3 Definição Clássica de Probabilidade ...................................................................... 88
A primeira definição que se conhece de probabilidade foi
enunciada por Pierre Simon Laplace( 1749-1827) ......................................................... 88

Lição No 2 89

2.1.4 Noções Básicas de Análise Combinatória .............................................................. 89


(Factorial, Permutações, Arranjos e Combinações) ........................................................ 89

Exercicios para auto avaliaçao 93

Licão No 3 94

2.1.4 Teoremas Básicos de Probabilidades ..................................................................... 95

Sumário 99

Exercicios de Auto-Avaliação 101

Soluções 104
2.2 Distribuição de probabilidade.................................................................................. 105
Introdução .......................................................................................................... 105

Lição No 4 106
2.2.1 Introdução à distribuição normal de
probabilidade ................................................................................................................. 106
Uso da tabela de distribuição normal de probabilidade ................................................ 107

Exercicios de Auto-Avaliação 108

Soluçoes 108

Lição No 5 109
2.2.2 Distribuição Qui- quadrado ........................................................................ 109
2.2.3 Distribuição t- Student ................................................................................ 110

Exercicios de Auto-Avaliação 111

Unidade 3 112
Estatística inferencial..................................................................................................... 112
Introdução .......................................................................................................... 112
7 Page
Lição No 1 113
3.1 Distribuição amostral e Intervalo de confiança para a
média de uma população ............................................................................................... 113
3.1.1 Distribuição Amostral .............................................................................. 113
3.2.1. Intervalo de confiança para a média de uma população ...................................... 114
3.1.2 Intervalo de confiança para proporções ................................................. 115
3.1.3. Intervalo de confiança para a variância de uma
população....................................................................................................................... 116

Lição No 2 118
3.1.3 Intervalo de confiança para duas médias
populacionais ................................................................................................................. 118

Exercícios de Auto-Avaliação 121

Soluções 123

Lição No 2 124
3.2 Teoria de decisão estatística, testes de hipóteses e
significância................................................................................................................... 124
3.2.1. Teste de Hipóteses para a Média de Populações
normais com variâncias conhecidas .............................................................................. 125

4. Bibliografia 128

Apêndices 129
Disciplina: Estatística Educacinal ..................................................................... 134

Visão geral
Bem-vindo ao Módulo de Estatística

Caro estudante, para poder seguir o estudo da Estatística espera-se


que você tenha uma preparação adequada em Matemática Básica.
Isso implica um conhecimento básico de expressões numéricas e
equações.

Mesmo supondo preenchidos estes pré – requisitos, é


frequentemente reconhecida a necessidade de se rever um pouco
do material preparatório, no início de uma lição. Teremos que
omitir a maioria dos detalhes, em particular os que envolvem
demonstrações matemáticas.

Objectivos do curso
Quando terminar o estudo do Módulo de Estatística educacional,
você será capaz de:
8 Page
 Aplicar e desenvolver técnicas de recolher, organizar,
apresentar e interpretar Estatísticas Educacionais;
 Aplicar métodos quantitativos na elaboração de um projecto

Objectivos de pesquisa;
 Organizar uma base de dados utilizando pacotes informáticos
Excel ou SPSS;
 Gerir uma base de dados utilizando pacotes informáticos
Excel ou o SPSS no processamento e análise de dados;
 Estimar e analisar Indicadores de eficácia interna do sistema
de educação Moçambicano;
 Elaborar relatórios fazendo um uso apropriado da informação
estatística.

Quem deveria estudar este módulo

Este Módulo destina-se à formação de professores em exercício e


outros interessados que possuem a 12ª Classe ou equivalente e
inscritos no Curso à Distância, fornecido pela Universidade
Pedagógica.

Como está estruturado este módulo

Todos os módulos dos cursos produzidos pela Universidade


Pedagógica encontram-se estruturados da seguinte maneira:
Páginas introdutórias
Um índice completo.
Uma visão geral detalhada do curso / módulo, resumindo os
aspectos-chave que você precisa de conhecer para completar o
estudo. Recomendamos vivamente que leia esta secção com
atenção antes de começar o seu estudo.
Conteúdo do módulo
O curso está estruturado em unidades. Cada unidade e seus
capítulos incluirão uma introdução, objectivos, conteúdos
incluindo actividades de aprendizagem, um sumário da unidade e
uma ou mais actividades para auto-avaliação.
O Módulo de Estatística compreende três unidades,
nomeadamente: (1) Estatística descritiva; (2) Noções de
probabilidade e Distribuições; (3) Estimação por intervalos e Teste
de hipóteses.

Outros recursos
Para quem esteja interessado em aprender mais,
apresentamos uma lista de recursos adicionais para você explore-
os. Estes recursos podem incluir livros, artigos ou sites na internet.

Tarefas de avaliação e/ou Auto - avaliação


Tarefas de avaliação para este módulo encontram-se no
final de cada lição . Sempre que necessário, dão-se folhas
individuais para desenvolver as tarefas, assim como instruções
para as completar. Estes elementos encontram-se no final do
9
Page

modulo.
Comentários e sugestões
Esta é a sua oportunidade para nos dar sugestões e fazer
comentários sobre a estrutura e o conteúdo do módulo. Os seus
comentários serão úteis para nos ajudar a avaliar e melhorar este
modulo.

Ícones de actividade

Ao longo deste manual irá encontrar uma série de ícones nas


margens das folhas. Estes icones servem para identificar diferentes
partes do processo de aprendizagem. Podem indicar uma parcela
específica de texto, uma nova actividade ou tarefa, uma mudança
de actividade, etc.
Acerca dos ícones
Os ícones usados neste manual são símbolos africanos, conhecidos
por
adrinka. Estes símbolos têm origem no povo Ashante de África
Ocidental,
datam do século 17 e ainda se usam hoje em dia.
Os ícones incluídos neste manual são... (ícones a ser enviados -
para efeitos
de testagem deste modelo, reproduziram-se os ícones adrinka, mas
foi-lhes
dada uma sombra amarela para os distinguir dos originais).
Pode ver o conjunto completo de ícones deste manual já a seguir,
cada um
com uma descrição do seu significado e da forma como nós
interpretámos
esse significado para representar as várias actividades ao longo
deste curso /
módulo.

Comprometim Resistência, “Qualidade “Aprender


ento/ perseverança do trabalho” através da
perseverança experiência”
(excelência/
autenticidade)
Auto-
Actividade avaliação Avaliação / Exemplo /
Teste Estudo de
caso

Paz/harmonia Unidade/relaçõ Vigilância / “Eu mudo ou


es humanas preocupação transformo a
Debate minha vida”
Actividade
de grupo Tome Nota! Objectivos
10
Page
“[Ajuda-me] “Pronto a “Nó da Apoio /
deixa-me enfrentar as sabedoria” encorajamento
ajudar-te” vicissitudes
da vida”
Dica
Leitura (fortitude / Terminologia
preparação)
Reflexão

11
Page
Habilidades de estudo

Caro estudante!
Para frequentar com sucesso este módulo terá que buscar através
de uma
leitura cuidadosa das fontes de consulta a maior parte da
informação ligada
ao assunto abordado. Para o efeito, no fim de cada unidade
apresenta-se
uma sugestão de livros para leitura complementar.
Antes de resolver qualquer tarefa ou problema, o estudante deve
certificar se de ter compreendido a questão colocada;
É importante questionar se as informações colhidas na literatura
são
relevantes para a abordagem do assunto ou resolução de
problemas;
Sempre que possível, deve fazer uma sistematização das ideias
apresentadas
no texto.
Desejamos - lhe muitos sucessos!

Precisa de apoio?

Dúvidas e problemas são comuns ao longo de qualquer estudo. Em


caso de
dúvida numa matéria tente consultar os manuais sugeridos no fim
da lição e
disponíveis nos centros de ensino a distância (EAD) mais
próximos. Se tiver dúvidas na resolução de algum exercício,
procure estudar os exemplos semelhantes apresentados no manual.
Se a dúvida persistir, consulte a orientação que aparece no fim dos
exercícios. Se a dúvida persistir, veja a resolução do exercício.
Sempre que julgar pertinente, pode consultar o tutor que está à sua
disposição no centro de EAD mais próximo.
Não se esqueça de consultar também colegas da escola que tenham
compreendido ou feito a cadeira de Estatística, vizinhos e até
estudantes de universidades que vivam na sua zona e tenham ou
estejam a fazer cadeiras relacionadas com Estatística.

Tarefas (avaliação e auto-avaliação)

Ao longo deste módulo irá encontrar várias tarefas que


acompanham o seu
estudo. Tente sempre solucioná-las. Consulte a resolução para
confrontar o
seu método e a solução apresentada. O estudante deve promover o
hábito de
pesquisa e a capacidade de selecção de fontes de informação, tanto
na
internet como em livros. Consulte manuais disponíveis e
referenciados no
fim de cada lição para obter mais informações acerca do conteúdo
que
esteja a estudar. Se usar livros de outros autores ou parte deles na
elaboração de algum trabalho deverá citá-los e indicar estes livros
12

na
Page
bibliografia. Não se esqueça que usar um conteúdo, livro ou parte
do livro
em algum trabalho, sem referenciá-lo é plágio e pode ser
penalizado por
isso. As citações e referências são uma forma de reconhecimento e
respeito
pelo pensamento de outros. Estamos cientes de que o estimado
estudante
não gostaria de ver uma ideia sua ser usada sem que fosse
referenciado, não
é?
Na medida de possível, procurar alargar competências relacionadas
com o
conhecimento científico, as quais exigem um desenvolvimento de
competências, como auto-controle da sua aprendizagem.
As tarefas colocadas nas actividades de avaliação e de auto-
avaliação
deverão ser realizadas num caderno à parte ou em folha de formato

Avaliação

O Módulo de Estatística terá dois testes e um exame final que


deverá ser feito no Centro de Recursos mais próximo, ou em local
a ser indicado pela administração do curso. O calendário das
avaliações será também apresentado oportunamente.
A avaliação visa não só informar-nos sobre o seu desempenho nas
lições,mas também estimular-lhe a rever alguns aspectos e a seguir
em frente.
Durante o estudo deste módulo o estudante será avaliado com base
na realização de actividades e tarefas de auto-avaliação previstas
em cada Unidade.
13
Page
Unidade 1

Estatística descritiva
Introdução
O objectivo fundamental da estatística é o de caracterizar (ou inferir sobre) uma população
conhecendo apenas uma parte dela. Neste caso, a verdadeira arte está no observador que tem de
ser capaz de ver o que está encoberto só com base na quilo que consegue observar. Para tal
reunimos um conjunto de conceitos de estatística e de métodos de análise considerados
fundamentais para analisar dados estatístico.
Nesta Unidade, você deverá fazer: o estudo do Objecto de Estatística, concentrando a atenção
nas Fases do método estatístico; um pouco do Historial e importância da Estatística a diversos
níveis; alguns conceitos e termos usados em Estatística como é o caso da População e amostra.
Ainda nesta Unidade, vai estudar as técnicas de amostragem, tipos de variáveis e distinguir a
Estatística descritiva da Inferencial. Vai poder ainda resumir os dados estatísticos em tabelas e
gráficos e, calcular certos parâmetros estatísticos que lhe permitirão descrever certos fenómenos.
Para poder seguir esta unidade sem maiores dificuldades, espera-se que você tenha uma
preparação adequada em Matemática básica. Isso implica um conhecimento básico de expressões
numéricas e equações.

Ao completar este capitulo, você será capaz de:

 Identificar o objecto de estudo de Estatística


 Dar alguns exemplos de utilização de estatística no seu dia-
Objectivos a-dia
 Identificar população e amostra num estudo estatístico;
 Explicar as razões da utilização da amostra num estudo
estatístico
 Indicar os cuidados a ter na utilização de uma amostra
 Explicar os diferentes tipos de amostragens
 Estabelecer a diferença entre Estatística Descritiva e
Inferencial
 Identificar e classificar variáveis num estudo estatístico;
 Representar dados estatísticos em tabelas e gráficos;
 Calcular certos parâmetros estatístico;
 Analizar e descrever fenómeno estatístico.
14
Page
Nesta lição, você deverá prestar muita atenção aos seguintes termos e
conceitos:
 População; amostra e tamanho de amostra;
Terminologia  Dados estatísticos; unidade estatística;
 Variáveis qualitativas; quantitativas e escalas de medição;
 Estatística descritiva e inferencial.

Lição No 1

1.1 Introdução à Estatistica

1.1.1Objecto da estatística

De uma forma sintética, pode -se dizer que a Estatística é um conjunto de técnicas
apropriadas para recolher, classificar, apresentar e interpretar conjuntos de dados numéricos. E
tem por objectivo a análise e avaliação numérica de observações.
Os computadores e calculadoras são meios excelentes para trabalhar com Estatística.
Assim, a Estatística é mais um método do que uma teoria, pois o seu objectivo
fundamental é descrever fenómenos e não tanto explicá-los. O método estatístico na medida em
que utiliza a linguagem de números, é um método quantitativo.
Num estudo estatístico, normalmente segue-se um conjunto de passos que designamos
por fases do método estatístico para facilitar o estudo estatístico.

Fases do Método estatístico:


a) Definição do problema - a primeira fase consiste na definição e formulação do problema
a ser estudado. O investigador deve ainda analisar outros estudos feitos sobre o mesmo
tema.
b) Planificação - definido o problema, é preciso determinar um processo para o resolver e
15

em especial, como obter informações sobre a variável em estudo. É nesta fase que se
Page
decide pela observação de toda população ou de uma amostra e a calendarização das
actividades a realizar.
c) Recolha de dados - os dados podem ser recolhidos através de:
 Questionário;
 Entrevista;
 Observação;
 Experimentação;
 Pesquisa bibliográfica, etc.

d) Organização ou classificação de dados - consiste em “resumir” os dados através da sua


contagem e agrupamento. Deste modo, obtém-se um conjunto de números que possibilita
distinguir o comportamento do atributo estatístico.
e) Apresentação dos dados - há duas formas de apresentação que não se excluem
mutuamente:
 Apresentação por tabelas;
 Apresentação por gráficos.
Estas formas de apresentar dados, permitem sintetizar grandes quantidades de dados,
tornando mais fácil a compreensão do carácter em estudo e permitindo uma futura
análise.
f) Análise e interpretação dos dados - é a mais importante e delicada do estudo estatístico,
pois é nesta fase que se tiram conclusões que ajudam o investigador a resolver o
problema. Nesta fase, ainda é possível, por vezes, “arriscar” alguma generalização, a qual
envolverá sempre algum grau de incerteza.

Ao estudo estatístico interessam os fenómenos não deterministas cujos resultados


envolvem alguma incerteza (inflação, resultados de uma eleição, …).
Os fenómenos deterministas ou causais (queda de um móvel, a resistência a rotura de um
material, …), para os quais existe uma lei matemática que os define, não serão naturalmente
estudados em Estatística.
16
Page
1.1.2 Um pouco de História

A origem de Estatística remota a tempos muito antigos da nossa história e começou por tratar de
assuntos de Estado. A palavra Estatística tem origem na palavra em latim status, traduzida
como o estudo do Estado e significava, originalmente, uma colecção de informação de interesse
para o estado sobre população e economia. Essas informações eram colectadas objectivando o
resumo de informações indispensáveis para os governantes conhecerem suas nações e para a
construção de programas de governo
Há indícios de que por volta do ano 3000 a.c. já se faziam censos na Babilónia, na China e no
Egipto com o propósito de cobrar impostos e para fins militares.
O livro quarto do Antigo Testamento refere que Moisés foi instruído pelo profeta a fazer um
levantamento dos homens de Israel que estivessem aptos a guerrear.
Na época do Imperador César Augusto foi ordenada a realização de um censo em todo o
Império romano no primeiro ano da nossa era (na região entre Douro e Guadiana).
Apesar da sua origem remota, é apenas no séc. XVII que a Estatística começa a ser
considerada uma disciplina autónoma. Para esta autonomia, muito contribuiu a acção do alemão
Herman Conring(1606-1681) ao introduzir o seu estudo na universidade de Helmstadt, no que foi
continuado por Godofred Achenwall (1719-1772) e por Schlozer(1735-1809).
No Séc. XVII, surge também a escola inglesa. John Graunt(1620-1674) e William Petty
(1623-1687) dois dos seus mais destacados representantes, preocuparam-se com o estudo
numérico dos fenómenos sociais e políticos numa primeira tentativa de determinarem leis
quantitativas capazes de exemplificarem tais fenómenos. A Graunt se deve a primeira
investigação estatística sobre a mortalidade, como consta de uma memória que apresentou á Real
Sociedade de Londres, em 1661.
Nesse estudo, Graunt concluiu que nasciam mais crianças do sexo masculino do que do
sexo feminino, que as mulheres tendiam a viver mais tempo do que os homens e que o número
de mortes (excepto durante as epidemias) se mantinha sensivelmente constante de ano para ano.
Na Alemanha, o Pastor Sussmilch (1707-1767) conduziu um estudo sobre Demografia,
que colocou como o precursor da Estatística enquanto meio indutivo de investigação.
O passo decisivo para a fundamentação teórica da inferência estatística encontra se associado ao
17

desenvolvimento do cálculo das probabilidades.


Page
1.1.3 Importância da Estatística

Nos nossos dias, a Estatística assume uma importância decisiva a diversos níveis.
A importância da Estatística pode ser vista através da sua utilização ao nível do Estado, de
Organizações Sociais e profissionais, do Cidadão comum e ao nível científico.
Ao nível do Estado, hoje em dia quase todos as decisões importantes que se tomam são
acompanhadas de estudos estatísticos e o mesmo se pode dizer relativamente á justificação da
adequação ou não das políticas seguidas por diferentes governos.
O grau de importância atribuído a Estatística, neste caso, é tão grande que praticamente todos
os países possuem organismos oficiais destinados a realização de estudos estatísticos - Instituto
Nacional de Estatística (INE).
No que respeita as organizações sociais e Profissionais, tem se vindo a assistir a um aumento
do uso da Estatística. Relativamente as Organizações Sociais, empresas, sindicatos, organizações
de assistência social, etc. Todas elas conduzem a sua acção recorrendo mais ou menos a
Estatística. Por exemplo, uma empresa quando lança um novo produto indaga pessoas acerca
desse produto com o fim de determinar índices de potenciais compradores.
No que concerne aos grupos profissionais, são também cada vez maiores as exigências na
utilização de Estatística. Muitas vezes tal utilização acompanha diversas fases do seu trabalho,
que vão desde a planificação passando pela execução e terminando na análise dos resultados.
Destaca-se, ao nível das organizações, o aparecimento recente e o grande incremento de
empresas e profissões ligadas a publicidade e técnicas de marketing, nas quais a Estatística
desempenha um papel central.
Ao nível do Cidadão comum, a importância da Estatística resulta imediatamente das
implicações das decisões tomadas, quer pelo Estado quer pelas diferentes organizações sociais e
profissionais. É sabido que as decisões políticas tomadas pelo Governo, as estratégias de
desenvolvimento e de gestão das empresas e as posições dos sindicatos, p.ex., afectam a
generalidade do cidadão comum.
A necessidade de formação estatística para todos no sentido de promover uma
participação esclarecida e crítica justifica-se, pois, voluntariamente ou involuntariamente, por
vezes, os resultados estatísticos favorecem certos grupos sociais em prejuízo de outros. A este
18

respeito recorde-se que com base no mesmo estudo, os membros do Governo e os dirigentes
Page

sindicais podem sustentar opiniões díspares acerca do desemprego. E não se pense que tais
disparidades resultam sempre de um uso distorcido da Estatística, pois essas discrepâncias
podem resultar de consideração de certos aspectos em detrimento de outros de acordo com o
interesse dos interlocutores.
O Cidadão comum é bombardeado também com informação relacionada com a cultura e
com o desporto, cuja a compreensão exige, igualmente, conhecimento de estatística. No caso de
futebol é frequente a televisão apresentar uma síntese relativa a certos aspectos do jogo durante o
intervalo e no fim do jogo.
A Estatística é também responsável pelo desenvolvimento científico em geral. Para além
da sua aplicabilidade nas Ciências Naturais, na Medicina, na Agronomia e na Economia, a
Estatística constitui um suporte de cientificidade para as ciências humanas e sociais. É assim que
ciências como a Sociologia, a Psicologia, a História e a Pedagogia têm beneficiado de
consideráveis desenvolvimentos e de aumento de credibilidade pública com a utilização de meios
estatísticos.

Exercícios
1. Descreve o objecto de estudo de estatística;
2. Dê pelo menos dois exemplos de utilização de estatística no seu dia-a-dia;
3. Que procedimentos devem ser observados num estudo estatístico?

19
Page
Lição No 2

1.1.4 Termos e conceitos básicos de estatística

População e Amostra
Num censo ou recenseamento são observados todos elementos da população
relativamente aos diferentes atributos que estão a ser objecto de estudo estatístico.
Ex. Para conhecermos os gostos dos alunos de uma escola acerca dos sabores de yougurtes
através de um censo, teríamos de interrogar todos alunos da escola.
Como exemplos de censos que se efectuam na generalidade dos países, temos: o
recenseamento militar, o recenseamento eleitoral e o recenseamento geral da população.
Estes recenseamentos têm por finalidade última facultar um melhor conhecimento das
pessoas e das suas condições de vida, de forma a permitir as entidades governamentais tomar
medidas adequadas para o desenvolvimento do país.
Quando por várias razoes, a realização de um censo surge como uma impossibilidade,
então a sondagem assume-se como uma alternativa.
Numa sondagem, o estudo estatístico baseia-se numa parte da população, isto é, numa
amostra que deve ser representativa dessa população.
Ex. Recorrendo a empresas especializadas, os partidos políticos encomendam sondagens para
estimar o número de votantes e/ou para avaliar o impacto público das suas posições; as empresas
promovem sondagens para prever o número de potenciais compradores dos seus produtos e os
investigadores efectuam sondagens para avaliar o impacto social das suas descobertas, etc.
Quando se faz uma sondagem acerca da audiência de um programa televisivo, não se
pergunta a toda população se gosta ou não do programa, mas sim interroga-se uma parte da
população, ou seja, uma amostra.
Quando se analisa a qualidade dos fósforos produzidos por uma fábrica, não se
experimenta todos os fósforos (população), mas sim uma parte dos fósforos (amostra).
População ou Universo Estatístico é uma colecção de seres com qualquer característica
comum.
Amostra é um subconjunto finito da população.
20

A cada elemento da população chama-se Unidade Estatística ou individuo.


Page

A população pode ser finita ou infinita.


Ex. População finita – o número de funcionários de uma empresa.
População infinita – os pontos de uma recta, os resultados obtidos (coroa ou cara) em
sucessivos lançamentos de uma moeda.
A maior parte de pesquisas científicas recorre a estudos de uma amostra.

1.1.5 Razões para a utilização de uma amostra


A utilização de uma amostra e não da população num estudo estatístico embora nos
conduza a conclusões seguras, deve-se pelo menos, a uma das seguintes razoes:
 A população ser infinita;
 Economia de dinheiro;
 Economia de tempo;
 Comodidade;
 Inutilização dos elementos observados. (a dona Amélia partiu todos os ovos para
verificar a sua qualidade, o que acontece aos ovos.)
O sucesso de um estudo estatístico baseado no estudo de uma amostra depende da escolha
desta. Uma amostra mal escolhida conduz a conclusões erradas.

1.1.6 Cuidados a ter na formação de uma Amostra


Dum modo geral, devemos ter os seguintes cuidados na formação da amostra:
Imparcialidade - todos os elementos devem ter a mesma oportunidade de fazer parte da amostra;
Representatividade – deve conter em proporção tudo o que a população possui, qualitativa e
quantitativamente;
Tamanho – deve ser suficientemente larga de modo que as características da amostra se
aproximem, tanto quanto possível, das características da população.
21
Page
Exercícios para auto avaliação

1. Relativamente a uma recolha estatística diga o que entende por:


a) População
b) Unidade estatística
c)Amostra
2. Fez-se um inquérito dirigido a todos operários de uma fábrica. Dos diferentes sectores
seleccionaram-se 50 operários.
Neste estudo: a) qual é a população b) qual é a amostra?
3. Dê dois exemplos de estudos estatísticos onde seja necessário utilizar uma amostra.
4. Dê um exemplo de amostra mal escolhida. E justifica
5. Porque em maior parte de pesquisas científicas usa se a amostra e não a população?
6. Leia a seguinte notícia:
«É surpreendente. Apenas 5% do tempo de trabalho diário de um vendedor é passado
a…. Vender ou negociar». Esta a conclusão que chegou Robert Kinnaird de uma
consultora de Glasgow, na sequência de um inquérito junto de 1000 vendedores de quatro
países europeus.
Fortuna, Maio 95
Neste estudo referido na notícia usou-se um censo ou uma sondagem? Justifique.

7.Indique a população e a unidade estatística em que o carácter em estudo era:


a) O curso preferido pelos estudantes da turma;
b) A nacionalidade dos Políticos que visitaram Moçambique em 1986;
c) O tempo gasto pelos 5 melhores ciclistas Moçambicanos na volta a Moçambicano em
2007.
22
Page
Soluções

2.a) Operários de uma fábrica; b) 50 Operários seleccionados

3.Exemplos: i.) Análise de sangue de um ser humano ii) Estudo do tipo do solo.

4. Exemplo: Selecção de rendimento de 5 melhores alunos de uma turma de 60 para avaliar o

aproveitamento da mesma. Justificação: Não se observa a representatividade; isto é, não estão

contempladas outras categorias de alunos(fracos e médios) além disso trata se de uma amostra

não significativa. E os resultados a obter se são incorrectos.

5. Razões: A população ser infinita; Economia de dinheiro; Economia de tempo; Comodidade;

Evitar inutilizar os elementos observados; etc.

6. Sondagem. Pesquisa feita somente a 1000 vendedores amostra de 4 países.

7. a) Estudantes da turma; cada estudante representa a unidade estatística;

b) Políticos que visitaram Moçambique em 1986; cada politico que visitou Moçambique em

1986;

c) Ciclistas Moçambicanos; cada ciclista.

23
Page
Lição No 3

1.1.7 Amostragem

Existem técnicas científicas para a selecção correcta de amostra.


A amostragem é o processo pelo qual recolhemos dados. Isto dá-nos apenas uma imagem da
população em estudo. No entanto, independentemente da correcção dos processos usados, para
recolher a amostra, há sempre a considerar o chamado erro de amostragem. Devemos sempre
esperar algumas diferenças entre a amostra e a população. Por outro lado, por exemplo, o erro
pode residir não só na amostragem, mas também nos próprios dados. Erros não amostrais
acontecem quando os valores recolhidos não pertencem aos valores possíveis da entidade
(exemplo: registado o valor 32 para uma nota, quando deveria ter sido 23) ou quando apenas
uma pequena proporção da população é recolhida.

1.1.8 Tipos de amostragem


De uma maneira geral, os tipos de amostragem podem ser: aleatórias e não aleatória.
O método de amostragem não aleatório consiste em seleccionarmos entidades através de escolha
pessoal.
As amostras não aleatórias incluem:
1) As de opinião quando as entidades são escolhidas porque compõem uma amostra
representativa (os habitantes de duas freguesias podem ser usados como representativos
dos eleitores de uma zona mais ampla do país, por exemplo);
2) As de conveniência quando escolhemos as entidades apenas estas estarem mais próximas
de nós (escolhemos os alunos de uma turma quando pretendemos obter a opinião de todos
os alunos de uma escola);
3) As de quota quando os elementos que compõem a amostra são de determinadas
características (se soubermos que os consumidores de um determinado produto são 60% do
sexo feminino, podemos dizer a um inquiridor que esteja à porta de um supermercado para
entrevistar 60 pessoas do sexo feminino e 40 do sexo masculino, cabendo-lhe a decisão de
escolher quem entrevista).
24

Porque dependem de escolha pessoal, as amostras não aleatórias podem efectivamente não ser
Page

representativas de uma população, sendo difícil o cálculo do erro amostral. Para ultrapassarmos
este problema, as amostras aleatórias deixam a escolha ao acaso, tendo em princípio cada
elemento da população a mesma probabilidade de ser escolhido.

Há quatro tipos de amostragens aleatórias.


A primeira delas é a chamada amostra aleatória simples de tamanho n onde não só cada
elemento da população tem as mesmas hipóteses de ser escolhido, como também qualquer
conjunto de tamanho n pode ser escolhido.
Ex. Pretende-se uma amostra de 20 alunos de uma escola, atribui-se um número a cada um dos
alunos da escola e, seguidamente, escolhe-se ao acaso 20 desses números.

O segundo tipo de amostragem é a amostragem estratificada. Neste tipo de amostragem, as


entidades são agrupadas em estratos segundo características físicas ou materiais. Para assegurar
que todos os estratos da população estudantil afectados por determinado diploma sejam
considerados, escolhem-se, por exemplo, uma amostra aleatória de estudantes de cada um dos
tipos de ensino: básico, secundário e superior. Uma única amostra aleatória simples não poderia
garantir esta representação de estudantes dos três tipos de ensino.
Ex. Na selecção de 30 alunos de uma escola, considerando cada ano de escolaridade como
estrato, escolher-se-ia em cada um desses anos um determinado número de alunos por um dos
processos anteriores. O número de alunos a escolher em cada ano, seja, em cada estrato deve ser
proporcional ao número dos alunos desse ano.
Se a escola, com 600 alunos, 150 são da 10ªclasse, 100 são da 11ª classe e 50 são da 12ªclasse
poder-se-ia para amostra
 15 Alunos da 10ªclasse
 10 Alunos da 11ªclasse
 5 Alunos da 12ª classe
O que significa que em cada estrato tem se 10% de alunos
Um terceiro tipo de amostragem é a chamada amostragem por cachos. Aqui, as entidades são
classificadas em grupos ou cachos e é seleccionada uma amostra aleatória de cachos. Um censo
(de toda a população) é então conduzido dentro dos cachos seleccionados.
Por fim, a amostra sistemática, os elementos da amostra, são escolhidos a partir de uma regra
25

estabelecida.
Page
Ex. Para seleccionar uma amostra de 30 alunos de uma escola com 600 alunos, depois de
numerados todos, pode-se escolher um aluno de 20 em 20 a partir do primeiro aluno
seleccionado e escolhido ao acaso de entre o primeiro grupo de 20 alunos. Supondo que o
número 3 foi seleccionado, tem-se para a amostra: 3, 23, 43, 63, ……, 563, 583.

1.1.9 Estatística descritiva e Estatística Indutiva


Estatística descritiva ou dedutiva tem por finalidade descrever certas propriedades
relativas a um conjunto de dados. Ela trata da recolha, ordenação, classificação e análise de um
conjunto de dados obtidos em observações,
Depois de efectuadas observações ficamos na posse de um conjunto caótico de dados, o
que dificulta a obtenção de conclusões. É perante esta «desordem» dos dados que a Estatística
descritiva revela a importância e interesse das suas técnicas, ao permitir classificar esses dados e
deles fornecendo características sumárias.
Constroem-se tabelas e gráficos que simplificam a complexidade de dados e calculam-se
parâmetros estatísticos que ajudam a compreender e descrever a situação em estudo.
Os métodos descritivos enquanto meios que permitem ordenar a «desordem» e sintetizar
a diversidade das informações contidas nos dados, podem explicar-se quer a população quer a
amostra.
Estatística Indutiva ou Inferencial – procura inferir propriedades do universo estatístico
a partir de propriedades verificadas na amostra. Ela generaliza para uma população,
estabelecendo previsões a partir dos resultados na Estatística Descritiva e apoia-se no cálculo das
probabilidades que permite quantificar o erro, compreendendo que a inferência é tanto mais
provável quanto menor for o erro que acompanha.
Pode utilizar-se a Estatística indutiva só no estudo da amostra.

ExercíciosExercícios de Auto-Avaliação
1. Supondo que ia fazer um estudo sobre cada um dos temas indicados, diga, justificando,
em quais deles utilizaria uma amostra:
26

a) Controlo de qualidade da educação oferecida pelas escolas privadas moçambicanas;


Page

b) Aproveitamento dos alunos da turma 10ª A de uma Escola;


c) Análise do mercado para lançamento de uma nova pasta de dentes;
d) Estado sanitário dos ovos existentes num armazém;
e) Tipo de borboletas existentes num País.

2.Explique a diferença entre Estatística descritiva e estatística inferencial.

3. Considerar a sequência do seguinte estudo:


a) Define-se uma amostra dos elementos de população;
b) Descrevem-se as variáveis para o estudo;
c) Toma-se nota, para cada variável, do valor correspondente a cada elemento da amostra;
d) Utilizam-se diversos métodos científicos e analisam-se os dados, obtendo-se diversas
estatísticas;
e) Com os dados obtidos na amostra prevê-se o comportamento da população com ajuda do
cálculo das probabilidades.
Qual dos passos referidos está dentro da Inferência Estatística?

4.Um promotor de vendas quer saber a opinião de mulheres empregadas sobre uma nova
política do governo que prevê escolaridade obrigatória até 7ª classe. Ela tem uma lista de
todas as mulheres que pagam quotas a um dos sindicatos. Ela envia um questionário a 100
destas mulheres escolhidas aleatoriamente. Destas, 68 preenchem e devolvem o questionário.
a) Qual é, neste caso, a população e amostra?
b) Acha que a amostra é representativa? Justifique.

5.Uma empresa está interessada em testar a eficácia da propaganda de um novo comercial de


televisão. Como parte do teste, o comercial é mostrado em um programa de notícias locais, as
18h30min. Dois dias mais tarde, uma firma de pesquisa de mercados realizou um
levantamento telefónico para obter informações sobre os índices de respostas (percentagem
de espectadores que responderam vendo o comercial) e impressões sobre o comercial.
a) Qual é a população desse estudo
b) Qual é a amostra para esse estudo
27

c) Porque se usaria uma amostra nessa situação?


Page
Soluções

1. a) , c), d) e e).

3.e)

4. a) Mulheres empregadas. Amostra 100 mulheres empregadas.

b) A amostra não é representativa pois, não envolveu mulheres de todos sindicatos.

5. a) População: novo comercial. b) Amostra: o comercial mostrado em um programa de

notícias locais; c) Comodidade

28
Page
Lição No 4

1.1.10 Caracteres ou variáveis estatísticas

Se a população de um estudo estatístico fosse constituída pelos alunos de uma escola,


cada aluno seria uma unidade estatística.
Cada aluno tem muitas Características ou caracteres: a cor dos olhos, a altura, o número
de irmãos, a profissão dos pais, sexo, a distância de casa a escola, a última nota de história, etc.
Os caracteres podem ser qualitativos (nominais e ordinais) ou quantitativos (discretos e
contínuos).

Caracteres qualitativos são aqueles que não se podem medir. Estão relacionados com
uma qualidade e apresentam-se em modalidades.

Caracteres qualitativos Modalidades


A cor dos olhos Azul, verde, castanho, …
O curso preferido Jornalismo, direito, …
A profissão dos pais Professor, médico, pedreiro, ….

Caracteres quantitativos – são aqueles que se podem medir. A apresentam-se com


diferentes intensidades ou valores.

Caracteres quantitativos Valores


O peso de um limão 10g, 15g, 50g, ….
Altura de uma pessoa 136cm, 179cm, …
O custo da renda de casa 2.500Mt, 7.000Mt, …

Ao resultado da observação de um carácter qualitativo ou quantitativo chama-se dado estatístico.


Ex. O Alfredo tem olhos castanhos; o Alfredo mede 1,86cm de altura.
Os estudos estatísticos incidem essencialmente em variáveis quantitativas.
As variáveis estatísticas quantitativas subdividem-se em duas categorias: Discretas e
29

contínuas.
Page
i. Variáveis Discretas – são as que só podem tomar um número finito ou uma
infinidade numerável de valores.
Ex. Número de irmãos de um aluno da turma, mesmo antes de fazermos a observação,
sabe que vamos encontrar dados que em termos geométricos, correspondem a pontos
isolados.
___. ________. ________. ________. _.....
0 1 2 3
ii. Variáveis Contínuas – são as que podem tomar qualquer valor de um intervalo.

__._____________. ___
1,70 1,90
Ex. Peso dos recém nascidos durante um mês, numa maternidade, mesmo antes de
fazermos uma observação, sabemos que, teoricamente, podemos encontrar uns dados
estatísticos que, em termos geométricos, seriam representados na recta real por qualquer
ponto de um intervalo.

Sumário

População ou Universo Estatístico é uma colecção de seres com qualquer característica


comum.
Amostra é um subconjunto finito da população.
A cada elemento da população chama-se Unidade Estatística ou individuo.
A população pode ser finita ou infinita.
Razões para a utilização de uma amostra
A utilização de uma amostra e não da população num estudo estatístico embora nos
conduza a conclusões seguras, deve-se pelo menos, a uma das seguintes razoes: a população ser
infinita; economia de dinheiro; economia de tempo; comodidade; inutilização dos elementos
observados.
Na selecção da amostra deve se observar os seguintes cuidados: imparcialidade,
representatividade e tamanho.
De uma maneira geral, os tipos de amostragem podem ser: aleatórias e não aleatória.
30

A estatística esta subdividida em duas partes: a descritiva e a inferencial.


Page

O diagrama abaixo indica os tipos de variáveis.


Comentado [u1]:
variáveis

Quantitativas
Qualitativas ou
Categóricas

Nominais Ordinais Contínuas Discretas

Ex. Sexo ex. nível de instrução ex. alturas ex. n° de filhos

Exercícios de auto avaliação

1.Considere o seguinte texto:


Num congresso sobre «direitos da criança» apresentaram comunicações 5 Pediatras, 3
Psicólogos, 4 Educadores, 2 Assistentes Sociais e 2 Sociólogos.
Da análise do Texto, infere-se que foi feito um estudo estatístico. Para esse estudo indique:
a) A população
b) Unidade estatística
c) O carácter estatístico. Classifique-o.

2.Tende-se fazer um estudo sobre o número de filhos dos professores de Matemática de uma
cidade. Para isso, efectuou-se um inquérito ao qual responderam 30 professores de
31

Matemática, os resultados obtidos foram:


Page
____________________________________
5 4 3 0 0 2 2 2 1 1 1 0 3 0 2
2 0 3 4 6 1 1 0 2 3 1 2 0 0 1
____________________________________
Indique:
a) A população em estudo
b) A amostra escolhida
c) A unidade estatística
d) A variável em estudo e classifique-a.

3.Mediram se os comprimentos de cinco mesas rectangulares e obtiveram se os seguintes


dados: 1,3cm; 1,2cm; 1,25cm; 1,02cm; 1,4cm.
Neste conjunto de observações, indique:
a) População;
b) A unidade estatística;
c) A variável estatística e classifique-a;
d) O que representam em linguagem estatística, os números dados?

4.Um levantamento arguiu 2010 adultos. «Você está satisfeito com a situação da educação
das nossas crianças nas escolas hoje?» As categorias das respostas eram insatisfeitas,
satisfeitas e indeciso.
a)Qual foi tamanho da amostra para esta pesquisa?
b) Os dados colectados eram quantitativos ou qualitativos?
c) Para um resumo dos dados para esta questão, faria mais sentido usar as médias ou
percentagens?
d) Dos que responderam, 60% disseram que estavam insatisfeitos com a situação da
educação. Quantos indivíduos forneceram esta resposta?

5. Uma agência classifica a ocupação dos trabalhadores como profissional liberal,


funcionário e operário. A variável é a ocupação do trabalhador. Esta é uma variável
32

qualitativa ou quantitativa?
Page
6. Declare se cada uma das variáveis é quantitativa (discreta, contínua) ou qualitativa
(nominal, ordinal).
a) Idade
b)Género
c) Classe social
d) Marca de automóvel
e) Número de pessoas favoráveis a pena de morte
f) Vendas anuais
g) Ganhos por acção
h) Método de pagamento (a vista, com cheque, com cartão de crédito).

7. Uma funcionária tem um salário de 140 mil meticais mas é informada de que terá uma
redução de 10% no pagamento em virtude do declínio dos lucros da companhia. É informada
também de que no ano seguinte terá um aumento de 10%. A situação não se afigura tão má
porque a redução de 10% parece ser compensada pelo aumento de 10%.
a) Determine a renda anual após o corte de 10%.
b)Com base no resultado obtido em a), determine a renda anual após o aumento de 10%.
c) O corte de 10% seguido do aumento de 10% restitui a funcionária o salário original de
140mil meticais?

8. Num teste de Matemática as classificações positivas e negativas distribuem-se pelos


rapazes e raparigas de acordo com os valores da seguinte tabela:
Rapazes Raparigas Total
Positivas 15 21 36
Negativas 5 4 9
Total 20 25 45

Determine a percentagem de:


a. Raparigas
b. Raparigas com classificação positiva;
33

c. Rapazes com classificação positiva, no conjunto dos rapazes.


Page
9.Um inquérito realizado para um supermercado classificou seus clientes segundo a frequência
com que o visitam e segundo a frequência com que compram produtos de limpeza.
Frequência de Frequência de compra de produtos de limpeza
visita Sempre Algumas vezes Nunca
Frequente 12 48 19
Não frequente 7 6 8

a) Quantos indivíduos visitam frequentemente o super mercado?


b) Quantos indivíduos visitam frequentemente o super mercado e compram produtos de
limpeza?
c) Qual é a percentagem de indivíduos que não visitam o supermercado frequentemente e
compram produtos de limpeza?

34
Page
Soluções

1. a) crianças; b) cada criança; c) direito das crianças. Variável qualitativa nominal;


2. a) professores de Matemática; b) 30 professores inquiridos; c) cada professor; d) número
de filhos de professores de Matemática. Variável quantitativa discreta.
3. a) Mesas rectangulares; b) Cada mesa; c) Comprimento de cada mesa. Variável
quantitativa contínua; d) Dados estatísticos.
4. a) 2010 adultos; b) qualitativos; c) Percentagens; d) 1206 adultos.
5. Qualitativa;
6. A) Quantitativa contínua; b) qualitativa nominal; c) qualitativa ordinal; d) qualitativa
nominal; e) quantitativa discreta; f) quantitativa discreta; g) quantitativa contínua; h)
qualitativa nominal.
7. a)1512000 b) 1663200 c)Não.
8. a) 55.6% b) 46.7% c)75%.
9. a) 79 b) 60 c) 13%

35
Page
1.2 Distribuição de Frequências e Gráficos

Introdução

Neste capítulo, você vai tratar das fases do método estatístico é neste capitulo onde você vai
começar a actividade de recolha, organização, apresentação (uso de tabelas e gráficos), análise e
interpretação do fenómeno estatístico observado, é, aqui onde vai construir um banco de dados
processando-os usando pacotes estatísticos Excel ou Spss.
Este capitulo tem 4 lições, estando previsto para cada uma delas um tempo de estudo de 2,5
horas. Este número de horas é um indicativo para lhe ajudar a gerir melhor o seu tempo; é
considerado suficiente para você conseguir atingir os objectivos definidos no início de cada
lição.

 Recolher dados num estudo estatístico;


Objectivos  Organizar dados estatísticos;
 Apresentar dados estatísticos numa tabela e num gráfico de
distribuição de frequências usando o pacote estatístico
Excel ou Spss;
 Analisar e interpretar os dados descrevendo-os e tirar
conclusões;
 Elaborar um relatório preliminar sobre o fenómeno
estatístico observado.

Ao completar esta unidade, você será capaz de:

Nesta lição, você deverá prestar muita atenção aos seguintes termos e
conceitos:
 Tabela de distribuição de frequências
Terminologia  Gráficos de barra, histograma, polígono de frequências,
sectograma;
 Frequências: absolutas, relativas, absoluta acumulada e
relativa acumulada
36
Page
Licao No 5

1.2.1 Tabela de Frequências

Vamos dar em seguida, particular atenção `a organização e apresentação dos dados,


nomeadamente `a elaboração de tabelas e gráficos
Para organizar e representar dados, usam-se tabelas e gráficos.

Tabela de Frequências para dados simples(não agrupados em classes)


Suponhamos que numa turma da 10ª classe pretendíamos fazer um estudo estatístico sobre as
idades(em anos) dos alunos. E neste caso registamos: 16, 13, 15, 16, 14, 13, 14, 15, 15, 14, 15,
17, 14, 15, 15, 15, 14, 16, 15, 14, 14, 15, 17.
A variável estatística idade (em anos), é discreta e toma os valores 13, 14, 15, 16 e 17.
Tabela 1: Distribuição das idades da turma
Idade contagem Frequência
(em anos) fi
Xi
13 // 2
14 //// // 7
15 //// //// 9
16 /// 3
17 // 2
Total - 23

A tabela acima representa a frequência absoluta ou efectivo (fi) de um valor X da variável, pois
indica o número de vezes que esse valor foi observado.
Sabemos da tabela que 7 alunos da turma têm 14 anos, 3 alunos têm 16 anos, etc.
A partir da frequência absoluta (fi), podemos calcular outras frequências:
Frequência relativa (fri) de um valor X da variável, é o quociente entre a frequência absoluta do
valor X da variável e o número total de observações.
37
Page
fi fi
fri  k

 fi
n fi
fri  *100%
i 1 ou em percentagem n (i=1,2,3,…..,k)
k
n   fi  f 1  f 2  ...  fk
i 1

Frequência absoluta acumulada (faci) ou (Fi) do valor X, é a soma das frequências absolutas de
todos valores anteriores a X com frequência absoluta de X.
Frequência relativa acumulada (facri) ou (Fri ) do valor X, é a soma das frequências relativas de
todos valores anteriores a X com frequência relativa de X.
Tabela2: Distribuição das frequências das idades da turma
Idade Freq.Absoluta Freq.relativa Freq.Absol. Freq.Relat.Acumu
(em fi fi acumulada. l.
f ri   100%
anos) n Fi Fri
Xi
13 2 2/23=0.09 ou 9% 2 0.09 ou 9%
14 7 7/23=0.30 ou 30% 9 0.39 ou 39%
15 9 9/23=0.39 ou 39% 18 0.78 ou 78%
16 3 3/23=0.13 ou 13% 21 0.91 ou 91%
17 2 2/23=0.09 ou 9% 23 1 ou 100%
n=23

Nesta tabela, encontram-se respostas para as seguintes questões:


1. qual é o número de alunos com idade inferior ou igual a 14 anos?
Resp.- há 9 alunos com 14 anos ou menos;
2. qual é a percentagem de alunos com 15 anos?
Resp - há 39% de alunos com 15 anos;
3. quantos alunos tem 17 anos?
Resp - há 2 alunos com 17 anos;
4. qual é a percentagem de alunos com idade inferior a 16 anos?
Resp -78% dos alunos têm menos de 16 anos;
38

5. qual é a percentagem de alunos com mais de 15 anos?


Page

Resp - 22% (13%+9%) dos alunos da turma têm mais de 15 anos;


6. qual é o número total dos alunos da turma?
Resp - o número total dos alunos da turma é 23.

Tabela de Frequências para dados agrupados ou tabulados em classes


Se no lugar de estudarmos a variável idade dos alunos, fossemos estudar a variável altura
dos alunos e tivéssemos:
1,62 1,71 1,50 1,62 1,69 1,59 1,48 1,52 1,64 1,57 1,49 1,66
1,73 1,53 1,61 1,63 1,56 1,55 1,57 1,64 1,60 1,51 1,68
___________________________________________________________________
Trata-se agora de uma variável contínua. E o estudo das variáveis contínuas assenta-se na
organização dos dados em classes.

Também pode-se usar o agrupamento de dados em classes de variáveis discretas se tivermos


tantos valores diferentes para variável X.
Não existe nenhuma fórmula universalmente aceite para determinar o número de classes a
considerar. A tabela de Truman L. Kelley que estabelece o número de classes (k) em função do
número total de observações (n) pode constituir uma ajuda.
n 5 10 25 50 100 200 500 1000
k 2 4 6 8 10 12 15 15

No caso das alturas podemos considerar 6 classes, pois n=23.


Todas as classes devem ter a mesma amplitude e para isso calcula-se:
1º Amplitude total =limite superior(Ls)-limite inferior(Li)=1,73-1,48=0,25.
Ls  Li 0,25
2º Amplitude de classe    0,042
k 6
Pode, então, considerar – se 0,05 como amplitude de cada classe e 1,45 como limite inferior da
primeira classe .
Obs: Se considerássemos a amplitude de 0,04 e 1,48 (menor valor observado) como limite
inferior da primeira classe verificava-se que o valor 1,73 não se incluía em qualquer classe
Deste modo, a definição da amplitude das classes e do limite inferior da primeira classes devem
ser estabelecidos por forma que cada valor da variável estatística pertença exactamente a uma
classe.
39

Uma outra maneira de determinar o número de classes é a regra sugerida por Sturgos.
Page

K=1+3,3logn e ainda, k  n , sendo n, o número de observações.


Tabela 3: Distribuição das alturas dos alunos
Alturas(em m) contagem fi
[1,45; 1,50[ // 2
[1,50; 1,55[ //// 4
[1,55; 1,60[ //// 5
[1,60; 1,65[ //// // 7
[1,65; 1,70[ /// 3
[1,70; 1,75[ // 2
Total ---- n= 23

Tabela 4: Distribuição de frequências das alturas dos alunos


Alturas(em Freq.Absoluta Freq.relativa Freq.Absol.acum. Freq.Relat.Acumul.
m) fi f ri Fi Fri

[1,45; 1,50[ 2 2/23=0.09 ou 23 1 ou 100%


9%
[1,50; 1,55[ 4 4/23=0.17 ou 21 0.91 ou 91%
17%
[1,55; 1,60[ 5 5/23=0.22 ou 17 0.74 ou 74%
22%
[1,60; 1,65[ 7 7/23=0.30 ou 12 0.52 ou 52%
30%
[1,65; 1,70[ 3 3/23=0.13 ou 5 0.22 ou 22%
13%
[1,70; 1,75[ 2 2/23=0.09 ou 2 0.09 ou 9%
9%
n= 23

Nesta tabela encontram-se as respostas para as seguintes questões:


1 qual é o número de alunos com alturas maiores ou iguais a 1,65m?
Resp.- há 5 alunos com altura de 1,65m ou mais.
40

2. qual é a percentagem dos alunos maiores ou iguais a 1,55m?


Page

Resp.- - 74% dos alunos têm alturas iguais a 1,55 ou mais;


3. quantos alunos têm alturas iguais a 1,50m ou compreendidas entre 1,50m e 1,55m?
Resp.- -há 4 alunos com alturas iguais a 1,50m ou compreendidas entre 1,50m e 1,55m;
4. qual é a percentagem do alunos que têm uma altura de 1,60m ou compreendida entre 1,60m
e 1,65m?
Resp.- - 30% dos alunos têm altura de 1,60m ou compreendida entre 1,60m e 1,65m.

Licao No 6

1.2.2 Gráficos de Distribuição de Frequências

Os gráficos constituem uma outra forma de representar dados. Comparativamente as tabelas, os


gráficos são mais atractivos e facilitam a apreensão da mensagem.
Existe uma grande variedade de gráficos estatísticos com o fim de responder `as mais
variadas situações. Neste estudo referir-se-ão: gráficos de barras, histograma, polígono de
frequências
e gráfico circular.
Gráficos de Barras
Os gráficos de barras utilizam-se essencialmente para dados simples (não agrupados).
Estes gráficos são empregues muita das vezes para estabelecer comparações.
No caso de variável discreta é usual desenhar gráficos: de barras, circular ou pictograma.
A partir dos dados da tabela de frequências das idades dos alunos da 10ª classe, vamos construir
o gráfico de barras.

alunos Idade dos alunos da 10a classe


9
8
7
6
5
4
3
2
1
0
13 14 15 16
Idade(Xi)
17
41
Page
Histograma ou diagrama em colunas
Os histogramas usam se para dados agrupados em classes. A sua construção é semelhante `a do
gráfico de barras. Não há qualquer espaço entre as barras. No eixo das abcissas(horizontal)
representam-se as classes e no eixo das ordenadas(vertical) as frequências.

Distribuicão das Alturas dos alunos da 10aclasse


8
7
6
5
4
3
2
1
0
[1,45;1,50[ [1,50; 1,55[ [1,55; 1,60[ [1,60; 1,65[ [1,65; 1,70[ [1,70; 1,75[
altura

Polígono de Frequências
Consta de uma poligonal, cujos vértices são obtidos pela intersecção de cada ponto médio da
classe e sua respectiva frequência absoluta simples correspondente (no histograma).

Distribuicão das Alturas dos Alunos da 10a Classe


8
7
Números de alunos

6
5
4
3
2
1
0
42

[1,45; 1,50[ [1,50; 1,55[ [1,55; 1,60[ [1,60; 1,65[ [1,65; 1,70[ [1,70; 1,75[
Alturas
Page
Gráficos Circulares (sectograma)
Um gráfico circular é representado por um círculo que está dividido em sectores cujas
amplitudes são proporcionais `a frequência correspondente.
O gráfico circular costuma-se utilizar quando o número de categorias para a variável é
pequeno (normalmente menor ou igual a seis-6) e, é especialmente adequado para estabelecer
comparações entre diferentes valores do atributo em estudo.
A amplitude de cada sector é determinada pela frequência relativa.
Na tabela seguinte foram observadas 54 pessoas relativamente a cor dos olhos.
Cor dos olhos Efectivos
Azul 10
Verde 5
Cinzenta 19
castanha 20

Vamos fazer uma tabela que nos permite calcular a percentagem e o ângulo
correspondente a cada classificação.
Cor dos olhos Efectivos Percentagem Ângulos (amplitude em graus)
(fi)
Azul `10 10/54=0,185… ou 0,185x360o=66,66…=67º
18,5%
Verde 5 5/54=0,093 …ou 9,30% 0,093x360o = 33,33=33º

Cinzenta 19 19/54=0,352… ou 0,352x360o=126,66...=127º …


35,2%
castanha 20 20/54=0,370 …ou 0,370x =1360o=133,33º
37,0% …=133º
n=54 Total=360º
43
Page
Distribuição da cor dos olhos de 54 pessoas

Cor dos olhos de 54 pessoas

Azul
19%
castanha Verde
37% 9%

Cinzenta
35%

Para organizar e representar dados, usam-se tabelas e gráficos.


Existe uma grande variedade de gráficos estatísticos com o fim de responder `as mais variadas
situações. Podemos destacar os gráficos de barras, histograma, pictograma, polígono de
frequências, sectograma ou polígono circular, etc…
Os gráficos de barras utilizam-se essencialmente para dados simples (não agrupados). Estes
gráficos são empregues muita das vezes para estabelecer comparações.
No caso de variável discreta é usual desenhar gráficos: de barras, circular ou pictograma. Os
histogramas usam se para dados agrupados em classes. Um gráfico circular é representado por
um círculo que está dividido em sectores cujas amplitudes são proporcionais `a frequência
correspondente.
O gráfico circular costuma-se utilizar quando o número de categorias para a variável é
pequeno (normalmente menor ou igual a seis-6) e, é especialmente adequado para estabelecer
comparações entre diferentes valores do atributo em estudo.
A amplitude de cada sector é determinada pela frequência relativa.

Exercícios

1. Considera a seguinte distribuição de frequências, relativas as comissões ganhas no último mês pelos
vendedores de uma dada empresa:
Comissões [0;2[ [2;4[ [4;6[ [6;8[ [8;10[ [10;12[ [12;14[
(em centenas
de contos)
No de 2 3 7 16 7 3 2
trabalhadores
Construa o histograma, o polígono de frequências e polígono de frequências acumuladas.

2.Inquéritos realizados em 20 residências de diversas universidades de um determinado país trevelaram


44

os seguintes valores para o número de estudantes de gestão por residência:


No de estudantes 0-10 10-20 20-30 30-40
Page

No de Residências 2 4 9 5
a) Encontre as frequências absoluta, relativa, absoluta acumulada e relativa acumulada;
b) Construa o histograma;

3. Os vencimentos mensais, em mil meticais, dos 40 funcionáriosde uma empresa são os seguintes:
18 18 20 22 21 18 19 20 23 18 19 20
21 18 17 19 20 18 22 19 18 24 20 18
19 18 22 21 20 19 17 18 21 18 18 19
18 18 18 18
a) Indique a população, a variável e a unidade estatística desta distribuição;
b) Elabore um quadro de distribuição de frequências;
c) Construa um gráfico de barras que defina esta distribuição;
d) Elabore um relatório de 2 linhas sobre esta distribuição

1.3 Medidas de localizaçao

Introdução

No capítulo anterior discutimos sobre a organização e apresentação de dados. Neste capítulo,


você vai aprender alguns parâmetros que representam os fenómenos pelos seus valores médios,
ou seja, valores em torno dos quais tendem a concentrar os dados. Esses parâmetros irão lhe
auxiliar na fase de análise e descrição do fenómeno estatístico, é o caso da média aritmética,
moda, mediana e separatrizes.

Ao completar esta unidade, você será capaz de:

 Determinar a média, moda, mediana, quartís,decís e


percentís ;
Objectivos
 Interpretar as medidas de localização

Neste capítulo, você deverá prestar muita atenção aos seguintes


conceitos:
 Média aritmética
Terminologia  Moda;
45

 Mediana e
Page

 Separatrizes.
Licao No 7

1.3.1 Média Aritmética ( X )

Emprega-se a média quando desejamos obter uma medida de posição de maior


estabilidade e quando houver necessidade de tratamento algébrico ulterior.
Chama-se média aritmética ou média de um conjunto de números x1, x2, x3, …,xn e

representa-se por X e definido por:


 Para dados simples
n n

x1  x 2  x3  ...  x n X i X i
X   i 1
 i 1
n

f
n n
i
1º ) i 1

Ex. As alturas de 5 árvores são: 2,3,2,4,5 m. Calcular a média das alturas das árvores.

X  2  3  2  4  5  16  3,2
5 5
 Para dados classificados
m m

f1 x1  f 2 x 2  ...  f m x m fx i i fx i i


X   i 1
 i 1
m

f
n n
i
i 1

se x1, x2, x3, …,xm ocorrem f1,f 2,…, fn vzeses respectivamente.

Exemplo: consideremos a variável idade (em anos) dos alunos da 10ª classe cuja a distribuição é
dada pela tabela:
Xi(idade) 13 14 15 16 17
Fi 2 7 9 3 2

fx i i
f1 x1  f 2 x 2  f 3 x3  f 4 x 4  f 5 x5 2.13  7.14  9.15  3.16  2.17 341
X  i 1
    14,83
n n 23 23
46

idade média é 14,83.


Page
 Para dados ponderados

As vezes, associam se os números x1, x2, x3, … ,xka certos factores de ponderação ou
pesos w1,w2,…,wk que dependem do significado ou importância atribuída aos
números. Neste caso:
k

w1 x1  w2 x2  ...  wk xk w x i i
X  i 1

w1  w2  ...  wk k

w
i 1
i

Exemplo: Um aluno obteve no primeiro bimestre em Estatística, respectivamente, 6, 7 e prova


final 8 e os pesos das provas são respectivamente¨3,2 e 5. Achar a média final do 1º bimestre.
3.6  2.7  5.8 18  14  40
X    7,2
3 25 10 Média aritmética ponderada
Como as frequências são números indicadores da intensidade de cada valor, elas funcionam
como factores de ponderação.
 Para dados agrupados em classe
k

 f Pm
i 1
i i

X=
 fi
i 1 ;
L  li
Pm i  X i  ou Pmi=li+hc/2 onde, Pmi é o ponto médio de cada classe também
2
chamado marca de classe é igual a semi-soma dos extremos da classe.
Li –limite superior da classe li- limite inferior da classe e hc- amplitude da classe.
Ex.Consideremos a variável altura(em metros) dos alunos de uma turma da 10ª classe.
Alturas(em m) fi Xi fiXi
[1,45; 1,50[ 2 1,475 2,95
[1,50; 1,55[ 4 1,525 6,10
[1,55; 1,60[ 5 1,575 7,875
[1,60; 1,65[ 7 1,625 11,375
[1,65; 1,70[ 3 1,675 5,025
[1,70; 1,75[ 2 1,725 3,45
47
Page
n= 23 6

 fixi 
i 1 36,775
k

 f Pm
i 1
i i

Li  li 1,45  1,50
k
X1   1,475,  fi 36,775
 1,6
Pi= 2  2 ,etc. X  i 1 = 23
Para além da média aritmética, existem outros tipos de média como: média harmónica, média
geométrica e média quadrática.

1.3.2 MEDIANA (Me)

Mediana é um valor central de um rol, isto é, o valor que divide um conjunto de dados ordenados
~
(crescente ou decrescente) em duas partes iguais. E representa-se por: Me ou Md ou X .

Sejam x1,x2,x3,…,xn, n dados estatísticos ordenados, se:


 n é ímpar, o valor da variável que ocupa a posição central(mediana) é Me=Xk, com
n 1
K
2 - posição do elemento mediana.
x  xk 1 n n
Me  k k1  k 2  k  1   1.
 n é par, 2 ; 2 e 2

Exemplo: Para dados simples


Consideremos dois conjuntos de elementos:
A={2,7,13,5,9,15,22} e B={7,16,2,10, 5,9}
Determinemos a mediana de cada conjunto.

Para o conjunto A:
1º ordenar os dados: A={2, 5, 7, 9, 13, 15, 22}
n 1 7 1
K 4
2º como n é impar, 2 = 2 ,  X4=Me=9

Para o conjunto B:
1º ordenar os dados: ={2, 5, 7,9, 10, 16}
n 6
k1    3
2º neste caso, n é par, 2 2 e k2=k1+1=3+1=4 assim, x3=7 e x4=9
xk  xk 1 x3  x4 7  9
Me    8
2 2 2
48

Dados em tabelas não agrupados


Page

1- se n é ímpar,
Consideremos a tabela das idades dos alunos da duma turma da 10ª classe

Idade(em anos) Frequência Fi


Xi fi
13 2 2
14 7 9
15 9 18
16 3 21
17 2 23
n=23

n  1 23  1
k   12  Me  X 12  15anos
2 2 , o número 12 indica a posição do elemento
mediana e procura-se na Fi. E nesta posição encontramos a idade 15. Porque de 10 a 18
encontramos uma sequência de 15

2- se n é par
Consideremos os dados da seguinte tabela:
xi Fi Fi
33 6 6
45 11 17
87 17 34
88 9 43
91 5 48
N=48
n 48
k1    24
2 2 e k2=k1+1=24+1=25. como se pode ver na tabela, de 18 a 34 encontramos
uma sequência de 87 isto significa que na posição 24 e 25 temos o mesmo valor ou seja
x x
X24=X25=87 assim, coincidentemente, Me  24 25  87 .
2
Dados em tabelas agrupados em classe
Para calcular a mediana em dados agrupados em classes usa-se a expressão

n
 Fi  ant
Me  l Me [ 2 ].h n
fM e
onde lMe-limite inferior da classe mediana; 2 - elemento mediano,
n, pode ser par ou ímpar.
; fme- frequência absoluta da classe mediana
49

h- amplitude da classe mediana,


Page

Fi ant-frequência absoluta acumulada a anterior a classe mediana.


Ex. Consideremos a tabela-4 das alturas dos alunos da 10ª classe

Alturas(em m) fi Fi
[1,45; 1,50[ 2 23
[1,50; 1,55[ 4 21
[1,55; 1,60[ 5 17
[1,60; 1,65[ 7 12
[1,65; 1,70[ 3 5
[1,70; 1,75[ 2 2
n= 23

n
=23/2 =11,5, é o elemento mediano que indica a posição da classe mediana, e observando na
2
tabela a coluna de Fi podemos ver que de 6 a 12 temos uma sequência da classe [1,60;1,65[.
Logo na posição 11,5 temos classe mediana [1,60; 1,65[; lMe.=1,60, fMe-=7, h=0,05, Fi ant=5
n
 Fi  ant
11,5  5  6,5
Me  l Me  [ 2 ].h  1,60   .0,05  1,60  .0,05  1,60  0,046  1,65
fM e  7  7

1.3.3 MODA, NORMA OU MODO (MO)

Chama-se moda de um conjunto de n dados, x1, x2, x3, …., xn, de uma variável estatística, ao
dado que ocorre com maior frequência e representa se por Mo. Karl Pearson foi quem a
introduziu em Estatística pela primeira vez no sec.XIX.
No caso de idades, a moda é 15 anos.
Para um conjunto de dados, pode existir mais do que uma ou até nem existir moda.
 se num conjunto de dados existir uma moda, diz-se unimodal
 se o conjunto de dados tiver duas modas, ele diz se bimodal
 se o conjunto de dados tiver mais que duas modas, ele diz se multimodal ou plurimodal
 se o conjunto de dados não tiver modas, ele diz se amodal. Ex. 4,1,3,5,7,4,3,1,5,7.
Para dados agrupados em classes, utilizamos diversos processos na sua obtenção. Mas o primeiro
passo é identificar a classe modal.
50

Moda bruta
É o processo mais elementar, basta tomar o ponto médio da classe modal.
Page
Processo de Czuber
Leva em consideração as frequências anteriores e posteriores `a classe modal.
1 ( f max  f ant )
M oc  x0  [ ].h ou seja: M oc  x Mo  [ ].h
1   2 2 f max  ( f ant  f post )

Onde: Moc- moda (processo de czuber);


1=fmax-fant ( diferença entre a frequência modal e a imediatamente anterior);
2=fmax-fpost (diferença entre a frequência modal e a imediatamente posterior);
h- amplitude de classe;
xMo- limite inferior da classe modal.
Utilizando o processo gráfico, basta para isso, identificar a frequência absoluta da classe modal e
as frequências absolutas simples anterior e posterior das duas classes adjacentes e seus
respectivos limites inferior e superior.

0
xMoMo LMo classe
Ex.Calcular a moda pelo processo Czuber, usando os dados da tabela das alturas dos alunos da
10ª classe.
Dados: fmax=7; fant=5; fpost=3, xMo =1,60m , h=0,05m

( f max  f ant ) 75 2


M oc  x Mo  [ ].h  1,60  [ ].0,05  1,60  .0,05  1,60  0,02  1,62m
2 f max  ( f ant  f post ) 2.7  (5  3) 6

51
Page
Numero de alunos
7

1
1,45

1,50

1,55

1,60

1,65

1,70

1,75

Altura(m)

Mo=1,62m
Processo de King
É considerada a influência sobre a classe modal das frequências das classes anterior e posterior.
 f post 
M ok  x M o   .h
 f ant  f post 

onde Mok- moda (processo de King);


fpost- frequência absoluta simples posterior;
fant- frequência absoluta simples anterior.

Graficamente

post.

0 xMo Mo LMo classe


ant.

Ex.: De acordo com os daos da tabela as alturas temos: fant=5; fpost=3, lMo =1,60m , h=0,05m
 f post  3 3
M ok  x M o   .h  1,60  [ ].0,05  1,60  .0,05  1,60  0,02  1,62m
 f ant  f post  53 8
52
Page

Distribuição das alturas dos alunos da 10ª classe


Número de alunos

5
fantt
4

1
1,45

1,50

1,55

1,60

1,65

1,70

1,75

Altura(m)

Fpost Mo=1,62m

Processo de Pearson
Este processo pressupõe que a distribuição seja aproximadamente simétrica, na qual a média
aritmética e a mediana são levados em consideração.
M op  3Me  2 X

Obs. Nem sempre coincidem os valores da moda usando os diferentes processos. Nos dados
agrupados em classe a moda é um valor provável dentro da classe modal comportando portanto
uma certa margem de erro.

1.3.4 CONSIDERACÕES GERAIS SOBRE A MÉDIA, A


MODA E A MEDIANA.

A média é a medida de localização mais utilizada, embora em certos casos, a utilização da


mediana ou da moda seja preferível.
 A média é muito sensível a valores extremos; isto é, quando alteramos drasticamente de
um dos dados a média varia consideravelmente.
53

a)50 85 60 65 60 65 60 80 60  X =65
Page
b) 50 85 60 65 60 65 195 80 60  X =80
 A mediana é preferível à média quando se está interessado em conhecer o ponto médio
da distribuição, aquele valor que divide um rol de dados em duas partes iguais.
 A moda revela a sua importância perante o estudo de caracteres qualitativos, já que tanto
a média como a mediana são medidas aplicáveis apenas a caracteres quantitativos.

A importância das medidas consideradas está dependente do tipo de variável estatística, da


distribuição dos dados e do objectivo que se tem em vista.
Das três medidas acima referidas, a mais importante é a média seguida da médiana e
finalmente a moda.
Na maioria dos estudos, o conhecimento das 3 medidas proporciona uma melhor descrição
do fenómeno ou acontecimento.
Vejamos resumidamente que relação existe entre estas três medidas quando temos
representação através de um polígono de frequências.

Curva Simétrica Curva Assimétrica Curva Assimétrica


Positiva Negativa

X  Me=Mo X >Me>Mo X <Me<Mo

Em termos gráficos a curva simétrica apresenta as duas caudas com a mesma configuração.
Neste caso, a distribuição diz-se normal e a média, mediana e a moda coincidem.

Exemplo: Consideremos o problema dos vencimentos ( em milhares de meticais) dos


54

empregados da empresa X. verifique se a distribuição é simétrica ou assimétrica:


Page
500 700 600 600 1500 1700 2600 700 600 2000 600
________________________________________________
vencimentos Fi Fi
Resolução:
1º Tabela de frequências: 500 1 1
600 4 5
700 2 7
2º Média 1500 1 8
1700 1 9
2000 1 10
2600 1 11
N=11

 fiXi 500  4.600  2.700  1500  1700  2000  2600


X  i 1
  1100
n 11
3º Moda
Mo=600

4º Mediana
n  1 12
N é ímpar,  K    6 assim, Me=X6=700
2 2
5º X >Me>Mo, a distribuição é assimétrica positiva. Também se pode dizer que há muitos
trabalhadores que recebem a baixo da média.

Distribuicão dos Salário de Empregados de uma


Empresa
4,5
4
Número de Empregados

3,5
3
2,5
2
Número de Empregados
1,5
1
0,5
0
0 500 1000 1500 2000 2500 3000
Vencimentos
55
Page
Exercicios

1. As classificações obtidas, no 1º teste deste ano pelos 150 alunos do 2º ano de Ensino Básico de
na disciplina de Estatística distribuem se da seguinte forma:
Classificações: 7 8 9 10 11 12 13 14 15 16 17
No de alunos: 5 11 14 19 . 20 30 18 9 12 8 4
a) Indique a população e a variável estatística em estudo;
b) Calcule a frequência relativa da classificação 8.
c) Indique a percentagem de alunos que tiveram nota inferior a 10;
d) Determine a nota média, a nota modal e a nota mediana.

2. . O chefe de estacão dos Caminhos de Ferro de uma dada localidade registou o atraso dos
comboios, durante uma semana na seguinte tabela:
Determine:
A média, a moda e a mediana de atrasos.
No. de 0-5 5-10 10-15 15-20 20-25 25-30
minutos de
atraso
No de 6 5 7 4 2 4
combois

1.3.5 Medidas separatrizes ( quartis, decis e Percentis)

Os quartis são os valores que dividem um rol de dados em quatro partes iguais.

X1 Q1 Q2=Me Q3 xn

Q1(1ºquartil): é o valor que divide a sequência em duas partes de tal modo que, pelo menos, ¼
ou 25% das observações sejam inferiores ou iguais a esse valor e ¾ ou 75% das observações
sejam superiores ou iguais a esse valor;

Q2(2ºquartil): é o valor que divide a sequência em duas partes iguais de tal modo que , pelo
menos, ½ ou 50%das observações sejam inferiores ou iguais a esse valor e 1/2 ou 50% das
observações sejam superiores ou iguais a esse valor; o Q2 coincide com a mediana.

Q3(3ºquartil):é o valor que divide a sequência em duas partes de tal modo que, pelo menos, ¾ ou
75% das observações sejam inferiores ou iguais a esse valor e ¼ ou 25% das observações sejam
56

superiores ou iguais a esse valor;


Page
Os quartis proporcionam-nos informações acerca da distribuição interna dos dados.

Cálculo de quartis
Calcula-se qualquer dos quartis de forma idêntica ao cálculo da mediana, substituindo-se na
fórmula desta, apenas a posição em que se encontra o elemento desejado.

 Dados não agrupados em classe


in
A posição do elemento quartil no conjunto ordenado é identificado pela expressão, q i  ,
4
(i= 1,2 e 3); n é nº de observações.
Ex1: dada a tabela seguinte calcular Q1, Q2 e Q3.

xi Fi Fi Resolução:
0 1 1 Q1-?
1 5 6 1.(23)
Q1 1º) q1   5,75( posicaoQ1)
4
2 7 13 Q2 Q1 está entre x5 e x6mas x5=x6=1, logo Q1=1
Q3 ou seja: Q1=x5+(x6-x5).0,75=1+(1-1).0,25=1+0=1
3 6 19
4 2 21 2º) Q2-?
5 1 22
6 1 23
N=23
2(23)
q 2   11,5( posicaoQ 2)
4
Q2 está entre x11 e x12mas x11  x12  2 logo Q2=2 ou seja:
Q2  x11  ( x12  x11 ). 0,5  2 + (2 - 2).0,5 = 2 + 0 = 2

3(23)
Q3? q 3   17,25( posicaoQ3)
4
Q3 está entre x17 e x18 e mas x17=x18=3 logo Q3=3 ou seja:
Q3=x17+(x18-x17).0,75=3+(3-3).0,75=3+0=3

Ex2:Determinar a faixa salarial(distância do 1º ao 3º quartil) de 6 funcionários de certa empresa


que ocupam o mesmo cargo.
Salários em Mt: 5.500, 5.780, 6.120, 6.150, 6.620, 7.120.

1.(6)
1º) q1   1,5( psicaoQ1) mas x1=5.500 e x2= 5.780
4
Q1=x1+(x2-x1).0,5 = 5.500+(5.780-5.500).0,5=5.640 Mt
3.(6)
2º) q3   4,5( posicaoQ3) , x4= 6.150 e x5= 6.620.
4
Q3= x4+(x5-x4).0,5 =6.150+(6.620-6.150).0,5=6.385 Mt
Portanto a faixa salarial dos seis funcionários é de (5.640 a 6.385)Mt.
57


Page

Para dados agrupados em classe


in
A posição do elemento quartil no conjunto ordenado é identificado pela expressão, q i  , i=
4
qi  Fi  ant
1,2 e 3; n é nº de observações. E Qi  li  h
f classe
li- limite inferior da classe de Qi;
fclasse- frequência da classe do Qi.
Ex. Consideremos a tabela das notas dos alunos de 4 turmas da 8ªclasse. Calculemos Q1, Q2 e
Q3.
Resolução:
Notas fi Fi
[0;2[ 27 27 1.110 2.110 3.110
[2;4[ 16 43 Q1 1º) q1   27,5 ; q 2   55,0 ; q3   82,5
4 4 4
q  F1  ant
[4;6[ 34 77 Q2 2º) Q1  lQ1  1  h , h=2, F1  ant =27 e fQ1=16
f Q1
[6;8[ 17 94 27,5  27
[8;10[ 16 110
Q3 Q1  2   2  2,06
16
N=110

55  43 82,5  77
Q2  4   2  4,70 Q3  6   2  6,65
34 17
Interpretação
a) para Q1=2,06 significa que em nosso exemplo, 25% dos alunos obtiveram nota 2,06 ou
menos;
b) para Q2=4,7 significa que 50% dos alunos obtiveram notas 4,7 ou menos;
c) para Q3=6,65 significa que 75% dos alunos obtiveram notas 6,65 ou menos.

Diagrama de Extremos e Quartis (Box-Plot ou Caixa de Bigod)


Quando uma distribuição é marcadamente assimétrica, tem interesse organizar um diagrama de
extremos e quartis. Uma vez calculados os quartis e considerando os valores extremos; isto é, o
valor máximo e mínimo de uma variável estatística, podemos construir o diagrama de extremos
e quartis, vejamos um exemplo:
Calcular Q1, Me e Q3 d conjunto de notas de cada uma das disciplinas:
Matemática: 2 5 8 8 8 9 11 11 12 13 14
Geografia: 4 7 89 11 14 15 16 16 17 18
História: 5 9 10 10 1112 12 12 13 14 14
Q1 Me=Q2 Q3
Para construir diagrama de extremos e quartis, começamos por desenhar uma linha vertical onde
assinalamos os valores da variável. Primeiro, marcamos na linha, os valres extremos máximo e
mínimo e, em seguida, assinalámos Q1, Me e Q3. construimos a «caixa» ou seja «Box-Plot»
correspndente a intervalo de extremos Q1 e Q3.
Os diagramas de extremos e quartis permitem uma visualização da distribuição das notas nas três
disciplinas, pondo em distaque:
1- diferença na amplitude total( na História há menor diferença na amplitude total);
58

2- diferença na Mediana ( o valor central mais elevado diz respeito à disciplina de


Page

Geografa);
3- diferença nos intervalos interquartis(Q3, Q1 dentro de cada «caixa»estão pelo
menos 50% das classificações respectivas;
4- na disciplina de História( a «caixa» é mais pequena ) existe uma maior
concentração de 50% das notas em torno da mediana;
5- nas disciplinas de Geografia e História há uma grande concentração de valores
acima da mediana;
6- na disciplina de Matemática há uma maior dispersão das notas inferiores ou iguais
a Q1 do que das notas superiores ou iguais a Q3.

Notas

18

16

14

12

10

0
0
Matemática Geografia História
0

Decil (Di)
Divide a distribuição em dez partes iguais em um conjunto ordenado de valores.
Assim podemos ter: D1, D2, D3,....., D9.
Para dados agrupados em classe
in Edi  Fi  ant.
Façamos, Edi  onde i=(1,2,3,..., 9), asim: Di  li  *h
10 f Di
Exemplo:

Com os dados da tabela anterior, de notas dos alunos das 4 turmas da 8ªclasse, determinar D2,
59

D5 e D7.
As posisões dos elementos desejados são:
Page
2 *110 5 *110 7 *110
Ed 2  22 ªposição, Ed 5   55 ªposição Ed 7   77 ª posição
10 10 10
22  0 55  43 77  43
D2  0  * 2  1,63 ; D5  4  * 2  4,70 ; D7  4  * 2  6,00
27 34 34
Interpretação
 Para D2=1,63 significa, em nosso exemplo que 20% dos alunos obtiveram notas 1,63 ou
menos;
 Para D5=4,70 significa que 50% dos alunos obtiveram notas 4,7 ou menos;
 Para D7=6,00 significa que 70% dos alunos obtiveram notas 6,0 ou menos.

Centil ou Percentil (Ci)


Divide a distribuição em cem partes iguais em um conjunto ordenado de valores.
Assim podemos ter: C1, C2, C3,....., C99.
Para dados agrupados em classe
in Eci  Fi  ant.
Façamos, Eci  onde i=(1,2,3,..., 99), asim: Ci  li  *h
100 f ci
Exemplo:
Ainda com base na tabela do exercicio anterior, determinar C25, C50 e C75 e fazer a respectiva
interpretação.
25 *110 50 *110 75 *110
Ec 25   27,5 ªposição; Ec 50   55 ªposição; Ec 75   82,5
100 100 100
ªposição
27,5  27 55  43 82,5  75
C 25  2  * 2  2,06 ; C50  4  * 2  4,70 ; C75  6  * 2  6,65
16 34 17
Interpretação
 Para C25=2,06 significa, em nosso exemplo que 25% dos alunos obtiveram notas 2,06 ou
menos;
 Para C50=4,70 significa que 50% dos alunos obtiveram notas 4,7 ou menos;
 Para C75=6,65 significa que 75% dos alunos obtiveram notas 6,65 ou menos.

Obs:Calcula-se qualquer dos quartis, decil e centil de forma idêntica ao cálculo da mediana,
substituindo-se na fórmula desta, apenas a posição em que se encontra o elemento desejado

Exercício
Um professor de Português obteve para o mesmo teste os seguintes resultados, em duas turmas
(o teste foi cotado de 0 a 20).
Turma -1: __________________________________
10 13 16 17 18 12 12 13 14 14
15 16 16 17 17 17 18 17 18
----------------------------------------------------
Turma-2: ____________________________________
3 18 5 7 9 12 13 12 10 8
8 12 10 6 9 11 17 12 13
60

------------------------------------------------------
Page

a) escreve as classificações, por ordem crescente, para cada uma das turmas.
b) Determine a mediana, o 1º quartil e o 3º quartil para cada uma das turmas.
c) Indique a amplitude total e a amplitude interquartis da turma -1.
d) Elabore os respectivos diagramas de extremos e quartis e interprete-os, referindo:
 A posição relativa a mediana;
 A distriuição das notas no intervalo interquartis.

Sumário
Emprega-se a média quando desejamos obter uma medida de posição de maior estabilidade e
quando houver necessidade de tratamento algébrico ulterior.
Para além da média aritmética, existem outros tipos de média como: média harmónica, média
geométrica e média quadrática.
Mediana é um valor central de um rol, isto é, o valor que divide um conjunto de dados ordenados
~
(crescente ou decrescente) em duas partes iguais. E representa-se por: Me ou Md ou X .
Chama-se moda de um conjunto de n dados, x1, x2, x3, …., xn, de uma variável estatística, ao
dado que ocorre com maior frequência e representa se por Mo. Karl Pearson foi quem a
introduziu em Estatística pela primeira vez no sec.XIX.
Para dados agrupados em classes, utilizamos diversos processos na sua obtenção. Mas o primeiro
passo é identificar a classe modal.
Moda bruta é o processo mais elementar, basta tomar o ponto médio da classe modal.
Processo de Czuber, leva em consideração as frequências anteriores e posteriores `a classe
modal.
Processo de King é considerada a influência sobre a classe modal das frequências das classes
anterior e posterior
Processo de Pearson, este processo pressupõe que a distribuição seja aproximadamente
simétrica, na qual a média aritmética e a mediana são levados em consideração.
M op  3Me  2 X

Obs. Nem sempre coincidem os valores da moda usando os diferentes processos. Nos dados
agrupados em classe a moda é um valor provável dentro da classe modal comportando portanto
uma certa margem de erro.
A média é a medida de localização mais utilizada, embora em certos casos, a utilização da
mediana ou da moda seja preferível.
61

A importância das medidas consideradas está dependente do tipo de variável estatística, da


distribuição dos dados e do objectivo que se tem em vista
Page
Na maioria dos estudos, o conhecimento das 3 medidas proporciona uma melhor descrição do
fenómeno ou acontecimento.
Os Quartis são os valores que dividem um rol de dados em quatro partes iguais Q1,Q2 e Q3.
Os quartis proporcionam-nos informações acerca da distribuição interna dos dados.
Os Decis, dividem a distribuição em dez partes iguais em um conjunto ordenado de valores.
Assim podemos ter: D1, D2, D3,....., D9.
Centil ou Percentil (Ci), dividem a distribuição em cem partes iguais em um conjunto ordenado
de valores.
Assim podemos ter: C1, C2, C3,....., C99.

Exercicios de Auto-avaliação

1. Na figuraque está representado um histograma que mostra a pontuação obtida num exame
escrito. Terão de prestar o exame oral os alunos que obtiveram pontuação inferior a 70.

No. de Resultados de um exame


Estudantes

no
6

10 20 30 40 50 60 70 80 90 pontuacão
a) quantos alunos dispensaram do exame oral?

b) qual a percentagem de alunos que obtiveram pontuação inferior a 50?


62
Page
1. Construa umgráfico circular indicando a percentagem relativa a cada sector de acordo
com os dados da tabela que indica tipo de transporte utilizado por 90 pessoas, quando se
deslocam para o trabalho:
Meio de No. de
transporte pessoas
Carro 32
Autocarro 38
Comboio 12
Motorizada 6

2. Os empregados do ministério do Turismo estão num sistema de horário flexível: eles


podem começar seu dia de trabalho às 7h, 7:30h, 8h, 8:30h ou 9h. Os seguintes dados
apresentam uma amostra de horário de início escolhido pelos empregados:
700h 8:30h 9:00h 8:00h 7:30h 7:30h 8:30h 8:30h 7:30h 7:00h
8:30h 8:30h 8:00h 7:30h 8:30h 7:00h 9:00h 8:30h 8:00h 8:00h
Sintetize os dados construindo:
a) Distribuição de frequência;
b) Gráfico de barras;
c) O que os sumários revelam sobre as preferências dos empregados quanto ao sistema de
horário flexível?

3. uma amostra de estudantes, que completaram um curso em estatísticas de negócios


durante a primavera de 1998, forneceu as seguintes respostas sobre o que teriam achado
do curso. Para auxiliar o processamento dos resultados via computador foi usada uma
escala numérica em que 1=fraco, 2=regular, 3=bom, 4= óptica, 5=excelente.
4 4 5 1 5 3 4 5 2 4 5 5 2 4 3 4 5 5 3
5 2 4 3 4 5 4 3 5 3 3 5 4 2 5 4 2 4 4
5 3 4 3 4 4 4 5 5 4 1 4 4 3 5 3 3 3 4
a) comente porque estes dados são qualitativos;

c) com base a alínea anterior comente a avaliação global do curso feito pelos estudantes.

4. Num teste de automobilismo de distância e de consumo de gasolina, 13 automoveis


foram atestados por 300km em estrada, nas mesmas condições de direcção na cidade e no
campo. Os seguintes dados foram registados para o desempenho milhas por galão.
Cidade: 16,2 16,7 15,9 14,4 13,2 15,3 16,8 16,0 16,1 15,3 15,2 15,3 16,2
Campo: 19,4 20,6 18u,3 18,6 19,2 17,4 17,2 18,6 19,0 21,1 19,4 18,5 18,7
Use a média, mediana e moda para fazer um relatório sobre a diferença no desempenho para
a condução na cidade e no campo. E

5. O gráfico circular ao lado, representa a


distribuição, por ramos de actividade,
de 936 empregados de uma empresa. Administractivo-
Empregados por ramo de actividade
63

100º
Transporte-60º
a) Em que ramo de actividade há mais Design- 45º
Page

empregados? Construcao- 125º


Vendas- 30º
b)Construa com os dados do gráfico uma tabela de efectivos e frequências relativas.
c)Qual é a percentagem de empregados na parte dos transportes?
d)Construa um gráfico de barras que indique as percentagens de empregados em cada um dos
ramos de actividade.

6. Os gráficos seguintes mostram a mesma informação. No entanto, eles apresentam uma


imagem diferente. Um deles foi apresentado pela administração e outro pelo delegado
sindical de uma empresa numa reunião de renovação do contrato salarial.
Vendas 1º semetre 2007
3,55

3,5

3,45 Vendas(milhares)

3,4

3,35
Grafico A
3,3
Polinômio
3,25 (Vendas(milhares))

3,2

3,15
Jan Feb Mar Apr May Jun

4,5 Grafico B
4

3,5

Vendas(milhares)
2,5

2 Polinômio
(Vendas(milhares))

1,5

0,5

0
Jan Feb Mar Apr May Jun

a) Mencione qual dos gráficos teria apresentado o delegado sindical para pedir aumento.
Justifique.
64

b) Qual foi a estratégia usada para dar a mesma informação de uma forma aparentemente
Page

diferente?
7. Cinco números tem média 6. se juntarmos um sexto numero ao conjunto, a média passa a
ser 7. qual foi o número que se adicionou?

8. Numa turma há 12 rapazes e 13 raparigas. A média dos pesos dos rapases é 65kg e a das
raparigas é 61kg. Determine o peso médio dos alunos da turma.

9. Numa associação desportiva, a altura média dos seus 200 atletas é de 1,65m. as atletas
femeninas são 110 e têm altura média igual a 1,60m. determine a altura média dos homens.

10. A média das idades de um grupo de seis alunos da 10ª classe é 16 anos e 5 meses. A este
grupo juntou-se mais um aluno e a média passou para 16anos e 7 meses. Determine a idade
do novo aluno.

11.A partir das classificações obtidas na disciplina de inglês pelos alunos de uma turma de 7º
ano, calcularam-se as frequências relativas das diferentes classificações e obtiveram-se os
seguintes valores da tabela:
Classificação(nível) 1 2 3 4 5
fri 0,05 0,20 0,45 0,20 0,10
a) calcula com aproximação às unidades, a classificação média dos alunos da turma na
disciplina de inglês;
b) determina a moda e a mediana das classificações.

12. O chefe de estacão dos Caminhos de Ferro de uma dada localidade registou o atraso dos
comboios, durante uma semana na seguinte tabela:
Determine:
A média, a moda e a mediana de atrasos.
No. de 0-5 5-10 10-15 15-20 20-25 25-30
minutos de
atraso
No de 6 5 7 4 2 4
combois

65
Page
1.4 Medidas de Dispersao

Introdução

No capítulo das Medidas de Dispersão, vai tratar de estudar o fenómeno da variabilidade em


dados estatísticos, você vai perceber até que ponto o resultado estatístico é seguro com o cálculo
de amplitude de distribuição, desvio - médio, variância, desvio-padrão e coeficientes de variação.
Estes parâmetros também vão auxiliar na fase de análise e descrição do fenómeno estatístico.
Ao completar este capitulo , você será capaz de:

 Calcular a amplitude, desvio-médio, variância, desvio-


padrão e coeficientes de variação;
 Analisar e interpretar medidas de dispersão descrevendo-os
e tirar conclusões;
Objectivos
 Elaborar um relatório preliminar sobre o fenómeno
estatístico observado.

Nesta lição, você deverá prestar muita atenção aos seguintes termos e
conceitos:
 Tabela de cálculos auxiliares
Terminologia  Amplitude total, desvio-médio, variância, desvio-padrão e
coeficientes de variação

Licao No 9

1.4.1 Amplitude Total (At)

A amplitude total é a diferença entre o maior e o menor valor de um rol de dados.


Se os dados estão agrupados em classe, podemos utilizar dois processos na sua obtenção:
a) a amplitude total é a diferença entre o limite superior da última classe e o limite
inferior da primeira,
66

b) também pode-se calcular através da diferença entre o ponto médio da última classe e
o ponto médio da primeira classe.
Page

Obs:Para os dois processos o resultado terá uma pequena diferênça.


At=Li-li
Ex: 0, 6, 8, 4, -1, 10.
At=10-(-1)= 10+1=11

Tanto a amplitude dos dados como os valores extremos, não constituem por si só medidas
estatísticas seguras para avaliar a dispersão dos dados, por duas razões principais:
1. são insensíveis a qualquer variação dos valores intermédios, visto que não levam em
consideração as flutações apresentadas em relação aos valores internos da distribuição.
2. a presença de uma única observação muito alta ou muito baixa, tem uma grande
influência sobre os seus valores.

Exemplo:

70 75 80 85 90 95 100 70 75 80 85 90 95 100 70 75 80 8590 95 100

As distribuições têm a mesma amplitude e são diferentes.

Menor dispersão

Maior dispersão

1.4.2 Desvio- Médio (Dm)

É a média dos valores absolutos dos desvios dos dados, a partir da média.

 Para dados não agrupados


n

x i x
Dm  i 1
67

n
Page

 Para dados agrupados e ponderados


m

 fi x i x
Dm  i 1

N.B. quanto maior for o desvio- médio, maior é o afastamento dos valores observados em
relação à média ou seja, maior é a dispersão dos dados.
Ex. Seja x= 2,5,8,15,20 , calcular Dm.

x
 xi  2  5  8  15  20  10
n 5

2  10  5  10  8  10  15  10  20  10
Dm  6
5

1.4.3 Variância

Os matemáticos procuram uma fórmula que nos permite avaliar a dispersão relativamente à
média sem que aparecesse o símbolo do valor absoluto; isto é, uma fórmula em que o
aparecimento de números negativos foi resolvido com «o elevar ao expoente 2»; isto é: (xi- x )2.
A variância de um conjunto de dados x1, x2, ...., xn, representa se por  2 ou S2 , quando se refere
a população e amostra respectivamente. E calcula-se:
Para dados não agrupados
2
 n 
  xi 
 xi  x   xi  x  xi   i 1 
n n n n

x 
2 2 2 2
i
2 n
População:  2  i 1
 i 1
x ; Amostra: S 2  i 1
 i 1
n n n 1 n 1

Para dados agrupados e ponderados

 fi * xi  x 
m m

 fi * x
2 2
i
2
População:  2  i 1
 i 1
x ; Amostra:
n n
2
 m 
  fi * xi 
 fi * xi  x  fi * xi 2   i 1 
m m


2

n
S2  i 1
 i 1

n 1 n 1

1.4.4 Desvio- Padrão

É a raiz quadrada positiva da variância e representa-se por  ou S, para população e amostra


68

respectivamente.
Page

Para dados não agrupados


 xi  x 
n n

 xi
2 2

População:   i 1
 i 1
 x2
n n

n
( xi ) 2
 xi  x 
n n

 xi
2 2
 i 1

n
Amostra: S  i 1
 i 1

n 1 n 1

Para dados ponderados e agrupados em classe

 fi * xi  x 
m m

 fi * xi
2 2

População:   i 1
 i 1
 x2
n n
2
 m 
  fi * xi 
 fi * xi  x   
m m


2 
fi * xi 2  i 1

n
Amostra: S  i 1
 i 1

n 1 n 1

O desvio- padrão é a medida de dispersão mais usada.


Para grande valor (n>30) não há praticamente diferença entre as duas definições de  2 e S2.
quando necessária melhor estimativa use sempre S2 para variância e S para o desvio -Padrão.

1.4.5 Interpretação do Desvio - Padrão


Quanto maior for o desvio- padrão, maior será a dispersão dos valores relativamente à média.
Combinando o conhecimento da média e do desvio- padrão, podemos em muitas situações
caracterizar a localização e a dispersão dos valores.
Quando a distribuição é normal (simétrica), isto é, x  Me M O , temos as seguintes estimativas:
68,3% das observações em x   ; x   
95,5% das observações em x  2 ; x  2 
99,7% das observações em x  3 ; x  3  69

Na prática a maioria das distribuições apresentam este comportamento.assim, por exemplo, se


Page

numa distribuição encontramos média 30 e o desvio padrão 4, podemos esperar que cerca de:
 2/3 dos valores estejam entre 26 e 34
 95% dos valores estejam entre 22 e 38
 99% dos valores estejam entre 18 e 42.

Ex1: A tabela junta mostra as classificações obtidas por 100 alunos numa prova de Matemática:

Classificações 2 5 8 10 11 12 13 14 16 18
Efectivos 3 8 10 30 13 16 8 7 3 2
Calcular:
a) a média das classificaões;
b) o desvio padrão

c) a percentagem de alunos cuja classificação está entre o intervalo x  2 ; x  2 
Resolução:
a) 1º construimos tabela de xi, fi, fi.xi, e fi.xi2:

xi fi Fi.xi Fi.xi2
2 3 6 12
5 8 40 200
8 10 80 640
10 30 300 3000
11 13 143 1573
12 16 192 2304
13 8 104 1352
14 7 98 1372
16 3 48 768
18 2 36 648
 fi  100  fi.xi  1047  fi.xi 2  11869
onde  fi  xi  1047
assim: x 
 fi  xi  1047  10,47 ,
n 100
 fi  xi 2
11869
 10,47   9,0691
 fi  xi
2
 11869 mas  2  x 
2 2
b)
n 100
assim, o desvio padrão é:    2  9,0691  3,01
x  2  10,47  2  3,01  4,45
c)
x  2  10,47  2  3,01  16,49
portanto, o intervalo referido é:]4,45; 16,49[, só as classificações de 2 e 18 estão fora deste
intervalo. Logo, 3+2=5 alunos têm classificações que não pertencem ao intervalo. Como
tinhamos 100alunos, temos que 95% dos alunos têm classificação dentro do intervalo.Trata
se duma distribuição próxima da normal se formos a comparar com os resultados já
estabelecidos.
70
Page
Ex2: um jardineiro mediu em centímetros, 50 plantas no dia em que as plantou. Os dados estão
registados na tabela a baixo.

Calcule a percentagem de plantas cujas alturas pertencem ao intervalo x   ; x  
classe Ponto médio da classe( Xi) fi
[3,5; 9,5] 6,5 5
[9,5; 11,5] 10,5 25
[11,5; 14,5] 13 11
[14,5; 18,5] 16,5 9
Resolução: Calculemos:
 fi  n  5  25  11  9  50 ,  fi.xi  586,5 ;  fi.xi 2  7276,75 ; x  11,73
 11,73  2,818 ,
7276,75
 2

50
 
Calculemos o número de plantas cujas alturas estão entre os valores: x   ; x  
11,73-2,818=8,912=8,91
11,73+2,818=14,548=14,55
Assim temos: ]8,91; 14,55[ estarão neste intervalo todas as plantas das classes [9,5; 11,5[ e
[11,5; 14,5[ e algumas plantas das clases [3,5; 9,5[ e [14,5; 18,5[.
 Calculemos o numero de plantas da classe[3,5; 9,5[ que pertencem a ]8,91; 14,55[
8,91  [3,5; 9,5[ e a amplitude deste intervalo=9,5-3,5=6 e o número de plantas desta classe
9,5  8,91
=5, assim o valor aproximado calcula-se:  5  0,49
6
 Calculamos o número de plantas da classe [14,5; 18,5[que pertencem ao intervalo
]8,91; 14,55[.
14,55  [14,5; 18,5[ e a amplitude deste intervalo 18,5-14,5=4 e, o número de plantas desta
14,55  14,5
classe=9. Assim o valor aproximado de plantas  9  0,11
4
 Conclusao:
0,49+25+11+0,11=36,6

O número total de plantas cujas alturas pertencem ao intervalo pedido =36,6 em percentagem,
36,6
temos:  100%  73,2%
50

1.4.6 Relações Empíricas Entre as Medidas de Dispersão

Para as distribuições moderadamente desviadas, há fórmulas empíricas:


Desvio- médio(Dm)=4/5(desvio padrão);
Amplitude semi-inter-quartilica=2/3(desvio- padrão).
Essas expressões resultam de ter sido determinado para as distribuições normais, que o Desvio
médio eAmplitude semi-inter-quartilica são iguais respectivamente, a 0,7979 e 0,6745 vezes o
desvio- padrão.
71

1.4.7 Dispersão absoluta e relativa. Coeficiente de Variação


Page
A variação ou dispersção real, determinada a partir do desvio-padrão, ou qualquer outra medida
de dispersão, é denominada dispersão absoluta.

Dispersa~oabsoluta
Dispersão relativa 
Media
Se a dispersão absoluta é o desvio-padrão  e a média é a aritmética x , a dispersão relativa é
denominada coeficiente de variação de Pearson (CVp) ou de dispersão, dado por:
 S
CVp   100% ou CVp   100%
x x

É mais utilizado quando desejamos comparar diversas grandezas com unidades de medidas que
podem ser iguais ou diferentes. Ou ainda quando apresentam médias diferentes, embora suas
unidades de medidas sejam iguais.
Exemplo:
Suponha que determinado que determinado fornecedor A, de parafusos tenha enviado ao
Departamento de compras de uma empresa uma amostra de 2000 parafusos, com medidas de seu
comprimento em mm variando entre 101 e 113mm.O Departamento de compras efectuou uma
análise em suas médias e calculou seu respectivo desvio-padrão, encontrando as seguintes
especificações:
 Comprimento médio do parafuso: 107,9mm
 Desvio-padrão do comprimento do parafuso: 2,72mm

Admitindo-se um fornecedor B, que apresentou um lote deste mesmo parafuso com o mesmo
número de peças, com média x  108mm e desvio-padrão S=1,08mm, qual é o lote que você
escolheria se fosse o comprador?
Resolução:
Fornecedor A: Fornecedor B:
2,72mm 1,08mm
CVp   0,0252  2,52% CVp   0,01  1,00%
107,9mm 108mm
Resp: iria escolher o lote do fornecedor B que apresenta menor dispersão relativa do que o lote
do fornecedor A.

Conforme seus valores, podemos ter as seguintes classificações de coeficiente de vaiação:


 CV  15% baixa dispersão
 15%  CV  30% média dispersão
 CV  30% alta dispersão

1.4.8 Variável reduzida, Escores reduzidos


xx
A variável Z  que mede o desvio em relação à média, em unidades de desvio-padrão, é

denominada variável reduzida e é a quantidade abstrata ( i.e., independe das unidades usadas).

Se os desvios em relação à média forem dadas em unidades de desvio-padrão, diz-se que estão
72

expressos em unidades reduzidas ou esores reduzidos.


Page
A variável reduzida ou escore Z(tipificação), permite comparar rendimentos de populações ou
indivíduos. p.ex salário de dois indivíduos. Maior escore Zimplica melhor rendimento.

Ex.1: em um exame final de Estatística, o grau médio de ium grupo de 150 estudantes foi 78 e o
desvio- padrão 8,0. Em Álgebra , entretanto, o grau médio final do grupo foi 73 e o desvio-
pardrão 7,6. Um estudante obteve os graus 73 em Estatística e 71 em Álgebra.
a) Em que matéria foi maior:
i. a dispersão absoluta;
ii. a dispersão relativa
b) Em qual dos exames foi mais elevada a sua posição relativa (rendimento)?

Resp: a) i. Estatística; ii. Álgebra; b) Álgebra

1.5 DISTRIBUIÇÕES BIDIMENSIONAIS

Introdução
No capitulo sobre Correlações e regressão simples ( distribuições bidimensionais), você vai
poder compreender como relacionar duas variáveis e validar o resultado num estudo estatístico.
Vai saber como representar esta relação graficamente (recta de regressão) e como interpretar.
Ainda vai poder calcular (estabelecer) a intensidade da relação entre duas variáveis com base na
covariância, coeficiente da correlação e coeficiente de determinação.

Ao completar esta unidade, você será capaz de:

 Determinar a relação entre duas variáveis estatísticas


através de cálculo de certas grandezas e graficamente;
Objectivos
 Estimar a equação de regressão linear.
 Calcular e interpretar o coeficiente de determinação.
73
Page
Neste capítulo, você deverá prestar muita atenção aos seguintes
conceitos:
 Diagrama de dispersão
Terminologia  Covariância
 Coeficiente de correlação linear;
 Coeficiente de determinação
 Recta de regressão linear.

Licao No 10

No estudo da Estatística até agora desenvolvido observamos um conjunto e atribuímos a cada


observação um número X i (ou modalidade).Distribuições deste tipo que envolvem observações
de uma única variável chamam-se unidimensionais.
Se ao fazermos uma observação atribuirmos a cada elemento um par ordenado de valores
 X i ; Yi  , temos uma variável estatística bidimensional.
No estudo de uma distribuição bidimensional, procura-se saber se existe alguma relação entre as
duas variáveis.

Exemplo: pergunta-se a cada aluno de uma turma:


a)A nota de Matemática obtida na 9ªclasse e a nota do 1º teste de Geografia.
b) A temperatura média anual e latitude das capitais dos países da CE.
c) O seu peso em Kg e altura em centímetros.
Não procuraremos relacionar as variáveis como sexo e a nota de Matemática, pois, à
partida, não existirá qualquer dependência estatística.
Quando afirmamos que duas coisas estão relacionadas, podemos querer dizer que existe entre
elas uma conexão bem definida e invariável ou, diferentemente , que a ligação é mais indefinida
e algo variável.
Por exemplo a área de um quadrado e o comprimento do seu lado estão relacionados. A relação
que os liga é bem definida, invariável e pode traduzir-se pela expressão matemática:
A  2 , em que A, representa a área e  , o lado.
A relação entre área e o lado do quadrado também chamada relação funcional, permite
determinar, com a precissão desejada, a área do quadrado a partir do comprimento do seu lado ou
o comprimento do seu lado a partir da sua área.
Já no caso de um estudo entre as idades dos cônjuges na data de casamento, a idade do marido
não pode ser determinada com ixactidão a partir da idade da mulher. O que pode dizer-se é que,
em média, quanto mais velho for o homem mais velha será também a mulher. Trata-se agora, de
uma relação menos precisa, mais vaga e sujeita a variações, pois, em alguns casos, o marido
pode ser mais novo ou ter a mesma idade da mulher. São estas as relações com interesse para o
estudo estatístico e que se designam por relações estatísticas.
74

Assim, perante dois fenómenos quaisquer, podemos afirmar que ou estão ligados através duma
relaão funcional ou de uma relação estatística, ou não estão ligados através de qualquer relação.
Page
Deste modo, podemos dizer quea relação estatística exprime o meio-termo, no grau de conexão
entre variáveis, entre a relação funcional e a ausência de relação.

Relação funcional - Relação estatística - Ausência de relação

No caso de ausência de qualquer relação entre dois fenómenos, esses fenómenos dizem-se
independentes.

1.5.1 DIAGRAMA DE DISPERSÃO


Um dos primeiros passos que pode ser dado na análise da relação entre duas variáveis, é a
construção do diagrama de dispersão. O diagrama de dispersão é um gráfico de pontos. Ele
permite ver se existe alguma relação entre as variáveis, identificando a equa,ão que a descreve
adequadamente.
A relação entre as variáveis pode ser positiva ( a um aumento dos valores de uma variável,
corresponde também um aumento nos valores da outra variável) ou negativa (a um aumento dos
valores de uma variável, corresponde a uma diminuição dos valores da outra).
O diagrama de dispersão apresenta vantagens consideráveis ao permitir identificar de imediato
certos atributos da relação entre variáveis. Todavia, este tipo de gráfico apresenta, em algumas
circunstâncias, certos inconvenientes.
Quando há observações que se repetem, o diagrama de dispersão não realça a frequência com
que aparecem tais observações e, tudo se passa em termos gráficos, como se não houvesse
repetições, pois, a representação gráfica de qualquer deles localiza-se no mesmo ponto.
Constrói-se o diagrama de dispersão, fazendo corresponder através de pontos o valor de X i ao
valor correspodente de Yi .
Os valores correspondentes de X i e Yi podem ser apresentados em tabelas de frequências,
simples ou de dupla entrada.

Considere que o gerente de uma loja está interessado em analisar a relação entre o número de
anúncios mostrados durante o fim de semana na televisão local e as vendas na loja durante a
semana seguinte. Para isso, ele recolhe os seguintes dados:
Número 2 5 1 3 4 1 5 3 4 2
de
anúncios
Volume 50 57 41 54 54 38 63 48 59 46
de
vendas
(US$)
75
Page
Diagrama de dispersão para a relação número de anúncios e volume de vendas

O gráfico mostra uma tendência crescente, a relação entre as duas variáveis é positiva. Para
confirmar este facto, calculemoas a covariância, medida descritiva de associação linear entre as
variáveis.

1.5.2 COVARIÂNCIA

O valor da covariância permite saber se a relação entre as variáveis é positiva ou negativa. Se o


valor da covariância for positivo, a relação é positiva, se a covariância for negativo, a rela,cão é
negativa.
A covariância representa-se por S xy ou C xy e calcula-se:
n

 x i  x  y i  y 
S xy  i 1

n
Portanto, é necessária uma tabela de cálculos para simplificar os passos de resolução.
Para o caso do gerente tem-se:
xi yi  xi  x   yi  y  xi  x  yi  y 
1 2 50 -1 -1 1
2 5 57 2 6 12
3 1 41 -2 -10 20
4 3 54 0 3 0
5 4 54 1 3 3
6 1 38 -2 -13 26
7 5 63 2 12 24
76

8 3 48 0 -3 0
Page

9 4 59 1 8 8
10 2 46 -1 -5 5
n 30 510 99
Soma = 
i 1

N=10

n n

x i
30
y i
510
x i 1
 3 e y i 1
  51 ,
n 10 n 10
n

 x i
99
 x  yi  y 
S xy  i 1
  9.9 este resultado mostra que existe uma relação positiva entre o
n 10
número de anúncios e o volume de vendas, pois,o valor da covariância é positiva.

1.5.3 COEFICIENTE DE CORRELAÇÃO LINEAR


DE PEARSON

O coeficiente de correlação linear é uma medida descritiva que avalia o tipo e a intensidade
(magnitude) de uma relação.Representa-se por letra rxy . A sua expressão matemática é:

S xy  x i  x  y i  y 
rxy   i 1

SxSy n n

 x  x  y  y
2 2
i i
i 1 i 1

O coeficiente de correlação varia entre -1 a +1. Valores próximos dos extremos indicam uma
associação forte entre as variáveis. Alguns autores convencionam que:

0  rxy  0,2 ou  0,2  rxy  0 Associação muito baixa;


0,2  rxy  0,4 ou  0,4  rxy  0 ,2 Associação baixa;
0,4  rxy  0,7 ou  0,7  rxy  0 ,4 Associação moderada;
0,7  rxy  0,9 ou  0,9  rxy  0 ,7 Associação forte
0,9  rxy  1 ou  1  rxy  0 ,9 Associação muito forte
Se rxy for igual a -1 ou +1 diz-se que a relação é perfeita.
Em relação ao problema do gerente, podemos calcularo coeficiente de correlação linear para
avaliar o tipo e a intensidade (magnitude) da relação entre o número de anúncios e o volume de
vendas.

 xi  x   yi  y  xi  x  yi  y  xi  x 2  yi  y 2
77

-1 -1 1 1 1
2 6 12 4 36
Page
-2 -10 20 4 100
0 3 0 0 9
1 3 3 1 9
-2 -13 26 4 169
2 12 24 4 144
0 -3 0 0 9
1 8 8 1 64
-1 -5 5 1 25
99 20 566

 x i  x  yi  y 
99 99
rxy  i 1
   0.93
n n
20  566 106.4
 x  x  y  y
2 2
i i
i 1 i 1

1.5.4 REGRESSÃO LINEAR SIMPLES

A observação cuidada da nuvem de pontos do diagrama de dispersão permite-nos identificar leis


matemáticas-tipo caracterizadoras da tendência da relação estatística.
A recta de ajustamento aos pontos da nuvem chama-se recta de regressão.
Trataremos apenas da sua construção gráfica de modo que a soma dos desvios dos pontos da
nuvem em relação aos correspondentes da recta seja o menor possível. O conhecimento dos
valores médios de x e y, pode ajudar a construir a recta com menor erro.
A principal vantagem da recta de regressão é, permitir determinar uma estimativa do valor de
uma das variáveis conhecido o valor da outra variável.
Em relação à preocupação do gerente da loja, a pergunta que agora se pode colocar em relação à
questão do número de comerciais e o volume de vendas é a seguinte: de que maneira poderão
comportar-se as vendas, se durante o final de semana passar 6 vezes o anúncio? Há neste caso,
que encontrar uma relação que possa estimar o volume de vendas com base no número de
comerciais mostrados no final de semana. Esta técnica chama-se análise da regressão.
Como o diagrama de dispersão em relação aos dados mostra uma relação aproximadamente
linear entre as variáveis, pode-se estimar numa recta para prever o comportamento de vendas (y)
quando o número de anúncios (x), varia.
A equação da recta é dada por C. O modelo de regressão simples expressa-se como
y  ax  b   . Onde “  ” é a variável residual que descreve os efeitos de y não explicados por x.
Como se pode notar, entre os pontos do diagrama podem ser traçadas várias rectas . a recta
traçada pelo método dos mínimos quadrados é aquela cujas distâncias entre a recta estimada e
os valores observados são mínimos; mais exactamente, fornece valores de a e b que minimizam
a soma dos quadrados dos desvios entre os valores observados e os estimados da variável
n
dependente, isto é, procura-se a e b tal que minimizam a soma  y i  yˆ ; onde yˆ é o valor
78

i 1
estimado.
Page

Usando este método, os valores de a e b são:


n

S xy  x i  x  y i  y 
a 2
 i 1
n
; b  y  ax
S   xi  x 
2
x
i 1

Usando as fórmulas acima, determine os coeficientes a e b e componha a equação de regressão,


substituindo os valores encontrados na equação y  ax  b .
Neste caso terá y  4.95x  36.15
Assim, para 6 comerciais: y  4.95x6  36.15  65.85

COEFICIENTE DE DETERMINAÇÃO

O coeficiente de determinação fala do poder explicativo do modelo, istoé, até que ponto a
variação da variável dependente y é explicada pela variação da variável independente x. hoje em
dia discute-se muito a regressão múltipla, em que se constróium modelo linear, com mais de
uma variável independente.
O coeficiente de determinação calcula-se: R 2  r xy
2

Por exemplo, o coeficiente de determinação nos permite responder a questão: qual é a eficácia
com que a equação y  ax  b aproxima os dados?
Para o caso do gerente: R 2  r xy  0,932  0,8649
2

O que significa que apenas 86% da variação das vendas é explicada pela variação do número de
anúncios. Os resgtantes 14%, podem ser explicados por outras variáveis ligadas às vendas, como
por exemplo a renda.

Sumário

No estudo de uma distribuição bidimensional, procura-se saber se existe alguma relação entre as
duas variáveis
A relação entre as variáveis pode ser positiva ( a um aumento dos valores de uma variável,
corresponde também um aumento nos valores da outra variável) ou negativa (a um aumento dos
valores de uma variável, corresponde a uma diminuição dos valores da outra).

O valor da covariância permite saber se a relação entre as variáveis é positiva ou negativa. Se o


valor da covariância for positivo, a relação é positiva, se a covariância for negativo, a rela,cão é
negativa.
O coeficiente de correlação linear é uma medida descritiva que avalia o tipo e a intensidade
(magnitude) de uma relação.
O coeficiente de correlação varia entre -1 a +1. Valores próximos dos extremos indicam uma
79

associação forte entre as variáveis.


Page
A recta de ajustamento aos pontos da nuvem chama-se recta de regressão.
O modelo de regressão simples expressa-se como y  ax  b   . Onde “  ” é a variável residual
que descreve os efeitos de y não explicados por x.

A principal vantagem da recta de regressão é, permitir determinar uma estimativa do valor de


uma das variáveis conhecido o valor da outra variável.

O coeficiente de determinação fala do poder explicativo do modelo, istoé, até que ponto a
variação da variável dependente y é explicada pela variação da variável independente x.

Exercicios
1.Que tipo de correlação espera encontrar entre:
a) Nota de Física e nota de Matemática;
b) Nota de Estatísticae altura do estudante;
c) Nível económico da mulher e taxa de divórcio;
d) Nível de consumo e asalário;
e) Altura e peso;
f) Preço do produto e nível de consumo do mesmo.

2.Mediu-se a altura de uma amostra de 5 meninos ( em polegadas) na idades de 6 an0s e


novamente na idade de 20 anos. A tabela seguinte mostra os resultados obtidos:

Altura na 40 43 40 40 42
idade de 6
anos
Altura na 68 74 70 68 70
idade de 20
anos
Determine o coeficiente de correlação entre as duas categorias de alturas.

3.uma companhia estabeleceu diferentes preços para 8 regiões diferentes. A tabela abaixo mostra
o número de aparelhos vendidos em unidades e o preço correspondente em centenas de dólares.
Vendas 420 380 350 400 450 380 450 420
preço 5,5 6,0 6,5 6,0 5,0 6,5 4,5 5,0
a)Estime a equação de regressão linear das vendas pelo preço.
b)Qual o efeito que se espera nas vendas quando o preço sobe 100,0?
80
Page
Exercicios de auto avaliaçao

1. A tabela junta apresenta uma distribuições das classificações dos alunos de duas
turmas de História do 2ºano.
a) Qual o significado de  fi e  fi  xi ?
b) Calcule a média, mediana, a moda e os quartis;
c) Calcule a variância e o desvio padrão
d) Construa um diagrama de extremos e quartis e interprete-o.
e) Qual é a percentagem de alunos com classificação igual ou inferior a 9?
f) Qualé a percentagem de alunos com classificação superior a 10.
Classificções 6 7 8 9 10 11 12 13 14 15 16
Efectivos 3 9 6 12 13 5 4 3 2 1 8
2. uma mesma prova de Estatistica foi aplicada em quatro turmas diferentes
obtendo-se as seguintes notas:
Turma A:
9 5 8 8 7 6 6 7 5,5 7,5 4,5 8 4,5 4,5 4 7 7 4,5 4,5.
Turma B:
5,5 6 2 5,5 6,5 6 5 9 5,5 5 7 8 3 4,5 3,5 6,5 3 6,5.
Turma C:
8 7 6,5 7,5 6,5 7 9,5 5 4,5 9 8,5 4,5 4,5 4 4,5 4,5 4,5.
Turma D:
2,5 4 4,5 5 6 7,5 7 5,5 9 9 8 6,5 4,5 7 6,5 7 7,5
Calcule:
a) nota média de cada turma;
b) desvio-padrão das notas;
c) coeficiente de variação(Pearson)
baseando no item C, qual turma apresentou melhor desempenho?

3. sabendo-se que o ponto médio da primeira classe (x1) é 46,5 e o ponto médio da
quinta classe (x5) é 82,5 e, sabendo se ainda que as freuências absoluta da
primeira à última classe são respectivamente, 9; 5; 15; 7; 2; determine:
a) Amplitude total
b) Amplitude dos 50% centrais para essa distribuição
c) Desvio médio
d) Desvio-padrão
e) Coeficiente de variação de Pearson.
4. usaram-se duas balanças diferentes para efectuar 5 pesagens de uma mesma
pessoa, tendo se obtido os resultados seguintes em kg:
Balança A: 71,82 71,86 71,89 71,85 71,84
Balança B: 71,85 71,86 71,84 71,85 71,83
a) calcule a média e o desvio-padrão para cada um dos grupos de dados;
b) escolha, justificando, das duas balanças aquela que é mais fiável.
5. No final do primeiro período, a Rosa e o André tiveram as classificações
81

indicadas ao lado.
a) verifique que a médiadas classificações da Rosa é igual à média das classificações
Page

do André.
b) determine para as classificações da Rosa e do André, a amplitude e o desvio-padrão.
c) justifique que, de entre as medidas de dispersão calculadas na alínea anterior, o
desvio- padrão é a que melhor caracteriza a dispersão das classificações.
Rosa: 16 10 11 13 13 11 15 15 13
André:12 10 16 1410 12 14 16 13

6. A tabela seguinte mostra os resultados de um estudo sobre os acidentes


rodoviários numa dada localidade e o período do dia a que ocorreram.
Horas Percentagem
de acidentes a) determine a média e a classe modal.
0-3 5,1% b) Localize, graficamente,os quartis.
c) De entre as medidas calculadas, quais teriam sido escolhidas para
3-6 5,7% divulgacão num programa de prevencão rodoviária?
6-9 11,2%
9-12 9,7%
12-15 16,2%
15-18 20,6%
18-21 22,2%
21-24 9,3%

7. . para a seguinte distribuição mostre que 5% dos valores estão fora do intervalo
 
x  4 ; x  4 . Faça um comentário acerca da situação.
Xi fi
1 1
2 0
3 77
4 0
5 3

8. Realizaram-se entrevistas a 600 pessoas sobre o interesse de um programa


televisivo, utilizando uma escala de 0 a 100. a média obtida foi de 31 e o desvio-
padrão de 5,4. sabendo que a distribuição é unimodal e ligeiramente assimétrica,
calcule, aproximadamente, quantos dos 600 entrevistados atribuiram ao programa
pontuaão entre 25,6 e 36,4.

9. Num período, um professor deu dois testes a uma turma. No primeiro teste a
média foi de 14 e o desvio-padrão de 3. no segundo teste, a média foi de 13 e o
desvio parão de 1. O Pedro obteve 16 no primeiro teste e 15 no segundo.
Justifique que a nota do Pedro no segundo teste, relativamente à turma , é superior

à nota obtida no primeiro.(faça referência ao intervalo x   ; x   ). 
10. Uma cadeia de 10 lojas comparou as vendas nos períodos natalicios dos anos 97 e
98, tendo concluido que as vendas subiram em qualquer das lojas; as percentagens
de subida foramas seguintes( cada % refere-se a uma loja): 10,2 3,1 5,9 7,0
3,7 2,9 6,8 7,3 8,2 4,3.
82

a) calcule a percentagem média de crescimento das vendas.


Page

b) calcule a mediana e os quartis Q1 e Q3.


c) calcule e interprete o percentil 80.
Calcule a variância, o desvio médio e o desvio-padrão.

11. um psicólogo aplicou um teste de inteligência a 60 alunos de uma escola


secundária e agrupou os resultados em classes como mostra a tabela:
Q1 93-98 98-103 103-108 108-113 113-118 118-123 123-128 128-133
Número de 2 5 12 17 14 6 3 1
alunos
a) faca o poligono de frequências;
b) determine a classe modal, a média e o desvio-padrão.
c) determine a mediana, moda, Q1, Q3, P20 e P90.

12. .Numa fabrica fez-se um teste a 150 lâmpadas e registou-se a seguinte


informação:
Número de 5 10 42 75 18
lâmpadas
“Duração de [0, 300[ [300, 600[ [600, 900[ [900, 1200[ [1200, 1500[
vida “ em
horas
a)utilize um histograma e um poligono de frequências para representar esta informação.
b) construa uma tabela de frequências acumuladas;
c) qual é a percentagem de lâmpadas com “ duração de vida” inferior a 900horas?
d) determine a duração média de vida desta amostra de lâmpadas.
e) determine a moda, a mediana e os quartis desta distribuição;
f) calcule o desvio-padrão.

13. um comerciante de temperos está curioso sobre a grande variação nas vendas de
loja para loja e acha que o volume das vendas está associado ao espaço nas
prateleiras dedicados a sua linha de produto em cada ponto de venda. Dez lojas
foram seleccionadas ao acaso em todo país e, duas variáveis foram medidas: (x)
total de espaço em frente ( comprimento x altura em cm2) dedicados a sua linha
de produtos e (y) total das vendas dos produtos em meticais no último mês.
X 340 230 405 325 280 195 265 300 350 310
y 71 65 83 74 67 56 57 78 84 65
Construa um diagram de dispersão e determine o coeficiente de correlação.

14. De acordo com algumas teorias, o consumo de quantidades moderadas de vinho tinto
reduzirá o perigo de ataques cardíacos. Num estudo em que se envolveu 19 países desenvolvidos,
em 1989, obteve-se a seguinte recta de regressão: y  260,56  22,969 x . Y- taxa de mortalidade
por ataque cardíaco; é o número de habitantes mortos por 100 000 habitantes; x- número de litros
de vinho consumidos por habitante.
a) trace a recta de regressão;
b) estime a taxa de mortalidade por ataque cardíaco num país em que se consome em média 5
litros.
c) se o consumo sobe um litro, o que acontece com a taxa de mortalidade?
83
Page
15. os dados que se seguem indicam a relação existente entre x, que representa a
densidade específica duma amostra de madeira, e y, que representa a pressão
máxima que a referida amostra pode suportar.
Xi 0,41 0,46 0,44 0,47 0,42 0,39 0,41 0,44 0,43 0,44
yi 1850 2620 2340 2690 2160 1760 2500 2750 2730 3120

a)trace o gráfico referente aos dados;


b)Estime os coeficientes de regressão;
c)Preveja a pressão que uma amostra que uma amostra de madeira suporta quando a sua
densidade específica é 0,43.

84
Page
Unidade 2

Teoria Elementar de Probabilidades e Distribuições


Introdução
Na unidade anterior, afirmou-se que o objectivo fundamental da estatística, é o de caracterizar
uma população, conhecendo-se apenas parte dela, actividade impossível sem que o resultado
esteja associado a uma incerteza.
Nesta unidade, você vai fazer um estudo sobre o método que dará a medida do grau de incerteza,
ferramenta básica para a inferência estatística.
Ao completar esta unidade, você será capaz de:

 Definir o conceito probabilidade;


 Descrever os tipos de evento;
Objectivos
 Definir classicamente a probabilidade de ocorrência de um
evento;
 Descrever os teoremas básicos da teoria de probabilidade;
 Caracterizar a distribuição de densidade de probabilidade de
uma variável aleatória.
 Diferenciar as distribuições: normal, qui- quadrado e t-
Student;

85
Page
Nesta lição, você deverá prestar muita atenção aos seguintes termos e
conceitos:
 Probabilidade;
Terminologia  Espaço amostral;
 Evento;
 Teorema de probabilidade total;
 Teorema Bayes.
 Distribuição normal, student e qui-quadrado;
 Experimentos aleatórios

Licao No 1

2.1 Teoria Elementar de Probabilidades

2.1.1 Origem das Probabilidades

Historicamente, a teoria de Probabilidades como ramo de Matemática que estuda as leis que
regem os fenómenos aleatórios, isto é, aqueles fenómenos cujos resultados variam de modo
imprevisível de experiência para experiência, surgiu por volta do sec.XVII, baseada
principalmente nos jogos de azar, muito em voga n a época, como a roleta e as cartas. Graças aos
trabalhos dos cientistas franceses Fermat(1601-1665),Pascal(1623-1662) e Huygens(1629-1695).
Depois do seu surgimento, a teoria das probabilidades desenvolveu-se
rapidamente através dos trabalhos de Jacques Bernoulli(1654-1705), Moivre(1667-1754) e do
reverendo Thomas Bayes (1702-1761).

2.1.2.Termos e Conceitos Probabilisticos

A contecimentos Aleatórios e Acontecimentos Deterministas


Consideremos duas experiências seguintes:
1ª) “a tirar uma pedra ao mar”.
Ja sabemos qual é o resultado mesmo antes de a efectuarmos. A pedra vai para o fundo.

2ª) ´´lançar uma moeda para cima``.


86

Não podemos afirmar se sai cara ou coroa.


Page
A 1ª experiência chama-se determinista ou causal. Pois, experiências deterministas ou causais
caracterizam-sepor produzirem o mesmo resultado, desde que sejam repetidas sob as mesmas
condições.
A 2ª experiência chama-se aleatória ou casual. As experiências aleatórias ou casuais
caracterizam-se pela impossibilidade de prever o resultado que se obtém, ainda que as
experiências sejam realizadas nas mesmas condições.
Os fenómenos aleatórios constituem o objecto de estudo das probabilidades.

Espaço Amostral. Eventos


Chama-se espaço amostral, ao conjunto formado por todos resultados possíveis de uma
experiência aleatória. E representa-se por S, U ou Ω.
Ex.1: Na experiência de lançamento de uma moeda, os resultados possíveis são:S= ca, co,

Ex.2: lançar simultaneamente duas moedas e observar as faces que ficam voltadas para cima.
Temos:S= caca , caco, coca , coco

Ex.3: lança-se um dado honesto e observa-se a face voltada para cima:


S  1,2,3,4,5,6

Eventoé qualquer subconjunto do espaço amostral S.

Tipos de Eventos

1. Evento Elementar – se o resultado de uma experiência consta de um só elemento do


espaço amostral. A  caca
2. Evento Composto- se o resultado de uma experiência consta de dopis ou mais elementos
do espaço amostral. B  caca , caco
3. Evento Impossível- se o resultado de uma experiência não tem qualquer elemento do
espaço amostral. C   
Ex. Sair 8 no lançamento de um dado honesto, é impossível porque só vai até ao nº6 e não
mais.

4. Evento Certo-se o resultado de uma experiência consta de todos os elementos do espaço


amostral.
Podemos combinar eventos para formar novos eventos, usando as diversas operações sobre
conjuntos:
5. Evento Complementar A - é evento que ocorre se A não ocorre.

Ex. Lança-se duas moedas simultaneamente e observa-se as faces voltadas para cima e
S  caca, caco, coca , coco, A  caca duas cara
Todos os outros eventos de S, que não fazem parte de A, são denominados de eventos
complementares de A. Assim, A  coco, coca , caco e AU A  S mas A  A  
87
Page
6. Eventos Mutuamente Exclusivos ou Disjuntos ou Incompatíveis – se a sua verificação
simultânea for um evento impossível ou seja A  B   , neste caso, os eventos A e B não
podem ocorrer simultaneamente.

Ex. No lançamento de um dado honesto; S  1,2,3,4,5,6, seja A  2 e B  3,4,5,6


A e B são mutuamente exclusivos, pois, A  B   .Além disso, A  B  S
NB: se A  B  S , dizemos que estes são mutuamente exclusivos e exaustívos.

7. Eventos Independentes- quando a ocorrência de um não afecta a probabilidade de


ocorrência de outros. Caso contrário, diz-se Eventos dependentes.

Ex. Se no lançamento de duas moedas simultaneamente tivermos


S  caca , caco , coca , coco  os resultados da experiência são totalmente independentes
de uma moeda para outra.

8. Eventos Condicionados-quando associamos dois ou mais eventos a um experimento


aleatório qualquer dizemos que eles são condicionados ou vinculados desde que o
aparecimento de um evento A qualquer dependa do aparecimento de outro evento B do
mesmo experimento.

Ex. Seja o experimento que consiste na retirada de duas cartas vermelhas de um baralho
comum de 52 cartas. Ora, na 1ª retirada temos 26 cartas vermelhas em um total de 52 cartas.
Quando retiramos a 2ª carta admitindo-se que ela seja vermelha, temos somente 25 cartas em
um total de 51 cartas, visto que na 1ª retirada a carta não foi recolocada novamente no
baralho. A ocorrência da 2ª carta está vinculada ou condicionada no aparecimento da 1ª
carta. Neste caso, estamos diante de um evento condicional.

9. Evento Soma- é o evento que ocorre se , e somente se, A ocorre ou B ocorre (ou ambos);
isto é: A  B  A  B

Ex. A  6,7 e B  3,4,5,6,7, A  B  A  B  3,4,5,6,7

10. Evento Produto- evento que ocorre se, e somente se, A ocorre e B ocorre; isto é:
A  B  A* B

Ex. A  5,6,7,9 e B  4,5,8,10, A  B  A * B  5

2.1.3 Definição Clássica de Probabilidade

A primeira definição que se conhece de probabilidade foi


enunciada por Pierre Simon Laplace( 1749-1827)
88

Historicamente a probabilidade P de um evento A era definida como se segue:


Page
Se n(A)=nº de casos favoráveis ao evento A e n(S)=nº total dos casos possíveis(S), desde que
igualmente provável(equiprovável), então, a probabilidade(sucesso) da ocorrência de um
experimento A, é igual ao quociente entre o nº de casos favoráveis ao evento e o nº de casos
n( A)
possiveis (S). Ou seja: P( A)  Lei de Laplace
n( S )

Ex1. Lancemos um dado honesto e observemos o nº em cima.


a) qual é a probabilidade de sair o nº 3?
b) qual é a probabilidade de sair um nº par?

Resolução:
a) só há um caso favorável de sair o nº 3 dos 6 possíveis,isto é: S  1,2,3,4,5,6 e A  3
1
por isso a probabilidade de sair 3 é P( A)  ou seja 16,7%.
6
Note que os restantes nºs têm a mesma chance de ocorrer, o que significa que têm a mesma
probabilidade.

b) um nº par pode ocorrer de 3 maneiras (casos favoráveis) de 6 maneiras igualmente prováveis.


B  2,4,6
3 1
Assim, P( B)    0,5 ou seja 50%.
6 2
Ex2. Uma bola é retirada ao acaso de uma urna que contém 6 vermelhas, 4 brancas e 5 azuis.
Qual é a probabilidade dela ser vermelha?
6 6 2
. P( A)     0,4 ou 40%.
6  4  5 15 5

2.1.4 Noções Básicas de Análise Combinatória

(Factorial, Permutações, Arranjos e Combinações)

1.Notação Factorial
O produto dos inteiros positivos de 1 a n, inclusive, (ou seja de n a 1), é indicado por n! (lê-se n
factorial):
n!=n(n-1)(n-2)......3.2.1 NB: 1!=1 e 0!=1
Ex.1: 3!=3.2.1=6
5!=5.4.3.2.1=120
89
Page
8! 8.7.6.5.4!
Ex.2:   8.7.6.5  1680
4! 4!

Ex.3:Simplificar:
nn  1n  2!
 nn  1  n 2  n
n!
a) 
n  2! n  2!

n!n  2! nn  1n  2!n  2! n  2!nn  1  1 n 2  n  1


b)   
n  1! n  1n  2! n  1n  2! n 1

2.Permutações
Qualquer agrupamento de um conjunto de n objectos numa dada ordem é denominado uma
permutação dos objectos(tomados todos de uma vez).Potrtanto o número de permutações que se
pode ter num conjunto de n objectos, é :Pn=n!

Ex. Consideremos o conjunto das letras a,b,c e d. Então, bdca, dcba e acdb são permutações das
4 letras(tomadas todas de uma só vez).Mas com as 4 letras podemos formar 4! Permutações.isto
é, P4=4!=4.3.2.1=24 permutações.
Permutações Circulares: o número de maneias dedispor n objectos distintos em torno de um
circulo é n  1!

3. Permutações Com Repetição


Teorema:o número de permutações de n objectos, dos quais n1 são iguais entre si, n2 outros são
n!
iguais entre si, ..., nr outros são iguais entre si, é: Pn 
n1!n2 !...nr !
Esta expressão também fornece o número de divisões possíveis de n objectos distintos em r
grupos distintos de tamanhos respectivamenten1, n2,n3,….,nr (n1+ n2+n3+….+nr=n) Ex1: Quantas
palavras de 7 letras podem ser formadas usando as letras da palavra BENZENO?
Queremos encontrar o número de permutações de 7 objectos, dos quais 2 são iguais entre si (os
dois E) e 2 outros são iguais entre si (os dois N). Pelo teorema anterior, existem
7! 7.6.5.4.3.2!
  7.6.5.2.3  1260 tais palavras.
2!2! 2.1.2!

3.Arranjos
Todo o agrupamento de quaisquer r  n destes objectos numa dada ordem é denominado um r-
arranjo ou um arranjo dos n objectos tomados r de cada vez (ou tomados r a r).
O número de arranjos de n objectos, tomados r a r, é indicado por A(n,r), nAr, An,r ou Arn.
n!
e calcula-se: A(n, r )  nr
n  r !
Ex1:Consideremos o conjunto das letras a,b,c e d. Então,
 bad, adb, cbd e bca são arranjos das 4 letras tomadas 3 a 3.
 ad, cb,da e bd são arranjos das 4 letras tomadas 2 a 2.
90
Page
4!
Mas em A(4,3)=  4.3.2.1  24 arranjos das 4 letras tomadas 3 a 3.
4  3!
4! 4.3.2!
A(4,2)    12 arranjos das 4 letras tomadas 2 a 2
4  2! 2!
Ex2: De quantas maneiras diferentes uma organização contendo 26 membros pode eleger um
presidente, um secretário e um tesoureiro ( supondo que nenhuma pessoa seja eleita mais de um
cargo)?
O presidente pode ser escolhido de 26 modos diferentes; a seguir, o secretário pode ser eleito de
25 modos diferentes, uma vez que a pessoa escolhida para presidente não pode ser eleita para
cargo de secretário; em seguida o tesoureiro pode ser escolhido de 24 modos diferentes. Assim
pelo principio de contagem, existem 26.25.24=15 600 maneiras diferentes de a organização
eleger seus funcionários.
Usando a fórmula de arranjos teremos: A26,3 
26! 26.25.24.23!
  26.25.24  15600
26  3! 23!

Ex3: determiar n  N sabendo que: A4n  42  A2n


nn  1n  2n  3n  4!
 nn  1n  2n  3
n!
Sabemos que A4n   e
n  4! n  4!
nn  1n  2!
 nn  1 isto significa que:
n!
A2n  
n  2! n  2!
nn  1n  2n  3 =42 nn  1  n  2n  3 =42  n 2  5n  6  42  n 2  5  36  0 ,
usando a fórmula resolvente das equações quadráticas ou o teorema de Viet, temos n1=9 e n2=-4
mas sabemos ainda que n  1 ou seja, n  N , significa que a resposta é, n=9.

4.Combinações
Consideremos uma coleção qualquer de n objectos. Uma combinação desses n objectos, tomados
r a r, é uma selecção qualquer de r dos objectos em que a ordem não interessa. Em outras
palavras, uma r-combinação de um conjunto de n objectos é qualquer subconjunto com r
elementos.

Ex. As combinações das letras a,b,c,d tomadas 3 a 3 são: abc, abd, acd, bcd.
Observemos que as combinações seguintes são iguais: abc, acb, bac, cab, cba, isto é, cada uma
delas indica o mesmo conjunto abc.
n
O número de combinações de n objectos tomados r a r, é indicado por C(n,r); nCr; Cn,r ;   ou
r
n
C r
An, r  n!
C 
n
 ;(n  r ) e é chamado um coeficiente binomial. Estes números podem ser
r
r! n  r !r!
arrumados em uma disposição triangular, o famoso triângulo de Pascal.

Nota:1. O número de modos de escolher p objectos entre n objectos distintos dados, podendo
91

 p  n 1 
repetir a escolha, é   . Esse é o chamado número de combinações completas (ou com

Page

 n 1 
repetição). Esta fórmula é usada também p.ex. se, se pretende conhecer o número de maneiras de
distribuir p moedas idênticas a n crianças.
2.O número de maneiras de distribuir p moedas idênticas a n crianças de forma que cada
 p 1 
criança receba pelo menos uma moeda é  
 n 1 

Ex.1: Numa organização de 26 membros precisa-se de 3 membros para participar num debate
sobre a homoxesualidade. Quantas comissões diferentes podem ser formadas?

26! 26.25.24.23!
C(26,3)=   2600 comissões diferentes podem ser formadas de 3
26  3!3! 23!.3.2.1
membros.
Ex2: um fazendeiro compra 3 vacas, 2 porcos e 4 galinhas de um homem que possui 6 vacas, 5
porcos e 8 galinhas. Quantas escolhas tem o fazendeiro?
6.5.4 5.4 8.7.6.5
R: O fazendeiro tem: C36 .C 25 .C 48  . .  14.000 escolhas
3.2.1 2.1 4.3.2.1

Ex2: Duas cartas são retiradas ao acaso, de um baralho comum de 52 cartas. Calcular a
probabilidae P de que:
a) ambas sejam de espadas;
b) uma seja de espada e outra de copas.

Resolução:
a) existem C252  1326 maneiras de se tirar 2 das 52 cartas.
E existem C213  78 maneiras de se retirar 2 das 13 cartas de espadas, logo:
78 3
P 
1326 51

b) como existem 13 cartas de espadas e 13 de copas, existem 13.13= 169 maneiras de se


169 13
retirar uma carta de espadas e uma de copas; portanto, P   .
1326 102

92
Page
Exercicios para auto avaliaçao

1-Simplificar:
a)
n  2! b)
n!
c)
n  1! d)
n  1! e)
n  1! f)
n!
g)
n  r  1!
n! n  1! n  1! n  2! n! n  2! n  r  1!

h)
2n  2! i)
n  1!n!
2n ! n  1!
2.Calcule:
A25
a) A33  A45 b) c) A35  2A23
A24

3. Indique justificando o valor lógico de :


a) C410  C610 b) C615  C615  C515

4. Mostre que:
n3  n
a) A34  A23  30 b) C nn2  C nn3 
3!

5. Determine o valor natural n para o qual:


a) A2n  72 b) Cn101  Cn101 c) A3n1  A4n d) 3C3n1  7C2n e) 2 A2n  50  A22n
f) 7 A3n  9A3n1  A2n2 

Problemas:
1. De quantas maneiras diferentes se podem sentar 5 pessoas num banco de 3 lugares?

2.Um grupo de cinco amigos decide ir ao cinema. Neste grupo temos o João e a Maria. De
quantas maneiras se podem sentar os cinco se:
a) o João e a Maria decidem ficar lado a lado;
b) o João não quer ficar junto com a Maria. 93
Page
Soluções

1.a) n  2n  1  n  3n  2 b) n c) n.n  1  n  n d) n  2n  1 n  n  3n  2n


2 2 3 2

f) n.n  1  n  n g) n  r  1n  r  h) 2n  22n  1  4 n  6n  2


2 2
e) n+1

i) n.n  2  n  2n
2

2.a) 126 b) 5/3 c)48


3. a) V b) F
5. a) 9 b) 5 c)5 d) 6 e) N ( Não existe em N) f) 10

Problemas:
1. 60
2. a) 48 b) 72

94
Page
2.1.4 Teoremas Básicos de Probabilidades

1º) para btodo o evento A, a probabilidade da sua ocorrência será sempre um valor
compreendido entre zero e um, ambos limites incluidos ou seja: 0  P( A)  1 .

P(A) será igual a zero quando for um evento impossível.


Ex1. A probabilidade de ocorrência de uma face voltada para cima mostrar o valor 9 no
0
lançamento de um dado honesto é impossível. P   0
6
P(A) será igual a um quando for um evento certo.
n( S )
Ex2. Se A é um evento certo, então A  S  S , logo, A=S, assim, P( A)   1.
n( S )

 
2º) se A é um evento complementar de A, então P A  P A  1 ou P A  1  P( A) .

Ex3. Uma bola é retirada ao acaso de uma urna que contém 6 vermelhas, 4 brancas e 5 azuis.
Qual é a probabilidade dela não ser vermelha?

Resolução:
6 6 2
Seja A evento que consiste na retirada de uma bola vermelha. P( A)     0,4
6  4  5 15 5
ou 40%.

E A , o evento de não ser bola vermelha, então: P A  1  P( A)  1 
2 3
  0,6 ou 60%.
5 5

3º) se AUB representa a ocorrência de A ou de B ou de ambas, então:


P A  B  P A  PB  P A  B

Esta regra pode ser alargada para a reunião de três acontecimentos:


P A  B  C   P A  PB  PC   P A  B  P A  C   PB  C   P A  B  C 
Em particular, para eventos mutuamente exclusivos, P A  B   P A  PB  porque
P A  B   0

Se A1 , A2 ,..., An são n eventos mutuamente exclusivos, que tem probabilidades P1 , P2 ,..., Pn ,


respectivamente, a probabilidade de ocorrência de todos eventos é: P  P1  p2  ...  Pn

Ex. Considerando o exercício anterior, determinar a probabilidade da bola retirada ser vermelha
ou branca.
Resolução:
P(A)- probabilidade de ser vermelha P A 
6 2

95

15 5
P(B)- probabilidade de ser branca PB  
4
Page

15
Porque são eventos mutuamente exclusivos P A  B   0
2 4 64 2
P A  B   P A  PB      .
5 15 15 3
Ex2. se A é evento ´´ extracção de um às de um baralho`` e B evento ´´extracção de uma carta de
espada``, então qual é a probabilidade de extracção de um às ou de uma carta de espadas ou de
ambas?

Resolução:
P A  B  
4 13 1 16 4
    A e B não são eventos mutuamente exclusivos visto que
52 52 52 52 13 pode ser extraido o às de espada. Assim:

Obs. P A 
4
( há 4 às de 52 cartas)
52
P B  
13
(há 13 espadas de 52 cartas)
52
P A  B  
1
( nos 4 às 1 é de espadas)
52

4º)Probabilidade Condicional. Eventos Independentes e Dependentes


Se A e B são dois eventos, a probabilidade de B ocorrer, depois de A ter acontecido, é definida
P A  B  P( B)  P A / B 
 
por P B 
A P A

P A
 
ou P B 
A
n 0 elementosA  B
n 0 elementosA

Se a ocorrência ou não de A não afectar a probabilidade da ocorrência de B, então


 
P B  PB  e diz se que A e B são Eventos independentes, no caso contrário, eles são e
A
ventos dependentes.

Se se representar por AB a ocorrência de ´´ambos eventos A e B``, as vezes denominando evento


 
composto, então: P A  B   P A.P B .
A
Em particular para eventos independentes temos P AB   P A.PB  .
Para três eventos A,B e C tem-se: P A  B  C   P A.P B .P C  A A B
 eventos
independentes.

Em geral, se A1,A2,...,An são n eventos independentes que têm respectivamente, as


probabilidades: p1,p2,...,pn, então a probabilidade de ocorrência simultânea de A1,A2,...,An é:
P= P1.P2.P3....Pn

Ex1: seja A e B os eventos ´´cara na 5ª jogada`` e ´´cara na 6ª jogada`` de uma moeda ,


respectivamente. Qual é a probabilidade de ocorrer cara em ambas jogadas?
96

Resolução:
Page
A e B são eventos independentes , de modo que a probabilidade de ocorrer cara em ambas
jogadas, 5ª e 6ª, é, admitindo-se que a moeda é (honesta).
P A  B   P A.PB      0,25  25%
1 1 1
2 2 4

Ex2: suponha que uma urna contém 3 bolas brancas e 2 bolas pretas. Seja A o evento´´a 1ª bola
retirada é preta`` e B o evento ´´a 2ª bola retirada é preta``, não sendo as bolas recolocadas
depois de retiradas. Qual é a probabilidade de ambas bolas retiradas serem pretas?
Resolução:
P  A 
2 2
 é a probabilidade da 1ª bola retirada ser preta enquanto:
23 5
P 
B 
A 3 1 4
1 1
 é a probabilidade da 2ª bola retirada ser preta depois de retirada a 1ª dessa
cor. Então a probabilidade de ambas as bolas retiradas serem pretas é:
 
P A  B   P A. B  . 
2 1 1
A 5 4 10
 0,1  10%

Ex.3: consideremos o lançamento de um par de dados honestos. Se a soma é 6, determinar a


probabilidade de que um dos dados tenha produzido um 2.

Resolução:
Seja, A  soma  6  1,5, 2,4, 3,3, 4,2, 5,1 e B={um 2 aparece em pelo menos um dos
dados}
Determinemos P B .  
A
Ora , A consiste em 5 elementos e dois deles,(2,4) e (4,2), pertencem a B:
 
A  B  2,4, 4,2. Então, P B 
A 5
2

Por outro lado, como B consiste em onze elementos


B  2,1, 2,2, 2,3, 2,4, 2,5, 2,6, 1,2, 3,2, 4,2, 5,2, 6,2e S consiste em 36 elementos,

P B  
11
36

Ex.4: um lote contém 12 peças das quais 4 são defeituosas. Três peças são retiradas ao acaso do
lote, uma após a outra. Determinar a pobabilidade P de que todas as três peças sejam não-
defeituosas.

Resolução :
8
A probabilidade de que a 1ª peça seja não defeituosa é uma vez que 8 das 12 peças são não
12
defeituosas. Se a 1ª peça é não defeituosa, então a probabilidade de que a peça seguinte seja não
7
defeituosa é pois somente 7 das 11 peças restantes são não defeituosas. Se as duas 1ªs peças
97

11,
Page
6
são não defeituosas, então a probabilidade de que a última peça seja não defeituosa é
, uma
10
vez que apenas 6 das 10 peças restantes são não defeituosas. Assim, pelo teorema da
multiplicação,
8 7 6 14
P   
12 11 10 55

Ex.5: considere um grupo constituido de 7 homens e três mulheres. Tendo se scolhido ao acaso
três pessoas, achar a probabilidade destas serem todas do sexo masculino.

Resolução:
Seja A o facto de ser homem a 1ª pessoa escolhida, B a 2ª pessoa e C, a 3ª. A probabilidade do 1º
acontecimento é P A  7 . A probabilidade do 2º acontecimento, à condição de ter ocorrido o
10
1º, isto é, a probabilidade de B relativa a A é P A B    .
6 2
9 3
A probabilidade do 3º acontecimento à condição de terem ocorrido os dois primeiros, isto é, a
probabilidade de C relativa a AB é PAB C   . Pelo teorema do produto, a probabilidade de
5
8
serem do sexo masculino as três pessoas escolhidas é
P A  B  C   P A.P A B .P AB C     
7 2 5 7
.
10 5 8 24

5º ) Fórmula de probabilidade Total


Seja {B1,B2, …., Bn}uma partição do espaço amostral S em eventos de probabilidade
positiva.Então, para qualquerevento A,
P A  PB1   P A B1   PB2   P A B2   ....  PBn P A Bn    PBi  P A Bi 

6º ) Fórmula de Bayes (1763)


Seja {B1,B2, …., Bn}uma partição do espaço amostral S em eventos de probabilidade positiva. Se
A é um evento com P A  0 , então, para todo j  1,..., n,

PB j  PA B j 
PB j A  n

 P B   P  A B 
i 1
i i

Esta fórmula é uma consequência imediata da definição de probabilidade condicional e do

teorema das probabilidades totais.

A fórmula de Bayes tem a seguinte interpretação. Seja A um acontecimento que se realiza se e só


98

se um dos acontecimentos mutuamente exclusivos, Bi (i=1,2,…), se realiza. Os Bitomam o nome


Page
de << causa>>. A fórmula de Bayes dá então a probabilidade de que o acontecimento A que

ocorreu seja o resultado da causa Bj. a probabilidade P(Bj) toma o nome de “probabilidade” à

priori da <<causa>> Bj, P(Bj/A) é a probabilidade à posteriori, isto é, a probabilidade de Bj

calculada após a informação de que A se realizou.

Ex. O gerente de um restaurante classifica os seus clientes em três categorias. Bem vestidos 50%,
Moderadamente vestidos40% e Mal vestidos 10%. 70% dos Bem vestidos, 50% dos
Moderadamente vestidos e 30% dos Mal vestidos pedem um vinho ao entrar no restaurante.
a)Qual é a probabilidade de um cliente escolhido aleatoriamente peça um vinho;
b) se se pedir um vinho, qual é a probabilidade de que o cliente que o pede esteja bem vestido?

Resolução:
Dados:
P(BEV)= 0,5; P(MOV)=0,4; P(MAV)= 0,1;P(V/BEV)= 0,7; P(V/MOV)= 0,5
P(V/MAV)=0,3;

a)P(V)=?

P(V)= P(BEV)*P(V/BEV)+P(MOV)*P(V/MOV)+P(MAV)*P(V/MAV)=
= 0,5*0,7+0,4*0,5+0,1*0,3= 0,35+0,2+0,03= 0,58

b)P(BEV/V)=?

PBEV  PV BEV  0,5  0,7


PBEV V     0,60
P(V ) 0,58

Sumário
A primeira definição que se conhece de probabilidade foi enunciada por Pierre Simon Laplace(
1749-1827)
Historicamente a probabilidade P de um evento A era definida como se segue:
Se n(A)=nº de casos favoráveis ao evento A e n(S)=nº total dos casos possíveis(S), desde que
igualmente provável(equiprovável), então, a probabilidade(sucesso) da ocorrência de um
experimento A, é igual ao quociente entre o nº de casos favoráveis ao evento e o nº de casos
99

n( A)
possiveis (S). Ou seja: P( A)  Lei de Laplace
Page

n( S )
Teoremas Básicos de Probabilidades
1º) para btodo o evento A, a probabilidade da sua ocorrência será sempre um valor
compreendido entre zero e um, ambos limites incluidos ou seja: 0  P( A)  1 .
 
2o) A é um evento complementar de A, então P A  P A  1 ou P A  1  P( A)
3º) se AUB representa a ocorrência de A ou de B ou de ambas, então:
P A  B  P A  PB  P A  B
Em particular, para eventos mutuamente exclusivos, P A  B   P A  PB  porque
P A  B   0
Se A1 , A2 ,..., An são n eventos mutuamente exclusivos, que tem probabilidades P1 , P2 ,..., Pn ,
respectivamente, a probabilidade de ocorrência de todos eventos é: P  P1  p2  ...  Pn
4º)Probabilidade Condicional. Eventos Independentes e Dependentes
Se A e B são dois eventos, a probabilidade de B ocorrer, depois de A ter acontecido, é definida
P A  B  P( B)  P A / B 
 
por P B 
A P A

P A
ou P B 
A
 
n 0 elementosA  B
n 0 elementosA

Se a ocorrência ou não de A não afectar a probabilidade da ocorrência de B, então


 
P B  PB  e diz se que A e B são Eventos independentes, no caso contrário, eles são e
A
ventos dependentes.

Se se representar por AB a ocorrência de ´´ambos eventos A e B``, as vezes denominando evento


 
composto, então: P A  B   P A.P B .
A
Em particular para eventos independentes temos P AB   P A.PB  .
Em geral, se A1,A2,...,An são n eventos independentes que têm respectivamente, as
probabilidades: p1,p2,...,pn, então a probabilidade de ocorrência simultânea de A1,A2,...,An é:
P= P1.P2.P3....Pn.
5º ) Fórmula de probabilidade Total
Seja {B1,B2, …., Bn}uma partição do espaço amostral S em eventos de probabilidade
positiva.Então, para qualquerevento A,
P A  PB1   P A B1   PB2   P A B2   ....  PBn P A Bn    PBi  P A Bi 

6º ) Fórmula de Bayes (1763)


Seja {B1,B2, …., Bn}uma partição do espaço amostral S em eventos de probabilidade positiva. Se
A é um evento com P A  0 , então, para todo j  1,..., n,

PB j  PA B j 
PB j A  n

 P B   P  A B 
i 1
i i
100

Esta fórmula é uma consequência imediata da definição de probabilidade condicional e do


Page

teorema das probabilidades totais.


Exercicios de Auto-Avaliação

1. O nº de de pessoas e o tipo de tarefa a desempenhar em determinada comissão


pode ser ou não diferenciada.
Num Centro de Saúde e para determinar turno do dia, achou se conveniente considerar
grupos de 5 pessoas , escolhidas entre 4 administrativos, 10 enfermeiros e 7 médicos.
Quantos grupos podem ser formados se se considerar apenas um administrativo e os restantes
elementos serem:
a) escolhidos entre enfermeiros e médicos;
b) dois enfermeiros e dois médicos;
c) pelo menos dois enfermeiros.

2. Num congresso participam 60 congressistas, 50 falam inglês e 40 falam francês.


a) indique, justificando, o nº de congressistas que falam simultaneamente as duas linguas;
b) determine a probabilidade de dois congressistas, escolhidos ao acaso, não se entenderem;

3. um teste de Biologia é constituido por 12 questóes.


De quantas maneiras um aluno pode resolver o teste se tiver de responder a 8 perguntas:
a) sem restrição;
b) se tiver de responder obrigatoriamente às 5 primeiras perguntas;
c) se tiver de responder pelo menos três das seis primeiras perguntas;
d) se as últimas 4 questões do teste forem de desenvolvimento e tiver de escolher
obrigatoriamente duas.

4. Uma operação cirúrgica exige a formação de uma equipa, em que cada elemento
tem a sua função específica. Suponha-se que para determinado tipo de intervenção
cirúrgica se dispõe de: 2 cirurgiões, 3 anestesistas, 5 enfermeiros e 4 técnicos. Se
são necessários 2 cirurgiões, 1 anestesista, 2 enfermeiros e 1 técnico:
a) indique quantas equipas podem ser formadas?
b) Se por dia são realizadas no máximo 4 operações, ao fim de quantos dias volta a estar a 1ª
equipa em exercício?

5. uma olaria faz a entrega de uma encomenda de 30 peças, 5 das quais com
imperfeições. A aceitação da encomenda, por parte do comprador, leva à
verificação da mesma. O comprador retira ao acaso, 10 peças. Qual é a
probabilidade de:
a) não encontrar nenhuma peça defeituosa?
b) Encontrar uma peça defeituosa?
101

c) Enontrar duas peças defeituosas?


d) Aceitar a encomenda com 4 peças defeituosas?
Page

6. Considere a palavra BARCO


a) quantas sequências podemos formar com três letras distintas da palavra dada? Quantas
dessas sequências começam por R?
b) Quantas sequências podemos formar com todas as letras dadas? Quantas dessas
sequências têm as consoantes todas juntas?

7. Quantas palavras de igual nº de letras podem ser formadas usando as letras das
palavras:
a) lhes b) isso c) radar d) abacate
8. De 100 estudantes, 30 estão estudando Matemática, 20 estão estudando Música e
10 estão estudando matemática como música. Se um estudante é selecionado ao
acaso, achar a probabilidade P de que ele esteja estudando Matemática ou Música.

9. Os finalistas de uma escola fizeram uma rifa, emitindo para tal, 1000 bilhetes.
Desses bilhetes, um permitia ganhar 10 000 Mt , 5 permitiam ganhar 1000Mt, 10
permitiam ganhar 100Mt e os restantes não permitiam ganhar nada. Determinar a
probabilidade de uma pessoa detentora de um único bilhete ganhar pelo menos
100Mt.

10. um atirador atinge o alvo, em cada uma das três zonas, com as seguintes
probabilidades: a zona I com P1=0,15; a zona II com P2=0,3 e a zona III com
P=0,2. determinar a probabilidade do atirador falhar o tiro.

11. De dois acontecimentos A e B, resultantes de uma mesma experiência aleatória,


sabe-se que:

P A  0,4 ; P A  B   0,9 e PB   P A
1
2
a) determine P A e PB 
b) averigue se os acontecimentos A e B são incompatíveis e contrários.

12. Sejam A e B dois eventos associados a um experimento. Seja P A  0,6 ,


P A  B   0,8 e PB   t . Pergunta-se:
a) para que valor de t, A e B são mutuamente exclusivos?
b) Para que valor de t A e B são independentes?

13. Se 40 famílias com 3 filhos vivem numa cidade, quantas delas será de esperar que
tenham:
a) 3 rapazes
b) 1 rapaz e 2 raparigas
c) Pelo menos um rapaz.


14. No universo S, acerca do acontecimento A e B, sabe-se que: P A  4PB 
a) escreva uma relação entre P A e PB 
102


b) calcular P A e PB  , se P A  0,2 .
Page
15. uma urna contém 6 bolas brancas e 4 pretas; outra contém 7 brancas e 5 pretas.
Se for retirada uma bola de cada urna, determinar a probabilidade de:
a) ambas serem brancas
b) ambas serem pretas
c) uma ser branca e a outra ser preta.

16. Em certa região de Brasil ocorreram 5 anos de seca em um período de 43anos.


Qual é a probabilidade de continuar a mesma situação nos próximos 2 anos?

17. Dois amgos foram a caça. Sabe se que um deles tem 45% de probabilidade de acertar em
qualquer caça, enquanto que o outro tem 60. qual é a probabilidade de em cada tiro disparado:
a) ambos acertarem na mesma caça?
b) nenhum acertar na mesma caça?
c) a caça ser atingida?
d) apenas um acertar a caça?

18. Três máquinas, A,B,C, fabricam um mesmo produto nas seguintes proporções.
A produção da máquina A é duas veses a produção da máquina B e as
máquinas B e C têm proporções iguais. Sabe-se ainda que 5% do produto
fabricado em A, 7% fabricado em B e 10% de C são defeituosos. Este produto
é armazenado em determinado almoxarifado, na proporção de produção de
cada máquina. Retirou-se um produto deste almoxarifado e verificou-se que
era defeituoso.
Qual a probabilidade de este produto ter sido produzido:
a) pela máquina A?
b) pela máquina B?
c)pela máquina c?

19. Num estudo sobre “novos hábitos”dos alunos observa-se que 15% achou normal “usar” o
telemóvel na aula, enquanto outros 20% pensam que é na aula a melhor altura para pôr
a conversa em dia. Por outro lado, 90% destes últimos nunca tem dúvidas sobre a matéria
leccionada, enquanto 20% dos que “usam”telemóvel na aula e 30% dos restantes (“os bem
comportados”), apresentam ocasionalmente dúvidas.
a) Foi posta uma dúvida sobre a matéria. Calcule a probabilidade de ser um dos alunos que
“usa” o telemóvel.
b) Pode afirmar-se que mais de 80% dos alunos não apresentam dúvidas na aula?
103
Page
Soluções
1. a) 9 520 b) 3 780 c) 7980

2. a) 30 b) 2.82%
3.a) 495 b)20 c) 480 d) 168
4.a) 120 b) no mínimo ao fim de 30dias.
5. a) 10.9% b) 6.8% c) 61.2% d) 44.9%
6. a) 60 ; 12 b) 120; 36
7. a) 24 b) 12 c) 30 d) 840
2
8. R:
5
9. 0,016.
10. 0,35
11.a) 0.6 e 0.3 b) Incompativeis e contrários pois, p A  B   0
12. a) t=0,2 b) t=0,5
13. a) 5 b)15 c) 35
14. a) 1  p A  4 pB  b) 0,8 e 0,05
15. a) 7/20 b) 1/6 c) 29/60.
16. 1,35%
17. a) 27% b)22% c)78% d) 51%
18. a) 37,04% b) 25,92% c) 37,04%
19. a) 0,1225 b) Não
104
Page
2.2 Distribuição de probabilidade

Introdução

Nesta unidade, você deverá fazer: o estudo da probabilidade associada aos acontecimentos
possíveis numa experiencia aleatória que obedece a um regra, isto é, a forma de distribuição mais
frequente nos processos educacionais, industriais, etc, para características mensuráveis.

Ao completar esta unidade, você será capaz de:

 Indicar as características da distribuição normal, t- student e


qui- quadrado;
Objectivos  Indicar as características da distribuição normal padrão;
 Consultar a probabilidade numa tabela de distribuição
normal, de t-student e qui- quadrodo;
 Caracterizar a distribuição de densidade de probabilidade de
uma variável aleatória.
 Diferenciar as distribuições: normal, qui- quadrado e t-
Student;
 Descrever as condições de a aproximação das distribuições:
normal, qui- quadrado e t- Student;

Nesta lição, você deverá prestar muita atenção aos seguintes termos e
conceitos:
 Distribuição de probabilidade;
Terminologia  Simetria;
 Graus de liberdade;
 Variável padronizada.
105
Page
Lição No 4

2.2.1 Introdução à distribuição normal de probabilidade

Uma variável aleatória contínua X segue uma


1  x 
2

1    distribuição normal (ou Gaussiana) caracterizada


f ( x)  e 2  
, x  R,   0
 2 pela média  e variância  2 , e representa-se por
X ~ N (  ,  2 ) , se sua função densidade de
probabilidade é dada por:

A função de densidade de probabilidade tem o gráfico representado na figura 2.1.

Figura 2.1: Gráfico da função de densidade de probabilidade da distribuição normal

Propriedades
Se X ~ N (  ,  ) , então:
2

 Média ou esperança matemática é o parâmetro μ .


 A variância da distribuição normal é o parâmetro  2 .
 A lei normal é simétrica em relação a média, isto é, para qualquer x  R , a
probabilidade a esquerda da média é igual a probabilidade a direita da média.
x
Se X ~ N (  ,  2 ) , então Z  , segue uma distribuição normal padrão e representa-se por

Z ~ N (0,1) .
106
Page
Figura 2.2: Gráfico da função de densidade de probabilidade da distribuição normal-padrão

Uso da tabela de distribuição normal de probabilidade

Como não era possível criar-se uma tabela com qualquer média e qualquer desvio padrão,
introduziu – se uma grandeza padronizada que segue uma distribuição normal padrão com média
0 e desvio padrão 1.
A tabela que consta em apêndice dá-nos a probabilidade de Z<Zi.

Exemplo 1:
Para determinar P( z  0,45) , indo a tabela, observamos na linha 0,4 e coluna 0,05. No
cruzamento encontra-se o valor da probabilidade, logo, P( z  0,45)  0,6736 , que é a
probabilidade procurada.
Exemplo 2:
P( z  1,52)  0,9345
Exemplo 3:
P( z  1,52) , neste caso, como pretende-se a probabilidade de Z >zi, e a tabela dá nos apenas
valores a esquerda, da totalidade que é 1, temos de tirar a área a esquerda e assim obteremos a
área a direita. P( z  1,52)  1  P( z  1,52)  P( z  1,52)  1  0,9345  0,0655

Exemplo 4:
Suponha que as notas dos estudantes duma turma numa certa escola sigam a distribuição normal,
com uma média de 10 valores e uma variância de 4. Qual é a probabilidade das notas excederem
13 valores?
Resolução :
Seja X as notas. A probabilidade requerida pode ser representada por P(X>13).
x
Como Z  Z = (X-10)/2.
 , então,
Note que X>13 corresponde a Z>1,5. Assim, da Tabela,

P(X>13) = P(Z>1.5) = 1 –P(Z≤1.5) = 1 –0.93319 = 0.06681


107
Page
Exercicios de Auto-Avaliação

1. Seja Z uma N(0, 1). Determinar as seguintes probabilidades:


a) P(Z < 2,33)
b) P(Z > -1,54)
c) P(-2 < Z ≤ 2)
d) P(1 ≤ Z ≤2)

2. Seja X uma VAC com distribuição N(10, 2). Determinar:


a) P(X < 10)
b) P(X > 11,50)
c) P(6,08 ≤ Z ≤ 13,92)

3. Suponha que X tenha uma distribuição N(2; 0,16). Empregando a tábua dedistribuição normal,
calcule as seguintes probabilidades:
a) P( x  2,3)
b) P(1,8  x  2,1)

4.Uma distribuição normal tem desvio padrão igual a 5 e é tal que 1,5% dos valores estão abaixo
de35. Determine sua média.

1. a) 0,9901 b) 0,9382 c.) 0,9544 d.) 0,1359


2. a.) 0,50 b). 0,2266 c.)0,95
3. a.) 0,2266 b) 0,2902
4. 0,458

108
Page
2.2.2 Distribuição Qui- quadrado

Consideremos um conjunto de n variáveis aleatórias Bi , sendo que cada variável Bi segue uma
distribuição normal padrão e são mutuamente independentes, então, a variável aleatória X, que é
soma das n variáveis Bi elevadas ao quadrado, segue distribuição Qui- Quadrado com n graus de
liberdade, e representa-se por :
n
X   Bi2 ~  n2
i 1

Os graus de liberdade são habitualmente usados para representar o número das variáveis Bi
adicionadas.
Uma variável aleatória X tem uma distribuição Qui- Quadrado se sua função de densidade de
probabilidade é dada por:

 2x n2 1
e x , x0
 n
f x    2 2 T  n  , n  0
 2

0 , x0

Propriedades da distribuição
 O gráfico da f.d.p é uma curva assimétrica positiva;
 O valor esperado da distribuição: E(X) = n;
 Variância: Var (X) = 2n.

Tabelas
O que é tabelado é a função inversa, em relação a área à direita de cada curva (uma para cada
linha), isto é, dado um valor de área na cauda direita (a), a tabela retorna um valor “x” tal que
P(  2  x)  

Exercícios

 
1. Seja X uma variável aleatória com distribuiçao do Qui-quadrado.determine:
a) P 22  4,605
b) P 2
6  0,676
c) P 2
6  0,872
109

Soluções : a). 0,1 b). 0,995 c). 0,99


Page
2.2.3 Distribuição t- Student

A distribuição t-Student é muito usada quando a variância é desconhecida, ou quando a amostra


é de menor dimensão numa distribuição normal.
Uma variável aleatória continua X tem distribuição t de student n> 0 graus de liberdade, e
representa-se por X ~ t ( n ) , se a sua função de densidade de probabilidade é dada por:

 n 1
T  2 
n 1

 2   x  2
0 x e dx
n 1  x
f ( x)  1  , x  R ( n  0) , onde T ( n ) 
 n   n 
n T  
2

A função de densidade de probabilidade tem o gráfico representado na figura 3.1.

Figura 2.3: Gráfico da função de densidade de probabilidade da distribuição t-Student

Principais características da distribuição


1 Curva simétrica em relação ao eixo x = 0
Se X ~ t (n) , então
E(X) = 0
n
Variância V ( x)  , para n  2 Rita
n2

 O seu aspecto gráfico depende do dos graus de liberdade.

A Distribuição t- Student é essencialmente uma distribuição normal (com forma aproximada de


um sino) para todas as amostras de tamanho ‘n’.

Propriedades da Distribuição t de Student

É diferente conforme o tamanho da amostra (n)


110

Tem forma geral simétrica, mas reflecte a maior variabilidade esperada em pequenas amostras
Tem média t=0
O desvio padrão varia com o tamanho da amostra, mas é superior a 1
Page
Quanto maior ‘n’, maior a aproximação em relação à distribuição normal. Para n>30 podemos
utilizar distribuição normal com valores críticos ‘z’.

Tabela da distribuição t- Student

O que é tabelado é a função inversa (percentis), em relação a área à direita (unilateral) de cada
curva (uma para cada linha), ou a soma das caudas (bilateral), isto é, a tabela retorna um valor
“t” tal que P(T ≥ t) = α (unilateral) ou P(|T| ≥ t) = α (bilateral).
As duas opções podem ser colocadas em uma mesma tabela. Pode-se ler uma área (a) de cima
para baixo e se ter um valor unilateral (P(T ≥ t) = α) ou ler a área (a) de baixo para cima e se ter
um valor “t” tal que P(T ≥ t) = α/2.

Exercicios
1. seja x uma v.a. com distribuição t- Student, determine:
a) P(T5 > 2.015)
b) P(Τ8< - 2.306)
c) P(Τ8>2.306)

Soluções: a) 0,05 b) 0,025 c) 0,025

Exercicios de Auto-Avaliação

1.O número de pedidos de compra de certo produto que uma cia recebe por semana distribui-
senormalmente, com média 125 e desvio padrão de 25. Se em uma dada semana o estoque
disponível é de 150 unidades:
a) Qual é a probabilidade de que todos os pedidos sejam atendidos?
b) Qual deveria ser o estoque para que tivesse 99% de probabilidade de que todos os pedidos
fossem atendidos?

2. Considere que o comprimento médio de determinado fio condutor é 120, com


desvio padrão 0,5. Qual a percentagem de fio com comprimento superior a 121?

3.Os Serviços Municipalizados de Gás e Electricidade debitam mensalemnte aos seus clientes
um consumo teórico T de energia eléctrica calculado de tal modo que a probabilidade de o
consumo efectivo o exceder seja de 30,85%.
Suponha um cliente cujo consumo por mês segue lei normal de média 400 kwh
111

e desvio-padrão 40 kwh.
a) Qual o consumo teórico que lhe é mensalmente debitado?
b) i. Qual a distribuição do consumo efectivo durante 3 meses?
Page
ii. Qual a probabilidade de que, ao fim de 3 meses, o consumo teórico exceda o efectivo em
mais de 100 kwh?

Soluções

1. a) 0, 8413 b) 184
2. 2,28%.
3. a) T =420 b) i.N(1200; 4800) ii. 2. 28,1%

Unidade 3

Estatística inferencial

Introdução

Até aqui, o trabalho realizado foi para a descrição das características de uma amostra, o que é a
base da inferência estatística. Nesta unidade, você deverá fazer: o estudo sobre dos
procedimentos que lhe ajudarão a partir dos resultados obtidos com base numa amostra estimar o
comportamento da população com certo grau de confiança.

Ao completar esta unidade, você será capaz de:

 Descrever a distribuição amostral das médias de uma


população;
Objectivos  Construir o intervalo de confiança para a média de uma
população;
 Construir o intervalo de confiança para as proporções;
 Construir o intervalo de confiança para a variância de uma
população
 Testar hipóteses;
112
Page
Nesta lição, você deverá prestar muita atenção aos seguintes termos e
conceitos:
 Intervalo de confiança;
Terminologia  Nível de significância;
 Distribuição amostral
 Teste;
 Hipótese nula;
 Hipótese alternativa;
 Potência de teste;
 Erro;

Lição No 1

3.1 Distribuição amostral e Intervalo de confiança para a média de uma população

3.1.1 Distribuição Amostral


Se extrairmos n amostras de uma determinada população, para cada uma das amostras pode se
calcular, por exemplo, a média, o desvio e tem-se a distribuição amostral desses parâmetros.
Como a média, os desvios são variáveis aleatórias, pode se determinar as suas características.

Distribuição Amostral da média


A média da distribuição amostral das médias é igual à média populacional, e representamos
por  .

 Se a população for infinita, ou se a amostragem é com reposição, então a variância da


2
distribuição amostral das médias, denotada por  X2 é dada por:  X2 
n
 Se a população for finita, ou se a amostragem é sem preposição, então a variância da
 2  N n
distribuição amostral das médias é dada por:  X2   
n  N 1 

 Se a população tem ou não distribuição normal com média μ e variância  2 , então a


distribuição das médias amostrais será normalmente distribuída com média  e variância
2
dada por:  X2 
113

n
.
Page
3.2.1. Intervalo de confiança para a média de uma população

Quando a variância é conhecida


Se a distribuição for normal ou quando a amostra é de grande dimensão e mesmo não sendo
normal, pde se dizer que segue uma distribuição aproximadamente normal.

Uma vez que apenas se encontra tabelada a distribuição N(0,1), torna-se necessário calcular a
x
variável reduzida correspondente: Z  ~ N (0;1)
x
onde :

X - é a média amonstral;
 - é a média populacional e

 x - é o desvio padrão corrigido, dado por  x  , logo, Z pode ser expressa de seguinte
n
x
modo : Z  ~ N (0;1)

n
A probabilidade de se encontrar a média da população dentro do intervalo será dada por:
   
P X  Z       X  Z    1
  1  n    n 

1
 2  2 .

O intervalo da confiança para a média da população a um grau de confiança de (1   )  100% é

dado por :
   
 X  Z   ; X  Z   
 n 
 1  n  1 
 2  2

Exercicios
1. Uma brigada de PT pediu ao gerente de bar onde trabalha o Jorge para colaborar numa
companha de sensibilização o dever de não beber quando vai conduzir. Assim o Jorge foi
encarregue de pedir aos clientes do bar para soprarem o balão ao sair. Ao fim de alguns
dias, o Jorge já tinha recolhido 125 observações cuja média amostral era de 0,6 mg por
litro. De acordo com as ilustrações da PT os valores de quantidade de álcool no sangue das
114

pessoas são bem modelados por uma distribuição normal com variância 0,04. Calcule o
intervalo de confiança a 95% para a verdadeira taxa de alcoolemia a saída do bar do Jorge.
Page
Resolução:

Sendo a média amostral 0,6 e a variância 0,04, logo o desvio padrão será 0,02.
A 95%, Z1  Z 0,05  Z 0,975 ,que consultando na tabela terremos Z0,975  1,96 . Como
1
2

     0,02 
0,6  1,96 11,2 ;0,6  1,96 11,2   0,565;0,635
0,02
 X  Z1  ;X  Z   então,
 2 n 1
2 n  

Quando a variância é desconhecida


Se a distribuição for normal, então segue uma distribuição t- Student.
x x
A grandeza padronizada será: T   ~ t (n  1)
Sx Sx
n

A probabilidade de se encontrar a média da população dentro do intervalo será dada por:


 S S 
P X  t  X t  1 
n 
 
n 1;1  
 2 n n 1;1
2 .
Quando a população é normal com variância desconhecida, o intervalo de confiança para a
média da população a um grau de confiança de (1   )100% é:
 S S 
 X  t n 1;1  ; X t
 
 
 2 n n 1;1
2 n

Quando a população não é normal mas a amostra é de grande dimensão com variância
desconhecida, o intervalo de confiança aproximado para a média da população a um grau de
confiança de (1   )100% é:
   
 X  Z 1  ;X Z 
1
 .
 2 n 2 n

3.1.2 Intervalo de confiança para proporções

Normalmente, faz-se afirmações sobre a taxa de sero trivalência em Moçambique e não do


número total dos infectados.
Se a amostra é do tamanho n, e X o número de pessoas infectadas na amostra, podemos estimar a
  X
proporção de amostra p pela equação: p  .
n
115

Se n é suficientemente grande, pelo teorema do limite central, a distribuição amostral aproxima-


se da distribuição com as seguintes características:
Page

pq
O desvio padrão da distribuição da amostra de proporção é: S p  , e sendo, q  1  p ,
n

p(1  pˆ )
então, S p  .
n

p p
A estatística Z é dada por: Z  e o intervalo de confiança é dado por:
Sp

  
 p  Z1 S p ; p  Z1 S p 
 2 2 

Exercício
Um estudante do Ensino Básico da Universidade Pedagógica afirmava que as classificações na
disciplina de estatística eram em regra, superiores a 10 valores em mais de 70%dos casos. Um
seu colega aparentemente céptico, resolveu obter uma amostra aleatória apropriada á situação,
através da qual verificou que para cada 98 alunos que se apresentavam ao exame 73 tinham
obtido classificações superiores a 10 valores.
Construa, com base na informação contida nesta amostra, um intervalo de confiança de nível
95% para a percentagem de todosestudante do Ensino Básico da Universidade Pedagógica com
classificação superior a 10 valores.

Resolução:

Como a amostra é de 98 e o número de estudantes com classificação maior a 10 é 73,


 73   
p  0,7449 . Sendo  p  Z1 S p ; p  Z1 S p  , com
98  2 2 

p(1  pˆ ) 0,7449(1  0,7449)
Sp    0,051 e a 95% Z1  Z 0,05  Z 0,975 ,que consultando
n 98 1
2
na tabela terremos Z0,975  1,96 , portanto, logo, o intervalo de confiança será:
0,7449  1,96  0,051;0,7449  1,96  0,051  0,7449  0,09996;0,7449  0,09996  0,645;0,645

3.1.3. Intervalo de confiança para a variância de uma população

Se a distribuição da população for normal, a variável fulcral para a construção do intervalo de


(n  1) S 2
confiança para a variância é: Q  ~  2 (n  1)
116

 2
Page
A probabilidade de se encontrar a variância da população dentro do intervalo será dada por:
 
 (n  1) S 2 (n  1) S 2 
P 2   2
2
  1
  ( n 1;1 )   
( n 1; )
.
 2 2 
Portanto, o intervalo de confiança para a variância da população a um grau de confiança de
(1   )100% é:
 
 (n  1) S 2 (n  1) S 2 
 2 ; 2
 ( n 1;1  )
  
( n 1; )
 2 2 

Exercício

1. Entre os 10 pavilhões mais visitados de uma exposição universal, foram seleccionados


aleatoriamente três, tendo sido registados os tempos de espera para visitar os mesmos
apartir das 12 horas. Seguem-se os dos obtidos relativos as 3 amostras aleatórias dos
tempos de espera registados em minutos, para os 3 pavilhões:
7 7

x  455 e  x  x   486 .
2
Pav 1: 1i 1i
i 1 i 1
6
Pav 2: x
i 1
2i  360 e S22  85 .

Pav 3: 55;60;64;58;47;73;49;71
Admitindo a normalidade dos tempos de espera do pavilhão 1, construa o intervalo de confiança
de nível 0,05, para a variância dos tempos de esperado mesmo.
Resolução:
 
 (n  1) S 2 (n  1) S 2 
Como por definição, intervalo para a variância ´dado por:  2 ; 2

 ( n 1;1  )
  
( n 1; )
 2 2  , e sendo

 x  x 
2
117

i
486
S 
2 i 1
  81
n 1 7 1
Page

,
 
 (7  1)81 (7  1)81   486 486 
então,  2

; 2
   14,4494 ; 1,2373   33,6346;392,7607
 ( 7 1;1 0,05) ( 7 1; 0, 05)   
 2 2 

3.1.3 Intervalo de confiança para duas médias populacionais

Quando as variâncias são conhecidas


Introdução

Sejam dois conjuntos, X 11, X 12, X 13 ,..., X 1n, e X 21, X 22, X 23 ,..., X 2n, duas amostras aleatórias
independentes de dimensões n1 e n 2 , respectivamente, retiradas de duas populações com
distribuição normal ou não sendo normal mas com a amostra de grande dimensão e desvios
 1 e  2 , neste caso, a variável fulcral a utilizar na construção do intervalo de confiança é:
( x  x 2 )  ( 1   2 )
Z 1 ~ N (0;1)
 12  22

n1 n2

A probabilidade de se encontrar a diferença de médias populacionais dentro do intervalo será


dada por:
 
P Z   Z  Z      1  
 2   
  2 
1
.

  12  22  12  22 
 P X 1  X 2  Z      1   2  X 1  X 2  Z      1
  1  n1 n2  1  n1 n2 
  2  2

O intervalo da confiança para a diferença das médias populacionais a um grau de confiança de

(1   )  100% é dado por :


118

  12  22  12  22 
 X1  X 2  Z     1   2  X 1  X 2  Z     
  1 
 2
n1 n2  1 
 2
n1 n2 
Page
Quando as variâncias são desconhecidas e iguais

( x1  x 2 )  ( 1   2 )
A grandeza padronizada será: T  ~ t (n1  n2  2)
1 1 (n1  1) S12  (n2  1) S 22

n1 n2 n1  n2  2

Quando as variâncias são desconhecidas e diferentes


( x  x 2 )  ( 1   2 )
A grandeza padronizada será: T  1 ~ t (v )
S12 S 22 , onde ,

n1 n2
2
 S12 S 22 
  
T  n1 n2 
2 2
1  S12  1  S 22  .
    
n1  1  n1  n2  1  n2 

Teorema do limite central

Desde que a média amostral tenha sido calculada com base numa amostra de grande dimensão, a
sua distribuição é aproximadamente normal.

Exercício

1. Entre os 10 pavilhões mais visitados de uma exposição universal, foram seleccionados


aleatoriamente três, tendo sido registados os tempos de espera para visitar os mesmos a
partir das 12 horas. Seguem-se os dos obtidos relativos as 3 amostras aleatórias dos
tempos de espera registados em minutos, para os 3 pavilhões:
7 7

x  455 e  x  x   486 .
2
Pav 1: 1i 1i
i 1 i 1
6
Pav 2: x
i 1
2i  360 e S22  85 .

Pav 3: 55;60;64;58;47;73;49;71
Construa o intervalo de confiança para a diferença entre as médias dos tempos de espera nos
pavilhões 2 e 3, respectivamente.

Resolução:
119

Como as variâncias populacionais são desconhecidas e sendo para:


Page
n2  6 n3  8
  2
o pavilhão 2 S 22  85 e para o pavilhão 3 S3  89,125
 x  60  x  59,625
 2  2
1 1 (n1  1) S12  (n2  1) S22 1 1 5  85  7  89,125
e sendo     5,27 , e
n1 n2 n1  n2  2 6 8 682
 1 1 (n1  1) S12  (n2  1) S22 
x2  x2   t    então,
 n 2  n3  2;1
2
n1 n2 n1  n2  2 
60  59,625  t11;0,975  5,27; 60  59,625  t11;0,975  5,27   11,224;11,974
teste de hipótese

120
Page
Exercícios de Auto-Avaliação

Intervalo de confiança para a média

1. A duração da vida de uma peça de equipamento é tal que σ=5 horas.Foram amostradas 100
dessas peças, obtendo-se a média de 500 horas.
Construa um intervalo de confiança para a verdadeira duração
média da peça com um nível de 95%.

2. Entre os 10 pavilhões mais visitados de uma exposição universal, foram seleccionados


aleatoriamente três, tendo sido registados os tempos de espera para visitar os mesmos a partir
das 12 horas. Seguem-se os dos obtidos relativos as 3 amostras aleatórias dos tempos de espera
registados em minutos, para os 3 pavilhões:
7 7

x  455 e  x  x   486 .
2
Pav 1: 1i 1i
i 1 i 1
6
Pav 2: x
i 1
2i  360 e S22  85 .

Pav 3: 55;60;64;58;47;73;49;71
a) Admitindo a normalidade dos tempos de espera do pavilhão 1, construa o intervalo de
confiança de nível 0,05, para a média dos tempos de espera do mesmo.

3. A altura de 10000 estudantes do Ensino básico têm distribuição aproximadamente normal com
média de 170 cm e desvio padrão de 5 cm.
a) Qual o número esperado de estudantes com altura superior a 1,65 m?
b) Qual o intervalo simétrico em torno da média, que conterá 75% das alturas dos
estudantes?

Intervalo de confiança para a proporçopes

4.Numa amostra de 200 indivíduos, que utilizam automóvel nas suas deslocações, casa -
emprego, 50 declaram-se disponíveis para passar a utilizar o metropolitano caso este passasse a
chegar á sua zona de residência. Com base nos resultados apresentados:
a) Construa um intervalo de confiança a 95% para a verdadeira proporção de indivíduos
nessas condições.
b) Qual deve ser a dimensão da amostra a recolher para reduzir a amplitude desse intervaloa
metade, mantendo o mesmo grau de confiança.
121
Page
Intervalo de confiança para variância
5.Suponha-se que o tempo de vida ( em horas) de componentes electrónicos produzidos
segundo determinado processo de fabrico, tem distribuição normal. Obtida uma amostra
casual de n=20 componentes da produção de certo dia, verificou-se a duração das mesmas, e
calculou-se a média e o desvio padrão da amostra, obtendo-se: x  1832 e S  497 .
Determine o intervalo de confiança a 90% para o desvio padrão do tempo de vida das
componentes electrónicas.

6. Com o objectivo de analisar os salários de certa empresa, seleccionou-se aleatoriamente


um amostra de funcionários da mesma. Os salários correspondentes, em centenas de euros,
apos tratados revelaram os resultados seguintes:

10 10

x
i 1
i  147,7 e x
i 1
2
i  3067,37

Construa o intervalo de confiança ao nível 0,95 para:


a) A média dos salários;
b) O desvio padrão dos salários.

122
Page
Soluções

1. 499,02;500,98

2. 56,676;73,324

3. a) 8413 b) ]164,25; 175,75[


4. a) 0,19;0,31 b) 800

5. 394,58;681,09
6.a) 7,673;21,867 b) 6,824;18,112

123
Page
Lição No 2

3.2 Teoria de decisão estatística, testes de hipóteses e significância

Introdução

Ao tentar a fixação de decisões, é conveniente a formulação de hipóteses a cerca das populações


interessadas. Essas suposições que podem ser verdadeiras ou não, chamam se hipóteses
Estatísticas.
Os testes de hipóteses são uma segunda vertente da inferência estatística, tendo por objectivo
verificar, a partir de dados observados numa amostra, a validade de certas hipóteses relativas à
população. No caso particular dos testes paramétricos a validação diz apenas respeito aos
parâmetros da população. O resultado do teste corresponde inevitavelmente a uma das duas
respostas possíveis para cada questão: afirmativa ou negativa.

Testamos hipóteses para tomarmos uma decisão entre duas alternativas. Por essa razão, o Teste
de Hipótese é um Processo de Decisão Estatística.

Tipos de Hipótese
Designa-se por H 0 , a hipótese nula, a hipótese estatística a ser testada, e por H 1 a hipótese
alternativa. A hipótese nula contém sempre uma igualdade ( o que se assume como correcto até
prova em contrário), enquanto a hipótese alternativa é dada por uma desigualdade.

Os testes classificam-se em Bilaterais e unilaterais:


Teste bilateral Teste unilateral direito Teste unilateral esquerdo
Hipótese Hipótese Hipótese
H 0 :   0 H 0 :   0 H 0 :   0
H1 :    0 H1 :    0 H1 :    0

Procedimentos padrão para a realização de um Teste de Hipóteses


i. Formular as hipóteses de teste (nula e alternativa);
ii. Seleccionar a estatística de teste adequada;
iii. Recolher os dados e calcular o valor observado para a estatística de teste;

Determinado o valor de Z observado, existem dois procedimentos subsequentes:


1º Procedimento:
i. Determinar a probabilidade associada à estatística de teste;
ii. Comparar o valor com o nível de significância;
iii. Decidir rejeitar ou não a hipótese nula. Se   P não rejeitar a hipótese nula e se   P
124

rejeitar a hipótese nula;


iv. Interpretar e concluir.
Page
2º Procedimento:
i. Escolher o nível de significância de teste;
ii. Definir as regiões de aceitação (R.A) e de rejeição (R.R);
iii. Comparar a estatística observada com as regiões críticas;
iv. Decidir rejeitar ou não a hipótese nula. Se a estatística de teste pertencer a R.A não
rejeitar a hipótese nula e rejeitar se pertencer a R.R;
v. Interpretar e concluir.

Erro no teste de hipótese


Tal como qualquer sistema legal, o processo do teste de hipóteses não é perfeito. Existem
dois tipos de erros que podem ser cometidos:

Decisão H 0 é verdadeira H 0 é falsa


Rejeitar H 0 Decisão incorrecta Decisão correcta
Erro do tipo I. P( rejeitar H 0 / H1
P  verdadeira)= 1  
Não rejeitar H 0 Decisão correcta Decisão incorrecta
( P  1 ) Erro do tipo II. ( P   )

Na prática, a pessoa que conduz o teste de hipóteses especifica a probabilidade máxima


permissível de se cometer o erro de tipo I, chamado nível de significância para o teste. Ecolhas
comuns para o nível de significância são 0.05 e 0.01.

3.2.1. Teste de Hipóteses para a Média de Populações


normais com variâncias conhecidas

A grandeza padronizada é dada por:

x
Z ~ N (0;1)

n

Região de rejeição e de aceitação da hipótese nula

Teste bilateral Teste unilateral direito Teste unilateral esquerdo


Hipótese Hipótese Hipótese
125

H 0 :   0 H 0 :   0 H 0 :   0
H1 :    0 H1 :    0 H1 :    0
Page

Regiões críticas Regiões críticas Regiões críticas


Cálculo do valor de P Cálculo do valor de P Cálculo do valor de P
P  2P( z  Z observado ) P  P( z  Z observado) P  P(Z  Z observado)

Exercicios
1. Certo candidato as eleições para determinada associação académica declarou, a dada altura da
campanha, que iria obter a maioria. Um elemento da sua comitiva resolveu seleccionar ao acaso
100 elementos; 47 responderam que iriam votar nesse candidato. Verifique se os dados
evidenciam que o candidato tinha razão.

Resolução:

Como apenas se tem a proporção dos elementos que iriam votar o teste de significância
´unilateral direito á proporção.
Para obter a maioria teria que ser contemplado com mais de 50% dos votos. Assim ter-se-ia um
 H 0 : p  0,5
teste da forma:  a um nível de significância de 5%
 H1 : p  0,5

α
 47
Como 100 é o numero dos inqueridos e 47 ´o numero dos que iriam votar, p   0,47 .
100
 
p p p(1  pˆ ) 0,47  0,5  0,03
Por definição, Z  e Sp  , então, Z    0,6 e
Sp n 0,5(1  0,5) 0,05
100
Z1  Z1 0,05  Z0,95 que consultando na tabela terremos: Z 0,95  1,645 . Sendo as regiões de
aceitação e de rejeição,  ;1,645 e 1,645;  respectivamente, como o Z pertence a região de
aceitação, não rejeitar H 0 .

2.Um fabricante de lajotas de cerâmica introduz um novo material em sua fabricaçao


126

e acredita que aumentará a resistência média, que é de 206 kg. A resistência das
Page
lajotas tem distribuição normal, com desvio padrão de 12 kg. Retira-se uma amostrade 30 lajotas,
obtendo-se X’ =210 kg. Ao nível de 10%, pode o fabricante aceitarque a resistência média de
suas lajotas tenha aumentado?
Resoluçao:
1º As hipóteses são:
H 0 :   206
H1 :   206
2º As regiòes críticas são:

Como as regioes de aceitaçao e de rejeiçao são  ;1,28 e 1,28; , respectivamente, o Zcalc


> Zα, rejeita-se H0, isto é, ao nível de 10% o fabricante pode concluirque a resistência média de
suas lajotas aumentou.

3.Determinada empresa, procede á embalagem embalagem de certo produto estando especificado


que a máquina deve ser reparada se for detectaque as embalagens do produto tenham em média,
500g. uma amostra aleatória de 30 embalagens seleccionadas em determinado perido de tempo
revelou pesos que nos conduzem aos seguintes resultados:
30 30

x  13443g e  x  x   2100g 2 . Supondo que o peso das embalagens tem distribuiçao


2
i i
i 1 i 1
normal, encontrar evidencia suficiente de que a máquina deve ser reparada, ao nível de
significancia de 5%.

Solucao: não reitar a H 0 .

127
Page
4. Bibliografia

CHISTINE, Dancey. Estatística sem Matemática para Psicologia. 3.ed. São Paulo, Artmed Editora,
2006.
F. Jaime e T. Daniel, Exercícios de Estatística, Edi,coes Sílabos, Lda. 1ª Ed. Lisboa, Abril, 2002
F. Pedro Lopes, Estatistica Descritiva e Inferencial, Faculdade de Economia, Universidade de
Coimbra, 2005;
H. Andreia, N.Cláudia e P. António, Grande Maratona de Estatística no SPSS, Escolar Editora,
2011;
L.Veríssimo , A. Maria Gomes e F. Pedro Lopes, Estatistica Aplicada À gestão, Vida Económica-
Editorial, SA, 2012
LEVIN, J. Fox James. Estatística para Ciências Humanas. São Paulo, Prentice Hall, 2000.
PESTANA Maria e GAGEIRO, João. Análise de Dados para Ciências Sociais- A
complementaridade do SPSS. 3 ed. Edições Sílabo, 2000.
Sonia Maria Barros Barbosa Correa. Probabilidade e Estatística. 2ª Edição. © PUCMINAS,
2003

128
Page
Apêndices

Tabela da distribuição Normal padrão


z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
-4.0 0.00003 0.00003 0.00003 0.00003 0.00003 0.00003 0.00002 0.00002 0.00002 0.00002
-3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003
-3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005
-3.7 0.00011 0.00010 0.00010 0.00010 0.00009 0.00009 0.00008 0.00008 0.00008 0.00008
-3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011
-3.5 0.00023 0.00022 0.00022 0.00021 0.00020 0.00019 0.00019 0.00018 0.00017 0.00017
-3.4 0.00034 0.00032 0.00031 0.00030 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024
-3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.00040 0.00039 0.00038 0.00036 0.00035
-3.2 0.00069 0.00066 0.00064 0.00062 0.00060 0.00058 0.00056 0.00054 0.00052 0.00050
-3.1 0.00097 0.00094 0.00090 0.00087 0.00084 0.00082 0.00079 0.00076 0.00074 0.00071
-3.0 0.00135 0.00131 0.00126 0.00122 0.00118 0.00114 0.00111 0.00107 0.00103 0.00100
-2.9 0.00187 0.00181 0.00175 0.00169 0.00164 0.00159 0.00154 0.00149 0.00144 0.00139
-2.8 0.00256 0.00248 0.00240 0.00233 0.00226 0.00219 0.00212 0.00205 0.00199 0.00193
-2.7 0.00347 0.00336 0.00326 0.00317 0.00307 0.00298 0.00289 0.00280 0.00272 0.00264
-2.6 0.00466 0.00453 0.00440 0.00427 0.00415 0.00402 0.00391 0.00379 0.00368 0.00357
-2.5 0.00621 0.00604 0.00587 0.00570 0.00554 0.00539 0.00523 0.00508 0.00494 0.00480
-2.4 0.00820 0.00798 0.00776 0.00755 0.00734 0.00714 0.00695 0.00676 0.00657 0.00639
-2.3 0.01072 0.01044 0.01017 0.00990 0.00964 0.00939 0.00914 0.00889 0.00866 0.00842
-2.2 0.01390 0.01355 0.01321 0.01287 0.01255 0.01222 0.01191 0.01160 0.01130 0.01101
-2.1 0.01786 0.01743 0.01700 0.01659 0.01618 0.01578 0.01539 0.01500 0.01463 0.01426
-2.0 0.02275 0.02222 0.02169 0.02118 0.02067 0.02018 0.01970 0.01923 0.01876 0.01831
-1.9 0.02872 0.02807 0.02743 0.02680 0.02619 0.02559 0.02500 0.02442 0.02385 0.02330
-1.8 0.03593 0.03515 0.03438 0.03362 0.03288 0.03216 0.03144 0.03074 0.03005 0.02938
129

-1.7 0.04456 0.04363 0.04272 0.04181 0.04093 0.04006 0.03920 0.03836 0.03754 0.03673
-1.6 0.05480 0.05370 0.05262 0.05155 0.05050 0.04947 0.04846 0.04746 0.04648 0.04551
Page

-1.5 0.06681 0.06552 0.06425 0.06301 0.06178 0.06057 0.05938 0.05821 0.05705 0.05592
-1.4 0.08076 0.07927 0.07780 0.07636 0.07493 0.07353 0.07214 0.07078 0.06944 0.06811
-1.3 0.09680 0.09510 0.09342 0.09176 0.09012 0.08851 0.08691 0.08534 0.08379 0.08226
-1.2 0.11507 0.11314 0.11123 0.10935 0.10749 0.10565 0.10383 0.10204 0.10027 0.09852
-1.1 0.13566 0.13350 0.13136 0.12924 0.12714 0.12507 0.12302 0.12100 0.11900 0.11702
-1.0 0.15865 0.15625 0.15386 0.15150 0.14917 0.14686 0.14457 0.14231 0.14007 0.13786
-0.9 0.18406 0.18141 0.17878 0.17618 0.17361 0.17105 0.16853 0.16602 0.16354 0.16109
-0.8 0.21185 0.20897 0.20611 0.20327 0.20045 0.19766 0.19489 0.19215 0.18943 0.18673
-0.7 0.24196 0.23885 0.23576 0.23269 0.22965 0.22663 0.22363 0.22065 0.21769 0.21476
-0.6 0.27425 0.27093 0.26763 0.26434 0.26108 0.25784 0.25462 0.25143 0.24825 0.24509
-0.5 0.30853 0.30502 0.30153 0.29805 0.29460 0.29116 0.28774 0.28434 0.28095 0.27759
-0.4 0.34457 0.34090 0.33724 0.33359 0.32997 0.32635 0.32276 0.31917 0.31561 0.31206
-0.3 0.38209 0.37828 0.37448 0.37070 0.36692 0.36317 0.35942 0.35569 0.35197 0.34826
-0.2 0.42074 0.41683 0.41293 0.40904 0.40516 0.40129 0.39743 0.39358 0.38974 0.38590
-0.1 0.46017 0.45620 0.45224 0.44828 0.44433 0.44038 0.43644 0.43250 0.42857 0.42465
-0.0 0.50000 0.49601 0.49202 0.48803 0.48404 0.48006 0.47607 0.47209 0.46811 0.46414

z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
130

2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
Page

3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

Tabela de distribuição t- Student

gl/P 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001

01 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619

02 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,598

03 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,541 12,924

04 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610

05 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869

06 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959

07 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,365 3,499 5,408

08 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041

09 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781

10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587

11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437

12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318

13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221

14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140

15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073

16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015

17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965
131

18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922
Page

19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883
20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850

21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819

22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792

23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,767

24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745

25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,726

26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707

27 0,127 0,256 0,389 0,531 0,684 0,856 1,057 1,314 1,703 2,052 2,473 2,771 3,690

28 0,127 0,256 0,389 0,530 0,683 0,856 1,056 1,313 1,701 2,048 2,467 2,763 3,674

29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,659

30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,646

40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551

60 0,126 0,254 0,387 0,527 0,679 0,848 1,046 1,296 1,671 2,000 2,390 2,660 3,460

120 0,126 0,254 0,386 0,526 0,677 0,845 1,041 1,289 1,658 1,980 2,358 2,617 3,373

i 0,126 0,253 0,385 0,524 0,674 0,842 1,036 1,282 1,645 1,960 2,326 2,576 3,2

132
Page
Distribuição de Qui Quadrado

P( X   gl2 ; P )  P

gl/P 0,99 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,02 0,01 0,001
1 ,0002 0,004 0,016 0,064 0,148 0,455 1,074 1,642 2,706 3,841 5,412 6,635 10,827
2 0,020 0,103 0,211 0,446 0,713 1,386 2,408 3,219 4,605 5,991 7,824 9,210 13,815
3 0,115 0,352 0,584 1,005 1,424 2,366 3,665 4,642 6,251 7,815 9,837 11,345 16,266
4 0,297 0,711 1,064 1,649 2,195 3,357 4,878 5,989 7,779 9,488 11,668 13,277 18,467
5 0,554 1,145 1,610 2,343 3,000 4,351 6,064 7,289 9,236 11,070 13,388 15,080 20,515
6 0,872 1,635 2,204 3,070 3,828 5,348 7,231 8,558 10,645 12,592 15,033 16,812 22,457
7 1,239 2,167 2,833 3,822 4,671 6,346 8,383 9,803 12,017 14,067 16,622 18,475 24,322
8 1,646 2,733 3,490 4,594 5,527 7,344 9,524 11,030 13,362 15,507 18,168 20,090 26,125
9 2,088 3,325 4,168 5,380 6,393 8,343 10,656 12,242 14,684 16,919 19,679 21,666 27,877
10 2,558 3,940 4,865 6,179 7,267 9,342 11,781 13,442 15,987 18,307 21,161 23,209 29,588
11 3,053 4,575 5,578 6,989 8,148 10,341 12,899 14,631 17,275 19,675 22,618 24,725 31,264
12 3,571 5,226 6,304 7,807 9,034 11,340 14,011 15,812 18,549 21,026 24,054 26,217 32,909
13 4,107 5,892 7,042 8,634 9,926 12,340 15,119 16,985 19,812 22,362 25,472 27,688 34,528
14 4,660 6,571 7,790 9,467 10,821 13,339 16,222 18,151 21,064 23,685 26,873 29,141 36,123
15 5,229 7,261 8,547 10,307 11,721 14,339 17,322 19,311 22,307 24,996 28,259 30,578 37,697
16 5,812 7,692 9,312 11,152 12,624 15,338 18,418 20,465 23,542 26,296 29,633 32,000 39,252
17 6,408 8,672 10,085 12,002 13,531 16,338 19,511 21,615 24,769 27,587 30,995 33,409 40,790
18 7,015 9,390 10,865 12,857 14,440 17,338 20,601 22,760 25,989 28,869 32,346 34,805 42,312
19 7,633 10,117 11,651 13,716 15,532 18,338 21,689 23,900 27,204 30,144 33,687 36,191 43,820
133

20 8,260 10,851 12,443 14,572 16,266 19,337 22,775 25,038 28,412 31,410 35,020 37,566 45,315

i = infinito
Page
Plano Temático de Estatística para Ensino Básico

Disciplina: Estatística Educacinal

Introdução
A disciplina de Estatística Educacional visa fornecer subsídios teóricos básicos que permitam ao
estudante recolher, analisar e interpretar os dados. Ajudará ao estudante a comprovar
cientificamente as suas hipóteses de investigação e a detectar erros no uso de alguns
instrumentos de medição
Esta disciplina será um instrumento principal para um estudante efectuar trabalhos de pesquisas
auxiliando-o na apresentação de dados bem como na expressão gráfica desses mesmos dados.

Código Tipo Nível Ano Semestre Crédito Horas lectivas


s 150
Complementar 1 º º 6 80C 70E
1. Competências
Os estudantes deverão:
 Aplicar e desenvolver técnicas de recolha e análise de Estatísticas Educacionais;
 Aplicar métodos quantitativos na elaboração de um projecto de pesquisa;
 Utilizar pacotes informáticos Excel ou o SPSS no processamento e análise de dados;
 Elaborar relatórios fazendo um uso apropriado da informação estatística.
2. Objectivos gerais
No fim do curso os participantes devem ser capazes de:
 Recolher, organizar, sumarizar e interpretar dados referentes `a diversas varáveis através de
tabelas de distribuição de frequências, representação gráfica e medidas estatísticas;
 Organizar e gerir uma base de dados utilizando pacotes informáticos Excel ou SPSS;
134

 Usar pacotes estatísticos na análise de dados


Page
 Transformar em base de dados as respostas aos questionários;
 Estimar e analisar Indicadores de eficácia interna do sistema de educação Moçambicano.
 Dada uma situação identificar os modelos de variáveis a analisar e identificar formas
apropriadas da recolha de dados;
 Fazer estimativas utilizando modelos de regressão linear;
 Identificar aspectos estatísticos preponderantes na preparação e realização de projectos;
 Reconhecer e interpretar curvas de distribuição normal, Student e Q
 ui-quadrado;
 Inferir sobre aspectos relacionados com variáveis, utilizando intervalos de
confidência, testes de hipóteses e regressão linear.
 Desenvolver capacidades de trabalho em equipe realizando pesquisas de opiniões que
envolvam definição de amostra, elaboração de questionário, processamento de dados e
elaboração do relatório sobre os resultados fazendo um uso apropriado da informação
estatística.
3. Pré-requisitos
Não Existem
4. Plano Temático
Nr. Tema Horas Horas de
de Estudo
Contact
o
1 Introdução e Conceitos Básicos de Estatística 6 4
2 Distribuição de frequências 6 4
3 Medidas de Localizacao 8 8
4 Medidas de Dispersao 8 7
5 Correlacao e Regressao simples 6 4
6 Teoria elementar de probabilidades 8 7
7 Distribuições 8 8
 Normal
 Qui-quadrado
 T-student
135

8 Introdução a inferência e estatística 8 7


Teoria elementar de amostragem
Page
9 Teoria estatística e de estimação 6 6

10 Teoria de decisão estatística, testes de hipóteses e 8 8


significância

11 Aulas de Avaliação 8 7
Sub-Total 80 70
TOTAL 150
5. Estratégias e métodos de ensino e aprendizagem
 Os conceitos serão introduzidos a partir de situações concretas do processo de investigação.
Servirão de material didáctico para a aprendizagem da análise estatística base de dados do
Ministério da Educação de Moçambique ou outras relacionadas com problemáticas da
educação.
 As aulas terão uma parte introdutória, seguida de trabalhos práticos com ênfase no
processamento de dados, produção de tabelas, gráficos e elaboração de relatórios de análise
de resultados.
 Estimar e analisar Indicadores de eficácia interna do sistema de educação Moçambicano.
 O estudo de casos e a resolução de exercícios e problemas será o aspecto fundamental da
metodologia de trabalho. Para cada tópico o estudante deverá resolver problemas, identificar
os procedimentos no SPSS ou Excel e fazer um relatório da interpretação do “output”
apresentando as conclusões aos restantes membros do grupo.
6. Meios de ensino
 Material Básico de Ensino
7. Avaliação
A avaliação será regida pelas normas de avaliação em vigor na UP. Ele terá duas vertentes: a
formativa e normativa. Os instrumentos a usar na avaliação serão:
 Observação da participação nas aulas, apresentação de seminários e trabalhos em grupo;
 Relatórios de análise de dados( estudos de casos) e testes.
8. Bibliografia
CHISTINE, Dancey. Estatística sem Matemática para Psicologia. 3.ed. São Paulo, Artmed Editora,
2006.
136

F. Jaime e T. Daniel, Exercícios de Estatística, Edi,coes Sílabos, Lda. 1ª Ed. Lisboa, Abril, 2002
F. Pedro Lopes, Estatistica Descritiva e Inferencial, Faculdade de Economia, Universidade de
Page
Coimbra, 2005;
H. Andreia, N.Cláudia e P. António, Grande Maratona de Estatística no SPSS, Escolar Editora, 2011;
L.Veríssimo , A. Maria Gomes e F. Pedro Lopes, Estatistica Aplicada À gestão, Vida Económica-
Editorial, SA, 2012
LEVIN, J. Fox James. Estatística para Ciências Humanas. São Paulo, Prentice Hall, 2000.
PESTANA Maria e GAGEIRO, João. Análise de Dados para Ciências Sociais- A
complementaridade do SPSS. 3 ed. Edições Sílabo, 2000.
Sonia Maria Barros Barbosa Correa. Probabilidade e Estatística. 2ª Edição. © PUCMINAS, 2003

137
Page

Você também pode gostar