Você está na página 1de 188

Estatística Básica

Msc.Augusto Lucubo Positivo Nakiti


augusto.lucubo@isptec.co.ao
WhatsApp: (00351) 912017297

3 de outubro de 2022

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 1 / 184
1 Noções Básica da Estatística
Denições Importantes em Estatística
Tipo de Variáveis
2 Estatística Descritiva
Introdução
Representação tabular e gráca
3 Medidas Descritivas
Introdução
Medidas de Localização
Tendência não central
Medida de Dispersão
4 Análise Bidimensional
Introdução
Duas Variáveis Qualitativas
Coeciente de Contingência Modicado
Duas Variáveis Quantitativas
Variáveis Qualitativas e Quantitativas
5 Probabilidades
Conceitos Básicos
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 2 / 184
Conteúdo Programático

1 Análise Exploratória de Dados


2 Probabilidade
1.ª Avaliação Parcelar
3 Variáveis Aleatórias
4 Variáveis Aleatória Multivariadas- Noções Básicas
2.º Avaliação Parcelar
5 Introdução à Inferência Estatística: Exame Normal

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 3 / 184
Avaliação

1 Duas Avaliações Parcelares

2 Exame de Época Normal

3 Exame de Recurso

4 Escala de avaliação: 0 a 20 valores

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 4 / 184
Bibliograa

1 Bussab, W. O. e Marettin, P. A. Estatística Básica, 8. º Edição, 2013,

2 Pinheiro, J.J, Carvajal, S. R., S e Gomes, G. C. Probabilidade e


Estatística. Elservier, 2012,

ª
3 Montgomery, D e Runger. G. Estatística Aplicada e Probabilidade
para Engenheiros. LTC, 5. Edição, 2012.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 5 / 184
Noções Básica da Estatística

Estatísticas é a ciência que a partir de dados, fornece métodos que


auxiliam o processo de tomada de decisões através de Análise de Dados.
Por outras palavras, é uma área do conhecimento que inclui os
Recolher, Organizar ou Classicar,
instrumentos necessários para
Apresentar e Interpretar um conjunto de dados.
A estatística divide-se em duas áreas
1 Estatística Descritiva: conjunto de técnica apropriadas para
Recolher, Organizar, Reduzir e Apresentar dados estatísticos.
2 Inferência Estatística: conjunto de técnicas que, com base na
informação amostral, permite caracterizar uma certa população,
requerendo o conhecimento de probabilidades.

As principais técnicas utilizadas são

Estimação : visa determinar o valor dos parâmetros desconhecidos;


Testes de Hipóteses : visa testar suposições acerca das características
de uma certa população

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 6 / 184
Noções Básica da Estatística Denições Importantes em Estatística

População

Ao grupo de todos os elementos que se pretende estudar e que possuem


uma característica (ou mais) em comum. O tamanho da população é
representado por N.

Figura: População Vs Amostra

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 7 / 184
Noções Básica da Estatística Denições Importantes em Estatística

Amostra

É uma parte da população, ou seja, um subconjunto da população. Em


geral tem dimensão sensivelmente menor que a população. O tamanho da
amostra é representado por n.

Dados Brutos

é uma sequência de valores numéricos não organizados, obtidos


diretamente da observação de um fenómeno coletivo.

Rol

é uma sequência ordenada dos dados brutos.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 8 / 184
Noções Básica da Estatística Tipo de Variáveis

Variáveis

É uma característica da população à ser estudada. Tipos Existem dois


tipos de variáveis:

1 Qualitativas (Atributos): variável com dados que fornecem rótulos,


qualidades, nomes, para uma característica em estudo ou são
características de uma população que não podem ser medidas, não
têm ordenamento nem hierarquia. Elas podem ser:
i Nominais: variáveis em que não é possível estabelecer uma ordem
natural entre seus valores ou quando os valores são expressos por
atributos.
ii Ordinais: variáveis que têm uma ordenação natural, indicando
intensidades crescentes de realização ou quando a variável segue
uma ordem, mesmo não podendo ser medida.
Exemplos
Turma (A ou B), Sexo (feminino ou masculino), Cor da pele, Nacionalidade,
Curso de Graduação são variáveis Ql. Nominais.
Tamanho (pequeno, médio ou grande), Classe Social (baixa, média ou alta),
escolaridade, cargos em uma empresa, patente militar são variáveis Ql Ordinais.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 9 / 184
Noções Básica da Estatística Tipo de Variáveis

2 Quantitativas: consistem em números que representam contagens ou


medições ou uma variável com dados que indicam a quantidade de
alguma coisa ou quando os valores da variável forem expressos
em números. É sempre numérica. Elas podem ser:
i Discretas: variáveis resultantes de contagens, assumindo assim, em
geral, valores inteiros;
ii Contínuas: variáveis que assumem valores em intervalos dos números
reais e, geralmente, são provenientes de uma mensuração (medição).
Exemplos
Número de Irmãos (0, 1, 2, ...) e Número de Defeitos (0, 1, 2,...) são
Quantitativas Discretas
Peso e Altura, faixa etária são Quantitativas Contínuas.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 10 / 184
Estatística Descritiva Introdução

O método cientico, quando aplicado para solução de um problema


cientico, frequentemente gera dados em grande Quantidade e de grande
Complexidade. Desse modo, a análise da massa de dados individuais, na
maioria das vezes, não revela a informação subjacente, gerando a
necessidade de algum tipo de condensação ou resumo dos dados.

Estatística Descritiva
É a parte da Estatística que desenvolve e disponibiliza métodos para
resumo e apresentação de dados estatísticos com o objectivo de facilitar a
compreensão e a utilização da informação.

Em resumo, a Estatística Descritiva tem por nalidade a utilização de


Tabelas, Grácos, Diagramas, Distribuições de Frequências e Medidas
descritivas para:

Examinar o formato da Distribuição dos Dados;

Vericar a ocorrência de valores atípicos;

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 11 / 184
Estatística Descritiva Introdução

Identicar valores típicos que informem sobre o centro da distribuição;

Vericar o grau de variação presente nos dados.

A validade do resumo dos dados está intimamente ligada à Quantidade de


informação disponível e à Qualidade da obtenção dos dados. Pose-se
pensar que todo método descritivo possui uma entrada, os dados, e uma
saída, que pode ser uma medida descritiva ou um gráco. Se a entrada é
deciente a saída também será de má qualidade.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 12 / 184
Estatística Descritiva Representação tabular e gráca

Uma forma de resumir um conjunto de dados, composto por n


observações, é através de uma Tabela Frequência. Esta tabela
disponibiliza um acesso rápido ao número, à percentagem ou proporção de
elementos observados com uma determinada característica ou valor ou
intervalo de valores (as chamadas classes de valores).

Uma Tabela de Frequência relaciona as categorias ou classes de valores


com o número de ocorrência, ou frequência, de observações que pertencem
a cada categoria ou classe.

As categorias ou classes de valores devem ser

1 Mutuamente Exclusivos, ou seja, cada valor observado só poderá


pertencer a uma das categoria ou classes;

2 Exaustivos, ou seja, as categorias ou classes devem compreender todos


os valores observados

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 13 / 184
Estatística Descritiva Representação tabular e gráca

Dados Qualitativos ou Quantitativos Discretos

A tabela de frequência associada a um conjunto de dados é designado da


seguinte forma:

Tabela: Tabela de frequência para dados Qualitativos ou Quantitativos Discretos

Categoria Freq.abs Freq.rel Freq.abs.acum Freq.rel.acum


(xi ) (ni ) (fi ) (Ni ) (Fi )
x1 n1 f1 N1 F1
x2 n2 f2 N2 F2
... ... ... ... ...
xk nk fk Nk = n Fk
Total n 1

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 14 / 184
Estatística Descritiva Representação tabular e gráca

Notações: A notação utilizada nas tabelas de frequência.

k: Número de categorias ou classes de valores de valores que od dados


assumem;

ni : Frequência absoluta de categoria ou classe de valores i;


ni
fi = : Frequência relativa de categoria ou classe de valores i;
n
Ni = ih=1 nh : Frequência absoluta acumulada;
P

Ni Pi
Fi = = h=1 fh : Frequência relativa acumulada;
n

Exemplos

Num estudo para analisar a ocorrência de acidente de trabalho numa


determinada empresa petrolífera, em 397 prossionais, vericando-se que
16 não tiveram qualquer acidente, 32 sofreram 1 acidente, 89 reportaram 2
acidentes, 137 sofreram 3 acidentes, 98 sofreram 4 acidentes e 25
prossionais reportaram 5 acidentes.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 15 / 184
Estatística Descritiva Representação tabular e gráca

Tabela: Tabela de frequência de Número de acidentes por prossionais

Categoria Freq.abs Freq.rel Freq.abs.acum Freq.rel.acum


(xi ) (ni ) (fi ) (Ni ) (Fi )
0 16 0,0403 16 0,0403
1 32 0,0806 48 0,1209
2 89 0,2242 137 0,3451
3 137 0,3451 274 0,6902
4 98 0,2469 372 0,9370
5 25 0,0630 397 1,0000
Total 397 1,0000

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 16 / 184
Estatística Descritiva Representação tabular e gráca

Exemplo

Fobias Fobias Fobias Agressividade Depressão


Agressividade Alcoolismo Depressão Pânico Fobias
Depressão Alcoolismo Esquizofrenia Agressividade Pânico
Pânico Esquizofrenia Depressão Alcoolismo Depressão
Fobias Esquizofrenia Depressão Agressividade Alcoolismo

Resolução
As observações distintas são: agressividade, alcoolismo, depressão, esquizofrenia, fobias
e pânico.
As frequências simples respectivas são: 4, 4, 6, 3, 5 e 3. Portanto a tabela de
frequências para esta variável qualitativa nominal será dada da seguinte maneira:

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 17 / 184
Estatística Descritiva Representação tabular e gráca

Tabela: Problemas que levaram 25 pacientes a procurar auxílio psicológico

Problema Freq.abs Freq.rel Freq.abs.acum Freq.rel.acum


(xi ) (ni ) (fi ) (Ni ) (Fi )
Agressividade 4 0, 16 16 5
Alcoolismo 4 0, 16 16 8
Depressão 6 0, 24 24 14
Esquizofrenia 3 0, 12 12 17
Fobias 5 0, 20 20 22
Pânico 3 0, 12 12 25
Total 25 1, 0 100

OBS: Este tipo de tabela também pode ser utilizada quando temos uma
variável quantitativa discreta em que aparecem uma pequena quantidade
valores que se repetem várias vezes.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 18 / 184
Estatística Descritiva Representação tabular e gráca

Dados Quantitativos Contínuos

Quando os dados são do tipo Quantitativos Contínuos é necessário


denir k classes de valores, que constituem as categorias dos dados em
estudo. Para construir estes intervalos de classe existem vários métodos
possíveis.

Por exemeplo

Se interessa comparar os resultados de um estudo com outro estudo, é


fundamental que se utilizem as mesmas classes para que seja possível
efectuar as comparações. A forma como se denem as classes condiciona
os resultados que, apenas, são válidos para a classicação efectuada.
Seja qual for o método utilizado é aconselhável não obter um número
muito elevado nem muito reduzido de classes (habitualmente recomenda-se
5 ⩽ k ⩽ 20).

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 19 / 184
Estatística Descritiva Representação tabular e gráca

Método de Construção de Classes

1 Determinar o número K de classes a construir com base nas n


observações, fazendo ( Regra de Sturges)
ln(n.º
 
ln(n) observações)
k= + 1⇔ n.º de classes = onde
ln(2) ln(2)
[número] representa a parte inteira do número obtido (por exemplo:
[5, 1] = 5 e [5, 9] = 5)
2 a do conjunto
Determinar a amplitude de dados fazendo:
a = amplitude = max − min
3 Determinar a amplitude ac de cada uma das classes fazendo:
a amplitude
ac = ⇔ amplitude das classes =
k n.º de classes
4 Construir as classes ci da seguinte forma:
c1 = [min; min +ac[
c2 = [min +ac; min +2ac[
...
ck = [min +(k − 1)ac; min +kac[
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 20 / 184
Estatística Descritiva Representação tabular e gráca

A tabela de frequência para Dados Quantitativos Contínuos é designado da


seguinte forma:

Tabela: Tabela de frequência para dados Quantitativos Contínuos

Classes Ponto Freq Freq. Freq.abs. Freq.rel.


(ci ) médio (xi ) abs.(ni ) rel.(fi ) acum(Ni ) acum(Fi )
x1 x1 n1 f1 N1 F1
x2 x2 n2 f2 N2 F2
... ... ... ... ... ...
xk xi nk fk Nk = n Fk = 1
Total n 1

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 21 / 184
Estatística Descritiva Representação tabular e gráca

Outra forma

Vamos apresentar forma de construção de uma tabela de frequências para


dados quantitativos contínuos.

1 Passo: Determinar a amplitude total dos dados (A), ou seja, o maior


valor menos o menor o valor do conjunto de dados.
2 Passo: Determinar o no de classes (k) a usar. Duas regras práticas
consistem em:

iPara n < 100, entãok = √n
ii Para n > 100, entãok ∼
= n
com k dê um valor não inteiro, arredonde sempre para o próximo
inteiro.

3 Passo: Dividir a amplitude por k − 1, para obter a amplitude de classe


(c):
A
C=
k−1

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 22 / 184
Estatística Descritiva Representação tabular e gráca

Outra forma (Cont.)

4 Passo: Determinar o limite inferior inicial que será:


c
LI1 = menor valor − 2
4 Passo: Calcular o ponto médio de cada intervalo de classe:
LSi − LIi
Pi =
2
sendo que LSi é o limite superior de classe e LIi é o limite inferior de
classe.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 23 / 184
Estatística Descritiva Representação tabular e gráca

Exemplo 1

O Sr. Nobre decidiu dedicar-se à criação de leitões, que vende quando


atingem os dois meses de idade e pesam mais de 9kg . Pretendendo fazer
um estudo sobre os lucros obtidos com essa actividade, resolveu pesar 60
leitões com dois meses de idade, tendo obtido os seguintes resultados:

4,1 5,8 5,8 6,1 6,7 7,0 7,0 7,5 7,5 7,5
7,7 8,2 8,3 8,5 8,7 8,8 9,0 9,0 9,1 9,1
9,1 9,2 9,2 9,2 9,2 9,4 9,4 9,4 9,5 9,5
9,7 9,8 10,0 10,0 10,2 10,2 10,3 10,6 10,6 10,8
10,9 10,9 11,0 11,1 11,1 11,6 11,7 11,8 11,8 11,8
12,0 12,2 12,2 12,3 12,5 12,6 12,7 14,0 14,2 14,8
Construir a tabela de frequência.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 24 / 184
Estatística Descritiva Representação tabular e gráca

Resolucção

n = 60  
ln(n) ln(60)
1 n.º de classes = k = = = [5, 9] + 1 = 5 + 1 = 6;
ln(2) ln(2)
2 amplitude total a = max − min = 14, 8 − 4, 1 = 10, 7
a 10, 5
3 amplitude das classes ac = = ≈ 1, 8
k 6
4 classes c1 = [4, 1; 5, 9[ ; c2 = [5, 9; 7, 7[ ; c3 = [7, 7; 9, 5[ ; c4 =
[9, 5; 11, 3[ ; c5 = [11, 3; 13, 1[ ; c6 = [13, 1; 14, 9]

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 25 / 184
Estatística Descritiva Representação tabular e gráca

Tabela: Tabela de frequência para dados Quantitativos Contínuos

Peso em Kg Ponto Freq Freq. Freq.abs. Freq.rel.


(ci ) médio (xi ) abs.(ni ) rel.(fi ) acum(Ni ) acum(Fi )
[4, 1; 5, 9[ 5 3 0,0500 3 0,0500
[5, 9; 7, 7[ 6,8 7 0,1167 10 0,1667
[7, 7; 9, 5[ 8,6 18 0,3000 28 0,4667
[9, 5; 11, 3[ 10,4 17 0,2833 45 0,7500
[11, 3; 13, 1[ 12,2 12 0,2000 57 0,9500
[13, 1; 14, 9] 14 3 0,05000 60 1,0000
Total 60 1,0000

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 26 / 184
Estatística Descritiva Representação tabular e gráca

Exemplo 2

O tempo de utilização de caixas eletrónicos depende de cada usuário e das


operações efetuadas. Foram coletadas 16 medidas desse tempo (em
minutos). Construir a tabela de frequência.

1, 5 1, 1 1, 2 1, 7 0, 9 1, 3 1, 4 1, 8
1, 4 1, 3 1, 7 1, 6 1, 2 1, 2 1, 0 0, 9

Exemplo 3

Um rigoroso Centro de Atendimento Psicológico de uma Universidade


resolveu fazer um estudo sobre o tempo de atraso para o atendimento dos
estagiários em psicologia, para procurar melhorar esse atendimento.
Durante uma semana foram coletadas 25 medidas desse tempo (em
minutos) em que os pacientes caram esperando fora do horário.
11, 5 10, 2 10, 2 11, 7 10, 9 12, 3 15, 4 16, 0 17, 0 16, 5
14, 0 12, 8 14, 5 13, 4 13, 0 11, 7 13, 6 12, 9 15, 2 15, 0
14, 9 16, 8 15, 7 15, 0 13, 0

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 27 / 184
Estatística Descritiva Representação tabular e gráca

Grácos

Os grácos mais utilizados para representar conjuntos de dados são:

Gráco Circular: Dados Qualitativos;


Gráco de Barras: dados qualitativos ou quantitativos discretos;
Gráco de frequência acumuladas: Qualitativos na escala ordinal
ou quantitativo discretos;

Histograma: dados quantitativos contínuos;


Polígono de frequência: dados quantitativos;
Caixa de bigodes: dados não agrupados quantitativos

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 28 / 184
Estatística Descritiva Representação tabular e gráca

Gráco Circular
Um Gráco Circular é constituído por um círculo dividido em fatias
quantas as categorias da variável. O tamanho das fatias e determinado peo
número ou percentagem/porporção de observações nas categorias, i.é.,
pelas frequências absolutas, ni , ou pelas relativas fi .

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 29 / 184
Estatística Descritiva Representação tabular e gráca

Gráco de Barras
Um Gráco Barras é um diagrama de barras (usualmente vertical), sendo
cada barra associada a cada uma das categorias da variável. A altura das
barras é denida pela frequências absolutas, ni , ou pelas relativas fi .

A linha a tracejado,
que une os extremos
das barras, chama-se
Polígono de
Frequências.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 30 / 184
Estatística Descritiva Representação tabular e gráca

Gráco de Frequência Acumulada

Um Gráco de Frequência Acumulada é um gráco de linha onde são


representadas das frequências absolutas, Ni , ou relativas, Fi . Para
categorias superiores à última a frequência acumulada toma o valor n, se
forem representadas as frequências Ni , ou 1, se forem representados as
frequências Fi

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 31 / 184
Estatística Descritiva Representação tabular e gráca

Histograma

Um Histograma é um gráco barras verticais adjacentes, com uma barra


associada a cada uma das classes da variável. A base da cada barra é
proporcional à amplitude da respectiva classe e a área proporcional às
frequencias absolutas, ni , ou relativas, fi

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 32 / 184
Estatística Descritiva Representação tabular e gráca

Caixa de Bigodes ou Boxplot

Uma Caixa de Bigodes ou Boxplot é um gráco que contém um


rectângulo, dividido em duas partes, que situa os quartis. Os bigodes da
caixa situam os pontos adjacentes inferior e superior, ou seja, o menor e
maior valores observados que ainda não são considerados observações
anómalas ou atípicas. Oa asteriscos identicam os valores anómalas, ou
seja, valores observados muito pequenos ou grandes.

AI Menor valor

Q1 e Q3 1º º
quartil e 3 quartil

x̃ Mediana

AS Maior valor

∗∗ Valores atípicos severos

Valores atípicos moderados

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 33 / 184
Estatística Descritiva Representação tabular e gráca

A (as)simetria da distribuição é indicada pela caixa central e pelo


comprimento dos bigodes, conforme a gura a baixo.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 34 / 184
Medidas Descritivas Introdução

As medidas fundamentais que se vão estudar numa distribuição de


frequência são:
1 Localização: localizam os valores oservados na distribuição
Tendência Central :Representam os fenómenos pelos seus valores
médios, em torno dos quais tendem a concentrar-se os valores
observados
Média, Mediana e Moda.
Tendência não Central : fornecem a localização dos valores da
variável.
Quantis (percentis, decis e quartis)
2 Dispersão: medem o grau de dispersão dos dados em torno de um
valor médio.
Absoluta: amplitude total, amplitude interquartil, desvio padrãoe
variância
Relativa: Coeciente de variação e coeciente de dispersão

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 35 / 184
Medidas Descritivas Introdução

3 Assimetria: Medem o grau de afastamento da simetria da


distribuição.
Grau de assimetria de Pearson, Grau de assimetria de Bowley,
Coeciente de assimetria de Fisher e Coeciente de assimetria amostral.
4 Achatamento: Medem a intensidade das frequências na vizinhança
dos valores centrais
Coeciente de Kurtosis, Coeciente percentil de Kurtosis e Coeciente
de Kurtosis amostral.

Tabela: Resumo das estatísticas mais úteis para cada escala de medida
Escala nominal Escala ordinal Escala Quantitativa
Moda. Moda, Quantis Moda, Quantis, Amplitude interquartil
Amplitude Amplitude total, Média, Desvio padrão
interquartil. Coeciente de variação, Assimetria, Achatamento.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 36 / 184
Medidas Descritivas Medidas de Localização

As Medidas de Localização informam sobre a localização de alguns


valores importantes da distribuição.

Média aritmética

A média aritmética,x̄ ou, abreviadamente, média, x̄, é a medida de


localização mais correctamente utilizada.

Dados Quantitativos

Não Agrupado Agrupado


k k k
1X 1X X
x̄ = xi (1) x̄ = ni x′i = fi x′i (2)
n n
i=1 i=1 i=1

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 37 / 184
Medidas Descritivas Medidas de Localização

Moda

A Moda, x̂ é o valor que ocorre com maior frequência.


Dados agrupados Contínuos
Dados não agrupados ou 1 Identicar a classe modal M o, a
agrupados qualitativo ou discreto classe com maior frequência;

2 O valor da moda é dado por:


Valor/Categoria que
surge com maior
frequência ∆1
x̂ = LIM o + acM o ∗
∆1 + ∆ 2
∆1 = nM o − nM o−1 e ∆2 = nM o − nM o+1
∆1 = fM o − fM o−1 e ∆2 = fM o − fM o+1

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 38 / 184
Medidas Descritivas Medidas de Localização

Mediana

A mediana, x̃, é o valor na amostra ordenada que tem tantos valores


inferiores ou iguais como superiores ou iguais a ele.

Dados

ordinais, discretos
ou não agrupados contínuos agrupados Contínuos
1 Ordenar a amostra por ordem 1 Identicar a classe Mediana Me
crescente; Ni = n/2 ou Fi = 0.5.;
2 Valor da mediana é dado por: 2 O valor da mediana é dado por:
(n/2) − NM e−1
x̃ = LIM e + acM e ∗
nM e
(x
n/2:n+ x(n/2)+1:n 0.5 − fM e−1
, par = LIM e + acM e ∗
x̃ = fM e
2
x(n+1)/2:n , ímpar

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 39 / 184
Medidas Descritivas Medidas de Localização

Comparação entre a média, mediana e moda

Através da análise do histograma é possível inferir sobre a assimetria da


distribuição. Uma distribuição de dados é assimétrica quando se estende
mais para um lado do que para o outro e é simétrica se a metade esquerda
de seu histograma é praticamente igual à sua metade direita, conforme a
gura 2.

Figura: Exemplos de assimetria

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 40 / 184
Medidas Descritivas Medidas de Localização

Figura: Exemplos de assimetria no histograma

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 41 / 184
Medidas Descritivas Tendência não central

Quantis

O Quantil Qp divide a amostra em duas partes:

na 1. ª parte 100 × p% dos elementos são menores ou iguais a Qp ;


na 2. ª parte 100 × (1 − p)% dos elementos são maiores ou iguais a Qp ;

p = 4i , i = 1, 2, 3;

 Quartis = Qi :
i
Qp = Decis = Di : p = 10 , i = 1, 2, ..., 9;
i
Percentis = Pi : p = 100 , i = 1, 2, ..., 99.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 42 / 184
Medidas Descritivas Tendência não central

Dados

ordinais, discretos agrupados Contínuos


ou não agrupados contínuos 1 Identicar a classe Quantil, Cq
1 Ordenar a amostra por ordem ou Ni = np ou Fi = p, i.e., a

crescente; classe que contém o quantil p;


2 Valor do quantil é dado por: 2 O valor do quantil é dado por:
(x
np:n + x[np+1]:n (np) − NCQ−1
, np par Qp = LICQ + acCQ ∗
Qp = 2 nCQ
x[np+1]:n , np ínteiro
p − fCQ−1
onde [np]=maior inteiro contido = LICQ + acCQ ∗
fCQ
no np

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 43 / 184
Medidas Descritivas Medida de Dispersão

As medidas de tendência central não são as únicas medidas necessárias


para caracterizar uma amostra (ou população). Métodos estatísticos
também são usados para ajudar a entender a variabilidade. Por
variabilidade, entende-se que sucessivas observações de um sistema ou
fenómeno que não produzem o mesmo resultado, então precisamos
também saber o quanto as observações na amostra estão "espalhadas". As
medidas de dispersão ou de variabilidade são medidas que informam sobre a
dispersão dos dados e são necessárias para, junto com a média, representar
bem um conjunto de observações.

Por outras palavras, as medidas de dispersão utilizam-se parar estudar a


concentração dos valores de um conjunto de dados em torno de uma
medida de localização central da amostra. Desta forma quanto menor for a
dispersão desses valores em relação à medida de localização central, mais
representativa será essa medida desse conjunto de dados.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 44 / 184
Medidas Descritivas Medida de Dispersão

Medidas absolutas

As medidas de dispersão absolutas dependem das unidades em que a


variável é expressa pelo que não servem para compara duas ou mais
distribuições relativamente à dispersão.


Amplitude total, a = xn:n − x1:n = máximo − mínimo
Amplitude interquartil, IQ = Q3 − Q1

Medidas absolutas=

 Desvio médio absoluta
Variância, Desvio padrão

Desvio médio absoluta

O Desvio médio absoluta, dm, é a medida dos desvios absoluta entre os


valores observados e a média.

Dados quantitativos

não agrupados agrupados


n k
1X 1X
dm=
n
|xi − x̄| dm = ni |x′i − x̄|
i=1 n
i=1
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 45 / 184
Medidas Descritivas Medida de Dispersão

Variância

A Variância amostral, s2 , é a medida dos quadrados dos desvios entre os


valores observados e a média.

Dados quantitativos

não agrupados agrupados


n k
X (xi − x̄)2 ni (x′i − x̄)2
s2 =
X
s2 =
n−1 n−1
i=1 i=1
n
!
n
!
1 X 1
x2i 2
X
= − x̄ = ni x′i 2 − nx̄ 2
n−1 n−1
i=1 i=1
Observações
Esta medida só assume valores não negativos e quanto maior o seu
valor maior a dispersão;

A variância tem como desvantagem o facto de ser expressa em


unidades ao quadrado, o que torna difícil a sua interpretação, razão
pela qual se utiliza o desvio padrão.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 46 / 184
Medidas Descritivas Medida de Dispersão

Desvio padrão amostral

A Desvio padrão amostral, s, é a √


medida de dispersão mais utilizada. O
Valor desta medida é dada fazendo variância.

Observações

Esta medida só assume valores não negativos e quanto maior o seu


valor maior a dispersão;

Para calcular o desvio padrão populacional, σ, basta substituir o


denominador do desvio padrão amostral n−1 por n.
Para distribuição amostral em forma de sino (simétrica) com média x̄
e desvio padrão s, tem-se:
i O intervalo x̄ − s contém aproximadamente 68% de todas as
observações amostrais;
ii O intervalo x̄ − 2s contém aproximadamente 95% das observações
amostrais para distribuições simétricas;
iii O intervalo x̄ − 3s contém aproximadamente 99,7% das observações
amostrais para distribuições simétricas

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 47 / 184
Medidas Descritivas Medida de Dispersão

Medidas Relativas

Coeciente de dispersão e Coeciente de Variação

O Coeciente de dispersão, CD e Coeciente de Variação, CV ,


medem o grau de concentração de valores em torno da média. E são dados
pelo quociente entre o desvio padrão e a média.

s s
CD = e CV = × 100
x̄ x̄

Observações

Estes coecientes só podem ser calculados quando a variável toma valores


de um só sinal, i.é., os valores são todos positivos ou são todos negativos;
Para valores inferiores a 50%, do coeciente de variação (ou 0.5 do
coeciente de dispersão) a media será tanto mais representativa quanto
menor o valor deste coeciente. Consequentemente, valores superiores a
50%, do coeciente de variação (ou 0.5 do coeciente de dispersão) indicam
uma pequena representatividade da média.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 48 / 184
Medidas Descritivas Medida de Dispersão

Exemplo de Gráco (Exercício 14 e 15)

1 No jardim-de-infância O Parque da Pequenada questionaram-se as


crianças com mais de 3 anos relativamente ao tipo preferido de
bebida. Das 160 crianças inquiridas, 30 indicaram o leite como a
bebida preferida, 10 referiram a água, 40 disseram os sumos naturais e
80 referiram os refrigerantes.
1 Dena e classique a variável em estudo.
2 Construa a tabela de frequências.
3 Qual é a frequência absoluta de alunos que preferem água?
4 Qual é a frequência relativa de alunos que preferem refrigerantes?
5 Represente gracamente a informação anterior.
2 Num inquérito realizado utentes de um determinado Centro de Saúde
sobre a qualidade do serviço, 27 armaram que o serviço foi muito
bom, 15 armaram que foi bom, 6 disseram que foi médio, 1
considerou que foi mau e 1 muito mau.
1 Identique a variável em estudo.
2 Construa a tabela de frequências.
3 Represente gracamente a informação anterior.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 49 / 184
Medidas Descritivas Medida de Dispersão

Resolução exemplo 1

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 50 / 184
Medidas Descritivas Medida de Dispersão

Continuação do Exercício 14. Dado Qualitativo Nominal

Determine e interprete a moda dos seguintes dados.

Tipo de Bebidas x′i N. º de Crianças (ni ) Prop. Crianças (fi )


Leite 1 30 0,188
Água 2 10 0,063
Sumos naturais 3 40 0,250
Refrigerantes 4 80 0,500
Total 160 1,000

Moda: x̂ = 4 = Refrigerantes (categoria com maior frequência).


O tipo de bebida que estas crianças preferem é o refrigerante.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 51 / 184
Medidas Descritivas Medida de Dispersão

Resolução exemplo 2

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 52 / 184
Medidas Descritivas Medida de Dispersão

Continuação do Exercício 15

Determine e interprete a mediana, a moda, os quartis, o 4 º decil, os


percentis 15 e 46 e a amplitude interquartil, dos dados apresentados.

Qualidade
x′i
N. ª de Prop. de N. º ac. de Prop.ac
de Serviço utentes untentes utentes utentes
Muito mau 1 1 0,02 1 0,02
Mau 2 1 0,02 2 0,04
Médio 3 6 0,120 8 0,16
Bom 4 15 0,30 23 0,46
Muito bom 5 27 0,54 50 1
Total 50 1,00

Mediana:
x25:50 + x26:50 5+5
n = 50(é par) → x̃ = = =5
2 2
Portanto, metade dos utentes considera que no mínimo a qualidade do
serviço foi muito boa.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 53 / 184
Medidas Descritivas Medida de Dispersão

Continuação Exercício 15

Moda:
x̂ = 5 = Muito bom (categoria com maior frequência). O mais frequente
foi os utentes considerarem que a qualidade de serviço prestado nesse

º
Centro de Saúde é Muito Bom.
1 Quartil:
p = 41 = 0, 25 =⇒ np = 12, 5(não é inteiro) =⇒ Q1 = x[12,5]+1:50 =
x[12]+1:50 = x13:50 = 4. Portanto, 25% dos utentes consideram que a
qualidade do serviço prestado foi no máximo (inferior ou igual) boa e,
portanto, os restantes 75% consideram que a qualidade do serviço foi no

º
mínimo (superior ou igual) boa.
3 Quartil:
p = 43 = 0, 75 =⇒ np = 37, 5(não é inteiro) =⇒ Q3 = x[37,5]+1:50 =
x38:50 = 5.
75% dos utentes consideram que a qualidade do serviço prestado foi no
máximo (inferior ou igual) muito boa e, portanto, os restantes 25%
consideram a qualidade do serviço prestado foi no mínimo (superior ou
igual) muito boa.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 54 / 184
Medidas Descritivas Medida de Dispersão

Continuação Exercício 15

4 º Decil ou 40
4
º Percentil:
x20:50 + x21:50
p= = 0, 4 → np = 20(é
10 inteiro) =⇒ D4 = P40 = =
2
4+4
=4
2
40% dos utentes consideram que a qualidade do serviço prestado foi no
máximo (inferior ou igual) boa e, portanto, os restantes 60% consideram
que o nível da qualidade do serviço prestado foi no mínimo (superior ou
igual) boa.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 55 / 184
Medidas Descritivas Medida de Dispersão

Exemplo de Gráco (Exercício 16)

Numa aula teórica de Estatística perguntou-se aos 50 alunos presentes


quantos livros leram durante as férias, tendo-se obtido os seguintes
resultados: 1 aluno leu 4 livros, 8 leram 3 livros, 27 leram 2 livros, 12 leram
apenas 1 livro e os restantes alunos não leram qualquer livro.

1 Identique a variável em estudo.

2 Construa a tabela de frequências.

3 Represente gracamente a informação anterior.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 56 / 184
Medidas Descritivas Medida de Dispersão

Resolução exemplo 2

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 57 / 184
Medidas Descritivas Medida de Dispersão

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 58 / 184
Medidas Descritivas Medida de Dispersão

Resolucção exercício 16

Considere a tabela de frequência abaixo:

N. ª de livros N. ª de Prop. de N. º ac. de Prop.ac


x′i alunos (ni ) alunos(fi ) alunos (Ni ) alunos (Fi )
0 2 0,04 2 0,04
1 12 0,24 14 0,28
2 27 0,54 41 0,82
3 8 0,16 49 0,98
4 1 0,02 50 1
Total 50 1,00

º º
Determine e interprete as medidas de localização de tendência central, os
quantis, o 1 e 9 decis, os percentis 82 e 95, a amplitude interquartil e a

º º º º º
amplitude total, a variância e o desvio padrão, o coeciente de variação e
dispersão, o 2 , 3 e 4 momentos centrais, o 2 momento, o 2 momento
em relação a 4 livros e estude a assimetria e achatamento dos dados.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 59 / 184
Medidas Descritivas Medida de Dispersão

x̄ = 1, 88
Em média os alunos leram mais do que um livro (1,88) livros nas férias de
verão.
Variância amostral:
s2 = 0, 6384.
Desvio padrão amostral:
√ √
s= s2 = 0, 6384 = 0, 799. O desvio típico em relação ao número
médio de livros lidos é 0,8 livros.
Coeciente de variação:
s
CV = ∗ 100 = 42, 5% < 50%. A média é representativa dos dados

(CV < 50%).

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 60 / 184
Medidas Descritivas Medida de Dispersão

Considere os dados, sobre as áreas dos jardins dos projetos aprovados, cuja
tabela de frequências segue abaixo:

º º º º
Determine e interprete as seguintes medidas estatísticas: média, mediana,
moda, amplitude interquartil, 1 e 7 decis, 36 e 90 percentis, variância,
desvio padrão, coecientes de dispersão e variação.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 61 / 184
Análise Bidimensional Introdução

É comum haver interesse em saber se duas variáveis quaisquer estão


relacionadas, e o quanto estão relacionadas, seja na vida prática, seja em
trabalhos de pesquisa, por exemplo:

Se o sexo dos funcionários de uma empresa está relacionado com a


função exercida;

Quanto a temperatura ambiente em uma região inuencia as vendas


de refrigerante;

Se o nível de escolaridade de um grupo de empreendedores está


relacionado com o grau de sucesso por eles alcançado.

Muitas vezes queremos vericar se há uma relação de causa e efeito entre


as duas variáveis (se as variáveis são dependentes ou não), se é possível
estudar uma das variáveis através da outra (que é mais fácil de medir)-
prever os valores de uma através dos valores da outra, ou calcular uma
medida de correlação ou de dependência entre as variáveis.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 62 / 184
Análise Bidimensional Introdução

Análise Bidimensional

Analisar o comportamento conjunto de duas ou mais variáveis aleatórias. o


objetivo é encontrar as possíveis relações ou associações entre as duas
variáveis. As duas variáveis abordadas podem ser Qualitativas ou
Quantitativas, e para cada tipo existe técnicas apropriadas para análise.

Quando consideramos duas variáveis (ou dois conjuntos de dados),


podemos ter três situações:
a as duas variáveis são Qualitativas;

b as duas variáveis são Quantitativas;


c uma variável Qualitativa e outra Quantitativa.

Para Variáveis Qualitativas estudaremos as Tabelas de Contingência,


Qui-Quadrado (χ) e o Coeciente de Contingência Modicado. Para
Variáveis quantitativas abordaremos Diagramas de Dispersão, Análise de
Correlação, Análise de Regressão Linear Simples, Coeciente de
Determinação e Análise de Resíduos.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 63 / 184
Análise Bidimensional Duas Variáveis Qualitativas

Variáveis Qualitativas

São as variáveis cujas realizações são atributos, categorias. Como exemplo


de variáveis qualitativas tem-se: sexo de uma pessoa (duas categorias,
masculino e feminino), grau de instrução (analfabeto, primeiro grau
incompleto, etc.), opinião sobre um assunto (favorável, desfavorável,
indiferente), etc.

Tabela de Contingência

É uma representação de dados bidimensional, quer de tipo qualitativo quer


do tipo quantitativo, que podem ser classicados segundo dois critérios.
Nesta tabela as linhas correspondem a um dos critérios e as colunas
correspondem ao outro critério. No interior da tabela, as células
correspondem ao número de observações, nij , que satisfazem
simultaneamente o critério da linha i e da coluna j.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 64 / 184
Análise Bidimensional Duas Variáveis Qualitativas

Tabela de Contingência

Exemplo

Analisar a tabela de contingências para as variáveis Sexo e Função dos


funcionários de uma empresa.

Função
Sexo Total
Escritório Serviços Gerais Gerência
Masculino 157 27 74 258
Feminino 206 0 10 216
Total 363 27 84 474
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 65 / 184
Análise Bidimensional Duas Variáveis Qualitativas

Podemos apresentar os percentuais calculados em relação aos totais das


colunas:

Função
Sexo Total
Escritório Serviços Gerais Gerência
Masculino 43,25 % 100 % 88,10 % 54 %
Feminino 56,75 % 0 % 11,90 % 46 %
Total 100 % 100 % 100 % 100 %

Seria interessante saber se as duas variáveis são estatisticamente


dependentes, e o quão forte é esta associação.Repare que os percentuais de
homens e mulheres em cada função são diferentes dos percentuais
Marginais (de homens e mulheres no total de funcionários), sendo que em
duas funções as diferenças são bem grandes.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 66 / 184
Análise Bidimensional Duas Variáveis Qualitativas

A Tabela de Contingências também é chamada de distribuição conjunta


das duas variáveis. Permite descrever o grau de associação existente
entre as duas variáveis: avaliando a "força"do relacionamento, e caso haja
uma associação forte pode-se prever os valores de uma variável através dos
da outra. Se as variáveis forem Independentes (ou seja, a associação
entre elas for fraca), as frequências na tabela de contingências devem
Totais Marginais. Se, porém,
distribuir-se de forma a seguir o padrão dos
Dependentes, as
houver uma associação entre as variáveis, elas forem
frequências deverão seguir algum padrão diferente daquele apresentado
pelos totais marginais.

Precisamos de uma estatística que relacione as frequências observados na


tabela de contingências com as Frequências Esperados se as duas
variáveis fossem independentes (se as frequências nos cruzamentos dos
valores das variáveis seguissem os padrões dos totais marginais). E quais
serão os valores das frequências esperadas?

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 67 / 184
Análise Bidimensional Duas Variáveis Qualitativas

Frequência Esperada

Frequências Esperadas para todas as células da tabela de contingências


diretamente, utilizando a seguinte fórmula:
total de linha i × total de linha j
Eij = (3)
total geral

Onde Eij é a frequência esperada, sob a condição de independência entre


as variáveis, em uma célula qualquer da tabela de contingências.

Qui-Quadrado

As frequências esperadas são necessárias para que possamos compará-las


com as observadas, sendo essa comparação materializada em uma
estatística, chamada de Qui-Quadrado: χ2 A expressão está descrita
abaixo:
L X
C 
(Oij − Eij )2
X 
2
χ = (4)
Eij
i=1 j=1

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 68 / 184
Análise Bidimensional Duas Variáveis Qualitativas

Onde L é o número total de linhas da tabela de contingências (número de


valores que uma das variáveis pode assumir), C é o número total de
colunas da tabela (número de valores que a outra variável pode assumir), e
Oij é a frequência observada em uma célula qualquer da tabela de
contingências. Então, para cada célula da tabela de contingências
calcula-se a diferença entre a frequência observada e a esperada

Observação

Para evitar que as diferenças positivas anulem as negativas as diferenças


são elevadas ao quadrado. E para evitar que uma diferença grande em
termos absolutos, mas pequena em termos relativos, "inacione"a
estatística, ou que uma diferença pequena em termos absolutos, mas
grande em termos relativos, tenha sua inuência reduzida, divide-se o
quadrado da diferença pela frequência esperada. Somam-se os valores de
todas as células e obtêm-se o valor da estatística.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 69 / 184
Análise Bidimensional Duas Variáveis Qualitativas

Vamos calcular Qui-Quadrado no exemplo acima "Sexo e Função dos


funcionários", começando por calcular as frequências esperadas de acordo
com a fórmula 3.

Observação

Quanto maior for o valor de χ2 maior será o grau de associação


entre as variáveis

Masculino - Escritório: E11 = (258 ∗ 363)/474 = 197, 58


Masculino - Serviços Gerais: E12 = (258 ∗ 27)/474 = 14, 70
Masculino - Gerência: E13 = (258 ∗ 84)/474 = 45, 72
Feminino - Escritório: E21 = (216 ∗ 363)/474 = 165, 42
Feminino - Serviços Gerais: E22 = (216 ∗ 27)/474 = 12, 30
Feminino - Gerência: E23 = (216 ∗ 84)/474 = 38, 28

Assim podemos calcular as diferenças entre as frequências e as demais


operações, que serão apresentado em tabelas.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 70 / 184
Análise Bidimensional Duas Variáveis Qualitativas

Função
(O - E)
Escritório Serviços Gerais Gerência
Masculino 157 - 197,58 27 - 14,70 74 - 45,72
Feminino 206 - 165,42 0 - 12,30 10 - 38,28

Função
(O − E)2
Escritório Serviços Gerais Gerência
Masculino 1646,921 151,383 799,672
Feminino 1646,921 151,383 799,672

Função
(O − E)2 /E
Escritório Serviços Gerais Gerência
Masculino 8,336 10,301 17,490
Feminino 9,956 12,304 20,891

Com esta última tabela podemos calcular o valor de Qui-Quadrado,


somando todos os valores:

χ2 = 8, 336 + 10, 301 + 17, 490 + 9, 956 + 12, 304 + 20, 891 = 79, 227
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 71 / 184
Análise Bidimensional Duas Variáveis Qualitativas

Coeciente de Contingência Modicado

permite quanticar a associação (grau de dependência) entre duas variáveis


Qualitativas, a partir da estatística χ2 e obtido da seguinte forma:

s r
∗ χ2 k
C = × (5)
χ2 + N k−1

onde χ2 é a estatística Qui-Quadrado, calculada a partir das frequências


observadas e esperadas (sob a condição de independência) a partir da
tabela de contingências.
N é o número total de observações da tabela de contingências.
k é o menor número entre o número de linhas e colunas da tabela de
contingências.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 72 / 184
Análise Bidimensional Duas Variáveis Qualitativas

O Coeciente de Contingência Modicado varia de zero (completa


independência) até 1 (associação perfeita).

Figura: Variação da associação entre as variáveis pelo Coeciente de Contingência


Modicado C*

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 73 / 184
Análise Bidimensional Duas Variáveis Qualitativas

Calcular o Coeciente de Contingência Modicado para os dados do


exemplo. O valor de χ2 foi calculado, a variável Sexo pode assumir 2
valores e Função pode assumir 3. O total de observações é igual a 474.
Então:

χ2 = 79, 22, N = 474e k = 2(porque é o menor valor entre 2 e 3)

s r r
χ2
r
k 79, 22 2 ∼
C =∗
× = × = 0,54
χ2 + N k−1 79, 22 + 474 2−1

Conclusão

Então a associação pode ser considerada moderada.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 74 / 184
Análise Bidimensional Duas Variáveis Qualitativas

Exemplo

Vericar se existe associação entre a vacinação e a manifestação de uma


doença numa amostra de 200 pessoas.

Doenças (Y)
Vacinação (X) Total
Não Contraíram Contraíram
Vacinados 100 20 120
Não Vacinados 40 40 80
Total 140 60 200

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 75 / 184
Análise Bidimensional Duas Variáveis Qualitativas

Exemplo 2

Há indícios de associação entre o sexo e o hábito de fumar?

Hábito de fumar
Sexo Total
Fuma Não fuma
Masculino 20 37 57
Feminino 8 27 35
Total 28 64 92

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 76 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Análise de Correlação e Regressão

Muitas vezes também estamos interessados em avaliar o relacionamento


entre variáveis QUANTITATIVAS, sejam elas discretas ou contínuas.
Basicamente dois tipos de análise podem ser realizados: Análise de
Correlação e Análise de Regressão.
Na análise de correlação e regressão há interesse em, a partir de dados de
uma amostra aleatória, vericar SE e COMO duas ou mais Variáveis
Quantitativas relacionam-se entre si em uma população, fornecendo:

um número que resume o relacionamento entre as variáveis, indicando


a força e a direção do relacionamento, isto para Análise de
Correlação;

uma equação matemática que descreve a Natureza do relacionamento


entre as duas variáveis, permitindo inclusive que sejam feitas previsões
dos valores de uma delas em função dos valores das outras,para
Análise de Regressão.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 77 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Análise de Correlação e Regressão

Observação

Quando há apenas duas variáveis envolvidas a Análise de Regressão é


chamada Simples e quando há mais de duas variáveis temos a Análise de
Regressão Múltipla.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 78 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Diagrama de Dispersão

Na analise de duas Variáveis Quantitativas, cujas observações constituem


pares ordenados, chamando estas variáveis de X (independente) e Y
(dependente), podemos efectuar o gráco do conjunto de pares ordenados
(x, y) em um diagrama cartesiano, que é chamado de Diagrama de
Dispersão.
O diagrama de dispersão fornece uma idéia inicial de como as variáveis
estão relacionadas: a direção da correlação (isto é, o que ocorre com os
valores de Y quando os valores de X aumentam, eles aumentam também
ou diminuem), a força da correlação (em que taxa os valores de Y
aumentam ou diminuem em função de X) e a natureza da correlação (se é
possível ajustar uma reta, parábola, exponencial, etc., aos pontos).

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 79 / 184
Análise Bidimensional Duas Variáveis Quantitativas

No diagrama percebe-se dois


aspectos:

à medida que a variável X


aumenta, os valores de Y
tendem a aumentar também.

seria perfeitamente possível


ajustar uma reta crescente.

Então Concluí-se que existe uma


Correlação linear (porque é possível
ajustar uma reta aos dados) positiva
(porque as duas variáveis aumentam
seus valores conjuntamente).

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 80 / 184
Análise Bidimensional Duas Variáveis Quantitativas

No diagrama percebe-se dois


aspectos:

à medida que a variável X


aumenta, os valores de Y
tendem a diminuir.

seria perfeitamente possível


ajustar uma reta decrescente.
Então Concluí-se que existe uma
Correlação linear (porque é possível
ajustar uma reta aos dados)
Negativa (porque quando uma das
variáveis aumentam seus valores, a
outra diminui).

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 81 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Analisando o diagrama ao lado,


nota-se que não há alguma espécie
de correlação entre as variáveis: os
pontos apresentam claramente um
padrão, semelhante a um círculo.
Contudo, não se trata de uma relação
linear, pois seria totalmente
inadequado ajustar uma reta aos
dados (os resíduos seriam muito
grandes). Assim, há correlação,
mas não é linear.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 82 / 184
Análise Bidimensional Duas Variáveis Quantitativas

No caso do diagrama ao lado é óbvio


que, temos uma situação totalmente
diversa dos casos anteriores. NÃO
HÁ padrão nos pontos, linear ou não
linear, os pontos parecem distribuir-se
de forma aleatória. Então, conclui-se
que NÃO HÁ CORRELAÇÃO
entre as duas variáveis.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 83 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Coeciente de Correlação Linear de Pearson

Através do diagrama de dispersão é possível identicar se há correlação


linear, e se a correlação linear é positiva ou negativa. Quanto mais o
diagrama de dispersão aproximar-se de uma reta mais forte será a
correlação linear.
É interessante notar que alguns erroneamente confundem inexistência de
correlação linear com inexistência de correlação entre as duas variáveis.
Duas variáveis podem apresentar uma forte correlação não-linear, conforme
visto anteriormente.
Se após observar o diagrama de dispersão decidir-se que é razoável
considerar que as variáveis possuem um relacionamento linear é
possível mensurar a direção e a força desse relacionamento através
de um coeciente de correlação: o coeciente de correlação linear
de Pearson. Este coeciente é chamado de ρ quando são usados dados da
população, e de r quando usados dados de uma amostra (mais comum).

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 84 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Trata-se de um coeciente adimensional, amostral, que pode ser expresso


por:

Pn
i=1 (xi − x̄)(yi − ȳ)
Cov(X, Y ) n−1
r= = (6)
SX SY SX SY
O numerador da expressão (6) é chamado de Covariância de X e Y, que
permite mensurar o relacionamento entre as variáveis. A Covariância é
dividida pelos desvios padrões de X e Y para que seja eliminado o efeito
que uma variável com maiores valores numéricos causaria no resultado.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 85 / 184
Análise Bidimensional Duas Variáveis Quantitativas

A covariância permite mensurar o relacionamento entre X e Y:


quando os valores de X e Y são ambos grandes ou ambos pequenos
(as distâncias em relação às médias têm o mesmo sinal) a covariância
será grande e positiva.

quando o valor de X é alto e o de Y é baixo (ou vice-versa) a


covariância será grande e negativa. dividindo-a por n−1 o seu valor
não será mais afetado pelo tamanho da amostra.

A forma do coeciente de correlação linear de Pearson mais utilizada

Pn Pn Pn
n i=1 (xi yi ) − p
i=1 xi i=1 yi
r = p Pn Pn n Pn
n i=1 (x2 ) − ( i=1 xi )2 × n i=1 (y 2 ) − 2
P
( i=1 yi )

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 86 / 184
Análise Bidimensional Duas Variáveis Quantitativas

O coeciente de correlação linear de Pearson pode variar de -1 a +1, e é


adimensional (sem unidade):

se r = -1 signica que há uma correlação linear negativa perfeita entre


as variáveis;

se r = +1 signica que há uma correlação linear positiva perfeita entre


as variáveis;

se r = 0 signica que não há correlação linear entre as variáveis.

se |r| > 0,7 a correlação linear pode ser considerada forte.

Oservação

Um alto coeciente de correlação linear de Pearson (próximo a +1 ou a -1)


não signica uma relação de causa e efeito entre as variáveis, apenas que
as duas variáveis apresentam aquela tendência de variação conjunta.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 87 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Exemplo

Estamos avaliar as médias de 15 estudantes no ensino médio,


relacionando-as com os índices dos mesmos estudantes no seus cursos
universitários. As médias no ensino médio podem variar de 0 a 100, e os
índices na universidade de 0 a 4, conforme a tabela abaixo. Construa um
diagrama de dispersão e calcule o coeciente de correlação linear de
Pearson para os dados a seguir. Interprete os resultados encontrados.

Média 80,0 82,0 84,0 85,0 87,0 88,0 88,0 89,0 90,0 91,0 91,0
Índice 1,0 1,0 2,1 1,4 2,1 1,7 2,0 3,5 3,1 2,4 2,7

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 88 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Figura: Diagrama de dispersão entre a médias e índice

Observando o diagrama acima consegue-se nota-se que há uma correlação


positiva entre as duas variáveis: de uma maneira geral, quanto maior o
valor da média no ensino médio maior o índice na universidade. Além disso,
é possível pensar em ajustar uma reta aos dados, que passasse por entre os
pontos, e tal reta seria crescente (pois a correlação é positiva).
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 89 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Então, por ser possível ajustar uma reta aos dados, e os valores das
variáveis caminham na mesma direção, há uma correlação linear positiva
entre média no ensino médio e índice na universidade, ao menos para este
conjunto de dados: ou seja, para valores MAIORES de média no ensino
médio esperam se valores também MAIORES de índice na universidade, e
vice-versa, permitindo usar uma equação de reta para prever o índice na
universidade de um aluno a partir da sua média no ensino médio.
A correlação linear é forte?

Observação

Quanto mais os pontos estiverem próximos da reta hipotética ajustada aos


dados mais forte será a correlação.

No diagrama da acima os pontos estão próximos uns dos outros, estariam a


Conclui-se, então,
pouca distância de uma reta que passasse entre eles.
que a correlação linear deve ser forte, o que resultará em um
coeciente de correlação linear de Pearson próximo de 1. Para
calcular o coeciente é preciso obter alguns somatórios.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 90 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Resolução

Média no ensino Índice na


X2 Y2 X ∗Y
de médio X Universidade Y
80,0 1,0 6400 1,0 80,0
82,0 1,0 6724 1,0 82,0
84,0 2,1 7056 4,41 176,4
85,0 1,4 7225 1,96 119,0
87,0 2,1 7569 4,41 182,7
88,0 1,7 7744 2,89 149,6
88,0 2,0 7744 4,0 176,0
89,0 3,5 7921 12,25 311,5
90,0 3,1 8100 9,61 279,0
91,0 2,4 8281 5,76 218,4
91,0 2,7 8281 7,29 245,7
92,0 3,0 8464 9,0 276,0
94,0 3,9 8836 15,21 366,6
96,0 3,6 9216 12,96 345,6
98,0 4,0 9604 16,0 392,0

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 91 / 184
Análise Bidimensional Duas Variáveis Quantitativas

P15 P15 P15 2


i=1
P15 2x i = 1335, 0 ;
P15i=1 y i = 37, 5, 0 ; i=1 xi = 119165, 0;
y
i=1 i = 107, 8 ; i=1 x i ∗ y i = 3400, 5
Vamos agora substituir os valores na equação do coeciente de correlação
linear de Pearson:

Pn Pn Pn
n i=1 (xi yi ) − p
i=1 xi i=1 yi
r = p Pn Pn n = 0, 9
n i=1 (x2 ) − ( i=1 xi )2 × n i=1 (y 2 ) − ( ni=1 yi )2
P P

Concluímos que, o coeciente de correlação linear de Pearson teve


resultado positivo, é próximo de 1, indicando forte correlação linear positiva
entre a média no ensino médio grau e o índice na universidade ao menos
para estes estudantes.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 92 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Análise de Regressão

Os modelos de regressão são largamente utilizados em diversas áreas do


conhecimento. O principal objetivo desta técnica é obter uma equação que
explique satisfatoriamente a relação entre uma variável resposta e uma ou
mais variáveis explicativas, possibilitando fazer predição de valores da
variável de interesse. Se apenas duas variáveis estão envolvidas chama-se
de Regressão Simples, se há mais de uma variável independente (e
apenas uma dependente) chama-se de Regressão Múltipla.

Figura: Formas lineares e não lineares de relação entre pares de variáveis

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 93 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Análise Regrssão Linear Simples

Se uma relação linear é válida para sumarizar a dependência observada


entre duas variáveis quantitativas, então a equação que descreve esta
relação é dada por:

Y = a + bX (7)

onde Pn
(x y ) − ni=1 xi ni=1 yi
P P
n
b= Pn i i 2
i=1 Pn (8)
n i=1 (xi ) − ( i=1 xi )2
n ni=1 yi − b ni=1 xi
P P
a= (9)
n

Esta relação linear entre X e Y é determinística, ou seja, ela arma que


todos os pontos caem exatamente em cima da reta de regressão. No
entanto este fato raramente irá ocorrer, ou seja, os valores observados não
caem todos exatamente sobre esta linha reta. Existe uma diferença entre o
valor observado e o valor fornecido pela equação.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 94 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Esta diferença é denominada erro e é representada por ε , é uma variável


aleatória que quantica a falha do modelo em ajustar-se aos dados
exatamente. Tal erro pode ser devido ao efeito, dentre outros, de variáveis
não consideradas e de erros de medição. Incorporando esse erro à equação
acima temos:

Y = a + bX + ε (10)

que é denominado modelo de regressão linear simples. a e b são os


parâmetros do modelo.
A variável X, denominada variável regressora, explicativa ou independente,
é considerada uma variável controlada pelo pesquisador e medida com erro
desprezível. Já Y, denominada variável resposta ou dependente, é
considerada uma variável aleatória, isto é, existe uma distribuição de
probabilidade para Y em cada valor possível de X. É muito freqüente, na
prática, encontrarmos situações em que Y tenha distribuição Normal. Este
é um dos principais pressupostos para aplicação desta técnica

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 95 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Coeciente de Determinação

O quadrado do coeciente de correlação de Pearson é chamado de


Coeciente de Determinação ou simplesmente R2 , que descreve a
proporção da variabilidade média de X que é explicada pela variação de Y
através do modelo de regressão (QUALQUER modelo). Sua fórmula geral
é:

Pn
2 (Ŷ − Ȳ )2 variância explicativa
R = Pni=1 2
= (11)
i=1 (Yi − Ȳ ) variância total

Para o caso linear o R2 será simplesmente o quadrado do coeciente de


correlação linear de Pearson (R), e como ele será um valor adimensional,
mas pode variar apenas de 0 a +1. O R2 é uma boa medida da aderência
do modelo de regressão aos dados, quanto mais próximo de +1 maior a
parcela da variabilidade média total de Y que é explicada pela variação de
X através do modelo.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 96 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Para R2 superiores a 0,5 (mais de 50% da variabilidade média total de Y é


explicada pela variação de X através do modelo de regressão). Para o caso
linear isso signica que o módulo do coeciente R deve ser maior do que
0,7 para que a regressão linear seja uma boa opção.

Observação

Embora útil, o coeciente de determinação não é suciente para avaliar se


um modelo de regressão é apresenta bom ajuste aos dados. Precisamos
fazer uma análise dos resíduos do modelo.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 97 / 184
Análise Bidimensional Duas Variáveis Quantitativas

Exemplos

Calcule e interprete o resultado do coeciente de determinação para o


modelo linear ajustado do exemplo em estudo.
Como se trata de um modelo linear, podemos obter o coeciente de
determinação elevando o coeciente de correlação linear de Pearson ( ao
quadrado R2 = 0, 92 = 0, 81
Em média 81% da variabilidade de Y pode ser "explicada"pela
variabilidade de X através do modelo linear Ŷ = −13, 52 + 0, 18X .
Como o valor do coeciente de determinação é maior que 0,50, concluímos
que o modelo linear apropriado para os dados

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 98 / 184
Análise Bidimensional Variáveis Qualitativas e Quantitativas

1 Grácos: Box-plot e Grácos de médias


Podem ser utilizados para comparações entre diferentes grupos de
dados
2 Medidas resumo: Estatísticas descritivas para cada categoria do grupo
(médias, medianas, desvios-padrão, etc.

3 Fazer Teste de Hipóteses apropriado

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 99 / 184
Probabilidades Conceitos Básicos

Probabilidade

Probabilidade é a possibilidade, ou chance, de que um determinado


acontecimento venha a ocorrer, podendo ser, por exemplo, a chance de
retirar uma carta preta de um baralho de cartas, a chance de um indivíduo
preferir um produto em relação a outro ou ainda a chance de um novo
produto de mercado obter sucesso.
A teoria das probabilidades, área fundamental para o desenvolvimento da
inferência estatística e também responsável pela modelação de fenómenos
cujo comportamento depende de componente aleatória.

Designa-se por fenómeno aleatório os fenómenos inuenciados pelo


acaso, no sentido de que não é possível prever de forma determinística o
seu futuro, a partir do passado.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 100 / 184
Probabilidades Conceitos Básicos

A seguir temos alguns conceitos importantes dentro da probabilidade:

Experiência Aleatória

é qualquer processo que permite fazer observações, sem prever o


acontecimento.
Uma experiência ou fenómeno que, se for observado em condições
idênticas, pode apresentar diferentes resultados é chamado de
experiência ou fenómeno aleatório.

Espaço Amostral ou de resultados

Conjunto (não vazio) de todos os possíveis resultados de uma experiência


ou fenómeno aleatório, designado por Ω (ómega). Diz-se:

Discreto: quando o espaço de resultados é nito ou innito


numerável;

Contínuo: quando o espaço de resultados é nito não numerável.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 101 / 184
Probabilidades Conceitos Básicos

Exemplos

Experiência E1 : Observações da face no lançamento de um dado


Ω1 = {1, 2, 3, 4, 5, 6}
Experiência E2 : Observação do número de avarias registadas num
elevador durante a sua vida útil.
Ω2 = {1, 2, 3, ..., n, ...}
Experiência E3 : Observação do intervalo de tempo entre chegadas
sucessivas de dois alunos ao bar da universidade.
Ω = [0; +∞[

Acontecimento

É um subconjunto do espaço amostral Ω, de um experiência aleatório, será


representado letras maiúsculas A, B, C, .... Os acontecimento podem ser:
Elementares: quando o subconjunto é singular (com um só
elemento);

Compostos: quando o subconjunto não é singular.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 102 / 184
Probabilidades Conceitos Básicos

Exemplo

Elementar A = {Saída da face 2} = {2}


Composto A = {Saída da face múltiplo de 3} = {2}

Terminologia

Conjuntos Acontecimentos
Ω Acontecimento certo
∅ Acontecimento impossível
ω∈Ω Acontecimento elementar

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 103 / 184
Probabilidades Álgebra dos Acontecimentos

Seja A e B forem dois acontecimentos, A⊆Ω e B ⊆ Ω.


Acontecimentos

Designa-se por União, A ∪ B , o Designa-se por Interseção, A ∩ B , o


acontecimento que ocorrerá se, e acontecimento que ocorrerá se, e
somente se, pelo menos um dos somente se, ambos acontecimentos,
acontecimentos, A ou B, ocorrer. A e B, ocorrerem.

Designa-se acontecimento impossível, ∅, o acontecimento que nunca


ocorre qualquer que seja o resultado da experiência aleatória.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 104 / 184
Probabilidades Álgebra dos Acontecimentos

Diz-se que osacontecimentos A e B são mutuamente exclusivos,


disjuntos ou incompatíveis, quando não possuem elementos em comum
(A ∩ B = ∅) ou seja não ocorrem em simultâneo.

Acontecimento

Designa-se por diferença, A − B ou


A/B , o acontecimento que ocorre
quando ocorre A mas não ocorre B.

Designa-se por complemento, Ā ou


Ω − A, o acontecimento que ocorre
se, A não ocorre e é constituído por
todos os resultados do espaço
amostral não favoráveis à ocorrência
de A.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 105 / 184
Probabilidades Álgebra dos Acontecimentos

Exemplos
Experiência E1 : Observação da face no lançamento de um dado.

Ω = {1, 2, 3, 4, 5, 6}

Acontecimentos

A = {saída de face par} = {2, 4, 6} ;


B={saída de face múltipla de 3} = {3, 6} ;
C={saída de face 2} = {2} ;
D={saída de face múltipla de 2} = {2, 4, 6} ;

Acontecimento União
A ∪ B = {saída de face par ou múltipla de 3} = {2, 3, 4, 6}
Acontecimento Interseção
A ∩ B = {saída de face par ou múltipla de 3} = {6}

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 106 / 184
Probabilidades Álgebra dos Acontecimentos

Probabilidade

Uma função P(.) é denominada probabilidade se

0 ⩽ P (A) ⩽ 1, ∀ ⊂ Ω;
P (Ω) = 1;

n n
!
[ X
P Aj = P (Aj ), ondeAi ∩ Aj = ∅parai ̸= j
i=1 j=1

Denição Clássica de Probabilidade

Se um experiência aleatório tivern(Ω) resultados mutuamente exclusivos


e igualmente possíveis e, se um acontecimento A tiver n(A) desses
resultados, a probabilidade do acontecimento A, representada por P (A), é
dada por

n(A)
P (A) = n(Ω)

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 107 / 184
Probabilidades Denição de Probabilidades

Frequencista de Probabilidade

Considere que um experimento aleatório seja realizado n vezes e seja n(A)


o número de vezes que o acontecimento (acont.) A acorre. A frequência
relativa de A, nesse caso, é dada por:
n(A) frequência do acont. A
fn (A) = = , 0 ⩽ fn (A) ⩽ 1.
n Total das observações

Exemplo

Lança-se um dado e observa-se a face que cai voltada para cima. O espaço
amostral é S = {1, 2, 3, 4, 5, 6}. Vejamos Alguns acontecimentos são:
A: O número observado é par={2, 4, 6} ,
B: O número observado é maior que 3={4, 5, 6} ,
C: O número observado é maior que 4 ={5, 6} .

Se acreditarmos que o dado é justo (todas as faces têm a mesma chance),


então usaríamos
1
P (1) = P (2) = P (3) = P (4) = P (5) = P (6) = . Neste caso, calcular
6
P(A) e P(B).
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 108 / 184
Probabilidades Propriedades de Probabilidades

Propriedades de Proabilidade

Seja ϵ uma experiência e Ω o espaço amostral associado ao mesmo. A cada


acontecimento A desse espaço amostral associamos uma medida P (A),
denominada probabilidade de A, que deve satisfazer:

0 ⩽ P (A) ⩽ 1;
P (Ω) = 1;
Se A e B são mutuamente exclusivo (disjuntos) A ∩ B = ∅, então
P (A ∪ B) = P (A) + P (B)
Generalizando, se os acontecimentos A1 , A2 , ..., An , forem
mutuamente exclusivo, então

n
X
P (A1 ∪ A2 ∪, ..., ∪An ) = P (A1 ) + P (A2 ) + ... + P (An ) = P (Ai )
i=1

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 109 / 184
Probabilidades Propriedades de Probabilidades

Se A e B são acontecimento quaisquer então


P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
P (A) = 1 − P (Ā)
P (A − B) = P (A) − P (A ∩ B)
P (A ∪ B) ⩽ P (A) + P (B)
Se A⊂B então P (A) ⩽ P (B), P (B) > 0

Exemplo

Considere e classique o espaço amostral de resultados associados às


seguintes experiências aleatórias:
a Lançamento de um dado não viciado

b Lançamento de dois dados não viciados


c Lançamento de uma moeda até ao aparecimento de coroa

d Escolha de um número aleatório ao conjunto dos números naturais

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 110 / 184
Probabilidades Propriedades de Probabilidades

Exercícios
1 Suponha que há três revistas, A, B, C , com as seguintes percentagens
de leitura:

A − 9, 8%, B − 22, 9%, C − 12, 1%, A e B − 5, 1%, A e


C − 3, 7%, B e C − 6, 0%, A, B e C − 2, 4%
Calcule a probabilidade de uma pessoa escolhida ao acaso ser leitor:

a De pelo menos uma das revistas

b Da revista A e B mas não a revista C


c Da revista A mas não das revistas B e C

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 111 / 184
Probabilidades Propriedades de Probabilidades

Resolução

Acontecimentos:
A = a pessoa escolhida, ao acaso, é leitor da revista A;
B = a pessoa escolhida, ao acaso, é leitor da revista B ;
C = a pessoa escolhida, ao acaso, é leitor da revista C .
a) P (A ∪ B ∪ C) =
P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) + P (B ∩ C) − P (A ∩ B ∩ C)
b) P (A ∩ B ∩ C̄) = P (A ∩ B) − P (C)
c) P (A ∩ B̄ ∩ C̄)

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 112 / 184
Probabilidades Probabilidade Condicional

Consideremos o lançamento de um dado equilibrado. Já vimos que o


espaço amostral desse experimento é Ω = 1, 2, 3, 4, 5, 6. Considere o
acontecimento A = sair face 2. Se não temos qualquer informação além
1
de o dado ser equilibrado, vimos que P (A) = 6.
Suponhamos, agora, que o dado tenha sido lançado e a seguinte
informação fornecida: saiu facer par. Qual é a probabilidade de ter saído
face 2? Note a diferença: agora nós temos uma informação parcial sobre a
experiência e devemos usa-la para reavaliar a nossa estimativa. Mais
precisamente, sabemos que ocorreu o acontecimento B= face par. Com
essa informação, podemos nos concentrar no acontecimento B = 2, 4, 6,
uma vez que as faces 1, 3, 5 cam descartadas em função da informação
dada. Dentro dessas três possibilidades, a probabilidade do evento A passa
1
a ser
3.

Calculamos, assim, a probabilidade do acontecimento A, sabendo que


ocorreu o acontecimento B.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 113 / 184
Probabilidades Probabilidade Condicional

Em muitos casos, estamos em condição de atualizar as informações de um


fenómeno aleatório pois uma determinada etapa pode inuenciar nas
probabilidades de ocorrências das etapas sucessivas, ou seja, calcular
probabilidades condicionais.

Probabilidade Condicional

A e B são dois acontecimento em um mesmo espaço amostral Ω. A


probabilidade condicional de A dado que ocorreu o acontecimento
B, denotada por P (A|B), é denida como

P (A ∩ B)
P (A|B) = , P (B) > 0 (12)
P (B)
Invertendo a expressão acima, obtém-se a importante relação:

P (A ∩ B) = P (A|B)P (B) = P (B|A)P (A), P (B) > 0, P (A) > 0 (13)

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 114 / 184
Probabilidades Probabilidade Condicional

Exempos 1

Consideremos, agora, o lançamento de dois dados equilibrados e os


acontecimentos A = soma das faces é par e B = soma das faces é maior
ou igual a 9. Se sabemos que ocorreu B, qual é a probabilidade de ter
ocorrido A? Queremos calcular P (A|B). Temos como espaço amostral de
lançamento de dois dados equilibrados:

(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)


(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

Assim, podemos obter o espaço amostral dos acontecimentos A e B:



B = (3, 6), (4, 5), (4, 6), (5, 4), (5, 5), (5, 6), (6, 3), (6, 4), (6, 5), (6, 6)

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 115 / 184
Probabilidades Probabilidade Condicional

 
(1, 1), (1, 3), (1, 5), (2, 2), (2, 4), (2, 6), (3, 1), (3, 3), (3, 5),
A=
(4, 2), (4, 4), (4, 6), (5, 1), (5, 3), (5, 5), (6, 2), (6, 4), (6, 6)

Se ocorreu B, a única chance de ter ocorrido A é que tenha ocorrido o


acontecimento


P (A ∩ B) = (4, 6), (5, 5), (6, 4), (6, 6)
e, nesse caso, a probabilidade é dada por

4
P (A ∩ B) 36 4
P (A|B) = = 10 =
P (B) 36
10

se sabemos que aconteceu o evento B, esse evento passa a ser o novo


espaço amostral e nesse novo espaço amostral, a única parte de A
presente é P (A ∩ B), conforme se ilustra no diagrama sobre interseção
entre acontecimentos.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 116 / 184
Probabilidades Probabilidade Condicional

Exemplo 2

Um grupo de 100 alunos foi classicado quanto ao sexo e à atividade de


lazer preferida, obtendo-se a distribuição dada na tabela abaixo.

Actividade de Lazer
Sexo Total
Cinema Praia Desporto
Masculino 10 12 13 35
Feminino 15 41 9 65
Total 25 53 22 100

1 Qual é a probabilidade de uma pessoa escolhida ao acaso neste grupo


ser do sexo masculino?

2 Se a pessoa escolhida prefere a praia como atividade de lazer, qual é a


probabilidade de que seja um homem?

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 117 / 184
Probabilidades Probabilidade Condicional

Solução

Começamos por denir os eventos: M = masculino; F = feminino; C =


cinema; P =praia; E = Desperto.

1 O problema pede P (M ). Como há 35 homens dentre as 100 pessoas,


temos que
35
P (M ) =
100
2 O problema pede P (M |P ). Por denição,

P (M ∩ P ) 12
12
P (M |P ) = = 100
53 = 53
P (P ) 100

Observação

Note que a probabilidade do evento aluno do sexo masculino se modica


quando sabemos que a pessoa prefere a praia como atividade de lazer, isto
é: P (M |P ) ̸= P (M ).

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 118 / 184
Probabilidades Probabilidade Condicional

Exemplo 3

De um total de 500 empregados, 200 possuem plano pessoal de


aposentadoria complementar, 400 contam com o plano de aposentadoria
complementar oferecido pela empresa e 200 empregados possuem ambos os
planos. Sorteia-se aleatoriamente um empregado dessa empresa.

1 Qual é a probabilidade de que ele tenha algum plano de aposentadoria


complementar?

2 Qual é a probabilidade de que ele não possua qualquer plano de


aposentadoria complementar?

3 Se o empregado conta com o plano de aposentadoria complementar


oferecido pela empresa, qual é a probabilidade de que ele tenha plano
pessoal de aposentadoria complementar?

4 Se o empregado tem plano pessoal de aposentadoria complementar,


qual é a probabilidade de que ele conte com o plano de aposentadoria
complementar da empresa?

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 119 / 184
Probabilidades Probabilidade Condicional

Solução

Vamos denotar por E o acontecimento empregado tem o plano


aposentadoria complementar da empresa e por P o acontecimento
empregado possui plano pessoal de aposentadoria complementar. O
problema diz que

200
P (P ) = 500 = 25 ; P (E) = 400
500 = 45 ; P (P ∩ E) = 200
500 = 2
5

Note que essas informações podem ser dispostas no formato de tabela da


seguinte forma:

Plano pessoal
Total
Sim Não
Plano da Sim 200 200 400
empresa Não 0 100 100
Total 200 300 500

Os números em negrito são as informações dadas no problema; o restante é


calculado observando-se os totais de linha e de coluna.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 120 / 184
Probabilidades Probabilidade Condicional

O problema pede

1 P (P ∪ E) = P (P ) + P (E) − P (P ∩ E)
2 P (P̄ ∩ Ē) = P (P ∪ E)
3 P (P |E)
4 P (E|P )

Exemplo 4

A seguir temos dados referentes a alunos matriculados em quatro cursos de


mestrado do Departamento de Ciências Exatas de uma grande universidade
no ano de 2005. Selecionando um aluno aleatoriamente, sabe-se que ele
está matriculado em Estatística. Calcule a probabilidade deste aluno ser do
sexo feminino.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 121 / 184
Probabilidades Probabilidade Condicional

Exemplo

Sexo
Curso
Homens Mulheres
Matemática 70 40
Matemática Aplicada 15 15
Estatística 10 20
Ciência da Computação 20 10

Solução

Se A e B indicam, respectivamente, os eventos "aluno é mulher"e "aluno


matriculado em Estatística", então P (A|B) será:

20
P (A ∩ B) 2
P (A|B) = = 200 =
P (B) 30 3
200

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 122 / 184
Probabilidades Probabilidade Independente

Regra de Multiplicação

A denição de probabilidade condicional pode ser rescrita para fornecer


uma expressão geral para a probabilidade da intersecção de dois eventos:

P (A ∩ B) = P (A|B) × P (B) = P (B|A) × P (A)

Acontecimentos Independentes

Sejam acontecimentos A e B são independentes, se a informação da


ocorrência ou não de B não altera a probabilidade da ocorrência de A, isto
é:

P (A ∩ B) = P (A), P (B) > 0 (14)

ou ainda a seguinte forma equivalente: P (A ∩ B) = P (A)P (B)

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 123 / 184
Probabilidades Probabilidade Independente

Se A e B são independentes então:

P (A ∩ B) = P (A), P (B) > 0


P (A ∩ B) = P (B), P (A) > 0
ou seja, o conhecimento da realização de B em nada afecta a probabilidade
de se realizar A e vice-versa.

Observação

A independência entre os acontecimentos A e B implica a independência


entre os acontecimentos A e B̄ , Ā e B , Ā e B̄ . Por exemplo:

P (A ∩ B̄) = P (A − B̄) = P (A) − P (A ∩ B)


= P (A) − P (A)P (B)
= P (A)(1 − P (B))
= P (A)P (¯(B))

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 124 / 184
Probabilidades Probabilidade Independente

Vejamos agora o conceito de independência para três acontecimentos:


dizemos que os eventos A, B, C são independentes se, e somente se:

i P (A ∩ B) = P (A)P (B)
ii P (A ∩ C) = P (A)P (C)
iii P (B ∩ C) = P (B)P (C)
iv P (A ∩ B ∩ C) = P (A)P (B)P (C)
Se apenas as três primeiras relações estiverem satisfeitas, dizemos que os
acontecimentos A, B, C são mutuamente independentes. É possível que
três acontecimentos sejam mutuamente independentes, mas não sejam
completamente independentes.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 125 / 184
Probabilidades Teorema de Probabilidade Total

Os acontecimentos A1 , A2 , ..., Ak dizem-se uma partição do espaço de


resultados Ω se:

1 Forem mutuamente exclusivos, i.e.:


Ai ∩ Aj = ∅, ∀ i̸= j com i, j = 1, 2, ..., k
2 A união de todos os acontecimentos é o espaço de resultados, i.e.:
Sk
A1 , A2 , ..., Ak = i=1 Ai =Ω
3 Todos os acontecimentos têm probabilidade não nula, i.e.:
P (Ai ) > 0, ∀ i=1,2,...,k

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 126 / 184
Probabilidades Teorema de Probabilidade Total

Probabilidade Total

Assim, considerando B um
acontecimento qualquer tal que
B ⊂ Ω, então B pode ser escrito da
seguinte forma:
B = (B∩A1 )∪(B∩A2 )∪...∪(B∩An )

Deste modo, a Probabilidade Total de B pode ser obtida, como segue.

P (B) = P (B ∩ A1 ) + P (B ∩ A2 ) + ... + P (B ∩ An )
Xn
= P (B ∩ An )
i=1 (15)

Xn
= P (B|Ai )P (Ai )
i=1

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 127 / 184
Probabilidades Teorema de Bayes

Frequentemente, começamos a análise com um cálculo de probabilidade


inicial ou prévia para acontecimentos de interesse especíco. Então, a
partir de fontes tais como uma amostra, um relatório especial, obtemos
dados adicionais sobre os acontecimentos. Com isto, atualizamos os valores
prévio da probabilidade calculando as probabilidades adicionais, denotadas
probabilidades posteriores. O Teorema de Bayes fornece um meio de
fazer esses cálculos de probabilidade.

Teorema de Bayes

Suponhamos que A1 , A2 , ..., Ak são acontecimentos mutuamente


exclusivos, cuja união é o espaço amostral Ω. Então, se B é um
acontecimento qualquer, temos que:

P (B|Ai )P (Ai ) P (B|Ai )P (Ai )


P (Ai |B) = =
P (B|A1 )P (A1 ) + · · · + P (B|Ak )P (Ak ) P (B)
(16)
Onde P (B) é a Probabilidade Total.
Isto nos permite encontrar as probabilidades de vários acontecimentos
A1 , A2 , ..., Ak que podem ser a causa de ocorrência de A.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 128 / 184
Probabilidades Teorema de Bayes

Exemplo 1

Numa fábrica, um certo tipo de chocolates é embalado em caixas e por


uma das 3 linhas de produção diferentes: M 1, M 2 e 3. Os registos
mostram que uma pequena percentagem das caixas não é embalada em
condições próprias para venda: 0,5% provêm de M 1, 0,8% de M2 e 1% de
M 3. Sabe-se que o volume diário de caixas embaladas por cada uma das
linhas de produção é de 500, 100 e 2000 unidades, respetivamente.
a Qual a probabilidade de uma caixa, escolhida ao acaso, não estar em
condições para venda?

b Sabendo que uma caixa não está em condições para venda, qual a
probabilidade de ser proveniente da linha de produção M 2?

Resolução

Acontecimentos:
M 1, M 2 e M 3: A caixa é embalada pela linha de produção M 1, M 2 M 3,


respectivamente.
D A caixa não está em condições para venda.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 129 / 184
Probabilidades Teorema de Bayes

M 1, M 2 e M3 são partição pois:

As caixas são embaladas apenas nas linhas de produção M 1, M 2 ou


M 3;
Uma caixa não pode ser embalada em duas linhas de produção em
simultâneo;

Todas as linhas de produção embalam caixas.

Portanto, pode-se aplicar o Teorema da Probabilidade Total e o Teorema


de Bayes para calcular as probabilidades pretendidas.

500 100
P (M 1) = 2600 = 0, 1923; P (M 2) = 2600 = 0, 0385;
2000
P (M 3) = 2600 = 0, 7692
P (D|M 1) = 0, 005 P (D|M 2) = 0, 008 P (D|M 1) = 0, 01
a P (D) =
P (D|M 1)P (M 1) + P (D|M 2)P (M 2) + P (D|M 3)P (M 3) = 0, 009
P (D|M 2)P (M 2)
b P (M 2|D) = = 0, 0343
P (D)
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 130 / 184
Probabilidades Teorema de Bayes

Exemplo 2

O Pedro entrou agora na universidade e foi informado de que há 30% de


possibilidade de vir a receber uma bolsa de estudo. No caso de a receber, a
probabilidade de se licenciar é de 0,85, enquanto que no caso de não a
obter, a probabilidade de se licenciar é de apenas 0,45.
a Diga ao Pedro qual é a probabilidade de ele se licenciar.

b Se, daqui a uns anos, encontrar o Pedro já licenciado, qual a


probabilidade de que tenha recebido a bolsa de estudo?

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 131 / 184
Probabilidades Teorema de Bayes

Exemplo 3

Numa urbanização recente, um inquérito aos moradores revelou que 5%


viviam em moradias, 20% em prédios em banda e os restantes em torres.
Alguns desses moradores foram aí instalados através de programas de
realojamento. Dos moradores que vivem em moradias 2% são realojados, o
mesmo acontecendo com 3% dos que vivem em prédios em banda e com
10% dos que vivem em torres. Escolhido ao acaso um dos habitantes dessa
urbanização, qual a probabilidade de:
a Ele ter sido alvo do programa de realojamento?

b Ele viver numa moradia sabendo que se trata de um realojado?

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 132 / 184
Variáveis Aleatórias Conceitos Básicos

Muitas vezes o espaço de resultados, ω, não é um conjunto numérico e o


estudo a realizar é bastante facilitado quando se atribui um número real, ,
ou conjunto ordenado de números reais, a cada elemento ω de Ω, i. e.,
ω ∈ Ω. Dene-se, assim, uma função X(ω) = x que se designa por variável
aleatória X.
Variável Aleatória

Uma variável aleatória (v.a), X , é uma função que a cada resultado ω∈Ω
associa um valor numérico X(ω) ∈ R.

Figura: Probabilidade utilizando a variável aleatória X

Se o conjunto de chegada de uma v.a. for constituído por elementos


expressos numa escala nominal ou ordinal, então diz-se que a variável é
qualitativa.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 133 / 184
Variáveis Aleatórias Conceitos Básicos

Se os elementos forem expressos numa escala numérica, então diz-se que a


variável é quantitativa.

A variável aleatória pode ser

Discreto: se o contradomínio for um conjunto nito ou innito


numerável.

Contínua: se o contradomínio for um conjunto innito não numerável.

Exemplo 3.1

Considere-se a experiência aleatória que consiste em lançar uma moeda ao


ar três vezes e registar a face que cou voltada para cima, face (F) ou
coroa (C). O espaço de resultados para esta experiência é:
Ω = (F, F, F ); (F, F, C); (F, C, F ); (C, F, F );
(F, C, C); (C, F, C); (C, C, F); (C, C, C).
Denindo X  v. a. que representa o número de faces voltadas para cima
em três lançamentos, então:
(F, F, F) =3 (F, F, C) = 2 (F, C, F) = 2 (C, F, F) = 2
(F, C, C) = 1 (C, F, C) = 1 (C, C, F) = 1 (C, C, C) = 0
Logo, x = X(Ω) = 0, 1, 2, 3.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 133 / 184
Variáveis Aleatórias Variável Aleatória Discreta

Função de Probabilidade

A função (massa) de probabilidade, f (x), da v. a.X designa a


probabilidade dessa variável tomar cada um dos valores do seu domínio D,
i. e.:


P (X = x) sex ∈D
f (x) = (17)
0 sex ∈
/D

Propriedade

Propriedades de f (x): A função f (x) tem que satisfazer as seguintes


condições:

1 0 ⩽ f (x) ⩽ 1, ∀x
P
x∈D f (x) = 1
2

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 134 / 184
Variáveis Aleatórias Variável Aleatória Discreta

Função de Distribuição

A função de distribuição, F (x), da v.a X corresponde à acumulação da


função de probabilidade para cada valor do domínio da variável, i. e.:

X
F (x) = P (X ⩽ x) = f (i) (18)
i⩽xD

Propriedades

A função F (x) tem que satisfazer as seguintes condições:

1 0 ⩽ f (x) ⩽ 1, ∀x
2 F (x1 ) ⩽ F (x2 ) ∀x com x1 < x2 , i.e., F (x) é uma função monótona
não crescente;

3 limx→∞ = 0 e limx→∞ = 1;
4 F (x) é continua à direita;

5 P (x1 < X ⩽ x2 ) = F (x2 ) − F (x1 ) ∀x x1 , x2 com x1 < x2

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 135 / 184
Variáveis Aleatórias Variável Aleatória Discreta

Exemplo

O custo unitário de um produto de rara procura comercialmente num


determinado estabelecimento é de 5 unidades monetárias, e o preço de
venda é de 7.5 unidades monetária. o abastecimento deste produto é feito
no início de cada semana, sabendo-se que tal produto se torna irrecuperável
se não for vendido na semana em causa. Considere a seguinte função de
probabilidade abaixo para a procura semanal, X, de uma unidade desse
produto.

xi 1 3 4 5 7
f(xi ) 0.1 0.3 0.2 0.3 0.1

Admitindo um stock inicial de 4 unidades, determine:


a A probabilidade de haver falha de stock.

b A probabilidade de haver sobras de stock.


c Determine a função de distribuição da v.a X

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 136 / 184
Variáveis Aleatórias Variável Aleatória Discreta

Exemplo

Consideremos a variável aleatória


X- Procura semanal de uma unidade do produto.
a) Seja o acontecimento A: "Ocorrência de falhas de stock", o qual se
verica se forem procuradas mais de 4 unidades do produto. Assim,

P (A) = P (X > 4) = P (X = 5 ∪ X = 7)
= P (X = 5) + P (X = 7)
= f (5) + f (7)
= 0.3 + 0.1 = 0.4
b) O acontecimento B: Existência de sobras de stock.

P (B) = P (X < 4) = P (X = 1 ∪ X = 3)
= P (X = 1) + P (X = 3)
= f (1) + f (3)
= 0.1 + 0.3 = 0.4
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 137 / 184
Variáveis Aleatórias Variável Aleatória Discreta

Uma variável aleatória discreta X tem função massa de probabilidade dado


por:

xi 0 1 2 3
P(X=xi ) 1/10 1/5 m 1/10

a Determine o valor de m
b Construir a função distribuição de variável aleatória de X
Resolução
b)


 0 se
x<0

0.1 se 0 ⩽ x < 1



F (x) = 0.1 + 0.2 = 0.3 se 1 ⩽ x < 2
0.3 + 0.6 = 0.9 se 2 ⩽ x < 3



0.9 + 0.1 = 1 se x ⩾ 3

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 138 / 184
Variáveis Aleatórias Variável Aleatória Discreta

Seja X a variável aleatória que representa o número de computadores


vendidos, por dia, numa loja de Centro Comercial. A distribuição de
probabilidade da v.a X.

xi 0 1 2 3
P(X=xi ) 1/6 p 1/30 3/10

a Determine a probabilidade de vender um computador num dia.

b Calcule P (1 ⩽ X < 4); P (X > 2); P (X ⩽ 1); P (X ⩾ 1|X < 3)

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 139 / 184
Variáveis Aleatórias Variável Aleatória Discreta

Exemplos 3.2

Considere o exemplo do lançamento da moeda, descrito no exemplo 3.1,


onde X é a v. a. que representa o número de faces voltadas para cima em
três lançamentos da moeda. Construa as funções de probabilidade e de
distribuição associadas a esta variável aleatória. Represente-as
gracamente.

Resolução

Função de probabilidade: Para a variável aleatória têm-se as seguintes


probabilidades:
f (0) = P (X = 0) = P (C, C, C) = 81 ;
3
f (1) = P (X = 1) = P (F, C, C) ∪ P (C, F, C) ∪ P (C, C, F ) = 8;
3
f (1) = P (X = 2) = P (F, F, C) ∪ P (F, C, F ) ∪ P (C, C, F ) = 8;
f (0) = P (X = 0) = P (F, F, F ) = 18
Por conseguinte, temos:

x 0 1 2 3
f(x) 1/8 3/8 3/8 1/8
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 140 / 184
Variáveis Aleatórias Variável Aleatória Discreta

Continuação

Função de Densidade
F (0) = P (X ⩽ 0) = P (X = 0) = 18 ;
F (1) = P (X ⩽ 1) = P (X = 0) + P (X = 1) = 81 + 38 = 84 ;
F (1) = P (X ⩽ 2) = P (X = 0) + P (X = 1) + P (X = 2) = 18 + 38 + 38 = 78 ;
F (1) = P (X ⩽ 3) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) =
1 3 3 1
8 + 8 + 8 + 8 =1
Assim,

x 0 1 2 3
F(x) 1/8 4/8 7/8 1

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 141 / 184
Variáveis Aleatórias Variável Aleatória Discreta

Figura: Função de probabilidade Figura: Função de Densidade

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 142 / 184
Variáveis Aleatórias Variável Aleatória Continua

Função densidade de probabilidade

Dena-se f (x) como a função densidade de probabilidade da v.a. X.


Propriedades

A função f (x) tem que satisfazer as seguintes condições:

1 f (x) ⩾ 0, qualquer que seja o valor de x


2
Z +∞
f (x)dx = 1
−∞

Função de distribuição

A função de distribuição f (x), da v. a. X é denida por:

Z x
F (x) = P (X ⩽ x) = f (t)dt
−∞

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 143 / 184
Variáveis Aleatórias Variável Aleatória Continua

Propriedade

A função F (x) tem que satisfazer as seguintes condições:

1 0 ⩽ F (x) ⩽ 1, ∀x
2 F (x1 ) ⩽ F (x2 ) ∀x com x1 < x2 , i.e., F (x) é uma função monótona
não crescente;

3 limx→∞ = 0 e limx→∞ = 1;
4 F (x) é continua à direita;

∂F (x)
5 F ′ (x) = = f (x)
∂x Rx
6 P (x1 < X ⩽ x2 ) = x12 = F (x2 ) − F (x1 ) ∀x x1 , x2 com x1 < x2

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 144 / 184
Variáveis Aleatórias Variável Aleatória Continua

Exemplo 3.2

Considere que o consumo semanal de um certo bem alimentar, em famílias


de um determinado concelho, é uma v. a. X com a seguinte função
densidade de probabilidade:

(1
x2 , 0<x<3
f (x) = 9
0, caso contrário

a Obtenha a função de distribuição.

b Represente gracamente as funções densidade de probabilidade e de


distribuição.
c Calcule a probabilidade de, numa semana, o consumo do bem
alimentar numa dada família ser superior a 1,5.

d Calcule a probabilidade de, numa semana, o consumo do bem


alimentar numa dada família se situar entre 1 e 2.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 145 / 184
Variáveis Aleatórias Variável Aleatória Continua

Resolução
Rx Rx 1 2 1
a) F (X) = −∞ f (u)du = −∞ u du = x3
9 27
Portanto,


 0,
 x⩽0
1 3
F (x) = x , 0<x<3
 27

1, x⩾3

b) Representação gráca das funções de densidade e de distribuição.

Figura: Função Densidade de


Figura: Função de Densidade
probabilidade

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 146 / 184
Variáveis Aleatórias Variável Aleatória Continua

1
c) P (X > 1, 5) = 1 − P (X ⩽ 1, 5) = 1 − F (1, 5) = 1 − ∗ 1, 53 = 0, 875
27
1 1
d) P (1 ⩽ X ⩽ 2) = F (2) − F (1) = ∗ 23 − = 0, 2593
27 27
Exemplo 3.3

A percentagem de álcool em certo composto pode ser considerada uma v.a


X, onde 0 < x < 1, com a f.d.p. f (x) = cX 3 (1 − X), 0 < x < 1.
a Determine o valor da constante c.
1
b Calcule P ( < x < 1)
2

Exemplo 3.3

O diâmetro X de um cabo eléctrico supõe-se ser uma v.a com f.d.p, assim
denida 
6x(1 − x), 0 ⩽ x < 1
f (x) =
0, c.c

a Verique tratar-se de uma f.d.p.


b Calcule P (x ⩽ 1/2|1/3 < x < 2/3)
augusto.lucubo@isptec.co.ao
Msc.Augusto Lucubo Positivo Nakiti Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 147 / 184
Variáveis Aleatórias Média e Variância de uma V.A Discreta

Média

A média de uma variável aleatória X usa o modelo de probabilidade para


ponderar os valores possíveis de X. A Média ou Valor Esperado ou ainda
Esperança Matemática de X, denotado por

v.a Discreta v.a Continua


k
X Z
E(X) = µx = xi P (X = xi ) E(X) = µx = xf (x)dx
i=1 D

Propriedades

1 E(k) = k , k constante

2 E(kX) = kE(X)
3 E(X ± Y ) = E(X) ± E(X)
4 E(X ± k) = E(X) ± k
5 Se X e Y são independentes, então E(X.Y ) = E(X).E(X)
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 148 / 184
Variáveis Aleatórias Média e Variância de uma V.A Discreta

Variância

Seja X uma v.a com função de probabilidade f (x). A variância de X,


V ar(X) ou σx2 , quando existe, dene-se por:

V ar(X) = σx2 = E((X − σx )2 ) = E(X 2 ) − (E(X))2


Portanto,

v.ak Discreta
X Z v.a Continua
V ar(X) = (x − µx )2 f (x) V ar(x) = (x − µx )2 f (x)dx
i=1 D
!2 Z Z 2
= x2 f (x)dx − xf (x)dx)
X X
2
= x − xf (x)
D D
x∈D x∈D

p
O desvio padrão de X, σx , quando exite, dene-se por: σx = V ar(x)

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 148 / 184
Variáveis Aleatórias Média e Variância de uma V.A Discreta

Propriedade da variância

Sendo X e Y v.a e k uma constante real:

1 V ar(k) = 0;
2 V ar(kX) = k 2 V ar(X);
3 V ar(k + X) = V ar(X)
4 V ar(X ± Y ) = V ar(X) ± V ar(Y ), X e Y independentes

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 149 / 184
Variáveis Aleatórias Média e Variância de uma V.A Discreta

Exemplo

Retome o exercício do exemplo 3.1 e determine:


a O número médio de lançamento em que a face ca voltada para cima;

b E(4X + 2) e E(X 2 );
c V ar(X) e V ar(2X + 5)

Exemplo

Retome o exercício do exemplo 3.2 e determine:


a O consumo médio semanal do bem alimentar, e uma determinada
família.

b Calcule o valor esperado e o desvio padrão do consumo mensal (4


semanas), de uma dada família desse concelho. Admita a
independência entre os consumos semanais

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 150 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Neste capítulo apresentam-se algumas das principais distribuições de


probabilidade teóricas, discretas e contínuas. Algumas destas distribuições
foram selecionadas por caracterizarem populações existentes na realidade e,
outras distribuições, devido às suas propriedades servirem de base aos
desenvolvimentos de resultados que se apresentam no capítulo seguinte.

Distribuições

Discreta Continua
1 Uniforme 1 Uniforme

2 Bernoulli e Binomial 2 Normal


3 Geométrica 3 Exponencial

4 Binomial Negativa 4 Qui-Quadrado

5 Multinomial 5 Gama

6 Hipergeométrica 6 t-Studant

7 Poisson 7 F de Fisher-Snedecor

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 151 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Distribuição de Bernoulli

Prova de Bernoulli: Uma experiência aleatória chama-se prova de


Bernoulli se possuir as seguintes características:

Tem apenas dois resultados possíveis, incompatíveis:


A que se designa por sucesso;
Ā designado por insucesso,
P (A) = p e P (Ā) = q = 1 − p
Quando se realiza uma prova de Bernoulli e se considera X a v.a. que
caracteriza a experiência tomando os valores:

x = 1, quando o resultado da prova é um sucesso,

x = 0, quando o resultado da prova é um insucesso,

então a distribuição de Bernoulli é o modelo adequado para descrever o


comportamento probabilístico da v. a. X.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 152 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Distribuição Binomial

Quando se realizam n provas de Bernoulli independentes mantendo-se


constante, de prova para prova, a probabilidade de sucesso e de insucesso,
i. e., P (A) = p e P (Ā) = q = 1 − p, então a distribuição de Binomial é
o modelo adequado para descrever o comportamento probabilístico da v. a.
X que conta o número de sucessos em provas realizadas.

Denição

A v. a. discreta X, que designa o número de sucessos em n provas de


Bernoulli independentes, cada uma com probabilidade de sucesso p, segue
uma distribuição Binomial, i. e., X ∼ B(n, p), se a sua função de
probabilidade é:
 
n x
f (x) = P (X = x) = p (1 − p)n−x , x = 0, 1, . . . n, 0 < x < 1
x

Se X ∼ B(n, p) então µx = E(X) = np e V ar(X) = np(1 − p) = npq

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 153 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Distribuição Poisson

A distribuição Poisson é o modelo probabilístico adequado para descrever


os fenómenos em que os acontecimentos se repetem no tempo (ou no
espaço) ou ainda fenómenos raros, isto é, fenómenos que se realizam um
número reduzido de vezes, no tempo ou no espaço.
Para que a v. a. X, que designa o número de ocorrências num
determinado intervalo de tempo, siga uma distribuição de Poisson tem que
vericar as seguintes condições:
i) Que a v.a. X seja o no de ocorrências de um evento em um intervalo;
ii) Que as ocorrências sejam aleatórias;
iii) Que as ocorrências sejam independentes umas das outras;
iv) Que as ocorrências sejam distribuídas uniformemente sobre o intervalo
considerado.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 154 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Alguns exemplos de fenómenos que se adequam a uma distribuição de


Poisson:

Número de chamadas telefónicas que chegam, em certo período de


tempo, a uma central telefónica;

Número de avarias que ocorrem numa máquina, num certo intervalo


de tempo;

Denição

A v. a. discreta X, que designa o número de ocorrências num determinado


intervalo de tempo, segue uma distribuição Poisson, i.e., X ∼ P (λ), se a
sua função de probabilidade é:

e−λ λx
f (x) = P (X = x) = , x = 0, 1, 2...; λ > 0
x!

Se XP (λ) então µx = E(X) = λ e V ar(X) = λ

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 154 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Exemplo 1: Distribuição Binomial

ª
Com a ingestão de um determinado fármaco para o tratamento da
depressão, 20% dos doentes referem sentir efeitos secundários durante a 1
semana de tratamento. Recolheu-se uma amostra aleatória de 15 doentes.
Seja X a v. a. que representa o número de doentes que sentem os
referidos efeitos secundários numa amostra de 15 doentes.
a Identique a distribuição da v. a. X.
b Em média quantos doentes sentiram efeitos secundários?
c Calcule a variância da v. a. X.
d Qual a probabilidade de exatamente 5 doentes sentirem efeitos
secundários?
e Determine a probabilidade de pelo menos 1 e menos de 4 doentes
sentirem efeitos secundários.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 155 / 184
Variáveis Aleatórias Distribuições de Probabilidades

a) Os n = 15 doentes são independentes.


Só existem 2 resultados possíveis por tratamento: sente efeitos secundários
E ou não sente efeitos secundários Ē , sendo
P (E) = 0.2 e P (Ē) = 1 − P (E) = 1 − 0.2 = 0.8 = q
logo, X ∼ B(n = 15, p = 0.2) e a função de probabilidade será:

 
15
f (x) = P (X = x) = (0.2)x (0.8)15−x , x = 0, 1, . . . 15
x
b) E, c) V ar(X) 
d) P (X = 5) = 15 5
5 (0.2) (0.8)
15−5 = 0, 1032

e) P (1 ⩽ x < 4) = P (X = 1) + P (X = 2) + P (X = 3) = 0.6130

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 155 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Exemplo 2

A probabilidade de um atirador acertar no alvo é p = 1/2


a Em oito tiros qual é a probabilidade de acertar pelo menos duas vezes?

X → v.a número de vezes que o tiro acerta no alvo.


X ∼ B(8, 0.25)
P (X ⩾ 2) = 1 − P (X < 2) = 1 − [P (X = 0) + P (X = 1)] = 0.6329
Exemplo 3

Um variável aleatória em distribuição binomial X ∼ B(15, p)


a Sabendo que o valor médio de X é 6, determine o valor p-
b Calcule P (X > 3)

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 156 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Exemplo 1: Distribuição Poisson

Seja X a v. a. que representa o número de automóveis que entram numa


autoestrada (AE) num período de 30 segundos. Sabe-se que X é uma v. a.
de Poisson com desvio padrão a 3.
a Descreva a função de probabilidade da v. a. em estudo.

b Em média quantos automóveis entram na AE num período de 30


segundos? Calcule a variância.
c Qual a probabilidade de entrarem no mínimo 2 automóveis na AE num
período de 30 segundos?

d Determine a probabilidade de entrarem no máximo 3 automóveis na


AE num minuto.
e Calcule a probabilidade de entrarem mais de 2 e menos de 5
automóveis na AE num período de 15 segundos.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 157 / 184
Variáveis Aleatórias Distribuições de Probabilidades

a) X ∼ P (λ = 32 = 9)
Função de probabilidade:
e−9 9x
f (x) = P (X = x) = , x = 0, 1, 2, ...
x!
c) P (X ⩾ 2) = P (X = 2) + P (X = 2) + P (X = 2) + · · · ou
 −9 0
e−9 91

e 9
= 1 − (P (X = 0) + P (X = 1)) = 1 − + = 0, 9998
º
0! 1!

d) Seja X a v.a. que representa o n. de automóveis que entram na AE
′ ′
num período de 1 minuto. Logo, X ∼ P (λ = 2λ = 18), pois 1 minuto =
2*30 segundos
P (X ′ ⩽ 3) = P (X ′ = 0) + P (X ′ = 1) + P (X ′ = 2) + P (X ′ = 3) ∼
=0
Exemplo 2

O número de nascimentos, por hora, numa certa maternidade é uma v.a.


de Poisson.
Sabendo que a probabilidade de não haver nascimento durante uma hora é
de 0,368, determine a probabilidade de ocorrerem pelo menos 3
nascimentos, numa hora.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 158 / 184
Variáveis Aleatórias Distribuições de Probabilidades

X → v.a. Número de nascimentos por hora


X ∼ P (λ)
e−λ λ0
P (X = 0) = 0, 368 =⇒ = 0, 368 =⇒ λ = 1
0!
P (X ⩾ 3) = 1 − P (X < 3) =
1 − [P (X = 0) + P (X = 1) + P (X = 2)] = 0, 0803
Exemplo 3

Suponha que X é uma v.a. com distribuição de Poisson. Se


P (X = 2) = 23 P (X = 1). Calcule P (X = 0) e P (X = 3)

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 159 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Distribuição Uniforme

Dizemos que X segue o modelo Uniforme, no intervalo [a, b] ⊂ R, se todos


os sub-intervalos de [a, b] com mesmo comprimento tiverem a mesma
probabilidade. Sua f.d.p é dada por


 1
, a⩽x⩽b
f (x) = a + b
 0, c.c
A função distribuição acumulada da Uniforme é facilmente encontrada e é
dada por:

 0,
x − x<a
a
F (x) = , a⩽x<b
a+b

1, x⩽b
Sua esperança e variância são dadas da seguinte maneira:

a+b (b − a)2
E(X) = e V ar(X) =
2 12
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 160 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Distribuição Normal

A distribuição Normal é, provavelmente, a mais importante distribuição de


probabilidade, tanto na teoria quanto na prática da estatística. Se X é
uma variável aleatória normal, então a distribuição de probabilidade de X é
denida como se segue:

(x − µ)2
1 −
f (x) = √ e 2σ 2
2πσ 2
A equação da curva Normal é especicada usando 2 parâmetros: a média
populacional µ, e o desvio padrão populacional σ , ou equivalentemente a
variância populacional σ2. Denotamos N (µ, σ 2 ) à curva Normal com
média e variância. A média refere-se ao centro da distribuição e o desvio
padrão ao espalhamento de curva.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 161 / 184
Variáveis Aleatórias Distribuições de Probabilidades

No cálculo de probabilidades para variáveis contínuas, devemos resolver a


integral da função densidade no intervalo de interesse, isto é:

Z b
(x − µ)2
1 −
P (a ⩽ X ⩽ b) = √ e 2σ 2
a 2πσ 2
Entretanto, a integral acima só pode ser resolvida de modo aproximado e
por métodos numéricos. Por essa razão as probabilidades para o modelo
Normal são calculadas com o auxílio de tabelas. Para se evitar a
multiplicação desnecessária de tabelas para cada par de valores (µ, σ 2 ),
utiliza-se uma transformação que conduz sempre ao cálculo de
probabilidades com uma variável de parâmetros (0, 1), isto é, média 0 e
variância 1.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 162 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Distribuição Normal Padrão

Considere X ∼ N (µ, σ 2 ) e de una uma nova variável Z, sendo:

X −µ
Z=
σ
A criação de uma nova variável aleatória por essa transformação é referida
como padronização. A variável aleatória Z representa a distância de X a
partir de sua média em termos dos desvios padrões. Pode-se ainda vericar
que essa transformação não afeta a normalidade e, assim, a variável
aleatória Z terá distribuição N(0, 1) e será denominada de Normal Padrão
ou Normal Reduzida. Para determinar a probabilidade de X ∈ [a, b],
procedemos da seguinte forma:

 
X −µ X −µ
P (a ⩽ X ⩽ b) = P ⩽Z⩽
σ σ

e, portanto, quaisquer que sejam os valores de µ e σ, utilizamos a Normal


Padrão para obter probabilidades com a distribuição Normal.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 163 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Resultados Importantes

X ∼ N (µ, σ)
Se então a v.a estandardizada (padronizada)
X −µ
Z= .
σ
A função de distribuição F (z) da v.a. Z ∼ N (0, 1) é representada por
Φ(z) e está tabelada.
Φ(−z) = 1 − Φ(z).
Φ(z) = α =⇒ z = Φ−1 (α)

Figura: Origem e Distribuição Normal reduzida


Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 164 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 165 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Para ilustrar a utilização da tabela de distribuição normal reduzida, vamos


resolver alguns exemplos. Probabilidade de Z menor que 1.74, ou seja
P (Z < 1.74).

P (Z < 1.74) = 0.9591

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 166 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Dada uma distribuição normal padrão, encontre a área da curva que


encontra-se a direita de Z = 1.84

P (Z > 1.84) = 1 − P (Z ⩽ 1.84) =


1 − 0.9671 = 0.0329

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 167 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Exemplo 1: Distribuição Normal

Uma empresa, monopolista no mercado de determinado produto, tem


produção constante de 90 toneladas (ton.) por dia. Sabe-se que a procura
diária é uma v. a. com distribuição Normal, com média µ = 80 toneladas e
desvio padrão σ = 10 toneladas.
a Qual a procura média diária deste produto? Calcule a variância.

b Determine a probabilidade de a procura ser inferior a 78 toneladas.


c Calcule a probabilidade de ocorrer procura excedentária?

d Qual a percentagem de dias em que a procura se situa entre 77 e 82


toneladas?
e Qual deve ser a produção mínima diária para que a probabilidade de
ocorrer procura excedentária seja 0,025.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 168 / 184
Variáveis Aleatórias Distribuições de Probabilidades

a) Seja X a v.a. que representa a procura diária, em tonelada, do produto,


com X ∼ N (µ = 80; σ = 10), portando E(X) = µ = 80 e
V ar(X) = σ 2 = 102= 100 
X −µ 78 − 80
b) P (X < 78) = P < = P (Z < −0.2) = Φ(−0.2) =
σ 10
1 − Φ(0.2) = 1 − 0.5793 = 0.4207  
90 − 80
c) P (X > 90) = 1 − P (X ⩽ 90) = 1 − P Z⩽ = 1 − Φ(1) =
10
1 − 0.8413  
77 − 80 82 − 80
d) P (77 ⩽ X ⩽ 82) = P ⩽Z⩽ = P (−0.3 ⩽ Z ⩽
10 10
0.2) = Φ(0.2) − Φ(−0.3) = 0.1972. Portanto, em 19,72% dos dias a
procura situa-se entre 77 e 82 toneladas
e) P (X > k) = 0.025    
k − 80 k − 80
⇔ P (Z ⩽ k) = 0.975 ⇔ P Z ⩽ = 0.975 ⇔ Φ como
10 10
k − 80
Φ(1.96) = 0.975 então = 1.96 ⇔ k = 99.6
10
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 169 / 184
Variáveis Aleatórias Distribuições de Probabilidades

Exemplo 2

O faturamento mensal de uma loja segue uma distribuição normal com


média Kz 20.000, 00 e desvio padrão Kz 4.000, 00. Calcule:
a A probabilidade de que, num determinado mês, o faturamento esteja
entre Kz 20.000, 00 e Kz 25.000, 00;

b A probabilidade de que, num determinado mês, o faturamento esteja


ente Kz 15.000, 00 e Kz 20.000, 00;
c A probabilidade de que, num determinado mês, o faturamento esteja
entre Kz 19.000, 00 e Kz 25.000, 00.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 170 / 184
Introdução à Inferência Estatística

O campo da inferência estatística consiste naqueles métodos usados para


tomar decisões ou tirar conclusões acerca de uma população. Esses
métodos utilizam a informação contida em uma amostra da população para
tirar conclusões. A inferência pode ser dividida em duas grandes áreas:
estimação de parâmetros e teste de hipóteses.

Denições Importantes

1 População: Consiste na totalidade das observações em que estamos


interessados. Ela pode ser:
i) População Finita: Aquela em que todos os seus elementos podem ser
identicados e enumerados. Exemplo: As propriedades rurais de Angola
ii) População Innita: Não é possível identicar (ou enumerar) todos os
seus elementos. Exemplo: As árvores pertencentes a um determinado
tipo de eucalipto que existem no mundo.
2 Amostra: É um subconjunto de observações selecionadas a partir de
uma população.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 171 / 184
Introdução à Inferência Estatística

Denições Importantes

3 Parâmetros: Constantes inerentes a populações relacionadas a uma


determinada variável de interesse (X ). Em muitas vezes são
desconhecidos. Toda distribuição de probabilidade estudada depende
de parâmetros, que determinam sua função especíca, por exemplo, o
p da binomial, o λ de Poisson, a µ e o σ da Normal, etc. Diferentes
valores dos parâmetros conduzem a valores distintos das
probabilidades.

4 Estimador ou Estatística: É uma variável aleatória que é função dos


elementos amostrais Xi , i = 1, 2, ..., n. Exemplo: A média amostral
(x) é um estimador de (parâmetro populacional). Ela é uma variável
aleatória que depende dos resultados obtidos em cada amostra
particular. Uma vez que uma estatística é uma variável aleatória, ela
tem distribuição de probabilidades.

5 Estimativa: É o valor numérico do estimador em uma determinada


amostra.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 172 / 184
Introdução à Inferência Estatística Amostragem

A amostragem
é uma técnica de seleção de elementos de uma população para se estimar
propriedades e características da população. Há dois tipos de métodos de
amostragem: Aleatória e Determinístico
1 Amostragem Aleatória, Causal ou Probabilística. Técnicas de
amostragem em que a seleção é aleatória de tal forma que cada
elemento tem igual probabilidade de ser escolhido para a amostra, e é
selecionado independentemente de qualquer outro. Assim se conhece a
probabilidade de todas as combinações amostrais possíveis.

2 Amostragem Determinístico, ou não Probabilística. A opinião e a


experiência individual são utilizadas para identicar os elementos da
população a incluir na amostra.

A amostragem aleatória permite efectuar uma análise Estatística mais


rigorosa do que a amostragem determinístico. Pode ser difícil, no caso
determinístico, conseguir obter amostras representativas da população e,
mas difícil ainda, demonstrar que as amostras não são enviesadas.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 173 / 184
Introdução à Inferência Estatística Amostragem

Tipo de Amostragem Aleatória

1 Amostragem Aleatória Simples


2 Amostragem Aleatória Estraticada

3 Amostragem Aleatória por clusters


4 Amostragem Aleatória Sistemática

5 Amostragem Aleatória Multietapas

Amostragem aleatória simples

Tipo de amostragem probabilística mais utilizada. Dá exatidão e ecácia à


amostragem, além de ser o procedimento mais fácil de ser aplicado  todos
os elementos da população têm a mesma probabilidade de pertencerem à
amostra.
É bastante preciso e apresenta todos os elementos da população com
probabilidade conhecida de serem escolhidos para fazer parte da amostra.
O processo consiste em selecionar uma amostra n a partir de uma
população N.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 174 / 184
Introdução à Inferência Estatística Amostragem

Amostragem Aleatória Simples

Este tipo de amostragem é pode ser feita com com reposição e sem
reposição (Geralmente a seleção é feita sem reposição e cada amostra é
feita unidade a unidade até que se atinja o número pré-determinado).

1 Com Reposição cada elemento da amostra é independente dos


restantes e tem a mesma probabilidade de pertencer à amostra. Assim,
para uma população de dimensão N, a probabilidade de escolha de um
1 1
qualquer individuo em , a do segundo é ,
primeiro lugar é
N N
etc. O número de amostras possíveis são n e, neste caso, é dada por
1
N n e a probabilidade de ocorrência de cada amostra é n .
º
N
2 Sem Reposição, a probabilidade de saída do 1. elemento da amostra

é
N
1
, do 2. é º1
N −1
, do 3. é
1
N −2
, º etc., sendo
1
N −i+1
para o

i − simo elemento da amostra.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 175 / 184
Introdução à Inferência Estatística Amostragem

Amostragem Aleatória Simples

Para que uma amostra assim selecionada se possa dizer aleatória, todas as
combinações da amostra n elementos que podem ser extraídos de uma
população com M sujeitos ( N Cn ) deem ter a mesma probabilidade de
serem selecionados:
1
probabilidade = NC
n

Por conceito

Amostragem simples ao acaso (ASA) Tem objetivo de obter uma


amostra representativa, quando os elementos da população são todos
homogéneos.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 176 / 184
Introdução à Inferência Estatística Distribuições Amostrais

Como já foi referido, nem sempre é possível e viável estudar com exatidão
toda a população, pelo que se retira uma amostra dessa população e, com
base na informação amostral, infere-se, quando possível, para a população.
A base dessa inferência assenta no tipo de amostragem probabilística que
se realizou e nas distribuições de probabilidade, cuja junção resulta nas
distribuições por amostragem. Ao longo deste capítulo assume-se que a
amostra é aleatória.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 177 / 184
Introdução à Inferência Estatística Distribuições Amostrais

Distribuição da Média Amostral

Seja X1 , X2 , . . . , Xn , uma a. a. duma dada população com média µ e


variância σ 2 . A média amostral é denida por:
n
X Xi
X̄ =
n
i=1

Assim, a distribuição amostral da média nos dá uma ideia de como X̄ varia


quando mudamos de uma amostra para a outra.

Propriedades

µX̄ = E(X̄) = µ
2 = V ar(X̄) = 1 2
σX̄ σ
n

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 178 / 184
Introdução à Inferência Estatística Distribuições Amostrais

Teorema de Limite Central

Seja X̄ X1 , X2 , . . . , Xn (amostra aleatória de


a média amostral de
tamanho n) de uma distribuição com média µ e desvio padrão σ
(0 < σ < ∞). Então a distribuição da variável aleatória Z denida por

X̄ − E(X̄) X̄ − µ
Z=p =
V ar(X̄) √σ
n

se aproxima da distribuição normal padrão quando n tende ao innito.


Ou seja, Z tem distribuição aproximadamente N (0, 1) quando n tende ao
innito.

Assim, o TCL nos diz que é assintoticamente distribuída como uma


distribuição normal com média µ e variância σ 2 /n. O mais impressionante
do teorema central do limite é o fato de que nada é dito a respeito da
função densidade f. Ou seja, qualquer que seja a função de distribuição,
desde que ela tenha variância nita, a média amostral terá uma distribuição
aproximadamente normal para amostras sucientemente grandes.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 179 / 184
Introdução à Inferência Estatística Distribuições Amostrais

Observações do TLC

1 A distribuição das variáveis X pode ser discreta ou contínua.

2 Quanto maior n, melhor a aproximação. Como regra prática, para


amostras de tamanho n ⩾ 30, a distribuição X̄ de pode ser
razoavelmente aproximada por uma distribuição normal.

3 Devido às propriedades da distribuição normal, se a população original


é distribuída normalmente, então a distribuição de X̄ é exatamente
normal para qualquer tamanho de amostra.

4 O erro-padrão de X̄ é o seu desvio-padrão, ou seja, σ / n.

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 180 / 184
Introdução à Inferência Estatística Distribuições Amostrais

Distribuição Média Amostral. Quando a variânça é conhecida

Se a distribuição da população é Normal com desvio padrão σ conhecido,


σ
então X ∼ N (µ; √ ), ou seja,
n

X̄ − µ
Z= ∼ N (0; 1)
√σ
n

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 181 / 184
Introdução à Inferência Estatística Distribuições Amostrais

Distribuição Média Amostral. Quando a variânça é desconhecida

Se a população é Normal mas o desvio padrão é desconhecido, e não


rejeitando a hipótese de independência das distribuições por amostragem
da média e da variância da amostra, então tem-se que:

X̄ − µ
T = ∼ t(n−1)
√S
n

onde t(n−1) Distribuição t de Student com n−1 grau de liberdade (g.l)


Se a distribuição da população não for Normal, mas a amostra for de
grande dimensão então, por extensão do corolário do T. L. C.,

 
S X̄ − µ
˚ N µ; √
X̄ ∼ , ou seja, Z = S ∼
˚ N (0; 1)
n √
n

OBS: Para valores elevados de n, a distribuição t-Student toma valores


muito próximos aos da N (0; 1). Existem alguns programas estatísticos (por
exemplo, SPSS) que, nestas condições, não utilizam a distribuição Normal
mas a t-Student.
Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao
Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 182 / 184
Introdução à Inferência Estatística Distribuições Amostrais

Distribuição t − Student
Seja Z uma variável aleatória com distribuição normal padrão e seja Y uma
variável aleatória com distribuição qui-quadrado com graus de liberdade,
com Z e Y independentes. Então

Z
T =p
Y /v

tem distribuição t de Student com v graus de liberdade. Notação: T ∼ tv

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 183 / 184
Introdução à Inferência Estatística Distribuições Amostrais

Distribuição da Proporção Amostral

Msc.Augusto Lucubo Positivo Nakiti augusto.lucubo@isptec.co.ao


Estatística Básica WhatsApp:
3 de(00351)
outubro912017297
de 2022 184 / 184

Você também pode gostar