Você está na página 1de 136

FACULDADE DE ECONOMIA DA UJES

DEPARTAMENTO DE MÉTODOS QUANTITATIVOS

NOTAS DE ESTATÍSTICA I - ANO lECTIVO 2021/2022

Docentes:

Alcides Onésimo Nunda (Regente)

Belchior Xavier Mário

Pedro Domingos Chitandula

Ivanoy Albano Lucas.

Huambo/2021 - 2022
Apresentação

A cadeira Estatística I, também denominada Estatística Básica ou Descritiva, é lecionada


o
no 2 ano da Faculdade de Economia do Huambo da Universidade José Eduardo dos San-

tos, tem como nalidade munir o estudante de conhecimentos iniciais sobre a Estatística

Descritiva, começando pelos conceitos fundamentais e terminando com as probabilidades.

Mais do que simplesmente ensinar, pretende-se que os estudantes possam: (i) despertar e

estimular o interesse pelo método estatístico; (ii) utilizar uma linguagem simples e aces-

sível, apresentar os conceitos e métodos de análise estatística de modo mais intuitivo e

formal; (iii) acompanhar a apetência teórica, exemplos e exercícios apropriados a cada

situação. Ainda, oferece diversos instrumentos matemáticos utilizados em várias áreas da

economia, como são os casos de, Econometria, Estatística II, Teoria Económica, Investi-

gação Operacional, Matemática Aplicada à Economia, Economia Regional, Contabilidade

Nacional, Análise e Avaliação de Projectos de Investimentos, Macroeconomia Microecono-

mia, entre outras. Para melhor compreensão, o estudante deve ter uma adequada destreza

em manejar operações matemáticas básicas, por isso tem como precedência as cadeiras

de Análise Matemática I e Análise Matemática II.

Estas notas servirão como texto de apoio da cadeira no presente ano lectivo. A sua

elaboração obedeceu um aceitável nível de rigor que esta área de conhecimento exige e

maior parte dos dados utilizados, tiveram como fonte os dados ociais do INE-Instituto

Nacional de Estatística. Para um processo de ensino-aprendizagem mais efectivo, cada

secção/capítulo será acompanhada de uma folha de exercícios que ajudarão os estudantes

a aplicar os conteúdos teóricos aprendidos e ampliar a sua dimensão de entendimento,

por isso se aconselha que cada estudante resolva o maior número possível de exercícios.

Nosso profundo agradecimento ao docente Licenciado Pedro Domingos Chitandula pelo

apoio ao regente da cadeira na concepção e digitalização do texto.

Pelo DEIMQ

Alcides Onésimo Nunda, MSc.

Professor Auxiliar

2
Conteúdo

1 A Estatística 1
1.1 Conceitos Fundamentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Síntese Histórica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.2 Importância da Estatística . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 A Estatística e os Métodos Estatísticos . . . . . . . . . . . . . . . . . . . . 4

1.2.1 Fases da Metodologia Estatística . . . . . . . . . . . . . . . . . . . 4

1.3 Objectivos da Análise Estatística . . . . . . . . . . . . . . . . . . . . . . . 6

1.4 Tipos de Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.1 Estatística Descritiva . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.2 Estatística Inferencial ou Indutiva . . . . . . . . . . . . . . . . . . . 8

1.4.3 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5 População e Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5.1 População ou Universo Estatístico (N) . . . . . . . . . . . . . . . . 9

1.5.2 Amostra (n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.6 Variáveis (ou Dados) e Tipos de Variáveis . . . . . . . . . . . . . . . . . . 11

1.6.1 Tipos de Variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.7 Números Aproximados e Arredondamento de Dados. Cálculo de Percentagem 13

1.7.1 Números Aproximados e Arredondamento de Dados . . . . . . . . . 13

1.7.2 Cálculo de Percentagem . . . . . . . . . . . . . . . . . . . . . . . . 14

2 Técnicas de Amostragem 15
2.1 Importância da Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2 Vantagens da Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

i
Notas - Estatística I FEC - UJES/2021-2022

2.3 Critérios para Seleção de Amostras . . . . . . . . . . . . . . . . . . . . . . 16

2.4 Tipos de Técnicas de Amostragem . . . . . . . . . . . . . . . . . . . . . . 17

2.4.1 Amostragem Casual ou Aleatória Simples . . . . . . . . . . . . . . 17

2.4.2 Amostragem Proporcional Estraticada . . . . . . . . . . . . . . . . 18

2.4.3 Amostragem Estraticada Uniforme . . . . . . . . . . . . . . . . . . 20

2.4.4 Amostragem Sistemática . . . . . . . . . . . . . . . . . . . . . . . . 20

2.4.5 Amostragem por Conglomerado . . . . . . . . . . . . . . . . . . . . 22

3 Séries Estatísticas e Grácos Estatísticos 24


3.1 Séries Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.1.1 Series Temporais, Cronológicas, Históricas, Evolutivas (ou Marchas) 25

3.1.2 Séries Geográcas, Espaciais, Territoriais ou Localização . . . . . . 26

3.1.3 Series Especicas ou Categóricas . . . . . . . . . . . . . . . . . . . 27

3.1.4 Séries Conjugadas ou Tabela de Dupla Entrada . . . . . . . . . . . 28

3.2 Grácos Estatísticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.2.1 Diagramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2.2 Grácos Polar ( ou Radar) . . . . . . . . . . . . . . . . . . . . . . . 34

4 Distribuição de Frequências 36
4.1 Conceitos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.2 Organização e Classicação de dados de Variáveis Qualitativas. . . . . . . . 38

4.3 Organização e Classicação de Dados de Variáveis Quantitativas . . . . . . 39

4.3.1 Distribuição de Frequências de Dados Numéricos não Agrupados

em Intervalos de Classe. . . . . . . . . . . . . . . . . . . . . . . . . 39

4.3.2 Distribuição de Frequências de Dados Numéricos Agrupados com

Intervalos de Classe. . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.4 Representação Gráca de uma Distribuição de Frequência . . . . . . . . . . 45

4.4.1 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.4.2 Polígono de Frequência . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.4.3 Polígono de Frequência Acumulada (ogiva de Galton) . . . . . . . . 47

Alcides Onésimo Nunda ii Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

5 Medidas de Posição: Medidas de Tendência Central 50


5.1 Média Aritmética (x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.1.1 Média Aritmética de Dados não Agrupados . . . . . . . . . . . . . 51

5.1.2 Média Aritmética para dados Agrupados sem Intervalos de Classe . 53

5.1.3 Média Aritmética para Dados Agrupados com Intervalos de Classe:

Média Aritmética Ponderada . . . . . . . . . . . . . . . . . . . . . . 55

5.2 Outras Médias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

5.2.1 Média Geométrica (Mg ) . . . . . . . . . . . . . . . . . . . . . . . . 56

5.2.2 Média Harmónica (Mh . . . . . . . . . . . . . . . . . . . . . . . . . 58

5.2.3 Fórmula Geral das Médias . . . . . . . . . . . . . . . . . . . . . . . 59

5.3 Moda (M0 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

5.3.1 Cálculo da Moda para Dados não Agrupados . . . . . . . . . . . . . 60

5.3.2 Cálculo da Moda para Dados Agrupados sem Intervalo de Classe . . 61

5.3.3 Cálculo da Moda para Dados Agrupados com Intervalo de Classe . 62

5.4 Mediana (Md ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5.4.1 Cálculo da Mediana para Dados não Agrupados . . . . . . . . . . . 64

5.4.2 Cálculo da Mediana para Dados Agrupados sem Intervalos de Classe 66

5.4.3 Cálculo da Mediana Para Dados Agrupados com Intervalo de Classe 67

6 Medidas de Posição: Medidas Separatrizes 70


6.1 Quartis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

6.1.1 Cálculo dos Quartis para dados não Agrupados . . . . . . . . . . . 71

6.1.2 Cálculo dos Quartis para Dados agrupados sem Intervalo de Classe 72

6.1.3 Cálculo dos Quartis para Dados Agrupados com Intervalo de Classe 74

6.2 Decis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

6.2.1 Cálculo dos Decis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

6.3 Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

6.3.1 Cálculo dos Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . 78

7 Medidas de Dispersão ou de Variabilidade 80


7.1 Amplitude Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

Alcides Onésimo Nunda iii Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

7.1.1 Cálculo da Amplitude Total para Série Simples . . . . . . . . . . . 80

7.1.2 Cálculo da Amplitude Total para Dados Agrupados numa Distri-

buição de Frequência . . . . . . . . . . . . . . . . . . . . . . . . . . 81

2
7.2 Variância (σ ) e Desvio- padrão (σ ) . . . . . . . . . . . . . . . . . . . . . . 81

7.2.1 Relação entre a Variância e o Desvio-padrão . . . . . . . . . . . . . 82

7.2.2 Cálculo do Desvio-padrão e Variância para Séries Simples (Dados

não agrupados) pela denição e pela fórmula alternativa . . . . . . 82

7.2.3 Calculo da Desvio-padrão e Variância para Dados Agrupados . . . . 84

7.2.4 Propriedades do Desvio-padrão . . . . . . . . . . . . . . . . . . . . 85

7.3 Dispersão Absoluta e Relativa na Comparação de duas Séries de Dados

Colectados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

7.3.1 Coeciente de Variação ou Coeciente de Variação de Pearson . . . 89

7.4 Curvas Simétricas e Assimétricas . . . . . . . . . . . . . . . . . . . . . . . 90

7.4.1 Distribuição de Frequências Representada por Uma Curva Simétrica 90

7.4.2 Distribuição de Frequências Representada por Uma Curva Assimétrica 91

7.4.3 Coeciente de Assimetria de Pearson (AS) . . . . . . . . . . . . . . 93

7.5 Curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

7.5.1 Coeciente Percentílico de Curtose . . . . . . . . . . . . . . . . . . 95

7.6 Propriedades da Aplicação do Desvio-padrão . . . . . . . . . . . . . . . . . 95

7.6.1 Distribuições Normais . . . . . . . . . . . . . . . . . . . . . . . . . 95

8 Números Índices e Noção de Demograa 98


8.1 Números índices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

8.1.1 Conceito e Objectivo . . . . . . . . . . . . . . . . . . . . . . . . . . 98

8.1.2 Relactivos e Índices . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

8.1.3 Número Índice Simples e Ponderados . . . . . . . . . . . . . . . . . 100

8.1.4 Índice Agregativos Ponderados. Fórmulas de Laspeyres, Egeworth

e de Marshall, de Paasche e de Ficher . . . . . . . . . . . . . . . . . 103

8.1.5 Número Índice em Cadeia . . . . . . . . . . . . . . . . . . . . . . . 105

8.2 Noções de Demograa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

8.2.1 Conceito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

Alcides Onésimo Nunda iv Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

8.2.2 Taxa de Crescimento . . . . . . . . . . . . . . . . . . . . . . . . . . 107

9 Probabilidades 110
9.1 Teoria de Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

9.1.1 Conceitos da Teoria de Probabilidades . . . . . . . . . . . . . . . . 110

9.1.2 Álgebra dos Acontecimentos . . . . . . . . . . . . . . . . . . . . . . 111

9.1.3 Conceitos de Probabilidade . . . . . . . . . . . . . . . . . . . . . . 115

9.1.4 Axiomas da Teoria das Probabilidades . . . . . . . . . . . . . . . . 117

9.1.5 Probabilidades Condicionas . . . . . . . . . . . . . . . . . . . . . . 119

9.1.6 Probabilidade da Intersecção de Acontecimentos. Acontecimentos

Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

9.1.7 Teorema da Probabilidade Total e Fórmula de Bayes . . . . . . . . 122

Referências Bibliográcas 125

Alcides Onésimo Nunda v Pedro Domingos Chitandula


Lista de Tabelas

2.1 Amostragem proporcional estraticada por sexo de uma empresa de mar-

keting digital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.2 Amostragem proporcional estraticada dos trabalhadores da Fábrica Cuca. 19

2.3 Amostragem proporcional estraticada dos trabalhadores da Fábrica Cuca. 20

3.1 Indicadores Económicos de Angola em 2020 (%) . . . . . . . . . . . . . . . 24

3.2 Reservas Internacionais Líquidas (USD Mil Milhões) em 2020 . . . . . . . . 26

3.3 Taxa de Desemprego da população por Região . . . . . . . . . . . . . . . . 27

3.4 Número de trabalhadores (sector público e privado) das várias classes de

salários em Angola  2018 - 2020 . . . . . . . . . . . . . . . . . . . . . . . 28

3.5 Inquérito do emprego em Angola (IEA), referente ao II trimestre de 2021. . 29

5.1 Venda de apólices de seguros . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.2 Distribuição das Estaturas . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

5.3 Distribuição da venda de electrodomésticos . . . . . . . . . . . . . . . . . . 61

5.4 Distribuição da venda de electrodomésticos . . . . . . . . . . . . . . . . . . 62

5.5 Distribuição do número de quartos por residência . . . . . . . . . . . . . . 67

5.6 Distribuição do tempo gasto na Internet. . . . . . . . . . . . . . . . . . . . 68

6.1 Distribuição das notas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

6.2 Distribuição salarial(em centenas de Kzs) dos funcionários do sector de

vendas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

7.1 Distribuição da venda de carros por nove vendedores . . . . . . . . . . . . 86

7.2 Distribuição de exigências descumpridas em cada proposta para concessão

de crédito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

vi
Notas - Estatística I FEC - UJES/2021-2022

7.3 Distribuição das vendas por funcionário . . . . . . . . . . . . . . . . . . . . 88

8.1 Mercadoria em Espécie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

8.2 Números Relactivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

8.3 Números índices simples e ponderados . . . . . . . . . . . . . . . . . . . . 100

8.4 Número índice aritmético ponderado . . . . . . . . . . . . . . . . . . . . . 101

9.1 Propriedades das operações . . . . . . . . . . . . . . . . . . . . . . . . . . 115

Alcides Onésimo Nunda vii Pedro Domingos Chitandula


Lista de Figuras

3.1 Vendas em milhares de kwanzas . . . . . . . . . . . . . . . . . . . . . . . . 31

3.2 Gráco em Colunas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.3 Gráco em Barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.4 Inquérito do emprego em Angola (IEA), referente ao II trimestre de 2021 . 33

3.5 Inquérito do emprego em Angola (IEA), referente ao II trimestre de 2021 . 34

3.6 Vendas em Milhares de Kwanzas . . . . . . . . . . . . . . . . . . . . . . . . 35

4.1 Estado civil dos compradores de congelados de um supermercado . . . . . 38

4.2 Estado civil dos compradores de congelados de um supermercado . . . . . 40

4.3 Símbolos nas representações para intervalos abertos e fechados . . . . . . . 43

4.4 Peso de 50 estudantes do sexo masculino da Faculdade de Economia . . . . 44

4.5 Histograma da distribuição dos pesos de 50 estudantes . . . . . . . . . . . 46

4.6 Polígono de frequência da distribuição dos pesos de 50 estudantes . . . . . 47

4.7 Polígono de frequência acumulada da distribuição dos pesos de 50 estudantes 48

5.1 Distribuição do número de clientes com parcelas atrasadas. . . . . . . . . . 54

5.2 Exemplos de representação gráca da moda . . . . . . . . . . . . . . . . . 60

7.1 Curva Simétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

7.2 Curva Assimétrica Positiva . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

7.3 Curva Assimétrica Negativa . . . . . . . . . . . . . . . . . . . . . . . . . . 92

7.4 Curva Mesocúrtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

7.5 Curva Platicúrtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

7.6 Curva Leptocúrtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

viii
Notas - Estatística I FEC - UJES/2021-2022

7.7 Representação gráca da zona de normalidade . . . . . . . . . . . . . . . . 96

9.1 Representação de acontecimento . . . . . . . . . . . . . . . . . . . . . . . . 112

9.2 União de acontecimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

9.3 Intersecção de acontecimentos . . . . . . . . . . . . . . . . . . . . . . . . . 113

9.4 Acontecimento impossível . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

9.5 Diferença de Acontecimentos . . . . . . . . . . . . . . . . . . . . . . . . . . 114

9.6 Acontecimento complementar . . . . . . . . . . . . . . . . . . . . . . . . . 114

Alcides Onésimo Nunda ix Pedro Domingos Chitandula


Capítulo 1

A Estatística

1.1 Conceitos Fundamentais


1.1.1 Síntese Histórica
Embora a estatística seja recente na área de pesquisa, ela já era observada de forma ru-

dimentar e imprecisa na antiguidade, quando então os governantes faziam registros de

dados que consideravam importante, tais como as informações sobre suas populações e

suas riquezas, tendo como objectivo ns militares ou tributários. Os governantes investi-

gavam o número de habitantes, de nascimentos e de óbitos, faziam avaliações dos bens e

riquezas do povo para que cobrassem os impostos proporcionais.

Os vários acontecimentos e aspectos da evolução da estatística agrupam-se em três grandes

períodos:

1. Período da preparação dos factos: abrange a idade antiga, idade média e parte

da idade moderna, na história da civilização e é caracterizado por registros de in-

teresse do estado. Por esta razão é também denominada período da estatística


administrativa. Na idade antiga, destaca-se Chouking, que baseado-se em princí-

pios bíblicos fez o levantamento do povo judaico, para ns de guerra, nessa época

era feito o recenseamento da população e extensão territorial do império romano.

Na idade média, destacam-se os árabes, no ano 721, coma coleta numérica das ci-

dades dominadas, compostas de suas populações e fábricas e de cada espécie de

seus produtos, para o controlo das conquistas territoriais. Na parte idade moderna,

destaca-se o Conquistador Guilherme, que ordenou a elaboração de um cadastro

da divisão do solo da Inglaterra das várias classes sociais existentes, para ns de

arrecadação de impostos.

1
Notas - Estatística I FEC - UJES/2021-2022

2. Período da preparação das teorias: caracterizam este período as críticas e po-

lémicas tendendo a erigir a estatística como disciplina autónoma. Destacam-se,

Herman Coring que no século XV II na Alemanha, emprega a estatística já como

disciplina autónoma e descreve o estado considerando seu território, seu governo

e suas nanças; William Petty, autor do termo "Aritmética Política", baseado em

informações estatísticas, tira conclusões com aproximação sobre a regularidade dos

fenómenos sociais; Edmond Halley, que constrói o cálculo actuarial e esboça a pri-
meira tábua de mortalidade; Blaise Pascal e Pierre Fermat que no século XV II

descobriram o cálculo de probabilidades na França.

3. Período do aperfeiçoamento técnico e cientíco: Inicia-se em 1853, com o pri-

meiro congresso de estatística e abrange parte, portanto, da idade média moderna

estendendo-se pela idade contemporânea. Neste período destacam-se, entre outros,

Françis Galton, com o emprego da estatística metodológica nos problemas da here-


ditariedade, James Clerk Maxwell, empregando a estatística na teoria cinética dos

gases.

• statu , que em latim signica estado, e apareceu pela


A palavra estatística deriva de

primeira vez no século XVII, sugerida pelo alemão Godofredo Achenwall .

• A partir do século XVI, as tabelas tornaram-se mais completas, surgiram as repre-


sentações grácas e o cálculo de probabilidades.

• Com base no desenvolvimento da teoria das probabilidades, no século XVII, vericou-


se que a estatística poderia ser utilizada para tirar conclusões e tomar decisões

baseadas na análise de dados.

É possível distinguir duas concepções para a palavra estatística:

1. Plural (estatísticas), indica qualquer coleção de dados numéricos, reunidos com a

nalidade de fornecer informações acerca de uma actividade qualquer. Assim, por

exemplo, as estatísticas demográcas referem-se aos dados numéricos sobre nas-


cimentos, falecimentos, matrimónios, etc. As estatísticas económicas consistem

em dados numéricos relacionados com emprego, produção, vendas e com outras

actividades ligadas aos vários sectores da vida económica;

2. No singular (Estatística), indica a actividade humana especializada ou um corpo de

técnicas, ou ainda uma metodologia desenvolvida para a coleta, a classicação, a

apresentação, a análise e a interpretação de dados quantitativos e a utilização desses

dados para a tomada de decisões.

Alcides Onésimo Nunda 2 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Na actualidade, a estatística é uma ciência moderna, imprescindível para entender as-

pectos e problemas em todas as áreas do conhecimento. Para se ter uma ideia sobre a

estatística na actualidade, apresentam-se as denições dos seguintes autores:

Denição 1 : Segundo Bernoulli, a estatística pode ser denida como um conjunto de


métodos e processos quantitativos que servem para estudar e medir os fenómenos colecti-
vos.

Denição 2 : Para Kachigan, a estatística é a disciplina cientíca cujo m consiste na


recolha, organização e interpretação de dados de acordo com procedimentos bem denidos.

Denição 3 : Para Murteira, a estatística é um repositório de instrumentos adequados


para: recolher, explorar, descrever e interpretar conjuntos de dados numéricos.

• A análise de qualquer uma destas denições revela que na base da estatística está

um conjunto de dados sendo esta constituída pelos métodos que são utilizados

para os recolher, organizar, descrever e interpretar.

1.1.2 Importância da Estatística


O mundo actual está repleto de problemas. Para resolvermos a maioria deles, necessitamos

de informações. Mas, que tipo de informação? Que quantidade de informações? Após

obtê-las, que fazer com elas? A estatística trabalha com essas informações, associando os

dados ao problema, descobrindo como e o que coletar, assim capacitando o pesquisador

(ou prossional ou cientista) a obter conclusões a partir dessas informações, de tal forma

que possam ser entendidas por outras pessoas.

Portanto, os métodos estatísticos auxiliam o cientista social, o economista, o engenheiro,

o agrónomo e muitos outros prossionais a realizarem o seu trabalho com mais eciência.

Exemplo 1.1.1 Os estatísticos do governo conduzem censos de população, residências,


produtos industriais, agricultura entre outros. São feitas compilações sobre vendas, pro-
dução, inventário, folha de pagamento e outros dados das indústrias e empresas. Essas
estatísticas informam ao administrador ou decisor ou gestor como a sua empresa está
crescendo, seu crescimento em relação a outras empresas e fornece-lhe condições de pla-
near ações futuras. A análise dos dados é muito importante para se fazer um planeamento
adequado.

Alcides Onésimo Nunda 3 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

1.2 A Estatística e os Métodos Estatísticos


A estatística fornece métodos para a coleta, organização, descrição, análise e interpretação

de dados. Os resultados podem ser utilizados para o planeamentos, tomadas de decisões

ou formulação de soluções.

Denição 4 (Método Estatístico) : O método estatístico pode ser entendido como


um conjunto de meios que, conduzidos e dispostos convenientemente, permite que se ca-
nalizem as informações para determinado objectivo.

1.2.1 Fases da Metodologia Estatística


Quando se pretende empreender um estudo estatístico completo, existem diversas fases do

trabalho que devem ser desenvolvidas para se chegar aos resultados nais de um estudo

capaz de produzir resultados válidos. O estudo estatístico inicia-se com o planeamento

da pesquisa que representa a organização do plano geral do trabalho que estabelece os

objectivos e a utilização dos meios estatísticos. A coleta de dados vai obter informações

sobre a realidade a ser estudada. A pós a coleta dos dados, é necessário classicá-los; isso

signica estabelecer categorias que permitem a união de informações coletadas. As fases

principais são as seguintes:

1. Denição dos Objectivos / Problema : A primeira fase do trabalho consiste

em uma denição ou formulação correcta do problema a ser estudado. Além de

considerar detidamente o problema objecto do estudo, o analista deverá examinar

outros levantamentos realizados no mesmo campo e que sejam análogos, uma vez

que parte da informação de que se necessita pode, muitas vezes, ser encontrada

nesses últimos.

2. Planeamento: O passo seguinte, após a denição do problema, compreende a fase

do planeamento, que consiste em se determinar o procedimento necessário para se re-

solver o problema e, em especial, como levantar informações sobre o assunto, objecto

do estudo. É preciso planear o trabalho a ser realizado tendo em vista o objectivo

que se pretende atingir. É nessa fase que será escolhido o tipo de levantamento a

ser utilizado. Sob esse aspecto, pode haver dois tipos de levantamento:

(a) Levantamento censitário, quando a contagem for completa, abrangendo

todo o universo;

(b) Levantamento por amostragem, quando a contagem for parcial.

Outros elementos importantes que devem ser tratados nesta mesma fase são:

Alcides Onésimo Nunda 4 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• Cronograma das actividades, através do qual são xados os prazos para as

várias fases;

• Custos envolvidos;

• Examinar as informações disponíveis;

• Delineamento da amostra, etc.

3. Coleta de Dados: O terceiro passo é essencialmente operacional, compreendendo

a coleta das informações propriamente ditas. Nesta fase do método estatístico, é

conveniente estabelecer uma distinção entre duas espécies de dados:

(a) Dados primários  quando são publicados ou coletados pelo próprio pesqui-
sador ou organização que os escolheu;

(b) Dados secundários  quando são publicados ou coletados por outra organi-

zação.

• Um conjunto de dados é, pois, primário ou secundário em relação a alguém.

As tabelas do Censo Demográco são fontes primárias. Quando determinado

jornal publica estatísticas extraídas de várias fontes e relacionadas com diversos

sectores industriais, os dados são secundários para quem desejar utilizar-se deles

em alguma pesquisa que esteja desenvolvendo.

A coleta de dados pode ser realizada de duas maneiras:

(a) Coleta Directa  quando é obtida directamente da fonte, como no caso da

empresa que realiza uma pesquisa para saber a preferência dos consumidores

pela sua marca;

(b) Coleta Indirecta  quando é inferida a partir dos elementos conseguidos pela
coleta direta, ou através do conhecimento de outros fenómenos que, de algum

modo, estejam relacionados com o fenómeno em questão.

4. Classicação e Apuramento dos Dados: Antes de começar a analisar os dados,

é conveniente que lhes seja dado algum tratamento prévio, a m de torná-los mais

expressivos. A quarta etapa do processo é, então, a da apuração ou sumarização,

que consiste em resumir os dados através de sua contagem e agrupamento. Pode

ser manual, eletromecânica ou eletrônica.

5. Apresentação dos Dados: Por mais diversa que seja a nalidade, os dados devem

ser apresentados sob forma adequada, tornando mais fácil o exame do fenómeno que

está sendo objecto de tratamento estatístico. Há duas formas de apresentação ou

exposição dos dados observados, que não se excluem mutuamente:

Alcides Onésimo Nunda 5 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

(a) Apresentação tabular  É uma apresentação numérica dos dados. Consiste

em dispor os dados em linhas e colunas distribuídas de modo ordenado, se-

gundo algumas regras práticas adotadas pelos diversos sistemas estatísticos.

As tabelas têm a vantagem de conseguir expor, sinteticamente e em só local,

os resultados sobre determinado assunto, de modo a se obter uma visão global

mais rápida daquilo que se pretende analisar.

(b) Apresentação gráca  É uma apresentação geométrica dos dados numéri-

cos. Embora a apresentação tabular seja de extrema importância no sentido de

facilitar a análise numérica de dados, não permite ao analista obter uma visão

tão rápida, fácil e clara do fenómeno e sua variação como aquela conseguida

através de um gráco.

6. Análise, Interpretação dos Dados e Elaboração do Relatório com as Con-


clusões : Nesta última etapa, o interesse maior reside em tirar conclusões que
auxiliem o pesquisador a resolver seu problema. A análise dos estatísticos está li-

gada essencialmente ao cálculo de medidas, cuja nalidade principal é descrever o

fenómeno. Assim, o conjunto de dados a ser analisado pode ser expresso por núme-

ros, as estatísticas que evidenciam as características particulares desse conjunto. O

signicado exato de cada um dos valores obtidos através do cálculo das várias me-

didas estatísticas disponíveis deve ser bem interpretado. É possível mesmo, nesta

fase, arriscar algumas generalizações, as quais envolverão, como mencionado ante-

riormente, algum grau de incerteza, porque não se pode estar seguro de que o que

foi constatado para aquele conjunto de dados (a amostra) se vericará igualmente

para a população.

1.3 Objectivos da Análise Estatística


O objectivo principal da análise estatística é o de tirar conclusões a partir dos dados por

forma a enriquecer o conhecimento da realidade. Na prossecução deste objectivo geral


podem indicar-s. fundamentalmente, seis objectivos básicos da análise estatística que

não são exclusivos nem exaustivos:

1. Sintetização e redução de dados;

2. Inferência para outros conjuntos de dados;

3. Identicação de relações entre conjuntos de dados;

4. Redução da dimensionalidade de dados multivariados;

5. Classicação e Discriminação de dados multivariados;

Alcides Onésimo Nunda 6 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

6. Agrupamento de dados.

1.4 Tipos de Estatística


A estatística usualmente é dividida em três grandes áreas, embora não se trate de ramos

isolados:

1. Estatística Descritiva ou Dedutiva;

2. Estatística Inferencial ou Indutiva;

3. Probabilidade.

1.4.1 Estatística Descritiva


A Estatística Descritiva é o conjunto de técnicas que objectivam coletar, organizar, apre-

sentar, analisar e sintetizar os dados numéricos de uma população, ou amostra.

O simples levantamento de informação e sua apresentação em tabelas estatísticas, limi-

tando  se a apresentar os dados e grácos de um dado fenómeno levam o nome de

estatística descritiva.

Nota 1.4.1 (Estatística Descritiva) . É a parte mais conhecida. Por exemplo, ao ver
o noticiário, na televisão ou nos jornais, sabe-se quão frequente é o uso de médias, índices
e grácos nas notícias.

Exemplo 1.4.1 (Índice de Preços do Consumidor (IPC)) . Sua construção envolve


a sintetização, em um único número, dos aumentos dos produtos de uma cesta básica.

Exemplo 1.4.2 (Anuário Estatístico Angolano) . O INE 1


publica esse anuário
apresentando, em várias tabelas, os mais diversos dados sobre Angola: educação, saúde,
transporte, economia, cultura, etc. Embora simples, fáceis de serem entendidas, as tabelas
são o produto de um processo demorado e extremamente dispendioso de coleta e apuração
de dados.
1 Instituto Nacional de Estatística

Alcides Onésimo Nunda 7 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

1.4.2 Estatística Inferencial ou Indutiva


Estatística Indutiva (ou Inferencial) - que, a partir da observação de alguns dados expe-

rimentais, permite comparações, ligações lógicas, análise e interpretação de dados com o

objetivo de generalizar e prever resultados.

A Inferência Estatística é constituída pelo conjunto dos métodos que permitem generalizar

ou inferir os resultados de um conjunto de dados ( a amostra) para um conjunto de dados


mais amplo ( população ou universo).

Nota 1.4.2 A tomada de decisões sobre a população, com base em estudos feitos sobre
os dados da amostra, constitui o problema central da inferência estatística.

Exemplo 1.4.3 . Suponha que a distribuição das alturas de todos os habitantes de um


país possa ser representada por uma distribuição normal. Mas não conhecemos de antemão
a média da distribuição. Devemos, pois, estimá-la.

Exemplo 1.4.4 (Análise Financeira) . Os analistas nanceiros estudam dados sobre


a situação da economia, visando explicar tendências dos níveis de produção e de consumo,
projetando-os para o futuro.

1.4.3 Probabilidade
A teoria de probabilidades nos permite descrever os fenómenos aleatórios, ou seja, aqueles

em que está presente a incerteza.

O processo de generalização, que é característico do método indutivo, está associado a uma

margem de incerteza. A existência da incerteza deve-se ao facto de que a conclusão, que se

pretende obter para o conjunto de todos os indivíduos analisados quanto a determinadas

características comuns, baseia-se em uma parcela do total das observações. A medida

da incerteza é tratada mediante técnicas e métodos que se fundamentam na Teoria da


Probabilidade. Essa teoria procura quanticar a incerteza existente em determinada

situação.

1.5 População e Amostra


O estudo de qualquer fenómeno, seja ele natural, social, económico ou biológico, exige a

coleta e a análise de dados estatísticos. A coleta de dados é, pois, a fase inicial de qualquer

Alcides Onésimo Nunda 8 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

pesquisa. É sobre os dados da amostra que se desenvolvem os estudos, visando a fazer

inferências sobre a população.

Exemplo 1.5.1 (Renda média per capita em diversas regiões do país) Toma-se um
conjunto de indivíduos em cada região, escolhidos ao acaso, e sobre esse grupo são feitos
os estudos. Os indivíduos assim escolhidos constituem a amostra e os resultados nela
observados serão estendidos à população.

1.5.1 População ou Universo Estatístico (N)


Denição 5 (População) . A população é um conjunto de todos os elementos (pessoas,
objetos, etc.) que possuem pelo menos uma característica em comum, a(s) qual (is) os
relacionam ao problema que está sendo estudado.

Denição 6 (População) . Uma população é qualquer colecção de entidades bem de-


nidas, ou seja, os elementos ou membros da população estão bem identicadas.

Exemplo 1.5.2 (Alguns exemplos de populações) . Os estudantes da disciplina de


estatística; As cidades angolana com mais de um milhão de habitantes; As empresas
cotadas na bolsa de Angola (BODIVA); Os hospitais do país; Os consumidores de um
produt; Os doentes atendidos nos serviços de urgência de um hospital num determinado
período de tempo; As empresas de Engenharias de Angola, etc.

Exemplo 1.5.3 . Se o problema a ser pesquisado está relacionado com a qualidade de


um certo produto produzido numa indústria, a população pode ser composta por todas as
peças produzidas numa determinada hora, turno, dia ou mês, dependendo dos objectivos.

Exemplo 1.5.4 . Se o objectivo de um estudo é pesquisar o nível de renda familiar de


uma certa cidade, a população seria todas as famílias desta cidade. Mas, se o objectivo
fosse pesquisar apenas a renda mensal do chefe da família, a população a ser pesquisada
seria composta por todos os chefes de família desta cidade.

Classicação da População

As Populações podem ser:

1. Reais - como as populações dos exemplos acima indicados;


2. Hipotéticas - como por exemplo, a população dos resultados que podem ser obtidos
em sucessivos lançamentos de um dado, a população de valores das cotações de uma

certa acção na Bolsa de Valores no próximo ano, etc;

Alcides Onésimo Nunda 9 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

3. Finita - quando o número de unidades de observação pode ser contado e é limitado.


Podemos citar como exemplo de população nita o conjunto formado pelos estudan-

tes que cursam a disciplina de estatística num determinado semestre da Faculdade

de Economia ou ISP-Caála;

4. Innita - quando a quantidade de unidades de observação é ilimitada. Um exemplo

de população innita seria o conjunto formado por todos os alunos de estatística de

Angola, pois este conjunto é composto por um número incontável de elementos.

Nota 1.5.1 Nem sempre a população de interesse (denominada população objectivo)


pode ser observada, ou por que não se conhecem todos os seus elementos, ou por qualquer
outra razão. Neste caso, o investigador apenas pode observar uma outra população que
não a desejável. Esta população é denominada população inquirida.

1.5.2 Amostra (n)


Denição 7 (Amostra) . A amostra é apenas uma parte da população, ou seja, é um
subconjunto da população. Embora que seja constituída por uma parte da população em
estudo, a amostra deve permitir a obtenção de dados representativos dessa população.

Nota 1.5.2 Uma amostra é um subconjunto ou uma parte da população. As amostras


são muito importantes na análise estatística, uma vez que, por razões económicas ou res-
trições de natureza física, não é conveniente ou não é possível observar todos os elementos
de uma dada população.

Nota 1.5.3 Vários motivos levam a necessidade de se observar apenas uma parte da
população, como, por exemplo: a falta de tempo, recursos nanceiros e/ou humanos. A
amostra deve ser obtida através de técnicas de amostragem, as quais tem como objectivo
principal garantir a representatividade da população, ou seja, fazer com que a amostra
seja um retrato el da população.

Exemplo 1.5.5 (Exemplos de Amostra) . Exemplos de amostra podem ser conside-


rados por conjuntos formados por apenas uma parte dos elementos populacionais descritos
nos exemplos 1.5.2 ; 1.5.3 e 1.5.4.

Observação 1.5.1 Em estatística, utilizamos extensamente os termos: população, amos-


tra, censo, parâmetros, estatística, dados discretos, dados contínuos, dados quantitativos
e dados qualitativos:

• População: é uma colecção completa de todos os elementos a serem estudados;

Alcides Onésimo Nunda 10 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• Amostra: é uma subcolecção de elementos extraídos de uma população;

• Censo: é uma colecção de dados relactivos a todos os elementos de uma população;

• Parâmetros: é uma medida numérica que descreve uma característica de uma


população;

• Estatística: é uma medida numérica que descreve uma característica de uma amos-
tra;

• Dados contínuos: resultam de um número innito de valores possíveis que podem


ser associados a pontos em uma escala contínua de tal maneira que não haja lacunas;

• Dados discretos: resultam de um conjunto nito de valores possíveis, ou de um


conjunto enumerável de valores;

• Dados quantitativos: consistem em números que representam contagens ou me-


didas;

• Dados qualitativos: podem ser separados em diferentes categorias que se distin-


guem por alguma característica não-numérica.

1.6 Variáveis (ou Dados) e Tipos de Variáveis


Denição 8 (Variável) . Uma Variável é uma característica (ou dado) associada a
cada elemento da população ou amostra. A variável apresenta diferentes valores, quando
sujeita a mensurações sucessivas, e, em geral, é denotada pelas letras maiúsculas: X, Y
ou Z .

Na população caracterizada pelos funcionários de uma empresa, podemos denir variáveis

como: tempo de serviço, idade, estado civil, sexo, etc.

1.6.1 Tipos de Variáveis


Basicamente, as variáveis podem ser classicadas como sendo Qualitativas ou Quanti-
tativas.

1. Variáveis Qualitativas: quando os valores que elas podem receber são referentes à

qualidade, atributo ou categoria, ou seja, quando expressam uma qualidade ou atri-

buto. Exemplos: Raça, podendo assumir os valores Branco ou Negro; Resultado


de um teste, aprovado ou reprovado; Escolaridade: 1o ciclo, 2o ciclo, superior,

Alcides Onésimo Nunda 11 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

pós-graduado, etc; Conceito de qualidade: péssima, suciente, regular, boa ou

óptima qualidade.

As variáveis qualitativas podem, ser classicadas como: Nominais ou Ordinais.

(a) As variáveis qualitativas nominais - são caracterizadas por dados que se

apresentam apenas sob o aspecto qualitativo (Ex: raça e resultado de um teste);

(b) As variáveis qualitativas ordinais - são caracterizadas por categorias que

apresentam uma ordenação natural. Por exemplo: escolaridade e conceito de

qualidade.

2. Variáveis Quantitativas: quando os valores que ela pode assumir são numéricos,

os quais podem ser obtidos através de uma contagem ou mensuração. Exemplo:

idade, salários, notas da avaliação, números de empresas, etc.

As variáveis quantitativas podem ser classicadas de acordo com o processo de

obtenção; podendo ser: Discreta ou Contínua.

(a) As variáveis quantitativas discretas - são variáveis numéricas obtidas a

partir de procedimento de contagem. Assumem apenas os valores de um con-

junto enumerável, ou seja, pode assumir apenas valores inteiros. Por exemplo:

Quantidade de pessoas numa família de um banco , quantidade de acidentes

numa indústria, número de carros num estacionamento, etc.

(b) As variáveis quantitativas contínuas - são variáveis numéricas cujos valores


são obtidos por um procedimento de mensuração, podendo assumir quaisquer

valores num intervalo dos números reais. Assumem inúmeros valores numéricos

entre dois limites, ou seja, podem assumir valores decimais. Exemplo: tempo

de espera na la de um supermercado, peso, temperatura, altura, salário, etc.

Observação 1.6.1 . O facto de uma variável ser expressa por números não signica
que ela seja necessariamente quantitativa, por que a classicação da variável depende de
como foi medida, e não do modo como se manifesta. Por exemplo, para a variável peso de
um lutador de boxe, se for anotado o peso marcado na balança, a variável é quantitativa
contínua; por outro lado, se esse peso for classicado segundo as categorias do boxe, a
variável é qualitativa ordinal.

Exemplo 1.6.1 O gerente de um restaurante do Huambo, pesquisou a preferência de seus


clientes sobre a fruta a ser servida após a refeição. A fruta preferida, a partir de uma
amostra de 50 clientes, foi o ananás. Resposta: Neste exemplo, a população em estudo

Alcides Onésimo Nunda 12 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

são os clientes do restaurante; O número de elementos da amostra são os 50 clientes e a


variável em estudo é a fruta, que é qualitativa.

1.7 Números Aproximados e Arredondamento de Da-


dos. Cálculo de Percentagem
1.7.1 Números Aproximados e Arredondamento de Dados
Existem muitas normas de arredondamento de dados na numeração decimal. A norma em

uso na actualidade é a norma NBR 5891 da Associação Brasileira de Normas Técnicas

(ABNT). Estas regras estão de acordo com a resolução 886/66 do IBGE:

0, 1, 2, 3 ou 4,
1. Quando o primeiro algarismo a ser abandonado no arredondamento é

ca inalterado o último algarismo a permanecer (arredondamento por defeito).

Exemplo:

25, 732 −→ 25, 73 ; 409, 04 −→ 409, 0 ; 3, 79021 −→ 3, 7902.

2. Quando o primeiro algarismo a ser abandonado no arredondamento é 6, 7, 8 ou


9, aumenta-se uma unidade ao último algarismo a permanecer (arredondamento
por excesso). Exemplos:

19, 4817 −→ 19, 482 ; 2, 309 −→ 2, 31 ; 2, 99 −→ 3, 0.

3. Quando o primeiro algarismo a ser abandonado no arredondamento é 5, há dois

procedimentos:

(a) Se após o algarismo 5 seguir em qualquer casa um número diferente de 0,


aumenta-se em uma unidade o algarismo de antecede o 5. Exemplo:

237, 85001 −→ 237, 9 ; 5, 5256 −→ 5, 53.

(b) Se após o algarismos 5 não seguir ( em qualquer casa) um número diferente

de0, aos algarismo que antecede o 5 será acrescentada uma unidade, se for

ímpar, e permanecerá como está, se for par. Exemplo:

247, 235 −→ 247, 24 ; 1349, 85 −→ 1349, 8 ; 12, 1250 −→ 12, 12.

Alcides Onésimo Nunda 13 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Observação 1.7.1 Eventualmente, nos softwares de computadores ( como o Excel) e


calculadoras cientícas, porém, não é aplicado o critério indicado no item 3. Nesses
casos, se o primeiro algarismo a ser abandonado for o algarismo 5, o arredondamento
será feito com o aumento de uma unidade ao algarismo que antecede o 5. Exemplo:

247, 235 −→ 247, 24 ; 1349, 85 −→ 1349, 9 ; 12, 1250 −→ 12, 13.

1.7.2 Cálculo de Percentagem


Denição 9 . Percentagens são razões em que um valor total está associado a uma
quantidade de 100% e, por meio de uma regra de três simples, podemos estabelecer a
correspondência entre uma parcela do valor total e o seu valor percentual:

Total −→ 100%
Parcela −→ X% (1.7.1)

X%Total = 100% · Parcela


100% × Parcela
X% = (1.7.2)
Total

Alcides Onésimo Nunda 14 Pedro Domingos Chitandula


Capítulo 2

Técnicas de Amostragem

Existem técnicas adequadas para recolher amostras, de forma a garantir (tanto quanto

possível) o sucesso da pesquisa e dos resultados. Nem sempre é possível fazer uma pesquisa

envolvendo a população para obter os dados de estudo. Por exemplo para vericar a

quantidade de poluentes tóxicos em um rio, retirase uma pequena quantidade de água

para análise. Outro exemplo : nem todas as declarações entregues a AGT têm vericação
detalhada, a escolha dos contribuintes que participam da chamada  malha na é feita

por amostragem.

2.1 Importância da Amostragem


Na realização de qualquer estudo, quase nunca é possível examinar todos os elementos da

população de interesse. Temos usualmente que trabalhar com uma amostra da população.

A inferência estatística nos dá elementos para generalizar, de maneira segura, as conclu-

sões obtidas da amostra para a população. Mas, para as inferências serem corretas, é

necessário garantir que a amostra seja representativa da população, isto é, a amostra deve

possuir as mesmas características básicas da população no que diz respeito ao fenómeno

pesquisado.

É uma utopia pensar que, caso tivéssemos acesso a todos os elementos da população,

seríamos mais precisos. Os erros de coleta e manuseio de um grande número de dados são

maiores do que as imprecisões a que estamos sujeitos quando generalizamos, via inferência,

as conclusões de uma amostra bem selecionada. Tratando-se de amostra, a preocupação

central é que ela seja representativa. É preciso que a amostra, ou as amostras que vão ser

usadas sejam obtidas por processos adequados. Assim obter informações através de um

levantamento amostral, nos deparamos imediatamente com os seguintes problemas:

15
Notas - Estatística I FEC - UJES/2021-2022

• Denir cuidadosamente a população de interesse;

• Selecionar a característica que iremos pesquisar.

Nota 2.1.1 Dados coletados de forma descuidada podem ser tão inúteis que nenhum
processamento estatístico consegue salvá-los.

2.2 Vantagens da Amostragem


São vantagens das técnicas de amostragens : a economia, tempo, conabilidade dos dados

e operacionalidade:

• O levantamento de dados sobre uma parte das população é mais económico que o

levantamento de dados sobre toda a população;

• O levantamento de dados sobre uma parte da população é mais rápido que o levan-

tamento de dados sobre toda a população;

• Ocorre menor número de erros em pesquisas que disponham de menor número de

elementos;

• É mais fácil trabalhar os dados em menor escala.

2.3 Critérios para Seleção de Amostras


É aconselhável haver critérios para a seleção dos elementos da amostra, cada elemento da

população deve ter a mesma chance de ser escolhido para garantir à amostra o carácter

de representatividade. Para tanto deve  se estabelecer um número mínimo de elementos

para compor a amostra. O tamanho da amostra não segue nenhuma regra xa, sendo

assim, para populações de tamanho relativamente pequeno ou médio, sugere-se que o

tamanho da amostra não seja menor que 10 % do total de elementos da população.

Exemplo 2.3.1 Numa empresa de 200 funcionários deve ser selecionado um mínimo de
20 funcionários (10 % 200) para compor uma amostra.

Nota 2.3.1 Para fazer inferências válidas sobre a população a partir de uma amostra, é
preciso que essa seja representativa. Uma das formas de se conseguir representatividade
é fazer com que o processo de escolha da amostra seja, de alguma forma, aleatório. Além
disso, a aleatoriedade permite o cálculo de estimativas dos erros envolvidos no processo
de inferência. Quanto à extracção dos elementos, as amostras podem ser:

Alcides Onésimo Nunda 16 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• Com reposição - quando um elemento sorteado pode ser sorteado novamente;


• Sem reposição - quando o elemento sorteado só pode gurar uma única vez na
amostra.

2.4 Tipos de Técnicas de Amostragem


Denidos os objectivos e a população a ser estudada, deve-se pensar em como será consti-

tuída a amostra dos dados e quais as características ou variáveis a serem estudadas. Neste

Amostragem Casual ou
sentido, as técnicas fundamentais para determinação da são :

Aleatória Simples; Amostragem Proporcional Estraticada, Amostragem Sis-


temática e Amostragem por Conglomerado.

2.4.1 Amostragem Casual ou Aleatória Simples


A amostragem aleatória simples é um processo para selecionar amostras de tamanho  n
dentre as  N unidades em que foi dividida a população. Sendo a amostragem reali-

zada sem reposição, que é o caso mais comum, existem ( N,n) possíveis amostras, todas

igualmente prováveis. As amostras aleatórias podem ser escolhidas por diversos métodos,

inclusive por tabelas de números aleatórios ( TNA 1


)

Nota 2.4.1 A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda
ou vice-versa), verticalmente (de cima para baixo ou vice- versa), diagonalmente (no
sentido ascendente ou descendente). A opção, porém, deve ser feita antes de iniciado o
processo e de computadores para gerar números aleatórios. Na prática, a amostra aleatória
simples é escolhida unidade por unidade. As unidades da população são numeradas de 1
a N.

Neste tipo de amostragem, todos os elementos da população estão disponíveis para serem

avaliados na amostra. Essa técnica deve garantir que qualquer elemento da população

tenha a mesma probabilidade de ser selecionado. Para tanto, a seleção deve ocorrer por

meio de sorteio.

1A TNA (Tabela de Números Aleatórios)  consiste em tabelas que apresentam sequências dos dígitos
de 0 a 9 distribuídos aleatoriamente nas linhas( horizontais) e colunas (verticais). Para obter os elementos
da amostra usando a TNA, sorte-a-se uma linha e uma coluna qualquer para começar a leitura.

Alcides Onésimo Nunda 17 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Exemplo 2.4.1 (Amostragem Aleatória Simples) . Procure os 10 primeiros núme-


ros na TNA começando a leitura na 9a linha e na 5a coluna (cada dígito representa uma
coluna). Os 10 primeiros números são: 1, 0, 0, 1, 8, 4, 7, 0, 1, 3.

Nota 2.4.2 Para retirar amostras em populações com mais de 10 itens é necessário ler
as colunas quantos dígitos compõe o número total de itens da população. Exemplo: para
retirar 5 amostras de uma população com 300 itens, temos que ler três colunas para con-
seguirmos valores entre 001 e 300. Se o número sorteado superar o número de elementos
rotulados, abandona-se o número sorteado, prosseguindo-se o processo. Considerando a
9a linha e 5a coluna temos como resposta : 124, 056, 094, 143, 014.

2.4.2 Amostragem Proporcional Estraticada


A amostragem proporcional estraticada considera a população dividida em estratos,

em que cada estrato abrange um subconjunto da população que reúne características

comuns entre seus elementos. Nesse processo, a variável em estudo apresenta comporta-

mento diferente em cada estrato. Por exemplo, se a característica for sexo, a população

será dividida em dois grupos (estratos): masculino e feminino.

Denição 10 Uma amostra estraticada é obtida separando-se as unidades da população


em grupos não super postos chamados estratos, e selecionando-se independentemente uma
amostra aleatória simples de cada estrato.

Existem dois tipos de amostragem estraticada: Do mesmo tamanho e Proporcional.

• No primeiro tipo, sorteia-se igual número de elementos em cada estrato. Esse pro-

cesso é utilizado quando o número de elementos por estrato for aproximadamente o

mesmo.

• No outro caso, utiliza-se a amostragem estraticada proporcional, cujo processo de

calcular o número de amostras por estrato é:

Na na n
= −→ na = Na (2.4.1)
N n N

Onde:N −→ N o de unidades da população; n ←→ N o de unidades das amostras;

Na ←→ N o de unidades do estrato A; na ←→ N o de amostras de A.

Nota 2.4.3 A amostragem proporcional estraticada, além de levar em conta a existência


de estratos, também considera que o número de elementos extraídos de cada estrato seja
proporcional aos respectivos estratos.

Alcides Onésimo Nunda 18 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Exemplo 2.4.2 Uma empresa de marketing digital do Huambo conta com 480 funcio-
nários, dos quais 288 são do sexo feminino e os 192 restantes do sexo masculino. Con-
siderando a variável "sexo"para estraticar essa população, foi selecionada uma amostra
proporcional estraticada de 50 funcionários. Calcule a proporção de funcionários de cada
sexo contida na amostra.

• Resolução: População: 480 funcionários; Amostra : 50 funcionários

 Primeiro estrato : 288 funcionários do sexo feminino (60 % da população)


 Segundo estrato: 192 funcionários do sexo masculino (40 % da população).
• Isso signica que a composição de funcionários da amostra deve manter a mesma
proporcionalidade dos estratos, do primeiro estrato serão 60 % dos elementos da
amostra e do segundo estrato serão retirados 40 % dos elementos da amostra:

Tabela 2.1: Amostragem proporcional estraticada por sexo de uma empresa de marketing
digital

Estrato População Proporção da Amostra proporcional


(por sexo) População Estraticada
288
Feminino 288
480
= 0.6(60%) n1 = 0.60 × 50 = 30
192
Masculino 192
480
= 0.4(40%) n2 = 0.40 × 50 = 20
Total 480 50

• Composição dos 50 funcionários da amostra n1 = 30 mulheres e n2 = 20 homens.

Exemplo 2.4.3 Com objectivo de levantar o estilo de comunicação ideal preferido pelos
trabalhadores da Fábrica Cuca do Huambo, realiza-se o levantamento por amostragem. A
população é composta por 200 chefes de secção, 4 400 operários especializados e 1 200
operários não especializados. Obtenha uma amostra com 5 % dos operários da indústria,
mantendo as mesmas relações de proporcionalidade em cada estrato.

Tabela 2.2: Amostragem proporcional estraticada dos trabalhadores da Fábrica Cuca.

Estrato População Amostra proporcional


(por sexo) Estraticada
Chefe de Secção 200 n1 = 200 × 0, 05 = 10
Trabalhadores especializados 4.400 n2 = 4.400 × 0, 05 = 220
Trabalhadores não especializados 1.200 n3 = 1.200 × 0.05 = 60
Total 5.800 290

• A amostra deverá conter 5 % do total de trabalhadores, ou seja 290 trabalhado-


res, composição dos trabalhadores da amostra n1 = 10 chefes de secção; n2 = 220
trabalhadores especializados e n3 = 60 trabalhadores não especializados.

Alcides Onésimo Nunda 19 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

2.4.3 Amostragem Estraticada Uniforme


Este método da amostragem estraticada uniforme não utiliza o critério de proporciona-

lidade, pois se selecciona a mesma quantidade de elementos de cada estrato. Deve ser

usado se o maior interesse for comparar os estratos ou obter estimativas separadas para

cada estrato.

Exemplo 2.4.4 Considerando o Exemplo 2.4.2, em que uma empresa de marketing digi-
tal conta com 480 funcionários, dos quais 288 são do sexo feminino e os 192 restantes do
sexo masculino. Considerando a variável "sexo"para estraticar essa população, vamos
obter uma amostra estraticada uniforme de 50 funcionários. Supondo que haja homoge-
neidade dentro de cada categoria, pode-se obter uma amostra estraticada uniforme de 50
funcionários com a selecção de 25 elementos de cada estrato.

Tabela 2.3: Amostragem proporcional estraticada dos trabalhadores da Fábrica Cuca.

Estrato População Amostra proporcional


(por sexo) Estraticada
Feminino 288 n1 = 25
Masculino 192 n2 = 25
Total 480 50

• Composição dos 50 funcionários da amostra: n1 = n2 = 25.

2.4.4 Amostragem Sistemática


Quando os elementos da população já se encontram ordenados, não há necessidade de

se construir o sistema de referência. Nesses casos, a seleção dos elementos que consti-

tuirão a amostra pode ser por um sistema imposto pelo pesquisador. Este método é um

procedimento para amostragem aleatória, utilizado quando os elementos da população já

se acham ordenados. Exemplos que podem ser citados: as casas e prédios de uma rua,

funcionários de uma empresa, as linhas de produção, listas de alunos, etc.

Em geral, para se obter uma amostra sistemática de n elementos de uma população de

tamanho N , K deve ser menor ou igual a N/n. Não é possível determinar K , precisamente,
quando o tamanho da população é desconhecido, mas pode-se supor um valor de k de

tal modo que seja possível obter uma amostra de tamanho n. Em vez da amostragem

aleatória simples, pode-se empregar a amostragem sistemática pelas seguintes razões:

• A amostragem sistemática é mais fácil de se executar e, por isso, está menos sujeita

a erros do entrevistador do que aqueles que acontecem na aleatória simples;

Alcides Onésimo Nunda 20 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• A amostragem sistemática frequentemente proporciona mais informações por custo

unitário do que a aleatória simples.

Método para seleção dos elementos de uma amostra sistemática de uma po-
pulação.

• Consideramos uma população com N elementos e que se deseja extrair uma amostra

sistemática de n elementos:

 Intervalo de Seleção (I) 2


: utilizando o método de amostragem sistemática,

denimos o intervalo de seleção para extração dos elementos da população que

irão compor a amostra:

N
I= , (n < N ) (2.4.2)
n
onde I é o intervalo de seleção, N= tamanho da população, n= tamanho da

amostra.

 Primeiro elemento da amostra (m): na amostragem sistemática a posição

do primeiro elemento da amostra é obtido por sorteio, e deve pertencer aos

"I "elementos iniciais da lista. Utilizaremos "m"para designar a posição do

elemento sorteado.

∗ m= posição do primeiro elemento da amostra e obtido por sorteio. Por

exemplo, se o intervalo de seleção for I = 18, o primeiro elemento da

amostra deve ser sorteado entre os 18 elementos iniciais da lista, ou seja, o

valor sorteado deve estar limitado entre os valores do primeiro ao décimo

oitavo elemento.

∗ O valor sorteado poderia ser o de número m = 5 ( pois está dentro do

intervalo entre os 18 elementos iniciais da lista), mas não poderia ser o de

número m = 27 ( pois está fora do intervalo entre os 18 elementos iniciais

da lista).

 Próximos elementos da amostra : considerando a posição do primeiro

elemento da amostra, os próximos serão selecionados em intervalos regulares

de "I "elementos de cada

∗ Posição do primeiro elemento da amostra = m


∗ Posição do segundo elemento da amostra = m+I
∗ Posição do terceiro elementos da amostra = m + 2I
∗ Posição do quarto elemento da amostra = m + 3I
2O intervalo de seleção corresponde ao número de vezes que a amostra cabe na população.

Alcides Onésimo Nunda 21 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

∗ E assim sucessivamente.

 Ultimo elemento da amostra: a posição do ultimo elemento da amostra

pode ser calculado pela fórmula a seguir:

m + (n − 1)I (2.4.3)

Exemplo 2.4.5 (Amostragem Sistemática) Uma empresa prestadora de serviço man-


tém um cadastro de 2.185 clientes, e pretende vericar o interesse de seus clientes por
um novo produto, para isso, selecciona uma amostra sistemática de 70 clientes

a). Supondo que o primeiro cliente (obtido por sorteio) seja o de número 21, determine
os números dos próximos cinco clientes seleccionados.

b). Qual o número do último cliente seleccionado?

• Tamanho da população: N = 2.185; Tamanho da amostra: n = 70.

• Intervalo de seleção: I = N
n
= 2.185
70
= 31, 21 ≈ 31

a). Posição do primeiro elemento da amostra m = 21. Os números dos próximos cinco
clientes selecionados para amostra são:

 Posição de segundo elemento da amostra: m + I = 21 + 31, 21 ≈ 52


 Posição do terceiro elemento da amostra m + 2I = 21 + 2×, 21 ≈ 83
 Posição do quarto elemento da amostra: m + 3I = 21 + 3×, 21 ≈ 115
 Posição do quinto elemento da amostra: m + 4I = 21 + 4 × 31, 21 ≈ 146
 Posição do sexto elemento da amostra. m + 5I = 21 + 5 × 31, 21 ≈ 177
 Número dos próximos cinco clientes selecionados: 52, 83, 115, 146, 177

b). Posição do último elemento da amostra: 21 + (70 − 1)31, 21 = 2.174.

2.4.5 Amostragem por Conglomerado


Denição 11 Uma amostra por conglomerado é uma amostra aleatória simples na qual
cada unidade de amostragem é um grupo, ou um conglomerado de elementos.

• O primeiro passo na amostragem por conglomerado é especicar conglomerados

apropriados. Os elementos em um conglomerado tendem a ter características si-

milares, portanto, o fato de novas medidas serem tomadas num conglomerado não

implica necessariamente aumento de informação sobre o parâmetro populacional.

Alcides Onésimo Nunda 22 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Como regra geral, o número de elementos num conglomerado deverá ser pequeno

em relação ao tamanho da população e o número de conglomerados deverá ser ra-

zoavelmente grande.

Nota 2.4.4 Na amostragem por conglomerado a população é dividida em grupos. Selecionam-


se amostras aleatórias simples de grupos e, então, todos os itens dos grupos (conglomera-
dos) selecionados farão parte da amostra.

Exemplo 2.4.6 Em um levantamento da população de uma cidade, podemos dispor do


mapa indicando cada quarteirão e não dispor de uma relação actualizada dos seus mora-
dores. Pode-se, então, colher uma amostra dos quarteirões e fazer a contagem completa
de todos os que residem naqueles quarteirões sorteados.

Alcides Onésimo Nunda 23 Pedro Domingos Chitandula


Capítulo 3

Séries Estatísticas e Grácos


Estatísticos

O estudo desta temática exige de nós o estudo do conceito de tabela. As tabelas são

recursos utilizados pela estatística, com o objectivo de organizar e facilitar a visualização

e comparação dos dados. As tabelas permitem uma visão geral dos valores assumidos

pelas variáveis dentro de certos parâmetros.

Denição 12 (Tabela) . É um conjunto de observações a respeito de determinado as-


sunto, organizadas e distribuídas num quadro. Ao elaboramos devemos caracterizar a
descrição das informações mediante um título, cabeçalhos, dados e rodapé. Conforme a
tabela abaixo:

Tabela 3.1: Indicadores Económicos de Angola em 2020 (%)

Indicadores 2020
Saldo Orçamental ( % do PIB) - 1.7
Dívida Pública (% do PIB) 134, 2
Saldo Externo ( % do PIB) 16,6
Taxa de Crescimento do PIB (%) - 6,8
Taxa de Desemprego (%) 30,6
Taxa de Inação Anual (%) 25,1
Preço do Barril de Petróleo (USD) 42,8

Fonte: INE, Angola

Nota 3.0.1 Uma tabela compõe-se de:

• Corpo  conjunto de linhas e colunas que contém informações sobre a variável em


estudo;

24
Notas - Estatística I FEC - UJES/2021-2022

• Cabeçalho  parte superior da tabela que especica o conteúdo das colunas;


• Coluna indicadora  parte da tabela que especica o conteúdo das linhas;

• Linhas  rectas imaginárias que facilitam a leitura, no sentido horizontal, de dados


que se inscrevem nos seus cruzamentos com as colunas;

• Casa ou célula  espaço destinado a um só número;


• Título  conjunto de informações, as mais completas possíveis, respondendo às
perguntas: O quê?- Quando?- Onde?- localizado no topo da tabela.

• Fonte  referência de onde se obteve os dados, colocado, de preferência, no rodapé.

3.1 Séries Estatísticas


Dene-se série estatística como toda e qualquer coleção de dados estatísticos referidos a

uma mesma ordem de classicação: quantitativa. No sentido mais amplo, série é uma

sucessão de números referidos a qualquer variável. Se os números expressarem dados es-

tatísticos, a série será chamada de série estatística. Em sentido mais restrito, pode-se

dizer que uma série estatística é uma sucessão de dados estatísticos referidos a caracte-

res qualitativos, ao passo que uma sucessão de dados estatísticos referidos a caracteres

quantitativos congurará uma Distribuição de Frequência.

Denição 13 . É chamada séria estatística toda tabela que apresenta um conjunto de da-
dos estatísticos distribuídos em função da época ,local ou de espécie. Elas são classicadas
em : Temporais; Geográcas; Especícas e Distribuição de Frequências.

3.1.1 Series Temporais, Cronológicas, Históricas, Evolutivas (ou


Marchas)
A evolução cronológica é predominante nesse tipo de série. Observa-se a variação do

tempo, enquanto o facto e o local permanecem constantes. Também chamada de série

temporal, série histórica, série evolutiva ou marcha, identica-se pelo caráter variável do

factor cronológico. Assim, deve-se ter: Elemento variável: Época ou Tempo; Elementos
Fixos: Local e Fenómeno ou Facto.

Alcides Onésimo Nunda 25 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Exemplo 3.1.1 (Serie Temporal, Cronológica, Histórica, Evolutiva (ou Marcha))

Tabela 3.2: Reservas Internacionais Líquidas (USD Mil Milhões) em 2020

Meses Reservas (em Mil Milhões de Dólares)


Janeiro 11,7
Fevereiro 10,9
Março 10,9
Abril 10,9
Maio 10,2
. Junho 10,4
Julho 10,3
Agosto 9,6
Setembro 9,3
Outubro 9,2
Novembro 9,2
Dezembro 9,1

Fonte: Elaborado pelos Autores a partir dos dados do BNA, 2020.

• Facto: Reservas Internacionais Liquidas de Angola em 2020 (constantes);

• Local: Angola; Tempo: Janeiro, Fevereiro, Março, Abril, Maio, Junho, Julho,

Agosto, Setembro, Outubro, Novembro e Dezembro (variável).

3.1.2 Séries Geográcas, Espaciais, Territoriais ou Localização


A descriminação segundo regiões é predominante nesse tipo de série, ou seja apresenta o

factor geográco como elemento variável. Nessa série, o local varia enquanto o tempo e o

facto permanecem constantes. A série geográca também é chamada espacial, territo-


rial ou localização.

Nota 3.1.1 (Série Geográca) Também chamada de série territorial, série espacial ou
série de localização, identica-se pelo caráter variável do factor geográco. Assim, deve-se
ter: Elemento variável: Local Elementos Fixos: Época e Fenómeno.

Alcides Onésimo Nunda 26 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Exemplo 3.1.2 (Séries Geográcas, Espaciais, Territoriais ou Localização)

Tabela 3.3: Taxa de Desemprego da população por Região

Região Taxa de Desemprego ( %)


Cabinda 36,9
Luanda 24,3
Huíla 23,2
.
Huambo 17,1
Lunda Sul 39,7
Moxico 31,2
Média das Regiões 28,7

Fonte: Elaborado pelos Autores a partir dos dados do INE, 2015 - 2020.

• Facto : Taxa de desemprego (constante)

• Local : Cabinda, Luanda, Huíla, Huambo, Luanda Sul ,e Moxico. Tempo : Ano

de 2015  2020 ( constante)

3.1.3 Series Especicas ou Categóricas


Nesse tipo de série, predomina a descriminação segundo categorias ou especicações. O

local e o tempo permanecem constantes enquanto o facto varia. A série especica também

é chamada de categórica.

Nota 3.1.2 (Série Especíca) Também chamada de série categórica ou série por ca-
tegoria, identica-se pelo carácter variável de factor especicativo. Assim, deve-se ter:
Elemento variável: Fenómeno; Elementos Fixos: Local e Época

Exemplo 3.1.3 (Series Especicas ou Categóricas)

Alcides Onésimo Nunda 27 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Tabela 3.4: Número de trabalhadores (sector público e privado) das várias classes de
salários em Angola  2018 - 2020

Salário (em Kwanzas) Número de Trabalhadores


Até 80.000 41. 326
De 80.000 a 119.000 123 236
De 120.000 a 159.000 428 904
De 160.000 a 199.000 324 437
. De 200.000 a 399.000 787 304
De 400.000 a 599.000 266 002
De 600.000 a 799.000 102 375
De 800.000 a 999.000 56 170
1.000.000 e mais 103 788
Total 2.233.542

Fonte: Elaborado pelos Autores a partir dos dados do MAPESS.

• Facto : Classes de Salários (Variável).

• Local : Angola; Tempo: Ano de 2018 - 2020 ( constante)

3.1.4 Séries Conjugadas ou Tabela de Dupla Entrada


As tabelas apresentadas anteriormente são tabelas estatísticas simples, onde apenas uma

série está representada. É comum, todavia, haver necessidade de apresentar, em uma

única tabela, mais do que uma série. Quando as séries aparecem conjugadas, tem-se

uma tabela de dupla entrada. Em uma tabela desse tipo são criadas duas ordens de

classicação: uma horizontal (linha) e uma vertical (coluna).

Exemplo 3.1.4 (Séries Conjugadas ou Tabela de Dupla Entrada)

Alcides Onésimo Nunda 28 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Tabela 3.5: Inquérito do emprego em Angola (IEA), referente ao II trimestre de 2021.


.
Indicadores II Trimestre I Trimestre II Trimestre
2020 2021 2021
População com 15 ou mais anos 16 812 503 17 274 534 17 373 096
População Economicamente activa 14 844 944 15 565 225 15 675 396
População Empregada 10 072 567 10 821 205 10 715 234
População Desempregada 4 772 378 4 744 020 4 960 162
População Inactiva 1 967 558 1 709 309 1 697 700
Taxa de Actividade 88,3 90,1 90,2
Taxa de Emprego 59,9 62,6 61,7
Taxa de Desemprego 32,1 30,5 31,6
Taxa de Inactividade 11,7 9,9 9,8

Fonte: Elaborado pelos Autores a partir dos dados do INE,2021.

Observação 3.1.1 . Nem sempre uma tabela representa uma série estatística. Por ve-
zes, os dados reunidos não revelam uniformidade, sendo meramente um aglomerado de
informações gerais sobre determinado assunto, as quais, embora úteis, não apresentam a
consistência necessária para se congurar uma série estatística.

3.2 Grácos Estatísticos


A representação gráca das séries estatísticas tem por nalidade representar os resultados

obtidos, permitindo que se chegue a conclusões sobre a evolução do fenómeno ou sobre

como se relacionam os valores da série. A escolha do gráco mais apropriado cará a

critério do analista. Contudo, os elementos simplicidade, clareza e veracidade devem ser

considerados, quando da elaboração de um gráco.

• Simplicidade  o gráco deve ser destituído de detalhes de importância secundária,


assim como de traços desnecessários que possam levar o observador a uma análise

morosa ou sujeita a erros.

• Clareza  o gráco deve possibilitar uma correcta interpretação dos valores repre-

sentativos do fenómeno em estudo.

• Veracidade  o gráco deve expressar a verdade sobre o fenómeno em estudo.

Nota 3.2.1 (Diretrizes para a Construção de um Gráco:) • O título do grá-


co deve ser o mais claro e completo possível. Quando necessário, deve-se acres-
centar subtítulos;

Alcides Onésimo Nunda 29 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• A orientação geral dos grácos deve ser da esquerda para a direita;

• As quantidades devem ser representadas por grandezas lineares;

• Sempre que possível, a escala vertical há de ser escolhida de modo a aparecer a linha
0 (zero);

• Só devem ser incluídas no desenho as coordenadas indispensáveis para guiar o olhar


do leitor ao longo da leitura. Um tracejado muito cerrado diculta o exame do
gráco;

• A escala horizontal deve ser lida da esquerda para a direita, e a vertical de baixo
para cima;

• Os títulos e marcações do gráco devem ser dispostos de maneira que sejam facil-
mente lidos, partindo da margem horizontal inferior ou da margem esquerda.

Denição 14 Os grácos são desenhos que envolvem formas e cores cuja construção
utiliza técnicas de desenho. Eles processam as mesmas informações das tabelas, porém
produzem comunicação visual mais rápida, permitindo melhor compreensão das principais
características dos dados. Além disso, fazem correspondências entre elementos de uma
série estatística e uma gura geométrica, de tal modo que haja proporcionalidade nessa
representação.

levando em consideração os objectivos e os usos a que se destinam os grácos classicamse

em dois tipos : grácos de informação e grácos de análise. Se for levado em conta

o visual de acordo com a composição de formas, os principais tipos de grácos são:

• Diagramas (grácos geométricos em duas dimensões);

• Grácos polar ou radar ( par representar séries temporais cíclicas);

• Cartogramas ( ilustrações relativas a cartas geográcas); Pictogramas (representa-

ção gráca ilustrada por guras);

3.2.1 Diagramas
Os diagramas são grácos de representação geométrica num universo de duas dimensões.

Em geral, utiliza-se o sistema cartesiano para a construção gráca. Eles classicamse

em : linhas ou curvas; colunas ou barras; colunas (barras) múltiplas; e sectores

Alcides Onésimo Nunda 30 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Grácos em Linha ou Curva

Os grácos em linha ou em curva são elaborados no espaço cartesiano e utilizam um par

de eixos ortogonais, que recebem o nome de eixos coordenados. Sendo que:

• O eixo das abscissas (eixo dos x) correspondente ao eixo horizontal;

• O eixo das ordenadas (eixo dos y) correspondente ao eixo coordenado vertical.

Exemplo 3.2.1 (Gráco em Linha ou Curva) . Os valores da variação de uma ca-


racterística são marcados no eixo das abscissas (no exemplo: anos), e os valores corres-
pondentes a outra variação no eixo das ordenadas (exemplo: vendas). Para a construção
do gráco em linha, consideramos os anos no eixo das abscissas e os correspondentes valo-
res das vendas no eixo das ordenadas. Posteriormente, consideramos os pares ordenados
e fazemos suas representações por meio de pontos grácos.

Figura 3.1: Vendas em milhares de kwanzas

Fonte: Dados Fictícios.

Grácos em Colunas ou em Barras

Nos grácos em colunas ou em barras, são feitas correspondências entre elementos de uma

série estatística e a gura geométrica de um retângulo, de tal modo que haja proporcio-

nalidade nessa representação.

• grácos de colunas : retângulos verticais.

Alcides Onésimo Nunda 31 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• grácos de barras : retângulos horizontais.

Nota 3.2.2 . Podemos construir o gráco em colunas ou em barras. O Excel nos per-
mite a elaboração do gráco com diferentes visuais. Para construir o gráco em barras,
considera-se o comprimento do retângulo, associação ao número populacional e a largura
associada ao ano correspondente (exemplo 3.2.2).

Exemplo 3.2.2 (Gráco em Coluna ou em Barra) . População do Huambo de 2017


a 2020.

Figura 3.2: Gráco em Colunas

Figura 3.3: Gráco em Barras

Fonte: Dados Fictícios.

Grácos em Coluna ( Barras) Múltiplas

É a representação simultânea de dois ou mais fenómenos num mesmo gráco. Essa simul-

taneidade tem por objectivo permitir a comparação entre os fenómenos estudados. Esse

gráco também poderia ter sido construído em barras múltiplas.

Exemplo 3.2.3 (Grácos em Coluna ( Barras) Múltiplas) .

Alcides Onésimo Nunda 32 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Figura 3.4: Inquérito do emprego em Angola (IEA), referente ao II trimestre de 2021

Fonte: INE, 2021.

Grácos em Sectores

Denição 15 (Grácos em Sectores) . É a representação gráca de uma série esta-


tística em círculo, por meio de sectores. É utilizado principalmente quando se pretende
comparar cada valor da série com o total.

• O gráco de sectores não deve ser empregado se houver mais de sete dados.

• O total é representado pelo círculo todo, cada subconjunto é representado por um

sector, de tal modo que haja proporcionalidade nessa representação.

• A representação da área de cada sector é obtida por uma regra de três simples. O

círculo corresponde ao ângulo de 360o e é associado ao valor total, um ângulo Xo


corresponde a um subconjunto do total (um dos dados).

Total −→ 360o (3.2.1)

Subconjunto −→ X o

Exemplo 3.2.4 (Gráco em Sector) . A representação gráca por sectores circulares


é feita com base a tabela 3.5 . Cada sector circular representará um indicador, e terá área
proporcional aos valores da taxa de actividade, de emprego, de desemprego e da taxa de
inactividade no II trimestre de 2021.

Alcides Onésimo Nunda 33 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Figura 3.5: Inquérito do emprego em Angola (IEA), referente ao II trimestre de 2021

Fonte: INE, 2021.

Nota 3.2.3 Se o gráco for feito manualmente, sua construção deve ser proporcional aos
valores especicados na tabela 3.5. Por exemplo para o indicador taxa de emprego, temos:

193, 3 −→ 360o
61, 7 −→ X o
X = 115o

115o graus no circulo corresponde a 32 % da área do círculo, que por outro lado signica
que a população empregada representa 32 % da população economicamente activa. O
cálculo e análise são análogos para os demais indicadores.

3.2.2 Grácos Polar ( ou Radar)


É o gráco ideal para representar séries temporais cíclicas, isto é, séries que apresentam

em seu desenvolvimento determinada periodicidade. O gráco polar representa séries

temporais em que é possível comparar os valores da série com o valor de sua média arit-

mética. A média aritmética é representada por círculo ; por outro lado, cada ponto da

série poderá estar dentro ou fora do círculo. O visual do gráco polar facilita a compara-

variação da
ção de cada valor com a média aritmética. Alguns exemplos dessas séries :

quantidade de açúcar consumida durante o ano (ou mês; ou semana), variação


da frequência mensal dos funcionários de um supermercado, variação da pres-
são atmosférica numa estação climática durante o ano ( ou mês; ou semana),

Alcides Onésimo Nunda 34 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

variação do consumo de energia elétrica numa empresa frigoríca durante o


ano (ou mês ; ou semana).

Exemplo 3.2.5 (Gráco Polar ou Radar) . O valor médio é representado pelo cír-
culo de raio r = 15 constituído no gráco, dessa forma, os valores mensais da série podem
ser comparados ao valor médio.

Figura 3.6: Vendas em Milhares de Kwanzas

Fonte: INE, 2021.

Alcides Onésimo Nunda 35 Pedro Domingos Chitandula


Capítulo 4

Distribuição de Frequências

4.1 Conceitos Básicos


Ao analisarmos um conjunto de dados, devemos determinar se temos uma amostra ou

uma população. Essa determinação afectará não somente os métodos utilizados, mas

também as conclusões, pois se estamos trabalhando com uma amostra os resultados en-

contrados são estimativas da população.

Nem sempre é possível compreender o signicado contido numa amostragem por simples

inspeção visual dos dados numéricos coletados. Entretanto, entendemos que o sucesso

de uma decisão dependerá da nossa habilidade em compreender as informações contidas

nesses dados. O objectivo deste estudo é mostrar a organização, apresentação e análise

gráca de uma série de dados, matéria prima das distribuições de frequências e dos

seus grácos.

Denition 4.1.1 (Dados Primitivos ou Brutos) . São os dados colectados durante


a pesquisa e que ainda não foram organizados. São os dados originais, que ainda não se
encontram prontos para análise, por não estarem numericamente organizados. (Também
são conhecidos como Tabela Primitiva).

Denition 4.1.2 (Rol) . É a ordenação dos valores obtidos (dados brutos) em ordem
crescente ou decrescente de grandeza numérica ou qualitativa. São os dados brutos, orga-
nizados em ordem crescente ou decrescente.

Denition 4.1.3 (Classe) . Ao organizar os dados colectados, estes são subdivididos


convenientemente em categorias. Cada uma dessas subdivisões recebe o nome de classe.

36
Notas - Estatística I FEC - UJES/2021-2022

Denition 4.1.4 (Frequência (fi )) . É o número de vezes que o elemento aparece na


amostra, ou o número de elementos pertencentes a uma classe. A frequência (fi ) também
pode ser designada de frequência simples ou frequência absoluta.

Denition 4.1.5 (Frequência Relactiva (f ri )) . A frequência relactiva de uma classe


é o quociente entre a frequência absoluta (fi ) da classe considerada e o número total
de dados (n) colectados na pesquisa. A frequência relactiva representa a proporção de
observações de um valor (ou de uma classe) em relação ao número total de observações,
o que facilita as comparações:
fi
f ri = (4.1.1)
n

Denition 4.1.6 (Frequência Relactiva Percentual (f ri %)) . A frequência relac-


tiva percentual de uma classe é o produto da frequência relactiva por 100:

f ri % = f ri × 100 (4.1.2)

Denition 4.1.7 (Frequência Acumulada (F aci )) . A frequência acumulada de uma


classe é a soma da frequência absoluta dessa classe com as frequências absolutas das classes
anteriores:
i
X
F aci = f1 + f2 + f3 + · · · + fn −→ F aci = fi (4.1.3)
1

Denition 4.1.8 (Frequência Relactiva Acumulada (F raci )) . A frequência relac-


tiva Acumulada (F raci ) de uma classe é a soma da frequência relactiva dessa classe com
as frequências relactivas das classes anteriores. Também pode ser calculada pela razão en-
tre a frequência acumulada da classe considerada e o número total de dados (n) colectados
na pesquisa:

i
X
F raci = f r1 + f r2 + f r3 + · · · + f rn −→ F raci = f ri (4.1.4)
1

ou
F aci
F raci = (4.1.5)
n

Denition 4.1.9 (Frequência Relactiva Acumulada Percentual (F raci %)) . A frequên-


cia relactiva acumulada percentual de uma classe é o produto da frequência relactiva acu-
mulada por 100:
F raci % = F raci × 100 (4.1.6)

Alcides Onésimo Nunda 37 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

4.2 Organização e Classicação de dados de Variáveis


Qualitativas.
Variável qualitativa: expressa uma qualidade ou atributo. A organização e classicação

de dados qualitativos é feita após a realização de uma pesquisa. Portanto a mesma é

representada numa tabela de distribuição de frequência. Na mesma devemos ter em conta

que uma das colunas descrimina as classe e a outra coluna corresponde à frequência.

Ademais cada uma classe corresponde a uma categoria e a frequência absoluta indica o

número de repetições para cada categorias.

Exemplo 4.2.1 Uma empresa de publicidade realizou uma pesquisa sobre o estado civil
dos compradores de alimentos congelados de um determinado supermercado, assumindo
as categorias : solteiro, casado, viúvo e separado. Foram encontradas as respostas
constantes na tabela abaixo.

Figura 4.1: Estado civil dos compradores de congelados de um supermercado

• O número de dados colectados na pesquisa é n = 56.

• A tabela de distribuição de frequência referente aos dados colectados na pesquisa é


dada por:

Classe (i) Estado Civil (xi ) Frequência(fi )


1 Solteiro 13
2 Casado 22
3 Viúvo 4
4 Separado 17
Total 56

• As categorias que constam na pesquisa são: Solteiro, Casado, Viúvo e Divorciado.

Alcides Onésimo Nunda 38 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• A tabela que discrimina os valores da frequência absoluta, frequência relactiva,


frequência relactiva percentual, frequência acumulada, frequência relactiva acumu-
lada e frequência relactiva percentual acumulada é dada por:

Classe (i) Estado Civil (xi ) fi f ri f ri % F aci F raci F raci %


1 Solteiro 13 0,2321 23,21 13 0,2321 23,21
2 Casado 22 0,3929 39,29 35 0,6250 62,50
3 Viúvo 4 0,0714 7,14 39 0,6964 69,64
4 Separado 17 0,3036 30,36 56 1,0000 100,00
Total 56 1,0000 100,00

4.3 Organização e Classicação de Dados de Variáveis


Quantitativas
Variável quantitativa: Os valores são expressos por números. A organização e classicação

de dados quantitativos é feita após a realização de uma pesquisa. Portanto a mesma é re-

presentada numa tabela de distribuição de frequência. Os dados quantitativos permitem

duas formas de representação na elaboração das tabelas de distribuição de frequência.

Eles podem ser ou não agrupados em intervalos de classe.

Opções para tabelas de distribuição de frequências para os dados numéricos:

• Distribuição de frequência de dados numéricos não agrupados em intervalos de

classe;

• Distribuição de frequência de dados numéricos agrupados em intervalos de classe.

4.3.1 Distribuição de Frequências de Dados Numéricos não Agru-


pados em Intervalos de Classe.
Os dados numéricos colectados assumem pequena quantidade de valores pontuais. Dessa

forma, cada valor numérico isolado representa uma categoria; sendo assim, a obtenção da

tabela de distribuição de frequência é análoga ás tabelas de dados de variáveis qualitativas.

Exemplo 4.3.1 Uma pesquisa realizada numa fábrica revela o número de peças com de-
feitos por caixa:

• O número de dados colectados na pesquisa é n = 30.

Alcides Onésimo Nunda 39 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Figura 4.2: Estado civil dos compradores de congelados de um supermercado

• A tabela de distribuição de frequência referente aos dados colectados na pesquisa é


dada por:

Classe (i) Peças com defeito por caixa (xi ) Frequência(fi )


1 0 14
2 1 11
3 2 5
Total 30

• As categorias que constam na pesquisa são: 0,1,2 peças com defeitos por caixa.

• A tabela que discrimina os valores da frequência absoluta, frequência relactiva,


frequência relactiva percentual, frequência acumulada, frequência relactiva acumu-
lada e frequência relactiva percentual acumulada é dada por:

Classe (i) Peças/Defeito(xi ) fi f ri f ri % F aci F raci F raci %


1 0 14 0,4667 46,67 14 0,4667 46,67
2 1 11 0,3667 36,67 25 0,8334 83,34
3 2 5 0,1667 16,67 30 1,0000 100,00
Total 30 1,0000 100,00

4.3.2 Distribuição de Frequências de Dados Numéricos Agrupa-


dos com Intervalos de Classe.
A distribuição de frequência de dados numéricos agrupados tem uma característica di-

ferente das demais frequências, pelo facto de que cada classe não representa um valor

individual, e sim conjunto de valores dentro de um intervalo.

A vantagem de fazermos com que cada classe represente um conjunto da valores dentro

de um intervalo é que reduz a extensão da tabela, além de facilitar a visualização e o

entendimento dos dados colectados como um todo.

Alcides Onésimo Nunda 40 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Assim, os passos necessários para a elaboração da tabela de distribuição de dados numé-

ricos agrupados em intervalos de classe são:

• Determinação do número de classe (k);

• Amplitude amostral (AA);

• Cálculo da amplitude do intervalo de classe (h);

• Limite inferior e superior do intervalo de classe;

• Determinação dos intervalos de classe;

• Determinação das frequências dos intervalos de classe;

• Amplitude total (AT).

Determinação do Número de Classe (k)

O número de classe que irá compor a tabela pode ser estabelecido pelo estatístico que

elabora a pesquisa, ou seja, o estatístico é sempre soberano para decidir o número de

classes. Para tornar o processo mais uniforme, existem algumas sugestões para estabelecer

o número de classes em função do número de dados da tabela.

• Primeira sugestão: É a fórmula desenvolvida pelo matemático Sturges para o

cálculo do número de classe:

k = 1 + 3, 322 × logn (4.3.1)

sendo k= número de classes; n= número de elementos colectados na pesquisa.

• Segunda Sugestão: É uma opção mais simples, em que se recomenda a utilização

quando o número de dados colectados for menor ou igual a 50.


k= n n ≤ 50 (4.3.2)

Amplitude Amostral (AA)

A amplitude amostral é a diferença entre o maior e o menor valor observado nos valores

colectados

AA = Xmx − Xmin (4.3.3)

onde, Xmx é o maior valor observado e Xmin é o menor valor observado.

Alcides Onésimo Nunda 41 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Cálculo da Amplitude do Intervalo de Classe (h)

Uma vez que se saiba com quantas classes vamos construir a tabela de distribuição de

frequência, pode-se passar ao cálculo da amplitude do intervalo de classe.

AA
h= (4.3.4)
k

onde AA é amplitude amostral e k é o número de classes.

Observação 4.3.1 Na estatística, é conveniente a uniformização da amplitude de inter-


valo de classe, ou seja, a mesma para todas as classes. O valor obtido no cálculo da
amplitude de classe nem sempre é um valor exacto, sendo assim, para preservar o número
de classes estabelecido, faz-se o arredondamento da amplitude de classe para valores acima
do valor obtido.

O valor da amplitude de classe (h) deve ser arredondado para valores convenientes e
coerentes com os dados colectados. Por exemplo, se todos os dados colectados forem
múltiplos de cinco, a amplitude do intervalo de classe deverá ser arredondada para o
múltiplo de cinco imediatamente superior ao valor obtido, Entretanto, cada caso deverá
ser analisado de acordo com a coerência dos dados colectados.

Limite Inferior e Superior do Intervalo de Classe

Os valores do conjunto que compõem o intervalo de classe estão limitados entre dois

números que representam o extremo inferior e o superior do intervalo. A matemática

admite intervalos abertos, fechados e a composição de aberto/fechado.

• Na estatística, o intervalo de classe, em geral, corresponde a um intervalo fechado à

esquerda e aberto a direita, utilizando a representação do símbolo "`".

 O limite inferior (li ) é menor valor numérico do intervalo de classe. É escrito à

esquerda do intervalo de classe (li `). O limite inferior localiza-se no intervalo

de classe fechado à esquerda.

 O limite superior (Li ) é o maior valor numérico do intervalo de classe . É

escrito à direita do intervalo de classe (` Li ). O limite superior localiza-se no

intervalo de classe aberto à direita.

• O limite de classe é representado por:

li ` Li (4.3.5)

Alcides Onésimo Nunda 42 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Figura 4.3: Símbolos nas representações para intervalos abertos e fechados

Amplitude Total (AT)

A amplitude total (AT) é calculada levando-se em conta os valores dos intervalos de

classe da tabela de distribuição de frequência. É Expressa pela diferença entre o maior e

o menor valor observado nos intervalos de classe da tabela de distribuição de frequência.

Isso corresponde à diferença entre o limite superior do último intervalo de classe e o limite

inferior do primeiro intervalo de classe.

! !
Limite superior do Limite inferior do
AT = − (4.3.6)
último intervalo de classe primeiro intervalo de classe

Frequência Simples ou Absoluta

A frequência simples ou absoluta para dados agrupados com intervalo de classe é obtida

para cada classe, pela contagem do número de dados colectados dentro do intervalo de

classe. A soma de todas as frequências é:

n = f1 + f2 + f3 + · · · + fk (4.3.7)

Sendo n o número total de dados colectados na amostra. Podemos representar a soma

de frequências pelo símbolo de somatório

k
X k
X
n = f1 + f2 + f3 + · · · + fk = fi −→ fi = n (4.3.8)
i=1 i=1

Alcides Onésimo Nunda 43 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Ponto Médio de uma Classe (xi )

O conceito de ponto médio de uma classe é utilizado na distribuição de frequência de

dados numéricos agrupados em intervalos de classe.

Ponto médio de um intervalo de classe (xi ) é o ponto que por situar-se numa posição

média da distribuição de valores do intervalo de classe, divide o intervalo em duas partes

iguais:
li + Li
xi = (4.3.9)
2

Exemplo 4.3.2 (Dados agrupados com intervalo de classes) . Considere o peso


(Kg) de 50 estudantes do sexo masculino da Faculdade de Economia do Huambo, na
gura abaixo:

Figura 4.4: Peso de 50 estudantes do sexo masculino da Faculdade de Economia


• Número de classe: k = 50 ≈ 7

• Amplitude amostral: AA = 97 − 33 = 64

• Amplitude do intervalo de classe: h = 64


7
≡ 10

• A tabela discriminatória das frequências e os pontos médios é dada por:

Alcides Onésimo Nunda 44 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Classes (k) Peso (kg) fi fri fri % faci fraci fraci % xi


1 30 ` 40 4 0,08 8 4 0,08 8 35
2 40 ` 50 6 0,12 12 10 0,20 20 45
3 50 ` 60 8 0,16 16 18 0,36 36 55
4 60 ` 70 13 0,26 26 31 0,62 62 65
5 70 ` 80 9 0,18 18 40 0,80 80 75
6 80 ` 90 7 0,14 14 47 0,94 94 85
7 90 ` 100 3 0,06 6 50 1,00 100 95
P
50 1 100

• Amplitude total: AT = 100 − 30 = 70.

4.4 Representação Gráca de uma Distribuição de Frequên-


cia
A representação gráca de uma distribuição de frequências pode ser feita de três formas

diferentes:

• Histograma;

• Polígono de Frequência;

• Polígono de Frequência Acumulada (Ogiva de Galton);

4.4.1 Histograma
O Histograma, é uma representação estatística do gráco da distribuição da frequência.
É também considerado como um diagrama de colunas em que cada retângulo está rela-

cionado com uma classe da distribuição de frequência. É formado por um conjunto de

retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que

seus pontos médios coincidem com os pontos médios dos intervalos de classe.

• As larguras dos retângulos são iguais às amplitudes dos intervalos de classe, isto

é, a largura de cada retângulo é dada pela amplitude do intervalo de classe que

representa. O eixo das abscissas corresponde ao eixo dos intervalos de classe:

hi = Li − li (4.4.1)

• As alturas dos retângulos devem ser proporcionais às frequências das classes, sendo

igual a amplitude dos intervalos, ou seja, O eixo das coordenadas corresponde ao

Alcides Onésimo Nunda 45 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

eixo das frequências, em que as alturas dos retângulos representam a frequências

ou, mais especicamente, a altura de cada retângulo representa a frequência (fi ) da

classe correspondente.

• Propriedades dos histogramas:

 A Área do histograma é proporcional à soma das frequências;

 Utilizando as frequências relactivas obtemos um gráco de área unitária

A=1 (4.4.2)

 Pelo histograma de frequências relactivas podem-se comparar duas ou mais

distribuições.

Exemplo 4.4.1 (Histograma) . A partir da tabela de frequência do exemplo 4.3.2,


obtém-se:

Figura 4.5: Histograma da distribuição dos pesos de 50 estudantes

4.4.2 Polígono de Frequência


O polígono de Frequência é um gráco de conguração linear. Para obter o polígono de

frequência, calcula-se o ponto médio de cada intervalo de classe, e marca-se esse ponto no

Alcides Onésimo Nunda 46 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

lado superior do respectivo retângulo do histograma. A linha do polígono de frequência

é obtida pela união desses pontos médios. O eixo das abscissas corresponde ao eixo dos

pontos médios dos intervalos de classe, e o eixo das ordenadas representa o eixo das

frequências.

Nota 4.4.1 Polígono de frequência  é um gráco em linha, sendo as frequências marca-


das sobre perpendiculares ao eixo horizontal, levantada pelos pontos médios dos intervalos
de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a -
gura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira
e da posterior à última, da distribuição.

Figura 4.6: Polígono de frequência da distribuição dos pesos de 50 estudantes

4.4.3 Polígono de Frequência Acumulada (ogiva de Galton)


Distribuição de frequência em intervalo de classes

o polígono de frequência acumulada (ou ogiva de Galton) para a distribuição de frequência

em intervalo de classes é um gráco de conguração linear

• No eixo das abscissas, são marcados os intervalos de classe. A marcação dos pontos

sobre o eixo das abscissas é idêntica ao histograma;

• No eixo das ordenadas são marcados os valores das frequências acumuladas para

cada intervalo de classe.

Alcides Onésimo Nunda 47 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Polígono de frequência acumulada  é traçado marcando-se as frequências acumuladas so-

bre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites

superiores dos intervalos de classe.

Figura 4.7: Polígono de frequência acumulada da distribuição dos pesos de 50 estudantes

Distribuições de frequências sem intervalos de classe

Uma distribuição de frequência sem intervalos de classe é representada gracamente por

um diagrama onde cada valor da variável é representado por um segmento de reta vertical

e de comprimento proporcional à respectiva frequência, isto é, é representada gracamente

por um conjunto de segmentos de reta verticais ( gráca em hastes ou bastões)

Alcides Onésimo Nunda 48 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Alcides Onésimo Nunda 49 Pedro Domingos Chitandula


Capítulo 5

Medidas de Posição: Medidas de


Tendência Central

A análise dos dados colectados pode ser feita sob diferentes aspectos, em que cada foco

verica um tipo de informações a respeito do comportamento ou da tendência do fenó-

meno em exame. Isso está de acordo com a estatística, pois um dos seus objectivos é

buscar leis de comportamento para o conjunto de dados colectados.

No entanto, para ressaltar as tendências características de cada distribuição, isoladamente,

ou em confronto com outras, necessitamos introduzir os elementos típicos da distribuição,

que são:

• Medidas de posição;

• Medidas de variabilidade ou dispersão;

• Medidas de assimetria;

• Medidas de curtose.

As medidas de posição mais importantes são as medidas de tendência central, que desta-

camos: A média aritmética; A mediana; A moda. As outras medidas de posição são


as separatrizes, que englobam: A mediana; Os quartis; Os decis; Os percentis.

As medidas de tendência central também são chamadas de Promedios. Essa denomina-

ção ocorre porque os dados observados tendem a agrupar- se em torno dos valores centrais

da distribuição. Outros promédios menos utilizados são a média geometria, media har-

mónica, media quadrática, media cubica etc. Há dois tipos de média aritmética: Média
aritmética simples; Média aritmética ponderada;

50
Notas - Estatística I FEC - UJES/2021-2022

5.1 Média Aritmética (x)


A média aritmética é uma das informações mais importantes da analise estatística. A

média aritmética é uma medida de posição de tendência central, mesmo que ela não

se encontre necessariamente no centro da distribuição, pois na verdade ela corresponde a

uma das posições de equilíbrio entre os dados colectados.

Para o cálculo da média aritmética (x) devemos levar em conta o agrupamento ou não dos

dados: Dados não agrupados; Dados agrupados (em intervalos de classe e sem intervalos

de classe)

Nota 5.1.1 Notação de média aritmética: x (lê-se: "X traço"ou "X barra")

5.1.1 Média Aritmética de Dados não Agrupados


A média aritmética de dados não agrupados corresponde ao cálculo de média aritmética

simples. É recomendada a utilização da média aritmética de dados não agrupados quando

os valores que compõem a série estatística tendem a ser homogéneos. Isso signica que

não existem valores muito grandes ou muito pequenos na série.

Denition 5.1.1 A Média aritmética simples (x): é calculada por meio da divisão entre
a soma dos valores da série pelo total de valores. É o quociente da divisão da soma dos
valores da variável pelo número deles. A média (aritmética) é, de modo geral, a mais
importante de todas as medidas descritivas.
Pn Pn
x1 + x2 + x3 + · · · + xn i=1 xi i=1 xi
x= = −→ x = (5.1.1)
n n n

Onde: x = média aritmética, xi = variável em estudo, n = número de dados colectados


na pesquisa.

Exemplo 5.1.1 Uma empresa de seguros do Huambo vende apólices de seguro de vida.
O número de a apólices vendidas mensalmente no ano de 2020 estão registados na tabela
abaixo:

Tabela 5.1: Venda de apólices de seguros


Jan. 16 Abr. 29 Jul. 13 Out. 15
Fev. 12 Maio 20 Agos. 32 Nov. 25
Mar. 26 Jun. 24 Set. 24 Dez. 16

Alcides Onésimo Nunda 51 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• A média mensal de apólices vendidas durante o ano é dado é dada por:

 xi = apólices vendidas durante o mês (variável em estudo)


 n = 12 (número de dados colectados na pesquisa)

Pn P12
i=1 xi i=1 xi
x= =
n 12
16 + 12 + 26 + 29 + 20 + 24 + 13 + 32 + 24 + 15 + 25 + 16
=
12
252
= = 21.
12

• A média mensal de apólices vendidas no mês durante o ano: x = 21 apólices.

• Considerando a venda total ocorrida no ano, o valor médio corresponde à venda


total dividida em 12 partes iguais, ou seja. é como se as vendas fossem constantes
(uniformes, como se a empresa tivesse vendido 21 apólices em cada um dos meses
que constituem o ano.

Desvio em Relação à Média (di )

O desvio em relação a média é a diferença entre um valor colectado na pesquisa e o valor

médio. O desvio mede o afastamento do valor colectado na pesquisa em relação ao valor

médio.

d i = xi − x (5.1.2)

• Propriedade do desvio em relação a média: a soma de todos os desvios em

relação ao valor médio é igual a zero:

n
X
di = 0 (5.1.3)
i=1

• No exemplo (5.1.1), o valor médio é x = 21 apólices, o desvio de cada valor em

relação ao valor médio é calculado pela expressão:

di = xi − 21. (5.1.4)

Média Aritmética Ponderada

A média aritmética ponderada também é chamada de média ponderada. Um dos sig-

nicados da palavra ponderar é "pesar". No cálculo da média ponderada, cada valor

Alcides Onésimo Nunda 52 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

colectado na série tem uma participação proporcional ao seu peso, isto é, proporcional à

sua importância relactiva no conjunto.

A média aritmética ponderada ou média ponderada é a soma das variáveis multiplicadas

pelos seus pesos (pi ), dividida pela soma dos pesos de cada variável.

x 1 p 1 + x2 p 2 + x2 p 2 + · · · + xn p n
x= (5.1.5)
p1 + p2 + p3 + · · · + pn

Onde: x = média aritmética ponderada, xi = variável em estudo, pi = peso da variável.

Exemplo 5.1.2 Numa empresa, temos 15 trabalhadores com salário de 800,00 USD, 25
com salário de 1 200,00 USD, 12 com salário de 1 600,00 USD e 4 com salário de 1
800,00 USD.

• x = média aritmética ponderada;

• xi = salário dos trabalhadores (variável em estudo);

• Pi = número de trabalhadores por salário (peso da variável).

15 × 800 + 25 × 1.200 + 12 × 1.600 + 4 × 1.800


x=
15 + 25 + 12 + 4
68.400
= = 1.221, 43
56

• A média salarial dessa empresa é de 1.221,43 USD.

Nota 5.1.2 (Diferenças entre os dois tipos de média aritmética.) • Média arit-
mética simples: Todas as variáveis têm a mesma importância, ou seja, o mesmo
peso;

• Média aritmética ponderada: As variáveis têm diferentes importâncias relati-


vas, ou, ainda diferentes pesos relativos.

5.1.2 Média Aritmética para dados Agrupados sem Intervalos de


Classe
A média aritmética para dados agrupados processa-se por meio do cálculo da média arit-

mética ponderada. Nesse caso, a ponderação é caracterizada pelo número de repetições

de cada valor, ou, mais especicamente, pela frequência.

Alcides Onésimo Nunda 53 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

A média aritmética é obtida pelo quociente entre o somatório dos produtos de cada variável

pelo respectivo peso (frequência) e o somatório das frequências

Pn Pn
i=1 xi fi i=1 xi f i
x= P ou x= (5.1.6)
fi n

Onde: x = média aritmética, xi = variável em estudo, fi = frequência (peso da

variável).

Exemplo 5.1.3 A seguradora Nossa Seguro, verica em determinado produto quais são
os segurados que estão com parcelas atrasadas. O contrato estabelece a cobrança de multa
para os pagamentos em atraso. A gura 5.1, registra o número de clientes versus o número
de meses em atraso.

Figura 5.1: Distribuição do número de clientes com parcelas atrasadas.

• O número total de clientes em atraso é : n = 12 + 16 + 21 + 15 + 13 + 10 = 87


clientes.

• O número médio de meses em atraso dessa distribuição é dada por:


Pn
i=1 xi f i
x=
n
12 × 1 + 16 × 2 + 21 × 3 + 15 × 4 + 13 × 5 + 10 × 6
=
12 + 16 + 21 + 15 + 13 + 10
292
= = 3, 36 ≈ 3 meses.
87

Alcides Onésimo Nunda 54 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

5.1.3 Média Aritmética para Dados Agrupados com Intervalos de


Classe: Média Aritmética Ponderada
A média aritmética para dados agrupados com intervalo de classe, também processa-se

por meio do cálculo da média aritmética ponderada.A ponderação será dada pela

frequência de cada classe.

A média aritmética para dados agrupados com intervalo de classe é obtida pelo somatório

dos produtos médios de cada intervalo de classes pelas respectivas frequências (peso)

dividida pelo somatório das frequências (peso).

Pn Pn
i=1 xi fi i=1 xi f i
x= P ou x= (5.1.7)
fi n

Sendo

• xi = ponto médio do intervalo de classe.

• fi = frequência da classe.

Observação 5.1.1 Tal como abordado anteriormente, o ponto médio de uma classe (xI )
é o ponto que por situar-se numa posição média da distribuição de uma classe de valores
do intervalo de classe, divide o intervalo em duas partes iguais:

li + Li
xi = (5.1.8)
2

Exemplo 5.1.4 Com objectivo de regulamentar a conguração interna de aviões de trans-


porte de passageiros, para especicar a distância entre o encosto e assento, e a largura das
cadeiras das aeronaves. A TAAG, realizou um levantamento das estaturas dos passagei-
ros, através de uma amostra composta por um grupo de passageiros , sendo os resultados
apresentados na tabela abaixo:

Alcides Onésimo Nunda 55 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Tabela 5.2: Distribuição das Estaturas

Estatutas (Cm) Passageiros (fi ) Ponto Médio (xi ) xi × f i


150 ` 157 7 153,5 1.074,5
157 ` 164 19 160,5 3.049,5
164 ` 171 25 167,5 4.187,5
171 ` 178 26 174,5 4.537,0
178 ` 185 21 181,5 3.811,5
185 ` 192 8 188,5 1.508,0
192 ` 199 3 195,5 586,5
Total 109 18.754,5

• A estatura média dos passageiros é dada por:


Pn
i=1 xi f i 18.754, 5
x= = = 172, 06 cm.
n 109

5.2 Outras Médias


A média aritmética é a mais usada mas, além desta, existem outras duas médias que

também se usam em determinadas situações, mas menos frequentemente: a Média Ge-


ométrica e a Média Harmónica.

5.2.1 Média Geométrica (Mg )


1. Dados não Agrupados: A média geométrica (Mg ) de um conjunto de n observa-

ções x1 , x2 , x3 , · · · , xn n do produto dessas observações.


é a raiz de ordem Ou seja,

a média geométrica de um conjunto de n observações, x1 , x2 , x3 , · · · , xn dene-se

como a raíz índice n do produto dos n valores x1 , x2 , x3 , · · · , xn

" n # n1
√ 1
Y
Mg = n
x1 .x2 .x3 . · · · .xn = (x1 , x2 , x3 , · · · , xn ) =
n xi (5.2.1)
i=1

Aplicando logaritmos (naturais) a fórmula (5.2.1) pode ser escrita:

n
1X
lnMg = lnxi (5.2.2)
n i=1

No caso, de dados agrupados, a raiz índice n do produto dos valores observados

elevados às respectivas frequências

Alcides Onésimo Nunda 56 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

2. Dados Agrupados sem Intervalos de Classe:


"
m
# n1
p Y
Mg = n
(x1 )n1 .(x2 )n2 .(x3 )n3 · · · .(xm )nm = (xj )nj (5.2.3)
j=1

Onde xi é o valor observado e ni é o número de observações da classe.

3. Dados Agrupados com Intervalo de Classe:


"m # n1
p Y
Mg = n (x1 )n1 .(x2 )n2 .(x3 )n3 · · · .(xm )nm = (xj )nj (5.2.4)
j=1

Onde xi é o ponto médio e ni é o número de observações da classe. Aplicando

logaritmos (naturais) a fórmula (5.2.3) pode ser escrita:

m
1X
lnMg = nj lnxj (5.2.5)
n j=1

Exemplo 5.2.1 Uma das situações em que se recorre à média geométrica é a deter-
minação da taxa de crescimento média de uma variável num determinado período.
Admita-se, por exemplo, que o Produto Interno Bruto (PIB) de um país cresceu no período
de 5 anos às seguintes taxas decrescimento anuais: 1%, 1, 5%, 2, 5%, 1, 2% e 0, 8%.

• A taxa decrescimento anual média no período dos 5 anos, poder-se-ia calcular a


média aritmética das taxas anuais, o que estaria evidentemente incorrecto.

• De facto, considere-se o caso geral em que uma variável x tem às taxas, respec-
tivamente, r1 , r2 , · · · , rn . Então nos anos seguintes ao ano 0 têm-se os seguintes
valores:

x1 = x0 + r1 x0 = (1 + r1 )x0 (5.2.6)

x2 = x1 + r2 x1 = (1 + r2 )x1 = (1 + r2 )(1 + r1 )x0


x3 = x2 + r3 x2 = (1 + r3 )x2 = (1 + r3 )(1 + r2 )(1 + r1 )x0
·
xn = xn−1 + rn xn−1 = (1 + rn )xn−1 = (1 + rn ) · · · (1 + r2 )(1 + r1 )x0

• A taxa de crescimento anual média de x nos n anos é r tal que

xn = (1 + r)n x0 (5.2.7)

Alcides Onésimo Nunda 57 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Igualando os valores obtidos para xn nas duas últimas equações vem:

(1 + r)n = (1 + rn ) · · · (1 + r3 )(1 + r2 )(1 + r1 ) (5.2.8)

ou seja, o factor 1 + r vem dado por:


p
n
(1 + r) = (1 + rn ) · · · (1 + r3 )(1 + r2 )(1 + r1 ) (5.2.9)

• A equação (5.2.9) é, precisamente, a média geométrica dos n factores (1+rn ), · · · , (1+


r3 ), (1 + r2 ), (1 + r1 ).

• Assim, a taxa de crescimento anual média do PIB naqueles 5 anos é r, dada por:
p
5
(1 + r) = 1, 01 × 1, 015 × 1, 025 × 1, 012 × 1, 008 = 1, 014
(1 + r) = 1, 014 −→ r = 0, 014(1, 4%).

• A taxa de crescimento anual média foi de aproximadamente r = 0, 014, isto é 1, 4%


ao ano.

5.2.2 Média Harmónica (Mh


A média harmónica (Mh ) do conjunto de valores, x1 , , x2 , · · · , xn , dene-se como o inverso
da média dos inversos destes valores.

Sejam x1 , x2 , x3 , · · · , xn, valores de x, associados às frequências absolutas n1 , n2 , n3 , · · · , nm ,


respectivamente. A média harmónica de X é denida por:

• Dados não Agrupados:

1 n
Mh = 1
Pn 1 = Pn 1 (5.2.10)
n i=1 xi i=1 xi

• Dados Agrupados:
1 n
Mh = 1
Pm nj = Pm nj (5.2.11)
n j=1 xj j=1 xj

 Para dados agrupados sem intervalo de classe xj é o valor da variável observada.

 Para dados agrupados com intervalo de classe xj é o ponto médio da classe.

Exemplo 5.2.2 Admite-se que uma família tem um orçamento mensal xo para adquirir
durante n meses um dado produto. Sejam q1 , q2 , · · · , qn as quantidades e p1 , p2 , · · · , pn os

Alcides Onésimo Nunda 58 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

respectivos preços. Para determinar o preço médio do produto utiliza-se a média harmónica
e não a média aritmética dos preços porque as quantidades são diferentes.

• Considerando o montante do orçamento por M ,tem-se M = pi qI para cada mês e,


portanto, qi = M
pi
. O preço médio é dado por:
Pn
pi q i nM n
Pi=1
n = Pn M = Pn 1 (5.2.12)
i=1 qi i=1 pi i=1 pi

que,é precisamente, a média harmónica dos preços.

5.2.3 Fórmula Geral das Médias


As médias aritmética, geométrica e harmónica são casos particulares de uma média geral,

denominada média de ordem q , representada por M (q) e assim denida:


" n
# 1q
1X q
M (q) = x (5.2.13)
n i=1 i

Esta é conhecida por fórmula geral das médias e como se pode vericar facilmente dá
a média aritmética para q=1 e a média harmónica para q = −1. Com efeito, com q=1
tem-se:
n
1X
M (1) = xi = x (5.2.14)
n i=1
e com q = −1

1
M (−1) = 1
Pn 1 = Mh (5.2.15)
n i=1 xi

A média geométrica corresponde ao caso q = 0, um pouco mais difícil de vericar, tal

como abordado anteriormente, o logaritmo da média geométrica é a média dos logaritmos

dos valores. Então quando q = 0, tem-se uma indeterminação na última equação da forma
0
que pode ser levantada recorrendo ao teorema de L'Hopital e encontra-se:
0

1
Pn q n
n 1=1 xi ln xi 1X
ln M (0) = lim 1
P n q = ln xi = ln Mg (5.2.16)
q→0
n i=1 xi n i=1

Alcides Onésimo Nunda 59 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

5.3 Moda (M0)


Moda é o valor que ocorre com maior frequência nos dados obtidos numa coleta ( esse

valor denominado  valor modal ).

Nota 5.3.1 A série pode ser classicada em função da quantidade de valores modais:

• Série amodal: não tem valor modal;

• Série unimodal: um valor modal;

• Série bimodal: dois valores modais;

• Série trimodal: três valores modais;

• Série polimodal: quatro ou mais valores modais.

Figura 5.2: Exemplos de representação gráca da moda

5.3.1 Cálculo da Moda para Dados não Agrupados


Numa série estatística em que os dados não são agrupados, o valor modal corresponde ao

valor com maior número de ocorrência, ou seja, é o valor que ocorre com maior frequência

em um conjunto de dados, e que é denominado valor modal. Baseado nesse contexto, um

conjunto de dados pode apresentar mais de uma moda.

Exemplo 5.3.1 Dada a série estatística constituída pelos dados brutos:

4, 7, 5, 7, 10, 2, 12, 8, 7, 5, 2, 10, 8, 11, 7, 3, 9, 6, 8

• Organizando os dados em ordem crescente(rol);

2, 2, 3, 4, 5, 5, 6, 7, 7, 7, 7, 8, 8, 8, 9, 10, 10, 11, 12.

• Observando a série, verica-se uma repetição dos valores 2 (2 vezes); 5 (2 vezes);


7 (4 vezes); 8 (3 vezes) e 10 (2 vezes).

Alcides Onésimo Nunda 60 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• Então: Mo = 7 é o valor modal da série (pois é o valor com maior número de


repetições).

5.3.2 Cálculo da Moda para Dados Agrupados sem Intervalo de


Classe
Após o agrupamento dos valores coletados numa tabela de Distribuição de frequência, ca

fácil a determinação do valor modal.

Denição de Moda

A moda é o valor da variável que corresponde à classe de maior frequência (classe modal).

Para a determinação da moda, numa tabela de distribuição de frequência com todos dados

agrupados sem intervalo de classe, devemse executar os passos a seguir:

• Primeiro passo: localizar a classe modal. Classe modal é a classe que contém o
maior valor de frequência;

• Segundo passo: vericar o valor da variável contido na classe modal.

Exemplo 5.3.2 Foi realizada uma pesquisa para determinar o tipo de electrodoméstico
mais vendido pela OK IMOBILIÁRIO do Huambo, entre geladeiras, freezers, fogões, ma-
quinas de lavar e secadoras). Os dados coletados pelo período de uma semana estão
registrados na tabela

Tabela 5.3: Distribuição da venda de electrodomésticos


Electrodoméstico Unidades Vendidas (fi )
Fogão 53
Geleira 82
Maquina de lavar roupa 33
Freezers 26
Secadora 31
Total 225

• Variável em estudo: electrodoméstico;

• A 2a classe é a classe modal, pois é a classe que contém o maior valor de frequência;

• A variável contida na 2a classe é geladeira, então: M0 = geladeira.

• Isso signica que a geladeira foi o eletrodoméstico mais vendido (Moda).

Alcides Onésimo Nunda 61 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Exemplo 5.3.3 A tabela 5.4 registra o número diário de carros alugados por uma Renta
Car do Huambo, durante um período de 100 dias.

Tabela 5.4: Distribuição da venda de electrodomésticos


Carros Alugados Dias (fi )
25 5
30 13
35 28
40 36
45 18
Total 100

• O valor modal é o 40 carros diários alugados, pois esse valor caracteriza o maior
número de ocorrências (f4 = 36) durante o período em estudo, M0 = 40.

5.3.3 Cálculo da Moda para Dados Agrupados com Intervalo de


Classe
Quando os dados estão agrupados ou sem classes, o cálculo da moda é mais complicado.

A moda é agora um valor pertencente à classe com maior frequência, a classe modal. A

forma mais simples de obtenção da moda, neste caso, é tomar como moda o ponto médio

da classe modal. Tal como foi feito para os dados agrupados sem intervalo de classe,

devem-se executar os passos a seguir:

• Primeiro Passo: localizar a classe modal, ou seja, a classe que contém o maior

valor de frequência;

• Segundo passo: Sabemos que a moda é um valor contido no intervalo de classe

modal. Para o cálculo da moda têm sido proposto muitos métodos, um destes

métodos baseia-se na Fórmula de King e aplica-se quando todas as classe têm a

mesma amplitude h:
 
fM0 post
M0 = lM0 + × hM0 (5.3.1)
fM0 ant + fM0 post

onde M0 , hM0 representa o limite inferior da classe modal, amplitude da classe modal
e fM0 ant, fM0 post representam, respectivamente, as frequências das classes anterior

e posterior à classe modal.

• Uma outra fórmula de cálculo que também tem sido proposta baseia-se na hipó-

tese de que a moda se deve encontrar dentro da classe modal mais para o lado da

Alcides Onésimo Nunda 62 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

classe que tem maior frequência. Com esta hipótese, pode-se admitir-se a seguinte

proporcionalidade:
fM0 − fM0 post fM0 − fM0 ant
= (5.3.2)
LM0 − M0 M0 − lM0
onde f M0 e LM0 representam, respectivamente, a frequência e o limite superior da

classe moda e os restantes símbolos têm o signicado anterior. A formula (5.2.2)

pode apresentar-se numa forma análoga à da fórmula de King. Para tal basta

eliminar o limite superior da classe modal por substituição de LM0 − lM0 (amplitude

da classe modal por hM0 e resolver em ordem a Mo e encontra-se a fórmula de

Czuber para o cálculo da moda:


 
d1
Mo = lM0 + × hM0 . (5.3.3)
d1 + d2

Sendo que:

• d1 : é diferença entre a frequência da classe modal e a frequência da classe anterior

à classe modal, d1 = fM0 − fM0 ant e d2 = fM0 − fM0 post.

Exemplo 5.3.4 Considerando a tabela (5.2) de distribuição de frequências das estaturas


do exemplo (5.1.4)

• A classe modal é a 4a , uma vez apresenta a maior frequência simples ou absoluta.

• A moda das estaturas pela fórmula de Czuber é dada por:


 
1
M0 = 171 + × 7 = 172, 17 cm.
1+5

Nota 5.3.2 (Moda Bruta) . É o valor do ponto médio da classe modal, No exemplo
(5.1.4), os extremos da classe modal são 171 e 178, o ponto médio é de 171+178
2
= 174, 5,
portanto a moda bruta é 174,5.

Nota 5.3.3 (Utilização da Moda) . A moda é utilizada especicamente:

• Para medidas rápidas e aproximação de posição;

• Para medidas de posição que caracterizam a distribuição (ou seja, a medida de


posição é o valor mais típico da distribuição).

Alcides Onésimo Nunda 63 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

5.4 Mediana (Md)


Tal como, na média e na moda, o processo de cálculo da mediana também depende da

forma como os dados se apresentam, isto é, se os mesmos estão agrupados ou se não estão

agrupados.

A mediana é uma medida de posição, é uma separatriz, pois divide o conjunto de dados

coletados em duas partes iguais, com o mesmo número de elementos. O valor da medi-

ana se encontra no centro da série estatística, organizada de tal forma que o número de

elementos situados antes desse valor (mediana) é igual ao número de elementos que se

encontram após esse mesmo valor (mediana)

A mediana é conveniente para séries estatísticas onde existem valores extremos, em que

valores grandes e pequenos coexistem dentro da mesma série, ou ainda nos casos em que

a série seja aberta nos extremos. Para esses casos, a mediana caracteriza o promédio mais

conável.

Exemplo 5.4.1 Considere um conjunto de valores de uma série estatística

29, 23, 14, 25, 31, 26, 18, 17, 22, 13, 27

e organizados segundo um critério de grandeza, no caso ordem crescente

13, 14, 17, 18, 22, 23, 25, 26, 27, 29, 31

O valor da mediana separa a série em dois conjuntos com a mesma quantidade de ele-
mentos, de tal forma que 50% dos valores coletados sejam menores do que a mediana e
outros 50% superior a ela.

13, 14, 17, 18, 22, 23 25, 26, 27, 29, 31


←−−−−−− −−−−−−→
50% 50%

• Md = 23(existem cinco valores coletados antes da mediana e cinco depois)

5.4.1 Cálculo da Mediana para Dados não Agrupados


A determinação da mediana depende do número de valores da amostra. Se a amostra tem

um número ímpar de valores, a mediana é o valor central enquanto se o número de valores é

par, a mediana é geralmente tomada como a média dos dois valores mais centrais, embora

Alcides Onésimo Nunda 64 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

possa ser qualquer um destes valores ou mesmo qualquer valor do intervalo denido pelos

dois valores mais centrais. Assim, para um conjunto de n>1 dados não agrupados

Série com Número Ímpar de Termos

Para uma série com número ímpar de termos: a mediana corresponde ao valor central,

esse valor apresenta o mesmo número de termos localizados a sua esquerda e a sua direita.

A posição do termo central pode ser localizada pela expressão:

(n + 1)
(5.4.1)
2

Exemplo 5.4.2 Considere um conjunto de valor de uma série estatística

41, 32, 66, 49, 35, 57, 39, 54, 44, 48, 51, 56, 59, 36, 63

Dados organizados em ordem crescente:

32, 35, 36, 39, 41, 44, 48, 49, 51, 54, 56, 57, 59, 63, 66

• n = 15

• Posição do termo central: (n+1)


2
= 15+1
2
= 8. Isso signica que a mediana está
localizada na oitava posição:

32, 35, 36, 39, 41, 44, 48, 49 51, 54, 56, 57, 59, 63, 66
←−−−−−− −−−−−−→
50% 50%

• Md = 49 −→ existem 7 elementos antes e 7 elementos depois da mediana, ou seja,


50% dos valores coletados são menores do que a mediana e outros 50% maiores que
ela.

Série com Número par de Termos

Para uma série com número par de termos, não há termo central único, e sim dois termos

centrais. Convencionamos que a mediana seja a média aritmética entre os dois termos

centrais, nesse caso, a mediana é um valor que não pertence à série e está localizado entre

os dois termos centrais.

n
• Primeiro termo central:
2
.

n
• Segundo termo central :
2
+1

Alcides Onésimo Nunda 65 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Exemplo 5.4.3 Considere um conjunto de valores de uma série estatística

48, 60, 33, 42, 36, 40, 53, 43, 46, 52, 55, 45, 58, 65

Dados organizados em ordem crescente:

33, 36, 40, 42, 43, 45, 46, 48, 52, 53, 55, 58, 60, 65

• n = 14

• Primeira posição do termo central: n


2
= 14
2
=7

• Segunda posição do termo central: 14


2
+ 1 = 8.

• Isso signica que os dois termos centrais estão localizados na sétima e na oitava
posição.
33, 36, 40, 42, 43, 45, 44, 48 52, 53, 55, 58, 60, 65
←−−−−−− −−−−−−→
50% 50%

• A média aritmética entre 46 e 48 é:

46 + 48
Md = = 47 −→ Md = 47.
2

Observação 5.4.1 Observe que o valor de 47 não pertence ao grupo de valores que cons-
tituem a série. Na verdade, o valor resultante do cálculo da mediana não precisa, neces-
sariamente, pertencer à série coletada.

5.4.2 Cálculo da Mediana para Dados Agrupados sem Intervalos


de Classe
A mediana é o valor da variável que corresponde à classe mediana. Na determinação da

mediana com dados agrupados sem intervalo de classe, devem-se executar os passos a

seguir:

1. Determina a posição da mediana: para vericar a posição da mediana na dis-

tribuição, calcula-se:
n
Posmed = (5.4.2)
2
2. Localizar a classe mediana: Uma vez determinada a posição da mediana, observa-

se na coluna da frequência acumulada em qual intervalo de valores acumulados esse

valor se enquadra. A classe mediana é estabelecida na coluna da frequência acumu-

lada. A classe mediana é a classe que contém a mediana .

Alcides Onésimo Nunda 66 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

3. Vericar o valor da variável contido na classe mediana.

Exemplo 5.4.4 Foi feita uma pesquisa para especicar as necessidades das famílias em
relação ao número de quartos de uma residência. Para tal, foram consultadas 220 famílias.
Os dados coletados encontra se na tabela 5.5

Tabela 5.5: Distribuição do número de quartos por residência

Quartos (xi ) Famílias (fi ) Faci Interpretação/Faci


1 46 46 1o ao 4o termo
2 81 127 46o ao 127o termo
3 63 190 127o ao 190o termo
4 24 214 190o ao 214o termo
5 6 220 214o ao 22o termo
Total 220

• Posição da mediana: Posmed = 220


2
= 110o valor da série.

• Na coluna da F aci , a posição do centésimo décimo (110o ) valor da série esta loca-
lizada entre o 47o e o 127o , ou seja, na 2a classe.

• Classe Mediana: 2a classe.

• O valor da variável que pertence à segunda classe é 2, ou seja, corresponde à opção


de residências com 2 quartos, Md = 2.

• Valor da mediana: Md = 2 quartos por residência.

• Interpretação: 50% das opiniões é favorável às residências com 2 ou menos dor-


mitórios e os outros 50% é favorável às residências com 2 ou mais dormitórios.

Observação 5.4.2 Quando a posição da mediana coincide com uma frequência acumu-
lada: caso aconteça de n2 coincidir com uma frequência acumulada, a sugestão é que se
faça o cálculo da mediana por meio da média aritmética entre o valor da variável cor-
respondente à frequência acumulada e o valor da variável correspondente a uma ordem
acima
(xi ) + (xi + 1) xi + xi + 1
Md = = (5.4.3)
2 2

5.4.3 Cálculo da Mediana Para Dados Agrupados com Intervalo


de Classe
Na determinação da mediana com dados agrupados em intervalos de classe, devem-se

executar os passos a seguir, sendo que os procedimentos do primeiro e o segundo passo

Alcides Onésimo Nunda 67 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

são àqueles vistos para dados agrupados sem intervalos de classe:

1. Determina a posição da mediana: para vericar a posição da mediana na dis-

tribuição, calcula-se:
n
Posmed = (5.4.4)
2
2. Localizar a classe mediana: Uma vez determinada a posição da mediana, observa-

se na coluna da frequência acumulada em qual intervalo de valores acumulados esse

valor se enquadra. A classe mediana é estabelecida na coluna da frequência acumu-

lada. A classe mediana é a classe que contém a mediana .

3. Determinar a mediana: localizada a classe mediana, ainda resta vericar qual o

ponto, dentro do intervalo dessa classe, que corresponde à mediana. Isto pode ser

resolvido por interpolação, utilizando-se a fórmula a seguir:

n
− F acant

2
Md = lM d + × hM d (5.4.5)
fM d

Sendo:

• lM d = Limite inferior do intervalo de classe mediana;

• F acant = Frequência acumulada da classe anterior à classe mediana;

• fM d = frequência (simples ou absoluta) da classe mediana;

• n= Número de elementos coletados na pesquisa;

• hM d = LM d − lM d = amplitude do intervalo de classe mediana.

• LM d = Limite superior do intervalo de classe mediana.

Exemplo 5.4.5 A tabela abaixo, corresponde ao tempo (em minutos) que 50 assinantes
da Internet da TV Cabo gastaram durante sua conexão mais recente.

Tabela 5.6: Distribuição do tempo gasto na Internet.

Tempo Gasto (xi ) Utilizadores (fi ) F aci Intervalos/F aci


5 ` 15 26 26 1o ao 26o termo
15 ` 25 33 59 26o ao 59o termo
25 ` 35 42 101 59o ao 101o termo
35 ` 45 48 149 101o ao 149o termo
45 ` 55 39 188 149o ao 188o termo
55 ` 65 18 206 188o ao 206o termo
65 ` 75 7 213 206o ao 213o termo
Total 213

Alcides Onésimo Nunda 68 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• Posmed = n
2
= 213
2
= 106, 5o valor da série.

• Na coluna da F ac (frequência acumulada) a posição do 106, 5o , valor da série está


localizada entre o 101o e o 149o , ou seja, na 4a classe.

• Classe mediana: 4a classe.

• Mediana:  
106, 5 − 101
Md = 35 + × 10 = 36, 15 minutos
48

• Interpretação da mediana: 50% dos assinantes da Internet gastaram menos de


36,15 minutos e 50% gastaram mais de 36,15 minutos durante sua conexão mais
recente.

Alcides Onésimo Nunda 69 Pedro Domingos Chitandula


Capítulo 6

Medidas de Posição: Medidas


Separatrizes

São valores que ocupam determinados lugares, abrangendo intervalos iguais, de um con-

junto de valores coletados e organizados. As medidas deposição separatrizes podem ser

classicadas em:

• Mediana: divide a série em duas partes iguais (M d);

• Quartis: divide a série em quatro partes iguais (Q1 , Q2 , Q3 );

• Decis: divide a série em dez partes iguais (D1 , D2 , · · · , D9 );

• Percentis: divide a série em cem partes iguais (P1 , P2 , · · · , P99 )

Os nomes das medidas de posição separatrizes modicam de acordo com a quantidade de

partes que é dividida a série.

Nota 6.0.1 A mediana, além de ser uma medida de posição de tendência central, é tam-
bém uma medida separatriz. A mediana já foi estudada anteriormente assim, passaremos
ao estudo dos quartis, decis e percentis.

6.1 Quartis
Nos quartis, a série é dividida em quatro partes iguais, com o mesmo número de elementos,

de tal forma que cada intervalo do quartil contenha 25% dos elementos coletados. Os

elementos separatrizes da série são Q1 , Q2 e Q3 .

• O primeiro quartil (Q1 ) separa os primeiros 25% dos elementos da série.

70
Notas - Estatística I FEC - UJES/2021-2022

• O segundo quartil (Q2 ) separa os primeiros 50% (25%+25%) dos elementos da série.

Observação 6.1.1 O segundo quartil (Q2 ) sempre será igual a mediana (Md ) da
série.

• O terceiro quartil (Q3 ) separa os primeiros 75% (25% + 25% + 25%) dos elementos

da série.

Nota 6.1.1 Para o cálculo dos quartis, utilizam-se técnicas semelhantes àquelas do cál-
culo da mediana.

6.1.1 Cálculo dos Quartis para dados não Agrupados


Para o cálculo dos quartis, utilizam-se técnicas semelhantes àquelas do cálculo da mediana.

Deste modo, temos:

• Q1 = Medina da primeira metade dos elementos da série.

• Q= Medina de todos os elementos da série.

• Q3 = Medina da segunda metade dos elementos da série.

Exemplo 6.1.1 Dado o conjunto de valores:

7, 13, 5, 12, 16, 4, 9, 15, 6

Considere o conjunto de valores ordenados segundo um critério de grandeza

4, 5, 6, 7, 9, 12, 13, 15, 16

• Q2 : Determinar em primeiro lugar o valor do segundo quartil (Q2 ).

4, 5, 6, 7, 9 12, 13, 16
←−−−− −−−−→
50% Q2 50%

Q2 = Md = 9: mediana de todos os elementos da série.

• Q1 : Para o cálculo do primeiro quartil, basta calcular a mediana da primeira metade


do conjunto.
4, 5, 6 , 7
←−−−− −−−−→
25% Q1 75%

Q1 = 5+6
2
= 5, 5: mediana da primeira metade dos elementos da série.

Alcides Onésimo Nunda 71 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• Q3 : Para o cálculo do quartil Q3 , basta calcular a mediana da segunda metade do


conjunto
12, 13, 15 , 16
←−−−−−− −−−−−−→
75% Q3 25%

Q3 = 13+15
2
= 14: mediana da segunda metade da série.

• Assim: Q1 = 5, 5; Q2 = 9 e Q3 = 14.

6.1.2 Cálculo dos Quartis para Dados agrupados sem Intervalo


de Classe
Para o cálculo dos quartis para dados agrupados sem intervalo de classe, utilizam-se técni-

cas semelhantes àquelas do cálculo da mediana. Isso signica que a localização da posição

do quartil na série é vericada pela frequência acumulada (F aci ).

Os quartis Q1 , Q2 e Q3 podem ser generalizados pela notação Qk , sendo que o quartil

considerado é representado por k.

Denition 6.1.1 Quartil Qk é o valor da variável que corresponde à classe desse quartil
considerado. Sendo que k indica a posição do quartil (k = 1, 2, 3).

• Assim, inicialmente, calcula-se a posição de Qk para estabelecer em que classe se

localiza o quartil considerado.

k×n
P osQk = (6.1.1)
4

• Obtida a posição de Qk , localiza-se o valor da mesma na frequência acumulada, para


conhecer qual é a classe que corresponde a essa posição, a qual damos o nome de

"classe do quartil k ". Em seguida, verica-se o valor da variável correspondente a

classe do quartil k considerado.

Exemplo 6.1.2 A distribuição das notas de Estatística Descritiva de 25 estudantes da


faculdade de Economia no ano lectivo 2020/2012 é descrita na tabela abaixo:

• Cálculo do Q1 (k = 1). Posição:

1×n 1 × 25
Q1 = = = 6, 25 −→ Posicionando na 2a classe
4 4

Alcides Onésimo Nunda 72 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Tabela 6.1: Distribuição das notas


Classe Notas (xi ) Estudantes (fi ) F aci
1 11 3 3
2 12 4 7
3 13 3 10
4 14 4 14
5 15 3 17
6 16 5 22
7 17 3 25

Total 25

A localização da posição 6,25, na coluna da frequência acumulada, ocorre na segunda


classe. A classe do Q1 é a segunda classe. Na segunda classe, o valor da variável é
12, ou seja Q1 = 12 valores.

• Cálculo do Q2 (k = 2). Posição:

2×n 2 × 25
Q2 = = = 12, 5 −→ Posicionando na 4a classe
4 4

A localização da posição 12,5, na coluna da frequência acumulada, ocorre na quarta


classe. A classe do Q2 é a quarta classe. Na quarta classe, o valor da variável é 14,
ou seja Q2 = 14 valores.

• Cálculo do Q3 (k = 3). Posição:

3×n 3 × 25
Q3 = = = 18, 75 −→ Posicionando na 6a classe
4 4

A localização da posição 18,75, na coluna da frequência acumulada, ocorre na sexta


classe. A classe do Q3 é a sexta classe. Na sexta classe, o valor da variável é 16,
ou seja Q3 = 16 valores.

• Interpretação:
 Q1 : 25% dos estudantes tiveram uma nota inferior ou igual a 12 valores e
75% tiveram uma nota maior ou igual a 12 valores
 Q2 : 50% dos estudantes tiveram uma nota inferior ou igual a 14 valores e
50% tiveram uma nota maior ou igual a 14 valores.
 Q3 : 75% dos estudantes tiveram uma nota inferior ou igual a 16 valores e
25% tiveram uma nota maior ou igual a 16 valores.

Alcides Onésimo Nunda 73 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

6.1.3 Cálculo dos Quartis para Dados Agrupados com Intervalo


de Classe
Para o cálculo dos quartis para dados agrupados com intervalo de classe, utilizam-se

técnicas semelhantes àquelas do cálculo dos quartis para dados agrupados sem intervalo

de classe.

• Inicialmente, calcula-se a posição de Qk para estabelecer em que classe se localiza o

quartil considerado.
k×n
P osQk = (6.1.2)
4
• Obtida a posição de Qk , localiza-se o valor da mesma na frequência acumulada, para
conhecer qual é a classe que corresponde a essa posição, a qual damos o nome de

"classe do quartil k ".

• Em seguida, determina-se o valor da variável que corresponde ao quartil k, através

da seguinte fórmula:

" #
k×n
4
− F acant
Qk = lQk + × hQk (6.1.3)
fQk

Onde:

 k = Quartil considerado.
 lQk = limite inferior do intervalo de classe do quartil considerado.
 F acant = Frequência acumulada da classe anterior à classe do quartil conside-
rado.

 fQk = Frequência simples da classe do quartil considerado.


 hQk = Amplitude do intervalo de classe do quartil considerado.

Exemplo 6.1.3 Numa empresa do Huambo, o salário dos funcionários do sector de ven-
das incide as comissões sobre as vendas realizadas. Tomando como base os salários, a
empresa divide os funcionários em quatro categorias:

• Os 25% menos produtivos : categoria C;

• Os 25% seguintes: categoria B;

• Os 25% mais produtivos: categoria A;

• Os 25% restantes = categoria especial.

Alcides Onésimo Nunda 74 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Tabela 6.2: Distribuição salarial(em centenas de Kzs) dos funcionários do sector de vendas

Salário(Kzs) (xi ) Funcionários (fi ) F aci


1.000 ` 2.000 3 3
2.000 ` 3.000 14 17
3.000 ` 4.000 18 35
4.000 ` 5.000 10 45
5, 000 ` 6.000 6 51
6.000 ` 7.000 3 54
Total 54

A distribuição salarial dos funcionários do sector de vendas é descrita na tabela

• Cálculo do Q1 . Posição
1 × 54
P osQ1 = = 13, 50
4
A classe do quartil Q1 é a segunda classe, assim
 
13, 50 − 3
Q1 = 2.000 + × 1.000 = 2.750, 00 −→ Q1 = 275.000 (2.750 × 100).
14

• Cálculo do Q2 . Posição
2 × 54
P osQ2 = = 27
4
A classe do quartil Q2 é a terceira classe, assim
 
27 − 17
Q2 = 3.000 + × 1.000 = 3.555, 56. −→ Q2 = 355.556 (3.555, 56 × 100)
18

• Cálculo do Q3 . Posição
3 × 54
P osQ3 = = 40, 50
4
A classe do quartil Q1 é a segunda classe, assim
 
40, 50 − 35
Q3 = 4.000 + × 1.000 = 4.550, 00 −→ Q2 = 455.000 (4.550 × 100).
10

Assim os salários limites das categorias estabelecidas pela empresa são:

• Categoria C (os 25% menos produtivos): salários entre 100.000 ,00 e 275.000,00;

• Categoria B (os 25% seguintes): salários entre 275.000 ,00 e 355.556,00;

• Categoria A (os 25% mais produtivos): salários entre 355.556,00 e 455.000,00;

• Categoria Especial (os 25% restantes): salários entre 455.000 ,00 e 700.000.

Alcides Onésimo Nunda 75 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

6.2 Decis
Nos decis, a série é dividida em dez partes iguais, com o mesmo número de elementos,

de tal forma que cada intervalo do decil contenha 10 % dos elementos coletados. Os

elementos separatrizes da série são: D1 , D2 , · · · , D9 . Interpretação dos decis:

• O primeiro decil (D1 ) separa os primeiros 10% dos elementos da série;

• O segundo decil (D1 ) separa os primeiros 20% (10%+10%) dos elementos da série;

• ···, Assim sucessivamente até o decil D9 .

• O nono decil (D9 ) separa os primeiros 90% dos elementos da série.

Denition 6.2.1 Dk é o valor da variável que corresponde à classe desse decil conside-
rado. Sendo que k indica a posição do decil (k = 1, 2, · · · 9).

6.2.1 Cálculo dos Decis


O cálculo dos decis é feito de maneira análoga ao cálculo dos quartis, seja para dados

simples ou agrupados com e sem intervalos de classe.

• Assim, para dados simples, calcula-se a posição do decil através da expressão

seguinte:
k×n
P osDk = (6.2.1)
10
• Para dados agrupados sem intervalos de classe, após obter a posição de Dk ,
localiza-se o valor da mesma frequência acumulada, para conhecer qual é a classe

correspondente a essa posição a qual damos o nome de "classe do decil k ". Em

seguida, verica-se o valor da variável correspondente do decil k considerado.

• Para dados agrupados com intervalos de classe, após obter a posição de Dk


e localizar a classe do decil k , determina-se o valor da variável que corresponde ao

decil Dk através da formula a seguir:

" #
k×n
10
− F acant
Dk = lDk + × hDk (6.2.2)
fDk

Onde:

 k = Decil considerado.
 lDk = limite inferior do intervalo de classe do decil considerado.

Alcides Onésimo Nunda 76 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

 F acant = Frequência acumulada da classe anterior à classe do decil considerado.


 fDk = Frequência simples da classe do decil considerado.
 hDk = Amplitude do intervalo de classe do decil considerado.

Exemplo 6.2.1 Considerando o exemplo 6.1.3, podemos calcular os decis D1 e D7 .

• Primeiro decil, D1 (k = 1). Posição:

1 × 54
P osD1 = = 5, 4
10

. A classe do decil D1 é a segunda classe, assim:


 
5, 4 − 3
D1 = 2.000 + × 1.000 = 2.171, 43 −→ D1 = 217.143, 00 (2.171, 43 × 100)
14

• Sétimo decil, D7 (k = 7). Posição:

7 × 54
P osD7 = = 37, 8
10

. A classe do decil D7 é a quarta classe, assim:


 
37, 8 − 35
D7 = 4.000 + × 1.000 = 4.280, 00 −→ D7 = 428.000 (4.280, 00 × 100)
10

• Interpretação: D1 , 10% dos funcionários ganham um salário inferior ou igual


a 217.143 mil kwanzas e os 90% dos funcionários ganham um salário superior a
217.143 mil kwanzas; D7 , 70% dos funcionários ganham um salário inferior ou
igual a 428.000 mil kwanzas e os 30% dos funcionários dos funcionários ganham
um salário superior a 428.000 mil kwanzas .

6.3 Percentis
Nos percentis, a série é dividida em cem (100) partes iguais, de tal forma que cada intervalo

do percentil contenha 1 % dos elementos coletados. Os elementos separatrizes da série

são: P1 , P2 , · · · , P 99. Interpretação dos percentis:

• O primeiro percentil (P1 ) separa os primeiros 1% dos elementos da série.

• O segundo percentil (P2 ) separa os primeiros 2% (1% + 1%) dos elementos da

série.

Alcides Onésimo Nunda 77 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• ··· E assim sucessivamente até o percentil P99 .

• O nonagésimo nono percentil (P99 ) separa os primeiros 99% dos elementos da série.

Denition 6.3.1 Pk é o valor da variável que corresponde à classe desse percentil con-
siderado. Sendo que k indica a posição do percentil (k = 1, 2, · · · , 99).

6.3.1 Cálculo dos Percentis


O cálculo dos percentis é feito de maneira análoga ao cálculo dos decis, seja para dados

simples ou agrupados com e sem intervalos de classe.

• Assim, para dados simples, calcula-se a posição do quartil através da expressão

seguinte:
k×n
P osP k = (6.3.1)
100
• Para dados agrupados sem intervalos de classe, após obter a posição de Pk ,
localiza-se o valor da mesma frequência acumulada, para conhecer qual é a classe

correspondente a essa posição a qual damos o nome de "classe do percentil k ". Em

seguida, verica-se o valor da variável correspondente do percentil k considerado.

• Para dados agrupados com intervalos de classe, após obter a posição de Pk


e localizar a classe do percentil k , determina-se o valor da variável que corresponde

ao percentil Pk através da formula a seguir:

" #
k×n
100
− F acant
Pk = lP k + × hP k (6.3.2)
fP k

Onde:

 k = Percentil considerado.
 lP k = limite inferior do intervalo de classe do percentil considerado.
 F acant = Frequência acumulada da classe anterior à classe do percentil consi-

derado.

 fP k = Frequência simples da classe do percentil considerado.


 hP k = Amplitude do intervalo de classe do percentil considerado.

Exemplo 6.3.1 Considerando o exemplo 6.1.3, podemos calcular os percentis P10 e P70 .

Alcides Onésimo Nunda 78 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• Décimo percentil, P10 (k = 10). Posição:

10 × 54
P osP10 = = 5, 4
100

. A classe do percentil P10 é a segunda classe, assim:


 
5, 4 − 3
P10 = 2.000 + × 1.000 = 2.171, 43 −→ P10 = 217.143, 00 (2.171, 43 × 100)
14

• Septuagésimo percentil, P70 (k = 70). Posição:

70 × 54
P osP70 = = 37, 8
100

. A classe do decil P70 é a quarta classe, assim:


 
37, 8 − 35
P70 = 4.000 + × 1.000 = 4.280, 00 −→ P70 = 428.000 (4.280, 00 × 100)
10

• Interpretação: P10 , 10% dos funcionários ganham um salário inferior ou igual


a 217.143 mil kwanzas e os 90% dos funcionários ganham um salário superior a
217.143 mil kwanzas; P70 , 70% dos funcionários ganham um salário inferior ou
igual a 428.000 mil kwanzas e os 30% dos funcionários dos funcionários ganham
um salário superior a 428.000 mil kwanzas.

Alcides Onésimo Nunda 79 Pedro Domingos Chitandula


Capítulo 7

Medidas de Dispersão ou de
Variabilidade

A interpretação de dados estatísticos exige que se realize um número maior de estudos,

além das medidas de posição. O estudo das médias, medianas, moda, quartis, decis

e percentis são válidos, mas não sucientes para estudos comparativos ou conclusões

qualitativas. Também é importante descrever o conjunto de valores do grupo em termos

da variação existente entre seus elementos. Quanto maior a variação dos dados, menor

a representatividade da média. Sendo assim, pode-se dizer que as medidas de dispersão

são úteis para qualicar a média. Quanto menor a dispersão, maior a homogeneidade na

As
concentração entre os elementos do conjunto de valores, e mais conável é a média.

medidas de dispersão servem para vericar a representatividade das medidas


de posição. Das medidas de dispersão estudaremos:

• Amplitude Total;

• Variância e Desvio-padrão;

• Coeciente de Variação.

7.1 Amplitude Total


7.1.1 Cálculo da Amplitude Total para Série Simples
Para dados não agrupados, a amplitude total é a diferença entre o maior e o menor valor

da série de dados coletados.

AT = Xmx − Xmin (7.1.1)

80
Notas - Estatística I FEC - UJES/2021-2022

Exemplo 7.1.1 Considerando o exemplo 6.1.2, podemos determinara a amplitude total


da distribuição das notas,
AT = 17 − 11 = 6 valores

7.1.2 Cálculo da Amplitude Total para Dados Agrupados numa


Distribuição de Frequência
Levando-se em conta a variável em estudo, a amplitude total é a diferença entre o limite

superior da classe mais alta e o limite inferior da classe mais baixa.

AT = Lmax − lmin (7.1.2)

Nota 7.1.1 A amplitude total é útil em casos como a medida de temperatura de uma
localidade, em que pode-se estabelecer a amplitude da temperatura em um dia, semana,
mês ou ano. Para a programação de um evento, é importante e signicativo conhecer a
amplitude da temperatura da região durante os últimos dias, semanas, meses ou anos.

Observação 7.1.1 A utilização da amplitude total como medida de dispersão é muito


limitada, pois sendo uma medida que depende apenas dos valores externos, é instável, não
sendo afetada pela dispersão dos valores internos.

Exemplo 7.1.2 Considerando o exemplo 6.1.3, podemos determinara a amplitude total


da distribuição salarial,

AT = 7.000 − 1.000 = 6.000 (6.000 × 100) −→ AT = 600.000 Kzs.

7.2 Variância (σ2) e Desvio- padrão (σ)


A variância é a medida de dispersão mais empregada, pois leva em consideração todos

os valores coletados para a variável em estudo. É um indicador de variabilidade mais

conável. O desvio-padrão é a medida mais usada na comparação de diferenças entre

conjunto de dados, por ter grande precisão. O desvio-padrão determina a dispersão dos

valores em relação a média.

A variância relaciona os desvios em torno da média, ou mais especicamente á a média

aritmética dos quadrados dos desvios.

• Valores da série próximos uns dos outros originam um desvio-padrão menor. Isso

signica que, quanto menor for o valor do desvio-padrão, menor será a dispersão

Alcides Onésimo Nunda 81 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

dos valores da série, ou seja, trata-se de uma série de valores com menor variação

( série mais homogénea);

• Valores da série muito afastados uns dos outros originam um desvio-padrão maior.

Isso signica que, quanto maior for o valor do desvio-padrão, maior será a dispersão

dos valores da série, ou seja, trata-se de uma série de valores com maior variação

( serie mais heterogénea).

7.2.1 Relação entre a Variância e o Desvio-padrão


O desvio-padrão é a raiz quadrada da variância, e consequentemente a variância é o

quadrado do desvio-padrão.


Variância = (σ)2 Desvio-padrão = σ2 = σ (7.2.1)

7.2.2 Cálculo do Desvio-padrão e Variância para Séries Simples


(Dados não agrupados) pela denição e pela fórmula alter-
nativa
O desvio-padrão e a variância de uma série podem ser calculados para duas situações de

coleta dos dados, população e amostra. As fórmulas são diferentes para cada caso, uma

vez que deve haver um ajuste para o cálculo dessas grandezas quando os dados coletados

referem-se a amostras.

Cálculo da Variância e do Desvio-padrão de uma População (pela Denição)

A variância é a média aritmética dos quadrados dos desvios.

(xi − x)2 d2i


P P
2
σ = = (7.2.2)
n n

Sendo: σ2 = variância; x= valor da média aritmética; xi = valor da i-ésima observação

da variável em estudo; d2i = desvio da variável em relação a sua média.

• O desvio-padrão é calculado por meio da raiz quadrada da variância para população:

rP rP
√ (x i − x)2 d2i
σ= σ2 = = (7.2.3)
n n

Alcides Onésimo Nunda 82 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Cálculo da Variância e do Desvio-padrão de uma Amostra (pela Denição)

Conforme citado anteriormente, o cálculo da variância para uma amostra deve apresentar

uma correção e, relação ao mesmo cálculo para a população. Nestes casos, a variância

representa uma descrição da amostra e não da população (este tipo de ocorrência é mais

comum na estatística), o denominador passa a ser "n − 1"ao invés de "n". A modicação

do denominador n para n−1 constitui um factor de ajuste visando corrigir o facto do

número de elementos da amostra ser menor que o número de elementos da população.

(xi − x)2
P P 2
2 di
σ = = (7.2.4)
n−1 n−1

• Da mesma forma que para a variância, caso o desvio-padrão represente uma descri-

ção da amostra e não da população, o denominador passa a ser n−1 ao invés de n.


O desvio-padrão é calculado por meio da raiz quadrada da variância para amostra:

sP

rP
(xi − x)2 d2i
σ= σ2 = = (7.2.5)
n−1 n−1

Nota 7.2.1 O valor médio em algumas séries resulta números decimais, consequente-
mente, o cálculo da variância e do desvio-padrão pode-se estender num somatório do
quadrado de números decimais. Com objectivo de simplicar os cálculos matemáticos,
utiliza-se uma fórmula alternativa para o cálculo da variância e do desvio padrão.

Cálculo da Variância e do Desvio-padrão de uma População (pela Fórmula


Alternativa)
P P 2
xi
(xi −x)2 = x2i − ( nxi ) .
P P
Levando em conta que x= n
e que Fazendo s substituição

desses valores na expressão da variação (equação 7.2.2), obtém-se:

( xi ) 2
P
2
( xi ) 2
P P 2 P
2 (x i − x) n xi
σ = = = − (7.2.6)
" n n # n n2
1 X 2 ( xi )2
P
= xi −
n n

• Desvio padrão:
v "
u
u1 X P 2#
( xi )
σ=t x2i − (7.2.7)
n n

Alcides Onésimo Nunda 83 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Cálculo da Variância e do Desvio-padrão de uma Amostra (pela Fórmula Al-


ternativa)

De forma análoga, para amostra obtém-se;

• Variância: " P 2#
1 X ( xi )
σ2 = x2i − (7.2.8)
n−1 n

• Desvio-padrão:
v
u " P 2#
u 1 X ( xi )
σ=t x2i − (7.2.9)
n−1 n

7.2.3 Calculo da Desvio-padrão e Variância para Dados Agrupa-


dos
Fórmula para o Cálculo da Variância e o Desvio-padrão para População (pela
Denição)

• Variância:

(xi − x)2 · fi
P
2
σ = (7.2.10)
n
• Desvio-padrão:

rP
(xi − x)2 · fi
σ= (7.2.11)
n

Fórmula para o Cálculo da Variância e o Desvio-padrão para Amostra (pela


Denição)

• Variância:

(xi − x)2 · fi
P
2
σ = (7.2.12)
n−1
• Desvio-padrão:

rP
(xi − x)2 · fi
σ= (7.2.13)
n−1

Alcides Onésimo Nunda 84 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Fórmula para o Cálculo da Variância e o Desvio-padrão para População (pela


Fórmula Alternativa)

• Variância: " #
P 2
1 X ( x f
i i )
σ2 = x2i · fi − (7.2.14)
n n

• Desvio-padrão:
v " #
2
u P
u1 X ( x i · f i )
σ=t x2i fi − (7.2.15)
n n

Fórmula para o Cálculo da Variância e o Desvio-padrão para Amostra (pela


Fórmula Alternativa)

• Variância: " #
P 2
1 X ( x i · f i )
σ2 = x2i fi − (7.2.16)
n−1 n

• Desvio-padrão:
v " #
2
u P
u 1 X ( x i · f i )
σ=t x2i fi − (7.2.17)
n−1 n

7.2.4 Propriedades do Desvio-padrão


1. Adicionando ou subtraindo um mesmo valor de todos os valores de uma variável, o

desvio-padrão não se altera;

2. Multiplicando ou dividindo todos os valores de uma variável por um mesmo número

(diferente de zero), o desvio-padrão ca multiplicado ou dividido por esse número.

Exemplo 7.2.1 ((Dados não Agrupados)) Durante determinada semana, os nove ven-
dedores de uma agência de automóveis do Huambo(população), venderam as seguintes
quantidades de carros: 20, 25, 28, 31, 37, 42, 45, 49, 53. A distribuição da venda de carros
por nove vendedores é descrita na tabela abaixo:

Alcides Onésimo Nunda 85 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Tabela 7.1: Distribuição da venda de carros por nove vendedores

Vendedor Caros Vendidos (xi ) x2i


1 20 400
2 25 625
3 28 784
4 31 961
5 37 1.369
6 42 1.764
7 45 2.025
8 49 2.401
9 53 2.809

x2i = 13.138
P P
xi = 330

• Sendo: x = 330
9
= 36, 67. −→ x = 37 carros

• Utilizando a fórmula da denição:

 Variância:
(20 − 36, 67)2 + (25 − 36, 67)2 + · · · + (53 − 36, 67)2 1038
σ2 = = = 115, 33.
9 9
q
 Desvio-padrão: σ = 1038
9
= 10, 74. −→ σ = 11 carros.

• Utilizando a fórmula alternativa:

 Variância:
(330)2
 
1 2
σ = 13.138 − = 115, 33.
9 9
r h i
 Desvio-padrão: σ = 9 13.138 − 9 = 10, 74 −→ σ = 11 carros.
1 (330)2

Alcides Onésimo Nunda 86 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Exemplo 7.2.2 (Dados Agrupados sem Intervalo de Classe) Uma empresa nan-
ceira vericou que algumas propostas apara a realização de nanciamentos não observaram
todos as exigências necessárias à concessão dos respectivos créditos. Visando uma análise
do problema, a empresa agrupou as propostas com base no número de exigências descum-
pridas. A distribuição de exigências descumpridas em cada proposta para concessão de
crédito e descrita na tabela abaixo:

Tabela 7.2: Distribuição de exigências descumpridas em cada proposta para concessão de


crédito

N o /Exig.Descumpridas (xi ) Propostas (fi ) xi f i x2i fi


1 6 6 6
2 8 16 32
3 7 21 63
4 5 20 80
5 5 25 125
6 4 24 144
7 2 14 98
Total n = 37 126 548

• Média aritmética:
P
x i fi 126
x= = = 3, 14 −→ x = 3 exigências descumpridas
n 37
h i
(126)2
• Variância: σ 2 = 1
37
548 − 37
= 3.2041.
r h i
(126)2
• Desvio -padrão: σ = 1
37
548 − 37
= 1, 79.

Exemplo 7.2.3 (Dados Agrupados com Intervalo de Classes) A distribuição das


vendas (em milhares de kwanzas) por funcionário de uma empresa de telecomunicação de
Angola é descrita na tabela abaixo:

Alcides Onésimo Nunda 87 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Tabela 7.3: Distribuição das vendas por funcionário

Vendas (xi ) Funcionário (fi ) Ponto Médio xi f i x2i fi


40, 00 ` 80, 00 5 60,00 300 18.000
80, 00 ` 120, 00 16 100,00 1.600 160.000
120, 00 ` 160, 00 21 140,00 2.940 411.600
160, 00 ` 200, 00 27 180,00 4.860 874.800
200, 00 ` 240, 00 18 220,00 3.960 871.200
240 ` 280, 00 10 260,00 2.600 676.000
280, 00 ` 320, 00 6 300,00 1.800 540.000

Total 103 18.060 3.551.600

• Média aritmética: P
xi f i 18.060, 00
x= = = 175, 43
n 103
• Variância:
(18.060)2
 
2 1
σ = 3.551.600 − = 3.738, 10
103 103

• Desvio-padrão:
s  
1 (18.060)2
σ= 3.551.600 − = 61, 14.
103 103

• As venda média da empresa é de 175.340 (175, 34 × 1.000) com desvio-padrão de


61,14. Assim observa-se que há uma grande dispersão entre as vendas praticadas
pelos funcionários

7.3 Dispersão Absoluta e Relativa na Comparação de


duas Séries de Dados Colectados
As medidas de viabilidade são medidas de dispersão absolutas que não devem ser usadas

para comparar dispersões de distribuições quando os valores das medidas de dispersões

forem diferentes. Para inviabilizar este problema usam-se medidas de dispersão relativas

A dispersão relativa é razão entre a dispersão absoluta e o valor da média:

dispersão absoluta
dispersão relativa = (7.3.1)
média

• Dispersão absoluta: é medida pelo desvio-padrão (a série com maior valor de

desvio-padrão terá maior dispersão absoluta).

Alcides Onésimo Nunda 88 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• Dispersão relativa: é medida pelo coeciente de variação (a série com maior

coeciente de variação terá maior dispersão relativa).

7.3.1 Coeciente de Variação ou Coeciente de Variação de Pe-


arson
A dispersão relativa é medida pelo coeciente de variação de Pearson, ou simplesmente

coeciente de variação, sendo que a dispersão absoluta é o desvio padrão σ. O coeciente

de variação (dispersão relativa) é a razão entre o desvio-padrão (σ ) e a média aritmética

(x). Utiliza-se o coeciente de variação na comparação do grau de concentração em torno

da média para duas ou mais séries distintas. O coeciente de variação pode ser expresso

por valor decimal ou por valor percentual

σ
CV = −→ valor decimal (7.3.2)
x

ou
σ
CV = × 100 −→ valor percentual (7.3.3)
x
Uma outra medida de dispersão relativa, que é insensível aos valores extremos e, portanto,

adequada para distribuição em que existem valores muito diferentes da grande maioria de

valores, considera como medida de dispersão absoluta a amplitude inter-quartis e como

medida de dispersão a mediana


Q3 − Q1
(7.3.4)
Md

Observação 7.3.1 Utiliza-se o coeciente de variação na comparação do grau de con-


centração de valores em torno da média para duas ou mais séries distintas. A série mais
homogênea e aquela que tem menor coeciente de variação relativa.

Nota 7.3.1 Uma distribuição estatística tem:

• Baixa dispersão: CV ≤ 15%.

• Média dispersão: 15% < CV < 30%.

• Alta dispersão: Cv ≥ 30%.

Exemplo 7.3.1 Para duas emissões de acções ordinárias de uma uma indústria de te-
lecomunicações, o preço médio diário, no fechamento dos negócios, durante um mês, foi
de 150, 00 USD para as acções A, com um desvio-padrão de 5, 00 USD. Para as acções
B , o preço médio foi de 50, 00 USD com um desvio-padrão de 3, 00 USD. Comparando a
viabilidade das acções A e B , tem -se:

Alcides Onésimo Nunda 89 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• A viabilidade absoluta• das acções A e B é obtida pela comparação dos respec-


tivos valores de desvio-padrão.

 σA = 5, 00 USD e σB = 3, 00 USD (σA é maior que SB ), então A tem maior


dispersão absoluta que B . Isto signica que em termos absolutos A é mais
variável que B , ou seja, a maior variabilidade ocorreu para a acção A, pois ela
apresenta maior desvio-padrão que a acção B

• A análise em termos relativos é feita pela comparação dos coecientes de variação

 CVA = 5
150
× 100 = 3, 30%
 CVB = 3
50
× 100 = 6, 0%
 CVA é menor que CVB , então A apresenta menor dispersão relativa que B .
Neste caso B , é mais variável que A, pois o coeciente de variação da acção
B é quase duas vezes maior que o da ação A.

7.4 Curvas Simétricas e Assimétricas


Estas medidas referem-se à forma da curva de uma distribuição de frequência, mais espe-

cicamente do polígono de frequência ou do histograma.

Uma curva plana é simétrica se for possível dividi-la por uma recta (chamada eixo de

simetria), de forma que as duas metades da curva assim obtidas possam ser sobrepostas

por dobragem. Uma curva assimétrica é uma curva não simétrica.

7.4.1 Distribuição de Frequências Representada por Uma Curva


Simétrica
Na estatística, ocorrem distribuições de frequências, cuja representação gráco uma curva

normal, caso particular de uma curva simétrica. A curva normal é também conhecida

como curva em forma de sino.

• Pico da Curva: é o valor modal, que corresponde ao maior valor da frequência.

O eixo de simetria contém o valor modal. A partir desse eixo de simetria, observa-se

que cada metade da curva prolonga-se indenidamente tanto para o lado direito como

para o lado esquerdo, porém, sem tocar o eixo horizontal. Uma distribuição de frequência

representada por uma curva normal é unimodal ( tem apenas um pico).

Alcides Onésimo Nunda 90 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Figura 7.1: Curva Simétrica

Nas distribuições de frequência simétrica, a média, mediana e moda são iguais. Na curva

normal, os valores da média, mediana e moda (x = M0 = Md ) coincidem no mesmo ponto


da curva de distribuição de frequência, que corresponde ao pico da curva.

7.4.2 Distribuição de Frequências Representada por Uma Curva


Assimétrica
Tanto nas representações grácas de distribuições de frequência simétrica quanto nas

assimétricas o pico da curva corresponde ao valor modal. Observa-se que na curva de

distribuição de frequência assimétrica a distribuição de pontos do lado esquerdo da curva

em relação à moda é diferente da distribuição dos pontos do lado direito da curva.

Uma distribuição de frequência é assimétrica quando a média, a mediana e a moda não

coincidem num mesmo ponto da representação gráca da distribuição, apresentando va-

lores diferentes. Toda distribuição deformada é sempre assimétrica. Entretanto, a assi-

metria pode dar-se na cauda esquerda ou na direita da curva de frequências.

Assimetria à Direita (ou Positiva)

Em uma distribuição assimétrica positiva, ou assimetria à direita, tem-se:

Mo < Md < X (7.4.1)

Alcides Onésimo Nunda 91 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Figura 7.2: Curva Assimétrica Positiva

Assimetria à Esquerda (ou Negativa)

Em uma distribuição assimétrica negativa, ou assimetria à esquerda, predominam valores

inferiores à Moda.

X < Md < Mo (7.4.2)

Figura 7.3: Curva Assimétrica Negativa

Observação 7.4.1 Para as curvas ligeiramente assimétricas, os valores da mediana e da


média deslocam-se para a direita ou para a esquerda da moda, sendo que esse afastamento
pode ser mensurado através do coeciente de assimetria de Pearson.

Alcides Onésimo Nunda 92 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

7.4.3 Coeciente de Assimetria de Pearson (AS)


O coeciente de assimetria de Pearson estabelece o grau de assimetria de uma curva de

distribuição de frequências, ou seja, mede o afastamento da mediana em relação à média

aritmética da distribuição.

O coeciente de assimetria é expresso pela diferença entre a média e a mediana dividida

pelo desvio-padrão do grupo de medidas. O coeciente de assimetria de Pearson, permite

comparar duas ou mais distribuições diferentes e avaliar qual das distribuições é mais

quanto a assimétrica. Quanto maior o coeciente de assimetria de Pearson, mais assimé-

trica é a curva.

Existem várias fórmulas para o cálculo do coeciente de assimetria. As mais utilizadas

são:

• 1o Coeciente de Pearson:

3(x − Md )
AS = (7.4.3)
σ

• 2o Coeciente de Pearson:

Q1 + Q3 − 2Md
AS = (7.4.4)
Q3 − Q1

Nota 7.4.1 O coeciente de Pearson pode ser nulo, positivo ou negativo. Se o coeciente
de for:

• AS = 0, indica que a curva é simétrica, ou seja, não há assimetria( é uma curva de


distribuição normal);

• AS > 0, indica que a assimetria é positiva (deslocamento para a direita);

• AS < 0, indica que a assimetria é negativa (deslocamento para a esquerda)

7.5 Curtose
Curtose é o grau de achatamento (ou alamento) de uma distribuição em comparação

com uma distribuição padrão (chamada curva normal). De acordo com o grau de curtose,

classicamos três tipos de curvas de frequência:

Alcides Onésimo Nunda 93 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

1. Mesocúrtica: é uma curva básica de referência chamada curva padrão ou curva

normal.

Figura 7.4: Curva Mesocúrtica

2. Platicúrtica: é uma curva mais achatada (ou mais aberta) que a curva normal.

Figura 7.5: Curva Platicúrtica

3. Leptocúrtica: é uma curva mais alada (menos aberta) que a curva normal.

Figura 7.6: Curva Leptocúrtica

Alcides Onésimo Nunda 94 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

7.5.1 Coeciente Percentílico de Curtose


A medida da curtose pode ser feita pelo coeciente percentílico de curtose:

Q3 − Q1
C= (7.5.1)
2(P90 − P10

Sendo:

• C= coeciente percentílico de curtose;

• Q3 = o terceiro quartil;

• Q1 = o primeiro quartil;

• P90 = o nonagésimo percentil;

• P10 = o décimo percentil

Uma curva normal apresenta um coeciente percentílico de curtose de valor C = 0, 263.


Esse valor é obtido ao se aplicar a expressão matemática do coeciente percentílico de

curtose aos valores de uma distribuição simétrica normal. Tomando-se esse valor como

padrão, podem-se estabelece comparações entre as diversas curvas:

• C = 0, 263 corresponde à curva mesocúrtica;

• C < 0, 263 corresponde à curva leptocúrtica;

• C > 0, 263 corresponde à curva platicúrtica.

7.6 Propriedades da Aplicação do Desvio-padrão


As aplicações nos permitem entender porque o desvio-padrão é a mais importante das

medidas de dispersão.

Observação 7.6.1 Na curva normal, o valor da média aritmética é igual ao valor da


moda e igual ao valor da mediana: x = Md = M0 .

7.6.1 Distribuições Normais


A curva normal pode ser completamente especicada pelo valor da média e pelo valor

do desvio-padrão. A área limitada pela curva normal, entre um ponto qualquer e a

média, é função do número de desvios-padrão que aquele ponto dista da média. Estudos

matemáticos estabeleceram as seguintes proporções:

Alcides Onésimo Nunda 95 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• A área total limitada pela curva normal é unitária (rea = 1).

• Intervalo de amplitude 2σ (também chamado zona de normalidade) é denido


pelo conjunto de valores em torno da média aritmética, contidos num intervalo de

amplitude 2σ , com centro na média da distribuição. É o conjunto de valores entre

(x − σ) e (x + σ ). Abrange 68% dos elementos da série.

• Intervalo de amplitude 4σ ( quatro vezes o desvio-padrão) é o conjunto de valores


compreendido entre (x − 2σ ) e (x + 2σ ) em torno da média, abrange cerca de 95%

dos elementos da série.

• Intervalo de amplitude 6σ ( seis desvios-padrão ) é o conjunto de valores com-


preendido entre (x − 3σ ) e (x + 3σ ) em torno da média, abrange aproximadamente

cerca de 100% da série.

Figura 7.7: Representação gráca da zona de normalidade

Exemplo 7.6.1 Dada a tabela de distribuição de frequência:

Classes fi
10 ` 14 10
14 ` 18 20
18 ` 22 30
22 ` 26 20
26 ` 30 10

• Sendo:

Alcides Onésimo Nunda 96 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

 x = 20, Md = 20, M0 = 20, Q1 = 16, 5,


 Q3 = 23, 5, P10 = 13, 6, P90 = 26, 4 e σ = 4, 64.

• Como x = Md = Mo = 20 −→ x − M0 = 0. Trata-se de uma curva simétrica


(x = Md = M0 )

• Coeciente de assimetria: AS = 3(20−20)


4,64
= 0. O coeciente nulo da assimetria
conrma que se trata de uma curva simétrica.

• Coeciente percentílico de curtose: C = 2(26,4−13,6)


23,5−16,5
= 0, 273. Como o valor do
coeciente percentílico de cusrtose obtido (0, 273) é maior que 0, 263 (C > 0, 263),
a curva é platicúrtica em relação à normal.

Alcides Onésimo Nunda 97 Pedro Domingos Chitandula


Capítulo 8

Números Índices e Noção de


Demograa

8.1 Números índices


8.1.1 Conceito e Objectivo
A análise comparativa da diversos fenómenos congéneres representados por séries, torna-se

mais simples se cada uma destas for representada por um número. Número este que poderá

ser uma das tendências centrais, facilitando a observação dentre outros acontecimentos, o

da variação de preços, de custo de vida, de salários, de volume de produção e de venda.

Para isso, entretanto é preciso observar a existência de termos de uma espécie nas várias

séries consideradas, sem o que, não se pode chegar a uma conclusão concisa das oscilações

reinantes.

Exemplo 8.1.1 Considere a tabela de mercadoria em espécie:

Tabela 8.1: Mercadoria em Espécie

Mercadoria em espécie Preço em milhares de Kwanzas

2015 2021
A 2,00 1,00
B 6,00 6,00
C 1,00 2,00
Total 9,00 9,00

• Assim, na tabela pode-se mediante simples observação, vericar a variação de preço

de cada mercadoria nos dois anos referidos.

98
Notas - Estatística I FEC - UJES/2021-2022

• No caso da oscilação de preços do conjunto de mercadorias, é necessário apresentar

os valores de cada época por um único número, ao qual denominar-se-á número


índice - que expressará o conjunto de números relactivos.

8.1.2 Relactivos e Índices


Para simplicidade das comparações anteriormente citadas, toma-se um dos conjuntos

como base e atribui-se o valor 100 para cada termo da época, e para ou outros de outra

época, valores proporcionais aos existentes em cada espécie da série origem e na nova

série. Neste caso, diz-se que a base é xa e apresenta a vantagem de se poder observar em

cada espécie a variação expressa em percentagem referida a determinada época. Se numa

série mista que contém várias épocas, os valores das espécies de cada época for referido

sempre à anterior imediata diz-se que a base é variável.

A nova série construída é constituída então, por números obtidos em relação à época

cujos valores forma considerados iguais a 100. Os números que constituem a nova série

são denominados números relactivos

O número representativo do conjunto de valores relactivos de determinada época em

relação a outra ou de local a outro, denomina-se: número índice. Os números índices são

classicados de acordo com o emprego de uma medida de tendência central ou consideradas

as somas dos valores das séries, em:

• Número índice aritmético

• Número índice geométrico

• Número índice harmónico

• Número índice mediano

• Número índice agregativo

Exemplo 8.1.2 Transformar a série de preços da tabela 8.1 em outra de números relac-
tivos tomando como base o ano de 2015. Considerando como 100 o valor de cada espécie
para o ano base 2015 obtém-se os respectivos valores para o ano 2021, mediante a regra
de três simples directa.
(
2−1
• Espécie A : 1×100
100 − a3 ∴ a3 = 2
= 50

Alcides Onésimo Nunda 99 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022
(
6−6
• Espécie B : 6×100
100 − a2 ∴ a2 = 6
= 100
(
1−2
• Espécie B : 2×100
100 − a4 ∴ a4 = 1
= 200

Tabela 8.2: Números Relactivos

Mercadoria em espécie N.Relactivos(Preço- Unit)

2020 2021
A 100 50
B 100 100
C 100 200
Total 300 350

8.1.3 Número Índice Simples e Ponderados


No acontecimento variação de preços, deve-se observar se as espécies estão apenas relaci-

onadas com eles (Tabela 8.1) ou se também com quantidades (Tabela 8.2). Quantidades

que, sendo conhecidas, podem expressar grandezas e valores absolutos, e que, se desco-

nhecidas, obriga em alguns casos a ponderar os preços das espécies de acordo com o valor

destas em ralação ao das outras. É o caso do conjunto da variação do custo de vida onde

os artigos de primeira necessidade recebem ponderações maiores do que os outros e o são

de forma diferente.

Quando as espécies estão apenas relacionadas com os preços, os números índices calculados

são denominados números índices simples e, se ainda, além dos preços são atribuídos
quantidades às espécies, os índices tomam o nome de números índices ponderados.

Tabela 8.3: Números índices simples e ponderados

Espécie 2015 2021

Preço Unit. (p0 ) Quantidades (q0 ) Preço Unit. (pi ) Quantidades (qi )
A 2,00 3 1,00 5
B 6,00 4 6,00 6
C 1,00 8 2,00 7

Número Índice Aritmético

Denição 16 (Número Índice Aritmético) . É a média aritmética dos números re-


lactivos a uma época. De acordo com o especicado pode ser simples ou ponderada.
Alcides Onésimo Nunda 100 Pedro Domingos Chitandula
Notas - Estatística I FEC - UJES/2021-2022

1. Número índice aritmético simples: Seu cálculo se prende ao da média aritmética

simples.Por exemplo para o ano de 2015 da série dada na tabela 8.2 tem-se:

350
Ia = = 116, 67 (8.1.1)
3

e conclui-se que houve um aumento no preço de mercadorias, de 2015 a 2021.

2. Número índice aritmético ponderado: Seu cálculo se pretende ao da média arit-

mética ponderada. Para calcular o seu valor referente a 2021 deve-se primeiramente

transformar a série dada pela tabela 8.3 na série de números relactivos exposta na

tabela 8.4. Calculado-se o índice referente a 2021, uma vez que o referente a 2015 é

igual a 100, tem-se:

Ip = 125 (8.1.2)

e conclui-se que houve aumento nos preços de 2015 a 2021.

Tabela 8.4: Número índice aritmético ponderado

Espécie 2015 2021


o o
N relactivos Quantidades (ton) N relactivos Quantidades (ton)
A 100 3 5 5
B 100 4 100 6
C 100 8 200 7

Número Índice Geométrico

Denição 17 (Número Índice Geométrico) . É a média geométrica dos números


relactivos referentes a uma época. Pode ser simples ou ponderado dependendo da série
ser respectivamente de dados não agrupados ou agrupados.

1. Número índice geométrico simples: Para seu cálculo emprega-se o da média

geométrica simples. Para a série exposta na tabela 8.2, tem-se para o ano de 2021:

Ig = 100 (8.1.3)

e conclui-se que não houve aumento nos preços das mercadorias consideradas em

conjunto.

2. Número índice geométrico ponderado: Para seu cálculo deve-se empregar o

da média geométrica ponderada. Assim, a série de preços expostos na tabela 8.4 a

presenta um aumento deles considerados uma vez que o número índice geométrico

Alcides Onésimo Nunda 101 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

referente a 2015 é 100 e o 2021 é

Igp = 108 (8.1.4)

Número Índice Harmónico

Denição 18 (Número Índice Geométrico) . É a medida geométrica dos números


relactivos referentes a uma época. Também pode ser simples ou ponderado de acordo com
a série a que se refere.

1. Número índice harmónico simples : Seu valor identica-se com o da média har-

mónica simples. Assim, pode-se vericar um decréscimo de preços da série exposta

pela tabela 8.2 mediante os valores de 100 para 2015 e para 2021 de,

Ih = 85, 7 (8.1.5)

2. Número índice harmónico ponderado:É calculado para a média harmónica

ponderada. Para a série de preços fornecida pela tabela 8.4 conrma-se o aumento

de preços, pois que, para 2015 seu valor é 100, e para 2021 tem-se:

Ihp = 110, 1 (8.1.6)

Número Índice Mediano

Denição 19 (Número índice mediano) . A medida de tendência central a ser em-


pregada é a mediana, cujos valores identicam-se. De conformidade com ela, o número
índice mediano pode ser simples ou ponderado.

1. Número índice mediano simples: Verica-se constância de preços na série ex-

posta pela tabela 8.2, uma vez que:

3+1
P = =2 e Im = 100 (8.1.7)
2

2. Número índice mediano ponderado: O cálculo de seu valor é feito de acordo

com o da mediana. Desta forma, verica-se que não houve variação de preços da

tabela 8.4 através do índice mediano de 2021:

Imp = 100 (8.1.8)

Alcides Onésimo Nunda 102 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Número Índice Agregativo Simples

Denição 20 (Número Índice Agregativo Simples) . O número índice agregativo


simples expressa as somas totais dos valores das épocas sobre a soma total 100 considerada
para a época básica. Para a série de preços da tabela 8.1 tem-se, mediante regra de três
simples directa,
9, 00 −→ 9, 00
(8.1.9)
100 −→ I I = 100×9
9
= 100,
o que demonstra pertinência no total dos preços, no conjunto de mercadorias, de 2015
a 2021. De modo geral, pode-se calcular o número índice agregativo simples, mediante
emprego da fórmula
100 × S2
I= (8.1.10)
S1
onde S1 soma total dos valores referentes à época base e S2 é a soma total dos valores da
época desejada.

8.1.4 Índice Agregativos Ponderados. Fórmulas de Laspeyres,


Egeworth e de Marshall, de Paasche e de Ficher
Para eliminar ou atenuar causas que inuem sensivelmente, foram propostas fórmulas

ao cálculo de números índices agregativos ponderados. Números esses que expressam

as somas dos produtos dos preços pelas quantidades de uma época dada, sobre a soma

100 dos referidos produtos da época básica. Dessa forma, considerando que as épocas

apresentam-se com quantidades diferentes de uma mesma espécie e sendo:

• q0 = quantidades das espécies na época-base;

• p0 = preços das espécies na época-base;

• qi = quantidades das espécies em uma época qualquer dada;

• pi = preços das espécies em uma época qualquer dada.

Têm-se as fórmulas a seguir discriminadas:

Fórmula de Laspeyres

Denição 21 (Fórmula de Laspeyres) . Obtém-se a fórmula de Laspeyres mediante


a regra de três simples directa e supondo, iguais as quantidades de cada espécie em todas

Alcides Onésimo Nunda 103 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

as épocas:
X X
p0 q0 − pi q i
100 −→ I

onde P
pi qi
I = 100 P
p0 q0
e sendo qi = q0 tem-se: P
p i q0
I = 100 · P (8.1.11)
p0 q 0

Exemplo 8.1.3 Para a série considerada na tabela 8.3 verica-se a oscilação ascendente
de preços, no conjunto de mercadorias, traçando mais duas colunas onde são calculados
respectivamente os produtos p0 q0 e pi qi cujas somas p0 q0 = 38, pi q0 = 43. valores
P P

esses que levados na fórmulas citada:

43
I = 100 · × = 113, 2 (8.1.12)
38

Fórmula de Marshall e Egeworth

Denição 22 (Fórmula de Marshall e Egeworth) . O cálculo do índice agregativo


ponderado se prende ao emprego da fórmula;
P
(qi + q0 )pi
I = 100 · P (8.1.13)
(q0 + qi )p0

Exemplo 8.1.4 Para série dada pela tabela 8.3 deve-se traçar mais colunas, a m de se
determinar o número índice desejado, sendo que em uma delas calculam-se as somas das
quantidades para cada espécie (q0 + qi ) e nas outras calculam-se os produtos das somas
das quantidades de cada espécie pelos respectivos preços. Obtendo-se respectivamente:
X
(q0 + qi )pi = 98
X
(q0 + qi )p0 = 91

valores que levados na fórmulas citada

98
I = 100 · = 107, 6 (8.1.14)
91

que demonstra o aumento havido nos preços das mercadorias consideradas em conjunto.

Alcides Onésimo Nunda 104 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Fórmula de Paasche

Denição 23 (Fórmula de Paasche) . O número índice agregativo é obtido com o


emprego da seguinte fórmula: P
pi qi
I = 100 · P (8.1.15)
po qi

Exemplo 8.1.5 Para a série exposta na tabela 8.3 usa-se a disposição indicada na fór-
mula de Laspeyres, considerando na última coluna referente ao ano de 2015 os produtos de
sues preços pelas quantidades de 2021. Obtidas as somas e empregando a fórmula tem-se:

55
I = 100 · = 103, 7 (8.1.16)
53

e ca vericada a variação para mais, já referida.

Fórmula de Ficher

Das fórmulas citadas, a que mais satisfaz às diversas provas, quanto à sua exatidão é a de

Ficher, obtida pela média geométrica das de Laspeyres e de Paasche


sP P
pi q 0 pi q i
I = 100 · P ·P (8.1.17)
p 0 q0 p0 qi

Mediante o emprego dessa fórmula na série exposta pela tabela 8.3, verica-se oscilação

reinante nos preços do conjunto de mercadorias. Tem -se sucessivamente:

r
43 55
I = 100 · · = 108, 4 (8.1.18)
38 53

Observação 8.1.1 Sendo difícil de obter de imediato os valores das quantidades qi ,


consideram-se então as quantidades q0 iguais em todas as épocas para cada espécie e
emprega-se a fórmula de Laspeyres.

8.1.5 Número Índice em Cadeia


Uma sequência de épocas, se cada número relactivo é calculado em referência à época

anterior imediata, tem-se então os números índices em cadeia. Apresentam vantagem

de facilitar a comparação dos preços em duas épocas consecutivas, eliminado a necessidade

de se recorrer a escolhida como base. Designando por I1 , I2 , ·, In os números respectivos de


n épocas, considerada a base 100 para a primeira época, a partir de percentagens tem-se

para o cálculo os números índices em cadeia:

Alcides Onésimo Nunda 105 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• Segunda Época:

100 −→ I2
I1 −→ I20

sendo
I1 I2
I20 = (8.1.19)
100

• Terceira Época:

100 −→ I3
I20 −→ I30

sendo
I20 I3
I30 = (8.1.20)
100

• n Época:

100 −→ In
0
In−1 −→ In0

sendo
0
In−1 In
In0 = (8.1.21)
100

8.2 Noções de Demograa


8.2.1 Conceito
O estudo das características, do modo de vida, das relações entre diversos grupos, e da

evolução de um povo é feito pela Demograa. Adolpho Quetelet (1796 - 1874), procurou

estabelecer uma espécie de Física social, empregando trabalhos de seus antecessores, nos

fenómenos demográcos e procurando estabelecer as leis das relações sociais. Porém, foi

Bertillon que lançou as bases da Demograa como ciência autónoma.

A demograa classica-se em:

1. Demograa Estática: É a parte da demograa que estuda em determinado tempo,

as características, modo de vida e relações entre os diversos grupos de um povo. As

Alcides Onésimo Nunda 106 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

relações entre os diversos grupos podem ser obtidas pelas densidades demográ-
cas que são:

(a) Densidade aritmética: Razão por quociente entre o efectivo da população,

e a superfície total do território.

(b) Densidade siológica: Razão por quociente entre o número de habitantes e

a superfície de terras produtivas, excluindo as orestas.

(c) Densidade agrária: Razão por quociente entre a população agrícola e a

superfície de terras produtivas.

2. Demograa Dinâmica: É a parte da demograa que estuda a evolução de um

povo. Esta evolução pode ser observada através dos nascimentos, casamentos, óbi-

tos, migrações, mortalidade e sobrevivência.

• A natalidade, nupcilidade e mortalidade, são expressas por taxas, consi-

derando sobre 1 000 habitantes, respectivamente os números de nascidos vivos,

de casamentos realizados e de mortes.

• As migrações são classicadas em internacionais que podem ser emigração


(saída de indivíduos de um país), imigração (entrada de indivíduos em um

país) e internas que consiste no deslocamento contínuo ou periódico de

indivíduos nas regiões de um país.

8.2.2 Taxa de Crescimento


Os valores de uma série cronológica ou marcha podem-se apresentar segundo relações

suscetíveis de denir. Assim, os valores representativos dos efectivos de uma população

podem ser dispostos em um gráco e segundo a tendência geral, apresentar um crescimento

positivo (aumenta), negativo (diminui) e nulo (estacionário). Esse crescimento pode ser

observado através das taxas: Taxa de crescimento absoluto; Taxa de crescimento médio;

Taxa de crescimento relactivo.

Taxa de Crescimento Absoluto (T)

Denição 24 (Taxa de crescimento absoluto (T)) . A taxa de crescimento abso-


luto de uma série cronológica é a diferença entre dois valores consecutivos da variável
dependente, respectivamente posterior e anterior. Se a taxa de crescimento for:

• T > 0 tem-se crescimento positivo.

• T < 0 tem-se crescimento negativo.

Alcides Onésimo Nunda 107 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• T = 0 tem-se crescimento nulo

No caso de o crescimento ser positivo ou negativo admite-se para prazos curtos cresci-
mento aritmético (os valores crescem em progressão aritmética) e crescimento geo-
métrico (os valores crescem em progressão geométrica) e para prazo longo ( os valores

crescem segundo linhas curvas e entre elas de preferência a logística).

Taxa de Crescimento médio ou anual (t)

Denição 25 (Taxa de crescimento médio anual (t)) . É a rezão por quociente en-
tre a taxa de aumento absoluto e o número de anos decorridos no intervalo de tempo ob-
servado. No crescimento aritmético esta taxa se identica com a razão de uma progressão
aritmética. Assim considerando

• p = população em um período inicial.

• P = população em um período consecutivo.

• n = número de anos decorridos no período

• t = taxa de crescimento anual.

Recorrendo a fórmula do termo geral de uma progressão aritmética, tem-se:

P −p
P = p + nt =⇒ t = (8.2.1)
n

Taxa de Crescimento Relactivo (tr )

Denição 26 (Taxa de crescimento relactivo (tr )) . A taxa de crescimento relac-


tivo é a razão por quociente entre a taxa média e o primeiro valor considerado da variável
dependente,
t
tr = (8.2.2)
p

• Crescimento aritmético: A razão da progressão aritméica é igual a ptr porque:

t = ptr e a fórmula da progressão cará:

P −p
P = p + ptr n ⇒ tr = (8.2.3)
pn

• Crescimento geométrico: Para prazos curtos é mais signicativo supor que para

efectivos cada vez maiores o acréscimo não seja constante, e sim que os valores

Alcides Onésimo Nunda 108 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

variem segundo uma progressão geométrica de razão q e cuja fórmula do termo

genérico será

P = pq n (8.2.4)

E a taxa de acréscimo será obtida mediante a fórmula:

s
n
P
q= (8.2.5)
q

Observação 8.2.1 Pode-se calcular a taxa de crescimento geométrico aplicando loga-


ritmo à fórmula da progressão geométrica:

log P = log p − n logq (8.2.6)

Alcides Onésimo Nunda 109 Pedro Domingos Chitandula


Capítulo 9

Probabilidades

9.1 Teoria de Probabilidades


As variáveis económicas são, por sua própria natureza, aleatórias. Não sabemos quais

serão seus valores senão depois de observá-los. A probabilidade é uma forma de expressar

a incerteza sobre eventos e resultados económicos. Consequentemente, neste capítulo,

faremos o estudo minucioso da teoria de probabilidades, que serão utilizados em matérias

dos anos posteriores do curso.

Não se pode falar da história da Estatística, sem falar em probabilidades. Estas tiveram

sua origem no estudo dos jogos de azar., já conhecido pelos Egípcios 3500 a.C. Mas só no
século XVI se assiste à primeira tentativa de desenvolver uma teoria de probabilidades.

Cardano considerado um verdadeiro cientista da Época Renascentista, escreveu sobre

todas as áreas de estudo da época, incluindo a matemática, a teologia, cosmologia e a

medicina. Tendo sido, um dos primeiros a tentar descrever um método de cálculo das

probabilidade, bem como, as suas leis básicas. Com o seu livro "The book on games of
chance ", Cardano, não só explica as leis da probabilidade como analisa os jogos de azar

e ensina a jogar e a detectar os batoteiros.

9.1.1 Conceitos da Teoria de Probabilidades


Experiência Aleatória

Uma experiência aleatória é o processo de observação ou de acção, cujos resultados, em-

bora podendo ser descritos no seu conjunto, não são determináveis à priori, antes de

realizada a experiência. As características de uma experiência aleatória são:

110
Notas - Estatística I FEC - UJES/2021-2022

• A possibilidade de repetição da experiência em condições uniformes;

• Não se pode armar à partida qual o resultado (fenómeno aleatório) da experiência

a realizar, mas poder descrever o conjunto de todos os resultados possíveis;

• A existência de regularidade quando a experiência é repetida muitas vezes.

Espaço de Resultados

É o conjunto de todos os resultados possíveis de uma determinada experiência aleatória,

e representa-se por Ω.

Acontecimentos

É o conjunto de resultados possíveis de uma experiência aleatória. Qualquer subconjunto

do espaço de resultados é um acontecimento denido em Ω (eventualmente o próprio Ω


ou o conjunto vazio ∅).

Não se deve confundir acontecimento com resultado. Enquanto que o primeiro signica

algo que a experiência aleatória pode produzir, mas não se realiza necessariamente, um re-

sultado indica algo que a experiência aleatória produziu. Ou seja, o conceito de resultado

só tem sentido depois de realizada a experiência, enquanto que o conceito de aconteci-

mento tem pleno sentido mesmo antes da experiência aleatória se realizar.

Um acontecimento A diz-se elementar se a sua realização depender da ocorrência de so-

mente um resultado especíco da experiência aleatória. Por outro lado, um acontecimento

diz-se complexo ou composto se a sua realização implica a ocorrência de um resultado da

experiência aleatória.

9.1.2 Álgebra dos Acontecimentos


Na secção anterior, deniu-se acontecimento como um conjunto de resultados possíveis

de uma experiência aleatória. Esta denição sugere que podemos utilizar todos os ins-

trumentos da teoria dos conjuntos para representar os acontecimentos e as operações que

se denem sobre estes. Por exemplo, o diagrama de Venn revela-se de extrema utilidade

na representação de acontecimentos: o conjunto universal é identicado como o espaço

de resultados Ω da experiência aleatória e cada acontecimento A por uma região interior

a Ω. Do mesmo modo, o diagrama de Venn pode ser usado para representar de forma

Alcides Onésimo Nunda 111 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

simplicada as operações que se denem sobre acontecimentos: união ou soma lógica,

intersecção ou produto lógico e diferença.

Figura 9.1: Representação de acontecimento

Denição 27 Sejam A e B dois acontecimentos, dene-se um novo acontecimento união


de A com B (A ∪ B ), ou soma lógica de A com B , traduzido por

A ∪ B = {ω : ω ∈ A ∨ ω ∈ B} (9.1.1)

isto é, A ∪ B consiste na realização de pelo menos um dos acontecimentos.

A operação união de acontecimentos pode ser generalizada a mais de dois acontecimen-

tos. Dada uma sucessão innita de acontecimentos A1 , A2 , ..., An , ... dene-se a sua união
S∞
i=1 Ai como sendo o acontecimento que ocorrerá se e somente se ocorrer pelo menos um

dos acontecimentos Ai .

Figura 9.2: União de acontecimentos

Denição 28 Dados dois acontecimentos A e B , dene-se intersecção ou produto lógico


de A com B , simbolicamente representada por A ∩ B , como o acontecimento que ocorre

Alcides Onésimo Nunda 112 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

se, e só se,ocorrerem A e B (em simultaneidade ou em sequência):

A ∩ B = {ω : ω ∈ A ∧ ω ∈ B∧} (9.1.2)

Figura 9.3: Intersecção de acontecimentos

De modo análogo, essa operação também pode ser generalizada a um conjunto, nito ou

innito, de acontecimentos.

Dada uma sucessão innita de acontecimentos A1 , A2 , A3 , ..., An , ... dene-se a sua inter-
T∞
secção i=1 Ai como sendo o acontecimento que se realiza se, e só se, ocorrem todos os

acontecimentos Ai .
Quando determinados acontecimentos que não podem ocorrer simultaneamente, a sua in-

tersecção é um acontecimento impossível, isto é, corresponde a um conjunto vazio. Estes

acontecimentos chamam-se mutuamente exclusivos ou incompatíveis. A sua representação

no diagrama de Venn é:

Figura 9.4: Acontecimento impossível

Denição 29 A diferença de dois acontecimentos A e B , ou acontecimento diferença


A − B ou A \ B é o acontecimento que se realiza quando ocorre A mas não B . Será ,

Alcides Onésimo Nunda 113 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

assim o acontecimento constituído por todos os elementos de A que simultaneamente não


pertencem a B , ou seja:

A − B = A \ B = {ω : ω ∈ A ∧ ω ∈
/ B} (9.1.3)

Diagramaticamente, No caso particular da diferença de dois acontecimentos A e B , em que

Figura 9.5: Diferença de Acontecimentos

A é o próprio espaço de resultados, o acontecimento diferença denomina-se complementar


de B , representa-se por B e é o acontecimento que ocorre quando não ocorre B :

Ω − B = B = {ω : ω ∈ Ω ∧ ω ∈
/ B} (9.1.4)

A sua representação pelo diagrama de Venn é:

Figura 9.6: Acontecimento complementar

Proposição 9.1.1 Propriedades das operações Abaixo apresentamos as propriedades mais


importantes das operações de união e intersecção de acontecimentos.

Alcides Onésimo Nunda 114 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Tabela 9.1: Propriedades das operações

Propriedades União Intersecção


1. Comutativa A∪B =B∪A A∩B =B∩A
2. Associativa A ∪ (B ∪ C) = (A ∪ B) ∪ C A ∩ (B ∩ C) = (A ∩ B) ∩ C
3. Distribuitiva A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
4. Idempotência A∪A=A A∩A=A
5. Lei do complemento A∪A=Ω A∩A=∅
6. Leis de De Morgan A∪B =A∩B A∩B =A∪B
7. Elemento neutro A∪∅=A A∩Ω=A
8. Elemento absorvente A∪Ω=Ω A∩∅=∅

9.1.3 Conceitos de Probabilidade


A probabilidade é uma medida da certeza da ocorrência de um determinado aconteci-

mento. Nas áreas económica e de gestão, os diferentes conceitos de probabilidade são

largamente utilizados. Por exemplo, quando o ministro das nanças de Angola arma

que a inação no corrente ano não ultrapassará 4% ou quando se arma que a diversi-

cação da economia terá um forte peso na redução do nível de importações.

As probabilidades fornecem aos gestores e economistas as bases para a tomada de deci-

são, quando existe incerteza sobre a evolução futura e sobre os efeitos práticos das suas

decisões, isto é, quando a partir do passado não é possível prever deterministicamente o

futuro, devido à inuência do acaso, sendo no entanto possível prever as linhas de evolu-

ção futura e as possibilidades de estas se concretizarem. Podemos denir três conceitos

de probabilidade: clássica, empírica ou frequencista e subjectiva. As probabilidades que

se baseiam nas características intrínsecas dos acontecimentos são denidas segundo o con-

ceito clássico; aquelas que se baseiam numa quantidade razoável de evidência objectiva

são impíricas ou frequencistas; enquanto que as probabilidades denidas com base em

crenças ou opiniões individuais se denominam subjectivas.

Denição 30 (Conceito clássico) A probabilidade de um conjunto A é a fracção n(A)


N
,
tal que,
n(A)
P (A) = (9.1.5)
N
onde:

n(A) - números de resultados favoráveis a A


N - número de resultados possíveis.

Exemplo 9.1.1 Consideremos a experiência aleatória que consiste no lançamento de um


dado. Seja A o acontecimento: obter um número ímpar na face superior do dado. O

Alcides Onésimo Nunda 115 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

espaço de resultados será constituído por ω = {1, 2, 3, 4, 5, 6}. E o acontecimento será:


A = {1, 3, 5}.

• O número de resultados favoráveis: n(A) = 3.

• O número de resultados possíveis: N = 6

• A probabilidade de A será:

n(A) 3 1
P (A) = P (A) = = =
N 6 2

Denição 31 (Conceito frequencista) Se em N realizações de uma experiência, o


acontecimento A se vericou n vezes, diz-se que a frequência relativa de A nas N re-
alizações é,
n
fA = , (9.1.6)
N
sendo fA a frequência relativa do acontecimento A.

Ao número para que tende a frequência relativa fA , quando se aumenta o número de

provas, chama-se probabilidade do acontecimento A:

P (A) = lim fA (9.1.7)


N →∞

Isto equivale a aceitar que numa sucessão numerosa de experiências é praticamente certo

que a frequência relativa de A seja aproximadamente igual a P (A).

Exemplo 9.1.2 A experiência aleatória que consiste na observação do sexo de um recém-


nascido pode considerar-se o exemplo típico para aplicação do conceito frequencista de
probabilidade. Porque esta experiência já se realizou inúmeras vezes e existem registos do
seu resultado, sabe-se que a probabilidade do sexo do recém-nascido ser masculino é de
aproximadamente 0, 52 e de ser feminino é de cerca de 0, 48.

Denição 32 (conceito subjectivo ou personalista)


Utilizando este conceito, a probabilidade de um acontecimento é dada pelo grau de credi-
bilidade ou de conança que cada pessoa dá à realizações de um acontecimento.

Exemplo 9.1.3 Se o ministro das nanças armasse que a inação para o próximo ano
será de 3% com uma probabilidade de 0, 9, estaria a aplicar o conceito subjectivo ou
personalista de probabilidade.

Alcides Onésimo Nunda 116 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

9.1.4 Axiomas da Teoria das Probabilidades


Da necessidade de sistematização dos conceitos empregues na Teoria das Probabilidades

e da construção de um corpo teórico coerente surgem três axiomas. Assim, consideremos

que P (·) é uma função que associa a todo o acontecimento A denido em Ω um número

compreendido no intervalo [0, 1] e que satisfaz os seguintes axiomas:

Axiomas 1 1. P (A) ≥ 0 ∀A ⊆ Ω

2. P (Ω)=1 (Ω é o acontecimento certo)

3. Sendo A e B acontecimentos mutuamente exclusivos denidos em Ω, ou seja A∩B =


∅, tem-se que:
P (A ∪ B) = P (A) + P (B). (9.1.8)

Generalizando, sendo A1 , A2 , ..., An acontecimentos mutuamente exclusivos denidos


em Ω, tem-se que "n #
[ Xn
P Ai = P (Ai ). (9.1.9)
i=1 i=1

Com base nestes axiomas é possível demonstrar vários teoremas, tais como:

Teorema 9.1.2 Dado um acontecimento A com probabilidade P (A), a probabilidade do


seu complementar obtém-se subtraindo à unidade a probabilidade de A, i.é:

P (A) = 1 − P (A). (9.1.10)

Exemplo 9.1.4 Numa ferira do sector de telecomunicações foram cadastradas 50 em-


presas. A organização prevê sortear um prémio para as empresas participantes. Qual
a probabilidade de uma empresa, que tenha instalado 4 tendas de exposição ganhar o
prémio? E a probabilidade de não ganhar?

• Probabilidade da empresa ganhar o prémio: n(A) = 4, N = 50:

n(A) 4
P (A) = = = 0, 08 (8%)
N 50

• A probabilidade de a empresa não ganhar o prémio:

 Acontecimento favorável A: ganhar o prémio.


 Acontecimento complementar A: não ganhar o prémio.
 Então:
P (A) = 1 − P (A) = 1 − 0, 08 = 0, 92 (92%)

Alcides Onésimo Nunda 117 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Teorema 9.1.3 A probabilidade do acontecimento impossível é zero, i.é,

P (∅) = 0 (9.1.11)

Teorema 9.1.4 Dados dois acontecimentos quaisquer A e B , a probabilidade do aconteci-


mento diferença B−A obtém-se pela diferença entre a probabilidade de B e a probabilidade
da intersecção de A com B , ou seja,

P (B − A) = P (B) − P (A ∩ B). (9.1.12)

Teorema 9.1.5 A probabilidade da união de dois acontecimento quaisquer, A e B , obtém-


se somando as suas probabilidades e deduzindo a probabilidade da sua intersecção, isto é,

P (A ∪ B) = P (A) + P (B) − P (A ∩ B). (9.1.13)

Exemplo 9.1.5 No lançamento de um dado, consideramos o acontecimento A = {1, 2, 5, 6}


e o acontecimento B = {2, 4, 6}

• Os acontecimentos não são mutuamente exclusivos, pois a intersecção de A e B não


é um conjunto vazio: A ∩ B = {2, 6}.

• P (A) = 64 , P (B) = 3
6
, P (A ∩ B) = 62 .

P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
4 3 3 5
= + − =
6 6 6 6
5
P (A ∪ B) =
6
Corolário 9.1.1 Sendo A e B acontecimentos quaisquer,

P (A ∪ B) ≤ P (A) + P (B). (9.1.14)

Teorema 9.1.6 (generalização do 9.1.5 a mais de dois acontecimentos)


Sejam A1 , A2 , ..., An acontecimentos quaisquer denidos em Ω. Então
" n
#
[
P (A1 ∪ A2 ∪ A3 ∪ ... ∪ An ) = P Ai = (9.1.15)
i=1
n
X n−1 X
X n
= P (Ai ) − P (Ai ∩ Aj )+
i=1 i=1 j=i+1
n−2 X
X n−1 n
X
+ P (Ai ∩ Aj ∩ Ak ) + ...+
i=1 j=i+1 k=j+1

+ ... + (−1)n+1 P (A1 ∩ A2 ∩ ... ∩ An )

Alcides Onésimo Nunda 118 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

9.1.5 Probabilidades Condicionas


A partir do momento em que se conhece a probabilidade do acontecimento B (do espaço de
resultados Ω) ocorrer, é possível calcular a probabilidade de qualquer outro acontecimento
A se realizar condicionado pelo acontecimento B .

Denição 33 Probabilidade condicionada é dada por

P (A ∩ B)
P (A \ B) = , se P (B) > 0 (9.1.16)
P (B)

isto é, a probabilidade de um acontecimento (A)condicionado pela ocorrência de outro (B )


é igual ao quociente entre a probabilidade de ambos se realizam (A ∩ B ) e a probabilidade
do acontecimento dado.

Axiomática e Teoremas da Teoria das Probabilidades na Probabilidade Con-


dicionada

O conceito de probabilidade condicionada satisfaz todos os axiomas da teoria das probabi-

lidades apresentada anteriormente. Assim, sendo B um acontecimento tal que P (B) > 0:

Teorema 9.1.7
P (B \ A) ≥ 0 (9.1.17)

Teorema 9.1.8
P (Ω \ B) = 1 (9.1.18)

Teorema 9.1.9 Se A1 e A2 são mutuamente exclusivos, isto é, A1 ∩ A2 = ∅, então:

P [(A1 ∪ A2 )|B] = P (A1 \ B) + P (A2 |B) (9.1.19)

9.1.6 Probabilidade da Intersecção de Acontecimentos. Aconte-


cimentos Independentes
Probabilidade da Intersecção de Acontecimentos

A probabilidade de intersecção de dois acontecimentos. A e B, decorre da probabilidade

condicionada. De acordo com a denição de probabilidade condicionada resulta que

P (A ∩ B)
P (A \ B) = (9.1.20)
P (B)

Alcides Onésimo Nunda 119 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

e
P (A ∩ B)
P (B \ A) = (9.1.21)
P (A)
Assim, das duas igualdades anteriores tem-se que:

P (A ∩ B) = P (A \ B) · P (B) (9.1.22)

ou

P (A ∩ B) = P (B \ A) · P (A) (9.1.23)

Acontecimentos Independentes

O conceito de acontecimentos independentes tem estrita relação com a probabilidade

condicionada. Assim, se para dois acontecimentos A e B suceder que que a ocorrência ou

não de algum deles não afecta a probabilidade de ocorrer o outro, i.é, se

P (A \ B) = P (A) ouse P (B \ A) = P (B) (9.1.24)

então A e B consideram-se acontecimentos independentes.

De modo equivalente, diz-se que A e B são independentes se e só se a seguinte condição

for vericada:

P (A ∩ B) = P (A) · P (B) (9.1.25)

i.é, se a probabilidade da sua intersecção for igual ao produto das probabilidades de

cada um deles. Para dois acontecimentos independentes, se podem enunciar os seguintes

teoremas:

Teorema 9.1.10 Se A e B são acontecimentos independentes, então:

1. A e B também o são;

2. A e B também o são;

3. A e B também o são.

Teorema 9.1.11 Sejam os acontecimentos A1 , A2 , ..., An , dizem-se independentes se se

Alcides Onésimo Nunda 120 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

vericarem simultaneamente as seguintes condições:

P (Ai ∩ Aj ) = P (Ai ) · P (Aj ) ∀i, j = 1, 2, ..., n com i 6= j (9.1.26)

P (Ai ∩ Aj ∩ Ak ) = P (Ai ) · P (Aj ) · P (Ak ) ∀i, j, k = 1, 2, ..., n, com i 6= j, i 6= k, j 6= k ......


n
! n
\ Y
P = P (Ai )
i=1 i=1

Exemplo 9.1.6 O Ministério da Economia de Angola acredita que a probabilidade da


inação car abaixo de 3 % nos próximos cinco anos é de 0,20; entre 3 % e 4 % é de
0,45 e acima de 4 % é de 0,35. O Ministério acredita que, com inação abaixo de 3 %, a
probabilidade de se criar mais 200.000 empregos é de 0.6, diminuindo essa probabilidade
para 0,3 caso a inação que entre 3 % e 4 %; no entanto, com inação acima de 4 %,
isso é totalmente impossível. Um economista prevê que a criação desses 200.000 empregos
novos no nal do período só será possível se a inação car entre 3 % e 4 %?. Qual é a
probabilidade de a inação car entre 3 % e 4 % e serem criados esses empregos?

• Sejam denidos os seguintes acontecimentos:

 A = Inação abaixo de 3%; B = Inação entre 3% e 4%.


 C = Inação acima de 4% e D = Criar mais 200.000 empregos.

• Pelos dados temos:

P (A) = 0, 20, P (B) = 0, 45, P (C) = 0, 35;


P (D \ A) = 0, 6, P (D \ B) = 0, 3, P (D \ C) = 0

• Então:
T
P (B D 0, 45 × 0, 3
P (B \ D) = = = 0.529.
P (D) (0, 20 × 0, 6) + (0, 45 × 0, 3) + (0, 35 × 0)

• A probabilidade de a inação car entre 3% e 4% no nal do período é de 52, 9%.

Exemplo 9.1.7 Suponha que uma loja dispõe se de dois produtos substitutos, a prefe-
rência do produto A pelos Clientes é de 46.67%, do produto B é de 55% e de ambos os
produtos é de 21.67%.

• Sendo os acontecimentos:

P (A) = 0, 466, P (B) = 0, 55, P (A ∩ B) = 0, 2167

Alcides Onésimo Nunda 121 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

• Se um cliente é escolhido ao acaso, probabilidade de :

 Preferir o produto A ou B é dada por:

P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
= 0, 466 + 0, 55 − 0, 2167 = 0, 7993 (79, 93%)

 Preferir somente o produto A é dada por :

P (A ∩ B)A = P (A ∪ B) − P (B) = 0, 7993 − 0, 55 = 0, 2493 (24, 93%)

 Preferir o produto A na condição de ser usuário do produto B é dada por:

P (A ∩ B) 0, 2167
P (A \ B) = = = 0, 3494 (34, 94%).
P (B) 0, 55

9.1.7 Teorema da Probabilidade Total e Fórmula de Bayes


O conceito de probabilidade condicionada revela-se muito importante e de larga utilização

quando se conhecem probabilidades condicionadas nas quais os acontecimentos condicio-

nantes denem uma partição em Ω.

Denição 34 Diz-se que os acontecimentos A1 , A2 , ..., An denem uma partição em Ω,


quando se vericam simultaneamente as seguintes condições:

1. A união de todos os acontecimentos é o próprio espaço de resultados:


n
[
Ai = Ω (9.1.27)
i=1

2. Os acontecimentos são mutuamente exclusivos, dois a dois:

Ai ∩ Aj = ∅ i 6= j, i, j = 1, 2, ..., n. (9.1.28)

3. Todos os acontecimento têm probabilidade não nula

P (Ai ) > 0 i = 1, 2, ..., n. (9.1.29)

Teorema 9.1.12 (probabilidade total)


Se os acontecimentos A1 , A2 , ..., An denem uma partição sobre Ω, então para qualquer

Alcides Onésimo Nunda 122 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

acontecimento B denido em Ω tem-se que:


n
X
P (B) = P (B\Ai )×P (Ai ) = P (B\A1 )×P (A1 )+P (B|A2 )×P (A2 )+...+P (B\An )×P (An )
i=1
(9.1.30)

Teorema 9.1.13 (fórmula de Bayes)


Se A1 , A2 , ..., An denem uma partição sobre Ω, então, para B denido em Ω:

P (Aj ) × P (B \ Aj )
P (Aj \ B) = Pn , j = 1, 2, ..., n (9.1.31)
i=1 P (Ai ) × P (B \ Ai )

Exemplo 9.1.8 O departamento de recurso humano de uma empresa do Huambo esco-


lhe estagiários oriundos da Faculdade de Economia. No primeiro curso, a proporção de
estudantes com boa formação em Contabilidade e Auditoria é de 60%, enquanto no curso
de Economia, essa proporção cai para 45%. Um estagiário acaba de ser contratado. A
probabilidade de que tenha boa formação em Contabilidade é Auditoria é de 50%. Qual é
a preferência (probabilidade) do departamento pelo primeiro curso?

• A = Curso de Contabilidade e Auditoria; B = Curso de Economia e C = Boa


formação em Contabilidade.

• Pelos dados temos: P (C \ A) = 0, 60; P (C \ B) = 0, 45 e P (C) = 0, 50

• Pretende-se, determinar P (A))

• Pelo teorema da probabilidade total temos:

P (C) = P (A ∩ C) + P (B ∩ C)
P (C) = P (A) × P (C \ A) + P (B) × P (C \ B)
0, 50 = P (A) × 0, 60 + 0, 45 × [1 − P (C \ A)]
0, 50 = 0, 60 × P (A) + 0, 45 − 0, 45 × P (A)
0, 05
P (A) = = 0, 333 (33, 3%)
0, 15

• A preferência do departamento pelo primeiro curso é de 33, 3%.

Exemplo 9.1.9 Um empresário é conhecido por ser muito cauteloso com relação a suas
informações. Ele tem um registro minucioso da composição de cada área de sua empresa
e sabe que:
Sabendo que ele realiza uma visita surpresa dum dos departamentos, escolhendo ale-
atoriamente um deles e consegue identicar de modo imediato um Técnico Médio. Qual

Alcides Onésimo Nunda 123 Pedro Domingos Chitandula


Notas - Estatística I FEC - UJES/2021-2022

Departamento Técnico Superior Técnico Médio Técnico Básico


Finanças 2 3 4
Jurídico 3 2 2
Contabilidade 4 1 1

é a probabilidade de ser do departamento de contabilidade? Assuma que os três departa-


mentos são igualmente prováveis de serem visitados (as portas das salas são idênticas e
equiprováveis).

• Seja os acontecimentos:

 A = Departamento de Finanças,
 B = Departamento Jurídico,
 C = Departamento de Contabilidade
 D = Técnico Superior
 E = Técnico Médio
 F = Técnico Básico

• Pelos dados temos: P (A) = P (B) = P (C) = 1


3
, P (E\C) = 1
6
, P (E\A) = 4
9
,
P (E\B) = 27 .

• Pede-se P (C\E). Aplicando o teorema de Bayes, temos:

(C ∩ E)
P (C\E) =
P (C ∩ E) + P (B ∩ E) + P (A ∩ E)


1
× 16
3
P (C\E) = 1 = 0, 186
3
× 61 + × 49 + 31 ×
1
3
2
7

• A probabilidade de ser do departamento de contabilidade, dado que na sua visita


identicou um técnico médio é de 18, 6%.

Alcides Onésimo Nunda 124 Pedro Domingos Chitandula


Referências Bibliográcas

a
• Correira, S. M. (2003). Probabilidade e Estatística (2 ed.). Belo Horizonte: Puc

Minas.

a
• Farber, Larson. (2010). Estatística Aplicada (4 Ed.).
a
• Homam, R. (2006). Estatística para Economistas (4 ed.). São Paulo: Cengage

Learning.

• Kazmier, Leonard J. (2004) Estattídtica Aplicada à Economia e Administração.

a
• Moreira, J. d. (1964). Elementos de Estatítica (2 ed.). São Paulo: ATLAS S/A.

• Morettin, L. G. (2010). Estatística Básica: Probabilidade e Inferência. São Paulo:

Perarson.

• Murteira, Bento et al. (2010) Introdução à Estatística.

• Ris, Elizabeth, et al.(1995). Estatística Aplicada Vol. 1.

• Ris, Elizabeth, et al. (1995). Estatística Aplicada Vol. 2.

• Sivestre, A. L. (2007). Análise de Dados e Estatítica Descritiva. Lisboa: Escola

Editora.

• Tiboni, C. G. (2010). EStatística Básica. São Paulo: Atlas S.A.

125

Você também pode gostar