Notas - Estatística I - Fec

FACULDADE DE ECONOMIA DA UJES
DEPARTAMENTO DE MÉTODOS QUANTITATIVOS
NOTAS DE ESTATÍSTICA I - ANO lECTIVO 2021/2022
Docentes:
Alcides Onésimo Nunda (Regente)
Belchior Xavier Mário
Pedro Domingos Chitandula
Ivanoy Albano Lucas.
Huambo/2021 - 2022
Apresentação
A cadeira Estatística I, também denominada Estatística Básica ou Descritiva, é lecionada

o
no 2 ano da Faculdade de Economia do Huambo da Universidade José Eduardo dos San-
tos, tem como nalidade munir o estudante de conhecimentos iniciais sobre a Estatística
Descritiva, começando pelos conceitos fundamentais e terminando com as probabilidades.
Mais do que simplesmente ensinar, pretende-se que os estudantes possam: (i) despertar e
estimular o interesse pelo método estatístico; (ii) utilizar uma linguagem simples e aces-
sível, apresentar os conceitos e métodos de análise estatística de modo mais intuitivo e
formal; (iii) acompanhar a apetência teórica, exemplos e exercícios apropriados a cada
situação. Ainda, oferece diversos instrumentos matemáticos utilizados em várias áreas da
economia, como são os casos de, Econometria, Estatística II, Teoria Económica, Investi-
gação Operacional, Matemática Aplicada à Economia, Economia Regional, Contabilidade
Nacional, Análise e Avaliação de Projectos de Investimentos, Macroeconomia Microecono-
mia, entre outras. Para melhor compreensão, o estudante deve ter uma adequada destreza
em manejar operações matemáticas básicas, por isso tem como precedência as cadeiras
de Análise Matemática I e Análise Matemática II.
Estas notas servirão como texto de apoio da cadeira no presente ano lectivo. A sua
elaboração obedeceu um aceitável nível de rigor que esta área de conhecimento exige e
maior parte dos dados utilizados, tiveram como fonte os dados ociais do INE-Instituto
Nacional de Estatística. Para um processo de ensino-aprendizagem mais efectivo, cada
secção/capítulo será acompanhada de uma folha de exercícios que ajudarão os estudantes
a aplicar os conteúdos teóricos aprendidos e ampliar a sua dimensão de entendimento,
por isso se aconselha que cada estudante resolva o maior número possível de exercícios.
Nosso profundo agradecimento ao docente Licenciado Pedro Domingos Chitandula pelo
apoio ao regente da cadeira na concepção e digitalização do texto.
Pelo DEIMQ
Alcides Onésimo Nunda, MSc.
Professor Auxiliar
2
Conteúdo
1 A Estatística 1
1.1 Conceitos Fundamentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Síntese Histórica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Importância da Estatística . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 A Estatística e os Métodos Estatísticos . . . . . . . . . . . . . . . . . . . . 4
1.2.1 Fases da Metodologia Estatística . . . . . . . . . . . . . . . . . . . 4
1.3 Objectivos da Análise Estatística . . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Tipos de Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.1 Estatística Descritiva . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.2 Estatística Inferencial ou Indutiva . . . . . . . . . . . . . . . . . . . 8
1.4.3 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5 População e Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.1 População ou Universo Estatístico (N) . . . . . . . . . . . . . . . . 9
1.5.2 Amostra (n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.6 Variáveis (ou Dados) e Tipos de Variáveis . . . . . . . . . . . . . . . . . . 11
1.6.1 Tipos de Variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.7 Números Aproximados e Arredondamento de Dados. Cálculo de Percentagem 13
1.7.1 Números Aproximados e Arredondamento de Dados . . . . . . . . . 13
1.7.2 Cálculo de Percentagem . . . . . . . . . . . . . . . . . . . . . . . . 14
2 Técnicas de Amostragem 15
2.1 Importância da Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Vantagens da Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
i
Notas - Estatística I FEC - UJES/2021-2022
2.3 Critérios para Seleção de Amostras . . . . . . . . . . . . . . . . . . . . . . 16
2.4 Tipos de Técnicas de Amostragem . . . . . . . . . . . . . . . . . . . . . . 17
2.4.1 Amostragem Casual ou Aleatória Simples . . . . . . . . . . . . . . 17
2.4.2 Amostragem Proporcional Estraticada . . . . . . . . . . . . . . . . 18
2.4.3 Amostragem Estraticada Uniforme . . . . . . . . . . . . . . . . . . 20
2.4.4 Amostragem Sistemática . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4.5 Amostragem por Conglomerado . . . . . . . . . . . . . . . . . . . . 22
3 Séries Estatísticas e Grácos Estatísticos 24

3.1 Séries Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1.1 Series Temporais, Cronológicas, Históricas, Evolutivas (ou Marchas) 25
3.1.2 Séries Geográcas, Espaciais, Territoriais ou Localização . . . . . . 26
3.1.3 Series Especicas ou Categóricas . . . . . . . . . . . . . . . . . . . 27
3.1.4 Séries Conjugadas ou Tabela de Dupla Entrada . . . . . . . . . . . 28
3.2 Grácos Estatísticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.1 Diagramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.2 Grácos Polar ( ou Radar) . . . . . . . . . . . . . . . . . . . . . . . 34
4 Distribuição de Frequências 36
4.1 Conceitos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.2 Organização e Classicação de dados de Variáveis Qualitativas. . . . . . . . 38
4.3 Organização e Classicação de Dados de Variáveis Quantitativas . . . . . . 39
4.3.1 Distribuição de Frequências de Dados Numéricos não Agrupados
em Intervalos de Classe. . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3.2 Distribuição de Frequências de Dados Numéricos Agrupados com
Intervalos de Classe. . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.4 Representação Gráca de uma Distribuição de Frequência . . . . . . . . . . 45
4.4.1 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.4.2 Polígono de Frequência . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.4.3 Polígono de Frequência Acumulada (ogiva de Galton) . . . . . . . . 47
Alcides Onésimo Nunda ii Pedro Domingos Chitandula

5 Medidas de Posição: Medidas de Tendência Central 50

5.1 Média Aritmética (x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.1.1 Média Aritmética de Dados não Agrupados . . . . . . . . . . . . . 51
5.1.2 Média Aritmética para dados Agrupados sem Intervalos de Classe . 53
5.1.3 Média Aritmética para Dados Agrupados com Intervalos de Classe:
Média Aritmética Ponderada . . . . . . . . . . . . . . . . . . . . . . 55
5.2 Outras Médias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.2.1 Média Geométrica (Mg ) . . . . . . . . . . . . . . . . . . . . . . . . 56
5.2.2 Média Harmónica (Mh . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.2.3 Fórmula Geral das Médias . . . . . . . . . . . . . . . . . . . . . . . 59
5.3 Moda (M0 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.3.1 Cálculo da Moda para Dados não Agrupados . . . . . . . . . . . . . 60
5.3.2 Cálculo da Moda para Dados Agrupados sem Intervalo de Classe . . 61
5.3.3 Cálculo da Moda para Dados Agrupados com Intervalo de Classe . 62
5.4 Mediana (Md ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.4.1 Cálculo da Mediana para Dados não Agrupados . . . . . . . . . . . 64
5.4.2 Cálculo da Mediana para Dados Agrupados sem Intervalos de Classe 66
5.4.3 Cálculo da Mediana Para Dados Agrupados com Intervalo de Classe 67
6 Medidas de Posição: Medidas Separatrizes 70

6.1 Quartis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6.1.1 Cálculo dos Quartis para dados não Agrupados . . . . . . . . . . . 71
6.1.2 Cálculo dos Quartis para Dados agrupados sem Intervalo de Classe 72
6.1.3 Cálculo dos Quartis para Dados Agrupados com Intervalo de Classe 74
6.2 Decis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
6.2.1 Cálculo dos Decis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
6.3 Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.3.1 Cálculo dos Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . 78
7 Medidas de Dispersão ou de Variabilidade 80

7.1 Amplitude Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Alcides Onésimo Nunda iii Pedro Domingos Chitandula

7.1.1 Cálculo da Amplitude Total para Série Simples . . . . . . . . . . . 80
7.1.2 Cálculo da Amplitude Total para Dados Agrupados numa Distri-
buição de Frequência . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2
7.2 Variância (σ ) e Desvio- padrão (σ ) . . . . . . . . . . . . . . . . . . . . . . 81
7.2.1 Relação entre a Variância e o Desvio-padrão . . . . . . . . . . . . . 82
7.2.2 Cálculo do Desvio-padrão e Variância para Séries Simples (Dados
não agrupados) pela denição e pela fórmula alternativa . . . . . . 82
7.2.3 Calculo da Desvio-padrão e Variância para Dados Agrupados . . . . 84
7.2.4 Propriedades do Desvio-padrão . . . . . . . . . . . . . . . . . . . . 85
7.3 Dispersão Absoluta e Relativa na Comparação de duas Séries de Dados
Colectados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
7.3.1 Coeciente de Variação ou Coeciente de Variação de Pearson . . . 89
7.4 Curvas Simétricas e Assimétricas . . . . . . . . . . . . . . . . . . . . . . . 90
7.4.1 Distribuição de Frequências Representada por Uma Curva Simétrica 90
7.4.2 Distribuição de Frequências Representada por Uma Curva Assimétrica 91
7.4.3 Coeciente de Assimetria de Pearson (AS) . . . . . . . . . . . . . . 93
7.5 Curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.5.1 Coeciente Percentílico de Curtose . . . . . . . . . . . . . . . . . . 95
7.6 Propriedades da Aplicação do Desvio-padrão . . . . . . . . . . . . . . . . . 95
7.6.1 Distribuições Normais . . . . . . . . . . . . . . . . . . . . . . . . . 95
8 Números Índices e Noção de Demograa 98

8.1 Números índices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
8.1.1 Conceito e Objectivo . . . . . . . . . . . . . . . . . . . . . . . . . . 98
8.1.2 Relactivos e Índices . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
8.1.3 Número Índice Simples e Ponderados . . . . . . . . . . . . . . . . . 100
8.1.4 Índice Agregativos Ponderados. Fórmulas de Laspeyres, Egeworth
e de Marshall, de Paasche e de Ficher . . . . . . . . . . . . . . . . . 103
8.1.5 Número Índice em Cadeia . . . . . . . . . . . . . . . . . . . . . . . 105
8.2 Noções de Demograa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
8.2.1 Conceito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
Alcides Onésimo Nunda iv Pedro Domingos Chitandula

8.2.2 Taxa de Crescimento . . . . . . . . . . . . . . . . . . . . . . . . . . 107
9 Probabilidades 110
9.1 Teoria de Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
9.1.1 Conceitos da Teoria de Probabilidades . . . . . . . . . . . . . . . . 110
9.1.2 Álgebra dos Acontecimentos . . . . . . . . . . . . . . . . . . . . . . 111
9.1.3 Conceitos de Probabilidade . . . . . . . . . . . . . . . . . . . . . . 115
9.1.4 Axiomas da Teoria das Probabilidades . . . . . . . . . . . . . . . . 117
9.1.5 Probabilidades Condicionas . . . . . . . . . . . . . . . . . . . . . . 119
9.1.6 Probabilidade da Intersecção de Acontecimentos. Acontecimentos
Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
9.1.7 Teorema da Probabilidade Total e Fórmula de Bayes . . . . . . . . 122
Referências Bibliográcas 125
Alcides Onésimo Nunda v Pedro Domingos Chitandula

Lista de Tabelas
2.1 Amostragem proporcional estraticada por sexo de uma empresa de mar-
keting digital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2 Amostragem proporcional estraticada dos trabalhadores da Fábrica Cuca. 19
2.3 Amostragem proporcional estraticada dos trabalhadores da Fábrica Cuca. 20
3.1 Indicadores Económicos de Angola em 2020 (%) . . . . . . . . . . . . . . . 24
3.2 Reservas Internacionais Líquidas (USD Mil Milhões) em 2020 . . . . . . . . 26
3.3 Taxa de Desemprego da população por Região . . . . . . . . . . . . . . . . 27
3.4 Número de trabalhadores (sector público e privado) das várias classes de
salários em Angola 2018 - 2020 . . . . . . . . . . . . . . . . . . . . . . . 28
3.5 Inquérito do emprego em Angola (IEA), referente ao II trimestre de 2021. . 29
5.1 Venda de apólices de seguros . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.2 Distribuição das Estaturas . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.3 Distribuição da venda de electrodomésticos . . . . . . . . . . . . . . . . . . 61
5.4 Distribuição da venda de electrodomésticos . . . . . . . . . . . . . . . . . . 62
5.5 Distribuição do número de quartos por residência . . . . . . . . . . . . . . 67
5.6 Distribuição do tempo gasto na Internet. . . . . . . . . . . . . . . . . . . . 68
6.1 Distribuição das notas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.2 Distribuição salarial(em centenas de Kzs) dos funcionários do sector de
vendas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
7.1 Distribuição da venda de carros por nove vendedores . . . . . . . . . . . . 86
7.2 Distribuição de exigências descumpridas em cada proposta para concessão
de crédito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
vi
7.3 Distribuição das vendas por funcionário . . . . . . . . . . . . . . . . . . . . 88
8.1 Mercadoria em Espécie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
8.2 Números Relactivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
8.3 Números índices simples e ponderados . . . . . . . . . . . . . . . . . . . . 100
8.4 Número índice aritmético ponderado . . . . . . . . . . . . . . . . . . . . . 101
9.1 Propriedades das operações . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Alcides Onésimo Nunda vii Pedro Domingos Chitandula

Lista de Figuras
3.1 Vendas em milhares de kwanzas . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Gráco em Colunas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.3 Gráco em Barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4 Inquérito do emprego em Angola (IEA), referente ao II trimestre de 2021 . 33
3.5 Inquérito do emprego em Angola (IEA), referente ao II trimestre de 2021 . 34
3.6 Vendas em Milhares de Kwanzas . . . . . . . . . . . . . . . . . . . . . . . . 35
4.1 Estado civil dos compradores de congelados de um supermercado . . . . . 38
4.2 Estado civil dos compradores de congelados de um supermercado . . . . . 40
4.3 Símbolos nas representações para intervalos abertos e fechados . . . . . . . 43
4.4 Peso de 50 estudantes do sexo masculino da Faculdade de Economia . . . . 44
4.5 Histograma da distribuição dos pesos de 50 estudantes . . . . . . . . . . . 46
4.6 Polígono de frequência da distribuição dos pesos de 50 estudantes . . . . . 47
4.7 Polígono de frequência acumulada da distribuição dos pesos de 50 estudantes 48
5.1 Distribuição do número de clientes com parcelas atrasadas. . . . . . . . . . 54
5.2 Exemplos de representação gráca da moda . . . . . . . . . . . . . . . . . 60
7.1 Curva Simétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
7.2 Curva Assimétrica Positiva . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.3 Curva Assimétrica Negativa . . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.4 Curva Mesocúrtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.5 Curva Platicúrtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.6 Curva Leptocúrtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
viii
7.7 Representação gráca da zona de normalidade . . . . . . . . . . . . . . . . 96
9.1 Representação de acontecimento . . . . . . . . . . . . . . . . . . . . . . . . 112
9.2 União de acontecimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
9.3 Intersecção de acontecimentos . . . . . . . . . . . . . . . . . . . . . . . . . 113
9.4 Acontecimento impossível . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
9.5 Diferença de Acontecimentos . . . . . . . . . . . . . . . . . . . . . . . . . . 114
9.6 Acontecimento complementar . . . . . . . . . . . . . . . . . . . . . . . . . 114
Alcides Onésimo Nunda ix Pedro Domingos Chitandula

Capítulo 1
A Estatística
1.1 Conceitos Fundamentais

1.1.1 Síntese Histórica
Embora a estatística seja recente na área de pesquisa, ela já era observada de forma ru-
dimentar e imprecisa na antiguidade, quando então os governantes faziam registros de
dados que consideravam importante, tais como as informações sobre suas populações e
suas riquezas, tendo como objectivo ns militares ou tributários. Os governantes investi-
gavam o número de habitantes, de nascimentos e de óbitos, faziam avaliações dos bens e
riquezas do povo para que cobrassem os impostos proporcionais.
Os vários acontecimentos e aspectos da evolução da estatística agrupam-se em três grandes
períodos:
1. Período da preparação dos factos: abrange a idade antiga, idade média e parte
da idade moderna, na história da civilização e é caracterizado por registros de in-
teresse do estado. Por esta razão é também denominada período da estatística

administrativa. Na idade antiga, destaca-se Chouking, que baseado-se em princí-
pios bíblicos fez o levantamento do povo judaico, para ns de guerra, nessa época
era feito o recenseamento da população e extensão territorial do império romano.
Na idade média, destacam-se os árabes, no ano 721, coma coleta numérica das ci-
dades dominadas, compostas de suas populações e fábricas e de cada espécie de
seus produtos, para o controlo das conquistas territoriais. Na parte idade moderna,
destaca-se o Conquistador Guilherme, que ordenou a elaboração de um cadastro
da divisão do solo da Inglaterra das várias classes sociais existentes, para ns de
arrecadação de impostos.
1
2. Período da preparação das teorias: caracterizam este período as críticas e po-
lémicas tendendo a erigir a estatística como disciplina autónoma. Destacam-se,
Herman Coring que no século XV II na Alemanha, emprega a estatística já como
disciplina autónoma e descreve o estado considerando seu território, seu governo
e suas nanças; William Petty, autor do termo "Aritmética Política", baseado em
informações estatísticas, tira conclusões com aproximação sobre a regularidade dos
fenómenos sociais; Edmond Halley, que constrói o cálculo actuarial e esboça a pri-
meira tábua de mortalidade; Blaise Pascal e Pierre Fermat que no século XV II
descobriram o cálculo de probabilidades na França.
3. Período do aperfeiçoamento técnico e cientíco: Inicia-se em 1853, com o pri-
meiro congresso de estatística e abrange parte, portanto, da idade média moderna
estendendo-se pela idade contemporânea. Neste período destacam-se, entre outros,
Françis Galton, com o emprego da estatística metodológica nos problemas da here-

ditariedade, James Clerk Maxwell, empregando a estatística na teoria cinética dos
gases.
• statu , que em latim signica estado, e apareceu pela

A palavra estatística deriva de
primeira vez no século XVII, sugerida pelo alemão Godofredo Achenwall .
• A partir do século XVI, as tabelas tornaram-se mais completas, surgiram as repre-

sentações grácas e o cálculo de probabilidades.
• Com base no desenvolvimento da teoria das probabilidades, no século XVII, vericou-

se que a estatística poderia ser utilizada para tirar conclusões e tomar decisões
baseadas na análise de dados.
É possível distinguir duas concepções para a palavra estatística:
1. Plural (estatísticas), indica qualquer coleção de dados numéricos, reunidos com a
nalidade de fornecer informações acerca de uma actividade qualquer. Assim, por
exemplo, as estatísticas demográcas referem-se aos dados numéricos sobre nas-

cimentos, falecimentos, matrimónios, etc. As estatísticas económicas consistem
em dados numéricos relacionados com emprego, produção, vendas e com outras
actividades ligadas aos vários sectores da vida económica;
2. No singular (Estatística), indica a actividade humana especializada ou um corpo de
técnicas, ou ainda uma metodologia desenvolvida para a coleta, a classicação, a
apresentação, a análise e a interpretação de dados quantitativos e a utilização desses
dados para a tomada de decisões.
Alcides Onésimo Nunda 2 Pedro Domingos Chitandula

Na actualidade, a estatística é uma ciência moderna, imprescindível para entender as-
pectos e problemas em todas as áreas do conhecimento. Para se ter uma ideia sobre a
estatística na actualidade, apresentam-se as denições dos seguintes autores:
Denição 1 : Segundo Bernoulli, a estatística pode ser denida como um conjunto de

métodos e processos quantitativos que servem para estudar e medir os fenómenos colecti-
vos.
Denição 2 : Para Kachigan, a estatística é a disciplina cientíca cujo m consiste na

recolha, organização e interpretação de dados de acordo com procedimentos bem denidos.
Denição 3 : Para Murteira, a estatística é um repositório de instrumentos adequados

para: recolher, explorar, descrever e interpretar conjuntos de dados numéricos.
• A análise de qualquer uma destas denições revela que na base da estatística está
um conjunto de dados sendo esta constituída pelos métodos que são utilizados
para os recolher, organizar, descrever e interpretar.
1.1.2 Importância da Estatística

O mundo actual está repleto de problemas. Para resolvermos a maioria deles, necessitamos
de informações. Mas, que tipo de informação? Que quantidade de informações? Após
obtê-las, que fazer com elas? A estatística trabalha com essas informações, associando os
dados ao problema, descobrindo como e o que coletar, assim capacitando o pesquisador
(ou prossional ou cientista) a obter conclusões a partir dessas informações, de tal forma
que possam ser entendidas por outras pessoas.
Portanto, os métodos estatísticos auxiliam o cientista social, o economista, o engenheiro,
o agrónomo e muitos outros prossionais a realizarem o seu trabalho com mais eciência.
Exemplo 1.1.1 Os estatísticos do governo conduzem censos de população, residências,

produtos industriais, agricultura entre outros. São feitas compilações sobre vendas, pro-
dução, inventário, folha de pagamento e outros dados das indústrias e empresas. Essas
estatísticas informam ao administrador ou decisor ou gestor como a sua empresa está
crescendo, seu crescimento em relação a outras empresas e fornece-lhe condições de pla-
near ações futuras. A análise dos dados é muito importante para se fazer um planeamento
adequado.

1.2 A Estatística e os Métodos Estatísticos

A estatística fornece métodos para a coleta, organização, descrição, análise e interpretação
de dados. Os resultados podem ser utilizados para o planeamentos, tomadas de decisões
ou formulação de soluções.
Denição 4 (Método Estatístico) : O método estatístico pode ser entendido como

um conjunto de meios que, conduzidos e dispostos convenientemente, permite que se ca-
nalizem as informações para determinado objectivo.
1.2.1 Fases da Metodologia Estatística

Quando se pretende empreender um estudo estatístico completo, existem diversas fases do
trabalho que devem ser desenvolvidas para se chegar aos resultados nais de um estudo
capaz de produzir resultados válidos. O estudo estatístico inicia-se com o planeamento
da pesquisa que representa a organização do plano geral do trabalho que estabelece os
objectivos e a utilização dos meios estatísticos. A coleta de dados vai obter informações
sobre a realidade a ser estudada. A pós a coleta dos dados, é necessário classicá-los; isso
signica estabelecer categorias que permitem a união de informações coletadas. As fases
principais são as seguintes:
1. Denição dos Objectivos / Problema : A primeira fase do trabalho consiste
em uma denição ou formulação correcta do problema a ser estudado. Além de
considerar detidamente o problema objecto do estudo, o analista deverá examinar
outros levantamentos realizados no mesmo campo e que sejam análogos, uma vez
que parte da informação de que se necessita pode, muitas vezes, ser encontrada
nesses últimos.
2. Planeamento: O passo seguinte, após a denição do problema, compreende a fase
do planeamento, que consiste em se determinar o procedimento necessário para se re-
solver o problema e, em especial, como levantar informações sobre o assunto, objecto
do estudo. É preciso planear o trabalho a ser realizado tendo em vista o objectivo
que se pretende atingir. É nessa fase que será escolhido o tipo de levantamento a
ser utilizado. Sob esse aspecto, pode haver dois tipos de levantamento:
(a) Levantamento censitário, quando a contagem for completa, abrangendo
todo o universo;
(b) Levantamento por amostragem, quando a contagem for parcial.
Outros elementos importantes que devem ser tratados nesta mesma fase são:

• Cronograma das actividades, através do qual são xados os prazos para as
várias fases;
• Custos envolvidos;
• Examinar as informações disponíveis;
• Delineamento da amostra, etc.
3. Coleta de Dados: O terceiro passo é essencialmente operacional, compreendendo
a coleta das informações propriamente ditas. Nesta fase do método estatístico, é
conveniente estabelecer uma distinção entre duas espécies de dados:
(a) Dados primários quando são publicados ou coletados pelo próprio pesqui-
sador ou organização que os escolheu;
(b) Dados secundários quando são publicados ou coletados por outra organi-
zação.
• Um conjunto de dados é, pois, primário ou secundário em relação a alguém.
As tabelas do Censo Demográco são fontes primárias. Quando determinado
jornal publica estatísticas extraídas de várias fontes e relacionadas com diversos
sectores industriais, os dados são secundários para quem desejar utilizar-se deles
em alguma pesquisa que esteja desenvolvendo.
A coleta de dados pode ser realizada de duas maneiras:
(a) Coleta Directa quando é obtida directamente da fonte, como no caso da
empresa que realiza uma pesquisa para saber a preferência dos consumidores
pela sua marca;
(b) Coleta Indirecta quando é inferida a partir dos elementos conseguidos pela
coleta direta, ou através do conhecimento de outros fenómenos que, de algum
modo, estejam relacionados com o fenómeno em questão.
4. Classicação e Apuramento dos Dados: Antes de começar a analisar os dados,
é conveniente que lhes seja dado algum tratamento prévio, a m de torná-los mais
expressivos. A quarta etapa do processo é, então, a da apuração ou sumarização,
que consiste em resumir os dados através de sua contagem e agrupamento. Pode
ser manual, eletromecânica ou eletrônica.
5. Apresentação dos Dados: Por mais diversa que seja a nalidade, os dados devem
ser apresentados sob forma adequada, tornando mais fácil o exame do fenómeno que
está sendo objecto de tratamento estatístico. Há duas formas de apresentação ou
exposição dos dados observados, que não se excluem mutuamente:

(a) Apresentação tabular É uma apresentação numérica dos dados. Consiste
em dispor os dados em linhas e colunas distribuídas de modo ordenado, se-
gundo algumas regras práticas adotadas pelos diversos sistemas estatísticos.
As tabelas têm a vantagem de conseguir expor, sinteticamente e em só local,
os resultados sobre determinado assunto, de modo a se obter uma visão global
mais rápida daquilo que se pretende analisar.
(b) Apresentação gráca É uma apresentação geométrica dos dados numéri-
cos. Embora a apresentação tabular seja de extrema importância no sentido de
facilitar a análise numérica de dados, não permite ao analista obter uma visão
tão rápida, fácil e clara do fenómeno e sua variação como aquela conseguida
através de um gráco.
6. Análise, Interpretação dos Dados e Elaboração do Relatório com as Con-

clusões : Nesta última etapa, o interesse maior reside em tirar conclusões que
auxiliem o pesquisador a resolver seu problema. A análise dos estatísticos está li-
gada essencialmente ao cálculo de medidas, cuja nalidade principal é descrever o
fenómeno. Assim, o conjunto de dados a ser analisado pode ser expresso por núme-
ros, as estatísticas que evidenciam as características particulares desse conjunto. O
signicado exato de cada um dos valores obtidos através do cálculo das várias me-
didas estatísticas disponíveis deve ser bem interpretado. É possível mesmo, nesta
fase, arriscar algumas generalizações, as quais envolverão, como mencionado ante-
riormente, algum grau de incerteza, porque não se pode estar seguro de que o que
foi constatado para aquele conjunto de dados (a amostra) se vericará igualmente
para a população.
1.3 Objectivos da Análise Estatística

O objectivo principal da análise estatística é o de tirar conclusões a partir dos dados por
forma a enriquecer o conhecimento da realidade. Na prossecução deste objectivo geral

podem indicar-s. fundamentalmente, seis objectivos básicos da análise estatística que
não são exclusivos nem exaustivos:
1. Sintetização e redução de dados;
2. Inferência para outros conjuntos de dados;
3. Identicação de relações entre conjuntos de dados;
4. Redução da dimensionalidade de dados multivariados;
5. Classicação e Discriminação de dados multivariados;

6. Agrupamento de dados.
1.4 Tipos de Estatística

A estatística usualmente é dividida em três grandes áreas, embora não se trate de ramos
isolados:
1. Estatística Descritiva ou Dedutiva;
2. Estatística Inferencial ou Indutiva;
3. Probabilidade.
1.4.1 Estatística Descritiva

A Estatística Descritiva é o conjunto de técnicas que objectivam coletar, organizar, apre-
sentar, analisar e sintetizar os dados numéricos de uma população, ou amostra.
O simples levantamento de informação e sua apresentação em tabelas estatísticas, limi-
tando se a apresentar os dados e grácos de um dado fenómeno levam o nome de
estatística descritiva.
Nota 1.4.1 (Estatística Descritiva) . É a parte mais conhecida. Por exemplo, ao ver
o noticiário, na televisão ou nos jornais, sabe-se quão frequente é o uso de médias, índices
e grácos nas notícias.
Exemplo 1.4.1 (Índice de Preços do Consumidor (IPC)) . Sua construção envolve

a sintetização, em um único número, dos aumentos dos produtos de uma cesta básica.
Exemplo 1.4.2 (Anuário Estatístico Angolano) . O INE 1

publica esse anuário
apresentando, em várias tabelas, os mais diversos dados sobre Angola: educação, saúde,
transporte, economia, cultura, etc. Embora simples, fáceis de serem entendidas, as tabelas
são o produto de um processo demorado e extremamente dispendioso de coleta e apuração
de dados.
1 Instituto Nacional de Estatística

1.4.2 Estatística Inferencial ou Indutiva

Estatística Indutiva (ou Inferencial) - que, a partir da observação de alguns dados expe-
rimentais, permite comparações, ligações lógicas, análise e interpretação de dados com o
objetivo de generalizar e prever resultados.
A Inferência Estatística é constituída pelo conjunto dos métodos que permitem generalizar
ou inferir os resultados de um conjunto de dados ( a amostra) para um conjunto de dados

mais amplo ( população ou universo).
Nota 1.4.2 A tomada de decisões sobre a população, com base em estudos feitos sobre
os dados da amostra, constitui o problema central da inferência estatística.
Exemplo 1.4.3 . Suponha que a distribuição das alturas de todos os habitantes de um

país possa ser representada por uma distribuição normal. Mas não conhecemos de antemão
a média da distribuição. Devemos, pois, estimá-la.
Exemplo 1.4.4 (Análise Financeira) . Os analistas nanceiros estudam dados sobre

a situação da economia, visando explicar tendências dos níveis de produção e de consumo,
projetando-os para o futuro.
1.4.3 Probabilidade
A teoria de probabilidades nos permite descrever os fenómenos aleatórios, ou seja, aqueles
em que está presente a incerteza.
O processo de generalização, que é característico do método indutivo, está associado a uma
margem de incerteza. A existência da incerteza deve-se ao facto de que a conclusão, que se
pretende obter para o conjunto de todos os indivíduos analisados quanto a determinadas
características comuns, baseia-se em uma parcela do total das observações. A medida
da incerteza é tratada mediante técnicas e métodos que se fundamentam na Teoria da

Probabilidade. Essa teoria procura quanticar a incerteza existente em determinada
situação.
1.5 População e Amostra

O estudo de qualquer fenómeno, seja ele natural, social, económico ou biológico, exige a
coleta e a análise de dados estatísticos. A coleta de dados é, pois, a fase inicial de qualquer

pesquisa. É sobre os dados da amostra que se desenvolvem os estudos, visando a fazer
inferências sobre a população.
Exemplo 1.5.1 (Renda média per capita em diversas regiões do país) Toma-se um
conjunto de indivíduos em cada região, escolhidos ao acaso, e sobre esse grupo são feitos
os estudos. Os indivíduos assim escolhidos constituem a amostra e os resultados nela
observados serão estendidos à população.
1.5.1 População ou Universo Estatístico (N)

Denição 5 (População) . A população é um conjunto de todos os elementos (pessoas,
objetos, etc.) que possuem pelo menos uma característica em comum, a(s) qual (is) os
relacionam ao problema que está sendo estudado.
Denição 6 (População) . Uma população é qualquer colecção de entidades bem de-

nidas, ou seja, os elementos ou membros da população estão bem identicadas.
Exemplo 1.5.2 (Alguns exemplos de populações) . Os estudantes da disciplina de

estatística; As cidades angolana com mais de um milhão de habitantes; As empresas
cotadas na bolsa de Angola (BODIVA); Os hospitais do país; Os consumidores de um
produt; Os doentes atendidos nos serviços de urgência de um hospital num determinado
período de tempo; As empresas de Engenharias de Angola, etc.
Exemplo 1.5.3 . Se o problema a ser pesquisado está relacionado com a qualidade de

um certo produto produzido numa indústria, a população pode ser composta por todas as
peças produzidas numa determinada hora, turno, dia ou mês, dependendo dos objectivos.
Exemplo 1.5.4 . Se o objectivo de um estudo é pesquisar o nível de renda familiar de

uma certa cidade, a população seria todas as famílias desta cidade. Mas, se o objectivo
fosse pesquisar apenas a renda mensal do chefe da família, a população a ser pesquisada
seria composta por todos os chefes de família desta cidade.
Classicação da População
As Populações podem ser:
1. Reais - como as populações dos exemplos acima indicados;

2. Hipotéticas - como por exemplo, a população dos resultados que podem ser obtidos
em sucessivos lançamentos de um dado, a população de valores das cotações de uma
certa acção na Bolsa de Valores no próximo ano, etc;

3. Finita - quando o número de unidades de observação pode ser contado e é limitado.

Podemos citar como exemplo de população nita o conjunto formado pelos estudan-
tes que cursam a disciplina de estatística num determinado semestre da Faculdade
de Economia ou ISP-Caála;
4. Innita - quando a quantidade de unidades de observação é ilimitada. Um exemplo
de população innita seria o conjunto formado por todos os alunos de estatística de
Angola, pois este conjunto é composto por um número incontável de elementos.
Nota 1.5.1 Nem sempre a população de interesse (denominada população objectivo)

pode ser observada, ou por que não se conhecem todos os seus elementos, ou por qualquer
outra razão. Neste caso, o investigador apenas pode observar uma outra população que
não a desejável. Esta população é denominada população inquirida.
1.5.2 Amostra (n)

Denição 7 (Amostra) . A amostra é apenas uma parte da população, ou seja, é um
subconjunto da população. Embora que seja constituída por uma parte da população em
estudo, a amostra deve permitir a obtenção de dados representativos dessa população.
Nota 1.5.2 Uma amostra é um subconjunto ou uma parte da população. As amostras

são muito importantes na análise estatística, uma vez que, por razões económicas ou res-
trições de natureza física, não é conveniente ou não é possível observar todos os elementos
de uma dada população.
Nota 1.5.3 Vários motivos levam a necessidade de se observar apenas uma parte da
população, como, por exemplo: a falta de tempo, recursos nanceiros e/ou humanos. A
amostra deve ser obtida através de técnicas de amostragem, as quais tem como objectivo
principal garantir a representatividade da população, ou seja, fazer com que a amostra
seja um retrato el da população.
Exemplo 1.5.5 (Exemplos de Amostra) . Exemplos de amostra podem ser conside-

rados por conjuntos formados por apenas uma parte dos elementos populacionais descritos
nos exemplos 1.5.2 ; 1.5.3 e 1.5.4.
Observação 1.5.1 Em estatística, utilizamos extensamente os termos: população, amos-

tra, censo, parâmetros, estatística, dados discretos, dados contínuos, dados quantitativos
e dados qualitativos:
• População: é uma colecção completa de todos os elementos a serem estudados;

• Amostra: é uma subcolecção de elementos extraídos de uma população;
• Censo: é uma colecção de dados relactivos a todos os elementos de uma população;
• Parâmetros: é uma medida numérica que descreve uma característica de uma

população;
• Estatística: é uma medida numérica que descreve uma característica de uma amos-
tra;
• Dados contínuos: resultam de um número innito de valores possíveis que podem

ser associados a pontos em uma escala contínua de tal maneira que não haja lacunas;
• Dados discretos: resultam de um conjunto nito de valores possíveis, ou de um

conjunto enumerável de valores;
• Dados quantitativos: consistem em números que representam contagens ou me-

didas;
• Dados qualitativos: podem ser separados em diferentes categorias que se distin-

guem por alguma característica não-numérica.
1.6 Variáveis (ou Dados) e Tipos de Variáveis

Denição 8 (Variável) . Uma Variável é uma característica (ou dado) associada a
cada elemento da população ou amostra. A variável apresenta diferentes valores, quando
sujeita a mensurações sucessivas, e, em geral, é denotada pelas letras maiúsculas: X, Y
ou Z .
Na população caracterizada pelos funcionários de uma empresa, podemos denir variáveis
como: tempo de serviço, idade, estado civil, sexo, etc.
1.6.1 Tipos de Variáveis

Basicamente, as variáveis podem ser classicadas como sendo Qualitativas ou Quanti-
tativas.
1. Variáveis Qualitativas: quando os valores que elas podem receber são referentes à
qualidade, atributo ou categoria, ou seja, quando expressam uma qualidade ou atri-
buto. Exemplos: Raça, podendo assumir os valores Branco ou Negro; Resultado

de um teste, aprovado ou reprovado; Escolaridade: 1o ciclo, 2o ciclo, superior,

pós-graduado, etc; Conceito de qualidade: péssima, suciente, regular, boa ou
óptima qualidade.
As variáveis qualitativas podem, ser classicadas como: Nominais ou Ordinais.
(a) As variáveis qualitativas nominais - são caracterizadas por dados que se
apresentam apenas sob o aspecto qualitativo (Ex: raça e resultado de um teste);
(b) As variáveis qualitativas ordinais - são caracterizadas por categorias que
apresentam uma ordenação natural. Por exemplo: escolaridade e conceito de
qualidade.
2. Variáveis Quantitativas: quando os valores que ela pode assumir são numéricos,
os quais podem ser obtidos através de uma contagem ou mensuração. Exemplo:
idade, salários, notas da avaliação, números de empresas, etc.
As variáveis quantitativas podem ser classicadas de acordo com o processo de
obtenção; podendo ser: Discreta ou Contínua.
(a) As variáveis quantitativas discretas - são variáveis numéricas obtidas a
partir de procedimento de contagem. Assumem apenas os valores de um con-
junto enumerável, ou seja, pode assumir apenas valores inteiros. Por exemplo:
Quantidade de pessoas numa família de um banco , quantidade de acidentes
numa indústria, número de carros num estacionamento, etc.
(b) As variáveis quantitativas contínuas - são variáveis numéricas cujos valores

são obtidos por um procedimento de mensuração, podendo assumir quaisquer
valores num intervalo dos números reais. Assumem inúmeros valores numéricos
entre dois limites, ou seja, podem assumir valores decimais. Exemplo: tempo
de espera na la de um supermercado, peso, temperatura, altura, salário, etc.
Observação 1.6.1 . O facto de uma variável ser expressa por números não signica
que ela seja necessariamente quantitativa, por que a classicação da variável depende de
como foi medida, e não do modo como se manifesta. Por exemplo, para a variável peso de
um lutador de boxe, se for anotado o peso marcado na balança, a variável é quantitativa
contínua; por outro lado, se esse peso for classicado segundo as categorias do boxe, a
variável é qualitativa ordinal.
Exemplo 1.6.1 O gerente de um restaurante do Huambo, pesquisou a preferência de seus

clientes sobre a fruta a ser servida após a refeição. A fruta preferida, a partir de uma
amostra de 50 clientes, foi o ananás. Resposta: Neste exemplo, a população em estudo

são os clientes do restaurante; O número de elementos da amostra são os 50 clientes e a

variável em estudo é a fruta, que é qualitativa.
1.7 Números Aproximados e Arredondamento de Da-

dos. Cálculo de Percentagem
1.7.1 Números Aproximados e Arredondamento de Dados
Existem muitas normas de arredondamento de dados na numeração decimal. A norma em
uso na actualidade é a norma NBR 5891 da Associação Brasileira de Normas Técnicas
(ABNT). Estas regras estão de acordo com a resolução 886/66 do IBGE:
0, 1, 2, 3 ou 4,
1. Quando o primeiro algarismo a ser abandonado no arredondamento é
ca inalterado o último algarismo a permanecer (arredondamento por defeito).
Exemplo:
25, 732 −→ 25, 73 ; 409, 04 −→ 409, 0 ; 3, 79021 −→ 3, 7902.
2. Quando o primeiro algarismo a ser abandonado no arredondamento é 6, 7, 8 ou

9, aumenta-se uma unidade ao último algarismo a permanecer (arredondamento
por excesso). Exemplos:
19, 4817 −→ 19, 482 ; 2, 309 −→ 2, 31 ; 2, 99 −→ 3, 0.
3. Quando o primeiro algarismo a ser abandonado no arredondamento é 5, há dois
procedimentos:
(a) Se após o algarismo 5 seguir em qualquer casa um número diferente de 0,

aumenta-se em uma unidade o algarismo de antecede o 5. Exemplo:
237, 85001 −→ 237, 9 ; 5, 5256 −→ 5, 53.
(b) Se após o algarismos 5 não seguir ( em qualquer casa) um número diferente
de0, aos algarismo que antecede o 5 será acrescentada uma unidade, se for
ímpar, e permanecerá como está, se for par. Exemplo:
247, 235 −→ 247, 24 ; 1349, 85 −→ 1349, 8 ; 12, 1250 −→ 12, 12.

Observação 1.7.1 Eventualmente, nos softwares de computadores ( como o Excel) e

calculadoras cientícas, porém, não é aplicado o critério indicado no item 3. Nesses
casos, se o primeiro algarismo a ser abandonado for o algarismo 5, o arredondamento
será feito com o aumento de uma unidade ao algarismo que antecede o 5. Exemplo:
247, 235 −→ 247, 24 ; 1349, 85 −→ 1349, 9 ; 12, 1250 −→ 12, 13.
1.7.2 Cálculo de Percentagem

Denição 9 . Percentagens são razões em que um valor total está associado a uma
quantidade de 100% e, por meio de uma regra de três simples, podemos estabelecer a
correspondência entre uma parcela do valor total e o seu valor percentual:
Total −→ 100%
Parcela −→ X% (1.7.1)
X%Total = 100% · Parcela

100% × Parcela
X% = (1.7.2)
Total

Capítulo 2
Técnicas de Amostragem
Existem técnicas adequadas para recolher amostras, de forma a garantir (tanto quanto
possível) o sucesso da pesquisa e dos resultados. Nem sempre é possível fazer uma pesquisa
envolvendo a população para obter os dados de estudo. Por exemplo para vericar a
quantidade de poluentes tóxicos em um rio, retirase uma pequena quantidade de água
para análise. Outro exemplo : nem todas as declarações entregues a AGT têm vericação
detalhada, a escolha dos contribuintes que participam da chamada malha na é feita
por amostragem.
2.1 Importância da Amostragem

Na realização de qualquer estudo, quase nunca é possível examinar todos os elementos da
população de interesse. Temos usualmente que trabalhar com uma amostra da população.
A inferência estatística nos dá elementos para generalizar, de maneira segura, as conclu-
sões obtidas da amostra para a população. Mas, para as inferências serem corretas, é
necessário garantir que a amostra seja representativa da população, isto é, a amostra deve
possuir as mesmas características básicas da população no que diz respeito ao fenómeno
pesquisado.
É uma utopia pensar que, caso tivéssemos acesso a todos os elementos da população,
seríamos mais precisos. Os erros de coleta e manuseio de um grande número de dados são
maiores do que as imprecisões a que estamos sujeitos quando generalizamos, via inferência,
as conclusões de uma amostra bem selecionada. Tratando-se de amostra, a preocupação
central é que ela seja representativa. É preciso que a amostra, ou as amostras que vão ser
usadas sejam obtidas por processos adequados. Assim obter informações através de um
levantamento amostral, nos deparamos imediatamente com os seguintes problemas:
15
• Denir cuidadosamente a população de interesse;
• Selecionar a característica que iremos pesquisar.
Nota 2.1.1 Dados coletados de forma descuidada podem ser tão inúteis que nenhum
processamento estatístico consegue salvá-los.
2.2 Vantagens da Amostragem

São vantagens das técnicas de amostragens : a economia, tempo, conabilidade dos dados
e operacionalidade:
• O levantamento de dados sobre uma parte das população é mais económico que o
levantamento de dados sobre toda a população;
• O levantamento de dados sobre uma parte da população é mais rápido que o levan-
tamento de dados sobre toda a população;
• Ocorre menor número de erros em pesquisas que disponham de menor número de
elementos;
• É mais fácil trabalhar os dados em menor escala.
2.3 Critérios para Seleção de Amostras

É aconselhável haver critérios para a seleção dos elementos da amostra, cada elemento da
população deve ter a mesma chance de ser escolhido para garantir à amostra o carácter
de representatividade. Para tanto deve se estabelecer um número mínimo de elementos
para compor a amostra. O tamanho da amostra não segue nenhuma regra xa, sendo
assim, para populações de tamanho relativamente pequeno ou médio, sugere-se que o
tamanho da amostra não seja menor que 10 % do total de elementos da população.
Exemplo 2.3.1 Numa empresa de 200 funcionários deve ser selecionado um mínimo de
20 funcionários (10 % 200) para compor uma amostra.
Nota 2.3.1 Para fazer inferências válidas sobre a população a partir de uma amostra, é
preciso que essa seja representativa. Uma das formas de se conseguir representatividade
é fazer com que o processo de escolha da amostra seja, de alguma forma, aleatório. Além
disso, a aleatoriedade permite o cálculo de estimativas dos erros envolvidos no processo
de inferência. Quanto à extracção dos elementos, as amostras podem ser:

• Com reposição - quando um elemento sorteado pode ser sorteado novamente;

• Sem reposição - quando o elemento sorteado só pode gurar uma única vez na
amostra.
2.4 Tipos de Técnicas de Amostragem

Denidos os objectivos e a população a ser estudada, deve-se pensar em como será consti-
tuída a amostra dos dados e quais as características ou variáveis a serem estudadas. Neste
Amostragem Casual ou
sentido, as técnicas fundamentais para determinação da são :
Aleatória Simples; Amostragem Proporcional Estraticada, Amostragem Sis-

temática e Amostragem por Conglomerado.
2.4.1 Amostragem Casual ou Aleatória Simples

A amostragem aleatória simples é um processo para selecionar amostras de tamanho n
dentre as N unidades em que foi dividida a população. Sendo a amostragem reali-
zada sem reposição, que é o caso mais comum, existem ( N,n) possíveis amostras, todas
igualmente prováveis. As amostras aleatórias podem ser escolhidas por diversos métodos,
inclusive por tabelas de números aleatórios ( TNA 1

)
Nota 2.4.1 A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda
ou vice-versa), verticalmente (de cima para baixo ou vice- versa), diagonalmente (no
sentido ascendente ou descendente). A opção, porém, deve ser feita antes de iniciado o
processo e de computadores para gerar números aleatórios. Na prática, a amostra aleatória
simples é escolhida unidade por unidade. As unidades da população são numeradas de 1
a N.
Neste tipo de amostragem, todos os elementos da população estão disponíveis para serem
avaliados na amostra. Essa técnica deve garantir que qualquer elemento da população
tenha a mesma probabilidade de ser selecionado. Para tanto, a seleção deve ocorrer por
meio de sorteio.
1A TNA (Tabela de Números Aleatórios) consiste em tabelas que apresentam sequências dos dígitos
de 0 a 9 distribuídos aleatoriamente nas linhas( horizontais) e colunas (verticais). Para obter os elementos
da amostra usando a TNA, sorte-a-se uma linha e uma coluna qualquer para começar a leitura.

Exemplo 2.4.1 (Amostragem Aleatória Simples) . Procure os 10 primeiros núme-

ros na TNA começando a leitura na 9a linha e na 5a coluna (cada dígito representa uma
coluna). Os 10 primeiros números são: 1, 0, 0, 1, 8, 4, 7, 0, 1, 3.
Nota 2.4.2 Para retirar amostras em populações com mais de 10 itens é necessário ler
as colunas quantos dígitos compõe o número total de itens da população. Exemplo: para
retirar 5 amostras de uma população com 300 itens, temos que ler três colunas para con-
seguirmos valores entre 001 e 300. Se o número sorteado superar o número de elementos
rotulados, abandona-se o número sorteado, prosseguindo-se o processo. Considerando a
9a linha e 5a coluna temos como resposta : 124, 056, 094, 143, 014.
2.4.2 Amostragem Proporcional Estraticada

A amostragem proporcional estraticada considera a população dividida em estratos,
em que cada estrato abrange um subconjunto da população que reúne características
comuns entre seus elementos. Nesse processo, a variável em estudo apresenta comporta-
mento diferente em cada estrato. Por exemplo, se a característica for sexo, a população
será dividida em dois grupos (estratos): masculino e feminino.
Denição 10 Uma amostra estraticada é obtida separando-se as unidades da população

em grupos não super postos chamados estratos, e selecionando-se independentemente uma
amostra aleatória simples de cada estrato.
Existem dois tipos de amostragem estraticada: Do mesmo tamanho e Proporcional.
• No primeiro tipo, sorteia-se igual número de elementos em cada estrato. Esse pro-
cesso é utilizado quando o número de elementos por estrato for aproximadamente o
mesmo.
• No outro caso, utiliza-se a amostragem estraticada proporcional, cujo processo de
calcular o número de amostras por estrato é:
Na na n
= −→ na = Na (2.4.1)
N n N
Onde:N −→ N o de unidades da população; n ←→ N o de unidades das amostras;
Na ←→ N o de unidades do estrato A; na ←→ N o de amostras de A.
Nota 2.4.3 A amostragem proporcional estraticada, além de levar em conta a existência

de estratos, também considera que o número de elementos extraídos de cada estrato seja
proporcional aos respectivos estratos.

Exemplo 2.4.2 Uma empresa de marketing digital do Huambo conta com 480 funcio-
nários, dos quais 288 são do sexo feminino e os 192 restantes do sexo masculino. Con-
siderando a variável "sexo"para estraticar essa população, foi selecionada uma amostra
proporcional estraticada de 50 funcionários. Calcule a proporção de funcionários de cada
sexo contida na amostra.
• Resolução: População: 480 funcionários; Amostra : 50 funcionários
Primeiro estrato : 288 funcionários do sexo feminino (60 % da população)

Segundo estrato: 192 funcionários do sexo masculino (40 % da população).
• Isso signica que a composição de funcionários da amostra deve manter a mesma
proporcionalidade dos estratos, do primeiro estrato serão 60 % dos elementos da
amostra e do segundo estrato serão retirados 40 % dos elementos da amostra:
Tabela 2.1: Amostragem proporcional estraticada por sexo de uma empresa de marketing
digital
Estrato População Proporção da Amostra proporcional

(por sexo) População Estraticada
288
Feminino 288
480
= 0.6(60%) n1 = 0.60 × 50 = 30
192
Masculino 192
480
= 0.4(40%) n2 = 0.40 × 50 = 20
Total 480 50
• Composição dos 50 funcionários da amostra n1 = 30 mulheres e n2 = 20 homens.
Exemplo 2.4.3 Com objectivo de levantar o estilo de comunicação ideal preferido pelos
trabalhadores da Fábrica Cuca do Huambo, realiza-se o levantamento por amostragem. A
população é composta por 200 chefes de secção, 4 400 operários especializados e 1 200
operários não especializados. Obtenha uma amostra com 5 % dos operários da indústria,
mantendo as mesmas relações de proporcionalidade em cada estrato.
Tabela 2.2: Amostragem proporcional estraticada dos trabalhadores da Fábrica Cuca.
Estrato População Amostra proporcional

(por sexo) Estraticada
Chefe de Secção 200 n1 = 200 × 0, 05 = 10
Trabalhadores especializados 4.400 n2 = 4.400 × 0, 05 = 220
Trabalhadores não especializados 1.200 n3 = 1.200 × 0.05 = 60
Total 5.800 290
• A amostra deverá conter 5 % do total de trabalhadores, ou seja 290 trabalhado-

res, composição dos trabalhadores da amostra n1 = 10 chefes de secção; n2 = 220
trabalhadores especializados e n3 = 60 trabalhadores não especializados.

2.4.3 Amostragem Estraticada Uniforme

Este método da amostragem estraticada uniforme não utiliza o critério de proporciona-
lidade, pois se selecciona a mesma quantidade de elementos de cada estrato. Deve ser
usado se o maior interesse for comparar os estratos ou obter estimativas separadas para
cada estrato.
Exemplo 2.4.4 Considerando o Exemplo 2.4.2, em que uma empresa de marketing digi-
tal conta com 480 funcionários, dos quais 288 são do sexo feminino e os 192 restantes do
sexo masculino. Considerando a variável "sexo"para estraticar essa população, vamos
obter uma amostra estraticada uniforme de 50 funcionários. Supondo que haja homoge-
neidade dentro de cada categoria, pode-se obter uma amostra estraticada uniforme de 50
funcionários com a selecção de 25 elementos de cada estrato.
Tabela 2.3: Amostragem proporcional estraticada dos trabalhadores da Fábrica Cuca.
Estrato População Amostra proporcional

(por sexo) Estraticada
Feminino 288 n1 = 25
Masculino 192 n2 = 25
Total 480 50
• Composição dos 50 funcionários da amostra: n1 = n2 = 25.
2.4.4 Amostragem Sistemática

Quando os elementos da população já se encontram ordenados, não há necessidade de
se construir o sistema de referência. Nesses casos, a seleção dos elementos que consti-
tuirão a amostra pode ser por um sistema imposto pelo pesquisador. Este método é um
procedimento para amostragem aleatória, utilizado quando os elementos da população já
se acham ordenados. Exemplos que podem ser citados: as casas e prédios de uma rua,
funcionários de uma empresa, as linhas de produção, listas de alunos, etc.
Em geral, para se obter uma amostra sistemática de n elementos de uma população de
tamanho N , K deve ser menor ou igual a N/n. Não é possível determinar K , precisamente,
quando o tamanho da população é desconhecido, mas pode-se supor um valor de k de
tal modo que seja possível obter uma amostra de tamanho n. Em vez da amostragem
aleatória simples, pode-se empregar a amostragem sistemática pelas seguintes razões:
• A amostragem sistemática é mais fácil de se executar e, por isso, está menos sujeita
a erros do entrevistador do que aqueles que acontecem na aleatória simples;

• A amostragem sistemática frequentemente proporciona mais informações por custo
unitário do que a aleatória simples.
Método para seleção dos elementos de uma amostra sistemática de uma po-
pulação.
• Consideramos uma população com N elementos e que se deseja extrair uma amostra
sistemática de n elementos:
Intervalo de Seleção (I) 2

: utilizando o método de amostragem sistemática,
denimos o intervalo de seleção para extração dos elementos da população que
irão compor a amostra:
N
I= , (n < N ) (2.4.2)
n
onde I é o intervalo de seleção, N= tamanho da população, n= tamanho da
amostra.
Primeiro elemento da amostra (m): na amostragem sistemática a posição
do primeiro elemento da amostra é obtido por sorteio, e deve pertencer aos
"I "elementos iniciais da lista. Utilizaremos "m"para designar a posição do
elemento sorteado.
∗ m= posição do primeiro elemento da amostra e obtido por sorteio. Por
exemplo, se o intervalo de seleção for I = 18, o primeiro elemento da
amostra deve ser sorteado entre os 18 elementos iniciais da lista, ou seja, o
valor sorteado deve estar limitado entre os valores do primeiro ao décimo
oitavo elemento.
∗ O valor sorteado poderia ser o de número m = 5 ( pois está dentro do
intervalo entre os 18 elementos iniciais da lista), mas não poderia ser o de
número m = 27 ( pois está fora do intervalo entre os 18 elementos iniciais
da lista).
Próximos elementos da amostra : considerando a posição do primeiro
elemento da amostra, os próximos serão selecionados em intervalos regulares
de "I "elementos de cada
∗ Posição do primeiro elemento da amostra = m

∗ Posição do segundo elemento da amostra = m+I
∗ Posição do terceiro elementos da amostra = m + 2I
∗ Posição do quarto elemento da amostra = m + 3I
2O intervalo de seleção corresponde ao número de vezes que a amostra cabe na população.

∗ E assim sucessivamente.
Ultimo elemento da amostra: a posição do ultimo elemento da amostra
pode ser calculado pela fórmula a seguir:
m + (n − 1)I (2.4.3)
Exemplo 2.4.5 (Amostragem Sistemática) Uma empresa prestadora de serviço man-

tém um cadastro de 2.185 clientes, e pretende vericar o interesse de seus clientes por
um novo produto, para isso, selecciona uma amostra sistemática de 70 clientes
a). Supondo que o primeiro cliente (obtido por sorteio) seja o de número 21, determine
os números dos próximos cinco clientes seleccionados.
b). Qual o número do último cliente seleccionado?
• Tamanho da população: N = 2.185; Tamanho da amostra: n = 70.
• Intervalo de seleção: I = N
n
= 2.185
70
= 31, 21 ≈ 31
a). Posição do primeiro elemento da amostra m = 21. Os números dos próximos cinco
clientes selecionados para amostra são:
Posição de segundo elemento da amostra: m + I = 21 + 31, 21 ≈ 52

Posição do terceiro elemento da amostra m + 2I = 21 + 2×, 21 ≈ 83
Posição do quarto elemento da amostra: m + 3I = 21 + 3×, 21 ≈ 115
Posição do quinto elemento da amostra: m + 4I = 21 + 4 × 31, 21 ≈ 146
Posição do sexto elemento da amostra. m + 5I = 21 + 5 × 31, 21 ≈ 177
Número dos próximos cinco clientes selecionados: 52, 83, 115, 146, 177
b). Posição do último elemento da amostra: 21 + (70 − 1)31, 21 = 2.174.
2.4.5 Amostragem por Conglomerado

Denição 11 Uma amostra por conglomerado é uma amostra aleatória simples na qual
cada unidade de amostragem é um grupo, ou um conglomerado de elementos.
• O primeiro passo na amostragem por conglomerado é especicar conglomerados
apropriados. Os elementos em um conglomerado tendem a ter características si-
milares, portanto, o fato de novas medidas serem tomadas num conglomerado não
implica necessariamente aumento de informação sobre o parâmetro populacional.

Como regra geral, o número de elementos num conglomerado deverá ser pequeno
em relação ao tamanho da população e o número de conglomerados deverá ser ra-
zoavelmente grande.
Nota 2.4.4 Na amostragem por conglomerado a população é dividida em grupos. Selecionam-

se amostras aleatórias simples de grupos e, então, todos os itens dos grupos (conglomera-
dos) selecionados farão parte da amostra.
Exemplo 2.4.6 Em um levantamento da população de uma cidade, podemos dispor do

mapa indicando cada quarteirão e não dispor de uma relação actualizada dos seus mora-
dores. Pode-se, então, colher uma amostra dos quarteirões e fazer a contagem completa
de todos os que residem naqueles quarteirões sorteados.

Capítulo 3
Séries Estatísticas e Grácos

Estatísticos
O estudo desta temática exige de nós o estudo do conceito de tabela. As tabelas são
recursos utilizados pela estatística, com o objectivo de organizar e facilitar a visualização
e comparação dos dados. As tabelas permitem uma visão geral dos valores assumidos
pelas variáveis dentro de certos parâmetros.
Denição 12 (Tabela) . É um conjunto de observações a respeito de determinado as-

sunto, organizadas e distribuídas num quadro. Ao elaboramos devemos caracterizar a
descrição das informações mediante um título, cabeçalhos, dados e rodapé. Conforme a
tabela abaixo:
Tabela 3.1: Indicadores Económicos de Angola em 2020 (%)
Indicadores 2020
Saldo Orçamental ( % do PIB) - 1.7
Dívida Pública (% do PIB) 134, 2
Saldo Externo ( % do PIB) 16,6
Taxa de Crescimento do PIB (%) - 6,8
Taxa de Desemprego (%) 30,6
Taxa de Inação Anual (%) 25,1
Preço do Barril de Petróleo (USD) 42,8
Fonte: INE, Angola
Nota 3.0.1 Uma tabela compõe-se de:
• Corpo conjunto de linhas e colunas que contém informações sobre a variável em

estudo;
24
• Cabeçalho parte superior da tabela que especica o conteúdo das colunas;

• Coluna indicadora parte da tabela que especica o conteúdo das linhas;
• Linhas rectas imaginárias que facilitam a leitura, no sentido horizontal, de dados

que se inscrevem nos seus cruzamentos com as colunas;
• Casa ou célula espaço destinado a um só número;

• Título conjunto de informações, as mais completas possíveis, respondendo às
perguntas: O quê?- Quando?- Onde?- localizado no topo da tabela.
• Fonte referência de onde se obteve os dados, colocado, de preferência, no rodapé.
3.1 Séries Estatísticas

Dene-se série estatística como toda e qualquer coleção de dados estatísticos referidos a
uma mesma ordem de classicação: quantitativa. No sentido mais amplo, série é uma
sucessão de números referidos a qualquer variável. Se os números expressarem dados es-
tatísticos, a série será chamada de série estatística. Em sentido mais restrito, pode-se
dizer que uma série estatística é uma sucessão de dados estatísticos referidos a caracte-
res qualitativos, ao passo que uma sucessão de dados estatísticos referidos a caracteres
quantitativos congurará uma Distribuição de Frequência.
Denição 13 . É chamada séria estatística toda tabela que apresenta um conjunto de da-
dos estatísticos distribuídos em função da época ,local ou de espécie. Elas são classicadas
em : Temporais; Geográcas; Especícas e Distribuição de Frequências.
3.1.1 Series Temporais, Cronológicas, Históricas, Evolutivas (ou

Marchas)
A evolução cronológica é predominante nesse tipo de série. Observa-se a variação do
tempo, enquanto o facto e o local permanecem constantes. Também chamada de série
temporal, série histórica, série evolutiva ou marcha, identica-se pelo caráter variável do
factor cronológico. Assim, deve-se ter: Elemento variável: Época ou Tempo; Elementos
Fixos: Local e Fenómeno ou Facto.

Exemplo 3.1.1 (Serie Temporal, Cronológica, Histórica, Evolutiva (ou Marcha))
Tabela 3.2: Reservas Internacionais Líquidas (USD Mil Milhões) em 2020
Meses Reservas (em Mil Milhões de Dólares)

Janeiro 11,7
Fevereiro 10,9
Março 10,9
Abril 10,9
Maio 10,2
. Junho 10,4
Julho 10,3
Agosto 9,6
Setembro 9,3
Outubro 9,2
Novembro 9,2
Dezembro 9,1
Fonte: Elaborado pelos Autores a partir dos dados do BNA, 2020.
• Facto: Reservas Internacionais Liquidas de Angola em 2020 (constantes);
• Local: Angola; Tempo: Janeiro, Fevereiro, Março, Abril, Maio, Junho, Julho,
Agosto, Setembro, Outubro, Novembro e Dezembro (variável).
3.1.2 Séries Geográcas, Espaciais, Territoriais ou Localização

A descriminação segundo regiões é predominante nesse tipo de série, ou seja apresenta o
factor geográco como elemento variável. Nessa série, o local varia enquanto o tempo e o
facto permanecem constantes. A série geográca também é chamada espacial, territo-

rial ou localização.
Nota 3.1.1 (Série Geográca) Também chamada de série territorial, série espacial ou
série de localização, identica-se pelo caráter variável do factor geográco. Assim, deve-se
ter: Elemento variável: Local Elementos Fixos: Época e Fenómeno.

Exemplo 3.1.2 (Séries Geográcas, Espaciais, Territoriais ou Localização)
Tabela 3.3: Taxa de Desemprego da população por Região
Região Taxa de Desemprego ( %)

Cabinda 36,9
Luanda 24,3
Huíla 23,2
.
Huambo 17,1
Lunda Sul 39,7
Moxico 31,2
Média das Regiões 28,7
Fonte: Elaborado pelos Autores a partir dos dados do INE, 2015 - 2020.
• Facto : Taxa de desemprego (constante)
• Local : Cabinda, Luanda, Huíla, Huambo, Luanda Sul ,e Moxico. Tempo : Ano
de 2015 2020 ( constante)
3.1.3 Series Especicas ou Categóricas

Nesse tipo de série, predomina a descriminação segundo categorias ou especicações. O
local e o tempo permanecem constantes enquanto o facto varia. A série especica também
é chamada de categórica.
Nota 3.1.2 (Série Especíca) Também chamada de série categórica ou série por ca-
tegoria, identica-se pelo carácter variável de factor especicativo. Assim, deve-se ter:
Elemento variável: Fenómeno; Elementos Fixos: Local e Época
Exemplo 3.1.3 (Series Especicas ou Categóricas)

Tabela 3.4: Número de trabalhadores (sector público e privado) das várias classes de
salários em Angola 2018 - 2020
Salário (em Kwanzas) Número de Trabalhadores

Até 80.000 41. 326
De 80.000 a 119.000 123 236
De 120.000 a 159.000 428 904
De 160.000 a 199.000 324 437
. De 200.000 a 399.000 787 304
De 400.000 a 599.000 266 002
De 600.000 a 799.000 102 375
De 800.000 a 999.000 56 170
1.000.000 e mais 103 788
Total 2.233.542
Fonte: Elaborado pelos Autores a partir dos dados do MAPESS.
• Facto : Classes de Salários (Variável).
• Local : Angola; Tempo: Ano de 2018 - 2020 ( constante)
3.1.4 Séries Conjugadas ou Tabela de Dupla Entrada

As tabelas apresentadas anteriormente são tabelas estatísticas simples, onde apenas uma
série está representada. É comum, todavia, haver necessidade de apresentar, em uma
única tabela, mais do que uma série. Quando as séries aparecem conjugadas, tem-se
uma tabela de dupla entrada. Em uma tabela desse tipo são criadas duas ordens de
classicação: uma horizontal (linha) e uma vertical (coluna).
Exemplo 3.1.4 (Séries Conjugadas ou Tabela de Dupla Entrada)

Tabela 3.5: Inquérito do emprego em Angola (IEA), referente ao II trimestre de 2021.

.
Indicadores II Trimestre I Trimestre II Trimestre
2020 2021 2021
População com 15 ou mais anos 16 812 503 17 274 534 17 373 096
População Economicamente activa 14 844 944 15 565 225 15 675 396
População Empregada 10 072 567 10 821 205 10 715 234
População Desempregada 4 772 378 4 744 020 4 960 162
População Inactiva 1 967 558 1 709 309 1 697 700
Taxa de Actividade 88,3 90,1 90,2
Taxa de Emprego 59,9 62,6 61,7
Taxa de Desemprego 32,1 30,5 31,6
Taxa de Inactividade 11,7 9,9 9,8
Fonte: Elaborado pelos Autores a partir dos dados do INE,2021.
Observação 3.1.1 . Nem sempre uma tabela representa uma série estatística. Por ve-
zes, os dados reunidos não revelam uniformidade, sendo meramente um aglomerado de
informações gerais sobre determinado assunto, as quais, embora úteis, não apresentam a
consistência necessária para se congurar uma série estatística.
3.2 Grácos Estatísticos

A representação gráca das séries estatísticas tem por nalidade representar os resultados
obtidos, permitindo que se chegue a conclusões sobre a evolução do fenómeno ou sobre
como se relacionam os valores da série. A escolha do gráco mais apropriado cará a
critério do analista. Contudo, os elementos simplicidade, clareza e veracidade devem ser
considerados, quando da elaboração de um gráco.
• Simplicidade o gráco deve ser destituído de detalhes de importância secundária,

assim como de traços desnecessários que possam levar o observador a uma análise
morosa ou sujeita a erros.
• Clareza o gráco deve possibilitar uma correcta interpretação dos valores repre-
sentativos do fenómeno em estudo.
• Veracidade o gráco deve expressar a verdade sobre o fenómeno em estudo.
Nota 3.2.1 (Diretrizes para a Construção de um Gráco:) • O título do grá-

co deve ser o mais claro e completo possível. Quando necessário, deve-se acres-
centar subtítulos;

• A orientação geral dos grácos deve ser da esquerda para a direita;
• As quantidades devem ser representadas por grandezas lineares;
• Sempre que possível, a escala vertical há de ser escolhida de modo a aparecer a linha
0 (zero);
• Só devem ser incluídas no desenho as coordenadas indispensáveis para guiar o olhar

do leitor ao longo da leitura. Um tracejado muito cerrado diculta o exame do
gráco;
• A escala horizontal deve ser lida da esquerda para a direita, e a vertical de baixo
para cima;
• Os títulos e marcações do gráco devem ser dispostos de maneira que sejam facil-
mente lidos, partindo da margem horizontal inferior ou da margem esquerda.
Denição 14 Os grácos são desenhos que envolvem formas e cores cuja construção
utiliza técnicas de desenho. Eles processam as mesmas informações das tabelas, porém
produzem comunicação visual mais rápida, permitindo melhor compreensão das principais
características dos dados. Além disso, fazem correspondências entre elementos de uma
série estatística e uma gura geométrica, de tal modo que haja proporcionalidade nessa
representação.
levando em consideração os objectivos e os usos a que se destinam os grácos classicamse
em dois tipos : grácos de informação e grácos de análise. Se for levado em conta
o visual de acordo com a composição de formas, os principais tipos de grácos são:
• Diagramas (grácos geométricos em duas dimensões);
• Grácos polar ou radar ( par representar séries temporais cíclicas);
• Cartogramas ( ilustrações relativas a cartas geográcas); Pictogramas (representa-
ção gráca ilustrada por guras);
3.2.1 Diagramas
Os diagramas são grácos de representação geométrica num universo de duas dimensões.
Em geral, utiliza-se o sistema cartesiano para a construção gráca. Eles classicamse
em : linhas ou curvas; colunas ou barras; colunas (barras) múltiplas; e sectores

Grácos em Linha ou Curva
Os grácos em linha ou em curva são elaborados no espaço cartesiano e utilizam um par
de eixos ortogonais, que recebem o nome de eixos coordenados. Sendo que:
• O eixo das abscissas (eixo dos x) correspondente ao eixo horizontal;
• O eixo das ordenadas (eixo dos y) correspondente ao eixo coordenado vertical.
Exemplo 3.2.1 (Gráco em Linha ou Curva) . Os valores da variação de uma ca-

racterística são marcados no eixo das abscissas (no exemplo: anos), e os valores corres-
pondentes a outra variação no eixo das ordenadas (exemplo: vendas). Para a construção
do gráco em linha, consideramos os anos no eixo das abscissas e os correspondentes valo-
res das vendas no eixo das ordenadas. Posteriormente, consideramos os pares ordenados
e fazemos suas representações por meio de pontos grácos.
Figura 3.1: Vendas em milhares de kwanzas
Fonte: Dados Fictícios.
Grácos em Colunas ou em Barras
Nos grácos em colunas ou em barras, são feitas correspondências entre elementos de uma
série estatística e a gura geométrica de um retângulo, de tal modo que haja proporcio-
nalidade nessa representação.
• grácos de colunas : retângulos verticais.

• grácos de barras : retângulos horizontais.
Nota 3.2.2 . Podemos construir o gráco em colunas ou em barras. O Excel nos per-
mite a elaboração do gráco com diferentes visuais. Para construir o gráco em barras,
considera-se o comprimento do retângulo, associação ao número populacional e a largura
associada ao ano correspondente (exemplo 3.2.2).
Exemplo 3.2.2 (Gráco em Coluna ou em Barra) . População do Huambo de 2017

a 2020.
Figura 3.2: Gráco em Colunas
Figura 3.3: Gráco em Barras
Fonte: Dados Fictícios.
Grácos em Coluna ( Barras) Múltiplas
É a representação simultânea de dois ou mais fenómenos num mesmo gráco. Essa simul-
taneidade tem por objectivo permitir a comparação entre os fenómenos estudados. Esse
gráco também poderia ter sido construído em barras múltiplas.
Exemplo 3.2.3 (Grácos em Coluna ( Barras) Múltiplas) .

Figura 3.4: Inquérito do emprego em Angola (IEA), referente ao II trimestre de 2021
Fonte: INE, 2021.
Grácos em Sectores
Denição 15 (Grácos em Sectores) . É a representação gráca de uma série esta-

tística em círculo, por meio de sectores. É utilizado principalmente quando se pretende
comparar cada valor da série com o total.
• O gráco de sectores não deve ser empregado se houver mais de sete dados.
• O total é representado pelo círculo todo, cada subconjunto é representado por um
sector, de tal modo que haja proporcionalidade nessa representação.
• A representação da área de cada sector é obtida por uma regra de três simples. O
círculo corresponde ao ângulo de 360o e é associado ao valor total, um ângulo Xo

corresponde a um subconjunto do total (um dos dados).
Total −→ 360o (3.2.1)
Subconjunto −→ X o
Exemplo 3.2.4 (Gráco em Sector) . A representação gráca por sectores circulares

é feita com base a tabela 3.5 . Cada sector circular representará um indicador, e terá área
proporcional aos valores da taxa de actividade, de emprego, de desemprego e da taxa de
inactividade no II trimestre de 2021.

Figura 3.5: Inquérito do emprego em Angola (IEA), referente ao II trimestre de 2021
Fonte: INE, 2021.
Nota 3.2.3 Se o gráco for feito manualmente, sua construção deve ser proporcional aos
valores especicados na tabela 3.5. Por exemplo para o indicador taxa de emprego, temos:
193, 3 −→ 360o
61, 7 −→ X o
X = 115o
115o graus no circulo corresponde a 32 % da área do círculo, que por outro lado signica
que a população empregada representa 32 % da população economicamente activa. O
cálculo e análise são análogos para os demais indicadores.
3.2.2 Grácos Polar ( ou Radar)

É o gráco ideal para representar séries temporais cíclicas, isto é, séries que apresentam
em seu desenvolvimento determinada periodicidade. O gráco polar representa séries
temporais em que é possível comparar os valores da série com o valor de sua média arit-
mética. A média aritmética é representada por círculo ; por outro lado, cada ponto da
série poderá estar dentro ou fora do círculo. O visual do gráco polar facilita a compara-
variação da
ção de cada valor com a média aritmética. Alguns exemplos dessas séries :
quantidade de açúcar consumida durante o ano (ou mês; ou semana), variação

da frequência mensal dos funcionários de um supermercado, variação da pres-
são atmosférica numa estação climática durante o ano ( ou mês; ou semana),

variação do consumo de energia elétrica numa empresa frigoríca durante o

ano (ou mês ; ou semana).
Exemplo 3.2.5 (Gráco Polar ou Radar) . O valor médio é representado pelo cír-
culo de raio r = 15 constituído no gráco, dessa forma, os valores mensais da série podem
ser comparados ao valor médio.
Figura 3.6: Vendas em Milhares de Kwanzas
Fonte: INE, 2021.

Capítulo 4
Distribuição de Frequências
4.1 Conceitos Básicos

Ao analisarmos um conjunto de dados, devemos determinar se temos uma amostra ou
uma população. Essa determinação afectará não somente os métodos utilizados, mas
também as conclusões, pois se estamos trabalhando com uma amostra os resultados en-
contrados são estimativas da população.
Nem sempre é possível compreender o signicado contido numa amostragem por simples
inspeção visual dos dados numéricos coletados. Entretanto, entendemos que o sucesso
de uma decisão dependerá da nossa habilidade em compreender as informações contidas
nesses dados. O objectivo deste estudo é mostrar a organização, apresentação e análise
gráca de uma série de dados, matéria prima das distribuições de frequências e dos
seus grácos.
Denition 4.1.1 (Dados Primitivos ou Brutos) . São os dados colectados durante

a pesquisa e que ainda não foram organizados. São os dados originais, que ainda não se
encontram prontos para análise, por não estarem numericamente organizados. (Também
são conhecidos como Tabela Primitiva).
Denition 4.1.2 (Rol) . É a ordenação dos valores obtidos (dados brutos) em ordem
crescente ou decrescente de grandeza numérica ou qualitativa. São os dados brutos, orga-
nizados em ordem crescente ou decrescente.
Denition 4.1.3 (Classe) . Ao organizar os dados colectados, estes são subdivididos

convenientemente em categorias. Cada uma dessas subdivisões recebe o nome de classe.
36
Denition 4.1.4 (Frequência (fi )) . É o número de vezes que o elemento aparece na

amostra, ou o número de elementos pertencentes a uma classe. A frequência (fi ) também
pode ser designada de frequência simples ou frequência absoluta.
Denition 4.1.5 (Frequência Relactiva (f ri )) . A frequência relactiva de uma classe

é o quociente entre a frequência absoluta (fi ) da classe considerada e o número total
de dados (n) colectados na pesquisa. A frequência relactiva representa a proporção de
observações de um valor (ou de uma classe) em relação ao número total de observações,
o que facilita as comparações:
fi
f ri = (4.1.1)
n
Denition 4.1.6 (Frequência Relactiva Percentual (f ri %)) . A frequência relac-

tiva percentual de uma classe é o produto da frequência relactiva por 100:
f ri % = f ri × 100 (4.1.2)
Denition 4.1.7 (Frequência Acumulada (F aci )) . A frequência acumulada de uma

classe é a soma da frequência absoluta dessa classe com as frequências absolutas das classes
anteriores:
i
X
F aci = f1 + f2 + f3 + · · · + fn −→ F aci = fi (4.1.3)
1
Denition 4.1.8 (Frequência Relactiva Acumulada (F raci )) . A frequência relac-

tiva Acumulada (F raci ) de uma classe é a soma da frequência relactiva dessa classe com
as frequências relactivas das classes anteriores. Também pode ser calculada pela razão en-
tre a frequência acumulada da classe considerada e o número total de dados (n) colectados
na pesquisa:
i
X
F raci = f r1 + f r2 + f r3 + · · · + f rn −→ F raci = f ri (4.1.4)
1
ou
F aci
F raci = (4.1.5)
n
Denition 4.1.9 (Frequência Relactiva Acumulada Percentual (F raci %)) . A frequên-

cia relactiva acumulada percentual de uma classe é o produto da frequência relactiva acu-
mulada por 100:
F raci % = F raci × 100 (4.1.6)

4.2 Organização e Classicação de dados de Variáveis

Qualitativas.
Variável qualitativa: expressa uma qualidade ou atributo. A organização e classicação
de dados qualitativos é feita após a realização de uma pesquisa. Portanto a mesma é
representada numa tabela de distribuição de frequência. Na mesma devemos ter em conta
que uma das colunas descrimina as classe e a outra coluna corresponde à frequência.
Ademais cada uma classe corresponde a uma categoria e a frequência absoluta indica o
número de repetições para cada categorias.
Exemplo 4.2.1 Uma empresa de publicidade realizou uma pesquisa sobre o estado civil
dos compradores de alimentos congelados de um determinado supermercado, assumindo
as categorias : solteiro, casado, viúvo e separado. Foram encontradas as respostas
constantes na tabela abaixo.
Figura 4.1: Estado civil dos compradores de congelados de um supermercado
• O número de dados colectados na pesquisa é n = 56.
• A tabela de distribuição de frequência referente aos dados colectados na pesquisa é

dada por:
Classe (i) Estado Civil (xi ) Frequência(fi )

1 Solteiro 13
2 Casado 22
3 Viúvo 4
4 Separado 17
Total 56
• As categorias que constam na pesquisa são: Solteiro, Casado, Viúvo e Divorciado.

• A tabela que discrimina os valores da frequência absoluta, frequência relactiva,

frequência relactiva percentual, frequência acumulada, frequência relactiva acumu-
lada e frequência relactiva percentual acumulada é dada por:
Classe (i) Estado Civil (xi ) fi f ri f ri % F aci F raci F raci %

1 Solteiro 13 0,2321 23,21 13 0,2321 23,21
2 Casado 22 0,3929 39,29 35 0,6250 62,50
3 Viúvo 4 0,0714 7,14 39 0,6964 69,64
4 Separado 17 0,3036 30,36 56 1,0000 100,00
Total 56 1,0000 100,00
4.3 Organização e Classicação de Dados de Variáveis

Quantitativas
Variável quantitativa: Os valores são expressos por números. A organização e classicação
de dados quantitativos é feita após a realização de uma pesquisa. Portanto a mesma é re-
presentada numa tabela de distribuição de frequência. Os dados quantitativos permitem
duas formas de representação na elaboração das tabelas de distribuição de frequência.
Eles podem ser ou não agrupados em intervalos de classe.
Opções para tabelas de distribuição de frequências para os dados numéricos:
• Distribuição de frequência de dados numéricos não agrupados em intervalos de
classe;
• Distribuição de frequência de dados numéricos agrupados em intervalos de classe.
4.3.1 Distribuição de Frequências de Dados Numéricos não Agru-

pados em Intervalos de Classe.
Os dados numéricos colectados assumem pequena quantidade de valores pontuais. Dessa
forma, cada valor numérico isolado representa uma categoria; sendo assim, a obtenção da
tabela de distribuição de frequência é análoga ás tabelas de dados de variáveis qualitativas.
Exemplo 4.3.1 Uma pesquisa realizada numa fábrica revela o número de peças com de-
feitos por caixa:
• O número de dados colectados na pesquisa é n = 30.

Figura 4.2: Estado civil dos compradores de congelados de um supermercado
• A tabela de distribuição de frequência referente aos dados colectados na pesquisa é

dada por:
Classe (i) Peças com defeito por caixa (xi ) Frequência(fi )

1 0 14
2 1 11
3 2 5
Total 30
• As categorias que constam na pesquisa são: 0,1,2 peças com defeitos por caixa.
• A tabela que discrimina os valores da frequência absoluta, frequência relactiva,

frequência relactiva percentual, frequência acumulada, frequência relactiva acumu-
lada e frequência relactiva percentual acumulada é dada por:
Classe (i) Peças/Defeito(xi ) fi f ri f ri % F aci F raci F raci %

1 0 14 0,4667 46,67 14 0,4667 46,67
2 1 11 0,3667 36,67 25 0,8334 83,34
3 2 5 0,1667 16,67 30 1,0000 100,00
Total 30 1,0000 100,00
4.3.2 Distribuição de Frequências de Dados Numéricos Agrupa-

dos com Intervalos de Classe.
A distribuição de frequência de dados numéricos agrupados tem uma característica di-
ferente das demais frequências, pelo facto de que cada classe não representa um valor
individual, e sim conjunto de valores dentro de um intervalo.
A vantagem de fazermos com que cada classe represente um conjunto da valores dentro
de um intervalo é que reduz a extensão da tabela, além de facilitar a visualização e o
entendimento dos dados colectados como um todo.

Assim, os passos necessários para a elaboração da tabela de distribuição de dados numé-
ricos agrupados em intervalos de classe são:
• Determinação do número de classe (k);
• Amplitude amostral (AA);
• Cálculo da amplitude do intervalo de classe (h);
• Limite inferior e superior do intervalo de classe;
• Determinação dos intervalos de classe;
• Determinação das frequências dos intervalos de classe;
• Amplitude total (AT).
Determinação do Número de Classe (k)
O número de classe que irá compor a tabela pode ser estabelecido pelo estatístico que
elabora a pesquisa, ou seja, o estatístico é sempre soberano para decidir o número de
classes. Para tornar o processo mais uniforme, existem algumas sugestões para estabelecer
o número de classes em função do número de dados da tabela.
• Primeira sugestão: É a fórmula desenvolvida pelo matemático Sturges para o
cálculo do número de classe:
k = 1 + 3, 322 × logn (4.3.1)
sendo k= número de classes; n= número de elementos colectados na pesquisa.
• Segunda Sugestão: É uma opção mais simples, em que se recomenda a utilização
quando o número de dados colectados for menor ou igual a 50.
√
k= n n ≤ 50 (4.3.2)
Amplitude Amostral (AA)
A amplitude amostral é a diferença entre o maior e o menor valor observado nos valores
colectados
AA = Xmx − Xmin (4.3.3)
onde, Xmx é o maior valor observado e Xmin é o menor valor observado.

Cálculo da Amplitude do Intervalo de Classe (h)
Uma vez que se saiba com quantas classes vamos construir a tabela de distribuição de
frequência, pode-se passar ao cálculo da amplitude do intervalo de classe.
AA
h= (4.3.4)
k
onde AA é amplitude amostral e k é o número de classes.
Observação 4.3.1 Na estatística, é conveniente a uniformização da amplitude de inter-

valo de classe, ou seja, a mesma para todas as classes. O valor obtido no cálculo da
amplitude de classe nem sempre é um valor exacto, sendo assim, para preservar o número
de classes estabelecido, faz-se o arredondamento da amplitude de classe para valores acima
do valor obtido.
O valor da amplitude de classe (h) deve ser arredondado para valores convenientes e
coerentes com os dados colectados. Por exemplo, se todos os dados colectados forem
múltiplos de cinco, a amplitude do intervalo de classe deverá ser arredondada para o
múltiplo de cinco imediatamente superior ao valor obtido, Entretanto, cada caso deverá
ser analisado de acordo com a coerência dos dados colectados.
Limite Inferior e Superior do Intervalo de Classe
Os valores do conjunto que compõem o intervalo de classe estão limitados entre dois
números que representam o extremo inferior e o superior do intervalo. A matemática
admite intervalos abertos, fechados e a composição de aberto/fechado.
• Na estatística, o intervalo de classe, em geral, corresponde a um intervalo fechado à
esquerda e aberto a direita, utilizando a representação do símbolo "`".
O limite inferior (li ) é menor valor numérico do intervalo de classe. É escrito à
esquerda do intervalo de classe (li `). O limite inferior localiza-se no intervalo
de classe fechado à esquerda.
O limite superior (Li ) é o maior valor numérico do intervalo de classe . É
escrito à direita do intervalo de classe (` Li ). O limite superior localiza-se no
intervalo de classe aberto à direita.
• O limite de classe é representado por:
li ` Li (4.3.5)

Figura 4.3: Símbolos nas representações para intervalos abertos e fechados
Amplitude Total (AT)
A amplitude total (AT) é calculada levando-se em conta os valores dos intervalos de
classe da tabela de distribuição de frequência. É Expressa pela diferença entre o maior e
o menor valor observado nos intervalos de classe da tabela de distribuição de frequência.
Isso corresponde à diferença entre o limite superior do último intervalo de classe e o limite
inferior do primeiro intervalo de classe.
! !
Limite superior do Limite inferior do
AT = − (4.3.6)
último intervalo de classe primeiro intervalo de classe
Frequência Simples ou Absoluta
A frequência simples ou absoluta para dados agrupados com intervalo de classe é obtida
para cada classe, pela contagem do número de dados colectados dentro do intervalo de
classe. A soma de todas as frequências é:
n = f1 + f2 + f3 + · · · + fk (4.3.7)
Sendo n o número total de dados colectados na amostra. Podemos representar a soma
de frequências pelo símbolo de somatório
k
X k
X
n = f1 + f2 + f3 + · · · + fk = fi −→ fi = n (4.3.8)
i=1 i=1

Ponto Médio de uma Classe (xi )
O conceito de ponto médio de uma classe é utilizado na distribuição de frequência de
dados numéricos agrupados em intervalos de classe.
Ponto médio de um intervalo de classe (xi ) é o ponto que por situar-se numa posição
média da distribuição de valores do intervalo de classe, divide o intervalo em duas partes
iguais:
li + Li
xi = (4.3.9)
2
Exemplo 4.3.2 (Dados agrupados com intervalo de classes) . Considere o peso

(Kg) de 50 estudantes do sexo masculino da Faculdade de Economia do Huambo, na
gura abaixo:
Figura 4.4: Peso de 50 estudantes do sexo masculino da Faculdade de Economia
√
• Número de classe: k = 50 ≈ 7
• Amplitude amostral: AA = 97 − 33 = 64
• Amplitude do intervalo de classe: h = 64

7
≡ 10
• A tabela discriminatória das frequências e os pontos médios é dada por:

Classes (k) Peso (kg) fi fri fri % faci fraci fraci % xi

1 30 ` 40 4 0,08 8 4 0,08 8 35
2 40 ` 50 6 0,12 12 10 0,20 20 45
3 50 ` 60 8 0,16 16 18 0,36 36 55
4 60 ` 70 13 0,26 26 31 0,62 62 65
5 70 ` 80 9 0,18 18 40 0,80 80 75
6 80 ` 90 7 0,14 14 47 0,94 94 85
7 90 ` 100 3 0,06 6 50 1,00 100 95
P
50 1 100
• Amplitude total: AT = 100 − 30 = 70.
4.4 Representação Gráca de uma Distribuição de Frequên-

cia
A representação gráca de uma distribuição de frequências pode ser feita de três formas
diferentes:
• Histograma;
• Polígono de Frequência;
• Polígono de Frequência Acumulada (Ogiva de Galton);
4.4.1 Histograma
O Histograma, é uma representação estatística do gráco da distribuição da frequência.
É também considerado como um diagrama de colunas em que cada retângulo está rela-
cionado com uma classe da distribuição de frequência. É formado por um conjunto de
retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que
seus pontos médios coincidem com os pontos médios dos intervalos de classe.
• As larguras dos retângulos são iguais às amplitudes dos intervalos de classe, isto
é, a largura de cada retângulo é dada pela amplitude do intervalo de classe que
representa. O eixo das abscissas corresponde ao eixo dos intervalos de classe:
hi = Li − li (4.4.1)
• As alturas dos retângulos devem ser proporcionais às frequências das classes, sendo
igual a amplitude dos intervalos, ou seja, O eixo das coordenadas corresponde ao

eixo das frequências, em que as alturas dos retângulos representam a frequências
ou, mais especicamente, a altura de cada retângulo representa a frequência (fi ) da
classe correspondente.
• Propriedades dos histogramas:
A Área do histograma é proporcional à soma das frequências;
Utilizando as frequências relactivas obtemos um gráco de área unitária
A=1 (4.4.2)
Pelo histograma de frequências relactivas podem-se comparar duas ou mais
distribuições.
Exemplo 4.4.1 (Histograma) . A partir da tabela de frequência do exemplo 4.3.2,

obtém-se:
Figura 4.5: Histograma da distribuição dos pesos de 50 estudantes
4.4.2 Polígono de Frequência

O polígono de Frequência é um gráco de conguração linear. Para obter o polígono de
frequência, calcula-se o ponto médio de cada intervalo de classe, e marca-se esse ponto no

lado superior do respectivo retângulo do histograma. A linha do polígono de frequência
é obtida pela união desses pontos médios. O eixo das abscissas corresponde ao eixo dos
pontos médios dos intervalos de classe, e o eixo das ordenadas representa o eixo das
frequências.
Nota 4.4.1 Polígono de frequência é um gráco em linha, sendo as frequências marca-

das sobre perpendiculares ao eixo horizontal, levantada pelos pontos médios dos intervalos
de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a -
gura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira
e da posterior à última, da distribuição.
Figura 4.6: Polígono de frequência da distribuição dos pesos de 50 estudantes
4.4.3 Polígono de Frequência Acumulada (ogiva de Galton)

Distribuição de frequência em intervalo de classes
o polígono de frequência acumulada (ou ogiva de Galton) para a distribuição de frequência
em intervalo de classes é um gráco de conguração linear
• No eixo das abscissas, são marcados os intervalos de classe. A marcação dos pontos
sobre o eixo das abscissas é idêntica ao histograma;
• No eixo das ordenadas são marcados os valores das frequências acumuladas para
cada intervalo de classe.

Polígono de frequência acumulada é traçado marcando-se as frequências acumuladas so-
bre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites
superiores dos intervalos de classe.
Figura 4.7: Polígono de frequência acumulada da distribuição dos pesos de 50 estudantes
Distribuições de frequências sem intervalos de classe
Uma distribuição de frequência sem intervalos de classe é representada gracamente por
um diagrama onde cada valor da variável é representado por um segmento de reta vertical
e de comprimento proporcional à respectiva frequência, isto é, é representada gracamente
por um conjunto de segmentos de reta verticais ( gráca em hastes ou bastões)


Capítulo 5
Medidas de Posição: Medidas de

Tendência Central
A análise dos dados colectados pode ser feita sob diferentes aspectos, em que cada foco
verica um tipo de informações a respeito do comportamento ou da tendência do fenó-
meno em exame. Isso está de acordo com a estatística, pois um dos seus objectivos é
buscar leis de comportamento para o conjunto de dados colectados.
No entanto, para ressaltar as tendências características de cada distribuição, isoladamente,
ou em confronto com outras, necessitamos introduzir os elementos típicos da distribuição,
que são:
• Medidas de posição;
• Medidas de variabilidade ou dispersão;
• Medidas de assimetria;
• Medidas de curtose.
As medidas de posição mais importantes são as medidas de tendência central, que desta-
camos: A média aritmética; A mediana; A moda. As outras medidas de posição são

as separatrizes, que englobam: A mediana; Os quartis; Os decis; Os percentis.
As medidas de tendência central também são chamadas de Promedios. Essa denomina-
ção ocorre porque os dados observados tendem a agrupar- se em torno dos valores centrais
da distribuição. Outros promédios menos utilizados são a média geometria, media har-
mónica, media quadrática, media cubica etc. Há dois tipos de média aritmética: Média
aritmética simples; Média aritmética ponderada;
50
5.1 Média Aritmética (x)

A média aritmética é uma das informações mais importantes da analise estatística. A
média aritmética é uma medida de posição de tendência central, mesmo que ela não
se encontre necessariamente no centro da distribuição, pois na verdade ela corresponde a
uma das posições de equilíbrio entre os dados colectados.
Para o cálculo da média aritmética (x) devemos levar em conta o agrupamento ou não dos
dados: Dados não agrupados; Dados agrupados (em intervalos de classe e sem intervalos
de classe)
Nota 5.1.1 Notação de média aritmética: x (lê-se: "X traço"ou "X barra")
5.1.1 Média Aritmética de Dados não Agrupados

A média aritmética de dados não agrupados corresponde ao cálculo de média aritmética
simples. É recomendada a utilização da média aritmética de dados não agrupados quando
os valores que compõem a série estatística tendem a ser homogéneos. Isso signica que
não existem valores muito grandes ou muito pequenos na série.
Denition 5.1.1 A Média aritmética simples (x): é calculada por meio da divisão entre
a soma dos valores da série pelo total de valores. É o quociente da divisão da soma dos
valores da variável pelo número deles. A média (aritmética) é, de modo geral, a mais
importante de todas as medidas descritivas.
Pn Pn
x1 + x2 + x3 + · · · + xn i=1 xi i=1 xi
x= = −→ x = (5.1.1)
n n n
Onde: x = média aritmética, xi = variável em estudo, n = número de dados colectados

na pesquisa.
Exemplo 5.1.1 Uma empresa de seguros do Huambo vende apólices de seguro de vida.
O número de a apólices vendidas mensalmente no ano de 2020 estão registados na tabela
abaixo:
Tabela 5.1: Venda de apólices de seguros

Jan. 16 Abr. 29 Jul. 13 Out. 15
Fev. 12 Maio 20 Agos. 32 Nov. 25
Mar. 26 Jun. 24 Set. 24 Dez. 16

• A média mensal de apólices vendidas durante o ano é dado é dada por:
xi = apólices vendidas durante o mês (variável em estudo)

n = 12 (número de dados colectados na pesquisa)
Pn P12
i=1 xi i=1 xi
x= =
n 12
16 + 12 + 26 + 29 + 20 + 24 + 13 + 32 + 24 + 15 + 25 + 16
=
12
252
= = 21.
12
• A média mensal de apólices vendidas no mês durante o ano: x = 21 apólices.
• Considerando a venda total ocorrida no ano, o valor médio corresponde à venda

total dividida em 12 partes iguais, ou seja. é como se as vendas fossem constantes
(uniformes, como se a empresa tivesse vendido 21 apólices em cada um dos meses
que constituem o ano.
Desvio em Relação à Média (di )
O desvio em relação a média é a diferença entre um valor colectado na pesquisa e o valor
médio. O desvio mede o afastamento do valor colectado na pesquisa em relação ao valor
médio.
d i = xi − x (5.1.2)
• Propriedade do desvio em relação a média: a soma de todos os desvios em
relação ao valor médio é igual a zero:
n
X
di = 0 (5.1.3)
i=1
• No exemplo (5.1.1), o valor médio é x = 21 apólices, o desvio de cada valor em
relação ao valor médio é calculado pela expressão:
di = xi − 21. (5.1.4)
Média Aritmética Ponderada
A média aritmética ponderada também é chamada de média ponderada. Um dos sig-
nicados da palavra ponderar é "pesar". No cálculo da média ponderada, cada valor

colectado na série tem uma participação proporcional ao seu peso, isto é, proporcional à
sua importância relactiva no conjunto.
A média aritmética ponderada ou média ponderada é a soma das variáveis multiplicadas
pelos seus pesos (pi ), dividida pela soma dos pesos de cada variável.
x 1 p 1 + x2 p 2 + x2 p 2 + · · · + xn p n
x= (5.1.5)
p1 + p2 + p3 + · · · + pn
Onde: x = média aritmética ponderada, xi = variável em estudo, pi = peso da variável.
Exemplo 5.1.2 Numa empresa, temos 15 trabalhadores com salário de 800,00 USD, 25
com salário de 1 200,00 USD, 12 com salário de 1 600,00 USD e 4 com salário de 1
800,00 USD.
• x = média aritmética ponderada;
• xi = salário dos trabalhadores (variável em estudo);
• Pi = número de trabalhadores por salário (peso da variável).
15 × 800 + 25 × 1.200 + 12 × 1.600 + 4 × 1.800

x=
15 + 25 + 12 + 4
68.400
= = 1.221, 43
56
• A média salarial dessa empresa é de 1.221,43 USD.
Nota 5.1.2 (Diferenças entre os dois tipos de média aritmética.) • Média arit-
mética simples: Todas as variáveis têm a mesma importância, ou seja, o mesmo
peso;
• Média aritmética ponderada: As variáveis têm diferentes importâncias relati-

vas, ou, ainda diferentes pesos relativos.
5.1.2 Média Aritmética para dados Agrupados sem Intervalos de

Classe
A média aritmética para dados agrupados processa-se por meio do cálculo da média arit-
mética ponderada. Nesse caso, a ponderação é caracterizada pelo número de repetições
de cada valor, ou, mais especicamente, pela frequência.

A média aritmética é obtida pelo quociente entre o somatório dos produtos de cada variável
pelo respectivo peso (frequência) e o somatório das frequências
Pn Pn
i=1 xi fi i=1 xi f i
x= P ou x= (5.1.6)
fi n
Onde: x = média aritmética, xi = variável em estudo, fi = frequência (peso da
variável).
Exemplo 5.1.3 A seguradora Nossa Seguro, verica em determinado produto quais são
os segurados que estão com parcelas atrasadas. O contrato estabelece a cobrança de multa
para os pagamentos em atraso. A gura 5.1, registra o número de clientes versus o número
de meses em atraso.
Figura 5.1: Distribuição do número de clientes com parcelas atrasadas.
• O número total de clientes em atraso é : n = 12 + 16 + 21 + 15 + 13 + 10 = 87

clientes.
• O número médio de meses em atraso dessa distribuição é dada por:

Pn
i=1 xi f i
x=
n
12 × 1 + 16 × 2 + 21 × 3 + 15 × 4 + 13 × 5 + 10 × 6
=
12 + 16 + 21 + 15 + 13 + 10
292
= = 3, 36 ≈ 3 meses.
87

5.1.3 Média Aritmética para Dados Agrupados com Intervalos de

Classe: Média Aritmética Ponderada
A média aritmética para dados agrupados com intervalo de classe, também processa-se
por meio do cálculo da média aritmética ponderada.A ponderação será dada pela
frequência de cada classe.
A média aritmética para dados agrupados com intervalo de classe é obtida pelo somatório
dos produtos médios de cada intervalo de classes pelas respectivas frequências (peso)
dividida pelo somatório das frequências (peso).
Pn Pn
i=1 xi fi i=1 xi f i
x= P ou x= (5.1.7)
fi n
Sendo
• xi = ponto médio do intervalo de classe.
• fi = frequência da classe.
Observação 5.1.1 Tal como abordado anteriormente, o ponto médio de uma classe (xI )
é o ponto que por situar-se numa posição média da distribuição de uma classe de valores
do intervalo de classe, divide o intervalo em duas partes iguais:
li + Li
xi = (5.1.8)
2
Exemplo 5.1.4 Com objectivo de regulamentar a conguração interna de aviões de trans-

porte de passageiros, para especicar a distância entre o encosto e assento, e a largura das
cadeiras das aeronaves. A TAAG, realizou um levantamento das estaturas dos passagei-
ros, através de uma amostra composta por um grupo de passageiros , sendo os resultados
apresentados na tabela abaixo:

Tabela 5.2: Distribuição das Estaturas
Estatutas (Cm) Passageiros (fi ) Ponto Médio (xi ) xi × f i

150 ` 157 7 153,5 1.074,5
157 ` 164 19 160,5 3.049,5
164 ` 171 25 167,5 4.187,5
171 ` 178 26 174,5 4.537,0
178 ` 185 21 181,5 3.811,5
185 ` 192 8 188,5 1.508,0
192 ` 199 3 195,5 586,5
Total 109 18.754,5
• A estatura média dos passageiros é dada por:

Pn
i=1 xi f i 18.754, 5
x= = = 172, 06 cm.
n 109
5.2 Outras Médias

A média aritmética é a mais usada mas, além desta, existem outras duas médias que
também se usam em determinadas situações, mas menos frequentemente: a Média Ge-

ométrica e a Média Harmónica.
5.2.1 Média Geométrica (Mg )

1. Dados não Agrupados: A média geométrica (Mg ) de um conjunto de n observa-
ções x1 , x2 , x3 , · · · , xn n do produto dessas observações.

é a raiz de ordem Ou seja,
a média geométrica de um conjunto de n observações, x1 , x2 , x3 , · · · , xn dene-se
como a raíz índice n do produto dos n valores x1 , x2 , x3 , · · · , xn
" n # n1
√ 1
Y
Mg = n
x1 .x2 .x3 . · · · .xn = (x1 , x2 , x3 , · · · , xn ) =
n xi (5.2.1)
i=1
Aplicando logaritmos (naturais) a fórmula (5.2.1) pode ser escrita:
n
1X
lnMg = lnxi (5.2.2)
n i=1
No caso, de dados agrupados, a raiz índice n do produto dos valores observados
elevados às respectivas frequências

2. Dados Agrupados sem Intervalos de Classe:

"
m
# n1
p Y
Mg = n
(x1 )n1 .(x2 )n2 .(x3 )n3 · · · .(xm )nm = (xj )nj (5.2.3)
j=1
Onde xi é o valor observado e ni é o número de observações da classe.
3. Dados Agrupados com Intervalo de Classe:

"m # n1
p Y
Mg = n (x1 )n1 .(x2 )n2 .(x3 )n3 · · · .(xm )nm = (xj )nj (5.2.4)
j=1
Onde xi é o ponto médio e ni é o número de observações da classe. Aplicando
logaritmos (naturais) a fórmula (5.2.3) pode ser escrita:
m
1X
lnMg = nj lnxj (5.2.5)
n j=1
Exemplo 5.2.1 Uma das situações em que se recorre à média geométrica é a deter-
minação da taxa de crescimento média de uma variável num determinado período.
Admita-se, por exemplo, que o Produto Interno Bruto (PIB) de um país cresceu no período
de 5 anos às seguintes taxas decrescimento anuais: 1%, 1, 5%, 2, 5%, 1, 2% e 0, 8%.
• A taxa decrescimento anual média no período dos 5 anos, poder-se-ia calcular a

média aritmética das taxas anuais, o que estaria evidentemente incorrecto.
• De facto, considere-se o caso geral em que uma variável x tem às taxas, respec-
tivamente, r1 , r2 , · · · , rn . Então nos anos seguintes ao ano 0 têm-se os seguintes
valores:
x1 = x0 + r1 x0 = (1 + r1 )x0 (5.2.6)
x2 = x1 + r2 x1 = (1 + r2 )x1 = (1 + r2 )(1 + r1 )x0

x3 = x2 + r3 x2 = (1 + r3 )x2 = (1 + r3 )(1 + r2 )(1 + r1 )x0
·
xn = xn−1 + rn xn−1 = (1 + rn )xn−1 = (1 + rn ) · · · (1 + r2 )(1 + r1 )x0
• A taxa de crescimento anual média de x nos n anos é r tal que
xn = (1 + r)n x0 (5.2.7)

Igualando os valores obtidos para xn nas duas últimas equações vem:
(1 + r)n = (1 + rn ) · · · (1 + r3 )(1 + r2 )(1 + r1 ) (5.2.8)
ou seja, o factor 1 + r vem dado por:

p
n
(1 + r) = (1 + rn ) · · · (1 + r3 )(1 + r2 )(1 + r1 ) (5.2.9)
• A equação (5.2.9) é, precisamente, a média geométrica dos n factores (1+rn ), · · · , (1+

r3 ), (1 + r2 ), (1 + r1 ).
• Assim, a taxa de crescimento anual média do PIB naqueles 5 anos é r, dada por:
p
5
(1 + r) = 1, 01 × 1, 015 × 1, 025 × 1, 012 × 1, 008 = 1, 014
(1 + r) = 1, 014 −→ r = 0, 014(1, 4%).
• A taxa de crescimento anual média foi de aproximadamente r = 0, 014, isto é 1, 4%

ao ano.
5.2.2 Média Harmónica (Mh

A média harmónica (Mh ) do conjunto de valores, x1 , , x2 , · · · , xn , dene-se como o inverso
da média dos inversos destes valores.
Sejam x1 , x2 , x3 , · · · , xn, valores de x, associados às frequências absolutas n1 , n2 , n3 , · · · , nm ,

respectivamente. A média harmónica de X é denida por:
• Dados não Agrupados:
1 n
Mh = 1
Pn 1 = Pn 1 (5.2.10)
n i=1 xi i=1 xi
• Dados Agrupados:
1 n
Mh = 1
Pm nj = Pm nj (5.2.11)
n j=1 xj j=1 xj
Para dados agrupados sem intervalo de classe xj é o valor da variável observada.
Para dados agrupados com intervalo de classe xj é o ponto médio da classe.
Exemplo 5.2.2 Admite-se que uma família tem um orçamento mensal xo para adquirir
durante n meses um dado produto. Sejam q1 , q2 , · · · , qn as quantidades e p1 , p2 , · · · , pn os

respectivos preços. Para determinar o preço médio do produto utiliza-se a média harmónica
e não a média aritmética dos preços porque as quantidades são diferentes.
• Considerando o montante do orçamento por M ,tem-se M = pi qI para cada mês e,

portanto, qi = M
pi
. O preço médio é dado por:
Pn
pi q i nM n
Pi=1
n = Pn M = Pn 1 (5.2.12)
i=1 qi i=1 pi i=1 pi
que,é precisamente, a média harmónica dos preços.
5.2.3 Fórmula Geral das Médias

As médias aritmética, geométrica e harmónica são casos particulares de uma média geral,
denominada média de ordem q , representada por M (q) e assim denida:

" n
# 1q
1X q
M (q) = x (5.2.13)
n i=1 i
Esta é conhecida por fórmula geral das médias e como se pode vericar facilmente dá
a média aritmética para q=1 e a média harmónica para q = −1. Com efeito, com q=1
tem-se:
n
1X
M (1) = xi = x (5.2.14)
n i=1
e com q = −1
1
M (−1) = 1
Pn 1 = Mh (5.2.15)
n i=1 xi
A média geométrica corresponde ao caso q = 0, um pouco mais difícil de vericar, tal
como abordado anteriormente, o logaritmo da média geométrica é a média dos logaritmos
dos valores. Então quando q = 0, tem-se uma indeterminação na última equação da forma
0
que pode ser levantada recorrendo ao teorema de L'Hopital e encontra-se:
0
1
Pn q n
n 1=1 xi ln xi 1X
ln M (0) = lim 1
P n q = ln xi = ln Mg (5.2.16)
q→0
n i=1 xi n i=1

5.3 Moda (M0)

Moda é o valor que ocorre com maior frequência nos dados obtidos numa coleta ( esse
valor denominado valor modal ).
Nota 5.3.1 A série pode ser classicada em função da quantidade de valores modais:
• Série amodal: não tem valor modal;
• Série unimodal: um valor modal;
• Série bimodal: dois valores modais;
• Série trimodal: três valores modais;
• Série polimodal: quatro ou mais valores modais.
Figura 5.2: Exemplos de representação gráca da moda
5.3.1 Cálculo da Moda para Dados não Agrupados

Numa série estatística em que os dados não são agrupados, o valor modal corresponde ao
valor com maior número de ocorrência, ou seja, é o valor que ocorre com maior frequência
em um conjunto de dados, e que é denominado valor modal. Baseado nesse contexto, um
conjunto de dados pode apresentar mais de uma moda.
Exemplo 5.3.1 Dada a série estatística constituída pelos dados brutos:
4, 7, 5, 7, 10, 2, 12, 8, 7, 5, 2, 10, 8, 11, 7, 3, 9, 6, 8
• Organizando os dados em ordem crescente(rol);
2, 2, 3, 4, 5, 5, 6, 7, 7, 7, 7, 8, 8, 8, 9, 10, 10, 11, 12.
• Observando a série, verica-se uma repetição dos valores 2 (2 vezes); 5 (2 vezes);

7 (4 vezes); 8 (3 vezes) e 10 (2 vezes).

• Então: Mo = 7 é o valor modal da série (pois é o valor com maior número de

repetições).
5.3.2 Cálculo da Moda para Dados Agrupados sem Intervalo de

Classe
Após o agrupamento dos valores coletados numa tabela de Distribuição de frequência, ca
fácil a determinação do valor modal.
Denição de Moda
A moda é o valor da variável que corresponde à classe de maior frequência (classe modal).
Para a determinação da moda, numa tabela de distribuição de frequência com todos dados
agrupados sem intervalo de classe, devemse executar os passos a seguir:
• Primeiro passo: localizar a classe modal. Classe modal é a classe que contém o
maior valor de frequência;
• Segundo passo: vericar o valor da variável contido na classe modal.
Exemplo 5.3.2 Foi realizada uma pesquisa para determinar o tipo de electrodoméstico
mais vendido pela OK IMOBILIÁRIO do Huambo, entre geladeiras, freezers, fogões, ma-
quinas de lavar e secadoras). Os dados coletados pelo período de uma semana estão
registrados na tabela
Tabela 5.3: Distribuição da venda de electrodomésticos

Electrodoméstico Unidades Vendidas (fi )
Fogão 53
Geleira 82
Maquina de lavar roupa 33
Freezers 26
Secadora 31
Total 225
• Variável em estudo: electrodoméstico;
• A 2a classe é a classe modal, pois é a classe que contém o maior valor de frequência;
• A variável contida na 2a classe é geladeira, então: M0 = geladeira.
• Isso signica que a geladeira foi o eletrodoméstico mais vendido (Moda).

Exemplo 5.3.3 A tabela 5.4 registra o número diário de carros alugados por uma Renta
Car do Huambo, durante um período de 100 dias.
Tabela 5.4: Distribuição da venda de electrodomésticos

Carros Alugados Dias (fi )
25 5
30 13
35 28
40 36
45 18
Total 100
• O valor modal é o 40 carros diários alugados, pois esse valor caracteriza o maior
número de ocorrências (f4 = 36) durante o período em estudo, M0 = 40.
5.3.3 Cálculo da Moda para Dados Agrupados com Intervalo de

Classe
Quando os dados estão agrupados ou sem classes, o cálculo da moda é mais complicado.
A moda é agora um valor pertencente à classe com maior frequência, a classe modal. A
forma mais simples de obtenção da moda, neste caso, é tomar como moda o ponto médio
da classe modal. Tal como foi feito para os dados agrupados sem intervalo de classe,
devem-se executar os passos a seguir:
• Primeiro Passo: localizar a classe modal, ou seja, a classe que contém o maior
valor de frequência;
• Segundo passo: Sabemos que a moda é um valor contido no intervalo de classe
modal. Para o cálculo da moda têm sido proposto muitos métodos, um destes
métodos baseia-se na Fórmula de King e aplica-se quando todas as classe têm a
mesma amplitude h:

fM0 post
M0 = lM0 + × hM0 (5.3.1)
fM0 ant + fM0 post
onde M0 , hM0 representa o limite inferior da classe modal, amplitude da classe modal
e fM0 ant, fM0 post representam, respectivamente, as frequências das classes anterior
e posterior à classe modal.
• Uma outra fórmula de cálculo que também tem sido proposta baseia-se na hipó-
tese de que a moda se deve encontrar dentro da classe modal mais para o lado da

classe que tem maior frequência. Com esta hipótese, pode-se admitir-se a seguinte
proporcionalidade:
fM0 − fM0 post fM0 − fM0 ant
= (5.3.2)
LM0 − M0 M0 − lM0
onde f M0 e LM0 representam, respectivamente, a frequência e o limite superior da
classe moda e os restantes símbolos têm o signicado anterior. A formula (5.2.2)
pode apresentar-se numa forma análoga à da fórmula de King. Para tal basta
eliminar o limite superior da classe modal por substituição de LM0 − lM0 (amplitude
da classe modal por hM0 e resolver em ordem a Mo e encontra-se a fórmula de
Czuber para o cálculo da moda:

d1
Mo = lM0 + × hM0 . (5.3.3)
d1 + d2
Sendo que:
• d1 : é diferença entre a frequência da classe modal e a frequência da classe anterior
à classe modal, d1 = fM0 − fM0 ant e d2 = fM0 − fM0 post.
Exemplo 5.3.4 Considerando a tabela (5.2) de distribuição de frequências das estaturas

do exemplo (5.1.4)
• A classe modal é a 4a , uma vez apresenta a maior frequência simples ou absoluta.
• A moda das estaturas pela fórmula de Czuber é dada por:

1
M0 = 171 + × 7 = 172, 17 cm.
1+5
Nota 5.3.2 (Moda Bruta) . É o valor do ponto médio da classe modal, No exemplo
(5.1.4), os extremos da classe modal são 171 e 178, o ponto médio é de 171+178
2
= 174, 5,
portanto a moda bruta é 174,5.
Nota 5.3.3 (Utilização da Moda) . A moda é utilizada especicamente:
• Para medidas rápidas e aproximação de posição;
• Para medidas de posição que caracterizam a distribuição (ou seja, a medida de

posição é o valor mais típico da distribuição).

5.4 Mediana (Md)

Tal como, na média e na moda, o processo de cálculo da mediana também depende da
forma como os dados se apresentam, isto é, se os mesmos estão agrupados ou se não estão
agrupados.
A mediana é uma medida de posição, é uma separatriz, pois divide o conjunto de dados
coletados em duas partes iguais, com o mesmo número de elementos. O valor da medi-
ana se encontra no centro da série estatística, organizada de tal forma que o número de
elementos situados antes desse valor (mediana) é igual ao número de elementos que se
encontram após esse mesmo valor (mediana)
A mediana é conveniente para séries estatísticas onde existem valores extremos, em que
valores grandes e pequenos coexistem dentro da mesma série, ou ainda nos casos em que
a série seja aberta nos extremos. Para esses casos, a mediana caracteriza o promédio mais
conável.
Exemplo 5.4.1 Considere um conjunto de valores de uma série estatística
29, 23, 14, 25, 31, 26, 18, 17, 22, 13, 27
e organizados segundo um critério de grandeza, no caso ordem crescente
13, 14, 17, 18, 22, 23, 25, 26, 27, 29, 31
O valor da mediana separa a série em dois conjuntos com a mesma quantidade de ele-
mentos, de tal forma que 50% dos valores coletados sejam menores do que a mediana e
outros 50% superior a ela.
13, 14, 17, 18, 22, 23 25, 26, 27, 29, 31

←−−−−−− −−−−−−→
50% 50%
• Md = 23(existem cinco valores coletados antes da mediana e cinco depois)
5.4.1 Cálculo da Mediana para Dados não Agrupados

A determinação da mediana depende do número de valores da amostra. Se a amostra tem
um número ímpar de valores, a mediana é o valor central enquanto se o número de valores é
par, a mediana é geralmente tomada como a média dos dois valores mais centrais, embora

possa ser qualquer um destes valores ou mesmo qualquer valor do intervalo denido pelos
dois valores mais centrais. Assim, para um conjunto de n>1 dados não agrupados
Série com Número Ímpar de Termos
Para uma série com número ímpar de termos: a mediana corresponde ao valor central,
esse valor apresenta o mesmo número de termos localizados a sua esquerda e a sua direita.
A posição do termo central pode ser localizada pela expressão:
(n + 1)
(5.4.1)
2
Exemplo 5.4.2 Considere um conjunto de valor de uma série estatística
41, 32, 66, 49, 35, 57, 39, 54, 44, 48, 51, 56, 59, 36, 63
Dados organizados em ordem crescente:
32, 35, 36, 39, 41, 44, 48, 49, 51, 54, 56, 57, 59, 63, 66
• n = 15
• Posição do termo central: (n+1)

2
= 15+1
2
= 8. Isso signica que a mediana está
localizada na oitava posição:
32, 35, 36, 39, 41, 44, 48, 49 51, 54, 56, 57, 59, 63, 66
←−−−−−− −−−−−−→
50% 50%
• Md = 49 −→ existem 7 elementos antes e 7 elementos depois da mediana, ou seja,

50% dos valores coletados são menores do que a mediana e outros 50% maiores que
ela.
Série com Número par de Termos
Para uma série com número par de termos, não há termo central único, e sim dois termos
centrais. Convencionamos que a mediana seja a média aritmética entre os dois termos
centrais, nesse caso, a mediana é um valor que não pertence à série e está localizado entre
os dois termos centrais.
n
• Primeiro termo central:
2
.
n
• Segundo termo central :
2
+1

Exemplo 5.4.3 Considere um conjunto de valores de uma série estatística
48, 60, 33, 42, 36, 40, 53, 43, 46, 52, 55, 45, 58, 65
Dados organizados em ordem crescente:
33, 36, 40, 42, 43, 45, 46, 48, 52, 53, 55, 58, 60, 65
• n = 14
• Primeira posição do termo central: n

2
= 14
2
=7
• Segunda posição do termo central: 14

2
+ 1 = 8.
• Isso signica que os dois termos centrais estão localizados na sétima e na oitava
posição.
33, 36, 40, 42, 43, 45, 44, 48 52, 53, 55, 58, 60, 65
←−−−−−− −−−−−−→
50% 50%
• A média aritmética entre 46 e 48 é:
46 + 48
Md = = 47 −→ Md = 47.
2
Observação 5.4.1 Observe que o valor de 47 não pertence ao grupo de valores que cons-
tituem a série. Na verdade, o valor resultante do cálculo da mediana não precisa, neces-
sariamente, pertencer à série coletada.
5.4.2 Cálculo da Mediana para Dados Agrupados sem Intervalos

de Classe
A mediana é o valor da variável que corresponde à classe mediana. Na determinação da
mediana com dados agrupados sem intervalo de classe, devem-se executar os passos a
seguir:
1. Determina a posição da mediana: para vericar a posição da mediana na dis-
tribuição, calcula-se:
n
Posmed = (5.4.2)
2
2. Localizar a classe mediana: Uma vez determinada a posição da mediana, observa-
se na coluna da frequência acumulada em qual intervalo de valores acumulados esse
valor se enquadra. A classe mediana é estabelecida na coluna da frequência acumu-
lada. A classe mediana é a classe que contém a mediana .

3. Vericar o valor da variável contido na classe mediana.
Exemplo 5.4.4 Foi feita uma pesquisa para especicar as necessidades das famílias em
relação ao número de quartos de uma residência. Para tal, foram consultadas 220 famílias.
Os dados coletados encontra se na tabela 5.5
Tabela 5.5: Distribuição do número de quartos por residência
Quartos (xi ) Famílias (fi ) Faci Interpretação/Faci

1 46 46 1o ao 4o termo
2 81 127 46o ao 127o termo
3 63 190 127o ao 190o termo
4 24 214 190o ao 214o termo
5 6 220 214o ao 22o termo
Total 220
• Posição da mediana: Posmed = 220

2
= 110o valor da série.
• Na coluna da F aci , a posição do centésimo décimo (110o ) valor da série esta loca-
lizada entre o 47o e o 127o , ou seja, na 2a classe.
• Classe Mediana: 2a classe.
• O valor da variável que pertence à segunda classe é 2, ou seja, corresponde à opção

de residências com 2 quartos, Md = 2.
• Valor da mediana: Md = 2 quartos por residência.
• Interpretação: 50% das opiniões é favorável às residências com 2 ou menos dor-

mitórios e os outros 50% é favorável às residências com 2 ou mais dormitórios.
Observação 5.4.2 Quando a posição da mediana coincide com uma frequência acumu-
lada: caso aconteça de n2 coincidir com uma frequência acumulada, a sugestão é que se
faça o cálculo da mediana por meio da média aritmética entre o valor da variável cor-
respondente à frequência acumulada e o valor da variável correspondente a uma ordem
acima
(xi ) + (xi + 1) xi + xi + 1
Md = = (5.4.3)
2 2
5.4.3 Cálculo da Mediana Para Dados Agrupados com Intervalo

de Classe
Na determinação da mediana com dados agrupados em intervalos de classe, devem-se
executar os passos a seguir, sendo que os procedimentos do primeiro e o segundo passo

são àqueles vistos para dados agrupados sem intervalos de classe:
1. Determina a posição da mediana: para vericar a posição da mediana na dis-
tribuição, calcula-se:
n
Posmed = (5.4.4)
2
2. Localizar a classe mediana: Uma vez determinada a posição da mediana, observa-
se na coluna da frequência acumulada em qual intervalo de valores acumulados esse
valor se enquadra. A classe mediana é estabelecida na coluna da frequência acumu-
lada. A classe mediana é a classe que contém a mediana .
3. Determinar a mediana: localizada a classe mediana, ainda resta vericar qual o
ponto, dentro do intervalo dessa classe, que corresponde à mediana. Isto pode ser
resolvido por interpolação, utilizando-se a fórmula a seguir:
n
− F acant

2
Md = lM d + × hM d (5.4.5)
fM d
Sendo:
• lM d = Limite inferior do intervalo de classe mediana;
• F acant = Frequência acumulada da classe anterior à classe mediana;
• fM d = frequência (simples ou absoluta) da classe mediana;
• n= Número de elementos coletados na pesquisa;
• hM d = LM d − lM d = amplitude do intervalo de classe mediana.
• LM d = Limite superior do intervalo de classe mediana.
Exemplo 5.4.5 A tabela abaixo, corresponde ao tempo (em minutos) que 50 assinantes
da Internet da TV Cabo gastaram durante sua conexão mais recente.
Tabela 5.6: Distribuição do tempo gasto na Internet.
Tempo Gasto (xi ) Utilizadores (fi ) F aci Intervalos/F aci

5 ` 15 26 26 1o ao 26o termo
15 ` 25 33 59 26o ao 59o termo
25 ` 35 42 101 59o ao 101o termo
35 ` 45 48 149 101o ao 149o termo
45 ` 55 39 188 149o ao 188o termo
55 ` 65 18 206 188o ao 206o termo
65 ` 75 7 213 206o ao 213o termo
Total 213

• Posmed = n
2
= 213
2
= 106, 5o valor da série.
• Na coluna da F ac (frequência acumulada) a posição do 106, 5o , valor da série está

localizada entre o 101o e o 149o , ou seja, na 4a classe.
• Classe mediana: 4a classe.
• Mediana:
106, 5 − 101
Md = 35 + × 10 = 36, 15 minutos
48
• Interpretação da mediana: 50% dos assinantes da Internet gastaram menos de

36,15 minutos e 50% gastaram mais de 36,15 minutos durante sua conexão mais
recente.

Capítulo 6
Medidas de Posição: Medidas

Separatrizes
São valores que ocupam determinados lugares, abrangendo intervalos iguais, de um con-
junto de valores coletados e organizados. As medidas deposição separatrizes podem ser
classicadas em:
• Mediana: divide a série em duas partes iguais (M d);
• Quartis: divide a série em quatro partes iguais (Q1 , Q2 , Q3 );
• Decis: divide a série em dez partes iguais (D1 , D2 , · · · , D9 );
• Percentis: divide a série em cem partes iguais (P1 , P2 , · · · , P99 )
Os nomes das medidas de posição separatrizes modicam de acordo com a quantidade de
partes que é dividida a série.
Nota 6.0.1 A mediana, além de ser uma medida de posição de tendência central, é tam-
bém uma medida separatriz. A mediana já foi estudada anteriormente assim, passaremos
ao estudo dos quartis, decis e percentis.
6.1 Quartis
Nos quartis, a série é dividida em quatro partes iguais, com o mesmo número de elementos,
de tal forma que cada intervalo do quartil contenha 25% dos elementos coletados. Os
elementos separatrizes da série são Q1 , Q2 e Q3 .
• O primeiro quartil (Q1 ) separa os primeiros 25% dos elementos da série.
70
• O segundo quartil (Q2 ) separa os primeiros 50% (25%+25%) dos elementos da série.
Observação 6.1.1 O segundo quartil (Q2 ) sempre será igual a mediana (Md ) da
série.
• O terceiro quartil (Q3 ) separa os primeiros 75% (25% + 25% + 25%) dos elementos
da série.
Nota 6.1.1 Para o cálculo dos quartis, utilizam-se técnicas semelhantes àquelas do cál-
culo da mediana.
6.1.1 Cálculo dos Quartis para dados não Agrupados

Para o cálculo dos quartis, utilizam-se técnicas semelhantes àquelas do cálculo da mediana.
Deste modo, temos:
• Q1 = Medina da primeira metade dos elementos da série.
• Q= Medina de todos os elementos da série.
• Q3 = Medina da segunda metade dos elementos da série.
Exemplo 6.1.1 Dado o conjunto de valores:
7, 13, 5, 12, 16, 4, 9, 15, 6
Considere o conjunto de valores ordenados segundo um critério de grandeza
4, 5, 6, 7, 9, 12, 13, 15, 16
• Q2 : Determinar em primeiro lugar o valor do segundo quartil (Q2 ).
4, 5, 6, 7, 9 12, 13, 16
←−−−− −−−−→
50% Q2 50%
Q2 = Md = 9: mediana de todos os elementos da série.
• Q1 : Para o cálculo do primeiro quartil, basta calcular a mediana da primeira metade

do conjunto.
4, 5, 6 , 7
←−−−− −−−−→
25% Q1 75%
Q1 = 5+6
2
= 5, 5: mediana da primeira metade dos elementos da série.

• Q3 : Para o cálculo do quartil Q3 , basta calcular a mediana da segunda metade do

conjunto
12, 13, 15 , 16
←−−−−−− −−−−−−→
75% Q3 25%
Q3 = 13+15
2
= 14: mediana da segunda metade da série.
• Assim: Q1 = 5, 5; Q2 = 9 e Q3 = 14.
6.1.2 Cálculo dos Quartis para Dados agrupados sem Intervalo

de Classe
Para o cálculo dos quartis para dados agrupados sem intervalo de classe, utilizam-se técni-
cas semelhantes àquelas do cálculo da mediana. Isso signica que a localização da posição
do quartil na série é vericada pela frequência acumulada (F aci ).
Os quartis Q1 , Q2 e Q3 podem ser generalizados pela notação Qk , sendo que o quartil
considerado é representado por k.
Denition 6.1.1 Quartil Qk é o valor da variável que corresponde à classe desse quartil
considerado. Sendo que k indica a posição do quartil (k = 1, 2, 3).
• Assim, inicialmente, calcula-se a posição de Qk para estabelecer em que classe se
localiza o quartil considerado.
k×n
P osQk = (6.1.1)
4
• Obtida a posição de Qk , localiza-se o valor da mesma na frequência acumulada, para

conhecer qual é a classe que corresponde a essa posição, a qual damos o nome de
"classe do quartil k ". Em seguida, verica-se o valor da variável correspondente a
classe do quartil k considerado.
Exemplo 6.1.2 A distribuição das notas de Estatística Descritiva de 25 estudantes da

faculdade de Economia no ano lectivo 2020/2012 é descrita na tabela abaixo:
• Cálculo do Q1 (k = 1). Posição:
1×n 1 × 25
Q1 = = = 6, 25 −→ Posicionando na 2a classe
4 4

Tabela 6.1: Distribuição das notas

Classe Notas (xi ) Estudantes (fi ) F aci
1 11 3 3
2 12 4 7
3 13 3 10
4 14 4 14
5 15 3 17
6 16 5 22
7 17 3 25
Total 25
A localização da posição 6,25, na coluna da frequência acumulada, ocorre na segunda

classe. A classe do Q1 é a segunda classe. Na segunda classe, o valor da variável é
12, ou seja Q1 = 12 valores.
2×n 2 × 25
4 4
A localização da posição 12,5, na coluna da frequência acumulada, ocorre na quarta

classe. A classe do Q2 é a quarta classe. Na quarta classe, o valor da variável é 14,
ou seja Q2 = 14 valores.
3×n 3 × 25
4 4
A localização da posição 18,75, na coluna da frequência acumulada, ocorre na sexta

classe. A classe do Q3 é a sexta classe. Na sexta classe, o valor da variável é 16,
ou seja Q3 = 16 valores.
• Interpretação:
Q1 : 25% dos estudantes tiveram uma nota inferior ou igual a 12 valores e
75% tiveram uma nota maior ou igual a 12 valores
50% tiveram uma nota maior ou igual a 14 valores.
25% tiveram uma nota maior ou igual a 16 valores.

6.1.3 Cálculo dos Quartis para Dados Agrupados com Intervalo

de Classe
Para o cálculo dos quartis para dados agrupados com intervalo de classe, utilizam-se
técnicas semelhantes àquelas do cálculo dos quartis para dados agrupados sem intervalo
de classe.
• Inicialmente, calcula-se a posição de Qk para estabelecer em que classe se localiza o
quartil considerado.
k×n
P osQk = (6.1.2)
4
• Obtida a posição de Qk , localiza-se o valor da mesma na frequência acumulada, para
conhecer qual é a classe que corresponde a essa posição, a qual damos o nome de
"classe do quartil k ".
• Em seguida, determina-se o valor da variável que corresponde ao quartil k, através
da seguinte fórmula:
" #
k×n
4
− F acant
Qk = lQk + × hQk (6.1.3)
fQk
Onde:
k = Quartil considerado.
lQk = limite inferior do intervalo de classe do quartil considerado.
F acant = Frequência acumulada da classe anterior à classe do quartil conside-
rado.
fQk = Frequência simples da classe do quartil considerado.

hQk = Amplitude do intervalo de classe do quartil considerado.
Exemplo 6.1.3 Numa empresa do Huambo, o salário dos funcionários do sector de ven-
das incide as comissões sobre as vendas realizadas. Tomando como base os salários, a
empresa divide os funcionários em quatro categorias:
• Os 25% menos produtivos : categoria C;
• Os 25% seguintes: categoria B;
• Os 25% mais produtivos: categoria A;
• Os 25% restantes = categoria especial.

Tabela 6.2: Distribuição salarial(em centenas de Kzs) dos funcionários do sector de vendas
Salário(Kzs) (xi ) Funcionários (fi ) F aci

1.000 ` 2.000 3 3
2.000 ` 3.000 14 17
3.000 ` 4.000 18 35
4.000 ` 5.000 10 45
5, 000 ` 6.000 6 51
6.000 ` 7.000 3 54
Total 54
A distribuição salarial dos funcionários do sector de vendas é descrita na tabela
• Cálculo do Q1 . Posição
1 × 54
P osQ1 = = 13, 50
4
A classe do quartil Q1 é a segunda classe, assim

13, 50 − 3
Q1 = 2.000 + × 1.000 = 2.750, 00 −→ Q1 = 275.000 (2.750 × 100).
14
2 × 54
P osQ2 = = 27
4
A classe do quartil Q2 é a terceira classe, assim

27 − 17
Q2 = 3.000 + × 1.000 = 3.555, 56. −→ Q2 = 355.556 (3.555, 56 × 100)
18
3 × 54
P osQ3 = = 40, 50
4
A classe do quartil Q1 é a segunda classe, assim

40, 50 − 35
Q3 = 4.000 + × 1.000 = 4.550, 00 −→ Q2 = 455.000 (4.550 × 100).
10
Assim os salários limites das categorias estabelecidas pela empresa são:
• Categoria C (os 25% menos produtivos): salários entre 100.000 ,00 e 275.000,00;
• Categoria B (os 25% seguintes): salários entre 275.000 ,00 e 355.556,00;
• Categoria A (os 25% mais produtivos): salários entre 355.556,00 e 455.000,00;
• Categoria Especial (os 25% restantes): salários entre 455.000 ,00 e 700.000.

6.2 Decis
Nos decis, a série é dividida em dez partes iguais, com o mesmo número de elementos,
de tal forma que cada intervalo do decil contenha 10 % dos elementos coletados. Os
elementos separatrizes da série são: D1 , D2 , · · · , D9 . Interpretação dos decis:
• O primeiro decil (D1 ) separa os primeiros 10% dos elementos da série;
• O segundo decil (D1 ) separa os primeiros 20% (10%+10%) dos elementos da série;
• ···, Assim sucessivamente até o decil D9 .
• O nono decil (D9 ) separa os primeiros 90% dos elementos da série.
Denition 6.2.1 Dk é o valor da variável que corresponde à classe desse decil conside-
rado. Sendo que k indica a posição do decil (k = 1, 2, · · · 9).
6.2.1 Cálculo dos Decis

O cálculo dos decis é feito de maneira análoga ao cálculo dos quartis, seja para dados
simples ou agrupados com e sem intervalos de classe.
• Assim, para dados simples, calcula-se a posição do decil através da expressão
seguinte:
k×n
P osDk = (6.2.1)
10
• Para dados agrupados sem intervalos de classe, após obter a posição de Dk ,
localiza-se o valor da mesma frequência acumulada, para conhecer qual é a classe
correspondente a essa posição a qual damos o nome de "classe do decil k ". Em
seguida, verica-se o valor da variável correspondente do decil k considerado.
• Para dados agrupados com intervalos de classe, após obter a posição de Dk

e localizar a classe do decil k , determina-se o valor da variável que corresponde ao
decil Dk através da formula a seguir:
" #
k×n
10
− F acant
Dk = lDk + × hDk (6.2.2)
fDk
Onde:
k = Decil considerado.
lDk = limite inferior do intervalo de classe do decil considerado.

F acant = Frequência acumulada da classe anterior à classe do decil considerado.

fDk = Frequência simples da classe do decil considerado.
hDk = Amplitude do intervalo de classe do decil considerado.
Exemplo 6.2.1 Considerando o exemplo 6.1.3, podemos calcular os decis D1 e D7 .
• Primeiro decil, D1 (k = 1). Posição:
1 × 54
P osD1 = = 5, 4
10
. A classe do decil D1 é a segunda classe, assim:

5, 4 − 3
D1 = 2.000 + × 1.000 = 2.171, 43 −→ D1 = 217.143, 00 (2.171, 43 × 100)
14
• Sétimo decil, D7 (k = 7). Posição:
7 × 54
P osD7 = = 37, 8
10
. A classe do decil D7 é a quarta classe, assim:

37, 8 − 35
D7 = 4.000 + × 1.000 = 4.280, 00 −→ D7 = 428.000 (4.280, 00 × 100)
10
• Interpretação: D1 , 10% dos funcionários ganham um salário inferior ou igual

a 217.143 mil kwanzas e os 90% dos funcionários ganham um salário superior a
217.143 mil kwanzas; D7 , 70% dos funcionários ganham um salário inferior ou
igual a 428.000 mil kwanzas e os 30% dos funcionários dos funcionários ganham
um salário superior a 428.000 mil kwanzas .
6.3 Percentis
Nos percentis, a série é dividida em cem (100) partes iguais, de tal forma que cada intervalo
do percentil contenha 1 % dos elementos coletados. Os elementos separatrizes da série
são: P1 , P2 , · · · , P 99. Interpretação dos percentis:
• O primeiro percentil (P1 ) separa os primeiros 1% dos elementos da série.
• O segundo percentil (P2 ) separa os primeiros 2% (1% + 1%) dos elementos da
série.

• ··· E assim sucessivamente até o percentil P99 .
• O nonagésimo nono percentil (P99 ) separa os primeiros 99% dos elementos da série.
Denition 6.3.1 Pk é o valor da variável que corresponde à classe desse percentil con-
siderado. Sendo que k indica a posição do percentil (k = 1, 2, · · · , 99).
6.3.1 Cálculo dos Percentis

O cálculo dos percentis é feito de maneira análoga ao cálculo dos decis, seja para dados
simples ou agrupados com e sem intervalos de classe.
• Assim, para dados simples, calcula-se a posição do quartil através da expressão
seguinte:
k×n
P osP k = (6.3.1)
100
• Para dados agrupados sem intervalos de classe, após obter a posição de Pk ,
localiza-se o valor da mesma frequência acumulada, para conhecer qual é a classe
correspondente a essa posição a qual damos o nome de "classe do percentil k ". Em
seguida, verica-se o valor da variável correspondente do percentil k considerado.
• Para dados agrupados com intervalos de classe, após obter a posição de Pk

e localizar a classe do percentil k , determina-se o valor da variável que corresponde
ao percentil Pk através da formula a seguir:
" #
k×n
100
− F acant
Pk = lP k + × hP k (6.3.2)
fP k
Onde:
k = Percentil considerado.
lP k = limite inferior do intervalo de classe do percentil considerado.
F acant = Frequência acumulada da classe anterior à classe do percentil consi-
derado.
fP k = Frequência simples da classe do percentil considerado.

hP k = Amplitude do intervalo de classe do percentil considerado.
Exemplo 6.3.1 Considerando o exemplo 6.1.3, podemos calcular os percentis P10 e P70 .

• Décimo percentil, P10 (k = 10). Posição:
10 × 54
P osP10 = = 5, 4
100
. A classe do percentil P10 é a segunda classe, assim:

5, 4 − 3
P10 = 2.000 + × 1.000 = 2.171, 43 −→ P10 = 217.143, 00 (2.171, 43 × 100)
14
• Septuagésimo percentil, P70 (k = 70). Posição:
70 × 54
P osP70 = = 37, 8
100
. A classe do decil P70 é a quarta classe, assim:

37, 8 − 35
P70 = 4.000 + × 1.000 = 4.280, 00 −→ P70 = 428.000 (4.280, 00 × 100)
10
• Interpretação: P10 , 10% dos funcionários ganham um salário inferior ou igual

a 217.143 mil kwanzas e os 90% dos funcionários ganham um salário superior a
217.143 mil kwanzas; P70 , 70% dos funcionários ganham um salário inferior ou
igual a 428.000 mil kwanzas e os 30% dos funcionários dos funcionários ganham
um salário superior a 428.000 mil kwanzas.

Capítulo 7
Medidas de Dispersão ou de
Variabilidade
A interpretação de dados estatísticos exige que se realize um número maior de estudos,
além das medidas de posição. O estudo das médias, medianas, moda, quartis, decis
e percentis são válidos, mas não sucientes para estudos comparativos ou conclusões
qualitativas. Também é importante descrever o conjunto de valores do grupo em termos
da variação existente entre seus elementos. Quanto maior a variação dos dados, menor
a representatividade da média. Sendo assim, pode-se dizer que as medidas de dispersão
são úteis para qualicar a média. Quanto menor a dispersão, maior a homogeneidade na
As
concentração entre os elementos do conjunto de valores, e mais conável é a média.
medidas de dispersão servem para vericar a representatividade das medidas

de posição. Das medidas de dispersão estudaremos:
• Amplitude Total;
• Variância e Desvio-padrão;
• Coeciente de Variação.
7.1 Amplitude Total

7.1.1 Cálculo da Amplitude Total para Série Simples
Para dados não agrupados, a amplitude total é a diferença entre o maior e o menor valor
da série de dados coletados.
AT = Xmx − Xmin (7.1.1)
80
Exemplo 7.1.1 Considerando o exemplo 6.1.2, podemos determinara a amplitude total

da distribuição das notas,
AT = 17 − 11 = 6 valores
7.1.2 Cálculo da Amplitude Total para Dados Agrupados numa

Distribuição de Frequência
Levando-se em conta a variável em estudo, a amplitude total é a diferença entre o limite
superior da classe mais alta e o limite inferior da classe mais baixa.
AT = Lmax − lmin (7.1.2)
Nota 7.1.1 A amplitude total é útil em casos como a medida de temperatura de uma
localidade, em que pode-se estabelecer a amplitude da temperatura em um dia, semana,
mês ou ano. Para a programação de um evento, é importante e signicativo conhecer a
amplitude da temperatura da região durante os últimos dias, semanas, meses ou anos.
Observação 7.1.1 A utilização da amplitude total como medida de dispersão é muito

limitada, pois sendo uma medida que depende apenas dos valores externos, é instável, não
sendo afetada pela dispersão dos valores internos.
Exemplo 7.1.2 Considerando o exemplo 6.1.3, podemos determinara a amplitude total

da distribuição salarial,
AT = 7.000 − 1.000 = 6.000 (6.000 × 100) −→ AT = 600.000 Kzs.
7.2 Variância (σ2) e Desvio- padrão (σ)

A variância é a medida de dispersão mais empregada, pois leva em consideração todos
os valores coletados para a variável em estudo. É um indicador de variabilidade mais
conável. O desvio-padrão é a medida mais usada na comparação de diferenças entre
conjunto de dados, por ter grande precisão. O desvio-padrão determina a dispersão dos
valores em relação a média.
A variância relaciona os desvios em torno da média, ou mais especicamente á a média
aritmética dos quadrados dos desvios.
• Valores da série próximos uns dos outros originam um desvio-padrão menor. Isso
signica que, quanto menor for o valor do desvio-padrão, menor será a dispersão

dos valores da série, ou seja, trata-se de uma série de valores com menor variação
( série mais homogénea);
• Valores da série muito afastados uns dos outros originam um desvio-padrão maior.
Isso signica que, quanto maior for o valor do desvio-padrão, maior será a dispersão
dos valores da série, ou seja, trata-se de uma série de valores com maior variação
( serie mais heterogénea).
7.2.1 Relação entre a Variância e o Desvio-padrão

O desvio-padrão é a raiz quadrada da variância, e consequentemente a variância é o
quadrado do desvio-padrão.
√
Variância = (σ)2 Desvio-padrão = σ2 = σ (7.2.1)
7.2.2 Cálculo do Desvio-padrão e Variância para Séries Simples

(Dados não agrupados) pela denição e pela fórmula alter-
nativa
O desvio-padrão e a variância de uma série podem ser calculados para duas situações de
coleta dos dados, população e amostra. As fórmulas são diferentes para cada caso, uma
vez que deve haver um ajuste para o cálculo dessas grandezas quando os dados coletados
referem-se a amostras.
Cálculo da Variância e do Desvio-padrão de uma População (pela Denição)
A variância é a média aritmética dos quadrados dos desvios.
(xi − x)2 d2i

P P
2
σ = = (7.2.2)
n n
Sendo: σ2 = variância; x= valor da média aritmética; xi = valor da i-ésima observação
da variável em estudo; d2i = desvio da variável em relação a sua média.
• O desvio-padrão é calculado por meio da raiz quadrada da variância para população:
rP rP
√ (x i − x)2 d2i
σ= σ2 = = (7.2.3)
n n

Cálculo da Variância e do Desvio-padrão de uma Amostra (pela Denição)
Conforme citado anteriormente, o cálculo da variância para uma amostra deve apresentar
uma correção e, relação ao mesmo cálculo para a população. Nestes casos, a variância
representa uma descrição da amostra e não da população (este tipo de ocorrência é mais
comum na estatística), o denominador passa a ser "n − 1"ao invés de "n". A modicação
do denominador n para n−1 constitui um factor de ajuste visando corrigir o facto do
número de elementos da amostra ser menor que o número de elementos da população.
(xi − x)2
P P 2
2 di
σ = = (7.2.4)
n−1 n−1
• Da mesma forma que para a variância, caso o desvio-padrão represente uma descri-
ção da amostra e não da população, o denominador passa a ser n−1 ao invés de n.

O desvio-padrão é calculado por meio da raiz quadrada da variância para amostra:
sP
√
rP
(xi − x)2 d2i
σ= σ2 = = (7.2.5)
n−1 n−1
Nota 7.2.1 O valor médio em algumas séries resulta números decimais, consequente-
mente, o cálculo da variância e do desvio-padrão pode-se estender num somatório do
quadrado de números decimais. Com objectivo de simplicar os cálculos matemáticos,
utiliza-se uma fórmula alternativa para o cálculo da variância e do desvio padrão.
Cálculo da Variância e do Desvio-padrão de uma População (pela Fórmula

Alternativa)
P P 2
xi
(xi −x)2 = x2i − ( nxi ) .
P P
Levando em conta que x= n
e que Fazendo s substituição
desses valores na expressão da variação (equação 7.2.2), obtém-se:
( xi ) 2
P
2
( xi ) 2
P P 2 P
2 (x i − x) n xi
σ = = = − (7.2.6)
" n n # n n2
1 X 2 ( xi )2
P
= xi −
n n
• Desvio padrão:
v "
u
u1 X P 2#
( xi )
σ=t x2i − (7.2.7)
n n

Cálculo da Variância e do Desvio-padrão de uma Amostra (pela Fórmula Al-

ternativa)
De forma análoga, para amostra obtém-se;
• Variância: " P 2#
1 X ( xi )
σ2 = x2i − (7.2.8)
n−1 n
• Desvio-padrão:
v
u " P 2#
u 1 X ( xi )
σ=t x2i − (7.2.9)
n−1 n
7.2.3 Calculo da Desvio-padrão e Variância para Dados Agrupa-

dos
Fórmula para o Cálculo da Variância e o Desvio-padrão para População (pela
Denição)
• Variância:
(xi − x)2 · fi
P
2
σ = (7.2.10)
n
• Desvio-padrão:
rP
(xi − x)2 · fi
σ= (7.2.11)
n
Fórmula para o Cálculo da Variância e o Desvio-padrão para Amostra (pela

Denição)
• Variância:
(xi − x)2 · fi
P
2
σ = (7.2.12)
n−1
• Desvio-padrão:
rP
(xi − x)2 · fi
σ= (7.2.13)
n−1

Fórmula para o Cálculo da Variância e o Desvio-padrão para População (pela

Fórmula Alternativa)
• Variância: " #
P 2
1 X ( x f
i i )
σ2 = x2i · fi − (7.2.14)
n n
• Desvio-padrão:
v " #
2
u P
u1 X ( x i · f i )
σ=t x2i fi − (7.2.15)
n n
Fórmula para o Cálculo da Variância e o Desvio-padrão para Amostra (pela

Fórmula Alternativa)
• Variância: " #
P 2
1 X ( x i · f i )
σ2 = x2i fi − (7.2.16)
n−1 n
• Desvio-padrão:
v " #
2
u P
u 1 X ( x i · f i )
σ=t x2i fi − (7.2.17)
n−1 n
7.2.4 Propriedades do Desvio-padrão

1. Adicionando ou subtraindo um mesmo valor de todos os valores de uma variável, o
desvio-padrão não se altera;
2. Multiplicando ou dividindo todos os valores de uma variável por um mesmo número
(diferente de zero), o desvio-padrão ca multiplicado ou dividido por esse número.
Exemplo 7.2.1 ((Dados não Agrupados)) Durante determinada semana, os nove ven-
dedores de uma agência de automóveis do Huambo(população), venderam as seguintes
quantidades de carros: 20, 25, 28, 31, 37, 42, 45, 49, 53. A distribuição da venda de carros
por nove vendedores é descrita na tabela abaixo:

Tabela 7.1: Distribuição da venda de carros por nove vendedores
Vendedor Caros Vendidos (xi ) x2i

1 20 400
2 25 625
3 28 784
4 31 961
5 37 1.369
6 42 1.764
7 45 2.025
8 49 2.401
9 53 2.809
x2i = 13.138
P P
xi = 330
• Sendo: x = 330
9
= 36, 67. −→ x = 37 carros
• Utilizando a fórmula da denição:
Variância:
(20 − 36, 67)2 + (25 − 36, 67)2 + · · · + (53 − 36, 67)2 1038
σ2 = = = 115, 33.
9 9
q
Desvio-padrão: σ = 1038
9
= 10, 74. −→ σ = 11 carros.
• Utilizando a fórmula alternativa:
Variância:
(330)2

1 2
σ = 13.138 − = 115, 33.
9 9
r h i
Desvio-padrão: σ = 9 13.138 − 9 = 10, 74 −→ σ = 11 carros.
1 (330)2

Exemplo 7.2.2 (Dados Agrupados sem Intervalo de Classe) Uma empresa nan-
ceira vericou que algumas propostas apara a realização de nanciamentos não observaram
todos as exigências necessárias à concessão dos respectivos créditos. Visando uma análise
do problema, a empresa agrupou as propostas com base no número de exigências descum-
pridas. A distribuição de exigências descumpridas em cada proposta para concessão de
crédito e descrita na tabela abaixo:
Tabela 7.2: Distribuição de exigências descumpridas em cada proposta para concessão de

crédito
N o /Exig.Descumpridas (xi ) Propostas (fi ) xi f i x2i fi

1 6 6 6
2 8 16 32
3 7 21 63
4 5 20 80
5 5 25 125
6 4 24 144
7 2 14 98
Total n = 37 126 548
• Média aritmética:
P
x i fi 126
x= = = 3, 14 −→ x = 3 exigências descumpridas
n 37
h i
(126)2
• Variância: σ 2 = 1
37
548 − 37
= 3.2041.
r h i
(126)2
• Desvio -padrão: σ = 1
37
548 − 37
= 1, 79.
Exemplo 7.2.3 (Dados Agrupados com Intervalo de Classes) A distribuição das

vendas (em milhares de kwanzas) por funcionário de uma empresa de telecomunicação de
Angola é descrita na tabela abaixo:

Tabela 7.3: Distribuição das vendas por funcionário
Vendas (xi ) Funcionário (fi ) Ponto Médio xi f i x2i fi

40, 00 ` 80, 00 5 60,00 300 18.000
80, 00 ` 120, 00 16 100,00 1.600 160.000
120, 00 ` 160, 00 21 140,00 2.940 411.600
160, 00 ` 200, 00 27 180,00 4.860 874.800
200, 00 ` 240, 00 18 220,00 3.960 871.200
240 ` 280, 00 10 260,00 2.600 676.000
280, 00 ` 320, 00 6 300,00 1.800 540.000
Total 103 18.060 3.551.600
• Média aritmética: P
xi f i 18.060, 00
x= = = 175, 43
n 103
• Variância:
(18.060)2

2 1
σ = 3.551.600 − = 3.738, 10
103 103
• Desvio-padrão:
s
1 (18.060)2
σ= 3.551.600 − = 61, 14.
103 103
• As venda média da empresa é de 175.340 (175, 34 × 1.000) com desvio-padrão de

61,14. Assim observa-se que há uma grande dispersão entre as vendas praticadas
pelos funcionários
7.3 Dispersão Absoluta e Relativa na Comparação de

duas Séries de Dados Colectados
As medidas de viabilidade são medidas de dispersão absolutas que não devem ser usadas
para comparar dispersões de distribuições quando os valores das medidas de dispersões
forem diferentes. Para inviabilizar este problema usam-se medidas de dispersão relativas
A dispersão relativa é razão entre a dispersão absoluta e o valor da média:
dispersão absoluta
dispersão relativa = (7.3.1)
média
• Dispersão absoluta: é medida pelo desvio-padrão (a série com maior valor de
desvio-padrão terá maior dispersão absoluta).

• Dispersão relativa: é medida pelo coeciente de variação (a série com maior
coeciente de variação terá maior dispersão relativa).
7.3.1 Coeciente de Variação ou Coeciente de Variação de Pe-

arson
A dispersão relativa é medida pelo coeciente de variação de Pearson, ou simplesmente
coeciente de variação, sendo que a dispersão absoluta é o desvio padrão σ. O coeciente
de variação (dispersão relativa) é a razão entre o desvio-padrão (σ ) e a média aritmética
(x). Utiliza-se o coeciente de variação na comparação do grau de concentração em torno
da média para duas ou mais séries distintas. O coeciente de variação pode ser expresso
por valor decimal ou por valor percentual
σ
CV = −→ valor decimal (7.3.2)
x
ou
σ
CV = × 100 −→ valor percentual (7.3.3)
x
Uma outra medida de dispersão relativa, que é insensível aos valores extremos e, portanto,
adequada para distribuição em que existem valores muito diferentes da grande maioria de
valores, considera como medida de dispersão absoluta a amplitude inter-quartis e como
medida de dispersão a mediana

Q3 − Q1
(7.3.4)
Md
Observação 7.3.1 Utiliza-se o coeciente de variação na comparação do grau de con-

centração de valores em torno da média para duas ou mais séries distintas. A série mais
homogênea e aquela que tem menor coeciente de variação relativa.
Nota 7.3.1 Uma distribuição estatística tem:
• Baixa dispersão: CV ≤ 15%.
• Média dispersão: 15% < CV < 30%.
• Alta dispersão: Cv ≥ 30%.
Exemplo 7.3.1 Para duas emissões de acções ordinárias de uma uma indústria de te-
lecomunicações, o preço médio diário, no fechamento dos negócios, durante um mês, foi
de 150, 00 USD para as acções A, com um desvio-padrão de 5, 00 USD. Para as acções
B , o preço médio foi de 50, 00 USD com um desvio-padrão de 3, 00 USD. Comparando a
viabilidade das acções A e B , tem -se:

• A viabilidade absoluta• das acções A e B é obtida pela comparação dos respec-

tivos valores de desvio-padrão.
σA = 5, 00 USD e σB = 3, 00 USD (σA é maior que SB ), então A tem maior

dispersão absoluta que B . Isto signica que em termos absolutos A é mais
variável que B , ou seja, a maior variabilidade ocorreu para a acção A, pois ela
apresenta maior desvio-padrão que a acção B
• A análise em termos relativos é feita pela comparação dos coecientes de variação
CVA = 5
150
× 100 = 3, 30%
CVB = 3
50
× 100 = 6, 0%
CVA é menor que CVB , então A apresenta menor dispersão relativa que B .
Neste caso B , é mais variável que A, pois o coeciente de variação da acção
B é quase duas vezes maior que o da ação A.
7.4 Curvas Simétricas e Assimétricas

Estas medidas referem-se à forma da curva de uma distribuição de frequência, mais espe-
cicamente do polígono de frequência ou do histograma.
Uma curva plana é simétrica se for possível dividi-la por uma recta (chamada eixo de
simetria), de forma que as duas metades da curva assim obtidas possam ser sobrepostas
por dobragem. Uma curva assimétrica é uma curva não simétrica.
7.4.1 Distribuição de Frequências Representada por Uma Curva

Simétrica
Na estatística, ocorrem distribuições de frequências, cuja representação gráco uma curva
normal, caso particular de uma curva simétrica. A curva normal é também conhecida
como curva em forma de sino.
• Pico da Curva: é o valor modal, que corresponde ao maior valor da frequência.
O eixo de simetria contém o valor modal. A partir desse eixo de simetria, observa-se
que cada metade da curva prolonga-se indenidamente tanto para o lado direito como
para o lado esquerdo, porém, sem tocar o eixo horizontal. Uma distribuição de frequência
representada por uma curva normal é unimodal ( tem apenas um pico).

Figura 7.1: Curva Simétrica
Nas distribuições de frequência simétrica, a média, mediana e moda são iguais. Na curva
normal, os valores da média, mediana e moda (x = M0 = Md ) coincidem no mesmo ponto

da curva de distribuição de frequência, que corresponde ao pico da curva.
7.4.2 Distribuição de Frequências Representada por Uma Curva

Assimétrica
Tanto nas representações grácas de distribuições de frequência simétrica quanto nas
assimétricas o pico da curva corresponde ao valor modal. Observa-se que na curva de
distribuição de frequência assimétrica a distribuição de pontos do lado esquerdo da curva
em relação à moda é diferente da distribuição dos pontos do lado direito da curva.
Uma distribuição de frequência é assimétrica quando a média, a mediana e a moda não
coincidem num mesmo ponto da representação gráca da distribuição, apresentando va-
lores diferentes. Toda distribuição deformada é sempre assimétrica. Entretanto, a assi-
metria pode dar-se na cauda esquerda ou na direita da curva de frequências.
Assimetria à Direita (ou Positiva)
Em uma distribuição assimétrica positiva, ou assimetria à direita, tem-se:
Mo < Md < X (7.4.1)

Figura 7.2: Curva Assimétrica Positiva
Assimetria à Esquerda (ou Negativa)
Em uma distribuição assimétrica negativa, ou assimetria à esquerda, predominam valores
inferiores à Moda.
X < Md < Mo (7.4.2)
Figura 7.3: Curva Assimétrica Negativa
Observação 7.4.1 Para as curvas ligeiramente assimétricas, os valores da mediana e da

média deslocam-se para a direita ou para a esquerda da moda, sendo que esse afastamento
pode ser mensurado através do coeciente de assimetria de Pearson.

7.4.3 Coeciente de Assimetria de Pearson (AS)

O coeciente de assimetria de Pearson estabelece o grau de assimetria de uma curva de
distribuição de frequências, ou seja, mede o afastamento da mediana em relação à média
aritmética da distribuição.
O coeciente de assimetria é expresso pela diferença entre a média e a mediana dividida
pelo desvio-padrão do grupo de medidas. O coeciente de assimetria de Pearson, permite
comparar duas ou mais distribuições diferentes e avaliar qual das distribuições é mais
quanto a assimétrica. Quanto maior o coeciente de assimetria de Pearson, mais assimé-
trica é a curva.
Existem várias fórmulas para o cálculo do coeciente de assimetria. As mais utilizadas
são:
• 1o Coeciente de Pearson:
3(x − Md )
AS = (7.4.3)
σ
• 2o Coeciente de Pearson:
Q1 + Q3 − 2Md
AS = (7.4.4)
Q3 − Q1
Nota 7.4.1 O coeciente de Pearson pode ser nulo, positivo ou negativo. Se o coeciente
de for:
• AS = 0, indica que a curva é simétrica, ou seja, não há assimetria( é uma curva de

distribuição normal);
• AS > 0, indica que a assimetria é positiva (deslocamento para a direita);
• AS < 0, indica que a assimetria é negativa (deslocamento para a esquerda)
7.5 Curtose
Curtose é o grau de achatamento (ou alamento) de uma distribuição em comparação
com uma distribuição padrão (chamada curva normal). De acordo com o grau de curtose,
classicamos três tipos de curvas de frequência:

1. Mesocúrtica: é uma curva básica de referência chamada curva padrão ou curva
normal.
Figura 7.4: Curva Mesocúrtica
2. Platicúrtica: é uma curva mais achatada (ou mais aberta) que a curva normal.
Figura 7.5: Curva Platicúrtica
3. Leptocúrtica: é uma curva mais alada (menos aberta) que a curva normal.
Figura 7.6: Curva Leptocúrtica

7.5.1 Coeciente Percentílico de Curtose

A medida da curtose pode ser feita pelo coeciente percentílico de curtose:
Q3 − Q1
C= (7.5.1)
2(P90 − P10
Sendo:
• C= coeciente percentílico de curtose;
• Q3 = o terceiro quartil;
• Q1 = o primeiro quartil;
• P90 = o nonagésimo percentil;
• P10 = o décimo percentil
Uma curva normal apresenta um coeciente percentílico de curtose de valor C = 0, 263.

Esse valor é obtido ao se aplicar a expressão matemática do coeciente percentílico de
curtose aos valores de uma distribuição simétrica normal. Tomando-se esse valor como
padrão, podem-se estabelece comparações entre as diversas curvas:
• C = 0, 263 corresponde à curva mesocúrtica;
• C < 0, 263 corresponde à curva leptocúrtica;
• C > 0, 263 corresponde à curva platicúrtica.
7.6 Propriedades da Aplicação do Desvio-padrão

As aplicações nos permitem entender porque o desvio-padrão é a mais importante das
medidas de dispersão.
Observação 7.6.1 Na curva normal, o valor da média aritmética é igual ao valor da

moda e igual ao valor da mediana: x = Md = M0 .
7.6.1 Distribuições Normais

A curva normal pode ser completamente especicada pelo valor da média e pelo valor
do desvio-padrão. A área limitada pela curva normal, entre um ponto qualquer e a
média, é função do número de desvios-padrão que aquele ponto dista da média. Estudos
matemáticos estabeleceram as seguintes proporções:

• A área total limitada pela curva normal é unitária (rea = 1).
• Intervalo de amplitude 2σ (também chamado zona de normalidade) é denido

pelo conjunto de valores em torno da média aritmética, contidos num intervalo de
amplitude 2σ , com centro na média da distribuição. É o conjunto de valores entre
(x − σ) e (x + σ ). Abrange 68% dos elementos da série.
• Intervalo de amplitude 4σ ( quatro vezes o desvio-padrão) é o conjunto de valores

compreendido entre (x − 2σ ) e (x + 2σ ) em torno da média, abrange cerca de 95%
dos elementos da série.
• Intervalo de amplitude 6σ ( seis desvios-padrão ) é o conjunto de valores com-

preendido entre (x − 3σ ) e (x + 3σ ) em torno da média, abrange aproximadamente
cerca de 100% da série.
Figura 7.7: Representação gráca da zona de normalidade
Exemplo 7.6.1 Dada a tabela de distribuição de frequência:
Classes fi
10 ` 14 10
14 ` 18 20
18 ` 22 30
22 ` 26 20
26 ` 30 10
• Sendo:

x = 20, Md = 20, M0 = 20, Q1 = 16, 5,

Q3 = 23, 5, P10 = 13, 6, P90 = 26, 4 e σ = 4, 64.
• Como x = Md = Mo = 20 −→ x − M0 = 0. Trata-se de uma curva simétrica

(x = Md = M0 )
• Coeciente de assimetria: AS = 3(20−20)

4,64
= 0. O coeciente nulo da assimetria
conrma que se trata de uma curva simétrica.
• Coeciente percentílico de curtose: C = 2(26,4−13,6)

23,5−16,5
= 0, 273. Como o valor do
coeciente percentílico de cusrtose obtido (0, 273) é maior que 0, 263 (C > 0, 263),
a curva é platicúrtica em relação à normal.

Capítulo 8
Números Índices e Noção de

Demograa
8.1 Números índices

8.1.1 Conceito e Objectivo
A análise comparativa da diversos fenómenos congéneres representados por séries, torna-se
mais simples se cada uma destas for representada por um número. Número este que poderá
ser uma das tendências centrais, facilitando a observação dentre outros acontecimentos, o
da variação de preços, de custo de vida, de salários, de volume de produção e de venda.
Para isso, entretanto é preciso observar a existência de termos de uma espécie nas várias
séries consideradas, sem o que, não se pode chegar a uma conclusão concisa das oscilações
reinantes.
Exemplo 8.1.1 Considere a tabela de mercadoria em espécie:
Tabela 8.1: Mercadoria em Espécie
Mercadoria em espécie Preço em milhares de Kwanzas
2015 2021
A 2,00 1,00
B 6,00 6,00
C 1,00 2,00
Total 9,00 9,00
• Assim, na tabela pode-se mediante simples observação, vericar a variação de preço
de cada mercadoria nos dois anos referidos.
98
• No caso da oscilação de preços do conjunto de mercadorias, é necessário apresentar
os valores de cada época por um único número, ao qual denominar-se-á número

índice - que expressará o conjunto de números relactivos.
8.1.2 Relactivos e Índices

Para simplicidade das comparações anteriormente citadas, toma-se um dos conjuntos
como base e atribui-se o valor 100 para cada termo da época, e para ou outros de outra
época, valores proporcionais aos existentes em cada espécie da série origem e na nova
série. Neste caso, diz-se que a base é xa e apresenta a vantagem de se poder observar em
cada espécie a variação expressa em percentagem referida a determinada época. Se numa
série mista que contém várias épocas, os valores das espécies de cada época for referido
sempre à anterior imediata diz-se que a base é variável.
A nova série construída é constituída então, por números obtidos em relação à época
cujos valores forma considerados iguais a 100. Os números que constituem a nova série
são denominados números relactivos
O número representativo do conjunto de valores relactivos de determinada época em
relação a outra ou de local a outro, denomina-se: número índice. Os números índices são
classicados de acordo com o emprego de uma medida de tendência central ou consideradas
as somas dos valores das séries, em:
• Número índice aritmético
• Número índice geométrico
• Número índice harmónico
• Número índice mediano
• Número índice agregativo
Exemplo 8.1.2 Transformar a série de preços da tabela 8.1 em outra de números relac-
tivos tomando como base o ano de 2015. Considerando como 100 o valor de cada espécie
para o ano base 2015 obtém-se os respectivos valores para o ano 2021, mediante a regra
de três simples directa.
(
2−1
• Espécie A : 1×100
100 − a3 ∴ a3 = 2
= 50

(
6−6
• Espécie B : 6×100
100 − a2 ∴ a2 = 6
= 100
(
1−2
• Espécie B : 2×100
100 − a4 ∴ a4 = 1
= 200
Tabela 8.2: Números Relactivos
Mercadoria em espécie N.Relactivos(Preço- Unit)
2020 2021
A 100 50
B 100 100
C 100 200
Total 300 350
8.1.3 Número Índice Simples e Ponderados

No acontecimento variação de preços, deve-se observar se as espécies estão apenas relaci-
onadas com eles (Tabela 8.1) ou se também com quantidades (Tabela 8.2). Quantidades
que, sendo conhecidas, podem expressar grandezas e valores absolutos, e que, se desco-
nhecidas, obriga em alguns casos a ponderar os preços das espécies de acordo com o valor
destas em ralação ao das outras. É o caso do conjunto da variação do custo de vida onde
os artigos de primeira necessidade recebem ponderações maiores do que os outros e o são
de forma diferente.
Quando as espécies estão apenas relacionadas com os preços, os números índices calculados
são denominados números índices simples e, se ainda, além dos preços são atribuídos
quantidades às espécies, os índices tomam o nome de números índices ponderados.
Tabela 8.3: Números índices simples e ponderados
Espécie 2015 2021
Preço Unit. (p0 ) Quantidades (q0 ) Preço Unit. (pi ) Quantidades (qi )
A 2,00 3 1,00 5
B 6,00 4 6,00 6
C 1,00 8 2,00 7
Número Índice Aritmético
Denição 16 (Número Índice Aritmético) . É a média aritmética dos números re-

lactivos a uma época. De acordo com o especicado pode ser simples ou ponderada.
1. Número índice aritmético simples: Seu cálculo se prende ao da média aritmética
simples.Por exemplo para o ano de 2015 da série dada na tabela 8.2 tem-se:
350
Ia = = 116, 67 (8.1.1)
3
e conclui-se que houve um aumento no preço de mercadorias, de 2015 a 2021.
2. Número índice aritmético ponderado: Seu cálculo se pretende ao da média arit-
mética ponderada. Para calcular o seu valor referente a 2021 deve-se primeiramente
transformar a série dada pela tabela 8.3 na série de números relactivos exposta na
tabela 8.4. Calculado-se o índice referente a 2021, uma vez que o referente a 2015 é
igual a 100, tem-se:
Ip = 125 (8.1.2)
e conclui-se que houve aumento nos preços de 2015 a 2021.
Tabela 8.4: Número índice aritmético ponderado
Espécie 2015 2021

o o
N relactivos Quantidades (ton) N relactivos Quantidades (ton)
A 100 3 5 5
B 100 4 100 6
C 100 8 200 7
Número Índice Geométrico
Denição 17 (Número Índice Geométrico) . É a média geométrica dos números

relactivos referentes a uma época. Pode ser simples ou ponderado dependendo da série
ser respectivamente de dados não agrupados ou agrupados.
1. Número índice geométrico simples: Para seu cálculo emprega-se o da média
geométrica simples. Para a série exposta na tabela 8.2, tem-se para o ano de 2021:
Ig = 100 (8.1.3)
e conclui-se que não houve aumento nos preços das mercadorias consideradas em
conjunto.
2. Número índice geométrico ponderado: Para seu cálculo deve-se empregar o
da média geométrica ponderada. Assim, a série de preços expostos na tabela 8.4 a
presenta um aumento deles considerados uma vez que o número índice geométrico

referente a 2015 é 100 e o 2021 é
Igp = 108 (8.1.4)
Número Índice Harmónico
Denição 18 (Número Índice Geométrico) . É a medida geométrica dos números

relactivos referentes a uma época. Também pode ser simples ou ponderado de acordo com
a série a que se refere.
1. Número índice harmónico simples : Seu valor identica-se com o da média har-
mónica simples. Assim, pode-se vericar um decréscimo de preços da série exposta
pela tabela 8.2 mediante os valores de 100 para 2015 e para 2021 de,
Ih = 85, 7 (8.1.5)
2. Número índice harmónico ponderado:É calculado para a média harmónica
ponderada. Para a série de preços fornecida pela tabela 8.4 conrma-se o aumento
de preços, pois que, para 2015 seu valor é 100, e para 2021 tem-se:
Ihp = 110, 1 (8.1.6)
Número Índice Mediano
Denição 19 (Número índice mediano) . A medida de tendência central a ser em-

pregada é a mediana, cujos valores identicam-se. De conformidade com ela, o número
índice mediano pode ser simples ou ponderado.
1. Número índice mediano simples: Verica-se constância de preços na série ex-
posta pela tabela 8.2, uma vez que:
3+1
P = =2 e Im = 100 (8.1.7)
2
2. Número índice mediano ponderado: O cálculo de seu valor é feito de acordo
com o da mediana. Desta forma, verica-se que não houve variação de preços da
tabela 8.4 através do índice mediano de 2021:
Imp = 100 (8.1.8)

Número Índice Agregativo Simples
Denição 20 (Número Índice Agregativo Simples) . O número índice agregativo

simples expressa as somas totais dos valores das épocas sobre a soma total 100 considerada
para a época básica. Para a série de preços da tabela 8.1 tem-se, mediante regra de três
simples directa,
9, 00 −→ 9, 00
(8.1.9)
100 −→ I I = 100×9
9
= 100,
o que demonstra pertinência no total dos preços, no conjunto de mercadorias, de 2015
a 2021. De modo geral, pode-se calcular o número índice agregativo simples, mediante
emprego da fórmula
100 × S2
I= (8.1.10)
S1
onde S1 soma total dos valores referentes à época base e S2 é a soma total dos valores da
época desejada.
8.1.4 Índice Agregativos Ponderados. Fórmulas de Laspeyres,

Egeworth e de Marshall, de Paasche e de Ficher
Para eliminar ou atenuar causas que inuem sensivelmente, foram propostas fórmulas
ao cálculo de números índices agregativos ponderados. Números esses que expressam
as somas dos produtos dos preços pelas quantidades de uma época dada, sobre a soma
100 dos referidos produtos da época básica. Dessa forma, considerando que as épocas
apresentam-se com quantidades diferentes de uma mesma espécie e sendo:
• q0 = quantidades das espécies na época-base;
• p0 = preços das espécies na época-base;
• qi = quantidades das espécies em uma época qualquer dada;
• pi = preços das espécies em uma época qualquer dada.
Têm-se as fórmulas a seguir discriminadas:
Fórmula de Laspeyres
Denição 21 (Fórmula de Laspeyres) . Obtém-se a fórmula de Laspeyres mediante

a regra de três simples directa e supondo, iguais as quantidades de cada espécie em todas

as épocas:
X X
p0 q0 − pi q i
100 −→ I
onde P
pi qi
I = 100 P
p0 q0
e sendo qi = q0 tem-se: P
p i q0
I = 100 · P (8.1.11)
p0 q 0
Exemplo 8.1.3 Para a série considerada na tabela 8.3 verica-se a oscilação ascendente
de preços, no conjunto de mercadorias, traçando mais duas colunas onde são calculados
respectivamente os produtos p0 q0 e pi qi cujas somas p0 q0 = 38, pi q0 = 43. valores
P P
esses que levados na fórmulas citada:
43
I = 100 · × = 113, 2 (8.1.12)
38
Fórmula de Marshall e Egeworth
Denição 22 (Fórmula de Marshall e Egeworth) . O cálculo do índice agregativo

ponderado se prende ao emprego da fórmula;
P
(qi + q0 )pi
I = 100 · P (8.1.13)
(q0 + qi )p0
Exemplo 8.1.4 Para série dada pela tabela 8.3 deve-se traçar mais colunas, a m de se
determinar o número índice desejado, sendo que em uma delas calculam-se as somas das
quantidades para cada espécie (q0 + qi ) e nas outras calculam-se os produtos das somas
das quantidades de cada espécie pelos respectivos preços. Obtendo-se respectivamente:
X
(q0 + qi )pi = 98
X
(q0 + qi )p0 = 91
valores que levados na fórmulas citada
98
I = 100 · = 107, 6 (8.1.14)
91
que demonstra o aumento havido nos preços das mercadorias consideradas em conjunto.

Fórmula de Paasche
Denição 23 (Fórmula de Paasche) . O número índice agregativo é obtido com o

emprego da seguinte fórmula: P
pi qi
I = 100 · P (8.1.15)
po qi
Exemplo 8.1.5 Para a série exposta na tabela 8.3 usa-se a disposição indicada na fór-
mula de Laspeyres, considerando na última coluna referente ao ano de 2015 os produtos de
sues preços pelas quantidades de 2021. Obtidas as somas e empregando a fórmula tem-se:
55
I = 100 · = 103, 7 (8.1.16)
53
e ca vericada a variação para mais, já referida.
Fórmula de Ficher
Das fórmulas citadas, a que mais satisfaz às diversas provas, quanto à sua exatidão é a de
Ficher, obtida pela média geométrica das de Laspeyres e de Paasche

sP P
pi q 0 pi q i
I = 100 · P ·P (8.1.17)
p 0 q0 p0 qi
Mediante o emprego dessa fórmula na série exposta pela tabela 8.3, verica-se oscilação
reinante nos preços do conjunto de mercadorias. Tem -se sucessivamente:
r
43 55
I = 100 · · = 108, 4 (8.1.18)
38 53
Observação 8.1.1 Sendo difícil de obter de imediato os valores das quantidades qi ,

consideram-se então as quantidades q0 iguais em todas as épocas para cada espécie e
emprega-se a fórmula de Laspeyres.
8.1.5 Número Índice em Cadeia

Uma sequência de épocas, se cada número relactivo é calculado em referência à época
anterior imediata, tem-se então os números índices em cadeia. Apresentam vantagem
de facilitar a comparação dos preços em duas épocas consecutivas, eliminado a necessidade
de se recorrer a escolhida como base. Designando por I1 , I2 , ·, In os números respectivos de

n épocas, considerada a base 100 para a primeira época, a partir de percentagens tem-se
para o cálculo os números índices em cadeia:

• Segunda Época:
100 −→ I2
I1 −→ I20
sendo
I1 I2
I20 = (8.1.19)
100
• Terceira Época:
100 −→ I3
I20 −→ I30
sendo
I20 I3
I30 = (8.1.20)
100
• n Época:
100 −→ In
0
In−1 −→ In0
sendo
0
In−1 In
In0 = (8.1.21)
100
8.2 Noções de Demograa

8.2.1 Conceito
O estudo das características, do modo de vida, das relações entre diversos grupos, e da
evolução de um povo é feito pela Demograa. Adolpho Quetelet (1796 - 1874), procurou
estabelecer uma espécie de Física social, empregando trabalhos de seus antecessores, nos
fenómenos demográcos e procurando estabelecer as leis das relações sociais. Porém, foi
Bertillon que lançou as bases da Demograa como ciência autónoma.
A demograa classica-se em:
1. Demograa Estática: É a parte da demograa que estuda em determinado tempo,
as características, modo de vida e relações entre os diversos grupos de um povo. As

relações entre os diversos grupos podem ser obtidas pelas densidades demográ-
cas que são:
(a) Densidade aritmética: Razão por quociente entre o efectivo da população,
e a superfície total do território.
(b) Densidade siológica: Razão por quociente entre o número de habitantes e
a superfície de terras produtivas, excluindo as orestas.
(c) Densidade agrária: Razão por quociente entre a população agrícola e a
superfície de terras produtivas.
2. Demograa Dinâmica: É a parte da demograa que estuda a evolução de um
povo. Esta evolução pode ser observada através dos nascimentos, casamentos, óbi-
tos, migrações, mortalidade e sobrevivência.
• A natalidade, nupcilidade e mortalidade, são expressas por taxas, consi-
derando sobre 1 000 habitantes, respectivamente os números de nascidos vivos,
de casamentos realizados e de mortes.
• As migrações são classicadas em internacionais que podem ser emigração

(saída de indivíduos de um país), imigração (entrada de indivíduos em um
país) e internas que consiste no deslocamento contínuo ou periódico de
indivíduos nas regiões de um país.
8.2.2 Taxa de Crescimento

Os valores de uma série cronológica ou marcha podem-se apresentar segundo relações
suscetíveis de denir. Assim, os valores representativos dos efectivos de uma população
podem ser dispostos em um gráco e segundo a tendência geral, apresentar um crescimento
positivo (aumenta), negativo (diminui) e nulo (estacionário). Esse crescimento pode ser
observado através das taxas: Taxa de crescimento absoluto; Taxa de crescimento médio;
Taxa de crescimento relactivo.
Taxa de Crescimento Absoluto (T)
Denição 24 (Taxa de crescimento absoluto (T)) . A taxa de crescimento abso-

luto de uma série cronológica é a diferença entre dois valores consecutivos da variável
dependente, respectivamente posterior e anterior. Se a taxa de crescimento for:
• T > 0 tem-se crescimento positivo.
• T < 0 tem-se crescimento negativo.

• T = 0 tem-se crescimento nulo
No caso de o crescimento ser positivo ou negativo admite-se para prazos curtos cresci-
mento aritmético (os valores crescem em progressão aritmética) e crescimento geo-
métrico (os valores crescem em progressão geométrica) e para prazo longo ( os valores
crescem segundo linhas curvas e entre elas de preferência a logística).
Taxa de Crescimento médio ou anual (t)
Denição 25 (Taxa de crescimento médio anual (t)) . É a rezão por quociente en-
tre a taxa de aumento absoluto e o número de anos decorridos no intervalo de tempo ob-
servado. No crescimento aritmético esta taxa se identica com a razão de uma progressão
aritmética. Assim considerando
• p = população em um período inicial.
• P = população em um período consecutivo.
• n = número de anos decorridos no período
• t = taxa de crescimento anual.
Recorrendo a fórmula do termo geral de uma progressão aritmética, tem-se:
P −p
P = p + nt =⇒ t = (8.2.1)
n
Taxa de Crescimento Relactivo (tr )
Denição 26 (Taxa de crescimento relactivo (tr )) . A taxa de crescimento relac-

tivo é a razão por quociente entre a taxa média e o primeiro valor considerado da variável
dependente,
t
tr = (8.2.2)
p
• Crescimento aritmético: A razão da progressão aritméica é igual a ptr porque:
t = ptr e a fórmula da progressão cará:
P −p
P = p + ptr n ⇒ tr = (8.2.3)
pn
• Crescimento geométrico: Para prazos curtos é mais signicativo supor que para
efectivos cada vez maiores o acréscimo não seja constante, e sim que os valores

variem segundo uma progressão geométrica de razão q e cuja fórmula do termo
genérico será
P = pq n (8.2.4)
E a taxa de acréscimo será obtida mediante a fórmula:
s
n
P
q= (8.2.5)
q
Observação 8.2.1 Pode-se calcular a taxa de crescimento geométrico aplicando loga-

ritmo à fórmula da progressão geométrica:
log P = log p − n logq (8.2.6)

Capítulo 9
Probabilidades
9.1 Teoria de Probabilidades

As variáveis económicas são, por sua própria natureza, aleatórias. Não sabemos quais
serão seus valores senão depois de observá-los. A probabilidade é uma forma de expressar
a incerteza sobre eventos e resultados económicos. Consequentemente, neste capítulo,
faremos o estudo minucioso da teoria de probabilidades, que serão utilizados em matérias
dos anos posteriores do curso.
Não se pode falar da história da Estatística, sem falar em probabilidades. Estas tiveram
sua origem no estudo dos jogos de azar., já conhecido pelos Egípcios 3500 a.C. Mas só no
século XVI se assiste à primeira tentativa de desenvolver uma teoria de probabilidades.
Cardano considerado um verdadeiro cientista da Época Renascentista, escreveu sobre
todas as áreas de estudo da época, incluindo a matemática, a teologia, cosmologia e a
medicina. Tendo sido, um dos primeiros a tentar descrever um método de cálculo das
probabilidade, bem como, as suas leis básicas. Com o seu livro "The book on games of
chance ", Cardano, não só explica as leis da probabilidade como analisa os jogos de azar
e ensina a jogar e a detectar os batoteiros.
9.1.1 Conceitos da Teoria de Probabilidades

Experiência Aleatória
Uma experiência aleatória é o processo de observação ou de acção, cujos resultados, em-
bora podendo ser descritos no seu conjunto, não são determináveis à priori, antes de
realizada a experiência. As características de uma experiência aleatória são:
110
• A possibilidade de repetição da experiência em condições uniformes;
• Não se pode armar à partida qual o resultado (fenómeno aleatório) da experiência
a realizar, mas poder descrever o conjunto de todos os resultados possíveis;
• A existência de regularidade quando a experiência é repetida muitas vezes.
Espaço de Resultados
É o conjunto de todos os resultados possíveis de uma determinada experiência aleatória,
e representa-se por Ω.
Acontecimentos
É o conjunto de resultados possíveis de uma experiência aleatória. Qualquer subconjunto
do espaço de resultados é um acontecimento denido em Ω (eventualmente o próprio Ω

ou o conjunto vazio ∅).
Não se deve confundir acontecimento com resultado. Enquanto que o primeiro signica
algo que a experiência aleatória pode produzir, mas não se realiza necessariamente, um re-
sultado indica algo que a experiência aleatória produziu. Ou seja, o conceito de resultado
só tem sentido depois de realizada a experiência, enquanto que o conceito de aconteci-
mento tem pleno sentido mesmo antes da experiência aleatória se realizar.
Um acontecimento A diz-se elementar se a sua realização depender da ocorrência de so-
mente um resultado especíco da experiência aleatória. Por outro lado, um acontecimento
diz-se complexo ou composto se a sua realização implica a ocorrência de um resultado da
experiência aleatória.
9.1.2 Álgebra dos Acontecimentos

Na secção anterior, deniu-se acontecimento como um conjunto de resultados possíveis
de uma experiência aleatória. Esta denição sugere que podemos utilizar todos os ins-
trumentos da teoria dos conjuntos para representar os acontecimentos e as operações que
se denem sobre estes. Por exemplo, o diagrama de Venn revela-se de extrema utilidade
na representação de acontecimentos: o conjunto universal é identicado como o espaço
de resultados Ω da experiência aleatória e cada acontecimento A por uma região interior
a Ω. Do mesmo modo, o diagrama de Venn pode ser usado para representar de forma

simplicada as operações que se denem sobre acontecimentos: união ou soma lógica,
intersecção ou produto lógico e diferença.
Figura 9.1: Representação de acontecimento
Denição 27 Sejam A e B dois acontecimentos, dene-se um novo acontecimento união

de A com B (A ∪ B ), ou soma lógica de A com B , traduzido por
A ∪ B = {ω : ω ∈ A ∨ ω ∈ B} (9.1.1)
isto é, A ∪ B consiste na realização de pelo menos um dos acontecimentos.
A operação união de acontecimentos pode ser generalizada a mais de dois acontecimen-
tos. Dada uma sucessão innita de acontecimentos A1 , A2 , ..., An , ... dene-se a sua união
S∞
i=1 Ai como sendo o acontecimento que ocorrerá se e somente se ocorrer pelo menos um
dos acontecimentos Ai .
Figura 9.2: União de acontecimentos
Denição 28 Dados dois acontecimentos A e B , dene-se intersecção ou produto lógico

de A com B , simbolicamente representada por A ∩ B , como o acontecimento que ocorre

se, e só se,ocorrerem A e B (em simultaneidade ou em sequência):
A ∩ B = {ω : ω ∈ A ∧ ω ∈ B∧} (9.1.2)
Figura 9.3: Intersecção de acontecimentos
De modo análogo, essa operação também pode ser generalizada a um conjunto, nito ou
innito, de acontecimentos.
Dada uma sucessão innita de acontecimentos A1 , A2 , A3 , ..., An , ... dene-se a sua inter-
T∞
secção i=1 Ai como sendo o acontecimento que se realiza se, e só se, ocorrem todos os
acontecimentos Ai .
Quando determinados acontecimentos que não podem ocorrer simultaneamente, a sua in-
tersecção é um acontecimento impossível, isto é, corresponde a um conjunto vazio. Estes
acontecimentos chamam-se mutuamente exclusivos ou incompatíveis. A sua representação
no diagrama de Venn é:
Figura 9.4: Acontecimento impossível
Denição 29 A diferença de dois acontecimentos A e B , ou acontecimento diferença

A − B ou A \ B é o acontecimento que se realiza quando ocorre A mas não B . Será ,

assim o acontecimento constituído por todos os elementos de A que simultaneamente não

pertencem a B , ou seja:
A − B = A \ B = {ω : ω ∈ A ∧ ω ∈
/ B} (9.1.3)
Diagramaticamente, No caso particular da diferença de dois acontecimentos A e B , em que
Figura 9.5: Diferença de Acontecimentos
A é o próprio espaço de resultados, o acontecimento diferença denomina-se complementar

de B , representa-se por B e é o acontecimento que ocorre quando não ocorre B :
Ω − B = B = {ω : ω ∈ Ω ∧ ω ∈
/ B} (9.1.4)
A sua representação pelo diagrama de Venn é:
Figura 9.6: Acontecimento complementar
Proposição 9.1.1 Propriedades das operações Abaixo apresentamos as propriedades mais

importantes das operações de união e intersecção de acontecimentos.

Tabela 9.1: Propriedades das operações
Propriedades União Intersecção

1. Comutativa A∪B =B∪A A∩B =B∩A
2. Associativa A ∪ (B ∪ C) = (A ∪ B) ∪ C A ∩ (B ∩ C) = (A ∩ B) ∩ C
3. Distribuitiva A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
4. Idempotência A∪A=A A∩A=A
5. Lei do complemento A∪A=Ω A∩A=∅
6. Leis de De Morgan A∪B =A∩B A∩B =A∪B
7. Elemento neutro A∪∅=A A∩Ω=A
8. Elemento absorvente A∪Ω=Ω A∩∅=∅
9.1.3 Conceitos de Probabilidade

A probabilidade é uma medida da certeza da ocorrência de um determinado aconteci-
mento. Nas áreas económica e de gestão, os diferentes conceitos de probabilidade são
largamente utilizados. Por exemplo, quando o ministro das nanças de Angola arma
que a inação no corrente ano não ultrapassará 4% ou quando se arma que a diversi-
cação da economia terá um forte peso na redução do nível de importações.
As probabilidades fornecem aos gestores e economistas as bases para a tomada de deci-
são, quando existe incerteza sobre a evolução futura e sobre os efeitos práticos das suas
decisões, isto é, quando a partir do passado não é possível prever deterministicamente o
futuro, devido à inuência do acaso, sendo no entanto possível prever as linhas de evolu-
ção futura e as possibilidades de estas se concretizarem. Podemos denir três conceitos
de probabilidade: clássica, empírica ou frequencista e subjectiva. As probabilidades que
se baseiam nas características intrínsecas dos acontecimentos são denidas segundo o con-
ceito clássico; aquelas que se baseiam numa quantidade razoável de evidência objectiva
são impíricas ou frequencistas; enquanto que as probabilidades denidas com base em
crenças ou opiniões individuais se denominam subjectivas.
Denição 30 (Conceito clássico) A probabilidade de um conjunto A é a fracção n(A)

N
,
tal que,
n(A)
P (A) = (9.1.5)
N
onde:
n(A) - números de resultados favoráveis a A

N - número de resultados possíveis.
Exemplo 9.1.1 Consideremos a experiência aleatória que consiste no lançamento de um

dado. Seja A o acontecimento: obter um número ímpar na face superior do dado. O

espaço de resultados será constituído por ω = {1, 2, 3, 4, 5, 6}. E o acontecimento será:

A = {1, 3, 5}.
• O número de resultados favoráveis: n(A) = 3.
• O número de resultados possíveis: N = 6
• A probabilidade de A será:
n(A) 3 1
P (A) = P (A) = = =
N 6 2
Denição 31 (Conceito frequencista) Se em N realizações de uma experiência, o

acontecimento A se vericou n vezes, diz-se que a frequência relativa de A nas N re-
alizações é,
n
fA = , (9.1.6)
N
sendo fA a frequência relativa do acontecimento A.
Ao número para que tende a frequência relativa fA , quando se aumenta o número de
provas, chama-se probabilidade do acontecimento A:
P (A) = lim fA (9.1.7)

N →∞
Isto equivale a aceitar que numa sucessão numerosa de experiências é praticamente certo
que a frequência relativa de A seja aproximadamente igual a P (A).
Exemplo 9.1.2 A experiência aleatória que consiste na observação do sexo de um recém-

nascido pode considerar-se o exemplo típico para aplicação do conceito frequencista de
probabilidade. Porque esta experiência já se realizou inúmeras vezes e existem registos do
seu resultado, sabe-se que a probabilidade do sexo do recém-nascido ser masculino é de
aproximadamente 0, 52 e de ser feminino é de cerca de 0, 48.
Denição 32 (conceito subjectivo ou personalista)

Utilizando este conceito, a probabilidade de um acontecimento é dada pelo grau de credi-
bilidade ou de conança que cada pessoa dá à realizações de um acontecimento.
Exemplo 9.1.3 Se o ministro das nanças armasse que a inação para o próximo ano
será de 3% com uma probabilidade de 0, 9, estaria a aplicar o conceito subjectivo ou
personalista de probabilidade.

9.1.4 Axiomas da Teoria das Probabilidades

Da necessidade de sistematização dos conceitos empregues na Teoria das Probabilidades
e da construção de um corpo teórico coerente surgem três axiomas. Assim, consideremos
que P (·) é uma função que associa a todo o acontecimento A denido em Ω um número
compreendido no intervalo [0, 1] e que satisfaz os seguintes axiomas:
Axiomas 1 1. P (A) ≥ 0 ∀A ⊆ Ω
2. P (Ω)=1 (Ω é o acontecimento certo)
3. Sendo A e B acontecimentos mutuamente exclusivos denidos em Ω, ou seja A∩B =

∅, tem-se que:
P (A ∪ B) = P (A) + P (B). (9.1.8)
Generalizando, sendo A1 , A2 , ..., An acontecimentos mutuamente exclusivos denidos

em Ω, tem-se que "n #
[ Xn
P Ai = P (Ai ). (9.1.9)
i=1 i=1
Com base nestes axiomas é possível demonstrar vários teoremas, tais como:
Teorema 9.1.2 Dado um acontecimento A com probabilidade P (A), a probabilidade do

seu complementar obtém-se subtraindo à unidade a probabilidade de A, i.é:
P (A) = 1 − P (A). (9.1.10)
Exemplo 9.1.4 Numa ferira do sector de telecomunicações foram cadastradas 50 em-

presas. A organização prevê sortear um prémio para as empresas participantes. Qual
a probabilidade de uma empresa, que tenha instalado 4 tendas de exposição ganhar o
prémio? E a probabilidade de não ganhar?
• Probabilidade da empresa ganhar o prémio: n(A) = 4, N = 50:
n(A) 4
P (A) = = = 0, 08 (8%)
N 50
• A probabilidade de a empresa não ganhar o prémio:
Acontecimento favorável A: ganhar o prémio.

Acontecimento complementar A: não ganhar o prémio.
Então:
P (A) = 1 − P (A) = 1 − 0, 08 = 0, 92 (92%)

Teorema 9.1.3 A probabilidade do acontecimento impossível é zero, i.é,
P (∅) = 0 (9.1.11)
Teorema 9.1.4 Dados dois acontecimentos quaisquer A e B , a probabilidade do aconteci-

mento diferença B−A obtém-se pela diferença entre a probabilidade de B e a probabilidade
da intersecção de A com B , ou seja,
P (B − A) = P (B) − P (A ∩ B). (9.1.12)
Teorema 9.1.5 A probabilidade da união de dois acontecimento quaisquer, A e B , obtém-

se somando as suas probabilidades e deduzindo a probabilidade da sua intersecção, isto é,
P (A ∪ B) = P (A) + P (B) − P (A ∩ B). (9.1.13)
Exemplo 9.1.5 No lançamento de um dado, consideramos o acontecimento A = {1, 2, 5, 6}

e o acontecimento B = {2, 4, 6}
• Os acontecimentos não são mutuamente exclusivos, pois a intersecção de A e B não

é um conjunto vazio: A ∩ B = {2, 6}.
• P (A) = 64 , P (B) = 3
6
, P (A ∩ B) = 62 .
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
4 3 3 5
= + − =
6 6 6 6
5
P (A ∪ B) =
6
Corolário 9.1.1 Sendo A e B acontecimentos quaisquer,
P (A ∪ B) ≤ P (A) + P (B). (9.1.14)
Teorema 9.1.6 (generalização do 9.1.5 a mais de dois acontecimentos)

Sejam A1 , A2 , ..., An acontecimentos quaisquer denidos em Ω. Então
" n
#
[
P (A1 ∪ A2 ∪ A3 ∪ ... ∪ An ) = P Ai = (9.1.15)
i=1
n
X n−1 X
X n
= P (Ai ) − P (Ai ∩ Aj )+
i=1 i=1 j=i+1
n−2 X
X n−1 n
X
+ P (Ai ∩ Aj ∩ Ak ) + ...+
i=1 j=i+1 k=j+1
+ ... + (−1)n+1 P (A1 ∩ A2 ∩ ... ∩ An )

9.1.5 Probabilidades Condicionas

A partir do momento em que se conhece a probabilidade do acontecimento B (do espaço de
resultados Ω) ocorrer, é possível calcular a probabilidade de qualquer outro acontecimento
A se realizar condicionado pelo acontecimento B .
Denição 33 Probabilidade condicionada é dada por
P (A ∩ B)
P (A \ B) = , se P (B) > 0 (9.1.16)
P (B)
isto é, a probabilidade de um acontecimento (A)condicionado pela ocorrência de outro (B )

é igual ao quociente entre a probabilidade de ambos se realizam (A ∩ B ) e a probabilidade
do acontecimento dado.
Axiomática e Teoremas da Teoria das Probabilidades na Probabilidade Con-

dicionada
O conceito de probabilidade condicionada satisfaz todos os axiomas da teoria das probabi-
lidades apresentada anteriormente. Assim, sendo B um acontecimento tal que P (B) > 0:
Teorema 9.1.7
P (B \ A) ≥ 0 (9.1.17)
Teorema 9.1.8
P (Ω \ B) = 1 (9.1.18)
Teorema 9.1.9 Se A1 e A2 são mutuamente exclusivos, isto é, A1 ∩ A2 = ∅, então:
P [(A1 ∪ A2 )|B] = P (A1 \ B) + P (A2 |B) (9.1.19)
9.1.6 Probabilidade da Intersecção de Acontecimentos. Aconte-

cimentos Independentes
Probabilidade da Intersecção de Acontecimentos
A probabilidade de intersecção de dois acontecimentos. A e B, decorre da probabilidade
condicionada. De acordo com a denição de probabilidade condicionada resulta que
P (A ∩ B)
P (A \ B) = (9.1.20)
P (B)

e
P (A ∩ B)
P (B \ A) = (9.1.21)
P (A)
Assim, das duas igualdades anteriores tem-se que:
P (A ∩ B) = P (A \ B) · P (B) (9.1.22)
ou
P (A ∩ B) = P (B \ A) · P (A) (9.1.23)
Acontecimentos Independentes
O conceito de acontecimentos independentes tem estrita relação com a probabilidade
condicionada. Assim, se para dois acontecimentos A e B suceder que que a ocorrência ou
não de algum deles não afecta a probabilidade de ocorrer o outro, i.é, se
P (A \ B) = P (A) ouse P (B \ A) = P (B) (9.1.24)
então A e B consideram-se acontecimentos independentes.
De modo equivalente, diz-se que A e B são independentes se e só se a seguinte condição
for vericada:
P (A ∩ B) = P (A) · P (B) (9.1.25)
i.é, se a probabilidade da sua intersecção for igual ao produto das probabilidades de
cada um deles. Para dois acontecimentos independentes, se podem enunciar os seguintes
teoremas:
Teorema 9.1.10 Se A e B são acontecimentos independentes, então:
1. A e B também o são;
2. A e B também o são;
3. A e B também o são.
Teorema 9.1.11 Sejam os acontecimentos A1 , A2 , ..., An , dizem-se independentes se se

vericarem simultaneamente as seguintes condições:
P (Ai ∩ Aj ) = P (Ai ) · P (Aj ) ∀i, j = 1, 2, ..., n com i 6= j (9.1.26)
P (Ai ∩ Aj ∩ Ak ) = P (Ai ) · P (Aj ) · P (Ak ) ∀i, j, k = 1, 2, ..., n, com i 6= j, i 6= k, j 6= k ......

n
! n
\ Y
P = P (Ai )
i=1 i=1
Exemplo 9.1.6 O Ministério da Economia de Angola acredita que a probabilidade da

inação car abaixo de 3 % nos próximos cinco anos é de 0,20; entre 3 % e 4 % é de
0,45 e acima de 4 % é de 0,35. O Ministério acredita que, com inação abaixo de 3 %, a
probabilidade de se criar mais 200.000 empregos é de 0.6, diminuindo essa probabilidade
para 0,3 caso a inação que entre 3 % e 4 %; no entanto, com inação acima de 4 %,
isso é totalmente impossível. Um economista prevê que a criação desses 200.000 empregos
novos no nal do período só será possível se a inação car entre 3 % e 4 %?. Qual é a
probabilidade de a inação car entre 3 % e 4 % e serem criados esses empregos?
• Sejam denidos os seguintes acontecimentos:
A = Inação abaixo de 3%; B = Inação entre 3% e 4%.

C = Inação acima de 4% e D = Criar mais 200.000 empregos.
• Pelos dados temos:
P (A) = 0, 20, P (B) = 0, 45, P (C) = 0, 35;

P (D \ A) = 0, 6, P (D \ B) = 0, 3, P (D \ C) = 0
• Então:
T
P (B D 0, 45 × 0, 3
P (B \ D) = = = 0.529.
P (D) (0, 20 × 0, 6) + (0, 45 × 0, 3) + (0, 35 × 0)
• A probabilidade de a inação car entre 3% e 4% no nal do período é de 52, 9%.
Exemplo 9.1.7 Suponha que uma loja dispõe se de dois produtos substitutos, a prefe-
rência do produto A pelos Clientes é de 46.67%, do produto B é de 55% e de ambos os
produtos é de 21.67%.
• Sendo os acontecimentos:
P (A) = 0, 466, P (B) = 0, 55, P (A ∩ B) = 0, 2167

• Se um cliente é escolhido ao acaso, probabilidade de :
Preferir o produto A ou B é dada por:
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
= 0, 466 + 0, 55 − 0, 2167 = 0, 7993 (79, 93%)
Preferir somente o produto A é dada por :
P (A ∩ B)A = P (A ∪ B) − P (B) = 0, 7993 − 0, 55 = 0, 2493 (24, 93%)
Preferir o produto A na condição de ser usuário do produto B é dada por:
P (A ∩ B) 0, 2167
P (A \ B) = = = 0, 3494 (34, 94%).
P (B) 0, 55
9.1.7 Teorema da Probabilidade Total e Fórmula de Bayes

O conceito de probabilidade condicionada revela-se muito importante e de larga utilização
quando se conhecem probabilidades condicionadas nas quais os acontecimentos condicio-
nantes denem uma partição em Ω.
Denição 34 Diz-se que os acontecimentos A1 , A2 , ..., An denem uma partição em Ω,

quando se vericam simultaneamente as seguintes condições:
1. A união de todos os acontecimentos é o próprio espaço de resultados:

n
[
Ai = Ω (9.1.27)
i=1
2. Os acontecimentos são mutuamente exclusivos, dois a dois:
Ai ∩ Aj = ∅ i 6= j, i, j = 1, 2, ..., n. (9.1.28)
3. Todos os acontecimento têm probabilidade não nula
P (Ai ) > 0 i = 1, 2, ..., n. (9.1.29)
Teorema 9.1.12 (probabilidade total)

Se os acontecimentos A1 , A2 , ..., An denem uma partição sobre Ω, então para qualquer

acontecimento B denido em Ω tem-se que:

n
X
P (B) = P (B\Ai )×P (Ai ) = P (B\A1 )×P (A1 )+P (B|A2 )×P (A2 )+...+P (B\An )×P (An )
i=1
(9.1.30)
Teorema 9.1.13 (fórmula de Bayes)

Se A1 , A2 , ..., An denem uma partição sobre Ω, então, para B denido em Ω:
P (Aj ) × P (B \ Aj )
P (Aj \ B) = Pn , j = 1, 2, ..., n (9.1.31)
i=1 P (Ai ) × P (B \ Ai )
Exemplo 9.1.8 O departamento de recurso humano de uma empresa do Huambo esco-

lhe estagiários oriundos da Faculdade de Economia. No primeiro curso, a proporção de
estudantes com boa formação em Contabilidade e Auditoria é de 60%, enquanto no curso
de Economia, essa proporção cai para 45%. Um estagiário acaba de ser contratado. A
probabilidade de que tenha boa formação em Contabilidade é Auditoria é de 50%. Qual é
a preferência (probabilidade) do departamento pelo primeiro curso?
• A = Curso de Contabilidade e Auditoria; B = Curso de Economia e C = Boa

formação em Contabilidade.
• Pelos dados temos: P (C \ A) = 0, 60; P (C \ B) = 0, 45 e P (C) = 0, 50
• Pretende-se, determinar P (A))
• Pelo teorema da probabilidade total temos:
P (C) = P (A ∩ C) + P (B ∩ C)
P (C) = P (A) × P (C \ A) + P (B) × P (C \ B)
0, 50 = P (A) × 0, 60 + 0, 45 × [1 − P (C \ A)]
0, 50 = 0, 60 × P (A) + 0, 45 − 0, 45 × P (A)
0, 05
P (A) = = 0, 333 (33, 3%)
0, 15
• A preferência do departamento pelo primeiro curso é de 33, 3%.
Exemplo 9.1.9 Um empresário é conhecido por ser muito cauteloso com relação a suas
informações. Ele tem um registro minucioso da composição de cada área de sua empresa
e sabe que:
Sabendo que ele realiza uma visita surpresa dum dos departamentos, escolhendo ale-
atoriamente um deles e consegue identicar de modo imediato um Técnico Médio. Qual

Departamento Técnico Superior Técnico Médio Técnico Básico

Finanças 2 3 4
Jurídico 3 2 2
Contabilidade 4 1 1
é a probabilidade de ser do departamento de contabilidade? Assuma que os três departa-

mentos são igualmente prováveis de serem visitados (as portas das salas são idênticas e
equiprováveis).
• Seja os acontecimentos:
A = Departamento de Finanças,
B = Departamento Jurídico,
C = Departamento de Contabilidade
D = Técnico Superior
E = Técnico Médio
F = Técnico Básico
• Pelos dados temos: P (A) = P (B) = P (C) = 1

3
, P (E\C) = 1
6
, P (E\A) = 4
9
,
P (E\B) = 27 .
• Pede-se P (C\E). Aplicando o teorema de Bayes, temos:
(C ∩ E)
P (C\E) =
P (C ∩ E) + P (B ∩ E) + P (A ∩ E)
•
1
× 16
3
P (C\E) = 1 = 0, 186
3
× 61 + × 49 + 31 ×
1
3
2
7
• A probabilidade de ser do departamento de contabilidade, dado que na sua visita

identicou um técnico médio é de 18, 6%.

Referências Bibliográcas
a
• Correira, S. M. (2003). Probabilidade e Estatística (2 ed.). Belo Horizonte: Puc
Minas.
a
• Farber, Larson. (2010). Estatística Aplicada (4 Ed.).
a
• Homam, R. (2006). Estatística para Economistas (4 ed.). São Paulo: Cengage
Learning.
• Kazmier, Leonard J. (2004) Estattídtica Aplicada à Economia e Administração.
a
• Moreira, J. d. (1964). Elementos de Estatítica (2 ed.). São Paulo: ATLAS S/A.
• Morettin, L. G. (2010). Estatística Básica: Probabilidade e Inferência. São Paulo:
Perarson.
• Murteira, Bento et al. (2010) Introdução à Estatística.
• Ris, Elizabeth, et al.(1995). Estatística Aplicada Vol. 1.
• Ris, Elizabeth, et al. (1995). Estatística Aplicada Vol. 2.
• Sivestre, A. L. (2007). Análise de Dados e Estatítica Descritiva. Lisboa: Escola
Editora.
• Tiboni, C. G. (2010). EStatística Básica. São Paulo: Atlas S.A.
125

Notas - Estatística I - Fec

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Notas - Estatística I - Fec

Enviado por

Direitos autorais:

Formatos disponíveis

FACULDADE DE ECONOMIA DA UJES

DEPARTAMENTO DE MÉTODOS QUANTITATIVOS

NOTAS DE ESTATÍSTICA I - ANO lECTIVO 2021/2022

Alcides Onésimo Nunda (Regente)

Belchior Xavier Mário

Pedro Domingos Chitandula

Ivanoy Albano Lucas.

A cadeira Estatística I, também denominada Estatística Básica ou Descritiva, é lecionada

Descritiva, começando pelos conceitos fundamentais e terminando com as probabilidades.

sível, apresentar os conceitos e métodos de análise estatística de modo mais intuitivo e

formal; (iii) acompanhar a apetência teórica, exemplos e exercícios apropriados a cada

situação. Ainda, oferece diversos instrumentos matemáticos utilizados em várias áreas da

gação Operacional, Matemática Aplicada à Economia, Economia Regional, Contabilidade

Nacional, Análise e Avaliação de Projectos de Investimentos, Macroeconomia Microecono-

de Análise Matemática I e Análise Matemática II.

Nacional de Estatística. Para um processo de ensino-aprendizagem mais efectivo, cada

secção/capítulo será acompanhada de uma folha de exercícios que ajudarão os estudantes

a aplicar os conteúdos teóricos aprendidos e ampliar a sua dimensão de entendimento,

Nosso profundo agradecimento ao docente Licenciado Pedro Domingos Chitandula pelo

apoio ao regente da cadeira na concepção e digitalização do texto.

Alcides Onésimo Nunda, MSc.

1.1.1 Síntese Histórica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.2 Importância da Estatística . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 A Estatística e os Métodos Estatísticos . . . . . . . . . . . . . . . . . . . . 4

1.2.1 Fases da Metodologia Estatística . . . . . . . . . . . . . . . . . . . 4

1.3 Objectivos da Análise Estatística . . . . . . . . . . . . . . . . . . . . . . . 6

1.4 Tipos de Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.1 Estatística Descritiva . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.2 Estatística Inferencial ou Indutiva . . . . . . . . . . . . . . . . . . . 8

1.5 População e Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5.1 População ou Universo Estatístico (N) . . . . . . . . . . . . . . . . 9

1.5.2 Amostra (n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.6 Variáveis (ou Dados) e Tipos de Variáveis . . . . . . . . . . . . . . . . . . 11

1.6.1 Tipos de Variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.7 Números Aproximados e Arredondamento de Dados. Cálculo de Percentagem 13

1.7.1 Números Aproximados e Arredondamento de Dados . . . . . . . . . 13

1.7.2 Cálculo de Percentagem . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2 Vantagens da Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.3 Critérios para Seleção de Amostras . . . . . . . . . . . . . . . . . . . . . . 16

2.4 Tipos de Técnicas de Amostragem . . . . . . . . . . . . . . . . . . . . . . 17

2.4.1 Amostragem Casual ou Aleatória Simples . . . . . . . . . . . . . . 17

2.4.2 Amostragem Proporcional Estraticada . . . . . . . . . . . . . . . . 18

2.4.3 Amostragem Estraticada Uniforme . . . . . . . . . . . . . . . . . . 20

2.4.4 Amostragem Sistemática . . . . . . . . . . . . . . . . . . . . . . . . 20

2.4.5 Amostragem por Conglomerado . . . . . . . . . . . . . . . . . . . . 22

3 Séries Estatísticas e Grácos Estatísticos 24

3.1.1 Series Temporais, Cronológicas, Históricas, Evolutivas (ou Marchas) 25

3.1.2 Séries Geográcas, Espaciais, Territoriais ou Localização . . . . . . 26

3.1.3 Series Especicas ou Categóricas . . . . . . . . . . . . . . . . . . . 27

3.1.4 Séries Conjugadas ou Tabela de Dupla Entrada . . . . . . . . . . . 28

3.2 Grácos Estatísticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.2.2 Grácos Polar ( ou Radar) . . . . . . . . . . . . . . . . . . . . . . . 34

4.2 Organização e Classicação de dados de Variáveis Qualitativas. . . . . . . . 38

4.3 Organização e Classicação de Dados de Variáveis Quantitativas . . . . . . 39

4.3.1 Distribuição de Frequências de Dados Numéricos não Agrupados

4.3.2 Distribuição de Frequências de Dados Numéricos Agrupados com

4.4 Representação Gráca de uma Distribuição de Frequência . . . . . . . . . . 45

4.4.2 Polígono de Frequência . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.4.3 Polígono de Frequência Acumulada (ogiva de Galton) . . . . . . . . 47

Alcides Onésimo Nunda ii Pedro Domingos Chitandula

5 Medidas de Posição: Medidas de Tendência Central 50

5.1.1 Média Aritmética de Dados não Agrupados . . . . . . . . . . . . . 51

5.1.2 Média Aritmética para dados Agrupados sem Intervalos de Classe . 53

2.4.2 Amostragem Proporcional Estraticada . . . . . . . . . . . . . . . . 18

2.4.3 Amostragem Estraticada Uniforme . . . . . . . . . . . . . . . . . . 20

3 Séries Estatísticas e Grácos Estatísticos 24

3.1.2 Séries Geográcas, Espaciais, Territoriais ou Localização . . . . . . 26

3.1.3 Series Especicas ou Categóricas . . . . . . . . . . . . . . . . . . . 27

3.2 Grácos Estatísticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.2.2 Grácos Polar ( ou Radar) . . . . . . . . . . . . . . . . . . . . . . . 34

4.2 Organização e Classicação de dados de Variáveis Qualitativas. . . . . . . . 38

4.3 Organização e Classicação de Dados de Variáveis Quantitativas . . . . . . 39

4.4 Representação Gráca de uma Distribuição de Frequência . . . . . . . . . . 45

não agrupados) pela denição e pela fórmula alternativa . . . . . . 82

7.3.1 Coeciente de Variação ou Coeciente de Variação de Pearson . . . 89

7.4.3 Coeciente de Assimetria de Pearson (AS) . . . . . . . . . . . . . . 93

7.5.1 Coeciente Percentílico de Curtose . . . . . . . . . . . . . . . . . . 95

8 Números Índices e Noção de Demograa 98

8.2 Noções de Demograa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

Referências Bibliográcas 125

2.1 Amostragem proporcional estraticada por sexo de uma empresa de mar-

2.2 Amostragem proporcional estraticada dos trabalhadores da Fábrica Cuca. 19

2.3 Amostragem proporcional estraticada dos trabalhadores da Fábrica Cuca. 20

salários em Angola 2018 - 2020 . . . . . . . . . . . . . . . . . . . . . . . 28