Escolar Documentos
Profissional Documentos
Cultura Documentos
2.1. Generalidades
Diariamente, torna-se cada vez mais necessário tomar decisões rápidas e bem
fundamentadas. As probabilidades e estatística podem ser pensadas como a
ciência de aprendizagem a partir de dados, fornecendo métodos que auxiliam o
processo de tomada de tais decisões através da análise dos dados disponíveis.
As razões que levam os pesquisadores a trabalhar com amostras e não com toda
a população são poucas, mas absolutamente relevantes: Custo e demora dos
censos; Populações muito grandes; Impossibilidade física de examinar toda a
população; Comprovado valor científico das informações colectadas por meio de
amostras.
estatísticas varia de amostra para amostra (logo é uma variável aleatória v. a.).
uma amostra a partir de uma população. Esta selecção pode ser realizada
recorrendo a dois tipos de métodos:
tem hipóteses de ser incluído na amostra, sendo possível medir com rigor qual a
probabilidade de tal suceder, através do cálculo de probabilidades. E pode ser :
o Amostragem estratificada;
o Amostragem por grupos, e outras.
▪ Não probabilísticos também designados por amostragem dirigida: não
Actividades
Solução:
Segundo Mahaluça (2016, p. 15), os dados são do mesmo tipo que o das variáveis
. Por exemplo, uma variável discreta produz dados discretos.Tal como figura o
organigrama abaixo:
Variáveis
Qualitativas Quantitativas
(categorizadas) (numéricas)
Actividades:
a) Identifique:
iii. Quantitativa?
𝑁𝑖
𝐹𝑖 = = ∑𝑖𝑘=1. 𝑓𝑘 - frequência relativa acumulada da categoria/valor/classe de
𝑛
valores 𝑖.
Exemplo: Foram examinados 100 lotes de 50 peças produzidas por uma máquina,
para verificação do número de peças defeituosas por lote. Os resultados
apresentam-se no seguinte quadro:
Actividade:
0nde [número] representa a parte inteira do número obtido (por ex: [7,1] = 7 e [4,9]
= 4).
um estudo sobre os lucros obtidos com essa atividade, resolveu pesar 60 leitões
com dois meses de idade, tendo obtido os seguintes resultados:
7,7 8,2 8,3 8,5 8,7 8,8 9,0 9,0 9,1 9,1
9,1 9,2 9,2 9,2 9,2 9,4 9,4 9,4 9,5 9,5
9,7 9,8 10,0 10,0 10,2 10,2 10,3 10,6 10,6 10,8
10,9 10,9 11,0 11,1 11,1 11,6 11,7 11,8 11,8 11,8
12,0 12,2 12,2 12,3 12,5 12,6 12,7 14,0 14,2 14,8
Solução:
10,7
𝑎 = 14,8 − 4,1 = 10,7 𝑎𝑐 = 6
≈ 1,8
Classes: 𝑐1 = [4,1; 5,9[; 𝑐2 = [5,9; 7,7[; 𝑐3 = [7,7; 9,5[; 𝑐4 = [9,5; 11,3[; 𝑐5 = [11,3;
13,1[; 𝑐6 = [13,1; 14,9]
LIi + LSi
Sendo 𝑥𝑖 , o ponto médio ou centro das classes 𝑐𝑖 : 𝑥𝑖 , = .
2
Daí, tem-se:
Pesos em kg 𝑥𝑖 , 𝑛𝑖 𝑁𝑖 𝑓𝑖 𝐹𝑖
(𝑐𝑖 )
Total 60 1,0000
Actividade:
Situação
9% Categoria A
10%
Categoria B
23% 58% Categoria C
Categoria D
Grupo Assentos
EUL 39
PES 200
EFA 42
EDD 15
ELDR 67
EPP 276
UEN 27
Outros 66
Total 732
5
4
3
2
1
0
Categoria 1 Categoria 2 Categoria 3 Categoria 4
Título do Eixo
ni / fi
2.2.2.2.4. Histograma
Salário 𝑛𝑖
[2000---4000[ 10
[4000---6000 [ 14
[6000---8000 [ 11
[8000---10000 [ 18
[10000---12000 [ 12
[12000---14000 [ 15
Total 80
𝑛𝑖 𝑓𝑖
𝑛𝑖 = 𝑎𝑖 e 𝑓𝑖 = 𝑎𝑖
Obs.: A área sob o polígono deverá ser igual à área do histograma, pelo que
quando as classes têm amplitudes diferentes é necessário transformar as
frequências absolutas ou relativas conforme já foi referido anteriormente.
2.2.2.2.7. Caixa-de-bigodes
(com ordens de grandeza que implicam que sejam classificados como valores
anómalos).
▪ Localização;
▪ Dispersão;
▪ Assimetria;
Onde:
❖ Média aritmética
1° Trimestre 3,5 12
2° Trimestre 7,5 8,25
3° Trimestre 9,0 16,75
Determine a nota média trimestral.
∑ 𝑥𝑖 𝑥1 + 𝑥2 + 𝑥3 8,25 + 12 + 16,75 37
𝑥̅ = = = = = 12,3
𝑛 3 3 3
Interpretação: Ter média 12,3 significa dizer que, apesar de ter obtido notas mais
altas ou mais baixas em outros Trimestres, a soma das notas (37) é a mesma que
ele alcançaria se tivesse obtido nota 12,3 em todos os Trimestres.
𝑥𝑖 𝑛𝑖 𝑥𝑖 ∗ 𝑛𝑖
40.000 5 200.000
90.000 2 180.000
150.000 2 300.000
500.000 1 500.000
∑ 𝑥𝑖 ∗ 𝑓𝑖 10 1.180.000
∑ 𝑥𝑖 ∗𝑛𝑖 1180000
𝑥̅ = = = 118.000
𝑛 10
Salário 𝑛𝑖
[2000; 4000[ 10
[4000; 6000 [ 14
[6000; 8000 [ 11
[8000; 10000 [ 18
[10000;12000 [ 12
[12000; 14000 [ 15
Total 80
Classes 𝑥𝑖 𝑛𝑖 𝑥𝑖 ∗ 𝑛𝑖
[2000; 4000[ 3000 10 30000
[4000; 6000 [ 5000 14 70000
[6000; 8000 [ 7000 11 77000
[8000; 10000 [ 9000 18 162000
[10000;12000 [ 11000 12 132000
[12000; 14000 [ 13000 15 195000
Total ::::::::::::::: 80 666000
∑ 𝑥𝑖 ∗ 𝑛𝑖 666000
𝑥̅ = = = 8.325
𝑛 80
𝑥1 ∗ 𝑝1 + 𝑥2 ∗ 𝑝2 + 𝑥3 ∗ 𝑝3 + 𝑥4 ∗ 𝑝4 + ⋯ + 𝑥𝑛 ∗ 𝑝𝑛
𝑥̅ =
𝑝1 + 𝑝2 + 𝑝3 + 𝑝4 + ⋯ + 𝑝𝑛
Exemplo 4: Uma aluna fez uma prova e obteve nota 19,1 e um trabalho, com nota
8,7. A média considera que a prova tenha peso 6 e o trabalho peso 4. Determine a
média dessa aluna.
19,1 ∗ 6 + 8,7 ∗ 4
𝑥̅ = = 14,94
6+4
❖ Mediana
É o valor que separa a metade maior e a metade menor de uma amostra, uma
população ou uma distribuição de probabilidade. Em termos mais simples,
mediana pode ser o valor do meio de um conjunto de dados.
A vantagem da mediana em relação à média é que a mediana pode dar uma ideia
melhor de um valor típico porque não é tão distorcida por valores extremamente
altos ou baixos. Em estudos estatísticos sobre renda familiar ou outros activos
voláteis, a média pode ser distorcida por um pequeno número de valores
extremamente altos ou baixos.
Soluçao:
𝑥𝑖 𝑛𝑖 𝑁𝑖
3 1 1
4 2 3
5 1 4
6 1 5
8 3 8
10 1 9
Total 9 ::::::::::
9+1
Sendo n = 9 e = 5, então 𝑥̃ = 𝑥5 = 6 .
2
Actividade 1:
Considere os dados em
Rol: 2, 3, 4, 4, 5, 6, 8, 8, 8, 10. Determine a mediana.
por:
𝟏
∗𝒏 − 𝑵𝒊−𝟏
𝟐
̃ = 𝒍𝒊𝒎𝒊𝒏𝒇 +
𝒙 ∗ 𝒂𝒊 , onde:
𝒏𝒊
Salário 𝑛𝑖
[2000; 4000[ 10
[4000; 6000 [ 14
[6000; 8000 [ 11
[8000; 10000 [ 18
[10000;12000 [ 12
[12000; 14000 [ 15
Total 80
❖ Moda
A moda amostral de um conjunto de dados trata do valor que ocorre com maior
frequência ou o valor mais comum em um conjunto de dados. A moda é
especialmente útil quando os valores (observações) não são numéricos, casos em
que a média e a mediana não podem ser definidas.
Uma amostra pode ser unimodal (uma moda), bimodal (duas modas), multimodal
(várias modas) e amodal (nenhuma moda).
Para dados brutos ou agrupados, a moda será aquele que apresentar maior
frequência.
Solução: 𝑥̂ = 8.
𝑥𝑖 𝑛𝑖
3 1
4 2
5 1
6 1
8 3
10 1
Total 9
𝒏𝒙̂𝒊−𝟏
̂ = 𝒍𝒊𝒎𝒊𝒏𝒇 +
𝒙 ∗ 𝒂𝒊 , (Moda do King)
(𝒏 ̂𝒊−𝟏 + 𝒏𝒙
𝒙 ̂𝒊+𝟏 )
̂= 𝟑∗𝒙
𝒙 ̃−𝟐∗𝒙
̅ , (Moda do Pearson), onde:
Salário 𝑛𝑖
[2000; 4000[ 10
[4000; 6000 [ 14
[6000; 8000 [ 11
[8000; 10000 [ 18
[10000;12000 [ 12
[12000; 14000 [ 15
Total 80
❖ Quartil
É uma medida que divide um conjunto de dados em 4 partes iguais. Existem três
quartis nomeadamente (𝑸𝟏 , 𝑸𝟐 𝑒 𝑸𝟑 ), no qual determina-se da seguinte maneira:
Solução:
1
Para 𝒏 par: 𝑝 = 4 ∗ (𝑖𝑛 + 2)
1
Daí, tem-se: 𝑄1 → 𝑝 = 4 ∗ (11 + 1) = 3, logo 𝑄1 = 𝑥3 = 4
3
e 𝑄3 → 𝑝 = 4 ∗ (11 + 1) = 9, , logo 𝑄3 = 𝑥9 = 8
𝒊
∗𝒏 − 𝑵𝒊−𝟏
𝐐𝒊 = 𝒍𝒊𝒎𝒊𝒏𝒇 + 𝟒 ∗ 𝒂𝒊 , onde 𝒊 = 𝟏, 𝟐, 𝟑, …
𝒏𝒊
Salário 𝑛𝑖
[2000---4000[ 10
[4000---6000 [ 14
[6000---8000 [ 11
[8000---10000 [ 18
[10000---12000 [ 12
[12000---14000 [ 15
Total 80
Determine os quartis 1, 2 e 3.
❖ Decil
Decil é qualquer um dos nove valores que dividem os dados ordenados de uma
variável em dez partes iguais, de modo que cada parte representa 1/10 da
amostra ou população. Assim:
• O 1º decil é o ponto de corte para 10% dos dados mais baixos, isto é, o
percentil 10;
• O 5º decil é o ponto de corte para 50% dos dados, isto é, o percentil 50, 2º
quartil, ou mediana;
• O 9º decil é o limite para 90% dos dados mais baixos, isto é, o percentil 90.
𝒊
∗𝒏 − 𝑵𝒊−𝟏
𝟏𝟎
𝐃𝒊 = 𝒍𝒊𝒎𝒊𝒏𝒇 + ∗ 𝒂𝒊 , onde 𝒊 = 𝟏, 𝟐, 𝟑, … 𝟗
𝒏𝒊
❖ Percentil
Percentil é uma medida que divide a amostra ordenada (por ordem crescente dos
dados) em 100 partes, cada uma com uma percentagem de dados
aproximadamente igual. Portanto:
Pi = xm + (p − m) ∗ (xm+1 − xm ), onde:
São medidas descritivas que visam a medição do grau de dispersão dos dados em
torno de um valor médio. Podem ser:
𝐴𝐼𝑄 = 𝑄3 − 𝑄1
❖ Desvio padrão
Observações:
➢ Esta medida só assume valores não negativos e quanto maior o seu valor
maior a dispersão.
➢ Para calcular o desvio padrão populacional, σ, basta substituir no
denominador do desvio padrão amostral 𝑛 − 1 por 𝑛.
➢ Propriedades para dados com distribuição aproximadamente normal:
- Aproximadamente 68% dos dados estão no intervalo [𝑥 − 𝑠; 𝑥 + 𝑠];
- Aproximadamente 95% dos dados estão no intervalo [𝑥 − 2𝑠; 𝑥 + 2𝑠];
- Aproximadamente 100% dos dados estão no intervalo [𝑥 − 3𝑠; 𝑥 + 3𝑠].
❖ Variância
Observações:
➢ Esta medida só assume valores não negativos e quanto maior o seu valor
maior a dispersão.
➢ Para calcular a variância populacional, 𝜎2, basta substituir no
denominador da variância amostral 𝑛 − 1 por 𝑛.
➢ A variância tem como desvantagem o facto de ser expressa em unidades
ao quadrado, o que torna difícil a sua interpretação, razão pela qual se
utiliza o desvio padrão.
❖ Coeficiente de variação
❖ Coeficiente de dispersão
Observações:
São as médias aritméticas da 1ª, 2ª, 3ª, 4ª,… potências dos desvios em relação á
média aritmética. A fórmula para o cálculo dos momentos é:
Observações:
1° Trimestre 12
2° Trimestre 8,25
3° Trimestre 16,75
Determine o desvio padrão.
Salário 𝑛𝑖
[2000---4000[ 10
[4000---6000 [ 14
[6000---8000 [ 11
[8000---10000 [ 18
[10000---12000 [ 12
[12000---14000 [ 15
Total 80
SA = 30 e SB = 40
𝑥̅ −𝑥̂
O grau de assimetria de Pearson, 𝒈𝑷, é dado por: 𝑔𝑃 = , onde −3 < 𝑔𝑃 < 3.
𝑆
gB < 1.
Actividade 8:
Durante certo período de tempo as taxas de juros para dez acções foram as
abaixo registadas:
Acção 1 2 3 4 5 6 7 8 9 10
Taxa(%) 2.59 2.64 2.60 2.62 2.55 2.61 2.50 2.63 2.64 2.69
Calcule:
a) A taxa média
b) A taxa mediana
c) A taxa modal
f) O coeficiente de assimetria.
Onde:
∑k−1
i=1 (pi − q i ) ∑k−1
i=1 q i
𝑰𝑮 = = 1−
∑k−1
i=1 pi ∑k−1
i=1 pi
Características: