Escolar Documentos
Profissional Documentos
Cultura Documentos
10 de Outubro de 2021
Variáveis Estatı́sticas
Variável:é a caracterı́stica que vai ser observada,medida ou contada nos
elementos de uma população ou da amostra e que pode variar, ou seja,
assumir um valor diferente de elemento para elemento.
Exemplo:sexo, peso, altura,idade,etc.
Observação:não basta identificar a variável a ser trabalhada, é necessário
fazer-se a distinção entre os tipos de variáveis.
Variável qualitativa ou Categórica:é aquela que se refere a qualidade e não
pode ser medida.
Exemplo:sexo, profissão, tipo de sangue, estado civil, comportamento,cor da
pele,etc.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
16 / 127 I
As variáveis qualitativas podem ser:
1 Nominais:não apresentam uma ordem natural de ocorrência.
Exemplo:cor dos olhos,cor da pele, marcas de carro,sexo,etc.
2 Ordinais:apresentam uma ordem natural de ocorrência.
Exemplo:Estado civil dos alunos da disciplina de estatı́stica I do curso
de economia e gestão(solteiro,casado, divorciado),classe
social(baixa,media,alta),etc.
Variável quantitativa:é aquela que é mensurável, isto é, aquela que pode ser
representada por números.Exemplo:a idade, o peso, às notas, a altura,etc.
As variáveis quantitativas subdividem-se em:
Método Estatı́stico:
Diante da impossibilidade de manter as causas contantes(nas ciências
sociais), admitem todas essas causas presentes variando-as, registrando
essas variações e procurando determinar, no resultado final, que influencias
cabem a cada uma delas.Exemplo: Quais as causas que definem o preço de
uma mercadoria quando a sua oferta diminui?
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
19 / 127 I
Seria impossı́vel, no momento da pesquisa, manter constantes a
uniformidade dos salários, o gosto dos consumidores, nı́vel geral de preços
de outros produtos,etc.
Séries estatı́sticas
Série estatı́stica: é toda tabela que apresenta a distribuição de um conjunto
de dados estatı́sticos em função da época, do local, ou da
espécie(fenómeno).
Numa série estatı́stica observa-se a existência de três elementos ou factores:
o tempo, o espaço e a espécie.
Conforme varie um desses elementos, a série estatı́stica classifica-se em
temporal, geográfica e especı́fica.
Série temporal, histórica ou cronológica: é a série cujos dados estão em
correspondência com o tempo, ou seja, variam com o tempo.
2 3 0 2 1 1 1 3 2 5
6 1 1 4 0 1 5 6 0 2
1 4 1 3 1 7 6 2 0 1
3 1 3 5 7 1 3 1 1 0
3 0 4 1 2 2 1 2 3 2
0 0 0 0 0 0 1 1 1 1
1 1 1 1 1 1 1 1 1 1
1 1 2 2 2 2 2 2 2 2
2 3 3 3 3 3 3 3 3 4
4 4 5 5 5 6 6 6 7 7
xi ni fi Ni Fi
n1
x1 n1 n N1 = n1 F 1 = f1
n2
x2 n2 n N1 + n2 F 1 + f2
.. .. .. .. ..
. . . . .
nk
xk nk n n 1
Total n 1
1222623222131212212210
R = xn:n − x1:n
h:amplitude de cada classe
R
h=
K
yi : ponto médio da classe i
linf + lsup
yi =
2
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
33 / 127 I
Portanto, o quadro de frequências para uma distribuição deste tipo
apresenta o seguinte aspecto:
Classes Yi ni fi Ni Fi
n1
[l1 ; l2 [ Y1 n1 n N 1 = n1 F1 = f1
n2
[l2 ; l3 [ Y2 n2 n N 1 + n2 F1 + f2
.. .. .. .. .. ..
. . . . . .
nk
[lk ; lk+1 [ Yk nk n n 1
Total n 1
Neste caso os dados são de natureza discreta mas com um número grande
de observações representativas assim, vamos representar os dados numa
tabela com intervalos de classes:
Definição de classes
Determinar o número (k=?) de classes:
Aplicando a regra de sturges→ k = 1 + 3, 3log (40) = 6, 287 → k ' 6
R = 98 − 70 = 28
Dividir essa amplitude pelo valor k; tomar para essa amplitude de classe h
um valor aproximado por excesso do valor anteriormente obtido:
28
h= '5
6
Construir as classes, de modo que tenham todas a mesma amplitude e cuja
união contenha todos os elementos da amostra:
C1 = [70, 75[ ; C2 = [75, 80[ ; C3 = [80, 85[ ; C4 = [85, 90[ ;
C5 = [90, 95[ ; C6 = [95, 100[.
Classes Yi ni fi Ni Fi
[70; 75[ 72, 5 6 0, 15 6 0, 15
[75; 80[ 77, 5 9 0, 225 15 0, 375
[80; 85[ 82, 5 11 0, 275 26 0, 65
[85; 90[ 87, 5 9 0, 225 35 0, 875
[90; 95[ 92, 5 3 0, 075 38 0, 95
[95; 100[ 97, 5 2 0, 05 40 1
Total 40 1
25 − − − − − − − − − 100%
17 − − − − − − − − − x
=⇒ x = 68%.
Logo, a percentagem dos Alunos que tiraram negativa é:
y = (100 − x)% = (100 − 68)% = 32%.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
48 / 127 I
Arredondamentos
Objectividade;
Dependência de todas as observações;
Significado bem preciso para sua interpretação;
Facilidade de cálculo.
di = Xi − X
, onde xi é um elemento do conjunto de valores.
Exemplo: Sabendo-se que a produção leiteira diária da Vaca Mimosa,
durante uma semana, foi de 10, 14, 13, 15, 16, 18, 12 litros, temos, para a
produção média semanal:
10 + 14 + 13 + 15 + 16 + 18 + 12
= 14
7
Logo, X = 14litros.
calculada.
2 Para um dado conjunto de números a média aritmética e única.
yi = xi ± c
então:
y = x ± c.
Exemplo:Somando-se 2 litros de leite a cada produção diária da Mimosa
tem-se:
Daı́:
12 + 16 + 15 + 17 + 18 + 20 + 14
y= = 16
7
Lembrando que a média anterior era x = 14., temos que:
y = 16 = 14 + 2 = x + 2
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
56 / 127 I
5)Multiplicando-se( ou dividindo-se) uma constante (c) de todos o valores
de uma variável, a média do conjunto fica multiplicada(ou dividida) dessa
constante.
Simbolicamente se,
yi = xi × c
então:
y =x ×c
.
Exemplo: Multiplicando-se por 3 cada produção diária da Mimosa temos
que:
y1 = 30, y2 = 42, y3 = 39, y4 = 45, y5 = 48, y6 = 54, y7 = 36
Daı́:
30 + 42 + 39 + 45 + 48 + 54 + 36
= 42
7
Lembrando que a média anterior era:
y = 42 = 14 × 3 = x × 3
.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
57 / 127 I
Média aritmética ponderada(Xp ):é uma média aritmética na qual será
atribuı́do um peso a cada valor da série.
n
X
Xi .p
i=1
Xp = n
X
pi
i=1
Logo:
3(8, 0) + 3(9, 0) + 4(9, 6)
Xp = = 8, 94
10
Isto é, a média semestral desse aluno em Estatı́stica é 8, 94.
Média Geométrica: sejam x1 , x2 , · · · xn os valores observados, tem-se:
√
G= n
x1 .x2 · · · xn
1 Ordenar os valores;
2 Se o número de dados é ı́mpar, a mediana é o valor que está no centro
da série;
3 Se o número de dados é par, a mediana é a média dos dois valores que
estão no centro da série.
(
X n+1 se n impar ;
2
Me = X n +X n +1
2
2
2
se n par .
Resolução
1.1. Ordenação:1, 3, 5, 7, 9, 9, 9.
1.2. Cálculo da ordem do elemento central: porque n = 7 é ı́mpar então:
Me = X n+1 = X 7+1 = X 8 = X4 = 7
2 2 2
X n2 + X n2 +1 X 8 + X 8 +1 X4 + X5 7+9 16
2 2
Me = = = = = =8
2 2 2 2 2
Caracterı́sticas da Moda
xi ni Ni
1 3 3
2 5 8
3 12 20
4 7 27
5 3 30
Total 30 −
n
+ n2 +1 15+16 31
De acordo com a tabela acima tem-se: Me = 2
2 = 2 = 2 = 15, 5.
Logo: Me = 15, 5; Me = 3.
xi ni Ni
1 3 3
2 5 8
3 2 10
4 18 28
5 3 31
Total 31 −
n+1 31+1
De acordo com a tabela acima tem-se: Me = 2 = 2 = 16. Logo:
Me = 16, 5; Me = 4.
xi 1 2 3 4 5
ni 10 12 12 8 4
Classes ni
[0; 5[ 50
[5; 10[ 120
[10; 15[ 42
Total 212
Determine os quartis.
A série estatı́stica tem um número par de termos,por isso:
9 + 12
Me = = 10, 5 = q2 .
2
6n
Como 100 = 6×300
100 = 18, o intervalo a que corresponde esta frequência
acumulada é o intervalo [30; 50[;
L = 30; Ni = 4; nicm = 16; h = 20;
P6 = 30 + 18−4
16 × 20 = 30 + 17, 5 = 47, 5.
Cálculo de P98 :
D1 = 52, 38- Há 10% dos empregados, isto é, 30 (10% de 300), com
salários até 52380$00;
D8 = 87, 43−Há 80% de empregados, isto é, 240 com salários até
87430$00;
P6 = 47, 50− Há 6% de empregados, isto é, 18, com salários até 47500$00;
P98 = 130−Há 98% de empregados, isto é, 294 empregados, com salários
até 130000$00.
AT = Xmax − Xmin
Variância
Defini-se a variância e representa-se por s 2 , como sendo a medida que se
obtém somando os quadrados dos desvios das observações da amostra,
relactivamente a sua média e dividindo pelo número de observações da
amostra menos um. As expressões para o cálculo das variâncias
populacional e amostral são apresentadas a seguir:
Dados não agrupados
n
X
σ 2 = n1 (xi − µ)2 (Populacional)
i=1
n n
X 1 X 2
s2 = 1
n−1 (xi − x)2 = (xi − nx 2 ).(amostral)
n−1
i=1 i=1
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
90 / 127 I
Dados agrupados
k
X
σ 2 = n1 (xi − µ)2 × ni (Populacional)
i=1
k
X
s2 = 1
n−1 (xi − x)2 × ni (amostral)
i=1
Exemplo: Calcular o desvio médio da série A: {9, 7, 6, 1, 12}. Começaremos
por calcular o valor da média:
9 + 7 + 6 + 1 + 12
X = = 7.
5
E, por isso, tem-se:
|9 − 7| + |7 − 7| + |6 − 7| + |1 − 7| + |12 − 7| 2+1+6+5
d= = = 2.8.
5 5
O valor encontrado para o desvio médio da série A foi igual a 2.8.Isso
significa que os dados se afastam em média 2.8 da média aritmética da série
analisada.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
91 / 127 I
Desvio√padrão amostral(s):é√a raiz quadrada positiva da variância.
s = + s 2 (amostral)e σ = σ 2 (populacional).
O desvio padrão amostral informa-nos sobre a dispersão dos valores
observados relactivamente à sua média. Quanto maior for a dispersão ,
tanto maior será o desvio padrão.Se não existir dispersão,isto é, se todos os
valores forem iguais ( e consequentemente, iguais a média), então o desvio
padrão é nulo.
A variância e o desvio padrão são as medidas de variabilidade mais usadas
em análise estatı́stica.Uma das suas principais caracterı́sticas importantes é
que têm em consideração todos os valores observados.O desvio padrão
indica a proximidade com que os valores estão agrupados ao redor da
média.Um valor pequeno do desvio padrão significa que as observações
estão pouco espalhadas à volta da média.A variância é o quadrado do
desvio padrão.
Classes Yi ni fi Ni Fi
[10; 20[ 15 2 0.04 2 0, 04
[20; 30[ 25 10 0.2 12 0.24
[30; 40[ 35 12 0.24 24 0.48
[40; 50[ 45 14 0.28 38 0.76
[50; 60[ 55 9 0.18 47 0.94
[60; 70[ 65 3 0.06 50 1
Total − 50 1 − −
Calcule a variância.
Momentos
São medidas descritivas de carácter mais geral dão origem às demais
medidas descritivas, como as de tendência central, dispersão, assimetria e
de curtose. Conforme a potência considerada tem-se a ordem ou o grau do
momento calculado.
3(X − Med)
AMed = .
s
Após o cálculo do coeficiente deve-se analisar o resultado encontrado,
considerando a seguinte convenção:
AMed = 0; a distribuição é simétrica.
AMed > 0; a distribuição é assimétrica positiva.
AMed < 0; a distribuição é assimétrica negativa.
X − Mod
AMod = .
s
Após o calculo do coeficiente deve-se analisar o resultado encontrado,
considerando a seguinte convenção:
AMod = 0; a distribuição é simétrica.
AMod > 0; a distribuição é assimétrica positiva.
AMod < 0; a distribuição é assimétrica negativa.
Quando não se dispõe os valores calculados da media e do desvio padrão,
mas têm-se os dados dos quartis, utiliza-se a forma a seguir.
M3
αr = ,
s3
SXY
r= , −1 ≤ r ≤ 1.
SX SY
Matriz de correlação
1 r
[rij ] =
r 1
Factorial
n! = n × (n − 1) × (n − 2) × · · · × 2 × 1, se n > 0.
Por convenção 0! = 1.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
120 / 127 I
Exemplos:
1 5! = 5 × 4 × 3 × 2 × 1 = 120;
7! 7×6×5!
2
5! = 5! = 7 × 6 = 42.
Agrupamentos
n!
An,p =
(n − p)!
, onde:
n- número total de elementos;
p- número de elementos de cada arranjo;
An,p - número de arranjo de n elementos tomados p a p.
Exemplo: quantos números de 3 algarismos podemos escrever com os
números 1, 2, 3, 4 e 5 sem repetição? Resolução:
Temos que formar arranjos do tipo 123, 321, 213, etc
n! 5!
An,p = =⇒ A5,3 = = 60
(n − p)! (5 − 3)!
Portanto, podemos escrever 60 números de 3 algarismos distintos.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
122 / 127 I
Arranjos completos ou com repetição
Pcn = (n − 1)!
7! 7!
C7,3 = = = 35
3!(7 − 3)! 3!4!
.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
127 / 127 I