Cálculo de somatórios
Para simbolizar a soma ou o total de um conjunto de valores usa-se a letra
x x1 x 2 x3 ... x n x i x1 x 2 x3 ... x n
i
ou i 1 , notação que
representando a soma dos valores assumidos pela variável X, desde o primeiro
valor assumido até o último.
x i x 2 x3 x 4 x5
temos i 2 ;
Para indicar a soma dos valores de X desde o primeiro até o terceiro
x i x1 x 2 x3
temos i 1 ;
x 2 2 2 2 2
x1 x 2 x3 ... x n
xi x1 x2 x3 ... xn
2 2 2 2 2
ou i 1
i
x x
i
2
1 x 2 x3 ... x n
2
ou i 1
xi xi xi x 2
a) xi b) i 1 c) i 3 d) i 2 e) i 1
i
2 2
5
2 5
x 2
xi xi
f) i 3
i
g) x i
2
h) i 1
x
i) i
2
j) i 3
Resolução:
a) x i x1 x 2 x3 x 4 x5 3 6 8 5 2 24
x i x1 x 2 3 6 9
b) i 1
x i x3 x 4 x5 8 5 2 15
c) i 3
x i x 2 x3 x 4 x5 6 8 5 2 21
d) i2
x 2 2 2
i x1 x 2 3 2 6 2 9 36 45
e) i 1
x 2 2 2 2
i x3 x4 x5 8 2 5 2 2 2 64 25 4 93
f) i 3
x
2 2 2 2 2 2
i x1 x 2 x3 x 4 x5 3 2 6 2 8 2 5 2 2 2
g) 9 36 64 25 4 138
2
2
xi x1 x 2 3 6 9 2 81
2 2
h) i 1
i)
x x i
2
1 x 2 x3 x 4 x5 3 6 8 5 2 24 2 576
2 2
2
5
xi x3 x 4 x5 3 6 8 17 2 289
2 2
j) i 3
Em determinadas situações, sobretudo no estudo da relação entre duas
variáveis estatísticas é necessário recorrer a conceitos soma dos produtos e
produto das somas. Suponhamos que tenham sido observadas duas variáveis
X e Y, e que durante n observações tenham assumido sucessivamente os
X x1 , x 2 , x3 ,..., x n e
valores que definem os conjuntos
x i y i x1 y1 x 2 y 2 ... x n y n
a)
x y x
i i 1 x 2 ... x5 y1 y 2 ... y5
2 5 4 3 6 5 6 3 1 2 20 17 340
b) x i y i 2 5 5 6 4 3 3 1 6 2 10 30 12 3 12 67
Nota: Para minimizar o risco de cometer erros durante cálculos é possível realizar os
cálculos intermediários através de uma tabela aproveitando depois nela os resultados
parciais, como apresentamos a seguir:
xi yi xi y i
2 5 10
5 6 30
4 3 12
3 1 3
6 2 12
x i 20 y i 17 x i y i 67
a)
x y 20 17 340
i i
b) x i y i 67
CAPÍTULO I
ALGUNS CONCEITOS BÁSICOS DA ESTATÍSTICA
CAPÍTULO II
DISTRIBUIÇÃO DE FREQUÊNCIAS
ascendente
Frequência
simples
relativa
descendente
acumulada
ascendente
a)Frequência absoluta simples ( f i )
A frequência absoluta simples dum determinado valor da variável é o número
de vezes que este valor foi observado ou o número de vezes que o valor se
repetiu durante as observações.
b)Frequência absoluta acumulada descendente ( fai ) ou abaixo de…
( fa3 ) f 1 f 2 f 3
……………………..
( fa n ) f 1 f 2 f 3 ... f n N
( fa 2 ) f 2 f 3 f 4 ... f n
( fa3 ) f 3 f 4 f 5 ... f n
……………..……………………….
( fa n ) f n porque não existe valor posterior ao último.
fi
fri % fri 100% ou fri % 100%
N
Nota: A soma de todas as frequências relativas simples de uma distribuição
(sem erros de arredondamento) é sempre igual a unidade (1).
( xi )
14 4 4 20 0,20 20 0,20 20 1,00 100
15 7 11 16 0,35 35 0,55 55 0,80 80
16 5 16 9 0,25 25 0,80 80 0,45 45
17 2 18 4 0,10 10 0,90 90 0,20 20
18 1 19 2 0,05 5 0,95 95 0,10 10
19 1 20 1 0,05 5 1,00 100 0,05 5
Os gráficos de colunas aqui vistos são todos simples, visto estar neles
representada apenas uma variável. Mas, além dos gráficos de colunas simples
existem os gráficos de colunas compostos ou de colunas por blocos. Estes
b) Gráfico de linhas
É uma linha quebrada constituída por segmentos de recta definidos por pontos
consecutivos da forma ( xi ; f i ).
Para construir um gráfico de linhas basta representar geometricamente os
pontos ( xi ; f i ) e uni-los conforme a sucessão dos mesmos.
Utilizando as tabelas usadas em gráficos de colunas temos:
1) Gráfico de linhas da frequência absoluta simples
Idade dos alunos do clube 1º de Agosto
Idade ( xi ) fi
14 4
15 7
16 5
17 2
18 1
19 1
1
Os conceitos limite superior e limite inferior estão apresentados no 4º passo
At 0,34
*h 0,05
K 7
b) Interpretação:
f1 f (1,60 x 1,65) 3 caçadores
*Três dos 50 caçadores do grupo “LÍDER” têm altura de 1,60 até quase 1,65 m
f 2 f (1,65 x 1,70) 8 caçadores
*Oito dos 50 caçadores do grupo “LÍDER” têm altura de 1,65 até quase 1,70 m
f 3 f (1,70 x 1,75) 3 caçadores
*Tês dos 50 caçadores do grupo “LÍDER” têm altura de 1,70 até quase 1,75 m
*Catorze dos 50 caçadores do grupo “LÍDER” têm altura de 1,75 m até quase
1,80 m
f 5 f (1,80 x 1,85) 5 caçadores
*Quatro dos 50 caçadores do grupo “LÍDER” têm altura de 1,80 até quase 1,85
m
f 6 f (1,85 x 1,90) 12 caçadores
*Doze dos 50 caçadores do grupo “LÍDER” têm altura de 1,85 até quase 1,90 m
f 7 f (1,90 x 1,95) 6 caçadores
*Seis dos 50 caçadores do grupo “LÍDER” têm altura de 1,90 até quase 1,95 m
fr1 fr (1,60 x 1,65) 0,06 6% dos caçadores
*6% dos 50 caçadores do grupo “LÍDER” têm altura de 1,60 até quase 1,65 m
fr2 fr (1,65 x 1,70) 0,16 16% dos caçadores
*16% dos 50 caçadores do grupo “LÍDER” têm altura de 1,65 até quase 1,70 m
fr3 fr (1,70 x 1,75) 0,06 6% dos caçadores
*6% dos 50 caçadores do grupo “LÍDER” têm altura de 1,70 até quase 1,75 m
fr4 fr (1,75 x 1,80) 0,28 28% dos caçadores
*28% dos 50 caçadores do grupo “LÍDER” têm altura de 1,75 até quase 1,80 m
fr5 fr (1,80 x 1,85) 0,1 10% dos caçadores
*10% dos 50 caçadores do grupo “LÍDER” têm altura de 1,80 até quase 1,85 m
fr6 fr (1,85 x 1,90) 0,24 24% dos caçadores
*24% dos 50 caçadores do grupo “LÍDER” têm altura de 1,5 até quase 1,90 m
fr7 fr (1,90 x 1,95) 0,12 12% dos caçadores
*12% dos 50 caçadores do grupo “LÍDER” têm altura de 1,90 até quase 1,95 m
c) Interpretação:
f 1 f (160 x 164) 3 caçadores
*Três dos 50 caçadores do grupo “LÍDER” têm altura de 160 cm até 164cm
f 2 f (165 x 169) 8 caçadores
*Oito dos 50 caçadores do grupo “LÍDER” têm altura de 165 cm até 170 cm
f 3 f (170 x 174) 3 caçadores
*Tês dos 50 caçadores do grupo “LÍDER” têm altura de 170 cm até 174 cm
f 4 f (175 x 179) 14 caçadores
*Catorze dos 50 caçadores do grupo “LÍDER” têm altura de 175 cm até 179 cm
f 5 f (180 x 184) 5 caçadores
*Quatro dos 50 caçadores do grupo “LÍDER” têm altura de 180 cm até 184 cm
*Doze dos 50 caçadores do grupo “LÍDER” têm altura de 185 cm até 189 cm
f 7 f (190 x 194) 6 caçadores
*Seis dos 50 caçadores do grupo “LÍDER” têm altura de 190 cm até 194 cm
fr1 fr (160 x 164) 0,06 6% dos caçadores
*6% dos 50 caçadores do grupo “LÍDER” têm altura de 160 cm até 164 cm
fr2 fr (165 x 174) 0,16 16% dos caçadores
*16% dos 50 caçadores do grupo “LÍDER” têm altura de 165 cm até 169 cm
fr3 fr (170 x 174) 0,06 6% dos caçadores
*6% dos 50 caçadores do grupo “LÍDER” têm altura de 170 cm até 174 cm
fr4 fr (175 x 179) 0,28 28% dos caçadores
*28% dos 50 caçadores do grupo “LÍDER” têm altura de 175 cm até 179 cm
fr5 fr (180 x 184) 0,1 10% dos caçadores
*10% dos 50 caçadores do grupo “LÍDER” têm altura de 180 cm até 184 cm
fr6 fr (185 x 189) 0,24 24% dos caçadores
*24% dos 50 caçadores do grupo “LÍDER” têm altura de 185 cm até 189 cm
fr7 fr (190 x 194) 0,12 12% dos caçadores
*12% dos 50 caçadores do grupo “LÍDER” têm altura de 190 cm até 194 cm
n n
Daqui obtemos a fórmula de cálculo da média aritmética para dados isolados
que é:
n
x x x ... xn
xi
X 1 2 3 i1
n n
A média aritmética obtida de dados isolados denomina-se média simples.
17 15 9
20
Claramente observamos existência de valores repetidos nesta expressão. Este
facto permite-nos reduzir a extensão desta expressão, basta aplicarmos em
simultâneo, as propriedades comutativa e associativa da adição e em seguida
transformar as somas de parcelas iguais em produtos. Aplicando o raciocínio
aqui descrito obtemos:
(9 9) (13 13 13)
20
4 12 2 14 2 16 3 17 4 15 2 9 3 13
X
20
Desta última expressão temos 20 dados distribuídos em sete valores ( xi ): 12,
f i xi
f1 x1 f 2 x2 ... f k x k
X i 1
n n
k
f i xi f1 x1 f 2 x 2 ... f k x k
Ou X Fórmula do cálculo da média
i 1 n n
aritmética para dados ponderados.
A média aritmética dos dados ponderados denomina-se média ponderada.
Nota: Quando os dados são numerosos e as vezes mesmo sendo poucos, o
desenvolvimento dos somatórios pela substituição dos valores e suas
respectivas frequências pode aumentar os riscos de cometer erros no processo
de cálculo. Por esta razão, achamos que realizar os cálculos auxiliares na
tabela de distribuição de frequências pode minimizar este risco, procedendo de
seguinte maneira:
1º) Construir a tabela de distribuição de frequência absoluta simples,
observando todos os cuidados mencionados no capítulo anterior sobre o
assunto;
2º) Calcular o valor de n pela soma das frequências absolutas simples e
4º) Calcular a soma dos produtos obtidos no 3º passo. Quer dizer achar
E, finalmente temos X f i xi
276
13,8
n 20
li Li
dos respectivos limites PM i 2
. Seguidamente, a tabela inicial (de
2
dados agrupados em classes) será reduzida à tabela de dados ponderados na
li Li
qual se tomará xi PM i . E finalmente, utilizando a fórmula da média
2
ponderada e substituindo nela xi por PM i obtém-se a fórmula da média
aritmética para os dados agrupados em classes que é
X
f i PM i
ou X f i PM i
n n
2
Ver agrupamento de dados em classes
X
f i PM i
15640
391USD
n 40
Interpretação: Cada trabalhador da firma KR aufere em média mensal um
salário de 391 USD (ou, o salário médio mensal dos trabalhadores da firma KR
é de 391 USD caca).
A avaliação pela média aritmética geral não é usual visto que a média
aritmética é bastante influenciada pelos valores extremos. Por isso é que a
avaliação é baseada em médias por disciplina. Para evidenciar este facto
vamos supor que um aluno com 8 disciplinas curriculares tenha obtido as
seguintes médias finais por disciplina: 7, 14, 6, 5, 16, 17, 17, 5. A média geral
destas classificações será
n 1
através da relação i ;
2
n 1
3º) Identificar o valor que ocupa a posição i no rol ou na distribuição,
2
x
através das fa i , isto é n21 ;
Mdn x n 1
4º) Determinar o valor da mediana sabendo que 2
n2
e i2 , visto existirem para esta situação dois valores centrais;
2
n n2
3º) Identificar os valores que ocupam as posições i1 e i2 no rol ou
2 2
x x
na distribuição, através das fai , isto é n2 e n 2 2 ;
x n x n2
4º) Determinar o valor da mediana sabendo que Mdn 2 2 , é a média
2
aritmética dos dois valores centrais.
Exemplo: Calcule e interprete a mediana dos dados das tabelas a seguir:
a)
LUCRO DOS AUTOMÓVEIS VENDIDOS PELA FIRMA GAMA
DURANTE O ANO DE 2007,EM USD
Lucro unitário Quantidade fa i Ordem
1234 11 11 1-11
1245 12 23 12-23
1320 9 32 24-32
1857 10 42 33-42
2358 15 57 42-57
2850 20 77 58-77
3450 12 89 78-89
n 1 89 1 90
i 45
2 2 2
Mdn x n 1 x 45 2358USD
2
n 26 n 2 28
respectivamente as posições: i1 13 e i2 14 .
2 2 2 2
Pela tabela extraímos os valores x13 15 e x14 14 .
x n x n 2
Finalmente, temos Mdn x13 x14 15 15
2 2
15
2 2 2
Interpretação: 50% dos alunos da 10ª RX obtiveram no máximo 15 valores na
1ª prova parcelar de Informática.
Na qual:
l i - é o limite inferior da classe mediana;
n
- é a posição da Mediana na distribuição;
2
fa ant é a frequência absoluta acumulada descendente da classe
anterior à classe mediana;
f i é a frequência absoluta simples da classe mediana;
Resolução:
li Li fi fa i Ordem
280 320 8 8 1-8
320 360 7 15 9-15
360 400 6 21 16-21
400 440 7 28 22-28
440 480 9 37 29-37
480 520 3 40 38-40
n 40
n 40
i 20
2 2
Pela ordem definida através das frequências acumuladas na tabela, podemos
observar que a mediana pertence à 3ª classe da distribuição. Daqui,
implementando a fórmula
n
fa ant
Mdn li 2 h
fi
n
Com l i 360; 20; fa ant 15; f i 6 e h 40 , temos:
2
20 15 5 40
Mdn 360 40 360 393,3 USD
6 6
Interpretação: 50% dos trabalhadores da firma RK, auferem no máximo 393,3
USD mensais.
Observação 2: Na avaliação global quando se utiliza a mediana quanto maior
for o valor da mediana em relação ao rendimento máximo, melhor será o nível
de rendimento alcançado. Isto leva-nos a crer que se o valor da mediana
4.3- Moda ( Mo )
Definição: Chama-se moda o valor da variável predominante, mais frequente,
ou mais observado num conjunto de dados. Ainda podemos definir a moda
como valor da variável que corresponde à maior frequência absoluta simples.
Uma distribuição estatística, quanto à quantidade de modas pode ser:
Amodal: Uma distribuição que não tem moda. Quer dizer, as
frequências absolutas simples são todas iguais;
Unimodal: Uma distribuição que tem apenas uma moda. Quer dizer, a
maior frequência absoluta simples está associada a um único valor da
variável ou a uma única classe em caso de dados agrupados em
classes;
Bimodal: Uma distribuição que tem duas modas. Quer dizer, a maior
frequência absoluta simples está associada a dois valores distintos da
variável ou a duas classes distintas;
Multimodal ou plurimodal: Uma distribuição que tem mais do que duas
modas.
Onde:
- l i é o limite inferior da classe modal;
- f post é a frequência absoluta simples da classe imediatamente a seguir
da classe modal;
- f ant é a frequência absoluta simples da classe imediatamente anterior
à classe modal;
- h é a amplitude do intervalo da classe modal.
Onde:
- l i é o limite inferior da classe modal;
- 1 f máx f ant é a diferença entre a frequência absoluta simples da
classe modal e a frequência absoluta simples da classe imediatamente
anterior a ela;
- 2 f máx f post é a diferença entre a frequência absoluta simples da
classe modal e a frequência absoluta simples da classe imediatamente a
seguir dela;
- h é a amplitude do intervalo da classe modal.
d) Moda de Pearson ( Mo P )
Segundo Pearson, conhecidos os valores da mediana e da média aritmética, a
moda pode ser calculada pela fórmula:
Mo P 3 Mdn 2 X
CAPÍTULO VI
MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE
3
Ver o 2º passo do agrupamento de dados em classes
D xi X
DMA
x i X
, para dados isolados;
n
DMA
f i xi X , para dados ponderados;
n
DMA
f i PM i X , para dados agrupados em classes.
n
DMA
x i X
.
n
b) Dados ponderados
f i xi X ;
DMA
f i xi X
6º) Dividir a soma encontrada no 5º passo por n. Isto é n .
d) Dados agrupados em classes
f i PM i X ;
DMA
f i PM i X
6º) Dividir a soma encontrada no 5º passo por n. Isto é n .
4.1.3- A variância ( )
2
2
(x i X )2
, para dados isolados;
n
2
f i ( xi X ) 2 , para dados ponderados;
n
2
f i ( PM i X ) 2 , para dados agrupados em classes.
n
4.1.3.1- Passos a marcar para o cálculo da variância para:
a) Dados isolados
5º) Dividir a soma dos desvios quadráticos pelo volume de observações. Isto é
2
(x i X )2
.
n
b) Dados ponderados
f x X ;
2
i i
f PM X ;
2
i i
Onde:
2
* X é a média quadrática ou valor médio dos quadrados dos valores (ou dos
quadrados dos pontos médios em caso de dados agrupados em classes), cujo
valor numérico se obtém através da fórmula:
x
2
i
X 2
, para dados isolados;
n
( f
2
i xi )
X 2
, para dados ponderados;
n
( f PM
2
)
( f i PM i ) X 2
2 i i
X2 n para dados agrupados em classes.
n
Resolução:
*Cálculo das médias:
3 14 10 13 65 2 11 2 15 13 65
X Miguel 13 e X António 13
5 5 5 5
*Comparação das médias: X Miguel X António
10 1 -3 3 3
13 1 0 0 0
14 3 1 1 3
f i n5 ( f i xi X ) 6
DMAMig .
f i xi X 6 1,2
n 5
António
xi fi xi X xi X f i xi X
11 2 -2 2 4
DMAAnt .
f i xi X 8 1,6
n 5
Comparando temos DMAMig . DMAAnt . . Logo, O Miguel foi o mais regular que o
António em termos de gastos, nos dias indicados.
Resolução:
*Cálculo das médias:
30 2 25 20 100 35 40 25 20 120
X Ham. 25 e X Dino 30
4 4 4 4
*Comparação das médias: X Ham. X Dino
Como as médias são diferentes, para a averiguação da questão utilizamos o
coeficiente de variação.
Para o Hamilton os dados são ponderados. Deste modo usamos as fórmulas
f x X
2
2 e i i
CV P 2
X X n
Hamilton
xi fi xi X ( xi X ) 2 f i ( xi X ) 2
20 1 -5 25 25
25 2 0 0 0
30 1 5 25 25
n4
f i ( xi X ) 2 50
f x X 50 12,5
2
i i
2
Ham.
n 4
x X
2
2 e 2 i
CV P
X X n
Dino
xi xi X ( xi X ) 2
20 -10 100
25 -5 25
35 5 25
40 10 100
(x i X ) 2 250
x X
2
i 250
2
Dino 62,5
n 4
2 Dino 62,5
CVDino 0,264
X Dino 30
Pelos resultados dos coeficientes de variação podemos concluir que o Hamilton
foi o mais regular que o Dino, em gastos de combustível.
Nota: Utilizando a segunda fórmula da variância para o exemplo anterior
temos:
( f
2
i xi )
X 2
, porque os dados são ponderados. Deste modo, temos:
n
xi fi f i xi xi
2
f i xi
2
20 1 20 400 400
25 2 50 625 1250
30 1 30 900 900
n4 ( f i xi ) 100 ( f i xi ) 2550
X
( f i xi )
100
25 ; X 2
( f i
2
xi )
2550
637,5
n 4 n 4
2 X 2 X 637,5 25 2 637,5 625 12,5
2
X , X
2 i i
No caso do Dino usamos as fórmulas X 2 2
e X 2
.
n n
Deste modo, temos:
xi xi
2
20 400
25 625
35 1225
40 1600
x i 120
xi 2 3850
x x
2
i 100 i 3850
X 25 ; X 2 962,5
n 4 n 4
2 X 2 X 962,5 30 2 962,5 900 62,5
2
n ( xi yi ) xi yi
rP
n x i
2 2
xi n yi yi
2 2
Numa classificação global distinguem-se três tipos de correlação seguintes:
a) Correlação positiva
b) Correlação negativa
c) Correlação nula
Entre duas variáveis existe uma correlação positiva quando rP 0 . Isto
acontece quando os comportamentos das duas variáveis alteram no mesmo
sentido ( ou ambos crescem, ou ambos decrescem)
Entre duas variáveis existe uma correlação negativa quando rP 0 . Isto
acontece quando os comportamentos das duas variáveis alteram em sentidos
contrários (Uma delas cresce enquanto a outra decresce e vice-versa)
A classificação pormenorizada da correlação depende do valor obtido do
coeficiente. Assim, se:
perfeita;
0,5 rP 1 , então existe uma correlação positiva forte;
perfeita;
n xi yi xi yi
m
n xi xi
2 2