EMENTA:
Esta aula aborda como descrever um grupo como um todo encontrando um
valor que represente o que é “médio” ou “típico” em um conjunto de dados, a
partir das medidas de tendência central1.
OBJETIVOS DA AULA:
1
A denominação “medida de tendência central” se deve ao fato de ser uma medida que geralmente se
localiza em torno do meio ou centro do conjunto de dados, isto é, onde a maior parte dos dados tende a
concentrar-se.
Levar o aluno a perceber a diferença que existe entre simetria e
assimetria em função das medidas de tendência central.
X́ =
∑x
n
Onde,
X́ = média aritmética
∑ = letra sigma grega que representa soma.
n = número total de observações.
Por exemplo: Vamos determinar a média aritmética dos valores 10, 20, 30, 40 e
50.
Por exemplo: suponha que a nota atribuída a vinte alunos em uma prova de
estatística sejam as seguintes: 3, 3, 4, 5, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 9,
10.
Veja a seguir:
6 + 6 + 6 + 6 + 6 + 6 + 6 = 42
Ou
6 x 7 = 42
Assim, quando os dados estiverem agrupados numa distribuição de
frequências, podemos utilizar a média aritmética dos valores X 1, X2, ..., Xk,
ponderados pelas suas respectivas frequências absolutas: f1, f2, ..., fk.
X́ =
∑ xi f i
∑ fi
Onde,
X́ = média aritmética
∑ = letra sigma grega que representa soma
x i = qualquer dado bruto do conjunto de observações
f i = frequência de ocorrência da variável x.
PA (mmHg) f fixi
110 2 2 x 110 = 220
120 3 3 x 120 = 360
130 5 5 x 130 = 650
140 6 6 x 140 = 840
150 4 4 x 150 = 600
160 4 4 x 160 = 640
170 3 3 x 170 = 510
180 1 1 x 180 = 180
∑f i = 28 ∑f i xi = 4000
Logo,
X́ =
∑ xi f i = 4000 → X́=142,857
∑ f i 28
X́ =
∑ ( x ¿ ¿ i pm. f i ) ¿
∑fi
Onde,
x i pm = ponto médio da classe
f i = frequência da classe
Classes fi
41 |--- 45 7
45 |--- 49 3
49 |--- 53 4
53 |--- 57 1
57 |--- 61 5
Total 20
Ponto
Classes fi xipm.fi
médio
41 |--- 45 7 43 301
45 |--- 49 3 47 141
49 |--- 53 4 51 204
53 |--- 57 1 55 55
57 |--- 61 5 59 295
Total 20 ∑ = 996
X́ =
∑ ( x ¿ ¿ i pm. f i ) = 996 → X́=49,8 ¿
∑fi 20
a) b) c)
Classes fi Classes fi Classes fi
1,55 |--- 1,57 2 21 |--- 24 8 180 |--- 185 8
1,57 |--- 1,59 6 24 |--- 27 17 185 |--- 190 17
1,59 |--- 1,61 7 27 |--- 30 18 190 |--- 195 18
1,61 |--- 1,63 8 30 |--- 33 22 195 |--- 200 22
1,63 |--- 1,65 2 33 |--- 36 29 200 |--- 205 29
1,65 |--- 1,67 1 36 |--- 39 30 205 |--- 210 30
Total Total Total
1.2. Mediana
A mediana é outra medida de tendência central. Sua principal característica é
dividir o conjunto de dados ao meio. Assim, a mediana é definida como o valor
que se encontra no centro de uma série de números dispostos em ordem.
N +1
Posição=
2
Onde,
Posição = a posição da mediana no conjunto de dados ordenados de forma
crescente.
N = número total de valores no conjunto de dados
Mas, o que acontece quando o nosso conjunto possui tamanho par? Suponha
que adicionamos mais um número a este conjunto de dados:
N + 1 8+ 1
Posição= = → Posição=4,5
2 2
Mediana
está entre a
X́ =
∑ x = 60+78 = 138 =69,0
n 2 2
Assim, para o conjunto de dados B, a mediana é 69, uma vez que, este é o
valor situado entre a quarta e quinta posição.
N° de
fi fa
meninas
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
∑ 34
Onde,
fa = frequência acumulada
Ainda aqui, temos que determinar um valor que divida a distribuição dos dados
de tal maneira que, em ambos, tenham o mesmo número de elementos.
Assim, a posição da mediana é agora determinada por:
Posição=
∑ fi
2
Sendo:
∑ f i = 34 =17 , em seguida devemos procurar o valor da mediana na
2 2
coluna de fa, na correspondente ao valor 2 da variável, sendo este valor
mediano.
Logo, a mediana = 2 meninas por família.
Notas fi fa
2 2 2
4 3 5
6 10 15
8 14 29
10 11 40
Sendo:
∑ f i = 40 =20, em seguida devemos procurar o valor da mediana na
2 2
coluna de fa, na coluna das frequências acumuladas; a menor frequência
acumulada que supera esse valor é 29, que corresponde ao valor 8 da variável
notas, sendo então este o valor mediano.
Idade, anos fi fa
10 18 18
15 15 33
20 10 43
25 12 55
30 8 63
Sendo:
∑ f i = 63 =31,5, em seguida devemos procurar o valor da mediana na
2 2
coluna de fa, na coluna das frequências acumuladas; a menor frequência
acumulada que supera esse valor é 33, que corresponde ao valor 15 da
variável idade em anos, sendo então este o valor mediano.
N
mediana=li+
( 2
−f ) h ant
fi
Posição=
∑ fi
2
Logo,
Posição=
∑ f i = 40 =20
2 2
Estatura (cm) fi fa
150 |--- 154 4 4
154 |--- 158 9 13
158 |--- 162 11 24 Classe da
162 |--- 166 8 32 mediana
166 |--- 170 5 37
170 |--- 174 3 40
∑= 40
Estatura (cm) fi fa
150 |--- 154 4 4
154 |--- 158 9 13
158 |--- 162 11 24
162 |--- 166 8 32
166 |--- 170 5 37
170 |--- 174 3 40
∑= 40
Estatura (cm) fi fa
150 |--- 154 4 4
154 |--- 158 9 13
Limite 158 |--- 162 11 24
inferior
162 |--- 166 8 32
166 |--- 170 5 37
170 |--- 174 3 40
∑= 40
5° PASSO: calcular a amplitude da classe (h). Para tanto, pegue o maior valor
da classe e subtraia do menor valor. Em nosso exemplo temos, 162 cm – 158
cm = 4 cm.
N
mediana=li+
( 2
−f ) hant
fi
Logo,
Assim, a estatura mediana dos alunos é 158,07 cm.
Salários (R$) fi fa
500 |--- 600 8 8
600 |--- 700 12 20
700 |--- 800 15 35
800 |--- 900 18 53
900 |---1000 16 69
1000 |--- 1100 8 77
Total 77
1.3. Moda
Curso
Aluno (a)
Superior
Lucas Medicina
Alessandra Arquitetura
Vanessa Fisioterapia
3
Embora a palavra moda possa estar relacionada a desfiles e roupas em geral, em um sentido mais
amplo, significa que é mais praticado ou frequente.
Daniel Engenharia
Nelson Medicina
Laura Medicina
Renan Marketing
Liliane Odontologia
Ana Carolina Jornalismo
Veja na tabela, que o curso de medicina foi citado três vezes, enquanto que os
demais foram citados apenas uma vez.
No conjunto de dados numéricos P = {10; 10; 15; 15; 15; 60; 55; 40; 15; 15; 4;
30}, a moda é 15, uma vez que 15, é o número que ocorre com maior
frequência (cinco vezes).
Já no conjunto de dados Q = {21; 31; 32; 44; 50; 51; 57; 58}, não há moda, pois
não existe nenhum valor que ocorre com maior frequência.
A moda em um conjunto de dados pode assumir três classificações:
Amodal – quando não existe moda. Por exemplo, Q = {21; 31; 32; 44;
50; 51; 57; 58}
Unimodal – quando a moda é única. Por exemplo, P = {10; 10; 15; 15;
15; 60; 55; 40; 15; 15; 4; 30}
Bimodal – quando há duas modas. Exemplo R = {35; 10; 68; 68; 70; 11;
68; 70; 70; 12; 68; 70};
EMENTA
Esta aula aborda as medidas de variabilidade mais conhecidas: variância,
desvio padrão e erro padrão.
OBJETIVOS
Por exemplo:
Suponha que três pacientes tiveram sua Pressão Arterial (PA) monitorada
durante a semana, veja a tabela a seguir.
120+120+120+120+120 600
X́ A = = → 120,0
5 5
118+119 +120+121+122 600
X́ B= = →120,0
5 5
As estatísticas mais conhecidas para este fim são: amplitude total, variância,
desvio padrão e erro padrão.
Uma forma rápida, porém, não muito precisa, de calcular a variabilidade dos
dados é usar o cálculo da amplitude total.
A amplitude total, nada mais é que a diferença entre o maior e o menor valor da
distribuição dos dados.
Por exemplo: se a PA mais alta do paciente C foi 150 mmHg e a mais baixa foi
105 mmHg, a amplitude total da PA deste paciente é de 45 mmHg (150 – 105 =
45).
Assim, o cálculo da amplitude total é dada por:
Onde,
AT = amplitude total
2.3. Variância
σ =¿ ¿
Onde,
4
Isso porque qualquer medida que seja afetada pelo escore de um único elemento, não pode fornecer
uma ideia precisa quanto a variabilidade da distribuição, como um todo.
2.4. Desvio padrão
Por motivos que logo se tornarão aparentes, a variância não é muito utilizada
para descrever a variabilidade de um conjunto de dados.
DP=√ ∑ ¿ ¿ ¿ ¿
Onde,
Onde,
DP = desvio padrão
∑ = soma (expressa pela letra grega, “sigma”)
x = qualquer dado bruto do conjunto
X́ = média aritmética.
Dias/sem Paciente B xi - X́
Seg 118 118 - 120 = -2
Ter 119 119 - 120 = -1
Qua 120 120 - 120 = 0
Qui 121 121 - 120 = 1
Sex 122 122 - 120 = 2
Dias/se
m
Paciente B
xi - X́ (xi - X́ )2
Seg 118 118 - 120 = -2 4
Ter 119 119 - 120 = -1 1
Qua 120 120 - 120 = 0 0
Qui 121 121 - 120 = 1 1
Sex 122 122 - 120 = 2 4
Dias/se
m
Paciente B
xi - X́ (xi - X́ )2
Seg 118 118 - 120 = -2 4
Ter 119 119 - 120 = -1 1
Qua 120 120 - 120 = 0 0
Qui 121 121 - 120 = 1 1
Sex 122 122 - 120 = 2 4
∑ = 10
Dias/se Paciente
m C
Seg 105
Ter 150
Qua 120
Qui 110
Sex 115
2.4.2. Calculo do desvio padrão com dados agrupados.
Intervalo de
fi
Classe
2 -- 4 2
5 -- 7 4
8 -- 10 5
11 -- 13 3
14 -- 16 2
17 -- 19 1
Intervalo de
fi Ponto médio
Classe
2 -- 4 2 (2 + 4) ÷ 2 = 3
5 -- 7 4 (5 + 7) ÷ 2 = 6
8 -- 10 5 (8 + 10) ÷ 2 = 9
11 -- 13 3 (11 + 13) ÷ 2 = 12
14 -- 16 2 (14 + 16) ÷ 2 = 15
17 -- 19 1 (17 + 19) ÷ 2 = 18
Intervalo de
fi Ponto médio fx
Classe
2 -- 4 2 3 2x3=6
5 -- 7 4 6 4 x 6 = 24
8 -- 10 5 9 5 x 9 = 45
11 -- 13 3 12 3 x 12 = 36
14 -- 16 2 15 2 x 15 = 30
17 -- 19 1 18 1 x 18 = 18
6+24+ 45+36+30+ 18 159
X́ = = →9,35
17 17
X́ 2 =9,35 . 9,35=87,42
Intervalo de
fi Ponto médio fx fx2
Classe
2 -- 4 2 3 6 36
5 -- 7 4 6 24 576
8 -- 10 5 9 45 2025
11 -- 13 3 12 36 1296
14 -- 16 2 15 30 900
17 -- 19 1 18 18 324
∑ fx2 = 1773
DP
EP=
√N
Onde,
EP = erro padrão
N = número de amostras.
Questões
Exercícios
1. As concentrações de óxido de nitrogênio e hidrocarbono (em g/m3)
foram determinadas em uma área urbana, em locais e horários
específicos. Os dados são mostrados a seguir.
Óxido de Hidrocarbon
Dia DIF= O - H
Nitrogênio (O) o (H)
1 104 108 -4
2 116 118 -2
3 84 89 -5
4 77 71 6
5 61 66 -5
6 84 83 1
7 81 88 -7
8 72 76 -4
9 61 68 -7
10 97 96 1
11 84 81 3
a) I, apenas.
b) II, apenas.
c) III, apenas.
d) I e II, apenas.
e) III, apenas.
Nº de Publicações Nº de Profissionais
0 6
1 8
2 12
3 10
4 4
∑ 40
a) I, apenas.
b) II, apenas.
c) I e II, apenas.
d) III, apenas.
e) Nenhuma das alternativas.
a) I, apenas
b) II, apenas
c) III, apenas
d) I e II, apenas
e) Nenhuma das alternativas.
As notas obtidas pelos 10 alunos da equipe Gama foram: 10; 6.5; 8; 10;
7; 6.5; 7; 8; 6 e 0.
Se o aluno da equipe Gama que faltou tivesse comparecido, essa
equipe:
a) I, apenas.
b) II, apenas.
c) III, apenas.
d) I e II, apenas.
e) Nenhuma das alternativas.
10; 1; 10; 11; 13; 10; 64; 13; 13; 12; 12; 11; 13; 11; 12; 12
a) I, apenas.
b) II, apenas.
c) III, apenas.
d) I e II, apenas.
e) I, II e III.
Período
Empresas
2013 2014 2015
Alfinetes V R$ 200 mil R$ 220 mil R$ 240 mil
Balas W R$ 200 mil R$ 230 mil R$ 200 mil
Chocolates X R$ 250 mil R$ 210 mil R$ 215 mil
Pizzaria Y R$ 230 mil R$ 230 mil R$ 230 mil
Tecelagem Z R$ 160 mil R$ 210 mil R$ 245 mil
Um investidor deseja comprar duas das empresas listadas na tabela. Para tal,
ele calcula a média aritmética da receita bruta anual dos últimos três anos e
escolhe as duas empresas de maior média anual.
a) Balas W e Pizzaria Y
b) Chocolates X e Tecelagem Z
c) Pizzaria Y e Alfinetes V
d) Pizzaria Y e Chocolates X
e) Tecelagem Z e Alfinetes V
Período
Região
2005 2006 2007 2008 2009
Norte 2% 2% 1% 2% 1%
Nordeste 18% 19% 21% 15% 19%
Centro Oeste 5% 6% 7% 8% 9%
Sudeste 55% 61% 58% 66% 60%
Sul 21% 12% 13% 9% 11%
a) 14,6%
b) 18,2%
c) 18,4%
d) 19,0%
e) 21,0%
Preocupada com a sua locadora, Marla aplicou uma pesquisa com um grupo de 200 clientes
escolhidos de forma aleatória, sobre a quantidade de filmes que estes locaram no primeiro
semestre de 2011. Os dados coletados estão apresentados na tabela a seguir:
Número de Frequênci
filmes a
0 25
1 30
2 55
3 90
Total 200
a) 2,05; 3; 2
b) 1,5; 2; 3
c) 1,5; 3; 3
d) 1,5; 3; 2
e) 2,05; 2; 3