Você está na página 1de 31

SUMÁRIO

1. MEDIDAS DE TENDÊNCIA CENTRAL


1.1. Média Aritmética
1.1.1. Cálculo simples da média aritmética
1.1.2. Cálculo da média aritmética ponderada
1.1.3. Cálculo de média aritmética ponderada com dados agrupados
em classes
1.2. Mediana
1.2.1. Cálculo da mediana para dados não agrupados
1.2.2. Cálculo da mediana com dados agrupados
1.2.3. Cálculo da mediana com dados agrupados em classes.
1.3. Moda
2. MEDIDAS DE VARIABILIDADE
2.1. Introdução as medidas de variabilidade
2.2. Amplitude total
2.3. Variância
2.4. Desvio padrão
2.4.1. Cálculo do desvio padrão
2.4.2. Calculo do desvio padrão com dados agrupados
2.5. Erro padrão da média

AULA II: MEDIDAS DE TENDÊNCIA CENTRAL

EMENTA:
Esta aula aborda como descrever um grupo como um todo encontrando um
valor que represente o que é “médio” ou “típico” em um conjunto de dados, a
partir das medidas de tendência central1.

OBJETIVOS DA AULA:

 Habilitar o aluno a realizar cálculos das medidas de tendência central;


 Permitir que o aluno localize a média, a mediana e a moda de um
conjunto de dados;
 Permitir que o aluno localize a média, a mediana e a moda em conjunto
de dados agrupados;

1
A denominação “medida de tendência central” se deve ao fato de ser uma medida que geralmente se
localiza em torno do meio ou centro do conjunto de dados, isto é, onde a maior parte dos dados tende a
concentrar-se.
 Levar o aluno a perceber a diferença que existe entre simetria e
assimetria em função das medidas de tendência central.

1. Medidas de Tendência Central


Os estudos que nós realizamos até agora nos permite descrever os valores
que uma variável pode assumir através de tabelas de distribuição de
frequências.

Podemos também localizar a maior concentração de valores de uma


distribuição. No entanto, pode ser muito difícil trabalhar com a distribuição de
frequência completa, razão pela qual costuma-se lançar mão de determinadas
medidas.

Existem diversas medidas que resumem certas características importantes dos


nossos dados.

Isto é, existem medidas que possibilitam condensar as informações de um


conjunto de dados para esclarecer a fase analítica da estatística descritiva.

Nesta aula, necessitamos introduzir conceitos que expressam, através de


números, essas características e tendências.
Esses conceitos são denominados:

 Medidas de Posição ou Medidas de Tendência Central;


 Medidas de Posição ou Medidas Separatrizes;
 Medidas de Variabilidade ou Dispersão.

1.1. Média Aritmética:


A medida de tendência central mais comum para descrever resumidamente
uma distribuição de frequências é a média, ou mais propriamente, a média
aritmética.
Há diversos tipos de médias (média aritmética simples e ponderada, média
geométrica, média harmônica e média quadrática).

Entretanto, neste módulo, estudaremos apenas a média aritmética simples e


ponderada.

A média aritmética é representada pelo símbolo X́ (lê-se “x barra”).

1.1.1. Cálculo simples da média aritmética


A média aritmética simples de um conjunto de números é igual à divisão entre
a soma dos valores do conjunto e o número total de valores, conforme a
fórmula abaixo:

X́ =
∑x
n
Onde,
X́ = média aritmética
∑ = letra sigma grega que representa soma.
n = número total de observações.

Por exemplo: Vamos determinar a média aritmética dos valores 10, 20, 30, 40 e
50.

Aplicando a fórmula, temos:

10+ 20+30+40+ 50 150


X́ = = =30
5 5

A média aritmética simples sempre será calculada quando os valores não


estiverem tabulados, ou seja, quando eles aparecerem representados
individualmente.
Pratique resolvendo mais alguns exemplos: Determine a média aritmética para
os seguintes conjuntos de valores:

1) A = {30, 44, 55, 70, 22, 18}


2) B = {140, 132, 144, 155, 126}
3) C = {72, 73, 74, 75, 71, 77, 79}

1.1.2. Cálculo da Média Aritmética Ponderada


A média aritmética ponderada é quando os valores do conjunto de dados
tiverem pesos diferentes.

Assim, é possível obter a média ponderada através da divisão entre a soma


dos produtos de cada variável pelo seu respectivo peso (frequência com que
ele ocorre no conjunto de dados) e a somatória dos pesos.

Por exemplo: suponha que a nota atribuída a vinte alunos em uma prova de
estatística sejam as seguintes: 3, 3, 4, 5, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 9,
10.

Como os valores da variável aparecem repetidos, é possível adotar a


frequência com que eles ocorrem como peso ou fator de ponderação. Podemos
verificar que a nota seis aparece sete vezes. Contudo, é indiferente, para
cálculo da média, somar os números seis, sete vezes ou multiplicar esse valor
por sete.

Veja a seguir:

6 + 6 + 6 + 6 + 6 + 6 + 6 = 42

Ou

6 x 7 = 42
Assim, quando os dados estiverem agrupados numa distribuição de
frequências, podemos utilizar a média aritmética dos valores X 1, X2, ..., Xk,
ponderados pelas suas respectivas frequências absolutas: f1, f2, ..., fk.

Assim, a média aritmética ponderada do conjunto pode ser calculada pela


fórmula:

X́ =
∑ xi f i
∑ fi
Onde,
X́ = média aritmética
∑ = letra sigma grega que representa soma
x i = qualquer dado bruto do conjunto de observações
f i = frequência de ocorrência da variável x.

Para empregar esse cálculo de forma prática, veja a tabela abaixo:

PA (mmHg) f fixi
110 2 2 x 110 = 220
120 3 3 x 120 = 360
130 5 5 x 130 = 650
140 6 6 x 140 = 840
150 4 4 x 150 = 600
160 4 4 x 160 = 640
170 3 3 x 170 = 510
180 1 1 x 180 = 180
∑f i = 28 ∑f i xi = 4000
Logo,

X́ =
∑ xi f i = 4000 → X́=142,857
∑ f i 28

1.1.3. Média Aritmética Ponderada com dados agrupados em classes


Quando os valores estiverem agrupados em classes, o cálculo da média
ponderada requer mais uma coluna na tabela, necessária para dispor o ponto
médio da classe, veja a fórmula a seguir:

X́ =
∑ ( x ¿ ¿ i pm. f i ) ¿
∑fi

Onde,
x i pm = ponto médio da classe

f i = frequência da classe

Veja um exemplo prático: suponha que a idade de 20 (n=20) indivíduos foram


agrupadas em classes com amplitude de cinco anos (ver tabela abaixo):

Classes fi
41 |--- 45 7
45 |--- 49 3
49 |--- 53 4
53 |--- 57 1
57 |--- 61 5
Total 20

1° PASSO: calcular o ponto médio das classes:

Classes f Ponto médio


41 |--- 45 7 (41 + 43) ÷ 2 = 43
45 |--- 49 3 (45 + 49) ÷ 2 = 47
49 |--- 53 4 (49 + 53) ÷ 2 = 51
53 |--- 57 1 (53 + 57) ÷ 2 = 55
57 |--- 61 5 (57 + 61) ÷ 2 = 59
Total 20  

2° PASSO: multiplicar o resultado da operação anterior pela frequência das


classes:
Classes fi Ponto xipm.fi
médio
41 |--- 45 7 43 43 x 7 = 301
45 |--- 49 3 47 47 x 3 = 141
49 |--- 53 4 51 51 x 4 = 204
53 |--- 57 1 55 55 x 1 = 55
57 |--- 61 5 59 59 x 5 = 295
Total 20    

3° PASSO: somar os valores obtidos de xipm.fi.

Ponto
Classes fi xipm.fi
médio
41 |--- 45 7 43 301
45 |--- 49 3 47 141
49 |--- 53 4 51 204
53 |--- 57 1 55 55
57 |--- 61 5 59 295
Total 20   ∑ = 996

4° PASSO: montar a fórmula com os resultados obtidos e calcular a média.

X́ =
∑ ( x ¿ ¿ i pm. f i ) = 996 → X́=49,8 ¿
∑fi 20

Pratique resolvendo mais alguns exemplos: Determine a média aritmética para


as seguintes tabelas:

a)     b)     c)  
Classes fi   Classes fi   Classes fi
1,55 |--- 1,57 2   21 |--- 24 8   180 |--- 185 8
1,57 |--- 1,59 6   24 |--- 27 17   185 |--- 190 17
1,59 |--- 1,61 7   27 |--- 30 18   190 |--- 195 18
1,61 |--- 1,63 8   30 |--- 33 22   195 |--- 200 22
1,63 |--- 1,65 2   33 |--- 36 29   200 |--- 205 29
1,65 |--- 1,67 1   36 |--- 39 30   205 |--- 210 30
Total     Total     Total  
1.2. Mediana
A mediana é outra medida de tendência central. Sua principal característica é
dividir o conjunto de dados ao meio. Assim, a mediana é definida como o valor
que se encontra no centro de uma série de números dispostos em ordem.

Em outras palavras, a mediana de um conjunto de valores, ordenados segundo


uma ordem de grandeza, é o valor situado de tal forma no conjunto que o
separa em dois subconjuntos de mesmo tamanho.

1.2.1. Cálculo da mediana para dados não agrupados


Para determinar o valor mediano de um conjunto de dados, podemos utilizar a
fórmula a seguir:

N +1
Posição=
2

Onde,
Posição = a posição da mediana no conjunto de dados ordenados de forma
crescente.
N = número total de valores no conjunto de dados

Por exemplo: considere um conjunto de dados A, tal que:

A = {60; 44; 21; 78; 80; 44; 88}

1° PASSO: colocar o conjunto de dados em ordem crescente ou decrescente2.

A = {21; 44; 44; 60; 78; 80; 88}

2° PASSO: aplicar a fórmula para encontrar a posição da mediana.


2
Na verdade, tanto faz. Geralmente, costuma-se colocar sempre na ordem crescente para facilitar o
entendimento do assunto.
N + 1 7+1
Posição= = → Posição=4
2 2

3° PASSO: note que a fórmula encontrou o a posição em que a mediana pode


ser encontrada. Neste caso, a mediana é 60, uma vez que 60, está situada na
quarta posição do conjunto de dados.

A = {21; 44; 44; 60; 78; 80; 88}

Observe que, nesse conjunto de dados (n=7), a mediana se encontra


exatamente no centro das observações (há três números inferiores a 60 e três
números superiores a 60).

Mas, o que acontece quando o nosso conjunto possui tamanho par? Suponha
que adicionamos mais um número a este conjunto de dados:

B = {21; 44; 44; 60; 78; 80; 88; 88}

Ao aplicar a fórmula temos:

N + 1 8+ 1
Posição= = → Posição=4,5
2 2

O resultado indica que a mediana do conjunto de dados B está entre a quarta e


quinta posição.

B = {21; 44; 44; 60 78; 80; 88; 88}

Mediana
está entre a

Assim, em conjunto de dados com tamanho par, o cálculo da mediana requer


mais um passo:
4° PASSO: calcular a média aritmética dos valores que ocupam a quarta e
quinta posição.

X́ =
∑ x = 60+78 = 138 =69,0
n 2 2

Assim, para o conjunto de dados B, a mediana é 69, uma vez que, este é o
valor situado entre a quarta e quinta posição.

1.2.2. Cálculo da Mediana com dados agrupados.


Se os dados estão agrupados em uma distribuição de frequências, o cálculo da
mediana ocorre de maneira muito semelhante àquele visto no tópico anterior,
implicando, porém, a determinação prévia das frequências acumuladas (veja a
tabela abaixo).

Tabela. Número de meninas/família em uma comunidade

N° de
fi fa
meninas
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
  ∑ 34  

Onde,
fa = frequência acumulada

Ainda aqui, temos que determinar um valor que divida a distribuição dos dados
de tal maneira que, em ambos, tenham o mesmo número de elementos.
Assim, a posição da mediana é agora determinada por:

Posição=
∑ fi
2
Sendo:
∑ f i = 34 =17 , em seguida devemos procurar o valor da mediana na
2 2
coluna de fa, na correspondente ao valor 2 da variável, sendo este valor
mediano.
Logo, a mediana = 2 meninas por família.

Pratique resolvendo alguns exemplos:

a) Na tabela abaixo, temos as notas obtidas pelos alunos de uma sala.


Qual a pontuação mediana destes alunos?

Notas fi fa
2 2 2
4 3 5
6 10 15
8 14 29
10 11 40
     

Sendo:
∑ f i = 40 =20, em seguida devemos procurar o valor da mediana na
2 2
coluna de fa, na coluna das frequências acumuladas; a menor frequência
acumulada que supera esse valor é 29, que corresponde ao valor 8 da variável
notas, sendo então este o valor mediano.

b) Na tabela abaixo, temos a idade de moradores de uma comunidade.


Qual o valor mediano?

Idade, anos fi fa
10 18 18
15 15 33
20 10 43
25 12 55
30 8 63
     
Sendo:
∑ f i = 63 =31,5, em seguida devemos procurar o valor da mediana na
2 2
coluna de fa, na coluna das frequências acumuladas; a menor frequência
acumulada que supera esse valor é 33, que corresponde ao valor 15 da
variável idade em anos, sendo então este o valor mediano.

1.2.3. Cálculo da mediana com dados agrupados em classes.


Neste caso, o problema consiste em determinar o ponto do intervalo em que
está compreendida a mediana. Para tanto, devemos aplicar a fórmula a seguir:

N
mediana=li+
( 2
−f ) h ant

fi

Como exemplo, veja a tabela, a seguir.

Tabela. Distribuição das estaturas de 40 alunos da área da saúde /UNIB –


2014.
Estatura (cm) fi fa
150 |--- 154 4 4
154 |--- 158 9 13
158 |--- 162 11 24
162 |--- 166 8 32
166 |--- 170 5 37
170 |--- 174 3 40
∑= 40  

Vamos assim, calcular a mediana a partir desta tabela, seguindo os passos a


seguir:

1° PASSO: achar a classe mediana. Para tanto, aplique a fórmula a seguir:

Posição=
∑ fi
2
Logo,

Posição=
∑ f i = 40 =20
2 2

2° PASSO: procurar a classe em que a mediana se encontra.


A estatura mediana está nas três primeiras classes da distribuição, uma vez
que, pretendemos determinar o valor que ocupa o 20° lugar.

Estatura (cm) fi fa
150 |--- 154 4 4
154 |--- 158 9 13
158 |--- 162 11 24 Classe da
162 |--- 166 8 32 mediana
166 |--- 170 5 37
170 |--- 174 3 40
∑= 40  

3° PASSO: achar a frequência acumulada anterior da classe da mediana.

Estatura (cm) fi fa
150 |--- 154 4 4
154 |--- 158 9 13
158 |--- 162 11 24
162 |--- 166 8 32
166 |--- 170 5 37
170 |--- 174 3 40
∑= 40  

4° PASSO: encontrar o limite inferior da classe da mediana.

Estatura (cm) fi fa
150 |--- 154 4 4
154 |--- 158 9 13
Limite 158 |--- 162 11 24
inferior
162 |--- 166 8 32
166 |--- 170 5 37
170 |--- 174 3 40
∑= 40  

5° PASSO: calcular a amplitude da classe (h). Para tanto, pegue o maior valor
da classe e subtraia do menor valor. Em nosso exemplo temos, 162 cm – 158
cm = 4 cm.

6° PASSO: insira todos os valores encontrados na fórmula da mediana.


Lembrando que a frequência cumulada anterior é 13, o limite inferior é 158 e a
amplitude da classe é 4.

N
mediana=li+
( 2
−f ) hant

fi

Logo,
Assim, a estatura mediana dos alunos é 158,07 cm.

Pratique resolvendo mais um exemplo:

a) Considere a tabela que apresenta os salários dos funcionários de uma


clínica. Calcule o salário mediano destes funcionários.

Salários (R$) fi fa
500 |--- 600 8 8
600 |--- 700 12 20
700 |--- 800 15 35
800 |--- 900 18 53
900 |---1000 16 69
1000 |--- 1100 8 77
Total 77  

1.3. Moda

A moda3 é o valor mais frequente em um conjunto de dados e, para obtê-la,


simplesmente, procure o valor ou categoria que, numa distribuição, ocorra com
maior frequência.

Para ilustrar esse conceito, primeiro utilizando categorias, imagine que


realizamos uma pesquisa para saber a preferência de um grupo de estudantes
do ensino médio em relação ao curso superior que desejariam cursar ao passar
no vestibular.

A tabela, a seguir, mostra o nome dos estudantes com suas respectivas


preferências.

Curso
Aluno (a)
Superior
Lucas Medicina
Alessandra Arquitetura
Vanessa Fisioterapia

3
Embora a palavra moda possa estar relacionada a desfiles e roupas em geral, em um sentido mais
amplo, significa que é mais praticado ou frequente.
Daniel Engenharia
Nelson Medicina
Laura Medicina
Renan Marketing
Liliane Odontologia
Ana Carolina Jornalismo

Veja na tabela, que o curso de medicina foi citado três vezes, enquanto que os
demais foram citados apenas uma vez.

Assim, a opção “Medicina” é a moda desse conjunto de dados. Em outras


palavras, é o valor mais típico nesse grupo.

Observe, agora, alguns exemplos quando temos números em nosso conjunto


de dados:

No conjunto de dados numéricos P = {10; 10; 15; 15; 15; 60; 55; 40; 15; 15; 4;
30}, a moda é 15, uma vez que 15, é o número que ocorre com maior
frequência (cinco vezes).
Já no conjunto de dados Q = {21; 31; 32; 44; 50; 51; 57; 58}, não há moda, pois
não existe nenhum valor que ocorre com maior frequência.
A moda em um conjunto de dados pode assumir três classificações:

 Amodal – quando não existe moda. Por exemplo, Q = {21; 31; 32; 44;
50; 51; 57; 58}

 Unimodal – quando a moda é única. Por exemplo, P = {10; 10; 15; 15;
15; 60; 55; 40; 15; 15; 4; 30}

 Bimodal – quando há duas modas. Exemplo R = {35; 10; 68; 68; 70; 11;
68; 70; 70; 12; 68; 70};

 Multimodal – quando há mais de duas modas. Exemplo R = {1; 2; 5; 7;


1; 7; 2; 3; 4; 8}

AULA III – MEDIDAS DE VARIABILIDADE

EMENTA
Esta aula aborda as medidas de variabilidade mais conhecidas: variância,
desvio padrão e erro padrão.

OBJETIVOS

 Aprender porque, junto com as medidas de tendência central, devemos


informar as medidas de variabilidade;
 Aprender a calcular as principais medidas de variabilidade: variância,
desvio padrão e erro padrão.

2.1. Introdução as medidas de variabilidade

Nas aulas anteriores, nós aprendemos que as medidas de tendência central


são utilizadas para resumir um conjunto de dados a um único valor.

Entretanto, quando empregada sozinha, qualquer medida de tendência central


fornece apenas uma visão superficial dos dados.

Por exemplo:

Suponha que três pacientes tiveram sua Pressão Arterial (PA) monitorada
durante a semana, veja a tabela a seguir.

  SEG TER QUA QUI SEX Média


Paciente A 120 120 120 120 120 120,0
Paciente B 118 119 120 121 122 120,0
Paciente C 105 150 120 110 115 120,0

120+120+120+120+120 600
X́ A = = → 120,0
5 5
118+119 +120+121+122 600
X́ B= = →120,0
5 5

105+150+ 120+110+115 600


X́ C = = →120,0
5 5

Note, que a média aritmética da PA de cada paciente foi calculada para os


cinco dias da semana e que todos tiveram a mesma média de 120,0 mmHg.
Será que, por isso, podemos admitir que o comportamento da PA dos três
pacientes durante a semana é o mesmo?

Não, como bem mostra a tabela, a PA do paciente A não variou ao longo da


semana. Já a PA do paciente B teve variações oscilando entre 118 mmHg e
122 mmHg. Por outro lado, a PA do paciente C variou muito, com valores entre
105 mmHg e 150 mmHg.

Tal fato, mostra a necessidade de apresentarmos, além da medida de


tendência central, algo que nos indique a variação em torno da medida de
tendência central.

As estatísticas mais conhecidas para este fim são: amplitude total, variância,
desvio padrão e erro padrão.

2.2. Amplitude total

Uma forma rápida, porém, não muito precisa, de calcular a variabilidade dos
dados é usar o cálculo da amplitude total.

A amplitude total, nada mais é que a diferença entre o maior e o menor valor da
distribuição dos dados.

Por exemplo: se a PA mais alta do paciente C foi 150 mmHg e a mais baixa foi
105 mmHg, a amplitude total da PA deste paciente é de 45 mmHg (150 – 105 =
45).
Assim, o cálculo da amplitude total é dada por:

AT = valor máximo – valor mínimo

Onde,

AT = amplitude total

Entretanto, apesar de ser um procedimento rápido, a amplitude possui uma


desvantagem importante. Ela depende inteiramente de apenas dois valores: o
maior e o menor valor da distribuição dos dados.

Assim, como via de regra, a amplitude fornece apenas um índice grosseiro4 da


variabilidade dos dados.

2.3. Variância

Se desejarmos obter uma medida de variabilidade que leve em consideração


todos os escores da distribuição, e não apenas dois, poderemos subtrair o
valor de cada observação com a média aritmética da distribuição, elevar os
resultados ao quadrado, soma-los e, então dividi-los pelo número total de
elementos da distribuição menos um.

Dessa forma, para calcular a variância de uma distribuição, podemos usar a


seguinte fórmula:

σ =¿ ¿

Onde,

σ = distância sigma, que representa a variância.

x = qualquer escore da distribuição dos dados

X́ = média aritmética do conjunto de dados

n = número total de dados da distribuição.

4
Isso porque qualquer medida que seja afetada pelo escore de um único elemento, não pode fornecer
uma ideia precisa quanto a variabilidade da distribuição, como um todo.
2.4. Desvio padrão

Por motivos que logo se tornarão aparentes, a variância não é muito utilizada
para descrever a variabilidade de um conjunto de dados.

Vimos no tópico anterior que, ao elevar as diferenças ao quadrado, alteramos a


unidade de medida da variável, dificultando assim a interpretação dos
resultados.

Para superar este problema, podemos retornar o resultado da variância para a


unidade de medida original, calculando o desvio padrão, ou seja, extraindo a
raiz quadrada da variância.

Dessa forma, podemos definir o desvio padrão como a raiz quadrada da


variância.

2.4.1. Cálculo do desvio padrão para conjunto de dados

Para calcular o desvio padrão de conjuntos de dados isolados, aplica-se a


seguinte fórmula:

DP=√ ∑ ¿ ¿ ¿ ¿

Onde,

Onde,

DP = desvio padrão
∑ = soma (expressa pela letra grega, “sigma”)
x = qualquer dado bruto do conjunto
X́ = média aritmética.

n = número total de escores do conjunto.

Vamos ao exemplo: Considere a tabela de dados do comportamento da PA do


paciente B ao longo da semana.
Dias/seman
Paciente B
a
Seg 118
Ter 119
Qua 120
Qui 121
Sex 122
   

1° PASSO: Calcular a média aritmética do conjunto:

118+119 +120+121+122 600


X́ B= = →120,0
5 5

2° PASSO: Calcular as diferenças entre cada valor do conjunto de dados e a


média aritmética.

Dias/sem Paciente B xi - X́
Seg 118 118 - 120 = -2
Ter 119 119 - 120 = -1
Qua 120 120 - 120 = 0
Qui 121 121 - 120 = 1
Sex 122 122 - 120 = 2
       

3° PASSO: Elevar todas as diferenças ao quadrado

Dias/se
m
Paciente B
xi - X́ (xi - X́ )2 
Seg 118 118 - 120 = -2 4
Ter 119 119 - 120 = -1 1
Qua 120 120 - 120 = 0 0
Qui 121 121 - 120 = 1 1
Sex 122 122 - 120 = 2 4
         

4° PASSO: Some os valores das diferenças ao quadrado.

Dias/se
m
Paciente B
xi - X́ (xi - X́ )2 
Seg 118 118 - 120 = -2 4
Ter 119 119 - 120 = -1 1
Qua 120 120 - 120 = 0 0
Qui 121 121 - 120 = 1 1
Sex 122 122 - 120 = 2 4
        ∑ = 10

5° PASSO: monte a fórmula e calcule o desvio padrão.

Assim, a média da PA do paciente B é de 120,0 ± 1,6 mmHg.

Pratique resolvendo o mais um exercício.

a) Calcule o desvio padrão do paciente C

Dias/se Paciente
m C
Seg 105
Ter 150
Qua 120
Qui 110
Sex 115
   
2.4.2. Calculo do desvio padrão com dados agrupados.

Com o propósito de ilustrar o passo a passo do procedimento para obtenção da


variância e desvio padrão com os dados agrupados em classes, utilizaremos o
exemplo de Levin (1987).

Suponha os dados da tabela abaixo:

Intervalo de
fi
Classe
2 -- 4 2
5 -- 7 4
8 -- 10 5
11 -- 13 3
14 -- 16 2
17 -- 19 1

1° PASSO: calcular o ponto médio de cada intervalo de classe.

Intervalo de
fi Ponto médio
Classe
2 -- 4 2 (2 + 4) ÷ 2 = 3
5 -- 7 4 (5 + 7) ÷ 2 = 6
8 -- 10 5 (8 + 10) ÷ 2 = 9
11 -- 13 3 (11 + 13) ÷ 2 = 12
14 -- 16 2 (14 + 16) ÷ 2 = 15
17 -- 19 1 (17 + 19) ÷ 2 = 18

2° PASSO: Determinar a média da distribuição e elevá-la ao quadrado. Para


tanto, crie uma nova coluna multiplicando os valores de fi com o ponto médio
de sua respectiva classe.

Intervalo de
fi Ponto médio fx
Classe
2 -- 4 2 3 2x3=6
5 -- 7 4 6 4 x 6 = 24
8 -- 10 5 9 5 x 9 = 45
11 -- 13 3 12 3 x 12 = 36
14 -- 16 2 15 2 x 15 = 30
17 -- 19 1 18 1 x 18 = 18
6+24+ 45+36+30+ 18 159
X́ = = →9,35
17 17

X́ 2 =9,35 . 9,35=87,42

3° PASSO: Multiplicar cada ponto médio por fx e somar os produtos.

Intervalo de
fi Ponto médio fx fx2
Classe
2 -- 4 2 3 6 36
5 -- 7 4 6 24 576
8 -- 10 5 9 45 2025
11 -- 13 3 12 36 1296
14 -- 16 2 15 30 900
17 -- 19 1 18 18 324
        ∑ fx2 = 1773

4° PASSO: aplicar os resultados do passo 2 e 3 na fórmula.

Assim, a variância é 16,87 e o desvio padrão é 4,11.

2.5. Erro padrão da média


Vimos que, tanto a variância quanto o desvio padrão mede a variabilidade da
distribuição dos dados em uma única amostra. Mas, e se tivéssemos diversas
amostras de uma mesma população? Poderíamos medir a variabilidade das
médias dessas amostras com a variância ou com o desvio padrão?

A resposta é não! Neste cenário, a medida de variabilidade mais adequada é o


erro padrão.

Assim, o erro padrão estima a variabilidade entre médias coletadas de diversas


amostras da mesma população.

O cálculo do erro padrão é dado por:

DP
EP=
√N
Onde,

EP = erro padrão

DP = desvio padrão (calculado no tópico anterior)

N = número de amostras.

Questões

Exercícios
1. As concentrações de óxido de nitrogênio e hidrocarbono (em g/m3)
foram determinadas em uma área urbana, em locais e horários
específicos. Os dados são mostrados a seguir.

Óxido de Hidrocarbon
Dia DIF= O - H
Nitrogênio (O) o (H)
1 104 108 -4
2 116 118 -2
3 84 89 -5
4 77 71 6
5 61 66 -5
6 84 83 1
7 81 88 -7
8 72 76 -4
9 61 68 -7
10 97 96 1
11 84 81 3

Com os dados da tabela acima, realize uma análise descritiva dos


dados. Calculando apenas a média e desvio padrão para a variável
Óxido de Nitrogênio (O).

I. Média aritmética = 83,7 / Mediana = 84 / Desvio Padrão = 16,9


II. Média aritmética = 83,7 / Mediana = 84
III. Média aritmética = 83,7 / Desvio Padrão = 16,9

a) I, apenas.
b) II, apenas.
c) III, apenas.
d) I e II, apenas.
e) III, apenas.

2. Considere uma população de 40 pesquisadores que foram questionados


sobre o número de publicações durante o período de 2015. Os dados
são mostrados na tabela abaixo:

Nº de Publicações Nº de Profissionais
0 6
1 8
2 12
3 10
4 4
∑ 40

Calcule a média aritmética e encontre a moda de publicações e assinale


a alternativa CORRETA.

I. Média aritmética = 8,0 / Moda = 3


II. Média aritmética = 8,0 / Moda = 2
III. Média aritmética = 2,0 / Moda = 2

a) I, apenas.
b) II, apenas.
c) I e II, apenas.
d) III, apenas.
e) Nenhuma das alternativas.

3. Em um levantamento realizado em dezembro de 2015 nos 200


funcionários de um hospital X, em relação a variável expressa em
unidades monetárias (u.m.), obteve-se a seguinte tabela:

Salário (u.m.) Nº de Funcionários


0 |- 2 26
2 |- 4 32
4 |- 6 34
6 |- 8 40
8 |- 10 28
10 |- 12 22
12 |- 14 18
∑ 200

Considerando os 200 funcionários como de uma população, determine o


valor da moda e média aritmética de todos os salários.

I. A moda é de 6 |- 8 (u.m.) e a média é de 28,57 (u.m.)


II. A moda é de 6 |- 8 (u.m.) e a média é de 7.0 (u.m.)
III. A moda é de 6 |- 8 (u.m.) e a média é de 6.5 (u.m)

a) I, apenas
b) II, apenas
c) III, apenas
d) I e II, apenas
e) Nenhuma das alternativas.

4. Suponha que a etapa final de uma gincana escolar consista em um


desafio de conhecimentos. Cada equipe escolheria 10 alunos para
realizar uma prova objetiva, e a pontuação da equipe seria dada pela
média das notas obtidas pelos alunos. As provas valiam, no máximo 10
pontos cada. Ao final, a vencedora foi a equipe ômega, com 7,8 pontos,
seguida pela equipe Delta, com 7,6 pontos. Um dos alunos da equipe
Gama, a qual ficou na terceira e última colocação, não pôde
comparecer, tendo recebido nota zero na prova.

As notas obtidas pelos 10 alunos da equipe Gama foram: 10; 6.5; 8; 10;
7; 6.5; 7; 8; 6 e 0.
Se o aluno da equipe Gama que faltou tivesse comparecido, essa
equipe:

I. Teria a pontuação igual a 6,5 se ele tivesse nota 0.


II. Seria a vencedora se ele obtivesse nota 10.
III. Permaneceria na terceira posição, independentemente da nota
obtida pelo aluno.

Assinale a alternativa CORRETA

a) I, apenas.
b) II, apenas.
c) III, apenas.
d) I e II, apenas.
e) Nenhuma das alternativas.

5. Um hospital seleciona 16 funcionários fumantes e promove um ciclo de


palestras com o objetivo de esclarecer os efeitos prejudiciais do cigarro
à saúde. Após essas palestras, foram coletados dados sobre a
quantidade de cigarros que cada um desses fumantes está consumindo
diariamente. Tais dados são expressos da seguinte maneira:

10; 1; 10; 11; 13; 10; 64; 13; 13; 12; 12; 11; 13; 11; 12; 12

Os dados 1 e 64 chamam a atenção por serem discrepantes, pois são


dados muito menores ou maiores que a maioria dos obtidos. Segundo
esta coleta de dados, pode-se afirmar que:

I. Se considerarmos os dados 1 e 64 o desvio padrão apresenta


valores próximos de sua média aritmética.
II. Se considerarmos os dados 1 e 64 na análise descritiva, o ideal é
que utilizar a mediana.
III. Devido ao fato da média sofrer influência de valores discrepantes
em seu cálculo, não podemos utilizar a média aritmética para
descrever estes dados.

Assinale a alternativa CORRETA.

a) I, apenas.
b) II, apenas.
c) III, apenas.
d) I e II, apenas.
e) I, II e III.

6. A tabela a seguir mostra a evolução da receita bruta anual nos três


últimos anos de cinco microempresas que se encontram à venda.

Período
Empresas
2013 2014 2015
Alfinetes V R$ 200 mil R$ 220 mil R$ 240 mil
Balas W R$ 200 mil R$ 230 mil R$ 200 mil
Chocolates X R$ 250 mil R$ 210 mil R$ 215 mil
Pizzaria Y R$ 230 mil R$ 230 mil R$ 230 mil
Tecelagem Z R$ 160 mil R$ 210 mil R$ 245 mil

Um investidor deseja comprar duas das empresas listadas na tabela. Para tal,
ele calcula a média aritmética da receita bruta anual dos últimos três anos e
escolhe as duas empresas de maior média anual.

As empresas que este investidor escolhe comprar:

a) Balas W e Pizzaria Y
b) Chocolates X e Tecelagem Z
c) Pizzaria Y e Alfinetes V
d) Pizzaria Y e Chocolates X
e) Tecelagem Z e Alfinetes V

7. A participação dos estudantes nas Olimpíadas Brasileiras de Matemática


das escolas públicas aumenta a cada ano. O quadro abaixo indica o
percentual de medalhistas de ouro, por região, nas edições da OBMEP
de 2005 a 2009.

Período
Região
2005 2006 2007 2008 2009
Norte 2% 2% 1% 2% 1%
Nordeste 18% 19% 21% 15% 19%
Centro Oeste 5% 6% 7% 8% 9%
Sudeste 55% 61% 58% 66% 60%
Sul 21% 12% 13% 9% 11%

Em reparação às edições de 2005 a 2009, qual o percentual médio de


medalhistas de ouro da região nordeste?

a) 14,6%
b) 18,2%
c) 18,4%
d) 19,0%
e) 21,0%
Preocupada com a sua locadora, Marla aplicou uma pesquisa com um grupo de 200 clientes
escolhidos de forma aleatória, sobre a quantidade de filmes que estes locaram no primeiro
semestre de 2011. Os dados coletados estão apresentados na tabela a seguir:

Número de filmes alugados

Número de Frequênci
filmes a

0 25

1 30

2 55

3 90

Total 200

A média, a moda e a mediana destes dados são, respectivamente, os seguintes:

a) 2,05; 3; 2

b) 1,5; 2; 3

c) 1,5; 3; 3

d) 1,5; 3; 2
e) 2,05; 2; 3

1. Os dados abaixo se referem a uma pesquisa com homens sedentários. Assinale a


opção em que reflete de forma correta a média amostral da concentração de colesterol
deste grupo de pessoas.

► Identidade Glicose Colesterol Triglicerídeo


Idade
► 1 85 mg/dL 168 mg/dL 149 mg/dL
20
► 2 94 mg/dL 191 mg/dL 72 mg/dL
25
► 3 80 mg/dL 130 mg/dL 66 mg/dL
20
► 4 78 mg/dL 165 mg/dL 44 mg/dL
31
► 5 91 mg/dL 178 mg/dL 37 mg/dL
28
► 6 85 mg/dL 172 mg/dL 43 mg/dL
28
Média
a) 167,3 mg/dL
b) 167,4 mg/dL
c) 68,5 mg/dL
d) 85,5 mg/dL
e) 172 mg/dL

2. Compreende a Estatística Descritiva:

a) Reunir um conjunto de técnicas para sumarizar os dados (tabelas, gráficos) e medidas


descritivas que permitem tirar muitas informações contidas nos dados.
b) Produzir afirmações sobre uma dada característica da população, na qual estamos
interessados, a partir de informações colhidas de uma parte dessa população.
c) Elaborar questionários que serão aplicados à amostras
d) Descrever o método estatístico
e) Descrever o planejamento da pesquisa

Você também pode gostar