Você está na página 1de 36

Universidade Estadual do Maranhão - UEMA

Disciplina – Estatística Aplicada à Educação


Prof: Cristovam Dervalmar Rodrigues Teixeira Filho

1.0 Introdução a Estatística.

1.1 Campos de Aplicação.

A utilização da Estatística é cada vez mais acentuada


em qualquer atividade profissional da vida moderna. Nos
seus mais diversificados ramos de atuação, as pessoas estão
freqüentemente expostas a estatística, utilizando-a com
maior ou menor intensidade.
A Estatística encontra aplicações em quase todos os
campos da atividade humana.
O Estado e a Sociologia têm necessidade de conhecer
as populações por seus efetivos, por sexo, idade, estado
civil, profissão, nacionalidade etc. O nível cultural de um
povo pode ser indicado pela proporção dos que sabem ler e
escrever, em relação ao total de habitantes e pelo número de
alunos das escolas. As tábuas de mortalidade, confrontadas
de tempos em tempos, ou com as de outros países, permitem
avaliar a evolução do grau de sanidade Física. Os serviços
de meteorologia, tão importantes para a navegação aérea e
marítima, são essencialmente estatísticos, com seus estudos
de temperaturas, pressões, quedas de chuva, umidades,
ventos etc. Na agricultura, a Estatística serve como
orientador seguro, fornecendo informações sobre colheitas,
rendimento das terras, valores da produção e outros. Na
indústria e no comércio podem-se comparar produções e
volumes de vendas em relação ao total por região, estudar a
situação dos mercados e suas tendências.
Grandes serviços a Estatística prestam à Biologia,
desde o "homem médio" de Quetelet, passando pela teoria
da hereditariedade de Mendel, até as infinitas aplicações de
hoje. A Geografia conclui através de estudos estatísticos as
densidades demográficas, correntes migratórias, climas etc.
Na Informática também encontramos importantes
aplicações, entre elas:
Avaliação de desempenho de redes de computadores, assim
como aplicações em redes neurais artificiais e mineração de
dados, na Inteligência Artificial.
Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada
a Educação - UEMA
É possível distinguir duas concepções para palavra
Estatística:

a) No plural (estatísticas), indica qualquer coleção


consistente de dados numéricos, reunidos com
finalidade de fornecer informações acerca de uma
atividade qualquer. Assim, por exemplo, as
estatísticas demográficas referem-se aos dados
numéricos sobre nascimentos, falecimentos,
matrimônios, desquites etc. As estatísticas
econômicas consistem em dados numéricos
relacionados com emprego, produção, preços,
vendas e com outras atividades ligadas aos vários
setores da vida econômica.

b) No singular, indica a atividade humana


especializada ou um corpo de técnicas, ou ainda
uma metodologia desenvolvida para a coleta, a
classificação, a apresentação, a análise e a
interpretação de dados quantitativos e a utilização
desses dados para a tomada de decisões.

1.2 Um pouco de História.

A origem da palavra Estatística esta associada à palavra latina


“Status”Há indícios de que em 3000 a.C, já se faziam censo na
Babilônia, china e Egito e até mesmo no velho testamento, encontra-
se referência a uma instrução dada a Moisés para fazer um
levantamento de homens de Israel que estivessem aptos para a
guerrear.
Usualmente estas informações eram utilizadas para a taxação

de impostos ou para o alistamento militar.

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
A história da Estatística é dividida em três
períodos:

1º- Período ou de Preparação dos fatos. (vai do regime feudal até meados
do século XVII);

2º- Período ou de Preparação das teorias. (meados do século XVII até


início do século XIX);

3º- Período ou do Aperfeiçoamento. (iniciou em 1853 com a Reunião do


Primeiro Congresso de Estatística).

1.3 O Crescimento e Desenvolvimento da Estatística


Moderna.

Podem ser relacionados a três fenômenos isolados:

- Necessidade do Governo de coletar dados sobre


as cidades;
- O desenvolvimento da teoria da Probabilidade;
- E o andamento da informática.

1.4 O Raciocínio Estatístico e o Gerenciamento


Moderno.

Na última década, com a globalização da economia, cresceu


o foco na qualidade de produtos e serviços. De fato, mais do que a
participação de qualquer outro indivíduo, foi o trabalho de um
estatístico, Edwards Deming, que levou esta mudança às empresas.

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
Raciocínio Estatístico – Pode ser definido como os
processos voltados para o entendimento, o gerenciamento e a
redução de variações.

1.5 Por que os gerentes precisam conhecer Estatística:

“Raciocinar estatisticamente será um dia tão


necessário quanto a habilidade de ler e escrever” (H.
G. Wells)

a) Os gerentes precisam saber como apresentar e


descrever informações de forma adequada;
b) Os gerentes precisam saber como tirar conclusões a
partir de grandes populações com base somente na
informação obtida de amostras;
c) Os gerentes precisam saber como melhorar processos;
d) Os gerentes precisam saber como obter previsões
confiáveis a partir de variáveis de interesse.

1.6 Divisão da Estatística.

▪ Estatística Descritiva;
▪ Estatística Indutiva ou Inferência Estatística;

1.6.1 Estatística Descritiva;


Pode ser interpretada como uma função cujo objetivo é a
observação de fenômenos de mesma natureza, a coleta de dados
numéricos referentes a esses fenômenos, a organização e classificação
desses dados observados e a sua apresentação através de gráficos e
tabelas, além do cálculo de coeficientes (estatísticas)que permitem
descrever resumidamente os fenômenos.

1.6.1 Estatística Indutiva ou Inferência Estatística;


Pode ser definida como os métodos que tornam possível a
estimativa de uma característica de uma população ou tomada de uma
decisão referente á população com base somente em resultados de
amostras, ou seja, a inferência estatística refere-se a um processo de
generalização a partir de resultados particulares.

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
1.7 Fases do Método Estatístico (Estatística
Descritiva);

- Definição do Problema;
- Planejamento;
- Coleta de Dados;
- Apuração dos dados;
- Apresentação dos Dados;

- Análise e Interpretação de Dados.

2 - DISTRIBUIÇÃO DE FREQUÊNCIA.
É o tipo de tabela mais importante para a Estatística
Descritiva.

2.1 - DADOS.
Podem ser entendidos como a informação numérica
necessária para nos ajudar a tomar decisões mais bem fundamentadas em
determinada situação.

2.1.1 – DADOS BRUTOS.


Após a coleta, os dados originais ainda não se
encontram pronto para análise, por não estarem organizados em ordem
numérica crescente ou decrescente.

2.2 – TABELAS DE MEDIÇÂO


Um estatístico da área de pesquisas muito
provavelmente desejará desenvolver um instrumento que faça diversas
perguntas e lide com uma variedade de fenômenos ou características.
Estes fenômenos ou características são chamadas variáveis aleatórias. Os
dados que são o produto observado destas variáveis aleatórias, podem
divergir de resposta para resposta.

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
2.2.1 - TIPOS DE DADOS.
Variáveis aleatórias categorizadas: produzem
respostas
categorizadas.
Exemplo: Como você classificaria o seu curso de estatística:
( ) ótimo, ( ) bom, ( ) regular, ( ) péssimo.
Variáveis aleatórias numéricas: Produzem respostas
numéricas. Exemplo: Qual a sua idade? ____________
Dados Discretos: São respostas numéricas que
surgem a partir de um processo de contagem.
Dados contínuos: São respostas numéricas que
surgem a partir de um processo de medição.

2.2.2 - TIPOS DE TABELAS DE MEDIÇÃO

Poderíamos também descrever nossos dados


resultantes de acordo com o nível de medição alcançado. Em sentido
mais amplo, todos os dados coletados são "medidos" de alguma maneira.
Os quatro níveis de medição são: do mais fraco ao mais forte; as escalas
nominal, ordinal, de intervalo e de proporcionalidade.

a) ESCALA NOMINAL E ORDINAL


Dados obtidos a partir de uma variável
categorizada são interpretados como tendo sido medidos numa escala
nominal ou numa escala ordinal. Se os dados observados são meramente
classificados em várias categorias distintas, nas quais nenhum
ordenamento está implícito, é alcançado um nível nominal de medição.
Por outro lado, se os dados observados forem classificados em categorias
distintas, nas quais o ordenamento está implícito, atingi-se um nível
ordinal de medição.

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
Exemplos de escala nominal
Variável Categorizada Categorias
Propriedade de automóvel Sim ------------ Não
Tipo de seg. de vida que possui Prazo limitado Por dote--- Toda
a
vida ---outro--- nenhum
Filiação a partido político PT ---PDT ---PFL---PSB---PSDB

Exemplos de escala ordinal

Variável categorizada Categorias ordenadas


(Mais baixo---------Mais alto)
Denominação de classe de Calouro, Secundarista, Terceiranista,
estudantes
Quartanista
Satisfação do produto Muito insatisfeito, relativamente
insatisfeito, neutro, relativamente
satisfeito, muito satisfeito
Titulo na UEMA Auxiliar, Assistente, Adjunto,
Titular

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
b) ESCALAS DE INTERVALO E PROPORCIONALIDADE:
Uma escala de intervalo é uma escala ordenada em
que a diferença entre as medições é uma quantidade significativa.
Admite-se que em geral os dados obtidos a partir de variáveis numéricas
foram medidos em uma escala de intervalo ou em uma escala de
proporcionalidade. Estas escalas constituem o nível mais alto de
medição. Elas são formas mais eficazes de medição do que uma escala
ordinal, porque podemos distinguir não só qual é o maior valor
observado como também quão maior é ele.

Exemplos de escala de intervalo e de proporcionalidade

Variável Numérica Nível de medição


Temperatura Intervalo
Calendário Intervalo
Altura Proporcionalidade
Peso Proporcionalidade
IIdade proporcionalidade

2.3 - ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA.

2.3.1 – POPULAÇÃO (N)

É um conjunto de indivíduos ou objetos que


apresentam pelo menos uma característica em comum. Pode ser finita ou
infinita.

2.3.2 – AMOSTRA. (n)


Considerando a impossibilidade, na maioria das
vezes, do tratamento de todos os elementos da população, retira-se uma
amostra em conformidade com alguma técnica de amostragem.

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
2.3.3 - VARIÁVEL DISCRETA E VARIÁVEL CONTÍNUA.
A variável é discreta quando assume valores em
pontos da reta real. EXEMPLO: Número de erros em um livro:
0,1,2,3,4,5,...
A variável é contínua quando pode assumir
teoricamente qualquer valor em certo intervalo da reta real. EXEMPLO:
Peso de alunos, pois teoricamente, um indivíduo poderá ter 50,5 Kg;
50,572 Kg; 50,585 Kg;
2.3.4 – FREQUÊNCIA SIMPLES. ( f i )
É o número de observações correspondentes a
um intervalo de classes ou a um valor individual.

2.3.5 – AMPLITUDE TOTAL OU “RANGER” At = Amax − Amin


A amplitude total ou intervalo total é diferença
entre o maior e o menor valor observado da variável em estudo.

2.3.6 – NÚMERO DE CLASSES (K).


Não há fórmula exata para o cálculo do número
de classes.
a) K=5 para n  25 e K  n , para n maior que
25
Obs: O nº de classes é um número inteiro.

Exemplo: Se K=6,5 deve-se arredondar para 6


ou 7

Outra maneira para calcular o nº de classes

b) Fórmula de STURGES K  1 + 3,22 log n,


em que n = Tamanho da amostra.

c) Fórmula de ANSELMO RAPOSO

(1 + 3,22 log n)
K= + ln n
2
OBS: ln é o logarítimo natural e o log é o logarítimo decimal

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
2.3.7 – AMPLITUDE DAS CLASSES (h).

At
h =
K

2.3.8 – LIMITES DE CLASSES.


São números extremos de cada classe. Há um
limite inferior ou mínimo e um limite superior.

EXEMPLO: Tabela de taxa escolar

Limite superior da 1ª
Limite classe
Classes
inferior da 1ª
classe 39.00 |— 45.89

45.89 |— 52.78

52.78 |— 59.67
Este símbolo significa que o
59.67 |— 66.56 intervalo é fechado no limite
inferior e aberto no limite
66.56 |— 73.44 superior. Ou seja, neste
intervalo temos todos os
elementos que iniciam com o
nº 39 e terminam em 45,89
excluindo o mesmo.

Nesta tabela
temos 5 classes

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
2.3.9 – PONTO MÉDIO DE CLASSE. (x i )
É a média entre o limite superior e o inferior da
classe.

li + ls
xi =
2

2.4 – TIPOS DE FREQUÊNCIA.

2.4.1 – FREQUÊNCIA SIMPLES ABSOLUTA f j ( )


k

f i =1
i =n

2.4.2 – FREQUÊNCIA SIMPLES RELATIVA frj ( )


Representa a proporção de observações
de um valor individual ou de uma classe, em relação ao número
total de obervações.

fi fi
Fr i = k
Fr i =
 fi
i =1
Ou n

OBS 1: Desejando-se expressar o resultado em termos


percentuais, multiplica-se o quociente por 100.
OBS 2: A soma das freqüências simples relativas de uma tabela
de freqüências é sempre igual a 1,00 ou 100%.

 Fr
i =1
i = 1,00

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
2.4.3 – FREQUÊNCIA ACUMULADAS “ ABAIXO DE “
(F j ) ou (Frj ) 
Referem-se ao fato de que as
freqüências a serem acumuladas correspondem aos valores
menores ou anteriores ao valor ou à classe cuja a freqüência
acumulada se deseja obter, incluindo no cálculo a freqüência do
valor ou da classe.

3- MEDIDAS DE TENDÊNCIA CENTRAL.


É comumente usada para descrever
resumidamente uma distribuição de freqüência. Tais medidas
orientam-nos quanto à posição da distribuição no eixo x (dos
números reais ). São chamadas medidas de tendência central,
pois representam os fenômenos pelos seus valores médios, em
torno dos quais tendem a concentra-se os dados.

3.1- Média Aritmética

3.1.1- Média Aritmética Simples (dados não agrupados)


Seja x1, x2 ..., xn, portanto “n” valores da
variável X. A média aritmética simples de X representado por x
é definida por:

x i
x= i =1

n
Em que, n é o número de elementos do conjunto.

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
3.1.2-Média Aritmética Ponderada (Dados Agrupados).
Quando os dados estiverem agrupados
numa distribuição de freqüência usaremos a média aritmética dos
valores x1 , x2 , x3 ..., xn , ponderados pelas respectivas freqüências
absolutas; F1 , F2 , F3 ,..., Fn , Assim:

x i fi
x= i =1

n
Exemplo 2 : Na tabela abaixo calcule a média Aritmética:

Classes fi xi xi.fi
39 |— 45 7 42 294
45 |— 51 8 48 384
51 |— 57 6 54 324
57 |— 63 4 60 240
63 |— 69 5 66 330
TOTAL 30 1572

Logo pela fórmula da média para dados agrupados temos que:

1572
X = X = 52,4
30
3.2- MÉDIA GEOMÉTRICA.
3.2.1- MÉDIA GEOMÉTRICA SIMPLES. ( DADOS NÃO
AGRUPADOS)
Sejam os valores de uma série,
x1 , x2 , x3 ,..., xn , definimos a média geométrica simples como
sendo a raiz n-ésima do produto de n termos positivos, isto é:

G = n x1.x2. x3 ...xn

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
OBS:Um método mais rápido para cálculo da média geométrica
é se usarmos a logaritmação.

log x1 + log x2 + log x3 + ... + log xn E ao resultado


log G = aplicamos o
n antilogarítimico
,
n

 log x i
G = ant log i =1
n

3.2.2- MÉDIA GEOMÉTRICA PONDERADA.


a) Para uma distribuição de freqüências por valores.

 f .log x
i i
G = ant log i =1
n

Exemplo 4:Calcule a média geométrica da tabela a seguir:

Notas obtidas dos alunos da UEMA


Nº de
alunos
Notas ( xi ) ( f i ) log xi fi. log xi
2 13 0,3010 3,9134
4 12 0,6020 7,2247
6 10 0,7782 7,7820
8 18 0,9031 16,2556
10 25 1,0000 25,0000
 78 60,1757
Fonte: Secretaria Geral

Obs: aplica-se logarítimo para cada valor das notas.


Ex: log2=0,3010 e o resultado multiplica-se pela freqüência
simples no caso igual a 13 e assim sucessivamente para cada uma
das classes.

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
Calculando a Média aplicando a fórmula:

60,1757
G = ant log
78

G = ant log 0,7715

G = 100, 7715 G = 5,9086

3.3- MEDIANA E MODA.

3.3.1- MEDIANA. ( Md ) ou .x
A mediana é considerada uma separatriz,
pois divide a distribuição ou conjunto de dados em duas partes
iguais. O número que indica a ordem em que se encontra o valor
correspondente a mediana é denominado elemento mediano, cujo
símbolo é EMd .
Se n for um número ímpar, a mediana
coincide com o termo central da série, ou seja, com o termo de
n +1
ordem . Se n for par, a mediana será a média entre os
2
n n
elementos centrais de e +1 .
2 2
0 50% 100%

a) Para dados não agrupados: x


Exemplo 9: Seja X = (2;4;6;8;10) calcular a mediana:

Resposta: n é nº ímpar então coincide com o termo central da


série no caso é 6. Para isso é preciso que os dados estejam em
ordem.

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
Exemplo: Seja X = (1;4;5;6;9;10;11;14;16;20) calcular a
mediana: n é par então:

n 10
EMd = = = 5º elemento é nº 9
2 2

n 10
EMd = +1 = = 5 + 1 = 6º elemento é nº 10
2 2

Logo a Mediana é calculada pela média dos dois números:

~ 9 + 10
X= = 9,5
2
b) Mediana Para uma distribuição de freqüência por
valores. (variável discreta).
Em uma distribuição de freqüências por
valores a mediana é localizada utilizando-se o
posicionamento da mediana dentro da distribuição, através
da freqüência acumulada de ordem crescente.
Exemplo :

Notas obtidas dos alunos da UEMA


Nº de alunos
Notas ( xi ) ( fi ) f ac
0 5 5
2 8 13
4 12 25
6 10 35
8 18 53
10 25 78
 78
Fonte: Secretaria Geral

78
EMd = = 39º elemento logo a mediana é 8,
2
pois o trigésimo nono elemento está na 5ª classe

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
c) Para uma distribuição de freqüências por classes de valores.
(dados agrupados).
Cálculo da mediana – variável contínua.

n
1º Passo: Calcula-se ordem . Como a variável é
2
contínua não se preocupe se n é par ou ímpar.

2º Passo: Pela f ac identifica-se a classe que contém a


mediana (classe Md).
3º Passo: Utiliza-se a fórmula:

n 
 − f  .h
+ 
2
x = lMd
f Md

Em que
lMd = limite inferior da classe Md.
n = tamanho da amostra ou número de elementos.
 f = soma das freqüências anteriores à classe Md.
h = amplitude da classe Md.
f Md = freqüência simples da classe Md.

3.3.2- Moda ( M 0 ) ou  X  .
  

 
a) A moda, norma, valor normal, ou mais
freqüente. É por definição, o valor de xi da série que ocorre em
maior número de vezes, Isto é, cuja freqüência é máxima.
a) Para uma distribuição de dados brutos e por valores:
Exemplo 14: Seja X = (2;4;6;6;8;8;8;10), qual o valor da
moda:
^
X =8

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
Exemplo: Dada a distribuição de freqüência abaixo qual o
valor da moda:
Notas obtidas dos alunos da UEMA
Nº de alunos
Notas ( xi ) ( fi )
0 5
2 8
4 12
6 10
8 18
10 25
 78
Fonte: Secretaria Geral

A moda é igual a 10.

b) Para uma distribuição de freqüência por classes de


valores. (Dados agrupados).
1º passo é identificar a classe modal (aquela
que possuir maior freqüência). Em seguida aplicar
Fórmula.

Fórmula de CZUBER Fórmula de KING

1 f post
M o = lmo + .h M o = lmo + .h
1 +  2 f ant + f post
Onde:
l mo - Limite inferior da classe Modal;

f mo - Freqüência simples da classe modal;


f ant - Freqüência simples da classe anterior à classe moda;
f post - Freqüência simples da classe posterior à classe
modal;

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
h - Amplitude do intervalo de classe;
1 = f mo − f ant
 2 = f mo − f post
OBS: outra maneira de calcular a moda quando a distribuição
apresentar boa simetria em relação à média é:
Fórmula de PEARSON
M o = 3x − 2 x

4.0- QUARTIS, DECIS E PERCENTIS (MEDIDAS


SEPARATRIZES).
4.1- QUARTIS.
Divide um conjunto de dados em quatro partes iguais.

0% 25% 50% 75% 100%

Q1 Q2 Q3

Q1 = 1º quartil, deixa 25% dos elementos;


Q2 = 2º quartil, coincide com a mediana, deixa 50% dos
elementos;
Q3 = 3º quartil, deixa 75% dos elementos.
a) Cálculo do quartis para uma distribuição de dados brutos
ou freqüência por valores ( dados não agrupados).

i.n
PQi = Fórmula do Posicionamento do
Quartil de ordem i
4

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
Exemplo : Na tabela Abaixo calcule o 3º Quartil:
Notas dos alunos da UEMA
Nº de alunos
Notas ( xi ) ( fi ) f ac
0 5 5
2 8 13
4 12 25
6 10 35
8 18 53
10 25 78
 78
Fonte: Secretaria Geral

3 X 78
PQ3 = = 58,5  59º elemento está na ultima classe logo
4
Q3 = 10 ou seja 75% das notas dos alunos estão variando de 0 a
10.
b) Cálculo do quartil para uma distribuição de freqüências
por classes de valores ( dados Agrupados por intervalos de
classes).

- Determinação de Q1 , Q2eQ3
i.n
P
1º passo: Calcular Qi =
4
2º passo: Identifica a classe do quartil pela f ac
3º passo cálculo:

i.n
− f)
(
Qi = lQi + 4 .h
f Qi

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
4.2 DECIS.
Dividem um conjunto de dados em 10 partes iguais.

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

D1 D2 D3 D4 D5 D6 D7 D8 D9

a) Para distribuição de dados brutos ou de freqüência


por valores ( dados não agrupados).

Fórmula de posicionamento do Decil de


i.n
PDi = ordem i
10

b) Decil para uma distribuição de freqüências por classes de


valores (dados agrupados).
1º passo: calcula-se

i.n
PDi =
10

2º passo: identifica-se a classe Di pela f ac

3ºpasso: Cálculo do decil

 i.n 
 −  f  .h
Di = lDi +  
10
f Di

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
4.3- PERCENTIS.
Dividem um conjunto de dados em 100 partes
iguais.
0% 1% 2% 3% ... 50% ... 97% 98% 99% 100%

P1 P2 P3 P50 P97 P98 P99


a) Percentis para uma distribuição de dados ou freqüência
por valores ( dados não agrupados).

Fórmula de posicionamento do
i.n
PPi =
percentil de ordem i

100

b) Percentil para uma distribuição de freqüências por


classes de valor ( Dados agrupados).
1º passo: Calcula-se o posicionamento do percentil de
ordem i

X = 6,0250 i.n
PPi =
100

2º passo: Identifica-se a classe Pi pela f ac


3º passo: Calcula-se o percentil

 i.n 
 − f  .h
Pi = lPi +  
100
f Pi

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
4.0 Medidas de Dispersão

4.1- VARIÂNCIA.
É a mais usada entre as medidas absolutas
de dispersão ou variabilidade. Sendo que 2 a variância
2
populacional e S a variância amostral.
a) Para uma distribuição de dados brutos

( x − X ) (x − X )
n 2 n 2
i e i
2 = i =1
S2 = i =1
N n −1

b) Para uma tabela distribuição de freqüência

( x − X ) (x − X )
n 2 n 2
e
i . fi i . fi
2 = i =1
S2 = i =1
N n −1

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
EXEMPLO: Dada a tabela a seguir calcule a variância
populacional.
Notas obtidas dos alunos da UEMA
Nº de
( ) ( )
2 2
alunos
Notas xi f i
xi − X xi − X . fi
0,00 5,00 44,1029 220,5144
2,00 8,00 21,5389 172,3110
4,00 12,00 6,9749 83,6986
6,00 10,00 0,4109 4,1088
8,00 18,00 1,8469 33,2439
10,00 25,00 11,2829 282,0720
 78,00 795,9487
Fonte: Secretaria Geral

795,9487
S2 = = 10,3369 pontos2
78 − 1
4.2- DESVIO-PADRÃO OU QUADRADO MÉDIO.
É a medida de dispersão mais usada, tendo
em comum com o desvio médio o fato de ambos serem
considerados os desvios com relação a média. Para se calcular o
desvio-padrão deve-se primeiramente determinar o valor da
variância e em seguida, extrair a raiz quadrada desse resultado,
assim:

 = 2 Desvio-padrão populacional

S = S2 Desvio-padrão amostral

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
4.3- COEFICIENTE DE VARIAÇÃO
Trata-se de uma medida relativa de
dispersão útil para a comparação em termos relativos do grau de
concentração em torno da média de séries distintas. É dado por:

 S
CV = 100 CV = 100
e

X x

Obs: Análise do coeficiente de variação:


- Baixa dispersão: CV  15%
- Média dispersão: 15%  CV  30%
- Alta dispersão: CV  30%

EXEMPLO 1: Suponhamos que uma firma que ofereça serviços de


consultoria para alunos de segundo grau em todo o território do Brasil
tenha contratado uma analista para comparar as taxas escolares cobradas
por faculdades e universidades em diferentes regiões do País. Os dados
abaixo apresentam as taxas escolares de 60 Faculdades e Universidades
em dólares.

Montar os dados numa tabela de distribuição de freqüência e calcular as


medidas de tendência central, separatrizes, dispersão e fazer o
histograma.
Dados brutos das taxas escolares
7,2 - 4,9 - 10,7 - 10,4 - 6,4 - 4,8 - 4,7 - 4,6 - 6,0 - 5,4 - 4,8 4,7 – 8,3 - 3,8 – 4,8
– 8,3 – 6,4 – 6,6 – 4,5 – 8,0 3,6 – 2,4 – 8,5 – 8,8 – 7,7 – 4,9 – 8,6 – 12,0 4,9
7,0 – 11,0 – 4,9 – 3,9 – 4,9 –4,4 – 4,9 – 4,9 – 8,0 3,6 – 7,4 – 7,9 – 4,9 – 5,8 –
39 – 11,6 –10,3 – 3,4 3,9 – 5,0 – 3,9 – 8,0 – 3,5 - 4,9 - 5,8 - 4,1 - 3,9 3,5 - 4,8
- 5,9 - 3,6.
Fonte: Dados extraídos da Associação Nacional das Mantenedoras.

É necessário colocar os dados em ordem. Para isso vamos colocá-los


num diagrama ramo e folha

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
DISPOSIÇÃO RAMO E FOLHA.
Uma disposição ramo-e-folha separa as entradas de
dados em dígitos leading ou ramos e dígitos trailing folhas. A coluna de
números à esquerda da linha vertical é chamada de ramo. Estes números
correspondem aos dígitos ramo dos dados. Em cada linha, as folhas se
ramificam para a direita da linha vertical e estas entradas correspondem
aos dígitos folha.
EXEMPLO 1:
2 4

3 869694995956

4 9876878599994999918

5 48089

6 4046

7 27049

8 33058600

10 743

11 06

12 0

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
A disposição ramo-e-folha revisada: colocar as folhas em

ordem crescente.

2 4

3 455666899999

4 1456778888999999999

5 04889

6 0446

7 02479

8 00033568

09

10 347

11 06

12 0

– ROL (DISPOSIÇÃO ORDENADA).


Quando colocamos os dados em ordem de
classificação, da menor para a maior observação, a seqüência é chamada
de disposição ordenada. Quando os dados estão classificados em uma
disposição ordenada, nossa avaliação dos seus principais aspectos fica
facilitada. Torna-se mais fácil detectar os extremos, os valores típicos e
as concentrações de valores.

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
EXEMPLO 1:

Disposição Ordenada I

2,4 – 3,4 – 3,5 – 3,5 – 3,6 – 3,6 – 3,6 – 3,8 – 3,9 – 3,9 – 3,9 – 3,9 – 3,9 –
4,1 - 4,4 - 4,5 – 4,6 – 4,7 – 4,7 – 4,8 – 4,8 – 4,8 – 4,8 – 4,9 – 4,9 – 4,9 –
4,9 – 4,9 4,9 – 4,9 – 4,9 - 4,9 – 5,0 – 5,4 – 5,8 – 5,8 – 5,9 – 6,0 – 6,4 –
6,4 – 6,6 – 7,0 - 7,2 – 7,4 – 7,7 – 7,9 – 8,0 –8,0 – 8,0 – 8,3 – 8,3 – 8,5 -
8,6 - 8,8 - 10,3 - 10,4 10,7 - 11,0 - 11,6 - 12,0

Montagem da tabela

Calcular:
a) A amplitude total

At = 12 − 2,4 = 9,6dolares

b) O nº de classes

K = 1 + 3,22 log 60 = 6,7256  7classes

c) A amplitude de classes

9,6
h= = 1,3714 = 1,5
7

d) O Limite das classes: Para montagem da tabela Inicia-se com o menor


nº da distribuição e adiciona-se o valor da amplitude de classes.

Classes
2.40 |— 3.90
3.90 |— 5.40
5.40 |— 6.90
6.90 |— 8.40
8.40 |— 9.90
9.90 |— 11.40
11.40 |— 12.90

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
e) Freqüência Simples ( f i ): Utiliza-se a disposição ordenada para
realização da contagem, ou seja, verificam-se quantos elementos têm
entre 2,4 até 3,9. No caso são oito faculdades que praticam taxas neste
intervalo.

Classes fi
2.40 |— 3.90 8
3.90 |— 5.40 25
5.40 |— 6.90 8
6.90 |— 8.40 10
8.40 |— 9.90 3
9.90 |— 11.40 4
11.40 |— 12.90 2
TOTAL 60

f) Ponto médio (xi): Soma o limite inferior e superior de cada classe


dividido por dois. O ponto médio representa cada intervalo de classe.

Classes fi xi
2.40 |— 3.90 8 3.15
3.90 |— 5.40 25 4.65
5.40 |— 6.90 8 6.15
6.90 |— 8.40 10 7.65
Significa que temos 33
8.40 |— 9.90 3 9.15
faculdades que praticam
9.90 |— 11.40 4 10.65 taxas a partir de 2,4 até
11.40 |— 12.90 2 12.15 5,4 dólares
TOTAL 60

g) Freqüência acumulada (fac)

Classes fi xi fac
2.40 |— 3.90 8 3.15 8
3.90 |— 5.40 25 4.65 33
5.40 |— 6.90 8 6.15 41
6.90 |— 8.40 10 7.65 51
8.40 |— 9.90 3 9.15 4
9.90 |— 11.40 4 10.65 58
11.40 |— 12.90 2 12.15 60
TOTAL 60

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
h) Freqüência relativa em porcentagem (Fr%)

Classes fi xi fac Fr%


2.40 |— 3.90 8 3.15 8 13.33%
3.90 |— 5.40 25 4.65 33 41.67%
5.40 |— 6.90 8 6.15 41 13.33%
6.90 |— 8.40 10 7.65 51 16.67%
8.40 |— 9.90 3 9.15 4 5.00%
9.90 |— 11.40 4 10.65 58 6.67%
11.40 |— 12.90 2 12.15 60 3.33%
TOTAL 60 100.00%

i)Freqüência relativa em porcentagem acumulada ( Frac % )

Classes fi xi fac Fr% Frac%


2.40 |— 3.90 8 3.15 8 13.33% 13.33%
3.90 |— 5.40 25 4.65 33 41.67% 55.00%
5.40 |— 6.90 8 6.15 41 13.33% 68.33%
6.90 |— 8.40 10 7.65 51 16.67% 85.00%
8.40 |— 9.90 3 9.15 4 5.00% 90.00%
9.90 |— 11.40 4 10.65 58 6.67% 96.67%
11.40 |— 12.90 2 11.15 60 3.33% 100.00%
TOTAL 60 100.00%

j) Média aritmética X
Classes fi xi xi.fi
2.40 |— 3.90 8 3.15 25.2
3.90 |— 5.40 25 4.65 116.25
5.40 |— 6.90 8 6.15 49.2
6.90 |— 8.40 10 7.65 76.5
8.40 |— 9.90 3 9.15 27.45
9.90 |— 11.40 4 10.65 42.6
11.40 |— 12.90 2 12.15 24.3
TOTAL 60 361.5

361,5
X = = 6,0250dolares
60

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
l) Média Geométrica (G)

Classes fi xi logxi fi.logxi


2.40 |— 3.90 8 3.15 0.4983 3.98648
3.90 |— 5.40 25 4.65 0.6675 16.6863
5.40 |— 6.90 8 6.15 0.7889 6.311
6.90 |— 8.40 10 7.65 0.8837 8.83661
8.40 |— 9.90 3 9.15 0.9614 2.88426
9.90 |— 11.40 4 10.65 1.0273 4.1094
11.40 |— 12.90 2 12.15 1.0846 2.16915
TOTAL 60 44.9832

44,9832
G = ant log = ant log 0,7497 = 100, 7497 = 5,6198
60

~
m) Mediana X
Classes fi fac
2.40 |— 3.90 8 8
3.90 |— 5.40 25 33
5.40 |— 6.90 8 41
6.90 |— 8.40 10 51
8.40 |— 9.90 3 4
9.90 |— 11.40 4 58
11.40 |— 12.90 2 60
TOTAL 60

60
EMd = = 30º elemento a mediana está na 2ª classe.
2
~ (30 − 8)
X = 3,9 + .1,5 = 5,22dolares.Este valor corta a distribuição em
25
duas partes iguais
0 50%% 100%

2,4 x =5,22 12,9

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
^
n) Moda X
Classes fi
2.40 |— 3.90 8
3.90 |— 5.40 25
5.40 |— 6.90 8
6.90 |— 8.40 10
8.40 |— 9.90 3
9.90 |— 11.40 4
11.40 |— 12.90 2
TOTAL 60

A maior freqüência é a da 2ª classe. Utilizando a fórmula de KING


temos que:

^ 8
X = 3,9 + .1,5 = 4,65dolares
(8 + 8)

o) Quartis

Classes fi fac
2.40 |— 3.90 8 8
3.90 |— 5.40 25 33
5.40 |— 6.90 8 41
6.90 |— 8.40 10 51
8.40 |— 9.90 3 4
9.90 |— 11.40 4 58
11.40 |— 12.90 2 60
TOTAL 60

Cálculo de Q1

1.60
PQ1 = = 15º elemento Está na 2ª classe
4

(15 − 8)
Q1 = 3,9 + .1,5 = 4,32 Significa que 25% das faculdades amostradas
25
praticam taxas entre 2,4 e 4,32 dólares.

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
Atividade: Calcule o valor de Q2 eQ3

p) Variância S2
Classes fi xi (xi-X)² (xi-X)².fi
2.40 |— 3.90 8 3.15 8.2656 66.1250
3.90 |— 5.40 25 4.65 1.8906 47.2656
5.40 |— 6.90 8 6.15 0.0156 0.1250
6.90 |— 8.40 10 7.65 2.6406 26.4063
8.40 |— 9.90 3 9.15 9.7656 29.2969
9.90 |— 11.40 4 10.65 21.391 85.5625
11.40 |— 12.90 2 12.15 37.516 75.0313
TOTAL 60 329.8125

Deve-se 1º calcular o valor da média aritmética (Neste caso foi 6,0250).


Depois subtrair cada valor de xi da mesma e elevar ao quadrado. Em
seguida multiplicar pela frequência simples da classe e assim
sucessivamente as demais classes. Exemplo:

(3,15-6,0250) ² = 8,2656 X 8 =66,1250

329,8125
S2 = = 5,59dolares2
60 − 1

q) Desvio Padrão S

S = 5,59 = 2,3643dolares Ou seja, cada valor da distribuição


está desviando em torno da média aritmética 2,3643 dólares em média da
média aritmética

r) Covariância ou coeficiente de Variação CV

2,3643
CV = X 100% = 39,2419% Significa que temos alta dispersão dos
6,0250
dados em torno da média aritmética

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
Apresentação Gráfica para dados numéricos

Este gráfico foi feito


no programa
BIOSTAT vs 3.0

Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada


a Educação - UEMA
Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada
a Educação - UEMA
Preparado pelo professor Cristovam Filho. Disciplina: Estatística Aplicada
a Educação - UEMA

Você também pode gostar