Você está na página 1de 52

CURSO DE CIÊNCIAS DE EDUCAÇÃO - HISTÓRIA

Estatística Aplicada à Educação


ESTATÍSTICA APLICADA
TEMA I – ESTATÍSTICA DESCRITIVA
CLASSIFICAÇÃO DOS DADOS SEGUNDO A ESCALA
DISTRIBUIÇÕES DE FREQUENCIA
MEDIDAS ESTATISTICAS
REPRESENTAÇÃO GRAFICA
Classificação dos Dados
Os dados contidos numa amostra podem ser classificados em
Qualitativos ou Quantitativos, segundo sejam expressos num
dos seguintes quatro tipos :
I- DADOS QUALITATIVOS
1. DADOS NOMINAIS
2. DADOS ORDINAIS

II – DADOS QUANTITATIVOS
1. DADOS DISCRETOS
2. DADOS CONTÍNUOS
UNIVERSIDADE KATYAVALA BWILA
INSTITUTO SUPERIOR DE CIÊNCIAS DA EDUCAÇÃO

Variáveis podem ser


POPULAÇÃO
“Eu queria escrever-te uma carta... Mas ah meu
amor, eu não sei compreender por que é, por que é,
por que é, meu bem que tu não sabes ler e eu - Oh!
Desespero - não sei escrever também! “

Carta de um contratado
António Jacinto
(Poemas, 1961)
ESTATISTICA DESCRITIVA
DISTRIBUIÇÕES DE FREQUÊNCIA
Distribuição para Dados Qualitativos

As formas mais comuns de descrever amostras uni variadas com


dados qualitativos é o recurso a tabelas de frequências,
diagramas de barras ou a diagramas circulares. O objectivo é o
de representar a forma como os dados se distribuem por um
conjunto de diferentes categorias
Exemplo:

Numa amostra constituída por 120 livros de literatura francesa armazenados


na biblioteca do ISCED, constatou-se que, 100 não tinham qualquer defeito,
15 tinham defeitos recuperáveis e 5 tinham defeitos irrecuperáveis.

Categorias dos livros Frequência absoluta Frequência relativa


Sem defeito 100 0.833
Recuperáveis 15 0.125
Irrecuperáveis 5 0.042
Total 120 1.000

Distribuição de frequências, distribuição empírica ou distribuição de dados


amostrais
Definições
DefiniçõesPrincipais
principais()

(1) - Frequência Absoluta (Fi): É o número de


dados contidos numa determinada categoria.
(2) - Frequência Relativa (fi): É o quociente entre
a frequência absoluta da categoria e o total de
dados na amostra
(3) - Dimensão da Amostra (n): É o total de dados
contidos na amostra. É de notar que k
k
Fi
(A) n   Fi , (B) f i 
i 1 n
e (C) 
i 1
f i 1
Definições Principais

(4) - Dados Brutos = Dados inicialmente


recolhidos que ainda não sofreram nenhuma
organização sistemática
2 0 3 4 1 4 5 1 2 3 0 3 2 4 4 5 3 4 2 3

(5) - Rol = Qualquer arranjo de dados brutos


feita por ordem crescente ou decrescente
0 0 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5
ou
5 5 4 4 4 4 4 3 3 3 3 3 2 2 2 2 1 1 0 0
Diagrama de Barras

0,90
0,83

0,80

0,70

0,60

0,50

0,40 Série1

0,30

0,20
0,13
0,10
0,04

0,00
Sem Defeito Recuperaveis Irrecuperaveis
Diagrama Circular

0,04

0,13

Sem Defeito
Recuperaveis
Irrecuperaveis

0,83
Distribuição para Dados Quantitativos

As formas utilizadas para descrever amostras uni


variadas constituídas por dados quantitativos
podem ser classificadas em três grupos:
(1) - Representação tabular ou gráfica de dados
(2) - Estatísticas
(3) - Representação gráfica de estatísticas
Notar que devemos ter em conta a natureza dos
dados ( discretos ou contínuos)
Mais Definições

1- Variável: refere a característica que se pretende estudar ou


observar e que pode tomar valores diferentes

2- Amplitude ou Dimensão dos dados: É a diferença entre o


maior valor observado e o menor valor observado nos dados

No exemplo anterior a variável é “número de filhos” que é


quantitativa discreta. A amplitude dos dados é 5-0=5.
Quando os dados são discretos e o número de
observações é pequeno optamos por uma Distribuição
Simples
Exemplo:
Os seguintes dados representam o número de filhos de
20 casais da cidade do lobito
2 0 3 4 1 4 5 1 2 3 0 3 2 4 4 5 3 4 2 3
n =20 (tamanho ou dimensão da amostra)
A variável “número de filhos” é discreta. Podemos
considerar as categorias segundo o número de filhos
que o casal tem, ou seja
xi Fi fi Fiac fiac
0 2 0,10 2 0,10
1 2 0,10 4 0,20
2 4 0,20 8 0,40
3 5 0,25 13 0,65
4 5 0,25 18 0,90
5 2 0,10 20 1,00
20 1,00
Xi – categoria i (número de filhos)
Fi – frequência absoluta da categoria ou classe i (número de
famílias com exactamente Xi filhos)
fi – frequência relativa da categoria i (proporção de famílias
com Xi filhos)
Fiac – frequência absoluta acumulada (número de famílias
com até Xi filhos)
fiac – frequência relativa acumulada (proporção de famílias
com até Xi filhos)
Algumas questões importantes:
(1) Quantas famílias têm 2 filhos?

Número de filhos Número de famílias

xi Fi fi Fiac fiac
0 2 0,10 2 0,10
1 2 0,10 4 0,20
2 4 0,20 8 0,40
3 5 0,25 13 0,65
4 5 0,25 18 0,90
5 2 0,10 20 1,00
20 1,00
(2 ) Quantas famílias têm até 3 filhos?
Número de filhos Número de famílias

xi Fi fi Fiac fiac
0 2 0,10 2 0,10
1 2 0,10 4 0,20
2 4 0,20 8 0,40
3 5 0,25 13 0,65
4 5 0,25 18 0,90
5 2 0,10 20 1,00
20 1,00

(0)2 + (1)2 + (2)4 + (3)5=13 famílias


(3) Quantas famílias têm 2 ou 3 filhos?

Número de filhos Número de famílias

xi Fi fi Fiac fiac
0 2 0,10 2 0,10
1 2 0,10 4 0,20
2 4 0,20 8 0,40
3 5 0,25 13 0,65
4 5 0,25 18 0,90
5 2 0,10 20 1,00
20 1,00

(2)4 + (3)5 = 9 famílias


(4) Que proporção de famílias tem 4 filhos?

Número de filhos Proporção de famílias

xi Fi fi Fiac fiac
0 2 0,10 2 0,10
1 2 0,10 4 0,20
2 4 0,20 8 0,40
3 5 0,25 13 0,65
4 5 0,25 18 0,90
5 2 0,10 20 1,00
20 1,00
(5) Que percentagem de famílias tem até 2 filhos?
Número de filhos Proporção acumulada de famílias

xi Fi fi Fiac fiac
0 2 0,10 2 0,10
1 2 0,10 4 0,20
2 4 0,20 8 0,40
3 5 0,25 13 0,65
4 5 0,25 18 0,90
5 2 0,10 20 1,00
20 1,00

0,40x100% = 40%
(6) Se a população em estudo tem 5000 famílias,
quantas devem ter entre 1 e 2 filhos?
xi Fi fi Fiac fiac
0 2 0,10 2 0,10
1 2 0,10 4 0,20
2 4 0,20 8 0,40
3 5 0,25 13 0,65
4 5 0,25 18 0,90
5 2 0,10 20 1,00
20 1,00

Proporção de famílias com entre 1 e 2 filhos = 0,10 + 0,20 = 0,30

0,30x5000 = 1500 famílias


AULA - 03
0,45

0,40

0,35

0,30

0,25
Série1
0,20

0,15

0,10

0,05

0,00
0 1 2 3 4

GRÁFICOS E DISTRIBUIÇÃO EM CLASSES


Exemplo

O numero de erros ortográfico cometidos por 100


estudantes de Linguística num teste nunca foi superior a
quatro e distribui-se da seguinte forma
Xi Fi fi Fac fac
0 10
1 15
2 25
3 40
4 10
Total Σ=100

Quadro 2: Distribuição de erros por estudante num teste de ortografia


Exemplo

O numero de erros ortográfico cometidos por 100


estudantes de Linguística num teste nunca foi superior a
quatro e distribui-se da seguinte forma
Xi Fi fi Fac fac
0 10 0,10
1 15 0,15
2 25 0,25
3 40 0,40
4 10 0,10
Total Σ=100 1,00

Quadro 2: Distribuição de erros por estudante num teste de ortografia


Exemplo

O numero de erros ortográfico cometidos por 100


estudantes de Linguística num teste nunca foi superior a
quatro e distribui-se da seguinte forma
Xi Fi fi Fac fac
0 10 0,10 10 0,10
1 15 0,15 25 0,25
2 25 0,25 50 0,50
3 40 0,40 90 0,90
4 10 0,10 100 1,00
Total Σ=100 1,00

Quadro 2: Distribuição de erros por estudante num teste de ortografia


Gráficos
1- Diagrama de Barras OU Diagrama de Paretto

DISTRIBUIÇÃO DO NÚMERO DE ERROS POR ESTUDANTE

0,45
Número (proporção) de Estudantes

0,40

0,35

0,30

0,25
Série1
0,20

0,15

0,10

0,05

0,00
0 1 2 3 4
Número de Erros
2- Diagrama Circular ou de Pie

0
1
2
3
4
Exemplo ()

Os seguintes dados mostram o número de ausências de 20


estudantes durante a primeira quinzena de aulas.

2 3 0 0 1 1 4 2 3 2 0 1 1 5 2 4 4 2 0 0

a) Classifique a variável
b) Construa uma tabela de distribuição de frequências
c) Quantos estudantes têm ausências no período
considerado?
d) Que proporção de estudantes tem até 4 ausências
e) Quantos estudantes têm pelo menos 3 ausências?
Exercício (1)
Sabe-se que F2=6 , f4=0,6 , f6ac=0,95 e F4=18
Determinar o valor de n

Exercício (2)
Sabendo que F3 = n/2 , complete a seguinte tabela

xi Fi fi Fiac fiac
2 0,10
4 0,30
6 320
8 0,90
10
DISTRIBUIÇÃO DE FREQUÊNCIAS EM CLASSES
DISTRIBUIÇÃO DE FREQUÊNCIAS EM CLASSES

• As vezes, a Amplitude total dos dados obriga-nos a proceder a


uma distribuição em CLASSES.

• Outros conceitos associados a este são os de NÚMERO DE


CLASSES, AMPLITUDE, LIMITES e PONTO MÉDIO ou CENTRO .
Regras Básicas
Regras Básicas

 Amplitude total: Diferença entre as entradas máxima e


mínima. (At=Xmax-Xmin)

 Número de Classes:
(1) Para n<25, tomar k=5
(2) Para n≥25, tomar k≈ √n
(3) Regra de Sturges: k ≈1+3,22logn

Se por exemplo n=49, ambas as soluções nos conduzem a


mesma solução (k=7)
DISTRIBUIÇÃO DE FREQUÊNCIAS EM CLASSES

SERVE PARA DADOS DISCRETO OU CONTÍNUOS


Exemplo 1 (classes semiabertas)

 Frequências: 5, 8, 6, 8, 5, 4
Classe Frequência Fi
 Limites inferiores: 1, 6, 11, 16, 21,
[1-6[ 5 26
[6-11[ 8  Limites superiores: 6, 11, 16, 21,
26, 31
[11-16[ 6
 Número de classes: 6
[16-21[ 8
 Amplitude das classes é a
[21-26[ 5 distancia entre os limites inferiores
(ou superiores) de classes
[26-31[ 4 consecutivas. No caso, 6-1=5
Exemplo 3

O conjunto de dados amostrais a seguir fornece uma lista


do número de minutos que 50 estudantes do ISCED
demoram no seu percurso de casa para a escola. Construir
uma distribuição de frequências para o conjunto de dados.

50 40 41 17 11 7 22 44 28 21 19 23 37 51 54 42 88

41 78 56 72 56 17 7 69 30 80 56 29 33 46 31 39 20

18 29 34 59 73 77 36 30 62 54 67 39 31 53 44 39
Solução (classes semiabertas):

1. Como n=50 (n >25), de acordo com a


Limite Limite
Regra, o número de classes será inferior superior
k= ≈7. Logo vamos construir 7
7 19
classes
19 31
2. A entrada mínima de dados (Xmin) é 7
31 43
e a máxima (Xmax ) é 88. Logo
43 55
At= Xmax- Xmin = 88-7=81.
55 67
3. A amplitude das classes é
67 79
At
= = ≈11,57. Deve ser 79 91
k 7
arredondado para 12.
Distribuição de frequências para o tempo
de percurso (em minutos)

Classes Ponto Medio Frequência, Fi


𝑳𝒊 𝑳𝒔
( )
𝟐

[7- 19[ 𝟕 𝟏𝟗 6
𝟐
[19- 31[ 𝟏𝟗 𝟑𝟏 10
𝟐
[31- 43[ 𝟑𝟏 𝟒𝟑 13
𝟐
[43- 55[ Ou 37+12=49 8
[55- 67[ 49+12=61 5
[67- 79[ 61+12=73 6
[79- 91[ 83+12=85 2
ΣFi =50
Continuação

Classes Ponto Médio Frequência, Freq. relativa Freq. acumulada


Ci Fi fi Fiac
7 - 19 13 6 0,12 6
19 - 31 25 10 0,2 16
31 - 43 37 13 0,26 29
43 - 55 49 8 0,16 37
55 - 67 61 5 0,1 42
67 - 79 73 6 0,12 48
79 - 91 85 2 0,04 50
ΣFi =50 Σ(Fi/n)=1
Exemplo

Os seguintes dados representam as idades de 40 estudantes do


2º ano do curso de C. Educação do ISCED- Benguela

38 64 50 32 44 25 49 57
46 58 40 47 36 48 52 44
68 26 38 74 63 21 54 65
46 73 42 47 35 53 40 35
41 45 35 42 50 56 45 28

a) Elaborar uma distribuição de frequências


b) Representar graficamente
Recordando algumas definições importantes

1) Amplitude total (At) dos dados


At= Xmax- Xmin
No caso, Xmax=74 e Xmin =21 portanto
At = 74-21=53

2) Número de classes (k)


a) Regra: se n<25 fazer k igual a 5. Se n≥25, fazer k
igual (ou aproximado) a raiz quadrada de n
No caso n=40 >25 logo k=6,3246.
3) Determinar a amplitude das classes ()
É o quociente entre a At e o número de
classes, ou seja =At/k =54/6=9

Devemos portanto construir uma distribuição


com 6 classes com amplitude  =9
Cálculo dos limites

Limite inferior Limite superior


[21 30[

[30 39[

39 48

48 57

57 66

[66 75[
Distribuição

Distribuição de frequências para as idades de 40


estudantes do 2º ano do CCE do ISCED-B

Classes Pto Medio Frequência, Fi


21 - 30 25,5 4
30 - 39 34,5 7
39 - 48 43,5 13
48 - 57 52,5 8
57 - 66 61,5 5
66 - 75 70,5 3
ΣFi =40
Distribuição de frequências para as idades de 40
estudantes do 2º ano do CCE do ISCED-B

Classes Ponto Médio Frequência, Fi


21 - 30 25,5 4
30 - 39 34,5 7
39 - 48 43,5 13
48 - 57 52,5 8
57 - 66 61,5 5
66 - 75 70,5 3
ΣFi =40
Continuação

Classes Ponto médio (Xi) Fi fi Fiac fiac

21- 30 25,5 4 0,10 4 0,10

30 - 39 34,5 7 0,175 11 0,275

39 - 48 43,5 13 0,325 24 0,60

48 - 57 52,5 8 0,20 32 0,80


57- 66 61,5 5 0,125 37 0,925
66- 75 70,5 3 0,075 40 1,00

ΣFi =40 Σ(Fi/n)=1


Distribuição dos estudantes por idades
13

8
Numero de estudantes

7
5
4

25,5 34,5 43,5 52,5 61,5 70,5


Idades
1. Histograma de frequências absolutas

Distribuição dos estudantes por idades

14

12
Numero de estudantes

10
25,5

8 34,5
43,5

6 52,5
61,5
70,5
4

0
25,5 34,5 43,5 52,5 61,5 70,5

Idades
2- Polígono de frequências

Distribuição dos estudantes por idades


14

12
Numero de estudantes

10

Série1
6

0
16,5 25,5 34,5 43,5 52,5 61,5 70,5 79,5

Idades
OBRIGADO