Você está na página 1de 44

CURSO DE CIÊNCIAS DE EDUCAÇÃO

Estatística e Cálculo de Probabilidades


Estatística e Cálculo de Probabilidades

Medidas da Estatística Descritiva


Medidas de localização e de
dispersão
Medidas de estatística descritiva

• Permitem representar um conjunto de


dados relativos à observação de
determinado fenómeno de forma ainda
mais resumida e, comparar diferentes
distribuições
Tipos de Medidas
• De localização
• De dispersão
• De Assimetria
• De curtose
• De concentração
Medidas de tendência central

Média Moda Mediana


Média Aritmética
Propriedades
Exemplo
As notas das cinco disciplinas que um estudante frequenta
no segundo semestre vêm dadas na seguinte tabela

Disciplina Nota A nota média do estudante no semestre


será:
Estatística 15 n

Português 14  x1  x2  x3  ...  xn x i
X  i 1
n n
História 12
15  14  12  17  10
Geografia 17  
5
Inglês 10 
68
 13,6
5
Média Aritmética
Dados agrupados (Dados discretos)

x1 F1  x2 F2  ...  xn Fn x F i i
Fi
X  i 1
  xi   xi f i
n n n

Também neste caso se costuma diferenciar a média da


população da média amostral
Exemplo
Determinar a média da seguinte distribuição

x F i i
0  2  1 3  2  1  3  1  4  3
Xi Fi fi i 1
 
n 10
0 2 0.2 20
  2 ou
1 3 0.3 10

2 1 0.1
k
3 1 0.1 x F i i

4 3 0.3
i 1
 0  0,2  1 0,3  2  0,1  3  0,1  4  0,3
n
2
10 1.0
Exemplo

Dados agrupados em CLASSES

C1 F1  C2 F2  ...  Cn Fn C F i i
X  i 1
  Ci f i
n n

Ci representa neste caso a marca ou centro de


classe na distribuição de frequências
Exemplo

Determinar a média da seguinte distribuição

Classes Fi fi Xi (Ci)
2-6 4 0.2 4
7-11 6 0.3 9
12-16 2 0.1 14
17-21 5 0.25 19
22-26 3 0.15 24
20 1.0
Solução

Neste caso devemos aplicar a formula para as


distribuições continuas.

C F i i
4  4  9  6  14  2  19  5  24  3
i 1
 
n 20

265
  13.25
20
Outras médias

1. Média geométrica

2. Média Harmónica

• Ver Estatística Descritiva; Elizabeth Reis, Edições


Sílabo, pp 72-77

• Sebenta de Matemáticas Gerais (Estatística) ,


Fernando Borja Santos, Platano Editora, 2001
Mediana

Observação ou dado que divide uma série em duas


partes iguais.

Há que distinguir os casos em que os dados são


discretos ou contínuos, se os dados estão ou não
agrupados e os casos em que n (ou N) é par ou impar
Dados N/agrupados (qualquer tipo)

1. Se n é impar

estando os dados ordenados de forma crescente ou


decrescente
2. Se n é par

estando os dados ordenados de forma crescente ou


decrescente
Dados N/agrupados (qualquer tipo)

1. Caso discreto

Usa-se o mesmo critério do caso anterior, tendo em


conta que a frequência acumulada (absoluta) dá a
posição de cada categoria, dado ou observação na
série de dados
Exemplo - Mediana
Dados agrupados

2. Caso continuo

n  Fac(Md  1) Mediana a partir das

Md  li(Md )   (Md ) 2
frequências absolutas
F (Md )

Mediana a partir das


0.5  fac(Md  1)
Md  li(Md )   (Md ) frequências relactivas
f (Md )

Ver exemplos
Exemplo - Mediana

10 31,6
Moda

 A moda é a única medida de localização central que pode ser


utilizada para dados numa escala nominal.

 A moda pode não ter significado, especialmente em dados de


natureza contínua ou em dados discretos com poucas
observações repetidas!

 Quando os dados estão agrupados em classes podemos falar


da classe modal, ou seja, da classe com maior frequência.
Exemplo - Moda
Moda – Dados Agrupados

Dado ou observação que maior frequência tem na


série, ou seja aquela observação que mais se repete.

No caso discreto não oferece nenhum problema. Se


os dados são contínuos e agrupados, define-se a
classe modal e pode-se usar a seguinte fórmula:

F ( Mo  1)
Mo  li ( Mo)   ( Mo)
F ( Mo  1)  F ( Mo  1)

Nota: Também se pode apresentar em função da frequência relactiva


Exemplo - Moda

10

35
Outras Medidas de Localização

• Localização relativa:

1. Mínimo (minimum),

2. Máximo (maximum),

3. Quantil (quantile),

4. Quartil (quartile),

5. Percentil (percentile).
Medidas de Localização Relactiva: Máximo e Mínimo

• Mínimo – é o valor mais reduzido da amostra

• Máximo – é o valor mais elevado da amostra


Medidas de localização relativa: Quantis e Percentis

• Quantil de ordem p (0≤ p ≤ 1)– é um valor, xp, que divide


a amostra em duas partes, tal que à esquerda de xp está
a proporção p da amostra e à direita a proporção 1-p.

• Percentil de ordem p (p vai de 1 a 100) - é o mesmo que


um quantil mas em que a proporção é dada em
percentagem.
Medidas de localização relativa: Quartis

• Quartis – são os valores (Q1, Q2 e Q3) que dividem a


amostra, depois de ordenada, em quatro partes iguais
(ou o mais iguais possível). Q2 coincide com a mediana.
Medidas de Dispersão

1. Amplitude ou rango(range),

2. Distância inter-quartil (inter-quartile range),

3. Variância (variance),

4. Desvio padrão (standard deviation),

5. Coeficiente de variação (coefficient of variation),


Amplitude Total

• A amplitude de uma amostra é a diferença entre o máximo e o


mínimo.

Exemplo: Na amostra 1.2; 1.7; 2.1; 2.2; 2.3 a amplitude é


.
2.3 - 1.2 = 1.1
Distância inter-quartil

• Distância inter-quartil – é a diferença entre o 3º e o 1º quartis,


Q3 - Q1.

• No intervalo que vai de Q1 a Q3 encontram-se 50% das


observações (as mais centrais).
Variância e desvio padrão

• A variância é a média dos quadrados dos desvios das


observações em relação à média da amostra.

• Dados não agrupados


n

 ( xi  x ) 2
S2  i 1
n
• Dados Agrupados
n

 Fi ( x i  x ) 2 n
S 2
 i 1
n
 
i 1
f i ( xi  x ) 2
Medidas de dispersão: desvio padrão

• A variância não vem representada na mesma unidade das


observações. Se tomarmos a raiz quadrada da variância obtemos o
desvio padrão que também é uma medida de dispersão e vem na
mesma unidade das observações.

 ( xi  x ) 2 Dados não agrupados


S  S2  i 1
n
n Dados agrupados
S  S2  i 1
f i ( xi  x ) 2

• O desvio padrão e a variância podem ser fortemente afectados por


erros ou observações muito afastadas.
Coeficiente de variação

• O Coeficiente de variação é a razão entre o desvio


padrão e a média, Cv = s / x ou v = s / x

• Trata-se de uma medida relativa de dispersão e por isso


não tem unidades.
Exemplos resumo

•Máximo (max): a maior observação


•Mínimo (min): a menor observação
•Moda (mo): é o valor (ou atributo) que ocorre com maior
freqüência.

Dados: 4, 5, 4, 6, 5, 8, 4

max = 8 min = 4 mo = 4
•Média:

x 1  x 2  x 3  ...  x n x i
x   i 1

n n

Dados: 2, 5, 3, 7, 8

25378
x 5
5
Mediana:
Dados: 2, 6, 3, 7, 8  n = 5 (ímpar)
Dados ordenados: 2 3 6 7 8  5+1 = 3  Md=6
2
Posição da Mediana 

Dados: 4, 8, 2, 1, 9, 6  n = 6 (par)
Dados ordenados: 1 2 4 6 8 9  6+1 = 3,5
 2
Md
Md = (4 + 6) / 2 = 5
Percentis:
O percentil de ordem p 100 (0 < p < 1), em um conjunto de dados
de tamanho n, é o valor da variável que ocupa a posição p  (n + 1)
do conjunto de dados ordenados.

Casos particulares:
percentil 50 = mediana ou segundo quartil (Md)

percentil 25 = primeiro quartil (Q1)

percentil 75 = terceiro quartil (Q3)

percentil 10 = primeiro decil


Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7  n=10

Posição de Md: 0,5(n+1)= 0,511= 5,5  Md = (3 + 3,1)/2 = 3,05


Posição de Q1: 0,25 (11) = 2,75  Q1=( 2+2,1)/2=2,05
Posição de Q3: 0,75 (11) = 8,25  Q3=(3,7+6,1)/2=4,9
Md = 3,05 Q1 = 2,05 Q3 = 4,9

Dados: 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6

 n=11
Md = 5,3 Q1 = 1,7 Q3 = 12,9
39
Exemplo 2: Considere as notas de um teste de 3 grupos de alunos

Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5

* * * * *
G1

* * * * *
G2
*
*
*
*
G3 *

0 5 10
_ _ _
Temos: x1 = x2 = x3 = 5 e md1= md2= md3 = 5
40
Medidas de Dispersão

Finalidade: encontrar um valor que resuma a variabilidade de um


conjunto de dados

•Amplitude (At):
At = Xmáx - Xmin

Para os grupos anteriores, temos:


Grupo 1, At = 4
Grupo 2, At = 8
Grupo 3, At = 0
Intervalo-Interquartil:

É a diferença entre o terceiro quartil e o primeiro quartil, ou


seja, Q3 - Q1.

Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7

Q1 = 2,05 e Q3= 4,9

Q3 - Q1 = 4,9 - 2,05 = 2,85


Variância:

( x  x ) 2
 ( x  x ) 2
 ...  ( x  x ) 2
Variância  s2  1 2 n

n
n
(xi  x)2

i 1 n

Desvio padrão:

Desvio Padrão  s  Variância


Cálculo para os grupos:

G1: s2 =(3-5)2+(4-5)2+ (5-5)2+ (6-5)2+ (7-5)2


5

 s2 = 10/5= 2  s = 1,41

G2: s2 = 8  s = 2,82

G3: s2 = 0  s = 0

Você também pode gostar