Você está na página 1de 18

FACULDADE DE CIÊNCIAS SOCIAIS E HUMANAS

CURSO DE LICENCIATURA EM CIÊNCIA POLÍTICA E RELAÇÕES


INTERNACIONAIS

DISCIPLINA: Estatistica Aplicada

Tema 1: DISTRIBUIÇÃO DE FREQUÊNCIAS E MEDIDAS ESTATÍSTICAS (DE


TENDÊNCIA CENTRAL, DE DISPERSÃO,DE CURTOSE E ASSIMETRIA)

Docente: Nasma da Glória José Langa

Maputo, 2024
ÍNDICE

1. INTRODUÇÃO .....................................................................................................................................2
2. MEDIDAS ESTATÍSTICAS .................................................................................................................3
2.1. DISTRIBUIÇÃO DE FREQUÊNCIAS ............................................................................................3
2.1.1. Frequência absoluta (fi) ..................................................................................................................3
2.1.2. Frequência relativa (fr) ...................................................................................................................3
2.1.3. Frequência acumulada (Fa ou Fr)...................................................................................................3
2.1.4. Histograma .....................................................................................................................................3
2.2. MEDIDAS DE TENDÊNCIA CENTRAL OU DE POSIÇÃO .........................................................3
2.2.1. Média ( )........................................................................................................................................3
2.2.2. Mediana (Me) .................................................................................................................................4
2.2.3. Moda (Mo) ......................................................................................................................................4
2.3. MEDIDAS DE LOCALIZAÇÃO (SEPARATRIZES) .....................................................................5
2.3.1. Quartis (Qk) ....................................................................................................................................5
2.3.2. Decil (Dk) .......................................................................................................................................6
2.3.3. Percentil (PK) ..................................................................................................................................6
2.4. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE ..............................................................6
2.4.1. Variância (S2) .................................................................................................................................6
2.4.2. Desvio padrão (S) ...........................................................................................................................7
2.4.3. Coeficiente de variação (Cv) ..........................................................................................................7
2.5. MEDIDAS DE ASSIMETRIA E CURTOSE ...................................................................................8
2.5.1. Assimetria ......................................................................................................................................8
2.5.1.1. Coeficiente de Assimetria (As) ..................................................................................................8
2.5.2. Curtose ...........................................................................................................................................8
2.5.2.1. Coeficiente de curtose (K ou C) .................................................................................................9
3. RESOLUÇÃO DO EXERCÍCIO PROPOSTO ...................................................................................10
CONCLUSÃO .............................................................................................................................................16
BIBLIOGRAFIA..........................................................................................................................................17

1
1. INTRODUÇÃO

O presente trabalho visa desenvolver o “tema1” proposto pelo docente da cadeira de Estatística
Aplicada, cujo teor é distribuição de frequências e medidas estatísticas (de tendência
central, de dispersão,de curtose e assimetria).

Após o desenvolvimento do tema, segue-se a resolução do exercício de aplicação proposto pelo


docente baseando-se nos dados da Tabela 2.6, do exercício numero 1 da pagina 37* do manual
de “Probabilidades e Estatistica” da autora Ana Maria Lima de Farias (2010).

a) Objetivo geral

Estudar sobre distribuição de frequências e medidas estatísticas (de tendência central, de


dispersão,de curtose e assimetria).

b) Objectivos especificos:

 Construir tabelas de frequencia (para dados simples e agrupados em classe) e histogramas;


 Conhecer e determinar as medidas de tendência central;
 Conhecer, calcular e interpretar as medidas separatrizes;
 Identificar, determinar as medidas de dispersão e comparar variáveis semelhantes;
 Conhecer e determinar as medidas de assimetria e curtose.

(*) – Acredito que tenha sido um lapso do Professor ao se referir que os dados para resolução das questões
colocadas estavam na pagina 39 do manuel referido, quando na verdade é pagina 37.

2
2. MEDIDAS ESTATÍSTICAS
2.1. DISTRIBUIÇÃO DE FREQUÊNCIAS
2.1.1. Frequência absoluta (fi)
Frequência absoluta do valor xi é o número de vezes que o elemento xi aparece na amostra, ou
é o número de elementos pertencentes a uma classe. Vale lembrar que ∑ =N

2.1.2. Frequência relativa (fr)


A frequência relativa de um valor xi é o quociente entre a frequência absoluta desse valor e o
número total da população. A frequência relativa pode apresentar-se: (1) por um numero

abstrato: fr = ; (2) Percentual: fr = *100%

2.1.3. Frequência acumulada (Fa ou Fr)


É o somatório de cada frequência absoluta ou relativa com as respectivas anteriores a esta.

2.1.4. Histograma
Consiste numa escala horizontal para os dados a serem representados, numa escala vertical para
as frequências (absolutas ou relativas) e barras ou rectângulos, cuja base é igual ao intervalo de
classe e a altura à sua frequência para tabelas com intervalos que tenham todos a mesma
amplitude.

2.2. MEDIDAS DE TENDÊNCIA CENTRAL OU DE POSIÇÃO

As medidas de posição são muito importantes na interpretação dos dados estatísticos. Elas são:
média, mediana e moda.

2.2.1. Média (̅)

Geralmente usa-se a média aritmética, que é o valor encontrado pelo somatório de todos valores
(dados), dividido pelo número desses valores (dados).


 ̅= - Para dados simples;

 ̅= - Para dados simples com frequência

3
̂
 ̅= - Para dados agrupados por classes

Onde: n = ∑fi ; ̅ – média; fi – frequência absoluta; n – amostra; ̂ - ponto médio.

2.2.2. Mediana (Me)

É o valor do meio.

(1) Para se achar a mediana de dados em serie deve-se colocar em ordem crescente.

 Se n é ímpar, a me é o valor do meio, achado pela localização i =

 Se n é par, a me será a média dos dois valores do meio ( ), assim i1 = e i2 =

e, portanto, a me =

(2) Para dados agrupados por classes a mediana obtém-se pela fórmula:

( )
me = li(me) + ( ) Onde: li(me) – limite inferior da classe mediana, F-1(me) –
( )

frequência acumulada anterior a classe mediana, fi(me) frequência absoluta da classe mediana e
ac(me) – amplitude da classe mediana

2.2.3. Moda (Mo)


É o valor com maior frequência. A moda pode ser: Unimodal – uma moda, bimodal – duas
modas, trimodal – três modas e multimodal – mais de três modas e sem moda se todos os
valores são diferentes ou são todos iguais.

Para dados agrupados por classes a moda obtém-se pela fórmula:

( ) ( )
mo = +( . ( ), Onde: li(mo) – limite inferior da classe modal,
( ) ( )) ( ( ) ( ))

fi(me) frequência absoluta da classe modal, fp(me) frequência absoluta posterior a classe modal e
ac(mo) – amplitude da classe modal fa(me) frequência absoluta anterior a classe modal./

Nota: A classe modal é aquela que apresenta maior frequência absoluta.

4
2.3. MEDIDAS DE LOCALIZAÇÃO (SEPARATRIZES)

Uma série ou conjunto pode ser dividida em duas ou mais partes que contenham a mesma
quantidade de elementos. Os elementos que dividem o conjunto denominam-se separatrizes e
assim podem ser:
 Mediana – divide o conjunto em duas partes (md);
 Quartis – dividem o conjunto em quatro partes (Q1, Q2 e Q3);
 Decis – Dividem o conjunto em dez partes (D1, D2, D3, D4, D5, D6, D7, D8, D9)
 Percentis – dividem o conjunto em cem partes (P1, P2, P3, …, P99).

2.3.1. Quartis (Qk)


O 1º quartil (Q1) corresponde à separação dos 1ºs 25% dos elementos do conjunto.
O 2º Quartil (Q2) corresponde aos 50% dos elementos e é igual à mediana.
O 3º Quatil (Q3) corresponde aos 75% dos elementos.
25% 50% 75%
____________I_____________I____________I___________
Q1 Q2 Q3
(1) Para dados simples (não agrupados por classes) o cálculo dos quartis é feito usando a
fórmula seguinte:
PQk = onde k pode tomar valores 1, 2 ou 3; n=∑fi e PQk é a posição do quartil;

Procedimento:
 1º Pôr os dados em rol (ordem);
 2º Determinar a posição do quartil;
 3º Identificar o elemento que está nessa posição.

(2) Para dados não agrupados por classes mas com frequências a posição do quartil
encontra-se na frequência acumulada e o valor da variável será o correspondente àquela
frequência.
(3) Para dados agrupados por classes

 Localizar a sua posição pela fórmula: PQk =

 Identificar a classe do quartil (na frequência acumulada)


5

( )
 Calcular o quartil pela fórmula: Qk = li(Qk) + (Qk)
( )

Nota: Para o cálculo de decís e percentís procede-se da mesma forma dos quartis, apenas
substituir o coeficiente 4 por 10 (para decil) ou 100 (para percentil).

2.3.2. Decil (Dk)



∑ ( )
PDk = e Dk = li(Dk) + (Dk)
( )

2.3.3. Percentil (PK)



∑ ( )
PPk = e Pk = li(Pk) + (Pk)
( )

2.4. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE

A dispersão de um conjunto de dados refere-se a variabilidade entre eles. No entanto, se todos


os valores (dados) sãos iguais então não há dispersão de dados, ou seja, não teremos
variabilidade de dados.

A dispersão considera-se pequena quando os valores apesar de serem diferentes se encontram


próximos da média.

As medidas de dispersão mais usadas são: a amplitude total (At), variância (S2), desvio padrão
(S) e Coeficiente De Variação (Cv)

2.4.1. Variância (S2)

Chama – se Variância, a média aritmética dos quadrados dos desvios em relação a média
aritmética.

(1) para amostra n


∑( ̅) ∑( ̅)
a) S2 = para dados simples sem frequências e S2 = com frequências
∑( ̂ ̅)
b) S2 = para dados agrupados por classes

6
(2) Para população
∑( ̅) ∑( ̅)
a) S2 = para dados simples sem frequências e S2 = com frequências
∑( ̂ ̅)
b) S2 = para dados agrupados por classes

Nota: a variância é tanto maior quanto maior for a dispersão.

2.4.2. Desvio padrão (S)

Chama-se desvio padrão, a raiz quadrada da variância: S = √

O desvio padrão informa sobre afastamento dos dados em relação a média.

2.4.3. Coeficiente de variação (Cv)

O Cv é uma medida relativa de dispersão expresso, muitas vezes, o valor em percentual. Este
permite comparar a variabilidade de dois conjuntos de dados com diferentes unidades de
medidas. Calcula-se usando as fórmulas:

Cv = ̅ *100%

Quanto menor for o Cv significa que existe menor dispersão relativa, i é, a média é significativa,
os valores estão mais próximos dela.

Embora se possam considerar outros intervalos, a dispersão pode ser:

 Pequena se Cv ≤ 10%
 Média se 10% ˂ Cv ≤ 20% e
 Grande se Cv ˃20%

7
2.5.MEDIDAS DE ASSIMETRIA E CURTOSE
2.5.1. ASSIMETRIA

Assimetria é o grau de desvio em relação a uma distribuição simétrica.

Na representação grafica de uma distribuição de frequências, três casos são possíveis:


 1º Caso: ̅ = Me = Mo, estamos perante uma distribuição simetrica.
 2º Caso: ̅ < Me < Mo, estamos perante uma distribuição assimétrica a esquerda ou
negativa.
 3º Caso: Mo < Me < ̅, estamos perante uma distribuição assimétrica a direita ou
positiva.

2.5.1.1. Coeficiente de Assimetria (As)


Karl Pearson propôs duas maneiras de avaliar o grau de achatamento ou de formação da curva
de uma distribuição de frequências, cujo objectivo principal é justamente indicar a grandeza do
afastamento em termos relativos.

a) Primeiro coeficiente
̅
AS =

b) b) Segundo coeficiente
̅
AS =3

Em função dos resultados de (As), é possível determinar o comportamento da curva de cada


distribuição. Assim, se:
 A distribuição é simétrica: AS = 0
 A distribuição é assimétrica positiva: AS > 0
 A distribuição é assimétrica negativa: AS < 0

2.5.2. CURTOSE

Chama-se Curtose ou Medidas de Achatamento ao grau de achatamento da curva de uma


distribuição de frequênciasem relação a curva padrão ou curva normal.

8
O grau de achatamento é determinado a partir do valor do coeficiente de curtose (K):

 Curva mesocurtica, se K = 0,263;


 Curva leptocurtica, se K < 0,263; e
 Curva platicurtica, se K > 0,263.

2.5.2.1. Coeficiente de curtose (K ou C)

O cálculo deste coeficiente é dado pela seguinte expressão: K = Ou K =


( ) ( )

Lembre-se que D9 = P90 e D1 = P10

9
3. RESOLUÇÃO DO EXERCÍCIO PROPOSTO

[EXERCÍCIO 1, Ana de Farias(2010; p.37)]: Num estudo sobre a jornada de trabalho das
empresas de Produtos Alimentares foram levantados os dados da “tabela abaixo” relativos
ao total de horas trabalhadas pelos funcionários no mês de Agosto (dados fictícios). Para
facilitar a resolução das questões que se seguem, os valores mínimo e máximo são 1.815 e
118.800, respectivamentes.

3.960 5.016 13.015 8.008 6.930 5.544 4.224 6.138


118.800 57.904 72.600 100.100 55.935 7.223 3.775 4.224
3.216 7.392 2.530 6.930 1.815 4.338 8.065 10.910
8.408 8.624 6.864 5.742 5.749 8.514 2.631 5.236
8.527 3.010 5.914 11.748 8.501 6.512 11.458 10.094
6.721 2.631 7.082 10.318 8.008 3.590 7.128 7.929
10.450 6.780 5.060 5.544 6.178 13.763 9.623 14.883
17.864 34.848 25.300 52.800 17.732 63.923 30.360 18.876
30.800 19.562 49.240 49.434 26.950 22.308 21.146 14.212
25.520 49.251 30.976 23.338 43.648 26.796 44.880 30.008
30.769 16.907 33.911 27.034 16.500 14.445 28.160 42.442
16.507 36.960 67.760 84.084 89.888 65.340 82.280 86.152
91.080 99.792 77.836 76.032

a) Qual é a variável em estudo e como se classifica

Resposta:

 Variável: total de horas trabalhadas;


 Classificação: variável quantitativa discreta.

10
b) Construa a tabela de distribuição de frequências

Resposta:
Organizando os dados em rol crescente, temos:

→ 1.815 2.530 2.631 2.631 3.010 3.216 3.590 3.775


3.960 4.224 4.224 4.338 5.016 5.060 5.236 5.544
5.544 5.742 5.749 5.914 6.138 6.178 6.512 6.721
6.780 6.864 6.930 6.930 7.082 7.128 7.223 7.392
7.929 8.008 8.008 8.065 8.408 8.501 8.514 8.527
8.624 9.623 10.094 10.318 10.450 10.910 11.458 11.748
13.015 13.763 14.212 14.445 14.883 16.500 16.507 16.907
17.732 17.864 18.876 19.562 21.146 22.308 23.338 25.300
25.520 26.796 26.950 27.034 28.160 30.008 30.360 30.769
30.800 30.976 33.911 34.848 36.960 42.442 43.648 44.880
49.240 49.251 49.434 52.800 55.935 57.904 63.923 65.340
67.760 72.600 76.032 77.836 82.280 84.084 86.152 89.888
91.080 99.792 100.100 118.800 →
NB: Os dados da mesma cor significam que pertencem a mesma classe

Passo 1: Determinar amplitude total (At)


At = Xmax - Xmin
= 118800 – 1815
= 116985
Passo 2: Numero de classes (k)

Não há uma fórmula exacta para o cálculo do número de classes. Entretanto, vamos usar a
Fórmula de Sturges , onde N é o tamanho da amostra..

Com N = 100, temos: 𝐾 00


𝐾
𝐾 6 644
𝐾 7 644
𝑲 𝟖

11
Passo 3: Amplitude de classe (h): h= = = 14623,125 => h

Passo 4: Construção de classes e determinacao de frequências

Frequência Simples Frequência Acumulada


Número De
Relativa (fr) Relativa (Fr)
Horas Absoluta Absoluta
Trabalhadas (fi) (Fi)
% %
[1815;16439[ 53 0,53 53,00 53 0,53 53,00
[16439;31063[ 21 0,21 21,00 74 0,74 74,00
[31063;45687[ 6 0,06 6,00 80 0,80 80,00
[45687;60311[ 6 0,06 6,00 86 0,86 86,00
[60311;74935[ 4 0,04 4,00 90 0,90 90,00
[74935;89559[ 5 0,05 5,00 95 0,95 95,00
[89559;104183[ 4 0,04 4,00 99 0,99 99,00
[104183;118807[ 1 0,01 1,00 100 1.00 100,00
∑ 100 00

c) Construa o gráfico correspondente

Resposta: Histograma e poligono de frequências de total de horas trabalhadas

60

50

40

30

20

10

12
d) Diga qual é o número médio de horas gastas pelos funcionários.

Resposta:

i intervalos Fi ̂ ̂ ( ̂ ̅)2| ( ̂ ̅)2|*fi


1 [1815;16439[ 53 53 9127 483731 323550875,75 17.148.196.414,77
2 [16439;31063[ 21 74 23751 498771 11313266,79 237.578.602,60
3 [31063;45687[ 6 80 38375 230250 126798409,83 760.790.458,98
4 [45687;60311[ 6 86 52999 317994 670006304,87 4.020.037.829,22
5 [60311;74935[ 4 90 67623 270492 1640936951,91 6.563.747.807,64
6 [74935;89559[ 5 95 82247 411235 3039590350,95 15.197.951.754,75
7 [89559;104183[ 4 99 96871 387484 4865966501,99 19.463.866.007,96
8 [104183;118807[ 1 100 111495 111495 7120065405,03 7.120.065.405,03
∑ 100 2711452 70.512.234.280,96

∑( ̂)
Média: ̅= = = 27114,52

Portanto, o número médio de horas gastas pelos funcionários é de 27114,52.

e) Determine a mediana.

( )
Resposta: Me = Li(me) + ( )
( )

Onde: Li(me) – limite inferior da classe mediana, F-1(me) – frequência acumulada anterior a classe
mediana, fi(me) frequência absoluta da classe mediana e h(me) – amplitude da classe mediana

Classe mediana: Sendo 0, a mediana está na classe correspondente a primeira

frequência acumulada superior a 50, que é a classe [1815;16439[


Li(me) = 1815 𝑛
𝐹 (𝑚𝑒)
N = 100 Me = Li(me) + (𝑚𝑒)
𝑓𝑖(𝑚𝑒)

( ) =0
Me = 1815 + 46 4
3
( ) 53
Me = 1815 + 46 4
h(me) = 3

Me = 1815 + 1379,23
Me = 15611,23

13
f) Determine a variância, o desvio padrão e o coeficiente de variação e diga que
tipo dedispersão os dados apresentam

Resposta: ● Variância ● Desvio padrão ● Coeficiente de variação

∑ ( ̅)
 Variância: = = = 705.122.342,81

 Desvio padrão: S = √ =√ 0 4 8 = 26554,14

 Coeficiente de variação: Cv = ̅ *100 = *100 = 97,93%

Uma vez que Cv ˃20%, então quanto ao tipo de dispersão ela é Grande.

g) Determine o coeficiente de assimetria de pearson e diga que tipo de assimetria


as horasdo trabalho dos funcionários apresentam

Resposta: Coeficiente de assimetria de Pearson (AS)


̅ ( ) ( )
AS = => Mo = +( . ( )
( ) ( )) ( ( ) ( ))

Onde: Li(mo) – limite inferior da classe modal; fi(mo) frequência absoluta da classe modal; fp(mo)
frequência absoluta posterior a classe modal; h(mo) – amplitude da classe modal e fa-1(mo)
frequência absoluta anterior a classe modal
A classe modal é aquela que apresenta maior frequência absoluta. Assim sendo, a classe modal é
[1815;16439[.
( ) ( ) 3
Mo = +( . ( ) = 8 +( ) ( 3
. 46 4 = 10933,49
( ) ( )) ( ( ) ( )) 3 )

̅ 𝐌𝐨
𝒙 7 33
AS = => AS =
𝝈
• Mo = 10933,49
3
• ̅ = 27114,52 AS =

• σ = S = 26554,14 AS = 0,61

Observando os valores de Mo = 10933,49; Me = 15611,23 e ̅ = 27114,52, nota-se que


Mo<Me ̅ o que indica que as horas do trabalho dos funcionários apresentam uma
distribuição assimétrica a direita ou positiva. Ou seja, sendo AS > 0, a distribuição é
assimétrica positiva.
14
h) É possível determinar o coeficiente de curtose das horas de trabalho dos
funcionários? Justifique a sua resposta e casa seja possível determine e faça a
interpretação.

Resposta: Sim! Determinar o coeficiente de curtose K é possivel quando temos uma


distribuição assimetrica.

K= , em que Qk e Dk denotam-se os k-ésimos quartil e decil, respectivamente.


( )


Posição do Quartil: PQk =
• PQ1 = = 25, portanto o Q1 está na classe

( ) [1815;16439[ pois é onde se localiza a posição 25.
Qk = li(Qk) + (QK)
( )
• Q1 = 1815+ 46 4 = 8713,11
3
3
• PQ3= = 75, portanto o Q3 está na classe

[31063;45687[ pois é onde se localiza a posição 75.


7 7
• Q3 = 31063+ 46 4 = 33500,33

∑ • PD1 = = 10, portanto o D1 está na classe


Posição do Decil; PDk =

( ) [1815;16439[ pois é onde se localiza a posição 10.
Dk = li(Dk) + (D
( )
• D1 = 1815+ 46 4 =2759,25
3

• PD9= = 90, portanto o D9 está na classe

[60311;74935[ pois é onde se localiza a posição 90.


• D9 = 60311+ 46 4 = 74935

Assim sendo: K = => K = = = = 0,172


( ) ( )

Uma vez K = 0 7 , implica que K < 0,263 o que traduz uma distribuição de frequencia
leptocurtica.

15
CONCLUSÃO

No presente trabalho vimos que na distribuição de frequências podemos ter frequência absoluta,
frequência relativa e frequência acumulada.

As medidas de posição são muito importantes na interpretação dos dados estatísticos e elas são
média, mediana e moda.

As principais medidas de localização (separatrizes) são: mediana, quartis, decis, percentis.

As medidas de dispersão mais usadas são: a amplitude total, variância, desvio padrão e
coeficiente de variação, podendo ser classificada em pequena se Cv ≤ 10%, média se 10% ˂ Cv
≤ 20% e grande se Cv ˃20%.

Assimetria é o grau de desvio em relação a uma distribuição simétrica. Não sendo uma
distribuição simétrica, so pode ser uma distribuição assimétrica a esquerda (negativa) ou uma
distribuição assimétrica a direita (positiva).

Curtose é o grau de achatamento da curva de uma distribuição de frequênciasem relação a curva


padrão ou curva normal

16
BIBLIOGRAFIA

1. CORREIA, M. S. B. B. (2003). Probabilidade e Estatística. 2ª edição. s/l.


2. FARIAS, A. M. L. (2010). Probabilidade e estatística. V. Único, Fundação CECIERJ, Rio de
Janeiro.
3. SILVA, S. M. et al (1999) - Estatística para os cursos de economia, administração e ciências
contábeis, Atlas, São Paulo;
4. VUNGA, H. M(2012), Estatística Aplicada: Manual dos Cursos de Licenciatura da
UnISCED, 1ª Ed. UnISCED – Beira.

17

Você também pode gostar