Você está na página 1de 32

ESTATÍSTICA DESCRITIVA

1.4. Gráficos e Tabelas


Estatística Aplicada | Gestão Pública
1. Apresentação dos dados: quadros e gráficos

A Estatística Descritiva pretende organizar, sintetizar e analisar os


dados obtidos no estudo de variáveis relativas a uma população de
modo a permitir caracterizar a população e conhecer o seu
comportamento. A informação fornecida pelos dados é compilada e
sintetizada em tabelas e gráficos e através do cálculo de indicadores
numéricos.

Apresentação ordenada dos dados


As tabelas de frequências e as representações gráficas são duas formas de apresentar a
informação de forma ordenada.

A leitura das tabelas, a síntese de informação que elas contêm é por vezes difícil de
interpretar. Uma distribuição estatística pode ser descrita de uma forma bastante mais
simples graficamente. Uma representação gráfica aparece como um meio de síntese e de
estudo extremamente eficaz, devendo esta ser simples, clara e verdadeira. No entanto
para uma análise mais detalhada as tabelas podem ser preferíveis aos gráficos.
O desafio da Estatística Descritiva consiste não na própria construção das tabelas ou
dos gráficos mas na escolha mais adequada destas ferramentas de modo a caracterizar
corretamente as variáveis em estudo.
GESTÃO PÚBLICA | ESTATÍSTICA APLICADA
2
1.1 Tabelas de Distribuição de Frequências

Nas tabelas de distribuição de frequências representa-se a forma como uma


dada variável se encontra distribuída pelo conjunto dos indivíduos em que essa
variável foi analisada. Tem aplicação tanto em variáveis qualitativas como
quantitativas.
Frequência Frequência Frequência Absoluta Frequência Relativa
X
Absoluta (ni) Relativa (fi) Acumulada (Ni) Acumulada (Fi)
𝒏𝟏
x1 n1 𝒇𝟏 = 𝑵𝟏 = 𝒏 𝟏 𝑭𝟏 = 𝒇𝟏
𝑵
𝒏𝟐
x2 n2 𝒇𝟐 = 𝑵𝟐 = 𝒏 𝟏 + 𝒏 𝟐 𝑭𝟐 = 𝒇𝟏 + 𝒇𝟐
𝑵
. . . . .
. . . . .
𝒏𝒑
xp np 𝒇𝒑 = 𝑵 1
𝑵
Total N 1

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


3
Tabelas de Distribuição de Frequências

ni → Efectivo observado ou frequência absoluta do subconjunto associado à


modalidade M i - número de vezes que um acontecimento ou fenómeno é observado.

ni
fi = → Frequência relativa, sendo N o número total de efectivos – número de
N
vezes que um acontecimento ou fenómeno é observado em relação ao número total
de casos.
j
N j =  ni → Frequência absoluta acumulada. Só tem sentido em variáveis
i =1
numéricas ou ordinais. Soma das frequências absolutas dos valores observados
menores ou iguais a xi
j
Nj
Fj =  fi = → Frequência relativa acumulada. Só tem sentido em variáveis
i =1 N
numéricas ou ordinais. Soma das frequências relativas dos valores observados
menores ou iguais a xi

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


4
Tabelas de Frequências – Exemplo 1

Questionaram-se os alunos do 1.º ano do curso TeSP quanto ao número de


irmãos que cada um possuía.

Variável estatística: nº de irmãos – quantitativa discreta


𝒏 = 𝟐𝟎

Dados:
1 2 2 0 1 0 0 1 1 1
1 3 1 2 1 1 0 1 3 1

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


5
Tabelas de Frequências – Exemplo 1
Nº de Freq. Fr. Relativa
Freq. Abs. Freq. Relativa
irmãos Absoluta Acumulada
Acumulada (𝑵𝒊 )
(𝑿) (𝒏𝒊 ) 𝒇𝒊 𝒇𝒊 % 𝑭𝒊 𝑭𝒊 %

0 4 4 4/20=0,2 20% 0,2 20%

1 11 4+11=15 11/20=0,55 55% 0,75 75%

2 3 15+3=18 3/20=0,15 15% 0,9 90%

3 2 18+2=20 2/20=0,1 10% 1 100%

Total 20 -- 1 100% -- --

Questões:
Quantos alunos têm pelo menos 2 irmãos?
Que percentagem dos alunos não tem irmãos?
GESTÃO PÚBLICA | ESTATÍSTICA APLICADA
6
Tabelas de Frequências – Exemplo 2
No quadro seguinte representa-se a distribuição de frequências (também
denominada distribuição empírica) do número de indivíduos por agregado doméstico
privado no Continente (INE, 1992).

Número de Indivíduos Frquências Absolutas Frequências Relativas Frequências Absolutas Acumuladas Frequências Relativas Acumuladas
1 1138 0,118 1138 0,118
2 2748 0,285 3886 0,403
3 2304 0,239 6190 0,642
4 2082 0,216 8272 0,858
5 848 0,088 9120 0,946
6 520 0,054 9640 1,000
Total 9640 1,000

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


7
Relativamente à distribuição de frequências anteriormente
apresentada, indique:

a) Percentagem de agregados com 4 elementos.


Resposta: 21,6%

b) Percentagem de agregados com no máximo 3 elementos.


Resposta: 64%

c) Número de agregados com número de elementos superior a 4.


Resposta: 1368

d) Número de agregados com número de elementos inferior a 3.


Resposta: 3886

e) Percentagem de agregados com número de elementos superior ou


igual a 2 e inferior a 5.
Resposta: 74%

f) Percentagem de agregados com pelo menos 5 elementos.


Resposta: 14.2%

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


8
A construção de quadros de frequências para variáveis discretas não apresenta quaisquer
dificuldades. No caso das variáveis contínuas o processo é um pouco mais elaborado e
compreende vários passos:
1. Definição das classes de valores.
2. Contagem dos valores pertencentes a cada classe.
3. Para classes de valores de uma variável contínua tomam-se em regra,
intervalos, correntemente designados por intervalos de classe. A definição das
classes consiste, portanto, na fixação dos limites desses intervalos ou limites de
classes.
As classes podem ter amplitude constante ou variável.
A escolha do número de classes e da sua amplitude faz-se, geralmente, em função dos
efectivos da população, de forma a que o número de efetivos em cada classe seja
suficiente para eliminar as flutuações que se produzem quando se consideram classes
com poucos efetivos (risco que se corre ao considerar um número muito elevado de
classes). Pelo contrário um número muito limitado de classes conduz a uma maior perda
de informação.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


9
Regra geral, escolhe-se a amplitude das classes de forma a que os efectivos de cada
classe sejam duma ordem de grandeza análoga. A natureza do estudo a efectuar
também influi no número de classes a escolher.

Existem contudo algumas regras que auxiliam na determinação do número de classes:

Critério de Sturges → k = 1+ log 2 n (k = número de classes)

Regra da raiz quadrada → k n (usualmente empregue quando n  25 )

Regra da Potência de 2 → k = menor valor inteiro tal que 2 ≥n k

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


10
Agrupar em Classes – Exemplo 3
Um dos principais indicadores da poluição atmosférica nas grandes cidades é a
concentração de ozono na atmosfera. Num dado verão registou-se 78 valores dessa
concentração, numa dada cidade:

São dados de natureza contínua.


Neste caso, ou para dados de natureza discreta quando o número de observações distintas
é elevado, elabora-se a tabela de frequências do seguinte modo:
1º Determinar valor máximo e valor mínimo:
Valor Máximo = 11.5 e Valor Mínimo = 1.1

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


11
Exemplo: Agrupar dados em classes (cont)

2º Determinar o número de classes, k:


• Pela regra de Sturges: k= 1+ log278= 1+ ln78/ln2  7,29 → k=7
• Pela regra da raíz: → k=8
• Pela regra da potência de 2: 26 = 64 < 78 e 27 = 128 >78. Portanto, k=7.
• Neste caso, considere-se k=7.

3º Determinar a amplitude das classes, h. Amplitude dos dados

Mínimo Máximo

Dividir em k classes de igual amplitude

→ Considere-se h=1.5

4º - Determinar as classes:
1ª classe: [1.1; 1.1+1.5[ → [1.1; 2.6[ 2ª classe: [2.6; 2.6+1.5[ → [2.6; 4.1[
(…) 7ª classe: [10.1;10.1+1,5 [ → [10.1; 11.6[

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


12
Exemplo: Agrupar dados em classes (cont)

5º - A tabela de frequências constrói-se contando quantos elementos do conjunto de dados pertencem a


cada uma das classes

X ni
[1.1;2.6[ 10
[2.6;4.1[ 16
[4.1;5.6[ 18
[5.6;7.1[ 26
[7.1; 8.6[ 5
[8.6;10.1[ 2
[10.1;11.6[ 1

TOTAL 78

Outra hipótese para a construção das classes pode ser iniciar o processo considerando a
classe ] − h/2, + h/2], onde representa a média aritmética do conjunto de dados. A partir
desta, formar-se-ão as classes subtraindo h e somando h ao extremo inferior e superior,
respetivamente, para ir determinando as classes inferiores e superiores àquela classe. Para
que todo o suporte da amostra fique coberto são necessárias k + 1 classes.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


13
Variáveis Quantitativas Contínuas – Exemplo 4
A Tabaqueira, SA faz um apertado controlo da qualidade dos cigarros que produz; o peso
é uma das características rigorosamente acompanhadas. Com os pesos de uma amostra
de 500 cigarros “SG Filtro” construiu-se a seguinte tabela de distribuição de frequências:

X ni fi Ni Fi
[760;780[ 4 0,008 4 0,008
[780;800[ 43 0,086 47 0,094
[800;820[ 118 0,236 165 0,330
[820;840[ 168 0,336 333 0,666
[840;860[ 117 0,234 450 0,900
[860;880[ 39 0,078 489 0,978
[880;900[ 11 0,022 500 1

TOTAL 500 1

(adaptado de B. Murteira: Análise Exploratória de Dados, McGraw-Hill, 1999 e Apontamentos leccionados


na cadeira de Probabilidades e Estatística pelo Professor Mário Basto, IPCA)

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


14
Relativamente à distribuição de frequências anteriormente
apresentada, indique:

a) Número de cigarros “SG Filtro” com peso superior ou igual a 860 gramas e
inferior a 880 gramas.
Resposta: 39 cigarros.

b) Percentagem de cigarros “SG Filtro” com pelo menos 820 gramas de peso.
Resposta: 67%

c) Percentagem de cigarros “SG Filtro” com peso inferior a 820 gramas.


Resposta: 33%

d) Número de cigarros “SG Filtro” com peso superior ou igual a 860 gramas.
Resposta: 50

e) Número de cigarros “SG Filtro” com peso superior ou igual a 800 gramas e
inferior a 860 gramas.
Resposta: 403

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


15
2. Representação Gráfica
Os gráficos mostram a relação entre variáveis ou mostram o valor de uma dada variável
ou fenómeno. Gráficos são imagens de efeito visual efectivo que:

1. Transmitem a informação de forma rápida e eficaz;


2. Permitem melhor interpretação da informação do que
uma tabela;
3. Podem revelar uma tendência.
4. Uma imagem informativa pode ser manipulada e
transmitir imagens enganadoras de forma propositada ou
como resultado de um mau manuseamento dos dados.

Por isso é importante começar por compreender os dados e saber qual o gráfico que
melhor se adequa à representação dessa informação.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


16
Um bom gráfico deve:

1. Mostrar factos;

2. Captar a atenção do leitor;

3. Completar ou demonstrar os factos apresentados (em texto ou tabela);

4. Ter um título e legenda;

5. Ser simples e objetivo;

6. Mostrar a informação sem a alterar ou deturpar;

7. Evidenciar os aspetos essenciais

8. Visualmente ser correto


(por ex, se temos o valor 15 e 30, o valor 30 deve ter o dobro do tamanho do valor 15)

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


17
Exemplo 5:
Gráficos por sector ou circulares

Gráficos de Linha Gráficos em anel Pictogramas

in Apontamentos leccionados na cadeira de Probabilidades e Estatística pelo Professor Mário Basto, IPCA
GESTÃO PÚBLICA | ESTATÍSTICA APLICADA
18 18
Representações gráficas – Variáveis quantitativas e qualitativas

Diagrama Circular
• Permite representar dados quer quantitativos quer qualitativos
• Adequados a dados representados por poucas categorias
• A amplitude de cada secção é proporcional à frequência da correspondente
categoria

ANO LECTIVO 2011/12 | GESTÃO PÚBLICA & FISCALIDADE E CONTABILIDADE| ESTATÍSTICA APLICADA 19
2.1 Representações gráficas - Variáveis Discretas

No caso da variável ser discreta o primeiro tipo de representação em


termos de frequências simples (diagrama diferencial) obtém-se com o
gráfico de barras .

A representação em termos das frequências relativas é mais significativa


na comparação de diagramas de distribuições que tenham um desigual
número de observações.

Gráfico de Barras
• Permite representar dados qualitativos ou quantitativos discretos
• No eixo horizontal (Ox), é marcado o valor das categorias
• Nesses pontos, são desenhadas barras verticais de altura igual à
frequência absoluta (ou relativa ou acumulada).
• A largura das barras verticais deve ser constante.
• As barras devem estar separadas

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


20
Exemplo 6: Diagrama de barras da distribuição do número de indivíduos por agregado
doméstico privado em termos de frequências absolutas.

Número de indivíduos por agregado doméstico privado

1 2 3 4 5 >6

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


21
Exemplo 6 (continuação): Diagrama de barras da distribuição do número de indivíduos
por agregado doméstico privado em termos de frequências relativas.

Número de indivíduos por agregado doméstico privado

6

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


22
2. 1 Representações gráficas - Variáveis Discretas

Outro tipo de representação serve-se do conceito de frequências acumuladas:


Gráfico de frequências acumuladas ou diagrama integral.

Frequências Relativas Acumuladas


0,9

0,8
Número de Indivíduos Frequências Relativas Acumuladas
0,7
1 0,118
0,6
2 0,403
0,5
3 0,642
4 0,858 0,4

5 0,946 0,3
6 1 0,2

0,1

0
-3 -2 -1 0 1 2 3 4 5 6 7 8

Número de Indíviduos

in Apontamentos leccionados na cadeira de Probabilidades e Estatística pelo Professor Mário Basto, IPCA

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


23
A leitura das frequências acumuladas de uma certa distribuição pode também ser feita
através da chamada Função Cumulativa ou Função Distribuição Empírica, F*(x).
1

Frequências Relativas Acumuladas


0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-3 -2 -1 0 1 2 3 4 5 6 7 8
Número de Indíviduos

Número de Indivíduos Frequências Relativas Acumuladas


1 0,118
2 0,403
3 0,642
4 0,858
5 0,946
6 1

Notar que apesar da variável discreta só tomar os a sucessão de valores x1, x2, x3,…, xn o
domínio da Função Cumulativa é IR.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


24
2.2 Representações gráficas - Variáveis Contínuas

A representação gráfica das frequências relativas ou absolutas de variáveis


contínuas é obtida por meio de um diagrama de áreas, o HISTOGRAMA
(diagrama diferencial), formado por uma sucessão de rectângulos adjacentes
tendo cada um por base um intervalo de classe e por altura a respetiva
frequência absoluta ou relativa, dividida pela amplitude do intervalo de classe.

Histograma

• Permite representar dados quantitativos contínuos ou discretos agrupados


em classes
• Consiste numa sucessão de retângulos adjacentes, tendo cada um por base
um intervalo de classe
• A altura (ou a área) de cada retângulo é igual à frequência (absoluta ou
relativa)
• A largura das barras corresponde à amplitude das classes

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


25
2.2 Representações gráficas - Variáveis Contínuas

HISTOGRAMA

A área do retângulo da classe Ij é nj ou fj, consoante os casos. A área total é N na


hipótese de se empregarem as frequências absolutas ou 1 se se aplicarem
frequências relativas. O segundo processo é o mais indicado por tornar
significativa a comparação das distribuições com desigual número de observações.

Quando os intervalos de classe possuem a mesma amplitude – e não estão em


causa comparações – é usual, para facilitar a visualização e a leitura das
frequências, tomar a altura dos retângulos igual (ou proporcional) às frequências
absolutas ou relativas.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


26
Algumas questões importantes na construção de um histograma:
Adaptado do site www.alea.pt

Para construir um histograma, quais as alturas que se devem


considerar para os rectângulos?
Se se pretende que a área do rectângulo, correspondente à classe Ci seja
ni ou fi, então a altura desse rectângulo deverá ser ni/h, ou fi/h,
respectivamente, onde h representa a amplitude das classes.

Se tomarmos para altura dos retângulos que constituem o histograma


as frequências, as áreas desses retângulos não serão iguais às
frequências, mas sim proporcionais ! Haverá problema? Qual a
constante de proporcionalidade?
Não há problema quando as classes têm todas a mesma amplitude ! A
constante de proporcionalidade é h, e a área total ocupada pelo
histograma será h ou n*h, conforme se utilizarem as frequências
relativas ou absolutas

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


27
2.2 Representações gráficas - Variáveis Contínuas

Outra forma de representação gráfica é conhecida por POLÍGONO DE


FREQUÊNCIAS e resulta de unir sucessivamente, por segmentos de reta, os
pontos médios dos lados superiores dos retângulos.

Polígono de frequências

• Obtém-se unindo, através de segmentos de reta, os pontos médios das


bases superiores dos retângulos representados no histograma
• Devem ser adicionados dois intervalos de classe, no início e no fim, com
frequência nula.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


28
Exemplo 7:

Histograma e polígono de frequências (diagramas diferenciais):

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


29
Exemplo 7 (continuação):

Diagrama Integral - Polígono de frequências acumuladas ou Ogiva:

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


30
RESUMO

VARIÁVEIS DISCRETAS VARIÁVEIS CONTÍNUAS

GRÁFICO DE BARRAS HISTOGRAMA E


DIAGRAMA DIFERENCIAL POLÍGONO DE FREQUÊNCIAS

Representação gráfica das


frequências relativas ou das
frequências absolutas.

DIAGRAMA EM ESCADA POLÍGONO DE FREQUÊNCIAS


DIAGRAMA INTEGRAL ACUMULADAS (OGIVA)

Representação gráfica das


frequências relativas acumuladas
ou das frequências absolutas
acumuladas.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


31
3. Referências Bibliográficas

• B. Murteira: Análise Exploratória de Dados, McGraw-Hill, 1999


• D. Pestana, S. Velosa: “Introdução à Probabilidade e à Estatística”, Vol. I, 4ª Ed.,
Fundação Calouste Gulbenkian
• R. Guimarães, J. Sarsfield Cabral: Estatística, 2º Ed., McGraw-Hill, 2007.
• M. Berenson, D. Levine et al: Basic Business Statistics: Concepts and Applications,
Prentice Hall, 2004
• Newbold, P.; Carlson, W. L.; Thorne, B: Statistics for Business and Economics, Pearson
Higher Education, 2002
• Neves, Maria Manuela: Introdução à Estatística e à Probabilidade, Instituto Superior
de Agronomia, 2007
Internet
•ALEA - Acção Local de Estatística Aplicada: alea-estp.ine.pt
Apontamentos IPCA
•Professor Mário Basto, apontamentos leccionados na cadeira de Probabilidades e
Estatística.

GESTÃO PÚBLICA | ESTATÍSTICA APLICADA


32

Você também pode gostar