Você está na página 1de 10

TEMA 1 – ESTATÍSTICA DESCRITIVA

Aula Teórica 2

Disciplina: Estatística Ano/Semestre: 3º Ano/1º Semestre

Carga horária: 3 H/semana;

Docente: Amândio António

OBJECTIVOS ESPECÍFICOS
 Identificar os diferentes tipos de uso de informação estatística.
 Sumarizar dados utilizando tabelas e gráficos.
 Interpretar dados utilizando as medidas de tendência central e dispersão.

CONTEÚDOS PROGRAMÁTICOS
1. ESTATÍSTICA DESCRITIVA
1.3. Formas de representação tabular e gráfica
1.3.1. Tabelas de frequência para dados uni variados.
1.3.2. Gráficos para dados univariados.

1.3. Formas de representação tabular e gráfica.


Quando se estuda uma variável, o maior interesse do pesquisador é conhecer o comportamento
dessa variável, analisando a ocorrência de suas possíveis realizações. Isto pode-se conseguir,
inicialmente, apresentando os valores das variáveis em tabelas e gráficos, que irão fornecer
rápidas e seguras informações a respeito das variáveis em estudo, permitindo determinações
administrativas e pedagógicas mais coerentes e científicas.
Definição:
 Tabela é um quadro que resume um conjunto de observações.
 Gráfico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de
produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do
fenómeno em estudo.

1 de 10 Agosto de 2019
Os métodos tabulares e gráficos da estatística descritiva permitem sintetizar um conjunto de
dados para rapidamente poder-se tirar conclusões e permitir tomada de decisões. No entanto, ao
incluir uma tabela em um trabalho, a sua identificação deve aparecer na parte superior, precedido
pela palavra Tabela e seguida de seu número de ordem de ocorrência no texto (algarismos
arábicos), de seu respetivo título e da fonte onde extraiu os dados. Uma regra básica para
elaboração adequada do título de qualquer tabela, é verificar se o mesmo responde a três
exigências: o quê, onde e quando. No entanto, ao incluir no gráfico, o nome do gráfico deve
aparecer na parte inferior seguindo as mesmas regras de atribuição exigida a uma tabela.

1.3.1. Tabela de frequência para dados univariados.


Um conjunto de dados com n observações pode ser facilmente resumido num quadro que se
designa de tabela de frequências. Esta tabela facilita um acesso rápido ao número, à percentagem
ou a proporção de elementos observados com uma determinada característica ou valor intervalo
de valores (as chamadas classes).
Durante o curso de estatística, vamos usar as notações:
At … Amplitude total (amplitude do conjunto de dados).

n … Tamanho da amostra.

N … Tamanho da população.

k ... Número de classes.


c , ou h… Amplitude de classe.

fi … Frequência simples absoluta de categoria/valor ou classe de valores i.


fi
fr 
n … Frequência simples relativa de categoria/valor ou classe de valores i.

Fi … Frequência absoluta acumulada de categoria/valor ou classe de valores i.

Fi
Fr 
n … Frequência absoluta relativa acumulada de categoria/valor ou classe de valores i

Quando os dados são de natureza qualitativa ou quantitativa discreta.

Feita a coleta, os dados originais ainda não se encontram prontos para análise, pelo facto de não
estarem numericamente organizados. Por essa razão, costuma-se designar de dados brutos.

2 de 10 Agosto de 2019
Chamam-se dados brutos aos dados que são obtidos diretamente da pesquisa, isto é, ainda não
sofreram nenhum processo de síntese ou análise.

De modo a se obter uma contagem mais precisa e menos confusa dos dados, aconselha-se a
ordená-los de forma crescente ou decrescente. Esta forma de organizar os dados se o nome de
Rol.

Por exemplo:

Para os seguintes dados, relativos ao numero de acidentes mensais em 38 meses na cidade de


Maputo de Janeiro de 2012 à Janeiro de 20141 :

3 3 2 3 5 1 2 1 4 4 2 2 3 6 4 5 1 1 1
4 8 6 4 2 2 3 4 3 5 6 3 5 5 5 8 5 5 4
1 1 1 4 1 1 1 2 2 1 1 1 1 2 1 1 2 2 3
4 3 6 5 2 3 2 5 6 4 6 5 3 1 3 4 5 6 5

O rol para estes dados é (do menor ao maior):

12 12 12 13 13 13 13 14 14 14 14 14 15 15 15 16 16 21 23
23 25 25 26 26 26 26 34 34 35 35 38 43 45 45 45 52 58 65

Ou em ordem decrescente (do maior para o menor):

65 58 52 45 45 45 43 38 35 35 34 34 26 26 26 26 25 25 23
23 21 16 16 15 15 15 14 14 14 14 14 13 13 13 13 12 12 12

A tabela de frequência para estes dados é:

1
Estes dados não são reais. Trata-se apenas de um exemplo.

3 de 10 Agosto de 2019
Tabela 1: Número de acidentes registados na cidade de Maputo no de Janeiro de 2012 à Janeiro
de 2014
Frequênci
Frequênci Frequênci Frequênci as
Frequênci Frequênci as Simples as as Acumulad
Dado
as Simples as Simples Relativas Acumulad Acumulad as
s
Absolutas Relativas Percentuai as as Relativas
s Absolutas Relativas Percentuai
s
12 3 0,079 7,9 3 0,079 7,89
13 4 0,105 10,5 7 0,184 18,42
14 5 0,132 13,2 12 0,316 31,58
15 3 0,079 7,9 15 0,395 39,47
16 2 0,053 5,3 17 0,447 44,74
21 1 0,026 2,6 18 0,474 47,37
23 2 0,053 5,3 20 0,526 52,63
25 2 0,053 5,3 22 0,579 57,89
26 4 0,105 10,5 26 0,684 68,42
34 2 0,053 5,3 28 0,737 73,68
35 2 0,053 5,3 30 0,789 78,95
38 1 0,026 2,6 31 0,816 81,58
43 1 0,026 2,6 32 0,842 84,21
45 3 0,079 7,9 35 0,921 92,11
52 1 0,026 2,6 36 0,947 94,74
58 1 0,026 2,6 37 0,974 97,37
65 1 0,026 2,6 38 1,000 100,00
Total 38          

Repare que construir uma tabela de frequências pode ser facilmente feito por um software ou
com ajuda de uma calculadora. O mais importante neste caso é saber interpretar a tabela.

Neste caso, podemos dizer em relação à:

a) Amplitude: O número máximo de acidentes verificado nos 38 meses foi de 65 avarias e


contra um mínimo de 12 avarias.

b) Frequência: A maior ocorrência mensal foi de 14 acidentes, o que corresponde a 13,2%


dos meses.

c) Frequência acumulada (relativa percentual): Em cerca de 53% dos meses verificaram-


se não mais do que 23 acidentes mensais.

4 de 10 Agosto de 2019
A distribuição apresentada anteriormente é valida para dados de natureza quantitativa discreta.
Vamos supor que dispomos de dados de natureza qualitativa. Como fazer a distribuição de
frequências.

Seja o seguinte exemplo:

Uma das perguntas de um questionário sobre o grau de satisfação dos estudantes de uma
determinada universidade tinha a seguinte questão: “Qual é o seu grau de satisfação em relação
aos balneários da universidade?”.

As respostas apresentadas numa escala de Likert (1. Muito Satisfeito, 2. Satisfeito, 3. Indiferente,
4. Insatisfeito e 5. Muito Insatisfeito) foram:

1 1 2 5 4 3 5 1 2 3
4 2 3 2 1 2 4 5 2 1
3 5 4 1 2 3 2 1 2 3
2 1 2 3 2 1 4 5 4 1
2 3 2 1 1 2 1 4 5 5
3 3 2 5 2 3 2 1 4 2
De acordo com os dados apresentados, qual é a opinião dos estudantes sobre o grau de satisfação
em relação aos balneários da universidade:

Tabela 2: Grau de satisfação dos estudantes de uma dada universidade em relação aos balneários
em um determinado ano.
Grau de Frequência Freq. Freq. Freq.
Freq. Rel.
Satisfação s Perc. Acum Acum.%
Muito Satisfeito 14 0,233 23,3 14 23,3
Satisfeito 19 0,317 31,7 33 55,0
Indiferente 11 0,183 18,3 44 73,3
Insatisfeito 8 0,133 13,3 52 86,7
Muito isatisfeito 8 0,133 13,3 60 100,0
Total 60        

Pode-se ver na tabela que no geral, os estudantes estão satisfeitos com os balneários. Dos 60
intuídos, apenas 16 não estão satisfeitos.

Quando os dados são de natureza quantitativa contínua.

Na elaboração de tabelas de frequências, deve-se ter sempre em conta o tipo de variável


envolvida. Para variáveis de natureza contínua, convém olha-se para uma outra abordagem de

5 de 10 Agosto de 2019
resumo de dados em tabelas. Isto é, há que organizá-los em uma tabela em que os dados
aparecem organizados em intervalos de classes.

Dentre os diferentes métodos de organização de dados em classes, consideremos os passos de


uma das regras:

 ln n 
k 1
1. Determinar o número k de classes:  ln 2  (regra de Sturges). Repare que o
resultado que aparece entre parentes rectos, deve ser tomado sempre a parte inteira do
resultado (por exemplo: [5,1] = 5, [5,9] = 5).

2. Determinar a amplitude do conjunto de dados At  máximo  mínimo .

At
c
3. Determinar a amplitude de cada classe k .

4. Construir as classes ci da seguinte forma:

c1  [min; min  c[
c2  [min  c; min  2  c[
c3  [min  2  c; min  3  c[
...
ck  [min  (k  1)  c; min  k  c[

Exemplo:
Considere o peso de uma amostra de 36 elementos de uma dada comunidade.
Tabela 3: Peso de uma amostra de elementos de uma comunidade
45 47 49 50 51 50 52 53 59
54 58 65 55 73 63 67 56 64
60 62 71 56 61 65 61 71 56
57 59 60 57 62 68 67 59 61

 ln n  ln 36
k  1   1  5,17  1  6
Passo 1:  ln 2  ln 2

Passo 2: At  máximo  mínimo  73  45  28


28
c  4, 6  5
Passo 3: Decidir o número de classes: 6

6 de 10 Agosto de 2019
c1  [45; 45  5[ [45;50[
c2  [50; 45  2  5[ [50;55[
c3  [55; 45  3  5[  [55;60[
...
Passo 4: c6  [45  (6  1)  5; 45  6  5[ [70;75[

Tabela 4: Distribuição de frequências


Classes f fr F Fr Marca de
Classe2
[45 – 50[ 3 0.08 3 0.08 47.5
[50 – 55[ 6 0.17 9 0.25 52.5
[55 – 60[ 10 0.28 19 0.53 57.5
[60 – 65[ 9 0.25 28 0.78 62.5
[65 – 70[ 5 0.14 33 0.92 67.5
[70 – 75[ 3 0.08 36 1.00 72.5
Total 36

1.3.2. Gráficos para dados univariados


A representação gráfica de dados é a de mais fácil perceção, já que a figura de “maior” e de
“menor” área é a que rapidamente nos cai à vista.
A construção de um gráfico, contrariamente a de uma tabela, é de fácil compressão. Todavia, há
que antes de mais, avaliar o tipo de variável em presença para representar os dados num
diagrama. Existem vários diagramas/gráficos para a representação de dados. Mas, mas serão
apresentados apenas os gráficos básicos: o gráfico circular, gráfico de barras e o histograma.
Mais adiante, quando se estiver a estudar medidas separatrizes, vamos apresentar a caixa de
bigodes.

Gráficos para dados qualitativos


Para dados de natureza qualitativa, os gráficos a usar são:
 Gráfico de barras3
Os gráficos de barras têm como finalidade comparar grandezas, por meio de rectângulos de igual
largura e alturas proporcionais às respectivas grandezas. Cada barra (coluna) representa a
intensidade de uma modalidade do atributo.

Há quatro orientações gerais observadas na construção de um gráfico em barras:


2
Também chamado ponto médio de uma classe – ponto que divide o intervalo de classe em duas partes iguais.
3
Um gráfico que exibe os dados em forma de barras posicionadas horizontalmente ou verticalmente

7 de 10 Agosto de 2019
1. As barras só diferem em comprimento, e não em largura, a qual é arbitrária.
2. As barras devem vir separadas umas das outras pelo mesmo espaço, o qual deve ser
suficiente para que as inscrições que identificam as diferentes barras não tragam confusão
ao leitor. Como regra prática pode-se tomar o espaço entre as barras como
aproximadamente a metade ou dois terços de suas larguras.
3. As barras devem ser desenhadas observando sua ordem de grandeza, para facilitar a
leitura e análise comparativa dos valores. Normalmente, a ordem é decrescente, a barra
superior representa o maior valor.
4. Um gráfico, construído para mostrar grandezas absolutas, deverá ter uma linha zero
claramente definida e uma escala de quantidade ininterrupta, caso contrário a leitura e a
interpretação do gráfico poderão ficar distorcidas.

Muitas vezes, costuma-se colocar no topo ou no interior de cada coluna o valor


correspondente à sua altura. Esse procedimento permite eliminar a escala. Recordar que os
gráficos de barras podem aparecer de diversas maneiras.

 Gráfico circular4
Os gráficos circulares são usados para representar valores absolutos ou percentagens

4
Gráfico de composição em sectores, sendo em forma de “pizza” o mais conhecido, destina-se a representar a
composição, usualmente em percentagem. O gráfico em sectores não é uma representação adequada de relações ao
longo do tempo, ou relações entre várias variáveis. Como regra geral, um gráfico em sectores não deve exigir mais
do que sete secções.

8 de 10 Agosto de 2019
complementares. Para construi-los, parte-se do facto de que o número total de graus de um
arco de circunferência é 360. Assim, o número total de valores analisados (100%, para
representar as percentagens complementares) corresponderá a 360º.

Gráficos para dados quantitativos


Para variáveis quantitativas podemos considerar uma variedade maior de representações gráficas.
Neste estudo, irá se considerar apenas o Histograma.
O histograma é um gráfico formado por um conjunto de rectângulos justapostos, de forma que a
área de cada rectângulo seja proporcional à frequência da classe que ele apresenta. Assim sendo,
a soma dos valores correspondentes à áreas dos rectângulos será sempre igual à frequência total.
Para determinar a altura do rectângulo, basta tomar a fórmula de cálculo da área de um
rectângulo:
S
h=
b
b... base do rectângulo = amplitude do intervalo de classe
S... área do rectângulo = frequência da classe
h... altura do rectângulo

Exemplo: Duração das chamadas telefónicas. Uma empresa, preocupada com os gastos em
telefone, decidiu fazer um estudo sobre a duração (em minutos) das chamadas telefónicas.
Assim, o departamento de controlo de qualidade recolheu uma amostra de dimensão 100, tendo
construído a seguinte tabela de frequências com os dados recolhidos:

Classes Freq. Absolutas Freq. Relativa


[0,2[ 28 0,28
[2,5[ 37 0,37

9 de 10 Agosto de 2019
[5,10[ 23 0,23
[10,20[ 9 0,09
[20,30[ 3 0,03
Total 100 1,00

O histograma correspondente aos dados é:

10 de 10 Agosto de 2019

Você também pode gostar