Você está na página 1de 16

Estatística Básica - Prof.

Leonardo Mendes 8
2. Construção de Tabelas:

Exemplo: Tabela 1: População residente no Brasil, segundo o sexo, de acordo com


o censo demográfico de 2010.
Sexo População residente %
Homens 93 406 990 49,0
Mulheres 97 348 809 51,0
Total 190 755 799 100,0
Fonte: IBGE, Censo Demográfico 2010 1

As tabelas são compostas de:

Título: explica e tipo de dado que a tabela contém, colocado no topo da tabela.
Corpo: formado pelos dados, distribuídos em linhas e colunas (os atributos
categóricos e numéricos).
Cabeçalho: especifica a informação apresentada em cada coluna (sexo, população
residente e %).

Sexo População residente %

Coluna indicadora: o tipo de informação que cada linha contém, por exemplo:

Homens
Mulheres
Total

• Não podem existir linhas externas fechando a tabela; neste caso, recebe o nome
de Quadro.

Outros componentes: fonte, notas e chamadas.

Fonte: a entidade responsável pelo fornecimento dos dados (IBGE). Coloca-se no


rodapé da tabela.
Notas: são informações adicionais para esclarecer o conteúdo das tabelas ou para
explica o método utilizado no levantamento dos dados.
Coloca-se após a fonte, se houver.
Chamadas: são informações de natureza especifica que servem para explicar ou
conceituar determinados dados.

As chamadas:
i) Devem ter um algarismo arábico entre parênteses, escrito à esquerda da
casa quando a chamada é feita no corpo da tabela e à direita da coluna
indicadora quando a chamada é feita nessa coluna.
ii) Havendo mais de uma chamada, pôr em ordem crescente, de cima para
baixo e separado por pontos, no rodapé da tabela.

__________
1 Disponível em
ftp://ftp.ibge.gov.br/Censos/Censo_Demografico_2010/Caracteristicas_Gerais_Religiao_Deficiencia/caracte
risticas_religiao_deficiencia.pdf
Estatística Básica - Prof. Leonardo Mendes 9
Exemplo: Tabela 2: População residente no Brasil, segundo o ano do censo
demográfico.
Ano do Censo População (Habitantes)
1940(1) 41 236 315
1950 (1) 51 944 397
1960(1) 70 191 370
1970 93 139 037
1980 119 002 706
1991 146 815 796
2000 169 799 170
Fontes: IBGE (1984); IBGE (1996); IBGE (2003).
(1) População presente.

• O nº. (1) é uma chamada e não uma nota, pois explica apenas três linhas da
tabela; a nota explica a tabela toda.

Normas e Procedimentos:

1) As tabelas devem ser delimitadas no alto e embaixo, por traços horizontais, podem
ter traços mais fortes na parte externa da tabela e não devem ser delimitadas à
esquerda e à direita.

2) Podem ser feitos traços verticais no interior da tabela, separando as colunas.

3) Devem ser numeradas com algarismos arábicos e pode ser adotada a numeração
progressiva por seções.
Ex.: Tabela 1.1, Tabela 1.2, ...

4) A finalidade da tabela é apresentar dados numéricos, e não deve ter mais casas
(células) sem número do que casas com números.

5) O texto da tabela deve estar em posição, de modo que não exija a rotação da
página. Caso não seja possível (devido ao comprimento), pôr de forma que para a
leitura, seja feita uma rotação no sentido horário.

6) Em dados obtidos por meio de perguntas ou entrevistas, se parte das pessoas não
respondeu a determinada pergunta, essa informação deve ser apresentada sob a
especificação: “Sem declaração”.
(ver Tabela 6)

7) Quando dois ou mais tipos de informação (ex. respostas de questionário) tiverem


sido agrupadas em um só conjunto, esse conjunto entra na tabela sob a
denominação: “Outros”.
(ver Tabela 5)

8) Nenhuma célula deve ficar em branco. Toda célula deve apresentar um número ou
um sinal, segundo a convenção:

• 0; 0.0; 0.00 (zero): o dado existe resultante de arredondamento, mas seu


valor é inferior à metade da unidade de medida adotada na tabela.
• – (traço): o dado não existe (ex. sem declaração).
Estatística Básica - Prof. Leonardo Mendes 10

• ... (reticências): o dado é desconhecido, podendo o fenômeno existir ou não.


• x (xis): dado omitido, a fim de evitar a individualização da informação
(identificação da fonte).

9) Para tabelas muito longas, que precisam ser escritas em 2 (duas) ou mais páginas:
• O cabeçalho deve ser repetido em todas as páginas; o título, só na primeira
página.
• Nas demais páginas escrevem-se “continua” e, na última, “conclusão”.
• O traço inferior que delimita a tabela deve ser colocado na última página.

10) Para tabelas com muitas linhas e poucas colunas podem ser organizadas em duas
ou mais partes:
• Escritas lado a lado, separadas por traços verticais duplos (||).
• O cabeçalho deve indicar o conteúdo em todas as partes

Exemplo:

Idade Peso Idade Peso Idade Peso

11) Tabelas com muitas colunas precisam ocupar 2 (duas) páginas que se
confrontam.
• As linhas devem receber um nº. de ordem, que deve ser escrito na primeira
coluna da página à esquerda e na última coluna da página à direita.

Exemplo:

10 11

Tabela 1.1 Tabela 1.1


Nº. de ordem A B C... ... X Y Z Nº. de ordem
1 1
2 2
M M
20 20

12) As tabelas devem ter significado próprio, isto é, devem ser entendidas mesmo
quando não se lê o texto em que estão apresentadas.

13) Toda tabela tem necessariamente título e corpo. Os outros componentes podem
até não existir, embora isto dependa da natureza do problema e nunca do gosto de
quem faz a tabela.
Estatística Básica - Prof. Leonardo Mendes 11

3. Séries Estatísticas:

⇒ É toda e qualquer coleção de dados estatísticos referidos a uma mesma ordem de


classificação: quantitativa (discreta ou contínua).

Série: sucessão de números referidos a qualquer variável. Se os números expressarem


dados estatísticos, ela será chamada de série estatística.

Uma série estatística difere de outra por três características:

• A época: fator temporal ou cronológico.


• O local: fator geográfico ou espacial.
• O fenômeno: espécie do fato ou fator especificativo.

1) Série temporal: é feita para apresentar dados observados ao longo do tempo.


a. Deve-se observar rigorosamente a ordenação de dias, meses e anos.
b. É também chamada de série cronológica, histórica ou evolutiva.
c. O local e o fenômeno são fixos.

Tabela 3: Taxa de analfabetismo das pessoas de 15 anos ou


mais de idade Brasil – 1940/2010
Ano Taxa de analfabetismo
1940 56,0
1950 50,5
1960 39,6
1970 33,6
1980 25,5
1991 20,1
2000 13,6
2010 9,60
Fonte: IBGE, Censo Demográfico 2010.

2) Série geográfica: é feita para apresentar dados de diferentes regiões geográficas.


a. Devem-se escrever países segundo o continente; municípios e cidades
segundo a unidade de federação; distritos e vilas segundo o município.
b. Também chamada de série territorial, espacial ou de localização.
c. A época e o fenômeno são fixos.

Tabela 4: Percentual de pessoas com 10 anos e mais que


declararam rendimento até um salário mínimo, segundo as grandes
regiões do país.
Região Percentual
Brasil 25,3
Norte 32,8
Nordeste 48,0
Sudeste 16,0
Sul 18,8
Centro-Oeste 22,3
Fonte: Retrato do Brasil. Folha de São Paulo, São Paulo, 21 dez. 2002.

Obs.: O IBGE mostra os dados de todo o Brasil com a entrada Brasil na primeira linha.
Estatística Básica - Prof. Leonardo Mendes 12

3) Série específica: é feita para apresentarem dados que se distribuem em diferentes


categorias.
a. Também chamada de série categórica ou por atributos.
b. A época e o local são fixos.

Tabela 5: Pessoas com curso superior completo, segundo a espécie do


curso, de acordo com o censo demográfico de 1991.
Curso Número de pessoas %
Ciências biológicas e da saúde 589 327 15,0
Ciências exatas e tecnologia 605 556 15,4
Ciências agrárias 102 110 2,6
Ciências humanas e sociais 2 116 677 53,9
Letras e artes 322 552 8,2
Defesa nacional 17 964 0,5
Outros 174 077 4,4
Total 3 928 263 100,0%
Fonte: IBGE. Censo demográfico 1991: características gerais da população e instrução.
Rio de Janeiro: IBGE, 1996. v.1.

4) Série mista: é a combinação de duas séries distintas: geográfico-temporal,


geográfico-específica ou específico-temporal.

Tabela 6: Taxa de analfabetismo de pessoas com 15 anos e mais


segundo cor, nos censos demográficos de 1991 – 2000.
Cor Censo 1991 Censo 2000
Brasil 19,4 12,9
Branca 11,9 8,3
Preta 31,5 21,5
Amarela 5,4 4,9
Parda 27,8 18,2
Indígena 50,8 26,1
Fonte: Retrato do Brasil. Folha de São Paulo, São Paulo, 21 dez. 2002;

Tabela 7: Infraestrutura nos domicílios (em porcentagem do total)


Número de domicílios (%)
Infraestrutura
2007 2008
Rede de água 83,2 83,9
Rede de esgoto 51,1 52,5
Fossa séptica 22,3 20,7
Coleta de lixo 87,3 87,9
Energia elétrica 98,2 98,6
Telefone 76,8 82,1
Fonte: PNAD (Pesquisa nacional por amostras em domicílio) e Infográfico/AE
Estatística Básica - Prof. Leonardo Mendes 13

5) Tabelas de Frequências: é o arranjo dos valores, disposto em linhas e colunas,


verificando a ocorrência de variação do fenômeno em estudo.
Elementos: a variável quantitativa de interesse (discreta ou continua), as
frequências simples (absolutas e relativas), e acumuladas (crescente ou decrescente).
Conforme a variável de interesse a tabela pode ser agrupada por ponto ou intervalos.

5.1 Dados agrupados por ponto: usamos em variáveis discretas (variáveis de


contagem). Agrupamos os valores pontualmente, em termos do seu próprio valor que a
variável assume.

Tabela 8: Frequência do número de filhos por família, de uma amostra


de 30 famílias de um bairro de SP.
Nº. de Filhos Nº. de Famílias % % Acumulado
0 4 13,3 13,3
1 8 26,7 40,0
2 10 33,3 73,3
3 6 20,0 93,3
4 2 6,7 100,0
Total 30 100,0 -

5.2 Dados agrupados em intervalos: usamos em variáveis continuas (variáveis


de medição) quando não for possível representar os valores pontualmente (muitos
distintos) gerando uma tabela muito extensa, dificultando a leitura e compreensão.

Tabela 9: Frequência dos entrevistados, segundo a idade.


Idade (anos) Nº. de entrevistados %
14 |- 21 5 8,33
21 |- 28 13 21,67
28 |- 35 20 33,33
35 |- 42 15 25,00
42 |- 49 5 8,33
49 |- 56 2 3,33
Total 60 100,0
Fonte: Pesquisa de Campo

Neste caso, temos:


Variável: Idade (anos).
Frequência absoluta (Fi ) : Nº. de entrevistados.
Fi
Frequência relativa ( fi ) : o percentual, sendo fi = × 100% , obtido em cada classe
n
de intervalo ( i = 1,K, k ) e n, o total de elementos analisados.
Estatística Básica - Prof. Leonardo Mendes 14

4. Representação Gráfica

⇒ Tem a vantagem de apresentar os dados de forma mais rápida e clara, além de


detectar possíveis mudanças ao longo do tempo (comportamento, perfil, fatores
externos).
⇒ Todo gráfico deve ter título e escala, para que possa ser interpretado sem que haja
necessidade de esclarecimentos adicionais no texto.
⇒ O título deve ser escrito abaixo do gráfico (Figura).
⇒ A variável deve ser identificada no próprio eixo.
⇒ No eixo das abscissas (x), a escala cresce da esquerda para a direita; as
ordenadas (y) de baixo para cima. Se a variável for nominal, não haverá escalas, apenas
as categorias (as legendas).

Tipos de Gráficos:

Gráfico de Linha: usado para representar os dados ao longo do tempo (série temporal).
7,00
6,28
5,76
6,00
Nº de filhos por mulher

5,00 4,35

4,00 3,53
2,85
3,00 2,54 2,43
1,95 1,89
2,00

1,00

0,00
1960 1970 1980 1984 1991 1997 1998 2007 2008
Ano

Figura 1: Taxa de fecundidade - em número de filhos por mulher.


Fonte: PNAD (Pesquisa nacional por amostras em domicílio)

900.000
800.000
Nº de infectados

700.000
600.000
500.000
400.000
300.000
200.000
100.000
0
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
Período
Figura 2: Casos de dengue notificados no Brasil nos últimos dez anos 1997-2007.
Fonte: Ministério da Saúde
Estatística Básica - Prof. Leonardo Mendes 15

Exemplo de gráfico em linhas usadas normalmente pela mídia, sem uma escala
apropriada (Pictogramas):

Figura 3: Evolução do Salário-Mínimo, em dólar, no período de 1994 a 2006.


Fonte: Ministério do Trabalho e Emprego, 2006.

Gráfico de Barras (Colunas): são retângulos verticais sobre o eixo das abscissas. O eixo
das ordenadas representa a frequência ou percentual da categoria. Usa-se para
comparação de dados de uma série estatística (em formato 2D ou 3D).
Tipos: simples e múltiplas (os mais comuns); compostas e sobrepostas, sendo que a
múltipla é apropriada quando se objetiva comparar duas ou mais séries de dados.

Figura 4: Vacinação contra a poliomielite - Ministério da Saúde, 1993


Estatística Básica - Prof. Leonardo Mendes 16

100

Número de domicílios (%)


80

60

40 2007
2008
20

0
Rede de Rede de Fossa Coleta de Energia Telefone
água esgoto séptica lixo elétrica
Infraestrutura

Figura 5: Infraestrutura nos domicílios (em porcentagem do total) - PNAD

Figura 6: Gestantes segundo o tipo de parto e a ocorrência de pré-natal em Itajubá-SP, 2009.

Um exemplo de gráfico em barras em que a categoria é um valor numérico atribuído.

Figura 7: Expectativa de vida das mulheres brasileiras, IBGE.


Estatística Básica - Prof. Leonardo Mendes 17

Gráfico de setor (pizza): usado para comparar os valores de uma única série com o
total. Normalmente apresenta valores relativos (%). Deve-se ter cuidado com a
quantidade de categorias (legendas), a fim de não prejudicar a visualização do gráfico. O
ângulo correspondente ao percentual é obtido de:

360 º
ai = × Fi
n

sendo : Fi a frequência absoluta da categoria i e n, o total de elementos.

Homens
49,2%
Mulheres
50,8%

Figura 8: População residente no Brasil, segundo o sexo, de acordo com o


Censo demográfico de 2000 - IBGE, 2003.

Figura 9: Avicultura de postura - Principais estados produtores, em


percentual da produção, 2003.
Estatística Básica - Prof. Leonardo Mendes 18

Histograma (Playfair): usado para representar dados agrupados em classes de


intervalos. É um gráfico em colunas, em que o eixo x representa as classes (intervalos) e
o eixo y, as frequências (absolutas ou relativas) ao longo de cada intervalo.

Figura 10: Histograma do nível de concentração de pH em xampus.

Diagrama de dispersão: usada para verificar a existência de linearidade ou não entre


duas variáveis numéricas, tipo X e Y. Podem-se observar tendências linear, exponencial,
parabólica, etc.

Figura 11: Dispersão da altura em função do peso dos alunos de uma escola
(MAGALHÃES e LIMA, 2002).
Estatística Básica - Prof. Leonardo Mendes 19

Box-Plot (Tukey): usada em análise descritiva em exploração de dados, permite verificar


existência de centralidade, dispersão e assimetria da distribuição dos dados, além de
identificar possíveis valores extremos (outliers).

Figura 12: Box-Plot para o tempo (em min) que os alunos demoraram em fazer
determinada prova (VIEIRA, 2003).

Obs.: As estatísticas Q1, Q2 e Q3 são conhecidas como Separatrizes e representam,


respectivamente, o 1º Quartil, o 2º Quartil (Mediana) e o 3º Quartil.

Gráfico em Haste: usado em variáveis discretas, onde o valor que a variável assume
corresponde a uma categoria. A abscissa é representada pelos valores da variável e a
ordenada as frequências absolutas ou relativas (%).

Figura 13: Quantidade de computadores defeituosos na empresa Alfa, segundo o


número de meses (Jan.1999 - Dez.2002).
Fonte: Departamento de Controle de Qualidade
Estatística Básica - Prof. Leonardo Mendes 20

Gráfico de Pareto: é um gráfico em barras, usada em dados qualitativos, com barras


ordenadas de acordo com a frequência.
• As escalas verticais podem representar frequências absolutas ou relativas, sendo
que a barra mais alta fica à esquerda e as barras menores na extrema direita.
• Dispomos as barras por ordem de frequência, o diagrama de Pareto focaliza
atenção sobre as categorias mais importantes.

Figura 14: Ranking do desmatamento no Brasil, entre 2002 e 2008 (por mil km2)

Figura 15: Expectativa de vida ao nascer nos estados brasileiros, em 2014.


Estatística Básica - Prof. Leonardo Mendes 21

Fonte Consultada:

VIEIRA, S.; HOFFMANN, R. Elementos de estatística. 4. ed. Atlas, 2003. 168p.

MAGALHAES, Marcos Nascimento & LIMA, Carlos Pedroso de. Noções de Probabilidade
e Estatística. São Paulo: Edusp, 2002.

BUSSAB, W.O; MORETTIN, P. A. Estatística Básica. 5 ed., São Paulo, Saraiva, 2004.
Estatística Básica - Prof. Leonardo Mendes 22

5. Elaboração de Tabelas de Freqüências Intervalar:

1) Rol dos Dados: ordenação numérica de n valores, os dados brutos ( X1, X 2 ,K, X n ) ,
em que ( X1 < X 2 < K < X n ) .
Dados brutos: dados da forma como foram obtidos (pesquisados), sem nenhum
tratamento aplicado aos dados. Também são chamados de dados
não agrupados.

2) Calcular:

a) Amplitude total: ∆ = max − min = X n − X1 .


b) Número de intervalos (ou classes):

 n , n < 50

 log(n)
k = 1 + = 1 + 3,322 log(n) , n ≥ 50 (Sturges, 1926).
 log 2
0,9 n (Mendis)

• O valor de c deve ser arredondado para o inteiro mais próximo.


• O logaritmo usado na fórmula de Sturges é o de base decimal (base 10).


c) Amplitude do intervalo: h = , de modo que seja arredondado para mais do
c
valor calculado.
Por exemplo, se: h = 4,675 , então: h > 4,675 , ou seja, h * = {4,7; 4,8; 4,9;K} .

d) As faixas do intervalo: obter o limite inferior e superior, ambos separado pelo


símbolo |- (significa fechado à esquerda).

1º Intervalo: min |- (min + h*)


2º Intervalo: (min + h*) |- (min + h*+h*) = (min + 2h*)
3º Intervalo: (min + 2h*) |- (min + 2h*+h*) = (min + 3h*), e assim por diante.

Exemplo: considere n = 70 observações.

 n = 70 = 8,367 ≅ 9

 log(n)
k = 1 + = 1 + 3,322 log( 70 ) = 7,129.
 log 2
0,9 70 = 7,530

Estatística Básica - Prof. Leonardo Mendes 23

Na tabela abaixo, temos os cálculos do número de intervalos em função do valor da


amostra:
Tabela 10: Determinação do número de intervalos, de acordo
com as funções matemáticas e do tamanho da amostra.
n n 1 + log(n) / log 2 0,9 n
5 2,24 3,32 2,01
10 3,16 4,32 2,85
15 3,87 4,91 3,49
20 4,47 5,32 4,02
30 5,48 5,91 4,93
40 6,32 6,32 5,69
50 7,07 6,64 6,36
75 8,66 7,23 7,79
100 10,00 7,64 9,00
300 17,32 9,23 15,59
500 22,36 9,97 20,12
750 27,39 10,55 24,65
1000 31,62 10,97 28,46
2500 50,00 12,29 45,00

Figura 15: Visualização do número de intervalos, segundo a tabela 10 e do tamanho da


amostra.

Você também pode gostar