Você está na página 1de 48

UNIVERSIDADE ESTADUAL DE MARINGÁ

CENTRO DE CIÊNCIAS EXATAS


DEPARTAMENTO DE ESTATÍSTICA

ANÁLISE DESCRITIVA NO
EXCEL

Angela Maria Marcone Araujo


Clédina Regina Lonardan Acorsi
Sebastião Gazola
ANÁLISE DESCRITIVA NO EXCEL

1 INTRODUÇÃO

A Estatística vai além de índices de audiência de programas de TV, taxas de


desemprego, prévias eleitorais e outras. É uma ciência que tem importante papel no
pensamento crítico no ensino, no trabalho, na pesquisa ou mesmo no dia a dia. Fazer
estatística é algo mais que manipular dados, pois cada conjunto de dados é acompanhado
por informações sucintas que permitem entender o que eles diz.

Estatística é a ciência dos dados. Envolve a coleta, a classificação, o


resumo, a organização, a descrição, a análise e a interpretação de
dados, visando a tomada de decisões (Vieira, 1998)

Na obtenção dos dados, deve-se atentar para a coleta. Ela deve ser realizada por
meio de um instrumento capaz de fornecer as informações para atender aos objetivos do
trabalho.
Atualmente, a utilização de planilhas eletrônicas, tem um papel importante no
desenvolvimento da estatística. Um software integrado de planilhas e gráficos é o EXCEL
que é utilizado como uma poderosa ferramenta para a realização de tarefas em todas as
áreas, além de ser uma ferramenta acessível em quase todos ambientes.
O objetivo deste curso é utilizar o Excel como ferramenta para análise de dados e
construção de tabelas e gráficos.
Neste curso, inicialmente são apresentadas instruções básicas e próprias do
software. Posteriormente, são fornecidas instruções que auxiliam o professor do ensino
fundamental e médio a usufruir dos recursos do software Excel, aperfeiçoando
gradativamente suas habilidades e desenvolvendo suas competências, num processo
dinâmico e construtivo. A proposta de trabalho com o auxílio do microcomputador é que o
professor busque alternativas para aplicar junto aos alunos do ensino fundamental e médio,
novas metodologias de ensino.

1
2 NOÇÕES BÁSICAS PARA O USO DO EXCEL

2.1 ACESSANDO O EXCEL:

i) Para acessar o programa a partir do gerenciador de programas, clique duas vezes no

ícone rotulado (ou selecione-o com o cursor e pressione Enter).

ii) Também pode ser acessado clicando: Iniciar  EXCEL

Fig. 1

2.2 ELEMENTOS DA PLANILHA


Uma planilha eletrônica de cálculo é formada basicamente por: barra de título, barra
de menus, barra de ferramenta, barra de fórmula e barra de status. Toda planilha é dividida
em linhas (identificadas por números) e colunas (identificadas por letras maiúsculas). A
intersecção de uma linha com uma coluna é chamada de Célula. No exemplo, o endereço
da célula ativa é A1 (coluna A intersecção com linha 1).

Barra de Menus

Barra de
fórmulas

Célula
Barra de
Ferramentas
Identificação das
colunas - letras
Planilha ativa
Identificação das
linhas - números
Fig. 2

2
2.3 CRIAR ARQUIVO
Para criar um arquivo, antes mesmo de digitar os dados, pode-se nomeá-lo e salva-
lo, para posteriormente iniciar o trabalho de sua construção.

i) Com o cursor, clique em Arquivo; a tela apresenta o quadro abaixo.

Fig. 3

Clique em Salvar como.


ii) A tela será como segue:

Fig. 4

Selecione a unidade onde deseja gravar o arquivo. Ex.: na pasta Documents

3
Nome do arquivo: digite um nome para o arquivo de dados.
Tipo: é mais conveniente usar Pasta de trabalho do Microsoft Excel.
Clique em Salvar.
As gravações seguintes podem ser feitas clicando no ícone .

2.4 INSERÇÃO DE DADOS

i) Na célula A1 (coluna A interseção com linha 1) digite “Sexo”. Na célula B1


(coluna B intersecção com linha 1) digite “Idade”. Na célula C1 (coluna C
intersecção com linha 1) digite “Altura”...

ii) Em cada linha digite o sexo, a idade e as demais especificações de cada aluno.

Fig. 5

2.5 ABRIR UM ARQUIVO EXISTENTE


Usa-se a barra de menus clicando em Arquivo  Abrir, conforme Fig. 6.

Fig. 6

A tela a ser preenchida será:

4
Fig. 7

À esquerda: escolhe-se a unidade.


Primeiro surgirão as pastas contendo os arquivos, então, clicando duas vezes na
referida pasta, surgirão os títulos dos arquivos existentes na unidade (Nome). Para abri-lo,
basta clicar duas vezes sobre o nome do arquivo desejado ou marcar e clicar em abrir.
Nome do arquivo: aparece o arquivo selecionado.
Arquivos do tipo: confira se seu arquivo é do tipo adequado.

2.6 NOMEAR UMA PLANILHA ATIVA

Pode-se trabalhar com várias planilhas simultaneamente num mesmo arquivo. É


conveniente que o banco de dados, com o qual o trabalho esteja sendo realizado,
permaneça em uma planilha própria, enquanto que os resultados, tabelas e gráficos ficam
melhor em outras planilhas.
As planilhas (ativas ou não) estão indicadas na parte inferior da tela pelos nomes
PLAN1, PLAN2, PLAN3, conforme mostra a Fig. 8. Para renomear qualquer uma destas
planilhas, dê dois cliques rápidos sobre o seu atual nome (ex.: PLAN1). Sobre a seleção,
digite o novo nome que deseja dar à planilha, por exemplo, Dados.
Caso necessite de uma quantidade maior de planilhas que o número apresentado na
tela (3 planilhas), na barra da planilha existente, clique com o mouse do lado esquerdo.

Clique com o lado


direito do mouse

Fig. 8

i. Com o lado direito do mouse, Selecione: Inserir (Fig.9) Planilha (Fig.10)

5
Fig. 9

Fig. 10

Obs: No caso de ser necessário a exclusão de uma planilha, use o procedimento exposto
pela Fig.9, clique em: Editar (Excluirá a planilha).

2.7 DEFINIR TAMANHOS IGUAIS PARA DUAS OU MAIS LINHAS (OU COLUNAS):

2.7.1 SUBSEQUENTES:

Para selecionar uma linha (ou coluna) por inteiro, basta clicar no número (ou letra)
que as identificam. Por exemplo, para selecionar a linha 6:

Fig. 11

6
i) Suponha que seja necessário converter as linhas 6, 7 e 8 em alturas de tamanhos
maiores e iguais (ou menores e iguais).
ii) Ao selecionar a linha 6, arraste o mouse até a linha 8.
iii) Com o cursor posicionado exatamente sobre a linha inferior da linha 8, pressione o
mouse e arraste o cursor deixando a linha na largura desejada. Ao soltar o mouse, todas as
linhas terão a mesma largura. O mesmo procedimento deve ser repetido para a adequação
da largura das colunas.

Fig. 12

2.7.2 ALTERNADAS

Para selecionar linhas (ou colunas) alternadas, por exemplo, as colunas B, D e G,


selecione a primeira coluna (B) e pressione a tecla Ctrl. Mantendo a tecla Ctrl pressionada,
selecione a coluna D e G. Pressione então o cursor à direita da célula G e o arraste com o
auxílio do mouse até o tamanho desejado. O mesmo procedimento deve ser repetido para a
adequação da altura de linhas alternadas.

Fig. 13

2.8 SELEÇÃO DE CÉLULAS (ADJACENTES E NÃO-ADJACENTES)

Para selecionar grupos de células distintas, o recurso utilizado é semelhante ao


anterior. Por exemplo: selecione o grupo de células A2:B4 e D6:E9 (células adjacentes).
i) Selecione a Célula A2 clicando sobre ela;
ii) Arraste o cursor até a célula B4 (seleção de células adjacentes);
iii) Para estender a seleção a outro grupo de células (D6:E9) que não seja adjacente ao
primeiro grupo (A2:B4), pressione a tecla Ctrl e clique na célula D6;
iv) Arraste o cursor até a célula E9 (ou seja, repita a seleção que for de seu interesse).

7
Fig. 14

2.8.1 UTILIZANDO O MOUSE:

i) Selecione a quantidade de linhas ou colunas que se deseja incluir (ou excluir) e clique
com o lado direito do mouse;
ii) Clique em Inserir ou Excluir;

Fig. 15

Obs: A linha será incluída acima da linha selecionada e a coluna à esquerda da coluna
selecionada.

2.9 COPIAR E COLAR CONTEÚDOS DE UMA CÉLULA

2.9.1 CÓPIA SIMPLES DE UMA CÉLULA:

Clique sobre a célula que se deseja copiar, pressione a tecla Ctrl e depois a tecla C
(para copiar). Também pode-se copiar o conteúdo de uma célula, selecionando-a e com o

auxílio do cursor clicar no ícone .

8
2.9.2 COLAGEM SIMPLES DE UMA CÉLULA:

Após proceder a cópia desejada, escolha uma célula vazia onde deve ser colado o
conteúdo copiado. Clique a tecla Ctrl e simultaneamente pressione a tecla V (para colar), ou
ainda apenas, na célula de destino, clicar no ícone .

2.10 ORDENAÇÃO DE NÚMEROS E PALAVRAS

Suponha que seja necessário classificar dados em ordem alfabética ou ordem


numérica (crescente ou decrescente).

i) Selecione as células que contenham os dados a serem classificados;

Fig. 16

Na barra de menus, clique em Dados  selecione um dos ícones: para ordem

crescente, ou para ordem decrescente. Qualquer que seja a escolha, é necessário


expandir a seleção para se preservar os dados das linhas por completo.

Fig. 17

Este procedimento pode ser realizado para ordenar em relação a qualquer coluna,
conservando a expansão (ou não).

9
3 DEFINIÇÕES

População: É o conjunto de elementos sobre o qual se deseja obter informações. A


população pode ser FINITA ou INFINITA. O número de elementos da população é
representado por N.
Censo: É o processo utilizado para levantar as características observáveis, abordando
todos os elementos de uma população.

Amostra: É um subconjunto retirado de uma população, obtido através de técnicas de


amostragem. O número de elementos da amostra é representado por n.

Exemplos:
a) O censo no Brasil é feito a cada dez anos. Qual é a população de interesse? Todos os
domicílios do Brasil.
b) Em uma pesquisa de opinião para saber o resultado das eleições para prefeito de
Maringá. Qual a população de interesse? Qual seria a amostra? A população são todos os
eleitores de Maringá. A amostra seria um subconjunto (ex., de 1200 eleitores) da população.

Variável: É o que está sendo analisado, uma característica da população ou da amostra. As


variáveis classificam-se em:

- Qualitativas: Quando seus valores forem expressos por categorias ou atributos (não
numéricas). Podem ser:
- Nominais. Ex.: sexo, cor de olhos,...
- Ordinais. Ex.: Ensino: fundamental, médio, superior.

- Quantitativas: Seus valores são mensuráveis e suas intensidades podem ser expressas
por unidades físicas. Podem ser:
- Contínuas. Quando assumem infinitos (não-enumerável) valores num
intervalo. Ex.: peso, altura, ...
- Discretas: Assumem valores pontuais, geralmente de números inteiros finitos
ou infinitos enumeráveis. Ex: número de filhos de um casal,
número de grãos de uma safra,...

OBS.: Em geral, as medições correspondem às variáveis contínuas e as contagens ou


enumerações, às variáveis discretas.

10
3.1 AMOSTRAGEM

Muitas vezes, na prática, não é possível observar toda a população. Então o


pesquisador utiliza-se de uma amostra para ter uma estimativa da população. Entretanto,
antes de selecionar uma amostra, é preciso conhecer as técnicas de amostragem. As
técnicas de amostragem não são objeto de estudo neste curso.

Amostragem: É o processo de se extrair ou obter amostras.

Exemplos:
a) Tirar conclusões sobre a altura, peso, idade de 600 estudantes da escola, observando
apenas 80 estudantes. Tamanho da população (N) = 600 e o tamanho da amostra (n) = 80.
b) Investigar a porcentagem de peças defeituosas fabricadas em uma indústria, durante 6
dias, examinando 20 peças por dia. População = todas as peças fabricadas durante 6 dias e
a Amostra = o subconjunto de 6x20=120 peças, selecionadas aleatoriamente para estudo.

Comparação entre amostragem e censo:


Amostragem é mais vantajosa: Censo é mais vantajoso:
- População infinita - População pequena
- Tempo limitado - Tamanho da amostra grande
- Teste destrutivo em relação a população
- Custo muito alto - Exigência de precisão
completa

3.2 TAMANHO DA AMOSTRA

Geralmente as populações são grandes demais para serem estudadas na sua


totalidade, neste caso, o mais comum é estudar amostras retiradas dessa população. As
amostras devem ser representativas da população para que os resultados possam ser
generalizados.
Para definir o tamanho de uma amostra o pesquisador deve conhecer o tamanho da
população a ser estudada e então definir o erro máximo da estimativa e a confiabilidade
desejada.
Apresentamos abaixo as fórmulas mais utilizadas para o cálculo do tamanho da
amostra:

11
z2  N
n (populações finitas)
[4  e 2  (N  1)  z 2 ]

2
1z
n   (populações infinitas)
4e

Exemplo: Deseja-se calcular o tamanho de uma amostra para uma população de tamanho
finito, N=404, com erro máximo estipulado em e=0,05 (5%) e uma confiança de 95%.

confiança = 95% z = 1,96


erro = 5% e = 0,05
N = 404

tamanho amostra n = 197,165 = 198

Obs.: O tamanho da amostra deve ser sempre arredondado para cima.

4 TABELAS PARA VARIÁVEIS QUALITATIVAS

Para as variáveis qualitativas tem-se um grande número de possibilidades na


representação gráfica e cabe ao pesquisador escolher a que melhor represente os dados
analisados, cuidando para que as normas básicas (ABNT, IBGE, ... ) de apresentação sejam
respeitadas.

4.1 CONSTRUÇÃO DE TABELAS

4.1.1 TABELA SIMPLES

A construção de tabelas para variáveis Qualitativas ou Quantitativas discretas pode ser


feita de acordo com os seguintes procedimentos:
i) Selecione uma planilha na qual tabela será montada;
ii) Na barra de menus selecione: Inserir Tabela DinâmicaTabela Dinâmica;

Fig. 18

12
iii) Criar Tabela Dinâmica:

Fig. 19

iv) No quadro Selecionar uma tabela ou intervalo, selecione os dados (podem estar em
outra planilha), inclusive com os títulos de cada coluna (ou linha) que se encontram na
planilha (no exemplo, os dados estão na planilha Dados e a tabela está sendo construída na
planilha Tabelas). O quadro para definir as variáveis será conforme Fig.20.

Fig. 20

v) Para a construção de uma tabela simples a variável que se deseja tabular deve ser
arrastada para o campo “Rótulos de linha” e para o “Valores”. É importante lembrar que no
campo Valores a variável desejada deve vir acompanhada da função Contagem; caso isso
não aconteça será necessário clicar na seta do campo, selecionar Configurações do
campo de Valor e dentre as opções, escolher a função Contagem, conforme a Fig. 21.

13
Fig. 21

vi) Automaticamente a tabela estará concluída..

Fig. 22

vii) Note que pela seta dos rótulos de linhas, os níveis podem ser retirados ou não. Por
exemplo, para retirar a observação (vazio), basta clicar em vazio.

Fig. 23

Por meio da Fig. 22, observa-se que o resultado será uma tabela cuja formatação
não se apresenta segundo as normas exigidas. Para que haja mais flexibilidade no trabalho
com uma tabela, deve-se copiá-la e fazer uma Colagem Especial, colando-a, numa célula
qualquer, como Valores (Fig.25).

14
Fig. 24

Fig. 25

A próxima etapa será construir o percentual referente a cada cor ou raça identificada
entre os alunos. Basta aplicar a fórmula para a primeira linha e posteriormente colá-la nas
demais linhas. O percentual da frequência absoluta também é conhecido como frequência
relativa e calculado da seguinte forma: .

Para dividir o número de alunos da cor/raça amarela (Fi= 33) pelo total de alunos
entrevistados (n= 430) e multiplicar o resultado por 100, proceda da seguinte maneira:

viii) Clique na coluna seguinte á contagem e na mesma linha.


ix) Digite o sinal de =
x) Clique na célula da frequência absoluta (33) digite o sinal de divisão (/) e clique sobre a
célula da total da amostra (430). Multiplique (*) por 100. Note que quando for arrastar para
colar, o valor da célula total devera permanecer fixa; isto é conseguido inserindo $ antes do
endereço da coluna (letra) e da linha (número). Isto é facilmente obtido apertando a tecla F4
imediatamente ao clicar no valor 430. O símbolo ($) é fixador de linhas e colunas. Aperte a
tecla Enter. A fórmula descrita deverá ter a forma da Fig. 26.

15
Fig. 26

Agora selecione esta célula e arraste-a até à última linha da tabela.

Fig. 27

Nota: Observe que a variável Cor ou raça na tabela no Excel foi ordenada em ordem
alfabética. Para ordená-la de acordo com a necessidade, ainda no Excel, siga os seguintes
procedimentos:
a) Na coluna à esquerda da especificação da variável, digite a ordem desejada;
selecione a coluna (Fig. 28).

Fig. 28

16
b) Acione o comando Classificar em ordem crescente (lembrando que deve sempre
observar que deve obedecer sempre: Expandir a seleção).

A partir desta nova tabela, a mesma pode ser copiada, colada e formatada no Word,
de acordo com as normas estabelecidas. (Tópico 4.2)

4.1.2 TABELAS DE DUPLA ENTRADA (OU TABELAS COMPARATIVAS)

i) Para a construção de uma tabela de dupla entrada, seguem-se exatamente os


mesmos passos da tabela simples (até Fig. 27). Acrescentando que a variável que
corresponde às linhas deve ser arrastada para o campo Rótulos de Linha, enquanto que a
variável que corresponde às colunas deve ser arrastada para o campo Rótulos de Coluna.
A variável que foi colocada no campo Rótulos de linha também deve ser especificada para
o campo Valores.
Na Fig. 29 está representado o preenchimento para as variáveis Cor/Raça (linha) e
Sexo (coluna).

Fig. 29

Lembre-se de ordenar adequadamente a variável cor.

4.2 FORMATAÇÃO DAS TABELAS:

A formatação de uma tabela deve seguir as normas vigentes. Para facilitar a edição,
ela pode ser copiada da planilha do Excel e colada no documento do Word. A Tabela 01
corresponde a uma tabela simples formatada.

17
Tabela 1: Cor ou raça de uma amostra dos alunos da Universidade Estadual de Maringá.
Maringá, 02/2016. (Tabela simples)
Cor ou Raça Nº de Alunos Percentual
Amarela 33 7.7
Branca 329 76.5
Parda 54 12.6
Preta 9 2.1
Outra 5 1.2
Total 430 100.0
Fonte: Relatório do projeto de pesquisa 570/2013.

Após colar a tabela no WORD, é preciso adequá-la ao tamanho da página.


i) Selecione a tabela recentemente colada;
ii) Apenas com o objetivo de facilitar procedimentos, Na Página Inicial, na barra
parágrafo, seleciona-se o ícone relacionado às bordas, selecionam-se Todas as bordas,
conforme Fig. 30.

Fig. 30

iii) Clique com o lado direito do mouse Auto Ajuste Ajustar-se automaticamente à
Janela (conforme Fig. 29).

Fig. 31

18
iv) Confira se todas as colunas estão identificadas corretamente (cabeçalho das
variáveis);
v) Insira as bordas superiores e inferiores conforme Tabela 01.

Para formatar uma tabela comparativa, os procedimentos iniciais são os mesmos (de i a v).
No Word, a tabela estará com a seguinte forma:

Fig. 32

vi) Selecione as duas colunas superiores centrais (as colunas que corresponde os níveis
da variável sexo, na linha correspondente), como na Fig. 32;

vii) Quando tais colunas forem selecionadas, aparecerá na parte superior da barra de
ferramentas, os ícones das Ferramentas de Tabela:

Fig. 33

viii) Clique em Mesclar Células e alinhamento centralizado ;


ix) Selecione todas as células centrais (Fig. 35), Masculino e Feminino, Layout 
Distribuir Colunas (Fig. 35);

Fig. 34

19
Nesta etapa outras correções devem ser procedidas. Lembrando que se houver
interesse em que as categorias sejam ordenadas por outra lógica, isto deverá ser procedido
ainda com a tabela no arquivo do Excel.
x) Também as linhas da especificação da variável devem ser mescladas, como no item viii,
deste tópico.

xi) Ainda em Layout, a especificação da variável deverá ter seu alinhamento centralizado.

Sexo
Cor ou Raça
Feminino Masculino Total
Amarela 20 13 33
Branca 185 144 329
Parda 21 33 54
Preta 3 6 9
Outra 3 2 5
Total 232 198 430

xii) Selecione a tabela, clique o mouse do lado direito. Acione Bordas e Sombreamento;

Fig. 35

20
xiii) Insira as bordas conforme procedimentos da tabela simples. Nesta etapa são
apresentadas as bordas conforme exigência do periódico;

Tabela 2: Cor ou Raça dos alunos da Universidade Estadual de Maringá amostrado segundo
o sexo dos mesmos. Maringá, 02/2016. (Tabela comparativa)
Sexo
Cor ou Raça
Feminino Masculino Total
Branca 185 144 329
Parda 21 33 54
Amarela 20 13 33
Preta 3 6 9
Outra 3 2 5
Total 232 198 430

A formatação de uma tabela deve seguir as normas vigentes. Destaca-se que


quando a variável for quantitativa ordinal, a sequência dos níveis da categoria deve ser
respeitada; portanto, ainda na planilha do Excel ela deve ser ordenada (procedimento já
detalhado, pag. 16, Fig. 28).

Tabela 3: Intensidade que o estressor falta de disciplina/hábito de estudo interfere no


rendimento acadêmico do aluno da Universidade Estadual de Maringá. Maringá, 02/2016.
Intensidade Nº de alunos Percentual
Pouquíssimo 116 27.0
Pouco 113 26.3
Indiferente 71 16.5
Muito 87 20.2
Muitíssimo 43 10.0
Total 430 100.0

5 GRÁFICOS PARA VARIÁVEIS QUALITATIVAS

5.1 GRÁFICO DE BARRAS

É um gráfico formado por retângulos horizontais de larguras iguais, no qual cada um


deles representa a intensidade de uma modalidade ou atributo. Pode-se dizer que é um
gráfico para resumir um conjunto de dados categóricos.
É recomendável que cada coluna conserve uma distância entre si de
aproximadamente 2/3 da largura da base de cada barra, evidenciando deste modo, a não
continuidade na sequência dos dados.
O objetivo deste gráfico é de comparar grandezas e é recomendável para variáveis
cujas categorias tenham designações extensas.

21
Fig. 36

5.2 GRÁFICO DE COLUNAS

É o gráfico mais utilizado para representar variáveis qualitativas. Mostram comparações


entre itens individuais em um período específico, ou somente comparações entre itens. Difere do
gráfico de barras por serem seus retângulos dispostos verticalmente ao eixo das abscissas,
sendo mais indicado quando as designações das categorias são breves (exemplo
apresentado nesta apostila). Como no gráfico de barras, neste tipo de gráfico deve ser
preservada a distância entre cada retângulo de, aproximadamente, 2/3 da largura da base
de cada coluna. O número de colunas ou barras do gráfico não deve ser superior a 12
(doze) – como no caso das tabelas..
Ao se descrever simultaneamente duas ou mais categorias para uma variável, é
conveniente fazer uso dos gráficos de barras ou colunas justapostas (ou sobrepostas),
chamados de gráficos comparativos. Este tipo de gráfico só deve ser utilizado quando
apresentar até três elementos para uma série de no máximo quatro valores.

Fig. 37

5.3 GRÁFICO DE SETORES

É um tipo de gráfico circular, comumente chamado de gráfico de pizza que


corresponde a um diagrama circular no qual os valores de cada categoria estatística
representadas são proporcionais às respectivas medidas dos ângulos. Este gráfico pode ser
expresso por frequências absolutas ou relativas (percentagens). É utilizado basicamente
para representar dados qualitativos nominais.
No gráfico de setores, a variável em estudo é projetada num círculo, de raio
arbitrário, dividido em setores com áreas proporcionais às frequências das suas categorias.
São indicados quando se deseja comparar cada valor da série com o total. Recomenda-se
seu uso para o caso em que o número de categorias não é grande e que não obedecem a

22
alguma ordem específica.
O procedimento para o cálculo do ângulo correspondente a cada categoria é feito por
meio de simples proporções: 360º que corresponde a um círculo completo está para o total
da amostra, assim como xº está para o total de indivíduos que pertencem à categoria
desejada.
360º xº

n Fi

Fig. 38

5.4 GRÁFICO DE LINHAS

Sua aplicação é mais indicada para representações de séries temporais, ou seja,


exibem dados contínuos ao longo do tempo, sendo por tal razão, conhecidos também como
gráficos de séries cronológicas. São utilizados para mostrar tendências em dados a
intervalos iguais. Sua construção é feita colocando-se no eixo vertical (y) a mensuração da
variável em estudo e na abscissa (x), as unidades da variável numa ordem crescente. É
Importante ressaltar que ele não enfatiza a quantidade de mudanças ao longo do período,
mas sim o fluxo de tempo e a taxa de mudança.
Este tipo de gráfico permite representar séries longas, o que auxilia detectar suas
flutuações tanto quanto analisar tendências. Como podem ser representadas várias séries
em um mesmo gráfico, é bastante empregado para destacar diferenças e associações entre
elas.

Fig. 39

5.4.1 CONSTRUÇÃO DO GRÁFICO PARA UMA ÚNICA VARIÁVEL, NO EXCEL

Para o caso da Tabela 01 dada como exemplo, selecione os dados de interesse (corpo da
tabela). O gráfico pode ser executado considerando as frequências absolutas ou relativas
(percentuais).
i) Primeiramente selecione as colunas que serão representadas.
ii) Na Barra de Menus, clique em Inserir  Gráficos (talvez em sua tela já possa ir direto
para o tipo de gráfico, item iii)

23
Fig. 40

iii) Como as especificações das variáveis são pouco extensas, o gráfico de colunas. Ao
clicar nesta opção, vários tipos de gráficos podem ser escolhidos: dimensões 2 ou 3.

Fig. 41

iv) Escolhendo Coluna 2D, tem-se a Fig.42, mas que necessita ser formatada:

Nº de Alunos
400
300
200
100 Nº de Alunos
0

Fig. 42

v) A legenda deve ser deletada, pois não há necessidade de identificar a variável pois ela
é única; da mesma forma, as linhas que aparecem no gráfico.

24
350
300
250
200
150
100
50
0
Amarela Branca Parda Preta Outra
Fig. 43

Faz-se necessário identificar os eixos e aproximar as colunas (2/3 da base dos retângulos).

vi) Basta selecionar as colunas do gráfico clicando em uma das colunas; observe que
todas deverão ficar selecionadas. Com o lado direito do mouse, clique em Formatar Série
de Dados.

Fig. 44

vii) Surgirá uma tela como a apresentada na Fig.45. Na opção Largura do Espaçamento,
reduzir para 65% a 70%.

25
Fig. 45

viii) Para nomear o eixo das frequências (eixo vertical principal), selecione Layout Títulos
dos EixosTítulo do Eixo Vertical PrincipalTítulo Girado. Digite uma das opções:
Percentual, Frequência ou a especificação da medida.

Fig. 46

ix) Para mudar a cor, clique sobre uma das colunas, selecione Formatar Série de
DadosPreenchimento. Escolha o tipo, a cor e finalize.

Fig. 47

26
O gráfico resultante será o apresentado na Fig.48.
90
80
70
60
50
Percentual

40
30
20
10
0
Branca Parda Amarela Preta Outra
Fig. 48

5.5 CONSTRUÇÃO DE GRÁFICOS COMPARATIVOS (DUAS VARIÁVEIS)

Para estudarmos o caso de gráficos comparativos, considere Tabela 02, a qual


apresenta a cor ou raça do aluno considerando o sexo do mesmo.

i) Selecione as células que contenham a opção de interesse (A2 ate C7), ou seja, as
colunas das categorias da variável com suas respectivas frequências absolutas, conforme
Fig. 49 (corpo da tabela);

Fig. 49

ii) Como no tópico anterior, na barra de ferramentas, selecione Inserir e escolha o gráfico
adequado.

Fig. 50

27
iii) O gráfico obrigatoriamente deverá apresentar legenda para especificar as variáveis.

200
180
160
140
120
100 Feminino
80 Masculino
60
40
20
0
Branca Parda Amarela Preta Outra
Fig. 51

Para formatar o gráfico, os procedimentos são semelhantes aos apresentados para


gráficos simples.

iv) Para retirar as linhas de grade, basta selecioná-las (clicando em uma delas) e deletá-
las. O procedimento para mudanças das cores segue o mesmo procedimento já citados
anteriormente (5.4.1, viii e ix).
O gráfico deverá ter a seguinte aparência:

200 Feminino
180 Masculino
160
140
120
Frequência

100
80
60
40
20
0
Branca Parda Amarela Preta Outra
Fig. 52

6 VARIÁVEIS QUANTITATIVAS

A quantidade do volume de dados dificulta ou até mesmo torna impraticável tirar


conclusões a respeito do comportamento das variáveis e, em particular, de variáveis
quantitativas sem uma análise mais aprofundada. O ponto de partida para sua interpretação
28
é colocar os dados brutos de cada uma das variáveis quantitativas em uma ordem crescente
ou decrescente, denominado rol. A visualização de algum padrão ou comportamento
continua sendo de difícil observação ou até mesmo cansativa, mas torna-se rápido
identificar maiores e menores valores ou concentrações de valores no caso de variáveis
quantitativas. Estes números (menor e maior valor observado) servem de ponto de partida
para a construção de tabelas para estas variáveis. Vale destacar que para as variáveis
qualitativas, pode-se também construir um rol em ordem temporal ou alfabética, por
exemplo.
É a diferença entre o menor e maior valor observado da variável X, denominada
amplitude total (AT = xmax – xmin), que definirá a construção de uma distribuição de
frequência pontual ou em classes. O ideal é que uma distribuição de frequência resuma os
dados em um número de linhas que varie de 5 a 10. Nota-se que para cada tipo de variável
trabalhada, tem-se um procedimento adequado para a construção de sua distribuição de
frequências. A seguir é apresentado cada um dos casos.
A construção de uma distribuição de frequência pontual é equivalente à construção
de uma tabela simples, onde se listam os diferentes valores observados da variável, com
suas frequências absolutas, denotadas por Fi, onde o índice i corresponde ao número de
linhas da tabela. A distribuição de frequência para dados quantitativos pode apresentar as
seguintes colunas complementares, constando as frequências:
A frequência relativa, denotada por fi, e já definida anteriormente como:
Fi
fi 
n
onde n é o tamanho da amostra, devendo ser substituída por N se os dados forem
populacionais. A soma das frequências relativas de todas as categorias é igual a 1;

 a frequência relativa em percentual, denotada por fi%, e definida como:


Fi
fi %  100 ,
n
Representação do percentual de observações que pertencem àquela categoria. A soma das
frequências deve, agora, ser igual a 100%;

 a frequência absoluta acumulada, denotada por Fa . Estas frequências são


i
obtidas somando-se a frequência absoluta do valor considerado, às frequências absolutas
anteriores a este mesmo valor.

 a frequência acumulada relativa, denotada por f a % e definida como:


i

Fa i
fai %  100
n
Exemplo: Construção da distribuição de frequência para variável que identifica o número de
pessoas, incluindo o próprio indivíduo, que vivem da renda mensal do grupo familiar do
entrevistado.

29
6.1 DISTRIBUIÇÃO DE FREQUÊNCIA PONTUAL – SEM PERDA DE INFORMAÇÃO

i) Selecionar os dados da variável Int.Disc./HabEst, e seguir todos os passos para o uso da


Tabela Dinâmica, apresentados para variáveis qualitativas;

Fig. 53

Não se esquecer de copiar a Tabela Dinâmica e colá-la como Valores, para poder
proceder a adequações necessárias à sua formatação. Todos os passos estabelecidos para
a construção das tabelas simples devem ser observados para esta situação.
A tabela, para estar completa precisa apresentar as frequências acumuladas.

ii) Frequência absoluta acumulada: Na coluna seguinte à do percentual (ou frequência


relativa) digite “=”, clique na célula que contém F1. (Fig.54)

Fig. 54

iii) Na linha abaixo, no exemplo, célula D3, digite “=”, clique na célula acima (D2), digite o
sinal “+” e clique na célula correspondente à F2 (B3). Isto significa que estamos
aplicando uma fórmula para somar 24 com 54.

Fig. 55

30
iv) Arraste esta fórmula até a célula que corresponda à linha anterior a que contém o total
das frequências absolutas (D9).
v) Para determinar a frequência relativa acumulada, pode-se aplicar o mesmo processo da
frequência absoluta acumulada ou então calcular o percentual da frequência absoluta
acumulada sobre o tamanho da amostra. Para a primeira possibilidade, digite na primeira
linha da coluna adjacente “=C2” e posteriormente, na célula imediatamente inferior,
“=E2+C3”. Pelo segundo método, calcula-se o percentual das fi usando diretamente os
valores especificados.

Fig. 56
vi) Arraste esta fórmula ate a célula que corresponda à linha anterior à que contém o total
das frequências absolutas (E9). O resultado será:

Dependentes da Frequência Frequência Frequência absoluta Frequência relativa


Renda Familiar absoluta relativa acumulada acumulada
1 24 5.6 24 5.6
2 54 12.6 78 18.1
3 110 25.6 188 43.7
4 161 37.4 349 81.2
5 62 14.4 411 95.6
6 15 3.5 426 99.1
7 4 0.9 430 100.0
Total 430 100.0 - -

6.1.1 GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS DISCRETAS – GRÁFICO DE BASTÕES

6.1.2 GRÁFICO DE BASTÕES:

Este gráfico é formado por segmentos de retas perpendiculares ao eixo horizontal


(eixo da variável), cujo comprimento corresponde à frequência absoluta ou relativa de cada
elemento da distribuição. Suas coordenadas não podem ser unidas porque a leitura do
gráfico deve tornar claro que não há continuidade entre os valores individuais assumidos
pela variável em estudo. Porém, por limitações do Excel, é comum substituí-lo por um
gráfico de colunas que é o que melhor se aproxima de um gráfico de bastões.

i- Na tabela construída, selecione apenas os dados da coluna que contenham a Fi


ii- Selecione InserirGráficosColunas (etapa é exatamente como na Fig.41, pag. 24)

31
iii- Clique com o lado direito do mouse sobre uma das colunas, ative Formatar Séries de
Dados, e na largura do espaçamento, arraste para o valor máximo

Fig. 57

Note que para este exemplo, a sequencia da variável está completa. Caso tal não
ocorresse, seriam necessárias readequações.

Exemplo: Suponha que a sequencia do número de dependentes fosse 3, 4, 5, 7, 9, 10 e 11.


vii) Para a construção do gráfico, deviríamos completar a sequência, inserindo os valores 6
e 8 na ordem, atribuindo frequência zero aos mesmos.

Fig. 58

Observe na Fig. 58, que o nome das variáveis no eixo x estão incorretas. O próximo
passo é atribuir o nome correto das variáveis.

viii) Selecione com o lado direito do mouse um dos valores do eixo horizontal. Clique em
Selecionar dados

32
Fig. 59

ix) No quadro de Rótulos do Eixo Horizontal (Categorias), vá para Editar

Fig. 60

x) Selecione os dados da tabela que contenham os nomes das variáveis, Ok;

Fig. 61

Os próximos passos correspondem apenas à formatação adequada.

200

150
Frequência

100

50

0
3 4 5 6 7 8 9 10 11
Nº de dependentes
Fig. 62

33
6.2 DISTRIBUIÇÃO DE FREQUÊNCIA EM CLASSES – COM PERDA DE INFORMAÇÃO

“A distribuição de frequências em classes é apropriada para apresentar dados


quantitativos contínuos ou discretos com um número elevado de possíveis valores”
(Medronho, 2003, p231). É necessário dividir os dados em intervalos ou faixas de valores
que são denominadas classes. Uma classe é uma linha da distribuição de frequências. O
menor valor da classe é denominado limite inferior (li) e o maior valor da classe é
denominado limite superior (Li). O intervalo ou classe pode ser representado das seguintes
maneiras:
a) li |____ Li, onde o limite inferior da classe é incluído na contagem da frequência
absoluta mas o superior não;
b) li ____| Li, onde o limite superior da classe é incluído na contagem mas o inferior
não;
c) li |____| Li, onde tanto o limite inferior quanto o superior são incluídos na
contagem;
d) li ____ Li, onde os limites não fazem parte da contagem.
Pode-se escolher qualquer uma destas opções sendo o importante tornar claro no
texto ou na tabela qual está sendo usada.
“Se houver muitos intervalos, o resumo não constituirá grande melhoria com relação
aos dados brutos. Se houver muito poucos, um grande volume de informação se perderá.
Embora não seja necessário, os intervalos são frequentemente construídos de modo que
todos tenham larguras iguais, o que facilita as comparações entre as classes”. (Pagano,
2004, p.11).
Milone (2004, p.36) apresenta os seguintes critérios para a determinação do número
de intervalos, denotado por k:
1. Raiz quadrada: √
2. Log (Sturges):
3. ln (Milone):
para as quais n é o número de elementos da amostra, AT é a amplitude total dos dados e d
é o número de decimais de seus elementos. Deve-se lembrar que sendo k o número de
classes, o resultado obtido por cada um dos critérios deve ser o número inteiro mais próximo
ao obtido.
Milone (2004) acrescenta ainda que, adotando o princípio de que os agrupamentos
devem ter no mínimo cinco e no máximo 20 classes, o critério da raiz é valido para 25≤ n
≤400, o do log para 16  n  572.237 e o do ln para 20  n  36.315.
Por outro lado, o pesquisador pode definir o número de classes baseando-se em sua
experiência.
Determinado o número de classes da distribuição de frequências, o próximo passo é
determinar a amplitude de cada classe, h, que por uma questão de bom senso deveria ser

34
um número com a mesma precisão dos dados.
A amplitude de classe, h, é definida por:
AT
h
k
e assim todas as classes terão a mesma amplitude, o que permitirá a construção de gráficos
e cálculo de medidas descritivas.
No caso de uma distribuição de frequência contínua, ou em classes, uma outra
coluna pode ser acrescentada à tabela. É a coluna dos pontos médios, denotada por xi e
definida como a média dos limites da classe:
li  Li
xi  , i  1,..., k .
2
Estes valores são utilizados na construção de gráfico e na obtenção de medidas
descritivas com o auxílio de calculadoras.
Tomemos como exemplo, a tabulação da variável peso. Para este tipo de variável é
mais simples mesclarmos.

6.2.1 CONSTRUÇÃO DE TABELA COM PERDA DE INFORMAÇÕES (POR CLASSES)

Para agilizar o trabalho de resumir e apresentar os dados, primeiramente é


necessário assegurar que na barra de ferramentas, esteja disponibilizada a aba “Análise de
dados”. Caso ela não esteja disponível na barra de Menus Dados, basta inseri-la:
i) Clique em ArquivoOpçõesSuplementos. Na tela que surgir, no quadro
Gerenciar, deverá ser selecionado Suplementos do Excel Ir...

Fig. 63

ii) Na próxima tela, Suplementos, marque Ferramentas de Análise.

35
Fig. 64

Assim, estamos em condições de facilmente construir os limites superiores das


classes e seu respectivo gráfico. Para tal, antes podemos identificar as medidas descritiva
(serão detalhadas posteriormente).

iii) Selecione a coluna que contém a variável que se deseja analisar, como por exemplo, a
coluna da variável peso (coluna D).

iv) Na barra de Menus, selecione DadosAnálise de DadosEstatística descritiva

Fig. 65

v) Em Intervalo de entrada, selecione os dados que deseja distribuir; Agrupado por:


Colunas; Rótulo na primeira linha, marque se os dados estiverem identificados pelo seu
rótulo; Intervalo de saída: clique a célula que deseja inserir os resultados; acione Resumo
estatísticoOk

36
Quadro 1: Medidas descritivas para a variável peso.
Peso

Média 68.03535
Erro padrão 0.746089
Mediana 65
Modo 80
Desvio padrão 15.47123
Variância da amostra 239.3589
Curtose 1.262555
Assimetria 0.901023
Intervalo 103
Mínimo 39
Máximo 142
Soma 29255.2
Contagem 430

Para determinar o número de classes da distribuição, k, como n= 430, MAIOR QUE


100, usaremos a fórmula: (pag. 36, item 3).

vi) Em uma coluna, digite k (numero de classes) e abaixo, h (amplitude da classe) (Fig. 66);
vii) Na coluna que seguinte e m esma linha, digite a fórmula “=-1+2*ln(430)”. O valor deve
ser aproximado para um número inteiro.
viii) Para determinar a amplitude da classe, h, dividimos o intervalo (valor máximo – valor
mínimo) pelo número de classes; h= 9

Fig. 66
ix) Iniciar uma nova tabela, começando pelos limites superiores das classes. Copie na
célula abaixo do Limite superior, o conteúdo do valor Mínimo das medidas “=B11”.

37
Fig. 67

x) No limite superior, digite a fórmula “=G2+9-0.00001”. A subtração de 0.00001 deve-se


ao fato de nos assegurarmos que o limite superior não esteja contido no intervalo. Note que
a última célula apresenta um valor 147, ou seja, 5 unidades maior que o valor máximo da
variável, 142. Para equilibrar essa diferença, pode ser digitado, por exemplo, 37 no primeiro
limite inferior; imediatamente os valores serão corrigidos.

xi) Para os demais limites inferiores, abaixo da célula que contém o primeiro limite, digite
a formula “=E2+9”; note-se que não se faz subtração neste limite. Arraste a fórmula até a
última linha.
Limite inferior Limite superior
37 |--- 46
46 |--- 55
55 |--- 64
64 |--- 73
73 |--- 82
82 |--- 91
91 |--- 100
100 |--- 109
109 |--- 118
118 |--- 127
127 |--- 136
136 |--- 145
xii) A frequência absoluta pode ser determinada por dois processos: 1ª) Selecionar a
coluna à direita do limite superior – Fig. 68.

Fig. 68
xiii) Pelo comando Inserir função EstatísticaFrequênciaOk

38
Fig. 69

xiv) No quadro da Frequência, em Matriz_dados deve-se selecionar todos os


dados da variável peso (não pode ser incluído o rótulo). Os dados podem estar na
mesma planilha ou em outra planilha. Em Matriz_bin, selecionam-se os dados dos
limites superiores das classes, conforme quadro que segue.

Fig. 70

xv) Simultaneamente, pressione as teclas Ctrl + Shift+Enter.

Limite Limite Frequência


inferior superior absoluta
37 |--- 46 14
46 55 86
55 64 101
64 73 83
73 82 79
82 91 35
91 100 24
100 109 1
109 118 5
118 127 1
127 136 0
136 145 1
Total 430

39
A frequência relativa e as respectivas frequências acumuladas seguem exatamente
os mesmos passos que a distribuição para variáveis com perda de informações.

Tabela 4: Distribuição do peso dos alunos da Universidade Estadual de Maringá. Maringá,


02/2016.
Frequência Frequência
Frequência Frequência
Pesos absoluta relativa
absoluta relativa
acumulada acumulada
37 |--- 46 14 3.3 14 3.3
46 |--- 55 86 20.0 100 23.3
55 |--- 64 101 23.5 201 46.7
64 |--- 73 83 19.3 284 66.0
73 |--- 82 79 18.4 363 84.4
82 |--- 91 35 8.1 398 92.6
91 |--- 100 24 5.6 422 98.1
100 |--- 109 1 0.2 423 98.4
109 |--- 118 5 1.2 428 99.5
118 |--- 127 1 0.2 429 99.8
127 |--- 136 0 0.0 429 99.8
136 |--- 145 1 0.2 430 100.0
Total 430 100.0 - -

6.2.2 CONSTRUÇÃO DE GRÁFICOS PARA UMA VARIÁVEL QUANTITATIVA DISCRETA

6.2.3 HISTOGRAMA

É um gráfico de colunas justapostas que representa uma distribuição de frequência


para dados contínuos ou uma variável discreta quando esta apresentar muitos valores
distintos. Ele mostra variação sobre uma faixa específica. O histograma foi desenvolvido
por Guerry em 1833 para descrever sua análise de dados sobre crime. Desde então, os
histogramas tem sido aplicados para descrever os dados nas mais diversas áreas.
Para sua construção, no eixo horizontal são dispostos os limites das classes
segundo as quais os dados foram agrupados enquanto que o eixo vertical corresponde às
frequências absolutas ou relativas das mesmas. Quando os dados são distribuídos em
classes de mesma amplitude, todas as colunas apresentam bases iguais com alturas
variando em função das suas frequências absolutas ou relativas. Neste caso, tem-se que a
área de cada retângulo depende apenas da sua altura. Um histograma pode representar
uma distribuição com classes de tamanho diferentes, ou seja, dados agrupados em classes
de dimensões diferentes e neste caso, a área de cada coluna já não é mais proporcional à
sua altura. O enfoque deste texto é trabalhar com classes de mesmo tamanho.
Um Histograma, no Excel, pode ser feito diretamente por meio da ferramenta:

40
Análise de dados.

i) Selecione DadosAnálise de dadosHistograma

Fig. 71
ii) O preenchimento desta etapa é bastante semelhante à utilizada para obter as medidas.
A No quadro do Intervalo de saída deve ser clicado a célula onde desejamos que os
resultados devem ser apresentados. No exemplo, A18. Assinalar Resultado do gráfico
Ok.

Fig. 72

Automaticamente tem-se o histograma (não formatado) e as frequências absolutas


que já havia sido calculada pela função Frequência.

Fig. 73

A partir desta fase, repetem-se os procedimentos para formatar o histograma de

41
acordo com as normas vigentes.

101

86 83
Freqüência 79

35
24
14
5
1 1 0 1 0

46 55 64 73 82 91 100 109 118 127 136 145 Mais

Peso (kg)
Fig. 74

7 MEDIDAS DESCRITIVAS

7.1.1 MÉDIA ARITMÉTICA

A média aritmética ̅ é a soma de todos os valores observados da variável dividida


pelo número total de observações. Sob perspectiva geométrica, a média de uma distribuição
é o centro de gravidade, e representa o ponto de equilíbrio de um conjunto de dados. É a
medida de tendência central mais utilizada para representar a massa de dados.
Seja (x1, ..., xn) um conjunto de dados. A média é dada por:
N n
 xi  xi
  i 1 ou X  i 1
N n
para dados populacionais ou amostrais, respectivamente. Caso os dados estejam
apresentados segundo uma distribuição de frequência, tem-se:
k k
 x i Fi  x i Fi
  i 1 ou X  i 1 .
N n
Observe que no caso de dados agrupados a média é obtida a partir de uma
ponderação, onde os pesos são as frequências absolutas de cada classe e xi é o ponto
médio da classe i.
Citam-se a seguir, algumas propriedades da média aritmética:
1. a média é um valor calculado facilmente e depende de todas as observações;
2. é única em um conjunto de dados e nem sempre tem existência real, ou seja, nem
sempre é igual a um determinado valor observado;

42
3. a média é afetada por valores extremos observados;
4. por depender de todos os valores observados, qualquer modificação nos dados
fará com que a média fique alterada. Isto quer dizer que somando-se, subtraindo-se,
multiplicando-se ou dividindo-se uma constante a cada valor observado, a média ficará
acrescida, diminuída, multiplicada ou dividida desse valor.
5. a soma da diferença de cada valor observado em relação à média é zero, ou seja,
a soma dos desvios é zero.
 (xi  x)  0
A propriedade 5, é de extrema importância para a definição de variância, uma
medida de dispersão a ser definida posteriormente.
Destaca-se, ainda, que a propriedade 3, quando se observam no conjunto dados
discrepantes, faz da média uma medida não apropriada para representar os dados. Neste
caso, não existe uma regra prática para a escolha de uma outra medida. O ideal é, a partir
da experiência do pesquisador, decidir pela moda ou mediana. Para ilustrar, considere o
número de filhos, por família, para um grupo de 8 famílias: 0, 1, 1, 2, 2, 2, 3, 4. Neste caso, a
média é x  1,875 filhos por família. Entretanto, incluindo ao grupo uma nova família com 10
filhos, a média passa a se x  2,788 , o que eleva em 48,16% o número médio de filhos por
família. Assim, ao observar a média, pode-se pensar que a maior parte das famílias deste
grupo tem três filhos quando, na verdade, apenas uma tem três filhos.

7.1.2 MODA

A moda (Mo) é o valor que apresenta a maior frequência da variável entre os valores
observados. Para o caso de valores individuais, a moda pode ser determinada
imediatamente observando-se o rol ou a frequência absoluta dos dados. Por outro lado, em
se tratando de uma distribuição de frequência de valores agrupados em classes,
primeiramente é necessário identificar a classe modal, aquela que apresenta a maior
frequência, e a seguir a moda é calculada aplicando-se a fórmula:
h(Fi  Fi 1)
Mo  li 
(Fi  Fi 1)  (Fi  Fi 1)

43
onde
i é a ordem da classe modal;
li é o limite inferior da classe modal;
h é a amplitude da classe modal;
Fi é a frequência absoluta da classe modal;
Fi 1 é a frequência absoluta da classe anterior à classe modal;

Fi 1 é a frequência absoluta da classe posterior à classe modal.

É relevante salientar que um conjunto de dados pode apresentar todos seus


elementos com a mesma frequência absoluta e, neste caso, não existirá um valor modal, o
que significa que a distribuição será classificada como amodal. Podem ocorrer, também,
casos em que a sequência de observações apresente vários elementos com frequências
iguais, implicando numa distribuição plurimodal.
O uso da moda é mais indicado quando se deseja obter, rapidamente, uma medida
de tendência central. Um outro aspecto que favorece a utilização da moda é que seu valor
não é afetado pelos valores extremos do conjunto de dados analisados.
Graficamente, utilizando-se um conjunto de dados hipotéticos, identifica-se a classe
modal como aquela que apresenta o retângulo de maior altura (frequência). A intersecção
das retas que unem os pontos AD e os pontos BC, determina o ponto P que, projetado
perpendicularmente no eixo da variável, corresponderá ao valor da moda Mo. (Fig. 75)

12
A C
10
Nº de alunos

8
D
6

2
B Anos
0
18 Mo 22 26 30 34 38
Fig. 75

44
7.1.3 MEDIANA

A mediana (Md) é o valor que ocupa a posição central da série de observações de


uma variável, em rol, dividindo o conjunto em duas partes iguais, ou seja, a quantidade de
valores inferiores à mediana é igual à quantidade de valores superiores a mesma.

Exemplo: Retomando o exemplo do número de filhos por famílias, verifica-se que:


Para o caso de oito famílias, n=8, a mediana é determinada como a seguir:
X x1 x2 x3 x4 x5 x6 x7 x8
x 4 +x 5
Valor observado 0 1 1 2 2 2 3 4
2
4 observações Md=2 4 observações

Quando se acrescenta ao grupo uma outra família com 10 filhos o tamanho da


amostra passa a ser n=9. Neste caso, a mediana é:
X x1 x2 x3 x4 x5 x6 x7 x8 x9
Valor observado 0 1 1 1 2 2 3 4 10
4 observações Md=2 4 observações

Observe que nos dois casos, por coincidência, a mediana manteve-se a mesma,
Md=2, significando que 50% das famílias possuem menos de 2 filhos ou 50% possuem mais
de 2 filhos. Mostra-se assim, que a mediana não é influenciada por valores extremos.

7.2 MEDIDAS DE DISPERSÃO

De acordo com Toledo (1985), fenômenos que envolvem análises estatísticas


caracterizam-se por suas semelhanças e variabilidades. As medidas de dispersão auxiliam
as medidas de tendência central a descrever o conjunto de dados adequadamente. Indicam
se os dados estão, ou não, próximos uns dos outros.
Desta forma, não há sentido calcular a média de um conjunto onde não há variação
dos seus elementos. Existe ausência de dispersão e a medida de dispersão é igual a zero.
Por outro lado, aumentando-se a dispersão, o valor da medida aumenta e se a variação for
muito grande, a média não será uma medida de tendência central representativa.
Faz-se necessário, portanto, ao menos uma medida de tendência central e uma
medida de dispersão para descrever um conjunto de dados.
As quatro medidas de dispersão que serão definidas a seguir são: amplitude total,
amplitude interquartílica, desvio padrão e variância. Com exceção à primeira, todas têm
como ponto de referência a média.

45
7.2.1 AMPLITUDE TOTAL

A amplitude total de um conjunto de dados é a diferença entre o maior e o menor


valor observado. A medida de dispersão não levar em consideração os valores
intermediários perdendo a informação de como os dados estão distribuídos e/ou
concentrados.
At  x max  x min

7.2.2 VARIÂNCIA E DESVIO PADRÃO

Enquanto não há nada conceitualmente errado em se considerar o desvio médio,


segundo Pagano (2004), esta medida não tem certas propriedades importantes e não é
muito utilizada. O mais comum é considerar o quadrado dos desvios em relação à média e
então calcular a média. Obtém-se, assim a variância que é definida por:

N n
 ( x i  ) 2  (x i  x) 2
 2  i 1 ou S2  i 1
,
N n 1
se os dados são populacionais ou amostrais, respectivamente. Caso os dados estejam
apresentados segundo uma distribuição de frequência, tem-se:

k k
 ( x i  ) 2 Fi  ( x i  x ) 2 Fi
i 1 i 1
2  ou s2  .
N n 1
Entretanto, ao calcular a variância observa-se que o resultado será dado em
unidades quadráticas, o que dificulta a sua interpretação. O problema é resolvido extraindo-
se a raiz quadrada da variância, definindo-se, assim, o desvio padrão:

N n
 ( x i  ) 2
i 1
 (x i  x) 2
 ou S i 1
,
N n 1
se os dados são populacionais ou amostrais e, se estiverem em distribuição de frequências:

k k
 ( x i  ) 2 Fi
i 1
 (x i  x ) 2 Fi
 ou S i 1
.
N n 1
É importante destacar que se duas populações apresentam a mesma média, mas os
desvios padrão não são iguais, isto não significa que as populações têm o mesmo
comportamento.

46
ACORSI, C.R.L.; GUEDES, T.A.; MARTINS, A. B. T.; JANEIRO, V. Estatística Descritiva.
Relatório do Projeto Aprender Fazendo Estatística.

BUSSAB, W. O. e MORETTIN, P. A. Estatística Básica. São Paulo: Editora Saraiva, 2013. 8ª


edição.

MAGALHÃES, M. N. e LIMA, A. C. P.de. Noções de Probabilidade e Estatística. São


Paulo: IME-USP, 2000.

MILONE, Giuseppe. Estatística Geral e Aplicada. São Paulo: Pioneira Thomson Learning, 2004.

47

Você também pode gostar