Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
ANÁLISE DESCRITIVA NO
EXCEL
1 INTRODUÇÃO
Na obtenção dos dados, deve-se atentar para a coleta. Ela deve ser realizada por
meio de um instrumento capaz de fornecer as informações para atender aos objetivos do
trabalho.
Atualmente, a utilização de planilhas eletrônicas, tem um papel importante no
desenvolvimento da estatística. Um software integrado de planilhas e gráficos é o EXCEL
que é utilizado como uma poderosa ferramenta para a realização de tarefas em todas as
áreas, além de ser uma ferramenta acessível em quase todos ambientes.
O objetivo deste curso é utilizar o Excel como ferramenta para análise de dados e
construção de tabelas e gráficos.
Neste curso, inicialmente são apresentadas instruções básicas e próprias do
software. Posteriormente, são fornecidas instruções que auxiliam o professor do ensino
fundamental e médio a usufruir dos recursos do software Excel, aperfeiçoando
gradativamente suas habilidades e desenvolvendo suas competências, num processo
dinâmico e construtivo. A proposta de trabalho com o auxílio do microcomputador é que o
professor busque alternativas para aplicar junto aos alunos do ensino fundamental e médio,
novas metodologias de ensino.
1
2 NOÇÕES BÁSICAS PARA O USO DO EXCEL
Fig. 1
Barra de Menus
Barra de
fórmulas
Célula
Barra de
Ferramentas
Identificação das
colunas - letras
Planilha ativa
Identificação das
linhas - números
Fig. 2
2
2.3 CRIAR ARQUIVO
Para criar um arquivo, antes mesmo de digitar os dados, pode-se nomeá-lo e salva-
lo, para posteriormente iniciar o trabalho de sua construção.
Fig. 3
Fig. 4
3
Nome do arquivo: digite um nome para o arquivo de dados.
Tipo: é mais conveniente usar Pasta de trabalho do Microsoft Excel.
Clique em Salvar.
As gravações seguintes podem ser feitas clicando no ícone .
ii) Em cada linha digite o sexo, a idade e as demais especificações de cada aluno.
Fig. 5
Fig. 6
4
Fig. 7
Fig. 8
5
Fig. 9
Fig. 10
Obs: No caso de ser necessário a exclusão de uma planilha, use o procedimento exposto
pela Fig.9, clique em: Editar (Excluirá a planilha).
2.7 DEFINIR TAMANHOS IGUAIS PARA DUAS OU MAIS LINHAS (OU COLUNAS):
2.7.1 SUBSEQUENTES:
Para selecionar uma linha (ou coluna) por inteiro, basta clicar no número (ou letra)
que as identificam. Por exemplo, para selecionar a linha 6:
Fig. 11
6
i) Suponha que seja necessário converter as linhas 6, 7 e 8 em alturas de tamanhos
maiores e iguais (ou menores e iguais).
ii) Ao selecionar a linha 6, arraste o mouse até a linha 8.
iii) Com o cursor posicionado exatamente sobre a linha inferior da linha 8, pressione o
mouse e arraste o cursor deixando a linha na largura desejada. Ao soltar o mouse, todas as
linhas terão a mesma largura. O mesmo procedimento deve ser repetido para a adequação
da largura das colunas.
Fig. 12
2.7.2 ALTERNADAS
Fig. 13
7
Fig. 14
i) Selecione a quantidade de linhas ou colunas que se deseja incluir (ou excluir) e clique
com o lado direito do mouse;
ii) Clique em Inserir ou Excluir;
Fig. 15
Obs: A linha será incluída acima da linha selecionada e a coluna à esquerda da coluna
selecionada.
Clique sobre a célula que se deseja copiar, pressione a tecla Ctrl e depois a tecla C
(para copiar). Também pode-se copiar o conteúdo de uma célula, selecionando-a e com o
8
2.9.2 COLAGEM SIMPLES DE UMA CÉLULA:
Após proceder a cópia desejada, escolha uma célula vazia onde deve ser colado o
conteúdo copiado. Clique a tecla Ctrl e simultaneamente pressione a tecla V (para colar), ou
ainda apenas, na célula de destino, clicar no ícone .
Fig. 16
Fig. 17
Este procedimento pode ser realizado para ordenar em relação a qualquer coluna,
conservando a expansão (ou não).
9
3 DEFINIÇÕES
Exemplos:
a) O censo no Brasil é feito a cada dez anos. Qual é a população de interesse? Todos os
domicílios do Brasil.
b) Em uma pesquisa de opinião para saber o resultado das eleições para prefeito de
Maringá. Qual a população de interesse? Qual seria a amostra? A população são todos os
eleitores de Maringá. A amostra seria um subconjunto (ex., de 1200 eleitores) da população.
- Qualitativas: Quando seus valores forem expressos por categorias ou atributos (não
numéricas). Podem ser:
- Nominais. Ex.: sexo, cor de olhos,...
- Ordinais. Ex.: Ensino: fundamental, médio, superior.
- Quantitativas: Seus valores são mensuráveis e suas intensidades podem ser expressas
por unidades físicas. Podem ser:
- Contínuas. Quando assumem infinitos (não-enumerável) valores num
intervalo. Ex.: peso, altura, ...
- Discretas: Assumem valores pontuais, geralmente de números inteiros finitos
ou infinitos enumeráveis. Ex: número de filhos de um casal,
número de grãos de uma safra,...
10
3.1 AMOSTRAGEM
Exemplos:
a) Tirar conclusões sobre a altura, peso, idade de 600 estudantes da escola, observando
apenas 80 estudantes. Tamanho da população (N) = 600 e o tamanho da amostra (n) = 80.
b) Investigar a porcentagem de peças defeituosas fabricadas em uma indústria, durante 6
dias, examinando 20 peças por dia. População = todas as peças fabricadas durante 6 dias e
a Amostra = o subconjunto de 6x20=120 peças, selecionadas aleatoriamente para estudo.
11
z2 N
n (populações finitas)
[4 e 2 (N 1) z 2 ]
2
1z
n (populações infinitas)
4e
Exemplo: Deseja-se calcular o tamanho de uma amostra para uma população de tamanho
finito, N=404, com erro máximo estipulado em e=0,05 (5%) e uma confiança de 95%.
Fig. 18
12
iii) Criar Tabela Dinâmica:
Fig. 19
iv) No quadro Selecionar uma tabela ou intervalo, selecione os dados (podem estar em
outra planilha), inclusive com os títulos de cada coluna (ou linha) que se encontram na
planilha (no exemplo, os dados estão na planilha Dados e a tabela está sendo construída na
planilha Tabelas). O quadro para definir as variáveis será conforme Fig.20.
Fig. 20
v) Para a construção de uma tabela simples a variável que se deseja tabular deve ser
arrastada para o campo “Rótulos de linha” e para o “Valores”. É importante lembrar que no
campo Valores a variável desejada deve vir acompanhada da função Contagem; caso isso
não aconteça será necessário clicar na seta do campo, selecionar Configurações do
campo de Valor e dentre as opções, escolher a função Contagem, conforme a Fig. 21.
13
Fig. 21
Fig. 22
vii) Note que pela seta dos rótulos de linhas, os níveis podem ser retirados ou não. Por
exemplo, para retirar a observação (vazio), basta clicar em vazio.
Fig. 23
Por meio da Fig. 22, observa-se que o resultado será uma tabela cuja formatação
não se apresenta segundo as normas exigidas. Para que haja mais flexibilidade no trabalho
com uma tabela, deve-se copiá-la e fazer uma Colagem Especial, colando-a, numa célula
qualquer, como Valores (Fig.25).
14
Fig. 24
Fig. 25
A próxima etapa será construir o percentual referente a cada cor ou raça identificada
entre os alunos. Basta aplicar a fórmula para a primeira linha e posteriormente colá-la nas
demais linhas. O percentual da frequência absoluta também é conhecido como frequência
relativa e calculado da seguinte forma: .
Para dividir o número de alunos da cor/raça amarela (Fi= 33) pelo total de alunos
entrevistados (n= 430) e multiplicar o resultado por 100, proceda da seguinte maneira:
15
Fig. 26
Fig. 27
Nota: Observe que a variável Cor ou raça na tabela no Excel foi ordenada em ordem
alfabética. Para ordená-la de acordo com a necessidade, ainda no Excel, siga os seguintes
procedimentos:
a) Na coluna à esquerda da especificação da variável, digite a ordem desejada;
selecione a coluna (Fig. 28).
Fig. 28
16
b) Acione o comando Classificar em ordem crescente (lembrando que deve sempre
observar que deve obedecer sempre: Expandir a seleção).
A partir desta nova tabela, a mesma pode ser copiada, colada e formatada no Word,
de acordo com as normas estabelecidas. (Tópico 4.2)
Fig. 29
A formatação de uma tabela deve seguir as normas vigentes. Para facilitar a edição,
ela pode ser copiada da planilha do Excel e colada no documento do Word. A Tabela 01
corresponde a uma tabela simples formatada.
17
Tabela 1: Cor ou raça de uma amostra dos alunos da Universidade Estadual de Maringá.
Maringá, 02/2016. (Tabela simples)
Cor ou Raça Nº de Alunos Percentual
Amarela 33 7.7
Branca 329 76.5
Parda 54 12.6
Preta 9 2.1
Outra 5 1.2
Total 430 100.0
Fonte: Relatório do projeto de pesquisa 570/2013.
Fig. 30
iii) Clique com o lado direito do mouse Auto Ajuste Ajustar-se automaticamente à
Janela (conforme Fig. 29).
Fig. 31
18
iv) Confira se todas as colunas estão identificadas corretamente (cabeçalho das
variáveis);
v) Insira as bordas superiores e inferiores conforme Tabela 01.
Para formatar uma tabela comparativa, os procedimentos iniciais são os mesmos (de i a v).
No Word, a tabela estará com a seguinte forma:
Fig. 32
vi) Selecione as duas colunas superiores centrais (as colunas que corresponde os níveis
da variável sexo, na linha correspondente), como na Fig. 32;
vii) Quando tais colunas forem selecionadas, aparecerá na parte superior da barra de
ferramentas, os ícones das Ferramentas de Tabela:
Fig. 33
Fig. 34
19
Nesta etapa outras correções devem ser procedidas. Lembrando que se houver
interesse em que as categorias sejam ordenadas por outra lógica, isto deverá ser procedido
ainda com a tabela no arquivo do Excel.
x) Também as linhas da especificação da variável devem ser mescladas, como no item viii,
deste tópico.
xi) Ainda em Layout, a especificação da variável deverá ter seu alinhamento centralizado.
Sexo
Cor ou Raça
Feminino Masculino Total
Amarela 20 13 33
Branca 185 144 329
Parda 21 33 54
Preta 3 6 9
Outra 3 2 5
Total 232 198 430
xii) Selecione a tabela, clique o mouse do lado direito. Acione Bordas e Sombreamento;
Fig. 35
20
xiii) Insira as bordas conforme procedimentos da tabela simples. Nesta etapa são
apresentadas as bordas conforme exigência do periódico;
Tabela 2: Cor ou Raça dos alunos da Universidade Estadual de Maringá amostrado segundo
o sexo dos mesmos. Maringá, 02/2016. (Tabela comparativa)
Sexo
Cor ou Raça
Feminino Masculino Total
Branca 185 144 329
Parda 21 33 54
Amarela 20 13 33
Preta 3 6 9
Outra 3 2 5
Total 232 198 430
21
Fig. 36
Fig. 37
22
alguma ordem específica.
O procedimento para o cálculo do ângulo correspondente a cada categoria é feito por
meio de simples proporções: 360º que corresponde a um círculo completo está para o total
da amostra, assim como xº está para o total de indivíduos que pertencem à categoria
desejada.
360º xº
n Fi
Fig. 38
Fig. 39
Para o caso da Tabela 01 dada como exemplo, selecione os dados de interesse (corpo da
tabela). O gráfico pode ser executado considerando as frequências absolutas ou relativas
(percentuais).
i) Primeiramente selecione as colunas que serão representadas.
ii) Na Barra de Menus, clique em Inserir Gráficos (talvez em sua tela já possa ir direto
para o tipo de gráfico, item iii)
23
Fig. 40
iii) Como as especificações das variáveis são pouco extensas, o gráfico de colunas. Ao
clicar nesta opção, vários tipos de gráficos podem ser escolhidos: dimensões 2 ou 3.
Fig. 41
iv) Escolhendo Coluna 2D, tem-se a Fig.42, mas que necessita ser formatada:
Nº de Alunos
400
300
200
100 Nº de Alunos
0
Fig. 42
v) A legenda deve ser deletada, pois não há necessidade de identificar a variável pois ela
é única; da mesma forma, as linhas que aparecem no gráfico.
24
350
300
250
200
150
100
50
0
Amarela Branca Parda Preta Outra
Fig. 43
Faz-se necessário identificar os eixos e aproximar as colunas (2/3 da base dos retângulos).
vi) Basta selecionar as colunas do gráfico clicando em uma das colunas; observe que
todas deverão ficar selecionadas. Com o lado direito do mouse, clique em Formatar Série
de Dados.
Fig. 44
vii) Surgirá uma tela como a apresentada na Fig.45. Na opção Largura do Espaçamento,
reduzir para 65% a 70%.
25
Fig. 45
viii) Para nomear o eixo das frequências (eixo vertical principal), selecione Layout Títulos
dos EixosTítulo do Eixo Vertical PrincipalTítulo Girado. Digite uma das opções:
Percentual, Frequência ou a especificação da medida.
Fig. 46
ix) Para mudar a cor, clique sobre uma das colunas, selecione Formatar Série de
DadosPreenchimento. Escolha o tipo, a cor e finalize.
Fig. 47
26
O gráfico resultante será o apresentado na Fig.48.
90
80
70
60
50
Percentual
40
30
20
10
0
Branca Parda Amarela Preta Outra
Fig. 48
i) Selecione as células que contenham a opção de interesse (A2 ate C7), ou seja, as
colunas das categorias da variável com suas respectivas frequências absolutas, conforme
Fig. 49 (corpo da tabela);
Fig. 49
ii) Como no tópico anterior, na barra de ferramentas, selecione Inserir e escolha o gráfico
adequado.
Fig. 50
27
iii) O gráfico obrigatoriamente deverá apresentar legenda para especificar as variáveis.
200
180
160
140
120
100 Feminino
80 Masculino
60
40
20
0
Branca Parda Amarela Preta Outra
Fig. 51
iv) Para retirar as linhas de grade, basta selecioná-las (clicando em uma delas) e deletá-
las. O procedimento para mudanças das cores segue o mesmo procedimento já citados
anteriormente (5.4.1, viii e ix).
O gráfico deverá ter a seguinte aparência:
200 Feminino
180 Masculino
160
140
120
Frequência
100
80
60
40
20
0
Branca Parda Amarela Preta Outra
Fig. 52
6 VARIÁVEIS QUANTITATIVAS
Fa i
fai % 100
n
Exemplo: Construção da distribuição de frequência para variável que identifica o número de
pessoas, incluindo o próprio indivíduo, que vivem da renda mensal do grupo familiar do
entrevistado.
29
6.1 DISTRIBUIÇÃO DE FREQUÊNCIA PONTUAL – SEM PERDA DE INFORMAÇÃO
Fig. 53
Não se esquecer de copiar a Tabela Dinâmica e colá-la como Valores, para poder
proceder a adequações necessárias à sua formatação. Todos os passos estabelecidos para
a construção das tabelas simples devem ser observados para esta situação.
A tabela, para estar completa precisa apresentar as frequências acumuladas.
Fig. 54
iii) Na linha abaixo, no exemplo, célula D3, digite “=”, clique na célula acima (D2), digite o
sinal “+” e clique na célula correspondente à F2 (B3). Isto significa que estamos
aplicando uma fórmula para somar 24 com 54.
Fig. 55
30
iv) Arraste esta fórmula até a célula que corresponda à linha anterior a que contém o total
das frequências absolutas (D9).
v) Para determinar a frequência relativa acumulada, pode-se aplicar o mesmo processo da
frequência absoluta acumulada ou então calcular o percentual da frequência absoluta
acumulada sobre o tamanho da amostra. Para a primeira possibilidade, digite na primeira
linha da coluna adjacente “=C2” e posteriormente, na célula imediatamente inferior,
“=E2+C3”. Pelo segundo método, calcula-se o percentual das fi usando diretamente os
valores especificados.
Fig. 56
vi) Arraste esta fórmula ate a célula que corresponda à linha anterior à que contém o total
das frequências absolutas (E9). O resultado será:
31
iii- Clique com o lado direito do mouse sobre uma das colunas, ative Formatar Séries de
Dados, e na largura do espaçamento, arraste para o valor máximo
Fig. 57
Note que para este exemplo, a sequencia da variável está completa. Caso tal não
ocorresse, seriam necessárias readequações.
Fig. 58
Observe na Fig. 58, que o nome das variáveis no eixo x estão incorretas. O próximo
passo é atribuir o nome correto das variáveis.
viii) Selecione com o lado direito do mouse um dos valores do eixo horizontal. Clique em
Selecionar dados
32
Fig. 59
Fig. 60
Fig. 61
200
150
Frequência
100
50
0
3 4 5 6 7 8 9 10 11
Nº de dependentes
Fig. 62
33
6.2 DISTRIBUIÇÃO DE FREQUÊNCIA EM CLASSES – COM PERDA DE INFORMAÇÃO
34
um número com a mesma precisão dos dados.
A amplitude de classe, h, é definida por:
AT
h
k
e assim todas as classes terão a mesma amplitude, o que permitirá a construção de gráficos
e cálculo de medidas descritivas.
No caso de uma distribuição de frequência contínua, ou em classes, uma outra
coluna pode ser acrescentada à tabela. É a coluna dos pontos médios, denotada por xi e
definida como a média dos limites da classe:
li Li
xi , i 1,..., k .
2
Estes valores são utilizados na construção de gráfico e na obtenção de medidas
descritivas com o auxílio de calculadoras.
Tomemos como exemplo, a tabulação da variável peso. Para este tipo de variável é
mais simples mesclarmos.
Fig. 63
35
Fig. 64
iii) Selecione a coluna que contém a variável que se deseja analisar, como por exemplo, a
coluna da variável peso (coluna D).
Fig. 65
36
Quadro 1: Medidas descritivas para a variável peso.
Peso
Média 68.03535
Erro padrão 0.746089
Mediana 65
Modo 80
Desvio padrão 15.47123
Variância da amostra 239.3589
Curtose 1.262555
Assimetria 0.901023
Intervalo 103
Mínimo 39
Máximo 142
Soma 29255.2
Contagem 430
vi) Em uma coluna, digite k (numero de classes) e abaixo, h (amplitude da classe) (Fig. 66);
vii) Na coluna que seguinte e m esma linha, digite a fórmula “=-1+2*ln(430)”. O valor deve
ser aproximado para um número inteiro.
viii) Para determinar a amplitude da classe, h, dividimos o intervalo (valor máximo – valor
mínimo) pelo número de classes; h= 9
Fig. 66
ix) Iniciar uma nova tabela, começando pelos limites superiores das classes. Copie na
célula abaixo do Limite superior, o conteúdo do valor Mínimo das medidas “=B11”.
37
Fig. 67
xi) Para os demais limites inferiores, abaixo da célula que contém o primeiro limite, digite
a formula “=E2+9”; note-se que não se faz subtração neste limite. Arraste a fórmula até a
última linha.
Limite inferior Limite superior
37 |--- 46
46 |--- 55
55 |--- 64
64 |--- 73
73 |--- 82
82 |--- 91
91 |--- 100
100 |--- 109
109 |--- 118
118 |--- 127
127 |--- 136
136 |--- 145
xii) A frequência absoluta pode ser determinada por dois processos: 1ª) Selecionar a
coluna à direita do limite superior – Fig. 68.
Fig. 68
xiii) Pelo comando Inserir função EstatísticaFrequênciaOk
38
Fig. 69
Fig. 70
39
A frequência relativa e as respectivas frequências acumuladas seguem exatamente
os mesmos passos que a distribuição para variáveis com perda de informações.
6.2.3 HISTOGRAMA
40
Análise de dados.
Fig. 71
ii) O preenchimento desta etapa é bastante semelhante à utilizada para obter as medidas.
A No quadro do Intervalo de saída deve ser clicado a célula onde desejamos que os
resultados devem ser apresentados. No exemplo, A18. Assinalar Resultado do gráfico
Ok.
Fig. 72
Fig. 73
41
acordo com as normas vigentes.
101
86 83
Freqüência 79
35
24
14
5
1 1 0 1 0
Peso (kg)
Fig. 74
7 MEDIDAS DESCRITIVAS
42
3. a média é afetada por valores extremos observados;
4. por depender de todos os valores observados, qualquer modificação nos dados
fará com que a média fique alterada. Isto quer dizer que somando-se, subtraindo-se,
multiplicando-se ou dividindo-se uma constante a cada valor observado, a média ficará
acrescida, diminuída, multiplicada ou dividida desse valor.
5. a soma da diferença de cada valor observado em relação à média é zero, ou seja,
a soma dos desvios é zero.
(xi x) 0
A propriedade 5, é de extrema importância para a definição de variância, uma
medida de dispersão a ser definida posteriormente.
Destaca-se, ainda, que a propriedade 3, quando se observam no conjunto dados
discrepantes, faz da média uma medida não apropriada para representar os dados. Neste
caso, não existe uma regra prática para a escolha de uma outra medida. O ideal é, a partir
da experiência do pesquisador, decidir pela moda ou mediana. Para ilustrar, considere o
número de filhos, por família, para um grupo de 8 famílias: 0, 1, 1, 2, 2, 2, 3, 4. Neste caso, a
média é x 1,875 filhos por família. Entretanto, incluindo ao grupo uma nova família com 10
filhos, a média passa a se x 2,788 , o que eleva em 48,16% o número médio de filhos por
família. Assim, ao observar a média, pode-se pensar que a maior parte das famílias deste
grupo tem três filhos quando, na verdade, apenas uma tem três filhos.
7.1.2 MODA
A moda (Mo) é o valor que apresenta a maior frequência da variável entre os valores
observados. Para o caso de valores individuais, a moda pode ser determinada
imediatamente observando-se o rol ou a frequência absoluta dos dados. Por outro lado, em
se tratando de uma distribuição de frequência de valores agrupados em classes,
primeiramente é necessário identificar a classe modal, aquela que apresenta a maior
frequência, e a seguir a moda é calculada aplicando-se a fórmula:
h(Fi Fi 1)
Mo li
(Fi Fi 1) (Fi Fi 1)
43
onde
i é a ordem da classe modal;
li é o limite inferior da classe modal;
h é a amplitude da classe modal;
Fi é a frequência absoluta da classe modal;
Fi 1 é a frequência absoluta da classe anterior à classe modal;
12
A C
10
Nº de alunos
8
D
6
2
B Anos
0
18 Mo 22 26 30 34 38
Fig. 75
44
7.1.3 MEDIANA
Observe que nos dois casos, por coincidência, a mediana manteve-se a mesma,
Md=2, significando que 50% das famílias possuem menos de 2 filhos ou 50% possuem mais
de 2 filhos. Mostra-se assim, que a mediana não é influenciada por valores extremos.
45
7.2.1 AMPLITUDE TOTAL
N n
( x i ) 2 (x i x) 2
2 i 1 ou S2 i 1
,
N n 1
se os dados são populacionais ou amostrais, respectivamente. Caso os dados estejam
apresentados segundo uma distribuição de frequência, tem-se:
k k
( x i ) 2 Fi ( x i x ) 2 Fi
i 1 i 1
2 ou s2 .
N n 1
Entretanto, ao calcular a variância observa-se que o resultado será dado em
unidades quadráticas, o que dificulta a sua interpretação. O problema é resolvido extraindo-
se a raiz quadrada da variância, definindo-se, assim, o desvio padrão:
N n
( x i ) 2
i 1
(x i x) 2
ou S i 1
,
N n 1
se os dados são populacionais ou amostrais e, se estiverem em distribuição de frequências:
k k
( x i ) 2 Fi
i 1
(x i x ) 2 Fi
ou S i 1
.
N n 1
É importante destacar que se duas populações apresentam a mesma média, mas os
desvios padrão não são iguais, isto não significa que as populações têm o mesmo
comportamento.
46
ACORSI, C.R.L.; GUEDES, T.A.; MARTINS, A. B. T.; JANEIRO, V. Estatística Descritiva.
Relatório do Projeto Aprender Fazendo Estatística.
MILONE, Giuseppe. Estatística Geral e Aplicada. São Paulo: Pioneira Thomson Learning, 2004.
47