Você está na página 1de 30

1

ESTATÍSTICA & EXCEL I

Um grupo de pesquisadores elaborou um banco de dados com as


características dos nascidos vivos no período de janeiro a junho de 2000, de um
determinado município. As variáveis mensuradas foram as seguintes variáveis:
¾ Informações sobre a mãe
• DN - número do nascimento
• IDAMAE - idade da mãe
• ESTCIV - estado civil da mãe
• ESCMAE - escolaridade da mãe (anos)
• QFILVIVO - quantidade de filhos vivos
• QFILMORT - quantidade de filhos mortos
• BAIRES - bairro de residência da mãe (UBS)
• GESTACAO - idade gestacional (semanas)
• GRAVIDEZ - paridade
• PARTO - tipo de parto
• CONSULTAS - número de consultas pré-natal
¾ Informações sobre o recém-nascido
• DNASC - data de nascimento
• SEXO - sexo do recém-nascido
• APGAR1 - apgar no 1o minuto
• APGAR5 - apgar no 5o minuto
• RACACOR - raça ou cor do recém-nascido
• PESO - peso de nascimento em gramas

Para facilitar a análise dos dados obtidos, os mesmos foram armazenados


em uma planilha conforme mostra a tela a seguir:
2

1. Categorização de dados numéricos


Para melhor compreensão da relação dos recém-nascidos com baixo peso
(menos de 2500g) com demais variáveis relativas à criança e à mãe, devemos
categorizar o peso de nascimento nos seguintes intervalos:

Intervalos de Peso Grau de Obstrução

Peso < 2500g Baixo peso


Peso ≥ 2500g Normal

Para efetuar a categorização digitamos a palavra PESO1 na casela


referente à linha 1 da coluna R (casela R1) como rótulo para o peso de
nascimento.
Para categorizarmos o peso de nascimento digitamos na casela R2 a
seguinte condição:
= SE(Q2<2500;"Até 2500g";"2500g ou +")
3

A operação desta casela deve ser copiada para as demais caselas da


coluna R.

2. A tabela dinâmica

Os dados repetidos de um banco de dados podem ser resumidos em uma


tabela no aplicativo. Neste exemplo veja como criar uma tabela dinâmica a partir
da planilha atual

¾ Abra o menu Dados


¾ clique sobre o comando Relatório de Tabela Dinâmica
4

Esse assistente abrirá quatro janelas seqüencialmente. Na primeira


responder a pergunta: “Onde estão os dados que você deseja analisar”.
5

¾ nesta tela selecione a opção Banco de dados ou lista do Microsoft Excel


¾ o assistente clip perguntará se você precisa de ajuda, utilize-o se desejar
¾ clique sobre o botão Avançar

¾ informe ao aplicativo o intervalo de caselas ($A$1:$R$3955) da planilha


DADOS, onde encontra-se o banco de dados, desde que estejam incluídos os
rótulos e as listas de dados no campo intervalo
¾ clique sobre o botão Avançar

¾ Neste diagrama você poderá criar a tabela que desejar


6

¾ clique sobre os nomes dos componentes e arraste para a posição desejada,


por exemplo, arraste o botão IDAMAE para o campo LINHA e o botão DN
para o campo DADOS, neste caso aparecerá o botão Soma de DN. Para que
se processe a contagem dos graus de obstrução, clique duas vezes sobre o
botão e selecione Contagem de valores.

¾ clique sobre o botão OK


7

¾ Após o preenchimento dos campos clicar o botão Avançar


¾ Na tela a seguir são apresentadas duas opções
• Nova planilha: esta opção salva os dados resumidos em uma nova
planilha
• Planilha existente: salva os resultados resumidos em uma planilha
existente. Esta opção é a mais recomendável, pois podemos ter criar uma
planilha somente para as tabelas

¾ Para finalizar clique sobre o botão Concluir


8

Observe que a tabela na nova planilha (PLAN1) apresenta somente as


freqüências simples, se você quiser calcular a porcentagem correspondente
dessas freqüências basta faze-los na coluna seguinte (coluna C) digitando na
casela C3 a seguinte fórmula:
=B3*100/3954
9

Copiar esta operação para as demais caselas. Não esquecer de colocar


um rótulo para essa coluna.
10

Todos os cálculos são apresentados com todas as casas decimais que


couber em uma casela, porém o ideal é formatar as porcentagens em apenas
uma casa decimal. Para tal, marcar as caselas com as porcentagens e clicar o
botão de formatação que diminui as casas decimais, uma a uma.

A tabela poderá ser transportada ou digitada em um arquivo do editor de


texto (word) seguindo um padrão, por exemplo:
11

Tabela 1 - Número e porcentagem de mães de acordo com a faixa etária.

Faixa etária Número de mães % de mães

12 a 20 973 24,6
21 a 30 1984 50,2
31 a 40 942 23,8
41 a 50 55 1,4

Total 3954 100,0

Para construir novas tabelas, por exemplo, Estado civil (ESTCIV), o


processo deverá ser repetido, porém algumas etapas serão acrescentadas a
partir da seleção dos dados para construção de uma nova tabela, e são as
seguintes:

¾ clique no botão Sim para indicar que os dados selecionados anteriormente


são os mesmos.

¾ clique no botão Avançar


12

¾ continue com o processo descrito para a tabela anterior.


¾ Se você quiser colocar a nova tabela na mesma planilha que está a tabela
anterior, selecione a opção Planilha existente e indique o local, para isso
basta clicar com o mouse no botão da planilha correspondente e clicar em
uma casela que não sobreponha a tabela anterior.

3.1. Editando tabela dinâmica

Quando for necessárias alterações, inserções ou inclusões podem ser feitas na


tabela, para isso
¾ posicione o apontador sobre o indicador da linha XX e clique o botão direito do
mouse
¾ clique sobre o comando inserir no menu rápido para inserir uma linha em
branco e digite os dados a serem inseridos
13

¾ no campo total não é necessário digitar novamente a fórmula, bastando copiar


o conteúdo de uma casela para outra
¾ na planilha tabela dinâmica clique sobre o botão atualizar dados ou abra o
menu dados e clique sobre o comando atualizar dados
¾ os dados inseridos na tabela encontram-se no formato geral diferentes das
outras planilhas, para formatá-los observe estes exemplos:
• posicione o seletor em qualquer casela onde encontram-se as médias
• clique sobre o botão campo da tabela dinâmica
• nesta caixa clique sobre o botão número
• selecione o formato a ser aplicado nesta caixa de diálogo
• clique sobre o botão OK
• clique novamente sobre o botão OK da caixa do campo da tabela dinâmica

A tabela dinâmica pode ser utilizada para calcular outras estatísticas além
da freqüência de ocorrência dos valores, e são as seguintes:

Função Estatísticas
Soma Soma das observações
Cont. Valores Número de observações
Média Média das observações
Máximo Valor máximo das observações
Mínimo Valor mínimo das observações
Mult Produto das observações
Cont. Núm Número de observações
DesvPad Desvio padrão da amostra
DesvPadp Desvio padrão da população
Var Variância da amostra
Varp Variância da população
14

Gráficos
Para aplicação de gráficos e sua manipulação a partir de uma tabela
¾ posicione o seletor na casela Contagem de DN para marcar a tabela (A2 até
C7). Se desejar contruir o gráfico com a freqüência percentual, posicione o
cursor na casela n% e arraste o mouse até marcar toda tabela.
¾ clique sobre o botão assistente de gráfico
¾ selecione o tipo e o subtipo do gráfico a ser criado, clicando em respectivos
painéis

¾ clique sobre o botão avançar


15

¾ as caselas marcadas (Plan1!$A$2:$C$7) aparecerão na caixa de diálogo


Æ se não quiser que o Total Global apareça digite Plan1!$A$1:$C$6
Æ selecione o modo de visualização: linhas ou colunas, dependendo da
forma que os dados estiverem dispostos.
Æ se quiser apenas um tipo de freqüência abra a caixa de Seqüência remova
aquela que não deseja, por exemplo, se for construir o gráfico com a
freqüência percentual, excluir a seqüência Total.
¾ clique sobre o botão avançar
16

¾ nesta caixa podem ser configurados os seguintes parâmetros


Î Títulos
• informe o título geral do gráfico
• informe o título para o eixo X em eixo das categorias para ser atribuído
ao sentido horizontal do gráfico
• o eixo Y não apresenta-se disponível por não condizer ao tipo de gráfico
e dados selecionados
• em eixo dos valores de Z digite se necessário uma denominação para
referência a este tipo de eixo presentes em gráficos de três dimensões
Î Eixos
• para exibição normal do eixo X no gráfico mantenha essa opção
marcada
• a opção automático permite ao aplicativo selecionar o tipo de dado a
servir como título do eixo X automaticamente
• A opção CATEGORIA exibe o título do eixo X por categoria
• para exibir o título do eixo X como uma data marque a opção escala de
tempo
• Quando a opção eixo dos valores Z estiver marcada os dados do eixo
serão exibidos.
17

Î Linhas de Grade
• se desejar insira as linhas adicionais para estruturação do gráfico
marcando as opções correspondentes
Î Legenda
• selecione o posicionamento da legenda na planilha, se desejar ocultá-la
desmarque a opção mostrar legenda
Î Rótulo de dados
• selecione o modo de exibição dos rótulos no gráfico
Î Tabela de dados
• para que seja exibida uma tabela abaixo do gráfico marque esta opção
¾ clique sobre o botão avançar

¾ selecione se desejar a opção como nova planilha para salvar o gráfico, digite
sua denominação na caixa correspondente ou salve-o na condição de um
objeto contido em determinada planilha, especifique o nome da planilha no
campo correspondente
¾ Concluir o assistente gráfico.
18

1984
2000

1800

1600

1400

1200
973 942
1000

800

600

400

200 55

0
12 A 20 21 A 30 31 A 40 41 A 50
Faixa etária

Figura 1 - Distribuição das mães de acordo com a faixa etária.


19

ESTATÍSTICAS DESCRITIVAS

A análise descritiva de dados, além da construção de tabelas e gráficos,


consiste também no cálculo de medidas que ajudam na produção de uma visão
global dos dados. Tais medidas recebem o nome genérico de estatísticas.

1. Média aritmética
A média aritmética ou simplesmente média é a soma de todas observações
dividida pelo número de observações, e é calculada através da seguinte fórmula:
n

X + X 2 + ... + Xn ∑X i
X= 1 = i =1
n n
A média pode ser interpretada como o “centro de gravidade”, isto é, o ponto
de equilíbrio das discrepâncias positivas e negativas.
Vantagens:
ƒ Fácil de compreender e usar;
ƒ Usa todos os dados disponíveis;
ƒ Fácil de incluir em equações matemáticas.
Desvantagens:
ƒ É afetada pelos valores extremos;
ƒ É necessário conhecer todos os valores da distribuição.

Com os dados da planilha podemos registrar a média das mensurações na


última linha. Posicionamos o cursor na célula onde deverá ser calculada a
estatística, podendo ser em uma outra planilha (PLAN2) e clicamos no botão de
funções fx e selecionar Estatística para a categoria da função e a seguir
selecionar a Média para o nome da função.

OBS: Para incluir uma nova planilha basta acionar no menu principal a opção
Inserir e selecionar o item Planilha, esta nova planilha automaticamente
receberá o nome Plan1, que para alterar basta clicar 2 vezes sobre esse nome, e
digitar o novo nome, por exemplo, Estatísticas.
20

Se as estatísticas forem calculadas nessa nova planilha, convém indicar os


nomes das estatísticas, por exemplo a média:

Desta forma, retornando ao cálculo da média, devemos posicionar o cursor


na célula correspondente (B2) e clicar o botão de funções fx e selecionar a
Categoria da função: Estatística, e a seguir Nome da função: Média.
21

Na próxima janela digitar a referência das células que contém os dados.

Com essa tela ativa, retornar à planilha DADOS (clique apenas uma vez
sobre o nome da planilha):
22

Digite ou selecione as células onde se encontram os pesos, ou seja, da


casela R2 até R3955, R2:R3955, e clicar o botão OK.
23

O resultado dessa operação será:

Observe que o resultado é um valor sem decimais, para aparecer os


dígitos decimais, caso exista, basta deixar o cursor na casela do número, e clicar
o ícone do aumento de casas decimais.

Outra forma para efetuar o cálculo da média é digitar na casela adequada a


expressão
=MÉDIA(DADOS!R2:R3955)
24

2. Mediana
A medida de tendência central mediana, denominada como Md, é o valor
da série ordenada que está localizado numa posição eqüidistante dos extremos
dos elementos da série.
Numa série de n observações ordenadas de forma crescente, a Mediana é
o valor da observação que divide essa série de n observações, em duas metades
iguais, uma delas com valores inferiores ao valor da mediana e a outra com
valores superiores.
¾ Se a série de dados tiver um número ímpar de observações, então o valor da
mediana é o próprio elemento que está no meio da série, isto é, o elemento
n +1
com ordem igual a
2
¾ Se a série de dados tiver um número par de observações não existirá um valor
no centro da série, portanto, para calcular o valor da mediana deveremos
n
dividir por dois a soma soma dos valores das observações com ordens e
2
n
+1
2

Vantagens:
ƒ Fácil de determinar;
ƒ Não é afetada pelos valores extremos;
ƒ Parece ser uma medida correta, pois divide a série em duas partes iguais a
50%.
Desvantagens:
ƒ Difícil de incluir em equações matemáticas;
ƒ Não usa todos os dados disponíveis.

Para o cálculo da mediana podemos utilizar o botão função ou então digitar


a expressão:
=MED(DADOS!R2:R3955)
25

3. Desvio padrão
O desvio padrão é uma medida da variabilidade dos dados em torno da
média. Quanto mais os dados se distanciam da média, maior será a variabilidade
mensurada pelo desvio padrão.
O desvio padrão é calculado pela fórmula a seguir:

∑ (X )
n
2
I −X
S= I =1

n −1

Para realizar o cálculo do desvio padrão na planilha utilizar o botão função

ou então basta digitar a função:


=DESVPAD(DADOS!R2:R3955)

4. Valor Mínimo e Máximo


Outra forma mais simples de mostrar a variação é através do valor
mínimo e máximo, ou seja, menor e maior valor. Esses valores também podem
ser determinados através do botão função:
26

idem para o valor máximo, ou então apenas digitando:


=MÍNIMO(DADOS!R2:R3955)
=MÁXIMO(DADOS!R2:R3955)

5. Quartis
Os quartis são medidas que dividem a distribuição em quatro partes, sendo
que em cada uma das partes temos pelo menos 25% das observações.
27

Para o terceiro quartil basta digitar o número do quartil (3) na linha do


Quarto.

6. Percentis

Para o cálculo dos percentis os procedimentos são os mesmos, porém


para calcular um determinado percentil, o valor de k será um valor entre 0 (zero) e
1 (um), por exemplo, para calcular o percentil 5, devemos digitar o valor 0,05 na
entrado do valor de n k, para o percentil 95 o valor de k é igual a 0,95, assim por
diante:

ou então, digitar a expressão:

=PERCENTIL(DADOS!R2:R3995;0,05) Îpercentil 5
=PERCENTIL(DADOS!R2:R3995;0,95) Îpercentil 95

7. Outra forma de cálculo

Outra maneira simples para calcular algumas dessas estatísticas é utilizar


a ferramenta: Análise de dados. A instalação padrão do programa Excel não
28

disponibiliza automaticamente essa ferramenta, para tal, executar as seguintes


etapas:

a) Acionar o menu Ferramentas e selecionar Suplementos


b) Nos suplementos disponíveis, selecionar o item Ferramentas de análise

Pronto! Essa ferramenta já está instalada.

Para obter as estatísticas usando a ferramenta Análise de dados, basta


entrar no menu Ferramentas e selecionar Análise de dados.

Na janela a seguir, selecionar a ferramenta de análise: Estatística


descritiva.
29

Para calcular as estatísticas descritivas para a variável peso, devemos na


tela a seguir preencher os seguintes campos:

Intervalo de entrada: $R$1:R$3955, ou então marcar as células corresponden-


tes, da célula R1 até R3955.

Agrupado por: assinalar a coluna, cada variável se encontra em uma


coluna.Rótulos na primeira linha: assinalar este campo se você selecionou da
célula R1 até R3955 pois a casela R1 contém o rótulo (nome) da variável na
coluna R; se você selecionou da célula R2 até R3955 este campo não deve ser
selecionado.
30

Intervalo de saída: Estísticas!$D$1, se você quiser que as estatísticas sejam


colocadas na planilha das Estatísticas a partir da casela D1.

Resumo estatístico: assinalar este campo para que as estatísticas sejam


calculadas.

Você também pode gostar