Escolar Documentos
Profissional Documentos
Cultura Documentos
Análises Estatísticas”
HEP58000
Curso de Bioestatística
Regina Bernal
Março de 2012
Índice
2
Regina Bernal e Nilza Nunes da Silva
VIII.3.3. Teste de hipóteses para as médias de duas populações
independentes e com variâncias iguais ...........................................41
VIII.3.4. Teste de hipóteses para as médias de duas população
independentes e com variâncias diferentes .....................................43
VIII.3.5. Teste de hipóteses para as médias com duas populações
pareadas (dependentes) ...............................................................45
VIII.4. Outras funções estatísticas .....................................................47
IX. Regressão Linear Simples ............................................... 48
3
Regina Bernal e Nilza Nunes da Silva
I. Sobre o Excel
Bancos de dados: A planilha eletrônica pode ser usada para armazenar dados. O
Excel dispõe funções de banco de dados que permite: consultar, buscar, ordenar,
filtrar, calcular estatísticas e administrar facilmente uma grande quantidade de
dados utilizando operações de bancos de dados padronizadas. A figura abaixo
ilustra o exemplo de dados provenientes da Pesquisa de Medicamentos do
município de São Paulo em 2005.
4
Regina Bernal e Nilza Nunes da Silva
Gráficos: A função de gráficos permite a representação gráfica dos dados
disponível na planilha. A figura abaixo ilustra o exemplo de ocorrências de
internações em cada dia da semana em 2007.
35
30
25
20
%
15
10
0
segunda terça quarta quinta sexta sábado domingo
Dia da Semana
5
Regina Bernal e Nilza Nunes da Silva
II.2. Tipos de dados
O usuário poderá inserir dois tipos de dados:
a) Valor constante: digita-se diretamente na célula um número, incluindo data e
hora, ou um texto. Procedimentos para entrada de dados:
1) Selecione a célula para a qual deseja entrar com o dado
2) Digite o dado
3) Teclar Enter
b) Fórmula: Pode ser uma função ou uma operação que produzirá novo valor a
partir de valores existentes. A fórmula inicia com sinal de igual (=) seguida da
operação ou função desejada.
No exemplo 1, para encontrar a soma de pacientes internados digite na célula B9
a fórmula =SOMA(B1:B8) ou clicar sobre o ícone e pressionar a tecla Enter.
Você encontrará o número total de pacientes. Digite na coluna A9 o texto Total.
Resultado:
6
Regina Bernal e Nilza Nunes da Silva
Resultado:
a) Referência Relativa
7
Regina Bernal e Nilza Nunes da Silva
2) e na célula E4 use o comando CTRL-V
b) Referência Absoluta
Uma referência absoluta indica como encontrar uma célula baseada na localização exata.
A célula é expressa é pelo caracter dólar ($) e representa:
1) $coluna$ fixa a coluna e linha
2) $coluna fixa a coluna
3) coluna$ fixa a linha
coluna=A, B, C ...
No exemplo anterior, para calcular a porcentagem de parturientes Normal com pré-natal
digite na célula F3 = C3/$D3*100. Na célula F3 CTRL-C na célula G3 CRTL-V. O
usuário copiou a fórmula na célula F3 para G3.
8
Regina Bernal e Nilza Nunes da Silva
II.3. Editando a planilha
II.3.1. Mover
O conteúdo de uma célula pode ser removida para uma nova célula mantendo o formato
e a fórmula caso exista. A linha e coluna também podem ser removidas.
Procedimento para mover uma célula:
1) Selecione a célula
Botão da direita do mouse selecione a opção Recortar(*) e tecle Enter
2) Selecione a nova célula e com o botão direito do mouse selecione a opção Colar
e tecle Enter
(*) Usar o ícone para recortar a área selecionada para a área de transferência
II.3.2. Copiar
O conteúdo de uma célula pode ser copiada para uma nova célula mantendo o formato e
a fórmula caso exista. A linha e coluna também podem ser copiadas.
Procedimento para copia uma célula:
1) Selecione a célula
2) Botão da direita do mouse selecione a opção Copiar(*) e tecle Enter
3) Selecione a nova célula e com o botão direito do mouse selecione a opção
Colar(*) e tecle Enter
9
Regina Bernal e Nilza Nunes da Silva
3) Selecione a nova linha e com o botão direito do mouse selecione a opção
Colar(*) e tecle Enter
(*) Use o ícone para Copiar a área selecionada para a Área de Transferência e o
ícone para Colar a seleção da Área de Transferência para a área indicada.
II.3.3. Inserir
O usuário poderá inserir célula(s), linha(s) ou coluna(s) em branco em qualquer lugar da
planilha. Ao inserir a célula, linha ou coluna o Excel deslocará as informações para a
inserção de novos valores.
Procedimento para inserir uma célula ou mais:
1) Selecione a(s) célula(s)
2) Botão da direita do mouse selecione a opção Inserir . Escolha uma das opções e
OK.
10
Regina Bernal e Nilza Nunes da Silva
2) Botão da direita do mouse selecione a opção Inserir(*)
II.3.4. Excluir
O usuário poderá excluir célula(s), linha(s) ou coluna(s).
Procedimento para excluir uma célula ou mais:
1) Selecione a(s) célula(s)
2) Botão da direita do mouse selecione a opção Excluir . Escolha uma das opções e
OK.
11
Regina Bernal e Nilza Nunes da Silva
II.5. Imprimindo arquivo
Selecione as células ou a planilha que serão impressas. Use o ícone para imprimir.
Novo - cria uma nova pasta de trabalho, com base no modelo padrão.
12
Regina Bernal e Nilza Nunes da Silva
III. Formatando os dados de uma planilha
A formatação dos dados é importante para facilitar a leitura, interpretação e impressão
dos dados.
Procedimentos:
13
Regina Bernal e Nilza Nunes da Silva
IV. Formatando tabelas
No exemplo 1, o usuário poderá inserir duas colunas para o cálculo da porcentagem. A
coluna C é a distribuição da variável tipo de parto das mulheres que fizeram o pré-natal.
Enquanto que, a coluna E é a distribuição da variável tipo de parta daquelas que não
fizeram o pré-natal. A coluna G é a distribuição da variável tipo de parto.
Resultado:
Selecionar a linha 3 e inserir uma linha recorte e cole a célula A2 para célula A3 nas
células B3, D3 e F3 escreva FA (freqüência absoluta) e nas células C3, E3 e G3 escreva
FR (frequência relativa).
Resultado:
14
Regina Bernal e Nilza Nunes da Silva
Selecione as células A1, A2 e A3 e clique no ícone para mesclar as células. Faça o
mesmo para as células B1 a E1 e F1 e G1.
Resultado:
Selecione células A1, A2, A3, C1, C2, C3, ... , G1, G2 e G3 com o botão da direita
selecione a opção de formatar células e Borda:
15
Regina Bernal e Nilza Nunes da Silva
Escolha uma
opção
Marque no texto
Pré-natal
Total
Tipo de Sim Não
parto
FA FR(%) FA FR(%) FA FR(%)
Normal 120 75,0 20 50,0 140 70,0
Cesariano 40 25,0 20 50,0 60 30,0
Total 160 100,0 40 100,0 200 100,0
16
Regina Bernal e Nilza Nunes da Silva
Ícones de formatação:
17
Regina Bernal e Nilza Nunes da Silva
V. Fazendo Gráficos
Apesar da apresentação dos dados através de tabelas ser mais precisa, a representação
gráfica tem a vantagem de transmitir os dados de uma maneira mais rápida e viva,
oferecendo uma visão imediata sobre o comportamento do fenômeno que estamos
descrevendo.
Elaborar gráficos é uma arte que somente pode ser adquirida através de prática, com os
cuidados necessários para evitar posições tendenciosas, permitindo a visão clara dos
pontos essenciais a serem notados.
simplicidade
clareza
veracidade
18
Regina Bernal e Nilza Nunes da Silva
Layout de gráfico
19
Regina Bernal e Nilza Nunes da Silva
V.1. Diagrama de barras (uma variável qualitativa ou quantitativa
discreta)
Lista de procedimentos para apresentar os dados da tabela em um gráfico apropriado:
1) Selecione as porcentagens
2) Selecione a opção de tipo de gráfico
(1)
Matricula no
Posto de n %
Saúde
2 0
Não 767 26 (2)
Sim 2152 74
Total 2921 100
Resultado:
20
Regina Bernal e Nilza Nunes da Silva
3) Selecione o gráfico e escolha a opção Layout de gráfico. Escolha um layout com
nomes dos eixos vertical e horizontal.
(3)
Resultado:
80
70
60
Título do Eixo
50
40
30 Série1
20
10
0
1 2
Título do Eixo
21
Regina Bernal e Nilza Nunes da Silva
(5) (4)
Passos:
1) Selecione as duas séries e escolha o gráfico de linha para representar as séries
temporais
22
Regina Bernal e Nilza Nunes da Silva
2) Insira os nomes dos valores possíveis do eixo X e os nomes das variáveis na
legenda. Escolha o layout do gráfico com nomes dos eixos.
Resultado:
30
25
Coeficiente de mortalidade
20
15
Total
10 Junho
0
1968 1969 1970 1971 1972 1973 1974
Ano
23
Regina Bernal e Nilza Nunes da Silva
3) Para alterar a escala aritmética para logarítmica, selecione o eixo Y e com o
botão direito do mouse selecione a opção formatar eixo.
24
Regina Bernal e Nilza Nunes da Silva
Resultado:
10
Total
Junho
1
1968 1969 1970 1971 1972 1973 1974
0,1
Ano
25
Coeficiente de mortalidade
Coeficiente de mortalidade
20
10
15
Total Total
10 Junho Junho
1
5 1968 1969 1970 1971 1972 1973 1974
0
1968 1969 1970 1971 1972 1973 1974
0,1
Ano Ano
Conclusão?
25
Regina Bernal e Nilza Nunes da Silva
V.3. Histograma - intervalos com mesma amplitude
Considerar os dados apresentados na tabela.
Distribuição de recém-nascidos acometidos de síndrome de desconforto idiopático grave
segundo peso ao nascer (g)
Peso(g)
No %
1000 |-- 1500 13 26
1500 |-- 2000 15 30
2000 |-- 2500 9 18
2500 |-- 3000 9 18
3000 |-- 3500 3 6
3500 |-- 4000 1 2
Total 50 100
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.
(3)
(2)
(1)
26
Regina Bernal e Nilza Nunes da Silva
5) Histograma da variável peso ao nascer (kg)
35
30
25
20
%
15
10
0
1000 |-- 1500 1500 |-- 2000 2000 |-- 2500 2500 |-- 3000 3000 |-- 3500 3500 |-- 4000
Peso ano nascer(kg)
27
Regina Bernal e Nilza Nunes da Silva
V.4. Diagrama de barras com duas variáveis
Considere os dados apresentados na tabela a seguir
(2)
(1)
(3)
28
Regina Bernal e Nilza Nunes da Silva
VI. Tabela Dinâmica
Dado um conjunto de observações, a tabela dinâmica permite o cruzamento entre as
variáveis para obter medidas de resumo, como exemplo: total, média desvio padrão e
outras. O resultado é apresentado em forma de tabela e gráfico.
Procedimento para análise:
1) Abrir o arquivo
2) Menu -> inserir -> tabela dinâmica -> selecionar o conjunto de dados -> OK
29
Regina Bernal e Nilza Nunes da Silva
3) Construir uma tabela univariada: Selecione uma variável categórica e solte na
coluna -> selecione uma variável categórica e solte na linha -> seleciona a
variável (∑ valores)
(1)
(3)
(4)
(2)
30
Regina Bernal e Nilza Nunes da Silva
5) Para acrescentar a porcentagem na tabela, faça:
(1) Selecione a variável b2b e arraste no campo (∑ valores). A coluna b2b será
duplicada
(2) No campo (∑ valores) selecione Contagem b2b2 e seguida a opção
Configurações no Campo de Valor
(3) Selecione a opção Contagem
(4) Selecione a opção Mostrar valores como
(5) Selecione a opção % do Total de Coluna
(1)
(2)
(4)
(3) (5)
Resultado:
31
Regina Bernal e Nilza Nunes da Silva
(2) Selecione uma célula vazia e com o botão direito do mouse selecione a opção
Colar Especial
(3) Escolha a opção Valores
(2)
(3)
Resultado:
Editar tabela:
b2b n fi
2 0,00
Não 767 0,26
Sim 2152 0,74
Total 2921 1,00
32
Regina Bernal e Nilza Nunes da Silva
Resultado:
b2b n fi
2 0,07
Não 767 26,26
Sim 2152 73,67
Total 2921 100,00
6) Construir uma tabela bivariada: Selecione uma variável linha (1) e uma variável
coluna (2)
(2)
(1)
Resultado:
b3e Dados
1 2 9 Total Contagem de b2b Total Contagem de b3e
b2b Contagem de b2b Contagem de b3e Contagem de b2b Contagem de b3e Contagem de b2b Contagem de b3e Contagem de b2b Contagem de b3e
1 0,60% 1 0,14% 0,00% 0,00% 2 0,07%
1 41 24,40% 222 30,20% 493 25,18% 11 18,33% 767 26,26%
2 126 75,00% 512 69,66% 1465 74,82% 49 81,67% 2152 73,67%
Total Geral 168 100,00% 735 100,00% 1958 100,00% 60 100,00% 2921 100,00%
33
Regina Bernal e Nilza Nunes da Silva
VII. Gráfico dinâmico
Para construir o gráfico usando a opção de gráfico dinâmico, faça:
(1)
(3) (4)
(5)
(2)
(6)
35
Regina Bernal e Nilza Nunes da Silva
A opção de Análise de dados estará disponível no menu Ferramenta:
36
Regina Bernal e Nilza Nunes da Silva
VIII.3. Procedimentos para as análises
Selecionar os
campos numéricos
para a análise
Essa
informação é
importante para
identificar na
saída as
variáveis
analisadas
Selecionar a
opção para
estatística
descritiva
Precisão da
média ->
37
Regina Bernal e Nilza Nunes da Silva
4) Resultados
Devido ao erro na tradução a estatística MODA ficou sendo MODO.
Saída original:
38
Regina Bernal e Nilza Nunes da Silva
VIII.3.2. Teste de hipóteses para as variâncias de
duas populações
O teste de hipóteses é unicaudal à direita ou à esquerda.
Publicidade 1 (P1): 41 43 44 48 39 45
Publicidade 2 (P2): 32 53 55 58 40 60 43
Amostra 1
Amostra 2
Resultados:
P1 P2
Média 43,33333 48,71429
Variância 9,866667 109,9048
Observações 6 7
gl 5 6
F 0,089775 Fcalculado
P(F<=f) uni-caudal 0,009092
F crítico uni-caudal 0,202008
Nível descritivo
39
Regina Bernal e Nilza Nunes da Silva
Interpretação dos resultados:
Estatística
P(F<=f)= d
Nível descritivo d rejeição de H0
d não rejeição de H0
2 2
H1 : 1 2
40
Regina Bernal e Nilza Nunes da Silva
VIII.3.3. Teste de hipóteses para as médias de duas
populações independentes e com variâncias
iguais
Exemplo 2: Voltando ao exemplo 1 e supondo que H0 não foi rejeitada, será realizada o
teste de hipóteses para as médias de duas populações independentes e com variâncias
iguais:
Procedimento:
Amostra 1
Amostra 2
Nível de
significância
Resultados:
Teste-t: duas amostras presumindo variâncias equivalentes
P1 P2
Média 43,33333 48,71429
Variância 9,866667 109,9048
Observações 6 7
Variância agrupada 64,4329
Hipótese da diferença de média 0
gl 11
Stat t -1,20492 tcalculado
P(T<=t) uni-caudal 0,126759
t crítico uni-caudal 1,795885 Nível descritivo
P(T<=t) bi-caudal 0,253517
Valor de t encontrado na tabela
t crítico bi-caudal 2,200985
t-Student
41
Regina Bernal e Nilza Nunes da Silva
Interpretação dos resultados:
Estatística
- Formulação das H0 : 1 2
hipóteses
H1 : 1 2
P(T<=t)= d
Nível descritivo d rejeito H0
d não rejeito H0
Conclusão do exemplo 2:
Teste de hipóteses: unicaudal à esquerda
H0 : 1 2
H1 : 1 2
Stat t > t crítico (-1,20 > -1,79), não rejeitamos H0 ao nível de 5% de significância.
Portanto, as vendas médias das duas publicidades são iguais, ou seja, não houve impacto
das publicidades.
Nota-se que, o nível descritivo é igual a 0,126, ou seja, para qualquer valor de menor
que 0,12 a hipótese H0 não será rejeitada.
42
Regina Bernal e Nilza Nunes da Silva
VIII.3.4. Teste de hipóteses para as médias de duas
população independentes e com variâncias
diferentes
Exemplo 3: Voltando ao exemplo 1 e supondo que H0 foi rejeitada, será realizada o teste
de hipóteses para as médias de duas populações independentes e com variâncias
diferentes:
Procedimento:
Amostra 1
Amostra 2
Nível de
significância
Resultados:
P1 P2
Média 43,33333 48,71429
Variância 9,866667 109,9048
Observações 6 7
Hipótese da diferença de média 0
gl 7
Stat t -1,292024 tcalculado
P(T<=t) uni-caudal 0,118683
t crítico uni-caudal 1,894579 Nível descritivo
P(T<=t) bi-caudal 0,237366
t crítico bi-caudal 2,364624 Valor de t encontrado na tabela
t-Student
Obs: Se o teste for unicaudal a esquerda precisa acrescentar
o sinal negativo no valor de t crítico (distribuição t-Student é
simétrica)
43
Regina Bernal e Nilza Nunes da Silva
Interpretação dos resultados:
Estatística
- Formulação das H0 : 1 2
hipóteses
H1 : 1 2
P(T<=t)= d
Nível descritivo d rejeição de H0
d não rejeição de H0
Conclusão do exemplo 3:
H0 : 1 2
H1 : 1 2
Stat t > t crítico (-1,29 > -1,89), não rejeitamos H0 ao nível de 5% de significância.
Portanto, as vendas médias das duas publicidades são iguais, ou seja, não houve impacto
das publicidades.
Nota-se que, o nível descritivo é igual a 0,119, ou seja, para qualquer valor de menor
que 0,119 a hipótese H0 não será rejeitada.
44
Regina Bernal e Nilza Nunes da Silva
VIII.3.5. Teste de hipóteses para as médias com
duas populações pareadas (dependentes)
O teste t para observações pareadas é usado para estudar o efeito de um
experimento em que se observam os mesmos indivíduos duas vezes, isto é, uma vez
antes, outra vez depois de administrar o experimento. Para realizar o teste no Excel
informe na variável 1 os dados da amostra 2 (efeito depois do tratamento) e na variável
2 os dados da amostra 1 (antes do tratamento), pois o objetivo é verificar o efeito após o
experimento ou tratamento.
Exemplo 4: Dez pessoas selecionadas aleatoriamente foram usadas num teste para medir
as suas capacidades em termos de ar inspirado, antes e depois de um tratamento. Se
x for a capacidade da população antes do tratamento e y for a capacidade da
população depois do tratamento. Mediu-se a capacidade de ar inspirado antes e depois
do tratamento e os resultados estão no quadro abaixo.
Volume de ar inspirado
Indivíduo
Antes Depois
A 2750 2850
B 2360 2380
C 2950 2930
D 2830 2860
E 2250 2320
F 2100 2150
G 2560 2610
H 2305 2300
I 2430 2435
J 2550 2650
Procedimento:
Amostra 2 (depois)
Amostra 1 (antes)
Nível de
significância
45
Regina Bernal e Nilza Nunes da Silva
Resultados:
Depois Antes
Média 2548,5 2508,5
Variância 73511,39 73811,39
Observações 10 10
Correlação de Pearson 0,988199
Hipótese da diferença de média 0
gl 9
Stat t 3,033361 tcalculado
P(T<=t) uni-caudal 0,007085
t crítico uni-caudal 1,833113 Nível descritivo
P(T<=t) bi-caudal 0,014169
t crítico bi-caudal 2,262157 Valor de t encontrado na tabela
t-Student
Obs: Se o teste for unicaudal a esquerda precisa acrescentar
o sinal negativo no valor de t crítico (distribuição t-Student é
simétrica)
onde: Di = xi – yi ; D = média de Di
Stat t > 0 Formulação das H0 : D 0
hipóteses
H1 : D 0
onde: Di = xi – yi ; D = média de Di
- Formulação das H0 : D 0
hipóteses
H1 : D 0
onde: Di = xi – yi ; D = média de Di
P(T<=t)= d
Nível descritivo d rejeito H0
d não rejeito H0
46
Regina Bernal e Nilza Nunes da Silva
Conclusão do exemplo 4:
Teste de hipóteses: unicaudal à direita
H0 : D 0
H1 : D 0
Stat t > t crítico (3,03 > 1,83), rejeitamos H0 ao nível de 5% de significância. Portanto,
há diferença entre as médias do volume de ar inspirado após e antes do tratamento. Ou
seja, após o tratamento os pacientes apresentaram um volume de ar inspirado acima do
observado anteriormente.
Nota-se que, o nível descritivo é próximo de zero ( d 0 ). Portanto, para qualquer
valor de a H0 será rejeitada.
47
Regina Bernal e Nilza Nunes da Silva
IX. Regressão Linear Simples
Exemplo: A analista de mercado tem interesse em estabelecer uma
relação entre o valor de venda e a avaliação do imóvel. Para o estudo foi
selecionada uma amostra de cinco propriedades.
Procedimento de análise:
1) Arquivo de dados
48
Regina Bernal e Nilza Nunes da Silva
3) Entrar com as informações de X (variável independente) e Y (variável
dependente) e selecionar os campos marcados
Variável dependente
Variável independente
(1)
(3)
(2)
Obs:
49
Regina Bernal e Nilza Nunes da Silva
4) Resultados:
Estatística de regressão
(5)
R múltiplo 0,989762411 1
R-Quadrado 0,97962963
R-quadrado ajustado 0,972839506 Adequação do modelo ajustado 0
Erro padrão 0,605530071 0
-1
Observações 5
ANOVA
gl SQ MQ F F de significação
(4)
Regressão 1 52,9 52,9 144,2727 0,001241545
Resíduo 3 1,1 0,366667
Total 4 54
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 95,0%Superior 95,0%
Interseção (6) -2,2 0,81240384 -2,708013 0,073287 -4,785434026 0,385434026 -4,785434026 0,385434
Valor avaliado (7) 2,3 0,191485422 12,01136 0,001242 1,690607356 2,909392644 1,690607356 2,909393
Obs:
(1) Teste de hipóteses dos parâmetros B0 e B1
(2) Nível descritivo do teste de hipóteses (1)
(3) Intervalo de confiança da estimativa do parâmetro
(4) Teste de hipóteses da adequação do modelo ajustado
(5) Correlação de Pearson
(6) Parâmetro B0 (intercepto)
(7) Parâmetro B1 (inclinação da reta)
50
Regina Bernal e Nilza Nunes da Silva