Você está na página 1de 54

CampusCampusCampusCampus dededede ErechimErechimErechimErechim

em Análises Clínicas e

PósPós-PósPós--Graduação-

Simone Maffini Cerezer

Simone Maffini Cerezer

Simone Maffini Cerezer

do Alto Uruguai e das Missões

UniversidadeUniversidadeUniversidadeUniversidade RegionalRegionalRegionalRegional IntegradaIntegradaIntegradaIntegrada do Alto Uruguai e das Missões

do Alto Uruguai e das Missões

do Alto Uruguai e das Missões

Toxicológicas

GraduaçãoGraduação emem AnálisesAnálises ClínicasClínicas ee ToxicológicasToxicológicas

Graduação em Análises Clínicas e Toxicológicas

AAAAAAAAppppppppoooooooossssssssttttttttiiiiiiiillllllllaaaaaaaa ddddddddeeeeeeee RRRRRRRReeeeeeeevvvvvvvviiiiiiiissssssssããããããããoooooooo DDDDDDDDeeeeeeee EEEEEEEEssssssssttttttttaaaaaaaattttttttííííííííssssssssttttttttiiiiiiiiccccccccaaaaaaaa BBBBBBBBáááááááássssssssiiiiiiiiccccccccaaaaaaaa

Disciplina:Disciplina:Disciplina:Disciplina: BioestatísticaBioestatísticaBioestatísticaBioestatística NãoNão-NãoNão--Paramétrica-ParamétricaParamétricaParamétrica

Revisão de Estatística Básica

Revisão de Estatística Básica

Revisão de Estatística Básica

ClaodomirClaodomirClaodomirClaodomir AntAntonioAntAnt onioonioonio MartinazzoMartinazzoMartinazzoMartinazzo –––– Revisão de Estatística Básica

Simone Maffini Cerezer –––– EstatísticaEstatísticaEstatísticaEstatística NãoNão-NãoNão--P-PParamParamaramétricaaramétricaétricaétrica

Revisão de bioestatística básica.

2

BIOESTATÍSTICA

1.0 Noções Elementares

O objetivo da Estatística (Bioestatística) é estudar conjuntos de dados para tirar parâmetros, que possibilitarão decisões. Parâmetro é um elemento numérico usado para caracterizar todo o conjunto. Assim, por exemplo:

Um aluno presta várias provas de uma determinada disciplina, conseguindo, ao término do ano, um conjunto de notas; tais notas formam os elementos do conjunto. Serão substituídos por um único elemento, por um parâmetro que, no caso, é a média aritmética, e que possibilitará anunciar a todos os interessados se

o aluno obteve ou não habilitação nessa disciplina. Ao conjunto de pessoas, de escolas, de notas, de leitos de um hospital etc., que constitui o todo para permitir o cálculo do parâmetro, é dado o título de universo. O universo é, assim, o conjunto constituído por todos os elementos; tais elementos são reunidos em subconjuntos denominados populações. Assim:

- o conjunto de escolas de 1º e 2 º graus do Rio Grande do Sul é um universo que contém populações de escolas urbanas, de escolas com uma só sala de aula, de escolas agrícolas etc.

População é, pois, um total de objetos ou de pessoas que apresentam as mesmas características dentro de um mesmo universo.

Normalmente não é possível inferir conclusões pesquisando uma população inteira, como por

exemplo, todos os eleitores de um país. É necessário definir certa parcela da população para fazer a pesquisa

e a partir dessa parcela que chamaremos de amostra poderemos tirar uma conclusão para tendência de todo o eleitorado. Estatística é ciência, quando estuda populações; é método, quando serve de instrumento a uma outra ciência. É também arte, ciência-método e método-ciência, segundo vários tratadistas. Estatística é a ciência que tem por objetivo orientar a coleta, o resumo, a apresentação, a análise e a interpretação de dados.

A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto

a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial.

Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da organização e descrição dos dados (Estatística do Ministério da Educação, estatística dos acidentes de trafego etc.), desconhecendo que o aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados obtidos inicialmente.

Esta disciplina, Bioestatística Não-paramétrica, é justamente voltada à inferência estatística.

IMPORTANTE

O papel da Estatística na pesquisa científica é contribuir com o investigador na formulação das hipóteses estatísticas e fixação das regras de decisão, no fornecimento de técnicas para um eficiente delineamento de pesquisa, na colheita, tabulação e análise dos dados (estatística descritiva) e em fornecer testes de hipóteses a serem realizados de tal modo que a incerteza da inferência possa ser expressa em um nível probabilístico pré-fixado (inferência estatística).

1.2 Variável

É qualquer quantidade ou característica que pode assumir diferentes valores numéricos. Por exemplo, um questionário de uma pesquisa contém as seguintes perguntas:

Revisão de bioestatística básica.

3

Pergunta

Variável

Qual a sua idade? Qual o número de pessoas de sua família? Qual a renda familiar? Qual é o seu estado civil? Você tem emprego fixo? Qual o tempo de trabalho na empresa?

- Idade

- Tamanho da família

- Renda familiar

- Estado civil

- Emprego

- Tempo de trabalho.

Classificação das Variáveis

Ao se fazer um estudo estatístico de um determinado fato ou grupo, tem-se que considerar o tipo da variável. Pode-se ter variáveis qualitativas ou quantitativas. As variáveis qualitativas (ou atributos) são as que descrevem os atributos de um indivíduo, tais como: sexo, estado civil, grau de instrução, etc. Já as variáveis quantitativas são as provenientes de uma contagem ou mensuração, tais como: idade, salário, peso, etc. As variáveis qualitativas e as quantitativas dividem-se em dois tipos:

Variáveis

Tipos

Descrição

Exemplos

   

Não existe nenhuma ordenação. O valor numérico associado com a categoria não tem significado real. Para dados na escala nominal, o interesse é na quantidade ou na proporção de cada categoria. Os métodos estatísticos não são aplicados neste caso, ou seja, não se pode calcular médias, variâncias, etc.

Cor dos olhos, sexo, estado civil, religião. Por exemplo:

Qualitativas

Nominal

1 – Sexo Masculino; 2 – Sexo feminino. O 1 e o 2 não tem significado.

ou

   

Grau de instrução; classe social; Faixa etária. Outros exemplos:

Categóricas

Obedece a certa ordenação. As características são ordenadas (de maneira crescente ou decrescente) em situações para as quais a posição associada é importante. As operações aritméticas possíveis são: a contagem e a comparação

a)

O

conceito

de

um

Ordinal

em uma disciplina da PG pode ser ótimo (4), bom (3), regular (2), ruim (1);

estudante

b) Presença de albumina na urina, indicada por: 0, +, ++, +++.

Quantitativas

Discretas

Dados oriundos de contagem.

Número de funcionários; número acidentes de trabalho ocorrido durante um mês.

Contínuas

Dados oriundos de medição.

Medidas de altura e peso; idade.

CUIDADO:

Para a variável peso de um lutador de boxe, se for anotado o peso marcado na balança, a variável é quantitativa contínua, se o peso for classificado segundo as categorias do boxe, a variável é qualitativa ordinal. A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo:

Revisão de bioestatística básica.

4

- para o fenômeno "sexo" são dois os resultados possíveis: sexo masculino e sexo feminino; - para o fenômeno "número de filhos" há um número de resultados possíveis expressos através dos números naturais;

0, 1, 2, 3, 4,

, n;

De um modo geral as medidas dão origem a variáveis contínuas e as contagens ou enumerações, a variáveis discretas. Designamos as variáveis por letras latinas, em geral, as últimas: x, y, z.

EXERCÍCIOS

1)Classifique

(ordinais e nominais) e quantitativas (discretas e

contínuas):

A. Universo: alunos de uma escola Variável: cor dos cabelos

B. Universo: casais residentes em uma cidade. Variável: número de filhos

C. Universo: as jogadas de um dado. Variável: o ponto obtido na jogada

D. Universo: peças produzidas por certa máquina. Variável: diâmetro externo

E. Universo: alunos de uma cidade. Variável: cor dos

F. Universo: estação meteorológica de uma cidade. V.: precipitação pluviométrica, durante um ano.

qualitativas

as

variáveis

em

G. Universo: Bolsa de valores de São Paulo. Variável: número de ações

H. Universo: pregos produzidos por uma máquina. V.:

I. Universo: Lutadores de BOXE. Variável: Peso de um lutador de boxe medido na balança

J. Universo: casais residentes em uma cidade Variável: sexo dos

K. Universo: propriedades agrícolas do Brasil Variável: produção de algodão

L. Universo: bibliotecas da cidade de São Paulo.

Variável: número de M. Universo: aparelhos produzidos em uma linha de

montagem.

Variável: número de defeitos por

N. Universo: indústrias de uma cidade.

Variável: índice de liquidez

O. Universo: Lutadores de BOXE. Variável: Peso de um lutador de boxe em categoria

2.0. Séries Estatísticas

2.1. Quadro

Um projeto de pesquisa pressupõe um planejamento detalhado do que deve ser feito com os dados coletados. Todas as etapas do processo de pesquisa são efetuadas visando à análise dos dados, por meio do qual serão tiradas conclusões, feitas recomendações e tomadas decisões. Inicialmente os dados dos questionários ou de qualquer outra forma de coleta devem ser organizados em Quadros, em que são listadas as informações obtidas para cada sujeito. O quadro é completamente fechado e não se propõe a resumir os dados. É classificado como ilustração de acordo com a ABNT (2002) NBR 14724. De acordo com a norma, a identificação deve ser feita na parte inferior precedida da palavra Figura, seguida do número de ordem no texto, em algarismos arábicos, título ou legenda respectiva e da fonte, quando necessário. De acordo com o livro Trabalhos Acadêmicos da Edifapes – da Concepção à Apresentação, no lugar de Figura escreve-se Quadro. Este livro propõe-se a unificar a formatação dos trabalhos em nível de URI-Campus de Erechim. Deve ser seguido na apresentação de trabalhos internos.

Sujeito

Sexo

Idade

Estado Civil

Nível de Instrução

Quem toma a medida

Qual a medida tomada

1

F

28

C

Superior

Mulher

Pílula

2

M

29

S

2º grau

Mulher

Tabela

3

f

36

S

Superior

mulher

Ligadura

 

… *

47

F

42

C

Superior

Mulher

Ligadura

48

F

30

C

2º grau

Mulher

Ligadura

49

F

46

C

1º grau

Mulher

Ligadura

50

F

29

C

2º grau

mulher

Pílula

Figura 2.1. Características de estudante da Universidade Santa Úrsula que utilizam Métodos Anticoncepcionais.

Fonte: BUNCHAFT & KELLNER, Estatística sem Mistérios, Ed. Vozes, Petrópolis: 1997, pág. 31 –34. * Foi feito um corte no Quadro. O quadro completo pode ser encontrado na fonte acima.

A descrição a seguir é válida para qualquer ilustração (ABNT (2002) NBR 14724) adaptada por Trabalhos Acadêmicos da Edifapes – da Concepção à Apresentação(2005). Elas devem:

a) ser inseridas no texto, se possível o mais perto do trecho a que se referem;

b) a chamada da ilustração, no texto, será feita pela indicação da palavra correspondente ao tipo de

o Quadro

1 mostra

ilustração (Figura, Quadro, Fotografia, Mapa, etc.), seguida do respectivo número. Por exemplo:

c) ter numeração arábica seqüencial ao longo do texto. O número pode ser precedido pelo número do

capítulo. Exemplo: Quadro 2.1. Significa: quadro 1 do capítulo 2;

d) ter um título ou legenda explicativa de forma breve e clara. As legendas devem ser digitadas em

fonte menor (fonte 10);

e) ser separadas do texto por dois espaços de 1,5;

f) após a ilustração, o texto deve iniciar a dois espaços de 1,5 abaixo da legenda;

Revisão de bioestatística básica

6

2.2. Tabelas

Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação desta ou destas variáveis. E isso ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas.

Tabela é um quadro que resume um conjunto de observações.

Uma tabela compõe-se de:

a. corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo;

b. cabeçalho – parte superior da tabela que especifica o conteúdo das colunas;

c. coluna indicadora – parte da tabela que especifica o conteúdo das linhas;

d. linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas;

e. casa ou célula – espaço destinado a um só número;

f. título – conjunto de informações, as mais completas possíveis, respondendo as perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela.

Tabela 2.1 – Produção de café. Brasil – 1991-1995. Título Cabeçalho ANOS Produção Cabeçalho (1000
Tabela 2.1 – Produção de café. Brasil – 1991-1995. Título
Cabeçalho
ANOS
Produção
Cabeçalho
(1000 t)
Coluna
1991
2535
Coluna
Indicadora
1992
2666
Numérica
Corpo
1993
2122
1994
3750
Linhas
Célula
1995
2007
Rodapé
Fonte:
IBGE

CONSIDERAÇÕES:

- O título da tabela deve indicar a natureza e a

abrangência geográfica e/ou temporal dos dados. É colocado na parte superior, precedido da palavra

Tabela e de seu número de ordem seguido de travessão. O tamanho a fonte é 12;

- As tabelas são numeradas consecutivamente e

independentemente das ilustrações, em algarismos arábicos. A numeração pode ser subordinada ou não

a capítulos ou seções de um documento;

- A tabela não deve ser fechada lateralmente (sem

fios laterais);

- Não há obrigatoriedade de linha (fio) vertical entre as colunas, mas esta pode ser utilizada desde que seja necessário, o que ocorre quando a tabela apresenta muita informação (muitas colunas e/ou muitas linhas);

- Não devem ser utilizados traços (fios) horizontais

separando as linhas com exceção do cabeçalho e da última linha;

- As linhas pontilhadas facilitam a leitura, mas não são obrigatórias;

- Convém colocar a informação referente ao total

em primeiro lugar, por se tratar em geral do dado mais importante;

- Nenhuma célula deve ficar em branco; a ausência

do dado é expressa por um traço (-) e a falta de

conhecimento deste (dado ignorado) é expressa por três pontos ( );

- Quando há dúvida quanto a um fato numérico,

pode-se ainda segui-lo de um ponto de interrogação (?).

- Notas e chamadas são utilizadas para clarificar os

dados. As notas fornecem informações de natureza geral, destinadas a explicitar ou a esclarecer o conteúdo da tabela ou a indicar a metodologia adotada no levantamento de dados, enquanto as chamadas se referem a informações específicas. Ambas são colocadas no rodapé da tabela, abaixo da fonte, sendo as notas listadas assim: 1, 2, 3 etc, e as chamadas (1), (2), (3) etc. Seu emprego deve ser evitado ao máximo, dado que contrariam o princípio de síntese proposto na elaboração de tabelas e gráficos; quando absolutamente necessárias devem

Revisão de bioestatística básica

7

ser redigidas de maneira muito concisa, indicando claramente os dados da tabela a que se referem.

- A fonte da tabela deve ser citada após o fio ou

linha de fechamento da mesma. Recomenda-se a citação da fonte quando reproduzidas de outros documentos. A prévia autorização do autor se faz necessária, não sendo mencionada na mesma. Quando os dados apresentados na tabela foram

levantados pelo autor do trabalho por meio de uma pesquisa de campo(questionários, formulários, entrevistas), pode-se utilizar como fonte as expressões o autor ou pesquisa de campo;

- As tabelas devem estar centralizadas em relação às margens esquerda e direita;

- Quando as dimensões da tabela forem maiores do

que a folha A4, a impressão poderá ser feita em

folha A3, para ser dobrada posteriormente, ou reduzida mediante fotocópia.

- O tamanho da fonte dos dados numéricos da tabela é 10.

- Devem ser inseridas o mais próximo possível do

trecho a que se referem; se a tabela não couber em uma folha, deve ser continuada na folha seguinte e, nesse caso, não é delimitado por traço horizontal na

parte inferior, sendo o título e o cabeçalhos repetidos na folha seguinte.

- Quando uma tabela, por excessiva altura, tiver de

ocupar mais de uma página, não deve ser delimitada na parte inferior, repetindo-se o cabeçalho na página

seguinte. Neste caso, deve-se usar no alto do cabeçalho ou dentro da coluna indicadora a designação Continua ou Conclusão, conforme o caso;

A Tabela 2.2 resume os dados citados no exemplo do Quadro 2.1.

Tabela 2.2 - Utilização de medida anticoncepcional de acordo com o estado civil - USU - 1995

Medida

Total

Estado Civil

Solteiro

Casado

Total Pílula Tabela Ligadura Coito Interrompido Diu Preservativo Diafragma

50

31

19

18

12

6

10

9

1

10

2

8

5

5

-

3

-

3

3

3

-

1

-

1

Fonte: WILMER, C., CASTELLO, G. & DE FARIAS, A.

De acordo com o livro Trabalhos Científicos, editado pela EDIFAPES, guia para os trabalhos na URI – Campus de Erechim, quando você insere uma tabela num texto deve fazê-lo como no exemplo a seguir:

“O site do IBGE apresenta dados sobre o crescimento da produção industrial no Brasil entre 2003 e 2004. Esse crescimento pode ser visto da Tabela 2.3.”

Tabela 2.3. Taxas anuais de crescimento da produção industrial por categoria de uso - 2003-2004.

Produção Industrial

2003

2004

Indústria Geral Bens de Capital Bens Intermediários Bens de Consumo Bens de Consumo Durável Bens de Consumo Não Durável

0

8,3

2,2

19,7

2

7,4

(-)2,7

7,3

3

21,8

(-)3,9

4

Fonte: IBGE, Diretoria de pesquisas, Coordenação de Indústria. Pesquisa Industrial Mensal

Conforme varie um dos elementos da série, podemos classificá-la em histórica, geográfica e específica.

Revisão de bioestatística básica

8

3.0. Medidas de Tendência Central

Pelo apresentado nos itens anteriores, vemos que à Estatística cabe a análise de fenômenos mensuráveis. Temos, assim, diante de nós, informações numéricas, obtidas nas fases iniciais do trabalho estatístico (planejamento, coleta, crítica, apuração e exposição), que deverão ser analisadas, agora na fase do trabalho estatístico que chamamos interpretação. Cabe-nos, assim, a determinação dos índices estatísticos que atuarão como indicadores do comportamento do fenômeno que estamos pesquisando.

Para facilitar o cálculo desses índices, achamos útil incluir uma introdução à notação de somatório (Σ), que virá por certo facilitar o entendimento e a simplificação das fórmulas, as quais irão traduzir as medidas estatísticas usadas na interpretação do conjunto de dados.

Introdução ao Símbolo Somatório (ΣΣΣΣ)

Para indicar um conjunto de N dados X 1 , X 2 , X N é usual tomarmos o símbolo X i , onde i,

, denominado índice, representa quaisquer dos

, dos diferentes valores.

Assim, por exemplo, se tivermos os números 4, 28, 13, 18 e 10, a notação X 4 representa o quarto deles, ou seja, X 4 = 18. Se, no entanto, quisermos representar a

X N

soma dos X; valores, isto é, X 1 + X 2 + X 3 + +

N e indica o número de ordem

números 1, 2, 3,

X 3 ,

podemos lançar mão da letra grega Σ (sigma) correspondente ao nosso S maiúsculo e indicativa de soma.

Por definição, temos:

N

i = 1

Xi = X

N

Xi

1

+ X

2

+ X

3

+

+ X

N

A

indicação ordena a soma dos X i

i = 1

valores desde i = 1 até i = N.

Para complementar a simbologia usada nas

fórmulas estatísticas, apresentaremos a seguir aquela

que indica produto.

3.1. Média Aritmética

As principais médias são: a aritmética, a geométrica, a harmônica e a quadrática, podendo ainda cada uma delas ser simples ou ponderada. Quando nada especificarmos, significa estarmos tratando de médias simples. Das médias ponderadas, cuidaremos somente da média aritmética ponderada, pois as demais fogem ao objetivo de nosso curso. Por ser a mais usada e conhecida, a média aritmética é chamada vulgarmente de média.

3.1.1. Média Aritmética Simples

o quociente entre a soma dos

elementos da série e o número (N) desses elementos. Assim:

X ,

é

∑ X X =
X
X =

N

3.1.1. Média Aritmética Ponderada

Por definição:

N

i = 1

X

i

= X

1

X

2

X

.

3

X

Em muitas situações torna-se necessário utilizar a média ponderada. Essa média é calculada levando-se em consideração os pesos

N (Fi) atribuídos aos valores (X).

Π (pi) é uma letra grega maiúscula e indica produto.

∑ X ⋅ Fi X = ∑ Fi
X
⋅ Fi
X =
∑ Fi

Revisão de bioestatística básica

9

Notas:

– lembrar que N = Σ Fi

– esse símbolo, X é utilizado para dados amostrais. Para dados de população usa- se a letra grega µ (mi).

3.2. Propriedades da média

a) A soma algébrica dos desvios de um conjunto de números, em relação a média aritmética é nula.

b) A soma dos quadrados dos desvios de um conjunto de números X i , em relação a qualquer número a, é um mínimo quando a = X i e somente neste caso.

c) Se f 1 números têm média m 1 , f 2 números têm

, f K números têm média m K , a

média m 2,

média de todos os números é

X =

f m

1

1

+

f m

2

2

+

+

f

K

m

K

f

1

+

f

2

+

+

f

K

Ou seja, a média aritmética ponderada de todas as médias.

3) Pode ser calculada diretamente usando qualquer calculadora eletrônica. 4) Depende de todos os valores da distribuição. 5) Evidencia bastante estabilidade de amostra para amostra, ou seja, se pesquisarmos numerosas amostras extraídas de uma mesma população, os valores das médias obtidas variam pouco. 6) Permite a manipulação subseqüente dos dados, como o cálculo de médias combinadas.

EXERCÍCIOS

1. Um aluno tira as seguintes notas numa prova de

Estatística: 5,6; 8,1 e 9,0. Calcule a média aritmética.

2. Na seqüência temos a massa (peso) em gramas, de

ratos da raça Wistar com 30 dias de idade. (Fonte:

Vieira, S., 1980). Calcule a média aritmética.

50

62

70

86

66

55

60

77

82

64

58

74

3.

Calcule a média dos números de dentes perdidos

ou danificados em uma amostra de 50 pessoas tratadas em determinada clínica dentária (Fonte:

Callegari-Jacques, S. 2003)

 

Número de

Número de

X . Fi

dentes

pessoas

Vantagens

e

desvantagens

da

média

(X)

(Fi)

aritmética

0

9

 

1

5

Por ser muito influenciada por valores extremos da série, não representa bem as distribuições em que estes valores ocorrem com freqüência acentuada, como, por exemplo, a série cujos elementos são os seguintes: 18, 20, 22, 24 e 850 (onde a média aritmética é igual a 186,8, resultado que foi muito influenciado pelo elemento 850). Um outro exemplo pitoresco e difícil de ocorrer, porém bastante esclarecedor: estamos calculando o peso médio (aritmético) de um grupo reduzido de formigas, quando alguém aparece com

2

6

3

7

4

9

5

5

6

4

7

3

8

2

Σ

50

 
 

um elefante para ser incluído nesse grupo,

médio (aritmético) do novo grupo sofrerá uma ”enorme” majoração. A forte variação não ocorreria, se, ao contrário, estivéssemos calculando o peso médio de um grupo de elefantes e alguém aparecesse com uma formiga para ser incluída no grupo. 1) Apesar de a média aritmética situar-se entre o menor e o maior resultado da distribuição de freqüências, ela não tem, necessariamente, a existência real. Podemos obter, por exemplo, uma média do tamanho de família de 4,5 pessoas, que é um valor inexistente. 2) Não pode ser calculada para distribuições com classes ou limites abertos.

o peso

1.2. Moda (Mo)

Denominamos moda o valor que ocorre com maior freqüência em uma série de valores. Desse modo, o salário modal dos empregados de uma indústria é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa indústria.

Revisão de bioestatística básica

10

1.2.1. Dados não-agrupados.

Quando lidamos com valores não-

agrupados, a moda é facilmente reconhecida: basta, de acordo com a definição, procurar o valor que mais se repete. A série de dados:

7, 8, 9, 10, 10, 10, 11, 12, 13, 15

tem moda igual a 10.

Podemos, entretanto, encontrar séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. É o caso da série:

3, 5, 8, 10, 12, 13,

que não apresenta moda (amodal). Em outros casos, ao contrário, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Na série:

2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9

temos duas modas: 4 e 7 (bimodal).

EMPREGO DA MODA

A moda é utilizada:

a)
a)
b)
b)

quando desejamos obter uma medida rápida e aproximada de posição; quando a medida de posição deve ser o valor mais típico da distribuição.

medida rápida e aproximada de posição; quando a medida de posição deve ser o valor mais

1.3. Mediana

A mediana é outra medida de posição definida como o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos.

~

1.3.1. Mediana com Dados Não-Agrupados ( X )

Dada

uma

série

de

valores,

como

por

exemplo:

5,

13, 10, 2, 18, 15, 6, 16, 9,

 

de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores:

2,

5, 6, 9, 10, 13, 15, 16, 18

O

valor central é o valor mediano. Portanto

~

X

= 10.

Se o número de elementos for par usa-se a média aritmética dos termos da ordem (n/2) e ((n/2) + 1).

2, 6, 7, 10, 12, 13, 18, 21

para n = 8 temos: 8/2 = 4 e (8+1)/2 = 5. Logo, a mediana é a média aritmética do 4º e 5º termos da série, isto é:

~

10 +

12

22

X =

=

= 11

 

2

2

EMPREGO DA MEDIANA

Empregamos a mediana quando:

- desejamos obter o ponto que divide a distribuição em partes iguais; - há valores extremos que afetam de uma maneira acentuada a média; - a variável em estudo é salário.

Relações entre Média, Mediana e Moda

A média, por seu emprego mais generalizado, por sua maior divulgação, pela facilidade de cálculo, tem levado ”vantagem” sobre as outras medidas de posição e ainda porque outras medidas usuais, que serão estudadas oportunamente, foram definidas a partir da média aritmética. Média, mediana e moda não se repelem; complementam-se. Sabemos que a média aritmética ”equilibra” todos os resultados, isto é, quem a calcula para uma série de notas de uma prova, passa a admitir que cada aluno tenha tirado a mesma nota igual à média. Vimos que a moda é o valor mais freqüente, aquele que se repete maior número de vezes. Entendemos que a mediana é o valor que divide o conjunto ordenado em dois subconjuntos

com o mesmo número de elementos cada um. Quem confronta uma nota isolada de um aluno com a nota mediana da prova aplicada, dirá a qual dos dois subconjuntos pertence essa nota, se entre 50% das notas dos melhores alunos ou se entre os outros 50%. Assim, a nota mediana tem maior expressão para o confronto do que a nota média.

Revisão de bioestatística básica

11

Um salário mediano é também mais significativo para tais confrontos do que o salário médio.

Outro significativo parâmetro é a idade mediana da vida humana, ou seja, aquela idade na qual metade do grupo sob observação ainda vive. Fixemos, uma vez mais, os conceitos de média, mediana e moda, observando as seguintes notas obtidas por 10 alunos:

10,8,6,3,3, 5,3,4, 1, 7.

A média aritmética é

Todas as notas foram, somadas, sem necessidade de ordenação. A média 5 é o parâmetro que irá interpretar aquele conjunto, o que fará ”nivelando” todos os alunos, pois admitirá que cada aluno tenha tirado nota 5.

A moda é 3, por ser o valor mais freqüente,

aquele que apareceu maior número de vezes. Diz esse parâmetro que a nota 3 foi moda na prova, foi a

nota mais comum, mais vulgar (no sentido de ocorrer mais vezes).

A nota mediana, obtida após a ordenação do

; ela significa a bipartição do

conjunto, de modo que a nota 5, por exemplo, pertence ao subconjunto com 50% das notas mais elevadas, enquanto a nota 3 foi obtida por um aluno que está entre os 50% com as mais baixas notas. Pelo exposto, constatamos a impossibilidade de relacionar analiticamente as principais medidas de posição (média, moda e mediana).

conjunto, é

5 = 4,5

4 +

2

1.5 – QUARTIS

Para curvas de freqüência unimodal moderadamente desviadas (assimétricas), vigora a relação empírica:

Média – Moda = 3(Média – Mediana)

Nas figuras abaixo, aparecem as posições relativas da média, da mediana e da moda para curvas de freqüência desviadas para a direita e para a esquerda, respectivamente. Para curvas simétricas, a média, a moda e a mediana são todas coincidentes.

a média, a moda e a mediana são todas coincidentes. Em geral a média é a

Em geral a média é a medida de tendência central mais útil. A maior parte dos testes de significância estatística estão baseados no uso das médias. Podemos concluir que a média não é uma boa medida para ser adotada quando estivermos interessados em ter um número representativo para caracterizar o centro de uma distribuição que inclua valores aberrantes (outliers). Ou seja, normalmente utilize a média como medida de tendência central, a menos que suas observações sejam por demais assimétricas (neste caso use a mediana). Além disso a média é mais facilmente calculada e de fácil entendimento.

Os quartis dividem os dados em quatro partes iguais. Podemos ter 3 quartis. Os quartis 1, 2 e 3. Para fazermos o cálculo do quartil usaremos uma função do BROFFICE ou do EXCEL com a seguinte notação: =QUARTIL (matriz de dados; número do quartil). Veja Manual do BROFFICE.

EXERCÍCIOS

1 – Determine a média, a moda e a mediana dos dados apresentados na tabela a seguir:

Percentual de água em cérebro de cobaias machos com 90 dias de idade

80,06

68,86

68,97

79,90

79,85

79,91

79,87

79,55

79,86

79,25

Fonte: Vieira, S. (1982)

Revisão de bioestatística básica

12

2 – Os tempos de reação de um indivíduo a determinados estímulos foram medidos por um psicologista como sendo 0,53; 0,46; 0,50; 0,49; 0,52; 0,53; 0,44 e 0,55 segundos, respectivamente. Determinar o tempo médio e mediano de reação do indivíduo a esses estímulos.

3 – Calcule o número médio de dentes cariados, para cada sexo, a partir dos dados apresentados na Tabela a seguir:

Nº de dentes cariados

Sexo

Masculino

Feminino

0

16

13

1

2

5

2

3

3

3

2

2

4

2

2

Fonte: MOREIRA et alli (1985)

4 – Os Níveis de ácido úrico, em mg/100ml, encontrados nos exames bioquímicos de sangue de 10 pacientes do Laboratório de Pesquisas Clínicas do Hospital Escola de FMIt, são os seguintes:

Paciente

AJF

CHJ

WT

APC

MD

SEG

HS

BET

RM

CR

Ácido Úrico (mg%),

4,0

5,2

6,5

5,0

4,5

9,0

5,5

4,5

6,0

7,0

Com base nessas informações, pede-se:

a) calcular a taxa média de ácido úrico no sangue dos dez pacientes;

b) calcular a mediana dos valores referidos no quadro;

c) calcular a moda das taxas de ácido úrico;

d) qual das três medidas de tendência central poderia ser convenientemente adotada como valor típico ou referencial do grupo de pacientes? Por quê

2,0. Medidas de Variabilidade

No último capítulo, aprendemos a calcular

e entender convenientemente as medidas de

posição, de tendência central ou promédios de uma série, onde destacamos a média aritmética (elemento ”ponto de equilíbrio” ou de ”uniformização” da série), a mediana (elemento do meio da série ordenada) e a moda (elemento mais freqüente da série). Essas medidas, embora sejam

da maior importância para avaliarmos a tendência

central revelada por um número bem razoável de séries, absolutamente nada nos informa sobre a dispersão ou variabilidade desses elementos.

Vejamos os seguintes exemplos:

1. Sejam quatro grupos distintos de alunos, com as seguintes notas:

Grupo A – 7, 5, 6, 9 e 8; Grupo B – 9, 10, 4, 1, 8 e 10; Grupo C – 5, 7, 7, 7,7, 7, 7, 7, 7 e 9; Grupo D – 7, 7, 7 e 7.

Como representante de cada um dos grupos, podemos calcular a sua média aritmética ou elemento ”ponto de equilíbrio”, que, no caso, é a mesma para todos os grupos (A A = A B = A C = A D = 7,0), embora eles sejam constituídos de elementos distintos. Um detalhe que também merece a nossa atenção consiste no fato de que em cada grupo, as notas se distribuem de maneira diferente em relação à média aritmética. Podemos inclusive constatar que o grupo mais homogêneo é, sem a menor dúvida, o grupo D, onde todos os seus elementos são iguais entre si. Temos, no entanto, dificuldades de definir entre os grupos A e B qual deles é o mais homogêneo, nos baseando apenas na visualização das suas respectivas notas.

A mais simples das medidas de dispersão é a amplitude (range em inglês). É considerada uma medida satisfatória para grupos bem pequenos de dados. É fácil de calcular. A desvantagem é que se se baseia apenas em dois valores (extremos) e não dá uma idéia de como as demais estão arranjadas entre os extremos.

Revisão de bioestatística básica

13

2.1. Amplitude ou Intervalo Total

É a diferença entre os elementos extremos (máximo e mínimo) da série, ou seja:

I t = X máx. - X mín

onde:

X máx. = maior elemento da série; X mín. = menor elemento da série.

A fórmula acima é de uso geral, podendo ser aplicada para os casos de dados apresentados isolados, repetidos com freqüência ou grupados em classes de freqüência. Nesse último caso (dados grupados em classes) devemos recordar que, como substituímos cada classe por seu ponto médio respectivo, os elementos extremos da série correspondem aos pontos médios da última e da primeira classe.

EXEMPLOS

1. Consideremos novamente os quatro grupos de alunos (apresentados no início deste capítulo) cujas notas repetimos a seguir:

Grupo A – 7, 5, 6, 9 e 8; Grupo B – 9, 10, 4, 1, 8 e 10; Grupo C – 5, 7, 7, 7,7, 7, 7, 7, 7 e 9; Grupo D – 7, 7, 7 e 7.

Com base na amplitude ou intervalo total, informar (justificando) qual é o mais homogêneo:

2. Com base no intervalo ou amplitude total, enumerar os grupos de alunos relativos ao exemplo anterior em ordem crescente de homogeneidade, justificando a solução apresentada.

Solução: Listar os grupos de alunos do menos homogêneo para o mais homogêneo consiste em enumerá-los do mais disperso (ou menos homogêneo) para o menos disperso (ou mais homogêneo), dispersão essa quantificada pelo intervalo total (já calculado no exemplo anterior). Assim, temos:

Grupo B, Grupos A e C (empatados) e Grupo D.

Comentário: Vimos acima que os grupos A e C são considerados igualmente homogêneos por terem o mesmo intervalo total. No entanto, um simples exame visual das notas respectivas nos leva a concluir que certamente o grupo C é o mais homogêneo, uma vez que dá para perceber que os seus elementos estão mais próximos entre si que os elementos do grupo A.

O que de fato ocorre é que, infelizmente, o

intervalo total não é uma medida capaz de quantificar de modo eficiente a dispersão de uma série, uma vez que no seu cálculo interferem apenas os elementos extremos (máximo e mínimo) da série, não avaliando o comportamento dos demais elementos. Utilizamos, assim, o intervalo total apenas para ter uma primeira notícia sobre a dispersão da série, visando quase que somente a identificar o campo de variação dos seus elementos.

2.2. Variância

Como vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos, que são, na sua maioria, devidos ao acaso.

A variância e o desvio padrão são medidas

que fogem a essa falha, pois levam em consideração a totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade

bastante estáveis e, por isso mesmo, os mais geralmente empregados. A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios 1 . Assim, representando a variância de dados populacionais por σ 2 , temos:

ou

σ

σ

n

(

X

i

X

)

2

2 i = 1

=

n

2

=

X

2

(

X

)

2

n

n

1 Lembremos que Σ d, = Σ (x i X ) = 0.

Revisão de bioestatística básica

14

NOTA : Quando nosso interesse não se restringe a descrição dos dados, mas, partindo da amostra, visamos tirar inferências válidas para a respectiva população, convém efetuar uma modificação, que consiste em usar o divisor n – 1 em lugar de n. Podemos, ainda, com o intuito de conservar a definição, calcular a variância usando o divisor n e, em seguida, multiplicar o resultado por n / n –

1.

Como são dados amostrais usa-se a letra “s” para indicar variância.

2

s =

Ou

 

n

(

X

i

X

)

2

i = 1

 
 

n

1

 

=

X

2

(

X

i

) 2

i

 

s

2

   

n

 
 

n

1

Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação a variável em questão, o que, sob o ponto de vista prático, é um inconveniente.

2.3. Desvio Padrão

Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desvio padrão, definida como a raiz quadrada da variância e representada por s:

2 s = s Assim:
2
s =
s
Assim:

ou

σ =

2 s
2
s

s

σ

X

2

(

X i ) 2

=

=

 

i

n

 
 

n

1

 
 

ou

 

X

2

i

(

X

i

)

2

 

n

 

n

( ∑ X i ) 2   n   n NOTA: • Tanto o desvio padrão

NOTA:

Tanto o desvio padrão como as variâncias são usadas como medidas de dispersão ou variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista. A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras.

EXERCÍCIOS

1) Tomemos como exemplo, o conjunto de valores

da variável peso (massa) de um grupo de

adolescentes:

40, 45, 48, 52, 54, 62, 70

Calcule a média, a variância e o desvio padrão dos

dados. (amostral e populacional)

2) A tabela a seguir indica o volume de plasma de oito homens adultos saudáveis.

Vol. De plasma

X

2,75

2,86

3,37

2,76

2,62

3,49

3,05

3,12

Calcule a média, a variância e o desvio padrão da amostra.

2.5. Coeficiente de Variação

Até o momento estudamos somente medidas absolutas de dispersão, cujas unidades, exceção feita à variância, são as mesmas usadas para aferir os elementos da série. Admitamos por exemplo ser do nosso interesse comparar entre si,

tendo em vista a homogeneidade, as séries

relacionadas a seguir, juntamente com suas médias

aritméticas e seus desvios padrões:

Revisão de bioestatística básica

15

Série

Média

Desvio padrão (σ ou S)

Aritmética

A (t)

80,8 t

10,0 t

B (cm)

450,0 cm

10,0 cm

C (ºC)

32,6 ºC

4,2 ºC

D (ºC)

30,0 ºC

2,6 ºC

E (t)

8 200,0 t

700,0 t

Questionemos:

qual série é mais homogênea: a série A ou a série B?

qual é mais homogênea: a série C ou a série D?

qual é mais homogênea: a série A ou a série E?

Entretanto, ao observarmos as médias aritméticas das séries em questão, vemos uma enorme diferenciação de suas ordens de grandeza, 80,8 t e 8 200,0 t, diferenças essas que se estendem aos elementos das séries respectivas e que desvirtuam e não recomendam o uso de uma medida de dispersão absoluta como o desvio padrão. Sentimos assim a necessidade de usarmos uma medida de dispersão relativa para resolvermos problemas desse tipo.

O desvio padrão tem duas características importantes:

Considera que os desvios se distribuem homogeneamente ao redor do valor da média. É uma medida absoluta.

A característica de o desvio padrão ser uma medida absoluta não permite comparar as medidas de dispersão de duas ou mais séries de observações. Nesse caso, e definimos uma medida denominada como coeficiente de variação (CV). Finalmente, apresentamos o COEFICIENTE DE VARIAÇÃO (CV) que é uma medida de dispersão relativa (dada em %), que mede a variação percentual do desvio padrão relativamente a média aritmética, ou seja:

CV =

100.

σ

X

;

para

X

0

onde: X é a média aritmética e σ é o desvio padrão.

Vamos então calcular o coeficiente de variação para cada uma das séries do exemplo acima:

– série A: V = 100 X 10,0/80,8 = 12,37 12,4%

– série B : V = 100 X 10,0/450,0 = 2,22 2,2%

– série C : V = 100 X 4,2/32,6 = 12,88 12,9%

– série D: V = 100 X 2,6/30,0 = 8,66 8,7%

– série E: V = 100 X 700,0/8 200,0 = 8,53 8%

Podemos,

assim,

por

possuir

o

menor

coeficiente de variação, afirmar que :

– a série B é mais homogênea que a série A;

– a série D é mais homogênea que a série C;

– a série E é mais homogênea que a série A.

EXERCÍCIOS

1 – Calcule a média, o desvio padrão amostral e o coeficiente de variação para peso e comprimento da tabela a seguir:

Peso (kg)

Comprimento (cm)

23,0

104

22,7

107

21,2

103

21,5

105

17,0

100

28,4

104

19,0

108

14,5

091

19,0

102

19,5

099

Fonte: Araújo e Hossne (1077) apud Vieira, S.

(1980)

2 – Imagine uma população composta por 10 crianças recém-nascidas, da qual são conhecidos os pesos (em gramas) e os comprimentos (em centímetos).

Recém-nascido

1

2

3

4

5

6

7

8

9

10

Comprimento(cm)

52

48

45

49

51

54

47

50

46

51

Peso(kg)

3300

3200

2950

3150

3350

3450

2900

3300

3150

3250

Calcule para cada variável:

a)

Média aritmética; b) variância amostral; c) desvio padrão amostral; d) coeficiente de variação;

e)

Qual das variáveis apresenta maior variabilidade?

Revisão de bioestatística básica

16

DISTRIBUIÇÃO NORMAL

Revisão de bioestatística básica 1 6 DISTRIBUIÇÃO NORMAL
Revisão de bioestatística básica 1 6 DISTRIBUIÇÃO NORMAL

Revisão de bioestatística básica

17

Revisão de bioestatística básica 1 7

Revisão de bioestatística básica

18

Revisão de bioestatística básica 1 8
Revisão de bioestatística básica 1 8

Revisão de bioestatística básica

19

Revisão de bioestatística básica 1 9
Revisão de bioestatística básica 1 9

Revisão de bioestatística básica

20

Revisão de bioestatística básica 2 0

Revisão de bioestatística básica

21

Revisão de bioestatística básica 2 1

Revisão de bioestatística básica

22

Revisão de bioestatística básica 2 2

Revisão de bioestatística básica

23

Revisão de bioestatística básica 2 3
Revisão de bioestatística básica 2 3

Revisão de bioestatística básica

24

Revisão de bioestatística básica 2 4

Revisão de bioestatística básica

25

Revisão de bioestatística básica 2 5

Revisão de bioestatística básica

26

TESTE DE HIPÓTESES

Revisão de bioestatística básica 2 6 TESTE DE HIPÓTESES
Revisão de bioestatística básica 2 6 TESTE DE HIPÓTESES
Revisão de bioestatística básica 2 6 TESTE DE HIPÓTESES

Revisão de bioestatística básica

27

Revisão de bioestatística básica 2 7
Revisão de bioestatística básica 2 7

Revisão de bioestatística básica

28

Revisão de bioestatística básica 2 8
Revisão de bioestatística básica 2 8
Revisão de bioestatística básica 2 8

Revisão de bioestatística básica

29

Revisão de bioestatística básica 2 9
Revisão de bioestatística básica 2 9

Revisão de bioestatística básica

30

Revisão de bioestatística básica 3 0
Revisão de bioestatística básica 3 0
Revisão de bioestatística básica 3 0

Revisão de bioestatística básica

31

Revisão de bioestatística básica 3 1
Revisão de bioestatística básica 3 1
Revisão de bioestatística básica 3 1

Revisão de bioestatística básica

32

Revisão de bioestatística básica 3 2
Revisão de bioestatística básica 3 2
Revisão de bioestatística básica 3 2

Revisão de bioestatística básica

33

Revisão de bioestatística básica 3 3
Revisão de bioestatística básica 3 3
Revisão de bioestatística básica 3 3

Revisão de bioestatística básica

34

Revisão de bioestatística básica 3 4
Revisão de bioestatística básica 3 4

Revisão de bioestatística básica

35

Revisão de bioestatística básica 3 5
Revisão de bioestatística básica 3 5
Revisão de bioestatística básica 3 5

Revisão de bioestatística básica

36

Revisão de bioestatística básica 3 6
Revisão de bioestatística básica 3 6
Revisão de bioestatística básica 3 6

Revisão de bioestatística básica

37

Revisão de bioestatística básica 3 7
Revisão de bioestatística básica 3 7

Revisão de bioestatística básica

38

Revisão de bioestatística básica 3 8
Revisão de bioestatística básica 3 8
Revisão de bioestatística básica 3 8

Revisão de bioestatística básica

39

Revisão de bioestatística básica 3 9
Revisão de bioestatística básica 3 9

Revisão de bioestatística básica

40

Revisão de bioestatística básica 4 0
Revisão de bioestatística básica 4 0
Revisão de bioestatística básica 4 0

Revisão de bioestatística básica

41

Revisão de bioestatística básica 4 1 11. Os dados a seguir referem-se ao peso de mulheres
Revisão de bioestatística básica 4 1 11. Os dados a seguir referem-se ao peso de mulheres
Revisão de bioestatística básica 4 1 11. Os dados a seguir referem-se ao peso de mulheres

11. Os dados a seguir referem-se ao peso de mulheres adultas antes e depois de se internarem por 15 dias em um Spa. O folder do Spa garante a perda de 3 Kg em 15 dias. Com base nesta amostra o que pode ser afirmado quanto a veracidade da propaganda?

Indv.

1

2

3

4

5

6

7

8

9

10

Antes

70

62

61

69

70

67

71

67

63

64

Depois 66

59

57

65

66

65

69

61

60

63

12. Acredita-se que entre os crimes cometidos por jovens com menos de 21 anos de idade haja uma maior proporção de crimes violentos, quando comparados aos cometidos por maiores de 21 anos. De 2750 prisões, aleatoriamente selecionada de criminosos com 21 anos ou mais, 4,55% envolviam crimes violentos. De 2200 prisões de criminosos com menos de 21 anos, 4,55% envolviam crimes violentos. Com base nestes resultados verifique a veracidade da hipótese postulada.

Revisão de bioestatística básica

42

4.0 – ANÁLISE DE VARIÂNCIA

Revisão de bioestatística básica 4 2 4.0 – ANÁLISE DE VARIÂNCIA
Revisão de bioestatística básica 4 2 4.0 – ANÁLISE DE VARIÂNCIA

Revisão de bioestatística básica

43

Revisão de bioestatística básica 4 3
Revisão de bioestatística básica 4 3

Revisão de bioestatística básica

44

Revisão de bioestatística básica 4 4
Revisão de bioestatística básica 4 4

Revisão de bioestatística básica

45

Revisão de bioestatística básica 4 5
Revisão de bioestatística básica 4 5
Revisão de bioestatística básica 4 5

Revisão de bioestatística básica

46

Revisão de bioestatística básica 4 6
Revisão de bioestatística básica 4 6
Revisão de bioestatística básica 4 6

Revisão de bioestatística básica

47

Revisão de bioestatística básica 4 7
Revisão de bioestatística básica 4 7
Revisão de bioestatística básica 4 7

Revisão de bioestatística básica

48

Revisão de bioestatística básica 4 8
Revisão de bioestatística básica 4 8

Revisão de bioestatística básica

49

Revisão de bioestatística básica 4 9
Revisão de bioestatística básica 4 9
Revisão de bioestatística básica 4 9

Revisão de bioestatística básica

50

Revisão de bioestatística básica 5 0 1. A atividade da desidrogenase de 6-fosfato de glicose (G-6-PD)

1. A atividade da desidrogenase de 6-fosfato de glicose (G-6-PD) foi medida em unidades clínicas nas

hemácias de 4 amostras de brasileiros sem deficiência dessa enzima, pertencentes a três grupos raciais (caucasóides, negróides e mongolóides). Nessas amostras, que foram designadas como caucasóide I, caucasóide II, negróide e mongolóide, foram observados os valores constantes na tabela abaixo. Por à prova a hipótese de que a atividade da G-6-PD nos indivíduos sem deficiência dessa enzima não depende do grupo racial.

Caucasóide I

Caucasóide II

Negróide

Mongolóide

8,4

11,1

9,2

10,6

7,8

9,6

8,1

10,6

8,5

8,1

9,2

8,9

8,8

9,6

9,2

6,1

11,3

8,5

9,5

6,7

8,9

8,0

10,4

7,7

10,0

8,5

10,2

8,4

8,2

8,1

7,1

9,7

9,2

9,9

6,8

7,6

7,5

10,1

9,6

7,4

2. A concentração sérica do total de proteínas foi medida eletroforeticamente em g% em cinco amostras

de 6 pacientes de um ambulatório, designadas por A a E, obtendo-se os resultados abaixo. Por à prova a hipótese de que as amostras de pacientes não diferem significativamente entre si contra aquela que afirma que isso não é verdadeiro.

A

B

C

D

E

8,5

8,4

7,4

10,5

8,1

7,2

8,0

7,2

9,0

7,4

7,4

9,7

7,8

8,8

7,0

7,8

8,1

6,8

9,2

7,0

7,0

8,7

7,2

9,4

7,6

7,4

8,5

6,8

8,0

6,8

3. O gerente de produção da Jacobs Chemical Company quer saber se o tempo médio necessário para

misturar um lote de material é o mesmo para máquinas produzidas por três fabricantes distintos. O laboratório obteve os dados a seguir sobre o tempo (em minutos) necessário para misturar o material. Use estes dados para testar se os tempos médios da população para misturar um lote de material são diferentes para os três fabricantes. Use α = 5%. O gerente quer, portanto, utilizar estes dados para testar a hipótese de que o tempo de mistura é o mesmo para as três marcas ou alternativamente, se a marca interfere no tempo de mistura.

Seja H 0 : µ 1 = µ 2 = µ 3 e H 1 = Nem todas as marcas misturam no mesmo tempo.

Revisão de bioestatística básica

51

Com a análise de variância, o gerente quer determinar se as diferenças observadas nas três médias da amostra são grandes o suficiente para rejeitar H 0 .

Tabela 01 - Pontuações de exames para 18 empregados.

Observação

Fabricante

Fabricante

Fabricante

1

2

3

1

20

28

20

2

26

26

19

3

24

31

23

4

22

27

22

5

23

29

19

6

21

26

23

7

25

27

22

Média da amostra

     

Variância da amostra

     

Desvio-padrão da amostra

     

Fonte: Adaptado de Anderson, Sweeney e Williams, Estatística Aplicada à Administração e economia.

Realize a análise de variância no Microsoft Excel. Preencha o campos em branco da Tabela 1. Cole no relatório a tabela da análise de variância ANOVA

Fonte da variação

SQ

gl

MQ

F

valor-P

F crítico

Entre grupos Dentro dos grupos

Total

Concluindo pela diferença entre as médias, realize o teste de Tukey para ver entre que médias existe diferença. Escreva as conclusões que vocês passarão para o gerente.

Revisão de bioestatística básica

52

Revisão de bioestatística básica 5 2 Áreas da curva normal entre Normal Padronizada 0 e ±

Áreas da curva normal entre Normal Padronizada

0 e ±±±± z. Distribuição

Área subentendida pela curva normal padrão compreendidas entre

a média ( X ) e um determinado valor Z.

Z

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,0

0,0000

0,0040

0,0080

0,0120

0,0160

0,0199

0,0239

0,0279

0,0319

0,0359

0,1

0,0398

0,0438

0,0478

0,0517

0,0557

0,0596

0,0636

0,0675

0,0714

0,0753

0,2

0,0793

0,0832

0,0871

0,0910

0,0948

0,0987

0,1026

0,1064

0,1103

0,1141

0,3

0,1179

0,1217

0,1255

0,1293

0,1331

0,1368

0,1406

0,1443

0,1480

0,1517

0,4

0,1554

0,1591

0,1628

0,1664

0,1700

0,1736

0,1772

0,1808

0,1844

0,1879

0,5

0,1915

0,1950

0,1985

0,2019

0,2054

0,2088

0,2123

0,2157

0,2190

0,2224

0,6

0,2257

0,2291

0,2324

0,2357

0,2389

0,2422

0,2454

0,2486

0,2517

0,2549

0,7

0,2580

0,2611

0,2642

0,2673

0,2704

0,2734

0,2764

0,2794

0,2823

0,2852

0,8

0,2881

0,2910

0,2939

0,2967

0,2995

0,3023

0,3051

0,3078

0,3106

0,3133

0,9

0,3159

0,3186

0,3212

0,3238

0,3264

0,3289

0,3315

0,3340

0,3365

0,3389

1,0

0,3413

0,3438

0,3461

0,3485

0,3508

0,3531

0,3554

0,3577

0,3599

0,3621

1,1

0,3643

0,3665

0,3686

0,3708

0,3729

0,3749

0,3770

0,3790

0,3810

0,3830

1,2

0,3849

0,3869

0,3888

0,3907

0,3925

0,3944

0,3962

0,3980

0,3997

0,4015

1,3

0,4032

0,4049

0,4066

0,4082

0,4099

0,4115

0,4131

0,4147

0,4162

0,4177

1,4

0,4192

0,4207

0,4222

0,4236

0,4251

0,4265

0,4279

0,4292

0,4306

0,4319

1,5

0,4332

0,4345

0,4357

0,4370

0,4382

0,4394

0,4406

0,4418

0,4429

0,4441

1,6

0,4452

0,4463

0,4474

0,4484

0,4495

0,4505

0,4515

0,4525

0,4535

0,4545

1,7

0,4554

0,4564

0,4573

0,4582

0,4591

0,4599

0,4608

0,4616

0,4625

0,4633

1,8

0,4641

0,4649

0,4656

0,4664

0,4671

0,4678

0,4686

0,4693

0,4699

0,4706

1,9

0,4713

0,4719

0,4726

0,4732

0,4738

0,4744

0,4750

0,4756

0,4761

0,4767

2,0

0,4772

0,4778

0,4783

0,4788

0,4793

0,4798

0,4803

0,4808

0,4812

0,4817

2,1

0,4821

0,4826

0,4830

0,4834

0,4838

0,4842

0,4846

0,4850

0,4854

0,4857

2,2

0,4861

0,4864

0,4868

0,4871

0,4875

0,4878

0,4881

0,4884

0,4887

0,4890

2,3

0,4893

0,4896

0,4898

0,4901

0,4904

0,4906

0,4909

0,4911

0,4913

0,4916

2,4

0,4918

0,4920

0,4922

0,4925

0,4927

0,4929

0,4931

0,4932

0,4934

0,4936

2,5

0,4938

0,4940

0,4941

0,4943

0,4945

0,4946

0,4948

0,4949

0,4951

0,4952

2,6

0,4953

0,4955

0,4956

0,4957

0,4959

0,4960

0,4961

0,4962

0,4963

0,4964

2,7

0,4965

0,4966

0,4967

0,4968

0,4969

0,4970

0,4971

0,4972

0,4973

0,4974

2,8

0,4974

0,4975

0,4976

0,4977

0,4977

0,4978

0,4979

0,4979

0,4980

0,4981

2,9

0,4981

0,4982

0,4982

0,4983

0,4984

0,4984

0,4985

0,4985

0,4986

0,4986

3,0

0,4987

0,4987

0,4987

0,4988

0,4988

0,4989

0,4989

0,4989

0,4990

0,4990

3,1

0,4990

0,4991

0,4991

0,4991

0,4992

0,4992

0,4992

0,4992

0,4993

0,4993

3,2

0,4993

0,4993

0,4994

0,4994

0,4994

0,4994

0,4994

0,4995

0,4995

0,4995

3,3

0,4995

0,4995

0,4995

0,4996

0,4996

0,4996

0,4996

0,4996

0,4996

0,4997

3,4

0,4997

0,4997

0,4997

0,4997

0,4997

0,4997

0,4997

0,4997

0,4997

0,4998

3,5

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

3,6

0,4998

0,4998

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

3,7

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

3,8

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

3,9

0,5000

0,5000