Você está na página 1de 80

BIOESTATÍSTICA

Introdução à bioestatística

A Bioestatística tem o objetivo de determinar se um fato


na natureza ocorre por um determinado fator ou por
acaso.

...aplicando:
Transforma a suspeita de que evento clínico está ligado
a uma determinada patologia em evidência científica.
Introdução à bioestatística
O que será visto: Conceitos e fundamentos
1. Fluxogramas e questões científicas
2. Paradigmas
3. Tipos de estudo: 1. Isto é real? 2. Qual é a magnitude do efeito? 3. O que acontecerá se as
condições mudarem?
4. Escalas
5. Universo de interesse
6. Coleta de dados
7. Amostragem
8. Hipótese nula
9. Tipos de variáveis (quantitativas – discretas, continuas – qualitativas – nominais, ordinais)
10. Estatística descritiva, gráficos
11. Distribuição normal = curva normal
12. Tipos de testes: paramétricos e não paramétricos
13. Diagramas de dispersão, correlação
14. Significância, intervalo de confiança

Rápida avaliação
Introdução à bioestatística

Os seres humanos geralmente só VISUALIZAM


informações em duas dimensões (marginalmente três, quando
pelo menos uma das dimensões for categórica*).

A função primária das análises estatísticas aparentemente mais


complexas é reduzir a dimensionalidade, de modo que as
questões formuladas em muitas dimensões possam ser
respondidas por gráficos em 2 dimensões.

Isto é, a estatística deve simplificar, e não complicar, a


interpretação biológica.

*por ex., sexo, estado civil, município


Introdução à bioestatística

Os teste estatísticos mais úteis produzem


resultados que podem ser interpretados
em termos de gráficos simples como este.

Delineamento amostral e cálculos


estatísticos não são necessários se
as informações originais puderem
ser diretamente expressas em
gráficos bidimensionais.

Segundo Goleman (1995; Emotional Intelligence), há


muitas formas de inteligência e a proficiência em
matemática é apenas uma delas.
Introdução à bioestatística

Noções de estatística básica

Estatística: Metodologia científica para obter, organizar e


analizar os dados

Estatística Descritiva: Metodologia para coletar, organizar,


resumir e descrever os dados

Inferência Estatística: Conjunto de métodos estatísticos que


visam caracterizar ou inferir sobre uma POPULAÇÃO a
partir de uma parte dela (=AMOSTRA)
Introdução à bioestatística

O que é delineamento amostral?

Delinear uma amostragem é coletar os dados de forma que


você tenha uma boa chance de tomar uma boa decisão.
Em grande parte, depende apenas do bom senso, mas ainda
há modelos simples podem ajudar a revelar padrões que, a
princípio, estavam escondidos.
Introdução à bioestatística
Delineamento amostral
Tukey (1980) enfatizou que “encontrar a pergunta certa é
frequentemente mais importante do que encontrar a resposta
certa". Infelizmente, formular questões realmente interessantes
envolve curiosidade, insight e experiência.

Mas não basta que as perguntas sejam interessantes. Elas


precisam ser "respondíveis", no sentido de que devem dar
origem a hipóteses que possam ser refutadas. Perguntas do
tipo "existe vida depois da morte?" são evidentemente
interessantíssimas, mas desafiam a mente humana a gerar
hipóteses refutáveis. Formular perguntas interessantes e
respondíveis é uma arte.
Introdução à bioestatística
Fluxogramas e questões científicas
Ciência é uma arte, e arte diz respeito à
comunicação. Um pintor vê uma paisagem
e determina o que ele quer retratar (p.
ex., harmonia, quietude, grandiosidade) e
representa esta qualidade essencial em duas
dimensões, usando cor, textura e forma.
Dependendo da escola a que o artista
pertença, ele pode querer transmitir algo a
respeito da paisagem ou de si mesmo, ou
ambos.
Girls at the Piano, 1892
Pierre-Auguste Renoir
Introdução à bioestatística
Fluxogramas e questões científicas

Um cientista faz quase a mesma coisa. Um ecólogo, olhando para a


paisagem, pode pensar em reduzi-la a uma qualidade essencial (p.
ex., competição, mutualismo, restrições físicas, metabolismo) e
representa esta qualidade em duas dimensões, usando palavras,
gráficos e fórmulas matemáticas.
Introdução à bioestatística

Paradigmas

Mesmo como cientistas, que procuram (ou deveriam) ser


imparciais, é inevitável que sejamos reflexos da época em
que vivemos... O modo como olhamos o mundo, as
complexidades, as doenças, os conceitos de vida e morte,...
estão embebidos da nossa cultura e da nossa época.

Os paradigmas estão em eterna mudança.


• Sistema solar....o planeta Terra...
• Micróbios....o que mais?
Introdução à bioestatística

Paradigma: Etimologicamente, do grego paradeigma, que


significa modelo ou padrão, corresponde a algo que vai
servir de modelo ou exemplo a ser seguido em determinada
situação.

O norte-americano Thomas Kuhn (1922-1996), físico e


filósofo da ciência, no seu livro A Estrutura das Revoluções
Científicas, designou como paradigma as “realizações
científicas que geram modelos que, por período mais ou menos
longo, e de modo mais ou menos explícito, orientam o
desenvolvimento posterior das pesquisas exclusivamente na
busca da solução para os problemas por elas suscitados.”
Introdução à bioestatística

• Comece por decidir o que você está estudando. Isto precisa ser
alguma coisa mensurável.

• Conceitos complexos como, p. ex., "qualidade ambiental" e


"justiça social" não têm dimensões, ou pelo menos não têm
dimensões que podem ser reconhecidas pela maioria das
pessoas.

• Não há questões implícitas ou óbvias! Se a questão não foi


explicitamente colocada, significa que o pesquisador está
confuso, ou é incompetente, ou pior ainda, desonesto. São
palavras duras, mas a consequência de questões vagas é o
desperdício de tempo, dinheiro e credibilidade dos cientistas.
Introdução à bioestatística

Fluxogramas e questões científicas

Vamos assumir que a questão ou a variável a ser investigada


já foi determinada. Deve-se então focalizar na decisão: o
que pode afetar esta variável e de que maneira.
Introdução à bioestatística

Você decidiu qual é o objeto de seu estudo? (variável dependente*)

Sua variável dependente pode ser medida objetivamente?

A sua amostragem está na mesma escala que sua questão? (...)

* variáveis que causam efeito (variáveis


independentes) e variáveis que são
afetadas (variáveis dependentes)
Introdução à bioestatística

Construindo a hipótese inicial

Você pode começar com a premissa de que qualquer coisa é


conectada com tudo o mais e tentar colocar tudo em seu
modelo.

Isto é análogo a um escultor querer colocar uma montanha inteira


sobre o seu pedestal - uma perda de tempo. Por outro lado, você pode
montar um sistema tão simples que ele não tenha mais semelhança
com o mundo real e, novamente, desperdiçar esforços.

Nosso modelo deve ser simples o suficiente para ser manejável,


mas complexo o suficiente para capturar a ideia central do
problema.
Introdução à bioestatística
Fluxogramas e questões científicas

Vamos começar com um exemplo simples, relacionado com uma


questão ecológica. A mesma lógica pode ser aplicada a estudos
em outras escalas, como em experimentos laboratoriais sobre
fisiologia.

Este fluxograma é,
obviamente, uma
simplificação muito grande.
Mas vamos usá-lo para
discutir os mecanismos de
construção de um
diagrama.
Introdução à bioestatística

Má alimentação

Genética?
Histórico familiar Obesidade

Sedentarismo

OBESIDADE...
...SOBRECARGA NASARTICULAÇÕES...
...DOENÇAS REUMATOLÓGICAS?
Introdução à bioestatística

Este fluxograma preliminar é importante porque ilustra a hipótese


inicial e as premissas. Você obviamente está interessado na densidade
de uma espécie de lagostim (= obesidade), presumivelmente porque ele
tem importância comercial ou por estar ameaçado de extinção, ou
alguma outra razão que justifique os gastos.
Introdução à bioestatística
Examinando o fluxograma, descobrimos que quem o fez acredita que os
fatores mais importantes que estão afetando a densidade do lagostim são
peixes predadores, fitoplâncton e poluição do corpo de água. Espera-se
que experiência, informação da literatura e bom senso sejam usados para
decidir quais os fatores mais importantes a serem estudados. Milhares de
outras coisas que potencialmente podem ser importantes, como predação
por pássaros, tipo de substrato e doenças não foram incluídas. Esta é uma
decisão subjetiva e o pesquisador pode estar errado. Entretanto, deve-se
decidir quais fatores se acredita serem PRIORITÁRIOS para a pesquisa, e
pode-se facilmente ver quais fatores foram deixados de fora.
Introdução à bioestatística

A primeira coisa a notar no fluxograma, é que as setas indicam a


direção do efeito.

Uma seta com pontas nas duas extremidades indica que cada uma
das variáveis influencia a outra.

Se não há pontas de flecha no traço que une duas variáveis, indica


que elas variam conjuntamente, mas nenhuma afeta diretamente a
outra
Introdução à bioestatística
A figura A mostra uma correlação, que pode ser substituída pela figura B.

A B

Se duas variáveis têm uma relação causal, como aparece na figura C,


deveríamos ser capazes de incluir um ou mais fatores que explicassem esta
causalidade, da forma exemplificada na figura D.

C D
Introdução à bioestatística

Este exercício resultou em fluxogramas que mostram os fatores


que julgamos importantes para o processo em estudo e o que
afeta o quê.

Claro, os modelos apresentados demandam ainda muito trabalho


e pode ser difícil admitir que eles são vitais como ponto de
partida de estudos científicos. Eles não são "sofisticados" no
sentido original da palavra, e não contêm aqueles hieróglifos que
usualmente associamos com textos científicos, como "P<" ou
"χ2= . . ."
Introdução à bioestatística

Surpreendentemente, contudo, estes diagramas são


necessários para interpretar a maioria das análises
estatísticas: Os estudos científicos investigam uma, ou
algumas vezes muitas, das flechas de um
fluxograma! Raramente ocorre de os pesquisadores
investigarem todas as setas de seus modelos, mas sem o
diagrama é difícil enxergar onde o estudo se encaixa
dentro de todo o esquema.
Introdução à bioestatística

Três tipos de estudo

1. Isto é real?
2. Qual é a forma e magnitude do efeito?
3. O que acontecerá se as condições mudarem?
Introdução à bioestatística

1. Isto é real?

• A questão básica, e frequentemente a única questão de muitos


estudos, é verificar se um efeito existe. Isto equivale a perguntar se
nós deveríamos mesmo incluir esta seta em nosso diagrama. Pode
parecer simples provar que um efeito existe, mas nada é tão simples
assim.

• É importante entender que os testes estatísticos mais poderosos


usualmente empregados não respondem à questão “O efeito
normalmente existe?”, mas sim à questão “Se todas as outras
variáveis forem mantidas constantes, a mudança desta variável
produz algum efeito?”. Estes testes consideram apenas os efeitos
diretos. A maneira mais convincente de mostrar que efeitos diretos
estão atuando é através de um experimento que manipule o sistema,
de forma que apenas as variáveis estudadas possam influenciar o
resultado.
Introdução à bioestatística

2. Qual é a forma e magnitude do efeito?


• A 2° fase da pesquisa frequentemente levanta questões a respeito da
forma da relação existente ou que se presume existir. A maioria dos
modelos é construída sobre relações lineares simples ou linearizadas
e nosso fluxograma reflete isto. Poderíamos achar que, para cada peixe
predador acrescentado ao sistema, reduzimos a densidade do lagostim
em três indivíduos por metro de riacho. Mas, um resultado simples como
este é improvável...
Muitas variáveis que afetam processos
biológicos se comportam desta forma: não
produzindo efeitos em baixos níveis, efeitos
positivos em níveis intermediários e efeitos
negativos em níveis elevados. Quantas
relações em seu campo de estudo reagem desta
forma?
Introdução à bioestatística

Precisamos de informação sobre a


forma da relação antes de testar
se um efeito existe.

Se compararmos os níveis de atividade do inseto a 5°C e a 20°C


concluiremos que a temperatura tem pouco ou nenhum efeito, ao
passo que se compararmos a atividade entre 5 e 15°C, concluiremos
que a temperatura tem um efeito muito forte. Isso ocorre quando são
aplicados testes para verificar a existência de fenômenos com
premissas incorretas quanto ao formato da relação ou quando os
pesquisadores não investigaram todos os níveis possíveis do
fenômeno.
Introdução à bioestatística

3. O que acontecerá se as condições mudarem?

• Muitos pesquisadores gostariam de responder à questão


“Quanto efeito uma variável tem sobre a outra”.
Infelizmente, com frequência, a resposta é “depende”.

• Quando o efeito de uma variável depende dos níveis de


outras variáveis „independentes”, como ocorre no
mundo real, não há uma única resposta correta.
variáveis que causam efeito (variáveis
independentes) e variáveis que são
afetadas (variáveis dependentes)
Introdução à bioestatística

Eventos independentes

Uma definição informal de um evento independente é que o resultado do evento não


lhe dá nenhuma informação sobre o resultado de outros eventos. As amostras
independentes são compostas de eventos totalmente independentes.
Exemplo: se você jogar 2 moedas, os resultados serão independentes. Se jogar 2
moedas 10 vezes cada uma, elas ainda serão amostras independentes, porque o
padrão de uma moeda não diz nada sobre o padrão de outra. Todas as amostras que
não são independentes são dependentes - ou seja, um evento é capaz de fornecer
informações sobre o outro.

Diferenças de tratamento estatístico


• A maioria dos procedimentos estatísticos assume que os dados são independentes.
Diferenças no poder estatístico
• Uma vantagem das amostras dependentes é que elas costumam ser mais potentes no
sentido estatístico (relação “estatisticamente significativa”).
Introdução à bioestatística
Qual o tamanho do problema?
Muitas das controvérsias na literatura científica ocorreram porque
pesquisadores trabalharam sobre o mesmo problema em escalas
diferentes.
A densidade de uma espécie de planta pode não ser relacionada com
características do solo em uma escala de dezenas de metros, embora
as características do solo expliquem grande parte da variação na
densidade de plantas entre regiões. Mas em uma escala mais ampla
ainda, por exemplo, em uma escala continental, pode não haver
relação entre a ocorrência de espécies e os tipos de solos. A resposta
para a questão de se o solo afeta a distribuição de espécies é “não,
sim, não”. Se tivéssemos examinado outras escalas, poderíamos ter
obtido outras combinações de sim e não.

Não há uma escala “correta” para os estudos científicos!


Introdução à bioestatística

Lacazia loboi em indígenas Caiabis

Viviam entre os rios Teles Pires e Tapajós, e


foram transferidos para aldeia Guarujá,
Parque Nacional do Xingu, Mato Grosso.
Introdução à bioestatística
Escala x Universo de interesse

Para decidir em que escala trabalhar, você deve


primeiro considerar qual:
• área
• população
• período de tempo
• situações físicas, químicas...
• situações sociais
...etc, que você deseja que os resultados se apliquem.
Isto é chamado de seu universo de interesse.
Introdução à bioestatística

Coleta de dados
Há várias maneiras de coletar os dados:
• Censo: Um censo é a contagem de toda uma população. Fornece
informações completas, mas é difícil de ser realizado.

• Amostra: É uma contagem ou medição de parte de uma população.


O uso da amostra é mais prático do que a realização de um censo.

• Simulação: É o uso de um modelo matemático ou físico para


reproduzir as condições de uma situação ou de um processo. Permite
estudar situações que seria pouco prático ou perigoso. Por exemplo:
fabricantes de automóveis usam simulações com bonecos para
estudar os efeitos que as colisões têm em seres humanos.

• Experimento: É aplicado um tratamento a uma parte da população


e observadas as respostas.
Introdução à bioestatística

Amostragem
Geralmente é impossível estudar todo um conjunto de dados de
interesse.

Então pode-se selecionar uma amostra, analisá-la e inferir


propriedades para toda população.

• População: Conjunto de indivíduos ou objetos que


apresentam em comum determinadas características
definidas para o estudo.
• Amostra: Redução da população à dimensões menores sem
perda das características essenciais.
Introdução à bioestatística
Devemos levar em conta duas questões importantes na retirada de
uma amostra: Representatividade e Imparcialidade

Suponham que estivéssemos interessados em conhecer o grau de instrução dos


habitantes do Estado de São Paulo. Considere uma amostra de 400 moradores
de regiões com difícil acesso a escola ou universidade. Logicamente, esta
amostra não é representativa de toda população do Estado de SP. Assim, a
média calculada com a amostra de 400 alunos não seria confiável podendo
dizer que se trata de uma amostra tendenciosa. Para coletar dados não-
tendenciosos é importante que a amostra seja representativa da população.
Técnicas de amostragem apropriadas devem ser usadas para garantir que as
inferências sobre a população sejam válidas.

• REPRESENTATIVIDADE: Uma amostra tem que ser representativa, ou


seja, deve conter em proporção tudo o que a população possui.

• IMPARCIALIDADE: Todos os elementos da população devem ter igual


oportunidade de fazer parte da amostra.
Introdução à bioestatística

Amostragem
É uma técnica especial para recolher amostras onde se possa garantir,
tanto quanto possível, o ACASO na escolha. Quando se faz a
amostragem, cada elemento da população passa a ter a mesma chance
de ser selecionado, pois é muito importante garantir que a amostra seja
representativa, pois as nossas conclusões relativas à população vão
estar baseadas nos resultados obtidos nas amostras dessa população. A
seguir mostraremos as três principais técnicas de amostragem
utilizadas, que são:
1. Amostragem casual ou aleatória simples;
2. Amostragem proporcional estratificada;
3. Amostragem sistemática.
Introdução à bioestatística

Amostragem Casual ou Aleatória Simples


Este tipo de amostragem é equivalente a um sorteio lotérico. Pode-se proceder
da seguinte forma: Enumerar os elementos da população e, através de um
dispositivo aleatório qualquer, realizar um sorteio e escolher os números que
farão parte da amostra.

Exemplo: Vamos retirar uma amostra da estatura de 40 alunos de uma sala.


a) Numera-se os alunos de 01 a 40.
b) Escreve-se os números, de 01 a 40, colocando-os em uma urna.
c) Mistura-se os papéis, e retira-se, um a um, 4 números que farão parte da
amostra.
Neste caso, o tamanho da amostra é igual a 10% da população. Quando o
número de elementos da amostra é grande, esse tipo de sorteio torna-se inviável.
Pode-se utilizar uma Tabela de Números Aleatórios ou softwares que geram
randomicamente a seleção, garantindo a imparcialidade da escolha.
Introdução à bioestatística

Amostragem Proporcional Estratificada

Muitas vezes a população estudada se divide em subpopulações chamadas


ESTRATOS. Por isso devemos fazer uma amostragem proporcional
estratificada e levar em consideração a quantidade de elementos de cada
estrato, escolhendo a amostra proporcionalmente a cada um.

Exemplo: Considerando o exemplo anterior, digamos que dos 40 alunos, 30


sejam homens e 10 sejam mulheres. Vamos obter uma amostra de 10% da
população, utilizando a amostragem proporcional estratificada, portanto:
Introdução à bioestatística
Amostragem Sistemática
Para esse tipo, os elementos da população a ser estudada já se encontram ordenados.
Exemplos: prédios de uma rua, produtos de uma linha de produção, prontuários médicos, etc.

Para a seleção dos elementos que farão parte da amostra, elabora-se um sistema:
Ex.: Numa rua existem 900 prédios, dos quais vamos coletar uma amostra de 50 prédios:
1. A população é de 900 prédios que já estão numerados (ordenados);
2. A amostra é de 50 elementos.
3. Cria-se um sistema para a retirada da amostra dividindo os 900 prédios pelos 50
elementos, determinando o intervalo entre os elementos escolhidos: 900/50 = 18 (entre
cada prédio escolhido devem haver 18 prédios entre eles).
4. Deve-se, então, escolher o primeiro prédio da amostra para poder utilizar a sistemática
criada. Este primeiro elemento deve estar entre o 1º e o 18º para que a sistemática
funcione e os dados dos demais elementos sejam retirados de 18 em 18.
Se o 4º prédio for o primeiro elemento da amostra, o segundo elemento será o prédio da
posição 22ª, o terceiro da posição 40º, etc, até termos a amostra completa (50 elementos).
0 2 4
4 2 0
Introdução à bioestatística

Para onde ir?

• Em geral, os pesquisadores decidem qual método de análise irão


usar copiando um disponível na literatura, e não consideram a
especificidade de suas questões. Por causa disso, as análises tendem
a definir as questões, ao invés de vice-versa.

• Afortunadamente, as análises estatísticas mais usadas são baseadas


em poucos conceitos básicos. Para usá-los, precisaremos ser capazes
de construir fluxogramas, interpretar gráficos simples e entender a
filosofia que está por trás dos testes de hipóteses. Os fluxogramas
que construímos mostram onde pensamos estar. E nos sugerem
experimentos críticos ou observações que precisamos fazer!
Introdução à bioestatística
Quanta evidência é necessária?
Nosso cientista, estudando o lagostim, decide testar o quanto locais sem peixes
têm mais lagostins do que locais com peixes predadores. Ele conta o número de
lagostins em seções de riachos com e sem peixes predadores, mas está inseguro
sobre quantas seções deve amostrar. Obviamente, uma seção de cada tipo não vai
nos dizer muito (a). Então ele aumenta o número para três seções de cada tipo,
mas ainda permanece a dúvida (b). Entretanto, com cinco seções de riachos de
cada categoria, já não resta muita dúvida (c).

CATEGORIAS
Lavradores
expostos x
câncer pele
Introdução à bioestatística

Este processo parece ser trivial, mas é uma das maneiras mais
poderosas de se planejar a pesquisa. Connolly et al. (2001) chamam
este processo de experimento de pensamento (thought experiment).
Há muitas fórmulas matemáticas “elegantes” para decidir quantas
observações são necessárias para se detectar um efeito de uma dada
magnitude (p. ex., Krebs, 1989), entretanto todas requerem
amostras preliminares.
Introdução à bioestatística
Quando improvável significa bem possível
Probabilidade... Karl Popper: O fundamento da teoria Popperiana é que não se pode
provar nada, apenas “desprovar”.

Popper ensina que só aprendemos quando erramos. Considere uma criança recém-
nascida: Ela está programada para esperar alguma coisa do mundo. Se ela não tivesse
nenhum programa em seu cérebro, seria como um computador sem um sistema
operacional – totalmente morto. Vamos imaginar que a criança é programada para
acreditar que o mundo é macio. Os pais da criança fazem o possível para que tudo o que
toque a criança seja macio em seus primeiros dias de vida e, portanto, ela não tem razões
para rejeitar sua preconcepção de que o mundo todo é macio. Entretanto, não importa
quantos objetos macios ela tenha tocado, isto nunca provará que o mundo é macio. Basta
tocar um único objeto rígido, talvez um brinquedo de cor azul, para rejeitar toda
sua conjectura sobre um mundo macio. A criança descobre que estava errada e
aprende. Ela criará uma nova conjectura, talvez que apenas objetos azuis sejam rígidos, e
somente irá adiante quando houver alguma razão para refutar esta nova conjectura.
Introdução à bioestatística

Este exemplo ilustra o fato de que é muito fácil obter


evidência para rejeitar alguma coisa.

Uma única observação que contrarie as expectativas será


suficiente.

Entretanto, nenhuma quantidade de corroboração provará


que aquela conjectura seja correta.

Quantos exemplos em ciência se encaixam! Algo é aceito


até que alguém prove o contrário...
Introdução à bioestatística
A estatística Popperiana se baseia nesta linha de raciocínio, de que é mais
fácil refutar do que provar alguma assertiva.

Não se pergunta qual é a probabilidade de se estar certo, mas a


probabilidade de se estar errado.

Para fazer isto, se começa estabelecendo uma hipótese nula. Uma hipótese
nula é uma assertiva de como o mundo deveria ser, se nossa suposição
estivesse errada.

Fizemos a conjectura de que a presença de


peixes afetava a densidade de lagostim. Nossa
hipótese nula era que não havia diferenças entre
as densidades de lagostins entre os riachos com e
sem peixes.
Introdução à bioestatística

O cientista deve ser capaz de visualizar gráficos que


representem a hipótese nula e comparar esta
idealização com o gráfico obtido com dados reais.

Poderíamos ter amostrado outros 10 riachos e o


resultado seria ligeiramente diferente. A estatística
inferencial diz respeito a lidar com muitas
possibilidades diferentes sob a hipótese nula.
Introdução à bioestatística
Teste de Hipótese
Ponto de partida de uma investigação
Hipótese nula (H0): não há diferença
Hipótese alternativa (H1): há diferença Hipótese nula é um
conceito do âmbito da
estatística e da
Hipótese: resposta presumida e provisória que, de probabilidade, que
acordo com algum critério, será ou não rejeitada. afirma que uma
hipótese é considerada
verdadeira até que
Processo para testar hipótese: surjam evidências que
provem o contrário.
1. Estabelecer Ho
2. Estabelecer H1 todas as ideias científicas
3. Determinar tamanho da amostra encontram-se em perpétuo teste
4. Colher dados
1. Estudo estabelecido para verificar se o H0 é verdadeira
2. Rejeitar ou não a H0
Introdução à bioestatística

Escolha do Teste Estatístico

A escolha de um teste depende de características dos dados


coletados:

• Tipos de dados: normais, ordinais ou contínuos


• Amostras isoladas, duas amostras ou mais de dois grupos
• Emparelhamento ou não
• Amostras grandes ou pequenas
• Distribuição normal ou não
Introdução à bioestatística

Variáveis
Quantitativas (expressas por número): idade, altura, peso, renda familiar

Discretas: (associação entre valores e números inteiros): idade em anos


completos, número de filhos, número de bactérias por litro de leite,
número de cigarros fumados por dia (resulta normalmente de contagens)

Contínua: (são resultados de medições, podendo assumir qualquer valor


no subconjunto de números reais): peso, altura, salário, temperatura
(resulta normalmente de uma mensuração, e todos valores fracionários são
possíveis)

# Devem ser medidas por meio de algum instrumento. Exemplos:


massa (balança), altura (régua), tempo (relógio), pressão arterial, idade...
Introdução à bioestatística
Variáveis
Qualitativas ou categóricas: Não podem ser expressas numericamente. São
definidas por categorias/atributos:
Nominal: (não existe ordenação entre as categorias) sexo, cor pele, cor dos
olhos, grupo sanguíneo, causa da morte, fumante/não fumante, doente/sadio.
Ordinais: (existe uma ordenação nas categorias): aparência, estágio da doença
(inicial, intermediário, terminal), status social, escolaridade (1, 2 e 3), mês de
observação (janeiro, fevereiro, etc.).

• Entretanto, as distinções são menos rígidas do descrito. Uma variável


originalmente quantitativa pode ser coletada de forma qualitativa. Por exemplo,
a variável idade, medida em anos completos, é quantitativa (contínua); mas se
for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos, etc.), é qualitativa
(ordinal). Outro exemplo é o peso dos lutadores de boxe, uma variável
quantitativa (contínua) se trabalharmos com o valor obtido na balança, mas
qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena, peso-
leve, peso-pesado, etc.).
Introdução à bioestatística
População e amostra
População: Conjunto de elementos com determinada característica
Amostra: Subconjunto com menor nº de elementos
Independentes: grupo selecionados com tratamento distinto
Dependentes: para cada elemento do grupo tratado existe um grupo controle semelhante
(sexo, idade, etc.)
Os testes estatísticos geralmente são divididos entre aqueles que assumem amostras
dependentes e independentes.
• Diz-se que uma amostra é dependente da outra quando ela está relacionada à outra. Por
exemplo, queremos saber se a água de um rio está sendo afetada pela descarga de uma
estação de tratamento de esgoto. Para isso, coleta-se água no rio antes de receber as águas
da estação de tratamento e depois. Como a amostra que coletamos depois da descarga da
estação está diretamente relacionada à que coletamos antes da estação, dizemos que estas
amostras são dependentes.
• Por outro lado, se estivermos comparando a água de duas nascentes situadas em regiões
diferentes, de forma que uma delas recebe a água de um estábulo de uma fazenda e a outra
não, dizemos que as amostras das nascentes são independentes, porque o valor que
encontraremos na amostra de uma nascente não está relacionada com o valor da amostra da
outra nascente.
Introdução à bioestatística
Revendo termos estatísticos

• DADO ESTATÍSTICO: é um dado numérico e é considerada a matéria-prima


sobre a qual iremos aplicar os métodos estatísticos.
• POPULAÇÃO: é o conjunto total de elementos portadores de, pelo menos, uma
característica comum.
• AMOSTRA: é uma parcela representativa da população que é examinada com o
propósito de tirarmos conclusões sobre ela.
• PARÂMETROS: são valores singulares que existem na população e que servem
para caracterizá-la (qualquer medida q descreve uma população). Para definirmos
um parâmetro devemos examinar toda a população.
• ESTIMATIVA: é um valor aproximado do parâmetro e é calculado com o uso da
amostra.
• VARIÁVEL: É, convencionalmente, o conjunto de resultados possíveis de um
fenômeno.
Introdução à bioestatística

Estatística Descritiva

Revisão: Média, moda e mediana

Exemplo: 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 8, 8, 10, 10

• Média = 3,4 (soma = 58 ÷ 17 elementos)


• Moda = 1 (elemento mais frequente)
• Mediana = 2 (elemento que está no meio)
Introdução à bioestatística

Estatística Descritiva
É o estudo descritivo dos dados de uma amostra (ou
população), em que se resume a informação contida no
conjunto de dados construindo tabelas, gráficos e
calculando algumas de suas características.
Introdução à bioestatística
Uma vez os dados recolhidos, faz-se a redução e representação desses
dados, utilizando as tabelas e gráficos, com o objetivo de facilitar a
compreensão do fenômeno estatístico por meio do efeito visual
imediato.
Gráfico de setores: é usado para apresentar variáveis qualitativas ou
variáveis ordinais.

Para representar os dados em um gráfico


de setores é preciso que os valores
estejam em porcentagem, para isso
devemos definir a frequência relativa
dos dados
Introdução à bioestatística

Gráfico de barras: é usado para apresentar variáveis qualitativas


ou variáveis ordinais
Introdução à bioestatística

Histograma: é usado para apresentar variáveis quantitativas


continuas. Não há espaço entre as barras!!

Frequência

Peso ao nascer INTERVALOS DE CLASSES


Introdução à bioestatística

Polígono de frequência: Os dados apresentados em tabela de


distribuição de frequências também podem ser apresentados em
gráficos denominados polígonos de frequência. Após serem
marcados os pontos na abscissa (pontos médios das classes) e na
ordenada (frequência relativas), fechar o polígono unindo os
extremos nos pontos de abscissas iguais
aos pontos médios de uma classe
imediatamente inferior a primeira
e de uma classe imediatamente
superior à última.
Introdução à bioestatística

Box Plot ou Diagrama de caixa


• Mediana (linha central): estimativa da tendência central:A sua posição indica a
presença de simetria (central) e próxima a dos percentis (assimetria)

• Percentis 25 e 75 . AAmplitude Interquartil


(AIQ) estima a variabilidade dos dados

• Whiskers (“bigodes de gato”):


1. valores máximos e mínimos
(distribuição normal)
2. distribuição assimétrica: os dados
máximo e mínimos se desviam do P25-P75
->1,5 AIQ: valores discrepantes
(outliers)
->2,5 AIQ: valores extremos
Dias de internação na coleta da hemocultura
por faixas de peso ao nascer
Introdução à bioestatística

Box Plot ou Diagrama de caixa


Introdução à bioestatística
Diferença entre os testes paramétricos e os não
paramétricos
Os testes paramétricos possuem os seguintes requisitos:

1. Distribuição normal
Os testes paramétricos são válidos quando aplicados a dados que obedecem a uma
distribuição normal - uma distribuição normal é aquela que é perfeitamente
simétrica à volta da média; tem a forma
de um sino, como mostra a figura.

Curva de distribuição normal


Introdução à bioestatística

No entanto, existem distribuições normais assimétricas, desviadas à direita


ou à esquerda. Uma distribuição normal é aquela cuja análise estatística
pode ser feita com dados da própria amostra, como a média, moda,
mediana e desvio padrão. Numa amostra que não tem uma distribuição
normal não é possível calcular o desvio padrão, por exemplo.

Quando a distribuição dos resultados da


variável for assimétrica, as conclusões
baseadas no teste estatístico são menos
válidas. Quanto maior for o enviesamento
das distribuições, menor será a validade do
teste paramétrico que lhes é aplicado.

Curva de distribuição enviesada


Introdução à bioestatística

Distribuição normal
Por que a distribuição normal é importante?
A forma exata da distribuição normal (a característica "curva do sino") é definida por
uma função que tem apenas dois parâmetros: média e desvio padrão. Uma propriedade
característica da distribuição normal é que 68% de todas as suas observações caem
dentro de um intervalo de 1 desvio padrão da média, um intervalo de 2 desvios padrões
inclui 95% dos valores, e 99% das observações caem dentro de um intervalo de 3
desvios padrões da média. Em outras palavras, em uma distribuição normal as
observações que tem um valor padronizado de menos do que -2 ou mais do que +2 tem
uma frequência relativa de 5% ou menos (valor padronizado significa que um valor é
expresso em termos de sua diferença em relação à média, dividida pelo desvio padrão).

O desvio padrão é a medida mais comum da dispersão estatística (representado pelo


símbolo sigma σ). Ele mostra o quanto de variação ou "dispersão" existe em relação à
média. Um baixo desvio padrão indica que os dados tendem a estar próximos da
média; um desvio padrão alto indica que os dados estão espalhados por uma gama de
valores
Introdução à bioestatística
Distribuição normal
Área sob a curva para qualquer distribuição normal de probabilidade

http://slideplayer.com.br/slide/3274748/
Introdução à bioestatística
2.Variância homogénea
Os resultados são mais fáceis de comprar parametricamente quando a
variância ou a variabilidade dos dados, nos dois grupos, for igual ou
homogénea. Se os dois grupos submetidos ao mesmo teste de realização
apresentarem médias iguais, mas distribuições diferentes (como
mostram respectivamente as curvas A e B da Figura abaixo) seria difícil
interpretar um teste paramétrico, devido às diferenças na dispersão ou
variância dos resultados, nos dois grupos.

Curva A tem menor variância ou dispersãodos


resultados que a curva B

3.Os intervalos são contínuos e iguais Os


testes paramétricos podem aplicar-se
apenas em dados que constituem uma
escala de intervalos, ou seja, têm entre si
intervalos contínuos e iguais.
Introdução à bioestatística
Testes paramétricos e não-paramétricos
Paramétrico Não-Paramétrico
Coeficiente de Pearson Coeficiente de Spearman para
para Correlação Correlação

Teste-t 1 Amostra Teste de Wilcoxon 1 Amostra


Teste-t Pareado Teste de Wilcoxon Pareado
Teste de Wilcoxon-Mann-Whitney
Teste-t 2 Amostras Amostras Independentes

ANOVA Teste de Kruskal-Wallis


ANOVA experimento Teste de Friedman
fatorial em blocos
Introdução à bioestatística

Testes Paramétricos
Análise de Variância (ANOVA: Analysis of Variance)
• Usado para comparar médias de mais de duas populações
• A análise de variância é um teste estatístico que visa
fundamentalmente verificar se existe uma diferença significativa entre
as médias e se os fatores exercem influência em alguma variável
dependente.
• Os fatores propostos podem ser de origem qualitativa ou quantitativa,
mas a variável dependente necessariamente deverá ser contínua.

Teste de Fisher ou da Probabilidade Exata


• Usado para amostras pequenas
Introdução à bioestatística

Vantagens dos Métodos Não-Paramétricos


1. Os métodos Não-Paramétricos podem ser aplicados a uma
ampla diversidade de situações, porque não exigem
populações distribuídas normalmente.

2. Podem frequentemente ser aplicados a dados não-


numéricos (são, particularmente, adaptáveis aos dados das
ciências do comportamento e são extremamente
interessantes para análises de dados qualitativos.)

3. Os métodos Não-Paramétricos em geral envolvem


cálculos mais simples do que seus correspondentes
Paramétricos, sendo, assim, mais fáceis de entender.
Introdução à bioestatística

Teste do χ2 (qui-quadrado)

• É um teste de hipóteses que se destina avaliar associação existente


entre variáveis qualitativas.
• É um teste não-paramétrico, ou seja, não depende de parâmetros
populacionais.
• O princípio básico deste método é comparar proporções, isto é, as
possíveis divergências entre as frequências observadas e
esperadas para um certo evento.
• Pode-se dizer que dois grupos se comportam de forma semelhante
se as diferenças entre as frequências observadas e as esperadas
forem muito pequenas, próximas a zero.
Introdução à bioestatística
Teste do χ2 mede a probabilidade de as diferenças encontradas em
dois grupos de uma amostra serem devidas ao acaso

O teste é utilizado para:


• Verificar se a frequência com que um determinado acontecimento observado
em uma amostra se desvia significativamente ou não da frequência com que
ele é esperado.
• Comparar a distribuição de diversos acontecimentos em diferentes amostras, a
fim de avaliar se as proporções observadas destes eventos mostram ou não
diferenças significativas.

• Condições para a execução do teste


• Exclusivamente para variáveis nominais e ordinais (qualitativos);
• Observações independentes;
• Não se aplica se 20% das observações forem inferiores a 5
• Não pode haver frequências inferiores a 1;
Introdução à bioestatística

Correlação e Regressão
No estudo de Correlação e Regressão Estatísticas deve-se levar em
conta 2 variáveis e 1 população. Exemplo: Peso e Comprimento (2
variáveis) das baleias (1 população). Dentre esse estudo teremos a
correlação e a regressão estatística, cujo principal objetivo é
estudar a relação entres essas variáveis. Esse estudo pode ser
investigando presença e/ou ausência dessa relação, que pode ser:

1) Quantificando a força dessa relação: correlação


2) Explicitando a forma dessa relação: regressão
Introdução à bioestatística

Diagrama de dispersão
O diagrama de dispersão é uma apresentação gráfica onde pontos no
espaço cartesiano XY são usados para representar simultaneamente os
valores de duas variáveis quantitativas medidas em cada elemento do
conjunto de dados.

Coeficiente de correlação
Coeficiente de correlação indica a força e a direção do relacionamento
linear entre as duas variáveis, sendo denotada por r. Vários coeficientes
são utilizados para situações diferentes, tais como o coeficiente de
correlação de Pearson e o coeficiente Linear.

No relacionamento correlacional, não se tem nenhum controle sobre as


variáveis: Elas são observadas como ocorrem no ambiente natural, sem
nenhuma interferência, isto é, as duas variáveis são aleatórias.
Introdução à bioestatística
TIPOS DE CORRELAÇÃO – indica força e direção
1.Correlação Positiva : O aumento de uma variável corresponde, ao aumento da
outra.
2.Correlação Negativa: O aumento de uma variável corresponde a diminuição da
outra.
3. Correlação Linear: Quando é possível ajustar uma reta, pode ser forte (quanto
mais próximas da reta) ou fraca (quanto menos próximas da reta).
4. Correlação não-linear: Quando não é possível ajustar uma reta.

Diagramas de dispersão Correlação não linear

Correlação linear negativa


Correlação linear positiva
Introdução à bioestatística

Correlação amostral
• Serve para estudar o comportamento conjunto de duas
variáveis quantitativas distintas. Ou, em outras palavras,
mede o grau de associação de duas variáveis aleatórias X
e Y.

• OBS.: Não há, nesse caso, preocupação em apresentar


alguma forma funcional entre as variáveis.
Introdução à bioestatística

Regressão linear

A análise da regressão consiste na realização de uma


análise estatística com o objetivo de verificar a existência
de uma relação funcional entre uma variável dependente
com uma ou mais variáveis independentes.
Introdução à bioestatística

Significância estatística

O que significa estatisticamente significativo?


• Somente quando estamos 95% certos de que um resultado é
genuíno (não resultante do acaso), devemos aceitar este
como verdadeiro - representativo da população!
• Se há somente 5% de probabilidade de algo acontecer ao
acaso, aceitamos o resultado como verdadeiro ou
significativo (p<0,05 ou 5%)
• A significância é representada por .

Quanto mais alto o nível-p, menos se pode acreditar que a relação observada
entre as variáveis na amostra é um indicador confiável da relação entre as
respectivas variáveis na população.
Introdução à bioestatística

Intervalos de confiança

Intervalos de confiança são usados para indicar a


confiabilidade de uma estimativa. Por exemplo, um IC pode
ser usado para descrever o quanto os resultados de uma
pesquisa são confiáveis. Sendo todas as estimativas iguais,
uma pesquisa que resulte num IC pequeno é mais confiável
do que uma que resulte num IC maior.
Introdução à bioestatística

Bibliografia consultada
CONNOLLY, J.; WAYNE, P.; Bazzaz, F. A. Interspecific competition in plants: how well do current methods
answer fundamental questions. American Naturalist, n. 157, p. 107-125, 2001

COSTA NETO, P. L. O. Estatística. Edgar Blucher, 1977. 264p.


GOLEMAN, D. Emotional intelligence. London: Bloomsbury Publishing ,1995.

KREBS, C. J. Ecological methodology. New York: Harper & Row, 1989.

MAGNUSSON, W. E.; MOURÃO, G. Estatística sem matemática: A ligação entre as questões e a análise. [S.l.]:
Editora Planta, 2003. 26p.

MAGNUSSON, W. E. Teaching experimental design, or how to do statistics without a bikini. Bulletin of the
Ecological Society ofAmerica, n. 78, p. 205-209, 1997.
TUKEY, J. W. We need both exploratory and confirmatory. American Statistician, n. 34, p. 23-25, 1980.

WOODS, W. J. et al. Ten years experience with Jorge Lobo's disease in the state of Acre, Amazon region, Brazil.
Rev. Inst. Med. Trop., v. 52, v. 5, 2010.

ZAR, J. H. Biostistical analysis. 4 ed. Rio de Janeiro: Prentice Hall, 1999. 661 p.
FIM DA APRESENTAÇÃO

Você também pode gostar