Você está na página 1de 6

cadeira Modelao dos Sistemas Biolgicos, Modela Biol Licenciatura em Biologia, Departamento de Biologia, Universidade da Madeira

cadeira Modelao dos Sistemas Biolgicos Parte 1 - Biometria

Anlise Estatstica
Modelao dos Sistemas Biolgicos, Licenciatura em Biologia Departamento de Biologia, Universidade da Madeira

Anlise Exploratria vs. Confirmatria


Tcnicas estatsticas servem dois objectivos diferentes: anlise exploratria: estatstica descritiva anlise confirmatria: o testar de hipteses anlise exploratria (EDA) processo de extrair, juntar, sumariar, e apresentar resultados serve tambm para formular novas hipteses a partir dos dados anlise grfica uma das melhores: muitas vezes: scatterplot histograma sempre graficar 1 resultados (melhor que tabelas complexas) adicionalmente calcular estatsticas descritivas anlise confirmatria estatstica de inferncia ou o testar de hipteses = o clculo da probabilidade de que um resultado seja consistente com a hiptese de nulidade (e.g. existe diferena entre os valores dos dois grupos) normalmente anlise em computador: mas! 1 tentar conhecer os dados (EDA) e familiarizar-se com os mesmos problema computador (black-box): faz tudo, mesmo quando os dados ou a hiptese no esto correctos Anlise de dados no um processo puramente mecnico: existe mais do que uma maneira e medida que se vo descobrindo resultados e comparando com hipteses, outras vo surgindo. um processo criativo e requer imaginao e inteligncia alm de conhecimentos.

Modelao dos Sistemas Biolgicos, Licenciatura em Biologia Departamento de Biologia, Universidade da Madeira

Probabilidade e significncia
Alguns termos estatsticos:

Hiptese de nulidade e alternativa H0: a hiptese base contra a qual o resultado obtido comparado: Normalmente prev a inexistncia de efeitos (no existe diferena, no existe relao entre varveis) HA: a hiptese alternativa que se supe ser verdadeira no caso de no se aceitar H0. Esta hiptese no pode ser testada, o que se testa H0.
Modelao dos Sistemas Biolgicos, Licenciatura em Biologia Departamento de Biologia, Universidade da Madeira

Nvel de significncia
Em geral a estatstica serve para saber se um efeito observado real, ou devido a factores aleatrios como erros de medio. Especficamente: A pergunta a que um teste estatstico responde : Qual a probabilidade, no caso de H0 ser verdadeira, de obtermos, por mera casualidade, o resultado que observado? Se a probabilidade for baixa, isso significa, que o nosso resultado no resulta de mera casualidade, mas que sim, se trata de um efeito real. A probabilidade de obter esse resultado observado denominada de nvel de significncia Por conveno, determinamos que resultados cuja probabilidade seja inferior a 5% (p<0.05) sejam considerados significativos (rejeita-se H0), ou seja no aconteceram por mear casualidade. Nveis de significncia utilizados normalmente so: p<a5%1%0.5%0.1%0.050.010.0050.001****** Programas estatsticos do probabilidades exactas: Num texto pode-se dar um valor como p=0.045 (mas lembre-se de arredondar p/3 dgitos: no p=0.044758) Ateno: em termos coloquiais diz-se altamente significante, mas realmente, isso significa que a probabilidade mais baixa (o valor numrico inferior!!)
Modelao dos Sistemas Biolgicos, Licenciatura em Biologia Departamento de Biologia, Universidade da Madeira

Tabelas de contingncia 1 x k

Teste de goodness of fit do 2

( f f ) =
k i i i =1

Dados (inventados)
var1:(direco) cat1: mesma direco observado esperado 10 cat2: direco contrria 30

fi

f i =e=frequncia experada f i =o=frequncia observada

2 =

(o e )
e

20

20

Resultado: Vacas pretas mostram uma tendncia significativa em virar na direco oposta da viragem forada (2=10, g.l.=1, N=40, p<0.005).

H0: no existe preferncia direccional HA: existe preferncia direccional

2 =
=

(o e )2 = (10 20)2 + (30 20)2


e 20 20

100 100 + = 5 + 5 = 10 20 20

da tabela: 20.05,1=3.841 e 20.005,1=7.879 0.005<P<0.001 rejeitar H0


Modelao dos Sistemas Biolgicos, Licenciatura em Biologia Departamento de Biologia, Universidade da Madeira

Teste de goodness of fit do 2


Dados em programa de estatstica
var1:(direco) mesma direco: 1 direco contrria: 2
VAR1 Observed N mesma direco direco contrria Total 10 30 40 Expected N 20.0 20.0

frequncia 10.00 30.00


Test Statistics Chi-Squarea df Asymp. Sig. VAR1 10.000 1 .002

Residual -10.0 10.0

a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 20.0.
Modelao dos Sistemas Biolgicos, Licenciatura em Biologia Departamento de Biologia, Universidade da Madeira

Erros do tipo I e II
Ter um nvel de significncia inferior a 0.05 no significa que o resultado seja realmente verdade. Significa, que a probabilidade baixa de obter um resultados desses por mera casualidade. Isto implica que podemos cometer erros: Existem 2 tipos de erros: TIPO I: H0 realmente verdade, mas rejeitamo-la: prob. = a = nvel de significncia TIPO II: H0 realmente falsa, mas aceitamo-la: prob. = b Poder ou fora de um teste estatstico A fora de um teste a sua sensibilidade em detectar efeitos reais: =A probabilidade de rejeitar H0 quando mesmo falsa = (1-b) quanto maior a fora de um teste, maior a prob. de detectar efeitos reais a est fixado (e.g. 5%) podemos aumentar o poder do teste atravs de aumentar o tamanho da amostra melhorar o design experimental (reduzir erros de medio, etc. ...)
Modelao dos Sistemas Biolgicos, Licenciatura em Biologia Departamento de Biologia, Universidade da Madeira

Testes uni- e bilaterais


Podemos fazer previses sobre a direco de um efeito: e.g. a barata limpa-se +vezes aps ser suja com giz unilateral Alternativamente, podemos no fazer previso nenhuma e.g. a barata comporta-se de forma diferente (limpa-se + ou -vezes) aps ser suja com giz bilateral Fazer previso antes do teste (antes da experincia melhor) nvel de significncia altera-se (dobro no bilateral uni: a=0.05, bi: a=0.10) normalmente utilizar sempre testes bilaterais! (trabalhar contra o prprio) s utilizar unilateral se houver razes fortes priori
Modelao dos Sistemas Biolgicos, Licenciatura em Biologia Departamento de Biologia, Universidade da Madeira

Magnitude do efeito vs. significncia estatstica


Magnitude de um efeito (diferena entre valores de duas amostras, tamanho da correlao, etc.). Significncia estatstica (probabilidade do efeito observado ter sido causado por razes aleatrias) alta significncia magnitude elevada Efeito altamente significativo, mas sem relevncia biolgica por magnitude pequena: Tamanho mdio entre europeus centrais e do sul: s poucos milmetros, mas altamente significante) Dar sempre, em conjunto com significncia, alguma estimativa da magnitude

Modelao dos Sistemas Biolgicos, Licenciatura em Biologia Departamento de Biologia, Universidade da Madeira

Processo de inferncia estatstica


Em geral a estatstica serve para saber se um efeito observado real, ou devido a factores aleatrios como erros de medio. Os seguintes passos devem ser dados:
Especificar Hiptese de Nulidade

e.g. H0: no existe diferena entre dois grupos especificar se o teste deve ser uni- ou bilateral
Seleccionar teste apropriado

Depende da questo: os mais simples usados em etologia so Xi2, sinal, teste de U, de t, de Wilcoxon, correlao de Pearson ou Spearman
Seleccionar nvel de significncia

j falado
Calcular valor da estatstica

escolher algoritmos de um livro e calcular (no incio melhor que utilizar computador)
Determinar valor crtico

Verificar tabelas estatsticas. Ter em conta se uni- ou bilateral

Modelao dos Sistemas Biolgicos, Licenciatura em Biologia Departamento de Biologia, Universidade da Madeira

Você também pode gostar