Você está na página 1de 10

A Conduo da Anlise 2014/2

Thierry R. Gasnier/ Universidade Federal do Amazonas

nha e carne como iscas para pegar formigas,


temos trs nveis efetivos na varivel tipo de
isca. Se em cada armadilha cairem 0, 0, 0, 0, 1,
1, 2, 4 e 8 formigas, teremos 5 nveis efetivos
de medida, pois foram 5 valores diferentes. Na
figura 3.1, a varivel Ms tem 6 nveis efetivos
e a varivel Tamanho da Aranha tem 19 nveis
efetivos. Cuidado, no so todos os 25 do eixo
Y, pois a menor medida, apenas aqueles que
tem valores. A preciso da medida foi de 1mm
(como pode se ver no grfico), se a preciso
fosse de 0,5mm, teramos aproximadamente o
dobro de nveis efetivos.

3 Confiana na
medida e independncia
Neste captulo abordaremos a confiana que
podemos ter em medidas. Quanto de confiana
ou incerteza podemos ter em um valor? Comearemos vendo que h tipos diferentes de valores que chamaremos de escalas de medidas.
Abordaremos a atribuio de valores categricos e as incertezas ligadas a esta atribuio.
Para falar nas incertezas de valores quantitativos introduziremos os conceitos de exatido,
preciso e de acurcia e a importncia de examinarmos distribuies de frequncias. Estudamos populaes, mas geralmente por amostras, por isto precisamos entrender o que so
parmetros populacionais, como so estimados
e a importncia de intervalos de confiana. Finalmente, veremos que h dois conceitos diferentes quando estamos falando em independncia estatstica.

Em funo do tipo de valor utilizado, as variveis dividem-se em ESCALAS DE MEDIDA da


seguinte forma:
BINRIAS: Possuem apenas dois nveis efetivos. Por exemplo: sim ou no; presena ou
ausncia; macho ou fmea; macrofauna ou
mesofauna; controle ou tratamento. Tambm
so binrias as variveis quantitativas que assumem apenas dois valores em uma analise
(por exemplo, na comparao entre tratamentos
com 1 mg ou 2 mg de um medicamento).

3.1 Nveis e escalas de medida

CATEGRICAS: Tipicamente assumem valores


qualitativos (no quantitativos) sem uma ordem intrnseca natural entre os nveis, ou possuem uma ordem, mas esta pode ser ignorada

Phoneutria reidyi

Tamnho da aranha(mm)

Dizer que uma pessoa alta ou que mede


1,80m so duas formas vlidas de falar sobre
altura, mas com poder informativo diferente.
Nas duas formas, estamos falando de variveis,
pois so propriedades que variam entre unidades amostrais. Se
voc divide as pessoas em dois
25
grupos, altas e baixas, ter dois
20
nveis de medidas; se voc dividir
em 3 grupos, altas, mdias e
15
baixas, ter trs nveis. Se medir
com uma fita mtrica, ter vrios
10
nveis de medida (como 1,73 m,
1,82 m, etc.). Os tratamentos
5
estatsticos dependem tanto do
nmero de nveis efetivos como
0
do tipo de medida.
NVEIS EFETIVOS DE MEDIDA
so os diferentes valores de uma
varivel efetivamente includos
em uma anlise. Se comparamos
a eficincia de goiabada, sardi-

v
?

Jun Ago Out Jan

Abr

Ago

Ms da coleta 2001/2002
Figura 3.1- Neste grfico EPR h seis nveis na varivel Ms da coleta, 19
nveis na varivel Tamanho da aranha e trs nveis na varivel Sexo.

29

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

neste curso, mas que interessante se conhecer}

na anlise. Por exemplo: tipos sanguneos (A,


B, AB e O), marcas de fertilizante, habitat e
nome do coletor (os nveis destas variveis
podem ser ordenados alfabeticamente, por
exemplo, mas esta ordem irrelevante para a
anlise). Nmeros podem ser utilizados para
rotular entidades (e. g. 135= planta # 135),
mas a propriedade nmero da planta categrica, j que no uma quantidade sujeita a
operaes matemticas (a planta #1 no igual
planta#136 menos a planta#135). Variveis
binrias sempre podem ser tratadas como categricas, mas diferem das categricas com mais
de dois nveis efetivos por possuir uma maior
flexibilidade em anlises estatsticas, o que
justifica uma escala separada. As escalas Binria e Categrica juntas so chamadas de Escala
NOMINAL.

As escalas de medida normalmente so tratadas como se fossem excludentes entre si, isto
, que se um valor pertencesse a uma no pertenceria a outra, mas no assim (Fig. 3.2).
Uma escala quantitativa tambm ordinal, pois
os nmeros que representam quantidades ou
dimenses esto ordenados (mas nem toda
sequncia ordinal quantitativa). As escalas
quantitativa e ordinal, tambm so categricas,
pois cada valor numrico ou de ordem, pode ser
visto como uma categoria. A binria est includa em todas, pois dois valores podem ser obtidos em qualquer escala. Muitos textos dividem
os valores em quantitativos e qualitativos, o que
nos induz a pensar que quantidades no so
qualidades. Entretanto, dizer que uma pessoa
tem 1,80 m s uma maneira mais precisa de
dizer que ela alta. Portanto, quantidades tambm so qualidades. A compreenso que algumas escalas de medida esto dentro de outras
e que qualquer atribuio de valor uma atribuio de uma qualidade ser importante quando abordarmos a flexibilidade na escolha de
testes estatsticos (captulo 5).

ORDINAIS: Existe uma sequncia categrica


ordenada relevante entre os nveis na anlise.
Tipicamente, a diferena entre um nvel e o
prximo de posio apenas, no h uma
quantificao. Por exemplo, no podemos saber
se o segundo lugar em uma corrida chegou
mais prximo do primeiro ou do terceiro apenas
com a posio da chegada. Outros exemplos:
abundncia na escala nula, rara, intermediria,
comum ou muito comum; vento na escala fraco, moderado, forte, violento e furaco; notas
na escala A, B, C, D ou reprovado; idade na
escala filhote, jovem pr reprodutivo, adulto
novo, adulto velho; tipo de solo na escala arenoso, intermedirio arenoso, intermedirio argiloso ou argiloso. Voc pode usar nmeros nestas escalas, mas preciso lembrar que estes
nmeros no so quantidades.
QUANTITATIVAS: Variveis quantitativas possuem valores numricos que efetivamente representam quantidades (como o nmero de
formigas) ou dimenses lineares (como o peso
das formigas). No so variveis quantitativas
aquelas que possuem valores numricos que
representam apenas ordem ou rtulo de uma
categoria. {Na apostila h algumas informaes
complementares sobre a escala quantitativa e
sobre outras trs escalas que no abordaremos

Figura 3.2-. Do ponto de vista lgico, as escalas de medida


no so auto excludentes, algumas esto contidas em
outras, e a Binria (Bi) se encontra dentro de todas.

30

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

principalmente quando a subjetividade pode ter


um papel importante na atribuio de um valor.
Em muitos estudos de comportamento, importante se detalhar o significado de categorias de
comportamento utilizadas para permitir comparaes (etograma). Se voc chamar de comportamento agressivo apenas quando animais
efetivamente lutam, vai considerar o comportamento mais raro do que outra pessoa que considere qualquer demonstrao de agressividade. Outros exemplos de CAC so chaves de
identificao de espcies, tabelas de sintomas
de doenas e tabelas de cores de tipos de solos.

3.2 Atribuio de nveis nominais e


ordinais
Em Tipicamente, em escalas nominais (binrias
ou categricas) e ordinais no h uma quantificao instrumental. Os nveis podem ser atribudos pelo pesquisador com um CRITRIO DE
ATRIBUIO DE CATEGORIA que deve ser
to objetivo quanto possvel, mas comum que
haja certo grau de interpretao na determinao de qual a categoria a que pertence uma
unidade amostral ou qual a sua posio em
uma escala ordinal. Muitas vezes isto simples,
como no registro se um peixe est vivo ou morto ao final de um experimento, mas pode ser
complexo, como ao se determinar qual a doena de um paciente. Em muitos estudos, os nveis so definidos pelo pesquisador, mas atribudos por outra pessoa, como ocorre em entrevistas. Por estes motivos, frequentemente a
atribuio de nveis nominais ou ordinais uma
das partes mais sensveis de um estudo.

Quando trabalhamos com nveis ordinais, os


resultados so muito mais confiveis se sempre
forem definidos pela mesma pessoa suficientemente treinada, ou se houver uma tabela de
referncia bem definida (como na tabela de
cores de solo). Mais difcil interpretar nveis
ordinais que variam entre pessoas ou circunstncias envolvidas na coleta dos dados. Se 60%
das pessoas entrevistadas de uma cidade gostam da qualidade de vida e apenas 30% das
pessoas entrevistadas de outra cidade gostam
da qualidade de vida, no podemos saber se a
qualidade de vida melhor na primeira cidade
ou se as pessoas so mais exigentes na segunda. Uma pessoa pode achar que h poucas aves em um local quando estiver comeando a observar aves, e perceber que h muitas depois de adquirir mais experincia.

Imagine que voc quer saber se a proporo de


meninos que sabe nadar diferente da proporo de meninas que sabem nadar, baseado em
entrevistas. Entretanto, o significado de um
sim de um menino realmente comparvel ao
significado de um sim de uma menina? Possivelmente os meninos tenham mais vergonha
em admitir que no sabem nadar e vrios respondam sim mesmo sem saber, enquanto as
meninas apenas respondem sim se nadam
bem. Se voc lembrar do captulo anterior, perceber que o problema que pode no haver
representatividade conceitual entre a varivel
operacional resposta pergunta se sabe nadar e a varivel terica sabe nadar?. Este
exemplo ilustra o tipo de problema que pode
acontecer em entrevistas, mas o problema no
se restringe a entrevistas.

Abordamos aqui as incertezas na atribuio de


valores nominais e abordaremos na prxima
seo incertezas em preciso e acurcia de
valores quantitativos. Terminamos esta seo
destacando que tambm os valores quantitativos podem ter incertezas de representatividade
conceitual. Por exemplo, o nmero de aes
agressivas registrados por dia pode no ser
representativo do nmero de aes agressivas
ocorridos por dia se os observadores no coincidirem sobre o que registrar como um comportamento agressivo. Portanto, sempre importante refletir bem sobre a possibilidade de erros
de atribuio comprometendo a interpretao
no seu estudo.

Por serem interpretaes, as atribuies nominais e ordinais sempre esto sujeitas a erros,
como na identificao de uma espcie, na determinao de qual doena um paciente teve,
ou no sentido de um sim dado por um entrevistado. importante definir cuidadosamente os
Critrios de Atribuio de Categorias (CAC),

31

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

3.3 Exatido, preciso e acurcia.


Uma
Uma medida um valor de uma propriedade de
uma entidade obtido com o uso de instrumentos, protocolos e procedimentos que podem ser
bons ou ruins em diferentes graus e aspectos
que sero tratados aqui. Imagine que voc
comprou um medidor de presso arterial digital
baratinho na farmcia. Chegando em casa, a
primeira coisa que voc faz medir a tua presso com o novo brinquedo. O resultado te assusta: presso alta, de 140:90 (mmHg sistlica:
diastlica), acima do ideal de aproximadamente 120:80. Ser que voc ter que ir ao mdico?
...ou ser que a medida que est errada?

Figura 3.3- Ilustrao sobre dois conceitos de incerteza


instrumental pela analogia com tiros de uma espingarda
(acima) e de um revolver (abaixo).

A EXATIDO de uma medida, na teoria, a


proximidade entre o valor obtido e o valor real.
Na prtica, uma medida considerada mais ou
menos exata conforme o procedimento (instrumento, protocolo, etc.) para obt-la for considerado mais ou menos exato. H dois aspectos
diferentes de incerteza que determinam a exatido instrumental: sua preciso e sua acurcia.

mentos de medida, como uma trena, no precisam de calibragem, outros, como balanas e
pHmetros, precisam de verificaes peridicas,
por isto, so vendidos junto com padres para
calibrao, como metais com pesos conhecidos.
Mas como faramos no caso do nosso aparelho
de medir presso? O ideal seria comparar algumas medidas deste aparelho com algumas
medidas com outro aparelho reconhecidamente
preciso e calibrado realizadas de forma alternada em curto espao de tempo. A mdia da diferena entre os dois aparelhos, digamos
10mmHg a mais no teu aparelho novo, a descalibragem, e deveria ser subtrada das suas
medidas.

A PRECISO de um instrumento/procedimento
o grau em que conseguimos com ele medidas
quantitativamente prximas entre si em condies estveis e homogneas. A primeira coisa
que faramos com nosso medidor de presso
seria repetir a medida vrias vezes. Para isto,
precisamos primeiro assumir que a tua presso
varia muito pouco nos poucos minutos do experimento, de forma que podemos desprezar a
variao natural da presso, e o esperado seria
vrias medidas iguais ou muito prximas se o
aparelho for muito bom.

Uma forma didtica de representar a preciso e


a acurcia atravs da analogia com tiros a um
alvo (Fig. 3.3). Quanto maior a preciso menor
a disperso dos valores. A preciso nos tiros ao
alvo com o instrumento espingarda (alvos
superiores) costuma ser alta comparada com a
baixa preciso com o instrumento revolver
(alvos inferiores) para o mesmo atirador
mesma distncia. O resultado que os tiros da
espingarda ficam mais concentrados que os do
revolver. Entretanto, a espingarda pode estar
desajustada (alvos direita), o que significa que
a mira precisa ser ajustada para obter maior
acurcia.

A ACURCIA de um instrumento/procedimento
o seu grau de ajustamento mdio em relao
ao valor real. Uma balana pode ter alta preciso, porque sempre d o mesmo resultado, mas
pode estar descalibrada e dar um resultado 15
gramas superior ao real em todas as medidas.
Um relgio de alta preciso atrasado 10 minutos
vai apresentar este erro por anos se no for
ajustado para o horrio correto. Alguns equipa-

32

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Preciso e a acurcia podem ser medidas (fig.


3.4). Note que no podemos distinguir se a falta
de exatido de um nico tiro (segmento 1) foi
por falta de preciso ou por falta de acurcia, ou
ambos, se no tivermos um conjunto de tiros.
Voc pode dizer que a espingarda da figura
anterior tem mais preciso que o revolver porque o tamanho do segmento entre os tiros mais
distantes (segmento 2) menor na espingarda
que no revolver. Voc pode dizer que a acurcia
da espingarda do lvo esquerdo da figura anterior maior quanto devido menor distncia
entre o centro do alvo e o centro dos tiros (segmento 3).

Figura 3.4- Representao de medidas relacionadas exatido:


1) desvio de um tiro (ou inexatido pontual); 2) impreciso de
uma espingarda (disperso de valores ou impreciso instrumental); 3) descalibragem ou tendenciosidade instrumental (inacurcia instrumental). A impreciso e a inacurcia so os dois aspectos da inexatido instrumental.

A medida da acurcia til para corrigir distores pela calibragem de armas e de equipamentos. Em equipamentos, como vimos acima,
comum haver padres para a calibragem, mas
ocasionalmente precisamos calibrar procedimentos de outras formas. Imagine que voc
tivesse que estimar visualmente tamanhos de
jacars distncia. Neste caso, voc pode calibrar esta capacidade estimando tamanhos de
objetos semelhantes a jacars (como troncos)
distncia e depois verificar como est se saindo
medindo os objetos com uma trena. Se tiver
tendncia a superestimar o tamanho, reduza
suas estimativas e se tiver tendncia a superestimar, aumente as estimativas. Se puder capturar jacars, conveniente repetir a avaliao
para melhorar a sua capacidade de estimar.
Ningum consegue acertar precisamente todas
as medidas, mas voc pode se considerar calibrado quando a quantidade de subestimativas
semelhante quantidade de superestimativas.

preciso, mais dispersos sero os dados ao


redor do valor central. A medida mais simples
de disperso a AMPLITUDE TOTAL, isto , a
diferena entre o maior e o menor valor (Fig.
3.5). Entretanto, uma medida que s serve
para comparar um nmero fixo de valores. Voc
no pode comparar a amplitude de 8 tiros de
um rifle com a amplitude de 80 tiros de outro,
pois a amplitude s tende a aumentar com o
nmero de tiros.
Uma medida de disperso melhor o
INTERVALO INTERQUARTIL, que a amplitude dos dados depois de excluir 25% dos valores
mais altos e 25% dos valores mais baixos. Esta

A medida da preciso importante para fabricantes de instrumentos, mas a maioria dos instrumentos tem uma preciso fixa, de forma que
ns, os usurios, no temos que nos preocupar
com ela no dia a dia, como ocorre com a calibragem. Entretanto, entender a medida de preciso importante porque nos ajuda a entender
a medida da variao (Fig. 3.4-2), que fundamental em estatstica.

Figura 3.5- Medio da preciso de um aparelho de medir


presso arterial por mltiplas medidas de presso em condies estveis. A Amplitude do Intervalo Interquartil,
obtido pela excluso de 25% dos valores inferiores e 25%
dos valores superiores uma medida melhor que a Amplitude Total porque no tende a aumentar com o nmero de
medidas.

A preciso costuma ser medida pelo seu inverso, a disperso dos valores. Quanto menor a

33

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

suficiente para as tuas anlises. Em outros casos, a preciso no to boa, mas ela pode ser
compensada por um tamanho amostral maior.
Embora o conhecimento sobre preciso seja
importante, ainda mais importante o conceito
de disperso de valores.

medida no se altera de forma tendenciosa em


funo do tamanho amostral. Esta forma de
medir a disperso relativamente pouco utilizada, na realidade, ela subutilizada, como veremos posterioremente.
Outra boa medida de disperso o DESVIO
ABSOLUTO MDIO, que a mdia das distncias entre cada valor e a mdia dos valores.
Repare que quanto maior a disperso dos
dados, maior a distncia mdia de cada ponto
do centro. Entretanto, a medida mais popular
de disperso o DESVIO PADRO, em que
as distncias entre os valores e a mdia so
elavadas ao quadrado, somadas, divididas
pelo tamanho amostral menos um e o resultado submetido raiz quadrada. Do ponto de
vista conceitual, o desvio padro semelhante ao desvio mdio absoluto}
O desvio padro realmente uma excelente
medida de disperso em muitas situaes,
especialmente na medida da preciso de instrumentos e de procedimentos, mas necessrio algum cuidado. Primeiro quanto ao nmero de valores usados em seu clculo. Bastam dois valores para um clculo de desvio
padro, mas clculos com menos que dez
valores so pouco precisos como medida de
disperso e com menos que cinco so muito
grosseiros. Alm disto, o desvio padro pode
no ser uma medida de disperso vlida dependendo da distribuio de frequncias da
varivel em questo, como veremos na prxima
seo.
Em resumo, na prtica, precisamos estar atentos para a acurcia de nossos procedimentos,
mas no to comum precisarmos avaliar a
preciso das medidas que utilizamos. Em algumas situaes, como no exemplo das estimativas de tamanhos dos jacars, a impreciso da
medida pode ser muito importante e merece
ateno especial. Entretanto, em muitos estudos, os procedimentos e instrumentos so plenamente satisfatrios, isto , sua impreciso
irrelevante em comparao variaes naturais
em estudo. Se sua planta cresce 10cm entre
cada medida, a preciso de 1 mm mais que

Quadro 3.1- A mdia aritmtica (1) um parmetro populacional utilizado em clculos de muitas medidas paramtricas.
Quando estimada com base em uma amostra, ela geralmente
simbolizada com um X ou um Y com uma barra encima. O
Desvio Absoluto Mdio (2) uma medida simples e intuitiva
de disperso. O Desvio Padro (3) uma medida bem mais
utilizada, com a mesma essncia do DAM. A frmula de DP
apresentada utilizada quando o determinamos com base em
uma amostra, que a situao mais comum. N= Tamanho
amostral; xi= cada valor registrado na amostra; = smbolo
matemtico de somatrio que significa que deve se somar os
termos a seguir na frmula. Curiosidade matemtica: a estatstica paramtrica utiliza estimativas inicialmente tendenciosas
que necessitam ajustes. o caso do desvio padro da amostra
com seu denominador (N-1). Por que no calculamos a mdia
dos desvios elevados ao quadrado com o denominador N? De
fato, no clculo de um desvio padro de um conjunto completo
de dados o denominador N. O problema que para determinar o desvio padro populacional com base em uma amostra
estaremos subestimando a disperso com o denominador N,
porque nossa mdia no a mdia real, mas uma estimativa
que necessariamente mais central ao conjunto de dados em
questo. Ao dividir por (N-1) temos um valor mais aproximado do DP da populao.

34

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

apenas dois nmeros, a mdia e o desvio padro. Nesta curva, aproximadamente 68% dos
dados esto a um desvio padro da mdia, 95%
a dois desvios e 99% a trs desvios padres.

3.4 Distribuies de frequncias


Quando temos diversos valores de uma varivel
quantitativa, uma forma muito eficiente de apresentar os dados um HISTOGRAMA. Em um
histograma o eixo x corresponde aos valores da
varivel quantitativa divididos em intervalos e o
eixo y corresponde frequencia de unidades
amostrais em cada um destes intervalos. Esta
frequencia em y pode ser a contagem dos casos, tambm chamada frequencia absoluta, ou
uma proporo do total de valores, tambm
chamada de frequencia relativa.

Quando a forma da curva lembra dois sinos


aproximadamente sobrepostos, temos uma
distribuio bimodal, pois h duas modas, isto
dois valores com frequencias mais altas. Um
exemplo de distribuio bimodal a altura de
adultos, pois h duas curvas sobrepostas, uma
para homens e uma para mulhes com modas
diferentes, pois as mdias variam com o sexo.
Repare que neste caso a mdia e o desvio padro j no descrevem bem a populao. Em
casos como este, pode ser melhor apresentar a
prpria distribuio de frequencia, ao invs dos
dois valores. Infelizmente, muito comum que
as pessoas calculem mdias e desvios padres
para caracterizar um conjunto de dados em
distrubuies que no correspondem a curvas
normais.

As DISTRIBUIES DAS FREQUNCIAS em


histogramas podem mostrar informaes muito
importantes. A forma da curva uma das informaes mais importantes. Uma das formas
mais comuns a DISTRIBUIO NORMAL (ou
distribuio Gaussiana), que tem o formato de
um sino. Quando a distribuio tem este formato, podemos resumir o conjunto de dados com

Figura 3.6- Duas distribuies de frequncia com formatos


diferentes. Na figura A, a distribuio tem o formato aproximado de um sino. Na figura B a distribuio fortemente
assimtrica. As amplitudes com 95% dos dados foram
determinadas com clculo paramtrico em (1) e por excluso de extremos em (2).

Figura 3.7- Exemplos grficos que ilustram modelos de


distribuies de probabilidades tericas. Estes modelos
servem como bases para utilizao de ferramentas estatsticas se podemos assumir que eles realmente so compatveis com a distribuio na populao.

35

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

H outras formas comuns de distribuio que


recebem nomes e que possuem modelos matemticos associados, como a curva Poison,
Log Normal e Uniforme. Entretanto, o formato
da curva tambm pode ser irregular e assim
mesmo muito informativo. Imagine que voc
apresentasse um histograma do tamanho de
jacars machos em uma lagoa. Ao analisar o
padro de distribuio dos dados, voc poderia
perceber uma curva aproximadamente bimodal
com muitos jovens pequenos e raros jovens de
tamanhos intermedirios e vrios adultos grandes. Um especialista poderia interpretar esta
forma dizendo que a falta de tamanhos intermedirios nesta lagoa pode ser um indcio que ai
os adultos matam os jovens. Este apenas um
exemplo hipottico para ilustrar que a distribuio de frequencias pode ser informativa tambm de fenmenos biolgicos, se voc souber
ler a forma da distribuio dos dados.

Figura 3.8- Quando temos uma distribuio normal, podemos determinar com base na mdia e no desvio padro
(DP), como os dados se distribuem e a proporo a cada
intervalo entre um, dois e trs desvios padres acima e
abaixo da mdia.

lidade for pequeno, os resultados dos mtodos


estatsticos ainda so confiveis, mas tudo tem
limite. Por exemplo, se voc estiver estudando
salrios de pessoas em um pais (Fig. 3.6), a
distribuio dos dados no ter a forma de uma
curva normal, j que muitas pessoas recebem
salrios baixos, poucas recebem salrios altos,
e algumas podem receber valores centenas de
vezes superiores mdia. O usurio de estatstica precisa saber o limite de segurana das
tcnicas que est utilizando.

Vamos voltar nossa curva normal. Este formato de curva muito importante em todas as
reas, e isto no diferente na Biologia. Na
Engenharia, ela muito utilizada para medir
preciso de instumentos, como discutimos na
seo anterior. Talvez em funo disto, esta
variao seja confundida frequentemente com a
idia de erro. importante ressaltar que na
Biologia esta variao raramente indica erro,
geralmente
indica principalmente uma
VARIAO NATURAL. Se voc medir a altura
de vrias pessoas, certamente haver um pequeno erro de medida, entretanto, a maior parte
da variao que vai encontrar variao natural, uma caracterstica biolgica relevante em
uma populao.

Em resumo. As distribuies de frequncia tm


importncia direta e indireta em estudos biolgicos. A importncia direta est na interpretao
de causas e consequncias do formato da distribuio. Por exemplo: a) uma distribuio bimodal (fig. 3.7) pode indicar uma seleo natural disruptiva em um carter biolgico; b) pirmides etrias so uma forma especial de histograma que revelam importantes caractersticas
de populaes, como o grau de desenvolvimento social de um pais. A importncia indireta est
em permitir a verificao de premissas para a
utilizao de determinadas ferramentas de anlise estatstica, como a validade de se utilizar a
mdia e o desvio padro para caracterizar um
conjunto de dados ou para verificar premissas
para a utilizao de certos testes estatsticos,
como veremos em outros captulos.

muito comum que a variao natural tenha


distribuio normal. Por exemplo, o tamanho de
animais adultos (inclusive humanos) de um
mesmo sexo em uma localidade tipicamente
possuem distribuio normal. Por causa disto,
foi criada toda uma srie de mtodos estatsticos (chamados mtodos paramtricos) para
lidar com valores com variveis que possuem
distribuio normal. O problema, que tambm
muito comum que a variao natural no siga
uma distribuio normal. Se o desvio da norma-

36

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

Os parmetros de variveis quantitativas envolvem contagens, como o nmero mdio de clulas brancas por campo em uma lmina de sangue, ou medidas contnuas, como o desvio
padro no tamanho (em m) de indivduos de
uma populao de Artemia salina. Note que as
contagens neste tipo de parmetro no so de
unidades amostrais, mas de algo que est em
cada unidade amostral. No exemplo da lmina
de sangue, a unidade amostral era campo e a
populao eram os campos daquela lmina.

3.5 Parmetros populacionais


Na Biologia, geralmente estamos mais interessados em caractersticas de populaes ou de
conjuntos de observaes ou eventos do que
em indivduos ou em eventos singulares. Algumas destas caractersticas so valores quantitativos denominados parmetros.
Quando temos um conjunto de valores (populao estatstica) com distribuio de frequncia
estatisticamente estvel, podemos estimar
apropriadamente alguns parmetros a partir de
subconjuntos representativos (amostras). Isto
muito til, j que raramente temos acesso a
toda a populao estatstica em que estamos
interessados em um estudo. Nesta seo sero
apresentados os parmetros populacionais mais
importantes. Os parmetros podem ser univariados (de contagem, de proporo, de variveis
ordinais, de variveis quantitativas) ou multivariados (de relao).

Os parmetros de variveis ordinais e de variveis quantitativas mais importantes so de trs


tipos: de tendncia central, de disperso e extremos. As trs medidas de tendncia central
principais so a mdia, a mediana e a moda. A
mdia comum (tambm chamada de mdia
aritmtica) a soma dos valores dividida pelo
nmero de observaes (a princpio no deveria
ser aplicado para variveis ordinais). A mediana
divide os valores ordenados pela metade. Por
exemplo, se colocarmos 25 valores em ordem
crescente, a mediana ser o 13 valor. A moda
o valor mais frequente quando os dados quantitativos esto agrupados em intervalos. A mediana geralmente considerada uma medida
mais apropriada de centralidade quando no
temos uma distribuio normal ou aproximadamente normal, entretanto, a mdia sempre
uma medida significativa para medidas quantitativas, mesmo na ausncia de normalidade, pois
reflete um aspecto de centralidade que a mediana no reflete.

Os parmetros de contagem so totais para


toda a populao, como nmero total de indivduos da populao estatstica (no confunda o
nmero de indivduos da populao com tamanho de uma amostra desta populao).
Os parmetros de proporo so contagens de
unidades amostrais de uma categoria divididos
por um total de unidades amostrais, como a
razo sexual de adultos e a taxa de sucessos
em um estudo sobre aprendizado (sucessos/
tentativas). Em variveis binrias s se apresenta um parmetro de proporo relevante (e.
g. razo sexual= machos/ total), pois o parmetro da outra categoria (fmeas/ total) seria redundante, de forma que voc pode escolher
qualquer um. Quando h mais de duas categorias em uma varivel, pode haver mais de um
parmetro relevante (e. g. azul/total, verde/total, amarelo/total). Embora isto possa ser
aplicado para categorias ordinais, normalmente
prefervel se usar outro parmetro que ser
apresentado adiante para esta escala.

Nas sees anteriores vimos medidas de disperso como o Desvio Padro e a Amplitude do
Intervalo Interquartil. Se a impreciso da medida
for pouco relevante em relao variao natural, estas medidas tambm so parmetros
populacionais (quando toda a populao foi
amostrada), ou estimativas de parmetros populacionais (quando o clculo foi feito por uma
amostra), pois a variao uma caracterstica
de uma populao.
Parmetros quantitativos extremos so o mximo e o mnimo populacional para uma varivel.
No nos referimos a mdias de mnimos ou de

37

A Conduo da Anlise 2014/2


Thierry R. Gasnier/ Universidade Federal do Amazonas

mximos, mas a estimativas de mnimos e mximos absolutos a partir de amostras. Sua determinao bem mais incerta e complexa do
que para medidas de centralidade e de disperso. Por este motivo, raramente so tratados
em cursos bsicos, entretanto, so parmetros
extremamente importantes. Por exemplo, precisamos ter estimativas do valor mximo da enchente de um rio para construirmos uma barragem segura.
Parmetros multivariados envolvem mais de
uma varivel ao mesmo tempo. Por exemplo, a
diferena nos tamanhos mdios de machos e
fmeas de ratos silvestres em uma populao
(parmetro de grau de dimorfismo sexual em
tamanho) ou a inclinao (coeficiente angular)
da reta que descreve a relao entre o peso de
indivduos uma populao de ratos silvestres e
a quantidade de recursos alimentares em sua
rea de vida (parmetro em um modelo matemtico). So parmetros, pois so caractersticas quantitativas relacionadas a estas populaes, e so importantes nos estudos de relaes. H anlises em que diversos parmetros
so determinados ao mesmo tempo, como em
equaes que descrevem a relao entre uma
varivel resposta e diversas variveis preditoras
(regresso mltipla).).

38