Você está na página 1de 222

Biologia

Bioestatstica
Lilian Giotto Zaros
Henrique Rocha de Medeiros
Bioestatstica
Natal RN, 2011
Biologia
Bioestatstica
Lilian Giotto Zaros
Henrique Rocha de Medeiros
2 Edio
COORDENAO DE PRODUO DE MATERIAIS DIDTICOS
Marcos Aurlio Felipe
GESTO DE PRODUO DE MATERIAIS
Luciana Melo de Lacerda
Rosilene Alves de Paiva
PROJETO GRFICO
Ivana Lima
REVISO DE MATERIAIS
Reviso de Estrutura e Linguagem
Eugenio Tavares Borges
Janio Gustavo Barbosa
Jeremias Alves de Arajo
Jos Correia Torres Neto
Kaline Sampaio de Arajo
Luciane Almeida Mascarenhas de Andrade
Thalyta Mabel Nobre Barbosa
Reviso de Lngua Portuguesa
Camila Maria Gomes
Cristinara Ferreira dos Santos
Emanuelle Pereira de Lima Diniz
Janaina Tomaz Capistrano
Priscila Xavier de Macedo
Rhena Raize Peixoto de Lima
Reviso das Normas da ABNT
Vernica Pinheiro da Silva
EDITORAO DE MATERIAIS
Criao e edio de imagens
Adauto Harley
Anderson Gomes do Nascimento
Carolina Costa de Oliveira
Dickson de Oliveira Tavares
Leonardo dos Santos Feitoza
Roberto Luiz Batista de Lima
Rommel Figueiredo
Diagramao
Ana Paula Resende
Carolina Aires Mayer
Davi Jose di Giacomo Koshiyama
Elizabeth da Silva Ferreira
Ivana Lima
Jos Antonio Bezerra Junior
Rafael Marques Garcia
Mdulo matemtico
Joacy Guilherme de A. F. Filho
IMAGENS UTILIZADAS
Acervo da UFRN
www.depositphotos.com
www.morguele.com
www.sxc.hu
Encyclopdia Britannica, Inc.
FICHA TCNICA
Catalogao da publicao na fonte. Bibliotecria Vernica Pinheiro da Silva.
Governo Federal
Presidenta da Repblica
Dilma Vana Rousseff
Vice-Presidente da Repblica
Michel Miguel Elias Temer Lulia
Ministro da Educao
Fernando Haddad
Universidade Federal do Rio Grande do Norte UFRN
Reitora
ngela Maria Paiva Cruz
Vice-Reitora
Maria de Ftima Freire Melo Ximenes
Secretaria de Educao a Distncia (SEDIS)
Secretria de Educao a Distncia
Maria Carmem Freire Digenes Rgo
Secretria Adjunta de Educao a Distncia
Eugnia Maria Dantas
Copyright 2005. Todos os direitos reservados a Editora da Universidade Federal do Rio Grande do Norte EDUFRN.
Nenhuma parte deste material pode ser utilizada ou reproduzida sem a autorizao expressa do Ministrio da Educaco MEC
Zaros, Lilian Giotto.
Bioestatstica / Lilian Giotto Zaros e Henrique Rocha de Medeiros. Natal: EDUFRN, 2011.
214 p.: il.
ISBN 978-85-7273-833-0
Contedo: Aula 1 O que bioestatstica. Aula 2 Como transformar dados em informaes.
Aula 3 - Descrevendo Sistemas. Aula 4 Elaborando hipteses. Aula 5 Testando hipteses. Aula 6
Anlise de varincia. Aula 7 Correlacionando informaes. Aula 8 Anlise de regresso. Aula 9
Entendendo os nmeros ndices e suas aplicaes. Aula 10 Probabilidade: conceitos e aplicaes.
Disciplina ofertada ao curso de Biologia a distncia da UFRN.
1. Bioestatstica. 2. Hipteses. 3. Probabilidade. I. Medeiros, Henrique Rocha de. II. Ttulo.
CDU 311
Z38b
Sumrio
Apresentao Institucional 5
Aula 1 O que Bioestatstica 7
Aula 2 Como transformar dados em informaes 25
Aula 3 Descrevendo Sistemas 43
Aula 4 Elaborando hipteses 65
Aula 5 Testando hipteses 83
Aula 6 Anlise de varincia 101
Aula 7 Correlacionando informaes 129
Aula 8 Anlise de regresso 147
Aula 9 Entendendo os nmeros ndices e suas aplicaes 173
Aula 10 Probabilidade:conceitos e aplicaes 193
5
Apresentao Institucional
A
Secretaria de Educao a Distncia SEDIS da Universidade Federal do Rio Grande
do Norte UFRN, desde 2005, vem atuando como fomentadora, no mbito local, das
Polticas Nacionais de Educao a Distncia em parceira com a Secretaria de Educao
a Distncia SEED, o Ministrio da Educao MEC e a Universidade Aberta do Brasil
UAB/CAPES. Duas linhas de atuao tm caracterizado o esforo em EaD desta instituio: a
primeira est voltada para a Formao Continuada de Professores do Ensino Bsico, sendo
implementados cursos de licenciatura e ps-graduao lato e stricto sensu; a segunda volta-se
para a Formao de Gestores Pblicos, atravs da oferta de bacharelados e especializaes
em Administrao Pblica e Administrao Pblica Municipal.
Para dar suporte oferta dos cursos de EaD, a Sedis tem disponibilizado um conjunto de
meios didticos e pedaggicos, dentre os quais se destacam os materiais impressos que so
elaborados por disciplinas, utilizando linguagem e projeto grco para atender s necessidades
de um aluno que aprende a distncia. O contedo elaborado por prossionais qualicados e
que tm experincia relevante na rea, com o apoio de uma equipe multidisciplinar. O material
impresso a referncia primria para o aluno, sendo indicadas outras mdias, como videoaulas,
livros, textos, lmes, videoconferncias, materiais digitais e interativos e webconferncias, que
possibilitam ampliar os contedos e a interao entre os sujeitos do processo de aprendizagem.
Assim, a UFRN atravs da SEDIS se integra o grupo de instituies que assumiram o
desao de contribuir com a formao desse capital humano e incorporou a EaD como moda-
lidade capaz de superar as barreiras espaciais e polticas que tornaram cada vez mais seleto o
acesso graduao e ps-graduao no Brasil. No Rio Grande do Norte, a UFRN est presente
em polos presenciais de apoio localizados nas mais diferentes regies, ofertando cursos de
graduao, aperfeioamento, especializao e mestrado, interiorizando e tornando o Ensino
Superior uma realidade que contribui para diminuir as diferenas regionais e o conhecimento
uma possibilidade concreta para o desenvolvimento local.
Nesse sentido, este material que voc recebe resultado de um investimento intelectual
e econmico assumido por diversas instituies que se comprometeram com a Educao e
com a reverso da seletividade do espao quanto ao acesso e ao consumo do saber E REFLE-
TE O COMPROMISSO DA SEDIS/UFRN COM A EDUCAO A DISTNCIA como modalidade
estratgica para a melhoria dos indicadores educacionais no RN e no Brasil.
SECRETARIA DE EDUCAO A DISTNCIA
SEDIS/UFRN
O que Bioestatstica
1
Aula
Aula 1 Bioestatstica 9
Apresentao
N
esta primeira aula, apresentaremos um breve histrico da Estatstica, suas subdivises
e como podemos utiliz-la no ramo das Cincias Biolgicas. Num segundo momento,
abordaremos o conceito de Bioestatstica e suas aplicaes, partindo para a retomada de
alguns conceitos vistos na disciplina de Matemtica e Realidade. Essa retomada essencial no
somente para a compreenso das aulas seguintes, mas tambm da disciplina como um todo.
Para compreender os assuntos que sero abordados nesta aula, necessrio que voc
leia atentamente os conceitos, que sempre sero acompanhados de exemplos aplicados s
Cincias Biolgicas.
Ao nal de cada tpico principal haver uma srie de exerccios propostos para voc
resolver, alm de exerccios j resolvidos. No nal da aula, haver uma autoavaliao para que
voc avalie a sua aprendizagem. Tenha sempre seu caderno em mos para que voc anote
suas dvidas e as encaminhe para ns o mais rpido possvel.
Objetivos
Conhecer a histria da Estatstica e identicar as situaes
onde ela pode ser aplicada.
Conhecer e distinguir as diversas fases do mtodo
estatstico.
Denir o que Bioestatstica.
Compreender os conceitos fundamentais para
o entendimento e aplicao da Bioestatstica.
Distinguir as tcnicas de amostragem para a escolha de
elementos que iro compor uma amostra.
1
2
3
4
5
Aula 1 Bioestatstica 10
O que Estatstica?
Para alguns, responder a essa pergunta muito fcil, mas para outros, que nunca ouviram
falar em estatstica, pode parecer algo impossvel de entendimento. Mas, mesmo sem saber,
voc j deve ter utilizado a estatstica no seu cotidiano. Vamos conferir?
Com a chegada da Copa do Mundo de 2010, muitas lojas iro fazer promoes de
televisores. Voc, consumidor, quer comprar uma TV e para saber qual delas tem o melhor
preo, inicia sua pesquisa de loja em loja, anotando os valores. Depois, em casa, compara os
preos, seleciona aquele mais em conta e se dirige at a loja para efetuar a sua compra. Nessa
situao, a estatstica esteve presente quando voc coletou os dados, extraiu as informaes
a partir da sua pesquisa e tomou as decises baseadas na sua coleta de dados.
Mas, alm do cotidiano, a Estatstica pode estar presente em qualquer disciplina de
qualquer curso, inclusive do curso de Cincias Biolgicas.
Mas voc deve estar se perguntando:
Em quais disciplinas e como?
B
em, se o professor da disciplina de Biodiversidade pedir para que voc faa um
levantamento de quais as espcies animais habitantes da caatinga esto ameaadas de
extino, voc estar utilizando um dos princpios da Estatstica, ou melhor, do mtodo
estatstico (que veremos a seguir), que o da coleta de dados. Mas se ele for mais alm, e pedir
para que voc ordene quais os animais mais ameaados de extino, a voc ter que fazer
um levantamento mais aprofundado, checar outras fontes, organizar e interpretar os dados e
apresentar os resultados ao professor. Nesse momento voc ainda estar utilizando a estatstica.
Percebeu como a Estatstica toma parte do nosso cotidiano e das disciplinas do Curso
de Cincias Biolgicas, por exemplo?
A Estatstica tem se mostrado um instrumento extremamente til na organizao
e interpretao dos dados, auxiliando na tomada de decises, alm de proporcionar uma
avaliao adequada de uma determinada situao, seja ela de origem biolgica ou no.
Aula 1 Bioestatstica 11
O papel da Estatstica quando estabelecida como cincia
Pois bem, inicialmente a Estatstica se preocupava em enumerar coisas e pessoas para
a avaliao das riquezas e cadastramento das propriedades de uma determinada cidade. Isso
aconteceu h milhares de anos atrs e atualmente acontece no Brasil a cada 10 anos.
Voc j deve ter recebido em sua casa um funcionrio do Instituto Brasileiro de Geograa
e Estatstica (IBGE), munido de um questionrio para avaliar sua condio de vida. Pois esse
questionrio, chamado de CENSO, que nos permite adquirir informaes sobre cada famlia
brasileira, e j era realizado em civilizaes muito antigas como a do Imprio Romano, da China
e do antigo Egito em 1000 a.C.
Hoje, com o passar dos anos, podemos constatar que o papel da Estatstica vai alm de
organizar e descrever fatos e/ou gerar informaes analisando um conjunto de dados coletados,
mas tambm auxiliar no:
1) Planejamento, auxiliando na escolha das situaes experimentais e na determinao da
quantidade de indivduos a serem examinados.
2) Na anlise dos dados, indicando tcnicas para resumir e apresentar as informaes, bem
como para comparar as situaes experimentais ou no.
3) Na elaborao das concluses, utilizando os vrios mtodos estatsticos que permitem
generalizar a partir dos resultados obtidos.
Fonte: <http://matematiques.sites.uol.com.br/pereirafreitas/1.1.2metodoestati
stico.htm>. Acesso em: 25 fev. 2010.
Estatstica a cincia que tem como objetivo orientar a coleta, o resumo, a
apresentao, a anlise e a interpretao dos dados coletados. E para isso, ela
se apia na utilizao do mtodo estatstico. O mtodo estatstico um processo
para se obter, apresentar e analisar caractersticas ou valores numricos para uma
melhor tomada de deciso em situaes de incerteza.
Aula 1 Bioestatstica 12
O mtodo estatstico apresenta as seguintes fases:
Denio do problema: Podemos ilustrar essa primeira fase do mtodo estatstico com a
pergunta: O que pesquisar? Nessa etapa voc deve conhecer o problema a ser pesquisado,
fazer as perguntas s quais quer que sejam respondidas com a sua pesquisa. Por exemplo:
A altura mdia dos alunos de cada semestre do Curso de Cincias Biolgicas.
Planejamento da pesquisa: Essa segunda etapa pode ser traduzida com a pergunta: Como
pesquisar? Assim, essencial que voc tenha clareza de como a pesquisa ser feita. Deve-se
tambm denir se voc utilizar a populao ou apenas uma amostra dessa populao, que
estudaremos logo a seguir. Utilizando o nosso exemplo acima, devemos planejar se vamos
estudar a altura de todos os alunos do Curso de Cincias Biolgicas ou somente dos alunos
do primeiro semestre, ou somente a altura dos homens.
Coleta dos dados: Podemos perguntar: O que coletar? Nessa etapa voc deve obter as
informaes de acordo com o que foi planejado na etapa anterior. Se o objetivo saber a altura
dos alunos de cada semestre do Curso de Cincias Biolgicas, voc deve iniciar as medies de
cada um dos alunos, anotando os valores obtidos, como exemplicados na tabela 1.
Tabela 1 Altura, em metros, dos alunos do 1, 2 e 3 semestres do Curso de Cincias Biolgicas
Altura dos alunos
do semestre 1 (m)
Altura dos alunos
do semestre 2 (m)
Altura dos alunos
do semestre 3 (m)
1,54 1,67 1,65
1,74 1,87 1,54
1,82 1,88 1,64
1,9 1,89 1,56
1,54 1,78 1,75
3,54 1,89 1,56
1,75 1,9 1,6
1,87 1,76 1,64
1,96 1,94 1,65
1,72 1,95 1,6
Alunos do
semestre 1
2
1,9
1,8
1,7
1,6
1,5
1,4
A
l
t
u
r
a

m

d
i
a

(
m
)
Alunos do
semestre 2
Alunos do
semestre 3
Aula 1 Bioestatstica 13
Crtica dos dados: Essa fase essencial para saber como anda a sua pesquisa. Pode-se lanar
a seguinte pergunta: Os dados esto coerentes? Voc deve observar criticamente os dados
coletados, para que, se detectado algum erro, este no seja repetido nas coletas futuras.
Se voc est medindo as alturas dos alunos de cada semestre do Curso de Cincias Biolgicas
e encontra uma medida de 3,54m, conforme apresentado em destaque na Tabela 1, pode ter
certeza que nessa hora, voc cometeu algum erro.
Apresentao: Nessa etapa voc dever apresentar os dados coletados aps eles serem
organizados. Uma vez os dados coletados, eles devem ser apresentados, seja atravs de
tabelas ou grcos, conforme apresentado no Grco 1, ou por meio de um texto escrito.
Grco 1 Altura mdia (m) dos alunos do primeiro, segundo e terceiro semestre do Curso de CinciasBiolgicas
Anlise e interpretao dos dados: Essa a etapa nal do mtodo estatstico, mas nem por
isso, a menos importante. Nessa fase voc deve descrever e analisar os dados pesquisados, e
chegar a uma concluso, ou seja, responder a sua pergunta inicial. No caso do nosso exemplo,
constatar qual a altura mdia dos alunos de cada semestre do Curso de Cincias Biolgicas.
As fases do mtodo estatstico, que incluem desde a denio do problema at
a apresentao dos dados, denominam-se Estatstica Descritiva, e a anlise e
interpretao dos dados constitui a Estatstica Inferencial, que ajuda a concluir
sobre um conjunto maior de dados (populaes) quando apenas parte desse
conjunto (as amostras) foi estudada.
Atividade 1
Aula 1 Bioestatstica 14
Com base no que voc viu at agora sobre o mtodo estatstico, faa uma pesquisa
na sua casa ou comunidade sobre algo que voc gostaria de saber (nmero de
pessoas da comunidade, nmero de pessoas com olhos claros, tipo de rvore da
sua regio, dentre outros) e, medida que voc for organizando sua pesquisa,
explicite quais as fases do mtodo estatstico que voc utilizou.
1
2
Atividade 2
Aula 1 Bioestatstica 15
Mas voc deve estar se
perguntando: E a Bioestatstica?
Agora que voc j sabe o que Estatstica, voc se arriscaria a elaborar uma denio para
Bioestatstica? simples! Considera-se Bioestatstica a aplicao dos mtodos estatsticos
para solucionar problemas biolgicos.
Pode parecer difcil para um aluno que no tem gosto pela Matemtica aprender
Bioestatstica. Mas ele deve adquirir algum conhecimento sobre essa disciplina, pois s assim
poder ter um ponto de vista objetivo sobre as tcnicas do mtodo cientco empregado nas suas
pesquisas e saber avaliar o grau de importncia da informao fornecida por essas tcnicas.
Aprender Bioestatstica tambm pode proporcionar que voc se familiarize com alguns
conceitos mais utilizados na rea. Alguns termos do vocabulrio comum tm signicado tcnico
e especco quando usados em Bioestatstica. E importante conhec-los.
Enm, sem despender muito tempo com clculos e demonstraes, pretendemos que
voc adquira os conhecimentos sucientes para tornar-se um usurio competente das tcnicas
estatsticas mais comuns que podem ser aplicadas nas Cincias Biolgicas.
Com base no que foi apresentado at aqui, escreva o que voc entendeu sobre o que
Bioestatstica e qual a sua importncia.
Procure, no seu cotidiano, duas utilizaes da Estatstica.
Aula 1 Bioestatstica 16
Retomando alguns
conceitos fundamentais
Alguns conceitos fundamentais para o entendimento e aplicao da Bioestatstica voc
j viu na disciplina de Matemtica e Realidade (Aula 2 A Estatstica: do senso comum ao
conhecimento cientco. Vamos retom-los?
Unidade experimental ou Unidade de observao
a menor unidade a fornecer uma informao. Podem ser pessoas, animais, plantas,
objetos. So aqueles indivduos submetidos a uma situao de experimento controlado, como
por exemplo, ratos de laboratrio colocados em um labirinto para estudar o comportamento
antes e aps a administrao de uma droga.
Populao
o conjunto de todos os elementos (pessoas, animais, plantas, objetos) que
apresentam, pelo menos, uma caracterstica comum e que pode ser observada, como por
exemplo, a populao de rvores de mandacaru do serto do Rio Grande do Norte.
Amostra
qualquer parte retirada de uma populao estatstica, ou seja, qualquer subconjunto
de uma populao. rvores de mandacaru do municpio de Currais Novos (RN).
Dados
So as informaes numricas ou no obtidas de uma unidade experimental ou de observao.
Quando se arma que as rvores de mandacaru tm 21 espinhos, os dados so 21 espinhos.
Varivel
alguma caracterstica que pode ser observada (contada ou medida) em uma populao
ou em uma amostra. O nmero de espinhos do mandacaru, a idade de uma pessoa e seus
1
Atividade 3
Aula 1 Bioestatstica 17
hbitos quanto ao fumo, a estatura de um jogador de basquete, a cor da pelagem dos animais,
o tipo de folha de uma planta constituem exemplos de variveis.
Entretanto, as variveis podem ser classicadas em quantitativas e qualitativas:
1) Variveis quantitativas: so aquelas cujos dados so valores numricos, como por exemplo,
a estatura das pessoas, o nmero de sementes de uma vagem, o nvel de colesterol no
sangue, o nmero de espinhos do mandacaru. As variveis quantitativas podem ainda ser:
a) Variveis quantitativas discretas: so aquelas em que os dados podem apresentar
somente determinados valores, no geral, nmeros inteiros, como por exemplo, o nmero
de lhos de um casal, o nmero de patas de um cavalo e o nmero de ptalas das ores.
impossvel dizer que um casal tem 2,3 lhos.
b) Variveis quantitativas contnuas: so aquelas em que os dados podem apresentar
qualquer valor dentro de um intervalo de variao possvel, como por exemplo, o peso de
uma pessoa (56,3 kg) e a altura de uma rvore (1,5 m).
2) Variveis qualitativas: so aquelas que fornecem dados de natureza no numrica, ou
seja, fornecem qualidade varivel, como por exemplo, a cor da semente das ervilhas, a
raa ou o sexo do animal. As variveis qualitativas podem ser:
a) Variveis qualitativas nominais: os nveis de respostas no admitem nenhuma ordem,
diferenciando uma categoria da outra, apenas pelo nome, por exemplo, o sexo dos animais,
ou fmea ou macho.
b) Variveis qualitativas ordinais: os nveis de respostas admitem ordem. No s
possvel identicar diferentes categorias, mas tambm reconhecer graus de intensidade
entre elas, possibilitando a sua ordenao. A cor da or do mandacaru, que pode ser
de branca vermelha; o nvel de intensidade de dor, que pode ser fraca, mdia, forte e
muito forte.
Explique com suas palavras o que voc entendeu por:
a) Populao:
2
Aula 1 Bioestatstica 18
b) Amostra:
c) Varivel:
Classique as variveis abaixo:
a) Cor do cabelo:
b) Nmero de patas de um coelho:
c) Nmero de clulas brancas no sangue:
d) Tipo sanguneo A, B, AB e O:
e) Tipo de folha de uma rvore:
f) Nmero de colnias de E. coli existente na gua mineral:
Aula 1 Bioestatstica 19
Utilizando as
amostras de uma populao
O
s experimentos so realizados com amostras de uma populao e no com toda
a populao e podemos apresentar duas razes para isso: A primeira, porque as
populaes nitas s podem ser estudadas atravs de amostras, como por exemplo,
um conjunto de alunos de uma escola em determinando ano, e a segunda, porque essas
populaes so muito grandes. Imagine sabermos o tipo sanguneo mais frequente dos
brasileiros? Levaramos muito tempo e teramos muito trabalho para realizarmos esses testes.
Fonte: <martabolshaw.blogspot.com/2008_03_01_archive.html>. Acesso em: 25 fev. 2010.
E se pegssemos apenas uma amostra dessa populao? O estudo cuidadoso de uma
amostra tem mais valor cientco do que o estudo de toda a populao. Por exemplo, para
estudar o efeito do or sobre a preveno da crie em crianas, melhor submeter uma
amostra de crianas a exames peridicos minuciosos, do que examinar rapidamente todas as
crianas antes e determinado tempo aps o uso do or. Dessa maneira no seria mais fcil,
e ao mesmo tempo constituiria de uma metodologia correta?
Aula 1 Bioestatstica 20
Como fazer para
escolher a amostra correta?
Quando trabalhamos com uma amostra da populao, utilizamos as tcnicas de
amostragem, isto , escolhemos o procedimento que vamos adotar para escolher os elementos
que iro compor a amostra.
Amostra casual simples
composta por elementos retirados ao acaso da populao. Todo elemento da populao
tem igual probabilidade de ser escolhido para compor a amostra. Vamos ver como?
Vamos supor que voc esteja no laboratrio de biologia vegetal e quer realizar um
experimento para avaliar os efeitos de diferentes quantidades de clcio (1mg, 3mg e 5mg)
no crescimento da planta. Para a realizao desse experimento temos 15 vasos de plantas,
nas mesmas condies de umidade, luz, temperatura, altura da planta e estado nutricional.
A pergunta : Quais vasos escolher para receber 1mg, 3mg e 5mg de clcio?
Nesse caso, fazemos um sorteio dos vasos, para que todos tenham a mesma chance de serem
escolhidos para receber diferentes quantidades de clcio.
Atividade 4
1
2
Aula 1 Bioestatstica 21
Amostra sistemtica
Os elementos so escolhidos por um sistema. Se no exemplo acima, voc escolhesse
somente os vasos listrados de preto, estaria organizando uma amostragem sistemtica.
Amostra estraticada
composta por todos os elementos originados de todos os estratos da populao.
Por exemplo: A populao de Natal (RN) composta por crianas, jovens, adultos e idosos.
Uma amostra estraticada tem que ter uma representao na mesma proporo das quatro
categorias acima citadas, ou seja, 10 crianas, 10 jovens, 10 adultos e 10 idosos.
Amostra de convenincia
formada por elementos que o pesquisador reuniu somente porque dispunha deles.
Se voc utilizar todos os vasos de plantas citados no primeiro exemplo, independente de um
critrio, esta amostra constituir numa amostra de convenincia. Entretanto, voc deve ter
muito cuidado ao utilizar esse tipo de amostra, pois os dados podem ser tendenciosos, no
revelando a realidade da situao.
Responda s questes abaixo de acordo com o que voc entendeu sobre amostras e
seus tipos.
Um pesquisador tem dez gaiolas. Cada uma delas contm seis ratos. Como esse
pesquisador pode selecionar dez ratos para compor sua amostra?
Dada uma populao de quarenta cajueiros, descreva uma forma de obter uma
amostra casual simples composta por seis cajueiros.
3
Aula 1 Bioestatstica 22
Organize uma lista com dez nomes de pessoas em ordem alfabtica. Depois descreva
uma forma de obter uma amostra sistemtica de cinco nomes.
Resumo
Nesta primeira aula, voc viu um breve histrico da Estatstica e como podemos
aplic-la nas Cincias Biolgicas. Estudou que, com o passar dos anos, o papel
da Estatstica se modicou, indo alm de organizar e descrever fatos e/ou
gerar informaes. Voc pode perceber que ela vem auxiliando na escolha das
situaes experimentais, na determinao da quantidade de indivduos a serem
examinados, na anlise dos dados, indicando tcnicas para resumir e apresentar
as informaes e na elaborao das concluses. Voc aprendeu a denio
de mtodo estatstico e todas as suas fases, desde a denio do problema,
passando pelo planejamento, coleta e crtica dos dados, at a apresentao,
anlise e interpretao dos dados. Estudou tambm a Bioestatstica, ou seja,
a aplicao da Estatstica nas Cincias Biolgicas, e retomou alguns conceitos
essenciais para o seu entendimento e aplicao, como a denio de populao,
amostra e varivel. Por m, viu que as tcnicas de amostragem constituem um
conjunto de procedimentos que vamos adotar para escolher os elementos que
iro compor a amostra que queremos analisar.
Autoavaliao
Nesta aula, voc deve ter percebido a importncia da Estatstica e da aplicao dos
mtodos estatsticos para solucionar problemas biolgicos. Feito isto, verique se voc
consegue responder, de maneira resumida, s seguintes perguntas:
1
2
Aula 1 Bioestatstica 23
Qual a nalidade e as fases do mtodo estatstico?
Conceitue populao e amostra, exemplicando.
Se voc conseguiu respond-las, suas respostas certamente contm os elementos
bsicos que voc dever ter apreendido deste contedo. Caso contrrio, retome os textos e
resolva as questes at que tais conceitos se estabeleam para voc como um conhecimento
bem estruturado.
Referncias
CALLEGARI-JACQUES, Sdia M. Bioestatstica: princpios e aplicaes. Porto Alegre: Artmed, 2003.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATSTICA IBGE. Disponvel em: <www.ibge.
gov.br>. Acesso em: 25 fev. 2010.
LOPES, Paulo Afonso. Probabilidades e estatstica. Rio de Janeiro: Ed. Reichman e Affonso
Editores, 1999.
SAMPAIO, Ivan Barbosa Machado. Estatstica aplicada experimentao animal. Belo
Horizonte: Ed. Fundao de Ensino e Pesquisa em Medicina Veterinria e Zootecnia, 1998.
VIEIRA, Sonia. Introduo bioestatstica. Rio de Janeiro: Campus, 1980.
Aula 1 Bioestatstica 24
Anotaes
Como transformar
dados em informaes
2
Aula
1
2
3
4
Aula 2 Bioestatstica 27
Apresentao
Nesta aula, estudaremos o conceito de dados e banco de dados. Veremos como criar
um banco de dados e, posteriormente, a transformar os dados em informaes. Inicialmente
faremos uma retomada dos principais conceitos vistos na Aula 1 O que Bioestatstica para
depois iniciarmos a apresentao dos novos conceitos sobre os dados.
Conceituado dados e banco de dados, estudaremos as diferenas entre dados e
informaes e aprenderemos a planejar uma coleta de dados. Por m, analisaremos os dados
coletados para que eles sejam apresentados em forma de tabelas, guras ou grcos, de
acordo com o objetivo da pesquisa.
Tenha em mos o seu material da Disciplina de Matemtica e Realidade, pois faremos a
reviso utilizando as Aulas 3 (A natureza dos dados estatsticos e sua organizao) e 4 (Grcos
estatsticos: uma sntese dos dados).
Bom estudo!
Objetivos
Conceituar dados e banco de dados.
Distinguir a diferena entre dados e informaes.
Estabelecer critrios para fazer uma coleta de dados.
Analisar os dados coletados.
Aula 2 Bioestatstica 28
Retomando alguns
conceitos da Aula 1
Antes de iniciarmos a nossa aula, conveniente voc relembrar o que uma unidade
experimental, uma varivel e como esta pode ser classicada (Aula 1 O que Bioestatstica).
Vamos denir o que so os dados?
Dados so denidos como informaes numricas (contnuas ou discretas) ou qualitativas,
obtidas de uma unidade experimental ou de observao.
No exemplo da Aula 1, quando se arma que as rvores de mandacaru tm 21 espinhos,
os dados so 21 espinhos. Podemos tambm citar o exemplo do consumidor que vai a vrias
lojas para fazer uma pesquisa de preo dos televisores. Nesse caso, os dados so os preos
das TVs que ele pesquisou.
Se compararmos os exemplos acima, podemos vericar que os dados podem ainda ser
classicados em:
Dados isolados, como o caso dos 21 espinhos de mandacaru, obtidos somente de
uma planta.
Conjunto de dados, como o caso dos diversos valores pesquisados pelo consumidor
antes de comprar a televiso. Nesse caso, para que esses dados transmitam alguma informao,
eles devem ser organizados.
Como organizar os dados?
Organizar o dado 21 espinhos de mandacaru relativamente fcil, sendo possvel at
anotar em um papel e guardar. Pronto, simples assim; desde que eu s queira estudar uma planta.
Mas, qual a relevncia deste dado (21 espinhos), se o objetivo do meu trabalho
determinar o nmero mdio de espinhos nos mandacarus em um jardim que tem 20 plantas?
Observe que, nesse caso, teremos que traar uma estratgia de planejamento e
organizao de trabalho, de modo que se possa ao nal:
1) Ter contado ou estimado o nmero mdio de espinhos de todas as plantas.
Unidade Experimetal
a menor unidade a
fornecer uma informao.
Podem ser pessoas,
animais, plantas, objetos.
Varivel
alguma caracterstica
que pode ser observada
(contada ou medida) em
uma populao ou em
uma amostra.
Classicao
das variveis
Quantitativa (discreta ou
contnua) e qualitativa
(nominal ou ordinal).
Atividade 1
1
2
Aula 2 Bioestatstica 29
2) Conseguir lembrar ou guardar esses nmeros, a m de que, se outro indivduo precisar
recomear ou continuar o trabalho, possa repetir o mesmo e chegar a resultados semelhantes.
Nesse momento, quando nos deparamos com uma quantidade maior de dados a serem
coletados para posterior anlise, precisamos organiz-los em um banco de dados.
Diferencie dados e banco de dados.
Cite alguns exemplos de dados quantitativos e qualitativos que fazem parte do
seu cotidiano.
Aula 2 Bioestatstica 30
Banco de dados
Um banco de dados um conjunto de registros (de nmeros ou variveis qualitativas)
com uma estrutura regular que permite a reorganizao e insero desses registros de
forma sistemtica, com a nalidade de se gerar informaes.
Pode ser a agenda do seu telefone celular, a lista telefnica, o seu caderno de anotaes
e at um conjunto de dados organizados em uma planilha de Excel.
Sim, isso mesmo! Mas desde que esses dados sejam organizados de forma sistemtica.
Veja o exemplo a seguir:
Situao problema 1: Como posso fazer a identicao das principais espcies
vegetais de uma rea de caatinga na reserva orestal do meu municpio?
Para resolver esse problema, devemos primeiro deixar bem claro:
1) Qual o objetivo da pesquisa?
Identicar as principais espcies vegetais numa determinada rea de reserva
orestal do municpio onde moro.
2) O que fazer para alcanar esse objetivo?
Identicar e contar o nmero de individuos presentes em cada uma das reas
de caatinga do municpio. Note que no objetivo esto espcies vegetais, isto
inclui rvores, arbustos, cactceas, gramneas e leguminosas, independente de
seu tamanho.
Feito isso, voc pode partir para o prximo passo:
3) Identicar e classicar as variveis a serem estudadas:
As variveis so as espcies vegetais. Neste exemplo, trata-se de uma varivel
numrica e discreta, pois sero dados de contagem (Caso haja dvidas, volte para
a Aula 1 O que Bioestatstica e leia a denio de variveis e seus tipos).
Agora, como posso denir o mtodo de amostragem j que impossvel contar
todas as espcies vegetais da rea? Para isso devemos fazer a seguintepergunta:
4) Quantas amostras eu vou precisar colher, para fazer essa determinao?
Existem vrios mtodos para fazer essa determinao, neste caso o mais
recomendado fazer uma reviso de literatura e procurar identicar o mtodo
mais adequado. Para este caso especco do exemplo, podemos denir que
Forma sistemtica
Forma organizada de
dispor os dados, seguindo
algum critrio. Por
exemplo: ao arrumar suas
camisetas no armrio voc
as ordena pela cor.
Parcela de 4m
2

contendo todas as
plantas a serem
contadas
L1 L2 L3 L4
L5 L6 L7 L8
L9 L10 L11 L12
Aula 2 Bioestatstica 31
Figura 1 rea experimental e respectiva parcela de 4m
2
Na Figura 1, em cada subunidade ser reservada uma parcela com 4m
2
de rea
para identicao e contagem do nmero de plantas de caatinga.
Depois de coletados os dados, veja, na tabela a seguir, como cou a sua organizao.
Tabela 1 Levantamento tossociolgico de uma rea de caatinga
Ordem Nome Popular Espcie Nmero de indivduos
1 Angico Piptadenia macrocarpa 4
2 Bambural Hyptis suaveolans (L.) Poit 1375
3 Carrapicho Agulha Bidens sp 37
4 Catingueira Caesalpinia pyramidalis Tul 2
5 Jitirana Merremia aegyptia L. 4
6 Malva Sida cordifolia L. 135
7 Manda Pulo Croton sp. 249
8 Marmeleiro Croton hemiargyreus 8
9 Mata Pasto Senna obtusifolia 13
10 Melosa Ruellia asperula 54
11 Milh Brachiaria plantaginea 90
12 Mofumbo Combretum leprosum Mart. 13
13 Moror Bauhinia cheilantha 2
14 Pau Branco Auxemma oncocalyx 4
15 Sabi Mimosa caesalpiniifolia 1
16 Tiririca Cyperus sp 3
17 Urtiga Fleurya aestuans L. 11
Viu como fcil? Agora, que tal extrair uma informao desse conjunto de
dados? Identique a espcie vegetal que apresenta o maior nmero de indivduos
(plantas) na rea amostrada.
sero avaliados 12 locais diferentes (L1, L2, L3, L4, L5, ... ,L12) e em cada um
destes locais sero coletadas amostras de parcelas de 4m
2
(Figura 1). Em cada
parcela, todas as plantas encontradas sero identicadas pelo nome comum e
o cientco e contadas.
Atividade 2
Aula 2 Bioestatstica 32
Vamos tomar algumas medidas de biometria com seus conhecidos? Selecione um grupo
de 25 indivduos (podem ser pessoas da sua famlia, amigos, alunos, colegas de trabalho, da
igreja e/ou de prtica de esportes) e organize uma tabela com os seguintes dados: primeiro
nome, idade, sexo, altura e peso de cada um deles, utilizando a tabela a seguir.
Primeiro nome Idade Sexo Altura Peso
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Biometria
Estudo das caractersticas
biolgicas quantitativas de
uma populao.
Aula 2 Bioestatstica 33
Diferenciando os conceitos:
dados x informaes
Para discutir o conceito de informaes, vamos partir da seguinte situao:
Uma lista telefnica (seja de celular ou papel) um conjunto de dados, organizados em
funo de alguma varivel como, por exemplo, o nome e/ou endereo. Quando voc precisa
ligar para uma pessoa, cujo telefone no se lembra, o que voc faz? Certamente, uma pesquisa/
anlise no conjunto de dados da lista a m de obter a informao desejada: o telefone da pessoa.
Analisando essa situao, podemos denir informao como: o conhecimento obtido
atravs da interpretao do signicado dos dados (HOUAISS; VILLAR; FRANCO, 2001).
Alis, um dicionrio da lngua portuguesa nada mais que um conjunto de dados, organizados
de forma sistemtica (normalmente em ordem alfabtica), no qual podemos obter informaes
sobre a ortograa correta, signicados, sinnimos e antnimos de palavras.
Uma curiosidade...
Se, na minha lista telefnica, eu no encontrar o nmero de telefone da pessoa
que procuro ou se ele no for o correto, ainda assim isso uma informao?
Sim, s que nesse caso o seu banco de dados (agenda do telefone) no serviu
para responder o seu questionamento. Por esse motivo, a informao obtida foi:
voc no tem o nmero do telefone da pessoa.
Neste caso, se realmente desejar falar com ela, voc vai precisar conseguir a
informao correta em outra fonte de dados, que pode ser a lista telefnica, um
colega, etc.
Nessa situao importante para lembrar que nem sempre o nosso conjunto
de dados vai permitir obter a informao necessria e/ou correta. So vrios os
fatores que podem resultar nesse problema, dentre eles podemos citar problemas
na amostragem (nmero insuciente e/ou amostras tendenciosas que conduzem
a concluses inverdicas) e erros na coleta e/ou no processamento dos dados.
Atividade 3
Aula 2 Bioestatstica 34
Na tabela construda na Atividade 2, conte o nmero de pessoas do sexo masculino e do
feminino que tem mais de 1,55m de altura e pesa mais que 68kg.
Planejando a coleta de dados
Lembra que agora a pouco vimos que h vrios fatores que podem resultar no fato de
um dado no fornecer nenhuma informao ou fornecer informaes erradas? Esse fato foi
exemplicado pelo caso de no acharmos o telefone procurado ou acharmos o telefone e este
estar errado.
Para que isso no ocorra, importante planejar e traar uma estratgia para realizar
a coleta de dados. Essa estratgia de planejamento da Coleta de Dados composta por:
Observao dos tens do mtodo estatstico (mencionada na Aula 1): Nessa primeira
fase voc deve seguir as etapas do mtodo estatstico, que so: (1) Identicao do problema
e (2) Formulao de hipteses. Conhecendo esses dois tens, entre outras coisas, possvel:
Identicar e classicar as variveis adequadas e necessrias para a pesquisa. Isso
importante para que voc possa organizar as tabelas em funo do tipo de resposta
esperada (ex.: sim ou no; presente ou ausente; espao para nmero ou texto) para cada
varivel estudada.
Traar uma estratgia de ao que permita coletar, organizar e processar os dados de
forma precisa e correta. Assim, pode-se evitar desperdcio de tempo anotanto informaes
que no sero teis e adequando as condies para coletar os dados e a necessidade do
trabalho. Desse modo, pode-se evitar erros na anotao ou processamento dos dados.
Um exemplo disso pde ser observado na realizao do censo agropecurio 2006, no
qual os entrevistadores utilizaram palmtops para coletar os dados. Assim, diminui a chance
de ocorrer erros durante o processamento dos questionrios, por erros de leitura. Entretanto,
os erros de coleta de dados podem acontecer na hora da anotao dos questionrios por
resposta imprecisa do entrevistado.
PLANEJAMENTO DA COLETA DE DADOS
Observao das fases do mtodo estatstico
ETAPA OPERACIONAL
Determinar o nmero de pessoas da equipe
Realizar treinamento para a coleta dos dados
Providenciar material necessrio
Organizar o trabaho no local da coleta
Verificar o modo de armazenamento e
transporte do material coletado
Identifcao do
problema
Formulao de
hipteses
Aula 2 Bioestatstica 35
Alm disto, importante antes de sair para coletar os dados, vericar:
Quantas pessoas sero necessrias para realizar o trabalho.
Se existe material de coleta disponvel (por exemplo: lpis e papel, frascos para armazenar
amostras etc.) para todo o trabalho.
Se necessrio realizar treinamento antes de iniciar o trabalho.
Como as amostras coletadas podem ser armazenadas e transportadas.
Se a amostra utilizada representativa da populao.
Como ser realizado o trabalho de coleta.
Tendo como exemplo a Tabela 1, para fazer a coleta de dados de quais as espcies vegetais
e o nmero de plantas em cada parcela, precisamos de: ta mtrica para demarcar o permetro
da rea amostral; lpis e papel para fazer anotar o nome comum (popular), o cientco e
a quantidade de indivduos de cada espcie. Alm disso, para esse trabalho especco
importante levar na equipe uma pessoa que conhea a ora regional e saiba identidicar as
plantas. Em caso de dvidas, interessante tambm ter recipientes adequados para coletar
amostras e levar para o biotrio, a m de fazer identicao correta da espcie.
A Figura 2 rene as principais etapas do planejamento da coleta de dados.
Figura 2 Principais etapas do planejamento da coleta de dados
Fonte: Henrique Rocha de Medeiros
Atividade 4
Aula 2 Bioestatstica 36
Elabore um plano para a coleta de dados idade, peso e altura de todas as pessoas da
cidade onde voc mora.
Aula 2 Bioestatstica 37
A opo de organizar os dados em linhas ou colunas vai depender da preferncia denida
antes de iniciar o trabalho de coleta. Todavia, esta deve sempre possibilitar a soma ou contagem
de dados correspondentes mesma varivel seguindo uma nica sequncia de linhas ou colunas.
Alm disso, a sistematizao das informaes em planilhas facilita ainda a elaborao
de tabelas (ver Tabela 1 Levantamento tossociolgico de uma rea de caatinga) e grcos
para anlise dos dados.
H vrios tipos de grcos, e a escolha de qual utilizar vai depender do tipo de dados
existentes, da necessidade e familiaridade com as informaes. Utilizando os dados do nosso
exemplo, escolhemos apresent-los em forma de grco de barras, mais adequado para o
tipo de dados que temos (Figura 4).
Anlise grca de conjunto de dados
Como dito anteriormente, um conjunto de dados s poder ser transformado em
informao se, com ele, for possvel realizar alguma anlise e interpretao dos seus resultados.
Assim, podemos estabelecer alguns mecanismos de classicao para o conjunto de dados.
Uma das ferramentas que possibilitam essa organizao sistematizada so as planilhas
(Figura 3), isto , um conjunto de dados organizados em linhas e colunas, que podem ser
preenchidas manualmente ou em computadores (planilhas eletrnicas).
Figura 3 Exemplo da planilha com linhas e colunas feita em computador. Os dados apresentados so referentes
ao exemplo utilizado na aula
Fonte: Henrique Rocha de Medeiros
Espcies encontradas
N

m
e
r
o

d
e

i
n
d
i
v

d
u
o
s

d
e

c
a
d
a

e
s
p

c
i
e
Angico
Bambural
Carrapicho
Agulha
Catingueira
Jitirana
Malva
Manda
Pulo
Marmeleiro
Mata
Pasto
Melosa
Milh
Mofumbo
Moror
Pau
Branco Sabi Tiririca
Urtiga
0
200
400
600
800
1000
1200
1400
1600
Nmero de
indivduos
Levantamento tossociolgico de espcies encontradas numa rea de Caatinga
Aula 2 Bioestatstica 38
No existe um tipo mais correto de grco, todavia importante que eles permitam
a interpretao rpida e o entendimento dos resultados e, alm disso, que respeitem as
normas para a elaborao de grcos e tabelas, como visto nas Aulas 3 e 4 da disciplina
Matemtica e Realidade.
Exerccio resolvido 1
Utilizando as informaes da Tabela 1 (Levantamento tossociolgico de uma rea de caatinga),
indique quantas espcies foram identicadas e qual o total de plantas contadas.
Resoluo
Nessa tabela, os dados referentes a cada espcie (observe que os nomes
cientcos no se repetem) esto organizados em linhas. Assim, observando-se
a tabela pode-se aferir que foram identicadas 17 espcies. O nmero total de
plantas contadas pode ser obtido somando-se o nmero de indivduos de cada
espcie (4 + 1375+ 37+...+1+3+11 = 2005).
Figura 4 Identicao e quanticao das espcies vegetais encontradas numa rea de caatinga na Regio Nordeste do Brasil
Fonte: Henrique Rocha de Medeiros
Aula 2 Bioestatstica 39
Resoluo
Observando-se os resultados da tabela pode-se identicar que o bamburral, o
manda pulo e a malva, com respectivamente 1.375, 249 e 135 indivduos cada,
so as espcies vegetais que tm o maior nmero de plantas na rea estudada.
Essa mesma resposta pode ser obtida, analisando-se a Figura 4: Identicao
e quanticao das espcies vegetais encontradas numa rea de caatinda na
Regio Nordeste do Brasil.
Resumo
Voc estudou o conceito de dados e banco de dados e aprendeu como criar
um banco de dados para, posteriormente, transform-lo em informaes. Voc
retomou os principais conceitos vistos na Aula 1 O que Bioestatstica tais
como, unidade experimental, varivel e classicao de variveis. Voc estudou
as diferenas entre dados e informaes e aprendeu que, para que dados sejam
transformados em informaes, precisa planejar sua coleta de forma a evitar
erros. Para isso, utilizou-se as duas primeiras etapas do mtodo estatstico:
(1) Identicao do problema e (2) Formulao de hipteses. Voc estudou
tambm algumas aes que fazem parte do planejamento da coleta de
dados, como conhecer o local da coleta, formar uma equipe de coleta, levar
material necessrio, dentre outros. Aprendeu que os dados coletados podem
ser organizados em planilhas eletrnicas feitas em computador, o que facilita
posterior anlise e interpretao. Por m, relembrou as formas de apresentao
dos dados, como por exemplo, em tabelas e grcos.
Nesse caso, a opo pela tabela ou pelo grco se dar em funo da necessidade de
informao. Se o objetivo for apenas identicar as espcies com maior nmero de indivduos,
possivelmente o grco ser a melhor alternativa. Entretanto, se a quanticao necessria,
a organizao da tabela em funo do nmero de indivduos poder facilitar o trabalho.
Exerccio resolvido 2
Ainda utilizando as informaes da Tabela 1, identique as trs espcies que tem mais
indivduos na amostra estudada. Nesse caso, a mesma resposta pode ser obtida analisando a
tabela ou construindo grcos como pde ser observado.
1
Aula 2 Bioestatstica 40
Autoavaliao
A dengue uma doena grave, que est disseminada em todo o territrio nacional.
Ento, que tal por em prtica os conceitos da aula de hoje, transformando os dados sobre
essa epidemia em informao?
Para isto analise os dados que foram retirados de um texto extrado da pgina da Secretaria
de Sade Pblica (SESAP/RN) na internet.
<http://www.rn.gov.br/contentproducao/aplicacao/govrn/imprensa/enviados/noticia_detalhe.
asp?nImprensa=0&nCodigoNoticia=17319>:
A Secretaria Estadual de Sade Pblica, por meio do Programa de Controle da Dengue,
divulgou nesta segunda-feira (14/12/2009) o boletim de acompanhamento epidemiolgico da
dengue. Desde janeiro deste ano foram noticados 3.577 casos da doena no Rio Grande do
Norte. Destes, 17 foram de Febre Hemorrgica de Dengue (FHD), alm de trs bitos ocorridos.
Em relao ao mesmo perodo do ano anterior (2008) quando foram noticados 43.552, houve
uma reduo nos casos. Na regio metropolitana da Capital (que inclui os municpios de Natal,
Macaba, So Gonalo e Extremoz) foram noticados 1.724 casos de dengue. Em Natal, foram
noticados 1.235 casos de dengue, dos quais 13 de FHD. J em Mossor, 370 pessoas foram
acometidas por esta enfermidade (dengue) e 07 apresentaram FHD.
Agora, utilizando os dados acima e:
Construa uma tabela com o nmero de casos noticados da doena no ano de 2009
em todo o estado do Rio Grande do Norte, na Regio Metropolitana da capital, em
Natal e em Mossor.
2
3
Aula 2 Bioestatstica 41
Calcule a porcentagem de casos ocorridos no municpio de Natal em relao ao
restante do estado, analisando os dados da tabela elaborada na questo 1.
Analise os dados e calcule a reduo do nmero de casos noticados de dengue em
2009 em relao ao ano anterior (2008), quando foram noticados 43.552 casos
dessa enfermidade.
Se voc conseguiu resolver o exerccio acima, parabns! Caso contrrio, entre em contato
com o seu professor, retorne ao texto da aula, reveja os principais conceitos, volte atividade
de autoavaliao e tente quantas vezes forem necessrias.
Referncias
HOUAISS, Antonio; VILLAR, Mauro de Sales; FRANCO, Francisco Manoel de Mello. Dicionrio
Houaiss da lngua portuguesa. Rio de Janeiro: Editora Objetiva, 2001.
LOPES, Paulo Afonso. Probabilidades e estatstica. Rio de Janeiro: Ed. Reichman e Affonso
Editores, 1999.
OTT, Lyman; MENDEENHALL, William. Understanding statistics. Boston: PWS-KENT Publishing
Company, 1990.
SAMPAIO, Ivan Barbosa Machado. Estatstica aplicada experimentao animal. Belo
Horizonte: FEP MVZ Editora, 1997.
Aula 2 Bioestatstica 42
Anotaes
Descrevendo Sistemas
3
Aula
1
2
3
Aula 3 Bioestatstica 45
Apresentao
N
esta aula, estudaremos as aplicaes da estatstica descritiva nas Cincias Biolgicas.
Para isto, utilizaremos dados de sistemas biolgicos para calcular a mdia, varincia,
desvio padro, moda e mediana e veremos como obter informaes com este tipo
de anlise estatstica. Desse modo, ser importante que voc tenha uma boa compreenso
dos conceitos vistos na Aula 1 O que Bioestatstica e Aula 2 Como transformar
dados em informaes. As anlises que aqui sero realizadas tero como base os conceitos
apreendidos nessas aulas.
Objetivos
Distinguir os conceitos de estatstica descritiva e suas
aplicaes em Cincias Biolgicas.
Aplicar a estatstica descritiva para realizar anlises de
conjuntos de dados.
Avaliar os resultados da anlise dos dados, de modo
a poder caracterizar corretamente a amostra e poder fazer
inferncias sobre a populao.
Aula 3 Bioestatstica 46
Medidas de tendncia central
As medidas de tendncia central indicam um ponto, em torno do qual, se distribuem
ou concentram os nmeros do conjunto de dados. Este tende a estar localizado no centro
da distribuio dos dados. As principais medidas de tendncia central so a mdia, a moda e
a mediana, que estudaremos a seguir.
Mdia
A mdia de um conjunto de nmeros pode ser denida como um valor que representa
o total desse conjunto, sem alterar as suas caractersticas. Esta medida (mdia) um valor
de equilbrio do conjunto de dados.
Se o conjunto de dados obtido de uma populao, utiliza-se a letra grega
(pronuncia-se mi) para representar a mdia. Quando o conjunto de dados obtido de uma
amostra da populao, utiliza-se o smbolo x
_
(pronuncia-se x barra).
Calculando mdias e suas aplicaes
A mdia aritmtica (x
_
) de um conjunto de dados calculada pela soma de todos os dados
dividida pelo nmero deles. A representao matemtica do clculo da mdia a seguinte:
x =

x
n
onde:
x = somatrio de todos os valores de x
n = a quantidade de valores
Exerccio resolvido 1
Um aluno tirou as notas: 0, 2, 4, 6 e 10, em cinco provas. Calcule a mdia das notas
desse aluno.
Aula 3 Bioestatstica 47
Resoluo
1) Primeiro devemos somar (x) todos os valores da cada prova: 0 + 2 + 4 +
6 + 10. O resultado 22.
2) Depois identicamos o n, ou seja, como so 5 notas, temos n = 5.
3) Por m, divide-se a soma 22 por 5 (22/5) e obtm-se a mdia 4,4.
4) Conclui-se que o aluno teve mdia 4,4.
Exerccio resolvido 2
Calcule a mdia geral das notas da turma de 25 alunos, de acordo com os dados
apresentados na Tabela 1.
Tabela 1 Resultado da avaliao (nota) de uma turma com 25 alunos
Nmero de alunos Nota
5 5
8 7
9 8
3 10
Resoluo
Neste caso, voc pode resolver a questo (e encontrar a mdia geral da turma)
de duas maneiras:
1) Somando todas as notas (x) obtidas pelos alunos (5 + 5 + 5 + 5 + 5
+ 7 + 7 + 7 + 7 + 7 + 7 + 7 + 7 + 8 + 8 + 8 + 8 + 8 + 8 + 8 +
8 + 8 + 10 + 10 + 10) que d x = 183 e dividir o valor encontrado pelo
nmero (n) de alunos que n = 25. Assim, o clculo da mdia da turma
obtido pela diviso 183/25, cujo resultado 7,32.
2) O mesmo resultado de mdia (7,32) pode ser obtido se voc multiplicar a nota
pelo nmero de alunos que tiraram a respectiva nota e zer o somatrio de
todos os resultados, da seguinte maneira: (5*5) + (8*7) + (9*8) + (3*10) = 183.
Assim, se dividirmos 183 por 25 obteremos o mesmo resultado para o clculo
da mdia geral da turma, ou seja, 7,32.
(5*5) + (8*7) + (9*8)
+ (3*10)
5*5 = 5+5+5+5+5;
8*7 =
7+7+7+7+7+7+7+7;
9*8 =
8+8+8+8+8+8+8+8+8
e 3*10 =10+10+10
Atividade 1
Aula 3 Bioestatstica 48
Calcule a mdia para os seguintes conjuntos de dados:
a) A altura (em cm) de plantas submetidas a tratamento com hormnio de
crescimento: 12,5cm; 12,6cm; 12,9cm; 13,5cm; 13,7cm; 12,7cm; 13,6cm.
b) Nmero de movimentos respiratrios por minuto (mpm) de cobaias de
laboratrio aps a administrao de um anestsico intravenoso: 12 mpm;
14 mpm; 13 mpm; 14 mpm; 15 mpm; 16 mpm; 16 mpm; 15 mpm; 13 mpm.
c) Nmero de salrios mnimos recebidos pelos trabalhadores de um
laboratrio de anlises clnicas: 5 salrios mninos; 4 salrios mninos;
4,5 salrios mninos; 6 salrios mninos; 5,5 salrios mninos; 8 salrios mninos;
6 salrios mninos; 6,5 salrios mninos.
Aula 3 Bioestatstica 49
Mediana e moda
A
anlise da mdia deve reetir o conjunto de dados. Todavia, este clculo pode ser
afetado por medidas muito discrepantes (muito altas ou muito baixas em relao ao
valor mdio). Quando isto acontece, a mdia calculada no representa adequadamente o
que acontece no conjunto de dados. Para estas situaes o clculo da mediana e/ou da moda
pode ser uma alternativa adequada para descrever o conjunto de dados.
A mediana (cujo smbolo md) o valor que ocupa a posio central; esta medida divide
o conjunto de dados em duas metades iguais. Para calcular a mediana, organize o seu conjunto
de dados em ordem crescente e encontre o valor que est no centro da srie.
Quando o nmero de dados for mpar a mediana ser o valor que est no centro da
srie. Quando o nmero de dados for par, a mediana ser a mdia dos valores que esto no
centro da srie.
Exerccio resolvido 3
Vamos descobrir a mediana do conjunto de dados utilizado para o clculo das mdias
do Exerccio resolvido 2?
Para isso devemos:
1) Organizar o conjunto de dados em ordem crescente. Assim procedendo, obtemos:
Valor 5 5 5 5 5 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 10 10 10
Posio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
2) Note que temos 25 nmeros. Esse valor mpar, e desse modo, a mediana ser o valor
que divide esse conjunto. Neste caso, a mediana corresponder ao nmero que est na
posio 13 (nmero 7), pois este dividir o conjunto de dados em duas metades iguais,
com 12 dados (nmeros) cada um, como se pode observar abaixo:
Conjunto 1 com os 12 primeiros valores (anteriores a mediana)
Valor 5 5 5 5 5 7 7 7 7 7 7 7
Posio 1 2 3 4 5 6 7 8 9 10 11 12
Mediana
Valor 7
Posio 13
Conjunto 2 com os 12 ltimos valores (posteriores a mediana)
Valor 8 8 8 8 8 8 8 8 8 10 10 10
Posio 14 15 16 17 18 19 20 21 22 23 24 25
1
2
Atividade 2
Aula 3 Bioestatstica 50
interessante utilizar essa medida quando se estuda um grande conjunto de dados,
onde existe muita discrepncia entre eles. Neste caso, a mediana pode ser uma medida mais
representativa que a mdia.
J a moda (cujo smbolo mo) representa o valor que ocorre com maior frequncia no
conjunto de dados.
Analisando-se o conjunto de dados do Exerccio resolvido 2, observa-se que a nota que
mais aparece 8. Neste caso, a moda ou o valor modal 8.
Neste exerccio, a mdia, a mediana e a moda apresentam valores bem prximos entre si.
E, dependendo do conjunto de dados estas trs medidas podem at ter o mesmo valor.
Entretanto, dependendo da variao existente no conjunto de dados, voc dever escolher
qual dessas medidas de tendncia central (mdia, mediana ou moda) a mais representativa
e adequada para ser utilizada.
Calcule a mdia, a moda e a mediana para o conjunto de dados de uma classe com
seis alunos, cujas notas foram:
Aluno A B C D E F
Nota 2,0 5,0 8,0 5,0 7,5 3,5
Analisando o conjunto de dados abaixo, responda:
Aluno A B C D E F G H
Nota 2,0 5,0 7,0 10,0 5,0 6,0 3,0 8,0
a) Quantos alunos tm nota superior mdia geral da turma?
Aula 3 Bioestatstica 51
Medidas de disperso
As medidas de disperso indicam ou permitem ter noo do quanto esto distantes os
dados entre si. Ou seja, como eles variam em relao mdia.
Neste sentido, a descrio de um conjunto de dados sempre se faz com uma medida de
tendncia central (geralmente a mdia) e uma de disperso associadas.
Mas, como medir esta variao em relao mdia?
Para isto, devemos analisar a amplitude e os desvios em relao mdia.
Amplitude
A amplitude corresponde diferena entre o maior e o menor valor no conjunto de dados.
Esta medida nos fornece uma noo da disperso dos dados.
Para explicar este conceito, vamos utilizar dois conjuntos de dados A e B, que representam
a nota obtida pelos alunos de uma determinada disciplina:
Conjunto de dados A: 4; 6; 4; 6; 5; 5
Conjunto de dados B: 9; 1; 5; 5; 1; 9
b) Calcule a mdia, a moda e a mediana desta turma.
c) Qual destas trs medidas de tendncia central, voc acha mais adequada para descrever
o conjunto de dados? Justique a sua resposta.
Aula 3 Bioestatstica 52
Para calcular a amplitude destes dois conjuntos de dados, identique, respectivamente,
o maior e o menor valor em cada um deles.
No conjunto A o maior valor encontrado 6 e o menor 4. Assim, a amplitude 6 4 = 2.
Para o conjunto de dados B o maior e o menor valor, so respectivamente 9 e 1, portanto
a amplitude 9 1 = 8.
Observe que esta medida permite inferir que a variabilidade do conjunto de dados B
maior que o do A.
Quando se trabalha com algumas variveis de grande instabilidade como, por exemplo,
contagem de ovos por grama de fezes (OPG) utilizado para diagnstico de verminose, onde
se podem determinar valores de amplitude superior a 10000 OPG, esta medida bastante
interessante para demonstrar a variabilidade e a disperso existente.
Estas caractersticas podem ser comprovadas nos dados da tabela a seguir (Tabela 2),
onde temos zero como o menor valor de OPG e 5100 como o maior valor.
Tabela 2 Contagem de OPG (ovos/g) de um rebanho de ovinos mestios ( sangue Somalis sem raa denida)
mantidos em pastagem nativa naturalmente contaminada por larvas de nematdeos gastrintestinais
Animal Contagem de OPG
1 100
2 0
3 200
4 300
5 0
6 100
7 400
8 100
9 1100
10 1400
11 5100
12 400
13 700
14 300
15 500
16 0
17 700
18 1300
19 200
20 800
21 300
22 2300
Fonte: Zaros et al (2009).
Aula 3 Bioestatstica 53
Desvio em relao media
O desvio em relao mdia permite estimar o quanto um determinado valor se afasta
da mdia do conjunto. O clculo do desvio em relao mdia dado pela diferena entre
o valor medido (observado) e a mdia do conjunto de dados (calculado previamente). Este
representado matematicamente pela frmula:
Desvio em relao a mdia = x x
_
.
Onde:
x = valor medido
x
_
= valor da mdia calculada
Para determinar os desvios, precisamos inicialmente calcular as mdias de cada conjunto
de dados. Ainda utilizando os conjuntos A (4; 6; 4; 6; 5; 5) e B (9; 1; 5; 5; 1; 9), vemos que
a mdia para ambos 5. Assim, os desvios em relao mdia do conjunto de dados A so:
Valor medido (x) Mdia (x
_
) x x
_
4 5 1
6 5 1
4 5 1
6 5 1
5 5 0
5 5 0
Total = 0
Os desvios em relao mdia para o conjunto B so:
Valor medido (x) Mdia (x
_
) x x
_
9 5 4
1 5 4
5 5 0
5 5 0
1 5 4
9 5 4
Total = 0
Observe que, apesar dos conjuntos de dados A e B possurem as mesmas mdias,
eles apresentam desvios bem diferentes. No conjunto A, os desvios vo de 1 a +1 e no B,
de 4 a +4.
Voc notou que, apesar dos valores diferentes, a soma dos desvios zero nos dois
conjuntos? Vamos ver o porqu?
Voc pode est se perguntando: Se a soma dos desvios em relao mdia sempre
zero para qualquer conjunto de dados, como poderei utilizar esta medida?
Aula 3 Bioestatstica 54
Neste caso, podemos utilizar um artifcio matemtico que elevar o valor de (x x
_
)
ao quadrado, transformando-o em (x x
_
)
2
, e assim ter sempre um valor positivo para esta
operao. Assim, sempre que voc calcular a soma dos desvios elevada a potncia 2, obter
um valor positivo e diferente de zero.
Vamos conferir?
Exerccio resolvido 4
Calcule a soma dos desvios elevada potncia 2 para os conjuntos de dados A (4; 6;
4; 6; 5; 5) e B (9; 1; 5; 5; 1; 9).
Resoluo
1) Para o conjunto de dados A:
Valor medido (x) Mdia (x
_
) x x
_
(x x
_
)
2
4 5 1 1
6 5 1 1
4 5 1 1
6 5 1 1
5 5 0 0
5 5 0 0
Total = 0 Total = 4
2) Para o conjunto de dados B:
Valor medido (x) Mdia ( x
_
) x x
_
(x x
_
)
2
9 5 4 16
1 5 4 16
5 5 0 0
5 5 0 0
1 5 4 16
9 5 4 16
Total = 0 Total = 64
3) Calculados os desvios e elevando-os potncia de 2, eles s tero valor zero,
se todos os valores x x
_
do conjunto forem iguais a 0. Neste caso, no existe
disperso e/ou diferena em relao a mdia.
Atividade 3
Aula 3 Bioestatstica 55
Retome os principais conceitos vistos nesta aula e dena:
a) Mdia:
b) Mediana:
c) Moda:
d) Amplitude:
e) Desvio em relao mdia:
Aula 3 Bioestatstica 56
Varincia de uma amostra
Depois de calcular os desvios em relao mdia, agora, voc j pode calcular a varincia
(s
2
) de uma amostra. Esta medida de disperso permite ter noo de quanto variam os dados
em relao a mdia e principalmente calcular o desvio padro de uma mdia.
A varincia de uma amostra estimada pela frmula:
S
2
=

(x x)
2
n 1
Onde:
x = valor medido ou observado na amostra
x
_
= Mdia calculada para amostra
n = nmero de dados da amostra
Vamos fazer uma aplicao da varincia utilizando os dados do exerccio resolvido 4?
Neste caso, para os dois conjuntos de dados, A e B, foram utilizados 6 valores, ento
o valor de n igual a 6 e, consequentemente, n 1 = 5.
Utilizando estes conceitos, a varincia para o conjunto A calculada dividindo-se o valor
de (x x
_
)
2
, que igual a 4, por n 1, que igual a 5. Assim, a varincia de A 4/5 ou 0,8.
Da mesma forma, a varincia de B calculada por 64, resultado de (x x
_
)
2
, dividido
por 5, resultado de n 1. Ou seja, 64/5 que resulta em 12,8.
Observe que a varincia uma medida adimensional.
Agora, conhecendo a varincia de um conjunto de dados, eu posso estimar o seu
desvio padro.
Desvio padro
C
omo a varincia uma medida que estima os quadrados dos desvios em relao
a mdia, esta tem pouca aplicao prtica. Visto que as unidades de medida dos dados
utilizados no cculo da varincia tambm so elevadas ao quadrado, o que diculta a
interpretao das respostas. Tome-se por exemplo uma medida calculada em: kg ou cm ou m
2
.
Neste caso, a varincia ser expressa em respectivamente: kg
2
ou cm
2
ou m
4
; dicultando
a interpretao dos resultados.
Aula 3 Bioestatstica 57
Uma forma de resolver este problema extrair a raiz quadrada da varincia, obtendo
assim o desvio padro (s).
O desvio padro (s) de um conjunto de dados obtido calculando-se a raiz quadrada da
varincia, utilizando a frmula:
s = (
2

S
2
)
Onde:
S
2
= varincia da amostra
Utilizando este conceito nos mesmos conjuntos de dados A e B, obtemos os seguintes
valores:
Para o conjunto A: S
2
= 0,8 ento, s =
2
_
0, 8 s = 0,894
Para o conjunto B: S
2
= 12,8 ento, s =
2
_
12, 8 s = 3,577
Agora, j que conhecemos a mdia e o desvio padro do conjunto de dados e a amplitude,
podemos utilizar estas informaes para descrever os dados analisados neste exemplo.
1) Conjunto A = 5 0,894; menor valor 4; maior valor 6; n = 5.
2) Conjunto B = 5 3,577; menor valor 1; maior valor 9; n = 5.
Voc pode, utilizando essas informaes, escolher o conjunto de dados A, se preferir
o que tiver menor desvio em relao mdia ou o conjunto de dados B se a opo for pela
maior amplitude.
Coeciente de variao
Agora, o que representa o desvio em relao mdia?
O desvio em relao mdia permite avaliar a instabilidade do conjunto de dados.
Esta medida de disperso chamada de coeciente de variao (CV).
O CV calculado dividindo-se o desvio padro pela mdia do conjunto de dados.
CV = s/x
_
Onde:
s = Desvio Padro
x
_
= Mdia aritimtica calculada para o conjunto de dados.
Atividade 4
Aula 3 Bioestatstica 58
Utilizando os dados do Exerccio resolvido 4, teremos os seguintes coecientes de variao.
1) Conjunto de dados A: 0,894/5 = 0,1788 ou 17,88%
2) Conjunto de dados B: 3,577/5 = 0,7154 ou 71,54%
Este resultado indica que o conjunto de dados A mais homogneo e menos instvel
que o B.
Ateno
No estamos armando que A melhor do que B ou vice-versa, mas sim,
homogneo. Isto importante, para se avaliar a representatividade da mdia em
relao ao conjunto de dados.
Lembra quando falamos da mdia de dados de contagem de OPG e que nestes casos, se
pode ter amplitude superior a 10000?
Este um caso de varivel muito instvel, onde a mdia no tem muita representatividade.
Nestas situaes, trabalhar com a moda ou a mediana mais interessante que com a mdia.
A noo de instabilidade de uma varivel e a escolha entre utilizar a mdia, a moda
ou a mediana para descrever o conjunto de dados, uma opo individual do pesquisador.
Para isto, recomenda-se o bom senso e observar/ler como se publicam estas informaes nos
meios cientcos, jornais e revistas.
Os dados a seguir fornecem a concentrao de um determinado poluente (ppm) em 8
pontos de um auente medidos uma hora antes e uma hora depois de um acidente ambiental:
Tabela 3 Concentrao (em ppm) de um determinado poluente nas guas de um rio antes e depois de um
acidente ambiental
Concentrao antes Concentrao depois
4,67 5,44
4,97 6,11
5,11 6,49
5,17 6,61
5,33 6,67
6.22 6,67
6,50 6,78
7,0 7,89
Fonte: <http://leg.ufpr.br/~paulojus/CE003/ce003/node2.html>. Acesso em: 12 abr. 2010.
Aula 3 Bioestatstica 59
Utilizando o conjunto de dados da Tabela 3, calcule a mdia, a mediana, a moda, o
desvio padro e o coeciente de variao da concentrao de poluentes antes e depois do
acidente ambiental.
Leitura complementar
PROJETO de ensino. Aprendendo a fazer estatstica. Disponvel em: <http://www.des.uem.
br/projetos/Estatistica_Descritiva.pdf>. Acesso em: 12 abr. 2010.
Este texto refere-se aos principais conceitos da Estatstica Descritiva vistos na aula de
hoje. Alm disto, sua leitura possibilitar conhecer outros exemplos de aplicaes da Estatstica
Descritiva, principalmente para voc utilizar em situaes de sala de aula tendo como exemplo
as situaes do cotidiano.
Resumo
Aula 3 Bioestatstica 60
Nesta aula, voc estudou as aplicaes da estatstica descritiva nas Cincias
Biolgicas. Para isto, voc teve como exemplo dados de sistemas biolgicos para
calcular a mdia, varincia, desvio padro, moda e mediana. Voc compreendeu
como obter informaes com este tipo de anlise estatstica e aprendeu a
realizar uma anlise de um conjunto de dados utilizando a estatstica descritiva.
Por m, voc pde interpretar os resultados da anlise dos dados, de modo a poder
caracterizar corretamente a amostra e poder fazer inferncias sobre a populao.
Autoavaliao
Um fazendeiro foi avaliar a produo de leite dos seus animais. Ele anotou os
dados na tabela a seguir (Tabela 4). Entretanto, cou sem saber analisar, fazer
uma estatstica descritiva dos resultados.
Tabela 4 Produo de leite (Kg/animal/dia)
Produo de leite (kg/animal/dia)
Identicao do animal Dia 1 Dia 2 Dia 3 Dia 4
A296 7,4 4 7,2 6,6
A369 6 5,4 8 4,8
A001 8 2,8 3,4 9,4
L061 7,4 9,8 11,2 7
L212 4,6 9 10,2 4
L344 2,8 5 6,2 4
Analise os dados da Tabela 4 e calcule a mdia, o desvio padro, a moda, a mediana e
o coeciente de variao da produo de leite do rebanho.
Aula 3 Bioestatstica 61
Se voc conseguiu resolver o exerccio acima, parabns. Caso contrrio, entre em contato
com o seu professor. Retome o texto da aula, reveja os principais conceitos, volte atividade
de Autoavaliao e tente quantas vezes forem necessrias.
Referncias
HOUAISS, Antonio; VILLAR, Mauro de Sales; FRANCO, Francisco Manoel de Mello. Dicionrio
Houaiss da lngua portuguesa. Rio de Janeiro: Editora Objetiva, 2001.
LOPES, Paulo Afonso. Probabilidades e estatstica. Rio de Janeiro: Ed. Reichman e Affonso
Editores, 1999.
MAGALHES, M. N.; LIMA, A. C. P. de. Noes de probabilidade e estatstica. So Paulo:
IME-USP, 2000.
OTT, Lyman; MENDEENHALL, William. Understanding statistics. Boston: PWS-KENT Publishing
Company, 1990.
PAGANO, Marcello; GAUVREAU, Kimberlee. Princpios de bioestatstica. 2. ed. So Paulo:
Pioneira Thomson Learning, 2004.
SAMPAIO, Ivan Barbosa Machado. Estatstica aplicada experimentao animal. Belo
Horizonte: FEP MVZ Editora, 1997.
ZAROS, L. G. et al. Desempenho de ovinos Somalis resistentes e susceptveis a nematdeos
gastrintestinais. In: ZOOTEC, 2009, guas de Lindia. Anais... guas de Lindia, 2009.
Anotaes
Aula 3 Bioestatstica 62
Anotaes
Aula 3 Bioestatstica 63
Anotaes
Aula 3 Bioestatstica 64
Elaborando hipteses
4
Aula
1
2
3
Aula 4 Bioestatstica 67
Apresentao

N
esta aula, apresentaremos o conceito de hiptese, exemplicando com situaes
que fazem parte do seu cotidiano. Num segundo momento, veremos quais os tipos
de hiptese e como utiliz-los. Entenderemos o conceito de populao amostral e
referncia, os quais sero parte essencial na construo da hiptese. Estudaremos quais os
tipos de erros existentes ao se aceitar ou rejeitar uma hiptese verdadeira.
Nesta aula, temos exerccios resolvidos que serviro de guia para que voc faa as
atividades propostas aps cada assunto abordado.
Lembre-se: para que voc compreenda os conceitos desta aula, necessrio que voc
leia atentamente o texto, fazendo sempre anotaes sobre suas dvidas e questionamentos.
Objetivos
Denir hiptese.
Diferenciar os tipos de hipteses.
Denir erro tipo I e tipo II.
Aula 4 Bioestatstica 68
F
o
n
t
e
:

<
h
t
t
p
:
/
/
n
o
t
i
c
i
a
s
r
o
.
n
a
f
o
t
o
.
n
e
t
/
i
m
a
g
e
s
/
p
h
o
t
o
2
0
0
8
1
0
0
4
0
1
4
8
2
4
.
j
p
g
>
.

A
c
e
s
s
o

e
m
:

2
5

m
a
r
.

2
0
1
0
.
Segundo o Dicionrio On Line de Portugus, a palavra hiptese refere-se a uma
suposio que se faz acerca de uma coisa possvel ou no, a qual se tira uma
consequncia; teoria provvel, admissvel, embora ainda no demonstrada.
Na ilustrao anterior, nossa hiptese que vai chover. Chegamos a essa
armao, constatando o cu cinzento e carregado de nuvens.
Mas, ser que podemos comprovar essa hiptese? Ser que essa hiptese pode
ser rejeitada? Que elementos temos para aceitar ou rejeitar essa hiptese?
Essas e outras questes sero respondidas no decorrer desta aula.
Se voltarmos um pouco no tempo e relembrarmos algumas disciplinas que voc j
estudou, como Biodiversidade, podemos destacar teorias que foram formuladas a partir de
uma, duas ou mais hipteses.
Um exemplo foi a teoria da evoluo dos seres vivos. Essa teoria teve vrias hipteses,
dentre elas a sustentada pelo cientista francs Jean-Baptiste Lamarck, que armava que os
seres vivos tinham de se transformar para melhor se adaptarem ao ambiente, ou seja, as girafas
teriam adquirido o pescoo longo ao se esforarem para ter acesso comida. Essa hiptese
no foi aceita pela cincia e foi substituda pelas hipteses de Darwim, que originaram a Teoria
da Seleo Natural.
Uma provvel teoria...
Observe a gura abaixo e responda a seguinte pergunta: Ser que
vai chover?
Figura 1 Cu nublado
Atividade 1
Aula 4 Bioestatstica 69
Baseado nos conhecimentos que voc adquiriu durante o curso de Cincias
Biolgicas, pesquise e descreva outras hipteses que foram conrmadas ou
rejeitadas na histria da Biologia.
Figura 2 Girafas que teriam adquirido pescoo longo ao
se esforarem para ter acesso comida - Hiptese de Lamarck
Esse apenas um exemplo de hipteses que, quando aceitas, tornaram-se fatos, teorias.
Aula 4 Bioestatstica 70
Um exemplo nos dias de hoje
Nas Cincias Biolgicas, os trabalhos cientcos so realizados com objetivos bem
estabelecidos, expressos por meio de armaes as hipteses que os pesquisadores
desejam vericar.
Veja esta situao: suponha que o pesquisador queira vericar se o medicamento X,
utilizado no tratamento do cncer de pele apresenta, como efeito colateral, um aumento na
presso sangunea. Nesse caso, o pesquisador elabora duas armaes, ou seja, duas hipteses
que devem ter sentido contrrio uma da outra (igualdade x diferena). Assim, obrigatoriamente,
ao aceitar uma hiptese, a outra deve ser rejeitada. Isso pode ser visto no exemplo a seguir.
Hiptese 1 (H1): o medicamento X, utilizado no tratamento do cncer de pele, no apresenta
efeito colateral.
Hiptese 2 (H2): o medicamento X, utilizado no tratamento do cncer de pele, apresenta pelo
menos um efeito colateral.
Entretanto, para saber quais das hipteses so verdadeiras, o pesquisador dever test-las,
ou seja, inicia-se uma pesquisa para responder s suas perguntas.
No caso do exemplo acima, ele deve selecionar indivduos, utilizar a medicao X e avaliar
se ocorre algum efeito colateral nos pacientes.
Dependendo dos resultados obtidos, o pesquisador aceita ou no a sua hiptese: se ele
vericar que os indivduos apresentaram algum efeito colateral, como, por exemplo, alterao
na presso arterial aps a administrao do medicamento, ele aceitar a hiptese 2; caso
contrrio, dever aceitar a hiptese 1.
Fonte: <http://frasesilustradas.les.wordpress.com/2009/04/hipotese.jpg>.
Acesso em: 25 mar. 2010.
Atividade 2
Aula 4 Bioestatstica 71
Com base no que voc leu at aqui, dena hiptese e construa duas hipteses
sobre como ser a disciplina de Bioestatstica.
Hipteses e seus tipos
At o momento, vimos o conceito de hiptese. Agora, vamos conhecer seus tipos?
H dois tipos principais de hipteses. Uma que chamamos de Hiptese Cientca e a
outra que denominamos de Hiptese Estatstica.
A hiptese cientca aquela que no menciona o valor do parmetro. o caso da nossa
situao acima, em que as hipteses formuladas no exprimem valor, ou seja, no se referem
mdia da presso sangunea dos indivduos analisados.
J a hiptese estatstica menciona o valor do parmetro. Seria o caso se, no exemplo
acima, o pesquisador apresentasse o valor mdio da presso sangunea dos indivduos
analisados, como, por exemplo, 128mmHg (milmetros de mercrio).
O esquema a seguir resume os dois principais tipos de hipteses com seus respectivos
exemplos e nos apresenta outros dois subtipos da hiptese estatstica, a Hiptese Nula ou de
Nulidade (H
0
) e a Hiptese Alternativa (H
a
).
Valor do parmetro
Valor do parmetro:
um nmero, um valor
que quantica a varivel.
HIPTESE
Hiptese Cientca
O medicamento
apresenta efeito
colateral
Parmetro
com valor
Hiptese
Nula Ho
A mdia da presso
sangunea igual para os
indivduos que receberam
o medicamento e para os
que no receberam
A mdia da presso
sangunea diferente para
os indivduos que receberam
o medicamento e para os
que no receberam
Hiptese
Alternativa Ha
O medicamento
apresenta efeito
colateral sobre a
mdia de presso
sangunea
Hiptese Estatstica
Parmetro
sem valor
Aula 4 Bioestatstica 72
Figura 3 Tipos e subtipos de hipteses e seus respectivos exemplos
Fonte: Lilian Giotto Zaros.
Vamos nos aprofundar nas hipteses estatsticas?
As hipteses estatsticas sempre comparam dois ou mais parmetros, armando que
so iguais ou no, como voc pde ver no esquema acima. Essas hipteses ainda podem ser:
Hiptese Nula ou de Nulidade (H
0
), que estabelece a ausncia de diferenas entre os
parmetros. sempre a primeira a ser formulada.
Ainda utilizando o exemplo anterior, a hiptese de nulidade pode ser:
H
0
, a mdia da presso sangunea da populao amostrada (
1
), de indivduos tratados
com o medicamento X, no difere da mdia da populao tomada como referncia (
2
), ou
abreviadamente:
H
0
:
1
=
2
Se essa hiptese for aceita, a concluso de que o medicamento no altera a presso
sangunea.
Populao
amostrada (
1
)
a amostra que constitui
o seu estudo. No caso
do nosso exemplo, os 60
indivduos que tomaram o
medicamento constituem
a populao amostral ou,
simplesmente, a amostra.
Populao tomada
como referncia (
2
)
aquele que serve como
base ou referncia para
o estudo. No caso do
exemplo, a populao
de pessoas que no
receberam o medicamento.
O pesquisador no precisa,
necessariamente, medir
a presso de todas as
pessoas. Ele simplesmente
pode ter como base
estudos j realizados que
constataram que a mdia
da presso arterial
de 128mmHg.
Aula 4 Bioestatstica 73
Hiptese alternativa
Hiptese Alternativa (H
a
ou H
1
): a hiptese contrria hiptese nula. Estabelece a presena
de diferenas entre os parmetros. Geralmente, a que o pesquisador quer ver conrmada.
A hiptese alternativa do exemplo acima :
H
a,
a mdia da presso sangunea da populao amostrada (
1
), de indivduos tratados com
o medicamento X, difere mdia da populao tomada como referncia (
2
), ou abreviadamente:
H
a
:
1

2
Se essa hiptese for aceita, a concluso de que o medicamento altera a presso sangunea.
Exerccio resolvido
Formule as hipteses de nulidade e alternativa para a situao descrita a seguir.
Um pesquisador da Empresa Brasileira de Pesquisa Agropecuria (EMBRAPA) tem se
dedicado aos estudos de caprinos, tentando identicar alguns genes que sejam relacionados
resistncia verminose. Num dado momento da sua pesquisa, ele notou que vrios genes
aparecem em diferentes propores nos animais mais resistentes do que nos animais mais
susceptveis e outros genes aparecem nas mesmas propores em ambos os animais.
Diante dessa observao, o pesquisador precisa formular suas hipteses para posteriormente
test-las. Descreva quais as hipteses esse pesquisador deve testar.
Resoluo
Em primeiro lugar, voc deve identicar qual a populao a ser testada. No
exemplo acima, queremos comparar se os animais resistentes apresentam os
mesmos genes que os animais susceptveis. Nesse caso, como iremos testar os
dois grupos de animais, podemos denominar os animais resistentes de populao
1 (
1
) e os animais susceptveis de populao 2 (
2
), j que ambos sero testados.
Uma vez denida a populao a ser testada, voc pode elaborar as hipteses.
Hiptese de nulidade (H
0
): a mdia de expresso gnica dos animais
resistentes no difere da dos animais susceptveis. H
0
:
1
=
2
Hiptese alternativa (H
a
): a mdia de expresso gnica dos animais
resistentes difere da dos animais susceptveis. H
a
:
1

2
Entendido? Agora faa o mesmo nas situaes abaixo.
Atividade 3
1
2
Aula 4 Bioestatstica 74
Um pesquisador da Fundao Oswaldo Cruz, no Rio de Janeiro, recebeu
uma demanda do Governo Federal para testar um novo inseticida contra
o mosquito Aedes aegipty, transmissor da dengue e da febre amarela
urbana. Alguns estudos preliminares foram realizados e comprovaram
que o inseticida tem efeito na diminuio da populao desse inseto.
Entretanto, o que o governo ainda no sabe se ele atua inibindo a
ecloso dos ovos, inibindo o desenvolvimento da larva em adulto, ou
tornando os adultos estreis. Com base nessas informaes, escolha
uma das trs alternativas para o mecanismo de ao do inseticida e
elabore as hipteses (H
0
e H
a
) que devem ser testadas para responder
ao questionamento do Governo Federal.
Antigamente, se pensava que o cncer de mama era uma doena rara
em mulheres abaixo dos 35 anos. Pesquisas recentes tm mostrado
que essa incidncia no um evento to raro como se pensava
anteriormente. Desse modo, pesquisadores de institutos de sade vm
se questionando se as causas desse tipo de cncer so as mesmas
em mulheres abaixo de 35 anos, quando comparadas quelas de 45
anos ou mais. Suponha que voc um desses pesquisadores que ir
realizar a pesquisa e elabore as hipteses (H
0
e H
a
) a serem testadas.
ERRO
Tipo I - erro
Rejeita H
0
quando
ela verdadeira
Aceita H
0
quando
ela falsa
Arma-se uma diferena
quando ela efetivamente
no existe
Arma-se uma igualdade
quando o correto seria
armar uma diferena
Tipo II - erro
Aula 4 Bioestatstica 75
Cometendo erros
Agora que voc j compreendeu o conceito de hiptese estatstica e conseguiu identicar,
em uma situao problema, as hipteses de nulidade (H
0
) e alternativa (H
a
), voc ir ver que
podemos cometer erros ao aceitar ou no uma hiptese. O aceitar ou rejeitar uma hiptese
dado pelos testes de hipteses, os quais estudaremos na Aula 5 Testando hipteses.
A vericao das hipteses estatsticas somente se dar com certeza se voc estudar toda
a populao, e no somente uma amostra dessa populao, como somente alguns indivduos
utilizados para avaliar o efeito do medicamento na presso arterial.
Entretanto, como no podemos avaliar toda a populao, por diversas razes, avaliamos
somente uma amostra dela (por exemplo, 60 indivduos) e extrapolamos, ou seja, aplicamos
os resultados obtidos com essa amostra para todos os indivduos da populao.
Mas, quando fazemos isso, corremos o risco de cometer erros, armando que h uma
diferena, quando ela efetivamente no existe, ou o inverso.
E como podem ser esses erros?
Os erros cometidos ao se extrapolar as informaes de uma amostra para toda a
populao podem ser visualizados no esquema apresentado a seguir.
Figura 4 Tipos de erros que podem ser cometidos ao se testar hipteses
Fonte: Lilian Giotto Zaros.
Testes de hipteses
procedimento estatstico
pelo qual se rejeita ou no
uma hiptese, associando
concluso um risco
mximo de erro.
Extrapolar
generalizar; estender a
validade de uma armao
ou concluso alm dos
limites em que ela
comprovvel.
VERDADEIRA
ACEITA
H
0
O

P
E
S
Q
U
I
S
A
D
O
R
DECISO
CORRETA
COMETE O
ERRO TIPO I ()
COMETE O
ERRO TIPO II ()
DECISO
CORRETA
REJEITA
H
0
FALSA
Se a Hiptese Nula (H
0
)
Aula 4 Bioestatstica 76
E como evitar esses tipos de erros?
Esses erros podem ser evitados atravs dos testes de hipteses (Aula 5) que os
tornem menores possveis. Entretanto, no possvel minimizar ambos os erros
ao mesmo tempo.
Os testes de hipteses so montados de forma que, xado o Erro Tipo I que se
est disposto a cometer, o Erro Tipo II seja o menor possvel.
Se o pesquisador aceita H
0
e ela realmente verdadeira, ele tomou a deciso correta,
e, consequentemente, no cometeu erro algum. Entretanto, se ele aceita H
0
e ela falsa, ele
cometeu um erro, chamado de erro tipo II, representado pela letra grega beta ().
Mas, se o pesquisador rejeita H
0
e ela verdadeira, ele comete o erro tipo I, representado
pela letra grega alfa (). J, se ele rejeita H
0
e ela falsa, ele tomou a deciso correta e no
cometeu erro algum.
Figura 5 Tipos de erros cometidos ao aceitar ou rejeitar uma hiptese de nulidade ou alternativa
Mas, como possvel rejeitar
uma hiptese que verdadeira?
O teste que realizamos para aceitar ou rejeitar uma hiptese baseia-se numa situao
experimental (amostra), sujeita a utuaes amostrais. Devido a essas utuaes, voc pode
ter uma amostra que no represente bem a populao, levando a uma concluso que no
corresponde realidade.
No quadro a seguir voc pode vericar os erros cometidos de acordo com a deciso
tomada pelo pesquisador de aceitar ou no uma hiptese.
F
o
n
t
e
:

<
h
t
t
p
:
/
/
w
w
w
.
e
d
i
t
o
r
a
f
e
r
r
e
i
r
a
.
c
o
m
.
b
r
/
p
u
b
l
i
q
u
e
/
m
e
d
i
a
/
p
e
d
r
o
_
t
o
q
1
4
_
t
e
s
t
e
-
h
i
p
o
t
e
s
e
s
.
p
d
f
>
.

A
c
e
s
s
o

e
m
:

2
5

m
a
r
.

2
0
1
0
.
Atividade 4
1
2
Aula 4 Bioestatstica 77
O texto abaixo foi escrito por Doris S. M. Fontes (2007, extrado da Internet), graduada
em Estatstica, aborda a importncia do erro estatstico. Leia e reita sobre ele.
Ser que os erros mdicos so mais graves que os erros estatsticos?
[...] Muitas vezes, conclui-se que os erros estatsticos no devem ser encarados
com tanto rigor legal como aqueles causados por mdicos, advogados ou
engenheiros. Eu realmente no compartilho muito dessa opinio. Erros estatsticos
podem ser muito graves, trazendo consequncias realmente nefastas para milhes
de pessoas. Enquanto um mdico mata um, dois ou dez pacientes por impercia,
um resultado estatstico aceito por uma empresa ou governo pode trazer prejuzo/
danos ou mortes para muitas pessoas, ou milhes, simultneamente, dependendo
do caso [...] O remdio genrico que foi aprovado mais tarde vericado que
no funciona. E quantas vtimas j ter feito? Um produto lanado a partir de
resultados estatsticos duvidosos, quantos tero morrido?
Pesquise o conceito de erro e, com base nos seus conhecimentos adquiridos nesta
aula, dena os tipos de erros estatsticos e suas consequncias.
Resumo
Aula 4 Bioestatstica 78
Nesta aula, voc aprendeu o conceito de hiptese e tambm que h hipteses
cientficas e estatsticas. Voc estudou os tipos de hipteses estatsticas
denominadas hiptese de nulidade (H
0
) e hiptese alternativa (H
a
) e as identicou
em vrios exemplos utilizados ao longo da aula. Entendeu o conceito de populao
amostral e referncia, que so parte essencial na construo de hipteses.
Aprendeu tambm a formular hipteses utilizando alguns exemplos da Biologia
e a reconhecer a importncia de uma hiptese bem formulada. Voc conheceu que
podemos aceitar ou rejeitar hipteses e vericamos que, ao rejeitar ou aceitar uma
hiptese, podemos cometer algum tipo de erro. Estudou os conceitos de erros
apresentados em erro tipo I, representado pela letra grega alfa () e o erro tipo
II, representado pela letra grega beta (). Por m, voc pde perceber e reetir
sobre a sua importncia quando extrapolamos uma concluso retirada de um
estudo de uma amostra para toda a populao.
Aula 4 Bioestatstica 79
Se voc conseguiu resolver a autoavaliao, parabns. Caso contrrio, entre em contato
com o seu professor, reveja os principais conceitos, volte atividade e tente quantas vezes
forem necessrias.
Referncias
CALLEGARI-JACQUES, Sdia M. Bioestatstica: princpios e aplicaes. Porto Alegre:
Artmed, 2003.
DEPARTAMENTO DE PATOLOGIA FMUSP. Biometria: aula II: inferncia estatstica. Disponvel
em: <http://med.fm.usp.br/dim/apostila/biometria/aula02.htm>. Acesso em: 23 fev. 2010.
Autoavaliao
Vamos aplicar o que aprendemos? Para isso, resolva o exerccio abaixo.
Suponha que antroplogos da Alemanha costumam classicar os tipos de
populaes antigas com base no comprimento dos seus crnios: populao 1 (P1),
com valores mdios de 190mm e populao 2 (P2), com valores mdios de
196mm. Recentemente, descobriram em outra localidade 12 crnios com
comprimento mdio de 194mm e desejam saber qual tipo de populao
(P1 ou P2) pertenceram esses crnios. Assim, transforme o problema acima em
uma hiptese estatstica.
Anotaes
Aula 4 Bioestatstica 80
DICIONRIO On Line de Portugus. Disponvel em: <http://m.dicio.com.br/hipotese/>. Acesso
em: 24 fev. 2010.
FONTES, D. S. Ser que os erros mdicos so mais graves que erros estatsticos? 2007.
Disponvel em: <http://www.conre3.org.br/forum/viewtopic.php?t=595>. Acesso em: 25 fev. 2010.
HOUAISS, Antonio; VILLAR, Mauro de Sales; FRANCO, Francisco Manoel de Mello. Dicionrio
Houaiss da lngua portuguesa. Rio de Janeiro: Editora Objetiva, 2001. 2922p.
LOPES, Paulo Afonso. Probabilidades e estatstica. Rio de Janeiro: Ed. Reichman e Affonso
Editores, 1999.
Anotaes
Aula 4 Bioestatstica 81
Anotaes
Aula 4 Bioestatstica 82
Testando hipteses
5
Aula
1
2
3
4
Aula 5 Bioestatstica 85
Apresentao
Agora que voc j compreendeu o conceito de hiptese estatstica e conseguiu identicar,
em uma situao problema, as hipteses de nulidade (H
0
) e alternativa (H
a
),(Aula 4- Elaborando
hipteses) voc ir conhecer os testes pelos quais podemos vericar se as hipteses que
construmos so ou no verdadeiras. Esses testes so chamados de testes de hipteses.
Tambm nesta aula voc vai estudar o conceito de nvel de signicncia do teste, onde
voc utilizar o conceito de erro tipo I e tipo II visto na aula anterior (Aula 4- Elaborando
hipteses) para compreender o que o nvel de signicncia de um teste e sua importncia.
Em seguida, voc vai aprender a classicar os tipos de testes de hipteses e ver em quais
situaes eles so mais utilizados.
Leia atentamente os textos e anote suas dvidas. Bom trabalho!
Objetivos
Denir testes de hipteses.
Identicar os principais tipos de testes de hipteses.
Denir o conceito de nvel de signicncia.
Reconhecer em quais situaes utilizar os testes
de hipteses.
Aula 5 Bioestatstica 86
Denindo os testes de hipteses
Os testes de hipteses ou testes de signicncia so procedimentos estatsticos pelos
quais voc rejeita ou aceita uma hiptese de nulidade (H
0
), associando um risco mximo de
erro (nvel de signicncia) para esta concluso. So utilizados para detectar se existe alguma
diferena entre as mdias testadas.
Para entender melhor a denio de testes de hipteses, suponha que voc queira avaliar
se a utilizao de suco de abacate com laranja na alimentao de mulheres resulta em perda
de peso. Como voc viu anteriormente, primeiro devemos elaborar as hipteses.
H
0
: A utilizao de suco de abacate com laranja na alimentao no tem efeito sobre a
perda de peso das mulheres.
H
1
: A utilizao de suco de abacate com laranja na alimentao tem efeito sobre a perda
de peso das mulheres.
Aps a elaborao das hipteses, voc dever test-las, utilizando o teste especco
para comparar os resultados obtidos. Mas antes de escolher qual o melhor teste estatstico,
primeiro voc deve analisar:
Natureza da varivel: se ela qualitativa ou quantitativa;
Distribuio da varivel: se tem distribuio normal ou no;
Continuidade da varivel: se contnua ou descontnua;
Instabilidade da varivel: se muito ou pouco instvel.
De acordo com esses critrios, podemos ter dois tipos de testes:
Testes paramtricos: devem ser utilizados quando so avaliados dados com variveis
quantitativas e de distribuio normal, como por exemplo, o peso mdio de um
rebanho bovino.
Testes no paramtricos: devem ser utilizados para variveis qualitativas e que no tm
distribuio normal, como por exemplo, nmero de pessoas que gostam do queijo tipo
A numa avaliao de preferncias.
Atividade 1
Aula 5 Bioestatstica 87
Aplicando testes
paramtricos e no paramtricos
O Quadro 1 resume os critrios a serem analisados na escolha do teste estatstico, de
acordo com a sua indicao em teste paramtrico e no paramtrico.
Caractersticas da varivel Testes paramtricos Testes no paramtricos
Varivel qualitativa x
Varivel quantitativa x
Distribuio normal x
Sem distribuio normal x
Contnua x
Descontnua x
Estvel x
Instvel x
Quadro 1 Critrios analisados na escolha do teste estatstico paramtrico e no paramtrico
Fonte: Henrique Rocha de Medeiros
Note que os testes paramtricos so indicados para variveis quantitativas, com
distribuio normal, contnua e estvel. Um exemplo de uma varivel que se encaixa nesse perl
o peso mdio dos animais de um rebanho submetidos a diferentes tipos de dieta alimentar.
J os testes no paramtricos so indicados para variveis qualitativas, sem distribuio
normal, descontnua e instvel, como por exemplo o nmero de eleitores que votariam num
determinado candidato para a eleio de diretor da escola.
Agora que voc j estudou o conceito de testes paramtricos e no paramtricos e viu
tambm em quais tipos de variveis utiliz-los, pesquise em seu material das aulas anteriores
os conceitos a seguir:
a) Varivel quantitativa e quantitativa.
= 0
= 1
1 -1 -2 -3 2 3 z
Aula 5 Bioestatstica 88
b) Varivel contnua e descontnua.
c) Varivel estvel e instvel.
Mas o que uma varivel
com distribuio normal?
Diz-se que uma varivel apresenta distribuio normal quando a mdia e mediana so
iguais. Alm do mais, os desvios em relao mdia so simtricos. Por isso, quando plotamos
os resultados em grcos, observa-se que estes apresentam forma de sino.
Est com diculdades para entender esta denio?
Vamos observar e analisar o grco a seguir para facilitar a sua compreenso acerca
destes conceitos.
Mdia e mediana
Caso voc no se lembre
do conceito de mdia e
mediana, volte Aula 3
Estatstica descritiva.
Figura 1 Grco de uma distribuio normal com mdia () = 0 e desvio padro () = 1
Atividade 2
Aula 5 Bioestatstica 89
Sempre que a distribuio dos dados for normal, observa-se a mdia () no centro da
curva (ilustrada pela reta em verde) e desvios simtricos em relao mdia ().
Vale ressaltar que este grco poder ser mais achatado ou no, de acordo com a relao
entre os desvios e a mdia.
Construa um grco utilizando o conjunto de dados da Tabela 1 a seguir e analise se os
mesmos tm distribuio normal. Este grco pode ser elaborado utilizando a ferramenta de
grcos do Excel ou em papel milimetrado, inserido aps a tabela.
Tabela 1 Peso mdio (valores mximos e mnimos) dos animais de um rebanho bovino e respectivos nmeros
de animais por classe de peso
Classes de peso (kg) Peso mdio Nmero de animais
Mnimo Mximo (kg) por classe por classe de peso
1 62,5 67,4 64,95 6
2 67,5 72,4 69,95 12
3 72,5 77,4 74,95 25
4 77,5 82,4 79,95 38
5 82,5 87,4 84,95 44
6 87,5 92,4 89,95 52
7 92,5 97,4 94,95 47
8 97,5 102,4 99,95 34
9 102,5 107,4 104,95 23
10 107,5 112,4 109,95 14
11 112,5 117,4 114,95 5
Fonte: Henrique Rocha de Medeiros
Alta acurcia
Baixa preciso
Baixa acurcia
Baixa preciso
Alta acurcia
Alta preciso
Baixa acurcia
Alta preciso
Atirador 1 Atirador 2
Aula 5 Bioestatstica 90
Agora j posso iniciar o teste?
Ainda no, mesmo que voc j tenha testado todas as condies da varivel e identicado
qual tipo de teste a ser utilizado.
Antes voc deve convencionar qual o nvel de erro desejado para testar esta mdia. Ou
seja, o limite mximo para se determinar quanto do desvio (erro) decorrente do acaso ou no.
Esses valores, normalmente, so distribudos entre 5% e 0,001%. Essa possibilidade
de erro levada em considerao quando se testa as hipteses denominada de nvel
de signicncia e representada pela letra grega alfa (). A escolha de qual o valor de
probabilidade de erro, entre 5% e 0,001%, escolher depender, principalmente, da sua
ponderao e subjetividade. Se voc aceitar uma hiptese onde o nvel de signicncia de
5% ou = 0,05, pode-se concluir que ela 95% verdadeira. Caso voc aceite uma hiptese
onde a porcentagem de erro de 1% ou = 0,01, voc concluir que sua hiptese tem 99%
de chance de ser verdadeira. Entendido?
E j que existe uma grande variao nos nveis de signicncia, qual o valor que devo
utilizar para o meu trabalho?
Esse valor vai depender da hiptese que est sendo testada, da necessidade de acurcia
e preciso da varivel estudada e dos objetivos da pesquisa.
Mas como avaliar a acurcia e preciso?
Para isso, vamos observar o exemplo da gura a seguir (Figura 2), que ilustra o conceito
de acurcia e preciso de quatro atiradores que esto fazendo testes para a tropa de elite da
Polcia Militar.
Acurcia
Medida correta dos
valores.
Preciso
Capacidade de repetir a
medida com acurcia.
Figura 2 Representao esquemtica dos conceitos de acurcia e preciso
Fonte: <http://sampa.if.usp.br/~suaide/LabFlex/blog/les/acuracia.jpg>. Acesso em: 17 maio 2010.
Atividade 3
Aula 5 Bioestatstica 91
Observe que com o Atirador 1, que tem alta acurcia e alta preciso, a maior parte das
marcas pretas (resultantes dos tiros) atinge o centro do alvo, o crculo verde e menor.
O Atirador 2 apresenta baixa acurcia, pois nenhum tiro atingiu o alvo central da gura,
e alta preciso, porque todos os tiros esto bem prximos entre si.
O Atirador 3 tem alta acurcia (atingiu o alvo central) e baixa preciso, pois a maior parte
dos seus tiros so dispersos e longe do alvo.
O Atirador 4 tem baixa preciso e baixa acurcia, pois nenhum dos seus tiros atingiu o
alvo central e todos esto bem dispersos (longe um do outro) na Figura 2.
Vamos reetir sobre esse tema?
Qual a necessidade de preciso e, consequentemente, da escolha do nvel de signicncia
a serem utilizados nas seguintes situaes?
1) Testar uma nova variedade de mandioca (Manihot sculenta Crantz), que resistente
seca, para ser plantada em regies semiridas.
2) Testar uma nova vacina contra gripe para idosos com mais de 60 anos.
Certamente, no caso 2 a necessidade de preciso ser muito maior que no caso 1.
Para se testar a resistncia de uma variedade de planta em relao a stress hdrico,
nveis entre 1 e 5% de erro podem satisfazer a necessidade de conana do pesquisador na
resposta obtida.
Para a situao 2, onde se testa uma vacina em idosos, nveis de signicncia superiores
a 0,1% so inadmissveis. Esses valores podem e devem ser ainda menores se for testado
um produto que pode causar danos sade. Nesse caso, recomenda-se trabalhar nos nveis
de signicncia de 0,01%.
Estabelea os nveis de signicncia (5%; 1%; 0,1% e 0,01%) adequados para se testar
as situaes experimentais a seguir e justique a sua resposta:
Aula 5 Bioestatstica 92
b) Comparar a produo de leite de vacas em uma fazenda.
c) Avaliar o efeito da substituio do leite de vaca por leite de cabra no ganho de peso de
crianas desnutridas com idade entre 1 e 5 anos.
d) Comparar a eccia da utilizao de gargarejo de soluo caseira com gua, sal e vinagre ou
de frmacos (remdios alopticos comprados em farmcia) no tratamento de amigdalite.
e) Avaliar o resultado de uma vacina que imuniza idosos com mais de 60 anos contra gripe.
a) Avaliar o efeito da utilizao de farinha de mandioca na alimentao de crianas de 4 a 8 anos.
Aula 5 Bioestatstica 93
Pode-se rejeitar uma hiptese que verdadeira?
Alm do nvel de signicncia (determinada pela necessidade de preciso e acurcia na
resposta medida), existe a possibilidade de ocorrerem erros tipo I () ou tipo II () quando se
testa uma hiptese. No erro tipo I atribui-se uma diferena s mdias quando elas realmente
no existem. No erro tipo II ocorre o contrrio: atribui-se uma igualdade quando as mdias
so diferentes.
Esses tipos de erro so antagnicos. Assim, seu controle simutneo e absoluto
impossvel. Neste caso, voc deve escolher o tipo de erro (I ou II) a ser minimizado. Para
isso, o tipo de varivel estudada e seus possveis resultados so importantes para a escolha.
Nas situaes onde o resultado favorvel uma diferena, deve-se evitar utilizar testes
que beneciem erro tipo I. Assim, diminui-se a probabilidade de se atribuir diferenas entre
as mdias, quando elas realmente no existem.
Esse tipo de erro indesejado nas situaes onde se espera maior ecincia de algum
tratamento, como por exemplo, testes para comparar produtividade de cultivares de mandioca
ou milho plantadas em regies de semirido. Assim, o produtor poder escolher a variedade
de mandioca ou de milho plantada deveria ser a que apresentasse a maior produtividade.
Por outro lado, quando o resultado favorvel (situao desejada) a equivalncia, deve-se
procurar utilizar testes que beneciem erro tipo II, isto , atribuir igualdade entre as mdias,
quando elas realmente no existem.
Essa situao pode ser exemplificada quando se compara a substituio de um
medicamento importado do exterior por um nacional. Para esta situao, a resposta desejada
uma equivalncia, pois a escolha de qual tratamento ser utilizado se d em funo de alguma
facilidade (por exemplo: preo ou maior possibilidade de aquisio).
Todavia, atribuir uma equivalncia quando ela realmente no existe , no mnimo, uma
irresponsabilidade, e poder comprometer a ecincia do tratamento. Isso porque faltariam
subsdios para indicar o tratamento mais ecaz.
Como dito anteriormente, esses erros so excludentes e no podem ser controlados
conjuntamente. Assim, o pesquisador (voc) dever fazer uma escolha: qual tipo de erro (I ou
II) quer beneciar ou evitar.
Atividade 4
Aula 5 Bioestatstica 94
Escolha o tipo de erro (I ou II) que dever ser beneciado para as seguintes situaes e
justique a sua resposta:
a) Comparar a substituio de um medicamento aloptico (comprado em farmcia) por um caseiro.
b) Comparar a o efeito, no ganho de peso mdio dirio de bovinos em connamento, da
substituio de farelo de trigo por resduo da produo de melo na alimentao.
c) Avaliar a ecincia de uma vacina contra gripe em pessoas com mais de 60 anos.
d) Avaliar o efeito da utilizao de castanha de caju na alimentao de crianas sobre os nveis
de colesterol bom (LDL) no sangue.
Aula 5 Bioestatstica 95
Os testes de hipteses
Existe uma gama diversa de testes de hipteses. Os testes mais comumente utilzados
em sistemas biolgicos so:
O Teste F, proposto por Fisher em 1924. Este teste indica se existe diferena entre
as mdias testadas. Porm, no diz quais so as diferenas. Assim, esse teste s deve
ser utilizado para comparar duas mdias por vez. Esses tipos de comparao so
denominados contrastes ortogonais.
O Teste t de student. Este teste bastante utilizado em Biologia, especialmente para
se comparar trs ou mais mdias simultaneamente. Ele favorece o aparecimento de erro
tipo I (atribui-se uma diferena, quando ela realmente no existe) e controla bem erro
tipo II ().
O Teste de Tukey tambm utilizado quando se deseja comparar trs ou mais mdias
simultaneamente. Este teste controla bem erro tipo I e favorece o aparecimento do erro
tipo II () (atribui-se uma igualdade, quando as mdias so diferentes).
Alm destes testes, existem vrios outros como o SNK, o Duncan e o de Sheff. A escolha
de qual deles voc vai utilizar no seu trabalho dever ocorrer em funo da sua necessidade
de controle de erro e peculiaridades inerentes pesquisa.
Assim, para escolhar qual o tipo de teste a ser utilizado interessante que voc promova
uma discusso entre os membros da equipe e um estatstico para decidirem qual o a melhor
opo a ser utilizada.
Vamos supor que, pra testar se o suco de abacate com laranja tem efeito no emagrecimento
de mulheres como exemplicado no incio dessa aula voc utilizou como populao
amostral 60 mulheres. Destas 60 mulheres, 30 receberam o suco de laranja com abacate
(1) e 30 receberam uma mistura que chamamos de placebo (2).
As mulheres da populao 1 perderam em mdia 3,5 kg e as mulheres da populao
2 perderam, em mdia, 0,5 kg. Para testarmos nossas hipteses, devemos assumir que h
um erro embutido no nosso experimento, j que os dados obtidos so da populao amostral
(60 mulheres) e no de todas as mulheres da populao em geral.
Nesse caso, antes de testarmos nossas hipteses, devemos assumir esse erro e dar um
valor a ele. Quanto maior for o valor do erro, maior a probabilidade de rejeitar uma hiptese
quando ela verdadeira. Assim, se assumirmos um valor de erro cada vez menor, temos uma
maior conana nos resultados obtidos.
Assim, nossa hiptese a ser testada seria:
H0: 1 =2 versus Ha: 12 ,
Placebo
um frmaco (produto)
ou procedimento inerte
que apresenta efeitos
teraputicos devido aos
efeitos siolgicos da
crena de que o pacinente
est sendo tratado.
Atividade 5
Aula 5 Bioestatstica 96
onde:
1 = mdia da perda de peso das mulheres que receberam suco de abacate com laranja (3,5 kg)
2 = mdia da perda de peso das mulheres que no receberam suco de abacate com
laranja(0,5 kg).
Considera-se aceitvel um erro (ou nvel de signicncia) de 5%. Podemos, agora, fazer
a seguinte pergunta: tomar suco de laranja com abacate faz mal sade das pessoas?
Se a resposta for no faz mal a sade, o teste de t de Student pode ser indicado. Esse
teste favorece erro tipo I, que rejeita H0, quando este verdadeiro. Mas, como tomar este
suco no vai fazer mal sade, no haver problemas com este tipo de erro, uma vez que o
mximo que pode acontecer a recomendao para tomar um produto que no vai fazer mal!
Todavia, e se o suco zer mal s pessoas? Neste caso, voc deveria utilizar um teste
como o de Tukey, que controla erro tipo II. Assim, no existiria recomendao de que se tomar
suco de laranja com abacate resultaria em emagrecimento, pois, no caso observado, a perda de
peso registrada nos pacientes que tomaram suco foi resultante do acaso, e no do tratamento
imposto (tomar suco de abacate com laranja).
Lembre que estes erros no podem ser controlados e ocorrem
ao acaso. No so fruto de trabalho errado ou mal feito!!
Entendeu o conceito?
Agora vamos fazer uma atividade e ganhar mais experincia para este tipo de reexo.
Indique os testes estatsticos mais adequados para as situaes abaixo:
a) Comparar a mdia de peso de indivduos que receberam tratamento para diminuir os nveis
de colesterol com aqueles que no receberam nenhum tipo de tratamento.
Aula 5 Bioestatstica 97
b) Comparar a mdia dos nveis de poluentes emitidos por 4 indstrias qumicas do Rio
Grande do Norte.
Resumo
Nesta aula voc conheceu a denio de testes de hipteses e os principais
tipos de testes. Voc viu que os testes, de uma maneira geral, podem ser
classicados em paramtricos e no paramtricos, de acordo com o tipo de
varivel pesquisada. Voc revisou o conceito de varivel qualitativa, quantitativa,
contnua, descontnua, estvel e instvel. Compreendeu o que caracteriza uma
varivel com distribuio normal e aprendeu a identic-la. Conheceu o conceito
de nvel de signicncia, identicou, em uma situao problema, erros do tipo I e
erros do tipo II e compreendeu a importncia de cada um deles para a realizao
de um teste estatstico. Voc tambm conheceu os principais tipos de testes de
hipteses e compreendeu em quais situaes utilizar cada um deles.
Autoavaliao
Existe uma crena popular de que ch de folha de goiabeira pode ser um bom remdio
caseiro para controlar diarreia em bezerros jovens. Proponha uma metodologia para
testar esta hiptese. Para isto, voc deve obedecer as seguintes etapas:
a) Elabore a hiptese de nulidade (H
0
) e a alternativa (H
a
) para avaliar o fenmeno escolhido.
Aula 5 Bioestatstica 98
b) Escolha o nvel de signicncia (5%; 1%; 0,1% ou 0,01%) adequado para esta situao
e justique sua resposta.
c) Escolha o tipo de erro (I ou II) que voc quer evitar e justique sua resposta.
d) Escolha o teste estatstico mais adequado aos seus objetivos e justique sua resposta.
Referncias
CALLEGARI-JACQUES, Sdia M. Bioestatstica: princpios e aplicaes. Porto Alegre: Artmed, 2003.
DEPARTAMENTO DE PATOLOGIA - FMUSP. Biometria: aula II: inferncia estatstica. Disponvel
em: <http://med.fm.usp.br/dim/apostila/biometria/aula02.htm>. Acesso em: 23 fev. 2010.
DICIONRIO On Line de Portugus. Disponvel em: <http://m.dicio.com.br/hipotese/>. Acesso
em: 24 fev. 2010.
FONTES, D. S. Ser que os erros mdicos so mais graves que erros estatsticos? 2007.
Disponvel em: <http://www.conre3.org.br/forum/viewtopic.php?t=595>. Acesso em: 25 fev. 2010.
HOUAISS, Antonio; VILLAR, Mauro de Sales; FRANCO, Francisco Manoel de Mello. Dicionrio
Houaiss da lngua portuguesa. Rio de Janeiro: Editora Objetiva, 2001. 2922p.
LOPES, Paulo Afonso. Probabilidades e estatstica. Rio de Janeiro: Ed. Reichman & Affonso
Editores, 1999.
Aula 5 Bioestatstica 99
Anotaes
Aula 5 Bioestatstica 100
Anotaes
Anlise de varincia
6
Aula
1
2
Aula 6 Bioestatstica 103
Apresentao
A
gora que voc j compreendeu o conceito de hiptese estatstica (Aula 4 - Elaborando
hipteses) e os testes estatsticos (Aula 5 - Testando hipteses), poderemos fazer a
anlise de varincia. Essa anlise fundamental para que se possa fazer a comparao
de mdias. Por isso importantssimo que os conceitos apreendidos nas aulas anteriores
estejam bem claros. Volte e estude essas aulas sempre que necessrio.
Assim, nesta aula, iremos apresentar o conceito de fatores de variao, de varincia, erros
aleatrios e graus de liberdade. com essas informaes que voc poder realizar a anlise
das mdias ou resultados obtidos nos experimentos e aplicar os testes estatsticos que foram
apresentados na aula passada (Aula 5 - Testando hipteses).
Com esses conhecimentos apreendidos, voc dever ser capaz de fazer uma avaliao
de experimentos inteiramente casualizados e em blocos completos inteiramente casualizados
em experimentos de Biologia.
Objetivos
Conhecer os conceitos de fatores de variao, graus de
liberdade, fazer anlise de varincia de experimentos
inteiramente casualizados e em blocos completos
casualizados.
Compreender as situaes onde se pode utilizar anlise
de varincia corretamente.
Aula 6 Bioestatstica 104
Denindo anlise de varincia
J vimos na Aula 3 (Descrevendo sistemas) deste curso, os conceitos de varincia e
como se fazer a sua estimativa. Essa medida (a varincia) uma pea fundamental em qualquer
anlise ou investigao cientca, pois essa anlise da varincia que permite a comparao
de mdias e, assim, vericar se existe diferena signicativa entre elas ou no.
Alm disso, para fazer uma anlise de varincia, devemos ter cuidado em respeitar
algumas premissas bsicas:
1) A resposta da varivel que est sendo analisada deve ter uma distribuio normal.
2) Os tratamentos impostos, nos quais a resposta est sendo medida, devem apresentar
varincias iguais.
3) A aplicao dos tratamentos deve ser homognea em todas as unidades experimentais.
4) A distribuio das unidades experimentais deve ser aleatorizada dentro da rea
experimental.
Se essas quatro premissas no forem cumpridas, a anlise de varincia no pode ser
realizada. Voc pode testar a normalidade dos dados utilizando as informaes disponibilizadas
na Aula 3 (Descrevendo sistemas) e Aula 5 (Testando hipteses).
E quando os dados no tm distribuio normal ou apresentam varincias
diferentes?
Quando os dados no tm distribuio normal, eles podem ser analisados
utilizando estatstica no paramtrica. Todavia, esse tipo de anlise no ser
apresentado neste curso. J para as situaes onde a varincia diferente, pode-se
fazer uma transformao de variveis. No entanto, para escolher como fazer a
transformao adequada para cada situao, deve-se consultar um estatstico ou
discutir com pesquisadores experientes nessa rea de conhecimento.
Agora eu j sei calcular as varincias, conheo as premissas bsicas para sua anlise...
e agora, o que fao com essas informaes?
Aula 6 Bioestatstica 105
Anlise de varincia
Quando realizamos qualquer experimento ou coleta de dados, vrios fatores interferem
juntos e ao mesmo tempo nos resultados. Tome, por exemplo, o seguinte experimento:
Um pesquisador deseja avaliar o peso ao nascer de bezerros num rebanho bovino da
raa gir (Tabela 1).
Tabela 1 Peso ao nascer de bezerro num rebanho bovino da raa gir
Nmero do bezerro 1 2 3 4 5 6 7 8 9 10
Peso ao nascer (kg) 30 27 24 28 29 18 23 22 20 28
Observe que vrios fatores podem estar interferindo no peso ao nascer dos bezerros.
Entre as possveis causas de variao podemos citar:
sexo da cria;
efeito da linhagem paterna;
peso e alimentao da me;
idade e nmero de partos da me;
poca/estao de nascimento dos bezerros.
Algumas dessas fontes de variao podem ser agrupadas e controladas, outras no.
por esse motivo que se deve fazer a anlise de varincia, para se conseguir isolar os
fatores de variao impostos e controlados (os tratamentos) daqueles que so do acaso e
no se pode controlar. Assim, voc pode avaliar o efeito do que se quer medir (tratamento
experimental) sobre a varivel resposta e identicar se existe ou no diferena estatstica
signicativa entre as mdias obtidas nos resultados do experimento.
Para o exemplo da Tabela 1, os dados podem ser organizados em funo do touro
utilizado, ou do nmero de partos das vacas (matrizes) em primparas ou multparas etc...
Na anlise de varincia, podemos decompor os fatores de variao em, basicamente,
dois tipos:
Controlados So aqueles conhecidos a priori (antes de se iniciar o experimento) e
que reconhecidamente tm efeito sobre a varivel resposta que est sendo medida. Por
esse motivo, seus efeitos so medidos e entram no modelo estatstico.
Aleatrias ou do acaso So variveis desconhecidas (que no podem ser controladas)
e vo compor o erro experimental. Sempre que possvel, deve-se minimizar a ao de
variveis aletrias e do erro experimental.
Diferena
estatstica
signicativa
Indica a possibilidade
de que o resultado
encontrado no
experimento seja igual ao
existente na populao.
Primparas
Animais que s tiveram
um parto
Multparas
Animais que tiveram mais
de um parto.
Atividade 1
Aula 6 Bioestatstica 106
Anal, para isso que se faz planejamento de experimentos e se procura controlar a
aplicao dos tratamentos.
Assim, conhecendo-se as fontes de variao do experimento pode-se aplicar o modelo
estatstico adequado e fazer a contabilizao dos resultados atravs da anlise de varincia. Para
isso, os fatores de variao estudados so decompostos em funo dos seus graus de liberdade
e da soma de quadrados. Nesta aula, sero demonstradas tabelas de anlise de varincia em
experimentos inteiramente casualizados e em blocos completos inteiramente casualizados.
a) Qual a diferena entre varincia e anlise de varincia?
b) Quais as condies ou premissas para que um experimento possa ser
avaliado utilizando anlise de varincia?
c) Proponha um experimento para medir a produo de frutas de uma rea
plantada com cajueiro e identique os fatores de variao controlados e os
aleatrios.
d) Voc quer avaliar o peso ao nascer de bezerros em um rebanho da raa
gir. Assim, cite os possveis fatores de variao que tm ao sobre essa
varivel resposta (peso dos bezerros ao nascer) e faa sua classicao em
controlados e do acaso.
Graus de liberdade
um estimador do
nmero de categorias
independentes num
teste particular ou
experincia estatstica.
Encontram-se mediante a
frmula n 1, onde n
o nmero de elementos
correspondente ao fator
de variao na amostra.
Aula 6 Bioestatstica 107
Experimentos com delineamento
inteiramente casualizado
Um experimento tem delineamento inteiramente casualizado quando a varivel resposta
s sofre ao dos tratamentos impostos e do acaso.
Esse o delineamento experimental mais simples e por isso mesmo o mais forte, que
minimiza o erro experimental em relao aos tratamentos. Nesse tipo de delineamento os
tratamentos se distribuem ao acaso em todas as unidades experimentais e o nmero de
repeties por tratamento pode ser igual ou diferente, que no resultar em alteraes na
anlise. O delineamento inteiramente casualizado muito til para o estudo de mtodos e
tcnicas de trabalho de laboratrio, que normalmente tm condies uniformes.
Exerccio resolvido 1
Um pesquisador deseja avaliar 10 prognies de eucalipto (Eucalyptus saligna) em um
experimento inteiramente casualizado, com quatro repeties cada (Tabela 2).
Tabela 2 Dados mdios do dimetro a altura do peito (DAP) de parcelas de um experimento de competio
de 10 prognies de eucalipto (Eucalyptus saligna), em centmetros
Prognies P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 Total
16,0 14,3 14,7 13,6 11,6 11,0 13,1 10,3 8,5 8,2
16,4 14,5 15,6 13,1 10,5 15,0 10,3 13,2 8,6 8,4
14,1 13,8 11,6 14,7 15,9 10,7 14,3 10,2 9,5 9,3
11,7 14,6 15,0 15,1 14,0 13,0 10,5 13,0 9,4 9,2
Total 58,2 57,2 56,9 56,5 52,0 49,7 48,2 46,7 36,0 35,1 496,5
Dimetro a
altura do peito
A medio do
dimetro da rvore deve
ser feita a uma altura
de 1,30 metro do solo.
Prognies
O teste de prognie avalia
os pais pela comparao
do desempenho das suas
descendncias.
Aula 6 Bioestatstica 108
Soluo
1) Observar quais os fatores que podem inuenciar as variveis.
Nesse caso, temos o valor gentico da planta me como melhoradora (o que se deseja
avaliar), o solo, o clima, possveis infestaes de insetos ou doenas nas razes, gua etc.
Certamente a minha varivel resposta medida (o DAP) vai sofrer a interferncia de todos
esses fatores e outros tantos mais que so do acaso e no se pode controlar.
Todavia, neste exemplo, o fator de variao que se quer testar a prognie, e esse
devidamente controlado. Os demais so do acaso. Nesse caso, como um experimento
inteiramente casualizado este deve ser conduzido numa rea plana, onde no h variao de
tipo de solo e de umidade em nenhum local do terreno.
2) Observar as condies expressas no mtodo estatstico e formular as hipteses que sero
testadas (Aula 4 Elaborando hipteses). So elas:
H0: No existe diferena entre as mdias de DAP nas 10 prognies avaliadas.
H1: Pelo menos uma das 10 prognies avaliadas difere das demais.
3) Escolher o teste mais adequado.
Nesse caso, utilizaremos o teste de Tukey, que minimiza erro tipo II (Aula 5 Testando hipteses).
4) Observar se os dados tm distribuio normal.
Isso pode ser realizado fazendo um grco com todos os dados, que dever ter formato de
sino e/ou testando a varincia. Para o caso analisado, os dados obedecem a essas duas condies.
5) Observando os fatores de variao analisados, voc ver que a nica diferena entre os
tratamentos a Prognie (P), que vai de 1 a 10.
Como o nmero de graus de liberdade (GL) medido pela frmula: GL = n 1, onde
n = nmero de parmetros do fator de variao. O GL da Prognie ser:
GL
Prognie
= 10 1 = 9.
6) Determine o total de parcelas e o grau de liberdade total.
O total de parcelas do experimento de 40 (10 Prognies 4 repeties cada). Assim,
o GL total ser:
GL
Total
= 40 1 = 39
7) Calcule o grau de liberdade do erro.
O GL do erro calculado pela diferena entre o GL
Total
e o GL
Prognie
que ser:
GL
Erro
= 39 9 = 30
Aula 6 Bioestatstica 109
8) Complete o quadro de anlise de varincia (ANAVA):
Fator de variao GL SQ QM Valor de F calculado Nvel de signicncia
Prognie 9
Erro 30
Total 39
SQ e QM signicam, respectivamente, Soma de Quadrados e Quadrado Mdio do Erro, que
corresponde a varincia.
9) Determine a Soma de Quadrados Total, dos Tratamentos e do Erro Experimental. Para isso,
voc deve calcular o Fator de Correo e, em seguida, a Soma de Quadrados Total, a dos
Tratamentos e a do Erro, nessa ordem.
a) Calcule o Fator de Correo (C), que deve ser utilizado no clculo da Soma de Quadrados
Total (SQT) e Soma de Quadrados dos Tratamentos (SQTrat)
C =

X
2
n
=
(496,5)
2
40
= 6.162,80
b) A Soma dos Quadrados Total (SQT) corresponde varincia total do experimento, e
calculada utilizando-se a seguinte frmula:
SQTotal =

X
2
C = 6401,35 6162,41 = 238,54, onde

x
2
= 16
2
+ 16,4
2
+. . . + 14,3
2
+ 15
2
. . . + 9,2
2
= 6401,35
E C o fator de correo j calculado anteriormente, 6162,80.
c) A Soma dos Quadrados dos Tratamentos (SQTrat ) permite isolar e quanticar a varincia
relacionada aos tratamentos.
SQTrat =

Xtrat
2
r
C
Onde:


Xtrat
2
calculado pela soma de quadrados dos tratamentos, utilizando a seguinte
frmula:

Xtrat
2
= (58,20)
2
+ (57,2)
2
+ (56,9)
2
+ (56,5)
2
+ (52,0)
2
+ (49,7)
2
+ (48,2)
2
+
+(46,7)
2
+ (36,0)
2
+ (35,1)
2

Xtrat
2
= 25295,17
O valor de r dado pelo nmero de repeties de cada tratamento. Para este exemplo,
o valor de r ser 4, pois foram utilizadas quatro repeties por cada tratamento (Prognie).
O C o Fator de Correo (6126,41), o mesmo que j foi calculado anteriormente
para a SQ
Total
.
Da:
SQTrat =

Xtrat
2
r
C =
25295,17
4
6162,41 = 6323,79 6162,41 = 160,98
ANAVA
Voc pode encontrar
como sinnimo de ANAVA,
o acrnimo ANOVA,
originado do termo
em ingls Analysis of
Variance cuja traduo
Anlise de Varincia.
Frmula
Os dados apresentados
no desenvolvimento
correspondem a soma
de todos os valores
da Tabela 2 (Dados
mdios do dimetro
a altura do peito
(DAP) de parcelas
de um experimento
de competio de 10
prognies de eucalipto
(Eucalyptus saligna), em
centmetros) elevados
ao quadrado.
Aula 6 Bioestatstica 110
d) Soma dos Quadrados do Erro (SQ
Erro
)
A Soma dos Quadrados do Erro (SQ
Erro
) calculada pela diferena entre a SQTotal e o
SQTrat. Assim teremos:
SQ
Erro
= SQ
Total
SQ
Trat
Como o SQ
Total
= 238,54 e o SQ
Trat
= 160,98; teremos:
SQ
Erro
= SQ
Total
SQ
Trat
SQErro = 238,54 160,38
SQErro = 77,56
10) De posse dessas informaes, podemos preencher outra coluna da tabela de ANAVA
deste experimento:
Fator de variao GL SQ QM Valor de F calculado Nvel de signicncia
Prognie 9 160,98
Erro 30 77,56
Total 39 238,54
11) Determine os valores dos Quadrados Mdios (QM).
O valor do Quadrado Mdio calculado dividindo-se a SQ pelo respectivo GL. No se
calcula o valor de QMTotal, pois este no ter utilidade. Assim teremos:
Para a Prognie
QMProg enie =
160,98
9
= 17,89
QMErro =
77,56
30
= 2,59
12) Calcular o valor de F.
Este obtido pela razo entre o QM
Prognie
e QM
Erro
:
FCalculado =
QMProg enie
QMErro
=
17,89
2,59
= 6,91
13) Assim, a nossa tabela de ANAVA car da seguinte forma:
Fator de variao GL SQ QM Valor de F calculado Nvel de signicncia
Prognie 9 160,98 17,89 6,91 1%
Erro 30 77,56 2,59 -------- --------
Total 39 238,54 -------- --------- ---------
14) Como o valor de F calculado maior que o tabelado a 1% ,que 3,07, (anexo A) diz-se
que o resultado do experimento signicativo a 1% de probabilidade. Ou seja, existe 99%
de possibilidade de o que ocorreu no experimento ser verdade e acontecer na populao.
15) Como o valor de F calculado signicativo, esse resultado indica que existe diferena
entre as mdias avaliadas. Assim, com essa informao voc pode rejeitar H0 e aceitar H1.
F
o
n
t
e
:

P
i
m
e
n
t
e
l
-
G
o
m
e
s

e

G
a
r
c
i
a

(
2
0
0
2
)
.
Aula 6 Bioestatstica 111
Bom, agora voc j sabe que existe diferena entre pelo menos uma das mdias dos
tratamentos. Entretanto, o teste F (Valor de F calculado) no indica qual dos 10 tratamentos
avaliados tem mdia diferente. Assim, voc precisa calcular a diferena mnima signicativa
utilizando o teste de Tukey, que j havia sido previamente escolhido.
Para isto, voc deve:
1) Pegar os valores tabelados na tabela de amplitude estudentizada (anexo B) para o teste
de Tukey a 5% para 10 graus de liberdade da fonte testada (tratamento) e 30 graus de
liberdade do erro, que 4,82.
O clculo da diferena mnima signicativa (DMS) obtido da seguinte frmula:
DMS = q(10 : 30)

QMErro

r
= 4,82

2,59

4
= 3,88 cm
2) Em seguida, voc deve listar (organizar) os resultados (as mdias) dos tratamentos, de
forma decrescente (da maior para a menor), como na tabela abaixo:
P1 14,55
P2 14,30
P3 14,23
P4 14,13
P5 13,00
P6 12,43
P7 12,05
P8 11,68
P9 9,00
P10 8,78
3) Aps isso, calcule a diferena entre a maior mdia (14,55) e a DMS (3,88). O resultado
obtido foi 10,67. Assim, todas as mdias contidas no intervalo entre 14,55 cm e 10,67 cm,
so iguais entre si e receberam a mesma letra.
4) Em seguida, repita a operao com a segunda mdia mais alta e realize o mesmo processo,
at que voc no encontre mais diferena estatstica signicativa entre as mdias.
Utilizando os resultados dessa ANAVA, voc ter o seguinte resultado, da comparao
de mdias:
P1 14,55
P2 14,30
P3 14,23
P4 14,13
P5 13,00
P6 12,43
b
P7 12,05
b
P8 11,68
b
P9 9,00
b
P10 8,78
b
Atividade 2
1
2
Aula 6 Bioestatstica 112
Assim, como letras iguais indicam que as mdias no diferem entre si, voc pode
identicar que as mdias P1, P2, P3, P4 e P5 (
a
) so estatisticamente diferentes da P9 e P10 (
b
).
Vamos aplicar o conceito de anlise de varincia em experimentos inteiramente
casualizados?
Planeje um experimento com delineamento inteiramente casualizado, para testar
o efeito de 5 fontes de adubao nitrogenada sobre a produo de milho, usando
4 repeties para cada tratamento.
Num experimento inteiramente casualizado com 5 tratamentos e 4 repeties,
estudou-se o efeito de 5 carrapaticidas (tratamentos) no controle de carrapatos em
bovinos. Analisando- se o nmero de carrapatos que cairam por animal, obtiveram-se
as seguintes somas de quadrados: S.Q. Tratamentos = 41,08 e S.Q. Total = 57,46.
De posse dessas informaes, estabelea as hipteses estatsticas H0 e H1 e
monte o quadro de anlise de varincia desse experimento realizado inclusive o
valor calculado de F.
3
Aula 6 Bioestatstica 113
Os dados da Tabela 3 se referem a produes de matria seca de cultivares de sorgo
em t/ha. Utilizando este conjunto de dados estabelea as hipteses estatsticas H0
e H1, monte o quadro de anlise de varincia desse experimento, calcule o valor de
F e diga se existe diferena estatstica signicativa entre os tratamentos.
Tabela 3 Produes de matria seca de cultivares de sorgo em t/ha
CULTIVAR
REPETIES
1 2 3 4 5 6
A 10,27 11,55 11,68 11,38 11,20 11,24
B 9,77 9,96 10,18 11,94 10,43 10,49
C 9,86 9,59 9,99 10,43 9,85 10,03
D 21,22 20,62 22,33 19,89 21 20,78
E 20,20 20,55 22,12 20,78 20,90 20,92
E os experimentos
em blocos completos
inteiramente casualizados?
Antes de denir esse tipo de delineamento experimental, vamos reetir sobre o efeito de
fatores de variao parcialmente controlados. Por exemplo:
1) Suponha que voc quer montar um experimento no campo e observa que existe um
desnvel na rea, que pode favorecer o acmulo de gua e afetar (beneciar ou prejudicar)
os tratamentos que forem colocados l.
2) Voc planeja fazer um experimento no laboratrio, e observa que existe uma parte do
laboratrio que recebe insolao direta, atravs de uma janela. E, isso tambm pode
interferir no seu tratamento experimental.
FONTE DE VARIAO NO INTENCIONAL
Aula 6 Bioestatstica 114
E agora, o que fazer? Bom, voc pode conseguir outras reas que permitam instalar todo
o experimento num delineamento inteiramente casualizado (Figura 1).
Outra alternativa indicada para essa situao organizar todos os tratamentos impostos
de modo que eles recebam o efeito desses fatores de variao parcialmente controlados
(aqui citados o desnvel do terreno e a insolao) de forma uniforme para todos (Figura 2).
Assim, voc no estaria beneciando ou prejudicando nenhum e controlando parcialmente
esses fatores de variao.
a esse tipo de delineamento que denominamos blocos completos inteiramente
casualizados. Nesse caso, cada bloco dever conter uma repetio de cada um dos tratamentos
experimentais, distribudos aleatoriamente.
Desse modo, os blocos podem ser convencionados como um fator de variao que ocorre
em uma s direo e perpendicular disposio dos tratamentos.
Figura 1 Delineamento inteiramente casualizado
Figura 2 Delineamento em blocos completos inteiramente casualizados
Aula 6 Bioestatstica 115
Nesse tipo de delineamento experimental, uma parte da Soma de Quadrados do Erro
Experimental transferida para testar o efeito dos blocos sobre as mdias. Por outro lado,
possibilita a uniformizao da aplicao dos tratamentos.
Um exemplo prtico desse tipo de situao dado ao se tentar implantar um experimento
numa rea que tem uma determinada declividade que favorece o acmulo de gua. Isso pode
beneciar ou prejudicar a produo ou os tratamentos experimentais que se localizem nessa rea.
Exerccio resolvido 2
Para este exemplo, vamos utilizar o mesmo experimento da avaliao de prognies de
eucalipto utilizada para o exemplo de delineamento inteiramente casualizado, com uma pequena
alterao: todas as linhas constituiro blocos. Assim, o nosso conjunto de dados caria da
seguinte forma:
Prognies P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 Total
Bloco 1 16,0 14,3 14,7 13,6 11,6 11,0 13,1 10,3 8,5 8,2 121,3
Bloco 2 16,4 14,5 15,6 13,1 10,5 15,0 10,3 13,2 8,6 8,4 125,6
Bloco 3 14,1 13,8 11,6 14,7 15,9 10,7 14,3 10,2 9,5 9,3 124,1
Bloco 4 11,7 14,6 15,0 15,1 14,0 13,0 10,5 13,0 9,4 9,2 125,5
Total 58,2 57,2 56,9 56,5 52,0 49,7 48,2 46,7 36,0 35,1 496,5
Assim, o quadro da anlise de varincia (ANAVA) ser:
Fator de variao GL SQ QM Valor de F calculado Nvel de signicncia
Prognie 9
Bloco 3
Erro 27
Total 39
SQ e QM signicam, respectivamente, Soma de Quadrados e Quadrado Mdio do Erro, que corresponde
varincia.
27
Observe que o valor
dos Graus de Liberdade
do Erro no quadro da
ANAVA 27 da anlise
em blocos completos
menor que no inteiramente
casualizado (30). Essa
diferena, corresponde
justamente ao nmero de
blocos (4) menos 1.
Soluo
1) Inicialmente, deve-se calcular o Fator de Correo (C) do experimento,
utilizando a seguinte frmula:
C =

X
2
n
=
(496,5)
2
40
= 6.162,80
2) A Soma de Quadrados do Experimento (SQ Total ) calculada da mesma
forma que para delineamentos inteiramente casualizados:
Aula 6 Bioestatstica 116
SQTotal =

X
2
C = 6401,35 6162,41 = 238,54, onde

x
2
= 16
2
+ 16,4
2
+. . . + 14,3
2
+ 15
2
. . . + 9,2
2
= 6401,35
E C o fator de correo j calculado anteriormente, 6162,80.
3) A Soma de Quadrados da Prognie (SQTrat) tambm calculada de forma
semelhante ao delineamento interiamente casualizado. Assim teremos:
SQTrat =

Xtrat
2
r
C
onde:

Xtrat
2
= (58,20)
2
+ (57,2)
2
+ (56,9)
2
+ (56,5)
2
+ (52,0)
2
+ (49,7)
2
+ (48,2)
2
+
+(46,7)
2
+ (36,0)
2
+ (35,1)
2

Xtrat
2
= 25295,17
C o Fator de Correo anteriormente calculado (6162,41).
Assim, o SQTrat ser:
SQTrat =

Xtrat
2
r
C =
25295,17
4
6162,41 = 6323,79 6162,41 = 160,98
4) A Soma de Quadrados dos Blocos (SQBloco) permite quanticar a varincia
dos blocos, e calculada da seguinte forma:
SQBloco =

XBloco
2
k
C
Onde,

XBloco
2
o somatrio ao quadrado dos valores de cada bloco
k o nmero de blocos
C o Fator de Correo, j calculado.
Assim, teremos o seguinte clculo:
SQBloco =

XBloco
2
k
C =
61640,11
10
6162,41 = 6164,11 6162,41 = 1,61
5) A Soma de Quadrados do Erro (SQ
Erro
) calculada pela diferena:
SQ
Erro
= SQ
Total
SQ
Bloco
SQ
Trat
SQ
Erro
= 238,54 1,60 160,38 = 76,56
Observe que o conjunto de dados foi o mesmo do Exerccio Resolvido 1, entretanto
o valor da SQErro foi menor. Isso se deve ao fato de que parte do erro experimental
Aula 6 Bioestatstica 117
foi transferida para os blocos, a m de quanticar o efeito dessa fonte de variao
sobre o experimento.
6) Agora, de posse dessas informaes, podemos preencher outra coluna da
tabela de ANAVA desse experimento:
Fator de variao GL SQ QM Valor de F calculado Nvel de signicncia
Prognie 9 160,98
Bloco 3 1,61
Erro 27 76,56
Total 39 238,54
7) Em seguida, devemos calcular os valores dos Quadrados Mdios:
O valor do Quadrado Mdio calculado dividindo-se o SQ pelo respectivo GL.
No se calcula o valor do QMTotal, pois este no ter mais utilidade para a
anlise do experimento. Assim teremos para:
QMProg enie =
160,98
9
= 17,89
QMBloco =
1,61
3
= 0,53
QMErro =
76,56
27
= 2,84
8) Calcular o valor de F calculado pela razo entre o QM
Prognie
e QM
Erro
:
FCalculado =
QMProg enie
QMErro
=
17,89
2,84
= 6,28
9) Assim, a nossa tabela de ANAVA car da seguinte forma:
Fator de variao GL SQ QM Valor de F calculado Nvel de signicncia
Prognie 9 160,98 17,89 6,28 1%
Bloco 3 1,61 0,54 -------- --------
Erro 27 76,56 2,59 ---------- ----------
Total 39 238,54 ---------- ---------- ----------
10) Como o valor de F calculado tambm maior que o tabelado a 1%
(que 3,07) diz-se que o resultado do experimento signicativo a 1% de
probabilidade. Todavia, observe que houve reduo no valor de F calculado.
11) No mais, os resultados continuam iguais aos do experimento anterior e voc
obtm a mesma resposta: as mdias P1, P2, P3, P4 e P5 so estatisticamente
diferentes da P9 e P10.
Atividade 3
1
Aula 6 Bioestatstica 118
Outros tipos de delineamento
experimental e arranjo estatstico
Alm do delineamento inteiramente casualizado e em blocos completos, existe tambm
o delineamento em quadrado latino.
Nesse caso, os fatores de variao atuam no experimento em dois sentidos (perpendicular
e paralelo) em relao rea experimental. Para trabalhar com esse tipo de delineamento
experimental e os arranjos estatsticos em fatorial e parcela subdividida, recomenda-se consulta
a um estatstico para denir a melhor forma de anlise e o nmero mnimo de repeties de
cada tratamento.
Vamos agora aplicar o conceito de anlise de varincia e resolver alguns exerccios
realizando a Atividade 3?
Quais so as caractersticas de um delineamento em blocos casualizados? E quais
as vantagens e desvantagens em sua aplicao?
2
3
Aula 6 Bioestatstica 119
Em um experimento planejado para vericar o efeito de alguns porta-enxertos para
citros no desenvolvimento da laranjeira pera, Mouro Filho ensaiou vrias medidas,
como a altura das rvores, volume da copa, dimetro do tronco, produo de frutos
etc. Foram utilizados 5 porta-enxertos, divididos em quatro blocos, pois o ambiente
utilizado para o experimento apresentava pequenas variaes de insolao. Os porta-
enxertos utilizados foram:
T1 = limoeiro cravo T4 = laranjeira caipira
T2 = laranjeira trifoliata T5 = tangerineira clepatra
T3 = limoeiro volkamericano
A varivel que estudaremos ser o nmero mdio de frutos por p nas parcelas. Os dados
se encontram na tabela a seguir.
Tabela 4 Nmero mdio de frutos de laranjeira pera enxertada sobre 5 porta-enxertos
Cultivar
Repeties
B1 B2 B3 B4
T1 143,25 224,25 211,50 231,50
T2 106,25 185,00 161,25 157,25
T3 110,75 85,00 109,50 94,50
T4 318,75 297,50 289,50 376,25
T5 274,25 281,00 297,75 305,75
Planeje um experimento para comparar trs frmulas de adubao no crescimento
de Pinus, supondo que voc dispe de um terreno heterogneo que deve ser dividido
em cinco blocos. Faa o croqui da rea.
Aula 6 Bioestatstica 120
Com base nessas informaes:
a) Identique os itens a seguir: o fator; nveis; varivel resposta; unidade de anlise; nmero
de repeties; nmero de ensaios.
b) Quais as hipteses a serem testadas sobre o experimento. Faa a tabela de anlise de
varincia e interprete.
Resumo
Aula 6 Bioestatstica 121
Nesta aula, voc aprendeu o conceito de anlise de varincia e viu tambm como
ela fundamental para que se possa fazer a comparao de mdias. Voc viu o
conceito de fatores de variao, de varincia, erros aleatrios e graus de liberdade,
conceitos essenciais para realizar a anlise das mdias ou resultados obtidos nos
experimentos. Em seguida, voc aprendeu como aplicar os testes estatsticos e
foi capaz de fazer uma avaliao de experimentos inteiramente casualizados e
em blocos completos inteiramente casualizados em experimentos de Biologia.
c) Aplique o teste de comparao de Tukey ao nvel de 5% de signicncia para as mdias
dos tratamentos do experimento do exerccio anterior, e interprete os resultados.
Aula 6 Bioestatstica 122
Autoavaliao
Um estudo sobre adubao nitrogenada na cultura do arroz irrigado testou
quatro formas de aplicao desse macronutriente: A1 = 80 kg/ha no plantio;
A2 = 40 kg/ha no plantio e 40 kg/ha 40 dias aps a emergncia (DAE);
A3 = 13,2 kg/ha no plantio e 66,8 kg/ha aos 40 DAE; e A4 = 13,2 kg/ha no
plantio e 33,4 kg/ha aos 40 e aos 60 DAE. O experimento tinha oito repeties,
e os dados de produo de gros em kg/ha esto na tabela a seguir.
Tabela 5 Dados de produo de arroz irrigado, em kg/ha, no delineamento inteiramente casualizado, com quatro
tratamentos e oito repeties
Tratamentos
Repeties
1 2 3 4 5 6 7 8
A1 6.276 6.035 6.086 5.594 6.321 6.746 5.751 6.191
A2 7.199 6.890 6.586 7.149 6.657 6.210 6.128 6.393
A3 6.457 6.174 6.612 6.087 5.797 5.865 6.498 6.486
A4 7.202 7.173 7.169 6.590 6.444 6.740 6.370 7.270
Utilizando os dados da tabela acima, faa uma anlise estatstica completa (estatstica
descritiva, teste de normalidade, ANAVA e teste de comparao de mdias) e estabelea
concluses ao nvel de 5% de signicncia.
Anotaes
Aula 6 Bioestatstica 123
Referncias
CALLEGARI-JACQUES, Sdia M. Bioestatstica: princpios e aplicaes. Porto Alegre: Ed.
Artmed, 2003.
PIMENTEL-GOMES, F.; GARCIA, C. H. Estatstica aplicada a experimentos agronmicos e
orestais: exposio com exemplos e orientaes para uso de aplicativos. Biblioteca de cincias
agrrias Luiz de Queiroz. Piracicaba: FEALQ, 2002. v 1.
SAMPAIO, Ivan Barbosa Machado. Estatstica aplicada experimentao animal. Belo
Horizonte: Ed. Fundao de Ensino e Pesquisa em Medicina Veterinria e Zootecnia, 1998.
VIEIRA, Sonia. Introduo Bioestatstica. Rio de Janeiro: Ed. Campus, 1980.
Anotaes
Aula 6 Bioestatstica 124
Aula 6 Bioestatstica 125
ANEXO A
Valores de amplitude
total estudentizada (q) para uso no
teste de Tukey a nvel de 1% de probabilidade
Fonte: Pimentel-Gomes e Garcia (2002, p. 293).
Aula 6 Bioestatstica 126
ANEXO B
Valores de amplitude total
estudentizada (q) para uso no teste
de Tukey a nvel de 5% de probabilidade
Fonte: Pimentel-Gomes e Garcia (2002, p. 291).
Aula 6 Bioestatstica 127
Anotaes
Aula 6 Bioestatstica 128
Anotaes
Correlacionando informaes
7
Aula
1
2
3
Aula 7 Bioestatstica 131
Apresentao
Avaliar se existe associao entre duas caractersticas quantitativas o objetivo de
vrios estudos em Biologia, e para isto, so realizadas anlises de correlao. Nesta aula,
iremos compreender a importncia, a denio e quais os tipos de correlao existentes
entre duas variveis.
Veremos tambm os mtodos utilizados para avaliar a existncia de correlao entre
variveis: o diagrama de disperso e o coeciente de correlao. Aprenderemos como construir
um diagrama de disperso e como calcular o coeciente de correlao. Na aula, tambm existem
exerccios resolvidos e no resolvidos, para que voc teste os conhecimentos adquiridos.
Boa aula!
Objetivos
Denir o conceito de correlao entre variveis.
Distinguir os mtodos utilizados para avaliar a existncia
de correlao entre duas variveis.
Construir um diagrama de disperso e calcular o
coeciente de correlao entre as variveis.
Aula 7 Bioestatstica 132
Relacionando duas
caractersticas
No nosso dia a dia, quer no trabalho, na escola ou em casa, temos o costume de relacionar
alguns fatos que presenciamos. Por exemplo: Ser que h relao entre o nmero de horas
que me dedico aos estudos e minha nota nal? Ser que h relao entre o ato de beber gua
depois das refeies e o aumento de peso?
Relacionar
Fazer relao. Estabelecer
vnculo entre coisas
diferentes.
F
o
n
t
e
:

<
h
t
t
p
:
/
/
e
s
c
o
l
a
p
r
o
f
.


l
e
s
.
w
o
r
d
p
r
e
s
s
.
c
o
m
/
2
0
0
9
/
0
3
/
c
o
m
p
u
t
a
d
o
r
.
j
p
g
>
.

A
c
e
s
s
o

e
m
:

3
1

m
a
r
.

2
0
1
0
.
Todos estes questionamentos se referem ao querer saber se h relao entre uma varivel,
que podemos cham-la de x (por exemplo, nmero de horas na frente do computador) e outra
varivel que podemos cham-la de y (por exemplo, dor de cabea).
Em sistemas biolgicos no diferente
Em estudos de sistemas biolgicos, comum vermos os pesquisados avaliando a
existncia de relao entre duas variveis de interesse.
Por exemplo: Um bilogo pode estar interessado em saber se h relao entre a quantidade
de chumbo medida na gua e o volume de dejetos (ou de esgoto) despejados em um rio.
Quando se pode demonstrar que existe relao ou associao entre duas variveis
quantitativas, isto , quando se constata que elas variam juntas, diz-se que as variveis
esto correlacionadas.
Assim, podemos denir correlao como o estudo do comportamento conjunto
de duas variveis.
Atividade 1
Aula 7 Bioestatstica 133
Mesmo sem dispor de dados, que tipo de relao voc acha que existe entre as
situaes abaixo:
1) Intensidade luminosa de uma planta e seu desenvolvimento.
2) Qualidade da alimentao e o nvel de colesterol no sangue.
3) Quantidade de gua parada e o desenvolvimento das larvas do mosquito da dengue.
4) Reclamao de clientes e a qualidade do produto.
5) Popularidade de um governo e indicadores econmicos.
Aula 7 Bioestatstica 134
Como avaliamos a correlao
entre duas variveis?
Para avaliar a correlao entre duas variveis, inicialmente apresentamos os dados em
forma de um grco de pontos, denominado diagrama de pontos ou diagrama de disperso.
Este diagrama permite visualizar a relao entre as duas variveis.
Mas como podemos construir esse diagrama?
A resposta simples: Vamos tomar como exemplo as informaes sobre a altura dos
alunos do segundo semestre do curso de Cincias Biolgicas que utilizamos na Aula 1 (O que
Bioestatstica) e acrescentar mais uma varivel a ser medida: o peso destes alunos.
Assim, para construir um diagrama de disperso voc deve:
1) Coletar os dados das variveis x e y que pretende correlacionar. No nosso exemplo, podemos
chamar de varivel x a altura dos alunos e de varivel y, o peso dos mesmos, conforme
podemos visualizar na tabela abaixo.
Tabela 1 Altura (m) e peso (Kg) dos alunos do segundo semestre do Curso de Cincias Biolgicas
Altura dos alunos do segundo semestre Peso dos alunos do segundo semestre
1,67 56,0
1,87 89,2
1,88 90,6
1,89 93,6
1,78 60,5
1,89 91,4
1,9 95,8
1,76 62,4
1,94 95,0
1,95 99,0
2) Em seguida, voc deve traar um sistema de eixos cartesianos, representando uma varivel
em cada eixo, ou seja, a varivel que chamamos de x, a altura dos alunos, deve ser colocada
no eixo X e a varivel que chamamos de y, o peso dos alunos, deve ser colocada no eixo
Y. Caso voc no se lembre como se constri um grco com eixo X e Y, volte s Aulas 5
(Dados quantitativos: como organiz-los?) e 6 (Distribuio de freqncias: apresentao
grca) da disciplina de Matemtica e Realidade.
3) O prximo passo marcar pontos nesse grco, de modo que, para cada valor de x,
voc tenha um valor de y correspondente. Por exemplo: se pela nossa tabela x for 1,67m,
y ser 56kg. Isso deve ser feito para todos os dados disponveis na tabela.
4) Note que, ao ir acrescentando os dados de x e y, teremos pontos especcos no grco
representando estes pares de dados (altura e peso).
5) Na sequncia, escreva os nomes das variveis nos respectivos eixos, bem como o ttulo
do diagrama. E est pronto o nosso diagrama de disperso.
Altura (m) e peso (Kg) dos alunos do
segundo semestre de Biologia
1,6
0
20
40
60
80
100
P
e
s
o

(
K
g
)
Altura(m)
120
1,7 1,8 1,9 2
Coletar os dados das variveis
que deseja estudar
Traar um grco com eixos cartesianos
(X e Y), representando uma varivel em cada eixo
Escrever os nomes das variveis nos
seus respectivos eixos
Fazer um ponto que represente cada
par de valores X e Y
Escrever o ttulo e se for o caso,
complementar com uma legenda
Aula 7 Bioestatstica 135
Figura 1 Altura (m) e peso (Kg) dos alunos do segundo semestre do Curso de Cincias Biolgicas
Entretanto, voc deve notar que, o diagrama acima representado foi feito em computador,
utilizando a planilha eletrnica no Excel. Para voc fazer esse mesmo diagrama utilizando papel
milimetrado, voc deve seguir os passos representados no esquema a seguir (Figura 2).
Importante
Para desenhar o diagrama de disperso, escolha as escalas de tal maneira que a
gura parea quadrada. Este cuidado ajuda a obter melhor viso da associao
entre as variveis.
Figura 2 Sequncia de procedimentos para a construo de um diagrama de disperso em papel milimetrado
Atividade 2
Aula 7 Bioestatstica 136
Utilizando os dados da Tabela 2, faa um diagrama de disperso no papel milimetrado a
seguir e repita o mesmo exerccio fazendo-o em planilha eletrnica do Excel ou Calc.
Tabela 2 Quantidade de lixo (m
3
) produzida de acordo com o nmero de dormitrios das residncias
Nmero de dormitrios Volume de lixo
1 1
2 3
3 6
4 8
Papel milimetrado para a construo do diagrama de disperso:
Mas como interpretar o diagrama de disperso?
Para isso, voc deve observar a direo dos pontos.
Note que, no nosso exemplo, medida que aumenta a altura dos alunos, aumenta tambm
o peso dos mesmos. Nesse caso, podemos armar que as variveis altura e peso esto
correlacionadas e, medida que uma aumenta, a outra aumenta tambm. Assim, podemos
dizer que estas variveis apresentam correlao positiva.
Diagramas de disperso que mostram correlao positiva entre as variveis
Diagramas de disperso que mostram correlao negativa entre as variveis
Correlao fraca Correlao forte Correlao perfeita
Correlao fraca Correlao forte Correlao perfeita
Diagrama de disperso que mostra correlao nula entre as variveis
Aula 7 Bioestatstica 137
Se tivssemos um comportamento diferente, ou seja, medida que aumenta a altura dos
alunos, diminui o peso, mesmo assim teramos uma correlao entre as variveis, porm esta
seria uma correlao negativa.
Se no houvesse nenhuma relao entre a altura dos alunos e o peso, no teramos
correlao entre as variveis, ou seja, sem correlao.
Quando alm de observarmos a direo dos pontos, tambm observamos sua disperso,
podemos ter mais dois outros subtipos de correlaes positivas e negativas:
Correlao forte: Quando h menor disperso dos pontos.
Correlao fraca: Quando h maior disperso dos pontos.
Correlao perfeita: Quando no h disperso dos pontos (formam uma linha).
Estes tipos de comportamentos entre as variveis quando analisadas do ponto de vista
da direo e disperso dos pontos podem ser ilustrados pelas guras abaixo:
Figura 3 Diagramas de disperso
Fonte: <www.lugli.org/2008/02/diagrama-de-dispersao/>. Acesso em: 31 mar. 2010.
Atividade 3
0
8
10
12
14
16
18
20
22
24
26
100 200 300 400
M

d
i
a

d
a

t
a
x
a

d
e

m
o
r
t
a
l
i
d
a
d
e

p
a
r
a

o

s
e
x
o

F
e
m
i
n
i
n
o

(
1
0
0
0
0
0

p
e
s
s
o
a
s

a
n
o
)
Consumo mdio de Vegetais (gr/pessoas/dia)
0
0
10
20
30
40
50
60
100 200 300
D
i
a
s

d
e

S
o
b
r
e
v
i
v

n
c
i
a
Peso Inicial da Fmea (mg)
Aula 7 Bioestatstica 138
De acordo com as guras abaixo, classique as correlaes em positivas e negativas e
em fortes, fracas e perfeitas.
1) Relao entre o consumo mdio de vegetais e a taxa de mortalidade para o sexo feminino.
Fonte: <http://www.scielo.br/img/revistas/rsp/v9n3/09f2.gif>.
Acesso em: 31 mar. 2010.
Fonte: <stat2.med.up.pt/cursop/glossario/rregressao.html>.
Acesso em: 31 mar. 2010.
2) Relao entre peso inicial das vacas com os dias de sobrevida quando submetidas a jejum.
N. de Sementes vs. SST
C1
C1A
C1B
C1C
C1D
C2
C2A
C2B
C2C
C2D
C3
C3A
C3B
C3C
C3D
Sementes
S
S
T
7,0
6,6
6,2
5,8
5,4
5,0
4,6
5 6 7 8 9 10 11 12 13 14
Aula 7 Bioestatstica 139
3) Mdia do nmero de sementes e a quantidade de slidos solveis totais de carambolas.
Fonte: <http://www.scielo.br/img/fbpe/sa/v58n1/a15g02.gif>.
Acesso em: 31 mar. 2010.
H outra maneira de avaliar a
correlao entre duas variveis?
Sim. Alm do diagrama de disperso, h outro mtodo para avaliar a correlao entre
duas variveis, e este feito atravs do clculo do Coeciente de Correlao.
O coeciente de correlao uma medida do grau de associao entre duas variveis
e sua frmula de clculo foi proposta por Karl Pearson em 1896. Por este motivo, ele
tambm conhecido como Coeciente de Correlao de Pearson (r) e pode ser obtido
atravs da frmula:
Onde:
xy = Somatrio dos valores de x vezes os valores de y;
x = Somatrio dos valores de x;
y = Somatrio dos valores de y;
x
2
= Somatrio de x ao quadrado;
(x)
2
= Somatrio de x vezes somatrio de x;
x
2
= Somatrio de y ao quadrado;
y
2
= Somatrio de y vezes somatrio de y;
n = nmeros de amostras.
r =

xy

y
n

_
_

x
2

_
x
_
2
n
_

y
2

_
y
_
2
n
_
Aula 7 Bioestatstica 140
Importante
O valor de r varia entre 1 e +1:
Se r = 1, diz-se que as duas variveis tm correlao perfeita positiva.
Se r = 1, diz-se que as duas variveis tm correlao perfeita negativa.
Se r = 0, diz-se que no existe correlao entre as variveis, ou seja, correlao nula.
Para entender como se aplica a frmula para calcular o valor de r, observe o Exerccio
Resolvido 1.
Exerccio Resolvido 1
A Tabela 3 ilustra a taxa de mortalidade infantil e a taxa de analfabetismo no Brasil,
de acordo com cada regio brasileira. Utilizando a frmula acima, calcule o coeciente de
correlao r e interprete a correlao entre as variveis.
Tabela 3 Taxa de mortalidade infantil e taxa de analfabetismo no Brasil, segundo cada regio
Regio Taxa de mortalidade Taxa de analfabetismo
Norte 35,6 12,7
Nordeste 59 29,4
Sudeste 25,2 8,6
Sul 22,5 8,3
Centro-Oeste 25,4 12,4
Resoluo
1) O primeiro passo determinar qual varivel representar a letra x e qual representar a letra y.
Nesse caso, vamos escolher x para a taxa de mortalidade e y para a taxa de analfabetismo.
2) Em seguida, devemos calcular os valores de x
2
, y
2
, xy, (x)
2
e (y)
2
, pedidos na frmula.
Assim temos:
X (mortalidade) Y (analfabetismo)
x
2
(mortalidade
ao quadrado)
y
2
(analfabetismo ao
quadrado)
xy
(mortalidade vezes
analfabetismo)
35,6 12,7 1267,36 161,29 452,12
59 29,4 3481 864,36 1734,6
25,2 8,6 635,04 73,96 216,72
22,5 8,3 506,25 68,89 186,75
25,4 12,4 645,16 153,76 314,96
167,7 71,4 6534,81 1322,26 2905,15
(x)
2
= 28123,29 (y)
2
= 5097,96
Atividade 4
Aula 7 Bioestatstica 141
3) Depois de calculado os somatrios de x, y, x
2
, y
2
, xy,(x)
2
e (y)
2
(em destaque na tabela
acima), s colocar os valores na frmula:
4) Para interpretarmos esse valor, devemos ter em mente que o valor de r varia entre 1 e +1.
Se obtiver valores fora deste intervalo, pode ter certeza que voc errou nos clculos.
No caso do exerccio acima, o valor de r, positivo e muito prximo de 1. Ento, existe forte
correlao positiva entre as variveis. Isto signica que ocorrem mais mortes de menores de
um ano nas regies em que existe maior nmero de analfabetos.
r =
2905, 15
167, 7 71, 4
5

_
6534, 81
28123, 29
5
_

_
1322, 26
5097, 96
5
_
Calcule o coeciente de correlao utilizando a frmula de Pearson para os dados
(hipotticos) de um laboratrio de hematologia apresentados na Tabela 4 e interprete a
correlao entre as variveis leuccitos e eritrcitos:
Tabela 4 Resultados de exames hematolgicos para leuccitos e eritrcitos
Leuccitos (mm
3
) Eritrcitos (mm
3
)
6.8 4.50
9.7 5.20
4.3 4.55
7.9 4.65
7.4 4.40
7.6 4.40
2.8 4.30
7.8 4.60
5.5 4.90
4.6 4.10
8.0 5.00
7.0 5.17
7.1 4.20
5.9 4.40
12.3 4.24
r = 0,9724
Resumo
1
Aula 7 Bioestatstica 142
Nesta aula, voc aprendeu que duas variveis podem ou no estar relacionadas
ou associadas. Este o conceito de correlao, ou seja, o estudo do
comportamento conjunto entre duas variveis. Estudou que as variveis podem
se comportar de vrias maneiras, ou seja, apresentam diferentes tipos de
correlao: correlao positiva, quando apresentam comportamento na mesma
direo; correlao negativa, quando apresentam comportamento em direes
opostas; e aquelas que no apresentam correlao. Voc estudou tambm que
as correlaes podem ser fortes e fracas, de acordo com a disperso de seus
pontos. Voc viu que a correlao pode ser obtida de duas maneiras: uma
atravs da construo do diagrama de disperso ou diagrama de pontos e a
outra atravs do clculo do coeciente de correlao. Aprendeu como construir
um diagrama de disperso em planilha eletrnica e em papel milimetrado e
como calcular o coeciente de correlao, usando a frmula desenvolvida por
Pearson. Por m, voc calculou o coeciente de correlao e interpretou a
correlao existente entre as variveis analisadas.
Autoavaliao
Teste os conhecimentos adquiridos na aula de hoje, conceituando os seguintes termos:
a) Correlao:
b) Tipos de correlao de acordo com a direo:
Aula 7 Bioestatstica 143
Faa uma pesquisa com 15 pessoas, podendo ser seus familiares, vizinhos e amigos
e preencha a tabela abaixo:
Nmero de lhos Renda mensal (nmero de salrios mnimos)
2 lhos 3 salrios mnimos
Em seguida, usando os dados acima, calcule o coeciente de correlao, usando a frmula
de Pearson e interprete os resultados.
c) Tipos de correlao de acordo com a disperso dos pontos:
d) Diagrama de disperso :
e) Coeciente de correlao e os valores de r:
2
Aula 7 Bioestatstica 144
Referncias
CALLEGARI-JACQUES, Sdia M. Bioestatstica: princpios e aplicaes. Porto Alegre: Ed.
Artmed, 2003.
CORRELAO e regresso: [disciplina de mtodos quantitativos em medicina]. Disponvel em:
<http://www.dim.fm.usp.br/regressao/index.php>. Acesso em: 12 mar. 2010.
HOUAISS, Antonio; VILLAR, Mauro de Sales; FRANCO, Francisco Manoel de Mello. Dicionrio
Houaiss da lngua portuguesa. Rio de Janeiro: Editora Objetiva, 2001. 2922p.
SAMPAIO, Ivan Barbosa Machado. Estatstica aplicada experimentao animal. Belo
Horizonte: Ed. Fundao de Ensino e Pesquisa em Medicina Veterinria e Zootecnia, 1998.
VIEIRA, Sonia. Princpios de estatstica. So Paulo: Ed. Pioneira, 1999.
Anotaes
Aula 7 Bioestatstica 145
Anotaes
Aula 7 Bioestatstica 146
Anotaes
Anlise de regresso
8
Aula
1
2
3
4
5
6
Aula 8 Bioestatstica 149
Apresentao
V
oc estudou na Aula 7 - Correlacionando informaes, que empregamos a anlise de
correlao para avaliar o comportamento conjunto de duas variveis quantitativas.
Todavia, nem sempre esse o objeto de estudo. Isso se d especialmente nos casos
em que se precisa/deseja avaliar o comportamento de uma varivel (dependente) em funo
de outra (independente) e expressar matematicamente essa relao de causa e efeito. Nesse
caso, recomenda-se utilizar uma anlise de regresso para se avaliar os dados. E esse tipo
de anlise que iremos estudar nesta aula.
Nesta aula, voc ver o conceito de regresso, bem como os tipos de regresso existentes.
Vai conceituar variveis dependentes e independentes e conhecer e calcular o coeciente linear
e coeciente angular da reta. Alm disso, estudar a equao da reta que representa a regresso
linear e far exerccios que englobam todos os conceitos trabalhados.
Objetivos
Denir o conceito de regresso.
Denir o conceito de varivel dependente e independente.
Identicar as variveis dependentes e independentes em
uma situao problema.
Diferenciar os tipos de regresso.
Denir o conceito de regresso linear.
Aplicar os procedimentos de uma anlise de regresso
linear simples.
Aula 8 Bioestatstica 150
Uma questo de variao
No nosso cotidiano, estamos em contato com situaes ou fatos que dependem
exatamente uns dos outros.
Pense em um supermercado que vai aumentar o seu gasto com propaganda por que
dizem que quem no anuncia se esconde.
Vamos ento pensar no aumento do volume de vendas como funo do aumento dos
gastos com propaganda. Voc acha que existe uma relao exata entre essas variveis, isto ,
para cada real a mais gasto com propaganda haver um aumento xo no volume de vendas?
No bem assim.
H uma srie de fatores que podem inuenciar essa relao, tais como o aumento das
vendas em certas pocas do ano, o fato do volume de vendas tambm depender dos preos e
do aumento de salrio; depender da concorrncia e outros tantos motivos, e claro, tambm da
propaganda. Mesmo que conhecssemos todas as causas que explicam o volume de vendas em
um supermercado, ainda assim no saberamos prever exatamente o volume dessas vendas.
Nesse caso, queremos estabelecer uma relao de causa e efeito entre o aumento do
volume de vendas e o aumento dos gastos com propaganda, ou seja, ver o quanto o aumento
do volume das vendas varia em funo do aumento dos gastos com propaganda, e ainda
expressar matematicamente essa relao. E isso feito atravs da anlise de regresso.
Mas o que regresso?
Algumas vezes estamos interessados em saber no apenas se existe associao entre
duas variveis quantitativas x e y, como o caso da correlao (Aula 7 - Correlacionando
informaes), mas temos tambm uma hiptese a respeito de uma provvel relao de causa
e efeito entre variveis, ou como uma varivel varia em funo da outra.
Desse modo, a anlise de regresso refere-se ao estabelecimento dessa relao causa-efeito
entre duas variveis quantitativas e pode ser expressa matematicamente.
Assim, usa-se a anlise de regresso com duas nalidades:
1) Previso: Para prever o valor de uma varivel chamada de x a partir do valor de outra
varivel chamada de y.
2) Estimativa: Estima o quanto x inuencia ou modica y.
Atividade 1
1
2
Aula 8 Bioestatstica 151
Na Biologia, esse tipo de anlise, ou seja, anlise de regresso ou anlise de relao de
causa e efeito entre variveis muito utilizada em experimentos cujo objetivo determinar
como uma varivel varia em funo da outra.
Vamos ver alguns exemplos?
Se o pesquisador deseja saber se a quantidade de um determinado anestsico varia em
funo do tempo aps a sua administrao; se um bilogo quiser saber se o nvel de fsforo no
solo varia em funo da sua adubao; se um nutricionista quiser saber se o nvel de vitamina
no sangue varia em funo da ingesto de frutas, todos devero fazer uma anlise de regresso,
j que ela tem o poder de avaliar como uma varivel varia em funo da outra.
Regresso: Estudo de quanto uma varivel varia em funo da outra,
exprimindo uma relao de causa e efeito.
Agora que voc j conheceu o conceito de regresso, faa uma
comparao entre correlao e regresso.
Indique duas situaes em que um bilogo utilizaria uma anlise de
correlao e uma anlise de regresso.
Atividade 2
Aula 8 Bioestatstica 152
Conhecendo melhor
as variveis x e y analisadas
As variveis x e y a serem submetidas anlise de regresso recebem denominaes
especcas, dependendo de que tipo de relao queremos analisar.
Se desejamos saber se y depende de x, nesse caso, y chamada de varivel dependente
ou varivel resposta e x chamada de varivel independente ou varivel explanatria.
Caso contrrio, se desejamos saber se x depende de y, nesse caso, x chamada de
varivel dependente ou varivel resposta e y chamada de varivel independente ou
varivel explanatria.
Por conveno, vamos estabelecer que y ser sempre a nossa varivel dependente e x
a varivel independente.
Identique as variveis dependentes (y) e independentes (x) nos exemplos
abaixo:
a) Peso mdio dos alunos do curso de Biologia em funo da altura.
b) Funcionamento dos rins em funo da quantidade de gua ingerida durante o dia.
c) Nmero de batimentos cardacos em funo da intensidade da atividade fsica.
Aula 8 Bioestatstica 153
Mas h somente
um tipo de regresso?
A forma de regresso mais comumente utilizada a regresso linear, que se caracteriza
pela hiptese de que o valor de y depende do valor de x, e expressamos matematicamente
essa relao por meio de uma equao, assumindo que a associao entre x e y linear, ou
seja, descrita adequadamente por uma reta.
Mas, como curiosidade, tem-se ainda a regresso por potncia, regresso logartmica
e regresso exponencial, que so chamadas de regresso no linear.
A regresso linear pode ser:
Simples: Quando temos uma varivel dependente y e uma varivel independente x.
Mltipla: Quando temos uma varivel dependente y e mais de uma varivel independente,
x1, x2, x3... e assim por diante.
A regresso linear simples
Como vimos no pargrafo acima, a regresso linear simples se caracteriza pela dependncia
do valor de y em relao ao valor de x. Essa dependncia expressa matematicamente por meio
de uma equao descrita adequadamente por uma reta, chamada de reta de regresso linear.
Essa a reta que relaciona as variveis x e y e representada pela equao abaixo:
y = + x
Onde:
y = varivel dependente
= coeciente linear (valor de y quando x = 0)
= coeciente angular (inclinao da reta; aumento ou diminuio em y para cada aumento
de uma unidade em x)
x = varivel independente
Atividade 3
1
2
Aula 8 Bioestatstica 154
Agora, monte as equaes da reta com os seguintes valores de coecientes:
a) Coeciente linear = 1,54 Coeciente angular: 0,87
Nas equaes abaixo, identique o coeciente linear e o coeciente angular da reta:
a) y = 3,54 + 1,5 x
b) y = 0,87x + 3,87
c) y = 1,67 + 5,81 x
0
0
5
10
15
20
25
30
35
5 10 15 20
Tempo
Q
u
a
n
t
i
d
a
d
e

d
e

a
n
e
s
t

s
i
c
o

h
i
d
r
o
l
i
s
a
d
o
y = -0.98 + 2,16x
Aula 8 Bioestatstica 155
b) Coeciente linear = 4,76 Coeciente angular: 1,23
c) Coeciente linear = 3,76 Coeciente angular: 1,98
A reta de regresso
A seguir, temos um exemplo de reta de regresso que representa a quantidade de
anestsico hidrolisado no plasma de um paciente em funo do tempo decorrido aps a sua
administrao (Figura 1).
Figura 1 Quantidade de anestsico hidrolisado no plasma humano (L) em funo do tempo (minutos) decorrido
aps sua administrao
Atividade 4
Aula 8 Bioestatstica 156
Analisando a gura anterior, voc pode vericar que os pontos esto praticamente sobre
uma reta, a reta de regresso, e pode concluir que a quantidade de anestsico hidrolisado no
plasma varia em funo do tempo decorrido de sua administrao. E ainda que essa reta pode
ser representada pela equao:
y = 0,98 + 2,16 x
Mas o que isso signica?
Na equao anterior, que representa a reta de regresso linear da quantidade de anestsico
hidrolisado no plasma em funo do tempo decorrido de sua administrao, temos como
coeciente linear o valor de 0,98 e como coeciente angular o valor de 2,16.
O coeciente linear fornece a altura onde a reta corta os eixos das ordenadas (eixo X),
ou seja, o valor de y onde o x igual a zero.
O coeciente angular fornece o ngulo formado pela reta em relao ao eixo x. Assim,
um coeciente angular positivo, indica que a reta ser direcionada pra cima e para a direita,
medida que o valor de x aumenta. O contrrio se d no caso de uma equao com coeciente
angular negativo. Nesse caso, medida que o valor de x aumenta, a reta tende a crescer para
a direita e para baixo.
Entendeu o conceito? Vamos realizar a atividade abaixo, para xar esses conceitos.
Utilize as equaes abaixo e construa um grco para cada uma substituindo o
valor de x, por um nmero positivo (maior que zero) a sua escolha, totalizando
5 substituies.
a) y = 3 + 1,5x
b) y = 3 1,5x
c) y = 5 + 7x
d) y = 5 7x
Aula 8 Bioestatstica 157
Aula 8 Bioestatstica 158
Montando uma equao de regresso
Bom, agora que j sabemos o que so o coeciente linear e o coeciente angular da
regresso, podemos montar a equao que representa a reta. Para isso, vamos tomar como
exemplo a variao da quantidade de anestsico hidrolisado no plasma em funo do tempo
decorrido de sua administrao.
Para calcularmos os valores desses coecientes, usamos as frmulas abaixo:
Coeciente linear: = y

x
Coeciente angular:

xy

y
n

x
2

x)
2
n
Onde:

= estimativa do coeciente linear da reta


y
_
= mdia dos valores de y

= estimativa do coeciente angular da reta


x
_
= mdia dos valores de x
xy = somatrio de x*y
x = somatrio de x
y = somatrio de y
x
2
somatrio de x
2
n = nmero de amostras
Clculo dos coecientes
No exemplo da quantidade de anestsico hidrolisado no plasma humano, acima
apresentado, todos os clculos foram realizados manualmente e organizados em uma planilha.
Para entender como estimar o coeciente linear e o angular de uma equao, observe a
seqncia do Exerccio resolvido 1.
Exerccio resolvido 1
Elabore uma equao de regresso para estimar a quantidade de anestsico hidrolisado
no plasma humano em funo do tempo decorrido aps sua administrao.
Tempo (minutos)
Q
u
a
n
t
i
d
a
d
e

d
e

a
n
e
s
t

s
i
c
o

h
i
d
r
o
l
i
s
a
d
o

(
m
o
l
e
s
/
l
i
t
r
o
)
0
0
5
10
15
20
25
30
35
5 10 15 20
Quantidade de
anestsico hidrolisado
Aula 8 Bioestatstica 159
Soluo
1) O primeiro passo obter todos os valores da quantidade de anestsico e do tempo aps
sua administrao, representados na Tabela 1.
Tabela 1 Quantidade de anestsico hidrolisado (moles/litro) no plasma humano
e tempo (minutos) decorrido aps sua administrao
Tempo Quantidade de anestsico hidrolisado
2 3,5
3 5,7
5 9,9
8 16,3
10 19,3
12 25,7
14 28,2
15 32,6
2) Nomear as variveis.
A varivel dependente y ser a quantidade de anestsico e a varivel x ser o tempo.
3) Traar o grco de disperso de y em funo de x (gura 1).
Aula 8 Bioestatstica 160
4) Colocar os valores de x e y em uma tabela e calcular os valores de xy, x
2
e y
2
.
x y xy x
2
y
2
2 3,5 7 4 12,25
3 5,7 17,1 9 32,49
5 9,9 49,5 25 98,01
8 16,3 130,4 64 265,69
10 19,3 193 100 372,49
12 25,7 308,4 144 660,49
14 28,2 394,8 196 795,24
15 32,6 489 225 1062,76
somatrio 69 141,2 1589,2 767 3299,42
5) Agora s aplicar as frmulas:
a) Para calcular o coeciente angular:

xy

y
n

x
2

x)
2
n


=
1589,2
69.141,2
8
767
4671
8
= 2,16
b) Para calcular o coeciente linear da reta:

=
y
_

x
_
Mas antes disso precisamos ter a mdia de x (x
_
) e mdia de y (y
_
):
x =

x
n
x =
69
8
x = 8,62
y =

y
n
y =
141,2
8
y = 17,65
Agora aplicamos a frmula:
=
y
_

x
_
= 17,65 2,16 8,62
= 0,98
6) E o ltimo passo construir a equao da reta, substituindo as letras pelos valores calculados:
Equao da reta:
y = + x
y = 0,98 + 2,16 x
Atividade 5
Obter os valores da varivel dependente (y) e da
varivel independente (x) que sero analisadas
Traar o grco de disperso
Aplicar as frmulas do coeciente linear e do coeciente angular
Construir a equao da reta y = + x
Colocar os valores de x e y em uma tabela e calcular os somatrios de x, y, xy, x
2
e y
2
Etapas de uma anlise de
regresso linear simples
Aula 8 Bioestatstica 161
Resumindo as etapas
da regresso linear simples...
Figura 2 Etapas para a realizao de uma anlise de regresso linear simples
Fonte: Henrique Rocha de Medeiros.
Suponha que voc esteja estudando a relao entre a quantidade de um poluente
despejado por uma fbrica em um riacho, e o dano ecolgico nesse curso dgua, medido
por um escore de dano que vai de 0 a 20 (Tabela 2). Para vericar sua hiptese, voc precisa
fazer uma anlise de regresso. Assim, utilizando os valores da tabela abaixo, responda
o que se pede.
Aula 8 Bioestatstica 162
Tabela 2 Escore de dano ecolgico medido para diferentes concentraes de poluente no riacho
Quantidade de poluente (g/L) Escore de dano ecolgico
1 3
2 6
3 7
4 10
5 10
6 12
a) Identique as variveis dependentes e independentes.
b) Monte o diagrama de disperso utilizando o grco milimetrado abaixo.
c) Calcule os valores do coeciente angular e do coeciente linear da reta.
Aula 8 Bioestatstica 163
d) Monte a equao da reta de regresso e conclua se o escore da dano ecolgico est
variando em funo da quantidade de poluente de um riacho.
Coeciente de determinao
At agora vimos que as variveis x e y podem variar uma em funo da outra, e que
esse comportamento medido atravs da anlise de regresso, que representa, em uma reta,
o quanto a varivel y depende da varivel x.
Mas podemos nos perguntar: O quanto essa reta reete realmente o comportamento de
x e y? Quanto do que visualizamos na reta real?
A resposta est baseada na preciso e acurcia da reta, que reetida nos valores do
coeciente de determinao, representado pelo smbolo R
2
.
Aula 8 Bioestatstica 164
O coeciente de determinao (R
2
) um valor entre 0 e 1, que estima quanto da alterao
da varivel dependente (Y) em funo de mudanas na varivel independente (X) pode ser
explicada pela equao de regresso. Por esse motivo, o coeciente de determinao pode
ser denido como o grau de ajuste da reta de regresso estimada ao conjunto de dados.
Ele reete quo bem o modelo se ajusta ao conjunto de dados utilizados para elaborar a equao
e, por esse motivo, denota a fora da associao linear entre x e y.
Por isso, R
2
assume diferentes valores, sempre variando de zero a 1:
Se R
2
= 1: signica que a variao explicada responde por 100% da variao total.
Ou seja, a reta de regresso representa perfeitamente o conjunto de dados e toda a
variao de y est relacionada com a de x.
Se R
2
for diferente de zero e inferior a 1: signica que a variao explicada responde
por uma percentagem da variao total. Por exemplo: se R
2
= 0,81, indica que
aproximadamente 81% da variao em y est relacionada com a de x e que o restante
19% (100% 81%) explicado pelo acaso (outros fatores que no o x). Observe que
alguns pontos esto localizados fora da reta, mas prximo a mesma. Assim, nesse caso,
a equao representa quase que perfeitamente o conjunto de dados analisados.
Se R
2
for igual ou muito prximo a zero: quando isso acontece, signica que o valor
mdio de y (coeciente linear) a melhor projeo para qualquer valor de x. Ou seja, a
reta de regresso no representa os dados observados, e por isso mesmo no deve ser
utilizada para fazer inferncias sobre a populao.
Calculando o valor do
coeciente de determinao
O coeciente de determinao de uma equao pode ser estimado dividindo-se a soma
de quadrados da regresso pela soma de quadrados total da varivel resposta, que Y.
Soma de quadrados da regresso (SQ
REGRESSO
), estimada utilizando-se a seguinte equao:
SQ
REGRESSO
= b
_

_
n

i1
X
i
Y
i

_
n

i=1
X
i
__
n

i=1
Y
i
_
n
_

_
Soma de quadrados total (SQ
TOTAL
) estimada utilizando-se a equao abaixo:
SQ
TOTAL

=
_

_
n

i1
Y
2
i

_
n

i=1
Y
i
_
2
n
_

_
Aula 8 Bioestatstica 165
Calculando o coeciente de
determinao de uma equao de regresso
Para isso, vamos utilizar os dados do Exerccio resolvido 1.
Como os valores utilizados no clculo j foram estimados, para calcular o coeciente
angular e linear da equao, podemos utilizar esses resultados:
b = 2,16
n

i1
X
i
Y
i
= 1589,2
n

i=1
X
i
= 69
n

i=1
Y
i
= 141,2
_
n

i1
Y
2
i
_
= 3299,42
n = 8
Vamos precisar calcular apenas o valor de
_
n

i=1
Y
i
_
2
= 141,2
2
= 19937,44
Resolvendo-se a frmula, temos o seguinte:
SQ
REGRESSO

= b
_

_
n

i1
X
i
Y
i

_
n

i=1
X
i
__
n

i=1
Y
i
_
n
_

_
SQ
REGRESSO

= 2,16
_
1589,2
(69)(141,2)
8
_
SQ
REGRESSO
= 802,1
e
SQ
TOTAL

=
_

_
n

i1
Y
2
i

_
n

i=1
Y
i
_
2
n
_

_
SQ
TOTAL

=
_
3299,42
19937,44
8
_
SQ
TOTAL
= 807,2
R
2
=
SQ
REGRESS

AO
SQ
TOTAL
R
2
=
802,1
807,2
R
2
= 99,3
Exemplo
Vamos ver um exemplo de aplicao de regresso linear?
Especula-se que a quantidade de lixo de uma cidade varia em funo do poder aquisitivo
de seus habitantes. Para saber se essa hiptese est correta, o pesquisador realizou uma coleta
de dados em 3 cidades (A, B e C), e anotou a quantidade de lixo produzida (em toneladas) de
acordo com o nmero de salrios-mnimos que a populao recebe. Esses dados podem ser
visualizados nas Tabelas 3, 4 e 5.
0
0
2
4
6
8
10
12
2 4 8 6 10
Quantidade de lixo (toneladas)
N

m
e
r
o

d
e
s
a
l

r
i
o
s
-
m

n
i
m
o
s
y = 1,5x -1
R
2
= 1
Aula 8 Bioestatstica 166
Tabela 3 Quantidade de lixo produzida (em toneladas)
na cidade A, de acordo com o nmero de salrios-mnimos da populao
Quantidade de lixo Nmero de salrio-mnimo
2 2
4 5
6 8
8 11
Tabela 4 Quantidade de lixo produzida (em toneladas)
na cidade B, de acordo com o nmero de salrios-mnimos da populao
Quantidade de lixo Nmero de salrio-mnimo
2 1
4 2
6 4
8 4
Tabela 5 Quantidade de lixo produzida (em toneladas)
na cidade B, de acordo com o nmero de salrios-mnimos da populao
Quantidade de lixo Nmero de salrio-mnimo
2 5
4 1
6 3
8 8
Aps a obteno desses dados, o pesquisador organizou os dados em uma planilha e
calculou os valores do coeciente linear e do coeciente angular da equao de regresso para
cada cidade e obteve a reta de regresso linear (observe o Exerccio resolvido 1), a equao
da reta e o coeciente de determinao R
2
para cada cidade e que podem ser visualizados
nas Figuras 3, 4 e 5.
Figura 3 Quantidade de lixo produzida (em toneladas) na cidade A,
de acordo com o nmero de salrios-mnimos da populao
0
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
5
2 4 8 6 10
Quantidade de lixo (toneladas)
N

m
e
r
o

d
e
s
a
l

r
i
o
s
-
m

n
i
m
o
s
y = 0,55x
R
2
= 0,8963
0
0
1
2
3
4
5
6
7
8
9
2 4 8 6 10
Quantidade de lixo (toneladas)
N

m
e
r
o

d
e
s
a
l

r
i
o
s
-
m

n
i
m
o
s
y = 0,55x + 1,5
R
2
= 0,2262
Aula 8 Bioestatstica 167
Figura 4 Quantidade de lixo produzida (em toneladas)
na cidade B, de acordo com o nmero de salrios-mnimos da populao
Figura 5 Quantidade de lixo produzida (em toneladas)
na cidade C, de acordo com o nmero de salrios-mnimos da populao
Soluo
Ao analisarmos as trs guras, podemos vericar que a quantidade de lixo gerada em
cada cidade em funo do nmero de habitantes variou de maneira diferente: na cidade A,
quanto maior a quantidade de lixo gerada, maior a renda dos habitantes; na cidade B, houve
uma tendncia desse mesmo resultado, exceto quando a produo de lixo foi de 6 toneladas;
na cidade C, pode-se notar uma maior disperso dos dados, quando a variao da quantidade
de lixo gerada no acompanha exatamente o aumento da renda da populao.
Mas ser que a interpretao dos resultados est correta? Ser que a reta traada para
representar a situao de cada cidade real, representando o quanto a quantidade de lixo varia
em funo da renda da populao?
Aula 8 Bioestatstica 168
Vamos ento analisar a reta de regresso e o coeciente de determinao da anlise de
regresso para cada cidade:
1) No caso da cidade A, o valor de R
2
= 1, o que signica que a reta de regresso traada
se ajusta perfeitamente aos pontos, o que pode ser vericado pelo fato dela passar
exatamente em cima de cada ponto. Podemos armar que 100% da variao que ocorre em
y (quantidade de lixo gerada) est relacionada com a variao de x (renda da populao).
Assim, podemos utilizar a equao de regresso para estimar a quatidade de lixo produzida
pela parte da populao que ganha 2,5 salrios-mnimos.
Equao de A: y = 1,5x + 1
Substituindo-se x por 2,5 temos: y = 1,5*2,5 + 1 = 4,75 toneladas de lixo.
2) No caso da cidade B, o valor de R
2
= 0,89, o que signica que a reta de regresso traada
se ajusta quase que perfeitamente aos pontos, o que pode ser vericado pelo fato dela se
aproximar muito de cada um deles. Nesse caso, podemos armar que 89% da variao
que ocorre em y (quantidade de lixo gerada) est relacionada com a variao de x (renda
da populao). O restante, 11%, fruto de uma variao que no tem explicao.
Nesse caso, como a equao de regresso tambm apresenta um coeficiente de
determinao alto (maior que 50%), pode-se utilizar a mesma para fazer inferncias sobre a
quantidade de lixo produzida em funo da renda da populao.
3) No caso da cidade C, o valor de R
2
= 0,22, o que signica que a reta de regresso
traada se ajusta muito pouco aos pontos, o que pode ser vericado pelo fato dela no se
aproximar de cada um deles. Nesse caso, podemos armar que somente 22% da variao
que ocorre em y (quantidade de lixo gerada) est relacionada com a variao de x (renda
da populao). O restante, 78%, fruto de uma variao que no tem explicao. Nesse
caso, possvelmente existem outros fatores (como por exemplo, o nvel de escolaridade e
educao dos habitantes) que inuenciam na quantidade de lixo gerada.
Isso quer dizer que a minha equao no serve?
No propriamente, mas apenas que ela no sucientemente adequada para explicar
a relao de causa e efeito, entre a receita da populao e a quantidade de lixo gerada.
Possivelmente, nesse caso, a adio de outras variveis (como por exemplo, o nmero mdio
de anos de estudo da populao) e uma nova equao de regresso mltipla resultaro em
aumento do R
2
.
Resumo
Aula 8 Bioestatstica 169
Nesta aula, voc viu o conceito de regresso linear simples, ou seja, o estudo
de quanto uma varivel varia em funo da outra, exprimindo uma relao de
causa e efeito. Estudou que essas variveis quantitativas podem ser dependentes
(y) e independentes (x) e verificou como identific-las em cada situao
problema. Conceituou regresso linear simples e conheceu os demais tipos de
regresso utilizados. Identicou que, numa anlise de regresso, temos vrios
fatores envolvidos, tais como o coeciente linear, representado pela letra e o
coeciente angular da reta, representado pela letra . Estudou a equao da reta
que representa a regresso linear, como voc pode fazer uma anlise de regresso
e como determinar o coeciente de regresso.
Autoavaliao
Faa uma regresso linear e calcule o seu coeciente de determinao, utilizando
as informaes da Tabela 6, que relaciona a quantidade de lhos por mulher em
funo no nmero de anos de estudo, e discuta sobre a representatividade da
equao gerada.
Tabela 6 Nmero de lhos segundo os anos completos de estudos, em mulheres de 15 a 49 anos de idade
Nmero de anos de estudo Nmero mdio de lhos
0 3,6
3 3,5
7 2,9
8 2,3
11 1,6
12 1,4
Fonte: Adaptado de Berqu e Cavenaghi (2006)
Aula 8 Bioestatstica 170
Referncias
BERQUO, Elza; CAVENAGHI, Suzana. Fecundidade em declnio: breve nota sobre a reduo
no nmero mdio de lhos por mulher no Brasil. Novos estud. - CEBRAP [online], n. 74, p.
11-15, 2006.
CALLEGARI-JACQUES, Sdia M. Bioestatstica: princpios e aplicaes. Porto Alegre: Ed.
Artmed, 2003.
CORRELAO e regresso. 2000. Disponvel em: <http://www.dim.fm.usp.br/regressao/index.
php>. Acesso em: 12 mar. 2010.
HOUAISS, Antonio; VILLAR, Mauro de Sales; FRANCO, Francisco Manoel de Mello. Dicionrio
Houaiss da lngua portuguesa. Rio de Janeiro: Editora Objetiva, 2001.
SAMPAIO, Ivan Barbosa Machado. Estatstica aplicada experimentao animal. Belo
Horizonte: Ed. Fundao de Ensino e Pesquisa em Medicina Veterinria e Zootecnia, 1998.
VIEIRA, Sonia. Introduo bioestatstica. Rio de Janeiro: Ed. Campus, 1980.
______. Princpios de estatstica. So Paulo: Ed. Pioneira, 1999.
Anotaes
Aula 8 Bioestatstica 171
Anotaes
Aula 8 Bioestatstica 172
Entendendo os nmeros
ndices e suas aplicaes
9
Aula
1
2
3
Aula 9 Bioestatstica 175
Apresentao
V
oc j deve ter ouvido expresses como: Houve aumento no ndice de inao; Houve
alterao no ndice nacional de custo na construo civil (INCC); Houve aumento na
taxa de natalidade do Estado do Rio Grande do Norte em 2009. Esses indicadores
so chamados de nmeros ndices e voc os estudar nesta aula. Voc ver como calcular
os nmeros ndices, sua importncia e formas de aplicao dessa ferramenta estatstica nas
Cincias Biolgicas e em situaes do cotidiano.
Objetivos
Compreender o conceito de nmero ndice.
Diferenciar nmeros ndices simples de compostos.
Calcular os nmeros ndices e interpretar os seus
resultados.
Aula 9 Bioestatstica 176
Nmeros ndices e
o nosso cotidiano
D
iariamente, vemos nos telejornais informaes de como anda a nossa economia:
Notcias como [...] a inao nos ltimos 12 meses foi de 1,56%; [...] o aumento
do IGPM foi de 12,6%; [...] o INPC teve queda de 2,8% no ms de agosto. Vemos
tambm notcias sobre o ndice de fertilidade da populao brasileira, ndice de natalidade,
ndice de mortalidade, dentre outros (Figura 1). E, na maioria das vezes, camos sem saber o
que estas informaes signicam.
Figura 1 Exemplos de nmeros ndices diariamente apresentados nos telejornais nacionais.
Fonte: Lilian Giotto Zaros
Esses ndices ilustrados na gura acima so denominados de nmeros ndices. Sua
denio, como calcul-los e como interpret-los o que voc ver a seguir.
Data limite
Data limite: data nal
do perodo de tempo
estudado.
Data base
Data base: data inicial
do perodo de tempo
estudado.
Aula 9 Bioestatstica 177
O que so nmeros ndices?
O
s nmeros ndices (ou apenas ndices) so instrumentos estatsticos utilizados
para comparar a evoluo ou o comportamento de variveis atravs do tempo. So
indicadores que se aplicam no campo da produo, evoluo dos preos, dos salrios,
da biodiversidade animal e vegetal, do desmatamento, de registros demogrcos, dentre
outros, como citados na Figura 1.
Como medem variaes no tempo e no espao, permitem sintetizar e apresentar de forma
ecaz a natureza das alteraes nas variveis. Usando os nmeros ndices possvel, com um
s valor, avaliar a evoluo de um conjunto complexo de variveis.
Matematicamente, a razo entre o valor de uma varivel em uma data limite e o valor
dessa mesma varivel em outra data, denominada data base.
Por exemplo: quando nos deparamos com a informao de que o ndice de mortalidade
infantil no Rio Grande do Norte no ano de 2010 foi de 3,5%, este ndice de mortalidade foi
obtido pela razo entre o nmero de mortalidades no ano de 2010 e o nmero de mortalidades
em uma data base, por exemplo, no ano de 2009. Todavia, essa comparao deve ser feita
apenas em relao data base.
Note que os nmeros ndices so expressos em porcentagens e s se aplicam s datas
a que se referem ou so adimensionais (sem unidade de medida).
Curiosidade
Os nmeros ndices como dissemos acima, podem ser aplicados nas Cincias
Biolgicas. A notcia a seguir exemplica essa aplicao.
Desmatamento na Caatinga j destruiu metade da vegetao original
Por Jefferson Rudy/MMA
A Caatinga,nico bioma exclusivamente brasileiro, possui atualmente metade de
sua cobertura vegetal original. Em 2008, a vegetao remanescente da rea era
de 53,62%. Dados do monitoramento do desmatamento no bioma realizado entre
2002 e 2008 revelam que, neste perodo, o territrio devastado foi de 16.576km
2
,
o equivalente a 2% de toda a Caatinga. A taxa anual mdia de desmatamento na
mesma poca cou em torno de 0,33% (2.763km
2
).
Fonte: <http://www.espacoecologiconoar.com.br/index.php?option=com_content&task=view&id=13106&Itemid=1>.
Acesso em: 10 maio 2010.
Atividade 1
Aula 9 Bioestatstica 178
Cite dois exemplos, diferentes dos citados anteriormente, de nmeros
ndices que voc conhece e que so utilizados nas mais diversas subreas
das Cincias Biolgicas.
Tipos de nmeros ndices
H dois tipos de nmeros ndices:
1) Simples: Representam a evoluo de uma s varivel simples entre dois perodos de
tempo. Por exemplo: quando uma famlia nota que o preo do po o dobro do que era
h 10 anos, est fazendo uso de certo tipo de nmero ndice de uma s varivel.
A principal limitao dos ndices simples que eles se referem apenas a itens isolados.
Apesar disso, so vrios os exemplos de ndices simples: crescimento da populao, taxa de
natalidade, taxa de mortalidade e indicador de desemprego.
Atividade 2
1
Aula 9 Bioestatstica 179
Fonte: Quino, tirinha 231, 16 ago. 2006. Disponvel em: <http://clubedamafalda.blogspot.com/2006/08/tirinha-231.html>. Acesso em: 10 maio 2010.
2) Compostos: Expressam a evoluo de uma varivel composta (que integra vrias medidas
juntas) entre dois perodos de tempo. Um exemplo deste tipo de varivel composta
observado no clculo da inao. Essa medida/ndice o resultado da variao conjunta
de preos de numerosos itens, como por exemplo, os alimentos (leite, carne, ovos,
manteiga etc.), o transporte (combustveis, passagens de nibus etc.), dentre outros.
Alguns desses artigos podem ter tido alterao (aumento ou diminuio) no preo e outros
podem continuar com o mesmo valor. Alm disso, cada um desses artigos tem um peso
(ponderao) diferente para o clculo do ndice. Assim, um aumento no preo do leite e do
feijo, por exemplo, tem um impacto muito maior no ndice de inao do que elevao do
valor de automveis. Isso se deve ao fato de que os alimentos so consumidos por toda
a populo e os automveis somente por alguns poucos indivduos.
Conceitue nmeros ndices.
2
3
Aula 9 Bioestatstica 180
Diferencie nmeros ndices simples de nmeros ndices compostos
e d exemplos de cada um deles, utilizando informaes obtidas em
jornais ou revistas ou na internet.
Selecione um grupo de 15 indivduos (podem ser pessoas da
sua famlia, amigos, alunos, colegas de trabalho, da igreja e/ou de
prtica de esportes) e faa as seguintes perguntas: Quais os tipos
de nmeros ndices que voc conhece? Em que local voc obteve
essas informaes? Em seguida, complete a tabela abaixo com as
informaes obtidas:
Tipo de nmero ndice
que conhece
Local onde obteve
a informao
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Aula 9 Bioestatstica 181
Como calcular
os nmeros ndices?
O clculo dos nmeros ndices feito utilizando-se a frmula abaixo:
NI =
V A
V B
100
Onde:
NI = nmero ndice;
VA = valor do parmetro atual ou na data limite;
VB = valor do parmetro anterior ou na data base.
Utilizando essa frmula, voc poder calcular os nmeros ndices, sejam eles simples
ou compostos.
Exerccio resolvido 1
Ser que se voc dividir o nmero de inscritos no vestibular para o Curso de Cincias
Biolgicas em 2010 pelo nmero de inscritos no ano anterior, e multiplicar por 100, voc
terum ndice?
Soluo
Sim, voc ter um ndice. Se o ndice for maior do que 100, a procura pelo
curso aumentou. Se ao contrrio, for menor do que 100, a demanda diminuiu.
Vamosvericar?
Suponha que o nmero de inscritos no ano de 2010 foi de 2500 estudantes e em
2009 foi de 2000. Assim, temos que:
NI =
V A
V B
100 =
2500
2000
100 = 1,25 100 = 125%
Agora, como o ano base representa sempre 100%, e o valor atual do ndice
125%, por diferena podemos calcular se houve ou no aumento do nmero de
inscritos no vestibular 2010 em relao a 2009.
Efetuando a operao matemtica: 125% 100%, podemos concluir que houve
um aumento de 25% na procura do Curso de Cincias Biolgicas no vestibular
2010 em relao a 2009.
Atividade 3
1
2
Aula 9 Bioestatstica 182
Utilizando esse mesmo conceito, voc pode ter resultados onde o valor atual (VA)
menor que o valor base (VB). Nesse caso, o resultado da subtrao ser um nmero negativo
e indicar uma reduo no ndice.
Calcule o nmero ndice para as seguintes situaes e interprete os resultados.
Foram oferecidas 50 bolsas de iniciao cientca aos alunos do Curso
de Cincias Biolgicas no ano de 2009 e 45 no ano de 2010.
Um bilogo notou que 525 plantas oresceram em sua estufa no ms
de fevereiro, quando comparadas a 400 plantas no ms de setembro
de 2009.
3
Aula 9 Bioestatstica 183
Curiosidade
Sempre que se tem o crescimento de um ndice, h um reexo positivo para
a populao?
Depende do que seja esse ndice. Se for de uma varivel boa, o crescimento deste
ndice ser bom para a populao. Como exemplo disso, temos: crescimento na
expectativa de vida, aumento na taxa de escolaridade das crianas, aumento real
do salrio mnimo.
J se fosse o ndice de crescimento da inao ou da taxa de mortalidade de
crianas at cinco anos de idade, por exemplo, seria extremamente diferente,
pois so indicadores que quanto mais baixos ou decrescentes, melhor para a
maioria da populao.
O volume de chuva na regio oeste do estado do Rio Grande do Norte
em 2008 foi de 3,5mm e chegou a 6mm no ano seguinte.
1
2
Aula 9 Bioestatstica 184
Utilizando nmeros ndices
Como j visto antes, os nmeros ndices esto presentes no cotidiano da populao.
Assim, nos prximos pargrafos, vamos discorrer sobre alguns ndices que voc poder
calcular para auxiliar o seu trabalho e/ou seu dia a dia.
ndice relativo de preos ou preos
relativos simples
a razo entre o preo de um produto em uma determinada data e o preo desse mesmo
produto na data escolhida como base.
O ndice relativo de preos mostra a evoluo do preo de um produto em um determinado
perodo estudado. Voc pode utilizar esse ndice para vericar as alteraes de preos, por
exemplo, dos principais itens de compra da sua casa.
O ndice relativo de preo (IP) obtido pela frmula abaixo:
IP =
p
t
p
0
100
Onde:
IP= ndice de preos;
p
t
= preo numa data atual;
p
0
= preo na data base ou poca-base.
Exerccio resolvido 2
O preo de determinado artigo, em 2008, foi R$ 5,00 e em 2010 subiu para R$ 6,25.
Tomando-se por base o ano 2008, determinar o ndice relativo de preo em 2010.
Soluo
Identicar a data base e a data atual:
Data base (0) = 2008 e perodo atual (t) = 2010
Identicar os preos na poca atual e na poca base:
Preo na data atual = 6,25 e preo na data base = 5,00
1
3
4
Aula 9 Bioestatstica 185
Em seguida, aplicar a frmula do ndice relativo de preo:
IP =
p
t
p
0
100 =
6,25
5
100 = 125%
Concluso: Em 2010 houve um aumento de 25% (125 100) no preo
do artigo, em relao ao preo do mesmo artigo em 2008.
ndice de aprovao dos alunos (IA)
O ndice de aprovao dos alunos rotineiramente utilizado por professores que querem
ter uma ideia de como foi a aprovao dos alunos em sua disciplina.
Ele pode ser obtido aplicando-se a frmula geral dos nmeros ndices, dividindo-se o
total de alunos aprovados pelo nmero de matrculas na disciplina.
IA =
N umero de alunos aprovados
N umero de alunos matriculados na disciplina
100
Note que para este ndice, o fato do aluno ter sido aprovado por mdia (direto) e/ou por
recuperao, bem como ter trancado a disciplina no interfere no resultado. O que me interessa
saber a relao entre o nmero de alunos aprovados ao nal do curso.
Note que a frmula para o clculo do ndice de aprovao de alunos a mesma utilizada
para o clculo do nmero ndice em geral, como dito anteriormente.
Exerccio resolvido 3
Calcule o ndice de aprovao de uma turma da disciplina de Bioestatstica do terceiro
semestre de 2010, onde o nmero de alunos inscritos foi de 41 e de aprovados foi de 30.
Soluo
Identicar:
Nmero de alunos aprovados: 30
Nmero de alunos matriculados: 41
2
2
1
3
Atividade 4
Aula 9 Bioestatstica 186
Em seguida, aplicar a frmula do ndice de aprovao:
Calcule o ndice relativo de preos nas situaes abaixo e interprete os resultados:
Uma caixa de morangos, que custava R$3,50 em fevereiro de 2010,
passou a custar R$4,30 em maio do mesmo ano.
Uma moto que custava R$5.900,00 em janeiro de 2009, passou a
custar R$7.100,00 em janeiro de 2010.
Concluso: O ndice de aprovao na disciplina de Bioestatstica em 2010
foi de 73,1%.
IA =
N umero de alunos aprovados
N umero de alunos matriculados na disciplina
100 =
30
41
100 = 73,1%
3
Aula 9 Bioestatstica 187
Uma casa que custava R$190.000,00 em maio de 2008, passou a
custar R$178.000,00 em maio de 2010.
ndices de custo de vida (ICV)
O ndice de custo de vida, conhecido pela sigla ICV, um ndice composto e pode ser
calculado como no exemplo abaixo:
Suponha que uma famlia com cinco pessoas compre semanalmente 10 litros de leite,
4 kg de feijo e 5 kg de arroz e gaste R$ 25,00/semana com transporte. Vamos ento elaborar
um ndice composto de custo de vida para esta famlia na primeira (1) e na ltima semana do
ms (4)?
Nesse caso, precisamos fazer um gasto ponderado entre a quantidade de alimentos e
servios e o preo de cada item. Para isso, vamos observar a tabela abaixo:
Item Preo na semana 1 Preo na semana 4
Leite R$ 0,77 R$ 0,77
Feijo R$ 1,53 R$ 2,50
Arroz R$ 0,88 R$ 1,88
Transporte R$ 2,5 R$ 2,5
Assim, o VA corresponder ao valor da cesta de produtos consumida pela famlia na
semana 4 e o VB ao consumo da famlia na semana 1.
Aula 9 Bioestatstica 188
Deste modo, teremos:
Gasto semanal da famlia na semana 1
Item
Quantidade
consumida
Valor unitrio (R$) Total da semana 1
Porcentagem
do total
Leite 10 R$ 0,77 R$ 7,70 17,82%
Feijo 4 R$ 1,53 R$ 6,12 14,16%
Arroz 5 R$ 0,88 R$ 4,40 10,18%
Transporte
(passagens)
10 R$ 2,5 R$ 25,00 57,84%
Total da semana R$ 43,22 100,00%
Gasto semanal da famlia na semana 4
Item
Quantidade
consumida
Valor unitrio (R$) Total da semana 4
Porcentagem do
total
Leite 10 R$ 0,77 R$ 7,70 14,78%
Feijo 4 R$ 2,50 R$ 10,00 19,19%
Arroz 5 R$ 1,88 R$ 9,40 18,04%
Transporte
(passagens)
10 R$ 2,5 R$ 25,00 47,98%
Total da semana R$ 52,10 100,00%
Aplicando a frmula do nmero ndice, temos:
IA =
V A
V B
100 =
52,10
43,22
100 = 1,2055 100 = 120,55%
Neste caso, o ndice calculado de 20,55% (120,555 100%).
Embora o aumento no preo do feijo seja de 63,40% e do arroz de 113,64%, o aumento
no ndice do custo de vida menor que este valor (20,55%). Isto ocorre porque os itens que
tiveram maior aumento tm uma participao relativa no custo de vida (despesas) total da famlia.
por esse motivo que, s vezes, os ndices de inao so divulgados e voc pode achar
que a alterao nos preos observados na sua regio diferente da informao ocial. Isso
ocorre porque a inao calculada por uma mdia ponderada de itens mdios de consumo
de uma famlia brasileira. Assim, nem sempre os hbitos de consumo e os preos observados
so semelhantes aos seus.
Resumo
Aula 9 Bioestatstica 189
Nesta aula, voc aprendeu o conceito de nmeros ndices e foi capaz de perceber
que eles so utilizados nas mais diversas reas do nosso cotidiano, nas Cincias
Biolgicas, na Geograa, na Economia, dentre outras. Voc diferenciou nmeros
ndices simples e compostos e realizou os clculos necessrios para determinar
um nmero ndice. Alm disso, voc viu alguns exemplos de nmeros ndices,
tais como o ndice relativo de preos, o ndice de aprovao de alunos e ndice
de custo de vida e aprendeu a calcular cada um deles. Por m, voc testou os
conhecimentos adquiridos, acompanhando a resoluo de exerccios e fazendo
sua autoavaliao.
Autoavaliao
Leia o texto abaixo, retirado do Jornal O Estado de So Paulo de 31 de outubro
de 2006, e calcule o ndice de emisso de gs carbnico na atmosfera para os
anos de 2000 e 2004, tendo como data base o ano de 1990.
Apesar dos esforos internacionais, as emisses de dixido de carbono (CO
2
) que geram
o efeito estufa aumentaram em 2004 e atingiram os maiores ndices desde a dcada de 90.
Os pases ricos somados tiveram uma queda de apenas 3,3% em mdia nas emisses nos
ltimos 15 anos. Porm, quando se leva em conta apenas o perodo entre 2000 e 2004, houve
na realidade um aumento das emisses nessas economias, o que mostra a necessidade de
Fonte: <http://blog.ambientebrasil.com.br/wp-content/
uploads/2009/03/chamine.jpg>. Acesso em: 10 maio 2010.
Referncias
CALLEGARI-JACQUES, Sdia M. Bioestatstica: princpios e aplicaes. Porto Alegre: Ed.
Artmed, 2003.
HOUAISS, Antonio; VILLAR, Mauro de Sales; FRANCO, Francisco Manoel de Mello. Dicionrio
Houaiss da lngua portuguesa. Rio de Janeiro: Editora Objetiva, 2001.
JORNAL DA CINCIA. Emisso de CO
2
cresce no planeta. 31 out. 2006. Disponvel em: <http://
www.jornaldaciencia.org.br/Detalhe.jsp?id=42014>. Acesso em: 10 maio 2010.
SAMPAIO, Ivan Barbosa Machado. Estatstica aplicada experimentao animal. Belo
Horizonte: Ed. Fundao de Ensino e Pesquisa em Medicina Veterinria e Zootecnia, 1998.
SIQUEIRA, Ivana Caldeira; SIMA, Luiz Fernando; ROCHA, Joo Alberto Guerra da. A importncia
dos nmeros-ndices. Disponvel em: <http://www.eumed.net/ce/2009a/ssr.htm>. Acesso em:
4 abr. 2010.
TELEMEDICINA: informtica mdica. Disciplina de mtodos quantitativos em medicina:
correlao e regresso. 1999. Disponvel em: <http://www.dim.fm.usp.br/regressao/index.
php>. Acesso em: 10 maio 2010.
VIEIRA, Sonia. Introduo bioestatstica. Rio de Janeiro: Ed. Campus, 1980.
______. Princpios de estatstica. So Paulo: Ed. Pioneira, 1999.
Aula 9 Bioestatstica 190
medidas mais drsticas para lidar com aquecimento do planeta. As emisses nos pases ricos
atingiram 19,9 bilhes de toneladas de CO
2
em 2004, antes 17,5 bilhes em 2000. Em 1990,
ano-referncia para o protocolo de Kyoto, os gases lanados na atmosfera por indstrias,
usinas e carros somavam 18,6 bilhes de toneladas.
Aula 9 Bioestatstica 191
Anotaes
Aula 9 Bioestatstica 192
Anotaes
Probabilidade:
conceitos e aplicaes
10
Aula
1
2
3
4
Aula 10 Bioestatstica 195
Apresentao
Nesta aula, voc vai conhecer a histria da probabilidade, bem como entender o seu
signicado. Voc ver como a probabilidade est presente no nosso cotidiano e como podemos
empreg-la nas Cincias Biolgicas. Vai estudar tambm as leis da probabilidade e far
exerccios que so regidos por essas leis.
Esta aula de extrema importncia, uma vez que os conceitos aqui adquiridos sero
utilizados na disciplina de Gentica. Desse modo, faa sempre anotaes e resolva os exerccios
propostos, que sero teis em seu aprendizado futuro.
Bom estudo!
Objetivos
Compreender o conceito de probabilidade.
Conhecer a histria da Teoria da Probabilidade.
Conhecer as leis de probabilidade.
Aplicar os conceitos aprendidos em estudos de sistemas
biolgicos.
Aula 10 Bioestatstica 196
O que probabilidade?
Todos conhecem, por intuio, o conceito de probabilidade, ou seja, o risco (chance) de
ocorrer um determinado evento preestabelecido.
Por exemplo, observe o conjunto de dados na Figura 1, abaixo. Todos estes dados no
so viciados, ou seja, no so adulterados, e em cada face existe uma numerao marcada que
vai de um at seis. Assim, se eu pegar um desses dados e arremess-lo numa caixa, existe a
probabilidade de 1/6 (ou 17%) de sair, na face voltada pra cima, o nmero 3.
Figura 1 Conjunto de dados no viciados
Fonte: <http://palavraguda.les.wordpress.com/2007/09/dados.jpg>.
Acesso em: 4 maio 2010.
Observe que essa probabilidade a mesma, se eu escolher, a priori, qualquer um dos nmeros
entre um e seis para apostar as minhas chas. Concomitantemente, a probabilidade de ocorrer um
nmero diferente do que eu escolhi de 83%, ou seja, o que faltar para completar 100%.
utilizando essa lgica que as empresas de jogos legais montam sua estratgia de
pagamento das apostas. Assim, elas podem pagar os prmios devidos e ainda assim auferir lucro.
A priori
Do latim partindo daquilo
que vem antes. uma
expresso losca que
designa uma etapa para se
chegar ao conhecimento.
Atividade 1
1
Aula 10 Bioestatstica 197
Curiosidades sobre as loterias...
Voc sabe qual a probabilidade de ganhar na Mega-Sena? A vai a resposta: 0,000000003%.
Ainda assim, com uma possibilidade to baixa, raramente o prmio acumula.
E se voc resolver preencher todas as combinaes possveis dentre os nmeros da
Mega-Sena para assegurar que vai ganhar o prmio principal, voc gastar mais dinheiro que
o valor a ser recebido.
A probabilidade usada para associar, a cada fato possvel, sua respectiva chance de
ocorrncia. Por exemplo, se h 80% de possibilidade de chover ento h 20% de possibilidade
de no chover; se voc fosse se submeter a uma cirurgia que tem apenas 30% de chance de
sucesso ponderaria melhor sobre sua deciso.
s vezes, podemos prever fenmenos, como o caso de voc jogar vrias vezes uma
moeda de determinado lugar e medir a velocidade da queda, onde os resultados sero sempre
iguais. Esse fenmeno previsvel, pois obedece determinada lei da Fsica e chamado
de determinstico.
Outras vezes, o fenmeno imprevisvel, no determinstico, mas apresenta um padro
que vem sendo observado a longo prazo. Por exemplo, voc no sabe qual ser o primeiro
camundongo a girar a roleta dentro da gaiola de experimento, mas sabe que, nas vrias vezes
que voc observou o comportamento dos animais, foi o camundongo de nmero 2 o primeiro
a faz-lo; voc no sabe se o terceiro lho de um casal que tem olhos verdes e castanhos ter
olhos castanhos, mas sabe que os dois primeiros lhos tiveram olhos castanhos.
Desse modo, podemos denir probabilidade
como sendo a chance de um evento ocorrer.
Dena probabilidade.
2
a b
Aula 10 Bioestatstica 198
Cite trs situaes cotidianas em que esteja implcito o conceito de probabilidade.
Mas antes de aprofundarmos os nossos estudos sobre probabilidade, vamos conhecer
como a Teoria da Probabilidade se originou?
Um pouco de histria
O estudo da Teoria da Probabilidade comeou em 1664, com a troca de correspondncia
entre dois matemticos franceses, Blaise Pascal e Pierre Fermant, que tinham sido procurados
por Antonie Gombaund, o Chevalier de Mer, homem de letras e membro da corte de Luis XIV.
Figura 2 (a) Blaise Pascal (1623-1662). (b) Pierre Fermant, 1601-1665
Fonte: <http://www.york.ac.uk/depts/maths/histstat/people/pascal.gif>;
<http://www.york.ac.uk/depts/maths/histstat/people/fermat.gif>.
Acesso em: 4 maio 2010.
Aula 10 Bioestatstica 199
O questionamento de Chevalier de Mer era de como dividir o prmio de um jogo
envolvendo vrias partidas se, por alguma razo, o jogo fosse interrompido antes que algum
jogador tivesse vencido o nmero de partidas combinado anteriormente.
Nessa poca, os dois matemticos iniciaram seus estudos e chegaram, cada qual, a
uma concluso diferente: Pascal se baseou nos valores esperados de duas aes que se
alternam (alternativas) e Fermant focou seus estudos no clculo da probabilidade de um evento.
Entretanto, nenhum dos dois estudiosos publicou imediatamente seus resultados.
Desse modo, o Chevalier de Mer avaliou que o estudo das probabilidades no deveria
ser pesquisado a fundo e ainda armou que o tempo gasto nesse estudo poderia ser melhor
empregado para outros ns. Felizmente, esse fato no foi acatado por todos os estudiosos
da poca.
Assim, em 1655, o astrnomo, fsico e matemtico holands Christian Huygens (1629-
1695) teve conhecimento do fato e resolveu iniciar seus estudos, e em 1657 publicou sua
soluo. Da em diante, vrios foram os estudiosos que contriburam com o estudo da
probabilidade, dentre eles, o matemtico Jacques Bernoulli (1654-1705) e o matemtico,
fsico e astrnomo Pierre-Simom de Laplace (1749-1827), que publicou o trabalho intitulado
Thorie Analytique des Probabilits (1812), onde as teorias de probabilidade se tornaram
cienticamente justicveis nas prtica.
A aceitao das ideias sobre probabilidade pelo pensamento cientco moderno foi muito
alm do que os pensadores dos sculos XVII e XVIII, principalmente com o desenvolvimento
e aceitao da estatstica na cincia e na indstria.
O acaso
A palavra acaso originria do latim a casu, e signica algo que surge ou acontece a
esmo, sem motivo ou explicao aparente.
Muitas das situaes que presenciamos no nosso dia a dia so determinadas pelo acaso,
congurando situaes que podem ser classicadas como sorte ou azar. Sair de casa apressado
e ver o nibus partindo do ponto; no participar de um chat de dvidas e este no ser realizado
devido doena do professor; encontrar uma pessoa na rua com a qual voc precisava conversar;
ser atendido pelo SUS antes que algo mais grave acontea com a sua sade; todos esses so
acontecimentos comuns a todos ns e, muitas vezes, determinados pelo acaso.
Teorias da
probabilidade
Para saber mais
sobre a histria das
probabilidades, consulte
Crusius (2001).
Aula 10 Bioestatstica 200
Fonte: <http://1.bp.blogspot.com/_Mc6hSIUqSgg/Sm4WqMEAemI/AAAAAAAABiY/Ls3XvHYN68c/s400/Charge+do+Pater+-+A+Tribuna3.jpg>. Acesso em: 4 maio 2010.
Esses acontecimentos acima citados apresentam duas caractersticas em comum:
1) Podem ou no acontecer (no sendo previsto com certeza).
2) Qualquer um deles acontecer um certo nmero de vezes (e no ocorrer um outro nmero
de vezes) ao longo de um determinado perodo de tempo.
Essas duas caractersticas podem ser apresentadas no exemplo acima, no qual voc pode
no participar de um chat de dvidas e este no ser realizado devido doena do professor
e voc pode no participar de um chat de dvidas e este ocorrer sem a sua participao
(caracterstica 1). Tambm, esse fato pode ocorrer um determinado nmero de vezes e se
repetir durante um certo tempo, no caso de voc no participar de vrios chats marcados pelo
professor e ter a sorte dele adoecer em diversas ocasies (caracterstica 2).
Existem situaes nas quais, embora no se saiba o que de fato ir acontecer, tem-se
uma lista de possveis resultados. Como por exemplo:
1) O sexo de uma criana: masculino ou feminino.
2) O tipo sanguneo de uma pessoa: A, B, AB e O.
3) O resultado obtido pelo aluno numa disciplina: aprovado ou reprovado.
Essas situaes so denominadas pelos matemticos de ensaio probabilstico ou ensaio
aleatrio, pois os resultados dependem do acaso. Isto , embora se possa saber os tipos
de resposta existentes, toda vez que o ensaio for repetido, voc no poder saber, a priori,
qualoresultado.
Aula 10 Bioestatstica 201
Um exemplo desse conceito foi abordado no lanamento de dados, onde as respostas
possveis so os nmeros de um a seis, todavia, impossvel voc saber (a menos que exista
alguma irregularidade no jogo) qual o resultado (nmero) obtido ao se jogar o dado.
Outro exemplo desse conceito quando se analisa a seguinte frase: provvel que o meu
time ganhe a partida hoje?. Pode-se esperar a ocorrncia de trs resultados para a partida:
O meu time ganhar.
Haver empate entre os dois times.
O meu time perder.
Repare que todos os resultados possveis so conhecidos a priori. Todavia, por mais
que voc tora pela vitria do seu time, impossvel saber se ele vai ganhar o jogo antes do
trmino da partida.
Eventos aleatrios
Evento cada um dos resultados possveis de uma situao acontecer. Se considerarmos
os exemplos anteriormente citados, seria um evento o fato do camundongo nmero 2 girar a
roleta dentro da gaiola de experimento; do terceiro lho do casal nascer de olhos castanhos;
de sair o nmero 3 em um dado.
Um exemplo clssico de evento o lanamento de uma moeda: se a moeda for honesta,
o evento cara tem igual chance de ocorrer que o evento coroa, ou seja 50% de chance.
Esses so denominados de eventos aleatrios (do latim alea, sorte), pois cada um deles (cara
e coroa) tem a mesma chance de ocorrer em relao a seus respectivos eventos alternativos
(se der cara, o evento alternativo ser coroa e se sair coroa, o evento alternativo ser cara).
Moeda honesta
Moeda no viciada, onde
cara e coroa tm chances
iguais de acontecerem.
Fonte: Adaptado de <http://pion.sbsica.org.br/pdc/var/eznewsletter_site/
storage/images/multimidia/charges/sica_moderna_e_contemporanea/probabilidade
/24861-1-por-BR/probabilidade.jpg>. Acesso em: 4 maio 2010.
1
Atividade 2
2
3
Aula 10 Bioestatstica 202
Outro exemplo de evento aleatrio a formao de um determinado tipo de gameta. Um
indivduo heterozigoto Aa tem a mesma probabilidade de formar gametas portadores do alelo
A (50%) e do alelo a (50%), certo?
Heterozigoto
Indivduo que tem dois
alelos diferentes do
mesmo gene (Aa).
Alelo
Cada uma das formas
alternativas do
mesmo gene (A ou a).
Veja a seguir as probabilidades de ocorrncia de alguns eventos aleatrios e tente explicar
por que cada um deles ocorre com a probabilidade indicada.
A probabilidade de sortear uma carta de espadas de um baralho de 52 cartas de 1/4.
A probabilidade de sortear um rei qualquer de um baralho de 52 cartas de 1/13.
A probabilidade de sortear o rei de espadas de um baralho de 52 cartas de 1/52.
Aula 10 Bioestatstica 203
Eventos independentes
Q
uando a ocorrncia de um evento no afeta a probabilidade de ocorrncia de um outro,
fala-se em eventos independentes. Por exemplo, ao lanar vrias moedas ao mesmo
tempo, ou uma mesma moeda vrias vezes consecutivas, o resultado do primeiro
lanamento no interfere no resultado dos demais lanamentos. Por isso, cada resultado
um evento independente do outro.
Da mesma maneira, o nascimento de uma criana com um determinado fentipo
um evento independente em relao ao nascimento de outros lhos do mesmo casal. Por
exemplo, imagine um casal que j teve dois lhos homens. Qual a probabilidade de que uma
terceira criana seja do sexo feminino? Uma vez que a formao de cada lho um evento
independente, a chance de nascer uma menina, supondo que homens e mulheres nasam com
a mesma frequncia, 1/2 ou 50%, como em qualquer nascimento.
Eventos mutuamente excludentes
Os eventos so classicados como mutuamente excludentes, quando o acontecimento
de um implica na impossibilidade do outro ocorrer. Nesse caso, a soma das probabilidades
dos eventos igual a 1 ou 100%.
Um exemplo desse tipo de evento dado pela probabilidade de uma me ter uma criana
do sexo masculino ou feminino. Repare que para este evento, s existem duas opes, que so
excludestes entre si com relao ao sexo: masculino ou feminino. Nesse caso, a probabilidade
da me ter uma criana do sexo masculino 0,5 (50%). Consequentemente, a probabilidade
dessa criana ser do sexo feminino o complemento para 1 (100%), ou seja, 0,5 (50%).
Clculo da probabilidade
A probabilidade de um determinado evento A ocorrer, calculada pela equao:
Pr(A) =
n umero de eventos que apresentam A
n umero total de eventos
Para realizarmos o clculo da probabilidade, vamos considerar o exemplo a seguir e
efetuar sua resoluo passo a passo.
Atividade 3
1
Aula 10 Bioestatstica 204
Exemplo
Sabe-se que h 26 cartas pretas e 26 cartas vermelhas em um baralho comum de 52
cartas, no considerando os coringas. Qual a probabilidade de se tirar, ao acaso, uma carta
vermelha deste baralho?
Soluo
Passo 1: Em primeiro lugar devemos identificar, no enunciado do problema, quais as
nossasvariveis:
Nmero total de eventos: 52, pois este o nmero total de cartas no baralho.
Nmero de eventos que apresentam A: nesse caso, A o conjunto de cartas vermelhas, e
h 26 cartas desse tipo em um baralho.
Passo 2: Identicados o nmero total de eventos e o nmero de eventos que representam A,
devemos aplicar a frmula da probabilidade:
Pr(A) =
n umero de eventos que apresentam A
n umero total de eventos
=
26
52
=
1
2
= 0, 5
Passo 3: Agora s concluir: A probabilidade de se tirar, ao acaso, uma carta vermelha deste
baralho de 0,5. Muitas vezes apresentamos o valor da probabilidade em porcentagem. Nesse
caso, s multiplicar o valor obtido por 100. Assim temos:
0,5 100= 50%.
No lanamento de um dado, qual a probabilidade de:
a) Sair o nmero 6?
2
3
Aula 10 Bioestatstica 205
b) Sair um nmero mltiplo de 3?
c) Sair um nmero menor do que 3?
A probabilidade de um casal heterozigoto (Aa x Aa) para o gene da fenilcetonria
(doena gentica caracterizada pelo defeito ou ausncia da enzima fenilalanina
hidroxilase ) ter um lho afetado (aa)
1
/4. Se o casal tem 3 lhos, qual a possibilidade
de um dos lhos ter a doena? Justique sua resposta.
Se a probabilidade de um indivduo ter sangue Rh

10%, qual a possibilidade de


5 indivduos que se apresentaram para exame de sangue serem todos Rh

?
Justique sua resposta.
Aula 10 Bioestatstica 206
Leis ou regras de probabilidade
Uma grande parte das perguntas relacionadas ao clculo da probabilidade pode ser
respondida pela observao das suas Propriedades Elementares e a aplicao da Lei ou Regra
da Soma e da Lei ou Regra do Produto de probabilidade.
Propriedades Elementares
P1) A probabilidade de um evento impossvel nula (0%).
P2) A probabilidade de um evento certo 1 (100%).
P3) A probabilidade de um evento qualquer sempre um valor entre zero e um (entre 0% e
100%). Assim, impossvel se calcular uma probabilidade negativa ou maior que 1.
Regra da Soma ou regra do ou
Essa regra diz que a probabilidade de que ocorram eventos mutuamente excludentes
como, por exemplo, A ou B ou C ou D etc a soma de suas respectivas probabilidades e o
total obtido ser sempre igual a 1 (100%). Essa regra pode ser representada por:
Pr(A ou B ou C ou D. . . .) = Pr(A) +Pr(B) +Pr(C) +Pr(D) +. . . .
Vamos ver um exemplo?
Exemplo
Qual a probabilidade de, em uma gestao, nascer um indivduo do sexo masculino ou
do sexo feminino?
Soluo Pr(masculino ou feminino) = Pr(masculino) +Pr(feminino) =
1
2
+
1
2
= 1
Assim, h 100% de probabilidade de nascer um indivduo do sexo masculino ou do sexo
feminino.
Regra do Produto ou regra do e
Essa regra diz que a probabilidade de que ocorram, simultaneamente, os eventos E, F, G,
H etc. o produto de suas respectivas probabilidades, se estes eventos forem independentes
entre si, e pode ser representado por:
Pr(E, F, G, e H . . .) = Pr(E) Pr(F) Pr(G) Pr(H) . . .
Vamos ver um exemplo?
Aula 10 Bioestatstica 207
Exemplo
As variveis gnero (masculino e feminino) e grupo sanguneo (A, B, AB e O) so
caractersticas independentes na espcie humana. Admitindo uma proporo de 1:1 em Natal, a
probabilidade de um natalense selecionado ao acaso ser do sexo feminino e ter tipo sanguneo O :
Soluo
Pr(sexo feminino e grupo O) = Pr(sexo feminino) Pr(grupo O) =
=
1
2

1
4
= 0, 125 ou 12, 5%
Pode-se concluir que h 12,5% de chance de um natalense ser do sexo masculino e ter
sangue tipo O.
Vamos vem uma aplicao das regras de probabilidade na gentica?
Exerccio resolvido 1
Em experimentos realizados por Mendel, observou-se que o cruzamento de ervilhas
amarelas homozigotas (AA) com ervilhas verdes homozigotas (aa) originaram ervilhas
amarelas heterozigotas (Aa). Se essas ervilhas fossem cruzadas entre si, seriam originadas
ervilhas amarelas e verdes, na proporo de 3:1. Suponha que Mendel pegou, ao acaso, trs
ervilhas, resultantes do cruzamento de ervilhas amarelas heterozigotas. Qual a probabilidade
de as trs serem verdes?
Figura 3 Gregor Johann Mendel
Resoluo
De acordo com o enunciado do texto, se cruzarmos ervilhas amarelas AA com ervilhas verdes
(aa), temos 100% de ervilhas amarelas, pois ambas ervilhas produziro gametas de um tipo s:
Atividade 4
1
Aula 10 Bioestatstica 208
as amarelas produziro gametas A e as verdes a. A combinao desses gametas
origina apenas Aa, ou seja, ervilhas amarelas.
Agora, se cruzarmos as ervilhas amarelas originadas desse cruzamento (Aa)
entre si, teremos a produo de dois tipos de gametas para cada uma: gametas
A e a. E se realizarmos sua combinao, teremos:
A a
Proporo 3:1 = Trs ervilhas
amarelas para uma ervilha verde
A
AA
Ervilha amarela
Aa
Ervilha amarela
a
Aa
Ervilha amarela
aa
Ervilha verde
Assim, por esse cruzamento, podemos concluir que a probabilidade de uma
ervilha resultante do cruzamento de Aa Aa de ser verde (aa) uma em quatro,
ou seja 1/4 ou 25%.
Agora podemos calcular a probabilidade das trs ervilhas serem verdes, aplicando
a regra do produto:
Pr(trs ervilhas verdes) = Pr(ervilha verde)Pr(ervilha verde)Pr(ervilha
verde)
Pr(tr es ervilhas verdes) =
1
4

1
4

1
4
=
1
64
ou 1, 56%
Um casal tem dois lhos. Qual a probabilidade de:
O primognito ser homem.
2
3
Aula 10 Bioestatstica 209
Os dois lhos serem homens.
Pelo menos um dos lhos serem homem.
Resumo
Nesta aula, voc conheceu um pouco da histria da probabilidade e compreendeu
o seu conceito. Entendeu o conceito de acaso e estudou os principais tipos
de eventos: aleatrios, independentes e mutuamente excludentes. Aprendeu
como calcular a probabilidade utilizando a sua frmula e visualizando exerccios
resolvidos. Conheceu as leis de probabilidade, ou seja, regra da soma ou regra do
ou e a regra do produto ou regra do e, bem como suas propriedades elementares.
Aprendeu como aplicar essas leis tendo como exemplo situaes cotidianas e
exerccios de gentica.
1
2
Aula 10 Bioestatstica 210
Suponha que a probabilidade de uma pessoa ser do tipo sanguneo O 40%, ser do tipo
A 30% e ser do tipo B 20%. Suponha ainda que a probabilidade de Rh
+
de 90% e que o
fator Rh independe do tipo sanguneo. Nessas condies, qual a probabilidade de uma pessoa
tomada ao acaso da populao ser:
O, Rh
+

Autoavaliao
Agora que voc j compreendeu os principais conceitos e regras que compem a Teoria
da Probabilidade, teste seus conhecimentos adquiridos, resolvendo o exerccio abaixo.
AB, Rh

Aula 10 Bioestatstica 211


Referncias
CALLEGARI-JACQUES, Sdia M. Bioestatstica: princpios e aplicaes. Porto Alegre: Ed.
Artmed, 2003.
CRUSIUS, C. A. A razo como faculdade calculadora: a aposta de Pascal. Porto Alegre: Ed.
Universidade/UFRGS, 2001.
HOUAISS, Antonio; VILLAR, Mauro de Sales; FRANCO, Francisco Manoel de Mello. Dicionrio
Houaiss da lngua portuguesa. Rio de Janeiro: Editora Objetiva, 2001. 2922p.
LOPES, Paulo Afonso. Probabilidade e estatstica: conceitos, modelos e aplicaes em excel.
Rio de Janeiro: Reichamann e Afonso Editores, 1999.
VIEIRA, Sonia. Introduo bioestatstica. Rio de Janeiro: Ed. Campus, 1980.
______. Princpios de estatstica. So Paulo: Ed. Pioneira, 1999.
Anotaes
Aula 10 Bioestatstica 212
Anotaes
Aula 10 Bioestatstica 213
Anotaes
Aula 10 Bioestatstica 214
Anotaes
Esta edio foi produzida em ms de 2012 no Rio Grande do Norte, pela Secretaria de
Educao a Distncia da Universidade Federal do Rio Grande do Norte (SEDIS/UFRN).
Utilizando-se Helvetica Lt Std Condensed para corpo do texto e Helvetica Lt Std Condensed
Black ttulos e subttulos sobre papel offset 90 g/m
2.
Impresso na nome da grca
Foram impressos 1.000 exemplares desta edio.
SEDIS Secretaria de Educao a Distncia UFRN | Campus Universitrio
Praa Cvica | Natal/RN | CEP 59.078-970 | sedis@sedis.ufrn.br | www.sedis.ufrn.br