Você está na página 1de 24

Bioestatística

Material Teórico
Bioestatística Aplicada

Responsável pelo Conteúdo:


Prof.ª Esp. Priscila Bernardo Martins

Revisão Textual:
Prof. Me. Sidney Silva Santos
Bioestatística Aplicada

• Utilização da Informática na Bioestatística;


• Avaliação Crítica de Artigos Científicos;
• Testes Estatísticos;
• Diagrama de Dispersão e Teste de Correlação;
• Retomando o Assunto “Variáveis”;
• A Tabela de Contingência.

OBJETIVO DE APRENDIZADO
• Apresentar a identificação de testes realizados, a sugestão de testes, a análise crítica
de tabelas e gráficos de artigos científicos, bem como o uso de softwares.
Orientações de estudo
Para que o conteúdo desta Disciplina seja bem
aproveitado e haja maior aplicabilidade na sua
formação acadêmica e atuação profissional, siga
algumas recomendações básicas:
Conserve seu
material e local de
estudos sempre
organizados.
Aproveite as
Procure manter indicações
contato com seus de Material
colegas e tutores Complementar.
para trocar ideias!
Determine um Isso amplia a
horário fixo aprendizagem.
para estudar.

Mantenha o foco!
Evite se distrair com
as redes sociais.

Seja original!
Nunca plagie
trabalhos.

Não se esqueça
de se alimentar
Assim: e de se manter
Organize seus estudos de maneira que passem a fazer parte hidratado.
da sua rotina. Por exemplo, você poderá determinar um dia e
horário fixos como seu “momento do estudo”;

Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma


alimentação saudável pode proporcionar melhor aproveitamento do estudo;

No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos
e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam-
bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua
interpretação e auxiliarão no pleno entendimento dos temas abordados;

Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus-
são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o
contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de
aprendizagem.
UNIDADE Bioestatística Aplicada

Utilização da Informática na Bioestatística


Até este momento, em alguma ocasião,
você deve ter ponderado: “Mas eu não gos-
to de matemática! Escolhi esse curso para
fugir das equações! E até aqui só vi fórmulas
e cálculos!”. Na verdade, a matemática e o
raciocínio lógico estão presentes em quase
tudo o que fazemos na área acadêmica. A
tomada de decisão em adotar o tratamento
X ou Y dependerá dos resultados obtidos
em estudos anteriores, estudos esses que Figura 1
foram embasados em análises estatísticas. Fonte: Getty Images

Mas, para facilitar a vida de todos, saibam que a informática muito pode contri-
buir. Veja o exemplo abaixo, suponha que tenhamos que calcular a média do peso
da mochila dos alunos do 3º ano do ensino fundamental.

Atualmente, como já foi dito no módulo anterior, temos à disposição vários


softwares que ajudam nos cálculos estatísticos. O Excel é um programa presente
em boa parte dos computadores e possui essa ferramenta. Vamos fazer o cálculo
da média usando esse programa.

Tabela 1
Alunos Peso das mochilas (kg)
1 1,2
2 2
3 2,5
4 0,9
5 0,9
6 1,3
7 1,5
8 1,4
9 2
10 2,1
11 1,7
12 1,4
13 1,6
14 1,8
15 2
16 2,3
17 1,9
18 1,5
19 1,1

8
Essa é uma das formas para calcularmos a média. Veja a primeira etapa: podemos
inserir a função e optar pela categoria estatística; lá temos o comando MÉDIA.

A seguir, selecionamos a coluna referente aos pesos das mochilas. No quadro, já


aparecerá o valor da média.

Figura 2

Figura 3

Teremos, então, a obtenção do valor médio das mochilas de 1,63kg.

9
9
UNIDADE Bioestatística Aplicada

Assim como no exemplo anterior, percebemos o quanto a informática facilita


a nossa vida. Todos os cálculos básicos de bioestatística podem ser feitos por
softwares como o Excel.

Avaliação Crítica de Artigos Científicos


Um dos objetivos principais da bioestatística é o de contribuir para o melhor
entendimento dos dados estatísticos relatados em publicações científicas. A asser-
tividade sobre aquilo que é demonstrado na tabela ou na figura dependerá
do contexto em que os mesmos são apresentados e da análise crítica dos
resultados numéricos.

A análise estatística descritiva é muito utilizada e, quando envolve tamanhos


amostrais grandes ou uma determinada população, essa análise é capaz de permitir
extrapolações dos resultados encontrados. Por outro lado, quando essas condições
não ocorrem, a análise estatística analítica contribui para garantir essa extrapola-
ção. Além dessa importância, a análise analítica – que usa os testes de compa-
ração de médias, que considera o nível de significância, que calcula o valor
de p, etc. – viabiliza as tomadas de decisão para considerar um fator de risco que
acomete um determinado grupo, para evidenciar o efeito de um tratamento, para
visualizar o resultado futuro de uma campanha de prevenção, etc.

Vejamos o exemplo a seguir.

Na tabela, pode-se observar a relação da variável principal, que é o peso, cujas


categorias são sobrepeso e eutrofia (= peso normal) de crianças. Perceba que a
tabela apresenta a relação dessa variável com as demais – idade, atividade física e
televisão –, cada qual com suas respectivas categorias. O que podemos observar?

Tabela 2 – Idade, nível de atividade física e de lazer e tempo em frente à televisão


segundo estado nutricional, em crianças da Favela do Fragoso, em Olinda, PE
Sobrepeso Eutrofia
Variáveis Valor de p
n % n %
Idade (anos) 0,99
5 6 13 4 10
6 11 23,9 9 22,5
7 10 21,7 9 22,5
8 8 17,3 7 17
9 11 23,9 11 27
Atividade física 0,04
Pouco ativo 34 73,9 21 52,5
Ativo 12 26,1 19 47,5

10
Sobrepeso Eutrofia
Variáveis Valor de p
n % n %
Televisão (h/dia) 0,86
0a2 13 28,4 12 30
3 ou mais 33 71,6 28 70

Algumas respostas:
1. Que se trata de uma tabela que mostra a relação da variável principal, que
está na coluna, com as demais, que estão nas linhas;
2. Os dados são apresentados na forma de frequência absoluta (n) e relativa (%);
3. Que foram realizados três testes estatísticos e, para cada teste, calculou-se
um valor de p;
4. Que os testes utilizados foram o qui-quadrado e o de Fisher, pois são todas
variáveis qualitativas;
5. Considerando a primeira análise, percebemos que não houve diferença
significativa entre as idades das crianças com sobrepeso e as eutróficas,
pois o valor de p é maior do que o nível de significância (a = 0,05), o que
atesta que não há diferença entre as proporções, isto é, entre as frequên-
cias das idades dessas crianças. O que nos leva a concluir que, em termos
de idade, as crianças com sobrepeso e eutróficas possuem as mesmas
distribuições de idade.

Tabela 3
Sobrepeso Eutrofia
Variáveis Valor de p
n % n %
Idade (anos) 0,99
5 6 13 4 10
6 11 23,9 9 22,5
7 10 21,7 9 22,5
8 8 17,3 7 17
9 11 23,9 11 27

6. Na segunda análise, podemos perceber que, quanto à prática de atividade


física, as crianças com peso adequado (eutróficas) são mais ativas do que as
crianças com sobrepeso, que são pouco ativas. Essa afirmação é possível
devido ao valor de p ser menor do que o de a (p < a). No entanto, essa
certeza só é válida para a amostra estudada, podendo ser extrapolada para
a população da qual se extraiu a mesma.

11
11
UNIDADE Bioestatística Aplicada

Tabela 4
Sobrepeso Eutrofia
Variáveis Valor de p
n % n %
Atividade física 0,04
Pouco ativo 34 73,9 21 52,5
Ativo 12 26,1 19 47,5

7. Na terceira análise da tabela, outro teste estatístico é feito e novamente não


observamos diferenças entre os grupos de crianças quanto ao hábito de ver
TV, pois o valor de p foi maior do que o nível de significância (p > a).

Tabela 5
Sobrepeso Eutrofia
Variáveis Valor de p
n % n %
Televisão (h/dia) 0,86
0a2 13 28,4 12 30
3 ou mais 33 71,6 28 70

Esse achado nos permite admitir, exclusivamente para essa amostra, que o há-
bito de ver TV não teve relação com a condição de a criança ser (ou estar) com
sobrepeso ou peso normal (ambos os grupos assistem a mais de 3 horas de TV
por dia!), ainda que saibamos por outros estudos que há uma forte relação de causa
e efeito entre as horas gastas para assistir TV e o ganho de peso, seja de adultos
ou de crianças. Essa assertiva dada pela tabela vale, exagerando na extrapolação,
para a população da qual a amostra foi extraída, considerando que os critérios de
seleção (lembra-se das formas de amostragem?) tenham sido adequadas.

É essa uma das grandes importâncias da estatística: buscar ser conclusiva para
a amostra, diminuindo as chances de que os resultados encontrados tenham sido
ocorrências do acaso, da sorte.

Dessa forma, fica claro que a compreensão de cada um dos testes é fundamental
para melhor compreensão dos dados apresentados em tabelas ou figuras. Tanto
para testes que utilizam dados quantitativos, como qualitativos, ou ambos, a regra
é sempre a mesma. Se:

p > () ( não haverá diferença significante entre as médias ou proporções (frequências)


p ≤ () ( haverá diferença significante entre as médias ou proporções (frequências)

12
Testes Estatísticos
Durante a disciplina, aprendemos que existem testes para serem aplicados em
amostras e/ou populações. Esses testes também permitem identificar a relação en-
tre duas ou mais variáveis (veja o modelo esquemático abaixo). Caso quiséssemos
analisar a relação entre duas variáveis, poderíamos escolher, por exemplo, um dos
seguintes testes:

Tabela 6 – Exemplo de modelo esquemático para realização de testes estatísticos


Tipo da variável Tipo da variável Tipo de resposta obtida Teste estatístico possível de ser realizado
Qualitativa Quantitativa · Teste T de Student
· nominal · contínua Quantitativa · Anova (Análise
· ordinal · discreta de Variância)
Qualitativa Qualitativa · Teste de Fisher;
· nominal · nominal Qualitativa · Teste qui-quadrado
· ordinal · ordinal

Quantitativa Quantitativa · Teste de correlação;


· contínua · contínua Quantitativa · Teste de regressão.
· discreta · discreta

A análise estatística descritiva também é importante e, como já disse anterior-


mente, se foi estudada a população, os dados serão mais conclusivos se compa-
rados aos resultados extraídos de uma amostra. Sua importância poderá ser, no
mínimo, a de “descrever” dados, sejam eles relacionados à variável primária ou
não. Vejamos o exemplo abaixo:

Tabela 7 – Ingestão calórica e estado nutricional das crianças moradoras da Favela do Fragoso, em Olinda, PE
Calorias/dia
Estado nutricional
Média DP Mínimo P50 Máximo RDA ADE (%)
Sobrepeso 2250 384 1696 2158 2997 1900 115,7
Eutrofia 1776 259 1110 1818 2313 1900 91,1

Nesse exemplo, temos a descrição das calorias ingeridas pelas crianças com
sobrepeso e eutróficas de um determinado local, no caso, uma favela em Olinda.
As medidas de resumo e de dispersão foram utilizadas para apresentar esses dados.
As conclusões não serão tão conclusivas como aquelas que obtemos com a análise
analítica, mas, muitas vezes, o que se quer é a descrição detalhada dos dados, apenas.

A Adequação da Amostra
Um ponto que merece a nossa atenção durante uma análise crítica é o tama-
nho da amostra e a forma de amostragem. Esses aspectos determinarão quanto
podemos confiar nas informações obtidas, bem como no poder de extrapolação
dos resultados.

13
13
UNIDADE Bioestatística Aplicada

Figura 4
Fonte: Getty Images

Vejamos no exemplo abaixo como uma escolha inapropriada dos elementos amos-
trais poderia trazer conclusões incorretas a respeito da população da qual foi extraída:
Em 1988, Shere Hite levantou, por meio de questionários inseridos em
revistas femininas americanas, dados sobre a sexualidade feminina. Esti-
ma-se que cerca de 100.000 mulheres foram colocadas em contato com
o questionário, mas só 4500 responderam. Mesmo assim, a amostra é
grande. Você acha que essa amostra pode dar boa ideia do comporta-
mento sexual das mulheres americanas daquela época? (SILVA, 2000)

O que você acha dessa condição? Qual a situação perigosa que ocorre nessa situação?

Figura 5
Fonte: Getty Images

14
Resposta:
O comportamento dos voluntários é diferente do comportamento dos
não-voluntários. Então – embora seja difícil ou até impossível estudar o
comportamento de pessoas que respondem a um questionário –, não se
pode concluir que a amostra de respondentes representa toda a popu-
lação (incluindo aqueles que não respondem). Conclusões baseadas em
amostras de pessoas que, voluntariamente, destacam o encarte da revis-
ta, respondem ao questionário e o remetem pelo correio são tendencio-
sas. Não se pode fugir à conclusão de que o questionário foi respondido
apenas por leitoras da revista e, entre elas, mulheres dispostas a falar
sobre sua vida pessoal. (VIEIRA, 2008)

Diagrama de Dispersão
e Teste de Correlação
Para elucidar outra aplicação da bioestatística, consideraremos o seguinte qua-
dro de informações:

Tabela 8
Quantidade de
Sujeitos Idade
relações sexuais/mês
A 15 8
B 20 8
C 26 8
D 29 8
E 33 10
F 45 5
G 47 8
H 90 2
I 86 1
J 77 3
K 48 5
L 60 3
M 65 3
N 66 4
O 69 2
P 75 2
Q 17 3
R 18 5
S 20 4
T 18 3
U 26 8

15
15
UNIDADE Bioestatística Aplicada

Quantidade de
Sujeitos Idade
relações sexuais/mês
V 90 2
W 92 4
X 97 0
Y 75 2
Z 26 8
AA 28 6

Analisando o quadro, podemos notar que sujeitos mais novos parecem realizar
mais relações sexuais por mês quando comparados aos mais velhos. Será que
existe alguma relação entre idade e quantidade de relações sexuais, considerando
a amostra acima?

Usando o software Excel, pode-se selecionar o assistente gráfico e optar pelo


gráfico de dispersão para entender um pouco mais. Vejamos o gráfico.

Figura 6

No gráfico acima, podemos verificar que parece mesmo existir uma relação, que
passaremos a chamar de correlação, entre as duas variáveis quantitativas (quanti-
dade de relações sexuais/mês e idade).

O teste de correlação de Pearson permite determinar o grau de correlação exis-


tente entre duas variáveis quantitativas. Seu valor pode variar de 0,0 a 1,0, sendo
que, quanto maior o valor, melhor a correlação. O valor de correlação, comumente
representado pela letra “r”, vem acompanhado de um sinal positivo (+) ou negativo
(-) que indica se a correlação é diretamente proporcional (+) ou inversamente pro-
porcional (-).

16
Na situação acima, encontraremos um valor de r = 0,71 e o sinal de negativo
(r = – 0,71), pois a correlação é inversamente proporcional, já que, no caso, quanto
maior a idade dos sujeitos, menor é a quantidade de relações sexuais/mês. Logo,
poderíamos representar o gráfico da seguinte forma:

Figura 7

Alguns estatísticos classificam os resultados possíveis quanto ao teste de correla-


ção da seguinte forma:

Figura 8
Fonte: Getty Images

17
17
UNIDADE Bioestatística Aplicada

Correlação fraca: se o r estiver entre 0,0 e 0,39;


Correlação moderada: se o r estiver entre 0,4 e 0,69;
Correlação forte: se o r estiver entre 0,7 e 1,0.

Obs.: Esses valores estarão sempre acompanhados do sinal de (+) ou (–).

Retomando o Assunto “Variáveis”


Vimos, nas unidades passadas, o que são variáveis e como essas podem ser
classificadas (como qualitativas e quantitativas, por exemplo). No entanto, quando
tratamos de análise estatística, ainda podemos classificar as variáveis, indepen-
dentemente da natureza da variável, como: Preditoras, Respostas ou de Controle.
Vamos defini-las:

Variável PREDITORA, EXPLICATIVA OU INDEPENDENTE: permite predizer uma resposta.


Exemplo: Fumo e risco de doença coronariana. A variável resposta é FUMO.

Variável RESPOSTA OU DEPENDENTE: aponta o evento que se pretende estudar.


Exemplo: PREVALÊNCIA DE OBESIDADE.

Variável de CONTROLE ou de CONFUSÃO: usada para avaliar a repercussão ou influ-


ência negativa de um evento/situação sobre os resultados.
Exemplo: A influência da escolaridade na estimativa de renda de um adulto.

Um outro estudo que esclarece bem o que é uma variável confudidora (ou
de confusão):
Há alguns anos, um pesquisador concluiu que o consumo de café au-
mentava o risco de câncer de pâncreas (a análise estatística mostrava
uma associação significante entre as duas variáveis). Quando o trabalho
foi re-analisado, concluiu-se que na verdade o fator de risco era o fumo.
O que ocorreu foi que os fumantes tomavam mais café. Assim, o café
era uma variável de confusão, ou seja, estava associada tanto ao fator de
risco verdadeiro (fumantes tomam mais café) como à doença (o consumo
de café entre os portadores de câncer de pâncreas era maior do que não
população geral). No entanto, não havia relação causa-efeito entre consu-
mo de café e câncer de pâncreas.

Fonte: Unifesp Virtual. Curso de Introdução à Bioestatística. Aula 1 – Introdução à Bioestatística

DEPENDENDO DA PERGUNTA DO ESTUDO, UMA MESMA VARIÁVEL


PODE SER PREDITORA, RESPOSTA OU CONTROLE

18
A Tabela de Contingência
Analise a tabela a seguir:

Tabela 9 – Idade, nível de atividade física e de lazer e tempo em frente à


televisão segundo nutricional, em crianças da Favela do Fragoso, em Olinda, PE
Sobrepeso Eutrofia
Variáveis Valor de p
n % n %
Idade (anos) 0,99
5 6 13 4 10
6 11 23,9 9 22,5
7 10 21,7 9 22,5
8 8 17,3 7 17
9 11 23,9 11 27
Atividade física 0,04
Pouco ativo 34 73,9 21 52,5
Ativo 12 26,1 19 47,5
Televisão (h/dia) 0,86
0a2 13 28,4 12 30
3 ou mais 33 71,6 28 70

É bem provável que você tenha percebido que tabelas com essa estrutura já apa-
receram antes, em módulos anteriores, ou até mesmo nessa unidade. Esse tipo de
tabela é o que chamamos de Tabela de contingência. Esse tipo de tabela, muitas
vezes, não necessita obrigatoriamente de estar acompanhada do resultado de um
teste estatístico analítico, como o teste qui-quadrado. A simples apresentação des-
sa tabela, mostrando a relação de duas ou mais variáveis, será bem explicativa se
comparada à apresentação em separado que essas mesmas variáveis poderiam ter.

Vejamos o exemplo acima:


8. Na tabela, percebemos que a variável estado nutricional, cujas categorias
são sobrepeso e eutrofia, é a variável dependente da tabela e, possivel-
mente, do estudo;
9. As outras variáveis – idade, atividade física e televisão – são as outras
variáveis independentes;
10. Na análise das tabelas de contingência, comumente tiramos conclusões a
partir da variável dependente. Nesse caso, poderíamos ter uma conclusão
da seguinte forma: considerando o estado nutricional das crianças inves-
tigadas no estudo, a maior parte de crianças com eutrofia (peso normal)
foram as crianças com 9 anos de idade;

19
19
UNIDADE Bioestatística Aplicada

Vale destacar que as tabelas de contingência não têm por finalidade determinar
causa e consequência, isto é, essas tabelas mostram a relação.
Mas pode acontecer de a natureza e o aspecto observados em determinada variável
darem a noção de causa e consequência.

Estamos finalizando mais uma unidade e esperamos que você tenha compreendido
um pouco mais sobre a importância e a aplicabilidade dos conceitos aqui trabalhados.

20
Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:

Leitura
A Escolha do Teste Estatístico – um tutorial em forma de apresentação em PowerPoint
https://goo.gl/3MZAiS
A Escolha do Método Estatístico
https://goo.gl/w5h5cd
Revisão Sobre Diagramas de Dispersão e Correlação
https://goo.gl/Beoc6x
Análise de Correlação e Medidas de Associação
https://goo.gl/iRQrn7

21
21
UNIDADE Bioestatística Aplicada

Referências
ARANGO, H. G. Bioestatística: Teórica e Computacional. 2. ed. Rio de Janeiro:
Guanabara Koogan, 2005.

IOCHIDA, L. C.; Castro A. A. Projeto de pesquisa (Parte VIII- método estatístico /


análise estatística). In: Castro A. A. Planejamento de Pesquisa. São Paulo: 2001.

SILVER, M. Estatística para Administração. São Paulo: Atlas, 2000.

TRIOLA, M. Introdução à Bioestatística. 9. ed. Rio de Janeiro: LTC, 2005.

VIEIRA, S. Introdução à Bioestatística. Rio de Janeiro: Elsevier, 2008.

22

Você também pode gostar