Você está na página 1de 43

DEFINIÇÕES E CONCEITOS EM BIOESTATÍSTICA O objetivo deste trabalho é oferecer um guia para os cientistas da área

biológica na condução de suas investigações científicas que necessitem de uma


1.1 INTRODUÇÃO abordagem da Bioestatística.
Algumas das informações obtidas de conhecimentos podem gerar uma 1.2 A ESTATÍSTICA MÉDICA
dificuldade, pois a ciência não conhece a realidade, ela a representa por meio de Com a crescente utilização da estatística na prática da medicina e de outras
modelos e teorias de diversos estudos. áreas biológicas, faz-se necessário o seu constante conhecimento por profissionais
da área da saúde.
Um ramo do conhecimento que aspira dificuldades da universalidade das Diante do exposto, fica evidente que a Estatística Médica se constitui nos
explicações científicas e que implica na padronização dos dados é a avaliação fundamentos da Medicina Quantitativa. As metodologias estatísticas são cada vez
estatística das informações. A ampla diversidade dos métodos estatísticos mais necessárias no estudo de situações em que as variáveis de interesse estão
encontrados na literatura, a vasta aplicação de metodologias de análise nos estudos sujeitas a variações aleatórias. Portanto, torna-se necessário, para a realização de
biológicos e a integração da estatística como ciência na essência do método estudos clínicos, a escolha adequada de uma metodologia capaz de tratar tal
científico, são as principais razões para se destacar a necessidade do uso e do variabilidade. Portanto, os métodos estatísticos representam estratégias de solução
conhecimento das técnicas estatísticas na investigação científica. de problemas na área da pesquisa médica.

Para a estatística a pesquisa tem significado se conhecermos o verdadeiro Ancorados nos conhecimentos substantivos da área médica e da estatística, os
problema sobre o universo que elegemos, quanto às variáveis e às metodologias de profissionais beneficiam-se de uma visão estruturada da metodologia da pesquisa.
análises.
A coleta, o processamento, a interpretação e a apresentação de dados A Bioestatística representa o conjunto de metodologias estatísticas utilizadas
numéricos pertencem todos ao domínio da Estatística. no tratamento da variabilidade existente nas ciências médicas e biológicas.
Essas atribuições compreendem desde o cálculo de pontos em esportes, a Portanto, a Bioestatística fornece respaldo para decisões acertadas na
coleta de dados sobre nascimentos e mortes, a avaliação da eficiência de produtos presença da incerteza, ou seja, é o planejamento e a análise de estudos médicos e
comerciais, até a previsão do tempo. biológicos.
A informação estatística é apresentada constantemente em todos os meios de A Biometria, dentro da área biológica e médica é compreendida como a
comunicação de massa: jornais, televisão, rádio e internet. ciência que estuda as medidas de seres vivos.
Dessa forma, a Bioestatística (Estatística Médica) pode ser vista como uma
Observamos uma abordagem crescentemente quantitativa utilizada em todas ferramenta responsável pela organização e validação do conhecimento
as ciências, na administração e em muitas atividades que afetam diretamente médico/biológico.
nossas vidas.
Isso inclui o uso de técnicas matemáticas nas decisões econômicas, públicas 1.3 DADOS BIOMÉTRICOS
ou privadas; na avaliação de controle de poluição; na análise de problemas de A Biometria (do grego Bios=vida, metron=medida) representa a utilização de
tráfego; no estudo dos efeitos de vários medicamentos; na adoção de novas características biológicas em mecanismos de identificação. Ou seja, é a ciência da
técnicas agrícolas e novas cultivares; em estudos demográficos como o tecnologia de medição e análise de dados biológicos. As informações obtidas
crescimento populacional e migração. baseadas nos elementos que constituem a população ou a amostra são denominadas
A partir desses poucos exemplos, podemos notar a importância da estatística tecnicamente de dados biométricos.
como ferramenta necessária para a compreensão dos fenômenos que ocorrem nas Os dados relativos a indivíduos podem ser coletados tanto diretamente pelo
mais diferentes áreas. pesquisador, como por meio de declarações feitas pelos próprios indivíduos. Para
que se obtenham essas informações o pesquisador pode fazer um questionário com Esse estudo é realizado, normalmente, a cada dez anos na maioria dos países.
perguntas para serem respondidas por escrito, ou fazer entrevistas. De acordo com a Organização das Nações Unidas (ONU), o censo é definido como
Assim, por exemplo, os dados a respeito do estado de saúde de um indivíduo “o conjunto de operações que consistem em recolher, agrupar e publicar dados
podem ser obtidos tanto mediante exame físico como por meio de declarações demográficos, econômicos e sociais relativos a um momento determinado ou em
prestadas pelo próprio indivíduo (anamnese). Um mesmo elemento pode fornecer certos períodos, a todos os habitantes de um país ou território”.
diversos dados. Assim, por exemplo, os pacientes de uma clínica fornecem os
dados relativos a sexo, profissão, etc., além de dados relativos ao diagnóstico e 1.4.1.1 O CENSO NO BRASIL
tratamento. Em 1936, foi criado no Brasil, o Instituto Brasileiro de Geografia e Estatística
– IBGE.
Após o levantamento de dados, isto é, após a operação de coleta do material Desde então, o órgão tornou-se o responsável pela realização do Censo
básico para descrição e posterior análise das características de uma população, há a Demográfico no país.
necessidade de os dados e os resultados obtidos serem dispostos de uma forma Os censos demográficos são planejados para serem executados nos anos de
ordenada e resumida, a fim de auxiliar o pesquisador na análise dos mesmos. finais zero, ou seja, a cada dez anos.
Os dados coletados nas áreas médicas e biológicas podem ser classificados No intervalo entre dois censos demográficos, realiza-se a contagem da
em dados quantitativos e qualitativos. Os dados qualitativos (Ex: raça, doença, população.
etc.) são aqueles que representam as qualidades (características) de um elemento
em pesquisa. 1.4.1.2 FASES DE UM RECENSEAMENTO OU CENSO
Os dados qualitativos podem ser divididos em nominais, quando não existe
nenhuma ordenação nas suas possíveis realizações (Ex: a cor da pele, a cor os  Realização do planejamento e preparação.
olhos, etc.) ou em ordinais, quando os seus possíveis resultados podem ser  Notação e coleta dos dados.
ordenados por algum critério específico (Ex: altura das pessoas, etc.). Já os dados  Compilação e verificação dos dados.
quantitativos são resultados de uma contagem ou mensuração (Ex: número de  Apuração dos dados.
pessoas com determinada doença, etc.).  Publicação dos dados.

1.4 OS CONCEITOS DA BIOESTATÍSTICA No Brasil, atualmente, são 185 milhões de habitantes, cerca de 16 milhões a
1.4.1 CENSO mais do que o ano de 2000.
Considerado um estudo estatístico, o censo, também chamado recenseamento Esse fato permite inferir uma grande dinâmica da população brasileira, que
demográfico, permite a coleta de dados (informações) sobre determinada está ligada a fatores como taxas de natalidade e expectativa de v
população.
A figura 1 representa a pirâmide etária ou também chamada de pirâmide
Exemplos de informações coletadas: demográfica ou populacional. Por meio dela é possível visualizar a distribuição de
 Número de habitantes. diferentes grupos etários em uma população.
 Número de homens e mulheres.
 Número de crianças e idosos. FIGURA 1 - PIRÂMIDE ETÁRIA DA POPULAÇÃO BRASILEIRA EM 1950,
 Onde e como vivem as pessoas. 1980 E 2010
 Profissão.
 Faixa salarial, etc.
Alguns exemplos de Censos realizados no Brasil:
a) Censo da Educação Superior
 Realizado pelo INEP (Instituto Nacional de Estudos e Pesquisas Educacionais
Anísio Teixeira).
 É realizado anualmente.
 É feita a coleta de dados do ensino superior, cursos de graduação presencial ou
a distância, cursos sequenciais, vagas oferecidas, inscrições, matrículas,
ingressantes e concluintes, além de informações sobre docentes.
Objetivos: oferecer informações detalhadas sobre a situação atual e as grandes
De acordo com a figura 1 (vista anteriormente), a base representa os jovens
tendências do setor acadêmico.
da população, representados por pessoas de até 14 anos.
A área intermediária ou corpo representa o grupo adulto da população,
b) Censo Agropecuário
compreendendo pessoas entre 15 e 59 anos e, por fim, o topo, ou ápice, que
representa a população idosa, ou seja, pessoas acima de 60 anos.  Realizado pelo IBGE (Instituto Brasileiro de Geografia e Estatística).
Os diferentes formatos das pirâmides indicam alterações significativas na  Representa o levantamento de informações sobre estabelecimentos
estrutura etária de uma população. agropecuários, florestais e/ou aquícolas de todos os municípios de um país.
Objetivos: atualizar dados de censos anteriores, fornecer informações a respeito de
Exemplos: aspectos econômicos, sociais e ambientais da atividade agropecuária.
 Pirâmides com bases largas indicam altas taxas de natalidade e aquelas com  A última edição ocorreu em 2007, tendo como ano-base 2006.
bases estreitas sugerem baixos índices de nascimento.
1.4.2 POPULAÇÃO
 Pirâmides com topos largos sugerem populações com elevada expectativa de
População ou universo estatístico representa o conjunto de elementos sobre o
vida, já topos estreitos mostram que há uma pequena participação dos idosos.
qual incide o estudo estatístico. Esse conjunto pode ser de pessoas, animais,
resultados experimentais, que apresentam uma ou mais características em comum.
As taxas de natalidade e de mortalidade não são constantes. De acordo com o
IBGE, em 1950, 41,8% da população do país se encontrava na faixa até 14 anos. Já
Vídeo
em 2010, esse percentual foi de apenas 24,7%. Há 60 anos, o número médio de
A cada elemento da população nomear-se unidade estatística, o número de
filhos por casal era superior a seis e, em 2010, não ultrapassa dois, indicando
elementos de uma população, ou seja, o número de unidades estatísticas é
assim, que a população brasileira está em movimento.
designado de dimensão populacional. A dimensão populacional pode ser finita
ou infinita.
FIGURA 2 - DINÂMICA DA POPULAÇÃO BRASILEIRA
Exemplo: O gestor de um hospital pretende ter uma ideia da porcentagem de
pessoas com determinada doença naquele mês. A população em estudo é
representada por todas as pessoas internadas no respectivo mês. A característica
estatística tem apenas duas modalidades: pessoas com a determinada doença ou
pessoas sem a determinada doença.

a) Dimensão populacional ou população finita:


Em uma população finita é possível enumerar todos os elementos que a formam. eventualmente poderão existir no futuro, ou seja, suas unidades não são
Refere-se a um universo limitado. identificáveis, mas apenas definidas pela caracterização das condições que lhe
Exemplos: Quantidade de medicamentos produzidos por uma indústria integrem.
farmacêutica por mês.
o A população de uma cidade. As populações de interesse são, em geral, muito grandes ou até mesmo
o O número de alunos de uma sala de aula. infinitas, embora algumas vezes possam ser bem pequenas.
o O número de pacientes com determinada doença em um hospital. Na maioria das vezes, devido ao alto custo, ao intenso trabalho e ao tempo
o O número de hospitais de uma determinada cidade. desprendido, limitamos as observações referentes a uma determinada pesquisa a
apenas uma parte da população que denominamos de amostra.
b) Dimensão populacional ou população infinita:
Em uma população infinita os seus elementos não podem ser mensurados. População ou universo é: Um conjunto de elementos com pelo menos uma
Refere-se a um universo não delimitado. característica em comum.
Exemplos:
o Os resultados (cara ou coroa) obtidos em sucessivos lançamentos de 1.4.3 AMOSTRA
uma moeda. Amostra é o nome dado a qualquer subconjunto de uma determinada
o O conjunto de números inteiros, reais ou naturais. população com a finalidade de reproduzir a realidade estudada.
A amostra deve ser representativa, ou seja, manter as características da
o Os pontos de uma reta.
população.
o A temperatura em cada ponto do Brasil.
FIGURA 3 - DEMONSTRAÇÃO DE POPULAÇÃO E AMOSTRA
Nem sempre é possível estudar todos os elementos de uma determinada população
por vários motivos, dentre os mais importantes:
o A população pode ter dimensão infinita.
o Pode o estudo da população levar à destruição da mesma.
o Pode o estudo da população ser muito dispendioso em tempo e
recursos financeiros.
o Inacessibilidade de alguns dos elementos da população.

As populações também podem ser classificadas em populações reais ou populações


conceituais.
1.4.4 PARÂMETROS
Populações reais Parâmetros estatísticos são valores numéricos utilizados para descrever uma
Uma população é chamada de real quando é constituída por unidades característica de determinada população.
existentes no momento da execução da pesquisa.
Populações reais são necessariamente finitas. 1.4.5 ESTIMATIVAS DOS PARÂMETROS
Populações conceituais Nos processos biológicos, é praticamente impossível medir todos os
Uma população é chamada de conceitual quando é constituída de unidades elementos de uma população. Por essa razão, os pesquisadores trabalham com
existentes no momento da execução da pesquisa, como também de unidades que, dados amostrais ou experimentais.
Desse modo, todas as inferências estatísticas são baseadas nas distribuições A realização de pesquisas é baseada nas questões relativas às tomadas de
amostrais e na teoria probabilística observações de realidade, ou seja, na obtenção de uma amostra dessa realidade. A
Estimativa de parâmetros são os valores calculados a partir dos dados da busca por métodos adequados para assegurar o valor científico das informações e
amostra, com o objetivo de avaliar parâmetros desconhecidos. A estimativa pode conclusões aventadas é sempre realizada pelos cientistas.
ser obtida pela estimação por ponto ou pela estimação por intervalo. Na estimação O método, também chamado de delineamento, é o plano estratégico de
por ponto ou pontual é obtido um único valor amostral para estimar o parâmetro observação da realidade e é também de grande importância no processo. Como já
populacional. mencionado, os levantamentos por amostragem têm a finalidade de reproduzir a
Convém salientar que o estimador é uma variável aleatória, que é função dos realidade estudada.
elementos amostrais. Dessa forma, a estimativa por ponto pode variar entre as Esses levantamentos se aplicam ao conjunto real composto de elementos,
amostras, estando, pois, sujeita a erros de estimação, devido ao processo de denominado população de estudo. Os dados são coletados em amostras de
aleatorização e à variabilidade inerente à população da qual foi retirada a amostra. população de estudo e as estimativas passam a ser as informações disponíveis para
os parâmetros, necessitando assim de uma amostragem.
Já na estimação por intervalo é construído um intervalo com uma probabilidade A amostragem compreende a definição do tamanho e o desenho da amostra e,
pré- fixada de conter o parâmetro populacional. Essas probabilidades são, em ainda, a escolha de procedimentos para a obtenção de estimativas.
geral, fixadas em 95% ou 99% e são denominadas nível de confiança. A importância de uma amostra está na avaliação de grandezas desconhecidas
A. O estimador deve ser não viciado ou não viesado. de uma população e a qualidade desta avaliação depende basicamente da
Dizer que um estimador é não viciado ou não viesado significa que, se forem representatividade da amostra e, a representatividade de uma amostra depende de
retiradas todas as amostras de tamanho n de uma população, a média de todas sua capacidade e reproduzir as características básicas de sua população.
as estimativas obtidas em todas as amostras possíveis será igual ao valor do Muito provavelmente você não será capaz de entrevistar toda uma população
parâmetro que se deseja estimar. de pessoas ou examinar todo um conjunto de objetos, então você se orienta por um
B. O estimador deve ser consistente. pequeno grupo retirado de uma população/conjunto.
Um estimador será consistente se, além de não viciado, sua variância tender Você vai inferir o comportamento da população com base nos resultados
para zero, quando n aumenta, tendendo para o infinito. Esse fato indica que o descritos da amostra. Uma amostra é uma parte integrante de uma população.
estimador converge em probabilidade para o parâmetro à medida que n cresce. Diversos fatores justificam os trabalhos com amostras, no lugar de estudar a
C. O estimador dever ser eficiente. respectiva população, entre as quais, destacam-se:
Um estimador eficiente é aquele que apresenta menor variância.  Custo - As despesas com operacionalização estatística da população são
geralmente bem maiores que com a averiguação de uma amostra.
1.4.6 UNIDADE DE AMOSTRAGEM  Velocidade - As pesquisas realizadas com amostras são mais rápidas, em
A amostragem é uma ferramenta que tem como objetivo permitir a análise de virtude de conter um menor número de unidades.
um subconjunto de uma população, levantando, assim, informações sobre fatos  Praticidade - Conforme o próprio conceito, às vezes, a dimensão da
relativos a esse subconjunto, com a intenção de inferir o comportamento da população torna as pesquisas impraticáveis.
população.
A amostragem permite recolher amostras, e ainda garante, tanto quanto A amostragem pode ser dividida em amostragem probabilística e não
possível, o acaso na escolha. probabilística. A amostragem probabilística caracteriza-se por garantir que todo
Desta forma, cada elemento da população passa a ter a mesma chance de ser elemento pertencente ao universo de estudo possua probabilidade, conhecida ou
escolhido, o que garante à amostra o caráter de representatividade, e isto é muito diferente de zero, de pertencer à amostra sorteada.
importante, pois, nossas conclusões relativas à população vão estar baseadas nos Vários processos de amostragem probabilística existem e são descritos na
resultados obtidos das amostras dessa população literatura. Esses métodos podem e são, pelo menos na maioria das situações,
usados de uma forma combinada. A amostragem probabilística é representada por A população submetida a esse tipo de amostragem é, em geral, finita, cujos
vários processos, dentre os quais os destaques a seguir. elementos possam ser identificados em uma listagem enumerada.
Uma característica exigida para que haja sucesso da amostragem, ou seja,
a) Amostragem casual ou aleatória simples para que estimativas fidedignas dos parâmetros populacionais possam ser obtidas,
A amostragem casual simples é o processo de amostragem probabilística na refere-se a uma homogeneidade entre os elementos dessa população.
qual qualquer combinação de (n) elementos da amostra, retirada dos (n) elementos Essa homogeneidade interna da população é um tanto quanto difícil de ser
populacionais que compõe a população, tem igual probabilidade de vir a ser caracterizada nas situações práticas com que o investigador se depara. Em hipótese
sorteada. alguma ela se refere a uma ausência de variabilidade da população.
É o processo mais elementar e frequentemente utilizado. É equivalente a um
sorteio lotérico (Figura 4). b) Amostragem proporcional estratificada
FIGURA 4 - DEMONSTRAÇÃO DE UMA AMOSTRAGEM ALEATÓRIA SIMPLES Dá-se o nome de amostragem estratificada ao sistema de obtenção de amostra
em que a população de (n) elementos é previamente dividida em grupos
mutuamente exclusivos, denominados de estratos, e dentro dos quais são sorteadas
amostras causais simples de tamanho n.
Como é provável que a variável em estudo apresente, de estrato em estrato,
um comportamento heterogêneo e, dentro de cada estrato, um comportamento
homogêneo, convém que o sorteio dos elementos da amostra leve em consideração
tais estratos. Uma das principais razões para se usar a estratificação fundamenta-se
“Na prática, cada elemento é amostrado por um processo aleatório que confere na premissa de que esse processo leva a um ganho de precisão na estimação de
igual chance de ser sorteado a cada elemento da população, sorteia-se um e repete- parâmetros da população.
se o processo para se selecionar o próximo elemento, dando sempre chances iguais Isso realmente ocorre, pois é possível subdividir uma população heterogênea
para todos aqueles remanescentes na população.” em subpopulações internamente homogêneas. Dessa forma, um estrato é
considerado homogêneo internamente se, de elemento para elemento, há apenas
“Repete-se tantas vezes esse procedimento até que a amostra de n elementos seja uma pequena variação.
composta. A partir do momento em que os elementos amostrados da população são Por essa razão, uma estimativa precisa para um parâmetro de um estrato
removidos para as sucessivas retiradas subsequentes, esse método é denominado populacional pode ser obtida com apenas uma pequena amostra desse estrato.
de amostragem simples ao acaso sem reposição.” Essas estimativas dos diferentes estratos são combinadas para a obtenção de uma
estimativa e um determinado parâmetro da população como um todo.
“Se por um lado os elementos populacionais são repostos após uma retirada, a FIGURA 5 - DEMONSTRAÇÃO DE UMA AMOSTRAGEM SISTEMÁTICA
amostragem é dita com reposição e é perfeitamente possível de ser feita.”

“À primeira vista, e intuitivamente, pode-se deduzir que não é muito vantajoso que
um mesmo elemento apareça duas, três ou mus vezes na amostra.
Se a população é muito grande os tipos de amostragem, com ou sem reposição, não
apresentam grandes diferenças. Isso porque a chance de um elemento ser sorteado
duas ou mais vezes para a amostra é muito pequena.” c) Amostragem Sistemática
A amostragem sistemática é um tipo de amostragem em que o plano de
amostragem é obtido por um critério pelo qual intervalos regulares de mesmo
tamanho entre unidades da amostra são tomadas até se compor uma amostra de
tamanho (n) de toda a extensão da localização física da população alvo (Figura 5). f) Amostragem Intencional
Quando os elementos da população já se acham ordenados, não há De acordo com determinado critério, é escolhido intencionalmente um grupo
necessidade de construir o sistema de referência. Porém, muitas vezes, a população de elementos que irão compor a amostra. O investigador se dirige intencionalmente
não pode ser ordenada em uma dimensão apenas. a grupos de elementos dos quais deseja saber a opinião.
As posições das unidades da amostra são definidas por duas dimensões Exemplo: numa pesquisa sobre preferência por determinado cosmético, o
(coordenadas). A forma de amostrar deve considerar um gride alinhado ou não pesquisador se dirige a um grande salão de beleza e entrevista as pessoas que
alinhado. ali se encontram.
No gride alinhado, a sequência de unidades na horizontal, ou na vertical,
segue a mesma distância ou alinhamento. No gride não alinhado essa disposição g) Amostragem por quotas
não obedece a essa regra. Um dos métodos de amostragem mais comumente usados em levantamento
de mercado e em prévias eleitorais. Ele abrange três fases:
d) Amostragem por conglomerados ou agrupamentos
Quando os elementos da população são reunidos em grupos que são sorteados 1ª: Classificação da população em termos de propriedades que se sabe, ou
para compor a amostra, o processo é denominado de amostragem por presume, serem relevantes para a característica a ser estudada.
conglomerado (Figura 6). 2ª: Determinação da proporção da população para cada característica, com base na
A razão de se usar um tipo de amostragem como esse é principalmente constituição conhecida, presumida ou estimada da população.
motivado por critérios de ordem prática. 3ª: Fixação das quotas para cada entrevistador a quem tocará a responsabilidade de
Dentre esses critérios destaca-se a ausência de uma listagem de todos os selecionar entrevistados, de modo que a amostra total observada ou entrevistada
elementos populacionais. contenha a proporção e cada classe tal como determinada na 2ª.
FIGURA 6 - DEMONSTRAÇÃO DEAMOSTRAGEM POR CONGLOMERADOS.
Podem surgir dificuldades no processo de amostragem, dentre os quais, os
mais importantes são:
 Erros de amostragem aleatórios que aparecem no processo de amostragem.
Dão origem a resultados diferentes dos que obteríamos se tivéssemos
usado um censo. São devidos à aleatoriedade da repetição de uma
experiência e são fáceis de ultrapassar, bastando para isso repetir várias
vezes a experiência para obter outras amostras.
Agrupamentos típicos são: quarteirões, famílias, organizações, agências,  Os erros de amostragem não aleatórios não estão relacionados com a
edifícios, etc. seleção da amostra. Muitas vezes, são devidos à complexidade do
processo.
e) Amostragem Acidental
Trata-se de uma amostra formada por aqueles elementos que vão aparecendo,
Uma parte da população retirada para análise denomina-se: AMOSTRA
que são possíveis de se obter até completar o número de elementos da amostra.
Geralmente utilizada em pesquisas de opinião, em que os entrevistados são
1.4.7 VARIÁVEIS
acidentalmente escolhidos.
O termo variável é utilizado genericamente para indicar aquilo que é sujeito à
Exemplo: pesquisa de opinião em praças públicas, ruas de grandes cidades,
variação ou à inconstância no contexto da pesquisa científica. Uma variável é
etc.
definida como a função que estabelece uma correspondência entre os níveis de
uma característica e os valores de um conjunto numérico segundo uma escala de
medida. Em outras palavras, uma variável é uma característica populacional que
pode ser medida de acordo com alguma escala. Ou seja, toda variável é
identificada por um nome ou identificador.
As variáveis coletadas podem ser classificadas em qualitativas e quantitativas
(variáveis aleatórias). As variáveis qualitativas são aquelas que fornecem dados
(informações) de natureza não numérica. Essas variáveis podem ser nominais ou
ordinais. Uma variável é qualitativa nominal quando a característica em estudo é
uma qualidade sem expressar nenhuma ordem hierárquica de classificação.
Já uma variável qualitativa é ordinal quando as características observadas
sugerem uma ordenação natural. As variáveis quantitativas ou também chamadas
de aleatórias são consideradas as mais importantes na estatística, já que, na maioria
das vezes, quando realizamos um experimento, estamos interessados em
características numéricas.

FIGURA 7 - CLASSIFICAÇÃO DAS VARIÁVEIS


1.4.8 VARIÁVEIS ALEATÓRIAS
As variáveis quantitativas ou aleatórias são as características que podem ser
medidas em escala quantitativa, ou seja, apresentam valores numéricos que fazem
sentido.
A variável aleatória é a função que associa um número real a cada elemento
do espaço amostral.
Onde:
S → espaço amostral
s → elemento do espaço amostral S

A variável aleatória está relacionada com a característica do experimento que


pretendemos estudar. As variáveis quantitativas ou aleatórias podem ser discretas
ou contínuas.
As variáveis aleatórias discretas são aquelas em que os dados somente podem
apresentar determinados valores, em geral, números inteiros, ou seja, um conjunto
finito ou enumerável.
Já as variáveis aleatórias contínuas são aquelas cujos dados podem apresentar
qualquer valor dentro de um intervalo de variação possível, ou seja, um conjunto
não enumerável.
2 EXPERIMENTAÇÃO BIOMÉTRICA
2.1 INTRODUÇÃO
A grande maioria das informações obtidas é resultado de observações; ao
passo que a parte mais significativa é a generalização ou o processo indutivo, que
consiste em levar em consideração acontecimentos anteriores para predizer
acontecimentos futuros, ou seja, observações que, posteriormente, possam vir a
acontecer no futuro.

O objetivo geral da estatística, como ciência, é tornar um observador mais


crítico, consciente e, acima de tudo, seguro, para quando, por falta de informações
confiáveis, ele possa agir de forma coerente com base em opiniões e impressões.

2.2 O RACIOCÍNIO INDUTIVO DA BIOMETRIA


Não é possível encontrar no mundo duas coisas exatamente iguais. Portanto,
não é possível garantir que dois experimentos estatísticos sejam exatamente iguais,
de tal forma que será sempre impossível a reprodução exata dos resultados obtidos.
As informações obtidas serão variáveis, em menor ou maior grau, e o erro
experimental estará sempre presente.
Desse modo, serão numerosos resultados que variam entre si, levando em
consideração a dimensão do erro experimental. Todas as generalizações obtidas
tendem a não ser absolutamente precisas; elas devem levar em consideração o erro
experimental e a existência do elemento da incerteza.
Essa incerteza é característica do raciocínio indutivo, e a grande questão é a
consideração desta incerteza nos processos experimentais. Quando se considera a
questão da incerteza na área biológica, depara-se com a problemática relacionada
com a variabilidade proveniente dos organismos vivos e suas partes. Há grande
influência de fatores genéticos, ambientais e de desenvolvimento, de tal modo que
não é possível a reprodução exata de nenhuma situação do sistema.
Isto torna evidente a necessidade do estabelecimento de uma experimentação
calcada em bases sólidas e coerentes, para que todas as variações existentes
possam ser levadas em conta e para que a acurácia dos experimentos seja a maior
possível, dando assim, a credibilidade necessária às informações obtidas.

2.3 DELINEAMENTOS EXPERIMENTAIS


A forma como os tratamentos ou níveis de um fator são dispostos às unidades
experimentais ou parcelas é chamada de delineamento experimental.
Para que o erro experimental seja reduzido ao máximo é necessário o  eij = é o erro experimental na parcela i, j.
estabelecimento de delineamentos experimentais. Diante do exposto, ter ciência de
como o experimento foi instalado e conduzido torna-se de fundamental Exemplo: Um experimento com três tratamentos e duas repetições foi realizado
importância para o sucesso experimental. em DIC. Os dados observados nas parcelas foram representados pela letra Y, com
Por isso, deve-se dar muita importância ao planejamento do experimento. os índices i e j indicando, respectivamente, tratamento e repetição. Os dados
O planejamento experimental de um delineamento é feito de maneira que a podem ser colocados em uma tabela como especificado na tabela seguinte.
variação ao acaso seja reduzida o máximo possível.
Dentre os delineamentos existentes, os mais utilizados são: TABELA 1 - REPRESENTAÇÃO DOS DADOS DE UM EXPERIMENTO EM DIC
COM TRÊS TRATAMENTOS E DUAS REPETIÇÕES
a) Delineamento Inteiramente Casualizado (DIC) = O delineamento
inteiramente casualizado é utilizado em locais cujas condições experimentais
possam ser bem controladas (laboratórios, casa de vegetação, terrenos com pouca
heterogeneidade, etc.), ou seja, quando a variabilidade entre as parcelas
experimentais for muito pequena, isto é, praticamente inexistente.
As vantagens do delineamento inteiramente casualizado (DIC) são:
 O número de graus de liberdade para o erro experimental é máximo.
 O número de tratamentos e de repetições depende apenas do número de Estas observações, segundo o modelo estatístico do delineamento inteiramente
parcelas experimentais disponíveis. casualizado (DIC), podem ser expressas como:
 É o delineamento mais simples de ser instalado e conduzido.
y11 = µ + t1 + e11
O delineamento inteiramente casualizado (DIC) possui como maior desvantagem a y21 = µ + t2 + e21
possibilidade de que toda a variabilidade existente irá inflacionar o erro y31 = µ + t3 + e31
experimental, exceto apenas a fonte de variação devido aos efeitos dos y12 = µ + t1 + e12
tratamentos. Isto pode ocasionar em um erro experimental muito grande e chegar a y22 = µ + t2 + e22
comprometer os resultados do experimento. y32 = µ + t3 + e32

Nesse delineamento os tratamentos são designados aleatoriamente às parcelas Tem-se aqui um sistema de equações no qual são conhecidos apenas os
experimentais. Esse tipo de sorteio implica em que todo tratamento tem a mesma valores de Y (variável resposta). O modo geral de análise para os ensaios em DIC é
chance de ser aplicado a qualquer parcela na área experimental. apresentado na Tabela 2.

Para o delineamento inteiramente casualizado (DIC) o modelo linear adequado DE TABELA 2 - MODELO GERAL ANÁLISE PARA ENSAIOS EM DIC COM I
para este é dado por: TRATAMENTOS E J REPETIÇÕES
yij = µ+ ti + eij

Em que:
 Yij = é a observação feita na parcela para o tratamento i na repetição j.
 µ = representa uma constante inerente a toda parcela.
 ti = representa o efeito do tratamento i.
Quando as parcelas se acham agrupadas em blocos, os tratamentos são
aleatoriamente designados às unidades dentro de cada bloco. Posteriormente, os
blocos são sorteados na área experimental.

A observação da parcela que recebe o tratamento i no bloco j (yij) é definida,


estatisticamente, por:
yij = µ + ti + bj + eij
b) Delineamento em blocos casualizados (DBC) = Diferentemente do Com i = 1, 2, ..., I e j = 1, 2, ..., J
delineamento inteiramente casualizado (DIC), no delineamento em blocos Em que:
casualizados (DBC), a parcela experimental é dividida em grupos homogêneos,  µ = é uma constante inerente à toda observação.
cada grupo constituindo uma repetição.  ti = é o efeito do tratamento i.
No caso de os blocos serem completos, em cada bloco ou repetição deve  bj = é efeito do bloco j.
conter uma vez cada tratamento. A grande finalidade da implantação do DBC é  eij = é o erro na parcela i, j.
manter em todas as etapas do experimento o erro, dentro de cada bloco, tão
pequeno quanto seja possível na prática. As fontes de variação e os respectivos graus de liberdade para o delineamento
Em todas as parcelas de um mesmo bloco deve-se empregar uma técnica em blocos casualizados completos são apresentados na Tabela 3.
uniforme durante toda a condução do ensaio. Quaisquer alterações na técnica de TABELA 3 - CAUSAS DE VARIAÇÃO E GRAUS DE LIBERDADE PARA O
condução ou em outras condições que possam afetar os resultados devem ser feitas DELINEAMENTO EM BLOCOS CASUALIZADOS E I TRATAMENTOS E COM J
entre os blocos. REPETIÇÕES
No campo este agrupamento é feito quando as parcelas são dispostas na área
experimental.
Cada repetição deverá ser formada por um grupo compacto de parcelas, de
forma tão aproximada quanto possível, pois se sabe que as parcelas vizinhas são
mais semelhantes em fertilidade do que parcelas distantes.
Em casos em que a colheita do ensaio deva estender-se por algum tempo é A soma dos quadrados é dada por:
necessário que seja feita repetição por repetição, sendo que, chuvas e outros fatores
podem produzir alterações no peso do material colhido de um dia para o outro.
As principais características e vantagens em relação ao delineamento
inteiramente casualizado (DIC) são:
 Permite o controle da influência de uma fonte de variação além do efeito
de tratamentos, pelo agrupamento hábil das parcelas (controle local).
 Dentro de cada bloco (repetição), as condições ambientais devem ser
homogêneas, podendo variar de bloco para bloco. Em que:
 As repetições podem ser distribuídas por uma área maior permitindo  Bj = é o total do bloco j.
conclusões mais gerais.  Ti = é o total do tratamento i
 G = é o total geral.
c) Delineamento Quadrado Latino = Já no delineamento quadrado latino TABELA 4 - CAUSAS DE VARIAÇÃO, GRAUS DE LIBERDADE E SOMAS DE
(DQL), os tratamentos são agrupados nas repetições de duas formas distintas: QUADRADOS PARA O DELINEAMENTO QUADRADO LATINO
“linhas” e “colunas”. Isso permite eliminar os efeitos de duas fontes de variação do
erro experimental.
O esquema do delineamento para I tratamentos corresponde a um “quadrado”
com I linhas e I colunas, contendo I² parcelas. Cada tratamento ocorre uma vez em
cada linha e em cada coluna. Um dos possíveis arranjos para um ensaio com quatro
tratamentos (A, B, C e D) é:
FIGURA 8 A estatística apropriada para testar a hipótese de que não existe efeito de
tratamentos é:
Fc = QMTratamentos / QMErro
que tem distribuição F( I -1) ; ( I -1) ( I -2) sob H0.
Desde que “Linhas” e “Colunas” representam restrições à casualização, o teste
F pode não ser apropriado para estes critérios de classificação.
A. Coleta dos dados.
Linhas e Colunas são termos gerais para referenciar critérios de classificação
B. Crítica dos dados.
e, assim, podem representar uma “espécie” de tratamentos. Se existir interação
C. Tratamento dos dados.
(dependência) entre os critérios de classificação e os tratamentos, a estatística Fc
D. Apresentação dos dados.
não tem distribuição de F e o teste não é válido.
E. Análise e Interpretação dos dados.
O delineamento quadrado latino é utilizado em experimentos industriais,
F. Conclusão.
zootécnicos, agronômicos e ensaios de diversas outras áreas. No caso de ensaios na
área agronômica, o DQL é implantado para controlar as diferenças de fertilidade
a) Coleta dos dados
em dois sentidos, por exemplo. Em geral, é satisfatório tomar um quadrado latino
O primeiro passo em uma pesquisa científica ou levantamento estatístico é o
qualquer, permutar as linhas e colunas e designar, ao acaso, os tratamentos às
planejamento, no qual define-se o problema que será o centro da pesquisa. Após a
letras.
definição do problema, é realizada a coleta dos dados, ou seja, é dado o início à
A observação da parcela na coluna j e na linha k, que recebe o tratamento i, é
coleta das informações numéricas necessárias à descrição do problema. A coleta
definida como:
dos dados pode ser de forma direta ou indireta.
yijk = μ + ti + cj + lk + ejk(i)
A coleta é designada direta quando os dados são coletados pelo próprio
Em que:
pesquisador por meio de inquéritos ou questionários, ou seja, quando leva em
 μ = é a constante comum a todas as parcelas.
consideração informações que são de registro obrigatório. Considera-se exemplo a
 ti = é o efeito do tratamento i. coleta de dados como nascimentos, casamentos e óbitos. A coleta direta de dados
 cj = é o efeito da coluna j. pode ser classificada relativamente ao fator tempo em:
 lk = é o efeito da linha k.  Contínua - A coleta de dados direta contínua é aquela feita continuamente.
 ejk(i) = representa o erro aleatório na parcela i, j, k. Exemplos: coleta de dados de nascimento, óbitos e a de frequência dos alunos
às aulas.
Sendo i, j, k, = 1, 2, ..., I.  Periódica - A coleta direta periódica é aquela realizada em intervalos
Este modelo estatístico leva ao modelo de análise, apresentado na Tabela 4. constantes de tempo.
Exemplos: Censos e avaliações mensais dos alunos.
 Ocasional - A coleta direta ocasional é aquela feita extemporaneamente. Tem  Tabelas
como finalidade atender a alguma necessidade de urgência. Uma forma bastante utilizada na apresentação de dados estatísticos é a
Exemplos: casos de epidemias. utilização de tabelas. A tabela é uma estrutura não discursiva de apresentar
informações, na qual o valor numérico é considerado como informação central. O
Já a coleta é dita indireta quando realizada levando em consideração objetivo da apresentação de dados na forma de tabelas é discriminar os dados de
informações conhecidas, obtidas pela coleta direta e/ou do conhecimento de outros modo ordenado, de maneira simples e que seja de fácil interpretação, fornecendo o
fenômenos relacionados com o fenômeno estudado. Um exemplo é a pesquisa máximo de informação em um mínimo de espaço.
sobre a mortalidade infantil, que é realizada por meio das informações obtidas por Para se construir uma tabela é necessário levar em consideração uma série de
uma coleta direta. normas técnicas. Estas normas técnicas podem ser encontradas na publicação do
IBGE “Normas de Apresentação Tabular” que tem como objetivo orientar a
b) Crítica dos dados apresentação racional e uniforme dos dados estatísticos.
Após a coleta dos dados, estes devem ser criteriosamente criticados com a Essas normas são de grande utilidade para garantir a clareza dos dados. A
finalidade de buscar possíveis falhas ou imperfeições que venham a acarretar em seguir algumas das principais normas e recomendações.
erros que possam de alguma forma interferir na confiabilidade dos resultados - Elementos da tabela
futuros. A crítica dos dados pode ser classificada em externa e interna. Uma tabela estatística é composta de elementos essenciais e elementos
A crítica dos dados é chamada de externa quando tem a finalidade de complementares.
descobrir as causas dos erros por parte do informante, como por exemplo, distração Os elementos essenciais são:
e má interpretação das perguntas que foram feitas. Já a crítica interna visa à  Título: É a indicação que precede a tabela contendo a designação do fato
observação dos elementos dos dados originais de coleta. observado, o local e a época em que foi estudado.
 Corpo: É o conjunto de linhas e colunas onde estão inseridos os dados.
c) Tratamento dos dados  Cabeçalho: É a parte superior da tabela que indica o conteúdo das
Após a análise crítica dos dados, a próxima etapa a ser realizada em um colunas.
levantamento estatístico é o tratamento dos dados. O tratamento dos dados está  Coluna indicadora: É a parte da tabela que indica o conteúdo das linhas.
relacionado com o processamento dos dados obtidos e a disposição desses dados Os elementos complementares são:
de acordo com critérios de classificação. O tratamento das informações pode ser  Fonte: A fonte representa a entidade que fornece os dados ou elabora a
realizado de forma manual ou eletrônica. tabela.
 Notas: Informações de natureza geral, destinadas a esclarecer o conteúdo
d) Apresentação dos dados das tabelas.
Uma etapa de grande importância em um levantamento estatístico é a  Chamadas: As chamadas são as informações específicas destinadas a
apresentação dos dados. esclarecer ou conceituar dados numa parte da tabela. As chamadas deverão
Com os dados em mãos, o pesquisador necessita divulgar estes dados a todos, estar indicadas no corpo da tabela, em números arábicos entre parênteses,
bem como as estatísticas calculadas, para que seu estudo possa ser compreendido e à esquerda nas casas e à direita na coluna indicadora. Os elementos
utilizado como referência em pesquisas futuras relacionadas ao mesmo tema. A complementares devem situar-se no rodapé da tabela, na mesma ordem em
apresentação dos dados de uma pesquisa deve ser feita de maneira compreensível e que foram descritos.
simples pata todos.
Geralmente, a apresentação dos dados estatísticos é feita por meio de tabelas - Número da tabela
ou gráficos. Essa forma de apresentação permite um fácil entendimento, Sempre que houver mais de uma tabela em um documento, deve-se identificá-
dependendo da dificuldade do problema em questão. la com seu respectivo número, seguindo sempre a sequência no documento. A
finalidade da identificação com o número é facilitar a sua localização no corpo do
texto.
A identificação da tabela deve ser feita em números arábicos, de modo
crescente, precedidos da palavra Tabela, podendo ou não ser subordinada a
capítulos ou seções de um documento.
Exemplos: Tabela 5; Tabela 5.4.
Em estudos são utilizados diversos tipos de tabelas, dentre eles, os mais
usados são as chamadas tabelas de frequências. As tabelas de frequências são
 Gráficos: A apresentação de dados por meio de gráficos é uma das formas
classificadas de acordo com a classificação da variável, em simples ou por faixa de
mais eficientes, já que os gráficos representam uma imagem construída a partir
valores.
de uma tabela, sendo mais indicados em situações que têm o objetivo de
 Tabelas de frequências simples: As tabelas de frequências simples são
proporcionar uma visão mais rápida e simples a respeito das variáveis das
adequadas para resumir observações de uma variável qualitativa ou
quais se referem os dados.
quantitativa discreta, desde que esta apresente um conjunto pequeno de
Diferentemente das tabelas que fornecem informações mais precisas e
diferentes valores. Um exemplo de tabela de frequência simples pode ser
possibilitam uma análise mais rigorosa dos dados. A elaboração de gráficos é
observado na Tabela 5.
dependente da habilidade individual, porém, algumas normas técnicas existem
TABELA 5 - FREQUÊNCIAS DE ESTADO CIVIL EM UMA AMOSTRA DE 385
INDIVÍDUOS para padronizar e facilitar a sua construção. Portanto, para a elaboração de um
gráfico que transmita com confiabilidade os dados obtidos, é necessário levar
em consideração algumas regras gerais existentes. Algumas dessas regras são
descritas a seguir.

Normas para a representação gráfica:


 Os gráficos, geralmente, são construídos num sistema de eixos
chamado sistema cartesiano ortogonal. A variável independente
localiza-se no eixo horizontal (abscissas), enquanto a variável
 Tabelas de frequências em faixas de valores: Quando é necessário agrupar dependente é localizada no eixo vertical (ordenadas). No eixo vertical,
dados de uma variável quantitativa contínua ou até mesmo uma variável o início da escala deverá ser sempre zero, ponto de encontro dos eixos.
discreta com muitos valores diferentes, a tabela de frequências simples não é  Iguais intervalos para as medidas deverão corresponder a iguais
indicada. intervalos para as escalas.
Nessas situações é indicada a utilização de tabelas de frequências em faixas de  O gráfico deverá possuir título, fonte, notas e legenda, ou seja, toda a
valores ou intervalos de classe. informação necessária a sua compreensão, sem auxílio do texto.
A utilização deste tipo de tabela deve ser criteriosa, pois não é mais possível  O gráfico deverá possuir formato aproximadamente quadrado para
reproduzir a lista de dados a partir da organização tabular, ou seja, há perda de evitar que problemas de escala interfiram na sua correta interpretação.
informação na organização da tabela. Um exemplo de tabela de frequência em
faixas de valores pode ser observado na Tabela 6 (a seguir). Existem vários tipos de gráficos que podem ser utilizados com o objetivo de
TABELA 6 - TABELA DE FREQUÊNCIAS PARA A VARIÁVEL HORAS SEMANAIS descrever um conjunto de dados resumidamente. E a escolha da melhor
DE ATIVIDADE FÍSICA demonstração gráfica dependerá do objetivo do estudo. As principais formas
gráficas são:
- Estereogramas
Os estereogramas são representações gráficas em que as grandezas são
representadas por volumes. Geralmente são construídos num sistema de eixos
bidimensional, mas podem ser construídos num sistema tridimensional para
ilustrar a relação entre três variáveis.
- Cartogramas
Os cartogramas são representações gráficas em cartas geográficas, ou seja, em
forma de mapas.  Gráfico de barras: O gráfico de barras é constituído de retângulos de
Exemplo Esterogramas: Exemplo Cartogramas: mesma largura, dispostos horizontalmente e com alturas proporcionais às
grandezas avaliadas.
É usado quando as inscrições dos retângulos forem maiores que a base dos
mesmos.
GRÁFICO 5 - CASOS NOTIFICADOS DE AIDS NOS CINCO ESTADOS DO BRASIL
DE MAIOR INCIDÊNCIA EM 1992

- Pictogramas ou gráficos pictóricos


Os pictogramas ou gráficos pictóricos são representações gráficas tipicamente
ilustrativas. GRÁFICO 6 - ELEITORES INSCRITOS PARA AS ELEIÇÕES BRASILEIRAS –
São elaborados com a finalidade de criar um apelo visual, dirigidos a um 1978/1990
público muito grande e heterogêneo.
Esse tipo de representação gráfica não deve ser utilizado em situações em que
a precisão é exigida

 Gráfico de colunas: O gráfico de colunas é constituído de retângulos de


mesma largura, dispostos verticalmente e com alturas proporcionais às
grandezas avaliadas. A distância entre os retângulos deve ser, no mínimo,  Gráfico de linhas ou curvas: No gráfico de linhas ou curvas os pontos
igual a 1/2 e, no máximo, 2/3 da largura da base dos mesmos. são dispostos no plano de acordo com as suas coordenadas e,
posteriormente, esses pontos são ligados por segmentos de reta.
GRÁFICO 4 - EFETIVO DO REBANHO SUÍNO NO BRASIL, SEGUNDO AS
Esse tipo de gráfico é bastante utilizado em séries históricas, séries mistas
GRANDES REGIÕES EM 2002
quando um dos fatores de variação é o tempo, como ferramenta de
comparação.
 Gráfico em setores: O gráfico em setores é uma figura ilustrativa, A última etapa de um levantamento estatístico é a obtenção das conclusões do
utilizado em situações em que se deseja evidenciar o quanto cada estudo realizado. Por meio dessas conclusões, o trabalho realizado torna-se
informação representa do total. passível de utilização por outros pesquisadores em pesquisas futuras, contribuindo
A figura é representada por um círculo em que o total (100%) é de forma grandiosa para o andamento da ciência.
considerado 360°, subdividido em tantas partes quanto for necessário a
representação. 2.4 ASPECTOS ESTATÍSTICOS DOS ESTUDOS ETIOLÓGICOS
Essa divisão se faz por meio de uma regra de três simples. Com o auxílio
de um transferidor efetua-se a marcação dos ângulos correspondentes a ESTUDO DE CASO-CONTROLE
cada divisão. Um estudo caso-controle (Figura 9 – a seguir) é uma ferramenta que permite
GRÁFICO 7 - HOSPITALIZAÇÕES PAGAS PELO SUS, SEGUNDO A NATUREZA verificar a diferença entre indivíduos que apresentam determinada doença dos
DO PRESTADOR DE SERVIÇOS (1993) indivíduos que não possuem a doença.
Os indivíduos que apresentam a doença são chamados de casos, enquanto os
indivíduos que não possuem os controles.
O objetivo geral de um estudo caso-controle é observar o comportamento dos
indivíduos frente a um determinado fator de risco.

O indivíduo livre da doença sob investigação não é uma condição absoluta,


podendo ocorrer variações que levam os pesquisadores, em determinadas
circunstâncias, a definir dentro do grupo controle, subgrupo ou subgrupos da
doença sob avaliação.
Esse fato tem a finalidade de especificar melhor as associações etiológicas.
e) Análise e Interpretação dos dados
Inicialmente define-se a doença a ser estudada e a população é definida a partir
Com os dados em mãos, a próxima etapa de um levantamento estatístico é a
dessa informação.
análise e interpretação dos dados. Essa etapa é de grande importância e leva em
Os casos representam todos os indícios da doença durante um determinado
consideração estudos feitos anteriormente que sirvam de base comparativa com as
período de tempo preestabelecido.
novas informações obtidas, o que aumenta a confiabilidade dos dados estatísticos
Já os controles devem ser representados por pessoas comparáveis aos casos,
novos.
porém sem a doença em questão, ou seja, pessoas que se desenvolvessem a doença,
A metodologia mais eficiente de análise e interpretação dos dados dependerá
seriam representadas como caso.
da natureza dos dados em questão. A análise dos dados é realizada por meio de
Tem-se então, um conjunto de pessoas com as características desejáveis para
técnicas estatísticas para sintetizar as informações contidas nos dados, de modo a
dar início ao estudo em questão.
facilitar a interpretação das informações obtidas.
Com a população definida, inicia-se o processo de levantamento de dados das
Uma representação gráfica comumente encontrada em jornais e revistas que inclui
pessoas selecionadas, ou seja, é realizado um estudo da história clínica de todos os
figuras de modo a torná-las mais atraentes é denominada: Gráfico pictórico ou
pacientes selecionados. De posse dessas informações, o objetivo é verificar o nível
pictograma.
do fator de risco entre os casos e entre os controles.
Caso a evidência seja suficiente, ou seja, caso haja diferença significativa
f) Conclusão
entre os casos e controles, o pesquisador concluirá que há uma associação entre o
fator de risco e a doença. A etapa de definição de um caso é o ponto chave em um A classificação dos estudos caso-controle é ampla, e é feita de acordo com a
estudo caso-controle. informação que se deseja obter, podendo ser epidemiológicos observacionais,
Devem-se levar em consideração duas questões importantes: os critérios longitudinais, retrospectivos e analíticos. Um estudo caso-controle, quanto ao
diagnósticos objetivos e os critérios de elegibilidade para a realização da seleção objetivo do estudo, pode ser classificado em exploratório e confirmatório.
dos indivíduos com a doença. Para que haja sucesso no estudo caso-controle e ele Um estudo caso-controle é classificado como exploratório quando os fatores
possa representar com confiabilidade a realidade existente, o tipo de caso deve ser de risco não são completamente conhecidos, ou seja, eles geram informações para
definido de forma adequada. futuros estudos. Já a classificação de um estudo caso-controle em confirmatório
Essa definição adequada de casos tem como objetivo assegurar que todos os acontece quando há uma hipótese já preestabelecida e são estudos direcionados.
casos verdadeiros tenham chances iguais de serem alocados no grupo, além de Os casos utilizados em estudos caso-controle podem ser de três tipos:
garantir que nenhum caso falso seja escolhido, o que acarretaria em uma distorção - Casos incidentes.
da estimativa da medida de associação na direção da hipótese nula. - Casos prevalentes.
O estudo caso-controle é uma estratégia de pesquisa eficiente e simples, o que - Falecidos.
permite sua utilização em diversos estudos. Como por exemplo, já foi verificada a Em um estudo caso-controle, a escolha de casos é uma etapa bastante
associação de vários fatores de risco com vários tipos de câncer. importante e responsável pelo sucesso do estudo em questão. A escolha de casos
A implementação de um estudo caso-controle não conta com empecilhos incidentes é mais indicada, devido a várias vantagens como:
éticos, o que facilita o trabalho dos pesquisadores em suas generalizações. Por
utilizar dados já preexistentes, um estudo caso-controle apresenta custos  Redução do desvio de seleção
relativamente baixos, além de se gastar pouco tempo na sua execução. Exemplo: Doença que apresenta níveis distintos de gravidade. Assim, pode
ocorrer de alguns indivíduos (casos) falecerem mais precocemente e neste caso,
FIGURA 9 - DEMONSTRAÇÃO DE UM CASO-CONTROLE durante o processo de seleção dos indivíduos que apresentam essa doença, serem
selecionados apenas os casos mais leves ou de gravidade moderada para
constituírem os casos do estudo, comprometendo o seu resultado. Esses indivíduos
sobreviventes e selecionados são os chamados prevalentes
Daí a importância em se escolher casos incidentes em vez de prevalentes, pois
assim, todos os indivíduos diagnosticados com a doença, terão a mesma chance de
serem selecionados. Com isso, evitam-se resultados distorcidos devido aos desvios
de seleção.
Outra questão quando se realiza um estudo caso-controle de base hospitalar é
o desvio de seleção com base no tempo de hospitalização. Nesses casos, deve-se
estabelecer um determinado intervalo de tempo que sirva de referência na escolha
dos pacientes, para que a amostragem seja representativa.
O estudo caso-controle apresenta ampla utilização, porém são mais utilizados Os casos e os controles são selecionados com base na admissão de pacientes
em casos em que se tem certeza do comportamento das pessoas do grupo, ou seja, neste período determinado (seleção de casos incidentes) e não com base em
as pessoas que constituem o grupo são comprovadamente doentes. Já como registros de pacientes internados em um determinado momento (casos
limitação, apresenta grande suscetibilidade aos vícios de informação e de seleção prevalentes).
dos indivíduos. Caso não fosse preestabelecido um intervalo de tempo, os pacientes que
apresentassem uma permanência mais longa no hospital teriam maiores chances de
 Classificação dos estudos caso – controle
serem escolhidos e casos de curta permanência ou morte súbita seriam desprezados Porém, a seleção de casos prevalentes possui uma vantagem, que é a
no estudo. disponibilidade em termos quantitativos, utilizados quando há limitações de tempo
É necessário ater-se também à escolha dos indivíduos, a não ocorrência de e de recursos no uso de casos incidentes. Porém os casos prevalentes devem ser
outras doenças juntamente com a doença de interesse, o que pode acarretar em uma selecionados o mais próximo possível do início do estudo.
maior duração do tempo de hospitalização. Escolhem-se casos prevalentes em estudos relacionados com algumas doenças
Essa diferença no tempo de hospitalização contribui para a ocorrência do crônicas, como a hipertensão arterial, devido à grande dificuldade em se identificar
desvio ou falácia de Berkson, um fenômeno estatístico em que essas diferenças nas a época do aparecimento da doença. Dessa forma, a avaliação deve ser feita de
taxas de hospitalização criam uma distribuição da exposição entre os casos forma cuidadosa com a finalidade de verificar se há algum fator associado à
hospitalizados que difere da observada para os demais casos. prevalência da doença que aumente o seu tempo de duração. As diferentes formas
de diagnósticos utilizadas também influenciam no processo.
 Redução do desvio de aferição Os casos selecionados devem apresentar homogeneidade, já que a utilização
Outra vantagem metodológica é a questão da redução do desvio devido à de grupos heterogêneos pode favorecer o não reconhecimento de associações que
aferição, especialmente o desvio de recordação. Indivíduos com diagnósticos possivelmente existam. Porém, ao longo do tempo, o estudo caso-controle pode
recentes apresentam uma capacidade maior de lembrar com maior clareza de sofrer alterações já que alguns pacientes podem se mudar, outros falecerem e
eventos relacionados com suas exposições aos fatores de risco quando comparados tantos outros se recusarem a participar do estudo.
àqueles com diagnósticos realizados há mais tempo. Dessa forma, o pesquisador deve informar quantos casos estavam enquadrados
Porém, deve-se considerar nessa etapa, a latência de determinadas doenças e a inicialmente no estudo e quantos foram excluídos, especificando sempre que
indução de alguns fatores de risco em função dos longos períodos de exposição. possível as razões das perdas de casos. Em um estudo caso-controle, os indivíduos
Ainda com relação ao desvio de aferição, prontuários de pacientes recentes que constituirão os casos podem ser reconhecidos e selecionados de duas formas:
são mais informativos quando comparados aos antigos, estando, assim, mais A partir da população hospitalar, podendo ser selecionados pacientes de um ou
disponíveis ao pesquisador. mais hospitais.
Outra questão que também influencia é a modificação dos critérios o A partir da população geral.
diagnósticos ao longo do tempo devido ao avanço da medicina. o Definição e Seleção dos Controles
Diante do exposto, é esperado que os casos incidentes sejam mais
uniformemente reconhecidos do que os diagnosticados em períodos distintos como "A seleção e definição do grupo controle é o principal desafio do estudo caso-
ocorre com os casos prevalentes. controle. Deve-se dar atenção redobrada a essa etapa para que haja a garantia da
confiabilidade do estudo.”
 Os efeitos da doença serão menos confundidos com as suas causas
Ao realizar um estudo caso-controle é necessário que a investigação seja "O grupo controle é caracterizado por pessoas que não apresentam a doença
criteriosa para que a caracterização dos casos seja confiável. Com relação a um em questão, porém não necessariamente essas pessoas tenham que ser sadias, ou
caso prevalente por longo período, o estilo de vida e o ambiente do indivíduo seja, podem ter outras doenças, mas essas não podem ter associação com a doença
podem sofrer alterações ao longo desse tempo, o que pode ocasionar em em estudo. Após a definição dos grupos de casos e controles, os indivíduos que
caracterizações falsas. constituem esses grupos deverão ser classificados em expostos e não expostos
Portanto, deve-se tomar cuidado durante o período de investigação para que ao(s) fator(es) sob investigação."
não ocorra erro por parte do pesquisador. Como pode ser observado, há maior
preferência por casos incidentes por apresentarem inúmeras vantagens quando "Dessa forma, pode-se inferir que o grupo controle não significa, em nenhuma
comparados aos casos prevalentes. hipótese, não exposição. O objetivo primordial com relação ao grupo controle é
assegurar que seus indivíduos sejam comparáveis aos casos. É observável que a
escolha dos controles depende dos casos. Os controles devem representar a
população de indivíduos que teriam sido identificados e incluídos como casos, se Vantagens dos estudos caso-controle:
eles tivessem desenvolvido a doença sob investigação.”  Custo baixo.
 Tempo curto.
"Resumindo, os controles devem ser originados da mesma população que deu  É possível a avaliação de diferentes fatores que podem estar atuando
origem aos casos. Para reduzir o desvio ao máximo no estudo, os pesquisadores na etiologia da doença.
buscam controles os mais similares possíveis aos casos, caso isso não implique na  São atrativos.
perda da essência da pesquisa de associações normais. O grupo controle não deve  São eficientes.
ter indivíduos com doenças cuja associação com o fator sob investigação já é  Apresentam capacidade de gerarem informação.
conhecida.”  Podem ser utilizados em estudos envolvendo doenças raras.
 São de fácil realização levando em consideração toda a cautela em
A seleção de caso-controle de base hospitalar é mais simples que a de base todas as etapas do processo.
populacional. Nesta última, a seleção de indivíduos para o grupo controle é mais Desvantagens dos estudos caso-controle
trabalhosa, pois raramente é possível a obtenção das informações necessárias ao  Suscetibilidade aos desvios de seleção.
estudo. Portanto, deve-se sempre ter noção dos possíveis desvios de seleção que  Suscetibilidade aos desvios de aferição.
podem ocorrer.  A doença e a exposição já ocorreram quando os participantes são
selecionados para o estudo, quando se trata de estudos com caráter
- Quantos grupos controle? Quantos Indivíduos no grupo? retrospectivo.
Após a definição e a determinação de onde realizar a seleção dos controles é Aplicações dos estudos caso-controle
importante dar início ao processo de definição da proporção de controles para cada  Em pesquisas etiológicas.
caso, bem como o número de grupos que serão utilizados para comparação no  Em questões do cotidiano da Saúde Pública e da Medicina.
estudo.  Na avaliação de medidas preventivas em geral.
Quanto maior, a proporção de controles para cada caso, maior será o poder do  No rastreamento de doenças.
estudo. Porém, de acordo com estudos anteriores, o ganho ocorre até a proporção  Na eficácia de vacinas.
de 4:1, além disso, não se justifica em termos de custo/benefício. Normalmente,  Na avaliação de serviços de saúde.
utiliza-se apenas um grupo controle nos estudos caso-controle.  No campo da Epidemiologia Molecular.

Seleção dos indivíduos controles 2.4.2 ESTUDOS DE COORTE


A seleção dos indivíduos que constituirão o grupo controle pode ser feita por Caracteriza-se como estudo de coorte o tipo de pesquisa que tem como
meio de diversas técnicas. A técnica mais utilizada nesses casos é o pareamento. O objetivo a comparação entre indivíduos expostos e não expostos a determinada
pareamento é uma ferramenta que visa o controle do efeito de variáveis que podem doença, ou seja, tem a finalidade de verificar se indivíduos que foram expostos a
atuar como confundidoras. um fator de risco desenvolveram a doença, independente do nível, quando
A utilização dessa ferramenta é indicada quando existem variáveis que comparados aos indivíduos não expostos ao fator de risco (grupo controle).
seguramente são fatores de risco para a doença. Desse modo, os controles são Neste tipo de estudo, os dois grupos são acompanhados por um grande
selecionados individualmente aos pares, trios ou quartetos. Portanto, para cada período de tempo e as taxas de incidência da doença são, posteriormente,
caso, um ou mais controles são relacionados. calculadas. Conclui-se com esse tipo de estudo se há ou não associação entre o
Quanto maior o número de variáveis a serem pareadas, maior a dificuldade em fator de risco e a doença. Portanto, taxas de incidência significativamente
encontrar controles adequados. diferentes entre os dois grupos indicam a presença de associação.
Em um estudo de coorte é necessário um acompanhamento constante por parte  A perda de participantes ao longo do processo pode prejudicar a validade dos
dos pesquisadores, tanto na identificação da presença ou não do fator de risco, resultados.
quanto na verificação da ocorrência da doença nos exames rotineiros, para que não  Necessita de amostras relativamente grandes.
haja perda de informação durante o processo de estudo, chamado de seguimento do  Longo tempo de estudos.
estudo. Esse acompanhamento é importante, pois caso haja alguma alteração ao  Pouco reprodutíveis.
longo do tempo, o pesquisador tem a oportunidade de realizar os ajustes  Pouco apropriados em casos de doenças com longos períodos de latência.
necessários aos dados.  Possibilidade de mudança no estado de exposição (exposto vira não exposto,
Exemplo: Fumo e Câncer do Pulmão não exposto vira exposto).
Uma pesquisa foi realizada com 60.000 indivíduos médicos. Por meio de um
 Menos adequados para o estudo de múltiplas causas de um evento específico
questionário, foi perguntado a esses indivíduos se eles já haviam fumado ou não.
(multicausalidade).
Caso a resposta fosse afirmativa, o questionário pedia informações adicionais
 Existência de possíveis desvios de confusão (causam confundimento).
sobre o que fumavam e quanto. As respostas possibilitaram aos pesquisadores
 Não disponibiliza resultados em curto prazo.
classificar cada respondente como fumante ou não fumante.
A definição de não fumante usada foi “Um não fumante é uma pessoa que  Os indivíduos sob estudo vivem livremente e não sob o controle do
fumou até no máximo um cigarro diário, em média, por período inferior a um pesquisador.
ano”.
Por meio de minucioso sistema de acompanhamento, observaram-se, nos 2.4.3 ENSAIOS CLÍNICOS ALEATORIZADOS
primeiros 10 anos de acompanhamento, 136 mortes associadas ao câncer pulmonar Um ensaio clínico é dito aleatorizado quando utiliza um processo aleatório
entre os médicos incluídos no estudo. para alocar os participantes nos diferentes grupos de tratamentos. É um
Destas, apenas três eram de não fumantes. Para equalizar os períodos de experimento médico para verificar a eficiência de tratamentos quando é incerto o
acompanhamento nos vários grupos, trabalhou-se com a taxa de incidência por valor de uma determinada terapia médica ou há disputa de méritos em terapias já
1000 pessoas-ano de exposição. existentes.
O risco de morte por câncer pulmonar das pessoas que fumam mais de 25 São dois grupos sendo testados. As pessoas são alocadas aleatoriamente em
cigarros diários é quase 32 vezes maior do que o risco para quem não fuma. um dos grupos. De um lado, encontra-se o grupo que recebe a terapêutica padrão,
também chamado de grupo controle. De outro, encontra-se o grupo que recebe a
- Vantagens dos estudos de coorte terapêutica que será testada no estudo, previamente definida.
Para que o estudo seja eficiente e proporcione resultados confiáveis, os dois
 É a única forma de se estudar a taxa de incidência (e risco) diretamente.
grupos devem receber exatamente os mesmos cuidados. Feita a pesquisa, técnicas
 Pode avaliar a relação da exposição com várias doenças.
estatísticas são usadas para obter a conclusão final, se há ou não há diferença na
 Os desvios de seleção e de informação podem ser mais facilmente
eficácia das terapias envolvidas.
minimizados.
Nos ensaios aleatorizados, o pesquisador interfere de maneira constante no
 Pode estudar mais de um desfecho para uma exposição. processo experimental, ou seja, no curso natural dos acontecimentos, por não estar
 A exposição precede o desfecho (ausência de ambiguidade temporal). restrito apenas à coleta de dados e informações. O pesquisador, portanto, altera a
 Pode estabelecer relação causa-efeito. dinâmica do processo diretamente pela questão da autossugestão, ou seja, o
- Desvantagens dos estudos de coorte pesquisador pode influir na evolução da doença.
 Oneroso, devido ao longo período de seguimento. É o chamado efeito placebo, que traz desvios consideráveis ao estudo clínico.
 Difíceis de operacionalizar. Esse efeito pode ser eliminado em ambos os grupos. Basta, sempre que possível,
 Ineficientes para doenças raras e com longo período de indução. realizar experimentos cegos, em que o paciente ou o médico desconhecem o
tratamento ou também podem ser realizados experimentos duplo-cegos, em que  Menores chances dos investigadores sistematicamente de descontinuar
ambas as partes desconhecem o tratamento. Porém, nem sempre isso é factível, o participantes.
que pode levar ao insucesso do estudo em questão.  Menores chances dos investigadores de encorajar ou desencorajar os
participantes a abandonarem os ensaios.
Cada indivíduo responde ao tratamento de maneira particular, devido às suas - Desvantagens dos ensaios clínicos aleatorizados
características pessoais.  Duração muito longa dos ensaios.
Portanto, para que as diferenças na eficácia das terapias sejam detectadas, é  Estudos onerosos.
fundamental que os grupos envolvidos no estudo sejam comparáveis.  Pouco eficazes para doenças raras.
Para se atingir essa comparabilidade completa e segura é necessário que os  Questões éticas envolvidas.
indivíduos sejam alocados nos grupos de forma aleatória.
 A existência de “drop-out” (indivíduos que abandonam os estudos).
Existem várias técnicas de aleatorização que são utilizadas nesses estudos.
 A existência de “cross-over” (indivíduos que deixam a intervenção que lhes foi
A importância da utilização da aleatorização dos indivíduos nos grupos está no
atribuída e passam a ser tratados com outra intervenção)
fato de que esses serão semelhantes em todos os aspectos, com exceção ao
tratamento recebido.
2.4.4 ESTUDOS DESCRITIVOS
Para isso, há a necessidade de os grupos serem grandes, ou seja, de
Um estudo descritivo é apenas a descrição de um fato médico, da área da
grande tamanho amostral. Outro ponto importante é a capacidade da
saúde. Portanto, não há um grupo controle que sirva como base de comparação. Os
aleatorização em eliminar desvios de seleção.
estudos descritivos podem ser de vários tipos, alguns são descritos a seguir.
Porém, quando há um número pequeno de pacientes, devem ser
Estudo de Caso
usadas técnicas para melhorar a sensibilidade do experimento; as técnicas
Exemplo: Associação entre rubéola e catarata congênita
de estratificação e de ajuste.
Em estudo realizado na Austrália, o oftalmologista Gregg, observou o
Na técnica de estratificação, os pacientes são divididos em subgrupos
nascimento de várias crianças apresentando catarata congênita. Gregg, intrigado
de acordo com as variáveis que sabidamente afetam a resposta ao
com as características pouco comuns dos casos, decidiu iniciar uma pesquisa para
tratamento e são alocados aleatoriamente nos subgrupos.
buscar uma possível explicação para o acontecido.
Já as técnicas de ajuste (estatísticas multivariadas), fornecem métodos
Foi descoberto que todas as mães haviam sido acometidas pela rubéola em
de comparação entre os grupos.
uma grande epidemia que tinha atingido a Austrália no ano anterior, exatamente
durante o primeiro trimestre das gestações. Suas observações propiciaram
- Vantagens dos ensaios clínicos aleatorizados
condições para que várias outras pesquisas fossem realizadas posteriormente,
 Menores chances de “respostas psicológicas” à intervenção pelos participantes
concluindo haver grande associação entre a ocorrência de rubéola no primeiro
dos ensaios.
trimestre da gestação e defeitos congênitos.
 Maiores chances dos participantes de cumprirem o regime de tratamento. Essa constatação permitiu a introdução do procedimento da vacinação em
 Menores chances de os participantes abandonarem os estudos. mulheres em idade fértil.
 Menores chances de os participantes buscarem tratamentos adicionais.
 Menores chances de os investigadores transferirem suas crenças ou posturas Estudo de uma série de casos
aos participantes. O estudo de uma série de casos acontece quando há o relato de mais de um
 Menores chances de os investigadores administrarem cointervenções. caso, sendo esses descritos pelos pesquisadores de forma minuciosa e criteriosa.
 Menores chances dos investigadores de “ajustarem” as dosagens. Esses estudos não fornecem informações confiáveis para comparação entre
tratamentos, nem podem ser a base para opiniões sobre etiologia. Isto porque não  Baixo custo.
são estudos comparativos.  Rápida duração.
- Vantagens dos estudos descritivos  Boa fonte de hipóteses.
 De fácil execução.  Não há necessidade de seguimento de pessoas.
 Curta duração.  Simples de ser feito.
 Baixo custo.  Alto potencial descritivo.
 Fácil de repetir. - Desvantagens dos estudos seccionais ou transversais
 Permite o acompanhamento de doenças raras.  A dificuldade de separar a causa do efeito.
 Permite a análise de vários fatores.  Vulnerabilidade a desvios.
- Desvantagens dos estudos descritivos  A maior dificuldade de identificação de doenças de curta duração se
 Dificuldade para formar um grupo controle aceitável. comparadas àquelas de longa duração.
 No caso de enfermidades raras, não se pode escolher os indivíduos  Desconhecimento da ação dos fatores no passado.
aleatoriamente, escolhe-se os que estão doentes.  Impossibilidade de estabelecer uma prova causal.
 Qualidade dos registros do serviço.  Baixo poder analítico.
 Não determina a incidência (risco absoluto).
2.4.5 SECCIONAIS OU TRANSVERSAIS  Exige amostra de grande tamanho quando se trata de condições de baixa
Um estudo seccional ou transversal (Figura 10 – a seguir) é um estudo prevalência.
semelhante ao estudo de coorte, porém a coleta de informações é feita em um
único momento, não existindo, portanto, período de acompanhamento dos Os instrumentos de medida de exposição nos estudos seccionais podem ser, entre
indivíduos (período de seguimento). outros, registros, preenchimento de questionários, exames físico e clínico, testes de
A primeira etapa de um estudo seccional ou transversal é a definição da laboratório.
questão a ser respondida por parte do pesquisador. Após definida, decide-se a
população e a escolha da melhor metodologia para a obtenção da amostra.
FIGURA 10 - DESCRIÇÃO DE UM ESTUDO SECCIONAL

- Vantagens dos estudos seccionais ou transversais


3.2 TESTES DIAGNÓSTICOS
Dá-se o nome de teste diagnóstico à ferramenta utilizada para a verificação
da ocorrência ou não ocorrência de determinada doença. Há diversos tipos de
testes, muitos são específicos para determinadas doenças.
Não há um teste que apresente perfeição na sua execução, ou seja, um teste
que determine com certeza e exatidão a presença da doença. No diagnóstico da
maioria das doenças, há a necessidade da utilização de mais de um teste para a
comprovação, ou seja, para a confiabilidade dos resultados.
De acordo com cada teste diagnóstico há um padrão específico de
referência, a partir do qual se determina o resultado positivo e negativo. Antes de
ser implantado, é necessário que o teste diagnóstico seja verificado quanto a sua
capacidade de acerto. Esse teste feito para verificação da capacidade de acerto é
realizado aplicando-o em dois grupos: o grupo doente e o sadio.

3.2.1 SENSIBILIDADE E ESPECIFICIDADE


A qualidade de um teste diagnóstico é estabelecida de acordo com a
distribuição quanto à ocorrência de um evento, ou seja, de uma doença (Figura 11).
FIGURA 11 - DISTRIBUIÇÃO QUANTO À OCORRÊNCIA DE UM EVENTO

Um teste diagnóstico deve passar por uma avaliação de qualidade para ser
considerado um bom teste. A avaliação de qualidade leva em consideração duas
probabilidades condicionais que recebem nomes especiais devido a suas grandes
3 TESTES EM BIOESTATÍSTICA importâncias: a sensibilidade e a especificidade.
3.1 INTRODUÇÃO
A análise diagnóstica caracteriza-se como um diagnóstico a análise
criteriosa e minuciosa que visa investigar todas as características e informações de
determinada pessoa. É indispensável na área médica.
Por meio dessa prática é possível implantar medidas de caráter preventivo
e curativo para as doenças, representando uma esperança para muitas pessoas.
Portanto, a importância do diagnóstico consiste no humano direito de salvar vidas.  Sensibilidade (S)= A sensibilidade é a probabilidade de um teste dar positivo
na presença da doença, isto é, a sensibilidade avalia a capacidade do teste em
Os diagnósticos são realizados por meio de diversos testes, os chamados testes detectar a doença quando ela está presente.
diagnósticos. Há grande importância na realização de um teste diagnóstico, pois é
por meio deste que é possível a busca pela cura de doenças.
 Especificidade (E)= A especificidade é a probabilidade de um teste dar
negativo na ausência da doença, isto é, a especificidade avalia a capacidade do "De acordo com os resultados obtidos no teste é possível inferir que o teste
teste em afastar a doença quando ela está ausente. ergométrico apresenta uma sensibilidade de 79,7% e uma especificidade de 74%.
De posse desses resultados, a escolha entre um teste sensível (que apresenta a
Um teste de diagnóstico com alta sensibilidade é aquele que, normalmente, medida de sensibilidade superior a de especificidade) e um teste específico (que
apresenta resultado positivo na presença da doença. Testes com altas sensibilidades apresenta a medida de especificidade superior a de sensibilidade) depende,
que apresentam ampla utilização em diversos tipos de situações. Algumas exclusivamente, do objetivo do estudo em questão.”
situações são descritas a seguir:
 Quando há uma penalização considerável para a omissão do diagnóstico. "Essa escolha é feita pelo pesquisador, que deve estar atento às características
 Em Programas de Rastreio. intrínsecas e extrínsecas do estudo, para que o resultado do estudo possa ter alta
 Deve ser usado no início da avaliação de um doente quando há muitas confiabilidade. Os índices de sensibilidade e especificidade são bons sintetizadores
possibilidades de diagnóstico. das qualidades de um teste diagnóstico, pela simplicidade na obtenção e por serem
bem ilustrativos.”
A partir do exposto, pode-se concluir que um teste que apresenta alta
sensibilidade tem mais utilidade quando o resultado for negativo. "Porém, a utilização desses índices não garante auxílio à equipe médica na tomada
de decisões. Diante disso, há a necessidade do conhecimento de outros índices para
Um teste com alta especificidade é aquele que apresenta, geralmente, auxiliar esses profissionais que são: o VPP (valor de predição positiva) e o VPN
resultado negativo quando na ausência da doença. Testes com altas especificidades (valor de predição negativa).”
apresentam ampla utilização. Algumas situações em que esses tipos de testes
apresentam grande utilidade: "Esses índices apresentam um papel importante na área médica e suas mensurações
 Quando se pretende confirmar um diagnóstico que é sugerido por testes auxiliam grandes estudos, permitindo resultados cada vez mais confiáveis e exatos.
menos específicos. Por meio desses valores, é possível à equipe médica, uma melhor atuação na
 Quando a existência de um resultado falso positivo tem importantes questão do diagnóstico de doenças e na tomada de decisões para tratamento de
implicações físicas, emocionais ou financeiras para o doente. doenças e elaboração de laudos médicos mais sólidos e robustos."

Diante do exposto, um teste com alta especificidade apresenta maior utilidade 3.2.2 VALOR DAS PREDIÇÕES: VPP E VPN
quando o resultado for positivo. Os valores das predições podem ser obtidos com grande facilidade pelos
Segue abaixo um exemplo da obtenção das estimativas de sensibilidade e pesquisadores. São necessárias algumas probabilidades, que estão discriminadas na
especificidade: figura 12.
FIGURA 12 - PROBABILIDADES PARA OBTENÇÃO DOS VALORES DE VPP E VPN
TABELA 7 - RESULTADOS DA AVALIAÇÃO DO TESTE ERGOMÉTRICO DE TOLERÂNCIA
A EXERCÍCIOS
A partir dos resultados acima obtidos, é possível observar que o valor da
predição negativa (VPN) foi bem superior ao valor de predição positiva (VPP).
Esse fato permite inferir que, caso o teste ergométrico de determinada
pessoa der resultado negativo, a chance dessa pessoa não ter a doença é de 99,34%,
considerando o valor de prevalência de 2%.
Com o resultado do teste sendo negativo, a chance de determinada pessoa
ter a doença que era de 2%, agora passa a ser 0,66% (1- 0,9934).
- Valor de predição positiva (VPP)= O valor de predição positiva (VPP)
representa a proporção de verdadeiros positivos entre todos os indivíduos com 3.2.3 DECISÕES INCORRETAS: PFP E PFN
teste positivo. Portanto, o valor de predição positiva (VPP) expressa a Em qualquer teste diagnóstico podem ocorrer as chamadas decisões
probabilidade de um paciente com o teste positivo ter a doença. incorretas, que são representadas pela probabilidade de falso positivo (PFP) e a
- Valor da predição negativa (VPN)= O valor da predição negativa (VPN) probabilidade de falso negativo (PFN). Essas decisões incorretas podem ocorrer
representa a proporção de verdadeiros negativos entre todos os indivíduos com em qualquer situação na qual está envolvida a pesquisa e o pesquisador deve estar
teste negativo. Portanto, o valor de predição negativo (VPN) expressa a sempre atento a sua ocorrência para que seus estudos apresentem alta
probabilidade de um paciente com o teste negativo não ter a doença. confiabilidade.
Exemplo: Teste ELISA para detecção de HIV
De acordo com o exposto, é possível verificar que para a obtenção dos Um exemplo bem difundido da ocorrência de decisões incorretas é na
valores de VPP e VPN, é necessário ter em mãos o valor de p. utilização do teste ELISA (Enzymelinked immunosorbent assay) para detecção do
Esse valor representa a estimativa da prevalência da doença em vírus HIV, o causador da AIDS. O teste ELISA apresenta em torno de 99,8% de
determinada população, chamada de população de interesse. especificidade e 95% de sensibilidade. Os dados do exemplo estão dispostos na
Portanto, a estimativa de prevalência é uma probabilidade de resultados Tabela 8.
corretos de diagnósticos. TABELA 8 - VALORES PARA DETECÇÃO DO HIV PELO TESTE ELISA
Voltando ao exemplo do teste diagnóstico ergométrico, é possível calcular
os valores das estimativas de VPP e VPN.
Para isso, deve-se utilizar um valor de prevalência da doença coronariana
na população-alvo (população de interesse), que neste caso é de 2%.

Segue abaixo especificada a forma de obtenção dessas duas estimativas:

A AIDS é uma doença de abrangência mundial, porém é considerada uma


doença de baixa prevalência. Como pode ser observado com os dados da tabela 8,
a maioria dos pacientes que apresentaram resultado positivo para a doença,
consistem na verdade de falsos-positivos. Isso pode ser inferido pela baixa
magnitude do valor de predição positiva (VPP).
Pode-se inferir também com base no valor alto da predição negativa
(VPN), que pouquíssimos não doentes deixarão de ser detectados. Portanto, a
utilização do teste ELISA em larga escala ocasionaria a ocorrência de falsos TABELA 9 - RESULTADO DO TESTE EM PARALELO DEPENDENDO DA CLASSIFICAÇÃO
positivos, o que levaria a uma queda na confiabilidade do diagnóstico. DOS TESTES INDIVIDUAIS A E B

Nestas situações, a ocorrência de um resultado positivo deve ser


confirmado com a execução de outro teste, posteriormente, para que a
confiabilidade do resultado seja máxima.
Quando são associados dois ou mais testes para se obter um diagnóstico, é
necessário ter o conhecimento de como são mensurados os índices de qualidade
dos testes múltiplos. No presente estudo restringiremos ao caso de apenas dois
testes associados, porém, as informações e ideias poderão ser estendidas para a Combinação em série
associação de mais de dois testes. Na combinação em série, os testes são aplicados consecutivamente. O
segundo teste só é realizado se o primeiro teste apresentar resultado positivo. Na
Formas de combinação de testes tabela 10 estão discriminados os possíveis resultados para a combinação em série
Existem diversas formas de associação de testes a partir dos resultados de considerando os resultados dos testes individuais.
dois testes. As formas mais simples e mais utilizadas em se formar um teste Pelo exposto, o teste só será considerado positivo se houver positividade
múltiplo são os testes em paralelo e os testes em série. comprovada em ambos os testes individuais. A combinação em série é utilizada em
Para fins de simplificação, no presente estudo, os testes originais serão situações em que não é necessário o rápido atendimento, podendo o paciente ser
chamados de A e B, o teste em paralelo será chamado de TP e o teste em série de assistido ao longo do tempo e em casos em que o custo é importante, seja pela
TS. Utilizando essas linguagens de eventos temos: situação orçamentária, ou pelo risco/desconforto que o exame possa causar.
Diante do exposto, pode-se verificar que é menor o custo de um teste em
combinação de testes em série, já que o segundo teste só é aplicado caso o primeiro
teste seja positivo. Considerando a independência dos testes individuais (testes A e
B), a sensibilidade de um teste em combinação de testes em série (SS) e a
especificidade (ES) podem ser calculadas por:
TABELA 10 - RESULTADO DO TESTE EM SÉRIE DEPENDENDO DA CLASSIFICAÇÃO DOS
TESTES INDIVIDUAIS A E B
Como é possível observar, as estimativas de sensibilidade e especificidade
do teste em paralelo (TP) e do teste em série (TS) são calculadas com o auxílio das
regras de probabilidade de eventos.

Combinação em paralelo
Em uma associação em paralelo, o resultado do teste será considerado Ss = SA x SB
positivo, se pelo menos um dos testes da associação apresentar resultado positivo. Es = EA + EB - EA x EB
Os possíveis resultados para a associação estão discriminados na Tabela 9 (a
seguir). Como pode ser observado, para que possamos obter as estimativas da
especificidade e da sensibilidade tanto da associação em série como da associação
A combinação em paralelo é utilizada em situações de caráter de urgência, em que em paralelo, é necessária a independência dos testes individuais.
é necessária uma abordagem rápida. Por exemplo, para pacientes oriundos de Porém, não é possível garantirmos que isso sempre irá ocorrer. Quando
lugares distantes. não houver tal independência, não há uma forma analítica simples para se obter
tais índices para um teste composto. Essas estimativas fogem do objetivo proposto
neste trabalho. Exemplo: Sensibilidade e especificidade de testes em paralelo e em série
Considerando uma prevalência de 1%, dois testes A e B, apresentam os valores de
Exemplo: Diagnóstico de câncer pancreático S, E, VPP e VPN descritos na tabela 12.
Considera-se um paciente idoso, que apresenta dores persistentes nas costas e no
abdome e, além disso, acentuada perda de peso. Diante desse quadro clínico, na TABELA 12 - SENSIBILIDADE, ESPECIFICIDADE E VALORES DE PREDIÇÃO DE TESTES
INDIVIDUAIS A E B E DOS TESTES EM SÉRIE E EM PARALELO CONSIDERANDO-SE
ausência de uma explicação para esses sintomas, a possibilidade de câncer no UMA PREVALÊNCIA DE 1%
pâncreas é frequentemente levantada. Para verificação desta possibilidade são
solicitados os testes de ultrassom (A) e tomografia computadorizada (B) do
pâncreas.
A tabela 11 apresenta dados hipotéticos sobre os índices de sensibilidade e
especificidade dos testes, quando utilizados separadamente e em conjunto.

TABELA 11 - SENSIBILIDADE E ESPECIFICIDADE DOS TESTES DE ULTRASSOM E


De acordo com os dados da tabela, a combinação em série apresentou alta
TOMOGRAFIA COMPUTADORIZADA NO DIAGNÓSTICO DO CÂNCER DE PÂNCREAS
INDIVIDUALMENTE E EM CONJUNTO especificidade (0,995) e sensibilidade relativamente baixa quando comparada com
os testes individuais.
Já a combinação em paralelo, apresentou alta sensibilidade (0,99), porém
sua especificidade foi menor que a dos testes isolados.
Como é de se esperar em situações semelhantes, os valores de predição
negativa (VPN) foram altos para ambos os testes, não havendo diferenciação entre
combinação em paralelo e combinação em série.
Como pode ser observado, os esquemas C e D correspondem, Já os valores de predição positiva (VPP) não foram altos, sendo que a
respectivamente, ao teste em paralelo e ao teste em série. Considerando a combinação em série apresentou melhor resultado (VPP=0,6056).
independência dos testes individuais, podem-se obter as estimativas da
sensibilidade e da especificidade combinadas: Diante do exposto, é importante salientar que nem sempre os testes
utilizados são independentes. Portanto, os valores acima tendem a superestimar o
Em paralelo verdadeiro valor dos índices dos testes combinados.
SC = 0,8 + 0,9 – 0,8 x 0,9 = 0,98 Dessa forma, não é possível determinar os valores das estimativas de
EC = 0,6 x 0,9 = 0 54 qualidade levando em consideração apenas os valores de cada teste individual.
Em série Assim, torna-se necessário um trabalho de pesquisa em que o pesquisador
SD = 0,8 x 0,9 = 0,72 realiza em um grupo de pacientes, o teste padrão (gold test) e o teste combinado,
ED = 0,6 + 0,9 – 0,6 x 0,9 = 0,96 buscando aumentar a confiabilidade do estudo em questão.
Como já mencionado anteriormente, a escolha do melhor teste depende do
Quando um ou outro teste é positivo, a sensibilidade combinada é maior objetivo do estudo e deve ser devidamente preestabelecido pelo pesquisador.
que o mais sensível dos testes, mas a especificidade é menor. Ao contrário, quando
o critério para a positividade do teste é que tanto o ultrassom como a tomografia 3.2.5 ESCOLHA ENTRE TESTES DIAGNÓSTICOS
sejam positivos, a especificidade combinada é maior que o mais específico dos Um teste dito com características ótimas é um teste que apresenta altos
dois, mas a sensibilidade é menor. Portanto, a sugestão seria o teste em série. índices de sensibilidade e especificidade. Porém, na prática, nem sempre existem
testes disponíveis que apresentem tais características ótimas. Normalmente,
ocorrem situações em que há mais de um teste que apresente características ótimas Considerando duas situações extremas, a hipótese de p ser igual a zero
e torna-se necessário a comparação entre eles para que o pesquisador possa fazer a (p=0) em uma determinada população, ou seja, ninguém apresenta a doença em
escolha mais adequada. questão; ou p ser igual a 1 (p=1), toda a população de interesse apresenta a doença
Nesses processos de escolha, por exemplo, a escolha do ponto de corte em questão. De acordo com os dados da tabela 14, pode-se verificar que é possível
(ponto limite para decidir se um paciente é doente ou sadio), é sugerido por muitos chegar aos valores apresentados para quaisquer valores de S e E.
pesquisadores realizar a soma da sensibilidade e especificidade, ou seja, o valor de TABELA 14 - VALORES DE PREDIÇÃO (VPP E VPN) E PROPORÇÃO DE RESULTADOS
referência é obtido por meio de valores de S e E que apresentem maior soma. FALSOS (PFP E PFN) PARA CASOS EXTREMOS DE PREVALÊNCIAS

Considerando uma situação em que haja dois testes diagnósticos


disponíveis: um dos testes apresenta alta sensibilidade e baixa especificidade e o
outro teste alta especificidade e baixa sensibilidade. Diante dessa situação, qual
teste seria melhor? Qual teste um pesquisador consciente escolheria? Para que um
Na tabela 15 são apresentados valores de predição para prevalências de 1% e 90%.
pesquisador possa realizar essa escolha de forma acertada, é necessário que haja TABELA 15 - VALORES DE PREDIÇÃO (VPP E VPN) PARA ALGUNS VALORES DE
uma avaliação, levando em consideração vários fatores. SENSIBILIDADE E ESPECIFICIDADE PARA PREVALÊNCIAS DE 1% A 90%
Serão apresentados alguns argumentos baseados nas medidas de qualidade
que podem auxiliar um pesquisador na escolha do melhor teste diagnóstico. O
primeiro argumento está relacionado com os valores de predição (VPP e VPN) que
dependem conjuntamente dos valores das estimativas de S, E e p. Em muitos
estudos fica evidente o efeito da prevalência nos valores de predição.

Exemplo: Diagnóstico da gonorreia


Um teste foi desenvolvido para a realização do diagnóstico de gonorreia. Este teste
chama-se Gonostion Dri-Drot e apresenta sensibilidade de 0,80 e especificidade de
0,95. Na tabela 13 (a seguir), estão discriminados os valores de predição positiva
(VPP) e predição negativa (VPN) para quatro populações com diferentes
estimativas de prevalências. De acordo com esses resultados, podem-se inferir, devido a algumas
TABELA 13 - VALORES DE PREDIÇÃO (VPP E VPN) DO TESTE GONOSTICON DRI-DROT evidências, as seguintes conclusões:
PARA QUATRO PREVALÊNCIAS (P)
 Um teste que apresenta alta estimativa de especificidade deve ser utilizado
quando a estimativa da prevalência da doença for relativamente baixa
(doença rara), mesmo havendo baixa sensibilidade.
 Um teste que apresenta alta estimativa de sensibilidade deve ser utilizado
quando a estimativa da prevalência da doença for alta (doença comum),
mesmo havendo baixa especificidade.
De acordo com os dados fornecidos pela tabela 13 (vista anteriormente), A escolha do melhor teste diagnóstico vai depender do objetivo do estudo em
mesmo o teste apresentando estimativas de qualidade consideradas razoáveis, em questão. Levando em consideração uma doença rara, ou seja, doença de baixa
populações com baixa estimativa de prevalência, o valor de predição positiva prevalência, deve ser escolhido um teste diagnóstico que apresente alta
(VPP) é baixo, o que acarreta na inutilidade do teste nessas condições
sensibilidade. Já para doenças comuns, que apresentam alta prevalência, deve ser De acordo com a figura 13 (vista anteriormente), pode-se observar que
escolhido um teste diagnóstico que apresente alta especificidade. quanto maior a estimativa da prevalência da doença, maior o valor preditivo
positivo (VPP).
Outro tipo de simulação é apresentado nas figuras 13 e 14 para algumas situações Considerando testes com altas estimativas de sensibilidade e especificidade
específicas. (S=99% e E=99%) o valor de predição positiva (VPP) seria muito elevado em
FIGURA 13 - VALOR PREDITIVO POSITIVO (VPP) EM FUNÇÃO DA PREVALÊNCIA situações de prevalência não muito alta.
Neste caso, se a situação sofre um impacto importante ao se diminuir
apenas um pouco a sensibilidade e a especificidade do teste (S=95% e E=95%).
Pode-se também alterar apenas uma das características do teste. No caso de alterar
a estimativa da sensibilidade, diminuindo-a e mantendo a especificidade elevada
(S=70% e E=90%), observa-se que praticamente não houve impacto nos valores
das estimativas de VPP em função da prevalência.
Porém, quando esta diminuição ocorre na especificidade, esse impacto é
alto, diminuindo-se muito o valor de VPP, mesmo para prevalências mais
elevadas. Dessa forma, pode-se afirmar que o valor preditivo positivo de um teste é
função da prevalência da doença, da sensibilidade e fundamentalmente da
especificidade.
Na figura 14 (vista anteriormente), pode-se observar que, ao reduzir apenas
a sensibilidade (s=70% e e=90%), ocorre uma drástica redução no VPN,
mostrando o grande impacto que essa medida exerce no VPN. Ao se reduzir
apenas a especificidade (s=99% e e=70%), o impacto no VPN é muito pequeno,
FIGURA 14 - VALOR PREDITIVO NEGATIVO (VPN) EM FUNÇÃO DA PREVALÊNCIA menor do que quando se reduz apenas um pouco a sensibilidade e a especificidade
conjuntamente (s=95% e, e=95%).

É possível verificar também que para um mesmo teste diagnóstico


(exceção apenas para s=70% e, e=99%), o impacto do aumento da prevalência na
redução do VPN é muito pequeno. Esse impacto se acentua nas prevalências muito
elevadas.

Como na prática clínica, as doenças estudadas comumente possuem prevalências


relativamente baixas, o VPN irá sofrer apenas pequena variação ao se modificar a
especificidade de um teste diagnóstico e mesmo ao se modificar pouco a
sensibilidade.

3.2.6 RELAÇÃO ENTRE SENSIBILIDADE E ESPECIFICIDADE


De acordo com o que foi visto até o momento, um teste diagnóstico é
considerado como ideal, se a sua especificidade e sensibilidade fossem 100%, ou
seja, se não ocorressem erros em seu resultado.
Porém, sabemos que na prática, essa situação ideal não ocorre. Pelo
contrário, sempre há um contrabalanço, chamado de trade-off, entre essas duas "Portanto, foi proposta a utilização de curvas de características de operação do
estimativas. Quando uma delas diminui a outra aumenta e vice-versa. receptor (Curvas ROC — Receiver Operating Characteristic).
Portanto, levando em consideração um teste diagnóstico expresso em A curva ROC representa uma poderosa forma de mensurar e evidenciar problemas
escala contínua, para sua execução é necessária a determinação de um ponto de no comportamento desempenhado pelo teste diagnóstico na área médica,
corte (cut-off) entre os valores de normalidade e anormalidade. Nessas condições, permitindo assim, o estudo detalhado da variação que ocorre entre as estimativas
uma determinada estimativa do teste somente poderá ser aumentada se a outra de sensibilidade e especificidade levando em consideração diferentes valores de
estimativa sofrer uma diminuição e vice-versa. corte.”
Frequentemente, na prática clínica, escolhe-se um ponto de corte em que
exista o menor erro possível, tanto de falsos positivos quanto de falsos negativos "Durante a Segunda Guerra Mundial, houve a necessidade de quantificar a
(Figura 15). habilidade dos operadores de radares em distinguir sinais de ruídos. Essa
FIGURA 15 - PONTO DE CORTE COM O MÍNIMO ERRO POSSÍVEL habilidade foi chamada de Receiver Operating Characteristic (ROC) e era
observada em uma curva.”

"A partir daí, as curvas ROC foram utilizadas em diversas áreas do conhecimento,
auxiliando os profissionais a analisarem melhor a relação entre as estimativas de
sensibilidade e especificidade.
As curvas ROC, hoje, representam uma ferramenta importantíssima para a área
médica, auxiliando na classificação de indivíduos em doentes e não doentes de
acordo com as características das populações de interesse.”

A curva ROC é uma representação gráfica da sensibilidade (ou também


3.2.7 CURVA ROC
chamada de taxa de verdadeiros positivos) versus a taxa de falsos positivos. Um
Pesquisadores da área médica estão sempre em busca de formas
exemplo dessa representação gráfica pode ser observado no gráfico 8.
simplificadas com o objetivo de descrever a capacidade de uma determinada
variável contínua ordinal em classificar materiais ou indivíduos em grupos bem GRÁFICO 8 - CURVA DE CARACTERÍSTICAS DE OPERAÇÃO DO RECEPTOR (CURVA
definidos. ROC)
Um exemplo que pode ser usado para exemplificar essa situação é o
desempenho de um teste diagnóstico em classificar indivíduos em portadores ou
não de determinada doença.

"Em razão de muitos exames médicos apresentarem valores mensurados em


escalas numéricas, as estimativas de sensibilidade e especificidade dependem
claramente do local em que se insere o ponto de corte (cut-off) entre os resultados
positivos e negativos.
Diante do exposto, torna-se necessária uma maneira mais eficiente de demonstrar
essa relação de antagonicidade entre a estimativa de sensibilidade e
especificidade.”
De acordo com a representação gráfica, podemos interpretar a curva da FIGURA 17 - CURVA ROC PARA OS ÍNDICES DOPPLER DA ARTÉRIA UMBILICAL. OS
seguinte forma: a linha diagonal pontilhada representa um teste que é positivo ou PONTOS DE DADOS SÃO VALORES MEDIDOS DOS ÍNDICES. IR: ÍNDICE DE
RESISTÊNCIA; D/A: RELAÇÃO DIASTÓLICA À MÉDIA; IP: ÍNDICE DE PULSATILIDADE
negativo, resultado esse aleatório.
A curva ROC tem a capacidade de evidenciar os valores para os quais há
maior otimização da sensibilidade em relação à especificidade, que corresponde ao
ponto em que se encontra mais próxima do canto superior esquerdo do diagrama,
uma vez que o índice de positivos verdadeiro é um e o de falsos positivos é zero.
À medida que um critério para o teste positivo tona-se mais rigoroso, o
ponto da curva correspondente à sensibilidade e à especificidade (ponto A)
movimenta-se para baixo e para a esquerda (sensibilidade menor e especificidade
maior). Se adotar um critério menos evidente, para identificar os positivos, o ponto
da curva (ponto B) movimenta-se para cima e para a direita (sensibilidade maior,
O local de cada ponto na curva ROC representa um determinado
especificidade menor).
comportamento entre a sensibilidade e o falso positivo. Dessa maneira, é possível
ter diferentes correspondências na curva. Como pode ser observado pela
FIGURA 16 - CURVA ROC
visualização da figura 18 há a diferenciação em vários critérios de acordo com a
posição na curva ROC.

O critério que apresenta maior preferência pelos pesquisadores é o critério


estrito e está descrito a seguir:
 Critério estrito = Um critério estrito está relacionado com o paciente
positivo quando a evidência da doença é muito alta. Este tipo de critério
representa uma pequena fração de falsos positivos e uma pequena fração
de verdadeiros positivos – localizados no canto inferior esquerdo da curva
A Curva ROC é utilizada para comparar dois ou mais testes diagnósticos.
ROC. A utilização de critérios que apresentam essa restrição conduz a
Na figura 16 está exemplificada essa comparação.
maiores frações de ambos os tipos (pontos colocados no canto superior da
São comparados os testes A e B. O teste A é considerado o teste com
curva).
melhor acurácia quando comparado com o teste B (teste inválido).
FIGURA 18 - CURVA ROC PARA UMA DADA CAPACIDADE DE DISCRIMINAÇÃO, COM A
Na figura anterior, cada ponto representa uma situação: VARIAÇÃO DO PONTO DE CORTE (CRITÉRIO DE DECISÃO)
 O ponto 1 representa maior valor de sensibilidade e especificidade.
 O ponto 2 representa maior sensibilidade, porém menor especificidade.
 O ponto 3 representa maior especificidade e menor sensibilidade.

Na figura 17 (a seguir), está um exemplo em que foram comparados quatro


índices correspondentes nos traçados de Doppler da artéria umbilical. Esses testes
são aplicados para prever a evolução perinatal desfavorável. De acordo com os
dados observados, pode-se concluir que três índices se apresentaram semelhantes,
porém o índice IP (índice de pulsatilidade) foi muito menos preciso.
(proporcional à área sob a curva), além da possibilidade de comparar testes
diagnósticos.

Exemplo: X e Y são variáveis aleatórias que representam as distribuições dos


valores de um teste diagnóstico com resposta contínua para as populações de,
respectivamente, indivíduos doentes e não doentes, em que X ~ N (µX; σ²X) e Y ~
N (µr; σ²r), então, para um ponto de corte t0, a especificidade é dada por:

É permitida aos pesquisadores a seleção arbitrária dos valores possíveis


para a variável decisão, ou seja, a seleção do ponto de corte. Em que Z tem distribuição normal padrão. A sensibilidade do teste
Acima deste ponto, o paciente é classificado como positivo, ou seja, seu diagnóstico em um ponto de corte t0 é dada por:
teste apresentou resultado positivo e, portanto, tem a doença.
Abaixo desse ponto, o paciente é classificado como negativo, pelo
resultado do seu teste ter apresentado resultado negativo e, portanto, não há a
presença da doença.
A figura 19 ilustra um teste diagnóstico que, produzindo uma resposta
Cada ponto de corte apresenta específicos valores de especificidade e
contínua, segue o modelo X ~ N (10;22), Y ~ N (14,22). A curva ROC teórica é
sensibilidade e esses pontos são então dispostos no gráfico.
simétrica em relação à diagonal que atravessa as coordenadas (0;1) e (1;0) do
A curva ROC permite ao pesquisador selecionar o melhor limiar de corte
gráfico, devido ao fato de considerarmos distribuições normais de médias
para que, por meio deste, possa ser obtido o melhor desempenho possível.
diferentes e variâncias iguais. Assumindo um modelo estatístico em que X e Y
apresentam distribuição normal, em um ponto de corte t0 a curva ROC teórica é
A curva ROC assim construída é chamada de curva ROC empírica, ou
dada por:
seja, a curva em que todos os possíveis pontos de corte que a amostra permite
estabelecer, ou seja, serão considerados n+m pontos de corte relativos a cada
medida de amostra.
E aquela determinada por um número de pontos de corte (menor que m+n)
de curva ROC aproximada. Há também um terceiro tipo de curva ROC, a chamada
curva ROC teórica.
Se, na prática, interessa ao clínico construir regras de decisão baseadas
Conhecido o modelo estatístico que determina a distribuição da variável
apenas em um conjunto limitado de possíveis resultados do teste diagnóstico (não
aleatória referente ao resultado do teste diagnóstico nas populações de indivíduos
necessariamente observados na amostra), a curva ROC aproximada (painel inferior
doentes e não doentes, pode-se basear nesta informação para se estabelecer a
esquerdo da Figura 19, onde n=100 e m=200) é a mais adequada.
curva.
Entretanto, inferências estatísticas (como comparações de curvas, por
exemplo) podem exigir o uso da curva ROC empírica (painel inferior direito da
Para a determinação de duas ou mais curvas ROC são significativamente
figura 19), já que ela estima com maior precisão a curva ROC teórica
diferentes, a avaliação é feita por meio da determinação da área sob a curva,
(desconhecida, na prática).
usando uma modificação do teste da soma de ordens de Wilcoxon para esta
comparação. Assim, é possível quantificar a exatidão de um teste diagnóstico
Alguns autores, ao apresentarem a curva ROC, mostram no mesmo gráfico
a diagonal representada pelos pontos onde SE = 1- ES, para mostrar a “distância”
entre a curva ROC empírica e a região que representa pontos de corte associados a
regras de classificação sem utilidade prática.

A curva ROC não sofre mudanças se as observações amostrais forem submetidas a


transformações monótonas, como logaritmo, raiz quadrada ou funções lineares
com coeficientes positivos.

Vantagens do uso da curva ROC


 É uma representação direta da habilidade da variável em classificar
sujeitos em grupos.
 Oferece aos seus usuários um conjunto de diferentes regras de
classificação, segundo os pontos de corte empíricos que compõem a curva.
 A possibilidade de visualizar em um único gráfico o desempenho de várias
maneiras de classificar indivíduos, segundo diferentes pontos de corte.
Desvantagens do uso da curva ROC
 Há uma chance do ponto de corte ótimo (desconhecido) não ser observado
na amostra, principalmente quando utilizadas amostras relativamente
pequenas, o que pode representar um obstáculo para a sua estimativa.
FIGURA 19
No Painel Superior Esquerdo, O Modelo Estatístico X ~ N (10;22), Y ~ N
(14,22). O Painel Superior Direito Mostra A Curva Roc Teórica, Para Este Modelo
Estatístico. Os Painéis Inferiores Esquerdo E Direito Mostram, Respectivamente,
Curvas Roc Aproximada E Empírica, Baseadas Em Amostras Tamanho N=200 E
M=100, Simuladas Segundo Este Modelo Estatístico.

Um teste que discrimina perfeitamente indivíduos doentes e não doentes


teria, para algum ponto de corte, uma SE e uma ES de 100%, o qual seria
representado no canto superior esquerdo da curva ROC. Já um teste totalmente
incapaz de discriminar indivíduos doentes e não doentes produziria uma curva
ROC representada por pontos que estariam contidos em uma reta que partiria da 4 APLICAÇÕES DA BIOESTATÍSTICA
origem do gráfico até o canto superior direito.
Para qualquer t0 pertencente ao espaço amostral de T, SE seria igual a 1 - A crescente utilização da Estatística como ferramenta na análise de
ES, ou seja, o teste sob investigação teria a mesma proporção de resultados fenômenos biológicos foi apoiada pelo crescimento da atividade científica em
positivos tanto para doentes como para não doentes. Este fato justifica o uso de 1 - todos os campos do conhecimento e pela revolução tecnológica, devido,
ES, e não simplesmente ES no eixo das abscissas. principalmente, ao uso de computadores modernos. A alta tecnologia foi, então,
decisiva e fez com que a Estatística se tornasse mais acessível aos pesquisadores A busca pela longevidade sempre foi um objetivo presente na vida de
dos diferentes campos de atuação. qualquer ser humano.
Atualmente, os equipamentos e softwares permitem a manipulação de Essa característica buscada com tanto afinco está diretamente relacionada
grande quantidade de dados, o que veio a dinamizar e viabilizar o emprego dos com as boas condições (infraestrutura, alimentação, lazer e, principalmente, saúde)
métodos estatísticos na avaliação de fenômenos. a que os seres humanos estão frequentemente submetidos.
Gráficos e tabelas são apresentados na exposição de resultados das A saúde, portanto, é uma característica intimamente ligada à longevidade.
empresas. Dados numéricos são usados para aprimorar e aumentar a produção. Nos hospitais e sistemas de saúde, em geral, ocorrem complicações infecciosas, o
Censos demográficos auxiliam o governo a entender melhor sua população que intefere neste estado de saúde buscado por todos os indivíduos.
e a organizar seus gastos com saúde, educação, saneamento básico, infraestrutura Essas complicações infecciosas são denominadas de infecções hospitalares
etc. (IHs) e representam um grave problema da saúde mundial, levando ao aumento da
morbidade e mortalidade entre os pacientes, ocasionando na elevação dos custos
Com a velocidade da informação, a Estatística passou a ser uma ferramenta hospitalares.
essencial na produção e disseminação do conhecimento. FIGURA 20 - ESTATÍSTICA NO DIA A DIA DE UMA COMISSÃO DE CONTROLE DE
O grau de importância atribuído à Estatística é tão grande, uma vez que, a INFECÇÕES HOSPITALARES (CCIH)

maioria das hipóteses científicas, independentemente da área, precisa passar por


um estudo estatístico para ser aceita ou rejeitada, como é o caso do teste de novos
medicamentos, dos ajustes de modelos de regressão, sobre a opinião popular de
novos produtos etc.
Na área médica, por exemplo, nenhum medicamento pode ser
disponibilizado para o mercado se não tiver sua eficácia estatisticamente
comprovada.

O grande volume de informações produzidas pelo mundo moderno


(pesquisas por amostragem, censos, internet, mercado financeiro) precisa ser
analisado adequadamente.
Essas análises utilizam as mais variadas técnicas estatísticas. A rigor, onde
houver incerteza esta ciência pode ser empregada. Desse modo, todas as áreas do
conhecimento humano a requerem como instrumento de análise de dados.
Na área da saúde, a aplicação de técnicas estatísticas (bioestatística)
permitiu a identificação de situações críticas e atuação no controle dessas
situações, desempenhando papel crucial no estudo e incidência de doenças.

Alguns exemplos da utilização da estatística nas áreas médicas e biológicas


(Bioestátistica) serão descritos a seguir.
Em 1983, foi publicada pelo Ministério da Saúde, a portaria 196. Esta
4.1 O USO DA ESTATÍSTICA NO CONTROLE DAS INFECÇÕES
portaria estabeleceu a obrigatoriedade para todos os hospitais do país em manterem
HOSPITALARES
suas Comissões de Controle de Infecções Hospitalares (CCIH), que apresentam
como objetivo principal reduzirem ao máximo uma possível incidência de Os métodos e conceitos estatísticos foram utilizados na metodologia do
infeccções hospitalares. presente estudo. A metodologia foi baseada em banco de dados desenvolvidos
Essas comissões apresentam diversas atividades relacionadas com a pelas seguintes instituições brasileiras:
estatística que podem ser observadas na figura 20.  Faculdade de Saúde Pública da Universidade de São Paulo (FSPUSP).
 Agência Nacional de Vigilância Sanitária (ANVISA).
Como pode ser observado, a implantação de comissões de controle de  Instituto Brasileiro de Geografia e Estatística (IBGE).
infeccções hospitalares (CCIH) é de grande importância para a garantia da saúde  Cadastro Nacional de Estabeleciementos de Saúde (CNES).
do ser humano. Porém, muitos estudos têm levado a acreditar que o sistema de
saúde brasileiro não tem conseguido incorporar as ações de prevenção e controle As informações utilizadas neste estudo foram oriundas de questionários
das infecções hospitalares de forma homogênea. aplicados por gestores da área da saúde, no âmbito municipal, estadual e federal.
Essa dificuldade na incorporação de medidas preventidas está relacionada Esses questionários sobre os hospitais abrangeram características do serviço,
com o fato de adaptação, já que todos os estudos implantados no Brasil estão complexidade da atenção prestada (usa a existência de leitos de terapia intensiva –
baseados nos modelos estrangeiros, principalmente nos modelos norte-americanos UTIs – como marcador); formação, composição e estrutura da CCIH; ações de
e ingleses. Diante do exposto, torna-se necessário um diagnóstico da situação do prevenção e controle gerais e específicas desenvolvidas; além das dificuldades
controle de infecção hospitalar no país. envolvidas na implementação das ações de prevenção e controle de IHs.
Esse conhecimento é fundamental para a evolução das ações de prevenção Foram utilizados no estudo informações de 4.148 instituições hospitalares,
e para o desenvolvimento de estratégias diversificadas, para atender a diversidade correspondendo a 70% dos hospitais brasileiros. Os dados foram analisados e
socioeconômica e cultural do país, em um contexto de recursos limitados para a apresentados com auxílio dos programas: Stata, Epi-Info e Excel.
saúde. De acordo com os resultados do estudo, a incorporação de ações de prevenção
Descreveremos um estudo relacionado com o controle de infecções e controle de infecções hospitalares ocorreu de forma heterogênea entre os
hopitalares realizado no programa de pesquisas hospitalares: Diagnóstico do hospitais estudados, sendo as ações mais presentes a nomeação de CCIHs (76%
controle da infecção hospitalar no Brasil. dos hospitais) e o monitoramento das IHs (77%).
Ações mais complexas foram menos presentes nas respostas, como por
Neste estudo, os objetivos foram: exemplo, desenvolvimento de programas de controle de infecções (49%),
 Conhecer a organização de estados e municípios em relação ao tema treinamentos específicos em controle de infecções (44%) e adoção de medidas de
prevenção e controle das infecções hospitalares. contenção de surtos (33%).
 Conhecer a organização de estados e municípios em relação ao tema Hospitais com leitos de terapia intensiva apresentaram melhor desempenho em
prevenção e controle das infecções hospitalares. relação à implantação das ações de prevenção, com 94% de adesão à implantação
 Analisar quantitaiva e qualitativamente o uso de ferramentas de orientação de CCIHs, contra 70% de adesão entre os que não tinham leitos de terapia
e direcionamento de ações específicas de prevenção de infecções intensiva.
hospitalares nos hospitais brasileiros. As ações de contenção de surtos foram relatadas por 59% dos hospitais com
 Oferecer subsídios para ampliar a discussão com a sociedade organizada, UTIs, contra 23% apresentadas pelos que não atendiam este tipo de paciente
prestadores e gestores de saúde, desenvolvendo propostas de adequação do (Figura 22 - a seguir).
modelo brasileiro para o controle de Ihs, considerando o contexto do
sistema de saúde no país. FIGURA 21 - DISTRIBUIÇÃO DE HOSPITAIS, DE ACORDO COM A ADOÇÃO DE MEDIDAS
DE PREVENÇÃO E CONTROLEDE INFECÇÕES, CONSIDERANDO A COMPLEXIDADE
(EXISTÊNCIA DE LEITOS DE UTI). ANVISA/FSPUSP (N=4148)
FIGURA 23 - DISTRIBUIÇÃO POR TOPOGRAFIA DAS INFECÇÕES HOSPITALARES EM
PACIENTES INTERNADOS EM UTIS DE ADULTO DE HOSPITAIS BRASILEIROS.
ANVISA/FSPUSP (N=182).

As taxas anuais de infecção relatadas pelos hospitais nos questionários não


são acuradas, devido a não utilização de critérios validados pela maioria das
instituições e por informações incompletas sobre casos detectados e pacientes
expostos (saídas = altas + óbitos + transferências). Em relação a políticas de utilização de antimicrobianos, germicidas e
A taxa global de infecções apresentada foi de 9%, com 14% de materiais médico-hospitalares, 53,5% dos hospitais informaram que adotavam,
mortalidade associada (letalidade) (Figura 22 - a seguir). As principais topografias 40,8% que não adotavam e 5,7% não informaram.
das infecções relatadas foram aparelho respiratório, urinário, sangue e pele (Figura Das instituições participantes, 61% informaram ter disponibilidade de
23 - a seguir). laboratórios para a realização de exames microbiológicos.
Mesmo com este cuidado de seleção dentro da amostra, estas taxas não A ausência de laboratórios de microbiologia foi informada por 36% dos
devem ser utilizadas para comparações ou expectativa de ocorrência de infecções hospitais pesquisados, sendo que 3% não responderam a esta pergunta.
em instituições individuais. O estudo permitiu aos pesquisadores fazerem recomendações visando à
melhoria da situação da saúde hospitalar e consequentemente à saúde humana.
FIGURA 22 - TAXA GLOBAL DE INFECÇÃO HOSPITALAR EM UTI DE ADULTOS NOS Recomendaram a revisão do modelo atual de prevenção de infecções
HOSPITAIS BRASILEIROS (EXCETO SÃO PAULO). ANVISA/FSPUSP (N=636). hospitalares, em parceria com gestores estaduais e municipais de saúde,
prestadores, sociedade organizada e usuários.
Recomendaram também que Estados e municípios devem reforçar a
descentralização dessas ações, priorizando ações básicas de importância
reconhecida na literatura especializada, apoiando os serviços de saúde na aplicação
dessas medidas.
Outro ponto importante bastante discutido foi a necessidade de uma
reestruturação dos laboratórios de microbiologia no país, enfatizando a
padronização de técnicas de identificação de microrganismos e de determinação da  Análise e caracterização quantitativa da situação da saúde das populações
sensibilidade. selecionadas nos estudos por meio de levantamentos relacionados com
dados de saneamento básico, moradia, nutrição, etc.
4.2 O USO DA ESTATÍSTICA NO RAMO DA PSIQUIATRIA  Utilização de modelos estatísticos para o estudo do agente causal e os
fatores ambientais relacionados com a sua transmissão.
Algumas áreas em que psiquiatras usam técnicas estatísticas sofisticadas,  Utilização da inferência estatística nos testes de hipóteses.
mas progressos ainda devem ser feitos, são:  Utilização da teoria da decisão.
 Classificação do doente mental: Pesquisadores têm usado análise fatorial,  Utilização dos modelos de regressão para encontrar a melhor adequação,
análise discriminante, análise de conglomerados, redes neurais, para minimizar os possíveis erros de predição.
visualização de dados multivariados em um esforço para melhorar os
critérios de diagnósticos e para determinar se ela é de particular interesse A análise de regressão estabelece a relação entre as variáveis. É representada pela
ou se é categórica ou dimensional. equação:
 Aumento no uso de regressão logística, modelos log-lineares e equações
estruturais, bem como técnicas multivariadas como: componentes y = α +βX
principais, análise fatorial, análise de correspondência, de correlação Em que:
canônica, de conglomerados, de escalonagem multidimensional etc. y = variável dependente
 Utilização de duas ou três opinoões para o diagnóstico requer métodos X= variável independente
para a mensuração de concordância entre opiniões. α = coeficiente linear da reta
 Análise de sobrevida para determinar o prognóstico de pacientes sob β = coeficiente angular da reta
terapia.
 Problema de riscos competitivos em dados longitudinais. Para obter as estimativas αˆ e βˆ, de α e β, aplicam-se as seguintes fórmulas obtidas
 Cuidados com viés de seleção. da minimização da soma dos quadrados dos erros:
 Maior utilização da Inferência Bayesiana e de técnicas de data mining
(Data mining: dados em busca de uma teoria).
 Conhecimentos sobre o p-valor; nível de significância; intervalos de
confiança.
 Utilização de ensaios clíncos.
 Utilização de testes diagnósticos.
Análise dos riscos;
4.3 A UTILIZAÇÃO DA ESTATÍSTICA NA EPIDEMIOLOGIA  Utilização e interpretação de correlações.
 Análise dos dados epidemiólogicos pela utilização do método estatístico  O coeficiente de correlação é uma medida do grau de dependência entre
indutivo quantitativo, que está diretamente relacionado com a questão da duas variáveis. Esse coeficiente, representado pela letra r, é dado pela
causalidade e evolução. fórmula:
 Estudo estatístico relacionado com a interação entre fatores ambientais e a
doença analisada em questão.
 Folha de verificação.
 As folhas de verificação são ferramentas estatísticas relacionadas com o
controle de qualidade hospitalar. São usadas para:
 - Tornar os dados fáceis de serem obtidos e utilizados.
 - Dispor os dados de uma forma mais organizada.
 - Verificar o tipo de defeito e a sua porcentagem.
 - Verificar a localização do defeito: mostrar o local e a forma de
ocorrência dos defeitos.
 - Verificar as causas dos defeitos.
O valor de r varia de –1 a +1, inclusive. Valores de r iguais a –1 e +1 indicam  - Determinar o turno em que ocorre o problema (turno, dia, hora, mês, ano,
que os pontos estão sobre a reta, isto é, a correlação é perfeita. Valores próximos etc.).
de –1 e +1 indicam correlação forte e valores próximos de zero indicam correlação  - Dar subsídios para a criação de várias ferramentas como: diagrama de
fraca. O sinal de r indica se a correlação é positiva ou negativa. pareto, diagrama de dispersão, histograma, etc.
O valor de r varia de –1 a +1, inclusive. Valores de r iguais a –1 e +1 indicam que
os pontos estão sobre a reta, isto é, a correlação é perfeita. Valores próximos de –1 Estratificação
e +1 indicam correlação forte e valores próximos de zero indicam correlação fraca. Estratificar é agrupar elementos com as mesmas características, ou seja,
O sinal de r indica se a correlação é positiva ou negativa. itens iguais ou muito semelhantes, tendo causas e soluções comuns (Figura 25).
A estratificação é uma ferramenta importante, mas precisa ser usada antes
4.4 UTILIZAÇÃO DA ESTATÍSTICA NA ORGANIZAÇÃO HOSPITALAR da coleta de dados. Ao ser construída a folha de verificação, deve-se ter em mente
a estratificação.
 Utilização do SAME (Serviço de Arquivo Médico e Estatística) (Figura 24).
Tem-se, por exemplo, o interesse em determinar certo tipo de doença de
pacientes que vão a óbito. Logo, é necessário estratificar por óbitos, enfermaria e
especialidade.

FIGURA 24 - ORGANOGRAMA DA SAME


 A estatística é utilizada para coletar, apurar, analisar e interpretar os dados
informativos dos pacientes, para que possa haver a realização da pesquisa
clínica.
FIGURA 25 - ESTRATIFICAÇÃO
 Realização do controle de admissões, transferências, altas, óbitos e cirurgias.
 Realização de estimativas e ajuste de modelos de tempo de vida. 4.5 UTILIZAÇÃO DA ESTATÍSTICA NA INDÚSTRIA FARMACÊUTICA
 Controle estatístico de processo (CEP) Sua utilização pressupõe que o processo seja estatisticamente estável, isto é, não
A utilização de métodos estatísticos não garante a solução de todos os problemas haja presença de causas especiais de variação ou, ainda e de outra forma, que as
de um processo, porém é uma maneira racional, lógica e organizada de determinar sucessivas amostragens representem um conjunto de valores independentes ou não
onde eles existem, sua extensão e a forma de solucioná-los. Esses métodos podem correlacionados.
ajudar na obtenção de sistemas que assegurem uma melhoria contínua da qualidade Este pressuposto quase sempre não é atendido e muitas vezes leva à utilização das
e da produtividade ao mesmo tempo. cartas de controle com limites inadequados e com a frequente ocorrência de
O Controle Estatístico de Processo (CEP) pode ser descrito como um conjunto de alarmes (pontos fora ou próximos aos limites da carta) sem que, necessariamente,
ferramentas de monitoramento da qualidade. Com tais ferramentas, consegue-se representem a presença de uma causa especial.
uma descrição detalhada do comportamento do processo, identificando sua
variabilidade e possibilitando seu controle ao longo do tempo, por meio da coleta  Controle estatístico de processo multivariável: aplicação à proodução de
continuada de dados e da análise e bloqueio de possíveis causas especiais, medicamentos na forma de comprimidos
responsáveis pelas instabilidades do processo em estudo. Em estudo realizado, foram utilizados dados da produção do medicamento
O Controle Estatístico de Processo abrange a coleta, a análise e a interpretação de captopril na forma de comprimidos de 25 mg produzidos pelo Laboratório
dados com a finalidade de resolver um problema particular. A ideia principal do Farmacêutico do Estado de Pernambuco (LAFEPE®), no período de 2004 a 2005,
CEP é melhorar os processos de produção com menos variabilidade, para análise do processo por meio da estatística T2 de Hotelling, uma forma de
proporcionando níveis melhores de qualidade nos resultados da produção. CEP multivariado.
É muito comum nas fábricas que processos industriais não sejam otimizados no Neste tipo de análise, em vez de serem analisadas isoladamente várias cartas de
sentido de serem caracterizados por altos níveis de eficiência, no entanto, dentro do controle, utiliza-se uma única carta que leva em consideração as variabilidades
CEP existem ferramentas para monitorar o processo e, portanto, melhorá-lo. simultâneas das variáveis peso médio, dureza, friabilidade, tempo de
desintegração, teor, teor de dissulfeto de captopril, dissolução e uniformidade de
 Uso de gráficos de controle conteúdo, o que se constitui em uma vantagem para a tomada de decisões dos
Os gráficos de controle representam uma das técnicas estatísticas que servem de operadores do processo.
apoio ao controle da qualidade de um processo, fornecendo evidências de suas
variações tanto de caráter aleatório quanto de caráter determinável.  Validação do processo de envase de xarope de salbutamol
Eles permitem que se possa atuar no processo de forma preventiva, corrigindo Os dados foram obtidos a partir de cinco lotes consecutivos. Primeiramente
possíveis desvios de qualidade, em tempo real, no momento em que eles estão definiu-se o peso médio, totalizando um número de amostragem igual a 30.
ocorrendo, não deixando que a situação de possibilidade de ocorrência de não Calculou-se a média de cada amostra e os valores obtidos foram tratados
conformidade perdure e acabe com uma possível reprovação do lote final. estatisticamente.
É importante destacar que um gráfico de controle não permite a identificação de Foram geradas Cartas de Controle (média e amplitude), histograma e valores
quais são as causas especiais de variação que estão atuando em um processo fora correspondentes aos índices de capacidade do processo. Dos cinco lotes tratados
de controle estatístico, mas ele processa e dispõe informações que podem ser estatisticamente, três apresentaram-se estáveis e dois não estáveis: já em relação à
utilizadas na identificação destas causas. capacidade, todos os lotes mostraram-se incapazes.
Isto demonstra que nem sempre um processo estável é também um processo capaz,
 Utilização de cartas de controle isto é, a estabilidade estatística de um processo não assegura que este seja um
As cartas de controle são as principais ferramentas utilizadas no controle estatístico processo capaz. As figuras 26, 27 e 28 ilustram os gráficos das médias, amplitude e
de processo e têm como objetivo detectar desvios de parâmetros representativos do histograma dos lotes um, dois e cinco, respectivamente.
processo, reduzindo a quantidade de produtos fora de especificações e os custos de Clique na seta abaixo para visualizar as figuras 26, 27 e 28.
produção.
Entre as alternativas para tornar esse processo capaz está a mudança do processo Entretanto, observa-se que este se encontra ligeiramente descentralizado na
para uma tecnologia de maior confiança, o estudo do processo com mais cuidado e especificação. A média calculada é de 95,42% enquanto que a média/alvo é de
a utilização de técnicas de melhoria para reduzir a variabilidade, centrar o processo 100%, referente ao centro da especificação.
para minimizar as perdas totais fora dos limites das especificações e inspecionar Ajuste efetuado na média permitirá alcançar maior índice de capacidade. Em
100% o processo. função destes resultados, todo o processo pode ser considerado validado.

 Determinação do teor da substância ativa em forma farmacêutica sólida oral  Desempenho das máquinas de enchimento por meio da massa, de uma
Foram avaliados três lotes de trinta comprimidos, assumindo a especificação de 85 suspensão parenteral relativamente viscosa, em recipientes de dose múltipla.
a 115% para variação no resultado de uniformidade de conteúdo. Foi verificado que a máquina de enchimento “A” enchia as ampolas dentro dos
Foram empregados gráficos de controle para valores individuais e amplitudes limites pretendidos com as médias dentro dos limites de controle. No entanto, a
móveis e esses revelaram que o processo pode ser considerado previsível quanto ao máquina “B” apresentava grande variação, tal como se observou pela carta de
seu desempenho para a característica avaliada (Figura 29 - a seguir). controle de gamas dos valores de enchimento, bem como por meio dos pontos que
Os pontos mantiveram-se dentro dos limites de controle. Além disso, os pontos caem fora dos limites de controle, indicados nas cartas médias (Figura 30).
não apresentaram comportamento indicando causa especial, ou seja, padrão
extraordinário de variação.
FIGURA 29 - GRÁFICOS DE CONTROLE DO TEOR DE PRINCÍPIO ATIVO DE
COMPRIMIDOS

FIGURA 30 - CARTAS DE CONTROLE PARA A MÉDIA E GAMA


(AMPLITUDE) DAS DUAS MÁQUINAS DE ENCHIMENTO

Após uma grande investigação e melhoria do processo, foi possível estreitar os


limites de controle da carta das médias e deste modo, o processo passou a ter maior
controle estatístico e simultaneamente a variação da massa de enchimento foi
minimizada.

 Reações adversas relacionadas com o uso do contraceptivo oral Qlaira


Foi feito um estudo estatístico pela indústria farmacêutica Bayer Schering Pharma
Em função desse processo pode ser avaliada mediante o cáculo dos índices de relacionada com as reações adversas do contraceptivo oral Qlaira. O estudo foi
capacidade. Considerando a quantidade de dados e Cpk igual a 1,38, o processo realizado com dez mil mulheres.
pode ser considerado capaz. As reações foram divididas da seguinte forma:
 Frequente (≥ 1/100 a < 1/10): dor de cabeça; dor abdominal; acne; suporte estatístico a repetição, por exemplo, o experimento realizado com ervilhas-
ausência de menstruação; desconforto nas mamas; cólicas; sangramento de-cheiro.
irregular; sangramento irregular intenso; aumento de peso corporal.
 Pouco frequente (≥ 1/1000 a < 1/100): infecção por fungo; candidíase  Determinação da taxa de recombinação gênica (distância entre genes)
vaginal; infecção vaginal; aumento de apetite; depressão/humor Por meio da estatística é possível realizar a estimação da taxa de recombinação,
deprimido; diminuição do desejo sexual; distúrbio mental; alterações de usada para estabelecer distâncias entre genes, expressas em percentagem ou cM.
humor; tontura; pressão alta; enxaqueca; diarreia; náuseas; vômitos; queda Mesmo diante do conhecimento de 1 cM corresponder a aproximadamente
de cabelo; coceira; erupção cutânea; aumento do tamanho das mamas; 1.000.000 pares de bases de DNA, sua mensuração ainda é importante, pelo menos
caroço nas mamas; crescimento anormal das células do colo do útero para uma primeira abordagem, na elaboração dos mapas gênicos.
(displasia cervical); sangramento uterino disfuncional; dor durante a
relação sexual; doença fibrocística das mamas; sangramento menstrual  Localização de genes de interesse para a medicina
intenso (menorragia); distúrbio menstrual; cisto ovariano; dor pélvica; Na medicina, a análise de linkage, é explorada para determinar a posição num
síndrome pré-menstrual; tumor benigno; da musculatura do útero cromossoma de um gene responsável por uma doença em relação a um ou mais
(leiomioma uterino); contração do útero (cólica); secreção vaginal; genes de localização conhecida (marcadores). Consideremos o locus de uma
ressecamento vulvovaginal; irritabilidade; inchaço de partes do corpo; doença com os alelos A e a e um segundo locus (marcador) com os alelos B e b.
diminuição de peso corporal. Se pais com o genótipo ab/AB (esta representação significa que num cromossoma
 Raro (≥ 1/10000 a < 1/1000): candidíase; herpes simples; doença vascular situam-se os alelos a e b e no seu homólogo A e B) deram origem a um
do olho; tinea versicolor (tipo de infecção na pele por fungo); infecção do descendente com o genótipo aB/Ab ocorreu uma recombinação entre os loci da
trato urinário; inflamação bacteriana da vagina; infecção vulvovaginal por doença e do marcador.
fungos; retenção de líquidos; aumento de triglicérides; instabilidade Exemplo: Seja θ a taxa de recombinação entre dois loci referentes ao gene de uma
emocional; agressão; ansiedade; sentimento de tristeza; aumento do desejo doença e a um marcador. Se estes estão em cromossomas diferentes têm uma
sexual; nervosismo; agitação; distúrbio do sono; estresse; distúrbios da transmissão independente e θ =1/2; se estão no mesmo cromossoma, são mais
atenção; sensações cutâneas subjetivas; vertigem; intolerância a lentes de frequentemente transmitidos em bloco e 0 ≤ θ < 1/2.
contato; sangramento das veias varicosas; fogachos; pressão baixa; dor nos Caso o gene da doença e o marcador estejam próximos, θ deve aproximar-se de 0;
vasos; constipação; indigestão; azia; nódulos no fígado; reação alérgica na se estão afastados deve estar próximo de 1/2. Diversos testes estatísticos têm sido
pele; cloasmas; crescimento excessivo de pelos em lugares característicos desenvolvidos para testar as hipóteses especificadas a seguir, com base em dados
do sexo masculino; pele oleosa; seborreia; dermatites e neurodermatites; de família.
dor nas costas; espasmos musculares; sensação de peso; cisto mamário;
sangramento durante a relação sexual; produção espontânea de leite H0: θ =1/2 VERSUS H1: 0 ≤ θ < 1
materno; sangramento genital intenso; fluxo menstrual reduzido; atraso na
menstruação; ruptura de cisto ovariano; sensação de queimação vaginal; "Muitos pesquisadores deduziram vários testes estatísticos, segundo uma
odor vaginal; desconforto vulvovaginal; inchaço dos gânglios linfáticos; abordagem clácsica para dados heterogêneos, ou seja, a amostra das famílias .com
dor no peito; fadiga; mal-estar. o mesmo número de descendentes ou não) apresenta uma proporção, k, de famílias
onde o loci da doença e do marcador estão ligados e nas restantes (1-k) não estão
4.6 O USO DA ESTATÍSTICA NA GENÉTICA ligados.”
Gregor Mendel foi o responsável por estabecer os alicerces da Genética. E desde
então a Estatística tem acompanhado o seu desenvolvimento. As leis da "Esta situação é apropriada para dados de uma mesma doença, mas causada por
transmissão de caracteres hereditários, de geração em geração, tiveram como mutações em diferentes loci. Outros pesquisadores seguem uma abordagem
bayesiana, exemplificando a aplicação dos testes apresentados com dados de Encontra-se frequentemente referência aos loci: D1S7, D2S44, D4S139, D10S28 e
famílias, para averiguar a ligação de três loci de DNA obtidos por RFLP e o locus D17S79.
da síndrome do X-frágil (caracteriza-se por deficiências mentais congênitas). " O comprimento (geralmente em kb) dos fragmentos de DNA não codificante são
medidos com um determinado erro que varia de laboratório para laboratório.
"Há estudo com relação à recombinação entre mais de dois e, dada a complexidade Se os cientistas forenses declaram que há diferenças entre as "impressões digitais"
dos modelos propostos, recorre aos Métodos de Monte Carlo via Cadeias de genéticas do suspeito e da amostra recolhida no local do crime, por meio das
Markov, em particular a amostragem de Gibbs e o algorítmo de Metropolis- autorradiografias correspondentes, não é necessária a intervenção da Estatística.
Hasting. Caso contrário, se não são "detectadas diferenças" recorre-se à Estatística para se
Estes métodos de simulação têm sido usados para a análise de árvores genealógicas calcular a proporção de perfis "semelhantes" à amostra do local do crime, numa
associadas a famílias com casos de doenças hereditárias, como, por exemplo, a população de referência. Estas populações de referência devem ser suficientemente
síndrome de Werner's e a fibrose cística" bem estudadas quanto a esses loci e a um conjunto de variáveis relacionadas com a
composição genética.
"Na epidemiologia, os métodos tradicionais mais frequentes assumem que os
indivíduos não estão relacionados. Porém esta hipótese não é realística ao estudar Até aqui a Estatística e os modelos probabilísticos podem intervir no conhecimento
famflias, pois os indivíduos dentro delas estão relacionados. Assim, ao incluir a dos erros de medição, no conhecimento da genética das populações, mas os
componente genética de algumas doenças (como os tumores malignos), até há tribunais que aceitam as "impressões digitais" genéticas esperam um "resumo
pouco tempo consideradas resultantes de causas ambientais, houve necessidade de numérico" que contribua para a sua decisão jurídica.
alterar os métodos habituais nesses estudo “
Exemplo: Considerando os loci L1, L2, L3, L4 e L5 cada um com vários alelos na
Há também estudos em que é utilizada a amostragem de Gibbs para população. Cada indíviduo possui apenas dois alelos (Ai1 e Ai2, i=1, ..., 5)
estimar parâmetros de modelos probabilísticos complexos que incluem uma situados nos cromossomas homólogos, sendo um herdado da mãe e outro do pai.
componente genética (relação entre fenótipos e genótipos e diversos genes dentro Suponhamos que, tanto na amostra de DNA do supeito, como na do local do crime,
de cada família), além do conjunto de variáveis usuais em estudos epidemiológicos tinham sido observados os seguintes alelos em cada loci:
(idade, sexo do indivíduo, alimentação, etc.), e onde a matriz de dados corresponde
a árvores genealógicas.
Muitos autores dão diversas referências bibliográficas de trabalhos que
incluem estes métodos de simulação recentemente (re)descobertos na estatística e
que são a solução para ultrapassar os pesados cálculos associados a modelos
complexos que surgem com frequência também na Genética.
Como se constatou a igualdade de perfis, a Estatística é necessária para estimar a
probabilidade de uma pessoa, selecionada aleatoriamente, da população de
 Utilização na análise forense
referência ter a mesma composição genética do suspeito e da amostra do crime.
Na análise forense são procurados marcadores genéticos de DNA em células
Admitindo o equilíbrio de Hardy-Weinberg entre e dentro dos loci, podemos
recolhidas no local do crime e numa amostra de células retiradas do suspeito de ter
sugerir:
cometido o crime.
Os laboratórios de Biologia Forense usam geralmente três a cinco loci VNTR -
fragmentos de DNA não codificante que correspondem a repetições sucessivas da Em que:
mesma base ou de sequências de bases - que diferem de indivíduo para indivíduo, Pij= proporção do alelo Aij na população para o loci Li, i= 1,2,3….5 e j=1,2.
exceto para os gêmeos verdadeiros.
Nos primeiros tempos de utilização das "impressões digitais" genéticas, esta com o empenho atual a credibilidade deste método aumentará em um futuro
estimativa da probabilidade era apresentada ao juiz, mas frequentemente, com duas próximo.
interpretações consoantes às conveniências da defesa ou da acusação.
Como os loci VNTR apresentam uma diversidade de alelos muito grande numa
população, superior aos grupos sanguíneos que são usados há mais tempo em
questões relacionadas com a investigação da paternidade e na análise forense, a
probabilidade de outro indivíduo ter as mesmas "impressões digitais" genéticas
(exceto nos gêmeos verdadeiros) é muito pequena.
O cálculo desta probabilidade tendo em conta a independência entre e dentro dos
loci (embora se possa testar como já foi referido atrás), a sua interpretação e a
escolha da população de referência, entre outros problemas, instalaram muitas
dúvidas, suscitando uma intervenção crescente dos estatísticos nesta área.
Como a população que está em causa nestas áreas é a humana, pelo menos uma das
condições para que se verifique o equilíbrio de Hardy-Weinberg falha: os
cruzamentos não são aleatórios.
Mas em populações numerosas, a falha desta e das outras condições (selecção
natural, mutações, etc.) pode não afetar muito o equilíbrio.
Esses cruzamentos não aleatórios podem determinar subpopulações dentro de uma
população geral que não devem ser ignoradas nos tratamentos estatísticos.
Para um determinado locus pode surgir outra complicação. Pode ser difícil
distinguir na autorradiografia uma situação em que o indivíduo é homozigótico,
outra - coalescência - em que os dois alelos têm comprimentos similares ou iguais.
O interesse estatístico por estas áreas fez com que se desenvolvessem modelos
probabilísticos que têm em conta os erros de medição no peso molecular dos
fragmentos de DNA, a estrutura da população, coalescência, testemunhas oculares,
etc.

Atualmente, em vez do cálculo da referida probabilidade, tornam-se mais


frequentes os testes de hipóteses, principalmente, segundo uma abordagem
bayesiana.

Essa metodologia também se usa na investigação da paternidade e mais raramente


(mas também acontece) da maternidade. Nesse caso, comparam-se as "impressões
digitais" genéticas da criança, mãe e pretenso(s) pai(s).
Com base nos dados dessa comparação avalia-se qual das hipóteses é mais
evidente: o pretenso pai é o verdadeiro pai da criança contra a negação desta.
Os problemas de natureza jurídica, genética e estatística que se têm levantado
ainda não permitem confiar totalmente nas "impressões digitais" genéticas, mas

Você também pode gostar