Você está na página 1de 31

Bioestatística

Prof. Dr. Glaucio Araujo


UNIFACIG
EXEMPLOS
Tipos de Variáveis
É expressa por um Sexo, tipo sanguíneo,
Nominais nome, uma categoria estado civil, presença
sem ordem lógica. ou ausência de doença.

Qualitativas
Escolaridade, classe
Categóricas É expressa por um
econômica (a, b, c, d, e),
Denominam uma Ordinais nome, uma categoria
gravidade da doença
possuindo ordem lógica.
qualidade, ou (leve, moderada, alta)
denominam uma
Variáveis categoria.
É expressa por um valor Nº de filhos, nº de
Discretas numérico inteiro, que residentes no domicilio,
Quantitativas pode ser contado. nº de dias internado.
Numéricas
Denominam uma É expressa por um valor Peso, altura, pressão
quantidade, é um valor numérico continuo, é arterial, nível de
numérico. Continuas encontrada por meio de colesterol em mg/ml,
medições. IMC.
Vamos considerar um
banco de dados obtido de
uma pesquisa da qual
participaram 40 mulheres.
As variáveis de interesse
são: idade (em anos
completos), estado civil
(casada, solteira, viúva,
amasiada, divorciada),
tabagismo (“sim”, se
fumante, ou “não”, se não
fumante), idade ao primeiro
filho (em anos completos),
número de partos, peso (em
quilogramas), altura (em
metros) e como descreve
seu próprio estado de saúde
(bom, regular ou ruim).
Vamos considerar um
banco de dados obtido de
uma pesquisa da qual
participaram 40 mulheres.
As variáveis de interesse
são: idade (em anos
completos), estado civil
(casada, solteira, viúva,
amasiada, divorciada),
tabagismo (“sim”, se
fumante, ou “não”, se não
fumante), idade ao primeiro
filho (em anos completos),
número de partos, peso (em
quilogramas), altura (em
metros) e como descreve
seu próprio estado de saúde
(bom, regular ou ruim).
Vamos considerar um
banco de dados obtido de
uma pesquisa da qual
participaram 40 mulheres.
As variáveis de interesse
são: idade (em anos
completos), estado civil
(casada, solteira, viúva,
amasiada, divorciada),
tabagismo (“sim”, se
fumante, ou “não”, se não
fumante), idade ao primeiro
filho (em anos completos),
número de partos, peso (em
quilogramas), altura (em
metros) e como descreve
seu próprio estado de saúde A idade da
(bom, regular ou ruim). mulher, a idade ao As variáveis peso O estado civil e o
O estado de saúde
primeiro filho e o e altura são tabagismo são
Você saberia identificar a número de partos quantitativas qualitativas
é qualitativa
natureza de cada uma ordinal.
são quantitativas contínuas. nominais.
dessas variáveis? discretas
Sexo Frequência Absoluta Frequência relativa

Masculino
Feminino
Total

Vamos ver as
frequências da
turma.
 A forma mais simples de descrever uma variável qualitativa é por
meio de uma tabela de frequências. Como exemplo, a Tabela 2.2
descreve o estado civil das 40 mulheres cujas informações são
exibidas na Tabela 2.1.

Tabelas de
Frequência

As frequências relativas são obtidas


As frequências absolutas descrevem o
da divisão entre cada frequência
número de mulheres em cada uma das
absoluta e o total de observações.
classes da variável. A soma das
São geralmente expressas em
frequências absolutas deve ser o
porcentagens. A soma das
próprio tamanho amostral.
frequências relativas é sempre 100%.
 A tabela precisa sempre conter um título que resuma seu
conteúdo.
 A primeira linha da tabela é um cabeçalho que descreve o
conteúdo das colunas.
 A primeira coluna da tabela costuma descrever o conteúdo das
linhas.
Regras  A última linha da tabela descreve o total dos valores exibidos nas
colunas.
 As linhas da tabela que contêm o cabeçalho e o total dos valores
são exibidas entre dois traços horizontais.
 Podemos utilizar linhas verticais para separar as colunas, se
acharmos necessário, mas não devemos usar linhas verticais à
esquerda da primeira coluna ou à direita da última coluna,
“fechando” a tabela.
As contagens de uma
variável discreta
também podem ser
descritas em uma
tabela de frequências.
A Tabela 2.3 descreve o
número de partos,
considerando os dados
da Tabela 2.1
 De acordo com os propósitos do estudo, uma tabela de frequências
pode conter somente as frequências absolutas ou somente as
frequências relativas.
 Por exemplo, a Tabela 2.4 descreve o número absoluto de casos
notificados de dengue em 2012 em cada uma das unidades da
Observe que a Tabela 2.4 Federação do Nordeste do Brasil.
inclui em sua parte inferior
algumas informações
adicionais. Quando os
dados apresentados na
tabela são obtidos de outro
estudo previamente
publicado, de um órgão do
governo, de um sistema de
informações ou outra fonte,
é conveniente informar sua
origem.
 As tabelas de dupla entrada descrevem as frequências de uma
variável de acordo com as classes de outra variável.
 A Tabela 2.5, por exemplo, descreve a autoavaliação do estado
de saúde dos participantes do estudo, de acordo com o
tabagismo (dados apresentados na Tabela 2.1).

Tabelas de
dupla entrada
Sexo Frequência Frequência
Absoluta relativa
Masculino
Feminino
Total

Número de alunos praticantes de atividades físicas em função do gênero


Categoria de atividade
Sexo Praticante Não Praticantes Total
Masculino
Feminino
Total
 Os gráficos são ferramentas bastante úteis para a
descrição de dados.
 A maior vantagem dos gráficos é sua capacidade de
transmitir a informação contida nos dados com muita
rapidez.
Gráficos  Se o gráfico for bem construído, o leitor terá a
oportunidade de entender as principais características
de nossos dados com pouco esforço.
 A seguir, apresentaremos alguns tipos de gráficos
usuais na pesquisa em saúde.
 O gráfico de dispersão é útil para descrever a relação entre duas
variáveis quantitativas contínuas. Nesse gráfico, cada par de
observações é representado por um ponto em um sistema de
coordenadas cartesianas.
O gráfico destaca um ponto que
representa uma mulher que tem
um peso que é bastante grande
em relação a sua altura (ela é
identificada com o número 27 na
Tabela 2.1).

Gráficos de
dispersão

A Figura 2.2 exibe um


gráfico de dispersão para
as variáveis altura e peso
(dados da Tabela 2.1
 O gráfico em hastes ou bastões é útil para caracterizar uma
variável quantitativa discreta.
Em um sistema de coordenadas,
apresentamos no eixo das
abscissas uma escala contendo
todos os possíveis valores da
variável de interesse e no eixo
das ordenadas representamos
Gráfico em suas respectivas frequências
absolutas em uma escala que se
hastes ou inicia necessariamente no valor
zero.
bastões
A frequência absoluta de cada
possível valor da variável é, então,
descrito nesse sistema de
coordenadas por um ponto.
 Os gráficos de barras são adequados para descrever a distribuição
de frequências de uma variável de natureza qualitativa.
 Por exemplo, consideremos a variável estado civil, cujas
frequências absolutas e relativas são apresentadas na Tabela 2.2. A
Figura 2.4 exibe um gráfico de barras para essa variável, em que
cada uma das classificações.
A Figura 2.4 evidencia que
há uma maior frequência de
mulheres casadas e uma
menor frequência de

Gráficos de mulheres solteiras no banco


de dados.

barras
Observamos que grande parte
das mulheres avalia seu estado
de saúde como bom, enquanto
uma frequência relativamente O gráfico de barras é capaz de
pequena avalia como ruim. descrever uma variável
qualitativa ordinal ou nominal.
Contudo, pode ser especialmente
útil para as variáveis ordinais,
A Figura 2.5 ilustra dado que representa os possíveis
resultados em barras dispostas
um gráfico de em uma sequência

barras para a
autoavaliação do
estado de
saúde,
considerando os
dados da Tabela
2.1.
 O gráfico de linhas é útil para descrever como as mensurações de
interesse modificam-se ao longo do tempo.
Gráfico de  Em uma representação cartesiana, o eixo das abscissas representa
os instantes em que as mensurações foram tomadas e o eixo das
linhas ordenadas representa os valores observados.
 Cada mensuração é descrita por um ponto nesse sistema de eixos,
e segmentos de retas são utilizados para unir esses pontos.
O gráfico explicita um
crescimento do número de
casos notificados da doença
de janeiro até abril. Após
esse mês, houve um rápido
decréscimo do número de
registros.
 O gráfico de setores descreve uma variável
qualitativa, de preferência nominal.
 Tem a forma de um círculo dividido em setores,
Gráfico de sendo que cada setor representa uma classe da
setores variável de interesse.
 A área de cada setor é proporcional à
frequência relativa da classe que ele
representa.
Na Tabela 2.2, observamos que
75% das mulheres cujas
informações são exibidas na Tabela
2.1 são casadas, 12,5% são
divorciadas, 2,5% são solteiras e
10% são viúvas.

Considerando que uma “volta Regra de três


completa” em torno do círculo possui 40 ----- 360º
360°, o setor correspondente às 30 ----- x
mulheres casadas tem um ângulo de X = 30*360/40
75% × 360° = 270° a partir do centro X = 270º
do círculo, o setor correspondente às
divorciadas tem um ângulo de 12,5%
× 360° = 45°, o setor correspondente
às solteiras tem um ângulo de 2,5% ×
360° = 9°, e o setor correspondente às
viúvas tem um ângulo de 10% × 360° =
36. Observar que 270° + 45° + 9° + 36°
= 360°.
Atualmente, com a Por exemplo, vamos
disponibilidade de programas de considerar uma pesquisa
computador que facilitam sua em que foi perguntado a
construção, os gráficos de 500 habitantes qual é o
setores tridimensionais principal problema de
tornaram-se usuais. Entretanto, seu bairro. Os resultados
esses gráficos devem ser vistos são mostrados na Tabela
com cautela. 2.7.

Perceba que esse gráfico descreve


claramente que igual número de Perceba que a figura, agora vista em
habitantes se preocupa com a poluição perspectiva, não deixa clara a
e com a educação (os respectivos proporção de cada setor. Não é
setores ocupam áreas correspondentes explícito na figura que os setores
a 8% do total) correspondentes à poluição e à
educação possuem áreas iguais,.
 O histograma é um gráfico destinado a descrever a distribuição de
uma variável de natureza quantitativa contínua.
 Os dados a seguir referem-se aos comprimentos (em centímetros)
de 83 ovos comprados em uma feira, mensurados com o uso de
um paquímetro.

histograma
O primeiro passo é
organizar esses dados
em uma tabela de
frequências. A
Tabela 2.8 distribui os
valores observados
para a variável em
questão em inter-valos
de classe.
A escolha do número de intervalos de classe para a construção do histograma é
arbitrária, e deve ser baseada no tamanho da amostra. Se definirmos muitos
intervalos de classe e a amostra for relativamente pequena, muitos intervalos
terão frequências pequenas de observações e o histograma não descreverá
satisfatoriamente a distribuição dos dados.
O histograma não pode ser
confundido com um gráfico
de barras. O gráfico de
barras descreve uma
variável de natureza
qualitativa, enquanto o
histograma é utilizado para
descrever a distribuição das
observações de uma
variável contínua.

Não deve haver espaços


entre os sucessivos
retângulos que compõem o
histograma, o que não
necessariamente ocorre no
gráfico de barras.
Distribuição
assimétrica, tal que os
Distribuição simétrica,
Intervalos de classe
com maior frequência
com maiores
de valores no centro do
frequências absolutas
gráfico.
tendem a posicionar-se
à esquerda

Os dados parecem
concentrar-se com
Distribuição maior intensidade em
assimétrica com cauda torno de dois
longa à Esquerda (ou intervalos de classe
assimétrica negativa) distintos (visualmente,
há duas “corcovas” no
gráfico). Bimodal.
 O polígono de frequências também descreve a distribuição de
uma variável de natureza quantitativa contínua.
 Assim como o histograma, também é construído a partir da
organização dos dados em uma tabela de frequências.
 Vamos considerar novamente os comprimentos (em centímetros)
de 83 ovos comprados em uma feira, organizados na Tabela 2.8.

Polígono de
frequências
 Esse tipo de gráfico é útil para visualizarmos as mudanças dos
valores de uma variável quantitativa contínua após um evento ou
intervenção.
 Como exemplo, vamos considerar um estudo que utilizou uma
amostra de onze voluntários portadores de doença pulmonar
obstrutiva crônica (DPOC), que foram submetidos a um programa
de exercícios realizados duas vezes por semana, com duração de
60 minutos cada sessão.
Gráfico “antes  São mostrados a seguir os valores do volume expiratório forçado
e “depois” (VEF) no primeiro segundo (em litros), tomados para cada
voluntário antes da intervenção e ao término do programa de
exercícios, que teve a duração de doze semanas.
As observações amostrais são,
No eixo das abscissas então, representadas por
desse gráfico, indicamos a pontos, de acordo com o
posição em que são momento (antes e depois, eixo
exibidos os valores das abscissas) e seus valores
anteriores e posteriores (eixo das ordenadas). Os pares
ao evento ou à de valores observados para cada
intervenção. indivíduo são, então, ligados por
segmentos de reta.

Em um gráfico “antes e depois”,


a inclinação dos segmentos de
reta que ligam os pontos “antes”
e “depois” responde pela
intensidade da mudança dos
respectivos valores.
Obrigado Até a próxima aula

Você também pode gostar