Escolar Documentos
Profissional Documentos
Cultura Documentos
Exploratria
de Dados com
auxlio do R
Medidas descritivas
(de posio e de disperso)
Variveis
Histograma
quantitativas Grficos
de barras
Boxplot
Distribuio de frequncias
Variveis
de setores
qualitativas Grficos
de barras
2
Exemplo: Projeto Qualidade de Vida
Dados CEA-QV: Projeto Avaliao da fadiga em mulheres
com cncer de mama durante o tratamento quimioterpico
Dados coletados:
- Variveis demogrficas e biomtricas
- Fadiga e qualidade de vida: mensuradas por meio do
questionrio FACIT-F verso 4
- Nvel de hemoglobina (g/dL)
Altura: em cm
6
Variveis do questionrio sobre fadiga
Questionrio FACIT-F:
Dividido em 4 domnios: BES, BEFi, BEE, BEF
Cada domnio tem 6 ou 7 questes
Cada questo tem pontuao de 0 a 4
Aps o paciente responder, calcula-se o escore de cada um dos domnios
Exemplo
Pontuao BEFi: 0 a 28 - quanto maior o escore, melhor a sensao
de bem-estar.
7
Projeto Qualidade de Vida - Variveis
Bem estar fsico (BEFi): varivel relacionada pr-disposio
fsica, sensao de dores, enjoo, etc. A pontuao varia de 0 a 28.
Bem estar social/familiar (BES): varivel relacionada interao
da paciente com a famlia e amigos. A pontuao varia de 0 a 28.
Bem estar emocional (BEE): varivel relacionada a questes
psicolgicas, como stress, preocupao com o estgio da doena, etc.
A pontuao varia de 0 a 24.
n=30
Variveis demogrficas e
biomtricas da paciente.
No variam com os
tempos de coleta.
Tempos de
coleta: 1, 5 e 8
Variveis do Questionrio
FACIT-F e do nvel de
Hemoglobina.
Avaliadas em cada sesso
de quimioterapia: sesses
1, 5 e 8.
10
APOIO COMPUTACIONAL
Software sugerido: R
Biblioteca Rcmdr
11
Carregando dados no R : Arquivo QV
(1) Carregar Rcmdr:
12
Projeto Qualidade de Vida: Dados demogrficos e biomtricos
Visualizar / Editar dados
Rcmdr: Ver conjunto de dados
13
Etnia
Nominal
Variveis Fumante
qualitativas Escolaridade Ordinal
Idade, Peso
Variveis Contnua
quantitativas IMC
BEFi
Discreta
BEE
14
Variveis Qualitativas
Etnia
Fumante
Escolaridade
Estado Civil
Situao de trabalho
16
TABELA DE FREQUNCIAS
Rcmdr: Estatsticas Resumos
Distribuies de frequncia
counts: HabFumar
No Fumante Fumante
19 11
percentages: HabFumar
Sada Rcmdr: No Fumante Fumante
17
63.33 36.67
Grficos para variveis qualitativas
Grfico de barras
Rcmdr: Grficos Grfico de Barras
18
Exemplo: Grfico de setores (pizza) da
varivel HabFumar (hbito de fumar)
HabFumar
No Fumante
Fumante
19
Exemplo: Grfico de barras para a varivel
ESCOLARIDADE
Rcmdr: Grficos Grfico de Barras
20
15
10
5
0
ESCOLARIDADE
20
Variveis Quantitativas
Para obter uma distribuio de frequncias de uma varivel
quantitativa discreta, transform-la em fator (ver slides 16 e 17) ,
com os fatores sendo os prprios nmeros.
Por exemplo,
Construir
Varivel: Idade quantitativa intervalos
de classe
21
(1) criar nova varivel no Rcmdr
Rcmdr: Dados Modificao ...
Agrupar em classes ...
Sada Rcmdr:
counts:
ClasseIdade
(24,33] (33,42] (42,51] (51,60] (60,69]
2 3 14 6 5
percentages:
ClasseIdade
(24,33] (33,42] (42,51] (51,60] (60,69]
6.67 10.00 46.67 20.00 16.67
23
A sada do Rcmdr pode ser editada, obtendo-se, por
exemplo, a tabela abaixo.
Histograma
Rcmdr: Grficos Histograma
Boxplot
Rcmdr: Grficos Boxplot
25
Exemplo: Histograma da Idade
Rcmdr: Grficos Histograma Options
(nmero de classes=5) ...
Classes de Idade f
(20; 30] 2
(30; 40] 2
(40; 50] 15
(50; 60] 6
(60; 70] 5
Total 30
26
BOXPLOT
27
Boxplot - Construo
LS=Q3+1,5(Q3-Q1)
Mximo Essa linha no desenhada no grfico
Q3
75%
Mediana
50%
Q1
25%
Mnimo
LI=Q1-1,5(Q3-Q1)
Mximo o maior valor menor que LS;
Mnimo o menor valor maior que LI. 28 linha no desenhada no grfico
Essa
Exemplo: varivel Altura
Observao aberrante?
30
Histogramas por Grupo
IDADE de acordo com o IMC de acordo com o
HBITO DE FUMAR HBITO DE FUMAR
HabFumar = No Fumante
0.08
Densidade
0.04
0.00
20 25 30 35 40 45
IMC
HabFumar = Fumante
0.08
Densidade
0.04
0.00
20 25 30 35 40 45
IMC
31
Varivel Quantitativa por Grupo
32
Boxplots por Grupo
33
Para treinar o uso do R e Rcmdr, sugerimos os exerccios a
seguir.
Exerccio 1:
Considere os dados demogrficos e biomtricos do Projeto
Qualidade de Vida (arquivo CEA-QV-demogrficos.xls).
a) Usando o R, converta as variveis etnia, estado civil,
escolaridade para fatores. Obtenha a tabela de frequncias e faa
uma representao grfica para cada uma dessas variveis. Descreva
e comente os resultados.