Você está na página 1de 12

MESTRADO EM GESTÃO FARMACÊUTICA

Aula 2
Estatística descritiva

1
MESTRADO EM GESTÃO FARMACÊUTICA

Estatística descritiva

2
Variáveis Contínuas

Gráfico: histograma

Medidas de sumário:

média ? Mediana? desvio padrão? âmbito? …

3
Medidas de sumário
Medidas de tendência central:

Média – soma de todos os valores sobre o nº de valores

Mediana – ordenando os valores por ordem crescente é o valor do meio

Outras medidas: moda

Medida Vantagens Desvantagens

Média Usa todos os dados Distorcida por valores extremos


Definida algebricamente Distorcida por distribuições
enviesadas
Mediana Não é distorcida por valores extremos Ignora muita informação
Não é distorcida por distribuições Não definida algebricamente
enviesadas
Quadro adaptado de: Medical Statistics at a Glance. Aviva Petrie and Caroline Sabin. Blackwell Science. 2000

>print(summary(nutricao$comp))
4
Medidas de sumário
Medidas de dispersão:
Âmbito – diferença entre o valor maior e menor

Âmbito de percentis – ordenando os valores por ordem crescente e


dividindo os valores em 100 pedaços, o valor que corresponde a x%
das observações é o percentil x. Se dividir em 4 grupos iguais chamam-
se quartis que correspondem ao percentil 25, 50 e 75. O âmbito
interquartil é a diferença entre o percentil 25 e 75. Também se pode
fazer o âmbito entre dois outros percentis.

Variância – soma dos quadrados dos desvios à média a dividir por um


menos o numero de casos

Desvio padrão – raiz quadrada da variância

Outras medidas – skewness and kurtosis


5
Medidas de sumário
Medida Vantagens Desvantagens
Âmbito Fácil de calcular Usa apenas dois valores
Distorcido por valores extremos
Âmbito de Não é distorcida por valores Não pode ser calculado para amostras
percentis extremos pequenas

Variância Usa todos os dados A unidade é o quadrado da unidade dos


Definida algebricamente dados
Sensível a valores extremos
Não apropriada em distribuições
enviesadas
Desvio padrão Usa todos os dados Sensível a valores extremos
Definida algebricamente Não apropriada em distribuições
Mesma unidade que os dados enviesadas
Fácil de interpretar
Quadro adaptado de: Medical Statistics at a Glance. Aviva Petrie and Caroline Sabin. Blackwell Science. 2000

>print(summary(nutricao$comp))
6
Apresentação Gráfica

histograma

>hist(nutricao$comp)
7
Variáveis Categóricas

Gráfico: tarte ou barras

Medidas: frequências relativas ou absolutas

8
Apresentação Gráfica

gráfico de barras tarte

9
Relacionar duas variáveis

Tabelas de contingência
Fumou no início da
As tabelas de contingência são gravidez?
utilizadas para estudar a relação Grupo etário N n (%)
entre duas variáveis categóricas 13-20 anos 200 70 (35)
descrevendo a frequências das 21-30 anos 2970 450 (15)
categorias de uma das variáveis
31-35 anos 970 60 (6)
relativamente às categorias de
36-55 anos 620 30 (5)
outra.

>prop.table(table(data$fumou,data$grupo_etario))
10
Relacionar duas variáveis

Diagrama de dispersão
Os diagramas de
dispersão são utilizados
para estudar a relação
entre duas variáveis
contínuas.

11
Relacionar duas variáveis

Box plot

12

Você também pode gostar