Você está na página 1de 24

Introduo Estatstica descritiva Representando dados gracamente

Aula 1 - Estatstica descritiva


Alexandre Ribeiro Leichsenring Daiichi Sankyo, Agosto de 2010

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Introduo
Estatstica
Estudo e a compreenso de variaes em populaes e processos e de interaes entre variveis em populaes e processos. Conjunto de tcnicas que permite organizar, descrever, analisar e interpretar dados. Trs reas
1 2 3
Estatstica Descritiva Probabilidade Inferncia Estatstica

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Estatstica Descritiva
Utilizada nas etapas preliminares de anlise. Conjunto de tcnicas para descrever e representar os dados (conjecturas iniciais).

Probabilidade
Teoria matemtica usada para modelar a incerteza de fenmenos aleatrios.

Inferncia Estatstica
Tomada de decises sobre conjuntos grandes de dados ( partir de um subconjunto menor de dados (

amostra).

populao), a

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Tratamento de bases de dados


Antigamente tarefa tediosa e cansativa. Hoje avano da tecnologia permite que grande quantidade de informao possa ser examinada rapidamente com o uso de computadores pessoais e programas adequados. Abordaremos aspectos tericos da estatstica, mas sempre que possvel, aplicaremos conceitos aprendidos em conjuntos de dados pertinentes.

Minitab
Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Medidas de tendncia central Medidas de Disperso

Estatstica descritiva
Dados
Informao numrica coletada sobre produtos, servios, processos, indivduos ou tens Variam por natureza, no havendo dois objetos ou indivduos idnticos. Caractersticas de interesse so chamada de variveis

Variveis
Categricas Dados classicados em categorias ou usados para indicar ocorrncias de um determinado fenmeno Quantitativas Resultam de medidas tiradas sobre objetos ou pessoas (e.g. altura, peso, temperatura, tempo)
Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Medidas de tendncia central Medidas de Disperso

Tabulando e resumindo dados


Para variveis categricas, construmos tabelas usando os valores da varivel registrando as freqncias (ou proporo) de cada valor nos dados. Exemplo

Considere os dados shipping.mtw do sample data do Minitab:


1 2
File

Open Worksheet

Clique na pasta Look in Minitab Sample Data folder, na parte inferior da caixa de dilogo

3 4

Na pasta Sample Data clique duas vezes em Meet Minitab Escolha Shippingdata.mtw e clique em Open.

Vamos supor que voc deseja saber se cada centro de expedio tem entregue as encomendas dentro do prazo. Um bom incio fazer uma tabulao dos dados. Use o Minitabpara isso.
Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Medidas de tendncia central Medidas de Disperso

Estatsticas descritivas
Para variveis quantitativas Fornecem um resumo numrico dos dados, um resumo informativo sobre a distribuio das variveis aleatrias Tambm chamadas medidas resumo Medidas de tendncia central Mdia, mediana, moda, 1 quartil, 3 quartil
o o

Medidas de disperso Varincia, desvio padro, amplitude

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Medidas de tendncia central Medidas de Disperso

Medidas de tendncia central


Mdia a medida de tendncia central mais conhecida. A mdia de um conjunto de dados e denida por

X1 , X2 , . . . X
n

, denotada por X

= X1 + X2 + . . . X X n

(1)

Nessa equao, reticncias (. . .) so usadas ao invs de se escrever todos os valores da amostra. Usamos o smbolo grego sigma () para representar a soma de todos os valores, de maneira que a frmula 1 simplica-se para a seguinte forma:
= X
n i

=1

X.
i

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Medidas de tendncia central Medidas de Disperso

Mediana Divide um conjunto ordenado de dados em duas partes iguais Metade dos valores sero maiores do que a mediana e metade sero menores Observao central do conjunto ordenado de dados No afetada pela existncia de valores extremos no conjunto de dados ( prefervel mdia quando h valores extremos) Para calcular a mediana de um conjunto de dados, primeiro se ordena os valores do menor para o maior, e ento a mediana computada.

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Medidas de tendncia central Medidas de Disperso

Quarts O 1 e 3 quartis (Q1 e Q3 ) tambm so medidas obtidas a partir da ordenao dos dados Q1 o valor da amostra ordenada tal que um quarto dos valores so menores do que ele e trs quartos so maiores Q3 valor tal que trs quartos dos valores so menores do que ele e um quarto so maiores Deduz-se que a mediana ser o 2 quartil
o o o

Moda Representa o valor com maior ocorrncia no conjunto de dados, ou dito de outra forma, o seu valor mais freqente.
Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Medidas de tendncia central Medidas de Disperso

Medidas de Disperso
Varincia Para um conjunto de dados com varincia dada pela frmula

n observaes X1 , X2 , . . . X
n i

,a (2)

Var (X ) = Var (X ) =

=1 (

)2 X X . n
i

comum calcular a varincia de um conjunto de dados por:


n i

=1 (

n1

)2 X

.
Essa

(3)

Dessa maneira, ao invs de dividir a soma por

n, dividimos por n 1.

diferena tem a ver com propriedades do estimador amostral para a varincia populacional. No entraremos em pormenores, em todo o caso, convenciona-se calcular a

varincia populacional pela frmula 2 e a varincia amostral pela


Estatstica para Farmacuticas

frmula alternativa 3.

Introduo Estatstica descritiva Representando dados gracamente

Medidas de tendncia central Medidas de Disperso

Desvio Padro O Desvio Padro denido por:

DP (X ) =

Var(X )

(4)

Tradicionalmente se denota a varincia de uma varivel aleatria pelo 2 smbolo e o desvio padro por Dizemos que sua varincia

um parmetro de escala, da largura da distribuio

Quanto menos concentrados estiverem os valores da varivel

maior ser

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente


Exemplo

Medidas de tendncia central Medidas de Disperso

Considere os dados das centrais de entrega (Shippingdata.MTW). Vamos gerar (atravs do Minitab) as estatsticas descritivas para a varivel Days, que representa o tempo at a entrega da encomenda. Vamos supor que ns desejamos investigar se h diferena entre os tempos de entrega de cada centro.
1

Acesse o seguinte caminho do menu:


Stat

Basic Statistics Display Descriptive Statistics

2 3

Na caixa de dilogo selecione a varivel Days Na janela By variables voc pode selecionar a varivel Centro para obter as estatsticas descritivas de Dias separado por centro de distribuio

Clique no boto Statistics e selecione as estatsticas descritivas de interesse

Clique em OK
Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Grcos para variveis categricas Grcos para variveis quantitativas Examinando relacionamentos entre variveis

Representando dados gracamente


Grcos para variveis categricas
H os bem conhecidos grcos de barra e de pizza. Podem ser criados no Minitab atravs dos seguintes caminhos no menu: Graph Bar Chart Graph Pie Chart

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Grcos para variveis categricas Grcos para variveis quantitativas Examinando relacionamentos entre variveis

Grcos para variveis quantitativas


Histograma Retngulos com barras proporcionais freqncia absoluta (ou porcentagem) de valores encontrados em cada intervalo. Pode-se usar intervalos de tamanhos diferentes para as barras, mas nesse caso recomenda-se que a rea da barra (e no a altura) seja proporcional freqncia de cada intervalo.

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Grcos para variveis categricas Grcos para variveis quantitativas Examinando relacionamentos entre variveis

Box-plot Caixa com o nvel superior dado pelo terceiro quartil e o nvel inferior dado pelo primeiro quartil Mediana representada por um trao no interior da caixa Segmentos de reta da caixa at os valores mximo e mnimo, que no sejam valores discrepantes (ouliers)

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Grcos para variveis categricas Grcos para variveis quantitativas Examinando relacionamentos entre variveis

Grco de valores individuais Usado para investigar e comparar distribuies amostrais Valores individuais para cada varivel ou grupo numa coluna vertical Facilita a identicao de valores discrepantes

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Grcos para variveis categricas Grcos para variveis quantitativas Examinando relacionamentos entre variveis

Procedimentos para gerar os grcos no Minitab


Para fazer histogramas 1 Graph Histogram 2 Na primeira caixa de dilogo, selecione Simple 3 Selecione a varivel Days para Graph Variables 4 Clique em Multiple Graphs, selecionando em seguida:
In separate panels of the same graph na aba Multiple variables A varivel Centro na caixa By variables in groups in separate panels OK

OK

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Grcos para variveis categricas Grcos para variveis quantitativas Examinando relacionamentos entre variveis

Grcos de ajuste de curva normal para histogramas 1 Graph Histogram 2 Na primeira caixa de dilogo, selecione With Fit and Groups 3 Selecione a varivel Days na caixa Graph variables 4 Selecione a varivel Centro na caixa Cathegorical variables for grouping 5 OK

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Grcos para variveis categricas Grcos para variveis quantitativas Examinando relacionamentos entre variveis

Box-plots 1 Graph Boxplot 2 Na caixa de dilogo selecione One Y With Groups 3 Selecione a varivel Days na caixa Graph variables 4 Selecione a varivel Centro na caixa Cathegorical variables for grouping 5 OK

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Grcos para variveis categricas Grcos para variveis quantitativas Examinando relacionamentos entre variveis

Para os grcos de valores individuais 1 Graph Individual Value Plot 2 Na caixa de dilogo selecione One Y With Groups 3 Selecione a varivel Days na caixa Graph variables 4 Selecione a varivel Centro na caixa Cathegorical variables for grouping 5 Clique no boto Data view e marque Mean connect line 6 OK

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Grcos para variveis categricas Grcos para variveis quantitativas Examinando relacionamentos entre variveis

Examinando relacionamentos entre variveis


Os grcos podem ajud-lo a identicar se h associaes entre as variveis e qual o grau dessas associaes. Conhecer o relacionamento entre as variveis pode ajud-lo a guiar anlises futuras e a determinar que variveis merecem maior ateno. Grco de disperso

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Grcos para variveis categricas Grcos para variveis quantitativas Examinando relacionamentos entre variveis

Procedimentos para gerar os grcos no Minitab


Como fazer grcos de disperso no Minitab 1 V em Graph Scatterplot e selecione o tipo With Regression 2 Selecione Days como varivel Y e Distance como varivel X 3 Clique no boto Multiple Graphs selecionando In separate panels of the same graph na aba Multiple Variables 4 Na aba By Variables selecione a varivel Center para a caixa By variables with groups in separate panels 5 OK

Estatstica para Farmacuticas

Introduo Estatstica descritiva Representando dados gracamente

Grcos para variveis categricas Grcos para variveis quantitativas Examinando relacionamentos entre variveis

Anlise de dados
Exemplo de roteiro de anlise descritiva O arquivo Aula1.MTW tem dados sobre mercado de trabalho formal da populao de baixa renda no Brasil. Vamos supor que queremos fazer uma anlise da proporo de empregados. Roteiro:
1

Anlise exploratria
a Estatsticas descritivas b Anlise grca

Cidades de tamanhos com perl muito diferentes:


a Criar varivel Porte da cidade: {P,G} b Tabelas para Porte da cidade

Anlise separada dos dois grupos: P x G


a Estatsticas descritivas b Anlise grca

Estatstica para Farmacuticas

Você também pode gostar