Você está na página 1de 33

Estatística Descritiva Análise das variáveis quantitativas

Medidas Resumo
Curso: Análise de dados e uso da informação no SUS
Ting Hui-Ching – outubro/2008

No ponto de ônibus ...

Dados Brutos

Onibus 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

Tempo 15 15 17 20 25 15 14 13 17 25 30 23 13 18 17 15 16 28 23 19 16 14 15 13 12 17 18 34 25 21 34 15

Tabela de Frequência
Tempo 12 13 14 15 16 17 18 19 20 21 23 25 28 30 34 Total Global N 1 3 2 6 2 4 2 1 1 1 2 3 1 1 2 32

Análise Descritiva

Medidas Resumo

Distribuicao de onibus por tempo de espera

Quantidade de onibus

8 6 4 2 0 12 13 14 15 16 17 18 19 20 21 23 25 28 30 34 Tempo (em minutos)

Medidas Resumo • Resposta breve e rápida que sintetize a informação • Caracterizar a tendência central ou dispersão dos dados Ex: Tempo de espera de um ônibus da linha A n Média Mediana Desvio Padrão Mínimo Máximo 32 19 17 6 12 34 .

Média Aritmética ( x ) Como calcular? • Soma de uma série de valores dividida pelo número de valores .

11.5/8 = 13. 14. 13. 14. 12 x = 105. 13.Média Aritmetica ( x ) • Exemplo Dosagem de hemoglobina (mg) em 8 indivíduos 15.5. 13.2 •Fórmula x = n Σ xi i=1 n .

Exemplo: Os grupos são iguais? A 0 5 X =5 B 10 5 5 5 X =5 Medidas de dispersão Quantificar a variabilidade dos dados .

A 0 5 X =5 Medidas de Dispersão (0-5) + (5-5) + (10-5) 10 (0-5) + (5-5) + (10-5) 3 (Variância) Desvio Padrão 2 2 2 Variância Fórmula: Var(x)= Σ (xi – x) i=1 n 2 n-1 Variância amostral .

B 5 5 X =5 Medidas de Dispersão (5-5) + (5-5) + (5-5) 5 Var(B) = (5-5) + (5-5) + (5-5) 3 -1 (Variância) DP (B)= 0 Desvio Padrão 2 2 2 =0 .

precisamos lembrar do desvio padrão!!! .P. = 5 B 10 5 5 5 X =5 D.Exemplo: Os grupos são iguais? A 0 5 X =5 D.P.=0 Ao comparar médias.

6 6.0 37.p. Exemplo: Estudo de efeito de vacina de gripe em crianças portadores de doenças crônicas Caracterização da amostra Medidas Resumo n Média Mediana Desvio Padrão Mínimo Máximo Idade (anos) 156 6 6 2 1 10 Peso (kg) 157 19.9 Estatura (cm) 156 109 112 16 66 138 Observe d.2 5. .4 19.A magnitude de Variância e Desvio Padrão depende da magnitude dos dados.

Como saber se um desvio padrão é grande ou pequeno? .

Coeficiente de Variação (CV) Fórmula: CV = Desvio Padrão Média Ø CV expressa a variabilidade relativa à média Ex: Estudo de efeito de vacina de gripe em crianças portadores de doenças crônicas Medidas Resumo Média Desvio Padrão CV(%) Idade (anos) 6 2 39 Peso (kg) 19.4 6.2 32 Estatura (cm) 109 16 14 X 100 .

Mediana (Md) Como calcular? 1) Ordenar os valores de forma crescente 2) Identificar o valor que separa a distribuição em duas metades com o mesmo número de eventos .

cada um nos seguintes tempos: 48’ . 52. 46’ Solução: Valores ordenados: 42. 95’. Md =48 . 52’. 48. 95. 46. 42’.Mediana (Md) Exemplo 1: Um tipo de cirurgia foi realizado por cinco médicos.

13. 13. 13.25 . 13. 12 Solução: Valores ordenados: 11. 14. 15 Md =(13+13. 14.5)/2 = 13. 11. 13. 13.5. 14. 12.5. 14.Mediana (Md) Exemplo 2: Dosagem de hemoglobina (mg) em 8 indivíduos 15.

Mediana (Md) Exercício: Encontre Mediana seguinte amostra 5. 10.5 .5 Mediana= 12. 100 Qual medida se aproxima mais a realidade da amostra? e média na Solução: Média = 32. 15.

média sofre mais a influencia dos valores extremos do que a mediana .Comentários • No caso de amostra pequena.

bimodais. trimodais ou amodais) • Uma medida de concentração dos valores • é a menos utilizada dentre as medidas de tendência central .Moda (Mo) Como calcular? • É o valor mais freqüente em um conjunto de dados Comentários • Distribuições podem ter uma ou mais modas (unimodal.

Moda (Mo) • Exemplo Dosagem de hemoglobina (mg) indivíduos 15. 12 Modas: 13 e 14 em 8 . 13. 14.5. 11. 14. 13. 13.

9 .0 1. As companhias A e B têm programas de estágios e oferecem uma remuneração por 20 horas semanais com as seguintes características (em salários mínimos) Companhia Média Mediana Moda A 2.9 1.5 B 2.7 1.5 1.Exercício: Qual companhia é mais adequada? Um estudante está procurando um estágio para o próximo ano.

• • • • Decil Percentil Mínimo Máximo 10 partes iguais 100 partes iguais Amplitude=Máximo-Mínimo .Outras Medidas de Posição ou Locação • Quartil Dividir o conjunto ordenado de observações em 4 partes iguais.

sendo que 25% dos valores são menores e 75% dos valores são maiores do que o valor determinado • 2o Quartil (Q2) = mediana (50% acima e 50% abaixo ) • 3o Quartil (Q3) = é o valor da série em que temos 75% dos valores abaixo e 25% dos valores acima do valor determinado .Quartil • Conjunto de dados ordenados e dividido em 4 partes iguais 50% Md 50% Min Q1 Q2 Q3 Max • 1o Quartil (Q1) = o valor que divide o conjunto em duas partes.

Desenho Esquemático (Boxplot) Máximo Q3 Mediana Q1 Mínimo Intervalo Interquartil (IQ=Q3-Q1) .

Desenho Esquemático (Boxplot) Dado Discrepante (Outlier) Pontos Soltos * Pontos externos ○ ½ IQ IQ •Mostrar a distribuição •Identificar “outliers” .

00 .00 escore2 28 0 27.668 11 26 16.50 21.00 28.25 18.00 25 50 75 .00 28.Exemplo: Manual para pacientes com doença renal croônica Statistics N Mean Median Std. Deviation Minimum Maximum Percentiles Valid Missing escore1 28 0 18.50 3.75 18.68 28.723 25 28 28.

Exemplo: Manual para pacientes com doença renal croônica P<0.001 .

Medidas Resumo Medidas de posição Medidas de tendência central: • Media Medidas de dispersão • • • • Amplitude Desvio Padrão/ Variância Intervalo Interquartil Coeficiente de variação • Mediana • Moda Outras: • • • • • Mínimo Máximo Quartil Decil Percentil .

podemos: Ø Analise de consistência discrepantes (Identificar dados Ø Resumir os dados para que sejam informativos Ø Obter informações que indiquem possíveis modelos a serem utilizados na inferência estatística .Com as medidas resumo.

Inferência Estatística .

tstudent testes não paramétricos Coeficiente de correlação Qualitativa Tabela de contingência Qualitativa Quantitativa Medidas resumo Quantitativa Qualitativa Quantitativa Gráfico de dispersão .Técnicas de Análise Bivariada Variável 1 Variável 2 Descrição dos dados Testes Qui-quadrado ANOVA.

7 23.5 3 3.5 2 2.9 25.7 1 1.5 24.2 0.4 11.2 11.2 16.6 14.5 4 4.7 18.8 19.5 0.Associação entre 2 variáveis quantitativas Ex: Determinada concentração da substância X (em mg/l) versus ganho de peso em 15 bois de mesma raça e idade X 0.9 13.2 16.1 Diagrama de Dispersão 30 Ganho de Peso 25 20 15 10 5 0 0 1 2 3 4 5 6 7 Concentracao da Substancia Qual a relação entre as variáveis? .5 5 5.4 12.5 6 Y 9.3 10.6 0.2 17.

W. J.A . A..Referências Ø Estatística Básica. Magalhães. e Lima. Morettin. IME-USP . Editora Atual Ø Noções de Probabilidade e Estatística.N.G.K. D. Cordani. G.P.A. Paula. Leite. L. P.C. O. A. M. Botter. e Bussab. EDUSP Ø Noções de Estatística.