Você está na página 1de 28

DIRECCIN DE ESTADSTICAS DE LA PROVINCIA

INTRODUCCIN A LA ESTADSTICA DESCRIPTIVA


Lazarte Vctor Fabio y Naidicz Paula Lorena

Distribuciones de Frecuencias Conjuntas Dado una unidad experimental podemos observar o medir ms de una variable simultneamente. simultneamente. Por ejemplo: X = peso de una persona ejemplo: Y = altura de la misma persona

Distribuciones bivariadas y su representacin grfica

1er caso: X e Y ambas variables cualitativas. En este caso la caso: cualitativas. distribucin conjunta se llama tabla de contingencia

Ejemplo 1: Se desea estudiar si existe o no relacin entre los hbitos de fumar de una persona y el hecho de padecer problemas de hipertensin. Es decir que se sospecha que el fumar hipertensin. aumenta el riesgo de tener problemas de hipertensin. hipertensin.

Se definen las siguientes variables. variables.




X = Condicin de Fumador. Fumador. Categoras = {No fuma, Fuma Moderadamente, Fuma en Exceso}

Y = Condicin de hipertenso. hipertenso. Categoras = {Si tiene hipertensin, No tiene hipertensin}

En el anlisis bivariado los datos estn de a pares, es decir, tendran la siguiente forma. forma.
Tabla 7: Datos de condicin de fumador y condicin de hipertenso. hipertenso.
Persona 1 2 3 4 5 6 7 8 9 10 X (condicin de fumador) No F. No F. No F. F. Exc. No F. No F. F. Mod. F. Exc. F. Mod. F. Mod. Y (condicin de hipertenso) Si tiene No tiene No tiene No tiene No tiene No tiene Si tiene Si tiene Si tiene Si tiene
4

Tabla 8: Distribucin de frecuencias conjunta de condicin de fumador vs. condicin de hipertenso. vs. hipertenso.
Y X No fuma Fuma Mod. Fuma exc. Total Si tiene 21 36 30 87 No tiene 48 26 19 93 Total 69 62 49 180

Distribuciones marginales: Son los totales por filas y columnas, marginales: estos corresponden a las distribuciones de las variables X e Y respectivamente. respectivamente.

Estudio de porcentajes: porcentajes: Se pueden calcular porcentajes sobre total de filas o total de columnas. columnas. Sirve para estudiar la influencia de una variable sobre la otra.
Tabla 9: Distribucin conjunta de porcentajes sobre total de filas
Y X No fuma Fuma Mod. Fuma en exceso Si tiene 30 % 58 % 61 % No tiene 70 % 42 % 39 % Total 100 % 100 % 100 %

Representacin Grfica: Diagramas de barras o Diagrama Grfica: Circular

Figura 6: Distribucin de personas con y sin hipertensin segn su condicin de fumador. fumador.

4 3

Si tiene o tiene

o fuma

uma

od.

uma e c.

Figura 7: Distribucin de personas con y sin hipertensin segn su condicin de fumador


N f m m .

t N t t N t

N t

Ejemplo 2: Se quiere realizar un estudio para analizar qu 2: medicamentos toma la gente para 4 dolencias determinadas. Los datos recolectados son los siguientes
Tabla 10: Distribucin conjunta de Padecimiento y medicamentos

Padecimiento Medicamento Neuralgia Resfro Malestar gstrico Dolor de cabeza

Ibuprofe.

Dipirona

Aspirina

Otro

107 98 302 0

47 41 60 242

198 401 0 201

24 30 23 26
9

Porcentajes: Para hacer el estudio de porcentajes nos hacemos la pregunta de que variable influye sobre cual Tabla 11: Distribucin porcentual sobre el total de filas Padecimiento Medicamento Neuralgia Resfro Malestar gstrico Dolor de cabeza 28% 17% 78% 0% 13% 7% 16% 51% 53% 70% 0% 44% 6% 5% 6% 5% 100% 100% 100% 100% Ibupro. Dipiro. Aspir. Otro Total

10

Ejercicio
Se desea investigar si el al Partido Demcrata es ms fuerte en la Ciudad A que en la B, los datos que se obtienen son los siguientes: Ciudad Partido Republicano Partido Demcrata

A B

625 875

1375 1125

11

Preguntas

  

A) Determine las distribuciones marginales. B) Calcule los porcentajes en el sentido que crea conveniente C) Dira usted que el apoyo al partido demcrata es diferente en la ciudad A que la B?

12

Distribuciones Marginales

Partido Republicano Demcrata Total

Frecuencia 1500 (38%) 2500 (62%) 4000 (100%) A B

Ciudad

Frecuencia 2000 (50%) 2000 (50%) 4000 (100%)

Total

13

Anlisis de Porcentajes: Los porcentajes deben estar basados en los totales de las ciudades. Ciudad A B Partido Republicano 31% 44% Partido Demcrata 69% 56% Total 100% 100%

S puede decirse que el partido Demcrata es ms fuerte en la ciudad A que en la B, ya que los porcentajes de simpatizantes es 13% mayor en la ciudad A.
14

2do caso: X Cualitativa e Y Cuantitativa. caso: Cuantitativa. Ejemplo: Ejemplo: Se desea estudiar si las personas de sexo masculino tienen mayores niveles de colesterol en la sangre que las de sexo femenino. femenino. Se definen las siguientes variables X = Sexo de una persona Categoras = {Masculino, Femenino} Y = Nivel de colesterol de la persona A la variable cualitativa se le llama variable agrupadora. agrupadora.

15

Estudio descriptivo Varones Mujeres

N 29 30

Media 170,97 157,3

Mediana 170 156,5

Desviacin Estndar 9,9 10,44

Mnimo 155 140

Mximo 190 180

16

Representacin Grfica: Una forma adecuada de representacin Grfica: grfica para comparar entre grupos son los diagramas de tipo caja. caja.
Figura 8: Niveles de colesterol por sexo. El grupo 1 es de los varones y el sexo. grupo 2 de las mujeres. mujeres.

190

180

170 V2 160 150 1 0

V1

17

Un caso similar es el de una variable cuantitativa continua y una cualitativa discreta, en este caso a la variable discreta se la puede tomar como una variable agrupadora. agrupadora.

Ejemplo 2: Veamos el ingreso total familiar en Tucumn en el 3er. er. Trimestre de 2005 segn la cantidad de miembros de una familia. familia.

18

Anlisis descriptivo

Cantidad de miembros 1 2 3 4 5 6 7

N 87 115 117 114 121 62 29

Media 532,2 730,9 868,5 911,5 1049,8 1090,0 849,0

Mediana 400,0 550,0 660,5 700,0 850,0 923,0 630,0

Desviacin Estndar 488,3 718,6 939,8 982,5 933,4 1063,0 825,0

19

Representacin grfica mediante diagramas de tipo caja Figura 9: ingreso total familiar en Tucumn en el 3er. Trimestre de 2005 segn la cantidad de miembros de una familia

6000

Ingreso total familiar

5000 4000 3000 2000 1000 0 1 2 3 4 5 6 7

antidad de miembros

20

3er caso: X e Y Cuantitativas caso: Ejemplo 1: Se desea estudiar si la tensin arterial sistlica cambia con la edad, se considera una muestra de 46 varones de edades entre 16 y 64 aos y se mide su tensin arterial sistlica. sistlica. Se definen las siguientes variables: variables: X = Edad Y = Tensin arterial sistlica En este caso de tener dos variables cuantitativas el grfico adecuado se llama Diagrama de Dispersin en el mismo se muestran los pares de datos para cada persona

21

Figura 9: Tensin arterial sistlica por edad de 46 personas de sexo masculino


200 190 180 170 160 150 140 130 15 25 35 45 55 65

Se observa que la tensin arterial sistlica aumenta en promedio con la edad. Para estudiar con mayor precisin esta relacin se edad. puede ajustar una relacin lineal, es decir una recta. recta.
22

Ejemplo 2: Se desea estudiar el consumo diario de energa en una casa en funcin de la temperatura.

Temp. Media Mensual (oC) (X) Consumo (Kilowats) (Y)

10

22

28 67

31 50

39 39

48 45

126 132 114 87

23

Grfico de dispersin: Temperatura- Consumo Temperatura-

4 2

Consumo (Kw) 4 2

2 Temper t r media

24

Observaciones


En ambos ejemplos es razonable pensar que la relacin que existe entre las variables es lineal. En esta situacin utilizamos una herramienta que se denomina REGRESIN LINEAL SIMPLE

25

Regresin Lineal Simple




Cuando los datos mediante un grfico de dispersin sugieren que se puede ajustar una recta: La recta tendra la forma y = E + x Luego el modelo terico que se utiliza es el siguiente: yi= E + xi +ei

 

Se ajusta utilizando mtodos de Mnimos Cuadrados y se implementa con Excel o con alguna calculadora cientfica

26

Recta Ajustada con Excel


-2 3444x + 138 77 R2 = 0 9126

140 120 100 80 s m C 40 20 0 0 10 20 Tem e a 30 60

40 a me a

50

60

27

La recta ajustada con Excel es: es: y = -2,34x + 138,7 34x 138, R2 = 0,9126 El coeficiente -2.34 se interpreta diciendo: diciendo: Es cuanto cambia Y en promedio, cuando X cambia en una unidad. unidad. Quiere decir que Y disminuye 2.34 en promedio, cuando X aumenta una unidad. unidad. El valor de E no siempre tiene sentido. sentido. Este modelo me sirve para Predecir y dado un valor de x pero vale solo dentro del rango de las observaciones. observaciones. El valor del R2 me indica el porcentaje de cuanto explica X a la variable Y.

 

28

Você também pode gostar