Escolar Documentos
Profissional Documentos
Cultura Documentos
Distribuciones de Frecuencias Conjuntas Dado una unidad experimental podemos observar o medir ms de una variable simultneamente. simultneamente. Por ejemplo: X = peso de una persona ejemplo: Y = altura de la misma persona
1er caso: X e Y ambas variables cualitativas. En este caso la caso: cualitativas. distribucin conjunta se llama tabla de contingencia
Ejemplo 1: Se desea estudiar si existe o no relacin entre los hbitos de fumar de una persona y el hecho de padecer problemas de hipertensin. Es decir que se sospecha que el fumar hipertensin. aumenta el riesgo de tener problemas de hipertensin. hipertensin.
X = Condicin de Fumador. Fumador. Categoras = {No fuma, Fuma Moderadamente, Fuma en Exceso}
En el anlisis bivariado los datos estn de a pares, es decir, tendran la siguiente forma. forma.
Tabla 7: Datos de condicin de fumador y condicin de hipertenso. hipertenso.
Persona 1 2 3 4 5 6 7 8 9 10 X (condicin de fumador) No F. No F. No F. F. Exc. No F. No F. F. Mod. F. Exc. F. Mod. F. Mod. Y (condicin de hipertenso) Si tiene No tiene No tiene No tiene No tiene No tiene Si tiene Si tiene Si tiene Si tiene
4
Tabla 8: Distribucin de frecuencias conjunta de condicin de fumador vs. condicin de hipertenso. vs. hipertenso.
Y X No fuma Fuma Mod. Fuma exc. Total Si tiene 21 36 30 87 No tiene 48 26 19 93 Total 69 62 49 180
Distribuciones marginales: Son los totales por filas y columnas, marginales: estos corresponden a las distribuciones de las variables X e Y respectivamente. respectivamente.
Estudio de porcentajes: porcentajes: Se pueden calcular porcentajes sobre total de filas o total de columnas. columnas. Sirve para estudiar la influencia de una variable sobre la otra.
Tabla 9: Distribucin conjunta de porcentajes sobre total de filas
Y X No fuma Fuma Mod. Fuma en exceso Si tiene 30 % 58 % 61 % No tiene 70 % 42 % 39 % Total 100 % 100 % 100 %
Figura 6: Distribucin de personas con y sin hipertensin segn su condicin de fumador. fumador.
4 3
Si tiene o tiene
o fuma
uma
od.
uma e c.
t N t t N t
N t
Ejemplo 2: Se quiere realizar un estudio para analizar qu 2: medicamentos toma la gente para 4 dolencias determinadas. Los datos recolectados son los siguientes
Tabla 10: Distribucin conjunta de Padecimiento y medicamentos
Ibuprofe.
Dipirona
Aspirina
Otro
107 98 302 0
47 41 60 242
24 30 23 26
9
Porcentajes: Para hacer el estudio de porcentajes nos hacemos la pregunta de que variable influye sobre cual Tabla 11: Distribucin porcentual sobre el total de filas Padecimiento Medicamento Neuralgia Resfro Malestar gstrico Dolor de cabeza 28% 17% 78% 0% 13% 7% 16% 51% 53% 70% 0% 44% 6% 5% 6% 5% 100% 100% 100% 100% Ibupro. Dipiro. Aspir. Otro Total
10
Ejercicio
Se desea investigar si el al Partido Demcrata es ms fuerte en la Ciudad A que en la B, los datos que se obtienen son los siguientes: Ciudad Partido Republicano Partido Demcrata
A B
625 875
1375 1125
11
Preguntas
A) Determine las distribuciones marginales. B) Calcule los porcentajes en el sentido que crea conveniente C) Dira usted que el apoyo al partido demcrata es diferente en la ciudad A que la B?
12
Distribuciones Marginales
Ciudad
Total
13
Anlisis de Porcentajes: Los porcentajes deben estar basados en los totales de las ciudades. Ciudad A B Partido Republicano 31% 44% Partido Demcrata 69% 56% Total 100% 100%
S puede decirse que el partido Demcrata es ms fuerte en la ciudad A que en la B, ya que los porcentajes de simpatizantes es 13% mayor en la ciudad A.
14
2do caso: X Cualitativa e Y Cuantitativa. caso: Cuantitativa. Ejemplo: Ejemplo: Se desea estudiar si las personas de sexo masculino tienen mayores niveles de colesterol en la sangre que las de sexo femenino. femenino. Se definen las siguientes variables X = Sexo de una persona Categoras = {Masculino, Femenino} Y = Nivel de colesterol de la persona A la variable cualitativa se le llama variable agrupadora. agrupadora.
15
N 29 30
16
Representacin Grfica: Una forma adecuada de representacin Grfica: grfica para comparar entre grupos son los diagramas de tipo caja. caja.
Figura 8: Niveles de colesterol por sexo. El grupo 1 es de los varones y el sexo. grupo 2 de las mujeres. mujeres.
190
180
V1
17
Un caso similar es el de una variable cuantitativa continua y una cualitativa discreta, en este caso a la variable discreta se la puede tomar como una variable agrupadora. agrupadora.
Ejemplo 2: Veamos el ingreso total familiar en Tucumn en el 3er. er. Trimestre de 2005 segn la cantidad de miembros de una familia. familia.
18
Anlisis descriptivo
Cantidad de miembros 1 2 3 4 5 6 7
19
Representacin grfica mediante diagramas de tipo caja Figura 9: ingreso total familiar en Tucumn en el 3er. Trimestre de 2005 segn la cantidad de miembros de una familia
6000
antidad de miembros
20
3er caso: X e Y Cuantitativas caso: Ejemplo 1: Se desea estudiar si la tensin arterial sistlica cambia con la edad, se considera una muestra de 46 varones de edades entre 16 y 64 aos y se mide su tensin arterial sistlica. sistlica. Se definen las siguientes variables: variables: X = Edad Y = Tensin arterial sistlica En este caso de tener dos variables cuantitativas el grfico adecuado se llama Diagrama de Dispersin en el mismo se muestran los pares de datos para cada persona
21
Se observa que la tensin arterial sistlica aumenta en promedio con la edad. Para estudiar con mayor precisin esta relacin se edad. puede ajustar una relacin lineal, es decir una recta. recta.
22
Ejemplo 2: Se desea estudiar el consumo diario de energa en una casa en funcin de la temperatura.
10
22
28 67
31 50
39 39
48 45
23
4 2
Consumo (Kw) 4 2
2 Temper t r media
24
Observaciones
En ambos ejemplos es razonable pensar que la relacin que existe entre las variables es lineal. En esta situacin utilizamos una herramienta que se denomina REGRESIN LINEAL SIMPLE
25
Cuando los datos mediante un grfico de dispersin sugieren que se puede ajustar una recta: La recta tendra la forma y = E + x Luego el modelo terico que se utiliza es el siguiente: yi= E + xi +ei
Se ajusta utilizando mtodos de Mnimos Cuadrados y se implementa con Excel o con alguna calculadora cientfica
26
40 a me a
50
60
27
La recta ajustada con Excel es: es: y = -2,34x + 138,7 34x 138, R2 = 0,9126 El coeficiente -2.34 se interpreta diciendo: diciendo: Es cuanto cambia Y en promedio, cuando X cambia en una unidad. unidad. Quiere decir que Y disminuye 2.34 en promedio, cuando X aumenta una unidad. unidad. El valor de E no siempre tiene sentido. sentido. Este modelo me sirve para Predecir y dado un valor de x pero vale solo dentro del rango de las observaciones. observaciones. El valor del R2 me indica el porcentaje de cuanto explica X a la variable Y.
28