Você está na página 1de 20

Tema 2 Introduccin. Estad o stica descriptiva.

Conceptos bsicos a
2.1. La estad stica

La estad stica se podr denir como el conjunto de mtodos cient a e cos que nos permiten interpretar descriptiva de la informacin numrica, elegir elementos representativos para reo e alizar inferencia y contrastar hiptesis, estudiar las relaciones causa-efecto y hacer predicciones. o Dentro de la Estad stica, podemos destacar varias ramas como son la Estad stica Descriptiva, el Clculo de Probabilidades o la Inferencia Estad a stica.

2.1.1.

Estad stica Multivariante

La Psicolog y la Sociolog son dos de las disciplinas en las que la Estad a a stica tiene una aplicacin ms importante. La Estad o a stica le ha proporcionado a estas la posibilidad de ser ciencias basadas en algo ms que en la observacin de fenmenos y la especulacin sobre las a o o o causas de los mismos. Durante muchos aos los investigadores en Sociolog basaban sus esn a tudios en el desarrollo de tcnicas univariantes (estudio de solo una variable), sin embargo, e ultimamente e impulsado por el desarrollo de aplicaciones informticas, los estudios en Soci a olog no se pueden concebir sin la utilizacin de Tcnicas Multivariantes. a o e Es sabido que en la investigacin, las variables pueden clasicarse en independientes y deo pendientes. Las independientes son las que se manipulan con intencin de producir un efecto, o estas variables son caracter sticas de los sujetos (edad) o situacin (prctica, terapia) que se o a suponen van a afectar a otras variables. Las variables dependientes son las que medimos porque consideramos que van a reejar el efecto de nuestra manipulacin, por ejemplo el grado de ano siedad, la idea de religin, la intencin de voto... o o La distincin entre tcnicas univariantes y multivariantes es una consecuencia de esta diso e tincin de variables. Distinguiremos entre: o 1. Las tcnicas univariantes: sern aquellas en las que solo exista una variable dependiente. e a Por ejemplo, el estudio del rendimiento acadmico (calicaciones) en funcin del nivel e o socio-econmico. o 13

14

Estad stica Descriptiva 2. Las tcnicas bivariantes: no distinguen entre variables independientes y dependientes y e su unico inters es responder a preguntas del tipo relacional, es decir si existe relacin e o entre dos variables, por ejemplo si hay dependencia entre la inteligencia y el sueldo. 3. Las tcnicas multivariantes: son aquellas en que se han medido varias variables depene dientes y se quieren estudiar simultneamente. a

Las tcnicas multivariantes son bastante ms complejas que las univariantes, sin embargo e a son fcilmente comprensibles sin necesidad de entrar en una formulacin matemtica desde el a o a aspecto practico.

2.1.2.

Conceptos Generales

Poblacin: Conjunto de individuos o elementos que poseen ciertas propiedades comunes o que se desean estudiar. Muestra: Subconjunto representativo de la poblacin en estudio, de tal manera que las o conclusiones sacadas sobre esta las extrapolaremos a la poblacin. o Variable: Propiedad, rasgo o cualidad de los elementos en estudio. Se clasican en: 1. Variables cualitativas o no mtricas: aquellas que por su forma no son medibles e numricamente. Las distintas observaciones se las clasica como modalidades. A su vez e estas se pueden descomponer en: a) Nominales o categor no son susceptibles de ordenacin. as: o b) Ordinales: se puede establecer un orden. 2. Variables cuantitativas o mtricas: las que son medibles numricamente. Se dividen e e en Intervalo o Razn. La unica diferencia entre ambas es que las de tipo razn poseen o o en la escala el cero absoluto mientras que las de intervalo no. El ejemplo t pico escala de intervalo es la temperatura en la que 0 grados cent grados no equivalen a 0. A su vez dependiendo del nmero de variables que se estudien distinguiremos entre esu tad stica unidimensional si solo se estudia una variable y estad stica multivariante si trabajamos con 2 o ms variables simultneamente. a a

2.1.3.

Etapas en la investigacin estad o stica

La investigacin estad o stica consta de cuatro grandes etapas: denicin de objetivos, recogio da de datos, descripcin y estudio de los resultados y una ultima etapa de interpretacin de o o los resultados obtenidos.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

15 Denicin de los objetivos o

Estad stica Descriptiva

El primer paso de la primera tarea es la establecer el n del estudio que se desea realizar y denir las caracter sticas que se tenga que estudiar para ese n. En segundo lugar, hemos de delimitar la poblacin en estudio y el marco (listado de o unidades). Por ultimo se elegir el mbito del estudio y la forma de recogida de la informacin. a a o Recogida de datos El primer paso de la recogida de datos ser el dise o del cuestionario. Esta labor es a n fundamental para el anlisis de los resultados, ya que un cuestionario mal diseado propora n cionar errores a la hora de analizar los resultados. En buen cuestionario tendr que cumplir: a a 1. Claridad en el lenguaje: el nivel de los encuestados puede ser muy heterogneo, por lo e que se debe usar un lenguaje accesible para cualquier persona. 2. Precisin en las preguntas: deben ser concretas y cortas con objeto de tener respuestas o precisas, evitando conceptos subjetivos. 3. Deben evitarse preguntas indiscretas que molesten al encuestado. 4. Cuidar el orden de las preguntas: las preguntas sencillas deben ser la primeras y las ms delicadas al nal, consiguindose as mayor grado de respuesta y evitando que no se a e conteste.Tambin deben agruparse las preguntas por temas o secciones similares. e Las preguntas de un cuestionario pueden agruparse de muchas maneras, una de ellas ser a en la distincin de preguntas abiertas (aquellas cuya respuesta es totalmente libre) o cerrao das (se elige entre uno o varias respuestas). El segundo paso ser el dise o muestral, es decir, los elementos o individuos sobre los a n que se realizar la investigacin (salvo que se realice en toda la poblacin). Este apartado a o o viene establecido por la Teor del Muestreo en Poblaciones Finitas (puede verse por ejemplo a Problemas de Muestreo en Poblaciones Finitas de Rueda Garc y Arcos Cebrin, Ed. Grupo a a Editorial Universitario) en donde existen un gran nmero de tipos de muestro, dentro de estos u destacamos: 1. Muestreo probabil stico: aquel en el que los elementos se eligen mediante un procedimiento matemtico, al azar y en donde todo individuo tiene una cierta probabilidad conocida a de ser elegido. Dentro de esta clase existe, por ejemplo: a) Muestreo aleatorio simple (m.a.s.) b) Muestreo con reemplazamiento c) Muestreo por conglomerados d ) Muestreo sistemtico a ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

16 e) Muestreo estraticado

Estad stica Descriptiva

2. Muestreo no probabil stico: no todos los elementos tiene probabilidad de ser elegidos o no se conoce esta. Por ultimo se estudiar la manera del tratamiento de datos y de su manipulacin y edicin a o o mediante software estad stico y validacin de los resultados. o Descripcin y estudio estad o stico Dentro del apartado estad stico se realizar un primer anlisis estad a a stico que consistir en a un estudio descriptivo bsico con un doble n, en primer lugar la proporcionar un resumen a estad stico unidimensional de cada variable estudiada y con en segundo lugar depurar los posibles errores a la hora de la edicin de los datos o el estudio de individuos anmalos. o o Posteriormente se aplicaran a los datos tcnicas estad e sticas multidimensionales como modelos de reduccin de dimensin (anlisis factorial, componentes principales o correlacin cannica) o o a o o modelos de agrupacin o clasicacin (cluster o discriminate) o modelos de regresin. La eleo o o ccin de tcnicas a tratar ser: o e a Figura 2.1: Eleccin de tcnicas segn intencin de estudio, variables y escala o e u o

Interpretacin de los resultados o Una vez realizada las tcnicas estad e sticas adecuadas a cada situacin, el ultimo paso ser el o a de realizar una interpretacin de los resultados dentro del ambito en el que nos encontremos o ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

17 (econmico, socilogo, biolgico...). o o o

Estad stica Descriptiva

2.2.

Estad stica descriptiva bsica a

Dentro de las tareas previas al anlisis estad a stico multivariante quizs la primera es un a estudio previo de los datos para conocer las diferencias entre variables y la bsqueda de tanto u valores anmalos como en el estudio de la forma de cada variable. De esta labor se encargar la o a Estad stica Descriptiva. Dentro de las tcnicas estad e sticas descriptivas podemos hacer dos grandes grupos, que sern, las tcnicas numricas (estad a e e sticos descriptivos y expresin cuantitativa de las variao bles) o tcnicas grcas. e a A continuacin recordaremos los conceptos ms importantes de la estad o a stica descriptiva.

2.2.1.

Distribucin de Frecuencias o

Cuando estudiamos una determinada variable, los datos siempre aparecen dispersos sin ningn patrn de comportamiento. Para intentar buscar estos patrones surgen las Distribuu o ciones de Frecuencias. El objetivo de la distribucin de frecuencias es representar en forma de o tabla todos los distintos valores que tome la variable que se estudia con su frecuencia (nmero u o porcentaje de veces que aparece). A el par formado por cada valor de la variable con su frecuencia se le denomina distribucin de frecuencias. o Aplicacin en SPSS o Por ejemplo obtendremos la tabla de frecuencias para las variables Sexo y Edad del chero de datos del tema anterior. Para obtener una tabla de frecuencias solo tendremos que seleccionar los mens: u Analizar Estad sticos Descriptivos Frecuencias En la ventana del men elegiremos las variables en las que estamos interesados u Figura 2.2: Tabla de frecuencias

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

18

Estad stica Descriptiva

Y sealaremos la pestaa de Mostrar Tablas de Frecuencias. Obteniendo los siguientes n n resultados: Figura 2.3: Tabla de frecuencias2

Donde podemos ver que en nuestros datos existen cinco hombres y cinco mujeres (50 % de cada uno) o que un 20 % tienen 21 aos, otro 20 % 25 y un 30 % 26 aos. n n Por lo tanto la tabla de frecuencias resumir de manera importante los datos originales. a

2.2.2.

Expresin Cuantitativa de una variable o

Medidas de Posicin o Son medidas que sintetizan las distribuciones de frecuencias. En vez de manejar todos los datos elegimos algn valor numrico que sea representativo y resumen de todos los valores de u e la variable. Estos valores se considerarn buenos, representativamente hablando, si la distribucin de a o frecuencias cumplen ciertas propiedades, pudiendo evidentemente ser ms o menos represena tativos. Los ms importantes son: a 1. De posicin central: media( Xi /n), mediana (valor que parte a la distribucin en dos o o partes iguales), moda (valor ms repetido). a 2. Percentiles: cuantiles o momentos. Medidas de dispersin o Estas medidas nos dan la representatividad de las medidas de posicin o dicho de otra o forma, la separacin (variabilidad) de los valores de la variable en estudio. Su utilidad es la de o indicar como de buenas son las medidas de posicin central para representar una variable. En o general es interesante que las variables tengan poca variabilidad o dispersin. o Destacamos como medidas ms importantes: a ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

19 1. Medidas absolutas: recorrido (intercuart lico), rango... 2. Medidas relativas: desviacin t o pica y varianza.

Estad stica Descriptiva

Tambin es muy interesante el Coeciente de Variacin ya que esta medida es la unica que e o permite comparar la variabilidad entre dos variables que estn medidas en diferentes escalas. a Medidas de forma Estas medidas nos indicarn numricamente el comportamiento global de los datos y estn a e a basadas en la representacin grca de las variables, de tal manera que compararn los valores o a a de la distribucin con otros tericos. Existen dos tipos: o o 1. Medidas de asimetr Diremos que una distribucin es simtrica si tiene tantos valores a a: o e un lado como a otro del eje marcado por el punto x. La principal medida es el coeciente de asimetr de Fisher, si este coeciente es mayor que cero ser asimtrica a la derecha, a a e si es menos que cero ser asimtrica a la izquierda y si es igual a cero ser simtrica. a e a e 2. Medidas de apuntamiento: indica si la variable tiene ms valores altos que bajos (en a sentido del eje de las Y). El estad stico de medida es el coeciente de curtosis, de tal forma que si este coeciente es mayor de cero ser apuntada hacia arriba y si es menor a que cero ser apuntada hacia abajo (plana). a Aplicacin en SPSS o Vamos a calcular todos los estad sticos descriptivos unicamente en la variable Edad. Para ello seleccionaremos los mismos mens que en el caso anterior (men Descriptivos y Frecuenu u cias) y pulsaremos el Botn Estad o sticos. En la ventana que nos aparece seleccionar amos los estad sticos que nos interesar an, en este caso todos. Figura 2.4: Estad sticos

Vemos que la media es 24,30, frente a la mediana y la moda que son 25 y 26. Vemos que la varianza es de 4.9 y otras medidas de dispersin pueden ser el Rango que es 6. Tambin o e aparecen los percentiles, que son por ejemplo, el percentil 20 es 21.20, es decir, 21.20 es el 20 % de la distribucin o que el valor 26.90 acumula el 90 % de la distribucin. Los estad o o sticos descriptivos completos para la variable Edad sern: a

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

20

Estad stica Descriptiva

Figura 2.5: Estad sticos

2.3.

Representaciones Grcas a

El uso de los estad sticos descriptivos mencionados en el apartado anterior son validos para hacernos una idea global de la distribucin pero no nos describen de forma detallada la o distribucin. La metodolog ms extendida para ello es mediante las representaciones grcas. o a a a A continuacin iremos describiendo los grcos ms comunes as como su obtencin meo a a o diante SPSS. Es importante destacar que en SPSS podemos obtener los mismos grcos desde a diferentes mens y adems existe un men desplegable exclusivo para representaciones grcas u a u a que es el Men Grcos. u a

2.3.1.

Diagrama de Barras

Este grco consiste en representar la Distribucin de Frecuencias, es decir los distintos a o valores que toma la variable y su frecuencia. Esta frecuencia puede ir en valores relativos o en porcentaje y tambin acumulando los resultados. Por lo tanto con estos grcos podremos ver e a la forma de la variable entera. Aplicacin en SPSS o En SPSS elegiremos los mens: u Grcos a Barras Simple A continuacin en este men tendremos que seleccionar la variable que queremos gracar, por o u ejemplo, si queremos ver la distribucin de frecuencias de la variable Edad, introducimos en o Eje de Categoras la variable a analizar (Edad ) y por ejemplo en porcentaje:

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

21

Estad stica Descriptiva

Figura 2.6: Ventana grcos categor a as

En este caso nuestro en nuestro grco ver a amos que el 20 % tiene 21 aos y otro 20 % 25, n que un 10 % tiene 22, 24 y 27 aos y que el 30 % tiene 26 aos. n n Figura 2.7: Diagrama de frecuencias

Existen muchas circunstancias en que se necesitan los diagramas de barras pero agrupando por categor de otra variable, en este caso el procedimiento es el mismo solo que hemos de as elegir Grcos de Barras Agrupado, en este caso la ventana del anlisis ser la misma solo a a a que hemos de indicar la variable que Dena los grupos. Por ejemplo si quisiramos obtener el e diagrama de barras para la variable Edad pero distinguiendo por sexo, en este caso, tomar amos como variable que dena los grupos la variable Sexo y obtendr amos el grco: a

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

22

Estad stica Descriptiva

Figura 2.8: Diagrama de frecuencias por categor as

En donde obtenemos la distribucin de frecuencias pero diferenciando por sexos, por ejemo plo, hay 2 mujeres con edad de 26 aos y solo un hombre o hay dos hombres con 21 aos y n n ninguna mujer con esa edad. Una extensin de estos grcos son los Diagramas de L o a neas, que simplemente lo que hacen es unir los puntos medios cada uno da las barras en del diagrama de barras mediante rectas.

2.3.2.

Diagramas de sectores

Este tipo de diagramas son la representacin de la distribucin de frecuencias solo que o o sobre una circunferencia, de tal manera que cada modalidad de la variable ocupar una parte a proporcional a su frecuencia en el circulo. Aplicacin en SPSS o Para obtener esta representacin realizamos: o Grcos a Sectores Resmenes para grupos de casos u Una vez seleccionado este men hemos de seleccionar la variable que nos dena los sectores, u por lo que, por ejemplo, seleccionaremos en Denir sectores por la variable Edad, obteniendo el siguiente grco: a

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

23

Estad stica Descriptiva

Figura 2.9: Diagrama de sectores

2.3.3.

Diagrama de Dispersin o

Los diagramas de dispersin son las representaciones de las variables en dos o tres dimeno siones. Aplicacin en SPSS o Los pasos sern: a Grcos a Dispersin/puntos o Elegir si es 2D(dispersin simple) o 3D (Dispersion 3D) o Posteriormente, simplemente introduciremos las variables a representar en cada uno de los ejes. Por ejemplo, seleccionaremos Dispersin simple y en Eje X la variable Notamedia y en o Eje Y la variable Edad. En el siguiente grco vemos el ventana del anlisis correspondiente a a y el grco esperado. a Figura 2.10: Grco de dispersin a o

2.3.4.

Grcos probabil a sticos

Los grcos probabil a sticos son los usados para ver si una variable sigue una determinada distribucin (casi siempre la normal) o no. o ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

24

Estad stica Descriptiva

Existen dos tipos de grcos probabil a sticos, los PP (percentil-percentil) y los QQ (cuartilcuartil). La metodolog es comparar los percentiles (o cuartiles) de nuestra variable de datos a frente a los percentiles (o cuartiles) de la variable que se terica que se quiere estudiar. o La normalidad de los datos ser perfecta cuando la representacin de los datos coincida a o con la diagonal que representa los percentiles de la distribucin en estudio, de tal manera que o cuanto ms se diferencien peor sera el ajuste. a

Aplicacin en SPSS o Para obtenerlos realizaremos los siguientes pasos: Grcos a PP (o QQ) Y en la ventana de anlisis hemos de indicar la variable a estudiar, la distribucin que a o queremos contrastar (Edad para este ejemplo) y algunas trasformaciones que se pueden hacer a los datos. Figura 2.11: Grcos P-P a

En nuestro caso podemos ver que los datos no se aproximan en exceso.

2.4.

Anlisis Exploratorio y Datos At a picos

Las tcnicas de anlisis exploratorio son un conjunto de tcnicas estad e a e sticas (grcas y a numricas) que se utilizan para detectar posibles anomal en las observaciones. Estos mtoe as e dos son muy utiles para la bsqueda de posibles datos at u picos (tambin llamados outliers), e entendindose como tal a observaciones con diferencias signicativas en su comportamiento con e respecto a la variable en general. Estos datos at picos deben ser estudiados en cada situacin o y analizar su tratamiento ya que existen tres tipos de datos at picos: ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

25

Estad stica Descriptiva 1. Los que surgen por un error en el procesamiento de la poblacin. Deben eliminarse, o tomarse como ausentes o volver a estudiar ese individuo. 2. Observacin que ocurre como consecuencia de un acontecimiento extraordinario, es decir, o existe una explicacin para este dato anmalo. El investigador debe decidir que hacer o o con este individuo. 3. Observaciones extraordinarias para las que no existe explicacin. Se omiten. o A continuacin estudiaremos las tcnicas ms importantes del anlisis exploratorio. o e a a

2.4.1.

Estad sticos

Estad sticos Descriptivos En primer lugar estudiaremos los estad sticos descriptivos (estudiados en el apartado 2.2.2) de tal manera que observaremos que los estad sticos centrales pertenezcan al intervalo de variacin de la variable y observaremos la distribucin de frecuencias de tal manera que seo o leccionaremos como casos at picos aquellos valores que se salen del rango. Tambin se pueden e estudiar los valores tipicados de la variable (ver 2.7). Estimadores robustos centrales Los estimadores robustos centrales son una serie de estad sticos basados en la mediana que se ven poco afectados por las observaciones at picas. Generalmente deben ser muy parecidos.

2.4.2.

Mtodos Grcos e a

Dentro de los mtodos grcos destacan el diagrama de tallos y hojas, los diagramas de caja e a con bigotes, los grcos probabil a sticos (ya estudiados) y las representaciones bidimensionales. Diagrama de tallos y hojas Es un procedimiento que permite representar toda la informacin para variables cuantitatio vas y es muy util cuando el nmero total de individuos es menor de 50. Este es una combinacin u o del diagrama de barras y la tabla de frecuencias aunque ms informativo que ambos ya que a muestra el rango de los datos, la simetr y la presencia de datos at a picos. Grco de Caja con bigotes a Este grco permite analizar y resumir la informacin de un conjunto de datos, permitiendo a o estudiar la simetr detectar valores at a, picos y descubrir el ajuste de distribuciones. El grco divide los datos en cuatro areas de igual frecuencia, con una caja dividida en dos a areas por una l nea vertical (la mediana) y otras dos areas representadas por los bigotes. La caja central encierra el 50 % de los datos y si la linea central no esta en el centro no existe simetr En los lados verticales de la caja se representa el primer y tercer cuartil. Se consideran a. ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

26

Estad stica Descriptiva

valores at picos a aquellos que se encuentran fuera de la representacin de la caja y los bigotes. o A continuacin vemos un ejemplo de un diagrama de caja con un dato at o pico. Figura 2.12: Diagrama de caja

Un vez detectado este dato habr que estudiarlo para analizar que se hace con el. a Diagramas de dispersin o Una vez analizado el aspecto univariante habr que entrar en el aspecto bivariante y a multivariante para evaluar conjuntamente la variacin de varias variables (por ejemplo un o individuo muy alto con muy poco peso). Para ello recurrir amos a los grcos de dispersin. a o Aplicacin en SPSS o Para la bsqueda de datos at u picos existe una opcin muy completa en SPSS que es el o men Explorar. Este men adems proporciona dos opciones muy utiles en todo anlisis esu u a a tad stico. Para selecciona el men Explorar tendremos que: u Analizar Estad sticos descriptivos Explorar Vamos a analizar la variable Notamedia y despus la variable Notamedia segn una variable e u de agrupacin. Para ello seleccionamos el men anterior y seleccionamos en Variable Dependio u ente la variable Notamedia. En primer lugar nos vamos a centrar en los estad sticos y luego en los grcos. Por esto a pulsamos el botn Estad o sticos y seleccionamos: 1. Descriptivos: con esta opcin nos muestra los estad o sticos ms comunes tanto de posicin a o como de dispersin. o

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

27

Estad stica Descriptiva 2. Estimadores robustos: Alternativas robustas a la mediana y a la media muestral para estimar el centro de la localizacin o 3. Valores at picos: Muestra los cinco valores mayores y los cinco menores. 4. Percentiles.

Figura 2.13: Explorar: estad sticos

Si analizamos los resultados, podemos ver que existe un valor de 12 para la nota media, por lo que, encontrar amos un primer datos at pico, ya que la variable nota no puede ser mayor de 10. A partir de aqu tendr amos que decir que hacer, podr amos volver a estudiar el individuo y ver cual es el verdadero valor, eliminar ese dato o eliminar a el individuo entero. En nuestro caso vamos a suponer que lo hemos estudiado y que el verdadero valor es 10, por lo que ir amos a nuestro chero de datos y lo reemplazar amos. Este misma conclusion la obtendr amos al analizar los valores extremos y ver que el valor mximo es de 12, el cual no pertenece al rango posible de valores. a Si en vez de seleccionar la opcin Estad o sticos, obtenemos los grcos, observamos en el a grco de tallos y hojas el valor 12 como anmalo. Sin embargo en el diagrama de caja con a o bigotes no observamos valores anmalos, ya que el valor 12 aunque imposible no esta en deo sacuerdo con el rango de valores de la variable. Si por ejemplo, introducimos en el chero de datos otro individuo con nota de 18, en este caso si nos sale reejado en el grco, ya que este a valor si estar en desacuerdo con el resto de valores. a Adems en el men Explorar podemos calcular los grcos probabil a u a stico normales en la opcin Grcos. o a Dentro de este men es muy interesante la opcin de introducir una variable de Factor, u o con la cual podemos hacer las mismas opciones que antes, solo que separando los clculo para a cada una de las modalidades de la variable Factor. Por ejemplo, si introducimos en Factor la variable Sexo obtendremos todos los resultados estad sticos y grcos pero separando para a hombres y mujeres.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

28

Estad stica Descriptiva

Figura 2.14: Explorar: caja con bigotes y tallos y hojas

Al calcular los estad sticos para ambos sexos, podemos ver que sigue habiendo un dato at pico (notamedia 12) para los hombres. Si observamos el diagrama de caja con bigotes separado por sexos nos damos cuenta que la variable Notamedia para hombres tiene ms dispersin a o (tambin lo observamos en la varianza) e Figura 2.15: Explorar: caja con bigotes por sexo

En muchas tcnicas estad e sticas se exigen, a priori, que las variables cumplan dos condiciones: 1. Normalidad: que las variables sean normales 2. Homocedasticidad: que las variables tenga para cada grupo igual varianza. Estas dos hiptesis son contrastables desde el men Explorar. Si seleccionamos la opcin o u o Grcos, tendremos la opcin de seleccionar Grcos con prueba de normalidad, resultando a o a los grcos QQ probabil a sticos (ya estudiados) con los que podr amos contrastar la normalidad. Tambin se obtiene un mtodo numrico para la resolucin del contraste de hiptesis de e e e o o normalidad (en la seccin 2.6 se explicar que es y como se resuelve un contraste de hiptesis) o a o por la metodolog de Shapiro-Wilks. a

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

29

Estad stica Descriptiva

Si adems seleccionamos la Dispersin por nivel con la prueba de Levene, SPSS realiza el a o contraste de hiptesis de igualdad de varianzas entre subgrupos, tomando nosotros el contraste o de Levene para la media. Figura 2.16: Explorar: contraste de normalidad y homogeneidad

2.5.

Datos perdidos

Cuando se realiza un estudio estad stico, sobre todo cuando se analiza un cuestionario, es muy comn tener datos faltantes, es decir, que el valor de algn individuo para alguna vau u riable no lo tengamos. Esta situacin puede ocurrir por diferentes motivos, por ejemplo existen o un tipo de preguntas de tipo pol tico, religioso o sexual que en muchas casos el entrevistado no esta dispuesto o no quiere responder. Tambin es frecuente que existan preguntas que no e afecten a todos los individuos, por ejemplo, si se pregunta sobre el hbito de fumar, los no a fumadores no contestarn a algunas preguntas. En todas estas circunstancias tendremos datos a faltantes. En esta situacin se suele realizar alguna de las siguientes opciones: o 1. Ignorar el valor: esta es la opcin ms comn. Si se realiza un anlisis univariante, el o a u a procedimiento no var simplemente tendremos n-(numero de datos faltantes) de india, viduos. El problema estar si se realiza algn tipo de anlisis bivariante o multivariante, a u a en este caso se elimina no el valor faltante, sino el individuo. 2. Sustituir el dato faltante: la otra opcin comn es sustituir el valor perdido por algn o u u valor que consideremos representativo. Por eso se suele sustituir los valores perdidos por la media de la variable. 3. Estudio del individuo: se volver a los cuestionarios, ya que el valor perdido puede venir a ocasionado por la mala implementacin de los cuestionarios e incluso se podr intentar o a volver a entrevistar al individuo en cuestin. o

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

30

Estad stica Descriptiva

2.6.

Contraste de hiptesis o

Un contraste de hiptesis es un procedimiento estad o stico mediante el cul se decide entre a dos hiptesis distintas. A la hiptesis que queremos comprobar se le denomina hiptesis nula y o o o se denota H0 y a la hiptesis contraria a la que queremos contrastar se le denomina hiptesis o o alternativa H1 . El contraste de hiptesis dar un procedimientos basado en las observaciones para decidir o a entre H0 o H1 . De tal manera que se rechazar la hiptesis nula para aceptar la alternativa si a o p valor(o signicacin) < o siendo el p-valor el nivel m nimo al cual se acepta H0 y el nivel al que ese realiza el contraste. El p-valor nos lo dar el contraste y el nivel lo jar el investigador a priori, siendo a a generalmente = 0,05 (contraste al 95 %). Por ejemplo, en los contraste de hiptesis (de normalidad y homocedasticidad) que hemos o realizado anteriormente (ver grco 2.16), ocurrir: a a 1. Contraste de Normalidad: en este caso la hiptesis nula es la normalidad de cada una de o las poblaciones. En el caso de las mujeres obtenemos un p-valor de 0.814>0.05, y para los hombres 0.701>0.05, por lo que en ambos casos aceptamos la normalidad. 2. Contraste de homogeneidad de varianzas: la hiptesis nula ser la igual de varianzas o a frente a la desigualdad. Vemos que el p-valor es de 0.012<0.05, por lo que rechazamos la hiptesis nula para aceptar la alternativa. Esta conclusin tambin la podemos ver en o o e las varianzas de cada poblacin, ya que la varianza de las mujeres es de 1.3 frente a 20.30 o en el caso de los hombres, por lo que evidentemente son distintas.

2.7.

Estadarizacin de las variables o

En muchas ocasiones, los datos son ms fciles de comprender cuando se estandarizan, de a a modo que se midan en unidades comparables. Esto suele hacerse mediante la eliminacin de o las unidades de medicin, de la forma: o xi i = 1, 2, . . . , N de tal manera que a la nueva variable Z se le llama variable estadarizada. Zi = Es recomendable realizar este procedimiento cuando las variables estn medidas en unidades a diferentes. Para estandarizar una variable hemos de seleccionar los mens: u Analizar Estad sticos Descriptivos Descriptivos ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

31

Estad stica Descriptiva

y en esta ventana sealar la opcin de Guardar valores tipicados como variables. n o

Figura 2.17: Tipicacin de variables o

Es interesante destacar, que generalmente, se suelen tomar como datos at picos, los que producen un valor estandarizado fuera del intervalo [-2,2].

2.8.
2.8.1.

Ejercicios obligatorios
Ejercicio primero

Se miden para 109 pa del mundo una serie de variables de tipo socioeconmico como ses o son: Poblacin, Esperanza de Vida Masculina y Femenina, Mortalidad Infantil, el PIB y la o Regin Econmica a la que pertenecen, junto con una variable de identicacin del Pa Los o o o s. datos estn en un chero llamado Ejercicio1. Se pide: a 1. Abrir el chero de datos. 2. Estudiar descriptivamente la variable Mortalidad Infantil y Esperanza de Vida Masculina. Qu porcentaje de pa tiene una esperanza de vida masculina menor de 50 aos? e ses n Y entre 50 y 70? Y por encima de 70? Cuantos pa tiene una mortalidad infantil ses mayor de 100 por cada 1000?, Y menor de 10? 3. Seleccionar solo los pa que pertenezcan a la regin OCDE. Enumerar los pa que ses o ses se seleccionan.(A partir de aqu se trabajar solo con estos pa a ses). a) Realizar un estudio descriptivo de las variables PIB, Poblacin y Esperanza de Vida o Femenina. Este estudio incluir los aspectos grcos y estad a a sticos y la bsqueda de u valores at picos. Si existen valores at picos explicar que actitud se adopta en cada situacin y modicar los valores si fuese necesario. o b) Contrastar la normalidad por mtodos grcos y numricos de la variable Esperanza e a e de Vida Masculina y Femenina. c) Crear una nueva variable de grupo (se llamar PIB2) de tal manera que tome el a valor 1 para los pa con PIB menor de 15000$, el valor 2 entre 15000$ y 18000$ y ses 3 a los superiores. Obtener un diagrama de barras y sectores de esta nueva variable.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

32

Estad stica Descriptiva d ) Realizar un estudio descriptivo de las variables Esperanza de Vida Masculina y Femenina segn los grupos marcados por la variable PIB2. Tienen estas variables u la misma varianza para cada subgrupo?.

2.8.2.

Ejercicio segundo

El chero Encuesta, fue pasado a los estudiantes del Instituto de Alhama de Granada con la intencin de estudiar patrones de comportamiento en el Plan de Prevencin de Drogodepeno o dencias del Ayuntamiento de Alhama. El chero contiene 6 variables: Sexo, Edad, Relacin o con los amigos, Relacin con la Familia, Consumo de Tabaco y Alcohol. Se pide: o 1. Buscar posibles datos at picos en las variables Sexo y Edad. 2. Realizar un estudio descriptivo (numrico y grco) para la variable Edad. e a 3. Realizar un estudio descriptivo (grco) de las variables Consumo de Alcohol y Consumo a de tabaco. 4. Repetir el apartado anterior pero particularizando por la variable Sexo. 5. Realizar un estudio descriptivo de la variable Consumo de drogas, para aquellos individuos que reconozcan tener una relaciones familiares malas o muy malas. Comentar los resultados desde un punto de vista sociolgico. o

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Você também pode gostar