Você está na página 1de 49

Tema 5: Anlisis de la informacin

Asignatura: Investigacin de Mercados I Titulacin: Grado de Marketing

CONTENIDOS DEL TEMA


1. 2. 3. 4. 5. Introduccin. Clasificacin de las tcnicas de anlisis de datos. Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

Trespalacios Gutirrez, J.A.; Vzquez Casielles, R.; y Bello Acebrn, L. (2005): Investigacin de mercados. Mtodos de recogida y anlisis de la informacin para la toma de decisiones en marketing. Editorial Thomson.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

INTRODUCCIN Una organizacin requiere de un flujo continuo da datos para competir


con xito en el mundo actual. Los datos, una vez convertidos en informacin relevante para la empresa, adquieren una vital importancia. La direccin de una organizacin debe adoptar decisiones, en la mayora de los casos, en un ambiente de incertidumbre. El papel que juega la informacin es reducir esa incertidumbre y orientar la toma de decisin.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

INTRODUCCIN El anlisis de datos es la actividad que transforma, mediante tcnicas y


mtodos estadsticos, los datos recogidos en una investigacin comercial en informacin relevante, que apoye la adopcin de decisiones y se pueda alcanzar los objetivos previamente establecidos (Kinnear y Taylor, 1998). La creciente necesidad de informacin por parte de las organizaciones, junto al desarrollo y abaratamiento de los equipos informticos y del software estadstico, ha facilitado una mayor utilizacin de las tcnicas de anlisis de datos.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

Para identificar la tcnica INTRODUCCIN

de anlisis apropiada a emplear sobre un conjunto de datos recogidos en una investigacin, hay que contestar a las siguientes preguntas :
Cuntas variables van a analizarse simultneamente?
ANLISIS UNIVARIABLE: Si se analiza una sola variable. ANLISIS BIVARIANTE: Si se analizan dos variables. ANLISIS MULTIVARIANTE: Si se analizan ms de dos variables.

Qu objetivo se pretende?

ANLISIS DESCRIPTIVO: Proporciona una descripcin de los datos. ANLISIS INFERENCIAL: Permite generalizar a una poblacin objetivo, los resultados alcanzados en una muestra

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

INTRODUCCIN El anlisis estadstico univariable contiene un conjunto de tcnicas


que estudian la medida y el comportamiento de una sola variable, analizando, por tanto, las variables de forma independiente.

Por un lado permite describir y evaluar las propiedades de la distribucin de una variable

Su objetivo es doble

Por otro lado permite la preparacin del anlisis bivariable y multivariable.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

Por ejemplo, si se quisiera conocer cmo se distribuyen los INTRODUCCIN alumnos matriculados en una asignatura en el grupo de la

maana y de la tarde, sera suficiente con calcular las frecuencias de alumnos de cada grupo.
Sin embargo, en otras situaciones el anlisis univariable es el antecesor del anlisis multivariable. Utilizando el mismo ejemplo anterior, se podra preguntar qu factores determinan que las mujeres se matriculen preferentemente en el grupo de la maana o qu causa que en el grupo de la tarde existan personas de mayor edad que en el de la maana. Para responder a estas preguntas se necesitaran modelos de anlisis ms completos que los incluidos en el univariable, pero ste se convierte en el necesario primer paso para la correcta aplicacin de dichos modelos.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

ANLISIS DE FRECUENCIAS INTRODUCCIN


La frecuencia es el nmero de veces que se repite un determinado valor de la variable. Se pueden distinguir los siguientes cuatro tipos de frecuencias: Frecuencia absoluta (ni): Es el nmero de veces que aparece un valor. La suma total de todas las frecuencias absolutas proporciona el tamao del conjunto de datos observados (N). Frecuencia relativa (fi): Es el cociente entre la frecuencia absoluta y el tamao del conjunto de datos observados. Su frmula es la siguiente:

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

ANLISIS DE FRECUENCIAS INTRODUCCIN

Si se multiplica la frecuencia relativa por 100, se consigue el tanto por ciento (pi) que posee un valor sobre el total de N.
Frecuencia absoluta acumulada (Ni): Es el nmero de veces (ni) en el conjunto de datos observados N con un valor igual o menor al dato u observacin que se trate. La ltima frecuencia absoluta acumulada es igual a N. Frecuencia relativa acumulada (Fi): Es el cociente entre la frecuencia absoluta acumulada y el nmero total de datos observados (N). Si se multiplica por 100, se alcanza el porcentaje acumulado (Pi)), que debe ser al final el 100% de N. Su frmula es la siguiente:

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

ANLISIS DE FRECUENCIAS INTRODUCCIN


Se pretende conocer la tabla de frecuencias de una poblacin de diez individuos a los cuales se les preguntan el nmero de bolgrafos que disponen. Las contestaciones son 3, 3, 2, 4, 3, 5, 6, 4, 7, 4, respectivamente. La tabla de frecuencia es la siguiente:

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

ANLISIS DE FRECUENCIAS INTRODUCCIN


Los datos de una tabla de frecuencia se pueden representar en un grfico de barras, un grfico de sectores o un histograma. Grfico de barras: Es un diagrama con barras rectangulares de longitudes proporcional al de los valores que representan.

Los grficos de barras son usados para comparar dos o ms valores.


Las barras pueden estar orientadas horizontal o verticalmente.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

ANLISIS DE FRECUENCIAS INTRODUCCIN


Grfico de sectores: Tambin conocido como grfico de tartas"; se divide un crculo en tantas porciones como clases tenga la variable. A cada clase le corresponde una porcin proporcional a su frecuencia absoluta o relativa.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

ANLISIS DE FRECUENCIAS INTRODUCCIN


Histograma: Es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente sealando las marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los datos. Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE TENDENCIA CENTRAL INTRODUCCIN


Las medidas que representan un valor tpico en un conjunto de datos se denominan medidas de tendencia central. Entre las medidas de tendencia central se dispone de las siguientes: La Media aritmtica: Se calcula sumando los datos u observaciones y dividiendo esta suma por el nmero de datos u observaciones que haya en el grupo. Su frmula es la siguiente:

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE TENDENCIA CENTRAL INTRODUCCIN


Ejemplo: Se pretende conocer la media aritmtica de una poblacin de cuatro individuos a los cuales se les preguntan el nmero de bolgrafos que disponen. Las contestaciones son 3, 1, 4 y 9, respectivamente.

Pasos que son interesantes seguir:


1.- Se suman los datos; 3+1+4+9=17 2.- Se divide esta suma por el nmero de las observaciones (4); 17/4=4,25 bolgrafos por persona.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE TENDENCIA CENTRAL INTRODUCCIN


La Mediana: Es el valor de la variable que deja idntico nmero de datos antes y despus que l. El conjunto de datos menores o iguales que la mediana son el 50% de ellos y los que son mayores representan el otro 50% del total de datos. La mediana de un grupo de datos es nica y, adems, no es sensible a la existencia de datos atpicos o extremos. Su frmula matemtica es la siguiente:
Si el nmero de datos es impar.

Si el nmero de datos es par.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE TENDENCIA CENTRAL INTRODUCCIN

Ejemplo: Suponiendo que los datos hubieran sido 3, 1, 4, 9 y 5, el proceso sera el siguiente:
1.- Se ordenan los datos; 1, 3, 4, 5, 9. 2.- Al ser el nmero de datos impar, se aplica la frmula correspondiente

(5 + 1)/2 = 3

3.- La mediana corresponde con el dato 3; es la observacin 4 bolgrafos.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE TENDENCIA CENTRAL INTRODUCCIN


Ejemplo: Se pretende conocer la mediana de una poblacin de cuatro individuos a los cuales se les preguntan el nmero de bolgrafos que disponen. Las contestaciones son 3, 1, 4 y 9, respectivamente. Pasos que son interesantes seguir: 1.- Se ordenan los datos; 1, 3, 4, 9. 2.- Al ser el nmero de datos par, se aplica la frmula correspondiente

[ (4/2 ) + ((4/2) +1) ] / 2 = 2,5

3.- La mediana corresponde con el dato 2,5; es la observacin que est comprendida entre 3 y 4 bolgrafos.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE TENDENCIA CENTRAL INTRODUCCIN


La Moda: Es el valor que cuenta con una mayor frecuencia en un conjunto de datos; es el valor que ms aparece o ms se repite.
Ejemplo: Se pretende conocer la moda de una poblacin de cuatro individuos a los cuales se les preguntan el nmero de bolgrafos que disponen. Las contestaciones son 3, 1, 3, 4 y 9, respectivamente.

La moda es 3 bolgrafos (se repite dos veces ms que las otras contestaciones-).

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE POSICIN INTRODUCCIN


Los cuantiles dividen la distribucin de una variable en partes iguales, es decir dividen un grupo de datos en conjuntos con el mismo nmero de individuos. Para obtenerlas es necesario que los datos estn ordenados de menor a mayor. Las medidas de posicin son las siguientes:

Cuartiles: dividen la serie de datos en cuatro partes iguales.


Deciles: desagregan la serie de datos en diez partes iguales.

Percentiles: fraccionan la serie de datos en cien partes iguales.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE DISPERSIN INTRODUCCIN


Las medidas de dispersin sealan la variabilidad de una distribucin, mostrando mediante un nmero si las diversas puntuaciones de una variable estn o no muy alejadas de la medida de tendencia central. Si este valor es muy alto, ms alta es la variabilidad. Si es bajo, ms homogneos son los datos y la medida de tendencia central. Para el clculo de la dispersin, se utilizan (entre otros), los siguientes mtodos: Rango estadstico: Es la diferencia existente entre el valor mnimo y el valor mximo en un conjunto de datos.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE DISPERSIN INTRODUCCIN


Ejemplo: se pretende conocer el rango de una poblacin de cuatro individuos a los cuales se les preguntan el nmero de bolgrafos que disponen. Las contestaciones son 3, 1, 4 y 9, respectivamente. Pasos que son interesantes seguir:

1.- Se ordenan los datos; 1, 3, 4, 9.


2.- Se resta el valor mnimo del mximo; 9-1=8. El rango es, por tanto, de 8 bolgrafos.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE DISPERSIN INTRODUCCIN


Varianza: mide la dispersin de un conjunto de datos con relacin a su media. Siempre es positiva (mayor o igual a cero). Mientras ms alejada de cero, ms dispersin. Su frmula es la siguiente:

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE DISPERSIN INTRODUCCIN


Ejemplo: Se pretende conocer la varianza de una poblacin de cuatro individuos a los cuales se les preguntan el nmero de bolgrafos que disponen. Las contestaciones son 3, 1, 4 y 9, respectivamente. Pasos que son interesantes seguir: 1.- Se calcula la media aritmtica de los datos;

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE DISPERSIN INTRODUCCIN


2.- Se resta cada dato de la media y se eleva al cuadrado;

3.- Se suman estos resultados y se dividen por 4 (N); 2.- Se resta cada dato de la media y se eleva al cuadrado;

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE DISPERSIN INTRODUCCIN


Desviacin tpica: La varianza, puesto que se mide en unidades al cuadrado, no se suele interpretar correctamente. Para solventar esta dificultad, se calcula la desviacin tpica, que es la raz cuadrada positiva de la varianza. Indica la dispersin de los datos respecto a la media; mientras mayor sea su valor, ms dispersos estn los datos. Su frmula es la siguiente:

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE DISPERSIN INTRODUCCIN


Ejemplo: Se pretende conocer la desviacin tpica de una poblacin de cuatro individuos a los cuales se les preguntan el nmero de bolgrafos que disponen. Las contestaciones son 3, 1, 4 y 9, respectivamente. Pasos que son interesantes seguir: 1.- Se calcula la media aritmtica de los datos;

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE DISPERSIN INTRODUCCIN


2.- Se resta cada dato de la media y se eleva al cuadrado;

3.- Se suman estos resultados, se dividen por 4 (N) y se halla la raz 2.- Se resta cada dato de la media y se eleva al cuadrado; cuadrada;

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE DISPERSIN INTRODUCCIN


Coeficiente de variacin de Pearson: la desviacin tpica sirve para medir de forma eficaz la dispersin de un conjunto de datos entorno a su media. Desgraciadamente esta medida puede resultar engaosa cuando se trata de comparar la dispersin de dos conjuntos de datos.

As, por ejemplo, si se tienen dos grupos de mujeres de 11 y 25 aos con medias y desviaciones tpicas dadas por la tabla anterior, puede parecer, al observar en ambos grupos una desviacin tpica igual, que los grupos de datos tienen la misma dispersin. No obstante, como parece lgico, no es lo mismo una variacin de dos kilos en un grupo de elefantes que en uno de conejos.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE DISPERSIN INTRODUCCIN


El coeficiente de Variacin de Pearson elimina esa posible confusin al ser una medida de la variacin de los datos pero en relacin con su media. Su frmula es la siguiente:

Si el CVP < 30 %, entonces la media resume adecuadamente los datos analizados.


Si el CVP > 70 %, la media no resume correctamente los datos que aglutina. Entre el 30 % y 70 %, depende de los datos y del investigador.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE DISPERSIN INTRODUCCIN


Ejemplo: Se pretende conocer el coeficiente de variacin de la media de una poblacin de cuatro individuos a los cuales se les preguntan el nmero de bolgrafos que disponen. Las contestaciones son 3, 1, 4 y 9, respectivamente. Pasos que son interesantes seguir: 1.- Se calcula la media aritmtica de los datos;

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE DISPERSIN INTRODUCCIN


2.- Se resta cada dato de la media y se eleva al cuadrado;

3.- Se suman estos resultados, se dividen por 4 (N) y se halla la raz 2.- Se resta cada dato de la media y se eleva al cuadrado; cuadrada;

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

MEDIDAS DE DISPERSIN INTRODUCCIN


4.- Se calcula el coeficiente de variacin de Pearson;

5.- Aunque est por debajo del 70%, por la cercana del resultado al 2.-anterior Se resta cada dato de la media se eleva al cuadrado; valor, habra que y manifestar que la media no resume adecuadamente los valores que aglutina.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

ESTUDIO DE LA NORMALIDAD INTRODUCCIN


La distribucin normal es una distribucin continua de simetra y con forma de campana. Su valor se debe esencialmente a la asiduidad con la que diferentes variables asociadas a fenmenos naturales y diarios adoptan, aproximadamente, esta distribucin. Para llevar a cabo un anlisis multivariante, en la mayora de los casos han de cumplirse una serie de supuestos bsicos; siendo uno de los ms frecuentes la normalidad de la distribucin de la variable.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

ESTUDIO DE LA NORMALIDAD INTRODUCCIN


Sin embargo, en algunos casos, las distribuciones de determinadas variables necesarias en los anlisis, se apartan de este ideal. Las desviaciones acentuadas de la normalidad pueden crear resultados que sean gravemente engaosos. Cuando esto sucede es posible que la variable (y su distribucin) sea transformada, para que se parezca a una variable que siga una distribucin normal, modificando sus valores. Tambin, se podra descartar la variable de diversos mtodos de anlisis de dato debido a su forma. En circunstancias extremas, la variable debe ser desechada de la totalidad del anlisis. A continuacin se realiza una aproximacin de los distintos mtodos disponibles para el estudio de la normalidad de una distribucin.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

ESTUDIO DE LA NORMALIDAD: MEDIDAS DE FORMA INTRODUCCIN


Coeficiente de asimetra: Mide la simetra de la curva.

La variable seguir una distribucin normal si el coeficiente de asimetra est prximo a cero sin superar 1 en valor absoluto.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

ESTUDIO DE LA NORMALIDAD: MEDIDAS DE FORMA INTRODUCCIN


Coeficiente de curtosis: Mide el grado de altura de la curva

La variable seguir una distribucin normal si el coeficiente de curtosis es cero o prximo a cero.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

ESTUDIO DE LA NORMALIDAD: REPRESENTACIN GRFICA INTRODUCCIN


Grfico Q-Q: Este grfico utiliza la variable original, en relacin a su transformacin como una variable normalizada. Se construye situando la variable original en el eje X, mientras la variable transformada en el eje Y. El grfico Q-Q, para la variable peso manifiesta que no es claro que se siga una distribucin normal (los puntos deberan estar sobre la lnea). De todas formas, este grfico no es especialmente til si el nmero de datos es menor a 20 y, aun siendo el tamao muestral o poblacional mayor que 20, la interpretacin es muy subjetiva.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

ESTUDIO DE LA NORMALIDAD: CONTRASTES DE HIPTESIS INTRODUCCIN


Existen otros procedimientos para el estudio de la normalidad basados en contrastes de hiptesis especficos: El Test de Kolmogorov-Smirnov, el Test de Shapiro Wilk, y el Test de Jarque-Bera.
H0: La variable sigue una distribucin normal. H1: La variable no sigue una distribucin normal

Se acepta la hiptesis nula cuando el p valor (la probabilidad obtenida en la prueba o mtodo) es mayor que el nivel de significacin fijado por el investigador (generalmente el 5% o el 1%).

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

ESTUDIO DE LA NORMALIDAD INTRODUCCIN


Qu se puede hacer cuando una variable no sigue una distribucin normal?
Una de las aplicaciones del anlisis exploratorio es el examen de la necesidad de llevar a cabo transformaciones. Las transformaciones pueden conducir a que los datos se expresen en escalas que no resulten familiares, originndose, por tanto, problemas en su interpretacin. El investigador debe proceder muchas veces por ensayo y error, ponderando la mejora frente a la necesidad de transformaciones adicionales. La forma de la variable suele sugerir la transformacin especfica. El investigador debera aplicar todas las transformaciones posibles, para posteriormente seleccionar la transformacin ms adecuada. Para distribuciones asimtricas positivas se usan las transformaciones x, ln(x) y 1/x, que comprimen los valores altos y expanden los pequeos. El efecto de estas transformaciones est en orden creciente; menos efecto x, ms ln(x) y ms an 1/x.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

El anlisis bivariable es el conjunto de mtodos y tcnicas estadsticas que analizan simultneamente dos variables, para describir el conjunto de la poblacin observada y analizar la posible existencia de relaciones entre dos variables .

Una simple asociacin entre ambas variables.

La relacin se puede traducir en

Una relacin causa-efecto.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

TABLAS DE CONTINGENCIA INTRODUCCIN


Estas tablas son un procedimiento de anlisis descriptivo en el que los niveles de una variable se cruzan con los niveles de la otra, de forma que la distribucin de una variable se subdivide en funcin de las categoras de la otra variable.

Representa una tabla de frecuencias de doble entrada, donde en cada celdilla o casilla figura el nmero de casos o individuos que poseen un nivel de una de las categoras o caractersticas de una variable analizada y de otra categora de la otra variable analizada.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

TABLAS DE CONTINGENCIA INTRODUCCIN


Ejemplo: Se pretende resumir en una tabla de contingencia las contestaciones de una poblacin de seis individuos a las preguntas sobre su estado civil y su provincia de residencia. Las contestaciones son las siguientes:
1.- Casada-Madrid. 2.- Soltero-Barcelona. 3.- Soltera-Madrid. 4.- Casada-Barcelona. 5.- Casado-Madrid. 6.- Casado-Madrid. La tabla de contingencia es la que muestra ms abajo. En cada celdilla aparece la frecuencia de individuos que cumplen la categora de una variable y otra. Adems aparecen dos tantos por ciento; el primero se calcula sobre el total de cada columna y el segundo sobre el total de cada fila.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

TABLAS DE CONTINGENCIA INTRODUCCIN

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

TABLAS DE CONTINGENCIA: TEST CHI-CUADRADO INTRODUCCIN


Test Chi-Cuadrado: A partir de la tabla de contingencia, el investigador se puede plantear si las variables incluidas en ella, presentan independencia o no. Para resolver esta disyuntiva se plantea un contraste de hiptesis con las siguientes alternativas: Ho: Las variables son independientes. H1: Las variables no son independientes.

Este procedimiento manifiesta, con una probabilidad determinada, la existencia de independencia (o la falta de ella) de las dos variables. Si no se presenta la independencia, el investigador puede inferir una posible relacin (sin saber su grado o nivel) e incluso puede determinar el sentido de dicha relacin.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

CORRELACIN LINEAL INTRODUCCIN


El coeficiente de correlacin de Pearson mide la relacin lineal entre dos variables cuantitativas, siendo independiente de la escala de medicin de dichas variables. Su clculo se realiza dividiendo la covarianza entre el producto de las desviaciones tpicas de las dos variables:

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

CORRELACIN LINEAL INTRODUCCIN

El valor de la correlacin oscila entre los valores 1 y -1. Si r = 0, no existe asociacin o relacin lineal. Esto no necesariamente implica una independencia total entre las dos variables, puesto que puede haber relaciones no lineales entre las dos variables.

Si r = 1, existe una correlacin positiva perfecta entre las dos variables. Cuando una de ellas aumenta, la otra tambin lo hace en el mismo sentido e idntica proporcin. Si r alcanza un valor entre 0 y 1, hay una correlacin positiva.
Si r = -1, existe una correlacin negativa perfecta entre las dos variables. Cuando una de ellas aumenta, la otra disminuye en sentido contrario e idntica proporcin. Si r alcanza un valor entre 0 y -1, hay una correlacin negativa.

Anlisis de la Informacin

Introduccin Clasificacin de las tcnicas de anlisis de datos Anlisis estadstico univariable. Anlisis estadstico bivariable. Conclusiones.

En funcin del nmero de variables existen los siguientes tres tipos de tcnicas de anlisis de datos: Univariables, bivariables y multivariables. El anlisis univariable o univariante analiza la variable de forma aislada. Puede aplicar la estadstica descriptiva (medidas resumen) o la inferencia estadstica (extrapola a la poblacin). La tabla de frecuencias sintetiza la informacin incluida en los datos, pero la tabla es de difcil interpretacin cuando el nmero de distintas alternativas o respuestas es elevado. En este caso, se hace necesario, resumir la informacin que conforma la tabla de frecuencias. Esto se obtiene con las principales caractersticas de la distribucin; medidas de tendencia central, posicin, dispersin y forma. Asimismo, las variables, tambin, deben ser examinadas para conocer si se aproximan a los requisitos previos, como la normalidad, de una tcnica o mtodo estadstico. El anlisis de datos bivariable o bivariante, con sus diferentes tcnicas y mtodos, permite determinar la existencia o corroboracin de una asociacin o relacin entre dos variables, sea de causalidad o no. Con estos resultados, la organizacin pretende disponer de una evidencia que le posibilite establecer un criterio para el desarrollo de su actuacin.

Tema 5: Anlisis de la informacin

Asignatura: Investigacin de Mercados I Titulacin: Grado de Marketing

Você também pode gostar