Você está na página 1de 5

Prueba de Independencia: Tablas de contingencia

Al estudiar la diferencia entre los parmetros poblacionales a travs de la diferencia muestral de los estadsticos muestrales correspondientes, lo que hemos hecho es realizar un anlisis comparativo de dos variables: X: Observaciones provenientes de la primera poblacin, e Y: Observaciones provenientes de la segunda poblacin.

Y al plantear la Hiptesis Nula de la igualdad de dichos parmetros, lo que hemos hecho es afirmar que dichos parmetros tienen el mismo comportamiento o que no existe suficiente evidencia para afirmar que difieren, versus la Hiptesis Alternativa que la niega.

Queremos ahora generalizar este tipo de comparaciones para ms de dos poblaciones. Pero a diferencia de probar el mismo comportamiento entre dos poblaciones, trataremos de probar hiptesis de independencia en el comportamiento de las mismas, versus la hiptesis alternativa que afirma la dependencia entre el comportamiento de las poblaciones.

Veamos el siguiente problema:

Ejemplo 4

La empresa Limpia Ya S.A. comercializa tres tipos de detergentes A, B y C. En un anlisis de segmentacin de mercado para los tres productos, el grupo de investigacin encargado ha planteado la duda de si las preferencias para los tres detergentes son diferentes entre los consumidores de los sectores Alto, Medio y Bajo. Si la preferencia de los detergentes fuera independiente del sector consumidor, se iniciara una nica campaa de publicidad para los tres productos; sin embargo, si la preferencia depende del sector de consumo, se ajustarn las promociones para tener en cuenta los distintos mercados de venta.

De manera que las hiptesis a plantearse sern:

H0: La preferencia de detergente es independiente del sector de consumo

H1: La preferencia de detergente no es independiente del sector de consumo

Despus de identificar a la poblacin y sectores consumidores, se puede tomar una muestra y preguntar a cada elemento de la muestra sobre su preferencia entre los tres tipos de detergentes.

El conjunto de datos definido como observaciones corresponder a un determinado detergente, consumido por un determinado sector.

Esto nos lleva a conformar todas las posibles combinaciones o contingencias a las cuales llamaremos Tabla de Contingencias.

De manera que una prueba de independencia utiliza como formato de trabajo una tabla de contingencias.

Por esta razn este tipo de prueba recibe el nombre de Pruebas de Tabla de Contingencias o prueba con tabla de contingencias.

El formato de la tabla se muestra a continuacin:

Detergente A Alto Medio Sexo Bajo O11 O21 O31

Detergente B O12 O22 O32

Detergente C O13 O23 O33

Total O.1 O.2 O.3

Total

O1.

O2.

O3.

Supongamos que se tom una muestra de 120 consumidores. Despus de usar los tres tipos de detergentes, se les pide manifestar su preferencia. Los resultados de la muestra se presentan en la siguiente tabla:

Producto Detergente A Alto 14 Detergente B 12 Detergente C 10 Total 36

Medio Sexo Bajo

21 15

16 12

8 12

45 39

Total

50

40

30

n= 120

5. Anlisis de datos categricos (9)


Si pudiramos obtener las frecuencias esperadas bajo la hiptesis de independencia entre la preferencia de los detergentes y el sector del consumidor, podramos usar la distribucin Chi Cuadrado para determinar si existe una diferencia significativa entre las frecuencias observadas y esperadas, como lo vimos en bondad de ajuste.

Para encontrar las frecuencias esperadas haremos uso del siguiente razonamiento:

Si es cierto que la preferencia de los detergentes y el consumo por sector son independientes entonces la proporcin de consumo por detergente debe se igual entre los tres sectores.

Por ello, bajo la hiptesis de independencia, esperaramos que el total de los consumidores por sector estaran afectados por esta proporcin.

En otras palabras, la proporcin de consumo por detergente es 50/120, 40/120 y 30/120.

Luego el nmero esperado de consumidores por sector ser 36(50/120), 45(40/120) y 39(30/120).

Todo esto se muestra en la siguiente tabla:

Producto Detergente A Alto Medio Sexo Bajo 15 18.75 16.25 Detergente B 12 15 13 Detergente C 9 11.25 9.75 Total 36 45 39

Total

50

40

30

n= 120

En consecuencia, hemos usado la siguiente frmula

Lo que falta ahora es repetir lo que hicimos en Bondad de Ajuste por Chi Cuadrado. Es decir obtener la suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, dividido por las frecuencias esperadas. Slo que en este caso, la suma es con doble sumatoria, como aqu se indica,

tal que

donde k es el nmero de categoras(filas) y m es el nmero de contingencias (columnas) existentes en la muestra.

El siguiente cuadro nos muestra la suma de los cuadrados mencionados lneas arriba.

Producto Detergente A Alto Medio Sexo Bajo Total 0.067 0.270 0.096 50 Detergente B Detergente C Total 0.000 0.067 0.077 40 0.111 0.939 0.519 30 36 45 39 120

Luego

= 2.146.

Usando Minitab encontramos el valor de

(4) = 9.4877

Puesto que

<

(4)

Entonces, podemos afirmar que existe evidencia para sospechar que la preferencia por los detergentes es independiente del sector al que pertenece el consumidor.

Você também pode gostar