Você está na página 1de 15

MTODOS PARAMTRICOS PARA LA COMPARACIN DE DOS MEDIAS

En muchos estudios, incluidos la mayora de los ensayos clnicos, es necesario comparar ciertas caractersticas en dos o ms grupos de sujetos. Tal sera el caso, por ejemplo, si pensamos que un tratamiento nuevo puede tener un porcentaje de mejora mayor que otro estndar, o cuando nos planteamos si los nios de las distintas comunidades autnomas tienen o no la misma altura. En este artculo se analizar nicamente el problema de la comparacin de dos grupos con respecto a una variable continua. La eleccin de un mtodo de anlisis apropiado en este caso depender de la naturaleza de los datos y la forma en la que estos hayan sido obtenidos. Fundamentalmente, cuando se comparan dos o ms grupos de observaciones pueden darse dos tipos de diseo: aquel en el que las observaciones se refieren a dos grupos independientes de individuos, o el caso en el que cada serie de datos se recoge en los mismos sujetos bajo condiciones diferentes. El tipo de metodologa ser distinto segn el caso en el que nos encontremos. Otro aspecto a tener en consideracin ser el tipo y distribucin de los datos. Para grupos independientes, los mtodos paramtricos requieren que las observaciones en cada grupo provengan de una distribucin aproximadamente normal con una variabilidad semejante, de modo que si los datos disponibles no verifican tales condiciones, puede resultar til una transformacin(1,2,3) de los mismos (aplicacin del logaritmo, raz cuadrada, etc.) o, en todo caso, se debera recurrir a la utilizacin de procedimientos no paramtricos(4). Normalmente en este tipo de anlisis podremos establecer una hiptesis de partida (hiptesis nula), que generalmente asume que el efecto de inters es nulo, por ejemplo que la tensin arterial es la misma en hombres y mujeres o que dos tratamientos para la hipercolesterolemia son igualmente efectivos. Posteriormente se puede evaluar la probabilidad de haber obtenido los datos observados si esa hiptesis es correcta. El valor de esta probabilidad coincide con el valor-p que nos proporciona cada test estadstico, de modo que cuanto menor sea ste ms improbable resulta que la hiptesis inicial se verifique. En un primer apartado, se presentar el test t de Student para dos muestras independientes, introduciendo las modificaciones necesarias en el caso de que la variabilidad de ambos grupos sea distinta. A continuacin se introducir el test t de Student para el caso de dos muestras dependientes.

Dos muestras independientes. Uno de los anlisis estadsticos ms comunes en la prctica es probablemente el utilizado para comparar dos grupos independientes de observaciones con respecto a una variable numrica. Como ejemplo, consideremos los datos que se muestran en la Tabla 1, correspondientes a 75 individuos con sobrepeso sometidos a dos dietas alimenticias distintas, de modo que se desea comparar el peso de los individuos que iniciaron cada una de las dietas. Como ya se ha adelantado, la aplicacin de un contraste paramtrico requiere la normalidad de las observaciones para cada uno de los grupos. La comprobacin de esta hiptesis puede realizarse tanto por mtodos grficos (por medio de histogramas, diagramas de cajas o grficos de normalidad) como mediante tests estadsticos (5) (test de KolmogorovSmirnov, test de Shapiro-Wilks). Un nmero suficiente de observaciones (digamos mayor de 30) como ocurre en el ejemplo planteado justifica, no obstante, la utilizacin del mismo test. As mismo, este tipo de metodologa exigir que la varianza en ambos grupos de observaciones sea la misma. En primer lugar se desarrollar el test t de Student para el caso en el que se verifiquen ambas condiciones, discutiendo posteriormente el modo de abordar formalmente el caso en el que las varianzas no sean similares. Bajo las hiptesis de normalidad e igual varianza la comparacin de ambos grupos puede realizarse en trminos de un nico parmetro como el valor medio (Figura 1), de modo que en el ejemplo planteado la hiptesis de partida ser, por lo tanto: H0: La media de peso inicial es igual en ambos grupos Se denotar por {X1, X2,...,Xn} e {Y1,Y2,...,Ym} al peso observado en cada uno de los sujetos sometidos a la dieta A y a la dieta B respectivamente. En general no se exigir que coincida el nmero de observaciones en cada uno de los grupos que se comparan, de modo que en el ejemplo n=40 y m=35. El t test para dos muestras independientes se basa en el estadstico:

(1)

donde

denotan el peso medio en cada uno de los grupos:

las cuasivarianzas muestrales correspondientes:

Con lo cual, en este caso particular, el valor utilizado para el contraste ser:

Si la hiptesis de partida es cierta el estadstico (1) seguir una distribucin t de Student con n+m-2 grados de libertad. De ser as, el valor obtenido debera estar dentro del rango de mayor probabilidad segn esta distribucin (Figura 2). Usualmente se toma como referencia el rango de datos en el que se concentra el 95% de la probabilidad. El valor-p que usualmente reportan la mayora de paquetes estadsticos no es ms que la probabilidad de obtener, segn esa distribucin, un dato ms extremo que el que proporciona el test. Como ya se dijo, refleja tambin la probabilidad de obtener los datos observados si fuese cierta la hiptesis inicial. Si el valor-p es muy pequeo (usualmente se considera p<0.05) es poco probable que se cumpla la hiptesis de partida y se debera de rechazar. La regin de aceptacin corresponde por lo tanto a los valores centrales de la distribucin para los que p>0.05. En el ejemplo planteado el valor-p correspondiente es de 0.425, de modo que no existe evidencia estadstica de que el peso medio en ambos grupos sea diferente. En la Tabla 2, se determina los grados de libertad (en la primera columna) y el valor de (en la primera fila). El nmero que determina su interseccin es el valor crtico correspondiente. De este modo, si el estadstico que se obtiene toma un valor mayor se dir que la diferencia es significativa. Otro modo de obtener esta misma informacin es mediante el clculo de intervalos de confianza para la diferencia de la respuesta media en ambos grupos. A mayores, el intervalo de confianza constituye una medida de la incertidumbre con la que se estima esa diferencia a partir de la muestra, permitiendo valorar tanto la significacin estadstica como la magnitud

clnica de esa diferencia(6). En el caso que nos ocupa, el intervalo de confianza vendr dado como:

donde denota el valor que segn la distribucin t de Student con n+m-2 grados de libertad deja a su derecha el 2.5% de los datos. En el ejemplo, el intervalo de confianza con una seguridad del 95% para la diferencia de peso viene dado por:

que expresa en definitiva un rango de valores entre los que se puede encontrar el valor real de la diferencia entre los pesos de ambos grupos. Proporciona adems la misma informacin que obtenamos del contraste estadstico. El hecho de que el valor cero pertenezca al intervalo indica que no se dispone de evidencia para concluir que el peso sea distinto en ambos grupos. A medida que el tamao muestral aumenta, la distribucin del estadstico (1) se hace ms prxima a la de una variable Normal estndar. De este modo, en algunos textos se opta por utilizar esta distribucin para realizar la comparacin de medias. Aunque esta aproximacin es correcta para muestras suficientemente grandes, ambos mtodos proporcionan en este caso resultados prcticamente idnticos, por lo que resulta ms simple utilizar, independientemente del tamao de la muestra, la misma metodologa a partir de la distribucin t. El mismo planteamiento podra utilizarse en el caso de varianzas distintas o de muestras apareadas.

Dos muestras independientes con varianza distinta. El caso en el que se dispone de dos grupos de observaciones independientes con diferentes varianzas, la distribucin de los datos en cada grupo no puede compararse nicamente en trminos de su valor medio (Figura 1b). El contraste estadstico planteado en el apartado anterior requiere de alguna modificacin que tenga en cuenta la variabilidad de los datos en cada poblacin. Obviamente, el primer problema a resolver es el de encontrar un mtodo estadstico que nos permita decidir si la varianza en ambos grupos es o no la misma. El F test o test de la razn de varianzas viene a resolver este problema. Bajo la suposicin de que las dos poblaciones siguen una distribucin normal y tienen igual varianza se espera que la razn de varianzas:

siga una distribucin F de Snedecor con parmetros (n-1) y (m-1). Supongamos que en el ejemplo anterior se desee comparar la prdida de peso en los sujetos sometidos a cada una de las dos dietas. La aplicacin del estadstico (1) no ser factible, ya que las varianzas en ambos grupos son sustancialmente distintas. En este caso la razn de varianzas es de 3.97 / 0.80 = 4.96, valor que se debe comparar con una distribucin F39,34. El valor-p asociado ser p<0.01, siendo muy poco probable que las observaciones provengan de poblaciones con igual variabilidad. En este tipo de situaciones, donde no se debe aplicar el contraste basado en (1), podemos utilizar una modificacin del t test para el caso de varianzas desiguales, conocido como el test de Welch(7) basada en el estadstico:

que, bajo la hiptesis nula seguir una distribucin t de Student con un nmero f de grados de libertad que depender de las varianzas muestrales segn la expresin:

La tcnica para realizar el contraste es anloga a la vista anteriormente cuando las varianzas son desconocidas e iguales. Por ejemplo, en el caso planteado, la prdida media de peso para los individuos en cada una de las dietas fue de e con las variabilidades anteriormente expresadas. Esto conduce a un valor del estadstico de t=5.58 a relacionar con una distribucin t de Student con aproximadamente 56 grados de libertad. El valor-p resultante es, por lo tanto, p<0.001 con lo cual podemos rechazar la hiptesis de partida y concluir que la reduccin de peso experimentada es distinta segn la dieta que se siga.

Al igual que en el caso anterior, podr optarse por calcular el correspondiente 95% intervalo de confianza para la diferencia de medias dado por:

Dos muestras dependientes Ya se ha comentado que cuando se trata de comparar dos grupos de observaciones, es importante distinguir el caso en el que son independientes de aquel en el que los datos estn apareados. Las series dependientes surgen normalmente cuando se evala un mismo dato ms de una vez en cada sujeto de la muestra. Tambin se puede encontrar este tipo de observaciones en estudios de casos y controles donde cada caso se aparea individualmente con un control. Supongamos que queremos comprobar, en los datos de la Tabla 1 si realmente se produce una prdida de peso significativa en esos individuos, para lo que se recoge en cada sujeto su peso antes y despus de someterse a la dieta. En este tipo de anlisis el inters no se centra en la variabilidad que puede haber entre los individuos, sino en las diferencias que se observan en un mismo sujeto entre un momento y otro. Por este motivo, resulta intuitivo trabajar con la diferencia de ambas observaciones (en el ejemplo ser la prdida de peso), de modo que se quiere contrastar la hiptesis: H0: La prdida de peso es nula frente a la alternativa de que la prdida de peso sea importante (es decir, distinta de cero). La veracidad de dicha hiptesis puede ser contrastada igualmente mediante el Test t de Student. Como se ha dicho, este tipo de mtodos tienen como hiptesis fundamental la normalidad de los datos. En este caso, sin embargo, no ser necesario que las observaciones en ambos grupos provengan de poblaciones normales, sino que nicamente se requiere verificar la normalidad de su diferencia. Denotando por la prdida media de peso la hiptesis de la que se parte es que:

frente a la alternativa

A partir de las observaciones muestrales {Y1,Y2,...,Yn} e {Y1,Y2,...,Yn} en cada uno de los grupos se calcula la diferencia de peso para cada sujeto {d1,d2,...,dn} con dj=Xj-Yj j=1,2,...,n. Ntese que en este caso un requisito fundamental es que se tenga un nmero igual de observaciones en ambos grupos. A partir de estos datos, el contraste se basa en el estadstico:

o en el clculo del 95% intervalo de confianza:

donde denota la media de la prdida de peso estimada a partir de la muestra:

denota la cuasivarianza muestral de la diferencia dada por:

En nuestro ejemplo el valor del estadstico vendra dado por:

a comparar del modo habitual con la distribucin t de Student con n-1=74 grados de libertad. El intervalo de confianza para la prdida media de peso correspondiente a una seguridad del 95% es de (3.56;4.41), lo cual se traduce en una prdida de peso significativamente distinta de cero, tal y como indica el valor-p correspondiente de p<0.001.

Figura 1. Comparacin de dos poblaciones normales a) Poblaciones normales con igual varianza y medias distintas

b) Poblaciones normales con igual y diferentes varianzas.

Figura 2. Regiones de aceptacin y rechazo en el contraste de hiptesis

Tabla 1. Datos de 75 pacientes con sobrepeso sometidos a dos dietas alimenticias. Dieta A A A A A A A Peso inicial 94,07 96,79 92,15 92,30 96,50 83,11 91,16 Peso final 86,59 93,08 87,85 86,83 92,70 76,80 83,40 Dieta B B B B B B B Peso inicial 88,02 88,22 103,45 82,94 89,71 94,83 81,93 Peso final 84,12 86,13 101,21 79,08 86,19 91,93 78,97

A A A A A A A A A A A A A A A A A A A

90,81 81,37 89,81 84,92 84,43 86,33 87,60 81,08 92,07 81,14 96,87 99,59 83,90 89,41 85,31 89,25 93,20 89,17 93,51

86,74 77,67 85,70 79,96 79,80 81,15 81,92 76,32 90,20 73,34 93,58 92,36 77,23 85,45 84,59 84,89 93,10 86,87 86,36

B B B B B B B B B B B B B B B B B B B

83,41 73,59 108,47 72,67 96,84 88,48 89,57 85,22 103,76 87,84 91,50 93,04 92,14 85,26 89,42 92,42 93,13 80,86 88,75

78,89 69,76 104,20 70,01 93,66 87,00 87,24 82,09 102,24 84,66 88,95 88,73 88,07 81,36 86,64 88,99 89,73 77,81 85,93

A A A A A A A A A A A A A A

88,85 88,40 82,45 96,47 99,48 99,95 100,05 87,33 87,61 89,28 89,72 95,57 97,71 98,73

83,24 81,20 77,18 88,61 94,67 93,87 94,15 82,17 86,01 83,78 83,56 89,58 91,35 97,82

B B B B B B B B B

95,02 92,29 89,43 93,32 92,88 89,88 82,25 88,99 82,07

91,90 91,28 87,22 89,77 89,38 88,00 80,81 86,87 79,74

Tabla de la Distribucin Chi Cuadrado


Nivel de significancia
gl

1 2 3 4 5 6 7 8 9 10 11 12 13

0.10 2.7055 4.6052 6.2514 7.7794 9.2363 10.6446 12.017 13.3616 14.6837 15.9872 17.275 18.5493 19.8119

0.05 3.8415 5.9915 7.8147 9.4877 11.0705 12.5916 14.0671 15.5073 16.919 18.307 19.6752 21.0261 22.362

0.025 5.0239 7.3778 9.3484 11.1433 12.8325 14.4494 16.0128 17.5345 19.0228 20.4832 21.92 23.3367 24.7356

0.01 6.6349 9.2104 11.3449 13.2767 15.0863 16.8119 18.4753 20.0902 21.666 23.2093 24.725 26.217 27.6882

0.005 7.8794 10.5965 12.8381 14.8602 16.7496 18.5475 20.2777 21.9549 23.5893 25.1881 26.7569 28.2997 29.8193

14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45

21.0641 23.6848 22.3071 24.9958 23.5418 26.2962 24.769 27.5871 25.9894 28.8693 27.2036 30.1435 28.412 31.4104 29.6151 32.6706 30.8133 33.9245 32.0069 35.1725 33.1962 36.415 34.3816 37.6525 35.5632 38.8851 36.7412 40.1133 37.9159 41.3372 39.0875 42.5569 40.256 43.773 41.4217 44.9853 42.5847 46.1942 43.7452 47.3999 44.9032 48.6024 46.0588 49.8018 47.2122 50.9985 48.3634 52.1923 49.5126 53.3835 50.6598 54.5722 51.805 55.7585 52.9485 56.9424 54.0902 58.124 55.2302 59.3035 56.3685 60.4809 57.5053 61.6562

26.1189 29.1412 27.4884 30.578 28.8453 31.9999 30.191 33.4087 31.5264 34.8052 32.8523 36.1908 34.1696 37.5663 35.4789 38.9322 36.7807 40.2894 38.0756 41.6383 39.3641 42.9798 40.6465 44.314 41.9231 45.6416 43.1945 46.9628 44.4608 48.2782 45.7223 49.5878 46.9792 50.8922 48.2319 52.1914 49.4804 53.4857 50.7251 54.7754 51.966 56.0609 53.2033 57.342 54.4373 58.6192 55.668 59.8926 56.8955 61.162 58.1201 62.4281 59.3417 63.6908 60.5606 64.95 61.7767 66.2063 62.9903 67.4593 64.2014 68.7096 65.4101 69.9569

31.3194 32.8015 34.2671 35.7184 37.1564 38.5821 39.9969 41.4009 42.7957 44.1814 45.5584 46.928 48.2898 49.645 50.9936 52.3355 53.6719 55.0025 56.328 57.6483 58.9637 60.2746 61.5811 62.8832 64.1812 65.4753 66.766 68.0526 69.336 70.6157 71.8923 73.166

46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77

58.6405 59.7743 60.9066 62.0375 63.1671 64.2954 65.4224 66.5482 67.6728 68.7962 69.9185 71.0397 72.1598 73.2789 74.397 75.5141 76.6302 77.7454 78.8597 79.973 81.0855 82.1971 83.3079 84.4179 85.527 86.6354 87.7431 88.8499 89.9561 91.0615 92.1662 93.2702

62.8296 64.0011 65.1708 66.3387 67.5048 68.6693 69.8322 70.9934 72.1532 73.3115 74.4683 75.6237 76.7778 77.9305 79.082 80.2321 81.381 82.5287 83.6752 84.8206 85.9649 87.108 88.2502 89.3912 90.5313 91.6703 92.8083 93.9453 95.0815 96.2167 97.351 98.4844

66.6165 67.8206 69.0226 70.2224 71.4202 72.616 73.8099 75.0019 76.1921 77.3804 78.5671 79.7522 80.9356 82.1174 83.2977 84.4764 85.6537 86.8296 88.004 89.1772 90.3488 91.5193 92.6885 93.8565 95.0231 96.1887 97.353 98.5162 99.6784 100.8393 101.9992 103.1581

71.2015 72.4432 73.6826 74.9194 76.1538 77.386 78.6156 79.8434 81.0688 82.292 83.5136 84.7327 85.9501 87.1658 88.3794 89.5912 90.8015 92.0099 93.2167 94.422 95.6256 96.8277 98.0283 99.2274 100.4251 101.6214 102.8163 104.0098 105.2019 106.3929 107.5824 108.7709

74.4367 75.7039 76.9689 78.2306 79.4898 80.7465 82.0006 83.2525 84.5018 85.7491 86.994 88.2366 89.477 90.7153 91.9518 93.1862 94.4185 95.6492 96.8779 98.1049 99.3303 100.5538 101.7757 102.9961 104.2148 105.4323 106.6473 107.8619 109.0742 110.2854 111.4954 112.7037

78 94.3735 99.617 104.3159 109.9582 113.9107 79 95.4762 100.7486 105.4727 111.144 115.1163 80 96.5782 101.8795 106.6285 112.3288 116.3209 81 97.6796 103.0095 107.7834 113.5123 117.524 82 98.7803 104.1387 108.9373 114.6948 118.7261 83 99.8805 105.2672 110.0902 115.8762 119.927 84 100.98 106.3949 111.2422 117.0566 121.1262 85 102.0789 107.5217 112.3933 118.2356 122.3244 86 103.1773 108.6479 113.5436 119.4137 123.5218 87 104.275 109.7733 114.6929 120.5909 124.7176 88 105.3723 110.898 115.8415 121.7672 125.9123 89 106.4689 112.022 116.989 122.9422 127.106 90 107.565 113.1452 118.1359 124.1162 128.2987 91 108.6606 114.2679 119.282 125.2893 129.4902 92 109.7556 115.3898 120.427 126.4616 130.6812 93 110.8501 116.511 121.5714 127.633 131.8705 94 111.9442 117.6317 122.7152 128.8032 133.0589 95 113.0377 118.7516 123.858 129.9725 134.2466 96 114.1307 119.8709 125.0001 131.1411 135.4327 97 115.2232 120.9897 126.1414 132.3089 136.6188 98 116.3153 122.1077 127.2821 133.4756 137.803 99 117.4069 123.2252 128.4219 134.6415 138.9869 100 118.498 124.3421 129.5613 135.8069 140.1697

Você também pode gostar