Você está na página 1de 3

En la planificacin de cualquier trabajo de investigacin surgir indefectiblemente la pregunta "qu tamao de muestra necesito para verificar la hiptesis planteada?

", y si no ha sido as cuando vayamos a publicar el resultado de nuestro trabajo y procedamos a revisar la lista de tems sugerida en la declaracin CONSORT, nos encontraremos con el punto 7 que bajo el ttulo "Tamao de muestra" nos indica: Especificar cmo fue determinado el tamao de muestra y en su caso explicacin de los anlisis intermedios efectuados, as como reglas para detener el estudio o experimento. Aunque el razonamiento para la predeterminacin del tamao de muestra es tremendamente sencillo, y a pesar de que existen multitud de tablas publicadas y de programas para su clculo, por algn extrao motivo muchos investigadores consideran la predeterminacin del tamao de muestra una tarea de "expertos" en estadstica, lo que como veremos no tiene ningn sentido, pues la informacin ms importante para ese clculo se basa en conocer ciertos datos del proceso que se va a estudiar. Como todo el mundo sabe, en un estudio comparativo podemos cometer dos tipos de errores, un error , que ocurre cuando se afirma que existe diferencia y en realidad sta es cero, y un error tipo tipo I o II o , que consiste en declarar que no hemos encontrado diferencias estadsticamente significativas

cuando s que son diferentes los dos grupos. Obviamente la realidad no la conocemos, y precisamente vamos a efectuar un trabajo para intentar saber ms sobre sta. Es habitual fijar de antemano la probabilidad de cometer un error de tipo I en una valor pequeo, normalmente inferior a 0.05. Uno de los problemas del contraste estadstico de hiptesis es que por pequea que sea una diferencia sta ser estadsticamente significativa siempre que el tamao de muestra sea suficientemente grande, de ah el inters del concepto de relevancia clnica de una diferencia observada. Dado que al investigador lo que le interesa es encontrar diferencias con una magnitud de cierta importancia prctica y dado que el coste de un estudio aumenta con el tamao de muestra, o lo que es lo mismo disminuye su viabilidad, ese orden de magnitud de la diferencia mnima que deseamos detectar permitir acotar el tamao de muestra necesario para nuestro estudio. La declaracin de principios es que buscamos un tamao de muestra lo ms pequeo posible, pero no tanto que no seamos capaces de detectar una diferencia de una magnitud tal que ya empieza a tener inters prctico, es decir que si la observsemos en nuestro experimento deseamos tener un tamao de muestra suficiente para poder afirmar que es estadsticamente significativa. No vamos a entrar ahora a profundizar en la matemtica del clculo del tamao de muestra, que se describe en prcticamente todos los libros de estadstica, cuya frmula de clculo concreto depender del parmetro que se va a estimar (una proporcin, una media, un coeficiente de correlacin, etc) y del modelo probabilstico con el que se supone se distribuye ese parmetro, obtenindose finalmente una frmula que depende del error prefijado, de la mnima diferencia D entre los parmetros que se considera de importancia prctica, de la probabilidad complementaria 1de no detectar esa diferencia, o su

la probabilidad de detectarla o potencia de la prueba, y de la variabilidad de los

datos expresada en funcin de la desviacin tpica s. Expresado de forma sucinta:

Donde f( ) indica funcin de ( ) Por tradicin se suele fijar en 0.05 y la potencia de la prueba 1entre 0.8 y 0.9, y salvo que

tengamos alguna razn poderosa para cambiarlo ms nos vale no luchar con una tradicin tan slidamente asentada en el mbito editorial cientfico. En el caso de que estemos comparando dos proporciones, la varianza se puede expresar en funcin de esas proporciones, con lo que podemos formular el tamao de muestra necesario de la siguiente manera

El problema radica en que para determinar el tamao de muestra necesitamos conocer P1 y P2, las proporciones en los dos grupos, que es precisamente lo que deseamos saber y para lo que pensamos efectuar un trabajo de investigacin. Hablando coloquialmente, es la pescadilla que se muerde la cola, y slo se puede resolver efectuando suposiciones, de ah que quizs por no existir una solucin "automtica" es por lo que se considera, inmerecidamente, y en tantas ocasiones una tarea de "gurus". La forma habitual de proceder consiste en suponer un orden de magnitud de la tasa de respuesta en el grupo de control P1, basada en la experiencia previa, en la literatura, en un estudio piloto o simplemente en la intuicin, y postular qu diferencia D en esa respuesta se puede empezar a considerar ya de inters, de tal manera que P2=P1+D. A partir de esos datos se calcula ya el tamao de muestra necesario. Es conveniente analizar en qu medida un valor diferente, pero tambin posible, de la tasa de respuesta conduce a otros tamaos de muestra, y sopesar as un rango de posibles tamaos junto con

respuesta conduce a otros tamaos de muestra, y sopesar as un rango de posibles tamaos junto con las restricciones logsticas y econmicas, las cuales suelen tener la ltima palabra al respecto. Es habitual tambin prever que puede haber prdidas de casos a lo largo del estudio, y de acuerdo a experiencias previas sobredimensionar inicialmente ese tamao de muestra para garantizar que el tamao al final del estudio no sea menor que el inicialmente previsto. Para la comparacin de medias de datos cuantitativos, adems de fijar el orden de magnitud de la diferencia D que se considera ya de cierta importancia y que queremos garantizar que seremos capaces de detectar con una probabilidad entre 0.8 a 0.9 (potencia de la prueba), es preciso adems conocer el valor de la desviacin tpica s que esperamos para nuestros datos, siendo ste el punto ms complicado. Tambin se puede acudir a fijar la relacin entre esa diferencia y la desviacin tpica, el cociente d=D/s, cociente que se conoce con el nombre d Cohen, y que se suele utilizar para tabular posibles tamaos de muestra en funcin de ese valor d. Aqu el cuello de botella se encuentra, sobre todo en un estudio novedoso sin informacin previa, en cmo tener idea de una estimacin sensata del valor de la desviacin tpica. Una alternativa posible es reestimar el tamao de muestra una vez que hemos recogido ya parte de los datos, lo que nos permite obtener una estimacin ms real de la desviacin tpica. Este procedimiento nos lleva a tcnicas de anlisis secuencial que se comentan ms adelante. A la hora de determinar el tamao de muestra necesario hay que tener en cuenta tambin el tipo de diseo y el tipo de muestreo utilizado, ya que ste condiciona la frmula que se utilizar para calcular el error estndar de la estimacin, y dado que manipulando esa frmula se obtiene el valor de N, tambin ste ser diferente segn sea el diseo del estudio. As, entre otros casos, habr que tener en cuenta si se trata de una comparacin de muestras independientes o pareadas, si el esquema del muestreo es aleatorio simple (el ms utilizado en los ensayos clnicos) o si se emple un mtodo de muestreo diferente (por ejemplo un muestreo estratificado o un muestreo por conglomerados). Como hemos visto el principal escollo que se presenta a la hora de predeterminar el tamao de muestra necesario para un estudio, una vez que disponemos de las frmulas, las tablas o el programa adecuado, lo encontramos en que hay que aventurar valores de parmetros que lamentablemente van a ser a su vez calculados en el propio estudio y es ste un crculo vicioso que no tiene salida, a pesar de que algunos autores hayan propuesto insistentemente soluciones algo descabelladas. As resulta curiosa la afirmacin sostenida por algunos de que para estimar una proporcin desconocida, con una precisin dada, el tamao de muestra mnimo necesario se obtiene suponiendo un valor de p=0.5, basndose en que para estimar una proporcin P con margen de tolerancia D la frmula que proporciona el tamao de muestra es:

donde Z=1.96 para

=0.05.

Para D fijo esa frmula toma su valor mximo con P=0.5. Pero D es la tolerancia en la estimacin de la proporcin y est claro que la magnitud de esa tolerancia no se puede fijar si no tenemos alguna idea respecto a la proporcin a estimar. Un margen de tolerancia del 1% puede ser aceptable en la estimacin de un porcentaje del 50%, o por ejemplo en un porcentaje del 20%, es decir que el intervalo de confianza de la estimacin estara en este ltimo caso entre el 19% y el 21%. Pero esa misma tolerancia es probablemente inadmisible para estimar un porcentaje del 2%, ya que entonces el margen absoluto del 1% constituye la mitad del valor estimado. El propio sentido comn nos dice que para estimar sucesos infrecuentes necesitaremos tamaos de muestra mayores que para estimar sucesos frecuentes.

Mtodos secuenciales
Hasta aqu se ha considerado la metodologa clsica del contraste de hiptesis, en la que se fija el tamao de muestra al principio del estudio, ya sea mediante un clculo basado en los razonamientos expuestos anteriormente o por otros motivos ms prosaicos, aunque luego para su publicacin se "ajusten" las cifras a alguna de las frmulas anteriores. Pero existe una alternativa, que se conoce con el nombre de anlisis secuencial en la que se efecta los clculos a medida que se van recogiendo casos y se compara el resultado obtenido hasta ese momento con dos umbrales, superados los cuales se detiene el experimento. Supongamos que se est comparando dos tratamientos y que el resultado analizado es dicotmico, por ejemplo para simplificar supongamos curacin s o no. En un ensayo secuencial fijamos entonces un umbral superior para la diferencia de proporciones entre la tasa en el grupo de nuevo tratamiento y la tasa en el grupo control, superado el cual se detiene el estudio considerando que hay ya suficiente evidencia para aceptar el nuevo tratamiento como mejor. Asimismo habr un umbral inferior, por debajo del cual se considerar probado que el nuevo tratamiento es peor y se detendr tambin el experimento. Esta metodologa permite obtener conclusiones durante el desarrollo del estudio, sin necesidad de esperar al final del mismo, por lo que habitualmente se puede llegar a una conclusin ms rpidamente que en un diseo clsico, lo que en determinadas situaciones

lo hace muy deseable ya que puede evitar a tiempo que los pacientes estn recibiendo un tratamiento mucho menos eficaz. No es de extraar que los mtodos secuenciales se utilicen asiduamente en la industria en ensayos destructivos, en los que la pieza que se analiza queda inoperativa despus del proceso de anlisis. En la metodologa estadstica secuencial para mantener la probabilidad global de error tipo I en un valor inferior al prefijado (0.05), es necesario utilizar un nivel de significacin menor para cada paso. Se trata de una problemtica similar a la comentada para el contraste mltiple de hiptesis. La regla de parada puede ser detener el estudio si los datos acumulados hasta ese momento muestran una diferencia estadsticamente significativa a un nivel de probabilidad tal que se garantiza el objetivo , y en caso contrario continuar con el estudio hasta llegar a un tamao mximo N momento global de en el que tambin se detendr el estudio y se aceptar la hiptesis de igualdad. El nivel de probabilidad a utilizar en cada paso depende del valor de N, cuanto mayor sea ste menor debe ser ese valor crtico. Actualmente los mtodos secuenciales ha cobrado auge en epidemiologa gentica, fundamentalmente en la metodologa que se conoce como "sequential linkage analysis". Tambin en muchos ensayos clnicos se lleva a cabo de forma habitual anlisis intermedios de los datos, con el fin de determinar si los resultados obtenidos hasta ese momento hacen inaceptable, desde un punto de vista tico, la continuidad del estudio, porque se ha encontrado una diferencia de efectos inesperadamente grande o porque por ejemplo la tasa de efectos secundarios es anormalmente alta. En estos casos es necesario tambin prefijar las condiciones de parada del estudio. Otra cuestin interesante que podemos plantearnos es qu influencia tiene el tamao de un estudio en la opinin clnica general. El intervalo de confianza de la magnitud de un efecto depende del tamao de muestra y de la varianza, pero lo que en general quizs llama ms la atencin es precisamente el tamao de muestra. Hasta qu punto sera recibido con escepticismo un ensayo en el que como consecuencia de la deteccin de un gran diferencia en el efecto ste se detiene a la mitad de su desarrollo, cuando llevamos incluidos la mitad de los pacientes previstos?. Si existiera una tendencia a sobrevalorar un gran tamao de muestra como garante de evidencia de un resultado, sera necesario incluir en el clculo de las reglas de parada no slo criterios puramente estadsticos sino adems otros que cuantificasen de alguna manera el "peso" de la evidencia necesaria para alterar la prctica clnica, lo que precisara de un enfoque bayesiano de la cuestin. Sin embargo, ahora que estn tan de moda los macro-estudios, hemos de tener bien claro que los grandes estudios slo son necesarios para demostrar pequeos efectos o diferencias pequeas en los efectos y que aunque las grandes cifras del efectivo de muestra de esos trabajos nos impresionen, el tamao no lo es todo, ya que en la calidad de los resultados tambin influye la calidad y caractersticas del diseo y sta siempre es mucho ms difcil de garantizar en los grandes estudios en los que intervienen centros muy diversos que en estudios ms pequeos y mucho mejor controlados.

Enlaces de inters

Você também pode gostar