Escolar Documentos
Profissional Documentos
Cultura Documentos
La ecuación es la siguiente:
Donde:
X2Q = estadístico ji cuadrada de la prueba Q de
Cochran.
K = número de tratamientos.
Gn = número total de respuestas de cambio de
cada tratamiento o columna.
Lc = número total de respuestas de cambio por
individuo de la muestra o hileras.
Pasos:
Ejemplo:
Los tratamientos corresponden a cuatro fármacos, que según afirman los fabricantes de los
productos, tienen capacidad para facilitar el aprendizaje.
El investigador, para evitar que por efectos acumulativos de los fármacos pudiera haber
error, al suponer que una droga administrada en el cuarto período incidiera en mayor
aprendizaje, aplica en secuencias y aleatoriamente los tratamientos, de modo que las
respuestas de los animales emitidas en el laberinto, en función de un período fijo (tiempo
crítico determinado por el experimentador), le permiten discriminar si fueron positivas (1) o
negativas (0).
Planteamiento de la hipótesis.
Hipótesis alterna (Ha). Los fármacos favorecen el aprendizaje simple en las ratas en
estudio. De esta forma, se muestran diferencias significativas entre, antes y después
de los tratamientos.
Hipótesis nula (Ho). Los cambios observados entre los períodos previo y posterior a
los tratamientos se deben al azar.
Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Solución de laberintos.
Decisión.
En razón de que el estadístico calculado tiene una probabilidad mayor que 0.05, cae en la
zona de rechazo, por lo cual se acepta Ho y se rechaza Ha.
Interpretación.
Ningún fármaco a nivel experimental en ratas produjo un cambio significativo y parece que
se debe al azar, aun cuando en el tercer tratamiento, 12 de 15 ratas presentaron cambio
positivo. Esto seguramente ocurrió debido al tamaño de la muestra, y el investigador habrá
de aumentar el número de animales para definir mejor el fenómeno.
web hosting • domain names
web design • online games
Una vez obtenidos los resultados, pero antes de informar de ellos, el investigador debe
dedicar algún tiempo a una fase especial: la evaluación. Debe evaluar los resultados: ¿son
lo que él quería?, ¿Es posible mejorar algo en el informe? ¿Debe ser dejado fuera algo o
merece el informe publicarse en su totalidad?
El segundo, mucho más difícil pregunta se refiere a la confiabilidad de los resultados: cuán
es alto el riesgo de ellos estar falsos, o cómo es grande su error probable.
Sólo después de que el proceso del proyecto haya sido aprobado en la inspección antedicha
es el momento oportuno de tomar seriamente los resultados divulgados y de los comenzar a
evaluar directamente. Dos puntos de vista más generalmente de esta examinación son
Evaluar los resultados teóricos y Valorar las consecuencias prácticas. En estas evaluaciones
finales no necesita se interesar mucho sobre las blancos iniciales del proyecto - es normal
que un proyecto logra más (o menos) que fue planeado.
En la historia de muchas ramas de la ciencia una teoría importante ha sido sustituta por un
nuevo, y una gran cantidad de estudios que han confiado en la teoría vieja han llegado a ser
apenas curiosidades históricas. En el estudio de productos esta cosa ocurrió, no obstante
gradualmente, durante el siglo XIX, cuando la teoría de Baumgarten de la belleza como
proceso de la percepción subjetiva reemplazó la doctrina de Platón en belleza como
característica de objetos. Tales revoluciones científicas, sin embargo, suceden tan
infrecuentemente que los investigadores no pueden esperar tomarlas en cuenta cuando
evaluar su materia.
Evaluar datos
recogidos
Los procedimientos de adquirir los
datos para la investigación consisten
generalmente en tres operaciones
distintas que se deben evaluar
separadamente:
Consistencia de la demarcación
Como contraste, en la investigación básica teórica usted desearía a menudo utilizar una
demarcación amplia que, por ejemplo, incluye todos los períodos históricos o todos los
casos comparables en el universo. Sin embargo, las delimitaciones muy amplias causan a
menudo dificultades cuando diseñar una muestra que se estudiará o cuando registrar datos
(véase abajo), y estas complicaciones alternadamente pueden dañar la credibilidad de los
resultados.
Cuándo la muestra está no aleatoria hay siempre el riesgo que la muestra contiene sesgo, un
error sistemático que está a menudo difícil de detectar sin estudiar a la población entera. Un
método entonces deberá estudiar cualquier materia que se puede encontrar acerca de la
población, como archivos públicos demográficos sobre edad o estructura por sexos, y
comparar estas cifras con nuestra muestra. Si encontramos desviaciones, tenemos que
plantearnos si éstas nos dan razones para sospechar sobre desviaciones también en las
variables "relevantes" arriba aludidas.
Una otra manera de evaluar la representatividad de una muestra no aleatoria sería investigar
otra muestra tomada de la misma población con otro método de muestreo.
Encontrar el intervalo de confianza. Observa que a pesar del nombre prometedor del
“margen del error’, este método mide solamente la diferencia entre población y muestra,
exactamente como todos los otros procedimientos de estudiar el significativo estadístico.
Ignora todos los errores en la colocación de los hechos, asimismo toda la variación que
quizás ocurrirá luego en el objeto del estudio, por ejemplo que clientes en realidad no se
comportan ni votan como ellos han dicho en una entrevista.
La fórmula para calcular el margen del error - i.e. la mitad del intervalo de confianza - para
un medio o un variable simple es, con un riesgo de 5%:
donde
s = desviación estándar de la población
n = número de la muestra
El diagrama abajo a la izquierda demuestra la dispersión de una cierta variable en la
población P, y también en dos muestras escogidas al azar de la población. El investigador
está interesado en el medio de esta variable en la población P. Si se asume que la dispersión
de esta variable en la población no está lejos de normal y la población no es más pequeña
que cerca de ciento, podemos calcular el margen del error (m) que define los límites del
intervalo de la confianza que incluye 95% de los medios de todas las muestras escogidas al
azar de esta población. Las muestras aleatorias R1 y R2 aquí se han dibujado en los dos
extremos del intervalo de la confianza del medio.
Las fórmulas para calcular el margen del error son poco diferentes para varias estadísticas.
La fórmula para manejar un porcentaje es:
donde
p = porcentaje (por ejemplo, de clientes que están satisfechos) desde una muestra
n = número de la muestra.
En ambos casos el coeficiente, aquí 1,96, depende de la probabilidad deseada, por ejemplo
para un riesgo de 1% sería 2,58 y para un 10% riesgo 1.64.
Calcular el significativo estadístico. La base del cálculo de probabilidad está igual que en
el método del margen del error, pero aquí el nivel de la probabilidad y del riesgo no se
miran como constantes. En lugar, la blanco es encontrar cuán probable es que los
resultados de la muestra son verdad también en la población original. Para este examen, hay
los métodos llamados comprobaciones estadísticas. Estos métodos nos ayudarán a elegir
entre dos explicaciones alternativas para nuestros resultados:
Ahora es posible calcular la probabilidad de obtener, por azar sólo, ciertos resultados a
partir de la muestra. Si esta probabilidad es muy pequeña, por ejemplo menos de un 0.1%,
tenemos buenas razones para rechazar la hipótesis nula y creer que los mismos resultados
son ciertos en la población. A tales resultados se les llama estadísticamente altamente
significativos.
Sin embargo, si la probabilidad de recibir el resultado por azar es amplia, digamos que por
encima de un 5%, no debemos afirmar que nuestros resultados son necesariamente válidos
en la población. En este caso, nuestros resultados se llaman estadísticamente no
significativos.
La abreviatura se usa situando una o más estrellas tras el resultado de la investigación ya sometido
a prueba.
Se usan nombres ligeramente distintos para los niveles de representatividad según el país, y
eso es por lo que, para evitar confusiones, podría por ejemplo afirmarse en el informe de
investigación que "el resultado es significativo en el nivel del 5%", queriendo esto decir
que la probabilidad de que se produjese ese resultado por accidente es inferior al 5 %.
No hay una fórmula universal para la comprobación estadística. En lugar de ello hay un
cierto número de comprobaciones especiales para cada distinto tipo de estadísticas (para la
media, la varianza, etc.). Sin embargo, la práctica general en las comprobaciones es siempre
la misma:
En la siguiente tabla encontraremos algunas comprobaciones estadísticas. Una tabla no puede dar
todos los criterios que deben tenerse en cuenta en la elección; sería aconsejable consultar a un
estadístico si tenemos la posibilidad.
DATOS QUE HAN DE SOMETERSE A PRUEBA: PRUEBA ADECUADA:
Estadísticas que describen una variable aritmética (por ej.: media): prueba t
Prueba Chi
La prueba Chi (letra griega que se pronuncia como en español "ji") puede usarse para
valorar cómo están distribuidos en clases los objetos o sujetos en una muestra aleatoria.
Un ejemplo inventado:
Un fabricante vende grifos en España. Éstos pueden ser cromados en plateado o dorado. La
empresa empezará pronto a lanzar al mercado estos productos en Portugal y necesita saber
si los clientes portugueses están relativamente más interesados en los dorados que los
clientes españoles.
Se ha enviado un cuestionario a 150 portugueses elegidos al azar y a un número igual de
españoles. 100 cuestionarios no fueron devueltos. Las 200 respuestas obtenidas se
distribuyeron como indican los números marcados con una T:
Españoles T = 50 T = 40 90
Portugueses T = 50 T = 60 110
En este caso (inventado), la mayoría de portugueses preferían grifos dorados, mientras que
la mayoría de españoles los preferían cromados. Ahora surge una pregunta: ¿esta diferencia
es válida en todos los portugueses y españoles o es posible que una divergencia tal de las
muestras esté causada sólo por el azar? Tenemos que plantearnos el hecho de que
recibiéramos sólo 200 respuestas y es bastante posible que accidentalmente tengamos un
grupo tan pequeño, varias personas que no son típicas en sus opiniones. La probabilidad de
un resultado accidental puede calcularse con la prueba Chi.
Para llevar a cabo la prueba, primero vamos a investigar cómo estas 200 respuestas podrían
estar distribuidas con mayor probabilidad, si no hubiese diferencias entre las dos
poblaciones; en otras palabras, si todos los portugueses y todos los españoles tuviesen
idénticas opiniones sobre los acabados de los grifos. Esta distribución hipotética se llama
distribución esperada. En nuestro ejemplo sería como sigue. (Las frecuencias de clases en
esta distribución van marcadas con la letra V):
Españoles V = 45 V = 45 90
Portugueses V = 55 V = 55 110
Ahora necesitamos construir una medida para indicar cuánta discrepancia hay entre la
distribución real y la esperada. Esta medida se llama Chi cuadrado, y se calcula como
sigue:
(siendo x la discrepancia, T el total y V el valor de los que prefieren cromado o dorado y
significando suma)
El siguiente paso es calcular la probabilidad de obtener, sólo por accidente, los resultados
de arriba (o, lo que es lo mismo, la divergencia mencionada anteriormente entre
portugueses y españoles).
No necesitamos calcular esta probabilidad, ya que se indica para un gran número de valores
en los manuales de estadística. Estas tablas nos dicen, por ejemplo, que hay un 5% de
probabilidad de obtener el valor 3.84 para Chi cuadrado en un par de tablas de 4 celdas,
cuando sólo actúa el azar y no hay diferencia entre las poblaciones.
En nuestro ejemplo, obtuvimos un valor Chi cuadrado de 2.02, que es menos de 3.84. Esto
significa que la probabilidad de obtener un valor Chi cuadrado así por azar es más del 5%.
En otras palabras, los resultados de nuestro cuestionario son estadísticamente no
significativos. Así, nuestro cuestionario no permite hacer afirmación alguna sobre las
diferencias entre portugueses y españoles.
Cuando la prueba Chi se aplica a distribuciones que consisten en más de cuatro clases, es
probable que Chi cuadrado se haga mayor por la simple razón de que la fórmula Chi
cuadrado incluye más de cuatro términos que han de agregarse. Para neutralizar este
incremento, la prueba Chi requiere que demos una medida de la amplitud de nuestra tabla.
La medida para esto tiene un nombre peculiar, grado de libertad. El nombre indica el
número de las celdas de nuestra tabla que podrían cambiar cuando el número de casos es
constante.
Por ejemplo, si vamos a estudiar distribuciones en que exactamente cien personas están
clasificadas en seis grupos, el grado de libertad en cualquiera de esas distribuciones es
cinco. La explicación para esto es que cinco celdas de las seis están siempre libres para
recibir cualquier número de sujetos (entre 0 y 100); pero después de que las cinco celdas
han recibido su contenido, la sexta no tiene libertad para cambiar; estará determinada por el
total de 100.
Una tabla de 2 x 2 celdas tiene un grado de libertad de exactamente uno: si todas las celdas
cambiasen, todas las demás celdas tendrían que cambiar de acuerdo con ello; tienen
colectivamente un único grado de libertad.
2x2 1
2x3 2
2x4 3
2x5 4
3x3 4
3x4 6
La tabla siguiente da los valores que alcanza Chi cuadrado bajo la influencia sólo del azar,
con una probabilidad de 5%, 1% o bien 0.1%. Esta tabla incluye sólo pequeñas
distribuciones con un grado de libertad hasta 6. Encontraremos tablas mayores en los
manuales.
f 5% 1% 0,1 %
Prueba Cochran Q
La prueba Cochran Q puede usarse para evaluar la relación entre dos variables que se
miden en una escala nominal. Una de las variables puede incluso ser dicotómica, o consistir
en sólo dos valores posibles.
En el ejemplo siguiente se evaluaron por 12 sujetos cuatro combinaciones distintas de asientos
para camión y de cinturones de seguridad. La escala de evaluación era dicotómica: el cinturón
podía molestar al usuario (=1) o no molestarle (=0). (El ejemplo es de Raimo Nikkanen: Seat and
Seat-Belt Comfort in Heavy Commercial Vehicles in Finland.)
Las evaluaciones por sujetos A...L se dan en las filas 2...5. Además, la tabla indica las sumas para
cada combinación de asiento/cinturón, sumas para cada sujeto, cuadrados de ambas sumas y
sumas de estos cuadrados, que son entonces usados en la fórmula de la prueba Cochran.
2 Asiento de tipo I: 1 1 1 1 1 1 1 0 0 1 0 0 8 64
Total Total
6 Totales por cada sujeto = SH 2 3 4 4 1 4 4 0 2 4 2 2
S=32 =270
Total
7 Cuadrados de la fila precedente = SH2 4 9 16 16 1 16 16 0 4 16 4 4 -
=106
En el siguiente paso, los valores de la tabla se sitúan en la siguiente fórmula, que da entonces el
valor Q:
Todos los parámetros en esta fórmula se encuentran en la tabla, excepto k, que es el número de
alternativas (aquí = 4).
El valor de Q se hace mayor si hay asociación estadística entre las variables. Si no hay asociación y
solo actúa el azar, Q alcanza exactamente el mismo valor que Chi cuadrado. Esto significa que
cuando se evalúa el valor de Q que hemos recibido en una prueba, podemos usar la Tabla Chi
cuadrado mostrada anteriormente.
En una tabla de distribución del tipo de la de arriba, el grado de libertad es igual a k-1; en el
ejemplo de arriba es igual a 3.
En el ejemplo de arriba, el valor obtenido para Q fue de 7.63. Consultando la tabla de Chi
cuadrado encontramos que el resultado de arriba sería significativo solo sí Q tuviese un
valor de al menos 7.815. La prueba Q Cochran mostró así que la diferencia encontrada
empíricamente entre las alternativas de asientos no era estadísticamente significativa.
Prueba Wilcoxon
La fila 5, Orden de rango de las diferencias (ignorando el signo) significa que la diferencia más
pequeña de esta fila recibe el valor 1, la segunda el valor 2, etc. Los casos en que no hay
diferencia se descartan completamente. El valor 6.5 significa que las diferencias situadas en el
sexto y séptimo lugar eran iguales; con lo que les damos a ambas el mismo rango de 6.5.
La fila 6, Los casos de signo menos frecuente significa que tomamos de la fila 5 aquellos casos
donde el signo de la diferencia era del tipo menos común. En este ejemplo, había una minoría de
diferencias negativas. De aquellos casos únicamente tomamos sus rangos, de la fila 5. En el
ejemplo, el único número que se tomará será el 3.
1 Sujeto de la prueba: A B C D E F G H I J K L
5 Orden de rango de las diferencias (ignorando el signo): 3 6,5 9,5 12 9,5 9,5 3 6,5 3 9,5 3 3
En el siguiente paso, añadimos todos los números a la fila 6, ignorando sus signos. Llamamos a
esto suma T. En el ejemplo será 3.
Ahora es momento de mirar en la tabla de la prueba Wilcoxon en nuestro manual. Las filas de la
tabla son para diferentes números de pares (=N, aquí 12). En la fila correcta, encontramos,
encontramos Tmax = valor que T no debe exceder, o los resultados no serán significativos en un
nivel del 5%. Aquí debajo tenemos una parte de la tabla.
N= 6 7 8 9 10 11 12 13 14 15 16 17 18
Tmax= 1 2 4 6 8 11 14 17 21 25 30 35 40
En nuestro caso, el valor empírico (3) está claramente bajo el valor permisible, y así podemos
llamar significativos a nuestros resultados. Sería altamente improbable que se obtuviese una
diferencia tan amplia en las preferencias solamente por azar.
Arriba hemos comprobado distribuciones y mediciones en una escala ordinal. Estos tipos
de pruebas son bien explicadas en Sidney Siegel: Nonparametric statistics for the
behavioral sciences.
La prueba t
El efecto del azar hay que considerarlo siempre cuando calculamos una estadística
descriptiva, por ejemplo, una media o una correlación. Estas estadísticas siempre proceden
del algoritmo aparentemente exacto y digno de confianza, incluso en casos en que el
material subyacente es a la vez escaso y poco fiable.
Numero de
Si la correlación es al menos:
mediciones
La tabla indica que cuando una correlación de 0,956 se ha obtenido de solamente cuatro
pares de medidas, ella es significativa solamente en el nivel de 5%. Es decir si se ha
estudiado veinte muestras de este tamaño, una de ellas demuestra probablemente tal
correlación incluso en el caso que estas variables no han ninguna asociación en la
población.
Usted tiene, por ejemplo, encontró que entre una muestra aleatoria de sus clientes, p por
ciento de gente prefiere su producto a que de competidores. Usted quiere saber que es este
porcentaje entre la población entera de sus clientes. Es imposible saber este exactamente sin
preguntar todo ellos, pero usted puede calcular los valores entre que el porcentaje en la
población está con 95 %es de probabilidad. La fórmula para esto es:
donde
La prueba t puede también usarse para estimar la representatividad de la diferencia entre los
parámetros obtenidos a partir de dos muestras distintas, es decir, lo probable que también
las poblaciones correspondientes difieran entre ellas en una manera similar. El principio de
la prueba es el mismo. Una limitación de la prueba t es que sólo puede usarse para estimar
uno de dos parámetros a la vez.
Análisis de varianza
El análisis de varianza (en inglés ANOVA, ANalysis Of VAriance) examina dos o más
conjuntos de mediciones e intenta detectar diferencias estadísticamente representativas
entre los conjuntos.
Confiabilidad de la registración
¿Qué queremos decir con las palabras "factual" y "verdadero" y cómo determinamos la
factualidad de una afirmación?
En el curso del tiempo, los investigadores han interpretado la palabra "factual" de distintos
modos. Hoy la mayor parte de los investigadores están de acuerdo en que, en el mundo
empírico, el criterio correcto de una afirmación es su correspondencia con la realidad, no
con las autoridades, por ejemplo.
Tenemos que aceptar el hecho de que los estudios empíricos no pueden producir resultados
que sean ciertos con absoluta certeza. Sin embargo, incluso cuando sabemos que los
resultados pueden contener pequeños errores, los resultados pueden seguir siendo bastante
útiles para muchos fines prácticos. Por ejemplo, si creemos que los resultados de una
investigación son ciertos en un 99% de los casos, muy bien podemos asumir el riesgo de
usarlos y aceptar que el 1% de nuestra aplicación será fallido. Los beneficios con el 99 de
productos exitosos pueden compensar las pérdidas con el producto defectuoso.
1. Observaciónes cuantitativas. La dispersión de los datos, que se puede medir con e.g. su
varianza, da a menudo una buena indicación de su confiabilidad también. Los métodos de
prueba estadística de observaciones se discuten en Errores de Medición.
La ética de la reunión de datos. Si hay gente (otros que los investigadores) o animales
implicados en los procedimientos, éstos no se deben exponer al estrés o a la inconveniencia
excesiva. Hay una página separada en las consideraciones éticas en la investigación.
Un examen más detallado del análisis podría incluir algunas de las siguientes preguntas.
¿Se explican claramente los principios de interpretación de modo que otro investigador
pueda llegar a las mismas conclusiones a partir del material reunido?
¿Es nuestra interpretación la única razonable o es claramente, por lo menos, la más
verosímil entre las alternativas? Debemos pensarlo bien antes de contestar que sí, porque,
en la práctica, una vez que el investigador ha encontrado una interpretación sostenible, se
le hace difícil inventar otras alternativas, incluso aunque una persona ajena podría pensar
fácilmente en otras posibilidades. Podría ser una buena idea que discutiésemos las
alternativas con una persona ajena.
Cuán fuerte es la invariación que usted ha encontrado en los datos de entrada. ¿Es decir
todos los casos estudiados siguen el patrón general que usted ha encontrado y definido
con la ayuda de su modelo, o están allí muchas anomalías (es decir casos en el desacuerdo
con el modelo)? Si están, pueden indicar averías en las medidas o en el análisis, así que es
recomendable comprobar una vez más las fuentes posibles del error.
Una tercera explicación posible para las anomalías es simplemente que el fenómeno
era débil y tenía muchas irregularidades, que quizás pueden disminuir el valor
práctico de su trabajo. Según algunos filósofos, aún un solo caso donde su hipótesis
se ha encontrado falsa rendiría inútil la hipótesis entera. Otros dicen que un
porcentaje pequeño de anomalías es aceptable, porque otros investigadores pueden
explicarlas quizás más adelante. Para ayudar al trabajo de investigadores posteriores
del asunto usted debe dar los detalles completos sobre las anomalías en su informe.
Evaluar los resultados teóricos
Por la definición, los resultados
teóricos, o las ventajas de un
proyecto de investigación a su rama
de la ciencia son una edición central
en proyectos de la investigación
descriptiva. El mismo es verdad, a
un cierto grado, también en la
investigación normativa. Las
ventajas pueden estar de tres clases:
Nótese que las ventajas antedichas son posibles solamente a condición de que el nuevo
proyecto de investigación tenga conexiones inequívocas a teoría anterior en el campo de la
investigación apropiado. Por esta razón es muy importante que usted deba utilizar tales
definiciones que sean similares a ésas usadas en la investigación anterior. Entonces será
fácil que usted (y para su público) estime si sus resultados son coherentes con teoría
anterior o no. Coherencia no es una meta en sí mismo - apenas indica que su proyecto o
está agrandando nuestro conocimiento que prevalece o está conectando pedazos
previamente separados de la teoría existente con una teoría más grande.
Si el informe de investigación es una Tesis, será criticado por los examinadores oficiales y
los oponentes.
Cuando se presenta un nuevo informe de investigación a los editores de una serie de
publicaciones científicas, el informe será criticado no sólo por los editores, sino que
también lo será por revisores establecidos para la serie, que normalmente son científicos
expertos y reconocidos y por ello son capaces de presentar unas agudas observaciones
críticas.
Tras la publicación, nuestro informe atraerá muchas veces la atención de nuestros colegas
investigadores, y lo usarán como una base para nuevas hipótesis que están poniendo a
prueba en sus propios proyectos. Si la hipótesis del último proyecto falla
inesperadamente, el investigador respectivo puede volver un ojo crítico hacia el informe
anterior sobre el que se ha apoyado.
Si nuestros hallazgos son aplicados a problemas prácticos entre los ejercientes de la
profesión o en la producción industrial, pueden fallar al producir los resultados que
habíamos pronosticado. Las investigaciones sobre las razones del fallo normalmente
incluirán una verificación crítica de nuestros procesos y resultados.
Mientras nadie entre las personas arriba mencionadas encuentre todos los fallos en nuestro
informe, nuestros hallazgos ganarán, sin embargo, credibilidad durante el proceso. Los colegas y
profesionales empezarán de forma gradual a ver nuestros hallazgos como una base fiable para su
propio trabajo, del mismo modo que cuando ellos usan sus propias observaciones, las tablas que
se encuentran en los manuales, o todo lo que todos aceptan como ajustado a los hechos y
verdadero. A este proceso gradual se le llama en ocasiones método de confirmación por
"consenso".
"La ciencia no reposa sobre un fondo de roca. La audaz estructura de sus teorías se levanta como
si lo hiciera sobre un pantano. Es como un edificio erigido sobre pilones. Los pilones se clavan en el
fondo del pantano, pero no en una base "natural" o "dada"; y cuando cesamos en nuestros
intentos de hundir nuestros pilones en una capa más profunda, no es porque hayamos alcanzado
una base firme. Simplemente nos detenemos cuando estamos satisfechos porque son lo bastante
firmes como para aguantar la estructura, al menos por el momento". (Karl R. Popper: The Logic of
Scientific Discovery, 1959, p. 111. Texto original.)
El método normal para valorar el éxito práctico de un proyecto es comparar sus resultados a
los objetivos iniciales del proyecto. Aparte de estos resultados previstos, sucede a menudo
que áreas adicionales de aplicar los resultados han aparecido durante el proyecto. En todo
caso, el capítulo final del informe de la investigación es el lugar correcto para una
evaluación por el investigador de todas ventajas prácticas (y inconveniencias, si cualquiera)
posibles del proyecto. Debido a la gran variación de estas ventajas es difícil nombrar
cualquier método o lista de comprobación para el trabajo, pero algunas ideas para él se
pueden quizás encontrar en las páginas Evaluar propuestas normativas o Ética de la
aplicación
Prueba Q de Cochran
la prueba de Cochran Q es apropiado para bloques al azar-o los datos de medidas repetidas,
donde los valores son dicotómicos (representado por cero o cualquier número distinto de
cero). El test calcula un estadístico Q que se compara con un valor crítico de la distribución
Chi-cuadrado. La distribución Chi-cuadrado es una aproximación asintótica de la
distribución exacta de P. nula La hipótesis nula (H 0) es que la proporción de los no-
miembros de cero es el mismo para todas las columnas.
Block1 0 0 0 0 1
Block2 0 0 0 0 1
Block3 0 0 0 1 1
Block4 0 1 0 1 1
Block5 0 1 0 1 0
Block6 1 1 0 1 0
Block7 1 1 0 0 0
Block8 1 0 0 0 0
Block9 1 0 0 0 0
En este caso hay 5 columnas y 9 filas con un total de 45 entradas que implica que la
aproximación de Chi-cuadrado se puede utilizar (más de 4 columnas y 24 entires total).
Para ejecutar la prueba de ejecutar el siguiente comando:
StatsCochranTest / T = 1 / Q wave1
Puede ser un poco desconcertante que, a pesar del hecho de que la columna grupo 3 es
igual a cero, la prueba no sugiere el rechazo de la hipótesis nula donde la proporción de
"ON" bloques es el mismo en todos los grupos.
Mantener la columna Group3 fija, puede aumentar la proporción de "ON" bloques en todas
las columnas hasta que el valor de Q excede el valor crítico. Esto se hace en Wave2 se
muestra a continuación.
Block1 0 0 0 0 1
Block2 0 0 0 0 1
Block3 0 0 0 1 1
Block4 0 1 0 1 1
Block5 1 1 0 1 1
Block6 1 1 0 1 1
Block7 1 1 0 1 0
Block8 1 1 0 0 0
Block9 1 0 0 0 0
StatsCochranTest / T = 1 / Q Wave2
Como era de esperar la prueba estadística se ha incrementado por encima del valor crítico
por lo que la H 0 debe ser rechazada, es decir, la proporción de no-cero de las entradas en
las diferentes columnas no es lo mismo.
Prueba de Cochran
En el análisis de dos vías diseño de bloques al azar donde la variable respuesta sólo puede
tomar dos posibles resultados (codificado como 0 y 1), la prueba de Cochran (también
llamado prueba de Cochran Q) es un no-paramétrica prueba estadística de si los
tratamientos k tiene efectos idénticos. [1] [2] Es el nombre de William Gemmell Cochran .
Contenido
[hide]
1 Antecedentes
2 Descripción
3 Región crítica
4 Supuestos
5 pruebas relacionadas
6 Referencias
[ editar ] Antecedentes
La prueba de Cochran se supone que hay k> 2 tratamientos experimentales y que las
observaciones se organizan en la letra b bloques , es decir,
Bloque 1 X 11 X 12 X 1k
Bloque 2 X 21 X 22 X 2k
Bloque 3 X 31 X 32 X 3k
Bloque B X b 1 X b2 X bk
[ editar ] Descripción
La prueba de Cochran es
donde
k es el número de tratamientos
b es el número de bloques
[ editar ] Supuestos
La prueba de Cochran se basa en los siguientes supuestos:
[ editar ] Referencias
1. ^ Conover, Jay William (1999). práctica estadística no paramétrica (Tercera Edición ed.).
Wiley, New York, NY EE.UU.. pp 388-395. ISBN 0471160687 9780471160687 .
2. ^ Instituto Nacional de Estándares y Tecnología. prueba de Cochran
Este artículo incorpora material de dominio público de sitios web o documentos del
Instituto Nacional de Estándares y Tecnología .
Contenido
[hide]
1 Introducción
2 Interpretación y el papel
3 Aplicación de la genética
4 Véase también
5 Referencias
[ editar ] Introducción
La prueba de tendencia se aplica cuando los datos en forma de un 2 × k tabla de
contingencia . Por ejemplo, si k = 3 tenemos
A = 1 N 11 N 12 N 13
A = 2 N 21 N 22 N 23
Esta tabla se puede completar con los totales marginales de las dos variables
B = 1 B = 2 B = 3 Suma
A = 1 N 11 N 12 N 13 R1
A = 2 N 21 N 22 N 23 R2
Suma C 1 C2 C3 N
donde el t i son los pesos, y la diferencia de la N-1 i I 2 - N 2 1 puede ser i R visto como la
diferencia entre N 1 y 2 i N i después de la nueva ponderación de las filas de tener el mismo
total.
El t i pesos pueden ser elegidos de manera que la prueba de tendencia a nivel local se
convierte en más potente para la detección de determinados tipos de asociaciones. Por
ejemplo, si k = 3 y sospechamos que B = 1 y B = 2 tienen frecuencias similares (dentro de
cada fila), pero que B = 3 tiene una frecuencia diferente, entonces el t pesos = (1,1,0) debe
ser utilizado. Si sospecha que hay una tendencia lineal en las frecuencias, el t pesos =
(0,1,2) se debe utilizar. Estos pesos son también de uso frecuente cuando las frecuencias se
sospecha que el cambio monótonamente con B, aunque la tendencia no es necesariamente
lineal.
[ editar ] Interpretación y el papel
La prueba de tendencia tienen mayor poder que la prueba de chi-cuadrado cuando la
tendencia se sospecha es correcta, pero la capacidad de detectar tendencias insospechadas
se sacrifica. Este es un ejemplo de una técnica general de la dirección de las pruebas de
hipótesis hacia el estrecho alternativas . La prueba de tendencia explota la dirección efecto
sospechosos para aumentar la potencia, pero esto no afecta a la distribución muestral del
estadístico de prueba bajo la hipótesis nula . Por lo tanto, la tendencia se sospecha de los
efectos no es un supuesto que debe tener para que los resultados de la prueba para que
tenga sentido.
Controles 20 20 20 60
Casos 10 20 30 60
Suma 30 40 50 120
En el ejemplo numérico, la estadística de prueba normalizada para los vectores de peso son
diferentes
1,1,0 1.85
0,1,1 -2.1
0,1,2 -2.3