Você está na página 1de 8

LA ESTADSTICA

Es una rama de las matemticas y una herramienta que estudia usos y anlisis provenientes de una muestra representativa
de datos, que busca explicar las correlaciones y dependencias de un fenmeno fsico o natural, de ocurrencia en forma
aleatoria o condicional.

Tcnicas de anlisis estadstico

1. Prueba t de Student
La estimacin puntual consiste en utilizar el valor de un estadstico, denominado estimador, para calcular el valor de un
parmetro desconocido de una poblacin. Por ejemplo, cuando usamos la media muestral para estimar la media de una
poblacin, o la proporcin de una muestra para estimar el parmetro de una distribucin binomial.

Una estimacin puntual de algn parmetro de una poblacin es un solo valor obtenido a partir de un estadstico.

2. Prueba de
En estadstica y estadstica aplicada se denomina prueba (pronunciado como ji cuadrado y a veces como chi
cuadrado) a cualquier prueba en la que el estadstico utilizado sigue una distribucin si la hiptesis nula es cierta.
Algunos ejemplos de pruebas son:
La prueba de Pearson, la cual tiene numerosas aplicaciones:
La prueba de frecuencias
La prueba de independencia
La prueba de bondad de ajuste
La frmula que da el estadstico es la siguiente:

Cuanto mayor sea el valor de , menos verosmil es que la hiptesis nula (que asume la igualdad entre ambas distribuciones)
sea correcta. De la misma forma, cuanto ms se aproxima a cero el valor de chi-cuadrado, ms ajustadas estn ambas
distribuciones.
Los grados de libertad gl vienen dados por :

Donde r es el nmero de filas y k el de columnas.


Criterio de decisin:
3. Anlisis de varianza (ANOVA)
En estadstica, el anlisis de la varianza (ANOVA, ANalysis Of VAriance, segn terminologa inglesa) es una coleccin
de modelos estadsticos y sus procedimientos asociados, en el cual la varianza est particionada en ciertos componentes
debidos a diferentes variables explicativas.
Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el estadstico y genetista R. A. Fisher en los aos
1920 y 1930 y es algunas veces conocido como "Anova de Fisher" o "anlisis de varianza de Fisher", debido al uso de la
distribucin F de Fisher como parte del contraste de hiptesis.

4. U de Mann-Whitney
En estadstica la prueba U de Mann-Whitney (tambin llamada de Mann-Whitney-Wilcoxon, prueba de suma de rangos
Wilcoxon, o prueba de Wilcoxon-Mann-Whitney) es una prueba no paramtrica aplicada a dos muestras independientes.
Es, de hecho, la versin no paramtrica de la habitual prueba t de Student.
Fue propuesto inicialmente en 1945 por Frank Wilcoxon para muestras de igual tamaos y extendido a muestras de tamao
arbitrario como en otros sentidos por Henry B. Mann y D. R. Whitney en 1947.
5. Anlisis de regresin
En estadstica, el anlisis de la regresin es un proceso estadstico para estimar las relaciones entre variables. Incluye
muchas tcnicas para el modelado y anlisis de diversas variables, cuando la atencin se centra en la relacin entre una
variable dependiente y una o ms variables independientes (o predictoras)

6. Correlacin
La correlacin es la forma numrica en la que la estadstica ha podido evaluar la relacin de dos o ms variables, es decir,
mide la dependencia de una variable con respecto de otra variable independiente.

Para poder entender esta relacin tendremos que analizarlo en forma grfica:

Si tenemos los datos que se presentan en la tabla y consideramos que la edad


edad peso determina el peso de las personas entonces podremos observar la siguiente grfica:
demanda
15 60 Donde los puntos 150
representan cada uno 1698 47
30 75 de los pares 100 2045 15
ordenados y la lnea 50 1348 100
18 67 1268 120
podra ser una recta
que represente la 0
42 80 1000 1500 2000
tendencia de los
datos, que
28 en otras palabras
60 podra decirse que se
observa que a mayor edad mayor peso.
19 65
La correlacin se puede explicar con la pendiente de esa
recta estimada
31 y de esta
92 forma nos podemos dar cuenta
que tambin existe el caso en el que al crecer la variable
independiente decrezca la variable dependiente. En aquellas rectas estimadas cuya pendiente sea cero entonces
podremos decir que no existe correlacin.

7. Iconografa de las correlaciones


La iconografa de las correlaciones, uno de los mtodos de anlisis de datos,
consiste en reemplazar una matriz de correlacin por un esquema o grafo donde las
correlaciones notables son representadas por un trazo continuo (correlacin
positiva), o un trazo punteado (correlacin negativa).

A partir de un cuadro de datos (por ejemplo, una hoja de clculo) que contiene
columnas (variables) y lneas (observaciones de estas variables), la iconografa
de las correlaciones elimina las falsas buenas correlaciones entre estas variables,
esto es, las que se deben a una tercera variable, y detecta las correlaciones
enmascaradas. El esquema final, que presenta solo los vnculos directos entre
las variables cualitativas y\o cuantitativas, es un medio de percibir de una ojeada lo
esencial, sobre una figura nica, quitando las redundancias.
8. Frecuencia estadstica
En estadstica, la frecuencia (o frecuencia absoluta) de un evento i, es el
nmero de veces en que dicho evento se repite durante un experimento o
muestra estadstica. Comnmente, la distribucin de la frecuencia suele
visualizarse con el uso de histogramas.

EJEMPLO:
Supongamos que las calificaciones de un estudiante de secundaria fueran las
siguientes:
18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13. Entonces:
La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.
La frecuencia relativa de 11 es 0.17, porque corresponde a la divisin 3/18 ( 3 de las veces que aparece de las 18
notas que aparecen en total).
La frecuencia absoluta acumulada para el valor 11 es 7, porque hay 7 valores menores o iguales a 11.
La frecuencia relativa acumulada para el valor 11 es 0.38, porque corresponde a la divisin 7/18 (frecuencia
absoluta acumulada dividida entre el nmero total de muestras).

9. Anlisis de frecuencia acumulada


La frecuencia acumulada o frecuencia acumulativa es la frecuencia de
ocurrencia de valores de un fenmeno menor que un valor de referencia. El
fenmeno puede ser un variable aleatoria que varia en el tiempo o en el espacio.
La frecuencia acumulada se llama tambin frecuencia de noexcedencia. El
anlisis de la frecuencia acumulada se hace con el propsito de obtener una
idea de cuantas veces ocurrira un cierto fenmeno lo que puede ser
instrumental en describir o explicar una situacin en la cual el fenmeno juega
un papel importante, o en planificar intervenciones, por ejemplo en el control de
inundaciones.

10. Prueba de la diferencia menos significante de Fisher


En estadstica se denomina prueba F de Snedecor a cualquier prueba en la que el estadstico utilizado sigue una
distribucin F si la hiptesis nula no puede ser rechazada. El nombre fue acuado en honor a Ronald Fisher.
La hiptesis de que las medias de mltiples poblaciones normalmente distribuidas y con la misma desviacin
estndar son iguales. Esta es, quizs, la ms conocida de las hiptesis verificada mediante el test F y el problema
ms simple del anlisis de varianza.
La hiptesis de que las desviaciones estndar de dos poblaciones normalmente distribuidas son iguales, lo cual
se cumple.
En muchos casos, el test F puede resolverse mediante un proceso directo. Se requieren dos modelos de regresin, uno
de los cuales restringe uno o ms de los coeficientes de regresin conforme a la hiptesis nula. El test entonces se basa
en un cociente modificado de la suma de cuadrados de residuos de los dos modelos como sigue:
El estadstico F puede calcularse como:

Donde:
RSS_0 se refiere al coeficiente de determinacin del modelo sin restringir (R^2)
RSS_1 se refiere al coeficiente de determinacin del modelo restringido (R^2)
m se refiere al nmero de restricciones impuestas a los coeficientes estimados (coficientes restringidos).
k se refiere al nmero de coeficientes estimados en el modelo sin restricciones.
n se refiere al nmero de observaciones del modelo.
El valor resultante debe entonces compararse con el valor correspondiente de la tabla de valores crticos.
Si F_calculado > F_tablas; rechazo el modelo restringido.
11. Coeficiente de correlacin de Pearson
En estadstica, el coeficiente de correlacin de Pearson es una medida de la
relacin lineal entre dos variables aleatorias cuantitativas. A diferencia de la
covarianza, la correlacin de Pearson es independiente de la escala de medida
de las variables.

De manera menos formal, podemos definir el coeficiente de correlacin de


Pearson como un ndice que puede utilizarse para medir el grado de relacin
de dos variables siempre y cuando ambas sean cuantitativas.

12. Coeficiente de correlacin de Spearman


En estadstica, el coeficiente de correlacin de Spearman, (rho) es una medida
de la correlacin (la asociacin o interdependencia) entre dos variables aleatorias
continuas. Para calcular , los datos son ordenados y reemplazados por su
respectivo orden.
El estadstico viene dado por la expresin:

donde D es la diferencia entre los correspondientes estadsticos de orden de x - y.


N es el nmero de parejas.

Se tiene que considerar la existencia de datos idnticos a la hora de ordenarlos,


aunque si stos son pocos, se puede ignorar tal circunstancia

Para muestras mayores de 20 observaciones, podemos utilizar la siguiente


aproximacin a la distribucin t de Student

La interpretacin de coeficiente de Spearman es igual que la del coeficiente de correlacin de Pearson. Oscila entre -1 y
+1, indicndonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlacin pero no
independencia. La tau de Kendall es un coeficiente de correlacin por rangos, inversiones entre dos ordenaciones de una
distribucin normal bivariante.

13. Anlisis factorial exploratorio


El Anlisis Factorial Exploratorio (AFE) [Exploratory Factor Analysis;
EFA] es una tcnica estadstica que permite explorar con mayor
precisin las dimensiones subyacentes, constructos o variables
latentes de las variables observadas, es decir, las que observa y mide
el investigador. Si, por ejemplo, para los propsitos de un estudio se
elabora o se adapta una batera de pruebas (pruebas de medicin de
constructos cognitivos, cuestionarios de variables afectivas), el AFE se
aplica con el objetivo de comprobar hasta qu punto estos
instrumentos o los tems que los conforman representan
adecuadamente los constructos latentes de inters o diferentes
dimensiones del mismo constructo. Asimismo, el AFE sera una valiosa
tcnica para examinar en qu medida ciertos indicadores cuantitativos
utilizados en el campo de la Adquisicin de Segundas Lenguas (ASL)
(por ejemplo, ndice de subordinacin, longitud promedio de la clusula
y de la unidad terminal) representan adecuadamente diferentes
constructos o componentes de la actuacin y del desarrollo lingstico
de los aprendientes de lengua extranjera (LE) (por ejemplo,
complejidad sintctica, precisin lingstica, fluidez, etc.).
14. Anlisis factorial confirmatorio
El anlisis factorial confirmatorio, AFC, trata de
determinar si el nmero de factores obtenidos y sus
cargas se corresponden con los que cabra esperar a
la luz de una teora previa acerca de los datos. La
hiptesis a priori es que existen unos determinados
factores preestablecidos y que cada uno de ellos est
asociado con un determinado subconjunto de las
variables. El anlisis factorial confirmatorio entonces
arroja un nivel de confianza para poder aceptar o
rechazar dicha hiptesis. El anlisis factorial se utiliza
para identificar factores que expliquen una variedad
de resultados en diferentes pruebas. Por ejemplo,
investigacin en inteligencia halla que la gente que
obtienen una nota alta en una prueba de habilidad
verbal tambin se desempea bien en pruebas que
requieren habilidades verbales. Los investigadores
explican esto mediante el uso de anlisis factorial para
aislar un factor a menudo llamado inteligencia
cristalizada o inteligencia verbal, que representa el
grado en el cual alguien es capaz de resolver
problemas usando habilidades verbales.

15. Grfica estadstica


La estadstica grfica es la descripcin e interpretacin de datos e inferencias sobre stos. Forma parte de los programas
estadsticos usados con los ordenadores. Autores como Edward R. Tufte desarrollaron nuevas soluciones de anlisis
grficos.
Un grfico o representacin grfica es un tipo de representacin de datos, generalmente numricos, mediante recursos
grficos (lneas, vectores, superficies o smbolos), para que se manifieste visualmente la relacin matemtica o correlacin
estadstica que guardan entre s. Tambin es el nombre de un conjunto de puntos que se plasman en coordenadas
cartesianas y sirven para analizar el comportamiento de un proceso o un conjunto de elementos o signos que permiten la
interpretacin de un fenmeno. La representacin grfica permite establecer valores que no se han obtenido
experimentalmente sino mediante la interpolacin (lectura entre puntos) y la extrapolacin (valores fuera del intervalo
experimental).
16. Tcnica de los Grficos
Son apropiaos para comparar el tamao de varias cantidades. Se emplean para analizar relaciones cuantitativas,
tales como nmero de fallos por mquina, nmero de Defectos por proceso, etc.

17. Diagramas de Pareto


Son grficos de barras especializados que pueden emplearse para mostrar frecuencia relativa de hechos tales
como productos defectuosos, reclamaciones de clientes, no conformidades, etc.

18. Diagramas de Causas-Efecto


Se utilizan para clarificar las causas de un problema y pueden aplicarse en cualquier proceso. En el lado de las
causas estn factores tales como: materiales, maquinaria y equipo, mtodos de operacin, operarios, etc. En el lado de
los efectos se incluye: calidad del producto, costos, cantidad de produccin, plazo de entrega, etc.
19. Histogramas
En un diagrama de distribucin de frecuencias, construido con los
datos recogidos en una tabla. Se utiliza para determinar si se satisfacen las
especificaciones de un producto o proceso.
En estadstica, un histograma es una representacin grfica de una variable
en forma de barras, donde la superficie de cada barra es proporcional a la
frecuencia de los valores representados. Sirven para obtener una "primera
vista" general, o panorama, de la distribucin de la poblacin, o de la muestra,
respecto a una caracterstica, cuantitativa y continua (como la longitud o el
peso). De esta manera ofrece una visin de grupo permitiendo observar una
preferencia, o tendencia, por parte de la muestra o poblacin por ubicarse
hacia una determinada regin de valores dentro del espectro de valores
posibles (sean infinitos o no) que pueda adquirir la caracterstica. As pues,
podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisin entre los valores de todas
las partes que componen la poblacin o la muestra, o, en contraposicin, poder observar el grado de variabilidad, y por
ende, la dispersin de todos los valores que toman las partes, tambin es posible no evidenciar ninguna tendencia y obtener
que cada miembro de la poblacin toma por su lado y adquiere un valor de la caracterstica aleatoriamente sin mostrar
ninguna preferencia o tendencia, entre otras cosas.

20. Grficos de Control


Se utilizan para evaluar y mantener la estabilidad de un proceso. Los grficos de control pueden clasificarse
segn las caractersticas a estudiar:
-Por variables (Grfico X Grfico X- R).
-Por atributos (Proporcin defectuosa, N de defecto, etc.).

Los Grficos de control sirven para poder analizar el comportamiento de los diferentes procesos y poder prever posibles
fallos de produccin mediante mtodos estadsticos. Estas se utilizan en la mayora de los procesos industriales.