Você está na página 1de 31

Introduccin

La estadstica es una ciencia formal, rama de la matemtica, y una


herramienta que estudia el uso y los anlisis provenientes de una
muestra representativa de datos en donde se busca explicar las
correlaciones y dependencias de un fenmeno fsico o natural, de
ocurrencia aleatoria o condicional.
El trmino alemn Statistik, introducido originalmente por
Gottfried Achenwall en 1749 haca referencia al anlisis de los datos del
Estado. Tambin se llam aritmtica poltica de acuerdo con la
traduccin literal del ingls. En el siglo XIX fue cuando el trmino
estadstica adquiri el significado de recolectar y clasificar datos;
concepto que fue introducido por primera vez por el militar britnico sir
John Sinclair.
Originalmente la estadstica estuvo asociada con el estudio
demogrfico de ciudades o estados, donde se hacan estudios de
crecimiento poblacional gracias a la informacin obtenida de los censos.
Pero con el pasar del tiempo el gran poder de la estadstica empez a
ser utilizado en diferentes reas de la ciencia como la fsica, la qumica,
la medicina; y en un sinfn de reas diversas como la economa, la
geografa, la seguridad, entre otras.
Debido a que la estadstica nos permite obtener informacin
acerca de los resultados que se obtendrn en un determinado fenmeno
o acontecimiento futuro, la importancia de esta ciencia formal es dems
de evidente. Por ejemplo, gracias a la estadstica se puede determinar
en qu momento resulta pertinente hacerle mantenimiento a un sistema
de suministro de electricidad para evitar as qu ste falle y ocasione
problemas o prdidas graves.
Pero para que se puedan obtener resultados que nos ayuden a
prever lo que suceder en un determinado fenmeno o acontecimiento,
es necesaria la aplicacin de diferentes conceptos, mecanismo y
tcnicas estadsticas, con fundamentos matemticos rigurosos, que
garanticen la exactitud y el xito de los clculos realizados. La
distribucin de frecuencia, la distribucin de probabilidad y las tcnicas
de regresin y correlacin lineal son unas de las tcnicas que conforman
la columna vertebral de la estadstica.
En el presente trabajo se definirn las diferentes tcnicas
mencionadas en el prrafo anterior as como tambin se explicarn
conceptos inherentes a las mismas que son fundamentales para la
compresin de dichas tcnicas estadsticas. En algunos casos se
proveern ejemplos que ayudan a comprender de mejor manera los

conceptos y muestran la utilidad de las tcnicas estadsticas en


fenmenos o acontecimientos de la vida real.

Desarrollo
1.- Distribucin de Frecuencia
La distribucin de frecuencia o tabla de frecuencias es una
ordenacin en forma de tabla de los datos estadsticos en donde se le
asigna a cada dato su frecuencia correspondiente; siendo la frecuencia
el nmero de veces que dicho dato o valor aparece en el estudio. Esta
agrupacin permite ubicar los datos en categoras mutuamente
excluyentes que indican el nmero de observaciones en cada categora.
La distribucin de frecuencia es de gran utilidad en muchas reas
cientficas ya que permite analizar un conjunto de datos, sin la
necesidad de considerar cada dato individualmente; cosa que suele
hacerse en los procedimientos cientficos.
a.- Variables discretas
Una variable discreta, denominada muchas veces variable digital
(del trmino dgito) es una variable que slo puede tomar valores dentro
de un conjunto determinado de nmeros, es decir, no acepta cualquier
valor sino slo aquellos que pertenecen al conjunto.
Se puede decir que este tipo de variable toma valores aislados ya
que no admite valores intermedios entre dos valores especficos. Como
ejemplos de este tipo de variables tenemos: los valores de un dado, el
nmero de primos de 4 amigos, la cantidad de alumnos con lentes en un
aula, etc.
b.- Variables continuas
Son aquellas que pueden tomar un valor cualquiera dentro de un
intervalo predeterminado. Una caracterstica de este tipo de variables es
que, a diferencia de las variables discreta, nunca puede ser medida con

exactitud; el valor observado depender de la exactitud o precisin de


los instrumentos de medicin utilizados.
Como ejemplo de este tipo de variables podemos mencionar: la
altura de una persona, la corriente que fluye por un conductor, la
temperatura de un material, etc.
c.- Poblacin y Muestra
Poblacin
La poblacin, universo o colectivo, en estadstica, es el conjunto de
todos los elementos que cumplen ciertas propiedades y entre los cuales
se desea estudiar un determinado fenmeno (pueden ser hogares,
nmeros de tuercas producidos por una fbrica en un mes, poblacin de
nios de una ciudad, etc).
La poblacin es el conjunto sobre el que estamos interesados en
obtener conclusiones, hacer indagaciones y sobre el cual van a recaer
las observaciones.
Normalmente es demasiado grande para poder
abarcarlo y por eso se recurre a al anlisis de slo una muestra de dicha
poblacin.
Muestra
En estadstica, una muestra es un subconjunto de casos o
individuos de una poblacin estadstica. Las muestras se obtienen con la
intencin de inferir propiedades de la totalidad de la poblacin, para lo
cual deben ser representativas de las mismas. Para cumplir esta
caracterstica, la inclusin de sujetos en la muestra debe seguir una
tcnica de muestreo, que garantice que cada uno de los sujetos o
elementos que han sido seleccionados para la muestra cumpla con
ciertos requisitos.
El nmero de sujetos que componen la muestra suele ser bastante
inferior a la poblacin total, aunque suficientemente grande como para
que la estimacin de los parmetros determinados tenga un nivel de
confianza adecuado.
En ocasiones, el muestreo puede ser exacto que el estudio de toda
la poblacin porque el manejo de un menor nmero de datos provoca
tambin menos errores en su manipulacin.
d.- Media y Varianza
Media

La media aritmtica (tambin llamada promedio o simplemente


media) de un conjunto finito de nmeros es el valor caracterstico de una
serie de datos cuantitativos objeto de estudio que parte del principio de
la esperanza matemtica o valor esperado, se obtiene a partir de la
suma de todos sus valores dividida entre el nmero de sumandos.
Cuando el conjunto es una muestra aleatoria recibe el nombre de media
muestral siendo uno de los principales estadsticos muestrales.
En sntesis, la media es la cantidad total de la variable distribuida
a partes iguales entre cada observacin.
Dados los n nmeros
como:

, la media aritmtica se define

Varianza
Es la media aritmtica del cuadrado de las desviaciones respecto a
la media de una distribucin estadstica.

La varianza se representa por

Varianza para datos agrupados

Para simplificar el clculo de la varianza vamos o utilizar las siguientes


expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Propiedades de la varianza

La varianza ser siempre un valor positivo o cero, en el caso de que las


puntuaciones sean iguales.

Si a todos los valores de la variable se les suma un nmero la varianza


no vara.

Si todos los valores de la variable se multiplican por un nmero la


varianza queda multiplicada por el cuadrado de dicho nmero.

Si tenemos varias distribuciones con la misma media y conocemos sus


respectivas varianzas se puede calcular la varianza total.

e.- Histograma de Frecuencia

El histograma es aquella representacin grfica de estadsticas de


diferentes tipos. La utilidad del histograma tiene que ver con la
posibilidad de establecer de manera visual, ordenada y fcilmente
comprensible todos los datos numricos estadsticos que pueden
tornarse difciles de entender. Hay muchos tipos de histogramas y cada
uno se ajusta a diferentes necesidades como tambin a diferentes tipos
de informacin.
Los histogramas son utilizados siempre por la ciencia estadstica.
Su funcin es exponer grficamente nmeros, variables y cifras de modo
que los resultados se visualicen ms clara y ordenadamente. El
histograma es siempre una representacin en barras y por eso es
importante no confundirlo con otro tipo de grficos como las tortas. Se
estima que por el tipo de informacin brindada y por la manera en que
sta es dispuesta, los histogramas son de especial utilidad y eficacia
para las ciencias sociales ya que permiten comparar datos sociales
como los resultados de un censo, la cantidad de mujeres y/o hombres en
una comunidad, el nivel de analfabetismo o mortandad infantil, entre
otros.
Para un histograma existen dos tipos de informaciones bsicas
(que pueden ser complementados o no de acuerdo a la complejidad del
diseo): la frecuencia de los valores y los valores en s. Normalmente, las
frecuencias son representadas en el eje vertical mientras que en el
horizontal se representan los valores de cada una de las variables (que
aparecen en el histograma como barras bidimensionales o
tridimensionales).
Existen diferentes tipos de histogramas. Los histogramas de barras
simples son los ms comunes y utilizados. Tambin estn los
histogramas de barras compuestas que permiten introducir informacin
sobre dos variables. Luego estn los histogramas de barras agrupadas
segn informacin y por ltimo el polgono de frecuencias y la ojiva
porcentual, ambos sistemas utilizados normalmente por expertos.
Trabajar con histogramas es muy simple y seguramente proveer con
una mejor comprensin de diferente tipo de datos e informacin.
Tipos de histogramas:

Diagramas de barras simples

Representa la frecuencia simple (absoluta o relativa) mediante la altura


de la barra la cual es proporcional a la frecuencia simple de la categora
que representa.
Diagramas de barras compuesta.
Se usa para representar la informacin de una tabla de doble entrada o
sea a partir de dos variables, las cuales se representan as; la altura de
la barra representa la frecuencia simple de las modalidades o categoras
de la variable y esta altura es proporcional a la frecuencia simple de
cada modalidad.
Diagramas de barras agrupadas.
Se usa para representar la informacin de una tabla de doble entrada o
sea a partir de dos variables, el cual es representado mediante un
conjunto de barras como se clasifican respecto a las diferentes
modalidades.
Polgono de frecuencias.
Es un grfico de lneas que de las frecuencias absolutas de los valores
de una distribucin en el cual la altura del punto asociado a un valor de
las variables es proporcional a la frecuencia de dicho valor.
Ojiva porcentual.
Es un grfico acumulativo, el cual es muy til cuando se quiere
representar el rango porcentual de cada valor en una distribucin de
frecuencias. En los grficos las barras se encuentran juntas y en la tabla
los nmeros poseen en el primer miembro un corchete y en el segundo
un parntesis.
Construccin de un histograma.

Paso 1: Determinar el rango de los datos. R= Vmax Vmin

Paso 2: Obtener los nmeros de clases, clase se denota con la


letra (K). K= n

Paso 3: Establecer la longitud de clase: es igual al rango entre el


nmero de clases.

Paso 4: Construir los intervalos de clases: Los intervalos resultan


de dividir el rango de los datos en relacin al resultado del Paso 2
en intervalos iguales.

Paso 5: Graficar el histograma: En caso de que las clases sean


todas de la misma amplitud, se hace un grfico de barras, las

bases de las barras son los intervalos de clases y altura son la


frecuencia de las clases. Si se unen los puntos medios de la base
superior de los rectngulos se obtiene el polgono de frecuencias.
Ejemplos:
Hay histogramas donde se agrupan los datos en clases, y se
cuenta cuntas observaciones (frecuencia absoluta) hay en cada una de
ellas. En algunas variables (variables cualitativas) las clases estn
definidas de modo natural, p.e sexo con dos clases: mujer, varn o grupo
sanguneo con cuatro: A, B, AB, O. En las variables cuantitativas, las
clases hay que definirlas explcitamente (intervalos de clase).

Se representan los intervalos de clase en el eje de abscisas (eje


horizontal) y las frecuencias, absolutas o relativas, en el de ordenadas
(eje vertical) y las frecuencias, absolutas o relativas, en el de ordenadas
(eje vertical).
A veces es ms til representar las frecuencias compuestas.

O representar simultneamente los histogramas de una variable en dos


situaciones distintas.
Otra forma muy frecuente, de representar dos histogramas de la misma
variable en dos situaciones distintas.

Otra forma muy frecuente, de representar dos histogramas de la misma


variable en dos situaciones distintas.
f.- Polgono de Frecuencia
Polgono de frecuencia es el nombre que recibe una clase de
grfico que se crea a partir de un histograma de frecuencia. Estos
histogramas emplean columnas verticales para reflejar frecuencias): el
polgono de frecuencia es realizado uniendo los puntos de mayor altura
de estas columnas.
Es decir, por tanto, podramos establecer que un polgono de
frecuencia es aquel que se forma a partir de la unin de los distintos
puntos medios de las cimas de las columnas que configuran lo que es un
histograma de frecuencia. Este se caracteriza porque utiliza siempre lo
que son columnas de tipo vertical y porque nunca debe haber espacios
entre lo que son unas y otras.
En las ciencias sociales, en las ciencias naturales y tambin en las
econmicas es donde con ms frecuencia se hace uso de estos
mencionados histogramas ya que se emplean para llevar a cabo lo que
es la comparacin de los resultados de un proceso determinado.
Caractersticas de los polgonos de frecuencias.

No muestran frecuencias acumuladas.


Se prefiere para el tratamiento de datos cuantitativos.

El punto con mayor altura representa la mayor frecuencia.


Suelen utilizarse para representar tablas tipo B.
El rea bajo la curva representa el 100% de los datos. El polgono
de frecuencia est diseado para mantener la misma rea de las
columnas.

Ejemplo:
Las temperaturas en un da de otoo de una ciudad han sufrido las
siguientes variaciones:

Ejemplo:
El peso de 65 personas adultas viene dado por la siguiente tabla:

2.- Distribuciones de Probabilidad

En teora de la probabilidad y estadstica, la distribucin de


probabilidad de una variable aleatoria es una funcin que asigna a cada
suceso definido sobre la variable aleatoria la probabilidad de que dicho
suceso ocurra. Dicho de otra manera, una distribucin de probabilidad
indica toda la gama de valores que pueden representarse como
resultado de un experimento si ste se llevase a cabo.
Constituye una herramienta fundamental para la prospectiva, ya
que se puede disear un escenario de acontecimientos futuros
considerando las tendencias actuales de diversos fenmenos naturales.
Esto nos permite adivinar o saber lo que ocurrir, probablemente, en
un determinado experimento o situacin de estudio.
Existen varias distribuciones de probabilidad, algunas de ellas son:
distribucin normal, distribucin binomial, distribucin de Poisson,
distribucin de chi cuadrado, y la distribucin de Weibull.
Antes de definir y explicar los diferentes tipo de distribuciones de
probabilidad antes mencionada es pertinente que definamos los
trminos: Probabilidad y variables aleatorias continuas.
a.- Probabilidad
Conjunto de reglas que permiten determinar el porcentaje de
posibilidades o frecuencia de que un suceso se realice. La probabilidad
mide la frecuencia con la que se obtiene un resultado o conjunto de
resultados, al llevar a cabo un experimento aleatorio, del que se
conocen todos los resultados posibles. La teora de la probabilidad se
usa extensamente en reas como la estadstica, la fsica, la matemtica,
la ciencia y la filosofa para sacar conclusiones sobre la probabilidad de
sucesos potenciales y la mecnica subyacente de sistemas complejos.

Ejemplo 1. Hallar la probabilidad de que al lanzar al aire dos monedas,


salgan:
a) Dos caras.

b) Dos cruces.

c) Dos caras y una cruz.

Ejemplo 2. Se lanzan dos dados al aire y se anota la suma de los puntos


obtenidos. Se pide:
a) La probabilidad de que salga el 7

b) La probabilidad de que el nmero obtenido sea par

c) La probabilidad de que el nmero obtenido sea mltiplo de tres

Ejemplo 3. La vida media de una lmpara, segn el fabricante, es de 68


meses, con una desviacin tpica de 5. Se supone que se distribuye
segn una distribucin normal En un lote de 10.000 lmparas. a)
Cuntas lmparas superarn previsiblemente los 75 meses?. b)
Cuntas lmparas se estropearn antes de 60 meses?
a) t = (75 -68)/5 = 1,4
P (X > 75) = (t > 1,4) = 1 - P (t 1,4) = 1 - 0,9192 = 0,0808
Luego, el 8,08% de las lmparas (808 lmparas) superarn los 75 meses
b) t = (60 -68)/5 = -1,6
P (X 60) = (t -1,6) = P (t> 1,6) = 1 - P (t 1,6) = 0,0548
Luego, el 5,48% del lote (548 lmparas) no llegarn probablemente a
durar 60 meses
b.- Variables aleatorias continuas
En gran nmero de experimentos aleatorios es necesario, para su
tratamiento matemtico, cuantificar los resultados de modo que se
asigne un nmero real a cada uno de los resultados posibles del
experimento. De este modo se establece una relacin funcional entre
elementos del espacio muestral asociado al experimento y nmeros
reales.
Formalmente se dice que una variable aleatoria (v.a.) X es una
funcin real definida en el espacio muestral asociado a un experimento
aleatorio, .
Se llama rango de una v.a. X y lo denotaremos RX, al conjunto de
los valores reales que sta puede tomar, segn la aplicacin X. Dicho de
otro modo, el rango de una v.a. es el recorrido de la funcin por la que
sta queda definida:

Ejemplo. Supongamos que se lanzan dos monedas al aire. El espacio


muestral, esto es, el conjunto de resultados elementales posibles
asociado al experimento, es
= {cc, cs, sc, ss},
donde (c representa "sale cara" y s, "sale sello").
Podemos asignar entonces a cada suceso elemental del experimento el
nmero de caras obtenidas. De este modo se definira la variable
aleatoria X como la funcin
dada por:

El recorrido o rango de esta funcin, RX, es el conjunto


RX = {0, 1, 2}

c.- Distribucin normal


La distribucin normal es un caso particular de variable aleatoria
continua, fue reconocida por primera vez por el francs Abraham de
Moivre. Posteriormente, Carl Freidrich Gauss elabor desarrollos ms
profundos y formul la ecuacin de la curva, de ah a que tambin se le
conozca, ms comnmente, como la campana de Gauss. La
distribucin de una variable normal est completamente determinada
por dos parmetros: su media () y su desviacin estndar ( ). Con
sta relacin, la densidad de la normal viene dada por la ecuacin:

La importancia de esta distribucin radica en que permite


modelizar numerosos fenmenos naturales, sociales y psicolgicos.
Mientras que los mecanismos que subyacen a gran parte de este tipo de
fenmenos son desconocidos, por la ingente cantidad de variables
incontrolables que en ellos intervienen, el uso del modelo normal puede
justificarse asumiendo que cada observacin se obtiene como la suma
de unas pocas causas independientes.

La distribucin normal tambin es importante por su relacin con


la estimacin por mnimos cuadrados, uno de los mtodos de estimacin
ms simples y antiguos.

Algunos ejemplos de variables asociadas a fenmenos naturales que


siguen el modelo de la normal son:

caracteres morfolgicos de individuos como la estatura;


caracteres fisiolgicos como el efecto de un frmaco;
caracteres sociolgicos como el consumo de cierto producto por
un mismo grupo de individuos;
caracteres psicolgicos como el cociente intelectual;
nivel de ruido en telecomunicaciones;
errores cometidos al medir ciertas magnitudes; entre otros.

Propiedad: No importa cules sean los valores de y para una


distribucin de probabilidad normal, el rea total bajo la curva siempre
es 1, de manera que podemos pensar en reas bajo la curva como si
fueran probabilidades.
Uso de la tabla de distribucin normal de probabilidad normal estndar
Para cualquier distribucin normal de probabilidad, todos los
intervalos que contienen el mismo nmero de desviaciones estndar a
partir de la media, contendrn a misma fraccin del rea bajo la curva
para cualquier distribucin de probabilidad normal. Esto hace que sea
posible usar slo una tabla de la distribucin de probabilidad estndar.

Tabla para el clculo de la distribucin estndar.


El valor de Z est derivado de la frmula:

Z=

Donde: X= Variable aleatoria, = media de la distribucin de la variable


aleatoria, = desviacin estndar de a distribucin y Z= Nmero de
desviaciones estndar que hay desde X a la media de la distribucin.
Ejemplo. Partiendo de la premisa de que =500 y =100 Cul es la
probabilidad de que un candidato al azar se tome entre 500 y 650 horas
en completar un programa de entrenamientos?
Z=

X 650500
=
=1,5 desviaciones entndar

100

Si buscamos en la tabla Z=1,5; encontramos una probabilidad de


0,4332. Por lo tanto la probabilidad de que un candidato escogido al azar
requiera entre 500 y 650 horas para terminar el programa de
entrenamiento es de 0,4332 en porcentaje 43,32%.d.- Distribucin Binomial
La distribucin binomial es un caso particular de probabilidad de
variable aleatoria discreta, y por sus aplicaciones es, posiblemente, la
ms importante.
Esta distribucin corresponde a la realizacin de un experimento
que cumple con las siguientes condiciones:
Al realizar el experimento slo son posible dos resultados: el suceso
A llamado xito, y el suceso B llamado fracaso.
Al repetir el experimento, el resultado obtenido es independiente de
los resultados obtenidos anteriormente.
La probabilidad del suceso A es constante, es decir, no vara de una
prueba del experimento a otra.
En cada experimento se realizan n pruebas idnticas.
Todo experimento que tenga estas caractersticas se dice que
sigue el modela de la distribucin Binomial o distribucin de Bernoulli.
En general, si existen n ensayos Bernoulli con probabilidad de
xito p y de fracaso q, entonces la distribucin de probabilidad que
la modela es la distribucin de probabilidad binomial y si regla de
correspondencia es:

Donde: P(x) es la probabilidad de ocurrencia del evento; p= probabilidad


de xito del evento (en un intento), q= probabilidad de fracaso del
evento (en un intento) y se define como q=1-p), x= ocurrencia del
evento o xitos deseados y n= nmero de intentos.
Ejemplo. Cul es la probabilidad de obtener exactamente 2 caras al
lanzar una misma moneda 6 veces?
p= 0,5

q=1-p=1-0,5=0,5
X=2
n=6
Al sustituir los valores en la frmula obtenemos:
6!
2
62
0,5 0,5
P(2caras)= 2 ! ( 62 ) !
= 0,234375

Entonces la probabilidad de que salgan 2 caras al lanzar la


moneda 6 veces es de 0,234375 o 23,4375 %.
e.- Distribucin de Poisson
La distribucin de POISSON es tambin un caso particular de
probabilidad de variable aleatoria discreta, el cual debe su nombre a
Simon Denis Poisson (1781-1840), un francs que la desarroll a partir
de los estudios que realiz durante la ltima etapa de su vida. Es til
cuando tratamos con cantidades de ocurrencia de un evento a lo largo
de un intervalo de tiempo o espacio especificado.
Esta distribucin se utiliza para describir ciertos procesos.
Caractersticas
En este tipo de experimentos los xitos buscados son expresados por
unidad de rea, tiempo, pieza, etc:
-

#
#
#
#
#

de defectos de una tela por m2


de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc.
de bacterias por cm2 de cultivo
de llamadas telefnicas a un conmutador por hora, minuto, etc, etc.
de llegadas de embarcaciones a un puerto por da, mes, etc, etc.
Para determinar la probabilidad de que ocurran X xitos por unidad
de tiempo, rea, o producto, la frmula a utilizar sera:

Donde:
p(X) = probabilidad de que ocurran x xitos, cuando el nmero
promedio de ocurrencia de ellos es
= media o promedio de xitos por unidad de tiempo, rea o producto

e = 2.718 (base de logaritmo neperiano o natural)


X = variable que nos denota el nmero de xitos que se desea que
ocurra
Hay que hacer notar que en esta distribucin el nmero de xitos
que ocurren por unidad de tiempo, rea o producto es totalmente al azar
y que cada intervalo de tiempo es independiente de otro intervalo dado,
as como cada rea es independiente de otra rea dada y cada producto
es independiente de otro producto dado.
Ejemplo. Si un banco recibe en promedio 6 cheques sin fondo por da,
cules son las probabilidades de que reciba 4 cheques sin fondo en un
da dado
=6
x=4
Comprobando (sustituyendo en la frmula):
4 6

P(x=4, =6)=

4 6

e
6 e
1296 0,0025
=
=
=0,133853
x!
4!
24

Entonces la probabilidad de que el banco reciba 4 cheques sin


fondos en un da es de 0,133853
.
f.- Distribucin Chi-Cuadrada
En estadstica, la distribucin X (de Pearson) es una distribucin
de probabilidad continua con un parmetro k que representa los grados
de libertad de la variable aleatoria:

donde Zi son variables de distribucin normal, de media cero y varianza


uno. El que la variable aleatoria X tenga esta distribucin se representa
habitualmente as:

Es conveniente tener en cuenta que la letra griega se transcribe


al latn como chi[1] y se pronuncia en castellano como ji.[
][]

La distribucin tiene muchas aplicaciones en inferencia


estadstica, por ejemplo en la denominada prueba utilizada como
prueba de independencia y como prueba de bondad de ajuste y en la
estimacin de varianzas. Tambin est involucrada en el problema de
estimar la media de una poblacin normalmente distribuida y en el
problema de estimar la pendiente de una recta de regresin lineal, a
travs de su papel en la distribucin t de Student, y participa en todos
los problemas de anlisis de varianza, por su papel en la distribucin F
de Snedecor, que es la distribucin del cociente de dos variables
aleatorias independientes con distribucin .

Ejemplo. El espesor de un semiconductor se controla mediante la


variacin estndar no mayor a = 0.60 mm. Para mantener controlado
el proceso se toman muestras aleatoriamente de tamao de 20
unidades, y se considera que el sistema est fuera de control cuando la
probabilidad de que 2 tome valor mayor o igual al valor de la muestra
observado que es 0.01. Que se puede concluir si s=0.84mm?

(n 1)s 2 / 2
Solucin. Existe fuera de control si

2
0.01,19

36.191

excede

Entonces,

(n 1)s 2 19 * 0.84 2

37.24
2
0.60 2

con n=20 y = 0.60,

Por tanto, el sistema est fuera de control.

g.- Distribucin de Weibull

La distribucin de Weibull, que recibe su nombre del investigador


sueco que la desarroll, se caracteriza por considerar la tasa de fallos
variable, siendo utilizada por su gran flexibilidad, al poder ajustarse a
una gran variedad de funciones de fiabilidad de dispositivos o sistemas.
La distribucin de Weibull complementa a la distribucin
exponencial y a la normal, se usa cuando se sabe de antemano que una
de ellas es la que mejor describe la distribucin de fallos o cuando se
han producido muchos fallos (al menos 10) y los tiempos
correspondientes no se ajustan a una distribucin ms simple.
La distribucin de Weibull nos permite estudiar cul es la
distribucin de fallos de un componente clave de seguridad que
pretendemos controlar y que a travs de nuestro registro de fallos
observamos que stos varan a lo largo del tiempo y dentro de lo que se
considera tiempo normal de uso.
Observacin: La distribucin exponencial es un caso especial de
distribucin de Weibull, puesto que obtenemos la distribucin
exponencial si hacemos =1 en la ecuacin: -1Z (t)= () t
La suposicin de la ecuacin anterior establece que Z (t) no es una
constante, sino ue es proporcional a las potencias de t. Por ejemplo, si
=2 , Z es una funcin lineal de t; si =3, Z es una funcin cuadrtica de
t, etc. As, Z es una funcin creciente, decreciente o constante de t,
segn el valor de como se indica en la figura:

Ejemplo. Los datos siguientes corresponden a los tiempos de falla de


cierto componente de un aeroplano: 23, 261, 87, 7, 120, 14, 62, 47, 225,
71, 246, 21, 42, 20, 5, 12, 120, 11, 3, 14, 71, 11, 14, 11, 16, 90, 1, 16,
52, 95.
Este tipo de datos se modela generalmente con una distribucin
Weibull, cuya funcin de densidad est dada por :
(1
)
Supongamos que se desea hacer inferencias sobre el parmetro , con
base en la distribucin inicial no informativa

y los

datos listados previamente. Supongamos tambin que interesa

estudiar la distribucin predictiva de una observacin futura


de la informacin disponible.
Dadas

observaciones

en vista

de (1) y la distribucin inicial

, la distribucin final de

est dada por

En este caso es posible integrar analticamente, por lo que despus de


un poco de lgebra obtenemos las siguientes expresiones para las
distribuciones de inters.
Densidad marginal de :
(2
)

Densidad predictiva de

(3
)

3.- Regresin y Correlacin Lineal


En estadstica, la regresin lineal o ajuste lineal es un mtodo
matemtico que modela la relacin entre una variable dependiente Y, y
las Variables independientes Xi y un trmino aleatorio . Este modelo
puede ser expresado como:

: Variable dependiente, explicada o regresando.


: Variables explicativas, independientes o regresores.
: Parmetros, miden la influencia que las variables
explicativas tienen sobre el regresando.

Donde
es la interseccin o trmino "constante", las
parmetros respectivos a cada variable independiente,

son los
es el nmero
de parmetros independientes a tener en cuenta en la regresin, y
es el error asociado a la medicin del valor X.

Supuestos del modelo de regresin lineal

Para poder crear un modelo de regresin lineal es necesario que se


cumpla con los siguientes supuestos:
1.- Que la relacin entre las variables sea lineal.
2.- Que los errores en la medicin de las variables explicativas sean
independientes entre s.
3.- Que los errores tengan varianza constante.
4.- Que los errores tenga una esperanza matemtica igual a cero (los
errores de una misma magnitud y distinto signo son equiprobables).
5.- Que el error total sea la suma de todos los errores.
Tipos de modelos de regresin lineal
a.- Regresin lineal simple
Slo se maneja una variable independiente, por lo que slo cuenta
con dos parmetros. Son de la forma:

Donde:

supuestos

es el error asociado a la medicin de valor X i y siguen los


del

modo

que

(Media

cero,

varianza

constante e igual a un y
ste modelo de regresin genera una recta , llamada recta de regresin
de ajuste que se calcula con las siguiente frmula.
Y= a + bx La cual es la misma frmula presentada anteriormente pero
esta forma de notacin es ms usada. Notamos que a= y b=
0

Donde:
y

Ejemplo. Vamos a calcular la recta de regresin de la siguiente serie de


datos de altura y peso de los alumnos de una clase. Vamos a considerar

que la altura es la variable independiente "x" y que el peso es la variable


dependiente "y" (podamos hacerlo tambin al contrario):

El parmetro "b" viene determinado por:


(1/30) * 1,034
b ------------------------------ = 40,26
5
= ----------(1/30) * 0,00856
Y el parmetro "a" por:
a = 33,1 - (40,265 * 1,262) = -17,714
Por lo tanto, la recta que mejor se ajusta a esta serie de datos es:
y = -17,714 + (40,265 * x)
Esta recta define un valor de la variable dependiente (peso), para cada
valor de la variable independiente (estatura):

b.- Regresin lineal mltiple


La regresin lineal permite trabajar con una variable a nivel de
intervalo o razn. De la misma manera, es posible analizar la relacin
entre dos o ms variables a travs de ecuaciones, lo que se
denomina regresin mltiple o regresin lineal mltiple.

Constantemente en la prctica de la investigacin estadstica, se


encuentran variables que de alguna manera estn relacionadas entre s,
por lo que es posible que una de las variables pueda relacionarse
matemticamente en funcin de otra u otras variables.

Maneja varias variables independientes. Cuenta con varios parmetros.


Se expresan de la forma:6
(13)

donde

es el error asociado a la medicin

supuestos de modo que


igual a un

con

del valor

y siguen los

(media cero, varianza constante e


).

Correlacin Lineal
En probabilidad y estadstica, la correlacin indica la fuerza y la
direccin de una relacin lineal y proporcionalidad entre dos variables
estadsticas. Se considera que dos variables cuantitativas estn
correlacionadas cuando los valores de una de ellas varan
sistemticamente con respecto a los valores homnimos de la otra: si
tenemos dos variables (A y B) existe correlacin si al aumentar los
valores de A lo hacen tambin los de B y viceversa. La correlacin entre
dos variables no implica, por s misma, ninguna relacin de causalidad
Los principales componentes elementales de una lnea de ajuste y,
por lo tanto, de una correlacin, son la fuerza, el sentido y la forma:

La fuerza extrema segn el caso, mide el grado en que la lnea


representa a la nube de puntos: si la nube es estrecha y alargada, se
representa por una lnea recta, lo que indica que la relacin es fuerte;
si la nube de puntos tiene una tendencia elptica o circular, la relacin
es dbil.

El sentido mide la variacin de los valores de B con respecto a A: si


al crecer los valores de A lo hacen los de B, la relacin es directa
(pendiente positiva); si al crecer los valores de A disminuyen los de B,
la relacin es inversa (pendiente negativa).

La forma establece el tipo de lnea que define el mejor ajuste:


la lnea recta, la curva monotnica o la curva no monotnica

Cada conjunto de correlaciones se basa en un tipo de


correlacin, que no es ms que una lista de propiedades. stas pueden
ser propiedades de datos, que se encuentran en el propio mensaje, o
propiedades de contexto, que describen detalles del sistema o de
mensajes no relacionados con los datos transmitidos en el mensaje.

Si necesita establecer correlaciones entre distintos valores para las


propiedades de un tipo de correlacin, deber crear un conjunto de
correlaciones nuevo: cada uno de ellos se puede inicializar una sola vez.
Puede promocionar las propiedades de un esquema de propiedades para
declarar que algunas de las propiedades de un mensaje estn accesibles
para la orquestacin.
Coeficiente de correlacin lineal
En una distribucin bidimensional puede ocurrir que las dos
variables guarden algn tipo de relacin entre s.
El coeficiente de correlacin lineal mide el grado de intensidad de
esta posible relacin entre las variables. Este coeficiente se aplica
cuando la relacin que puede existir entre las variables es lineal (es
decir, si representramos en un grfico los pares de valores de las dos
variables la nube de puntos se aproximara a una recta).

No obstante, puede que exista una relacin que no sea lineal, sino
exponencial, parablica, etc. En estos casos, el coeficiente de
correlacin lineal medira mal la intensidad de la relacin las variables,
por lo que convendra utilizar otro tipo de coeficiente ms apropiado.
Para ver, por tanto, si se puede utilizar el coeficiente de
correlacin lineal, lo mejor es representar los pares de valores en un
grfico y ver qu forma describe.
El coeficiente de correlacin lineal se calcula aplicando la siguiente
frmula:

Es decir:

Numerador: se denomina covarianza y se calcula de la siguiente


manera: en cada par de valores (x, y) se multiplica la "x" menos su
media, por la "y" menos su media. Se suma el resultado obtenido de
todos los pares de valores y este resultado se divide por el tamao de la
muestra.
Denominador: se calcula el producto de las varianzas de "x" y de "y", y a
este producto se le calcula la raz cuadrada.
Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r
<1
Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una
variable sube el de la otra).
La correlacin es tanto ms fuerte cuanto ms se aproxime a 1.
Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms.
Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una
variable disminuye el de la otra). La correlacin negativa es tanto ms
fuerte cuanto ms se aproxime a -1.
Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr
menos.
Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra
existir otro tipo de correlacin (parablica, exponencial, etc.)
De todos modos, aunque el valor de "r" fuera prximo a 1 o -1, tampoco
esto quiere decir obligatoriamente que existe una relacin de causaefecto entre las dos variables, ya que este resultado podra haberse
debido al puro azar.
Ejemplo. Vamos a calcular el coeficiente de correlacin de la siguiente
serie de datos de altura y peso de los alumnos de una clase:

Aplicamos la frmula:
(1/30) * (0,826)
---------------------------------------------------r=
-----(((1/30)*(0,02568)) * ((1/30)*(51,366
)))^(1/2)

Luego r=0,719. Por lo tanto,


la correlacin existente entre estas dos variables es elevada (0,7) y de
signo positivo.
Conclusin
La estadstica cuenta con una gran variedad de procedimientos o
tcnicas que permiten prever lo que suceder en un determinado
fenmeno o acontecimiento. Est gran variedad de tcnicas responde a
la gran diversidad y complejidad de los fenmenos que pueden ser
objeto de un estudio estadstico.

El manejo de conceptos y de las diferentes teoras de la estadstica


es fundamental para afrontar problemas de la cotidianidad o de la
realidad. Ante un problema o fenmeno de estudio, es necesario
conocer, entender y determinar las variables y parmetros presentes,
as como tambin determinar las relaciones existentes entre las mismas.
La distribucin de frecuencias nos permite ver de manera
ordenada los diferentes datos de inters de un problema estadstico as
como tambin la frecuencia de los mismos. Esto resulta de gran
importancia ya que nos da una idea de la naturaleza cuantitativa o
relevancia de cada dato dentro del fenmeno de estudio.
Las distribuciones de probabilidad son una de las herramientas
ms utilizadas en la estadstica y en muchas otras reas como la fsica y
la medicina debido a su gran utilidad en diferentes fenmenos o
acontecimientos. Est tcnica nos permite determinar los resultados que
con mayor probabilidad obtendremos en un determinado fenmeno o
acontecimiento.
Para la aplicacin de las diferentes distribuciones de probabilidad
como la distribucin normal, la distribucin binomial, la distribucin de
Poisson; en un determinado fenmeno, es de gran importancia analizar
las caractersticas del fenmeno para determinar el tipo de distribucin
de probabilidad que ms se adapte a la situacin. Si por ejemplo, el
fenmeno a realizar tiene slo dos posibilidades de respuesta, la
distribucin binomial podra ser una opcin acertada para su estudio.
La regresin y correlacin lineal representan una gran herramienta
para la toma de decisiones en un determinado proceso, ya que con un
anlisis del mismo, podramos elaborar
un modelo del proceso,
considerando todas las variables y sus relaciones, as como tambin la
influencia de variables independientes del proceso (el error) y poder
determinar los resultados que se obtendrn a futuro, en base a dichos
resultados se pueden tomar las medidas necesarias para actuar de la
mejor manera posible.
Con la implementacin de todas estas tcnicas estadsticas
mencionadas podramos tener un panorama claro del futuro de un
proceso, fenmeno u objeto de estudio, en base a los datos del pasado y
del presente. Por tal razn la estadstica juega un papel fundamental en
la ingeniera donde es muy necesario saber lo que ocurrir en un
proceso (elctrico, qumico, mecnico, etc) para planificar los posibles
planes de mantenimiento, reemplazo de equipos o partes del proceso y
tener una nocin de la evolucin del mismo.

Você também pode gostar