Escolar Documentos
Profissional Documentos
Cultura Documentos
Se llama Unidad experimental a cada uno de los entes que son observados en el
experimento.
Se llama Dato estadístico al valor asignado a una de las características de una Unidad
Experimental, conforme a la Escala de Medición empleada.
Un dato estadístico es el valor que resulta de una medición. Se pueden clasificar en:
Escalas de medición
Escala nominal : Se usa únicamente para clasificar a los entes en distintas categorías. La
operación básica y más sencilla en todo proceso de investigación, es la clasificación, esto
significa separar las unidades experimentales desde el punto de vista de determinadas
características, decidiendo cuales son las que pertenecen a una misma clase y cuales
pertenecen a distintas clases. Esta escala se utiliza cuando los datos son cualitativos,
constituyendo el nivel más bajo de medición. Los valores correspondientes a esta escala
reciben el nombre de categorías y son simples etiquetas. Si algún numero se asocia a una
categoría, este estaría cumpliendo una función de código, de ninguna manera se pueden
utilizar para operaciones matemáticas. La relación lógica de la Escala Nominal es la
relación de equivalencia y posee las propiedades de simetría y transitividad.
Ej.: Provincia de origen del personal de una empresa: Los empleados de una empresa
pueden ser clasificados en las distintas provincias, pero no es posible establecer una
jerarquía entre ellas.
Escala Ordinal: Se usa para, además de clasificar a los entes en distintas categorías,
clasificarlos de acuerdo a su rango. Esta escala se utiliza cuando los datos son
cualitativos, y es posible ordenarlo de acuerdo a una jerarquía preestablecida de sus
valores según el grado que poseen. La escala Ordinal constituye un nivel de medición
superior al de la Escala Nominal. Cuando a las categorías se las representan con
números, se hace la misma salvedad que la realizada para la Escala Nominal. Las
relaciones lógicas propias de esta escala son, Relación de Equivalencia y la Relación de
Origen y posee las propiedades de simetría, para dos valores de la misma categoría;
asimetría, para dos valores de distinta categoría, y transitividad.
A<B<C<D
B tiene mayor jerarquía que A, C tiene mayor jerarquía B, D tiene mayor jerarquía
que C, se puede decir que la mayor diferencia jerárquica entre A y D es igual al agregado
de las diferencias jerárquicas entreA y B, y la diferencia jerárquica entre B y C, la
diferencia jerárquica entre C y D, pero no se puede establecer cuál de las diferencia
jerárquicas parciales es mayor.
Ej.: Grado de acuerdo con una determinada política del gobierno si las posibilidades son:
muy de acuerdo, de acuerdo y desacuerdo: Se puede establecer una relación de orden o
jerarquía entre las respuestas.
Escala de Intervalo o Distancia: Se usa para, además de clasificar a los entes en distintas
categorías y clasificarlos de acuerdo a su rango, poder establecer una distancia entre dos
cualquiera de ellos. Esta escala se utiliza cuando los datos son cuantitativos, por lo tanto
los valores de cada categoría necesariamente deben ser números.
A<B<C
ABC
Se puede decir que la distancia entre a y b es mayor que la distancia entre b y c, pero no
se pude establecer la proporcionalidad entre ellos. Al punto de origen de esta escala se le
asigna arbitrariamente el valor cero, llamado cero arbitrario, que no necesariamente indica
ausencia de la característica medida.
Escala de Razón o proporción: Se usa para, además de clasificar a los entes en distintas
categorías, clasificarlos de acuerdo a su rango, y poder establecer una distancia entre dos
cualquiera de ellos, poder establecer una proporcionalidad entre dos cualquiera de ellos,
poder establecer una proporcionalidad entre dos cualquiera de ellos.
A<B<C
ABC
Se puede decir que la distancia entre a y b es mayor que la distancia entre b y c, como así
también se puede establecer la proporcionalidad entre ellos. El punto de origen de esta
escala es realmente cero, llamado cero real, que indica ausencia de la característica
medida. Esta escala constituye el nivel más alto de medición.
Ej.: Peso de una persona (en kg): Peso cero indica ausencia de peso.
Información: Al resultado de la evaluación de los datos estadísticos cuando se los
compara con una adecuada referencia.
Ej.: La edad mínima requerida para ver una determinada película en el cine es 16 años.
Llega una persona para ver la película y el empleado de la entrada le consulta la edad. Ella
le contesta que tiene 18 años y el empleado le permite entrar.
Estadística
Universo
Variable cualitativa: Cuando los valores que puede asumir no constituyen un espacio
métrico. Esto quiere decir que no es posible establecer una distancia entre dos valores
cualesquiera, como así tampoco realizar operaciones algebraicas con los valores de una
variable cualitativa. Se miden en escala nominal o en escala ordinal.
Variable cuantitativa: Cuando los valores que puede asumir si constituyen un espacio
métrico. Esto quiere decir que es posible establecer la distancia entre dos valores
cualesquiera como así también realizar operaciones algebraicas con los valores de una
variable cuantitativa. Se miden en escala de Intervalo o de razón y los valores pueden ser
únicamente números.
2. Formulación de los instrumentos de medición: son aquellos con los cuales se obtienen
y/o registran los datos a medida que se los conoce o ellos se producen.
3. Recopilación de los datos: Forman la materia prima del proceso estadístico para la
obtención de información.
· Muestreo: Es un conjunto de métodos que se utilizan para tomar una muestra, por lo
tanto se observa una parte del universo en un instante dado. Es un método estático de
recopilación de los datos.
Fuentes externas: Son las publicaciones. Si se utiliza este tipo de fuente para la obtención
de los datos hay que verificar la calidad y responsabilidad de la publicación tratando que,
en lo posible sea un material especializado.
· Fuente externa primaria: Cuando los datos publicados fueron recopilados directamente
por los responsables del medio que los reproduce, mediante alguno de los métodos
descriptos para las Fuentes Propias. Generalmente se recurre, como fuente externa
primaria, a las publicaciones de organismos oficiales, como el Instituto Nacional de
Estadísticas y Censos.
Una vez que los datos se han recopilado es necesario que sean presentados en forma
efectiva, de modo tal que puedan ser comunicados y que, a la vez, permitan tanto, obtener
alguna información primaria, como así también, organizarlos para proceder al análisis.
Presentación escrita: Consiste en incorporar los datos en un párrafo combinando cifras y
textos. No es muy eficaz cuando hay gran cantidad de datos.
· Cuadro estadístico de referencia: Son aquellos que se usan solo para publicar los datos y
son utilizados como fuente para otros trabajos.
· Cuadro estadístico de Análisis: Son aquellos que se utilizan para presentar los datos de
modo tal que facilite la realización de los cálculos matemáticos necesarios para el análisis
de los datos.
Los resultados que se obtienen mediante el análisis de los datos están expresados en un
lenguaje estadístico. En esta etapa, el Estadístico y el Especialista deben “traducir” estos
resultados al lenguaje de la disciplina objeto de la investigación y entre ambos poder
compatibilizarlos, dado que toda conclusión estadística tiene asociada una conclusión
especifica donde se tomaras las decisiones.
Los Datos Cuantitativos que se obtienen mediante la recopilación de los datos para
realizar un determinado trabajo, según el tipo de información que se quiera proporcionar,
se pueden expresar de dos maneras:
Cantidades absolutas: Son aquellos datos cuantitativos que, cuando son presentados y/o
analizados, están expresados en las unidades de medida correspondientes a la magnitud
que se está midiendo.
Cantidades relativas: Son aquellos datos cuantitativos que surgen del cociente entre dos
cantidades absolutas correspondientes a la misma magnitud y unidad de medida.
Cuadro estadístico
1. Titulo: Debe describir concisamente el contenido del cuadro Ej.: que son los datos,
donde fueron recopilados, como están clasificados, cuando ocurrieron los eventos que
dieron origen a los datos.
4. Encabezado de las columnas: Los valores de las otras variables que quieran ser
presentadas junto a la variable más significativa, o algunas características especiales de
esta, generalmente se disponen en columnas, cuyos títulos constituyen el Encabezado de
las columnas.
Gráficos
1. Titulo: Debe describir concisamente el contenido del cuadro Ej.: que son los datos,
donde fueron recopilados, como están clasificados, cuando ocurrieron los eventos que
dieron origen a los datos.
2. Nota de encabezado: Se incorpora al grafico cuando se quiere hacer una ampliación del
título, ya sea detallando algún elemento importante o aclarando la unidad de medida de la
magnitud que corresponde a los datos.(debajo del título y entre paréntesis)
3. Diagrama: Está formado por los distintos trazos que se utilizan para realizar los dibujos.
Estos trazos pueden ser líneas, rectángulos, etc.
Según el tipo de diagrama que se utiliza para realizar los gráficos, estos reciben distintas
denominaciones:
Es posible que se quisiera mostrar la evolución de un Total conjuntamente con las Partes
que lo componen. En este caso se llama lineal de partes componentes, y en él se realizan
diagramas simultáneos.
Si se quiere mostrar la incidencia que tienen cada una de las partes que forman los totales
representados en cada una de las barras, a estas se las particiona proporcionalmente
dando origen a un grafico de barras llamado de barras segmentadas.
Si se quiere resaltar la comparación entre las barras, se dibujan barras adyacentes que
muestren cada parte, dando origen a un grafico de barras llamado Barras Agrupadas.
Gráficos circulares: Se utiliza para comparar partes de un total y su evolución en el tiempo
o en el espacio por tal motivo se presenta un grafico para cada situación a comparar.
Consiste en un círculo dividido en tanto sectores circulares como partes componen los
totales que se quieren comparar. El ángulo correspondiente a cada uno de los sectores se
determina de modo tal que mantenga la misma proporción con el ángulo de la
circunferencia de cada parte con el total.
Análisis descriptivo
Frecuencia absoluta simple para variables discreta: Cantidad de veces que se repite
un valor de la variable. Para representarla se utiliza el grafico de bastones. En el eje de
abscisas se representa la variable en estudio y en el eje de ordenadas, la frecuencia
simple.
Variables continuas
Medidas de concentración: Son aquellas medidas con las cuales se puede establecer el
porcentaje de datos que está concentrado dentro de un determinado intervalo que
contenga una determinada concentración porcentual de datos. Tiene sentido cuando los
datos están agrupados en una distribución de frecuencias.
a) Cuando el valor dado coincide con el límite superior de un intervalo, el rango percentilar
queda determinado directamente por la frecuencia relativa acumulada hasta dicho valor.
No se requieren formulas especiales.
Percentiles: Calcula hasta que valor se acumula una determinada frecuencia relativa.
El percentil de orden K es aquel valor hasta donde se acumula, a lo sumo, el K% de los
datos, y desde donde se acumula a lo sumo el 100-k%. El orden absoluto del
percentil es la frecuencia absoluta acumulada correspondiente al valor K, y se obtiene
calculando el K% del total de observaciones N.
Son aquellos valores destacados con los cuales es posible representar a la totalidad de los
valores observados de la variable. No necesariamente son valores de la variable pero si
están expresadas en la misma magnitud. Las medidas son:
Variables continuas: Con la inspección de los datos solo se puede obtener el intervalo de
mayor frecuencia. El intervalo de mayor frecuencia se llama Intervalo modal. El modo es
un valor que pertenece a dicho intervalo y para localizarlo hay que utilizar una formula de
interpolación
Método de cálculo:
Promedios ponderados
Se llama Ponderación a aquella cantidad que permite asignar a cada unidad experimental
que proporciona un valor de la variable en estudio, una determinada importancia o peso
relativo.
El promedio aritmético ponderado surge de hacer el cociente entre, la suma del producto
de cada valor de la variable y su correspondiente ponderación, y la suma de
ponderaciones.
Medidas de variabilidad
Las medidas de variabilidad son aquellas que permiten estudiar, como se desvían, en su
conjunto, los valores observados de una variable, con respecto a alguna Medida de
Tendencia Central.
La Varianza es una medida de variabilidad que mide el promedio aritmético del cuadrado
de los desvíos que se producen entre cada valor de la variable y la media
Propiedades de la varianza
Desvío estándar
Coeficiente de variación
Para poder establecer si la variabilidad alrededor de la Media Aritmética que presenta una
variable es baja o no, es necesario que el valor numérico del desvió estándar sea
comparado o relacionado con ella (la media). El Coeficiente de variación de una variable
es el cociente entre el desvío estándar y la media aritmética. Es un número puro,
desprovisto de magnitud. Su valor numérico permite establecer criterios generales acerca
de la homogeneidad de los datos, de la representatividad de la media y la comparación
con la variabilidad de otras variables aunque las unidades de medida o las magnitudes
sean distintas.
Momentos empíricos
Medidas de forma
Otra característica importante a tener en cuenta al analizar los valores observados de una
variable es la forma que presenta la distribución de frecuencias correspondiente ya que
ello permite visualizar aproximadamente cual podría ser el Modelo Matemático que mejor
se ajusta para describir el comportamiento de una variable.
La Simetría y la Curtosis son dos de los aspectos que permiten establecer dicha forma.
Si la variable es continua, las frecuencias simples de los intervalos cuyos puntos medios
equidisten de la Media aritmética, son iguales.
Se llama Curtosis o apuntamiento, a una determinada relación entre la amplitud total y la
máxima frecuencia que presenta una distribución de frecuencia.
Probabilidad
Suceso intersección o Conjunto: Aquel suceso que ocurre si, y solo si se presentan
conjuntamente dos o más de los sucesos que forman el espacio muestral.
Suceso unión incluyente: Aquel suceso que ocurre si, y solo si ocurre alguno de los
sucesos que forma el espacio muestral.
Suceso unión excluyente: Aquel suceso que ocurre si, y solo si ocurre solo uno de los
suceso que forman el espacio muestral.
Cuando en un mismo espacio muestral se definen dos o mas sucesos, estos, por la propia
naturaleza del experimento aleatorio que se lleva cabo, algunas veces podrían presentarse
en forma simultanea. Pero hay sucesos que nunca, bajo ninguna circunstancia, se
presentaran jutnos en la misma realización del Experimento Aleatorio.
Sucesos compatibles: Dos o mas sucesos son compatibles si y solo si es posible que se
presenten en forma conjunta.
Establece que la frecuencia relativa correspondiente a un suceso aleatorio, oscila, con una
cnvergencia asintótica, alrededor de un numero fijo, cuando la cantidad de observaciones
del Experimento Aleatorio crece indefinidamente.
En ocasiones, las personas deben decidir llevar a cabo acciones cuyo resultado no puede
predecirse con exactitud. Bajo ciertas condiciones, estas acciones se consideran
Experimentos Aleatorios. El desconocimiento del, o de los posibles resultados que se
obtendrán, genera cierto grado de incertidumre. Por tal motivo, al tomar la decisión, y para
que esta sea objetiva, debe contarse con un cuantificador, un numero capaz de
proporcionar una medida del estado de duda o vacilación en que se encuentre el
“decididor”. El calculo de la probabilidad permite cuantificar la incertidumbre que provoca el
resultado de un Experimento Aleatorio y medir la propensión a ocurrir que tiene cada uno
de los resultados posibles.
Axiomas
Teoremas
Probabilidad Marginal
P(S1/S2)= P(S1S2)/P(S2)
Variables aleatorias
Los resultados de los experimentos aleatorios, cualesquiera que sean, tienen que
estar expresados cuantitativamente. Para ello, hay que contar con métodos capaces
de definir reglas precisas que asignen números reales a los resultados de los
experimentos aleatorios, teniendo en cuenta que se quiere medir y como se quiere
medir.
Variable aleatoria: Es una función, o regla bien definida, que asigna, a cada elemento
del espacio muestral, un vector perteneciente a un espacio vectorial.
Variables aleatoria unidimensional: Cuando, a cada elemento del espacio muestral, se
asigna un escalar perteneciente al conjunto de números reales.
Recorrido de una variable aleatoria unidimensional: Conjunto formado por los números
reales que se pueden asignar a dicha variable.
Es conveniente recalcar el hecho de que se puede concebir una variable aleatoria de
dos maneras:
• Se realiza un Experimento aleatorio E que tiene un resultado u=U, y luego se le
asigna a este resultado el valor numérico x(U)€R
• Se realiza un experimento aleatorio E que tiene un resultado u=U. Si la observación
consiste en realizar mediciones cuantitativas, el resultado u, es un número real. Si la
unidad de medida correspondiente a dicho resultado coincide con “como se quiere
medir” o sea, la unidad de medida de la variable aleatoria definida, entonces, u es
igual a x(u), y U es igual a R(x). Si la unidad de medida de la magnitud de la variable
no coincide con la medición realizada son dos números reales distintos.
Variable aleatoria discreta unidimensional: Es aquella variable aleatoria cuyo recorrido
es finito o infinito numerable.
Distribución de probabilidad univariada
Funciona de probabilidad puntual: Asigna a cada valor del recorrido de dicha variable,
un numero real no negativo, llamado probabilidad puntual, de modo tal que la suma de
todos estos valores, a través del recorrido de la variable , debe será igual a la unidad.
Debe cumplir dos condiciones:
1) Condición de no negatividad; El número real asignado debe ser no negativo.
2) Condición de cierre: La suma de todos los números reales asignados por la función
de probabilidad puntual, a cada valor de la variable discreta, debe ser igual a uno.
Una variable discreta, X, queda estrictamente definida cuando se establece su función
de probabilidad puntual. La función de probabilidad puntual puede ser graficada
utilizando las coordenadas ortogonales, donde los valores de la variable se ubican en
el eje de abscisas y los correspondientes valores puntual, en el eje de ordenadas.
(Grafico de Bastones)
Función de distribución: Función que asigna a cada valor del recorrido, un número real
que representa la suma de todas las probabilidades puntuales, desde el primero hasta
el valor en cuestión.
La función de distribución acumulada puede ser graficada utilizando las coordenadas
cartesianas ortogonales, donde los valores de la variable se ubican en el eje de
abscisas y los correspondientes valores de probabilidad acumulada, en el eje de
ordenadas. (Grafico escalonado)
El conjunto de pares ordenados {Xi; F(Xi)}, para todo i, se llama función de distribución
de probabilidad. Es la distribución acumulada hasta un valor de la variable, o
simplemente Distribución acumulada.
Función de distribución complementaria: Función que asigna a cada valor del
recorrido, un número real que representa la suma de todas las probabilidades
puntuales, desde el valor en cuestión hasta el último.
El conjunto de pares ordenados {Xi; G(Xi)}, para todo i, se llama función de distribución
complementaria de probabilidad. Es la distribución acumulada desde un valor de la
variable, o simplemente Distribución desacumulada.
• La suma entre el valor de la función de distribución correspondiente a un valor de la
variable y el valor de la función de distribución complementaria correspondiente al
siguiente valor de la variable, es siempre igual a uno.
Percentiles
Percentil de orden K (O<K<100 / K€r) de una variable aleatoria discreta a un valor Xk,
tal que, hasta el valor de variable inmediato anterior, se acumule, a lo sumo, una
probabilidad igual a K/100 y, desde el valor de variable inmediato posterior se
acumule, a lo sumo, una probabilidad igual a (1-K/100).
Se llama Esperanza matemática de una función generada con una variable aleatoria
continua, a la integral, a través del recorrido de la variable, del producto de la función
dada por la función de densidad de probabilidad de la variable.
Teorema de tchebycheff
Sea X una variable aleatoria, discreta o continua, con esperanza matemática finita y
varianza finita, y sea K un número real positivo mayor a uno. Cualquiera sea la
distribución de probabilidad de la variable aleatoria X, siempre se cumple que:
La probabilidad de que, el modulo de la desviación ente un valor de la variable y el
promedio esperado, sea mayor o igual, a k veces el desvío estándar (K>1), es a lo
sumo 1/K₂
Variable estandarizada
Se llama variable estandarizada de una variable aleatoria, discreta o continua, a la
variable que se genera haciendo el cociente entre, la diferencia entre la variable
original y su esperanza matemática, y la raíz cuadrada positiva de la varianza. Toda
variable aleatoria estandarizada, tiene esperanza igual a cero y varianza igual a uno,
cualquiera sea la naturaleza de la variable original que se está estandarizando.
Aplicaciones de la variable estandarizada
Estandarizar una variable aleatoria, la variable original, es transformar los valores de
ella, que están expresados en unidades de la magnitud original, a valores en unidades
de desvió estándar. En otras palabras, el valor de la variable estandarizada indica a
qué distancia, a cuantos desvíos estándares, y en qué posición (izquierda o derecha)
se encuentra el correspondiente valor observado de la variable en estudio, con
respecto a su media aritmética.
Esta transformación hace posible que se pueda comparar la desviación con respecto
al promedio aritmético, de valores individuales correspondientes a variables aleatorias
que representan distintas circunstancias, o distintos grupos, o medidas en distintas
unidades de magnitudes.
Leyes de probabilidad específicas
Experimento aleatorio dicotómico: Aquel experimento aleatorio cuyo espacio muestral
tiene solo dos resultados posibles mutuamente excluyentes.
Permutaciones: Dado un conjunto formado por n elementos, se llama permutación de
n a cualquier arreglo ordenado de los n elementos. La cantidad de permutaciones que
se pueden formar ordenando los n elementos de distinta manera, se calcula con un
numero llamado factorial de n.
Espacio continuo: Es un recinto de infinitos puntos donde en cualquiera de ellos es
posible encontrar un elemento. Son las magnitudes (longitud; superficie; tiempo)
Distribución de Bernoulli: Es una función que proporciona valores de probabilidad a
una variable aleatoria discreta que denota la presencia o ausencia de un determinado
atributo. Si el atributo no se presenta, se asigna a la variable el valor cero; si el atributo
se presenta se asigna a la variable el valor uno.
La cantidad de elementos con un determinado atributo que se presenta en una
observación de un experimento aleatorio dicotómico, es una variable aleatoria discreta,
r, cuya función de probabilidad es llamada distribución de bernoulli.
Distribución Binomial
• Las n observaciones son independientes: la probabilidad de que se presente un
elemento con un determinado atributo permanece constante a través de las n pruebas.
La cantidad de elementos con un determinado atributo, que se presentan en n
observaciones independientes de un experimento aleatorio dicotómico, es una variable
aleatoria discreta, r, cuya función de probabilidad es llamada distribución binomial.
Distribución geométrica
• La variable aleatoria es la cantidad de repeticiones independientes del experimento
que son necesarias para encontrar un elemento que tenga un determinado atributo.
• Si n es la cantidad de observaciones o repeticiones independientes del experimento
aleatorio dicotómico, entonces en las primeras (n-1) observaciones no se tiene que
haber presentado el elemento con el atributo.
La cantidad de observaciones independientes de un experimento aleatorio dicotómico
necesarias para encontrar 1 elementos con un determinado atributo, es una variable
aleatoria discreta, ñ, cuya función de probabilidad es llamada distribución geométrica
Distribución Pascal
• La variable aleatoria es la cantidad de repeticiones del experimento pero que son
necesarias para encontrar una cantidad fija, mayor a uno, de elementos que tengan un
determinado atributo.
• Esta variable es útil cuando se quieren concreta algunos trabajos de investigación, o
tener una correcta información acerca de determinadas situaciones, donde es
necesario contar con una cantidad fija de elementos que tengan un determinado
atributo. Para ello, habrá que repetir el experimento aleatorio tantas veces como sea
necesario. Es decir, se observan unidades experimentales sucesivamente hasta
conseguir la cantidad con atributo que se necesita, y recién, cuando ello se logra, se
detienen las pruebas.
Distribución de Poisson
La distribución que se estudia en este punto se origino en el estudio de la cantidad de
elementos (personas, automóviles, llamadas telefónicas, etc.) que arriban en un
determinado periodo de tiempo. Posteriormente el análisis fue generalizado para otros
espacios continuos.
Dado un espacio muestral continuo de extensión t. En dicho continuo ocurren ciertos
acontecimientos en forma aleatoria formando una secuencia o flujo de
acontecimientos. Se supone que este flujo de acontecimientos satisfaces las
siguientes condiciones:
1) Sean (t1;t2) y (t3;t4) dos intervalos cualesquiera del continuo, no superpuestos y
estadísticamente independientes, o sea que la probabilidad de que se produzcan
acontecimientos en uno de los intervalos, no depende de los que ocurrieron en el otro.
2) La probabilidad de que un acontecimiento se produzca en un intervalo infinitesimal
(t0;t0+∆t) es un infinitésimo de orden ∆t.
3) La probabilidad de que se produzcan dos o más acontecimiento en el intervalo
infinitesimal (t0;t0+∆t) es un infinitésimo de orden ∆t.
4) Los acontecimientos ocurren con una tasa media o frecuencia media o promedio de
presentación en el continuo conocido.
La cantidad de acontecimientos que se presentan en un continuo es una variable
aleatoria discreta.
La cantidad de elementos que se presentan al azar en un continuo de extensión t, y
con un promedio de presentación en el continuo igual a , es una variable aleatoria
discreta, r~, cuya función de probabilidad es llamada distribución de Poisson.
Características
1) a y b son los parámetros matemáticos de la función.
2) Por ser función de densidad de probabilidad la función de densidad uniforme
cumple con la condición de no negatividad y con la condición de cierre.
3) La función de distribución de la distribución uniforme es:
Distribución Normal
La distribución normal es quizá, una de las más importantes, dado que es un modelo
teórico que se presenta con extraordinaria frecuencia como función de densidad de
probabilidad de las variables aleatorias continuas que se estudian en todas las
ciencias. No obstante, es necesario verificar, mediante metodologías que se
estudiaran en cursos más avanzados, la validez de la “normalidad” en las variables
que se analizan, para evitar errores en las decisiones.
Por otro lado, la distribución normal posee importantes propiedades que permiten
analizar el comportamiento de variables originadas en la suma o diferencia de otras
variables; como así también, bajo ciertas condiciones, puede ser utilizada como
aproximación de funciones de probabilidad para variables aleatorias discretas.
Una variable aleatoria continua X, definida para todos los números reales, tiene
distribución normal, si su función de densidad de probabilidad es
Características
1) Los números µ y ∂ de la función de densidad normal son los parámetros
matemáticos de la función
2) La función de densidad normal alcanza un máximo relativo cuando x= µ
3) La función de densidad normal tiene dos puntos de inflexión cuando:
X= µ - ∂ X= µ + ∂
4) La función de densidad normal es simétrica con respecto al punto de máxima
ordenada
5) La función de densidad normal es asíntota al eje de abscisa.
Variable normal estandarizada o tipificada
El valor de la función de distribución de una variable aleatoria con distribución normal,
para el valor x, es igual al valor de la función de distribución de la variable
estandarizada Z con distribución normal, para el correspondiente valor.
Varianza muestral
Se llama varianza muestral a un estimador de la varianza poblacional que se genera
haciendo el cociente entra la suma del cuadrado de las desviaciones con respecto a la
media aritmética muestral y los correspondientes grados de libertad.
Proporción muestral
Se llama proporción de elementos que tienen un determinado atributo en la muestra o,
simplemente, proporción muestral a un estimador de la proporción poblacional, que se
genera mediante el cociente entre la cantidad de elementos que si poseen un
determinado atributo en la muestra y el tamaño de la muestra.
• Varianza muestral
La esperanza matemática de la varianza muestral, en universos infinitos, siempre es la
varianza poblacional
Con estos dos teoremas se construyen los intervalos de confianza para estimar el
parámetro media poblacional
Muestra grandes
Si la distribución de probabilidad de la población no es conocida y el tamaño de la
muestra es lo suficientemente grande como para que se cumpla el Teorema Central
del Límite, entonces, para poblaciones infinitas o finitas, respectivamente:
Muestras chicas
Si la distribución de probabilidad de la población no es conocida, y el tamaño de la
muestra no es lo suficientemente grande como para que se cumpla el Teorema
Central del Límite, entonces el nivel de confianza del intervalo de estimación es la cota
inferior de probabilidad que surge de la aplicación del teorema de Tchebycheff.
Entonces, para poblaciones con varianza poblacional conocida, infinitas o finitas, los
intervalos de confianzas son, respectivamente
Tamaño de muestra
Tamaño de muestra para estimar la media poblacional
• Varianza poblacional conocida
El cálculo del tamaño de la muestra se realiza teniendo en cuenta los siguientes
factores:
El error de muestreo: Este factor es proporcionado por el usuario de la muestra. El
debe indicar cuál es la máxima diferencia entre la media muestral y la media
poblacional está dispuesto a aceptar. El error de muestreo debe estar expresado en la
misma unidad de medida de la variable.
La confianza en la estimación: Este factor es proporcionado por el usuario de la
muestra. El debe indicar cuál es la probabilidad deseada de que el intervalo de
confianza cubra al verdadero valor de la media poblacional.
La varianza de la población: Este factor indica el grado de variabilidad de la
población.
El tamaño de la población: En caso de poblaciones finitas, este factor es una
restricción para el tamaño de la muestra.
Donde:
T1: Es el fractil de orden de la distribución t de student con (n-1) g.l.
S2: Varianza muestral calculada con la muestra piloto de tamaño n0.
e: Error de muestreo
3) Se obtiene un segundo tamaño de muestra, cambiando el valor t1 utilizado
anteriormente por t2, otro fractil de orden de la distribución t de Student pero usando
(n1-1)g.l.
5) Este proceso iterativo se repite tantas veces hasta que dos tamaños de muestra
consecutivos son iguales ni= n(i+1) entonces ese es el tamaño de la muestra.
Tamaño de muestra para estimar la proporción poblacional
El cálculo del tamaño de la muestra se realiza teniendo en cuenta los siguientes
factores:
• El error de muestreo: Este factor es proporcionado por el usuario de la muestra. El
debe indicar cuál es la máxima diferencia entre la proporción muestral y la proporción
población que está dispuesto a aceptar. El error de muestreo debe estar expresado en
tanto por uno.
• La confianza en la estimación: Este factor es proporcionado por el usuario de la
muestra. El debe indicar cuál es la probabilidad deseada de que el intervalo de
confianza cubra al verdadero valor de la proporción poblacional.
• La proporción: Este factor proporciona información sobre el grado de concentración
de los elementos que tienen el atributo A.
• El tamaño de la población: En caso de poblaciones finitas, este factor es una
restricción para el tamaño de la muestra.
El error de muestreo se obtiene haciendo la semidiferencia entre los límites del
intervalo de la confianza.
Luego
Prueba de hipótesis
Se llama hipótesis estadística a cualquier afirmación o aseveración que se formula
acerca de cualquier característica poblacional (el valor numérico de un parámetro, la
forma funcional de una población, etc.)..
Se llama hipótesis parametrica a aquella hipótesis estadística planteada para controlar
o verificar el valor numérico de un parámetro.
Se consideran solo tres posibles situación del valor numérico del parámetro, a saber:
• El valor numérico del parámetro θ es exactamente igual a un determinado valor
postulado θo.
• El valor numérico del parámetro θ es menor a un deterimando valor postulado de θo.
• El valor numérico del parámetro θ es mayor a un determinado valor postulado de θo.
Se llama curso de acción a la acción que se llevaría a cabo, si se conociese el
verdadero valor del parámetro θ.
Se llama desigualdad equivalente a la igualdad a aquella desigualdad entre el
parámetro θ y el valor postulado θo, que provoca el mismo curso de acción que se
llevaría a cabo con la igualdad entre el valor del parámetro θ y el valor postulado θo.
Se llama desigualdad no equivalente a la igualdad a aquella desigualdad entre el
parámetro θ y el valor postulado θo, que provoca un curso de acción distinto al que se
llevaría a cabo con la igualdad entre el valor del parámetro θ y el valor postulado θo.
Se llama hipótesis nula a aquella hipótesis que establece que la diferencia entre el
verdadero valor del parámetro valor del parámetro θ y el valor postulado θ, y el valor
que se postula valor del parámetro θ y el valor postulado θo.o, es cero.
Necesariamente la hipótesis nula debe plantearse como la igualdad entre el valor del
parámetro y el valor postulado
Si es menor:
El valor de parámetro θ es igual o menor al valor postulado θo
La diferencia entre el verdadero valor del parámetro θ y el valor postulado, θo, es
menor o igual a cero
Si es mayor:
El valor de parámetro θ es igual o mayor al valor postulado θo
La diferencia entre el verdadero valor del parámetro θ y el valor postulado, θo, es
mayor o igual a cero
Hipótesis alternativa
Es aquella hipótesis que debería cumplirse si la hipótesis nula no es cierta.
Hipótesis alternativa única: Cuando hay un solo valor alternativo del parámetro θ, el
θ1, que debería ser en el caso de que la hipótesis nula no sea cierta.
Si la hipótesis nula no es cierta, entonces, el valor de parámetro θ debería ser igual a
θ1.
Dada la hipótesis nula la regla de decisión establece que hay que rechazarla si, luego
de obtener la muestra, hacer las mediciones correspondientes y calcular el valor
numérico del estadígrafo de prueba, ep, éste pertenece a la región critica, y que no
hay que rechazarla si el estadígrafo de prueba, ep, no pertenece a la región critica.
Error de tipo I
El hecho de rechazar la hipótesis nula cuando la hipótesis nula es cierta.
Error de tipo II
El hecho de no rechazar la hipótesis nula cuando la hipótesis nula es falsa.
Nivel de significación
Es la probabilidad de cometer el error de tipo I, o sea, a la probabilidad de rechazar la
hipótesis nula cuando es cierta. El nivel de significación se simboliza con la letra griega
α y mide el tamaño de la región critica.
Potencia de la prueba
Es la probabilidad de no cometer el error de tipo II, o sea, la probabilidad de rechazar
la hipótesis nula cuando es falsa. La potencia de la prueba se simboliza con la letra
griega ∏
Acción derivada
El rechazo de la hipótesis nula inducirá al investigador a realizar una determinada
acción con respecto al objeto de su investigación. Si por el contrario, no se rechaza la
hipótesis nula, entonces el investigador estará también inducido a realizar una acción,
pero distinta. Cualesquiera de estas dos acciones se derivan del resultado de la
prueba de hipótesis.
Se llama acción derivada a la acción que se lleva a cabo según el resultado de la
decisión estadística que se tome, rechazar o no rechazar la hipótesis nula.
Pasos a seguir para realizar una prueba de hipótesis parametrica
1-Establecer el parámetro a probar
2-Indicar los cursos de acción
3-Verificar si hay una desigualdad equivalente
4-Plantear la hipótesis nula y la hipótesis alternativa
5-Indicar el estadígrafo de prueba a utilizar y su correspondiente distribución de
probabilidad
6-Establecer la región critica y el o los puntos críticos teniendo en cuenta lo siguiente:
a) Si la desigualdad no equivalente es la desigualdad menor, toda la región critica esta
a la izquierda y el punto crítico es el fractil α2.
b) Si la desigualdad no equivalente es la desigualdad mayor, toda la región critica esta
ala derecho y el punto crítico es el fractil (1-α)3
c) Si no hay desigualdad equivalente la región critica se particiona en dos. Una parte a
la izquierda cuyo punto crítico es el fractil (α/2)4 y la otra parte a la derecha cuyo punto
crítico es el fractil [1-(α/2)].
7-Plantear la regla de decisión estadística para rechazar o no la hipótesis nula.
8- Calcular el valor numérico del estadígrafo de prueba y verificar a que región
pertenece.
9-Tomar la decisión estadística
10-Llevar a cabo la acción derivada.
Estadígrafos de prueba para la prueba de hipótesis de parámetros específicos de una
población
Poblaciones infinitas con varianza poblacional conocida
Poblaciones finitas
Análisis de regresión
Es un método estadístico que permite explicar el comportamiento de una variable
cuantitativa, a partir del comportamiento de otra u otras variables que puedan estar
relacionadas, estableciendo la expresión funcional del modelo matemático que
describa dicho comportamiento.
Variable explicada
Es aquella variable cuantitativa cuyo comportamiento se desea describir a partir del
comportamiento de otra u otras variables.
Variables explicativas
Son aquellas variables que explica el comportamiento de la variable explicada
Ej.: Para medir la cantidad demandada de un determinado bien por una unidad
económica, se puede utilizar el precio de dicho bien, el precio de bienes
complementarios, el precio de bienes sustitutos, el ingreso del consumidor, etc.
El análisis de regresión consiste en construir un modelo que permita predecir el valor
de la variable explicada, utilizando para ello, valores de K variables explicativas. El
modelo a construir consta de dos partes. Una de ellas, es una función real o modelo
matemática y la otra parte, es una variable aleatoria que representa la variabilidad no
controlada por las k variables explicativas.
Se llama modelo estadístico de regresión al modelo
Se llama función de regresión al modelo matemático que interviene en el modelo
estadístico de regresión
Se llama residuo aleatorio o variable aleatoria residual a la variable aleatoria que forma
parte del modelo estadístico de regresión.
β0 es la ordenada al origen.
Suma de cuadrados de X
La diferencia entre un valor particular de la variable explicativa Xo y su media
aritmética X es una desviación de la variable X
Si se toman todos los valores de dicha variable se puede calcular la suma del
cuadrado de las desviaciones de la variable x con respecto a la media aritmética o
simplemente suma de cuadrados de x, la que mide la variabilidad total de la variable X.
Suma de cuadrados de Y
La diferencia entre un valor particular de la variable explicada Yo y su media aritmética
Y es una desviación de la variable Y
Si se toman todos los valores de dicha variable se puede calcular la suma del
cuadrado de las desviaciones de la variable y con respeto a la media aritmética, o
simplemente suma de cuadrados de y, la que mide la variabilidad total de la variable Y.
Si se toman todos los pares de valores de dichas variables se puede calcular la suma
del producto de las desviaciones de cada variable con respecto a sus respectivas
medias aritméticas, o simplemente suma del producto XY, la que mide la variabilidad
conjunta total entre las variables X e Y.
La recta de regresión estimada tiene la propiedad de compensar los desvíos que se
producen entre cado valor muestral de la variable explicativa y el correspondiente valor
de la recta. Se cumple que:
Números índices
Son aquellas medidas estadísticas que ponen de manifiesto, en forma cuantitativa, las
variaciones relativas de un fenómeno complejo, a través del tiempo, del espacio o de
cualquier otra circunstancia.
Indican la variación porcentual de una variable o grupo de variables, entre una
situación inicial (situación base de comparación), y otra situación final (situación objeto
de la comparación).
Se llama canasta al conjunto de bienes económicos que intervienen en la construcción
de un número índice.
Se llama periodo base al periodo cronológico que se utiliza como situación inicial o
base de la comparación
Se llama periodo actual al periodo cronológico que se quiere comparar con el periodo
base.
El periodo actual “t” es un momento particular en el tiempo. Un número índice
construido en ese momento, mide el tamaño relativo porcentual de laguna variable, o
grupo de variables, con relación al tamaño que tenían en el periodo base.
Para lograr que el número índice ponga de manifiesto, con mayor objetividad, los
cambios relativos en los valores de las variables, al seleccionar el periodo base para
construir un índice particular, se deben observar dos reglas:
• El periodo base seleccionado debe ser un periodo de normalidad o estabilidad
económica, ya que un periodo que este cerca de una cúspide, en una economía en
expansión, o de una sima, en una economía declinante o en recesión, pueden
proporcionar comparaciones que no reflejen adecuadamente los aspectos dinámicos
de las variables que se están analizando.
• El periodo base no debería estar muy alejado de los periodos que serán objeto de
comparación, a fin de que estas comparaciones no resulten afectadas sin necesidad,
por cambios en la tecnología, calidad del producto, o en las actitudes, intereses,
gustos y hábitos de los consumidores.
Clasificación de los números índices
Según la variable cuya variación se pretende medir, se clasifican en:
• Índice de precios: refleja el cambio porcentual de los precios de uno o más bienes.
• Índice de cantidad: Refleja el cambio porcentual de las cantidades demandadas de
uno o más bienes.
• Índice de valor: Refleja el cambio porcentual de lo gastado en uno o más bienes.
Índices Simples
Para un solo bien: Relativo simple, es el precio relativo multiplicado por 100. Este
índice indica la variación porcentual del precio del i-esimo bien de la canasta.
Índice de Laspeyres
Este índice mide la variación porcentual del gasto total en los k bienes, si en el año
actual se hubiesen demandado las cantidades del año base. Es criticado, en primer
lugar, porque, según las leyes económicas, las variaciones en los precios provocan
variaciones en las cantidades demandadas (generalmente en sentido contrario, luego,
el numerado carecería de validez ya que no reflejaría la realidad. En segundo lugar,
este índice no tiene en cuenta los cambios tecnológicos y los cambios en los gustos de
los consumidores, lo que hace que las cantidades sufran variaciones de importancia,
llegando al extremo de ser casi nulas en algunos casos, no obstante, en la
construcción del numero debe seguir figurando la cantidad demandada en el año base,
con la consecuente distorsión de la realidad.
Índice de Paasche
Este índice mide la variación porcentual del gasto total en los k bienes, si en el año
base se hubiese demandado las cantidades del año actual. Es criticado porque, en
primer lugar, igual que con el índice de Laspeyres, no se tiene en cuenta las
variaciones en las cantidades demandadas provocadas por las variaciones en los
precios. Esto significa que si los precios del año base son menores a los del año
actual, las cantidades demandadas serán mayores, luego, el denominador carecería
de validez, ya que no reflejaría la realidad. En segundo lugar, por cuestiones
tecnológicas o de gustos del consumir, algunos bienes consumido en el año actual
podrían no conocerse en al año base, por lo tanto no tendrían precio, y el índice no se
podría calcular. En tercer lugar, si se quiere mantener una serie cronológica obligaría a
recalcularla en cada período, ya que las cantidades demandadas cambian de periodo
a periodo.
Índice de Fischer
Índices de cantidad
Una cantidad relativa para cada uno de los bienes de la canasta, en un momento dado
en el tiempo, el periodo actual t, es el cociente entre la cantidad del bien en ese
periodo y la cantidad del bien en el periodo base.
Índices simples
Para un solo bien: La cantidad relativa multiplicada por 100, es el índice relativo
simple.
Índices ponderados
a) Ponderado por el precio: Se construye calculando el promedio aritmético ponderado
de las cantidades relativas, utilizando como factor de ponderación los
correspondientes precios, en el periodo base, de los bienes que constituyen la
canasta.
c) Ponderado por el valor del año base con los precios del año actual: Se construye
calculando el promedio aritmético ponderado de las cantidades relativas, utilizando
como factor de ponderación, el valor que se hubiese gastado en el periodo base, en
cada uno de los bienes que constituyen la canasta si se hubiesen pagado los precios
del año actual.
4. Identidad: El índice de la base (en tanto por uno) debe ser igual a la unidad