Você está na página 1de 25

Carrera:

Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

1. INTRODUCCIN
La estadstica es el lenguaje universal de la ciencia. Como usuarios potenciales de la estadstica, es necesario dominar la
ciencia y el arte de utilizar correctamente su metodologa. El empleo cuidadoso de los mtodos estadsticos permite
obtener informacin precisa de los datos. Estos mtodos incluyen; definir cuidadosamente la situacin, recolectar datos,
resumir con precisin los datos y obtener y comunicar las conclusiones importantes.
La estadstica implica informacin, nmeros y grficas para resumir la informacin; y su interpretacin. El trmino estadstica
posee varios significados para personas de diversos entornos e intereses. Para algunos, se trata de un medio para recolectar
y representar grandes cantidades de informacin. Para otros, se trata de un medio para lomar decisiones de frente a la
incertidumbre.
En la perspectiva idnea, cada uno de estos puntos de vista es correcto.
El terreno de la estadstica puede dividirse en dos reas: estadstica descriptiva y estadstica inferencial. La estadstica
descriptiva es en lo que piensa la mayora de las personas al escuchar la palabra estadstica ya que incluye la recoleccin,
presentacin y descripcin de los dalos' mustrales. El trmino estadstica inferencial se refiere a la tcnica de interpretacin
de los valores resultantes de las tcnicas descriptivas y a la toma de decisiones y obtencin de conclusiones sobre la
poblacin.
La estadstica es ms que slo nmeros; son los datos, lo que se hace con los dalos, lo que se aprende de los datos
y las conclusiones resultantes.
2-CONCEPTO DE ESTADISTICA
La estadstica segn Kendall y Buckland:
La estadstica es un valor resumido, calculado, con base en una muestra de observaciones que
generalmente, aunque no por necesidad, se considera como una estimacin de parmetro
de determinada poblacin; es decir, una funcin de valores de muestra.
La estadstica segn Gini;
La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos de
masa o colectivos, cuya mediacin requiere una masa de observaciones de otros fenmenos
ms simples llamados individuales o particulares
La estadstica segn Spiegel:
La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y analizar datos;
asi como para sacar conclusiones vlidas y lomar decisiones razonables basadas en tal anlisis.
La estadstica segn Yale y Kendall:
La estadstica es la ciencia que traa de la recoleccin, clasificacin y presentacin de tos
hechos sujetos a una apreciacin numrica
como base a la explicacin, descripcin y comparacin de los
3. CLASIFICACIN DE ESTADISICA
fenmenos..
El terreno de la estadstica puede dividirse en dos campos de aplicacin: estadstica descriptiva y estadstica inferencial.
3.1 Estadstica Descriptiva
Tiene por objeto fundamental la obtencin, presentacin, anlisis y descripcin de un conjunto de datos.
Estudia las tcnicas que se utilizan para describir o caracterizar los datos obtenidos.
3.2 Estadstica Inferencial
Abarca las tcnicas que permiten utilizar los datos mustrales para inferir o extraer conclusiones sobre las poblaciones
de las cuales fueron obtenidos dichos datos.
Incluye las tcnicas que emplean los datos obtenidos en la muestra, para, a partir de ellos, hacer inferencias sobre
sus respectivas poblaciones
4. COMPONENTES DE UNA INVESTIGACIN ESTADISICA
Los componentes son:
4.1 Poblacin: Es una coleccin o conjunto' de individuos, objetos o dalos que el investigador est interesado en estudiar.
En un experimento, la poblacin es el grupo ms grande del cual se pueden tomar los elementos que participarn en
dicho experimento.
Para definirla es necesario tener en cuenta las siguientes caractersticas:
Homogeneidad: los miembros de la poblacin deben tener caractersticas semejantes.
Tiempo: perodo de tiempo donde se ubica la poblacin de inters.
Espacio, lugar donde se ubica la poblacin de inters.
La poblacin puede ser:
Finita; se pueden enumerar todos los elementos de la poblacin.
Infinita; no se pueden enumerar todos los elementos de la poblacin.
Cuando la informacin deseada est disponible para todos los objetos de la poblacin, se tiene lo que se llama censo.
Las restricciones de tiempo, dinero y otros recursos hacen que un censo sea, generalmente, imprctico o infactible.
4.2 Muestra
Es un subconjunto de la poblacin, que se escoge a travs de un proceso llamado muestreo

Carrera:
Asignatura: Probabilidad y estadstica
Curso:
Profesor: Blanco Vctor
Unidad 1Estadstica: concepto. Estadstica descriptiva e Inferencial. Variables. Poblacin. Muestra. Tipos de muestra. Parmetro y
Estadstico. Unidad de observacin. Inferencia estadstica. Variable. Clasificacin. Recopilacin de datos. Obtencin de la informacin.
Fuentes de informacin. Etapas de estudio de una investigacin estadstica. Representacin de datos estadsticos: Tablas y grficos
estadsticos para variables cualitativas y cuantitativas.

1. Definicin de Estadstica
La Estadstica Es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a individuos, grupos, series
de hechos, etc. y deducir de ello gracias al anlisis de estos datos unos significados precisos o unas previsiones para el futuro.
La estadstica, en general, es la ciencia que trata de la recopilacin, organizacin presentacin, anlisis e interpretacin de
datos numricos con el fin de realizar una toma de decisin ms efectiva.
La estadstica es una parte de la matemtica que trata de establecer las caractersticas comunes de una cantidad de datos.
La palabra tiene tres significados: la palabra estadstica, en primer trmino se usa para referirse a la informacin estadstica;
tambin se utiliza para referirse al conjunto de tcnicas y mtodos que se utilizan para analizar la informacin estadstica; y el
trmino estadstico, en singular y en masculino, se refiere a una medida derivada de una muestra. La Estadstica trata de la
recoleccin, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar
conclusiones.
Utilidad e Importancia
Los mtodos estadsticos tradicionalmente se utilizan para propsitos descriptivos, para organizar y resumir datos numricos.
La estadstica descriptiva, por ejemplo trata de la tabulacin de datos, su presentacin en forma grfica o ilustrativa y el
clculo de medidas descriptivas. Ahora bien, las tcnicas estadsticas se aplican de manera amplia en mercadotecnia,
contabilidad, control de calidad y en otras actividades; estudios de consumidores; anlisis de resultados en deportes;
administradores de instituciones; en la educacin; organismos polticos; mdicos; y por otras personas que intervienen en la
toma de decisiones. Es decir los datos pueden surgir de diferentes campos, como experimentos mdicos con el fin de
determinar el efecto de una nueva droga, el control de calidad de productos industriales elaborados en una fbrica, para la
medicin de la opinin pblica, etc. Con respecto a la investigacin su papel es actuar como una herramienta en el diseo
investigaciones, en el anlisis de datos y en la extraccin de conclusiones a partir de ellos.
Divisin de la Estadstica
La Estadstica para su mejor estudio se ha dividido en dos grandes ramas: la Estadstica Descriptiva y la Inferencial.
Estadstica Descriptiva: Consiste sobre todo en la presentacin de datos en forma de tablas y grficas. Esta comprende
cualquier actividad relacionada con los datos y est diseada para resumir o describir los mismos sin factores pertinentes
adicionales; esto es, sin intentar inferir nada que vaya ms all de los datos, como tales; es decir trata solamente de describir
y analizar un grupo dado sin sacar conclusiones de un grupo mayor.
Estadstica Inferencial: Se deriva de muestras, de observaciones hechas slo acerca de una parte de un conjunto numeroso
de elementos y esto implica que su anlisis requiere de generalizaciones que van ms all de los datos; es decir trata las
condiciones bajo las cuales las inferencias para un grupo mayor son validas. Como consecuencia, la caracterstica ms
importante del reciente crecimiento de la estadstica ha sido un cambio en el nfasis de los mtodos que describen a
mtodos que sirven para hacer generalizaciones. La Estadstica Inferencial investiga o analiza una poblacin partiendo de una
muestra tomada.
Mtodo Estadstico
El conjunto de los mtodos que se utilizan para medir las caractersticas de la informacin, para resumir los valores
individuales, y para analizar los datos a fin de extraerles el mximo de informacin, es lo que se llama mtodos estadsticos.
Los mtodos de anlisis para la informacin cuantitativa se pueden dividir en los siguientes seis pasos:
1. Definicin del problema.
2. Recopilacin de la informacin existente (recoleccin de datos).
3. Obtencin de informacin original.
4. Clasificacin.
5. organizacin y representacin de datos.
6. Anlisis de datos.
7. obtencin de conclusiones.
Errores Estadsticos Comunes
Al momento de recopilar los datos que sern procesados se es susceptible de cometer errores as como durante los
cmputos de los mismos. No obstante, hay otros errores que no tienen nada que ver con la digitacin y que no son tan
fcilmente identificables.
Algunos de estos errores son:
Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de comenzar a estudiar un problema,
y existen muchas maneras en que una perspectiva o estado mental pueda influir en la recopilacin y en el anlisis de la
informacin. En estos casos se dice que hay un sesgo cuando el individuo da mayor peso a los datos que apoyan su opinin
que a aquellos que la contradicen. Un caso extremo de sesgo sera la situacin donde primero se toma una decisin y
despus se utiliza el anlisis estadstico para justificar la decisin ya tomada.

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Datos no comparables: el establecer comparaciones es una de las partes ms importantes del anlisis estadstico, pero es
extremadamente importante que tales comparaciones se hagan entre datos que sean comparables.
Proyeccin descuidada de tendencias: la proyeccin simplista de tendencias pasadas hacia el futuro es uno de los errores
que ms ha desacreditado el uso del anlisis estadstico.
Muestreo Incorrecto: En la mayora de los estudios sucede que el volumen de informacin disponible es tan inmenso que se
hace necesario estudiar muestras, para derivar conclusiones acerca de la poblacin a que pertenece la muestra. Si la muestra
se selecciona correctamente, tendr bsicamente las mismas propiedades que la poblacin de la cual fue extrada; pero si el
muestreo se realiza incorrectamente, entonces puede suceder que los resultados no signifiquen nada
Poblacin: Estadsticamente, la poblacin se define como un conjunto de individuos o de objetos que poseen una o
varias caractersticas comunes. No se refiere esta definicin nicamente a los seres vivientes; una poblacin puede estar
constituida por los habitantes de un pas o por los peces de un estanque, as como por los establecimientos comerciales de
un barrio o las unidades de vivienda de una ciudad. Es la totalidad de valores posibles de una caracterstica de un grupo
especfico de objetos; en definitiva una poblacin es el conjunto de todos los elementos a los que se somete a un estudio
estadstico.
Este conjunto debe estar bien definido, de tal forma que se puedan distinguir quienes pertenecen o no a dicho conjunto.

Una poblacin puede ser finta o infinita. Se dice que es finita si esta compuesta por una cantidad finita, determinable de
elementos .es infinita si no se puede determinar la cantidad de elementos que posee, sin embargo Existen desde el punto de vista de su
manejabilidad poblaciones finitas e infinitas. Aqu el trmino infinito no est siendo tomado con el rigor semntico de la palabra; por
ejemplo, los peces dentro de un estanque son un conjunto finito; sin embargo, en trminos estadsticos, puede ser considerado como
infinito.

Muestra: Es cualquier subconjunto de la poblacin que estudiamos, seleccionada de acuerdo con una regla o un plan, se pide que sea
representativa; es decir que todos los elementos de la poblacin tengan la misma posibilidad de ser elegidos, o sea que sea aleatoria. Por
lo general es poco practico medir a todos los miembros de una poblacin por lo tanto es necesario seleccionar una muestra de la poblacin
con el objeto de estudiarla. La precisin de la investigacin depende en gran parte de la forma en que la muestra es escogida.
En la prctica, estudiar todos y cada uno de los elementos que conforman la poblacin no es aconsejable, ya sea por la poca disponibilidad
de recursos, por la homogeneidad de sus elementos, porque a veces es necesario destruir lo que se est midiendo, por ser demasiado
grande el nmero de sus componentes o no se pueden controlar; por eso se recurre al anlisis de los elementos de una muestra con el fin
de hacer inferencias respecto al total de la poblacin. Existen diversos mtodos para calcular el tamao de la muestra y tambin para
tomar los elementos que la conforman. Hay que tener en cuenta que la muestra debe ser representativa de la poblacin y sus elementos
escogidos al azar para asegurar la objetividad de la investigacin.
En definitiva, Una muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor
que el de la poblacin.

Muestreo: El muestreo es la reunin de datos que se desea estudiar, obtenidos de una proporcin reducida y representativa de la
poblacin.

Tipos de muestra
En la prctica se han encontrado varias clases o tipos de muestras. Las caractersticas que distinguen a un tipo de otro son: la
manera de obtencin de la muestra; el nmero de variables y el fin para el que fue extrada la muestra.
La manera de obtencin de la muestra o sea el muestreo es muy importante y pueden agruparse, segn su mtodo de
seleccin, en dos grandes clases:
a)

Las que se seleccionan por criterio: La seleccin de la muestra es fijada por cierto tipo de criterio subjetivo de
manera que no todos los miembros de la poblacin tienen la misma posibilidad de ser elegidos y por lo tanto no
resulta objetivo realizar generalizaciones.(a esto se llama muestra no aleatoria). En este caso los sesgos pueden
influir para evitar que ciertos miembros de la poblacin no sean seleccionados.

b) Las que se seleccionada azar: Cuando la muestra es seleccionada de tal forma que todos los elementos de la
poblacin tienen la misma oportunidad de ser elegidos, se llama aleatoria. Es decir cada elemento de la poblacin
tiene una probabilidad conocida de pertenecer a la muestra.
Recordamos que una buena muestra es aquella a partir de la cual pueden hacerse generalizaciones respecto a la poblacin, mientras que
una mala muestra es aquella que no permite tales generalizaciones. Por lo tanto una buena muestra debe ser aleatoria y representativa de
la poblacin de estudio.
Existen diferentes tipos de muestreo:
a)

Muestreo aleatorio simple: Se obtiene al azar y todos los elementos de la poblacin tienen la misma probabilidad de ser
elegidos y se elige un elemento por vez. Puede hacerse a travs de diferentes procedimientos como el mtodo de los nmeros
aleatorios; El mtodo consiste en enumerar todos los elementos de una poblacin y luego utilizar tablas de nmeros aleatorios o
la funcin random de la calculadora, o sorteo aleatorio.

Carrera:
Asignatura: Probabilidad y estadstica
Curso:
Profesor: Blanco Vctor
b) Muestreo sistemtico: El procedimiento comienza eligiendo el primer elemento al azar simple y despus se seleccionan los
elementos cada k-simo unidad de la poblacin.
c) Muestreo estratificado: Se divide la poblacin en grupos o clases llamados estratos, dentro de cada uno de los estratos los
elementos estn situados de manera ms homognea con respecto a las caractersticas que estn estudio. Luego, para cada
estrato se toma una submuestra mediante el procedimiento aleatorio simple. Es frecuente que se tome la misma proporcin por
cada estrato.
d) Muestreo por conglomerados: Se selecciona primero al azar los grupos, llamados conglomerados y se toma luego todos los
elementos o una submuestra de ellos dentro de cada conglomerado. Se puede llevar acabo en varias etapas.

Parmetro: Nmero resultante de una manipulacin de ciertos datos pertenecientes a una poblacin, de acuerdo con
determinados procedimientos especficos. Por ejemplo el promedio de inasistencia semanal de un determinado colegi. Mas
adelante veremos que utilizremos algunas letras para referirnos a estos valores.

Estadstico: Nmero resultante de una manipulacin de ciertos datos pertenecientes a una muestra, de acuerdo con

determinados procedimientos especficos. Comnmente, usamos un estadstico que se calcula a partir de una muestra para
estimar el parmetro de una poblacin.

Unidad de observacin: Es un solo miembro de la poblacin que estudiamos. Tambin se lo denomina individuo, Un
individuo o unidad estadstica es cada uno de los elementos que componen la poblacin.
Inferencia estadstica: Una inferencia estadstica es una conclusin obtenida de una poblacin completa desde la informacin
tomada de una muestra. Este es un proceso por el cual se atribuyen a la poblacin completa caractersticas mas significativas que se
obtuvieron y midieron en una muestra. Dicho proceso no es infalible pero en la mayora de los casos, podemos predecir un margen de
error y asignar toda la validez del estudio. Una cuidadosa conduccin de la investigacin estadstica produce generalmente una muy
confiable informacin.
Por ejemplo supongamos que un socilogo desea hacer un estudio de la relacin entre la salud y el ingreso. La poblacin en estudio podra
estar constituida por todos los matrimonios con hijos o sin ellos. Despus de seleccionar una muestra de parejas, el socilogo mide en cada
una el ingreso total anual y su estado de salud del momento, la mortalidad infantil, las condiciones sanitarias, el registro de vacunacin, las
visitas al medico, el numero de ausencias a la escuela provocadas por enfermedades, etc. El socilogo obtendr estadsticos de los
resultados de estas mediciones y aplicara los mismos haciendo una inferencia estadstica para informar acerca de la poblacin completa.

Frecuencia: Es la cantidad de veces que un elemento se repite en un conjunto. La frecuencia es arbitraria pero debe haber
dos por lo menos.
Variable: Una variable es un nmero, (cantidad o medida) o denominacin es un conjunto de valores medidas, u observaciones
que estudia las caractersticas comunes a todos los elementos de la poblacin. Al hacer investigaciones estadsticas uno efecta mediciones
sobre las unidades de observacin. Estas mediciones pueden ser cuantitativas o cualitativas. En otras palabras un a variable estadstica

es cada una de las caractersticas o cualidades que poseen los individuos de una poblacin.
Para introducir una variable se debe tener en cuenta la caracterstica o cualidad que se va a estudiar de manera que la
poblacin quede dividida en grupos bien diferenciados.

Las variables deben cumplir con:


Deben ser una caracterstica que se pueda diferenciar.
Distintos grupos de presentacin tienen diferentes tipos de frecuencia.
Las variables deben introducir diferencias sustanciales en el grupo
Introducir variables y establecer la frecuencia en la que se presenta la variable es la nica forma que tiene la
estadstica para describir la poblacin
CLASIFICACIN DE VARIABLES
Dependiendo del pipo de caracterstica o cualidad que se a estudiar, se puede clasificar las variables en: CUANTITATIVAS o
CUALITATIVAS.

Variables Cualitativas: Se refieren a caractersticas, atributos, actitudes o cualidades asociados a la unidad de


observacin, que no pueden ser medidas con nmeros. Es decir Las variables cualitativas se refieren a caractersticas o
cualidades que no pueden ser medidas con nmeros.
Por ejemplo: La variable que se refiere al color de ojos puede tomar valores como azul, marn, negro etc. O tambin registro
de opiniones, jerarqua, agrupamiento de personas por razas, lugar de nacimiento, conducta del alumno, entre otras.
Las variables cualitativas se dividen en Ordinales y Nominales.
La variable cualitativa nominal: No admite orden de jerarqua; es decir Una variable cualitativa nominal presenta
modalidades no numricas que no admiten un criterio de orden .Por ejemplo: El estado civil, con las siguientes
modalidades: soltero, casado, separado, divorciado y viudo. Lugar de nacimiento, sexo (si), carrera, profesin, color de ojos,
de cabello, afiliacin poltica, etc.

La variable cualitativa ordinal: Admite jerarqua, tiene un orden jerrquico (escalas); es decir Una variable cualitativa
ordinal presenta modalidades no numricas, en las que existe un orden.

Carrera:
Asignatura: Probabilidad y estadstica
Curso:
Profesor: Blanco Vctor
Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba
deportiva: 1, 2, 3, Medallas de una prueba deportiva: oro, plata, bronce. Grado de opinin, notas cualitativas, grado de
escolaridad.

Variable Cuantitativa: Es la que se expresa mediante un nmero, son de dimensin o capacidad y dependiendo de que
tipo de nmero se trate se pueden clasificar en cuantitativas Discretas y cuantitativas Continuas. Por ejempl estatura, peso,
profundidad, longitud, tiempo, volumen, rea, etc.

Variable cuantitativa Discreta aquella que toma valores aislados, es decir no admite valores intermedios entre dos
valores especficos. Se utiliza para contar es decir los valores de la variable se pueden enumerar. Por ej. Cantidad de
hermanos, cantidad de hermanos, etc. El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Variable continua una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros
enteros, es decir, todos los valores de un intervalo, los valores se pueden medir. Existen infinitos Valores. Son de dimensin
o capacidad, por ejemplo: La altura de los 5 amigos: 1,73; 1,82; 1,77; 1,69; 1,75; el peso, profundidad, longitud, tiempo,
volumen, rea, etc.
VARIABLE
CUALITATIVA
(indican
atributos,
caractersticas,
actitudes, etc.)

NOMINAL

CUANTITATIVA
(indican
cantidades)

DISCRETA

ORDINAL

CANTINUA

DEFINICIN

EJEMPLO

NO SE PUEDE ESTABLECER UN
ORDEN DE JERAQUIA

PROFESION,
NACIMINETO

SE PUEDE ESTABLECER UN
ORDEN DE JERARQUIA

NOTAS
CUAKITATIVAS,
GRADO DE OPINION

LOS VALORES POSIBLES SE


PUEDEN ENNUMERAR

CANTIDAD DE HERMANOS,
NUMERO DE ALUMNOS

LOS VALORES
MEDIR

ALTURA,
TEMPERATURA

SE

PUEDEN

LUGAR

DE

PESO,

ORGANIAZCIN DE DATOS ESTADISTICOS


Los datos estadsticos deben ser representados en forma efectiva, tanto como una ayuda para el anlisis como
para comunicar los resultados de este .Sin una preparacin efectiva, los datos estadsticos pierden mucho de
valor y de su impacto.
Los datos pueden ser organizados en:

Serie simple: Los datos son ordenados en forma creciente o decreciente.


Supongamos que los siguientes datos corresponden al resultado de un test de razonamiento.
62

88

79

92

86

87

83

78

41

67

68

76

46

81

92

77

84

76

70

66

77

75

98

81

82

81

87

78

70

60

99

79

52

82

77

81

77

70

74

61

41

61

68

74

77

78

81

82

86

92

46

62

70

75

77

78

81

82

87

98

52

66

70

76

77

79

81

83

87

98

60

67

70

76

77

79

81

84

88

99

La serie simple seria:

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Arreglo tronco y hojas: tcnica que remen simultneamente los datos numricos y presenta una discusin
grafica de la distribucin.
Para el ejemplo anterior las decenas sern los troncos y las unidades formaran las hojas:

Tablas de Frecuencias:
Las tablas de frecuencia sirven para ordenar los datos de una muestra y permitir que se pueda leer la informacin en forma
mas clara o sea es un resumen de informacin respecto a una o ms variables, que ofrezca claridad al lector sobre lo que se
pretende describir. Podemos construir una tabla de frecuencia o distribucin de frecuencia ya sea que los datos sean
cualitativos o cuantitativos.
En una tabla de frecuencia podemos encontrar las siguientes simbolizaciones
N: Tamao de
n: El tamao de la muestra, es el nmero de observaciones.
Xi: La variable; es cada uno de los diferentes valores que se han observado. La variable Xi, toma los x1, x2... xm valores.
fi: La frecuencia absoluta o simplemente frecuencia, es el nmero de veces que se repite la variable Xi; as f1, es el nmero de
veces que se repite la observacin x1, f2 el nmero de veces que se repite la observacin x2 etc.
Fi: La frecuencia acumulada, se obtiene acumulando la frecuencia absoluta.
hi: Frecuencia relativa; es el resultado de dividir c/u de las frecuencias absolutas por el tamao de la muestra.
Hi: Frecuencia relativa acumulada; se obtiene dividiendo la frecuencia acumulada entre el tamao de la muestra.
Intervalo de clase: Es un rango de nmeros definido arbitrariamente por los nmeros ms altos y los ms bajos de ella.
Frecuencia: Se refiere al nmero de veces que ocurre un valor particular o fenmeno.
Frecuencia de un intervalo: Se refiere al nmero de valores que ea dentro del intervalo.
Frecuencia relativa de un intervalo: Se refiere a la proporcin de todos lo valores dados que caen dentro del intervalo.

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Aunque es difcil dividir la estadstica en partes separadas, una divisin clsica hasta hace unos 30 aos ha sido
entre estadstica descriptiva y estadstica inferencial.
La estadstica descriptiva tiene como fin presentar resmenes de un conjunto de datos y poner de manifiesto sus
caractersticas, mediante representaciones grficas. Los datos se usan para fines comparativos, y no se usan
principios de probabilidad. El inters se centra en describir el conjunto dado de datos y no se plantea el extender
las conclusiones a otros datos diferentes o a una poblacin.
La inferencia estadstica, por el contrario, estudia los resmenes de datos con referencia a un modelo de
distribucin probabilstico o una familia de modelos, determinando mrgenes de incertidumbre en las estimacin
de los parmetros desconocidos del mismo. Se supone que el conjunto de datos analizados es una muestra de
una poblacin y el inters principal es predecir el comportamiento de la poblacin, a partir de los resultados en la
muestra.
Inferencia: conclusin que se obtiene al finalizar un estudio estadstico. En todo estudio estadstico hay que
seguir una serie de pasos hasta llegar a las conclusiones finales (inferencia) que normalmente se dan en forma de
grficos, ya que es la manera ms sencilla de entender los resultados del estudio estadstico.
Se comienza por determinar que se quiere estudiar y a continuacin se hace una eleccin del tipo y la cantidad de
los datos que se van a utilizar.
Pasos: una vez definida la poblacin, se introducen las variables y surgen los subconjuntos estos tienen el mismo
valor de la variable, de la poblacin se obtiene la muestra de estudio la cantidad de elementos que forman prte
de un conjunto no son los mismos siempre hay diferencias a esto se llama frecuencia.
No todos los valores de la variable tienen la misma frecuencia de aparicin.
Advertencia: si al introducir las variables se produce una misma frecuencia de presentacin, quiere decir que la
variable introducida no es la correcta (es una constante) porque no da ninguna caracterstica de la poblacin que
se quiere estudiar o sea que si la variable no produce subgrupos no sirve.

Siguiendo este proceso, de recoleccin de datos, se procede a organizar los datos a tabularlos (tabulacin de la
informacin)
Tabular significa: hacer tablas de frecuencias, en estas tablas lo que se hace es organizar los datos en funcin de
los valores que toma la variable y la frecuencia con que aparece cada uno de estos valores y por ultimo producir
los graficos correspondientes y obtener una conclusin para efectuar una accin

Distribucin de frecuencias y Representacin Grfica


Grficos Estadsticos: Sirven para entender de manera ms rpida y sencilla los resultados de un estudio
estadstico.
El mtodo grafico consiste en representar los datos obtenidos de un estudio estadstico, mediante figuras
simples que faciliten las comparaciones y permitan de inmediato describir hechos y relaciones que podran pasar
desapercibidos en las tablas.

A pesar de la gran ayuda que prestan las tablas y cuadros con informacin organizada, no todos los pblicos
alcanzan a comprenderla o no disponen del tiempo suficiente para analizarla. Es por ello que la mayora de los
investigadores acostumbran a reforzar la descripcin a travs de dibujos, generalmente con formas geomtricas,
que ayudan a visualizar el comportamiento de las variables tratadas.
Una grfica o diagrama estadstico es un dibujo complementario a una tabla o cuadro, que permite observar las
tendencias de un fenmeno en estudio y facilita el anlisis estadstico de las variables all relacionadas.
Se debe elegir el grafico que mas se adecue al tipo de estudio realizado y para ello se observan las variables de
estudio.

Componentes de una grfica


Una grfica, al igual que un cuadro o una tabla, debe constar de:

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Ttulo adecuado: El cual debe ser claro y conciso, que responda a las preguntas: Qu relaciona, cundo y dnde se hicieron
las observaciones o sea que describa el contenido del grafico.
El cuerpo: o grfico en s, cuya eleccin debe considerar el o los tipos variables a relacionar, el pblico a quien va dirigido y
el diseo artstico del grfico.
Notas de pie de grfico: Donde se presentan aclaraciones respecto al grfico, las escalas de los ejes, o se otorgan los crditos
a las fuentes respectivas.

Principales tipos de grficos


Grficos para variables cualitativas
Grficos de barras: Consiste en representar mediante barras la magnitud de las frecuencias referidas a una tabla. El
grfico de barras, como su nombre lo indica, est constituido por barras rectangulares de igual ancho, conservando la misma
distancia de separacin entre s. El eje horizontal de la grfica, representa frecuencias absolutas o relativas y el otro eje los
valores de la variable.
Se utiliza bsicamente para mostrar y comparar frecuencias de variables cualitativas o comportamientos en el tiempo,
cuando el nmero de tems es reducido.
Son tiles para comparar datos y se utilizan para variables cualitativas; si la variable es cualitativa nominal la posicin o el
orden de las barras no importa, pero si es cualitativa ordinal el orden o la posicin si importan.
Tipos de grficos de barras:
a) Grficos de barras simples: representan una sola serie de datos
Ejemplo, un estudio realizado con una variable cualitativa nominal.
Poblacin: Todos los alumno que asisten al I.F.D.R N 6.018 en H. Irigoyen.
X/Xi Es un alumno del I.F.D.R. N 6.018
Variable: Municipio donde viven los alumnos del I.F.D.R N 6.018.

Xi Municipio
Oran
Pichanal
Irigoyen
Ingenio
Embarcacin
Colonia santa
Rosa

fi
80
41
35
6
4
8
N=174

hi

fi
a
l
u
m
n
o
s

Cantidad de alumnos del I.F.D.R N 6.018 de otras Localidades


90
80
70
60
50
40
30
20
10
0

Ejemplo de variable cualitativa ordinal Xi nivel de escolaridad.


Xi
fi
hi Fi Hi

Municipios de Residencia

Analfabeto
Primaria
Secundaria
Terciario

40
120
85
35

Universitaria 27
Postgrado
10
b) Grafico de barras mltiples: representan dos o mas series de datos. Son adecuados para efectuar comparaciones.

Grfico de Sectores Circulares: Usualmente llamado grfico de pastel, debido a su forma caracterstica de
una circunferencia dividida en cascos, por medio de radios que dan la sensacin de un pastel tajado en porciones.

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el nmero de tems no es
superior a 5 y se quiere resaltar uno de ellos. Para su construccin se procede de la siguiente forma: La
circunferencia tiene en su interior 360 grados, los cuales hacemos corresponder al total de la informacin, es
decir al 100%; luego, para determinar el nmero de grados correspondiente a cada componente se multiplica el
porcentaje respectivo por 360 y se divide por 100, los cuales se miden con la ayuda de un transportador para
formar los casquetes de los diferentes tems.

Grficos para variables cuantitativas.


Grafico de bastn: se utiliza cuando la variable es cuantitativa discreta. Por ejemplo: nota, nmero de hijos,
cantidad de materias aprobadas.
Variable cuantitativa discreta: Xi: Aplazos de los alumnos de segundo ao de la carrera de matemtica.
Xi
fi
hi Fi Hi fp
0
2
1
4
2
7
3
10
4
5
5
2
6
1
7
0
otros 0

Histograma:
Es una representacin grfica de una tabla de frecuencias de una variable cuantitativa continua. Los intervalos de clase, que
pueden ser o no ser iguales, y estn marcados sobre el eje horizontal. Las frecuencias absolutas o relativas estn marcadas
sobre el eje vertical.
El histograma se construye por medio de rectngulos unidos cuyos anchos son las de los intervalos de clase que ellos
representan, y cuyas alturas representan a las frecuencias absolutas o a las frecuencias relativas y sus frecuencias
acumuladas respectivas.

Los rectngulos tienen sus bases sobre el


eje horizontal con centros en las marcas de
clase y medida igual al tamao de los
intervalos
de
clase
y
superficies
proporcionales a las frecuencias.

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Polgono de frecuencia. Es una forma geomtrica obtenida de segmentos de recta que unen los puntos
medios de intervalos de clase adyacentes en un histograma. Cerramos el polgono al prolongar los segmentos de
recta de los extremos de tal forma que encuentren al eje horizontal en el punto medio de la clase hipottica
siguiente.

Se trata de un grafico de lneas trazado sobre las marcas de clase y se obtiene uniendo los puntos medios de los
techos de los rectngulos del histograma. Se utiliza nicamente en variables cuantitativas continuas. La forma de
los polgonos de frecuencia no es infinita, la idea es encontrar una funcin de manera que relacione cada valor de
la variable con su respectiva frecuencia.
Para trazar un polgono de frecuencias usamos segmentos de recta que conecten los puntos medios de

La frecuencia acumulada relativa o frecuencia acumulada en porcentajes, es la frecuencia acumulada dividida por
la frecuencia total.
Observacin:
Distribuciones de frecuencias relativas: Las representaciones de distribuciones de frecuencias relativas pueden
obtenerse del histograma o del polgono de frecuencias, cambiando la escala vertical de frecuencia a frecuencia
relativa, conservndose el mismo diagrama, se conocen tambin como histogramas porcentuales.
Distribuciones de frecuencias acumuladas u ojiva: El grafico que representa esta frecuencia se llama polgono de
frecuencias acumuladas u ojiva.
Distribuciones de frecuencias relativas acumuladas: Para representarlas se realiza el polgono de frecuencias con
las frecuencias relativas acumuladas en el eje vertical; tambin se las conoce como ojiva porcentual.
Ojiva: es la representacin grafica de la frecuencia absoluta acumulada.
En la ojiva se representan los puntos extremos superiores de los intervalos.

10

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Curvas de frecuencias. Curva suavizada:

Es el proceso de alisar las esquinas del polgono de frecuencias de tal forma que se obtenga una curva suave,
sugiriendo la forma bsica de la distribucin de nmeros.
El conjunto de datos puede considerarse normalmente como perteneciente a una muestra extrada de una
poblacin grande. Si se realizan muchas observaciones sobre la poblacin, es posible tericamente (para datos
cuantitativos continuos) elegir los intervalos de clase muy pequeos y todava tener un nmero adecuado de
observaciones dentro de cada clase. As se tiene que, el polgono de frecuencias relativas de una poblacin grande
puede estar formada por muchos pequeos segmentos rectos que aproximan el conjunto a una curva, las curvas
de este tipo pueden llamarse curvas de frecuencias o curvas de frecuencias relativas respectivamente.
en definitiva se trata de aproximar el polgono de frecuencias a travs de una curva

Es razonable esperar que tales curvas tericas provengan de la suavizacin de los polgonos de frecuencias o de
los polgonos de frecuencia relativa a la muestra, la aproximacin es tanto ms exacta conforme aumenta el
tamao de la muestra. Por esta razn una curva de frecuencia se conoce como un polgono de frecuencia
suavizado.
De una forma analgica las ojivas suavizadas provienen de la suavizacin de los polgonos de frecuencias
acumuladas u ojivas normalmente es mas sencillo suavizar una ojiva que un polgono de frecuencias
Tipos de curvas de frecuencias: puede ser simtrica, sesgada a la derecha, sesgada la izquierda, en forma de j, en
forma de jota invertida, bimodal, multimodal.

Preguntas para los finales:


Cul es la diferencia entre un polgono de frecuencias y una ojiva?
Distribucin de frecuencias. Uso de tablas y graficas. Tablas de frecuencias: Frecuencias absolutas,
relativas y acumuladas. Tablas con datos agrupados. Grficos estadsticos: Histogramas. Polgonos
de frecuencia. Diagramas de barras. Grficos circulares.

11

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Medidas de Centralizacin

Profesor: Blanco Vctor

Anlisis y resumen de la informacin.


Para comparar poblaciones se debe de buscar las caractersticas comunes a ellas; y esto implica, encontrar una variable que
genere caractersticas diferentes a una misma situacin. Para poder comparar las poblaciones tendremos que reducir la
informacin de la poblacin a una sola cantidad; a esto se llama reduccin o resumen de datos.
La fase previa de cualquier estudio estadstico se basa en la recogida y ordenacin de datos; esto se realiza con la ayuda de
los resmenes grfico visto en la unidad anterior y los numricos que veremos a continuacin.
En la unidad anterior se describi en forma grafica el resumen de los datos pero el anlisis estadstico necesita con frecuencia
sintetizar las caractersticas bsicas de un conjunto total de nmeros en un resumen numrico de datos que consista solo en
uno o dos nmeros.
Los resmenes numricos de datos presentan dos caractersticas bsicas:
Una medicin representativa; un valor que, en algn sentido, representa a todas las medidas del conjunto, llamada
medida de centralizacin.
Un indicador de cuanto varan las mediciones o estn dispersas con respecto a otra o con respecto de algn valor
central, llamada medida de dispersin.
Las medidas de centralizacin sirven para hacer comparaciones entre poblaciones y adems implica que todos los datos
deben reducirse a una sola cantidad para poder compararlas.
Para calcular una medida de centralizacin hago uso de todos los valores de la muestra o de la poblacin
Medidas de centralizacin o de posicin:
La medida de centralizacion de un conjunto de datos es la disposicion de estos para agruparse ya sea alrededor del centro o
de ciertos valores numericos, es decir, Son los valores alrededor de los cuales estan concentrados los datos.
Se pretende que la medida de posicion sea representativa del conjunto, ya que como se dijo, indica la ubicacin del centro
de la distribucion o la medicion mas representativa en un conjunto. Existen principalmente tres medidas de tendencia
central: la media, la mediana y la moda.
a) Media aritmtica ( )
La media aritmtica o simplemente media es el promedio aritmtico de un conjunto de datos, que denotaremos por , y se
obtiene al dividir la suma de todos los valores observados de la variable entre el nmero total de observaciones.
Calculo de la media: si calculamos la media de una poblacin se simboliza con la letra y si se calcula de una muestra se
simboliza con .

Para datos sin agrupar


Para la muestra
Para la poblacin


=1

+ ++++


=1


:
:

Para datos agrupados


Serie de frecuencias simples

=
=

Serie de datos por intervalo


=1


=1

para variables cuantitativa discretas.


para variables cuantitativas continas.

Interpretacin: La interpretacin de la media viene dado por el promedio de los datos observados y acta como un
centro de masa o equilibrio significa que el peso de los datos de la izquierda es igual al peso de los datos de la derecha. Sin
embargo no significa que exista una misma cantidad de datos a la izquierda y ala derecha.

Ventajas e inconvenientes:

La media aritmtica viene expresada en las mismas unidades que la variable y es nica.
Solo se aplica a variables cuantitativas.
En su clculo intervienen todos los valores de la distribucin.
Su principal inconveniente es que se ve afectada por los valores extremadamente grandes o pequeos de la
distribucin.
La media hace uso de todos lo datos recogidos ya sea de la poblacin o de la muestra, por eso se dice que es la mas
representativa.

Ejemplo para datos sin agrupar


Sea xi / es el numero de notas de un examen parcial de probabilidad y estadstica 1.

=
=

2, 1, 3, 4, 5, 10, 9

+ + + ++ + + + + +
=
=
=
= ,

Variable: puntuacin en un examen parcial de probabilidad y estadistica1.


Tipo: Cuantitativa Discreta. Interpretacin: el promedio de las notas del examen parcial fue de 5.

Ejemplo para datos agrupados:


Para serie de datos simples: Si tenemos la siguiente distribucin, se pide hallar la media aritmtica de la cantidad de
materias aprobadas por los alumnos de segundo ao de matemtica.
Variable: cantidad de materias aprobadas.

12

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Tipo de variable: Cuantitativa discreta


Xi /cantidad de materias
aprobadas

fi

Xi fi

1
2
3
4
5
6
8
9
10

2
2
2
1
4
2
5
3
2

2
4
6
4
20
12
40
27
20
135

N = 23

=
=1


1 2 + 2 2 + 3 2 + 4 1 + 5 4 + 6 2 + 8 5 + 9 3 + 10 2 135
=
=
= = 5,87 6 = 6

23
23

Para serie de datos por intervalos: Si los datos estn agrupados en intervalos, la expresin de la media aritmtica,
es la misma, pero utilizando la marca de clase ( ).
Variable Xi /Xi es el peso de las alumnas de la carrera de turismo.
Tipo: cuantitativa continua.
Xi
fi
Xi m
Xi m f i
[45,50)
2
47,5
95
[50,55)
2
52,5
105
[55,60)
2
57,5
115
[60,65)
1
62,5
62,5
[65,70)
4
67,5
270
[70,75)
2
72,5
145
[75,80)
5
77,5
387,5
[80,85)
3
82,5
247,5
[85,90)
2
87,5
175
n = 23

=
=


. ,
=
= ,

El peso promedio de las alumnas de turismo es de 70 kg.


La marca de clase es el punto medio entre los lmites de


cada clase o intervalo. Xi m =
=

b) Mediana (Me)
Dada una distribucin de frecuencias con los valores ordenados de menor a mayor, llamamos mediana y la representamos
por , al valor de la variable, que deja a su izquierda el mismo nmero de frecuencias que a su derecha, es decir es el valor
de la variable que se encuentra en la mitad de los datos previamente ordenados.

Interpretacin: En una serie de datos ordenados el valor de la mediana es aquel nmero, que puede o no ser un valor
de la variable, que divide al conjunto de datos en dos partes iguales de manera que:
El 50 % de los datos son menores o iguales al valor de la mediana y el otro 50 % son mayores o iguales al valor de la mediana.
50 % 50 %
La mediana deja igual nmero de datos por debajo y por arriba de ella.
Calculo de la mediana: Variara segn el tipo de dato. Pero para calcular la mediana los datos deben estar ordenados.
Para datos sin agrupar, Variables discretas no agrupadas
Si es impar, entonces =

, o sea si la cantidad de datos es impar, la mediana ser el valor que ocupa la

posicin del medio de los datos ordenados.


Si es par, entonces =

+
+

, o sea si la cantidad de datos es par, la mediana ser el promedio de los dos

valores centrales de los datos ordenados.

Ejemplo: Sean los valores de : 1, 2, 4, 8, 10; = 5

+1
2

La posicin donde se encuentra la mediana ser

5+1
2

= 3 = 3 = 4

Ejemplo: Xi: 4, 8, 10, 11, 15, 20 = 6 o sea existen dos valores que ocupan la posicin del medio. Hay dos medianas
por lo que hay que sacar el promedio de ellas.
+

+1

3 +4
2

13

10+11
2

= 3 = 10,5

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Para Datos Agrupados

Distribucin de Frecuencias Simples: Es el valor de la variable cuya frecuencia acumulada contenga a .

Se observa cual es la primera que supera o iguala a

, distinguindose dos casos:

Ejemplo: Sea la distribucin cantidad de das que una mujer va al gimnasio en un mes

1
2
5
7
10
13

3
3
que contiene a
2
4
7
35
=
= 17,5
9
16
2
2
10
26

Como se cumple que < < 16 <17,7< 26 = por lo tanto Me = 7


7
33

2
35
= 35
Interpretacin: El 50 % de las mujeres van al gimnasio de 1 a 7 das por mes y el otro 50 % de mujeres va de 7 a 13 das al
mes.
O tambin la mitad de las mujeres va al gimnasio 7 das o menos por mes y la otra mitad va de 7 a 13 das por mes.
El otro caso lo podemos ver en la siguiente distribucin

que contiene a
2
1
3
3
32
=
=
16
2
4
7
2
2
5
9
16
1 + +1
5+7

7
10
26
En este caso = 16 =
=
=6

2
2
10
6
32
= 32

Distribucin de Frecuencias agrupadas por intervalos

En este caso lo primero que hay que hacer es detectar en que intervalo est el valor mediano, o sea buscamos el nmero

(valor de la variable ) qu est en la posicin del medio . Dicho intervalo se denomina .


2

El smbolo utilizado para el intervalo mediano es = ; );


Es decir tenemos que mirar la columna de las frecuencias acumuladas y buscar el primer intervalo cuya frecuencia

acumulada sea mayor o igual a , ( o sea el que contenga a ), este ser el intervalo mediano; antes de calcular la
2

mediana debemos distinguir dos casos:

a) Si = , entonces la mediana es correspondiente. = donde es el lmite inferior del intervalo mediano.

b) Si existe alguna frecuencia acumulada que contenga a , entonces <

= ; ); despus se aplica la siguiente formula.

= +

F i1
2

< y el intervalo de la mediana ser

Li: Es el lmite inferior del intervalo mediano


n: Es la cantidad de datos observados.
Fi-1: es la frecuencia absoluta acumulada del intervalo anterior el intervalo mediano
fi : es la frecuencia absoluta del intervalo mediano.
C : es la amplitud del intervalo

Ejemplo Variable: Edad de los empleados de una empresa


,
20,25

100

100

25,30

150

250

30,35

200

450

35,40

180

630

40,45

41

671

671
2

= 335,5;

Estar

en

el

intervalo

30,35 , por lo tanto tenemos:

= + 2

Fi1

= 30 +

33,5250
200

5= 32,138

n = 671
Interpretacin: Del total de 671 empleados de una empresa la mitad de ellos tiene entre 20 a 30 aos y la otra mitad 30 a 45
aos.

14

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Ventajas e inconvenientes:
- Es la medida ms representativa en el caso de variables que solo admitan la escala ordinal.
- Es fcil de calcular.
- En la mediana solo influyen los valores centrales y es insensible a los valores extremos.
- En su determinacin no intervienen todos los valores de la variable.
La mediana sirve para comparar y es ms representativa que la media cuando esta influenciada por valores muy extremos.

C) Moda (Mo)
Es el valor de la variable que mas se repite o sea el que tiene mayor frecuencia absoluta o sea el mas comn.
La moda es el valor de la variable que ms veces se repite, y en consecuencia, en una distribucin de frecuencias, es el valor
de la variable que viene afectada por la mxima frecuencia de la distribucin. En distribuciones no agrupadas en intervalos se
observa la columna de las frecuencias absolutas, y el valor de la distribuci6n al que corresponde la mayor frecuencia ser la
moda. A veces aparecen distribuciones de variables con ms de una moda (bimodales, trimodales, etc), e incluso una
distribucin de frecuencias que presente una moda absoluta y una relativa.

Para datos sin agrupar: Es el valor de la variable que mas se repite.


Distribucin de Frecuencias simples: Es el Xi que tiene mayor frecuencia absoluta ( fi)

Xi
1
2
3
4
5

Xi: Cantidad de hermanos


fi
hi
Fi
5
0,16
5
4
0,12
9
10
0,31
19
6
0,19
25
7
0,22
32

Interpretacin: La mayora tiene 3 hermanos


La moda es tener 3 hermanos

Hi
0,16
0,28
0,59
0,78
1

Distribucin de Frecuencias agrupadas por intervalos de clase:


En el caso de estar la variable agrupada en intervalos de clase, se define el intervalo modal, y se denota por [Li , Ls), como
aquel que posee mayor frecuencia absoluta (fi) y una vez identificado este, se emplea la siguiente formula:
Se calcula con la siguiente formula = +

1
1+ 2

Donde:

: Limite inferior modal


1 : es la diferencia entre 1
2 : es la diferencia entre +1
C: amplitud del intervalo

Variable: temperaturas mximas registradas durante 20 das en la ciudad de oran.


Xi
[12; 20)
[20; 28)
[28, 36)
[36; 44)

fi
4
7
15
5

Fi
4
11
15
20

15

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Medidas de dispersin
En el anlisis estadstico no basta el clculo e interpretacin de las medidas de tendencia central o de posicin, ya que, por
ejemplo, cuando pretendemos representar toda una informacin con la media aritmtica, no estamos siendo absolutamente
fieles a la realidad, pues como ya vimos suelen existir datos extremos inferiores y superiores a la media aritmtica, los cuales,
a decir verdad, no estn siendo bien representados por este parmetro.
Si tenemos dos informaciones con igual media aritmtica, no significa este hecho, que las distribuciones sean exactamente
iguales, por lo tanto, debemos analizar el grado de homogeneidad entre sus datos.
Por ejemplo, los valores 1, 200, 399 tiene igual media aritmtica, y mediana que los valores 199, 200, 201; sin embargo, para
la primera informacin la media aritmtica, se encuentra muy alejada de los valores extremos 1 y 399, cosa que no ocurre
con la segunda informacin que posee igual media aritmtica y mediana, vemos entonces que la primera informacin es mas
heterognea o dispersa que la segunda, por lo tanto para datos muy dispersos la media no me es muy til, de ah que
necesitamos de un nuevo tipo de medida que me muestren cuando la media es representativa y cuando no, o sea cuando los
datos estn muy dispersos de la media.
En definitiva, las medidas de dispersin indican la variacin que tienen los datos con respecto a la media. Las medidas de
dispersin tratan de medir el grado de dispersin que tiene una variable estadstica en torno a una medida de posicin o
tendencia central, indicndonos lo representativa que es la medida de posicin. A mayor dispersin menor representatividad
de la medida de posicin y viceversa.
Para medir el grado de dispersin de una variable, se utilizan principalmente los siguientes indicadores: Rango o recorrido,
Desviacin media, Varianza y desviacin tpica o estndar, Coeficiente de variabilidad.
1) RANGO O RECORRIDO
Es la medida de dispersin ms sencilla ya que solo considera los dos valores extremos de una coleccin de datos.
Se obtiene haciendo la diferencia entre el mayor y menor valor de la variable.
= = medicin mas grande medicin mas pequea
Ej: Sea X, las indemnizaciones recibidas por cuatro trabajadores de dos empresas A y B
A 100 120 350 370
B 225 230 240 245
R (A) = 370 100= 270
R (B) = 245 225= 20 por lo tanto la Distribucin menos dispersa es la de la empresa B.
Esta medida es poco utilizada debido a que nicamente considera el valor de los datos extremos sin considerar el
comportamiento de los dems datos.
Otros recorridos:
Quizs la imaginacin no sea sino una
Rango intercuartlico: = 3 1
inteligencia que se divierte
Intervalo interdeclico: = 9 1
Intervalo intercentlico: = 99 1
2) Desviacin media:
La desviacin media, mide la distancia absoluta promedio entre cada uno de los datos, y el parmetro que caracteriza la
informacin. Usualmente se considera la desviacin media con respecto a la media aritmtica:
Nos indica las desviaciones con respecto a la media con respecto a la media aritmtica en valor absoluto, o sea es el
promedio de las distancias de los datos respecto de la media.

Para datos sin agrupar

=
=1

: Desviacin media.
: Son los diferentes valores de la
variable X.
: Media Aritmtica de la informacin.
: Tamao de la muestra

Ejemplo: obtener la desviacin media de los siguientes datos 7, 16, 9, 22, 17, 23, 15 , 11, 25, 18, 13. (La media es 16)
9+0+7+6+1+7+1+5+9+2+3
=
= 4,5
11
Esto significa que los datos se encuentran alejados en promedio 4,5 unidades de la media aritmtica; es decir que la mayora
de los datos estn comprendidos entre 11,5 y 20,5. Cuantos datos se encuentra en este intervalo, en donde su punto medio
es la media igual 16?

= 16

11,5

16

20,5

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Para datos agrupados

Distribucin de Frecuencias simples


Para obtener la desviacin media cuando se tienen datos agrupados

=
=1

: Desviacin media.
: Son los diferentes valores de la variable X.
: Media Aritmtica de la informacin.
: Cantidad de veces que se repite la
observacin
: Tamao de la muestra.
: Nmero de agrupamientos.

Distribucin de Frecuencias agrupadas por intervalos


Para obtener la desviacin media cuando se tienen datos agrupados en intervalos de clase

=
=

: Desviacin media.
: Es la marca de clase, del intervalo i.
: Media Aritmtica de la informacin.
: Frecuencia absoluta correspondiente al intervalo i.
: Tamao de la muestra.
: Nmero de intervalos.

Ejemplo 2: En la fbrica del Ingenio del Tabacal el salario de 142 empleados se muestra en la siguiente tabla:
Salarios en Nmero de




miles
de empleados

pesos ($)
1,4
36
50,4
-0,1838
0,1838
6,6168
1,5
42
63,0
-0,0838
0,0838
3,5196
1,6
23
36,8
0,0162
0,0162
0,3726
1,7
13
22,1
0,1162
0,1162
1,5106
1,8
11
19,8
0,2162
0,2162
2,3782
1,9
12
22,8
0,3162
0,3162
3,7944
2,0
5
10,0
0,4162
0,4162
2,081
= 142 224,9
20,2732
La media aritmtica del salario de 142 empleados del ingenio tabacal ser:

=
=

224,9
=
= 1,5838

142

Es decir, el salario promedio de los 142 empleados es de$ 1.583,8


La desviacin media es de:

=
=1

No se preocupe por sus dificultades en


matemtica. Yo puedo asegurarle que las
mas son todava mayores. John Locke

20,2732
=
= 0,14277

142

Significa que los sueldos de los 142 empleados estn desviados con respecto al sueldo promedio en $ 142,77; y que la
mayora de los sueldos varan o estn, entre $1.441,03 y $1.726,57.
Cul ser el error que se comete al reemplazar el ingreso salarial de cada uno de los 142 obreros por $1.538,8?
Ejemplo 3 Determinar la desviacin media para el siguiente conjunto de datos
Variable Xi /Xi es el peso de las alumnas dela carrera de turismo.
Tipo: cuantitativa continua.
Xi
fi
Xi m
Xi m f i



[45,50)
2
47,5
95
-22,1739
22,1739
44,3478
[50,55)
2
52,5
105
-17,1739
17,1739
34,3478
[55,60)
2
57,5
115
-12,1739
12,1739
24.3478
[60,65)
1
62,5
62,5
-7,1739
7,1739
7,1739
[65,70)
4
67,5
270
-2.1739
2,1739
8,6956
[70,75)
2
72,5
145
2,8261
2,8261
5,6522
[75,80)
5
77,5
387,5
7,8261
7,8261
39,1305
[80,85)
3
82,5
247,5
12,8261
12,8261
38,4783
[85,90)
2
87,5
175
17,8261
17,8261
35,6522
n = 23
1.602,5
237,8261

17

Carrera:
Asignatura: Probabilidad y estadstica

=
=

.,

Curso:

Profesor: Blanco Vctor

= , El peso promedio de las alumnas de turismo es de 70 kg.

237,8261
=
= 10,3401

23

Significa que los pesos de las alumnas de turismo estn desviados con respecto al promedio de 69,6739 Kg en 10,3401 Kg.
Caractersticas de la desviacin media:
Su clculo est basado en todos los valores e indica la dispersin con relacin a un promedio.
Al ignorarse los signos de las desviaciones, la medida no resulta adecuada para un manejo matemtico.
3) Varianza:
El problema de los signos en la desviacin media, es eludido tomando los valores absolutos de las diferencias de los datos
con respecto a la media aritmtica. Ahora bien, la varianza obvia los signos elevando las diferencias al cuadrado, lo cual
resulta ser ms elegante, aparte de que es supremamente til en el ajuste de modelos estadsticos que generalmente
conllevan formas cuadrticas.
La varianza es uno de los parmetros ms importantes en estadstica, se puede decir que, teniendo conocimiento de la
varianza de una poblacin, se ha avanzado mucho en el conocimiento de la poblacin misma.
En definitiva, la varianza es el promedio de los cuadrados de las desviaciones de los valores de la variable con respecto a su
media aritmtica.
Se simboliza con 2 cuando trabajo con la muestra
Se simboliza con 2 cuando trabajo con la poblacin
Para datos sin agrupar

=
=
2 =
2 =

La varianza mide la mayor o menor dispersin de los valores de la variable respecto a la media aritmtica. Cuanto mayor sea
la varianza mayor dispersin existir y por tanto menor representatividad tendr la media aritmtica.
La varianza se expresa en las mismas unidades que la variable analizada, pero elevadas al cuadrado.
Para datos agrupados
Distribucin de Frecuencias simples

=
=1

2
1

=
=1

Distribucin de Frecuencias agrupadas por intervalos

=
=1

2
1

=
=1

Caractersticas de la varianza
La varianza es matemticamente lgica ya que considera los signos de los desvos, de all su ventaja con respecto a
la desviacin media.
La varianza no esta expresada en unidades originales, sino en una unidad al cuadrado. Esto es debido a la operacin
de elevar al cuadrado las desviaciones.
Cuando las varianzas son grandes se hace difcil su interpretacin.
4) Desviacin Tpica o Estndar
Debido a que la varianza no est expresada en unidades originales y para restaurarlas se obtiene la raz cuadrada de esta
medida.
La desviacin estndar es la raz cuadrada de la varianza; o sea es la raz cuadrada del promedio de los cuadrados de las
desviaciones de los valores respecto de su media aritmtica del promedio.
Se simboliza con cuando trabajo con la muestra = 2 =
Se simboliza con cuando trabajo con la poblacin = 2

18

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Para datos sin agrupar


=

2 =

2 =

Ejemplo obtener la varianza y la desviacin estndar para los siguientes datos: 7, 16, 9, 22, 17, 23, 15, 11, 25, 18, 13. (La
media es 16)

92 + 0 + 72 + 62 + 12 + 72 + 12 + 52 + 92 + 22 + 32
=
2 =
=

10
81 + 0 + 49 + 36 + 1 + 49 + 1 + 25 + 81 + 4 + 9
= 33,6
10
Desviacin estndar S= 33,6 = 5,7966
El promedio de cada dato se aleja de su media aritmtica en 5,7966 unidades.
2 =

Para datos agrupados

Distribucin de Frecuencias simples

=
=1

2
1

2 =
=1

Distribucin de Frecuencias agrupadas por intervalos

=
=1

2
1

=
=1

Interpretacin En promedio cada dato se aleja de su media en unidades


Caractersticas de desviacin tpica
Al igual que la varianza, la desviacin estndar se calcula en base a todos los valores. Mide la dispersin alrededor
de la media y no con respecto a ciertos valores como el rango.
La desviacin tpica es matemticamente lgica, ya que como la varianza, tiene en cuenta los signos positivos y
negativos de los desvos individuales.
Esta expresada en unidades originales lo que facilita su anlisis e interpretacin.
Cuanto mayor es la desviacin tpica o estndar, mas dispersos estn los datos respecto de la media

19

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Media geomtrica: para datos sin agrupar, la media geomtrica de una serie de nmeros es la ensima raz del
producto de esos nmeros
Sea una distribucin de frecuencias (xi, ni). La media geomtrica, que denotaremos por G. se define como la raz
n-sima del producto de los n valores de la distribucin.
G=

COMPARACIN ENTRE LA MEDIA MEDIANA Y LA MODA


La comparacin entre la media, mediana y moda nos ofrece una gran ventaja a la hora de decidir cual de ellas
usar como medida de centralizacin de manera que los datos queden correctamente representados .
Sabemos que la media aritmtica no siempre es la mas representativa, pues no siempre conviene usarla como
promedio porque es muy sensible a los valores extremos que causa que la distribucin sea

20

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Trabajos prcticos

Medidas de Centralizacion Trabajo practico N 3


1.- Clasifica en discretas o continuas las siguientes variables:
a) Nmero de habitantes por kilmetro cuadrado.
b) Nmero de bacterias de cierto tipo, por mililitro
c) intensidad que recorre un circuito electrnico cerrado.
d) Nmero de frutos de un rbol.
e) Velocidad de un vehculo al pasar por un determinado punto
f) Puntuaciones obtenidas en un test por un grupo de personas
g) Superficie dedicada a cierto cultivo, por hectreas, en un municipio
h) Peso de un nio al cumplir 3 aos
i) Nmero de alumnos de tu Instituto.
2.- De un examen realizado a un grupo de alumnos, cuyas notas se han evaluado del 1 al 8, se ha obtenido el siguiente cuadro
estadstico:
Se pide:


(a)
Acabar de rellenar la tabla estadstica.
1 4 0,08
(b)
N de alumnos que se han examinado.
2 4
(c)
N
de alumnos que han obtenido una nota superior a 3
3
0,16 16
(d)
%
de
alumnos que han sacado una nota igual a 6
4 7 0,14
(e) % de alumnos que han obtenido una nota superior a 4
5 5
28
(f) N de alumnos que han obtenido una nota superior a 2 e inferior a 5.
6
38
7 7 0,14 45
8
3.- Una fbrica empaqueta en lotes de 100 unidades, condensadores que produce. Se establece un plan de inspeccin por
muestreo consistente en examinar, de cada lote, 20 condensadores elegidos al azar y rechazar el lote si de los 20 aparecen
ms de 4 defectuosos; almacenar el lote como revisable si el nmero de defectuosos es menor que 5 pero mayor que 1, y
aceptarlo en otro caso. Se inspeccionan 52 lotes y resulta el siguiente nmero de condensadores defectuosos de cada
muestra:
1

21

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

a) Construye la tabla de frecuencias absolutas y relativas del resultado de la inspeccin


b) Dibuja el diagrama de barras para los resultados de la inspeccin
c) Dibuja el diagrama acumulativo de frecuencias.
Agrupa los resultados por lotes: Rechazados, revisables y aceptados y:
d) Construye la tabla de frecuencias para los lotes
e) Determina la proporcin de lotes rechazados
f) Representa la distribucin de frecuencias mediante un histograma
g) Dibuja el diagrama acumulativo de frecuencias
h) Comenta las diferencias entre los resultados de los apartados c) y g)
4.- El precio del pan sufri los siguientes incrementos: del 7% de 1990 a 1991, del 6% de 1991 a 1992, del 4% de 1992 a 1993,
del 3% de 1993 a 1994 y de 1994 a 1995. Cul es el incremento medio anual de 1990 a 1995?
5.-Se ha realizado una encuesta en 30 hogares en la que se les pregunta el n de individuos que conviven en el domicilio
habitualmente. Las respuestas obtenidas han sido las siguientes:
4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
a) Calcule la distribucin de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes
acumuladas.
b) Qu proporcin de hogares est compuesto por tres o menos personas? Qu proporcin de individuos vive en hogares
con tres o menos miembros?
c) Dibuje el diagrama de frecuencias absolutas y el diagrama de frecuencias acumuladas.
d) Agrupe por intervalos de amplitud 2 los valores de la variable, calcule su distribucin de frecuencias y represente con los
correspondientes grficos las frecuencias absolutas y acumuladas.
6.-Por un error, un profesor borr la calificacin obtenida por uno de diez alumnos. Si los otros nueve estudiantes obtuvieron
43, 66, 74, 90, 40, 52, 70, 78 y 92 y la media de las diez calificaciones es 67, Qu calificacin borr el profesor?
7.-Los siguientes datos muestran las ventas (en miles de pesos), de 20 vendedores de una CA. de computadores.
99,8 42,9 44,2 31,7
40,2 26,9 32,3 36,8
29,3 28,9 55,2 45,2
Calcule medidas de tendencia central. Interprete.

88,2
37,8
25,4

35,6
5,6
50,6

25,1
39,7

8.- Con el Objetivo de invertir en cierto proyecto, se ha tomado una muestra aleatoria de 100 semanas, respecto de la
rentabilidad de las acciones de una empresa A (en %). Para ello se han recopilado los datos, los que se han resumido en la
siguiente tabla:
Frecuencias
Rentabilidad Marca de clase Absoluta Relativa Absoluta acumulada Relativa acumulada
0,505;
5
; 1,505
25
;
1,755
50
;
95
;
a) Reconozca y clasifique la variable de estudio.
b) Realice un grfico adecuados a los datos.
c) Determine las medidas de tendencia central.

22

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

9.-Una empresa con el fin de contratar un grupo de empleados operarios aplic una prueba a todos los postulantes, a cada
uno se les asign el mismo trabajo. Los datos obtenidos son los siguientes:
tiempo (hrs.) postulantes
1,45 - 2,15
3
2,15 - 2,85 9
2,85 - 3,55 15
3,55 - 4,25 22
4,25 - 4,95 10
9,95 - 5,65 6
5,65 - 6,35 3
a. Cul es el tiempo de ejecucin ms comn entre los postulantes?.
b. La empresa contratar a todos los postulantes que tengan un tiempo de ejecucin superior o igual a 4.5 hrs. Cul es el
porcentaje de postulantes contratados?.

c. La empresa asignar a otras labores a los empleados que tengan un tiempo de ejecucin mayor o igual a 3.3 hrs. Cul es
el porcentaje de empleados (contratados) que se encuentran en esta situacin?.

23

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

Completar y analizar el tipo de combustible que utilizan los automviles de una provincia. Se considera una muestra de 100
autos.
Tipos de combustibles
f
h F H h
i

GASOIL

450

NAFTA

350

GAS

200

TOTAL

Examen 2014
Ejercicio 1: En los siguientes enunciados identifique la poblacin, tamao de la muestra, variable a medir, su clasificacin y
unidad de observacin.
a) Supongamos que el dueo de la despensa santa rosa, ubicada en la ciudad de oran, le interesa averiguar si sus
clientes consideran que son bien atendidos; para esto est planeando entrevistar a 100 de ellos y consultarles sobre la
atencin recibida clasificndola en muy buena, buena, regular y mala. (5p).
b) De una produccin de 1.000 tuercas de la fabrica Don Tomas (obtenidas en el mes de julio), se extrajeron 40 y se
midi su dimetro (5p)
c) Un investigador educativo quiere evaluar la efectividad de un nuevo mtodo para ensear a leer a estudiantes de la
escuela para nios sordos santa Cecilia. Para ello toma un grupo de 30 alumnos elegidos al azar. El aprovechamiento
al final de un periodo de enseanza se mide con el resultado (malo, regular y bueno) del estudiante en un examen de
lectura. (5p).
Ejercicio 2: en una fabrica se midieron los tiempos (en minutos) usados por 30 operarios para realizar una operacin de
ensamble:
11,0
13,5

11,1
14,0
a)
b)
c)
d)

11,4
14,3

11,5
14,4

11,8
14,5

11,8
14,5

11,9
14,6

12,3
15,0

12,3
15,0

12,5
15,3

12,5
15,3

12,7
15,5

12,9
15,8

Cul es tiempo medio requerido para la operacin? Utilice redondeo simtrico, con dos decimales (5p)
Cul es el valor de la mediana? (3p)
Calcule el e interprete el valor encontrado (3p)
Complete:

24

13,0
16,0

13,2
16,2

Carrera:
Asignatura: Probabilidad y estadstica

Curso:

Profesor: Blanco Vctor

El 80 % de los empleados utilizaron menos de.minutos para realizar la operacin (7p)


El 25 % de los empleados utilizaron mas de . minutos para realizar la operacin (7p)
Ejercicio 3: En cierto es establecimiento comercial se obtuvo el volumen de ventas diarias. Las observaciones se realizaron
durante 150 das.

Volumen de ventas
%
(miles de pesos)
02
15
24
20
46
30
68
50
8 10
25
10 12
10
a) Complete la tabla de frecuencias. (Trabaje con 2 decimales y aplique redondeo simtrico) (5p)
b) Represente el polgono de frecuencia asociado, usando (5p)
c) Complete e intrprete cada uno de los valores obtenidos.
N
(1p)

Media
(5p)

Mediana
(5p)

25

Moda
(5p)

3
(5p)

90
(5p)

Você também pode gostar