Você está na página 1de 57

Primera Semana

Introducción- Conceptos básicos

2017-II Lic. Nelly Demetria Pillhuaman Caña


Sumilla

La asignatura corresponde al área de formación básica. Es de carácter teórico práctico. Se


propone capacitar al alumno en los temas fundamentales de la estadística descriptiva,
aspectos básicos de la teoría de la probabilidad y de la inferencia estadística para métrica.
Competencias:

Los estudiantes al concluir la asignatura estarán capacitados en las siguientes competencias:

 Resumir un conjunto de datos mediante métodos estadísticos, propios de la estadística


descriptiva.

 Establecer la diferencia entre la información obtenida a partir de datos poblacionales y


datos muestrales.

 Saber identificar y cuantificar la relación entre dos variables cuantitativas.

 Saber por qué la información obtenida a partir de los datos de una muestra no puede
generalizarlo, si no hace uso del cálculo de probabilidades.
 Entender los conceptos básicos de la teoría de probabilidades y sus aplicaciones a
problemas reales.

 Utilizar los modelos probabilísticos más importantes para resolver problemas en


ingeniería.

 Usar los conceptos básicos de la teoría del muestreo.

 Hacer uso adecuado de los métodos de la Estadística inferencial para métrica.


Estrategia didáctica

El docente, desarrollará la asignatura siguiendo criterios de mediación, usando el método


inductivo, flexible, participativo y constructivo.

Las clases serán expositivas, con un enfoque teórico-práctico y de laboratorio


computacional, promoviendo permanentemente la participación activa de los estudiantes.

Se elaborarán guías de prácticas y de laboratorios, orientadas a que el estudiante refuerce


los conocimientos adquiridos en las clases teóricas.

Se hará uso de los medios de cómputo y de software estadístico para el procesamiento de


los datos y análisis de la información.

Los estudiantes participarán activamente a través del desarrollo de problemas, estudio de


casos, talleres de creatividad, formando grupos pequeños de trabajo cooperativo.
Evaluación del aprendizaje

La evaluación de los estudiantes es integral, continua y permanente. Para el promedio final


se tomará en cuenta los siguientes conceptos:
 Promedio de evaluaciones (PP),
 Examen parcial (EP) y
 Examen final (EF).
PP  EP  EF
El promedio final (PF) se obtendrá con la siguiente expresión: PF 
3

Los estudiantes tienen la opción de sustituir una de las 2 exámenes. El examen sustitutorio
involucra todos los temas desarrollados en clase.
Índice de Precios de Materiales de la Construcción

Muestra la variación de los precios de los principales materiales de construcción que se utilizan en la
actividad constructora del país.
Fichas técnica Ficha técnica
Empresa contratante: GFK, en exclusividad para "Latina" y "La
Empresas: Ipsos Perú República".
Fecha de aplicación: 26 y 27 de mayo Muestra: 1,508 personas distribuidas a escala nacional.
Muestra: 1,815 personas Margen de error: +/- 2.5 %.
Margen de error: +/- 2,3% Nivel de confianza: 95 %
Nivel de confianza: 95% Trabajo de campo: del 23 al 25 de mayo del 2016
La ESTADISTICA da respuesta a preguntas como:
• ¿Qué porcentaje de los electores votaran por un candidato determinado en las próximas
elecciones municipales?
• ¿Cuál es el porcentaje de unidades defectuosas con que opera determinado proceso de
producción?

• ¿Cuál es precio de los spots publicitarios en televisión?


• ¿Han variado en los últimos 5 anos los alquileres de los locales comerciales en Plaza
norte?
•¿Como repercute sobre la demanda de un producto un incremento en su precio?
• ¿Como se relacionan la tasa de inflación y la tasa de paro de un país?
Semana 01
CONCEPTOS BÁSICOS: Unidad de observación. Característica: Elementos de una
característica. Dato o medida. Variable: Tipo de variable. Información Estadística.
Población. Muestra. Métodos para procesamiento de datos: Tablas de frecuencias
unidimensionales para variable categórica y cuantitativa. Gráficas Estadísticas: gráfica de
barras y sectores. Cuadros estadísticos.
Definiciones
La Estadística es la Ciencia de la

• Sistematización, recolección, ordenación y presentación de los


datos referentes a un fenómeno que presenta variabilidad o
incertidumbre para su estudio metódico, con objeto de

• deducir las leyes que rigen esos fenómenos,

• y poder de esa forma hacer previsiones sobre los mismos, tomar


decisiones u obtener conclusiones.
Estadística Descriptiva
• Es la parte de la estadística que se encarga de recolectar, clasificar, presentar, describir
y simplificar datos.
• Es usada para transformar datos en información.

Recolectar Datos: Ejem. Encuestas

Presentar datos: Ejem. Tablas y gráficos


Resumir Datos: Ejem. Inflación, Balance
Estadística Inferencial

• Conjunto de métodos utilizados para saber “algo” acerca de una población basándose
en una muestra.

• Brinda la base para estimaciones y pronósticos.

• Es usada para transformar información en conocimiento.


Población

Descritpiva
Inferencia
Muestra

Transformación: medidas Análisis: estimación,


resumen pruebas de hipótesis
Ejemplos

Estimación:
– Estimar el gasto promedio en consumo de energía eléctrica mensual por hogar.

Prueba de hipótesis:
– Verificar si el gasto promedio por energía eléctrica mensual en los hogares de LM es
superior al gasto promedio en energía eléctrica por los hogares de la Provincia del Callao.
En conclusión podemos decir: que tanto la Estadística Descriptiva como la
estadística inferencial tienen como objetivo la toma de decisiones.

En la actualidad la gran mayoría de las empresas toman decisiones considerando los


resultados numéricos que la estadística proporciona.

En conclusión, se recolecta datos y sobre el análisis de la misma, se fundamenta y


toman decisiones. Por tanto, Información y decisión son, pues, las claves que
explican el porqué del tratamiento estadístico.
Toma de decisiones

Datos: Observaciones específicas a través de mediciones Decisión


o conteos.

Información: Datos procesados y resumidos para


Conocimiento
producir hechos y generar ideas.
Experiencia, Teoría,
Literatura, Estadística
Inferencial
Conocimiento: Información seleccionada y organizada
que proporciona entendimiento, recomendaciones y Información
el sustento para las decisiones.
Estadística Descriptiva
Probabilidades

Datos
¿Por qué necesitamos estudiar Estadística?

•La estadística es una parte de la educación general deseable para los futuros ciudadanos adultos,
quienes precisan adquirir la capacidad de lectura e interpretación de tablas y gráficos estadísticos
que con frecuencia aparecen en los medios informativos.

•Es útil para la vida posterior, ya que en muchas profesiones se precisan unos conocimientos
básicos del tema.

•Su estudio ayuda al desarrollo personal, fomentando un razonamiento crítico, basado en la


valoración de la evidencia objetiva.
Revisión de conceptos básicos

Elemento o unidad elemental:


Es el elemento o unidad base de la población o de la muestra del cual se obtendrá
información o datos referidos a ciertas características o variables, que nos interesan para
explicar un determinado fenómeno

identificable

Características del elemento =  observable
 medible

• Población (‘population’) es el conjunto sobre el
que estamos interesados en obtener conclusiones
(hacer inferencia).
La población debe estar definida en base a los
elementos siguientes:
 Unidad elemental
 Espacio
 Tiempo

La población puede ser:


 Finita (es posible enumerar)
 Infinita (no es posible enumerar)
• Muestra (‘sample’) es un subconjunto
seleccionado de la población con la finalidad de
realizar inferencias acerca de ella.

Para ello la muestra debe ser una foto de la


población es decir: deberá tener las mismas
características de la población de interés.

También debemos de considerar que al trabajar solo con una muestra de la población, los
resultados que deriven de ella deberá ir acompañada con su margen de error respectivo.
Dato
Los valores obtenidos para cada variable en cada unidad de análisis constituyen los
datos.

Tiempo de duración 2200 horas

Unidad elemental Variable Dato


Variable

Es una característica de las unidades poblacionales o de la muestra que interesa al


investigador y que toma diferentes valores. Las variables se denotan con letras
mayúsculas.

Según el rol que desempeñan en la investigación, las variables se clasifican teniendo en


cuenta el criterio de su causalidad en dependientes y dependientes.
 Las variables dependientes, son aquellas que dependen del valor que asuman otros
fenómenos o variables. Estas variables corresponden al fenómeno explicado.
 Las variables independientes, son aquellas cuyos cambios en sus valores
determinan cambios en los valores de la otra. Estas variables son las que explican el
fenómeno.
Clasificación de las variables según: su naturaleza

Unidad de análisis: una bombilla de luz


Nominal ejem: led, halógenas, incandecentes

Cualitativa

Ordinal ejem: tipos de gasolina segú octanaje

Variable

Discreta ejem: eficiencia de las bombillas


(vatios que consumen)
Cuantitativa

Continua ejem: Tiempo de duración de la bombilla


Ejemplos: variable cualitativa nominal

Energía eólica Energía eólica en el mar

torres de refrigeración e
Petróleo instalaciones nucleares Panel solar
Iluminación de tareas.- Proporciona
iluminación en áreas específicas de trabajo
como escritorios y mostradores

Iluminación arquitectónica. Caracterizada por acentuar las características y elementos específicos de


un espacio en general, como sus paredes, techos, pisos, en vez de los objetos presentes.

Iluminación para acentuación. Es utilizada Iluminación para ambientes- Es utilizada para


para realzar características especificas dentro darle carácter a los espacios a iluminar
de un espacio
Ejemplos de variable cualitativa ordinal:
Ejemplo de variable cuantitativa discreta

Número de cilindros que tiene un vehículo


Número de asientos de un vehículo
Antigüedad de un vehículo
Número de celulares que posee una persona
Cantidad de libros que tiene una persona
Número de tazas de café que consume una persona
Número de lugares turísticos visitados hasta Julio por una persona
etc
Ejemplo de variable cuantitativa continua

Ingreso mensual
Gasto en consumo de gasolina
Temperatura del día
Km recorrido por un automóvil en el lapso de un mes
 Gasto en consumo eléctrico
% de volumen de alcohol
Potencia de una turbina eólica (MW)(va de 2 a15)
Clasificación de las variables según: su escala de medición

Nominal Ejem: Color de luz que emite una bombilla


Grupo sanguineo de una persona

Ordinal Ejem: Nivel de educación de una persona


Nivel socioeconómico de una persona

Intervalar Ejem: Temperatura del día


Nota promedio al final de curso

Razón Ejem: Tiempo de duración de una bombilla


Gasto mensual en consumo de energía
Elementos De Una Variable

 Nombre o denominación de la variable.


 Definición o conceptualización de la variable.- Proporciona un significado a un concepto
o variable que puede comunicarse a otras unidades. Es algo que tiene el mismo significado
ayer, hoy , mañana y siempre para todas las unidades.
 Conjunto de categorías o niveles, definida por el investigador,
 Procedimiento para obtener el dato.
 Algunas medidas resumen.
¿Cómo presentar los datos?
i. Tablas de distribución de frecuencias
Es una forma de cómo presentar los datos de acuerdo al tipo de variable que se
tiene. Uno de los usos de la tabla de distribución de frecuencias es para calcular
algunos medidas resumen.

• Frecuencia absoluta simple. (fi) Es el número de observaciones que caen en cada una
de las clases o categorías de la variable de estudio. Se denota con fi

• Frecuencia relativa simple (también se puede expresar en porcentaje. (hi) Viene a


ser parte de una categoría o clase con respecto a la unidad. Se calcula como el cociente
de la frecuencia absoluta de la clase a considerar y el número total de observaciones.
Es decir:
ii. Representaciones gráficas
La representación grafica de los datos constituye un instrumento de gran utilidad ya que
proporciona una imagen que permite:
 Visualiza de manera sencilla y rápida aspectos relevantes de la distribución de
frecuencias,
Mejorar la comprensión del fenómeno que se analiza,
Detectar la presencia de errores en los datos.
a. Tabla de distribución de frecuencia para variable cualitativa
Ejemplo

Se realizo un estudio de investigacion a 160 personas cuyas edades oscilan entre 12 a 60


años de edad con la finalidad de conocer cuales son los programas preferidos en televisión.
Los resultados se muestran en tabla

Número de televidentes según programas preferidos en televisión

variable Programas Nº televidentes hi


Noticieros 34 0.2125
categorías
Series policiacas 30 0.1875
Novelas 36 0.2250 frecuencias
Dibujos animados 32 0.2000
Culturales 28 0.1750
Total 160 1.0000
Responda las siguientes preguntas

1.-¿Cuantas televidentes prefieren ver los noticieros?

2.-¿Cuántas personas no prefieren ver los noticieros?

3.-¿Qué porcentaje de personas prefieren ver las series?

4.-¿Cuál es el porcentaje de televidentes que no prefieren ver las series?


Tipo de gráficos para variables cualitativas

Gráfico de barras simples Gráfico de sectores


20
FRECUENCIA ABSOLUTA

18
Cultural
16
18%
14
12 Noticiero21%
10
8
6 Dibujos Series 19%
4 20%
Novelas
2 22%
0
NOTICIEROS SERIES NOVELAS DIBUJOS CULTURALES

PROGRAMAS
b. Tabla de distribución de frecuencia para una variable cuantitativa discreta

Intervalo fi hi Fi Hi
x1 f1 h1 F1= f1 H1= h1
x2 f2 h2 F2=F1+f2 H2=H1+h2
.. .. .. .. ..
.. .. .. .. ..
xi fi hi Fi=Fi-1+fi Hi=Hi-1+hi
.. | .. .. ..
.. .. .. .. ..
xk fk hk Fk= n Hk= 1
Total n 1
donde:
Fi: Frecuencia absoluta acumulada de la clase i
Hi: Frecuencia absoluta acumulada de la clase i
Distribución del Número de focos por hogar
c. Tabla de distribución de frecuencia para una variable cuantitativa continua

Pasos a considerar:
1.- Calcule el rango (R). Que viene a ser la diferencia del valor mas alto y el valor
mas pequeño
2. Elija o calcule el número de clases a considerar en el estudio.
 K podría estar entre 5 y 15
 De acuerdo al conocimiento que se tiene de la variable de estudio o muy bien
 Calcular mediante Sturges: K= 1+3.3 log(n) (redondeo matemáticamente)
3. Calcule la amplitud del intervalo de clase mediante: A= R/ K (redondeo por
exceso)

4. Determine los límites de clase.


5. Calcule el punto medio (marca) de clase.
6. Efectúe el conteo para cada una de los intervalos hallados
Como redondear la amplitud del intervalo (A)

Ejemplo de Se
Ejemplo de dato original valor de la amplitud (A ) redondea
calculado por
exceso a:
15 (dato entero) 5.75 6
3.2 (dato con 1 decimal) 2.33782129 2.4
11.13 (dato con 2 decimales) 3.24920976 3.25
5.391 (dato con 3 decimales) 1.42135709 1.422
99.3489 (con 4 decimales) 9.2876405 9.2877
Forma de la tabla de distribución de frecuencias para una variable cuantitativa continua
Ejemplo

En un establecimiento comercial, se dispone de los datos de la venta semanal (en miles


de soles) para las últimas 30 semanas. Los datos son los siguientes

Construya una tabla de distribución de frecuencias.


Pasos a considerar:

1. R= Xmax – X min = 15,8 – 12,2 = 3,6

2. Hallar “k”mediante Sturges:


k= 1 + 3,3 log (30) = 5,8745 aprox. 6 (redondeado matemáticamente)

3. Determinar la amplitud del intervalo:

A= 3,6 / 6 =0,6 (no se redondea, porque ya tiene un decimal como los datos)
Distribución de las ventas mensuales del establecimiento comercial
Responda las siguientes preguntas
1.- ¿Cuántas semanas tienen ventas entre 14,0 y 14,6 miles de soles?
Rpta.
2.- ¿Cuál es la proporción o el porcentaje del número de semanas cuyas ventas se
encuentran entre 12,8 y 13,4 miles de soles?
Rpta.
3.- ¿Cuántas semanas tienen ventas menores a 14,6 miles de soles?
Rpta.
4.- ¿Cuál es la proporción o el porcentaje del número de semanas cuyas ventas son
menores a 15,2 miles de soles?
Rpta.
5.-¿Qué porcentaje de las ventas son como mínimo 14.6 miles de soles?
Rpta.
Tipo de gráficos para variables cuantitativas continuas

Histograma
Histograma de Frecuencias Absolutas

Frequencia Absoluta 7

0
12.2 12.8 13.4 14.0 14.6 15.2 15.8
Ventas
Tipo de gráficos para variables cuantitativas continuas

-Histograma
Poligono de Frecuencias Absolutas
- Polígono
9

7
numero de semanas

0
12.5 13.1 13.7 14.3 14.9 15.5
Ventas
iii. Tallos y hojas

Es una técnica que se usa para organizar los datos como primer paso en un análisis
exploratorio de datos.

En el diagrama de tallo y hojas se visualizan diferentes rasgos de la distribución como


son:
 Rango de los valores (dispersión)
 Localización de valores centrales
 Identificación de valores muy o poco frecuentes
 Saltos (gaps) o lagunas
 Valores anómalos o extremos notablemente desviados del conjunto (outliers)

 Asimetría y forma.
El diagrama de tallos y hojas presenta las siguientes ventajas en comparación con el
histograma u otra forma de graficar:
 No condensa la información. Se puede seguir reconociendo los elementos de la muestra
con una mínima perdida de información.
 Facilita la localización de los cuantiles.
 Informa de la existencia de valores outliers y los identifica.
Procedimiento:

 Ordenar los datos de la variable en forma creciente.


 Considere como hoja la primera cifra de derecha a izquierda y el tallo las cifras restantes.
A continuación separarlos por una linea vertical, en donde se colocan los tallos a la
izquierda y las hojas a la derecha del tallo correspondiente. De esta forma cada tallo se
representa una sola vez y define una clase y el número de hojas representa la
frecuencia de cada clase.
Por ejemplo escribir 34 como tallo y hoja:
Tallo Hoja
3 4
Escribir 532 como tallo y hoja: Tallo Hoja
53 2

Para los siguientes datos, construya un diagrama tallos y hojas:


12, 15, 18, 22, 24, 26, 27, 31, 33, 33,
35, 36, 42, 42, 45, 46, 50, 51, 53
Unidad(Leaf unit) = 1.0 Es la unidad de hoja, es importante por que con ella podemos
recuperar el dato original. En el ejemplo la Unidad es 1.0 asi
la primera observacion es 12 . Si la unidad hubiera sido 0.1
Acumulado Tallo Hojas entonces el valor seria 1.2 y si fuera 10 indicaria que el dato es
120-
3
1 2 5 8
7
2 2 4 6 7
.(5) Centro de la distribución
3 1 3 3 5 6
7
4 2 2 5 6 ¡Observe que se parece a un histograma volteado!
3
5 0 1 3

Você também pode gostar