Escolar Documentos
Profissional Documentos
Cultura Documentos
PORTAFOLIO DE
ESTADÍSTICA
PARALELO: 3- “B”
Ecuador – Tulcán
09/05/2017
ESTADÍSTICA DESCRIPTIVA
OBJETIVO GENERAL
La Estadística es un lenguaje que ayuda a analizar mejor la realidad que nos rodea.
Es un lenguaje que ayuda a pensar, que ayuda a mirar, a relacionar, a comparar,
ayuda a ver más allá de donde llega nuestra mirada.
DESCRIPTIVA
Variable nominal: Son aquellas que establecen la distinción de los elementos en las
categorías sin implicar orden entre ellas
Ejemplo:
INTERVALO
Es una disciplina científica que afecta a todos los actos de hoy en día. Interviene en
los ámbitos del saber y de la economía, destaca las vidas salariales de los individuos
estas son productivas por el estado de gobierno. El papel teórico y técnico como
vertiente teórica con sus distintas partes involucrándose en todas las actividades.
Retroalimentación
• No de sucursales VARIABLE
DATOS
Tipos de datos
Recolección de datos
ESCALA DE LIKERT
Psicométrica
Encuestas
Entrevista
Observación
Documentación
Documentación
Observación
La observación es científica cuando:
Sistemática
Controlada
Cuenta mecanismos para evitar errores y confusiones.
Observación no participante:
• Es cuando se perturba la acción o situación que se está investigando.
Observación participante:
• Implica conciencia en el evaluado.
Entrevista
• La evaluación que se realiza al individuo no debe pasar inadvertido
• El instrumento es el evaluador la reacción la provoca directamente el
evaluador
• Estructurada: si cuenta con una guía
• No estructurada: Cuando buscan explorar características del evaluado
Encuesta
• Busca conocer la respuesta de un grupo; Puede corresponder a una muestra
o una población
• Asincrónico o Auto administrativo: Si el individuo completa los reactivos.
Sincrónico o Hetera administrativo: cuando hay el encuestador.
Psicometría
• Desarrollada por los investigadores de las ciencias del comportamiento
• No requiere que el investigador pertenezca a la línea de investigación;
primero porque los instrumentos son autoadministrables
• Por ultimo porque el evaluado se puede autocalificar.
• Utilizada para medir algunas variables.
Elementos del proceso de observación:
• Sujeto u observador
• El ente observado
• Los medios de observación
• Las circunstancias de la observación
Clasificación:
1. Según la relación entre el observador y el ente observado
2. Según los medios de observación
3. Según las circunstancias de la observación
4. Según la relación entre el observador y el ente observado
NO PARTICIPANTES:
SISTEMATICA
SISTEMATICA
ASISTEMATICA
Laboratorio
• Controlada
• El ente observado no se encuentra en su estado natural requiere de
procesos para controlar su ambiente.
• Mediciones de mayor estabilidad
ENTREVISTA DE INVESTIGACIÓN
Entrevista no estructurada
Entrevista a profundidad
• Es netamente cualitativa, busca explorar y descubrir características en el
evaluado, no sigue reglas.
• No clasifica no tiene interés de tabulares datos, pero orienta posibles
hipótesis.
Entrevista enfocada
• Se concentra en uno o varios puntos.
• El entrevistador conoce directa e indirectamente esta situación
• Cuenta con una lista de temas abarca a fin de no omitir aspectos importantes.
• Modificando el investigador la forma y orden dependiendo de las
circunstancias.
• Formula hipótesis
• Obtiene una conclusión
Entrevista estructurada
Muestreo estratifico
Muestreo conglomerado.
Método de muestreo en el que la población se divide en conglomerados/
grupos, en el que se selecciona solamente un subconjunto de cada
conglomerado en lugar del conglomerado completo. Este método utiliza a
menudo las zonas de enumeración como unidad primaria de muestreo.
Muestreo no-probabilístico
Es aquel estudio que es realizado en las empresas, a los empleados nuevos sobre
el trabajo por medio de cuestionarios, los cuales cumplen la función de investigar
los antecedentes laborales del postulante de trabajo en dicha empresa.
Encuesta socioeconómica
TIPOS DE PREGUNTAS
Según la contestación
1. cerrada
Según la función
2. Filtro
3. Batería
4. Control
5. Amortiguadora
Según el contenido
1. Identificación: sitúa las condiciones en la estructura social
2. Acción: trata sobre las acciones de los entrevistados
3. Intención: indagan sobre las acciones o intenciones
4. Opinión: opinión de entrevistados
5. Información: analizan el grado de conocimiento
6. Motivos: tratan sobre el porqué de determinados actos u
opiniones.
Las personas tienen más tendencias a contestar si a que contestar no, una pregunta
recibe más adhesiones cuando están formulados para contestar sí que cuando esta
formulada para contestar no.
TABULACIÓN DE LA INFORMACIÓN
OBJETIVO GENERAL
ANALISIS DE FRECUENCIAS
Para el análisis de los fenómenos se debe iniciar con una traficación de las
distribuciones para realizar los resultados y facilitar la interpretación.
DATOS
N° DE CONTE0
PLANTAS DE PRODUCCIÓN
OBSERVACIÓN EN GRAMOS
1 650 GRAMOS N° DE PLANTAS
2 250 0 100 2
3 330 101 200 2
4 400 201 300 4
5 450 301 400 5
6 580 401 500 8
7 640 501 600 2
8 650 601 700 4
9 730 MAS 700 3
10 750
11 650
12 760
13 450
14 450
15 430
16 350
17 400
18 450
19 115
20 136
21 70
22 50
23 250
24 350
25 480
26 500
27 550
28 300
29 460
30 280
Intervalos de Frecuenci
Frecuenci Frecuenci
clases Marca Frecuenc as Frecuenci
as as relativa
de ia absolutas as
límite límite clase absoluta acumulad relativas porcentual acumulad
inferio superi es as
a
r or
0 100 50 2 2 0,067 7 7
101 200 150,5 2 4 0,067 7 14
201 300 250,5 4 8 0,133 13 27
301 400 350,5 5 13 0,167 17 44
401 500 450,5 8 21 0,267 27 70
501 600 550,5 2 23 0,067 7 77
601 700 650,5 4 27 0,133 13 90
700 760 730 3 30 0,100 10 100
SUMA 30 1 100
Para definir el límite inferior y el límite superior de cada intervalo. El límite inferior
de la primera clase es el dato de menor valor el resto de los límites de clase se
obtienen mediante la suma sucesiva de la amplitud o a partir del primer valor
ASIGNAR LA FRECUENCIA
DATOS
128
129
139
143
148
157
177
186
187
188
189
205
205
208
209
209
209
218
218
225
230
230
231
257
258
258
258
258
258
258
258
258
277
278
285
285
285
287
288
289
289
289
297
303
304
305
308
308
309
310
Marca Frecuencias Frecuencias
Frecuencia Frecuencias Frecue
Intervalo RANGO de absolutas relativas
absoluta relativas porcen
de clase clase acumuladas acumuladas
159 128 159 143,5 6 6 0,12 12
190 159 190 174,5 5 11 0,10 22
221 190 221 205,5 8 19 0,16 38
252 221 252 236,5 4 23 0,08 46
283 252 283 267,5 11 34 0,22 68
314 283 314 298,5 16 50 0,32 100
SUMA 50 1,00
rango Q1 Q2 Q3
n: numero de observaciones
52, 53, 53, 54, 54, 55, 55, 55, 56, 56, 57, 57, 58, 58, 58, 59, 60, 60, 60,60, 60, 62,
63, 64, 65, 65, 66, 67, 69, 70, 70, 71, 75, 77, 78, 78, 79, 79, 79, 80, 53, 53, 54, 54,
55, 55, 55, 56, 56, 57, 57, 58, 58, 58, 59, 60, 60, 60,60, 60, 62, 63, 64, 65, 65, 66,
67, 69, 70, 70, 71, 75, 77, 78, 78, 79, 79, 79, 80
Tallo y hojas
5 2, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 9, 9
6 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 2, 3, 3, 4, 4, 5, 5, 5, 5, 6, 7, 7, 9, 9
7 0, 0, 0, 0 1, 1, 5, 5, 7, 7, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9
8 0, 0
Calificación de Estudiantes
6, 4, 4, 3, 6, 10, 1, 2, 6, 6, 8, 5
Media 5,5
Mediana 5,5
Moda 6
Media Geométrica 4,38
Valor Máximo 10
Valor Mínimo 1
Rango 9
Desviación Media 1,92
Varianza 5,92
Desviación Estándar 2,43
Media Aritmética 5,08
Desviación Estándar
Medida de Desviación
Campana de Gauss
MEDIDAS DE POSICIÓN
Leptocurtica. La mayoría de los datos son bien parecidos los valores concentrados
a la media, es mayor que cero.
Coeficiente de Fisher
MEDICIÓN ASIMÉTRICA
Carson
Probabilidad
(MTC)(MO)
MPVC(Q)
FORMULA DE ASIMETRIA
𝐸𝑥 3
𝑛(5𝑥)3
48
4𝑥(2,82)3
288
4𝑥(2,82)3
= 0,53
Asimetría: coeficiente de Pearson
Distribución de datos
Ap= tendencia/dispersión
Ap= x-Me/n
Ap = < 0 negativo
4. no van al museo
6. van 1 vez al museo
3. 2 veces al mes
4. 3 veces al mes
2. 4 veces al mes
1. 5 veces al mes
Mo =1
X= 1,85
Me= 1,5
D= 1,46
x ni Ni fi Fi
0 4 4 0,2 20
1 6 10 0,5 50
2 3 13 0,65 65
3 4 17 0,85 85
4 2 19 0,95 95
5 1 20 1 100
X=0+6+6+12+8+5/20
X=1,85
Mo= 1
VOCABULARIO
Regresión media
Conclusión: los padres muy altos tienen tendencia a tener hijos que heredan esta
altura, lo mismo ocurre con los padres bajos.
- La covarianza entre dos variables nos indica si la posible relación entre dos
variables es directa o inversa.
1
- Directa: Sxy>0 S𝜇 = 𝑛 ∑(𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)
- Inversa: Sxy<0
- Intercalados: Sxy=0
Q1= 1
Q4= 3
Me= 1,5
0000111111223333445
3 1
𝑄 +𝑄 −2𝑀𝑒
4 4
AB= 3 1
𝑄 −𝑄
4 4
3+1−2(1,5)
AB= 3−1
AB= 0,5
Xi ni Vi fi Fi
0 4 4 20% 20
1 6 10 30% 50
2 3 13 15% 65
3 4 17 20% 85
4 2 19 10% 95
5 1 20 5% 100
La regresión se utiliza para resolver la variación entre dos variables. Se aplicó las
características de los hijos a los padres en cuanto a la estatura.
Ejemplo:
0000111111223333445
𝑛 3
Mediana= 2 = 2 = 1,5
(𝑥𝑖−𝑍)2
Varianza= 𝑛
42,45
20
2,1225
Desviación estándar
√2,1225
1,46
𝑥𝑚−𝑀𝑜
Ap = ∅
1,85−1
Ap = 1,46
Coeficiente de Bowley
3 1
𝑄 +𝑄 −2 𝑀𝑒
4 4
AB: 3 1 > 0 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜
𝑄 −𝑄
4 4
Tiene el mismo signo, por lo tanto de su signo obtenemos el que la posible relación
será directa o inversa.
Es útil para determinar si hay relación lineal entre las variables para no servir otro
tipo de decisión (cuadrática y logarítmica)
REGRESIÓN:
El análisis de regresión sirve para proceder una medida en función de otra medida.
Y= variable dependiente
Predicha
Explicada
X = variable independiente
Predictiva
Explicativa
Y= f(x) + error
N = 13
Media= 13,88
Mediana= 14
Moda= 16
Desviación= 2,74
Curtosis = -0,65
ÍNDICADORES
𝑄25 + 𝑄75
2
Diagrama de Caja
HISTAGRAMA
Ejercicio
. Desviación estándar
n µ = E X1
Media ponderada:
ƩWX1
Ʃ W1
P1(X¡)+P
300+400+400
1100
25200
X= = 22,91
1100
K=Max – Min
Media Aritmética = Ʃ X1 /n
Desviación Media: Diferencia de las Medias Datos X Datos –X Desviación M
3 6 -3
4 6 -2
5 6 -1
8 6 2
10 6 4
0
ƩX1 30
Media = = =6
𝑛 5
Simulacro Prueba
65 59
76 81
80 86
93 95
51 53
62 60
70 75
73 73
82 86
86 88
78 77
60 63
ƩX 876 ƩY 906
X 73 Y 75,5
Diagrama de descripción
65-73 69 – 75,5
-8 -6.5 52 64 42.25
0 -2.5 0 0 6.25
1526/12 1580/m
1741/12
135.5 131.66
√145,083
=11.475 = 12,045
Ơ X = 11,475
ƠY =12,045
Ơx4 135,5 135,5
r = Ơx.04 x100% = (11,475) (12,045)
x 100 = 138,216 x100
=98.04%
DATOS BIVARIADOS
Diagrama de dispersión
H ᴔXY= 0 no existe
. . .
∑ 𝑋𝑖 − ⃗⃗⃗
𝑋
𝑁
(5−6)+(4−6)+(5−6)+(8−6)+(10+6)
DM𝑋 = 5
3+2+1+2+4
=
5
12
=
5
= 2,4
Varianza
2
(𝑋𝑖 − 𝑋)
𝜎=
𝑛
Desviación Estándar
2
⃗)
∑(𝑋𝑖−𝑋
S=√ 𝑛−1
4,4
S= 4
S=1,10
MEDIDAS DE DISPERSIÓN
2
∑(𝑋𝑖 − 𝑋)
𝑋𝑆 𝑦 𝑋 = √
𝑛
VARIANZA: es una medida de dispersión que permite conocer un carácter o rasgo
de objetos, cuadrática optima por ser la menor de todas.
∑(𝑥𝑖−𝑥)2 𝑛𝑖
Población: 𝜎 2 = 𝑛
∑(𝑥𝑖−𝑥 )2 𝑛𝑖
Muestra: 𝑠 2 = 𝑛−1
N= 5
x1 x2
4 16
6 36
2 4
1 1
3 9
∑ = 66
∑ = 16
𝑥 = 3,2 𝑠 2 = 13,2
1,118
𝑐𝑣 = 𝑥 100%
1,5
𝑐𝑣 = 74,5%
4,36
𝐸𝐸 = = 1,45
√9
a= 1,05
z= 1,96 - 2
𝑥 = 28,50
EE=1,45
IC= 2EE
EJERCICIO
Ejercicio
Considerando los datos de producción por planta (gramos de café cereza) y del
porcentaje del gramo vano, realiza un análisis de frecuencia en dos sentidos
Desviacion estandar
Error estándar= √𝑛
Simulacro Examen
65 69
76 81
80 86
93 95
51 53
62 60
70 75
73 73
82 86
86 88
INTRODUCCION
La estadística nos sirve para describir fenómenos.
Estadística descriptiva: Corregida de datos, tablas, gráficos, resúmenes.
Estadística inferencial: Observación muestra una mayor que se llama población en
la cual se utiliza una teoría llamada teoría de la probabilidad.
Un estudio estadístico consiste en un sin número de pasos
Elección o hipótesis para medir una población
Utilización de variables que se va a observar
Estudio del individuo mediante variables
Recolección de datos
Descubrir los resultados, tablas gráficos.
Intervalos de confianza, hipótesis de contraste
Cuantificar de conclusiones
Planteamiento de la hipótesis contrastar con la recolección de datos
Recoger
Obter
datos
conclusiones
analizados
Ejemplo
Altura ≠ Hijos
Continuas:
Variables cualitativas
Discretas
Continuas
Intervalo
Base de datos
Cuartiles 0-1
Percentiles 0-100
Percentil 50
Cuartiles- percentiles 25(bajos), 50(medios), 75(altos)
Moda: Unidades, decimales, máximo absoluto, medidas de centralización.
Medidas de centralización
(). ()