Você está na página 1de 10

ANOVA SIMPLE

1.Variables

a) Factor: Carrera Clasificación nivel 1 (5)

b) Respuesta: Promedio edad carrera

2.Hipotesis

a) Ho: u1=u2=u3=u4=u5

b) Ha: al menos una diferente

3.Nivel de Significancia: 0.05

4.Supuestos

a) Normalidad de Población

 Ho= Población es Normal


 Ha= Población es no normal

Interpretación:
La población es no normal, dado que “p-valor” es menor que alfa, por ende, se
rechaza la hipótesis nula
b) Varianza de poblaciones

 Ho : Var1=Var2=Var3=Var4=Var5
 Ha : Al menos una diferente

de varianzas iguales: Promedio Edad Carrera vs. CARRERA CLASIFICACION


Múltiples intervalos de comparación para la desviación estándar, α = 0.05

Comparaciones múltiples
CARRERAS PROFESIONALES Valor p 0.000
CARRERA CLASIFICACION NIVEL 1
Prueba de Levene
Valor p 0.000
CARRERAS TÉCNICAS

DOCTORADO

MAGÍSTER

POSTÍTULO

5 6 7 8 9

Si los intervalos no se sobreponen, las Desv.Est. correspondientes son significativamente diferentes.

Interpretación:
Las varianzas son diferentes, dado que “p-valor” es menor a alfa, por ende, se
rechaza la hipótesis nula, también en el grafico se ve claramente que la
varianza de magister es distinta al de carreras profesionales y técnicas

5.Modelo Anova

Ho: el promedio edad carrera es igual a todas las carreras clasificación nivel 1

Ha: al menos un promedio edad carrera es diferente


Prueba de Welch

GL
Fuente Num GL Den Valor F Valor p
CARRERA CLASIFICACION NIVEL 1 4 675.936 488.84 0.000
Interpretación:

El promedio edad carrera es diferente para las carreras clasificación nivel 1, dado que “p-valor”
es menor a alfa, por ende, se rechaza la hipótesis nula.

Resumen del modelo

R-cuad. R-cuad.
R-cuad. (ajustado) (pred)
23.36% 23.32% 23.24%
Interpretación:

El Modelo explica el 23.36% del promedio edad carrera


Comparaciones en parejas de Games-Howell

Agrupar información utilizando el método de Games-Howell y una confianza de


95%

CARRERA CLASIFICACION NIVEL 1 N Media Agrupación


DOCTORADO 109 36.130 A
MAGÍSTER 728 36.058 A
POSTÍTULO 683 35.978 A
CARRERAS PROFESIONALES 4033 29.0325 B
CARRERAS TÉCNICAS 2918 27.4394 C

Interpretación:

 los de mayor edad promedio edad carrera son de doctorado, magíster y postítulo.
 No existe diferencia significativa entre el promedio edad carrera de doctorado
magister y postítulo
 La menor edad promedio edad carrera es de carreras técnicas, dado que su agrupación
es la C (la más baja)

Anova Multifactorial
1.Variables

a) Factor:

 Nivel Global (3)


 Clasificación Institución nivel 0 (3)

b) Respuesta: Duración Estudio Carrera

2.Hipotesis

 Nivel Global
o Ho: u1=u2=u3
o Ha: al menos una diferente
 Clasificación institución nivel 0
o Ho: u1=u2=u3
o Ha: al menos una diferente

3.Nivel de Significancia: 0.05

4.Supuesto

o Normalidad de Población
o Ho: la población es normal
o Ha: la población es no normal
Interpretación:

La población es no normal, dado que “p-valor” es menor a alfa, por ende, se rechaza la
hipótesis nula

5.Modelo Anova para dos factores

o Ho: no afecta
o Ha: si afecta

Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


NIVEL GLOBAL 2 22469.3 11234.7 2976.48 0.000
CLASIFICACION INSTITUCION NIV_0 2 15405.0 7702.5 2040.68 0.000
Error 8595 32441.6 3.8
Falta de ajuste 2 28.2 14.1 3.74 0.024
Error puro 8593 32413.4 3.8
Total 8599 61430.7

Interpretación:

o La duración estudio carrera si afecta a nivel global, dado que “p-valor” es menor a alfa
o La duración estudio carrera si afecta a clasificación institución niv_0, dado que “p-
valor” es menor a alfa

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
1.94280 47.19% 47.17% 47.14%
Interpretación:

o El modelo explica el 47.19% del promedio de la duración estudio carrera

6. Modelo Anova para dos factores con interacción

Con Grafico

Interpretación:

1) Nivel Global
a. El promedio de duración de carrera(semestre) de pregrado es mayor a
todos
b. El promedio de duración de carrera(semestre) de postítulo es el menor de
todos
2) Clasificación Institucional Niv_0
a. El promedio de duración de carrera(semestre) de las universidades es mayor
que demás (Centros formación técnica e institutos profesionales)
b. el promedio de duración de carrera(semestre) de los centros de formación
técnica es la menor que los demás (universidades e institutos profesionales)
REGRESION SIMPLE
1. MATRIZ DE CORRELACION Y SIGNIFICANCIA ESTADISTICA DE CADA CORRELACION.

TOTAL TOTAL TOTAL Promedio Edad


TITULADOS FEMENINO MASCULINO Ca
TOTAL 0.883
FEMENINO
0.000

TOTAL 0.790 0.404


MASCULINO
0.000 0.000

Promedio Edad -0.097 -0.095 -0.071


Ca
0.000 0.000 0.000

Promedio Edad -0.085 -0.081 -0.048 0.931


Fe
0.000 0.000 0.000 0.000

Promedio Edad -0.081 -0.074 -0.065 0.929


Ma
0.000 0.000 0.000 0.000

2. SEA EL MODELO DE REGRESIÓN:


- LA CORRELACION ENTRE TOTAL TITULADOS Y PROMEDIO EDOD MASCULINO ES
NEGATIVO Y DEBIL (-0.081).
- LA CORRELACION ENTRE TOTAL FEMENINO Y PROMEDIO EDAD MASCULINO ES
NEGATIVO Y DEBIL (-0.074).
- LA CORRELACION ENTRE TOTAL MASCULINO Y PROMEDIO EDAD ES NEGATIVO Y
DEBIL (-0.065)
- LA CORRELACION ENTRE PROMEDIO EDAD CARRERA Y PROMEDIO EDAD
MASCULINO ES POSITIVA Y FUERTE(0.929).
3. SEA EL MODELO DE REGRESIÓN:
GRAFICA DE DISPERSION:

Fitted Line Plot


Promedio Edad Masculino = - 0.2807 + 1.019 Promedio Edad Carrera
80 S 2.46242
R-Sq 86.3%
R-Sq(adj) 86.3%
70
Promedio Edad Masculino

60

50

40

30

20

20 30 40 50 60 70 80
Promedio Edad Carrera

-
COEFICIENTE DE DETERMINACION (R-CUAD): EL PROMEDIO EDAD CARRERA
EXPLICA EL 86.3% DEL PROMEDIO EDAD MASCULINO.
- LA DISPERSION ENTORNO DE LA RECTA: AL COMIENZO DE LA GREFICA LOS
PUNTOS ESTAN AGRUPADOS ALREDEDOR DE LA RECTA Y LUEGO SE DISPERSAN.
4. MODELO DE REGRESION COMPLETO
A) SUPUESTOS
i) NORMALIDAD DE LOS ERRORES
NORMALIDAD DE LOS ERRORES
- DEBIDO A QUE VARIOS PUNTOS SE ALEJAN LOS ERROES NO SON NORMALES.
- PARA QUE LOS ERRORES SEAN NORMALES LOS PUNTOS DEBEN ESTAR MUY CERCA
A LA RECTA ROJA.

Histogram
(response is Promedio Edad Masculino)

2500

2000
Frequency

1500

1000

500

0
-12 -6 0 6 12 18 24 30
Residual

- LOS ERRORES SON NORMALES, POR QUE SE AJUSTA A LA CURVA NORMMAL.


- SE CUMPLE CON EL SUPUESTO DE NORMALIDAD.

i) VARIANZA CONSTANTE DE LOS ERRORES


DEBIDO A QUE EXISTE UN GRUPO COMPACTO DE PUNTOS, LA VARIANZA DEL
ERROR NO ES CONSTANTE.

B) MODELO

ECUACION DE REGRESION

Promedio Edad = 0.390 - 0.7081 Promedio Edad Femenino


Masculino + 1.6981 Promedio Edad Carrera
- 0.01032 TOTAL TITULADOS
+ 0.01744 TOTAL FEMENINO

- Intercepto: (0.390) EL PROMEDIO DE EDAD MASCULINOPARA 0 AÑOS DE


PROMEDIO EDAD FEMENINO + 0 AÑOS DE PROMEDIO EDAD CARRERA MENOS 0
AÑOS DE TOTAL TITULADOS MAS 0 AÑOS DE TOTAL FEMENINO ES DE 0.390.
- LA PENDIENTE:
POR CADA AÑO DE PROMEDIO EDAD FEMENINO ADICIONAL, EL PROMEDIO EDAD
MASCULINO DISMINUYE EN 0.7081.
POR CADA AÑO DE PROMEDIO EDAD CARRERA ADICIONAL, EL PROMEDIO EDAD
MASCULINO AUMENTA EN 1.6981.
POR CADA AÑO DE TOTAL TITULADOS ADICIONAL, EL PROMEDIO EDAD
MASCULINO DISMINUYE EN 0.01032.
POR CADA AÑO DE TOTAL FEMENINO ADICIONAL, EL PROMEDIO EDAD
MASCULINO DAUMENTA EN 0.01744.
- LA INFERENCIA:
Coeficientes

Coefficients
Term Coef SE Coef T-Value P-Value VIF
Constant 0.390 0.166 2.35 0.019
Promedio Edad Femenino -0.7081 0.0121 -58.56 0.000 5.47
Promedio Edad Carrera 1.6981 0.0126 135.02 0.000 5.48
TOTAL TITULADOS -0.01032 0.00260 -3.97 0.000 4.51
TOTAL FEMENINO 0.01744 0.00386 4.51 0.000 4.52

a. VALOR T: EL TERMINO MAS IMPORTANTE DEL MODELO ES LA


CONSTANTE,(135.02)
b. VALOR P:
HO: EL COEFICIENTE ES IGUAL A 0
HA: EL COEFICIENTE ES DIFERENTE DE CERO
COMO SE RECHAZA HO, LOS COEFICIENTES DE LAS VARIABLES SON
ESTADISTICAMENTE SIGNIFICATIVAS (CAUSALIDAD).
5) UTILIZANDO EL MODELO ANTERIOR, ESTIME EL SALARIO PROMEDIO EN CASO DE 25
AÑOS DE EXPERIENCIA

Prediction
Fit SE Fit 95% CI 95% PI
25.3170 0.0564399 (25.2064, 25.4276) (20.9824, 29.6516)

- EL MODELO PRONOSTICA QUE EL PROMEDIO EDAD MASCULINO PARA 25 AÑOS


DE LAS VARIABLES A ANALIZAR ES DE 25.3170.
- PODEMOS AFIRMAR CON UN 95% DE CONFIANZA QUE EL VALOR PRONOSTICADO
REAL ESTA ENTRE 20.9824 Y 29.6516 .

Você também pode gostar