Você está na página 1de 32

Master en Organización de Empresas

OTRAS LÍNEAS DE INVESTIGACIÓN EN


ORGANIZACIÓN DE EMPRESAS
Índice

Tratamiento de datos
Estadísticos descriptivos
PREPARAR LA MUESTRA PARA HACER LOS CÁLCULOS

Exportar datos desde Excel a SPSS


PREPARAR LA MUESTRA PARA HACER LOS CÁLCULOS
Ir a vista de variables y revisarlas
PREPARAR LA MUESTRA PARA HACER LOS CÁLCULOS
Ir a vista de las variables y revisarlas

Variables cuantitativas y cualitativas


-Cuantitativas: escala. Pueden ser discretas -las que solo
pueden asumir una cantidad finita de valores-, y las
continuas -las que pueden asumir una cantidad infinita de
valores-.
-La variables cualitativas se dividen en nominales y
ordinales. Las nominales se refieren a atributos que no
tienen un orden como color, sexo y las ordinales
representan un orden o jerarquía.

La naturaleza de las variables utilizadas condiciona el


análisis estadístico de los datos

https://www.youtube.com/watch?v=BkSHNKjARYU
VARIABLE DEPENDIENTE

VARIABLES ABREVIATION MEASUREMENT SOURCE


ALLIANCE Dummy: Firm has cooperated on R&D
R&D alliances PITEC 2007
2007 during 2005-2007: value 1: yes; value 0: no

VARIABLES CONTROL

VARIABLES ABREVIATION MEASUREMENT SOURCE


Adapted from
Belderbos et
Categorical variable: value 1 for small firms al. (2004);
(less than 50 employees); value 2 for López (2008)
Size SIZE medium-size firms (between 50 and 500 and López-
employees) and value 3 for large firms Fernández et
(more than 500) al. (2008)
PITEC 2006,
2007
Categorical variable: value 0: industrial &
PITEC 2006,
Sector SECTOR agriculture (CNAE93: 1-45) and value 1:
2007
service sector (CNAE93: 50-92).
VARIABLES INDEPENDIENTES
VARIABLES MEASUREMENT SOURCE

Adapted from
Total innovation expenditures in 2006 Belderbos et al. (2006)
PITEC 2006
INNOVACIÓN
Adapted from
Number of R&D personnel in 2006 Belderbos et al. (2004)
PITEC 2006
Importance of competitors as source of knowledge for the firm’s
innovation process during 2004-2006 (values 1 to 4: 1 no important– 4
high)
Importance of customers as source of knowledge for the firm’s
innovation process during 2004-2006 (values 1 to 4: 1 no important– 4
high)
Adapted from
Importance of suppliers as source of knowledge for the firm’s
Belderbos et al. (2004)
SPILLOVER* innovation process during 2004-2006 (values 1 to 4: 1 no important– 4
and López (2008)
high)
PITEC 2006
Average of importance of universities, innovation centres, and
research institutions as source of knowledge for the firm’s innovation
process during 2004-2006 (values 1 to 4: 1 no important– 4 high)
Average of importance of patents, databases, trade literature and fairs
as source of knowledge for the firm’s innovation process during 2004-
2006 (values 1 to 4: 1 no important– 4 high)
CREAR VARIABLES O PREPARAR LAS VARIABLES
Crear a partir de una variable otra: por ejemplo, la variable tamaño puede ser
continua o bien categórica para clasificar a las empresas en pequeñas, medianas
y grandes.
En SPSS: con la variable tamaño 2006 crear una categórica
PREPARAR LA MUESTRA PARA HACER LOS CÁLCULOS

Valores perdidos:

- La consecuencia depende de su patrón de distribución, de


la cantidad de valores y de la causa de pérdida.

Tratamiento de los valores perdidos:


- Si los valores siguen un patrón:
- No hay medios estadísticos conocidos para reducir el número
de valores perdidos
- No es posible generalizar los resultados

- Si los valores son aleatorios. Problema menor con dos opciones:


- Eliminar todos los casos con un valor perdido
- Imputar un valor estimado
PREPARAR LA MUESTRA PARA HACER LOS CÁLCULOS

Eliminar todos los casos con un valor perdido:


- Procedimiento por defecto en los programas estadísticos

- Se puede perder mucha información

- Especial cuidado en los análisis basados en análisis de varianzas-


covarianzas, correlaciones

- Se puede eliminar selectivamente en cada análisis sólo los casos con datos
faltantes. Esto genera problemas por el continuo cambio de tamaño muestral

Imputar valores en los datos perdidos:

- Lo más utilizado es imputar la media:


Procedimiento conservador
La media no cambia pero la varianza se reduce
PREPARAR LA MUESTRA PARA HACER LOS CÁLCULOS

Valores atípicos (outliers):

- Aquellos casos que una, dos o más variables toman valores extremos que
difieren del comportamiento del resto de la muestra y hacen sospechar de
que han sido generados por mecanismos distintos.

- Consecuencias:
- Distorsionan los resultados
- Suelen afectar a la normalidad
- Causas:
- Errores en los datos (recogida e introducción)
- Errores por parte del encuestado
- Errores de muestreo (introducir en la muestra un individuo que no
pertenece a la población)
- Outliers verdaderos: casos que pertenecen a la población objeto
de estudio y que realmente difieren del resto por la variabilidad
inherente
PREPARAR LA MUESTRA PARA HACER LOS CÁLCULOS

¿Qué hacer con los valores atípicos?

- Si es un error evidente es conveniente corregirlo o eliminarlo

- Error en la introducción de los datos: buscar el original y corregirlo

- Error en el registro:
- Volver a registrarlo
- Si no se puede: cambiarlo por el valor medio o tomar
logaritmos o hacer alguna transformación que simetrice los
datos.
ANÁLISIS DESCRIPTIVOS
ANÁLISIS DESCRIPTIVO DE DATOS: ESTADÍSTICA UNIVARIABLE
Se trata de obtener una descripción de la realidad analizada

-Distribuciones de frecuencias (para toda clase de variables, tanto métricas


como no métricas). Conocer el número de individuos que, tanto en valores
absolutos como en términos relativos (es decir, porcentuales) han citado cada
una de las posibles respuestas que puede tomar la variable que estamos
analizando. Representación gráfica mediante histogramas, diagramas de barras o
de sectores

-Estadísticos descriptivos (algunos de ellos sólo para variables métricas).


Indicadores (o medidas) que “resumen” la información contenida en la
distribución de dispersión.

- Distribución estadística de la variable (para toda clase de variables).


https://www.youtube.com/watch?v=m4kimPxXzvE
ANÁLISIS DESCRIPTIVOS
DISTRIBUCIONES DE FRECUENCIAS

Ver frecuencias de las variables: alianzas, sector y tamaño


ANÁLISIS DESCRIPTIVOS

ESTADÍSTICOS DESCRIPTIVOS – MEDIDAS DE


CENTRALIZACIÓN
MEDIANA: valor de la distribución que divide la muestra en dos
partes iguales.

MODA: valor de la respuesta más citada (categoría con mayor


número de casos)

MEDIA ARITMÉTICA: cociente entre la suma de cada valor de la


variable y el número total de individuos.
ANÁLISIS DESCRIPTIVOS

ESTADÍSTICOS DESCRIPTIVOS – MEDIDAS DE DISPERSIÓN


Conocer el grado de variabilidad de la distribución de frecuencias de la variable analizada.
A mayor grado de variabilidad, menos representativas son las medidas de centralización.

DESVIACIÓN TÍPICA: raíz cuadrada de la varianza.

RECORRIDO o RANGO: diferencia entre el valor máximo y el valor mínimo de los valores
de la variable.

COEFICIENTE DE VARIACIÓN: cociente entre la desviación típica y la media aritmética.


Suele expresarse en porcentaje. A mayor valor del coeficiente de variación mayor
heterogeneidad de los valores de la variable.
ANÁLISIS DESCRIPTIVOS
ASIMETRÍA Y CURTOSIS
Aplicar en variables cuantitativas. Ver normalidad de la variable
Histograma: ¿Está ajustada la curva al histograma? ¿Qué forma tiene?

Asimetría (distribución alrededor de la media)


Si tiende a cero, simétrica
Si es mayor que 0: positiva
Si es mejor que 0: negativa

Curtosis (concentración de valores en la región central)


Si tiende a cero, forma de campana: mesocúrtica
Si es mayor que cero: leptocúrtica
Si es mejor que cero: platicúrtica

Asimetría y curtosis de +/- 0,5: tiende a tener una distribución normal. Verificar
con test de normalidad
Fuente: https://www.youtube.com/watch?v=HuLdLz8WjQ0
ANÁLISIS DESCRIPTIVOS
DISTRIBUCIÓN ESTADÍSTICA DE LA VARIABLE
(Test de normalidad)
Test de Kolmogorov-Smirnov (N>50) / Shapiro Wilk (N<50)

Hipótesis nula (H0): La variable analizada Xi sigue la distribución normal.


https://www.youtube.com/watch?v=phY8Z9-TXCY

Si el valor de la Significación Asintótica (p-valor) es menor de 0,05 se


rechaza la hipótesis nula (al 95% N.C.). De manera similar, se hace para p-
valores menores de 0,01 (al 99%N.C.) o de 0,10 (al 90% N.C.).

SPPS: analizar, estadísticos descriptivos, explorar… gráficos de normalidad


con pruebas

https://www.youtube.com/watch?v=8hqupjj5wu0
ANÁLISIS DESCRIPTIVOS
DISTRIBUCIÓN ESTADÍSTICA DE LA VARIABLE
ANÁLISIS DESCRIPTIVOS
ANÁLISIS DESCRIPTIVO DE DATOS: ESTADÍSTICA BIVARIABLE
Se trata de detectar posibles asociaciones entre dos variables cualesquiera X1 y
X2

Tablas de contingencia
Prueba de la Chi-cuadrado
Análisis de Correlaciones

Contraste de medias
Análisis de la Varianza
(ANOVA)
ANÁLISIS DESCRIPTIVOS
ESTADÍSTICA BIVARIABLE: TABLAS DE CONTINGENCIA
- Analizan la distribución de la frecuencia conjunta de dos (o más) variables no
métricas X1 y X2. Se analiza el nivel de asociación existente entre X1 y X2.

El estadístico de la chi-
cuadrado (o jicuadrado)
compara la distribución
observada con la distribución
teórica de cada variable. La
hipótesis nula es que hay Si el test es significativo, se rechaza la
independencia/no asociación hipótesis nula. Po lo que se puede decir
entre las variables X1 y X2. que las variables están relacionadas.
https://www.youtube.com/watch?v=DX3Fe3l6vK8
https://www.youtube.com/watch?v=IQuXV1K5DqA
ANÁLISIS DESCRIPTIVOS
ESTADÍSTICA BIVARIABLE: CORRELACIONES
Intensidad de la relación de asociación existente entre dos
variables. Suponen una relación de asociación lineal.
Los coeficientes de correlación pueden estar entre –1 (valor mínimo
que expresa una relación inversa perfecta) y +1 (valor máximo que
refleja una relación directa perfecta).

-MEDIDAS DE CORRELACIÓN: TIPOS


-Coeficiente de correlación de Pearson (para variables métricas
de razón normalmente distribuidas).
https://www.youtube.com/watch?v=1qkAU--IK8Y
-Coeficiente Rho de Spearman (no paramétrica para datos
ordinales o de intervalo que no están normalmente distribuidos)
-Coeficiente Tau-b de Kendall (no paramétrica para categorías
ordenadas)
ANÁLISIS DESCRIPTIVOS
ESTADÍSTICA BIVARIABLE: CONTRASTES

Fuente: https://www.youtube.com/watch?v=W6fuVCGGK8I
ANÁLISIS DESCRIPTIVOS
ESTADÍSTICA BIVARIABLE: CONTRASTES DE MEDIAS
CONTRASTES DE MEDIAS: OPCIONES

-Prueba T para muestras independientes: comparar los valores promedios de una


determinada variable X1 en dos grupos de casos
(https://www.youtube.com/watch?v=naVYkIZTF-4)

- Prueba T para muestras relacionadas: comparar los valores promedios de dos


variables X1 y X2 de un mismo grupo
(https://www.youtube.com/watch?v=4J0sA7WOdQM)

- Prueba T para una muestra: comparar si el valor promedio de una determinada


variable X1 en un determinado grupo difiere de una constante especificada
(https://www.youtube.com/watch?v=Q_8uJ7uAQI0)

Ver contraste de medias para la variable tamaño


ANÁLISIS DESCRIPTIVOS
ANÁLISIS PREVIOS
Normalidad y homoscedasticidad (https://www.youtube.com/watch?v=73M6FaDj3ik)

Fuente: https://www.youtube.com/watch?v=W6fuVCGGK8I
ANÁLISIS DESCRIPTIVOS
ANÁLISIS DESCRIPTIVOS

Levene: significativa al 90%. Se rechaza la igualdad de varianzas. No se cumple


homoscedasticidad

Prueba t para no varianzas iguales: no es significativo. Se acepta Ho: no existe


diferencia significativa entre grupos (innovan o no organizativamente) para la cifra de
negocios en 2006
ANÁLISIS DESCRIPTIVOS
ESTADÍSTICA BIVARIABLE: ANÁLISIS DE LA VARIANZA (ANOVA)

Se trata de un método explicativo: Analiza la relación de dependencia de la


variable X2 respecto a la variable X1. Variable dependiente (X2) es cuantitativa
siempre. Variable independiente (X1) es cualitativa siempre (más de dos
poblaciones).
Hipótesis nula: Las medias poblacionales son iguales

-El Análisis de la Varianza es robusto a las desviaciones de la normalidad (de X1 y


X2)
- Los grupos han de proceder de poblaciones con varianzas iguales (Prueba de
Levene de homogeneidad de varianzas. Ver
https://www.youtube.com/watch?v=73M6FaDj3ik
ANÁLISIS DESCRIPTIVOS
ESTADÍSTICA BIVARIABLE: ANÁLISIS DE LA VARIANZA (ANOVA)

ANOVA de un factor: una variable cuantitativa (dependiente) y otra cualitativa


(factor). Analizar si las medias poblacionales son iguales (estadístico F).
Normalidad y homoscedasticidad.

https://www.youtube.com/watch?v=JNehPlR5jfo
ANÁLISIS DESCRIPTIVOS
ESTADÍSTICA BIVARIABLE: ANÁLISIS DE LA VARIANZA (ANOVA)

No acepto Ho
(Ho: Las varianzas
poblacionales son
homogéneas)
ANÁLISIS DESCRIPTIVOS
ESTADÍSTICA BIVARIABLE: ANÁLISIS DE LA VARIANZA (ANOVA)

La significatividad es 0,000
No se acepta la Ho
(H0: las medias poblacionales son iguales)
BIBLIOGRAFÍA
•CARLBERG, C (2011): Análisis estadístico con Excel, Anaya Multimedia,
Madrid.

•CEA D’ANCONA, M.A. (2004). Análisis multivariante. Teoría y Práctica en la


investigación social, Síntesis, Madrid.

•HAIR, J.F.; ANDERSON, R.; TATHAM, R. BLACK, W. (2004): Análisis


Multivariante, Prentice-Hall, Madrid.

•MARTÍN MARTÍN, Q.; CABERO MORÁN, T.; DE PAZ SANTANA, J.R. (2008):
Tratamiento estadístico de datos con SPSS. Paraninfo, Madrid. Disponible en
google libros
•PÉREZ LÓPEZ, C. (2009): Técnicas estadísticas multivariantes con SPSS,
Garceta, D.L.

•SARABIA, J.M.; PASCUAL, m. (2006): Curso Básico de Estadística para


Economía y Administración de Empresas, Universidad de Cantabria.
Disponible en google libros

Você também pode gostar