Você está na página 1de 15

Gua Nro.

03
4.2. Importar Archivos de Texto de Ancho Fijo
Para los archivos de Ancho Fijo el paso 4, presenta diferencias en la definicin
respecto a los archivos Delimitados, debido a las caractersticas de los datos. Para
identificar estas diferencias vamos a importar los datos del archivo ancho.dat.
Para abrir un archivo de texto de ancho fijo, debemos ir al men Archivo y
seleccionar la opcin Leer datos de texto, con lo que surge la ventana de
navegacin.
Seleccionamos el archivo correspondiente a Datos [*.dat] [Fig.3-49] y hacemos
clic en Abrir, con lo que aparece el cuadro de dilogo del Asistente para la
importacin de texto [Fig.3-50].

Figuras 3-49 y 3-50


Este cuadro contiene las mismas caractersticas del cuadro obtenido con
el archivo Delimitado, la nica diferencia que se puede resaltar se presenta en la
visualizacin del archivo. Si nos fijamos en la vista de datos, notaremos que dentro
de la informacin no aparece un carcter de separacin, por lo que los datos de
cada variable son de difcil identificacin. Dado que no se cuenta con
un archivo de formato predefinido para archivos de ancho fijo, seleccionaremos
la opcin NO y sucesivamente hacemos clic en Siguiente, con lo que aparece el
cuadro de dilogo correspondiente al paso 2 de 6 [Fig.3-51].
La segunda pregunta del asistente corresponde a Estn incluidos los nombres de
las variables en la parte superior del archivo?, si nos fijamos nuevamente en el
visor de datos, notaremos que los nombres no estn incluidos en la primera fila;
generalmente este tipo de archivos no incluyen el nombre de las variables dentro
de los datos. Para continuar con la extraccin, activamos la opcin Ancho fijo en
la primera pregunta y la opcin No en la segunda.

Docente: Ing. Shirley R. Velazque Rojas.

Figuras 3-51 y 3-52


Una vez determinado el formato del archivo hacemos clic en Siguiente, con lo
que aparece el cuadro de dilogo correspondiente al paso 3 de 6 [Fig.3-52], en
este
paso
se
definen
las opciones de
los
casos.
Dentro
de
estas opciones encontramos En qu nmero de lnea comienza el primer caso
de los datos?, Cuntas lneas representan un caso? y Cuntos casos desea
importar?.
La primera fila de datos debe ser por lgica el lugar en donde comiencen los
datos, ya que en el paso anterior definimos que los nombres de las variables no se
incluan en la primera fila. Para determinar cuntas filas representan un caso, es
necesario dirigirnos al final de las lneas empleando la barra de desplazamiento
horizontal que aparece en la vista previa de datos y tratar de observar si cada
una de las filas cuenta con una longitud aproximadamente igual; en nuestro
ejemplo cada fila representa un caso.
Despus de establecer las opciones de los casos hacemos clic en Siguiente, con
lo que aparece el cuadro de dilogo correspondiente al paso 4 de 6 [Fig.3-53], en
donde se definen las posiciones de las variables. En este paso se hacen evidentes
las diferencias entre los dos formatos (Delimitado y Ancho fijo). SPSS suele utilizar
lneas de corte para definir el ancho de cada variable, ubicando una lnea en la
columna de inicio y otra al finalizar la variable. Cada una de estas lneas debe ser
ingresada por el usuario, ya que el programa no tiene la capacidad de identificar
las variables.

Docente: Ing. Shirley R. Velazque Rojas.

Figura 3-53
Si nos fijamos en la parte superior del cuadro, notaremos que aparecen las
instrucciones de cmo utilizar las lneas de corte; dentro de estas instrucciones
encontramos los procedimientos de como modificar insertar o eliminar lneas. Las
lneas deben ser ingresadas y editadas en la vista previa de datos; para facilitar la
ubicacin de cada lnea, el asistente incluye un indicador de columna en la parte
superior de la Vista previa de datos, el cual esta estipulado de 10 en 10 y con unas
marcas de identificacin para cada nmero de lnea intermedio [Fig.3-54].

Figura 3-54
Note como cada una de las marcas de indicacin se ubican directamente en la
zona intermedia de cada uno de los datos. Para ingresar una nueva lnea, se
debe ubicar el puntero del ratn entre dos valores de datos y hacer clic, con lo
que aparece en la zona intermedia una nueva lnea. Para eliminar una lnea,
basta con hacer clic en la punta de la flecha, con lo cual desaparece. Para
mover una lnea, se debe seleccionar haciendo clic sobre ella y manteniendo el
botn del ratn oprimido correrla hasta el lugar donde se desee ubicar; al soltar el
botn del ratn la lnea se queda esttica.
Antes de ingresar las lneas de corte, es necesario conocer como estn
estipuladas las variables en el archivo. Para disminuir el tamao del diccionario de
datos, slo expondremos la informacin perteneciente a las seis variables de
inters; esta informacin se encuentra en la tabla de la figura [3-55].

Docente: Ing. Shirley R. Velazque Rojas.

Si nos fijamos en los datos de la tabla, notaremos que las variables que
extraeremos corresponden al nmero de encuesta (Columnas de la 1 a la 4),
Ciudad (columna 2), Gnero (columna 6), Edad (columnas 9 y 10), Estado civil
(columna 28) y Nivel de educacin (Columna 30). Esta informacin debe ser
generada por el creador del archivo, aunque algunos programas la proporcionan
en el momento de formarlo. Para entender la posicin de forma ms clara
observemos la figura [3-56], en la cual aparece el nmero de la columna en la
parte superior.

Figura 3-55

Figura 3-56
Una vez establecidas cada una de las columnas que ocupan las variables,
debemos introducir en la vista previa de datos las lneas de corte
correspondientes al inicio y el final de cada variable de inters. Los datos
ubicados en las columnas 7 y 8, 11 a 27 y las superiores a 30 no se deben
considerar como informacin prdida, ya que estas columnas corresponden a
variables que no deseamos importar y por lo tanto las omitimos en la tabla del
diccionario de datos. Continuando con ejemplo, procedemos a introducir las
lneas de corte correspondientes a cada una de las variables de inters.

Figura 3-57
En el paso 5, debemos definir el nombre y el formato de cada una de las
variables, as como especificar las variables que deseamos importar.

Docente: Ing. Shirley R. Velazque Rojas.

Si nos fijamos en la vista previa de datos, notaremos que el programa a


reconocido diez (10) diferentes variables, las cuales identifica con la letra V y le
asigna un nmero de acuerdo a la ubicacin que tenga dentro del archivo (V1,
V2, V3,..., V10). Para continuar con la extraccin de los datos, vamos a definir el
nombre y el formato de datos para las variables de inters. Con el nimo de
facilitar la interpretacin de los nombres y formatos, se anexa la tabla de la figura
[3-59]; en esta tabla encontramos la ubicacin de la variable (V1, V2, etc.), el
nombre que le asignaremos y el formato al que corresponde.

Figuras 3-58 y 3-59


Las variables V4, V6, V8 y V10, no las importaremos ya que contienen informacin
que no requerimos. Para evitar que estas variables sean importadas, es necesario
especificrselo al programa, por lo que debemos sealarlas y en la
casilla formatos
escoger
la
opcin No
importar [Fig.3-61].
Este procedimiento debe realizarse con cada una de las variables que no
deseamos importar.

Figuras 3-61
Despus de asignarle el nombre y el formato a cada una de las variables de
inters y definir las variables que no deseamos importar, hacemos clic en el botn
Siguiente con lo que aparece el cuadro de dilogo correspondiente al paso 6 de
6 [Fig.3-62]. Este cuadro es igual al generado para las variables delimitadas. Si nos
fijamos en la vista previa de datos observaremos que las variables V4, V6, V8 y
V10, aun estn presentes, esto se debe a que el programa no ejecuta la
importacin hasta hacer clic en Finalizar. Para terminar la importacin

Docente: Ing. Shirley R. Velazque Rojas.

hacemos clic en finalizar de manera que la informacin aparece en el editor de


datos [Fig.3-63].

Figuras 3-62 y 3-63


4.3. Importar Bases de Datos a SPSS
De igual manera que en los formatos anteriores, SPSS nos permite importar
informacin procedente de diferentes programas de bases de datos como
Access, Foxpro, dBase, etc. Con la nica condicin que el programa sea
compatible con los controladores ODBC. Para comprender la metodologa que
se debe emplear en la importacin de informacin proveniente de archivos de
Bases de datos, vamos a Extraer la informacin del archivo Basetelemerca.mdb.

Para importar la informacin de los archivos de bases de datos, debemos ir al


men Archivo y seleccionar la opcin Abrir bases de datos [Fig.3-64], donde
encontraremos tres posibilidades Nueva consulta (Esta opcin nos permite definir
la fuente [Programa y Nombre del archivo] y los datos [Variables y casos], del
archivo de origen); Editar consulta (Con esta opcin podemos modificar los
parmetros de una consulta creada con anterioridad); y Ejecutar consulta (esta
opcin nos permite importar de forma directa la informacin de un archivo,
utilizando los parmetros establecidos en una consulta previamente creada).
Para poder utilizar las opciones Editar y Ejecutar es necesario haber definido y
guardado una consulta con anterioridad. Dado que es la primera vez que
trabajamos con archivos de base de datos debemos crear una nueva consulta,
por lo tanto escogemos la primera opcin, con lo cual se abre el cuadro de
dilogo correspondiente al Asistente para bases de datos [Fig.3-65], quien nos
guiar durante todo el proceso de definicin de los datos.

Docente: Ing. Shirley R. Velazque Rojas.

Figuras 3-64 y 3-65


Este asistente se compone de seis pasos, a travs de los cuales se definen las
caractersticas de la informacin contenida en el archivo:
Primer Paso:
Especificar el origen o fuente de los datos; para especificar el origen de los datos,
SPSS nos ofrece dos posibilidades; la primera es aadir una nueva fuente de datos
y la segunda es elegir una de las fuentes existentes en el listado de formatos.
Para definir una nueva fuente de datos, debemos hacer clic en el botn Aadir
fuente de datos, con lo que surge un nuevo cuadro de dilogo denominado
Administrador de orgenes de datos ODBC [Fig.3-66]; esta aplicacin no hace
parte del paquete SPSS, sino que es una funcin del sistema operativo Windows.
Est administrador se utiliza para definir el nombre del archivo y el programa de
origen, pero requiere que el controlador ya se encuentre instalado en el
ordenador.
El administrador esta compuesto por siete opciones; cada una de ellas se utiliza
dependiendo de las caractersticas del archivo. Por el momento nos
concentraremos en la pestaa DSN de usuario donde se agregan, eliminan o
configuran los orgenes de datos locales, a los cuales slo se puede tener acceso
si los datos se encuentran en alguno de los discos duros o extrables del equipo.

Docente: Ing. Shirley R. Velazque Rojas.

Figuras 3-66 y 3-67


Para continuar con
el
ejemplo
vamos
a
definir
el
archivo Basetelemerca.mdb como un nuevo origen de datos; para lograrlo,
debemos hacer clic en el botn Agregar de la pestaa DSN de usuario, con lo
que aparece el cuadro de dilogo correspondiente a Crear nuevo origen de
datos (Fig.3-67). En este cuadro encontramos un listado de los controladores de
bases de datos con que cuenta nuestro ordenador (el listado puede variar de
acuerdo al nmero de controladores que se tengan instalados).
Dentro de este listado vamos a ubicar el controlador correspondiente a Microsoft
Access Driver (*.mdb), el cual como su nombre lo indica, nos permite abrir los
archivos creados en Microsoft Access.
Despus de ubicarlo, lo seleccionamos y posteriormente hacemos clic en Finalizar;
con lo que aparece el cuadro de dilogo correspondiente a Configuracin de
ODBC Microsoft Access [Fig.3-68].
En este cuadro se definen las propiedades de la fuente, como el Nombre del
origen de datos, la Descripcin y la base de datos. La primera de estas
propiedades, nos permite asignarle un nombre a la fuente de datos que estamos
creando, con el fin de facilitar su reconocimiento dentro del listado.
Para continuar con el ejemplo le asignaremos el nombre Base.
La segunda propiedad (Descripcin), nos permite generar una pequea leyenda
para describir brevemente el contenido del archivo; esta descripcin es un
parmetro informativo para los futuros usuarios de esta consulta, donde le
indicar que tipo de datos se encuentran dentro de la informacin.
Para continuar con el ejemplo ingresaremos la frase Contactos telemercadeo.

Docente: Ing. Shirley R. Velazque Rojas.

Figuras 3-68
Dentro de las propiedades de bases de datos encontramos cuatro opciones
(Seleccionar, Crear, Reparar y Compactar), cada una de ellas genera un nuevo
cuadro de dilogo especfico cuya nica diferencia con respecto a los dems
radica en la funcin que realiza.
Para continuar con el ejemplo hacemos clic en botn Seleccionar; con lo que
aparece una nueva ventana de navegacin, la cual emplearemos para ubicar el
archivo Basetelemerca.mdb. Una vez localizado, lo seleccionamos y
hacemos clic en Aceptar con lo que aparecer en la parte superior de la
seccin Base de datos el nombre y la ubicacin del archivo [Fig.3-70]. Note como
despus de definir el archivo de origen, se activa el botn Aceptar y click en el.

Figuras 3-70 y 3-71


Volvemos al Administrador de orgenes de datos [Fig.3-71]; en donde aparece
la consulta que hemos creado con el nombre que le estipulamos (Base), si nos
fijamos en el controlador observaremos que aparece Microsoft Access
Driver(*.mdb); lo que nos indica que este es un acceso directo a la lectura
del archivo Basetelemerca creado en Access.
Para terminar la definicin de la nueva fuente de datos hacemos clic en Aceptar,
con lo que volvemos al Asistente para bases de datos de SPSS [Fig.3-72].

Docente: Ing. Shirley R. Velazque Rojas.

Figuras 3-72 y 3-73


Segundo Paso:
Ubicar dentro del listado de formatos el acceso al controlador Microsoft Access
Database. Una vez ubicado hacemos doble clic sobre l, de manera que
aparezca la ventana Acceso al controlador ODBC [Fig.3-73].
En este cuadro hacemos clic en el botn Examinar, con lo que surge una nueva
ventana
de
navegacin,
por
medio
de
la
cual
ubicamos
el archivoBasetelemerca.mdb. Despus de localizar el archivo, lo seleccionamos y
hacemos clic en Abrir.
Para finalizar hacemos clic en Aceptar apareciendo el cuadro de dilogo
correspondiente al paso 2 de 6 [Fig.3-74]. En este paso debemos definir las
variables de las diferentes tablas del archivo que deseamos importar.

Figuras 3-74 y 3-75


Seleccionar todas las variables de las tablasContactos y Tipos de contactos; para
realizarlo debemos hacer doble clic sobre las dos tablas, de manera que
aparezcan en la casilla de recuperacin todas las variables que contienen [Fig.377]. Despus de ingresar las variables hacemos clic en Siguiente.

Docente: Ing. Shirley R. Velazque Rojas.

Figuras 3-77 y 3-78


Tercer Paso:
Aparece el cuadro de dilogo correspondiente al paso 3 de 6 [Fig.3-78]; en este
paso debemos definir la relacin existente entre las variables de las dos tablas, por
defecto el programa relaciona las variables que tengan el mismo nombre en las
dos tablas; las variables restantes deben ser relacionadas en forma manual por el
usuario. La utilidad de este paso radica en la posibilidad de restringir dos variables
con el mismo contenido pero con nombres diferentes en las dos tablas.
La otra opcin que nos ofrece este paso la encontramos en la parte inferior del
cuadro y corresponde a Unir tablas automticamente. Esta opcin por defecto se
encuentra activa y su utilidad radica en formar como resultado un slo archivo de
datos. Dado que en nuestro caso las variables restantes no tienen ningn tipo de
relacin y la opcin unir tablas se encuentra activa, hacemos clic en Siguiente.
Cuarto Paso:
Aparece el cuadro de dilogo correspondiente al paso 4 de 6 [Fig.3-79]; en este
paso el asistente nos brinda la posibilidad de limitar la informacin de las variables
que ser importada, mediante dos mtodos diferentes. El primero de ellos,
consisten en restringir los casos por medio de ecuaciones de comparacin
(Aritmtico lgicas) y la segunda opcin es por medio del muestreo aleatorio.

Figura 3-79

Docente: Ing. Shirley R. Velazque Rojas.

Si deseamos definir una o varias funciones de comparacin, es necesario


ingresarlas en la seccin Criterios, cumpliendo con los requisitos estipulados por
SPSS para cada uno de los campos. Dentro de los criterios de comparacin
encontramos;

Expresin 1 en este campo se introduce un valor numrico o una de las


variables del archivo.
Relacin, es una funcin matemtica de comparacin entre dos
expresiones; podemos utilizar relaciones como igual (=); menor que (<),
mayor que (>), menor o igual que (<=), mayor o igual que (>=) y diferente de
(<>).
Expresin 2 en este campo se introduce un valor numrico o una de las
variables, teniendo en cuenta que la comparacin entre dos nmeros no es
de utilidad.
Conector, este campo une la relacin (Expresion1 + Relacin + Expresin2)
ubicada en su fila con la relacin de la fila inmediatamente anterior; por este
motivo la primera casilla de los conectores no esta habilitada. En las
ecuaciones podemos utilizar dos tipos de conectores correspondientes a la
funcione lgicas AND (Y) OR (O).

Vamos a pedirle al asistente que slo importe los casos que satisfagan la
condicin (empresas comercializadoras cuyo contacto no sea a travs de
referidos).
Lo primero que debemos hacer es identificar las variables que se involucran en el
criterio de seleccin; en nuestro caso emplearemos las variables IdTipoContacto y
Tipo de cuenta. La variable IdTipoContacto tiene 2 valores representativos
(Referido = 1 y Telemercadeo = 2); mientras que la variable Tipo de cuenta puede
tomar los valores (Comercializadora = COM, Manufactura = MANU Y Financiera =
FIN). Note que los datos en esta variable corresponde a letras, esto se debe a que
dentro del archivo original se definieron estos valores.
La expresin debe quedar (IdTipoContacto > 1 AND Tipo de cuenta = COM).
Ingresamos la ecuacin, con lo cual la ecuacin debe quedar igual a la figura [380] y [3-81].

Figuras 3-80 y 3-81

Docente: Ing. Shirley R. Velazque Rojas.

SPSS tambin nos permite limitar la recuperacin de casos por medio de un


muestreo aleatorio, ya sea por medio de un porcentaje o un nmero especfico
de casos. Esta opcin puede ser utilizada junto a los criterios de seleccin o
directamente sobre el total de los casos.
Quinto Paso:
Click en Siguiente de manera aparece el cuadro de dilogo correspondiente al
paso 5 de 6 [Fig.3-82], donde definiremos los nombres y tipos de variables. En este
cuadro encontramos tres columnas; la primera corresponde al nombre de la
variable de resultado, tipo de variable, etiquetas de valor (recodificar como
numrica), en donde al programa nos permite convertir los valores de una
variable alfanumrica (Cadena), en etiquetas de valor;

Figuras 3-82 y 3-83


Para continuar con el ejemplo, elegiremos la opcin Etiquetas de valor para las
variables Tipo de contacto, tipo de cuenta, Ciudad, Volumen y Cargo.
Sexto Paso:
Click en Siguiente con lo que aparece el cuadro de dilogo correspondiente al
paso 6 de 6 [Fig.3-83], en donde hallamos las opciones de resultados.
Para agilizar el proceso, seleccionamos la opcin Recupere los casos.
Guardar (si es necesario) la consulta en la carpeta Mis documentos con el
nombre Ejemplo y clic en el botn Finalizar, con lo que la importacin se realiza y
los datos son expuestos en el editor de datos de SPSS [Fig.3-84]. Al igual que los
ejemplos anteriores, es necesario guardar el archivo resultante y definir
las propiedades de las variables, antes de obtener un archivo de datos completo.

Docente: Ing. Shirley R. Velazque Rojas.

Figura 3-84
Para finalizar con la importacin de archivos de bases de datos, vamos a utilizar la
consulta que hemos guardado en el ltimo paso. Para realizarlo nos dirigimos al
men Archivo, escogemos la opcin Abrir base de datos y dentro de ella
seleccionamos la opcin Ejecutar consulta, con lo que se abre una nueva
ventana de navegacin [Fig.3-85].

Figura 3-85
Por medio de esta ventana ubicamos el archivo Ejemplo.spq dentro de la carpeta
Mis documentos y posteriormente hacemos clic en Abrir con lo que la informacin
ser importada y representada en el editor de datos. La utilidad de guardar las

Docente: Ing. Shirley R. Velazque Rojas.

consultas radica en la posibilidad de importar la informacin actualizada de una


base de datos, de forma directa sin necesidad de definir nuevamente todos los
parmetros del archivo.

Docente: Ing. Shirley R. Velazque Rojas.

Você também pode gostar