Você está na página 1de 5

TIPOS DE DATOS

Las variables se dividen en cualitativas (las que representan atributos o


características no cuatificables) y cuantitativas (las que representan
características cuantificables).

Variables Cualitativas o Atributos: Es el resultado de un proceso que categoriza


(clasifica) o describe un elemento de una población. Las operaciones aritméticas,
como sumar y obtener promedios, no son significativos para datos que resultan
de una variable cualitativa. Generalmente de este tipo de variables se describe
normalmente en palabras y no en forma numérica, porque difiere en clase y no
en grado entre unidades elementales.

Las variables cualitativas pueden ser a su vez, binomiales o multinomiales.

Las variables cualitativas se dividen en nominales y ordinales.


Las variables cualitativas nominales se refieren a atributos que no se pueden
representar con números, como color, sexo, lugar de nacimiento, preferencias
de marca, etc.

Las variables cualitativas ordinales representan un orden o jerarquía. Aunque


pueden usarse números para representarlas, estos solo indican el orden o
"puesto" dentro de un conjunto ordenado. Ejemplos: el orden de nacimiento
dentro de un grupo de hermanos, el orden en que llegaron los participantes en
una competencia, el puesto en el cuadro de honor en un grupo de alumnos, etc.

 Variable Cualitativa Binomial: Se pueden hacer observaciones sobre este


tipo de variables en sólo dos categorías; por ejemplo, hombre o mujer,
empleado o desempleado, correcto o incorrecto, defectuoso o
satisfactorio, elegido o no elegido, ausente o presente.
 Variable Cualitativa Multinomial: Se pueden hacer observaciones en más
de dos categorías. Por ejemplo puesto, colores, idiomas, religiones, tipos
de negocios, etc.

1. Categóricos (Cualitativos) representan categorías, conteo más que


números, Los atributos categóricos o cualitativos siempre son discretos,
Un Atributo Discreto tiene un número finito o contable de valores. En
general se representa como números enteros. Atributos binarios son un
caso especial de ellos.

Se dividen a su vez en:

 Nominales, No tienen orden significativo. Podemos realizar


operaciones de igualdad o desigualdad.
Ejemplo: Sexo {M,F}, Color de los Ojos, ID_Number
Operaciones: Moda, Entropía, Correlación.

 Ordinales, Tienen orden definido. Se puede realizar


igualdades, desigualdades, mayor y menor que.
Ejemplo: {Bueno, Regular, Malo}, Notas, Números de Calles
Operaciones: Media, Percentiles, Correlación

Hay que tener cuidado ya que existen atributos que pueden parecer numéricos
pero son categóricos como un código postal o un número de teléfono, hay que
notar que no tiene sentido que dos códigos postales sean sumados o sacar el
promedio de varios números de teléfono, por eso son categóricos.

2. Numéricos (Cuantitativos) son atributos que son número y pueden ser


tratados como tal, representan medidas Los atributos numéricos pueden
ser continuos o discretos. Un Atributo Continuo tiene un número infinito
de valores posibles. Es representado por números reales o de punto
flotante. Se pueden obtener tan precisos como sea el instrumento de
medición.

Numéricos (Cuantitativos) son atributos que son número y pueden ser tratados
como tal, representan medidas Los atributos numéricos pueden ser continuos o
discretos. Un Atributo Continuo tiene un número infinito de valores posibles. Es
representado por números reales o de punto flotante. Se pueden obtener tan
precisos como sea el instrumento de medición.

Las variables cuantitativas se dividen el discretas (las que solo pueden asumir
una cantidad finita de valores), y las continuas (las que pueden asumir una
cantidad infinita de valores).

 Variable Cuantitativa Discreta: Estas variables pueden tomar valores sólo


en puntos específicos de una escala, con intervalos entre ellos; tales datos
difieren entre sí por pasos definidos claramente. Considérese observar: el
número de hijos en las familias, de empleados en empresas, de
estudiantes en grupos, de recámaras en casas, de carros en existencia,
de vacas en pastizales. De modo invariable, los datos individuales están
desconectados uno de otro por intervalos en la escala de valores; se verán
como números enteros pero nunca como decimales. Las variables
cuantitativas continuas provienen de hacer mediciones. Por ejemplo:
estatura, peso, longitud de un objeto, volumen, ingresos personales o
familiares, distancias, etc.

 Variable Cuantitativa Continua: Una variable de este tipo pueden tomar


valores en todos los puntos de una escala, sin intervalos entre valores
posibles. Considérese la altura, longitud, volumen o peso, temperatura,
tiempo, sueldo de un empleado. El peso podría reportarse como 45 o 48
Kg, pero también como 45.8 Kg. o incluso como 48.855 Kg.

Se dividen a su vez en:

 Intervalo, no existe un 'cero', la división no tiene sentido. Se


pueden hacer operaciones de igualdad, desigualdad, de
orden, sumas y restas.
Ejemplo: Fechas, Temperatura
Operaciones: Desviación Estándar, Mediana, Correlación,
Max, Min

 Radio, el cero existe, división tiene sentido. Podemos


realizar operaciones que tiene intervalo y además
multiplicación y división.
Ejemplo: Teléfono, Numero de Llamadas, Precio, Edad,
Notas
Operaciones: Media geométrica, Media Armónica, Max, Min

Calidad de los Datos

¿Qué tipo de problemas de calidad de datos?

¿Cómo podemos detectar problemas en los datos?

¿Qué podemos hacer con estos problemas?

Ejemplos de problemas de calidad de datos:

1. El ruido y los valores extremos (Outliers): El ruido se refiere a la modificación


de los valores originales Ejemplos: distorsión de la voz de una persona cuando
se habla en un teléfono pobres y "nieve" en la pantalla del televisor

Los valores extremos (Outliers): Son los objetos de datos con las características
que
son considerablemente diferente de la mayoría de los otros
objetos de datos en el conjunto de datos

2. Los valores perdidos: Razones de los valores perdidos


No se recoge información por ejemplo, las personas se niegan a dar a su edad
y peso)

Los atributos pueden no ser aplicables a todos los casos


(por ejemplo, el ingreso anual no es aplicable a los niños)
Manipulación de los valores perdidos
- Eliminar objetos de datos
- Estimar los valores perdidos
- Ignorar el valor que falta durante el análisis
- Vuelva a colocar con todos los valores posibles (ponderado por su
probabilidades))

3. Datos duplicados: El mayor problema al combinar datos de otras fuentes

1. Categóricos (Cualitativos) representan categorías, conteo más que


números, Los atributos categóricos o cualitativos siempre son discretos,
Un Atributo Discreto tiene un número finito o contable de valores. En
general se representa como números enteros. Atributos binarios son un
caso especial de ellos

http://www.dataprix.com/rapidminer-tutorial-online-operadores

OPERADORES DE TRANSFORMACION

1. Nominal to Numerical : Este operador cambia el tipo de atributos no


numéricos seleccionados a un tipo numérico. También los mapas de
todos los valores de estos atributos a valores numéricos. Valores de los
atributos binarios se asignan a 0 y 1.
2. Numerical to Polynominal : Este operador cambia el tipo de atributos
numéricos seleccionados a un tipo de polinomio. También los mapas de
todos los valores de estos atributos a los correspondientes valores
polinómica. Este operador sólo cambia el tipo de atributos seleccionados;
si usted necesita un método de normalización más sofisticado por favor
utilice los operadores de discretización.
3. Numerical to Binominal : El operador numérico a Binominal cambia el tipo
de atributos numéricos a un tipo binominal (también llamado binario).
Atributos binominal pueden tener sólo dos valores posibles es decir,
'verdadero' o 'falso'. Si el valor de un atributo está entre el valor mínimo y
máximo especificado, se convierte en 'falso', de lo contrario "verdadero".
Los valores mínimos y máximos pueden ser especificados por el mínimo
y máximo respectivamente parámetros.

4. Nominal to Binominal : El nominal para el operador Binominal se utiliza


para cambiar el tipo de atributos nominales a un tipo binominal. Este
operador no sólo cambia el tipo de atributos seleccionados pero también
los mapas de todos los valores de estos atributos a valores binomial, es
decir, verdadero y lo falso. Por ejemplo, si un atributo nominal con 'costos'
de nombres y posibles valores nominales "bajo", "moderado" y "alto" se
transforma, el resultado es un conjunto de tres 'costos bajos =' atributos
binominal, "costes = moderada ', y' costos = Alta '. Sólo el valor de uno de
estos atributos es cierto para un ejemplo específico, el valor de los otros
atributos es falsa.

Você também pode gostar