Você está na página 1de 10

UNIVERSIDAD POPULAR DEL CESAR

FACULTAD DE INGENIERÍA Y TECNOLOGÍAS


INGENIERÍA DE SOFTWARE

TITULO

ANALISIS SOBRE LA VIOLENCIA INTRAFAMILIAR APLICANDO TÉCNICAS DE BIG DATA


ANALISIS VISUAL Y MACHINE LEARNING

DOCENTE

GILBERTO DULCEY CABALLERO

ESTUDIANTES

ERVIN YESID REDONDO DOMINGUEZ


SERGIO IVAN DIAZ BOLAÑOS

VALLEDUPAR
21/05/2019
INTRODUCCIÓN

Los actos violentos a nivel nacional, han generado un impacto muy negativo con respecto a
las familias y hogares establecidos en el territorio colombiano. Millones de personas han
sido víctimas de algún tipo de violación ocasionada tanto en los hogares como en las vías
públicas. Cualquier tipo de abuso de poder de parte de un miembro de la familia sobre otro
de manera repetitiva es considerado violencia. Ello incluye maltrato físico, psicológico o de
otro tipo.
En los últimos años se ha observado cómo, en Colombia, se han incrementado los casos de
maltrato infantil. El incremento anual de este índice es cada vez más impresionante y su
causante primordial, es la situación social actual, el desempleo, la necesidad de
desplazamiento forzado, los grupos armados, la corrupción, la pérdida de valores, el bajo
nivel socioeconómico y educativo y las condiciones de hacinamiento.
En el presente documento, se realizará un análisis poblacional de todas las denuncias
hechas por los ciudadanos, cual es la población(región) más afectada y cuál es el causante
clave para poder tomar decisiones de como disminuir y controlar esta problemática a corto,
mediano y largo plazo, mediante técnicas de análisis de datos.
ESTADO DEL ARTE

 (López Diana & Fernández Amaru, 2018). Aplicación en los medios de


prensa de un agrupamiento K-Means (Clustering K-Means).

El objetivo de este trabajo es determinar la cercanía lingüística entre distintos


medios de prensa nacionales e internacionales, aplicando un modelo no supervisado
de Agrupamiento K-Means sobre una base documental conformada por los
diferentes sitios web de medios de prensa digitales, que son: Agencia de Prensa
Francesa (afp.com), Prensa Argentina (argenpress.info), El Mercurio On-Line
(emol.com) y The Clinic On-Line (theclinic.cl). Estos medios se seleccionaron por su
importancia y seriedad al abordar las distintas noticias, teniendo cada uno, una
posición ideológica definida. Es por esto que se agruparon como medios de prensas
internacionales, correspondientes a las Agencia de Prensa Francesa y Prensa
Argentina, centrados en temáticas sobre acontecimientos mundiales, y por otro lado
los nacionales, como El Mercurio On-Line y The Clinic On-Line, con temáticas mixtas,
nacionales como internacionales, pero fuertemente marcados al área local.

Las temáticas de las noticias recogidas son de diferentes áreas, como política,
deportes, economía, entre otras. Lo relevante de la selección de estos medios es
que utilizan un lenguaje formal y, en su generalidad, evitan el uso de palabras
coloquiales o de la jerga local, por lo que se espera una fuerte relación entre ellas,
separándolas de una posible marcada ideología del periódico.

 (Hernández Cáceres Javier, 2016). Clustering basado en el algoritmo


K-means para la identificación de grupos de pacientes quirúrgicos.

La presente investigación busca apoyar la Gestión Estratégica del Proceso de Cirugía


en un hospital público de alta complejidad, a partir del agrupamiento de pacientes
quirúrgicos cuyos diagnósticos estuvieron asociados a tumores malignos.

Se definió un conjunto de datos con atributos sociodemográficos y clínicos y se


utilizó WEKA como herramienta de minería de datos para aplicar la técnica
Clustering basada en el algoritmo K-means y distancia Euclídea. Resultados:
descripción exploratoria de atributos y clústeres que identifican grupos de pacientes
que fueron sometidos a intervenciones quirúrgicas durante los períodos 2007 al
2015. Los clústeres obtenidos permitieron evidenciar la presencia de diagnósticos
asociados a cáncer, agrupando la población por: edad, grupo etario, régimen de
salud, género, zona de residencia, estrato, etnia, estado civil, grupo CIE-10, grupo
quirúrgico y tipo de atención.

La evaluación exhibió altos niveles de aceptación por parte de las partes interesadas.
El resultado de agrupación de este estudio no es una solución universal a todos los
datos del paciente, para generalizar el resultado, un mayor conjunto de datos
debería ser adoptado en la investigación futura. Los principales tipos de tumores
malignos en hombres eran tumores del estómago, colon y la laringe. Entre las
mujeres, las principales fueron los tumores de colon, estómago y cerebro. Aunque
el grupo más afectado fue el de más de 60 años también se observó la presencia
significativa de tumores a partir de 40 años.

 (Velásquez Henao David & Morales Olaya Yris & Cardona Franco Jaime, 2011).
Análisis y predicción de series de tiempo en mercados de energía usando el lenguaje
R

El modelado y análisis de las relaciones entre las variables económicas y financieras


en diferentes mercados de energía (electricidad, petróleo, gas, carbón,
biocombustibles, etc.) son dos de los principales ejes de investigación de la
economía energética; las metodologías utilizadas provienen de diversos campos del
conocimiento que incluyen, entre otros, la economía, la econometría, la
investigación de operaciones, la estadística y las finanzas. Gran parte del análisis
está centrado en descubrir y entender la relación entre diferentes variables así
como su dinámica, a partir de la información histórica

El análisis de series de tiempo y la predicción de variables económicas son tópicos


centrales de investigación en el campo de la energía. En este artículo, se revisan los
principales aspectos del lenguaje R para el computó estadístico, y se discute su
utilidad potencial para los investigadores y profesionales en mercados de energía.
También, se revisan las principales funciones disponibles para el análisis de series
de tiempo y se presentan algunos ejemplos de su uso.

 (Saez Marc, Pérez-Hoyos Santiago, Tobias Aurelio, Saurina Carme, Barceló Antonia
& Ballester Ferran, 1999). Métodos de series temporales en los estudios
epidemiológicos sobre contaminación atmosférica.

Se revisan los métodos de series temporales en los estudios epidemiológicos sobre


contaminación atmosférica, ilustrándolo mediante una regresión de Poisson auto
regresivo, la cual ha sido utilizada en los proyectos APHEA y EMECAM.
Se relacionan las variaciones en el número diario de muertos mayores de 70 años
(todas las causas, CIE-9:001-799) en Barcelona, 1991-1995, con las variaciones en
los niveles diarios promedio de contaminación por humos negros. Se utiliza una
regresión de Poisson por cuanto la variable aleatoria dependiente sigue
presumiblemente tal distribución de probabilidad.

Como confusores se consideran variables meteorológicas (promedios diarios de


temperatura y de humedad), comportamientos tendenciales, estacionales y efectos
de calendario presentes en la mortalidad (todos ellos aproximados de forma
determinista) así como cualquier otra variable que tenga un comportamiento que
pueda relacionarse con la variable dependiente (ocurrencia de epidemias de gripe
por ejemplo).

La relación entre la mortalidad y las variables confusoras se modeliza de forma no


lineal y se tienen en cuenta además los previsibles periodos de latencia (utilizando
retardos de variables explicativa por ejemplo). Sin embargo, y debido a que el
control no es perfecto, se opta por estimar un modelo de Poisson auto regresivo
(introduciendo como variables explicativas diversos retardos de la mortalidad)
corrigiendo la auto correlación residual.
METODOLOGÍA CRIPS-DM

 ¿Por qué la metodología CRISP-DM?


CRISP-DM aparte de ser el ciclo de vida más utilizado por las grandes empresas, es
la metodología más completa porque tiene en cuenta la aplicación al entorno de
negocio de los resultados, fundamentándose en una serie de objetivos como:
 Aplicar y comprender de mejor manera a la Minería de Datos y sus resultados
basándose en un proceso jerárquico.
 Dar cumplimiento de objetivos desde el punto de vista empresarial dando
preferencia a la comprensión del negocio.
 Desarrollar proyectos de minería de datos mediante un proceso estandarizado.
 Minimizar los costos que implica un proyecto de minería de datos en las
empresas.

 Fases de la metodología

1. Comprensión del negocio: Esta fase inicial se enfoca en la comprensión de los


objetivos de proyecto. Después se convierte este conocimiento de los datos en la
definición de un problema de minería de datos y en un plan preliminar diseñado
para alcanzar los objetivos.
2. Comprensión de los datos: La fase de entendimiento de datos comienza con la
colección de datos inicial y continúa con las actividades que permiten familiarizarse
con los datos, identificar los problemas de calidad, descubrir conocimiento
preliminar sobre los datos, y/o descubrir subconjuntos interesantes para formar
hipótesis en cuanto a la información oculta.

3. Preparación de los datos: La fase de preparación de datos cubre todas las


actividades necesarias para construir el conjunto final de datos (los datos que se
utilizarán en las herramientas de modelado) a partir de los datos en bruto iniciales.
Las tareas incluyen la selección de tablas, registros y atributos, así como la
transformación y la limpieza de datos para las herramientas que modelan.

4. Modelado: En esta fase, se seleccionan y aplican las técnicas de modelado que sean
pertinentes al problema (cuantas más mejor), y se calibran sus parámetros a valores
óptimos. Típicamente hay varias técnicas para el mismo tipo de problema de
minería de datos. Algunas técnicas tienen requerimientos específicos sobre la
forma de los datos. Por lo tanto, casi siempre en cualquier proyecto se acaba
volviendo a la fase de preparación de datos.

5. Evaluación: En esta etapa en el proyecto, se han construido uno o varios modelos


que parecen alcanzar calidad suficiente desde la una perspectiva de análisis de
datos.
Antes de proceder al despliegue final del modelo, es importante evaluarlo a
fondo y revisar los pasos ejecutados para crearlo, comparar el modelo obtenido
con los objetivos de negocio. Un objetivo clave es determinar si hay alguna
cuestión importante de negocio que no haya sido considerada
suficientemente. Al final de esta fase, se debería obtener una decisión sobre la
aplicación de los resultados del proceso de análisis de datos.

6. Despliegue: Generalmente, la creación del modelo no es el final del proyecto.


Incluso si el objetivo del modelo es de aumentar el conocimiento de los datos, el
conocimiento obtenido tendrá que organizarse y presentarse para que el cliente
pueda usarlo. Dependiendo de los requisitos, la fase de desarrollo puede ser tan
simple como la generación de un informe o tan compleja como la realización
periódica y quizás automatizada de un proceso de análisis de datos en la
organización
1. COMPRENSIÓN DEL NEGOCIO

1.1. Violencia intrafamiliar

La violencia intrafamiliar o también llamada violencia doméstica son abusos


de poder por parte de cualquier miembro de una familia sobre otro, que
producen daños físicos o psíquicos a la víctima. Existen varias formas de
violencia intrafamiliar, las cuales buscan minimizar, aislar, intimidar, acosar,
amenazar o incluso, abusar física y emocionalmente de uno o de varios
miembros de la familia.

Según (La revista Semana, 2016). En algunos hogares no dan tregua las
conductas violentas y agresivas. Así lo revela un informe que sostiene que
hasta el 31 de julio del 2016 se han registrado 44.796 casos de violencia
intrafamiliar, según el Instituto Nacional de Medicina Legal y Ciencias
Forenses.

Los datos oficiales de la entidad muestran en Colombia más de 25.000


mujeres han sido agredidas por su pareja este año, mientras que 4.000
hombres se han visto afectados por este tipo de violencia. Así mismo, son
víctimas de esta problemática social 5.827 niños, niñas y adolescentes; 8.710
personas entre hijos, hermanos, tíos y cuñados, y 933 adultos mayores.

En ocasiones, nos hacen mucho énfasis en cómo detectar el maltrato, e


incluso en forma errónea pensamos que las únicas formas que existen son el
maltrato físico y el abuso sexual, y dejamos a un lado el maltrato emocional
y la negligencia, los cuales se presentan al insultar, criticar, ridiculizar o
ignorar.

Según (tusabogadosycontadores, 2016). La forma de violencia ejercida suele


desarrollarse dependiendo hacia quién está destinada y quién es la está
empleando. Además puede ampliarse de diferentes maneras, según el tipo
de abuso que se ejerza.

 Violencia física: Es cuando el agresor utiliza el miedo y la agresión,


para así paralizar a su víctima, generando daño corporal con golpes
u objetos, por ejemplo con armas.

 Violencia emocional: Es aquella cuyo objetivo principal es lastimar y


herir las emociones de una persona, por medio de humillaciones,
amenazas e insultos.
 Violencia sexual: Se refiere al hecho de tener cualquier tipo de
contacto sexual de manera obligada con otra persona. El agresor
suele dominar a la víctima.

1.2. Objetivos

Objetivo general

 Disminuir el índice de violencia intrafamiliar mediante estudios de


big data.

Objetivos específicos

 Conocer cuáles son las zonas rurales y urbanas más afectadas a nivel
nacional.
 Saber en qué lugares se ocasionan frecuentemente estos actos de
violencia.
 Comprender con claridad los causantes de estos actos y cómo se
producen.

1.3. Área problemática

BIBLIOGRAFÍA

[1]. Diana López & Amaru Fernández, ARTÍCULO Volumen 12, Nº1, 2018: Aplicación
en los medios de prensa de un agrupamiento K-Means (Clustering K-Means).
https://rches.utem.cl/articulos/aplicacion-en-los-medios-de-prensa-de-un-
agrupamiento-k-means-clustering-k-means/

[2]. Javier Hernández Cáceres, ARTÍCULO 2016: Clustering basado en el algoritmo K-


means para la identificación de grupos de pacientes quirúrgicos.
http://www.udi.edu.co/congreso/historial/congreso_2016/ponencias/Ingenieria_d
e_sistemas/JAVIER_HERNANDEZ_CACERES.pdf
[3]. Juan David Velásquez Henao, Yris Olaya Morales & Carlos Jaime Franco Cardona,
2011: Análisis y predicción de series de tiempo en mercados de energía usando el
lenguaje R. http://www.scielo.org.co/pdf/dyna/v78n165/a30v78n165.pdf

[4]. Saez Marc, Pérez-Hoyos Santiago, Tobias Aurelio, Saurina Carme, Barceló
Antonia & Ballester Ferran, Rev. Esp. Salud Publica vol.73 no.2 Madrid mar. 1999:
Métodos de series temporales en los estudios epidemiológicos sobre contaminación
atmosférica.http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S11355727199
9000200004

[5]. (Tusabogadosycontadores, 2016): Conozca qué es la violencia intrafamiliar y los tipos


que existen. https://tusabogadosycontadores.co/blog/conozca-que-es-la-violencia-
intrafamiliar-y-los-tipos-que-existen/

[6].

Você também pode gostar