Você está na página 1de 5

ESTADISTICA DESCRIPTIVA

BASES DE DATOS
Artículo de Revisión

ESTUDIO ESTADISTICO DE LAS COMPLICACIONES Y MUERTES QUE SE HAN LLEVADO


A CABO EN ALGUNOS HOSPITALES DEL TERRITORIO DE EE.UU.
Statistical Study of Complications and Deaths that Have Been Carried out in Some Hospitals in the
American Territory

Autor 1 (Juan Sebastián García Rojas)1

RESUMEN
En este trabajo se realizará un estudio de estadística descriptiva bajo el modelo de programación
de la base de datos “Complications and Deaths” del territorio norteamericano. Esta base esta
compuesta por 12 variables, 6 de tipo carácter, 2 de tipo factor y 4 de tipo numérico, se
relacionarán algunas de estas con el objetivo de describir cada variable de la mejor manera.
Nota: La base de datos no trae valores perdidos (NA) en las variables numéricas, sin embargo al
tener tantos datos es posible que estos valores hayan sido tomados como valor numérico cero (0)
para ser evaluados con una mayor transparencia.
Palabras clave: Complicaciones, Muertes, Base de Datos, Variable, Valores Perdidos, Datos,
Factor, Carácter, Estadística Descriptiva

ABSTRACT
In this work, a descriptive statistics study will be carried out under the programming model of the
"Complications and Deaths" database of the North American territory. This base is composed of
12 variables, 6 of character type, 2 of factor type and 4 of numeric type, some of these will be
related in order to describe each variable in the best way.
Note: The database does not bring missing values (NA) in the numerical variables, however,
having so much data it is possible that these values have been taken as a numerical value zero (0)
to be evaluated with greater transparency.

1
Universidad El Bosque_Bogotá_Colombia_ Contacto: jsegarciar@unbosque.edu.co
Keywords: Complications, Deaths, Database, Variable, Missing Values, Data, Factor, Character,
Descriptive Statistics

SÍNTESE
Neste trabalho, será realizado um estudo de estatística descritiva sob o modelo de programação
do banco de dados "Complicações e Mortes" do território norte-americano. Esta base é composta
por 12 variáveis, 6 de tipo de caractere, 2 de tipo fatorial e 4 de tipo numérico, algumas destas
serão relacionadas de forma a descrever da melhor forma cada variável.
Nota: O banco de dados não traz valores perdidos (NA) nas variáveis numéricas, porém, por ter
tantos dados é possível que esses valores tenham sido tomados como um valor numérico zero (0)
para serem avaliados com maior transparência.
Palavras-chave: Complicações, mortes, banco de dados, variável, valores ausentes, dados, fator,
caráter, estatística descritiva

INTRODUCCIÓN
La presente investigación tiene como objetivo estudiar de manera estadística descriptiva la base
de datos proporcionada por el territorio americano donde explican las razones por las cuales
distintas personas tuvieron una complicación de su salud, o en su fatalidad, la muerte; los datos
están contenidos en 12 variables que relacionan el código del hospital, el hospital, su dirección, la
ciudad, el condado, el motivo de la complicación, su relación con el ámbito nacional, la
población total de pacientes, el mínimo estimado de pacientes con dicha complicación, el
máximo estimado de pacientes con esa complicación y el numero de casos reales que se
presentaron, lo que es información suficiente para empezar a relacionar dichas variables con el
fin de poder sacar conclusiones validas para el numero de hospitales trabajos que en este caso
oscilaran por los diez mil. Al clasificar dichas variables se tomaran en cuenta el tipo de variable y
luego se realizara la tabla de frecuencia y los filtros necesarios para obtener los resultados
deseados.
MARCO DE REFERENCIA

Sistema de Salud en los hospitales de Estados Unidos.

La organización del sistema de salud en este país como en el mundo es mixta, es decir hay tanto
aseguradoras públicas como privadas. Lo que es único de este sistema es el dominio del sector
privado sobre el público. En 2011 el 49% de la población estadounidense recibe un seguro
médico privado por medio de su empleador, el 5% tiene un seguro médico independiente, 16% no
goza de un seguro médico (es decir, 50 millones de personas), el 13% está cubierto bajo
Medicare y el 18% tiene Medicaid o algún otro tipo de seguro médico público. Estas estadísticas
según la oficina de análisis legales.

En el sector privado hay dos formas de obtener un seguro médico. La primera es por medio de su
empleador, esta es la forma más común en los Estados Unidos. La segunda es en el mercado de
una manera individual, el gran problema con esta última opción es que las aseguradoras tenían la
posibilidad de negar la cobertura basándose en la salud general y condiciones preexistentes de los
asegurados.

En el sector público, a pesar de los beneficios de los programas de seguridad pública (y del bajo
costo administrativo de los mismos) hay muchos aspectos que todavía son problemáticos. Por
ejemplo, Medicare no cubre medicina preventiva, o servicios como dentistas u oculistas.
Medicaid está expuesto al rechazo por parte de los proveedores de los servicios de salud, puesto
que su tasa de reembolso es muy baja. De la misma manera el programa S-CHIP.

Los cambios para mejorar el sistema son necesarios, el debate es político e ideológico, por lo que
debemos informarnos para reconocer las fortalezas y las debilidades de nuestro sistema. En el
siguiente número de La Voz presentaré los cambios que la ley de reforma del sistema de salud,
comúnmente llamada “Obamacare”,  viene trayendo.

(La Voz, Cultura y noticias hispanas del Valle de Hudson, 2013)

METODOLOGIA Y RESULTADOS

Se clasificaron las variables en variable de carácter, variable de factor y variable de tipo


numérico, con la variable del código de cada hospital se diseño una tabla con datos agrupados. Se
transformaron las variables del tipo del hospital y el diseño de comparación a nivel nacional, la
primera con cuatro etiquetas y la segunda con ocho etiquetas, a partir de ahí se construyó la
función para realizar la tabla de frecuencias y se comenzaron a analizar las distintas relaciones
que había. Para terminar, se utilizó “lapply” para por medio de una lista, obtener las medidas de
tendencia central de las variables numéricas que son necesarias para obtener conclusiones mas
acertadas.

A continuación, se mostrarán algunas relaciones que se obtuvieron en la aplicación en la que se


desarrollo el análisis.

Valores Perdidos: Se contabilizaron los valores perdidos de cada variable numérica, suponiendo
que haya sido reemplazada por el valor nulo “0”, siendo así, estos fueron los resultados:
(Población: 3254, Casos Estimados: 2824, Mínimo Estimado: 3638 y Máximo Estimado: 2824)

NOTA: Se anexa en la carpeta todo el código con el que se realizaron las comparaciones, así
como las tablas completas que entregaron los resultados del análisis. Cabe destacar que toda la
programación se realizó en la aplicación de R y RStudio.
CONCLUSIONES

Respecto al objetivo general se logró realizar un análisis estadístico descriptivo bastante acertado
logrando comparar por un lado las variables que comenzaban con “f” para identificar el código
del hospital y el nombre de este. Se identifico que la mayoría de valores que entrega cada hospital
no es diferente con el valor estimado que le da el gobierno nacional a la complicación de salud.
Se concluyo que la mayoría de las personas asisten a centros de salud, en este caso públicos o
privados del territorio. En cuanto a las medidas de tendencia central, fueron acertadas en el caso
de que hubo un promedio de siete casos complicados por ochocientos pacientes, un mínimo
estimado del 5.27% y un máximo estimado de 10% por cada motivo de complicación, algo que
también se presenta acertado y bastante acorde a la información de los datos. El primer cuartil y
el mínimo son muy cercanos a cero en las cuatro variables numéricas y eso se da con motivo a
que todos los valores perdidos NA probablemente fueron cambiados por valor numérico nulo.
Para terminar, se obtuvo un análisis descriptivo sin mayor sobresalto utilizando tres librerías en
específico de nuestra aplicación RStudio y con aproximadamente 0 datos perdidos en la base de
datos de “Complications and Deaths” del territorio americano. (Anexo la carpeta con el código
completo realizado en R y con los documentos detallados de manera completa en formato .txt).

REFERENCIAS

 (La Voz, Cultura y noticias hispanas del Valle de Hudson, 2013)

Você também pode gostar