Escolar Documentos
Profissional Documentos
Cultura Documentos
posicionan a un candidato
Introduccin:
El anlisis de la carga emocional ha tomado mucha importancia en la
actualidad. El punto de este estudio es conocer los aspectos de un
determinado comentario, como podra ser subjetivo, objetivo, neutral, positivo
o negativo.
En el giro que tomar este trabajo que ser poltico, analizaremos que tan
conveniente es una apreciacin positiva o negativa, como tambin en que
momento un comentario puede afectar de forma tajante una contienda
electoral
Fechas claves en las elecciones
Lunes 26 de setiembre
La primera vez que el republicano y la demcrata se vean las caras ser en el
debate del 26 de setiembre a las 21H00 locales. El evento televisado tendr
lugar en la Universidad Hofstra de Nueva York y ser moderado por Lester Holt,
presentador de la cadena NBC.
El debate estar dividido en seis segmentos de quince minutos cada uno. El
moderador iniciar con una pregunta y cada candidato tendr dos minutos
para responder. Luego Trump y Clinton podrn dirigirse el uno al otro con
respecto al tema tratado.
Martes 4 de octubre
Adems de los debates que ocurrirn entre los candidatos a la Presidencia de
Estados Unidos, el 4 de octubre la Universidad Longwood en Farmville (Virginia)
acoger el debate entre los candidatos a la Vicepresidencia, el senador Tim
Kaine y al gobernador Mike Pence, compaeros de frmula de Clinton y Trump,
respectivamente. La moderadora ser Elaine Quijano, de CBS News.
Domingo 9 de octubre
Los moderadores del segundo debate entre Clinton y Trump, previsto para el 9
de octubre en la Universidad Washington, en San Luis (Misuri), sern el
presentador Anderson Cooper, de CNN, y la corresponsal jefe para poltica
exterior de la cadena ABC, Martha Raddatz.
En este caso, los ciudadanos realizarn la mitad de las preguntas y la otra
mitad ser hecha por el moderador. Clinton y Trump tendrn dos minutos para
responder y luego habr un minute adicional para que Cooper facilite la
discusin. Los
Organization.
ciudadanos
participantes
sern
elegidos
por
la
Gallup
Mircoles 19 de octubre
El tercer y ltimo debate entre los candidatos antes de las elecciones
presidenciales del 8 de noviembre, de nuevo entre Clinton y Trump, lo
moderar Chris Wallace, presentador de la cadena conservadora Fox, el 19 de
octubre desde la Universidad de Nevada, en Las Vegas.
Martes 08 de noviembre
Ms de 100 millones de estadounidenses acudirn a las urnas en esta jornada
que, como dicta la legislacin del pas, corresponden al primer martes despus
del primer lunes de noviembre. Un porcentaje de la poblacin votar das
antes de manera adelantada como sucedi en las elecciones primarias.
Objetivo
El objeto de este trabajo es estudiar como las redes sociales pueden
determinar si un candidato ganara o perder las elecciones y como las
circunstancias buenas o malas de estos comentarios hacen un parteaguas
Objetivos
Marco Terico
Que es Text Mining
El descubrimiento por computadora de nuevos, informacin previamente
desconocida, extraer automticamente informacin de una gran cantidad de
Recursos textuales no estructurados.
Estadstica de la informacin
Continuo de la extraccin de datos, insertaremos la seccin de anlisis de
sentimientos.
Anlisis de la informacin
Que candidato fue ms veces mencionado en las redes sociales
Trump
Clinton
Procedimiento:
library("twitteR")
library("ROAuth")
library("httr")
setup_twitter_oauth("G93s8auXjpxyNBtIPp5wOYSXe",
"g2XQYIw5KBGAoegIgLLnX5tztb7xaxdColUFDI4AQd2RR21PrT", "58611727hDFFNFiqdjjMYojwp1P3MpE4tR4KS31jX3cN4ZpCD",
"WWvIg2rkxtpXxsX28yitq6EGPI165IbM2DmL45sUvLMV2" )
Ejemplo
searchTwitter("@realDonaldTrump", n=50)
Procedemos a quitar las stopword, siendo estas palabras que estorban y las
ms utilizadas como sera un ejemplo: el, la, los, las, etc.
stopwords("english") [1:10]
Etapa de clasificacin
La computadora aprender los elementos pre clasificados que le ingresamos
Para que pueda aprender pasaremos las palabras a nmeros
Por eso vamos a crear una matriz para brindar un valor a las palabras
Con este comando podemos analizar cuales palabras aparecen mas, como por
ejemplo visualizaremos las palabras que aparecen mas de 50 veces
inspect(frecuencies[700:725, 505:515])
findFreqTerms(frecuencies,lowfreq = 50)
table(testSparse$sentiment)
111/200
library("NLP")
library("tm")
library("caret")
library("e1071")
Pero para tener un mejor anlisis aplicaremos la metodologa Machine learning,
donde tomara los datos para aprender
SVM <- svm(as.factor(sentiment)~.,data=trainSparse)
summary(SVM)
Validacin
confusionMatrix(predictSVM,testSparse$sentiment)
library("RColorBrewer")
library("wordcloud")
positive <- subset(tweetsSparse, tweetsSparse$sentiment ==1)
positive$sentiment <- NULL
positivas <- as.data.frame(colSums(positive))
positivas$words <- row.names(positivas)
View(positivas)
Conclusiones
Podemos observar que el resultado de las elecciones se baso en las menciones
de los medio de comunicacin hacia el candidato mas polemico, pero quiero
decir polemico al que genero controversia en aspectos sociales y de genero.
El resultado negativo para Hillary fue que las menciones en las redes sociales
tenian una afectacion para su pais y la segurar de este, inclinando que muchos
jovenes analuran su voto, siendo estos los mayores consumidores de redes
sociales