Você está na página 1de 21

Como los comentarios en las redes sociales en el momento oportuno

posicionan a un candidato

Introduccin:
El anlisis de la carga emocional ha tomado mucha importancia en la
actualidad. El punto de este estudio es conocer los aspectos de un
determinado comentario, como podra ser subjetivo, objetivo, neutral, positivo
o negativo.
En el giro que tomar este trabajo que ser poltico, analizaremos que tan
conveniente es una apreciacin positiva o negativa, como tambin en que
momento un comentario puede afectar de forma tajante una contienda
electoral
Fechas claves en las elecciones
Lunes 26 de setiembre
La primera vez que el republicano y la demcrata se vean las caras ser en el
debate del 26 de setiembre a las 21H00 locales. El evento televisado tendr
lugar en la Universidad Hofstra de Nueva York y ser moderado por Lester Holt,
presentador de la cadena NBC.
El debate estar dividido en seis segmentos de quince minutos cada uno. El
moderador iniciar con una pregunta y cada candidato tendr dos minutos
para responder. Luego Trump y Clinton podrn dirigirse el uno al otro con
respecto al tema tratado.

Martes 4 de octubre
Adems de los debates que ocurrirn entre los candidatos a la Presidencia de
Estados Unidos, el 4 de octubre la Universidad Longwood en Farmville (Virginia)
acoger el debate entre los candidatos a la Vicepresidencia, el senador Tim
Kaine y al gobernador Mike Pence, compaeros de frmula de Clinton y Trump,
respectivamente. La moderadora ser Elaine Quijano, de CBS News.

Domingo 9 de octubre
Los moderadores del segundo debate entre Clinton y Trump, previsto para el 9
de octubre en la Universidad Washington, en San Luis (Misuri), sern el
presentador Anderson Cooper, de CNN, y la corresponsal jefe para poltica
exterior de la cadena ABC, Martha Raddatz.
En este caso, los ciudadanos realizarn la mitad de las preguntas y la otra
mitad ser hecha por el moderador. Clinton y Trump tendrn dos minutos para
responder y luego habr un minute adicional para que Cooper facilite la

discusin. Los
Organization.

ciudadanos

participantes

sern

elegidos

por

la

Gallup

Mircoles 19 de octubre
El tercer y ltimo debate entre los candidatos antes de las elecciones
presidenciales del 8 de noviembre, de nuevo entre Clinton y Trump, lo
moderar Chris Wallace, presentador de la cadena conservadora Fox, el 19 de
octubre desde la Universidad de Nevada, en Las Vegas.

Martes 08 de noviembre
Ms de 100 millones de estadounidenses acudirn a las urnas en esta jornada
que, como dicta la legislacin del pas, corresponden al primer martes despus
del primer lunes de noviembre. Un porcentaje de la poblacin votar das
antes de manera adelantada como sucedi en las elecciones primarias.

Objetivo
El objeto de este trabajo es estudiar como las redes sociales pueden
determinar si un candidato ganara o perder las elecciones y como las
circunstancias buenas o malas de estos comentarios hacen un parteaguas
Objetivos

Explicar cmo los comentarios negativos pueden ayudar a posicionar a


una persona
Aclarar como declaraciones intensas sin importar su polaridad llaman la
atencin de los medios

Marco Terico
Que es Text Mining
El descubrimiento por computadora de nuevos, informacin previamente
desconocida, extraer automticamente informacin de una gran cantidad de
Recursos textuales no estructurados.

Ejecucin del anlisis


Acceso a rapidminer

Extraccin de datos de una cuenta de Twitter, y relacionarlo a una palabra


clave o usuario. Durante este trabajo analizaremos a los usuarios de la red
A&T& Mxico con la intencin de medir su satisfaccin y poderlo estimar cual
es el rea de oportunidad de la compaa.
Eleccin de la herramienta de bsqueda, cuenta de Twitter y palabras clave

Tomemos en cuenta que estamos delimitando la region y el idioma con la


cuanta de AT&T Mexico Ayuda.

Datos que brinda el primer anlisis:


Id, Fecha de creacin, Usuario, User ID, Usuario al que se escribi el Tweet,
Lenguaje, Fuente de la informacin, Texto, Localizacin y Retweet.

Al tener esta informacin lo que tenemos pendiente es el anlisis de


sentimientos para saber si este mensaje es una opinin, si contiene sarcasmo o
si un usuario se encuentra feliz con el servicio.

Estadstica de la informacin
Continuo de la extraccin de datos, insertaremos la seccin de anlisis de
sentimientos.

News API (segundo anlisis)

Anlisis de la informacin
Que candidato fue ms veces mencionado en las redes sociales

Mencin de los candidatos en los ltimos 60 das antes de las elecciones

Trump

Clinton

Perfiles de los votantes

Procedimiento:
library("twitteR")
library("ROAuth")
library("httr")

setup_twitter_oauth("G93s8auXjpxyNBtIPp5wOYSXe",
"g2XQYIw5KBGAoegIgLLnX5tztb7xaxdColUFDI4AQd2RR21PrT", "58611727hDFFNFiqdjjMYojwp1P3MpE4tR4KS31jX3cN4ZpCD",
"WWvIg2rkxtpXxsX28yitq6EGPI165IbM2DmL45sUvLMV2" )

Realizaremos una conexin pare descargar tweet desde la API de Twitter

Con esto ya podremos realizar descargas directas de la base de datos de


Twitter

Ejemplo
searchTwitter("@realDonaldTrump", n=50)

Posteriormente para el anlisis a realizar cargare una pequea base de datos


para el anlisis de la informacin

tweets <- read.csv("tweets.csv", sep = ",")


table(tweets$sentiment)
library("NLP")
library("tm")
library("SnowballC")
corpus = Corpus(VectorSource(tweets$text))
length(corpus)
content(corpus[[2]])

corpus <- tm_map(corpus, tolower)


corpus <- tm_map(corpus, PlainTextDocument)

corpus <- tm_map(corpus, removePunctuation)

Procedemos a quitar las stopword, siendo estas palabras que estorban y las
ms utilizadas como sera un ejemplo: el, la, los, las, etc.
stopwords("english") [1:10]

corpus <- tm_map(corpus, removeWords, c (stopwords("english")))


content(corpus[[2]])

corpus <- tm_map(corpus, stemDocument)


content(corpus[[2]])

Etapa de clasificacin
La computadora aprender los elementos pre clasificados que le ingresamos
Para que pueda aprender pasaremos las palabras a nmeros
Por eso vamos a crear una matriz para brindar un valor a las palabras

frecuencies <- DocumentTermMatrix(corpus)


frecuencies

Con este comando podemos analizar cuales palabras aparecen mas, como por
ejemplo visualizaremos las palabras que aparecen mas de 50 veces
inspect(frecuencies[700:725, 505:515])
findFreqTerms(frecuencies,lowfreq = 50)

sparse <- removeSparseTerms(frecuencies, 0.995)


sparse

tweetsSparse <- as.data.frame(as.matrix(sparse))


colnames(tweetsSparse) = make.names(colnames(tweetsSparse))
Vamos a transformar la matriz sparse a una base de datos que R pueda leer

Logo asignaremos los nombres de las columnas


tweetsSparse$sentiment <- tweets$sentiment
library(caTools)
set.seed(12)

Utilizaremos un modelo de clasificacin Support Vector Machines


Este modelo genera un conjunto de vectores bidimensionales
Tenemos que definir un conjunto de entrenamiento (80%) y evaluacin (20%)

split <- sample.split(tweetsSparse$sentiment, SplitRatio = .80)


trainSparse = subset(tweetsSparse, split==TRUE)
testSparse = subset(tweetsSparse, split==FALSE)

Necesitamos realizar una comparacin, entonces veremos en nuestra base de


pruebas cuantos comentarios positivos y negativos tenemos

table(testSparse$sentiment)
111/200

En este momento tenemos un 55% de efectividad

library("NLP")
library("tm")
library("caret")
library("e1071")
Pero para tener un mejor anlisis aplicaremos la metodologa Machine learning,
donde tomara los datos para aprender
SVM <- svm(as.factor(sentiment)~.,data=trainSparse)
summary(SVM)

Analizaremos como el modelo se comporta al realizar predicciones


predictSVM <- predict(SVM, newdata = testSparse)

Validacin
confusionMatrix(predictSVM,testSparse$sentiment)

library("RColorBrewer")
library("wordcloud")
positive <- subset(tweetsSparse, tweetsSparse$sentiment ==1)
positive$sentiment <- NULL
positivas <- as.data.frame(colSums(positive))
positivas$words <- row.names(positivas)
View(positivas)

colnames(positivas) <- c("freq","word")


wordcloud(positivas$word, positivas$freq, random.order = FALSE, colors =
brewer.pal(8, "Dark2"),max.words = 300)

Conclusiones
Podemos observar que el resultado de las elecciones se baso en las menciones
de los medio de comunicacin hacia el candidato mas polemico, pero quiero
decir polemico al que genero controversia en aspectos sociales y de genero.
El resultado negativo para Hillary fue que las menciones en las redes sociales
tenian una afectacion para su pais y la segurar de este, inclinando que muchos
jovenes analuran su voto, siendo estos los mayores consumidores de redes
sociales

Você também pode gostar