Análisis de Sentimientos

Como los comentarios en las redes sociales en el momento oportuno
posicionan a un candidato
Introduccin:
El anlisis de la carga emocional ha tomado mucha importancia en la
actualidad. El punto de este estudio es conocer los aspectos de un
determinado comentario, como podra ser subjetivo, objetivo, neutral, positivo
o negativo.
En el giro que tomar este trabajo que ser poltico, analizaremos que tan
conveniente es una apreciacin positiva o negativa, como tambin en que
momento un comentario puede afectar de forma tajante una contienda
electoral
Fechas claves en las elecciones
Lunes 26 de setiembre
La primera vez que el republicano y la demcrata se vean las caras ser en el
debate del 26 de setiembre a las 21H00 locales. El evento televisado tendr
lugar en la Universidad Hofstra de Nueva York y ser moderado por Lester Holt,
presentador de la cadena NBC.
El debate estar dividido en seis segmentos de quince minutos cada uno. El
moderador iniciar con una pregunta y cada candidato tendr dos minutos
para responder. Luego Trump y Clinton podrn dirigirse el uno al otro con
respecto al tema tratado.
Martes 4 de octubre
Adems de los debates que ocurrirn entre los candidatos a la Presidencia de
Estados Unidos, el 4 de octubre la Universidad Longwood en Farmville (Virginia)
acoger el debate entre los candidatos a la Vicepresidencia, el senador Tim
Kaine y al gobernador Mike Pence, compaeros de frmula de Clinton y Trump,
respectivamente. La moderadora ser Elaine Quijano, de CBS News.
Domingo 9 de octubre
Los moderadores del segundo debate entre Clinton y Trump, previsto para el 9
de octubre en la Universidad Washington, en San Luis (Misuri), sern el
presentador Anderson Cooper, de CNN, y la corresponsal jefe para poltica
exterior de la cadena ABC, Martha Raddatz.
En este caso, los ciudadanos realizarn la mitad de las preguntas y la otra
mitad ser hecha por el moderador. Clinton y Trump tendrn dos minutos para
responder y luego habr un minute adicional para que Cooper facilite la
discusin. Los
Organization.
ciudadanos
participantes
sern
elegidos
por
la
Gallup
Mircoles 19 de octubre
El tercer y ltimo debate entre los candidatos antes de las elecciones
presidenciales del 8 de noviembre, de nuevo entre Clinton y Trump, lo
moderar Chris Wallace, presentador de la cadena conservadora Fox, el 19 de
octubre desde la Universidad de Nevada, en Las Vegas.
Martes 08 de noviembre
Ms de 100 millones de estadounidenses acudirn a las urnas en esta jornada
que, como dicta la legislacin del pas, corresponden al primer martes despus
del primer lunes de noviembre. Un porcentaje de la poblacin votar das
antes de manera adelantada como sucedi en las elecciones primarias.
Objetivo
El objeto de este trabajo es estudiar como las redes sociales pueden
determinar si un candidato ganara o perder las elecciones y como las
circunstancias buenas o malas de estos comentarios hacen un parteaguas
Objetivos
Explicar cmo los comentarios negativos pueden ayudar a posicionar a

una persona
Aclarar como declaraciones intensas sin importar su polaridad llaman la
atencin de los medios
Marco Terico
Que es Text Mining
El descubrimiento por computadora de nuevos, informacin previamente
desconocida, extraer automticamente informacin de una gran cantidad de
Recursos textuales no estructurados.
Ejecucin del anlisis

Acceso a rapidminer
Extraccin de datos de una cuenta de Twitter, y relacionarlo a una palabra

clave o usuario. Durante este trabajo analizaremos a los usuarios de la red
A&T& Mxico con la intencin de medir su satisfaccin y poderlo estimar cual
es el rea de oportunidad de la compaa.
Eleccin de la herramienta de bsqueda, cuenta de Twitter y palabras clave
Tomemos en cuenta que estamos delimitando la region y el idioma con la

cuanta de AT&T Mexico Ayuda.
Datos que brinda el primer anlisis:

Id, Fecha de creacin, Usuario, User ID, Usuario al que se escribi el Tweet,
Lenguaje, Fuente de la informacin, Texto, Localizacin y Retweet.
Al tener esta informacin lo que tenemos pendiente es el anlisis de

sentimientos para saber si este mensaje es una opinin, si contiene sarcasmo o
si un usuario se encuentra feliz con el servicio.
Estadstica de la informacin
Continuo de la extraccin de datos, insertaremos la seccin de anlisis de
sentimientos.
News API (segundo anlisis)
Anlisis de la informacin
Que candidato fue ms veces mencionado en las redes sociales
Mencin de los candidatos en los ltimos 60 das antes de las elecciones
Trump
Clinton
Perfiles de los votantes
Procedimiento:
library("twitteR")
library("ROAuth")
library("httr")
setup_twitter_oauth("G93s8auXjpxyNBtIPp5wOYSXe",
"g2XQYIw5KBGAoegIgLLnX5tztb7xaxdColUFDI4AQd2RR21PrT", "58611727hDFFNFiqdjjMYojwp1P3MpE4tR4KS31jX3cN4ZpCD",
"WWvIg2rkxtpXxsX28yitq6EGPI165IbM2DmL45sUvLMV2" )
Realizaremos una conexin pare descargar tweet desde la API de Twitter
Con esto ya podremos realizar descargas directas de la base de datos de

Twitter
Ejemplo
searchTwitter("@realDonaldTrump", n=50)
Posteriormente para el anlisis a realizar cargare una pequea base de datos

para el anlisis de la informacin
tweets <- read.csv("tweets.csv", sep = ",")

table(tweets$sentiment)
library("NLP")
library("tm")
library("SnowballC")
corpus = Corpus(VectorSource(tweets$text))
length(corpus)
content(corpus[[2]])
corpus <- tm_map(corpus, tolower)

corpus <- tm_map(corpus, PlainTextDocument)
corpus <- tm_map(corpus, removePunctuation)
Procedemos a quitar las stopword, siendo estas palabras que estorban y las
ms utilizadas como sera un ejemplo: el, la, los, las, etc.
stopwords("english") [1:10]
corpus <- tm_map(corpus, removeWords, c (stopwords("english")))

corpus <- tm_map(corpus, stemDocument)

Etapa de clasificacin
La computadora aprender los elementos pre clasificados que le ingresamos
Para que pueda aprender pasaremos las palabras a nmeros
Por eso vamos a crear una matriz para brindar un valor a las palabras
frecuencies <- DocumentTermMatrix(corpus)

frecuencies
Con este comando podemos analizar cuales palabras aparecen mas, como por
ejemplo visualizaremos las palabras que aparecen mas de 50 veces
inspect(frecuencies[700:725, 505:515])
findFreqTerms(frecuencies,lowfreq = 50)
sparse <- removeSparseTerms(frecuencies, 0.995)

sparse
tweetsSparse <- as.data.frame(as.matrix(sparse))

colnames(tweetsSparse) = make.names(colnames(tweetsSparse))
Vamos a transformar la matriz sparse a una base de datos que R pueda leer
Logo asignaremos los nombres de las columnas

tweetsSparse$sentiment <- tweets$sentiment
library(caTools)
set.seed(12)
Utilizaremos un modelo de clasificacin Support Vector Machines

Este modelo genera un conjunto de vectores bidimensionales
Tenemos que definir un conjunto de entrenamiento (80%) y evaluacin (20%)
split <- sample.split(tweetsSparse$sentiment, SplitRatio = .80)

trainSparse = subset(tweetsSparse, split==TRUE)
testSparse = subset(tweetsSparse, split==FALSE)
Necesitamos realizar una comparacin, entonces veremos en nuestra base de

pruebas cuantos comentarios positivos y negativos tenemos
table(testSparse$sentiment)
111/200
En este momento tenemos un 55% de efectividad
library("NLP")
library("tm")
library("caret")
library("e1071")
Pero para tener un mejor anlisis aplicaremos la metodologa Machine learning,
donde tomara los datos para aprender
SVM <- svm(as.factor(sentiment)~.,data=trainSparse)
summary(SVM)
Analizaremos como el modelo se comporta al realizar predicciones

predictSVM <- predict(SVM, newdata = testSparse)
Validacin
confusionMatrix(predictSVM,testSparse$sentiment)
library("RColorBrewer")
library("wordcloud")
positive <- subset(tweetsSparse, tweetsSparse$sentiment ==1)
positive$sentiment <- NULL
positivas <- as.data.frame(colSums(positive))
positivas$words <- row.names(positivas)
View(positivas)
colnames(positivas) <- c("freq","word")

wordcloud(positivas$word, positivas$freq, random.order = FALSE, colors =
brewer.pal(8, "Dark2"),max.words = 300)
Conclusiones
Podemos observar que el resultado de las elecciones se baso en las menciones
de los medio de comunicacin hacia el candidato mas polemico, pero quiero
decir polemico al que genero controversia en aspectos sociales y de genero.
El resultado negativo para Hillary fue que las menciones en las redes sociales
tenian una afectacion para su pais y la segurar de este, inclinando que muchos
jovenes analuran su voto, siendo estos los mayores consumidores de redes
sociales

Análisis de Sentimientos

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Análisis de Sentimientos

Enviado por

Direitos autorais:

Formatos disponíveis

Como los comentarios en las redes sociales en el momento oportuno

Explicar cmo los comentarios negativos pueden ayudar a posicionar a

Ejecucin del anlisis

Extraccin de datos de una cuenta de Twitter, y relacionarlo a una palabra

Tomemos en cuenta que estamos delimitando la region y el idioma con la

Datos que brinda el primer anlisis:

Al tener esta informacin lo que tenemos pendiente es el anlisis de

News API (segundo anlisis)

Mencin de los candidatos en los ltimos 60 das antes de las elecciones

Perfiles de los votantes

Realizaremos una conexin pare descargar tweet desde la API de Twitter

Con esto ya podremos realizar descargas directas de la base de datos de

Posteriormente para el anlisis a realizar cargare una pequea base de datos

tweets <- read.csv("tweets.csv", sep = ",")

corpus <- tm_map(corpus, tolower)

corpus <- tm_map(corpus, removePunctuation)

corpus <- tm_map(corpus, removeWords, c (stopwords("english")))

corpus <- tm_map(corpus, stemDocument)

frecuencies <- DocumentTermMatrix(corpus)

sparse <- removeSparseTerms(frecuencies, 0.995)

tweetsSparse <- as.data.frame(as.matrix(sparse))

Logo asignaremos los nombres de las columnas

Utilizaremos un modelo de clasificacin Support Vector Machines

split <- sample.split(tweetsSparse$sentiment, SplitRatio = .80)

Necesitamos realizar una comparacin, entonces veremos en nuestra base de

En este momento tenemos un 55% de efectividad

Analizaremos como el modelo se comporta al realizar predicciones

colnames(positivas) <- c("freq","word")

Você também pode gostar