Você está na página 1de 24

Diplomado Community Manager IP Arcos: Mdulo de Newsbots 2017

Introduccin a la creacin de Newsbots para


publicacin automtica de contenidos en
redes sociales
Profesor

Jaime O. Prez Gonzlez


Linkedin: linkedin.com/in/jperezg
Facebook: facebook.com/jaimitoperezg
Correo: jaimitoperez@gmail.com
Objetivo General

Adquirir los conocimientos necesarios para crear un canal


temtico de informacin que se actualiza de forma
automtica o semiautomtica a travs de un robot capaz
de publicar en una red social.
Objetivos especficos

Utilizar herramientas de anlisis para identificar nichos temticos y de inters para


comunidades en incipiente crecimiento.

Conocer y diferenciar las tecnologas que nos permiten clasificar y seleccionar


informacin temtica o de nicho en internet.

Conocer, diferenciar y utilizar las herramientas que nos permiten construir y configurar robots
con la capacidad de publicar informacin relevante en las redes sociales.
Clase 1

Qu es un Newsbot?

Qu tecnologas nos permiten crear un Newsbot?

Por qu crear un newsbot?


Qu es un Newsbot?

News + Bot = Noticias + Robot


Qu es un Newsbot?

Noticia:

Composicin o texto escrito de tipo informativo que en un espacio limitado de


extensin intenta entregar, generalmente de forma estructurada, la mayor
cantidad de datos sobre un hecho que se considera relevante y que sucedi en
un periodo reciente de tiempo.
Qu es un Newsbot?

Bot (Afresis de robot):

Programa informtico que intenta imitar el comportamiento humano.


https://es.wikipedia.org/wiki/Bot
Qu es un Newsbot?

Segn Wiktionary un Newsbot es..

Any of various pieces of software designed to harvest articles from


newsgroups, or from news websites.
https://es.wikipedia.org/wiki/Bot

Una o varias piezas de software diseados para obtener artculos desde grupos
o sitios de noticias.
Think About Files, Not Web Pages / Piensa en archivos, no en pginas web

To most people, the Web appears as a collection of web pages. But in reality, the Web is collection
of files that form those web pages. These files may exist on servers anywhere in the world, and they
only create web pages when they are viewed together. Because browsers simplify the process of
downloading and rendering the individual files that make up web pages, you need to know the nuts
and bolts of how web pages are put together before you write your first webbot...

Para la mayora de las personas, Internet se les presenta como una coleccin de pginas
web. Pero en realidad, la Web es ms bien una coleccin de los archivos que forman esas
pginas web. Estos archivos pueden existir en servidores ubicados en cualquier parte del
mundo, y ellos slo crean las pginas web cuando son vistos en su conjunto. Porque los
navegadores simplifican el proceso de descarga y rendereo (diagramacin) de los archivos
individuales que conforman las pginas web, entonces necesitas conocer las tuercas y los
pernos que arman las pginas web antes de comenzar a crear tu primer robot web.
MICHAEL SCHRENK
Think About Files, Not Web Pages / Piensa en archivos, no en pginas web

Esta idea nos lleva a tres conceptos bsicos a tener en cuenta para crear
nuestro newsbot

1. Debemos comprender las tecnologas que nos permiten publicar contenidos en


internet (HTTP, HTML, CSS, javascript, RSS, ATOM, e-mail, xml, json...)

1. Debemos entender internet como un espacio de informacin cambiante, donde la


informacin se renueva constantemente (se crea, actualiza, borra o reutiliza). Por
ende tanto la informacin como las tecnologas estn en constante cambio.

1. Toda informacin que se puede ver a travs de nuestro navegador, tambin se


puede descargar y por ende manipular. Es en este aspecto donde ingresan los
newsbot y por tanto para crearlos debemos aprender a manipular esa informacin, y
MICHAEL SCHRENK as reutilizarla a favor del proyecto que queramos desarrollar como creadores de
contenido.
Think About Files, Not Web Pages / Piensa en archivos, no en pginas web

Esta idea nos lleva a tres conceptos bsicos a tener en cuenta para crear
nuestro newsbot

1. Qu tecnologas sustentan y hacen funcionar internet? / Clase 1

1. Cmo podemos gestionar y clasificar la informacin de internet? /


Clases 3 y 4

1. Cmo podemos manipular y utilizar la informacin de internet a


nuestro favor? / Clases 5, 6 y 7

MICHAEL SCHRENK
HTTP: Qu tecnologas sustentan y hacen funcionar internet?

HTTP (Hypertext transfer protocol o Protocolo de transferencia de hipertexto)

Protocolo orientado a transacciones que sigue el esquema peticin-respuesta


entre un cliente y un servidor. El cliente (se le suele llamar "agente de
usuario", en ingls user agent) realiza una peticin enviando un mensaje,
con cierto formato al servidor. El servidor (se le suele llamar un servidor
web) le enva un mensaje de respuesta. Ejemplos de cliente son los
navegadores web y las araas web (tambin conocidas por su trmino
ingls, webcrawlers).

Para ms informacin
https://upload.wikimedia.org/wikipedia/commons/thumb/8/
https://es.wikipedia.org/wiki/Hypertext_Transfer_Protocol 80/Qu%C3%A9_es_http2.jpg/330px-Qu%C3%A9_es_http2.jpg
HTTP: Qu tecnologas sustentan y hacen funcionar internet?

Versiones de HTTP

0.9 (lanzada en 1991): Prcticamente slo poda recibir informacin.

HTTP/1.0 (mayo de 1996): Incorpora la recepcin y envo de informacin.

HTTP/1.1 (junio de 1999): Permite enviar mltiples peticiones y disminuye el tiempo


de respuesta. Pero crea cuellos de botella. Cada archivo debe esperar respuesta del
servidor antes de ser descargado.

HTTP/1.2 (febrero de 2000): Versin experimental que buscaba mejorar an ms el


tiempo de respuesta de las transacciones entre el servidor y el cliente. Se desestim
por temas de compatibilidad con las versiones anteriores.
https://upload.wikimedia.org/wikipedia/commons/thumb/8/
80/Qu%C3%A9_es_http2.jpg/330px-Qu%C3%A9_es_http2.jpg
HTTP/2 (mayo de 2015): Sus mejoras se enfocan en cmo se empaquetan los datos
y en el transporte. Protocolo de tipo binario.
HTML: Qu tecnologas sustentan y hacen funcionar internet?

HTML (HyperText Markup Language)

El lenguaje de marcas de hipertexto o HTML es la estructura base de todo sitio


web. Es el esqueleto que permite ordenar y delimitar el tipo de informacin que
se ubica en cada apartado o seccin del texto.

As entonces tenemos etiquetas para el ttulo <h1>, <h2>, <h3>, etc.


Etiquetas pare prrafos <p>
Enlaces <a>
Listas <ul><li><ol>
Tablas <table>
Divisiones <div>
https://upload.wikimedia.org/wikipedia/commons/thumb/8/
Entre otros 84/HTML.svg/270px-HTML.svg.png
CSS: Qu tecnologas sustentan y hacen funcionar internet?

CSS (Cascading Style Sheets)

La hoja de estilos en cascada es una hoja que se puede enlazar a un


documento HTML o insertar dentro del cdigo HTML para incluir estilos de
diseo, que permiten agregar color, ordenamiento avanzado de los bloques de
texto, e incluso en las ltimas versiones se pueden definir estilos animados.

Se le llama en estilos de cascada pues el cdigo de la hoja se lee desde arriba


hacia abajo (como una cascada) y por ende tendrn predominancia los estilos
que se ubiquen en la parte inferior de la hoja, pudiendo los que estn en la
parte de ms abajo sobreescribir las propiedades ingresadas en la parte
superior.
https://upload.wikimedia.org/wikipedia/commons/thumb/9/
93/CSS-shade.svg/338px-CSS-shade.svg.png
JavaScript: Qu tecnologas sustentan y hacen funcionar internet?

JavaScript

JavaScript (abreviado comnmente JS) es un lenguaje de programacin


interpretado, dialecto del estndar ECMAScript. Se define como orientado a
objetos y dinmico.

Se utiliza principalmente en su forma del lado del cliente (client-side),


implementado como parte de un navegador web permitiendo mejoras en la
interfaz de usuario y pginas web dinmicas.

Ms informacin en https://es.wikipedia.org/wiki/JavaScript

https://images2.alphacoders.com/778/778628.png
XML: Qu tecnologas sustentan y hacen funcionar internet?

XML

XML, siglas en ingls de eXtensible Markup Language, traducido como


"Lenguaje de Marcado Extensible" o "Lenguaje de Marcas Extensible", es un
meta-lenguaje que permite definir lenguajes de marcas desarrollado por el
World Wide Web Consortium (W3C) utilizado para almacenar datos en forma
legible.

XML no ha nacido nicamente para su aplicacin en Internet, sino que se


propone como un estndar para el intercambio de informacin estructurada
entre diferentes plataformas. Se puede usar en bases de datos, editores de
texto, hojas de clculo y casi cualquier cosa imaginable.
https://upload.wikimedia.org/wikipedia/commons/thumb/6/
68/XML.svg/275px-XML.svg.png
Ms informacin https://es.wikipedia.org/wiki/Extensible_Markup_Language
JSON: Qu tecnologas sustentan y hacen funcionar internet?

JSON

JSON, acrnimo de JavaScript Object Notation, es un formato de texto ligero


para el intercambio de datos. JSON es un subconjunto de la notacin literal de
objetos de JavaScript aunque hoy, debido a su amplia adopcin como
alternativa a XML, se considera un formato de lenguaje independiente.

Una de las supuestas ventajas de JSON sobre XML como formato de


intercambio de datos es que es mucho ms sencillo escribir un analizador
sintctico (parser) de JSON. (Es decir un lector)

Ms informacin https://es.wikipedia.org/wiki/JSON
https://sbalagop.files.wordpress.com/2015/04/json.png
RSS: Qu tecnologas sustentan y hacen funcionar internet?

RSS

Really Simple Syndication (RSS) o Redistribucin Realmente Simple es una tecnologa para
compartir o seguir informacin a travs de la red, que permite conocer de primera fuente las
ltimas actualizaciones de inters para el usuario.

Es un formato XML para distribuir contenido en la web. Se utiliza para difundir informacin
actualizada frecuentemente a usuarios suscritos a la fuente de contenidos. El formato
permite distribuir contenidos sin necesidad de un navegador, utilizando programas llamados
agregadores de noticias.

NOTA: A menudo RSS se utiliza de forma indistinta junto al estndar ATOM y en su conjunto
se les llama Feed o alimentadores, pero su principal diferencia fue la incorporacin de la
etiqueta <update> en ATOM, para indicar actualizaciones de contenido. Sin embargo RSS fue http://etc.usf.edu/te_mac/internet/i/rss1.jpg
la tecnologa ms masificada y utilizada.

Ms informacin https://es.wikipedia.org/wiki/RSS
Open Graph: Qu tecnologas sustentan y hacen funcionar internet?

Open Graph Protocol y Twitter cards

El protocolo Open Graph permite a cualquier sitio web convertirse en un


objeto con cualidades sociales. Por ahora, este es utilizado por la red social
Facebook para permitir a cualquier sitio web la obtencin de las mismas
cualidades de cualquier otro objeto en Facebook.

Su smil para la plataforma twitter son las Twitter cards que permiten dar un
formato ms atractivo y profesional al contenido que se comparte en dicha
red social. Misma capacidad que se agrega en Facebook al implementar esta
clase de mejores web.

Ms informacin http://ogp.me/
https://warfareplugins.com/open-graph-tags-twitter-cards-rich-pins/
Con qu tecnologa crearemos nuestro Newsbot?

De las tecnologas revisadas, RSS es la nica de tipo independiente y abierta, creada especficamente para
distribucin de noticias y artculos.

Aunque su auge fue en la segunda mitad de los 2000 (despus del 2005) an es una tecnologa vigente y que, por
ejemplo, est instalada por defecto en todos los portales que funcionan con Wordpress. Lo que al ao 2017
representa poco ms del 23% de las web del mundo con 76 millones de sitios y un poco ms del 60% del mercado de
CMSs (administradores de contenido).

Los principales portales de noticias del mundo cuentan con canales de distribucin RSS, las alertas de google se
pueden configurar con rss, los resultados del buscador Bing, Google news, los resultados de los buscadores de avisos
clasificados y una amplia gama de contenidos a los que todava hoy podemos seguir a travs de esta tecnologa de
distribucin.
Por qu aprender a crear un Newsbot?

1. Ser una ventaja competitiva ante otros Community que slo realizan las tareas de forma manual.

2. El proceso de curatora de contenidos nos ayudar a crear nuestras propias herramientas para nutrirnos de
contenidos fresco y encontrar inspiracin.

3. Al tener acceso a los computadores, la automatizacin de las tareas repetitivas ms que un derecho es un
deber (para ello inventamos las mquinas).

4. Al automatizar contenido podremos dedicarnos a otras actividades ms enriquecedoras o, si lo deseamos, a


administrar ms cuentas de clientes de las que podramos, sin la ayuda de esta clase de herramientas.

5. Para testear nichos de clientes, negocios y contenidos.

6. Porque el presente es de los robots y aprender a crearlos nos ayudar a convivir y entender mejor la realidad.
Qu herramientas vamos a utilizar?

1. Google Alerts https://www.google.cl/alerts

2. Digg Reader http://digg.com/reader

3. IFTTT https://ifttt.com/

4. Zapier https://zapier.com/

5. Buffer https://buffer.com/

6. Dlvr.it https://dlvrit.com/

7. Grepsr https://www.grepsr.com/

8. Cronycle https://cronycle.com/

Você também pode gostar