Conoce algunas funcionalidades del lenguaje de programación

Andrés Toro
6 de agosto de 2018
3 min. de lectura

Quizás, en algún momento, escuchaste que el equipo de datos de una compañía hace sus labores con un lenguaje de programación llamado R, pero crees que esta herramienta se emplea únicamente para obtener estadísticas descriptivas o administrar bases de datos como en Excel.

No, este lenguaje de programación va mucho más allá, cuenta con funcionalidades interesantes para el análisis de datos, maneja grandes volúmenes de información, realiza presentaciones gráficas de alta calidad y automatiza procesos complejos o demorados.

Esta multiplataforma funciona en diferentes tipos de sistemas operativos (Mac, Windows, Unix, Linux), se puede usar por cualquier persona y desde cualquier lugar de forma gratuita.

Mostraré algunas de las ventajas de R para que uses y aproveches esta herramienta en tu empresa.

Extracción de datos de sitios web

Con R es posible extraer información que se visualiza en una página web y almacenarla en una base de datos. Con  R se puede acceder al código HTML del sitio web y usar la información que contiene dicho código. Esto aplica tanto para datos de texto, como para imágenes.

Piensa que quieres hacer un análisis de los principales temas de las revistas más importantes del país, para ello, necesitas agrupar en un solo lugar los títulos de las noticias de primera plana de las revistas virtuales seleccionadas. Si lo realizas de forma manual es muy tedioso y desgastante, pues tendrás que revisar al menos cuatro portales web y copiar uno a uno los títulos de las noticias.

En cambio, R permite agilizar el proceso extrayendo dicha información de forma automatizada, sin tener que ingresar a los portales para revisar cada una de las noticias.

El ejemplo anterior es una pequeña muestra, pero considera que este ejercicio lo puedes realizar con cualquier página web que desees, con la posibilidad de obtener datos que quizás no encuentres en ningún otro espacio; y que lo único que necesitas es conocimientos en R y códigos HTML.

Muestra datos en imágenes

A la hora de presentar los resultados de un análisis de datos, es común hacer uso de algún componente visual, ya sea para facilitar la comunicación o captar la atención posible de los espectadores.

En este sentido, R ofrece la capacidad de ejecutar una amplia gama de gráficas para mostrar un conjunto de datos. Estas gráficas cuentan con un componente visual amigable para el usuario final, a la vez que son fáciles de realizar y de interpretar.

La gama de gráficas va desde un sencillo histograma hasta elementos en tres dimensiones, con la capacidad de moldear las gráficas por colores, tamaños y formas, de tal manera que se ajusten lo mejor posible a los datos que queremos mostrar.

Crear nubes de palabras

Nube de palabras

En algunas ocasiones, la información que se requiere analizar es un conjunto de texto, y por lo tanto, los métodos que se aplican para un análisis numérico pierden validez. En estos casos, las nubes de palabras son muy útiles porque brindan un resumen gráfico de los elementos más representativos y reducen el tiempo de análisis de horas a unos pocos minutos.

Para aprender más sobre nubes de palabras consulta el artículo: ¿Qué son las nubes de palabras?

El uso de este instrumento visual es válido para cualquier conjunto de texto, pero los más comunes son los análisis de resultados de una encuesta que busca conocer la opinión de los usuarios frente a un producto o servicio, así como los comentarios en una fan page.

El siguiente es un ejemplo de una nube de palabra de los comentarios en una fan page, donde se observan palabras relevantes como “puntos”, “curso”, “hacer” y “redimir”, lo que indica que los usuarios preguntan frecuentemente sobre cómo redimir los puntos y cómo pueden hacer unos cursos ofrecidos.

Conexión con otros programas

Al igual que otros programas, R tiene la capacidad de conectarse con otras herramientas. Un ejemplo de esto es la facilidad de enlazar un código de R con Google Earth, permitiéndonos tener a disposición todos los mapas que tiene dicho programa de visualización geográfico.

Con esta conexión, además, podemos marcar zonas geográficas de cualquier parte del planeta de acuerdo a unas características particulares; lo único que necesitamos para ello son las coordenadas geográficas de dichas zonas. La siguiente imagen es una muestra de lo anterior.

mapa, ejemplo

La invitación con este artículo es a conocer más a profundidad el lenguaje de programación R, que brinda muchas herramientas para obtener, procesar y visualizar la información, lo que permite explotar todo el potencial detrás de los datos.

Nuevo llamado a la acción

 

Te puede interesar

Otros artículos de Ciencia de datos

Suscríbete