Bases de Datos en R

Bases de Datos – Mcoder.AI

Mcoder.AI

Linkedin: Aranza Armas Twitter: @AArmasR

Día con día, diferentes empresas generan y manejan una gran cantidad de datos, ya sean de tipo financiero, personal, industrial, inventario, entre otros. Es por ello que es aconsejable tenerlos en un formato ordenado y con altos niveles de acceso. De esta manera, cuando los analicemos, será más fácil encontrar y consultar la información. Una manera de conseguirlo es mediante las base de datos.

¿Qué es una base de datos?

Se le conoce cómo base de datos, databases o BD a un conjunto de información perteneciente a un mismo contexto. Los datos suelen presentarse de manera ordenada y sistemática para su recuperación, análisis y/o transmisión. Actualmente existen muchas formas de bases de datos, que van desde una biblioteca hasta los vastos conjuntos de datos de usuarios de una empresa de telecomunicaciones.

Las bases de datos son el producto de la necesidad humana de almacenar la información, es decir, de preservarla contra el tiempo y el deterioro, para poder acudir a ella posteriormente. En ese sentido, la aparición de la electrónica y la computación brindó el elemento digital indispensable para almacenar enormes cantidades de datos en espacios físicos limitados, gracias a su conversión en señales eléctricas o magnéticas.

Bases de Datos en R – Mcoder.AI

Paquete readr

Existen muchos formatos para presentar una base de datos, por ejemplo formatos de texto como archivos csv, archivos xml, archivos txt, archivos stata, SPSS o incluso BD provenientes de un navegador web. 

El paquete readr es uno de los más populares y utilizados al importar bases de datos en R. El objetivo de readr es proporcionar una forma rápida y sencilla de leer datos rectangulares (como csv, tsv y fwf), ya que está diseñado para analizar de manera flexible muchos tipos de datos encontrados en la mayoría de BD. El paquete readr admite siete formatos de archivo con siete funciones read_:

read_csv(«archivo.csv»)

Archivos separados por comas (.csv).

read_delim(«archivo.txt», delim= «|»)

Archivos delimitados generales (.txt).

read_fwf(«archivo.fwf»)

Archivo de ancho fijo, read_table() ó read_tsv(«archivo.tsv») son archivos separados por tabuaciones, dónde las columnas están separadas por espacios en blanco.

read_log()

Archivos de registro web.

Otro tipo de datos

Para casos distintos, existen más paquetes para importar todo tipo de archivos con formatos cómo:

  • haven: archivos SPSS, Stata y SAS
  • readxl: archivos de Excel (.xls y .xlsx)
  • DBI: bases de datos
  • jsonlite: json
  • xml2: XML
  • httr: API web
  • rvest: HTML (Web Scraping)

Si te interesa utilizar R para hacer ciencia de datos, instalar estos paquetes te será de mucha ayuda, ya que contar con las herramientas necesarias para la importación de bases de datos es el primer paso para generar un análisis de datos exitoso.

– Aranza Armas

Data Science

Dejar una contestacion

Tu dirección de correo electrónico no será publicada.