Big Data

¿Qué es?, características, ¿Cómo funciona? y ejemplos

Big Data – Mcoder.ai

Big Data ¿Qué es?, características, ¿Cómo funciona? y ejemplos

¿Te imaginas toda la cantidad de información que tu generas al utilizar un smartphone?

Generas una gran cantidad de información en forma de textos, fotos, correos electrónicos, videos, música, búsqueda en páginas de internet, llamadas, etc.

Ahora multiplícala por toda la información que genera cada uno de los usuarios de un smartphone.

¿Puedes imaginar toda esa cantidad de información?

Ahora pensemos en internet…..

Te imaginas toda la información que cada persona genera al compartir Snapchats, hacer una búsqueda en Google, Revisar su Facebook, ver videos en Youtube, enviar mails, etc.

Para que te des una idea te comparto la infografía anual de Lori Lewis y Chadd Callahan , el cual muestra lo que sucede en Internet en un minuto .

A todos estos datos masivos se les considera Big Data.

Hay varias definiciones para Big Data, pero en general lo que engloban estas definiciones es que el Big Data es un conjunto de herramientas y tecnología que pueden recibir, almacenar y procesar un gran volumen y variedad de datos.

La mayoría de los autores habla sobre 5 características del Big Data aunque hay algunos que manejan 7 o hasta 10. A estas características se les conoce como las V´s. En este artículo nos enfocaremos en las 5´v principales y las utilizaremos con une ejemplo enfocado al sector médico.

Volumen: El volumen significa gran tamaño, lo podríamos considerar como datos masivos por lo que no se podrían manejaren en un simple ordenador, es necesario tecnología especifica.

Imagínate la cantidad de hospitales, clínicas, centros de salud, etc. alrededor del mundo los cuales generan gran cantidad de información minuto a minuto.

Velocidad: se refiere a un flujo de datos masivo y constante. Cuando hablamos de Big Data hablamos que se genera y almacenan datos a gran volumen lo que genera que la información quede desfasada rápidamente y pierda su valor al aparecer datos nuevos.

Ahora para nuestro ejemplo imagina a qué velocidad se crean todos los reportes, exámenes médicos, etc.

Variedad: La información tiene diversidad de formatos y estructuras.  Para explicar esta característica es importante mencionar la forma en que se divide la información:

  • Datos estructurados que son bases de datos en un formato, longitud y denominación predefinido. Ejemplos: ERP, CRM, etc.
  • No estructurados que son los que no tienen una estructura alguna predefinida. Ejemplos imágenes, vídeos, archivos logs, audios, etc.
  • Semiestructurados que son los que “no tienen estructura fija, pero contienen etiquetas y otros marcadores que ayudan a su comprensión”. Ejem documentos con lenguaje HTML, XML o SGML.

Para nuestro ejemplo:

Los datos estructurados podrían ser reportes en Excel o los resultados realizados en algún laboratorio.

Los semiestructurados podría ser la verificación semanal de las hojas de tratamientos de radioterapia externa mediante el uso de logfiles.

Los no estructurados podrían ser las radiografías, los escáneres o resonancias.

Veracidad:  Es el grado de confianza de los datos a utilizar. Se deben eliminar los datos tomados de manera incorrecta y detectar los patrones reales lo cual es todo un reto del Big Data.

 En nuestro ejemplo es importante determinar qué tan exacta e integra es la información.

Valor: Es el valor que generan los datos una vez convertidos en información, como por ejemplo identificar patrones de comportamiento, hacer predicciones de compra, identificar nuevas oportunidades de negocio, etc.

Para nuestro ejemplo la información nos puede dar valor para detectar y prevenir enfermedades, mejorar tratamientos y reducir costos.

Pero ¿Cómo se guarda y procesa toda esta información?

Para ello utilizamos los llamados Frameworks como Hadoop. Lo que hace Hadoop es dividir toda la información y guardarla en varios servidores.

Además, se genera una copia de los archivos y se almacena en los diferentes servidores de forma distribuida para así asegurar que si se descompone o falla algún servidor tu información quedaría resguardada en otro de los servidores. A esto se le conoce como procesamiento paralelo.

Con todo ello se logra que la información se pueda procesar de forma rápida y segura, además de que sea más fácil analizarla.

Otros ejemplos en los que se utiliza el Big data son:

Optimización de la gestión de tráfico en las ciudades al conocerse el comportamiento mas habitual de los conductores.

Marketing y ventas al predecir de antemano los gustos y necesidades de los consumidores, así como su evolución.

Ciencia y salud al decodificar cadenas de ADN en minutos.

Deportes para definir las estrategias a utilizar en cada partido, prevenir lesiones de los jugadores, conocer las preferencias de los aficionados, etc.

Lyssette Molinar

Dejar una contestacion

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *