¿Qué es BIG DATA? Introducción, Tipos, Características y Ejemplo

in #big5 years ago

¿Qué es Data?

Las cantidades, los caracteres o los símbolos en los que una computadora realiza operaciones, que pueden almacenarse y transmitirse en forma de señales eléctricas y registrarse en medios de registro magnéticos, ópticos o mecánicos.

¿Qué es Big Data?

Big Data también es un dato, pero con un tamaño enorme. Big Data es un término usado para describir una colección de datos que es enorme en volumen y que sin embargo crece exponencialmente con el tiempo. En resumen, tales datos son tan grandes y complejos que ninguna de las herramientas tradicionales de manejo de datos son capaces de almacenarlos o procesarlos eficientemente.

ver más sobre qué es el big data

Ejemplos de Big Data

A continuación se presentan algunos ejemplos de Big Data-

La Bolsa de Valores de Nueva York genera alrededor de un terabyte de nuevos datos comerciales por día.

Medios de comunicación social

La estadística muestra que más de 500 terabytes de nuevos datos son ingeridos en las bases de datos del sitio de medios sociales Facebook, todos los días. Estos datos se generan principalmente en términos de subir fotos y videos, intercambio de mensajes, poner comentarios, etc.

Un solo motor a reacción puede generar 10+terabytes de datos en 30 minutos de vuelo. Con muchos miles de vuelos por día, la generación de datos alcanza hasta muchos Petabytes.

Tipos de Big Data

BigData' se puede encontrar en tres formas:

*Estructurado.
*No estructurado.
*Semiestructurado.

Estructurado

Cualquier dato que pueda ser almacenado, accedido y procesado en forma de formato fijo se denomina dato "estructurado". A lo largo del tiempo, el talento en informática ha logrado un mayor éxito en el desarrollo de técnicas para trabajar con ese tipo de datos (cuando el formato es bien conocido de antemano) y también en la obtención de valor a partir de ellos. Sin embargo, hoy en día, estamos previendo problemas cuando un tamaño de tales datos crece en gran medida, los tamaños típicos están en la furia de los múltiples zettabytes.

¿Sabe usted? 1021 bytes iguales a 1 zettabyte o mil millones de terabytes forman un zettabyte.

Mirando estas cifras uno puede entender fácilmente por qué se da el nombre de Big Data e imaginar los desafíos que implica su almacenamiento y procesamiento.

¿Lo sabe usted? Los datos almacenados en un sistema de gestión de base de datos relacional es un ejemplo de un dato "estructurado".

Ejemplos de datos estructurados

Una tabla de 'Empleados' en una base de datos es un ejemplo de Datos Estructurados

Employee_ID Employee_Name Gender Department Salary_In_lacs
2365 Rajesh Kulkarni Male Finance 650000
3398 Pratibha Joshi Female Admin 650000
7465 Shushil Roy Male Admin 500000
7500 Shubhojit Das Male Finance 500000
7699 Priya Sane Female Finance 550000

No estructurado

Cualquier dato con forma o estructura desconocida se clasifica como dato no estructurado. Además de su enorme tamaño, los datos no estructurados plantean múltiples problemas en cuanto a su procesamiento para obtener valor a partir de ellos. Un ejemplo típico de datos no estructurados es una fuente de datos heterogénea que contiene una combinación de simples archivos de texto, imágenes, vídeos, etc. Las organizaciones actuales disponen de una gran cantidad de datos, pero lamentablemente no saben cómo obtener valor de ellos, ya que estos datos están en su forma bruta o en formato no estructurado.

Ejemplos de datos no estructurados

La salida devuelta por la 'Búsqueda de Google'

061114_0759_WhatIsBigDa5.png

Semiestructurado

Los datos semiestructurados pueden contener ambas formas de datos. Podemos ver los datos semi-estructurados como una forma estructurada pero en realidad no está definida con, por ejemplo, una definición de tabla en el DBMS relacional. Un ejemplo de datos semi-estructurados es un dato representado en un archivo XML.

Ejemplos de datos semiestructurados

Los datos personales almacenados en un archivo XML...

El crecimiento de los datos a lo largo de los años

big-data-growth.jpg

Tenga en cuenta que los datos de la aplicación web, que no están estructurados, consisten en archivos de registro, archivos de historial de transacciones, etc. Los sistemas OLTP están construidos para trabajar con datos estructurados en los que los datos se almacenan en relaciones (tablas).

Características de Big Data

i) Volumen - El nombre de Big Data en sí mismo está relacionado con un tamaño que es enorme. El tamaño de los datos juega un papel muy crucial en la determinación del valor de los datos. También, si un dato en particular puede ser considerado como un Big Data o no, depende del volumen de los datos. Por lo tanto, el "volumen" es una característica que debe ser considerada cuando se trata de datos grandes.

ii) Variedad - El siguiente aspecto de Big Data es su variedad.

La variedad se refiere a fuentes heterogéneas y a la naturaleza de los datos, tanto estructurados como no estructurados. Durante los primeros días, las hojas de cálculo y las bases de datos eran las únicas fuentes de datos consideradas por la mayoría de las aplicaciones. Hoy en día, los datos en forma de correos electrónicos, fotos, vídeos, dispositivos de vigilancia, PDF, audio, etc. también se consideran en las aplicaciones de análisis. Esta variedad de datos no estructurados plantea ciertos problemas para el almacenamiento, la extracción y el análisis de los datos.

iii) Velocidad - El término "velocidad" se refiere a la velocidad de generación de datos. La rapidez con que se generan y procesan los datos para satisfacer las demandas, determina el potencial real de los datos.

La gran velocidad de los datos trata de la velocidad a la que los datos fluyen desde fuentes como procesos de negocios, registros de aplicaciones, redes y sitios de medios sociales, sensores, dispositivos móviles, etc. El flujo de datos es masivo y continuo.

iv) Variabilidad - Se refiere a la incoherencia que pueden mostrar los datos a veces, lo que dificulta el proceso de poder manejar y gestionar los datos con eficacia.

Beneficios del gran procesamiento de datos

La capacidad de procesar Big Data trae múltiples beneficios, tales como...

Las empresas pueden utilizar la inteligencia externa mientras toman decisiones

El acceso a los datos sociales de los motores de búsqueda y sitios como facebook, twitter están permitiendo a las organizaciones afinar sus estrategias comerciales.

Mejora del servicio al cliente

Los sistemas tradicionales de retroalimentación de los clientes están siendo reemplazados por nuevos sistemas diseñados con tecnologías de Big Data. En estos nuevos sistemas, las tecnologías de procesamiento de Big Data y de lenguaje natural se están utilizando para leer y evaluar las respuestas de los consumidores.

Identificación temprana del riesgo para el producto/servicio, si lo hay
Mejor eficiencia operativa

Las tecnologías de Big Data pueden utilizarse para crear una zona de ensayo o de aterrizaje para los nuevos datos antes de identificar qué datos deben trasladarse al almacén de datos. Además, esa integración de las tecnologías Big Data y el almacén de datos ayuda a una organización a descargar datos a los que se accede con poca frecuencia.