Big Data: la información que no controlamos

Autor: | Posteado en Tecnología Sin comentarios

¿Por qué debe interesarme saber qué es Big Data? Esa, y solamente esa, es la consulta que debemos preocuparnos por responder.

En digital, a la vez nos movemos en un universo que evoluciona minuto a minuto, dinámico, funcional y cambiante: ¡como la vida misma! Estructurar vuestro trabajo (y parte de vuestra vida) a través de contenidos en Internet, cree dos cuestiones que pueden parecer redundantes a priori: estructurar vuestro trabajo a partir de contenidos y estructurar vuestro trabajo a través de medios digitales.

Por ello, no es extraño tener presente que las nuevas tecnologías avanzan a través de los contenidos que, como comunidad, hemos estructurado (bien definidos en dimensión y formato), no organizado (recolectados y almacenados en su formato original, como los PDF) y semiestructurado (datos sin campos limitados, no obstante con marcadores para separarlos, como el formato XML o el HTML).

Aquí es donde entra en juego Big Data como un mecanismo para procesar y analizar aquella info(datos). que no puede procesar o analizar el software con el que, tradicionalmente, contamos.

Es la revolución de los datos masivos: ¡Big Data!

Hablando claro, Big Data son todos aquellos sistemas informáticos, englobados dentro de las TIC (Tecnologías de la Información y la Comunicación), pueden identificar patrones recurrentes en un número enorme de datos.

Hoy, el desarrollo descontrolado de datos e info(datos). cree cinco problemas de distinto naturaleza:

#1 Almacenamiento

¿Podemos almacenar info(datos). de forma casi infinita sin afectar a los procesos de búsqueda, compartición, análisis y visualización? En términos de bytes, estaríamos conversando de que un gigabyte corresponde a un millón de bytes, y que las necesidades recientes han llevado hasta los zetabytes 1021.

#2 Búsqueda

En el interior de estos volúmenes enormes de datos a la vez puede ser problemático hallar aquello que realmente estamos buscando, así como inventar patrones que diferencien los datos entre sí.

#3 Compartir

Y, por supuesto, al igual que ocurrió con los problemas de resolución de las primeras pantallas en ultra alta definición, puede ser complicado que la tecnología alcance la capacidad de colaborar todos estos datos. A menudo, los datos han crecido a una rapidez mayor que la tecnología de transferencia y procesado.

Agregados a ello, están el punto #4 y #5, que no son más que los problemas de analizar e inclusive visibilizar todos estos datos.

¿Y esa explosión de datos de dónde surge?

¿Pero cómo ha sido probable este enorme volumen de datos sin control? La explicación más sencilla se descubre en la era digital y en el uso que todos nosotros hacemos de Internet (Facebook, Twitter® o Reddit), y a la vez en los datos censales o médicos que la Administración ha digitalizado durante las últimas décadas.

Facebook y Twitter® sirven, perfectamente, como ejemplo para esto, verás:

  • Se escriben tantos tweets diarios que, diariamente se ocupan 12(doce) terabytes de información: ¡12 TB con msjes de 160 caracteres!
  • En Facebook, en cambio, se almacenan entre fotos y videos 100 petabytes (1015) cada veinticuatro horas

A todo ello, se suma la variedad de estos datos, tanto en lo que se refiere a aparatos como en lo que posee relación con la forma de expresarlos a lo extenso y ancho del mundo. Dispositivos smartphones como smartphones inteligentes, tablets o wearabless, sistemas GPS, medidores eléctricos, sensores digitales y muchos otros elementos que no solo requieren una acertada rapidez de carga, sino a la vez de resolución en sus procesos. En estos campos es donde una solución Big Data puede brillar por sí misma.

Como ya hemos identificado, hay un 1.er campo que a todos se nos ocurre rápidamente: el contenido web-site vinculado a blogs y redes sociales. ¿Pero qué más procesos de datos masivos pueden requerir de una solución Big Data?

  • Comunicaciones M2M (Machine-to-Machine) que capturan algún evento concreto (velocidad, presión, salinidad…) y que transfieren a otros sistemas la información
  • Big Transaction Data de registros de facturación o telecomunicaciones
  • Información biométrica (huellas digitales, escaneo retinal, cadenas de ADN…), básica para la investigación científica y tecnológica
  • Información generada por humanos (human generated) a través de llamadas a call-center, correos electrónicos y un extenso etcétera

En estas situaciones y en todas las que se derivan una solución Big Data admite inventar patrones de búsqueda para analizar, comparar, buscar, mirar y llegar a un resultado concreto a enorme velocidad.

Llegados a este punto, puede surgir la incertidumbre de para qué queremos continuar empleando bases de datos tradicionales si hablamos con conclusiones Big Data, no obstante esto no posee un sentido real, ya que Big Data complementa a las BBDD y viceversa. Cada sistema posee sus pros y sus contras y continuamente funcionarán mejor unidos que por separado; así, una solución Big Data, probablemente, estará centrada en la búsqueda rápida y exacta de patrones y una BBDD planteada para soportar toda esa info(datos). y su carga.

Hoy, los campos relacionados con ámbitos científico-técnicos continuan en incesante cambio, y las conclusiones Big Data se han consolidado como un enorme aliado de la ciencia, no obstante a la vez de la educación, la droga o las apps militares. Y es que Big Data es la solución que nos admite controlar la información, y continuar cambiando el universo que nos rodea.

The post(artículo) Big Data: la info(datos). que no controlamos appeared first on Blog ASUS.

Blog ASUS


Fuente del contenido original se encuentra más arriba (enlace), respetando todos los derechos de autor.

La prensa de Core i7

También puedes revisar estas noticias relacionadas.

Agrega tu comentario