Warning: preg_replace(): The /e modifier is no longer supported, use preg_replace_callback instead in /home1/mrcitech/public_html/modules/bootstrap.php on line 272
Big Data y el Internet de las Cosas (IoT) – MRCI Technology
Cargando...
portadaiot

Big Data y el Internet de las Cosas (IoT)

El término Internet de las Cosas (IoT) es un término que se escucha con mayor frecuencia en los últimos meses y  se refiere en forma simple a todas las cosas cotidianas de las que hacemos uso y que se conectan a Internet.

Entre los dispositivos conectados se encuentran:

  • Computadoras, laptops, smartphones, tabletas
  • Aparatos electrodomésticos: Refrigeradores, tostadoras, Smart TVs
  • Cámaras, Videocámaras
  • Portables:  Smartwatch
  • Automóviles
  • Sistemas de calefacción, sensores

De acuerdo al análisis realizado por Gartner, se estima que  20.400 millones de objetos inteligentes estarán en funcionamiento para finales de la década, en ese sentido, cuando acabe el presente curso (20017), ya habrá 8.400 millones de cosas conectadas en todo el mundo, un 31% más que en 2016, lo que  supondrá un gasto de más de 1,6 billones en 2017 y de más de dos billones de dólares en inversiones el próximo 2018.

IoT tiene una gran relevancia, ya que repercute en todos los ámbitos de la vida cotidiana, sobre educación, la comunicación, las empresas, la ciencia, el gobierno, la economía, el ambiente, claramente los dispositivos generan una masiva cantidad de datos y es ahí donde juega un papel fundamental big data, para extraer, tratar y  analizar todos esos datos, ya que el big data permite crear valor a partir de hacer la información transparente y utilizable, pues es en los datos se pueden identificar tendencias futuras o soluciones a problemas del pasado.

bigdata1iot3

 

Sin embargo, uno de los retos para los científicos de datos es elegir las plataformas y la arquitectura adecuada para la integración y el análisis de cantidades masivas de datos proveniente de dispositivos mientras se realiza una serie de análisis y flujos de trabajo de procesos empresariales sobre dichos datos.

Entre los puntos a considerar para la implementación de IoT, se listan los siguientes:

  • DataFrames

El primer punto que debemos considerar es la conectividad de los dispositivos, la clave para conectarse a los dispositivos son los protocolos de red Ethernet, Wi-Fi y celular que se conectan directamente a Internet, otros protocolos necesitan un dispositivo de puerta de enlace para conectarse Bluetooth, RFID, NFC, Zigbee.

Para ubicaciones remotas hay dispositivos más potentes como el Arrow BeagleBone Black Industrial y MyPi Industrial..

Una herramienta ideal para trabajar con los diferentes dispositivos, metadatos, protocolos, formatos de datos y tipos de datos en constante evolución es Apache NiFi, que permite  flexibilidad de ingerir formatos de archivo, tamaños, tipos de datos y esquemas cambiantes. Ya sea los dispositivos envíen XML hoy y mañana JSON, entre otros variados formatos.

  • Capa de datos y middleware

En este punto es recomendable utilizar una plataforma de Big Data con capacidades nativas de middleware orientado a mensajes (MOM) para ingerir datos del dispositivo, en la que se procesaran también los datos en lotes o en tiempo real, de acuerdo a las necesidades del negocio.

Entre las herramientas que se pueden utilizar para el procesamiento están:

Apache Storm: es un motor de computación en tiempo real distribuido que procesa de forma fiable flujos de datos sin límites.

Apache Spark: es una plataforma de computación en clúster de código abierto, tal como vimos en la unidad anterior.

Apache Hadoop: es un framework de software que permite el almacenamiento distribuido y el procesamiento de grandes conjuntos de datos utilizando modelos sencillos de programación de alto nivel.

Apache Kafka: es un sistema de mensajería en tiempo real distribuido que proporciona una gran durabilidad y tolerancia a fallos.

  • Nivel de aplicación

Ya que se cuenta con los datos provenientes de los diversos dispositivos, lo siguiente es realizar la agregación de los datos, transformación, limpieza, clasificación, entre otros, lo cual puede llegar a ser muy complejo si no se cuenta con las herramientas adecuadas para almacenamiento y procesamiento.

Una infraestructura basada en la nube, por su capacidad de proporcionarnos recursos de computación, red y almacenamiento altamente escalables es idónea.

Nos encontramos en un momento muy emocionante a la hora de trabajar en computación paralela y big data, el gran volumen de datos que hoy en día se genera en todos los campos de la industria y la ciencia está revolucionando la forma como interactuamos con las aplicaciones, creamos productos y estudiamos el mundo a nuestro alrededor. Al mismo tiempo, las herramientas necesarias para trabajar con estos datos se han vuelto más fáciles de usar que nunca, puesto que los desarrolladores las han hecho accesibles a más y más usuarios, requiriéndoles menos esfuerzo para adoptarlas.

 

Fuentes

THARRINGTON, M. (n.d.). The guide to Big Data Data Science & Advanced Analytics. IV, 1-10. Retrieved May 15, 2017

Iglesias Fraga, A. (2017, February 07). Internet de las Cosas: 8.400 millones de dispositivos conectados cuando acabe 2017. Retrieved May 15, 2016, from http://www.ticbeat.com/innovacion/internet-de-las-cosas-8400-millones-dispositivos-conectados-2017/

(Visited 17 times, 1 visits today)

Deja un comentario