¿Cuál Hadoop debo escoger para mis operaciones?

Soy Digital

El análisis de los datos cobra sentido cuando sus administradores entronizan Hadoop en sus operaciones, ya que según Gartner, esta es la tecnología estrella, sin embargo, ¿cuál es el más conveniente?

Róger Gutiérrez

 

Hadoop conserva su núcleo en función del paradigma de programación creado por Google, si bien ha florecido a su alrededor un rico ecosistema. Así, en torno a su versión open source, capaz de procesar grandes cantidades de datos, se ha ido diseñando y rediseñando el camino hacia el valor de big data desde aquella primera distribución open source de uso libre bautizada como Apache Hadoop, cuya enorme popularidad ha multiplicado los productos comerciales basados en ella.

 

Además, de forma constante, la comunidad internacional open source va manteniendo y actualizando Hadoop, corrigiendo errores y agregando estos nuevos paquetes para brindar funcionalidades que se adapten a los requerimientos de las corporaciones. 

 

Dentro de los principales sistemas Hadoop que usted puede utilizar para sus operaciones, se encuentra:

 

Además: ¿Por qué escoger un data center prefabricado?

 

Hadoop Distributed File System: es un sistema de archivos distribuido, escalable y portátil escrito en Java para el framework Hadoop. Cada nodo en una instancia Hadoop típicamente tiene un único nodo de datos; un clúster de datos forma el HDFS. La situación es típica porque cada nodo no requiere un nodo de datos para estar presente. Cada uno de estos sirve bloques de datos sobre la red usando un protocolo de bloqueo específico para HDFS. El sistema de archivos usa la capa TCP/IP para la comunicación; los clientes usan RPC para comunicarse entre ellos.

 

Amazon S3: Este se dirige a clústers almacenados en la infraestructura del servidor bajo demanda Amazon Elastic Compute Cloud. No hay conciencia de racks en este sistema de archivos, porque es todo de manera remota.

 

FTP: Almacena todos sus datos en un servidor FTP accesible remotamente.

 

HTTP y HTTPS: Codifica la  información y la traduce a modo de lectura, sirve principalmente para el análisis de pequeños datos.

 

Para escoger el Hadoop adecuado primero se debe tener clara la información que se desea analizar y luego valorar la capacidad de análisis que poseen sus sistemas.

Este artículo está clasificado como: , , , , , , , , ,

Comentarios

Para poder comentar debe iniciar su sesión:

INGRESAR