Cuando uno se pone a pensar en la gran cantidad de datos que almacena Internet, también se pone a pensar en ¿Cuál es el mecanismo de búsqueda que se utiliza para poder hacer más rápido la navegación dentro del Internet?

HDFS.

La investigación de la Universidad de Saarland hace que la busqueda sea más rápida y muy eficiente.

Las grandes cantidades de información que maneja Google, Facebook y otras empresas de Internet,  son comparables a las cantidades de datos que algunas instituciones de investigación como el “Laboratorio Europeo para la Física de Partículas” usan. Generalmente estas bases de datos son demasiadas grandes, y lo que tienen que hacer estos centros de investigación son manejar estos datos de una forma muy abstracta.

Existe en la web un código abierto que está favoreciendo de una manera inimaginable a estos centros de investigación, el código es conocido como “Apache Hadoop” que es un gran framework de software que permite trabajar con gran cantidad de datos, aproximadamente peta bytes de datos y con miles de nodos a al vez. El “Apache Hadoop” es un código que se genera por inspiración de los documentos de Google para MapReduce y Google File System. Este framework trabaja con el sistema de archivos distribuidos, escalable y portátil HDFS que fue escrito en código Java.

La ayuda que brinda el Apache Hadoop, no es buscar en una base de datos grandísimas; sino que colabora con su sistema de archivos distribuidos HDFS. Ya que un proyecto en Alemania llamando Biblioteca de Indexación Agresiva de Hadoop o “HAIL” almacena grandes cantidades de información en HDFS, este proyecto está siendo realizado por el equipo de Jens Dittrich, que es  profesor de Informática en la Universidad de Saarland, en Alemania. Lo que permite este proyecto es hacer una búsqueda 100 veces más rápido de lo acostumbrado, también se comentó que el proceso de indexación no toma tiempo al computador y mucho menos ocupa gran espacio.

Agregue un comentario

Su dirección de correo no se hará público. Los campos requeridos están marcados *