A así como en el fondo del mar, una parte de la Web contiene mundos desconocidos para los internautas.
A través de la nueva tecnología de análisis y clasificación de información del conjunto de herramientas de búsqueda Memex, la Agencia de Proyectos de Investigación Avanzados de Defensa de Estados Unidos (DARPA, en inglés) busca explorar la llamada “Red profunda”.
En las profundidades, la Red alberga un gran porcentaje de contenidos no indexados, a los que no se puede llegar a través de buscadores como Google o Bing.
Esto es del interés de las agencias de seguridad e inteligencia a nivel mundial, que desean descubrir operaciones de trata de personas y otras actividades ilegales que ocurren en la inmensa “dark Web” (o “red oscura”), que concentra entre el 80 y 95 por ciento de contenidos a los que no tenemos acceso.
Pero también le interesa a la NASA. Un equipo de investigadores del Laboratorio de Propulsión a Chorro (JPL) de la agencia espacial estadounidense, se ha unido al proyecto para aprovechar los beneficios de Memex como una herramienta de apoyo para la ciencia.
Esta herramienta ayudaría a catalogar la enorme cantidad de datos enviados diariamente por las naves en órbita de la NASA, señala un comunicado.
“Estamos desarrollando tecnologías de búsqueda de nueva generación capaces de comprender a las personas, lugares, cosas y las conexiones existentes entre los mismos”, dice Chris Mattmann, investigador principal del proyecto Memex en el JPL.
Memex apunta a convertirse en el primer motor de búsqueda capaz de registrar todas las páginas Web no indexados por los buscadores comunes, incluidas las imágenes, los videos, anuncios pop-up, formularios, scripts y otras formas en las que se almacena la información para observar la forma en la que éstas se relacionan entre sí.
“Estamos acrecentando los rastreadores Web para que se comporten como navegadores (…). Esta información normalmente no es catalogada por los motores de búsqueda”, explica Mattmann.
A diferencia de los buscadores comunes, Memex reconoce información oculta en imágenes y videos, y vincular la misma con búsquedas sobre los mismos temas.
La herramienta de búsqueda puede identificar el mismo objeto a través de muchos fotogramas de un video o incluso diferentes videos.
La NASA busca sacar provecho precisamente de dichas capacidades, lo que beneficiaría el procesamiento de fotografías, videos y otros tipos de datos de imágenes tomadas en sus misiones espaciales.
“Buscar información visual sobre un cuerpo planetario en particular podría facilitar en gran medida el trabajo de científicos en el análisis de las características geológicas”, agrega el comunicado.
También se verían beneficiados “los científicos que analizan los datos de imágenes de las misiones terrestres que monitorean fenómenos como la nieve y la humedad del suelo”.
La tecnología de Memex también podría mejorar la búsqueda de datos científicos publicados, además de aplicarse a los grandes centros de datos de la NASA, como el Centro de Archivo Activo Distribuido de Oceanografía Física, que hace los datos oceánicos y climáticos de la agencia espacial más accesibles y significativos.