Proyectos en desarrollo
Esta es una lista incompleta de proyectos y de apuestas tecnológicas en las que Datanalytics está embarcado.
Integración de KNIME con R
KNIME es una plataforma de minería de datos desarrollada en Java que tiene la propiedad de ser fácilmente extendible mediante la creación de nodos adicionales que pueden programarse, incluso, en R.
Creemos que la creación de módulos específicos que implementen algoritmos a medida de las necesidades de nuestros clientes sobre dicha plataforma es una manera adecuada de distribuir y pasar a producción...
Hadoop/MapReduce
El tamaño de los conjuntos de datos susceptibles de ser estudiados mediante técnicas de minería de datos puede exceder con creces la capacidad de cálculo de las máquinas actuales.
Mediante la combinación de Hadoop (como capa de almacenamiento) y MapReduce (capa lógica) pueden analizarse sobre redes de ordenadores (posiblemente en la nube de Amazon u otras) conjuntos de datos de un tamaño impensable pocos años atrás.
Datanalytics está investigando estas nuevas tecnologías para poder ayudarle a analizar sus datos sobre plataformas de hardware económicas y con la mayor eficiencia.
Procesamiento en base de datos
SAS, por ejemplo, ha llegado a algunos acuerdos de tipo técnico y comercial con Teradata para proporcionar lo que llaman in database processing, es decir, poder ejecutar programas y algoritmos analíticos de SAS dentro del mismo motor de la base de datos.
Con R también es posible realizar el mismo tipo de operaciones sobre Postgres.
Rapache: aplicaciones estadísticas en la red
Analizar un conjunto de datos y crear modelos sobre ellos puede ser más o menos complicado. Pero muchos estadísticos se enfrentan al problema de poner dichos modelos en valor, de poder, de alguna manera, subirlos a producción.
Una manera eficiente de diseminar el acceso a un algoritmo desarrollado por un equipo de estadísticos (por ejemplo, el que permite valorar una prima de seguro en función de las características sociodemográficas del tomador) a través de una organización entera es colgándolo de la red.
Rapache, un módulo de Apache, permite que sea el mismo R el que procese peticiones web devolviendo, por ejemplo, la predicción de un modelo frente a los datos de un formulario.
¡Las actualizaciones del modelo serían automáticas!
