Curso recomendado

lunes, 30 de noviembre de 2009

Data Mining - Rapid Miner

Hoy os presentaré otra herramienta GPL para hacer minería de datos, creo que ya llevamos 3 y eso que no hemos entrado en las librerías de programación libres, para que luego digan que no hay opciones en el software libre.

Se llama RapidMiner; esta herramienta nace de Yale (Yet Another Learning Environment), una herramienta totalmente gratuita centrada en la investigación de algoritmos de machine learning, con el tiempo se creo una empresa a su alrededor que lo ha estado desarrollado la herramienta desde, más o menos, el 2006.

El resultado, cuando menos, es interesante. Esta herramienta permite ejecutar los algoritmos de Weka dentro de su interface, a demás, en la proxima versión podrán en marcha una nueva interface mucho más visual que la anterior, os dejo un enlace con un vídeo aquí .

Esta herramienta ha ganado varios premios, ha sido la mejor startup de Alemania en el 2007, el año pasado gano otro premio centrado en las Startup de Business, pero lo que considero más interesante es el hecho que se ha metido dentro, como observador, del comite del Data Mining Group, esto quiere decir que en breve soportará exportación e importación de modelos en PMML, pero a demás desde su puesto estará al tanto de la evolución de este formato y podrá aplicar la modificaciones de una manera rápida. Esto es más importante de lo que parece en un principio, ya que se auguran tiempos donde la herramienta de modelización estará desvinculada de la de explotación.

Esta empresa, como otras dentro del software GPL, han optado por el doble producto, uno totalmente libre donde la comunidad puede hacer lo que quiera, y otro Enterprise, donde hay que pagar un precio por el producto, la verdad que no muy abultado, con 9999€ una versión con instalaciones ilimitadas y con un soporte con una respuesta en menos de 2 horas. Os dejo el enlace con las tarifas aquí.

Bueno pues ya tenemos otro entorno donde poder hacer nuestro análisis, ya me contareis que os parece.

2 comentarios:

cjgb dijo...

Hola...

Alguna vez la he probado. Tiene muy buenas referencias en instalaciones, pero hay dos cosas de esta herramienta que me han echado para atrás:

1) El interfaz es inhabitual y menos intuitivo que el de KNIME, Weka y otros. Aparentemente, en nuevas versiones, leí, van a cambiar (o al menos, incluir) de paradigma. Pero la verdad, cada vez que lo pruebo, comienzo casi de cero. Tal vez sea pura pereza intelectual.

2) No vi tan claro como en KNIME, por ejemplo, cómo extender los nodos base para crear otros nuevos. Tal vez tendría que investigar más y mejor el asunto, pero para mí, eso es fundamental.

Francisco Ortega dijo...

Por lo que estoy viendo se han puesto las pilas con el tema de la interface, estan haciendo algo más intuitivo, a ver que tal les queda.

En lo de poder ampliar nodos tienes, por narices, que ir a código, java creo, yo eso ni me lo planteo...