Curso recomendado

jueves, 31 de diciembre de 2009

Data Mining - Análisis de Redes Sociales con R y Statnet

Hola a todos otra vez, hoy os presento un curso que han colgado sobre R y análisis de redes sociales, en concreto utilizan el paquete Statnet.

Este pequeño curso consta de 5 vídeos que os dejo al final de la entrada.

La verdad es que llevamos unos meses viendo un crecimiento en este tipo de técnicas, esto es debido a que cada vez tenemos que estudiar información con estruturas más complejas. No hace mucho hablamos sobre minería de sentimientos, un campo muy nuevo donde también se está trabajando duramente; una de las aplicaciónes de la minería de sentimientos es el estudio de las opiniones en la blogosfera, si nos servimos de estas técnicas conjuntamente no sólo podremos saber que piensan de nosotros, sino que también, mediante estudio de redes, como se difunden las opiniones, o, por poner otro ejemplo, podremos localizar que blogs son más influyentes a la hora de difundir una opinión.

Un saludo y feliz entrada en el nuevo año.



sábado, 26 de diciembre de 2009

Data Mining - Conferencia de R y charla sobre Knime

Hola a todos, hace unas semanas nos hicimos eco de un importante hecho, se habían preparado la primera conferencia hispana de R. La verdad es que me hubiera gustado asistir pero no pudo ser, eso si, nos han dejado colgados varios vídeos sobre las charlas, os dejo el enlace aquí.

Todas son interesantes, pero sobre todo no os perdáis la charla de Carlos J. Gil Bellosta, ya os lo presentamos en un post anterior. En esta charla llamada Al-R-ededores nos presenta R desde el punto de vista de la empresa, y no sólo eso, sino que Carlos está trabajando para integrar R y Knime, de esta manera se pueden crear nuevos nodos con código R que luego pueden ser utilizados dentro de la interficie de Knime. La verdad es que tiene muy buena pinta lo que está consiguiendo junto con su equipo.

Bueno y por ahora nada más, felices fiestas, feliz año nuevo y espero que nos sigamos viendo por aquí.

jueves, 17 de diciembre de 2009

Felices Fiestas y Feliz 2010

Se acaba el año, y con él llegan las deseadas vacaciones navideñas. Llega el momento de mirar atrás, reelerte un poco, reinventarte, y pensar en el año entrante.

Este año lo cerramos con más de 10.000 visitas, y más de 6.000 usuarios, que han tenido la oportunidad de leer más de 70 posts, más de 6 al mes, gracais sobre todo a Paco Ortega que entró y continua con mucha fuerza. Este golpe de efecto creo que será continuista con la llegada de Chim Baldús que aportará ese toque tan característico que Chim aporta a los proyectos y desarrollos.

¿Y el año que viene? Pues estamos con cosas, ya os iremos contando. Yo por mi parte estaré unos tres meses desarrollando un proyecto en un cliente, bastante interesante por cierto, pero espero tener tiempo para poder seguir compartiendo mis experiencias.

Saludos y felices fiestas.

martes, 8 de diciembre de 2009

GMK y DM - ZoneTypes y regresiones espaciales

Desde hace aproximadamente dos años se ha vivido una creciente demanda de proyectos analíticos con una componente geográfica muy importante; se trata por lo general de valorar ubicaciones en cuanto a su idoneidad como puntos de distribución de un producto o servicio determinado. La cuestión ha surgido en algunos casos buscando locales para nuevas aperturas y en otros casos comparando locales que ya formaban parte de la red comercial, siendo necesario el cierre selectivo de algunos de estos puntos. En cualquier caso, la experiencia adquirida muestra que una forma interesante de abordar este tipo de problema es la construcción de modelos matemáticos para simular la presencia de clientes potenciales teniendo en cuenta los diferentes orígenes de éstos. Una forma de clasificar estos orígenes consiste en definir una partición del público medio presente entorno al punto de venta en los siguientes términos: público estable, vinculado a la zona por su residencia o su puesto de trabajo; público atraído por la oferta propia de la zona en el sentido del ocio, los comercios, servicios, etc.; público de paso, asociado al tráfico de transeúntes o en algún medio de transporte propio.

El resultado del trabajo realizado durante este tiempo consiste en una colección de unos 30 indicadores numéricos llamados Zone Types que sintetizan la información disponible desde diferentes y numerosas fuentes (unas 600 variables) de forma que es posible cuantificar y cualificar la presencia de clientes potenciales pertenecientes a los tres orígenes ya descritos. Estos indicadores numéricos están asociados a unidades geográficas elementales como secciones censales o, más recientemente, a una cuadrícula con elementos de 100 por 100 metros extendida sobre el conjunto del territorio español que proporciona resultados con una precisión mucho mayor.

El conjunto de Zone Types está estructurado en cuatro conceptos independientes: Perfil de atracción de la zona, entorno físico, perfil sociodemográfico de los residentes y perfil empresarial en la zona. Para una presentación que permita una lectura rápida se ha generado además cuatro segmentaciones asociadas a cada uno de los cuatros conceptos.

Existe una gran variedad de formas de ofrecer este producto; la forma más sencilla, directa y de carácter puramente descriptivo consiste en proporcionar un informe asociado a una ubicación en que aparecen todos los indicadores numéricos presentados de forma gráfica, con estadísticas a nivel nacional, provincial, etc. que proporciona una potente imagen del funcionamiento de la zona, cosa útil en caso de contar con alguna intuición de negocio que permita valorar subjetivamente la idoneidad del lugar.

Otra posibilidad que ha despertado gran interés en el contexto de empresas con cierto histórico sobre el funcionamiento de sus diferentes puntos de venta es la búsqueda de ubicaciones con igual perfil que las ubicaciones de sus establecimientos con mejores resultados (se crea una medida de similitud en términos de Zone Types) .

Por último, con mayor nivel de complejidad, hemos utilizado las Zone Types como entradas para el desarrollo de modelos de regresión espacial. Los valores a predecir han sido en la mayoría de los casos variables relacionadas con los resultados esperables de una establecimiento imaginario que podría ser abierto en una ubicación dada; cuotas de penetración, número de clientes a captar o, incluso, facturación estimada explícitamente. Las experiencias hasta el momento muestran que la construcción de un modelo de este tipo es relativamente directa gracias al buen funcionamiento de los indicadores numéricos (ZT) utilizados como entrada. Otros componentes de estos modelos son los campos de atracción, concepto que sustituye al de área de atracción, y que permite dar una medida estimada de la atracción generada en cada punto alrededor de una ubicación estudiada. Estos campos de atracción simulados tienen un comportamiento no escalonado (cosa que aporta gran estabilidad al resultado) y decreciente con la separación entre la ubicación estudiada y los puntos de su entorno. Esta separación suele calcularse en términos del tiempo de desplazamiento en ruta.

Otra contribución importante en estos modelos es la correspondiente a la competencia, tanto externa como interna. Esta última parte completa un modelo en que aparecen estimadas las diferentes componentes del mercado potencial con una repartición de éste entre los diferentes competidores de la zona a través de las fuerzas de atracción que cada uno de ellos está generando en los lugares de procedencia de los clientes.

Nueva Incorporación - Chim Baldus

Hola a todos, tengo la grata noticia de presentaros a una nueva incorporación al blog. Se trata de un compañero de fatigas, Chim Baldus, que desde mi punto de vista es el eslabón que une el geomarketing y el data mining, ejes centrales de este blog.

De Chim poco puedo decir, el mismo se presenta de la siguiente manera:

"Tengo 32 años, estudié física y matemáticas en la universidad de Barcelona y me especialicé en la visión geométrica de la física matemática, profesión poco próspera a nivel lucrativo en este país. En estos momentos hace ya tres años que trabajo en arvato services (Barcelona) en el área analítica realizando proyectos de data mining y, sobre todo el último año, geomárketing de carácter analítico."

Bienvenido a este proyecto!!!!

jueves, 3 de diciembre de 2009

Data Mining - Blog "Análisis y decisión"

Desde hace poco tengo el placer de cruzarme emails con Carlos J. Gil Bellosta, posteador habitual de "Análisis y decisión", blog de Raúl Vaquerizo.

De Carlos decir que le llevo la pista desde hace años, desde que era estadístico freelance a actualmente que está en las filas de everis. Es el único que conozco que ha trabajado en el mundo real con software libre dentro de un entorno analítico; hace poco hizo una presentación en las "I Jornadas de R en Castellano" sobre el software GPL, en concreto se centró en R y derivados, y el desarrollo de proyectos en la empresa; tiene un resumen de las jornadas posteado aquí.

A Raúl tengo que reconocer que hasta que no vi su blog, hace un par de meses, no tenía noticias de él, pero hay que admitir que su blog es de obligada lectura para cualquiera que se interese en estos temas.

Desde aquí darles la gracias por recomendarnos y no puedo hacer la otra cosa que hacer lo mismo con vosotros compañeros, cualquiera que tenga interés sobre el análisis de datos tiene que tener su blog, "Análisis y decisión", en favoritos y ser de obligada lectura.

Un saludo vecinos.

PD: nosotros también agregamos a http://erre-que-erre-paco.blogspot.com/ como enlace, que para pocos que somos nos tenemos que ayudar.

miércoles, 2 de diciembre de 2009

Data Mining - Wipley


Esta vez sólo hacerme eco de esta interesante noticia que acaba de saltar a la red, ha surgido una red social española centrada en el mundo de los video juegos, se llama wipley, así que al grito de "Quien no sea freak que levante su sable laser" os insto a apuntaros.

La idea es sencilla, permite a los usuarios compatir gustos sobre los diferentes juegos digitales sin importar la plataforma, con esto cubriríamos la utilidad de red social, pero no se queda allí la cosa, según nuestro perfil, puntuaciones a juegos, comportamiento y cualquier información que puedan almacenar nos haran recomendaciones de juegos; como mínimo es un planteamiento interesante.

Ya se que no es la tipica noticia que posteo, pero es que dentro de este proyecto hay un motor de recomendación español, y la verdad, para pocas iniciativas interesantes que se hacen en este país hay que mimar y ayudar a las que surgen, y más con los tiempos que corren.

Les seguiremos la pista a estos de wipley, espero que nos de muchas alegrías.