Blogia
Webconfort

Web Mining

Clicktracks: Webminig intuitivo

Desde hace un tiempo empecé a probar la herramienta Clicktracks, un software orientado al seguimiento de usuarios de los sitios Web, a partir del análisis de logs. La gracia de este programa es que es sumamente visual en la entrega de resultados. De alguna manera favorece la lectura de los datos gracias a una potente interfaz, que combina portada de sitio Web con los resultados del tracking en una misma pantalla..

Sin embargo aún no la he visto funcionar en su máxima expresión, ya que el trial que estoy probando tiene varias restricciones. De hecho me cuesta entender para qué entregan un trial de 30 días y además lo restringen. Se supone que es cuando ve un software funcionando en su plenitud, que se decide a comprarlo.

En fin; que me gustó bastante, aunque hecho de menos un producto que mida densidad de clicks y los represente a partir de colores e intensidades, en la interfaz gráfica de la página que se está midiendo.

Volviendo a Clicktracks. Es fácil de customizar y no requiere mucho conocimiento. Incluso la compañía entrega tutoriales en vivo, según agenda predeterminada, y soporte en línea vía mensajería instantánea, durante buena parte del día.

Si les interesa el tema de los comportamientos y hábitos de usuarios, no deberían dejar de probarlo.

Domino Server: prohibido usar los Log Files

Muchos conocen las gracias de la tecnología Notes y Lotus Domino de la IBM. Y si no las conocen, hay un sinfín de lugares donde encontrar las mejores refrencias de uno de los pilares del software de la IBM.

Desde mi humilde lugar y experiencia, seré en esta ocasión quien hable mal de ese mismo software del que tantos
hablan bien. Al menos en lo referente a algunos aspectos.

Y tal pareciera que IBM no entendió aún que el diseño y desarrollo Web es una cadena en la cual, buena parte de los propios insumos de análisis de lo que ocurre en el sitio, salen de las propias entrañas de los sitios y servidores. Sin eso, la Web es poco y nada y el diseño se basa en las presunciones de unos cuantos profetas. Y lamento decir aquí que IBM podría ser considerado un evangelizador de este tipo de profecías, ya que no se ha preocupado en lo más mínimo por ese aspecto. Veamos el caso en cuestión.

Todo comenzó cuando en el marco de una asesoría a un cliente del sector público, orientada a identificar hábitos de uso del sitio Web de la institución, se nos ocurrió la descabellada idea (según, imagino, diría algún trabajador de la IBM) de extraer los archivos Logs para su análisis e interpretación.

De ahí en adelante todo resultó en un periplo que no hizo más que confirmar la importancia de los estándares. Pues bien; a diferencia de los estándares, los logs de Lotus Domino se configuran y construyen de una forma absolutamente... IBM.

"El problema"

Un archivo de log estándar, de un día, equivale a cinco archivos en un servidor Domino. Tome nota:
- Agent
- Acces
- Referer
- Error
- JS_error

Cómo hacer para sacar alguna información clara de esta maraña, que ayudara a comprender el comportamiento de los usuarios del sitio? Pues simple. Se supone que hay herramientas de interpretación de los logs (softwares), que están en condiciones de obtener resultados claros y ordenados.

Para este caso, por confiabilidad, costos, calidad, entre otros factores, nos fuimos al clásico webtrends, hoy devenido NetIQ. Las primeras pruebas nos dieron la pauta de que la versión estándar era una absoluta pérdida de tiempo. Saltamos a las versiones especiales para Domino y, para nuestra sorpresa, los resultados arrojados fueron pauperrimos; solo logramos obtener algunas cifras generales que no daban cuenta de lo que sucedía al interior del sitio. Me refiero a número de visitas y page views por día.

Por esa misma fecha se liberó el trial de la última versión de Webtrends y optamos por descargar directamente la versión Log analyzer Advanced Edition que se vende, engañosamente al público, como multiplataforma. Rápidamente nos dimos cuenta que tampoco pasaba mucho con los resultados, a pesar de haber obtenido alguna información adicional, y que sintetizar esos cinco archivos de logs en un solo y lograr un resultado que fuera legible, no era tarea a la que IBM o Webtrends habían prestado mucha atención.

El escenario era bastante claro. Por otra parte, nadie que invierte un dinero en licencias y desarrollo como el que implica Notes y Domino, está dispuesto a tirar su inversión por la ventana. Como solución y con el fin de aprovechar al máximo las prestaciones de la Versión 8 de Webtrends (la estándar fue suficiente), programamos un script cuya tarea era ordenar y limpiar los logs, recomponiéndolos en un archivo único, legible y estándar.

Fue una solución relativamente rápida pero que implicó un paso adicional; además de las complicaciones relacionadas con la configuración inicial de los logs en el servidor Domino y de la customización de los grupos de contenidos en Webtrends. No es materia de este artículo profundizar en esto último, pero los muchachos de Webtrends no han sido muy brillantes en el diseño de la configuración de los grupos de contenidos; especialmente en la forma en que se relacionan los path a las secciones de contenidos.

Final Felíz

Es probable que por unos cuantos cientos de dólares IBM nos hubiera provisto de una maravillosa suite de análisis de tráfico, o de tracking, o un CMR. Pero para la mayoría de los mortales del Web, incluyendo a clientes con pocas ganas de seguir gastando, estas son palabras y precios que están vedados.

Para ahorar en letras, ojos agotados y aburrimientos varios, solo resta decir que finalmente logramos llegar a los resultados esperados. Mediante el famoso "script", pudimos entender qué áreas del sitio eran las más visitadas por los usuarios, los refereres desde donde llegaban, las rutas más frecuentes, las cadenas de búsquedas que los traían hasta esa Web.

Nuestros conocimientos sobre Webtrends y Notes crecieron considerablemente y tenemos una solución más en nuestro haber. Pero queda en el aire esa extraña sensación de que hay muuuchas personas, buscando soluciones de IT, que creen que este tipo de CMS podrían resolverles sus problemas rápidamente.

Algunas conclusiones

- A veces lo aparentemente sólido termina siendo evidentemente débil.
- Los estándares no son caprichosos. Hacen que todos nos comuniquemos más y mejor.
- Aún queda mucho por investigar e inventar en la Web.
- La creatividad sigue siendo un valor agregado de los chicos versus la inflexibilidad de los más grandes. (Claro que los chicos tenemos otros problemas).
- Los soportes técnicos no son en vano. Muchas empresas se dedican a la reventa de productos que no conocen. Esto lo sufrimos con uno de los proveedores de Webtrends en Santiago de Chile.
- Vale la pena evitar los paquetes de software demasiado cerrados, al menos que estén dispuestos en gastar plata en asesorías, upgrades o complementos en el futuro.

Una expresión: Finalmente no podía dejar de imaginarme la expresión de un ingeniero de la IBM, preguntando para qué quieren analizar los logs del servidor.

Un toque solidario: con todos aquellos que recorrían foros, listas y sitios afines, buscando una respuesta que aún no existe. A todos ellos, "mira en tu interior Luke".