En directo: Jornadas de Sistemas de Recomendación Social

Bueno, acaban de empezar las Jornadas. Están presentando la Cátedra Tissat de la UPV, que organiza estas jornadas como presentación e inicio de su andadura. A ver que tal se me da esto del posteo en directo. En la mesa, Anabel Pardo (Tissat), y empieza Francisco Martín con MyStrands.

11.20: La tecnología de sistemas de recomendación social
(Fco. J.Martín. MyStrands)

Empieza hablando de serendipia… esto promete ;-) Los sistemas de recomendación han cambiado completamente la forma de buscar contenidos en la red: nos fiamos más de nuestros amigos que ¿de Google? Por lo menos con nuestros amigos estamos más seguros de la calidad de la recomendación (trust).

El problema de los sistemas actuales: la alta interacción requerida por parte del usuario: no nos molestamos en contestar, calificar… con lo que los resultados no son adecuados. Sin embargo, los sistemas que nos «espían», como la librería biblioteca de iTunes o MediaPlayer tienen información real de lo que hacemos.

Mira… acabo de saber que esto que hago se llama auto-expresión… ¡me he quitado 10 años de encima de golpe! X-D Blogs, twitter… todo el mundo dice lo que hace, una especie de «vouyerismo» inverso. Y esto es lo que se aprovecha para la recomendación social. La comparación de los perfiles de usuario y también los items uno a uno. Hace falta algo que procese millones de inputs y millones de usuarios. Y además en «tiempo real», o sea, rápido.

MyStrands usa las preferencias del usuario para reconocer relaciones «ocultas», de personas normales (no expertos). Y se aprende y personaliza para ayudar a descubrir cosas nuevas. Funciona con redes complejas: 10M pistas, 1’3M de pistas recomendables, 200M de enlaces… todo creado a través de las playlists de los usuarios. Aprovecha la inteligencia de las personas, no de las máquinas (socialización). ¿Cómo?

  1. organizando el contenido
  2. descubriendo elementos nuevos que pueden ser de su interés
  3. conectando al usuario con otras personas que comparten tus mismos gustos

Simplemente hay que enseñar lo que tú estás haciendo que le pueda servir a otros. Y también se guarda tu historia ¿qué escuchabo yo hace 10 años? Ufff, creo que no me acuerdo. Aunque eso de tener toda tu vida registrada, y en manos de terceros, de empresas privadas que pueden comerciar con perfiles. Da un poco de miedo ¿no?

Cosas interesantes: recomendación grupal. En un autobús, en un bar, en el salón de tu casa (eso en más difícil.. el mando es de mi padre X-D). Es difícil hacer una recomendación que satisfaga a un grupo de personas.

Y para acabar, un poco de bola de cristal ¿qué nos dará la web 3.0? web móvil de 10Mb, minería de datos para estudiar el comportamiento (y perfiles),web semántica… esto último me interesa, es en lo que estoy trabajando ahora.

12.00 Impacto social y económico de los sistemas de recomendación
(Enrique Dans, Instituto de Empresa)

Bueno, un rato hasta que conecten el portátil con el cañón. Juas, juas. Esto pasa hasta en las mejores familias. Bueno, parece que ya va. Empezamos. Presentación con algo de estilo «Lessing»

Hasta ahora hemos vivido en una época de escasez: la economía se basa en la escasez de productos y los que tienen el control de ellos: recursos naturales, infraestructuras complejas (fabricación), regulación artificial (ya está aquí el copyright, DRM… ¡viva!). ¿Por qué fases pasan los negocios?

  1. negocios de margen: sólo yo controlo la producción. Ejemplos, farmacia, basados en propiedad intelectual…. el mercado de la droga. Todos necesitan superar una barrera de entrada que hace que funcionen. Con el tiempo, la barrera de entrada es más fácil de saltar y se entra en un modelo de competencia que lleva al siguiente:
  2. negocios de eficiencia: tengo que ser el mejor en algo (más barato, mejor calidad, un nicho concreto). Si llegamos al límite los beneficios bajan y se pasa a un
  3. negocios de relación: basado en la fidelización de los clientes, que nos prefieren a nosotros por…no sé…cualquier cosa.

Google y la economía de la atención ¡incluso de uno (gmail)! Y vende esta atención. Ahora la atención no la manejan las televisiones, sino los usuarios particulares. Ejemplo de mobuzz (je, falta un disclaimer). Ahora cualquiera puede generar contenidos. Cualquiera puede generar historias, mandarlas a mobuzz, los usuarios votan y la «cadena» construye el reportaje.

Pero cuando los primeros puestos de Google están «cotizados» estamos convirtiendo a Google nen un negocio de margen otra vez: control por las primeras posiciones. Hoy, en El Pais están hablando de los mismo (vía La maté por un yogurt), aunque se lían un poco.

Ahora hablamos de IdeaStorm, de Dell. Pero, ¿qué hacen las empresas cuando los usuarios piden algo que no quieren oir? Algunas hacen caso. Esto hizo que Dell se planteara vender equipos con Linux preinstalado. Esto es un riesgo, porque si está abierto otras empresas pueden adelantarse escuchando a tus usuarios.

Importancia de los blogs. Hoy 80’1 millones de blogs (este es uno de ellos) y sólo estamos en la fase de despegue, en los inicios: innovadores, «early adopters»… Hemos pasado de 46 mill de usuarios a 1.000 mill en 10 años, creando contenidos constantemente. Creando una inteligencia colectiva ¿por qué? disminuyen todos los costes: de producción, de transmisión…

12.35 Presente y futuro de los sistemas de recomendación social
(Álvaro Ibáñez -Alvy-, Internality… y Microsiervos, of course)

«La moneda del futuro es la atención. Y, en el futuro, el reparto de atención se asignará por reputación».

Buen comienzo, con una cita de A. Weigend.

Alvy también habla de Google como sistema de recomendación, porque se basa en enlaces que la gente pone en sus páginas. Nunca lo había visto así. También habla de Amazón, pero desde que le fastidié las recomendaciones a Carlos al pedir un libro de Aghata Christie a mi no me gusta demasiado. Otra referencia a MyStrands.

Un poco de Web 2.0 Empieza con su mapa visual de la Web 2.0, en el informe para la Fundación Orange. Las etiquetas son una herramienta fundamental para marcar los contenidos. Las preferencias de los usuarios a la hora de clasificar contenidos son casi más importantes que la de los autores. Estamos viendo detalles del mapa. En todas las áreas los sistemas de recomendación tienen algo que ver.

Tags y folksonomías: otra característica de la Web 2.0. Nos permiten organizar los contenidos que están desorganizados. A mi me marea un poco cuando tengo que revisarlos y uso una etiqueta nueva que podía aplicar a documentos antiguos ¿no hay ningún sistema que asigne tags automáticamente?.

En 11870 (no el año -que bruto soy-, sino el sitio) automáticamente los usuarios han asignado como etiqueta el precio de los restaurantes. Yo no me había dado cuenta (tengo que salir más). Es un ejemplo de cómo los uusarios crean un servicio útil que tú ni siquiera habías planeado. Ahora puedes saber dónde comer en Madrid por 10€ y que te guste.

Las API permiten incorporar en herramientas nuevas servicios proporcionados por otros. Nosotros hablamos de eso con Zentation, que enlaza Google Vídeos con SlideShare. O también lo que se hace con el Yahoo! pipes. Esta es otra de las cosas que me gustan: ver cómo enlazar los agentes inteligentes con los servicios web ¿puede construirse un agente que programe con pipes?

Los problemas de los sistemas de recomendación es una lista muy larga… no las pondré todas, pero estamos trabajando sobre algunas

  • escalabilidad, funcionan con 10.000 o 20.000, pero ¿qué pasa con millones?
  • normalización, sobre todo para que las máquinas sean capaces de adquirir directamente el conocimiento en sitios distintos (hacen falta ontologías y web semántica)
  • el problema del arranque en frío ¿qué me recomienda el sistema la primera vez que entro?
  • recomendaciones según el contexto: no tengo las mismas preferencias cuando me voy a un congreso que cuando me voy de veraneo con mi familia
  • el tiempo necesario para la clasificación. En eso me gusta MyStrands, la interacción con el usuario es mínima y el sistema aprende de tus interacciones. MyStrands lo tiene fácil porque simplemente «espía» tu reproductor de música. Habría que ampliarlo a tu navegación en la web, los documentos en los que trabajas, tus correos electrónicos… Sería algo parecido a lo que hacía en su día Beagle, usando esa información como base del sistema de recomendación.

Una mención especial al fraude: pushing (para promocionar cosas artificialmente), nuking (anula recomendaciones «legales» para perjudicar a otros), sabotajes, bromas… Los sistemas son bastantes sensibles a esto. Alvy nos está contando sobretodo técnicas estadísticas para detectar los fraudes. Pero claro, cuando el fraude ya se ha cometido. ¿Se puede solucionar antes? Nosotros estamos estudianto técnicas basadas en la confianza (trust). Creo que esta palabra la he puesto más arriba :-)

«La ley de los grandes números está de parte de los sistemas de recomendación»
(B. Mobasher)

Y para acabar, algunas visiones del futuro, algunas extraídas de la conferencia Recommenders 2006. ¡Ay, ay! que se me acaba la batería del portátil… me quedan 17 minutos. Por cierto, que lo del MPEG-7 a Carlos y a mi nos ha gustado. Permite incorporar información adicional (metadatos) sobre ritmo, instrumentos, estilo…. dentro del propio fichero ¿una especie de EXIF multimedia?

Bueno, pues eso ha sido todo. En la parte de preguntas se me acabó la batería, pero ahora, en el despacho, he terminado de retocarlo un pelín (escribir sobre la marcha genera algunos errores). Me ha gustado esta experiencia del blogueo en directo; lo haré más veces. En un rato subo fotos a Flickr, a ver qué tal han salido.

Se han ido todos a comer y no me han invitado :_( así que tendré que comerme un bocata o echar una carrera hasta casa. ¿Será verdad lo de la indirecta?

Actualización 17.50: Ya he subido las fotos de las Jornadas a mi cuenta de Flickr.

Noticias relacionadas

2 respuestas a «En directo: Jornadas de Sistemas de Recomendación Social»

  1. ¿Qué le pasó a mi comentario? No ha salido. Bueno pues lo repito.

    Decía que no trabajo directamente con la web semántica. En lo que estoy en más en la computación orientada a servicios, y más concretamente intentando que agentes inteligentes sean capaces de gestionar servicos de web semática. Vamos, que no me queda poco casi ná ;-)

Los comentarios están cerrados.