Probando RDFaCE

Buscando herramientas para la asignatura Diseño de Ontologías, hemos dado con RDFaCE. Se trata de un editor que permite anotar semánticamente los contenidos de una web. En concreto, lo que estoy probando es un plugin de WordPress que añade al editor un par de botones para marcar y etiquetar palabras o frases de lo que estás escribiendo en el blog, que quedan integradas en el código HTML que se genera.

¿Que para qué sirve esto? Bueno, básicamente, consigues que una máquina pueda extraer mejor información sobre lo que estás escribiendo. Las etiquetas que se incluyen permiten identificar personas, organizaciones y lugares, con el mismo formato que emplea, por ejemplo, el New York Times.

De esta manera, si yo digo que me llamo Miguel Rebollo, que vivo en Valencia y que soy profesor de la Universidad Politécnica de Valencia, puedo usar este editor para marcar las palabras que corresponden a una persona, a un lugar o a una organización, y rellenar información adicional a través de un formulario.

Y si luego le paso el enlace del post al Google Structured Data Testing Tool, verás cómo detecta la información que contiene la página. Es decir, estoy convirtiendo el bla, bla, bla que para un ordenador es el contenido de una página web, en algo que tiene significado y del que puede extraer información estructurada. Por ejemplo, este es un fragmento del resultado de lo que ve Google de este post

Si quieres, puedes consultar el resultado completo del análisis semántico de este post, o también el resultado de una noticia del NY Times (hoy, referencia obligada a la tormenta).

Otra cosa es que sea capaz de marcar automáticamente el contenido. Es decir, que si yo vuelvo a escribir Valencia, me lo marque como lugar sin que yo tenga que repetir todo el proceso cada vez. Pero bueno, démosle tiempo, que esto acaba de empezar.

AIWS. Web Semántica

Con un poco de retraso (aquí, en el blog, no el los sitios habituales) os dejo las transparencias de la sesión de web semántica. Después de ver conceptos generales y abstractos (vale, muy abstractos) sobre ontologías, en esta parte vemos los lenguajes que se emplean para manejar semántica en la web. Básicamente, el Dublin Core y los microformatos como esquemas simples, para pasar a ver las características de RDF y OWL como lenguajes semánticos.

Web Semantica

Para ponerlo en práctica, hemos usado Protégé: un programa del Stanford Center for Biomedical Informatics Research que permite la creación de ontologías y puede integrarse con multitud de sistemas. Para practicas, hemos ido siguiendo el tutorial de Matthew Horridge (de la Univ. de Manchester) sobre las pizzas.