Semántica


La semántica es un término que puede ser analizado desde diferentes puntos de vista.

Semántica (lingüística): es el subcampo de la lingüística que se dedica al estudio del significado inherente a nivel de palabras, frases, oraciones y unidades más largas del discurso. Su área básica de estudio es el significado de estos símbolos y el estudio de sus relaciones.

Semántica (ciencias de la computación): se refiere al significado de los lenguajes, en oposición a su forma (sintaxis). Adicionalmente, el término es aplicado a ciertos tipos de estructuras de datos diseñados específicamente para representar el conocimiento de alguna información.

Al conjuntar estas definiciones se establece el siguiente significado de semántica:

La semántica es la manera en que percibimos y entendemos el mundo que nos rodea. Esta forma de percepción se basa en la descripción de las entidades del mundo y las relaciones que tienen con otras entidades, constituyendo un vocabulario común en los canales de la comunicación humana.

La semántica entonces, como forma de percepción, presenta las siguientes características:

  • Constituye un vocabulario consensuado, pues sirve para comunicar y establecer ideas entre las personas de cierto círculo.
  • Establece relaciones entre el conocimiento existente y el nuevo conocimiento, es decir, los conceptos recién aprendidos son relacionados con los conceptos ya comprendidos.
  • Es incremental, pues se pueden adquirir cada vez más conceptos e ideas.
  • Constituye el conocimiento de un dominio, pues en su conjunto proporciona sentido a un campo de aplicación.
  • Es contextual, es decir, está influenciada por el entorno y la percepción particular de los individuos.

Este concepto de semántica es muy general, sin embargo, se ha trasladado a distintos campos de aplicación impulsando el surgimiento de otros conceptos como el de la Web Semántica y el de la Tecnología Semántica, definidos más adelante.

Web Semántica


Tim Berners-Lee, creador de la World Wide Web y director del World Wide Web Consortium (W3C), en su visión, define a la Web Semántica como sigue:

La Web Semántica es una Web de datos que pueden ser procesados directa o indirectamente por máquinas; una Web que permitirá a las máquinas comprender los documentos y datos semánticos, no el lenguaje o escritura humana.

Dentro de esta visión, Berners-Lee bosqueja un conjunto de tecnologías y formatos (RDF, ontologías, agentes) que permitirán hacer de la Web Semántica una realidad. Estos bosquejos suponen el tener la capacidad de dotar de significado al contenido de las páginas Web mediante un lenguaje unificado y universal que desde su definición ayude a la evolución del conocimiento humano como un todo. Este lenguaje se basa en el uso de conceptos y relaciones conforme a la definición de la semántica y permite, según Berners-Lee, razonar de manera automática sobre el conocimiento mediante la aplicación de reglas definidas.

Tecnología Semántica


En el contexto de la Web Semántica, se define a la tecnología semántica como sigue:

La tecnología semántica es un conjunto de estándares y herramientas que proporciona una manera de representar el conocimiento de un dominio en términos entendibles tanto por humanos como por máquinas.

La tecnología semántica es el fundamento de la Web 3.0 y los sistemas de software semántico, mismos que han propiciado la creación de nuevos modelos y formatos de almacenamiento. Dentro de estos formatos se encuentran dos estándares ampliamente aceptados y que son de particular interés para el desarrollo de aplicaciones semánticas: RDF y OWL. RDF y OWL permiten representar el mundo real mediante estructuras de datos basadas en grafos.

RDF (Resource Description Framework)


RDF es un formato de almacenamiento diseñado para el intercambio de datos en la Web que incluye características que facilitan la integración de datos de diferentes fuentes. Con RDF se puede describir toda la información acerca de un objeto (llamado recurso) en forma de triplas. Las triplas son una estructura simple que permite construir un grafo dirigido y etiquetado donde las aristas forman una relación bien definida entre dos recursos representados por los nodos del grafo. Cada tripla puede visualizarse como un vector de tres componentes: sujeto, predicado y objeto, donde el predicado es una relación (propiedad) entre el sujeto y el objeto.

Ejemplo:
Una casa es una construcción de piedra y madera que sirve para vivir. Está dividida en habitaciones con puertas y ventanas para el acceso de los habitantes. Toda casa tiene un dueño.

Si se analiza el texto y se extraen las relaciones existentes entre los conceptos involucrados en la descripción anterior, puede dibujarse rápidamente el grafo de la figura 1.

grafoRDF

                          Figura 1. Grafo construido para representar una casa.


Este grafo es otra manera de representar lo que se entiende por una casa. Ahora bien, si se utiliza el enfoque de triplas para construir el grafo, se puede obtener el conjunto listado en la tabla 1. Este conjunto de triplas es otra representación (quizás más sencilla de entender para la computadora) de la descripción de una casa.

Sujeto Predicado Objeto
casa hecha de piedra
casa hecha de madera
casa tiene habitación
casa hospeda habitante
casa sirve para vivir
casa pertenece a dueño
casa tiene puerta
casa tiene ventana

                          Tabla 1. Conjunto de triplas que representan una casa.

El conjunto de triplas de la tabla 1 puede adecuarse al formato RDF de manera que se permita su persistencia en un almacén de triplas o una estructura XML, dos mecanismos de almacenamiento soportados por las computadoras. El concepto de RDF proporciona gran flexibilidad para su extensión, permitiendo usarlo como punto de inicio para construir nuevos lenguajes de representación de conocimiento.

Ontologías y OWL


Una ontología representa los términos en el vocabulario de un dominio de conocimiento, así como las relaciones que existen entre dichos términos, que en conjunto representan el significado del dominio. Para almacenar dicho vocabulario en un formato estándar se creó OWL (Ontology Web Language), que es un lenguaje cimentado en RDF y permite definir e instanciar ontologías. OWL está pensado para aplicarse cuando la información acerca de un dominio será procesada tanto por aplicaciones como por humanos. Estrictamente podría verse a OWL como una capa enriquecida de RDF en tanto que define construcciones básicas para dotar de significado a los objetos representados, entre las cuales se encuentran tipos de relaciones entre clases (de restricción, intersección y equivalencia) y tipos de propiedades.