Federated Query Processing for the Semantic Web
[thesis]
C. Buil-Aranda
The recent years have witnessed a constant growth in the amount of RDF data available on the Web. This growth is largely based on the increasing rate of data publication on the Web by different actors such governments, life science researchers or geographical institutes. RDF data generation is mainly done by converting already existing legacy data resources into RDF (e.g. converting data stored in relational databases into RDF), but also by creating that RDF data directly (e.g. sensors). These
more »
... DF data are normally exposed by means of Linked Data-enabled URIs and SPARQL endpoints. Given the sustained growth that we are experiencing in the number of SPARQL endpoints available, the need to be able to send federated SPARQL queries across them has also grown. Tools for accessing sets of RDF data repositories are starting to appear, differing between them on the way in which they allow users to access these data (allowing users to specify directly what RDF data set they want to query, or making this process transparent to them). To overcome this heterogeneity in federated query processing solutions, the W3C SPARQL working group is defining a federation extension for SPARQL 1.1, which allows combining in a single query, graph patterns that can be evaluated in several endpoints. In this PhD thesis, we describe the syntax of that SPARQL extension for providing access to distributed RDF data sets and formalise its semantics. We adapt existing techniques for distributed data access in relational databases in order to deal with SPARQL endpoints, which we have implemented in our federation query evaluation system (SPARQL-DQP). We describe the static optimisation techniques that we implemented in our system and we carry out a series of experiments that show that our optimisations significantly speed up the query evaluation process in presence of large query results and optional operators. Primero me gustaría dedicarle esta tesis a mis padres, tanto a mi padre Carlos como a mi madre Concepción. Ellos han estado siempre ahí, desde el comienzo, en los malos momentos de mi carrera y en los buenos. Sin ellos, no sería como soy y no hubiese llegado hasta este punto. Así que mi agradecimiento eterno y la dedicación de esta tesis. También me gustaría dedicarle esta tesis a mi hermano Miguel y a mi abuela Concepción, por todo el amor que me han dado y me dan. Quiero agradecer a mis amigos el haber estado también siempre ahí, apoyándome, con su fe infinita en mi criterio y en mi valía. Sacar adelante una tesis es algo complejo, hay muchas decisiones que tomar, decidir qué investigar, qué camino seguir (a pesar de que a priori sabes por dónde van los tiros), y requiere de muchísimo esfuerzo ya que es un muy largo proceso. Sin la supervisión de Óscar, con todo lo que me ha enseñado, con todo lo que me ha facilitado las cosas, con sus rápidas revisiones y comentarios, con su apoyo, dudo que hubiese acabado esta tesis, y casi en plazo. Por supuesto, en esta tesis han contribuido también otras muchas personas, Asun, la directora del grupo, Raúl, Miguel, otro Raúl, José, Boris, Víctor, etc. No puedo nombrarlos a todos porque se acaban las páginas. Ellos son solo unos pocos representantes del OEG que me han ayudado a finalizar esta tesis, así que gracias. También agradecer a la gente de iSOCO, en especial a José Manuel, ya que ahí fue donde realmente empezó mi trabajo como estudiante de doctorado. Yo no entiendo la investigación sin colaborar con otros investigadores. Sin las estancias que hice, en Edimburgo y Santiago, esta tesis no sería la misma. En Edimburgo me encontré con un grupo de grandes profesionales, de los que aprendí mucho, y tengo mucho que agradecerles, en especial a Ally Hume, Bartek Dobrzelecki, Radek Ostrowski, Amy Krause, Elias Theocharopoulus, Tilaye Alemu, Mike Jackson y Mario Antonioletti. Y en Chile, entre otras cosas, me encontré con una de las personas más inteligentes y apasionadas con su trabajo que he conocido, Marcelo Arenas, que me facilitó siempre las cosas, especialmente en este último año, que fue cuando más lo necesité. Parte de esta tesis también es suya. Finalmente, también quiero agradecer y dedicar esta tesis a Leslie e Iker, mi nueva familia, y mi futuro.
doi:10.20868/upm.thesis.10497
fatcat:e35bfc7l7zdyxmge55n4nxthuu