@MASTERSTHESIS\{IMM2003-02545,
    author       = "C. Poulsen and M. R. Christensen",
    title        = "A Framework for Ontology Based Queries in a Semistructured Database for World Heritage",
    year         = "2003",
    keywords     = "ontology, classification, XQuery, {XML,} World Heritage, semistructured data",
    school       = "Informatics and Mathematical Modelling, Technical University of Denmark, {DTU}",
    address      = "Richard Petersens Plads, Building 321, {DK-}2800 Kgs. Lyngby",
    type         = "",
    url          = "http://www2.compute.dtu.dk/pubdb/pubs/2545-full.html",
    abstract     = "World Heritage (WH) is an organization which aims at preserving particularly interesting areas, monuments etc. Each of these ``sites{''} are described on a website. 

In order to help users navigate the existing World Heritage website, some categorizations have been created. For instance it is possible to browse categories based on location or site type. 

It is difficult to make good categorizations and take advantage of the possibilities that they offer. But good categorizations expresses a lot of information about the sites that they cover. Categorizations can be used to make some complex queries. For example it is possible to suggest sites that are related to each other based on some category property. 

The goal of this project is to explore the possibilities that emerging {XML} technologies offer, and based on the technologies suggest a way of making categorizations of semistructured data. Furthermore we explore the possibilities that categorizations of semistructured data offer, and create a framework that supports easy generation of categorizations. We explore how queries can take advantage of categorizations and how query results can be presented to the users on the {WH} website in a usable manner. 

The {WH} site list contains many different sites, and many of them do not have much in common. This makes it hard to describe all the sites using the same schema. To avoid this problem we use a semistructured data model, and implement a software system that illustrates some of the different principles that applies to semistructured data. The implementation is based on Open Source Software and {XML} specifications from the World Wide Web Consortium such as XQuery and XPath. 

In Danish:

World Heritage (WH) er en organisation, hvis m{\aa}l er at bevare specielt interessante omr{\aa}der, monumenter mm. Hver af disse ``lokaliteter{''} er beskrevet p{\aa} en webside. 

For at hj{\ae}lpe brugere med at finde rundt i den eksisterende World Heritage webside, er der lavet nogle kategoriseringer. For eksempel er det muligt at ``browse{''} kategorier baseret p{\aa} beliggenhed eller type. 

Det kan v{\ae}re sv{\ae}rt at lave gode kategoriseringer og udnytte de muligheder, som de giver. Men gode kategoriseringer udtrykker en masse information, omkring de lokaliteter de kategoriserer. Kategoriseringer kan anvendes til at konstruere komplekse foresp{\o}rgsler. For eksempel er det muligt at lave foresp{\o}rgsler, som foresl{\aa}r andre lokaliteter, der er relaterede til en valgt lokalitet. Relationen mellem den valgte lokalitet og de relaterede lokaliteter, er indeholdt i kategoriseringerne. 

Form{\aa}let med dette projekt er at udforske de muligheder, som nye {XML} teknologier tilbyder, samt foresl{\aa}, hvordan disse kan benyttes til kategorisering af semistruktureret data. Desuden unders{\o}ger vi de anvendelsesmuligheder som kategoriseringer tilbyder, og laver et ``framework{'',} der kan benyttes til at lave kategoriseringer. Vi unders{\o}ger, hvordan foresp{\o}rgsler kan udnytte kategoriseringer til at lave gode s{\o}gefaciliteter, samt hvordan s{\o}geresultater kan pr{\ae}senteres for bes{\o}gende p{\aa} World Heritage websiden. 

Listen af lokaliteter under World Heritage indeholder mange forskelligartede lokaliteter, og mange af dem har kun f{\aa} ting til f{\ae}lles. Dette g{\o}r det problematisk at beskrive alle lokaliteter vha. et f{\ae}lles skema. For at undg{\aa} disse problemer benytter vi en semistruktureret datamodel, og implementerer et softwaresystem, som viser de forskellige principper omkring anvendelse af semistruktureret data. 

Implementationen er baseret p{\aa} open source software og {XML} specifikationer fra World Wide Web Consortium eksempelvis XPath og XQuery."
}