Header

UZH-Logo

Maintenance Infos

Extracting and linking locations and activities from the Geospatial Web


Venkateswaran, Ramya. Extracting and linking locations and activities from the Geospatial Web. 2015, University of Zurich, Faculty of Science.

Abstract

The Geospatial Web contains large amounts of data that are waiting to be turned into information. This information is of great value to map services since it enables them to push dynamic data on to mobile devices where the location of the user is known. With location information constantly updating, this data can be used to inform the user of the actions that people perform in that place, or where most people go for various activities such as eating, watching a movie, etc.. This information could be extracted from unstructured text such as web pages in HTML or structured content on the web. However, people’s perception of a place is never uniform. Their view of the extent and characteristics of a place often depend on their own experiences. The nature of a place often undergoes constant change due to new infrastructure driven by increasing population, changes in economy, seasons, etc. It would be very useful if map applications could capture these changes too.
The principal contribution of this thesis is towards establishing the link between people’s perception of place and the actions they are likely to perform in that place. In this thesis we measure actions by the activities people are likely to perform. Since this research focuses on people’s perception of place, the thesis investigates and demonstrates methods to semi-automatically determine activities people perform from UGC and automatically link them to locations, also extracted from UGC. Since several conclusions in the course of this work are based on UGC and the Geospatial Web, the thesis first discusses an approach towards computing the geographic and linguistic web coverage of the relevant data. It also discusses a study to examine the geographic and linguistic variations in these data. This is especially important since these data are known to be geographically and linguistically heterogeneous.
This thesis investigates various questions, some of which are: How does the geographic and linguistic web coverage vary across Switzerland for tourism related themes and how is it affected by different factors such as population and touristic popularity? How can UGC be utilised to investigate people’s perceptions of places thereby extracting locations and perceived activities automatically? How can UGC be used to make affordances on a certain place? Once extracted, how do these activities relate to topographic data and how do they behave spatially and temporally?


Das Geoweb enthält riesige Datenmengen, die nur darauf warten, in Informationen umgewandelt zu werden. Diese Informationen sind deshalb so wertvoll für Kartendienste, da sie es erlauben, dynamisch Daten auf Mobilgeräte zu übertragen, wenn die Position des Nutzers bekannt ist. Da Geodaten ständig aktualisiert werden, kann man den Nutzer darüber informieren, was andere Nutzer am selben Ort tun, oder welche Orte sie für bestimmte Aktivitäten aufsuchen; wo sie beispielsweise essen oder ins Kino gehen. Diese Informationen können entweder aus unstrukturiertem Text wie HTML Webseiten oder aus strukturierten Netzinhalten extrahiert werden. Allerdings ist die Wahrnehmung eines Ortes durch mehrere Menschen stets unterschiedlich. Der Eindruck über die Größe eines Ortes oder dessen Eigenschaften hängen stark von den eigenen Erfahrung der Nutzer ab. Auch verändert sich ein Ort durch neue Infrastrukturen, die einer steigenden Bevölkerungsdichte Rechnung tragen, durch veränderte wirtschaftliche Umstände, je nach Jahreszeit und weitere Faktoren. Anwendungen müssen daher auch diese Veränderungen berücksichtigen.
Der fundamentale Beitrag dieser Arbeit ist, eine Verbindung zwischen der Wahrnehmung eines Ortes durch eine Person und dem, was sie dort wahrscheinlich tun wird, zu schaffen. In dieser Dissertation schließen wir von den Aktivitäten einer Person auf ihre Handlungen. Da sich diese Forschung auf die Wahrnehmung eines Ortes durch die Menschen konzentriert, untersucht und entwickelt die vorliegende Arbeit Methoden, die halbautomatisch die Aktivitäten aus nutzergenerierten Inhalten (UGC) extrahiert und sie dann automatisch mit Standorten verbindet, die ebenfalls aus nutzergenerierten Inhalten entnommen werden. Der Fokus dieser Arbeit richtet sich auf die nutzergenerierten Daten und das Geoweb. Dies erfordertin einem ersten Schritt Erfassung der geographischen und sprachlich-räumlichen Abdeckung dieser Daten um eine Vorstellung zu erhalten, welche und wieviele Daten im Geoweb zu Verfügung stehen. Die Abdeckung der Daten im Netz ist nicht homogen; sie variiert geographisch und sprachlich. Dies erfordert daher erst eine Untersuchung dieser Variationen, bevor diese Daten für weitere Untersuchungen verwenden können.
In dieser Dissertation untersuchen wir verschiedenen Fragestellungen, unter anderem: Wie verändert sich die sprachliche und geographische Netzabdeckung von Tourismusthemen an verschiedenen Orten der Schweiz und wie wird sie durch verschiedene Faktoren wie Bevölkerungsdichte und Beliebtheit bei Touristen beeinflusst? Wie kann man nutzergenerierte Inhalte nutzen, um auf die Wahrnehmung eines Ortes durch den Nutzer zu schließen, um dann wiederum Geodaten und Aktivitäten automatisch daraus abzuleiten?Wie können nutzergenerierte Inhalte verwendet werden, um zu erfassen wie ein Ort genutzt wird und welche Aktivitäten er ermöglicht? Wie verhalten sie diese abgeleiteten Aktivitäten in Bezug auf topografische Daten und wie verändern sie sich in zeitlich und räumlich?

Abstract

The Geospatial Web contains large amounts of data that are waiting to be turned into information. This information is of great value to map services since it enables them to push dynamic data on to mobile devices where the location of the user is known. With location information constantly updating, this data can be used to inform the user of the actions that people perform in that place, or where most people go for various activities such as eating, watching a movie, etc.. This information could be extracted from unstructured text such as web pages in HTML or structured content on the web. However, people’s perception of a place is never uniform. Their view of the extent and characteristics of a place often depend on their own experiences. The nature of a place often undergoes constant change due to new infrastructure driven by increasing population, changes in economy, seasons, etc. It would be very useful if map applications could capture these changes too.
The principal contribution of this thesis is towards establishing the link between people’s perception of place and the actions they are likely to perform in that place. In this thesis we measure actions by the activities people are likely to perform. Since this research focuses on people’s perception of place, the thesis investigates and demonstrates methods to semi-automatically determine activities people perform from UGC and automatically link them to locations, also extracted from UGC. Since several conclusions in the course of this work are based on UGC and the Geospatial Web, the thesis first discusses an approach towards computing the geographic and linguistic web coverage of the relevant data. It also discusses a study to examine the geographic and linguistic variations in these data. This is especially important since these data are known to be geographically and linguistically heterogeneous.
This thesis investigates various questions, some of which are: How does the geographic and linguistic web coverage vary across Switzerland for tourism related themes and how is it affected by different factors such as population and touristic popularity? How can UGC be utilised to investigate people’s perceptions of places thereby extracting locations and perceived activities automatically? How can UGC be used to make affordances on a certain place? Once extracted, how do these activities relate to topographic data and how do they behave spatially and temporally?


Das Geoweb enthält riesige Datenmengen, die nur darauf warten, in Informationen umgewandelt zu werden. Diese Informationen sind deshalb so wertvoll für Kartendienste, da sie es erlauben, dynamisch Daten auf Mobilgeräte zu übertragen, wenn die Position des Nutzers bekannt ist. Da Geodaten ständig aktualisiert werden, kann man den Nutzer darüber informieren, was andere Nutzer am selben Ort tun, oder welche Orte sie für bestimmte Aktivitäten aufsuchen; wo sie beispielsweise essen oder ins Kino gehen. Diese Informationen können entweder aus unstrukturiertem Text wie HTML Webseiten oder aus strukturierten Netzinhalten extrahiert werden. Allerdings ist die Wahrnehmung eines Ortes durch mehrere Menschen stets unterschiedlich. Der Eindruck über die Größe eines Ortes oder dessen Eigenschaften hängen stark von den eigenen Erfahrung der Nutzer ab. Auch verändert sich ein Ort durch neue Infrastrukturen, die einer steigenden Bevölkerungsdichte Rechnung tragen, durch veränderte wirtschaftliche Umstände, je nach Jahreszeit und weitere Faktoren. Anwendungen müssen daher auch diese Veränderungen berücksichtigen.
Der fundamentale Beitrag dieser Arbeit ist, eine Verbindung zwischen der Wahrnehmung eines Ortes durch eine Person und dem, was sie dort wahrscheinlich tun wird, zu schaffen. In dieser Dissertation schließen wir von den Aktivitäten einer Person auf ihre Handlungen. Da sich diese Forschung auf die Wahrnehmung eines Ortes durch die Menschen konzentriert, untersucht und entwickelt die vorliegende Arbeit Methoden, die halbautomatisch die Aktivitäten aus nutzergenerierten Inhalten (UGC) extrahiert und sie dann automatisch mit Standorten verbindet, die ebenfalls aus nutzergenerierten Inhalten entnommen werden. Der Fokus dieser Arbeit richtet sich auf die nutzergenerierten Daten und das Geoweb. Dies erfordertin einem ersten Schritt Erfassung der geographischen und sprachlich-räumlichen Abdeckung dieser Daten um eine Vorstellung zu erhalten, welche und wieviele Daten im Geoweb zu Verfügung stehen. Die Abdeckung der Daten im Netz ist nicht homogen; sie variiert geographisch und sprachlich. Dies erfordert daher erst eine Untersuchung dieser Variationen, bevor diese Daten für weitere Untersuchungen verwenden können.
In dieser Dissertation untersuchen wir verschiedenen Fragestellungen, unter anderem: Wie verändert sich die sprachliche und geographische Netzabdeckung von Tourismusthemen an verschiedenen Orten der Schweiz und wie wird sie durch verschiedene Faktoren wie Bevölkerungsdichte und Beliebtheit bei Touristen beeinflusst? Wie kann man nutzergenerierte Inhalte nutzen, um auf die Wahrnehmung eines Ortes durch den Nutzer zu schließen, um dann wiederum Geodaten und Aktivitäten automatisch daraus abzuleiten?Wie können nutzergenerierte Inhalte verwendet werden, um zu erfassen wie ein Ort genutzt wird und welche Aktivitäten er ermöglicht? Wie verhalten sie diese abgeleiteten Aktivitäten in Bezug auf topografische Daten und wie verändern sie sich in zeitlich und räumlich?

Statistics

Downloads

24 downloads since deposited on 17 Feb 2017
12 downloads since 12 months
Detailed statistics

Additional indexing

Item Type:Dissertation (monographical)
Referees:Weibel Robert, Purves Ross S, Burghardt Dirk
Communities & Collections:07 Faculty of Science > Institute of Geography
UZH Dissertations
Dewey Decimal Classification:910 Geography & travel
Language:English
Place of Publication:Zürich
Date:2015
Deposited On:17 Feb 2017 12:42
Last Modified:15 Apr 2021 14:39
Number of Pages:135
OA Status:Green

Download

Green Open Access

Download PDF  'Extracting and linking locations and activities from the Geospatial Web'.
Preview
Content: Published Version
Language: English
Filetype: PDF
Size: 6MB