Abstract
Movement (in space and time) is studied by different research fields, such as GIScience, movement ecology, or urban planning in order to gain insights into behavior of animals or people. Recent technological advancements allow collecting huge volumes of movement data in the form of GPS records. Movement analysis aims at developing methods with a strong focus on detecting movement patterns in relation to movement behavior. In this context, data mining as the key process of knowledge discovery in databases (KDD) is often applied on movement data in order to achieve a better understanding of movement patterns in terms of the moving objects’ behavior. Within spatial data mining, movement patterns today are mostly quantified on the basis of geometric properties and the arrangement of the GPS points. Although information about the geographic environment surrounding the movement patterns could provide semantics, from a methodological point of view, thus far the relation of movement to its surrounding geographic context has largely been neglected. Therefore, in this thesis, the relation of movement to the geographic context is investigated with regard to effects of preprocessing, its sensitivity to different methods for relating the movement to its embedding geographic context, and scale issues. Preprocessing primarily aims at removing erroneous and filtering irrelevant data. In the KDD process, the focus lies on data mining, and the therewith development of algorithms. Besides data mining, preprocessing is also well established in recent research on movement analysis, as for example with the detection of stops and moves, or the identification of inaccurate GPS measurements. However, preprocessing is specific to almost each study, depending on various factors, such as, for example, the species under investigation or the problem scenario. Nevertheless, a common ground for preprocessing in movement analysis can be formalized on a more general level. In this work, a preprocessing workflow based on averaged speed values is presented. This preprocessing workflow proved to enable the detection of stops and moves at different temporal scales, applicable within different research contexts. Further, effects of preprocessing on the computation of movement parameters and their relation to geographic context were investigated in different case studies. The various experiments on quantitative effects of preprocessing procedures produced a complex picture. While in some cases the effect of preprocessing was significant (e.g., computing speed values on map-matched movement data), in others it was negligible (e.g., filtering stops in movement data with low temporal sampling rate). The experiments illustrated that preprocessing of movement data can cause expected (e.g., low speed values at stops), but also unexpected effects (e.g., unrealistic speed values due to map matching). All in all, on a more specific level, it is not possible to establish generic guidelines; instead, besides the presented preprocessing workflow, individual considerations are required on a case-by-case basis. GPS data are usually captured as a temporal sequence of point locations. Although a variety of movement models from different disciplines (e.g., GIScience, movement ecology) exist, in GIScience, movement most often is modeled in the form of points. As a consequence, movement-context relation methods are commonly based on the point geometry of the movement data with the use of some form of buffer analysis. In this work, we present a movement-context relation matrix, where different movement-context relation methods are categorized on the basis of models for movement (x-axis) and context (y-axis). The matrix was validated with a case study relating the movement of animals to factors of their geographic context. Different movement models and the therewith application of different movement-context relation methods resulted in significant differences in the space-use distributions generated with regard to the geographic context. Therefore, the proposed movement-context relation matrix is a reasonable means for choosing a suitable movement-context relation method. In the relation of movement to geographic context different types of scale, such as the temporal scale of the movement, as well as the spatial and thematic scale of the context come into play. Recent studies in movement analysis most often focused on effects of varying the temporal scale. When even different sorts of scale are considered, interdependencies between different scales have rarely been investigated thus far. Therefore, sensitivity experiments were conducted with regard to different types of scale (temporal scale of movement, and spatial and thematic scale of geographic context). Besides effects of spatial and thematic scale of the geographic context on the result of relating movement to geographic context, interdependencies between all the types of scale under investigation in this thesis, were revealed. As a consequence, different types of scale cannot be regarded in isolation with regard to the relation of movement and geographic context. This thesis confirmed that taking into account different types of scale is crucial in order to understand movement in relation to its surrounding geographic environment. Coefficient of variation analysis allowed gaining the insight that within the relation of movement and geographic context, effects of scale and variations caused by different relation methods can be in the same order of magnitude. In a first case study – relating animal movement (and its properties) to land cover and terrain using different relation methods – revealed manifold and not easy-to-predict dependencies between problem scenario, data granularity, chosen relation method and relation method parameterizations. Similarly, in a second case study – relating the movement of outdoor sportsmen and urban shoppers to their movement context – also revealed that in some constellations, the choice of relation method and the method for deriving context variables has significant impact on the strength of relations found. For instance, it was shown that correlation analysis is highly sensitive to different quantitative methods for modeling slope. This study illustrated the substantial difficulty to distinguish between what is really a new insight in terms of movement behavior and what appears to be an artifact of the methodology. In the course of this work, different factors that play an important role in the relation of movement to geographic context were revealed. On the one hand, the quantification of aspects of movement and the geographic context proved to be crucial when relating them. On the other hand, preprocessing, movement-context relation methods, and scale showed having a significant impact on quantifying the relation of movement to geographic context. The insights gained in this thesis can support future studies with methods for developing more specific tools for context-aware movement analysis. This thesis presented means for bridging the semantic gap between movement patterns and movement behavior through the relation of movement to geographic context. Revealing causal relationships between movement and geographic context, however, still remains a major challenge of future research. In relation to statements of Dodge et al. (2008, p.245, according to Blythe et al., 1996) and Orellana & Renso (2010, p.67), this dissertation allows the following conclusion: “Movement is behavior, but patterns are not yet.”
Bewegung (in Raum und Zeit) ist Gegenstand verschiedener Forschungsfelder, wie etwa der Geographischen Informationswissenschaft, der Bewegungsökologie oder der Stadtplanung. Bewegungsanalyse vermag Erkenntnisse über das Verhalten von Tieren und Menschen aufzudecken. Heute verfügbare Technologien erlauben das Sammeln grosser Mengen von Bewegungsdaten in Form von GPS-Aufnahmen. Die methodische Disziplin der Bewegungsanalyse beabsichtigt das Auffinden von Bewegungsmustern hinsichtlich eines besseren Verständnisses von Bewegungsverhalten. In diesem Zusammenhang wird häufig Data-Mining als Teilprozess des Knowledge Discovery in Databases (KDD) auf Bewegungsdaten angewendet. Innerhalb des räumlichen Data-Mining werden Bewegungsmuster heutzutage meistens auf der Basis geometrischer Eigenschaften und der Anordnung von GPS-Punkten quantifiziert. Obwohl Informationen über die geographische Umgebung zur semantischen Anreicherung von Bewegungsmustern dienen könnten, wurden bisher Methoden zur expliziten Quantifizierung des Zusammenhangs zwischen der Bewegung und dem geographischen Kontext weitgehend vernachlässigt. Deshalb wird in dieser Arbeit die Verknüpfung der Bewegung und dem geographischem Kontext in Bezug auf Effekte der Vorverarbeitung, dessen Sensitivität gegenüber Methoden zur Verknüpfung der Bewegung mit geographischem Kontext und Skalenaspekte untersucht. Die Vorverarbeitung dient primär dem Entfernen fehlerhafter und dem Filtern irrelevanter Daten. Im KDD-Prozess liegt der Fokus auf dem Data-Mining und der damit verbundenen Entwicklung von Algorithmen. Nebst Data-Mining ist die Vorverarbeitung ein anerkannter Bestandteil des KDD-Prozesses innerhalb kürzlich erschienener Forschungsarbeiten der Bewegungsanalyse, wie zum Beispiel beim Detektieren von Stopps und Bewegungsphasen oder der Identifikation ungenauer GPS-Messungen. Es zeigt sich allerdings, dass die Vorverarbeitung für beinahe jede Studie in Abhängigkeit spezifischer Rahmenbedingungen (z.B. Art des Bewegungsobjekts oder Problemszenario) unterschiedlich ausgestaltet werden muss. Dennoch kann eine gemeinsame Basis für unterschiedliche Studien hinsichtlich der Vorverarbeitung in der Bewegungsanalyse auf einem allgemeineren Level formuliert werden. In dieser Arbeit wird ein Vorverarbeitungs-Arbeitsablauf, welcher auf gemittelten Geschwindigkeitswerten basiert, präsentiert. Dieser Vorverarbeitungsprozess hat sich für die Detektion von Stopps und Bewegungsphasen verschiedener zeitlicher Skalen innerhalb verschiedener Forschungskontexte als geeignet erwiesen. Des Weiteren wurden in verschiedenen Fallstudien die Sensitivität der Berechnung von Bewegungsparametern und deren Zusammenhang zu geographischem Kontext untersucht. Die verschiedenen Experimente bezüglich quantitativer Effekte der Vorverarbeitungs-Prozeduren erzeugten ein komplexes Bild. Die Vorverarbeitungs-Effekte waren in einigen Fällen signifikant (z.B. Berechnung der Geschwindigkeit auf mit Map-Matching korrigierte Bewegungsdaten), in einigen anderen vernachlässigbar (z.B. Filtern von Stopps in Bewegungsdaten mit tiefer zeitlicher Auflösung). Die Experimente illustrierten, dass die Vorverarbeitung der Bewegungsdaten erwartete (z.B. tiefe Geschwindigkeiten bei Stoppphasen), aber auch unerwartete Effekte (z.B. unrealistische Geschwindigkeitswerte aufgrund des Map-Matching) zur Folge haben kann. Alles in allem gibt es diesbezüglich keine generellen Richtlinien; stattdessen benötigt man nebst einem allgemeineren Vorverarbeitungs-Arbeitsablauf auch spezifische Annahmen von Fall zu Fall. GPS-Daten werden normalerweise als Beobachtungspunkte in zeitlicher Abfolge erfasst. Obwohl eine grosse Vielfalt an Bewegungsmodellen aus verschiedenen Disziplinen (z.B. Geographische Informationswissenschaft, Bewegungsökologie) existieren, wird die Bewegung in der Geographischen Informationswissenschaft oft in Form von Punkten modelliert. Demzufolge basieren auch Bewegung-Kontext-Verknüpfungsmethoden normalerweise auf Punktgeometrien der Bewegungsdaten, wie beispielsweise mit der Anwendung einer Pufferanalyse. In dieser Arbeit präsentieren wir eine Bewegung-Kontext-Verknüpfungsmatrix, bei welcher Bewegung-Kontext-Verknüpfungsmethoden auf der Basis von Bewegungs- (x-Achse) und Kontextmodellen (y-Achse) strukturiert werden. Die Matrix wurde mit einer Fallstudie validiert, indem Tierbewegungen in Bezug zu Faktoren des umgebenden geographischen Kontexts gesetzt wurde. Verschiedene Varianten zur Modellierung der Bewegung und die damit verbundene Anwendung verschiedener Bewegung-Kontext-Verknüpfungsmethoden resultierten in signifikanten Differenzen in den Verteilungen der Raumnutzung generiert in Bezug auf den geographischen Kontext. Deshalb stellt die vorgeschlagene Bewegung-Kontext-Verknüpfungsmatrix ein sinnvolles Mittel zur Auswahl einer geeigneten Bewegung-Kontext-Verknüpfungsmethode dar. Bei der Verknüpfung der Bewegung und des geographischen Kontexts kommen verschiedene Skalenarten, wie die zeitliche Skala der Bewegung und die räumliche und thematische Skala des Kontexts ins Spiel. Neuste Studien der Bewegungsanalyse tragen häufig nur der zeitlichen Skala der Bewegung Rechnung. Falls sogar verschiedene Skalensorten berücksichtigt werden, werden jedoch Abhängigkeiten zwischen den Skalen bisher selten untersucht. Deshalb wurden in dieser Dissertation Sensitivitätsexperimente hinsichtlich verschiedener Skalentypen (zeitliche Skala der Bewegung, und räumliche und thematische Skala des geographischen Kontexts) durchgeführt. Nebst Effekten räumlicher und thematischer Skala des geographischen Kontexts auf das Resultat der Verknüpfung der Bewegung und geographischem Kontext, wurden Abhängigkeiten zwischen allen in dieser Arbeit untersuchten Skalentypen aufgezeigt. Deshalb können verschiedene Skalenarten in Bezug auf die Verknüpfung von Bewegung und geographischem Kontext nicht isoliert betrachtet werden. Diese Arbeit bestätigte, dass die Berücksichtigung verschiedener Instanzen verschiedener Skalenarten für das Verständnis der Bewegung in Bezug auf dessen geographische Umwelt wesentlich ist. Die Analyse mittels Variationskoeffizienten hat die Erkenntnis erlaubt, dass Effekte in der Bewegung-Kontext-Verknüpfung aufgrund der Skalenvariation und unterschiedlicher Verknüpfungsmethoden in der gleichen Grössenordnung liegen können. In einer ersten Fallstudie hat die Verknüpfung von Tierbewegungen (und deren Eigenschaften) zu Bodenbedeckung und Gelände mit verschiedenen Verknüpfungsmethoden, vielfältige und nicht einfach vorherzusagende Abhängigkeiten zwischen Problemszenario, Datengranularität, gewählter Verknüpfungsmethode und Methodenparametrisierung aufgedeckt. Ebenso zeigte die Verknüpfung der Bewegung von Outdoor-Sportlern und städtischen Einkäufern zu deren Bewegungskontext in einer zweiten Fallstudie, dass in einigen Konstellationen die Wahl der Verknüpfungsmethode und die Methode zum Ableiten von Kontextvariablen einen signifikanten Einfluss auf die gefundene Zusammenhangsstärke haben. Es wurde zum Beispiel gezeigt, dass die Korrelationsanalyse hoch sensitiv gegenüber verschiedener quantitativer Methoden für die Modellierung der Hangneigung ist. Diese Studie illustrierte die beachtliche Schwierigkeit der Unterscheidung zwischen neuen Erkenntnissen in Bezug auf Bewegungsverhalten und Artefakten der Methodik. Im Zuge dieser Arbeit wurde aufgedeckt, dass verschiedene Faktoren in der Verknüpfung der Bewegung und des geographischen Kontexts eine wichtige Rolle spielen. Einerseits hat sich die Methodik zur Quantifizierung von Aspekten der Bewegung und des geographischen Kontexts bei deren Verknüpfung als entscheidend erwiesen. Andererseits hat diese Arbeit aufgezeigt, dass die Vorverarbeitung, Bewegung-Kontext-Verknüpfungsmethoden und Skala, massgebliche Einflussfaktoren auf die quantitative Ausprägung des Zusammenhangs zwischen der Bewegung und dessen geographischen Kontext sind. Die Erkenntnisse, welche in dieser Dissertation gewonnen werden konnten, können in zukünftigen Studien zur Entwicklung spezifischer Werkzeuge für die kontext-sensitive Bewegungsanalyse beitragen. In dieser Arbeit wurden Mittel zur Überbrückung der semantischen Lücke zwischen Bewegungsmustern und Bewegungsverhalten durch die Verknüpfung der Bewegung und geographischem Kontext präsentiert. Das Enthüllen kausaler Zusammenhänge zwischen Bewegung und geographischem Kontext bleibt dennoch eine Hauptherausforderung zukünftiger Forschung. Diese Erkenntnisse erlauben die folgende Schlussfolgerung in Anlehnung an die Aussagen von Dodge et al. (2008, p.245, according to Blythe et al., 1996) und Orellana & Renso (2010, p.67): “Bewegung ist Verhalten, aber Muster sind dies noch nicht.”