MLTreeMap - maximum likelihood placement of environmental DNA sequence reads into curated reference phylogenies
Stark, Manuel. MLTreeMap - maximum likelihood placement of environmental DNA sequence reads into curated reference phylogenies. 2011, University of Zurich, Faculty of Science.
Abstract
Bei der Erforschung von mikrobiellen Gemeinschaften in situ stösst die traditionelle Mikrobiologie an ihre Grenzen, weil nur ein verschwindend kleiner Teil der Mikroben in Reinkultur gezu! chtet werden kann. Die Idee diesen Engpass zu umgehen, indem man DNA direkt aus aus der Umwelt extrahiert und daraufhin sequenziert, fu! hrte zur Entstehung eines neuen Forschungsfeldes, der Metagenomik. Mit Hilfe des metagenomischen Ansatzes ist es möglich, objektive Informationen u! ber alle in einer Probe präsenten Mikroben zu erhalten. Ein gewichtiger Nachteil ist allerdings, dass die gewonnenen Sequenzdaten nur fragmentiert vorliegen. MLTreeMap, das in dieser Dissertation vorgestellt wird, ist ein Softwarepaket, welches in der Metagenomik Anwendung findet. Es wurde entwickelt, um Einblicke in die phylogenetischen und funktionellen Eigenschaften von Metagenomen und den ihnen zugrundeliegenden mikrobiellen Gemeinschaften zu gewinnen. Hierfür werden die zur Diskussion stehenden DNA Sequenzen auf eine Reihe von relevanten Markergenen hin durchsucht und deren wahrscheinlichste phylogenetische Herkunft ermittelt. Zu diesen Genen gehören proteinkodierende phylogenetische Marker, 16S und 18S rRNA Gene und Marker für wichtige Stoffwechselwege. Beispiele für letztere sind die Gene der Schlüsselenzyme der Photosynthese, Stickstofffixierung, Methanfixierung und Ammoniakoxidation. MLTreeMap kann entweder direkt über das Web benutzt werden (http://mltreemap.org) oder aber auf einem lokalen Computer installiert werden. Wir veröffentlichten MLTreeMap im Jahr 2010 im Journal BMC Genomics.
Traditional microbiology has proven to be insufficient for studying entire microbial communities in situ, because only a small fraction of microbes can be grown in pure culture. The idea of circumventing this bottleneck by directly sequencing DNA from the environment led to a new field of research, called metagenomics. As a consequence of its approach, metagenomics provides a very unbiased view of all organisms contained in a sample, but it also has to cope with heavily fragmented sequence data. MLTreeMap, which is presented in this thesis, is a software framework designed to give insights into phylogenetic and functional properties of metagenomes and of the underlying microbial communities. It does so by detecting and phylotyping a series of relevant marker genes on the submitted DNA fragments. Among these genes are protein coding phylogenetic markers, 16S and 18S rRNA genes and markers for important functional pathways. Examples of the latter are genes coding for the key enzymes of photosynthesis, nitrogen fixation, methane fixation and ammonia oxidation. MLTreeMap is available as a web-server at http://mltreemap.org and also as a stand-alone version. It has been published in BMC Genomics in 2010.
Abstract
Bei der Erforschung von mikrobiellen Gemeinschaften in situ stösst die traditionelle Mikrobiologie an ihre Grenzen, weil nur ein verschwindend kleiner Teil der Mikroben in Reinkultur gezu! chtet werden kann. Die Idee diesen Engpass zu umgehen, indem man DNA direkt aus aus der Umwelt extrahiert und daraufhin sequenziert, fu! hrte zur Entstehung eines neuen Forschungsfeldes, der Metagenomik. Mit Hilfe des metagenomischen Ansatzes ist es möglich, objektive Informationen u! ber alle in einer Probe präsenten Mikroben zu erhalten. Ein gewichtiger Nachteil ist allerdings, dass die gewonnenen Sequenzdaten nur fragmentiert vorliegen. MLTreeMap, das in dieser Dissertation vorgestellt wird, ist ein Softwarepaket, welches in der Metagenomik Anwendung findet. Es wurde entwickelt, um Einblicke in die phylogenetischen und funktionellen Eigenschaften von Metagenomen und den ihnen zugrundeliegenden mikrobiellen Gemeinschaften zu gewinnen. Hierfür werden die zur Diskussion stehenden DNA Sequenzen auf eine Reihe von relevanten Markergenen hin durchsucht und deren wahrscheinlichste phylogenetische Herkunft ermittelt. Zu diesen Genen gehören proteinkodierende phylogenetische Marker, 16S und 18S rRNA Gene und Marker für wichtige Stoffwechselwege. Beispiele für letztere sind die Gene der Schlüsselenzyme der Photosynthese, Stickstofffixierung, Methanfixierung und Ammoniakoxidation. MLTreeMap kann entweder direkt über das Web benutzt werden (http://mltreemap.org) oder aber auf einem lokalen Computer installiert werden. Wir veröffentlichten MLTreeMap im Jahr 2010 im Journal BMC Genomics.
Traditional microbiology has proven to be insufficient for studying entire microbial communities in situ, because only a small fraction of microbes can be grown in pure culture. The idea of circumventing this bottleneck by directly sequencing DNA from the environment led to a new field of research, called metagenomics. As a consequence of its approach, metagenomics provides a very unbiased view of all organisms contained in a sample, but it also has to cope with heavily fragmented sequence data. MLTreeMap, which is presented in this thesis, is a software framework designed to give insights into phylogenetic and functional properties of metagenomes and of the underlying microbial communities. It does so by detecting and phylotyping a series of relevant marker genes on the submitted DNA fragments. Among these genes are protein coding phylogenetic markers, 16S and 18S rRNA genes and markers for important functional pathways. Examples of the latter are genes coding for the key enzymes of photosynthesis, nitrogen fixation, methane fixation and ammonia oxidation. MLTreeMap is available as a web-server at http://mltreemap.org and also as a stand-alone version. It has been published in BMC Genomics in 2010.
TrendTerms displays relevant terms of the abstract of this publication and related documents on a map. The terms and their relations were extracted from ZORA using word statistics. Their timelines are taken from ZORA as well. The bubble size of a term is proportional to the number of documents where the term occurs. Red, orange, yellow and green colors are used for terms that occur in the current document; red indicates high interlinkedness of a term with other terms, orange, yellow and green decreasing interlinkedness. Blue is used for terms that have a relation with the terms in this document, but occur in other documents.
You can navigate and zoom the map. Mouse-hovering a term displays its timeline, clicking it yields the associated documents.