Header

UZH-Logo

Maintenance Infos

Theoretical and computational studies of protein folding energy landscapes


Rao, Francesco. Theoretical and computational studies of protein folding energy landscapes. 2005, University of Zurich, Faculty of Science.

Abstract

Die folgende Dissertation befasst sich mit der Entwicklung und Anwendung dreier neur Ansatze fur die Erzeugung und Untersuchung von Energy Landscapes mit dem Ziel, die Proteinfaltung zu charakterisieren und besser zu verstehen. Das Paradigma der Energy Landscapes hat sich in den letzten zehn Jahren bei der Untersuchung des Faltungsverhaltens von Proteinen bewahrt. Dieses Paradigma fuhrt dazu, dass die Energy Landscape eines Proteins vereinfacht als Trichter dargestellt werden kann. Projektionen dieser Energy Landscape auf Ordnungsparameter, wie zum Beispiel die Projektion auf die freie Energie zur Untersuchung von Stabilitat, sollten eine vereinfachte Sicht der Zustande und Energiebarrieren wiedergeben, wobei oftmals versteckte Annahmen getroffen werden, die nicht erfullt sind. Basierend auf der Theorie komplexer Netzwerke wird als erstes ein neur Ansatz zur Untersuchung der Proteinzustande vorgestellt. Dabei sind die Konformationen, welche im Verlauf einer molecular dynamics (MD) Simulation angenommen werden, die Knoten und die zeitlichen Uebergange die Verbindungen. Dieses Netzwerk reprasentiert die vollstandige multi-dimensionale Energy Landscape ohne Projektion auf willkurlich gewahlte Ordnungsparameter. Die Anwendung von Netzwerken enthullt ein komplexes Zusammenspiel von Minima, Basins und Super-Basins, die in der Energy Landscape die Rolle von Attraktoren spielen. Als erstes wird die MD-Simulation eines strukturierten Peptides (Beta3s) untersucht. Dabei werden Basins mit kleiner Entropie/ kleiner Enthalpie, sowie Basins mit grosser Entropie/grosser Enthalpie gefunden. Hierbei ist interessant, dass Beta3s im gefalteten Zustand (im Unterschied zu einer kinetischen Trap) nicht nur enthalpisch, sondern auch entropisch stabilisiert wird. Free Energy Basins entsprechen Subgraphen (Communities) des gesamten Netzwerks, wobei die Knoten in einen Basin dicht miteinander verbunden sind. Das Finden dieser Communities und die Validierung einer Unterteilung des gesamten Netzwerkes in solche ist trotz der Fulle von existierenden Algorithmen noch nicht zufriedenstllend gelost. In dieser Dissertation wird dazu ein Mass, die Goodness Deviation, vorgeschlagen. Zweitens ist die Kinetik der Proteinfaltung ebenfalls eng mit der Topographie von Energy Landscapes verknupft. Die schwer fassbare Natur des Transition State Ensemble (TSE) erlaubt kein einfaches Bild fur Faltunsubergange. Zur Charakterisierung des TSE wird oft die Faltungswahrscheinlichkeit pfold einer Proteinstruktur benutzt. Obwohl g fur die Analyse von Faltungsubergangen sehr nutzlich ist, erfordert dessen Berechnung einen grossen rechnerischen Aufwand, was die praktische Anwendungen limitiert. Die kinetische Homogenitat von strukturell ahnlichen Snapshots erlaubt jedoch einen statistischen Zugang fur die Analyse einzelner Konformationen. Die Idee des sogenannten Cluster-pfold ermoglicht es in dieser Dissertation, g fur Strukturen einer MD-simulation approximativ zu berechnen. Die Anwendung dieser Methode auf Beta3s zeigt ein breites, heterogenes TSE, sowie zwei Haupt-Pathways. Diese Ergebnisse decken sich interessanterweise mit der Netzwerk-Analyse aus vorhergehenden Untersuchungen. Der marginale Rechenaufwand fur den Cluster-pfold ermoglichte die Analyse des TSE von vielen Beta3s-Mutanten und die Berechnung von Phi-Werten. Mit herkommlichen Methoden ware dies fur unsere riesige Menge Simulationsdaten (0.65ms) unmoglich gewesen. Drittens sind in dieser Dissertation alle Simulationen mit konstanter Temperatur bei einer Temperatur T gemacht worden, welche hoher ist als die physiologische Temperatur. Es sei erwahnt, dass die Hohe der Energie-Barrieren proportional zu exp(- (DeltaE/kT) ansteigt, wobei k die Boltzmann-Konstante ist. Daher bleiben MD- Simulationen bei physiologischer Temperatur leicht in lokalen Minima stecken und ergeben somit kein korrektes Sampling der Energy Landscape innert nutzlicher Rechenzeit. In dieser Dissertation wird die Replica-exchange Methode (REM) benutzt, um die fruhen Stadium der Peptid-Aggregation eines amyloidogenetischen Peptides des Prionen-Proteins Sup35 befasst. abcxyz

Summary The present thesis is concerned with the development and application of three novel approaches for the generation and the analysis of energy landscapes characterizing protein folding. In the past decade, the energy landscape paradigm has emerged as a consistent and useful framework for the study of many aspects of protein folding leading to the so-called funnel picture for folding. Projections of the energy landscape to order parameters should give a simple and synthetic view of the states and energetic barriers of the system. Free-energy projections are used to estimate the stability and in some cases also the kinetics of the states involved in the folding process. However, this simplistic picture revealed some hidden assumptions on order parameter(s) that in many cases are not fulfilled. First, a novel approach for the study of the states of a protein, based on complex networks, is introduced. Conformations visited during a molecular dynamics (MD) simulation and the transitions between them are the nodes and the links of the network, respectively. The network represents the multi-dimensional free-energy landscape and does not require any projections to arbitrarily chosen order parameters. The network approach revealed a complex scenario of minima, basins and super- basins of attraction in the free-energy landscape. As a first application, a structure peptide, namely beta3s, was investigated by MD simulations and network analysis. Both low-enthalpy/low-entropy and high-enthalpy/high-entropy basins were found in the denatured state. Interestingly, the native state of beta3s is stabilized not only enthalpically but also entropically, the latter with respect to a kinetic trap. In the network framework, free-energy basins are defined as subgraphs (called communities or clusters) of the network where nodes are highly connected. Although many communities detection algorithms exist in literature, it is not yet clear how to judge the quality of a clusterization. A new measure to assess this problem, called goodness deviation, is proposed in the thesis. Second, kinetics of protein folding are strongly connected to the topography and the organization of the energy landscape. The elusive nature of the transition state ensemble (TSE) doesn't allow an easy and clear picture of the folding energy barrier. A common technique, widely used in literature, to characterize the TSE is the computation of the folding probability pfold which is the probability of a structure to fold before unfolding. Even if pfold is a useful quantity for transition state analysis, it requires a very large computational effort which in practice limits its application to the analysis of small sets of data. The kinetic homogeneity of structurally similar snapshots suggests the use of a statistical approach for the analysis of the kinetic properties of a peptide conformation. In this thesis, a novel approach for the computation of the folding probability, called cluster-pfold, allows the approximate estimation of the pfold for every structure sampled along an MD simulation. The application of the method on the beta3s peptide has shown the presence of a broad and heterogeneous TSE as well as two average folding pathways. Interestingly, these findings are in agreement with the network analysis performed on the peptide in our former studies. The negligible computational demand for the calculation of the cluster-pfold allowed the analysis of the TSE for a large set of beta3s mutants and the calculation of the Phi-values. Given the huge amount of simulation time (0.65 ms), this analysis would have been impossible with traditional methods. Third, all constant temperature simulations presented in this thesis were run at temperatures higher than the physiological temperature. It is worth noting that the height of energy barriers is proportional to exp(-DeltaE/kT), where k and T are the Boltzmann constant and temperature, respectively. For this reason, MD simulations ran at physiological temperatures by conventional MD. One disadvantage of the method is that it cannot be used for the analysis of the kinetics. REM simulations were also used to study the early stages of peptide aggregation of an amyloidogenic peptide from the yeast prion protein sup35. abcxyz

Abstract

Die folgende Dissertation befasst sich mit der Entwicklung und Anwendung dreier neur Ansatze fur die Erzeugung und Untersuchung von Energy Landscapes mit dem Ziel, die Proteinfaltung zu charakterisieren und besser zu verstehen. Das Paradigma der Energy Landscapes hat sich in den letzten zehn Jahren bei der Untersuchung des Faltungsverhaltens von Proteinen bewahrt. Dieses Paradigma fuhrt dazu, dass die Energy Landscape eines Proteins vereinfacht als Trichter dargestellt werden kann. Projektionen dieser Energy Landscape auf Ordnungsparameter, wie zum Beispiel die Projektion auf die freie Energie zur Untersuchung von Stabilitat, sollten eine vereinfachte Sicht der Zustande und Energiebarrieren wiedergeben, wobei oftmals versteckte Annahmen getroffen werden, die nicht erfullt sind. Basierend auf der Theorie komplexer Netzwerke wird als erstes ein neur Ansatz zur Untersuchung der Proteinzustande vorgestellt. Dabei sind die Konformationen, welche im Verlauf einer molecular dynamics (MD) Simulation angenommen werden, die Knoten und die zeitlichen Uebergange die Verbindungen. Dieses Netzwerk reprasentiert die vollstandige multi-dimensionale Energy Landscape ohne Projektion auf willkurlich gewahlte Ordnungsparameter. Die Anwendung von Netzwerken enthullt ein komplexes Zusammenspiel von Minima, Basins und Super-Basins, die in der Energy Landscape die Rolle von Attraktoren spielen. Als erstes wird die MD-Simulation eines strukturierten Peptides (Beta3s) untersucht. Dabei werden Basins mit kleiner Entropie/ kleiner Enthalpie, sowie Basins mit grosser Entropie/grosser Enthalpie gefunden. Hierbei ist interessant, dass Beta3s im gefalteten Zustand (im Unterschied zu einer kinetischen Trap) nicht nur enthalpisch, sondern auch entropisch stabilisiert wird. Free Energy Basins entsprechen Subgraphen (Communities) des gesamten Netzwerks, wobei die Knoten in einen Basin dicht miteinander verbunden sind. Das Finden dieser Communities und die Validierung einer Unterteilung des gesamten Netzwerkes in solche ist trotz der Fulle von existierenden Algorithmen noch nicht zufriedenstllend gelost. In dieser Dissertation wird dazu ein Mass, die Goodness Deviation, vorgeschlagen. Zweitens ist die Kinetik der Proteinfaltung ebenfalls eng mit der Topographie von Energy Landscapes verknupft. Die schwer fassbare Natur des Transition State Ensemble (TSE) erlaubt kein einfaches Bild fur Faltunsubergange. Zur Charakterisierung des TSE wird oft die Faltungswahrscheinlichkeit pfold einer Proteinstruktur benutzt. Obwohl g fur die Analyse von Faltungsubergangen sehr nutzlich ist, erfordert dessen Berechnung einen grossen rechnerischen Aufwand, was die praktische Anwendungen limitiert. Die kinetische Homogenitat von strukturell ahnlichen Snapshots erlaubt jedoch einen statistischen Zugang fur die Analyse einzelner Konformationen. Die Idee des sogenannten Cluster-pfold ermoglicht es in dieser Dissertation, g fur Strukturen einer MD-simulation approximativ zu berechnen. Die Anwendung dieser Methode auf Beta3s zeigt ein breites, heterogenes TSE, sowie zwei Haupt-Pathways. Diese Ergebnisse decken sich interessanterweise mit der Netzwerk-Analyse aus vorhergehenden Untersuchungen. Der marginale Rechenaufwand fur den Cluster-pfold ermoglichte die Analyse des TSE von vielen Beta3s-Mutanten und die Berechnung von Phi-Werten. Mit herkommlichen Methoden ware dies fur unsere riesige Menge Simulationsdaten (0.65ms) unmoglich gewesen. Drittens sind in dieser Dissertation alle Simulationen mit konstanter Temperatur bei einer Temperatur T gemacht worden, welche hoher ist als die physiologische Temperatur. Es sei erwahnt, dass die Hohe der Energie-Barrieren proportional zu exp(- (DeltaE/kT) ansteigt, wobei k die Boltzmann-Konstante ist. Daher bleiben MD- Simulationen bei physiologischer Temperatur leicht in lokalen Minima stecken und ergeben somit kein korrektes Sampling der Energy Landscape innert nutzlicher Rechenzeit. In dieser Dissertation wird die Replica-exchange Methode (REM) benutzt, um die fruhen Stadium der Peptid-Aggregation eines amyloidogenetischen Peptides des Prionen-Proteins Sup35 befasst. abcxyz

Summary The present thesis is concerned with the development and application of three novel approaches for the generation and the analysis of energy landscapes characterizing protein folding. In the past decade, the energy landscape paradigm has emerged as a consistent and useful framework for the study of many aspects of protein folding leading to the so-called funnel picture for folding. Projections of the energy landscape to order parameters should give a simple and synthetic view of the states and energetic barriers of the system. Free-energy projections are used to estimate the stability and in some cases also the kinetics of the states involved in the folding process. However, this simplistic picture revealed some hidden assumptions on order parameter(s) that in many cases are not fulfilled. First, a novel approach for the study of the states of a protein, based on complex networks, is introduced. Conformations visited during a molecular dynamics (MD) simulation and the transitions between them are the nodes and the links of the network, respectively. The network represents the multi-dimensional free-energy landscape and does not require any projections to arbitrarily chosen order parameters. The network approach revealed a complex scenario of minima, basins and super- basins of attraction in the free-energy landscape. As a first application, a structure peptide, namely beta3s, was investigated by MD simulations and network analysis. Both low-enthalpy/low-entropy and high-enthalpy/high-entropy basins were found in the denatured state. Interestingly, the native state of beta3s is stabilized not only enthalpically but also entropically, the latter with respect to a kinetic trap. In the network framework, free-energy basins are defined as subgraphs (called communities or clusters) of the network where nodes are highly connected. Although many communities detection algorithms exist in literature, it is not yet clear how to judge the quality of a clusterization. A new measure to assess this problem, called goodness deviation, is proposed in the thesis. Second, kinetics of protein folding are strongly connected to the topography and the organization of the energy landscape. The elusive nature of the transition state ensemble (TSE) doesn't allow an easy and clear picture of the folding energy barrier. A common technique, widely used in literature, to characterize the TSE is the computation of the folding probability pfold which is the probability of a structure to fold before unfolding. Even if pfold is a useful quantity for transition state analysis, it requires a very large computational effort which in practice limits its application to the analysis of small sets of data. The kinetic homogeneity of structurally similar snapshots suggests the use of a statistical approach for the analysis of the kinetic properties of a peptide conformation. In this thesis, a novel approach for the computation of the folding probability, called cluster-pfold, allows the approximate estimation of the pfold for every structure sampled along an MD simulation. The application of the method on the beta3s peptide has shown the presence of a broad and heterogeneous TSE as well as two average folding pathways. Interestingly, these findings are in agreement with the network analysis performed on the peptide in our former studies. The negligible computational demand for the calculation of the cluster-pfold allowed the analysis of the TSE for a large set of beta3s mutants and the calculation of the Phi-values. Given the huge amount of simulation time (0.65 ms), this analysis would have been impossible with traditional methods. Third, all constant temperature simulations presented in this thesis were run at temperatures higher than the physiological temperature. It is worth noting that the height of energy barriers is proportional to exp(-DeltaE/kT), where k and T are the Boltzmann constant and temperature, respectively. For this reason, MD simulations ran at physiological temperatures by conventional MD. One disadvantage of the method is that it cannot be used for the analysis of the kinetics. REM simulations were also used to study the early stages of peptide aggregation of an amyloidogenic peptide from the yeast prion protein sup35. abcxyz

Statistics

Downloads

4 downloads since deposited on 05 Jun 2019
3 downloads since 12 months
Detailed statistics

Additional indexing

Item Type:Dissertation (monographical)
Referees:Caflisch Amedeo, Schuler Ben
Communities & Collections:UZH Dissertations
Dewey Decimal Classification:Unspecified
Language:English
Place of Publication:Zürich
Date:2005
Deposited On:05 Jun 2019 14:43
Last Modified:07 Apr 2020 07:15
Number of Pages:61
Additional Information:Enthält Sonderdrucke
OA Status:Green
Related URLs:https://www.recherche-portal.ch/primo-explore/fulldisplay?docid=ebi01_prod005141639&context=L&vid=ZAD&search_scope=default_scope&tab=default_tab&lang=de_DE (Library Catalogue)

Download

Green Open Access

Download PDF  'Theoretical and computational studies of protein folding energy landscapes'.
Preview
Content: Published Version
Language: English
Filetype: PDF
Size: 4MB