Header

UZH-Logo

Maintenance Infos

Automatic verification of small molecule structure with one dimensional proton nuclear magnetic resonance spectrum


Li, Jiwen. Automatic verification of small molecule structure with one dimensional proton nuclear magnetic resonance spectrum. 2010, University of Zurich, Faculty of Economics.

Abstract

Zusammenfassung Die Verifikation von kleinen eindimensionalen molekularen Protonstrukturen mittels NMR (Nuclear Magnetic Resonance) ist eine zentrale Methode für die Entdeckung und Entwicklung von Medikamenten geworden. Der manuelle Verifikationsprozess ist jedoch ineffizient, womit diese Methode sich auf ein Entscheidungsinstrument für die Identifikation von molekularen Strukturen beschränkt.

Betrachtet man die unbestreitbaren Vorteile von NMR in der Identifikation von molekularen Strukturen (verglichen mit anderen Techniken), liegt auf der Hand, dass die Verbreitung dieser Technologie als routinemässige Verifikationsmethode für molekulare Strukturen die Entwicklung von Medikamenten erheblich effizienter machen kann, insbesondere im Compound Library Management der pharmazeutischen Industrie.

Dementsprechend wurde Software für die automatisierte NMR Structure Verification entwickelt, in der Literatur beschrieben sowie kommerziell vertrieben. Leider sind diese Ansätze grundsätzlich limitiert (und hängen beispielweise stark von der Chemical Shift Prediction ab) und sind in der Praxis nicht einsetzbar.

Angesichts der hohen Motivation durch die Industrie schlagen wir einen alternativen Ansatz für das vorliegende Problem vor. Wir schlagen vor, Prinzipien der Künstlichen Intelligenz (AI) zu nutzen, um das Vorgehen eine Spektroskopisten in der NMR Molekülstruktur-Verfikation zu simulieren.

Geleitet durch diese Strategie wird ein auf menschlicher Logik basierender Optimierungsansatz entwickelt, um den Entscheidungsprozess des Spektoskopisten zu simulieren. Der Ansatz basiert auf einem Wahrscheinlichkeitsmodell, das benutzt wird, um den auf menschlicher Logik basierenden Optimierungsansatz mit dem Maximum Likelihood Framework zu vereinigen. Desweiteren wird ein neues System für die 1D 1H NMR Verifikation molekularer Strukturen entwickelt und auf dem vorgängig erwähnten Optimierungsprozess implementiert.

Um die zahlreichen NMR Spektroskopisten und andere am Prozess interessierte zu überzeugen, werden umfassende Experimente präsentiert, die aufzeigen, dass das System eine sehr hohe Leistung sowohl in der Genauigkeit wie auch in der Konsistenz im Vergleich mit Spektroskopisten in den genutzten Test Sets hat 1.

Dieses Resultat validiert die Korrektheit unseres Ansatzes sowie die Machbarkeit, industrielle Software basierend auf unserem System zu bauen für den praktischen Einsatz in industriellen Strukturverifikationsumgebungen. Dementsprechend ist kommerzielle Software, die auf unserem System basiert in der Entwicklung in einem bedeutenden NMR Hersteller, welche in der pharmazeutischen Industrie released werden wird.

Abschliessend diskutiert diese Arbeit Ähnlichkeiten und Unterschiede zwischen der Optimierung basierend auf menschlicher Logik und anderen verbreiteten Optimierungsansätzen mit einem speziellen Fokus auf der Anwendbarkeit.

1 Um eine praktische Auswertung zu ermöglichen, werden detailierte Structural Verification Reports von 81 Verbindungen, die durch das System generiert wurden im Appendix katalogisiert. Wir hoffen dass durch diese Diskussionen die Optimierung basierend auf menschlicher Logik als Referenz für andere praxisorientierte Informatiker für die Lösung anderer Automationsprobleme in anderen Gebieten genutzt wird. Small molecule structure one dimensional (1D) proton (1H) Nuclear Magnetic Resonance (NMR) verification has become a vital procedure for drug design and discovery. However, the inefficient throughput of human verification procedure has limited its application only to an arbitral instrument for molecular structural identification. Considering NMR’s unimpeachable advantages in molecular structural identification tasks (compared to other techniques), to popularize NMR technology into routine molecular structural verification procedures (especially in compound library management of the pharmaceutical industry), will dramatically increase the efficiency of drug discovery procedures. As a result, some automatic NMR structure verification software approaches were developed, described in the literature and are commercially available. Unfortunately, all of them are limited in principal (e.g. they heavily depend on the chemical shift prediction) and are shown not to be working in practice.

Driven by the strong motivation from the industry, we propose a new approach as an alternative to approach the problem. Specifically, we propose to utilize approaches from artificial intelligence (AI) to mimic the spectroscopist’s NMR molecular structure verification procedure. Guided by this strategy, a human-logic based optimization (i.e. heuristic search) approach is designed to mimic the spectroscopist’s decision process. The approach is based on a probabilistic model that is used to unify the human logic based optimization approach under maximum likelihood framework. Furthermore, a new automatic 1D 1H NMR molecular structural verification system is designed and implemented based on the optimization approach proposed earlier.

In order to convince vast NMR spectroscopists and molecular structural identification participators, comprehensive experiments are used to evaluate the system’s decision accuracy and consistency to the spectroscopists. The results of the experiments demonstrate that the system has very high performance in terms of both accuracy and consistency with the spectroscopists on the test datasets we used1. This result validates both the correctness of our approach and the feasibility of building industrialized software based on our system to be used in practical industrial structural verification environments. As a result, commercial software based on our system is under development by a major NMR manufacture, and is going to be released to the pharmaceutical industry.

Finally, the thesis also discusses similarities and differences between the human logic based optimization and other typically used optimization approaches, and especially focuses on their applicability. Through these discussions, we hope that the human logic based optimization could be used as a reference by other practical computer science participants to solve other automation problems from different domains.



1 To be convenient for the evaluation of vast molecular structural identification practitioners, detail structural verification reports of 81 compounds generated by the system are cataloged in the thesis’ appendix.

Abstract

Zusammenfassung Die Verifikation von kleinen eindimensionalen molekularen Protonstrukturen mittels NMR (Nuclear Magnetic Resonance) ist eine zentrale Methode für die Entdeckung und Entwicklung von Medikamenten geworden. Der manuelle Verifikationsprozess ist jedoch ineffizient, womit diese Methode sich auf ein Entscheidungsinstrument für die Identifikation von molekularen Strukturen beschränkt.

Betrachtet man die unbestreitbaren Vorteile von NMR in der Identifikation von molekularen Strukturen (verglichen mit anderen Techniken), liegt auf der Hand, dass die Verbreitung dieser Technologie als routinemässige Verifikationsmethode für molekulare Strukturen die Entwicklung von Medikamenten erheblich effizienter machen kann, insbesondere im Compound Library Management der pharmazeutischen Industrie.

Dementsprechend wurde Software für die automatisierte NMR Structure Verification entwickelt, in der Literatur beschrieben sowie kommerziell vertrieben. Leider sind diese Ansätze grundsätzlich limitiert (und hängen beispielweise stark von der Chemical Shift Prediction ab) und sind in der Praxis nicht einsetzbar.

Angesichts der hohen Motivation durch die Industrie schlagen wir einen alternativen Ansatz für das vorliegende Problem vor. Wir schlagen vor, Prinzipien der Künstlichen Intelligenz (AI) zu nutzen, um das Vorgehen eine Spektroskopisten in der NMR Molekülstruktur-Verfikation zu simulieren.

Geleitet durch diese Strategie wird ein auf menschlicher Logik basierender Optimierungsansatz entwickelt, um den Entscheidungsprozess des Spektoskopisten zu simulieren. Der Ansatz basiert auf einem Wahrscheinlichkeitsmodell, das benutzt wird, um den auf menschlicher Logik basierenden Optimierungsansatz mit dem Maximum Likelihood Framework zu vereinigen. Desweiteren wird ein neues System für die 1D 1H NMR Verifikation molekularer Strukturen entwickelt und auf dem vorgängig erwähnten Optimierungsprozess implementiert.

Um die zahlreichen NMR Spektroskopisten und andere am Prozess interessierte zu überzeugen, werden umfassende Experimente präsentiert, die aufzeigen, dass das System eine sehr hohe Leistung sowohl in der Genauigkeit wie auch in der Konsistenz im Vergleich mit Spektroskopisten in den genutzten Test Sets hat 1.

Dieses Resultat validiert die Korrektheit unseres Ansatzes sowie die Machbarkeit, industrielle Software basierend auf unserem System zu bauen für den praktischen Einsatz in industriellen Strukturverifikationsumgebungen. Dementsprechend ist kommerzielle Software, die auf unserem System basiert in der Entwicklung in einem bedeutenden NMR Hersteller, welche in der pharmazeutischen Industrie released werden wird.

Abschliessend diskutiert diese Arbeit Ähnlichkeiten und Unterschiede zwischen der Optimierung basierend auf menschlicher Logik und anderen verbreiteten Optimierungsansätzen mit einem speziellen Fokus auf der Anwendbarkeit.

1 Um eine praktische Auswertung zu ermöglichen, werden detailierte Structural Verification Reports von 81 Verbindungen, die durch das System generiert wurden im Appendix katalogisiert. Wir hoffen dass durch diese Diskussionen die Optimierung basierend auf menschlicher Logik als Referenz für andere praxisorientierte Informatiker für die Lösung anderer Automationsprobleme in anderen Gebieten genutzt wird. Small molecule structure one dimensional (1D) proton (1H) Nuclear Magnetic Resonance (NMR) verification has become a vital procedure for drug design and discovery. However, the inefficient throughput of human verification procedure has limited its application only to an arbitral instrument for molecular structural identification. Considering NMR’s unimpeachable advantages in molecular structural identification tasks (compared to other techniques), to popularize NMR technology into routine molecular structural verification procedures (especially in compound library management of the pharmaceutical industry), will dramatically increase the efficiency of drug discovery procedures. As a result, some automatic NMR structure verification software approaches were developed, described in the literature and are commercially available. Unfortunately, all of them are limited in principal (e.g. they heavily depend on the chemical shift prediction) and are shown not to be working in practice.

Driven by the strong motivation from the industry, we propose a new approach as an alternative to approach the problem. Specifically, we propose to utilize approaches from artificial intelligence (AI) to mimic the spectroscopist’s NMR molecular structure verification procedure. Guided by this strategy, a human-logic based optimization (i.e. heuristic search) approach is designed to mimic the spectroscopist’s decision process. The approach is based on a probabilistic model that is used to unify the human logic based optimization approach under maximum likelihood framework. Furthermore, a new automatic 1D 1H NMR molecular structural verification system is designed and implemented based on the optimization approach proposed earlier.

In order to convince vast NMR spectroscopists and molecular structural identification participators, comprehensive experiments are used to evaluate the system’s decision accuracy and consistency to the spectroscopists. The results of the experiments demonstrate that the system has very high performance in terms of both accuracy and consistency with the spectroscopists on the test datasets we used1. This result validates both the correctness of our approach and the feasibility of building industrialized software based on our system to be used in practical industrial structural verification environments. As a result, commercial software based on our system is under development by a major NMR manufacture, and is going to be released to the pharmaceutical industry.

Finally, the thesis also discusses similarities and differences between the human logic based optimization and other typically used optimization approaches, and especially focuses on their applicability. Through these discussions, we hope that the human logic based optimization could be used as a reference by other practical computer science participants to solve other automation problems from different domains.



1 To be convenient for the evaluation of vast molecular structural identification practitioners, detail structural verification reports of 81 compounds generated by the system are cataloged in the thesis’ appendix.

Statistics

Downloads

1148 downloads since deposited on 07 Feb 2011
67 downloads since 12 months
Detailed statistics

Additional indexing

Item Type:Dissertation (monographical)
Referees:Bernstein Abraham, Baldridge K
Communities & Collections:UZH Dissertations
Dewey Decimal Classification:000 Computer science, knowledge & systems
Uncontrolled Keywords:Artificial Intelligence
Language:English
Place of Publication:Zurich
Date:2010
Deposited On:07 Feb 2011 16:33
Last Modified:24 Sep 2019 17:21
Number of Pages:258
Additional Information:Automatic verification of small molecule structure with one dimensional proton nuclear magnetic resonance spectrum / by Jiwen Li. - [Zurich], 2010
OA Status:Green
Related URLs:https://www.recherche-portal.ch/primo-explore/fulldisplay?docid=ebi01_prod006130381&context=L&vid=ZAD&search_scope=default_scope&tab=default_tab&lang=de_DE (Library Catalogue)
Other Identification Number:merlin-id:13075

Download

Green Open Access

Download PDF  'Automatic verification of small molecule structure with one dimensional proton nuclear magnetic resonance spectrum'.
Preview
Filetype: PDF
Size: 11MB