Novel Machine Learning Methods for Computational Chemistry [article]

Katja Hansen, Technische Universität Berlin, Technische Universität Berlin, Klaus-Robert Müller
2012
Die Untersuchung komplexer pharmakokinetischen Eigenschaften, wie Absorption, Disposition, Metabolismus oder Toxizität, ist bei Arzneistoffen mit einem enormen experimentellen Aufwand und erheblichen Kosten verbunden. Computergestützte Vorhersageverfahren, wie maschinelle Lernverfahren, können diese Eigenschaften vorhersagen und stellen somit eine effiziente Alternative zum experimentellen Ansatz dar. Allerdings werden diese Verfahren aufgrund ihrer oft unklaren und wechselhaften Genauigkeit
more » ... zögerlich eingesetzt. Ziel dieser Arbeit ist es, die Akzeptanz und die Anwendungsmöglichkeiten von maschinellen Lernverfahren in der chemischen Forschung zu erweitern. Im ersten Teil der Arbeit steht die Verbesserung von kernbasierten maschinellen Lenverfahren in Bezug auf die Anwendungen in der Wirkstoffforschung im Vordergrund. Im ersten Kapitel wird ein neuer Algorithmus, StructRank, für das virtuelle Screening entwickelt. Dieser Algorithmus ist ideal an die Anforderungen des virtuellen Screenings angepasst, da er eine Rangordnung von Molekülen vorhersagt und Moleküle mit einer hohen Bindungsaffinität besonders stark berücksichtigt. Das zweite Kapitel beschäftigt sich mit dem Vergleich und der Kombination von Lernverfahren zu einem leistungsstärkeren Ensemble. Anhand von Daten zur Inhibition des hERG Rezeptors werden die Grenzen und Möglichkeiten verschiedener Verfahren untersucht. Eine lokale Bias-Korrektur kristallisiert sich hierbei als ein schnelles und effizientes Verfahren zur Einbindung neuer Messergebnisse ohne erneute Anpassung des Modells heraus. Im Rahmen dieser Studie wird auch ein neues Kreuz-Validierungs-Schema untersucht, welches das Extrapolationsvermögen von Prädiktionsmodellen stärker berücksichtigt. Das Extrapolationsvermögen ist in der chemischen Forschung von besonderer Bedeutung, da die neu zu untersuchenden Verbindungen sich oftmals deutlich von allen zuvor untersuchten Molekülen unterscheiden. Im zweiten Teil der Arbeit werden neue Ansätze zur Bewertung und Interpretation computergestützter Vorh [...]
doi:10.14279/depositonce-3309 fatcat:yp7idqaprvgunacaaamuzdvw3a