Modellierung, Strukturverbesserung und sequentielle Zuordnung als vollautomatische Module für die automatisierte Proteinstrukturbestimmung im Softwareprojekt AUREMOL

Konrad Brunner
2007
In der vorliegenden Arbeit wurde die Entwicklung des Softwareprojekts AUREMOL fortgesetzt. Das Ziel von AUREMOL ist die Bereitstellung von Modulen, die eine automatische Strukturbestimmung von Proteinen in Lösung mit möglichst wenigen experimentellen Daten ermöglichen. Grundsätzliche Neuerungen sind die Einführung einer einheitlichen IUPAC-konformen Nomenklatur der Atomnamen der einzelnen Aminosäuren in den verschiedenen Modulen von AUREMOL und die Bereitstellung entsprechender Konverter, um
more » ... mddaten leicht und schnell nutzen zu können. Es wurden drei spezielle Module entwickelt, mit deren Hilfe die Proteinbestimmung mittels AUREMOL weiter automatisiert wurde. Der Top-Down-Ansatz von AUREMOL verlangt u. a. eine Startstruktur. Im Extremfall kann hier ein ausgestreckter Strang eingesetzt werden. Um jedoch mehr Strukturinformationen gleich von Anfang an nutzbar zu machen und so die Strukturbestimmung zu beschleunigen, wurde als erstes Modul eine Homologie-Modellierung (PERMOL) in AUREMOL implementiert und weiterentwickelt. Da bereits ab einer Sequenzidentität von mehr als 20 % eine Homologie bzgl. Funktion und somit Struktur vorliegen kann, wird die Strukturinformation derartiger, bereits gelöster, Proteine dazu genutzt, Atomabstände, Diederwinkel und Wasserstoffbrücken aus den PDB-Dateien zu berechnen. Diese Daten werden dann als Beschränkungen (Restraints) in Moleküldynamik-Programmen verwendet. Die Berechnung von Fehlergrenzen folgt unmittelbar aus den mit Hilfe der jeweiligen Standardabweichung berechneten Konfidenzintervallen. Ebenso können auf diese Weise aus einzelnen Röntgenstrukturen mit Hilfe der für jedes Atom gegebenen B-Faktoren und der Auflösung Strukturbündel gewonnen werden. Die so gewonnenen homologen Strukturen können sehr vielfältig in den verschiedenen Modulen von AUREMOL als Startstruktur eingesetzt werden. Das zweite Modul ISIC dient zur Strukturverbesserung von Proteinen unter Verwendung von Informationen aus anderen Datenquellen. Während der letzten Jahre ist die in der Proteindatenbank hin [...]
doi:10.5283/epub.10518 fatcat:rxawxccepvelhdhv47zhtzgfwi