ISSN: 1745-7580
Mieszko Lis, Taeho Kim, Jamica J. Sarmiento, Daisuke Kuroda, Huy Viet Dinh, Akira R. Kinjo, Kar-lou Amada, Srinivas Devadas, Haruki Nakamura und Daron M. Standley
Hintergrund: Da die Abdeckung experimentell ermittelter Proteinstrukturen zunimmt, wird erwartet, dass fragmentbasierte Strukturmodellierungsansätze bei der Strukturmodellierung eine immer wichtigere Rolle spielen werden. Hier stellen wir eine Strukturmodellierungsmethode vor, mit der eine anfängliche Strukturvorlage durch das Hinzufügen von Strukturfragmenten erweitert werden kann, um einer ausgerichteten Abfragesequenz besser zu entsprechen. Es wurde eine Datenbank mit Proteinfragmenten erstellt, die nach ihren internen Koordinaten indiziert sind, und eine neuartige Methode für deren Abruf implementiert. Nach der Fragmentauswahl und -zusammenstellung werden Seitenketten ersetzt und das Allatommodell durch eingeschränkte Energieminimierung verfeinert. Wir haben die vorgeschlagene Methode im Programm Span-ner implementiert und sie anhand eines zuvor veröffentlichten Satzes von 367 Immunglobulin-(Ig)-Schleifen, 206 historischen Abfrage-Vorlagen-Paaren und Ausrichtungen aus dem Experiment „Critical Assessment of Protein Structure Prediction“ (CASP) und 217 Strukturausrichtungen zwischen entfernt homologen Abfrage-Vorlagen-Paaren verglichen. Die auf Einschränkungen basierende Modellierungssoftware MODELLER und zuvor gemeldete Ergebnisse für RosettaAntibody wurden als Referenzen verwendet. Ergebnisse: Der Fehler in den modellierten Strukturen wurde anhand der mittleren quadratischen Abweichung (RMSD) von der nativen Struktur als Funktion der Sequenzidentität zwischen Abfrage und Vorlage ermittelt. Für den Ig-Benchmark-Satz, für den ein einzelnes Fragment zur Modellierung jeder Schleife verwendet wurde, lag der durchschnittliche RMSD für Spanner (3 +/- 1,5 Å) in der Mitte zwischen dem von MODELLER (4 +/- 2 Å) und RosettaAntibody (2 +/- 1 Å). Für die CASP- und Strukturalignment-Benchmarks, bei denen die Lücken einen kleinen Teil der modellierten Reste darstellen, war der Unterschied zwischen Spanner und MODELLER viel kleiner als die Standardabweichungen beider Programme. Der Spanner-Webserver und der Quellcode sind unter http://sysimm.ifrec.osaka-u.ac.jp/Spanner/ verfügbar. Schlussfolgerungen: Für typische Homologiemodellierung ist Spanner im Durchschnitt mindestens so gut wie der vorlagenfreie, einschränkungsgesteuerte Ansatz von MODELLER. Die Ergebnisse des Ig-Modells weisen darauf hin, dass die Modellgenauigkeit deutlich verbessert wird, wenn Lückenbereiche einen signifikanten Anteil der Ausrichtung ausmachen, indem Spanner Fragmentbibliotheken zusammen mit lokalen Sequenz- und Sekundärstrukturinformationen effizient nutzt, ohne den Rechenaufwand drastisch zu erhöhen.