ISSN: 1745-7580
Johannes Sollner, Rainer Grohmann, Ronald Rapberger, Paul Perco, Arno Lukas und Bernd Mayer
Hintergrund: Die Anwendung von peptidbasierten Diagnostika und Therapeutika, die Teile von Proteinantigenen nachahmen, erfährt erneutes Interesse. Bisher basieren Auswahl und Designprinzipien für solche Peptide in der Regel auf der Vorhersage von T-Zell-Epitopen, verfügbaren experimentellen und modellierten 3D-Strukturen, Vorhersagen von B-Zell-Epitopen wie Hydrophilie-Diagrammen oder Erfahrungen. Wenn keine Struktur verfügbar ist, ist die rationale Auswahl von Peptiden für die Produktion funktionsverändernder oder neutralisierender Antikörper praktisch unmöglich. Insbesondere wenn viele alternative Antigene verfügbar sind, ist die Reduzierung der erforderlichen synthetisierten Peptide, bis ein erfolgreicher Kandidat gefunden ist, von zentralem technischen Interesse. Wir haben die Integration der B-Zell-Epitopvorhersage mit der Variabilität von Antigenen und der Erhaltung von Mustern für die Vorhersage posttranslationaler Modifikationen (PTM) untersucht, um den Stand der Technik auf diesem Gebiet zu verbessern. Insbesondere die Anwendung von Methoden des maschinellen Lernens zeigt vielversprechende Ergebnisse. Ergebnisse: Wir stellen fest, dass Proteinbereiche, die zur Produktion funktionsverändernder Antikörper führen, häufig durch einen deutlichen Anstieg der kumulativen Summe dreier präsentierter Parameter gekennzeichnet sind. Darüber hinaus führt das Konzept, die Antigenität zu maximieren, die Variabilität zu minimieren und die Wahrscheinlichkeit posttranslationaler Modifikationen zur Identifizierung relevanter Stellen zu minimieren, zu biologisch interessanten Beobachtungen. In erster Linie funktioniert der Ansatz für etwa 50 % der Antigene gut mit individuellen Werten für den Bereich unter der ROC-Kurve (AROC) von mindestens 0,65. Andererseits weist ein erheblicher Anteil entsprechend niedrige AROC-Werte von < = 0,35 auf, was auf eine insgesamt nicht-Gaußsche Verteilung hindeutet. Während etwa ein Drittel von 57 Antigenen mit unserem Ansatz scheinbar nicht greifbar sind, deuten unsere Ergebnisse auf die Existenz von mindestens zwei unterschiedlichen Klassen bioinformatisch nachweisbarer Epitope hin, die separat vorhergesagt werden sollten. Als Nebeneffekt unserer Studie präsentieren wir einen von Hand kuratierten Datensatz zur Validierung der Schutzklassifizierung. Basierend auf diesem Datensatz verbessern maschinelle Lernmethoden die Vorhersagekraft weiter auf eine Klassentrennung in einem ausgeglichenen Datensatz von bis zu 83 %. Schlussfolgerung: Wir präsentieren eine rechnergestützte Methode zur automatischen Auswahl und Einstufung von Peptiden zur Stimulation potenziell schützender oder anderweitig funktionsverändernder Antikörper. Es lässt sich zeigen, dass die Integration von Variabilität, Erhaltung des posttranslationalen Modifikationsmusters und B-Zell-Antigenität die rationale Auswahl gegenüber dem Zufallsprinzip verbessert. Was wahrscheinlich noch wichtiger ist: Wir haben herausgefunden, dass der Ansatz für etwa 50 % der Antigene wesentlich besser funktioniert als für den gesamten Datensatz von 57 Proteinen. Im Wesentlichen als Nebeneffekt optimiert unsere Methode die vermutlich am besten anwendbaren Peptide, da diese wahrscheinlich unverändert und so unveränderlich wie möglich sind, was den Anforderungen bei der Diagnose und Behandlung von Pathogeninfektionen entspricht.Darüber hinaus zeigen wir das Potenzial für weitere Verbesserungen durch die Anwendung von Methoden des maschinellen Lernens, insbesondere Random Forests.