Das Open-Source-Projekt OpenMed hat ein vollständiges System zur Proteinentwicklung vorgestellt, das Strukturvorhersage, Sequenzdesign und DNA-Codonoptimierung kombiniert. Das Kernmodell CodonRoBERTa wurde mit Daten aus 25 Tierarten trainiert und benötigte nur 55 GPU-Stunden Rechenzeit. Die Gesamtkosten für das Training beliefen sich auf etwa 165 Dollar – ein deutlicher Fortschritt für die Demokratisierung von Protein-Engineering.
📢 Pressemitteilung
Open-Source-Pipeline: Proteindesign für 165 Dollar
9. April 2026·Quelle: Hugging Face Blog
Unsere Einordnung
Dies ist ein wichtiger Durchbruch für die Demokratisierung von Biotech: Komplexe Protein-Engineering-Pipelines, die bisher Großkonzernen vorbehalten waren, werden für weniger als 200 Dollar trainierbar. OpenMed zeigt, dass raffiniertere Spezialisierung (Multi-Species-Konditionierung) ohne prohibitive Kosten erreichbar ist – ein Muster, das sich auch in anderen KI-Bereichen abzeichnet.
Schlüsselfakten
- CodonRoBERTa-large-v2 erreichte eine Perplexität von 4,10 und übertraf damit konkurrierende Architekturen deutlich
- Das System wurde auf 25 verschiedene Tierarten trainiert und ermöglicht artspezifische Optimierung
- Vier produktionsreife Modelle entstanden in nur 55 GPU-Stunden für circa 165 Dollar
- Die Pipeline deckt alle drei kritischen Schritte ab: 3D-Strukturvorhersage, Aminosäure-Design und Codon-Optimierung
- Erstmals bietet ein Open-Source-Projekt ein species-konditioniertes System für mRNA-Optimierung