Hi, I recently stumbled over HELM as a way to describe bio-macromolecules, and was very pleased to see that rdkit offers some kind of support with the MolToHELM und MolFromHELM functions, at least for proteins.
However, playing around with these functions, I noticed a few limitations/bugs: 1) the Cterm cap of peptides is not recognized, e.g. when I have a capped Alanine (the famous alanine dipeptide), MolToHELM only recognizes the N-Term cap, see the following code snippet from rdkit import Chem rdmol = Chem.MolFromSmiles('CNC(=O)[C@H](C)NC(C)=O') helm = Chem.MolToHELM(rdmol) print(helm) >>PEPTIDE1{[ac].A}$$$$ So the acetyl is there, the N-Me-amine is missing. 2) when I import an acetylated Lysine, this acetyl is not recognized, but instead the HELM string shows a regular Lysine as K. So my questions: a) is anybody working on that part of rdkit right now so that there is a chance to see bugfixes as well as more functionality in the future? e.g. plotting capabilities, monomer registration, interface to the HELM toolkit? b) can you point me where the definitions of the monomers are that rdkit recognizes so far? So obviously it knows about the natural aminoacids (D and L), acetyl group, but what else? c) any other suggestion for a python module that can handle modified or non-natural amino acids, cyclic/branched peptides, or peptides with small-molecule attached? Best, Th. Mit freundlichen Grüßen / Kind regards, Dr. Thomas Fox Boehringer Ingelheim Pharma GmbH & Co. KG Medicinal Chemistry Tel.: +49 (7351) 54-7585 Fax: +49 (7351) 83-7585 mailto:thomas....@boehringer-ingelheim.com Pflichtangaben finden Sie unter: https://www.boehringer-ingelheim.de/unser-unternehmen/gesellschaften-in-deutschland Mandatory information can be found at: https://www.boehringer-ingelheim.de/unser-unternehmen/gesellschaften-in-deutschland Datenschutzhinweis: Für bereits bestehende und neue Geschäftsbeziehungen nutzen wir personenbezogene Daten und werden diese für die Dauer unserer Geschäftsbeziehung aufbewahren. Während unserer Geschäftsbeziehung erheben wir unter Umständen Kontaktdaten, Daten zur Berufsqualifikation (Publikationen etc.). Einige Daten werden aus öffentlichen Quellen und Internetseiten bezogen. Rechtsgrundlage: Artikel 6 (1) b) und f) EU DS-GVO. Klicken Sie hier<https://www.boehringer-ingelheim.com/locations/europe>, um weitere Informationen auf der lokalen Unternehmensinternetseite des betreffenden Landes über Datenschutz bei Boehringer Ingelheim und zu Ihren Rechten zu erhalten. Bitte beachten Sie, dass zusätzliche Datenschutzhinweise gelten können und alle diese Datenschutzhinweise von Zeit zu Zeit aktualisiert werden können. Privacy Notice: We use personal data for current and future business collaborations, and will retain such data for the duration of our business relationship. During the course of our business relationship we may collect contact data, data about professional qualifications (publications etc.). Some of the data is sourced from public sources and websites. Legal basis: Article 6 (1) b) and f) EU GDPR. Click here<https://www.boehringer-ingelheim.com/locations/europe> for more information on the local company website of the respective country about data protection at Boehringer Ingelheim and your rights. Please note that additional privacy notices may apply and that all these privacy notices might be updated from time to time. Diese E-Mail ist vertraulich zu behandeln. Sie kann besonderem rechtlichem Schutz unterliegen. Wenn Sie nicht der richtige Adressat sind, senden Sie bitte diese E-Mail an den Absender zurück, löschen die eingegangene E-Mail und geben den Inhalt der E-Mail nicht weiter. Jegliche unbefugte Bearbeitung, Nutzung, Vervielfältigung oder Verbreitung ist verboten. / This e-mail is confidential and may also be legally privileged. If you are not the intended recipient please reply to sender, delete the e-mail and do not disclose its contents to any person. Any unauthorized review, use, disclosure, copying or distribution is strictly prohibited.
_______________________________________________ Rdkit-discuss mailing list Rdkit-discuss@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/rdkit-discuss