Introduction à la chémoinformatique : les fichiers pour les petites molécules 3D

, par Stéphane

Format de fichier 3D des petites molécules et source

Les ligands ou constituants biologiques sont disponibles dans différentes bases de données, trois formats sont le plus souvent utilisés, en fonction de l’utilisation prévue du ligand :

  1. le format SDF, attention ce format permet de représenter les molécules en 2D, il faut être vigilant à télécharger la molécule au format « 3D ».
  2. le format MOL2
  3. le format PDB

Il existe de nombreux autres formats pour représenter les petites molécules, ils sont décrits sur la page wikipedia en détail (https://en.wikipedia.org/wiki/Chemical_file_format), le détail de l’organisation de ces fichiers et les principes sous-jascents sont présentés dans uen page dédiée (https://en.wikipedia.org/wiki/Chemical_table_file).

Il est possible de décrire sur une ligne (1D) une formule chimique en suivant les descriptions du format SMILES, présentés sur le site de l’entreprise DayLight (https://daylight.com/) ou encore sur wikipedia dans la page décrivant SMILES (https://en.wikipedia.org/wiki/Simplified_molecular-input_line-entry_system).

Bases de données comprenant les molécules au format 3D

Quand il s’agit de petites molécules (qui seront des ligands des protéines), il est possible d’obtenir directement leurs coordonnées au format SDF 3D en allant sur :