Protein-ligand binding affinity prediction using combined molecular dynamics simulations and deep learning algorithms - Thèses de l'Université d'Orléans Accéder directement au contenu
Thèse Année : 2023

Protein-ligand binding affinity prediction using combined molecular dynamics simulations and deep learning algorithms

Prédiction de l'affinité de liaison des complexes protéine-ligand en combinant des simulations de dynamique moléculaire avec des algorithmes d'apprentissage profond

Pierre-Yves Libouban
  • Fonction : Auteur
  • PersonId : 1366333
  • IdRef : 253888301

Résumé

Interactions of small molecules with their target proteins are essential to pharmaceutical research. In vitro experiments were developed to measure the binding affinity of protein-ligand complexes, but they remain long and expensive. Nowadays deep neural networks (NN) use the three-dimensional structures of complexes to predict their binding affinity. However, limitations persist despite the implementation of new NN, primarily due to scarce structural data, necessitating extensive experimental work. This project aims to improve our ability to predict the affinity of protein-ligand complexes by combining deep learning and molecular dynamics (MD) simulations. Data augmentation can be achieved by extracting additional structures from MD simulations. Furthermore, MD simulations provide temporal insights into protein-ligand interactions that can be used to improve models. We created a dataset of 63,000 simulations, obtained from 6,300 complexes. To create efficient statistical models by learning from these MD simulations, we developed NNs able to analyse both spatial and temporal information, like the convolutional LSTM. These NNs combine a convolutional NN able to extract the spatial information from the three-dimensional structures at each time step, while the LSTM keeps track of the evolution of this information over the whole simulation. Using molecular dynamics data augmentation, we are obtaining promising results.
Les interactions des petites molécules avec leurs protéines cibles sont essentielles à la recherche pharmaceutique. L'affinité de liaison des complexes protéine-ligand peut être mesurée par des expériences in-vitro, mais ces tests sont couteux en argent et en temps. Aujourd'hui, les réseaux de neurones profonds utilisant les structures en trois dimensions des complexes sont capables de prédire cette affinité de liaison. Cependant, des limitations persistent malgré l'implémentation de nouveaux réseaux de neurones. Ceci est principalement dû au manque de données structurales, qui nécessitent un travail expérimental conséquent pour être déterminées. Ce projet vise à améliorer notre capacité à prédire l'affinité des complexes protéine-ligand en combinant des approches d'apprentissage profond avec des simulations de dynamique moléculaire. Ainsi, il est possible d'augmenter la quantité de données utilisées lors de l'apprentissage des modèles statistiques, en extrayant des structures supplémentaires des simulations de dynamique moléculaire. En outre, celles-ci fournissent des informations temporelles sur les interactions protéine-ligand qui peuvent être utilisées pour améliorer les modèles. Nous avons créé un ensemble de données de 63 000 simulations, obtenues à partir de 6 300 complexes. Puis nous avons développé des réseaux de neurones, tel que le LSTM à convolutions, capables d'analyser à la fois les informations spatiales et temporelles issues des simulations. Ces réseaux combinent un réseau de neurones à convolutions capable d'extraire l'information spatiale des structures en trois dimensions à chaque pas de temps, tandis que le LSTM suit l'évolution de cette information sur l'ensemble de la simulation. En utilisant les simulations de dynamique moléculaire en tant qu'augmentation de données, nos modèles obtiennent des résultats prometteurs.
Fichier principal
Vignette du fichier
2023ORLE1044_va.pdf (11.43 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-04516350 , version 1 (22-03-2024)

Identifiants

  • HAL Id : tel-04516350 , version 1

Citer

Pierre-Yves Libouban. Protein-ligand binding affinity prediction using combined molecular dynamics simulations and deep learning algorithms. Other. Université d'Orléans, 2023. English. ⟨NNT : 2023ORLE1044⟩. ⟨tel-04516350⟩
10 Consultations
8 Téléchargements

Partager

Gmail Facebook X LinkedIn More