La valeur logP d’un composé, qui est le logarithme de son coefficient de partage entre le n-octanol et l’eau log(coctanol/eau),est une mesure bien établie de l’hydrophilie du composé. De faibles hydrophilicités et donc des valeurs logP élevées entraînent une absorption ou une perméation médiocre. Il a été démontré que pour que les composés aient une probabilité raisonnable d’être bien absorbés, leur valeur logP ne doit pas être supérieure à 5,0. La distribution des valeurs logP calculées de plus de 3000 médicaments sur le marché souligne ce fait (voir diagramme)
Notre méthode interne de calcul du logP est mise en œuvre comme un système d’incrémentation ajoutant les contributions de chaque atome en fonction de son type d’atome. Au total, le moteur de prédiction cLogP distingue 368 types d’atomes qui sont composés de diverses propriétés de l’atome lui-même (numéro atomique et appartenance à un cycle) et de ses voisins directs (type de liaison, état d’aromaticité et numéro atomique codé). Plus de 5000 composés avec des valeurs de logP déterminées expérimentalement ont été utilisés comme ensemble d’entraînement pour optimiser les 369 valeurs de contribution associées aux types d’atomes. Le graphique de corrélation (voir le diagramme) montre les valeurs logP calculées par rapport aux valeurs logP déterminées expérimentalement d’un ensemble de test indépendant de plus de 5000 composés différents de l’ensemble d’apprentissage.