然而,精准预测pKa始终是计算化学领域的一大挑战,传统的经验公式(如 QSPR 模型)面对复杂、多氮杂环或高度官能团化的先导化合物时,误差往往超过 1-2 个数量级。量子化学方法(如DFT)则耗时数小时。如果 pKa 预测不准,将导致一系列连锁反应:溶解度误判、ADMET瓶颈、分子对接失效......
一、 精度验证:超越 Marvin等行业标杆,盲测平均绝对误差(MAE )仅 0.55|
一图看懂 InDraw pKa 与 Marvin 等方法在多个数据集上的平均绝对误差(MAE)对比 |
||||
|
测试数据集 |
测试集规模 |
InDraw 7.2 MAE |
行业标杆A (MAE) |
物理计算(DFT) 误差 |
|
Novartis Internal Set |
经典药物分子 |
0.81 |
0.99 |
~0.5-0.7 |
|
SAMPL6 Blind Challenge |
药物小分子 |
0.55 |
0.78 |
0.5-1.0 |
|
SAMPL7 Blind Challenge |
复杂杂环分子 |
0.57 |
1.12 |
1.0+ |

|
一图看懂 InDraw pKa 与 Marvin 等方法在多个数据集上的平均绝对误差(MAE)对比 |
||||
|
测试数据集 |
测试集规模 |
InDraw 7.2 MAE |
行业标杆A (MAE) |
物理计算(DFT) 误差 |
|
Novartis Internal Set |
经典药物分子 |
0.81 |
0.99 |
~0.5-0.7 |
|
SAMPL6 Blind Challenge |
药物小分子 |
0.55 |
0.78 |
0.5-1.0 |
|
SAMPL7 Blind Challenge |
复杂杂环分子 |
0.57 |
1.12 |
1.0+ |
微观粒子分布曲线:一键生成分子在 pH 0-14 范围内的电荷状态分布图。这对于制药工艺设计、制剂处方前研究(Pre-formulation)具有至关重要的指导价值。
五、从“盲猜”到“秒答”:改变化学家的工具箱