クライアントの要件
クライアントは、化学・生物学・薬理学データを網羅した、高品質で調和され、構造化されたスモール分子のデータセットを必要としていました。
最終的な目的は、標準化されたスモール分子データセットを自社の AI/ML プラットフォームに統合し、仮想ヒットの特定に向けたアルゴリズム学習に活用することでした。
私たちのアプローチ
Excelra の Global Online Structure Activity Relationship Database である GOSTAR™ は、数百万の化合物について、化学構造と生物学的・薬理学的・治療学的情報を結び付け、360 度の総合的な視点を提供します。
さまざまな情報源から収集される異質で非構造化のデータは、GOSTAR™ 内で構造化されたリレーショナルデータベース形式へと変換されます。
GOSTAR™ のすべてのコンテンツは手作業で収集され、3 段階の品質管理プロセスを経ています。
構造活性相関(SAR)、物理化学特性、ADMET パラメータを網羅した、正規化・構造化データセットは、クライアントの内部プラットフォームに統合され、AI/ML アルゴリズムによるモデルトレーニングや活性・特性予測に利用され、ヒット化合物の特定およびリード最適化を支援しました。
GOSTAR® に加えて、Cheminformatics および Data Curation Services における Excelra の専門性が、複雑なデータセットのシームレスな調和を実現し、AI 主導の創薬ワークフローを強化しました。
同様の取り組みについては、化合物データセットを対象とした Activity Landscape Analysis に関する当社の事例をご覧ください。ここでは、構造化されたインサイトが化合物の優先順位付けを加速させました。