ある中規模のバイオ医薬品企業で、長年にわたりChemaxonを利用しているクライアントが、最近私たちにこう語ってくれました。「プロジェクトの進捗管理や情報共有に関して、もっと良いソリューションが本当に必要です。というのも、私たちは今でも定例ミーティングや長いメールのやり取りに大きく依存しており、データはあちこちのスライドや整理されていないスプレッドシート、メールの中に散在しているのです。」
低分子創薬の世界では、DMTA(設計・合成・試験・解析)サイクルの効率的な最適化が重要な鍵となります。
研究者たちは長年にわたり、ワークフローを支えるために静的なファイルシステムに依存してきました。たとえば、研究成果の記録、共有、発表にはMicrosoft PowerPointが広く使用されており、化学構造やそれに対応する生物学的アッセイ結果の保存にはExcelのスプレッドシートが利用されてきました。
強力なソフトウェアではあるものの、これらは本来、医薬品研究における複雑かつ動的なデータセットを管理するために設計されたものではありません。リアルタイムデータの取り扱いや、複雑な化学的認識の提供、効果的なチーム間のコラボレーションの支援には限界があります。
文脈の欠如とインタラクティブなライブセッションの非対応
創薬プロセスにおいて最も重要な問いのひとつは、「次に合成すべき化合物はどれか?」ということです。化学空間は非常に広大で、しかも拡大し続けているため、時間とリソースを効率的に使って、優先すべき化合物のセットを導き出す必要があります。Bellmannらによると、EnamineのREAL Space、WuXiのGalaXi Space、OtavaのCHEMriya Spaceといった代表的な化学空間同士の重複部分は、わずか約76,000化合物にすぎません。このような広大な化学空間の中を効率的に探索するのは、ますます困難になっています。設計プロセスをどの方向に進めるかを決定するには、「なぜその化合物群を選んだのか」を明確に説明できなければなりません。化合物を設計した当初はその理由が明らかであっても、新たなデータが次々と蓄積される中で、その理由を追跡することが徐々に難しくなっていきます。したがって、アイデアの優先順位付けと追跡を支援する、堅牢な仮説駆動型の設計ツールが不可欠です。急速な技術革新によってデータ駆動型のアプローチが創薬の最前線に登場しているとはいえ、仮説駆動型のアプローチは今後も重要であり、この二つのバランスをうまく取ることが、複雑な研究課題に成功裏に取り組むための鍵となるのです。
目標は、設計・合成・生物学的フィードバックのサイクルを短期間で繰り返すことにより、仮説を新たなデータごとに反復的に検証または修正していくことにあります。
静的なファイルシステムでは、データに対する包括的な文脈を提供することが難しく、その意味を理解したり、有意義な結論を導き出したりするのが困難になります。チームミーティングでは長年にわたりPowerPointプレゼンテーションが活用されてきましたが、瞬間的なメッセージを伝えることはできても、ライブセッション中のインタラクティブな対応を提供することはできません。たとえば、新しいIC50の結果をチームメンバーに発表している最中に、こんな質問が出たとします。「この結果は、数か月前に芳香環をブロミドではなくメチル基に置換したときのデータと比べてどうだったっけ?」あるいは、「メチルアナログから合成した化合物バッチを優先した理由って、もう一度なんだったっけ?」
もしそれらのデータが予備スライドに正確に用意されていなければ、とっさに答えるのは難しいかもしれません。こうしたライブデータを日常的に扱う場合、静的なファイルシステムではそのニーズに応えきれないのです。
データの分断化
この問題は、創薬という複雑で協働的なプロセスに起因しています。そこには多くの関係者、研究チーム、アプリケーションが関与します。最近開催されたLab of the Futureカンファレンスで、ある大手製薬企業の代表者が「医薬化学者は平均して1日に20種類のアプリケーションに触れており、そのほとんどで新たなデータが生成されている」と述べていました。
統合性や標準化が欠如していることにより、データは複数の情報源、スライド、ファイル、メールの中に非統一の形で散在し、しばしば互換性のないフォーマットで保存されます。さらに、研究機関やCRO(契約研究機関)はそれぞれ独自のデータリポジトリを保持していることが多く、それが結果として孤立したデータのサイロ化を招いています。
これらのデータサイロは、効率的なデータ共有とコラボレーションを妨げ、研究の進行を遅らせる原因となります。また、従来の静的なデータ管理システムは、他のツールとの密接な統合が難しく、そのことがさらにデータの断片化や品質の低下を招き、意思決定プロセスを阻害します。これらのシステムからのデータ移行には多大なコストと時間がかかります。
ライフサイエンス業界では現在、データ管理におけるFAIR原則(Findable: 発見可能、Accessible: 利用可能、Interoperable: 相互運用可能、Reusable: 再利用可能)についての議論が活発に行われています。人工知能(AI)や機械学習の力を活用して複雑な研究課題を解決するためには、学習に用いる基盤データが高品質かつ一貫性のあるものでなければなりません。そのため、FAIR化に向けた取り組みは多くの企業にとって優先事項となりつつあります。しかし、静的なシステムでは、FAIRデータ管理の主要原則を満たすことが困難であり、これらの取り組みを支えることができません。
インタラクティブ性とコラボレーションの妨げ
人間は、視覚的に表示された情報を最も効果的に処理できると言われています。しかし、PowerPointのプレゼンテーションは静的であり、データの探索や操作においてインタラクティブ性は限定的です。静的ファイルシステムの最大の弱点のひとつは、コラボレーションに関する機能の脆弱さにあります。創薬には、化学、生物学、薬理学、情報学といった多様な分野の専門家による連携が不可欠ですが、それぞれが異なる専門ツールやデータベースを使っているため、効果的なデータ共有は容易ではありません。たとえば、次のような問いに答えたいとしましょう。「ハロゲン誘導体のうち、私たちが合成することに決めた化合物の中で、すでに合成依頼先にアサインされたものはどれか?」これに従来の方法で答えようとすると、まずはスプレッドシートを開き、どのCROに合成を依頼したかを示す列を探さなければなりません。さらに、それが実際にCROに伝えられ、承認されたかどうかを確認するために、過去のメールのやり取りを探す必要があります。そして、選定された化合物の合成が完了した際には、CROが自社のELNから出力したPDFレポートを添えて、メールで報告が行われることになります。理想的には、そのレポートの内容は社内データベースに転記されるべきですが、PDFからの化学情報の抽出は非常に厄介な作業であり、とりわけ化学構造の画像認識は信頼性に乏しく、手作業での補正が必要になることも少なくありません。さらに、チーム内や他部門間でスプレッドシートやスライド資料を共有する場合、冗長なファイルが複数作成されることで、いわゆる「バージョン管理の混乱」が発生しやすくなります。最新のファイルがどれか分からなくなり、業務の効率が大きく損なわれるのです。共有スプレッドシートを作成することは技術的には可能ですが、その運用は容易ではなく、バージョン管理の問題を完全に解決するものではありません。その結果、管理者はファイルのアクセス権を管理したり、内容の正確性を確認するためにスプレッドシートを何度もチェックしたりと、余分な時間と手間を費やすことになります。
化学認識の欠如による非効率的なワークフロー
化学者が使用するソフトウェアには、化学的な認識力が必要不可欠です。化合物構造間、あるいは化合物構造とプロジェクト内のメタデータとの関連付け、複数プロジェクトを横断した厳密または類似性検索、さらには複数の場所で同時に化学構造を修正するなどの機能は、単なる「あると便利」なものではなく、業務の効率化、不整合や転記ミス、重複の生成、無限に続くコピー&ペーストのループを防ぐために極めて重要です。しかし残念ながら、静的ファイルシステムはデフォルトでは化学データを扱うことができず、ExcelやPowerPoint、さらにはOutlookに化学的な認識力を持たせるためには、追加の拡張機能が必要になります。そしてそれらの拡張は、生成されるデータが少なく、シンプルで限定的な研究ワークフローにおいてのみ、ある程度効果を発揮するものです。静的ファイルシステムにはスケーラビリティがほとんどないため、大量のデータ処理には対応できず、他のアプリケーションやプラグインとの統合エンドポイントを提供することもできません。これは現代の研究ワークフローにおいて、大きな制約となっています。たとえば、新しい化合物を設計中に「ピリジン環をテトラヒドロピランに置き換えたらCNS MPOスコアにどう影響するか」を、複数のアプリを行き来せずにリアルタイムで確認できたら理想的です。そして、その設計を進める前に、社内の誰かがすでにピリジンからテトラヒドロピランへの置換を検討したことがあるかどうかも確認したいところです。さらに、設計した化合物が自国およびCROが所在する国の規制対象になっていないかもチェックして、法規制への適合性を確保したいはずです。こうした一連の確認を一つのインターフェース内で完結させるには、豊富なAPIやプラグインインターフェースが不可欠ですが、静的ファイルシステムでこれを実現するのは非常に困難、あるいは不可能です。
限定的なセキュリティとコンプライアンス
製薬業界は、データ漏洩による損害額が最も高い業界のひとつであり、IBMの2023年の報告によると、同業界におけるデータ侵害の平均被害額は4.82百万ドルに達しています。RiskXchangeがまとめた2023年の「製薬業界サイバーセキュリティレポート」では、重大なセキュリティ問題として以下の2点が挙げられています。
a) アプリケーションのセキュリティおよび構成管理の不備
b) プラットフォームやアプリケーション全体における暗号化の弱さまたは欠如
このうち、アプリケーションセキュリティの問題が全体の約50%、暗号化の不備が約30%を占めており、重大なリスク要因となっています。
静的ファイルシステムには、サイバー攻撃や情報漏洩に対抗するための堅牢なセキュリティ機能が欠如していることが多く、アクセス制限の設定や多要素認証・多層認証といった高度なセキュリティ対策も限定的です。パスワード保護だけでは不十分であり、不正アクセスのリスクが常につきまといます。また、誰がいつどのようにファイルにアクセスし、変更を加えたかを追跡する監査記録(オーディットトレイル)の作成は、手動で行われることが多く、ミスが生じやすい点も問題です。信頼できるアプリケーションは、24時間365日安定稼働し、定期的なアップグレードやセキュリティパッチが適用され、スケーラビリティと高いパフォーマンスを兼ね備えている必要があります。そして何よりも、堅牢で適切なアクセス制御レベルを備えたセキュリティ体制を維持していることが重要です。
創薬活動はもはや単一の拠点にとどまっておらず、多くの企業が業務の一部を世界中の共同研究者にアウトソースしています。
しかし、外部の共同研究者と協力することには、プロジェクト管理からドキュメント管理、技術面に至るまで、社内システムと外部システムの同期という課題が伴います。スプレッドシートやメールを使って機密データを共有することは、適切に管理されていない場合、セキュリティリスクにつながる可能性があります。重要なのは、不要な情報だけを共有し、それ以外のプロジェクト関連データには制限付きアクセスを設けて非公開に保つことです。たとえば、CROには割り当てた化合物の情報だけを見せ、科学的な背景やプロジェクト全体の詳細にはアクセスできないようにする、といった対応が求められます。
動的ファイルシステム(Design Hub) |
静的ファイルシステム |
複雑な条件を組み合わせた検索が簡単に可能 |
検索機能が制限される、もしくは存在しない |
リアルタイムでの共同作業と対話が可能、メールのやり取りが減少 |
リアルタイムでの共同作業は不可能 |
一貫した階層構造でデータを整理 |
データが無秩序、またはランダムに存在 |
化合物設計プロセスに仮説が自動的にリンクされる |
設計プロセスの文脈が失われがち |
カンバン方式によるプロジェクトの全体像の把握が容易 |
マネージャーがプロジェクト全体を把握するのが困難 |
監査対応が容易で、必要な情報を数秒で追跡可能 |
監査が困難で、ミスの追跡もほぼ不可能 |
設計プロセスに直結した外部ツールとの連携が可能 |
外部ツールとの連携はほとんど不可能 |
特化型のデジタル環境における一元的なデータ管理 |
スプレッドシートやPPTにデータが分散し、断片化が発生 |
アクセス権を設定できるため高いセキュリティを確保 |
ExcelやGoogle Docsでの共有はセキュリティ上のリスクが高い |
意思決定が簡素化され、設計サイクルが短縮される傾向 |
設計サイクルが長くなる傾向 |
自動的に常に最新の状態が維持される |
手動での更新が必要で、最新状態の維持が困難 |
バージョン管理が自動で行われる |
バージョン管理に問題が生じやすい |
製薬研究プロジェクトのデータ管理に特化して設計されている |
この種のソフトウェアは製薬研究データの管理を想定していない |
化学構造に対応した認識能力を持つ |
化学構造の認識能力がない |
データ損失のリスクが最小限に抑えられる |
データ損失のリスクが高い |
データ統合が容易 |
データ統合に手作業と時間がかかる |
プレゼン中にデータを即座に検索・表示可能 |
複数のスライドやPPT全体を開いて探す必要がある |
リッチでリアルタイムな可視化と統合ツールを提供 |
可視化機能が限られ、ツールの切り替えが頻繁に必要 |
ライブセッション中の対話支援が可能 |
ライブセッション中の支援は静的で限定的 |
高い柔軟性でカスタマイズが可能 |
カスタマイズ不可、柔軟性も低い |
データのFAIR化(FAIRification)のいくつかの段階を支援できる |
FAIR原則への対応ができない |
高いスケーラビリティを持つ |
スケーラビリティに限界がある |
Design Hub は共同作業と情報共有を促進する
Design Hub は、Chemaxon が提供する小分子医薬品設計のためのチームコラボレーションツールであり、DMTA サイクル(設計・合成・試験・解析)における科学的根拠と化合物のトラッキング、合理的な設計に必要な計算リソースとを結びつけます。本ツールは、化合物の効率的な設計、合成、進捗のトラッキングを可能にし、外部との共同研究を伴う創薬プロジェクトの成功を支援します。
Design Hub により、チームは PowerPoint ファイルから、視覚的に豊かで化学構造の検索が可能な仮説へと移行できるようになります。これらの仮説は化合物設計プロセスに不可欠な要素として統合され、ライブセッションにおける対話的なサポートとしても活用可能です。仮説に関連づけられた化合物は常にその仮説と紐付けられており、過去の意思決定を導いた根拠を研究者が見失わないよう支援します。プロジェクト全体を俯瞰できるビュー、カンバンボード、化合物ステータスの変化に関する通知により、マネージャーやチームメンバーは合成に伴う課題を乗り越えつつ、プロジェクト全体の進捗状況を把握しやすくなります。どの化合物を優先的に合成するかの判断は、リアルタイムの物性予測、安全性アラート、特許取得の可能性や市販ビルディングブロックの入手可否といったフィードバックに基づいて行うことができます。豊富なプラグインおよび API インターフェースを通じて、外部および社内のデータソース ― 登録システム、アッセイデータベース、コンプライアンスチェッカー、ELN、モデリングツールやドッキングツール ― との連携も可能です。
Design Hub は、役割やプロジェクト単位で細かくアクセス権を設定できる共有コラボレーションスペースを提供することで、CRO パートナーとの協業を円滑にします。これにより、データの安全性および知的財産の保護を確保しつつ、円滑なコミュニケーションとデータ共有が可能になります。
本プラットフォームは、AWS インフラを利用したシングルテナント構成で提供されており、企業およびそのすべてのベンダーは ISO 認証を取得しているため、データは安全に取り扱われます。
Design Hub は、企業の独自のデジタル環境に組み込むことで、信頼性の高い唯一の情報源として機能する理想的なプラットフォームです。