私たちは、データ共有について語る必要があります。昨年発表された「Gartner Hype Cycle for Healthcare Data, Analytics and AI」の中のデータ共有に関するセクションでは、次のような一文から始まっています。「データ共有は困難である。最良の標準や新たな機能があったとしても、それには複雑なアーキテクチャや、ガバナンスに関するポリシー、ガイドライン、ガードレールの整備が必要であり、それらは医療機関にとって管理が困難である。」
ここで問題となるのは、技術的な側面だけではありません。むしろ、それは「簡単な部分」と言えるかもしれません。本当に必要なのは、プロセス、期待値、定義されたKPI(重要業績評価指標)、さらには結果やデータを共有することに関する文化や動機づけといったものを見直すことです。これらを調整してはじめて、新しい標準や技術の導入が進みやすくなるのです。そうでなければ、私たちはこれからも、データサイロを作り続けることになるでしょう。
製薬業界は現在、1つの医薬品あたりの研究開発コストが年々増加する一方で、新薬による収益の期待値は横ばいという厳しい課題に直面しています。「従来型の低分子化合物」研究における効率性向上だけでなく、さまざまなタイプのバイオ医薬品を含む新たな分子種におけるベストプラクティスの確立には、部門間、研究グループ間、さらには企業間の円滑なコミュニケーションが不可欠です。これら新しい分子種の導入は、プロセスや組織構造のさらなる複雑化を招いています。つまり、私たちは業界全体で効率性の問題に直面しているだけでなく、新たなバイオ医薬品のモダリティ(作用様式)の登場によって、もう一段階の複雑さにも直面しているのです。
ある程度までであれば、機能的な部門が明確に分かれ、整理されていることは自然であり、むしろ賢明とも言えます。しかし、新たなプロジェクトの複雑さが絶えず部門間の積極的な連携を求める状況では、データの流れを途切れさせることなく保つ必要があります。
この効率性の問題を緩和するために、アウトソーシング、学術機関との連携、CRO(Contract Research Organization)の活用、さらには買収の増加といった対策が取られることが一般的です。しかし、これらすべての手段は、データ共有、データの流通、データの可用性といった観点で新たな問題を引き起こし、結果としてセキュリティやアクセス制御に深刻な影響を及ぼす可能性があります。最終的に、データの共有やデータサイロ間の連携能力が、この分野における重大なボトルネックのひとつとなっているのです。
簡単に現状を概観するために、いくつかの数字をもとに市場の状況を見ていきましょう。
Chemaxonでは、ケモインフォマティクスおよび化学データ管理の現状と将来に深い関心を持っています。そのため、先述したような一般的な課題は、次の主要なトピックに集約することができます。
言うまでもなく、データは鍵である
企業による頻繁な買収の結果として、さまざまな情報源からのデータを適切に移行することが、企業内に存在するすべての知的財産(IP)へのアクセスを可能にするための鍵となっています。データ移行は、過去のデータの再利用性を担保し、買収後もそのデータにアクセスできるようにする必要があります。異なるデータセットを比較可能なものにするためにはデータの標準化が求められます。加えて、データの出所や元の識別子を保持し、すべてが同一のビジネスルールに準拠していることも必要です。これらすべての要素は、FAIR原則(Findable, Accessible, Interoperable, Reusable:見つけやすく、アクセスしやすく、相互運用可能で、再利用可能)のより大きな枠組みの一部として捉えることができます。
システムの接続
部門間や研究グループ間で異なるシステムを接続する際には、データソースへのアクセスを迅速化することが不可欠です。こうした作業は通常、それぞれのシステムが持つ明確に定義されたAPI(アプリケーション・プログラミング・インターフェース)を通じて統合を行うことで実現されます。APIの標準化が進めば、本来はつながっていないシステム同士の統合にかかる労力は大幅に軽減されるはずですが、APIの標準自体はまだ稀であり、普及のスピードも遅いのが現状です。
フォーマット変換と標準化
これもシステム間の相互運用性に関わる問題ですが、効率的な連携は信頼性の高いデータフォーマットの変換、あるいは理想的にはフォーマットの標準化に大きく依存しています。研究開発の各分野では、それぞれが使用する情報源のシステム、装置、ソフトウェアツールのベンダーに応じた独自のフォーマットが使われています。オープンスタンダードを推進する「競争前」段階の取り組みもいくつか存在していますが、API標準と同様に、導入には困難が伴います。一般的には、市場シェアの大きい独自フォーマットが事実上の標準となる傾向がありますが、そのプロセスには何年、時には数十年かかることもあります。
データのフォーマット変換は不可欠であり、やり取りされるデータセットの規模が増加する今、「人力による翻訳」に頼る余地はありません。
効率的な意思決定に必要なあらゆる情報を見つけて(再)利用する
複数の領域やシステムをまたいでデータを検索できる「フェデレーテッドサーチ(統合検索)」は、効率的な意思決定をめぐる議論で頻繁に登場するキーワードです。関連する情報をすべて簡単に見つけられるようにすることは、ステータス報告会議のために手作業でさまざまなレポートを集めるという手間を省くことにつながります。また、すべての関係者が同じデータを見て、次のステップに向けた意思決定の根拠を共有できるようになります。
私たちR&D ITコミュニティは、どのように進展に貢献できるのか?私たちは、データ移行、既存データセットの再利用(有用な場合)、データの標準化、そしてFAIR原則の採用について、単なる議論にとどまらず、実際に行動に移す必要があります。FAIR原則を実践することが、私たちの全体的な効率性に大きな影響を与えるのです。理想的なアーキテクチャと、現実的かつ効率的な変革の実装とのバランスを学ばなければなりません。その第一歩として、Chemaxonが主催するChemTalksイベントに、ぜひ皆さんをご招待したいと思います。このイベントでは、業界の専門家たちが、創薬初期段階におけるデータサイロの壁をいかにテクノロジーで乗り越えているかについて議論します。
参考文献
- Gartner Hype Cycle for Healthcare Data, Analytics and AI, 2023
https://www.gartner.com/en/doc/788390-hype-cycle-for-healthcare-data-analytics-and-ai-2023 - KPMG Biopharma deal trends outlook for 2023
https://kpmg.com/kpmg-us/content/dam/kpmg/pdf/2023/biopharma-deal-trends-outlook.pdf - CRO Industry Report, Contract Pharma, 2024年6月19日
https://www.contractpharma.com/issues/2024-06-01/view_features/cro-industry-report-645387/ - Citeline Pharma R&D Infographic
https://www.citeline.com/-/media/citeline/resources/pdf/infographic_pharma-rd-2024.pdf - Are reaction data FAIR… and what can we do with that?
Gerd Blanke, UGM 2023
https://www.youtube.com/watch?v=8_iAiqmLaYg - Improving Your Drug Discovery Workflow: Collaboration, Data Management, and Security
Daniela Cintulova, 2024年1月10日
https://chemaxon.com/blog/improve-your-drug-discovery-workflow-collaboration-data-management-and-security - FAIR原則
https://www.go-fair.org/fair-principles/