GOSTAR by EXCELRA｜メドケム・創薬AI SARデータベース

作成者: Patcore｜Apr 8, 2024 6:28:31 AM

GOSTARは世界最大の専門家が人手でキュレーションして構築された低分子化合物のデータベースです。公開データは実に多様ですが、マニュアルキュレーションにより整理・統合・更新されているので、すぐに解析やAIモデルの構築に使うことができます。GOSTARを使うとデータを収集・整理したりすることから解放されるので、あなたの貴重な時間を最も重要な研究活動に集中することができます。

GOSTARは約1千万件の低分子化合物と約3,400万件のSARデータポイントを収録した世界最大規模の低分子SARデータベースです。約4百万件から絞り込まれた9万7千件の特許および100万件の学術論文から吟味した約20万8千件の記事から専門家がマニュアル作業により抽出し、ISOの認証を受けた所定のルールに基づく標準化・構造化がなされたデータベースです。

GOSTARのデータセットは、医薬品の設計と創薬に最も関連性の高いデータを含むように編集されており、低分子の生物学的活性、物理化学的特性、合成方法論を含む包括的な情報を提供します。

データベース全体でデータの標準化、正規化、用語の統制を行い、セマンテック技術（コンピュータが意味を理解可能な形式で情報を扱い、自動処理を可能とする技術）を採用しているため、利用者が意図した情報を容易に検索・解析したり、自動処理したりすることが容易にできます。

化合物のカバレッジ

Target :78,235

（2024年7月時点）

SARデータポイントの概要

GOSTARのアッセイカテゴリ別データポイント件数

NLP（自然言語処理技術）とエキスパートの知性を融合したISO900認証の品質保証システムを採用

GOSTAR以外のデータベースではコストの安い自動データ収集を採用しています。一方Excelraはコストとデータの質のトレードオフに直面したとき、データの質を選択しました。Excelraでは60名以上の博士取得者を含む約600名の専門家集団を擁しており、さまざまな種類のソースからすべてのデータポイントをキュレートし、抜粋し、精査して、リレーショナルデータ形式に変換しています。コンテンツは、GOSTARに追加する前に、3段階の品質管理分析、標準化、正規化プロセスにかけられます。

Excelraは、厳密さと迅速さを併せ持つ技術を18年以上の経験を通して習得しており、文献や特許の公開わずか数週間で新しい情報を取得・追加し、化学分野の最新情報を常に入手できるようにしています。

Excelraは以下の認証を取得しています。

- 品質管理システム - ISO 9001:2015
- 情報セキュリティ管理システム - ISO/IEC 27000:2013
- 事業継続管理システム - ISO 22301:2019
- HIPAA コンプライアンス証明書
- 個人情報管理システム - BS 10012:2017
- PII プロセッサとして機能するパブリッククラウドで PII を保護するための管理システム - ISO/IEC 27018:2019

ターゲットバリデーション

GOSTARは、in vitroおよびin vivo（酵素および細胞ベースモデル）技術により実験的に決定された、既知化合物と標的の定量的結合相互作用を表現する大規模データセットです。AI/MLモデラーは、機械学習技術を使用して、薬剤性モデルを生成し、対象のターゲットの活性化または阻害に関与する未知のメカニズムを予測することができます。

- - 創薬ターゲットの検証用アッセイを特定するためのデータセット
  - 化学的プローブ（参考化合物）関連のデータセット
  - ターゲットの作用機序に関連するデータセット

バーチャルスクリーニング

GOSTARは約1千万もの化合物のリポジトリを持ち、その化学構造は生物学的、薬理学的、治療的情報とリンクしています。AI/MLモデラーは、この情報を利用して、ヒット化合物を発見するための仮想スクリーニングモデルを構築し、検証することができます。

- - バーチャルスクリーニングのためのコンテンツ（構造およびアナログベースのアプローチ）
  - ターゲット周辺の既知かつ多様な化学空間
  - 膨大なSAR空間を利用した新規性評価
  - アクセス容易なフラグメント・スキャフォールドライブラリー

リード最適化

GOSTAR内のSAR、ADMET、物理化学データセットは、リード化合物の仮想最適化研究を行うために使用することができます。特にADMETデータセットは、リード化合物の薬物動態特性を最適化するために使用できる予測モデルの構築と検証に有用です。

- - SARデータセットに着目し、リード化合物の親和性・ポテンシーを最適化するためのモデルを構築
  - 新規性評価とリードシリーズの拡大
  - 安全性と有効性モデル構築のためのin vivo（疾患モデル）データセット

ドラッグリパーパシング/ドラッグリポジショニング

GOSTARは、AI/MLモデラーが、既に承認されている薬剤や臨床研究された化合物の新しい治療用途を探索することをサポートします。データサイエンティストは、前臨床化合物、臨床候補化合物、既承認薬の定量的相互作用によって表される膨大なSARコンテンツをマイニングし、新規の関係性を探索することができます。体系的に捉えられたポリファーマコロジーコンテンツは、新規の関連性を探索し、また再利用候補化合物の安全性と有効性を調査するための豊富なデータプラットフォームを提供します。

オンラインアクセス

GOSTARのオンラインサービスで、すぐに検索・解析が可能！

ご契約に応じて検索結果もダウンロードできますので、お客様がお持ちのSAR解析ツールで解析したり、AI/ML予測モデルのトレーニングデータセットとしても利用したりできます。

ライセンス形態：ユーザらのユーザーベースのアクセスライセンス及びユーザー数制限の無いコーポレートライセンス

GOSTARデータのファイルによる提供

GOSTARの全データ又は特定カテゴリに絞ってご提供致します。お客様の社内システムにデータをインポートして活用したり。大規模なGOSTARのデータを用いてAIモデルの構築が行えます。

データ形式：Oracle、PostgreSQL、MySQL、CSV、TSV、XML、XLS、SDF、RDF

カスタムキュレーションサービス

ニッチな研究領域に特化したデータベースの構築など、お客様のご要望に応じてExcelraのマニュアルキュレーションによるデータベース構築をサービスとしてご提供しています。

- - 特許からマーカッシュ構造を抽出し、電子化（ChemaxonのMarkush Editor、Markush Searchで利用可能）
  - 医薬化学ジャーナル、特許、お客様所有のデータ、その他の情報源から、ご要望に基づき条件にマッチしたデータを抽出し、ご指定のフォーマットでデータベースを構築

Excelraアドバンテージは、独自の精選されたデータ資産、深い専門知識、データサイエンスをシームレスに融合することで生まれます。Excelraの多面的なチームは、最先端のテクノロジーを駆使して、大量の異種非構造化データを調和させ、分析します。データ主導の意思決定により、業務効率を高め、創薬開発のスピードアップを実現し、創薬と医薬品開発を加速させます。過去18年間、Excelraは、大手製薬会社上位20社のうち15社を含む90社以上のグローバルクライアントから、データおよび分析のパートナーとして選ばれてきました。

Excelraは、500人以上の訓練を受けたデータキュレーター（それぞれが有資格の主題専門家）からなるチームを有しており、複雑なデータ状況を把握し、お客様の創薬ライフサイクルを加速させる化学、生物、医学データを提供することが可能です。

Excelra社は以下のデータセットをご提供可能です

膨大な化学物質と構造活性相関を照らし出す、構造化された高品質なデータセット
AI-ML創薬モデルのための解析可能なデータセット
お客様の社内データとの統合、およびお客様のシステムとの互換性を考慮したデータセット

Markush構造から個別構造の生成、R-グループ解析解析、特定ターゲット周辺のランドスケープ解析、ADMETデータセット生成など、化学キュレーションのあらゆるニーズにお応えします。

”GOSTARのおかげで、事実上他の方法では不可能な生物・化学空間の領域に参入することができます。”

E-therapeutics社 CTO Jonny Wray 氏

”AIはこれまで考えられなかった方法で創薬に革命を起こしており、X-ChemのRosalindAIは正確でスケーラブル、かつ堅牢なAIツールで先導し、前臨床創薬の変革を可能にしています。Excelraとのコラボレーションにより、GOSTARのデータを活用し、これまでにない方法でAIを実現することができます。”

X-Chem SVP Noor Shaker 氏

最近の共同研究で、RosalindAIのGOSTARデータによる学習で2倍優れたモデルが得られることを確認。

詳細はホワイトペーパーをご覧ください。

カタログはこちらから

GOSTARについてのカタログやホワイトペーパーを用意しております。ご所望のカタログ・ホワイトペーパーがございましたら、それぞれのダウンロードボタンを押下し、リンク先のiPROSにてダウンロード下さい。

GOSTARに関する資料はこちら。

世界最大のSARデータベースGOSTERカタログ

GOSTARの使用例に関する資料はこちら。

AI駆動型創薬に最適な構造化されたSARデータ

化合物データベースの活性ランドスケープ解析

GOSTERデータによるKRAS研究の支援

GOSTARにおける機械学習分析に関する資料はこちら。

GOSTERホワイトペーパー_機械学習比較分析

詳細なデモでGOSTARのデモをご覧頂き、お客様の課題がどのように解決できるのかをご確認下さい。
GOSTARでSARデータの収集や整理、アップデートの煩わしさから解放されましょう。
デモのご依頼、ご質問などは以下のお問合せフォームよりご用命ください。

完全な記事を表示