GOSTAR by EXCELRA|創薬SARデータベース

創薬AIの学習データには高品質且つ大量のSARデータが必要です。GOSTARはエキスパートがマニュアルキュレーションにより、収集・整理した世界最大級の化学構造とその関連データに関するデータベースです。SARデータを入手したり最新に維持する悩みを解消します。

ExcelraのGOSTARは、化学構造と生物学的、薬理学的、治療学的活性を結びつけ、数百万の化合物に対する360度ビューを提供します。GOSTARを使用することで、最新の整理されたSAR情報を簡単に入手でき、研究に専念することが可能です。

AIモデルを構築する際に、データの収集や整理に苦労する必要はもうありません。

充実したデータ量と質

GOSTARは世界最大の専門家が人手でキュレーションして構築された低分子化合物のデータベースです。公開データは実に多様ですが、マニュアルキュレーションにより整理・統合・更新されているので、すぐに解析やAIモデルの構築に使うことができます。GOSTARを使うとデータを収集・整理したりすることから解放されるので、あなたの貴重な時間を最も重要な研究活動に集中することができます。
GOSTARは約1千万件の低分子化合物と約3,400万件のSARデータポイントを収録した世界最大規模の低分子SARデータベースです。約4百万件から絞り込まれた9万7千件の特許および100万件の学術論文から吟味した約20万8千件の記事から専門家がマニュアル作業により抽出し、ISOの認証を受けた所定のルールに基づく標準化・構造化がなされたデータベースです。
GOSTARのデータセットは、医薬品の設計と 創薬に最も関連性の高いデータを含むように編集されており、低分子の生物学的活性、物理化学的特性、合成方法論を含む包括的な情報を提供します。
データベース全体でデータの標準化、正規化、用語の統制を行い、セマンテック技術(コンピュータが意味を理解可能な形式で情報を扱い、自動処理を可能とする技術)を採用しているため、利用者が意図した情報を容易に検索・解析したり、自動処理したりすることが容易にできます。

化合物のカバレッジ

化合物のカバレッジ
(2025年5月時点)

SARデータポイントの概要

GOSTARのアッセイカテゴリ別データポイント件数

SARデータポイントの概要

GOSTARデータベース統計情報

2025年5月時点

10.6M+
 
化合物
35M+
 
SARデータ
(活性値・物性値)
79K+
 
ターゲット
(標的・Target)
120K+
 
論文・学会誌
78K+
 
組織
(企業・研究機関)
4M+
 
調査対象特許

特許|新規化学物質へのアクセス

対応法域(特許庁)

  • 世界知的所有権機関(WIPO)
  • 米国特許商標庁(USPTO)
  • 欧州特許庁(EPO)

特許クラス

  • IPC分類:A61( 医学または獣医学;衛生学)およびC07 (有機化学)のうち、薬理学的に関連する化合物および生物活性データを含む特許クラス

特許の収載方針と更新タイミング

  • 類似特許(パテントファミリー): 1件の特許のみがキュレーションされ、他の特許庁からの類似特許は、重複データを最小限に抑えるために、その特許の下にタグ付けされます。(類似特許とは、複数の国や領域で出願された同一の発明を指し、同一の優先日を共有し、同一の特許ファミリーに属します。)
  • 収載までのリードタイム - 公開日から45日
  • 英 語以外の特許は、化学名からの変換エラーを減らすために、構造が画像形式で表示されている場合のみキュレーションされます

科学雑誌|研究における新たなトレンドを発見

収載対象の科学雑誌

  • Journal of Medicinal Chemistry
  • ACS Medicinal Chemistry Letters
  • Journal of Natural Products
  • European Journal of Medicinal Chemistry
  • Bioorganic and Medicinal Chemistry
  • Bioorganic and Medicinal Chemistry Letters
  • Molecules
  • Marine Drugs

その他の科学雑誌からの情報収録及び更新タイミング

  • 記事に構造活性相関(SAR)データが含まれ、オープンソースまたはオンデマンドの場合に抽出されます。
  • 収載までのリードタイム - 公開日から60日
features-intuitive-search-1[1]
features-segmented-data-analysis[1]
features-user-friendly-SAR-tool[1]
features-custom-report-generation[1]
features-flexible-export-options[1]
login-page-GOSTAR[1]

高品質なデータがご提供できる理由

NLP(自然言語処理技術)とエキスパートの知性を融合したISO900認証の品質保証システムを採用

GOSTAR以外のデータベースではコストの安い自動データ収集を採用しています。一方Excelraはコストとデータの質のトレードオフに直面したとき、データの質を選択しました。Excelraでは60名以上の博士取得者を含む約600名の専門家集団を擁しており、さまざまな種類のソースからすべてのデータポイントをキュレートし、抜粋し、精査して、リレーショナルデータ形式に変換しています。コンテンツは、GOSTARに追加する前に、3段階の品質管理分析、標準化、正規化プロセスにかけられます。
Excelraは、厳密さと迅速さを併せ持つ技術を18年以上の経験を通して習得しており、文献や特許の公開わずか数週間で新しい情報を取得・追加し、化学分野の最新情報を常に入手できるようにしています。

Excelraは以下の認証を取得しています。

    • 品質管理システム - ISO 9001:2015

    • 情報セキュリティ管理システム - ISO/IEC 27000:2013
    • 事業継続管理システム - ISO 22301:2019

    • HIPAA コンプライアンス証明書

    • 個人情報管理システム - BS 10012:2017

    • PII プロセッサとして機能するパブリック クラウドで PII を保護するための管理システム - ISO/IEC 27018:2019

GOSTARの概要紹介ビデオ

GOSTAR活用シーン

pharma-img

製薬・バイオテクノロジー

GOSTAR®は製薬企業やバイオテクノロジー企業にとって極めて重要であり、化学の枠を超え、活性、親和性、ADME、毒性学、物理化学、その他創薬や薬剤設計に関連するデータを含むSARデータベースを提供しています。オントロジー、フォーマット、インターフェースは、お客様のニーズに基づき最適に設計されています。

GOSTAR

AI / ML

GOSTAR®でAI主導の創薬を促進しましょう。GOSTAR®は、高度に正規化されたQMS-ISO認定の高品質なデータセットを提供し、MLアルゴリズムのトレーニングに使用することができ、新規化合物の探索を促進します。

Academia-img

アカデミア

学術研究者や教育者は、GOSTAR®の包括的なSARおよび薬理学データから恩恵を受け、研究の進展をサポートし、革新的な研究を促進し、一流ジャーナルでの出版を可能にします。

ターゲットバリデーション

GOSTARは、in vitroおよびin vivo(酵素および細胞ベースモデル)技術により実験的に決定された、既知化合物と標的の定量的結合相互作用を表現する大規模データセットです。AI/MLモデラーは、機械学習技術を使用して、薬剤性モデルを生成し、対象のターゲットの活性化または阻害に関与する未知のメカニズムを予測することができます。

  • 創薬ターゲットの検証用アッセイを特定するためのデータセット

  • 化学的プローブ(参考化合物)関連のデータセット
  • ターゲットの作用機序に関連するデータセット

バーチャルスクリーニング

GOSTARは約1千万もの化合物のリポジトリを持ち、その化学構造は生物学的、薬理学的、治療的情報とリンクしています。AI/MLモデラーは、この情報を利用して、ヒット化合物を発見するための仮想スクリーニングモデルを構築し、検証することができます。

  • バーチャルスクリーニングのためのコンテンツ(構造およびアナログベースのアプローチ)

  • ターゲット周辺の既知かつ多様な化学空間
  • 膨大なSAR空間を利用した新規性評価

  • アクセス容易なフラグメント・スキャフォールドライブラリー

リード最適化

GOSTAR内のSAR、ADMET、物理化学データセットは、リード化合物の仮想最適化研究を行うために使用することができます。特にADMETデータセットは、リード化合物の薬物動態特性を最適化するために使用できる予測モデルの構築と検証に有用です。

  • SARデータセットに着目し、リード化合物の親和性・ポテンシーを最適化するためのモデルを構築

  • 新規性評価とリードシリーズの拡大
  • 安全性と有効性モデル構築のためのin vivo(疾患モデル)データセット

ドラッグリパーパシング/ドラッグリポジショニング

GOSTARは、AI/MLモデラーが、既に承認されている薬剤や臨床研究された化合物の新しい治療用途を探索することをサポートします。データサイエンティストは、前臨床化合物、臨床候補化合物、既承認薬の定量的相互作用によって表される膨大なSARコンテンツをマイニングし、新規の関係性を探索することができます。体系的に捉えられたポリファーマコロジーコンテンツは、新規の関連性を探索し、また再利用候補化合物の安全性と有効性を調査するための豊富なデータプラットフォームを提供します。

ご契約モデル

オンラインアクセス

GOSTARのオンラインサービスで、すぐに検索・解析が可能!
ご契約に応じて検索結果もダウンロードできますので、お客様がお持ちのSAR解析ツールで解析したり、AI/ML予測モデルのトレーニングデータセットとしても利用したりできます。
ライセンス形態:ユーザらのユーザーベースのアクセスライセンス及びユーザー数制限の無いコーポレートライセンス

GOSTARデータのファイルによる提供

GOSTARの全データ又は特定カテゴリに絞ってご提供致します。お客様の社内システムにデータをインポートして活用したり。大規模なGOSTARのデータを用いてAIモデルの構築が行えます。
データ形式:Oracle、PostgreSQL、MySQL、CSV、TSV、XML、XLS、SDF、RDF

カスタムキュレーションサービス

ニッチな研究領域に特化したデータベースの構築など、お客様のご要望に応じてExcelraのマニュアルキュレーションによるデータベース構築をサービスとしてご提供しています。

  • 特許からマーカッシュ構造を抽出し、電子化(ChemaxonのMarkush Editor、Markush Searchで利用可能)

  • 医薬化学ジャーナル、特許、お客様所有のデータ、その他の情報源から、ご要望に基づき条件にマッチしたデータを抽出し、ご指定のフォーマットでデータベースを構築

Excelraアドバンテージは、独自の精選されたデータ資産、深い専門知識、データサイエンスをシームレスに融合することで生まれます。Excelraの多面的なチームは、最先端のテクノロジーを駆使して、大量の異種非構造化データを調和させ、分析します。 データ主導の意思決定により、業務効率を高め、創薬開発のスピードアップを実現し、創薬と医薬品開発を加速させます。 過去18年間、Excelraは、大手製薬会社上位20社のうち15社を含む90社以上のグローバルクライアントから、データおよび分析のパートナーとして選ばれてきました。
Excelraは、500人以上の訓練を受けたデータキュレーター(それぞれが有資格の主題専門家)からなるチームを有しており、複雑なデータ状況を把握し、お客様の創薬ライフサイクルを加速させる化学、生物、医学データを提供することが可能です。

Excelra社は以下のデータセットをご提供可能です

  • 膨大な化学物質と構造活性相関を照らし出す、構造化された高品質なデータセット

  • AI-ML創薬モデルのための解析可能なデータセット

  • お客様の社内データとの統合、およびお客様のシステムとの互換性を考慮したデータセット

  • image-png-Jun-10-2024-01-56-21-5846-AM

Markush構造から個別構造の生成、R-グループ解析解析、特定ターゲット周辺のランドスケープ解析、ADMETデータセット生成など、化学キュレーションのあらゆるニーズにお応えします。

お客様の声

”GOSTARのおかげで、事実上他の方法では不可能な生物・化学空間の領域に参入することができます。”
E-therapeutics社 CTO Jonny Wray 氏
”AIはこれまで考えられなかった方法で創薬に革命を起こしており、X-ChemのRosalindAIは正確でスケーラブル、かつ堅牢なAIツールで先導し、前臨床創薬の変革を可能にしています。Excelraとのコラボレーションにより、GOSTARのデータを活用し、これまでにない方法でAIを実現することができます。”
X-Chem SVP Noor Shaker 氏
 
最近の共同研究で、RosalindAIのGOSTARデータによる学習で2倍優れたモデルが得られることを確認。
詳細はホワイトペーパーをご覧ください。
  • image-png-Jul-07-2024-09-35-57-5331-AM

さらに詳しくは

GOSTARについてのカタログやホワイトペーパーを用意しております。ご所望のカタログ・ホワイトペーパーがございましたら、それぞれのダウンロードボタンを押下し、リンク先のiPROSにてダウンロード下さい。

 

 

カタログ

世界最大のSARデータベースGOSTAR

ケーススタディー

AI駆動型創薬に最適な構造化されたSARデータ

ケーススタディー

化合物データベースの
活性ランドスケープ解析

ケーススタディー

GOSTARデータによる
KRAS研究の支援

ケーススタディー

機械学習比較分析

まずは、デモで実際のGOSTARをご覧ください

詳細なデモでGOSTARのデモをご覧頂き、お客様の課題がどのように解決できるのかをご確認下さい。
GOSTARでSARデータの収集や整理、アップデートの煩わしさから解放されましょう。
デモのご依頼、ご質問などは以下のお問合せフォームよりご用命ください。

Contact

お問い合わせ

製薬・バイオテクノロジーのDXならパトコアにおまかせください