JKlustor

クラスタリングツール、MCS抽出

低分子創薬

データサイエンス

開発ツールキット

クラスタリングとダイバーシティ解析

sphere_exclusion_clustering_with_jklustor[1]

JKlustorは、化合物ライブラリとフォーカスセットの類似性と構造に基づくクラスタリングを階層的または非階層的に実行するクラスタリング手法満載のツールです。

また、分子フィンガープリントやその他の記述子に基づいて、多様性の計算やライブラリーの比較も行います。コンビナトリアルケミストリー、バーチャルライブラリーデザイン、その他多数の化合物を分析する分野で不可欠なツールです。

 

 

 

 

JKlustorは以下のコマンドラインツールを提供します

LibMCS application GUI

JKlustor は、JChem に統合された多様性計算とクラスタリングのための Chemaxon モジュールです。JChem のユーザーは主に化学者ですが、JKlustor は他のオブジェクトにも使用できます。現在、JKlustor はクラスタリング用に次のコマンドライン ツールを提供しています。

 

  • GenerateMD は、分子の化学ハッシュやファーマコフォア フィンガープリントなど、構造多様性の計算やクラスタリングに使用できるさまざまな分子記述子を生成します。

  • Jarp は可変長 Jarvis-Patrick クラスタリングを実行します。

  • Ward は、RNN アプローチを適用した Ward の階層的クラスタリング法を使用して分子をクラスタリングします。

  • LibMCS は、最大共通サブ構造によって分子を階層的にクラスタリングします。これは、フォーカス セット プロファイリングや多様性分析に適用できます。

  • CreateView は、 GenerateMDの入力 SD ファイルを使用して構造と計算結果の両方を含む SD ファイルと、SD ファイルからの化合物の順序番号とその他の表示するデータを含むテーブルを作成します。このようなテーブルは、たとえば Compr、Jarp、または Ward によって作成できます。生成された SD ファイルは、MarvinView またはその他の SDF ビューアで表示できます。

 

Chemaxon のすべてのクラスタリング手法は、以下のようにグループ化されています。

 

階層的クラスタリング

Wardの最小分散法は、Murtaghの相互最近傍アルゴリズム(Murtagh’s reciprocal nearest neighbour algorithm)で高速化され、緊密でよく分離されたクラスタを作成します。100,000構造未満のフォーカスされたライブラリのような小さなデータセットで使用することをお勧めします。Wardクラスタリングの詳細

 

非階層的クラスタリング

Sphere Exclusion クラスタリングは、フィンガープリントやその他の数値データに基づいており、何百万もの構造に簡単に対応でき、多様なサブセットの選択に適しています。

K-meansクラスタ分析法は、各クラスタ内の分散を最小化する方法で、入力データ内の自然なクラスタの中心を見つけることを目的としています。

最後に、Jarvis-Patrick (Jarp)法は、最近傍アプローチを使用し、何十万もの構造が含まれる化学データベースの可変長クラスタリングを行います。

 

 

記述子とコマンドラインツールによる機能拡張

JKlustor は、Chemaxon 独自の化学およびファーマコフォア フィンガープリント技術、および BCUT などの他のユーザー定義記述子を使用できます。たとえば、予測または測定された物理化学特性(pKa、logP など) もクラスタリングに役立ちます。

    

JKlustor のコマンドライン ツール:

  • 多様性分析 - Compr コマンドラインを使用すると、データセット内でさまざまな種類の類似性または非類似性の比較が生成されます (多様性セットの選択も参照)。 
  • GenerateMD  - 分子構造の分子記述子を生成します。
  • Jarp  - 修正された Jarvis-Patrick 法によるクラスタリング。
  • Ward  - RNN アプローチを使用した Ward の階層的クラスタリング法によるクラスタリング。
  • LibMCS  - 最大共通サブ構造に基づく階層的クラスタリング。
  • CreateView  - SD ファイルとデータ テーブルから新しい SD ファイルを作成します - クラスター化された結果を表示するのに便利です。

 

様々な方法で利用可能

JKlustorツールは、コマンドラインまたはJChemのAPIから呼び出すことができます。JKlustorは、多くのオペレーティングシステム上で動作し、多くのデータベースエンジンと統合することができます。Oracle、MySQL、MS SQL Server、DB2、PostgreSQL、Accessなどのデータベースへの接続はもちろん、Javaと.NETの完全な統合がサポートされています。

LibMCS エレメントにはスタンドアロン GUI が付属しており、ユーザーは大規模なデータセットをブラウズ/ナビゲートできます。さらに、最大公約数部分グラフ (MCES) と最大公約数部分構造 (MCS) クラスタリング手法も、Chemaxon のコンポーネントとして、KNIME と Pipeline Pilot ワークフロー管理システムの両方で利用できます。

 

関連ドキュメント

 

機能紹介動画(英語)

 

 

製品・サービス一覧

RELATION PRODUCTS

 

 

 

 

 

お問合せフォーム以外にも、電話やE-mailでのお問い合わせも受け付けています

03-6256-0331

(平日 9:00 ~ 17:00)

info@patcore.com