Name to Structure (N2S)
IUPAC名,一般名,CAS登録番号から構造式を生成
低分子創薬
データサイエンス
化学ソフト
開発ツールキット
Name to Structure(N2S)はIUPAC や体系名、一般的から化学構造式に変換する機能に加え、CAS登録番号®を認識して公的Webサービスを介して化学構造式を取得する機能を提供します。また、ユーザーがカスタマイズ可能な辞書、データベース、または Web サービスを参照して、企業 ID または任意のテキストを構造に変換することを可能にします。英語以外にも、中国語や日本語からの名前から構造への変換もサポートしています。
なお、本ライセンスには構造式から化学名やCAS番号を取得するStructure to Name(S2N)が包含されています。
本ツールは、名称から構造式に一括変換する方法を複数提供しています。
Instant JChemやJChem for Excel、MarvinViewにおいては、名称が記載されたテキストファイルをインポートすると自動的に構造が認識され、SDファイルからのインポートと同じように構造式として読み込むことができます。
Pipeline pilot や Knimeのようなワークフローツールについては、コンポーネントの一つとして変換ツールが実装されています。 Molcovertやcxcalcなどのコマンドラインツールからも名称⇔構造変換が可能です。
また、APIを用いてカスタムアプリケーションに変換機能を組み込むことが出来ます。オプションの利用でMicroserviceとして本機能を利用することも可能です。
日本語、中国語化学名にも対応
急速に増加するアジア言語の科学文献に対応するため、ChemAxonは中国語と日本語の変換に対応しました。これらの言語をサポートすることで、研究者のために化学的内容を含む中国と日本の特許や他の文書の膨大なライブラリへの扉を開きます。Chemaxonによる日本語名→構造変換の精度検証では、45,000の日本語化合物名をテストし、認識率85%、正しい構造式に変換できた名称は97%でした。
ドキュメントから自動抽出するD2Sからの利用
別製品のDocument to Structure(D2S)は、html、テキスト、PDFファイル内の化学名を認識し、構造式として一括抽出を可能にします。Structure to Nameのライセンスをお持ちのお客様はオプションとしてDocument to structureを追加できます。
Document to structureはAPI及びコマンドラインおよび、InstantJChem、JChem for EXCEL、Java APなどから利用できます。
本ツールは化学名を認識し、構造に変換するだけでなく、ファイル内の化学名の位置情報も取得することができます。 Document to structureのテクノロジーはchemicalize.orgに実装されているほか、 Linguamatics 社やQuestel社のテキストマイニングでも採用されています。Pipeline PilotコンポーネントやJChem extention for KNIMEに統合されたDocument to Structureを用いるとテキストマイニングの自動化が可能です。
カスタマイズ可能な辞書
ChemAxonのネーミングテクノロジーは非常に柔軟でカスタマイズ可能です。化学名と構造の変換は、ユーザー独自のカスタム辞書をサポートしています。これは、Name to Structure のロジックや内部の辞書で見つけられない不明瞭な一般名や略称、俗称、企業の化合物IDを化学構造に変換する必要がある場合に有用です。カスタマ辞書は、名称とそれに対応する構造式のSMILESで容易に定義が可能です。カスタム辞書はローカルのファイル、データベースからのアクセス、Webサービスを介した構成が可能です。
カスタム辞書についての詳細はこちらをご覧ください。