技術ブログ第一回目では、化学構造式描画ツールについて紹介します。
海外の方々とコミュニケーションをとる際には、言葉の壁が存在します。文化による表現の違いや、微妙なニュアンスの違いにより、苦労された経験がないでしょうか。 化学の世界では、幸いなことに化学構造という共通言語が存在するため、そのような心配は無用です。コーヒーの主成分であるカフェインを例にとると、慣用名であるCaffeine、IUPAC名である1,3,7-Trimethylpurine-2,6-dione、といった異なる表現はありますが、化学構造式を描画してしまえば意図する化合物についてきちんと伝えることができます。
その化学構造式を描画するツールとして、商用・OSS含めて様々な化学構造式描画ツールが存在しますが、ChemAxon社のMarvinは信頼性と機能性の点で他とは一線を画します。JavaベースのデスクトップアプリケーションであるMarvinSketchと、JavaScriptベースでWebアプリケーションに容易に組み込むことができるMarvinJSが提供されています。
MarvinJSが採用されているサービスの例
今回はMarvinSketchの実際の使い方を紹介します。
MarvinはChemAxon社の最初の製品とリリースされて以来、20年に渡って機能改善がなされてきました。以下の様な特徴があります。
MarvinSketchについて実際に何ができるのか、見ていきます。
MarvinSketchのインストーラはChemAxon社のページよりダウンロードすることができます。(注:ChemAxon社のサイトで会員登録が必要です。)
SMILES, MOL, SDF, PDB, InChI等の多彩なファイル形式を読み込むことができ、テキストのコピー&ペーストによる構造を貼り付けることができます2。他のエディタツールのファイル形式にも対応しており、ChemDrawの場合はCtrl+DによりXML形式でコピー⇒MarvinSketchに貼り付けることができます。
描画する構造のボンド長、太さ、フォント、色などは自由に変更できます。デフォルトで主要ジャーナルのガイドラインに沿ったフォーマットが登録されているため、論文投稿用の画像も簡単に用意できます。
構造を描画するにあたって、キーボードをいかに効率的に使えるかが描画速度を上げる鍵となります。キーボードショートカットの説明については、ChemAxon社のユーザーガイド(MarvinSketch・MarvinJS)をご覧ください。併せて、"Did You Know Series"として、Youtubeに使い方説明の動画がアップロードされています。
とりあえずは、以下を覚えておけば描くのがずいぶん早くなります。
※Windows環境での説明です。
Calculator Pluginsを使用することにより、pKa, logP, solubility, NMR, structural isomerなどのChemAxon社の物性計算を利用することができます。計算精度など詳細については、参考記事を参照下さい。
不対電子対の表示や、電子フローの矢印を使うことで反応を描画できます。反応の矢印を追加することで、反応物と生成物を自動で認識してくれます。下図では酸塩基平衡反応を描いてみました。
ちなみに、アトムマッピングという機能を使うと原子をマッピングするため、反応前後での原子を追うことができます。ChemAxon社にはAutoMapperというツールがあり、Marvin上で単にAtom mappingを選択することで自動で反応点を認識してくれます。
MarvinSketchで描画した構造は、様々なフォーマットで保存できます。一方で標準で外部サイトと連携しているため、描画した構造を使って構造式検索を行うことができます。
以上、低~中分子を念頭にMarvinの使い方を説明しました。
Marvinは20年近くに渡って多くの顧客に利用されており、低~中分子化合物の描画について様々な機能を有する、決定版といえるツールです。一方で、近年では創薬研究のテーマとして、低分子化合物だけではなく、核酸やペプチド、抗体薬物複合体といった新たなモダリティにも注目が集まっています。これら生体高分子ではそのモノマーの構造(アミノ酸、ヌクレオチド等)を略語で表し、シーケンス情報に基づいて化学情報が管理されます。さらに、天然の構造を化学的に修飾した特殊ペプチド、人工ヌクレオチドも使われるため、モノマーの構造を登録する機能も必要になります。
この様な生体高分子の描画について、Marvinでも一部対応していますが、より洗練された機能を持つ専用のツールとしてBioEddieという製品があります。生体高分子の記述言語であるHELMに対応しており、非天然の特殊ペプチドの登録機能等により、シーケンス・分子レベルでの正確な表現を可能にします。
BioEddieについてはまた別の投稿にて紹介したいと思います。Marvinについても、ポリマーや混合物の描画方法やクエリ構造の指定など、高級な機能がありますので、別な機会に記事にしてみます。
ChemAxon社のサイトよりダウンロード下さい。
https://chemaxon.com/products/marvin↩
Name to Structureのライセンスにより、慣用名、IUPAC名、CAS登録番号等から構造へ変換することができます。日本語・中国語にも対応しています。
https://chemaxon.com/products/chemical-name-conversion↩