創薬研究の現場において、低分子化合物をターゲットとした研究開発以外にも、ペプチド・核酸・抗体(抗体薬物複合体)などの新たなモダリティに対する関心が高まっています。それらバイオポリマーに関する情報は配列として保存され、ケモインフォマティクス同様、バイオインフォマティクスの手法により創薬リードの探索が進められています。
バイオポリマーの薬理作用を最適化する場合、配列中のアミノ酸残基、核酸を置換(変異)、欠損、修飾する操作が行われます。生化学的技法の発展により配列の操作は実用的な難易度で可能になりました。しかし、どの様な配列を設計すれば薬理活性を上げることができるか、という予測はバイオポリマーの高次構造の予測が難しいこともあり依然として困難です。低分子創薬に広く使われている構造活性相関(SAR)解析ツールの様なデータ解析ツールが求められています。
Altoris社1はカリフォルニアに拠点を置き、SAR解析ツールSARvision|SMを初めとする創薬支援ツールを開発している会社です。そのAltoris社が大手製薬企業と共同でバイオポリマー向けSAR解析ツールSARvision|Biologics(以下SVB)を開発し、一般に提供しています。現在も既存顧客からの要望を取り入れた最新バージョンを継続的にリリースしてくれています。
SVBは配列の相同性(類似性)に基づき配列データを整列させ、クラスタリング・可視化機能等を用いてペプチド・エピトープ・パラトープ・RNAなどのバイオポリマーにおける構造活性相関を解析することができます。今回は抗菌活性を持つペプチドAureinの相同配列をインプットとして、SVBを使ってみました。
SVBが開発された背景など、詳しい説明は参考文献を参照下さい。
Development of an Informatics Platform for Therapeutic Protein and Peptide Analytics, M.R. Hansen, H.O. Villar, E. Feyfant, J. Chem. Inf. Model. 2013, 53, 10, 2774–2779, doi:10.1021/ci400333x
まず、相同配列や活性値などが保存されたcsv形式、またはfasta形式のファイルを用意し、SVBに読み込ませます。配列データとしては単純な短縮略号の他、標準でHELM形式をサポートしていますので、架橋やループを含む複雑な配列も読み込むことができます。
HELMの特徴としてモノマーライブラリーを用意する必要があることを以前の記事で紹介しました。SVBにおいてもモノマーライブラリーを「Residue Table」として事前に用意しておく必要があります。このテーブルにより例えば「A」は核酸のアデニンか、アミノ酸のアラニンか認識させることができますし、モノマーの特性データや表示フォーマットなどの不随するデータを登録することができます。このフォーマットに従った独自のデータセットを用意すると、非天然アミノ酸や人工核酸を登録することができます。
さらに、配列解析ではモノマー構造の光学異性体(L/D体)やアセチル化などの修飾したモノマー構造も用いる場合が多いかと思います。その様な変異体については「Modifier Table」に修飾パターンを登録しておくことで、元のモノマー構造に対して表示色を変えるといった方法で関係性を可視化させることができます。
Sequence,Activity,MIC L. Lactis,MIC S. Aureus,MIC M. Luteus,Name,IP,Net Charge,Boman Index,Ref
GVIDAAKKVVNVLKNL[NH2-F],Active,3,25,12,Uperin 3.6,9.7,2,0.01,Eur. J. Biochem. 1999; 265: 627-640
GLFDIIKKIAES[NH2-I] ,Active,25,200,200,Aurein 1.1,6.07,0,-0.02,Eur J Biochem. 2000 Sep;267(17):5330-41
GLFDIIKKIAES[NH2-F] ,Active,12,26,51,Aurein 1.2,6.07,0,0.12,Eur J Biochem. 2000 Sep;267(17):5330-41
バイオポリマーの配列データを比較・解析するためには、類似した領域を特定できるように配列を並べ替える必要があります。SVBではClustalなどのアルゴリズムを実装しているため、以下のSequence alignmentの処理を実行できます。
計算に係る時間を考えた場合、通常のスペックのPCではおおよそ数千のレコード数であればMultiple Alignmentでも十分対応できます。それ以上になるとPairwise Alignmentを推奨しています。
fasta形式の配列データも扱えるため、他のソフトウェアで整列させた配列データをそのまま読み込ませることも可能です。また、整列させた後もExcel感覚でギャップを導入するなど、配列を手動で修正できます。
※参照配列データに対する変異部位が黄色でハイライトされています。
データを読み込むことができたら、後は様々な可視化機能・フィルター・数値計算・カテゴリ分けを行うことにより、SequenceとActivityの関係性を解析します。低分子化合物のSAR解析の経験がある方なら、低分子構造を配列データに置き換えて考えてみると解析のフローについて想像がしやすいかと思います。
SVBは専門家の解析フローを支援するツールであり、様々なデータ処理をGUI上で行うことができます。数値データに対してヒートマップを設定することで配列データとの相関関係を見たり、フィルターを用いて該当する配列データだけに絞りこむといった一般的な使い方以外にも、ペプチド構造のループ数をカウントする関数を用いるなど、バイオポリマーに特異的な関数が用意されています。
解析ワークフローの例
活性値などの数値データをHeatMapによる可視化する。
Filter機能を使い特定条件の配列のみ絞り込む。
配列の類似度などを計算する関数を使い、数値によるソートを行う。
特定のモチーフを持つ配列を探し出す。
配列データを基にAlpha-helix propensityやChou-Fasmanを計算して配列の性質を把握する。
など
数値データの解析と共にプロットやグラフによるデータの可視化を行うためのオプションが多数用意されています。散布図、ヒストグラムを用いて活性値の相関関係を調べる他、配列データ中のモチーフを探索するためのSequence Logo Plot、配列の相同性を基に分類するDendrogramなどの可視化オプションを使うことができます。
低分子SAR解析ツールでは、母骨格に対する置換基を変えた誘導体の活性値を比較し、値が急激に変わる置換基を探し出す、すなわちActivity Cliffを探すことがリード最適化を行う上で重要なワークフローです。バイオポリマーでも同様に、どの位置に変異を導入すると活性値が大幅に変化するか特定することが配列設計に役立ちます。SVBではこの目的でMutation Cliffsという探索プログラムが用意されています。
以下の図中では参照配列(Uperin 3.6)の各配列位置を横軸に、アミノ酸の変異を縦軸に置き、そのM. Luteusに対する抗菌活性をMutation Cliffsを使って可視化しています。配列中の変異体の出現を3つまで許容して各配列位置における変異体ペアを見つけ、MIC M. Luteusの値が3倍以上変化した変異部位を色付けして表示しています。
以上、Altoris社のSarvision|Biologicsを使ってみて、主要な機能をまとめてみました。私は今回初めてバイオポリマー系の製品を触ったのですが、低分子SAR解析ツールと同様に、活性値に大きく影響を与える特異的な部位構造を見つけるためのツールと考えると理解がしやすかったです。
通常SVBで行う解析操作は、バイオインフォマティクスの専門家がデータ解析プログラムを使って行う敷居の高いワークフローです。この操作をGUI上で行えるため、普段ベンチワークを主な業務とする研究員の方にも使いやすいと感じました。著名な研究者であるHugo O Villar博士とMark R. Hansen博士により開発が行われているため、研究プロジェクトに必要な機能が網羅されています。
SVBは専門家が使うことを想定しているため、様々な解析ができる多機能なツールです。この記事では触れていない以下の様な高級な機能がいくつもあります。ご興味のある方はパトコアまでご連絡下さい。トライアルで実際にお試しいただけます。
また、Altoris社の公式ドキュメントサイトもぜひご参照ください。