【PAT】包括定義に基づく化合物ライブラリのスキャンサムネイル画像

包括定義に基づく化合物ライブラリのスキャン

Ákos Papp

Ákos Papp

CC illustration

大規模な研究用化合物ライブラリをスキャンして、ジェネリック規制(包括規制)に該当する化合物を特定するには、複雑な規制文書をコンピュータで処理可能な形に変換する必要があります。市販の規制化合物チェックソフトウェアでは、規制データベースの専門家がこれらのジェネリックな物質定義を化学的な検索構造クエリー、時には非常に複雑な Markush 構造に変換します。そして検索エンジンが入力化合物と照合します。

規制物質に関する法規におけるジェネリック定義の概要については、こちらの記事をご覧ください。

ジェネリックな構造表現を実現する「 Markush 構造」

創薬および開発プロセスのあらゆる段階――設計、化合物登録、在庫管理、出荷といった工程――において、化合物の状態をモニタリングできることが極めて重要です。この継続的な可視化により、現行規制への適合性を確認するための初期の構造レビューを超えて、新たに導入された法規制についても、化合物が各フェーズを進む際に適用できるようになります。

Markush 構造は、化学的に関連する化合物群を特定するために作られたジェネリックな記述方法です。その最初の応用は Eugene A. Markush によるもので、彼は1924年に米国特許庁へピラゾロン染料の特許を申請する際に、ジェネリックな化学構造を主張しました1。それ以来、Markush 構造は化学特許やその他の分野で広く利用されるようになりました。

構造の不変部分「スキャフォールド」―は、その化合物群に共通する構造的特徴を含んでいます。

可変部分は次のように記述できます:

  1. 置換基の変化 ― ある位置に異なる置換基の集合を列挙すること
  2. 位置の変化 ― 置換基の異なる結合点や位置
  3. 頻度の変化 ― 置換基が鎖や環の一部に複数回出現することを許容すること
  4. ホモロジー群 ― 「aryl」のような共通の構造的特徴を持つ、大規模または理論的には無限の数の部分構造を包含する一般的な命名表現

構造的・化学的多様性の結果、単一の Markush 構造が膨大な化学空間をカバーし、事実上無限の分子を表す可能性があります。

フェンタニル関連物質を規制するジェネリック定義の運用

この Markush 構造への変換は、実際にはどのように見えるのでしょうか。米国におけるフェンタニル誘導体の一般定義の「ポイントB」を変換して、詳しく見てみましょう。2

「フェンタニル関連物質とは、他の管理物質コード番号に分類されていない物質であり、かつ連邦食品・医薬品・化粧品法([21 U.S.C. 355])第505条の下で免除や承認が有効でなく、以下の1つ以上の修飾によりフェンタニルと構造的に関連する物質を意味します。

  1. フェネチル基のフェニル部分を任意の単環で置換すること(単環の内部または外部にさらに置換があるかどうかを問わない)
  2. フェネチル基の内部または外部を、アルキル、アルケニル、アルコキシル、ヒドロキシル、ハロ、ハロアルキル、アミノ、またはニトロ基で置換すること
  3. ピペリジン環の内部または外部を、アルキル、アルケニル、アルコキシル、エステル、エーテル、ヒドロキシル、ハロ、ハロアルキル、アミノ、またはニトロ基で置換すること
  4. アニリン環を任意の芳香族単環で置換すること(芳香族単環の内部または外部にさらに置換があるかどうかを問わない)
  5. N-プロピオニル基を他のアシル基で置換すること」3
CC blog - genericdefinitions-1

フェネチル断片には、置換可能な9つの明確な位置があります。置換基をメチル誘導体および単一型ハロアルキル置換基(–CH₃X、–CH₂X₂、–CHX₃、–CX₄、ただし X = F, Cl, Br, I)に限定した場合、一意の置換基の総数(水素を含む)は26になります。その結果、可能な置換パターンの総数は 26⁹、すなわち約5×10¹² となります。したがって、この制約条件の下では、選択されたフェネチル・スキャフォールドに対して理論的には約5兆通りの置換パターンが存在します。

このジェネリック定義の全範囲を考慮すると、対象となる化学空間を効率的に検索するには、この組合せの複雑性を処理できる高度なアルゴリズムが必要であることが明らかになります。

ジェネリック定義を処理するという観点では、Markush 構造を効率的に検索するための専用アルゴリズムの開発が不可欠ですが、それだけでは十分ではありません。現在使用されている一部のジェネリック定義は従来の Markush 構造表記では十分に表現できないため、正確な構造表現を実現するには、スクリプト機能を備えたケモインフォマティクス用ツールボックスも必要です。

商用の規制物質識別ソフトウェアでは、専門家チームがジェネリックな定義を適切な Markush 構造に解釈し、それを用いて単一のエントリまたは構造リストに対するヒットをワンクリックで特定できるようにしています。

Compliance Checker を用いた事例研究

ChEMBL 35 におけるフェンタニル誘導体

私たちは、医薬品様特性を持つ分子を収録したライブラリやデータベースにフェンタニル関連化合物が含まれているかどうかに関心を持ちました。その検証のため、約250万件の化合物を収録した手作業でキュレーションされたライブラリである ChEMBL 35 を調査し、フェンタニル関連分子の特定を試みました。この大規模なデータベースを利用することで、Compliance Checker の性能を検証することも可能となります。これは、多くの製薬ライブラリと同等であり、ソフトウェアが「現実の世界」でどのように機能するかを示す点で有用です。

実験は、対象規制の全範囲に対して Compliance Checker SaaS Premium サブスクリプションを用いて実施されました。コンプライアンスチェックに先立ち、分子データベースは前処理を行いました。具体的には、塩や溶媒の除去、重複構造の削除を行い、分子量が120 Daから1200 Daの範囲にある分子のみを残しました。合計で約231.8万件の構造が評価されました。

スクリーニングは3時間以内に完了し、以下の数のフェンタニル誘導体が検出されました:

Singapore

1108

Denmark

30

Switzerland

458

France

27

United States

214

Canada

26

United Kingdom

183

Germany

25

Italy

169

Yellow List

25

結果は、個々の誘導体をリスト化して規制している国々の法制度が、比較的一貫していることを示しています。しかし、包括的な定義を用いて規制している国々では、大きなばらつきが見られ、異なる化学的範囲をカバーしています。その理由は推測にとどまりますが、著者の考えでは、フェンタニルの製造が比較的容易であるため、新たな「合法的」誘導体で需要を満たす必要性が直ちには生じていないことが一因かもしれません。

ChEMBL 35 における合成カンナビノイド

これは合成カンナビノイドの状況とは著しく対照的です。合成カンナビノイドにおいては、いわゆる「リーガルハイ」の製造業者と規制当局、特に英国において、長期綱引きが展開されてきました。2000年代、特にその後半における合成カンナビノイド類似体の急増は、これらの物質の法的定義に大きな変化をもたらしました。これらの新しい化合物が英国の街頭で頻繁に出現するようになるにつれ、第3世代の合成カンナビノイドを包括するため、広範かつjな定義が導入されました。

その結果として、1971年の Misuse of Drugs Act(薬物乱用法)を改正した The Misuse of Drugs (Amendment) (England, Wales, and Scotland) Regulations 2016 が施行されるに至りました。

該当件数

規制

BE

8672

Synthethishe cannabinoiden ...

IT

5120

Analoghi di struttura deriventi da INDOL-3-CARBOSSAMIDE ...

SG

4782

indole-2/3-carboxamide/carboxaldehyde/carboxylic acid に構造的に由来する任意の化合物

UK

3754

第3世代合成カンナビノイド

CA

3094

3-(1-naphthoyl)indole 構造を持つ任意の物質(置換の有無を問わず)

NL

2562

Stofgroep: Cannabimimetica / Synthetische cannabinoïden

ChEMBL35 データセットに含まれる 250 万種の化合物のうち、各国のカンナビノイドジェネリック規制(包括規制)によって規制対象とされた物質

この差異は、各国における国内法を正しく理解することの重要性を浮き彫りにしています。

まとめ

ライフサイエンス分野の研究開発が、アウトソーシング、協働、外部化によってますますグローバル化する中で、この認識は製薬業界においてかつてないほど重要になっています。合成、化合物管理、試験業務は現在国際的に分散して行われており、化合物を適切な試験施設へ迅速かつ効率的に国境を越えて輸送することに大きく依存しています。したがって、各地域における微量規制や研究用途の免除に関する知識を背景に、規制対象化合物の特定を容易に管理できることが重要となります。

パフォーマンスに関連して前述したように、Compliance Checker は 230 万件のユニークな構造を対象に、18 か国にわたっておよそ 3 時間で処理を完了したことは特筆に値します。製薬業界においてこれは、500 万件規模の化合物を含むような大規模ライブラリであっても、週末の間に世界的な法規制に照らして効率的にスクリーニングできることを意味します。その結果に基づき、必要に応じて化合物を会社の方針に従ってフラグ付けしたり、除外したりすることが可能となります。

参考文献

  1. https://worldwide.espacenet.com/publicationDetails/biblio?CC=US&NR=1506316&KC=&FT=E&locale=en_EP

  2. https://www.ecfr.gov/on/2024-12-31/title-21/chapter-II/part-1308

  3. https://www.deadiversion.usdoj.gov/drug_chem_info/frs.pdf

  4. https://www.bundesgesundheitsministerium.de/fileadmin/Dateien/ 3_Downloads/Gesetze_und_Verordnungen/GuV/N/NpSG_englisch.pdf
  5. https://www.ebi.ac.uk/chembl/
Ákos Papp
執筆者:Ákos Papp
シニア プロダクトマネージャー アーコシュ・パップは化学工学を専攻し、ブダペスト工科大学の化学工学科を卒業した化学エンジニアです。 彼のキャリアを通じて、一貫してケモインフォマティクスの分野に携わり、ソフトウェア開発の立場とユーザーの立場の両面から経験を積んできました。 2008年にChemAxonへ入社して以来、Marvin、化合物登録、バイオロジクス登録など複数のプロジェクトに関わり、現在はCompliance Checker、cHemTS、そしてJChem for Officeのプロダクトマネージャーを務めています。

一覧ページへ戻る

RELATED

関連記事はこちら

Contact

お問い合わせ

製薬・バイオテクノロジーのDXならパトコアにおまかせください