概要
ケモインフォマティクス
操作性に優れた分子データベース機能を利用して、大規模な分子ライブラリーを取り扱うことが可能です。脱塩、立体構造の立ち上げといった前処理や、物性値、フィンガープリントの算出など一括で処理できます。クラスタリングやQSAR、合成ルールによるコンビケムライブラリーの構築など、ライブラリー設計からリード化合物の探索、リード最適化に至るまでの創薬研究において利用される多くの機能を提供しています。
分子記述子計算
- VSA(van der Waals surface area)記述子
MOE独自の記述子で、logP、モル屈折、電荷の特性に関し、ある一定の特性レンジに入るような分子の表面積を記述子の値として使用します。2次元情報だけから3次元的な特性を算出するので2.5D記述子と言われ、ライブラリーの解析、QSAR/QSPRモデルの構築まで利用できる汎用性の高い記述子です。
- 統計解析プロット
2D相関図、ヒストグラム、相関マトリックスの表示、主成分分析の各成分による3Dプロット、各記述子の相対的な重要性を比較し出力する機能等、算出した記述子を使用してデータベースの統計的な解析と表示を行えます。
記述子の主成分分析によるケミカルスペースの描画
QSAR/QSPRモデル構築
化合物の構造から計算される記述子より、活性予測モデルあるいは物性予測モデルを構築できます。精度のある活性値から作成される線形モデルはリード最適化の段階で有効です。また、比較的粗いデータの処理に適した確率モデルや分類モデルはリード探索の段階で有効です。AutoQuaSAR (AutoQSAR)を用いることで、通常専門家が行う手順を自動化し、ユーザーは分子構造と実験値を入力するだけで適切なQSAR/QSPRモデルを構築できます。
- 線形モデル
回帰分析(PCR、PLS)を行い、記述子と活性値との相関式(線形モデル)を構築します。構築したモデルを使い新規化合物の活性値を予測することができます。Cross Validationによるモデルの検証も行えます。QuaSAR-Evolutionを用いることで、遺伝的アルゴリズムを用いて多数の予測モデルの中より記述子を選択し重回帰分析によりモデル化が可能です。
- 確率モデル(バイナリモデル)
従来の回帰分析ではモデル化の難しい比較的精度の低いデータ、例えばHTS実験で得られる活性の「有る」「無し」というようなバイナリデータ(2値データ)をモデル化する手法として、独自のBinary QSARを搭載しています。Binary QSARは、ベイズの定理をQSARに応用することにより、構造活性相関を確率モデルとして表します。Binary QSARは、実験誤差やアウトライヤーの存在による影響を受けにくく、大量のデータ処理を要求されるリード化合物のスクリーニングにおいて特にその効果を発揮します。
- 分類モデル
記述子のとる値が閾値を超えるか超えないかで分類を行う決定木を作成します。活性のタイプでライブラリーが分類されている場合や、HTS実験から活性の強度で幾つかのクラスに大まかに分類されている場合に、数種のクラスに分類するようなモデルを構築し、サンプルを分類するのに有効です。
MOEsaic
MOEsaic は、合成研究者が活性化合物の構造情報を用いて、構造活性相関 / 構造物性相関解析を行うためのMOE/webアプリケーションです。ウェブブラウザーから、Matched Molecular Pair (MMP)解析やR-group解析を簡単な操作で実行でき、母核・置換基と活性・物性の関係について整理した結果を分かりやすく表示します。以下のような解析機能が搭載されています。
MOEsaic (PDF)
- ■ MMP解析(MMP検索、MMPプロファイル、Interesting MMP)
- ■ 活性クリフ解析
- ■ R-Group解析(R-Group分解、R-Groupプロファイル)
- ■ 部分/類似構造検索
- ■ Free-Wilson解析による新規化合物の提案
- ■ 2次元分子構造アラインメント
- ■ 分子構造スケッチと同時に物性値を予測
- ■ 物性値のプロットとフィルタリング
- ■ Oral Drug、Sweet Spot、Golden Triangleのプロパティモデルによる評価
- ■ カスタムプロパティモデルの追加など、設定変更やカスタマイズが可能
【MOEsaicの解析事例】
ChEMBLから取得したシクロオキシゲナーゼ-2(COX-2)阻害剤のデータセット(648化合物)を用いてMMP検索、MMPプロファイル、R-group分解、Golden TriangleとBOILED-Eggプロパティモデルによる評価を行いました。
- MMP検索
MMP検索は、指定した部分構造だけが異なる分子ペアを高速に検索します。
CHEMBL118のメチル基をクエリーとして、COX2阻害剤をMMP検索した結果。構造式の背景の色は活性値に基づく(緑:高活性~赤:低活性)。
- MMPプロファイル
MMPプロファイルでは、指定した構造変換に対応する分子ペアを網羅的に検索し、構造変換による特性値の変化(活性クリフ)を確認することができます。
MMPプロファイルを用いてベンジル誘導体からフェニル誘導体の構造変換を検索。フェニル誘導体の方がベンジル誘導体に比べて全体にわたって、より高活性であった。
- R-Group分解
R-group分解は、母核と置換基へのフラグメント化を行います。母核と置換基の位置は、MOEsaic中の2Dスケッチャーを使用して指定します。R-group分解を行うと、活性値や物性値と合わせて、置換基-置換基または置換基-母核の組み合わせ表示ができます。
ピラゾール環を持つ母核でR-group分解した後、置換基R2-置換基R3のSARテーブルの表示。マトリックス上のグラフは活性の大きさを示す。
- Golden Triangleを用いた経口薬としての物理化学的特性の評価
Golden Triangleは横軸にlogD、縦軸に分子量をとったプロットです。黄色の三角形の領域に入れば経口薬としての吸収性と排出能が良好であると予測できます。
リファレンス分子CHEMBL118とMMP検索により見出した分子CHEMBL29943の比較。CHEMBL118は領域外だが、親水性置換基が導入されたCHEMBL29943は経口薬としての物理化学的特性を満たした。
- BOILED-Eggモデルを用いた、化合物の腸管吸収と血液脳関門(BBB)透過性の評価
MOEsaicには、独自のカスタムプロパティモデルを追加し、化合物をリアルタイムに評価できます。BOILED-EggはMOEsaic用のカスタムプロパティモデルで、化合物の腸管吸収とBBB透過性を評価します。
COX-2への活性が高い構造のBOILED-Eggでの評価。白領域内の構造は腸管吸収に優れており、黄領域内の構造はBBB透過性に優れている。
Structure-Activity Report(SAReport)
化合物群の分子構造を自動的に母核と置換基に分け、母核・置換基の組み合わせと活性との関係レポートを作成します。入力分子に対する各種グラフのほか、より良い活性が予測された新しい組み合わせもあわせて報告されます。レポートはウェブブラウザで閲覧できるため、プロジェクト内で容易に共有できます。
分子データの標準化
多数の分子構造データを統一的な条件下で取り扱うための標準化機能を搭載しています。多数の分子構造を含むライブラリーに対しても高速に一括処理を行い、素早く解析プロセスに移行できます。また、コマンドラインから利用できるツールもあわせて搭載しており、ライブラリーの管理システムにも容易に組み込めます。
- 分子構造の標準化
分子構造データに含まれる塩・溶媒分子の削除や、pHを指定した水素原子の付加、中性化、結合長の調整といった分子構造の標準化処理が簡単に行えます。3次元構造から適切な2次元構造を抽出することも可能です。
- 分子構造の3次元化
データベース中の分子構造にエネルギー極小化計算を行います。2次元構造からの立体構造立ち上げ時には、独自の4次元Minimizerを用いることで衝突による異常構造を避けた効率のよい3次元構造への変換を行うことができます。
- SDコマンドラインツール
SDファイル(*.sdf)形式に登録された分子構造データに対して各種標準化を行うコマンドを利用できます。大量データのバッチ処理や、管理システムに組み込んだ自動的な標準化処理も容易です。
前処理前後の構造。化合物ライブラリー対して連続計算が可能。
ライブラリー解析
- フィンガープリント計算
規定された特徴の有無によって化合物を表現するフィンガープリントを算出します。MACCSキーによる部分構造フィンガープリント、ファーマコフォアによるフィンガープリント、分子形状によるフィンガープリントの3タイプ11種類を利用できます。フィンガープリントを利用することで大量の化合物データベースに対する類似構造検索やクラスタリングも高速に計算されます。
- ファーマコフォアフィンガープリント
ファーマコフォアのタイプと各ファーマコフォア間の距離で表現されるフィンガープリントで、分子のもつ特性の相対位置の情報を含みます。距離の定義は2次元結合数距離と3次元距離の2種類があります。2次元結合数距離を利用することで、3次元構造に依存しないライブラリーの解析が可能です。
- クラスター解析
記述子や物性値、フィンガープリントをもとにクラスタリングを行うことができます。記述子や物性値に関してはセルベースのクラスタリングを行います。フィンガープリントに関してはJarvis-Patrick法による距離に基づくクラスタリングを行います。
- 類似性・多様性解析
フィンガープリントの類似性を計算し、類似化合物をデータベースから検索します。また、フィンガープリントや記述子の値を使い化合物間の距離を計算し多様性のある部分集合を抽出します。ライブラリーをクラスターに分けている場合は、各クラスターから同数の部分集合を抽出することもできます。
ライブラリー設計
- コンビナトリアルライブラリー機能
化学反応ルールに基づくバーチャルライブラリー構築機能が搭載されています。反応式ファイル(.rxn/.skc/.rdf)とBuilding Block試薬データベースを指定することで、反応式に記載された反応物を試薬データベースの中から自動的に検索し、該当の生成物を構築します。記述子、QSARモデル、ファーマコフォアなどの2D/3Dフィルターを適用し満足する生成物のみ出力できます。本機能にあわせて一般的な反応式と試薬データベースも提供されています。 反応式は2Dスケッチャーを用いて編集可能です。
- RECAP解析/合成
化合物をRECAPルールに基づいて分解し、フラグメントライブラリーを構築します。またこのフラグメントライブラリーをRECAPルールに満足するように組み合わせて、新規バーチャルライブラリーを構築できます。本機能にあわせて12万件のRECAPフラグメントライブラリーも提供されています。
- 多様性バーチャルライブラリー設計
指定した分子数で多様性をもつライブラリーを構築できます。最初に指定した数の分子を構築した後、多様性が十分に大きくなるまで新しい分子を構築してライブラリーの更新を続けます。この手法により、冗長性の低い、多様性をもった任意の大きさのライブラリーを設計することが可能です。活性化合物を指向したライブラリー設計のために、分子量やlogP値での制限や確率モデルを使用したフィルタリングも行えます。
- ライブラリー補間
複数のライブラリーから特性の重複しない化合物を組み合わせ、多様性の大きいライブラリーを作成します。既存のライブラリーに新しい化合物データを追加する際に効率良く化合物を選抜して組み合わせられます。
- PSILO
- タンパク質立体構造情報データベースシステム
- Daylight
- 情報化学システム構築ツール
- Chemotargets CLARITY
- ターゲット・作用機序予測プラットフォーム