過去のセミナー・トレーニングをご覧いただけます。
- 2020年1月14日
-
MOEフォーラム2020開催のご案内
統合計算化学システム「MOE」の最新情報と応用事例をご紹介する「MOE フォーラム2020」を、2020年9月4日(金)に開催いたします。
MOEフォーラム 2020 の詳細へのリンク
MOEフォーラム2020開催のご案内統合計算化学システム「MOE」の最新情報と応用事例をご紹介する「MOE フォーラム2020」を、2020年9月4日(金)に開催いたします。 |
創薬研究におけるMOEの活用
遠藤 真弓
(大正製薬株式会社)
Abstract: 弊社では、約30年にわたり、創薬研究に分子シミュレーションやX線結晶構造解析によるSBDDを活用し、リード探索や最適化といった創薬プロセスの効率化に取り組んできた。1999年より薬物分子設計のツールとしてMOEを使用し、SBDD実行の効率化に活用している。
本講演では、「AIとSBDDを活用したリード最適化」と「分子シミュレーションにおける前処理と結果解析」におけるMOEの活用方法ついて紹介する。
Drug Discovery with MOE:AI and SBDD applications
Mayumi Endo (Taisho Pharmaceutical Co., Ltd.)
Abstract:
For about thirty years, our group has pursued SBDD by applying molecular simulation and X-ray crystallography to drug discovery research aiming to improve the efficiency of lead generation and optimization.
Since 1999, we have been using MOE as a tool to improve the efficiency of the SBDD process. In this talk, I will describe how we use MOE for lead optimization using AI and SBDD and for preparation and result analysis in molecular simulation such as molecular dynamics and FMO (Fragment Molecular Orbital) calculations.
REINVENTのMOEインターフェースの紹介
木村 嘉朗
(株式会社モルシス)
Abstract: MOEのREINVENT インターフェースについて、機能と使用例について紹介します。REINVENT1)はプログラミング言語pythonで実装されたRecurrent Neural NetworkをベースとしたSMILES生成モデルです。化合物ライブラリーから教師あり学習により得られたモデルを、さらにフィンガープリントによる類似度、活性予測モデルなどを評価関数として取り入れた強化学習により調整できます。MOEのREINVENT インターフェースでは、MOE上からREINVENTを実行するための使いやすいGUIとともに以下の機能を提供します。
Introduction to MOE Interface to REINVENT
Yoshirou Kimura (MOLSIS inc.)
Abstract: I would like to introduce features and usage examples of MOE interface to REINVENT. REINVENT1) is SMILES generative model based on Recurrent Neural Network implemented in programming language Python. Models supervised-learned by compound library can be further adjusted by reinforcement learning that incorporates scoring functions such as fingerprint similarity and activity prediction models. MOE Interface to REINVENT provides the following features along with an easy-to-use GUI.
Toward prediction of molecular properties of bRo5 compounds by multicanonical MD simulations
Satoshi Ono (Mitsubishi Tanabe Pharma Corporation)
Abstract: Efficient conformational sampling of bRo5 (beyond rule of five) compounds, like cyclic peptides and PROTACs, is an emerging interest for assigning physical properties, such as cell permeability and solubility. There are many conformational sampling methods ranging from molecular mechanics, molecular dynamics simulations, quantum mechanical calculations, and their variants. Among them, we chose multicanonical molecular dynamics (McMD) simulations, one of the enhanced sampling methods, which can sample any metastable states in theory. This method was applied to cyclic hexapeptide diastereomers in explicit cyclohexane, chloroform, and water. Detailed analysis of the free-energy landscapes and intramolecular hydrogen bond (IMHB) patterns at T = 300 K in each solvent revealed that permeable compounds have different structural profiles even for a single stereo-isomeric change. In addition, the average solvent-accessible surface area (SASA) in cyclohexane showed excellent correlation with cell permeability. Unexpectedly, the average polar surface area did not correlate with cell permeability in those solvents. Based on these results, explicit cyclohexane is suitable as a solvent that mimic the membrane interior environment. Additionally, average SASA in water showed moderate correlation with solubility. These finding will be useful for assessing the conformation and molecular properties of newly designed cyclic peptides.
マルチカノニカルMDシミュレーションによる中分子の物性予測に向けて
小野 聡
(田辺三菱製薬株式会社)
Abstract: Abstract: 環状ペプチドやPROTACsのような中分子化合物(bRo5: beyond rule of 5)の細胞透過性や溶解度などの物理的性質を評価するためには各種環境下(水中、膜中など)における立体構造をいかに効率的にサンプリングするかが重要になる。立体配座探索には分子力学(MM)、分子動力学シミュレーション(MD)や量子力学計算(QM)など各種手法が用いられ、多くの立体配座サンプリング法が使われている。それらの中で我々は拡張アンサンブル法の1つである、マルチカノニカル分子動力学(McMD)シミュレーションを用いた。この手法をシクロヘキサン、クロロホルム及び水中で立体の異なる8個の6残基環状ペプチドに適用した。各溶媒中のT=300 Kでの自由エネルギー地形や分子内水素結合(IMHB)パターンの詳細な解析から、一か所立体が異なるだけで異なる膜透過様式を持つことを明らかにした。さらに、シクロヘキサン中の平均溶媒接触可能表面積(SASA)は細胞透過性と良い相関を示した。予想に反して、平均極性表面積(PSA)は細胞透過性と相関しなかった。これらの結果から膜中を模倣する溶媒は一般的に使われているクロロホルム中よりもシクロヘキサン中の方が適していることが分かった。また、水中の平均SASAは溶解度と中程度の相関を示した。これらの知見は新たにデザインした環状ペプチドの立体配座と物性予測に有用であると考えている。
Customizing applicability domain of a machine learning model using transfer learning
Tomohiro Sato (Yokohama City University)
Abstract: Recently, prediction models based on machine learning techniques such as deep neural network are routinely applied in drug discovery studies. MOE implemented the descriptor calculation functions for small molecules, proteins, and the complexes; which enable the construction of machine learning models by combination with statistical packages like R, Scikit-learn, and Tensorflow.
We previously reported the construction of AMED cardiotoxicity database which integrated the information of small molecule hERG inhibitors from various public data sources and in house assay data measured in RIKEN, and built a hERG prediction model based on the data set. The model employed a genetic algorithm-based descriptor selection and Support Vector Machine, resulting in the prediction performance of kappa statistics of 0.733 and accuracy of 0.984 for the test set compounds, which exceeded those by commercially available hERG prediction models.
On the other hand, applicability domain is known as an important issue for machine learning models. The prediction performance of the AMED hERG model was also found to decrease when applied to structurally novel chemical series. In current AMED DAIIA project, we are trying to apply transfer learning technique to customize the applicability domain of a deep neural network model to novel chemical series by additional learning of novel data. The details of the AMED hERG model and preliminary results of the transfer learning-based models are to be presented.
転移学習を用いた活性予測モデルの新規化合物シリーズに対する
モデル適用性の改善
佐藤 朋広
(横浜市立大学 生命医科学研究科)
Abstract: 近年、深層学習に代表される機械学習を用いた予測は創薬分野においても様々な形で利用されている。MOEに関しても化合物、タンパク質、複合体構造に対する多様な記述子の計算機能が実装されており、R・python等の任意の統計ライブラリーと組み合わせることで生体分子に対する機械学習モデルの実装が可能となる。
我々は2015~2019年度に実施したAMED創薬インフォマティクス事業において低分子化合物の心毒性リスクの予測を目的としてChEMBL, PubChem等の公共データベースおよび理化学研究所にて測定したアッセイ結果を統合することで約30万化合物のhERG阻害情報を収載したデータベース、および、それに基づくhERG阻害活性予測モデルを構築した。本予測モデルは遺伝的アルゴリズムを用いた記述子選択とSupport Vector Machineによる判別分析を組み合わせることで、テスト化合物セットに対して正答率98.4%、Kappa統計量0.733を記録し、市販されているhERG予測モデルを大きく上回る予測精度を達成した。
一方で、機械学習を用いた予測モデルの弱点として予測適用範囲が学習データに強く依存することが知られており、上記hERG予測モデルに関しても新規性の高い化合物に対しては予測精度が不可避に低下してしまうという問題が確認されている。現在我々はAMED産学連携による次世代創薬AI開発事業の一環として、深層学習を用いた予測モデルについて予測適用範囲外の新規化合物シリーズに対する予測精度を新規データの追加学習による転移学習効果によって向上させる手法の開発を行っている。本講演では上記のhERG阻害活性予測モデルの詳細および、転移学習によるモデル適用性の改善技術の検証状況について発表を予定している。
Medicinal chemistry on anti-cancer and anti-virus agents utilizing molecular modeling calculation with MOE
Hirokazu Tamamura (Tokyo Medical and Dental University)
Abstract: In the present studies on medicinal chemistry, development of high molecular weight compounds such as various monoclonal antibodies concerned to molecular target drugs has been rising in addition to development of conventional low molecular weight compounds. In this situation, pharmaceutical development of peptide compounds as mid-size drugs that are located between low and high molecular weight compounds are desired. Particularly, cyclic peptide derivatives have become new drug modalities. So far, many peptidomimetics, which mimic peptide structures, have been developed and used in medicinal chemistry. Our laboratory has been developing several anti-cancer and anti-virus agents based on low molecular weight compounds and peptidomimetics. Phase III clinical trials of one compound are now in progress. In these studies, molecular design and structure-activity relationship studies have been performed utilizing molecular modeling calculation with MOE based on structures with target proteins by X-ray crystallography. In this lecture, medicinal chemistry on anti-cancer and anti-virus agents, which have been studied in our laboratory, will be introduced.
分子モデリング計算MOEを活用した抗がん・抗ウイルス剤の創薬研究
玉村 啓和
(東京医科歯科大学 生体材料工学研究所)
Abstract: 現在の創薬研究は、従来通りの低分子化合物をターゲットとした研究に加えて、最近では分子標的薬を意識し、種々のモノクローナル抗体等の高分子化合物の創製研究が台頭してきている。このような状況下、分子サイズ的に低分子と高分子の間に位置する中分子化合物として、ペプチド性化合物の創薬への期待が増している。特に、環状ペプチド誘導体はくすりの新しいモダリティとなっている。また、これまでにペプチドの構造を模倣したペプチドミメティックが多数開発され、創薬研究に用いられている。我々の研究室では長年、低分子化合物とペプチドミメティックを基盤として、抗がん剤・抗ウイルス剤等の創製研究を行ってきている。その中には、臨床試験の第III相へ進んでいるものもある。その際、研究過程で、標的タンパク質とのX線結晶構造解析を基にMOEを利用して分子モデリング計算を行い、化合物のデザインや構造活性相関の考察を行うことが多い。本講演では我々が行ってきた、がん、HIV 感染症等の疾病に対する創薬リード化合物の創製研究について紹介したい。
Trials with MOE: various joint research and idea implementation
Shinya Nakamura (Kindai University)
Abstract: In this presentation, several collaborative researches involved in using MOE in various fields, as well as tools and implementation examples under development using MOE's SVL, will be introduced in an omnibus format. As examples of the co-research, rationalization of the SAR of assayed compounds, conversion of substrate specificity using artificially modified enzymes, and drug repositioning of approved drug for new targets, would be introduced based on actual examples. In addition, the Fragment Molecular Orbital (FMO) method enables precise interactions at the quantum chemical level even with large molecules such as proteins. We are investigating a computational scheme to make FMO method a routine analysis method at the PC level without large computers. The visualization tool currently under development to support for decision of the calculation scheme would be shown. As much as time permits, other examples listed below would be presented; the application of the Ultrafast Shape Recognition (USR) method to compare shapes between molecules for our virtual screening methods SDOVS, and the Interaction Entropy method which is a simple correction of the entropy term to the MM-PB/SA method as current usual method to estimate the binding free energy.
MOEでやってみた様々な共同研究とアイデアの実装
中村 真也
(近畿大学 薬学部)
Abstract: 本発表では、MOEを利用して携わった様々な分野の共同研究や、MOEのSVLを用いて開発中のツールや実装例などをオムニバス形式で紹介する。共同研究の例として、既存化合物群の構造活性相関の理論付け、人工改変酵素による基質特異性の変換、新規ターゲットに対する既存薬のドラッグリポジショニングについて実例を踏まえて紹介する。また我々の取り組みとして、タンパク質のような巨大分子でも量子化学レベルでの精密な相互作用が可能なフラグメント分子軌道法(FMO法)を大型計算機なしにパソコンレベルの日常的な解析手法とするための計算スキームを検討中であるが、その中で現在開発中の図示化ツールの例、バーチャルスクリーニング法のひとつであるSDOVS法で行う分子間の形状比較にUltrafast Shape Recognition (USR) 法を導入した例、結合自由エネルギーの計算法として現在汎用されているMM-PB/SA法に簡便にエントロピー項の補正として加えるInteraction Entropy法の実装した例など時間の許す限り紹介を行う。
Design of covalent peptide binders toward antibody and its application for development of antibody drug
Yuji Ito (Kagoshima University)
Abstract: For antibody labeling by chemical modification, the methods of randomly modifying ε-amino group of Lys residues on the surface of antibody or modifying thiol groups of Cys residues exposed after reducing the SS bond in the hinge portion of antibody has been generally used. However, such modification methods have concerns to disturb the antigen-binding ability and the stability of the antibody, depending on the modification sites. In this presentation, I will introduce a site-specific chemical conjugation method called CCAP (Chemical Conjugation by Affinity Peptide), which enable to label antibodies site-specifically with functional molecules/chemical groups via Fc-specific affinity peptides, and also its application for antibody drugs to higher functionality, interweaving molecular design of the CCAP reagent using MOE software.
We had isolated a human IgG Fc-specific 17-residues’ peptide (IgG-binding peptide, IgG-BP) from a random peptide phage library and performed X-ray crystallographic analysis of the complex. The results revealed that two IgG-BP symmetrically bound to Fc on the boundary region between CH2 and CH3. Based on this structure, we designed CCAP reagent which can make a covalent linkage to a specific Lys residue on Fc, using MOE software. Arg8 of IgG-BP in the complex is replaced with Lys, whose ε-amino group is linked to Lys248 on Fc by an appropriate crosslinker. To confirm this design, CCAP reagent whose side chain of Lys8 was modified with N-succinimidyl glutarate was prepared and reacted with antibody. The result indicated tLys 248 residue were very efficiently modified according to design. This method was also adopted to the design of CCAP reagent of Protein A-derived peptide called Z34C.
CCAP method make it possible to form a conjugate between the antibody and the peptide rapidly and quantitatively by simply mixing the antibody and CCAP reagent. Therefore, if the CCAP reagent was in advance attached to a functional molecule or chemical group, antibody can be easily functionalized in a site-specific manner. As an application of this method for drug development, antibody drug conjugate (ADC) and PET imaging probe attached with metal chelator will be presented.
Database AutoPH4: pharmacophore analysis of multiple protein structures
Chris Williams (Chemical Computing Group ULC)
Abstract: An automated approach to summarize pocket shapes and binding hot-spots from a collection of protein structures is presented. Pocket shapes are described using pocket volumes derived from Alpha Sites and molecular surfaces. Binding hot-spots are located using pharmacophore features generated by AutoPH4. Collections of pocket volumes and pharmacophores are analyzed using feature densities which map onto a universal grid the fraction of structures that possess a given feature at each point in space. Regions with high pharmacophore feature densities identify the most persistent interaction binding hot-spots over the collection of structures. Pocket volume densities detect and classify binding site regions into core pockets and sub-pocket regions. Fingerprints that represent pocket shape, sub-pocket presence and pharmacophore feature presence are derived and used to cluster and classify multiple protein structures using standard fingerprint clustering tools. Application of the method to fragment-based drug design, minor pocket detection, selectivity mapping, binding-mode classification and custom docking scoring function creation is presented.
抗体に対する共有結合ペプチドの設計と抗体医薬品開発への応用
伊東 祐二
(鹿児島大学 理工学域理学系)
Abstract: 化学修飾による抗体の標識には、一般的には、抗体分子表面に存在するLysのアミノ基をランダムに修飾する方法や、抗体のヒンジ部のSS結合を還元して露出したCysのチオール修飾法が主に用いられてきた。しかし、このような修飾法は、修飾部位によっては抗体の抗原結合能や安定性を損なうことが懸念される。本発表では、ヒトIgGのFc領域に特異的に結合する親和性ペプチドを介して、機能性分子を部位特異的に抗体に付加する手法であるChemical Conjugation by Affinity Peptide (CCAP)法と、CCAP法を用いた抗体医薬品の高機能化への応用について、MOEを使った分子デザイン手法を織り交ぜながら、紹介したい。
我々は、ランダムペプチドファージライブラリからヒトIgGのFcに特異的に結合する17残基のペプチド(IgG結合ペプチド、IgG-BP)を単離し、そのFcとの複合体のX線結晶解析を行った。その結果、IgG-BPは、Fc上のCH2-CH3との境界領域に2分子結合することを明らかにした。この構造を元に、Fc上の特定のLys残基を標的に、共有結合で連結できるCCAP試薬のデザインを、MOEを用いて行った。複合体におけるIgG-BPのArg8をLysに置換し、このεアミノ基と標的であるFcのLys248のεアミノ基間を、適当なクロスリンカーで結ぶ分子デザインを行った。実際に、このデザインが有効であるかを確認するため、IgG-BPのLys8の側鎖に、N-succinimidyl glutarate基で修飾した試薬を調製し、抗体との反応を行った。その結果、デザイン通りに、2つの残基が、共有結合で連結されることを実験的に確認した。この連結手法は、Z34Cと呼ばれるプロテインA由来のペプチドをベースにしたCCAP試薬のデザインにも適用された。
CCAP法は、抗体とCCAP試薬を混合するだけで、短時間で定量的に、抗体とペプチド間の共有結合による連結体(コンジュゲート)を生成する。このため、前もって、CCAP試薬に機能性の分子、例えば、蛍光剤やビオチン、抗癌剤や金属キレータ等の機能性分子、あるいは機能性官能基(クリック反応のアジド基やDBCO基など)を連結しておけば、抗体に機能性の分子を、部位特異的に付加することが可能となる。この医薬品開発への応用として、ガン細胞を認識する抗体医薬品に抗癌剤を連結した抗体薬物複合体や金属キレータを付加したPETイメージング用プローブの調製についてお話しする。
蛋白質配列から創薬に必要な情報を読み取るリテラシーとは
=MOEをより有効に利用するために=
白井 宏樹(アステラス製薬株式会社)
Abstract: 創薬研究は様々な階層での“意思決定“が連続的に行われる。あるプロジェクトを進めるのか中止するのか、といった大きな決定もあれば、今実験室で得たデータを踏まえ、では次にどのような実験を行うのか、という小さな決定まで、実に様々である。創薬研究は学際研究の典型であるため、このような意思決定には、異なる専門性をもった研究者が行う個別の分析を持ち寄って多角的な検討がなされる。この枠組みの中でMOEを扱う研究者は、蛋白質情報に関しての”情報分析屋“としての役割を担っていると考えることが出来よう。
医薬品標的は依然として概ね蛋白質であり、また昨今は蛋白質自体をモダリティあるいはその一部とする医薬品も増加していることから、創薬において蛋白質科学は、さらに重要性が増している。そして蛋白質科学は新たな局面を迎えている。超分子複合体の構造や動的構造の解析、相分離現象をはじめとするコロイド状態の分析、情報・計算科学による分析などが急進しているのである。このような背景により、MOEユーザこと蛋白質の情報分析屋が“意思決定”に提供する分析内容も、時代への適応と先端科学の恩恵の最大活用を模索せねばならない。以上を踏まえ、創薬研究における蛋白質配列から読み取れるリテラシーとは何か、について議論したい。
Considering what’s the literacy to extract useful information for drug discovery from amino acid sequence
=In order to use MOE more effectively=
Hiroki Shirai ( Astellas Pharma Inc. )
Abstract: In drug discovery research, "decision making" is continuously performed in various layers. There are big decisions such as whether to go on or terminate a project, and even small decisions such as what kind of experiment will be conducted next based on the data obtained in the laboratory. Since drug discovery research is typical of interdisciplinary research, such decision-making is subject to multi-faceted examination with individual analyzes conducted by researchers with different expertise. Within this framework, researchers dealing with MOE can be considered to play a role as an "information analyst" with respect to protein information.
Since the drug target is still mostly proteins, and the number of drugs that use the protein itself as a modality or a part thereof is also increasing these days, protein science has become more important in drug discovery. And protein science is entering a new phase. Rapid progress occurs in the analyses of the protein machinery structure, dynamic structure, and colloidal states including phase separation phenomena, and also in the analyses using data science and molecular simulation. Based on this background, the analysis provided by MOE users, ie, protein information analysts, to “decision making” is coming to give more impact. Importantly, they should adapt to and maximize the benefits from recent advance of protein science. Based on the above, I would like to discuss what is literacy that can be read from protein sequences in drug discovery research.
Quantum Structural Life Science by Combining FMO and Structural Biology
Kaori Fukuzawa
( Hoshi university / Tohoku University )
Abstract: Quantum chemical calculations of proteins and nucleic acids using fragment molecular orbital (FMO) methods have evolved significantly in the last two decades in terms of methodology and computational software. Nowadays, it is possible to perform these calculations easily using computers in laboratories. In life science research, it is also possible to construct logic through repeated discussions with structural biologists. In fact, in some cases, FMO calculations are performed to validate the structures before they are registered in the Protein Data Bank (PDB). The FMO Drug Discovery Consortium, an industry-academia-government collaboration, aims to develop high-performance drug discovery technologies based on FMO methods. We mainly evaluate the activity value, binding specificity and target selectivity based on the crystal structure of the complex. The consortium is also developing FMO drug discovery methods such as prediction of interaction energy by machine learning and application to AI. Even in cases where the crystal structure of the complex is not available, FMO calculations are performed on structures sampled from molecular dynamics calculations using MOE-based modeling or docking structures as the initial structure, in an attempt to predict binding poses and binding affinities.
We have also made the "FMO Database" available to the public (http://drugdesign.riken.jp/FMODB/) in order to make good use of these massive computational results. From this April, a special COVID-19 page in collaboration with the Protein Data Bank of Japan (PDBj) was launched, and data are updated every two weeks. As of August 2020, the entire FMO database had 2,659 structures (1,162 unique PDBs) available to the public. All calculations hold interaction energy data based on the FMO method, and it is hoped that these will be useful for the development of new drugs, including those for the treatment of COVID-19.
Research on pocket prediction using 3D-CNN
Takeshi Baba, Ph.D. (Toray Industries, Inc.)
Abstract:
1. Introduction
In-silico screening is a rapid search method for ligand candidates using proteins and ligand-binding candidate pockets. On the other hand, it generally takes a long time to determine the ligand-bind candidate pockets by experiments. To solve this problem, we implemented the computer program called “deepsite” to find the accurate ligand-bind candidate pocket rapidly1.
2. Methods
In this research, we focused on 3D convolutional neural network (3D CNN) technology to make the program. We took three-dimensional structure of protein as the three-dimensional image. To carry out 3D CNN, we used Hydrophobic, Aromatic, Hydrogen bond acceptor, Hydrogen bond donor, Positive ionizable, Negative ionizable, Metal, Excluded volume as a feature value. For the pocket prediction, we firstly prepared the cubic (16Å×16Å×16Å) called “subgrid” from the box containing the whole structure of protein. In addition, we divided each subgrid into voxels of 1Å×1Å×1Å and occupancies of each grid is obtained from the following equation:
where rvdW is the van der Waals radius of each atom. Here r is the distance between the atom coordinate and the center of voxel. After that, we did the prediction whether each subgrid contains a ligand binding pocket or not. In this research, a distance between the center of the ligand and the center of the subgrid less than 4 Å is defined as “Pocket positive”, and a distance greater than 4 Å is defined as “Pocket negative”. We used scPDB2017 data sets to develop the program2.
3. Results and Discussion
To investigate the efficacy of deepsite, we examined the predictive performance of proteins that are already known to contain allosteric sites or cryptic sites. The results showed that allosteric sites could predict pockets in all systems and cryptic sites in 2/3. This result indicates that deepsite can predict pockets with high accuracy. On the other hand, some cryptic sites could not predict pockets. This failure is probably due to the inclusion of the excluded volume term in the descriptors used for deepsite. In order to improve the prediction accuracy of cryptic sites, we need to change other descriptors or training sets.
4. Acknowledgment
Part of this research was carried out as activities of Life Intelligence Consortium (LINC) and was made by the computational resources from Riken. We deeply thanks to the opportunity to do this research.
5. References
1. Jiménez, J., Doerr, S., Martínez-Rosell, G., Rose, A. S., & De Fabritiis, G. Bioinformatics, 33(19), 3036-3042, (2017).
2. Jérémy Desaphy, Guillaume Bret, Didier Rognan, Esther Kellenberger, Nucleic Acids Research, Volume 43, Issue D1, D399–D404, (2015).
FMOと構造生物学の融合による量子構造生命科学
福澤 薫
(星薬科大学薬学部/東北大学大学院工学研究科)
Abstract: タンパク質や核酸の量子化学計算は、フラグメント分子軌道 (FMO) 法によって、この20年で方法論と計算ソフトウェアが大幅に発展し、現在では各研究室の計算機を用いても手軽に計算を行うことができる。生命科学研究においても、構造生物学者と議論を繰り返しながらの論理構築が可能な段階にきており、Protein Data Bank (PDB) の登録前にFMO計算を行って検証する例もある。FMO法に基づく高性能な創薬技術開発を目指した産学官連携の「FMO創薬コンソーシアム」では、主に複合体の結晶構造に基づいて活性値予測や結合特異性、ターゲット選択性などの評価を行い、また機械学習による相互作用エネルギー予測やAIへの展開などのFMO創薬手法の開発を行っている。複合体の結晶構造が得られていないケースにおいても、MOEを用いたモデリングやドッキング構造に対する分子動力学計算からサンプリングした構造に対してFMO計算を行い、結合ポーズと結合親和性を予測する試みを始めている。
我々はまた、これらの膨大な計算結果を有効活用するために「FMOデータベース」を一般公開している (http://drugdesign.riken.jp/FMODB/)。この4月からは日本蛋白質構造データバンク(PDBj)と連携したCOVID-19特集ページを開設し、2週間ごとにデータを更新している。FMOデータベース全体として、2020年8月の時点で2,659構造(固有PDB数1,162)を公開している。全ての計算結果はFMOに基づく相互作用データを保持しており、これらがCOVID-19の治療薬を始めとする新薬の開発に役立つことが期待される。
HLAに特化したモデリングツールと抗原性ペプチド予測ツールの開発
甘利 真司(株式会社モルシス)
Abstract: ヒト白血球抗原 (human leukocyte antigen, HLA) はヒト免疫機構において重要な分子であり、27,980種類のユニークなアレルが報告されている (2020年7月現在)。免疫反応はHLAに結合する8~20残基程度のペプチドによって誘発され、HLAによりT細胞に抗原提示される。特定のHLAに対して高い結合能を持つペプチドが得られれば、感染症やアレルギー性疾患などの原因や治療法の開発につながる可能性がある。しかしながら、HLAとペプチドの複合体の構造決定することや、HLAと結合する膨大な数のペプチド配列を実験的に検出することは非常に困難である。そのため、我々は、HLAの免疫機構における役割を解析するために22種類のツール、HLA-ModelerとHLABAPを開発した。
HLA分子構造モデリング・システムHLA-Modelerは、HLA (Class I及びII)分子とそれに結合するペプチドの立体構造を半自動で予測・評価する。その精度を検証するために、立体構造が既知である複数の HLAアレル について、一次構造に基づいて作成されたホモロジー・モデルとX 線結晶構造の互いに対応する非水素原子座標の平均二乗偏差(RMSD)を計算したところ、RMSD値は十分に小さく、このシステムで構築した立体構造が機能解析の研究を実用的に行う上で十分に正確であることが示された。
HLA結合抗原性ペプチド予測プログラムHLABAP (HLA Class I-Binding Antigenic Peptide Predictor)は、HLAに結合する任意のペプチドの結合強度を予測し、親和性の高いペプチド配列を提案する。動作検証を行ったところ、HLA-A*02:01においてContact Energyスコアを用いて、約4,000の候補ペプチドから効率よく結合能の高いペプチドを選別できることが示された。
Development of Tools to Build Model and
Predict Antigenic Peptide for HLA
Shinji Amari (MOLSIS Inc.)
Abstract: Human leukocyte antigen (HLA) plays an important role in the human immune system, and 27,980 unique alleles have been discovered as of July 2020. The immune response is elicited by a peptide of about 8 to 20 residues that binds to HLA, and HLA presents the antigen to T cells. If peptides that have a high binding ability to the HLA allele related to a specific disease (infectious disease, allergic disease, cancer, etc.) can be identified, it may lead to the development of therapeutics for those diseases. However, it is very difficult to determine the structure of the HLA-peptide complex and detect a huge number of peptide sequences that bind to HLA experimentally. Therefore, we have developed two types of tools, HLA-Modeler and HLABAP, to analyze the role of HLA in the immune mechanism.
HLA-Modeler, HLA molecular structure (Class I and II) modeling system, semi-automatically models and evaluates the 3D structures of complexes of HLA molecules and peptides. As for verifying the precision of modeling, we calculated the root mean square deviation (RMSD) between the homology models and the X-ray crystal structures. As a result, calculated RMSD values were sufficiently small, and it was shown that the 3D structures modeled by this system are practical and sufficiently accurate.
HLABAP (HLA Class I-Binding Antigenic Peptide Predictor), a program for predicting HLA-binding antigenic peptides, predicts the affinity of any peptides that bind to HLA and suggests high-affinity peptide sequences. It was shown that peptides with high affinity can be efficiently selected from about 4,000 candidate peptides for HLA-A*02:01 using the Contact Energy score.
Introduction to PSILO
Yoshirou Kimura (MOLSIS Inc.)
Abstract: PSILO is a database management system for protein–ligand complex structures with a web-based interface. It organizes protein structure data, makes them searchable with various queries, and allows researchers to share the protein structure data. In this session, we will introduce various functionalities of PSILO with some examples.
PSILO has various functionalities that meet the needs of specialists such as computational chemists, medicinal chemists, and structural biologists. For computational chemists, there is a complex search functionality based on various queries such as keywords, homologous sequences, 3D-interactions, protein-like pockets, etc., which enables efficient access to protein structure data. For medicinal chemists, there is a functionality to superimpose based on the ligand-binding site of the protein family understudy, ligand structure, pocket similarity, etc. and the result can be confirmed with the 3D structure viewer. For structural biologists, in addition to PDB format files, there is a functionality to manage protein structure data by associating multiple structure factor files, scaling log files, scaling data files, TLS parameter files, and so on. Data registration supports GUI and batch processing, and you can define your registration format with an XML file. For system administrators, there is a functionality to set access authority to data for each user, so that necessary security can be ensured.
PSILOの紹介
木村 嘉朗(株式会社モルシス)
Abstract: PSILOは、ウェブベースのインターフェースを持つタンパク質–リガンド複合体構造のデータベースシステムです。タンパク質立体構造データを整理して、多様なクエリーで検索可能にし、研究者間の情報共有を支援します。本セッションではPSILOのさまざまな機能について使用例を交えて紹介します。
PSILOには、計算化学者、実験研究者、構造解析研究者などの専門家のニーズに応える様々な機能が搭載されています。例えば、計算化学者向けには、キーワード、相同配列、3D-相互作用、タンパク質類似ポケットなど、多様なクエリーによる複合的な検索機能があり、タンパク質立体構造データへの効率的なアクセスが可能です。実験研究者向けには、研究対象とするタンパク質ファミリーのリガンド結合部位、リガンド構造、ポケット類似性などを基準に重ね合わせる機能があり、その結果を3D 構造ビューアーで確認できます。構造解析研究者向けには、PDBフォーマットファイル以外にも、複数の構造因子ファイル、スケーリングログファイル、スケーリングデータファイル、TLSパラメーターファイルなどを関連付けてタンパク質立体構造データを管理する機能があります。データ登録ではGUIやバッチ処理に対応しており、XMLファイルで独自の登録形式を定義できます。システム管理者向けには、データへのアクセス権限をユーザーごとに設定できる機能があり、必要なセキュリティーを確保できます。
Introduction to MOE Antibody Design Application
Takashi Ikegami (MOLSIS Inc.)
Abstract: To design antibody drugs, there are various techniques such as chimeric antibody, humanized antibody, IgG subclass substitution, amino acid mutation, sugar chain modification, drug modification, fragmentation, and PEGylation and they are becoming more and more diversified. The use of modeling software that widely supports these techniques will lead to more efficient antibody drug development in the future.
The Molecular Operating Environment (MOE) is modeling software for drug discovery modalities and can be used to design a wide range of molecules including small molecules, peptides, antibodies, and nucleic acids. MOE has integrated various applications that can be used for antibody design such as annotating antibody sequences and/or 3D structures, homology modeling, loop/linker modeling, protein design, virtual phage display, protein–protein docking, epitope mapping, molecular surface analysis, physical property assessment, and detection of chemical modification sites. These applications make it possible to model antibody fragments (Fv, Fab, F(ab') and rIgG), full-length antibody, bispecific antibody, single-chain antibody (scFv), antibody–drug conjugate (ADC), VHH/VLL and humanized antibody.
In this session, we will introduce case studies of antibody design using MOE from the viewpoint of antibody modeling, protein-protein interaction analysis, and developability assessment.
MOE抗体設計アプリケーションの紹介
池上 貴史(株式会社モルシス)
Abstract: 抗体医薬品を設計するために、キメラ抗体、ヒト化抗体、IgGサブクラス置換,アミノ酸置換、糖鎖改変、薬物修飾、低分子化、PEG化等の様々な技術が用いられ益々多様化しています。これらの技術に広く対応したモデリングソフトウェアの活用は、今後の抗体医薬品開発の効率化につながります。
統合計算化学システム MOEは、低分子、ペプチド、抗体、核酸などの広範な分子設計に活用できる、創薬モダリティに対応した分子モデリングソフトウェアです。抗体配列・構造アノテーション、ホモロジーモデリング、ループ/リンカーモデリング、タンパク質デザイン、バーチャル・ファージディスプレイ、タンパク質-タンパク質ドッキング、エピトープマッピング、分子表面解析、物性推算、化学的修飾候補部位の検出など、MOEには抗体設計に活用できるアプリケーションが統合されています。Fv、Fab、F(ab’)、rIgGなどの各領域、抗体の全長構造、二重特異性抗体(バイスペシフィック抗体)、一本鎖抗体(scFv)、抗体薬物複合体(ADC)、VHH/VLL抗体、ヒト化抗体など様々な抗体構造のモデリングをMOEはサポートします。
このセッションでは、抗体モデリング、タンパク質間相互作用解析、Developability(開発可能性)の評価の観点から、抗体設計におけるMOEの活用事例を紹介します。
In silicoによるPROTACを介した三元複合体モデリングツール
神谷 謙太朗(株式会社モルシス)
Abstract: 標的タンパク質分解誘導薬は、従来の低分子医薬品が標的とすることができなかった転写因子や足場タンパク質などの「アンドラッガブル」なタンパク質も標的にできる可能性があることから、近年、創薬の新しいモダリティとして注目されています。PROTAC (PROteolysis TArgeting Chimera)は、標的タンパク質分解誘導薬の一つであり、標的タンパク質および、そのユビキチン化を触媒するE3リガーゼと結合して、三元複合体を形成することで、標的タンパク質のユビキチン化と続くプロテアソームによる分解を誘導します。PROTACによる標的タンパク質の分解誘導には、三元複合体の形成が必須であり、合理的なPROTACの設計には、適切な三元複合体をモデリングすることが重要です。
PROTAC Modeling Tools1, 2は、PROTACの開発を支援するMOEのカスタムアプリケーションです。本アプリケーションにより三元複合体構造の予測とモデリングを容易に行うことができます。本セッションでは、PROTAC Modeling Toolsのモデリング手法の概要とその適用事例を紹介します。
In Silico Modeling Tools for PROTAC-Mediated Ternary Complexes
Kentaro Kamiya (MOLSIS Inc.)
Abstract: In recent years, protein degraders have attracted attention as a new modality in drug discovery due to their potential to target even “undruggable” protein such as transcription factors and scaffold proteins and so on which has not been targeted by conventional small molecule drugs. A PROteolysis TArgeting Chimera (PROTAC) is one of the degraders and induces degradation of a target protein by the proteasome following ubiquitination by forming a ternary complex with the target protein and E3 ligase which catalyzes protein ubiquitination. Formation of the ternary complex is essential for the induction of the target protein degradation by PROTACs, so modeling the appropriate ternary complex is important for rational PROTAC design.
PROTAC Modeling Tools1, 2 are the custom applications of MOE to assist the development of PROTACs. These applications make it easy to predict and model ternary complex structures. In this session, we will present an overview of the modeling methodology and the case studies of their application.
Semi-automation of in silico analysis using MOE and KNIME
Akitoshi Okada (Japan Tobacco Inc.)
Abstract: In recent years, in silico analysis is often used to make drug development more efficient. This in silico technology can largely be divided into knowledge based and physics based. AI technology has gained tremendous attention recently and as a result, knowledge based methods are being relooked at in QSAR and QSPR. As for the physics based method, docking simulation has been used for many years to predict the binding pose of target molecule and to select potent novel inhibitors.
It is necessary to use different methods accordingly to the target of interest even within these knowledge based and the physics based technologies. However, there are parts where automation can help to make the analysis more efficient and focus time on the interesting. We will present ways to semi-automate knowledge based and physics based analysis for an efficient drug development infrastructure using MOE and KNIME.
Developability Assessment and Property Prediction by pH-Dependent Conformational Sampling
David Thompson (Chemical Computing Group ULC)
Abstract: mAb candidates identified from high-throughput screening or binding affinity optimization often present liabilities for developability, such as aggregation-prone regions or poor solution behavior. In this work, we developed a method for modeling proteins and performing pH-dependent conformational sampling, which can enhance property calculations such as hydrophobic patches, charge and pI. A retrospective data analysis demonstrates that these 3D descriptors, averaged over conformational sampling and stochastic titration, can accurately predict pI values, screen candidates and enrich libraries with favorable developability properties for a range of biotherapeutics. The clinical landscape of antibodies is also analyzed and its property profile and insights thereof are presented.
MOEsaic: Guiding Multi-Parameter Optimization in Ligand-Based Design
Fred Parsons (Chemical Computing Group ULC)
Abstract: We present MOEsaic, a web-based application for organizing, exploring and analyzing drug discovery data sets as well as predicting novel hybrid virtual compounds. MOEsaic provides an intuitive interface which follows medicinal chemistry workflows for interrogating data sets such as matched molecular pairs (MMP) analysis, R-group profiling, MMP transforms, property models and plots. In addition, MOEsaic also affords the opportunity to configure, standardize and share data across project groups thus providing a fully integrated analytics infrastructure.
MOEとKNIMEの連携によるin silico解析の半自動化
岡田 晃季 (日本たばこ産業株式会社)
Abstract: 近年,創薬研究において in silicoによる解析を活用した研究効率化は頻繁に行われている。その際に利用される技術を大きく分けるとknowledge basedとphysics basedに分かれる。近年のAI技術への注目によりknowledge basedの技術として,各種機械学習的手法は再注目されており,低分子の物性値の推算などに利用されている。またphysics basedの手法として有名なものの一つにドッキング計算があり,創薬ターゲットのタンパク質構造が解明されている場合,結合様式を把握し有望な化合物を探索する手法としてよく利用されている。
これらの手法はターゲットや目的に応じて,行う解析が異なってくる一方で,自動化できるタスクも多くある。これらの技術の一部を自動化することで,より効率的な解析を行い,興味深い探索へ時間を集中することが可能になると考える。そこで本発表では,MOEとKNIMEによるknowledge based, physic based技術の半自動化・効率化について発表する。
SBDD, the most valuable CADD skill
Qian Liu (Sichuan Kelun Pharmaceutical Co Ltd.)
Abstract: CADD has been broadly recognized as an essential role in modern drug discovery in recent years, not only in big pharma, but also in small biotech companies where HTS platform is barely established. The recognition on CADD comes from the important role that it plays in hit/lead discovery for drug targets with target protein crystal structures. Virtual screening (VS) is a proven technology for identifying early protein binders especially when HTS is not available or cannot be applied for any reason. SBDD, on the other hand, can shorten the time of hit/lead optimization cycle if embedded in routine drug discovery protocol. Factors affecting the performance of SBDD are discussed in this talk.