menu

SARNews No.36

SARNews_36

創薬における連携を成功させるには~ワンストップアカデミア創薬支援基盤~大阪大学薬学研究科 辻川和丈1. はじめに 創薬研究において、製薬会社によるオープンイノベーションが拡大される中、我が国におけるバイオベンチャー設立が十分でないことから、アカデミア創薬に大きな期待が寄せられてきた。アカデミアでは生命科学の基礎研究により、癌や免疫疾患、難病や希少疾患などの発症・悪性化機構の解明が進み、その結果疾患標的分子の同定もなされてきている。一方で、それらの研究成果を創薬に繋げることには苦戦を強いられてきた。その理由として、医薬品候補化合物の創製においては、疾患標的分子に対してその機能を制御する化合物のライブラリーを用いた評価、ヒットからリードへ繋げる構造展開、さらにはin vivoでの薬物動態解析や安全性試験を実施しなければならないが、それらの実施においては創薬に特化した施設や機器、化合物ライブラリーの整備、専任創薬研究者の参画が必要不可欠である。また創薬研究の展開においては、アカデミアにおける研究とは異なり、製薬会社が蓄積してきた知識や経験、研究手法等も要求される。よってアカデミア創薬を展開し、医薬品候補化合物を創製するためにはこれらの課題を解決し、製薬会社の協力も含めた連携の仕組みの構築が重要となる。 平成29年度からこれらの課題の解決により、アカデミア創薬を推進させるために、国立研究開発法人日本医療研究開発機構(AMED)による創薬等ライフサイエンス研究支援基盤事業が開始された。この事業では、アカデミア創薬の進展に繋がる最先端機器や設備を整備し、我が国の創薬基盤技術を結集して、医薬品創製に向けた支援を強力に推進することを目的とするものである。その事業において大阪大学は薬学研究科が中心となり、疾患標的分子の機能を制御するヒット化合物の同定から、リード化合物への構造展開、さらにin vivoでの薬物動態や安全性試験により医薬品候補化合物へと磨き上げるシームレスな支援体制を構築した。さらにこの支援体制においては、製薬会社の研究者とも連携構築がなされているという特徴を有している。本稿では、大阪大学におけるこれら創薬支援の積極的活用により次代のアカデミア創薬研究の推進を期待し、その仕組みや利用法を紹介する。また、このような支援体制の構築が、アカデミア創薬研究の着実な展開に繋がっている1例として、AlkB homolog 3(ALKBH3)を分子標的としたfirst-in-classの癌治療創薬の事例を紹介する。2. 日本の創薬研究事業 国の施策に基づき、アカデミアによる創薬研究を推進させるため、研究プロジェクトが立ち上げられてきた。文部科学省においては、平成14年度から平成18年度まで「タンパク3000プロジェクト」、続いて平成19年度から平成23年度まで「ターゲットタンパク研究プログラム」、この間平成16年度から平成20年度には「ゲノムネットワークプロジェクト」も進められた。さらに平成24年度から平成28年度までは、それまで実施された構造生物学プロジェクトにおける創薬・医療技術シーズ等の研究成果を迅速に医薬品等に結び付けることを目的として、「創薬等支援技術基盤プラットフォーム事業」が立ち上げられた。この事業では、それまでの事業において整備された施設・設備を、創薬等ライフサイエンス研究を行う研究者が広く共同利用できる体制とすることにより、創薬・医療技術開発支援の強化が図られた。この事業は平成27年4月1日に設立された国立研究開発法人日本医療研究開発機構(AMED)に移管された。そして平成28年度からは、AMED「創薬等ライフサイエンス研究支援基盤事業」へと繋がった。 2.1 創薬等ライフサイエンス研究支援基盤事業 創薬等ライフサイエンス研究支援基盤事業は、我が国の優れたライフサイエンス研究の成果を医薬品等の実用化につなげることを目的として、5年間のプロジェクトとして開始された。この事業では、構造解析ユニット、ケミカルシーズ・リード探索ユニット、バイオロジカルシーズ探索ユニット、インシリコユニットとプラットフォーム機能最適化ユニットの5つのユニットが設置された。構造解析ユニットは、タンパク質生産や結晶化の支援を行い、放射光施設(SPring-8、Photon Factory)やクライオ電子顕微鏡などの最先端ファシリティーを駆使して、タンパク質やタンパク質複合体の構造解析を行っている。ケミカルシーズ・リード探索ユニットは、低分子化合物、天然物やペプチドのライブラリー提供とそれらライブラリーを活用したスクリーニングを担当するとともに、ヒット化合物の誘導体合成展開によりリード化合物の創出に繋げる支援を行っている。バイオロジカルシーズ探索ユニットは、ゲノミクス解析やゲノム改変による疾患モデル動物作出と評価、薬物動態・安全性評価を支援している。インシリコユニットは計算科学を駆使して構造ダイナミクス研究やバイオインフォマティクス、ケモインフォマティクスの解析の支援担当となっている。そしてプラットフォーム機能最適化ユニットでは、この事業における研究成果の最大化に役立つデータベースクラウドを提供している。これらの最先端技術を有する研究者による強力な支援が「創薬等先端技術支援基盤プラットフォーム(BINDS)」[1]を介して、外部研究者の創薬研究推進を強力にバックアップしている。 3. 大阪大学創薬サイエンス研究支援拠点 創薬研究においては、創薬標的分子の同定、その標的分子を制御しうる化合物の探索を行うスクリーニング系の構築とそのハイスループット化、ハイスループットスクリーニングの実施、ヒット化合物からリード化合物への構造展開、さらにin vivo薬物動態や安全性試験が必要となる。しかしこれらを各研究者あるいは研究室内などで完結させることはできない。それらの各ステップを実施するには、専用の機器や設備が必要となるだけではなく、創薬研究の経験、知識や情報を有する研究者によるサポートを含めたシームレスな支援体制が必要不可欠である。大阪大学は上述の創薬等支援技術基盤プラットフォーム事業に続き、創薬等ライフサイエンス研究支援基盤事業において、ケミカルシーズ・リード探索ユニットのライブラリー・スクリーニング領域と構造展開領域、さらにバイオロジカルシーズ探索ユニットにおいて採択を受けた。そして薬学研究科に化合物ライブラリー・スクリーニングセンター、創薬センター構造展開ユニットと薬物動態・安全性試験ユニットからなる創薬サイエンス研究支援拠点[2]を設置し(図1)、BINDSと連携して学内外の創薬研究を強力に支援する体制を構築した。 3.1化合物ライブラリー・スクリーニングセンター3.2創薬センター構造展開ユニット3.3創薬センター薬物動態・安全性試験ユニット4. 支援を活用した癌の革新的創薬研究 以上記載したアカデミア創薬支援を利用して進められた1例として癌の革新的創薬研究について紹介する。 クロマチンの後天的修飾による遺伝子の発現変化はエピゲノミクスと呼ばれている。DNAのシトシンのメチル化やヒストンタンパク質のメチル化やアセチル化により、遺伝子の発現が制御され、発生や分化、環境への応答、さらに癌などの種々の疾患発症に関わっていることが明らかとされている。一方、RNAも種々修飾されていることは以前より知られていたが、mRNAのキャップ構造である7-methylguanosine以外にほとんどその分子生物学的役割は明らかにされていなかった。しかし最近、RNA塩基をメチル化するmethyltransferaseや脱メチル化するdemethylase、さらにメチル化RNAを認識して結合するタンパク質が同定されたこと、またRNAのメチル化がRNAの局在性や安定性、タンパク質の翻訳効率にも影響することなどが明らかにされたことから、RNAの後天的修飾によるタンパク質の発現変化は、エピトランスクリプトミクスという新しい概念の創出に繋がり、最近たいへん注目されている[3]。 我々は、癌の分子標的を探索する目的で、前立腺癌術後組織を用いたdifferential display解析により、非癌部と比べ癌部で発現上昇する遺伝子としてprostate cancer antigen-1 (PCA-1)と命名した遺伝子をクローニングした[4]。抗PCA-1抗体を作製し、種々の癌病理組織の免疫組織学的解析を行ったところ、PCA-1は前立腺癌とともに、膵癌や非小細胞肺癌などにおいて高発現が認められた[5-9]。またPCA-1の高発現と予後不良性が有意に相関することも明らかとなった。PCA-1のsiRNAを用いた解析により、膵癌細胞や肺癌細胞などにおけるPCA-1のノックダウンは、in vitroにおいてはアポトーシス誘導による細胞増殖抑制作用が、またin vivo xenograftモデルにおいては顕著な抗腫瘍作用が認められた(図5)[10-11]。これらの結果は、PCA-1は前立腺癌、膵癌や非小細胞肺癌の有望な分子標的となる可能性を示唆した。 PCA-1は大腸菌タンパク質AlkBのC末端ドメインと高い相同性があるドメインを有していることが分かっていたが、その後AlkBのこの領域は2-oxoglutarate, Fe(II)-dependent oxygenase domainとしてメチル化剤によりメチル化されたDNAやRNAの塩基を脱メチル化する酵素活性を発現することが示された。PCA-1もRNAの1-methyladenine(m1A)やN6-methyladenine(m6A)を基質として脱メチル化する酵素活性を発現することが明らかになり、現在AlkB homolog 3 (ALKBH3)と呼ばれている[12]。また癌細胞で高発現するALKBH3はtRNAのm1Aを脱メチル化することにより、癌細胞の増殖に必要となるタンパク質翻訳効率を上昇させることも明らかとなった[13]。 そこでこのALKBH3のRNA脱メチル化酵素活性HTS測定系を構築し、大阪大学の化合物ライブラリーを用いてスクリーニングを実施した。その結果、ALKBH3の脱メチル化酵素活性を阻害するヒット化合物を得た[14]。この化合物は、膵癌細胞株や肺癌細胞株に対してアポトーシス誘導による増殖抑制活性を示した。またin vivo xenograftモデルにおいてもALKBH3 siRNAと同様の抗腫瘍作用を発現した。さらに質量分析装置を用いたエピトランスクリプトーム解析基盤技術により、この化合物を添加した膵癌細胞ではtRNAのm1Aやm6Aの発現上昇も認められた。さらにALKBH3酵素活性阻害化合物は癌細胞の新生タンパク質の翻訳を顕著に抑制した。これらの成果から、ALKBH3の脱メチル化酵素活性阻害化合物は、癌細胞におけるエピトランスクリプトミクスの制御により細胞増殖を抑制し、抗腫瘍作用を発現することから革新的な癌治療薬となることが期待された(図6)。そこでこの化合物をヒット化合物として、構造展開ユニットのメディシナルケミストの力により誘導体展開もなされた。一方、アカデミアの創薬シーズの実用化を目指したAMEDの創薬支援推進事業(創薬ブースター)において、製薬企業などから提供された約20万化合物のHTSを実施する産学協働スクリーニングコンソーシアム(DISC)においてもヒット化合物が創出された。現在これらの研究成果に基づき製薬会社とfirst-in-classとなる癌治療薬に向けた共同開発研究が進められている。 5. まとめ アカデミア創薬研究により癌や難病、希少疾患等の革新的治療薬の創製が大きく期待されている。アカデミアの基礎研究を医薬品開発に繋げるために、創薬等ライフサイエンス研究支援基盤事業における支援はたいへん大きな役割を果たしている。また大阪大学薬学研究科では、疾患治療標的分子に対する特徴的化合物ライブラリーを用いたHTSの実施、構造展開ならびにin vivo薬物動態・安全性試験のシームレスな支援体制を整えた。これらの支援基盤の積極的な活用により、アカデミア創薬の大きな進展が期待される。 機械学習を用いた高精度力場構築に向けてみずほ情報総研株式会社 東レ株式会社 加藤幸一郎 増田友秀1. はじめに 創薬研究において実施されるタンパク質や核酸などの生体分子系を計算対象とする分子動力学シミュレーションやインシリコスクリーニング等の分子シミュレーションでは、分子力場が一般に用いられ、それらの計算精度は用いる分子力場の精度に大きく依存する。通常の分子シミュレーションでは古典力学に基づく分子力場が用いられ、量子力学に基づいた分子シミュレーションと比較して精度は劣るものの、計算コストの面で圧倒的に有利であることからタンパク質や核酸を含む大規模分子系に対する分子シミュレーションが可能である。 一般に、分子力場には式(1)のようなポテンシャル関数が用いられ、代表的な既存分子力場としては、AMBER[1]、CHARMM[2]、GROMOS[3]、OPLS[4]等が挙げられる。ポテンシャル関数は原子間相互作用を表し、結合長、結合角、二面角に関係する結合エネルギー項と、ファンデールワールス力及びクーロン力に起因する非結合エネルギー項より構成される。 しかしながら、タンパク質の生体高分子と医薬低分子化合物等との相互作用は非常に複雑であり、例えばハロゲン結合等の相互作用は単純なポテンシャル関数形では表現することは困難である。また、ポテンシャル関数に含まれるパラメータを最適化することで高精度化を図ることが可能な場合もあるが、多様な相互作用に対して統一的な改良を行うことは困難である。さらに、生体高分子と低分子化合物との相互作用では非結合相互作用が特に重要であるものの、式(1)を用いた既存分子力場のクーロン項の計算においては点電荷近似による固定電荷を用いるため、周辺環境やコンフォメーションの変化に対応した電荷分布の変化および分極効果を考慮していないという課題が挙げられる。このような課題に対して、現在でも積極的な分子力場の改良が行われており、各種提案されている[5]-[6]。 一方、AI技術を創薬に用いる試みも世界中で加速してきており、注目を集めている。日本においては、京都大学/理研の奥野恭史教授らが中心となり、AI(Artificial Intelligence)による創薬開発の効率化および成功確率向上を目指す産官学連携コンソーシアム「LINC(Life Intelligence Consortium)」が設立された[7]。LINCでは30個のAI開発プロジェクト(PJ)が進行しており、筆者らはその中のPJ14にて活動している。PJ14は、ライフサイエンス企業・IT企業と所属は異なるもののバックグラウンドや専門分野が近く、以前より分子力場に対して共通課題を持つメンバーが、AIによる課題解決に強い志を持って集まり発足に至った。具体的には、既存分子力場を用いた場合と同等の計算コストで、より高精度な分子シミュレーションを可能とする力場の構築を目指しており、以下に示すAIモデルの構築を進めている。 2. 機械学習モデルの概要 上述の通り、我々はNNを用いた機械学習モデルの構築を進めている。各原子の座標および原子種情報をNNの入力とするには、記述子化によってベクトル情報に変換する必要がある。我々は、Behlerらにより提案されたAtom Centered Symmetry Functions(以後、ACSFs)を用いることにした[8]。また、NNを力場構築に適用する方法として、BehlerとParrinelloにより提案されたHigh-Dimensional Neural Network Potential(以後、HDNNP)を採用した[9]。それぞれについて詳細を後述する。2.1 Atom Centered Symmetry Functions (ACSFs)2.2 High-Dimensional Neural Network Potential (HDNNP)3. 開発状況3.1 NNP LINCが発足した開発当初は、プログラムの動作検証や学習に係るノウハウ習得からスタートする必要があった。そのために、先行研究[10]があり、かつ系の構成要素が単純な均一系である水のみの系に対するNNP構築を行った。繰り返しになるが、この検討の目的は水の性質を再現できるNNPを構築することではなく、教師データに用いた第一原理計算レベルのポテンシャルエネルギーと力を得ることである。 ここでは、Gromacs[15]を用いて10,000のスナップショット構造を作成し、それらに対してQuantum Espresso[16]による周期DFT計算をそれぞれ行うことで、教師データを作成した。記述子化に必要となるパラメータについてもMarawietzらが用いた値と同じものとし、各酸素原子、水素原子の周辺環境は、それぞれ30個、27個の記述子で表現した[10]。結果として、図3に示すとおり先行研究と同等のエネルギー・力の算出に成功した。力については若干先行研究と比較して誤差が大きいが、先行研究においては様々なサイズ(構成原子数)の系を学習に用いるなど教師データ作成に工夫を凝らしているのに対して、本研究では動作検証やノウハウ習得を目的としているため、単一トラジェクトリのみの教師データを用いており、教師データに含まれる多様性の違いに起因しているものと考えられる。 水のみの系での成功を受け、現在は水和タンパク質の様な非均一系やハロゲン結合を含むモデル系の検討なども進めており、NNPの有用性を示す結果が出始めている。これらの系については、機械学習により分子力場を作る試みが世界的にも未だなされていないものであるため、非常にチャレンジングなものとなっているが、ライフサイエンス企業・IT企業が協力し、アカデミアの助言を受けながらLINCの枠組みを最大限活用するかたちで進めているところである。一般にライフサイエンス企業・IT企業の協業ではお互いに「共通認識」を持った議論が困難なことが多いと言われるが、これまでのPJ14の活動を振り返ると、各メンバーのバックグラウンドや専門分野が近いことから、「共通認識」を持った活発な議論ができ、企業間の連携が上手く機能していると考えている。また、ライフサイエンス企業メンバー数は少ないものの、各種の分子シミュレーション分野に精通したメンバーが在籍しており、アカデミアからの助言に加えて、企業メンバー間で専門的な意見交換・技術交流が容易にできたことも大きかったと思われる。3.2 NNAC 次に、原子電荷予測用の機械学習モデルであるNNACの開発状況を紹介する。NNACの教師データについては、FMO創薬コンソーシアムFMODD(FMO Drug Design Consortium)[17]と連携することで、Gaussian等のQM計算では作成が困難なサイズのタンパク質も含めたデータを作成・利用した。具体的には、polyQ10、TrpCage、BRD2-BD2(BRD2のBD2ドメイン、以後BRD2)について、Amberを用いたMD計算によりそれぞれ10,000、10,000、1,000スナップショット構造を作成し、ABINIT-MP[18]を用いたFMO計算(FMO2-HF/6-31G*)によりRESP電荷[19]を算出し教師データとした。MD計算で得られた構造をそのままFMO計算したため、一部の構造でFMO計算が収束しなかったが、図4に示すとおりFMO計算が収束した各構造のデータをTrain、Validation、Testに分割して学習に用いた。なお、データ分割には各構造のRMSDを用いたk-meansクラスタリングを行い、得られたクラスタの代表構造がTest構造である。残りの構造を8:2に分割してTrain、Validationとした。 NNACの学習については、いずれの系においてもValidationデータに対するRMSEが0.10程度となるまで行った。学習済みのNNACを用いてTestデータに対する予測を行った結果が図5である。当然ながら原子数の少ないpolyQ10が最も予測精度が高くなっているが、1,811原子を含むBRD2においても、R2で0.9近い精度を達成しており、NNACの予測精度に我々自身も驚いているところである。ただし、系全体の電荷の総和であるNet chargeを見ると、まだまだ改善の余地がありそうである。特に、BRD2BromodomainについてはNet chargeのブレが大きい。今後の効率的な教師データ作成に生かすため、このNet chargeのブレの原因をはじめとして、どの様な環境に置かれた原子についての予測精度が良い/悪いのかについての詳細解析を進めているところである。 4. まとめと今後の展望 本稿では、LINCのPJ14にて開発を進めている機械学習を用いた高精度分子力場についての概要と開発状況を紹介した。PJテーマとしては非常に基礎研究色の強いものであり、個別企業で取り組むことは困難なものであるが、LINCにおいて興味を持ったライフサイエンス企業・IT企業が連携し、アカデミアの支援を受けながら協調的に進めることで、NNP、NNACの有用性の一端を示すところまで進めることができた。LINCの活動は、各個人・企業が複数のPJに参加することができるため知識・ノウハウを含めた情報共有に注意する必要があるものの、企業の枠を超えた深い人脈をつくることができるため、大変有意義であると感じている。 今後は、記述子開発を含めた更なるプログラムの改良および教師データの整備を進めて、高精度な分子力場開発の加速化に努めていきたい。創薬における大学と企業との連携例東京工業大学 情報理工学院, 日本学術振興会特別研究員DC1 安尾 信明1. はじめに 筆者は現在シミュレーションや機械学習を応用した創薬を専門領域とし、東京工業大学で博士課程の学生をしている。今回は、武田薬品工業株式会社との共同研究を昨年CBI学会で発表したことをきっかけにSAR Newsへの寄稿依頼を頂いた。自由に書いて欲しいとのことであったので、筆者が経験した二つの共同研究事例と、そこから考える創薬における企業との連携におけるポイントについて書かせて頂くこととした。SAR Newsの読者の方々はどちらかというと製薬企業の側の方が多いことと想像するが、情報側の学生がどのようなことを考えているのかの参考になれば幸いである。2. 事例1: ドッキングを用いた抗トリパノソーマ原虫化合物探索3. 事例2: 機械学習を用いたリード最適化の経路予測4. 創薬における連携のポイント 筆者が考える連携のポイントは、当然のことであるが、連携を開始するまえに十分に計画を練っておき、お互いが納得できる条件を用意することである。また、目的について、新薬を開発するという大目的は共通であると思うが、共同研究の目標は異なることに注意したい。企業は企業内の問題を解決することが目標であることが多いが、アカデミアでは論文や特許を出すことが大きな目標の一つと考える人が多いだろう。論文を出版する際にどのような情報は公開してもよいか、どのような手続きが必要かなどについては事前に議論しておく必要がある。時間スケールについて、特に新規な技術開発を行う場合は、単に既存技術を適用する場合に比べて検討に時間を要することが多い。そのため、互いが納得できるマイルストーンを設定する必要がある。 具体的な研究内容については、事例1のように直接新規の化合物を取得することを目指す研究の場合、標的疾患・蛋白質に特徴的な性質や、活性はどの程度必要か、現段階で溶解性や毒性はどこまで検討すべきかといった、得たい化合物の傾向に大きく影響する基準は事前に詳細に議論し情報共有しておくことが重要と考えている。これらの項目は、実際に筆者がバーチャルスクリーニングを行った際に見落としてしまった経験があるものである。 事例2のようにシミュレーションや機械学習などを用いた予測手法を開発する研究の場合、筆者は以下のようなことを検討する。 * データの質 一般的に公開されているデータベースに比べ、社内データは質がよいことが多いが、量や網羅性には欠けることが多い。ここで言う質がよいというのは、学習するデータにノイズが少なく、予測するデータと似た特徴をもっていることである。例えばある標的蛋白質に対してのIC50を予測する場合、同じ化合物のIC50は同程度の値であることが期待される。社内データで学習を行う場合、同じ化合物のIC50が大きく変動することは考えにくい。一方、公開されているデータベースでは、実験系の違いなどによって大きく異なる値が登録されていることがある。例えば、多くの実験結果が収載されているデータベースであるChEMBLでHuman Cyclooxygenase-2 (COX2)に対するaspirinのIC50を調べてみると、最小は2.4 ?M、最大は18 mMと、750倍の幅が見られた。このようなデータを学習に用いる必要がある場合には、実際に適用する系と比較しながらデータの取捨選択を行うことになる。 * データの網羅性 機械学習による予測では、一般的に予測したいデータ点の近傍に学習データがある場合は比較的予測が容易で、ない場合は予測が難しいとされる。この性質から、予測を行いたい範囲が広ければ広いほど学習に必要なデータ量が多くなる傾向にある。そのため、予測したいデータの範囲や、学習に利用可能なデータが予測したいデータとどの程度類似しているのかは事前に検討しておく必要がある。 * 予測精度と解釈性のトレードオフ 解釈性と予測精度は一般にトレードオフの関係にあると言われる。例えば、ディープラーニングの予測結果を人間が分かるように解釈する方法は盛んに研究されているが[4]、未だ発展途上である。解釈性をどの程度重視するかは目的によって異なり、スクリーニング目的など精度が重視される場合もあれば、構造展開に活用するために重要な官能基を明らかにする必要がある場合もある。事前に将来の活用予定や必要な精度に関してすり合わせを行っておくことで、不要な実装や検討を削減できる可能性がある。5. おわりに 大学と企業の連携は今後さらに増加していき、連携の重要度も増していく可能性が高い。また、これまで「門外不出」であった製薬企業の社内データも、事例2のような制限つきのものから始まり、近年ではより詳細な情報の公開に踏み切るケースについても聞き及んでいる。これらの連携を機に、日本の薬学研究や創薬産業が一層活発になることを願っている。