SARNews No.19
構造活性相関部会・ニュースレター<1October,2010>SARNewsNo.19「目次」/////Perspective/Retrospective/////創薬におけるケモインフォマテックス手法の活用長谷川清・・・2/////CuttingEdge/////創薬プロジェクトにおけるモデリング&シミュレーションの拡張大川和史・・・8ChemoinformaticsToolkitsを用いた創薬システム開発におけるラピッドプロトタイピング吉森篤史・・・14/////Activities/////<報告>構造活性フォーラム2010開催報告「QSARパラダイムの分化と深化」中川好秋・・・21<会告>第38回構造活性相関シンポジウム・・・22SARNewsNo.19(Oct.2010)/////Perspective/Retrospective/////創薬におけるケモインフォマテックス手法の活用中外製薬・鎌倉研究所長谷川清1.はじめにケモインフォマテックスとは、化学情報全般を扱う広大な学問領域で、データベースのstorage,organization,management,retrievalあるいは、データのanalysis,dissemination,visualizationと種々のテクノロジーを意味する[1]。ケモインフォマテックスは化学構造を基にしたアプローチなので、創薬を目指した製薬企業では、これを利用した薬物設計が盛んである。例えば、部分最小2乗法(PLS)、サポートベクトルマシーン(SVM)などの統計・機械学習手法は、ケモインフォマテックスおよび関連のケモメトリックスで開発された手法であり、定量的構造活性相関研究やデータマイニング研究に最近多用されている[2]。創薬の現場においては、特に、ターゲットタンパク質に対するリード化合物の探索およびリード化合物の最適化の効率化が望まれる。本寄稿では、これらの目的のために、いかにケモインフォマテックス手法が有効活用できるかを、最新の研究を紹介しながら説明したい。なお、より広範なケモインフォマテックス手法については、船津らの単行本[1]に詳しくあるので、興味のある読者は一読を薦める。2.リード化合物の探索Pharmacophoreモデルによるvirtualscreening既存の薬物の部分構造を修飾すると、本来のターゲットに対する阻害活性が消失し、かわりに別のターゲットの阻害活性が上昇することが知られている。図1には、ドパミン受容体に阻害活性がある市販のminaprineの側鎖を構造修飾すると、ムスカリン受容体への阻害活性が上昇する実例を示した[3]。NNNHNONNNHNONNNHNNNNHOHNminaprineKi=17,000nMKi=550nMKi=50nMKi=3nM図1Minaprineの構造修飾によるムスカリン受容体阻害活性の最適化したがって、ターゲットごとにpharmacophoreモデルを用意して、virtualscreeningを実施すれば、安全性がすでに確保された既存の化学骨格で、別の阻害作用をもつリード化合物を得ることが可能である[4]。個別のpharmacophoreモデルからそれぞれの阻害活性を識別できることは、Langerらによりすでに報告があり、このようなアプローチが有用であることが実証されている[5]。図2は、その検証結果である。HIVprotease,HIVreversetranscriptase(RT),Influenzaneuraminidase(NA),Humanrhinovirus(HRV)coatprotein,HCVpolymerasesites1,2,3のターゲットについて、それぞれのpharmacophoreモデルがどの程度正しく対応するリガンドを認識できたかを表している。縦軸がpharmacophoreモデルの予測、横軸が実測のリガンドである。緑色が正し-2-SARNewsNo.19(Oct.2010)く認識された領域を、オレンジ色が誤認識された領域を示す。InfluenzaNA,HRVcoatproteinで一部誤認識はあるが、virtualscreeningという枠組みでは、おおむね正しく認識されていると言える。現在、Langerらは、約650個のターゲットについてpharmacophoreモデルを用意しており、ターゲットの選択性を考慮したvirtualscreeningが可能である[6]。図2Pharmacophoreモデルによる各ターゲットの認識結果(Langerより許可を得て転載)Denovodesignによる自動構造発生既存の阻害剤と化学骨格が異なる化合物を見出すことは、新規特許の点からも分子設計上、重要である。Schneiderらは、DOGS(DesignofGenuineStructures)というligand-baseddenovodesignシステムを構築して、新規骨格化合物を自動生成することに成功した[7,8](図3)。まず、あらかじめvendercatalogueにある化合物からユニークなフラグメントを用意しておく。これらfragmentを、化学反応を考慮して、任意の組み合わせでつなぐことにより、化学構造が自動発生される。最後に、発生された構造から、ターゲット分子に対する物理化学的特徴の類似性が高い構造を選択する。図3DenovodesignシステムDOGSの概要(Schneiderより許可を得て転載)TGF-β1receptorligandでの実例を図4に示す。既存のリリーの化合物(LY364947)をテンプレートにして、右側に示すような様々な化合物が出力される。興味深い点は、これまでのdenovodesignツールと比較して、出力化合物の合成ルートが明示されている点である。これにより、化-3-SARNewsNo.19(Oct.2010)学合成可能なより現実的な化学構造を期待することができる。DOGSは、ligand-baseddesignを志向しているので、タンパク質の構造が未知のプロジェクトでの広い応用が期待される。図4TGF-β1receptorligandでの実例(Schneiderより許可を得て転載)3.リード化合物の最適化ローカルモデルによるADMET予測リード化合物を最適化する場合、阻害活性だけでなくabsorption,distribution,metabolism,excretion,toxicity(ADMET)の最適化も必要となる。ADMET予測プログラムは市販にもあるが、これらは、一般的な化学構造に適した予測精度の低いグローバルモデルである。プロジェクトで合成されているような化学骨格が固定された化合物については、ローカルモデルが適している。長谷川らは、プロジェクト化合物専用のADMETローカルモデルとメディシナルケミスト向け専用webpageを社内で構築した[9,10]。そのイメージ図を図5に示した。図5メディシナルケミスト向けプロジェクト専用webpageJavaAppletの部分をダブルクリックするとISIS/Drawが起動して、任意の化学構造式を入力できる。その後、Submitボタンを押すと、プロジェクト内で登録されているADMET項目の予測値が帰ってくるようになっている。それぞれの予測値には、モデルの適用範囲を示す距離が表示され、この値が大きいと予測値の信頼性が低いことを示す。予測システムのワークフローを図6に示す。ISIS/Drawで書かれた構造イメージは、ChimeProにより、2次元のmolfileに変換される(プロセス(a))。Corinaで3次元molfileに変換された後(プロセス(b))、MOEで構造記述子が計算される(プロセス(c))。構造記述子が入っているtextfileから、あらかじめ作成しておいたRモデルで予測値を算出する(プロセス(d))。最後に、予測値を出力webpageのhtmlにcgiで記述する(プロセス(e))。一方、先ほど計算された構造記述子とモデル構築に利用した構造sdfから、モデル空間までの距離が計算され(プロセス(d))、これもまた出力webpageのhtmlにcgiで記述される(プロセス(e))。-4-SARNewsNo.19(Oct.2010)(a)(b)(c)(d)(e)ISISdraw→2D_mol→3D_mol→des_txt→pred_txt→.htmltrain_sdf→dis_txt→.html(a)
”,$pred)printf(“Distance=%6.2f
”,$dis)図6予測システムのワークフローと具体的なコマンド専用webpageは、その後いろいろな機能が拡充され、現在、プロジェクト推進に大いに利用されている。追加機能としては、多分子からなるsdffileでの予測、分子中のどの部分が重要であるかを示すatom-coloring表示、予測化合物がchemicalspace上どこにあるかを示す図示化機能などがある。Chemicalspaceの図示化活性化合物がchemicalspace上どこにあり、現在合成を考えている化合物がどこにあるかを把握することは、構造最適化ではきわめて重要である。これら全体像がイメージできれば、合成化合物の数を減らすことができかつ最適化のゴールが定量化できる。Bajorathらは、Javaを基本としたSARANEA[11]というシステムを開発した。図7は、論文にあるplasminに対する阻害化合物のchemicalspaceを図示化したものである。それぞれのノードが化合物を表しており、Tanimoto係数>0.65の化合物ペアは線で結ばれている。赤、オレンジ、黄、黄緑、緑という順番で、阻害活性値の減少を意味している。一方、ノードの大きさは、QSARcliffの度合いを意味している。化合物ペアで活性値の差が大きい場合、QSARcliffが大きいと定義される。この値が大きいとchemicalspace上断崖絶壁と考えられ、リード化合物の最適化が難しいことを意味している。図7で、continuousと書いてある領域はリード最適化に適しているが、discontinuousと書いてある領域は難しいことを意味する。なお、SARANEAはJavaを基本としているので、それぞれのノードにマウスをかざすと、具体的な化学構造と活性データが表示される。図7Plasminに対するchemicalspaceの図示化(Bajorathより許可を得て転載)図8は、SARANEAで注目する化合物を中心にして、chemicalspace上、どの近接ポイントにどのような化合物があるかを示した図である。中心化合物と比較して、chemicalspace上離れれば離れるほど、外側の円上にノードが位置される。円の右側が中心化合物と比較して活性が上昇している化合物を、左側が活性が減少している化合物を示している。このような図から、化合物-5-SARNewsNo.19(Oct.2010)をどのように修飾すれば、活性が上昇・減少できるかが一目でわかるようになる。例えば、化合物1の右側のethylamineを化合物5のpiperidineに変換すれば、活性が上昇することがわかる。近接ポイントだけ表示されているので、骨格部分の構造が固定されデザインのアイデアが容易である。このように、chemicalspaceの図示化は重要なツールであり、先のセクションで記述したローカルモデルと併用すれば、構造最適化がより効率的になる。図8Plasminに対するchemicalspaceの同心円(Bajorathより許可を得て転載)4.おわりに最近のホットなトピックスとして、ケモゲノミックス研究がある。ケモゲノミックス研究では、多くのターゲットに対する大量のリガンドの活性データを有効に解析し、ラフな傾向を導き出すことが求められている[12]。したがって、ターゲット空間を表現できるバイオインフォマテックスとリガンド空間を表現できるケモインフォマテックスを融合できれば、ターゲット-リガンド空間の効率的な探索が期待できる。さらに、ターゲット-リガンド空間の活性領域内で、構造ジェネレータを利用して構造を発生させれば、オーファンターゲットに対する新規リガンド化合物を見つけることができるかもしれない[13]。このように、ケモインフォマテックスでは有用なアルゴリズムが順次開発されており、創薬研究に携わる研究者として、今後、この分野の発展を注目していきたい。参考文献1.ケモインフォマティクス-予測と設計のための化学情報学、船津公人監訳、丸善株式会社(2005).2.ChemoinformaticsandAdvancedMachineLearningPerspectives:ComplexComputationalMethodsandCollaborativeTechniques,LodhiH.andYamanishiY.(Eds.),IGIpublishing(2011).3.Aminopyridazines.AnAlternativeRoutetoPotentMuscarinicAgonistswithNoCholinergicSyndrome:WermuthC.G.,IlFarmaco,48,253-274(1993).4.NewUsesforOldDrugs:ChongC.R.andSullivanD.J.,Nature,448,645-646(2007).5.ParallelScreening:ANovelConceptinPharmacophoreModelingandVirtualScreening:SteindlT.M.,SchusterD.,LaggnerC.andLangerT.,J.Chem.Inf.Model.,46,2146-2157(2006).6.PharmacophoresinDrugResearch:LangerT.,Mol.Inf.,29,470-475(2010).-6-SARNewsNo.19(Oct.2010)-7-7.Voyagestothe(Un)known:AdaptiveDesignofBioactiveCompounds:SchneiderG.,HartenfellerM.,ReutlingerM.,TanrikuluY.,ProschakE.andSchneiderP.,TrendsBiotechnol.,27,18-26(2009).8.FromMachineLearningtoNaturalProductDerivativesSelectivelyActivatingTranscriptionFactorPPARgamma:RuppM.,SchroeterT.,SteriR.,ZettlH.,ProschakE.,HansenK.,RauO.,SchwarzO.,Müller-KuhrtL.,Schubert-ZsilaveczM.,MüllerK.-RandSchneiderG.,ChemMedChem,5,191-194(2010).9.ADMETローカルモデルの構築およびケミスト向けWebGUIの開発、長谷川清、深海隆明、大田雅照、白鳥康彦、第32回情報化学討論会、山口大学(2009).10.ConstructionofADMETLocalModelsandDevelopmentofWebGUIforChemists:HasegawaK.,FukamiT.,OhtaM.,ShiratoriY.,2ndChemoinformaticsStrasbourgSummerSchool,France(2010).11.SARANEA:AFreelyAvailableProgramtoMineStructure−ActivityandStructure−SelectivityRelationshipInformationinCompoundDataSets:LounkineE.,WawerM.,WassermannA.M.andBajorathJ.,J.Chem.Inf.Model.,50,68-78(2010).12.ChemogenomicApproachestoRationalDrugDesign:RognanD.,Br.J.Pharmacol.,152,38-52(2007).13.ExhaustiveStructureGenerationforInverse-QSPR/QSAR:MiyaoT.,ArakawaM.andFunatsuK.,Mol.Inf.,29,111-125(2010).SARNewsNo.19(Oct.2010)/////CuttingEdge/////創薬プロジェクトにおけるモデリング&シミュレーションの拡張持田製薬株式会社創薬研究所化学研究室大川和史1.はじめに化合物の置換基変換を行ったり、反応試薬データベースを使った仮想的な構造を創出するようなケモインフォマティクスツールはポピュラーであるが、まずは基本に立ち戻って化学構造の変換をグラフ操作の観点から捉えなおす。次に、これらの操作を拡張することにより、ケミストが合成案を創出するプロセスを、反応のルールセットの集合とその操作を用い表現することを考える。さらにそれらを束ね拡張した場合にプロジェクトが表現できるであろうことを示す。次の章では、構造最適化プロジェクトというものを、ストリームとして捉えてみる。その場合に、化合物管理システムは単に化合物のデータを管理するだけではなく、よりメタ情報(情報に関する情報)を記録していく必要性があるが、ソフトウェア開発のプロジェクトマネジメントシステムではすでにそのようなメタ情報を管理するようなシステムが存在するため、それらと比較しながら、メタ化合物管理システムというものを考えてみたい。2.化学構造プログラミング化学構造はノードとエッジで表現できるため、いくつかのケモインフォマティクス用のライブラリではグラフの操作として化学構造を扱うことができる。そのようなライブラリとしてOEChemToolkit[1]、PerlMol[2]、OpenBabel[3]が存在する。このようなライブラリはグラフ操作を通して化学構造を修飾できるが、化学反応を記述するためのフォーマット(例えばSMIRKS[4]、RXN[5])フォーマットをサポートしていれば煩雑なグラフ操作をしなくても構造の変換が可能である。OEChemToolkitやPipelinePilot[6]ではRXNフォーマットがサポートされているのでグラフ操作の処理を自分で書く必要はないが、本稿ではグラフ操作のイメージを持ってもらうためPerlMolによるコードを二つ載せる。例1)Diels-Alder反応例えばPerlMolではSMARTS[7]というパターンマッチのための表現形式を使うことで化学反応を定義できる。例として図1のようなDiels-Alder反応を記述してみる。図1Diels-AlderReactionuseChemistry::File::SMILES;useChemistry::File::SMARTS;useChemistry::Ring’aromatize_mol’;my$react1=Chemistry::Mol->parse(‘ClC=Cdienophile’,format=>’smiles’);my$react2=Chemistry::Mol->parse(‘OC=C-C=Cdiene’,format=>’smiles’);#dieneとdienophileのパターンをSMARTSで定義my$dienophile_pat=Chemistry::Pattern->parse(“C=C”,format=>’smarts’);my$diene_pat=Chemistry::Pattern->parse(“C=C-C=C”,format=>’smarts’);-8-SARNewsNo.19(Oct.2010)aromatize_mol($react1);aromatize_mol($react2);my$name=$react1->name.”+”.$react2->name;my$prod=Chemistry::Mol->new(name=>$name);$prod->combine($react1,$react2);#dieneとdienophilieのパターンを探し、みつかったら各オブジェクトにマップ$dienophile_pat->match($prod);my@atom_map1=$dienophile_pat->atom_map;my@bond_map1=$dienophile_pat->bond_map;$diene_pat->match($prod);my@atom_map2=$diene_pat->atom_map;my@bond_map2=$diene_pat->bond_map;#反応用の原子が揃っているかチェックif($atom_map1[0]&&$atom_map1[1]&&$atom_map2[0]&&$atom_map2[3]){#結合の作成$prod->new_bond(atoms=>[$atom_map1[0],$atom_map2[0]],order=>’1′);$prod->new_bond(atoms=>[$atom_map1[1],$atom_map2[3]],order=>’1′);#dieneとdienophileの結合次数を変える$bond_map1[0]->order(1);$bond_map2[0]->order(1);$bond_map2[1]->order(2);$bond_map2[2]->order(1);my$smi=$prod->print(format=>’smiles’,unique=>1,name=>1);print”$smi¥n”;}例2)ベンゼンを生物学的等価なチオフェンに変換するコンピューター上の操作であるため、グラフ操作であればどのような構造の修飾でも可能である。例えば生物学的等価な変換として知られているベンゼンをチオフェンに変換する(図2)コードは以下のようになる。図2ベンゼンをチオフェンにuseChemistry::File::SMILES;useChemistry::File::SMARTS;useChemistry::Ring’aromatize_mol’;my$comp=Chemistry::Mol->parse(‘c1ccccc1′,format=>’smiles’);aromatize_mol($comp);my$pattern=Chemistry::Pattern->parse(‘c:[ch]=[ch]:c:c:c’,format=>’smarts’);$pattern->match($comp);my@nfg=$pattern->atom_map;$nfg[1]->delete;$nfg[2]->delete;my$s=$comp->new_atom(symbol=>”S”);my$sc1=$comp->new_bond(atoms=>[$s,$nfg[0]],order=>’1′);my$sc2=$comp->new_bond(atoms=>[$s,$nfg[3]],order=>’1′);$s->implicit_hydrogens(0);print$comp->print(format=>’smiles’,unique=>1,name=>0),”¥n”;Bioisosteregeneratorここまでで化学構造の変換をプログラミングできることを示したが、これをさらに広げていこう。例えば文献などで経験上知られている生物学的等価体のルールをすべて収集し、任意の化合物に対してすべての可能な生物学的等価体を生成するようなツールを用意すれば、ケミストの経-9-SARNewsNo.19(Oct.2010)験や知識のばらつきによらずに、ボトムラインとしての一定の質が担保できる。弊社ではこのようなツールをwebサービスとして公開することで、ケミストが容易に興味のある構造からすべての可能な生物学的等価体をSDFファイルとして受け取れるようにしている。他の事例としては、aromaticringに再帰的にヘテロ原子を入れていき、すべての組み合わせを自動的に出力する、MORPH[8]のようなツールも有用性が高いと思われる。ケミストを模倣するより複雑な拡張として、ケミストのように合成案を創出するような仕組みを考える。例えば、環を切ったり巻いたりといった大胆な骨格変換、アミド結合をリバースにしたりといった変換から、単にアルキル基、ハロゲン基の導入といった細かい置換や、上で挙げた生物学的等価な変換やヘテロ環の組み合わせをランダムに生成していくようなプログラム[9]は可能である。単にランダムに構造を生み出したいだけであれば、反応ルールのセットを保持しておいて、反応ルールをランダムに選択しながら新たな構造を生成、新しく生まれた構造を再度反応ルールにかけるような再帰的なループを回せばよい(図3)が、実用性を考えた場合、反応ルールセットは設定ファイルで調整できるようにし、新規な化合物のプロパティを評価しながら、イテレーションごとに設定ファイルを調整するような仕組みにしたほうがよいであろう。そうすれば「極性が高いようであれば次のイテレーションではそれを下げる」「分子量が大きくなった場合、次のイテレーションでは構造を削る」ような反応ルールが選択されやすくなるように設定ファイルを書き換えることができる。図3ランダム合成サイクルさらに、このシミュレーションの大きな利点の一つは、世代を管理することができ、どの構造から生まれた構造かが明確になっているために、時系列を考慮したさらに大きいシミュレーションの枠組みとして使える可能性があるということである。リードオプティマイゼーションは単に化合物を積み上げていくだけでなく、プロジェクトの歴史を刻みながら、プロジェクトそのものを科学的に理解していく作業であると筆者は考えている。次の章ではこのような世代を扱えるシミュレーションツールを使ったプロジェクトシミュレーションの可能性を考えてみたい。3.プロジェクトプロジェクトの構造リードオプティマイゼーションのプロセスでは、構造最適化されるべき出発化合物が一つまたは複数存在するが、これらの化合物が修飾された後、さらに新しく合成された化合物をもとに新たな化合物が合成されるため、最終的にはプロジェクトの出発化合物をルートとしたツリー構造を形成することになる。ここで、親の化合物に対して子を幾つか合成してみて、そのうちの特性の良いものの上位数化合物から新たな子を生成する(ただし最初のほうは特性が振れやすく最終的には安定する)というようなモデルをつくってシミュレーション[10]してみると以下のような図になる。グラフの描画はCytoscape[11]を用いたが、このような情報もまたグラフとして表現できる。図4において、ノードに化合物、エッジには親子関係をあらわした。世代を経るにつれエッジの色が黄色から緑に変化するようにし、ノードの色は活性のようなものを表現しており、黒から赤になるに従い特性が良くなるようにした。-10-SARNewsNo.19(Oct.2010)図4プロジェクトにおける化合物のシミュレーション実際のプロジェクトにおいては、親子関係がもっと複雑であったり、解決すべき課題が複数あるためにこのような単純な構造は取らないだろうが、プロジェクト全体の「見える化」としては有用な表現方法だと考えられる。プロジェクトシミュレーションJohnDelaney[12]はrandom-walkの一種であるself-avoidingwalkを用いて化合物最適化のシミュレーションを行ない、プロジェクトの成功確率と投入する人員の関係性や、ラボの生産性の考察を行なっており、その結果は興味深い。しかし、本論文においてはself-avoidingwalkを用いたシミュレーションであるために、化合物の構造変換を陽には考慮していない。そこで、先にあげた、ケミストを模倣するようなシミュレーションの枠組みを用意することで化合物の構造を明示的に取り入れ、プロジェクトシミュレーションをより具体的なレベルで行いたいというのが筆者の考えである。もし、このような枠組みを用意できれば、実際のプロジェクトと比較しながらよりよいプロジェクトの意思決定に貢献するようなシステムを構築できるであろうと考えている。もちろん、このようなシミュレーションの評価のためには実際のプロジェクトの歴史が記録されたデータが必要である。そこで、最後の章では、そのようなプロジェクトマネジメントシステムの可能性に関して考えてみる。4.メタ化合物管理システムプロジェクトマネジメントサイクルにおいてはソフトウェア開発と構造最適化プロジェクトに多くの共通点が見られるため、ソフトウェアプロジェクトマネジメントシステムのアナロジーから考えてみる。実際にソフトウェア開発においては既に幾つものアプローチが試みられていて実装も多い。ソフトウェアのバージョン管理システムとしてはSubversion[13]、Git[14]、Mercurial[15]といったツールが有名である。これらの基本的な機能は、ファイルの作成日時、変更日時、変更点などの履歴を保管することである。修正したソフトウェアをリポジトリに追加する行為をコミットまたはチェックインといいコミットを積み重ねることでそのプロジェクトの歴史が形作られ、この歴史のことをコミットツリー(図5)などと呼ぶ。-11-SARNewsNo.19(Oct.2010)図5コミットツリーバージョン管理システムでは複数の人間が扱うことを想定した機能になっており、どのソースコードを改編したかを記憶している。さらに、ソースコードのどの部分が改編されているかといった親との差分が簡単に見えるようになっている。いまここで、そのような化合物管理データベースを考えてみよう。つまりどの化合物から着想を得て改変したかを記録してあるデータベースマネジメントシステムが存在し、いつ、誰がどのような化合物をどの化合物に基づいて合成したかを記録できているとすれば、コミットツリーの矢印は差分を示しており•構造のどの部分が変化したのか•cLogP、PSAや実際に測定した物性値がどのように変化したのか•実際に測定したアッセイ系での変化量といった差分情報が記録されることになるだろう。バージョン管理システムにおいては、差分が簡単に把握できるため、自分が合成した化合物が何を変化させたのか?そしてその結果プロジェクトにどういう影響をあたえたのか?がより明確になる。つまり親子の構造の差分はすなわちケミストの意図やプロジェクトの意思決定結果を反映しており、それらを「見える化」することには大きな意味があるわけである。モデリングの立場からも構造の差分は反応ルールに還元するための重要な情報であるし、このようにデータベース化されていれば、究極的には知識としての反応ルール抽出の自動化が可能になり、シミュレーターにもフィードバックできるようになるため、有用である。さらにマネジメントシステムには並行して走る複数の内部プロジェクトを管理する仕組みが備わっており、違うスキャフォールドを並行して複数展開していく場合にも適切に管理できる。進捗具合や有害事象またはバックアップ化合物の構造最適化が行なわれたり、初期の構造に戻りなおし、新たに合成展開をやり直すといった状況でも、きちんと歴史に残せる。一方、このようなアナロジーでもう一つ見えてくるものは、創薬系のプロジェクトマネジメントにおいてバグトラッキングシステムやイシュー管理システムのようなものが見られないことである。デザインなどのクリエイティブ要素を含む開発現場でも最近はよく使われているという状況において、ドラッグデザインといった、かなりクリエイティブ性の高い領域であまり使われていない状況に筆者は違和感を感じる。ソフトウェアプロジェクトマネジメントシステムにはTrac[16]やRedmine[17]といったバグトラッキングシステムが有名であるが、このように発生した要求変更やバグと歴史の任意の時点を紐づけるような管理の手法が創薬プロジェクトにおいて、今後必要とされるのではないだろうか?5.おわりにモデリング&シミュレーションの大きな目的のひとつはモデリングの作業を通して現実への理解を深めることである。つまり、作ったモデルと実際のデータのギャップデータは何か、隠れた重要な特徴は何か、それを含めた場合に観測されたデータをより特徴づけられるかといったトライアンドエラーを繰り返すことで、よりよい意思決定を行なうのである。-12-SARNewsNo.19(Oct.2010)-13-プロジェクトのある時間軸(ブランチの群)を用いてSARを行った結果に対し、実際にこれから合成する化合物はinterpolationするのかextrapolationするのかきちんと考えることは実際のプロジェクトにおいては非常に重要であり、これらはプロジェクトがどういう歴史をたどってきてこれからどう向かおうとしているのかというメタ情報に影響されるものである。これらのことを考えると、創薬プロジェクトにおいて、構造活性相関解析が行われる化合物のリストのメタ情報の解析といったプロジェクトそのものを評価していくことは意味があると思われるし、そういった情報を記録するようなデータベースまたはインフラストラクチャの整備は重要であると考えている。参考文献[1]http://www.eyesopen.com/[2]http://www.perlmol.org/[3]GuhaR,HowardMT,HutchisonGR,Murray-RustP,RzepaH,SteinbeckC,WegnerJ,WillighagenEL.TheBlueObelisk-interoperabilityinchemicalinformatics.JChemInfModel.2006May-Jun;46(3):991-8.[4]http://www.daylight.com/dayhtml_tutorials/languages/smirks/index.html[5]http://www.symyx.com/downloads/public/ctfile/ctfile.jsp[6]http://accelrys.co.jp/products/pipeline-pilot/[7]http://www.daylight.com/dayhtml/doc/theory/theory.smarts.html[8]BenoBR,LangleyDR.MORPH:anewtoolforliganddesign.JChemInfModel.2010Jun28;50(6):1159-64.[9]http://github.com/kzfm/Chemicho[10]http://gist.github.com/574635[11]http://cytoscape.org/index.php[12]DelaneyJ.Modellingiterativecompoundoptimisationusingaself-avoidingwalk.DrugDiscovToday.2009Feb;14(3-4):198-207.Epub2008Dec8.[13]http://subversion.tigris.org/[14]http://git-scm.com/[15]http://mercurial.selenic.com/[16]http://trac.edgewall.org/[17]http://www.redmine.org/SARNewsNo.19(Oct.2010)/////CuttingEdge/////ChemoinformaticsToolkitsを用いた創薬システム開発におけるラピッドプロトタイピング株式会社理論創薬研究所吉森篤史1.はじめに近年、insilicoにおける創薬技術は、invitro/invivoにおける技術と同様に、創薬プロセスにおいて必要不可欠な技術となっている。創薬プロジェクトにおいては、内在性リガンド、標的タンパク質、特許情報など、開始時(参加時)に得られている情報がプロジェクトごとに大きく異なるため、それに伴い、ComputationalChemistに求められる貢献範囲も様々なものとなる。従って、創薬プロジェクトを成功に導くためにinsilicoで何ができるのかを、与えられた情報を最大限に生かし、かつ有益なアウトプットを出せる戦略として、迅速かつ具体的に提示することが、創薬プロジェクトにおけるComputationalChemistの重要な役割の1つであると言える。特に迅速性は、創薬プロジェクトにおいてinsilicoに期待される普遍的な要求であると考えられる。ソフトウェア開発におけるプロトタイピングとは、はじめから完成版といえるソフトウェアの開発に着手するのではなく、まずは、プロトタイプ(試作品)を作成し、完成版のイメージをユーザーに抱かせることにより、初期段階から適切なフィードバックを得るための手法である。創薬プロジェクトにおいては、過去の経験も含め、様々なアイデアをもった研究者が参加しており、プロトタイプ、及びそれから得られるアウトプットの提示は、ソフトウェアの修正、及び改善点をより的確に把握するための重要な工程であると考えられる。それでは、創薬システムの開発において、迅速なプロトタイピング(ラピッドプロトタイピング)を実現するためには、何が必要であろうか?現在、多くのChemoinformaticsToolkitsが、オープンソースソフトウェアとして公開されている。これらToolkitsには、創薬システムの開発において必要とされるアルゴリズムの多くが実装されており、これらを効率的に利用することで、プロトタイプの開発期間を大幅に短縮することができる。しかしながら、そのApplicationProgramInterface(API)は膨大であり、またドキュメントの整備もあまり進んでいないことから、ソースコードを通して、その使用法を理解しなければならないケースも多い。従って、ラピッドプロトタイピングの実現には、適切なToolkitsの選択だけではなく、APIの使用法や実践的なTipsの整備が重要な課題であると言える。本稿では、ラピッドプロトタイピングの適用例として、ChemoinformaticsToolkitsの1つであるRDKit(http://www.rdkit.org/)を用いた標的タンパク質指向型フラグメントライブラリの構築について紹介する。ラピッドプロトタイピングの面白さと有効性をご理解頂ければ幸いである。2.ChemoinformaticsToolkits現在、オープンソースソフトウェアとして公開されている代表的なChemoinformaticsToolkitsを表1に示す。表1ChemoinformaticsToolkits名称URL言語OpenBabelhttp://openbabel.org/C++/Python他JOELib/JOELIb2http://www.ra.cs.uni-tuebingen.de/software/joelib/JavaCDKhttp://sourceforge.net/apps/mediawiki/cdk/JavaRDKithttp://www.rdkit.org/C++/PythonPerlMolhttp://www.perlmol.org/PerlCinfonyhttp://code.google.com/p/cinfony/PythonOASAhttp://bkchem.zirael.org/oasa_en.htmlPython-14-SARNewsNo.19(Oct.2010)多くのToolkitsは、C++、Java等で実装されているが、SimplifiedWrapperandInterfaceGenerator(SWIG)、Jython、RubyJavaBridge(RJB)などを通じて、様々なスクリプト言語からの利用が可能となっている。この様な仕組みにより、まずは、スクリプト言語でプログラム全体を記述し、性能評価を行った上で、処理速度のパフォーマンスの改善に必要な部分だけ、オリジナルの実装言語で書くなどの作業を行うことができる。ラピッドプロトタイピングにおけるスクリプト言語の利用は、迅速なシステム開発を実現するための必要不可欠な要素であると言える。一方、各々のToolkitsは、互いに共通した機能を持っている反面、Fingerprintや構造生成等、異なった機能も併せ持っている。従って、複数のToolkitsを補完的に利用することにより、目的とするシステムの開発をより効率的に行うことができる。しかしながら、Toolkits間におけるデータの互換性や相互変換の機能はほとんどなく、プログラミングを行う際の大きな障害となっている。Cinfonyでは、この様な問題の解決策の1つとして、OpenBabel、CDK、及びRDKitを共通のインターフェースを通して利用できる仕組みを提案している[1]。ChemoinformaticsToolkitsの利用において、共通インターフェースの普及は、迅速、効率的な創薬システムの開発に大いに貢献するであろう。3.適用例:標的タンパク質指向型フラグメントライブラリの構築近年、Fragment-BasedDrugDiscovery(FBDD)には、実践的な創薬手法の1つとして、多くの関心が寄せられている。その背景として、活性が弱いながらも適切な結合を形成できる小分子を起点とすることにより、HighThroughputScreening(HTS)で得られるリード化合物と比較して、より効率的な合成展開が期待されることが挙げられる。また、FBDDを支える基盤技術として、表面プラズモン共鳴、X線結晶構造解析、核磁気共鳴に代表される物理化学的手法が、目覚しい技術進歩を成し遂げたことも挙げられる。一方、FBDDを行うに当たり、フラグメントライブラリのデザインは、FBDDの成功のカギを握る重要なステップであると言える。一般的に、フラグメントとして適した分子は、RuleofThree[2]に代表されるフラグメント指標により選別され、ライブラリの構築が行われる。本稿では、ラピッドプロトタイピングの適用例として、標的タンパク質指向型フラグメントライブラリの構築について紹介する。ここでは、CellDivisionProteinKinase2(CDK2)に対するFBDDを仮想的な創薬プロジェクトとして設定した。そして、我々に与えられた課題を、CDK2を対象としたフラグメントライブラリの構築と設定して説明を行う。3.1創薬システムの概要ラピッドプロトタイピングの対象となる創薬システムの概要を図1に示す。化合物ライブラリフラグメントライブラリ標的指向型フラグメントライブラリ利用する主な手段フラグメント化(RECAP)完全一致検索(CanonicalSMILES)フィルタリング(RuleofThree)ファーマコフォアの定義(結晶構造の結合様式から抽出)ファーマコフォアサーチ(DistanceGeometry/EnergyMinimization)フラグメントと結合ポケット間のマッチング評価(Alignment)図1創薬システムの概要-15-SARNewsNo.19(Oct.2010)本創薬システムは、はじめに、1)化合物ライブラリの選別、2)化合物ライブラリのフラグメント化、3)重複フラグメントの削除、4)フィルタリングの実施により、フラグメントライブラリを構築する。次に、5)CDK2と阻害剤の共結晶構造からファーマコフォアの定義、6)ファーマコフォアサーチ、7)フラグメントと結合ポケット間のマッチング評価により、標的タンパク質指向型フラグメントライブラリを構築する。ラピッドプロトタイピングを行うに当たり、ChemoinformaticsToolkitsとしてRDKitを選択し、言語はPythonを使うことにした。ここでは、図1の()内に記載した方法により、本創薬システムのラピッドプロトタイピングを実施した。3.2フラグメントライブラリの構築RDKitでは、RetrosyntheticCombinatorialAnalysisProcedure(RECAP)[3]により分子のフラグメント化を行うことができる。RECAPは、11個の切断ルールに基づいて分子をフラグメントに分解する。例えば、切断ルールの1つであるアミド結合の切断は、以下のように定義されている(Recap.py,Line69)。[C;!$(C([#7])[#7]):1](=!@[O:2])!@[#7;+0;!D1:3]>>[*][C:1]=[O:2].[*][#7:3]また、Pythonの対話モードにおいて(RDKitはインストール済みであること)、>>>fromrdkit.ChemimportRecap>>>printRecap.reactionDefsにより、全ての切断ルールを確認することができる。Recap.py最新版では、11個の切断ルールの他に、aromaticnitrogen-aromaticcarbon間の切断ルールが新たに追加されていることが分かる。RECAPを図2の化合物に一般的に適用した場合、1~4の4個のフラグメントに分解される(図2)。一方、RDKitに実装されているRECAPでは、階層的にフラグメント化を行うことができ、この処理により、1~10の10個のフラグメントを得ることができる(図2)。>>>fromrdkitimportChem>>>fromrdkit.ChemimportRecap↓分子をSMILESで入力>>>mol=Chem.MolFromSmiles(“CCCC(=O)Nc1n[nH]c2c1cc(-c1ccccc1)c(-c1ccc(O)cc1)c2”)>>>root=Recap.RecapDecompose(mol)←RECAPによるフラグメント化>>>printroot.GetLeaves().keys()←RECAPの一般的な適用>>>printroot.GetAllChildren().keys()←RECAPの階層的な適用フラグメント化(RECAP)10123486759図2RECAPを用いたフラグメント化-16-SARNewsNo.19(Oct.2010)RECAPを一般的に適用した場合、分子量100以下のフラグメントが大部分を占め、また得られるフラグメント数も少ないが、RECAPを階層的に適用した場合、分子量の幅も広く、また多様なフラグメントを得られることが分かった。本稿では、RECAPを階層的に適用して、分子のフラグメント化を行なった。また、切断部位の原子(図2の*)は、炭素原子でキャッピングを行い、そして、CanonicalSMILESに変換後、文字列比較により、重複の除去を行った。次に、RuleofThreeを用いて、RECAPでフラグメント化された分子のフィルタリングを行った。RuleofThreeとは、一般的に、分子量≦300、cLogP≦3、水素結合供与体数≦3、水素結合受容体数≦3、回転可能結合数≦3、極性表面積≦60Å2として定義されたフラグメントの指標である。本稿では、RECAPによるフラグメント化の際、分子量100以下のフラグメントが多数含まれること、及び後で定義するファーマコフォアのサイズも考慮して、分子量の下限を設けた120≦分子量≦300を採用した。RuleofThreeで用いる記述子は、RDKitのAvailDescriptorsモジュールを用いて計算した。>>>fromrdkitimportChem>>>fromrdkit.ChemimportAvailDescriptors>>>mol=Chem.MolFromSmiles(“CNc1n[nH]c2cc(C)c(C)cc21”)←分子をSMILESで入力>>>mw=AvailDescriptors.descDict[‘MolWt’](mol)#記述子の計算>>>logP=AvailDescriptors.descDict[‘MolLogP’](mol)>>>hd=AvailDescriptors.descDict[‘NumHDonors’](mol)>>>ha=AvailDescriptors.descDict[‘NumHAcceptors’](mol)>>>rb=AvailDescriptors.descDict[‘NumRotatableBonds’](mol)>>>tpsa=AvailDescriptors.descDict[‘TPSA’](mol)>>>printmw,logP,hd,ha,rb,tpsa↓RuleofThreeによるフィルタリング>>>ifmw>=120andmw<=300andlogP<=3.0andhd<=3andha<=3andrb<=3andtpsa<=60:>>>…print“pass”ちなみに、AvailDescriptorsモジュールで利用可能な記述子の種類は、176種類あり、>>>printAvailDescriptors.descListにより、確認することができる。3.3ファーマコフォアの定義RDKitでは、対象とするリガンド分子内に局在する特性基とその距離に基づき、ファーマコフォアの定義を行うことができる。特性基として、”Donor”,“Acceptor”,“NegIonizable”,“PosIonizable”,“Aromatic”等がBaseFeatures.fdefファイル内に定義されており、特性基の変更、及び追加も行うことができる。まずは、リガンド分子内の特性基の探索を行うことにした。>>>importos.path>>>fromrdkitimportChem>>>fromrdkitimportRDConfig>>>fromrdkit.ChemimportChemicalFeatures↓分子をSMILESで入力>>>mol=Chem.MolFromSmiles(“CCCC(=O)Nc1n[nH]c2c1cc(-c1ccccc1)c(-c1ccc(O)cc1)c2”)>>>dataDir=os.path.join(RDConfig.RDCodeDir,’Chem¥¥Pharm3D¥¥test_data’)>>>featFact=ChemicalFeatures.BuildFeatureFactory(os.path.join(dataDir,’BaseFeatures.fdef’))>>>feats=ChemicalFeatures.MCFF_GetFeaturesForMol(featFact,mol)>>>foriinrange(len(feats)):↑分子内にある特性基の検索>>>…family=feats[i].GetFamily()←検索された特性基の種類の取得>>>…printfamily本手順により、分子内に13個の特性基が検出された。本分子は、CDK2との共結晶がProteinDataBank(http://www.pdb.org/)に登録されていることから(PDBID:3LFN)[4]、目視により、この13個の特性基の中からCDK2との結合に重要な特性基の抽出を行った(図3)。-17-SARNewsNo.19(Oct.2010)図3ファーマコフォアの定義CDK2と阻害剤の結合様式から、CDK2のヒンジ領域に位置するLeu83の=Oとの水素結合を示すFeat_1(Donor)、Leu83のNHとの水素結合を示すFeat_2(Acceptor)、そしてLeu134を中心とした疎水領域との結合を示すFeat_3(Aromatic)の3つの特性基をファーマコフォア形成する特性基として定義した(図3左)。そして、各特性基間の距離は、結晶構造から算出した値(単位はÅ)を利用した(図3右)。RDKitにおけるファーマコフォアの設定は、以下の手順で実施することができる。>>>fromrdkit.ChemimportChemicalFeatures>>>fromrdkit.Chem.Pharm3DimportPharmacophore>>>fromrdkitimportGeometry↓特性基の定義>>>feat_1=ChemicalFeatures.FreeChemicalFeature(‘Donor’,Geometry.Point3D(43.1,-11.0,23.8))>>>feat_2=ChemicalFeatures.FreeChemicalFeature(‘Acceptor’,Geometry.Point3D(41.8,-11.2,21.9))>>>feat_3=ChemicalFeatures.FreeChemicalFeature(‘Aromatic’,Geometry.Point3D(39.8,-9.1,23.2))>>>feats=[feat_1,feat_2,feat_3]>>>pcophore=Pharmacophore.Pharmacophore(feats)←ファーマコフォアの設定>>>d_upper=1.5←特性基間の距離の許容範囲(上限値)>>>d_lower=0.5←特性基間の距離の許容範囲(下限値)>>>pcophore.setLowerBound(0,1,2.32-d_lower)#距離の許容範囲の設定>>>pcophore.setUpperBound(0,1,2.32+d_upper)>>>pcophore.setLowerBound(1,2,3.25-d_lower)>>>pcophore.setUpperBound(1,2,3.25+d_upper)>>>pcophore.setLowerBound(0,2,3.89-d_lower)>>>pcophore.setUpperBound(0,2,3.89+d_upper)>>>printpcophoreここでは、便宜上、1つの共結晶構造からファーマコフォアを定義したが、ファーマコフォアの抽出法には様々な手法があるため、上に示すような設定方法を理解していれば、応用展開も容易だと思われる。3.4ファーマコフォアサーチ一般的なファーマコフォアサーチにおいては、分子の3D構造生成後、ファーマコフォアのサーチを行うが、RDKitにおいては、事前に分子の3D構造を生成させるのではなく、ファーマコフォアを満たす3D構造が生成できるか否かを判定基準として、ファーマコフォアのサーチを行うことができる。RDKitにおけるファーマコフォアサーチの流れを以下に示す。なお、紙面の都合上、重要な部分のみを抜粋して示す。-18-SARNewsNo.19(Oct.2010)Step1:ファーマコフォア中の特性基が検索対象の分子中に含まれているか否かを評価match,mList=EmbedLib.MatchPharmacophoreToMol(mol,FeatFact,pcophore)ifmatch:↑ファーマコフォアのマッチング(特性基のみ)num_match=len(mList)foriinrange(num_match):#マッチングした特性基を構成する原子のIDを表示num_feature=len(mList[i])forjinrange(num_feature):printmList[i][j].GetAtomIds()Step2:ファーマコフォアで定義されている特性基間の距離が検索対象の分子内で満たされているか否かを評価bounds=rdDistGeom.GetMoleculeBoundsMatrix(mol)←距離行列の取得pList=EmbedLib.GetAllPharmacophoreMatches(mList,bounds,pcophore)num_match=len(pList)↑ファーマコフォアのマッチングphMatches=[]foriinrange(num_match):#ファーマコフォアにマッチングした特性基num_feature=len(pList[i])#を構成する原子のIDを取得phMatch=[]forjinrange(num_feature):phMatch.append(pList[i][j].GetAtomIds())phMatches.append(phMatch)←phMatchesはStep3で利用するRDKitでは、DistanceGeomerty(DG)[5]により分子の3D構造を生成させる(実際の構造生成はStep3で実施)。DGは原子間の距離データから分子の配座を算出する方法であり、bounds変数に格納されているデータは、この距離データ(距離行列)に相当する。ファーマコフォアで定義されている特性基間の距離と本距離行列を比較することで、検索対象の分子内でファーマコフォアが満たされているか否かを評価している。Step3:ファーマコフォアで定義されている特性基間の距離を分子の距離行列に埋め込み3D構造を生成forphMatchinphMatches:bm,embeds,nFail↓ファーマコフォア制限付きでの3D構造生成=EmbedLib.EmbedPharmacophore(mol,phMatch,pcophore,count=20,silent=1)print”—->embedsnum:”,len(embeds)forembedinembeds:AllChem.UFFOptimizeMolecule(embed)←UFFを用いた最適化len(embeds)が0でなければ、ファーマコフォアを満たす配座をもつ分子(フラグメント)であると判定することができる。また、配座生成は、20回トライ(count=20)するように設定しているため、最大20個のファーマコフォアを満たす配座を得ることができる。生成された配座には、UniversalForceFieldによる最適化を実施する。3.5フラグメントと結合ポケット間のマッチング評価本稿では、CDK2の結合ポケットに位置する阻害剤の3D座標からファーマコフォアを定義しているため、このファーマコフォアとヒットしたフラグメントとをアライメントすることにより、CDK2とフラグメントの複合体構造を構築することができる。アライメントを行うための回転、平行移動行列の取得と、アライメントは以下の処理で行うことができる。align_data=rdAlignment.GetAlignmentTransform(ref_mat,move_mat)←行列の取得AllChem.TransformMol(mol,align_data[1])←アライメント-19-SARNewsNo.19(Oct.2010)-20-結合ポケットにアライメントされたフラグメントは最大20個の配座をもつが、それぞれの配座に対し、結合ポケットを構成する原子と接触がないか、評価を行う。本稿では、フラグメントと結合ポケットを構成する原子間の距離が1.5Å以内であれば、そのフラグメントの配座は結合ポケットに接触すると判断している。一方、結合ポケットと接触しないと判定された配座を1つ以上もつフラグメントは、その配座情報と共に標的指向型フラグメントライブラリに格納される。以上の処理により、本創薬システムのラピッドプロトタイピングは終了となる。3.6プロトタイプの検証本プロトタイプの検証を行うにあたり、ADirectoryofUsefulDecoys(DUD)[6]に登録されている40種類のタンパク質の活性既知の化合物を集めて、化合物ライブラリとして用いた(2950化合物)。次に、RECAPによるフラグメント化とRuleofThreeによるフィルタリングにより、フラグメントライブラリを作成した(1512化合物)。最後に、ファーマコフォアは、CDK2と阻害剤の共結晶(PDBID:3LFN)を用いて定義し(図3右)、フラグメントライブラリに対するファーマコフォアサーチとCDK2の結合ポケットとのマッチングを実施した。結果として、43化合物からなる標的指向型フラグメントライブラリが構築された(図4左)。この43化合物は、定義したファーマコフォアを満たし、かつCDK2の結合ポケットにフィットしていることを確認した(図4右)。図4プロトタイプの検証4.最後に本稿では、ラピッドプロトタイピングという視点から、ChemoinformaticsToolkitsの使用法について述べた。適用例として、標的タンパク質指向型フラグメントライブラリの構築について紹介した。ソースコードの総行数は500行にも満たないため、APIの使用法さえ理解していれば、半日もあれば書くことのできる量である。もちろん、実践的な創薬システムとしては、多くの改善すべき点はあるが、フラグメントの構造式や、標的タンパク質との結合様式は、他の研究者とのコミュニケーションの題材として、有益に利用できるものと思われる。創薬システムの開発において、アイデアを迅速に具体化できる面白さは、Webシステム開発におけるマッシュアップに通じるものがあり、また、ToolkitsのAPIの利用法の整備は、その土台になるものと考えている。なお、RDKitのAPIに関する基本的な利用法については、サンプルプログラムも含めて、http://cheminformist.itmol.comで紹介している。本稿が、皆様の研究開発に少しでもお役に立てれば幸いである。5.参考文献[1]O’BoyleNM,HutchisonGR,Chem.Cent.J.2008,2,24.[2]CongreveM,etal.DrugDiscov.Today2003,8,876.[3]LewellXQ,etal.J.Chem.Inf.Comput.Sci.1998,38,511.[4]LesuisseD,etal.Bioorg.Med.Chem.Lett.2010,20,1985.[5]BlaneyJM,DixonJS,ReviewsinComputationalChemistry,Vol.5,VCH:NewYork,1994,p.299.[6]HuangN,etal.J.Med.Chem.2006,49,6789.SARNewsNo.19(Oct.2010)/////Activities/////構造活性フォーラム2010開催報告「QSARパラダイムの分化と深化」構造活性フォーラム2010実行委員長中川好秋平成22年6月18日(金),コープイン京都(京都市中京区)において,構造活性フォーラム2010を「QSARパラダイムの分化と深化」というタイトルで開催致しました.今回は,QSARの原点に立ち戻り,ClassicalQSAR(Hansch-Fujita法)に焦点を当て,その生みの親である藤田先生にQSAR誕生の秘話と,その応用例について講演をしていただきました.今からちょうど25年前,定期的なフォーラムが開催される以前の1985年(昭和60年)6月に,「定量的構造活性相関の基礎と応用」というタイトルで,講習会が開催されました.この頃は,まだ日本薬学会の部会としては活動しておらず,構造活性相関懇話会の主催で2日間にわたって行われました.今回の講演要旨に藤田先生が書いておられますが,QSARの誕生したのは1961年のことで,来年でちょうど半世紀を迎えます.今回のフォーラムへの参加者は講演者を含めて101名でありました.また,学生の参加費を無料にしましたところ,21名の学生が参加してくれました.一般参加者としては,大学や公的研究機関から24名,企業からは56名でありました.当日のプログラムは以下の通りでした.1.清水良(田辺三菱製薬)座長中山章QSAR—統計的有意性とメカニズムの妥当性2.藤田稔夫(京都大学名誉教授)座長高山千代蔵Hansch-Fujita法の半世紀―生物理化学的意義と創薬企業化成功例3.大軽貴典(田辺三菱製薬)座長大田雅照等級活性データーの取り扱いと3D-QSAR4.中馬寛(徳島大学)座長岡島伸之Hansch-Fujita法の分子論的解釈と分子科学計算を用いたenzymaticQSAR5.仲西功(近畿大学)座長藤原巌分子シミュレーションと構造活性相関清水博士には,藤田先生と入念な打ち合わせを行なっていただき,Hansch-Fujita法を正しく理解するための導入的な内容で講演していただきました.その甲斐もあって,初心者にとって分かりやすく,藤田先生の講演にうまく連結したと思います.藤田先生には,QSARという手法がどのようにして誕生したかを簡単に紹介していただき,Hansch-Fujita法が創薬研究の現場で頻繁に使われてきたことをお話ししていただきました.座長は藤田先生のお弟子さんの高山博士にお願いしましたが,高山博士が藤田先生から受けた薫陶が語られるとともに,QSAR誕生時のHansch,Fujita両先生の写真も公開されました.午後は,大軽博士に3D-QSAR解析と等級データーの取り扱いについて,中馬博士と仲西博士には,計算科学の分野からの講演をお願いしました.お二人からは,それぞれHansch-Fujita法の物理化学的な解釈とタンパク質とリガンド分子間の相互作用についての講演をしていただきました.すべての講演において,活発な質疑応答が行われ,途中で質問を打ち切ったにもかかわらず大幅に時間超過し,総合討論の時間を持つことができませんでした.しかし,それぞれの座長の見事な進行によって,和やかなうちに本講演会を閉じることができました.また,懇親会は,例年のような形をとらず,講演者,学生含むすべての皆様から会費を頂戴して開催させていただきました.予想以上に多くの方々に参加していただき,懇親を深めることができました.末筆ながら,ご講演を頂いた講師の先生方,座長の労をおとりいただいた5人の先生方には心から御礼申し上げます.-21-SARNewsNo.19(Oct.2010)/////Activities/////<会告>第38回構造活性相関シンポジウム日時平成22年10月30日(土)・31日(日)会場徳島大学工学部共通講義棟(5–6F)(徳島市南常三島町2-1)主催日本薬学会構造活性相関部会共催日本化学会日本分析化学会日本農芸化学会日本農薬学会併催第33回情報化学討論会懇親会10月30日(土)連絡先第38回構造活性相関シンポジウム事務局〒105-0014東京都港区芝3-17-15クリエート三田207Tel03-3798-5240Fax03-3798-5251E-mailsar2010@event-convention.com第1日目(10月30日)9:30-9:40開会中馬寛(徳島大院・薬)9:40-11:45SARPresentationAward応募講演(工学部創成スタジオ)座長:赤松美紀KA01分子科学計算に基づくベンゼンスルホンアミド誘導体の炭酸脱水酵素阻害機構解析と相関解析○宗井陽平、島本和典、清水美帆、相原薫、山内香子、吉田達貞、中馬寛(徳大院・薬)KA02インフルエンザノイラミニダーゼ-シアル酸誘導体複合体相互作用の非経験的フラグメント分子軌道法計算に基づく相関解析○比多岡清司、的場弘、郡恵理、原田政隆、吉田達貞、中馬寛(徳島大院・薬)KA03縮環インドール構造を有する新規Eg5阻害剤の開発○竹内智起、大石真也、渡部敏明、大野浩章、浅田直也、北浦和夫(京大院・薬)、澤田潤一、浅井章良(静岡県大院・薬)、藤井信孝(京大院・薬)座長:藤原巌KA04メディシナル・エレクトロノミクス分子としてのオリゴアセチレニック芳香族化合物の疎水性○小畑勝稔、中田英司、宇都義浩、堀均(徳島大院・STS研)KA05代謝物同定およびINSILICO予測を用いたヒト代謝酵素CYP3A4とCYP2C19における基質認識機構の差異○城谷直紀、十川萌、原田俊幸、宮川恒、平井伸博、赤松美紀(京大院・農)、生城真一、榊利之(富山県立大・工)12:40-14:40ポスターセッション(工学部K407教室)※情報化学討論会ポスター会場と共通12:40-13:40奇数番発表13:40-14:40偶数番発表14:40-15:30一般講演(工学部創成スタジオ)座長:飯島洋-22-SARNewsNo.19(Oct.2010)KO01*量子化学計算によるタンパク質とリガンドの結合に及ぼす溶媒効果の解析○浅田直也、北浦和夫(京大院・薬)KO02*高活性・高選択性α2CAdrenoceptorantagonistの創製とホモロジーモデルを用いた相互作用解析○渡辺佳晃、神辺義剛、柏木浩孝、大竹義仁、古田佳之、山口真里奈、與語健二、吉田昌伸、須藤宏和、今川純一、古賀隆樹、大田雅照、森川一実(中外製薬株式会社)15:30-16:25特別講演(工学部創成スタジオ)座長:岡島伸之KS01ThermodynamicAnalysisofProtein-ProteinandProtein-LigandInteractionsProvidesRigorousGuidelinesforDrugDevelopmentErnestoFreire(JohnsHopkinsUniversity,DepartmentofBiology,USA)16:35-17:30特別講演(工学部創成スタジオ)座長:船津公人JS01スパコンがもたらす計算化学の革新平尾公彦(理化学研究所)17:30-18:15招待講演(工学部創成スタジオ)座長:大田雅照KI01単体及び複合体タンパク質を標的としたインシリコスクリーニング広川貴次(産業技術総合研究所生命情報工学研究センター)19:00-懇親会(ホテルグランドパレス徳島)※情報化学討論会と合同ポスターセッション(工学部K407教室)KP01PIMTがL-β-AspあるいはD-α-Aspを含むペプチド基質を認識するメカニズムの計算機的研究○野地郁彦、小林佳奈(東北薬大・薬)、小田彰史(東北薬大・薬、阪大・蛋白研)、高橋央宜(東北薬大・薬)KP02CYPの基質および阻害剤選択性に関する統合解析–機械学習,ドッキング,QSAR–○岡田耕平、山本将博、吉田達貞、中馬寛(徳島大院・薬)KP03ヒドロキシルラジカルによるアミノ酸残基のα-水素引き抜きについての密度汎関数計算○高橋央宜、小林佳奈(東北薬大)、小田彰史(東北薬大、阪大・蛋白研)KP04分子内Redox反応を利用したフルオロアルケンジペプチドイソスター(FADI)含有ペプチドの合成と活性評価○辻耕平、八巻陽子、山本純、重永章(徳島大院・薬)、下東康幸(九州大院・理)、大高章(徳島大院・薬)-23-SARNewsNo.19(Oct.2010)KP05分子モデリング・分子科学計算に基づくヒトノイラミニダーゼの構造-機能解析○原田政隆、比多岡清司、郡恵理、的場弘、北尾聡、MotiurMd.Rahman,吉田達貞、辻大輔(徳島大院・薬)、広川貴次(産総研・CBRC)、伊藤孝司、中馬寛(徳島大院・薬)KP06非経験的分子軌道法によるフェノール水素原子のラジカル引き抜き反応の分子論的考察およびフラボノイドの構造活性相関への応用○廣隅公治、馬島彬、吉田達貞(徳島大院・薬)、志葉優子、河合慶親、寺尾純二(徳島大院・栄養)、中馬寛(徳島大院・薬)KP07マウスリゾチームにおけるアスパラギン残基の部位特異的なラセミ化に関する量子化学計算○小林佳奈(東北薬大)、小田彰史(東北薬大、阪大蛋白研)、高橋央宜(東北薬大)KP08ヒトCathepsinA活性に対するArg344置換の影響に関する実験および分子科学計算に基づく解析○郡恵理、比多岡清司、原田政隆、的場弘、北尾聡、MotiurMd.Rahman、吉田達貞(徳島大院・薬)、門田佳人(徳島文理大・薬)、辻大輔(徳島大院・薬)、広川貴次(産総研・CBRC)、伊藤孝司、中馬寛(徳島大院・薬)KP09S-15176およびその誘導体がミトコンドリアの膜構造と機能に及ぼす作用○川島聡(徳島大・薬、徳島大疾患ゲノム研セ)、山本武範(徳島大疾患ゲノム研セ)、堀内優加、藤原健悟(徳島大・薬、徳島大疾患ゲノム研セ)、山下菊治(徳島大院・HBS)、寺田弘(東京理大・薬)、兼松誠(徳島大・薬)、宍戸宏造(徳島大・薬)、篠原康雄(徳島大・薬、徳島大疾患ゲノム研セ)KP10D-α-アスパラギン酸およびL-β-アスパラギン酸の分子力学計算のためのパラメータの検討○小田彰史(東北薬大・薬、阪大・蛋白研)、小林佳奈、高橋央宜(東北薬大・薬)KP11Insilico創薬技術に基づくD-aspartateoxidase-thiolactomycin複合体の構造解析○中込泉、山乙教之、合田浩明、片根真澄、本間浩、広野修一(北里大・薬)KP12ICAによるファルマコフォアのクラスタリング○石川誠(日産化学)KP13新規解析手法を用いたQSARモデルの構築○本保洋介(阪大院・薬)、岡本晃典(阪大院・薬)、川下理日人(阪大院・薬、阪大微生物病研)、大眉佳大、栗花落昇平、伊藤雅士(阪大院・薬)、高木達也(阪大院・薬、阪大微生物病研)KP14非経験的分子軌道法計算に基づく薬物-受容体分子間相互作用におけるHammettσの電子的効果の解析○清水美帆、馬島彬、吉田達貞、中馬寛(徳島大院・薬)KP15結合自由エネルギー計算とランダムフォレストによるプロテインキナーゼ阻害活性の予測-24-SARNewsNo.19(Oct.2010)○田村勇之進、宮川博夫(大正製薬)KP161-β-O-アシルグルクロニドの構造活性相関:親電子的分解反応に対するカルボン酸α位置換基とキラリティの影響馬場暁子、○吉岡忠夫(北海道薬大)KP17化学物質の反復投与毒性試験における神経毒性のデータ解析とカテゴリー化の検討○西川智、櫻谷祐企、山田隆志、山田隼、前川昭彦、林真(製品評価技術基盤機構)KP18化学物質の反復投与毒性を対象としたカテゴリーライブラリーの開発○櫻谷祐企、西川智、山田隆志、山田隼、前川昭彦(NITE)、林真(NITE、安評センター)KP19副作用情報に基づく薬物性肝障害惹起医薬品の分類と機械学習による安全性予測○庄野由佳理(徳島大・薬)、足立麻美、坂本久美子(徳島大病院)、佐藤陽一、山内あい子(徳島大院・薬)KP20毒性予測分野での適用を目指した新規分類/予測手法の提案○湯田浩太郎((株)インシリコデータ)KP21化学物質の生物濃縮性における極性官能基の影響○池永裕、櫻谷祐企、山田隼(NITE・化学物質管理センター)KP22データマイニングによる反復投与毒性データからの基本活性構造(BAS)抽出大森紀人、○堀川袷志、森幸雄、山川眞透、吉岡祐一、川崎万基子、岡田孝(関学大・理工)、林眞、櫻谷祐企、阿部武丸、西川智(NITE)、広瀬明彦(国衛研)KP23自然免疫関連ペプチドとbis-QACの柔軟性と抗菌能○大倉一人(千葉科学大学)、篠原康雄(徳島大・薬、徳島大疾患ゲノム研セ)、堀均(徳島大院・STS研)KP24ベイジアンネットワークによる化学物質の反復投与毒性評価システムの構築○廣島亮、山口一歩、天木辰哉、岡田孝(関学大・理工)、櫻谷祐企(NITE)KP25誘導適合を考慮したバーチャルスクリーニングによる新規HCVNS3-4Aプロテアーゼ阻害剤の探索○高谷大輔、上條加寿恵(理研)、山下篤哉、前川伸哉、雨宮史武、坂本直哉(山梨大院・医)、脇田隆字(国立感染研)、榎本信幸(山梨大院・医)、伊藤正彦(山梨大院・医)、本間光貴(理研)、梅山秀明(理研、北里大学・薬)、松本武久(理研)、横山茂之(理研)KP26アミノ酸残基の周辺環境に注目したGPCRの配列特徴解析システムの開発○家村享明、加藤博明(豊橋技科大)KP27遺伝的アルゴリズムによってタンパク質ポケットを重ねあわせる○菅谷昇義(ファルマデザイン)KP28タンパク質構造予測のための関数とホモロジーモデリングシステムの構築○荒井まみ(中央大院・理工)、加納和彦、寺師玄記、梅山秀明(北里大・薬)、岩舘満雄(中央大・理工)-25-SARNewsNo.19(Oct.2010)KP29TRNOE測定、コンピュータリガンドドッキング計算および結合自由エネルギー計算を組み合わせたキチナーゼBとArgifin由来ジペプチド阻害剤の相互作用解析○合田浩明(北里大・薬)、砂塚敏明、廣瀬友靖、井口加奈美、菅原章公、野口吉彦、斉藤佳史、山本剛、塩見和朗、大村智(北里生命科学研)、広野修一(北里大・薬)KP30多数のdrug-like化合物を用いたコンホメーション発生プログラムの評価○高木輝文、天野倫子、田中稔祐、冨本昌樹(武田薬品工業)KP31薬物類似構造探索におけるデータ探索手法の比較○PhanThieuVan、高橋由雅(豊橋技科大院・工)KP32肝臓への副作用をおこしやすい特徴的化学構造の抽出○吉岡祐一、大森紀人、堀川袷志、森幸雄、山川眞透、岡田孝(関学大・理工)KP33Gaussian09-SMD法を用いたLogP予測○松本真洋、石川俊夫(石原産業株式会社)第2日目(10月31日)8:30-9:20一般講演(工学部創成スタジオ)座長:小沢知永KO03*インフルエンザウィルス由来金属酵素RNAポリメラーゼを標的とするジケト酸阻害剤の結合様式の予測と分子設計○石川吉伸、藤井敏(静県大・薬)KO04*原子間相互作用の摂動解析○小山洋平(理研・CDB)、小林徹也(東大・生研)、上田泰己(理研・CDB)9:20-10:20特別セッション(工学部創成スタジオ)「タンパク質ホモロジーモデリングと構造活性相関の融合」座長:久保寺英夫KF01複合体タンパク質モデリングと生物情報学的リガンドドッキングの統合:Integrated-FAMS○梅山秀明(北里大・薬、理研)、小松克一郎、山本理恵(北里大・薬)、高谷大輔(理研)、加納和彦(NIIDJapan)、寺師玄記(北里大・薬)、岩舘満雄(中央大、理研)、竹田-志鷹真由子(北里大・薬、理研)KF02昆虫脱皮ホルモン受容体とリガンドとの相互作用中川好秋(京大院・農)KF03ニコチン性アセチルコリン受容体と殺虫剤ネオニコチノイドとの相互作用赤松美紀(京大院・農)10:30-11:15招待講演(工学部創成スタジオ)座長:山下富義KI02薬物の毒性と代謝:基質の構造から酵素の認識を読む山添康(東北大院・薬)-26-SARNewsNo.19(Oct.2010)-27-11:15-12:10特別講演(工学部創成スタジオ)座長:藤田稔夫KS02CondensingChemicalReactionstoPseudo-molecules:AnEfficientWayofReactionsMiningAlexandreVarnek(UniversityofStrasbourg,LaboratoryofChemoinformatics,France)13:10-14:40招待講演(工学部創成スタジオ)座長:宍戸宏造KI03エピジェネティックに遺伝子発現を制御する低分子化合物の設計と合成宮田直樹(名古屋市立大院・薬)座長:大高章KI04細胞治療を助ける化合物上杉志成(京大・物質-細胞統合システム拠点)14:55-16:15一般講演(工学部創成スタジオ)座長:合田浩明KO05*自然言語処理によるCYP代謝情報の網羅的収集とそれに基づく構造活性相関解析○山下富義、吉田秀哉、馮春来、橋田充(京大院・薬)KO06進化計算を用いた新薬候補構造の骨格デザインに関する研究○丸野裕史、高橋由雅(豊橋技科大院・工)座長:本間光貴KO07相互作用プロファイルによるタンパク質複合体予測のポストドッキング解析○内古閑伸之(東工大院・情理)、広川貴次(産総研・CBRC)、秋山泰(東工大院・情理)KO08*分子重ね合わせ法を用いたLigand-BasedDrugDesign手法によるcongenericな化合物群の3D-QSARモデルの構築及びその検証○土井一生、山乙教之、合田浩明、広野修一(北里大・薬)16:15-16:30SARPresentationAward表彰式(工学部創成スタジオ)閉会※一般講演(KO01~08)の*印はA講演25分(発表20分,質疑5分),無印はB講演15分(発表10分,質疑5分),SARPresentationAward応募講演(KA01~05)は25分(発表18分,質疑7分)SARNewsNo.19(Oct.2010)/////Activities/////構造活性相関部会の沿革と趣旨1970年代の前半、医農薬を含む生理活性物質の活性発現の分子機構、立体構造・電子構造の計算や活性データ処理に対するコンピュータの活用など、関連分野のめざましい発展にともなって、構造活性相関と分子設計に対する新しい方法論が世界的に台頭してきた。このような情勢に呼応するとともに、研究者の交流と情報交換、研究発表と方法論の普及の場を提供することを目的に設立されたのが本部会の前身の構造活性相関懇話会である。1975年5月京都において第1回の「懇話会」(シンポジウム)が旗揚げされ、1980年からは年1回の「構造活性相関シンポジウム」が関係諸学会の共催の下で定期的に開催されるようになった。1993年より同シンポジウムは日本薬学会医薬化学部会の主催の下、関係学会の共催を得て行なわれることとなった。構造活性相関懇話会は1995年にその名称を同研究会に改め、シンポジウム開催の実務担当グループとしての役割を果すこととなった。2002年4月からは、日本薬学会の傘下組織の構造活性相関部会として再出発し、関連諸学会と密接な連携を保ちつつ、生理活性物質の構造活性相関に関する学術・研究の振興と推進に向けて活動している。現在それぞれ年1回のシンポジウムとフォーラムを開催するとともに、部会誌のSARNewsを年2回発行し、関係領域の最新の情勢に関する啓蒙と広報活動を行っている。本部会の沿革と趣旨および最新の動向などの詳細に関してはホームページを参照頂きたい。(http://bukai.pharm.or.jp/bukai_kozo/index.html)編集後記日本薬学会構造活性相関部会誌SARNews第19号をお届けいたします。今回は、創薬におけるchemoinformatics手法の活用という観点から纏めてみました。お忙しい中ご執筆いただきました諸先生方に、心よりお礼申し上げます。Perspective/Retrospectiveでは、長谷川清先生(中外製薬)に、ファーマコフォアモデルによるバーチャルスクリーニングやdenovo設計などchemoinformatics分野の最先端研究・最新情報のご紹介とともに、プロジェクト化合物最適化のための独自ADMET予測システム構築や化合物空間の可視化を解説していただきました。CuttingEdgeでは、大川和史先生(持田製薬)に、化学構造プログラミング・化合物構造最適化プロジェクトシミュレーション・メタ化合物管理システムなど、独創的手法の開発と活用について、また、吉森篤史先生(理論創薬研究所)に、ソフトウェアの高効率開発の実例として、オープンソースchemoinformaticstoolkitsを駆使したラピッドプロトタイピング手法について、ご紹介をいただきました。創薬研究者としては、日々online/offlineで発信される厖大なchemoinformatics情報とこれを解析する新規な手法から目を離すことができません。このような状況の中、創薬現場で適時・適切にchemoinformatics手法を活用する上で、いずれのご解説も実践的・具体的情報としてたいへん有用であると思われます。このSARNewsが構造活性相関研究の先端情報と展望を会員の皆様にご提供できることを、編集委員一同願っております。(編集委員会)SARNewsNo.19平成22年10月1日発行:日本薬学会構造活性相関部会長赤松美紀SARNews編集委員会(委員長)久保寺英夫藤原巌福島千晶粕谷敦飯島洋*本誌の全ての記事、図表等の無断複写・転載を禁じます。-28-__