▶CBIホームページ
チュートリアル
<English>

▼TS01 Pythonを使ったケモインフォマティクス チュートリアル 10月27日(月)13:00-17:00 [研修室]
▼TS02 FMOデータベース実践チュートリアル
-生体高分子の量子化学的分子間相互作用データの活用-
10月27日(月)13:00-17:00 [401]
▼TS03 KNIMEを使ったケモインフォマティクス入門 10月27日(月)13:00-17:00 [407]
TS01 [研修室] 10月27日 13:00-17:00
 
Pythonを使ったケモインフォマティクス チュートリアル
Cheminformatics tutorial with python

セミナー概要

第一部: RDKit最新バージョンの紹介: Greg Landrum 13:00~13:45
RDKit開発者のGreg Landrum氏によるRDKitの最新機能紹介。
様々なケモインフォマティクスのプログラムに利用されているRDKitの開発者Greg Landrum氏ご本人から最近のRDKitに実装された新機能を紹介していただきます。

第二部: ハンズオントレーニング: 芹沢 貴之(第一三共)13:45~16:30
今回のハンズオントレーニングでは、Graph Neural Networkや基盤モデル (Foundation model) の最新のアルゴリズムを用いた予測モデルの構築方法を学びます。
また、Datamolを用い、データセットを意味のある方法で分割するための方法を学ぶ予定です。
実際に手を動かして触ってみることでご自身の研究業務への応用のモチベーション向上や導入へのハードルが下がることが期待されます。また、全てのコードはオープンソースのものを利用するため、マテリアルを転用し業務に活用していただくことも可能です。

2つの異なるアプローチでの予測モデル構築

  • Graph Neural Network (GNN)
    • GNN予測モデルをGraphiumで構築する。
  • 基盤モデルのFine Tuning
    • 大規模な化合物データを学習させた基盤モデルMolEを用いた予測モデルを構築し、分子のEmbedding取得とその可視化も行う。

第三部:フリーディスカッション:16:30~17:00
講師への質問タイム、コードの試行や参加者同士の交流の時間とする。

参加にあたって

本ハンズオンは中級者以上向けとなるため、以下のスキルを前提とします。
  • condaコマンドによる環境構築がご自身で可能
  • RDKitでケモインフォマティクスのプログラムを書いた経験
会場のネットワーク速度と時間の関係で、condaでの環境構築は事前に済ませておいてください(ハンズオンでは行いません)。また、過去のハンズオンのマテリアル(2023, 2024)も公開していますので、参加を検討している場合は参考にしてください。

モデレーター

芹沢 貴之(第一三共株式会社)、大川 和史(塩野義製薬株式会社)、 新井 浩一郎(旭化成ファーマ株式会社)、
高橋 一敏(味の素株式会社)、 宮野 奈津美(帝人ファーマ株式会社)
---------------------------------------------
・参加費: 33,000円(税込)
・申込〆切: 9月30日
・定員: 84名
---------------------------------------------
TS02 [401] 10月27日 13:00-17:00
 
FMOデータベース実践チュートリアル
-生体高分子の量子化学的分子間相互作用データの活用-

Practical Tutorial on the FMO Database:
Utilizing Quantum Chemical Intermolecular Interaction Data of Biomacromolecules

 フラグメント分子軌道(FMO)計算結果を収載したFMOデータベース(FMODB; https://drugdesign.riken.jp/FMODB/)は、2019年2月の一般公開以来データ数を増やし、2024年7月29 日時点で37,426個のFMO計算データ(ユニークなPDB ID: 7,782)を公開している。最近では、富岳等のスパコンを用いた大規模な解析、SCOP2のタンパク質基本フォールド代表構造の網羅計算、FMOデータからの相互作用エネルギーの特徴量抽出やAI予測等の取り組みも進んでいる。本セッションでは、初学者向けのFMODBの概要の紹介から、実際に登録されているデータを用いた創薬研究のための解析方法や最新の研究事 例を紹介する。当日は、実際のFMO計算の解析をチュートリアル形式で実施する。FMODBの詳細を知りたい方、実際にFMO計算結果を解析してみたい方のご参加をお待ちします。

モデレーター

加藤 幸一郎 Koichiro Kato(九州大学 Kyushu University)
高谷 大輔 Daisuke Takaya(大阪大学 The University of Osaka)
大山 達也 Tatsuya Ohyama(理化学研究所 RIKEN IMS)

【プログラム】

13:00-13:05 はじめに 加藤幸一郎(九州大学)

13:05-14:35 
「FMOデータベースの紹介とデータ活用方法」
 高谷 大輔(大阪大学)

量子化学計算の一つである FMO 法により得られる相互作用エネルギー(IFIE/PIEDA) はタンパク質-リガンド間相互作用解析及び創薬研究への応用が期待されている。我々のグループでは FMO計算データの蓄積を目的としたFMODBを開発し、FMODDコンソーシアムのメンバーによる計算、自動化前処理プロトコールで計算された結果等のFMOデータを閲覧するための簡便なインターフェイスをホームページから提供している。本セクションではFMODBが提供する機能や開発状況について紹介する。また、FMODB データの活用に向けた、ターゲットタンパク質の構造情報等の各種条件設定によるデータ検索のデモンストレーションも行う予定である。

14:35-14:55 休憩

14:55-16:25
「FMODBを活用したリガンド–タンパク質間の動的平均相互作用解析」
 森 義治(九州大学)

リガンド‐タンパク質間の動的平均相互作用解析について、CDK2を題材にFMODBのwebインターフェイスおよびBioStation Viewerを用いた解析を行う。関連研究の最新動向を紹介すると共に、一連のMDスナップショット構造に対するFMO計算で得られた複数のcpfファイル(IFIEなどの各種数値が格納されたファイル)から1つの動的平均cpfファイルの作成を行い、動的平均cpfファイルを用いた解析を実践する。

16:25-16:35 まとめ 加藤 幸一郎(九州大学)

16:35-17:00 個別相談等

【事前の準備について】

チュートリアルでの説明と並行して、実際にFMOデータベース、BioStation Viewerの操作を行っていただきます。なお、チュートリアルで実際に使用する最新版のBioStation Viewer等のプログラムやデータについては、チュートリアル開催の一週間前をめどに【FMODBチュートリアル資料一式】を掲載したサイトURLをご案内する予定です。

---------------------------------------------
・参加費: 無料
・申込〆切: 10月17日
・定員: 30名
---------------------------------------------
TS03 [407] 10月27日 13:00-17:00
 
KNIMEを使ったケモインフォマティクス入門
Introduction to Chemoinformatics Using KNIME

 本チュートリアルでは、医薬品データを題材に、ワークフロー構築型ツール「KNIME」の基本操作から簡単 な機械学習モデルの作成までを体験します。はじめに、CSVファイルから化合物の活性データを読み込み、前処理(欠損値処理、特徴量選択、正規化)を行います。続いて、ロジスティック回帰モデルとランダムフォレストモデルを用いて、活性分類を実施します。ハイパーパラメータチューニングを行い、モデル精度を向上させるプロセスも紹介します。操作はすべてノーコードで進めるため、初心者でも直感的にデータ解析の流れを理解できる内容とします。最終的には、参加者が自ら簡単なワークフローを構築し、評価指標を確認できることを目標としています。

モデレーター

江崎 剛史(滋賀大学)、植沢 芳広(明治薬科大学)
---------------------------------------------
・参加費: 無料
・申込〆切: 9月30日
・定員: 30名
---------------------------------------------