▶CBIホームページ
チュートリアル
<English>

▼TS01 Pythonを使ったケモインフォマティクス チュートリアル 10月27日(月)13:00-17:00 [研修室]
▼TS02 FMOデータベース実践チュートリアル
-生体高分子の量子化学的分子間相互作用データの活用-
10月27日(月)13:00-17:00 [401]
▼TS03 KNIMEを使ったケモインフォマティクス入門 10月27日(月)13:00-17:00 [407]
TS01 [研修室] 10月27日 13:00-17:00
 
Pythonを使ったケモインフォマティクス チュートリアル
Cheminformatics tutorial with python

セミナー概要

1)最新バージョンのRDKitの紹介:Greg Landrum氏
RDKit 開発者のGreg Landrum氏をお招きし最新バージョンのRDKitに実装された機能を紹介していただきます。
コードの共有が可能であれば参加者の皆様もその場で一緒にコーディングしていただくことができます。

2)ハンズオントレーニング
化合物情報の前処理~特徴量算出~データスプリットなどのプロセスはケモインフォマティクスのタスクにおいて非常に大切な部分です。今回のチュートリアルではデータの前処理、特徴量算出、 データスプリットなどに有用なパッケージを題材としてハンズオントレーニングを行います。 また、処理したデータを用いて、構造生成、またはGNN予測モデルの作成などについても実施してみる予定です。
参加者皆様の日々のインフォマティクスの業務でも利用できる情報を持ち帰っていただくことをゴールといたします。

必要なスキル

・Conda などを利用した環境構築が自身でできる方
・ケモインフォマティクス関連のプログラムを書いた経験がある方。
・環境構築に不安を感じる方は参加をお控えください。コードは公開予定です。

モデレーター

芹沢 貴之(第一三共株式会社)、大川 和史(塩野義製薬株式会社)、 新井 浩一郎(旭化成ファーマ株式会社)、
高橋 一敏(味の素株式会社)、 宮野 奈津美(帝人ファーマ株式会社)
---------------------------------------------
・参加費: 33,000円(税込)
・申込〆切: 9月26日
・定員: 84名
---------------------------------------------
TS02 [401] 10月27日 13:00-17:00
 
FMOデータベース実践チュートリアル -生体高分子の量子化学的分子間相互作用データの活用-
Practical Tutorial on the FMO Database:
Utilizing Quantum Chemical Intermolecular Interaction Data of Biomacromolecules

 フラグメント分子軌道(FMO)計算結果を収載したFMOデータベース(FMODB; https://drugdesign.riken.jp/FMODB/)は、2019年2月の一般公開以来データ数を増やし、2024年7月29 日時点で37,426個のFMO計算データ(ユニークなPDB ID: 7,782)を公開している。最近では、富岳等のスパコンを用いた大規模な解析、SCOP2のタンパク質基本フォールド代表構造の網羅計算、FMOデータからの相互作用エネルギーの特徴量抽出やAI予測等の取り組みも進んでいる。本セッションでは、初学者向けのFMODBの概要の紹介から、実際に登録されているデータを用いた創薬研究のための解析方法や最新の研究事 例を紹介する。当日は、実際のFMO計算の解析をチュートリアル形式で実施する。FMODBの詳細を知りたい方、実際にFMO計算結果を解析してみたい方のご参加をお待ちします。

モデレーター

加藤 幸一郎(九州大学)、高谷 大輔(大阪大学)、大山 達也(理研)
---------------------------------------------
・参加費: 無料
・申込〆切: 10月17日
・定員: 30名
---------------------------------------------
TS03 [407] 10月27日 13:00-17:00
 
KNIMEを使ったケモインフォマティクス入門
Introduction to Chemoinformatics Using KNIME

 本チュートリアルでは、医薬品データを題材に、ワークフロー構築型ツール「KNIME」の基本操作から簡単 な機械学習モデルの作成までを体験します。はじめに、CSVファイルから化合物の活性データを読み込み、前処理(欠損値処理、特徴量選択、正規化)を行います。続いて、ロジスティック回帰モデルとランダムフォレストモデルを用いて、活性分類を実施します。ハイパーパラメータチューニングを行い、モデル精度を向上させるプロセスも紹介します。操作はすべてノーコードで進めるため、初心者でも直感的にデータ解析の流れを理解できる内容とします。最終的には、参加者が自ら簡単なワークフローを構築し、評価指標を確認できることを目標としています。

モデレーター

江崎 剛史(滋賀大学)、植沢 芳広(明治薬科大学)
---------------------------------------------
・参加費: 無料
・申込〆切: 9月30日
・定員: 30名
---------------------------------------------