『ケモインフォマティクス』 | |||
▼IL01-01 | Gregory Landrum(Eidgenössische Technische Hochschule Zürich) | 10/28(火)14:10-14:50 | |
"A personal perspective on open science, open source, and open data" | |||
▼IL01-02 | 山西 芳裕(名古屋大学大学院情報学研究科) | 10/28(火)14:50-15:30 | |
「Data-driven identification of therapeutic targets and drug candidates through machine learning」 | |||
『医療情報が拓く創薬研究:データから標的探索へ』 | |||
▼IL02-01 | 黒田 知宏(京都大学医学部附属病院 医療情報企画部) | 10/29(水)14:00-14:30 | |
「改正次世代医療基盤法が拓く医療情報の創薬への活用」 | |||
▼IL02-02 | 国本 亮(第一三共株式会社) | 10/29(水)14:30-15:00 | |
「創薬標的候補探索へのオミクスデータの活用(仮)」 | |||
▼IL02-03 | 石谷 太(大阪大学 微生物病研究所) | 10/29(水)15:00-15:30 | |
「〜健康長寿の合成生物学〜オミクスデータから見つけた因子を利用して超短命動物に健康長寿を合成する」 | |||
『生成AI:未来を紡ぐ知のエンジン』 | |||
▼IL03-01 | 鈴木 潤(東北大学 言語AI研究センター) | 10/30(木)14:00-14:30 | |
「生成AIの進化予測:現在の動向と今後の展望」 | |||
▼IL03-02 | 水野 和恵(株式会社Preferred Networks) | 10/30(木)14:30-15:00 | |
「Preferred Networksにおけるライフサイエンス領域での生成AI活用の取り組み」 | |||
▼IL03-03 | 中郷 孝祐(株式会社Sakana AI) | 10/30(木)15:00-15:30 | |
「Sakana AIが推進する生成AI研究の方向性」 |
招待講演『ケモインフォマティクス』 IL01-01 |
[Big hall] 10/28 14:10-14:50 | |
![]() |
A personal perspective on open science, open source, and open data | |
Gregory Landrum | ||
Eidgenössische Technische Hochschule Zürich (ETH Zurich) |
I have been writing open-source scientific software and advocating for a more open practice of science in chemistry for almost 20 years. In that time a large shift towards increased openness has taken place in the norms and common practices in our field. In this talk I provide an argument for why openness in science is important, try to debunk some common myths about open science, and look back at how things have changed for the better. I will argue that by staying pragmatic and focused on the most important aspects we can continue to improve and will end up doing better science faster.
Recent developments in biotechnology have contributed to the increase in the amounts of high-throughput data in the genome, transcriptome, proteome, interactome, phenome and diseasome. At the same time, the high-throughput screening of large-scale chemical compound libraries with various biological assays is enabling us to explore the chemical space of possible compounds. These big data can be useful resources for drug development processes. Artificial intelligence and machine learning methods are expected to play key roles in the big data analysis. In this study, we developed novel machine learning methods for various applications in drug discovery. First, we present a computational approach for therapeutic target identification. A critical element of drug development is the identification of therapeutic targets for diseases, but the depletion of therapeutic targets is a serious problem. Here we propose to integrate genome-wide and transcriptome-wide association studies for predicting new therapeutic targets of various diseases including orphan diseases. Next, we present a network-based and structure-based approach for discovering therapeutic and side effects of drug candidate compounds. The prediction is performed based on molecular interaction networks and genome-side scale protein structures revealed by AlphaFold. Finally, we present a computational approach for de novo drug design. Most previous methods are based on chemical information, but they do not take into account biological information. Here we propose to utilize various biological data and polypharmacology toward the de novo design of drug candidate molecular structures with desired properties.
2018年5月に施行された次世代医療基盤法は、創薬科学や医療機器開発等を促進するための個人情報保護法の特別法として制定された。しかし、利用できる情報が匿名加工医療情報に限られるなどの多くの制約が災いし、広く活用されるには至らなかった。そこで、2024年4月に施行された改正法では、仮名加工医療情報、連結可能匿名加工医療情報などの新しい概念が導入され、薬事目的でのデータの提出、NDB等の公的データベースとの連結などが制度的に可能になり、医療情報利用の可能性が広がった。また、近年ではNDB等の公的データベースから仮名加工情報の提供が検討されており、この先より高度なデータ活用が可能になると想像されている。本講演では、改正次世代医療基盤法について概説し、これを最大限活用した創薬研究の促進方法について概観する。併せて、医療データ基盤整備で先行している欧州EHDS (European Health Data Space) の考え方を鏡にして、医療データサイエンスを更に加速させるための、医療情報基盤制度の在り方などについて論じる。
The Next-Generation Medical Infrastructure Act, which came into force in May 2018, was enacted as a special law of the Personal Information Protection Act to promote drug discovery science and medical device development. However, due to many restrictions, such as the fact that the information that can be used is limited to anonymously processed medical information, it has not been widely used. Therefore, the amended law, which came into force in April 2024, introduced new concepts such as pseudonymized medical information and linkable anonymously processed medical information, making it possible to submit data for pharmaceutical purposes and link with public databases such as NDB, expanding the possibilities for using medical information. In addition, nowadays, the provision of pseudonymized information from public databases such as NDB has been considered, and it is expected that more advanced data utilization will become possible in the near future. In this lecture, I will provide an overview of the revised Next-Generation Medical Infrastructure Act and of how to promote drug discovery research by making the most of it. In addition, I will discuss the form of the medical information infrastructure system to further accelerate medical data science, taking the idea of the European Health Data Space (EHDS), which is a pioneer in the development of medical data infrastructure, as a mirror.
招待講演『医療情報が拓く創薬研究:データから標的探索へ』 IL02-02 |
[Big hall] 10/29 14:30-15:00 | |
![]() |
「創薬標的候補探索へのオミクスデータの活用(仮)」 |
|
国本 亮 | ||
第一三共株式会社 |
健康寿命を延伸するためには、全身の老化を制御する技術を確立する必要がある。近年の分子細胞生物学研究によって、細胞老化やオートファジー低下、幹細胞活性低下など細胞レベルでの老化メカニズムが急速に解明された。また、データの充実とバイオインフォマティクス解析の急速な発展によって、長寿因子や疾患リスク因子の候補が特定されつつある。しかしながら、全身レベルでの老化制御機構の解明や、それを制御する手法の開発は、いまだ十分には進んでいない。本シンポジウムでは、私たちの新たなアプローチである「健康長寿の合成生物学」についてお話しする。具体的には、寿命や健康寿命の異なるヒト個体間、動物種間、動物系統間、そして雌雄間の比較解析から見出された健康長寿因子候補を、超速老化魚ターコイズキリフィッシュ(学名Nothobranchius furzeri;略称キリフィッシュ、飼育可能な脊椎動物の中で最も短命)に導入し、人工的に健康長寿を創出することで、健康長寿を達成するために必要な因子を迅速に探索する。このアプローチにより、健康寿命を延ばすための新たな技術の発見を加速し、将来的にはヒトの健康長寿の実現へと発展させていきたい。
To extend healthy lifespan, it is necessary to establish technology to control whole-body aging. In recent years, molecular cell biology research has led to a rapid understanding of aging mechanisms at the cellular level, and bioinformatics analysis has led to the identification of longevity factors and disease risk factors. However, there has been little progress in understanding the control mechanisms of aging at the whole-body level, and in developing approaches to control it. In this symposium, I will talk about our new approach, "the synthetic biology of healthy longevity". Specifically, we introduce candidates for healthy longevity factors found through comparative analysis between human individuals, animal species, animal strains, and males and females with different lifespans and healthspans into the ultra-fast aging killifish (Nothobranchius furzeri), and artificially create healthy longevity to rapidly search for factors necessary for achieving healthy longevity. By taking this approach, we hope to accelerate the discovery of new technologies to extend healthy lifespan and develop them into the future realization of healthy longevity in humans.
ChatGPTに代表される文章生成AIでは、深層ニューラルネットワーク(Transformer)に基づく言語モデルが中心的な役割を担っています。ChatGPTが2022年11月末に登場してから約3年間、理論および実験の両面から言語モデルの本質的な能力を多角的に検証する研究が盛んに行われてきました。例えば、昨今の言語モデルの性能を決定づける根源的な原理としては、学習データ量とモデルパラメータ数のスケーリング則が成り立つことにより説明されますが、同様に、適切な手法を用いることで、推論時の計算量に関するスケーリング則が成り立つことが実験的に示されています。さらに、学習データ量が一定の場合には、品質の高いデータを用いることでより優れた性能が得られることも示されています。また、言語モデルの解釈研究では、モデルが知識をどのように符号化しているかを調べる研究が進められ、追加学習を必要としない介入(ステアリング)手法の開発が注目されています。さらに、言語モデル単独では、誤情報(いわゆる「幻覚」)の生成や、安全性の担保を外部モジュールなしに完全に防ぐのは難しいことが指摘されています。
本講演では、これまでに述べてきた言語モデルの得意・不得意および昨今の機能拡張に関する話題を取り上げ、それらを説明する理論や観測・分析結果を踏まえて、言語モデルの現状の到達点と今後の発展について独自の視点から議論したいと考えています。
In generative AI for text, as exemplified by ChatGPT, language models based on deep neural networks (Transformers) play a central role. In the approximately three years since ChatGPT’s launch at the end of November 2022, researchers have conducted both theoretical (mathematical) and empirical studies to probe its underlying capabilities from a wide range of perspectives.
For example, findings to date suggest that the fundamental rationale underlying the performance of language models lies in the fact that scaling laws hold with respect to both the amount of training data and the number of model parameters. Similarly, researchers have now discovered that a scaling law for test-time computation holds when an appropriate method is employed. Moreover, with the same amount of training data, higher-quality data yields superior performance. As another example, some studies in the field of mechanistic interpretability have examined how models encode knowledge and are now focusing on developing steering methods for interventions that require no further training. Furthermore, numerous studies have pointed out that language models, on their own, struggle to entirely prevent the generation of false information (so-called "hallucinations") and to fully guarantee safety without relying on external modules.
In this talk, I will cover a few major topics regarding the strengths and weaknesses of recent language models and draw on their underlying rationale to discuss my analyses and interpretations of current progress and future developments.
In this talk, I will revisit the strengths, weaknesses, and functional enhancements of the language models discussed above, and drawing upon relevant theoretical justifications, empirical observations, and analytical findings, I aim to offer my own perspective on the current progress and future developments of language models.
Preferred Networks (PFN)は、ライフサイエンスおよびヘルスケア領域において、AI技術を活用した事業や研究開発を推進しています。当該分野のプロダクトやサービスは、創薬研究者、医療従事者といった専門家のみならず、患者やその家族など多岐にわたるステークホルダーが利用するため、その用途とユーザー特性に応じた信頼性の高い開発・運用体制が求められます。
PFNでは、以前より倫理的な指針として自社のAI policyを定めて運用してきましたが、生成AI関連技術の導入に伴い、より実践的なプロセスの策定と体制作りを進めてきました。具体的には、AIプロダクト・サービスのリスク管理を目的としたガバナンス推進組織を設置し、社内確認プロセスおよびAIガバナンス体制の構築・運用を実施しています。
本発表では、前半でPFNが手掛けるライフサイエンス・ヘルスケア領域のサービスや研究事例をご紹介します。後半では、これら事例の中からいくつかを選定し、開発および運用段階においてAIガバナンスの観点からどのように検討・対応を実施したかについて概説します。本講演を通じて、AI技術を社会実装する上での課題と、その解決に向けた実践的なアプローチとしてPFNの取り組みをご提示し、参加者の皆様の研究・実務の一助となれば幸いです。
Preferred Networks (PFN) is developing AI-based businesses in the life sciences and healthcare fields, including drug discovery. Products and services in these fields are used by a wide range of people, including researchers, medical professionals, patients, and the general public, and gaining the trust of users is essential. PFN has long established its own AI policy as an ethical guideline. With the introduction of generative AI-related technologies, the company has been working to develop more practical processes and systems. Specifically, PFN has established a governance promotion organization to manage risks associated with AI products and services, and is building and operating internal review processes and an AI governance framework.
In this presentation, we will first introduce PFN's services and research examples in the life sciences and healthcare fields. Next, we will outline how we have considered AI governance in the development and operation stages for some of these examples.
Through this presentation, we hope to share the challenges of implementing AI technologies in society and practical approaches to solving them.
招待講演『生成AI:未来を紡ぐ知のエンジン』 IL03-03 |
[Big hall] 10/30 15:00-15:30 | |
![]() |
「Sakana AIが推進する生成AI研究の方向性」 Sakana AI's directions in generative AI research |
|
中郷 孝祐 Kosuke Nakago |
||
株式会社Sakana AI Sakana AI |
本講演では、Sakana AIが取り組む幅広い生成AIの研究開発の中から、科学的な探求に関連する先駆的な取り組みを紹介していく。
はじめに、創業初期から探求するアプローチとして、既存の多様な基盤モデルを組み合わせることで集合知(Collective Intelligence)を形成し、性能向上を目指す研究を概観する。その具体例として、Evolutionary Model Merge (EMM)やAdaptive Branching Monte Carlo Tree Search (AB-MCTS)について述べる。
次に、生成AIの適用範囲を新たな領域へ拡張する上で、適切な評価指標(ベンチマーク)の確立は不可欠である。新たなベンチマークを提案することで当該分野の研究促進に貢献する試みとして、ALE-Bench 、AI CUDA Engineer、Sudoku-Bench、EDINET-Benchなどを紹介する。
さらに、研究プロセス全体の自動化を目指す試みとして、アイデア生成から実験、論文執筆までを行うAI Scientistと、その後継研究でICLR 2025 Workshopの査読プロセスを通過した論文の生成に成功したAI Scientist v2を取り上げる。
従来、このようなAIエージェントのワークフローは人手で設計されるが、その構築プロセス自体をAI、つまりMeta Agentに委ねるアプローチも探求している。ここでは、その一例としてAutomated Design of Agentic Systems (ADAS)やDarwin Gödel Machine (DGM)に言及する。
以上の取り組みを通じて、生成AIの研究開発における最近の動向と今後の可能性を議論したい。
We will introduce several key initiatives from Sakana AI's research and development in generative AI, with a focus on approaches in scientific field.
First, we will outline an approach we have been exploring since company’s foundation: forming a collective intelligence through the combination of diverse, existing foundation models. Specific examples of this approach include Evolutionary Model Merge (EMM) and Adaptive Branching Monte Carlo Tree Search (AB-MCTS).
Establishing appropriate evaluation metrics is essential for unleashing the applicability of generative AI to next level. We will present our efforts to promote research in these areas by proposing new benchmarks and their agents, including ALE-Bench, AI CUDA Engineer, Sudoku-Bench and EDINET-Bench.
Furthermore, we will discuss our endeavors to automate the entire research process. We will feature AI Scientist, which handles tasks from ideation and experimentation to paper writing. Its successor, AI Scientist v2, generated a paper that passed the peer-review process for an ICLR 2025 Workshop.
While AI agent workflows are conventionally designed by humans, we are also exploring an approach that delegates this construction process to an AI, or a "Meta Agent." Examples of this line of research include the Automated Design of Agentic Systems (ADAS) and the Darwin Gödel Machine (DGM).
Through these initiatives, we aim to provide an overview of recent trends and future possibilities in the research and development of generative AI.