新サイト「知性学研究室」を立ち上げた
昨年7月以来、研究の中心をLLMを使ったプログラミングに切り替え、主に医学文献分析をテーマに取り組んできた。その主要な成果とのが、NOA(NO Asking)というシステムだ。
NOAは、検索クエリを一切書かずに文書を入力するだけで、2020年以降の腫瘍学関連PubMedアブストラクト(150万件超)から類似文献を探索するアプリケーションだ。入力文書の意味をベクトル化し、研究室で独自に構築した腫瘍学専用データベースと照合することで、NCBIのインデックス検索では見つけにくい関連論文を発見できる。
なぜ「文系研究室風」のサイトなのか
このサイトの第一の目的は、NOAの一般公開だ。ただし、NOAの出力には症例の診断・治療に関する解説が含まれるため、公開にあたっては配慮が必要という判断があった。実際、複数のAI(GPT-4.5、Gemini 2.5 Pro)に相談したところ、アクセス制限を設けるべきという意見が一致した。
しかし、NOAはあくまでPubMed検索アプリケーションであり、医療用アプリのような強い制限は本来不要だ。この立場を明確にするために選んだのが、「文系大学研究室風のホームページ上での試験公開」というスタイルだった。このアプローチについてはAIも賛同し、制限なしの試験公開に踏み切った。
「知性学研究室」という思想
発端はNOAの公開方法をめぐる実務的な工夫だったが、文系的なテーマはもともと自分自身の関心でもある。そこでホームページを、自分の思想に基づいて構成することにした。
主宰挨拶では、AIが科学技術を自律的に推進する時代が来たとき、人間に残される問いとは何かを論じている。文献を読み、仮説を立て、検証するという科学の過程がAI主導になっていくとしても、それは人間に問うべきことがなくなることを意味しない。むしろそのときこそ、「人間の知性とは何か」という問いが浮かび上がってくる——知性とは単なる計算能力ではなく、世界を意味づけ、迷い、驚き、責任を負う営みを含むものだ、という立場だ。
研究室の理念では、その問いへのアプローチとして、LLMを「対照系」として使うことを掲げている。人類が書物や図書館という形で外部記憶を蓄積してきたように、現代の巨大なデジタルデータベースもまた外部記憶の延長だ。人がその膨大な外部記憶をどのように操作し、自らの思考と統合するか——NOAはその実践的な実験でもある。
技術的な収穫:オープンウェイトLLMとベクトルデータベース
NOAを開発する過程で、オープンウェイトLLMとベクトルデータベースの扱い方を習得できた。ChatGPTやGeminiといったクラウドサービスだけを使う場合とは、可能性の広がり方がまるで違う。
オープンウェイトLLMの最大のメリットは計算コストの削減だ。コストを気にせず膨大な処理をLLMに任せることができる。ベクトルデータベースは扱えるデータ量が格段に増えるうえ、「意味検索」という新しい類似性探索の可能性を開く。
次の対象:オペラ、そして哲学へ
NOAでは医学にこれらの技術を適用したが、次に取り掛かっているのはオペラだ。オペラの歌詞には二つの利点がある。一つは、大半の作品の著作権がすでに切れていること。もう一つは、自分のコレクションの大部分をリッピングしてMacに蓄積済みで、データ操作をすぐに始められることだ。
医学では知識を扱ったが、オペラでは情動と人間関係の状況を扱う。その次は哲学——データベースとしてはPhilPapersがある——を対象に、人の思考の定式化に挑もうと考えている。