科学の本質についていろいろな議論があるが、予測 predicdtion こそが科学の本質である、という見解がある。予測能の検証試験は機械学習の分野で定式化されている:学習セットと呼ぶデータで予測システムを造り、それを検証セットと呼ぶデータで検証する。このとき学習セットと検証セットは重複してはならない。通常の科学のプロセスでは学習セットと検証セットの分割に時間を使う。すなわち「ある特定の時刻以降の情報は、その時刻以前に取得された情報に混入することはない」という原理を用いて学習セットと検証セットに分割するわけだ。科学における仮説の検証は、この原理に基づいて行われる。仮説に対してあらたに検証実験を計画実行するので、仮説を立てた時の情報と検証実験の情報とが混ざることはない。医学研究の場合は、厳密に規則が決められていて、検証したい仮説(薬剤の効果など)や予測システム(検査システム)についての評価試験を文書で記載し、その後で評価試験を行いデータを取得する。文書制作、データ取得の時刻を記録していくため、データ取得の時系列について過誤が起こらないようになっている。
このように新たに検証試験を行う場合は、データ取得の時系列が明確なので問題はおこらない。しかし過去のデータ、すでに獲得済みのデータを用いて検証する場合は、2つのグループに分割することは難しくトラブルが起こる。過去データを用いた試験・研究は信頼性が低い:医学研究の場合は厳しく決められており、過去データのみの検証では厚生労働省の承認には得られない。
私が関わってきたのは、機械学習を用いた検査システムだ。2000年前後に数千から一万個の遺伝子の発現データでがんの悪性度を予測する研究が多数行われた。データ量が多いので、数理統計学を用いて予測システムを構築して悪性度予測を行う。このとき検証セットに学習セットのデータを混入させた間違った研究が多数行われ、一流誌にも頻繁に掲載された。もともと予測システムの構築に使ったデータで検証するため、良い性能が必ずでる。厳密に検証セットを用いると大抵性能が低下して使えないものになってしまうので論文にはならない。そういう理由もあって大量の誤った論文が掲載されたわけだ。現在でもゲノム科学の大量データを用いた予測システム研究は行われているが、過去と同じ過ちを犯している人が多い。最近2年で5件ほど関連論文が査読に回ってきたが、すべて指摘した誤りを犯しており、即座にrejectした。
さて「メッセージ」はドゥニ・ヴィルヌーヴが監督を務めた映画で、原作はテッド・チャンのSF小説「あなたの人生の物語」である。地球に飛来した異星人(人というよりも蛸)とコミュニケーションを図る女性言語学者の物語であるが、テーマは2つあって、一つは異星人の言語、もう一つは女性研究者自身の時間を無視した記憶である。異星人は過去と未来を区別しない:すなわち過去の情報と未来の情報が混在しており、そのすべてを認識することができる。彼らの言語は、そのような彼ら自身の能力に対応した構造になっている。主人公の言語学者ルイーズはもともと異星人と同様未来に起こることを記憶できる能力を潜在的に持っていた。この能力が異星人の言語を理解習得するに伴い、顕在化する。未来の記憶に関して、2つのエピソードが描かれている。一つは血液疾患で早死する娘とのエピソード。これは全編を通して描かれ、鑑賞者は最初は過去のことだと思ってみているが、ストーリーの後半で同僚の物理学者イアンとその後結婚して授かった娘であることがわかる。未来の出来事を記憶として振り返っているのだ。
異星人とのコミュニケーションは世界各地で複数のグループで行われていたが、ルイーズ以外のグループが異星人のメッセージを誤解して彼らが地球侵略を企てていると結論、一触触発の自体になった。ルイーズは中国軍のシャン上将に電話して説得を試みる。彼女は「未来の出来事」の記憶により、誰も知らないはずの妻の死ぬ間際のメッセージをャン上将に伝えたところ、シャン上将は感動して説得に応じ、戦争は食い止められた。その「未来の出来事」とは1年後ルイーズがシャン上将と会ったときに、1年前の電話の内容としてシャン上将が語ったことであった。
SFとしてはタイム・パラドックス物に分類されるだろうが、このストーリーの特徴はタイム・パラドックスが一人の女性言語学者の記憶の中だけで起こっている点だ。記憶の中で過去と未来の情報が混在する状態であり、先に述べた「ある特定の時刻以降の情報は、その時刻以前に取得された情報に混入することはない」という普遍原理が崩壊した状態である。過去と未来の情報が混在する記憶がリアリティを持って絶妙に描かれており、私達を奇妙な感覚に陥れるのだ。テッド・チャンの小説の方は論理でストーリーをたどるため、映画のような不可思議な感覚を経験できない。ドゥニ・ヴィルヌーヴの才能前提だが、映画というメディアの特性が大きく発揮されている。
人類と異なり、異星人は皆「未来の記憶」を持っている。この場合、「時間による情報の分割」ができないので、科学のプロセス、知識拡張のプロセスも全く異なるものになっているはずだ。あるいは拡張不可能でアプリオリに知識が存在しているのだろうか?少し考えてみる値打ちはありそうだ。