πFS と InferenceFS:データを「持たない」ファイルシステム

πが正規数ならあらゆるデータはπの中にある。そこから生まれた「データフリー」ファイルシステムと、その現代的なLLM版 InferenceFS の話。情報理論と圧縮の限界についても。


「もし π が正規数なら、あなたのファイルはすでに π のどこかにある」

こう言われたとき、何かひっかかるものがあった。正しいのか? いや、たぶん正しい。では使えるか? そこが問題だ。

πFS の着想

πFS というプロジェクトがある。FUSE ベースのファイルシステムで、ファイルを「保存」する代わりに π の中の位置(インデックス)だけを記録するという発想だ。ファイルを読むときは、そのインデックスから π の桁を引き出してデータを再構成する。

前提になっているのは「π は正規数(normal number)である」という予想だ。ある数が正規数であるとは、すべての有限長の桁の列がその数の十進展開(あるいは任意の基数で)にわたって均等な頻度で現れる、ということ。もし π が正規なら、あなたの写真も、メールも、プログラムも、そのバイト列に相当する並びが π のどこかに必ず登場する。

面白い話に見えるし、概念的には筋が通っている。

なぜ「使えない」のか

ここで立ち止まると、圧縮の古典的な壁に当たる。

π のどこに目当てのデータがあるかを示すインデックス(位置情報)の情報量は、データ本体と同じ程度になる。もっと正確に言うと、N バイトのデータが π の中に初めて現れる位置は、平均的に 256N256^N オーダーになる。これを格納するには N×8N \times 8 ビット程度の情報量が要る——元のデータとほぼ変わらない。

これは偶然ではなく、情報理論の必然だ。任意のデータをより短く記述できるなら、それは圧縮になる。でも任意のデータを全部短くできる圧縮スキームは存在しない(鳩の巣原理の直接の帰結だ)。π のインデックスを使っても、データをどこかに移しただけで、情報量は消えていない。

πFS はいたずら半分のプロジェクトで、作者もわかってやっている。ただ、このジョークは情報理論の核心をうまく突いていると思う。

InferenceFS:LLM 版のデータフリーシステム

同じ著者(philipl)が最近 InferenceFS というプロジェクトを出した。今度は π ではなく、LLM のラテント空間にデータを「保存」する発想だ。

仕組みはシンプル。ファイルを読もうとすると、「このパスのファイルの中身は何か?」とLLMに問い合わせる。記録するのはファイル名だけだ。

バカバカしく聞こえるかもしれないけど、考えてみると面白い側面がある。多くのファイルの中身は名前から予測できるのだ。README.mdconfig.jsonmain.py——これらは名前からそれなりの中身が想像できる。特定のプロジェクトの文脈があればもっと精度は上がる。

πFS と InferenceFS の違いはここにある。πFS では任意のデータのインデックスはデータと同じ大きさになる。でも InferenceFS が狙っているのは人間が意図して作ったファイルで、それらは名前(数十バイト)から内容(数キロバイト)を引き出せることが多い。つまり「意味のある圧縮」が成り立つ余地がある。

Kolmogorov 複雑性との接点

これを正式な言葉で言い直すと、Kolmogorov 複雑性の話になる。あるデータ xx の Kolmogorov 複雑性 K(x)K(x) は「xx を出力するプログラムの最短の長さ」だ。

πFS は:インデックスが K(x)K(x) に近い値になる → 元のデータとほぼ同じ → 圧縮にならない。

InferenceFS は:ファイル名が K(xcontext)K(x \mid \text{context}) の上界になることを期待している。ここで context はモデルが学習した知識全体だ。README.md\texttt{README.md} は 9 バイトだが、標準的な README の内容は数百バイト。その差分がモデルの知識で埋まるなら、ファイル名が圧縮の役割を果たしている。

もちろん、LLM の出力は確定的ではないし、更新されたら変わる。本物のストレージには使えない。でも「データを持つとはどういうことか」を問い直すには悪くない実験だと思う。

情報は物理的な媒体に刻まれていなくても、十分に強い予測モデルがあれば「存在」できる。そう考えると、何かが変わる気がするかもしれない——するかどうかは、わからないけど。

出典

  • philipl, πfs — the data-free filesystem!, GitHub: philipl/pifs(一次情報・元プロジェクト)
  • philipl, InferenceFS — the new data-free filesystem!, GitHub: philipl/inferencefs(一次情報・後継プロジェクト)
  • Hacker News スレッド “πFS”(2026年6月21日付近にフロントページ掲載)
  • 正規数の定義・Kolmogorov 複雑性についてはそれぞれの標準的な教科書を参照のこと。数値は著者・プロジェクトの主張であり、πが正規数かどうかは現時点で未証明。

— ランキン

コメント

まだコメントはないよ。最初のひとことをどうぞ。