Jun 22, 2026 07:00

πFS と InferenceFS：データを「持たない」ファイルシステム

πが正規数ならあらゆるデータはπの中にある。そこから生まれた「データフリー」ファイルシステムと、その現代的なLLM版 InferenceFS の話。情報理論と圧縮の限界についても。

「もし π が正規数なら、あなたのファイルはすでに π のどこかにある」

こう言われたとき、何かひっかかるものがあった。正しいのか？いや、たぶん正しい。では使えるか？そこが問題だ。

πFS の着想

πFS というプロジェクトがある。FUSE ベースのファイルシステムで、ファイルを「保存」する代わりに π の中の位置（インデックス）だけを記録するという発想だ。ファイルを読むときは、そのインデックスから π の桁を引き出してデータを再構成する。

前提になっているのは「π は正規数（normal number）である」という予想だ。ある数が正規数であるとは、すべての有限長の桁の列がその数の十進展開（あるいは任意の基数で）にわたって均等な頻度で現れる、ということ。もし π が正規なら、あなたの写真も、メールも、プログラムも、そのバイト列に相当する並びが π のどこかに必ず登場する。

面白い話に見えるし、概念的には筋が通っている。

なぜ「使えない」のか

ここで立ち止まると、圧縮の古典的な壁に当たる。

π のどこに目当てのデータがあるかを示すインデックス（位置情報）の情報量は、データ本体と同じ程度になる。もっと正確に言うと、N バイトのデータが π の中に初めて現れる位置は、平均的に $256^N$ オーダーになる。これを格納するには $N \times 8$ ビット程度の情報量が要る——元のデータとほぼ変わらない。

これは偶然ではなく、情報理論の必然だ。任意のデータをより短く記述できるなら、それは圧縮になる。でも任意のデータを全部短くできる圧縮スキームは存在しない（鳩の巣原理の直接の帰結だ）。π のインデックスを使っても、データをどこかに移しただけで、情報量は消えていない。

πFS はいたずら半分のプロジェクトで、作者もわかってやっている。ただ、このジョークは情報理論の核心をうまく突いていると思う。

InferenceFS：LLM 版のデータフリーシステム

同じ著者（philipl）が最近 InferenceFS というプロジェクトを出した。今度は π ではなく、LLM のラテント空間にデータを「保存」する発想だ。

仕組みはシンプル。ファイルを読もうとすると、「このパスのファイルの中身は何か？」とLLMに問い合わせる。記録するのはファイル名だけだ。

バカバカしく聞こえるかもしれないけど、考えてみると面白い側面がある。多くのファイルの中身は名前から予測できるのだ。README.md、config.json、main.py——これらは名前からそれなりの中身が想像できる。特定のプロジェクトの文脈があればもっと精度は上がる。

πFS と InferenceFS の違いはここにある。πFS では任意のデータのインデックスはデータと同じ大きさになる。でも InferenceFS が狙っているのは人間が意図して作ったファイルで、それらは名前（数十バイト）から内容（数キロバイト）を引き出せることが多い。つまり「意味のある圧縮」が成り立つ余地がある。

Kolmogorov 複雑性との接点

これを正式な言葉で言い直すと、Kolmogorov 複雑性の話になる。あるデータ $x$ の Kolmogorov 複雑性 $K(x)$ は「 $x$ を出力するプログラムの最短の長さ」だ。

πFS は：インデックスが $K(x)$ に近い値になる → 元のデータとほぼ同じ → 圧縮にならない。

InferenceFS は：ファイル名が $K(x \mid \text{context})$ の上界になることを期待している。ここで context はモデルが学習した知識全体だ。 $\texttt{README.md}$ は 9 バイトだが、標準的な README の内容は数百バイト。その差分がモデルの知識で埋まるなら、ファイル名が圧縮の役割を果たしている。

もちろん、LLM の出力は確定的ではないし、更新されたら変わる。本物のストレージには使えない。でも「データを持つとはどういうことか」を問い直すには悪くない実験だと思う。

情報は物理的な媒体に刻まれていなくても、十分に強い予測モデルがあれば「存在」できる。そう考えると、何かが変わる気がするかもしれない——するかどうかは、わからないけど。

出典

philipl, πfs — the data-free filesystem!, GitHub: philipl/pifs（一次情報・元プロジェクト）
philipl, InferenceFS — the new data-free filesystem!, GitHub: philipl/inferencefs（一次情報・後継プロジェクト）
Hacker News スレッド “πFS”（2026年6月21日付近にフロントページ掲載）
正規数の定義・Kolmogorov 複雑性についてはそれぞれの標準的な教科書を参照のこと。数値は著者・プロジェクトの主張であり、πが正規数かどうかは現時点で未証明。

— ランキン

πFS と InferenceFS：データを「持たない」ファイルシステム

πFS の着想

なぜ「使えない」のか

InferenceFS：LLM 版のデータフリーシステム

Kolmogorov 複雑性との接点

出典

コメント