64px^2 を観て、食いつきたくなったのだ

その昔、デジタル画像処理回路のエンジニアをしていたことがあるので、低解像度のデジタル画像の話となるとつい食いつきたくなってしまう。ただ、先に謝っておくが本稿は何らかの示唆をするような結論には至っていない。チラシの裏レベルと言っていいだろう。ただ、どうしても食いつきたかったのだ。

それは、若手ながらその賢さにはいつもひれ伏せざるを得ない co1 氏の「64px^2」のことだ。

自分のデジタル画像との付き合いは８ビットパソコンの画面全体で40x25pxの解像度から始まっている。仕事で関わったのは720x576pxの頃だ。Rec 601規格とか「どストライク」である。「4:2:0」を知っていれば「白黒写真に色線を引くだけでカラー写真に見える事象」は何も不思議ではない。

co1氏が例として提示してくれた64x43pxの写真を見て気がついたことがあった。元の画像が想像できるものと、できないものがあるのだ。想起されるものは断片的な情報（モザイク画像）から自分の記憶の中のフル情報とマッチングされているだけであって、co1氏が想起された記憶（＝モザイク前の元画像）とは明らかに異なるものである。想起されないものは類似の記憶から類推できそうなものもあるが、それでも想像できないものがある。

これがなにかの食べ歩きの写真だが、何を食べているか分かるだろうか。宮島名物「揚げもみじ」であることは、予め知っていなければ分からないだろうと思う。

少し前のパソコンでは難しい漢字がドット数の関係で正確に表現できず、省略されて表示されていた。それでも元の漢字を知っているならばその欠落した情報をベースに正確な字体を手書きで表現することができるが、元々その漢字を知らなければ幾ら画面を凝視しても正確に筆記することはできない。64px^2の写真の事象もその延長に見える。

さらに言うならば、結婚式の写真は普通の集合写真か、新郎新婦の衣装を入れ替えた余興の写真なのかは分からない。私の記憶の中には新郎新婦の衣装を入れ替えた余興というのは見た経験がないので、仮にその余興が正解だとすれば私は正解にたどり着くことはできない。それは「自分が出席した結婚式ではそのような余興が行われた事実はなかった」というステートメント的な記憶から結論づけられたものであって、画像のパターンマッチのようなもので想起されているものではない。

断片的な情報からフルの情報を復元するという意味では、仕事でソフトを書いていた頃に会社の方針で「毎年１０％ずつコード書く効率を上げろ」と言われていたことを思い出す。もしそれが達成可能だとすれば、究極的には１バイトを書くことで世の中のどんなソフトウエアでも作成可能になってしまう。そんなことはあり得ないから毎年１０％効率アップなんて不可能である…と反論したのを覚えている。もちろんこれは幼稚な反論であり、組織の歯車としての正解は「やる方法を考える」である。

話が逸れた。

64x64pxというのも８の倍数であることから現在のコンピューティングの技術水準に照らし合わせてリーズナブルな解像度であるところから決められたものではないかと思う。co1氏が参照した「ある著名な機械学習（AI）を用いた画像認識の手法」の原典に辿り着けなかったので断定的なことは言えないのだが、一般的に機械学習というのはインプットの情報量に対してn次増しで処理量が発生する。

2019年の技術水準がたまたまその程度なのであって、”「その写真を僕か僕じゃない他人のどちらが撮ったか」や「この写真が多数の良いね！を得られそうかどうか」などを識別させる程度であれば、おおよそ64px四方程度の画像で十分”というのは実は「成果を出さなければならない機械学習エンジニアのレトリックであり主従関係が逆である可能性」はあると思う。

従って、コンピュータの処理性能が向上することでより精細な映像の機械学習が可能になり、今の我々が想像できないような「写真が持つ意味合い」が抽出される可能性もある。

co1氏は ”これらの曖昧な写真を凝視し、全体や部分を観察することを通じて、各々が持ち合わせているはずの”記憶の断片”をこの画像に当てはめ、膨らませていくことで、あたかもそれが最初から自分の記憶であったかのように再構成可能なようにも思える” と言うが、挑戦してみたものの私にはできなかった。ただ、これは個人の能力差も大きいと思う。想像力が豊かな人はいるし、強く思うことで記憶を作れる人も確実に存在する。

また、“この写真から失われたディティールへの探索を通して引き出された貴方の記憶は、果たして私の記憶と区別可能だろうか” という問いに対しては「可能」と言える。同一のモザイク画像がトリガーになっているものの、それによって想起される記憶は別の人間の経験のものだからだ。別の言い方をすれば、もし区別ができないとすれば「視力が著しく落ちた人間同士の記憶は一致する」ということになってしまいかねない。人類補完計画ではあるまいし、それはないだろう。

結論が見えないままつらつらと書き始めた本文だが、どう考えてもco1氏の論調の方が夢があり刺激的だし今風にいうならエモい。ただ、肌色だらけの画面で「目を細めてみるとモザイクが外れて見える！」（下品なたとえですまぬ）などをいうことをやっていた世代には、捉え方が新鮮に感じられたのだ。