• このエントリーをはてなブックマークに追加
「モザイクで隠された読めない文字」を復元・解読する方法!?
閉じる
閉じる

新しい記事を投稿しました。シェアして読者に伝えましょう

×

「モザイクで隠された読めない文字」を復元・解読する方法!?

2013-03-27 14:03
    「モザイクで隠された読めない文字」を復元・解読する方法!?

    今回は平林純さんのブログ『雑学界の権威・平林純の考える科学』からご寄稿いただきました。

    ■「モザイクで隠された読めない文字」を復元・解読する方法!?
    「モザイクで隠された読めない文字」を復元・解読する方法!?
    (画像が見られない方は下記URLからご覧ください)
    http://px1img.getnews.jp/img/archives/moz01.jpg

    上の運転免許証の写真のように、一部の文字を読むことができないように(判別できないように)モザイク処理をして、(公開できない情報が一部含まれている)機密文章や個人情報が含まれた写真などを公開することがあります。今回はそんな「モザイクで隠された読めない文字」を復元し、解読する方法について考えてみることにします。

    モザイク処理にも色々ありますが、今回対象にするのは「文字サイズより大きいモザイク」です。たとえば、実例を作ってみたのが、たとえば下のような画像です。こんな秘密メッセージ、モザイクが掛かっていて肝心な部分を読み取れない秘密文章の内容を、解き明かすことができるでしょうか?

    「モザイクで隠された読めない文字」を復元・解読する方法!?

    (画像が見られない方は下記URLからご覧ください)

    http://px1img.getnews.jp/img/archives/moz02.jpg

    まず、一見して、このモザイク部分には全部で5文字が隠されているということが明らかです。そして、その前に書かれた「一番最初は」という部分を見ると、ヒラギノゴシックの(画面解像度上で)18ポイントの大きさで書かれている、ということもわかります。つまり、モザイク部分に隠れているのは、多分「18ポイントのヒラギノゴシックで5文字」だということがわかります。

    さて、次は「モザイク部分の濃さ」に着目してみましょう。五文字の濃さは「濃・濃・薄・濃・薄」となっています。すると、「漢字は濃く見える・ひらがなは薄く見える」ということから、「漢字2文字+ひらがな1文字+漢字1文字+ひらがな1文字」ではないかという予想ができます。…しかし、これだけでは全く何のことかわかりません。

    そこで、モザイク部の濃さをもっと詳しく調べてみると、モザイク部は20×20ピクセルで、画素値は(それぞれ)195, 196, 217, 205, 230となっています。ここで、コンピュータで解析を行うコード(プログラム)を書き・実行してみると(参考データ *1)、18ポイントのヒラギノゴシックを20×20ピクセルのモザイク処理をしたとき、画素値が195, 196, 217, 205, 230になる可能性のある文字は、次のようになります。ちなみに、文字の並びは「(Google調べによる *2)使われる頻度が高い順番」に沿っています。つまり、前に並んでいるものほど「(前後の言葉との関係などを無視すれば)使われてる可能性が高い(かもしれない)」というものです。

    *1:「Jun Hirabayashi@hirax」『twitter』
    https://twitter.com/hirax/status/313212499258392576

    *2:「新常用漢字表のための漢字出現頻度調査」
    https://sites.google.com/site/shibano/shin-jouyoukanji-hyou-no-tame-no-kanji-shutsugen-hindo-chousa

    ・ 画素値195になる可能性のある文字


    “店”, “目”, “法”, “所”, “決”, “材”, “求”, “町”, “及”, “治”, “昨”, “辺”, “況”, “完”, “走”, “充”, “攻”, “血”, “豆”, “河”, “渋”, “巨”, “封”, “祈”, “尚”, “荘”, “皿”, “忠”, “仰”, “劣”, “灰”, “炉”, “洪”, “朱”, “忌”, “且”, “抄”, “弔”, “拉”

    ・ 画素値196になる可能性のある文字


    “学”, “当”, “全”, “切”, “状”, “告”, “足”, “歩”, “休”, “伝”, “宅”, “谷”, “史”, “児”, “百”, “列”, “包”, “旧”, “耳”, “旬”, “乱”, “祉”, “杉”, “卓”, “往”, “芳”, “克”, “兆”, “矛”, “瓦”, “冶”

    ・ 画素値217になる可能性のある文字


    “小”, “士”, “に”, “ル”, “よ”, “ど”, “ジ”, “サ”, “オ”, “ゴ”

    ・ 画素値205になる可能性のある文字


    “行”, “今”, “文”, “化”, “予”, “公”, “主”, “北”, “守”, “又”, “礼”, “忙”, “仏”, “巧”, “孔”, “な”, “る”, “ま”, “を”, “が”, “ボ”

    ・ 画素値230になる可能性のある文字


    “く”, “へ”, “ェ”, “ヘ”, “ヶ”, “ゥ”

    こうすると、かなり候補が絞られます。まず、カタカナは使われてなさそうですから、最後の2文字は「行く」の可能性が高いでしょう。すると、その前の文字はたぶん「に」で、合わせて「に行く」になりそうです。あとは、最初の2文字を手当たり次第組み合わせてみると、そして意味が通じる組み合わせを探していくと…「渋谷」という有力候補が浮かび上がってきます。(進路に関する話であれば「法学に行く」という候補も有力そうですが)

    そう、この暗号の答えは「一番最初は渋谷に行く」でした。モザイク処理が掛かって全く読むことができなさそうであっても、文脈や文字(フォント)の情報を組み合わせていくと、「可能性が高そうな組み合わせ・内容」が浮かび上がってきたりするのです。

    「モザイクで隠された読めない文字」を復元・解読する方法!?

    (画像が見られない方は下記URLからご覧ください)

    http://px1img.getnews.jp/img/archives/moz03.jpg

    執筆: この記事は平林純さんのブログ『雑学界の権威・平林純の考える科学』からご寄稿いただきました。

    寄稿いただいた記事は2013年03月25日時点のものです。

    ■関連記事

    安倍首相のFacebookに韓国人・中国人が反日コメント するも、 何故かフランス人が論破した件

    国会で語られた「朝日新聞の捏造&慰安婦の真実」動画 NHKが削除するも中山なりあきが資料と共に再度公開

    国会で「朝日新聞の慰安婦捏造」を指摘した中山なりあき議員 「私が狙われている」とツイート

    常識? 裏ワザ? 『とびだせ どうぶつの森』で見つけた使える小ネタ集

    国会で語られた「朝日新聞の慰安婦捏造」問題をどこのメディアも報道しないのはなぜ?

    RSSブログ情報:http://getnews.jp/archives/306017
    コメントを書く
    コメントをするにはログインして下さい。