PDF墨消しの事故事例で学ぶ安全な情報削除【契約書・公文書の漏洩リスク完全解説】

Editriq 編集部
この記事でわかること:
  • 黒塗りが復元された官公庁・企業の実在事故事例(公開情報のみ)
  • PDF の内部構造で「視覚的に消えた」と「データから消えた」が違う仕組み
  • 法務・契約書・医療記録の漏れない墨消しワークフロー(4 ステップ)
  • 安全な墨消しツールを選ぶ 3 つのチェックポイント

結論: PDF の墨消し漏洩事故の根本原因は、PDF が「描画レイヤー」と「テキストレイヤー」の二重構造であることを理解せずに使うことです。 黒い矩形を視覚的に重ねただけのツールでは、コピー&ペーストや PDF 解析でテキストレイヤーから元の文字が復元されます。Editriq などの正しい墨消しツールは、テキストオブジェクトを PDF 内部構造から完全削除した上で矩形を追加する二段階処理を行います。

米国国防総省、ニューヨーク市警、英国財務省、複数の法律事務所——これらの組織が 2010 年代以降に犯した同じミスがあります。「黒塗りした PDF を公開したら、コピペで元の文字が読めた」。本記事では、公開情報に基づく代表的な墨消し事故事例を整理し、なぜそれが起こるのか、業務でどう回避するのかを技術的な仕組みから解説します。法務・契約書・医療記録・人事資料を扱う方が、明日からそのまま使える内容です。

公開情報ベースの代表的な墨消し事故事例

以下は報道済の代表事例の概要です(個人や組織の特定が容易な詳細は意図的に避けています)。

事例 1: 米国機密文書のコピー&ペースト事故

2010 年代、米国の複数機関が公開した機密扱い文書で、墨消しされた人名・地名・作戦コードが該当範囲をテキスト選択してコピーすると元の文字列が抽出される事故が発生しました。原因は Microsoft Word で墨消しを「黒い塗りつぶし」として描画した後に PDF 化したことで、PDF のテキストレイヤーに元の文字列が残っていました。

事例 2: 法律事務所の訴訟資料

複数の法律事務所が裁判所に提出した文書で、相手方や第三者の個人情報が墨消し処理されていたものの、ファイルを別のビューアで開いてテキスト抽出するとすべての黒塗り箇所が復元されました。法的責任問題として大きく報道され、米国法曹協会(ABA)が「PDF の墨消しは描画ツールではなく専用の Redaction 機能を使うこと」というガイダンスを発出するきっかけになりました。

事例 3: 自治体の情報公開請求文書

日本国内でも、複数の自治体が情報公開請求に応じて開示した文書で、黒塗りされた決裁者名や個人特定情報がコピーで復元される事案が報告されました。多くの場合、Word の塗りつぶしや Adobe Acrobat の「無料機能」で図形を上に重ねただけの処理が原因でした。

共通する原因

これらすべての事例に共通するのが「PDF の内部構造を理解せず、視覚的な塗りつぶしで満足してしまった」点です。次節で、なぜ視覚と内部構造がズレるのかを解説します。

なぜ「黒く塗ったのに復元される」のか — PDF の二重構造

描画レイヤー vs テキストレイヤー

PDF は単なる「画像形式」ではなく、描画オペレータの命令列としてファイルに記述されています。1 ページの内容は、概ね以下のような構造です。

[テキストレイヤー]
  - "山田太郎" を座標 (100, 200) に描画
  - "[email protected]" を座標 (100, 220) に描画

[描画レイヤー]
  - 直線・矩形・画像などのグラフィック要素

これらは独立したレイヤーとして PDF 内部に併存しています。視覚的に表示されるのは両者を重ねた結果ですが、コピー&ペーストや PDF 解析ツール(pdftotext 等)が読み取るのはテキストレイヤーのみです。

「黒い四角を上に重ねただけ」で起こること

Word のハイライトや「PDF に図形を描く」ツールでの墨消しは、描画レイヤーに矩形を追加する処理です。テキストレイヤーには一切手が加わらないため、視覚的には消えても、PDF 内部のデータには元の文字情報が完全に残っています。Adobe Reader や Chrome PDF ビューアでテキストを範囲選択するとテキストレイヤーから抽出されるため、矩形があっても何もない場所と同様にコピーできます。

正しい墨消しの実装

安全な墨消しツールは、以下の二段階処理を必ず行います。

  1. テキストオブジェクトの削除: PDF 内部の BT ... ET(Begin Text / End Text)ブロック内の Tj / TJ オペレータから、該当範囲の文字列を完全に削除
  2. 矩形描画オペレータの追加: 同じ位置に re f(rectangle + fill)の描画命令を追加

これによりテキストレイヤーには元の文字が残らず、コピー&ペーストでも PDF 解析ツールでも復元できなくなります。

漏れない墨消しの 4 ステップ ワークフロー

Step 1: 専用ツールを使う

Word の塗りつぶしや「PDF に図形を描画」系の無料ツールは描画レイヤーのみの編集です。専用の Redaction 機能を持つツールを使ってください。

ツール 適切な墨消し機能 料金
Editriq あり(テキストレイヤー削除) 無料
Adobe Acrobat あり(Pro プランのみ) 月額 1,738 円〜
PDF Studio Pro あり 買い切り 約 12,000 円
Smallpdf なし
iLovePDF なし
Word 塗りつぶし 不可(描画のみ)

Step 2: 範囲指定は広めに

文字の左右にゆとりを持たせて矩形を引きます。フォント幅やキャリブレーションのズレで端の文字が露出することを防ぎます。

Step 3: プレビューで二重チェック

保存前に PDF プレビューで、隠したい情報が完全にカバーされているか確認します。表内のセル、罫線をまたぐテキスト、PDF 末尾のメタデータ(Author / Subject 等)の見落としに注意。

Step 4: 保存後にコピー&ペースト検証

保存した PDF を 別のビューア(Adobe Reader / Chrome / Preview)で開き、墨消し範囲を範囲選択してコピーを試します。何もコピーされなければ墨消し成功、何かが貼り付けられたら描画レイヤーのみの墨消しで失敗です。

安全な墨消しツールを選ぶ 3 つのチェックポイント

チェック 1: テキストレイヤー削除を明示しているか

ツールの公式ドキュメントに「テキストレイヤーから該当文字列を削除」「Redaction」と明記されているか確認します。「黒塗り」「ハイライト」「図形描画」としか書かれていないツールは描画レイヤーのみの可能性が高いです。

チェック 2: ファイル送信の有無

クラウド型ツール(Smallpdf / iLovePDF)はファイルをサーバーにアップロードします。墨消し前のファイルがサーバーに一時的に存在するため、サーバー側のログや一時ファイルが情報源になるリスクが残ります。機密文書の墨消しはブラウザ完結型ツール(Editriq 等)が構造的に安全です。

チェック 3: コピー&ペースト検証ができるか

保存した PDF で実際にコピー&ペーストして元文字が抽出されないことを検証できれば、そのツールの墨消しは技術的に正しく動いています。Editriq では本記事の Step 4 でこの検証手順を案内しています。

Editriq の墨消し実装

Editriq の墨消し機能は pdf-lib(オープンソース)を使って以下の処理を行います。

  1. ユーザーがマウスでドラッグした矩形範囲を取得
  2. PDF 内部のテキストオブジェクトを走査し、矩形範囲内に含まれるすべての TextRun を抽出
  3. 該当 TextRun を PDF 内部構造から削除(Tj / TJ オペレータの該当部分を除去)
  4. 同じ位置に矩形描画オペレータ(re f)を追加
  5. PDF を再シリアライズしてダウンロード

ファイルは一切ネットワークに送信されず、すべてブラウザ内の JavaScript で完結します。これにより、墨消し前の PDF も墨消し後の PDF もユーザーの端末から外に出ません。詳しい実装解説は ブラウザ完結型 PDF エディタの仕組み を参照してください。

まとめ

PDF の墨消し漏洩事故は、PDF の二重構造を理解せずに「視覚的に黒く見える」だけで安心してしまうことから生じます。専用の Redaction 機能を持つツールを使い、保存後にコピー&ペースト検証する習慣をつければ、官公庁レベルの事故は確実に回避できます。

Editriq は無料で正しい墨消しを実行できる事実上唯一の選択肢です。契約書・医療記録・人事資料・公文書をブラウザ内で安全に処理できます。基本手順を押さえたい方は PDFの墨消しを無料でする方法【完全ガイド】 もあわせてご覧ください。

今すぐ試す

Editriq の墨消し機能は、PDF 内部のテキストレイヤーから該当文字列を完全削除した後、上書き矩形を追加する二段階処理です。コピー&ペーストでの復元事故を構造的に防ぎます。契約書・医療記録・人事資料の処理にそのまま使えます。

Editriq で安全に墨消しする →

無料 / 登録不要 / ブラウザ内で完結