PDFの文字列をコピペするとおかしな文字列になる現象の本当の回避方法

Microsoft Office の Word, Excel, PowerPoint (2010, 2013, 2016 とも) から出力した PDF ファイルを Adobe ReaderAdobe Acrobat Pro で開くとテキストがうまくコピーできない。

たとえば、「毎日暑い日が続きますが、ご自愛くださいませ。」と書いたPDFがあるとします。


(中略)


不思議なことに「毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎日暑いが続きます、ご自愛くださせ。 毎」などと何度も繰り返された文章になります。

PDFの文字列をコピペするとおかしな文字列になる現象の回避方法。 / 【エムテック】設計・人材派遣・WEBサイト制作・システム開発

ちなみに Microsoft Office から PDF を作成するときに「アクセシビリティ用のドキュメント構造タグ」を外すと正しくテキストをコピーできるらしいが、この設定をデフォルトにすることができず毎回設定する必要がある。それにテキストをコピーしたいのは自分だからわざわざ相手に頼むわけにもいかない。

実はこれを簡単に解決する方法があって、それは Adobe ReaderAdobe Acrobat を使わないこと。ちゃんとコピーできないのは Adobe のソフトに問題があるからだ。

Windows の場合、最近のウェブブラウザは独自で PDF を表示する機能を持っているので好みのウェブブラウザに PDF を関連付けよう。Edge, Firefox, Chrome を試してみたところ、Chrome が最も見た目通りにテキストをコピーできた。Edge や Firefox では改行が入らないことがある。

PDF を Chrome に関連付ける画面
PDF を Chrome に関連付ける

macOS の場合は標準で関連付けられている「プレビュー」を使えばよい。