PDFファイルの取り扱い

Date: 2023/05/18 (initial publish), 2023/05/31 (last update)

Source: jp/note-00060.md

Previous Post Top Next Post

TOC

PDF書式フォーム問題(特に日本語環境下)

公的な提出書式が、書き込み可能なPDFの「書式フォーム」で提供されていることが多くなりました。

PDFを扱えるフリーのプログラムは、表示だけならどんなPDFでも問題ないのですが、フォーム入力では必ずしもうまく行きません。

特に日本語で作られたフォームでは問題が多いようです。

Chrome / Chromium

日本語も含め書式フォームは使える。ほぼ問題ない。書き込み保存可能。一番キレイ。

右クリックから"Open with …“で起動する。

Ocular – KDE

日本語も含め書式フォームは使える。文字位置などは少々ずれている。書き込み保存可能。

多くのQTライブラリー導入になるので、Chrome/Chromiumで対応するのでこれは導入回避。

evince (Document Viewer 43.1) – GNOME

英語だと書式フォームは使え書き込み保存可能。ただ、日本語で作られたフォームではそれなりに読めたりする部分もあるが、文字化けし快適に使えない。

MuPDF

PDFはフォーム記入内容を含めて読めるが、書式フォームは使えないリードオンリー。

xpdf

PDFは読めるが、フォーム記入内容は欠落する。書式フォームはもちろん使えないリードオンリー。

gv

PDFはフォーム記入内容を含めて読めるが、日本語だと書式フォーム部の表示はひどい文字化け。リードオンリー。

PDF非フォームの編集・印刷

役所のサイトには、今だに単に印刷可能だがフォーム入力対応しない申請書の類のPDFファイルがあることがあります。PDFを開くソフトのdefaultはGNOMEではevinceですが、これにはPDF化された文書内容の編集機能はありません。(つまりacrobat同様の機能)

印刷前にできるだけ記入してから印刷するFOSS環境下の術は、推奨ソフトにある編集機能のあるLibreoffice(Draw)とGNU Image Manipulation Program (GIMP)があり、これらが有望そうなので試してみました。

Libreoffice (Draw)

意外でしたが、もとの文字がスケーラブルフォントを使う編集可能な文字列データーとベクトルフォントとグラフィクスオブジェクトと位置の集合情報としてうまく読み込めます。QuarkXpressもどきの使い方ができます。Libreoffice (Writer)ででも同様に読込可能です。だから書式フォーム以外の部分も文字としての編集が可能です。

ただ書式フォーム関連の位置の画面表示などは少々ずれるなどの難が少しあるようです。

GNU Image Manipulation Program (GIMP)

ビットマップデーターとして、指定解像度で読み込めます。デフォルトはFAX並の100DPIですが、レーザープリンター品質の300DPIでの読込も、解像度のプロンプト時に簡単に指定できます。

編集対象データーは完全にビットマップ化され元データーの痕跡はないので、既存文字は文字としての書き換えはできません。下地を白の箱背景で隠して新規の文字を貼り付ければ、任意の文字で強引に書き換えはできます。

機能が単純なので、どうもズレの問題はありません。

Previous Post Top Next Post