制作お役立ち便利帳
タグ:文字化け
クラウドに置いたテキストファイルが文字化けする
クラウド上にファイルを置いてPCやスマホ・タブレットで情報共有することが多くなっています。原稿のやり取りにもクラウド経由での作業が増えています。一般的なネット上のストレージとして、OneDrive、Googleドライブ、DropBoxなどが有名ですが、そこにある文書をスマホで開いたら次のようになって読めないことがあります。
しかしWindowsPCではちゃんと読める場合、Windowsで再度保存する際に文字コードを UTF-8 に指定すると、スマホで読めるはずです。この場合、最初にWindowsなどで文書作成をした際に、過去との互換性を考慮して、無指定では文字コードがシフトJISが扱える「ANSI」になっていたと考えられます。
最近のWindowsアプリでは文字コードがシフトJISではなく、最初からunicodeになっているものが多いです。例えばファイル名に空白文字が使えているのはシフトJISではなくunicodeを使っているアプリです。unicode対応なら世界中の多くの言語・文字が扱えます。読めない文字が何語なのかわからない場合は、テキストファイルをInternet Explorerのウィンドウにドラッグ&ドロップして、言語をチェックすることができます。同様に文字化けしたファイルもInternet Explorerで開くとunicode か シフトJISかがわかりますし、異なるコードを選択して保存すれば、コード変換がされます。

しかし、現実問題としてInternet Explorerはそれほど使われていないので、同等の変換はWindowsのメモ帳を使うのが良いでしょう。つまり、(A)のような文字化けした文字列をメモ帳にカット&ペーストして、(B)文字コードにANSIを選択して保存すると、(C)シフトJISの文書になって読めるようになります。
冒頭のスマホで化けている場合は、逆にAndroidなどではシフトJISの文書が読めないからで、クラウドに文書を載せる場合は、なるべくUTF-8を使うのがおすすめです。今日UTF-8で作った文書は古いWindows ソフトウェア以外ではどこでも読めるはずです。
またネット上には任意の文字列を意図的に文字化けさせたり、文字化けの復元を試みるアプリもあります。
(例 https://tools.m-bsys.com/dev_tools/char_corruption.php)
文字化けした文字列をカット&ペーストして、変換や復元をやってみると、だいたいどんな化け方をすると、何が原因かがつかめるようになります。例えば、古いzip圧縮アプリ(Lhaplusなど)で日本語ファイル名などを含むファイルを扱って、ファイル名が化けた場合に、これで変換して読めるようにできます。zip圧縮を扱うのは最近のWindowsに備わっているExplolerの機能を使う方が確実です。
Webフォントは印刷にも使えるのか?
Webフォントについては、記事「Webフォントにするメリットは何か?」に説明がありますが、CSS3.0 fonts moduleでサーバー側から提供されるフォントデータでクライアントが文字表示を行えるようになったものです。
Webフォントが使えると、ページ制作をしたオリジナルの姿で表示されるだけでなく、文字を画像にすることがなくなるので、文字検索、SEO対応、文字編集、自動翻訳、音声読み上げに対応できます。ただしWebブラウザがダウンロードして使うものなので、各ブラウザの機能や仕様に依存し、プリントやPDF化については、ブラウザが異なると出力結果は同じになりません。
つまりWebページやWeb制作とは関係なくWebフォントを使うのは難しいといえますが、PDF化したものを印刷物制作に取り込むようなことは工夫次第でできます。そもそも多くの場合にWebフォントを使う理由は、印刷用フォントをWEBでも使いたいことですので、日本語のフォントメーカーのものなら印刷用フォントを入手すればいいわけです。しかし上の図のように、欧文など日本で手に入らないフォントがWEBで使われていて、それを印刷したい場合もあります。
その場合、まずPDF保存してちゃんとWEBフォントが使えているかどうかを確認します。しかしそれを他の印刷物に転用できるかどうかは、フォント各社のライセンス条項によりますので、その確認が必要になります。日本のフォントベンダーはそれそれのサイトに注意書きがありますので確認してください。海外で一番有名なWEBフォント fonts.com では日本語フォントも取り扱っており、AXISフォントやDynaFont(ダイナフォント)がありますが、ライセンスや利用料金もかかるWebフォントもあります。
日本でポピュラーな欧文WEBフォントには、Google Fonts、Adobeフォントライブラリがあります。Google FontsはGoogleが提供している無料のフォントで、種類も豊富といった点が特徴です。Adobeフォントライブラリには幅広くデザイン性に富んだフォントが揃っていて、全体が全てのCreative Cloudのサブスクリプションプランで利用できます。
ロゴや商品名など短い文字列で使う場合、フォントとして再利用できなければ文字を画像化して使うしか方法がありません。利用できる場合はAdobeイラストレータに取り込んでアウトライン化することで使うという方法もあります。
Windowsで文字化けが起こる
CSVファイルをEXCELで開いたら文字化けしていたとか、メールが化けている、またメールの添付ファイルが化けているということが起こることがあります。また何らかのアプリケーションから取り出したファイルや、アプリケーションに読み込んだファイルが文字化けを起こすことがあります。典型的なのはWindowsで作成したテキストをメールに添付してiphoneで開いた場合などです。これは文字コードの違いによるもので、シフトJISで保存されていたものを、utf-8だと解釈して表示する場合に起こります。これに対しては、ファイルを取り出して文字コードの指定を変えれば正しく読みだすことができます。
以前はOSごとに基準となる文字コード体系が異なることによる現象が多くみられました。ms-dos以来パソコンのテキストファイルは無条件でシフトJISが使われてきましたが、現在主流のWindows10ではデフォルトでutf-8で保存するために、古いテキストファイルやcsvファイルをWindows10のアプリで開くと化けてしまう場合があります。
逆にWindows10で保存されたテキストをWindows7や古いアプリケーションで開くと、やはり化けてしまうことも起こります。しかしシフトJISであったり古いアプリで必ず文字化けが起こるかというと、そうとは限りません。それはブラウザでもアプリでもソフトウェア的に文字コードの判別をする機能を持っていて、自動変換をして正しく表示することも行われているからです。
自動変換に頼れない場合は、古いファイルやWindows10以前のアプリを使う場合には利用者側で文字コードの確認をしておくのがいいでしょう。今日ではutf-8に統一して扱うのが良いのですが、utf-8nとかBOM付があり、BOMはバイトオーダーマーク(byte order mark)の略で、Unicodeで符号化したテキストの先頭に付与され、アプリケーションによってはBOMで文字コード判断しますが、BOMがあると正常に処理できないこともあります。EXCELだけが対象ならBOM付の方がよいですが、Webで使うならBOM無しの方がおすすめです。
圧縮されたファイルを解凍したが、ファイル名が化けて、うまく扱えない
zip圧縮されたファイルをメール添付やネット上からのダウンロードで入手した場合に、中に含まれているファイル名やフォルダ名が破損していて識別できないとか、解凍・コピーができないことがあります。無理に解凍してもファイル名が長くなりすぎて削除ができないとかパソコン操作に支障をきたす場合もあります。
原因
パソコンのOSによって同じzipフォーマットであっても中に含まれるファイル名文字の符号化方法(エンコード)が若干異なる場合に、圧縮されたパソコンと異なるOSのパソコンでは元と同じ様には見えないためです。多く発生するのはMacで作成した圧縮ファイルをWindowsで解凍する場合で、これはWindowsは「Shift-JIS」を昔から使っているのに対して、UNIX系であるMac OS X(やUNIX系OSのLinuxなど)では、UTF-8を使っているという違いがあるからです。
2007年からzipフォーマットは拡張されてファイル名がUTF-8である場合はフラグを立てるように決まったのですが、Mac OS XやUNIX系OSはUTF-8フラグを立てていないのでWindowsがShift-JISと思って処理することから起こる現象です。
対処
WindowsでもWindows8以降のOSについては、標準でUTF-8にも対応していますが、Windows7またはWindowsServer2008までの場合は標準ではUTF-8フラグに対応していないので、マイクロソフトの修正プログラムによって解凍機能パッチをあてて使用しなければなりません。修正プログラムは以下にあります。
https://support.microsoft.com/ja-jp/kb/2704299
逆にWindows7などのShift_JISでzip圧縮ファイルを作った場合には、Mac OS Xが標準でShift-JISの解凍に対応しているので問題は起こりません。しかしiPadや、Linuxが相手だと対応できないで文字化けが起こる可能性がありますので、Windows側もUTF-8に対応した修正プログラムを使うか、7-zip (https://sevenzip.osdn.jp/)のようなフリーソフトを使います。
Mac で Windowsユーザーを対象にShift-JIS の zip ファイルを作成する際には、Mac特有の「.DS_Store」をはじめとするファイルを自動的に除外する機能が付いているソフトである、WinArchiver やMacZip4Winを使います。
現在はWindows10に移行していますので、こういったトラブルは減っていくと考えられますが、ファイル交換やファイル公開の際にはエンコードの違いのことは気にしておくべきです。








