制作お役立ち便利帳
文字に関するご質問

Q Webで外国文字が表示されたり、されなかったりする。

A

今のパソコンはUnicode(ISO/IEC 10646)など8ビット単位(UTF-8)で複数バイトの文字を扱えるようになっているので、どこからでも世界中の言語のWebにアクセスできますが、パソコンの中に外国語のフォントが無いと、表示上は□■▭▯などに置き換えられて読むことができません。

「【Q】カタログと同じフォントをWebにも使いたい。」では、WebフォントというWebサーバ側にインストールされたフォントをページデータと共に利用者に送りつけて、Webを最初に作った時のフォントがそのまま再現できる仕組みを説明しましたが、そもそもWebサーバには外国人向けのフォントをわざわざ入れないので外国では表示ができません。

例えば欧米の人が日本のWebを見たならばどうなるでしょうか? 今は機械翻訳も進んでいるので、外国語も(読めるかどうかは別にして)そのまま表示してほしいという要望も出てきました。そこでGoogleは世界中の言語を一つのフォントセットで表現するNotoFontsを開発しました(参考)。これは□などが豆腐文字と呼ばれたので“No more Tofu”の略だと言われています。Webページにこのフォント指定が広まれば、外国文字が見えないことは減っていきます。

NotoFontsの日本語部分はAdobeが制作したもので、活字メーカーであったイワタによる本格的なデザインがされていて、ウェイトも7種類あります。これはWebフォントとしても画期的なことで、従来は画面ではウェイトが不足していたのが欧文並にカバーされています。また従来の日本語Webフォントのちゃんとしたものは有料であったのがGoogle(Adobe)のものは無料であるので、外国のみならず日本国内でも需要が高まるかもしれません。

源ノ角ゴシック

これらの印刷用にも使えるフォントは、Adobeからオープンソースのゴシック体フォント。「源ノ角ゴシック」として無料提供され、パソコン用のダウンロードサイト(例えば窓の杜)から手に入れることができます。これは日本・中国・韓国で使われている文字を網羅したゴシック体のフォント「Source Han Sans」のうち、日本語部分だけですが、日中韓で使われている漢字を統一されたデザインで利用できるので、東アジアに向けた印刷物やWebページ、ソフトなどに便利かもしれません。(参考

しかし提供されている書体は角ゴシックのみなので、今これだけで紙面構成をするのは難しいのですが、このフォントは改変や再配布が自由なので、丸ゴシックなども提供され始めています。

源柔ゴシック

文字コードが世界共通になろうとしていることを追いかけて、フォントも最低限のデザインは世界共通になろうとしてるのでしょう。

Q 一流のDTPなのに文字組がきたない(横組み)

A

AdobeInDesignなどのDTPソフトは、日本の伝統的な文字組版の規則を考慮して作られているので、初期設定のママでも恥ずかしくない文字組にはなりますし、メニュー・ダイアログの設定を変えても使い方が適切ならば問題ないはずです。しかし文字の並びがいびつになる原因はDTPソフトの機能以外にもあり、そもそも原稿に使っている文字種が不適切な場合は、どのようなソフトを使おうともバラけた文字の並びになってしまうことがあります。

例えば、日本語ワープロが登場以来、カナ・数字・アルファベットには全角と半角があり、オフィスではなんとなく使い分けられていますが、出版目的にはこれらの用法に厳格な規則を定めていて、混在してみっともないことにはなりません。もし曖昧な使い分けをしていたならば、文字組の結果は不均一になります。

とりわけ、!“#$%&‘()*+-?/@ などは、全角と半角の使い分けが混同しがちな文字種で、混じって使われていると、前後の文字との間隔がバラバラになってしまいます。また欧文でしか使われない []{}‘’や、和文でしか使われない 「」『』【】を、違う言語の文字と組み合わせてしまっても、文字組版はきれいにいかない場合があります。それは欧文と和文の境界には少しのスペース(4分の1~3分の1)を開ける習慣がありますが、上記の記号・約物・括弧類が和欧入り混じるとDTPソフトではうまく並べにくいからです。特にパソコンのキー入力では引用符“”と ″がうまく使い分けにくいので、誤用が起こりがちです。

和文中に欧文の単語や行が挿入される場合には、行末にどこで折り返すかの処理が大きな問題になります。欧文単語の途中で行が折り返せないので単語単位で行の切れ目を決めることから、英字間が空いてまばらに文字が配列されるみっともないところが出てきてしまいます。それを避けるのはDTPソフトでは難しく、多くの場合に人が原稿のどこかに改行やスペースを入れて調整しています。

組版(横組み)

和文欧文が混じる場合の文字の並びにはフォントの選択も関係していて、日本で作られた欧文フォントならば和文との整合を考えてデザインされていますが、デザインが面白いからといって海外のフォントをネットからダウンロードして使う際には、そのままではベースラインの位置がずれてしまうことがあります。この場合はその欧文の部分だけベースラインの調整が必要になり、これも手作業になります。

出版の制作過程ではこういった記号や約物などの利用規則を知っている編集者や校正者が原稿をチェックして統一的な使い方になるように整理していますので、DTPソフトで組んだ結果が適切なものとなりますが、もし原稿整理がされていないとDTPソフトでもワードプロセッサと同程度の文字組になってしまいます。原稿整理は、記号・約物・全角/半角 などの統一はプログラムによって一律に変換するやり方がありますが、前述のように誤用とか不適切な使い方とか行末処理による文字間のばらつきなどは、文字組の結果を見てから人が再調整するしかありません。

Q 一流のDTPなのに文字組がきたない(縦組み)

A

日本語は元は縦組であって、文字は原稿用紙のようにマス目に並ぶような組み方がされていました。そこでは数字には漢数字が使われ、桁の表示も十百千万億のように漢字で表すものでした。しかしカタカナ語の増加と共にアルファベットや算用数字・英記号も日本語表記の中に増えて、それを縦組でどのように表現(組版)するのかについては、いくつもの方式が生まれました。

組版(縦組み)

この例では、WCCやWHOなどの略語ではアルファベットを縦に並べていますが、数字2桁の場合は左の例のように縦中横の組み方をしています。また括弧(パーレン)類は右の例では全角ですが、左の例では2分(半角)になっています。これらはどちらが良いか悪いかという問題ではなく、文章中に出現する記号・約物・数字・アルファベットなどの扱いについて、何らかの統一がされていますので、読みにくさとか見っとも無さにはなっていません。

それには原稿を書いた後で、それらの統一をする作業が必要になり、「【Q】一流のDTPなのに文字組がきたない(横組み)」と同様に原稿整理を行っているからです。特に横書きのワードプロセッサで原稿を書いている場合は漢数字とか縦中横を気にすることはありませんので、それらを縦組みにする際に統一を図る作業は増えていしまいます。

出版制作の段階では、プロの編集者や校正者が原稿をチェックして統一的な使い方になるように整理してからDTP作業に入りますが、もし原稿整理がされていないとプロのDTPソフトで統一感のない、紙面の中のアキにムラのある文字組になってしまいます。

オフィスの文書を縦書きにすることは滅多にありませんが、横書きの原稿を集めて縦組の出版物を作る場合には、原稿整理は2段階になる場合が多いでしょう。まず一旦文字原稿をプログラムによって記号・約物・全角/半角 など一括変換をして、さらに縦組に適切な文字や記号になっているかを人が再調整する必要があります。

Q 文字原稿の代わりにPDFは使えますか?

A

PDFが作られた経緯はいくつも考えられます。

① WordやExcelなどMicrosoftOfficeで作って保存する際にPDFを指定した場合。
② 複合機などで文書をスキャンしてPDF保存した場合。
③ オフセット印刷などの目的でInDesignなどで作成した場合。

これらのうち、①はWordやExcelなどに変換するソフトも入手でき、PDFからテキストファイルを取りだして、再編集をすることも可能なことは多いと考えられます。

③の場合は簡単にテキストファイルが取りだせる場合と取りだせない場合があります。AdobeReaderなどでPDFを開いて文字の全選択ができればテキストファイルをカット&ペーストで取りだすことができます。しかし商業印刷では多様なフォントを使用するので、実際に使用した文字だけをアウトライン化した図形としてPDFにした場合は、そのままではテキストファイルは取りだせません。またフォント埋め込みをしたPDFでは、画面から文字の選択が可能であっても、カット&ペーストをすると意味不明な文字列になる場合があり、テキストファイルとして取りだせないかもしれません。

②は紙面が図像・画像化されていますので、そのままでは文字選択とか文字検索はできません。テキストファイルを取りだすにはOCRにかける必要があり、そのためのソフトも多くあります。またAdobeAcrobatというPDFの加工ツールにもOCR機能があり、そこでは③でアウトライン化された文字(Adobeイラストレータで作られた場合を含め)でもOCR機能が使えます。ただしOCR機能に完全を期待することはできません。取りだしたテキストファイルには人が気づきにくい間違いもありますので、緻密な校正が必要になります。

いずれにしてもワープロやDTPソフトのファイルとは違って、PDFでは文字列ではなく文字単位でコード、フォント、座標位置などの情報を持つことができる反面、文章や文節と言う流れの情報は扱わないので、例えば紙面中に縦中横、横中縦があるとか横書きと縦書きが混在していたら、日本語としては誤ったつながりのテキストが取得されてしまうことがよくあります。例えば表組の表頭・表側部分では縦横の組方向の判別がつかないために、テキストを1文字づつ手で編集し直さねばならないことが多いです。つまりよほど単純な紙面でない限りPDFを文字原稿の代わりに使うのは無理が生じがちです。

しかし雑誌で過去10年分のPDFがあって再利用したいという場合には、同じパターンの記事が多くあると考えられますので、最初にPDFがどのような構造になっていてるのかを解析して、テキストファイルの適切な取り出し方法を見つければ、若干編集作業が必要であってもコンテンツの再利用や電子書籍化はうんと楽になります。PDFの再利用は最初にかならず実験が必要になると考えておけばよいでしょう。