コンピュータ上で日本語の文字コード(エンコーディング方法)はいくつかあり,コンピュータやアプリケーションの種類によって日本語の扱い方が異なる.
またFTPやmtoolsでのファイル転送では自動的に日本語文字コードを変換しないため,日本語文字コードをnkfコマンドを使って変換する必要がある.
次に主な日本語文字コードを挙げる.
CNSでは,一部を除いてISO-2022-JPで日本語を扱うことになっているが,WindowsやMacintoshなどではShift-JISが利用されている.例えば家のPCからCNS にファイルを転送する場合などのように,日本語の取り扱いが異なるコンピュータ間で日本語テキストをやりとりするには,何らかの変換をしなければならない.
フロッピーディスクを使ってコピーする場合などには,日本語コードが変換されないので,自分で日本語文字コードを変換する必要がある.Muleではどの日本語コードであっても読み書きできるので,日本語コードの種類を気にする必要はないが,LATEXなどのように特定の日本語コードでしか扱わないアプリケーションでは文字コードを変換する必要がある.CNS環境で日本語テキストのコード変換を行うには,nkf (Network Kanji code convertionFilter)コマンドを用いる.
% nkf [オプション] [変更前ファイル名] > [変更後ファイル名] <RET>
-e | 変換結果をEUC-JPで出力する |
-j | 変換結果をISO-2022-JPで出力する |
-s | 変換結果をShift-JISで出力する |
-u | 変換結果のバッファリングを行わない |
nkfコマンドは,入力ファイル名に指定されたファイルについては,3つのうちどのコードで日本語を扱っているかを自動的に判断するので,どのコードで出力するかをオプションで指定すればよい.
例えばCNSのMuleで作成したファイルcns.tex (通常はISO-2022-JPとなっている)をフロッピーで持って帰って自宅のPC (Shift-JIS)で編集するときには次のように入力する.
% nkf -s cns.tex > dyna.tex<RET>
% _