UNIXの操作/UNIXの応用/日本語コードの変換
4.6.1 日本語文字コードコンピュータ上での日本語の文字コード(エンコーディング方法)はいくつかあり,コンピュータやアプリケーションの種類によって日本語の扱い方が異なります.またFTPやmtoolsでのファイル転送では自動的に日本語文字コードを変換しないため,日本語文字コードをnkfコマンドを使って変換する必要があります. 次におもな日本語文字コードを挙げます.
4.6.2 日本語文字コードを変換する -- nkfCNS では,一部を除いてISO-2022-JPで日本語を扱うことになっていますが,WindowsやMacintoshなどではShift-JISが利用されています.例えば家のコンピュータからCNS にファイルを転送する場合など,日本語の取り扱いが異なるコンピュータ間で日本語テキストをやりとりするには,何らかの変換をする必要があります. フロッピーディスクを使ってコピーする場合などには,文字コードが変換されないので,自分で文字コードを変換する必要があります.Emacsではどの文字コードであっても読み書きできるので,文字コードの種類を気にする必要はありませんが,LaTeXなどのように特定の文字コードでしか利用できないアプリケーションでは文字コードを変換する必要があります.CNS 環境で日本語テキストの文字コード変換を行うには,nkf (Network Kanji code convertionFilter)コマンドを用います.
%nkf [オプション] [変更前ファイル名] > [変更後ファイル名] <RET> オプション
例えばCNS のEmacsで作成したファイル`cns.tex' (通常はISO-2022-JPとなっている)をフロッピーで持って帰って自宅のコンピュータ (Shift-JIS)で編集するときには次のように入力してください.
% nkf -s cns.tex > dyna.tex<RET>
% _
nkfコマンドを使って文字コードを変換するとき,変更前と変更後のファイル名を同じにすると,ファイルの内容が空になるので注意してください.
4.6.3 改行コードWindowsやMacintoshで作成したファイルをUNIXで編集する場合には,次のようにして改行コードを変更します.
% tr -d '\015' < [Windowsのファイル] > [UNIXのファイル]<RET> % tr -d '\015' '\012' < [Macintoshのファイル] > [UNIXのファイル]<RET>
|