-[[【 nkf 】 文字コードを変換する:http://itpro.nikkeibp.co.jp/article/COLUMN/20060227/230849/]]

* unicode [#leb5b740]
-[[Unicodeのテキストファイルをほかの文字コードに変換するには:http://www.atmarkit.co.jp/flinux/rensai/linuxtips/448cnvunicode.html]]

-エスケープされたunicode文字列を確認したい場合
 $ python -c "print u'\u30A8\u30B9\u30B1\u30FC\u30D7\u3055\u308C\u305F\u30E6\u30CB\u30B3\u30FC\u30C9'"
 エスケープされたユニコード

* 変換ツール [#f64ee4ba]
** iconv [#yca920cb]

** [[lv:http://www.ff.iij4u.or.jp/~nrt/lv/]] [#kaf90d26]

** [[nkf:http://sourceforge.jp/projects/nkf/]] [#y00acc50]
-[[Linux上で文字コードを変換できるコマンドnkfのオプション一覧:http://jp.layer8.sh/reference/entry/show/id/745]]

 $ nkf --help
 Usage:  nkf -[flags] [--] [in file] .. [out file for -O flag]
  j/s/e/w  Specify output encoding ISO-2022-JP, Shift_JIS, EUC-JP
           UTF options is -w[8[0],{16,32}[{B,L}[0]]]
  J/S/E/W  Specify input encoding ISO-2022-JP, Shift_JIS, EUC-JP
           UTF option is -W[8,[16,32][B,L]]
  m[BQSN0] MIME decode [B:base64,Q:quoted,S:strict,N:nonstrict,0:no decode]
  M[BQ]    MIME encode [B:base64 Q:quoted]
  f/F      Folding: -f60 or -f or -f60-10 (fold margin 10) F preserve nl
  Z[0-4]   Default/0: Convert JISX0208 Alphabet to ASCII
           1: Kankaku to one space  2: to two spaces  3: HTML Entity
           4: JISX0208 Katakana to JISX0201 Katakana
  X,x      Convert Halfwidth Katakana to Fullwidth or preserve it
  O        Output to File (DEFAULT 'nkf.out')
  L[uwm]   Line mode u:LF w:CRLF m:CR (DEFAULT noconversion)
  --ic=<encoding>        Specify the input encoding
  --oc=<encoding>        Specify the output encoding
  --hiragana --katakana  Hiragana/Katakana Conversion
  --katakana-hiragana    Converts each other
  --{cap, url}-input     Convert hex after ':' or '%'
  --numchar-input        Convert Unicode Character Reference
  --fb-{skip, html, xml, perl, java, subchar}
                         Specify unassigned character's replacement
  --in-place[=SUF]       Overwrite original files
  --overwrite[=SUF]      Preserve timestamp of original files
  -g --guess             Guess the input code
  -v --version           Print the version
  --help/-V              Print this help / configuration

-URLエンコード(出力:UTF-8)
 $ echo '%A4%DB%A4%B2' | tr % = | nkf -wmQ
 ほげ

-URLデコード(入力:UTF-8)
 $ echo ほげ | nkf -wMQ | tr = %
 %E3%81%BB%E3%81%92


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS