UNICODE

概要

UNICODEでは1文字は2バイトになります。0000hから00FFhはISO-8859-1と互換性があります。SHIFT_JISに変換できない文字を多数含んでいます。

ファイルの先頭の2バイトはバイトオーダーを表します。FFh FEhならばリトルエンディアン(小さいバイトの方が先)、FEh FFhならばビックエンディアン(大きいバイトの方が先)です。

実装

SHIFT_JISへ変換

WindowsのAPIを用いて行います。WindowsのAPIに依存します。

SHIFT_JISから変換

WindowsのAPIを用いて行います。WindowsのAPIに依存します。

判別

リトルエンディアン

下記の条件をすべて満たすときにはUNICOCE(リトルエンディアン)と判定します。

  • ファイルの先頭がFFh FEh。
  • ファイルサイズは偶数。
  • ビックエンディアン

    下記の条件をすべて満たすときにはUNICOCE(ビックエンディアン)と判定します。

  • ファイルの先頭がFEh FFh。
  • ファイルサイズは偶数。

  • 戻る