javascript サロゲートペア文字を考慮してUnicodeコードポイントを取得

javascript サロゲートペア文字を考慮してUnicodeコードポイントを取得

javascriptで、文字列を一度配列化して、文字のUnicodeコードポイントを取得するサンプルコードを記述してます。

環境

  • OS windows10 pro 64bit
  • Apache 2.4.43
  • ブラウザ chrome 84.0.4147.105

サロゲートペア文字を考慮

Unicodeコードポイントでは、サロゲートペア文字は1つのコード値で取得できるのですが、

実行結果をみると、2つの文字コードで表現されてしまいます。

これを解消するには、正規表現と配列化を使用して、取得する必要があります。

実行結果

ちなみに上記のfor文は1行で記述することが可能です。

サンプルコード

以下は、
「実行」ボタンをクリックすると、フォームに入力されたサロゲートペア文字列のUnicodeコードポイントを表示する
サンプルコードとなります。

※cssには「bootstrap5」を使用してます。「bootstrap5」は、IEのサポートを終了してます。

Unicodeコードポイントが表示されていることが確認できます。