2017年6月15日木曜日

UTF-8の文字

UTF-8の文字コードがいまいちよくわかってませんでした。
ちょっと調べたので、備忘のためメモしておきます。

参考にしたサイト
https://ja.wikipedia.org/wiki/UTF-8

1バイト
ASCII文字 (123, ABC とか)

2バイト
ラテン文字とか(ÀÀÃÅとか)

3バイト
ひらがな、普通の漢字とか(あいうえおとか)

4バイト
サロゲートペアの文字(U+10000~U+10FFFF)の文字
※使う場合は文字コード表で確認した方がよいです。