碼位
在字元編碼術語中,碼位或稱編碼位置[1],即英文的code point或code position,是組成碼空間(或頁碼)的數值[2]。 例如,ASCII碼包含128個碼位,範圍是016進制到7F16進制,擴充ASCII碼包含256個碼位,範圍是016進制到FF16進制,而Unicode包含1,114,112個碼位,範圍是016進制到10FFFF16進制。Unicode碼空間劃分為17個Unicode字元平面(基本多文種平面,16個輔助平面),每個平面有65,536(= 216)個碼位。因此Unicode碼空間總計是17 × 65,536 = 1,114,112.
定義
碼位的抽象意涵, 不同於下列概念:
- 作為具體編碼的位元流。例如,UTF-16編碼的位元流,既可以是大尾序,也可以是小尾序。
- 具有特定字形的字元. 因為字元集中的字元(碼位)的具體外觀隨字型(font)——字型顯示樣式——的不同而變化。
- 特定碼空間的編碼方式。例如,一個Unicode碼空間的碼位,可以用UTF-8編碼;也可以用UTF-16編碼。
- 用不同字形顯示一個字元,即字位.
參考
- ^ GB 18030-2005《資訊科技 中文編碼字元集》中,既使用了碼位,也用了編碼位置。
- ^ Glossary of Unicode Terms. [2012-03-12]. (原始內容存檔於2015-12-26).