靚麗時尚館

位置:首頁 > 健康生活 > 心理

一個漢字的積累碼佔幾個位元組

心理2.23W
一個漢字的積累碼佔幾個位元組

一個漢字字形碼在不同的編碼體系中可能佔2位元組或3位元組甚至4位元組。

GB2312編碼、GBK編碼中漢字字元佔2位元組。

GB18030採用多位元組編碼,每個字元可以由 1 個、2 個或 4 個位元組組成。

Unicode與ISO 10646編碼

定義了一個超大的字符集,它可以容納全世界所有的文字字元,再對它們統一進行編碼,讓每一個字元都對應一個不同的編碼值,這裡每個字元就佔4個位元組。

一個漢字字型碼佔用兩個位元組。

1個漢字需要2個位元組。主要可以是說我們中文漢字比字母多很多,使用字母那套編碼無法相容完我們的漢字。一個位元組是8個位(bit),最多可以表示256個對應字元(2的8次方)。

如果是2個位元組則是16個位(bit),最多可以表示65536個對應字元(2的16次方)。同時也是為了計算機系統原有電子邏輯,則採用2個位元組的漢字編碼。

一般佔用兩個位元組。

1個ASCII碼佔1個位元組,而1個漢字編碼佔2個位元組。

這是指漢字編碼,就象每個字元都有一個ASCII碼一樣。

如果是在UTF-8編碼下,一個漢字佔3個位元組,UTF-8是一種國際通用的一種變長編碼。

西方文字(希臘文字)佔2個字元,中文佔用3個位元組數,還有平面符號佔4個位元組。

漢字,又稱中文字,中國字,方塊字,屬於表意文字的詞素音節文字。漢字是漢語的書寫用文字 ,也被借用於書寫日語,韓語,越南語等語言,是漢字文化圈廣泛使用的一種文字,也是目前世界上唯一仍被廣泛使用的高度發達的文字。

標籤:漢字 位元組