2010年8月27日 星期五

023電腦中文並非圖形

  上文提到字元bit與字節byte和中文乃雙字節系統double byte。很多讀者都摸不著頭腦,不明所以;今日就講清楚吧。試想想:電腦的信息表達靠無數電源的開與關。用數字來代表,1是開,0是關。既然只有0與1兩個代表數目,電腦始創中人就以二進制數字binary digit來表示電腦的基本份子。頭痛的問題又由此而衍生了:這個字委實太長,講得太快舌頭可會打結呢!於是老外(洋人)就取其頭兩個字母BI、和最尾的字母T,組成BIT了。
  一個字元1 bit只能代表兩樣事情、兩個字元可有四個組合(即2乘2)、三個得八(即22乘2)、四變16…五得32…六生64…七出128…八有256。今天的英文字符在電腦上共有256,所以人稱1 byte有8 bits。
  雖說中文漢字乃象形文字,不過在電腦上可不能用圖形方式來表達。誠如國內的中文電腦大師支秉彝指出:用圖形方式來代表中文字乃殺雞用牛刀,大材小用!且細想圖文傳真機的掃描方式就明白箇中道理了。換言之,正如英文字符,中文字也是一個個的事先造好了,擺入漢字庫內備用,那才處理得夠快速。
  既然中文字有6763個法定簡體字(大陸的中文電腦系統),台灣則採用13053個正體字,那麼需用多少個字元才夠表示呢?共14個!即兩個英文字節。2自乘14次等於16384(字庫最高容量)。每個字節還剩1 bit,可作傳送偵錯功能呢!

沒有留言:

張貼留言