您當前位置：首頁 > php開源 > php教程 > Java代碼實現隨機生成漢字

Java代碼實現隨機生成漢字

來源：程序員人生發布時間：2015-04-09 08:30:56 閱讀次數：3807次

1、背景知識
GB 2312⑻0 是中國國家標準簡體中文字符集，全稱《信息交換用漢字編碼字符集?基本集》，由中國國家標準總局發布，1981年5月1日實行。GB2312 編碼通行于中國大陸；新加坡等地也采取此編碼。中國大陸幾近所有的中文系統和國際化的軟件都支持 GB 2312。

GB2312 標準共收錄 6763 個漢字，其中1級漢字 3755 個，2級漢字 3008 個；同時收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內的 682 個字符。GB2312 的出現，基本滿足了漢字的計算機處理需要，它所收錄的漢字已覆蓋中國大陸 99.75% 的使用頻率。對人名、古漢語等方面出現的罕用字，GB2312 不能處理，這致使了后來 GBK 及 GB18030 漢字字符集的出現。

GB2312 中對所收漢字進行了“分區”處理，每區含有 94 個漢字/符號。這類表示方式也稱為區位碼。

01 - 09 區為特殊符號。
16 - 55 區為1級漢字，按拼音排序。
56 - 87 區為2級漢字，按部首/筆劃排序。
10 - 15 區及 88 - 94 區則未有編碼。舉例來講，“啊”字是 GB2312 當中的第1個漢字，它的區位碼就是 1601。

每一個漢字及符號以兩個字節來表示。第1個字節稱為“高位字節”，第2個字節稱為“低位字節”。“高位字節”使用了 0xA1 - 0xF7（把 01 - 87 區的區號加上 0xA0），“低位字節”使用了 0xA1 - 0xFE（把 01 - 94 位的位號加上 0xA0）。由于1級漢字從 16 區起始，漢字區的“高位字節”的范圍是 0xB0 - 0xF7，“低位字節”的范圍是 0xA1 - 0xFE，占用的碼位是 72 * 94 = 6768。其中有 5 個空位是 D7FA - D7FE。例如“啊”字在大多數程序中，會以兩個字節，0xB0（第1個字節）0xA1（第2個字節）貯存。（與區位碼對照：0xB0 = 0xA0 + 16, 0xA1 = 0xA0 + 1）。

國家標準 GB 18030⑵005《信息技術中文編碼字符集》，是中華人民共和國現時最新的內碼字集，與 GB 2312⑴980 完全兼容，與 GBK 基本兼容，支持 GB 13000 及 Unicode 的全部統1漢字，共收錄漢字 70244 個。現行版本為國家質量監督檢驗總局和中國國家標準化管理委員會于2005年11月8日發布，2006年5月1日實行，為在中國境內所有軟件產品支持的強迫標準。

(以上資料來源于“維基百科”)

2、隨機生成經常使用漢字的 C# 程序

新建Java項目，創建代碼片斷：

import java.io.UnsupportedEncodingException;
import java.util.Random;

/**
 * 隨機生成常見的漢字
 * 
 * @author xuliugen
 * 
 */
public class GeneCharTest {
    public static void main(String[] args) {

        for (int i = 1; i < 24; i++) {
            System.out.print(getRandomChar() + "  ");
        }
    }

    private static char getRandomChar() {
        String str = "";
        int hightPos; //
        int lowPos;

        Random random = new Random();

        hightPos = (176 + Math.abs(random.nextInt(39)));
        lowPos = (161 + Math.abs(random.nextInt(93)));

        byte[] b = new byte[2];
        b[0] = (Integer.valueOf(hightPos)).byteValue();
        b[1] = (Integer.valueOf(lowPos)).byteValue();

        try {
            str = new String(b, "GBK");
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
            System.out.println("毛病");
        }

        return str.charAt(0);
    }
}

運行結果：
這里寫圖片描述

生活不易，碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生

------分隔線----------------------------

上一篇 [置頂] CSDN博客自動訪問

下一篇 SharePoint 2013 Nintex Workflow 工作流幫助（十二）

分享到:

------分隔線----------------------------

為碼而活

積分：4237

15粉絲

7關注

欄目熱點

多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

Java代碼實現隨機生成漢字