1、中文汉字的编码局限:[\u4e00-\u9fa5](java相干视频教程引荐:java视频教程)
下面的要领推断一个字符是不是是汉字
//如果是一个汉字返回true,不然返回falsepublic static boolean checkCharCN(char c){ String s = String.valueOf(c); String regex = "[\u4e00-\u9fa5]"; Pattern p = Pattern.compile(regex); Matcher m = p.matcher(s); return m.matches(); }
Java用的是Unicode 编码char 型变量的局限是0-65535 无标记的值,能够示意 65536个字符,基础上地球上的字符可被悉数包含了
汉字基础集合在[19968,40869]之间,共有20901个汉字
unicode编码局限:
汉字:[0x4e00,0x9fa5](或十进制[19968,40869])
数字:[0x30,0x39](或十进制[48, 57])
小写字母:[0x61,0x7a](或十进制[97, 122])
大写字母:[0x41,0x5a](或十进制[65, 90])
更多java相干文章请关注java基础教程栏目。
以上就是java推断字符是不是中文字符的要领的细致内容,更多请关注ki4网别的相干文章!