自动检测汉字GB18030编码与UTF-8编码
想到如下特征来识别汉字:1.如果第1位是0就不需要判断的,一定是ASCII字符。2.如果第1位是1开头的,第2位是0开头的,一定是GB编码。3.如果第1位是非1110开头的,则一定是GB编码。4.多做几个汉字判断。
下载地址
用户评论
虽然我看到代码比较乱,不过readme还是比较有用哈
有用可以参考一下
谢谢分享!!
可以参考一下 readme有用