中文转UTF-8:
let str = '中文内容'; //待转换中文
escape(str ).replace(/(%u)(\w{4})/gi, "$2;")
UTF-8转中文:
let str = '徐恒'; //待转换UTF-8
unescape(str .replace(//g, '%u').replace(/;/g, ''));
你这两个代码是"读书"的区位码 (2233 4273)
用Replace Pioneer转换,自己动手,丰衣足食,而且灵活。
下面举例说明怎样用Replace Pioneer把汉字“读书”,转换成代码(2233 4273),然后再转换回汉字。
汉字转编码:
1. ctrl-o打开待转换的文本文件(纯汉字)
2. ctrl-h打开替换窗口
* 在Search for Pattern输入一个点“.”,不带双引号。
* 在Replace with Pattern输入:
${match}join("",map(calc(byte2num($_)-160), split(//,encode('gbk',$match))) )
3. 点击Replace,完成!
编码转汉字:
1. ctrl-o打开待转换的文本文件(4位一组的纯数字)
2. ctrl-h打开替换窗口
* 在Search for Pattern输入(\d\d)(\d\d)表示4位编码
* 在Replace with Pattern输入:
decode('gbk',num2byte(160+$1).num2byte(160+$2))
3. 点击Replace,完成!
unicode编码不需要转换成汉字,因为unicode就是和字符关联的终极编码。
windows中只有unicode码可以和字符直接关联,也就是使用国际标准的unicode字符集。
中文windowsXp默认的内码是gbk(装过gb18030补丁的话也就变成gb18030),日文系统就是JIS,不同语言版本的windows都有不同的默认内码,这是每个国家的标准化管理局规定的。
然后就是页码表的概念,所谓页码表就是把一个用系统默认编码(比如gbk,gb2312)表示的字符映射到对应unicode编码,而每个unicode编码对应着唯一确定的字符。这样就完成了地域性编码到国际标准码再到字符的对应关系。
在控制面板-区域和语言选择-高级,里面可以看到window提供的所有页码表。
怎么将汉字转为url编码
urlencode()函数原理就是首先把中文字符转换为十六进制,然后在每个字符前面加一个标识符%。 urldecode()函数与urlencode()函数原理相反,用于解码已编码的 URL 字符串,其原理就是把十六进制字符串转换为中文字符