什么是URL编码和URL解码(在线编码解码工具)

2023-03-23 14:17:33 听风 思思

因为在程序中无法直接请求一个含有中文的url,所以,我们要对它编码,我们一般会编成gbk,utf-8,但是URL编码和gbk,utf-8编码的区别是,它不会把所有字符都编码,

它只对非字母数字的字符借助utf-8或gbk来编码。

编码时注意 不能把整个url路径传到UrlEncoder的decode方法中,因为它也会把反斜杠/和冒号:也编码,所以域名部分是不需要编码的,取出路径部分 /图片/华仔.jpg

编码解码工具 之 Base16编码/解码

Base16编码使用16个ASCII可打印字符(数字0-9和字母A-F)对任意字节数据进行编码。Base16先获取输入字符串每个字节的二进制值(不足8比特在高位补0),然后将其串联进来,再按照4比特一组进行切分,将每组二进制数分别转换成十进制,在下述表格中找到对应的编码串接起来就是Base16编码。

Base16编码的方式:

1.将数据(根据ASCII编码,UTF-8编码等)转成对应的二进制数,不足8比特位高位补0。然后将所有的二进制全部串起来,4个二进制位为一组,转化成对应十进制数。

2.根据十进制数值找到Base16编码表里面对应的字符。Base16是4个比特位表示一个字符,所以原始是1个字节(8个比特位)刚好可以分成两组,也就是说原先如果使用ASCII编码后的一个字符,现在转化成两个字符。数据量是原先的2倍。

在线工具链接:

url的编码和解码方式

url的在线编码和解码工具:

1、基本知识

URLEncode:是指针对网页url中的中文字符的一种编码转化方式,最常见的就是Baidu、 Google等搜索引擎中输入中文查询时候,生成经过 Encode过的网页URL。URLEncode的方式一般有两种一种是传统的基于GB2312的Encode(Baidu、Yisou等使用),一种是 基于UTF-8的Encode(Google,Yahoo等使用)。本工具分别实现两种方式的Encode与Decode。

中文 - GB2312的Encode - ����

中文 - UTF-8的Encode - 中文

Html中的URLEncode:

编码为GB2312的html文件中,

中文.rar - 浏览器自动转换为 - ����.rar

注意:Firefox对GB2312的Encode的中文URL支持不好,因为它默认是UTF-8编码发送URL的,但是ftp://协议可以,我试过了.我认为这应该算是Firefox一个bug.

编码为UTF-8的html文件中,

中文.rar - 浏览器自动转换为 - 中文.rar

PHP中的URLEncode:

//GB2312的Encode

echo urlencode(“中文-_. “).”\n”; // ����-_.+

echo urldecode(“����-_. “).”\n”; //中文-_.

echo rawurlencode(“中文-_. “).”\n”; // ����-_.

echo rawurldecode(“����-_. “).”\n”; //中文-_.

?

除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数。

urlencode和rawurlencode的区别:

urlencode 将空格则编码为加号(+)

rawurlencode 将空格则编码为加号( )

如果要使用UTF-8的Encode,有两种方法:

一、将文件存为UTF-8文件,直接使用urlencode、rawurlencode即可。

二、使用mb_convert_encoding函数。

$url = ‘中文.rar’;

echo urlencode(mb_convert_encoding($url, ‘utf-8′, ‘gb2312′)).”\n”;

echo rawurlencode(mb_convert_encoding($url, ‘utf-8′, ‘gb2312′)).”\n”;

//中文.rar

?

实例:

function parseurl($url=”")

{

$url = rawurlencode(mb_convert_encoding($url, ‘gb2312′, ‘utf-8′));

$a = array(“:”, “/”, “@″);

$b = array(“:”, “/”, “@”);

$url = str_replace($a, $b, $url);

return $url;

}

$url=”中文/中文.rar”;

echo parseurl($url);

//����/����.rar

?

JavaScript中的URLEncode:

中文-_. 中文-_.

encodeURI 不对下列字符进行编码:“:”、“/”、“;”、“?”、“@”等特殊字符。

中文.rar中文.rar

2、示例

;ckn=91142321196129

1)utf-8解码

�ᘷ���� ������ckn=91142321196129

2)gb2312解码

�针吠塑� 浈��?ckn=91142321196129