Já vimos o que é URL em um outro artigo: Rede e Internet: O que é uma URL?
URL nada mais é que o endereço web, de internet, que estamos acostumados a ver, como: categoriaoutros.com.br, gnulinuxbrasil.com.br etc…
Umaa URLé composta por uma quantidade específica de caracteres pertencentes ao conjunto de caracteres US-ASCII.
Em uma URL, alguns caracteres não são aceitos: espaço, backspace, |, \, <, >, {, } etc…
Existem alguns caracteres que têm significado especial em URLs. Esses caracteres são chamados de caracteres reservados: ?
, /
, #
, :
Quaisquer dados transmitidos como parte da URL não devem conter esses caracteres. Então, o que fazemos quando precisamos transmitir quaisquer dados na URL que contenham esses caracteres não permitidos? Nós codificamos eles!
URL Encoding converte caracteres não aceitos para um formato universalmente aceito e compreendido por todos os navegadores e servidores da web.
A codificação de URL também é chamada de codificação de porcentagem, pois usa o sinal de porcentagem (%) como caractere de escape.
Espaço: Um dos caracteres codificados mais frequentes que você provavelmente encontrará é o espaço. O valor ASCII do caractere de espaço em decimal é 32, que quando convertido em hexadecimal resulta em 20. Agora, apenas colocamos uma % antes que nos dá o valor codificado %20.
Referência de codificação de caracteres ASCII
Decimal | Character | URL Encoding (UTF-8) |
---|---|---|
0 | NUL | %00 |
1 | SOH | %01 |
2 | STX | %02 |
3 | ETX | %03 |
4 | EOT | %04 |
5 | ENQ | %05 |
6 | ACK | %06 |
7 | BEL | %07 |
8 | BS | %08 |
9 | HT | %09 |
10 | LF | %0A |
11 | VT | %0B |
12 | FF | %0C |
13 | CR | %0D |
14 | SO | %0E |
15 | SI | %0F |
16 | DLE | %10 |
17 | DC1 | %11 |
18 | DC2 | %12 |
19 | DC3 | %13 |
20 | DC4 | %14 |
21 | NAK | %15 |
22 | SYN | %16 |
23 | ETB | %17 |
24 | CAN | %18 |
25 | EM | %19 |
26 | SUB | %1A |
27 | ESC | %1B |
28 | FS | %1C |
29 | GS | %1D |
30 | RS | %1E |
31 | US | %1F |
32 | space | %20 |
33 | ! | %21 |
34 | “ | %22 |
35 | # | %23 |
36 | $ | %24 |
37 | % | %25 |
38 | & | %26 |
39 | ‘ | %27 |
40 | ( | %28 |
41 | ) | %29 |
42 | * | %2A |
43 | + | %2B |
44 | , | %2C |
45 | – | %2D |
46 | . | %2E |
47 | / | %2F |
48 | 0 | %30 |
49 | 1 | %31 |
50 | 2 | %32 |
51 | 3 | %33 |
52 | 4 | %34 |
53 | 5 | %35 |
54 | 6 | %36 |
55 | 7 | %37 |
56 | 8 | %38 |
57 | 9 | %39 |
58 | : | %3A |
59 | ; | %3B |
60 | < | %3C |
61 | = | %3D |
62 | > | %3E |
63 | ? | %3F |
64 | @ | %40 |
65 | A | %41 |
66 | B | %42 |
67 | C | %43 |
68 | D | %44 |
69 | E | %45 |
70 | F | %46 |
71 | G | %47 |
72 | H | %48 |
73 | I | %49 |
74 | J | %4A |
75 | K | %4B |
76 | L | %4C |
77 | M | %4D |
78 | N | %4E |
79 | O | %4F |
80 | P | %50 |
81 | Q | %51 |
82 | R | %52 |
83 | S | %53 |
84 | T | %54 |
85 | U | %55 |
86 | V | %56 |
87 | W | %57 |
88 | X | %58 |
89 | Y | %59 |
90 | Z | %5A |
91 | [ | %5B |
92 | \ | %5C |
93 | ] | %5D |
94 | ^ | %5E |
95 | _ | %5F |
96 | ` | %60 |
97 | a | %61 |
98 | b | %62 |
99 | c | %63 |
100 | d | %64 |
101 | e | %65 |
102 | f | %66 |
103 | g | %67 |
104 | h | %68 |
105 | i | %69 |
106 | j | %6A |
107 | k | %6B |
108 | l | %6C |
109 | m | %6D |
110 | n | %6E |
111 | o | %6F |
112 | p | %70 |
113 | q | %71 |
114 | r | %72 |
115 | s | %73 |
116 | t | %74 |
117 | u | %75 |
118 | v | %76 |
119 | w | %77 |
120 | x | %78 |
121 | y | %79 |
122 | z | %7A |
123 | { | %7B |
124 | | | %7C |
125 | } | %7D |
126 | ~ | %7E |
127 | DEL | %7F |