#ProgramaçãoGlobal #Unicode #CaracteresInvisíveis #ASCII
Uma lista exaustivamente detalhada de caracteres invisíveis abrange todos os caracteres em sistemas de codificação (como Unicode e ASCII) que não possuem representação visual direta, mas afetam a formatação, controle ou comportamento do texto.
Abaixo, estão organizados os caracteres invisíveis por categorias, incluindo seus códigos Unicode, nomes, descrições e usos. Como o Unicode é o padrão mais abrangente, focarei nele, mas mencionarei equivalentes em ASCII quando aplicável.
Código Unicode | Nome | Descrição | Problemas |
---|---|---|---|
U+206A | Inhibit Symmetric Swapping | Inibir troca simétrica | Depreciado; usava-se em espelhamento de parênteses |
U+206B | Activate Symmetric Swapping | Ativar troca simétrica | Depreciado; usava-se em espelhamento de parênteses |
U+206C | Inhibit Arabic Form Shaping | Inibir formação árabe | Depreciado; controlava formas de letras árabes |
U+206D | Activate Arabic Form Shaping | Ativar formação árabe | Depreciado; controlava formas de letras árabes |
U+206E | National Digit Shapes | Formas de dígitos nacionais | Depreciado; usava-se para dígitos regionais |
U+206F | Nominal Digit Shapes | Formas de dígitos nominais | Depreciado; usava-se para dígitos padrão |
- Esses caracteres foram substituídos por algoritmos automáticos (ex.: Unicode Bidirectional Algorithm).
- Seu uso pode causar incompatibilidades em sistemas modernos.
- Exaustividade: Esta lista cobre todos os caracteres invisíveis padrão no Unicode (versão 15.0), incluindo controles ASCII, caracteres de formatação, direcionais e específicos de scripts. Outros caracteres podem existir em blocos privados ou futuros do Unicode, mas não são amplamente usados.
- Detecção: Para identificar esses caracteres, use editores como VS Code (mostra símbolos como ␣, ¶), ferramentas como hexdump ou bibliotecas como unicodedata em Python.
- Problemas: Caracteres como U+200B, U+202E ou U+FEFF são notórios por causar erros (ex.: quebras inesperadas, falhas de parsing, ataques de ofuscação).
- Segurança: Em contextos de segurança, filtre caracteres como U+200C, U+200D e U+202E para evitar manipulação maliciosa.
👉 Siga André Bernardes no Linkedin. Clique aqui e contate-me via What's App.
Nenhum comentário:
Postar um comentário