Propósito

✔ Programação GLOBAL® - Quaisquer soluções e/ou desenvolvimento de aplicações pessoais, ou da empresa, que não constem neste Blog devem ser tratados como consultoria freelance. Queiram contatar-nos: brazilsalesforceeffectiveness@gmail.com | ESTE BLOG NÃO SE RESPONSABILIZA POR QUAISQUER DANOS PROVENIENTES DO USO DOS CÓDIGOS AQUI POSTADOS EM APLICAÇÕES PESSOAIS OU DE TERCEIROS.

Caracteres Invisíveis - Identificando

Caracteres Invisíveis - Identificando
#ProgramaçãoGlobal #Unicode #CaracteresInvisíveis #ASCII

Caracteres invisíveis são caracteres que não aparecem visualmente em um texto, mas ocupam espaço ou têm funções específicas em sistemas computacionais. Eles são comuns em codificação de texto (como Unicode ou ASCII) e podem ser usados para formatação, controle ou separação de dados.

Compreendendo os Caracteres Invisíveis:


Aqui estão os principais tipos de caracteres invisíveis:


Espaço (U+0020): O espaço comum entre palavras. Embora "visível" como um espaço em branco, é tecnicamente um caractere.

Caracteres de controle (geralmente na faixa U+0000 a U+001F e U+007F em Unicode):

  • NUL (U+0000): Caractere nulo, usado em algumas linguagens de programação.
  • TAB (U+0009): Tabulação horizontal, para alinhamento de texto.
  • LF (U+000A, Line Feed): Quebra de linha (usada em sistemas Unix).
  • CR (U+000D, Carriage Return): Retorno de carro (usado em sistemas Windows junto com LF).
  • BEL (U+0007): Produz um som de alerta em alguns sistemas.
  • DEL (U+007F): Caractere de exclusão, usado historicamente para apagar.


Por Que Você Precisa Entender ASCII, EBCDIC e UNICODE ao Programar em VBA? - Why You Need to Understand ASCII, EBCDIC, and UNICODE When Programming in VBA?

Tabela ASCII no VBA: Como Resolver Problemas de Codificação - ASCII Table in VBA: How to Solve Encoding Issues

Dicas de VBA: Como Converter Entre ASCII, EBCDIC e UNICODE - VBA Tips: How to Convert Between ASCII, EBCDIC, and UNICODE

ASCII no VBA: O Guia Rápido para Iniciantes em Codificação de Caracteres - ASCII in VBA: A Quick Guide for Beginners in Character Encoding


Caracteres de formatação
:

  • Zero Width Space (U+200B): Espaço com largura zero, usado para quebras de linha opcionais sem espaço visível.
  • Non-Breaking Space (U+00A0): Espaço que impede quebra de linha.
  • Soft Hyphen (U+00AD): Hífen opcional que aparece apenas em quebras de linha.
  • Zero Width Joiner (U+200D): Une caracteres (como em emojis ou scripts complexos).
  • Zero Width Non-Joiner (U+200C): Impede a união de caracteres.

Caracteres de direção
:

  • Left-to-Right Mark (U+200E): Controla a direção do texto (esquerda para direita).
  • Right-to-Left Mark (U+200F): Controla a direção do texto (direita para esquerda).
  • Bidi Controls (como U+202A a U+202E): Gerenciam textos bidirecionais (ex.: árabe e inglês misturados).

Outros caracteres invisíveis
:

  • Byte Order Mark (BOM) (U+FEFF): Usado para indicar a ordem dos bytes em UTF (pode causar problemas se não for tratado corretamente).
  • Invisible Separator (U+2063): Separador invisível para contextos específicos.

Como identificar caracteres invisíveis?

  • Editores de texto avançados (como VS Code, Notepad++ ou Sublime Text) podem exibir caracteres invisíveis como símbolos (ex.: para espaço, para quebra de linha).
  • Ferramentas online (como Unicode Inspector) mostram o código de cada caractere.
  • Linguagens de programação: Em Python, por exemplo, você pode usar repr() ou encode() para revelar caracteres invisíveis em uma string.

Problemas comuns

  • Erros de codificação: Caracteres invisíveis como BOM podem causar falhas em parsers ou scripts.
  • Segurança: Caracteres como Zero Width Space podem ser usados em ataques de ofuscação (ex.: esconder código malicioso).
  • Formatação indesejada: Copiar e colar texto de sites pode incluir caracteres invisíveis que quebram scripts ou layouts
    .


    👉 Siga André Bernardes no Linkedin. Clique aqui e contate-me via What's App.

    Comente e compartilhe este artigo!

    brazilsalesforceeffectiveness@gmail.com

Nenhum comentário:

Postar um comentário

diHITT - Notícias