terça-feira, 29 de outubro de 2013

O Texto - Padrões de Codificação de Caracteres

Iniciamos uma nova subunidade, Subunidade 1 - Texto (Formação de Texto).


O que são Padrões de Codificações de Texto?

Os padrões de codificação consistem em tabelas com grupos de bits que representam determinados caracteres. Alguns dos principais exemplos:

  • ASCII (Amercian Standart Code Information Interchange)
  • Unicode (Um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente)
  • EBCDIC (Extended Binary Coded Decimal Interchange Code, utilizados em servidores IBM antigos, completamente diferente do ASCII)
  • ISO Latin and ANSI (Partilham os primeiros 255 caracteres, a partir dai os formatos diferem do Unicode).

Como constiste a tabela de código ASCII e de código Unicode?

A tabela de código ASCII surgiu nos anos 60, com objetivo de tornar a comunicação mais fácil de comunicar entre todos os computadores.
Utiliza um conjunto de 7 bits para representar 128 caracteres, muitos deles adequados apenas à língua Inglesa.
A ISO adoptou o codigo ASCII como norma internacional, com a disignação ISO 646, ampliando-o com caracteres de outros idiomas, permitindo representar 256 caracteres.
No entanto, tiveram de ser criadas variantes regionais, para se poderem representar todos os idiomas.

Conjunto de caracteres ASCII imprimiveis (código 32 a 126)

O Unicode é um código utilizado que difine todos os caracteres da maior parte das línguas do mundo. Fui desenvolvido em simultaneo, por um consórcio industrial, incluindo a Adobe, a Apple, a HP, entre outras.
Permitem representar conjuntos até 4 bytes para codificar caracteres de idiomas modernos e as formas clássicas de alguns carateres.
Codificam, entre outros, caracteres acentuados, simbolos de pontuação, matemáticos e outros simbolos.



Baseado nos Apontamentos da Aula

Sem comentários:

Enviar um comentário