1.6 UNICODE
Es un set de caracteres universal, es decir, un estándar en el que se definen todos los caracteres necesarios para la escritura de la mayoría de los idiomas hablados en la actualidad. Es un formato común de caracteres, dentro del cual se encuentran cada uno de los caracteres de todo teclado de una computadora. Deriva de los tres objetivos perseguidos que son universalidad, unicidad y uniformidad.
- La Principal Ventaja que tiene UNICODE es su adaptación a la gran cantidad de idiomas por todo el mundo, entre ellos idiomas como el chino, el ruso o el árabe.
- Ente todos esos idiomas, uno de ellos es el español lo que hace que se pueda escribir sin problemas la letra ñ.
- UNICODE es compatible con ASCII.
- Una secuencia de bytes para un carácter jamás será parte de una secuencia más larga de otro carácter como lo hacían viejas codificaciones como Shift-JIS.
- Una desventaja es, UTF-8 es de longitud variable; eso significa que diferentes caracteres toman secuencias de diferentes longitudes para codificar. La agudeza de esto podría ser disminuida, sin embargo, creando una interfaz abstracta para trabajar con cadenas UTF-8 y haciéndolo transparente al usuario.
· Un analizador de UTF-8 mal escrito podría aceptar un número de
diferentes representaciones pseudo-UTF-8 y convertirlas en la misma salida
Unicode.
· Esto, más que una desventaja es un pequeño inconveniente, y es que los
caracteres ideográficos usan 3 bytes en UTF-8, pero sólo 2 en UTF-16. Así, los
textos chinos/japoneses/coreanos usarán más espacio cuando sean representados
en UTF-8.
ASCII significa (American Standard Code for Information Interchange —Código Estándar estadounidense para el Intercambio de Información—), pronunciado generalmente áski. Utiliza 7 bits para representar los caracteres. En la actualidad define códigos para 32 caracteres no imprimibles, de los cuales la mayoría son caracteres de control que tienen efecto sobre cómo se procesa el texto, más otros 95 caracteres imprimibles que les siguen en la numeración (empezando por el carácter espacio). El código ASCII es una representación numérica de un carácter como ‘a’ o ‘@’. Es un método para una correspondencia entre cadenas de bits y una serie de símbolos (alfanuméricos y otros).
Unicode es un estándar en constante evolución y se agregan nuevos caracteres continuamente. Se han descartado ciertos alfabetos, propuestos por distintas razones, como por ejemplo el alfabeto klingon.
Fuentes:
- https://es.slideshare.net/jb
arretopy/representacion-interna-de-datos1-2014
- https://edukativos.com/apuntes/archives/author/admin
- https://unicode-table.com
- https://laika.unirioja.es
- https://docs.oracle.com/cd/E26921_01/html/E27143/glmgn.html
- https://www.ecured.cu/Lenguaje_Unicode
- https://datosuno.wordpress.com/unidad-2/unicode/
Alumnas:
- Dominguez, Micaela A.
- Estigarribia, Erika G.
- Francini, Astrid S.
No hay comentarios.:
Publicar un comentario