L’UNICODE 

L’Unicode è un sistema di codifica che assegna un numero univoco (è una corrispondenza tra due insiemi) ad ogni carattere utilizzato per la scrittura dei testi , in maniera indipendente dalla lingua e della piattaforma e il programma utilizzato.

Viene pubblicizzato e aggiornato dall’Unicode Consortium ( è un consorzio di aziende interessate nel trattamento informatico dei testi in lingue diverse)

Caratteristiche:

Incorpora nella prima parte la codifica ISO/IEC ( è uno standard comune per la codifica di caratteri), ma va molto oltre ; codificando caratteri usati in quasi tutte le lingue vive, nonchè simboli matematici e chimici , l’alfabeto Braille, ideogrammi.

Il codice assegnato al carattere viene rappresentato con U+ seguito dalle 4/6 cifre esadecimali.

Viene supportato dai moderni standard della programmazione e del markup ( è una sequenza di caratteri con cui si marcano gli elementi di un file di testo per assegnare loro determinate caratteristiche o funzioni)come XML ( è un  metalinguaggio per la definizione di linguaggi di markup),JAVA(è un linguaggio di programmazione ad alto livello , orientato agli oggetti),JAVA SCRIPT (è un linguaggio di scripting orientato agli oggetti e agli eventi) , e sistemi operativi vari.

byte che servono per memorizzare un carattere: 4 byte (32 bit)

IL CODICE ASCII 

Il codice ASCII( American Standard Code for Information Interchange) è uno dei codici più diffusi attualmente per rappresentare i caratteri. Nella tabella ASCII standard si trovano le cifre numeriche ,le lettere maiuscole e minuscole     ( con codici ASCII differenti ), la punteggiatura , i simboli aritmetici e altri simboli. La tabella ASCII standard essendo stata concepita in america non comprende le lettere accentate ( sconosciute all’ortografia inglese).Per comodità i bit vengono raggruppati in byte ( 8 bit=1 byte ).I primi 32 byte della tabella standard sono inoltre riservati per segnali di controllo.

Esercizio guidato

Quanti byte mi servono per memorizzare sul computer il mio nome e cognome ?

francesca  gaydou= 16 caratteri

in ascii : 1 carattere = 1 byte

quindi francesca gaydou in ascii =  1*16  byte = 16 byte

in unicode: 1 carattere = 4 byte

quindi francesca in unicode= 4*16 byte= 64 byte