LA CODIFICA DEI TESTI

E’ la rappresentazione del testo su supporto digitale in un formato leggibile da un elaborato.

-si basa su un linguaggio informatico,detto linguaggio di codifica

-il processo di trasformazione di una informazione in numeri binari (0 e 1) si chiama “codifica”.

– i numeri 0 e 1 si chiamano bit (8bit=1byte).

-per passare da un testo (in linguaggio naturale) a un testo elettronico(in binario) è necessario un processo di codifica che deve essere composto da due parti:

  • la codifica de caratteri e dei simboli grafici.
  • la codifica delle operazioni necessarie per esplicitare l’interpretazione del testo (markup).

LA CODIFICA DEI CARATTERI

 

  • I caratteri hanno una natura (ossia il fonema che rappresentano) e un glifo (ossia il modo in cui sono rappresentati).
    A   a
  •  I caratteri rappresentati sopra hanno la stessa natura ma
    glifi diversi.
  • Per codificare i simboli grafici bisogna associare ad ogni carattere un numero naturale.
  • In questo modo costruiamo una corrispondenza biunivoca tra l’insieme dei caratteri e un insieme di numeri.
  • Questa corrispondenza può essere rappresentata per mezzo di una tabella detta “set di caratteri”.
  • Ad ogni carattere si associa un codice numerico detto “code position”.