Hva er forskjellen mellom UTF-8 og ISO-8859-1?
Wikipedia forklarer begge rimelig godt: UTF-8 vs Latin-1 (ISO-8859-1). Førstnevnte er en koding med variabel lengde, sistnevnte en koding med fast lengde på én byte. Latin-1 koder bare de første 256 kodepunktene i Unicode-tegnsettet, mens UTF-8 kan brukes til å kode alle kodepunktene. På fysisk kodingsnivå er det bare kodepunktene 0 - 127 som blir kodet identisk; kodepunktene 128 - 255 skiller seg ut ved at de blir 2-bytesekvenser med UTF-8, mens de er enkeltbytesekvenser med Latin-1.
ISO-8859-1 er en eldre standard fra 1980-tallet. Den kan bare representere 256 tegn, så den er bare egnet for noen språk i den vestlige verden. Selv for mange språk som støttes, mangler noen tegn. Hvis du oppretter en tekstfil i denne kodingen og prøver å kopiere / lime inn noen kinesiske tegn, vil du se rare resultater. Så med andre ord, ikke bruk det. Unicode har tatt over verden, og UTF-8 er stort sett standarden i disse dager, med mindre du har noen eldre grunner (som HTTP-hoder som må være kompatible med alt).