[H-verkko] Merkistöongelma H-verkossa Re: H-verkko Lukemisto, Vol 149, Aihe 1

Tapio Onnela tapio.onnela at utu.fi
Ke Marras 26 15:40:07 EEST 2011


<seppo.heikkinen at yle.fi> <seppo.heikkinen at yle.fi> kirjoitti 25.10.2011  
kello 17.01:

> Minkähän takia nuo otsikkolistat näkyuvät aina tuollaisena suttuna,  
> joka on täynnä kysymysmerkkejä ja =-merkkejä?
> Haittaavat todella paljon luettavuutta. Eikö niitä saa pois?
> 2. =?UTF-8?Q?Tutkimuspyynt=F6=3A?= Apurahoja kirjan tutkimukseen



Tässä tietoja tuosta H-verkkoa jo jonkin aikaa vaivanneesta  
sietämättömästä ääkkösongelmasta.

H-verkkoon tulevat viestit työpaikoista, tapahtumista, apurahoista  
jne.. Agricola-Suomen historiaverkon sivuilta automaattipostituksina.  
Agricolan lomakkeelle lisätty ilmoitus tallentuu paitsi Agricolan  
sivuille se myös postittuu tänne H-verkko listalle.

Jokin aika sitten järjestelmään, jota kautta viestit listalle tulevat  
tehtiin muutos noiden ääkkösten koodauksissa, jonka seurauksena  
sivujen lähettämien viestien ääkköset menivät koodimössöksi.

Ongelman korjaaminen on ollut yllättävä monimutkaista, sillä  
järjestelmään on vuosien saatossa (vuodesta 1996 lähtien) kerrostunut  
koodia eri ajoilta erilaisten konvertointijärjestelmien myötä, osa  
lomakkeista osasi koodata ääkköset osa ei. Nyt näyttäisi siltä, että  
ongelmakohdat on paikallistettu ja korjaukset tuntuisivat toimivan  
kunnolla. Hankaluuksia lisää vielä se, että kaikki postiohjelmat ja  
selainversiot eivät aina näytä kaikkia merkkejä samalla tavalla.

Perimmältään ongelma, joka tuntuu kiusaavan meitä  "ikuisesti" johtuu  
siitä, että tietotekniikka on lähtöisin englanninkielisistä maista  
eikä englannissa käytetä ääkkösiä, siksi niissä käytetyt merkistöt  
eivät alun perin sisältäneet ääkkösten tapaisia merkkejä ja siksi myös  
monet muut ei-englanninkieliset maat ovat saaneet tästä vitsauksesta  
kärsiä. Ongelma on ollut monimutkainen ja sitä on yritetty korjata eri  
tavoin - vaihtelevin tuloksin. Yksi on ollut merkistöjen  
laajentaminen. Esimerkiksi Unicode ja ISO 8859-1 ovat  
englanninkielisen ASCII-merkistön laajennuksia, joilla voidaan esittää  
skandinaavisia merkkejä.

Siirryimme nyt siis ISO-8859-1 koodauksesta UTF-8 koodaukseen. Saapa  
nähdä miten kauan merkistöt tottelevat meitä tällä kertaa.

Parhain terveisin:
Tapio Onnela
Agricolan toimittaja