[H-verkko] Merkistöongelma H-verkossa Re: H-verkko Lukemisto, Vol 149, Aihe 1
Tapio Onnela
tapio.onnela at utu.fi
Ke Marras 26 15:40:07 EEST 2011
<seppo.heikkinen at yle.fi> <seppo.heikkinen at yle.fi> kirjoitti 25.10.2011
kello 17.01:
> Minkähän takia nuo otsikkolistat näkyuvät aina tuollaisena suttuna,
> joka on täynnä kysymysmerkkejä ja =-merkkejä?
> Haittaavat todella paljon luettavuutta. Eikö niitä saa pois?
> 2. =?UTF-8?Q?Tutkimuspyynt=F6=3A?= Apurahoja kirjan tutkimukseen
Tässä tietoja tuosta H-verkkoa jo jonkin aikaa vaivanneesta
sietämättömästä ääkkösongelmasta.
H-verkkoon tulevat viestit työpaikoista, tapahtumista, apurahoista
jne.. Agricola-Suomen historiaverkon sivuilta automaattipostituksina.
Agricolan lomakkeelle lisätty ilmoitus tallentuu paitsi Agricolan
sivuille se myös postittuu tänne H-verkko listalle.
Jokin aika sitten järjestelmään, jota kautta viestit listalle tulevat
tehtiin muutos noiden ääkkösten koodauksissa, jonka seurauksena
sivujen lähettämien viestien ääkköset menivät koodimössöksi.
Ongelman korjaaminen on ollut yllättävä monimutkaista, sillä
järjestelmään on vuosien saatossa (vuodesta 1996 lähtien) kerrostunut
koodia eri ajoilta erilaisten konvertointijärjestelmien myötä, osa
lomakkeista osasi koodata ääkköset osa ei. Nyt näyttäisi siltä, että
ongelmakohdat on paikallistettu ja korjaukset tuntuisivat toimivan
kunnolla. Hankaluuksia lisää vielä se, että kaikki postiohjelmat ja
selainversiot eivät aina näytä kaikkia merkkejä samalla tavalla.
Perimmältään ongelma, joka tuntuu kiusaavan meitä "ikuisesti" johtuu
siitä, että tietotekniikka on lähtöisin englanninkielisistä maista
eikä englannissa käytetä ääkkösiä, siksi niissä käytetyt merkistöt
eivät alun perin sisältäneet ääkkösten tapaisia merkkejä ja siksi myös
monet muut ei-englanninkieliset maat ovat saaneet tästä vitsauksesta
kärsiä. Ongelma on ollut monimutkainen ja sitä on yritetty korjata eri
tavoin - vaihtelevin tuloksin. Yksi on ollut merkistöjen
laajentaminen. Esimerkiksi Unicode ja ISO 8859-1 ovat
englanninkielisen ASCII-merkistön laajennuksia, joilla voidaan esittää
skandinaavisia merkkejä.
Siirryimme nyt siis ISO-8859-1 koodauksesta UTF-8 koodaukseen. Saapa
nähdä miten kauan merkistöt tottelevat meitä tällä kertaa.
Parhain terveisin:
Tapio Onnela
Agricolan toimittaja