“Jutumärgid” ja muu…

Pärast oma väikeseid rännakuid LaTeX-i ja TeX-i maailmas hakkasin igasugustele pisidetailidele märksa rohkem tähelepanu pöörama. Pealegi, kui Donald E. Knuth pöörab tohutut tähelepanu isegi sellele, milline näeb välja δ (delta), siis ei tundu minu väike tähelepanujuhtimine kirjavahemärkidele sugugi tühisena.

Palju on lehekülgi, mis selle asemel, et kasutada tüpograafiliselt korrektseid “kahepoolseid jutumärke”, kasutavad programmeerijatele hästi tuntud "ühepoolseid jutumärke". Ühepoolseid jutumärke kasutab teiste seas näiteks selline suurlehekülg nagu ekspress.ee.

Mõningates kohtades on näha ka TeX-i laadseid ``variante'', aga see pole eestikeelsetel lehtedel eriti levinud.

Teised, kes küll kasutavad kas “jutumärke” või «jutumärke» ei kasuta html-i sümbolikoode nagu “ ja ” vaid hoopis mingi ISO-8859 kooditabeli sümboleid, mis reeglina antud enkodeeringule ei vasta—juhul kui enkodeering muidugi üldse määratudki on. Näiteks ühel poogen.ee lehel annab validaator ainuüksi sellel põhjusel tervelt 1414 veateadet.

Lahendused

<q>

Tegelikult pole antud probleem sugugi lihtne. Näiteks HTML-is on olemas spetsiaalne element <q>, mis on mõeldud jutumärkide tekitamiseks, aga see pole brauserite poolt eriti toetatud. Õigupoolest Opera ongi vist ainus, kes seda mõningal määral toetab. Tegelikult on <q> väärtus üsnagi kahtlane, arvestades, et XML ei lubaks sel juhul jutumärkidel alata ühes lõigus ning lõppeda alles mitu lõiku hiljem või üldse mitte.

HTML-i element <q> on mõeldud lõigusiseste tsiteeringute esitamiseks. Kõrvalefektina peaks <q> tekitama tsitaadi ümber ka automaatselt vastavad jutumärgid, aga hetkel on selles osas brauserite toetus väga puudulik.

Unicode

Varem sai mainitud, et paljudel lehtedel on probleemid jutumärkidega tingitud sellest, et kasutatakse valet kodeeringut. Hea uudis on see, et selline kodeering, mis kõikvõimalikke jutumärke toetab, on olemas—selleks on unicode. Halb uudis on aga see, et vähesed teavad ja oskavad seda kasutada.

Idee poolest tuleks lihtsalt kasutada mõnda tekstiredaktorit, mis toetab unicode-i (neid on palju) ning salvestada tekst näiteks UTF-8 formaadis. Kõik veebilehitsejad toetavad unicode-i nii, et selle poole pealt pole mingit probleemi. See aga tähendab reeglina seda, et kogu lehekülg tuleks üle viia UTF-8 peale, mis iseenestest pole paha, sest see ennetab probleeme tulevikus, kui keegi ühtäkki peaks tahtma midagi näiteks tühipaljas kirillitsas kirjutada, mis aga ühegi ISO-8859-x sisse ei mahu, UTF saab selle ja kõigi teiste maailma keeltega aga suurepäraselt hakkama.

&html;

Viimaseks variandiks on kasutada HTML-i sümbolilühendeid &xxxx;. Kindlasti märksa rohkem ruumi võttev variant kui unicode, kuid võimaldab pääseda ilma enkodeeringut muutmata.

Järgnevalt olen ära toonud mõningad olulisimad märgid ja nende HTML-i ekvivalendid ning kui õnnestus leida, siis klahvikombinatsioonid nende eesti klaviatuuril väljavõlumiseks.

vasak ülakoma — &lsquo; [AltGr+Shift+V]
parem ülakoma — &rsquo; [AltGr+Shift+B]
vasak jutumärk — &ldquo; [AltGr+V]
parem jutumärk — &rdquo; [AltGr+B]
vasak väike jutumärk #2 — &lsaquo;
parem väike jutumärk #2 — &rsaquo;
«
vasak jutumärk #2 — &laquo;
»
parem jutumärk #2 — &raquo; [AltGr+X]
kolm punkti — &hellip;
mõttekriips — &mdash;

Teadmiseks ka niipalju, et ka Trinoloogialehel on nüüdsest need koledad "märgid" vahetatud hoopis kenamate “märkide” vastu. Kodeeringuks jääb seniks veel ISO-8859-15…

Kirjutatud 2. detsembril 2004, viimati muudetud 20. juulil 2005.

Trinoloogialeht

Eesti Trinoloogide Maja. Eesti trinoloogiahuviliste avalik kogunemiskoht. info@triin.net

Peamenüü

Samal teemal

RSS, RSS kommentaarid, XHTML, CSS, AA