Esperantaj literoj en TTT

Unikodo

Kiam oni faras Unikodan TTT-pagxon, oni aux povas skribi la Esperantajn supersignajn literojn rekte per la kodprezento UTF-8, aux oni povas uzi numeran skribon. (Ekzistas ankaux aliaj kodprezentoj ol UTF-8, sed nur UTF-8 estas vere rekomendinda por normala uzo.)

Unikodo laux UTF-8 «

En UTF-8 cxiuj signoj, kiu ne estas en simpla Askio (ASCII), estas kodita per du aux pli da bitokoj. La Esperantaj literoj estas cxiuj skribataj per po du bitokoj. Jen tabelo, kiu montras la dekumajn numerojn de tiuj bitokoj, kiuj reprezentas la Esperantajn supersignajn literojn en UTF-8:

Majuskla C kun cirkumflekso 196+136
Minuskla c kun cirkumflekso 196+137
Majuskla G kun cirkumflekso 196+156
Minuskla g kun cirkumflekso 196+157
Majuskla H kun cirkumflekso 196+164
Minuskla h kun cirkumflekso 196+165
Majuskla J kun cirkumflekso 196+180
Minuskla j kun cirkumflekso 196+181
Majuskla S kun cirkumflekso 197+156
Minuskla s kun cirkumflekso 197+157
Majuskla U kun hoketo 197+172
Minuskla u kun hoketo 197+173

Sed normale oni ja ne bezonas scii pri tiuj teknikajxoj. Oni simple uzu tekstoredaktilon, kiu regas UTF-8-on. Tia redaktilo estas ekzemple “Vim” (ekde versio 6).

Unikodo - numera skribo «

Se oni ne havas tekstoredaktilon, kiu regas Unikodon, oni povas en HTML (kaj ankaux en XML) anstatauxe skribi cxiun Unikodan signon per gxia numero. Plej bone funkcias skribi la numerojn dekume: Ĉ ĉ Ĝ...

Jene oni skribas la Esperantajn supersignajn literojn numere en HTML:

Majuskla C kun cirkumflekso Ĉ
Minuskla c kun cirkumflekso ĉ
Majuskla G kun cirkumflekso Ĝ
Minuskla g kun cirkumflekso ĝ
Majuskla H kun cirkumflekso Ĥ
Minuskla h kun cirkumflekso ĥ
Majuskla J kun cirkumflekso Ĵ
Minuskla j kun cirkumflekso ĵ
Majuskla S kun cirkumflekso Ŝ
Minuskla s kun cirkumflekso ŝ
Majuskla U kun hoketo Ŭ
Minuskla u kun hoketo ŭ

Por kelkaj signoj ekzistas en HTML ankaux nomaj kodoj: π σ..., sed ankoraux ne por la Esperantaj literoj.

Rudimenta ekzemplo

Jen sekvas ekzempla kodo de rudimenta Esperanta TTT-pagxo kun numeraj indikoj de la Unikodaj Esperantaj literoj. Post la kodo estas ligo al pagxo tiel verkita. Iru al tiu pagxo por vidi, kio rezultigxas el la kodo. Rimarku, ke la kodo estas laux HTML5, la nova formo de HTML.

<!DOCTYPE html>
<html>
<head>
<title>Pa&#285;o pri la Esperantaj literoj</title>
</head>
<body>

<h1>La Esperantaj literoj</h1>

<p>
Jen iom da teksto:
E&#293;o&#349;an&#285;o &#265;iu&#309;a&#365;de.
E&#292;O&#348;AN&#284;O &#264;IU&#308;A&#364;DE.
</p>

</body>
</html>

Jen kiel prezentigxas (por vi) la cxi-antauxa ekzemplo.

Jen tiu sama ekzemplo, sed kun Esperantaj literoj laux UTF-8.

Komentoj «

  • Por ke la Esperantaj signoj efektive aperu en legebla formo sur ekrano (aux surpapere) tamen necesas, ke tiparoj kun tiuj signoj estas uzataj de la TTT-legilo. Antauxe mi konsilis cxi tie, ke oni nepre lasu la elekton de tiparo al cxiu leganto mem, kaj ke oni ne uzu indikojn pri specifaj tiparoj (nek per kodoj kiel <font face="...">, nek per stilfolio), cxar principe ne eblas scii, cxu tiu tipara versio, kiun la leganto havas en sia komputilo, enhavas Esperantajn literojn. Nuntempe tamen praktike cxiuj ordinaraj tiparoj instalitaj en komputiloj – cxu Vindozaj, cxu Linuksaj, cxu Makintosxaj, cxu alispecaj – enhavas la supersignajn literojn de Esperanto. Tial nuntempe oni kredeble ne plu bezonas atenti pri tiu konsilo, almenaux se oni indikas uzon de tiparoj, kiuj estas vaste uzataj.

    Krome nuntempe eblas en stilfolioj uzi indikojn de specialaj tiparoj, kiujn la TTT-legilo aparte elsxutu por uzado en la koncerna TTT-pagxo. Oni tiam uzas la stilfolian kodajxon @font-face, kiu estas parto de versio 3 de la stilfolia lingvo CSS. Se oni uzas tiun eblon, oni povas scii ekzakte, kiujn signojn la tiparo enhavas. Sed oni zorge kontrolu la signorepertuaron, cxar multaj TTT-ejoj, kiuj disponigas tiajn tiparojn, prezentas por senkosta elsxutado tiparojn, en kiuj niaj supersignaj literoj mankas! Tio estas tute komprenebla: Tiparoj elsxutataj por uzo en TTT-pagxoj prefere ne estu tro grandaj. Ideale ili enhavu nur tiujn signojn, kiuj estas efektive uzataj en la TTT-pagxo. Plej multaj TTT-pagxoj ne uzas Esperantajn literojn, almenaux statas tiel ankoraux en 2011 (eble kiam vi legos tion cxi, estos alie...).

  • Kiam oni uzas UTF-8-on, oni ankaux povas enmiksi numere skribitajn signojn (&#264; &#265;...) kaj nomkodojn (&ouml; &eacute; &pi;...).

    Kiam oni skribas laux UTF-8, oni ne povas enmiksi unubitokajn signojn laux ekzemple Latino 1. Cxiujn signojn ekster baza Askio (kun numeroj pli altaj ol 127) oni tiam devas aux skribi UTF-8-e (per po du aux pli da bitokoj), aux skribi nomkode, aux skribi numere (&Auml; &ntilde;... &#196; &#241;...).

  • Se oni uzas UTF-8-on, oni devas iel anonci al la TTT-legilo, ke tiu kodo estas uzata. Tion oni prefere faru per la tiel nomata HTTP-cxapo. Tio estas informoj pri la pagxo, kiujn la servilo sendas al la TTT-legilo antaux ol gxi sendas la efektivan pagxon. Por anonci, ke aperos HTML-pagxo kodita laux UTF-8, la servilo sendu la jenon:

    Content-type: text/html; charset=UTF-8

    (Nepre estu malplena linio post tiu HTTP-cxapo!)

    Se oni ial ne havas eblon aux rajton agordi la servilon, ke gxi faru tian anoncon pri UTF-8, oni povas anstatauxe fari la anoncon en meta-elemento ene de la HTML-pagxo. Jen ekzemplo:

    <!DOCTYPE html>
    <html>
    <head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
    <title>Pagxo pri la Esperantaj literoj</title>
    </head>
    <body>
    [...]

    Oni povas fari la anoncon en ambaux manieroj samtempe. Efektive tia anonco en meta-elemento povas esti utila, se oni legas HTML-pagxon loke (ne tra reta servilo). Tial povas esti konsilinde cxiam inkluzivi tian meta-elementon, se oni uzas UTF-8-on.

    Efektive oni povas uzi ankaux aliajn signokodojn ol Unikodo, ekzemple Latinon 1, Latinon 2 aux KOI-8-R, kaj tamen enmiksi Esperantajn literojn. Tiam oni skribu la Esperantajn literojn cxiam nur numere. Efektive en HTML-pagxo oni povas cxiam skribi cxiun ajn signon, kiu ekzistas en Unikodo, per tia numera indiko (aux per nomkodo), sendepende de la uzata signokodo de la pagxo. Tiam la numeroj cxiam sekvu Unikodon, neniam la signokodon uzatan en la pagxo. Jen pli da informoj pri signokodoj.

  • Laux la normo HTML-dokumento devas komencigxi per informo pri la dokumenta tipo (<!DOCTYPE ...>). Tia deklaro montras, kiu versio de HTML estas uzata en la dokumento. La DOCTYPE-deklaro en la cxi-tieaj ekzemploj montras, ke estas uzata HTML5. Antauxe neniu TTT-legilo vere atentis pri la anoncita dokumentotipo, sed nuntempe kelkaj legiloj ja atentas. Tiuj legiloj elektas surbaze de tiu deklaro (aux manko de deklaro), cxu prezenti la pagxon (kiom ili povas) laux la ekzistantaj normoj por HTML kaj CSS (stilfolioj), aux cxu imiti la prezentokapricojn kaj prezentoerarojn de malnovaj legiloj. Iafoje la prezento de pagxo povas draste sxangxigxi se oni sxangxas la dokumentotipan deklaron. La deklaro, kiun mi montris cxi-antauxe, igas tiujn legilojn (provi) sekvi la normojn, kaj estas tial bona elekto.

    Estas cxiam rekomendinde kontroli per tiucela programo, cxu la pagxo estas valida (= gxuste verkita): validumi la pagxon. En validumado dokumento-tipa deklaro estas necesa. Bona servo por validumi HTML-pagxojn ekzistas cxe <http://validator.w3.org/>.

  • Kelkaj malnovaj TTT-legiloj, kiuj gxenerale subtenas Unikodon, kaj kiuj povas montri Esperantajn supersignajn literojn, tamen havas problemojn pri tiaj signoj en iuj specialaj kuntekstoj. Problemoj povas aperi pri teksto en <title>-elementoj, alternativa teksto de bildoj (alt-atributo ene de img-marko), teksto en la statusa strio, kaj teksto en dialogujoj (kiujn oni povas aperigi ekz. per Javaskripto). Tiuj problemoj plejparte nun malaperis, sed ankoraux indas aparte kontroli la efektivan rezulton en tiaj specialaj kuntekstoj en diversaj TTT-legiloj.