Komputiloj nur komprenas ciferojn. Ili ne komprenas vere la literojn.
Komputiloj unue uzis la 128 literojn kaj signojn de la angla, aranĝo donis
unu ciferon, ekde 0 ĝis 127 al ĉiu litero kaj signo, poste (ĉirkaŭ 1990) ili uzis 256
signojn komunajn en la lingvoj de okcidenta Eŭropo: angla, hispana,
franca, itala, portugala, germana, svedia, norvega, kaj finna.
Kompreneble en la landoj, kie tiuj lingvoj ne estas parolataj, oni
elektis malsaman aron da 256 signoj. La problemo estas ke teksto farita
en komputilo de Meksiko, kiu uzas la Ñ, ne estas legebla en komputilo de
Ĉeĥio, eble tiu Ñ aperos kiel Š, tio okazas
ĉar la Ñ kaj la Š havas la saman kodon, ekzemple la numeron 135. Antaŭ
ol interreto tio ne estis tiom grava problemo, sed nun ĉiuj povas eniri
paĝaron en ĉiu lingvo, el ĉiu lando. Por solvi tiun ĉi problemon, la
Unikoda Konsorcio ekekzistiĝis, kaj proponis fari unu aranĝon de literoj
kaj signoj por ĉiuj lingvoj, do oni povas havi ĉiujn literojn en ĉiuj
komputiloj, ĉiulande. Antastaŭ 256, unikodon havas miliojn da signojn kaj
literojn, la aranĝo donas unikan kodon (unikodon) al ĉiu litero, do nun
la Ñ kaj la Š havas malsaman kodon, do kiam mi tajpas Ñ en tektso ĝi
daŭriĝos kiel Ñ ĉiam, ĉie.
Kiuj lingvoj estas tajpeblaj per Unikodo?
Unuvorta respondo: Ĉiuj.
Multvorta respondo: Ĉiuj lingvoj en la mondo kiuj uzas unu el tiuj ĉi
skribmanieroj: latina, greka, cirila, armena, hebrea, araba, aramea,
maldiva, devanagara, bengala, gurmuka, orija, tamila, telugua, kanara,
majalajama, sinhala, taja, laŭa, tibeta, birma, korea, etiopa, ĉeroka,
kanada-indiĝena-silaba, tagaloga, kmera, mongola, ĉina, japanaj,
korea kaj multaj aliaj. Por pli datumoj pri la lingvoj kaj la skriboj
esperante iru al paĝaro de
Bertilow, aŭ angle al paĝaro de
Unikodo.
Ĉu ankaŭ lingvoj el orienta kaj okcidenta Azio estas subtenataj?
Jes. Unikodo havas pli ol 70,000 ideografaĵojn, laŭ ŝtataj reguloj de
Ĉinujo, Japanujo, Koreujo kaj Tajvano. Ankaŭ la lingvoj kiuj estas
skribataj maldekstren (ekz. la araba) estas subtenataj.
Kio estas UTF-8? Ĉu ĝi estas Unikodo?
Unikodo estas pli kompleta literaro ol antaŭaj, do ĝi estas pli granda.
UTF-8 estas plimalgrandigilo. En UTF-8 la oftaj latinaj literoj estas
uzataj kiel ne-unikodaj, kaj la ceteraj kiel unikodaj. Do la en la vorto
ĉevalo la ĉ bezonas duoblon da spaco ol la e. Se oni
ne uzus UTF-8, ĉiuj literoj uzus duoblon. Kelkaj aziaj literoj bezonas
trioblon, do UTF-8 okupas la plej eblan malgrandan spacon por ĉiu litero.
Kiel oni uzas Unikodon en retpaĝoj?
Oni nepre metu <meta http-equiv="Content-Type"
content="text/html; charset=utf-8"> ene de la <head> ero.
Kaj por aperigi unikodajn literojn sur la paĝo:
Se vi ja povas konservi dosierojn kiel UTF-8aj dosieroj, vi povas
tajpi rekte la unikodan literon/signon en la HTMLa kodo, ekzemple:
Matenmanĝaĵo. estus: <i>Maten<b>manĝ</b>aĵo.</i>
Se vi ne povas konservi dosierojn kiel UTF-8aj dosieroj, vi devas
tajpi la unikodan kodon de la litero/signo en la HTMLa kodo, ekzemple: matenmanĝaĵo.
estus: <i>maten<b>manĝ</b>aĵo.</i>
Oni tajpu: & # x poste la unikodan nombron de la signo
kaj fine ;.
La unikodaj kodoj por esperantaj literoj estas:
Ĉ
ĉ
Ĝ
ĝ
Ĥ
ĥ
Ĉ
ĉ
Ĝ
ĝ
Ĥ
ĥ
Ĵ
ĵ
Ŝ
ŝ
Ŭ
ŭ
Ĵ
ĵ
Ŝ
ŝ
Ŭ
ŭ
Kiel mi povas scii ĉiujn unikodajn kodojn?
Je Vindozo la plej facila metodo estas uzi la Mapon de Signoj (Character
Map, Mapa de Caracteres). Oni elektu la literon, kaj malsupre oni povas
vidi la unikodan codon U+ kaj la nomon. Mi konsilas uzi la
litertipon Arial, aŭ Times New Roman, kiuj estas la plej kompletaj
litertipoj.
Alia ebleco estas uzi dokumenton de la Unikoda Konsorcio havebla ĉe
ĝia retpaĝo.
Bedaŭrinde tiu ĉi informo estas nur en la angla.