David Madore WebLog-je - Kísérlet Unicode írására a bábukhoz
Egy Unicode for Dummies írási kísérlet
Meta: E bejegyzés célja ideális esetben egy olyan dokumentum kiadása, amelyet Unicode for Dummies-nak neveznék: az ötlet az lenne, hogy legyen valami érthető a nagyközönség számára (mondjuk mindenki számára, aki minimálisan ismeri a számítógép használatát - például a másolás és beillesztés ismerete), és amely bemutatja azokat a dolgokat, amelyeket szeretnék, ha mindenki tudna az Unicode-ról (mi ez, mire való, miért létezik, de azt is, hogy milyen hatással lehet rájuk - főleg biztonság - és hogyan kell használni). Nyilvánvaló, hogy egy ilyen dokumentumnak csak akkor lenne értelme a lakosság számítógépes alapképzésének általánosabb keretrendszerében (amely például annak egyik fejezetében elmagyarázná, mi is az a web, és egy web általános elképzelése. böngésző, milyen URL és weboldal, ilyesmi, így különösen tudok biztonsági tanácsokat adni), de nincs időm és türelmem ilyen tanfolyamot írni, akkor csak egy nagyon kicsi tégla, az Unicode-ra vonatkozó. (És még egyszer leírom, amit elképzelni kell, nem pedig ténylegesen.) • Miért pont Unicode? Először azért, mert szerintem alacsonyan lógó gyümölcs (a nagyközönségnek sokat kell nyernie kevés erőfeszítéssel, ha kicsit tud a témáról); hanem önző okból is, vagyis az, hogy engem bosszant, amikor elektronikus úton lépek kapcsolatba az emberekkel, amikor azon kapom magam, hogy olvasok vagy válaszolok olyan dolgokra, mint például hogyan írsz ℝ a Twitter üzenetben? (nos, pontosan, inkább megkérdezik tőlem, hogyan csinálok egy kettős R sávot (azaz vastag-táblát); és ami engem őszintén szólva idegesít, azok az emberek, akik | R-t próbálnak ezt utánozni ℝ), vagy más Nem tudom, hogyan kell beírni az e-in-the-t, ez nem a billentyűzetemen van, és nem ilyen dolgokra gondolok.

Ez a bejegyzés nem célja befejezésnek, és különösen a technikailag hozzáértő olvasóknak teszi fel a kérdést, hogy mit kellene még ott mondani, vagy hogyan lehetne könnyebben hozzáférhetővé tenni a dolgokat Madame Michu és Monsieur Dugenou számára. (De az igazat megvallva, biztosan örökké lusta leszek, hogy kiegészítsem ezt a szöveget. Mivel lusta leszek, hogy egyszerűsítsem azokat a részeket, ahol túl bonyolult dolgokat mondtam. Mindazonáltal érdekelnek Michu asszony és Dugenou úr, aki találkozik ezzel a szöveggel, hogy elmondhassa nekem azt, ami szerintük nem világos, vagy javításra szorul.)
Röviden. Mit akarok a nagyközönség megérteni az Unicode-ról? Főleg félkövér betűkkel a következőkben (de egyébként is, mi van a félkövér betűk között ...):
Először természetesen, mi ez: Az Unicode egy számítógépes szabvány, amely meghatározza a karakterek halmazát (de egyezményeket is a karakterek kezelésére vonatkozóan), amely lehetővé teszi a gigantikus számú különböző nyelv és a különféle szimbólumok hatalmas tömegének képviseletét (beleértve a híres hangulatjeleket, amelyek talán most teszik az Unicode-ot a leghíresebbé a nagyközönség körében). Talán hozzá kell tennünk példákat az Unicode által támogatott nyelvekre és az ezekre a nyelvekre írt szavakra, de tegyük fel, hogy a Földön még mindig élő nyelvek szinte minden írórendszere, jó sok halott nyelv és néhány mesterséges nyelv nyelvek (bármit is jelent ez) az Unicode által reprezentálhatók. Ami a szimbólumokat illeti, ezek mindenféle általános piktogramot lefednek, technikai szimbólumokat, köztük rengeteg matematikai szimbólumot, de egész egyszerűen sok, egy kicsit furcsa vagy egzotikus írásjelet is.
Másrészt azt gondolom, hogy fontos aláhúzni manapság az Unicode mindenhol jelen van: azokban a helyzetekben, amikor a számítógép stringeket (azaz szöveget) kezel, ezek a karakterek Unicode karakterek. A weboldalak Unicode-ban vannak; a webcímek Unicode-ban vannak (vagy legalábbis lehetnek); az e-mailek Unicode-ban vannak (az e-mail címeknél ez kérdésesebb); A Word vagy a LibreOffice dokumentumok Unicode-ban vannak; Google/Bing/DuckDuckGo/stb. Keresések Unicode-ban készülnek; A Wikipédia Unicode-ban található; a tweetek Unicode-ban vannak; még az SMS-ek is Unicode-ban vannak (bár vannak olyan finomságok, amelyek miatt az összes karakter nem egyforma); számos operációs rendszeren a fájlnevek Unicode-ban vannak; Stb. (Természetesen vannak kivételek: A légitársaságok biztosan nem használják az Unicode-ot az antiluvian foglalási rendszereikben, és ha a nevén furcsa karakterek szerepelnek, akkor valószínűleg ezt tudja, amikor jegyet akar kapni.)