LTAL, Projekt: Szótörés
Ötlet: Tervezze meg és valósítsa meg a Pythonban a Knuth-Liang algoritmust az automatikus elválasztáshoz. Olyan programot kell írnia, amely elolvassa a szavak listáját (pl. Egy szöveget), és ezeket a szavakat a törvényesnek tekintett kötőjelek megjelölésével nyomtatja ki, pl.:

Figyelembe véve, hogy az emberi család valamennyi tagjának eredendő méltóságának, valamint egyenlő és elidegeníthetetlen jogainak újbóli megismerése képezi a szabadság, az igazságosság és a béke alapját a világon,
Figyelembe véve, hogy az emberi jogok figyelmen kívül hagyása és figyelmen kívül hagyása olyan bar-ba-rie cselekedetekhez vezetett, amelyek újból felerősítik a humánság tudatát, és hogy egy olyan világ megjelenése, ahol az emberek szabadon szólhatnak és hithetnek, szabadok a rettegéstől és a félszegségtől kezdve az ember legmagasabb as-pi-rációjának nyilvánították,
Figyelembe véve, hogy alapvető fontosságú, hogy az emberi jogokat törvényi szabályozás védje, hogy az embert a legnagyobb tiszteletben tartva ne kényszerítsék a ty-ran-nie és az op-nyomás elleni lázadásra,
Figyelembe véve, hogy elengedhetetlen a nemek közötti baráti kapcsolatok fejlesztésének elősegítése,
Figyelembe véve, hogy az Alapokmányban az Egyesült Nemzetek népei újból meghirdették hitüket az alapvető emberi jogokban, a méltóságban és az ember értékében, a férfiak és nők jogainak egyenlőségében, és hogy úgy döntöttek, újra megoldani, hogy a pro-társadalom létrejöjjön, és jobb szabadságfeltételekkel jobb-jobb életkörülményeket teremtsen, .
Tesztjeihez vegyen néhány francia nyelvű irodalmi szöveget, amelyeken dolgoztunk, a „Nyilatkozattól” eltérően. Ha szeretné, hasonlítsa össze megoldását az alább említett JavaScript eredményével. Néhány apró különbség fennmaradhat, a kivételeket nem dolgozza fel.
Bevezetés
Itt van a teszt. Módosítsa az oldal szélességét, ellenőrizze, hogyan változik a sor kitöltése. (Itt az elválasztási rendszer beilleszti a "feltételes kötőjel" HTML-t a következő szavakba:, csak akkor látható, amikor az elválasztás megtörténik.).
A technika viszonylag bonyolult, mivel az elválasztási szabályok sok heterogén, fonetikus, morfológiai és etimológiai (szemantikai) szabályok, sok kivételtől eltekintve. Olaszul a meglehetősen mechanikus, eufonikus szótagokra osztás dominál (mássalhangzó előtt elvágva). De lengyelül vagy franciául a szótöredékek szemantikája fontosabb, mint a szótagok, és a szabályok több mint tízszer nagyobbak.
Minták írta Liang
Egy helyi szabályt érvényteleníthet egy másik: transz-amerikai, de transz-sac-tion és trans-por-ter. Ezután: mas-to-donte apos-trophe, de de-struc-tu-rer (és egyesek szerint az "aposztróf" rosszul lett kivágva, mert az "apo" és "strófák" morfológiai entitások.)
Az elképzelés az, hogy összegyűjtsünk (manuálisan vagy félig automatikusan) egy bizonyos számot (tíz vagy ezer). Minták: betűkombinációk, ahol találunk metszett, kis egész számokat: 1, 2, 3. A szám hiánya nulla. A páratlan szám azt jelenti, hogy a vágás megengedett, páros szám: tilos. Ha a minták zavarják (az így deklarált több kombináció egy szóval, ugyanazon a helyen található - a nagyobb szám "nyer").