URÁL NYELVI ADATBÁZIS
suihkone /). A cikk előadásokat tartalmaz a Tudományos Napokon, amelyet a Helsinki Egyetem szervezett 1997. január 9-én és 10-én, valamint az IFUSCO 1997-es kongresszuson, 1997. április 24-én. A német fordítást Irmeli Helin asszony és Helmut doktor készítették. Diekman aggódott. Szeretnék köszönetet mondani mindkettőjüknek. Szeretnék köszönetet mondani Prof. Dr. Ins Cornelssen a cikkhez fűzött észrevételeihez.

1. térkép. Az Urál nyelvének nyelvi területei 5
12 CONJ_a = mutta ADV_öni = nyt PRN-NEG_n'ekod_SG_NOM = ei kukaan V-NEG_oz_PRES_3SG-PL = ei V_tydav_NEG_SG = nahkyä. # Alakuloisia ajatuksia nytä. # Alakuloisia ajatuksia nä. Anyaga a Erzänischen morfológiai kódolási (Jack Rueter 1994) 00.080.025 V_Uchost'_IND_PT1_SUBJ-3PL_FAB = WAIT N-P_Mat'an'_GEN-OBJ_IDF = (utónév), PRN-REL_kona_SG_NOM_AB1F = WHO V_tus'_SUB_F_N_AB1 = WHO V_tus'_FAB _GEN-OBJ_IDF = FOLYADÉK V_veshn'eme_INF-OBJ = KERES. ATR IDF = EGY, KI ÜRES '_IND_PT1_SUBJ-1SG_FAB = BE, PRN-_mez'ejak_SG_NOM_IDF_PCL-INCL = BÁRMILYEN PCL-NEG1_a = NEM V_maksit'_IND_PRS_SUBJ-3PL_FAB = PR N-PER tonna 'SG2 GEN = TE N_kasol'ent'_SG_GEN-OBJ_DEF = BAB POP_kise_INE_IDF = FOR, N-P_Pakhom_SG_NOM = (GIVEN NAME). BAB. #
Sölkupikus korpusz morfológiai és szintaktikai kódolással és német fordítással (Jarmo Alatalo 1998) 13 Itja és Pünegusse. (A8) T: A8. iicjä immrljantrsä urrkäsjprkkaqr. Itja a nagynénjénél lakott. iicjä N SG NOM SBJ immrljantrsä N SG KOM 3S LDM SAD urrkäsjprkkaqr V AOR 3DS FRE KNT VER T: A8. okkrr taaqrn iicjä mykka immrljaqrntr: Itja egyszer azt mondta a néninek: okkrr P ATR taaqrn N SG LOK SAD iicjä N SG NOM SBJ mykka V AOR 3SS FRE VER immrljaqrntr N SG DAT 3S LDM SAD T: A8. "man kojalang qarrngtrlj aaqqrn poqlontr". "A Ferde folyó medréhez megyek". man P SBJ kojalang V OPT 1SS VER qarrngtrlj P IP TRA ATR aaqqrn N SG GEN ATR poqlontr N SG DAT SAD Udmurtisch (Pirkko Suihkonen 1998b: 30-31, 48-49, tesztkódolás) (1) Morfológiai kódolás a szavak alapformáinak fordításával Dzhog_ADV_MAN gyors, hamarosan ortts' + i + z_v_-cont_-tra_ + fin_ind_past_sg3 át (el) zarn'i_n_-count_sg_nom A_SCAL_SG_NOM arany kuaro_a_scal_sg_nom, z_v_-cont_-tra_ + fin_ind_past_sg3 át (el) zarn'i_n_-count_sg_nom A_SCAL_SG_NOM arany kuaro_a_scal_sg_nom, z_v_a_scal_sg_nom, z_v_-cont_sg_nom levelekkel dyr_G_nogman + -co_en_country + dyr_G_SG_NOM + time_s_v_s_g_sg_en + -tra_ + fin_ind_past_pl3 jön zhob_a_scal_sg_nom csúnya, kellemetlen siz'yl_n_ + count_-anim_sg_nom A_SCAL_SG_NOM ADV_TIME őszi nunal + jos_n_ + count_-anim_pl_nom nap. + Ez_N_ + COUNT_-ANIM_SG_ACC ég, ég
Az automatikus elemzés először a korpuszban adja meg a szóalakot, majd felsorolja az érintett szóalak értelmezését, azaz jelentéseit. Az értelmezés tartalmazza a szó alapformáját és a szóalak morfológiai elemzését. Az adott szóalak összes jelentése egy kohortot alkot (Karlsson 1992: 3; Karlsson 1995: 46). Az UHLCS finn automatikus elemző programot használ. A finn automatikus elemzése (Koskenniemi 1983) (a macska az istálló lépcsőjén aludt és a nyárról álmodozott) * kissa nukkui tallin portailla ja uneksi kesästä. (") (" ("kissa" N NOM SG)) (" ("nukkua" V PAST ACT SG3)) (" ("talli" N GEN SG)) ("
"(" porras "N ADE PL)) (" "(" ja "COORD C)) (" "(" uneksia "V IMPV ACT SG2) (" uneksia "V PRES ACT NEG) (" uneksia "V PAST ACT SG3 ) ("uni" N TRA SG)) (" ("június" N ELA SG)) (") Ha egy nyelv elemzéséhez automatikus kódolást programoznak, akkor ez a program felhasználható további anyagok kódolására Az automatikus vagy manuális kódolás feladata a lehető legmegbízhatóbb ismeretek biztosítása az adott nyelvről. Ezenkívül a kódolást olyan körültekintően kell végrehajtani, hogy az eredeti szövegben szereplő információk egyike sem veszjen el. A kódolt anyagokat másoknak is át kell adni, eltérő Tipológiai szempontból különböző nyelvek számára feldolgozott koncepció vagy kódolási rendszerek valósíthatók meg 5. Az anyag felhasználása kutatási célokra Az anyag a gyakorlatban sokféleképpen használható fel. Fontos a nyelvi kutatás, beleértve az ezek speciális területeinek vizsgálatát.
16 nyelv és a szótárak és nyelvtanok anyagának szerkesztése. Ebbe a kategóriába tartozik az udmurt szótár, amely az udmurt szöveg korpusz anyagából jött létre. A szótár később elérhető lesz az elektronikus korpusz szerveren. A következő példában először az udmurt szó következik, amelyet angol és finn fordítása követ. Elektronikus korpuszok a szótárak anyagaként (Suihkonen, Zagulyayeva & Tronina 1995: 17) UDMURT/UDMURTTI ANGOL/ENGLANTI FINNISH/SUOMI ad'ami, N ember, emberi lény; személy. heines; rossz; személy. addz '+ em, 1. V PCPL
, 2. N 1. s. Addz'yny. 2. látva. 1. ks. addz'yny. 2. Näkeminen. addz'empoton, N szeretnék látni. halu sewdä. addz'empot + on + tem, ADJ ks. addz'empoton; utálatos; utálatos. ks. addz'empoton; vihattava; vastenmielinen, inhottava. addz'empotostem = addz'empotontem. addz'em # pot + y + ny, V INF látni akarni. haluta sewdä. addz'is'k + is ', V PCPL
s. addz'is'kyny. ks. addz'is'kyny. addz'is'k + on, N 1. láthatóság. 2. találkozás, találkozás. 3. szellem. 1. Näky (väi) szeptember. 2. kohtaus; tapaaminok. 3. aave. addz'is'k + on + tem, PCPL
s. addz'is'kyny. ks. addz'is'kyny. addz '+ is'k + y + ny, V INF
uralilaisten cold tietopankki ovat osa Helsingin yliopiston> tallteilla eri eri cold tietopankkia. 19 A kw-alg program megkeresi a 3. személy birtokos utótagjait -ez és -yz az igében. És pl. Az udmurt mint karaktersorozat, amely az acc. A konkordancia bemeneti fájlja az udmurt szöveg korpusz morfológiailag elemzett szakasza. A mintaanyag görgeti a szöveget, nagy konverziós és írásjelek nélküli átalakítás nélkül. kw-alg '\ + (ez hez yz)' célfájl 104: Anaj + ez kosem + ys 'gine kyti-oti tölatis'ky + ny 125: a, inzhen'er + ly dyshetskon s'ures + ez. 118: i + z t'ehn'its'eskoj l'it'eraturaj + ez. 48: 'ko + d + -a, myn + a + m tshukaz'e berpum + yz Erkyn nunal + e kyl' + i + z. 69: Ivanovits Viktor '+ len pits'i dyr + yz s'elo + ja + ortts' + i + z. 91: Esh + jos + yz uram + yn kalg + o, A következő példa az észak-lappiai korpusz teljes anyagának kivonata. A konkordancia program paramétereként a bemeneti és a célfájlok meghatározása mellett a számokat a szó azonosítóiként, a két írásjel közötti karaktersorozatként és a kontextus hosszaként is megadják. KWIC 4 4 célfájl sápmelas'vuo a ja gávnnahii, sus lea skandinávalas 'va igi buoremus dovdomearka lei, sus lej ritmalac'c'at njo l ásaidahttojuvjuvot eanet nu, ávdin ja geavatkeavohtes eaje s datneju dolg asvit nu, kgo s te sámec'earddaid gaskkas nu, viimmát nuortasámiid stii lmmos 'sáhttá govviduvvot nu, váldá ovdan iez'as árbevi ápmelac'c'at leat jurddas'an, vuoinjnjat latta sivdnidan igen vuovdit "sámegovaid", maidda ássi vuoinjnjaide vuo uduvve dán dihtui luonddu gierd n goit bázii s'addat dovddusin sámi dáiddac'eahppin, id álgovu oleamus dáiddahápaz, hp'gundaheadan, 28, újságíró Matti (1872-1929) lei vuos Az intézet megtanítja a UNIX operációs rendszer alapvető ismereteit és az elektronikus korpuszok kutatási anyagként való használatát is. A Helsinki Egyetem nyelvészeti intézetei is kínálnak egyet a félévek alatt