Elosztási szemantika
Elosztási szemantika A szó jelentése van a fejében? Kolb Peter, 2010. december 9

Áttekintés Szolgáltatási szemantika (MS) Terjesztési szemantika (DS) módszer alkalmazások összehasonlítása MS DS
lovagolni ló etetése ló simogatása a ló vágtat a ló alszik a ló eszik gyors ló öreg ló vad ló * formátum ló * vas ló * kifúj egy ló * a ló érvel Ló * erdős ló * szögletes ló
Modellválasztási korlátozások szemantikai jellemzőkkel: A ló alvása vitatkozik [+ élénk] [- emberi] SUBJ: [+ élénk] SUBJ: [+ emberi] a ló alszik * a ló érvel
Pontosítás olvasása: 1. ló [+ él] [- ember] ló 2 [élõ] alvás SUBJ: [+ él] érvel SUBJ: [+ emberi] a ló alszik 1. ló
Pferd ló csődör [+ felnőtt] [+ hím] csődör kanca [+ felnőtt] [+ nőstény] kanca csikó [-felnőtt] csikó [-felnőtt] [+ nőstény] csikó [-felnőtt] [+ hím] csikó fekete [+ fekete ] fekete ló szürke [+ fehér] fehér ló [+ szürke] szürke ló róka [+ vörös-barna] sóska
A szómagyarázat módszerei: (1) Mutassa: Ez egy ló (2) Fordítás: A ló jelentése: „ló” (3) Határozza meg: A fehér ló a fehér ló
A szavak magyarázatának módszerei: (1) Mutassa: Ez egy ló (2) Fordítás: A ló jelentése: „ló” (3) Határozza meg: A fehér ló fehér ló Meghatározható-e a teljes szókincs? Szavakkal magyarázott szavak: körkörös meghatározások veszélye
kör = egy kör alakja, gömböt mutatva Kör = egyenletesen kerek, önálló gömb = teljesen kerek test (Duden Deutsches Universal körülbelül 1996. augusztus)
Magától értetődik, hogy a szemantikai jellemzők elvont, elméleti egységek, amelyek összetett, pszichés struktúrákat képviselnek. [] A [] kifejezések nem vezethetnek abba a feltételezésbe, hogy maguk a jellemzők ismét valamilyen természetes nyelv lexikai egységei. Minden szemantikai struktúra végső soron azokra a tulajdonságokra vezethető vissza, amelyek az emberi szervezet gondolatszerkezetének és észlelésének alapvető diszpozícióit képviselik. (Manfred Bierwisch 1969)
Ló [+ K027] [-S143] [+ B415] [+ R024].
Következmények: a jelentések szemantikai jellemzőkből állnak, ezek nem nyelvi és veleszületettek. Az egyes szavak jelentése külön-külön is megadható Jelentéshasználat és hivatkozás (hivatkozás)
A jelentések mentális reprezentációk: kifejezések, fogalmak, prototípusos képek a fejben
szemantikus objektivizmus: a szavak olyasvalamit képviselnek, amelyet az érzékelés vagy a gondolkodás már megad, vagyis a nyelvtől függetlenül létezik. A jelentés a nyelvi jeleket megelőzi. A szavak olyanok, mint a névtáblák, amelyek a jelentésekhez kapcsolódnak (Wittgenstein)
Problémák: (1) gyakorlati megvalósítás: hogyan vezethetem vissza a zeitgeist érzékelhető vagy logikus építőelemekre? Melyek ők egyébként? (2) sok kategóriában homályos határok vannak sztereotípiák, nem kell, hogy legyen olyan jellemző, amely a kategória összes képviselőjére vonatkozik, egyes kategóriák képviselői reprezentatívabbak, mint más természetes kategóriák, nincsenek éles határok (pl. Fa vagy bokor)
Áttekintés Feature Semantics (MS) Terjesztési szemantika (DS) módszer alkalmazások összehasonlítása MS DS
lovagolni ló etetése ló simogatása a ló vágtat a ló alszik a ló eszik gyors ló öreg ló vad ló * formátum ló * vas ló * kifúj egy ló * a ló érvel Ló * erdős ló * szögletes ló
lovagolni ló etetése ló simogatása a ló vágtat a ló alszik a ló eszik gyors ló öreg ló vad ló * formátum ló * vas ló * kifúj egy ló * a ló érvel * a ló borjakat * a ló táplálja * fordított Ross * erdős ló * szögletes ló
* lovagolni csirkével etetés csirke stroke csirke * a csirke vágtat a csirke alszik a csirke eszik gyors csirkét régi csirke vad csirke * formátum csirke * vas csirke * fúj csirke * a csirke érvel * csirke borjak * a csirke táplálja * fordított csirke * erdős csirke * szögletes csirke
* pohárral etetni * poharat simogatni egy pohárral * az üveg vágtázik * az üveg alszik * az üveg eszik? gyors pohár régi üveg * vad üveg * formázza meg a poharat * vasalja egy poharat * fújjon ki egy poharat * az üveg érvel * az üveg borjak * az üveg etet * fordított üveg * fás üveg szögletes üveg
Elosztási hipotézis (Harris 1968): A hasonló összefüggésekben használt szavak jelentése hasonló. Használat Jelentés Használat = eloszlás a korpuszban = az összes összefüggés összege
Mit jelent a kontextus? közös szavak Mit jelent a közös? Távolság szintaktikai összefüggés
Határozza meg az eloszlás összhangját:
Ablak ± 3 szó (csak a tartalmi szavakra figyeljen):
Ablak ± 3 szó (csak a tartalmi szavakra figyeljen):
Ablak ± 3 szó (csak a tartalmi szavakra figyeljen):
Ablak ± 3 szó (csak a tartalmi szavakra figyeljen):
Ablak ± 3 szó (csak a tartalmi szavakra figyeljen):
Gyakori szavak listája gyakorisággal: A helymeghatározási profil (= a szó eloszlása) a szignifikancia statisztikai mértékével az abszolút frekvenciákat konvertálja szignifikancia értékekké., 3 lovagolt 12,1 hegyes 10,8 elefánt 10,8 öszvér 10,8 gyeplő 10.6
Gyakori szavak listája gyakorisággal: Kollokációs profil (= a szó eloszlása) az abszolút frekvenciák statisztikai szignifikancia mérésével való konvertálása szignifikancia értékekké Ló lovagolt 18,7 lovagolt 16,9 ügetett 15,2 lovas 14,5 teve 13,1 szamár 13,0 menet 12, 3 lovagolt 12,1 hegyes 10,8 elefánt 10,8 öszvér 10,8 gyeplő 10.6. Ross lovas 14,4 emelkedés 11,7 stabil 9,9 gyeplő 9,7 láb 8,2 fehér 7,9 lovas 7,6 őrzött 6,8 arany 6,8 gyors 6,7 ugrás 6,3 teve 6,2.
Gyakori szavak listája gyakorisággal: Kollokációs profil (= a szó eloszlása) az abszolút frekvenciák statisztikai szignifikancia mérésével való konvertálása szignifikancia értékekké Ló lovagolt 18,7 lovagolt 16,9 ügetett 15,2 lovas 14,5 teve 13,1 szamár 13,0 menet 12, 3 lovagolt 12,1 hegyes 10,8 elefánt 10,8 öszvér 10,8 gyeplő 10.6. Ross lovas 14,4 emelkedés 11,7 stabil 9,9 gyeplő 9,7 láb 8,2 fehér 7,9 motoros 7,6 őrzött 6,8 arany 6,8 gyors 6,7 ugrás 6,3 teve 6,2.
Az összes szó (táblázat oszlop) összehasonlítása egymással: magas értékek azoknál a szavaknál, amelyeket hasonló összefüggésekben használtak a leginkább hasonló szavak listájához ló: ló ló szamár állat juh kutya teve üveg: üveg pohár csésze korty korty sör.
félénk: félénk félelmetes habozó csendesen ideges szomorú rémült szerény kínos izgatott bizonytalan udvarias jókedvű félelmetes. Kapitalizmus: szocializmus kommunizmus demokrácia imperializmus fasizmus kapitalista piacgazdaság liberalizmus sztálinizmus. sikoly: sírás, üvöltés, nevetés, zokogás, hívás, ének, ordítás, ugatás, eső, ordítás, nyögés, vérzés, sikoltozás, köhögés, káromkodás, mondás, beszéd.
Áttekintés Feature Semantics (MS) Terjesztési szemantika (DS) módszer alkalmazások összehasonlítása MS DS
Modellválasztási korlátozások disztribúciós hasonlósággal (Erk et al. 2010)
Az agyi aktivitás előrejelzése a főnevek feldolgozásakor (Mitchell és mtsai. 2008) Agy aktivitása mágneses rezonancia képalkotással (MRI) mérve 25 igék: lásd hallani hallgat íz szag eszik érintés fut lökés mondjuk félelem hajt kopás.
60 főnév: zeller kukorica repülőgép a 60 főnév korpuszban gyakori előfordulása a 25 igével meghatározza a szignifikancia értékeket pl. zeller: egyél 0,84 ízt 0,35 töltsön 0,32 ezek alapján az értékek és a főnevek 25 igéjének aktivitásmintáinak megtanult tevékenységi mintái szerint a siker aránya 77%
Különböző nyelvű szóközök kiosztása A kollokációk (a táblázat sorai) fordítása, amennyire csak ismert: Ló: lovaglás ügetés ügetés lovas lovas teve teve mount mount új oszlop a célnyelvi táblázat összehasonlítása a célnyelv összes oszlopával
Kísérletezzen német angol szóközökkel a német és az angol Wikipedia kétnyelvű szótárból, 16 000 bejegyzéssel 800 tesztszó ismert fordítással Főnév: 60% helyes (a várható fordítást találták a leginkább hasonló szónak) Igék: 45% helyes Melléknevek: 66% a fordítást várta a főnevek közül 20 hasonlóbb között: 87% igék: 78% melléknevek: az esetek 93% -a.
jelentése: 0,046 jelentése 0,034 jelentése 0,034 átlag 0,033 jelöli 0,032 ige 0,031 utótag 0,030 származtat 0,030. Tök: avokádó 0,084 káposzta 0,081 görögdinnye 0,080 kukorica 0,078 tök 0,077 eper 0,076 szükséges: szükséges 0,150 elegendő 0,103 megfelelő 0,097 megfelelő 0,080 szükséges 0,079. évente: évente 0,151 éves 0,135 évente 0,099 havonta 0,073 hetente 0,060 vásár 0,058.
A vektorűr modellek vitathatatlanul a szemantika legsikeresebb megközelítései. (Turney & Pantel 2010)
Áttekintés Feature Semantics (MS) Terjesztési szemantika (DS) módszer alkalmazások összehasonlítása MS DS
Ágoston-i nyelvkép (Wittgenstein PU 1 szerint) A nyelvnév tárgyai Minden szónak van jelentése, amelyet a szóhoz rendelnek. Ez az a tárgy, amelyért a szó áll. A nyelv megtanulása, mintha a gyermeknek már lenne nyelve, mintha már megkérdezhetné: Milyen tárgyat értenek a felnőttek a „fa” szó alatt? mint egy felnőtt, aki már beszél egy nyelvet és idegen országba érkezik
a felnőtt megtanulja a nyelvet: a „kék” kék „fa” a fa radikális értelmezését jelenti (D. Davidson). mintha a gyermek idegen országba érkezett volna, és nem értené az ország nyelvét; azaz: mintha már lenne nyelve, csak nem ez. (PU 32), de a gyermeknek nincs nyelve a nyelv előtt: a „kék” azt jelenti, hogy X X = nem szó, hanem valami nyelven kívüli dolog, az a tárgy, amelyért a szó áll
Ruben van de Vijver: Fonológia. A hangoknak önmagában nincs jelentése. Kombinációban olyan szavakat alkotnak, amelyeknek van jelentése. A beszédhangnak ezért különböznie kell a többi hangtól. Csak akkor lehet szókincset építeni. Strukturalisták: Különbség és ellentét Egy struktúrában mindennek csak értelme van az egészből. Egy nyelv szavai nem külön-külön állnak jelentéshordozóként, de mindegyiknek csak azért van jelentése, mert mások mellett jelentése is van. (Trier 1931, 643. o.)
Maguk a jelek csak olyan megkülönböztetésekből állnak, amelyeket nem tartalmuk, hanem negatívan határoz meg a rendszer többi tagjához való viszonyuk. Leghatározottabb jegyük, hogy olyanok, amilyen mások nem. (Saussure 1916, 139. o.) A teljes, viszonylag egyedi szavak jelentése nem bír jelentéssel, függetlenül a többi jelentéstől, amelyet a nyelv jelentése adott = hely a nyelvi rendszerben
negyedik meghatározási módszer: strukturális azonosítás (Carnap 1961) minden szó, amely egyértelműen azonosítható azáltal, hogy beágyazódik az űr szó szerkezetébe, annak ellenére, hogy a körkörösség, a szótér a szavak szövegekben történő felhasználásából származik A jelentés nem valami idegen vagy nyelv előtti, ami a szavakhoz kapcsolódik, hanem azok használhatósága a rendszerben
A kérdés: "Mi is valójában egy szó?" analóg a "Mi az a sakkfigura?" (Wittgenstein 1953, 108.) A nyelv nem tartalmaz sem ötleteket, sem hangokat, amelyek a nyelvi rendszerrel kapcsolatban léteznének, hanem csak a rendszerből fakadó fogalmi és fonetikai különbségeket tartalmaznak. (Saussure 1916, 143. o.)
Hol van a jelentés? A jelentés benne van a diskurzusban. (Teubert 2005)
Irodalom Bierwisch, Manfred: Strukturális szemantika. Hoffmann, L. (szerk.), Nyelvészet: Olvasó. De Gruyter 1996. Carnap, Rudolf: A világ logikai felépítése. Felix Meiner Verlag, 1961. Erk, Katrin, Padó, Sebastian és Padó, Ulrike: A Regular and Inverse Selectional Preferences rugalmas, korpuszvezérelt modellje. Számítógépes nyelvészet 2010. Harris, Zelig: A nyelv matematikai struktúrái. Interscience Publishers 1968. Mitchell, Tom M. és mtsai: A főnevek jelentésével összefüggő emberi agyi aktivitás előrejelzése. Science, Vol. 320, 2008. Putnam, Hilary: A jelentés fontossága. Klostermann 1979. de Saussure, Ferdinand: Az általános nyelvészet alapkérdései. De Gruyter 1967.
Irodalom Teubert, Wolfgang: A korpusz nyelvészet változata. International Journal of Corpus Linguistics 10: 1, 2005. Trier, Jost: Nyelvi mezők. Hoffmann, L. (szerk.), Nyelvészet: Olvasó. De Gruyter 1996. Turney, Peter és Pantel, Patrick: A frekvenciától a jelentésig: A szemantika vektor térmodelljei. Journal of Artificial Intelligence Research, 37, 2010. Wellmer, Albrecht: Sprachphilosophie. Suhrkamp 2004. Wittgenstein, Ludwig: Filozófiai vizsgálatok. Work edition 1. évf., Suhrkamp 1984.