A kollokációk reprezentativitásáról a világban

Szakdolgozat (haladó szeminárium) 2015 23 oldal

világban

Minta olvasása

szerkezet

1. Bevezetés - A webes kollokációk reprezentativitásáról
1.1. Mik a kollokációk?
1.2. Kérdés
1.3. Az internet mint korpusz
a) A korpusz nyelvészet mint empirikus kutatási módszer
b) A web mint korpusz előnyei és hátrányai
c) Az internetes kollokációk kivizsgálása

2. A weben kiválasztott kollokációk saját korpusz-nyelvészeti vizsgálata
2.1. "Német nyelvű kollokációk szótára" - megvizsgálandó kollokációk válogatása
2.2. Corpus elemzés a WebCorp segítségével
2.3. Eredmények és összehasonlítás a kollokációs szótárral

3. Az eredmények értelmezése és megvitatása
3.1. kilátások

1. Bevezetés - A webes kollokációk reprezentativitásáról

1.1. Mik a kollokációk?

A frazeológiai kutatásokban a kollokáció kifejezést „rögzített nem idiomatikus szóösszetételek jelölésére használják” (vö. Reder 2006: 160). A kollokációk tehát az egyes nyelvekben konvencionálisak, bizonyos szóösszetételek erősen rögzülnek egyetlen nyelvben, és így rögzített „a nyelvi rendszer egységeit” képviselik (vö. Lehr 1996: 1). A nyelvészeti kutatások során a kollokációkat gyakran bináris lexikai egységként kezelik, mint a fent említett példákban. Vannak azonban „több mint két szavas összefüggések” is (vö. Hollós 2010: 85), amint azt a példában tömegesen kritizálták (vö. Hausmann 2004: 316). Ezekkel azonban itt nem szabad foglalkozni, mivel túlmutatnának e munka keretein.

Összefoglalva, korpusz-nyelvi vizsgálatomat a kollokációk következő megértésére alapozom: A kollokációk statisztikailag gyakori bináris jellegű szavak kombinációi, amelyeket a kollokátor szintagmatikus és szemantikai függőségei jellemeznek egy bázison (vö. Hausmann 2001: 316, Reder 2006: 158). Jelen munka a verbális és az érdemi kollokációkra összpontosít, mivel korpusz nyelvi szempontból könnyen azonosíthatók, ezért jól alkalmasak a webes korpuszban található kollokációk reprezentativitásának értékelésére (lásd Breidt 1995: 5). A lehetséges kollokatív szóösszetételek sokfélesége kétértelműségekhez vezethet a korpuszok felkutatásában és elemzésében, ezért szükséges a vizsgálandó tárgy egyértelmű körülhatárolása.

1.2. Kérdés

Mielőtt a következő fejezetben foglalkoznék a web lehetőségeivel és kockázataival a kollokációelemzés korpuszaként, szeretném elmondani a vizsgálat célorientált kérdését. A cél annak megvizsgálása, hogy a „világháló” reprezentatív-e a verbális és főnévi kollokációk használatában. A web saját korpusz-elemzésének eredményeit össze kell hasonlítani a „Német nyelvű kollokációk szótárában” (Quasthoff 2011) szereplő bejegyzésekkel annak érdekében, hogy fel lehessen mérni a web tényleges nyelvhasználatának reprezentativitását. A szótár bejegyzései már a megfelelő német nyelvű kollokációk megfelelő gyakoriságát jelzik (vö. Quasthoff 2011: XII). Mivel a kvantitatív elemzés csak korlátozott mértékben lehetséges az internetes korpuszban 1, a korpusz adatainak értékelésekor az eredmények kvalitatív elemzését is el kell végezni.

1.3. Az internet mint korpusz

A következő fejezetben előzetes megfontolásokat fogunk tenni a web nyelvi korpuszként való alkalmasságáról, amelyek a kollokációs elemzés későbbi eredményeinek tárgyalásába fognak áramlani.

a) A korpusz nyelvészet mint empirikus kutatási módszer

A korpusznyelvészet segítségével empirikusan megvizsgálható a különféle nyelvi jelenségek egyetlen nyelven való felhasználása. Például hiteles nyelvi anyag felhasználásával bizonyítást nyújthatunk a konkrét kollokációk jelentésére és használatára, valamint meghatározhatjuk előfordulásuk gyakoriságát. Ezért minőségileg és mennyiségileg is elemezhetők (vö. Scherer 2006: 35f.). Ez aztán alapot jelenthet a szótárak létrehozásához, mint például a „Német nyelvű kollokációk szótára” esetében. A legtöbb korpusz - más szóval: „(…) bizonyos nyelvi kritériumok szerint kiválasztott és osztályozott szöveggyűjtemények vagy szövegrészek” (2006: 3) - most digitalizálva vannak, és PC-k segítségével elemezhetők. A „világháló” rendkívül nagy adatgyűjtést biztosít az írott (és részben beszélt) nyelvből, és kibővíti a nyelvi korpusz elemzésének lehetőségeit. Vannak azonban hátrányai vagy korlátai. Az úgynevezett „webes korpuszok” 2 különféle jellemzőit az alábbiakban részletesebben megvizsgáljuk.

b) A web mint korpusz előnyei és hátrányai

c) Az internetes kollokációk kivizsgálása

A fent tárgyalt korlátozások ellenére a web felhasználható lexikográfiai és nyelvstatisztikai vizsgálatokhoz (Scherer 2006: 75, Diemer 2008: 36). Bickel korpusz nyelvészeti tanulmányai 3 világossá teszik, hogy a webes korpusz nagy növekedése és folyamatos továbbfejlesztése ellenére a keresési eredmények bizonyos esetekben „eredendően következetesek” és „reprodukálhatók” (Bickel 2006: 80). Nagyon hasonló eredményeket lehetett elérni különböző időpontokban, ami a szövött korpusz bizonyos stabilitását jelzi (vö. 2006: 78ff.).

2. A weben kiválasztott kollokációk saját korpusz-nyelvészeti vizsgálata

Annak megvizsgálása érdekében, hogy a „világháló” reprezentatív-e a verbális és az érdemi kollokációk használatához, korpuszanalízisemet összehasonlítás céljából a „Német nyelvű kollokációk szótárából” kiválasztott kollokációkra szeretném alapozni.

2.1. "A németországi kollokációk szótára" - megvizsgálandó kollokációk válogatása

A „Német nyelvű kollokációk szótára” az első német nyelvű kollokációs szótár (vö. Quasthoff 2011: XII). Mivel a lipcsei nyelvi korpusz empirikus, korpuszlingvisztikai vizsgálata alapján fogant, a kollokatív felhasználások nyelvi valóságát ábrázolja (vö. Radzik 2013: 64, Quasthoff 2011: XII). Quasthoff kollokációs szótára összegyűjti a leggyakoribb kollokátorokat összesen 3253 főnévhez, igéhez és melléknévhez, amelyek a bináris szóösszetételek alapjaként szerepelnek (2011: X). Radzik (2013: 71) a „Német szótár kollokációkhoz” korpusz alapú létrehozását „a német lexikográfia nagy eredményének” tekinti. Egy kulcsszó megfelelő kollokációi nem a referencia korpuszban való tényleges előfordulási gyakoriságuk szerint vannak strukturálva, hanem szintaktikai és szemantikai viszonyok szerint vannak rendezve az úgynevezett 4. kollokációs csoportokban (vö. Quasthoff 2011: X).

A független korpuszelemzéshez az alap étrenden alapuló verbális kollokációkat (főnév + ige) elemzik. Másrészt a főnevek kollokációit (melléknév + főnév) a fent említett alapon kell vizsgálni. A kollokációs szótár először a következő igéket és mellékneveket sorolja fel a táplálék főnév kollokátoraként (vö. 2011: 150):

1 lásd az 1.3b) szakaszt.

2 A „Web corpora” nyelvileg elkészített nyelvi anyag az Internetről. Meg kell különböztetni ezeket az "online elérhető korpuszokat", amelyek hozzáférhetők az interneten, de nyelvileg nincsenek feldolgozva (vö. Storrer 2011: 12).

3 A korpusz nyelvi vizsgálat felépítéséről és végrehajtásáról lásd Bickel (vö. 2006: 75ff.). 6.

4 Ezek a kollokációs csoportok pontosvesszővel elválasztva vannak felsorolva. Ezen struktúra alapján bemutattam ennek a korpusz nyelvészeti munkának az eredményeit is a 2.3. Ponttól (10. o.).