Mi az a; telített; modell

Mit értünk, amikor azt mondjuk, hogy telített modellünk van?

Egy telített modellben annyi becsült paraméter van, ahány adatpont van. Definíció szerint ez tökéletesen illeszkedik, de statisztikailag kevéssé használható, mivel már nincsenek adatok a variancia becsléséhez.

Például, ha 6 adatpontja van, és egy 5. rendű polinomot illeszt az adatokhoz, akkor telített modellt kap (független változók 5 hatványának egy paramétere plusz egy az állandó kifejezésre).

A telített modell olyan, amelyet túlparamétereznek, hogy alapvetően csak interpolálja az adatokat. Bizonyos beállításokkal, például a képtömörítéssel és a rekonstrukcióval, ez nem feltétlenül rossz, de amikor prediktív modellt próbál létrehozni, nagyon problematikus.

Röviden, a telített modellek rendkívül nagy variancia előrejelzőket hoznak létre, amelyeket a zaj jobban befolyásol, mint a tényleges adatok.

Gondolkodási kísérletként képzelje el, hogy van egy telített modellje, és az adatok zajt tartalmaznak. Akkor képzelje el, hogy néhány százszor illeszkedik a modellhez, minden alkalommal más-más zajmegvalósítással, majd új pontot jósol. Valószínű, hogy minden alkalommal gyökeresen eltérő eredményt fog elérni, mind illeszkedése, mind előrejelzése alapján (és ebben a tekintetben a polinomok különösen kirívóak). Más szavakkal, az illesztés és a prediktor szórása rendkívül magas.

Ezzel szemben egy nem telített modell (ha ésszerűen felépített) olyan rohamokat ad, amelyek következetesebbek még a különböző zajmegvalósítások esetén is, és a prediktor szórása is csökken.

Egy modell akkor és akkor telített, ha annyi paramétere van, mint az adatpontok (megfigyelések). Más szavakkal, telítetlen modellekben a szabadság fokai nagyobbak, mint nulla.

Ez alapvetően azt jelenti, hogy ez a modell haszontalan, mivel nem írja le az adatokat kevésbé takarékosan, mint a nyers adatokat (és az adatok takarékosabb leírása általában a modell alkalmazásának ötlete). Ezenkívül a telített modellek (de nem muszáj) tökéletes (tökéletes) illeszkedést biztosítani, mivel csak interpolálják vagy iterálják az adatokat.

Például vegye az átlagot egyes adatok modelljeként. Ha csak egy adatpontja van (pl. 5), akkor az átlag (pl. 5; vegye figyelembe, hogy az átlag csak egy adatpont telített modellje) használata egyáltalán nem segít. Ha azonban már két adatpontja van (pl. 5 és 7), és az átlagot (pl. 6) használja modellként, akkor pontosabb leírást kap, mint az eredeti adat.

Mint mindenki más mondta, ez azt jelenti, hogy annyi paramétered van, ahány adatpontod van. Tehát nincsenek fit tesztek. Ez azonban nem jelenti azt, hogy a modell "definíció szerint" tökéletesen illeszkedjen minden adatponthoz. Személyes tapasztalatok alapján elmondhatom, hogyan dolgozott néhány telített modellel, amelyek nem tudták megjósolni bizonyos adatpontokat. Elég ritka, de lehetséges.

Egy másik fontos kérdés, hogy a telítettség nem jelent haszontalant. Például az emberi megismerés matematikai modelljeiben a modellparamétereket olyan specifikus kognitív folyamatokhoz rendelik, amelyek elméleti háttérrel rendelkeznek. Ha a modell telített, akkor tesztelheti annak megfelelőségét olyan célzott kísérletekkel, amelyek csak bizonyos paramétereket befolyásoló manipulációkkal végezhetők el. Ha az elméleti előrejelzések egyetértenek a paraméterbecslések megfigyelt különbségeivel (vagy hiányával), akkor a modell érvényesnek mondható.

Képzeljünk el például egy modellt, amely két paraméterkészletet tartalmaz, egyet a kognitív feldolgozáshoz, egyet a motoros válaszokhoz. Képzelje el, hogy két olyan kísérletet folytat, ahol a résztvevők reakcióképessége romlik (kettő helyett csak az egyik kezet használhatják), a másik feltételnek pedig nincs károsodása. Ha a modell érvényes, akkor a paraméterbecslésekben mindkét körülménynél csak a motor válaszparamétereinél lehet eltérés.

Vegye figyelembe azt is, hogy ha egy modell sem telített, akkor még mindig nem azonosítható. Ez azt jelenti, hogy a paraméterértékek különböző kombinációi ugyanazt az eredményt hozzák, ami befolyásolja a modell illeszkedését.

Ezekről a témákról általában a következő cikkeket olvashatja el:

Bamber, D. és van Santen, JPH (1985). Hány paraméter lehet és még tesztelhető? Journal of Mathematical Psychology, 29, 443-473.

Bamber, D. és van Santen, JPH (2000). Hogyan értékeli a modell tesztelhetőségét és azonosíthatóságát? Journal of Mathematical Psychology, 44, 20-40.