Miért ingadozik az érvényesítési pontosság

Négyrétegű CNN-m van, hogy MRI-adatok alapján megjósoljam a rákreakciót. ReLU aktiválásokat használok a nemlinearitások bevezetésére. A vonat pontossága és vesztesége monoton módon növekszik, illetve csökken. De a teszt pontosságom kezd vadul ingadozni. Próbáltam változtatni a tanulási sebességen, csökkenteni a rétegek számát. De ez nem állítja meg az ingadozásokat. Még olvastam is ezt a választ, és megpróbáltam követni a válasz utasításait, de megint nem volt szerencsém. Tudna valaki segíteni abban, hogy kiderítsem, hol tévedek?

Ahogy értem a pontosság definícióját, a pontosság (az adatpontok helyesen rangsorolt% -a) kevésbé kumulatív, mint mondjuk az MSE (átlag négyzethiba). Ezért látja, hogy a vesztesége gyorsan növekszik, miközben a pontosság ingadozik.

Intuitív módon ez alapvetően azt jelenti, hogy néhány példa besorolásra kerül véletlenszerűen, ami ingadozásokat produkál, mert a helyes véletlenszerű találgatások száma mindig ingadozik (képzeljünk el pontosságot, amikor az alkatrésznek mindig "fejeket" kell adnia). Alapvetően a zajérzékenység (amikor a besorolás véletlenszerű eredményt ad) a túlillesztés általános definíciója (lásd a wikipédiát):

A statisztikában és a gépi tanulásban az egyik leggyakoribb feladat az, hogy egy "modellt" illesztenek egy edzésadathoz, így megbízható előrejelzéseket tehet az általános, képzetlen adatokról. A túlillesztés egy statisztikai modell egy véletlenszerű hibát vagy zajt ír le az alapul szolgáló kapcsolat helyett