Berlini Műszaki Egyetem
Technische Universität Berlini Kar I. Nyelv- és Kommunikációs Intézet Hangkommunikáció Tanszék Hangszórók audiovizuális minõségének értékelése Mester szakdolgozat Paul Mainz által benyújtott 225610 számú hallgató, Berlin, 2015. március 18. Elsõ bíráló: Prof. Dr. Stefan Weinzierl Második bíráló: Dr. Hans-Joachim Maempel

Nyilatkozat az eskü helyett ezennel kijelentem, hogy a jelen munkát önállóan és saját kezemmel, illetéktelen külső segítség nélkül, kizárólag a felsorolt források és források felhasználásával készítettem el. Berlin, 2015. március 18. Paul Mainz
Tartalom 1 Bevezetés 1 2 A kutatás állapota 3 2.1 Multimodális érzékelés. 3 2.2 Audiovizuális érzékelés. 4 2.2.1 Audiovizuális minőségértékelés. 7 2.2.2 A hangszórók audiovizuális érzékelése. 9 3 Hallgatási teszt 11 3.1 A vizsgálat tárgya. 11 3.2 A teszt kialakítása. 12 3.2.1 Együtt-jelenlét paradigma. 12 3.2.2 Kúpos inger paradigma. 12 3.3 Hangszórók. 14 3.4 Szerkezeti teszt beállítása. 17 3.5 Mérés. 19 3.6 Hangtartalom. 23 3.7 Felmérés eszköze. 24 3.8 Mérlegszerkezet. 25 3.9 Műszaki kísérlet beállítása. 29 3.9.1 Adatgyűjtés. 29 3.9.2 Akusztikus szimuláció. 32 3.9.3 Lemezjátszó. 35 3.10 Megvalósítás. 36 4 Értékelés 39 4.1 Együtt-jelenlét paradigma. 41 4.1.1 Hallási attribútumok. 44 4.1.2 Vizuális attribútumok. 49 I.
4.1.3 Audiovizuális tulajdonságok. 50 4.2 Kúpos inger paradigma. 52 4.2.1 Hallási tulajdonságok. 53 4.2.2 Vizuális attribútumok. 57 4.2.3 Audiovizuális tulajdonságok. 58 4.3 A változók közötti kapcsolatok. 60 4.3.1 Együtt-jelenlét paradigma. 60 4.3.2 Kúpos inger paradigma. 65 5 Összefoglalás 70 Irodalomjegyzék 73 Ábra-lista 76-os táblázat-lista 79 A variancia-elemzés 82 A.1 együtt-jelenlét paradigma. 82 A.2 Kúpos inger paradigma. 85 B regresszió 89 B.1 együtt-jelenlét paradigma. 89 B.2 Kúpos inger. 91 C Polaritás Prole 93 C.1 Együtt-jelenlét paradigma. 93 D LimeSurvey 97 D.1 Tesztelési utasítások. 97 D.2 Kérdőívek. 98 D.3 osc-web. 99 E A Matlab funkciói 100 E.1 reset_turntable.m. 100 E.2 mozgás_fordulótábla.m. 102 E.3 setup_righttable.m. 105 E.4 vázlat_hívás.m. 106 II
1. BEVEZETÉS Az általuk reprodukált hang érzékelése, valamint a teljes hangszóró termék minőségének értékelése. Ha van itt összefüggés, akkor meg kell próbálni számszerűsíteni azt: Az audiovizuális észlelés mint tudományos kutatási terület egyre nagyobb figyelmet kap, de ez egy fiatal tudományág, amely sok nyitott kérdést kínál fel. E munka célja, hogy hozzájáruljon a tárgyak hallása és látása közötti kapcsolatok jobb megértéséhez. Ezenkívül e kapcsolatok ismerete a hangszórókkal kapcsolatban gyakorlati hasznos lehet a hangszórók gyártása során. 2
2.2. AUDIOVIZUÁLIS FELFOGÁS 2. A KUTATÁS ÁLLAPOTA egymáshoz rendezve. Így belülről kifelé egyre nagyobb a különbség a vizuális és a hallási inger között. A kísérlet előtt a tesztalanyoknak azt a tanácsot adták, hogy mindkét hangszóró ugyanazt a hangot adja, és hogy ezért nem hallanak sztereó hangot, és úgy hangzik, mintha a jel a középpontból érkezne. Mindazonáltal továbbra is kérdéses, hogy ez a bejelentés elfogadhatóvá teszi-e a conict ingert az észlelési rendszer számára, és van-e értelme hasonló kísérletet végezni olyan körülmények között, amelyek a tesztalanyok számára ismertebb helyzetet képviselik, és a mindennapi, természetes tapasztalatokat, amikor hangjelzéseket hallanak a hangszórókon keresztül jobban térképez. Kísérletük során a szerzők mindig kérdeztek a hangminőségről minden körülmények között (beleértve a tisztán vizuálisakat is). Arra is rámutatnak, hogy érdekes lehet megvizsgálni, hogy mely egyedi tényezők fontosak a hangszóró termék általános megítélése szempontjából. 10.
3.4. SZERKEZETI KÍSÉRLETI BEÁLLÍTÁS (a) Adam Classic oszlop Mk3 (c) JVC SP-E5 3. hallgatási teszt (b) B&W DM601 S2 (d) Braun L420/1 (e) Heco Victa 201 3.1. Ábra: A hallgatási tesztben használt hangszórók 18
3.5. MÉRÉS 3. HALLGATÁSI VIZSGÁLAT 3.4 ábra: FABIAN robot mérése a széken a tesztalanyok számára a BRIR mérése előtt Ren Ren felszereli a fejhallgatót egy fejkövetővel, amely regisztrálja a fej mozgását. A fejkövető helyzetadatai alapján az aktuális fejhelyzethez megfelelő BRIR választható ki a bemeneti jellel való hajtogatáshoz. A hallgató számára ez létrehoz egy virtuális hangforrást, amely a fej elfordításakor nem mozog, hanem a helyén marad. Az audiokommunikációs osztály által kifejlesztett FABIAN mérőrobotot használták a BRIR mérésére [24]. A robot egyszerű módszert kínál a BRIR automatikus mérésére ± 80 fejpozíció tartományban. A felbontás itt 1 volt. A BRIR-eket így 1 lépésben mértük a fej 80-as balra forgatásától 80-ig jobbra történő forgatásáig. Így a forrás mérésének végén mindkét irányban 80 BRIR-t kap, plusz egyet a nulla helyzetben, vagyis azt a fejhelyzetet, amelyben a robot egyenesen előre néz. Tehát ez forrásként 2 80 + 1 = 161 BRIR (sztereó). Minden sztereó párban lévő hangszórót külön mértünk. Így végül 2,161 = 322 BRIR van hangszóró-modellenként
3.6. AUDIO TARTALOM 3. HALLGATÁSI VIZSGÁLAT 3.6. Ábra: A helyiség bal bal hangszórójának átviteli funkciója, ha mérő robotral mérünk, és 30 szög (azaz a robot elülső képe a hangszórón), a jobb füles hangszóró egészen a lemezjátszó ruha alá. A 3.5. És a 3.6. Ábra példákat mutat be az öt hangszóró kísérleti beállításának átviteli funkcióiról, a bal oldali hangszóró impulzusválaszai alapján számolva 30 szögre (a mérőrobot tehát szorosan nézi a hangszórót). 3.6 Hangtartalom Meg kell próbálni a lehető legnormálisabb hallgatási helyzetet teremteni a tesztalanyok számára. A tesztalanyok által értékelendő ingerek tartalmát, vagyis a hanganyagot, amelyet a BRIR-szel hajtogatnak, ezért olyan műfajból kell kiválasztani, amely sok hallgató számára meglehetősen ismerős. Ugyanakkor ennek a jelnek képesnek kell lennie a hangszóró gyengeségeinek feltárására és hallhatóvá tételére, vagy az erősségek hangsúlyozására, hogy a tesztalanyoknak lehetőségük legyen meghallani az öt hangszóró-modell közötti különbségeket. A 3.2 23. szakaszban leírtak szerint
3.9. MŰSZAKI TESZT BEÁLLÍTÁSA 3. HALLGATÁSI TESZT 3.7. Ábra: Vázlatos műszaki beállítás a hallgatási teszt alatt Interfész. Az egyes kérdésoldalakra példák találhatók a D. függelékben. A kísérlet összes különböző részéhez (tisztán akusztikus, tisztán optikai és optoakusztikus) a LimeSurvey-ban létrehozták a kérdéses oldalakat a megfelelő attribútumokkal. Ez biztosítja, hogy a tesztalanyok csak a jelenleg megfelelő tulajdonságokat látják. Minden oldal hozzárendelhető egy randomizációs csoporthoz a LimeSurvey-ban. Egy ilyen csoporton belül az egyes oldalak véletlenszerű sorrendben jelennek meg. Ugyanakkor a csoportok tetszőleges sorrendben rendezhetők. Ebben az esetben egy csoportot hoztak létre a kísérlet tisztán akusztikus, tisztán optikai és optoakusztikus részére. Ez megkönnyíti a kívánt ingersorozat létrehozását a kísérletben (először akusztikusan, majd optikailag, majd 30
3.9. MŰSZAKI KÍSÉRLETI BEÁLLÍTÁS 3. HALLGATÓ KÍSÉRLET 3.8. Ábra: Az akusztikus szimuláció audioadatainak elérési útja a fejhallgatón keresztül egy mélynyomó segítségével, amelyet a szoba egyik sarkában helyeztek el a többi hangszóró mögött. Nehéz volt látni a tesztalanyokat, és a résztvevők nem észleltek a membrán mozgása által okozott légrobbantásokat. A mélysugárzó ezért nem volt egyértelműen felismerhető a kísérletben aktívan részt vevő komponensként, és a doboz akusztikus lokalizálása az alacsony frekvenciák reprodukálása miatt nem volt lehetséges. Mivel a mélysugárzó használatának célja a jelek állati szekvenciális összetevőinek reprodukálása volt, de csak a frekvenciaspektrum azon pontjáig, amelyen a fejhallgató újra átveheti, és ezzel egyidejűleg a mélynyomó jelszintjét is módosítani kellett Annak biztosítására, hogy a fejhallgató szimulációs részének szintje megegyezzen a tesztalanyok helyzetével, az fwonder kimeneti jelét, vagyis a BRIR-szel hajtogatott jelet a JACKRack 9 szoftverhez küldték. A JACKRack kínál 9 Bob Ham et al., Http://jack-rack.sourceforge.net/ 33
3.10. A 3. HALLGATÁSI KÍSÉRLET ELVÉGZÉSE Javítsa ki az aktuális inger akusztikai szimulációját. 3.10 Megvalósítás A kísérlet során először a tisztán akusztikus ingereket mutatták be a tesztalanyoknak, vagyis csak a hangszórókat hallják, de nem látják, majd tisztán optikai ingereket generálnak, vagyis csak a hangszórókat mutatják meg akusztikus szimuláció nélkül. Játsszon hangmintákat, és mutassa be végül az optoakusztikus ingereket. Ez a sorrend biztosítja, hogy a tisztán hallási értékelés során a résztvevőket még ne befolyásolja a hangszórók megjelenése. Mivel az első meghallgatáskor nem lát egyetlen hangszórót sem, a későbbi tisztán vizuális értékeléshez nem lehet egyszerűen hozzárendelni a korábban hallott hangmintákat az optikailag bemutatott hangszórókhoz. Az ingereket véletlenszerűen mutattuk be mindhárom csoportban (lásd 3.9.1.). 3.10. Ábra: A tesztalanyok életkorstruktúrája A teszt során összesen 20 német állampolgárságú személy 36
3.10. VÉGREHAJTÁS 3. HALLGATÁSI KÍSÉRLET, hogy a fejhallgatón keresztül később ismét jelet fognak lejátszani, ezért a fejhallgatót bekapcsolva kell tartania az egész kísérlet során. Azt is bejelentették az embereknek, hogy mindegyik hangszórót többször hallják, és hogy a különböző elektroakusztikai beállítások miatt ugyanaz a hangszóró minden alkalommal másképp szólhat. Ezért minden alkalommal meg kell próbálniuk újból hallgatni vagy látni és értékelni. Annak érdekében, hogy a hangszórókat pusztán hallási szempontból lehessen értékelni, a kísérlet elején a hangszórókat ronggyal borították be. Az emberek ezért nem láthatták őket. Az öt tisztán akusztikus inger után az alanyokat ezért arra kérték, hogy tartsanak egy rövid szünetet, amíg a kísérletező el nem távolítja a burkolatokat. 38
4.1. KOPESZTENCIA-PARADIGMA 4. ÉRTÉKELÉS Minden változót -2–2 értékekkel kódolunk. A skála legkisebb vagy negatív értéke a -2-nek felel meg, a legnagyobb vagy a legpozitívabb a 2-es értéknek. 4.1 Copresence Paradigma a copresence paradigmában található mint már kifejtettük, tartalmazzon minden ingert, amely nem produkál kúpos ingert. A két tényező modalitása (3 faktoros szint) és a hangszóró (5 faktoros szint) itt változik. Valamennyi függő változó esetében először kiszámolták az átlagértékeket, és így az összes hangszóróhoz és az összes modalitáshoz polaritásprololokat hoztak létre az adatok szemléltetésére. Ezek jó áttekintést nyújtanak a rögzített értékelésekről, és néhány dolog megragadja a figyelmet, amikor a Prole-t nézzük. A hangszóró fekete-fehér és az auditív modalitás jelentőségét itt mutatjuk be példaként (4.1. És 4.2. Ábra). A többi hangszóró iránti érdeklődés és a modalitások a függelékben találhatók. 4.1. Ábra: A B&W DM601 S2 polaritási profilja az együtt-jelenlét paradigmában A hallási és az audiovizuális modalitás közötti változás jelentős változásnak tűnik
4.1. TARTALOMJEGYZÉS-PARADIGMA 4. ÉRTÉKELÉS, az ilyen típusú együtt-jelenlét paradigmában is használják az egyszerűség és az egységesség fenntartása érdekében. Azokban az esetekben, amikor ez érdekes, egyedi pár-összehasonlításokat végeztek (kiigazítás nélkül) az egyes faktorszintek között is. 4.1.1 Hallási attribútumok A várakozásoknak megfelelően a legtöbb hallási tulajdonság jelentős eredményeket mutat, ha a hangszóró tényező változik. Ez nem meglepő eredmény, mert az akusztikus jelek reprodukálása és a jó hallási benyomások generálása a hangszóró fő feladata. 4.3. Ábra: A hallási tulajdonságok átlagértékei a magas, az alacsony, a keménység és a térfogat a modalitás felett ábrázolva; az egyes értékek a jobb olvashatóság érdekében vonalakkal vannak összekapcsolva, a vonalak nem képviselik a modalitások közötti értékeket, azonban a hangszóró tényező változása nem eredményez jelentős különbséget a magas hangok értékelésében. Ez a 4.3. Ábrán is látható. Ebben az ábrán, valamint a következő átlagérték-ábrázolásokon az abszcisszát névlegesen méretezzük, és mindegyikre egy tényezőt alkalmazunk. Ez azt jelenti, hogy az x tengelyen megjelölt pontok között természetesen a 44. sz
4.1. COPESENCE PARADIGM 4. ÉRTÉKELÉS Az értékeket mértük. Ennek ellenére a beírt értékek között összekötő vonal húzódott a grafikonok könnyebb olvashatósága érdekében. A magasság értékei mind szorosan egymás mellett vannak. A tesztalanyok alig észleltek különbségeket a magasság reprodukciójában. A hangosság mellett a magasság attribútum az egyetlen olyan hallás, amely nem mutat szignifikáns megfigyeléseket az együtt-jelenlét paradigmában. Ez vonatkozik a modalitási tényezőre is. Habár a hangszórókon is tapasztalható különbség a magas hangokban, ezeket a résztvevők nem biztos, hogy olyan könnyen meghallották. A hangszóró tényező esetében azonban az eredmény csak marginálisan jelentéktelen (p = 0, 080). A teszt szilárdsága sem különösebben magas, 0,539-nél. Ezért lehet, hogy a hangszórók várható hatása itt nem volt megtalálható. Az észlelési mélységek aránya a hangszóró tényező szempontjából igen jelentős eredményeket mutat (p