Mi a modell, és miért van rá szükségünk DHd-Blog

Az interdiszciplináris félreértésekről a DHd 2020-ban

A modellek matematikai képletek, amelyek segítségével tesztelhetem az adataim közötti kapcsolatokat. Ezzel az egyszerű modell-koncepcióval kvantitatív társadalomtudósként nőttem fel, sok vita nélkül. 2020-ig, a Digitális Humán Tudományok Egyesületének 7. éves konferenciájáig német ajkú országokban.

A konferencia kétnapos gyakorlati foglalkozásokkal kezdődik, amelyek során részt veszek az „Elfogultság az adatkészletekben és a gépi tanulási modellekben” workshopon. Null hipotéziseket statisztikai modellekkel és alternatív hipotézisekkel tesztelünk a számítási modellekben végzett szimulációk segítségével. A modellek matematikailag formalizáltak, ezért tökéletesen illeszkednek a saját modell-koncepciómhoz. A komfortzónámban maradok.

A szünetben más műhelyek résztvevőivel beszélgetek. Hirtelen olyan mondatok, mint: "Az TEI-vel modellezzük az adatainkat.", Vagy: "A modellünk egy neo4j adatbázis."
„Az annotációs szabványok és az adatbázisok nem modellek”, gondolom magamban: „Hol vannak a számítások?”. És mindenekelőtt: "Hol vannak azok a kutatási kérdések, amelyek alapján bizonyos számításokat végzünk, másokat hátrahagyunk?" Egy kicsit össze vagyok zavarodva.

Kedd este a Heinz Nixdorf MuseumsFórumban ülök és hallgatom Julia Flanders főelőadását a modellek létrehozásáról a digitális humán tudományokban (DHs). És hirtelen leesik a fillér. Lehet, hogy beszélünk egymás mellett? Hogy másképpen definiáljuk a „modellt”? Számomra a modell matematikai modell. Julia Flanders és sok más DHd-tag számára azonban ez adatmodellnek tűnik. Ez az adatfeldolgozás (pl. Annotáció) és az ábrázolás (adatbázis) szabványait jelenti.

Bár félreértésem megoldódott, a következő napokban sok előadás elgondolkodtat. Az a benyomásom, hogy sok időt és erőforrást fordítanak a modellek létrehozására, de a tartalommal kapcsolatos kutatási kérdések megválaszolása háttérbe szorul. Pontosan azok a kontextuális kontextusok érdekelnek minket, mint tudósokat. Hogyan viszonyulnak az irodalmi alakok egymáshoz? Mi köze van az egyik történelmi eseménynek a másikhoz? Miért változnak az idő múlásával a színházi előadások? Miért használja a zeneszerző az egyik motívumot és nem a másikat?
Adataink és matematikai modelljeink csak eszközök a tartalommal kapcsolatos kutatási kérdések megválaszolásához. Kutatási kérdéseinket ezért jobban figyelembe kell venni a modellek kidolgozása során.

Három olyan pontot szeretnék hangsúlyozni, amelyek a DHd 2020-ban megfogták a szemem a modellkezeléssel kapcsolatban.
(1) Miért különböztetik meg ritkán a modell kifejezést? Csak engem zavar a különböző modelldefiníciók, vagy mások számára?
(2) Miért építünk hatalmas adatmodelleket, amelyek elkészítése hosszú időt vesz igénybe? Ezért sokáig kell várnunk, mire végre megválaszolhatjuk kutatási kérdéseinket.
(3) Miért építünk hatalmas adatmodelleket azzal az állítással, hogy általánosan használhatóak? Nem tudjuk, valóban szükséges-e a nagy erőfeszítés a kutatási kérdéseink megválaszolásához.

Tehát mit kell tenni? Itt van a kis szubjektív, ideiglenes kívánságlistám.
(1) Konkrétaknak kell lennünk, amikor a modell kifejezést használjuk, és pontosan meg kell határoznunk, hogy a modell milyen típusú. Ez megkönnyíti a kommunikációt egy olyan interdiszciplináris területen, mint a DH-k.
(2) Kis méretű alkalmazás-specifikus adatmodelleket kell felépítenünk, mielőtt hatalmas, univerzális adatmodellekkel kezdenénk. A kezdeti kutatási kérdések az adatmodell kicsinyített változatával azonnal megoldhatók.
(3) Az adatokat és a matematikai modelleket inkrementálisan és iteratívan kell kidolgoznunk, ahelyett, hogy egyszerre építenénk őket (vízesés elve). Minden iteráció után a modell felhasználható egy adott kutatási kérdés megválaszolására. Attól függően, hogy ez mennyire működik, a modell folyamatosan adaptálódik. Így akadályozzuk meg, hogy egy hatalmas, fáradságosan létrehozott modell haszontalan legyen egy kutatási kérdés megválaszolásában.

Következtetés:
Először is, a DH-k egy interdiszciplináris terület, ahol különböző modellkifejezések keringenek. Ezért különbséget kell tennünk az adatok és a matematikai modellek között.
Másodszor, tudósok vagyunk, mert a kontextus kapcsolatai érdekelnek minket. Ha az adatmodellek létrehozására összpontosítanánk, akkor szoftverfejlesztőkké vagy adatbázis-kezelőkké válnánk. A modellezés nem öncél, hanem a kutatási kérdések megválaszolásának eszköze.

2020 DHd utazási ösztöndíjasok - áttekintés és hozzájárulások | DHd blog 2020. március 12

[…] Ramona Roller (ETH Zürich) - @ramona_rollerMi az a modell, és miért van rá szükségünk? In: DHd blog, 2020. március 12., https://dhd-blog.org/?p=13186. [...]

Frederike Neuber, 2020. március 12

Köszönöm ezt a gyönyörű cikket a "modellek" témában, amelyre azonnal áttérek.

Véleményem szerint az adatmodellek nem korlátozódnak az adatfeldolgozás eszközeire. A modell kialakítása segíthet (interdiszciplináris) munkacsoportokban a komplex területek közös megértésének megteremtésében. Magát a modellezést heurisztikus folyamatként értem, amelynek során az objektumról (pl. Szöveg vagy kép) meglévő ismereteit kibővítik, megkérdőjelezik és kiélezik. Ebben a tekintetben a * modellezést a kutatás részének tekintem *, amelyben egy tárgyról szóló ismeretek gazdagodnak és elméletek alakulnak ki. Ezenkívül a modellek képezik a végső soron értékelhető adatok alapját, az értékelés eredményei (többek között) az előző modellezés szempontjából.

Pontosabban a véleményem a modellezéssel kapcsolatos pontjaival/kívánságaival kapcsolatban:

(1) Igen, meg kell határoznunk, hogy milyen modellre gondolunk. Közös megegyezés felmerülhet például a "modell kifejezés" koncepcionális modelljén keresztül. Igen, ez most nagyon meta . de miért ne?!

(2) Az adatmodelleknek nem szabad önmagukban célt szolgálniuk, hanem meghatározott célt kell kitűzniük és ezt konkrétan feltérképezniük. A digitális források világában az adatmodelleknek összekapcsolhatónak és újrafelhasználhatónak is kell lenniük, ezért van értelme a szabványok használatának és az általánosítás követelményének. Ha mindenki csak magára gondol a modellezés során, munkánk hosszú távon - lazán fogalmazva - a macskának szól. Példa: A hatalmas TEI-modell fejlesztésének köszönhetően a különböző projektek kódolt szövegeit viszonylag kevés erőfeszítéssel lehet összesíteni vagy kicserélni. Számos szöveges korpusz, amely ma elvégzi az Ön által vágyott értékeléseket, kisebb korpuszokból áll (véleményem szerint ugyanez vonatkozik a képi adatbázisokra stb.) valaha is közel kerül a nagy adatokhoz, és felteszi az igazán izgalmas kérdéseket? Véleményem szerint a TEI jó példa arra is, hogy a szövegekkel kapcsolatos ismereteket meghatározták és egyértelművé tették (mindig azt mondom, hogy a TEI valódi értéke a szöveggel és a definíciókkal kapcsolatos gondolatok, kevesebb a kódoló szókincs).

(3) Az iterációnak van értelme, és azt is gondolom, hogy a nagy adatmodelleket alulról felfelé, nem pedig fentről lefelé kell létrehozni.

Személy szerint a „modellezés” szempontját alulreprezentáltnak tartottam az idei DHd konferencián. Ennek oka lehet, hogy mostanra kritikus tömegű adat és eszköz áll rendelkezésre a kutatáshoz, és az adatok létrehozása háttérbe szorul. Mindazonáltal a modellezés szempontját a DH fontos részének és kritikus folyamatnak tekintem, amelyhez tudományra van szükség (. amely kutatási szoftver mérnököknek vagy adatbázis-kezelőknek is lehet). Különösen azokban a projektekben, amelyekben a bölcsészek és az informatikusok együtt dolgoznak, gyakran szükség van modellezési ismeretekkel rendelkező DH-s személyre, hogy a lehető legjobban közvetítse a szakterületet és a kutatási kérdést, és formalizálja a megfelelő formátumban vagy szókincsben. A digitális humán tudományok szinte minden vállalata, beleértve a nagy mennyiségű szöveg értékelését a kutatási kérdések megválaszolására, áll vagy elbukik az adatbázis minőségével, ami viszont annak modellezéséből adódik. Ezért sok szövegértékelő előadáson gyakran hiányzott az adatbázis kritikus áttekintése.

Tessa Gengnagel, 2020. március 12

Köszönöm ezt az élménybeszámolót! Időkorlátok miatt csak néhány rövid megjegyzésem van ehhez (valójában néhány mondatot kell itt részleteznie és tisztáznia kell néhány félreértést):

1. Ahogy a neve is sugallja, a digitális humán tudományok a humán és a kultúratudományokra összpontosítanak. A társadalomtudományok között már most is nagy a szakadék. Azt mondom, hogy minden ítélet nélkül, ez csak ilyen. A félreértés tehát nemcsak magukban a digitális bölcsészettudományokban van eltemetve, hanem a különféle speciális kultúrákban, vagyis néhány nagyon alapvető módszertani és ismeretelméleti, ha nem is általános tudományos elméleti vitában. Ezeket nem helyezheti át a digitális humán tudományokra, és nem is oldhatja meg bennük.

2. Különösen a „modell” és a „modellezés” témájáról folytatott vita régi hobbilova a DH-ban, még akkor is, ha Willard McCarty 2005 óta elméleti szinten nem történt érdemi hozzájárulás. A kifejezést gyakran nem árnyaltan használják, ez igaz és ez problémát jelent. De Nelson Goodman már a „Művészet nyelvei” (1968/1976) című munkájában megjegyezte: „A népi és tudományos beszédekben kevés kifejezést használnak inkább a modell, mint a modell. A modell megcsodálható vagy utánozható, egy minta, egy eset, egy típus, egy prototípus, egy minta, egy makett, egy matematikai leírás - szinte bármi a meztelen szőkétől a másodfokú egyenletig - és viselheti amihez a szimbolizálás szinte bármilyen viszonyát modellezi. ”- Ez sem egy DH-specifikus jelenség vagy probléma. A terminológia ezen meghatározása meglehetősen pandémiás sok tantárgyban, és csak részben észrevehetőbb a DH-ban, mert vagy ha nincs közös technikai alap a beszélgetőpartnerek, azaz az alaptantárgyak között, és nincs közös horgony a DH nyelvben, Módszertan van megadva.

3. Azt mondani, hogy egyrészt vannak matematikai modellek, másrészt vannak olyan adatmodellek, amelyek messze elmaradnak a jelöléstől, és nem írnak le egyrészt egy tudományos és általánosan érvényes megértést, másrészt a DH megértést sem. Sajnos erre most nem térhetek ki részletesebben, de értékesnek tartom, hogy ez a blogbejegyzés ismét rávilágít a tudományos kommunikáció problémájára, és ebben egyértelműen a DH a hibás.