2018. december Kutatási jegyzetfüzet a Francia Nemzeti Könyvtárban

A CORPUS projekt részeként, amely a Francia Nemzeti Könyvtár 2016–2019-es négyéves kutatási tervében szerepel, a „Penser, classer, modeler. A Foucault Fiches de Lecture "projekt példájára november 13-án délután került sor a François-Mitterrand helyszínen. A szakértelem megosztásának logikájába szerveződve célja az volt, hogy a Foucault Fiches de Lecture projekt konkrét példájának felhasználásával reflektáljon a modellezéssel és az adatok gazdagításával kapcsolatos kérdésekre, és általánosabban arra, hogy a digitális eszközök mit hozhatnak a kutatási munkában levéltár korpuszán.
A Foucault Fiches de Lecture (FFL) projekt egy hároméves ANR projekt, amelynek célja egy platform segítségével digitalizálni, online feltölteni, indexelni, leírni és gazdagítani Michel Foucault kézzel írott olvasmányjegyzeteit.
A PSL és az ENS Lyon közötti partnerség gyümölcse, az FFL projekt, a különböző kutatólaboratóriumok (ArchiNum, Triangle, CAPHÉS és ITEM) csapatainak összefogásával, a humán és társadalomtudományi kutatók és a kutatómérnökök közötti szoros együttműködésen alapul.
Az olvasókártyák BnF általi digitalizálását követően (a BNF kéziratok osztálya által 2013-ban megszerzett NAF 28740 gyűjtemény) ma, a projekt első évének végén a mérnökök által kifejlesztett prototípus platform számos funkciót kutat, és új kutatási perspektívákat nyit meg. Először lehetővé teszi a digitalizált ívek megtekintését: jelenleg a projekt részeként digitalizálandó 14 000-ből mintegy 5700, a BnF-nél tartott gyűjtemény 20 000 lapjából pedig kb. Lehetőséget ad a kutatóknak ezen fájlok leírására és feljegyzésére is: minden felhasználó képes megosztott metaadatokat készíteni és privát jegyzeteket is rögzíteni.
A Foucault Reading Card (FFL) platform prototípusa
A szemantikus webes technológiákon alapuló platform lehetővé teszi ezen információk gazdagítását egy mashup és igazítási rendszer révén a bibliográfiai és életrajzi adatokkal a data.bnf.fr. Ezenkívül minden rekordról átírást ad. Ezt az automatikus átírást a Transkribus szoftver segítségével nyerik, amely a mesterséges intelligencia technológián alapul, az ideghálózatokon keresztüli tanulási szakasz után lehetővé teszi a kézírás felismerését, valamint a kulcsszavakkal történő keresést. Annak ellenére, hogy gondos soronkénti munkára van szükség, a csapat átlagosan 92% -os kézírás-felismerési sikert aratott, amikor gyakorolták. Végül a kutatómérnökök egy feltérképezési funkción dolgoznak, amely lehetővé teszi a kutatók számára, hogy grafikusan megjelenítsék a fájlok közötti kapcsolatokat, és ezekből a kapcsolatokból vizualizálják a fogalmak és a szerzők hálózatait. A projekt célja tehát tudásbázis létrehozása Foucault forrásai mellett, valamint a filozófus által használt szókincs terminológiai tárháza.
Minta átírás
A papírról a digitális archívumra való áttérés a kutatók számára új megértési módot jelent. A fájlok és a külső erőforrások közötti hipertext-kapcsolatok létrehozásának, valamint az adatok megjelenítésének lehetősége a projekt egyik fő eszközét képezi, amelynek célja tehát a kutatók számára nyitott munkamodell felajánlása, de elméleti reflexió is Foucault munkamódszereiről és archívumairól, munkáiról. " könyvtár".
A meglévő adatok újrafelhasználása
Az olvasókártyák ezen korpuszának hibrid státusza van: több, mint szöveg, bibliográfiai adatbázist alkot. Anyagosságában a több mint harminc év alatt felhalmozott kártyákat tematikus sorrendben dobozokba és mappákba rendezik. Szisztematikusan ezekre a fájlokra Foucault hivatkozásokat és attribútumok fogalmakat jegyez fel. A platform virtuális dimenziójában ezek az emberekre, dokumentumokra és fogalmakra történő hivatkozások, amennyire csak lehetséges, a data.bnf.fr fájlhoz igazodnak, vagy rámutatnak a BnF általános katalógusára, vagy más könyvtári katalógusokra, ha a hivatkozás nincs on data.bnf.fr. Ehhez a strukturált metaadathoz hozzáadódnak a kutatók által készített kommentárok (például személyes megjegyzések vagy hivatkozások hozzáadása) és a fájlok teljes átírása.
Hogyan lehet akkor a lehető legjobban kihasználni ezeket a különböző típusú adatokat (strukturált metaadatok, kommentárok és átírások)? Ki lehet-e egészíteni a data.bnf.fr fájlon keresztüli adatdúsítást ugyanazzal a munkával a fájlok átirataiból, a teljes szövegből? ?
A Cours au Collège de France (témák és személyek) indexeit egyesítették egybe (a 10 tanfolyam indexe 200 oldalt képvisel), de csak a munka egy részét írják le (1970-1984), és túlságosan specializáltak a tanfolyamok témái; ezután a csapat kíváncsi arra, hogy létre lehet hozni egy tezaurust fogalmakból, vagy egy meglévő tezaurust felhasználni a Foucault által használt fogalmak leírására, hogy ellenőrizzék az új entitások létrehozását és javítsák a szöveges adatok minőségét.