Ott következik az Arcanum, ahol a világ legnagyobb keresőmotorjának véget ér a tudása

Arcanum Adatbázis Kiadó
Vágólapra másolva!
Biszak Sándor alapító és cégvezető mesélt a családi vállalkozásként működő, és az elsősorban a több száz évre visszamenőleg fellelhető dokumentumok digitalizálásával foglalkozó, mesterséges intelligenciát is felhasználó Arcanum csodabirodalmáról, amely lassan kinövi a többemeletes családi ház munkahelyi és raktározási kereteit.
Vágólapra másolva!

Az archiválás mesterei

Az Arcanum szolgáltatása bővítéseként sajtófotó-digitalizálással is foglalkozik újabban.

Jelenleg a már megszűnt Fővárosi Fotóvállalat több mint kettőszázezer fotónegatívját viszik fel a térbe

– méghozzá speciális fényképezőgéppel.

Archiválás speciális fényképezőgéppel Fotó: Csudai Sándor - Origo

A legújabb futó projekt a román nyelvű dokumentumok feldolgozása. Ezek Romániából érkeznek, a legrégebbi példányok a XIX. század közepéből valók.

Az Arcanum egy már befejezett projektje valóban újításnak tekinthető, hiszen

szolgáltatásaikkal elindultak a videókazetták archiválása felé.

A Moholy-Nagy Művészeti Egyetem hatalmas vhs, digi-cam, svhs gyűjteményét ebben a budai családi házban digitalizálták.

Látogatást tettünk a negatív fotó tekercseket feldolgozó szobában is.

Negatívok digitalizálása Fotó: Csudai Sándor - Origo

Ahogy arról Biszak Sándor felvilágosított bennünket, léteznek egyedi, egykockás negatívok és tekercses negatívok. Az utóbbira specializált gépbe be lehet tenni akár egy 36-os tekercset is, amit az feldarabol és archivál. Ezt a gépet azonban tíz éve nem gyártják már. Egy másik géppel 6X6-os diafilmeket lehet digitalizálni.

Varázslat a térképekkel

Az Arcanum futó projektjei közül az igazgató a térképek digitalizálására a legbüszkébb.

Már XVIII. és XIX. századi korhű és pontos térképeik is vannak (főleg a későbbi Osztrák-Magyar Monarchia területeiről, és természetesen a későbbi független Magyarországról).

Amiben a vállalat egyedülállót alkotott, hogy egy adott település, falu, város régi és jelenlegi térképét egy idővonal segítségével össze lehet vetni egymással. Ha például rákeresünk a XIX. századi Maglódra, egy idővonal megmutatja, hogy ez a település hogyan nézett ki a különböző korszakokban.

Térképbirodalom Fotó: Csudai Sándor - Origo

Ezenkívül megvalósították a budapesti "időgépet" is.

Ezzel a módszerrel teljesen egyértelműen nyomon követhető, hogy a történelmi időszakok során mennyit fejlődtek a települések, városok és falvak.

Ezt a technikát a világon csak nagyon kevesen ismerik és használják. Az ELTE Űrtudományi Tanszék nagy segítséget jelentett ennek a bravúrnak a megvalósításában. Megjegyzendő, hogy az Amerikai Egyesült Államok 1880-as térképei csak az Arcanum felületein tekinthetőek meg.

Még ezt is lehet fokozni, hiszen

az időgép segítségével a házakat 3D-ben is feltüntették

– nyomon követve az ezekben esetleg bekövetkezett változásokat -, amikről számos fontos adatot is feltöltöttek (mikor épült, kik voltak a tulajdonosok, adásvételi szerződések, tulajdoni lap, építészeti tervek). Mindezek mellett akár az adott falu, város lakóinak születési anyakönyvi kivonatait is meg lehet nézni. Itt a teljes magyar oklevélállomány megtalálható a levéltáraknak köszönhetően. A latinul íródott dokumentumok hiteles fordítását is elolvashatjuk.

A térképeken jól követhető a településfejlődés Fotó: Csudai Sándor - Origo

Egy forradalmi újítás: a Hungaricana

Az Arcanum egy másik nagy projektje a Hungaricana. Ezen belül

a képcsarnok például nagyméretű festmények digitalizált verzióit tartalmazza, sőt azok minőségét is felfejlesztik

(sokszor így élesebbé válik a mű, mint ha a múzeumban látnánk).

Szinte életre kelnek a festmények Fotó: Csudai Sándor - Origo

A festmény címe és alkotója mellett a benne szereplők neveire is rá lehet keresni az arcfelismerő, mesterséges intelligencia technikával. A képeket egy speciális fényképezőgéppel és lámpával (a fényhatás miatt) fotózzák le az archiválás előtt. Az olajfestményeknél például polárfény megvilágítást alkalmaznak, hogy ne legyen olyan fényes az alkotás az adatbázisban. Ezzel a digitalizálással a legapróbb részletek is jól láthatóvá válnak. A képeket gigapixeles felbontásban archiválják.

A Hungaricana-ra régi korok tárgyainak (például egy puska) fotóit is feltöltik, amiket aztán az oldalra látogató előfizető a speciális fotózási technikának köszönhetően teljesen el is forgathat.

A Hungaricana-n van továbbá húszezer órányi hanganyag is – ezek magyar népzenék kottákkal. De megtalálható ott milliós darabszámú képeslapgyűjtemény is.

A mesterséges intelligencia a digitalizálás szolgálatában

A mesterséges intelligencia technikája többféleképpen is segíti a digitalizálást: arcfelismeréssel a festményeknél, a népdalok szerzőinek meghatározásánál, de képes megkülönböztetni egymástól az intézmény, utca és személyneveket. Például felismeri, hogy Petőfi Sándor az adott helyen intézményt, utcát vagy magát a költőt jelöli. Ahogy arról az Origo már beszámolt, a Tudománytár arcfelismerő rendszerének segítségével egy-egy fénykép alapján eljuthatunk azokhoz a cikkekhez, amelyek a fényképen szereplő nevéhez köthető, vagy ő maga szerepel rajtuk. A vállalat egyébként az Amazon arcfelismerő rendszerét is használja.

Az Arcanum legnagyobb „vetélytársa" az archiválás, digitalizálás és ezek egyszerű kereshetősége vonatkozásában a Google keresőmotorja. A magyar digitális adatbázis az alapító véleménye szerint egyedülálló az adatbázisok piacán, mivel egyszerre rendelkezik elképesztő méretű és folyamatosan bővülő összeszedett és katalogizált magyar sajtóanyaggal, térképgyűjteménnyel és a valóban újdonságnak számító, mesterséges intelligencián alapuló arcfelismerő rendszerrel. Ezekkel olyan megoldásokat kínál a felhasználóknak, melyek bizonyos vonatkozásokban többek és előremutatóbbak, mint a világcég megoldásai.