Digital humaniora - verktøy og infrastruktur
For å få mest mulig ut av datasettene konverterer vi disse til Linked Data. Vi baserer oss mest mulig på fri programvare, for ikke å binde løsningene unødig til proprietære og lukkede format. Infrastrukturen er noe som bygges opp med frie programvaremoduler rundt datasett standardiserte for Linked Data. Det tekniske fellesnivået for våre digitale fulltekstarkiv er ikke én bestemt programvareløsning, men at de behandles og drives i standardiserte format. Til en slik infrastruktur hører også kontinuerlig arbeid med datamodellering og datakonvertering.
- Datamodellering
- Konvertering og annotering
- Hovedprosessen er XSL-transformasjoner
- Verktøy er oXygen xml editor samt transformasjoner kjørt på server-stack
- Datavasking gjøres i OpenRefine
- Semantisk annotering gjøres med Pundit, samt Microsoft Excel og Google.docs
- Vi bruker Open Data Press
- Presentasjon av data
- Gjøres med LODSPeakr (se Marcus)
- En aktuell plattform er eXtensible Text Framework (se Ludvig Holbergs Skrifter)
- Utfyllende teknisk beskrivelse
For mer informasjon kontakt: dst@ub.uib.no