Ein wohlerzogenes Dokument ist ein elektronisches Dokument, welches sucher- und benutzer-freundlich ist - digi-libris

Direkt zum Seiteninhalt

Hauptmenü:

Ein wohlerzogenes Dokument ist ein elektronisches Dokument, welches sucher- und benutzer-freundlich ist

Über
Warum?
Open Access, der Wandel der Bibliotheken vom physischen Ausleiher zum digitalen Wissensvermittler, neue Überpüf- und Vetriebsmodelle, selbstverlegen und der akademische Druck zu publizieren und zu zitieren führen dazu, dass eine immer gewaltigere Menge von wissenschaftlichen, professionellen und anderen Dokumenten über das Internet (oft kostenlos) verfügbar wird. Die Übersicht zu behalten wird daher zu einer echten Herausforderung.

Sucherfreundlich
Um diese Masse von heruntergeladenen Inhalten zu organisieren, müssen sich die Dokumente ohne oder nur mit minimalem manuellem Eingriff in eine Wissensbasis eingliedern lassen. Dazu müssen sie sinnvolle, eingebetteten Metadaten enthalten, welche von Bibliothekaren, Inhalts-verantwortlichen und Privatpersonen (einschließlich einer stetig wachsenden Anzahl von nicht-wissenschaftlichen Lesern) mit geeigneter Software (z.B. digi-libris Reader) ausgewertet werden können, damit diese automatisch klassifiziert und für die Suche innerhalb einer Sammlung von Dokumenten indiziert werden.
Ein wohlerzogenes PDF oder EPUB Dokument, welches benutzer- und sucher-freundlich ist, bietet Vorteile für den Autor, den Verleger und den Benutzer:
      • Artikel sind leichter zu finden und zu referenzieren
      • und werden leichter in der persönlichen Wissensbasis wieder gefunden
      • interdisziplinäre Vernetzung und der Austausch von Arbeiten wird erleichtert
      • Autoren werden vermehrt aufgefunden und erhöhen ihren Bekanntheitsgrad
      • Zitate und Literaturangaben können off-line erzeugt werden, nach Verweisen im Internet zu suchen entfällt (was für selbst-verlegte Artikel, unveröffentlichte oder entstehende Arbeiten, Blogs und redaktionelle Inhalte ohnehin kaum möglich ist).
Benutzerfreundlich
Wissenschaftliche Abhandlungen, Monographien, Hand- und Fachbücher und alle mehrseitigen Dokumente, welche man nicht wie ein literarisches Werk in einem Zug von Deckel zu Deckel liest, sollten leicht zu lesen und zu bedienen sein. Sie sind in einem offenen Format und benötigen keine teure Lesesoftware für die Darstellung der Inhalte und sind einfach zu durchsuchen.
Sie haben Lesezeichen (in Formaten die dieses zulassen wie z.B. PDF in Acrobat oder Adobe Reader), ein interaktives Inhaltsverzeichnis, welches beim Anklicken auf die richtige Zielseite wechselt und möglichst einen Index, Querverweise und Links zu externen Ressourcen. Selbst urheberrechtlich- oder Passwort-geschützte Dokumente erlauben dem Empfänger, Teile auszudrucken und zu kopieren und eigene Kommentare anzufügen. Und sie enthalten unverschlüsselte Metadaten.

Dokumente interaktiv machen und Metadaten einbetten bedeutet nicht unbedingt Mehraufwand, wenn dies von Anfang an richtig eingeplant und ein paar einfache Regeln (z.B. konsequente Verwendung von Stilen) befolgt werden.
Ein Autor, welcher einen Monat an seinem Artikel gearbeitet hat, kann sicherlich noch weitere 10 Minuten aufbringen um ein paar Stichwörter und eine kurze Beschreibung aufzuschreiben. Der Schriftsetzer, der ohnehin ein Inhaltsverzeichnis erstellt, muss vor der PDF-Ausgabe nur ein einziges Kästchen anklicken und der Verleger kann leicht eine XMP Datei mit Metadaten in das endgültige Dokument importieren.
Sucherfreundlich
heisst, ein Dokument enthält brauchbare, eingebettete Metadaten, welche es Bibliothekaren, Inhaltsverantwortlichen und dem einzelnen Empfänger erlauben, ein Dokument ohne oder mit nur minimalem analytischem Aufwand zu klassifizieren, bzw. in seiner persönlichen Datenverwaltung einzuordnen.
Universitäts- und öffentliche Bibliotheken legen die Metadaten von Dokumenten meistens in separaten Katalogen oder Datenbanken ab, um diese besser und einheitlicher verwalten zu können. Doch das Eine schliesst das Andere nicht aus und so erscheint es sinnvoll, dass die Metadaten auch jedem einzelnen Dokument mitgegeben werden, damit dritte, welche eine eigene Wissensbasis erstellen möchten, dieses auch offline und losgelöst von einem Katalog, lokal abspeichern, verwalten und ggf. einen eigenen Katalog erstellen können. Für den Lokalgebrauch dürfte in den meisten Fällen die Anlage von einfachen Attribut/Wort-Paaren genügen.

Sucherfreundlich wissenschaftlich publizieren
Die Maschinenlesbarkeit von Metadaten wird im Hinblick auf den globalen Einfluss der Digitalisierung und Open Access im sich verändernden Publikationsumfeld  immer wichtiger. Die meisten wissenschaftlichen Publikationen werden über das Internet verbreitet, was für ihre Verarbeitung und systematischen Archivierung eine echte Herausforderung darstellt. Um diese Internet-Inhalte zu organisieren, sollten wissenschaftliche Arbeiten leicht klassifizierbar sein, d.h. eingebettete Metadaten enthalten. Dies erleichtert die Arbeit der Bibliothekare, Verwalter von digitalen Inhalten und nicht zuletzt auch diejenige von normalen Benutzern, da
      • Quellen werden automatisch klassifiziert und für die Suche in einer Sammlung von Dokumenten indexiert
      • an Zeitschriften eingereichte und/oder publizierte Artikel sind einfacher zu finden und zu zitieren
      • interdisziplinäre Vernetzung und der Austausch von Informationen wird erleichtert
      • Autoren werden vermehrt sichtbar
      • keine Notwendigkeit, zitatrelevante Metadaten über das Internet ausfindig zu machen, besonders vorteilhaft für Studenten, denen Geduld oder Wissen fehlt, wie solche  in Repositorien ausfindig zu machen sind
      • Zitate und bibliographische Referenzen können off-line erzeugt werden, ein Muss für selbst veröffentlichte oder noch in Arbeit befindliche Inhalte.

Metadaten Standarde
Dutzende von Metadaten-Standards sind derzeit verfügbar, die meisten auf eigenen Vokabulaien aufgebaut. Unglücklicherweise ist keines dieser Standards universell einsetzbar. Ein Student sucht Daten um Zitate zu erzeugen, während ein Ingenieur seine Sammlung von Papieren nach bestimmten technischen Kriterien durchsucht. Informationen über Buchverlage, Bilder oder Gemälde Urheberrechte von Fotografen, Komponist/Orchester/Sänger oder Architekt der alten Pyramiden sind alles wesentliche Metadaten und Attribute der betroffenen Elemente, aber sind nicht in jedem Standard vorgesehen. Verschiedene Benutzer suchen nach verschiedenen Kriterien. Kunstkritiker, Veterinäre, Physiker und Juristen laden oft Inhalte aus Webseiten andere Disziplinen herunter und sie würden es vorziehen, dies ohne manuelle Anpassung und nur mit Hilfe eingebetteter Metadaten bei sich automatisch einordnen zu können.

Verlage, Universitäten und öffentliche Bibliotheken sind gefordert, ihre Dienstleistungen zu verbessern und sich aktiver an der wissenschaftlichen Forschung zu beteiligen indem Sie disziplinübegreifende Metadaten zur Verfügung stellen. Die Lösung für dieses Problem sollten universell sein. Ich schlage vor, eine individuell erweiterbarer und universell einsetzbar Metadatensatz, der auf den weit verbreiteten Dublin Core-Standard (minus Verfeinerungen) aufbaut, aber zusätzlich eine unbegrenzte Anzahl von kunden Attribut / Wert-Paare für die Daten. Betrachten Sie es als Alternative Dublin Core Applikationsprofil (DCAP) für Personen, oder auch nicht haben kann, um auf einem einzigen Standard, der von einer übergeordneten Institution ausgestellt verlassen. Für den Austausch von Metadaten mit Dritten auf Adobe® XMP-Technologie beruht.

Wer soll liefern Metadaten und wer soll sie einbetten?
      • Die Verantwortung für die Aufnahme von nützlichen Metadaten liegt schliesslich beim Herausgeber. Allerdings sollten auch alle anderen an der Entwicklung und Verteilung von Dokumenten Beteiligten, Metadaten zu den letzten Versionen ihrer Dokumente hinzufügen:
      • Autoren kennen ihr Thema am besten und sollten relevante Tags für den Abstrakt und Zitierungen vorschlagen. Im Idealfall erstellen sie eine Liste und rechen diese zusammen mit ihrem Manuskript ein. XMP-Sidecar-Dateien sind wahrscheinlich die beste Option, um die Integrität ihrer Metadaten zu gewährleisten
      • Rezensenten können Änderungen am Titel und der Beschreibungen neben sachliche Anpassungen vorschlagen
      • Redakteure und Übersetzer können unterschiedliche Daten beisteuern, sowie geeignete Schlüsselwörter für die Optimierung von Suchmaschinen
      • Verlage können Metadaten anzupassen und spezifische hinzu fügen, wie z.B. Creative Commons-Lizenzen, Urheberangaben, Daten der Einreichung und Annahme, ISSN / DOI Kennungen etc.
      • Bibliotheken und Anbieter von Inhalten, die sowieso Metadaten für ihre Kataloge zu sammeln, sollten sicherstellen, dass jedem vertriebenen Dokument nützliche Metadaten für die automatische Klassifizierung, Indexierung und Wiederauffindbarkeit mitgegeben werden.

PDF-Dateien mit Metadaten versehen
Die XMP™ Technologie von  Adobe® eignet sich für die Einbettung von Metadaten am besten. Dies ist das Format, welches bereits in PDF-Dokumenten implementiert ist. Es enthält Platzhalter für Dublin Core-Elemente und andere Standard-Meta-Typen wie Dicomed für medizinische Anwendungen, IPTC der International Press Community, welches es Fotografen erlaubt, ihre Urheberrechte zu sichern und Zitat Variablen, welche nicht durch DC abgedeckt sind.
      • Es ermöglicht auch den Einsatz anderer institutioneller Sätze mit ihren eigenen Namensräumen sowie ein unbegrenzte Anzahl von benutzerdefinierten Attribut/Variablenpaare, die beliebig verwendet werden können und eigene Berschreibungen und Definitionen zulassen. 
      • Um Metadaten anzuzeigen, zu bearbeiten und zu exportieren, wird eine geeignete (kostenlose oder kostengünstige) Software vorausgesetzt (z.B. digi-libris Reader). 
      • Um Metadaten in ein PDF-Dokument einzubetten, verwendet man Acrobat® (Exe, nicht nur den Reader) oder ein anderes PDF-Tool, welches XMP-Dateien importieren kann.
 
digi-libris Reader ist ein persönliches Organisationswerkzeug für den multitasking Benutzer von heute, der in einer digitalen Welt lebt und arbeitet. Dies ist auf Metadaten ausgerichtete Software, die automatisch Ihrer Sammlung von Dateien und Dingen klassifiziert. Dokumente und Datensätze aller Art, Fotos, Musik, Videos und Web-Links werden in einer gemischten Liste zusammengefasst und deren wichtigsten Eigenschaften auf einen Blick angezeigt. Physische oder virtuelle Elemente können manuell hinzugefügt werden. Es ist kostenlos und es ist sehr einfach zu bedienen: Ziehen Sie einfach eine Datei oder einen Web-Link in das Hauptfenster und es wird automatisch klassifiziert.
Zurück zum Seiteninhalt | Zurück zum Hauptmenü