PDF, EPUB, HTML und LaTeX werden direkt von digi-libris eingelesen - digi-libris

Direkt zum Seiteninhalt

Hauptmenü:

PDF, EPUB, HTML und LaTeX werden direkt von digi-libris eingelesen

Produkte
Die folgenden vier Dokumentenformate werden direkt von digi-libris unterstützt, d.h. ihre Metadaten, falls vorhanden, werden automatisch erkannt und dienen der Klassifizierung, der Indexierung und der Anzeige des Dokuments.
Alle anderen Dokumente (z.B. aus Textverarbeitung, Tabellenkalkulation, Präsentations-Anwendungen und maschinenerzeugte Daten ) können natürlich auch in die digi-libris Liste eingetragen werden und diejenigen, für welche ein Programm auf Ihrem Computer installiert ist, können Sie auch mit einem Doppelklick öffnen. Um diese Dokumente zu klassifizieren, müssen Sie die entsprechenden Metadaten manuell eingeben oder eine begleitende XMP-Datei einlesen.

digi-libris Reader kann ausserdem dMeta-Pakete (= Daten + Metadaten-XMP siehe dort) lesen und schreiben, die wie Dokumente mit eingebetteten Metadaten behandelt werden und welche mit jeder Art von Datei, einschließlich forschungs-relevanten Datensätzen, verwendet werden kann.
PDF ist das beliebteste Dateiformat für den Austausch von elektronische Dokumenten. Es gibt mehrere Anwendungen, die Dateien in diesem Format erzeugen können, vor allem Acrobat® und anderen Adobe-Programmen. Während Acrobat und sein PDF-Writer die Grund-metadaten (Titel, Autor, Thema und Stichwörter) eingegeben werden können, welche auch in seinem fortschrittlichen Meta-Daten-Viewer als geeignete DC-Elemente angezeigt, werden. DC-Terms und andere Metadaten Sammlungen werden nicht unterstützt, wenngleich auch diese anerkannt / toleriert werden, wenn diese mit Werkzeugen von Drittanbietern (wie digi-libris Reader) korrekt erstellt und eingebttet werden.
Es enthält auch einen eigenen Satz von XMP-Metadaten, aber kein Tool, um diese einfach in Acrobat selbst manipulieren zu können. Alles, was Sie tun können, ist alle erweiterten Meta-Tags zu / von einem * .XMP Sidecar-Datei zu exportieren bzw. zu importieren.
Ein weiteres Problem mit PDF ist Verschlüsselung und der Passwortschutz. Während digi-libris die vier Grund Tags in den meisten Fällen zu lesen im Stande ist, ist es nicht immer in der Lage, alle anderen Metadaten, welche möglicherweise enthalten sind, zu entziffern.
Mit geeigneter Software können sowohl DC-Elemente, DC-Terms, zitat-relevante Tags und benutzerdefinierte Attribut / Wert-Paare, sowie alle anderen, vordefinierten Schemata (DICOMED, IPTC, TIFF etc.), in offenen PDF-Dateien ausgezogen und bearbeitet werden.
EPUB ist das Standard Format für E-Books, wenngleich es bereits davon verschiedene Abarten gibt, von denen einige vielleicht proprietären oder verschlüsselt sind (DRM), welche das Lesen der eingebetteten Metadaten unmöglich machen kann.
Einige Layoutprogramme (z.B. InDesign) können dieses Format direkt erzeugen, die meisten bekannten E-Book Reader können damit umgehen und in einige Schulen in Kalifornien ist es sogar obligatorisch und eBook-Readers werden dort kostenlos verteilt.
Eine EPUB-Datei ist im Wesentlichen ein strukturiertes ZIP-Paket, welches alle Elemente eines Buches in HTML oder Nur-Text-Format enthält. Die Norm beinhaltet auch einen Zeiger auf eine separaten Textdatei (in der Regel als content.opf) in welcher alle Metadaten gespeichert sind.
Die meisten Beispiele, die wir gesehen haben, setzen die Metadaten als dc:Variablen richtig ein.
Mit geeigneter Software können die eingebetteten Metadaten problemlos interpretiert und modifiziert werden.
HTML ist in Bezug auf eingebettete Metadaten das unkontrollierteste Format, denn es gibt buchstäblich Tausende von Anwendungen, die HTML Dateien erzeugen können, wobei Struktur, Syntax und der Einsatz von CSS und Javascripts sehr unterschiedliche Resultate erbringen.
Während die meisten die Metadaten als <meta name = xxx> im <head> Block anbringen, haben wir die wildesten Exzesse von dem, was nach dem Gleichheitszeichen folgt gesehen.
Bei weitem nicht alle verwenden <DC ... oder <dc.terms ... und oft diejenigen, die dies tun, gebrauchen Phantasie Bezeichnungen ihrer eigenen Wahl. Vor kurzem haben wir benutzerdefinierte Tags mit Facebook und Twitter-Präfixe gesehen, welche oft zitat-relevante Werte enthalten. Auch verwenden dies oft andere Vorzeichen, z.B. <meta.option=...>
Geeignete Software sollte auch ein Werkzeug beinhalten, welches das Angleichen ungewöhnlicher Meta-Namen an gültige dc.elements, dc.terms, Zitat Variablen oder benutzerdefinierte Wert / Attribut Paare ermöglicht und zwar noch bevor diese in eine Sammlung integriert werden.
Ein weiteres Problem mit HTML-Dateien ist, dass viele virtuell oder auf spontan und programmatisch erstellt werden, z.B. als Antwort auf eine Anfrage, und viele sind das Ergebnis von mehreren Seitenumleitungen und sind deshalb nicht unbedingt die Datei, die der Benutzer dachte, angeklickt zu haben. Dies geschieht in der Regel auf Seiten mit Rahmensets oder Master-Seiten mit vielen Links aufgebaut sind.
Geeigneten Software sollte es ermöglichen Sammlungen und Inhaltsverzeichnisse zu erstellen, welche ebenfalls Metadaten von virtuellen Dateien entgalten können.
Da das Herunterladen Dateien mit einer Länge von Null ergeben kann, ist es empfehlenswert, dass alle Downloads überprüft werden, bevor sie definiv an einer Sammlung hinzugefügt werden.
Aus diesem Grund zeigt digi-libris alle Dateien und deren Pfade an, welche mit einem einzigen Klick auf einen Link geöffnet wurden. 
LaTeX ist ein Satzprogramm, welches vor allem in wissenschaftlichen Kreisen für seine Fähigkeit, komplexe mathematische Formeln darzustellen, verwendet wird. Da das Veröffentlichen sehr wichtig für die Forschenden ist, sollten ihren Leistungen unbedingt durch eingebetteten oder begleitenden Meta-Daten in einer Weise gesichert werden, dass diese auch Peer-Reviews und Satzgestaltung bis zur endgültig publizierten Version im PDF-Format überleben.
Mit digi-libris können die in LaTeX Dateien eingebetteten Meta-Daten gelesen und die Dokumente dadurch leichter klassifiziert werden. Diese können auch bearbeitet und ergänzt wund dann als XMP-Datei dem Dokument beigelegt werden (z.B. dMeta Bündel). Dritte (z.B. Verlage) können diese XMP-Dateien leicht in das Abschlussdokument vor der Online-Veröffentlichung integrieren.
 
digi-libris Reader ist ein persönliches Organisationswerkzeug für den multitasking Benutzer von heute, der in einer digitalen Welt lebt und arbeitet. Dies ist auf Metadaten ausgerichtete Software, die automatisch Ihrer Sammlung von Dateien und Dingen klassifiziert. Dokumente und Datensätze aller Art, Fotos, Musik, Videos und Web-Links werden in einer gemischten Liste zusammengefasst und deren wichtigsten Eigenschaften auf einen Blick angezeigt. Physische oder virtuelle Elemente können manuell hinzugefügt werden. Es ist kostenlos und es ist sehr einfach zu bedienen: Ziehen Sie einfach eine Datei oder einen Web-Link in das Hauptfenster und es wird automatisch klassifiziert.
Zurück zum Seiteninhalt | Zurück zum Hauptmenü