ZEFYS

Einleitung

Das ZEitungsinFormationssYStem ZEFYS bietet Zugang zu digitalisierten historischen Zeitungen der Staatsbibliothek zu Berlin.

ZEFYS weist derzeit  628.218 Ausgaben von 222 historischen Zeitungen aus Deutschland und deutschen Zeitungen des Auslands nach. Angeboten werden Images der Zeitungsseiten sowie Metadaten der Zeitungsausgaben. Für einzelne Zeitungen können zusätzlich Volltexte benutzt werden. Das Angebot wird ausgebaut. Folgende umfangreichere Zeitungsverläufe stehen neben vielen Einzelausgaben oder -jahrgängen verschiedener Zeitungen zur Verfügung:

1. Berliner Tageblatt (ZDB-ID: 341834-0)
Digitalisiert: 1878-1928 (ZDB-ID: 2764651-8)
Bearbeitete Beilagen: Der Montag; Wochen-/Monatsausgabe; Technische Rundschau

2. Berliner Börsenzeitung (ZDB-ID: 1114705-2)
Digitalisiert: 1857; 1872-1930 (ZDB-ID: 2436020-X)

3. Volks-Zeitung : Organ für Jedermann aus dem Volke (ZDB-ID: 532361-7)
Digitalisiert: 1856-1858; 1890-1904 (ZDB-ID: 2797453-4)

4. Berliner Volkszeitung (=Nachfolger der Volks-Zeitung) (ZDB-ID: 749588-2)
Digitalisiert: 1904-1930 (ZDB-ID: 2797174-0)

5. Norddeutsche Allgemeine Zeitung (ZDB-ID: 125912-X)
Digitalisiert: 1878-1918 (ZDB-ID: 2802868-5)

6. Deutsche Allgemeine Zeitung (=Nachfolger der Norddeutschen Allgemeinen Zeitung) (ZDB-ID: 1064181-6)
Digitalisiert: 1918/19-1922 (ZDB-ID: 2807323-X)

7. Deutsche allgemeine Zeitung : DAZ. Ausgabe Groß-Berlin (Nachfolger der Deutschen Allgemeinen Zeitung) (ZDB-ID: 788922-7)
Digitalisiert: 1922-1930 (ZDB-ID: 2811315-9)

8. 22 Zeitungen aus dem Projekt: Die deutschsprachige Presselandschaft im ‚langen‘ 19. Jahrhundert – ein Beitrag zur Digitalisierung überregionaler Tages- und Wochenzeitungen aus Berlin und dem deutschen Osten

Schnittstellen

Aus rechtlichen Gründen stehen die hier aufgeführten Schnittstellen nur für die rechtefreien Titel in ZEFYS zur Verfügung. Für die Inhalte des „DDR Presse“ Portals können wir leider keinen Direktzugriff auf die Daten ermöglichen.

IIIF

Die Abfrage von Inhalten wie Bildern und Volltexten für die Digitalisierten Zeitungen (ZEFYS) ist über das International Image Interoperability Framework (IIIF) Protokoll verfügbar.

Aktuell können aus den Digitalisierten Zeitungen Bilder und Metadaten nach dem folgenden Schema abgefragt werden:
https://content.staatsbibliothek-berlin.de/zefys/SNP{ZDB-ID}-{YYYYMMDD}-{Issue}-{Page}-{Article}-{Version}

Die ZDB-ID ist eine eindeutige Kennung für jeden Zeitungstitel und kann sowohl im Zeitungsportal ZEFYS oder direkt bei der ZDB gefunden werden. Für den Datenabruf ist die ZDB-ID der digitalisierten Zeitung zu benutzen.

Weiterhin muss ein Datum im Format YYYYMMDD angegeben werden, bspw. 18900101 für die Ausgabe vom 01. Januar 1890. Die Information, an welchen Daten bereits digitalisierte Ausgaben einzelner Zeitungen vorliegen, kann wiederum über das Zeitungsportal ZEFYS abgerufen werden.

Um gescannte Bilder für die gewünschte Zeitung zu erhalten, müssen weitere Informationen in der URL spezifiziert werden, die dem IIIF-Standard entsprechen:
/full/{width in pixel},/0/default.jpg wobei width in pixelfrei gewählt werden kann und die Höhe sich automatisch anpasst, z.B.
https://content.staatsbibliothek-berlin.de/zefys/SNP27974534-19010712-0-1-0-0/full/1200,/0/default.jpg
https://content.staatsbibliothek-berlin.de/zefys/SNP27974534-19010712-0-1-0-0/full/250,/0/default.jpg

Der IIIF-Standard erlaubt weitere Bildmanipulationen über die URL. So kann, neben der Anpassung der Größe, ein Ausschnitt des Bildes gewählt oder das Bild gedreht werden. Im folgenden Beispiel wird ein 300 x 300 Pixel großer Ausschnitt um 90° gedreht zurück geliefert.
https://content.staatsbibliothek-berlin.de/zefys/SNP27974534-19010712-0-1-0-0/1000,1000,300,300/full/90/default.png

Es ist ebenso möglich das originale TIFF Bild zu erhalten, indem default.tif anstatt default.jpg in the URL verwendet wird:
https://content.staatsbibliothek-berlin.de/zefys/SNP27974534-19010712-0-1-0-0/full/full/0/default.tif

Mit dem Anfügen der Seitenzahl 0 und der Endung .xml an die URL der einzelnen Ausgabe, kann man das METS Dokument mit den Metadaten des einzelnen Zeitungstitels erhalten, bspw.:
https://content.staatsbibliothek-berlin.de/zefys/SNP27974534-19010712-0-0-0-0.xml

Weitere funktionierende Beispiele:
https://content.staatsbibliothek-berlin.de/zefys/SNP27974534-19010712-0-1-0-0/full/full/0/default.tif -> TIF, Seite 1
https://content.staatsbibliothek-berlin.de/zefys/SNP27974534-19010712-0-1-0-0/full/1200,/0/default.jpg -> JPG, Seite 1
https://content.staatsbibliothek-berlin.de/zefys/SNP27974534-19010712-0-1-0-0.pdf -> PDF, Seite 1
https://content.staatsbibliothek-berlin.de/zefys/SNP27974534-19010712-0-0-0-0.pdf -> PDF, alle Seiten
https://content.staatsbibliothek-berlin.de/zefys/SNP27974534-19010712-0-0-0-0.xml -> METS

Volltexte

Inzwischen liegen für die überwiegende Zahl der eingangs erwähnten Zeitungen auch Volltexte vor.
Die OCR-Daten im ALTO-Format sind nach folgendem Schema seitenweise einzeln abrufbar. Hier die Berliner Morgen-Zeitung (ZDB-Nummer 30740459) vom 27.11.1914:
https://content.staatsbibliothek-berlin.de/zefys/SNP30740459-19141127-0-1-0-0.alto.xml für Seite 1,
https://content.staatsbibliothek-berlin.de/zefys/SNP30740459-19141127-0-2-0-0.alto.xml für Seite 2 usw.

Für das Projekt Amtspresse Preußens liegen Volltexte in verschiedenen Formaten vor.

Für das Teltower Kreisblatt liegen die Daten im ALTO Format vor. Gegenüber der Auslieferung der METS Datei muss hier zum einen
die Ausgabe mit dem Buchstaben A und die Seitenzahl in der URL angepasst werden.
Dadurch werden anstatt der METS Daten die OCR-Daten im ALTO Format für jede Seite einzeln ausgeliefert:
https://content.staatsbibliothek-berlin.de/zefys/SNP25128437-18580109-A-1-0-0.xml für Seite 1,
https://content.staatsbibliothek-berlin.de/zefys/SNP25128437-18580109-A-2-0-0.xml für Seite 2 usw.

Für die weiteren Zeitungen mit Volltext, Provinzial-Correspondenz und Neueste Mittheilungen, liegen die Daten in einem freien XML-Format vor.
Hier muss die Ausgabe mit dem Buchstaben F angegeben werden, die Seite mit 1, da hier der gesammte Volltext als eine Datei ausgeliefert wird.
Beispiele für eine Auslieferung dieser Daten sind für die Provinzial-Correspondenz:
https://content.staatsbibliothek-berlin.de/zefys/SNP9838247-18770117-F-1-0-0.xml
und für die Neueste Mittheilungen:
https://content.staatsbibliothek-berlin.de/zefys/SNP11614109-18930721-F-1-0-0.xml

Lizenz- und Nutzungsbedingungen

Die hier angebotenen Zeitungen stehen unter Public Domain Mark 1.0. Es bestehen keine Lizenz- und Nutzungseinschränkungen.

Ansprechpersonen

Clemens Neudecker; George Dogaru

0 Kommentare

Hinterlasse einen Kommentar

An der Diskussion beteiligen?
Hinterlasse uns deinen Kommentar!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert