< HOME OF SGML > |
Kopie auf Dr. Web
SGML/XML | |
0 | Inhalte |
01 | Wunsch Inhalt |
1 | Einführung |
1.1 | Was ist SGML ? |
1.2 | Was ist XML ? |
2 | Entstehung von SGML |
3 | Die Rolle von SGML heute |
4 | Praxis: Verlage und SGML |
4.1 | Überblick |
4.2 | Fazit |
4.3 | SGML-Strategie von Verlagen |
5 | Was mit SGML noch möglich ist: |
6 | Ausblick |
7 | SGML: Techniken und Werkzeuge |
7.1 | Dokumenttypdefinition (DTD) |
7.1.1 | Beispiel: DTD-Ausschnitt für Paragraph |
7.1.2 | Beispiel: Ausschnitt aus Dokument für Paragraph |
7.2 | SGML Parser |
7.3 | SGML Editor |
7.4 | SGML Browser |
7.5 | SGML Datenbank |
8 | Verweise |
9 | Dank |
Kurze Einführung - was ist das
Praxis - was kann man damit machen
Beispiel - wie das technisch gemacht wird mit etwas Code. Ausblick warum es wichtig ist.
ev Link auf englische Quellen oder Lexika.
Die Standard Generalized Markup Language - SGML - ist der Standard zur Beschreibung von Dokumenten festgelegt von der International Standardization Organization (ISO), der unter der Nummer ISO 8879 im Jahr 1986 veröffentlicht wurde. Das Ziel und die Idee dieses Standards ist es, die Struktur des Inhalts eines Dokuments von seiner layoutorientierten Erscheinungsform zu trennen. Damit wird der Schwerpunkt bei der Formatierung von Dokumenten weg vom typografischen Layout hin zur logischen und strukturellen Auszeichnung eines Dokuments verlegt. Wichtig daran zu bemerken ist, daß dies eine Sprache zur Beschreibung beliebiger Dokumente mit unterschiedlichsten Strukturen ist. Genauer gesagt ist SGML nicht eine Sprache zur Auszeichnung von Dokumenten sondern eine Meta-Sprache zur Beschreibung von Auszeichnungs- oder MarkUp-Sprachen für diese Dokumente. Der Gewinn dieser im Gegensatz zum Layouten unterschiedlichen Vorgehensweise ergibt zwei hauptsächliche Vorteile:
Aufgrund ihres Meta-Charakters ist SGML also nicht nur einfach eine Sprache sondern eine Strategie.
Dazu ein Ausschnitt aus einem Artikel von Brian E. Travis, Managing Editor, aus der < TAG >, Februar 98
Das erste Donnergrollen kam von den XML Entwicklern über ihre Pläne SGML zu vereinfachen. Diese Leute sagten, sie brauchten eine einfache Form von SGML die über das Web geliefert werden könnte. "SGML ist zu komplex für solch eine Aufgabe", sagten sie, "und diePerformance würde ein Problem sein außer wir könnten einige der unangenehmen Eigenschaften von SGML abstreifen". Ihre Vision war die Leute dazu zu bringen, SGML weiter zu benutzen für komplexe Dokumente, dann diese auszuliefern im Ganzen als XML über das Web. Die erklärte Absicht war nicht, SGML zu ersetzen, aber es zu erweitern.
Mehr unter: [http://th-o.de/sgml/whysgml.htm] . Nicht zuletzt soll damit der mehrere hundert Seiten umfassende SGML-Standard auf 20 (in Worten: zwanzig) A4 Seiten komprimiert werden. Die Extensible Markup Language (XML) ist ein Anwendungsprofil bzw. eine eingeschränkte Form von SGML, aber genau wie der Standard eine Meta-Sprache. Das Ziel von XML ist es, die Akzeptanz und Nutzbarkeit der SGML Idee zu verbessern und seine Anwendbarkeit in der Form auf das Web zu übertragen, in der es jetzt mit HTML möglich ist. XML wurde entwickelt für eine einfache Verwendung und Interoperabilität sowohl mit SGML als auch mit HTML.
SGML hat den Vorläufer GML (Generalized Markup Language), welcher von Charles Goldfarb, IBM, entwickelt wurde. Der Standard wurde - wie oben bereits erwähnt - im Jahr 1986 von der International Standards Organization (ISO) als ISO 8879-1986 veröffentlicht. Er findet weite Verbreitung in den USA als Standard-Datenformat für das CALS (Computer-Aided Acquisition and Logistics Support)-Projekt des Department of Defense und entwickelt sich zum Standard für Datenhaltung im Verlagswesen und in der Technischen Dokumentation.
SGML trägt stark zum Übergang der Gesellschaft in eine Informationsgesellschaft bei, denn SGML
Bereits einige Verlage (weltweit und in Deutschland) haben heute eine Palette elektronischer Publikationen in verschiedenen Bereichen. Das bringt häufig ähnliche, sich zum Teil überschneidende Inhalte. SGML bedeutet für die
Produktion elektronischer Texte:
Das schnelle Fortschreiten von Forschung und Entwicklung bringt immer größere Datenumfänge mit sich. Das bedeutet für die Produktion elektronischer Texte die Verwaltung und Verarbeitung großer Datenmengen. Um diese noch einigermaßen überschaubar, übersichtlich und einfach nutzen zu können, gibt es sogenannte Links. Dies sind Verknüpfungen auf andere Texte oder konkrete Stellen im gleichen oder anderen Dokument. So gibt es gerade bei elektronischen Fachdatenbanken häufig
Um nun die Aktualität der Produkte zu wahren, muß die Produktion ein reibungsloses Updatemanagement mit weitestgehend automatisierter Produktion gewährleisten, dies besonders unter dem Gesichtspunkt der unterschiedlichen Arten der
Datenpräsentation und der Bedienung unterschiedlicher Distributionsmedien: CD-ROM Fachdatenbank, Internet, Intranet, Diskette, Papier (Braille, Sprachausgabe, ...). Das bedeutet für die Produktion:
Bezogen auf die immer schneller voranschreitende technologische Entwicklung in der Softwareindustrie bedeutet das für die Produktion die Haltung der Daten unabhängig von den Anwendungen (Software) und von proprietären Formaten (siehe Probleme mit Microsoft Produkten).
Verlage brauchen:
Durch einen SGML Datenpool sind elektronisch publizierende Verlage für die Zukunft gerüstet, denn sie haben qualitativ hochwertige und aktuelle Dateninhalte sowie in technischer und inhaltlicher Hinsicht flexibel einsetzbare Daten.
Die DTD (Document Type Definition) ist die Voraussetzung für das Arbeiten mit SGML. In der DTD sind alle Elemente einer Dokumentstruktur und deren Eigenschaften (Attribute) sowie die Beziehungen zwischen den Elementen festgelegt. Die Elemente werden im Dokument durch die Tags verkörpert, die durch die Zeichen "<" und ">" begrenzt sind, wobei meist ein öffnendes und ein schließendes Tag zusammengehören. Beim schließenden Tag wird nach dem "<" ein "/" gesetzt.
In der DTD werden das Auftreten und die Eigenschaften eines Elements festgelegt:
Elementdeklaration für Paragraph
<!ELEMENT paragraph - O (ptitel, (satz+ | num+ | absatz+)? ) >
Dabei ist paragraph
der Name des Elementes. Die Phrase "- O
" ist die sogenannte Tagminimierung, die in diesem Fall aussagt, daß bei paragraph
das schließende Tag weggelassen werden kann ("O"). In
paragraph
wiederum können ("?") auf das Element ptitel
(muß vorkommen) die Elemente (entweder) satz
, num
oder ("|") absatz
ein- oder mehrmals ("+") auftreten.
Attributdeklaration für Element par
<!ATTLIST paragraph pid ID #REQUIRED >
Das Element paragraph
hat in diesem Fall ein Attribut mit Namen pid
welches vom Typ ID
ist. Die Phrase #REQUIRED
sagt aus, daß dieses Attribut belegt werden muß.
<paragraph id="p1"><ptitel>Das ist der Titel zum Paragraph mit der ID p1</ptitel> <satz>Das ist ein Satz innerhalb des Paragraph mit der ID p1.</satz> <satz>Das ist ein zweiter Satz innerhalb des Paragraph mit der ID p1.</satz> <paragraph id="p2"><ptitel>Titel Paragraph p2</ptitel> <satz>Im Paragraph mit der ID p1 wurde das Ende-Tag weggelassen, da dies laut DTD erlaubt ist.</satz> <satz>In diesem Paragraph steht das Ende-Tag da, auch das entspricht der DTD</satz> </paragraph>
Ein SGML Parser ist ein Prüfprogramm, das die Struktur eines Dokumentes gegen eine Dokumenttypdefinition (DTD) abprüft und so sicherstellt, daß das Dokument den Regeln der DTD entspricht und fehlerfrei von Programmen verarbeitet werden kann. Trifft das Programm auf einen Fehler, wird eine Meldung ausgegeben.
Ein SGML Editor ist ein Editor, der dem Benutzer hilft, SGML-konforme Dokumente zu erstellen indem Elemente nur an den von der DTD vorgegebenen Stellen eingefügt werden und die gesamte Struktur eines Dokumentes überprüft werden kann, auch auf Verweisfehler.
SGML Browser ist Software, die SGML Dokumente formatiert darstellt, indem jedem Element oder Elementkombinationen (z. B. Textabsätze in Listeneinträgen) ein Layout (fett, rot, 14 pt) oder eine Funktion (Popup, blinkt, läuft von links nach rechts über den Bildschirm) zugewiesen wird.
Eine SGML Datenbank ist eine relationale, objektorientierte oder objektrelationale Datenbank, die die SGML Struktur in ihrer internen Datenbankstruktur abbildet und für die Suche in den Daten nutzt. Bietet sie außerdem Versionenkontrolle und Workflow-Management, spricht man von einem Redaktionssystem.
Mein besonderer Dank gilt Frau Ursula Raithelhuber vom UB MEDIA Verlag St. Wolfgang für ihre freundliche Unterstützung.
Thomas Hofmann --
German Home of SGML