Anhang B Glossar XML

Allgemeines Entity

Mit einer Entity-Definition lassen sich längere Zeichenketten durch Abkürzungen definieren. Innerhalb eines XML-Dokuments eingesetzt, werden diese Abkürzungen vom Parser automatisch gegen die vollständige Zeichenkette ersetzt.

Ancestor

Die Anordnung der Elemente eines Dokuments erfolgt in einer hierarchischen 
Struktur ähnlich der eines Familienstammbaumes. Das Ancestor eines Elements ist 
der direkte Vorfahre eines Elements. Beispielsweise könnte ein Kapitel der 
Vorgänger mehrerer Absätze sein.

Anchor

übersetzt Anker. Der Startpunkt eines Hyperlinks wird Anchor genannt.

Anwendung

Mit einer Anwendung wird unter XML das Programm bezeichnet an das der XML-Processor seine Daten weiterleitet. Die Anwendung ist beispielsweise für die Ausgabe und Weiterverarbeitung der XML-Daten zuständig.

API

Abkürzung für Application Programming Interface. Die API ist eine genormte Schnittstelle, über die der Programmierer direkt die Funktionen des Betriebssystems nutzen kann (zum Beispiel von Windows). Ein XML Processor muss eine API enthalten, über die die zugeordnete Applikation XML Daten beziehen kann.

ASCII-Code

Abkürzung für American Standard Code for Information Interchange. Zeichencode auf 7-Bit -Basis. Der ASCII-Code wird praktisch von jedem PC verwendet. Häufig wird heute der auf 8-Bit erweiterte Code benutzt. So sind neben den Standardzeichen auch Sonderzeichen und landesspezifische Zeichen ergänzt worden. Insgesamt sind dadurch 256 Zeichen nutzbar (statt 127 beim 7-Bit-Code). ASCII liegt sowohl XML als auch HTML zugrunde.

Applet

Einfaches ·Java-Programm, das Bestandteil einer HTML-Seite ist.

Attribut

·Tags sind mit Attribut-Wert-Paaren ausgestattet, die inhaltliche Informationen definieren. Beispiel für ein Attribut:

<ELEMENT ATTRIBUT="inhalt">

Attributdeklaration

Innerhalb einer ·DTD wird der Name und gegebenenfalls der gültige Wertebereich eines Attributs sowie das zugehörige Element definiert.

Bedingter Abschnitt

Abhängig von einer vorgegebenen Bedingung wird ein Teilbereich einer ·DTD berücksichtigt oder von der Verarbeitung ausgeschlossen.

Betaversion

Die verschiedenen Entwicklungsstadien einer Software werden oft mit griechischen Buchstaben bezeichnet. Eine Betaversion ist nach der Alphaversion die erste wirklich lauffähige Version. Sie ist noch mit Fehlern behaftet und wird einem kleinen Publikum von Testern zur Beurteilung im normalen Betrieb vorgelegt.

Betaversionen werden im Bereich XML und HTML als ·RFCs bezeichnet.

Bibliothek

Eine Bibliothek ist eine Datei, in der sich abgeschlossene Programmfunktionen befinden, die von verschiedenen Programmen eingesetzt werden können. So müssen Standardroutinen nicht immer neu entwickelt werden. Unter Windows nennen sich solche Bibliotheken ·DLLs.

Binär

Binär wird ein zweiwertiges Zahlensystem genannt, es sind also nur die Zustände Null und Eins möglich. Computer verwenden zur internen Verarbeitung dieses System (· digital).

XML und HTML verwenden aus Gründen mangelnder Kompatibilität statt des Binärsystems das ·ASCII-System.

Browser

Ein Browser ist die zentrale Kontroll- und Steuer-Software für die Bedienung des Internet. Primär decodiert er HTML-Sequenzen und stellt diese auf dem Bildschirm dar; außerdem umfassen die meisten Browser weitere Dienste, beispielsweise E-Mail-Clients oder Newsreader.

Die bekanntesten Browser sind der Netscape Communicator und der Internet Explorer. Bisher unterstützen die gängigen Browser XML nur sehr rudimentär. Die neue Browsergeneration wird XML in wesentlich stärkerem Maße integrieren. Im Augenblick bietet der Microsoft Internet Explorer die am weitesten gehende Unterstützung von XML.

Bug

Da die ersten Rechner noch mit Relais-Schaltern arbeiteten, kam es vor, dass ein Bug (engl. für »Wanze«) einen solchen Schalter blockierte. In mühsamer Arbeit wurde dieser Fehlerverursacher dann gesucht. Auch heute noch nennt man daher Programmfehler nach diesen Tierchen.

Cache

In einem Cache werden häufig verwendete Daten gespeichert, beispielsweise Grafiken und Textbausteine. Er ist Bestandteil des Browsers, so dass dieser beim Anwählen einer Website im Cache abgelegte Elemente verwenden kann. Die Datenlast wird damit minimiert.

Cascading Style Sheets (kurz CSS)

CSS ist ein W3C-Standard, der sich mit ·Formatdefinitionen von HTML-Dokumenten befasst. Aktuelle Browser, darunter der Internet Explorer 4 und der Netscape Communicator, sind CSS-kompatibel.

case-sensitive

Die meisten Parser betrachten einzelne Zeichen case-sensitive, das heißt sie unterscheiden zwischen Groß- und Kleinschreibung.

CDATA

Der CDATA-Abschnitt innerhalb eines XML-Dokuments charakterisiert einen Teil, in dem Tags ohne Wirkung bleiben. Hier können Sonderzeichen wie &, /, > verwendet werden.

Channel Definition Format (kurz CDF)

Mit dem Channel Definition Format hat Microsoft schon früh den XML-Standard umgesetzt. Das CDF-Format dient in erster Linie dazu Websites mit »Push-Fähigkeiten« auszustatten. Das CDF-Dokument fasst mehrere Seiten mit Pushfunktion zu einem Channel zusammen und enthält den Titel und eine Beschreibung des Informations-Kanals.

CERN

Das Kernforschungszentrum in Genf hat Anfang der 90er Jahre die heutige Killerapplikation des Internet, das World Wide Web, ins Leben gerufen.

CGI

Kurz für Common Gateway Interface. CGI ist eine Programmier-Skriptsprache, die das Erstellen von interaktiven Webdokumenten erlaubt. Mit CGI können auf einfache Weise elektronische Formulare und Cyber-Gästebücher realisiert werden.

Class

Eine Class (»Klasse«) bezeichnet Elemente, die der gleichen hierarchischen Ebene angehören und auf einer Stufe stehen. Beispielsweise gehören die Kapitel eines Buches der gleichen Klasse an.

Codierungsdeklaration

Mithilfe des Attributs xml:lang kann einem Element optional die verwendete Zeichencodierung übergeben werden. In unserem Beispiel wird zunächst die englische Sprache und anschließend die deutsche Sprache definiert.

<element xml:lang="en">Hello World!</element>
<element xml:lang="de">Hallo Welt!</element>

Conditional Section

Die englische Bezeichnung kennzeichnet einen »bedingten Abschnitt« einer DTD. Dieser kann von der Verarbeitung ausgeschlossen werden.

Content

Mit der englischen Bezeichnung Content (= Inhalt) wird in der Regel der Textinhalt, der sich zwischen Start- und Schluss-Tag eines Markups befindet, bezeichnet.

Cookies

Ein Cookie (»Keks«) ist eine Indexdatei, die ursprünglich verwendet wurde, um den Status eines Benutzers in Bezug auf eine Website zu fixieren.

Erreicht ein Anwender beispielsweise ein bestimmtes HTML-Dokument, wird auf der Festplatte ein Cookie erzeugt, das beim nächsten Aufruf abgefragt wird.

Comma Separated Values (kurz CSV)

Ein einfaches Textformat, das zur Delimitierung der einzelnen Einträge Kommata verwendet. Datensätze werden durch ein Line-Feed-Kommando abgeschlossen. Das CSV-Format findet vor allem als Austausch-Format zwischen verschiedenen Tabellenkalkulationen seinen Einsatz. So erlaubt fast jedes Tabellenkalkulationsprogramm einen Export und Import von CSV-Daten (beispielsweise Excel).

CSS

Abkürzung für ·Cascading Style Sheets. Die CSS bezeichnen so genannte Formatvorlagen für die Verwendung unter HTML.

Delimitierung

Zur Abgrenzung von Markups zu normalem Text müssen bestimmte Zeichen definiert werden in die die Befehle eingeschlossen werden. Die Größer- und Kleinerzeichen (»>« und »<«) übernehmen in den meisten bekannten Sprachen diese Funktion.

Delimiter

Bezeichnet die Begrenzungszeichen, die zur ·Delimitierung eingesetzt werden.

Dokument

Ein XML-Dokument besteht aus einer XML-Deklaration, einer Dokumententypdeklaration (DTD) und dem ·Dokumentenelement.

Dokumentelement

Das Dokumentenelement ist das so genannte Root- oder Wurzelelement, es umschließt den gesamten Inhalt des XML-Dokuments. In der Sprache HTML wäre das Wurzelelement beispielsweise das umschließende Markup <html>.

Dokumenttypdefinition

Kurzform für Document Type Definition, einer Standard-Strukturbeschreibung jedes ·SGML- und XML-Dokuments. In dieser Definition werden die Regeln für die gültigen Elemente (Befehle) innerhalb eines XML-Dokuments festgelegt. Sowohl mögliche Elemente, als auch gültige Wertebereiche und Attribute werden hier definiert.

Dokumenttypdeklaration

Die Dokumententypdeklaration befindet sich in der Regel am Anfang eines XML-Dokuments und gibt an, wo die zugehörige DTD für dieses Dokument zu finden ist. Man unterscheidet zwischen interner DTD-Untermenge und externer DTD-Definition.

DOM

Kurzform für Document Object Model, einer Spezifikation für XML, die mit einer ·JavaScript-Norm für HTML vergleichbar ist.

DSSSL

kurz für Document Style Semantics and Specification Language. Diese Sprachdefinition gilt als Standard für ·SGML- und ·XLS-Dokumente.

DSSSL-o

Inzwischen wurde die DSSSL-o als weitere Untergliederung des ·DSSSL entwickelt und vorgeschlagen. Sie bildet eine Teilmenge der DSSSL und ist speziell für die Online-Nutzung vorgesehen. Sie enthält einen stark vereinfachten und reduzierten Befehlssatz.

DTD

Kurzform für Document Type Definition, einer Standard-Strukturbeschreibung jedes ·SGML- und XML-Dokuments

EBNF

Abkürzung für ·Extended Backus-Naur-Form.

Electronic Data Interchange (kurz EDI)

Das EDI-Format ist ein Austausch-Format, das seinen Einsatz im geschäftlichen Alltag findet. Über EDI lassen sich beispielsweise Artikel- oder Kontendaten zwischen verschiedenen Buchhaltungsprogrammen austauschen. Gegenwärtig arbeitet man an der Übertragung des EDI-Formats in den XML-Standard.

Element

Ein Element bezeichnet einen einzelnen Befehl oder ein Markup, das in einer DTD definiert wurde und im XML-Dokument verwendet wird. Übertragen auf HTML werden alle Befehle, die für diese Sprache definiert sind, als Elemente benannt. Innerhalb des Start-Markups und des abschließenden Markups eines Elements befindet sich der so genannte Inhalt des Elements.

<vorname>Rüdiger</vorname>

Elementinhalt

In einer DTD ist festgelegt welchen Inhalt ein Element enthalten darf. Das umfasst beispielsweise den Zeichensatz oder Wertebereich. Eine Ausnahme bilden die so genannten leeren Elemente, die keinen Inhalt besitzen. Gegenüber HTML müssen diese Elemente in XML trotzdem korrekt abgeschlossen werden.

<img src="bild.gif"></img>

Elementkonstruktionsregel

Innerhalb eines XSL-Stylesheets kann angegeben werden, wie bestimmte Elemente verarbeitet werden sollen.

Entity

Ein Entity enthält beliebige Daten, wie beispielsweise ein externes Dokument oder eine Grafikdatei. Die externe Ressource wird nicht direkt eingebunden, sondern durch ein so genanntes Entity eingebunden.

Entity-Deklaration

In einem Bereich einer DTD können für längere Zeichenketten Abkürzungen definiert werden. Im XML-Dokument müssen dann lediglich die Abkürzungen verwendet werden. Vom Parser werden diese wieder durch die vollständigen Zeichenketten ersetzt.

Extended Backus-Naur-Form (kurz EBNF)

Bezeichnet eine Syntax in der Sprachdefinitionen stattfinden können. XML ist auf Basis der EBNF spezifiziert.

Externe Entity

Begriff, der sich von Entität = »Lebensform« ableitet. Gemeint ist ein Tag, der auf ein externes Element außerhalb der aufrufenden XML-Instanz verweist:

Beispiel:

<!ENTITY Verweis »MARKUP.XML">

FAQ-Dokument

Abkürzung für Frequently Asked Questions. Neueinsteigern wird die Möglichkeit geboten, Antworten auf häufig gestellte Fragen in einem Textdokument nachzulesen. In dieser FAQ wird außerdem Grundlagenwissen vermittelt, das für die Anwendung eines Dienstes notwendig ist.

Flow Object (»Flussobjekt«)

Begriff aus der ·DSSSL-Terminologie. Ausgabeeinheiten wie Tabellen, Seiten oder Zeichen werden als Flow Objects zusammengefasst. Der Name entstammt der Art, in der die Objekte an ihre definierte Position gleiten.

Formular-Seiten

Formular-Seiten sind HTML-Dokumente, die dem Anwender eine direkte Interaktion mit einem Internet-Angebot gestatten. Ähnlich einem gewöhnlichen Formular kann der Besucher Daten in eine vorgegebene Maske eintragen und auf diese Weise beispielsweise weiterführendes Informationsmaterial anfordern.

Frames

englischer Begriff für Seitenrahmen. Frames unterteilen eine HTML-Seite in mehrere kleine Segmente, die unabhängig voneinander ausprogrammiert werden können.

Mit Frames ist eine sehr individuelle Gestaltung von Internet-Seiten möglich. Die Frame-Spezifikation ist jedoch erst in der HTML-Norm 3.0 enthalten, kann jedoch von allen zeitgemäßen Browsern interpretiert werden.

FTP

kurz für File Transfer Protocol. Das auf TCP/IP fußende Dateitransferprotokoll des Internet ermöglicht den Download von Dateien. Wenn beispielsweise ein neuer Hardware-Treiber im Internet bezogen werden soll, wird dieser via FTP auf die eigene Festplatte überspielt.

Generic Markup

Elementnamen können unter XML und ·SGML frei definiert werden, so dass sie den Typ auch namentlich charakterisieren. Dieser Umstand wird als generische Markierung, »schöpferische« Zuordnung also, bezeichnet.

GIF

kurz für Graphics Interchange Format. Der Onlinedienst Compuserve hat das GIF-Grafikformat entwickelt, um Grafiken, Scans und Bilder effizient und ressourcensparend über das Internet transferieren zu können. Es lässt eine Farbtiefe von bis zu 256 Nuancen zu und wird heute vielfach in HTML-Dokumente als multimediales Element eingebettet.

GML

Kurzform für Generic Markup Language. Die »Ur«-Sprache aller aktuellen Auszeichnungssprache existiert bereits seit Ende der sechziger Jahre und wurde von Charles Goldfarb und weiteren Entwicklern konstruiert.

Header

Im Header eines HTML-Dokuments sind technische und administrative Informationen zu finden

Hexadezimal

Dieses Zahlensystem auf der Basis 16 wird zur einfacheren Darstellung von Binärzahlen genutzt. So lässt sich mit einer zweistelligen Hexadezimalzahl eine achtstellige Dualzahl darstellen. Im Computerbereich wird eine solche Zahl oft zur Bezeichnung einer Speicheradresse eingesetzt.

HTML und XML verwenden das weitreichend verstandene ·ASCII-Format.

Homepage

Die Homepage ist die höchste hierarchische Seite eines Webangebots. Von ihr wird auf alle weiteren Angebote verzweigt, beispielsweise auf Unterkategorien. Eine Homepage wird als gewöhnliches HTML-Dokument abgelegt und umfasst meist eine Begrüßung und einen kurzen Überblick über das Webangebot.

Hot Java

Sun Microsystems präsentierte 1995 den weltweit ersten ·Java-fähigen Browser Hot Java, der interaktive Java-Programme ausführen konnte.

HTML

kurz für Hyper Text Markup Language. Ähnlich dem DOC-Format von Word für Windows handelt es sich bei HTML um ein Dokumentformat. Als Seitenbeschreibungssprache sind neben Textpassagen auch Steuerinformationen, so genannte Tags, untergebracht.

In einem HTML-Dokument, das an der Dateiendung HTM oder HTML zu erkennen ist, sind Querverweise auf andere Dienste und Angebote im Internet sowie auf Grafik- und Audiodateien verankert. HTML-Seiten sind gewöhnlicher ASCII-Rohtext, der entsprechend mit jedem Texteditor bearbeitet werden kann.

HTML 2.0

Frühe Version des HTML-Standards, den inzwischen alle auf dem Markt befindlichen Browser interpretieren können. Dieser Standard wurde von höheren HTML-Versionen abgelöst

HTML 3.2

Neue Funktionen heben die Version 3 von vorhergehenden HTML-Versionen ab. So können beispielsweise Imagemaps definiert und damit Grafiken als Querverweise festgelegt werden. Außerdem sind Frames möglich.

HTML 4.0

Die neuste HTML-Version unterstützt weitere leistungsfähige Funktionen, darunter dynamische HTML-Seiten (Dynamic HTML). Diese noch junge HTML-Version wird von den wichtigsten Browsern mittlerweile unterstützt.

HTML 4.01

In der aktuellen ·HTML 4.0 Version wurden einige kleine Fehler beseitigt, die letzte gültige Version nennt sich also ganz korrekt 4.01. Die meisten Editoren und übrigen Referenzen unterscheiden allerdings noch nicht zwischen diesen Versionen.

HTTP

kurz für Hyper Text Transfer Protocol. HTTP ist ein Übertragungsprotokoll, das auf TCP/IP aufbaut und HTML-Dokumente überträgt. Die Verwendung des Protokolls ist am Präfix http:// erkennbar.

Hyperlink

englisch für Querverweis. Hyperlinks sind zentrale Bestandteile des HTML-Codes, die auf andere Informationen, Dienste und Textstellen des gleichen Dokuments verweisen.

Meist sind Hyperlinks, die ein Besucher noch nicht angewählt hat, blau und unterstrichen vom Fließtext abgehoben, während bereits besuchte Links rot hervorgehoben werden.

Hypermedia-Dokumente

Hypermedia ist ein Begriff, der die Multimedialität eines HTML-Dokuments beschreibt. Hypermedia-Dokumente sind HTML-Dateien, die außer normalem Text auch multimediale Elemente enthalten. So lassen sich Grafiken, Fotos und Bilder einbinden, aber auch komplexere Elemente wie Audio- und Videosequenzen.

Hypertext

Ein Hypertext ist ein Text, in dem bestimmte Worte mit einem Hyperlink versehen sind. Im Gegensatz zu normalem Fließtext kann der Anwender detailliertere Informationen abrufen, indem er auf ein farbig abgehobenes Wort klickt.

IETF

Abkürzung für International Engineering Task Force. Dieser Zusammenschluss diskutiert die technische Entwicklung des Internet und sorgt für einheitliche Standards der Internet Architektur. Anfängliche Aufgaben der IETF, die auch die Entwicklung von HTML 2.0 umfasste, wurden inzwischen dem W3C übertragen.

Inline Link

Ein einfacher Link wird innerhalb eines Dokuments eingefügt. Der Inline Link ist die einfachste Form einen Hyperlink in ein XML-Dokument einzufügen. Die Funktionsweise ist vergleichbar mit den aus HTML bekannten Hyperllinks.

ISO 10179

ISO-Norm für ·DSSSL.

ISO 10646-1

ISO-Norm für 32-Bit Zeichensätze..

ISO 3166

Standard für einen Ländercode. Jeder Ländercode besteht aus zwei Zeichen (Bsp.: »DE« für Deutschland oder »UK« für England.

ISO 639

Durch diese ISO-Norm erfolgt die Definition der verwendeten Sprache (Bsp.: »DE« für Deutsch oder »EN« für Englisch. Zusätzlich kann noch ein Attribut für einen Dialekt hinzugefügt werden (Bsp.: »EN.UK« für britisches Englisch oder »EN.US« für amerikanisches Englisch).

ISO 8859

Definiert einen Zeichensatz auf der Grundlage des Standard ASCII-Zeichensatzes. Diesem werden landesspezifische Sonderzeichen hinzugefügt. Ein 8-bit Zeichensatz nach ISO 8859 besteht aus 256 Zeichen.

ISO 8879

Offizieller Standard für ·SGML. Teilweise wird der Standard zusätzlich durch das Jahr des Erscheinens ergänzt (ISO 8879:1986).

Jade

Akronym aus James DSSSL Engine, einem von James Clark entwickelten ·DSSSL-Programm. Mithilfe dieser Implementierung können bereits bestehende XML-Dateien über Style Sheets formatiert werden.

Java Applet

Java Applets sind kleine Java-Programme, die auf einem Server hinterlegt werden und durch einen Java-Interpreter ausgeführt werden. Die meisten aktuellen Browser integrieren bereits Java-Interpreter, so dass sie Java-Applets ausführen können.

Java

Java ist eine betriebssystemunabhängige und architekturneutrale Programmiersprache, deren Syntax C++ ähnelt. Die von Sun entwickelte Sprache hat vor allem Verbreitung im Internet-Raum gefunden, in dem sehr viele unterschiedliche Hardware-Plattformen miteinander kommunizieren. Java-Programme benötigen für die Ausführung keinen Browser, sondern werden durch einen Java-Compiler in ein ausführbares Programm übersetzt.

JavaScript

JavaScript ist ein einfaches Java-Derivat, dessen Vorteil in der einfachen Programmierung liegt. Es bietet keinen leistungsfähigen Funktionsumfang wie etwa Java, wird dafür aber direkt in den HTML-Code eingebunden und ist leicht erlernbar.

JPEG

kurz für Joint Photographic Experts Group. Diese Expertengruppierung hat ein Grafikformat definiert, das sich ausgezeichnet an die Erfordernisse der geringen Datenmengen im Internet anpasst.

Zwar eignet sich die Wiedergabequalität nicht für professionelle Fotoarbeiten, aber für Standard-Internet-Anwendungen hat sich JPEG als De-facto-Standard durchsetzen können. JPEG-Grafiken können von den meisten Browsern verarbeitet werden und sind an der Dateiendung JPG erkennbar.

Kommentar

Ein als Kommentar gekennzeichneter Text, wird eingesetzt um dem Autoren dieses Dokuments die spätere Aktualisierung zu erleichtern. Einzelne Schritte oder Abschnitte können so mit zusätzlichen Informationen versehen werden. Diese Kommentare werden dem Anwender, der die Seite besucht, nicht mit angezeigt.

Konstruktionsregel

·XLS erfordert die Definition einer Konstruktionsregel, die als Vorgabe für die Verarbeitung von Elementen notwendig ist. Jede Regel umfasst ein Muster sowie eine Folgeaktion.

Langcode

Der Language-Code dient der Identifizierung der verwendeten Sprache eines Dokuments. Zur Definition des LangCode kann die ·ISO 639 verwendet werden.

Leeres Element

Ein leeres Element enthält keinen Inhalt. In der Praxis bedeutet das, dass dieses Element nur aus einem einzelnen Markup-Befehl besteht. In HTML sind beispielsweise die <br>-Befehle »leere« Elemente. Anders als in HTML müssen auch leere Elemente korrekt abgeschlossen werden (z.B. <br/>).

Link

Kurzform für Hyperlink, der englischen Bezeichnung für Querverweis.

Literal Data

Durch einfache oder doppelte Anführungszeichen begrenzte Zeichenketten werden als Literale Daten bezeichnet.

Markup

Ein Befehl innerhalb eines XML- oder HTML-Dokuments wird als Markup bezeichnet. Zwischen dem Start- und dem End-Markup befindet sich der Inhalt des Elements.

MCF

Kurzform für Meta Content Framework. Dieser bereits früh spezifizierte Entwurf beschreibt Metadaten, die von Netscape-Browsern gehandhabt werden können.

Metasprache

Metasprachen dienen zur Definition von anderen Sprachen. SGML ist die bekannteste Metasprache. Auf ihrer Basis wurde beispielsweise HTML definiert.

MIME

Abkürzung für Multi-purpose Independent Mail Extensions. Dient der Identifizierung des Formats eines Dokuments. XML hat die MIME-Typ "content-type: text/xml", aber auch binäre Grafikdaten können über den MIME-Typ erkannt werden (Bsp.: JPEG-Format "content-type: image/jpeg").

Mixed Content

Bezeichnung für den Inhalt eines Elements, das neben reinen Zeicheninformationen auch vererbte Kindelemente enthalten darf.

Beispiel:

<!ELEMENT p (#DATUM)*>

Namensraum

Teil im Header eines XML-Dokuments, in dem die Elementtypen des Dokuments definiert werden. Beispiel:

<!ELEMENT p (#Daten)*>

NDATA

Das Schlüsselwort NDATA weist den Parser an, die Daten eines externen Entity nicht zu verarbeiten, sondern an die Anwendung weiterzugeben.

Nonvalidating

Man unterscheidet zwischen validierenden und nicht-validierenden XML Parsern. Ein nicht-validierender Parser kann Informationen in einer zugehörigen ·DTD ignorieren.

PCDATA

Das Schlüsselwort PCDATA, das bei der Definition von Elementen verwendet wird, gibt an, dass das Element als gültigen Inhalt normale Zeichendaten enthalten darf.

PNG

kurz für Portabel Network Graphics. PNG ist ein richtungsweisendes Grafikformat, das technisch herausragende Innovationen implementiert. Neben guten Kompressionsraten bietet es hohe Farbtiefen und wird in der Zukunft anderen Grafikformaten wie JPG und GIF Konkurrenz machen.

Prolog

Entgegen der frühen gleichnamigen Programmiersprache verbirgt sich hinter diesem Begriff der Datenkopf eines XML-Dokuments.

Prozessinstruktionen

Eine Prozessinstruktion (kurz PI) ist ein Befehl einer Anwendung an ein XML-Dokument. Die Instruktion wird stets zwischen zwei Fragezeichen eingefasst und wird über einen Funktionsnamen eindeutig identifiziert. Beispiel:

<?magnum order="todo"?>

Rendering

Mit Rendering bezeichnet man den Prozess in dem ein XML-Dokument zur Ausgabe auf dem Bildschirm vorbereitet wird.

RFC

Kurzform für Request for Comment. Das W3C und weitere Internet-Spezifikationsorgane geben technische Entwürfe als RFCs an die Öffentlichkeit weiter, die zur Diskussion aufgerufen ist. RFCs münden in endgültigen Internet-Standards.

SGML

Kurz für Standard Generalized Markup Language. Diese Hochsprache erzeugt ihr untergeordnete Auszeichnungssprachen, darunter HTML.

Site

Als Site oder Website wird das gesamte Internet-Angebot bezeichnet, das sich aus einzelnen HTML-Dokumenten, Binär- und Steuerdateien zusammensetzt.

Stilregel

Eine Stilregel ist ein Element, das den Formatstil eines XSL-Dokuments beschreibt. Die hier festgelegte Spezifikation kann auch elementunabhängig definiert werden.

Style Sheet

Ein Style Sheet beinhaltet Formatierungsoperatoren, die das spätere Erscheinungsbild eines Dokuments festlegen. ·CSS ist die Style-Sheet-Spezifikation für HTML-Dokumente, ·XSL ist das Pendant für XML.

Tags

Neben reinem Fließtext umfassen XML- und HTML-Dokumente auch Formatierungsanweisungen, die als Tags bezeichnet werden. Tags weisen den Browser bei der späteren Darstellung eines Dokuments an, bestimmte Inhalte in definierter Weise abzubilden.

In Tags sind auch Hyperlinks eingebunden. HTML-Tags sind an einem einleitenden Symbol, der spitzen Klammer, erkennbar. Ein Beispiel für einen typischen Tag ist :

</BODY>

URL

kurz für Uniform Resource Locator. Das URL-Format ist gewissermaßen das »Dateisystem« im Internet. Es spezifiziert die Pfad- und Protokollangabe zu einem Dienst und zu einer Datei im Inter- und Intranet.

Eine typische URL-Adresse ist beispielsweise http://www.mut.com

VRML

kurz für Virtual Reality Modeling Language. Mit VRML können dreidimensionale Umgebungen im Internet simuliert werden.

Statt eine zweidimensionale Fläche auf den Bildschirm zu projizieren, kann der Benutzer einen Raum interaktiv durchschreiten, Gegenstände betrachten etc.

Webmaster

Der Webmaster eines Angebots ist für die Technik eines Webservers verantwortlich. Tauchen Probleme bei der Anwendung des Internet-Angebots auf, fungiert der Webmaster als erste Kontaktperson. Er ist unter der zentralen Adresse webmaster@server.com erreichbar.

Well Formed Document

Übersetzt etwa »wohlgeformtes Dokument«. Auf den Einsatz von DTDs kann verzichtet werden; XML-Dokumente benötigen sie nicht zwingend. XML-Dokumente ohne DTD werden immer dann als wohlgeformt (wellformed) bezeichnet, wenn deren Syntax und geschachtelte Struktur standardgemäß mit Start- und End-Tags ausgestattet sind.

WYSIWYG

kurz für What you see is what you get. Ein WYSIWYG-fähiges Programm stellt ein Dokument so dar, wie es später auf dem Drucker ausgegeben wird. Im Internet-Bereich meint WYSIWYG darüber hinaus, dass ein Web-Publishing-Tool eine Seite derart gestaltet, dass das Layout während der Gestaltung der späteren Darstellung eines Browsers entspricht.

XHTML

Das W3C hat Ende 1999 eine Überarbeitung von HTML auf Basis von XML erarbeitet. Der Standard enthält eine komplette DTD, die die aktuelle HTML 4.0 Version festlegt.

XML-Deklaration

Am Beginn jedes XML-Dokuments ist innerhalb der ·Prozessinstruktion auch ein administrativer Hinweis auf die Versionsnummer sowie einige weitere Informationen des Dokuments zu finden. Beispiel:

<?xml version="1.0"?>

XML-Dokument

Ein XML-Dokument besteht aus drei Bestandteilen: der XML-Deklaration, einer Dokumententypdeklaration und dem Dokumentenelement.

XML-Instanz

Eine Instanz umfasst ein XML-Dokument, das sich aus beliebig vielen Einzeldateien zusammensetzen kann

XML Linking Specification

Beschreibt die XML Spezifikation zur Erstellung von Links und Verbindungen zu anderen Datenquellen oder Dokumenten.

XML-Prozessor

Ein XML-Prozessor verarbeitet XML-Dokumente und überprüft diese auf Gültigkeit und Wohlgeformtheit. Anschließend reicht der Prozessor die Daten an eine Anwendung weiter.

XML-Spezifikation

Die XML-Spezifikation, herausgegeben vom W3C legt genau fest, wie XML funktioniert.

XSL

Kurzform für Extensible Markup Language, der ·Style-Sheet-Spezifikation von XML.

Zeichendaten

Neben Markups enthält jedes XML- oder HTML-Dokument den eigentlichen Inhalt: die so genannten Zeichendaten. In der Regel handelt es sich dabei um den Text aus dem ein Dokument besteht.