6 Basis HTML data types

Contents

  1. Hoofdletterinformatie
  2. SGML basis types
  3. Tekst strings
  4. URI's
  5. Kleuren
    1. Nota's bij het gebruik van kleuren
  6. Lengtes
  7. Inhoudstypes (MIME types)
  8. Taalcodes
  9. Karakter encoderingen
  10. Enkelvoudige karakters
  11. Datums en tijden
  12. Link types
  13. Media omschrijvers
  14. Script data
  15. Style sheet data
  16. Frame doel namen

Deze sectie van de specificatie omschrijft de basis data types die mogen voorkomen als inhoud van een element of een attribuutwaarde.

Als inleidende informatie over het lezen van de HTML DTD, raadpleeg de SGML handleiding.

6.1 Hoofdletterinformatie

Elke attribuutdefinitie bevat informatie over de hoofdlettergevoeligheid van de waarden ervoor. De hoofdletterinformatie wordt weergegeven met de volgende afkortingen:

CS
De waarde is hoofdlettergevoelig (case-sensitive) (User Agents interpreteren "a" en "A" verschillend).
CI
De waarde is hoofdletterongevoelig (case-insensitive) (User Agents interpreteren "a" en "A" als hetzelfde).
CN
De waarde is onafhankelijk van hoofdletterinformatie, bijvoorbeeld omdat het een nummer of een karakter van de karakterset is.
CA
De element of attribuutdefinitie zelf geeft de hoofdletterinformatie.
CT
Raadpleeg de type definitie voor informatie over de hoofdlettergevoeligheid

Als een attribuutwaarde een lijst is, dan gelden de afkortingen voor elke waarde in de lijst tenzij anders vermeld.

6.2 SGML basis types

De document type definitie specificeert de syntaxis van HTML element inhoud en attribuutwaarden door gebruik te maken van SGML tekens (bijvoorbeeld, PCDATA, CDATA, NAME, ID, etc.). Zie [ISO8879] voor hun volledige definities. Het volgende is een samenvatting van sleutelinformatie:

6.3 Tekst strings

Een aantal attributen ( %Text; in de DTD) nemen tekst die bedoeld is als "leesbaar door mensen". Raadpleeg voor inleidende informatie over attributen de besprekende handleiding van attributen.

6.4 URI's

Deze specificatie gebruikt de term URI zoals gedefinieerd in [URI] (zie ook [RFC1630]).

Merk op dat URI's URL's bevatten (zoals gedefinieerd in [RFC1738] en [RFC1808]).

Relatieve URI's worden opgelost tot volledige URI's door gebruik te maken van een basis URI. [RFC1808], sectie 3, definieert het normatieve algoritme voor dit proces. Raadpleeg voor meer informatie over basis URI's het deel over basis URI's in het hoofdstuk over links.

URI's worden in de DTD voorgesteld door de parameter entiteit %URI;.

URI's zijn algemeen hoofdlettergevoelig. Er kunnen URI's, of stukken van URI's zijn waar het gebruik van hoofdletters onbelangijk is (bijvoorbeeld bij machinenamen), maar deze identificeren kan moeilijk zijn. Gebruikers zouden er altijd moeten van uit gaan dat URI's hoofdlettergevoelig zijn (om veilig te spelen).

Raadpleeg de appendix voor informatie over niet-ASCII karakters in URI attribuutwaarden.

6.5 Kleuren

De attribuutwaarde type "color" (%Color;) verwijst naar kleur definities zoals gespecificeerd in [SRGB]. Een kleurwaarde mag ofwel een hexadecimaal nummer (voorafgegaan door een hekje) ofwel één of meer van de volgende zestien kleurnamen zijn. De kleurnamen zijn hoofdletterongevoelig.

Kleurnamen en sRGB waarden
Black = "#000000" Green = "#008000"
Silver = "#C0C0C0" Lime = "#00FF00"
Gray = "#808080" Olive = "#808000"
White = "#FFFFFF" Yellow = "#FFFF00"
Maroon = "#800000" Navy = "#000080"
Red = "#FF0000" Blue = "#0000FF"
Purple = "#800080" Teal = "#008080"
Fuchsia = "#FF00FF" Aqua = "#00FFFF"

De kleurwaarden "#800080" en "Paars" verwijzen beiden naar de kleur paars.

6.5.1 Nota's bij het gebruik van kleuren

Hoewel kleuren een aanzienlijke hoeveelheid informatie aan documenten kan toevoegen en ze meer leesbaar kan maken, overweeg de volgende richtlijnen wanneer je kleur gebruikt in jouw documenten:

6.6 Lengtes

HTML specificeert drie types van lengte waarden voor attributen:

  1. Pixels: De waarde (%Pixels; in de DTD) is een integer die het aantal pixels representeert van de canvas (scherm, papier). De waarde "50" betekent dus vijftig pixels. Raadpleeg voor normatieve informatie over de definitie van een pixel, [CSS1].
  2. Length: De waarde (%Length; in de DTD) mag ofwel een %Pixel; ofwel een percentage van beschikbare horizontale of verticale ruimte zijn. De waarde "50%" betekent dus de helft van de beschikbare ruimte.
  3. MultiLength: De waarde ( %MultiLength; in de DTD) mag een %Length; zijn of een relatieve lengte. Een relatieve lengte heeft de vorm "i*", waar "i" een integer is. Wanneer ruimte wordt toegewezen tussen elementen die in aanmerking komen voor deze ruimte, dan wijzen User Agents eerst pixel en percentage lengtes toe. Dan wordt de overgebleven ruimte verdeeld onder de relatieve lengtes. Elke relatieve lengte ontvangt een proportioneel deel van de beschikbare ruimte afhankelijk van de integer die vooraf gaat aan de "*". De waarde "*" is equivalent aan "1*". Als 60 pixels ruimte beschikbaar zijn na toewijzing van de pixels en percentages door de User Agent, en de competitieve relatieve lengtes zijn 1*, 2* en 3*, dan krijgt de 1* slechts 10 pixels toegewezen, de 2* krijgt 20 pixels toegewezen en de 3* krijgt 30 pixels toegewezen.

Lengte waarden zijn hoofdletteronafhankelijk.

6.7 Inhoudstypes (MIME types)

Nota. Een "media type" (gedefinieerd in [RFC2045] en [RFC2046]) specificeert de aard van een gelinkte bron. Deze specificatie gebruikt de term "inhoudstype" liever dan "media type" in overeenkomst met huidig gebruik. Bovendien mag in deze specificatie "media type" verwijzen naar de media waar een User Agent een document weergeeft.

Dit type is gerepresenteerd in de DTD door %ContentType;.

Inhoudstypes zijn hoofdletterongevoelig.

Voorbeelden van inhoudstypes omvatten "text/html", "image/png", "image/gif", "video/mpeg", "text/css" en "audio/basic". Raadpleeg voor de huidige lijst van geregistreerde MIME types [MIMETYPES].

6.8 Taalcodes

De waarde van attributen waarvan het type een taalcode is ( %LanguageCode in de DTD) verwijst naar een taalcode zoals gespecificeerd door [RFC1766], sectie 2. Raadpleeg voor informatie over specificatie van taalcodes in HTML, het deel over taalcodes. Witte ruimte is niet toegestaan binnen de taalcode.

Taalcodes zijn Hoofdletterongevoelig.

6.9 Karakter encoderingen

De "charset" attributen (%Charset in de DTD) verwijzen naar een karakter encodering zoals omschreven in de sectie over karakter encoderingen. Waarden moeten strings zijn (bijvoorbeeld, "euc-jp") van de IANA registry (zie [CHARSETS] voor een complete lijst).

Namen van karakter encoderingen zijn hoofdletterongevoelig.

User Agents moeten de stappen vooropgesteld in het deel over specificatie van karakter encoderingen volgen om te bepalen welke de karakter encodering is van een externe bron.

6.10 Enkelvoudige karakters

Bepaalde attributen roepen voor een enkelvoudig karakter van de document karakter set. Deze attributen nemen het %Character type in de DTD.

Enkelvoudige karakters mogen gespecificeerd worden met karakter referenties (bijvoorbeeld "&").

6.11 Datums en tijden

[ISO8601] laat veel opties en variaties in de representatie van datums en tijden toe. De huidige specificatie gebruikt één van de vormen omschreven in het profiel [DATETIME] voor de definitie van geldige datum/tijd strings ( %Datetime in de DTD).

De vorm is:

  YYYY-MM-DDThh:mm:ssTZD
waar:
     YYYY = jaartal bestaande uit vier getallen
     MM   = maand bestaande uit twee getallen (01=januari, enz.)
     DD   = dag van de maand bestaande uit twee getallen (01 tot 31)
     hh   = uur bestaande uit twee getallen (00 tot 23) (am/pm NIET toegestaan)
     mm   = minuten bestaande uit twee getallen (00 tot 59)
     ss   = seconden bestaande uit twee getallen (00 tot 59)
     TZD  = tijdzone aanduiding (Time Zone Designator)

De tijdzone aanduiding één van de volgende:

Z
geeft UTC (Coordinated Universal Time - Gecoördineerde Universele Tijd) aan. De "Z" moet in hoofdletters.
+hh:mm
geeft aan dat de tijd een lokale tijd is welke hh uren en mm minuten voor loopt op UTC.
-hh:mm
geeft aan dat de tijd een lokale tijd is welke hh uren en mm minuten achter loopt op UTC.

De componenten zoals ,hier getoond moeten exact aanwezig zijn, met exact dezelfde schrijfwijze. Merk op dat "T" letterlijk voorkomt in de string (het moet in hoofdletters zijn) om het begin van het tijd element aan te geven, zoals gespecificeerd in [ISO8601]

Ale een genererende toepassing de tijd niet tot op de seconde kent, dan mag het de waarde "00" voor de seconden gebruiken (en ook voor de minuten en uren als nodig).

Nota. [DATETIME] handelt niet over overspringende (leap) seconden.

6.12 Link types

Auteurs mogen gebruik maken van de volgende gekende link types, die hier met hun conventionele interpretaties opgesomd zijn. In de DTD verwijst %LinkTypes naar een door spaties gescheiden lijst van link types. Witte ruimte karakters zijn niet toegestaan binnen link types.

Deze link types zijn hoofdletterongevoelig, dus "Alternate" heeft dezelfde betekenis als "alternate".

User Agents, zoekrobots, enz. mogen deze link types interpreteren op verschillende manieren. User Agents mogen bijvoorbeeld toegang bieden tot gelinkte documenten door middel van een navigatie balk.

Alternate
Wijst een plaatsvervangende versie voor het huidige document toe van waaruit de link voorkomt. Wanneer samen met het lang attribuut gebruikt, verwijst het naar een vertaalde versie van het document. Wanneer samen met het media attribuut gebruikt, verwijst het naar een versie ontworpen voor een ander medium (of media).
Stylesheet
Verwijst naar een extern style sheet. Zie het deel over externe style sheets voor details. Dit wordt gebruikt samen met het link type "Alternate" voor door de gebruiker selecteerbare alternatieve style sheets.
Start
Verwijst naar het eerste document in een collectie van documenten. Dit link type vertelt zoekrobots welk document door de auteur beschouwd wordt als het startpunt van de collectie.
Next
Verwijst naar het volgende document in een lineaire sequentie van documenten. User Agents kunnen er voor kiezen om deze "volgende" documenten te pre-loaden om zo de waargenomen laadtijd te reduceren.
Prev
Verwijst naar het vorige document in een geordende serie van documenten. Sommige User Agents ondersteunen ook het synoniem "Previous".
Contents
Verwijst naar een document dat dienst doet als een inhoudstabel. Sommige User Agents ondersteunen ook het synoniem ToC (van "Table of Contents").
Index
Verwijst naar een document dat een index voor het huidige document voorziet.
Glossary
Verwijst naar een document dat een lijst van begrippen voorziet van termen die in het huidige document voorkomen.
Copyright
Verwijst naar een verklaring van auteursrechten voor het huidige document.
Chapter
Verwijst naar een document dat dienst doet als een hoofdstuk in een collectie van documenten.
Section
Verwijst naar een document dat dienst doet als een onderdeel in een collectie van documenten.
Subsection
Verwijst naar een document dat dienst doet als een onderafdeling in en collectie van documenten.
Appendix
Verwijst naar een document dat dienst doet als een appendix in een collectie van documenten.
Help
Verwijst naar een document dat hulp biedt (meer informatie, links naar andere bronnen van informatie, enz.)
Bookmark
Verwijst naar een bladwijzer. Een bladwijzer is een link naar een sleutelpositie binnen een uitgebreid document. Het title attribuut mag bijvoorbeeld gebruikt worden om de bladwijzer te labelen. Merk op dat verschillende bladwijzers gedefinieerd mogen worden in elk document.

Auteurs kunnen wensen om aanvullende link types te definiëren die niet omschreven zijn in deze specificatie. Als ze dit doen, dan zouden ze gebruik moeten maken van een profiel om de conventies aan te geven die gebruikt worden om de link types te definieren. Raadpleeg het profiel attribuut van het HEAD element voor meer details.

Raadpleeg voor meer uitleg over link types het deel over links in HTML documenten.

6.13 Media omschrijvers

Het volgende is een lijst van herkende media omschrijvers ( %MediaDesc in de DTD).

screen
Bedoeld voor computerschermen.
tty
Bedoeld voor media die gebruik maken van een karakter grid met vaste afstand zoals teletypes, terminals of draagbare toestellen met beperkte weergavemogelijkheden.
tv
Bedoeld voor televisie-type toestellen (lage resolutie, kleur, beperkte scrollbaarheid).
projection
Bedoeld voor projectors.
handheld
Bedoeld voor handheld toestellen (kleine schermen, monochroom, gebitmapte graphics, beperkte bandbreedte).
print
Bedoeld voor genummerde bladzijden, ondoorzichtig materiaal en voor documenten die op scherm bekeken worden in print preview mode.
braille
Bedoeld voor braille tastfeedback toestellen.
aural
Bedoeld voor spraaksynthesizers.
all
Geschikt voor alle toestellen.

Toekomstige versies van HTML kunnen nieuwe waarden introduceren en kunnen geparametriseerde waarden toestaan. Om de introductie van deze uitbreidingen te vergemakkelijken, moeten aangepaste User Agents de media attribuutwaarde als volgt kunnen ontleden:

  1. De waarde is een door komma's gescheiden lijst van onderdelen. Bijvoorbeeld:
     media="screen, 3d-glasses, print and resolution > 90dpi"
     

    wordt ontleed in:

     "screen"
     "3d-glasses"
     "print and resolution > 90dpi"
     
  2. Elk onderdeel wordt afgekapt juist voor het eerste karakter dat niet een US-ASCII letter [a-zA-Z] (ISO 10646 hex 41-5a, 61-7a), getal [0-9] (hex 30-39) of koppelteken (hex 2d) is. In het voorbeeld geeft dit:
     "screen"
     "3d-glasses"
     "print"
     
  3. Dan wordt een hoofdlettergevoelige overeenkomst gemaakt met de set van media types die hierboven werden gedefinieerd. User Agents kunnen onderdelen die niet overeenkomen negeren.In het voorbeeld houden we screen en print over.

Nota. Style sheets kunnen media-afhankelijke variaties bevatten (bijvoorbeeld de CSS @media constructie). In zulke gevallen kan het geschikt zijn om "media=all" te gebruiken.

6.14 Script data

Script data ( %Script; in de DTD) kan de inhoud zijn van het SCRIPT element en de waarde van intrinsieke event attributen. User Agents moeten de script data niet evalueren als HTML opmaak, maar in plaats daarvan de inhoud ervan doorspelen als data aan een script engine.

De hoofdlettergevoeligheid van script data hangt af van de scripting taal.

Merk op dat script data die inhoud is van een element geen karakter referenties mag bevatten, maar script data die de waarde van een attribuut is mag deze wel bevatten. De appendix voorziet verdere informatie over specificatie van niet-HTML data.

6.15 Style sheet data

Style sheet data (%StyleSheet; in de DTD) kan de inhoud van het STYLE element en de waarde van het style attribuut zijn. User Agents moeten de style data niet evalueren als HTML opmaak.

De hoofdlettergevoeligheid van style data hangt af van de style sheet taal.

Merk op dat style sheet data die elementinhoud is geen karakter referenties mag bevatten, maar style sheet data die de waarde is van een attribuut dit wel mag bevatten. De appendix geeft verdere informatie over de specificatie van niet-HTML data.

6.16 Frame doel namen

Behalve voor de gereserveerde namen hieronder opgesomd, moeten frame doel namen (%FrameTarget; in de DTD) beginnen met een alfabetisch karakter (a-zA-Z). User Agents zouden alle andere doel namen moeten negeren.

De volgende target namen zijn gereserveerd en hebben een speciale betekenis.

_blank
De User Agent zou het voorbestemde document moeten laden in een nieuw, onbenoemd venster moeten laden.
_self
De User Agent zou het document in hetzelfde frame moeten laden als het element dat verwijst naar dit doel.
_parent
De User Agent zou het document moeten laden in de onmiddellijke FRAMESET ouder van het huidige frame. Deze waarde is equivalent aan _self als het huidige frame geen ouder heeft.
_top
De User Agent zou het document moeten laden in het volledige, originele venster (dus alle andere frames vallen weg). Deze waarde is equivalent aan _self als het huidige frame geen ouder heeft.