HTMLでは、タグに使っている<と>、それに本節で説明する理由から、&をそのまま表示用に使ってはいけないことになっています14。
たとえば次のようなHTMLファイルは誤りになります。
... <body> 不等号記号は < と > です。 </body> ...
このような文字を表現する場合には、実体参照(エンティティ)というテクニックを使います。SGMLの実体参照は、ある文字、ファイル、画像などを別の名前で置き換えることができますが、HTMLでは縮小化されており、<や>などの文字のみが置き換え対象です。
実体参照の書式は次のとおりです。
&実体参照名;
実体参照名に文字列を入れると、それに対応した実際の文字(実体)がブラウザ上で表現されます。&をそのまま表示用に使ってはいけないのは、このように実体参照に使うからです。
HTMLでは、次のものが定義されています。
このほか、文字コードを次の書式で直接指定することもできます。
&#文字コード番号;
文字コード番号は、10進数で指定します。これを使うことで、通常は表現できないような特殊な制御文字なども表示させることができます15。
また、ブラウザやフォントが対応している必要がありますが、ほかにもいろいろな実体参照があります。ISO Latin1として定義されている実体参照のうち一部を表2 に挙げ、ブラウザで表示される状態を図8 に示します。残りのものについては、こちらをごらんください。ブラウザやフォントセットによっては、正常に表示できないものもあります。特に日本語フォントを設定している場合、ウムラウトなどのフォントはほとんど表現できないでしょう。