フォーマット制御文字

ECMA-262 3rd Edition和訳)を見ていたら、7章にこんなことが書いてあるのを見つけました。

フォーマット制御文字は ECMAScript プログラムのソーステキストのどの場所に出現してもよい。これらの文字は、字句文法を適用する前にソーステキストから取り除かれる。文字列と正規表現リテラルの処理前にこれらの文字が取り除かれるので、文字列、正規表現内に Unicode 制御文字を入れるには Unicode エスケープシーケンス (セクション 7.6) を使用しなければならない。

This Document has Moved

ざっとCfカテゴリ(プロパティ)の文字で調べてみると、IEでは無視される(取り除かれる)ことはありませんでしたが、Firefox2では以下の文字が無視されました。

U+200C: ZERO WIDTH NON-JOINER
U+200D: ZERO WIDTH JOINER
U+200E: LEFT-TO-RIGHT MARK
U+200F: RIGHT-TO-LEFT MARK
U+202A: LEFT-TO-RIGHT EMBEDDING
U+202B: RIGHT-TO-LEFT EMBEDDING
U+202C: POP DIRECTIONAL FORMATTING
U+202D: LEFT-TO-RIGHT OVERRIDE
U+202E: RIGHT-TO-LEFT OVERRIDE
U+206A: INHIBIT SYMMETRIC SWAPPING
U+206B: ACTIVATE SYMMETRIC SWAPPING
U+206C: INHIBIT ARABIC FORM SHAPING
U+206D: ACTIVATE ARABIC FORM SHAPING
U+206E: NATIONAL DIGIT SHAPES
U+206F: NOMINAL DIGIT SHAPES
U+FEFF: ZERO WIDTH NO-BREAK SPACE

いつか使うかもしれないのでメモ。