Abstract: Perls Unicode-Modell ist sehr "einfach" - doch ähnlich wie bei Tcl
sind wenige harte Regeln nicht automatisch einfach zu Verstehen.
Über Perl und Unicode habe wir sicher schon viel gehört, aber meiner
Meinung nach wird das Modell häufig zu kompliziert dargestellt, was
sich leider in Problemen und subtilen Bugs in Programmen aber vor allem
in CPAN-Modulen niederschlägt.
Perl macht es sich einfach: Skalare in Perl sind typlos und bleiben es
auch - es gibt kein Unicode, lediglich die Möglichkeit, größere
Indices als 255 in einem Character zu speichern - um die Interpretation
muss man sich selbst kümmern. Und auf XS-Ebene ist es genauso: das
UTF-8 Bit ist eine Optimierung, kein Unicode-Flag.
Was zählt, ist das Unicode-Modell im Kopf, nicht das im
Perl-Interpreter.
Was dies in der Praxis bedeutet, möchte ich prägnant und kurz
erklären.