作者: ねこ丸
日時: 2008/6/29(09:33)
  ねこ丸です。

藤岡和夫 writes:

> http://www.rwds.net/kuroita/program/Perl_unicode.html
> 
> が、うまくまとめてますね。
> 
>  これでほぼ自在に取り扱えそうです。

  どういう結論になったのか分からないですが、自分としては

use open
binmode

  でいいような気がします。TSabc ですしね :-)

  ただ、なぜこれが必要なのかを説明するためには UTF8 フラグを理解しない
といけないわけですが。

  正直この Perl のUTF-8周りは面倒なだけじゃんと自分も思いまし
た。という話は以下に書いてあります。

結局日本語周りをまとめた - あーありがち (2007-08-03)
http://aligach.net/diary/20070803.html#p02

  たどりついてもらえなかったのが残念です :-)

  以下余談。

  正確に「内部エンコーディング」と呼べるものを持っていない PHP 5.x 以下
も藤岡さんの要望には合うかも。UTF-8 なら preg で処理できるし。ただ 6 だ
と「内部エンコーディング」ができちゃうとか?  よく調べてませんけど。

※ 5.x までの PHP の mbstring.internal_encoding は様々な変換などの処理
   でデフォルトのエンコーディングとして働くだけで、PHP の内部的に何か特
   別な意味があるわけではありません。特別な意味があるように見えるのはこ
   れをもとにいろんなフィルタが自動で働くからです。

--
    ねこ丸