著作一覧 |
子供がメモ帳使ってテキストを打っているのを見ていたら、ごく自然にUnicode(UTF-8ではなく、16ビットのやつ)を選んで保存していた。
というのは、ハートとかハートとかハートとかが変換すると出てくるからだ。
変換して出てくればそりゃ使うだろう。(でも既定で記号辞書は無効になっているのだが、いつ変えたんだろう? OfficeをインストールするとOfficeのIMEがそう設定するのか?)
そして保存しようとすれば、Unicodeを選べと警告してくる。素直にやれば、そこでUnicodeを選ぶだろう。
こんな感じで、じきにUnicodeのBOMが付いたテキストファイルが蔓延することになるんだろうな。「テキストファイルでお送りください」とか書いたりすると。それは良いのだが、だったらUTF-8を勧めてほしいと思わないでもないが、UTF-8のBOMが付くとそれはそれで厄介か。
「単位」と確実に打った覚えがあるのに、妙に、「単に」と変換されることが多くて不思議に思っていた。
どうもIMEが気をばりばり利かせて「tanni」を「tannni」の打ち間違いだと推測してくれているらしい。
というか、いろいろ試すと、「tannigotono」で変換すると「単位ごとの」と確実に変換するが、単に「tanni」は100%確実に「単に」にしでかしてくれる。
しかし、おれの親指は単語単位にスペースキーを叩くようにeducateされている。なんて訳せば良いのかな? 訓練されているというとちょっと違うし、学習されているというのともちょっと違う。
ストーミーウェザーでミスターボージャングルが蒸気船に乗って、さておれはどこへ行こうかなと考えていると、音楽が聞こえてくるのだか、蒸気船のエンジンがポンポン言い出すのを聞いただかして、自然とタップを踏むシーンがある。通りかかった船員がびっくりして「おまえの足はwell educatedだ!」と賞賛するシーンとセリフの一部が印象的だが、さてどう訳されていたか記憶にない(非常に印象的なシーンなので英語の原文がプログラムに出ていたのを覚えてしまったのであった)。
Stormy Weather(Various Artists)
(後で買う。というか映像を観たいのだが30年代へ逆戻りみたいだな)
もちろん、ボージャングルはショービジネスの世界に入り、あのアステアが引用するくらいの成功をおさめる。
スイング・タイム(有頂天時代) [DVD](フレッド・アステア)
しかし、1930年代のハリウッドでは、世界最高のタップダンスをフィルムで公開するには、世界で2番めのタップダンスを使わざるを得なかったというような歴史があって、ようやく戦争のおかげで黒人をフィルムで主演させることができるようになったときは、すでに第一線からは退いたあとだった、なんだかなぁ。
というくらい、「単位」問題は厄介だ。
でもこれは「たんにしょう」と読むのだよ。
ジェズイットを見習え |
ふと思ったんですが、artonさんってコニー・ウィルス『リメイク』は読まれてます? もしかしたらおすすめかもです(私は映画は詳しくないので。というかアステアの名前はこの本で知って、未だに映画では見たことないです)。<br>http://www.amazon.co.jp/dp/4150112754/
「リメイク」は発想がうまいですよね。
>UTF-8のBOMが付くとそれはそれで厄介か。<br><br>時代の変化と言えば,先日<br>http://mono.ximian.com/monobuild/preview/sources-preview/<br>からmono-2.0.tar.bz2を取ってきて,<br>mono-2.0\mcs\class\System.Core\System.Linq.Expressions<br>以下のファイルを弄っていたときのこと.<br><br>気付いたら,ASCIIのファイルとUTF-8 (BOM付き)のファイルが混在していたので,またVisual Studioがやっちゃったかなと調べてみると,実はmonoのオリジナルソースからしてASCIIとBOM付きUTF-8が混在していたというオチでした.<br>案外あちこちで混在しているものですなぁ.
あー,ASCIIのファイルとUTF-8 (BOM付き)のファイルが混在していたと見るよりは,BOM無しとBOM付きが混在していたと見るべきかも.
BOMうぜぇっていうのはわかるんですが、この処理をちゃんとして暗いものに出会う度に欧米人ってほんと多言語処理をちゃんとしてくれないなと憂鬱になるのは職業病でしょうかw
>この処理をちゃんとしてない(?)ものに出会う度に欧米人<br>いやぁ、個人的にはRubyが(ポリシーとして)してくれないのが一番厄介なんですけどね。
>リメイク<br>幸にして(知ってたらつまらないじゃん)知りませんでした。今読んでる(読み物系の)本を読了したら読んでみます。ミュージカルは大好きだし、SFもわりと好きなので、楽しみです。ありがとうございます。
utf-8のBOMはユーザーが自分で対処しろって話じゃありませんでしたっけ?
以前議論があって、rewind等を考えるとよろしくやるのは難しいので、当面は対応しないとうことになりました。 (そしてこのままいけば feature freeze となる)。<br>http://blade.nagaokaut.ac.jp/cgi-bin/scat.rb/ruby/ruby-dev/32982<br>適切な仕様と実装を出す方がいらっしゃれば変わるかも、というステータスから今に至る、という感じですね。
>ユーザーが自分で対処しろ<br>がポリシーでしょ?<br>>以前議論<br>ありがとうございます。以前メモ(http://arton.no-ip.info/diary/20080915.html#p02)した番号が間違っていますね。<br>自分にとって有用な仕様しか考える気がないので、openをオーバーライドしてファイルかつrtなら読み飛ばすしかないかなと思っています。
>あー,ASCIIのファイルとUTF-8 (BOM付き)のファイルが混在していたと見るよりは,BOM無しとBOM付きが混在していたと見るべきかも. <br>それにしても味わい深い。
たいして物を考えずに生きているので、大した結論も出ないでこのシリーズは終わります(^^;
結論を出す必要もないような気がするなぁ。>自分が過去に何を考えたか<br>だって、そのときは反射的に選択したことが、後から考えると(その「後」のそれぞれの状況や経験に応じて)理屈がつくことがあるからね。ってことは、結論は、常にその時点で変化するもので、そこが歴史のおもしろいところだと僕は思う。
訂正:1.9.0-4はBOM付きUTF-8のスクリプトを処理できますね。
いやあmonoのソースはもっとひどいですよ。BOMなしUTF-8かと思いきやiso-8859-*が普通に使われていたりして。ほとんどコードを書いた人の名前で使われているだけなんですけどね。<br>そもそも当初はmcsのデフォルトエンコーディングがcodepage28591(Encoding.Defaultではない)だったりして…アレを直させるのも大変でした…