Pythonを使うことに


 まあ色々あって、Python2.5.4を導入する。元々Pythonには興味があったからいいのだが、どのバージョン入れていいのかよく分からん。まあ適当でも死にはしないだろう。2.5.5はWindows版バイナリが無いんで見なかったことに。
 で、ネットでチュートリアルとか適当に読む。Perlの時はラクダ本にお世話になったが、今はタダで日本語の資料がごろごろしてて有り難い。
 そして、軽く概要を見た辺りでおとなしく読むのに飽きて、対話モードで超適当に憶測で色々やってみる。ほほう、これは面白い。デフォで多倍長整数演算できるんか。楽ですなあ。Perlと違って、無駄な揺らぎを許容しませんなあ。これはこれで。記号も全然出てこないんだな。いかにも素性の良さそうな。ふへへへへ。Perlのずぼらな感じも好きだけど。
 まあ、実行速度も既にPerlよりPythonやRubyの方が上みたいだしなあ。Rubyが速くなってると聞くと少し興味はあるのだが、作者が苦手なんでまだ回避。機会があれば普通に触るだろうけど。
 で、Perl同様、タイプ数は削ぎ落とされてる感じ。まあこの辺はみんなそうか。それでも、無茶な短縮はしないあたりが品の良さか。ふへへ。

 つーことで、手慣らしにちょっとしたコードを書こうとしてハマる。EUC-JPのデコードでUnicodeDecodeError投げてくるのだが。どこだよ引っ掛かってるのは。
 慣れない言語を少しずつ使い慣らしながら調べてみると、ローマ数字で引っ掛かってた。PerlのEncodeモジュールでは出来てたのに。機種依存文字だった気がするが、今もそうなのかはもうよく分からん。文字コードの規格多すぎて。
 RubyやPHPは知らんけど、PerlやPythonは恐らく基本的に内部UCSで、必要なとこでencode/decodeする形だろうから、変換が通らないとどうにもならん。
 で、色々と解決方法を探る。自前変換とか書くくらいならPython捨ててScalaかJava勉強するか、とか投げやりな思考が浮かんだりもしたが、何となくcodec仕様を調べてみると、euc-jis-2004とかいうエンコーディングの存在に気付く。使ってみたら変換出来た。わーい。理屈分からんけどもうめんどくせえからこれでいいや。

 そして、今度はHTML実体参照(ユニコード数値含む)のデコードライブラリが無いのに気付く。めんどくせえ。調べてみても、一発変換関数は無さそうな雰囲気だ。何で今時。まあ書くか…。

(Visited 16 times, 1 visits today)

コメントを残す

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください