Count:
「Sugaken's Web Page[note]」
1999/08版 その3



1999/08/21 (土)

点取り様のお告げ:いやに気にしているね。1点

そりゃ気になるでしょう。だって、母校に大差で勝った相手が甲子園で優勝してしまうんだから。はい。桐生。気流じゃなくてよかったですね。はい。また心のこもっていないボケですが。

LaTeX2htmlは進捗していません。昨日から。なんとなく、切なくなってるんですね。たとえば、Times New Romanでは正しく表示できる英語の記号が、日本語の文字コードだとちゃんと見られない記号コードの見本を見てください。文字コードをiso-8859-1にすると、なかなか快適に見ることができますが、これをiso-2022-jpに切り替えると[?]が並びます。こっちが疑問符じゃい。つまり、日本語のフォントにはそういうものが入っていないんですね。ここで困ったことが起こってるんです。

つまり、\copyrightというコマンドがでたときに、HTMLのiso-2022-jpでは表示できないんです。いや、FONTタグのface属性も無理ではないでしょう。が、そうなったときに日本語をどのフォントで表示させるかというのは、結構気味が悪いです。face="MS 明朝"とかいう。だから、face属性に漢字使うなよ。この辺の話じゃないんだから。

これは一見すると単純な問題のように思えるのかもしれないが、なかなか大変な問題であるということに気がついた。たとえば、「魔王(Elk\"{o}nig)」と書くとしよう。\"{o}はoにウムラウト(上に”みたいなのが乗っかっている)だが、TeXでは完全に表示可能、印刷可能なのに、HTMLに変換しても、表示も印刷も不可能になる。もっとも、その文字だけは文字コードを切り替えることで完全に表示はできるが、そんなことをしても周りの全角文字が大変な騒ぎになってしまう。これはかなりいただけない。そこだけgifにするというのもひとつの手かもしれないが、残念ながらbpmplusとかいう、表示できない部分をGIFで作ってくれるプログラムが、DOS上では開発環境がないと動作できないという、かなりな問題点を持っているので、この「数式対応」もちょっと困り気味。どうすればいいのだろう?

この点が、開発に当たっての一番大きな壁かな。



1999/08/22 (日)

点取り様のお告げ:あと3歩下がるとかまれるよ 6点

どういう状況なんでしょう?そういえば、高校の英語の参考書に、[Another three steps for your backward makes you bitten by lion.]という文があったのを思い出しました。文が不正確かもしれない。直訳すると「あと三歩下がるとライオンにかまれます」だって。どういう状況なんだろう。3歩下がってかまれるということは、すでにライオンの射程圏内にいるのではないだろうか。逆に、いまの状況(つまり3歩下がる前)は、かまれない安全圏なのだろうか。檻の中にでもいて、そこから3歩下がるとお尻がかみつかれるというのだろうか?いずれにしても、高校の時の参考書とは、内容はともかく文法的に正しければ(そういや、こいつは文法的になにが説明したかったんだろう????)それでいいのだ、ということを学びました。はい。

LaTeX2htmlの一応の方向性が見えてきました。\コマンドの場合、そのそれぞれに対する処理をアプリの中に内包させると、大変なことになることがわかりました。ということで、痴漢、いや置換テーブル(?)をつくってみることにしました。実は置換テーブルが厳密にはどういう意味なのかわかっていないので、その辺は適当に聞いてほしいのですが、置換前文字列と、置換後文字列を1行にまとめます。もちろん、区切り文字として両方に含まれることのない文字を考えます。ここでは、TeXコマンドとHTMLなので、:(コロン)あたりが適当ですね。それを取得するわけです。べつに、置換前文字列と置換後文字列の間に改行を入れるのもひとつの手です。プログラム的にはこの方が楽なのですが、このファイルを手動で編集しようというときに、忘れる可能性があります。あとでまとめて加えよう・・・というときは、だいたい間違って編集されます。というか、おいらがいっつも間違えてるんだけど。

で、少々プログラム的に面倒でも、こっちの方がいいと思ったのでした。これでマッチングさせると、およそ700件のデータで1秒もかからない。まぁ、動かすマシンのCPUにもよるのだろうけど、少なくとも、別なプログラムで使っているアルゴリズムをそのまま持ってくると、それくらいのスピードまではでるでしょう。あ、その実験したマシンですが、Windows95がやっとこさ動いているようなマシンなので、きっと大丈夫でしょう。最近のマシンは速いから。

ただし、この方法に問題がないわけではないのです。たとえば、
\begin{math}
\sum^{n}_{i=0} x^{2}_{i} = 30 %この式はでたらめ。
\end{math}
とかいう文に出くわしたときに、\sumはgif絵でも何でも吐き出すとして、それ以前にあらかじめ上付文字のnと、下付の文字列であるi=0を取得しておいて、さらにxに対しても同じようなことをしなければならないわけです。これは結構大変です。ということで、「マクロ埋め込み型のマッチテーブル」を組むことにしました。

マクロは、色指定のcolors、上付文字(^)と下付文字(_)、数式番号用のequationとか。もちろん、脚注も。結構数を数えるのが面倒かもしれない。変数の名前に頭を抱えるのだ。そして、数式なんかの場合は、文字の大きさは目をつぶってもらうとして、テーブルに変換する・・・夢は壮大だが、なんだかできるかどうか自分でもかなり不安になってきた。




1999/08/23 (月)


1999/08/24 (火)


1999/08/25 (水)

点取り様のお告げ:たで食う虫も好きずき 3点

ひょっとしたら多いのかもしれない。「たで食う虫も好きずき」っていうのを、「田で」だと思っている人。違います。「たで」は、「」という字を書きます。植物の名前です。桜とか檜と一緒ですね。これが、強烈なにおいだそうです。誰も聞いていないと思って、目にしみるくらい強烈(←それはMen's 5)だそうです。そういう植物には一見すると虫が付かないように思えるが、実際には害虫がつくんだそうです。そこで、「たで食う虫も好きずき」なんです。赤っ恥かかないようにしてくださいね。

恒例となりました「LaTeX2html」なんですが、床屋でうとうとしているうちに抗争が浮かびました。おい、そんなキルギスな。どういう形容詞だ。なんとか引数をとることができそうです。問題は、そのアルゴリズム。やっぱり、構想の発酵が不十分ですね。だめです。床屋から帰って、ええい、ままよ、とコードを入れてみると、やっぱり動きません。DoEventsのおかげでとりあえず一般保護違反にはならないですが。

バイトの空き時間にさらに構想を練りました。よかった。なんとかなるかもしれない。これでうまくいく。・・・・よく考えたらWinPerlでもそれなりのことができるんじゃないかと思ってみたりする今日この頃。だって、変換テーブルさえどうにかすれば、文字列置換でどうにかなるんだもの。まぁ、Windowsでできるようになるというだけでもいいか。




1999/08/26 (木)


1999/08/27 (金)

点取り様のお告げ:体によくありません。1点

なんのことでしょう?こういうことでしょうか。ひっそりとしておきましたが。

上のリンクなんですが、見てわかるとおり、アクセス解析です。ちょっとやってみました。すごいワードで検索している人もいるんですね。はい。 話題はそれくらいにしておいて、LaTeX2htmlです。どうも、おかしな動きをします。昨日、コーディングの途中に最適化をしてしまったおかげで、変なコードになってしまいました。愚直に組んだ方がスマートだったかも・・・まぁ、愚直に組み直しました。これでいいでしょう。はい。が、問題は、日本語の文字コードの中に[¥]を持っているのがいるかどうかわかりませんが、やっちゃってくれてます。一般保護違反やらアクセス違反やら、そのすれすれのところで動いてくれています。いけませんね。はい。どうにかしなければ。そもそも日本語のVBなんだから、日本語の文字コードの中に[¥]があってもいいと思うんですけどね。だめなんでしょうか。それとも、えらく長い\footnote{}があるからでしょうか。仕方ありませんね。やってもらわなきゃ。せっかく人がVBで作ろうとしているんだから。

直球で怒ってみました。

福太郎さんにこの場で連絡。メーリングリストに2000年問題の不具合を確認しました。これは配送に関する問題ではなく、ログをとる際や、過去ログのメール取得を行う際に問題になります。作者のページからすでに対策プログラムを持ってきて、処理をしておきましたので、おそらく問題は発生しないと思われます。いまのところ、サーバの停止予定はありませんが、電力供給の停止などの不可抗力によってサーバが停止するおそれは、現段階では消えてはいません。東北大学としてどう対処するのか、教えてほしいところですね。無停電元素うちも稼働予定ですが、残念ながら1時間程度しか持たないので、意味がないでしょう。

そこでも法学部に負けてはいけないのですが(まだいうか)、法学部はもとの利用者が少ないので、一度非常事態になったときの回復は結構速くすみます。くやしいけど。




1999/08/28 (土)

点取り様のお告げ:私の顔はそんなに変ですか。2点

それほど変です。(きっぱり)今日も土曜日だというのにバイトが入っていました。国語を教えられる先生がいないので、仕方ないですが。

LaTeX2htmlなんですがねぇ、\ref{こんなの}の[}]が認識されないんですね。というか昨日からなにもしていないんですが。昨日のままです。手をつける気力もありません。「たいへんよくできました」のスタンプがほしいです。きわめて。塾の先生&学校の先生御用達。でも、ネットにないんですね、通信販売。学校用品だからな。困ったものです。明日にでも、仙台のデパートとか文房具屋さんを回ってみましょう。あるかもしれない。

GIFだと、htmllintしてみればわかりますが、でてきます。「たいへんよくできました」が。画像だけの配布は不可でしょうから、やめてください。とりあえず、明日になってみればわかることですね。

LaTeX2htmlなんですが、解析方法を変えようかと思っています。順番にくくり出すという方法を採っているんですが、これだと文字位置の取得が面倒なので、切り落とし方式にしようと思います。ソースコードもどうしようか迷っています。自分の目で見ても汚いので、公開すると、きっとダイオキシン以上に大変なことになるでしょう。ついでに、メールウエアにすることに少々不安。メールウエアにするとその責任がつきますからね。開発者としての(そんな大げさなもん作ってるのか?)。

「プロは頭の中で一応のアルゴリズムを描けるものだ!」と福太郎さんに大見得を切っていた自分。ううむ。大見得も結構だが、そのアルゴリズムを大幅に修正しないと乗り越えられない壁なのかもしれない。




1999/08/29 (日)

点取り様のお告げ:お弁当をもっていきましょう。2点

恒例となりました(←かってにするな)LaTeX2htmlですが、どうにかそれらしいものができました。もちろん、数式には対応していないベータ版ですが、正式版でも対応するかどうかはきわめて微妙です。gif絵にすることも考えたのですが、数式が100個あれば、100枚のgif絵が必要ですね。そうでなくても、ウムラウトやら、記号やらがありますから、そう簡単にgifにするということもちょっと控えたわけです。もちろん、そこまでの腕がないということも、忘れてはいけません。

今日は風邪を引いた福太郎さんにお見舞い。なんたって、関西人の歯医者は認めませんから。段ボール製の飛行機かもしれないし。ふふふ、なんのことだかわからないだろ。

そのあとで、仙台市内で「たいへんよくできました」のゴムスタンプを探す。ビブレにいってみる。キャラクタものは確かに数種類あるが、キャラクタの線が妙に細いので、ちょっと斜めに力を加えると線が消えてしまうかもしれない。ここは、昔ながらの純粋な(?)文字だけものにしてみる。仙台の文房具屋さんで買う。「学校用」の引き出しに入っていた。たいへんよくできました、よくできました、ふつうです、もうすこしです、もうすこしがんばりましょう、5個セットで1800円なり。こんなもんでしょう。文房具屋さんで売ってます。

シンプルなものが一番いいですね。はい。小学校の時はこんな感じでした。オットセイの絵か何かかいてあったかな。記憶はあいまい。なんたって、昭和50年代ですから。・・・だよな。そうですね。小学生の時、昭和50年代でした。ぎりぎりで。

いま、Sitelogをとるためのスクリプトをかいています。とりあえず、サーバからアクセスログを持ってきて、それをどうにかして統合させて、解析させようという、なかなかヘビーなプログラムです(←どこが)。いま、FTPで持ってくるところまではかきました。あとは、統合から解析までのBATでもかいておけば十分でしょう。はい。



1999/08/30 (月)

点取り様のお告げ:指のかずより沢山のかずはかぞえられない。2点

いまでもそうですが。←また心のこもっていない斬新なボケですが、いかがお過ごしでしょうか。

心機一転、プロバイダを変えました。telewayからnewebということで、合併しただけで、なにも変化はないような気がしていたんですが、telewayのSMTPがtelewayアドレス以外では使えなくなってしまったので、いちいち経済のダイヤルアップ(PIAFS対応のくせにモデムだと288だったりする)に変えて・・・と思ってしばらくそうしてたのですが、あまりにも面倒だったので、一番安かった(ついでに、NTTの人が勧めていた←おいおい)KDD系列のものにしました。そこそこ快調です。あまり遅さは感じませんでした。11時過ぎにつなぐことがないので、それでいいでしょう。テレホーダイにするつもりもないし。

来年からは経済ダイヤルアップが使えない。使ってもいいが遠すぎる。まぁ、会社でどうにかしてくれるんだろうからいいか。

経済学部の管理者用端末に、アクセスログ解析ツールをおいてみた。とりあえず、WS_FTPのスクリプトを書いて、kanaにFTPを仕掛ける。combine_logのたぐいを全部かっさらう。で、ファイルをひとつにする。これはcopyコマンドでどうということはない。それを引数として指定してBATを起動させる。以上。簡単なBATさえ書ければ、FTPのスクリプトも簡単。あとは、これを管理者用端末(へっへっへ、NT+sp5+ie5)で「タスク」として指定すればよし。これで、毎朝チェックしてくれる。最新の情報も、そのBATを動かすだけ。簡単簡単。しかし、「ジャポニカ学習帳」とか、「いけない関係」とか、どこから調べてくるんでしょう?・・・っていうか、誰だそんなキーワード含んでるHTML作ったの。

今日から連続講義です。証券会社の常務さんだった人が直接講義してくれるので、かなりおもしろいです。実務家の視点は、やっぱり学者とは違いますね。いいです。新鮮です。いつの日か、経済学部開講科目「情報科学」でおいらも講義したいものですね。ほかは無理かもしれないけれど、それくらいなら講義できそう。日経新聞を買っていかなければならないのだが、日刊紙を売っている店がこの辺にはない。コンビニはスポーツ紙しか売っていない。どうしたものか。

日刊紙を売っているコンビニを探すしかないか。あとは駅に立ち寄るとか。キヨスクならだいたいあるだろうから。で、一番驚いたのが、 「日経新聞速報」のたぐいのメールマガジンがないこと。まぐまぐでもしらべたが、なかった。日経にもなかった。いいとおもうんだけどなぁ。日経のメールニュース。有料でも入るけどな。いや、Perlでとりあえずかっさらってメールで流すというのもアリなのかもしれないけど、それを他人に供給することはできないから、ちょっと残念。




1999/08/31 (火)



メールはこちらへ...[sugaken (sugaken @(at) sugaken .(dot) com)]

この日記は、GNSを使用して作成されています。